Что значит что одни и те же сведения закодированы в различных формах
Краткое объяснение кодирования текстовой информации. Информатика
Содержание:
Кодирование текстовой информации — очень распространенное явление. Один и тот же текст может быть закодирован в нескольких форматах. Принято считать, что кодирование текстовой информации появилось с приходом компьютеров. Это и так и не так одновременно. Кодировка в том виде, в котором мы ее знаем, действительно к нам пришла с приходом компьютеров. Но над самим процессом кодирования люди бьются уже много сотен лет. Ведь, по большому счету, сама письменность уже является способом закодировать человеческую речь, для ее дальнейшего использования. Вот и получается, что любая окружающая нас информация никогда не бывает представленной в чистом виде, потому что она уже каким-то образом закодирована. Но сейчас не об этом.
Кодирование текстовой информации
Самый распространенный способ кодирования текстовой информации — это ее двоичное представление, которое сплошь и рядом используется в каждом компьютере, роботе, станке и т. д. Все кодируется в виде слов в двоичном представлении.
Сама технология двоичного представления информации зародилась еще задолго до появления первых компьютеров. Среди первых устройств, которые использовали двоичный метод кодирования, был аппарат Бодо — телеграфный аппарат, который кодировал информацию в 5 битах в двоичном представлении. Суть кодировки заключалась в простой последовательности электрических импульсов:
В компьютерный мир такая кодировка пришла вместе с персонализацией самих компьютеров. То есть в первых компьютерах не было такой кодировки. Но как только компьютеры стали уходить «в массы», то резко обнаружилась потребность обрабатывать компьютерами большое количество именно текстовой информации, которую нужно было как-то кодировать. Тенденция обрабатывать большое количество текстовой информации сохранилась и в современных устройствах.
Так получилось, что двоичное кодирование в компьютерах связано только с двумя символами «0» и «1», которые выстраиваются в определенной логической последовательности. А сам язык подобной кодировки стал называться машинным.
Кодирование текстовой информации и компьютеры
Для справки. Есть уникальный язык программирования, который в качестве своих операторов использует только пробелы, табуляции и переносы строки. Практического применения этот язык не имеет, но он есть.
Мы вводим текст в компьютер при помощи клавиатуры, символы которой мы прекрасно понимаем. Нажимая на какую-то букву, мы отправляем в оперативную память компьютера двоичное представление нажатых клавиш. Каждый отдельный символ будет представлен 8-битной кодировкой. Например буква «А» — это «11000000». Получается, что один символ — это 1 байт или 8 бит. При такой кодировке, путем нехитрых подсчетов можно посчитать, что мы можем зашифровать 256 символов. Для кодирования текстовой информации данного количества символов более чем предостаточно.
Кодирование текстовой информации в компьютерных устройствах сводится к тому, что каждому отдельному символу присваивается уникальное десятичное значение от 0 и до 255 или его эквивалент в двоичной форме от 00000000 и до 11111111. Люди могут различать символы по их внешнему виду, а компьютерное устройство только по их уникальному коду.
Рассмотрите, как происходит процесс. Мы нажимаем нужный нам символ на клавиатуре, ориентируясь на их внешний вид. В оперативную память компьютера он попадает в двоичном представлении, а когда компьютер его выводит нам на экран, то происходит процесс декодирования, чтобы мы увидели знакомый нам символ.
Кодирование текстовой информации и таблицы кодировок
Таблица кодировки — это место, где прописано какому символу какой код относится. Все таблицы кодировки являются согласованными — это нужно, чтобы не возникало путаницы между документами, закодированными по одной таблице, но на разных устройствах.
На сегодняшний день существует множество таблиц кодировок. Из-за этого часто возникают проблемы с переносом текстовых документов между устройствами. Так получается, что если текстовая информация была закодирована по одной какой-то таблице, то и раскодирована она может быть только по этой таблице. Если попытаться раскодировать другой таблицей, то в результате получим только набор непонятных символов, но никак не читабельный текст.
Что значит что одни и те же сведения закодированы в различных формах
Кодирование текстовой информации
Двоичное кодирование – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.
Начиная с конца 60-х годов, компьютеры все больше стали использоваться для обработки текстовой информации, и в настоящее время основная доля персональных компьютеров в мире (и большая часть времени) занята обработкой именно текстовой информации. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется алфавит мощностью два (всего два символа 0 и 1). Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1).
С точки зрения ЭВМ текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа «=», «(«, «&» и т.п. и даже (обратите особое внимание!) пробелы между словами.
Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в двоичном коде. Это значит, что каждый символ представляется 8-разрядным двоичным кодом.
В процессе вывода символа на экран компьютера производится обратный процесс — декодирование, то есть преобразование кода символа в его изображение. Важно, что присвоение символу конкретного кода — это вопрос соглашения, которое фиксируется в кодовой таблице.
Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу. Понятно, что это дело условное, можно придумать множество способов кодировки.
Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.
Виды таблиц кодировок
Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.
Для разных типов ЭВМ используются различные таблицы кодировки.
Таблица кодов ASCII делится на две части.
Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111).
Структура таблицы кодировки ASCII
Символы с номерами от 0 до 31 принято называть управляющими.
Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.
Стандартная часть таблицы (английский). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы.
Все остальные отражаются определенными знаками.
Альтернативная часть таблицы (русская).
Вторая половина кодовой таблицы ASCII, называемая кодовой страницей (128 кодов, начиная с 10000000 и кончая 11111111), может иметь различные варианты, каждый вариант имеет свой номер.
Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.
Обращается внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом последовательного кодирования алфавита.
Для букв русского алфавита также соблюдается принцип последовательного кодирования.
К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows. MS-DOS, Macintosh и ISO). Из-за этого часто возникают проблемы с переносом русского текста с одного компьютера на другой, из одной программной системы в другую.
Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 («Код обмена информацией, 8-битный»). Эта кодировка применялась еще в 70-е годы на компьютерах серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX.
От начала 90-х годов, времени господства операционной системы MS DOS, остается кодировка CP866 («CP» означает «Code Page», «кодовая страница»).
Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.
Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.
Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251. Введена компанией Microsoft; с учетом широкого распространения операционных систем (ОС) и других программных продуктов этой компании в Российской Федерации она нашла широкое распространение.
С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode.
Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.
Внутреннее представление слов в памяти компьютера
с помощью таблицы ASCII
Таким образом, каждая кодировка задается своей собственной кодовой таблицей. Как видно из таблицы, одному и тому же двоичному коду в различных кодировках поставлены в соответствие различные символы.
Н апример, последовательность числовых кодов 221, 194, 204 в кодировке СР1251 образует слово «ЭВМ» (Рис. 10), тогда как в других кодировках это будет бессмысленный набор символов.
К счастью, в большинстве случаев пользователь не должен заботиться о перекодировках текстовых документов, так как это делают специальные программы-конверторы, встроенные в приложения.
Понятие информации. Одну и ту же информацию можно представить в разных формах;
Лекция ИНФОРМАЦИЯ: СВОЙСТВА И ВИДЫ
ДВОИЧНОЕ КОДИРОВАНИЕ ИНФОРМАЦИИ
Одну и ту же информацию можно представить в разных формах. Например, информацию о прогнозе погоды можно записать на бумаге, передать по радио и телевидению или, используя азбуку Морзе, передать на большое расстояние. Эта же информация может быть введена в компьютер, обработана соответствующим образом и выведена на экран дисплея или распечатана на принтере.
При вводе в компьютер алфавитно-цифровая информация представляется с помощью базы двоичной системы счисления, т.е. цифр 0 и 1. Это связано с тем, что каждый символ в ЭВМ кодируется с помощью последовательностей сигналов двух видов:
включено или выключено, намагничено или не намагничено, высокое или низкое напряжение. Одно состояние обозначают цифрой О, а другое –цифрой 1. Такое кодирование информации называетсядвоичным. Последовательности из двух цифр 0 и 1 называютсядвоичными кодами. Запись информации в двоичных кодах называетсякодированием в двоичных кодах.
Например, в ЭВМ буква А кодируется как 01000001, а буква М –01001101. Тогда слово МАМА кодируется последовательностью
01001101 01000001 01001101 01000001
Результат решения задачи на ЭВМ получается в двоичных кодах и потом переводится на понятный нам язык. Этот процесс перевода называетсядекодированием информации.
Кодирование и декодирование информации в двоичных кодах компьютер делает автоматически.
В жизни мы часто встречаемся с кодированием и декодированием информации. Например, запись музыки на магнитофонную ленту – это кодирование, а воспроизведение музыки – это декодирование.
[1] Полонников Р.И. Феномен информации и информационного взаимодействия (введение в семантическую теорию информации). – С-Пб, 2001. – С.6
[2] См.: Ковалева Н.Н. Информационное право России: Учебное пособие. М.: Издательско-торговая корпорация «Дашков и К», 2007. С. 119.
[3] Шеннон К. Работы по теории информации и кибернетики / пер. с англ., под ред. Р.Л. Добрушина, О.Б.Луконова, М., 1963.
Вопросы:
1. Понятие информации.
2. Концепции информации.
3. Формы передачи, представления и виды информации.
4. Свойства информации.
5. Измерение информации. Математическое понятие информации
6. Понятие системы счисления.
7. Двоичное кодирование.
С развитием информационного подхода, раскрывающего новые свойства, новые стороны материальных объектов, социальных явлений и процессов, само понятие информации переросло из обиходных категорий в общенаучное понятие, которое, несмотря на свою распространенность, и по сей день вызывает огромное количество споров, дискуссий и по поводу которого имеется множество самых различных точек зрения. «Из всех наук теория информации и информатика, хотя и пользуются огромной и заслуженной популярностью, – пишет Р.И.Полонников[1], – и имеют неоспоримые успехи и достижения в целом ряде прикладных областей, но продолжают оставаться в несколько стесненном положении, ибо их центральное понятие – информация – остается строго неопределенным». Буквально, сколько авторов, пишущих об информации, столько и дефиниций этого феномена.
В настоящее время специалисты насчитывают более 200 существующих в настоящее время подходов к определению информации, среди которых нет ни одного более или менее общепризнанного, а некоторые из них просто не выдерживают никакой критики и вызывают достаточно резкие оценки в научной среде.
1. Информация есть знания, переданные кем-то другим или приобретенные путем собственного исследования или изучения,
2. Информация – это сведения, содержащиеся в данном сообщении и рассматриваемые как объект передачи, хранения и обработки,
3. Информация – это объективное содержание связи между взаимодействующими материальными объектами, проявляющееся в изменении состояний этих объектов,
4. Информация есть текущие данные о переменных величинах в некоторой области деятельности, систематизированные сведения относительно основных причинных связей, которые содержатся в знании как понятии более общего класса, по отношению к которому информация является подчиненной,
5. Информацией называется всякое сообщение или передача сведений о чем-либо, что заранее не было известно,
6. Информация есть запомненный выбор одного варианта из нескольких возможных и равноправных.
Наиболее общее определение имеет место в философии, где под информацией понимается отражение предметного мира, выражаемое в виде сигналов и знаков.
1. Информация есть отражение в сознании людей объективных причинно-следственных связей в окружающем нас реальном мире,
2. Информация – это содержание процессов отражения.
Понятие информации предполагает наличие двух объектов: источника и потребителя. Для уяснения сущности информации следует учитывать и другие философские категории, такие как движение, пространство, время, а также проблему первичности материи и вторичности познания. Другим весьма важным условием уяснения сущности информации и правильного решения информационно-познавательных задач, к числу которых относятся и большинство правовых, является использование принципа адекватного отображения отображаемого объекта отображающим его объектом.
Под информацией понимаются сведения об окружающем мире и протекающих в нем процессов, воспринимаемых человеком или специальными устройствами для обеспечения целенаправленной деятельности. К тому же информация об объекте познания может быть не только воспринята познающим субъектом или техническим устройством (при соответствующей ее обработке), но и как бы отделена от ее первоисточника – отображения объекта познания.
Из этого следует, что она может быть перенесена в пространстве, сохранена во времени, передана другому познающему субъекту или техническому устройству (например, ЭВМ), подвергнута иным операциям, совокупность которых называютинформационными процессами. Их состав и последовательность определяются в каждом частном случае. В общем виде информационные процессы составляют создание, синтез, передачу, прием, накопление, хранение, преобразование, систематизацию, анализ, отбор, распространение информации, ее представление в удобном для пользователя виде.
С понятием информации связаны такие понятия, как сигнал, сообщение и данные.
Сигналы отражают физические характеристики различных процессов и объектов, а через знаки происходит восприятие предметного мира человеком. Таким образом, Сигнал представляет собой любой процесс, несущий информацию.
Сообщение – это информация, выраженная в определенной форме и предназначенная для передачи. Примером сообщения является текст телеграммы, речь оратора, показания измерительного прибора, команды управления и т.п. Таким образом, сообщение – это форма представления информации.
Данные – это информация, представленная в формализованном виде и предназначенная для обработки ее техническими средствами, например ЭВМ. Т.е. данные – это сырье для получения информации.
Разработка нового базового законодательного акта обусловлена необходимостью унификации как с понятийной, так и с содержательной точки зрения принципов и правил взаимодействия в данной сфере, устранения в ней ряда пробелов и приближения законодательства РФ к международной практике регулирования информационных отношений.
Ст.2 данного Закона вводит ряд основных понятий.
Центральным понятием законодательства об информации, информационных технологиях и о защите информации является понятие «информация». В ранее действовавшем Законе об информации от 1995 г. под информацией понимались сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их предоставления. В новом Федеральном законе определение информации представлено в более общем виде. Информацией являются любые сведения (сообщения, данные) независимо от формы их предоставления.
В ст.2 вводится новое для российского законодательства определение понятия «информационные технологии», которое объединяет процессы, методы поиска, сбора, хранения, обработки, предоставления, распространения информации и способы их осуществления. Информационные технологии имеют важное значение для развития, т.к., учитывая важность информации, именно уровнем развития таких технологий определяется потенциал дальнейшего прогрессивного движения во всех направлениях жизни общества.
К основным видам информационных технологий относят:
— высокие интеллектуальные информационные технологии, которые представляют собой генерацию технических решений, реализующих ситуационное моделирование, позволяющих выявить связь элементов, их динамику и обозначить объективные закономерности среды;
Данная статья содержит также уточненное определение понятия «информационная система». В ранее действовавшем Законе об информации от 1995 г. под информационной системой понималась организационно упорядоченная совокупность документов (массивов документов) и информационных технологий, в том числе с использованием средств вычислительной техники и связи, реализующих информационные процессы.
Признаки информационной системы:
— выполнение одной, нескольких функций в отношении информации;
— единство системы (наличие общей файловой базы, единых стандартов и протоколов, единого управления);
Основные требования к информационной системе:
— качество функционирования (то есть ее точность, защищенность, согласованность со стандартами);
— надежность (то есть те пороги, когда система отказывает по качеству информации; по времени доступа; по производительности;)
Бурное развитие информационных и телекоммуникационных технологий обусловило необходимость закрепления в законодательстве такого термина, как «информационно-телекоммуникационная сеть». Она представляет собой технологическую систему, предназначенную для передачи по линиям связи информации, доступ к которой осуществляется с использованием средств вычислительной техники.
В соответствии со ст. 2 Федерального закона от 7 июля 2003 г. N 126-ФЗ «О связи» (в ред. от 27 июля 2006 г.) под понятием «линии связи» понимаются линии передачи, физические цепи и линейно-кабельные сооружения связи.
В Законе введен также ряд других понятий. Таким образом, Федеральный закон приводит понятийный аппарат и механизмы регулирования в соответствие с практикой применения информационных технологий, определяет правовой статус различных категорий информации, закрепляет положения в области создания и эксплуатации информационных систем, общие требования к использованию информационно-телекоммуникационных сетей, а также принципы регулирования общественных отношений, связанных с использованием информации.
Закрепляется принцип свободы поиска, получения, передачи, производства и распространения информации любым законным способом. При этом ограничение доступа к информации может устанавливаться только федеральными законами.
В законе содержатся положения, направленные на защиту от недобросовестного использования или злоупотребления возможностями средств распространения информации, при которых пользователям навязывается ненужная информация. В частности, информация должна включать достоверные сведения о ее обладателе или об ином лице-распространителе, в форме и объеме, которые достаточны для идентификации такого лица. При использовании для распространения информации средств, позволяющих определять ее получателей, в том числе почтовых отправлений и электронных сообщений, лицо-распространитель обязано обеспечить получателю информации возможность отказа от нее.
Определены основные правила и способы защиты прав на информацию, самой информации путем принятия основных правовых, организационных и технических (программно-технических) мер. Права обладателя информации, содержащейся в базах данных информационной системы, подлежат охране независимо от авторских и иных прав на такие базы данных.
В зависимости от категории доступа к информации она подразделяется на общедоступную, а также на ограниченную федеральными законами (информация ограниченного доступа). Устанавливается перечень информации, доступ к которой не может быть ограничен (например, о деятельности органов власти и об использовании бюджетных средств), а также предоставляемой на безвозмездной основе.
Закреплен запрет на требование от гражданина (физического лица) предоставления информации о его частной жизни, в том числе информации, составляющей личную или семейную тайну, и на получение такой информации помимо воли гражданина (физического лица). Исключение могут составлять только случаи, предусмотренные федеральными законами.