Что значит что одни и те же сведения закодированы в различных формах

Краткое объяснение кодирования текстовой информации. Информатика

Содержание:

Кодирование текстовой информации — очень распространенное явление. Один и тот же текст может быть закодирован в нескольких форматах. Принято считать, что кодирование текстовой информации появилось с приходом компьютеров. Это и так и не так одновременно. Кодировка в том виде, в котором мы ее знаем, действительно к нам пришла с приходом компьютеров. Но над самим процессом кодирования люди бьются уже много сотен лет. Ведь, по большому счету, сама письменность уже является способом закодировать человеческую речь, для ее дальнейшего использования. Вот и получается, что любая окружающая нас информация никогда не бывает представленной в чистом виде, потому что она уже каким-то образом закодирована. Но сейчас не об этом.

Кодирование текстовой информации

Самый распространенный способ кодирования текстовой информации — это ее двоичное представление, которое сплошь и рядом используется в каждом компьютере, роботе, станке и т. д. Все кодируется в виде слов в двоичном представлении.

Сама технология двоичного представления информации зародилась еще задолго до появления первых компьютеров. Среди первых устройств, которые использовали двоичный метод кодирования, был аппарат Бодо — телеграфный аппарат, который кодировал информацию в 5 битах в двоичном представлении. Суть кодировки заключалась в простой последовательности электрических импульсов:

В компьютерный мир такая кодировка пришла вместе с персонализацией самих компьютеров. То есть в первых компьютерах не было такой кодировки. Но как только компьютеры стали уходить «в массы», то резко обнаружилась потребность обрабатывать компьютерами большое количество именно текстовой информации, которую нужно было как-то кодировать. Тенденция обрабатывать большое количество текстовой информации сохранилась и в современных устройствах.

Так получилось, что двоичное кодирование в компьютерах связано только с двумя символами «0» и «1», которые выстраиваются в определенной логической последовательности. А сам язык подобной кодировки стал называться машинным.

Кодирование текстовой информации и компьютеры

Для справки. Есть уникальный язык программирования, который в качестве своих операторов использует только пробелы, табуляции и переносы строки. Практического применения этот язык не имеет, но он есть.

Мы вводим текст в компьютер при помощи клавиатуры, символы которой мы прекрасно понимаем. Нажимая на какую-то букву, мы отправляем в оперативную память компьютера двоичное представление нажатых клавиш. Каждый отдельный символ будет представлен 8-битной кодировкой. Например буква «А» — это «11000000». Получается, что один символ — это 1 байт или 8 бит. При такой кодировке, путем нехитрых подсчетов можно посчитать, что мы можем зашифровать 256 символов. Для кодирования текстовой информации данного количества символов более чем предостаточно.

Кодирование текстовой информации в компьютерных устройствах сводится к тому, что каждому отдельному символу присваивается уникальное десятичное значение от 0 и до 255 или его эквивалент в двоичной форме от 00000000 и до 11111111. Люди могут различать символы по их внешнему виду, а компьютерное устройство только по их уникальному коду.

Рассмотрите, как происходит процесс. Мы нажимаем нужный нам символ на клавиатуре, ориентируясь на их внешний вид. В оперативную память компьютера он попадает в двоичном представлении, а когда компьютер его выводит нам на экран, то происходит процесс декодирования, чтобы мы увидели знакомый нам символ.

Что значит что одни и те же сведения закодированы в различных формах. Смотреть фото Что значит что одни и те же сведения закодированы в различных формах. Смотреть картинку Что значит что одни и те же сведения закодированы в различных формах. Картинка про Что значит что одни и те же сведения закодированы в различных формах. Фото Что значит что одни и те же сведения закодированы в различных формах

Кодирование текстовой информации и таблицы кодировок

Таблица кодировки — это место, где прописано какому символу какой код относится. Все таблицы кодировки являются согласованными — это нужно, чтобы не возникало путаницы между документами, закодированными по одной таблице, но на разных устройствах.

На сегодняшний день существует множество таблиц кодировок. Из-за этого часто возникают проблемы с переносом текстовых документов между устройствами. Так получается, что если текстовая информация была закодирована по одной какой-то таблице, то и раскодирована она может быть только по этой таблице. Если попытаться раскодировать другой таблицей, то в результате получим только набор непонятных символов, но никак не читабельный текст.

Источник

Что значит что одни и те же сведения закодированы в различных формах

Кодирование текстовой информации

Двоичное кодирование – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.

Начиная с конца 60-х годов, компьютеры все больше стали использоваться для обработки текстовой информации, и в настоящее время основная доля персональных компьютеров в мире (и большая часть времени) занята обработкой именно текстовой информации. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется алфавит мощностью два (всего два символа 0 и 1). Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1).

С точки зрения ЭВМ текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа «=», «(«, «&» и т.п. и даже (обратите особое внимание!) пробелы между словами.

Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в двоичном коде. Это значит, что каждый символ представляется 8-разрядным двоичным кодом.

Что значит что одни и те же сведения закодированы в различных формах. Смотреть фото Что значит что одни и те же сведения закодированы в различных формах. Смотреть картинку Что значит что одни и те же сведения закодированы в различных формах. Картинка про Что значит что одни и те же сведения закодированы в различных формах. Фото Что значит что одни и те же сведения закодированы в различных формах

В процессе вывода символа на экран компьютера произ­водится обратный процесс — декодирование, то есть преоб­разование кода символа в его изображение. Важно, что присвоение символу конкретного кода — это вопрос соглашения, которое фиксируется в кодовой табли­це.

Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу. Понятно, что это дело условное, можно придумать множество способов кодировки.

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.

Виды таблиц кодировок

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.

Для разных типов ЭВМ используются различные таблицы кодировки.

Таблица кодов ASCII делится на две части.

Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111).

Структура таблицы кодировки ASCII

Символы с номерами от 0 до 31 принято называть управляющими.

Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.

Стандартная часть таблицы (английский). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы.

Все остальные отражаются определенными знаками.

Альтернативная часть таблицы (русская).

Вторая половина кодовой таблицы ASCII, называемая кодовой страницей (128 кодов, начиная с 10000000 и кончая 11111111), может иметь различные варианты, каждый вариант имеет свой номер.

Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.

Что значит что одни и те же сведения закодированы в различных формах. Смотреть фото Что значит что одни и те же сведения закодированы в различных формах. Смотреть картинку Что значит что одни и те же сведения закодированы в различных формах. Картинка про Что значит что одни и те же сведения закодированы в различных формах. Фото Что значит что одни и те же сведения закодированы в различных формах

Обращается внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом последовательного кодирования алфавита.

Для букв русского алфавита также соблюдается принцип последовательного кодирования.

Что значит что одни и те же сведения закодированы в различных формах. Смотреть фото Что значит что одни и те же сведения закодированы в различных формах. Смотреть картинку Что значит что одни и те же сведения закодированы в различных формах. Картинка про Что значит что одни и те же сведения закодированы в различных формах. Фото Что значит что одни и те же сведения закодированы в различных формах

К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows. MS-DOS, Macintosh и ISO). Из-за этого часто возникают проблемы с переносом русского текста с одного компьютера на другой, из одной программной системы в другую.

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 («Код обмена информацией, 8-битный»). Эта кодировка применялась еще в 70-е годы на компьютерах серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX.

Что значит что одни и те же сведения закодированы в различных формах. Смотреть фото Что значит что одни и те же сведения закодированы в различных формах. Смотреть картинку Что значит что одни и те же сведения закодированы в различных формах. Картинка про Что значит что одни и те же сведения закодированы в различных формах. Фото Что значит что одни и те же сведения закодированы в различных формах

От начала 90-х годов, времени господства операционной системы MS DOS, остается кодировка CP866 («CP» означает «Code Page», «кодовая страница»).

Что значит что одни и те же сведения закодированы в различных формах. Смотреть фото Что значит что одни и те же сведения закодированы в различных формах. Смотреть картинку Что значит что одни и те же сведения закодированы в различных формах. Картинка про Что значит что одни и те же сведения закодированы в различных формах. Фото Что значит что одни и те же сведения закодированы в различных формах

Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.

Что значит что одни и те же сведения закодированы в различных формах. Смотреть фото Что значит что одни и те же сведения закодированы в различных формах. Смотреть картинку Что значит что одни и те же сведения закодированы в различных формах. Картинка про Что значит что одни и те же сведения закодированы в различных формах. Фото Что значит что одни и те же сведения закодированы в различных формах

Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.

Что значит что одни и те же сведения закодированы в различных формах. Смотреть фото Что значит что одни и те же сведения закодированы в различных формах. Смотреть картинку Что значит что одни и те же сведения закодированы в различных формах. Картинка про Что значит что одни и те же сведения закодированы в различных формах. Фото Что значит что одни и те же сведения закодированы в различных формах

Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251. Введена компанией Microsoft; с учетом широкого распространения операционных систем (ОС) и других программных продуктов этой компании в Российской Федерации она нашла широкое распространение.

Что значит что одни и те же сведения закодированы в различных формах. Смотреть фото Что значит что одни и те же сведения закодированы в различных формах. Смотреть картинку Что значит что одни и те же сведения закодированы в различных формах. Картинка про Что значит что одни и те же сведения закодированы в различных формах. Фото Что значит что одни и те же сведения закодированы в различных формах

С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode.

Что значит что одни и те же сведения закодированы в различных формах. Смотреть фото Что значит что одни и те же сведения закодированы в различных формах. Смотреть картинку Что значит что одни и те же сведения закодированы в различных формах. Картинка про Что значит что одни и те же сведения закодированы в различных формах. Фото Что значит что одни и те же сведения закодированы в различных формах

Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.

Внутреннее представление слов в памяти компьютера

с помощью таблицы ASCII

Что значит что одни и те же сведения закодированы в различных формах. Смотреть фото Что значит что одни и те же сведения закодированы в различных формах. Смотреть картинку Что значит что одни и те же сведения закодированы в различных формах. Картинка про Что значит что одни и те же сведения закодированы в различных формах. Фото Что значит что одни и те же сведения закодированы в различных формах

Таким образом, каждая кодировка задается своей собственной кодовой таблицей. Как видно из таблицы, одному и тому же двоичному коду в различных кодировках поставлены в соответствие различные символы.

Н апример, последовательность числовых кодов 221, 194, 204 в кодировке СР1251 образует слово «ЭВМ» (Рис. 10), тогда как в других кодировках это будет бессмысленный набор символов.

К счастью, в большинстве случаев пользователь не должен заботиться о перекодировках текстовых документов, так как это делают специальные программы-конверторы, встроенные в приложения.

Источник

Понятие информации. Одну и ту же информацию можно представить в разных фор­мах;

Лекция ИНФОРМАЦИЯ: СВОЙСТВА И ВИДЫ

ДВОИЧНОЕ КОДИРОВАНИЕ ИНФОРМАЦИИ

Одну и ту же информацию можно представить в разных фор­мах. Например, информацию о прогнозе погоды можно записать на бумаге, передать по радио и телевидению или, используя азбу­ку Морзе, передать на большое расстояние. Эта же информация может быть введена в компьютер, обработана соответствующим образом и выведена на экран дисплея или распечатана на принте­ре.

При вводе в компьютер алфавитно-цифровая информация пред­ставляется с помощью базы двоичной системы счисления, т.е. цифр 0 и 1. Это связано с тем, что каждый символ в ЭВМ коди­руется с помощью последовательностей сигналов двух видов:

включено или выключено, намагничено или не намагничено, вы­сокое или низкое напряжение. Одно состояние обозначают цифрой О, а другое –цифрой 1. Такое кодирование информации называ­етсядвоичным. Последовательности из двух цифр 0 и 1 называютсядвоичными кодами. Запись информации в двоичных кодах называетсякодированием в двоичных кодах.

Например, в ЭВМ буква А кодируется как 01000001, а буква М –01001101. Тогда слово МАМА кодируется последовательностью

01001101 01000001 01001101 01000001

Результат решения задачи на ЭВМ получается в двоичных ко­дах и потом переводится на понятный нам язык. Этот процесс пе­ревода называетсядекодированием информации.

Кодирование и декодирование информации в двоичных кодах компьютер делает автоматически.

В жизни мы часто встречаемся с кодированием и декодирова­нием информации. Например, запись музыки на магнитофонную ленту – это кодирование, а воспроизведение музыки – это деко­дирование.

[1] Полонников Р.И. Феномен информации и информационного взаимодействия (введение в семантическую теорию информации). – С-Пб, 2001. – С.6

[2] См.: Ковалева Н.Н. Информационное право России: Учебное пособие. М.: Издательско-торговая корпорация «Дашков и К», 2007. С. 119.

[3] Шеннон К. Работы по теории информации и кибернетики / пер. с англ., под ред. Р.Л. Добрушина, О.Б.Луконова, М., 1963.

Вопросы:

1. Понятие информации.

2. Концепции информации.

3. Формы передачи, представления и виды информации.

4. Свойства информации.

5. Измерение информации. Математическое понятие информации

6. Понятие системы счисления.

7. Двоичное кодирование.

С развитием информационного подхода, раскрывающего новые свойства, новые стороны материальных объектов, социальных явлений и процессов, само понятие информации переросло из обиходных категорий в общенаучное понятие, которое, несмотря на свою распространенность, и по сей день вызывает огромное количество споров, дискуссий и по поводу которого имеется множество самых различных точек зрения. «Из всех наук теория информации и информатика, хотя и пользуются огромной и заслуженной популярностью, – пишет Р.И.Полонников[1], – и имеют неоспоримые успехи и достижения в целом ряде прикладных областей, но продолжают оставаться в несколько стесненном положении, ибо их центральное понятие – информация – остается строго неопределенным». Буквально, сколько авторов, пишущих об информации, столько и дефиниций этого феномена.

В настоящее время специалисты насчитывают более 200 существующих в настоящее время подходов к определению информации, среди которых нет ни одного более или менее общепризнанного, а некоторые из них просто не выдерживают никакой критики и вызывают достаточно резкие оценки в научной среде.

1. Информация есть знания, переданные кем-то другим или приобретенные путем собственного исследования или изучения,

2. Информация – это сведения, содержащиеся в данном сообщении и рассматриваемые как объект передачи, хранения и обработки,

3. Информация – это объективное содержание связи между взаимодействующими материальными объектами, проявляющееся в изменении состояний этих объектов,

4. Информация есть текущие данные о переменных величинах в некоторой области деятельности, систематизированные сведения относительно основных причинных связей, которые содержатся в знании как понятии более общего класса, по отношению к которому информация является подчиненной,

5. Информацией называется всякое сообщение или передача сведений о чем-либо, что заранее не было известно,

6. Информация есть запомненный выбор одного варианта из нескольких возможных и равноправных.

Наиболее общее определение имеет место в философии, где под информацией понимается отражение предметного мира, выража­емое в виде сигналов и знаков.

1. Информация есть отражение в сознании людей объективных причинно-следственных связей в окружающем нас реальном мире,

2. Информация – это содержание процессов отражения.

Понятие информации предполагает наличие двух объектов: ис­точника и потребителя. Для уяснения сущности информации сле­дует учитывать и другие философские категории, такие как дви­жение, пространство, время, а также проблему первичности мате­рии и вторичности познания. Другим весьма важным условием уяснения сущности информа­ции и правильного решения информационно-познавательных за­дач, к числу которых относятся и большинство правовых, являет­ся использование принципа адекватного отображения отображае­мого объекта отображающим его объектом.

Под информацией понимаются сведения об окружающем мире и протекающих в нем процессов, воспринимаемых челове­ком или специальными устройствами для обеспечения целенаправ­ленной деятельности. К тому же информация об объекте познания может быть не только воспринята познающим субъектом или тех­ническим устройством (при соответствующей ее обработке), но и как бы отделена от ее первоисточника – отображения объекта познания.

Из этого следует, что она может быть перенесена в простран­стве, сохранена во времени, передана другому познающему субъек­ту или техническому устройству (например, ЭВМ), подвергнута иным операциям, совокупность которых называютинформацион­ными процессами. Их состав и последовательность определяют­ся в каждом частном случае. В общем виде информационные процессы составляют создание, синтез, передачу, прием, накопле­ние, хранение, преобразование, систематизацию, анализ, отбор, распространение информации, ее представление в удобном для пользователя виде.

С понятием информации связаны такие понятия, как сигнал, сообщение и данные.

Сигналы отражают физические характеристики различных про­цессов и объектов, а через знаки происходит восприятие предмет­ного мира человеком. Таким образом, Сигнал представляет собой любой процесс, несущий информа­цию.

Сообщение это информация, выраженная в определенной форме и предназначенная для передачи. Примером сообщения яв­ляется текст телеграммы, речь оратора, показания измерительно­го прибора, команды управления и т.п. Таким образом, сообщение – это форма представления информации.

Данные – это информация, представленная в формализованном виде и предназначенная для обработки ее техническими средства­ми, например ЭВМ. Т.е. данные – это сырье для получения информации.

Разработка нового базового законодательного акта обусловлена необходимостью унификации как с понятийной, так и с содержательной точки зрения принципов и правил взаимодействия в данной сфере, устранения в ней ряда пробелов и приближения законодательства РФ к международной практике регулирования информационных отношений.

Ст.2 данного Закона вводит ряд основных понятий.

Центральным понятием законодательства об информации, информационных технологиях и о защите информации является понятие «информация». В ранее действовавшем Законе об информации от 1995 г. под информацией понимались сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их предоставления. В новом Федеральном законе определение информации представлено в более общем виде. Информацией являются любые сведения (сообщения, данные) независимо от формы их предоставления.

В ст.2 вводится новое для российского законодательства определение понятия «информационные технологии», которое объединяет процессы, методы поиска, сбора, хранения, обработки, предоставления, распространения информации и способы их осуществления. Информационные технологии имеют важное значение для развития, т.к., учитывая важность информации, именно уровнем развития таких технологий определяется потенциал дальнейшего прогрессивного движения во всех направлениях жизни общества.

К основным видам информационных технологий относят:

— высокие интеллектуальные информационные технологии, которые представляют собой генерацию технических решений, реализующих ситуационное моделирование, позволяющих выявить связь элементов, их динамику и обозначить объективные закономерности среды;

Данная статья содержит также уточненное определение понятия «информационная система». В ранее действовавшем Законе об информации от 1995 г. под информационной системой понималась организационно упорядоченная совокупность документов (массивов документов) и информационных технологий, в том числе с использованием средств вычислительной техники и связи, реализующих информационные процессы.

Признаки информационной системы:

— выполнение одной, нескольких функций в отношении информации;

— единство системы (наличие общей файловой базы, единых стандартов и протоколов, единого управления);

Основные требования к информационной системе:

— качество функционирования (то есть ее точность, защищенность, согласованность со стандартами);

— надежность (то есть те пороги, когда система отказывает по качеству информации; по времени доступа; по производительности;)

Бурное развитие информационных и телекоммуникационных технологий обусловило необходимость закрепления в законодательстве такого термина, как «информационно-телекоммуникационная сеть». Она представляет собой технологическую систему, предназначенную для передачи по линиям связи информации, доступ к которой осуществляется с использованием средств вычислительной техники.

В соответствии со ст. 2 Федерального закона от 7 июля 2003 г. N 126-ФЗ «О связи» (в ред. от 27 июля 2006 г.) под понятием «линии связи» понимаются линии передачи, физические цепи и линейно-кабельные сооружения связи.

В Законе введен также ряд других понятий. Таким образом, Федеральный закон приводит понятийный аппарат и механизмы регулирования в соответствие с практикой применения информационных технологий, определяет правовой статус различных категорий информации, закрепляет положения в области создания и эксплуатации информационных систем, общие требования к использованию информационно-телекоммуникационных сетей, а также принципы регулирования общественных отношений, связанных с использованием информации.

Закрепляется принцип свободы поиска, получения, передачи, производства и распространения информации любым законным способом. При этом ограничение доступа к информации может устанавливаться только федеральными законами.

В законе содержатся положения, направленные на защиту от недобросовестного использования или злоупотребления возможностями средств распространения информации, при которых пользователям навязывается ненужная информация. В частности, информация должна включать достоверные сведения о ее обладателе или об ином лице-распространителе, в форме и объеме, которые достаточны для идентификации такого лица. При использовании для распространения информации средств, позволяющих определять ее получателей, в том числе почтовых отправлений и электронных сообщений, лицо-распространитель обязано обеспечить получателю информации возможность отказа от нее.

Определены основные правила и способы защиты прав на информацию, самой информации путем принятия основных правовых, организационных и технических (программно-технических) мер. Права обладателя информации, содержащейся в базах данных информационной системы, подлежат охране независимо от авторских и иных прав на такие базы данных.

В зависимости от категории доступа к информации она подразделяется на общедоступную, а также на ограниченную федеральными законами (информация ограниченного доступа). Устанавливается перечень информации, доступ к которой не может быть ограничен (например, о деятельности органов власти и об использовании бюджетных средств), а также предоставляемой на безвозмездной основе.

Закреплен запрет на требование от гражданина (физического лица) предоставления информации о его частной жизни, в том числе информации, составляющей личную или семейную тайну, и на получение такой информации помимо воли гражданина (физического лица). Исключение могут составлять только случаи, предусмотренные федеральными законами.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *