Понятие информации. Сообщения и сигналы

При использовании ЭВМ для обработки информации от различных устройств (объектов, процессов), в которых информация представлена непрерывными (аналоговыми) сигналами, требуется преобразовать аналоговый сигнал в цифровой - в число, пропорциональное амплитуде этого сигнала, и наоборот. В общем случае процедура аналого-цифрового преобразования состоит из трех этапов:

дискретизации;

квантования по уровню;

кодирования.

Под дискретизацией понимают преобразование функции непрерывного времени в функцию дискретного времени, а сам процесс дискретизации состоит в замене непрерывной функции её отдельными значениями в фиксированные моменты времени.

Дискретизация может быть равномерной и неравномерной. При неравномерной дискретизации длительность интервалов между отсчетами различна. Наиболее часто применяется равномерная дискретизации, при которой длительность интервала между отсчетами Т Д , постоянна. Период дискретизации Т Д непрерывного сигнала и(t) (рис. 1 а) выбирается в соответствии с теоремой Котельникова:

где F в - высшая частота в спектре частот сигнала и(t) (рис. 1 б)

Рис. 1.Процесс аналого-цифрового преобразования

Под квантованием понимают преобразование некоторой величины с непрерывной шкалой значений в величину, имеющую дискретную шкалу значений.

Для этого весь диапазон значений сигнала и(t), называемый шкалой делится на равные части – кванты, h – шаг квантования. Процесс квантования сводится к замене любого мгновенного значения одним из конечного множества разрешенных значений, называемых уровнями квантования.

Вид сигнала и(t) в результате совместного проведения операций дискретизации и квантования представлен на рис. 1 в). Дискретизированное значение сигнала и(t), находящееся между двумя уровнями квантования, отождествляется с ближайшим уровнем квантования. Это приводит к ошибкам квантования, которые всегда меньше шага квантования (кванта), т. е. чем меньше шаг квантования, тем меньше погрешность квантования, но больше уровней квантования.

Число уровней квантования на рис. 1 в) равно восьми. Обычно их значительно больше. Можно провести нумерацию уровней и выразить их в двоичной системе счисления. Для восьми уровней достаточно трех двоичных разрядов. Каждое дискретное значение сигнала представляется в этом случае двоичным кодом (табл. 1) в виде последовательности сигналов двух уровней.

Таблица 6.1

Наличие или отсутствие импульса на определенном месте интерпретируется единицей или нолем в соответствующем разряде двоичного числа. Цифровая форма представления сигнала и(t) показана на рис. 1 г). Импульсы старших разрядов расположены крайними справа.

Таким образом, в результате дискретизации, квантования и кодирования аналогового сигнала получаем последовательность n -разрядных кодовых комбинаций, которые следуют с периодом дискретизации Т л. При этом рациональное выполнение операций дискретизации и квантования приводит к значительному экономическому эффекту как за счет снижения затрат на хранение и обработку получаемой информации, так и вследствие сокращения времени обработки информации.

Сигнал (от лат. signum - знак) - знак, физический процесс (или явление), несущий информацию о каком-либо событии, состоянии объекта наблюдения либо передающий команды управления, указания, оповещения.

Сигнал является материальным носителем информации, которая передается от источника к потребителю.

Сигнал - это изменяющийся во времени физический процесс. Такой процесс может содержать различные характеристики. При взаимодействии сигнала с физическими телами возникают определенные изменения свойств этих тел, которые можно зарегистрировать. Таким образом, будем считать, что данные - это зарегистрированные сигналы. Характеристика, которая используется для представления данных, называется параметром сигнала. Если параметр сигнала принимает ряд последовательных значений и их конечное число, сигнал называется дискретным. Если параметр сигнала непрерывная функция, то сигнал называется непрерывным.

Квантование сигнала - преобразование сигнала в последовательность импульсов (квантование сигнала по времени) или в сигнал со ступенчатым изменением амплитуды (квантование сигнала по уровню), а также одновременно и по времени, и по уровню. Применяется при преобразовании непрерывной величины в код в вычислительных устройствах, цифровых измерительных приборах и др.

Данные, безусловно, несут в себе информацию, но они ей не тождественны. Для того чтобы данные стали информацией необходимо наличие методов пересчета одной величины в другую. Данные - диалектическая составная часть информации. В соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов.

Самым распространенным носителем данных в настоящее время является бумага. На бумаге данные регистрируются путем изменения оптических характеристик ее поверхности. В то же время изменение коэффициента отражения поверхности в определенном диапазоне длин волн используется в устройствах, осуществляющих запись лазерным лучом на пластмассовых носителях с отражающим покрытием (CD ROM). Магнитные ленты и магнитные диски, служащие в современных компьютерах главными носителями информации, используют изменение магнитных свойств тела. Свойства информации получаемой пользователем, тесно связаны со свойствами носителей данных, с которых эта информация будет получена. Любой носитель можно характеризовать параметром разрешающей способности , т.е. количеством данных записанных в принятой на носителе единице измерения, и динамическим диапазоном - логарифмическим отношением интенсивности амплитуд максимального и минимального регистрируемого сигнала. От этих свойств носителя зависят такие свойства информации, как полнота, доступность и достоверность. Задача преобразования данных с целью смены носителя относится к одной из важнейших задач информатики. В стоимости вычислительных систем устройства для ввода и вывода данных, работающие с носителями информации, составляют не меньше половины стоимости аппаратных средств.

Обуславливая диалектическое единство данных и методов в информационном процессе, определяют следующие понятия.

Динамический характер информации. Данные имеют статичный характер. Информация динамически меняется и существует только в момент времени взаимодействия данных и методов. Таким образом, информация существует только в момент протекания информационного процесса. Все остальное время она содержится в виде данных.

Требования адекватности методов. Одни и те же данные могут в момент потребления поставлять разную информацию, в зависимости от степени адекватности взаимодействующих с ними методов. Использование более адекватных методов даст более полную информацию.

Диалектический характер взаимодействия данных и методов. Данные являются объективными, это результат регистрации объективно существовавших сигналов, вызванных изменениями в материальных полях или телах. В тоже время методы являются субъективными. В основе искусственных методов лежит алгоритм, т.е. упорядоченная последовательность команд, составленная и подготовленная человеком (субъектом). В основе естественных методов лежат биологические свойства субъектов информационного процесса.

Таким образом, информация возникает и существует в момент диалектического взаимодействия объективных данных и субъективных методов.

Для автоматизации работы с данными, относящимися к различным типам и несущим в себе различную информацию очень важно унифицировать форму их представления. Для этого обычно используется прием кодирования.

Кодирование - это выражение данных одного типа через данные другого типа.

Естественные человеческие языки - это не что иное, как системы кодирования понятий для выражения мыслей посредством речи.

В вычислительной технике работа ведется с числовой информацией. Остальная информация тексты, звуки, изображения и т.д. для обработки в вычислительной среде должна быть преобразована в числовую форму. При этом все числа в память компьютера записываются с использованием, так называемого двоичного кодирования. Двоичное кодирование основано на представлении данных последовательностью всего двух знаков 0 и 1. Эти знаки называются двоичными цифрами, по-английски binary digit или сокращенно (bit) бит.

Двоичная система кодирования выбрана совсем не случайно. Она легко реализуется технически. Электронные схемы для обработки двоичных кодов должны находиться в одном из двух состояний «есть сигнал/нет сигнала» или «высокое / низкое» напряжение и т.д. Схему легко переключать из одного состояния в другое.

Бит - минимальная единица информации в вычислительной технике. Один двоичный разряд.

Группа из восьми бит называется байт и обеспечивает основу записи информации в память компьютера.

1024 байта = 1 килобайту (Кб)
1024 килобайта = 1 мегабайту (Мб)
1024 мегабайта = 1 гигабайту (Гб)

Для правильного понимания, как представляется информации в памяти компьютера, рассмотрим различные системы счисления, используемые современными вычислительными средствами.

Система счисления - это совокупность правил наименования и изображения чисел с помощью набора знаков.

Системы счисления бывают позиционные и непозиционные .

Непозиционная система счисления - это система, где порядок цифры в числе определяется по установленному правилу. Например, непозиционной системой счисления является «римская» система.

Позиционной системой счисления , называется система - где порядок цифры в числе определяется рядом степени числа, которое является основанием данной системы счисления.

В общем виде целое число в позиционной системе счисления можно представить выражением:

N (m) = k0 * m0 + k1 * m1 +…kn-1 * mn-1, где

N(m) - число в m-ой системе счисления;

m - разрядность системы (двоичная, восьмеричная, десятичная, шестнадцатеричная системы m = 2; m = 8; m = 10, m = 16);

n - количество разрядов в числе;

k - цифра в числе.

Рассмотрим, как записываются числа в позиционных системах счисления, используемых современной вычислительной техникой.

Десятичная система счисления.

Основанием десятичной системы является ряд степени числа 10. Разрядность системы m = 10. В десятичной системе счисления 10 цифр (от 0 до 9). Возьмем, к примеру, десятичное число 1957. Число, состоит из четырех цифр - четырехзначное, т.е. n =4. Используя выше приведенную формулу, получим число в десятичной системе счисления.

N(10) = 7*100 + 5*101 + 9*102 + 1*103 = 1957

Двоичная система счисления.

Основанием двоичной системы является ряд степени числа 2. Разрядность системы m = 2. В двоичной системе счисления 2 цифры (0 и 1). Возьмем, к примеру, двоичное число 100011В (В-идентификатор двоичной системы счисления). Число, состоит из шести цифр - шестизначное, т.е. n = 6. Используя выше приведенную формулу, получим десятичное число.

N(2) = 1*20 + 1*21 + 0*22 + 0*23 + 0*24 + 1*25 = 35, т.е. двоичное число 100011В = десятичному числу 35.

Обратим внимание, что для записи чисел в позиционных системах счисления могут быть использованы одинаковые цифры. Так цифры 0 и 1 используются как десятичной, так и двоичной системой. Поэтому в записи чисел недесятичной системы счисления принято использовать буквы являющиеся идентификаторами систем счисления и позволяющие отличить числа одной системы счисления от другой.

Восьмеричная система счисления

Основанием восьмеричной системы является ряд степени числа 8. Разрядность системы m = 8. В восьмеричной системе счисления 8 цифр (от 0 до 7). Возьмем, к примеру, восьмеричное число 573Q (Q-идентификатор восьмеричной системы счисления). Число, состоит из трех цифр - трехзначное, т.е. n = 3. Используя выше приведенную формулу, получим десятичное число.

N(8) = 3*80 + 7*81 + 5*82 = 379, т.е. восьмеричное число 573Q = десятичному числу 379.

Шестнадцатеричная система счисления.

Основанием шестнадцатеричной системы является ряд степени числа 16. Разрядность системы m = 16. В шестнадцатеричной системе счисления 16 цифр (от 0 до F), первые десять цифр от 0 до 9 совпадают с цифрами десятичной системы, а затем идут цифры: A - цифра десять; B - цифра одиннадцать; C - цифра двенадцать; D - цифра тринадцать; E - цифра четырнадцать; F - цифра пятнадцать. Возьмем, к примеру, шестнадцатеричное число 1A7H (H-идентификатор шестнадцатеричной системы счисления). Число, состоит из трех цифр - трехзначное, т.е. n = 3. Используя выше приведенную формулу, получим десятичное число.

N(16) = 7*160 + 10*161 + 1*162 = 423, т.е. шестнадцатеричное число 1A7H = десятичному числу 423.

Каждый раз, вычисляя число N(m) по приведенной выше формуле мы получаем число в десятичной системе. Таким образом, числа из 2-ой, 8-ой и 16-ой системы мы переводили в десятичную систему счисления.

дискретизации;

квантования по уровню;

кодирования.

Дискретизация может быть равномерной и неравномерной. При неравномерной дискретизации продолжительность интервалов между отсчетами различна. Наиболее часто применяется равномерная дискретизации, при которой продолжительность интервала между отсчетами Т Д , постоянна. Период дискретизации Т Д непрерывного сигнала и(t) (рис. 1 а) выбирается в соответствии с теоремой Котельникова:

где F в - высшая частота в спектре частот сигнала и(t) (рис. 1 б)

Рис. 1.Процесс аналого-цифрового преобразования

Таблица 6.1

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, в результате дискретизации, квантования и кодирования аналогового сигнала получаем последовательность n -разрядных кодовых комбинаций, которые следуют с периодом дискретизации Т л. При этом рациональное выполнение операций дискретизации и квантования приводит к значительному экономическому эффекту как за счет снижения затрат на хранение и обработку получаемой информации, так и вследствие сокращения времени обработки информации.

На практике преобразование аналогового сигнала в цифровую форму осуществляется с помощью аналого-цифрового преобразователя (АЦП). Для решения обратной задачи преобразования числа в пропорциональную аналоговую величину, представленную в виде электрического напряжения, тока и т. п., служит цифроаналоговый преобразователь (ЦАП). В ЦАП каждая двоичная кодовая комбинация преобразуется в аналоговый сигнал, и на выходе создается последовательность модулированных по амплитуде импульсов с периодом Т л.

Квантование по уровню применяется для получения конечного числа амплитудных значений дискретных отсчетов сигнала взамен непрерывного бесконечно большого количества их значений, т.е. процесс квантования аналогичен процедуре округления числа до ближайшего разрешенного значения. Такое округление всегда связано с погрешностью, называемой погрешностью квантования.

В результате квантования возникают специфические нелинейные искажения, действие которых на передаваемый сигнал можно условно представить как добавление к неискаженному сигналу некоторой аддитивной помехи - шума квантования. Эти искажения неустранимы, но практически могут быть сделаны неощутимыми для получателя сообщений при надлежащем выборе числа уровней округляемой (квантуемой) величины сигнала.

Рисунок 4.1 - Амплитудная характеристика квантующего устройства с равномерной шкалой

Как видно из рисунка 6, недостаток равномерной шкалы квантования заключается в том, что относительная погрешность квантования, т.е. отношение

для сильных сигналов мала, в то время как для слабых сигналов она велика.

В зависимости от разбивки динамического диапазона сообщения на уровни квантования различают равномерное (линейное) и неравномерное (нелинейное) квантования. В первом случае на всем динамическом диапазоне сообщения шаг квантования выбирается одинаковым. При передаче речевых сигналов наиболее вероятны сигналы с малыми мгновенными значениями, поэтому для передачи их с меньшей погрешностью необходимо уменьшить шаг квантования. Обычно требуют, чтобы защищенность речевого сигнала от шума квантования была не менее 20 дБ на минимальном уровне средней мощности. Под защищенностью понимают

где - мощность сигнала;

Мощность шумов квантования.

При равномерном квантовании для получения требуемой защищенности от шумов квантования при передаче речевых сигналов кодирование должно производиться достаточно большим числом разрядов кода, что нежелательно. При увеличении числа разрядов кода уменьшается длительность импульсов и соответственно расширяется спектр сигнала ИКМ, усложняются устройства кодирования и декодирования, увеличиваются требования к их быстродействию.

Таким образом, недостатком равномерного квантования является то, что защищенность от шумов квантования минимальна для наиболее слабых сигналов и увеличивается пропорционально увеличению уровня сигнала. Для выравнивания величины при изменении уровня сигнала в широких пределах и соответственно для уменьшения количества уровней квантования и уменьшения разрядности двоичного кода применяют неравномерное квантование, при котором шаг квантования имеет минимальное значение для слабых сигналов и увеличивается с увеличением уровня входного сигнала.

Нелинейная шкала квантования в системах передачи с ИКМ может быть реализована несколькими способами: сжатием динамического диапазона сигнала перед кодированием, для чего используются компрессоры, и последующим его расширением после декодирования с помощью экспандеров; нелинейным кодированием и декодированием; цифровым компандированием.

Рисунок 4.2 - Амплитудная характеристика квантующего устройства с нелинейной (неравномерной) шкалой

При неравномерном квантовании непрерывных сигналов обычно ставится задача: выбором закона изменения шага квантования обеспечить примерно равное отношение сигнал-шум квантования в достаточно широком диапазоне уровней входных сигналов. Если шаг квантования будет возрастать по мере увеличения входного сигнала, то по сравнению с равномерным квантованием для слабых сигналов отношение сигнал-шум возрастет, а для сильных снижается, оставаясь, однако, достаточно высоким.

Рассмотрим один из возможных способов осуществления неравномерного квантования - с использованием аналоговых компандеров.

Компрессор представляет собой устройство с нелинейной амплитудной характеристикой, называемой характеристикой компрессии. Слабые сигналы компрессор усиливает в большей степени, чем сильные, благодаря чему происходит сжатие динамического диапазона ().

Применение компрессора перед кодером с равномерным квантованием позволяет получить неравномерное квантование. На приемном конце после декодера сигнал поступает на экспандер, имеющий обратную компрессору амплитудную характеристику, при этом суммарная амплитудная характеристика должна быть линейной. Экспандер устраняет искажения, вносимые в сигнал компрессором, так что результирующая амплитудная характеристика сигнала "компрессор-экспандер" является линейной. Система, состоящая из последовательно включенных компрессора и экспандера, называется компандером.

Применение неравномерного квантования позволяет обеспечить требуемую защищенность от шумов квантования для наиболее слабых речевых сигналов при восьмиразрядном кодировании вместо двенадцатиразрядного при равномерном квантовании.

Недостатком аналогового компандирования является сложность получения с большой точностью взаимообратных амплитудных характеристик компрессора и экспандера, вследствие чего нелинейность суммарной амплитудной характеристики приводит к нелинейным искажениям передаваемых сигналов.

Необходимое качество передачи сигналов в реальных условиях достигается путем применения неравномерных кодирующих и декодирующих устройств (методами нелинейного кодирования), когда формирование неравномерной квантующей характеристики осуществляется непосредственно в кодере (декодере). Последний в этом случае называется нелинейным.

Наиболее распространенными для кодеров с неравномерным шагом квантования являются два приблизительно равноценных закона компрессии и, с помощью которых получается квазилогарифмическая характеристика компрессора.

Дискретизация непрерывных сообщений производится АИМ - модуляторами в соответствии с теоремой Котельникова. На выходе АИМ - модуляторов формируется групповой АИМ - сигнал. Работой АИМ - модуляторов управляют последовательности канальных импульсов. Групповой АИМ - сигнал поступает на кодер, который одновременно с кодированием осуществляет операцию квантования по уровню.

Многоканальные системы передачи в основном применяются для передачи речевых сигналов, которые относятся к непрерывным. Для передачи непрерывного сообщения с помощью ИКМ необходимо выполнить следующие операции:

· дискретизация сообщения по времени (получение АИМ - сигнала);

· квантование полученных импульсов (отсчетов, выборок) по амплитуде;

· кодирование квантованных по амплитуде импульсов.

В результате квантования возникают специфические нелинейные искажения, действие которых на передаваемый сигнал можно условно представить как добавление к неискаженному сигналу некоторой аддитивной помехи - шума квантования. Эти искажения неустранимы, но практически могут быть сделаны неощутимыми для получателя сообщений при надлежащим выборе числа уровней округляемой (квантуемой) величины сигнала.

В зависимости от разбивки динамического диапазона сообщения на уровни квантования различают равномерное (линейное) и неравномерное (нелинейное) квантования.

Наиболее распространенными для кодеров с неравномерным шагом квантования являются два приблизительно равноценных закона компандирования м и A , с помощью которых получается квазилогарифмическая характеристика компрессора.

Характеристика компрессии закона A? описывается следующим уравнением:

где sign (л) - полярность сигнала;

л - амплитуда входного сигнала;

А - параметр, используемый для определения степени компрессирования.

В качестве международного стандарта для нелинейных кодеров взвешивающего типа принята сегментная характеристика компандирования типа А = 87,6/13 .

Для законов квантования А = 87,6/13 рассчитаем для первых N i отсчётов каждого входного сигналов в первом цикле передачи:

· абсолютное значение отсчётов в условных единицах;

· номер сегмента (С ) отсчётов;

· номер уровня квантования (К ) отсчётов в сегментах.

для 7-го канала для 8-го канала

для 9-го канала для 10-го канала

для 11-го канала для 12-го канала

Номер сегмента С квантованного отсчёта определяется как наименьшее целое из выражения:

Найдем разность r между амплитудой входного сигнала и величиной, соответствующей нижней конечности точке данного сегмента:

Номер уровня квантования К отсчёта в сегменте определяется как наименьшее целое из выражения:

Подставляя значения в формулу, получим:

Аналогичные расчеты произведем для 2-го, 3-го и 4-го циклов передачи. Результаты расчетов сведем в таблицу 4.1.

Таблица 4.1 - Результаты квантования отсчетов по уровню и их кодирование

Номер цикла	Номер исследуемого канала	Значение отсчёта	Полярность отсчёта	Код полярности отсчёта	Номер сегмента	Код номера сегмента	Уровень квантования в сегменте	Код уровня квантования в сегменте	Закодированное значение отсчёта