Какъв принцип на кодиране на информация се използва в компютъра. Информация за кодиране

Кодиране на информация в компютър

Цялата информация, която компютърът обработва, трябва да бъде представена в двоичен код с помощта на две цифри - 0 и 1. Тези два знака обикновено се наричат ​​двоични цифри или битове. Използвайки две числа 1 и 0 можете да кодирате всяко съобщение. Това беше причината два важни процеса да бъдат организирани в компютъра:

    кодиране, което се осигурява от входни устройства при преобразуване на входната информация в компютърно възприемаема форма, т.е. в двоичен код; декодиране, което се осигурява от изходни устройства при преобразуване на данни от двоичен код във форма, която може да бъде разбрана от хората.

От гледна точка на техническата реализация, използването на двоичната бройна система за кодиране на информация се оказа много повече
по-просто от използването на други методи. Наистина е удобно да се кодира информация като последователност от нули и единици, ако си представим тези стойности като две възможни стабилни състояния на електронен елемент:

    0 - няма електрически сигнал или сигналът е слаб; 1 - има сигнал или сигналът е на високо ниво.

Тези условия са лесни за разграничаване. Недостатъкът на двоичното кодиране е дългите кодове. Но в технологиите е по-лесно да се работи с голям брой прости елементи, отколкото с малък брой сложни.

Дори в ежедневието трябва да се справяте с устройство, което може да бъде само в две стабилни състояния: включено/изключено. Разбира се, това е превключвател, който е познат на всички. Но се оказа невъзможно да се измисли превключвател, който да може стабилно и бързо да превключва към някое от 10 състояния. В резултат на това, след редица неуспешни опити, разработчиците стигнаха до извода, че е невъзможно да се изгради компютър, базиран на десетичната бройна система. И основата за представяне на числата в компютъра беше двоичната бройна система.


В момента има различни начини за двоично кодиране и декодиране на информация в компютър. На първо място, зависи от вида на информацията, а именно какво трябва да бъде кодирано: текст, числа, графики или звук. Освен това, когато кодирате числа, важна роля играе как ще бъдат използвани: в текст, в изчисления или в I/O процеса. Налагат се и особености на техническо изпълнение.

Кодиране на графична информация

Има два начина за създаване и съхраняване на графични обекти на вашия компютър - като растерно изображение или като векторно изображение. Всеки тип изображение използва свой собствен метод на кодиране.

Растерното изображение е колекция от точки, използвани за показването му на екрана на монитора. Обемът на растерното изображение се определя като произведение от броя точки и информационния обем на една точка, което зависи от броя на възможните цветове. За черно-бяло изображение информационният обем на една точка е 1 бит, тъй като точката може да бъде както черна, така и бяла, която може да бъде кодирана с две цифри - 0 или 1.

За кодиране на 8 цвята са необходими 3 бита; за 16 цвята - 4 бита; за 6 цвята - 8 бита (1 байт) и т.н.

Кодиране на аудио информация

Звукът е звукова вълна с непрекъснато променящи се амплитуда и честота. Колкото по-голяма е амплитудата на сигнала, толкова по-силен е той за човек; колкото по-висока е честотата на сигнала, толкова по-висок е тонът. За да може компютърът да обработва звук, непрекъснатият аудио сигнал трябва да се преобразува в поредица от електрически импулси (двоични единици и нули).

В процеса на кодиране на непрекъснат аудио сигнал се извършва неговата времева дискретизация. Продължителната звукова вълна се разделя на отделни малки секции, като за всяка такава се задава определена стойност на амплитудата. По този начин непрекъснатата зависимост на амплитудата на сигнала от времето се заменя с дискретна последователност от нива на гръмкост.

Съвременните звукови карти осигуряват 16-битова дълбочина на аудио кодиране. В този случай броят на нивата на сигнала ще бъде 65536.

При двоично кодиране на непрекъснат аудио сигнал, той се заменя с последователност от дискретни нива на сигнала. Качеството на кодирането зависи от броя на измерванията на нивото на сигнала за единица време, т.е. от честотата на дискретизация. Колкото по-голям е броят на измерванията, направени за 1 секунда (колкото по-висока е честотата на вземане на проби), толкова по-точна е процедурата за двоично кодиране.

Броят на измерванията в секунда може да варира от 8000 до 48000, т.е. честотата на дискретизация на аналогов аудио сигнал може да приема стойности от 8 до 48 kHz - качество на звука на аудио CD. Също така трябва да се има предвид, че са възможни както моно, така и стерео режими.

Представяне на видео информация

Напоследък компютрите все повече се използват за работа с видео информация. Най-лесният начин да направите това е да гледате филми и видеоклипове. Трябва ясно да се разбере, че обработката на видео информация изисква много висока скорост на компютърната система.

Какъв е филмът от гледна точка на компютърните науки? На първо място, това е комбинация от звукова и графична информация. В допълнение, за да се създаде ефект на движение на екрана, се използва присъща дискретна технология за бърза смяна на статични изображения. Проучванията показват, че ако за една секунда се сменят повече от 10-12 кадъра, то човешкото око възприема промените в тях като непрекъснати.

Изглежда, че ако проблемите с кодирането на статистическа графика и звук бъдат решени, тогава запазването на видео изображението няма да е трудно. Но това е само на пръв поглед, тъй като, както показва примерът, разгледан по-горе, при използване на традиционни методи за съхранение на информация електронната версия на филма ще се окаже твърде голяма. Доста очевидно подобрение е, че първият кадър се запомня изцяло (в литературата обикновено се нарича ключов кадър), а в следващите се запазват само разликите от първоначалния кадър (разликови кадри).

Има много различни формати за представяне на видео данни.

В средата на Windows, например, повече от 10 години (започвайки с версия 3.1) се използва форматът Video for Windows, базиран на универсални файлове с разширение AVI (Audi o Video Interleave - редуване на аудио и видео).

Технология, наречена DivX (произлизаща от съкращението на думата Digital Video Express), стана широко разпространена. Благодарение на DivX беше възможно да се постигне ниво на компресия, което направи възможно поставянето на висококачествен запис на пълнометражен филм на един CD - компресиране на 4,7 GB DVD филм до 650 MB.

Кодът е набор от конвенции (или сигнали) за запис (или комуникация) на някои предварително дефинирани концепции.

Информационното кодиране е процес на формиране на специфично представяне на информация. В по-тесен смисъл терминът "кодиране" често се разбира като преход от една форма на представяне на информация към друга, по-удобна за съхранение, предаване или обработка.

Обикновено всяко изображение при кодиране (понякога наричано криптиране) се представя с отделен знак.

Знакът е елемент от краен набор от елементи, различни един от друг.

В по-тесен смисъл терминът "кодиране" често се разбира като преход от една форма на представяне на информация към друга, по-удобна за съхранение, предаване или обработка.

Компютърът може да обработва само информация, представена в цифрова форма. Цялата друга информация (например звуци, изображения, показания на инструменти и т.н.) трябва да се преобразува в цифрова форма за обработка на компютър. Например, за да се определи количествено музикален звук, може да се измери интензитета на звука при определени честоти на кратки интервали, представяйки резултатите от всяко измерване в цифрова форма. С помощта на компютърни програми можете да трансформирате получената информация, например да „наслагвате“ звуци от различни източници един върху друг.

По подобен начин текстовата информация може да се обработва на компютър. Когато се въведе в компютър, всяка буква се кодира с определен номер, а когато се изведе на външни устройства (екран или печат), изображенията на буквите се изграждат от тези числа за човешко възприемане. Съответствието между набор от букви и цифри се нарича кодиране на знаци.

По правило всички числа в компютъра се представят с нули и единици (а не с десет цифри, както е обичайно за хората). С други думи, компютрите обикновено работят в двоичната бройна система, тъй като това прави устройствата за обработката им много по-прости. Въвеждането на числа в компютър и извеждането им за четене от хора може да се извърши в обичайната десетична форма и всички необходими преобразувания се извършват от програми, работещи на компютъра.

Методи за кодиране на информация.

Една и съща информация може да бъде представена (кодирана) в няколко форми. С появата на компютрите възникна необходимостта от кодиране на всички видове информация, с които борави както отделният човек, така и човечеството като цяло. Но човечеството започна да решава проблема с кодирането на информация много преди появата на компютрите. Грандиозните постижения на човечеството - писането и аритметиката - не са нищо повече от система за кодиране на реч и цифрова информация. Информацията никога не се появява в чист вид, тя винаги е представена по някакъв начин, кодирана по някакъв начин.

Двоичното кодиране е един от често срещаните начини за представяне на информация. В компютрите, роботите и машините с цифрово управление по правило цялата информация, с която работи устройството, е кодирана под формата на думи от двоичната азбука.

Кодиране на символна (текстова) информация.

Основната операция, извършвана върху отделни текстови знаци, е сравнението на знаци.

При сравняване на знаци най-важните аспекти са уникалността на кода за всеки знак и дължината на този код, а самият избор на принцип на кодиране е практически без значение.

За кодиране на текстове се използват различни таблици за преобразуване. Важно е една и съща таблица да се използва при кодиране и декодиране на един и същ текст.

Таблица за преобразуване е таблица, съдържаща списък от кодирани знаци, подредени по някакъв начин, според който знакът се преобразува в своя двоичен код и обратно.

Най-популярните таблици за преобразуване: DKOI-8, ASCII, CP1251, Unicode.

В исторически план 8 бита или 1 байт са били избрани като дължина на кода за кодиране на знаци. Следователно най-често един знак от текста, съхраняван в компютъра, съответства на един байт памет.

При дължина на кода от 8 бита може да има 28 = 256 различни комбинации от 0 и 1, така че не повече от 256 знака могат да бъдат кодирани с помощта на една таблица за преобразуване. С дължина на кода от 2 байта (16 бита) могат да бъдат кодирани 65536 знака.

Кодиране на числова информация.

Приликата в кодирането на цифрова и текстова информация е следната: за да се сравняват данни от този тип, различните числа (както и различните знаци) трябва да имат различен код. Основната разлика между числови данни и символни данни е, че в допълнение към операцията за сравнение, върху числата се извършват различни математически операции: събиране, умножение, извличане на корен, изчисляване на логаритъм и др. Правилата за извършване на тези операции в математиката са разработени подробно за числа, представени в позиционната бройна система.

Основната бройна система за представяне на числа в компютър е двоичната позиционна бройна система.

Кодиране на текстова информация

В момента повечето потребители използват компютър за обработка на текстова информация, която се състои от символи: букви, цифри, препинателни знаци и т.н. Нека изчислим колко символа и колко бита са ни необходими.

10 цифри, 12 препинателни знака, 15 аритметични символа, букви от руската и латинската азбука, ОБЩО: 155 знака, което съответства на 8 бита информация.

Единици за измерване на информация.

1 байт = 8 бита

1 KB = 1024 байта

1 MB = 1024 KB

1 GB = 1024 MB

1 TB = 1024 GB

Същността на кодирането е, че на всеки знак се присвоява двоичен код от 00000000 до 11111111 или съответен десетичен код от 0 до 255.

Трябва да се помни, че в момента се използват пет различни кодови таблици за кодиране на руски букви (KOI - 8, CP1251, CP866, Mac, ISO) и текстовете, кодирани с помощта на една таблица, няма да се показват правилно в друга

Основният дисплей на кодирането на знаци е ASCII кодът - американски стандартен код за обмен на информация, който е таблица 16 на 16, където знаците са кодирани в шестнадесетичен запис.

Кодиране на графична информация.

Важна стъпка в кодирането на графично изображение е разделянето му на отделни елементи (семплиране).

Основните начини за представяне на графики за съхранение и обработка с помощта на компютър са растерни и векторни изображения

Векторното изображение е графичен обект, състоящ се от елементарни геометрични фигури (най-често сегменти и дъги). Позицията на тези елементарни сегменти се определя от координатите на точките и радиуса. За всеки ред са посочени двоични кодове за вида на линията (плътна, пунктирана, тире-пунктирана), дебелина и цвят.

Растерното изображение е съвкупност от точки (пиксели), получени в резултат на вземане на проби от изображение в съответствие с принципа на матрицата.

Матричният принцип на кодиране на графични изображения е, че изображението е разделено на определен брой редове и колони. След това всеки елемент от получената мрежа се кодира според избраното правило.

Пикселът (елемент на изображението) е минималната единица от изображение, чийто цвят и яркост могат да се задават независимо от останалата част от изображението.

В съответствие с матричния принцип изображенията се конструират, извеждат на принтера, показват се на екрана и се получават с помощта на скенер.

Колкото по-високо е качеството на изображението, толкова по-плътни са пикселите, т.е. толкова по-висока е разделителната способност на устройството и толкова по-точно се кодира цветът на всеки от тях.

За черно-бяло изображение цветният код за всеки пиксел се определя с един бит.

Ако картината е цветна, то за всяка точка се задава двоичен код за нейния цвят.

Тъй като цветовете са кодирани в двоичен код, ако например искате да използвате 16-цветна картина, тогава ще ви трябват 4 бита (16=24), за да кодирате всеки пиксел, а ако е възможно да използвате 16 бита (2 байта), за да кодирате цвят на един пиксел, тогава можете да предадете 216 = 65536 различни цвята. Използването на три байта (24 бита) за кодиране на цвета на една точка ви позволява да отразите 16 777 216 (или около 17 милиона) различни нюанса на цвета - така нареченият режим "истински цвят". Имайте предвид, че те се използват в момента, но са далеч от максималните възможности на съвременните компютри.

Кодиране на аудио информация.

От курса си по физика знаете, че звукът е вибрация на въздуха. По своята същност звукът е непрекъснат сигнал. Ако преобразуваме звука в електрически сигнал (например с помощта на микрофон), ще видим как напрежението се променя плавно с течение на времето.

За компютърна обработка аналоговият сигнал трябва по някакъв начин да се преобразува в поредица от двоични числа и за да се направи това, той трябва да бъде дискретизиран и дигитализиран.

Можете да направите следното: измервайте амплитудата на сигнала на редовни интервали и записвайте получените числени стойности в паметта на компютъра.

Съвременният компютър може да обработва цифрова, текстова, графична, звукова и видео информация. Всички тези видове информация в компютъра се представят в двоичен код, т.е. използва се азбука с капацитет от два знака (0 и 1). Това се дължи на факта, че е удобно да се представи информацията под формата на последователност от електрически импулси: няма импулс (0), има импулс (1). Такова кодиране обикновено се нарича двоично, а самите логически последователности от нули и единици се наричат ​​машинен език.

Всяка цифра от машинния двоичен код носи количество информация, равно на един бит.

Това заключение може да се направи, като се разглеждат числата от машинната азбука като еднакво вероятни събития. Когато записвате двоична цифра, можете да изберете само едно от две възможни състояния, което означава, че тя носи количество информация, равно на 1 бит. Следователно две цифри носят 2 бита информация, четири цифри носят 4 бита и т.н. За да се определи количеството информация в битове, е достатъчно да се определи броят на цифрите в двоичния машинен код.

Кодиране на текстова информация

В момента повечето потребители използват компютър за обработка на текстова информация, която се състои от символи: букви, цифри, препинателни знаци и др.

На базата на една клетка с информационен капацитет от 1 бит могат да се кодират само 2 различни състояния. За да може всеки знак, който може да бъде въведен от клавиатурата в латиница, да получи свой собствен уникален двоичен код, са необходими 7 бита. Въз основа на последователност от 7 бита, в съответствие с формулата на Хартли, могат да се получат N = 2 7 = 128 различни комбинации от нули и единици, т.е. двоични кодове. Като присвоим на всеки знак неговия двоичен код, получаваме таблица за кодиране. Човек оперира със символи, компютър с техните двоични кодове.

За клавиатурната подредба на латиница има само една таблица за кодиране за целия свят, така че текстът, въведен с помощта на латинската подредба, ще бъде адекватно показан на всеки компютър. Тази таблица се нарича ASCII (Американски стандартен код за обмен на информация) на английски се произнася [éski], на руски се произнася [áski]. По-долу е цялата ASCII таблица, кодовете в която са посочени в десетична форма. От него можете да определите, че когато въведете да речем символа “*” от клавиатурата, компютърът го възприема като код 42(10), от своя страна 42(10)=101010(2) - това е двоичният код на символът "* " Кодове от 0 до 31 не се използват в тази таблица.

ASCII символна таблица

За да се кодира един символ, се използва количество информация, равно на 1 байт, т.е. I = 1 байт = 8 бита. Използвайки формула, която свързва броя на възможните събития K и количеството информация I, можете да изчислите колко различни символа могат да бъдат кодирани (приемайки, че символите са възможни събития):

K = 2 I = 2 8 = 256,

т.е. азбука с капацитет от 256 знака може да се използва за представяне на текстова информация.

Същността на кодирането е, че на всеки знак се присвоява двоичен код от 00000000 до 11111111 или съответен десетичен код от 0 до 255.

Трябва да се помни, че в момента Пет различни кодови таблици се използват за кодиране на руски букви(KOI - 8, SR1251, SR866, Mac, ISO) и текстовете, кодирани с помощта на една таблица, няма да бъдат показани правилно в друго кодиране. Това може да бъде визуално представено като фрагмент от комбинирана таблица за кодиране на знаци.

Различни символи се присвояват на един и същ двоичен код.

Двоичен код

Десетичен код

Въпреки това, в повечето случаи не потребителят се грижи за прекодирането на текстови документи, а специални програми - конвертори, които са вградени в приложения.

От 1997 г. най-новите версии на Microsoft Office поддържат новото кодиране. Нарича се Unicode. Unicode е таблица за кодиране, която използва 2 байта за кодиране на всеки знак, т.е. 16 бита. Въз основа на такава таблица могат да бъдат кодирани N=2 16 =65 536 знака.

Unicode включва почти всички съвременни писмености, включително: арабски, арменски, бенгалски, бирмански, гръцки, грузински, деванагари, иврит, кирилица, коптски, кхмерски, латински, тамилски, хангъл, хан (Китай, Япония, Корея), чероки, етиопски, японски (катакана, хирагана, канджи) и др.

За академични цели са добавени много исторически писмености, включително: древногръцки, египетски йероглифи, клинопис, писменост на маите и етруска азбука.

Unicode предоставя широка гама от математически и музикални символи и пиктограми.

Има два кодови диапазона за кирилски знаци в Unicode:

Кирилица (#0400 - #04FF)

Добавка на кирилица (#0500 - #052F).

Но внедряването на Unicode таблицата в нейната чиста форма се възпрепятства от факта, че ако кодът на един знак заема не един байт, а два байта, ще отнеме два пъти повече дисково пространство за съхраняване на текста и два пъти толкова време, за да го предаде по комуникационни канали.

Следователно на практика сега Unicode представянето UTF-8 (Unicode Transformation Format) е по-често срещано. UTF-8 осигурява най-добрата съвместимост със системи, които използват 8-битови знаци. Текст, състоящ се само от знаци с номера под 128, се преобразува в обикновен ASCII текст, когато е написан в UTF-8. Други символи на Unicode са представени като последователности с дължина от 2 до 4 байта. Като цяло, тъй като най-често срещаните знаци в света, латинската азбука, все още заемат 1 байт в UTF-8, това кодиране е по-икономично от чистия Unicode.

За да определите цифровия код на знак, можете да използвате кодова таблица. За да направите това, изберете от менюто „Вмъкване“ - „Символ“, след което на екрана се появява диалоговият панел „Символ“. В диалоговия прозорец се появява таблица със знаци за избрания шрифт. Знаците в тази таблица са подредени ред по ред, последователно отляво надясно, като се започне със знака за интервал.

Запознахме се с бройните системи - начини за кодиране на числата. Числата дават информация за броя на елементите. Тази информация трябва да бъде кодирана и представена в някаква бройна система. Кой от известните методи да изберете зависи от проблема, който се решава.
Доскоро компютрите обработваха предимно числова и текстова информация. Но човек получава по-голямата част от информацията за външния свят под формата на изображения и звук. В този случай изображението се оказва по-важно. Помнете поговорката: „По-добре е да видиш веднъж, отколкото да чуеш сто пъти“. Ето защо днес компютрите започват да работят все по-активно с изображения и звук. Определено ще обмислим начини за кодиране на такава информация.

Двоично кодиране на цифрова и текстова информация.

Всяка информация се кодира в компютър с помощта на последователности от две цифри - 0 и 1. Компютърът съхранява и обработва информация под формата на комбинация от електрически сигнали: напрежение 0,4V-0,6V съответства на логическа нула, а напрежение 2,4V-2,7 V съответства на логическа единица. Извикват се последователности от 0 и 1 двоични кодове , а числата 0 и 1 са битове (двоични цифри). Това кодиране на информация в компютъра се нарича двоично кодиране . По този начин двоичното кодиране е кодиране с минималния възможен брой елементарни символи, кодиране с най-простите средства. Ето защо той е забележителен от теоретична гледна точка.
Инженерите са привлечени от двоичното кодиране на информацията, защото е лесно за изпълнение технически. Електронните схеми за обработка на двоични кодове трябва да бъдат само в едно от двете състояния: има сигнал / няма сигнал или високо напрежение/ниско напрежение .
В своята работа компютрите оперират с реални и цели числа, представени под формата на два, четири, осем и дори десет байта. За представяне на знака на число при броене, доп знакова цифра , който обикновено се намира преди цифровите цифри. За положителни числа стойността на знаковия бит е 0, а за отрицателни числа - 1. За да напишете вътрешното представяне на отрицателно цяло число (-N), трябва:
1) вземете допълнителния код на числото N, като замените 0 с 1 и 1 с 0;
2) добавете 1 към полученото число.

Тъй като един байт не е достатъчен за представяне на това число, той се представя като 2 байта или 16 бита, неговият допълващ код е 1111101111000101, следователно -1082=1111101111000110.
Ако компютърът можеше да обработва само единични байтове, нямаше да има голяма полза. В действителност компютърът работи с числа, които са записани в два, четири, осем и дори десет байта.
От края на 60-те години компютрите все повече се използват за обработка на текстова информация. За представяне на текстова информация обикновено се използват 256 различни знака, например главни и малки букви от латинската азбука, цифри, препинателни знаци и др. В повечето съвременни компютри всеки символ съответства на поредица от осем нули и единици, т.нар байт .
Байтът е осембитова комбинация от нули и единици.
При кодирането на информацията в тези електронни компютри се използват 256 различни последователности от 8 нули и единици, което позволява да се кодират 256 знака. Например, голямата руска буква „М“ има код 11101101, буквата „I“ има код 11101001, буквата „P“ има код 11110010. Така думата „СВЯТ“ е кодирана с последователност от 24 бита или 3 байта: 111011011110100111110010.
Броят на битовете в едно съобщение се нарича обем на информацията на съобщението. Това е интересно!

Първоначално в компютрите се използва само латинската азбука. Има 26 букви. И така, пет импулса (бита) биха били достатъчни, за да обозначат всеки един. Но текстът съдържа препинателни знаци, десетични числа и т.н. Следователно в първите англоезични компютри един байт - машинна сричка - включва шест бита. След това седем - не само за разграничаване на големи букви от малки, но и за увеличаване на броя на контролните кодове за принтери, сигнални светлини и друго оборудване. През 1964 г. се появява мощният IBM-360, в който байтът най-накрая става равен на осем бита. Последният осми бит беше необходим за псевдографични знаци.
Присвояването на конкретен двоичен код на символ е въпрос на конвенция, която се записва в кодовата таблица. За съжаление има пет различни кодировки на руски букви, така че текстовете, създадени в едно кодиране, няма да бъдат отразени правилно в друго.
Хронологично, един от първите стандарти за кодиране на руски букви на компютри беше KOI8 („Код за обмен на информация, 8 бита“). Най-често срещаното кодиране е стандартното кодиране на кирилица на Microsoft Windows, обозначено със съкращението SR1251 („SR“ означава „Кодова страница“ или „кодова страница“). Apple разработи собствено кодиране на руски букви (Mac) за компютри Macintosh. Международната организация по стандартизация (ISO) одобри кодирането ISO 8859-5 като стандарт за руски език. Най-накрая се появи нов международен стандарт Unicode, който разпределя не един байт за всеки знак, а два, и следователно с негова помощ можете да кодирате не 256 знака, а цели 65536.
Всички тези кодировки продължават кодовата таблица ASCII (Американски стандартен код за обмен на информация), която кодира 128 знака.

ASCII символна таблица:

код символ код символ код символ код символ код символ код символ
32 пространство 48 . 64 @ 80 П 96 " 112 стр
33 ! 49 0 65 А 81 Q 97 а 113 р
34 " 50 1 66 б 82 Р 98 b 114 r
35 # 51 2 67 ° С 83 С 99 ° С 115 с
36 $ 52 3 68 д 84 T 100 д 116 T
37 % 53 4 69 д 85 U 101 д 117 u
38 & 54 5 70 Е 86 V 102 f 118 v
39 " 55 6 71 Ж 87 У 103 ж 119 w
40 ( 56 7 72 з 88 х 104 ч 120 х
41 ) 57 8 73 аз 89 Y 105 аз 121 г
42 * 58 9 74 Дж 90 З 106 й 122 z
43 + 59 : 75 К 91 [ 107 к 123 {
44 , 60 ; 76 Л 92 \ 108 л 124 |
45 - 61 < 77 М 93 ] 109 м 125 }
46 . 62 > 78 н 94 ^ 110 н 126 ~
47 / 63 ? 79 О 95 _ 111 о 127 DEL

Двоичното кодиране на текста се извършва по следния начин: когато натиснете клавиш, определена последователност от електрически импулси се предава на компютъра и всеки знак съответства на собствена последователност от електрически импулси (нули и единици на машинния език). Програмата за драйвер на клавиатурата и екрана определя знака с помощта на кодовата таблица и създава неговото изображение на екрана. Така текстовете и числата се съхраняват в паметта на компютъра в двоичен код и се преобразуват програмно в изображения на екрана.

Двоично кодиране на графична информация.

От 80-те години технологията за обработка на графична информация на компютър се развива бързо. Компютърната графика се използва широко в компютърната симулация в научни изследвания, компютърна симулация, компютърна анимация, бизнес графика, игри и др.
Графичната информация на екрана на дисплея се представя под формата на изображение, което се формира от точки (пиксели). Погледнете внимателно снимка от вестник и ще видите, че тя също се състои от малки точки. Ако това са само черни и бели точки, тогава всяка от тях може да бъде кодирана с 1 бит. Но ако в снимката има нюанси, тогава два бита ви позволяват да кодирате 4 нюанса на точки: 00 - бяло, 01 - светло сиво, 10 - тъмно сиво, 11 - черно. Три бита ви позволяват да кодирате 8 нюанса и т.н.
Броят на битовете, необходими за кодиране на един нюанс на цвета, се нарича дълбочина на цвета.

В съвременните компютри резолюция (броят на точките на екрана), както и броят на цветовете зависи от видео адаптера и може да се променя софтуерно.
Цветните изображения могат да имат различни режими: 16 цвята, 256 цвята, 65536 цвята ( висок цвят), 16777216 цвята ( истински цвят). На точка за режим висок цвятНеобходими са 16 бита или 2 байта.
Най-често срещаната резолюция на екрана е 800 на 600 пиксела, т.е. 480 000 точки. Нека изчислим количеството видеопамет, необходимо за режим с висок цвят: 2 байта *480000=960000 байта.
По-големи единици също се използват за измерване на количеството информация:


Следователно 960 000 байта са приблизително равни на 937,5 KB. Ако човек говори по осем часа на ден без почивка, тогава в течение на 70 години живот той ще говори около 10 гигабайта информация (това са 5 милиона страници - купчина хартия с височина 500 метра).
Скоростта на предаване на информация е броят битове, предавани за секунда. Скоростта на предаване от 1 бит в секунда се нарича 1 бод.

Растерната карта, която представлява код на двоично изображение, се съхранява във видео паметта на компютъра, откъдето се чете от процесора (поне 50 пъти в секунда) и се показва на екрана.


Двоично кодиране на аудио информация.

От началото на 90-те години персоналните компютри могат да работят с аудио информация. Всеки компютър със звукова карта може да записва като файлове ( файлът е определено количество информация, съхранявано на диска и има име ) и възпроизвеждане на аудио информация. Използването на специален софтуер (редактори на аудио файлове) отваря широки възможности за създаване, редактиране и прослушване на звукови файлове. Създават се програми за разпознаване на реч и става възможно да управлявате компютъра с гласа си.
Това е звуковата карта (карта), която преобразува аналоговия сигнал в дискретна фонограма и обратно, „дигитализирания“ звук в аналогов (непрекъснат) сигнал, който отива към входа на високоговорителя.


При двоично кодиране на аналогов аудиосигнал непрекъснатият сигнал се семплира, т.е. се заменя с поредица от негови отделни образци - показания. Качеството на двоичното кодиране зависи от два параметъра: броя на дискретните нива на сигнала и броя на пробите в секунда. Броят на пробите или честотата на вземане на проби в аудио адаптерите може да бъде различен: 11 kHz, 22 kHz, 44,1 kHz и т.н. Ако броят на нивата е 65536, тогава 16 бита (216) са предназначени за един аудио сигнал. 16-битов аудио адаптер кодира и възпроизвежда аудио по-точно от 8-битов аудио адаптер.
Броят битове, необходими за кодиране на едно аудио ниво, се нарича аудио дълбочина.
Обемът на моно аудио файл (в байтове) се определя по формулата:


При стереофоничен звук силата на звука на аудио файла се удвоява, при квадрафоничен звук се учетворява.
С усложняването на програмите и увеличаването на техните функции, както и с появата на мултимедийни приложения, функционалният обем на програмите и данните се увеличава. Ако в средата на 80-те обичайният обем на програми и данни беше десетки и само понякога стотици килобайти, то в средата на 90-те той започна да възлиза на десетки мегабайти. Количеството RAM се увеличава съответно.


В света има постоянен обмен на информационни потоци. Източници могат да бъдат хора, технически устройства, различни предмети, обекти на неживата и живата природа. Един или няколко обекта могат да получават информация.

За по-добър обмен на данни информацията се кодира и обработва едновременно от страна на предавателя (подготвяне на данните и преобразуването им във форма, удобна за излъчване, обработка и съхранение), препращане и декодиране от страната на приемника (преобразуване на кодираните данни в оригиналната им форма). Това са взаимосвързани задачи: източникът и приемникът трябва да имат сходни алгоритми за обработка на информация, в противен случай процесът на кодиране-декодиране ще бъде невъзможен. Кодирането и обработката на графична и мултимедийна информация обикновено се осъществява на базата на компютърни технологии.

Кодиране на информация на компютър

Има много начини за обработка на данни (текстове, числа, графики, видео, звук) с помощта на компютър. Цялата информация, обработвана от компютър, се представя в двоичен код - с помощта на числата 1 и 0, наречени битове. Технически този метод се изпълнява много просто: 1 - има електрически сигнал, 0 - липсва. От човешка гледна точка такива кодове са неудобни за разбиране - дългите низове от нули и единици, които са кодирани знаци, са много трудни за дешифриране веднага. Но този формат на запис веднага ясно показва какво представлява кодирането на информацията. Например, числото 8 в двоична осембитова форма изглежда като следната последователност от битове: 000001000. Но това, което е трудно за човек, е просто за компютъра. За електрониката е по-лесно да обработва много прости елементи, отколкото малък брой сложни.

Кодиране на текст

Когато натиснем бутон на клавиатурата, компютърът получава специфичен код за натиснатия бутон, търси го в стандартната ASCII символна таблица (Американски код за обмен на информация), „разбира“ кой бутон е натиснат и предава този код за по-нататък обработка (например за показване на знака на монитора). За съхраняване на символния код в двоична форма се използват 8 бита, така че максималният брой комбинации е 256. Първите 128 знака се използват за контролни знаци, цифри и латински букви. Втората половина е предназначена за национални символи и псевдографика.

Кодиране на текст

Ще бъде по-лесно да разберете какво е кодирането на информация с пример. Нека да разгледаме кодовете за английския знак "C" и руската буква "C". Обърнете внимание, че знаците са главни и техните кодове се различават от тези с малки букви. Английският символ ще изглежда като 01000010, а руският ще изглежда като 11010001. Това, което изглежда еднакво за човек на екрана на монитора, се възприема от компютъра напълно различно. Също така е необходимо да се обърне внимание на факта, че кодовете на първите 128 знака остават непроменени, а от 129 нататък един двоичен код може да съответства на различни букви в зависимост от използваната кодова таблица. Например десетичният код 194 може да съответства на буквата „b“ в KOI8, „B“ в CP1251, „T“ в ISO и нито един знак не съответства на този код в кодировките CP866 и Mac. Следователно, когато при отваряне на текст виждаме буквена и символна абракадабра вместо руски думи, това означава, че такова кодиране на информация не е подходящо за нас и трябва да изберем друг конвертор на знаци.

Кодиране на числа

В двоичната бройна система има само два варианта на стойност - 0 и 1. Всички основни операции с двоични числа се използват от една наука, наречена двоична аритметика. Тези действия имат свои собствени характеристики. Вземете например числото 45, написано на клавиатурата. Всяка цифра има свой осембитов код в кодовата таблица на ASCII, така че числото заема два байта (16 бита): 5 - 01010011, 4 - 01000011. За да се използва това число в изчисленията, то се преобразува с помощта на специални алгоритми в двоичната бройна система под формата на осембитово двоично число: 45 - 00101101.

През 50-те години графичното изобразяване на данни за първи път се прилага на компютри, които най-често се използват за научни и военни цели. Днес визуализацията на информацията, получена от компютър, е обичайно и познато явление за всеки човек, но в онези дни това направи изключителна революция в работата с технологиите. Може би влиянието на човешката психика е имало ефект: ясно представената информация се усвоява и възприема по-добре. Голям пробив в развитието на визуализацията на данни настъпва през 80-те години, когато кодирането и обработката на графична информация получава мощно развитие.

Аналогово и дискретно графично представяне

Аудио кодиране

Кодирането на мултимедийна информация се състои в преобразуване на аналоговата природа на звука в дискретна за по-удобна обработка. ADC получава входа, измерва амплитудата му на определени интервали от време и извежда цифрова последователност с данни за промените в амплитудата. Не се случват физически трансформации.

Изходният сигнал е дискретен, следователно, колкото по-често е честотата на измерване на амплитудата (проба), толкова по-точно изходният сигнал съответства на входния сигнал, толкова по-добро е кодирането и обработката на мултимедийната информация. Проба също така обикновено се нарича подредена последователност от цифрови данни, получени чрез ADC. Самият процес се нарича вземане на проби, на руски - дискретизация.


Обратното преобразуване се извършва с помощта на ЦАП: въз основа на цифровите данни, пристигащи на входа, в определени моменти от време се генерира електрически сигнал с необходимата амплитуда.

Параметри за вземане на проби

Основните параметри за вземане на проби са не само честотата на измерване, но и битовата дълбочина - точността на измерване на промяната в амплитудата за всяка проба. Колкото по-точно се предава стойността на амплитудата на сигнала във всяка единица време по време на цифровизацията, толкова по-високо е качеството на сигнала след ADC, толкова по-висока е надеждността на реконструкцията на вълната по време на обратното преобразуване.