Кодове на знаци според кодовата таблица. Кодиране на текстова информация
Между другото, на нашия уебсайт можете да конвертирате всеки текст в десетичен, шестнадесетичен, двоичен кодс помощта на онлайн калкулатора на кодове.
ASCII таблица
ASCII (Американски стандартен код за обмен на информация)
Обобщена таблица на ASCII кодовете
ASCII кодова таблица Символи на Windows(Win-1251)
|
|
Разширена ASCII кодова таблица
Форматиране на символи.
Backspace (Връща един знак). Показва, че механизмът за печат или курсорът на дисплея се движат една позиция назад. |
|
Хоризонтална табулация. Показва движението на печатащия механизъм или курсора на дисплея до следващия предписан "стоп на раздела". |
|
Подаване на ред. Показва движение на печатащия механизъм или курсора на дисплея към началото следващ ред(един ред надолу). |
|
Вертикална табулация. Показва движението на печатащата машина или курсора на дисплея към следващата група редове. |
|
Форма за подаване. Показва движението на печатащия механизъм или курсора на дисплея до началната позиция Следваща страница, форма или екран. |
|
Връщане на каретка. Показва движението на механизма за печат или курсора на дисплея до началната (най-лява) позиция на текущия ред. |
Трансфер на данни.
Начало на заглавието. Използва се за определяне на началото на заглавка, която може да съдържа информация за маршрутизиране или адрес. |
|
Начало на текст. Показва началото на текста и същевременно края на заглавието. |
|
Край на текста. Прилага се при завършване на текст, който започва със знака STX. |
|
Разследване. Заявка за идентификационни данни (като "Кой си ти?") от отдалечена станция. |
|
Признайте. Получаващото устройство предава този символ на подателя като потвърждение за успешното получаване на данните. |
|
Отрицателно признание. Получаващото устройство предава този символ на изпращача в случай на отказ (провал) на получаване на данни. |
|
Синхронен/неактивен. Използва се в системи за синхронизирано предаване. Когато няма предаване на данни, системата непрекъснато изпраща SYN символи, за да осигури синхронизация. |
|
Край на предавателния блок. Показва края на блок от данни за комуникационни цели. Използва се за разделяне на големи количества данни в отделни блокове. |
Разделителни знаци при предаване на информация.
Други символи.
Нула. (Няма знак - няма данни). Използва се за предаване, когато няма данни. |
|
Звънец (обаждане). Използва се за управление на алармени устройства. |
|
Shift Out. Показва, че всички следващи кодови думи трябва да се интерпретират според външния набор от символи преди пристигането на SI знака. |
|
Shift In. Показва, че следващите кодови комбинации трябва да се интерпретират според стандартния набор от знаци. |
|
Връзка за даннибягство. Промяна на значението на следните знаци. Кандидатства се за допълнителен контролили за предаване на произволна комбинация от битове. |
|
DC1, DC2, DC3, DC4 |
Контроли на устройството. Символи за управление на спомагателни устройства (специални функции). |
Отказ. Показва, че данните, които предхождат този знак в съобщение или блок, трябва да бъдат игнорирани (обикновено ако бъде открита грешка). |
|
Край на средата. Показва физическия край на лента или друг носител за съхранение |
|
Заместител. Използва се за заместване на грешен или невалиден знак. |
|
Бягство (разширение). Използва се за разширяване на кода чрез посочване, че следващ знак има алтернативно значение. |
|
пространство. Непечатаем знак, използван за разделяне на думи или за преместване на печатащата машина или курсора на дисплея една позиция напред. |
|
Изтрий. Използва се за премахване (изтриване) на предишния знак в съобщение |
За да използвате правилно ASCII, е необходимо да разширите познанията си в тази област и относно възможностите за кодиране.
Какво е?
ASCII е таблица за кодиране на печатаеми знаци (вижте екранна снимка № 1), въведени на компютърна клавиатура, за предаване на информация и някои кодове. С други думи, азбуката и десетичните цифри са кодирани в съответните символи, които представляват и носят необходимата информация.
ASCII е разработен в Америка, така че стандартният набор от символи обикновено включва английската азбука с цифри, за общо около 128 знака. Но тогава възниква справедлив въпрос: какво да направите, ако се изисква кодиране на националната азбука?
Други версии на ASCII таблицата са разработени за справяне с подобни проблеми. Например, за езици с чуждоезикова структура, буквите от английската азбука бяха премахнати или добавени допълнителни знаципод формата на национална азбука. По този начин ASCII кодирането може да съдържа руски букви за национална употреба (вижте екранна снимка № 2).
Къде се използва системата за кодиране ASCII?
Тази система за кодиране е необходима не само за набиране текстова информацияна клавиатурата. Използва се и в графиката. Например в програмата ASCII Art Maker графични изображенияразличните разширения се състоят от набор от ASCII символи (вижте екранна снимка № 3).
По правило такива програми могат да бъдат разделени на тези, които изпълняват функцията графични редактори, обръщане на изображение в текст и такива, които преобразуват изображение в ASCII графики. Добре познатият емотикон (или както го наричат още „ усмихнато човешко лице") също е пример за кодиращ знак.
Този метод на кодиране може да се използва и по време на писане или създаване HTML документ. Например, въвеждате конкретен и необходим набор от знаци и когато разглеждате самата страница, символът, съответстващ на този код, ще се покаже на екрана.
Наред с други неща този видкодирането е необходимо при създаване на многоезичен уебсайт, тъй като знаците, които не са включени в конкретна национална таблица, ще трябва да бъдат заменени с ASCII кодове. Ако читателят е пряко свързан с информационните и комуникационните технологии (ИКТ), тогава ще бъде полезно за него да се запознае с такива системи като:
- Преносим набор от знаци;
- Контролни знаци;
- EBCDIC;
- VISCII;
- YUSCII;
- Unicode;
- ASCII изкуство;
- KOI-8.
Свойства на ASCII таблица
Като всяка систематична програма, ASCII има свои собствени характерни свойства. Така например десетичната бройна система (числа от 0 до 9) се преобразува в двоична системасмятане (т.е. всяка десетична цифра се преобразува съответно в двоична 288=1001000).
Буквите, разположени в горната и долната колона, се различават една от друга само с малко, което значително намалява нивото на сложност на проверката и редактирането на случая.
С всички тези свойства ASCII кодирането работи като осем-битово, въпреки че първоначално е предвидено да бъде седем-битово.
Използване на ASCII в програмите Microsoft Office:
Ако е необходимо тази опциякодирането на информация може да се използва в Microsoft Notepad и Microsoft Office Word. В тези приложения може да се запише документ ASCII формат, но в този случай ще бъде невъзможно да използвате някои функции при писане.
По-специално удебелените и удебелените шрифтове няма да са налични, тъй като кодирането запазва само значението на въведената информация, а не обща формаи форма. Можете да добавите такива кодове към документ, като използвате следните софтуерни приложения:
- Microsoft Excel;
- Microsoft FrontPage;
- Microsoft InfoPath;
- Microsoft OneNote;
- Microsoft Outlook;
- Microsoft PowerPoint;
- Microsoft Project.
Струва си да се има предвид, че когато пишете ASCII кода в тези приложения, трябва да задържите клавиш на клавиатурата ALT.
Разбира се, всички необходими кодове изискват по-дълго и по-подробно проучване, но това е извън обхвата на днешната ни статия. Надявам се, че сте го намерили наистина полезно.
Ще се видим отново!
Добро Лошо
Всеки компютър има свой собствен набор от символи, които прилага. Този комплект съдържа 26 главни и малки букви, числа и Специални символи(точка, интервал и т.н.). Когато се преобразуват в цели числа, символите се наричат кодове. Стандартите са разработени така, че компютрите да имат еднакви набори от кодове.
ASCII стандарт
ASCII (Американски стандартен код за обмен на информация) - американски стандартен кодза обмен на информация. Всеки ASCII знак има 7 бита, така че максималният брой знаци е 128 (Таблица 1). Кодовете от 0 до 1F са контролни знаци, които не се отпечатват. Много непечатаеми ASCII знацинеобходими за пренос на данни. Например едно съобщение може да се състои от знака за начало на заглавката SOH, самото заглавие и знака за начало на текста STX, самия текст и знака за край на текста ETX и края на предаването характер EOT. Данните по мрежата обаче се предават в пакети, които сами са отговорни за началото и края на предаването. Така че непечатаемите знаци почти никога не се използват.
Таблица 1 - ASCII кодова таблица
Номер | Екип | Значение | Номер | Екип | Значение |
---|---|---|---|---|---|
0 | NUL | Нулев указател | 10 | DLE | Изход от преносната система |
1 | SOH | начало на заглавието | 11 | DC1 | Управление на устройството |
2 | STX | Начало на текст | 12 | DC2 | Управление на устройството |
3 | ETX | Край на текста | 13 | DC3 | Управление на устройството |
4 | EOT | Край на предаването | 14 | DC4 | Управление на устройството |
5 | ACK | Заявка | 15 | Н.А.К. | Непотвърждение за приемане |
6 | БЕЛ | Потвърждение за приемане | 16 | SYN | просто |
7 | Б.С. | Камбана символ | 17 | ETB | Край на предавателния блок |
8 | HT | Отдръпни се | 18 | МОГА | Марк |
9 | LF | Хоризонтална табулация | 19 | Е.М. | Край на медиите |
А | VT | Превод на линия | 1А | ПОДП | Долен индекс |
б | FF | Вертикален раздел | 1Б | ESC | Изход |
° С | CR | Превод на страница | 1C | FS | Файлов разделител |
д | ТАКА | Връщане на каретка | 1D | Г.С. | Групов разделител |
д | С.И. | Преминете към допълнителен регистър | 1E | Р.С. | Разделител на записи |
С.И. | Преминете към стандартен случай | 1F | НАС | Разделител на модули |
Номер | Символ | Номер | Символ | Номер | Символ | Номер | Символ | Номер | Символ | Номер | Символ |
---|---|---|---|---|---|---|---|---|---|---|---|
20 | пространство | 30 | 0 | 40 | @ | 50 | П | 60 | . | 70 | стр |
21 | ! | 31 | 1 | 41 | А | 51 | Q | 61 | а | 71 | р |
22 | ‘ | 32 | 2 | 42 | б | 52 | Р | 62 | b | 72 | r |
23 | # | 33 | 3 | 43 | ° С | 53 | С | 63 | ° С | 73 | с |
24 | φ | 34 | 4 | 44 | д | 54 | T | 64 | д | 74 | T |
25 | % | 35 | 5 | 45 | д | 55 | И | 65 | д | 75 | И |
26 | & | 36 | 6 | 46 | Е | 56 | V | 66 | f | 76 | v |
27 | ‘ | 37 | 7 | 47 | Ж | 57 | У | 67 | ж | 77 | w |
28 | ( | 38 | 8 | 48 | з | 58 | х | 68 | ч | 78 | х |
29 | ) | 39 | 9 | 49 | аз | 59 | Y | 69 | аз | 70 | г |
2А | ‘ | 3А | ; | 4А | Дж | 5А | З | 6А | й | 7А | z |
2B | + | 3B | ; | 4B | К | 5B | [ | 6B | к | 7B | { |
2C | ‘ | 3C | < | 4C | Л | 5C | \ | 6C | л | 7C | | |
2D | — | 3D | = | 4D | М | 5 Д | ] | 6D | м | 7D | } |
2E | 3E | > | 4E | н | 5E | — | 6E | н | 7E | ~ | |
2F | / | 3F | ж | 4F | О | 5F | _ | 6F | о | 7F | DEL |
Unicode стандарт
Предишното кодиране работи добре за на английски, но не е удобно за други езици. Например немският има умлаути, а френският има горни индекси. Някои езици имат напълно различни азбуки. Първият опит за разширяване на ASCII беше IS646, който разшири предишното кодиране с допълнителни 128 знака. Бяха добавени писмас щрихи и диакритични знаци, и получава името – лат. 1. Следващият опит е IS 8859 – който съдържа кодова страница. Имаше и опити за разширения, но това не беше универсално. Създадено е UNICODE кодиране (е 10646). Идеята зад кодирането е да се присвои на всеки символ една постоянна 16-битова стойност, която се нарича - кодов указател. Общо има 65536 указателя. За да спестим място, използвахме Latin-1 за кодове 0 -255, лесно променяйки ASII на UNICODE. Този стандарт реши много проблеми, но не всички. Поради пристигането на нови думи, например за японския език, е необходимо да се увеличи броят на термините с около 20 хил. Необходимо е също така да се включи брайлово писмо.
Наслагване на знаци
Символът BS (backspace) позволява на принтера да отпечата един знак върху друг. ASCII се предоставя за добавяне на диакритични знаци към буквите по този начин, например:
- a BS "→ á
- a BS ` → à
- a BS ^ → â
- o BS / → ø
- c BS , → ç
- n BS ~ → с
Забележка: в старите шрифтове апострофът " беше начертан наклонен наляво, а тилдът ~ беше изместен нагоре, така че те просто отговарят на ролята на акут и тилда отгоре.
Ако същият символ е насложен върху символ, ефектът е удебелен, а ако върху символ се насложи долна черта, тогава се получава подчертан текст.
- a BS a → а
- aBS_→ а
Забележка: това се използва например в помощна системачовек
Национални ASCII варианти
Стандартът ISO 646 (ECMA-6) предвижда възможност за поставяне на национални символи на място @ [ \ ] ^ ` { | } ~ . В допълнение към това, на място # могат да бъдат публикувани £ , и на място $ - ¤ . Тази система е много подходяща за европейски езици, където са необходими само няколко допълнителни знака. Версията на ASCII без национални символи се нарича US-ASCII или „Международна референтна версия“.
Впоследствие се оказа по-удобно да се използват 8-битови кодировки (кодови страници), където долната половина на кодовата таблица (0-127) е заета от символи US-ASCII, а горната половина (128-255) чрез допълнителни знаци, включително набор от национални знаци. По този начин горната половина на ASCII таблицата, преди широкото приемане на Unicode, се използва активно за представяне на локализирани знаци, букви от местния език. Липсата на унифициран стандарт за поставяне на кирилски знаци в ASCII таблицата предизвика много проблеми с кодировките (KOI-8, Windows-1251 и други). Други езици с нелатинични скриптове също страдат от наличието на няколко различни кодировки.
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .А | .Б | .° С | .Д | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0. | NUL | SOM | EOA | EOM | EQT | W.R.U. | RU | ЗВЪНЧЕ | БКСП | HT | LF | VT | FF | CR | ТАКА | С.И. |
1. | DC 0 | DC 1 | DC 2 | DC 3 | DC 4 | ГРЕШКА | СИНХРОНИЗИРАНЕ | L.E.M. | S 0 | S 1 | S 2 | S 3 | S 4 | S 5 | S 6 | S 7 |
2. | ||||||||||||||||
3. | ||||||||||||||||
4. | ПРАЗНО | ! | " | # | $ | % | & | " | ( | ) | * | + | , | - | . | / |
5. | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
6. | ||||||||||||||||
7. | ||||||||||||||||
8. | ||||||||||||||||
9. | ||||||||||||||||
А. | @ | А | б | ° С | д | д | Е | Ж | з | аз | Дж | К | Л | М | н | О |
б. | П | Q | Р | С | T | U | V | У | х | Y | З | [ | \ | ] | ← | |
° С. | ||||||||||||||||
Д. | ||||||||||||||||
д. | а | b | ° С | д | д | f | ж | ч | аз | й | к | л | м | н | о | |
Е. | стр | р | r | с | T | u | v | w | х | г | z | ESC | DEL |
На тези компютри, където минималната адресируема единица памет е 36-битова дума, първоначално са използвани 6-битови символи (1 дума = 6 знака). След прехода към ASCII такива компютри започнаха да съдържат или 5 седембитови знака (1 бит остана допълнителен), или 4 деветбитови знака в една дума.
ASCII кодовете също се използват за определяне кой клавиш е натиснат по време на програмиране. За стандартна QWERTY клавиатура кодовата таблица изглежда така:
ASCII кодова таблица на знаци на Windows. Трябва да се отбележи, че контролните символи на таблицата ASCII първоначално са били използвани за осигуряване на обмен на данни чрез телетайпна машина, въвеждане на данни от перфолента и за просто управление на външни устройства. |
Код | Описание |
---|---|
NUL, 00 | Нулев, празен |
SOH, 01 | Начало на заглавието |
STX, 02 | Начало на TeXt, началото на текста. |
ETX, 03 | Край на TeXt, край на текст |
EOT, 04 | Край на предаването, край на предаването |
ENQ, 05 | Запитване. Моля потвърди |
ACK, 06 | Признание. Потвърждавам |
БЕЛ, 07 | Бел, обади се |
BS, 08 | Backspace, връщане един знак назад |
ТАБ, 09 | Раздел, хоризонтален раздел |
LF, 0A | Подаване на ред, подаване на ред. Днес в повечето езици за програмиране се обозначава като \n |
VT, 0B | Вертикален раздел, вертикална таблица. |
FF, 0C | Емисия на формуляр, емисия на страница, нова страница |
CR, 0D | Връщане на каретка, връщане на каретка. Днес в повечето езици за програмиране се обозначава като \r |
ТАКА, 0Е | Shift Out, променете цвета на мастилената лента в печатащото устройство |
SI, 0F | Shift In, връща обратно цвета на мастилената лента в печатащото устройство |
DLE, 10 | Data Link Escape, превключване на канала към предаване на данни |
DC1, 11 DC2, 12 DC3, 13 DC4, 14 | Контрол на устройството, символи за управление на устройството |
НАК, 15 | Отрицателно потвърждение, не потвърждавам. |
SYN, 16 | Синхронизация. Символ за синхронизация |
ETB, 17 | Край на текстовия блок, край на текстовия блок |
МОЖЕ, 18 | Отказ, анулиране на предварително предадено |
ЕМ, 19 | Край на средата |
СУБ, 1А | Заместник, заместител. Поставя се на мястото на символ, чието значение е изгубено или повредено по време на предаване |
ESC, 1B | Контролна последователност за бягство |
FS, 1C | Разделител на файлове, разделител на файлове |
GS, 1D | Групов разделител |
RS, 1E | Разделител на записи, разделител на записи |
САЩ, 1F | Разделител на единици |
DEL, 7F | Изтриване, изтриване на последния знак. |