Kody znaków zgodnie z tabelą kodów. Kodowanie informacji tekstowych
Przy okazji, na naszej stronie możesz przekonwertować dowolny tekst na dziesiętny, szesnastkowy, kod binarny za pomocą kalkulatora kodu dostępnego online.
Tabela ASCII
ASCII (amerykański standardowy kod wymiany informacji)
Tabela podsumowująca kody ASCII
Tabela kodów ASCII Znaki Windowsa(Win-1251)
|
|
Rozszerzona tabela kodów ASCII
Formatowanie symboli.
Backspace (Zwróć jeden znak). Wskazuje, że mechanizm drukujący lub kursor wyświetlacza cofa się o jedną pozycję. |
|
Tabulacja pozioma. Wskazuje ruch mechanizmu drukującego lub kursora wyświetlacza do następnego zalecanego „tabulatora”. |
|
Kanał liniowy. Wskazuje ruch mechanizmu drukującego lub kursora wyświetlacza na początek następna linia(jedna linia w dół). |
|
Tabulacja pionowa. Wskazuje ruch mechanizmu drukującego lub kursora wyświetlacza do następnej grupy linii. |
|
Kanał formularza. Wskazuje ruch mechanizmu drukującego lub kursora wyświetlacza do pozycji początkowej Następna strona, formularz lub ekran. |
|
Powrót karetki. Wskazuje ruch mechanizmu drukującego lub kursora wyświetlacza do pozycji wyjściowej (skrajnej na lewo) bieżącej linii. |
Transfer danych.
Początek kursu. Służy do definiowania początku nagłówka, który może zawierać informacje o routingu lub adres. |
|
Początek tekstu. Pokazuje początek tekstu i jednocześnie koniec tytułu. |
|
Koniec tekstu. Ma zastosowanie w przypadku kończenia tekstu rozpoczynającego się znakiem STX. |
|
Zapytanie. Żądanie danych identyfikacyjnych (takich jak „Kim jesteś?”) ze stacji zdalnej. |
|
Uznawać. Urządzenie odbiorcze przesyła ten znak do nadawcy jako potwierdzenie pomyślnego odbioru danych. |
|
Negatywne potwierdzenie. Urządzenie odbiorcze przesyła ten znak do nadawcy w przypadku odmowy (nieudanego) odbioru danych. |
|
Synchroniczny/bezczynny. Stosowany w zsynchronizowanych systemach przesyłowych. Gdy nie ma transmisji danych, system w sposób ciągły wysyła symbole SYN, aby zapewnić synchronizację. |
|
Koniec bloku transmisji. Wskazuje koniec bloku danych do celów komunikacyjnych. Służy do dzielenia dużych ilości danych na osobne bloki. |
Znaki podziału podczas przesyłania informacji.
Inne symbole.
Zero. (Brak znaku - brak danych). Używany do transmisji w przypadku braku danych. |
|
Dzwonek (zadzwoń). Służy do sterowania urządzeniami alarmowymi. |
|
Przesuń się. Wskazuje, że wszystkie kolejne słowa kodowe muszą być interpretowane zgodnie z zewnętrznym zestawem znaków przed nadejściem znaku SI. |
|
Przesuń się. Wskazuje, że kolejne kombinacje kodów muszą być interpretowane zgodnie ze standardowym zestawem znaków. |
|
Łącza danych Ucieczka. Zmiana znaczenia następujących znaków. Jest o to wnioskowany dodatkowa kontrola lub przesłać dowolną kombinację bitów. |
|
DC1, DC2, DC3, DC4 |
Sterowanie urządzeniami. Symbole obsługi urządzeń pomocniczych (funkcje specjalne). |
Anulować. Wskazuje, że dane poprzedzające ten znak w komunikacie lub bloku powinny zostać zignorowane (zwykle w przypadku wykrycia błędu). |
|
Koniec średniego. Wskazuje fizyczny koniec taśmy lub innego nośnika danych |
|
Zastąpić. Służy do zastąpienia błędnego lub nieprawidłowego znaku. |
|
Ucieczka (rozszerzenie). Służy do rozwijania kodu poprzez wskazanie, że kolejny znak ma alternatywne znaczenie. |
|
Przestrzeń. Znak niedrukowalny używany do oddzielania słów lub przesuwania mechanizmu drukującego lub kursora wyświetlacza o jedną pozycję do przodu. |
|
Usuwać. Służy do usuwania (kasowania) poprzedniego znaku w wiadomości |
Aby poprawnie posługiwać się kodem ASCII konieczne jest poszerzenie wiedzy w tym zakresie oraz o możliwościach kodowania.
Co to jest?
ASCII to tablica kodowania drukowalnych znaków (patrz zrzut ekranu nr 1) wpisywanych klawiatura komputerowa, do przesyłania informacji i niektórych kodów. Innymi słowy, alfabet i cyfry dziesiętne są kodowane w odpowiednich symbolach, które reprezentują i niosą niezbędne informacje.
ASCII został opracowany w Ameryce, więc standardowy zestaw znaków zwykle obejmuje alfabet angielski z cyframi, w sumie około 128 znaków. Ale wtedy pojawia się słuszne pytanie: co zrobić, jeśli wymagane jest kodowanie alfabetu narodowego?
Aby rozwiązać podobne problemy, opracowano inne wersje tabeli ASCII. Na przykład w przypadku języków o strukturze języka obcego usunięto lub dodano litery alfabetu angielskiego dodatkowe znaki w formie alfabetu narodowego. Zatem kodowanie ASCII może zawierać rosyjskie litery do użytku krajowego (patrz zrzut ekranu nr 2).
Gdzie używany jest system kodowania ASCII?
Ten system kodowania jest niezbędny nie tylko do wybierania numerów informacje tekstowe na klawiaturze. Jest również stosowany w grafice. Na przykład w programie ASCII Art Maker obrazy graficzne różne rozszerzenia składają się z zakresu znaków ASCII (patrz zrzut ekranu nr 3).
Z reguły takie programy można podzielić na te, które wykonują tę funkcję redaktorzy graficy, odwracające obraz na tekst i te, które konwertują obraz na grafikę ASCII. Dobrze znany emotikon (lub jak się go nazywa „ uśmiechnięta ludzka twarz") jest także przykładem znaku kodującego.
Tej metody kodowania można również używać podczas pisania lub tworzenia Dokument HTML. Przykładowo wpisujesz określony i niezbędny zestaw znaków, a podczas przeglądania samej strony na ekranie wyświetli się symbol odpowiadający temu kodowi.
Między innymi ten typ kodowanie jest konieczne przy tworzeniu wielojęzycznej witryny internetowej, ponieważ znaki, które nie są zawarte w konkretnej tabeli narodowej, będą musiały zostać zastąpione kodami ASCII. Jeśli czytelnik jest bezpośrednio związany z technologiami informacyjno-komunikacyjnymi (ICT), to przydatne będzie dla niego zapoznanie się z takimi systemami jak:
- Przenośny zestaw znaków;
- Znaki kontrolne;
- EBCDIC;
- VISCII;
- YUSCII;
- Unikod;
- Grafika ASCII;
- KOI-8.
Właściwości tabeli ASCII
Jak każdy program systematyczny, ASCII ma swoje własne charakterystyczne właściwości. Na przykład konwertowany jest system liczb dziesiętnych (cyfry od 0 do 9). system binarny rachunek różniczkowy (tzn. każda cyfra dziesiętna jest konwertowana odpowiednio na binarną 288=1001000).
Litery znajdujące się w górnej i dolnej kolumnie różnią się od siebie tylko nieznacznie, co znacznie zmniejsza stopień skomplikowania sprawdzania i edycji sprawy.
Dzięki tym wszystkim właściwościom kodowanie ASCII działa jako ośmiobitowe, chociaż pierwotnie miało być siedmiobitowe.
Używanie ASCII w programach Microsoft Office:
Jeśli to konieczne ta opcja kodowania informacji można używać w Notatniku Microsoft i Microsoft Słowo biurowe. W tych aplikacjach dokument można zapisać w formacie formacie ASCII, ale w tym przypadku korzystanie z niektórych funkcji podczas pisania będzie niemożliwe.
W szczególności czcionki pogrubione i pogrubione nie będą dostępne, ponieważ kodowanie zachowuje jedynie znaczenie wpisywanych informacji, a nie forma ogólna i kształt. Możesz dodać takie kody do dokumentu za pomocą następujących aplikacji:
- Microsoft Excel;
- Strona główna Microsoftu;
- Microsoft InfoPath;
- Microsoft OneNote;
- Microsoft Outlook;
- Microsoft PowerPoint;
- Projekt Microsoftu.
Warto wziąć pod uwagę, że wpisując kod ASCII w tych aplikacjach trzeba przytrzymać klawisz klawiatury ALT.
Oczywiście wszystkie niezbędne kody wymagają dłuższej i bardziej szczegółowej analizy, ale wykracza to poza zakres naszego dzisiejszego artykułu. Mam nadzieję, że uznałeś to za naprawdę przydatne.
Do zobaczenia!
Dobry zły
Każdy komputer ma swój własny zestaw znaków, który implementuje. Ten zestaw zawiera 26 kapitałów i małe litery, liczby i Specjalne symbole(kropka, spacja itp.). Po przekonwertowaniu na liczby całkowite symbole nazywane są kodami. Opracowano standardy, aby komputery miały te same zestawy kodów.
Standard ASCII
ASCII (amerykański standardowy kod wymiany informacji) — amerykański standardowy kod do wymiany informacji. Każdy znak ASCII ma 7 bitów, więc maksymalna liczba znaków wynosi 128 (tabela 1). Kody od 0 do 1F to znaki kontrolne, które nie są drukowane. Wiele nienadających się do druku Znaki ASCII potrzebne do transmisji danych. Na przykład wiadomość może składać się ze znaku początku nagłówka SOH, samego nagłówka i znaku początku tekstu STX, samego tekstu i znaku końca tekstu ETX oraz znaku końca transmisji postać EOT. Dane w sieci przesyłane są jednak w pakietach, które same odpowiadają za początek i koniec transmisji. Dlatego prawie nigdy nie używa się znaków niedrukowalnych.
Tabela 1 - Tabela kodów ASCII
Numer | Zespół | Oznaczający | Numer | Zespół | Oznaczający |
---|---|---|---|---|---|
0 | NUL | Wskaźnik zerowy | 10 | DLE | Wyjście z systemu przesyłowego |
1 | SOH | początek tytułu | 11 | DC1 | Zarządzanie urządzeniami |
2 | STX | Początek tekstu | 12 | DC2 | Zarządzanie urządzeniami |
3 | ETX | Koniec tekstu | 13 | DC3 | Zarządzanie urządzeniami |
4 | EOT | Koniec transmisji | 14 | DC4 | Zarządzanie urządzeniami |
5 | POTWIERDŹ | Wniosek | 15 | NAK | Brak potwierdzenia odbioru |
6 | BEL | Potwierdzenie akceptacji | 16 | SYN | Prosty |
7 | B.S. | Symbol dzwonka | 17 | ETB | Koniec bloku transmisji |
8 | HT | Cofać się | 18 | MÓC | Ocena |
9 | LF | Tabele poziome | 19 | E.M. | Koniec mediów |
A | VT | Tłumaczenie liniowe | 1A | POD | Indeks |
B | FF | Zakładka pionowa | 1B | WYJŚCIE | Wyjście |
C | CR | Tłumaczenie strony | 1C | FS | Separator plików |
D | WIĘC | Powrót karetki | 1D | G.S. | Separator grupy |
mi | SI. | Przejdź do dodatkowego rejestru | 1E | R.S. | Separator rekordów |
SI. | Przełącz na standardową obudowę | 1F | NAS | Separator modułów |
Numer | Symbol | Numer | Symbol | Numer | Symbol | Numer | Symbol | Numer | Symbol | Numer | Symbol |
---|---|---|---|---|---|---|---|---|---|---|---|
20 | przestrzeń | 30 | 0 | 40 | @ | 50 | P | 60 | . | 70 | P |
21 | ! | 31 | 1 | 41 | A | 51 | Q | 61 | A | 71 | Q |
22 | ‘ | 32 | 2 | 42 | B | 52 | R | 62 | B | 72 | R |
23 | # | 33 | 3 | 43 | C | 53 | S | 63 | C | 73 | S |
24 | φ | 34 | 4 | 44 | D | 54 | T | 64 | D | 74 | T |
25 | % | 35 | 5 | 45 | mi | 55 | I | 65 | mi | 75 | I |
26 | & | 36 | 6 | 46 | F | 56 | V | 66 | F | 76 | w |
27 | ‘ | 37 | 7 | 47 | G | 57 | W | 67 | G | 77 | w |
28 | ( | 38 | 8 | 48 | H | 58 | X | 68 | H | 78 | X |
29 | ) | 39 | 9 | 49 | I | 59 | Y | 69 | I | 70 | y |
2A | ‘ | 3A | ; | 4A | J | 5A | Z | 6A | J | 7A | z |
2B | + | 3B | ; | 4B | K | 5B | [ | 6B | k | 7B | { |
2C | ‘ | 3C | < | 4C | L | 5C | \ | 6C | l | 7C | | |
2D | — | 3D | = | 4D | M | 5D | ] | 6D | M | 7D | } |
2E | 3E | > | 4E | N | 5E | — | 6E | N | 7E | ~ | |
2F | / | 3F | G | 4F | O | 5F | _ | 6F | o | 7F | DEL |
Standard Unicode
Poprzednie kodowanie działa dobrze dla po angielsku jednak nie jest to wygodne w przypadku innych języków. Na przykład w języku niemieckim występują umlauty, a w języku francuskim indeks górny. Niektóre języki mają zupełnie inne alfabety. Pierwszą próbą rozszerzenia ASCII był IS646, który rozszerzył poprzednie kodowanie o dodatkowe 128 znaków. Zostały dodane listy z kreskami i znakami diakrytycznymi i otrzymał nazwę - łac. 1. Następną próbą był IS 8859 - który zawierał stronę kodową. Były też próby rozbudowy, ale nie było to powszechne. Utworzono kodowanie UNICODE (jest 10646). Ideą kodowania jest przypisanie każdemu znakowi jednej stałej 16-bitowej wartości, która nazywa się - wskaźnik kodu. W sumie jest 65536 wskaźników. Aby zaoszczędzić miejsce, użyliśmy języka Latin-1 dla kodów 0 -255, łatwo zmieniając ASII na UNICODE. Standard ten rozwiązał wiele problemów, ale nie wszystkie. W związku z pojawieniem się nowych słów, np. dla języka japońskiego, konieczne jest zwiększenie liczby terminów o około 20 tysięcy, konieczne jest także uwzględnienie alfabetu Braille'a.
Nakładka postaci
Znak BS (backspace) umożliwia drukarce drukowanie jednego znaku na drugim. ASCII przewidywało dodawanie znaków diakrytycznych do liter w ten sposób, na przykład:
- BS „ → á
- BS ` → à
- BS ^ → â
- o BS / → ø
- c BS , → ç
- n BS ~ → с
Notatka: w starych czcionkach apostrof " był rysowany pochylony w lewo, a tylda ~ była przesunięta w górę, więc po prostu pasowały do roli ostrej i tyldy na górze.
Jeśli ten sam symbol zostanie nałożony na symbol, efekt będzie taki sam pogrubiony, a jeśli na znak zostanie nałożony znak podkreślenia, wówczas uzyskany zostanie podkreślony tekst.
- licencjat → A
- ABS_ → A
Notatka: jest to używane na przykład w systemu pomocy Człowiek.
Krajowe warianty ASCII
Norma ISO 646 (ECMA-6) przewiduje możliwość umieszczania symboli narodowych @ [ \ ] ^ ` { | } ~ . Poza tym na miejscu # można opublikować £ i na miejscu $ - ¤ . System ten dobrze nadaje się do języków europejskich, w których potrzebnych jest tylko kilka dodatkowych znaków. Wersja ASCII bez znaków narodowych nazywana jest US-ASCII lub „międzynarodową wersją referencyjną”.
Następnie wygodniejsze okazało się stosowanie kodowania 8-bitowego (stron kodowych), w którym dolna połowa tabeli kodów (0-127) jest zajęta przez znaki US-ASCII, a górna połowa (128-255) dodatkowymi znakami, w tym zestawem znaków narodowych. Zatem górna połowa tabeli ASCII, przed powszechnym przyjęciem Unicode, była aktywnie wykorzystywana do reprezentowania zlokalizowanych znaków, liter lokalnego języka. Brak jednolitego standardu umieszczania znaków cyrylicy w tablicy ASCII powodował wiele problemów z kodowaniem (KOI-8, Windows-1251 i inne). Inne języki z alfabetem innym niż łaciński również ucierpiały z powodu kilku różnych kodowań.
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .MI | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0. | NUL | SOM | EOA | EOM | EQT | W.R.U. | RU | DZWONEK | BKSP | HT | LF | VT | FF | CR | WIĘC | SI. |
1. | DC 0 | DC 1 | DC 2 | DC 3 | DC 4 | BŁĄDZIĆ | SYNCHRONIZACJA | L.E.M. | S 0 | S 1 | S2 | S 3 | S 4 | S 5 | S 6 | S 7 |
2. | ||||||||||||||||
3. | ||||||||||||||||
4. | PUSTY | ! | " | # | $ | % | & | " | ( | ) | * | + | , | - | . | / |
5. | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
6. | ||||||||||||||||
7. | ||||||||||||||||
8. | ||||||||||||||||
9. | ||||||||||||||||
A. | @ | A | B | C | D | mi | F | G | H | I | J | K | L | M | N | O |
B. | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ← | |
C. | ||||||||||||||||
D. | ||||||||||||||||
MI. | A | B | C | D | mi | F | G | H | I | J | k | l | M | N | o | |
F. | P | Q | R | S | T | ty | w | w | X | y | z | WYJŚCIE | DEL |
Na tych komputerach, gdzie minimalną adresowalną jednostką pamięci było słowo 36-bitowe, początkowo używano znaków 6-bitowych (1 słowo = 6 znaków). Po przejściu na ASCII takie komputery zaczęły zawierać albo 5 znaków siedmiobitowych (1 bit pozostał dodatkowy), albo 4 znaki dziewięciobitowe w jednym słowie.
Kody ASCII służą również do określenia, który klawisz zostanie naciśnięty podczas programowania. W przypadku standardowej klawiatury QWERTY tabela kodów wygląda następująco:
Tabela kodów znaków ASCII systemu Windows. Należy zaznaczyć, że znaki sterujące tablicą ASCII były pierwotnie używane do zapewnienia wymiany danych za pomocą dalekopisu, wprowadzania danych z taśmy dziurkowanej oraz do prostego sterowania urządzeniami zewnętrznymi. |
Kod | Opis |
---|---|
NUL, 00 | Zero, pusty |
SOH, 01 | Początek Nagłówka |
STX, 02 | Początek TeXta, początek tekstu. |
ETX, 03 | Koniec TeXtu, koniec tekstu |
EOT, 04 | Koniec transmisji, koniec transmisji |
ENQ, 05 | Pytać się. Proszę potwierdzić |
AK, 06 | Potwierdzenie. Potwierdzam |
BEL, 07 | Dzwonek, zadzwoń |
B.S., 08 | Backspace, cofnij się o jeden znak |
TAB, 09 | Zakładka, zakładka pozioma |
LF, 0A | Przesunięcie linii, przesunięcie linii. Obecnie w większości języków programowania jest to oznaczone jako \n |
VT, 0B | Zakładka pionowa, tabulacja pionowa. |
FF, 0°C | Kanał formularza, kanał strony, nowa strona |
CR, 0D | Powrót karetki, powrót karetki. Obecnie w większości języków programowania jest to oznaczone jako \r |
TAK, 0E | Shift Out, zmień kolor taśmy barwiącej w urządzeniu drukującym |
SI, 0F | Shift In, przywróć kolor taśmy barwiącej w urządzeniu drukującym |
DLA, 10 | Data Link Escape, przełączanie kanału na transmisję danych |
DC1, 11 DC2, 12 DC3, 13 DC4, 14 | Kontrola urządzenia, symbole kontroli urządzenia |
NAK, 15 | Negatywne potwierdzenie, nie potwierdzam. |
SYN, 16 | Synchronizacja. Symbol synchronizacji |
ETB, 17 | Koniec bloku tekstowego, koniec bloku tekstowego |
MOŻE, 18 | Anuluj, anulowanie wcześniej przesłanego |
EM, 19 | Koniec średniego |
POD, 1A | Zastępca, zastępca. Umieszczony w miejscu symbolu, którego znaczenie zostało utracone lub zniekształcone podczas transmisji |
ESC, 1B | Sekwencja kontroli ucieczki |
FS, 1C | Separator plików, separator plików |
GS, 1D | Separator grupy |
RS, 1E | Separator rekordów, separator rekordów |
USA, 1F | Separator jednostek |
DEL, 7F | Usuń, usuń ostatni znak. |