Alle mængder inden for datalogi. Hvad er bits og bytes (kilobyte, megabyte, gigabyte, terabyte), samt funktioner i måleenheder for information

I moderne computere kan vi komme ind tekstoplysninger, numeriske værdier, samt grafisk og lydinformation. Mængden af ​​information, der er lagret i en computer, måles ved dens "længde" (eller "volumen"), som er udtrykt i bits. Bit - minimum måleenhed for information (fra engelsk BInary digiT - binært ciffer). Hver bit kan have værdien 0 eller 1. En bit kaldes også en bit af en computerhukommelsescelle. Følgende enheder bruges til at måle mængden af ​​lagret information:

1 byte = 8 bits;

1 KB = 1024 bytes (En KB læses som en kilobyte);

1 MB = 1024 KB (MB læses som megabyte);

1 GB = 1024 MB (en GB læses som en gigabyte).

Beat (fra engelsk. binært ciffer; også spille på ord: engelsk. lidt- En lille)

Ifølge Shannon er en bit den binære logaritme af sandsynligheden for lige sandsynlige hændelser eller summen af ​​produkterne af sandsynligheden ved den binære logaritme af sandsynligheden for lige sandsynlige hændelser.

En bit binær kode (binært ciffer). Kan kun tage to gensidigt udelukkende værdier: ja/nej, 1/0, tænd/sluk osv.

En grundlæggende måleenhed for mængden af ​​information svarende til mængden af ​​information indeholdt i en oplevelse, der har to lige sandsynlige udfald. Dette er identisk med mængden af ​​information i svaret på et spørgsmål, der tillader svarene "ja" eller "nej" og intet andet (det vil sige mængden af ​​information, der giver dig mulighed for entydigt at svare på det stillede spørgsmål). En binær bit indeholder en bit information.

I computerteknologi og datanetværk, bliver værdierne 0 og 1 normalt transmitteret forskellige niveauer spænding eller strøm. For eksempel i TTL-baserede chips er 0 repræsenteret af en spænding i området +0 til +3 I og 1 i området fra 4,5 til 5,0 I.

Dataoverførselshastigheden for et netværk måles normalt i bits per sekund. Det er bemærkelsesværdigt, at med stigningen i dataoverførselshastigheden fik biten også et andet metrisk udtryk: længde. Så i et moderne gigabit-netværk (1 Gigabit/sek.) er der cirka 30 meter ledning pr. bit. På grund af dette, vanskeligheden netværksadaptere er steget markant. Tidligere, for eksempel i et-megabit-netværk, var en bitlængde på 30 km næsten altid åbenlyst større end længden af ​​kablet mellem to enheder.

Inden for databehandling, især i dokumentation og standarder, bruges ordet "bit" ofte til at betyde binært ciffer. For eksempel: den første bit er det første binære ciffer i den pågældende byte eller ord.

I øjeblikket er en bit den mindst mulige informationsenhed inden for databehandling, men intensiv forskning på området kvantecomputere antage tilstedeværelsen af ​​q-bits.

Byte (engelsk) byte) - en måleenhed for mængden af ​​information, normalt lig med otte bit, kan tage 256 (2 8) forskellige værdier.

Generelt er en byte en sekvens af bits, hvis antal er fast, den mindste adresserbare mængde hukommelse i en computer. I moderne computere generelle formål en byte er lig med 8 bits. For at understrege, at der i beskrivelsen menes en otte-bit byte netværksprotokoller Udtrykket "oktet" bruges. oktet).

Nogle gange er en byte en sekvens af bits, der udgør et underfelt af et ord. Nogle computere kan adressere bytes af forskellig længde. Dette er givet af feltekstraktionsinstruktionerne fra LDB- og DPB-montørerne på PDP-10 og i Common Lisp.

I IBM-1401 var en byte lig med 6 bit, ligesom i Minsk-32, og i BESM - 7 bit, i nogle computermodeller fremstillet af Burroughs Computer Corporation (nu Unisys) - 9 bit. Mange moderne digitale signalprocessorer bruger bytes, der er 16 bit eller større i længden.

Navnet blev første gang brugt i 1956 af W. Buchholz, da han designet den første supercomputer IBM 7030 til en masse bits, der blev transmitteret samtidigt i input-output-enheder (seks stykker); senere, som en del af det samme projekt, blev byten udvidet til otte (2 3) bit.

Flere præfikser til at danne afledte enheder for en byte bruges ikke som sædvanligt: ​​For det første bruges diminutive præfikser slet ikke, og informationsenheder mindre end en byte kaldes specielle ord (nibble og bit); for det andet betyder forstørrelsespræfikser for hver tusinde 1024 = 2 10 (en kilobyte er lig med 1024 bytes, en megabyte er lig med 1024 kilobyte eller 1.048.576 bytes osv. med gigabyte, terabyte og petabyte (bruges ikke længere)). Forskellen stiger med vægten af ​​konsollen. Det er mere korrekt at bruge binære præfikser, men i praksis bruges de endnu ikke, måske på grund af kakofonien - kibibyte, mebibyte osv.

Nogle gange bruges decimalpræfikser i bogstavelig forstand, for eksempel ved angivelse af kapacitet harddiske: for dem kan en gigabyte betyde en million kibibytes, altså 1.024.000.000 bytes, eller endda bare en milliard bytes, og ikke 1.073.741.824 bytes, som for eksempel i hukommelsesmoduler.

Kilobyte (kbyte, kB) m., skl . - en måleenhed for mængden af ​​information svarende til (2 10) standard (8-bit) bytes eller 1024 bytes. Bruges til at angive mængden af ​​hukommelse i forskellige elektroniske enheder.

Navnet "kilobyte" er generelt accepteret, men formelt forkert, da præfikset kilo - betyder multiplikation med 1.000, ikke 1.024. Det korrekte binære præfiks for 2 10 er kibi - .

Tabel 1.2 - Flere præfikser for at danne afledte

Megabyte (MB, M) m., skl. - en måleenhed for mængden af ​​information svarende til 1048576 (2 20) standard (8-bit) bytes eller 1024 kilobytes. Bruges til at angive mængden af ​​hukommelse i forskellige elektroniske enheder.

Navnet "Megabyte" er generelt accepteret, men formelt forkert, da præfikset mega - , betyder at gange med 1.000.000, ikke 1.048.576. Det korrekte binære præfiks for 2 20 er mebi - . At udnytte den nuværende situation store virksomheder, producerer harddiske, som, når de mærker deres produkter, forstår en megabyte til at være 1.000.000 bytes, og en gigabyte til at være 1.000.000.000 bytes.

Den mest originale fortolkning af udtrykket megabyte bruges af computerdisketteproducenter, som forstår det som 1.024.000 bytes. Således rummer en diskette med en kapacitet på 1,44 MB faktisk kun 1440 KB, det vil sige 1,41 MB i sædvanlig forstand.

I denne henseende viste det sig, at en megabyte kan være kort, mellemlang og lang:

kort - 1.000.000 bytes

gennemsnit - 1.024.000 bytes

lang - 1.048.576 bytes

Gigabyte er en multipel måleenhed for mængden af ​​information, svarende til 1.073.741.824 (2 30) standard (8-bit) bytes eller 1.024 megabytes.

SI giga præfiks - bruges fejlagtigt, fordi det betyder at gange med 10 9 . For 2 30 skal indtages binært præfiks gibi-. Store virksomheder, der producerer harddiske, udnytter denne situation, og når de mærker deres produkter, betyder en megabyte 1.000.000 bytes, og en gigabyte betyder 1.000.000.000 bytes.

Et maskinord er en maskinafhængig og platformafhængig størrelse, målt i bits eller bytes, svarende til bredden af ​​processorregistrene og/eller bredden af ​​databussen (normalt en potens af to). Ordstørrelsen matcher også mindste størrelse adresserbare oplysninger (bitdybde af data placeret på én adresse). Maskinordet definerer følgende egenskaber for maskinen:

bitdybde af data behandlet af processoren;

adresserbar databredde (databusbredde);

maksimal værdi af en heltalstype uden fortegn, der understøttes direkte af processoren: hvis resultatet aritmetisk operation overskrider denne værdi, opstår der et overløb;

maksimal lydstyrke Random Access Memory, direkte adresseret af processoren.

Maksimal værdi ord med længden n bit kan let beregnes ved hjælp af formlen 2 n −1

Tabel 1.3 - Maskinordstørrelse på forskellige platforme

Vores højteknologiske tidsalder er kendetegnet ved sin brede muligheder. Med udviklingen af ​​elektroniske computere åbnede fantastiske horisonter sig for mennesker. Eventuelle nyheder af interesse kan nu findes i globalt netværk helt gratis, uden at forlade dit hjem. Dette er et gennembrud på det teknologiske område. Men hvordan kan så meget data lagres i computerens hukommelse, behandles og transmitteres over lange afstande? Hvilke enheder for informationsmåling findes i datalogi? Og hvordan arbejder man med dem? I dag er det ikke kun personer, der er direkte involveret i at skrive computerprogrammer, men almindelige skolebørn burde også kende svarene på disse spørgsmål. Det er trods alt grundlaget for alt.

i datalogi

Vi er vant til at tro, at information er al den viden, der formidles til os. Men i datalogi og datalogi har dette ord en lidt anden definition. Dette er den grundlæggende komponent i al elektronisk videnskab. computere. Hvorfor grundlæggende eller grundlæggende? Fordi computerteknologi behandler data, opbevarer og kommunikerer dem til folk. Minimum enhed Måleinformation beregnes i bits. Oplysningerne gemmes på computeren, indtil brugeren ønsker at se dem.

Vi er vant til at tro, at information er en sprogenhed. Ja, det er sandt, men datalogi bruger en anden definition. Dette er information om tilstand, egenskaber og parametre for objekter i miljøet omkring os. Det er helt klart, at jo mere information vi lærer om et objekt eller et fænomen, jo mere forstår vi, at vores forståelse af dem er sparsom. Men nu, takket være sådan en enorm mængde af helt gratis og tilgængelige materialer fra hele verden, er det blevet meget nemmere at studere, stifte nye bekendtskaber, arbejde, slappe af og bare slappe af ved at læse bøger eller se film.

Alfabetisk aspekt af måling af mængden af ​​information

Udskrivning af dokumenter til arbejde, artikler på hjemmesider og vedligeholdelse af din personlig blog på internettet tænker vi ikke over, hvordan data udveksles mellem brugeren og selve computeren. Hvordan er en maskine i stand til at forstå kommandoer, og i hvilken form gemmer den alle filer? I datalogi er informationsmåleenheden en bit, som kan gemme nuller og etaller. Essensen af ​​den alfabetiske tilgang er i måling tekst tegn består af en sekvens af tegn. Men lad være med at flette den alfabetiske tilgang sammen med tekstens indhold. Det er helt forskellige ting. Mængden af ​​sådanne data er proportional med antallet af indtastede tegn. Takket være dette viser det sig, at informationsvægten af ​​et tegn fra det binære alfabet er lig med en bit. Der er forskellige enheder for informationsmåling i datalogi, ligesom alle andre mål. En bit er minimumsværdien af ​​en måling.

Indholdsaspekt ved beregning af mængden af ​​information

Informationsmåling er baseret på sandsynlighedsteori. I I dette tilfælde spørgsmålet om, hvor meget data der er indeholdt i den besked, en person modtager, overvejes. Det er her sætninger om diskret matematik kommer i spil. For at beregne materialer tages der to forskellige formler afhængigt af sandsynligheden for hændelsen. Samtidig forbliver måleenhederne for information i datalogi de samme. Opgaverne med at beregne antallet af tegn og grafik ved hjælp af indholdstilgangen er meget vanskeligere end at bruge den alfabetiske tilgang.

Typer af informationsprocesser

Der er tre hovedtyper af processer, der udføres i en elektronisk computer:

  1. Hvordan det går denne proces? Gennem datainputværktøjer, det være sig et tastatur, optisk mus, printer eller andre modtager information. Derefter konverterer dem til binær kode og optager på HDD i bits, bytes, megabytes. For at oversætte enhver måleenhed for information i datalogi er der en tabel, hvorfra du kan beregne, hvor mange bits der er i en megabyte og udføre andre oversættelser. Computeren gør alt automatisk.
  2. Lagring af filer og data i enhedens hukommelse. En computer kan huske alt i binær form. Binær kode består af nuller og ettaller.
  3. En anden af ​​de vigtigste processer, der forekommer i en elektronisk computer, er dataoverførsel. Det udføres også i binær form. Men information vises på monitorskærmen i en symbolsk eller anden form, som vi kender til.

Kodning af information og måling af dens måling

Informationsmåleenheden er lidt, som er ret nem at arbejde med, fordi den kan indeholde værdien 0 eller 1. Hvordan koder en computer alm. decimaltal V binær kode? Lad os se på et lille eksempel, der vil forklare princippet om kodning af information ved hjælp af computerteknologi.

Lad os sige, at vi har et tal i det sædvanlige talsystem - 233. For at konvertere det til binær form skal du dividere med 2, indtil det bliver mindre end selve divisoren (i vores tilfælde 2).

  1. Vi begynder deling: 233/2=116. Vi skriver resten ned separat, disse vil være komponenterne i den binære svarkode. I vores tilfælde er det 1.
  2. Den anden handling vil være denne: 116/2=58. Resten af ​​divisionen - 0 - skrives igen separat.
  3. 58/2=29 uden rest. Glem ikke at skrive de resterende 0 ned, for mister du kun ét element, får du en helt anden værdi. Denne kode vil derefter blive gemt på computerens harddisk og vil repræsentere bits - de mindste informationsenheder inden for datalogi. 8. klasser er allerede i stand til at klare at konvertere tal fra decimal til binær og omvendt.
  4. 29/2=14 med en rest på 1. Vi skriver det separat til de allerede modtagne binære cifre.
  5. 14/2=7. Resten af ​​divisionen er 0.
  6. Lidt mere og den binære kode vil være klar. 7/2=3 med en rest på 1, som vi skriver ind i det fremtidige binære kodesvar.
  7. 3/2=1 med en rest på 1. Herfra skriver vi to enheder som svar. Den ene - som en rest, den anden - som det sidste resterende tal, som ikke længere er deleligt med 2.

Det er nødvendigt at huske, at svaret er skrevet ind omvendt rækkefølge. Det første resultat binært tal fra den første handling vil være det sidste ciffer, fra det andet - det næstsidste, og så videre. Vores endelige svar er 11101001.

Dette registreres i computerens hukommelse og gemmes i denne form, indtil brugeren ønsker at se det på skærmen. Bit, byte, megabyte, gigabyte - måleenheder for information i datalogi. Det er i disse mængder, at binære data lagres i en computer.

Omvendt konvertering af et tal fra binært til decimalsystem

For at udføre den omvendte oversættelse fra en binær værdi til decimalsystem calculus, skal du bruge formlen. Vi tæller antallet af tegn i en binær værdi, startende fra 0. I vores tilfælde er der 8, men hvis vi begynder at tælle fra nul, så slutter de serienummer 7. Nu skal du gange hvert ciffer fra koden med 2 i potensen 7, 6, 5,..., 0.

1*2 7 +1*2 6 +1*2 5 +0*2 4 +1*2 3 +0*2 2 +0*2 1 +1*2 0 =233. Her er vores startnummer, som blev taget allerede før oversættelse til binær kode.

Nu kender du essensen computerenhed og et minimumsmål for informationslagring.

Minimumsenhed for information: beskrivelse

Som nævnt ovenfor anses den mindste måling af information for at være en smule. Dette er et ord af engelsk oprindelse, oversat betyder det "binært ciffer". Hvis man ser på denne værdi fra den anden side, kan vi sige, at der er tale om en hukommelsescelle i elektroniske computere, som er lagret i form af 0 eller 1. Bits kan konverteres til bytes, megabyte og endnu større mængder information. Den elektroniske computer udfører selv denne procedure, når den gemmer den binære kode i harddiskens hukommelsesceller.

Nogle computerbrugere vil måske manuelt og hurtigt konvertere volumenmål digital information fra den ene til den anden. Online-beregnere er blevet udviklet til sådanne formål, de vil straks udføre en operation, der kan tage meget tid manuelt.

Måleenheder for information i datalogi: tabel over mængder

Computere, flashdrev og andre lagrings- og informationsbehandlingsenheder adskiller sig i deres hukommelseskapacitet, som normalt beregnes i gigabyte. Det er nødvendigt at se på hovedtabellen over mængder for at se sammenligneligheden af ​​en måleenhed for information i datalogi i stigende rækkefølge med den anden.

Brug af den maksimale informationsenhed

I dag er den maksimale mængde information, kaldet en yottabyte, planlagt til at blive brugt af National Security Agency til at opbevare alt lyd- og videomateriale modtaget fra offentlige steder, hvor videokameraer og mikrofoner er installeret. På dette øjeblik yottabytes - største enheder måling af information i datalogi. Er dette grænsen? Det er usandsynligt, at nogen vil være i stand til at give et præcist svar nu.

Informationsmængde

Mængden af ​​information som et mål for at reducere videnusikkerhed.
(Særlig tilgang til at bestemme mængden af ​​information)

Erkendelsesprocessen af ​​den omgivende verden fører til akkumulering af information i form af viden (fakta, videnskabelige teorier osv.). Kvittering nye oplysninger fører til en stigning i viden eller, som det nogle gange siges, til et fald i videns usikkerhed. Hvis en besked fører til et fald i usikkerheden i vores viden, så kan vi sige, at en sådan besked indeholder information.

For eksempel, efter at have taget en prøve eller gennemført en prøve, plages du af usikkerhed, du ved ikke, hvilken karakter du fik. Til sidst annoncerer læreren resultaterne, og du får en af ​​to informationsmeddelelser: "bestået" eller "ikke bestået", og efter testen en af ​​fire informationsmeddelelser: "2", "3", "4" eller "5".

En informationsmeddelelse om en karakter til en prøve medfører en halvering af usikkerheden på din viden, da en af ​​to mulige informationsmeddelelser modtages. Informationsmeddelelse om vurderingen vedr prøve resulterer i en firedobling af usikkerheden på din viden, da en af ​​fire mulige informationsmeddelelser modtages.

Det er klart, at jo mere usikker den oprindelige situation er (den stor mængde informationsmeddelelser er mulige), jo flere nye oplysninger vi modtager, når vi modtager en informationsmeddelelse (jo flere gange vil usikkerheden på viden mindskes).

Informationsmængde kan betragtes som et mål til at reducere videnusikkerhed ved modtagelse af informationsmeddelelser.

Den tilgang til information, der er diskuteret ovenfor som et mål for at reducere videns usikkerhed, giver os mulighed for kvantitativt at måle information. Der er en formel, der relaterer antallet af mulige informationsmeddelelser N og mængden af ​​information, jeg har båret af den modtagne meddelelse:

N=2 i (1.1)

Bit. For at kvantificere enhver mængde skal du først bestemme måleenheden. Så for at måle længde er måleren valgt som enhed, for at måle masse - kilogram osv. På samme måde skal du indtaste en måleenhed for at bestemme mængden af ​​information.

Bag enhed for informationsmængde mængden af ​​information, der er indeholdt i informationsmeddelelsen, accepteres, hvilket reducerer videnusikkerheden med det halve. Denne enhed kaldes lidt.

Hvis vi vender tilbage til modtagelsen af ​​en informationsmeddelelse om testresultaterne diskuteret ovenfor, så er usikkerheden her reduceret til det halve, og derfor er mængden af ​​information, som meddelelsen bærer, lig med 1 bit.

Afledte enheder til måling af mængden af ​​information. Den mindste måleenhed for mængden af ​​information er en bit, og den næststørste enhed er en byte, og:

1 byte = 8 bit = 2 3 bit.

Inden for datalogi er systemet til at danne flere måleenheder noget anderledes end det, der accepteres i de fleste videnskaber. Traditionelle metriske systemer af enheder, f.eks. Internationalt system SI-enheder, koefficienten 10 n bruges som multiplikatorer af flere enheder, hvor n = 3, 6, 9 osv., hvilket svarer til decimalpræfikser"Kilo" (10 3), "Mega" (10 6), "Giga" (10 9) osv.

I en computer er information kodet ved hjælp af et binært fortegnssystem, og derfor bruges en faktor på 2 n i flere måleenheder for mængden af ​​information

Således indtastes måleenheder for mængden af ​​information, der er multipla af en byte, som følger:

1 kilobyte (KB) = 2 10 bytes = 1024 bytes;

1 megabyte (MB) = 2 10 KB = 1024 KB;

1 gigabyte (GB) = 2 10 MB = 1024 MB.

Kontrolspørgsmål

    1. Giv eksempler på informationsbudskaber, der fører til en reduktion af videnusikkerhed.
    2. Giv eksempler på informationsmeddelelser, der indeholder 1 bit information.

Bestemmelse af mængden af ​​information

Bestemmelse af antallet af informationsmeddelelser. Ved hjælp af formel (1.1) kan du nemt bestemme antallet af mulige informationsmeddelelser, hvis mængden af ​​information er kendt. For eksempel, i en eksamen tager du et eksamenskort, og læreren fortæller dig, at den visuelle informationsmeddelelse om dens nummer indeholder 5 bits information. Hvis du vil bestemme antallet af eksamensbilletter, er det nok at bestemme antallet af mulige informationsmeddelelser om deres antal ved hjælp af formel (1.1):

Antallet af eksamensbilletter er således 32.

Bestemmelse af mængden af ​​information. Tværtimod, hvis det mulige antal informationsmeddelelser N er kendt, er det nødvendigt at løse ligningen for I for at bestemme mængden af ​​information, som meddelelsen bærer.

Forestil dig, at du styrer en robots bevægelse og kan indstille retningen for dens bevægelse ved hjælp af informationsmeddelelser: "nord", "nordøst", "øst", "sydøst", "syd", "sydvest", "vest" og " nordvest" (fig. 1.11). Hvor meget information vil robotten modtage efter hver besked?

Der er 8 mulige informationsmeddelelser, så formel (1.1) har form af en ligning for I:

Lad os faktorisere tallet 8 på venstre side af ligningen og præsentere det i potensform:

8 = 2 × 2 × 2 = 2 3 .

Vores ligning:

Ligestilling af venstre og rigtige dele ligningen er gyldig, hvis eksponenterne for tallet 2 er ens. Således er I = 3 bit, dvs. mængden af ​​information, som hver informationsmeddelelse sender til robotten, er lig med 3 bit.

Alfabetisk tilgang til at bestemme mængden af ​​information

alfabetisk tilgang for at bestemme mængden af ​​information, bliver de distraheret fra indholdet af informationen og betragter informationsmeddelelsen som en sekvens af tegn på et bestemt tegnsystem.

Skiltets informationskapacitet. Lad os forestille os, at det er nødvendigt at transmittere en informationsmeddelelse gennem en informationstransmissionskanal fra afsender til modtager. Lad meddelelsen kodes ved hjælp af et tegnsystem, hvis alfabet består af N tegn (1, ..., N). I det enkleste tilfælde, når længden af ​​beskedkoden er et tegn, kan afsenderen sende en af ​​N mulige beskeder"1", "2", ..., "N", som vil bære mængden af ​​information I (fig. 1.5).

Ris. 1.5. Overførsel af information

Formel (1.1) relaterer antallet af mulige informationsmeddelelser N og mængden af ​​information, jeg bar med den modtagne meddelelse. Så, i den betragtede situation, er N antallet af tegn i tegnsystemets alfabet, og I er mængden af ​​information, som hvert tegn bærer:

Ved hjælp af denne formel kan du for eksempel bestemme mængden af ​​information, som et tegn bærer i det binære tegnsystem:

N = 2 => 2 = 2 I => 2 1 = 2 I => I=1 bit.

I et binært signeret system bærer et tegn således 1 bit information. Det er interessant, at selve måleenheden for mængden af ​​information "bit" (bit) har fået sit navn FRA den engelske sætning "Binary digiT" - "binary digit".

Informationskapaciteten af ​​tegnet for det binære tegnsystem er 1 bit.

Jo flere tegn alfabetet i et tegnsystem indeholder, jo større mængde information bæres af et tegn. Som et eksempel vil vi bestemme mængden af ​​information, der bæres af et bogstav i det russiske alfabet. Det russiske alfabet indeholder 33 bogstaver, men i praksis bruges kun 32 bogstaver ofte til at formidle beskeder (bogstavet "ё" er udelukket).

Ved hjælp af formel (1.1) bestemmer vi mængden af ​​information, der bæres af et bogstav i det russiske alfabet:

N = 32 => 32 = 2 I => 2 5 = 2 I => I=5 bit.

Således bærer et bogstav i det russiske alfabet 5 bits information (med en alfabetisk tilgang til at måle mængden af ​​information).

Mængden af ​​information et skilt bærer afhænger af sandsynligheden for modtagelsen. Hvis modtageren på forhånd ved præcis, hvilket tegn der kommer, så vil mængden af ​​modtaget information være lig med 0. Omvendt, jo mindre sandsynligt det er at modtage et tegn, jo mere informationskapacitet.

På russisk skrivning hyppigheden af ​​brug af bogstaver i teksten er forskellig, så i gennemsnit er der pr. 1000 tegn i en meningsfuld tekst 200 bogstaver "a" og hundrede gange mindre antal bogstaver "f" (kun 2). Fra informationsteoriens synspunkt er informationskapaciteten af ​​tegnene i det russiske alfabet således forskellig (bogstavet "a" har det mindste, og bogstavet "f" har det største).

Mængden af ​​information i beskeden. En besked består af en sekvens af tegn, som hver bærer en vis mængde Information.

Hvis tegnene bærer den samme mængde information, så kan mængden af ​​information I c i meddelelsen beregnes ved at gange mængden af ​​information I z båret med et tegn med kodelængden (antal tegn i meddelelsen) K:

I c = I × K

Så hvert ciffer af binær computer kode bærer information på 1 bit. Følgelig bærer to cifre information i 2 bit, tre cifre - i 3 bit osv. Mængden af ​​information i bit er lig med antallet af cifre i den binære computerkode (tabel 1.1).

Tabel 1.1. Mængden af ​​information båret af en binær computerkode

For at måle længde er der enheder som millimeter, centimeter, meter, kilometer. Det er kendt, at masse måles i gram, kilogram, centners og tons. Tidens gang udtrykkes i sekunder, minutter, timer, dage, måneder, år, århundreder. Computeren arbejder med information, og der er også tilsvarende måleenheder til at måle dens volumen.

Vi ved allerede, at computeren opfatter al information gennem nuller og ettaller. En bit er den mindste informationsenhed, der svarer til et enkelt binært ciffer ("0" eller "1").

En byte består af otte bits. Ved at bruge en byte kan du kode et tegn ud af 256 mulige (256 = 28). Således er en byte lig med et tegn, det vil sige 8 bit:

1 tegn = 8 bit = 1 byte.

Studerer IT-færdigheder involverer overvejelse af andre, større måleenheder af information.

Byte tabel: 1 byte = 8 bit

1 KB (1 kilobyte) = 210 bytes = 2*2*2*2*2*2*2*2*2*2 bytes =

1024 bytes (ca. 1 tusind bytes - 103 bytes)

1 MB (1 megabyte) = 220 bytes = 1024 kilobytes (ca. 1 million bytes - 106 bytes)

1 GB (1 Gigabyte) = 230 bytes = 1024 megabytes (ca. 1 milliard bytes - 109 bytes)

1 TB (1 Terabyte) = 240 bytes = 1024 gigabyte (ca. 1012 bytes). En terabyte kaldes nogle gange et ton.

1 PB (1 Petabyte) = 250 bytes = 1024 terabyte (ca. 1015 bytes).

1 Exabyte = 260 bytes = 1024 petabytes (ca. 1018 bytes).

1 Zettabyte = 270 bytes = 1024 exabytes (ca. 1021 bytes).

1 Yottabyte = 280 bytes = 1024 zettabyte (ca. 1024 bytes).


I ovenstående tabel er to potenser (2 10, 2 20, 2 30 osv.) nøjagtige værdier kilobyte, megabyte, gigabyte.

Spørgsmålet opstår: er der en fortsættelse af bytetabellen? I matematik er der et uendeligt begreb, som er symboliseret som et omvendt ottetal: ∞.

Det er tydeligt, at man i bytetabellen kan fortsætte med at tilføje nuller, eller rettere sagt, potenser til tallet 10 på denne måde: 10 27, 10 30, 10 33 og så videre ad infinitum. Men hvorfor er dette nødvendigt? I princippet er terabyte og petabyte nok for nu. I fremtiden vil måske endda en yottabyte ikke være nok.

Til sidst et par eksempler på enheder, der kan gemme terabyte og gigabyte af information. Der er en praktisk "terabyte" - ydre hårdt disk, der er tilsluttet via USB-port til computeren. Du kan gemme en terabyte information på den. Særligt praktisk til bærbare computere (hvor der skiftes harddisk kan være problematisk) og for Reserve eksemplar Information. Det er bedre at gøre det på forhånd sikkerhedskopier information, og ikke efter alt er væk.

Computerfærdighedsøvelser:

1) Hvor mange bytes (uden anførselstegn) indeholder sætningen "I dag er det den 7. juli 2011"?

2) Hvor mange bytes (kilobytes) tager en side tekst, hvis der er 60 tegn på en linje og 40 linjer på en side? Hvad er volumen af ​​en bog bestående af 100 ens sider?

3) En terabyte er en ekstern harddisk, der forbindes til en computer via et USB-stik og har en kapacitet på 1 terabyte. Instruktionerne til dens brug siger, at denne disk kan passe 250 tusind. musikfiler eller 285 tusind fotografier. Hvad er størrelsen på én musikfil og størrelsen på ét billede ifølge producenterne af denne enhed?

4) Hvor mange lignende musikfiler kan der være på en 700 megabyte cd?

5) Hvor mange ens billeder kan passe på et 4 gigabyte flashdrev?

Løsninger:

1) "I dag" - med mellemrum (men uden anførselstegn) 8 bytes "7. juli" - med to mellemrum (uden anførselstegn) 7 bytes "2010" - med et mellemrum og en prik (uden anførselstegn) 7 bytes I alt: 8 + 7 + 7 = 22 bytes "vejer" sætningen "I dag er det 7. juli 2010"

2) En linje indeholder 60 tegn, hvilket betyder, at volumen af ​​en linje er 60 bytes. Der er 40 sådanne linjer på en side, som hver indeholder 60 bytes, så volumen af ​​en side tekst er 60 x 40 = 2400 bytes = 2,4 Kilobytes = 2,4 KB

Volumen af ​​en bog er 2400 x 100 = 240.000 bytes = 240 Kilobytes = 240 KB

3) Størrelsen af ​​en musikfil, som ifølge producenterne kan optages på en "terabyte": 1.000.000.000.000: 250.000 = (vi reducerer tre nuller i udbyttet og i divisoren) 1000.000.000: 250 = 4.000 4 megabyte = 4 MB

Størrelsen af ​​et fotografi, som ifølge producenterne kan optages på en "terabyte": 1.000.000.000.000: 285.000 = (vi reducerer tre nuller i udbyttet og divisoren) 1.000.000.000: 285 = 3.508.9,7 opad (3.508.9,7) Megabyte = 3,5 MB

4) En 700 megabyte cd kan rumme 700 MB: 4 MB = 175 musikfiler, hver ikke større end 4 MB. Her kan megabytes straks opdeles i megabyte, men når du arbejder med forskellige mængder bytes, er det bedre først at konvertere alt til bytes og derefter udføre forskellige aritmetiske operationer med dem.

5) Et 4 GB flashdrev kan rumme 4.000.000.000: 3.508.771, 93 = (reducer tre nuller i udbytte og divisor) = 4.000.000: 3.508 = 1.139,99 foto = (rundt) 1.140 billeder, som ikke er mere end 1.140 billeder i hver .

Du kan også beregne ca. Derefter: Et 4 GB flashdrev kan rumme 4.000.000.000: 3.500.000 = (reducer fem nuller i udbytte og divisor) = 40.000: 35 = 1.142,86 billeder = (rund ned) 1.140 billeder, som hver ikke er mere end 5 MB i størrelsen 3.

Vi måler hele tiden noget – tid, længde, hastighed, masse. Og for hver størrelse er der sin egen måleenhed, og ofte flere. Meter og kilometer, kilogram og tons, sekunder og timer - alt dette er velkendt for os. Hvordan måler man information? Også opfundet til information måleenhed og navngav hende lidt.

En bit er den mindste informationsenhed.

En bit indeholder meget lidt information. Det kan kun tage en af ​​to værdier (1 eller 0, ja eller nej, sand eller falsk). At måle information i bits er meget ubelejligt - tallene viser sig at være enorme. De måler jo ikke en bils masse i gram.

For eksempel, hvis vi repræsenterer kapaciteten af ​​et 4 GB flashdrev i bit, får vi 34.359.738.368 bit. Forestil dig, du kom til computer butik og bed sælgeren om at give dig et flashdrev med en kapacitet på 34.359.738.368 bit. Det er usandsynligt, at han vil forstå dig

Derfor bruges bit-afledte informationsenheder i datalogi og i livet. Men de har alle en bemærkelsesværdig egenskab - de er to-kræfter med et trin på 10.

Så lad os tage tallet 2 og hæve det til nul potens. Vi får 1 (ethvert tal i nulpotensen er lig med 1). Dette vil være en byte.

Der er 8 bits i en byte.

Nu hæver vi 2 til 10. potens - vi får 1024. Dette er kilobyte(KB).

Der er 1024 bytes i en kilobyte.

Hvis vi hæver 2 til 20. potens, får vi megabyte(MB).

1 MB = 1024 KB.

Navn Symbol Grad
byte B 2 0
kilobyte kB 2 10
megabyte MB 2 20
gigabyte GB 2 30
terabyte TB 2 40
petabyte PB 2 50
exabyte EB 2 60
zettabyte ZB 2 70
yottabyte JB 2 80

Forståelse af dette emne vil give dig mulighed for succes