Hvordan gemmes negative tal i computerens hukommelse? Flydende komma-format

Reelle tal i matematiske beregninger har ingen begrænsninger på rækkevidden og præcisionen af ​​talrepræsentation. Men i computere er numre gemt i registre og hukommelsessteder med et begrænset antal cifre. Derfor nøjagtighed repræsentation reelle tal, tænkelige i en bil, er begrænset, og rækkevidden er begrænset.

Når man skriver reelle tal i programmer, er det sædvanligt at bruge en prik i stedet for det sædvanlige komma. Ethvert reelt tal kan repræsenteres i form af tal med radixrækkefølgen af ​​talsystemet.

Eksempel 4.4. Decimaltallet 1.756 i form af at skrive tal med radixrækkefølgen af ​​talsystemet kan repræsenteres som følger:

1.756 . 10 0 = 0.1756 . 10 1 = 0.01756 . 10 2 = ...

17.56 . 10 -1 = 175.6 . 10 -2 = 1756.0 . 10 -3 = ... .

Flydende komma repræsentation kaldet nummerrepræsentation N i et talsystem med en base q som :

N = m*. q p ,

Hvor m - en multiplikator, der indeholder alle cifre i tallet (mantisse), s - et heltal kaldet orden.

Hvis det "flydende" punkt er placeret i mantissen før det første signifikante ciffer, så med et fast antal cifre tildelt mantissen, registreres det maksimale antal signifikante cifre i tallet, det vil sige den maksimale nøjagtighed af tallets repræsentation i maskinen.

Hvis det første ciffer efter prikken (komma) i mantissen er forskellig fra nul, kaldes et sådant tal normaliseret .

Mantisse og orden q Det er sædvanligt at skrive et -ary-tal i radixsystemet q , og selve basen er i decimalsystemet.

Eksempel 4.5. Her er eksempler på en normaliseret repræsentation af et tal i decimalsystemet:

2178.01 =0.217801 * 10 4

0.0045 =0.45 * 10 -2

Eksempler i binær:

10110,01= 0,1011001 * 2 101 (rækkefølge 101 2 = 5 10)

Moderne computere understøtter flere internationale standardformater til lagring af rigtige flydende kommatal, varierende i præcision, men de har alle den samme struktur. Et reelt tal er lagret i tre dele: tegnet for mantissen, den forskudte rækkefølge og mantissen:

Egenskab n-bit normaliseret antal beregnes som følger: hvis ordren er allokeret k cifre, så tilføjes en offset lig med (2 k -1 -1) til den sande værdi af rækkefølgen repræsenteret i de tos komplementkode.

Således konverteres en ordre, der tager værdier i intervallet -128 til +127, til en forspændt rækkefølge i intervallet 0 til 255. Den skæve rækkefølge lagres som et tal uden fortegn, hvilket forenkler sammenligning, addition og subtraktion af ordrer , og forenkler også sammenligningsoperationen selve de normaliserede tal.

Antallet af cifre, der er allokeret til ordren, påvirker området fra det mindste ikke-nul tal til det største tal, der kan repræsenteres i maskinen givet formatet. Det er klart, at jo flere cifre der er allokeret til mantissen, jo højere er nøjagtigheden af ​​talrepræsentationen. På grund af det faktum, at for normaliserede reelle tal er den mest signifikante bit af mantissen altid 1, gemmes denne mest signifikante bit ikke i hukommelsen.

Ethvert binært heltal, der højst indeholder m cifre, kan konverteres til ægte format uden forvrængning.

Tabel 4.3. Standardformater til at repræsentere reelle tal

Eksempel 4.6. Repræsentation af normaliserede tal i et enkelt format.

Lad os illustrere, hvordan tallet 37.16 10 vil blive gemt. Ved konvertering til et binært tal opstår der ikke en nøjagtig oversættelse af 100101,(00101000111101011100) - brøkdelen i parentes gentages i perioden.

Vi konverterer tallet til normaliseret form: 0,100101(00101000111101011100) * 2 110

Lad os repræsentere et reelt tal i 32-bit format:

1. Tallets fortegn er "+", så vi indtaster 0 i fortegnsbitten (31);

2. For at indstille rækkefølgen tildeles 8 bits, til den sande værdi af rækkefølgen præsenteret i den komplementære kode tilføjer vi offset (2 7 -1) = 127. Da ordren er positiv, falder den direkte ordrekode sammen med den ekstra ordre, lad os beregne den forskudte ordre: 00000110 + 01111111=10000101

Vi indtaster den resulterende forskudte rækkefølge.

3. Vi indtaster mantissen, mens vi fjerner det mest signifikante ciffer af mantissen (det er altid lig med 1);

ændret rækkefølge

mantisse

I dette eksempel var vi i stand til at overføre kun 24 bits; resten gik tabt med et tab af præcision i at repræsentere tallet.

Hvis vi kunne se på indholdet af computerhukommelsen, ville vi se følgende:

Dette tal afspejler Regel #1: Data (og programmer) i computerens hukommelse lagres i binær form, dvs. i form af kæder af nuller og etaller.

Regel #2:repræsentation af data i en computer diskret.

Hvad er diskrethed?

Nærmeste svar: "Separat"

Bemærk: Et diskret sæt består af elementer adskilt fra hinanden. For eksempel er sand diskret, fordi det består af individuelle sandkorn. Men vand eller olie er kontinuerlig (inden for rammerne af vores fornemmelser, da vi stadig ikke kan fornemme individuelle molekyler)

Eksempelvis er et billede opbygget som en samling af punkter, dvs. diskret.

Regel #3:mængden, der kan repræsenteres i hukommelsen, er begrænset og begrænset.

Repræsenterer tal på en computer.

Heltal i computeren. (Fix point format)

Enhver computerenhed (computer, lommeregner) kan kun arbejde med et begrænset sæt heltal. Se på lommeregnerens display, det indeholder 10 tegn. Det største positive tal, der kan placeres på resultattavlen:

9

9

9

9

9

9

9

9

9

Det største negative tal i absolut værdi:

9

9

9

9

9

9

9

9

9

Situationen er den samme i computeren.

For eksempel, hvis en hukommelsescelle på 16 bit er allokeret til et heltal, så vil det største positive tal være sådan:

0

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

I decimaltalsystemet er det lig med:

2 15 -1=32767

Her spiller den første bit rollen som tallets tegn. Nul er et tegn på et positivt tal. Det største absolut negative tal er -32768.

Sådan får du dens interne repræsentation:

1) konvertere tallet 32768 til det binære talsystem, er det lig med
1000000000000000 - modtaget direkte kode.

2) inverter denne binære kode, dvs. erstatte nuller med enere, og enere med nuller - vi fik returkode.

0111111111111111

3) Tilføj en til dette binære tal, resultatet er:

1

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

Et et i den første bit angiver et minustegn.

(tror ikke, at den resulterende kode er "minus nul". Denne kode repræsenterer tallet -32768.)

Dette er reglerne for maskinrepræsentation af heltal. Denne interne repræsentation af et tal kaldes ekstra kode.

Hvis der er allokeret N bits til et heltal i computerens hukommelse, er intervallet af heltalsværdier: [-2 N-1 -1, 2 N -1]

Vi så på formatet for at repræsentere fortegnede heltal, dvs. positive og negative. Der er tidspunkter, hvor du kun behøver at arbejde med positive heltal. I dette tilfælde bruges formatet til at repræsentere heltal uden fortegn.

I dette format er det mindste tal nul, og det største tal for en 16-bit celle er:

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

I decimalnotation er dette 2 16 - 1 = 65535, det dobbelte af den absolutte værdi af fortegnsnotation.

Heltal i computeren. (flydende komma-format)

Det største antal kan variere fra lommeregner til lommeregner. Den enkleste lommeregner har 999999999. Hvis du tilføjer en anden enhed til den, vil lommeregneren vise en fejlmeddelelse. Og på en "smartere" lommeregner vil tilføjelse af en føre til følgende resultat:

1

e

+

0

9

Denne post på resultattavlen forstås som følger: 1 x10 9.

Dette talformat kaldes flydende komma-format.

1

e

+

0

9

mantisse

nummerrækkefølge

På en computer kan tal repræsenteres i både fixpunkt- og flydende kommaformat.

I computerteknologi er reelle tal (i modsætning til heltal) tal, der har en brøkdel.

Når du skriver dem I stedet for et komma er det sædvanligt at skrive et punktum. Så for eksempel er tallet 5 et heltal, og tallene 5.1 og 5.0 er reelle.

For at gøre det nemmere at vise tal, der tager værdier fra et ret bredt område (det vil sige både meget små og meget store), er formen til at skrive tal med grundrækkefølgen af ​​talsystemet. For eksempel kan decimaltallet 1,25 repræsenteres i denne form som følger:

1.25*10 0 = 0.125*10 1 = 0.0125*10 2 = ... ,
eller sådan her:
12.5*10 -1 = 125.0*10 -2 = 1250.0*10 -3 = ... .

Hvis det "flydende" punkt er placeret i mantissen før det første signifikante ciffer, så med et fast antal cifre tildelt mantissen, registreres det maksimale antal signifikante cifre i tallet, det vil sige den maksimale nøjagtighed af tallets repræsentation i maskinen. Derfor:

Denne repræsentation af reelle tal, som er mest gavnlig for en computer, kaldes normaliseret.

Mantissen og rækkefølgen af ​​et q-ært tal skrives normalt i systemet med grundtallet q, og selve grundtallet skrives i decimalsystemet.

Eksempler på normaliseret repræsentation:

Decimalsystem Binært system

753,15 = 0,75315*103; -101,01 = -0,10101*2 11 (rækkefølge 11 2 = 3 10)

0,000034 = -0,34*10 -4; -0,000011 = 0,11*2 -100 (ordre -100 2 = -410)

Reelle tal skrives forskelligt i forskellige typer computere. I dette tilfælde giver computeren normalt programmøren mulighed for at vælge mellem flere talformater, der er bedst egnede til en bestemt opgave - ved hjælp af fire, seks, otte eller ti bytes.

Som et eksempel er her karakteristikaene for de reelle talformater, der bruges af IBM-kompatible personlige computere:

Reelle talformater Størrelse i bytes Omtrentlig område af absolutte værdier Antal signifikante decimaler
Enkelt 4 10 -45 ... 10 38 7 eller 8
Ægte 6 10 -39 ... 10 38 11 eller 12
Dobbelt 8 10 -324 ... 10 308 15 eller 16
Fremskreden 10 10 -4932 ... 10 4932 19 eller 20

Af denne tabel kan det ses, at formen for repræsentation af flydende kommatal giver dig mulighed for at skrive tal med høj præcision og fra et meget bredt område.

Ved lagring af flydende kommanumre tildeles de cifre for mantisse, eksponent, taltegn og eksponenttegn:

Lad os med eksempler vise, hvordan nogle tal skrives i normaliseret form i et fire-byte-format med syv bit for at registrere rækkefølgen.

1. Tal 6,25 10 = 110,01 2 = 0,11001

  • 2 11:

2. Tal -0,125 10 = -0,0012 = -0,1*2 -10 (negativ rækkefølge er skrevet i to's komplement):

Den maksimale værdi af et ikke-negativt heltal opnås, når alle celler indeholder et. For en n-bit repræsentation vil den være lig med

ikke-negative heltal. Minimumsantallet svarer til de otte nuller, der er gemt i hukommelsescellens otte bit og er lig nul. Det maksimale antal svarer til otte enheder og er lig med

A = 1 × 2 7 + 1 × 2 6 + 1 × 2 5 + 1 × 2 4 + 1 × 2 3 + 1 × 2 2 + 1 × 2 1 + 1 × 2 0 = 1 × 2 8 - 1 = 255 10 .

Omfang af forandring ikke-negative heltal tal: fra 0 til 255.

Til opbevaring signerede heltal to hukommelsesceller (16 bit) er allokeret, og den mest signifikante (venstre) bit tildeles tallets fortegn (hvis tallet er positivt, så skrives 0 til fortegnsbitten, hvis tallet er negativt - 1) .

Repræsentationen af ​​positive tal i en computer ved hjælp af fortegnsstørrelsesformat kaldes direkte kode tal. For eksempel vil tallet 2002 10 = 11111010010 2 være repræsenteret i 16-bit format som følger:

0 0 0 0 0 1 1 1 1 1 0 1 0 0 1 0

Det maksimale positive tal (der giver mulighed for tildeling af et ciffer pr. tegn) for heltal med fortegn i n-bit repræsentation er:

Bruges til at repræsentere negative tal ekstra kode. Yderligere kode giver dig mulighed for at erstatte den aritmetiske operation af subtraktion med en additionsoperation, som væsentligt forenkler processorens arbejde og øger dens ydeevne.

Komplementkoden for et negativt tal A gemt i n celler er 2 n - |A|.

To's komplement repræsenterer tilføjelsen af ​​modulet af et negativt tal A til 0, da i n-bit computeraritmetik:

2 n - |A| + |A| = 0,

da i computer n-bit aritmetik 2 n = 0. Den binære repræsentation af et sådant tal består faktisk af en et og n nuller, og kun n cifre af lav orden, det vil sige n nuller, kan passe ind i en n-bit celle.

For at få den komplementære kode for et negativt tal kan du bruge en ret simpel algoritme:

1. Skriv modulet af tallet ind direkte kode i n binære cifre.

2. Få returkode tal, for denne værdi, inverter alle bits (erstat alle ener med nuller og erstat alle nuller med enere).

3. Tilføj en til den resulterende omvendte kode.

Lad os skrive den ekstra kode for det negative tal -2002 for 16-bit computerrepræsentationen:


Når en n-bit repræsentation af et negativt tal A i tos komplementkode bruges, allokeres den mest signifikante bit til at gemme fortegnet for tallet (en). De resterende cifre skrives som positive tal.

For at et tal skal være positivt, skal følgende betingelse være sand:

|A| £2 n-1.

Derfor er den maksimale værdi af modulet af tallet A i den m-cifrede repræsentation lig med:

Så er det mindste negative tal:

Lad os definere rækken af ​​tal, der kan gemmes i RAM i formatet lange signerede heltal(fire hukommelsesceller er allokeret til lagring af sådanne tal - 32 bit).

Det maksimale positive heltal (under hensyntagen til tildelingen af ​​et ciffer pr. tegn) er lig med:

A = 2 31 - 1 = 2 147 483 647 10.

Det mindste negative heltal er:

A = -2 31 = - 2 147 483 648 10.

Fordele ved at repræsentere tal i format med fast punkt er enkelheden og klarheden af ​​repræsentationen af ​​tal, samt enkelheden af ​​algoritmerne til implementering af aritmetiske operationer.

Ulempen ved at repræsentere tal i format med fast punkt er et lille udvalg af repræsentation af mængder, utilstrækkeligt til at løse matematiske, fysiske, økonomiske og andre problemer, hvor både meget små og meget store tal bruges.

Repræsentation af tal i flydende kommaformat. Reelle tal gemmes og behandles i en computer i formatet flydende komma. I dette tilfælde kan placeringen af ​​decimaltegnet i tallet ændre sig.

Talformat flydende komma er baseret på eksponentiel notation, hvor ethvert tal kan repræsenteres. Så tallet A kan repræsenteres som:

A = m × q n 2.3

hvor m er mantissen af ​​tallet;
q - base af talsystemet;
n - nummerrækkefølge.

Til ensartet præsentation af tal flydende komma der anvendes en normaliseret form, hvor mantissen opfylder betingelsen:

1/n £ |m|

Det betyder, at mantissen skal være en egen brøk og have et ciffer, der ikke er nul efter decimalkommaet.

Lad os konvertere decimaltallet 555,55, skrevet i naturlig form, til eksponentiel form med en normaliseret mantisse:

555,55 = 0,55555 × 10 3.

Her er den normaliserede mantisse: m = 0,55555, rækkefølge: n = 3.

Et tal i flydende kommaformat fylder 4 ( fælles præcisionsnummer) eller 8 bytes ( dobbelt præcisionstal). Når du skriver et flydende kommatal, allokeres bits til at gemme mantissetegnet, eksponenttegnet, eksponenten og mantissen.

Rækken af ​​tal bestemmes af antallet af bit, der er allokeret til at lagre rækkefølgen af ​​antallet, og præcisionen (antallet af signifikante cifre) bestemmes af antallet af bit, der er allokeret til at lagre mantissen.

Lad os bestemme det maksimale antal og dets nøjagtighed for formatet almindelige præcisionstal, hvis 8 bit er allokeret til at gemme ordren og dens fortegn, og 24 bit er allokeret til at lagre mantissen og dens fortegn:

0 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
underskrive og bestille tegn og mantisse

Den maksimale værdi af rækkefølgen af ​​tallet vil være 1111111 2 = 127 10, og derfor vil den maksimale værdi af tallet være:

2 127 = 1,7014118346046923173168730371588 × 10 38.

Den maksimale værdi af en positiv mantisse er:

2 23 - 1 » 2 23 = 2 (10 × 2,3) » 1000 2,3 = 10 (3 × 2,3) » 10 7.

Altså den maksimale værdi almindelige præcisionstal under hensyntagen til den mulige nøjagtighed af beregninger vil være 1,701411 × 10 38 (antallet af signifikante cifre i et decimaltal er i dette tilfælde begrænset til 7 cifre).

Opgaver

1,26. Udfyld tabellen ved at skrive negative decimaltal i fremadgående, omvendte og komplementære koder i 16-bit notation:

1,27. Definer visningsområde signerede heltal(2 bytes hukommelse er allokeret) i fixpunktformat.

1,28. Bestem det maksimale antal og dets præcision for formatet dobbelte præcisionstal, hvis 11 bit er allokeret til at lagre ordren og dens fortegn, og 53 bit er allokeret til at lagre mantissen og dens fortegn.

Numeriske data behandles i en computer ved hjælp af det binære talsystem. Tal gemmes i computerhukommelsen i binær kode, det vil sige som en sekvens af nuller og enere, og kan repræsenteres i format med fast eller flydende komma.

Heltal gemmes i hukommelsen i fikspunktsformat. Med dette format til at repræsentere tal er et hukommelsesregister bestående af otte hukommelsesceller (8 bit) tildelt til lagring af ikke-negative heltal. Hvert ciffer i en hukommelsescelle svarer altid til det samme ciffer i tallet, og kommaet er placeret til højre efter det mindst signifikante ciffer og uden for ciffergitteret. For eksempel vil nummeret 110011012 blive gemt i et hukommelsesregister som følger:

Tabel 4

Den maksimale værdi af et ikke-negativt heltal, der kan lagres i et register i fixpunktformat, kan bestemmes ud fra formlen: 2n – 1, hvor n er antallet af cifre i tallet. Det maksimale antal vil være lig med 28 - 1 = 25510 = 111111112 og minimum 010 = 000000002. Således vil intervallet af ændringer i ikke-negative heltal være fra 0 til 25510.

I modsætning til decimalsystemet har det binære talsystem i computerrepræsentationen af ​​et binært tal ikke symboler, der angiver tallets fortegn: positive (+) eller negative (-), derfor for at repræsentere heltal med fortegn i det binære system, to der bruges talrepræsentationsformater: talværdiformat underskrevet og to's komplementformat. I det første tilfælde tildeles to hukommelsesregistre (16 bit) til lagring af heltal med fortegn, og det mest signifikante ciffer (længst til venstre) bruges som fortegn for tallet: hvis tallet er positivt, skrives 0 til fortegnsbitten. , hvis tallet er negativt, så 1. For eksempel vil tallet 53610 = 00000010000110002 være repræsenteret i hukommelsesregistrene i følgende form:

Tabel 5

og et negativt tal -53610 = 10000010000110002 i formen:

Tabel 6

Det maksimale positive tal eller mindste negative tal i talværdiformat med fortegn (under hensyntagen til repræsentationen af ​​et ciffer pr. tegn) er 2n-1 – 1 = 216-1 – 1 = 215 – 1 = 3276710 = 11111111111111112 og rækkevidden af ​​tal vil være fra - 3276710 til 32767.

Oftest, for at repræsentere fortegnede heltal i det binære system, bruges de tos komplementkodeformat, som giver dig mulighed for at erstatte den aritmetiske operation af subtraktion i en computer med en additionsoperation, som markant forenkler strukturen af ​​mikroprocessoren og øger dens ydeevne .

For at repræsentere negative heltal i dette format bruges to's komplementkode, som er modulet af et negativt tal til nul. Konvertering af et negativt heltal til to's komplement udføres ved hjælp af følgende operationer:


1) skriv modulet af nummeret i direkte kode i n (n = 16) binære cifre;

2) få nummerets omvendte kode (inverter alle cifre i nummeret, dvs. udskift alle ener med nuller og nuller med ener);

3) tilføje et til det mindst signifikante ciffer til den resulterende omvendte kode.

For eksempel, for nummeret -53610 i dette format, vil modulet være 00000010000110002, den gensidige kode vil være 1111110111100111, og den ekstra kode vil være 1111110111101000.

Det skal huskes, at komplementet til et positivt tal er selve tallet.

For at gemme andre signerede heltal end 16-bit computerrepræsentationen, når den bruges to hukommelsesregistre(dette talformat kaldes også det korte fortegnede heltalsformat), de mellemstore og lange fortegnede heltalsformater bruges. Til at repræsentere tal i mellemtalsformatet bruges fire registre (4 x 8 = 32 bit), og til at repræsentere tal i det lange talformat bruges otte registre (8 x 8 = 64 bit). Værdiintervallerne for de mellemstore og lange talformater vil være henholdsvis: -(231 – 1) ... + 231 – 1 og -(263-1) ... + 263 – 1.

Computerrepræsentation af tal i fast punktformat har sine fordele og ulemper. TIL fordele omfatter enkelheden ved at repræsentere tal og algoritmer til implementering af aritmetiske operationer; ulemperne er det begrænsede område af repræsentation af tal, som kan være utilstrækkeligt til at løse mange problemer af praktisk karakter (matematisk, økonomisk, fysisk osv.).

Reelle tal (endelige og uendelige decimaler) behandles og gemmes i en computer i flydende decimalformat. Med dette talrepræsentationsformat kan placeringen af ​​decimaltegnet i indtastningen ændre sig. Ethvert reelt tal K i flydende kommaformat kan repræsenteres som:

hvor A er tallets mantisse; h – basis af talsystemet; p – nummerrækkefølge.

Udtryk (2.7) for decimaltalsystemet vil have formen:

for binær -

for oktal -

for hexadecimal -

Denne form for talrepræsentation kaldes også normal . Med en ændring i rækkefølgen skifter kommaet i tallet, det vil sige, at det ser ud til at flyde til venstre eller til højre. Derfor kaldes den normale form for at repræsentere tal flydende komma form. Decimaltallet 15,5, for eksempel i flydende kommaformat, kan repræsenteres som: 0,155 102; 1,55 101; 15,5 100; 155,0 10-1; 1550.0 · 10-2 osv. Denne form for decimal floating point notation 15.5 bruges ikke, når man skriver computerprogrammer og indtaster dem i en computer (computer input-enheder accepterer kun lineær dataregistrering). Ud fra dette konverteres udtryk (2.7) for at repræsentere decimaltal og indtastning af dem i computeren til formen

hvor P er rækkefølgen af ​​tal,

dvs. i stedet for grundtallet for talsystemet 10 skriver de bogstavet E, i stedet for et komma, en prik, og multiplikationstegnet er ikke placeret. Således vil tallet 15,5 i flydende komma og lineært format (computerrepræsentation) blive skrevet som: 0,155E2; 1,55E1; 15,5E0; 155,0E-1; 1550.0E-2 osv.

Uanset talsystemet kan ethvert tal i flydende kommaform repræsenteres af et uendeligt antal tal. Denne form for optagelse kaldes unormaliseret . For en entydig repræsentation af flydende kommatal anvendes en normaliseret form for at skrive et tal, hvor tallets mantisse skal opfylde betingelsen

hvor |A| - den absolutte værdi af tallets mantisse.

Betingelse (2.9) betyder, at mantissen skal være en egenbrøk og have et ciffer, der ikke er nul efter decimalkommaet, eller med andre ord, hvis mantissen ikke har et nul efter decimalkommaet, så kaldes tallet normaliseret . Så tallet 15,5 i normaliseret form (normaliseret mantisse) i flydende kommaform vil se sådan ud: 0,155 102, dvs. den normaliserede mantisse vil være A = 0,155 og orden P = 2, eller i computerrepræsentationen af ​​tallet 0,155E2.

Flydende kommatal har et fast format og optager fire (32 bit) eller otte bytes (64 bit) computerhukommelse. Hvis et tal fylder 32 bit i computerens hukommelse, er det et almindeligt præcisionstal, hvis det er 64 bit, så er det et dobbelt præcisionstal. Når man skriver et flydende kommatal, tildeles bits til at gemme mantissens fortegn, eksponentens fortegn, mantissen og eksponenten. Antallet af cifre, der er allokeret til rækkefølgen af ​​tallet, bestemmer variationsområdet for tallene, og antallet af cifre, der er allokeret til at gemme mantissen, bestemmer nøjagtigheden, hvormed tallet er specificeret.

Når du udfører aritmetiske operationer (addition og subtraktion) på tal præsenteret i flydende kommaformat, implementeres følgende procedure (algoritme):

1) rækkefølgen af ​​tal, som aritmetiske operationer udføres på, justeres (rækkefølgen af ​​et mindre absolut tal stiger til rækkefølgen af ​​et større absolut tal, mens mantissen falder med samme mængde);

2) aritmetiske operationer udføres på mantisser af tal;

3) det opnåede resultat normaliseres.

Praktisk del