AMD Radeon-skærmkortfamilier Referenceinformation. AMD Radeon-videokortfamilier Referenceinformation Hvad er knappen på Radeon 7900-kortet

For et par dage siden blev den omtrentlige pris på grafikadaptere baseret på Tahiti GPU'en med den nye Next Generation Core (NGC) arkitektur kendt. I amerikanske butikker vil flagskibet Radeon HD 7970 blive solgt med et prisskilt på $550, og Radeon HD 7950-løsningen med et prisskilt på $450. Derudover kommer oplysninger fra ubekræftede kilder om tilstedeværelsen af ​​en 384-bit hukommelsesbus i disse videokort.

I dybet af Beyond3D.com-forummet delte en bestemt beæret bruger, Felix, billeder af Radeon HD 7900 videokort med ligesindede. Han forsøgte at lave kvaliteten af ​​billederne for ikke at gå ud over NDA. Der er dog bekræftelse af tilstedeværelsen af ​​en 384-bit bus på dem.

To AMD Tahiti-videokort fungerer sammen med deres maver vendt mod linsen. Ud over det ændrede design kan vi notere tilstedeværelsen af ​​to 8-bens strømstik, som giver yderligere 300 W ud over strømmen fra selve PCIe x16-slottet. Det rapporteres, at længden af ​​printkortet er 30 cm, og der er 12 hukommelsesmoduler, som nemt bekræfter tilstedeværelsen af ​​en 384-bit bus.

På dette billede kan du se, at videokortene tydeligvis ikke er detailprøver.

På det samme forum dukkede spændende grafer op, der viser den klare dominans af NGC-arkitekturen og Radeon HD 7970-skærmkortet over andre testdeltagere. Det er klart, at oprettelsen af ​​en sådan tidsplan tager 5 minutter, og du skal behandle den i overensstemmelse hermed.

I dag høres ordene "Minedrift", "Blockchain", "Bitcoins" bogstaveligt talt overalt: fra sporvognspassagerer til seriøse forretningsmænd og statsdumaen. Det er imidlertid svært at forstå alle forviklingerne og faldgruberne ved disse og relaterede begreber i databasen på vores hjemmeside Du vil hurtigt finde omfattende information, der dækker alle aspekter.

Vi søger yderligere information i databaser:

Radeon hd 7900 specifikationer

Online projektdatabaser:

Data fra udstillinger og seminarer:

Data fra registre:

Vent på, at søgningen er fuldført i alle databaser.
Efter afslutningen vises et link for at få adgang til de fundne materialer.

Kort fortalt vil al den nødvendige viden blive præsenteret i denne artikel.
Så lad os starte med blockchain. Dens essens er, at computere er forenet til et enkelt netværk gennem et sæt blokke, der indeholder automatisk krypteret information, der kommer dertil. Tilsammen danner disse blokke en database. Lad os sige, at du vil sælge et hus. Når du har udfyldt dokumenterne, skal du gå til en notar, så i hans nærvær, efter at have bekræftet overførslen med sin underskrift, vil de give dig pengene. Det tager lang tid, og desuden skal du betale et gebyr.

Takket være blockchain-teknologi er det nok at:

  1. Indgå en aftale.
  2. Find ud af modtagerens konto.
  3. Overfør penge til modtagerens konto.

Og ikke kun penge. Du kan udstede en elektronisk signatur og sende dokumenter og andre oplysninger, herunder fortrolige oplysninger. Igen, notarer og andre embedsmænd er ikke nødvendige: det er nok for dig og modtageren (det være sig en privatperson eller et statsligt organ) at identificere dig selv på din computer.

Transaktionen foregår over en sikker kommunikationskanal, ingen ser (inklusive banker og stat), hvem der har overført hvad og til hvem.

Muligheden for hacking er udelukket på grund af det store antal blokke beskrevet ovenfor. En hacker skal finde en chiffer for hver blok, hvilket er fysisk umuligt.

Andre anvendelser af blockchain:

  • Forsikring;
  • Logistik;
  • Betaling af bøder
  • Ægteskabsregistrering og meget mere.


Begrebet cryptocurrency er tæt forbundet med blockchain. Cryptocurrency er en ny generation af decentraliseret digital valuta, der er skabt og kun opererer på internettet. Ingen kontrollerer det; valuta udstedes gennem arbejdet fra millioner af computere rundt om i verden, der bruger et program til at beregne matematiske algoritmer.

Kort fortalt ser det sådan ud:
1. Du agter at overføre penge til nogen.
2. Der genereres en matematisk kode, der passerer gennem de blokke, du allerede kender.

3. Mange computere (ofte en samling af dem, med kraftige processorer og som følge heraf større båndbredde) behandler digital information, sender dem til de næste blokke, modtager en belønning for dette (nogle transaktioner kan foretages gratis)
4. Den matematiske kode når modtagerens elektroniske tegnebog, og penge vises på hans saldo.

Igen, som det er tilfældet med blockchain, kontrolleres cryptocurrency-overførsler ikke af nogen.

Selvom databasen er åben, med alle adresser på dem, der overfører og modtager penge, er der ingen, der kender ejeren af ​​denne eller den adresse, hvorfra overførslen sker, medmindre ejeren selv vil fortælle det.

Der er mange valutaer, der fungerer efter et lignende princip. Den mest kendte er naturligvis Bitcoin. Også populære er Ethereum, Rittle, Litecoins, Numits, Namecoins og mange andre. Forskellen mellem dem er i forskellige typer kryptering, behandling og nogle andre parametre.

Minearbejdere tjener penge på pengeoverførselsteknologi.

Det er de mennesker, der skabte det ovennævnte sæt computervideokort, som genererer nye blokke, der transmitterer digital information - bitcoins (eller rittles eller enhver anden kryptovaluta). For dette modtager de en belønning i form af den samme kryptovaluta.

Der er konkurrence mellem minearbejdere, fordi... Teknologien er programmeret til at blive mere kompleks med hver transaktion. Først var det muligt at mine fra én computer (2008), men nu er sådan en valuta som Bitcoin simpelthen urentabel for enkeltpersoner: du har brug for en masse videokort (de kaldes tilsammen farme), med enorm computerkraft. For at gøre dette lejes separate lokaler; energiomkostningerne for arbejde er sammenlignelige med omkostningerne for industrivirksomheder.

Men du kan tjene penge på andre, mindre populære, men udviklende kryptovalutaer. Der er også en sondring mellem solo-minedrift og pool-mining. Solo er skabelsen af ​​din egen gård, fortjenesten tages til dig selv. Puljen samler andre mennesker med de samme mål. Du kan tjene meget mere, men du skal dele det med alle.

Både enkeltpersoner og hele stater er blevet interesserede i mulighederne for at bruge blockchain-teknologi i almindelighed og kryptovalutaer i særdeleshed.

Kryptovaluta er lovligt i Japan. I Rusland vil de næste år vedtage regler om legalisering af blockchain, cryptocurrency-overførsler og minedrift. Det er planlagt at overføre nogle operationer til blockchain-rammen. Det giver mening at studere dette mere detaljeret og, hvis det ønskes, begynde at tjene penge. Det er indlysende, at nu vil informationsteknologier udvikle sig og komme mere og mere ind i vores liv.

Post navigation

10 Mar. 2016

Denne side nedenfor har links til at downloade den seneste gratis Drivere til AMD-skærmkort fra Radeon HD 7900-serien, som er en del af Radeon HD-serien. Installationsfiler er taget fra den officielle hjemmeside og er velegnede til: Windows 7, 10, 8, 8.1, XP, Vista 32/64-bit (x86/x64).

For at gøre det nemmere at vælge de filer, du har brug for, er versionen af ​​din Windows og dens bitdybde angivet nedenfor.

Din computer kører på:

  1. Hent (153,5 MB / version 16.8.2 (Crimson Edition 16.8.2 Hotfix) / udgivelsesdato 08/12/2016)

    Til Windows 7 32-bit

  2. Hent (239,8 MB / version 16.8.2 (Crimson Edition 16.8.2 Hotfix) / udgivelsesdato 08/12/2016)

    Til Windows 7 64-bit

  3. Hent (134,8 MB / version 16.8.2 (Crimson Edition 16.8.2 Hotfix) / udgivelsesdato 08/12/2016)

    Til Windows 10 32-bit

  4. Hent (208.24 MB / version 16.8.2 (Crimson Edition 16.8.2 Hotfix) / udgivelsesdato 08/12/2016)

    Til Windows 10 64-bit

  5. Hent (205 MB / version 14.4 (Catalyst Software Suite) / udgivelsesdato 25/04/2014)

    Til Windows 8 32-bit

  6. Hent (260 MB / version 14.4 (Catalyst Software Suite) / udgivelsesdato 25/04/2014)

    Til Windows 8 64-bit

  7. Hent (154.21 MB / version 16.8.2 (Crimson Edition 16.8.2 Hotfix) / udgivelsesdato 08/12/2016)

    Til Windows 8.1 32-bit

  8. Hent (239.88 MB / version 16.8.2 (Crimson Edition 16.8.2 Hotfix) / udgivelsesdato 08/12/2016)

    Til Windows 8.1 64-bit

  9. Hent (179 MB / version 14.4 (Catalyst Software Suite) / udgivelsesdato 25-04-2014)

    Til Windows XP 32 og 64-bit

  10. Hent (151 MB / version 13.12 (Catalyst Software Suite) / udgivelsesdato 18-12-2013)

    Til Windows Vista 32-bit

  11. Hent (209 MB / version 13.12 (Catalyst Software Suite) / udgivelsesdato 18-12-2013)

    Til Windows Vista 64-bit

Fallback - Hent drivere ved hjælp af AMD Driver Autodetect

Denne mulighed er praktisk, fordi programmet AMD Driver Autodetect vil vælge og downloade de seneste fungerende drivere, som passer til dit AMD-skærmkort og din version af Windows. Programmet kræver ikke installation, det blev oprettet af AMD og filer downloades fra deres officielle servere.

Instruktioner:

  1. Kør AMD Driver Autodetect, og det vil straks automatisk vælge de nødvendige filer til installation af drivere.
  2. For at downloade filer skal du klikke på knappen "Download nu".
  3. Vent på, at filerne downloades, og start installationen.

De er dukket op på internettet, som er af særlig interesse for de brugere, der, når man ser på det imponerende design af disse modeller, er i forventning om et seriøst ydeevnepotentiale. De seneste slides lækket til internettet fortæller om funktionaliteten af ​​de nye. Lad os først se nærmere på de tre hovedkategorier af funktionalitet repræsenteret af Graphics Core Next (GCN)-arkitekturen, AMD Eyefinity 2.0-teknologi og hardwareapplved hjælp af AMD APP-generelle computerteknologi. AMD beskriver GCN som en ny, "revolutionær" teknologi, der ændrer den måde, en videochip udfører grafikberegninger på.
I løbet af de sidste fem generationer, startende med Radeon HD 2000-serien, har AMD-videokort brugt VLIW (Very Long Instruction Word) arkitektoniske platform, og selv dens seneste version, VLIW4, repræsenteret ved linjen, er mere en evolutionær udvikling end et revolutionært gennembrud i VLIW's historie. Med Graphics Core Next-platformen erstattes generiske VLIW-processorer af Graphics Compute superskalære grafikkerner. Denne overgang betyder højere ydeevne pr. kvadratmillimeter af GPU-kerneareal, hvilket igen gør det muligt at reducere størrelsen af ​​grafikchippen, hvilket giver AMD ekstra plads til at manøvrere med hensyn til prissætning i konkurrencen med NVIDIA. Selve chippen er produceret på basis af TSMCs 28 nanometer procesteknologi. Yderligere bekræfter AMD understøttelse af en grænseflade med dobbelt så stor båndbredde i forhold til den tidligere version af bussen - PCI-Express 2.0.

AMD PowerTune-teknologi er ansvarlig for at styre strømforbruget, så du kan justere frekvensegenskaberne både op og ned i forhold til det nominelle, mens du forbliver inden for det deklarerede strømforbrugsniveau. Derudover nævnes ZeroCore-teknologi, som giver dig mulighed for helt at deaktivere grafik i tilfælde af, at den melder behov for at slukke for skærmen på grund af at være i inaktiv tilstand. Implementeringen af ​​ZeroCore-teknologi hjælper med at reducere videoadapterens strømforbrug til 3 W, hvilket viser en 10-dobbelt forbedring af denne indikator sammenlignet med modeller fra tidligere generationer. Det er også rapporteret, at denne funktion vil gøre det muligt for de sekundære GPU'er i bundtet (dvs. det andet, tredje og fjerde kort) at blive skiftet til ZeroCore-tilstand, hvilket efterlader hovedkortet (det, som skærmen er tilsluttet) i "vågen tilstand" ” tilstand - alt dette under forudsætning af, at computerens grafiske undersystem ikke er fyldt med intensive beregninger til at udføre 3D-opgaver.


Der annonceres væsentlige innovationer vedrørende Eyefinity 2.0-teknologi. Først og fremmest taler vi om DDM-systemet (Direct Drive Monitor), som giver dig mulighed for at udsende uafhængige lydstreams, når du sender surroundlyd i 7.1-format via HDMI- eller DisplayPort-stik. Når du flytter et programvindue, hvori et bestemt program afspilles, fra en skærm til en anden, overføres lydstrømmen også dynamisk fra en port til en anden. Den praktiske værdi af en sådan ordning ligger for eksempel i muligheden for at bruge et længere HDMI-kabel, når du tilslutter en computer i et rum til et HDMI-interface i et andet rum. Brugeren kan selv tænke på andre mulige anvendelsesområder for denne funktion. Eyefinity 2.0 vil stadig give dig mulighed for at oprette videooptagelser baseret på 5 skærme i liggende retning. Der ydes support til AMD HD3D, en proprietær teknologi fra AMD's grafikdivision, der gør det muligt at vise stereoskopiske 3D-billeder på hver skærm som en del af en videosekvens, der kompenserer for billedet under hensyntagen til skærmens vinkel i forhold til brugerens perspektiv og til rammen af ​​andre skærme.

Kørsel af applikationer, der understøtter computerteknologi til generelle formål, kendt som AMD APP (Accelerated Parallel Processing), bliver mere effektiv på grund af en vis udvidelse af funktionalitet på grund af brugen af ​​ressourcer i en ny, mere kraftfuld computerarkitektur designet med høje computerarbejdsbelastninger i tankerne. Det forventes at understøtte Steady Video 2.0-funktionen, som giver dig mulighed for at forbedre kvaliteten af ​​den originale optagelse ved at kompensere for rystelsen af ​​det billede, der er taget i hånden. En forbedret hardware videodekodningsenhed (UVD, Unified Video Decoder) vil udvide GPU'ens muligheder på dette område. En anden vigtig fordel er understøttelse af hjemmevideo i 3D-format, så den opdaterede UVD-motor vil tillade, at nogle præstationsproblemer også kan løses på dette område. Endelig vil AMD udvide sit APP-fodaftryk ved at udvikle nye applikationer, der understøtter teknologien.

  • Chipkodenavn: "Tahiti"
  • 4,3 milliarder transistorer (mere end 60 % flere end Cayman og præcis dobbelt så mange som Cypress)
  • 384-bit hukommelsesbus: seks 64-bit brede controllere, der understøtter GDDR5-hukommelse
  • Kerneur: op til 925 MHz (til Radeon HD 7970)
  • 32 GCN-beregningsenheder, inklusive 128 SIMD-kerner, bestående af i alt 2048 flydende ALU'er (heltals- og flydende kommaformater, understøttelse af FP32- og FP64-præcision inden for IEEE 754-standarden)
  • 128 teksturenheder, med understøttelse af trilineær og anisotropisk filtrering for alle teksturformater
  • 32 ROP-enheder med understøttelse af anti-aliasing-tilstande med programmerbar sampling af mere end 16 samples pr. pixel, inklusive med FP16- eller FP32-rammebufferformat. Maksimal ydeevne op til 32 samples pr. ur, og kun i Z-tilstand - 128 samples pr. ur
  • Integreret understøttelse af seks skærme, inklusive HDMI 1.4a og DisplayPort 1.2

Radeon HD 7970 grafikkort specifikationer

  • Kernefrekvens: 925 MHz
  • Antal universelle processorer: 2048
  • Antal teksturblokke: 128, blandingsblokke: 32
  • Effektiv hukommelsesfrekvens: 5500 MHz (4x1375 MHz)
  • Hukommelsestype: GDDR5
  • Hukommelseskapacitet: 3 gigabyte
  • Hukommelsesbåndbredde: 264 gigabyte i sekundet.
  • Teoretisk maksimal opfyldningshastighed: 29,6 gigapixel per sekund.
  • Teoretisk tekstursamplinghastighed: 118,4 gigatexels pr. sekund.
  • To CrossFire stik
  • PCI Express 3.0 bus
  • Strømforbrug: fra 3 til 250 W
  • Et 8-benet og et 6-benet strømstik
  • Dobbelt slot design
  • Vejledende pris for det amerikanske marked: $549

Radeon HD 7950 grafikkort specifikationer

  • Kernefrekvens: 800 MHz
  • Antal universelle processorer: 1792
  • Antal teksturblokke: 112, blandingsblokke: 32
  • Effektiv hukommelsesfrekvens: 5000 MHz (4x1250 MHz)
  • Hukommelsestype: GDDR5
  • Hukommelseskapacitet: 3 gigabyte
  • Hukommelsesbåndbredde: 240 gigabyte i sekundet.
  • Teoretisk maksimal opfyldningshastighed: 25,6 gigapixel per sekund.
  • Teoretisk tekstursamplinghastighed: 89,6 gigatexels pr. sekund.
  • To CrossFire stik
  • PCI Express 3.0 bus
  • Stik: DVI Dual Link, HDMI 1.4, to Mini-DisplayPort 1.2
  • Strømforbrug: fra 3 til 200 W
  • Dobbelt slot design
  • amerikansk vejledende pris: $449

Den høje kompleksitet af den nye chip er bemærkelsesværdig - 4,3 milliarder transistorer, hvilket er mere end halvdelen af ​​antallet af transistorer i den tidligere top-end grafikprocessor. Evnen til at lave en så kompleks krystal blev muliggjort ved brug af en moderne 28 nanometer procesteknologi, og den nye chip var endda lidt mindre i areal end Cayman. Og dens praktiske egenskaber, der påvirker ydeevnen, er blevet mærkbart forbedret: antallet af ALU'er, TMU'er og hukommelsesbus. Kun antallet af ROP-blokke steg ikke, og frekvensen af ​​GDDR5-videohukommelse forblev på samme niveau.

Navneprincippet for virksomhedens grafikkort forbliver det samme. Radeon HD 7970 er virksomhedens mest produktive single-chip-løsning; efter nogen tid blev junior HD 7950-modellen frigivet, annonceret lidt senere. Oprindeligt havde HD 7970 ingen konkurrenter på markedet og erstattede ikke noget specifikt videokort fra AMD-linjen, men flyttede det snarere ned. Hvad angår sammenligning med sin konkurrent, frigav NVIDIA sin 28-nanometer-løsning meget senere.

Det nye AMD-videokort er udstyret med den samme GDDR5-hukommelse, men dets volumen er i stedet for 2 gigabyte i den forrige generation steget til 3 gigabyte. Dette skete på grund af udvidelsen af ​​hukommelsesbussen fra 256-bit til 384-bit. Og nu kan du lægge enten 1,5 GB eller 3 GB på det nye board. Ud fra et markedsføringssynspunkt ville det naturligvis være en klar ulempe at installere en mindre volumen, så det blev besluttet at installere 3 GB, selvom det i dag er lidt overkill. Kun i ultrahøje opløsninger og med MSAA 16x er 1,5-2 GB ikke nok. AMD har dog også Eyefinity, og til spil på tre eller flere skærme vil skærmbufferen fylde meget.

Så lad os se på Radeon HD 7970. Det nye videokort i den øvre prisklasse har et dual-slot kølesystem, dækket af et plastikhus, som alle moderne AMD-kort kender til i hele kortets længde. Kun designet af dette kabinet har ændret sig lidt, selvom bagdelen stadig strækker sig ud over printkortet. Men designet af strimlen med stifter blev ændret - for at forbedre afkøling af videokortet blev en af ​​de to slots (halvdelen af ​​strimlen) udelukkende optaget af et ventilationshul til varmefjernelse.

Men brugerne bør ikke lide under en reduktion i antallet af DVI-stik loddet direkte på kortet. For nemheds skyld vil en speciel HDMI-DVI-adapter være inkluderet i pakken, som giver dig mulighed for at forbinde to skærme med DVI-stik. Strømforbruget på det nye kort er i øvrigt ikke lavere end Radeon HD 6970, så det skulle udstyres med et sæt med et 8-benet og et 6-benet strømstik.

Men i den nye Radeon HD 7970 har kølesystemet ændret sig til det bedre. Der bruges en ny generation af fordampningskammer og en ny større køler med omformede blade og øget ydeevne (mere luftstrøm leveres). Resultatet er en forøgelse af køleeffektiviteten, samtidig med at støjen reduceres.

Dual BIOS-firmware-switchen, som vi skrev om i beskrivelsen af ​​Radeon HD 6900, er heller ikke forsvundet fra brættet Kort sagt: Videokortet har to BIOS-versioner, den ene med mulighed for at custom flashe firmwaren, og sekund med firmware hardkodet på fabrikken. Både brugere og AMD selv kunne lide denne bekvemme løsning så meget, at de besluttede at fortsætte med at pakke dem med top-end løsninger.

Vi kan kun hilse denne løsning velkommen, som virkelig hjælper i forskellige tilfælde relateret til uventede problemer under blink (for eksempel strømafbrydelse under processen), og giver dig mulighed for frygtløst at udføre forskellige eksperimenter med BIOS-billeder. Det er ikke overraskende, at AMD igen og igen antyder fremragende overclocking-egenskaber på det nye videokort:

Som du kan se, er overclocking til en frekvens på 1 GHz og højere praktisk talt lovet, hvis du ikke tager højde for den lille inskription (som ikke var inkluderet i skærmbilledet), at garantien ophører med at være gyldig, selvom videokortet svigter som et resultat af et eksperiment med at hæve frekvensen fra indstillingsvideodriverne.

Arkitektoniske træk ved Radeon HD 7970

For at forstå relevansen af ​​de arkitektoniske ændringer på de sydlige øer ser vi først på udviklingen af ​​GPU'er i løbet af de sidste par år som repræsenteret af AMD. Indtil 2002 var grafikchips specifik hardware, der udelukkende var i stand til grafisk databehandling. Videochips fra den tid havde begrænset funktionalitet; de kunne kun anvende og filtrere teksturer, behandle geometri og udføre primitiv rasterisering og var derfor slet ikke egnede til universelle computeropgaver.

I løbet af de næste par år blev grundlæggende programmerbarhed tilføjet til GPU'en, men fokuserede også udelukkende på grafikopgaver. Dette var tidspunktet for understøttelse af DirectX 8 og 9, shader-programmer med begrænset funktion med evnen til at beregne med flydende komma. Videochips fra den tid havde specialiserede ALU-enheder til vertex- og pixelbehandling samt dedikerede caches til pixels, teksturer og andre data. Alsidigheden var stadig ikke engang tæt på.

Det var først i 2007, at AMD erhvervede den forenede DirectX 10 shader-arkitektur samt muligheden for at programmere GPU'en ved hjælp af specialværktøjer: CAL, Brook, ATI Stream. GPU'er på den tid havde allerede avanceret caching og understøttelse af lokale og globale delte data. Arkitektonisk var chipsene baseret på VLIW5 og VLIW4 blokke, fleksible nok til nogle grundlæggende ikke-grafiske beregninger, men stadig fokuseret på grafikalgoritmer.

Nu er det tid til en ny arkitektur, der er endnu bedre egnet til generel databehandling - Graphics Core Next (GCN). Dette er en ny arkitektonisk æra for AMD, hvorfor navnet blev valgt. De nye GPU'er tilbyder fremragende grafikbehandlingsegenskaber og ydeevne, men de arkitektoniske ændringer, der er foretaget, er primært beregnet til at forbedre positioner inden for ikke-grafisk computing - hvilket øger ydeevnen og effektiviteten i komplekse generelle opgaver. Det nye GPU-design er beregnet til såkaldt heterogen computing - en blanding af grafik og generel databehandling i et multitasking-miljø. GCN-arkitekturen er blevet mere fleksibel og burde være endnu bedre egnet til energieffektiv udførelse af forskellige opgaver.

Grundblokken i den nye arkitektur er GCN-blokken. Det er på disse "byggeklodser", at alle nye Southern Islands-serie grafikprocessorer er baseret. Arkitekturen for AMD-grafikchips bruger for første gang et ikke-VLIW-design, den bruger vektor- og skalareenheder, og en af ​​de vigtigste ændringer er, at hver af GCN-computerenhederne har sin egen planlægger og kan udføre instruktioner fra forskellige programmer (kerne).

Den nye computerarkitektur er designet til høj effektivitet ved indlæsning af computerenheder i et multi-tasking miljø. GCN-beregningsenheden er opdelt i fire undersektioner, som hver arbejder på sin egen instruktionsstrøm hver clock-cyklus. Tråde kan også bruge den skalarblok, der leveres af GCN til flowkontrol eller markøroperationer. Kombinationen af ​​vektor- og skalarblokke giver en meget enkel programmeringsmodel. For eksempel er funktionspointere og stackpointere meget nemmere at programmere, og compilerens opgave er nu væsentligt forenklet, da udførelsesenhederne er skalære.

Hver GCN-blok har 64 KB dedikeret lokal datalagring til dataudveksling eller lokal registerstakudvidelse. Blokken inkluderer også en cache på første niveau med læse- og skrivefunktioner og en fuldgyldig teksturpipeline (sampling- og filtreringsenheder). Derfor er den nye computerenhed i stand til at arbejde selvstændigt, uden en central skemalægger, som i tidligere arkitekturer var ansvarlig for at fordele arbejde på tværs af enheder. Nu er hver af GCN-blokkene i stand til selv at planlægge og distribuere kommandoer; én computerblok kan udføre op til 32 forskellige kommandostrømme, som kan være fra forskellige virtuelle adresserum i hukommelsen og er fuldstændig beskyttede og uafhængige af hinanden.

Tidligere AMD GPU-arkitekturer brugte VLIW4- og VLIW5-arkitektoniske modeller, og selvom de er gode nok til grafikopgaver, er de ikke effektive nok til generel databehandling, da det er meget vanskeligt at indlæse alle udførelsesenheder med arbejde under sådanne forhold. Den nye GCN-arkitektur tilbyder det samme store antal eksekveringsenheder, men med en skalær udførelse, der fjerner begrænsningerne og afhængigheden af ​​registre og instruktioner. Overgangen fra VLIW-arkitekturen til skalær eksekvering giver en mærkbar forenkling af kodeoptimeringsopgaver.

Ved udførelse af instruktioner på den tidligere VLIW4-arkitektur skal compileren håndtere registerkonflikter, udføre kompleks distribution af instruktioner til eksekveringsenheder på kodekompileringsstadiet osv. Samtidig kræver det ofte ikke-triviel optimering at opnå høj ydeevne, hvilket er velegnet til de fleste grafiske opgaver og meget mindre fleksibel til andre beregninger. Den nye arkitektur tilbyder betydelig forenkling af udvikling og support, forenklet oprettelse, analyse og fangst af fejl i lavniveaukode, stabil og forudsigelig ydeevne.

Hukommelse caching subsystem

Der er aldrig nok båndbredde og hukommelse og caches, og der er altid behov for og metoder til at øge dem. AMDs nye GPU'er bruger en fuld to-niveau læse/skrive-cache. Hver computerenhed har 16 kilobyte cache på første niveau, og den samlede mængde cache på andet niveau er 768 kilobyte (i alt har chippen 512 KB L1 og 768 KB L2), hvilket er 50 % mere end i den forrige chip , som slet ikke har skrivemuligheder i L2-cache.

Med hensyn til ydeevne kan hver GCN-beregningsenhed modtage eller skrive 64 bytes data fra/til L1-cachen eller den globale hukommelse, som bruges til at udveksle data mellem instruktionstråde, i en clock-cyklus. Hver sektion af L2-cachen på andet niveau er i stand til at transmittere og modtage den samme mængde data. Som et resultat opnår virksomhedens top-end GPU 2 terabyte/s for L1 og 700 GB/s for L2, hvilket er 50 % mere end AMDs tidligere top-end-løsning.

Tahiti GPU

Nu hvor vi har set på de lave arkitektoniske ændringer i den nye Southern Islands-serie, er det tid til at gå videre til detaljerne i linjens mest kraftfulde løsning, Radeon HD 7900, som omfatter to modeller. Først og fremmest, lad os bemærke den rene kompleksitet af den nye GPU, fordi den indeholder mere end 4,3 milliarder transistorer, hvilket er dobbelt så mange, som der var i den chip, som Radeon HD 5870 er baseret på! Naturligvis blev sådan en kraftig chip kun mulig takket være brugen af ​​den nye 28 nm procesteknologi. Så hvad har han indeni?

Antallet af geometriske blokke er ikke ændret, sammenlignet med Cayman, der er stadig to af dem, men effektiviteten af ​​deres arbejde er blevet betydeligt øget - vi vil dvæle mere detaljeret på dette lidt senere. I GPU-diagrammet ser vi 32 GCN-arkitektur-beregningsenheder, der er tilgængelige på Radeon HD 7970, og i tilfælde af den lavere ende-løsning vil nogle af dem være deaktiveret. Hvis vi betragter løsningens maksimale computerydelse, er det næsten 3,8 teraflops (floating point operations per second), hvilket er en absolut rekord for en GPU til dato.

Hver GCN-blok indeholder 16 teksturenheder, hvilket giver et endeligt tal på 128 TMU'er pr. chip, eller mere end 118 gigatexels/sek. - og dette er endnu en rekord på udgivelsestidspunktet, og det vil ikke være den sidste. Men antallet af ROP-blokke har ikke ændret sig, der er stadig 32 af dem i 8 forstørrede RBE-blokke. En anden interessant arkitektonisk ændring er, at ROP-blokke nu ikke er "vedhæftet" til hukommelseskanaler, som det tidligere var tilfældet, men til GCN-blokke.

Selvom skrivehastigheden til rammebufferen teoretisk er næsten uændret, og det maksimalt mulige er de samme 32 farveværdier og 128 dybdeværdier pr. ur, er den praktiske udfyldningshastighed i applikationer fra den virkelige verden steget betydeligt på grund af den øgede hukommelsesbåndbredde. Ifølge AMDs målinger optog Cayman kun 23 pixels pr. ur, mens den nye Tahiti kom tæt på de teoretiske 32 pixels pr. ur.

Det er forståeligt, for AMDs nye videochip har en 384-bit hukommelsesbus – seks 64-bit kanaler, ligesom konkurrentens nuværende top-end løsning. Det er denne halvanden gange stigning i hukommelsesbåndbredde, der gør det muligt at øge den faktiske hastighed for teksturhentning og skrivning til framebufferen. Båndbredde på 264 GB/sek skal være med til at presse tæt på teoretiske tal på 118 gigapixel/sek og 30 gigapixel/sek, og i den praktiske del tjekker vi dette.

I tilfældet med den "nedskårne" Radeon HD 7950 GPU inkluderer Tahiti 28 aktive computerenheder af GCN-arkitekturen ud af 32 fysisk tilgængelige på chippen. I tilfælde af juniorløsningen i Radeon HD 7970-serien blev det besluttet at deaktivere fire af dem. Da hver GCN-enhed indeholder 16 teksturenheder, er det samlede antal TMU'er for den nye model 112 TMU'er, hvilket giver en ydeevne på næsten 90 gigatexels/sek.

Men antallet af ROP-enheder og hukommelsescontrollere i HD 7950 har ikke ændret sig; de besluttede ikke at skære dem og lade dem være på henholdsvis 32 og 6 stykker. Derfor har Tahiti Pro videochippen den samme 384-bit hukommelsesbus, samlet fra seks 64-bit kanaler, som den bedste AMD-løsning. Tilsyneladende er det de computerfunktionelle enheder, der lider mest af produktionsfejl, og de besluttede ikke at skære alt andet.

Tessellering og geometribehandling

Fra et arkitektonisk synspunkt har intet meget ændret sig ved Tahitis geometriske blokke siden Cayman. To blokke bruges stadig til behandling (indstilling af hjørner og tessellation) geometriske data og rasterisering, og skemaet ligner meget det, vi så tidligere, bortset fra at tessellatorerne kaldes 9. generation:

På trods af de skematiske ligheder er den seneste generation af disse blokke i stand til betydeligt større tessellations- og geometribehandlingsydelse, da blokkene har gennemgået betydelige modifikationer. Selvom den maksimale ydeevne kun steg til næsten to milliarder hjørner og primitiver pr. sekund (925 MHz og to hjørner pr. ur), steg den faktiske ydeevne mere. Dette blev opnået ved at øge størrelsen af ​​caches, forbedre geometridatabuffring og genbruge toppunktsdata.

Som et resultat er tessellationsydelsen forbedret på tværs af alle trekantsforhold med op til fire gange sammenlignet med den tidligere generation Radeon HD 6970. Men fire gange opnås ikke i alle tilfælde, selv på diagrammet fra AMD selv:

Diagrammet sammenligner tessellationsydelsen for Radeon HD 7970 versus HD 6970 ved partitioneringsfaktorer fra 1 til 32. Og som du kan se, er ydeevneforskellen mellem 1,7 og 4 gange. Men dette er bare syntetisk. Og for at komme tættere på virkeligheden, lad os give nogle flere data om tessellationshastighed i spilapplikationer:

Som du kan se, er AMD's syntetiske tal godt understøttet af gaming - ydeevnen i rigtige applikationer med "tunge" tesselleringer er steget betydeligt. Dette er et meget godt resultat, som vi helt sikkert vil tjekke i den praktiske del ved at bruge eksemplet med syntetiske materialer og spilapplikationer.

Ikke-grafisk databehandling

Ud fra synspunktet om heterogene og ikke-grafiske computeropgaver er fremkomsten af ​​to asynkrone computermotorer (Asynchronous Compute Engines - ACE) meget vigtig. De er designet til at planlægge og distribuere arbejde mellem eksekveringsenheder for effektiv multitasking og arbejde sammen med den grafiske kommandoprocessor (Command Processor).

Radeon HD 7900 har to uafhængige computermotorer og en grafikmotor. I alt giver dette tre programmerbare blokke og tre kommandostrømme, fuldstændig adskilt fra hinanden. Og udover asynkron kommandolevering til hurtig kontekstskift, har den nye GPU også to DMA-controllere (bidirectional direct memory access) introduceret i Cayman. Disse to controllere er nødvendige for at drage fuld fordel af den nye PCI Express 3.0 bus.

Som vi ved, ud fra et seriøs databehandlingssynspunkt er ikke kun hastigheden af ​​udførelsen af ​​enkelt præcision flydende komma operationer vigtig, men også dobbelt præcision flydende komma. Og den nye AMD-arkitektur klarer denne opgave ganske godt. I øjeblikket antages det, at der er to versioner af GCN-beregningsenheder, der har forskellige hastigheder for udførelse af FP64-instruktioner. For ældre GPU'er er eksekveringshastigheden 1/4 af FP32-hastigheden, og for yngre chips er eksekveringshastigheden 1/16, hvilket er ganske nok til at bevare kompatibiliteten, men ikke komplicerer billige løsninger for meget. Som et resultat er Radeon HD 7970 i stand til 947 milliarder dobbeltpræcisionsoperationer i sekundet (åh, de kom bare til kortere end en teraflop!) - dette er endnu en højeste præstation af den nye AMD-chip.

Desuden er det ikke de samme gigaflops som i tilfældet med tidligere arkitekturer, men mere "fede". Når alt kommer til alt burde effektiviteten af ​​den nye GPU i komplekse computeropgaver stige betydeligt. For det første er undersystemet hukommelse og caching blevet forbedret. For det andet har hver GCN-beregningsenhed sin egen planlægger, som skulle forbedre udførelse af forgreningskode og overordnet effektivitet. Nå, for det tredje bemærker vi den skalære udførelse, som ikke kræver komplekse optimeringer fra compileren, som et resultat af hvilken beregningsenhederne vil være inaktive meget sjældnere. Og som et resultat vil det i enhver opgave være lettere for den nye chip at demonstrere høj ydeevne og ALU-belastning.

Blandt andre innovationer relateret til computeregenskaber bemærker vi fuld ECC-understøttelse af DRAM og SRAM. På softwaresiden er det vigtigt, at Tahiti er den første GPU med fuld understøttelse af de nye API-versioner: OpenCL 1.2, DirectCompute 11.1 og C++ AMP og deres muligheder. For eksempel giver OpenCL 1.2 dig mulighed for at kombinere mulighederne for flere computerenheder til én, og AMD har allerede frigivet support til dette i form af AMD APP SDK 2.6 og Catalyst 11.12-driveren.

Arkitektur ydeevne og effektivitet

Efter at have gennemgået alle de arkitektoniske innovationer ved at bruge eksemplet med top-end-chippen fra Southern Island-serien, er det tid til at tale om effektiviteten af ​​alle disse ændringer. Det er klart, at ydeevnen af ​​de nye chips er meget højere end de tidligere; det modsatte ville være ret overraskende. Spørgsmålet er, hvor meget hurtigere. I forskellige opgaver spænder resultaterne fra 40-50 % (minimum!) til en femdobbelt forskel. Forbedringer i arkitekturen gør det muligt at overstige de teoretiske 1,4 gange forskellen i dumme gigaflops. Lad os se på dette med eksempler:

Diagrammet sammenligner den nye topløsning og den tidligere single-chip-løsning: Radeon HD 7970 og HD 6970, hvilket er ganske fair. De valgte ydelsestests er forskellige: SmallptGPU og LuxMark er ray tracing på OpenCL, SHA256 er en sikker hashing-algoritme, og AES256 er en symmetrisk krypteringsalgoritme. Nå, Mandelbrot er et velkendt problem beregnet med dobbelt præcision.

Den lodrette stiplede linje i grafen markerer den teoretiske forskel i ydeevne, men hastighedsdataene viser, at i tre ud af fem opgaver var hastigheden på den nye GPU markant højere. Dette er forårsaget af alle de ændringer, der har til formål at øge effektiviteten: bevæge sig væk fra VLIW, have en skemalægger i hver computerenhed, forbedret caching osv.

Ændringer i gengivelseskvaliteten

Egentlig kunne denne del sagtens være sprunget over, da der på det seneste ikke har været nogen særlige klager over billedkvaliteten, og det kan der ikke være - af forskellige årsager. For eksempel er kvaliteten af ​​fuldskærms anti-aliasing blandt videokort fra forskellige producenter meget ens, især i betragtning af den udbredte brug af software anti-aliasing metoder ved hjælp af efterbehandlingsfiltre, som udføres nøjagtigt ens på alle GPU'er.

Det samme gør sig gældende for teksturfiltrering – nu er kvaliteten sådan, at det er meget svært at skelne mellem AMD- og NVIDIA-løsninger, selvom man foretager en pixel-for-pixel sammenligning. I Radeon HD 6900 - virksomhedens tidligere generation - er anisotropisk filtrering forbedret lidt mere, og nu vil selv et "mikroskop" ikke hjælpe med at finde nogen væsentlige mangler der. Den eneste note er, at Radeon-videokortene i bevægelse var lidt ringere end GeForce på grund af mere mærkbare specifikke artefakter, såsom "støj" eller "sand".

Med udgivelsen af ​​den nye generation af videochips blev texelvægtene i teksturfilteret gennemgået igen, og modificeret dem på en sådan måde, at sådanne artefakter reduceres, nogle gange synlige på Radeon HD 6900 i nærværelse af visse typer teksturer (“høj -frekvens”, med skarpe overgange fra for eksempel mørkt til lys). Ændringerne i kvalitet er så svære at vise med eksempler, at AMD ikke leverer sammenlignende billeder af HD 7900 versus HD 6900, men blot sammenligner kvaliteten af ​​"hardware"-algoritmen med en ren software, der udføres på GPU-streamprocessorer, og derfor ideelt:

På et så lille skærmbillede er forskellen i kvalitet ikke synlig, men AMD forsikrer, at alle de foretagne ændringer ikke medførte noget fald i ydeevnen og ikke forringede billedkvaliteten i noget som helst aspekt - det afhænger stadig ikke af vinklen og filtreringskvaliteten er tæt på ideel. Vi vil helt sikkert tjekke dette i et af de fremtidige praktiske materialer.

Delvist residente teksturer

Ideen med Partially Resident Textures (PRT) er at bruge hardwarefunktionerne i den præsenterede GPU - virtuel hukommelse. Mange brugere har sikkert allerede set spillet RAGE by id Software, som bruger virtuel tekstureringsteknologi, den såkaldte megatexturing (“MegaTexture”), som gør det muligt at bruge enorme mængder teksturdata og streame dem til videohukommelsen.

Ved at bruge virtuel videohukommelse er det meget nemt at få effektiv hardwareunderstøttelse til sådanne algoritmer, hvilket giver dig mulighed for at bruge op til 32 terabyte teksturer i en applikation, hvilket gør det muligt at skabe unikke placeringer i spil, uden at gentage stykker af teksturer, og uden problemer med at indlæse teksturdata. Sandt nok giver AMD et tydeligt eksempel, der er for mærkeligt, hvorfra intet er særlig klart:

PRT giver dig mulighed for at opnå høj billedkvalitet og hjælper med at forbedre effektiviteten af ​​brug af videohukommelse. Lignende algoritmer bruges allerede i id Software-motoren, og de forventes at dukke op i mange næste generations motorer. Fremtidens spil skal arbejde med enorme mængder data, og fordelen ved den nye GPU er, at lokal grafikhukommelse i algoritmer a la PRT fungerer som hardware-cache-hukommelse, og teksturer indlæses i den, når det er nødvendigt. GPU'er fra Southern Islands-familien understøtter "megateksturer" med et volumen på op til 32 terabyte (opløsning op til 16384 × 16384) og vigtigst af alt, hardwareteksturfiltrering for dem, som ikke er tilgængelig på tidligere videochips.

Virtuelle teksturer er opdelt i stykker på 64 kilobyte i størrelse (kilobyte, ikke texels), og denne stykke størrelse er fast. Og kun dem, der er nødvendige ved gengivelse af den aktuelle ramme, indlæses i videokortets lokale hukommelse. Teknologien virker uanset teksturformatet, bare størrelserne på stykkerne i texel vil være anderledes. For en almindelig ukomprimeret tekstur med 32 bits pr. farve vil stykstørrelsen for eksempel være 128x128 texel, og for en tekstur komprimeret i DXT3-format - 256x256 texel.

Teknologien involverer også brug af tekstur mip-niveauer (reducerede kopier, der bruges til teksturfiltrering). De kræver flere adgange under gengivelse og filtrering. Lad os se på algoritmens funktion ved at bruge et eksempel.

Dette billede fremhæver fire forskellige bidder fra forskellige mip-niveauer, der kræves til gengivelse. Når et shader-program anmoder om data fra dem, er nogle af bidderne allerede i lokal hukommelse, og disse data sendes straks til shaderen for yderligere beregninger. Men der mangler nogle bidder på bordet, og applikationen skal vælge, hvad der skal ske næste gang på den miss. For eksempel kan du anmode om data fra et mip-niveau med lavere opløsning, så vil billedet være sløret, men i det mindste vil det ligne den ægte vare og vil blive gengivet uden forsinkelse. Og når det næste billede gengives, kan det allerede indlæses i cachen - lokal videohukommelse. Dem, der spillede RAGE, vil forstå os.

Dette er en kraftfuld algoritme, der giver dig mulighed for at bruge enorme teksturer, der er unikke for hvert objekt. Lignende algoritmer har længe været brugt i offline-gengivelse, bortset fra behovet for realtidsberegninger. AMD lavede endda en demo ved hjælp af Per-Face Texture Mapping-teknikken udviklet af Walt Disney Animation Studios til deres animationsfilm. Demoen er desværre ikke klar endnu, og vi har kun set skærmbilleder i lav opløsning.

Essensen af ​​denne teksturkortlægningsteknik er at tildele et specifikt stykke tekstur til hver polygon uden behov for at bruge UV-transformation (finde en overensstemmelse mellem overfladekoordinaterne for et tredimensionelt objekt og koordinaterne på en todimensionel tekstur) . Denne tilgang løser nogle af problemerne med at skabe tesselleret indhold ved at gøre forskydningskortlægningsalgoritmen meget enkel. Og PRT i denne metode bruges til effektivt at gemme og få adgang til teksturdata.

Mediebehandlingsinstruktioner

En interessant innovation på de sydlige øer synes at være støtte til specialiserede instruktioner, der bruges i billedbehandling, statisk og dynamisk. For eksempel er en meget brugt instruktion kaldet "sum of absolute differences", bedre kendt som SAD (Sum of Absolute Differences), blevet forbedret. Hastigheden af ​​dens udførelse er en meget kritisk ydeevneflaskehals for mange billed- og videobehandlingsalgoritmer, såsom bevægelsesdetektion, gestusgenkendelse, billedsøgning, computersyn og mange andre.

Men i vores anmeldelse af det gamle Radeon HD 5870-skærmkort skrev vi allerede om SAD-understøttelse. Ud over den almindelige SAD (4x1) har Southern Islands nu en ny instruktion - QSAD (quad SAD), som kombinerer SAD med skiftoperatører for at øge ydeevnen og energieffektiviteten, samt en "maskeret" instruktion MQSAD, som ignorerer baggrundspixel og bruges til at isolere objekter, der bevæger sig i rammen fra baggrunden.

De nye GPU'er kan behandle op til 256 pixels per GCN-beregningsenhed per ur, hvilket i tilfældet med AMD Radeon HD 7970-modellen betyder evnen til at behandle op til 7,6 billioner pixels per sekund i tilfælde af 8-bit heltal farveværdier. Selvom dette er en teoretisk figur, er de nye GPU'ers visuelle behandlingsmuligheder ret imponerende - mange videobehandlingsopgaver kan udføres i realtid.

PCI Express 3.0

Vi kunne ikke ignorere støtten fra den tredje version af PCI Express fra hele linjen af ​​nye sydlige øers grafikløsninger. Denne support var ret forventet, da specifikationerne for den tredje version af PCI Express endelig blev godkendt tilbage i efteråret 2010, men der var stadig ingen hardwareløsninger med dens support, selvom bundkort allerede dukker op, blev videokort udgivet i slutningen af 2011, og de tilsvarende centrale processorer Der er.

Den opdaterede grænseflade har en overførselshastighed på 8 gigatransaktioner i sekundet i stedet for 5 GT/s for version 2.0, og dens gennemstrømning er igen fordoblet (til 32 GB/s) sammenlignet med PCI Express 2.0-standarden. Den nye bus bruger et andet kodningsskema for data sendt over bussen, men kompatibiliteten med tidligere versioner af PCI Express er blevet bibeholdt.

De første bundkort, der understøtter PCI Express 3.0, blev introduceret i sommeren 2011, hovedsageligt baseret på Intel Z68-chipsættet, og de blev først bredt tilgængelige i efteråret samme år. Nu er videokortene ankommet, og AMD er igen kommet foran resten med hensyn til hastigheden af ​​udgivelsen af ​​nye grafikprocessorer, der understøtter de mest avancerede teknologier. Men om PCI-E 3.0 vil give nogen praktisk mening er for tidligt at vurdere.

AMD PowerTune-teknologi

En af de mest interessante innovationer i Cayman var PowerTunes avancerede strømstyringsteknologi. Fleksibel GPU-strømstyring har været brugt i lang tid, men før Radeon HD 6900 var alle disse teknologier ret primitive og for det meste softwaremetoder og ændrede frekvensen og spændingen i trin, ude af stand til at slukke for store dele af videochips.

Selv i Radeon HD 5000-familien dukkede en ydelsesbegrænser op, når et vist forbrugsniveau blev overskredet, og i Radeon HD 6900 flyttede systemet til et kvalitativt andet niveau. For at gøre dette inkluderede chippen specielle sensorer i alle blokke, der overvåger opstartsparametre. GPU'en måler konstant belastning og strømforbrug og tillader ikke sidstnævnte at gå ud over en vis tærskel, idet den automatisk justerer frekvensen og spændingen, så parametrene forbliver inden for den specificerede termiske pakke.

I modsætning til tidligere strømstyringsteknologier giver PowerTune direkte kontrol over GPU-strømforbruget, i modsætning til indirekte kontrol ved at ændre frekvenser og spændinger. Denne teknologi hjælper dig med at indstille dine GPU-ure til høje hastigheder og opnå høj spilleydelse uden at bekymre dig om, at strømforbruget går ud over sikre grænser. De fleste spil og generelle applikationer, der bruger GPU-computere, har trods alt væsentligt lavere strømkrav og nærmer sig ikke farlige strømforbrugsgrænser, i modsætning til stabilitetstests som Furmark og OCCT.

Selv de tungeste spil kræver ikke maksimalt strømforbrug, og hvis du begrænser forbruget efter frekvens, tester videokort med ekstreme tests, så vil der i tilfælde af 3D-spil være en hel del uudnyttet ydeevne og strømpotentiale. I tilfælde af at videokortet ikke har nået den sikre forbrugsgrænse, vil GPU'en fungere med den frekvens, der er indstillet på fabrikken, og i FurMark- og OCCT-testene vil GPU-frekvensen falde for at holde sig inden for forbrugsgrænserne.

PowerTune hjælper således med at indstille højere fabriksfrekvenser og konfigurere systemet til at udnytte GPU-ressourcerne mest effektivt ved det indstillede maksimale forbrugsniveau. I eksemplet vist ovenfor bruger HD 5870 ikke PowerTune, og på grund af GPU-frekvensbegrænsningen på grund af højt forbrug i udholdenhedstestene, bruger den ikke alle sine muligheder. Mens Radeon HD 7970 er indstillet til den maksimale TDP, og videochippen kun nulstiller frekvenserne, når den overskrides, hvilket opnår den højest mulige ydeevne i enhver applikation.

Dette er tydeligt vist i det følgende diagram. I tilfælde af spilapplikationer er det muligt at opnå TDP ved at øge GPU-frekvensen, og for spidsbelastninger reducerer udholdenhedstest frekvensen til et sikkert niveau af strømforbrug. Uden PowerTune skulle du vælge - enten muligheden for et videokortfejl, når du bruger FurMark og OCCT i lang tid, eller reducere den potentielle ydeevne i spil. Ny teknologi løser disse problemer så effektivt som muligt.

AMD PowerTune reagerer hurtigt på skiftende forhold (mikrosekunder), fordi det er en hardwareteknologi. Det er også kendetegnet ved fleksible frekvensindstillinger, og ikke trinvist, som det var tilfældet i tidligere chips. Alle målinger er uafhængige af driveren, men kan justeres af brugeren ved hjælp af videokortets indstillinger.

Forskellen mellem PowerTune og den tidligere almindeligt accepterede tilgang er, at der i andre tilfælde anvendes termisk drosling, hvilket sætter GPU'en i en væsentlig reduceret forbrugstilstand, mens PowerTune blot jævnt reducerer dens frekvens, hvilket bringer GPU-forbruget til den indstillede limiter. Dette opnår højere clockhastigheder og ydeevne.

AMD ZeroCore-teknologi

AMD begrænsede sig ikke til at bruge strømstyringsteknologi, der allerede er kendt fra tidligere løsninger. I de første chips i Southern Islands-familien introducerer den AMD ZeroCore-teknologi, som hjælper med at opnå endnu større energieffektivitet i "deep indle" (eller "sleep")-tilstand med displayenheden deaktiveret, hvilket understøttes af alle operativsystemer.

Når alt kommer til alt, bruger næsten ethvert system, selv et spil, det meste af sin tid i lav belastningstilstand på grafikprocessoren. Og videokortet bør ikke forbruge meget energi i denne tilstand. Og endnu mere, for ikke at nævne tilstanden med skærmen slukket - i dette tilfælde er det tilrådeligt at slukke GPU'en helt. Det var, hvad AMD gjorde. Takket være ZeroCore, i en dyb inaktiv tilstand, bruger den nye GPU mindre end 5 % af energien i en fuld tilstand, hvilket deaktiverer de fleste funktionelle blokke i denne tilstand.

AMD giver en skematisk sammenligning med sin egen Radeon HD 5870, som ikke understøttede en sådan teknologi. ZeroCore er en eksklusiv innovation på Sydøerne, der bringes til desktop-løsninger fra mobile GPU'er designet til bærbare computere. Forresten er fordelene ved denne teknologi ikke kun forbundet med reduceret forbrug. Derudover slukker videokortet i langvarig inaktiv tilstand, når skærmen er slukket, også for blæseren på videokortkøleren!

Det er præcis, hvad mange brugere har ventet på i lang tid. Det mest interessante er, at ifølge vores data blev laboratorietest af lignende PowerTune- og ZeroCore-løsninger udført for flere generationer af videokort siden. Nogle af ingeniøreksemplerne af videokort fra AMD-serien, der længe har forladt markedet, fungerede præcis sådan her, og slukkede fuldstændigt for køleren, når den ikke var i brug.

Men det er ikke kun enkelt-GPU-brugere, der vil drage fordel af reduceret støj og strømforbrug med AMDs nye ZeroCore-aktiverede grafikkort. Lignende forbedringer venter de glade ejere af CrossFire-systemer baseret på to, tre og endda fire GPU'er. Det er logisk, at i tilstanden til at gengive en to-dimensionel grænseflade af operativsystemet, bør alle videokort undtagen det vigtigste slet ikke fungere? Men det er præcis sådan, de fungerer nu!

I tilfælde af CrossFire-systemer på videokort med ZeroCore-understøttelse i 2D-tilstand, sættes alle sekundære videokort i dyb dvale med minimalt strømforbrug og køleren deaktiveret. Denne tilstand fungerer for flere single-chip videokort og for dual-chip løsninger. Derudover vil det primære CrossFire-grafikkort også gå i denne tilstand i tilfælde af længere tids inaktivitet, konfigureret i Windows. Forskellen i drift ser således ud:

Teknologien er i øvrigt ikke så simpel, som den måske ser ud til. AMD-ingeniører skulle løse en masse problemer relateret til driften af ​​operativsystemet i inaktiv tilstand. For eksempel fandt de ud af, at Windows forsøger at opdatere oplysninger på skærmen, selv når skærmen er slukket. Hvilket naturligvis ikke tillader dig at deaktivere GPU'en overhovedet. Derfor måtte virksomhedens programmører tage en løsning og ignorere alle skærmtegningskommandoer, når skærmen er slukket i dvaletilstand.

AMD Eyefinity 2.0-teknologi

Naturligvis var der i den nye arkitektur også plads til forbedringer af den gennemprøvede teknologi til visning af billeder på flere skærme - AMD Eyefinity, nu i version 2.0. Den fik nye funktioner, højere opløsninger, understøttelse af flere skærme og øget fleksibilitet.

Denne teknologi er ret interessant, selvom meget få brugere vil finde plads i rummet og samle mod til at installere mere end to skærme i deres familie. Men det er bedre at have muligheden for altid at kunne bruge det end slet ikke at have det. Desuden er priserne for store diagonale skærme næsten ikke faldende, men mellemniveauløsninger bliver konstant billigere.

Faktisk er det nu mere rentabelt at købe tre skærme med en skærmdiagonal på 24″ end en 30-tommer. AMD giver netop et sådant eksempel, når en 30″ skærm med en opløsning på 2560×1600 koster mere end $1000, og tre 24″ FullHD kan købes til den halve pris:

Men hvordan du bruger dine penge og plads i rummet er en personlig sag for hver bruger. Det vigtigste er, at en sådan mulighed eksisterer. Derudover understøtter Eyefinity 2.0 nu billedoutput i HD3D stereotilstand - noget der manglede i tidligere løsninger, som var ringere end konkurrerende i denne parameter. Ved at kombinere AMD Eyefinity- og HD3D-teknologier er Radeon HD 7970-grafikkortet den første single-chip-løsning, der understøtter tre skærme, der fungerer i stereotilstand.

Stereo-gengivelse i høj opløsning kræver en meget hurtig datagrænseflade. Og med tidligere versioner af HDMI-udgange var mulighederne begrænset til 24 Hz per øje, hvilket er ganske nok til at se Blu-ray 3D-film, men klart for lavt for gamere.

Til sådanne opgaver begyndte de at bruge rammepakningsformatet, når rammerne til venstre og højre øje er kombineret til én, og AMD Radeon HD 7970 understøtter HDMI 1.4a rammepakningsformatet til stereobilledoutput. Dette er det første videokort, der understøtter 3 GHz HDMI med rammepakning, når hvert øje modtager et FullHD-billede med en frekvens på 60 Hz (120 Hz i alt):

Et andet interessant nyt produkt forekommer os at være den Discrete Digital Multi-Point Audio (DDMA) multi-channel audio output teknologi, der arbejder sammen med Eyefinity. Alle tidligere GPU'er er i stand til kun at udsende én lydstrøm via HDMI og DisplayPort. Det vil sige, at selvom tre skærme placeret i forskellige rum er tilsluttet pc'en via HDMI, transmitteres kun én lydkanal. Men AMD Radeon HD 7900 modtog understøttelse af samtidig output af flere uafhængige lydkanaler, hvilket meget vel kan være nyttigt i nogle multi-monitor konfigurationer.

Den samme funktion vil være meget nyttig til brug i videokonferencer med visning af flere samtalepartnere på separate skærme, såvel som multitasking-applikationer som at spille på tre skærme med spillyd og se nyheder på en separat skærm med en uafhængig lydstrøm. Tidligere var det nødvendigt at bruge flere separate lydsystemer til alt dette, men nu fungerer alt så bekvemt som muligt.

Eyefinity-softwaresupport er heller ikke blevet glemt; teknologien opdateres næsten hver måned - nye muligheder dukker op. Så tilbage i oktober dukkede understøttelse af opløsninger op til 16384x16384 og nye multi-monitor-konfigurationer op: vandret og lodret 5x1, samt baseret på seks skærme i 3x2-tilstand.

December-opdateringen til AMD Catalyst-videodriveren gjorde det muligt at arbejde sammen mellem Eyefinity og HD3D, og ​​i februar lover de support til brugerdefinerede opløsninger, indstillinger for proceslinjeplacering og forbedret forudindstillet styring.

Output til seks skærme kan opnås ved at bruge to DisplayPort 1.2-porte og to MST-hubs (som vi skrev om tidligere), mens tre eller endda fire skærme kun kræver én port og den tilsvarende hub. Sådanne hubs tillader fleksibel konfiguration af billedoutputsystemet; de understøtter op til fire FullHD-enheder pr. DisplayPort 1.2-stik og skulle være tilgængelige til salg i sommeren 2012.

Apropos opløsning. Høj opløsning eller endda ultrahøj - Ultra High Resolution. Nuværende enheder med en opløsning på 4000 pixels på den større side kræver tilslutning ved hjælp af flere kabler på én gang: to DP 1.1 eller fire DVI. Skærme med denne opløsning af næste generation vil kun blive forbundet via ét kabel: DP 1.2 HBR2 eller HDMI 1.4a 3 GHz. Og det nye videokort fra AMD er allerede klar til sådanne skærme, igen blev det det første i verden.

Videokodning og afkodning

Det er helt naturligt, at AMD Radeon HD 7970 indeholder den samme UVD-enhed til afkodning af videodata, som dukkede op i den tidligere generation af virksomhedens videochips. Den behøver ganske enkelt ingen modifikationer, den understøtter multi-stream MVC codec, afkodning MPEG-2/MPEG-4 (DivX), VC-1 og H.264 formater, samt afkodning af to FullHD streams i alle understøttede formater.

AMD-løsninger giver maksimal kvalitet af videostream-afkodning, bruger flere dusin specielle kvalitetsforbedringsalgoritmer og giver maksimale resultater i kvalitetstests som HQV. Blandt de understøttede funktioner bemærker vi: farve- og tonejustering, støjreduktion, skarphed, højkvalitets skalering, dynamisk kontrast, avanceret deinterlacing og omvendt telecine. Her er et eksempel på forbedring af kontrasten i farten:

Men afkodning på alle videochips har været mere eller mindre i orden i lang tid. Alle nye GPU'er giver anstændig kvalitet og ydeevne, når du ser videodata. Men videokodning på GPU'en er stadig i sin vorden, og de vigtigste klager fra brugere er rettet mod den lave kvalitet af det resulterende komprimerede billede.

Måske kan den nye Radeon HD 7000-serie hjælpe med dette, fordi alle GPU'er i serien inkluderer en Video Codec Engine (VCE) videokodningsenhed. Radeon HD 7970-modellen blev det første videokort til at understøtte hardware-accelereret videokodning og komprimering ved hjælp af en specialiseret enhed (tidligere deltog stream-processorer i kodningen).

Kvalitet og ydeevne skulle være klart bedre end før, med understøttelse af 1080p-kodning med 60 billeder i sekundet, og endda hurtigere end i realtid. Det er svært at sige noget om kvalitet uden test, men vi er lovet forskellige niveauer af encoder-optimering til videodata og spil, samt variabel komprimeringskvalitet (muligheden til at vælge mellem at øge kvalitet eller ydeevne).

Der er i øjeblikket ingen steder at prøve VCE - der er simpelthen ingen applikationer, der understøtter det, men AMD samarbejder med partnere som ArcSoft om at yde support til VCE i deres respektive softwareprodukter. I fremtiden planlægger vi at frigive et softwarebibliotek for at accelerere videokodning, hvilket vil gøre det lettere for udviklere at understøtte næste generation af AMD-produkter.

Kodning kan udføres i to tilstande: fuld og hybrid (ved at bruge funktionerne fra GPU-streamprocessorer). Fuld tilstand er designet til opgaver, der kræver maksimal energieffektivitet og ensartede ydeevneniveauer. Fuld tilstandskodning på VCE er hurtigere end realtid og giver lav latenstid. Men der er også en hybridtilstand:

I denne tilstand fungerer GPU matematiske blokke også sammen med VCE. Alle de meget paralleliserbare trin, som er skitseret med gult i diagrammet, kan udnytte kraften fra GCN-beregningsenheder, mens en dedikeret VCE-enhed håndterer effektiv hardwareentropi-kodning. Denne tilstand er velegnet til videokort med stor matematisk kraft, såsom Radeon HD 7970. Der er stadig spørgsmål om kvaliteten af ​​disse to tilstande, men dette kræver omhyggelig analyse i en separat artikel.

AMD Steady Video

Udover indkodning og afkodning af videodata er der et andet område, hvor kraften fra ny grafik fra AMD kan bruges – forbedring af videoer af dårlig kvalitet, der er taget håndholdt, uden brug af stativ eller andre lignende billedstabiliseringsmidler. Videostabiliseringsteknologien hedder AMD Steady Video, og dens anden version er allerede blevet frigivet.

Betjeningsalgoritmen for softwarestabilisatoren er ret enkel: baseret på videostrømmen indsamles statistikker om kamerabevægelse (skift, rotation, zoom), og denne bevægelse kompenseres i det aktuelle billede i forhold til de foregående - billedet forskydes , roteret og skaleret, så billedet ikke hopper meget og forbliver stabilt.

Så simpelt det end lyder, er det lige så svært at implementere. Simpelthen fordi der er to millioner pixels på skærmen, og op til 30 eller endda 60 billeder i sekundet. Forestil dig, hvor mange beregninger der skal laves for at spore alle mulige billedforskydninger. Vi har allerede skrevet ovenfor om QSAD-funktionen, der bruges i videobehandling; den bruges også i Steady Video 2.0 for at fremskynde algoritmen til bevægelsesdetektering. Så GPU'en skal behandle tilfældige skift med en amplitude på op til 32 pixels i enhver retning, og dette kræver ydeevne svarende til mere end 500 milliarder SAD-operationer i sekundet (for 1920x1080 ved 60 FPS).

På grund af understøttelsen af ​​nye QSAD-instruktioner i Radeon HD 7970, overstiger dens fordel i forhold til kraftfulde CPU'er i algoritmen til bevægelsesdetektering 10x! Det vil sige, at vi nu bliver forsynet med video i høj kvalitet, og ikke kun når vi behandler hjemmevideoer i videoredigering, men også når vi ser andres online videoer, optaget med hvem ved hvad og hvem ved hvordan.

Detaljer: Radeon HD 7800-serien

  • Chipkodenavn: "Pitcairn"
  • Fremstillingsteknologi: 28 nm
  • 2,8 milliarder transistorer (lidt mere end Cayman, som er grundlaget for Radeon HD 6900-serien)
  • En samlet arkitektur med en række fælles processorer til strømbehandling af adskillige typer data: hjørner, pixels osv.
  • Hardwareunderstøttelse til DirectX 11.1, inklusive Shader Model 5.0
  • 256-bit hukommelsesbus: fire 64-bit brede controllere, der understøtter GDDR5-hukommelse
  • Kernefrekvens: op til 1000 MHz (til Radeon HD 7870)
  • 20 GCN-beregningsenheder, inklusive 80 SIMD-kerner, bestående af i alt 1280 ALU'er til flydende kommaberegninger (heltals- og flydende formater, understøttelse af FP32- og FP64-præcision inden for IEEE 754-standarden)
  • 80 teksturenheder, med understøttelse af trilineær og anisotropisk filtrering for alle teksturformater
  • 32 ROP-enheder med understøttelse af anti-aliasing-tilstande med programmerbar sampling af mere end 16 samples pr. pixel, inklusive med FP16- eller FP32-rammebufferformat. Maksimal ydeevne op til 32 samples pr. ur, og kun i Z-tilstand - 128 samples pr. ur

Radeon HD 7870 grafikkort specifikationer

  • Kernefrekvens: 1000 MHz
  • Antal universelle processorer: 1280
  • Antal teksturblokke: 80, blandingsblokke: 32
  • Hukommelsestype: GDDR5
  • Hukommelseskapacitet: 2 gigabyte
  • Teoretisk maksimal fyldningshastighed: 32,0 gigapixel per sekund.
  • Teoretisk tekstur samplingshastighed: 80,0 gigatexels pr. sekund.
  • Ét CrossFire stik
  • PCI Express 3.0 bus
  • Stik: DVI Dual Link, HDMI 1.4, to Mini-DisplayPort 1.2
  • Strømforbrug: fra 3 til 175 W
  • To 6-bens strømstik
  • Dobbelt slot design
  • Vejledende pris for det amerikanske marked: $349

Radeon HD 7850 grafikkort specifikationer

  • Kerne ur: 860 MHz
  • Antal universelle processorer: 1024
  • Antal teksturblokke: 64, blandingsblokke: 32
  • Effektiv hukommelsesfrekvens: 4800 MHz (4x1200 MHz)
  • Hukommelsestype: GDDR5
  • Hukommelseskapacitet: 2 gigabyte
  • Hukommelsesbåndbredde: 153,6 gigabyte i sekundet.
  • Teoretisk maksimal fyldningshastighed: 27,5 gigapixel i sekundet.
  • Teoretisk tekstur samplingshastighed: 55,0 gigatexels pr. sekund.
  • Ét CrossFire stik
  • PCI Express 3.0 bus
  • Stik: DVI Dual Link, HDMI 1.4, to Mini-DisplayPort 1.2
  • Strømforbrug: fra 3 til 130 W
  • Dobbelt slot design
  • US MSRP: $249

Og denne gang blev princippet om at navngive virksomhedens produkter ikke ændret, og tendenserne i den tidligere serie blev fortsat. Mid-budget-serien af ​​videokort baseret på GCN-arkitekturen adskiller sig fra top- og budgetlinjerne med det andet ciffer i indekset: i stedet for 7 og 9 sættes tallet 8, hvilket er ret logisk. Da AMD tog den psykologiske tærskel på 1000 MHz for GPU-frekvensen, modtog Radeon HD 7870 tilføjelsen "GHz Edition" til navnet, hvilket indikerer, at denne frekvens blev taget.

Af navnet fremgår det tydeligt, at Radeon HD 7800 er mere produktiv end HD 7700, men har en lavere hastighed sammenlignet med de ældre modeller - HD 7900. Hvad angår sammenligning med NVIDIA-løsninger, var den ældre udgivne model HD 7870 på det tidspunkt af udgivelsen konkurrerer med GeForce GTX-skærmkortet 570, og det yngre er rettet mod at bekæmpe GTX 560 Ti, og NVIDIA har endnu ikke udgivet nye 28 nm mid-range chips.

Begge modeller af AMD-skærmkort har GDDR5-hukommelse med samme kapacitet på 2 gigabyte. De bruger begge en 256-bit hukommelsesbus og kan derfor konfigureres med 1, 2 eller 4 GB. 1 GB er for lidt, og 4 GB er for dyrt til dette prissegment. Derfor kan vi sige, at det ideelle volumen på 2 GB videohukommelse blev valgt, ganske tilstrækkeligt til langt de fleste spil, selv i høje opløsninger, og ikke for dyrt med hensyn til omkostninger.

Fra et forbrugersynspunkt er HD 7850- og HD 7870-modellerne ellers stadig forskellige. Den ældre Radeon HD 7870 har et højere strømforbrug, så den har brug for to ekstra 6-bens strømstik, mens HD 7850 nøjes med kun et af dem. Begge boards har et dobbelt-slot kølesystem design, men de fleste producenter producerer boards med deres eget design til mindst en køler eller endda et printkort.

Arkitektoniske træk ved Radeon HD 7800-familien

Ovenfor i teksten har vi omhyggeligt beskrevet alle funktionerne i den nye Graphics Core Next (GCN) arkitektur, så vi vil kun gentage de vigtigste. Alle virksomhedens nye GPU'er tilbyder fremragende muligheder og ydeevne, ikke kun inden for grafikbehandling, men også inden for ikke-grafisk databehandling, herunder en blanding af forskellige typer beregninger. Den nye GCN-arkitektur tilbyder også en betydelig forenkling af kodeoptimeringsopgaver, forenklet udvikling og support samt stabil og forudsigelig ydeevne og generelt ret høj effektivitet.

Grundblokken i den nye arkitektur er GCN-blokken, og alle Southern Islands-seriens GPU'er er samlet ud fra dem. Overvej blokdiagrammet for Pitcairn-chippen:

Diagrammet viser Radeon HD 7870-grafikprocessoren (den "forenklede" HD 7850 adskiller sig fra den i flere deaktiverede enheder); vi ser 20 computerenheder af GCN-arkitekturen. I tilfældet med juniorløsningen i Radeon HD 7800-serien var fire af dem deaktiveret, og antallet af aktive blokke i den er 16. Dette svarer til henholdsvis 1280 og 1024 stream-processorer (præcis som i tilfældet med HD'en) 7700 familie, kun der er præcis dobbelt så mange blokke). Da hver GCN-blok indeholder fire teksturenheder, er det endelige antal TMU'er for den ældre model 80 TMU'er, og for den yngre - 64 TMU'er.

Men antallet af ROP-enheder og hukommelsescontrollere i HD 7870 og HD 7850 er også det samme, som i løsningerne i den yngste linje. Antallet af ROP-blokke blev efterladt ret højt - 32 styk for begge modeller. Hukommelsesbussen på Pitcairn-baserede kort er reduceret til 256-bit; den er samlet fra fire 64-bit-kanaler. Det er ikke dårligt for en løsning på dette niveau, selvom det er halvanden gang mindre end i toplinjen, fordi hukommelsesbussen traditionelt er det første, der skal skæres. Det er godt, at brugen af ​​hurtig GDDR5-hukommelse gav en relativt høj båndbredde på 153 GB/s.

Ligesom andre GCN-arkitekturchips inkorporerer Pitcairn en 9. generations tessellator-enhed, som har adskillige buffer- og caching-optimeringer for markant at forbedre geometribehandlingsydelsen. Her er en sammenligning af det nye AMD-kort med den forrige generations løsning i et syntetisk problem, hvilket tyder på en stigning i tessellationshastighed på op til fire gange:

Ligeledes understøttes mange AMD-teknologier, som blev introduceret og forbedret i de nye videochips i Radeon HD 7000-linjen. Her er en ufuldstændig liste: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, forbedringer i kvaliteten af ​​teksturfiltrering , etc. Alt dette er skrevet mere detaljeret ovenfor. Lad os tilføje til listen, at Radeon HD 7800 fuldt ud understøtter både den forbedrede anti-aliasing-algoritme MLAA 2.0 og super-sampling anti-aliasing (SSAA).

Når det kommer til at sammenligne spilydelse, er Radeon HD 7870 betydeligt hurtigere end sin direkte konkurrent, GeForce GTX 570, især i betragtning af manglen på 1,25 GB videohukommelse i sidstnævnte (sammenlignet med 2 GB i de undersøgte løsninger). observeret i moderne spil ved høje gengivelsesopløsninger. Den yngre Radeon HD 7850 kan sammenlignes med GeForce GTX 560 Ti, og her kan den ikke længere prale af hukommelseskapacitet. Ifølge AMDs målinger er deres nye løsning dog stadig hurtigere end konkurrenten i de fleste spil.

Detaljer: Radeon HD 7700-serien

  • Chipkodenavn: "Kap Verde"
  • Fremstillingsteknologi: 28 nm
  • 1,5 milliarder transistorer (mindre end Barts, som er grundlaget for Radeon HD 6800-serien)
  • En samlet arkitektur med en række fælles processorer til strømbehandling af adskillige typer data: hjørner, pixels osv.
  • Hardwareunderstøttelse til DirectX 11.1, inklusive Shader Model 5.0
  • Kernefrekvens: op til 1000 MHz (til Radeon HD 7770)
  • 10 GCN-beregningsenheder, inklusive 40 SIMD-kerner, bestående af i alt 640 flydende ALU'er (heltals- og flydende kommaformater, understøttelse af FP32- og FP64-præcision inden for IEEE 754-standarden)
  • 40 teksturenheder, med understøttelse af trilineær og anisotropisk filtrering for alle teksturformater
  • Integreret understøttelse af op til seks skærme, inklusive HDMI 1.4a og DisplayPort 1.2

Radeon HD 7770 grafikkort specifikationer

  • Kernefrekvens: 1000 MHz
  • Antal universelle processorer: 640
  • Antal teksturblokke: 40, blandingsblokke: 16
  • Hukommelsestype: GDDR5
  • Hukommelseskapacitet: 1 gigabyte
  • Teoretisk tekstursamplinghastighed: 40,0 gigatexels pr. sekund.
  • Ét CrossFire stik
  • PCI Express 3.0 bus
  • Stik: DVI Dual Link, HDMI 1.4, to Mini-DisplayPort 1.2
  • Strømforbrug: fra 3 til 80 W
  • Et 6-benet strømstik
  • Dobbelt slot design
  • Vejledende pris for det amerikanske marked: $159

Radeon HD 7750 grafikkort specifikationer

  • Kernefrekvens: 800 MHz
  • Antal universelle processorer: 512
  • Antal teksturblokke: 32, blandingsblokke: 16
  • Effektiv hukommelsesfrekvens: 4500 MHz (4x1125 MHz)
  • Hukommelsestype: GDDR5
  • Hukommelseskapacitet: 1 gigabyte
  • Hukommelsesbåndbredde: 72 gigabyte i sekundet.
  • Teoretisk maksimal fyldhastighed: 12,8 gigapixel pr. sekund.
  • Teoretisk tekstursamplinghastighed: 25,6 gigatexels pr. sekund.
  • PCI Express 3.0 bus
  • Stik: DVI Dual Link, HDMI 1.4, en DisplayPort 1.2
  • Strømforbrug: fra 3 til 55 W
  • Kræver ikke ekstra strøm
  • Enkelt slot design
  • Vejledende pris for det amerikanske marked: $109

En billig serie af videokort baseret på GCN-arkitekturen adskiller sig fra de øverste og mellemste linje med det andet ciffer i indekset: tallet 9 er optaget af tallet 7, som det var tilfældet før. Radeon HD 7770 er en mere produktiv løsning, men der er også en yngre model - HD 7750. Det ældre board på tidspunktet for udgivelsen havde ingen direkte konkurrenter på markedet, placeret et sted mellem GeForce GTX 560 og GTX 550 Ti , og den yngre er rettet mod at bekæmpe GTX 550 Ti. Til HD 7770 blev der senere annonceret en konkurrent i form af GeForce GTX 560 SE (alle NVIDIA-løsninger er baseret på ældre GPU'er).

Begge modeller af AMD-videokort under overvejelse har GDDR5-hukommelse med samme kapacitet på 1 gigabyte. På grund af brugen af ​​en 128-bit hukommelsesbus kunne de udstyres med 2 GB, men en sådan mængde GDDR5-hukommelse ville være for dyr i forhold til deres prissegment. Derfor er der indtil videre udgivet modeller med denne volumen, selvom det i fremtiden er muligt, at varianter med 2 GB videohukommelse vil blive frigivet. Indtil videre besluttede de at overlade denne kapacitet til HD 7800.

Med hensyn til andre forbrugeregenskaber er HD 7750 og HD 7770 modellerne ret forskellige. Hvis den ældre Radeon HD 7770 har et to-slots kølesystemdesign, og dens køler er dækket af et plastikhus ligesom ældre løsninger, så ser den yngre HD 7750 mærkbart enklere ud, idet den optager én plads og har en simpel køler. De fleste producenter producerer dog stadig plader med deres egne designs. Strømforbruget på nye modeller i denne prisklasse er også anderledes, den ældre har et 6-benet ekstra strømstik, og den yngre bruger strøm modtaget via PCI Express.

Arkitektoniske træk ved Radeon HD 7700

Grundblokken i den nye arkitektur er GCN-blokken, og alle GPU'er i serien er samlet ud fra dem. Hver af de tilgængelige GCN-blokke er i stand til selv at planlægge og distribuere kommandoer, og en computerblok kan udføre op til 32 uafhængige kommandotråde. Lad os se på blokdiagrammet af Kap Verde-chippen:

Diagrammet viser Radeon HD 7770-grafikprocessoren (den "strippede" HD 7750 har flere deaktiverede enheder); vi ser 10 computerenheder af GCN-arkitekturen. I tilfældet med juniorløsningen i Radeon HD 7700-serien blev det besluttet at deaktivere to af dem, og antallet af blokke blev 8. Det svarer til 640 og 512 stream-processorer. Og da hver GCN-blok indeholder 4 teksturenheder, er det endelige antal TMU'er for den ældre model 40 TMU'er, og for den yngre - 32 TMU'er.

Antallet af ROP-enheder og hukommelsescontrollere i HD 7770 og HD 7750 er ikke anderledes, og de besluttede ikke at skære ROP'en for meget ned, hvilket efterlod 16 af dem hver. Men Kap Verdes hukommelsesbus er skåret til 128-bit, som er samlet fra to 64-bit kanaler. Generelt er det tre gange mindre end i topserien, og vi så endnu en bekræftelse på, at memorybussen traditionelt er det første, der bliver skåret i billige chips. Selvom brugen af ​​hurtig GDDR5-hukommelse gjorde det muligt at opretholde en relativt høj (for så billige løsninger) båndbredde på 72 GB/s.

Det eneste, der er tilbage for os at bemærke, er den ret store mængde af second-level cache - hele 512 kilobyte (sammenlign med 768 KB for den øverste chip - tilsyneladende fylder L2 cachen ikke for meget på chippen), da samt forbedringer i geometrisk ydeevne. Ligesom top-end-chippen har Kap Verde en 9. generations tessellator med adskillige buffer- og caching-optimeringer for at forbedre geometribehandlingsydelsen betydeligt sammenlignet med Radeon HD 6000-serien.

Generelt vil vi ikke gentage alle oplysninger om AMD-teknologier, der er blevet introduceret og forbedret i de nye videochips i Radeon HD 7000-linjen (her er en ufuldstændig liste: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, forbedringer i kvaliteten af ​​teksturfiltrering osv. .p.), er alt dette skrevet i detaljer ovenfor. HD 7700-serien understøtter alle de funktioner, der er anført der, inklusive AMD Eyefinity 2.0 med seks skærme og stereogengivelse, og har også en forbedret videoafkodnings- og kodningsenhed.

Men hvad med det vigtigste - spilydelse? De første estimater af gengivelseshastighed kan altid foretages ud fra producentens præsentationer. AMD mener, at Radeon HD 7770 er placeret et sted midt mellem henholdsvis GeForce GTX 560 og GeForce GTX 550 Ti, og sammenligner det i sine materialer med konkurrentens anden model.

Men de sammenligner ikke Radeon HD 7750 med noget, blot bemærker, at de fleste moderne spil kan spilles på denne model ved maksimale indstillinger i FullHD-opløsning. Dette er dog ikke overraskende, da der i de seneste år praktisk talt ikke har været nogen pc-eksklusivitet, og multi-platform spil er meget mindre krævende. Så Radeon HD 7700-seriens boards er perfekte til krævende brugere.

Detaljer: Radeon HD 7790 model

  • Chipkodenavn: "Bonaire"
  • Fremstillingsteknologi: 28 nm
  • 2,08 milliarder transistorer (mere end Kap Verde i Radeon HD 7700, men mindre end Pitcairn i Radeon HD 7800)
  • En samlet arkitektur med en række fælles processorer til strømbehandling af adskillige typer data: hjørner, pixels osv.
  • Hardwareunderstøttelse til DirectX 11.1, inklusive Shader Model 5.0
  • 128-bit hukommelsesbus: to 64-bit brede controllere, der understøtter GDDR5-hukommelse
  • Kernefrekvens: 1000 MHz
  • 14 GCN-beregningsenheder, inklusive 56 SIMD-kerner, bestående af i alt 896 flydende ALU'er (heltals- og flydende kommaformater, understøttelse af FP32- og FP64-præcision inden for IEEE 754-standarden)
  • 56 teksturenheder, med understøttelse af trilineær og anisotropisk filtrering for alle teksturformater
  • 16 ROP-blokke med understøttelse af antialiasing-tilstande med mulighed for programmerbart at sample mere end 16 samples pr. pixel, inklusive med FP16- eller FP32-rammebufferformat. Maksimal ydeevne op til 16 samples pr. ur, og kun i Z-tilstand - 64 samples pr. ur

Radeon HD 7790 grafikkort specifikationer

  • Kernefrekvens: 1000 MHz
  • Antal universelle processorer: 896
  • Antal teksturblokke: 56, blandingsblokke: 16
  • Hukommelsestype: GDDR5
  • Hukommelseskapacitet: 1 gigabyte
  • Hukommelsesbåndbredde: 96 gigabyte i sekundet.
  • Teoretisk maksimal fyldningshastighed: 16,0 gigapixel pr. sekund.
  • Teoretisk tekstursamplinghastighed: 56,0 gigatexels pr. sekund.
  • Ét CrossFire stik
  • PCI Express 3.0 bus
  • Stik: DVI Dual Link, HDMI 1.4, to Mini-DisplayPort 1.2
  • Strømforbrug: fra 3 til 85 W
  • Et 6-benet strømstik
  • Dobbelt slot design
  • amerikansk vejledende pris: $149

Den billige videokortmodel, baseret på en ny mid-budget-chip, adskiller sig fra den tidligere topmodel af HD 7700-underfamilien med det tredje ciffer i indekset: i stedet for 7 sætter de tallet 9, hvilket indikerer en stigning i ydeevnen . Samtidig indikerer Radeon HD 7790-indekset tydeligt, at der er tale om et mindre kraftfuldt videokort sammenlignet med linjen et trin højere - HD 7800.

Alt er dog heller ikke så simpelt her – den kan bestemt konkurrere med den yngre HD 7850. Men den vejledende pris på Radeon HD 7790 er sat til $149, det vil sige cirka midt mellem priserne på HD 7770 og HD 7850. Hvad angår løsningerne fra en konkurrent fra samme prissegment, udgivelsen af ​​HD 7790 var tydeligvis beregnet til at have noget at kæmpe med NVIDIA GeForce GTX 650 Ti, baseret på GK106 chippen, som er placeret præcis mellem HD 7770 og HD 7850 i pris og hastighed. Men NVIDIA reagerede øjeblikkeligt på udgivelsen af ​​det nye board fra AMD, og ​​frigav til markedet en overclocket version af GeForce GTX 650 Ti Boost, som har større ydeevne.

Denne AMD-skærmkortmodel har GDDR5-hukommelse med en kapacitet på kun 1 gigabyte. GPU'en har en 128-bit hukommelsesbus, og teoretisk ville det være muligt at levere 2 GB, men denne mængde hurtig GDDR5 hukommelse er stadig for dyr til dette prissegment, og AMD udgav en model med en mindre kapacitet, selvom den evt. ikke være nok til nogle moderne spil, selv ved ikke de højeste indstillinger og opløsning. Det er dog muligt at frigive videokort fra partnere med 2 GB videohukommelse.

Ligesom modellerne ved siden af ​​i rækken, har Radeon HD 7790 et kølesystem med dobbelt slot, som er dækket af et plastikhus. Selvom de fleste producenter stadig udgiver bundkort med deres eget kølerdesign, så er referencen ikke så vigtig. Interessant nok er strømforbruget på den nye model ikke steget for meget sammenlignet med HD 7770, men forbedringen i energieffektiviteten var forventet. Det er i øvrigt derfor, at det nye produkt også kun har et 6-benet ekstra strømstik.

Arkitektoniske træk

Den nye Bonaire-grafikprocessor, som den frigivne Radeon HD 7790-model er baseret på, tilhører den samme Graphics Core Next (GCN)-arkitektur, som vi har været bekendt med i halvandet år, men AMD kalder den GCN 1.1, hvilket antyder små ændringer. Faktisk er chippen praktisk talt ikke anderledes arkitektonisk fra de tidligere, selvom der faktisk er nogle mindre ændringer. For eksempel introducerede den nye arkitektur instruktioner, der er nyttige til heterogen systemarkitektur (HSA), understøttelse af et større antal samtidigt udførte tråde, samt en ny version af AMD PowerTune-teknologi, som vi vil tale om senere. Men alle disse ændringer kan ikke kaldes væsentlige, fordi der ikke er noget nyt i de grundlæggende blokke og forbedre deres effektivitet.

Derfor kan du roligt henvise til, som nøje beskriver alle funktionerne i den nye Graphics Core Next (GCN) arkitektur, og her vil vi kun gentage de vigtigste egenskaber og funktioner ved et bestemt produkt. Alle AMDs seneste GPU'er tilbyder fremragende muligheder og ydeevne inden for både grafik og ikke-grafik, og en blanding af de to. Den nye GCN-arkitektur har også i høj grad forenklet optimerings- og softwareudviklingsopgaver og samtidig bevaret høj effektivitet.

Som du ved, er grundblokken i arkitekturen GCN-blokken, hvorfra alle Southern Islands-seriens grafikprocessorer er samlet. GCN-beregningsblokken er opdelt i underafsnit, som hver arbejder på sit eget kommandoflow. GCN-blokke har 64 KB dedikeret lokal datalagring til udveksling af data eller udvidelse af den lokale registerstak. Blokken har også en cache på første niveau med læse-skrivefunktioner og en fuldgyldig teksturpipeline med samplings- og filtreringsenheder. Hver af de eksisterende GCN-blokke er i stand til selv at planlægge og distribuere kommandoer, og en computerblok kan udføre flere uafhængige kommandostrømme. Lad os se på blokdiagrammet for den nye chip:

Bonaires design bekræfter den nye løsnings mål om at tilbyde ydeevne mellem Kap Verde, som har 10 GCN-beregningsenheder, og Pitcairn med sine 20 GCN-enheder. Disse to GPU'er, der blev udgivet i 2012, er næsten nøjagtigt halvt så store som hinanden, hvilket efterlader et ret stort ydeevnehul i midten, som Bonaire nu har udfyldt.

Diagrammet viser en grafikprocessor i form af en Radeon HD 7790, som er en komplet løsning uden at skære nogle blokke ned. Chippen omfatter 14 computerenheder af GCN-arkitekturen, hvilket svarer til 896 stream-processorer. Da hver GCN-blok indeholder 4 teksturenheder, er det endelige antal TMU'er for den nye model 56 TMU'er. Det vil sige, at Bonaire er nøjagtigt 1,4 gange hurtigere end Kap Verde-chippen med hensyn til hastigheden af ​​matematiske beregninger og teksturhentninger, forudsat at der antages ens frekvenser.

Men antallet af ROP-enheder og hukommelsescontrollere i Bonaire og Radeon HD 7790 svarer til, hvad vi så i Kap Verde og Radeon HD 7770 - de besluttede at forlade 16 ROP-enheder, og hukommelsesbussen på den nye chip er 128-bit, samlet fra to 64-bit kanaler. Det lille antal ROP-blokke kan være løsningens "akilleshæl", da brugen af ​​hurtig GDDR5-hukommelse gjorde det muligt at levere en relativt høj gennemstrømning på 96 GB/s, men der kan ikke gøres noget ved ROP-ydelsen.

Men den nye GPU har forbedringer i geometrisk ydeevne og tessellationshastighed. Ja, Kap Verde har også en 9. generation tessellator, men Bonaire fordoblede også antallet af geometriske blokke, rasterizere og kommandoprocessorer (angivet som ACE'er i diagrammet) - nu er der to af dem alle. Denne forbedring giver Bonaire mulighed for at behandle op til to geometriske primitiver pr. urcyklus - ligesom de mere kraftfulde Pitcairn og Tahiti.

Som du husker, var det i Radeon HD 7770, at AMD først nåede den vigtige psykologiske milepæl med GPU-clockfrekvensen på 1 GHz. Så HD 7790 har også nøjagtig samme referencefrekvens på 1 GHz, så stigningen i ydeevnen i forhold til HD 7770 vil udelukkende være begrundet i arkitektoniske ændringer og en stigning i antallet af udførelsesenheder.

Men videohukommelsens driftsfrekvens for det nye produkt er meget højere. Hvis HD 7770 havde en relativt lav hukommelsesfrekvens på 4,5 GHz, så er HD 7790 udstyret med hurtig GDDR5-hukommelse, der opererer på 6 GHz, hvilket giver en tredjedel mere båndbredde. Videohukommelsesbåndbredden steg med 33 % sammenlignet med modeller af Radeon HD 7700-underfamilien førte til en klar stigning i spilydelsen. AMD leverer dette diagram, der sammenligner billedhastigheder på HD 7790 med hukommelse, der kører på 4,5 og 6,0 GHz:

Den maksimale acceleration fra en stigning i hukommelsesbåndbredde blev opnået i spil som StarCraft II og Crysis 2. Og i gennemsnit giver en stigning på 33 % i hukommelsesbåndbredde et sted omkring en 10 % stigning i den gennemsnitlige billedhastighed i et sæt moderne spil . Dette er en god indikator, der viser, at hukommelsesbåndbredde er ret vigtig i dag, selvom det ikke er det eneste fokus på produktivitet. Selvom det er meget muligt, at med mere ROP ville Bonaires hastighed være endnu højere...

Det er tydeligt, at det gennemsnitlige strømforbrug er steget en smule sammenlignet med HD 7770. Hvis denne værdi for den gamle model er 80 W, så er den for HD 7790 85 W - dette er en meget lille pris at betale for en teoretisk ydelsesforøgelse på 33-40%! Arkitektoniske forbedringer (PowerTune), design af en ny GPU ved hjælp af erfaringer fra tidligere, samt løbende forbedring af den tekniske proces hos TSMC - alt dette førte til en lille stigning i forbruget med en væsentlig forbedring af hastighedskarakteristika.

Hvad angår chipområdet og antallet af transistorer på Bonaire, er den nye chip klart større end Kap Verde, men tilføjelsen af ​​beregnings-, tekstur- og geometrienheder kunne ikke gå ubemærket hen. Ifølge disse parametre ligger Bonaire også cirka midt mellem Kap Verde og Pitcairn. Bonaire indeholder 2,08 milliarder transistorer i en 160 mm 2 chip, for Kap Verde er disse tal henholdsvis 1,5 milliarder og 123 mm 2, og for Pitcairn - 2,8 milliarder transistorer og 212 mm 2 chipareal.

Naturligvis understøtter den nye chip alle AMD-teknologier, der blev introduceret og forbedret i den nye Radeon HD 7000-familie (en ufuldstændig liste: PowerTune, ZeroCore, Eyefinity, HD3D, Steady Video, forbedret teksturfiltreringskvalitet osv.), både alt dette er skrevet i detaljer i artiklen AMD Radeon HD 7970: The New Single-Processor Leader. HD 7790 understøtter alle de funktioner, der er angivet der, inklusive AMD Eyefinity 2.0 med seks skærme og stereogengivelse, og har også en forbedret videoafkodnings- og kodningsenhed.

Forbedret PowerTune-teknologi

Tilbage i 2010 introducerede AMD PowerTune-teknologi i sin Cayman-chip (AMD Radeon HD 6900-serien). Denne GPU var den første med dynamisk strømstyring, kaldet PowerTune. Det tillod højere maksimale clockhastigheder til typiske applikationer, mens man undgik for meget strømforbrug i specialiserede stabilitetstest som FurMark. Derefter blev teknologien anvendt på dual-chip AMD Radeon HD 6990-modellen, som havde brug for det endnu mere af indlysende årsager.

Teknologien fik en seriøs opdatering i midten af ​​2012, da automatisk frekvensforøgelse – Boost – blev tilføjet til AMD PowerTune. I AMD Radeon HD 7970 GHz Edition gjorde denne algoritme det muligt at forbedre ydeevnen yderligere sammenlignet med den almindelige version af videokortet. PowerTune-driftsalgoritmen i videokort uden automatisk overclocking bruger tre tilstande: tomgang, lav-3D og fuld hastighed. HD 7970 GHz tilføjede også en Boost-overclocking-tilstand. PowerTune tjener til at holde sig inden for det krævede forbrug og skifter til en lavere belastningstilstand, når det er nødvendigt. I dette tilfælde reducerer teknologien clockfrekvensen kraftigt. I praksis er sådanne spring sjældne - på grund af det store mellemrum mellem de to aktive tilstande.

Reduktion af GPU-clockhastigheden reducerer strømforbruget, men for mere effektiv kontrol skal du også reducere spændingen. Det er præcis, hvad Radeon HD 7790. Den nye Bonaire-grafikchip har otte tilstande med forskellige frekvenser og spændinger, hvilket giver dig mulighed for at opnå højere clock-hastigheder end tidligere, mens GPU'en altid kører på den optimale spænding og frekvens. Skift mellem tilstande er baseret på GPU-belastning samt videochippens aktuelle energiforbrug.

I den nye algoritme skal PowerTune ikke skarpt nulstille frekvensen, når forbrugsniveauet overskrides, og sammen med frekvensen falder spændingen også. Overgange mellem tilstande skal være så hurtige som muligt for ikke at overskride forbrugsgrænsen selv i kort tid, så Bonaire skifter PowerTune-tilstande hver 10. ms, det vil sige, at chippens tilstand ændres 100 gange hvert sekund.

Med en sådan konstant ændring i frekvenser vil tredjepartsapplikationer som MSI Afterburner og GPU-Z ikke vise øjeblikkelige clockhastighedsværdier, men gennemsnitlige værdier over en vis tidsperiode - den såkaldte "effektive" frekvens. En anden interessant udvikling er, at AMD åbner op for nye PowerTune-indstillinger til tredjepartsapplikationer. Partnere kan også indstille deres egne PowerTune-indstillinger, hvilket vil hjælpe med at skabe fabriksoverclockede videokortmodeller og give flere muligheder, der ikke er begrænset af AMD-referenceværdier. Sandt nok kan forskellige PowerTune-indstillinger føre til, at videokort af samme model fra forskellige producenter ikke kun vil have forskellige clock-frekvenser, men også algoritmen til at ændre dem over tid, hvilket vil gøre det vanskeligt at sammenligne under de samme forhold.

Salget af Radeon HD 7790 videokort på markedet begyndte i begyndelsen af ​​april 2013. AMD organiserede sammen med sine partnere udgivelsen af ​​begge bundkort med referencefrekvenser og fabriksoverclockede løsninger. Og nu lancerer begge producenter nye videokort på markedet på nogenlunde samme måde, med forskellige muligheder hurtigt tilgængelige fra deres partnere. Faktisk udgav partnerne næsten flere overclockede versioner af HD 7790 end almindelige, og grafikchipsene i dem fungerer ved frekvenser på omkring 1075 MHz.

Detaljer: Radeon HD 7990 model

  • Kodenavn "Malta"
  • Fremstillingsteknologi: 28 nm
  • 2 chips med hver 4,3 milliarder transistorer
  • En samlet arkitektur med en række fælles processorer til strømbehandling af adskillige typer data: hjørner, pixels osv.
  • Hardwareunderstøttelse til DirectX 11.1, inklusive Shader Model 5.0
  • Dobbelt 384-bit hukommelsesbus: to gange seks 64-bit brede controllere med understøttelse af GDDR5-hukommelse
  • GPU-frekvens: 1000 MHz
  • To gange 32 GCN-beregningsenheder, hver med 128 SIMD-kerner, bestående af i alt 4096 flydende ALU'er (heltals- og flydende kommaformater, understøttelse af FP32- og FP64-præcision inden for IEEE 754-standarden)
  • 2x128 teksturenheder, med understøttelse af trilineær og anisotropisk filtrering for alle teksturformater
  • 2x32 ROP-enheder med understøttelse af antialiasing-tilstande med mulighed for programmerbart at sample mere end 16 samples pr. pixel, inklusive med FP16- eller FP32-rammebufferformat. Maksimal ydeevne op til 64 samples pr. ur, og kun i Z-tilstand - 256 samples pr. ur
  • Integreret understøttelse af op til seks skærme via HDMI 1.4a og DisplayPort 1.2 interfaces

Radeon HD 7990 grafikkortspecifikationer

  • Kernefrekvens: 1000 MHz
  • Antal universelle processorer: 4096
  • Antal teksturblokke: 2x128, blandingsblokke: 2x32
  • Effektiv hukommelsesfrekvens: 6000 MHz (4x1500 MHz)
  • Hukommelsestype: GDDR5
  • Hukommelseskapacitet: 2x3 gigabyte
  • Hukommelsesbåndbredde: 2x288 gigabyte per sekund.
  • Teoretisk maksimal opfyldningshastighed: 64 gigapixel i sekundet.
  • Teoretisk tekstursamplinghastighed: 256 gigatexels pr. sekund.
  • Ét CrossFire stik
  • PCI Express 3.0 bus
  • Stik: DVI Dual Link, fire Mini-DisplayPort 1.2
  • Strømforbrug op til 375 W
  • To 8-bens hjælpestrømstik
  • Dobbelt slot design
  • Anbefalet pris for Rusland - 32.999 rubler. (for USA - $999).

Allerede i anden generation af AMD-videokort forbliver navngivningsprincippet for dual-chip-modeller uændret. Topløsningen på to kraftige videochips adskiller sig fra den tidligere generationsmodel svarende til dens klasse i det første ciffer i indekset: i stedet for 6 modtog den nummeret 7, hvilket indikerer en ny serie. Det annoncerede videokort adskiller sig fra single-chip-løsningen i det tredje ciffer, hvilket indikerer maksimal ydeevne inden for generationen.

Hvad angår sammenligning med konkurrenter, er den vigtigste rival for Radeon HD 7990-modellen annonceret i dag GeForce GTX 690-skærmkortet, der blev udgivet for næsten et år siden, og det er disse dual-chip-løsninger, der skal kæmpe med hinanden. NVIDIA har ganske vist også en anden kraftfuld løsning, men baseret på en enkelt GPU - GeForce GTX Titan, som også kan betragtes som en konkurrent til det pågældende board fra AMD.

Det nye dual-chip Radeon-videokort er udstyret med 3 gigabyte GDDR5-hukommelse for hver GPU, hvilket skyldes 384-bit hukommelsesbussen af ​​Tahiti-chips. Denne volumen er ret berettiget for et produkt på et så højt niveau, da i nogle moderne spilapplikationer, med maksimale indstillinger, anti-aliasing aktiveret og høje opløsninger, er en mindre mængde hukommelse (2 gigabyte pr. chip eller mindre) muligvis ikke længere nok. Og endnu mere, når du gengiver i stereotilstand eller på flere skærme i Eyefinity-tilstand.

Det er tydeligt, at et så kraftigt dual-chip videokort har et massivt dual-slot kølesystem, som adskiller sig fra traditionelle kølere til AMD-kort. Den har en massiv radiator skjult under et kabinet med tre store blæsere, der kører ved relativt lave hastigheder. Strømforbruget på et kort med to GPU'er ombord er ret højt af indlysende årsager, og det har to 8-bens strømstik, men det er i hvert fald ikke tre, som det var tilfældet i ikke-referenceprøver baseret på to Tahiti-chips .

Arkitektur

Da videokortet, kodenavnet "Malta", er baseret på to "Tahiti" GPU'er fra Southern Islands-familien, kan du blot henvise til, som nøje beskriver alle funktionerne i den nuværende Graphics Core Next (GCN) arkitektur. I basismaterialer gentager vi kun de vigtigste egenskaber og funktioner ved specifikke produkter.

Arkitekturens grundblok er GCN-blokken, hvorfra alle GPU'er i serien er samlet. Beregningsenheden er opdelt i underafsnit, som hver arbejder på sit eget instruktionsflow, den har dedikeret lokal datalagring, en læse-skrive L1-cache og en fuld tekstur-pipeline med hente- og filterenheder. Hver af GCN-blokkene er i stand til selv at planlægge og distribuere kommandoer, og en computerblok kan udføre flere uafhængige kommandostrømme. Radeon HD 7990 bruger to Tahiti-chips, som vi allerede kender:

Diagrammet over grafikprocessoren (der er to af disse i Radeon HD 7990) viser 32 computerenheder i GCN-arkitekturen, og alle er aktive. Tidligere blev det antaget, at det for en to-chip-løsning ville være nødvendigt at deaktivere nogle af dem og endda sænke frekvensen for at komme ind i strømforbrugsgrænserne på 375 W, men AMD-ingeniører formåede at løse dette vanskelige problem. Måske blev der udgivet en særlig ny revision af Tahiti med reduceret strømforbrug, eller chipsene gennemgår simpelthen en meget streng udvælgelsesproces.

Da hver GCN-enhed indeholder 16 teksturenheder, er antallet af TMU'er 128 enheder pr. chip, hvilket giver en endelig ydeevne på 256 gigatexels pr. sekund, hvilket er meget godt for en konkurrent til GeForce GTX 690. Antal ROP-enheder og hukommelsescontrollere i HD 7990 ændrede sig heller ikke sammenlignet med sin single-chip modstykke; de ​​blev efterladt på henholdsvis 32 og 6 stykker pr. GPU. Radeon HD 7990 har to 384-bit hukommelsesbusser, der består af tolv 64-bit kanaler, hvilket giver en samlet hukommelsesbåndbredde på 576 GB/s - endnu et rekordstort tal.

Ellers understøtter det nye board alle moderne AMD-teknologier, der blev introduceret og forbedret i de nye videochips i Radeon HD 7000-linjen: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, forbedret teksturfiltreringskvalitet osv. Alt dette er skrevet i detaljer ovenfor i beskrivelsen af ​​Radeon HD 7970, og det nytter simpelthen ikke at gentage det.

Kølesystem og strømforbrug

I tilfælde af sådanne seriøse dobbeltspånplader bliver et højeffektivt kølesystem særligt vigtigt. Hvis der i tilfælde af løsninger fra partnere baseret på to Tahiti blev brugt tre-slot løsninger, og i tilfælde af ASUS ARES II blev der brugt vandkøling, var det i dette tilfælde nødvendigt at nøjes med mindre indsats, så en køler blev designet med en meget massiv radiator og tre blæsere med forbedrede akustiske egenskaber.

Kølesystemets støjniveau og temperaturen til GPU'er er blandt de vigtigste forbrugerkarakteristika for ethvert videokort, inklusive en top-end løsning beregnet til entusiaster. Et kølesystem, der er for højt eller ineffektivt, vil af købere blive betragtet som et mindre rentabelt køb, idet alle andre faktorer er (nogenlunde) lige store. Så AMD tog dette problem meget alvorligt i tilfældet med Radeon HD 7990-modellen, sammenlignet med andre topløsninger på markedet. Lad os se på de akustiske egenskaber ved det nye system:

Diagrammet viser støjniveauet fra tre forskellige videokort: Radeon HD 7990 og to konkurrenter: Dual-chip GeForce GTX 690 og single-chip GTX Titan fra NVIDIA. Desuden blev støjen målt under forskellige forhold - i tomgang (System Idle) og ved maksimal belastning ved brug af Furmark. Hvis man tror på tallene fra AMD, så når selv single-chip Titan ikke deres nye produkt i forhold til støjniveau fra køleren, for ikke at nævne dual-chip GTX 690, som er den højest i denne sammenligning.

Men blev en sådan imponerende akustisk ydeevne opnået på bekostning af GPU-temperaturen? Følgende diagram viser GPU-temperaturer målt på AMDs Radeon HD 7990 og de samme to konkurrenter. Denne gang brugte AMD-specialister kun højbelastningstilstanden, når de testede hos Furmark.

Og igen bruges en "tricky" koordinatakse med oprindelsen ikke på nul. Den reelle forskel mellem 80 og 82 grader for Radeon HD 7990 og GTX Titan vil være praktisk talt umærkelig, selvom 87 grader for GTX 690 klart skiller sig ud til det værre. Igen bemærker vi, at alle disse test blev udført af en interessent og er underlagt uafhængig verifikation.

Med hensyn til strømforbrug er der ikke noget nyt i dual-chip-løsningen, men der er også understøttelse af den tidligere annoncerede ZeroCore Power-teknologi. Denne teknologi hjælper med at opnå et markant lavere strømforbrug under dyb tomgang (eller dvale) med skærmenheden slukket. I denne tilstand er den inaktive GPU næsten helt slukket og bruger mindre end 5 % af energien i fuld tilstand, hvilket deaktiverer de fleste funktionelle enheder. Og i tilfælde af et to-chip-kort er det endnu vigtigere, at i CrossFire-systemet, når du renderer en to-dimensionel grænseflade af operativsystemet, virker alle GPU'er undtagen den vigtigste slet ikke. Det vil sige, at i tilfældet med Radeon HD 7990 vil en af ​​chipsene i 2D-tilstand blive nedsænket i dyb søvn med minimalt energiforbrug, og den anden kan "falde i søvn" i dyb pc-tomgangstilstand.