Når det gjelder GPUer, er Nvidia en ledende ekspert. Å ha vært i virksomheten siden 1993, har Nvidia produsert et bredt utvalg av profesjonelle GPUer av høyeste kvalitet og forbruker. De anerkjente arkitekturen til deres prosessorer ligger bak produktets suksess, spesielt av deres primære linje, GeForce. Nvidias GPUer gikk utover spillområdet og utvidet sin tilstedeværelse i dyp læring, AI (kunstig intelligens) og akselerert analyse. Nvidia infiltrerte datasentermarkedet for et tiår siden, og begynte med Fermi-sjetongene. Senere iterasjoner ble gjort, og selskapet ga kontinuerlig ut GPUer som fyller den umettelige etterspørselen etter raskere prosesseringshastighet i datasentre. Nvidias GPUer har utviklet seg gjennom årene, og arkitekturdesignene driver primært evolusjon.
Nvidias Ampere Architecture
Konkurransen er alvorlig streng blant GPU-produsenter, men Nvidia holder ikke noe tilbake for å ta topplasseringen. Faktisk har Nvidia dominert AI-markedet det siste tiåret. I 2020 gjorde nyheter om Nvidias første 7nm (8nm for forbruksdeler) GPU med 54 milliarder transistorer komprimert i en så liten matbit ganske sur. Kodenavn Ampere etter den franske matematikeren André-Marie Ampère, Nvidias prosessorarkitektur øker en massiv forbedring i forhold til forgjengerne, Turing og Volta, og lover mer funksjonalitet, bedre effektivitet og høyere ytelse ved lavere effektnivåer. Ampere står bak Nvidias andre generasjon RTX GPUer, RTX 30-serien, og sies å være dobbelt så rask som deres kolleger i RTX 20-serien. Ampere-arkitekturen er også styrken bak Nvidia A100 datasenter-GPUer.
Ampere spesifikasjoner
Ampere er Nvidias første 7nm / 8nm GPU, den andre generasjonen av forbrukerstrålesporing, og har tredje generasjon tensorkjerner. Ampere er den underliggende arkitekturen til GA100, GA102 og GA104 GPUer som er innebygd i GeForce RTX 3090, RTX 3080, RTX 3070, og sist RTX 3060. Nvidia er også planlagt å gi ut RTX 3050 de neste månedene. I mellomtiden gir virksomheten GA100 GPU 20 ganger mer datakraft enn tidligere generasjoner av datasenter-GPUer. Her er en oversikt over Nvidias Ampere-baserte profesjonelle og forbruker-GPUer [1]:
GPU | GA100 | GA102 | GA102 | GA104 |
---|---|---|---|---|
Grafikkort | Nvidia A100 | GeForce RTX 3090 | GeForce RTX 3080 | GeForce RTX 3070 |
Prosess (nm) | TSMC N7 | Samsung 8N | Samsung 8N | Samsung 8N |
Transistorer (milliarder) | 54 | 28.3 | 28.3 | 17.4 |
Dørstørrelse (mm ^ 2) | 826 | 628.4 | 628.4 | 392.5 |
GPC-konfigurasjon | 8 × 16 | 7 × 12 | 6 × 12 | 6 × 8 |
Tekstmelding | 108 | 82 | 68 | 46 |
CUDA kjerner | 6912 | 10496 | 8704 | 5888 |
RT kjerner | Ingen | 82 | 68 | 46 |
Tensorkerner | 432 | 328 | 272 | 184 |
Boost Clock (MHz) | 1410 | 1700 | 1710 | 1730 |
VRAM-hastighet (Gbps) | 2.43 | 19.5 (GDDR6X) | 19 (GDDR6X) | 14 (GDDR6) |
VRAM (GB) | 40 (maks 48) | 24 | 10 | 8 |
Bussbredde | 5120 (maks 6144) | 384 | 320 | 256 |
ROP-er | 128 | 112 | 96 | 96 |
TMUer | 864 | 656 | 544 | 368 |
GFLOPS FP32 | 19492 | 35686 | 29768 | 20372 |
RT TFLOPS | Ikke relevant | 69 | 58 | 40 |
Tensor TFLOPS FP16 (sparsity) | 312 (628) | 143 (285) | 119 (238) | 81 (163) |
Båndbredde (GB / s) | 1555 | 936 | 760 | 448 |
TBP (watt) | 400 (250 PCIe) | 350 | 320 | 220 |
Nvidia A100
Nvidia A100 er den første GPUen som brukte Ampere-arkitekturen. Bedriftsbrikken er rettet mot datasentre og designet for GPU-intensive oppgaver som dyp læring og AI. Bygget ved hjelp av TSMCs 7nm-prosess, huser det en enorm mengde på 54 milliarder transistorer. Det har overgått de forrige generasjonene av bedriftens GPUer med en 20x økning i ytelse med 6912 CUDA-kjerner, 432 teksturkartleggingsenheter, 160 ROP-er, tredje generasjon Tensor-kjerner og en 40 GB VRAM med minnebåndbredde som topper på 1.6 TB / sek. DGX A100 er verdens første AI-system med en klynge på åtte A100-er og en heftig prislapp på $ 199.000.
GeForce RTX 30-serien
Bortsett fra å dominere bedriftsmarkedet, har Nvidia alltid forbrukerne, spesielt spillere og skapere, i tankene. Ampere-arkitekturen er også tatt i bruk i Nvidias forbrukergrafikkort. Andre generasjon GeForce RTX bærer Ampere-baserte GPUer, og øker ytelsen til dobbelt så mye som forrige generasjon.
I de fleste aspekter har Ampere mer enn det dobbelte av prosesseringskraften til Turing. Det har doblet Turings skyggeytelse med dobbelt så mange FP32 CUDA-kjerner. Spesielt har den 30 Shader-TFLOPS, 2.7 ganger mer enn Turing, som bare er 11 Shader-TFLOPS. På samme måte måler Turing Tensor Core til 89 Tensor-TFLOPS, men Ampere har mer enn doblet denne hastigheten med sine 238 Tensor-TFLOPS. For ikke å glemme sine Ray Tracing Core-priser, som er 58 RT-TFLOPS, 1.7 ganger raskere enn Turings 34 RT-TFLOPS, og for å få GPUer til å kjøre enda raskere, kobles Ampere-brikken til verdens raskeste minne, Micron G6X.
RTX 30-serien er laget med Samsung 8N Nvidia Custom Process med 28 milliarder transistorer for GA102 og 17 milliarder transistorer for GA104. Titan klasse RTX 3090 er drevet av GA102 GPU og gir ekstremt kraftig forbrukerkortytelse. I motsetning til tidligere generasjoner er RTX 3090 åpen for tredjeparter for tilpasset design.
RTX 3080 bruker også en GA102 GPU, og leverer dobbelt så høy ytelse som RTX 2080 og en imponerende 4K-dyktighet. RTX 3070, drevet av GA104 GPU, er på nivå med RTX 2080 Ti til halv pris. Den nylig utgitte RTX 3060 klarer heller ikke å imponere med sin svimlende ytelse drevet av forbedrede Ray Tracing Cores, Tensor Cores, nye streaming multiprosessorer og G6-minne med høy hastighet.
Til tross for den enorme økningen i ytelse, går ikke de nye RTX GPU-ene tungt på lommen. De mye raskere grafikkortene er lett tilgjengelige når det gjelder priser. Nvidia GeForces flaggskip, RTX 3080, starter på $ 699, RTX 3070 selger til $ 499, og RTX 3060 har en prislapp på $ 329. Den høyere RTX 3090 koster $ 1.499; fremdeles betydelig billig med tanke på ytelsen på Titan-nivå.
Bare noen måneder etter utgivelsen har det angivelig vært mangel på Ampere-baserte grafikkort, og det er ingen overraskelse med Amperes fantastiske ytelse til en rimelig pris. For de som vurderer en GPU-oppgradering, er det nå den beste tiden å få tak i Nvidias Ampere-baserte GPUer.
Kilder
[1] Walton, Jarred. “Nvidia RTX 30-Series Ampere Architecture Deep Dive: Everything We Know”. https: // www.tomshardware.no / features / nvidia-ampere-architecture-deep-dive. 13. oktober 2020.