Jeśli chodzi o procesory graficzne, Nvidia jest wiodącym ekspertem. Działając w branży od 1993 roku, Nvidia wyprodukowała szeroką gamę najwyższej jakości profesjonalnych i konsumenckich procesorów graficznych. Cenione architektury ich procesorów stoją za sukcesem ich produktów, zwłaszcza ich podstawowej linii, GeForce. Procesory graficzne Nvidii wyszły poza przestrzeń gier, rozszerzając swoją obecność w dziedzinie głębokiego uczenia, sztucznej inteligencji (sztucznej inteligencji) i przyspieszonej analizy. Nvidia zinfiltrowała rynek centrów danych dziesięć lat temu, zaczynając od chipów Fermi. Dokonano kolejnych iteracji, a firma stale wypuszczała procesory graficzne, które zaspokajają nienasycone zapotrzebowanie na szybsze przetwarzanie w centrach danych. Procesory graficzne Nvidii ewoluowały przez lata, a projekty architektury napędzają przede wszystkim ewolucję.
Architektura Ampere firmy Nvidia
Konkurencja wśród producentów procesorów graficznych jest bardzo zacięta, ale Nvidia nie powstrzymuje się od zajęcia pierwszego miejsca. W rzeczywistości Nvidia zdominowała rynek AI w ciągu ostatniej dekady. W 2020 roku wiadomość o pierwszym 7-nanometrowym procesorze graficznym Nvidii (8 nm dla części konsumenckich) z 54 miliardami tranzystorów skompresowanych w tak małej matrycy wywołał spore zamieszanie. Nazwa kodowa Amper według francuskiego matematyka André-Marie Ampère, Architektura procesorów Nvidii znacznie poprawia ich poprzedniczki, Turing i Volta, obiecując więcej funkcji, lepszą wydajność i wyższą wydajność przy niższych poziomach mocy. Ampere stoi za drugą generacją procesorów graficznych Nvidia RTX, serii RTX 30 i mówi się, że jest dwa razy szybszy niż ich odpowiedniki z serii RTX 20. Architektura Ampere jest również siłą napędową procesorów graficznych Nvidia A100 dla centrów danych.
Specyfikacje Ampere
Ampere to pierwszy procesor graficzny Nvidii 7nm/8nm, druga generacja konsumenckiego ray tracingu, z trzecią generacją rdzeni tensorowych. Ampere to podstawowa architektura procesorów graficznych GA100, GA102 i GA104, które są wbudowane w GeForce RTX 3090, RTX 3080, RTX 3070, a ostatnio w RTX 3060. Nvidia ma również wypuścić RTX 3050 w nadchodzących miesiącach. Tymczasem procesor graficzny GA100 klasy korporacyjnej zapewnia 20-krotnie większą moc obliczeniową niż poprzednie generacje procesorów graficznych dla centrów danych. Oto przegląd profesjonalnych i konsumenckich procesorów graficznych Nvidia Ampere [1]:
GPU | GA100 | GA102 | GA102 | GA104 |
---|---|---|---|---|
Karta graficzna | Nvidia A100 | GeForce RTX 3090 | GeForce RTX 3080 | GeForce RTX 3070 |
Proces (nm) | TSMC N7 | Samsung 8N | Samsung 8N | Samsung 8N |
Tranzystory (mld) | 54 | 28.3 | 28.3 | 17.4 |
Rozmiar matrycy (mm^2) | 826 | 628.4 | 628.4 | 392.5 |
Konfiguracja GPC | 8×16 | 7×12 | 6×12 | 6×8 |
SMSy | 108 | 82 | 68 | 46 |
Rdzenie CUDA | 6912 | 10496 | 8704 | 5888 |
Rdzenie RT | Żaden | 82 | 68 | 46 |
Rdzenie Tensora | 432 | 328 | 272 | 184 |
Taktowanie doładowania (MHz) | 1410 | 1700 | 1710 | 1730 |
Szybkość pamięci VRAM (Gb/s) | 2.43 | 19.5 (GDDR6X) | 19 (GDDR6X) | 14 (GDDR6) |
VRAM (GB) | 40 (maksymalnie 48) | 24 | 10 | 8 |
Szerokość busa | 5120 (6144 maks.) | 384 | 320 | 256 |
RPO | 128 | 112 | 96 | 96 |
TMU | 864 | 656 | 544 | 368 |
GFLOPS FP32 | 19492 | 35686 | 29768 | 20372 |
RTLOPS RT | Nie dotyczy | 69 | 58 | 40 |
Tensor TFLOPS FP16 (rzadkość) | 312 (628) | 143 (285) | 119 (238) | 81 (163) |
Przepustowość (GB/s) | 1555 | 936 | 760 | 448 |
TBP (wat) | 400 (250 PCIe) | 350 | 320 | 220 |
Nvidia A100
Nvidia A100 to pierwszy procesor graficzny wykorzystujący architekturę Ampere. Chip korporacyjny jest przeznaczony dla centrów danych i przeznaczony do zadań intensywnie wykorzystujących GPU, takich jak głębokie uczenie i sztuczna inteligencja. Zbudowany w procesie 7 nm firmy TSMC, mieści ogromną liczbę 54 miliardów tranzystorów. Przewyższa poprzednie generacje procesorów graficznych dla przedsiębiorstw dzięki 20-krotnemu wzrostowi wydajności dzięki 6912 rdzeniom CUDA, 432 jednostkom mapującym tekstury, 160 ROP, rdzeniom Tensor trzeciej generacji i 40 GB VRAM z przepustowością pamięci sięgającą 1.6 TB/s. DGX A100 to pierwszy na świecie system AI z klastrem ośmiu A100 i wysoką ceną 199 000 USD.
Seria GeForce RTX 30
Oprócz dominacji na rynku przedsiębiorstw, Nvidia zawsze ma na uwadze konsumentów, zwłaszcza graczy i twórców. Architektura Ampere jest również stosowana w konsumenckich kartach graficznych Nvidii. Druga generacja GeForce RTX zawiera procesory graficzne oparte na Ampere, zwiększając wydajność do dwukrotnie większej niż poprzednia generacja.
W większości aspektów Ampere ma ponad dwukrotnie większą moc obliczeniową niż Turing. Podwoił wydajność shaderów Turinga przy dwukrotnie większej liczbie rdzeni CUDA FP32. W szczególności ma 30 Shader-TFLOPS, 2.7x więcej niż Turinga, który ma tylko 11 Shader-TFLOPS. Podobnie, rdzeń tensorowy Turinga mierzy 89 TFLOPS tensorowych, ale Ampere podwoił tę szybkość dzięki 238 TFLOPS tensorowych. Nie można zapomnieć o wskaźnikach Ray Tracing Core, które wynoszą 58 RT-TFLOPS, 1.7x szybszy niż 34 RT-TFLOPS Turinga, a aby jeszcze szybsze działanie procesorów graficznych, układ Ampere łączy się z najszybszą na świecie pamięcią, Micron G6X.
Seria RTX 30 jest wykonana przy użyciu niestandardowego procesu Samsung 8N Nvidia z 28 miliardami tranzystorów dla GA102 i 17 miliardami tranzystorów dla GA104. RTX 3090 klasy Titan jest zasilany przez procesor graficzny GA102 i zapewnia niezwykle wysoką wydajność kart konsumenckich. W przeciwieństwie do poprzednich generacji, RTX 3090 jest otwarty dla stron trzecich na niestandardowe projekty.
RTX 3080 wykorzystuje również procesor graficzny GA102, zapewniając dwukrotnie wyższą wydajność niż RTX 2080 i imponującą wydajność w grach 4K. RTX 3070, zasilany przez GPU GA104, dorównuje RTX 2080 Ti za połowę ceny. Niedawno wydany RTX 3060 również imponuje oszałamiającą wydajnością napędzaną ulepszonymi rdzeniami Ray Tracing, rdzeniami tensorowymi, nowymi multiprocesorami strumieniowymi i szybką pamięcią G6.
Pomimo ogromnego wzrostu wydajności, nowe procesory graficzne RTX nie obciążają kieszeni. Znacznie szybsze karty graficzne są łatwo dostępne, jeśli chodzi o ceny. Flagowy model Nvidia GeForce, RTX 3080, zaczyna się od 699 USD, RTX 3070 sprzedaje się za 499 USD, a RTX 3060 ma cenę 329 USD. Wyższy RTX 3090 kosztuje 1499 USD; wciąż znacznie tani, biorąc pod uwagę wydajność na poziomie Titan.
Zaledwie kilka miesięcy po premierze podobno brakowało kart graficznych opartych na Ampere i nie jest zaskoczeniem, że Ampere ma oszałamiającą wydajność w rozsądnej cenie. Dla tych, którzy rozważają ulepszenie GPU, teraz jest najlepszy czas, aby zdobyć procesory graficzne Nvidia oparte na Ampere.
Źródła
[1] Walton, Jarred. „Głębokie zanurzenie w architekturze Ampere serii Nvidia RTX 30: wszystko, co wiemy”. https://www.tomshardware.com/features/nvidia-ampere-architecture-deep-dive. 13 października 2020 r.