Представлена видеокарта NVIDIA GeForce RTX 4090 «Ada Lovelace» — 16384 ядра 24 ГБ GDDR6X которая в 4 раза быстрее RTX 3090

Представлена видеокарта NVIDIA GeForce RTX 4090 "Ada Lovelace" - 16384 ядра 24 ГБ GDDR6X которая в 4 раза быстрее RTX 3090 Новости

NVIDIA GeForce RTX 4090 — это BFGPU нового поколения, предлагающий сокрушительную производительность, которая выводит игры на новый уровень. GeForce RTX 4090 — это не просто GPU, это флагманское предложение зеленой команды, обеспечивающее четырехкратный рост производительности по сравнению с предшественником.

GeForce RTX 4090 от NVIDIA была долгожданной и вот, наконец, она появилась. Видеокарта предназначена для энтузиастов и геймеров, которые хотят получить максимальную визуальную точность, а для этого нужен мощный GPU, учитывая, насколько требовательными стали игры нового поколения AAA. Помня об этом, NVIDIA поставила перед своим следующим чипом цель быть не на несколько процентов или 50% быстрее, чем предыдущее поколение, а в 4 раза быстрее с DLSS и в 2 раза быстрее в родном разрешении, чтобы убедиться, что их видеокарты готовы не только к новым играм, но и к расширенным функциям, таким как трассировка лучей и т.д.

Графический процессор NVIDIA AD102 «Ada Lovelace» — мощь нового поколения

В сердце видеокарты NVIDIA GeForce RTX 4090 лежит графический процессор AD102 Ada Lovelace. Графический процессор имеет площадь около 600 мм2 и использует технологический узел TSMC 4N, который является оптимизированной версией 5-нм (N5) узла TSMC, разработанного для «зеленой» команды. Графический процессор оснащен 76 миллиардами транзисторов.

Представлена видеокарта NVIDIA GeForce RTX 4090 "Ada Lovelace" - 16384 ядра  24 ГБ GDDR6X

Ожидается, что графический процессор NVIDIA Ada Lovelace AD103 будет иметь до 7 GPC (кластеров графической обработки). Это то же количество GPC, что и у GPU Ampere GA102, и на один дополнительный GPC больше, чем у GPU GA103. Каждый GPU будет состоять из 6 TPC и 2 SM, что соответствует конфигурации существующего чипа. Каждый SM (потоковый мультипроцессор) будет содержать четыре подъядра, что также соответствует конфигурации GPU GA102. Что изменилось, так это конфигурация ядер FP32 и INT32. Каждое подъядро будет включать 128 блоков FP32, но комбинированные блоки FP32+INT32 будут достигать 192. Это связано с тем, что ядра FP32 не делят одно подъядро с ядрами IN32. 128 ядер FP32 отделены от 64 ядер INT32.

Таким образом, каждое подъядро будет состоять из 32 FP32 плюс 16 INT32, итого 48 ядер. Каждый SM будет иметь в общей сложности 128 блоков FP32 плюс 64 блока INT32 — всего 192 блока. Поскольку всего имеется 84 SM (по 12 на GPC), мы имеем 12 288 блоков FP32 и 6 144 блока INT32, что в общей сложности составляет 18 432 ядра. Каждый SM также включает два графика обертывания (32 потока/КЛК), что дает 64 обертывания на SM. Это на 50% больше ядер (FP32+INT32) и на 33% больше обмоток/потоков по сравнению с GPU GA102.

GPU NAMEAD102GA102TU102GA100GH100
GPC12 (Per GPU)1.7x2x1.5x1.5x
TPC6 (Per GPC)SameSame0.75x0.67x
SM2 (Per TPC)SameSameSameSame
Sub-Core4 (Per SM)SameSameSameSame
FP32128 (Per SM)Same2x2xSame
FP32+INT32192 (Per SM)1.5x1.5x1.5xSame
Warps64 (Per SM)1.33x2xSameSame
Threads2048 (Per SM)1.33x2xSameSame
L1 Cache192 KB (Per SM)1.5x2xSame0.75x
L2 Cache96 MB (Per GPU)16x16x2.4x1.6x
ROPs32 (Per GPC)2x2x2x2x

GeForce RTX 4090

 

Переходим к кэшу — это еще один сегмент, где NVIDIA дала значительный прирост по сравнению с существующими GPU Ampere. Графические процессоры Ada Lovelace будут оснащены 192 КБ кэша L1 на СМ, что на 50% больше, чем у Ampere. Это в общей сложности 4,5 МБ кэша L1 на топовом GPU AD102. Кэш-память L2 будет увеличена до 96 МБ, как упоминалось в утечках. Это в 16 раз больше, чем у GPU Ampere, который имеет всего 6 МБ кэша L2. Кэш будет распределен по всем GPU.

Представлена видеокарта NVIDIA GeForce RTX 4090 "Ada Lovelace" - 16384 ядра  24 ГБ GDDR6X которая в 4 раза быстрее RTX 3090

Наконец, у нас есть ROPs, которые также увеличены до 32 на GPC, что в 2 раза больше, чем у Ampere. На флагмане нового поколения можно будет использовать до 384 ROPs против всего 112 на самом быстром GPU Ampere, RTX 3090 Ti. В GPU Ada Lovelace также будут установлены новейшие тензорные ядра 4-го поколения и RT (Raytracing) 3-го поколения, которые помогут поднять производительность DLSS и Raytracing на новый уровень. В целом, графический процессор Ada Lovelace AD102 будет предлагать:

Предварительные характеристики серии NVIDIA GeForce RTX 40:

GRAPHICS CARD NAMENVIDIA GEFORCE RTX 4090NVIDIA GEFORCE RTX 4080 16GNVIDIA GEFORCE RTX 4080 12GNVIDIA GEFORCE RTX 3090 TINVIDIA GEFORCE RTX 3080
GPU NameAda Lovelace AD102-300?Ada Lovelace AD103-300?Ada Lovelace AD104-400?Ampere GA102-225Ampere GA102-200
Process NodeTSMC 4NTSMC 4NTSMC 4NSamsung 8nmSamsung 8nm
Die Size~600mm2~450mm2~450mm2628.4mm2628.4mm2
Transistors~75 BillionTBDTBD28 Billion28 Billion
CUDA Cores1638497287680102408704
TMUs / ROPsTBDTBDTBD320 / 112272 / 96
Tensor / RT CoresTBD / TBDTBD / TBDTBD / TBD320 / 80272 / 68
Base ClockTBDTBDTBD1365 MHz1440 MHz
Boost Clock~2520 MHz~2505 MHz~2610 MHz1665 MHz1710 MHz
FP32 Compute~82 TFLOPs~50 TFLOPs~40 TFLOPs34 TFLOPs30 TFLOPs
RT TFLOPsTBDTBDTBD67 TFLOPs58 TFLOPs
Tensor-TOPsTBDTBDTBD273 TOPs238 TOPs
Memory Capacity24 GB GDDR6X16 GB GDDR6X12 GB GDDR6X12 GB GDDR6X10 GB GDDR6X
Memory Bus384-bit256-bit192-bit384-bit320-bit
Memory Speed21.0 Gbps23.0 Gbps21.0 Gbps19 Gbps19 Gbps
Bandwidth1008 GB/s736 GB/s504 GB/s912 Gbps760 Gbps
TBP450W (660W BIOS Max TGP)340W (516W BIOS Max TGP)285W (366W BIOS Max TGP)350W320W
Price (MSRP / FE)$1199 US?$899 US?$699 US?$1199$699 US
Launch (Availability)October 2022?November 2022?November 2022?3rd June 202117th September 2020
Представлена видеокарта NVIDIA GeForce RTX 4090 "Ada Lovelace" - 16384 ядра  24 ГБ GDDR6X которая в 4 раза быстрее RTX 3090

На данный момент слухи указывают на запуск в середине июля, так что нам придется подождать еще два месяца, чтобы увидеть, как все пройдет!

nibbl
Оцените автора
NIBBL
Добавить комментарий