NVIDIA GeForce RTX 4090 — это BFGPU нового поколения, предлагающий сокрушительную производительность, которая выводит игры на новый уровень. GeForce RTX 4090 — это не просто GPU, это флагманское предложение зеленой команды, обеспечивающее четырехкратный рост производительности по сравнению с предшественником.
GeForce RTX 4090 от NVIDIA была долгожданной и вот, наконец, она появилась. Видеокарта предназначена для энтузиастов и геймеров, которые хотят получить максимальную визуальную точность, а для этого нужен мощный GPU, учитывая, насколько требовательными стали игры нового поколения AAA. Помня об этом, NVIDIA поставила перед своим следующим чипом цель быть не на несколько процентов или 50% быстрее, чем предыдущее поколение, а в 4 раза быстрее с DLSS и в 2 раза быстрее в родном разрешении, чтобы убедиться, что их видеокарты готовы не только к новым играм, но и к расширенным функциям, таким как трассировка лучей и т.д.
Графический процессор NVIDIA AD102 «Ada Lovelace» — мощь нового поколения
В сердце видеокарты NVIDIA GeForce RTX 4090 лежит графический процессор AD102 Ada Lovelace. Графический процессор имеет площадь около 600 мм2 и использует технологический узел TSMC 4N, который является оптимизированной версией 5-нм (N5) узла TSMC, разработанного для «зеленой» команды. Графический процессор оснащен 76 миллиардами транзисторов.
Ожидается, что графический процессор NVIDIA Ada Lovelace AD103 будет иметь до 7 GPC (кластеров графической обработки). Это то же количество GPC, что и у GPU Ampere GA102, и на один дополнительный GPC больше, чем у GPU GA103. Каждый GPU будет состоять из 6 TPC и 2 SM, что соответствует конфигурации существующего чипа. Каждый SM (потоковый мультипроцессор) будет содержать четыре подъядра, что также соответствует конфигурации GPU GA102. Что изменилось, так это конфигурация ядер FP32 и INT32. Каждое подъядро будет включать 128 блоков FP32, но комбинированные блоки FP32+INT32 будут достигать 192. Это связано с тем, что ядра FP32 не делят одно подъядро с ядрами IN32. 128 ядер FP32 отделены от 64 ядер INT32.
Таким образом, каждое подъядро будет состоять из 32 FP32 плюс 16 INT32, итого 48 ядер. Каждый SM будет иметь в общей сложности 128 блоков FP32 плюс 64 блока INT32 — всего 192 блока. Поскольку всего имеется 84 SM (по 12 на GPC), мы имеем 12 288 блоков FP32 и 6 144 блока INT32, что в общей сложности составляет 18 432 ядра. Каждый SM также включает два графика обертывания (32 потока/КЛК), что дает 64 обертывания на SM. Это на 50% больше ядер (FP32+INT32) и на 33% больше обмоток/потоков по сравнению с GPU GA102.
GPU NAME | AD102 | GA102 | TU102 | GA100 | GH100 |
---|---|---|---|---|---|
GPC | 12 (Per GPU) | 1.7x | 2x | 1.5x | 1.5x |
TPC | 6 (Per GPC) | Same | Same | 0.75x | 0.67x |
SM | 2 (Per TPC) | Same | Same | Same | Same |
Sub-Core | 4 (Per SM) | Same | Same | Same | Same |
FP32 | 128 (Per SM) | Same | 2x | 2x | Same |
FP32+INT32 | 192 (Per SM) | 1.5x | 1.5x | 1.5x | Same |
Warps | 64 (Per SM) | 1.33x | 2x | Same | Same |
Threads | 2048 (Per SM) | 1.33x | 2x | Same | Same |
L1 Cache | 192 KB (Per SM) | 1.5x | 2x | Same | 0.75x |
L2 Cache | 96 MB (Per GPU) | 16x | 16x | 2.4x | 1.6x |
ROPs | 32 (Per GPC) | 2x | 2x | 2x | 2x |
GeForce RTX 4090
Переходим к кэшу — это еще один сегмент, где NVIDIA дала значительный прирост по сравнению с существующими GPU Ampere. Графические процессоры Ada Lovelace будут оснащены 192 КБ кэша L1 на СМ, что на 50% больше, чем у Ampere. Это в общей сложности 4,5 МБ кэша L1 на топовом GPU AD102. Кэш-память L2 будет увеличена до 96 МБ, как упоминалось в утечках. Это в 16 раз больше, чем у GPU Ampere, который имеет всего 6 МБ кэша L2. Кэш будет распределен по всем GPU.
Наконец, у нас есть ROPs, которые также увеличены до 32 на GPC, что в 2 раза больше, чем у Ampere. На флагмане нового поколения можно будет использовать до 384 ROPs против всего 112 на самом быстром GPU Ampere, RTX 3090 Ti. В GPU Ada Lovelace также будут установлены новейшие тензорные ядра 4-го поколения и RT (Raytracing) 3-го поколения, которые помогут поднять производительность DLSS и Raytracing на новый уровень. В целом, графический процессор Ada Lovelace AD102 будет предлагать:
Предварительные характеристики серии NVIDIA GeForce RTX 40:
GRAPHICS CARD NAME | NVIDIA GEFORCE RTX 4090 | NVIDIA GEFORCE RTX 4080 16G | NVIDIA GEFORCE RTX 4080 12G | NVIDIA GEFORCE RTX 3090 TI | NVIDIA GEFORCE RTX 3080 |
---|---|---|---|---|---|
GPU Name | Ada Lovelace AD102-300? | Ada Lovelace AD103-300? | Ada Lovelace AD104-400? | Ampere GA102-225 | Ampere GA102-200 |
Process Node | TSMC 4N | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
Die Size | ~600mm2 | ~450mm2 | ~450mm2 | 628.4mm2 | 628.4mm2 |
Transistors | ~75 Billion | TBD | TBD | 28 Billion | 28 Billion |
CUDA Cores | 16384 | 9728 | 7680 | 10240 | 8704 |
TMUs / ROPs | TBD | TBD | TBD | 320 / 112 | 272 / 96 |
Tensor / RT Cores | TBD / TBD | TBD / TBD | TBD / TBD | 320 / 80 | 272 / 68 |
Base Clock | TBD | TBD | TBD | 1365 MHz | 1440 MHz |
Boost Clock | ~2520 MHz | ~2505 MHz | ~2610 MHz | 1665 MHz | 1710 MHz |
FP32 Compute | ~82 TFLOPs | ~50 TFLOPs | ~40 TFLOPs | 34 TFLOPs | 30 TFLOPs |
RT TFLOPs | TBD | TBD | TBD | 67 TFLOPs | 58 TFLOPs |
Tensor-TOPs | TBD | TBD | TBD | 273 TOPs | 238 TOPs |
Memory Capacity | 24 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 12 GB GDDR6X | 10 GB GDDR6X |
Memory Bus | 384-bit | 256-bit | 192-bit | 384-bit | 320-bit |
Memory Speed | 21.0 Gbps | 23.0 Gbps | 21.0 Gbps | 19 Gbps | 19 Gbps |
Bandwidth | 1008 GB/s | 736 GB/s | 504 GB/s | 912 Gbps | 760 Gbps |
TBP | 450W (660W BIOS Max TGP) | 340W (516W BIOS Max TGP) | 285W (366W BIOS Max TGP) | 350W | 320W |
Price (MSRP / FE) | $1199 US? | $899 US? | $699 US? | $1199 | $699 US |
Launch (Availability) | October 2022? | November 2022? | November 2022? | 3rd June 2021 | 17th September 2020 |
На данный момент слухи указывают на запуск в середине июля, так что нам придется подождать еще два месяца, чтобы увидеть, как все пройдет!