Графический процессор NVIDIA AD102 получил 76.3 млрд транзисторов
Новые игровые видеокарты NVIDIA GeForce RTX 4000, представленные вчера, получили новые графические процессоры, а новым флагманом теперь считается AD102. Он изготавливается по кастомному технологическому процессу TSMC 4N, сделанному специально для NVIDIA.
Применение более совершенного технологического процесса позволило разместить 76.3 млрд транзисторов на кристалле площадью 608.4 мм², что дает плотность размещения транзисторов около 125.5 млн мм², что в 2.78 раза больше плотности флагмана прошлого поколения GA102, изготавливаемого по технологическому процессу Samsung 8N.
К сожалению, точное количество CUDA-ядер у полноценной версии AD102 официально не сообщается, но некоторые партнеры указывают на наличие 142 потоковых мультипроцессоров и 18176 CUDA-ядер, хотя слухи говорили про 144 SM и 18432 CUDA. В игровой видеокарте GeForce RTX 4090 лежит урезанная версия графического процессора со 128 SM и 16384 CUDA.
Также графические процессоры в новых видеокартах получили третье поколение RT-ядер и четвертое поколение тензорных ядер, а для оптимизации задействования всего потенциала SM-блока был внедрен механизм переупорядочивания выполнения шейдеров (SER), подразумевающим сортировку потоков для повышения производительности в играх: до 25% в играх с растровым освещением и до 3 раз в играх с трассировкой лучей.
Скорее всего, полноценная версия графического процессора NVIDIA AD102 ляжет в основу еще более производительной видеокарты нового поколения. Например, GeForce RTX 4090 Ti. Будет интересно взглянуть на её характеристики и производительность, если компания планирует выпустить такую модель в будущем.