Intel рассказала про чудовищную мощь флагманской графики Xe-HP на четырёх кристаллах

Главный архитектор и старший вице-президент подразделения дискретной графики Intel Раджа Кодури (Raja Koduri) на конференции Hot Chips 2020 рассказал подробности о теоретической производительности будущих ускорителей компании. И заявленные цифры впечатляют.

Во время выступления господин Кодури достал из кармана самый большой и мощный графический процессор Xe HP, объединяющий на одной подложке четыре кристалла (будут и более простые версии с одним и двумя кристаллами). Каждый из них включает 512 вычислительных блоков (EU, Execution Units) и, вероятнее всего, два модуля многослойной памяти HBM2e.

Затем руководитель провёл тест, чтобы показать отличную масштабируемость архитектуры Xe и то, как увеличение количества кристаллов на подложке приводит к кратному масштабированию производительности. Работая на одном кристалле, ускоритель обеспечивает производительность до 10,588 терафлопс для операций с плавающей запятой FP32 при одинарной точности. Когда задействовано два кристалла, производительность масштабируется почти идеально и достигает 21,161 терафлопс (в 1,999 раза). Флагманское же решение с четырьмя кристаллами обеспечивает 3,993-кратное повышение производительности до 41,908 терафлопс.

Распределение задач между графическими процессорами в таких технологиях, как SLI и CrossFire, намного сложнее, а масштабирование от дополнительных ускорителей обычно даёт игрокам в лучшем случае прирост в районе 50–80 %. Однако в вычислительных рабочих нагрузках задачи часто независимы и могут идеально масштабироваться. Поэтому в профессиональных задачах флагманские GPU Intel с четырьмя кристаллами явно покажет себя хорошо. А вот как будут обстоять дела у Intel с масштабированием графики — покажут независимые тесты.

Для сравнения: видеокарта GeForce RTX 2080 Ti в операциях FP32 способна обеспечить до 14,2 терафлопс производительности. Но это ещё не всё: господин Кодури также упомянул, что Xe HP на базе четырёх кристаллов способен обеспечивать производительность в петафлопсах. Другими словами, с помощью тензорных блоков новый графический процессор Intel будет невероятно быстрым в задачах машинного обучения и искусственного интеллекта, где не нужна высокая точность.


Источник

Tags

Похожие статьи

Добавить комментарий

Закрыть