Intel заявила, что её серверный ускоритель вычислений Ponte Vecchio до 2,5 раза быстрее NVIDIA A100
![](http://etalon-it.bigcdn.ru/wp-content/uploads/2022/08/intel-zajavila-chto-ejo-servernyj-uskoritel-vychislenij-ponte-vecchio-do-25-raza-bystree-nvidia-a100-0a3d6d2-750x470.jpg)
В рамках конференции HotChips 34 компания Intel поделились новыми деталями о готовящихся к выпуску серверных ускорителях вычислений Ponte Vecchio, у которых на одной подложке объединены 63 отдельных элемента (47 функциональных включая GPU). В частности, эксперты компании рассказали о максимальной пропускной способности и производительности ускорителя Ponte Vecchio в вычислениях с одинарной и двойной точностью.
Источник изображений: Intel
В составе Ponte Vecchio используются кристаллы, выполненные по трём разным техпроцессам: Intel 7 (10 нм Enhanced SuperFin), TSMC N7 (7 нм) и TSMC N5 (5 нм). Они объединены между собой с помощью новой упаковкой Foveros и шиной EMIB. В составе одного Ponte Vecchio присутствуют 128 графических ядер Xe, 128 ускорителей трассировки лучей, 64 Мбайт кеш-памяти L1 и 408 Мбайт кеш-памяти L2. Данные ускорители также получили до 128 Гбайт высокоскоростной памяти HBM2e и поддерживают интерфейс PCIe 5.0.
![Подсистема памяти и пропускная способность (ниже) Ponte Vecchio](/wp-content/uploads/2022/08/intel-zajavila-chto-ejo-servernyj-uskoritel-vychislenij-ponte-vecchio-do-25-raza-bystree-nvidia-a100-0b1debd.jpg)
Подсистема памяти и пропускная способность (ниже) Ponte Vecchio
![](/wp-content/uploads/2022/08/intel-zajavila-chto-ejo-servernyj-uskoritel-vychislenij-ponte-vecchio-do-25-raza-bystree-nvidia-a100-f916236.jpg)
![Ponte Vecchio в задачах DPC++ в сравнении с NVIDIA A100](/wp-content/uploads/2022/08/intel-zajavila-chto-ejo-servernyj-uskoritel-vychislenij-ponte-vecchio-do-25-raza-bystree-nvidia-a100-82e6e14.jpg)
Ponte Vecchio в задачах DPC++ в сравнении с NVIDIA A100
По словам Intel, в задачах Data Parallel C++ (DPC++) ускорители Ponte Vecchio обеспечивают в 1,4–2,5 раза более высокую производительность по сравнению с серверными ускорителями вычислений NVIDIA A100. Intel также предоставила данные о производительности своего решения в ExaSMR OpenMC (современный код Монте-Карло для исследований и разработок), где Ponte Vecchio обеспечивает вдвое более высокую производительность. А в NekRS (для решения уравнений Навье–Стокса) решение Intel показывает производительность в 1,3–1,7 раза выше конкурента.
![Ponte Vecchio в задачах ExaSMR и miniBUDE](/wp-content/uploads/2022/08/intel-zajavila-chto-ejo-servernyj-uskoritel-vychislenij-ponte-vecchio-do-25-raza-bystree-nvidia-a100-824513b.jpg)
Ponte Vecchio в задачах ExaSMR и miniBUDE
![](/wp-content/uploads/2022/08/intel-zajavila-chto-ejo-servernyj-uskoritel-vychislenij-ponte-vecchio-do-25-raza-bystree-nvidia-a100-a08a9b6.jpg)
![](/wp-content/uploads/2022/08/intel-zajavila-chto-ejo-servernyj-uskoritel-vychislenij-ponte-vecchio-do-25-raza-bystree-nvidia-a100-d09f1de.jpg)
Ожидалось, что Intel Ponte Vecchio вместе с серверными процессорами Intel Sapphire Rapids Xeon дебютируют в составе первого американского эксафлопсного суперкомпьютера Aurora. Однако из-за задержки разработки это звание перехватил суперкомпьютер Frontier, оснащённый третьим поколением процессоров AMD EPYC и графическими ускорителями AMD Instinct MI250X, выдающими пиковую производительность в 1,6 Эфлопс.
![Источник изображения: VideoCardz](/wp-content/uploads/2022/08/intel-zajavila-chto-ejo-servernyj-uskoritel-vychislenij-ponte-vecchio-do-25-raza-bystree-nvidia-a100-b0626be.jpg)
Источник изображения: VideoCardz
Когда состоится релиз Ponte Vecchio — пока неизвестно. Однако на его замену Intel уже готовит ускоритель Rialto Bridge.