Итоги 2020 года: игровые видеокарты

09.01.2021

0 23 12 minutes read

Несмотря на пандемию и экономические потрясения, компьютерная индустрия хотя бы в чем-то развивается по плану. Например, у производителей дискретных GPU настал очередной цикл полного обновления кремниевой базы. Чипы предыдущего поколения еще надолго задержатся в категории бюджетных видеокарт и мобильной графики, но верхушку модельного ряда NVIDIA уже полностью заменила свежими продуктами на базе архитектуры Ampere. Что касается AMD, то до появления устройств серии Radeon RX 6000 в каталоге «красных» решений и не было полноценного high-end’а, а предыдущая решительная попытка составить конкуренцию «зеленым» в верхнем сегменте быстродействия (Radeon VII) обернулась очередным разочарованием. Теперь же, спустя пять лет после Radeon R9 Fury (X), рынок ускорителей игровой графики наконец пришел в нормальное состояние, когда у покупателей появился выбор между марками GeForce и Radeon в любом ценовом диапазоне.

Впрочем, кого мы обманываем? В условиях строжайшего дефицита, который поразил все новое железо, NVIDIA и AMD пока могут соревноваться разве что за симпатии экспертов и энтузиастов. Однако шквальный спрос на ускорители GeForce 30-й серии и Radeon RX 6000 говорит о том, что осенние новинки определенно удались. Давайте резюмируем достижения чипмейкеров в этом году, но самое интересное оставим на десерт и будем двигаться в хронологическом порядке.

Radeon RX 5600 XT

Прошедший год не сравнится с рекордным 2019-м по количеству и многообразию представленных графических ускорителей (чего, естественно, не скажешь о качественных изменениях, которые произошли в верхнем ценовом сегменте). Поэтому не видим никаких причин, чтобы проигнорировать единственное важное пополнение в совокупном ряду устройств AMD и NVIDIA, помимо дебютантов GeForce 30-го семейства и Radeon RX 6000. Вдобавок к Radeon RX 5600 XT AMD выпустила для сборщиков систем самую младшую модель 5000-й серии, RX 5300. В свою очередь, под маркой NVIDIA появилось несколько разновидностей GeForce GTX 1650, отличающихся от оригинальной версии памятью GDDR6. Но все перечисленные бюджетные новинки нельзя причислить к решениям, подходящим для современных игр, — у них слабые GPU и небольшой объем VRAM.

SAPPHIRE PULSE Radeon RX 5600 XT

Про Radeon RX 5600 XT этого не скажешь. Даже теперь, когда передовые решения AMD и NVIDIA подняли планку быстродействия на новую высоту, а требовательные игры — такие как Cyberpunk 2077 или Microsoft Flight Simulator — вновь срезали избыток кадровых частот даже на самом мощном железе, RX 5600 XT выдерживает конкуренцию среди видеокарт, ориентированных на разрешение 1080p. Ускорители для игры в этом режиме — самые востребованные, и даже устройства класса Radeon RX 5700 XT, которые были нацелены на 1440p в начале своей карьеры, уже покупают для того, чтобы гарантировать уверенный фреймрейт не меньше 60 FPS в народном 1080p. Топовые модели для 4К-экранов остаются статусными продуктами, да и, по правде говоря, запросы игр снова обгоняют возможности GPU в ультра-высоком разрешении, особенно если речь идет о трассировке лучей без компромиссных решений масштабирования кадра наподобие DLSS или FidelityFX CAS.

AMD редко выпускает на основе одного и того же GPU больше двух розничных моделей в рамках одной продуктовой линейки, но для Radeon RX 5600 XT пришлось сделать исключение — позаимствовать кристалл Navi 10 у Radeon RX 5700 (XT) и в очередной раз урезать его вычислительные блоки. Тем не менее RX 5600 XT полностью воспроизводит конфигурацию Radeon RX 5700, за исключением суженной с 256 до 192 бит шины оперативной памяти. Последнее значит, что у видеокарты осталось всего лишь 6 Гбайт VRAM, но справедливости ради стоит отметить, что это же относится ко всем разновидностям его ближайшего соперника — GeForce GTX 1660.

Radeon RX 5600 XT заполнил широкий промежуток, образовавшийся между Radeon RX 5700 (XT) и двумя модификациям Radeon RX 5500 XT, которые AMD выпустила ранее, вступив в прямое противостояние с GeForce GTX 1660 Ti. Но в итоге истинным конкурентом Radeon RX 5600 XT стал вовсе не GeForce GTX 1660 Ti, а удешевленный, но почти столь же производительный GTX 1660 SUPER. Кроме того, NVIDIA парировала анонс Radeon RX 5600 XT скидкой на GeForce RTX 2060. Все эти видеокарты находятся в довольно тесном диапазоне быстродействия и не предполагают колебаний в объеме оперативной памяти.

Хотя Radeon RX 5600 XT без труда выполнил свою первоначальную миссию в бенчмарках против GeForce GTX 1660 Ti, более доступный GTX 1660 SUPER и дисконтированный GeForce RTX 2060 поставили новинку в незавидное положение. Однако урезанные спецификации всегда можно откатить назад в изменившихся конкурентных условиях. Так и поступила AMD в ответ на удешевление GeForce RTX 2060, санкционировав агрессивный заводской разгон партнерских версий Radeon RX 5600 XT, который выражается в увеличенном резерве мощности и повышенных тактовых частотах. Оверклокинг — не важно, официальный или силами пользователя — расходует лишь небольшую долю частотного потенциала Navi 10, но при этом способен вывести RX 5600 XT прямо на уровень RTX 2060. Разумеется, продукты AMD 5000-й серии не допущены к графическим эффектам на основе трассировки лучей, но и GeForce RTX 2060 трудно освоить передовые игры (такие как Cyberpunk 2077) на максималках и с рейтрейсингом даже при помощи DLSS.

Производитель	AMD
Модель	Radeon RX 5500 XT	Radeon RX 5600 XT	Radeon RX 5700	Radeon RX 5700 XT	Radeon RX 5700 XT Anniversary Edition
Графический процессор
Название	Navi 14 XTX	Navi 10 XLE	Navi 10 PRO	Navi 10 XT	Navi 10 XT
Микроархитектура	RDNA	RDNA	RDNA	RDNA	RDNA
Техпроцесс, нм	7 нм FinFET	7 нм FinFET	7 нм FinFET	7 нм FinFET	7 нм FinFET
Число транзисторов, млн	6 400	10 300	10 300	10 300	10 300
Тактовая частота, МГц: Base Clock / Game Clock / Boost Clock	1 607/1 717/1 845	1 130/1 375/1 560	1 465/1 625/1 725	1 605/ 1755/1 905	1 680/1 830/1 980
Шейдерные ALU FP32	1 408	2 304	2 304	2 560	2 560
Блоки наложения текстур (TMU)	88	144	144	160	160
Блоки операций растеризации (ROP)	32	64	64	64	64
Оперативная память
Разрядность шины, бит	128	192	256	256	256
Тип микросхем	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	1 750 (14 000)	1 500 (12 000)	1 750 (14 000)	1 750 (14 000)	1 750 (14 000)
Объем, Мбайт	4 096/8 192	6 144	8 096	8 096	8 096
Шина ввода/вывода	PCI Express 4.0 x8	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	5 196	7 188	7 949	9 754	10 138
Производительность FP64/FP32	1/16	1/16	1/16	1/16	1/16
Производительность FP16/FP32	2/1	2/1	2/1	2/1	2/1
Пропускная способность оперативной памяти, Гбайт/с	224	288	448	448	448
Вывод изображения
Интерфейсы вывода изображения	DL DVI-D, DisplayPort 1.4, HDMI 2.0b	DisplayPort 1.4, HDMI 2.0b	DisplayPort 1.4, HDMI 2.0b	DisplayPort 1.4, HDMI 2.0b	DisplayPort 1.4, HDMI 2.0b
TBP/TDP, Вт	130	150	185	225	235
Розничная цена (США, без налога), $	4 Гбайт: 169 8 Гбайт: 199 (рекоменд. на дату выхода)	279 (рекоменд. на дату выхода)	349 (рекоменд. на дату выхода)	399 (рекоменд. на дату выхода)	449 (рекоменд. на дату выхода)
Розничная цена (Россия), руб.	4 Гбайт: 12 999 8 Гбайт: 14 299 (рекоменд. на дату выхода)	20 990 (рекоменд. на дату выхода)	25 499 (рекоменд. на дату выхода)	29 499 (рекоменд. на дату выхода)	Н/Д

В итоге Radeon RX 5600 XT по сей день остается актуальным предложением в своей ценовой категории (около 30 тыс. руб.). В разговоре о других новинках 2020 года мы будем оперировать более стабильным долларовыми ценами, но в данном случае удобнее рубли. Дело в том, что «красные» видеокарты серии Radeon RX 5000 под новый год смели с американских торговых площадок, а у нас они по-прежнему широко доступны. Остальные модели 5000-й серии также не спешат уходить с рынка, ведь новейшие устройства Radeon RX 6000 пока заменили лишь верхушку каталога AMD.

NVIDIA GeForce RTX 30: старшие модели

Релиз видеокарт на чипах Turing, которые первыми среди потребительских устройств освоили аппаратное ускорение трассировки лучей, был событием исторического масштаба для самого чипмейкера и игровой 3D-графики в целом. Однако технологический прорыв и, не в последнюю очередь, усугубляющееся отставание AMD дали NVIDIA возможность повысить розничные цены. Основные усилия разработчиков Turing были направлены на расширение функций рендеринга при помощи аппаратного рейтрейсинга и обработки данных нейросетями, но в проектах без трассировки производительность на доллар у GeForce RTX 20-й серии в лучшем случае не изменилась по сравнению с предшествующим поколением. Последнее отлично проиллюстрировали результаты нашего исторического тестирования видеокарт начиная с моделей 2013 года и заканчивая GeForce 20. Наконец, потенциал инновационных технологий далеко не всегда раскрывается в продуктах первого поколения, и по новейшим играм хорошо видно, что младшие модели RTX 20 уже с трудом тянут рейтрейсинг на максималках.

В следующей, 30-й серий GeForce RTX производитель решил исправить сложившуюся ситуацию. Одним предложением новинки можно охарактеризовать так: они получили в 2,5–3 раза больше FP32-совместимых CUDA-ядер, блоки для трассировки лучей второго поколения, и все это доступно за те же деньги, которых стоили непосредственные предшественники свежих моделей. Разумеется, речь идет о рекомендованных ценах. Все новое железо, появившееся осенью прошлого года, до сих пор в большом дефиците и продается по откровенно завышенным ценам.

NVIDIA GeForce RTX 3080 и RTX 3090 Founders Edition

В отличие от Turing, следующая итерация архитектуры NVIDIA, Ampere, в большей степени ориентирована на чистый рост производительности, нежели на функциональные усовершенствования. Тем не менее инженеры NVIDIA не просто раздули чипы Turing еще на несколько миллиардов транзисторов. В логике Ampere есть ряд интересных нововведений, о которых мы подробно писали в осенней аналитической статье, а сегодня кратно резюмируем самую важную информацию.

Пока NVIDIA выпустила лишь два кристалла Ampere потребительской категории — GA102 и GA104. Благодаря тому, что набор 32-битных CUDA-ядер, обрабатывающих вещественные числа, внутри потоковых мультипроцессоров GPU был удвоен, формула главных исполнительных блоков GA102 включает поражающее воображение количество шейдерных ALU — 10 496 FP32 (да и у GA104 их 6144 штуки, а это все еще больше по сравнению с показателем флагманского кристалла семейства Turing). Процессор состоит ни много ни мало из 28 млрд транзисторов — такой компонентный бюджет NVIDIA может себе позволить благодаря миграции с 12-нм техпроцесса TSMC на самсунговский 8-нм.

Графический процессор NVIDIA GA102

Запас сырой вычислительной мощности совсем не помешает в новейших играх со сложными трассированными эффектами, которые чрезвычайно сильно усложняют шейдерные операции. Но одновременно с этим NVIDIA внесла изменения в специализированную логику, выполняющую собственно трассировку лучей в пределах геометрии кадра. Первая итерация данной архитектуры имеет свои ограничения, связанные с тем, что RT-ядро в процессе трассировки отдельно взятого луча сначала ищет лежащий на пути полигон, а уже затем вычисляет координаты пересечения с поверхностью. RT-ядро Ampere может делать и то и другое одновременно с двумя разными лучами. Кроме того, в Ampere появилась функция аппаратно-ускоренного размытия в движении, хотя она полезнее программам для профессиональной визуализации, чем играм.

Тензорные блоки Ampere обрели поддержку структурно-разряженных матриц, которые позволяют существенно увеличить пропускную способность тензорных ядер, хотя в первую очередь это касается опять-таки вычислений, не связанных с игровой графикой. А вот следующая функция вновь напрямую затрагивает игровую производительность. Дело в том, что Turing не позволяет одновременно нагружать блоки трассировки лучей и тензорные ядра в пределах одного потокового мультипроцессора. Графические шейдеры могут исполняться непрерывно по мере рендеринга кадра, но параллельно с ними в отдельный момент времени действует только один тип расчетной нагрузки — либо рейтрейсинг, либо тензорные операции для масштабирования DLSS. В Ampere трассировка лучей, графические шейдеры и DLSS исполняются одновременно, что увеличивает фреймрейт.

Массив вычислительных блоков чипа GA102 обслуживает 384-битная шина оперативной памяти с поддержкой нового типа микросхем, GDDR6X, созданных компанией Micron по заказу NVIDIA. Чипы GDDR6X обеспечивают топовым моделям 30-й серии (GeForce RTX 3080 и RTX 3090) пропускную способность вплоть до 19,5 Гбит/с на контакт, но для этого пришлось решиться на коренное изменение принципов кодирования сигнала, ответственного за передачу данных (WCK). В памяти типа GDDR6 один такт WCK кодирует один бит информации, соответствующий высоком или низкому напряжению проводника. В GDDR6X, напротив, применяется амплитудно-импульсная модуляция PAM4, когда амплитуда сигнала может принимать четыре различных значения и, соответственно, один такт сигнала кодирует два бита данных. В рамках PAM4 открылась возможность вдвое снизить частоту WCK, сохранив прежнюю пропускную способность, а затем постепенно наращивать и то и другое.

Печатная плата NVIDIA GeForce RTX 3080

Другое нововведение, относящееся к локальной памяти видеокарты, это функция RTX IO, которая, впрочем, также доступна старым видеокартам под маркой RTX. Она представляет собой частную реализацию технологии DirectStorage в комплекте игровых API Microsoft. RTX IO должна решить проблемы, возникающие при коммуникации между ПЗУ компьютера, центрального процессора и локальной памяти графической карты, — в таких сценариях, как предварительная загрузка текстур игры или стриминг ресурсов по требованию, который широко используется для преодоления ограничений емкости VRAM. В традиционной логике ввода-вывода передача данных выполняется неоптимальным способом, когда ресурсы сперва копируются в системную память и лишь затем — в память GPU, дважды проходя через интерфейс PCI Express, а компрессия без потерь, которую широко используют разработчики игр, занимает такты центрального процессора. API DirectStorage и технология RTX IO полностью меняют традиционную схему: при помощи DMA-блоков Turing и Ampere графические ресурсы копируются напрямую в VRAM, минуя системную память, и на пути от SSD к видеокарте остаются в сжатом виде. Декомпрессию выполняет сам графический процессор путем асинхронных вычислений на CUDA-ядрах.

Однако это еще не все. NVIDIA добавила в чипы Ampere логику фиксированной функциональности для быстрого декодирования AV1 — нового формата видео, который обеспечивает чрезвычайно высокую степень компрессии по сравнению с распространенными кодеками HEVC (H.265) и VP9, но в то же время нуждается в серьезной вычислительной мощности при софтверном декодировании. И наконец, все представители 30-го семейства оснащаются выходом HDMI версии 2.1. Он может пропускать сигнал с разрешением 8К и кадровой частотой 60 Гц либо 4К и 120 Гц, таким образом, это самый скоростной видеоинтерфейс на домашних ПК. Пока это задел на будущее, но, как показывает история, возможности HDMI 2.1 рано или поздно пойдут в дело.

Однако довольно теоретических рассуждений. На данный момент NVIDIA представила четыре модели 30-й серии: два устройства, основанные на младшем чипе GA104 — GeForce RTX 3060 Ti и RTX 3070, — и два на GA102 — RTX 3080 и RTX 3090. Напомним, что представляют собой новинки, и как они выступили в наших бенчмарках, начиная с RTX 3080.

Производитель	NVIDIA
Модель	GeForce RTX 3060 Ti	GeForce RTX 3070	GeForce RTX 3080	GeForce RTX 3090
Графический процессор
Название	GA104	GA104	GA102	GA102
Микроархитектура	Ampere	Ampere	Ampere	Ampere
Техпроцесс	8 нм (8N)	8 нм (8N)	8 нм (8N)	8 нм (8N)
Число транзисторов, млн	17 400	17 400	28 300	28 300
Тактовая частота, МГц: Base Clock / Boost Clock	1 410 /1 665	1 500 /1 725	1 440 /1 710	1 395 /1 695
Шейдерные ALU FP32	4 864	5 888	8 704	10 496
Блоки наложения текстур (TMU)	152	184	272	328
Блоки операций растеризации (ROP)	80	96	96	112
Тензорные ядра	152	184	272	328
RT-ядра	38	46	68	82
Оперативная память
Разрядность шины, бит	256	256	320	384
Тип микросхем	GDDR6 SGRAM	GDDR6 SGRAM	GDDR6X SGRAM	GDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	1 750 (14 000)	1 750 (14 000)	1 188 (19 000)	1 219 (19 500)
Объем, Мбайт	8 192	8 192	10 240	24 576
Шина ввода/вывода	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	16 197	20 314	29 768	35 581
Производительность FP64/FP32	1/32	1/32	1/32	1/32
Производительность FP16/FP32	1/1	1/1	1/1	1/1
Пропускная способность оперативной памяти, Гбайт/с	448	448	760	936
Вывод изображения
Интерфейсы вывода изображения	DisplayPort 1.4a, HDMI 2.1	DisplayPort 1.4a, HDMI 2.1	DisplayPort 1.4a, HDMI 2.1	DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт	200	220	320	350
Розничная цена (США, без налога), $	399 (рекоменд. в момент выхода)	499 (рекоменд. в момент выхода)	699 (рекоменд. в момент выхода)	1 499 (рекоменд. в момент выхода)
Розничная цена (Россия), руб.	39 990 (рекоменд. в момент выхода)	45 490 (рекоменд. в момент выхода)	63 490 (рекоменд. в момент выхода)	136 990 (рекоменд. в момент выхода)

Старшие модели основаны на одном и том же GPU. Состав исполнительных блоков процессора в RTX 3080 был серьезно урезан, но даже в таком виде ускоритель двукратно превосходит по паспортной пропускной способности FP32-вычислений GeForce RTX 2080 Ti, а RTX 2080 — уже в три раза. На практике стоит ожидать рост игрового фреймрейта в пределах 70 %, если взять за точку отсчета GeForce RTX 2080 SUPER, но и такой результат нельзя не признать впечатляющим рывком быстродействия, который приближается к достижениям архитектуры Pascal. Особенно при том, что GeForce RTX 3080 поступил в продажу по той же рекомендованной цене, что и его формальный предшественник, RTX 2080, — $699. Ключевое слово здесь, конечно, «рекомедованной». Пока дефицит не пойдет на убыль, все новинки будут стоит намного больше. Единственное, в чем NVIDIA пришлось пойти на компромисс, это объем оперативной памяти, который у GeForce RTX 3080 составляет уже не столь внушительные 10 Гбайт. Кроме того, топовые модели Ampere оказались чрезвычайно прожорливыми видеокартами. Прогресс в производительности на ватт имеет место, и все-таки своими достижениями RTX 3080 обязан не в последнюю очередь потребляемой мощности под 300 Вт.

NVIDIA GeForce RTX 3080 Founders Edition

Впрочем, как показал истинный флагман 30-й серии, 300 Вт — это еще не предел. GeForce RTX 3090 расходует вплоть до 350 Вт и стоит подобающе, $1 499. Благо исключительно для игр покупка RTX 3090 лишена всякого смысла, ведь даже в самых благоприятных условиях дополнительные вычислительные ресурсы, которые NVIDIA пробудила в графическом процессоре GA102, способны увеличить кадровые частоты всего лишь на 12 %, а объем оперативной памяти, расширенный до 24 Гбайт, геймерам попросту не нужен. Чипмейкер позиционирует GeForce RTX 3090 как решение для игр в разрешении 8К, и в этом случае от 24 Гбайт VRAM действительно есть польза. Но мы проверили и убедились, что без чрезвычайно агрессивного масштабирования силами DLSS, которое доступно лишь избранным тайтлам, к 8К компьютерное железо еще совершенно не готово (не говоря уже о том, сколько стоят 8К-экраны). На самом деле GeForce RTX 3090 — это просьюмерская видеокарта и прямой наследник устройств под маркой TITAN. Только в профессиональных приложениях, которым требуется больше 10 Гбайт видеопамяти, RTX 3090 действительно отрабатывает свою цену. Да и вообще архитектура Ampere даже лучше, чем в играх, проявляет себя в неграфических вычислениях, начиная от 3D-моделирования или видеомонтажа и заканчивая машинным обучением — традиционно сильнейшей стороной NVIDIA. Неспроста GeForce RTX 3090 оказалась единственной моделью нового поколения, сохранившей разъем NVLink для прямой коммуникации между двумя GPU.

NVIDIA GeForce RTX 3090 Founders Edition

Прежде чем мы перейдем к следующим по старшинству представителям 30-й серии, нужно отдать должное конструкции старших видеокарт Founders Edition. Высокое TBP и чипы оперативной памяти нового типа — из-за всего этого GeForce RTX 3080 и RTX 3090 выдвигают повышенные требования к питанию и охлаждению видеокарт. NVIDIA вышла из положения благодаря необычному кулеру, который содержит всего два вентилятора, но укороченная печатная плата освободила половину радиатора для сквозного продува. Как следствие, оба устройства работают чрезвычайно тихо несмотря на громадную потребляемую мощность, а RTX 3080 Founders Edition удалось сделать еще и неожиданно компактной по меркам высокопроизводительных видеокарт.