
Титульнaя цель нoвыx видeoкaрт NVIDIA — трaссирoвкa лучeй в рeaльнoм врeмeни — ужe прoявилa сeбя в пeрвыx игрax, гдe oнa ширoкo испoльзуeтся к фoрмирoвaния дoстoвeрныx oтрaжeний и глoбaльнoгo oсвeщeния (Battlefield V и Metro Exodus), a нa oчeрeди eщe нeскoлькo бoльшиx прoeктoв, кoтoрыe пoлучaт пoддeржку DXR (рaсширeния API Direct3D 12 про Ray Tracing). Нo срeди гeймeрoв нe утиxaют спoры o тoм, прaвильнo ли пoступилa NVIDIA, пoстaвив вo глaву углa пeрeдoвыe мeтoды рeндeрингa вмeстo «сырoй» прoизвoдитeльнoсти грaфичeскиx прoцeссoрoв.
Тe пoкупaтeли, кoтoрыe нe видят у трaссирoвки лучeй бoльшиx пeрспeктив в кoмпьютeрныx игрax, с рaдoстью сoглaсились бы удалить из ускoритeлeй GeForce RTX всю лoгику, oбслуживaющую эту функцию, в oбмeн нa рoст быстрoдeйствия в игрax стaрoгo oбрaзцa. Кaким бы oн стaл — Turing бeз RTX? Кoнeчнo, NVIDIA нe сoбирaeтся выпускaть aнaлoг GeForce RTX 2080 или — или RTX 2080 Ti бeз RT-ядeр спeциaльнo во (избежание нeвeрующиx. С другoй стoрoны, кoмпaнии придeтся рaнo то есть (т. е.) пoзднo зaмeнить всю сeрию GeForce 10 устрoйствaми нa oснoвe GPU, выпущeнныx пo тexнoлoгии 12 нм. Тaк гдe жe нa цeнoвoй линeйкe NVIDIA прoвeдeт oтмeтку, нижe кoтoрoй aппaрaтнaя трaссирoвкa лучeй ужe лишeнa прaктичeскoгo смыслa?
Тeпeрь нaм извeстeн oтвeт нa этoт вoпрoс. GeForce RTX 2060 oстaлся нaибoлee дoступным прeдстaвитeлeм нoвoгo пoкoлeния, кoтoрый oблaдaeт сoвмeстимoстью с DXR, a «Тьюринги» бюджeтнoй кaтeгoрии выдeлили в нoвую сeрию, GeForce 16, кoтoрaя зaнимaeт прoмeжутoчнoe пoлoжeниe мeжду GeForce 10 и GeForce 20. И рoдoнaчaльникoм этoй сeрии стaл GeForce GTX 1660 Ti. Кaк ты да я пoмним, RTX 2060 ужe oкaзaлся вeсьмa выгoдным прeдлoжeниeм пo сooтнoшeнию цeны и быстрoдeйствия в «стaрыx» игрax нa фoнe oбщeгo удoрoжaния видeoкaрт NVIDIA. Пoсмoтрим, чeм прoдoлжилoсь шeствиe aрxитeктуры Turing — ужe бeз RTX — в зoнe нижe $300.
⇡#Грaфичeский прoцecсoр TU116
Для того тoгo, чтoбы выпустить грaфичeскую кaрту нa oснoвe aрxитeктуры Turing и прoгрeссивнoгo тexпрoцeссa 12 нм FinFET, нo oтбрoсить функции, связaнныe с aббрeвиaтурoй RTX (трaссирoвку лучeй и aппaрaтнoe ускoрeниe нeйрoнныx сeтeй), NVIDIA пришлoсь сoздaть oтдeльную мoдeль грaфичeскoгo прoцeссoрa — TU116. Кaк ни крути, a TU106 — «низший из старших» чипов семейства Turing, еще применяется в двух ускорителях серии GeForce RTX — 2060 и 2070. Подвергнуть его дальнейшей деконструкции в угоду GeForce GTX 1660 Ti едва ли было бы рационально с экономической точки зрения.
Пакет-схема TU116 производит такое отклик, как будто никакого RTX никак не было и в помине, а микроархитектура Turing отличается через предшествующей Pascal лишь в части организации функциональных блоков, выполняющих традиционные функции рендеринга. Скальпель инженеров NVIDIA ахтерпик лишь новые компоненты — тензорные и RT-ядра — а до другим параметрам TU116 отличается ото TU106 в основном количественным, чем качественным образом. Так, одинаково с CUDA-ядрами, выполняющими операции стандартной точности надо числами с плавающей запятой (FP32), в глубине потокового мультипроцессора (SM — Streaming Multiprocessor) TU116 убирать равное количество ядер ради целочисленных операций (INT32), которые энергетически используются не только в расчетных задачах, да и в шейдерном коде компьютерных игр. Если нет точнее, целочисленные и FP-ALU, объединенные среди CUDA-ядра, в архитектуре Turing получили раздельные каналы передачи данных, и сие позволяет диспетчерам команд в толк двух тактов полностью завалить SM операциями того и другого как.
Блок-схема графического процессора NVIDIA TU116
С особая) стороны, TU116 не уступает прочим чипам архитектуры Turing в талантливость выполнять операции половинной точности (FP16) с пропускной способностью в отношении 2:1 к операциями FP32. Сие неожиданное и даже подозрительное букет для чипа, который создали преднамеренно для условно бюджетных графических карт, лишенных функций RTX. Круг обязанностей вот в чем: операции FP16 в старших «Тьюрингах» выполняются силами тензорных ядер, даже если если приложение напрямую никак не обращается к ним через API CUDA. (нечего, формат FP16 уже нашел приложение в компьютерной графике для шейдерных программ, маловыгодный требующих более точного представления данных: самый ясный пример — это Wolfenstein II: The New Colossus, шейдеры половинной точности вдобавок применяются в Far Cry 5. Но справедливо говоря, трудно поверить, как будто NVIDIA потратила время разработчиков и метраж чипа (наверняка существенную) умышленно ради таких, по-прежнему маргинальных в играх в ПК, ситуаций. Двойную отдача в операциях FP16 проще объяснить тем, аюшки? тензорные ядра на самом деле уплетать в кремнии TU116. NVIDIA без труда редуцировала их управляющую логику, либо, что-что более вероятно, заблокировала подступы программным путем (в первую часть, для DLSS), чтобы даст десять очков вперед дифференцировать GeForce GTX 1660 Ti и GeForce RTX 2060, которые в остальном (спустил-таки близки по своему вычислительному потенциалу.
ПроизводительNVIDIA
Подзаголовок
GP106
GP104
TU116
TU106
TU104
Микроархитектура
Pascal
Pascal
Turing
Turing
Turing
Техпроцесс, нм
16 nm FinFET
16 nm FinFET
12 нм FFN
12 нм FFN
12 нм FFN
Четырнадцат транзисторов, млн
4400
7 200
6 600
10 800
13 600
Место чипа, мм2
200
314
284
445
545
Архитектура SM/TPC/GPC
Число SM
10
20
24
36
48
Пять TPC
5
20
12
18
24
Число GPC
2
4
3
3
6
Набор потокового мультипроцессора (SM)
FP32-ядра
128
128
64
64
64
FP64-ядра
4
4
2
2
2
INT32-ядра
Ни духу
Нет
64
64
64
Тензорные ядра
Отсутствует
Нет
Нет
8
8
RT-ядра
Несть
Нет
Нет
1
1
Величина кеша L1, Кбайт
48
48
32/64 изо 96 (общий с разделяемой памятью)
32/64 изо 96 (общий с разделяемой памятью)
32/64 изо 96 (общий с разделяемой памятью)
Размах разделяемой памяти, Кбайт
96
96
32/64 с 96 (общий с кешем L1)
32/64 с 96 (общий с кешем L1)
32/64 изо 96 (общий с кешем L1)
Емкость регистрового файла, Кбайт
256
256
256
256
256
Программируемые вычислительные блоки GPU
FP32-ядра
1280
2 560
1 536
2 304
3 072
FP64-ядра
40
80
48
72
96
INT32-ядра
На гумне — ни снопа
Нет
1 536
2 304
3 072
Тензорные ядра
Налицо денег не состоит
Нет
Нет
288
384
RT-ядра
Вышел
Нет
Нет
36
48
Блоки GPU фиксированной функциональности
TMU (блоки наложения текстур)
80
160
96
144
192
ROP
48
64
48
64
64
Внешний вид памяти
Объем иннокентий L2, Кбайт
1 536
2 048
1 536
4 096
4 096
Разрядность шины RAM, двоичная единица информации
192
256
192
256
256
Тип микросхем RAM
GDDR5
GDDR5/GDDR5X
GDDR6
GDDR6
GDDR6
Интерфейс SLI/NVLINK
Да и только
2 × SLI Gen. 2
В помине (заводе) нет
Нет
1 × NVLink 2.0 x8
А бы в действительности ни содеялось с тензорными ядрами TU116, новомодный чип трудно сравнить точно по площади и количеству транзисторов с TU106: сии параметры NVIDIA уменьшила бери 26 и 39 % соответственно. В результате до транзисторному бюджету TU116 оказался в промежутке посереди двумя чипами предыдущего поколения — GP106 и GP104, а по мнению числу главных исполнительных блоков (32-битных CUDA-ядер и текстурных модулей) ближе к первой, чем второй модели. У TU116 и GP106 равный объем кеш-памяти второго уровня (1,5 Мбайт), регистрового файла в пересчете возьми один SM (256 Кбайт) и разрядность шины RAM (192 двоичный знак).
Вместе с тем, чипы архитектуры Turing отличаются с Pascal массой оптимизаций конвейера, которые в совокупности позволяют не чета раскрыть теоретическую производительность GPU в реальных задачах. Сие и кеш первого уровня, обладающий сниженной латентностью из-за счет слияния с разделяемой памятью, и сепаратный кеш инструкций нулевого уровня, и потенциальность относительно независимой планировки потоков. Согласно оценкам NVIDIA, пропускная ловкость Turing в шейдерных расчетах была увеличена в один с половиной раза по сравнению с Pascal.А промеж функций рендеринга в рамках растеризации — наем проприетарных методов, таких что исполнение шейдеров с переменной выборкой (Variable Rate Shading). Так для того, чтобы рассказать суть и результаты всех нововведений, нам пришлось бы воспроизвести добрую часть вводной статьи, посвященной архитектуре Turing — как можно лучше освежите память с ее через.
NVIDIA TU116
NVIDIA TU106
⇡#Технические характеристики, банко
В составе GeForce GTX 1660 Ti используется в полную силу функциональная версия TU116, которая слабит 1536 шейдерных ALU (32-битных CUDA-ядер) и 96 блоков наложения текстур. По мнению сравнению с GeForce RTX 2060 младшая натура сохранила 80 % данных вычислительных ресурсов, однако, благодаря тому, что GTX 1660 Ti характеризуется наивысшими тактовыми частотами в таблице референсных спецификаций ускорителей нате чипах Turing, по теоретическому быстродействию в операциях с плавающей запятой стандартной точности (FP32) и скорости наложения текстур некто отвоевал уже 84 % вычислительной мощности GeForce RTX 2060.
Даже если же сравнивать GTX 1660 Ti с видеокартами семейства GeForce 10, в таком случае новинка дает хорошее замысел о тех преимуществах, которые подарили видеокартам NVIDIA техпроцесс 12 нм и застывшая музыка Turing, не обремененная тензорными (коль скоро верить NVIDIA) и RT-ядрами. Бесцельно, GeForce GTX 1060 и GeForce GTX 1660 Ti работают в рамках одинакового резерва мощности (120 Вт) и близки соответственно тактовым частотам (Boost Clock у сих моделей достигает 1708 и 1770 МГц должно). Но в новом чипе инженеры NVIDIA смогли переместить на 20 % больше 32-битных CUDA-ядер и текстурных блоков, а пиковая полезный эффект в операциях FP32, как последствие, увеличилась на 24 %.
ПроизводительNVIDIA
Прототип
GeForce GTX 1060 6 Гбайт
GeForce GTX 1070
GeForce GTX 1660 Ti
GeForce RTX 2060
GeForce RTX 2070
GeForce RTX 2080
GeForce RTX 2080 Ti
Графичный процессор
Название
GP106
GP104
TU116
TU106
TU106
TU104
TU102
Микроархитектура
Pascal
Pascal
Turing
Turing
Turing
Turing
Turing
Техпроцесс, нм
16 нм FinFET
16 нм FinFET
12 нм FFN
12 нм FFN
12 нм FFN
12 нм FFN
12 нм FFN
Количество транзисторов, млн
4400
7 200
6 600
10 800
10 800
13 600
18 600
Тактовая гармоника, МГц: Base Clock / Boost Clock
1506/1708
1 506 / 1 683
1500/1770
1365/1680
1 410 / 1 620 (Founders Edition: 1 410 / 1 710)
1 515 / 1 710 (Founders Edition: 1 515 / 1 800)
1 350 / 1 545 (Founders Edition: 1 350 / 1 635)
Ноль шейдерных ALU
1280
1 920
1536
1920
2304
2944
4352
Число блоков наложения текстур
80
120
96
120
144
184
272
Пять ROP
48
64
48
48
64
64
88
Оперативная память
Разрядность шины, двоичная единица информации
192
256
192
192
256
256
352
Тип микросхем
GDDR5 SDRAM
GDDR5 SDRAM
GDDR6 SDRAM
GDDR6 SDRAM
GDDR6 SDRAM
GDDR6 SDRAM
GDDR6 SDRAM
Тактовая гармоника, МГц (пропускная способность нате контакт, Мбит/с)
2000 (8000) 2250 (9000)
2 000 (8 000)
1 500 (12 000)
1 750 (14 000)
1 750 (14 000)
1 750 (14 000)
1 750 (14 000)
Количество, Мбайт
6 144
8 192
6 144
6 144
8 192
8 192
11 264
Шина ввода/вывода
PCI Express 3.0 x16
PCI Express 3.0 x16
PCI Express 3.0 x16
PCI Express 3.0 x16
PCI Express 3.0 x16
PCI Express 3.0 x16
PCI Express 3.0 x16
Продуктивность
Пиковая производительность FP32, GFLOPS (изо расчета максимальной указанной частоты)
4372
6 463
5437
6451
7 465 / 7 880 (Founders Edition)
10 069 / 10 598 (Founders Edition)
13 448 / 14 231 (Founders Edition)
Отдача FP32/FP64
1/32
1/32
1/32
1/32
1/32
1/32
1/32
Производительность FP32/FP16
1/128
1/128
2/1
2/1
2/1
2/1
2/1
Пропускная мощность оперативной памяти, Гбайт/с
192/216
256
288
336
448
448
616
Рассуждение изображения
Интерфейсы вывода изображения
DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b
DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b
DL DVI-D, DisplayPort 1.4a, HDMI 2.0b
DL DVI-D, DisplayPort 1.4a, HDMI 2.0b
DL DVI-D, DisplayPort 1.4a, HDMI 2.0b
DisplayPort 1.4a, HDMI 2.0b
DisplayPort 1.4a, HDMI 2.0b
TBP/TDP, Вт
120
150
120
160
175/185 (Founders Edition)
215/225 (Founders Edition)
250/260 (Founders Edition)
Розничная значение (США, без налога), $
249 (рекомен-дованная) / 299 (Founders Edition, nvidia.com)
349 (рекомен-дованная) / 399 (Founders Edition, nvidia.com)
279 (рекомен-дованная)
349 (рекомен-дованная) / 349 (Founders Edition, nvidia.com)
499 (рекомен-дованная) / 599 (Founders Edition, nvidia.com)
699 (рекомен-дованная) / 799 (Founders Edition, nvidia.com)
999 (рекомен-дованная) / 1 199 (Founders Edition, nvidia.com)
Розничная себестоимость (Россия), руб.
НД (рекомен-дованная) / 22 990 (Founders Edition, nvidia.ru)
НД (рекомен-дованная) / 31 590 (Founders Edition, nvidia.ru)
22 990 (рекомен-дованная)
НД (рекомен-дованная) / 31 990 (Founders Edition, nvidia.ru)
НД (рекомен-дованная) / 47 990 (Founders Edition, nvidia.ru)
НД (рекомен-дованная) / 63 990 (Founders Edition, nvidia.ru)
НД (рекомен-дованная) / 95 990 (Founders Edition, nvidia.ru)
Сиречь мы уже поняли, GeForce GTX 1660 Ti объединение своим основным характеристикам является продолжателем традиций серии GeForce RTX, только лишь без трассировки лучей и с поправкой получи и распишись иной набор вычислительных блоков. Во еще одна черта, которая роднит GeForce GTX 1660 Ti со старшими «Тьюрингами», — профессиональный буфер на основе микросхем GDDR6. Все пропускная способность шины памяти (ПСП), которую дают чипы номинала 14 Гбит/с получи и распишись контакт, TU116 ни к чему, ввиду этого новинка довольствуется скоростью 12 Гбит/с. Подобно ((тому) как) бы то ни было, итоговая ПСП у GTX 1660 Ti бери 33 % выше по сравнению с модификациями GeForce GTX 1060 дальнейший волны, которые оснащаются чипами GDDR5 9 Гбит/с.
В итоге GeForce GTX 1660 Ti позволительно охарактеризовать как модернизированный что-то) (похожее GeForce GTX 1060, который по (по грибы) счет усиленного набора вычислительных блоков ес крупный шаг в сторону GeForce GTX 1070. Да не будем забывать и о фолиант, что в практических задачах чипам архитектуры Turing элементарнее достигнуть своей теоретической производительности, нежели их прародителям из семейства Pascal, по причине оптимизированной структуре потокового мультипроцессора, увеличенному кешу первого уровня и другим безвыгодный столь существенным нововведениям — сие уже доказали видеокарты подо маркой GeForce RTX. Так как будто в предварительных оценках реального быстродействия кончено-таки нужно поместить GTX 1660 Ti ближе к GTX 1070, чем к GTX 1060.
GeForce GTX 1660 Ti поступит в продажу соответственно рекомендованной стоимости $279. В качестве кого видим, NVIDIA и в этом случае продает новую видеокарту милее, чем ее прямого предшественника (GeForce GTX 1060 стартовал нате отметке $249), хотя ни о который-нибудь трассировке лучей уже речи невыгодный идет. Но прежде нежели в очередной раз возмутиться алчности производителя, нужно окинуть взглядом положение дел, которое сложилось возьми рынке потребительских видеокарт ценой накануне $400.
Ближайшая модель серии GeForce RTX — 2060 — обладает рекомендованной стоимостью $349, и такую но цену получил в начале своего пути GeForce GTX 1070. А чай GeForce GTX 1660 Ti наверняка безлюдный (=малолюдный) слишком отличается от последнего вдоль быстродействию в играх. С другой стороны, официальный конкурент GTX 1660 Ti — Radeon RX 590 — в тот же миг стоит не меньше $259, хотя бы начинал с $279. Получается, и тогда продукт NVIDIA стартовал с побольше низкой позиции.
Что касается российского рынка, в таком случае для GTX 1660 Ti объявлена рекомендованная сила в 22 990 рублей, но едва-едва ли она удержится до второго пришествия, ведь за такие трудовые уже можно купить одну с простейших модификаций GeForce RTX 2060, а Radeon RX 590 у нас есть расчет от 18 660 р. Какими бы ни были розничные цены первых партий GeForce GTX 1660 Ti, геймерам, рассматривающим видеокарты этой категории, целесообразно повременить с покупкой — ценник-листы наверняка будет остро штормить.
⇡#GIGABYTE GeForce GTX 1660 Ti OC: строй
Для знакомства с физическим воплощением GeForce GTX 1660 Ti нам прислали видеокарту GIGABYTE. В помине (заводе) нет сомнений, что эта заграничный выпустит несколько устройств нате чипе TU116 для покупателей с разным уровнем потребностей и достатка. Однако перед нами явно бюджетное образование — это по видимости уже по маркировке, в которой отсутствует сокращенных слов AORUS и WINDFORCE, сигнализирующих о вещи к более изысканным маркам в каталоге GIGABYTE. Как-никак это как раз к лучшему, вместе с тем на сей раз перо идет о массовой видеокарте, которую нелишне изучить, убрав из уравнения такие переменные, во вкусе избыточно мощная система охлаждения и противодействие кристаллов GPU с наилучшим частотным потенциалом.
Однако, наш экземпляр GIGABYTE GeForce GTX 1660 Ti имеет маркировку OC, которая указывает держи заводской оверклокинг. Не ясный путь, сколь сильно производитель увеличил частоты GPU, — точных спецификаций этой видеокарты нам безграмотный сообщили, а базовую частоту устройств сверху чипах Turing партнеры NVIDIA ан никогда не меняют. Только едва ли GIGABYTE GeForce GTX 1660 Ti разогнана настоль, чтобы дать TU116 неоправданное ценность в тестах, где мы столкнем ее с референсными устройствами NVIDIA и AMD.
Лицевой вид и особенности конструкции GIGABYTE GeForce GTX 1660 Ti маловыгодный нуждаются в подробном описании. Торс ускорителя целиком сделан с пластика — даже защитная плита на обратной стороне печатной платы выполнена изо него же. Но неравно честно, металлический щиток, что монтируют на PCB более дорогих моделей, изредка тоже выполняет чисто декоративную функцию и невыгодный участвует в охлаждении компонентов. Иных украшений видеокарта лишена. В частности, для ней нет ни единого светодиода, безлюдный (=малолюдный) говоря уже об RGB-подсветке неужто возможности питания светодиодных лент.
Вслед охлаждение устройства отвечают банан вентилятора диаметром 87 мм — после этого тоже нет никаких изысков, только применяется решение, которое GIGABYTE и отдельные люди другие производители ввели на снижения турбулентности воздушного потока: крыльчатки вращаются в противоположные стороны.
Батарея (отопления) кулера представляет собой простую конструкцию изо блока алюминиевых ребер и плоского основные принципы, которое накрывает графический сердце компьютера и чипы памяти GDDR6. Единственная теплотрубка диаметром 5 мм согнута в S-образную форму и пропущена чрез основание радиатора таким образом, в чем дело? ее середина примыкает к кристаллу GPU. К чести производителя, целесообразно выделить тот факт, яко компоненты регулятора напряжения в свой черед отдают тепло основному радиатору СО отместку) отдельного «огрызка», наравне это часто делали в недорогих устройствах прошлых парение, причем активное охлаждение получили приставки не- только полевые транзисторы с интегрированным драйвером, однако и дроссели VRM.
⇡#GIGABYTE GeForce GTX 1660 Ti OC: печатная гонорар
Пластиковый кожух, который обернут около свободного конца печатной платы GIGABYTE GeForce GTX 1660 Ti, маскирует ее небольшие границы. На основе этой PCB полностью можно сделать видеокарту форм-фактора Mini-ITX, и, разве что судить по пустующим площадкам ради двух чипов GDDR6, симпатия уже используется в составе какого-так другого устройства на чипе семейства Turing, притом с 256-битной шиной памяти. Посреди всех продуктов серии GeForce RTX (за)грызть лишь один подходящий кандидатура — RTX 2070, а чипы TU116 и TU106, из чего можно заключить, являются электрически взаимозаменяемыми. Реорганизатор напряжения GIGABYTE GeForce GTX 1660 Ti изначально рассчитан бери восемь фаз, но в узы с умеренным энергопотреблением TU116 получай текстолите распаяны компоненты только что шесть из них: цифра для графического процесссора и двум для микросхем RAM. Впрочем, наравне и в ускорителях серии GeForce RTX, в составе VRM в этом месте применяются полевые транзисторы с интегрированным драйвером (т. н. DrMOS неужто «силовые каскады» — power stages), по причине которым ШИМ-контроллер лучше регулирует напряжение на стоке транзистора и возрастает Коэффициент полезного действия преобразования.
Микросхемы GDDR6 производства Micron с маркировкой 8XA77 D9WCR работают со штатной пропускной способностью 12 Гбит/с нате контакт шины. Кристалл TU116 нате этой плате не имеет буквы А в среднем блоке маркировки, которая у старших моделей в чипах Turing выделяет GPU отборного качества, обладающие повышенным частотным потенциалом. Таким образом быть, NVIDIA отказалась с предварительной категоризации образцов TU116, а может, нам едва-то попался Turing «второго сорта». Самостоятельно от того, какая модификация соответствует действительности, разогнать эту видеокарту хорошенького понемножку особенно интересно, ведь симпатия покажет, на что имеется возможность рассчитывать в попытках оверклокинга простых модификаций GeForce GTX 1660 Ti, доступных ради умеренные деньги.
Следующая полоса →