Nvidia Ampere анонс и предварителен анализ

Ето го и дългоочакваният NVIDIA Ampere анонс. Картите дойдоха, цените са обявени и имаме (не)достоверни данни за производителността и ефикасността им. И като цяло какво изобщо разбрахме от анонса на NVIDIA Ampere картите? Преди да говорим за самите карти, бяха показани нови технологии като:

  • RTX I/O – RTX I/O цели ускоряване на зареждането на ресурси чрез използване на видеокартата за декомпресия на файлове. Важно е да отбележим, че в предстоящото поколение конзоли, този подход е рафиниран още по-добре, давайки отделен канал за комуникация между всеки един елемент от цялата система. NVIDIA просто използват предстоящия DirectStorage API от Microsoft, но конзолите ще бъдат със стъпка напред в това отношение.
  • NVIDIA Reflex – Измерване и подобряване на латентността, представена от компютъра/устройството, на което се играе – нарича се „системна латентност“. Системната латентност може да бъде лесно представена като времето между кликане или мърдане на мишката и представяне на това действие на дисплея. Макар начинът на работа на това ново API да не е изцяло изяснен, има възможност тази функционалност да е достъпна само при пълна натовареност на графичната карта. AMD вече имат технология за справяне с този проблем и работи без нужда от допълна интеграция в игрите. Характерният „затворен“ подход на NVIDIA се вижда и тук.
  • Nvidia Broadcast – Магията от цялата за презентация, показваща колко напред е NVIDIA с интегрирането на изкуствен интелект в софтуерното си портфолио. Ако RTX Voice ви е впечатлил, подгответе се за още вълнения с NVIDIA Broadcast. Това ще бъде дефиниращото приложение за стриймъри и броудкастъри. AI, който ви позволява да превърнете всяка стая в студио без нуждата от зелен екран. RTX Voice, за да може гласът ви да бъде на фокус, независимо какво се случва около вас. AI, който може да следи движенията ви и винаги да сте в центъра на кадъра.

И така стигаме и до…

Nvidia Ampere анонс –  RTX 3090, RTX 3080 и RTX 3070

NVIDIA Ampere - RTX 3090 RTX 3080 RTX 3070 спецификации. Източник: anandtech
NVIDIA Ampere – RTX 3090 RTX 3080 RTX 3070 спецификации. Източник: anandtech

Това са данните, които имаме към момента. Съмнително завишен брой CUDA ядра, по-голям брой RT ядра (или поне по-висока производителност), дати, на които да ги очакваме и цени. Цените ще ги коментираме в отделен параграф. До момента се вижда едно: NVIDIA са избрали Samsung за партньор в производството на новият им Ampere дизайн и ще използват 8nm технология.

Всички карти поддържат PCI-E 4.0 и HDMI 2.1 и, както се изрази лидера на компанията:

Всичко е удвоено – тройно удвояване.

Има се предвид, че транзисторите, CUDA ядрата, RT ядрата и Tensor ядрата са удвоени и при трите модела. Това ме навежда на мисълта, че може би по-бюджетните Ampere карти няма да претърпят същите драстични промени като споменатите три модела. Говорейки за тези три модела, само два от тях се възползват от новият дизайн на охлаждането. Макар дизайна да е изключително красив (лично мнение), логиката зад него не е нито нова, нито иновативна.

Охлаждането

NVIDIA Ampere анонс и изображение, илюстриращо потока на въздуха при новите карти
Визуализация на движението на въздуха в „стандартна“ кутия и „стандартно“ монтиране на картата. Източник: nvidia

Много компании и досега са произвеждали задни планки, които са перфорирани и не е рядко срещана практика този вид охлаждане да се комбинира с умалена платка за графичното ядро. Целта е въздуха от отдалеченият вентилатор да преминава безпрепядствено през радиатора. В случая най-иновативното решение е да се сложи вентилатор и отзад, за да подпомогне движението на въздуха. Това има двоен позитивен ефект:

  1. Управлението на въздуха чрез активен вентилатор спомага и за охлаждане на задната част на платката, а това от своя страна позволява дори интегрирането на логика там (в задната част на платката).
  2. Тъй като „предния“ – или в случай на стандартно инсталиране на картата: долния – вентилатор все още следва логиката на blower fan дизайна, част от горещия възду от карта излиза директно през задния край на картата и извън кутията. Останалата топлина се насочва в кутията – нагоре и назад. Това позволява невероятен контрол върху въздушния поток и може би наистина се доближава до „идеалният“ дизайн за използване в „стандартна“ кутия.

Друг интересен коментар, отново фокус от презентацията, беше споменаването на 8К резолюция в същото изречение с RTX и 60 FPS. Досегашният топ модел – RTX 2080 Ti имаше огромни затруднения с поддържането на 60 FPS с включен RTX дори при 1080p – 16 пъти по-ниска резолюция! Ще е интересно да видим как точно това ще бъде постигнато, при какви точно настройки на RTX, кой вид RTX и най-важното: дали DLSS също работи. А, да – и при кои карти това ще бъде възможно.

Интересен факт: 8nm литография от Samsung е малко по-лоша от 10nm технология на TSMC и изостава с повече от 80% в ключови метрики спрямо EUV варианта на 7nm от TSMC. Вижте още информация в статията ни от преди няколко дни.

RTX 3000 серията – цена срещу производителност

Преди да продължим статията, нека изясним едно нещо, и то е важно. Не вадете калкулаторите за инфлация. Не се опитвайте да сравнявате само с миналите поколения на NVIDIA, защото – колкото и да не ви се вярва – те не са монополисти. С тези забележки, какво точно можем да разберем от представянето на картите и техните цени? Няколко основни фактора преди да продължим към отговорите:

  • Nvidia Turing (RTX 2000 серията) не предложи добро съотношение цена/производителност. Никой не беше доволен от невероятния скок в цените. GTX 1080 Ti струваше $699, а RTX 2080 Ti – $999, но реалната цена на RTX 2080 Ti със спецификите на пазара се оказа, че е по-скоро около $1200. Същото не важеше за GTX 1080 Ti, между другото. Какво е важното в тази точка: цената скочи с над 50%, а производителността – с едва 30%.
  • Освен цената, разглеждаме и производителността, а често срещан аргумент за покачената беше точно новата функционалност – RTX, в 2000 серията. Мисля, че всеки един до момента знае, че това беше недодялана имплементация, която беше трудна за интегриране в игрите и видя изключително ниска приемственост в гейминг обществото. За капак на всичко, RTX беше „тежка“ функция и смъкваше производителността с над 70% при първоначалните тестове. След това NVIDIA бяха принудени да смекчат имплементацията на ray tracing в реално време и така стигнаха до консенсус от около 50% удар в производителността. В крайна сметка, обаче, основният план на NVIDIA е RTX да върви ръка за ръка с DLSS, защото иначе RTX просто става трудно-продаваема функционалност, заради лошата производителност. А това означава още повече работа за разработчиците на игри при имплементирането на тези нестандартни функции. Не забравяйте, че конзолите поставят стандарта за разработчиците на игри, а не NVIDIA. А конзолите използват AMD хардуер… Предполагам започвате да виждате проблема?

Какво получаваме това поколение? Огромен скок (под въпрос) в производителността със същите – завишени – цени от миналото поколение и много по-евтин еквивалент на Titan картата.

Ръст в цените между поколенията, включително NVIDIA Ampere
Ръст в цените между поколенията. *Забележка: всяко пресмятане е спрямо предходно поколение.

RTX 3090 цена: $1499 (еквивалент на RTX Titan – $2500)

RTX 3080 цена: $699 (равна цена с RTX 2080)

RTX 3070 цена: $499 (равна цена с RTX 2070)

Ръст в производителността между поколенията. *Забележка: всяко пресмятане е спрямо предходно поколение.
Ръст в производителността между поколенията. *Забележка: всяко пресмятане е спрямо предходно поколение. Данните са взети от базата данни на techpowerup.

 

Както се вижда все още очакваме официални данни от тестове от трети страни. Данните директно от производителя обикновено са подбрани и илюстрират най-добрите случаи. Поради тази причина реших да не ги включвам в таблиците горе – нека почакаме и повидим. През това време, можем да ги обсъдим все пак, нали?

Общите твърдения от NVIDIA са: 2.7x подобрение за шейдърите, 1.7x подобрение за RT and 2.7x за Tensor производителност. Това са големи твърдения. Нека не забравяме, че таблиците горе са за оригиналните RTX 2000 карти. След тях имаше и Super версии, спрямо които компанията има много по-скромни цифри – около 30% (или 1.3х) за стандартна растеризация.

По-интересното в случая е твърдението относно RTX 3070 – по-бърза от RTX 2080 Ti, но на цената на RTX 2070. Предстои да видим как тези цифри ще се променят при тестване от трети страни (и в какви ситуации това може да бъде вярно) и още по-важно – при реална поява на пазара (цените все пак са препоръчителни). Въпреки това, увеличението в количеството включена VRAM (8 към 10GB) е неоспорим бонус.

Допълнителни технологии в RTX 3000 серията

Както казахме в началото, има няколко нови и интересни допълнения – както към самата Ampere архитектура, така и по отношение на съпътстващия софтуер. Нека направим кратък обзор на новостите, но този път съпътстван с коментарите и забележките ни.

RTX I/O 

RTX IO: 100x пропускливост и 20х по-малко използване на процесора. Източник: nvidia
RTX IO: 100x пропускливост и 20х по-малко използване на процесора. Източник: nvidia

RTX I/O цели ускоряване на зареждането на ресурси чрез използване на видеокартата за декомпресия на файлове. Обикновено тази задача изисква двупосочна комуникация и процесорно време. Както отбелязах в началото, в предстоящото поколение конзоли и по-специфично в Playstation 5, този подход е интегриран без допълнителни абстрактни класове. Това се постига чрез бързо SSD и директна и свръх-бърза комуникация между компонентите (до 5,5GB/s), а крайният резултат е намалено процесорно време, т.е. по-голям процесорен ресурс. Макар резултата да е същия, при NVIDIA това освобождаване става за сметка на логика в графичния чип, докато при PS5 има външни ускорители (цялостната архитектура на дизайна е различна). Още една разлика е използването на Microsoft DirectStorage при Ampere.

NVIDIA Reflex

NVIDIA Ampere анонс - Илюстрация на понятията, свързани с латентност. Източник: nvidia
Илюстрация на понятията, свързани с латентност. Източник: nvidia

Идеята е проста: намаляване на тоталната (система) латентност. Пример: това е времето между натискане на левия бутон на мишката и отразяването на действието в монитора. Всички карти от GTX 900 серията насам ще бъдат поддържани. Има няколко детайла, които ме притесняват, обаче. Единият се базира на факта, че целият програмен пакет трябва да бъде интегриран в играта, т.е. е възможно не всички игри да поддържат тази функционалност – при AMD функцията за намаляване на латентността е интегрирана в драйвърите. Другият е, че е възможно използването на G-Sync монитор да е задължително. Не, че такива монитори са лоши – напротив. Просто G-Sync етика покачва цената на монитора. Подобни фактори също трябва да се имат предвид, когато говорим за достъпността на дадена функционалност или технология.

Забележка: Очаквайте по някое време този месец – Септември, 2020 г.

Nvidia Broadcast

Това е, може би, наистина последния пирон в кофчега на AMD и усилията им да се конкурират с AI възможностите на NVIDIA. Това е просто приложение, което можете да изтеглите и след това да се наслаждавате на AI магия в реално време. Можете да превърнете всяка една стая в студио с възможността за подмяна на фона без нужда от зелен екран. Друга възможност, която работи изключително добре (поне в демото) е свързана с проследяване на движението ви и цели винаги да сте в центъра на кадъра. Да, резултиращото видео е леко изрязано, но ако се движите в обхвата на камерата, изглежда така сякаш оператор я управлява.

Nvidia Broadcast включва и RTX Voice в себе си и разчита на NVENC (NVidia ENCoder), който беше интегриран за хардуерно ускорение още в RTX 2000 серията. Проверявайте линка горе, ако искате да изтеглите приложението, защото все още не е достъпно за изтегляне. Можете също да проверявате и във Facebook групата ни за новини по въпроса или да поискате съвет, ако имате нужда от помощ.

Забележка: Ключови думи за новите функционалности в Nvidia Broadcast са: Audio Noise Removal (премахване на страничния шум), Virtual Background Effects (виртуални фонови ефекти, които не изискват зелен екран и обработка) и Webcam Auto Frame (автоматично оформяне на кадъра, като говорителя се използва за центрирането му)

Още новини от анонса…

… който между другото не беше наречен NVIDIA Ampere анонс, а NVIDIA GeForce RTX 30 Series | Official Launch Event или NVIDIA GeForce Special Event.

Обявена беше новата версия на Fortnite с подрръжа на RTX – вижте трейлъра.

NVIDIA Omniverse Machinima – beta версия през Октомври; позволява създаването на реалистични графики за AI-ускорено 3D-реалистично създаване на истории и дори игри; интересна функционалност е възможността за AI генериране на движение на устните, спрямо подадена записана реч – процес, който досега отнемаше дни и множество хора се измества от записана реч и AI алгоритъм.

G6X – ново поколение VRAM; очакваме 2х пропускливост в сравнение с G6 (GDDR6) за еквивалентен период от измерено време.

По време на представянето на „новата flow through“ система, лидера на компанията многократно каза, че това е първата такава система. Важно е да се отбележи, че това не е вярно. Това е първата такава система в техните собствени дизайни – AIB партньорите им произвеждат топ моделите по този начин от повече от 5 години.

RTX 3090 беше нареченеа BFGPU – игра на думи с BFG от популярната Doom поредица.

Ако искате да видите още детайли, имаме два клипа в статията, включително и заглавния клип, който е пълният NVIDIA Ampere анонс. А ако вече сте видели абсолютно всичко, заповядайте в Технологичното общество на България да го обсъдим!

Коментирайте чрез Facebook

Мнения, критики, неточности - пишете ни, не ни жалете!

За Кямил Насуф

Likes computers, flowers, hummus, table tennis and writing.