Графічний процесор зробив Nvidia найціннішою компанією в історії.


Чип, який його замінює, вже одночасно створюють Google, Amazon, Meta, Microsoft та OpenAI.
Ось що це означає для того, куди насправді тече гроші далі.
Перш за все, потрібно зрозуміти, чому GPU став королем.
Поверніться до 2012 року.
Нейронна мережа під назвою AlexNet знищила конкуренцію на глобальному конкурсі розпізнавання зображень, використовуючи одне відкриття.
Паралельна обробка, яку Nvidia вбудувала у GPU для відтворення реалістичної графіки у відеоіграх, структурно ідентична тому, що потрібно для навчання нейронної мережі.
Тисячі менших ядер одночасно виконують матричне множення замість кількох потужних ядер, що виконують послідовні задачі.
Один дослідник взяв GPU і зламав його, щоб розкрити ці можливості паралельних обчислень для глибокого навчання.
Цей момент розпочав десятирічну еру, яка перетворила Nvidia з ігрової компанії у інфраструктурний шар всієї AI-економіки.
За минулий рік було відвантажено шість мільйонів GPU Blackwell.
Один серверний стелаж з 72 GPU Blackwell коштує приблизно 3 мільйони доларів.
Nvidia щотижня відвантажує тисячу таких стелажів.
На короткий момент у жовтні Nvidia стала першою компанією в історії, яка досягла оцінки у 5 трильйонів доларів.
Ось до чого призвело одне відкриття з 2012 року.
Але у GPU є структурна проблема, про яку ніхто голосно не говорив до недавнього часу.
Це універсальний інструмент.
Надзвичайно здатний у широкому спектрі AI-завантажень, але не оптимізований під жодне з них.
У ранню еру буму великих мовних моделей ця гнучкість була важливою.
Навчання вимагало масивних універсальних паралельних обчислень, і GPU робив це краще за все, що було доступне.
Але з розвитком моделей баланс змінився.
Післянавчальні техніки зробили моделі все більш здатними.
Зараз домінуюче навантаження — це не навчання.
Це — inference (виведення).
Коли ви відкриваєте Claude, ChatGPT, Gemini або будь-який AI-продукт і отримуєте відповідь, це — inference.
Кожна транзакція у додатку Starbucks, кожен робочий процес у Salesforce, кожен AI-помічник у ваших EarPods — все inference.
І inference може працювати на менш потужних чипах, запрограмованих для більш конкретних завдань.
Цей один зсув у балансі навантажень і відкрив двері для чипа, який зараз створюється, щоб кинути виклик домінуванню Nvidia.
ASIC — це чип, що змінює карту.
Application Specific Integrated Circuit.
Де GPU — це універсальний інструмент, ASIC — це інструмент для однієї мети.
Жорстко запрограмований виконувати точні математичні операції для одного типу роботи.
Швидше у цій роботі, більш енергоефективний, і значно дешевший у масштабі для цієї роботи, ніж будь-який універсальний GPU.
Обмін — це гнучкість.
Після виготовлення в силіконі ASIC не можна перепрограмувати для іншого завдання.
Але для компаній, що виконують inference у масштабі мільярдів запитів щодня, цей обмін не є недоліком.
Це — саме те, що потрібно.
Google була першою.
TPU, Tensor Processing Unit, запущений у 2015 році, допоміг створити архітектуру трансформерів у 2017.
Трансформер — основа майже кожної сучасної AI-системи, що працює сьогодні.
Сьоме покоління чипів Google, Ironwood, щойно запущено разом із угодою на навчання Claude на до одного мільйона TPU.
Amazon створила Trainium і Inferentia після придбання ізраїльського стартапу з чипів у 2015 році.
Anthropic наразі тренує свої моделі на півмільйоні чипів Trainium2 у дата-центрі Amazon у Індіані без Nvidia GPU.
Trainium забезпечує на 30-40 відсотків кращу цінову продуктивність порівняно з конкурентами на AWS, згідно з даними Amazon.
Meta має власний прискорювач для навчання та inference.
Microsoft має свої чипи Maia для цетрів Azure.
OpenAI створює кастомні ASIC у партнерстві з Broadcom, починаючи з 2026 року.
Кожен великий гіперскейлер одночасно створює свій чип.
Не як експеримент.
Як стратегічне інфраструктурне рішення вартістю сотні мільярдів доларів.
Broadcom — це назва, яку більшість поза індустрією чипів ще не врахували у свою тезу.
Кожен великий гіперскейлер із програмою ASIC співпрацює з принаймні однією компанією з проектування чипів для отримання IP, інженерної експертизи та мережевої інфраструктури для масштабування.
Broadcom домінує на цьому ринку.
TPU Google. Тренувальний прискорювач Meta. Тепер кастомні ASIC OpenAI.
Аналітики, що відстежують цю сферу, оцінюють, що Broadcom захоплює 70-80 відсотків ринку бекенд-ASIC.
Очікується, що цей ринок зростатиме з середньою двоцифровою річною темпом за наступні п’ять років.
Хвиля ASIC прискорюється швидше за ринок GPU.
Broadcom знаходиться в центрі майже всього цього.
А ще є крайовий рівень, за яким ще не слідкує більшість.
Зі зрілістю дата-центрів AI наступним полем бою стане inference на пристрої.
Ваш телефон. Ваша машина. Ваш ноутбук. Ваші носимі пристрої.
Neural Processing Unit — це чип, що забезпечує AI локально, без відправлення даних назад у хмарний сервер.
Конфіденційність, швидкість і економія коштів покращуються, коли inference виконується на пристрої, а не у дата-центрі.
Qualcomm домінує у NPUs для Android.
Чипи серії M від Apple мають спеціальний нейронний двигун для MacBook.
Чипи серії A у нових iPhone мають вбудовані нейронні прискорювачі.
AMD та Intel змагаються за NPUs у Windows-ноутбуках.
Гроші сьогодні зосереджені у дата-центрах.
Але обсяг чипів, необхідних для впровадження AI у кожен телефон, автомобіль, робота та носимий пристрій, у рази більший за ринок дата-центрів.
Цей перехід уже почався.
Геополітичний рівень, що лежить під усім цим, — це обмеження, про яке ніхто у споживчій історії не говорить достатньо.
Майже всі чипи у цій системі — Nvidia Blackwell, Google TPU, Amazon Trainium, Apple A-series — виробляє одна компанія.
Taiwan Semiconductor Manufacturing Company.
TSMC.
Концентрація передового виробництва напівпровідників у Тайвані — це найбільший геополітичний вузол у глобальній гонці AI.
Закон CHIPS започаткував процес створення фабрик TSMC у Арізоні.
Blackwell Nvidia вже у повному виробництві на арізонському заводі.
Intel виробляє передові чипи у новому заводі в Арізоні.
Але останній чип iPhone від Apple все ще потребує процесу TSMC у 3 нанометри, який наразі доступний лише у Тайвані.
Перенесення виробництва напівпровідників до США триває, але за графіком у роки, а не місяці.
Китай створює власний паралельний стек.
Huawei, ByteDance та Alibaba розробляють кастомні ASIC під експортний контроль, що обмежує їх доступ до найсучаснішого обладнання та чипів Blackwell Nvidia.
Гонка за AI-чипи — це не лише технологічне змагання.
Це геополітична війна інфраструктури, що ведеться у силіконі.
Країна, яка забезпечить найсучасніше виробництво та найнадійніше енергопостачання для його роботи, виграє щось набагато цінніше за ринок.
Ось рамка, яка пов’язує усе це разом.
Nvidia здобула свою позицію.
Роки інвестицій у екосистему розробників, CUDA як пропрієтарна програмна оборона, та дорожня карта апаратного забезпечення, що йшла попереду кожного конкурента, створили один із найстійкіших конкурентних переваг у історії технологій.
Ця перевага не зникає за ніч.
Але ринок стає настільки великим, що створює простір для цілого нового шару переможців поруч із Nvidia, а не просто замінює її.
Гіперскейлери зменшують свою залежність від Nvidia через кастомні ASIC.
Broadcom захоплює бекенд-інфраструктуру кожної великої програми ASIC одночасно.
Qualcomm та Apple володіють краєвоюInference-слоєм, оскільки AI переходить у кожен пристрій.
TSMC залишається незамінним вузлом виробництва незалежно від того, яка архітектура чипів переможе.
А під усім цим — енергетична інфраструктура, необхідна для масштабного запуску всього, стає обмеженням, що визначає, хто справді може будувати у швидкості, яку вимагає гонка AI.
Графічний процесор зробив Nvidia найціннішою компанією в історії.
Компанії, які зрозуміли цей момент 2012 року до того, як він став очевидним, ніколи не потребували пояснювати свій час.
Та сама прогалина у розумінні існує й зараз у переході на ASIC.
Люди, що слідкують за рівнем чипів під час гонки моделей, вже розташовані у правильних позиціях.
Ті, хто візьмуться за це сьогодні вночі, зрозуміють, чому завтра.
Переглянути оригінал
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено