Чому центри обробки даних зі штучним інтелектом не можуть покладатися лише на GPU? Дослідження взаємодії

Markets
Оновлено: 30/06/2026 04:57

У червні 2026 року Bitcoin утримувався біля позначки 60 000 доларів, а Ethereum торгувався в діапазоні 1 600 доларів, що сигналізувало про період консолідації крипторинку. Водночас інша галузь — інфраструктура дата-центрів для штучного інтелекту — демонструвала стрімке зростання активності. За прогнозом Gartner, глобальні витрати на IT досягнуть 6,31 трильйона доларів у 2026 році, що становить приріст на 13,5% порівняно з попереднім роком, причому витрати на системи дата-центрів очолять всі категорії з темпом зростання 55,8%. IDC прогнозує, що глобальні корпоративні витрати на AI сягнуть 940 мільярдів доларів у 2026 році.

На тлі цієї гонки обчислювальних потужностей відбувається важлива зміна підходу: конкурентоспроможність дата-центрів AI вже не визначається лише кількістю GPU чи піковою обчислювальною потужністю. Фокус зміщується на загальну синергію обчислень, зберігання та мережевих можливостей у межах кластерів. Розуміння того, як пам’ять, мережа та сховище взаємодіють, стало основою для оцінки інвестиційної цінності інфраструктури AI.

«Стіна пам’яті»: перша вузька ланка епохи великих моделей

Розмір параметрів великих AI-моделей зріс експоненційно за останні два роки. З 2024 по 2026 роки кількість параметрів основних моделей збільшилася у сто разів, а контекстні вікна розширилися з десятків тисяч до мільйонів токенів. Однак пропускна здатність пам’яті серверів зростала менш ніж на 15% щороку, значно відстаючи від темпів розвитку AI-бізнесу. Такий гострий дисбаланс між темпами розвитку програмного забезпечення та апаратного забезпечення зробив «стіну пам’яті» основною вузькою ланкою, що обмежує обчислювальні можливості AI.

Поняття «стіна пам’яті» означає, що швидкість обробки CPU/GPU зростає набагато швидше, ніж пропускна здатність і затримка пам’яті при читанні та записі. Хоча обчислювальні чипи працюють на високій швидкості, дані не можуть надходити достатньо швидко, і процесори змушені витрачати значну частину часу на очікування. За даними галузевих тестів, у великих GPU-кластерах вузькі місця при передачі даних можуть призводити до простою GPU понад 40% часу — тобто майже половина дорогих чипів просто чекає на передачу даних.

Ресурси пам’яті стають надзвичайно дефіцитними. Один сервер для AI-інференсу споживає понад десять разів більше DRAM та HBM, ніж традиційний сервер дата-центру, і майже 60% світової потужності виробництва DRAM-вафель вже спрямовано на AI-кластери. Особливо дефіцитною є HBM: основні виробничі потужності вже заброньовані великими клієнтами до 2026 та навіть 2027 року. Gartner зазначає, що зростання попиту та обмеження пропозиції підняли ціни на HBM до рекордних рівнів, зробивши пам’ять сегментом з високою маржинальністю для виробників напівпровідників.

Для подолання «стіни пам’яті» галузь рухається двома шляхами: по-перше, програмна оптимізація — тонке налаштування та компресія, наприклад, ієрархічне кешування KV та низькобітна квантизація, щоб максимально використовувати існуючі ресурси зберігання; по-друге, апаратна інновація — модернізація HBM та впровадження нових протоколів з’єднання пам’яті, таких як CXL (Compute Express Link). Платформа NVIDIA HGX Rubin нового покоління збільшила пропускну здатність GPU-пам’яті до 176 ТБ/с. Ці два підходи не є взаємовиключними, а навпаки — доповнюють один одного, формуючи нову логіку співпраці між зберіганням та обчисленнями в галузі.

Мережа: «нейронна мережа» AI-кластерів

Пам’ять вирішує питання ефективності передачі даних у межах одного вузла, а мережа — проблему переміщення даних між вузлами. У великих AI-кластерах сотні або тисячі GPU працюють разом для тренування чи інференсу однієї моделі, і ефективність між-GPU-комунікації є критично важливою для загальної швидкості тренування.

Сьогодні вузькі місця пропускної здатності існують на кількох рівнях: між чипами традиційні друковані плати вже не відповідають вимогам високої пропускної здатності та низької затримки для AI-чипів; у межах серверних стійок пропускна здатність між серверами обмежує вертикальне масштабування; між дата-центрами пропускна здатність при передачі на великі відстані та затримки обмежують горизонтальне масштабування та розподіл робочих навантажень між регіонами. За оцінками, у сучасних AI-кластерах енергоспоживання при переміщенні даних вже перевищує енергоспоживання на обчислення.

NVLink та InfiniBand від NVIDIA давно домінують на ринку внутрішніх з’єднань для AI-кластерів. Останній NVLink Switch забезпечує пропускну здатність 28,8 ТБ/с, удвічі більше, ніж попереднє покоління. Однак ця ситуація змінюється — такі компанії, як AMD та Broadcom, розробляють власні рішення для з’єднань, а відкриті стандарти, такі як UALink (Ultra Accelerator Link), швидко розвиваються. До 2026 року мережевий сегмент перейде від «NVIDIA only» до «багатостандартної конкуренції», що підвищить вимоги до інтеграційних можливостей операторів дата-центрів.

Сховище: від «складу» до «потоку даних»

У традиційних дата-центрах сховище виконувало роль «складу даних» — переважно для архівування та зберігання холодних даних. У дата-центрах AI сховище перетворилося на «потік даних» — забезпечує безперервну доставку тренувальних даних до обчислювальних вузлів на надвисокій швидкості та підтримує низькозатратне зчитування параметрів моделей під час інференсу.

AI-тренування потребує швидкого доступу до величезних обсягів сирих даних, а інференс — оперативного зчитування ваг моделей та кешів KV. Кеші KV тепер розширюються від GPU HBM до системної DRAM і навіть до високошвидкісних локальних SSD. Це стирає межу між сховищем та пам’яттю, роблячи пристрої зберігання не лише кінцевими точками для даних, а й ключовими вузлами у потоці даних.

All-flash сховище витісняє традиційні жорсткі диски як основний вибір для AI-дата-центрів. На ISC High Performance 2026 компанія Sugon представила all-flash сховища та нативні високошвидкісні мережеві продукти, підкресливши цю галузеву тенденцію. Тепер продуктивність сховища безпосередньо визначає, чи встигають дані потрапити до обчислювальних блоків, а отже — впливає на рівень використання GPU.

Синергія обчислень, пам’яті та мережі: від точкових проривів до системної оптимізації

Коли ролі та вузькі місця кожного компонента стають зрозумілими, з’являється справжнє розуміння «синергії»: реальна обчислювальна потужність AI-дата-центру — це не просто сума продуктивності GPU, пропускної здатності пам’яті, мережевого трафіку та IOPS сховища. Це ефективний результат, що виникає завдяки системному поєднанню всіх чотирьох компонентів.

Безперервне зростання кількості параметрів моделей стимулює появу супер-кластерів AI. Зручність використання вже визначається не лише продуктивністю чипів, а й загальною синергією та ефективністю обчислень, сховища та мережі у межах кластера. Такий підхід швидко стає галузевим консенсусом.

На практиці щільно інтегрований дизайн обчислень, пам’яті та мережі став стандартом для провідних постачальників. Суперкластер Sugon scaleX AI реалізує цю інтегровану філософію, значно підвищуючи ефективність тренування та інференсу. Операційна система NVIDIA Dynamo 1.0 для інференсу у парі з платформою BlueField-4 CMX забезпечує безшовне з’єднання GPU, HBM, системної DRAM, локального flash та віддалених сховищ на кількох рівнях, руйнуючи ізоляцію GPU-пам’яті завдяки автоматизованому маршрутизуванню гарячих та холодних даних.

У звіті IDC за червень 2026 року чітко зазначено: конкурентна перевага у сфері AI вже не полягає у наявності найпотужніших обчислювальних ресурсів, а у здатності перетворити AI на стійку бізнес-можливість з найменшими витратами на токен. В основі витрат на токен лежить сукупна ефективність обчислень, пам’яті, мережі та сховища.

Ринковий ландшафт: хто виграє?

Ця галузева тенденція вже добре відображена на фінансових ринках.

У сегменті пам’яті SK Hynix став зіркою 2026 року. 22 червня 2026 року акції SK Hynix зросли на 6% до рекордних 2 944 000 KRW, обігнавши Samsung та ставши найдорожчою публічною компанією Кореї, а з початку року прибуток перевищив 349%. Micron також показав сильні результати: квартальний дохід у останній тиждень червня збільшився більш ніж у чотири рази, а компанія оголосила про 16 нових довгострокових контрактів на постачання. Акції Micron підскочили на 16% у день публікації фінансових результатів.

У сегменті мережі постачальник оптоволокна Corning досяг історичного максимуму у останній тиждень червня, оскільки ринок переоцінив ключову роль його продукції у дата-центрах AI. Замовлення Cisco на AI-інфраструктуру перевищили 9 мільярдів доларів.

У сфері серверів та системної інтеграції дохід Dell від серверів, оптимізованих для AI, за квартал склав 16,1 мільярда доларів, що на 757% більше, ніж рік тому. Supermicro володіє близько 70% ринку технології прямого рідинного охолодження.

Для операторів дата-центрів BOCOM International назвав GDS (GDS-SW) та SUNeVision (SUNEVISION) найкращими у секторі дата-центрів, вказавши на вибухове зростання попиту, спричинене генеративним AI. UBS також зазначає, що індустрія інтернет-дата-центрів Китаю значно прискориться з другої половини 2026 року.

Як інвестувати в інфраструктуру AI через Gate?

Gate надає доступ до понад 12 500 акцій та ETF на ринках США, Гонконгу та Кореї. Інвестори можуть використовувати єдиний рахунок для прямої торгівлі глобальними акціями з USDT та іншими цифровими активами, що дозволяє безперешкодно розподіляти кошти між крипто- та традиційними цінними паперами.

У секторі інфраструктури дата-центрів AI Gate охоплює весь ланцюг галузі — від чипів до застосувань:

Для американських акцій інвестори можуть торгувати основними компаніями, такими як NVIDIA (NVDA), AMD, Micron (MU), Broadcom (AVGO), Dell (DELL), Supermicro (SMCI), Corning (GLW) та Cisco (CSCO). Gate підтримує торгівлю до та після основної сесії, розширюючи торгові години до 16×5, що дозволяє оперативно реагувати на фінансові звіти та макродані.

Для гонконгських акцій інвестори можуть зосередитися на операторах дата-центрів, таких як GDS (09698.HK) та SUNeVision (01686.HK).

Для корейських акцій SK Hynix (000660.KS) є беззаперечним лідером у сегменті HBM, а Jeju Semiconductor відіграє ключову роль у виробництві матеріалів для оптичних комунікацій дата-центрів AI.

Торгівля акціями на Gate передбачає комісії від 0,1%, підтримує як маржинальні, так і спотові режими, а користувачі з портфелем від 2 000 доларів отримують ексклюзивні VIP тарифи. Для інвесторів, які прагнуть системного доступу до сектору інфраструктури дата-центрів AI, можливості Gate для крос-ринкової, мульти-активної, комплексної торгівлі знижують бар’єри для розподілу глобальних технологічних активів.

Висновок

Дата-центри AI переходять від епохи «накопичення GPU» до нової фази системної оптимізації. Пам’ять, мережа та сховище вже не є ізольованими компонентами інфраструктури — вони стали системними змінними, які у межах синергії обчислень, пам’яті та мережі спільно визначають реальний результат обчислювальної потужності AI.

Розуміння цієї логіки допомагає не лише оцінювати технологічні тренди, а й надає міцну аналітичну основу для інвестиційних рішень. Від чипів до пам’яті, мережі до сховища, серверів до операцій дата-центрів — весь ланцюг галузі лише починає переоцінюватися. Коли короткострокова волатильність крипторинку перетинається з довгостроковою історією інфраструктури AI, відкривається нове вікно для розподілу між цифровими активами та реальною економікою.

FAQ

Q1: Чому дата-центри AI не можуть вирішити проблему обчислювальної потужності просто додаванням GPU?

GPU — це лише кінцева точка для обчислювального виходу. Їхня продуктивність значно залежить від того, чи може пропускна здатність пам’яті забезпечити дані вчасно, чи мережа здатна ефективно координувати паралелізм між GPU, і чи сховище може швидко обробляти масові операції читання та запису. У великих GPU-кластерах вузькі місця при передачі даних можуть призводити до понад 40% простою GPU — просте накопичення GPU без вирішення цих трьох аспектів призводить до значної втрати обчислювальної потужності.

Q2: Чому HBM така дефіцитна?

HBM (High Bandwidth Memory) — стандартна пам’ять для AI-чипів, з складними виробничими процесами та циклами розширення понад два роки. У 2026 році попит на AI-інференс перевищить тренування, що ще більше підвищить попит на HBM та DRAM великої ємності. Більшість виробничих потужностей вже заброньовано великими клієнтами до 2026 та навіть 2027 року, тому у короткостроковій перспективі пропозиція дуже обмежена.

Q3: Яка основна логіка інвестування в інфраструктуру дата-центрів AI?

Основна логіка полягає у переході від «домінування тренування» до «вибуху попиту на весь стек». У 2026 році Microsoft, Google, Amazon та Meta разом витратять 725 мільярдів доларів на капітальні витрати для інфраструктури AI. Такий масштаб інвестицій не може бути забезпечений лише одним сегментом — виграє вся ланцюгова структура, від чипів і пам’яті до мережі та операцій дата-центрів.

Q4: Як Gate забезпечує торгівлю акціями, пов’язаними з інфраструктурою дата-центрів AI?

Gate надає доступ до понад 12 500 акцій та ETF США, Гонконгу та Кореї. Користувачі можуть поповнювати рахунок USDT та іншими цифровими активами і торгувати основними акціями AI-інфраструктури, такими як NVIDIA, Micron та SK Hynix, у єдиному рахунку. Gate підтримує торгівлю до та після основної сесії, маржинальні та спотові режими, з комісіями від 0,1%.

Q5: Які основні ризики інвестування в інфраструктуру дата-центрів AI?

Основні ризики включають: (1) дисбаланс між попитом і пропозицією може призвести до тимчасового надлишку — BOCOM International зазначає необхідність стежити за циклічними дисбалансами та коливаннями оцінок; (2) стійкість капітальних витрат гіпермасштабних хмарних провайдерів — J.P. Morgan попереджає, що зростання капітальних витрат у 2025–2026 роках значно випереджає зростання доходів, що тисне на грошові потоки; (3) геополітична напруженість та експортний контроль можуть порушити ланцюги постачання передових чипів.

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement
Вподобати контент