Почему дата-центры искусственного интеллекта не могут полагаться только на GPU? Взаимосвязь памяти, сете?

Рынки
Обновлено: 06/30/2026 04:57

В июне 2026 года биткоин держался около отметки 60 000 долларов, а эфир торговался в диапазоне 1 600 долларов, что свидетельствовало о периоде консолидации на крипторынке. В то же время другой сектор — инфраструктура дата-центров для искусственного интеллекта — переживал всплеск активности. По прогнозу Gartner, мировые расходы на IT достигнут 6,31 трлн долларов в 2026 году, увеличившись на 13,5 % по сравнению с предыдущим годом, при этом расходы на системы дата-центров станут лидерами с ростом в 55,8 %. IDC ожидает, что глобальные корпоративные расходы на искусственный интеллект составят 940 млрд долларов в 2026 году.

На фоне этой гонки вычислительных мощностей происходит важный сдвиг в подходах: конкурентоспособность дата-центров для ИИ определяется уже не только количеством GPU или максимальной вычислительной мощностью. В центре внимания оказывается общая синергия вычислений, хранения и сетевых ресурсов внутри кластеров. Понимание того, как память, сеть и хранилище работают вместе, становится ключевым для оценки инвестиционной привлекательности инфраструктуры ИИ.

«Стена памяти»: первый узкий участок в эпоху больших моделей

Размер параметров крупных моделей ИИ за последние два года вырос экспоненциально. С 2024 по 2026 год параметры основных моделей увеличились в сто раз, а контекстные окна расширились с десятков тысяч до миллионов токенов. Однако пропускная способность серверной памяти росла менее чем на 15 % в год, что значительно отставало от темпов развития бизнеса в сфере ИИ. Серьёзное несоответствие между скоростью обновления программного обеспечения и аппаратных компонентов сделало «стену памяти» главным ограничивающим фактором вычислительной мощности ИИ.

Так называемая «стена памяти» означает, что скорость обработки CPU/GPU растёт гораздо быстрее, чем пропускная способность и задержка памяти при чтении и записи данных. Вычислительные чипы работают с огромной скоростью, но данные не успевают поступать вовремя, из-за чего процессоры значительную часть времени простаивают в ожидании. По данным отраслевых тестов, в масштабных GPU-кластерах узкие места при вводе-выводе данных приводят к тому, что GPU простаивают более 40 % времени — почти половина дорогих чипов тратит время на ожидание передачи данных.

Память становится крайне дефицитным ресурсом. Один сервер для инференса ИИ потребляет более чем в десять раз больше DRAM и HBM, чем обычный сервер дата-центра, причём почти 60 % мировых мощностей по производству пластин DRAM уже задействовано для ИИ-кластеров. Особенно острый дефицит наблюдается по HBM: основные производственные мощности забронированы крупными заказчиками до 2026 и даже 2027 года. Gartner отмечает, что рост спроса и ограничения предложения привели к рекордному росту цен на HBM, сделав память сегментом с высокой маржинальностью для производителей микросхем.

Для преодоления «стены памяти» отрасль движется по двум направлениям: первое — оптимизация на уровне программного обеспечения, включая тонкую настройку и компрессию, такие как многоуровневое управление KV-кэшем и квантование с низкой разрядностью, чтобы максимально использовать имеющиеся ресурсы хранения; второе — инновации на уровне аппаратной архитектуры, включая обновления HBM и внедрение новых протоколов межсоединений памяти, например, CXL (Compute Express Link). Платформа NVIDIA HGX Rubin нового поколения увеличила пропускную способность памяти GPU до 176 ТБ/с, что в три раза выше предыдущего поколения. Эти подходы дополняют друг друга и формируют новую логику взаимодействия хранения и вычислений во всей отрасли.

Сети: «нейронная сеть» ИИ-кластеров

Если память отвечает за эффективность передачи данных внутри одного узла, то сеть решает задачу перемещения данных между узлами. В масштабных ИИ-кластерах сотни или тысячи GPU должны работать совместно для обучения или инференса одной модели, поэтому эффективность меж-GPU коммуникаций критически важна для общей скорости обучения.

Сегодня узкие места по пропускной способности существуют на разных уровнях: между чипами традиционные межсоединения на печатных платах уже не соответствуют требованиям по высокой пропускной способности и низкой задержке для ИИ-чипов; внутри серверных стоек пропускная способность между серверами ограничивает вертикальное масштабирование; между дата-центрами пропускная способность и задержка при передаче данных на большие расстояния сдерживают горизонтальное масштабирование и межрегиональное распределение рабочих нагрузок. По оценкам, в современных ИИ-кластерах для обучения энергозатраты на перемещение данных уже превышают затраты на вычисления.

NVLink и InfiniBand от NVIDIA долгое время доминировали на рынке внутренних межсоединений для ИИ-кластеров. Последний NVLink Switch обеспечивает пропускную способность 28,8 ТБ/с, что вдвое больше предыдущего поколения. Однако ситуация меняется: компании AMD и Broadcom разрабатывают собственные решения, а открытые стандарты, такие как UALink (Ultra Accelerator Link), быстро развиваются. К 2026 году рынок сетей перейдёт от «монополии NVIDIA» к конкуренции между несколькими стандартами, что повысит требования к интеграции систем со стороны операторов дата-центров.

Хранилище: от «склада» к «потоку данных»

В традиционных дата-центрах хранилище выполняло функцию «склада данных» — в основном для архивирования и хранения холодных данных. В ИИ-дата-центрах хранилище превратилось в «поток данных» — оно должно непрерывно подавать обучающие данные вычислительным узлам с очень высокой скоростью и поддерживать быстрые чтения параметров моделей при инференсе.

Для обучения ИИ необходим быстрый доступ к огромным объёмам исходных данных, а для инференса — оперативное извлечение весов модели и KV-кэшей. KV-кэши теперь распространяются от HBM GPU вниз к системной DRAM и даже к высокоскоростным локальным SSD. Это стирает границу между хранилищем и памятью, превращая устройства хранения не просто в конечные точки данных, а в ключевые узлы потока данных.

All-flash хранилища вытесняют традиционные жёсткие диски и становятся основным выбором для ИИ-дата-центров. На ISC High Performance 2026 компания Sugon представила all-flash хранилища и продукты с нативной высокоскоростной сетью, что подчёркивает тенденцию отрасли. Производительность хранилища теперь напрямую определяет, успевают ли данные поступить к вычислительным блокам, а значит, влияет на уровень загрузки GPU.

Синергия вычислений, памяти и сети: от точечных прорывов к системной оптимизации

Когда роли и узкие места каждого компонента становятся понятны, появляется смысл понятия «синергия»: реальная вычислительная мощность ИИ-дата-центра — это не просто сумма производительности GPU, пропускной способности памяти, сетевого трафика и IOPS хранилища. Это эффективный результат, возникающий при системном взаимодействии всех четырёх компонентов.

Беспрерывный рост параметров моделей стимулирует появление супер-кластеров ИИ. Работоспособность определяется уже не только производительностью чипов, но всё больше — общей синергией и эффективностью вычислений, хранения и сетевых ресурсов внутри кластера. Такой подход быстро становится отраслевым стандартом.

На практике интегрированный дизайн вычислений, памяти и сети становится стандартом у ведущих производителей. Суперкластер scaleX AI от Sugon реализует эту концепцию, значительно увеличивая эффективность обучения и инференса. Операционная система NVIDIA Dynamo 1.0 для инференса в сочетании с платформой BlueField-4 CMX объединяет GPU, HBM, DRAM хоста, локальный flash и удалённое хранилище на разных уровнях, устраняя изолированность памяти GPU с помощью автоматизированного маршрутизирования горячих и холодных данных.

В отчёте IDC за июнь 2026 года отмечено: конкурентное преимущество в ИИ связано уже не с самой мощной вычислительной техникой, а с тем, насколько эффективно можно превратить ИИ в устойчивую бизнес-функцию с минимальной стоимостью токена. В основе стоимости токена лежит совокупная эффективность вычислений, памяти, сети и хранилища.

Рыночная ситуация: кто выигрывает?

Эта тенденция уже хорошо отражается на капиталовложениях.

В сегменте памяти лидером 2026 года стала SK Hynix. 22 июня 2026 года акции SK Hynix выросли на 6 % до рекордных 2 944 000 KRW, обогнав Samsung и став самой дорогой публичной компанией Кореи, а с начала года их рост составил более 349 %. Micron также показала сильные результаты: квартальная выручка за последнюю неделю июня увеличилась более чем в четыре раза, было объявлено о 16 новых долгосрочных контрактах на поставку. Акции Micron выросли на 16 % в день публикации отчёта.

В сетевом сегменте поставщик оптического волокна Corning достиг исторического максимума в последнюю неделю июня, поскольку рынок переоценил ключевую роль его продукции в ИИ-дата-центрах. Заказы Cisco на инфраструктуру ИИ превысили 9 млрд долларов.

В области серверов и системной интеграции доходы Dell от серверов, оптимизированных для ИИ, за квартал составили 16,1 млрд долларов, что на 757 % больше, чем годом ранее. Supermicro занимает около 70 % рынка технологий прямого жидкостного охлаждения.

Среди операторов дата-центров BOCOM International выделяет GDS (GDS-SW) и SUNeVision (SUNEVISION) как лидеров сегмента, отмечая взрывной рост спроса благодаря генеративному ИИ. UBS также прогнозирует ускорение развития индустрии интернет-дата-центров Китая во второй половине 2026 года.

Как инвестировать в инфраструктуру ИИ через Gate?

Gate предоставляет доступ к более чем 12 500 акциям и ETF на рынках США, Гонконга и Кореи. Инвесторы могут использовать единый аккаунт для прямой торговли глобальными акциями с USDT и другими цифровыми активами, что позволяет гибко распределять средства между криптовалютой и традиционными ценными бумагами.

В сегменте инфраструктуры ИИ-дата-центров Gate охватывает всю цепочку отрасли — от чипов до приложений:

Для американских акций инвесторы могут торговать ключевыми компаниями, такими как NVIDIA (NVDA), AMD, Micron (MU), Broadcom (AVGO), Dell (DELL), Supermicro (SMCI), Corning (GLW) и Cisco (CSCO). Gate поддерживает торговлю до открытия и после закрытия рынка, расширяя торговые часы до 16×5, что позволяет оперативно реагировать на отчёты и публикацию макроданных.

Для гонконгских акций инвесторы могут обратить внимание на операторов дата-центров, таких как GDS (09698.HK) и SUNeVision (01686.HK).

Для корейских акций SK Hynix (000660.KS) является безусловным лидером по HBM, а Jeju Semiconductor играет важную роль на upstream-этапе в производстве оптических материалов для ИИ-дата-центров.

Торговля акциями на Gate предусматривает комиссии от 0,1 %, поддерживает как маржинальный, так и спотовый режимы, а пользователи с портфелем от 2 000 долларов получают эксклюзивные VIP-тарифы. Для инвесторов, желающих получить системную экспозицию к сектору инфраструктуры ИИ-дата-центров, кросс-маркетинговые, мультиактивные и комплексные торговые возможности Gate снижают барьеры для глобального распределения технологических активов.

Заключение

ИИ-дата-центры переходят от эпохи «наращивания GPU» к новой фазе системной оптимизации. Память, сеть и хранилище больше не являются разрозненными компонентами инфраструктуры — теперь это системные переменные, которые в рамках синергии вычислений, памяти и сети совместно определяют реальную отдачу вычислительной мощности ИИ.

Понимание этой логики помогает не только оценивать технологические тенденции, но и формировать прочную аналитическую базу для инвестиционных решений. От чипов до памяти, от сетей до хранилищ, от серверов до операторов дата-центров — вся цепочка отрасли только начинает переоцениваться. Когда краткосрочная волатильность крипторынка пересекается с долгосрочной историей развития инфраструктуры ИИ, открывается новое окно для распределения средств между цифровыми активами и реальным сектором экономики.

FAQ

Вопрос 1: Почему дата-центры ИИ не могут решить проблему вычислительной мощности просто увеличив количество GPU?

GPU — это лишь конечная точка вычислений. Их производительность сильно зависит от того, может ли память своевременно подавать данные, может ли сеть эффективно координировать параллельную работу нескольких GPU, и может ли хранилище быстро обрабатывать большие объёмы чтения и записи данных. В крупных GPU-кластерах узкие места при вводе-выводе приводят к тому, что GPU простаивают более 40 % времени — просто добавлять GPU без решения этих трёх задач означает огромные потери вычислительной мощности.

Вопрос 2: Почему наблюдается такой дефицит HBM?

HBM (High Bandwidth Memory) — стандартная память для ИИ-чипов, её производство сложное, а цикл расширения превышает два года. В 2026 году спрос на инференс ИИ превзойдёт обучение, что дополнительно увеличит спрос на HBM и DRAM большой ёмкости. Большая часть производственных мощностей уже забронирована крупными заказчиками до 2026 и даже 2027 года, поэтому гибкость предложения в краткосрочной перспективе минимальна.

Вопрос 3: Какова основная логика инвестирования в инфраструктуру ИИ-дата-центров?

Основная логика — переход от «доминирования обучения» к «взрывному спросу на весь стек». В 2026 году Microsoft, Google, Amazon и Meta совместно потратят 725 млрд долларов на капитальные расходы на инфраструктуру ИИ. Этот масштаб инвестиций не может быть обеспечен одним сегментом — выигрывает вся цепочка создания стоимости: от чипов и памяти до сетей и операторов дата-центров.

Вопрос 4: Как Gate позволяет торговать акциями, связанными с инфраструктурой ИИ-дата-центров?

Gate предоставляет доступ к более чем 12 500 акциям и ETF США, Гонконга и Кореи. Пользователи могут пополнять счёт USDT и другими цифровыми активами и торговать ключевыми акциями инфраструктуры ИИ, такими как NVIDIA, Micron и SK Hynix, через единый аккаунт. Gate поддерживает торговлю до открытия и после закрытия рынка, маржинальный и спотовый режимы, а комиссии начинаются от 0,1 %.

Вопрос 5: Каковы основные риски инвестирования в инфраструктуру ИИ-дата-центров?

Ключевые риски: (1) несоответствие спроса и предложения может привести к временному избытку предложения — BOCOM International рекомендует следить за циклическими дисбалансами и колебаниями оценки; (2) устойчивость капитальных расходов гипермасштабных облачных провайдеров — J.P. Morgan предупреждает, что рост capex в 2025–2026 годах значительно опережает рост выручки, что создаёт давление на денежные потоки; (3) геополитические риски и экспортные ограничения могут нарушить цепочки поставок передовых чипов.

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement
Нравится содержание