Основное обновление инфраструктуры: партнерство продолжается в области оптимизации SGLang DeepSeek R1 на платформе NVIDIA's GB200 NVL72.
Это сотрудничество сосредоточено на расширении возможностей inference с помощью передовых аппаратных ускорений. Архитектура GB200 NVL72 обеспечивает серьезную вычислительную мощность, делая ее естественным выбором для продвинутых моделей рассуждения.
Что здесь интересно? Комбинация фреймворка SGLang с возможностями DeepSeek R1 может открыть новые уровни эффективности для крупномасштабных AI-операций. Платформа NVIDIA предоставляет необходимую мощность для обработки сложных inference-нагрузок.
Для тех, кто следит за развитием инфраструктуры AI в крипто- и Web3-сферах, такие оптимизационные работы важны. Лучшие inference-двигатели означают более быстрые и дешевые операции для всего — от on-chain аналитики до автоматизированных торговых систем.
Эволюция технологического стека продолжается.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
18 Лайков
Награда
18
8
Репост
Поделиться
комментарий
0/400
FOMOmonster
· 12-12 08:01
gb200 nvl72 Эта аппаратная начинка действительно безумна, deepseek r1, работающий на ней, вероятно, взлетел
sglang Оптимизация этой части действительно интересная, на стороне on-chain должно быть очень круто
Еще одна волна гонки инфраструктуры, кто первым использует — тот выигрывает
Точность вывода увеличивается — стоимость может снизиться, это очень важно для ai торговых систем
nvidia снова определила правила игры
Если чип GB200 действительно сможет работать, сможет ли стоимость онлайновых вычислений снизиться вдвое? Сейчас за один запрос иногда платят несколько рублей, что немного неправдоподобно.
Посмотреть ОригиналОтветить0
GasGasGasBro
· 12-11 01:46
gb200 действительно круто, эта волна deepseek в сочетании с nvdia, вероятно, взлетит
---
Производительность вывода прямо на максимум, издержки на транзакции в цепочке должны значительно снизиться
---
ngl это именно тот уровень инфраструктуры, который должен быть, а не постоянные пустые разговоры
---
Настоящее улучшение производительности против тех воздушных проектов — это совершенно разные вещи
---
Подождите, разве это не означает, что on-chain AI действительно скоро появится?
---
Оборудование собирают так, а можно ли снизить стоимость? Вот в чем вопрос
---
deepseek такой темп — отлично, постоянно делаем реальные дела
Посмотреть ОригиналОтветить0
GlueGuy
· 12-11 01:35
gb200 снова устраивает переполох, на этот раз что за фишки сможет придумать комбинация deepseek и nvidia?
Посмотреть ОригиналОтветить0
BagHolderTillRetire
· 12-11 01:31
gb200 действительно действительно может быть эффективным, кажется, что больше преувеличений
Посмотреть ОригиналОтветить0
ProtocolRebel
· 12-11 01:27
gb200 действительно станет следующим прорывом в области вычислительной мощности или это снова маркетинговая акция
Основное обновление инфраструктуры: партнерство продолжается в области оптимизации SGLang DeepSeek R1 на платформе NVIDIA's GB200 NVL72.
Это сотрудничество сосредоточено на расширении возможностей inference с помощью передовых аппаратных ускорений. Архитектура GB200 NVL72 обеспечивает серьезную вычислительную мощность, делая ее естественным выбором для продвинутых моделей рассуждения.
Что здесь интересно? Комбинация фреймворка SGLang с возможностями DeepSeek R1 может открыть новые уровни эффективности для крупномасштабных AI-операций. Платформа NVIDIA предоставляет необходимую мощность для обработки сложных inference-нагрузок.
Для тех, кто следит за развитием инфраструктуры AI в крипто- и Web3-сферах, такие оптимизационные работы важны. Лучшие inference-двигатели означают более быстрые и дешевые операции для всего — от on-chain аналитики до автоматизированных торговых систем.
Эволюция технологического стека продолжается.