Выпущен Google Gemini 3 Flash: ультранедорогая модель ИИ, API теперь открыт для доступа

robot
Генерация тезисов в процессе

Официальный блог Google только что выпустил новое поколение AI-модели Gemini 3 Flash, и её позиционирование состоит всего в двух словах: быстро + дешево. На этот раз всё совсем иначе — мы разгромили предшественника 2.5 Pro одновременно по нескольким параметрам.

Давайте сначала посмотрим на показатели производительности. Бенчмарк GPQA Diamond набрал 90,4%, а Human’s Last Exam — 33,7% в режиме без инструментов. Главное — скорость гораздо выше, стоимость ниже, даже на самом низком уровне мышления это лучше, чем в старой версии.

Ценообразование привлекательное: 0,50 доллара за входные токены, 3 миллиона за выходы (1 миллион долларов за аудиовходы). Но это не всё. Google также запустил контекстное кэширование (до 90% экономии) и пакетный API (снижение затрат на 50% и более высокая скорость), которые можно использовать в комбинации, если вы хотите.

Функциональный опыт был улучшен. Более сильные возможности визуального и пространственного мышления, а также более стабильные возможности выполнения кода. Её можно использовать для таких задач, как масштабирование, подсчёт и редактирование изображений. Более того, Gemini 3 Flash интегрирован в Google AI Studio, Antigravity, Gemini CLI, Android Studio и Vertex AI, и теперь разработчики могут к нему воспользоваться.

API и Vertex AI уже открыты для доступа, так что если хотите попробовать — это сейчас.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • Репост
  • Поделиться
комментарий
0/400
CryptoComedianvip
· 5ч назад
Дешево действительно круто, эта ценовая стратегия Google просто говорит другим производителям: "Мы пришли, чтобы снизить уровень". Снизить затраты на 90%? Смеясь, я вдруг заплакал, теперь другим моделям действительно придется снижать цены и заниматься мошенничеством. token всего 50 центов за миллион, я чувствую, что моя квота API внезапно ожила. Но, если задуматься, при такой низкой цене Google, вероятно, найдет способ откусить еще кусочек откуда-то. Одним словом: гонка.
Посмотреть ОригиналОтветить0
OnchainGossipervip
· 12ч назад
Наконец-то дождались AI по низкой цене, Google в этот раз действительно впечатляет Теперь мне нужно посчитать, насколько это дешевле, чем раньше Кэш может сэкономить 90%? Это преувеличение, не поверю, пока сам не проверю Все, начинаем, ценовая война больших моделей только начинается
Посмотреть ОригиналОтветить0
BlockBargainHuntervip
· 12-18 09:39
Быстро и дешево — и дело с концом, в этот раз Google действительно вложился, 0.5 доллара за миллион токенов — смешно --- Кэширование может сэкономить 90%? Это нужно срочно начать использовать, иначе убытки --- Опять превосходит предшественника, Google действительно снизил соотношение цена/качество до дна, уже не тянет --- Подождите, Batch API — это что, чтобы заставить нас массово запускать данные, и при этом снизить затраты? --- Баллы 90.4% выглядят неплохо, только интересно, как это работает на практике, данные на бумаге всегда самые ненадежные --- Я просто хочу знать, когда это появится в Китае, неужели снова придется использовать VPN
Посмотреть ОригиналОтветить0
CryptoNomicsvip
· 12-18 09:35
ngl снижение затрат на 90% за счет кэширования контекста статистически значимо, но все игнорируют последствия для токеномики... если моделировать это как стохастический процесс ценообразования AI-инференции, вы можете столкнуться с потенциальной рыночной неэффективностью, которая может потребовать месяцев для исправления
Посмотреть ОригиналОтветить0
FreeRidervip
· 12-18 09:32
Эта цена действительно потрясающая, намного дешевле, чем раньше Подождите, кэш может сэкономить 90%? Разве это не революция? Имя Flash действительно подходит — он быстрый Б немного беспокоюсь, снизится ли производительность, но цифры выглядят довольно убедительно Google наконец-то сделал что-то полезное
Посмотреть ОригиналОтветить0
EternalMinervip
· 12-18 09:19
卧槽这价格,2.5 Pro可以退休了 Дешево до безумия, неудивительно, что снова началась гонка за превосходство Подождите, действительно ли кэширование контекста может сэкономить 90%? Насколько это круто Быстро и дешево, кто еще использует другие... Теперь мне снова придется менять свой prompt-проект
Посмотреть ОригиналОтветить0
  • Закрепить