Официальный блог Google только что выпустил новое поколение AI-модели Gemini 3 Flash, и её позиционирование состоит всего в двух словах: быстро + дешево. На этот раз всё совсем иначе — мы разгромили предшественника 2.5 Pro одновременно по нескольким параметрам.
Давайте сначала посмотрим на показатели производительности. Бенчмарк GPQA Diamond набрал 90,4%, а Human’s Last Exam — 33,7% в режиме без инструментов. Главное — скорость гораздо выше, стоимость ниже, даже на самом низком уровне мышления это лучше, чем в старой версии.
Ценообразование привлекательное: 0,50 доллара за входные токены, 3 миллиона за выходы (1 миллион долларов за аудиовходы). Но это не всё. Google также запустил контекстное кэширование (до 90% экономии) и пакетный API (снижение затрат на 50% и более высокая скорость), которые можно использовать в комбинации, если вы хотите.
Функциональный опыт был улучшен. Более сильные возможности визуального и пространственного мышления, а также более стабильные возможности выполнения кода. Её можно использовать для таких задач, как масштабирование, подсчёт и редактирование изображений. Более того, Gemini 3 Flash интегрирован в Google AI Studio, Antigravity, Gemini CLI, Android Studio и Vertex AI, и теперь разработчики могут к нему воспользоваться.
API и Vertex AI уже открыты для доступа, так что если хотите попробовать — это сейчас.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
23 Лайков
Награда
23
6
Репост
Поделиться
комментарий
0/400
CryptoComedian
· 5ч назад
Дешево действительно круто, эта ценовая стратегия Google просто говорит другим производителям: "Мы пришли, чтобы снизить уровень".
Снизить затраты на 90%? Смеясь, я вдруг заплакал, теперь другим моделям действительно придется снижать цены и заниматься мошенничеством.
token всего 50 центов за миллион, я чувствую, что моя квота API внезапно ожила.
Но, если задуматься, при такой низкой цене Google, вероятно, найдет способ откусить еще кусочек откуда-то.
Одним словом: гонка.
Посмотреть ОригиналОтветить0
OnchainGossiper
· 12ч назад
Наконец-то дождались AI по низкой цене, Google в этот раз действительно впечатляет
Теперь мне нужно посчитать, насколько это дешевле, чем раньше
Кэш может сэкономить 90%? Это преувеличение, не поверю, пока сам не проверю
Все, начинаем, ценовая война больших моделей только начинается
Посмотреть ОригиналОтветить0
BlockBargainHunter
· 12-18 09:39
Быстро и дешево — и дело с концом, в этот раз Google действительно вложился, 0.5 доллара за миллион токенов — смешно
---
Кэширование может сэкономить 90%? Это нужно срочно начать использовать, иначе убытки
---
Опять превосходит предшественника, Google действительно снизил соотношение цена/качество до дна, уже не тянет
---
Подождите, Batch API — это что, чтобы заставить нас массово запускать данные, и при этом снизить затраты?
---
Баллы 90.4% выглядят неплохо, только интересно, как это работает на практике, данные на бумаге всегда самые ненадежные
---
Я просто хочу знать, когда это появится в Китае, неужели снова придется использовать VPN
Посмотреть ОригиналОтветить0
CryptoNomics
· 12-18 09:35
ngl снижение затрат на 90% за счет кэширования контекста статистически значимо, но все игнорируют последствия для токеномики... если моделировать это как стохастический процесс ценообразования AI-инференции, вы можете столкнуться с потенциальной рыночной неэффективностью, которая может потребовать месяцев для исправления
Посмотреть ОригиналОтветить0
FreeRider
· 12-18 09:32
Эта цена действительно потрясающая, намного дешевле, чем раньше
Подождите, кэш может сэкономить 90%? Разве это не революция?
Имя Flash действительно подходит — он быстрый
Б немного беспокоюсь, снизится ли производительность, но цифры выглядят довольно убедительно
Google наконец-то сделал что-то полезное
Посмотреть ОригиналОтветить0
EternalMiner
· 12-18 09:19
卧槽这价格,2.5 Pro可以退休了
Дешево до безумия, неудивительно, что снова началась гонка за превосходство
Подождите, действительно ли кэширование контекста может сэкономить 90%? Насколько это круто
Быстро и дешево, кто еще использует другие...
Теперь мне снова придется менять свой prompt-проект
Выпущен Google Gemini 3 Flash: ультранедорогая модель ИИ, API теперь открыт для доступа
Официальный блог Google только что выпустил новое поколение AI-модели Gemini 3 Flash, и её позиционирование состоит всего в двух словах: быстро + дешево. На этот раз всё совсем иначе — мы разгромили предшественника 2.5 Pro одновременно по нескольким параметрам.
Давайте сначала посмотрим на показатели производительности. Бенчмарк GPQA Diamond набрал 90,4%, а Human’s Last Exam — 33,7% в режиме без инструментов. Главное — скорость гораздо выше, стоимость ниже, даже на самом низком уровне мышления это лучше, чем в старой версии.
Ценообразование привлекательное: 0,50 доллара за входные токены, 3 миллиона за выходы (1 миллион долларов за аудиовходы). Но это не всё. Google также запустил контекстное кэширование (до 90% экономии) и пакетный API (снижение затрат на 50% и более высокая скорость), которые можно использовать в комбинации, если вы хотите.
Функциональный опыт был улучшен. Более сильные возможности визуального и пространственного мышления, а также более стабильные возможности выполнения кода. Её можно использовать для таких задач, как масштабирование, подсчёт и редактирование изображений. Более того, Gemini 3 Flash интегрирован в Google AI Studio, Antigravity, Gemini CLI, Android Studio и Vertex AI, и теперь разработчики могут к нему воспользоваться.
API и Vertex AI уже открыты для доступа, так что если хотите попробовать — это сейчас.