Офіційний блог Google щойно випустив нове покоління AI-моделі Gemini 3 Flash, і її позиціонування складається лише з двох слів: швидко + дешево. Цього разу все зовсім інакше — ми розгромили попередника 2.5 Pro у багатьох вимірах одночасно.
Давайте спочатку подивимось на показники продуктивності. Бенчмарк GPQA Diamond набрав 90,4%, а іспит Humanity’s Last — 33,7% у режимі без інструментів. Головне — швидкість набагато вища, вартість нижча, навіть на найнижчому рівні мислення це краще, ніж у старій версії.
Ціновий аспект привабливий: $0,50/мільйон для вхідних токенів, $3/мільйон за вихідні дані ($1/мільйон для аудіовходів). Але це ще не все. Google також запустила контекстне кешування (до 90% економії) та пакетне API (50% зниження вартості та вища швидкість), які можна використовувати в комбінації, якщо хочете.
Функціональний досвід було оновлено. Сильніші візуальні та просторові можливості мислення, а також більш стабільні можливості виконання коду. Його можна використовувати для таких завдань, як масштабування, підрахунок і редагування зображень. Більше того, Gemini 3 Flash інтегрований у Google AI Studio, Antigravity, Gemini CLI, Android Studio та Vertex AI, і розробники тепер можуть до нього користуватися.
API та Vertex AI вже відкриті для доступу, тож якщо хочете спробувати — це вже зараз.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
23 лайків
Нагородити
23
6
Репост
Поділіться
Прокоментувати
0/400
CryptoComedian
· 48хв. тому
Дешево, дійсно круто, ця цінова стратегія Google просто говорить іншим виробникам: "Ми знижуємо рівень конкуренції"
Витрати можна зменшити на 90%? Сміючись, починаєш плакати, тепер інші моделі дійсно повинні знижувати ціни і шахраювати
Токен всього п’ять копійок за мільйон, я відчуваю, що мій API ліміт раптом запрацював
Але, подумавши, якщо ціна така низька, Google, напевно, знайде спосіб обдурити людей, як лохів з інших джерел
Одне слово описує: конкуренція
Переглянути оригіналвідповісти на0
OnchainGossiper
· 6год тому
Нарешті дочекалися AI за низькою ціною, Google у цьому плані дійсно вражає
Цю вартість я маю порахувати, наскільки вона дешевша, ніж раніше
Кешування може заощадити 90%? Це перебільшення, не повірю, поки не перевірю сам
Всі, готуйтесь, війна цін на великі моделі тільки починається
Переглянути оригіналвідповісти на0
BlockBargainHunter
· 12-18 09:39
Швидко і дешево — і все, цього разу Google справді вклалися, 0.5 долара за мільйон токенів, смішно
---
Кешування може зекономити 90%? Це треба швидко починати використовувати, інакше програєш
---
Знову перевершує попередників, Google справді знизили цінність до дна, вже не можу конкурувати, друзі
---
Чекайте, Batch API — це щоб ми масово запускали дані, чи зменшити витрати?
---
Рейтинг 90.4% виглядає непогано, але цікаво, як воно працює на практиці, дані на папері завжди мають найменшу довіру
---
Я просто хочу знати, коли це з’явиться в Китаї, не може ж знову знадобитися VPN
Переглянути оригіналвідповісти на0
CryptoNomics
· 12-18 09:35
ngl зменшення витрат на 90% за допомогою кешування контексту є статистично значущим, але всі ігнорують наслідки токеноміки тут... якщо ми моделюємо це як стохастичний процес ціноутворення штучного інтелекту, ви маєте потенційну ринкову неефективність, яка може зайняти місяці для виправлення
Переглянути оригіналвідповісти на0
FreeRider
· 12-18 09:32
Ця ціна дійсно неймовірна, значно дешевше ніж раніше
Зачекайте, кешування може економити 90%? Це справжня революція
Назва Flash дуже підходить — він швидкий
Трохи хвилююся, чи не зменшиться продуктивність, але цифри виглядають досить переконливо
Цього разу Google нарешті зробила кілька кадрових рішень
Переглянути оригіналвідповісти на0
EternalMiner
· 12-18 09:19
卧槽 ця ціна, 2.5 Pro може піти на пенсію
Дешево до безумства, не дивно, що знову починається конкуренція
Зачекайте, чи справді кешування контексту може заощадити 90%? Наскільки це круто
Швидкість швидка, витрати низькі, хто ще використовує інше...
Тепер знову доведеться змінювати мій prompt-проект
Google Gemini 3 Flash випуск: надзвичайно дешевий AI-модель, API вже відкритий для підключення
Офіційний блог Google щойно випустив нове покоління AI-моделі Gemini 3 Flash, і її позиціонування складається лише з двох слів: швидко + дешево. Цього разу все зовсім інакше — ми розгромили попередника 2.5 Pro у багатьох вимірах одночасно.
Давайте спочатку подивимось на показники продуктивності. Бенчмарк GPQA Diamond набрав 90,4%, а іспит Humanity’s Last — 33,7% у режимі без інструментів. Головне — швидкість набагато вища, вартість нижча, навіть на найнижчому рівні мислення це краще, ніж у старій версії.
Ціновий аспект привабливий: $0,50/мільйон для вхідних токенів, $3/мільйон за вихідні дані ($1/мільйон для аудіовходів). Але це ще не все. Google також запустила контекстне кешування (до 90% економії) та пакетне API (50% зниження вартості та вища швидкість), які можна використовувати в комбінації, якщо хочете.
Функціональний досвід було оновлено. Сильніші візуальні та просторові можливості мислення, а також більш стабільні можливості виконання коду. Його можна використовувати для таких завдань, як масштабування, підрахунок і редагування зображень. Більше того, Gemini 3 Flash інтегрований у Google AI Studio, Antigravity, Gemini CLI, Android Studio та Vertex AI, і розробники тепер можуть до нього користуватися.
API та Vertex AI вже відкриті для доступу, тож якщо хочете спробувати — це вже зараз.