Google Gemini 3 Flash发布:超低成本AI模型,API已开放接入

robot
摘要生成中

【比推】Google官方博客刚发布了新一代AI模型Gemini 3 Flash,定位就俩字:快+便宜。这次真的不一样——同时在多个维度上碾压前代2.5 Pro。

先看性能数字。GPQA Diamond基准测试达到90.4%,Humanity’s Last Exam在无工具模式下拿到33.7%。关键是速度快了不少,成本还更低,哪怕在最低思考等级下也比旧版更优秀。

定价方面很有吸引力:输入token $0.50/百万、输出 $3/百万(音频输入 $1/百万)。但这还不是全部。Google同时推出了上下文缓存(最高能省90%成本)和Batch API(降本50%、速率更高),想要的老兄们可以组合用。

功能体验升级了。视觉和空间推理能力更强,代码执行能力更稳定。可以用来缩放图像、计数、编辑图像这类任务。不仅如此,Gemini 3 Flash已经集成到Google AI Studio、Antigravity、Gemini CLI、Android Studio和Vertex AI里,开发者现在就能接入。

API和Vertex AI已经开放接入,想试试的就现在吧。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 6
  • 转发
  • 分享
评论
0/400
Crypto笑话王vip
· 2小时前
快便宜真的绝了,Google这波定价策略就是在告诉其他家厂商"我们来降维打击了" 成本能省90%?笑着笑着就哭了,这下其他模型真的得降价跑路了 token才五毛钱一百万,我感觉我的API额度突然活了 不过转念一想,便宜到这程度,Google接下来肯定会想办法从别的地方割一刀 一个字形容:卷
回复0
链上资深吃瓜群众vip
· 8小时前
终于等到白菜价的AI了,谷歌这波真的绝 这成本我得算算,比之前便宜多少才行 缓存能省90%?夸张了吧,不信除非亲测 卷起来了各位,大模型价格战才刚开始
回复0
区块捡漏王vip
· 12-18 09:39
快便宜就完事儿,这次Google确实下血本了,0.5刀百万token笑死 --- 缓存能省90%?这玩意儿得赶紧用上啊,不然亏死 --- 又是碾压前代,Google真把性价比打到地板了,卷不动了各位 --- 等等,Batch API这是想让我们批量跑数据吗,成本又能降? --- 90.4%的分数看着不错,就是不知道实际用着咋样,纸面数据永远可信度最低 --- 我就想知道这玩意儿啥时候国内能用上,总不能又得梯子吧
回复0
CryptoNomicsvip
· 12-18 09:35
ngl 通过上下文缓存实现的90%成本降低在统计学上具有显著意义,但大家都忽视了这里的代币经济学影响……如果我们将其建模为人工智能推理定价的随机过程,你可能会看到一个潜在的市场低效,可能需要数月时间才能纠正
查看原文回复0
FreeRidervip
· 12-18 09:32
这价格真的绝了,比之前便宜太多了 等等,缓存能省90%?这不是要革命吗 Flash这名儿起得也贴切,就是快 有点担心性能会不会缩水,但数字看起来挺能打的 谷歌这回终于干了点人事儿
回复0
永赢矿工vip
· 12-18 09:19
卧槽这价格,2.5 Pro可以退休了 便宜到离谱,难怪又要内卷一轮 等等,上下文缓存真的能省90%?这得多狠啊 速度快成本低,谁还用其他的... 这下又得改我的prompt工程了
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)