Google Gemini 3 Flash发布：超低成本AI模型，API已开放接入

ForkMonger

2025-12-18 09:18:15

摘要生成中

【比推】Google官方博客刚发布了新一代AI模型Gemini 3 Flash，定位就俩字：快+便宜。这次真的不一样——同时在多个维度上碾压前代2.5 Pro。

先看性能数字。GPQA Diamond基准测试达到90.4%，Humanity’s Last Exam在无工具模式下拿到33.7%。关键是速度快了不少，成本还更低，哪怕在最低思考等级下也比旧版更优秀。

定价方面很有吸引力：输入token $0.50/百万、输出 $3/百万（音频输入 $1/百万）。但这还不是全部。Google同时推出了上下文缓存（最高能省90%成本）和Batch API（降本50%、速率更高），想要的老兄们可以组合用。

功能体验升级了。视觉和空间推理能力更强，代码执行能力更稳定。可以用来缩放图像、计数、编辑图像这类任务。不仅如此，Gemini 3 Flash已经集成到Google AI Studio、Antigravity、Gemini CLI、Android Studio和Vertex AI里，开发者现在就能接入。

API和Vertex AI已经开放接入，想试试的就现在吧。

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

23人点赞了这条动态

赞赏
23
6
转发
分享

0/400

Crypto笑话王

· 2小时前

快便宜真的绝了，Google这波定价策略就是在告诉其他家厂商"我们来降维打击了" 成本能省90%？笑着笑着就哭了，这下其他模型真的得降价跑路了 token才五毛钱一百万，我感觉我的API额度突然活了不过转念一想，便宜到这程度，Google接下来肯定会想办法从别的地方割一刀一个字形容：卷

链上资深吃瓜群众

· 8小时前

终于等到白菜价的AI了，谷歌这波真的绝这成本我得算算，比之前便宜多少才行缓存能省90%？夸张了吧，不信除非亲测卷起来了各位，大模型价格战才刚开始

区块捡漏王

· 12-18 09:39

快便宜就完事儿，这次Google确实下血本了，0.5刀百万token笑死 --- 缓存能省90%？这玩意儿得赶紧用上啊，不然亏死 --- 又是碾压前代，Google真把性价比打到地板了，卷不动了各位 --- 等等，Batch API这是想让我们批量跑数据吗，成本又能降？ --- 90.4%的分数看着不错，就是不知道实际用着咋样，纸面数据永远可信度最低 --- 我就想知道这玩意儿啥时候国内能用上，总不能又得梯子吧

CryptoNomics

· 12-18 09:35

ngl 通过上下文缓存实现的90%成本降低在统计学上具有显著意义，但大家都忽视了这里的代币经济学影响……如果我们将其建模为人工智能推理定价的随机过程，你可能会看到一个潜在的市场低效，可能需要数月时间才能纠正

查看原文回复0

FreeRider

· 12-18 09:32

这价格真的绝了，比之前便宜太多了等等，缓存能省90%？这不是要革命吗 Flash这名儿起得也贴切，就是快有点担心性能会不会缩水，但数字看起来挺能打的谷歌这回终于干了点人事儿

永赢矿工

· 12-18 09:19

卧槽这价格，2.5 Pro可以退休了便宜到离谱，难怪又要内卷一轮等等，上下文缓存真的能省90%？这得多狠啊速度快成本低，谁还用其他的... 这下又得改我的prompt工程了

热门话题查看更多
#2025Gate年度账单
7.38万热度
#成长值抽奖赢金条和精美周边
3.15万热度
#ETH走势分析
15.13万热度
#美联储降息预测
8.12万热度
#晒出我的Alpha积分
7.17万热度

热门 Gate Fun查看更多

1
100000BtcBd
市值:$3537.93持有人数:1
0.00%
2
WTHwealth9231
市值:$3583.27持有人数:2
0.04%
3
大门大门交易所
市值:$3614.75持有人数:2
0.30%
4
MP信托Международный Трастовый Фонд
市值:$3604.42持有人数:4
0.17%
5
MCMargin Call
市值:$3555.17持有人数:1
0.00%