Google Gemini 3 Flash發布:超低成本AI模型,API已開放接入

robot
摘要生成中

【比推】Google官方博客剛發布了新一代AI模型Gemini 3 Flash,定位就俩字:快+便宜。這次真的不一樣——同時在多個維度上碾壓前代2.5 Pro。

先看性能數字。GPQA Diamond基準測試達到90.4%,Humanity’s Last Exam在無工具模式下拿到33.7%。關鍵是速度快了不少,成本還更低,哪怕在最低思考等級下也比舊版更優秀。

定價方面很有吸引力:輸入token $0.50/百萬、輸出 $3/百萬(音頻輸入 $1/百萬)。但這還不是全部。Google同時推出了上下文快取(最高能省90%成本)和Batch API(降本50%、速率更高),想要的老兄們可以組合用。

功能體驗升級了。視覺和空間推理能力更強,程式碼執行能力更穩定。可以用來縮放圖像、計數、編輯圖像這類任務。不僅如此,Gemini 3 Flash已經集成到Google AI Studio、Antigravity、Gemini CLI、Android Studio和Vertex AI裡,開發者現在就能接入。

API和Vertex AI已經開放接入,想試試的就現在吧。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 6
  • 轉發
  • 分享
留言
0/400
Crypto笑话王vip
· 2小時前
快便宜真的絕了,Google這波定價策略就是在告訴其他家廠商"我們來降維打擊了" 成本能省90%?笑着笑着就哭了,這下其他模型真的得降價跑路了 token才五毛錢一百萬,我感覺我的API額度突然活了 不過轉念一想,便宜到這程度,Google接下來肯定會想辦法從別的地方割一刀 一個字形容:卷
查看原文回復0
链上资深吃瓜群众vip
· 8小時前
終於等到白菜價的AI了,谷歌這波真的絕 這成本我得算算,比之前便宜多少才行 緩存能省90%?誇張了吧,不信除非親測 卷起來了各位,大模型價格戰才剛開始
查看原文回復0
区块捡漏王vip
· 12-18 09:39
快便宜就完事兒,這次Google確實下血本了,0.5刀百萬token笑死 --- 緩存能省90%?這玩意兒得趕緊用上啊,不然虧死 --- 又是碾壓前代,Google真把性價比打到地板了,卷不動了各位 --- 等等,Batch API這是想讓我們批量跑數據嗎,成本又能降? --- 90.4%的分數看著不錯,就是不知道實際用著怎麼樣,紙面數據永遠可信度最低 --- 我就想知道這玩意兒啥時候國內能用上,總不能又得梯子吧
查看原文回復0
CryptoNomicsvip
· 12-18 09:35
ngl 透過上下文快取實現的 90% 成本降低在統計上具有顯著意義,但大家都忽略了這裡的代幣經濟學影響……如果我們將其建模為一個 AI 推理定價的隨機過程,你可能會看到一個潛在的市場低效,可能需要數月時間來修正
查看原文回復0
FreeRidervip
· 12-18 09:32
這價格真的絕了,比之前便宜太多了 等等,快取能省90%?這不是要革命嗎 Flash這名字起得也貼切,就是快 有點擔心性能會不會縮水,但數字看起來挺能打的 谷歌這回終於干了點人事兒
查看原文回復0
永赢矿工vip
· 12-18 09:19
卧槽这價格,2.5 Pro可以退休了 便宜到離譜,難怪又要內卷一輪 等等,上下文快取真的能省90%?這得多狠啊 速度快成本低,誰還用其他的... 這下又得改我的prompt工程了
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)