Google Gemini 3 Flash ra mắt: Mô hình AI chi phí siêu thấp, API đã mở để tích hợp

2025-12-18 09:18:15

Đang tạo bản tóm tắt

【比推】Google chính thức công bố mô hình AI thế hệ mới Gemini 3 Flash, với hai đặc điểm chính: nhanh + rẻ. Lần này thực sự khác biệt — vượt trội hơn nhiều so với phiên bản trước 2.5 Pro trên nhiều phương diện.

Đầu tiên là các số liệu hiệu suất. Đánh giá GPQA Diamond đạt 90.4%, Humanity’s Last Exam trong chế độ không dùng công cụ đạt 33.7%. Điều quan trọng là tốc độ đã nhanh hơn rất nhiều, chi phí còn thấp hơn, ngay cả ở mức độ suy nghĩ thấp nhất cũng vượt trội hơn phiên bản cũ.

Về giá cả rất hấp dẫn: token đầu vào $0.50/triệu, đầu ra $3/triệu (đầu vào âm thanh $1/triệu). Nhưng chưa hết, Google còn ra mắt bộ nhớ đệm ngữ cảnh (tiết kiệm tới 90% chi phí) và Batch API (giảm chi phí 50%, tốc độ cao hơn), các anh em muốn có thể kết hợp sử dụng.

Trải nghiệm chức năng đã được nâng cấp. Khả năng thị giác và suy luận không gian mạnh hơn, khả năng thực thi mã ổn định hơn. Có thể dùng để phóng to hình ảnh, đếm, chỉnh sửa hình ảnh và các tác vụ tương tự. Không chỉ vậy, Gemini 3 Flash đã tích hợp vào Google AI Studio, Antigravity, Gemini CLI, Android Studio và Vertex AI, các nhà phát triển có thể bắt đầu kết nối ngay bây giờ.

API và Vertex AI đã mở để truy cập, ai muốn thử thì hãy bắt đầu ngay.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

23 thích

Phần thưởng
23
6
Đăng lại
Retweed

Bình luận

0/400

CryptoComedian

· 2giờ trước

Rẻ thật sự tuyệt vời, chiến lược định giá này của Google đang nói với các nhà sản xuất khác "chúng tôi đã hạ thấp tiêu chuẩn" Chi phí có thể tiết kiệm 90%? Cười một lúc rồi lại khóc, giờ thì những mô hình khác thực sự phải giảm giá và Rug Pull rồi token chỉ có năm hào một triệu, tôi cảm thấy hạn mức API của mình đột nhiên sống lại Nhưng nghĩ lại, rẻ đến mức này, chắc chắn Google sẽ nghĩ cách lấy lại từ những nơi khác Một từ để mô tả: Cuộc chiến

Xem bản gốcTrả lời0

OnchainGossiper

· 8giờ trước

Cuối cùng cũng đợi được AI giá thấp, Google thực sự rất tuyệt Tôi phải tính toán chi phí này, rẻ hơn bao nhiêu so với trước đây mới được Có thể tiết kiệm 90% bộ nhớ đệm? Nghe có vẻ phóng đại, tôi không tin trừ khi tự mình thử nghiệm Mọi người đã vào cuộc rồi, cuộc chiến giá cả của các mô hình lớn mới chỉ bắt đầu

Xem bản gốcTrả lời0

BlockBargainHunter

· 12-18 09:39

Nhanh chóng rẻ là xong, lần này Google thực sự bỏ ra số tiền lớn, 0.5 đô la cho triệu token cười chết --- Cache có thể tiết kiệm 90%? Cái này phải nhanh chóng sử dụng, nếu không sẽ lỗ nặng --- Lại vượt trội hơn thế hệ trước, Google thật sự đã đưa tỷ lệ giá trị trên hiệu suất xuống mức thấp nhất, mọi người không còn cạnh tranh nổi nữa rồi --- Chờ đã, Batch API này có ý muốn chúng ta chạy dữ liệu hàng loạt phải không, chi phí có thể giảm nữa không? --- Điểm số 90.4% trông khá tốt, chỉ là không biết thực tế sử dụng ra sao, dữ liệu trên giấy luôn có độ tin cậy thấp nhất --- Tôi chỉ muốn biết khi nào cái này có thể dùng được trong nước, không thể lại phải dùng VPN nữa chứ

Xem bản gốcTrả lời0

CryptoNomics

· 12-18 09:35

ngl giảm 90% chi phí nhờ vào bộ nhớ đệm ngữ cảnh là có ý nghĩa thống kê nhưng mọi người đều bỏ qua các tác động về tokenomics ở đây... nếu chúng ta mô hình hóa điều này như một quá trình ngẫu nhiên của việc định giá suy luận AI, bạn đang nhìn thấy một khả năng không hiệu quả thị trường có thể mất vài tháng để điều chỉnh

Xem bản gốcTrả lời0

FreeRider

· 12-18 09:32

Giá này thực sự tuyệt vời, rẻ hơn rất nhiều so với trước đây Chờ đã, bộ nhớ đệm có thể tiết kiệm 90%? Chẳng phải đang cách mạng hóa sao Tên Flash cũng rất phù hợp, chính là nhanh Một chút lo lắng về hiệu suất có thể giảm sút, nhưng các số liệu trông khá ấn tượng Google cuối cùng cũng đã làm một số việc nhân sự

Xem bản gốcTrả lời0

EternalMiner

· 12-18 09:19

Wow, with this price, 2.5 Pro có thể nghỉ hưu rồi Rẻ đến mức khó tin, không ngạc nhiên khi lại phải cạnh tranh gay gắt một lần nữa Chờ đã, bộ nhớ đệm ngữ cảnh thực sự có thể tiết kiệm 90%? Điều này phải cực kỳ mạnh mẽ Tốc độ nhanh, chi phí thấp, ai còn dùng cái khác... Lần này lại phải chỉnh lại dự án prompt của tôi rồi

Xem bản gốcTrả lời0

Chủ đề thịnh hànhXem thêm
#Gate2025AnnualReportComing
73.8K Phổ biến
#JapanToRaiseInterestRatesInMid-to-lateDecember
18 Phổ biến
#JoinGrowthPointsDrawToWinGoldenBar
31.53K Phổ biến
#ETHTrendWatch
151.35K Phổ biến
#FedRateCutPrediction
81.25K Phổ biến

Gate Fun hotXem thêm

1
100000BtcBd
Vốn hóa:$3.53KNgười nắm giữ:1
0.00%
2
WTHwealth9231
Vốn hóa:$3.58KNgười nắm giữ:2
0.04%
3
大门大门交易所
Vốn hóa:$3.61KNgười nắm giữ:2
0.30%
4
MP信托Международный Трастовый Фонд
Vốn hóa:$3.6KNgười nắm giữ:4
0.17%
5
MCMargin Call
Vốn hóa:$3.55KNgười nắm giữ:1
0.00%

Ghim

sơ đồ trang web