Google Gemini 3 Flash ra mắt: Mô hình AI chi phí siêu thấp, API đã mở để tích hợp

robot
Đang tạo bản tóm tắt

【比推】Google chính thức công bố mô hình AI thế hệ mới Gemini 3 Flash, với hai đặc điểm chính: nhanh + rẻ. Lần này thực sự khác biệt — vượt trội hơn nhiều so với phiên bản trước 2.5 Pro trên nhiều phương diện.

Đầu tiên là các số liệu hiệu suất. Đánh giá GPQA Diamond đạt 90.4%, Humanity’s Last Exam trong chế độ không dùng công cụ đạt 33.7%. Điều quan trọng là tốc độ đã nhanh hơn rất nhiều, chi phí còn thấp hơn, ngay cả ở mức độ suy nghĩ thấp nhất cũng vượt trội hơn phiên bản cũ.

Về giá cả rất hấp dẫn: token đầu vào $0.50/triệu, đầu ra $3/triệu (đầu vào âm thanh $1/triệu). Nhưng chưa hết, Google còn ra mắt bộ nhớ đệm ngữ cảnh (tiết kiệm tới 90% chi phí) và Batch API (giảm chi phí 50%, tốc độ cao hơn), các anh em muốn có thể kết hợp sử dụng.

Trải nghiệm chức năng đã được nâng cấp. Khả năng thị giác và suy luận không gian mạnh hơn, khả năng thực thi mã ổn định hơn. Có thể dùng để phóng to hình ảnh, đếm, chỉnh sửa hình ảnh và các tác vụ tương tự. Không chỉ vậy, Gemini 3 Flash đã tích hợp vào Google AI Studio, Antigravity, Gemini CLI, Android Studio và Vertex AI, các nhà phát triển có thể bắt đầu kết nối ngay bây giờ.

API và Vertex AI đã mở để truy cập, ai muốn thử thì hãy bắt đầu ngay.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 6
  • Đăng lại
  • Retweed
Bình luận
0/400
CryptoComedianvip
· 2giờ trước
Rẻ thật sự tuyệt vời, chiến lược định giá này của Google đang nói với các nhà sản xuất khác "chúng tôi đã hạ thấp tiêu chuẩn" Chi phí có thể tiết kiệm 90%? Cười một lúc rồi lại khóc, giờ thì những mô hình khác thực sự phải giảm giá và Rug Pull rồi token chỉ có năm hào một triệu, tôi cảm thấy hạn mức API của mình đột nhiên sống lại Nhưng nghĩ lại, rẻ đến mức này, chắc chắn Google sẽ nghĩ cách lấy lại từ những nơi khác Một từ để mô tả: Cuộc chiến
Xem bản gốcTrả lời0
OnchainGossipervip
· 8giờ trước
Cuối cùng cũng đợi được AI giá thấp, Google thực sự rất tuyệt Tôi phải tính toán chi phí này, rẻ hơn bao nhiêu so với trước đây mới được Có thể tiết kiệm 90% bộ nhớ đệm? Nghe có vẻ phóng đại, tôi không tin trừ khi tự mình thử nghiệm Mọi người đã vào cuộc rồi, cuộc chiến giá cả của các mô hình lớn mới chỉ bắt đầu
Xem bản gốcTrả lời0
BlockBargainHuntervip
· 12-18 09:39
Nhanh chóng rẻ là xong, lần này Google thực sự bỏ ra số tiền lớn, 0.5 đô la cho triệu token cười chết --- Cache có thể tiết kiệm 90%? Cái này phải nhanh chóng sử dụng, nếu không sẽ lỗ nặng --- Lại vượt trội hơn thế hệ trước, Google thật sự đã đưa tỷ lệ giá trị trên hiệu suất xuống mức thấp nhất, mọi người không còn cạnh tranh nổi nữa rồi --- Chờ đã, Batch API này có ý muốn chúng ta chạy dữ liệu hàng loạt phải không, chi phí có thể giảm nữa không? --- Điểm số 90.4% trông khá tốt, chỉ là không biết thực tế sử dụng ra sao, dữ liệu trên giấy luôn có độ tin cậy thấp nhất --- Tôi chỉ muốn biết khi nào cái này có thể dùng được trong nước, không thể lại phải dùng VPN nữa chứ
Xem bản gốcTrả lời0
CryptoNomicsvip
· 12-18 09:35
ngl giảm 90% chi phí nhờ vào bộ nhớ đệm ngữ cảnh là có ý nghĩa thống kê nhưng mọi người đều bỏ qua các tác động về tokenomics ở đây... nếu chúng ta mô hình hóa điều này như một quá trình ngẫu nhiên của việc định giá suy luận AI, bạn đang nhìn thấy một khả năng không hiệu quả thị trường có thể mất vài tháng để điều chỉnh
Xem bản gốcTrả lời0
FreeRidervip
· 12-18 09:32
Giá này thực sự tuyệt vời, rẻ hơn rất nhiều so với trước đây Chờ đã, bộ nhớ đệm có thể tiết kiệm 90%? Chẳng phải đang cách mạng hóa sao Tên Flash cũng rất phù hợp, chính là nhanh Một chút lo lắng về hiệu suất có thể giảm sút, nhưng các số liệu trông khá ấn tượng Google cuối cùng cũng đã làm một số việc nhân sự
Xem bản gốcTrả lời0
EternalMinervip
· 12-18 09:19
Wow, with this price, 2.5 Pro có thể nghỉ hưu rồi Rẻ đến mức khó tin, không ngạc nhiên khi lại phải cạnh tranh gay gắt một lần nữa Chờ đã, bộ nhớ đệm ngữ cảnh thực sự có thể tiết kiệm 90%? Điều này phải cực kỳ mạnh mẽ Tốc độ nhanh, chi phí thấp, ai còn dùng cái khác... Lần này lại phải chỉnh lại dự án prompt của tôi rồi
Xem bản gốcTrả lời0
  • Ghim