Blog resmi Google baru saja merilis model AI generasi baru Gemini 3 Flash, dan posisinya hanya dua kata: cepat + murah. Kali ini benar-benar berbeda - menghancurkan pendahulunya 2.5 Pro dalam berbagai dimensi secara bersamaan.
Mari kita lihat angka kinerjanya terlebih dahulu. Tolok ukur GPQA Diamond mencetak skor 90,4%, dan Ujian Terakhir Kemanusiaan mendapat skor 33,7% dalam mode bebas alat. Kuncinya adalah kecepatannya jauh lebih cepat, biayanya lebih rendah, bahkan pada tingkat pemikiran terendah, lebih baik daripada versi lama.
Aspek harganya menarik: $0,50/juta untuk token input, $3/juta untuk output ($1/juta untuk input audio). Tapi bukan itu saja. Google juga telah meluncurkan caching kontekstual (penghematan biaya hingga 90%) dan Batch API (pengurangan biaya 50% dan kecepatan lebih tinggi), yang dapat digunakan dalam kombinasi jika Anda menginginkannya.
Pengalaman fungsional telah ditingkatkan. Kemampuan penalaran visual dan spasial yang lebih kuat, dan kemampuan eksekusi kode yang lebih stabil. Ini dapat digunakan untuk tugas-tugas seperti penskalaan, penghitungan, dan pengeditan gambar. Tidak hanya itu, Gemini 3 Flash telah diintegrasikan ke dalam Google AI Studio, Antigravity, Gemini CLI, Android Studio, dan Vertex AI, dan pengembang kini dapat mengaksesnya.
API dan Vertex AI sudah terbuka untuk akses, jadi jika Anda ingin mencobanya, sekarang.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
23 Suka
Hadiah
23
6
Posting ulang
Bagikan
Komentar
0/400
CryptoComedian
· 2jam yang lalu
Murah banget, strategi harga Google kali ini memang memberi tahu perusahaan lain "kami akan menyerang dari dimensi yang lebih rendah"
Biaya bisa dihemat 90%? Tertawa sambil menangis, kali ini model lain pasti harus menurunkan harga dan rug pull
Token hanya lima puluh sen per juta, saya merasa kuota API saya tiba-tiba hidup kembali
Tapi setelah dipikir-pikir, murah sampai segini, Google pasti akan mencari cara untuk memotong dari tempat lain
Satu kata untuk menggambarkan: persaingan
Lihat AsliBalas0
OnchainGossiper
· 8jam yang lalu
Akhirnya sampai juga AI dengan harga rendah, langkah Google kali ini benar-benar luar biasa
Saya harus menghitung biaya ini, seberapa murah dibandingkan sebelumnya
Bisakah caching menghemat 90%? Terlalu berlebihan, saya tidak percaya kecuali sudah dicoba sendiri
Mari kita mulai, perang harga model besar baru saja dimulai
Lihat AsliBalas0
BlockBargainHunter
· 12-18 09:39
Cepat dan murah, selesai sudah. Kali ini Google benar-benar mengeluarkan dana, 0.5 dolar untuk satu juta token bikin ngakak.
---
Cache bisa menghemat 90%? Ini harus segera digunakan, kalau tidak akan rugi besar.
---
Kembali mengalahkan generasi sebelumnya, Google benar-benar menurunkan rasio harga-kinerja ke level terendah, tidak bisa bersaing lagi, teman-teman.
---
Tunggu dulu, Batch API ini maksudnya ingin kita menjalankan data secara batch, apakah biayanya bisa turun lagi?
---
Skor 90.4% terlihat bagus, cuma tidak tahu bagaimana kenyataannya saat digunakan, data di atas kertas selalu paling tidak dapat dipercaya.
---
Saya cuma mau tahu kapan alat ini bisa digunakan di dalam negeri, tidak mungkin harus pakai VPN lagi, kan?
Lihat AsliBalas0
CryptoNomics
· 12-18 09:35
ngl pengurangan biaya 90% melalui caching konteks secara statistik signifikan tetapi semua orang mengabaikan implikasi tokenomics di sini... jika kita memodelkannya sebagai proses stokastik dari penetapan harga inferensi AI, Anda sedang melihat potensi ketidakefisienan pasar yang bisa memakan waktu berbulan-bulan untuk diperbaiki
Lihat AsliBalas0
FreeRider
· 12-18 09:32
Harga ini benar-benar luar biasa, jauh lebih murah dari sebelumnya
Tunggu, cache bisa menghemat 90%? Ini bukan revolusi namanya
Nama Flash juga sangat cocok, artinya cepat
Sedikit khawatir performa akan menurun, tapi angka-angka terlihat cukup menjanjikan
Google akhirnya melakukan sesuatu yang nyata kali ini
Lihat AsliBalas0
EternalMiner
· 12-18 09:19
Wah, harga ini, 2.5 Pro bisa pensiun
Murah banget sampai gila, nggak heran kalau harus bersaing lagi
Tunggu, apakah cache konteks benar-benar bisa menghemat 90%? Seberapa hebat itu
Kecepatan tinggi biaya rendah, siapa lagi yang pakai yang lain...
Sekarang aku harus mengubah lagi proyek promptku
Google Gemini 3 Flash dirilis: model AI dengan biaya sangat rendah, API telah dibuka untuk akses
Blog resmi Google baru saja merilis model AI generasi baru Gemini 3 Flash, dan posisinya hanya dua kata: cepat + murah. Kali ini benar-benar berbeda - menghancurkan pendahulunya 2.5 Pro dalam berbagai dimensi secara bersamaan.
Mari kita lihat angka kinerjanya terlebih dahulu. Tolok ukur GPQA Diamond mencetak skor 90,4%, dan Ujian Terakhir Kemanusiaan mendapat skor 33,7% dalam mode bebas alat. Kuncinya adalah kecepatannya jauh lebih cepat, biayanya lebih rendah, bahkan pada tingkat pemikiran terendah, lebih baik daripada versi lama.
Aspek harganya menarik: $0,50/juta untuk token input, $3/juta untuk output ($1/juta untuk input audio). Tapi bukan itu saja. Google juga telah meluncurkan caching kontekstual (penghematan biaya hingga 90%) dan Batch API (pengurangan biaya 50% dan kecepatan lebih tinggi), yang dapat digunakan dalam kombinasi jika Anda menginginkannya.
Pengalaman fungsional telah ditingkatkan. Kemampuan penalaran visual dan spasial yang lebih kuat, dan kemampuan eksekusi kode yang lebih stabil. Ini dapat digunakan untuk tugas-tugas seperti penskalaan, penghitungan, dan pengeditan gambar. Tidak hanya itu, Gemini 3 Flash telah diintegrasikan ke dalam Google AI Studio, Antigravity, Gemini CLI, Android Studio, dan Vertex AI, dan pengembang kini dapat mengaksesnya.
API dan Vertex AI sudah terbuka untuk akses, jadi jika Anda ingin mencobanya, sekarang.