Google Hadirkan AI Gemini 1.5 Flash 8B sebagai Versi Lebih Cepat dan Efisien
- developers.googleblog.com
VIVABandung – Google terus mendorong batasan teknologi kecerdasan buatan (Al) dengan merilis pembaruan terbaru dari model Gemini. Pada Mei lalu, mereka memperkenalkan Gemini 1.5 Flash, yang dikenal dengan kemampuannya merespons permintaan pengguna dengan sangat cepat. Kini, Google telah meningkatkan model tersebut dengan meluncurkan Gemini 1.5 Flash-8B, yang membawa sejumlah pembaruan signifikan.
Salah satu peningkatan utama dari model terbaru ini adalah kemampuan pemrosesan yang lebih cepat. Google meningkatkan jumlah permintaan yang dapat ditangani dalam satu menit, dari 2.000 menjadi 4.000 request per menit (RPM). Hal ini memungkinkan Gemini 1.5 Flash-8B untuk merespons pertanyaan dengan jauh lebih efisien, terutama untuk permintaan yang tidak memerlukan banyak sumber daya.
Selain itu, model ini dirancang dengan latensi yang lebih rendah, artinya jeda waktu antara menerima pertanyaan dan memberikan jawaban kini semakin singkat.
Selain kecepatan dan efisiensi, Gemini 1.5 Flash-8B juga menawarkan manfaat lain berupa biaya yang lebih terjangkau. Penggunaan API untuk model ini kini lebih hemat hingga 50% dibandingkan pendahulunya. Ini memberikan peluang bagi para developer untuk mengintegrasikan Al ke dalam aplikasi mereka dengan biaya yang lebih rendah.
Dengan penurunan harga ini, Google berharap para pengembang dapat lebih mudah memanfaatkan teknologi Al untuk berbagai keperluan, mulai dari menjawab pertanyaan hingga melakukan transkripsi audio secara langsung, serta menerjemahkan bahasa asing.
Google juga memberikan akses terbatas secara gratis bagi pengguna yang ingin menguji coba kemampuan Gemini 1.5 Flash-8B melalui Gemini API. Namun, jika pengguna melebihi batas token tertentu, akan ada biaya tambahan yang dikenakan. Harga baru ini akan mulai berlaku bagi para developer yang menggunakan layanan berbayar pada 14 Oktober 2024.