Gemini Nano dari Google Kini Mampu Memproses Gambar

Gemini AI
Sumber :
  • Pinterest

VIVABandung – Sebelumnya Gemini Nano yang hanya dapat memproses input teks, kini telah diperluas untuk mencakup pemahaman gambar. Peningkatan ini menandai inovasi google dalam kemampuan AI pada perangkat mobile.

Dimulai dengan smartphone Pixel aplikasi yang menggunakan Gemini Nano dengan Multimodalitas akan dapat memahami dunia seperti yang dilakukan manusia. Ini berarti tidak hanya melalui teks tetapi juga melalui penglihatan suara dan bahasa lisan. Kemampuan multimodal ini membuka berbagai kemungkinan baru untuk interaksi yang lebih intuitif dan komprehensif antara pengguna dan perangkat mereka.

Peningkatan Gemini Nano mencerminkan upaya Google untuk membawa kemampuan AI yang lebih canggih ke perangkat edge. Dengan memungkinkan pemrosesan gambar langsung di perangkat ini dapat meningkatkan privasi pengguna dan mengurangi ketergantungan pada koneksi internet untuk tugas-tugas tertentu.

Kemampuan baru ini dapat diterapkan dalam berbagai skenario mulai dari pengenalan objek dalam foto hingga pemahaman konteks visual untuk asisten virtual. Misalnya pengguna dapat menunjukkan gambar ke perangkat mereka dan meminta penjelasan atau informasi tambahan tentang apa yang mereka lihat.

Gemini Nano dengan kemampuan multimodal ini menjanjikan pengalaman yang lebih kaya dan kontekstual dalam penggunaan AI di perangkat mobile. Ini adalah langkah penting dalam membuat AI lebih mudah diakses dan berguna dalam kehidupan sehari-hari.

Untuk informasi lebih lanjut tentang Gemini 1.0 Nano di Android dan bagaimana pengembang dapat memanfaatkan kemampuan barunya pengguna dapat merujuk ke dokumentasi resmi Google. Dengan perkembangan ini Google terus mendorong batas-batas apa yang mungkin dilakukan dengan AI di perangkat mobile meningkatkan interaksi antara manusia dan teknologi.