OpenAI o1 Kalahkan Mahasiswa PhD dalam Ujian Sains, Peluang atau Justru Ancaman?

Kecerdasan buatan yang semakin berkembang
Sumber :
  • id.pinterest.com

Bandung, VIVA – Dunia akademis dikejutkan oleh kemampuan luar biasa yang ditunjukkan OpenAI o1 model bahasa besar (LLM) terbaru dari OpenAI. Dalam serangkaian tes yang dirancang untuk menguji pemahaman mendalam tentang kimia fisika dan biologi tingkat lanjut o1 berhasil mengalahkan para ahli berpendidikan PhD. Prestasi ini menjadikan o1 sebagai model AI pertama yang mampu melampaui kinerja manusia dalam benchmark GPQA Diamond.

Sejarah Singkat Berdirinya OpenAI: Dibangun dari Nol Menjadi Raksasa Global

GPQA Diamond merupakan tolok ukur kecerdasan yang sangat sulit menguji keahlian di bidang kimia fisika dan biologi. Untuk membandingkan kinerja model dengan manusia OpenAI merekrut sejumlah ahli bergelar PhD untuk menjawab pertanyaan-pertanyaan GPQA Diamond. Hasilnya mengejutkan o1 mampu melampaui kinerja para ahli tersebut.

Ilustrasi kecerdasan buatan

Photo :
  • id.pinterest.com
Cara Cepat Hapus Akin Facebook Lama: Langkah Mudah yang Wajib Kamu Coba!

Meski demikian OpenAI menegaskan bahwa hasil ini tidak berarti o1 lebih mampu daripada seorang PhD dalam segala aspek. Model ini hanya lebih mahir dalam memecahkan beberapa jenis masalah yang biasanya dapat diselesaikan oleh seorang PhD. Keunggulan o1 terletak pada kemampuannya untuk menghasilkan rangkaian pemikiran internal yang panjang sebelum memberikan jawaban.

Instagram Dibajak? Ini Langkah Cepat yang Harus Kamu Lakukan!

Selain GPQA Diamond o1 juga mengungguli model-model AI lainnya dalam berbagai benchmark pembelajaran mesin. Dengan kemampuan persepsi visual yang diaktifkan o1 meraih skor 78.2% pada MMMU menjadikannya model pertama yang mampu bersaing dengan ahli manusia di bidang ini. o1 juga mengungguli GPT-4o dalam 54 dari 57 subkategori MMLU.

Halaman Selanjutnya
img_title