OpenAI o1 Kalahkan Mahasiswa PhD dalam Ujian Sains, Peluang atau Justru Ancaman?
- id.pinterest.com
Bandung, VIVA – Dunia akademis dikejutkan oleh kemampuan luar biasa yang ditunjukkan OpenAI o1 model bahasa besar (LLM) terbaru dari OpenAI. Dalam serangkaian tes yang dirancang untuk menguji pemahaman mendalam tentang kimia fisika dan biologi tingkat lanjut o1 berhasil mengalahkan para ahli berpendidikan PhD. Prestasi ini menjadikan o1 sebagai model AI pertama yang mampu melampaui kinerja manusia dalam benchmark GPQA Diamond.
GPQA Diamond merupakan tolok ukur kecerdasan yang sangat sulit menguji keahlian di bidang kimia fisika dan biologi. Untuk membandingkan kinerja model dengan manusia OpenAI merekrut sejumlah ahli bergelar PhD untuk menjawab pertanyaan-pertanyaan GPQA Diamond. Hasilnya mengejutkan o1 mampu melampaui kinerja para ahli tersebut.
Meski demikian OpenAI menegaskan bahwa hasil ini tidak berarti o1 lebih mampu daripada seorang PhD dalam segala aspek. Model ini hanya lebih mahir dalam memecahkan beberapa jenis masalah yang biasanya dapat diselesaikan oleh seorang PhD. Keunggulan o1 terletak pada kemampuannya untuk menghasilkan rangkaian pemikiran internal yang panjang sebelum memberikan jawaban.
Selain GPQA Diamond o1 juga mengungguli model-model AI lainnya dalam berbagai benchmark pembelajaran mesin. Dengan kemampuan persepsi visual yang diaktifkan o1 meraih skor 78.2% pada MMMU menjadikannya model pertama yang mampu bersaing dengan ahli manusia di bidang ini. o1 juga mengungguli GPT-4o dalam 54 dari 57 subkategori MMLU.
Keberhasilan o1 ini membuka diskusi menarik tentang masa depan pendidikan dan penelitian ilmiah. Apakah AI akan menjadi asisten yang sangat berharga bagi para ilmuwan ataukah justru mengancam peran manusia dalam pengembangan ilmu pengetahuan? Bagaimanapun juga kolaborasi antara kecerdasan manusia dan AI tampaknya akan menjadi kunci untuk membuka terobosan-terobosan baru dalam berbagai bidang keilmuan di masa depan.