OpenAI o1 Kalahkan Mahasiswa PhD dalam Ujian Sains, Peluang atau Justru Ancaman?

Kecerdasan buatan yang semakin berkembang
Sumber :
  • id.pinterest.com

Bandung, VIVA – Dunia akademis dikejutkan oleh kemampuan luar biasa yang ditunjukkan OpenAI o1 model bahasa besar (LLM) terbaru dari OpenAI. Dalam serangkaian tes yang dirancang untuk menguji pemahaman mendalam tentang kimia fisika dan biologi tingkat lanjut o1 berhasil mengalahkan para ahli berpendidikan PhD. Prestasi ini menjadikan o1 sebagai model AI pertama yang mampu melampaui kinerja manusia dalam benchmark GPQA Diamond.

Toloka Aplikasi Mikro Job yang Memungkinkan Siapapun Hasilkan Saldo Dana di Rumah

GPQA Diamond merupakan tolok ukur kecerdasan yang sangat sulit menguji keahlian di bidang kimia fisika dan biologi. Untuk membandingkan kinerja model dengan manusia OpenAI merekrut sejumlah ahli bergelar PhD untuk menjawab pertanyaan-pertanyaan GPQA Diamond. Hasilnya mengejutkan o1 mampu melampaui kinerja para ahli tersebut.

Ilustrasi kecerdasan buatan

Photo :
  • id.pinterest.com
Nubia Focus Pro 5G Smartphone Fotografi Kelas Pro dengan Sistem Kamera AI Canggih

Meski demikian OpenAI menegaskan bahwa hasil ini tidak berarti o1 lebih mampu daripada seorang PhD dalam segala aspek. Model ini hanya lebih mahir dalam memecahkan beberapa jenis masalah yang biasanya dapat diselesaikan oleh seorang PhD. Keunggulan o1 terletak pada kemampuannya untuk menghasilkan rangkaian pemikiran internal yang panjang sebelum memberikan jawaban.

Tablet Huawei MatePad SE 11 Fitur Cerdas Ramah Keluarga untuk Pengalaman Belajar dan Hiburan

Selain GPQA Diamond o1 juga mengungguli model-model AI lainnya dalam berbagai benchmark pembelajaran mesin. Dengan kemampuan persepsi visual yang diaktifkan o1 meraih skor 78.2% pada MMMU menjadikannya model pertama yang mampu bersaing dengan ahli manusia di bidang ini. o1 juga mengungguli GPT-4o dalam 54 dari 57 subkategori MMLU.

Halaman Selanjutnya
img_title