Berita Perangkat Keras dan Teknologi Studi Mengungkap Tugas di Mana AI Menyaingi Kinerja Manusia

Studi Mengungkap Tugas di Mana AI Menyaingi Kinerja Manusia

Arkadiy Andrienko
Baca versi lengkap

OpenAI telah melakukan studi berskala besar untuk menilai seberapa baik jaringan saraf modern menangani tugas pekerjaan yang sebenarnya. Temuan menunjukkan bahwa kecerdasan buatan sudah dapat melakukan beberapa fungsi pada tingkat karyawan berpengalaman di berbagai profesi.

Eksperimen yang disebut GDPval ini mencakup 220 tugas di 44 profesi yang berbeda. Para profesional di bidang ini sendiri mengevaluasi seberapa efektif model AI menangani pekerjaan yang mereka lakukan setiap hari. Profesi ini termasuk agen real estat, pengacara, insinyur, pengembang perangkat lunak, apoteker, dan penasihat keuangan.

Studi ini menemukan bahwa jaringan saraf berkinerja terbaik dengan tugas rutin yang terdefinisi dengan baik. Misalnya, AI sudah dapat menyusun materi pemasaran, menganalisis data pasar, membantu dalam menyiapkan dokumen hukum awal, atau memproses gambar medis. Menariknya, dalam kompetisi informal di antara model-model ini, pemimpin bukanlah produk dari OpenAI. Model yang dinilai terbaik oleh para ahli adalah Claude Opus 4.1 dari Anthropic, dengan GPT-5 mengikuti di belakangnya.

Sebuah versi yang lebih maju dari GPT-5 menghasilkan output yang dinilai oleh para ahli setara atau lebih baik daripada pekerjaan manusia dalam 40% kasus. Sebaliknya, generasi sebelumnya, GPT-4o, mencapai hasil ini hanya dalam 13,7% tugas. OpenAI menekankan bahwa ini bukan tentang sepenuhnya menggantikan manusia, tetapi lebih kepada peran AI dalam membantu karyawan, di mana mesin dapat melakukan beberapa tugas repetitif lebih cepat dan lebih murah, membebaskan para profesional untuk fokus pada hal-hal yang lebih kompleks.

Hambatan utama untuk adopsi yang luas tetap pada apa yang disebut "halusinasi AI"—kejadian di mana jaringan saraf menghasilkan informasi yang tidak dapat diandalkan atau dibuat-buat. Ini sangat terlihat dalam proyek yang panjang dan kompleks, di mana pengawasan manusia masih sangat penting. Satu hal yang jelas: AI tidak lagi sekadar mainan; ia telah menjadi alat yang mengubah permainan dan dapat berfungsi sebagai bantuan berharga bagi manusia di berbagai bidang profesional.

    Tentang Penulis