Free DeepSeek R1 Melonjak dalam Penalaran Logis — Hampir Menangkap ChatGPT Berbayar

Free DeepSeek R1 Melonjak dalam Penalaran Logis — Hampir Menangkap ChatGPT Berbayar

Arkadiy Andrienko

Tim DeepSeek telah diam-diam meluncurkan pembaruan besar untuk asisten AI gratisnya, R1. Meskipun para pengembang dengan rendah hati menyebutnya "kecil," pengujian mengungkapkan lompatan besar dalam kemampuannya untuk menangani masalah yang sulit.

Peningkatan kunci adalah logika dan penalaran ilmiah yang ditingkatkan. Model R1-0528 yang diperbarui sekarang dapat menyelesaikan masalah olimpiade matematika dengan benar hampir 9 kali dari 10 – sebuah lompatan besar sejak Januari. Yang paling mengesankan adalah kemajuannya dalam tes "Ujian Terakhir Kemanusiaan" yang terkenal sulit, di mana skor R1 lebih dari dua kali lipat menjadi 17,7%. (Tes itu masih membuat kebanyakan AI bingung.)

Dalam enam pengujian independen (sains, pemrograman, matematika lanjutan), R1 yang ditingkatkan memberikan hasil yang sangat mendekati ChatGPT-o3 berbayar dari OpenAI. Selisihnya minimal di mana saja kecuali satu tolok ukur pengkodean. Para pengembang juga mengklaim R1 sekarang menghasilkan lebih sedikit ketidakakuratan. Sementara kemampuan serupa di ChatGPT-o3 dikenakan biaya $20/bulan, DeepSeek R1 tetap sepenuhnya gratis.

Peningkatan ini tidak berasal dari model yang lebih besar, tetapi dari "penyesuaian halus" yang lebih cerdas – mempertajam keterampilan penalaran dan analisisnya. Pengguna segera menyadari: aplikasi seluler DeepSeek kembali meroket ke posisi teratas di toko aplikasi di AS, Inggris, Jepang, Korea Selatan, dan China.

Asisten Cina gratis ini telah membuat kemajuan serius dalam menutup kesenjangan dengan pemimpin pasar. Sementara OpenAI masih memiliki keunggulan dalam multimodalitas (gambar, suara), DeepSeek R1 semakin menjadi pilihan utama bagi siapa saja yang membutuhkan analisis mendalam dan pemecahan masalah kompleks – tanpa langganan.

    Tentang Penulis
    Komentar0