xAI telah memperkenalkan model bahasa baru, Grok 3, yang disebut oleh pendiri perusahaan, Elon Musk, sebagai "AI terpandai di Bumi." Para pembuat chatbot mengklaim bahwa versi baru ini secara signifikan melampaui versi sebelumnya: ia memproses volume data pelatihan yang lebih besar dan memiliki mekanisme koreksi diri yang baru. Versi demo Grok 3 diluncurkan hari ini, dan ulasan pertama sudah muncul.
Apa yang Baru
Keunggulan utama Grok 3 adalah akses ke sumber daya komputasi yang lebih baik. Chatbot ini dilatih menggunakan superkomputer Colossus: pada tahap awal, para pembuatnya menggunakan 100.000 NVIDIA H100 GPU, kemudian menggandakan jumlah tersebut. Di masa depan, kekuatan komputasi diharapkan meningkat lima kali lipat.
Grok 3 mencakup mekanisme koreksi diri bawaan. AI menganalisis responsnya sendiri, membandingkannya dengan jawaban referensi, dan kemudian melakukan penyesuaian. Menariknya, chatbot menerima "hadiah" untuk respons yang akurat dan "hukuman" untuk apa yang disebut "halusinasi" — informasi yang salah atau dibuat-buat.
Menurut perwakilan xAI, Grok 3 lebih pintar daripada model lain dalam matematika, ilmu alam, dan pemrograman. Uji buta digunakan untuk mengevaluasi kualitas respons, yang berarti pengguna tidak mengetahui chatbot mana yang memberikan jawaban.
Selama presentasi Grok 3, xAI juga memperkenalkan Deep Search — agen pencarian "generasi berikutnya" yang mampu dengan cepat menemukan dan menganalisis informasi secara online. Meskipun fitur serupa ada di model pesaing, xAI mengklaim bahwa Deep Search lebih akurat.
Selain itu, Grok 3 akan segera menerima antarmuka suara, memungkinkan pengguna untuk berinteraksi seolah-olah berbicara dengan orang nyata. Suaranya dikatakan terdengar lebih alami dan ekspresif dibandingkan model pesaing.
Bagaimana Kinerjanya dalam Praktik
Pengguna di jejaring sosial X dapat mengakses chatbot baru dengan berlangganan X Premium+ seharga $50 per bulan. Meskipun belum banyak ulasan awal tentang Grok 3, beberapa di antaranya menonjol.
Misalnya, seorang pengguna bernama Penny2x berbagi bahwa mereka telah membuat permainan yang sepenuhnya fungsional menggunakan versi AI baru:
Grok 3 baru saja dirilis. Anda tidak akan percaya, saya sudah membuat permainan.
(Saya mendapatkan akses awal PAGI INI).
Permainan ini 100% dibuat oleh GROK, saya hanya memberi tahu apa yang saya inginkan, dan menempatkan kode di tempat yang tepat.
Saya terus meminta penyesuaian, dan ia terus mengeluarkan permainan dalam satu file yang bisa saya letakkan di desktop saya dan jalankan.
Permainan ini telah berubah selamanya.
Saya telah mengembangkan banyak hal dengan AI dari setiap pembangun AI besar lainnya akhir-akhir ini, mencoba memutuskan mana yang saya suka, dan grok adalah SEORANG PEMAIN. Saya tidak memiliki tolok ukur resmi, dan saya belum mengatur API jadi ini bukan alur kerja normal saya, tetapi rasanya sama sekali mampu seperti Sonet, 4o, atau yang lainnya.
Dalam satu atau dua hari ke depan saya akan mengaturnya sebagai bagian dari alur kerja saya di NVIM dan menggunakannya untuk pekerjaan nyata.
Ini luar biasa. Kita hidup di masa depan. Semua orang sekarang adalah pengembang.
Bahkan lebih menarik adalah apa yang dipikirkan salah satu pendiri OpenAI, Andrej Karpathy tentang Grok 3. Dia juga mengujicobakan model bahasa baru tersebut. Menurut Karpathy, di beberapa bidang, chatbot ini bersaing dengan pesaing teratas:
...Grok 3 jelas memiliki model pemikiran yang canggih (tombol "Pikir") dan berhasil dengan baik pada pertanyaan saya tentang Settlers of Catan:
"Buat halaman web permainan papan yang menunjukkan grid heksagonal, sama seperti dalam permainan Settlers of Catan. Setiap grid heksagonal diberi nomor dari 1..N, di mana N adalah jumlah total ubin heksagonal. Buatlah generik, sehingga seseorang dapat mengubah jumlah "cincin" menggunakan penggeser. Misalnya, di Catan, radiusnya adalah 3 heks. Halaman HTML tunggal, silakan."
Beberapa model tidak dapat melakukan ini dengan andal. Model pemikiran teratas OpenAI (misalnya, o1-pro, seharga $200/bulan) juga dapat melakukannya, tetapi semua DeepSeek-R1, Gemini 2.0 Flash Thinking, dan Claude tidak dapat.
Andrej Karpathy juga menghargai ketekunan Grok 3:
Saya suka bahwa model ini akan mencoba menyelesaikan hipotesis Riemann ketika diminta, mirip dengan DeepSeek-R1 tetapi berbeda dengan banyak model lain yang menyerah dengan cepat (o1-pro, Claude, Gemini 2.0 Flash Thinking) dan hanya mengatakan bahwa itu adalah masalah besar yang belum terpecahkan. Saya harus menghentikannya pada akhirnya karena saya merasa sedikit kasihan padanya, tetapi ia menunjukkan keberanian, dan siapa tahu, mungkin suatu hari...
Namun, ada beberapa kekurangan. Agen Deep Search mengangkat beberapa kekhawatiran:
…model ini tampaknya tidak suka merujuk X sebagai sumber secara default, meskipun Anda dapat memintanya secara eksplisit. Beberapa kali saya menangkapnya berhalusinasi URL yang tidak ada. Beberapa kali ia mengatakan hal-hal faktual yang saya rasa tidak benar dan tidak memberikan kutipan untuk itu (mungkin tidak ada).
Sebagai kesimpulan, Andrej Karpathy mencatat bahwa, berdasarkan kesan awal, Grok 3 telah mendekati tingkat model-model teratas OpenAI, seperti o1-pro ($200 per bulan), dan bahkan sedikit melampaui DeepSeek-R1 dan Gemini 2.0 Flash Thinking. Mengingat bahwa tim xAI mulai mengembangkan AI ini dari nol sekitar setahun yang lalu, kemajuannya mengesankan. Namun, tes yang lebih komprehensif diperlukan sebelum menentukan apakah chatbot ini benar-benar layak menyandang gelar "yang paling pintar."
Kekhawatiran Bias
Tidak ada rahasia bahwa Elon Musk secara aktif berpartisipasi dalam kehidupan politik AS dan secara terbuka mengungkapkan pandangannya. Beberapa pengguna internet khawatir bahwa Grok 3 mungkin juga mendorong narasi tertentu.
Kekhawatiran ini tidak tanpa dasar: Musk membagikan tangkapan layar yang menunjukkan chatbot mengkritik satu outlet media berita sambil memuji X sebagai sumber informasi yang paling dapat diandalkan. Ini meskipun Grok 3 diposisikan sebagai produk dengan sensor yang minimal. Banyak orang percaya bahwa AI harus tetap netral dalam penilaiannya.
***
Terlepas dari itu, peluncuran model bahasa lain yang menjanjikan menandai tonggak penting dalam perlombaan AI yang sedang berlangsung. Semakin tinggi persaingan, semakin cepat kemajuan berkembang.
Apa pendapat Anda tentang Grok 3? Bagikan pemikiran Anda di kolom komentar.
-
Jaringan saraf terbaik untuk generasi konten pada Januari-Februari 2025 -
Grok 3 Menjadi Gratis: Elon Musk Meluncurkan AI Terpintar di Dunia -
Elon Musk Mengkritik Game 'Woke' Lagi, Berjanji untuk Membuka Studionya Sendiri -
Elon Musk Secara Tak Terduga Mengumumkan Penjualan Jaringan Sosial X -
Pencarian ChatGPT Menjadi Lebih Mudah Diakses — OpenAI Menantang Raksasa Pencarian
Fazil Dzhyndzholiia





