NeuReality Meluncurkan Chip yang Memaksimalkan Potensi GPU untuk AI

NeuReality Meluncurkan Chip yang Memaksimalkan Potensi GPU untuk AI

Arkadiy Andrienko

Startup Israel, NeuReality, telah memperkenalkan chip NR1 khusus mereka, yang menargetkan hambatan kritis: penggunaan Graphics Processing Unit (GPU) yang tidak efisien dalam aplikasi AI. Meskipun GPU modern yang berfokus pada AI telah menjadi jauh lebih canggih, Central Processing Unit (CPU) dan Network Interface Card (NIC) di server seringkali tidak mampu mengimbanginya. Perkiraan menunjukkan bahwa ketidaksesuaian ini menyebabkan GPU dalam sistem tersebut hanya beroperasi pada 30-50% dari kapasitas potensialnya.

Diposisikan sebagai "otak di balik inferensi AI," chip NR1 mengambil alih seluruh proses koordinasi antara GPU, CPU, dan jaringan, sehingga secara dramatis mempercepat pemrosesan data. Yang terpenting, chip ini kompatibel dengan akselerator apa pun – baik dari NVIDIA, AMD, maupun solusi khusus. NeuReality mengklaim NR1 memungkinkan pemanfaatan GPU yang hampir total. Dalam pengujian internal perusahaan, satu GPU yang menjalankan model AI generatif menghasilkan kinerja 6,5 ​​kali lebih tinggi dibandingkan arsitektur server berbasis x86 standar, dengan konsumsi daya yang sama.

Teknologi ini menjanjikan untuk:

  • Pembuatan aset game secara real-time, termasuk tekstur, animasi, dan alur suara.
  • Platform cloud gaming dan layanan streaming yang membutuhkan infrastruktur AI yang skalabel.
  • Pengembang yang menciptakan bot AI dan NPC dengan kemampuan perilaku tingkat lanjut.
  • Moderasi konten – mulai dari penyaringan obrolan hingga analisis aliran video.

NeuReality juga menyediakan SDK dan toolkit Kubernetes untuk tim DevOps dan MLOps, menawarkan jalur yang efisien untuk integrasi ke dalam studio game dan layanan cloud. Seiring AI semakin terintegrasi dalam pengembangan game – mendukung segala hal mulai dari pembuatan konten hingga analisis perilaku pemain yang canggih – mengurangi biaya dan mempercepat komputasi menjadi sangat penting. NR1 mewujudkan tren menuju disagregasi server, membagi komputasi AI ke dalam jalur pemrosesan terpisah yang sangat optimal.

Hal ini khususnya relevan bagi studio yang bekerja dengan AI generatif, model multimodal, pemrosesan gambar (termasuk grafik fotorealistik), sintesis suara, dan pembelajaran mesin pada data game dalam jumlah besar. Kedatangan NR1 menyoroti meningkatnya permintaan pasar akan solusi khusus yang secara efisien mengelola sumber daya selama tugas AI yang kompleks, terutama saat operasi meningkat.

    Tentang Penulis
    Komentar0