Raksasa teknologi China, Tencent, telah meluncurkan alat baru yang menarik untuk pembuat konten: model AI bernama HunyuanWorld-Voyager. Alat ini dapat menghasilkan video pendek hanya dari satu gambar statis, menciptakan ilusi meyakinkan tentang pergerakan kamera di dalam adegan.
Tidak seperti generator video standar seperti Sora, yang pada dasarnya melukis urutan bingkai yang mungkin, Voyager fokus pada menjaga konsistensi spasial. Ini berarti bahwa saat kamera "bergerak" maju atau menyamping, objek dalam gambar tidak melayang atau berubah bentuk secara sembarangan. Sebaliknya, mereka mempertahankan proporsi dan posisi mereka, sama seperti yang akan terjadi di lingkungan 3D nyata.
Seorang pengguna mengunggah gambar apa pun — katakanlah, foto interior sebuah ruangan atau pemandangan. Mereka kemudian mendefinisikan trajektori untuk kamera virtual yang akan diikuti, dan sistem menghasilkan 49 bingkai (sekitar 2 detik video), yang dapat disatukan menjadi urutan yang lebih panjang.
Fitur kunci dari teknologi ini adalah kemampuannya untuk menghasilkan video berwarna dan data kedalaman per bingkai secara bersamaan. Ini memungkinkan hasilnya diubah menjadi awan titik 3D untuk pemodelan lebih lanjut, yang bisa sangat berguna untuk pengembangan game. Namun, model ini tidak menciptakan ruang 3D yang sebenarnya; ia dengan mahir menirunya. Karena ini, ia dapat menghasilkan kesalahan pada urutan yang lebih panjang atau saat mencoba rotasi penuh 360 derajat.
Penghalang terbesar untuk adopsi yang luas adalah persyaratan perangkat keras. Untuk menjalankan model ini bahkan pada kualitas minimum (540p), diperlukan kartu grafis dengan setidaknya 60 GB VRAM. Untuk hasil yang stabil, kartu 80 GB disarankan — solusi semacam itu baik mahal maupun langka.
Model ini secara resmi tersedia di Hugging Face, tetapi lisensinya melarang penggunaan di dalam Uni Eropa, Inggris, dan Korea Selatan. Perusahaan komersial besar dengan audiens lebih dari 100 juta pengguna juga akan memerlukan kesepakatan terpisah dengan Tencent.
Meski memiliki keterbatasan saat ini, Voyager menarik untuk tugas-tugas niche tertentu. Namun, untuk saat ini, ia lebih merupakan alat yang menarik bagi para penggemar dan profesional daripada produk pasar massal. Para ahli mencatat bahwa perkembangan seperti ini — dari Tencent, Google (Genie 3), dan startup lainnya — adalah langkah awal menuju bentuk seni digital generatif baru, di mana seorang penonton dapat secara halus "menggerakkan" kamera di dalam dunia yang diciptakan oleh AI.