DeepSeek telah merilis Janus-Pro-7B, melampaui DALL-E 3 dan Stable Diffusion dalam kemampuan generasi gambar

DeepSeek telah merilis Janus-Pro-7B, melampaui DALL-E 3 dan Stable Diffusion dalam kemampuan generasi gambar

Arkadiy Andrienko

Perusahaan Cina DeepSeek telah memperkenalkan jaringan saraf multimodal baru mereka, Janus-Pro-7B, yang dirancang untuk pengenalan dan generasi gambar yang efisien. Dibandingkan dengan versi sebelumnya, model baru ini telah mengalami peningkatan yang signifikan: algoritma pelatihan telah dioptimalkan, dataset diperluas, dan ukuran model ditingkatkan. Perubahan ini telah memungkinkan jaringan saraf untuk sangat meningkatkan kinerjanya dalam tugas-tugas yang terkait dengan generasi gambar dari deskripsi tekstual dan analisis gambar.

Janus-Pro-7B telah mengungguli model-model terkenal seperti DALL-E 3 dan Stable Diffusion dalam tes GenEval dan DPG-Bench. Jaringan saraf ini menawarkan tingkat detail dan realisme yang tinggi dalam pembuatan gambar, menjadikannya pesaing kuat terhadap solusi lainnya. Model ini sudah tersedia di platform Hugging Face, dan kodenya dapat diunduh secara gratis dari GitHub, memungkinkan peneliti dan pengembang untuk berkontribusi pada pengembangannya.

    Tentang Penulis
    Komentar0