DeepSeek випустила Janus-Pro-7B, яка обігнала DALL-E 3 та Stable Diffusion у можливостях генерації зображень

Китайська компанія DeepSeek представила нову мультимодальну нейромережу Janus-Pro-7B, призначену для ефективного розпізнавання та генерації зображень. У порівнянні з попередніми версіями, нова модель значно покращена: оптимізовані алгоритми навчання, розширено датасет і збільшено розмір самої моделі. Ці зміни дозволили нейромережі значно покращити результати в задачах, пов'язаних з генерацією зображень за текстовими описами та їх аналізом.

Janus-Pro-7B продемонструвала перевагу над відомими моделями, такими як DALL-E 3 і Stable Diffusion, відповідно до тестів GenEval і DPG-Bench. Ця нейромережа володіє високою деталізацією та реалістичністю у створенні зображень, що робить її конкурентоспроможною на фоні інших рішень. Модель вже доступна на платформі Hugging Face, а код можна безкоштовно завантажити з GitHub, що дозволяє дослідникам і розробникам внести свій внесок у її розвиток.

✈️ Исторически достоверно — в Kingdom Come: Deliverance 2 заметили… самолёт
Допис був перекладений Показати оригінал (RU)
+6
Коментарі 5