NVIDIA представила Fugatto — ІІ для генерації звуку з тексту

NVIDIA анонсувала нову експериментальну модель генеративного ІІ під назвою Fugatto (Foundational Generative Audio Transformer Opus 1), яка здатна генерувати та модифікувати музичні, голосові та звукові файли на основі текстових запитів.

Модель розроблена для роботи з широким спектром завдань, включаючи:

  • Створення музичних прототипів з можливістю змінювати стилі, інструменти та голоси;
  • Генерацію голосів для мовних освітніх інструментів;
  • Адаптацію звуків для відеоігор у реальному часі в залежності від дій гравців.

Fugatto також має унікальну здатність комбінувати команди, наприклад, синтезувати мову з певними акцентами та інтонаціями або створювати звуки різного роду, які при цьому матимуть динаміку. Розробка моделі велася за участю спеціалістів з усього світу, що дозволило інтегрувати в неї багатомовні та багатоакцентні можливості.

На даний момент NVIDIA не розкриває деталей про публічний доступ до Fugatto, залишивши це питання без коментарів.

🐼 Работа над «Кунг-фу пандой 5» уже началась — сообщает инсайдер Дэниел Рихтман
Допис був перекладений Показати оригінал (RU)
+1
Коментарі 5