NVIDIA представила Fugatto — ІІ для генерації звуку з тексту
25 листопада 2024, 19:14
NVIDIA анонсувала нову експериментальну модель генеративного ІІ під назвою Fugatto (Foundational Generative Audio Transformer Opus 1), яка здатна генерувати та модифікувати музичні, голосові та звукові файли на основі текстових запитів.
Модель розроблена для роботи з широким спектром завдань, включаючи:
- Створення музичних прототипів з можливістю змінювати стилі, інструменти та голоси;
- Генерацію голосів для мовних освітніх інструментів;
- Адаптацію звуків для відеоігор у реальному часі в залежності від дій гравців.
Fugatto також має унікальну здатність комбінувати команди, наприклад, синтезувати мову з певними акцентами та інтонаціями або створювати звуки різного роду, які при цьому матимуть динаміку. Розробка моделі велася за участю спеціалістів з усього світу, що дозволило інтегрувати в неї багатомовні та багатоакцентні можливості.
На даний момент NVIDIA не розкриває деталей про публічний доступ до Fugatto, залишивши це питання без коментарів.
Допис був перекладений Показати оригінал (RU)