NVIDIA анонсувала нову експериментальну модель генеративного ІІ під назвою Fugatto (Foundational Generative Audio Transformer Opus 1), яка здатна генерувати та модифікувати музичні, голосові та звукові файли на основі текстових запитів.
Модель розроблена для роботи з широким спектром завдань, включаючи:
Fugatto також має унікальну здатність комбінувати команди, наприклад, синтезувати мову з певними акцентами та інтонаціями або створювати звуки різного роду, які при цьому матимуть динаміку. Розробка моделі велася за участю спеціалістів з усього світу, що дозволило інтегрувати в неї багатомовні та багатоакцентні можливості.
На даний момент NVIDIA не розкриває деталей про публічний доступ до Fugatto, залишивши це питання без коментарів.
Теперь надо звука из текста. Но не речь, а музыка чтобы!