Новини Залізо та технології Stability AI представила компактну ІІ-модель для генерації звуку без інтернету

Stability AI представила компактну ІІ-модель для генерації звуку без інтернету

Arkadiy Andrienko
Читати у повній версії

Компанія Stability AI, відома своїми розробками в галузі генеративного ШІ, анонсувала нову модель для створення аудіо — Stable Audio Open Small. Головна особливість інструмента — можливість роботи на смартфонах без підключення до інтернету, завдяки оптимізації для процесорів Arm.

Модель, розроблена спільно з виробником чіпів Arm, орієнтована на створення коротких звукових фрагментів: семплів, ефектів або інструментальних замальовок довжиною до 11 секунд. За заявою розробників, генерація такого аудіо займає менше восьми секунд навіть на мобільних пристроях. Це стало можливим завдяки зменшенню розміру нейромережі до 341 мільйона параметрів і адаптації під енергоефективні чіпи.

На відміну від хмарних сервісів на кшталт Suno та Udio, Stable Audio Open Small функціонує локально, що вирішує проблему затримок і залежності від інтернету. Крім того, навчання моделі проводилось виключно на даних з безкоштовних бібліотек Free Music Archive та Freesound, що мінімізує ризики, пов'язані з авторськими правами. Це відрізняє її від деяких конкурентів, які використовують спірний контент для тренування ШІ.

Однак у інструмента є обмеження: він підтримує лише англійські текстові запити, не генерує вокал або складні композиції. Умови використання також варіюються: для стартапів і дослідників модель безкоштовна, але компанії з річним доходом вище $1 млн повинні придбати комерційну ліцензію. Stable Audio Open Small не претендує на заміну професійних студій, але пропонує зручне рішення для швидкого створення звукового супроводу безпосередньо на мобільних пристроях.

⚡️ Ghost of Yotei получила первые обзоры — 87 баллов на Metacritic и 89 на OpenCritic
    Про автора
    Коментарі2
    Залишити коментар
    4 місяці
    Кроме того, обучение модели проводилось исключительно на данных из бесплатных библиотек Free Music Archive и Freesound, что минимизирует риски, связанные с авторскими правами. Это отличает её от некоторых конкурентов, использующих спорный контент для тренировки ИИ.
    Вот это классно. Если она сможет и эффекты создавать (звуки шагов, позвякивания и т.д.), то это хороший инструмент для инди разработчиков
    Відповісти
    4 місяці
    Звук без интернета, картинки без интернета, общение без интернета... это про реальную жизнь что-ли?!
    Відповісти