Google об'єднала генерацію відео, звуку та зображень в одному сервісі

Google об'єднала генерацію відео, звуку та зображень в одному сервісі

Arkadiy Andrienko

Компанія Google анонсувала набір інструментів для генерації мультимедійного контенту, включаючи відео, зображення та музику. Головна новинка — модель Veo 3, яка створює ролики з синхронізованим звуком. На відміну від аналогів, алгоритм самостійно підбирає аудіодоріжку: діалоги, шуми або музику, аналізуючи візуальну частину. Наприклад, якщо в кадрі йде дощ, глядач почує стук крапель без додаткових команд.

Ще одна модель, Imagen 4, генерує зображення в роздільній здатності 2K — від гіперреалістичних знімків до абстракцій. Для роботи зі звуком додано Music AI Sandbox, який дозволяє мікшувати треки за текстовими запитами. Усі ці інструменти об'єднані в сервіс Flow, де користувачі можуть комбінувати відео, картинки та текстові сценарії, редагувати ракурси камери або додавати нові сцени.

Особливий акцент Google зробила на безпеці: усі матеріали помічаються водяними знаками SynthID, щоб відрізняти їх від реальних записів. Компанія також співпрацює з кінематографістами та музикантами, щоб адаптувати ІІ-інструменти для професійних завдань. Однак не всі раді інноваціям: за даними Гільдії аніматорів Голлівуду, до 2026 року автоматизація може скоротити до 100 тисяч робочих місць у креативних індустріях США.

Поки Flow доступний тільки в США. Базова підписка (Google AI Pro), що включає 100 генерацій, оцінена в $20 (приблизно 1 606 гривень) на місяць. За словами розробників, сервіс орієнтований як на професіоналів, так і на новачків — наприклад, в ньому є бібліотека прикладів (Flow TV), де можна підглянути техніки створення роликів. Поки Google не розкриває, на яких даних навчалася модель, що викликає питання у спільноти. Тим не менше, це перший крок до того, щоб перетворити генеративний ІІ з експерименту в робочий інструмент для авторів.

⚡️ Слух: нас ждёт коллаба R.E.P.O
    Про автора
    Коментарі1