Чат замість фотошопа: Gemini 2.0 Flash від Google навчає ШІ редагувати знімки в діалозі

Компанія Google зробила несподіваний крок у гонці генеративного ІІ, представивши експериментальну мультимодальну версію Gemini 2.0 Flash в AI Studio. Тепер модель не тільки генерує зображення «з нуля», але й дозволяє змінювати деталі на існуючих знімках через звичайний чат — без необхідності пересоздавати картинку заново. Це перший випадок, коли великий гравець ринку впроваджує такий функціонал, випередивши OpenAI та Ілона Маска з його xAI.
Користувачі можуть у режимі діалогу давати Gemini команди на кшталт «заміни фон на гірський пейзаж» або «додай напис українською мовою». Нейромережа зберігає контекст бесіди, що дозволяє вносити серію правок поступово. Наприклад, спочатку змінити одяг людини на фото, потім «перенести» його в іншу локацію, а після — налаштувати освітлення. Усі зміни застосовуються до вихідного зображення, що економить час і ресурси.
Кожне згенероване зображення автоматично помічається водяним знаком SynthID — технологія Google для боротьби з глибокими фейками. Це особливо важливо для дизайнерів і маркетологів, які зможуть легально використовувати контент у комерційних проектах. Серед неочевидних функцій — клонування текстур об'єктів, колоризація старих фото і навіть «додаткова малювання» відсутніх елементів на знімках за допомогою текстових підказок.
Хоча Gemini 2.0 Flash розуміє запити українською, офіційно сервіс недоступний в Росії. Розробники та компанії можуть тестувати модель безкоштовно через AI Studio або API, але деякі функції поки працюють нестабільно — наприклад, заміна облич або складна реставрація. У Google підкреслюють, що це рання версія, а фінальний реліз буде оптимізований для завдань реального часу.
Експерти відзначають, що Google вперше об'єднала в одній моделі креативність Midjourney, точність DALL-E та інтерактивність ChatGPT. Якщо експеримент виявиться успішним, це кратно спростить роботу в дизайні, освіті й навіть журналістиці — наприклад, миттєва візуалізація даних або створення ілюстрацій для статей без участі людини. Поки що Gemini 2.0 Flash залишається цікавим інструментом, який, однак, вже сьогодні змушує переглянути уявлення про можливості генеративного ІІ.
-
Google все ще змушують продати веб-браузер Chrome
-
Реклама вбила пошук: користувачі шукають альтернативи Google
-
Google розпочала «тиху війну» з блокувальниками: популярні блокувальники реклами перестають працювати
-
Покращена захист 2.0: Google Chrome представив ІІ-захист від невідомих загроз
-
ШІ від Google навчився аналізувати світ через камеру смартфона