Користувачі додатку Gemini та розробники на платформах Google AI Studio та Vertex AI отримають доступ до оновленого інструменту для редагування зображень. Нова модель, відома під псевдонімом Nano-banana, дозволяє вносити в фотографії складні правки за текстовим запитом.
Основна перевага оновлення — висока точність та збереження деталей. Якщо попросити більшість сучасних ІІ-сервісів змінити колір якихось деталей на знімку, результат може розчарувати: обличчя може спотворитися, а фон змінитися. Gemini 2.5 Flash Image справляється з такими завданнями, коректно працюючи з дрібними елементами, такими як риси обличчя, текстура шерсті тварин або візерунки на одязі.
Компанія також заявляє, що впровадила в систему суворі захисні заходи. Нейромережу заборонено використовувати для створення зображень інтимного характеру без згоди людини. Усі згенеровані картинки автоматично позначаються спеціальними метаданими та водяними знаками, щоб користувачі могли відрізнити їх від справжніх фотографій.
Запуск точного редактора зображень — важливий крок для Google в конкурентній боротьбі з OpenAI, чат-бот якого, ChatGPT, має більше користувачів на тиждень, ніж Gemini за місяць. Нова функція в Gemini буде корисна в повсякденних завданнях: наприклад, для візуалізації ідей щодо ремонту або підбору стилю в одязі, оскільки модель вміє поєднувати в одному зображенні кілька предметів за прикладом. Повноцінний доступ для всіх користувачів буде відкрито в кінці серпня.
Розширений функціонал для редактора зображень з'явився слідом за розширенням доступності NotebookLM, який отримав підтримку більш ніж 80 мов. Судячи з усього, осінь принесе безліч нововведень від ІІ-команди Google.