
OpenAI вбудувала в ChatGPT розумну генерацію зображень на основі GPT-4o
Компанія OpenAI інтегрувала потужний інструмент генерації зображень прямо в ChatGPT. З сьогоднішнього дня користувачі можуть створювати детальні візуали, використовуючи оновлену модель GPT-4o, здатну розуміти контекст, обробляти складні запити і навіть генерувати бездоганний текст на зображеннях.
Ранні версії ChatGPT використовували нейромережу DALL-E 3, але нова система, що отримала назву Images in ChatGPT, працює на базі мультимодального «універсала» GPT-4o. Це означає, що модель одночасно аналізує текст, аудіо, відео та зображення, що радикально підвищує точність. Тепер ІІ здатний коректно пов'язувати до 15–20 об'єктів в одному зображенні, уникаючи помилок, які раніше виникали навіть при 5–8 елементах.
Одним з ключових покращень стала можливість створювати зображення з ідеально читабельним текстом — проблема, яка довго залишалася ахіллесовою п'ятою генеративних моделей. Тепер ChatGPT може генерувати меню для ресторанів, логотипи з написами або інфографіку без помилок. Крім того, користувачі отримали функцію редагування: завантажене зображення можна модифікувати, додаючи або видаляючи елементи за простим текстовим запитом.
Новинка доступна для всіх підписок ChatGPT, включаючи безкоштовний тариф, де діють ліміти, аналогічні DALL-E 3. При цьому DALL-E залишиться в арсеналі через кастомні GPT-модулі. OpenAI приділила особливу увагу безпеці: всі зображення позначаються метаданими C2PA для ідентифікації ІІ-контенту, а система блокує запити, пов'язані з насильством, дипфейками та іншими зловживаннями.