Американська науково-дослідна організація OpenAI представила нову функцію для ChatGPT під назвою Operator. Це ІІ-агент, який може автономно виконувати дії в інтернеті від імені користувача.
Operator заснований на новій моделі, яка називається Computer-Using Agent (CUA). Об'єднуючи візуальні можливості GPT-4o з розширеними навичками міркування через навчання з підкріпленням, CUA навчена взаємодії з графічними інтерфейсами користувача (GUI) — кнопками, меню та текстовими полями, які люди бачать на екрані.
Operator може бачити (через скріншоти) та взаємодіяти (використовуючи всі дії, доступні миші та клавіатурі) з браузером, що дозволяє йому виконувати дії в інтернеті без необхідності використання користувацьких API-інтеграцій.
Ось деякі з функцій, які підтримує Operator:
Примітно, що функція може відмовитися виконувати ті чи інші дії, які можуть завдати шкоди та несуть потенційну загрозу. Operator підтримує практично всі сайти протоколу HTTPS, а також деякі сервіси та додатки.
Під час використання функції Operator запускає зашифрований браузер у хмарі. За бажанням користувач може перехопити управління та скоригувати завдання. У деяких ситуаціях, таких як покупки на сайтах, користувач повинен підтвердити запит.
У США власники преміум-плану ChatGPT Pro (вартість $200 на місяць) вже отримали ранній доступ до Operator. У найближчому майбутньому OpenAI планує розширити підтримку для планів Plus, Team та Enterprise. У ЄС функція поки недоступна.
Нагадаємо, раніше ми повідомляли про нову ІІ-функцію для форуму Reddit.
Вместо пользователя сам придумывает запросы, сам же их ищет.