Основна відмінність o1 від попередніх версій ІІ полягає в її здатності до логічного мислення та аналізу. На відміну від GPT-4o, який в основному покладається на пошук відповідей у базі даних, o1 імітує людський процес мислення: вона розбиває завдання на окремі кроки, розглядає різні підходи та виправляє власні помилки. Це робить її набагато більш ефективною у вирішенні складних завдань, що вимагають послідовного аналізу та логічного міркування.
Модель продемонструвала видатні результати на тестах, призначених для оцінки розумових здібностей. Зокрема, на кваліфікаційному етапі Міжнародної математичної олімпіади (IMO), o1 впоралася з 83% завдань, що значно перевищує результати GPT-4o, який правильно вирішив лише 13%. У тестах на програмування модель зайняла 49-е місце на Міжнародній олімпіаді з інформатики (IOI) і показала перевагу над 89% учасників платформи Codeforces.
Модель пройшла складний тест GPQA diamond, який оцінює знання в таких галузях, як хімія, фізика та біологія. У результаті, o1 показала рівень, співставний з докторами наук, хоча розробники підкреслюють, що це не означає її перевагу над усіма спеціалістами, а лише її здатність вирішувати деякі завдання на найвищому рівні.
Ключем до успіху нової моделі став принципово новий алгоритм навчання, відомий як «ланцюг думок». Цей підхід дозволяє o1 продумувати свої рішення більш глибоко, вдаючись до методу навчання з підкріпленням, що дає змогу нейромережі не лише виправляти власні помилки, а й оптимізувати процес вирішення завдань, пробуючи різні стратегії.
Однак, незважаючи на всі переваги, у моделі o1 є і свої недоліки. Вона менш ефективна при роботі з енциклопедичними знаннями порівняно з GPT-4o і не може обробляти веб-сторінки, файли та зображення, крім того, її обчислювальні процеси повільніші, а вартість використання вища.
OpenAI вже зробила модель o1 доступною в прев'ю-версії для користувачів ChatGPT і розробників через API. Окрім основної моделі, OpenAI представила полегшену версію — o1-mini, яка орієнтована на завдання, пов'язані з програмуванням, пропонуючи легшу та доступнішу альтернативу для розробників.
А какой был пример и какой верный ответ? В группе помню писали, но искать слишком долго
В чате рассказывал недавно, пролистаю — гляну. Задание: Переведи периодичную дробь 5.2(45) в обыкновенную дробь. Выдал в ответе: Итак, периодическая дробь ( 5.2(45) ) в виде обыкновенной дроби равна ( frac{229}{44} ). Надо понимать как 229/44. Это 5.20(45).
В ответе внутри скобок обратный слеш, при отправке комментария здесь он пропадает.
Копилот выдал верную пропорцию, но число в три раза больше. Когда я спросил почему не выдал 577 на 110, он ответил
Спрячь решение за спойлер, а то модер полотно удалит, по своим комментам знаю точно.
В тот же день спрашивал у Копилота.
Тоже ошибся.
У меня есть подозрения в неправильном составлении запросов, поэтому получил неправильные ответы.
Вполне возможно. Тем более она же сначала переводит всё на английский, а потом отвечает, снова переводя на русский
Да, на русском. Но нейросеть сама переводит запросы на английский, их обрабатывает, составляет ответ и его переводит на русский.
З.ы. тут ошибся. Копилот напрямую обрабатывает запрос. Значит спутал с чатGPT
Где опробовать? Пару дней назад дал ChatGPT несложное задание перевести периодичную дробь в обыкновенную. Тоже показывала ход решения, но в итоге промахнулась.