Новини OpenAI випустила просунуту модель o1: штучний інтелект нового рівня

OpenAI випустила просунуту модель o1: штучний інтелект нового рівня

Arkadiy Andrienko

13 вересня 2024, 10:26

Читати у повній версії

Основна відмінність o1 від попередніх версій ІІ полягає в її здатності до логічного мислення та аналізу. На відміну від GPT-4o, який в основному покладається на пошук відповідей у базі даних, o1 імітує людський процес мислення: вона розбиває завдання на окремі кроки, розглядає різні підходи та виправляє власні помилки. Це робить її набагато більш ефективною у вирішенні складних завдань, що вимагають послідовного аналізу та логічного міркування.

Модель продемонструвала видатні результати на тестах, призначених для оцінки розумових здібностей. Зокрема, на кваліфікаційному етапі Міжнародної математичної олімпіади (IMO), o1 впоралася з 83% завдань, що значно перевищує результати GPT-4o, який правильно вирішив лише 13%. У тестах на програмування модель зайняла 49-е місце на Міжнародній олімпіаді з інформатики (IOI) і показала перевагу над 89% учасників платформи Codeforces.

Модель пройшла складний тест GPQA diamond, який оцінює знання в таких галузях, як хімія, фізика та біологія. У результаті, o1 показала рівень, співставний з докторами наук, хоча розробники підкреслюють, що це не означає її перевагу над усіма спеціалістами, а лише її здатність вирішувати деякі завдання на найвищому рівні.

Ключем до успіху нової моделі став принципово новий алгоритм навчання, відомий як «ланцюг думок». Цей підхід дозволяє o1 продумувати свої рішення більш глибоко, вдаючись до методу навчання з підкріпленням, що дає змогу нейромережі не лише виправляти власні помилки, а й оптимізувати процес вирішення завдань, пробуючи різні стратегії.

Однак, незважаючи на всі переваги, у моделі o1 є і свої недоліки. Вона менш ефективна при роботі з енциклопедичними знаннями порівняно з GPT-4o і не може обробляти веб-сторінки, файли та зображення, крім того, її обчислювальні процеси повільніші, а вартість використання вища.

OpenAI вже зробила модель o1 доступною в прев'ю-версії для користувачів ChatGPT і розробників через API. Окрім основної моделі, OpenAI представила полегшену версію — o1-mini, яка орієнтована на завдання, пов'язані з програмуванням, пропонуючи легшу та доступнішу альтернативу для розробників.

⚡️ Павел Дуров анонсировал приватную блокчейн-сеть для запуска нейронок

PC Новини Залізо і технології ChatGPT OpenAI нейромережі

Про автора

Arkadiy Andrienko

Автор статей і новин

Як технічний журналіст VGTimes, я з однаковим задоволенням обговорюю новітні графічні процесори та заглиблююсь у тонкощі класичних RPG. Починаючи з 2018 року пишу про ігри та обладнання, мій досвід роботи в галузі звукорежисури дозволив мені добре розбиратися в нюансах аудіотехнологій, і я завжди знаходжусь у пошуку чогось нового в галузі ігрового обладнання. Коли я не пишу про технології, то, швидше за все, я досліджую постапокаліптичні пустки в Fallout, керую колонією в RimWorld або командую арміями в Hearts of Iron IV. Для мене ігри — це більше, ніж просто хобі — це пристрасть, яка підживлює мій творчий потенціал і підтримує зв'язок з постійно розвиваючим світом технологій.

Коментарі21

Залишити коментар

gooranga

1 рік

Где опробовать? Пару дней назад дал ChatGPT несложное задание перевести периодичную дробь в обыкновенную. Тоже показывала ход решения, но в итоге промахнулась.

Відповісти

ithitym

1 рік

А какой был пример и какой верный ответ? В группе помню писали, но искать слишком долго

Відповісти

gooranga

1 рік

В чате рассказывал недавно, пролистаю — гляну. Задание: Переведи периодичную дробь 5.2(45) в обыкновенную дробь. Выдал в ответе: Итак, периодическая дробь ( 5.2(45) ) в виде обыкновенной дроби равна ( frac{229}{44} ). Надо понимать как 229/44. Это 5.20(45).

Відповісти

gooranga

1 рік

В ответе внутри скобок обратный слеш, при отправке комментария здесь он пропадает.

Відповісти

ithitym

1 рік

А правильный ответ какой?

Відповісти

gooranga

1 рік

577/110.

Відповісти

ithitym

1 рік

Копилот выдал верную пропорцию, но число в три раза больше. Когда я спросил почему не выдал 577 на 110, он ответил

Показать спойлер

Відповісти

gooranga

1 рік

Спрячь решение за спойлер, а то модер полотно удалит, по своим комментам знаю точно.

Відповісти

gooranga

1 рік

В тот же день спрашивал у Копилота.

Показать спойлер

Тоже ошибся.

Відповісти

gooranga

1 рік

выдал верную пропорцию, но число в три раза больше

Не понял, как это.

Відповісти

ithitym

1 рік

Выдал 1731 на 330

Відповісти

gooranga

1 рік

У меня есть подозрения в неправильном составлении запросов, поэтому получил неправильные ответы.

Відповісти

ithitym

1 рік

Вполне возможно. Тем более она же сначала переводит всё на английский, а потом отвечает, снова переводя на русский

Відповісти

gooranga

1 рік

На русском же можно. Ваши запросы на русском были?

Відповісти

ithitym

1 рік

Да, на русском. Но нейросеть сама переводит запросы на английский, их обрабатывает, составляет ответ и его переводит на русский.
З.ы. тут ошибся. Копилот напрямую обрабатывает запрос. Значит спутал с чатGPT

Відповісти

Bulochka_C_Makom

1 рік

И восстали машины из пепла ядерного огня...

Відповісти

Sky_new

1 рік

до этого сценария еще долго

Відповісти

Bulochka_C_Makom

1 рік

Думаешь?

Відповісти

БиллиБоб

1 рік

Было бы неплохо если бы он за меня работал, а я деньги получал.

Відповісти

bobie

1 рік

В этом то и соль, они не облегчают, а лишь добавляют трудностей))

Відповісти

Rintslerr Забанений

1 рік

какой ИИ я с вас балдею это тупой набор скриптов не более

Відповісти