Новини OpenAI випустила просунуту модель o1: штучний інтелект нового рівня

OpenAI випустила просунуту модель o1: штучний інтелект нового рівня

DoubleA
Читати у повній версії

Основна відмінність o1 від попередніх версій ІІ полягає в її здатності до логічного мислення та аналізу. На відміну від GPT-4o, який в основному покладається на пошук відповідей у базі даних, o1 імітує людський процес мислення: вона розбиває завдання на окремі кроки, розглядає різні підходи та виправляє власні помилки. Це робить її набагато більш ефективною у вирішенні складних завдань, що вимагають послідовного аналізу та логічного міркування.

Модель продемонструвала видатні результати на тестах, призначених для оцінки розумових здібностей. Зокрема, на кваліфікаційному етапі Міжнародної математичної олімпіади (IMO), o1 впоралася з 83% завдань, що значно перевищує результати GPT-4o, який правильно вирішив лише 13%. У тестах на програмування модель зайняла 49-е місце на Міжнародній олімпіаді з інформатики (IOI) і показала перевагу над 89% учасників платформи Codeforces.

Модель пройшла складний тест GPQA diamond, який оцінює знання в таких галузях, як хімія, фізика та біологія. У результаті, o1 показала рівень, співставний з докторами наук, хоча розробники підкреслюють, що це не означає її перевагу над усіма спеціалістами, а лише її здатність вирішувати деякі завдання на найвищому рівні.

Ключем до успіху нової моделі став принципово новий алгоритм навчання, відомий як «ланцюг думок». Цей підхід дозволяє o1 продумувати свої рішення більш глибоко, вдаючись до методу навчання з підкріпленням, що дає змогу нейромережі не лише виправляти власні помилки, а й оптимізувати процес вирішення завдань, пробуючи різні стратегії.

Однак, незважаючи на всі переваги, у моделі o1 є і свої недоліки. Вона менш ефективна при роботі з енциклопедичними знаннями порівняно з GPT-4o і не може обробляти веб-сторінки, файли та зображення, крім того, її обчислювальні процеси повільніші, а вартість використання вища.

OpenAI вже зробила модель o1 доступною в прев'ю-версії для користувачів ChatGPT і розробників через API. Окрім основної моделі, OpenAI представила полегшену версію — o1-mini, яка орієнтована на завдання, пов'язані з програмуванням, пропонуючи легшу та доступнішу альтернативу для розробників.

🍑 В Escape from Tarkov завезли плакаты с девушками
Коментарі 21
Залишити коментар
3 місяці

Где опробовать? Пару дней назад дал ChatGPT несложное задание перевести периодичную дробь в обыкновенную. Тоже показывала ход решения, но в итоге промахнулась.

Відповісти
3 місяці

А какой был пример и какой верный ответ? В группе помню писали, но искать слишком долго

Відповісти
3 місяці

В чате рассказывал недавно, пролистаю — гляну. Задание: Переведи периодичную дробь 5.2(45) в обыкновенную дробь. Выдал в ответе: Итак, периодическая дробь ( 5.2(45) ) в виде обыкновенной дроби равна ( frac{229}{44} ). Надо понимать как 229/44. Это 5.20(45).

Відповісти
3 місяці

В ответе внутри скобок обратный слеш, при отправке комментария здесь он пропадает.

Відповісти
3 місяці

А правильный ответ какой?

Відповісти
3 місяці

577/110.

Відповісти
3 місяці

Копилот выдал верную пропорцию, но число в три раза больше. Когда я спросил почему не выдал 577 на 110, он ответил

Показать спойлерСкрыть спойлер
Відповісти
3 місяці

Спрячь решение за спойлер, а то модер полотно удалит, по своим комментам знаю точно.

Відповісти
3 місяці

В тот же день спрашивал у Копилота.

Показать спойлерСкрыть спойлер

Тоже ошибся.

Відповісти
3 місяці
выдал верную пропорцию, но число в три раза больше

Не понял, как это.

Відповісти
3 місяці

Выдал 1731 на 330

Відповісти
3 місяці

У меня есть подозрения в неправильном составлении запросов, поэтому получил неправильные ответы.

Відповісти
3 місяці

Вполне возможно. Тем более она же сначала переводит всё на английский, а потом отвечает, снова переводя на русский

Відповісти
3 місяці

На русском же можно. Ваши запросы на русском были?

Відповісти
3 місяці

Да, на русском. Но нейросеть сама переводит запросы на английский, их обрабатывает, составляет ответ и его переводит на русский.
З.ы. тут ошибся. Копилот напрямую обрабатывает запрос. Значит спутал с чатGPT

Відповісти
3 місяці

И восстали машины из пепла ядерного огня...

Відповісти
3 місяці

до этого сценария еще долго

Відповісти
3 місяці

Думаешь?

Відповісти
3 місяці

Было бы неплохо если бы он за меня работал, а я деньги получал.

Відповісти
3 місяці

В этом то и соль, они не облегчают, а лишь добавляют трудностей))

Відповісти
Rintslerr Забанений
3 місяці

какой ИИ я с вас балдею это тупой набор скриптов не более

Відповісти