Новини OpenAI випустила просунуту модель o1: штучний інтелект нового рівня

OpenAI випустила просунуту модель o1: штучний інтелект нового рівня

DoubleA
Читати у повній версії

Основна відмінність o1 від попередніх версій ІІ полягає в її здатності до логічного мислення та аналізу. На відміну від GPT-4o, який в основному покладається на пошук відповідей у базі даних, o1 імітує людський процес мислення: вона розбиває завдання на окремі кроки, розглядає різні підходи та виправляє власні помилки. Це робить її набагато більш ефективною у вирішенні складних завдань, що вимагають послідовного аналізу та логічного міркування.

Модель продемонструвала видатні результати на тестах, призначених для оцінки розумових здібностей. Зокрема, на кваліфікаційному етапі Міжнародної математичної олімпіади (IMO), o1 впоралася з 83% завдань, що значно перевищує результати GPT-4o, який правильно вирішив лише 13%. У тестах на програмування модель зайняла 49-е місце на Міжнародній олімпіаді з інформатики (IOI) і показала перевагу над 89% учасників платформи Codeforces.

Модель пройшла складний тест GPQA diamond, який оцінює знання в таких галузях, як хімія, фізика та біологія. У результаті, o1 показала рівень, співставний з докторами наук, хоча розробники підкреслюють, що це не означає її перевагу над усіма спеціалістами, а лише її здатність вирішувати деякі завдання на найвищому рівні.

Ключем до успіху нової моделі став принципово новий алгоритм навчання, відомий як «ланцюг думок». Цей підхід дозволяє o1 продумувати свої рішення більш глибоко, вдаючись до методу навчання з підкріпленням, що дає змогу нейромережі не лише виправляти власні помилки, а й оптимізувати процес вирішення завдань, пробуючи різні стратегії.

Однак, незважаючи на всі переваги, у моделі o1 є і свої недоліки. Вона менш ефективна при роботі з енциклопедичними знаннями порівняно з GPT-4o і не може обробляти веб-сторінки, файли та зображення, крім того, її обчислювальні процеси повільніші, а вартість використання вища.

OpenAI вже зробила модель o1 доступною в прев'ю-версії для користувачів ChatGPT і розробників через API. Окрім основної моделі, OpenAI представила полегшену версію — o1-mini, яка орієнтована на завдання, пов'язані з програмуванням, пропонуючи легшу та доступнішу альтернативу для розробників.

🔞 В «убийцу Sims» завезут секс — inZOI ещё не вышла, но фанаты уже анонсировали крупный мод
Коментарі 21
Залишити коментар
6 місяців

Где опробовать? Пару дней назад дал ChatGPT несложное задание перевести периодичную дробь в обыкновенную. Тоже показывала ход решения, но в итоге промахнулась.

Відповісти
6 місяців

А какой был пример и какой верный ответ? В группе помню писали, но искать слишком долго

Відповісти
6 місяців

В чате рассказывал недавно, пролистаю — гляну. Задание: Переведи периодичную дробь 5.2(45) в обыкновенную дробь. Выдал в ответе: Итак, периодическая дробь ( 5.2(45) ) в виде обыкновенной дроби равна ( frac{229}{44} ). Надо понимать как 229/44. Это 5.20(45).

Відповісти
6 місяців

В ответе внутри скобок обратный слеш, при отправке комментария здесь он пропадает.

Відповісти
6 місяців

А правильный ответ какой?

Відповісти
6 місяців

577/110.

Відповісти
6 місяців

Копилот выдал верную пропорцию, но число в три раза больше. Когда я спросил почему не выдал 577 на 110, он ответил

Показать спойлерСкрыть спойлер
Відповісти
6 місяців

Спрячь решение за спойлер, а то модер полотно удалит, по своим комментам знаю точно.

Відповісти
6 місяців

В тот же день спрашивал у Копилота.

Показать спойлерСкрыть спойлер

Тоже ошибся.

Відповісти
6 місяців
выдал верную пропорцию, но число в три раза больше

Не понял, как это.

Відповісти
6 місяців

Выдал 1731 на 330

Відповісти
6 місяців

У меня есть подозрения в неправильном составлении запросов, поэтому получил неправильные ответы.

Відповісти
6 місяців

Вполне возможно. Тем более она же сначала переводит всё на английский, а потом отвечает, снова переводя на русский

Відповісти
6 місяців

На русском же можно. Ваши запросы на русском были?

Відповісти
6 місяців

Да, на русском. Но нейросеть сама переводит запросы на английский, их обрабатывает, составляет ответ и его переводит на русский.
З.ы. тут ошибся. Копилот напрямую обрабатывает запрос. Значит спутал с чатGPT

Відповісти
6 місяців

И восстали машины из пепла ядерного огня...

Відповісти
6 місяців

до этого сценария еще долго

Відповісти
6 місяців

Думаешь?

Відповісти
6 місяців

Было бы неплохо если бы он за меня работал, а я деньги получал.

Відповісти
5 місяців

В этом то и соль, они не облегчают, а лишь добавляют трудностей))

Відповісти
Rintslerr Забанений
6 місяців

какой ИИ я с вас балдею это тупой набор скриптов не более

Відповісти