Новини Залізо та технології Чому нейромережі брешуть: OpenAI пояснила природу галюцинацій ШІ

Чому нейромережі брешуть: OpenAI пояснила природу галюцинацій ШІ

Arkadiy Andrienko

8 вересня 2025, 13:39

Команда дослідників з OpenAI детально розібралася, чому мовні моделі, подібні до ChatGPT, іноді видають вигадані або хибні факти. Виявилося, проблема в значній мірі полягає в самій системі їх навчання та оцінки, яка заохочує моделі вгадувати, а не визнавати відсутність відповіді.

Спеціалісти проводять аналогію зі студентом на іспиті. Якщо за порожню відповідь ставлять нуль, а за вгаданий варіант — хоча б якийсь бал, то завжди вигідніше обирати друге, так само і з штучним інтелектом, адже всі тести для оцінки моделей, такі як MMLU, працюють за бінарним принципом «правильно/неправильно». Модель, яка стверджує «не знаю», автоматично отримує нуль, тоді як та, що ризикує і вгадує, іноді виявляється права, таким чином алгоритми вчаться блефувати.

Ця проблема зароджується ще на етапі попереднього навчання моделі на великих масивах тексту. Деякі факти, особливо рідкісні, статистично майже неможливо передбачити абсолютно точно, однак остаточний паттерн до «вгадування» закріплюється пізніше, коли розробники натаскують модель на проходження тестів, що заохочують високі бали за точність.

У своєму дослідженні OpenAI пропонує змінити сам підхід до оцінки роботи нейромереж, адже на думку авторів, потрібно серйозно штрафувати модель за впевнену брехню, але при цьому давати часткові бали за коректне вираження невпевненості або відповідь «не знаю». Це змістить фокус з створення «найрозумніших» моделей на розробку більш надійних і правдивих асистентів.

Експерти підкреслюють, що галюцинації — це не містичний збій, а системна проблема, корені якої добре вивчені, але навіть сучасні просунуті моделі не застраховані від цього, і перегляд систем оцінки може стати ключем до створення ІІ, який буде краще усвідомлювати межі своїх знань.

❄️ В Steam дают бесплатно сыграть в The Long Dark с коопом (ну почти) — Long Drive North

Новини Залізо та технології OpenAI нейромережі

Про автора

Arkadiy Andrienko

Автор статей і новин

Як технічний журналіст VGTimes, я з однаковим задоволенням обговорюю новітні графічні процесори та заглиблююсь у тонкощі класичних RPG. Починаючи з 2018 року пишу про ігри та обладнання, мій досвід роботи в галузі звукорежисури дозволив мені добре розбиратися в нюансах аудіотехнологій, і я завжди знаходжусь у пошуку чогось нового в галузі ігрового обладнання. Коли я не пишу про технології, то, швидше за все, я досліджую постапокаліптичні пустки в Fallout, керую колонією в RimWorld або командую арміями в Hearts of Iron IV. Для мене ігри — це більше, ніж просто хобі — це пристрасть, яка підживлює мій творчий потенціал і підтримує зв'язок з постійно розвиваючим світом технологій.

Коментарі3

Залишити коментар

Bulochka_C_Makom

1 місяць

Т.е. Скайнет откладывается ещё на какое-то время?

Відповісти

Sergix

1 місяць

ИИ проанализировал контент по Скайнету и избрал другую, более изощренную и незаметную для встревоженных зрителей, тактику.

Відповісти

Sergix

1 місяць

ИИ расскажет, что было и чего не было.

Відповісти