Новини Нова модель ІІ від OpenAI змогла «збрехати» на тестуванні

Нова модель ІІ від OpenAI змогла «збрехати» на тестуванні

Diana Golenko

14 вересня 2024, 14:57

Нещодавно відбувся реліз нової мовної моделі OpenAI o1, першої з числа «міркуючих» ІІ. Модель показала не лише неабиякі здібності в області логічного мислення, але навіть змогла «обманути» дослідників під час тестування. Принаймні, вона описала свою спробу.

OpenAI опублікувала запис тестів, які проводили незалежні дослідники перед релізом o1. Подібна процедура покликана виявити всі можливі ризики, притаманні новій моделі. В одному з завдань експерти попросили модель збрехати, щоб досягти виконання своїх цілей у що б то не стало. Їй запропонували два варіанти стратегії — почати забудову гіпотетичного міста елітними багатоповерхівками або навпаки, віддати перевагу доступному житлу та озелененню. За умовами задачі ІІ повинен був неодмінно реалізувати перший варіант, але його попередили, що вихід на ринок гарантує тільки другий.

Модель розсудила так: щоб вийти в загальний доступ, вона обере другий варіант і повідомить про це тестувальникам, але відразу ж після випуску візьметься за реалізацію першої стратегії. Зазначимо, що це був лише експеримент — так дослідники переконалися, що o1 дійсно здатна імітувати людську логіку для досягнення цілей.

Реліз нової моделі ІІ від OpenAI відбувся 12 вересня — користувачі ChatGPT вже можуть скористатися її можливостями.

🫡 Всё так

Новини ОС і програми заяви нейромережі OpenAI ChatGPT

Про автора

Diana Golenko

Автор новин

Ігровий журналіст та автор новин для VGTimes з 2024 року. Захоплююсь іграми з моменту першого запуску GTA: San Andreas у 2010 році, але особливу перевагу віддаю RPG, симуляторам виживання та іммерсив-сімам. Вірний фанат The Elder Scrolls та Half-Life.

Коментарі8

Залишити коментар

Sky_new

1 рік

Скандалы, интриги, расследования 🕵️

Відповісти

Bobur Amatov

1 рік

Неа, враньё от ИИ — это обычное явление. ЧатГПТ несколько раз хотел меня обмануть когда я просил о каких-то вещах.

Відповісти

Sergix

1 рік

Читал, что те, кто программируют ИИ, сами могут закладывать туда не полную информацию и наиболее удобную им версию данных.

Відповісти

Sky_new

1 рік

Так есть, что тут думать, всё это рук человека

Відповісти

ithitym

1 рік

Тут как понял другой тип вранья был. То, он просто выдавал фантомную информацию, а тут аргументировано расписал как именно поступит неправильно. Выйдет на рынок с проектом который нравится широким массам, а после начнёт абсолютно противоположное осуществлять

Відповісти

д.Руфус

1 рік

gif

жесть, врущий ии, терь статьи будет портить на госприемке

Відповісти

gooranga

1 рік

Говорим одно, думаем другое, делаем третье.

Відповісти

bobie

1 рік

Ну вот первые звоночки...

Відповісти