OpenAI випустила gpt-oss — перші за 6 років відкриті ШІ-моделі

OpenAI випустила gpt-oss — перші за 6 років відкриті ШІ-моделі

Arkadiy Andrienko

Компанія OpenAI представила дві нові моделі штучного інтелекту з відкритим кодом — gpt-oss-120b та gpt-oss-20b. Це перші відкриті мовні моделі від OpenAI за останні шість років: раніше відкритою була лише GPT-2, випущена у 2019 році.

Моделі розроблені з акцентом на логічне мислення, ефективність у роботі з інструментами та низькі витрати на розгортання. Їх можна вільно використовувати, модифікувати та інтегрувати в комерційні проекти завдяки ліцензії Apache 2.0.

Характеристики моделей:

  • gpt-oss-120b: 120 млрд параметрів (5,1 млрд активних на токен), працює на GPU з 80 ГБ відеопам'яті. За тестами наближається до продуктивності o4-mini.
  • gpt-oss-20b: 20 млрд параметрів (3,6 млрд активних), підходить для пристроїв з 16 ГБ пам'яті. Порівнянна з o3-mini за якістю міркувань і точністю.

Обидві моделі підтримують роботу з інструментами (наприклад, веб-пошук і виконання коду на Python), видають структуровані відповіді та використовують ланцюг міркувань (Chain of Thought, CoT), який можна аналізувати під час налагодження. Обидві моделі мають можливість запуску на власних серверах, без необхідності використовувати API.

Завантажити моделі можна на Hugging Face, а інструкції щодо локального запуску доступні на GitHub. Відкриті моделі gpt-oss можуть стати важливим кроком у розвитку більш прозорої та доступної екосистеми ШІ. Вони дозволяють розробляти та навчати власні рішення в будь-яких умовах — від локального запуску до розгортання в корпоративному середовищі, знижуючи залежність від великих хмарних платформ та пропрієтарних рішень.

👊 Xiaomi ультует: в новом флагмане компании будет экран в блоке камер
    Про автора
    Коментарі2