Компанія OpenAI представила дві нові моделі штучного інтелекту з відкритим кодом — gpt-oss-120b та gpt-oss-20b. Це перші відкриті мовні моделі від OpenAI за останні шість років: раніше відкритою була лише GPT-2, випущена у 2019 році.
Моделі розроблені з акцентом на логічне мислення, ефективність у роботі з інструментами та низькі витрати на розгортання. Їх можна вільно використовувати, модифікувати та інтегрувати в комерційні проекти завдяки ліцензії Apache 2.0.
Характеристики моделей:
Обидві моделі підтримують роботу з інструментами (наприклад, веб-пошук і виконання коду на Python), видають структуровані відповіді та використовують ланцюг міркувань (Chain of Thought, CoT), який можна аналізувати під час налагодження. Обидві моделі мають можливість запуску на власних серверах, без необхідності використовувати API.
Завантажити моделі можна на Hugging Face, а інструкції щодо локального запуску доступні на GitHub. Відкриті моделі gpt-oss можуть стати важливим кроком у розвитку більш прозорої та доступної екосистеми ШІ. Вони дозволяють розробляти та навчати власні рішення в будь-яких умовах — від локального запуску до розгортання в корпоративному середовищі, знижуючи залежність від великих хмарних платформ та пропрієтарних рішень.
- Arigato!