AMD представляє свою першу мовну модель ІІ

Компанія AMD анонсувала запуск своєї першої мовної моделі ІІ — AMD-135M, в рамках розширення присутності на ринку штучного інтелекту. Новий продукт орієнтований на використання в приватному бізнесі і належить до сімейства Llama.

Модель AMD-135M створена з використанням унікальної технології спекулятивного декодування, яка дозволяє швидше генерувати текстові дані завдяки паралельній роботі двох моделей. Цей підхід збільшує продуктивність, але вимагає більшого обсягу даних для обробки, що відображається на енергоспоживанні.

Модель представлена у двох версіях: AMD-Llama-135M і AMD-Llama-135M-code. Базова модель навчалася на 670 млрд токенів і пройшла шестиденне навчання з використанням обладнання AMD Instinct MI250. Друга версія, AMD-Llama-135M-code, орієнтована на завдання програмування і була донавчена на додаткових 20 млрд токенів.

AMD продовжує вдосконалювати свої рішення, прагнучи підвищити ефективність і продуктивність своїх мовних моделей у майбутньому.

🎮 Российская игровая консоль будет базироваться на процессоре «Эльбрус»
Допис був перекладений Показати оригінал (RU)
-2
Коментарі 1