Новини NVIDIA анонсувала нейромережу NVLM 1.0, яка здатна аналізувати та інтерпретувати зображення

NVIDIA анонсувала нейромережу NVLM 1.0, яка здатна аналізувати та інтерпретувати зображення

Arkadiy Andrienko

19 вересня 2024, 12:41

NVIDIA представила свою новітню мультимодальну мовну модель NVLM 1.0, яка не тільки чудово справляється з візуальними завданнями, але й може інтерпретувати картинки та рукописний текст. У тестах NVLM 1.0 перевершила GPT-4o у розпізнаванні тексту на зображеннях, продемонструвавши видатні результати в математиці, лише трохи поступившись Claude 3.5. Модель також може пояснювати сенс мемів та інших комічних ситуацій, зображених на картинках або описаних текстом.

Компанія випустила три версії моделі: NVLM-D, NVLM-X та NVLM-H. NVLM-D використовує попередньо навчений енкодер для зображень і споживає менше ресурсів графічного адаптера, NVLM-X оптимізована для роботи із зображеннями у високій роздільній здатності, а NVLM-H поєднує риси обох попередніх моделей.

Для більш детальної інформації та доступу до коду моделі можна перейти на сайт NVIDIA та GitHub.

⚡️ Перезапуск Painkiller уже можно заценить — в Steam дропнули демку

PC Новини Залізо і технології нейромережі

Про автора

Arkadiy Andrienko

Автор статей і новин

Як технічний журналіст VGTimes, я з однаковим задоволенням обговорюю новітні графічні процесори та заглиблююсь у тонкощі класичних RPG. Починаючи з 2018 року пишу про ігри та обладнання, мій досвід роботи в галузі звукорежисури дозволив мені добре розбиратися в нюансах аудіотехнологій, і я завжди знаходжусь у пошуку чогось нового в галузі ігрового обладнання. Коли я не пишу про технології, то, швидше за все, я досліджую постапокаліптичні пустки в Fallout, керую колонією в RimWorld або командую арміями в Hearts of Iron IV. Для мене ігри — це більше, ніж просто хобі — це пристрасть, яка підживлює мій творчий потенціал і підтримує зв'язок з постійно розвиваючим світом технологій.

Коментарі2

Залишити коментар

MrProRock(33RU)

1 рік

Потыкаться было бы любопытно, но только какой толк от кода🤷‍♂️для обычного юзверя.

Відповісти

БиллиБоб

1 рік

Уж лучше пользоваться нейронкой, которая твои ресурсы жрать не будет.

Відповісти