Новини Google представила мультимодальний ІІ Gemini 2.0 з підтримкою відео та звуку

Google представила мультимодальний ІІ Gemini 2.0 з підтримкою відео та звуку

DoubleA
Читати у повній версії

11 грудня Google анонсувала запуск нової моделі штучного інтелекту Gemini 2.0, яка обіцяє стати важливим кроком в еволюції технологій ШІ. Gemini 2.0 представляє собою мультимодальну систему, яка може обробляти зображення, відео та аудіо, а також генерувати їх. Нова модель значно перевершує попередницю 1.5 за швидкістю реагування та продуктивністю, у два рази швидше відповідаючи на запити.

Однією з ключових особливостей Gemini 2.0 є підтримка мультимодальності — можливість одночасно працювати з текстом, зображеннями та звуком. Модель може не лише розпізнавати, але й створювати зображення, комбінуючи їх з текстовими запитами. Це відкриває нові перспективи для розробки ботів, які зможуть виконувати більш складні завдання на основі голосу та зображень.

Крім того, Gemini 2.0 підтримує багатомовні функції перетворення тексту в мову та може інтегрувати власні інструменти, такі як пошукова система Google, а також можливості для роботи з кастомними функціями. Gemini 2.0 буде інтегрований у різні продукти Google, включаючи пошукову систему, Workspace та інші сервіси. Gemini 2.0 також оснащений новими можливостями в дослідницьких завданнях з функцією Deep Research, яка використовує потужність ШІ для аналізу та підготовки складних тем. Очікується, що доступ до нової моделі стане доступним для всіх користувачів у січні 2025 року.

😂 В Call of Duty: Black Ops 6 появился скин, который мешает своему владельцу
Коментарі 3
Залишити коментар
3 тижні

Все таки видать Джона Коннора убьют и не кому его будет спасти.

Відповісти
Rintslerr Забанений
3 тижні

чудо что этот скрипт вообще понимает его акцент из индии

Відповісти
6 днів

Ждём ответочки от яндекса...

Відповісти