Статті Залізо та технології Наскільки розумний «лякаюче розумний» чат-бот Ілона Маска?

Наскільки розумний «лякаюче розумний» чат-бот Ілона Маска?

Fazil Dzhyndzholiia
Читати у повній версії

xAI представила нову мовну модель Grok 3, яку засновник компанії Ілон Маск (Elon Musk) назвав «найрозумнішим ШІ на Землі». Творці чат-бота заявили, що нова версія значно перевершує попередню: вона працює з більшим обсягом навчальних даних, і їй доступні нові механізми типу самоусунення помилок. Демоверсія Grok 3 вийшла вранці, і відразу з'явилися перші відгуки.

Що нового

Ключова перевага Grok 3 — доступ до збільшених обчислювальних ресурсів. Чат-бот навчається за допомогою суперкомп'ютера Colossus: на перших етапах процесу його творці залучили 100 000 графічних карт NVIDIA H100, а потім кількість графічних адаптерів подвоїли. У майбутньому обчислювальну потужність планують збільшити ще в п'ять разів.

У Grok 3 додані вбудовані механізми самоусунення помилок. ШІ аналізує власні відповіді, порівнює їх з еталонами, а потім вносить корективи. Що цікаво: чат-бот отримує «нагороди» за точні відповіді і «штрафи» за так звані «галюцинації» — некоректну або вигадану інформацію.

Якщо вірити заявам представників xAI, то Grok 3 розумніший за інші моделі в математичних задачах, природничих науках і програмуванні. Щоб оцінити якість відповідей, використовувалися «сліпі» тести, коли користувачі не знали, який саме чат-бот відповідає.

Статьи про нейросети

  1. Как нейросеть Sora создаёт видео — конкретные примеры
  2. Редакция VGTimes экспериментирует с возможностями ChatGPT-4o
  3. Нейросеть Heygen переводит русские видеомемы на разные языки. Актеры дубляжа больше не нужны?
  4. Что такое нейросети и кому они нужны? Как установить и настроить Stable Diffusion, как обучить её новым стилям и понятиям. Интервью с основателями сервиса NeuroFox
  5. Редакция VGTimes рисует арты при помощи нейросети — смотрите, что у нас получилось
  6. Runway Gen-3, новая нейросеть для создания видео. Показываем примеры работы и рассказываем, как ей пользоваться
  7. Нейросети на любой случай жизни: для создания видео, редактуры фото, написания текста и записи звука
  8. Аниме-версии Сони Блейд, Йеннифэр, Ады Вонг и других — создали галерею образов при помощи нейросети Loopsie
  9. Как нейросети захватят мир и нужно ли из-за этого переживать
  10. Что умеют и могут нейросети? Рассказываем, как ИИ рисует картины, пишет дипломные работы, сдает экзамены и читает по губам

На презентації Grok 3 також продемонстрували Deep Search — пошуковий агент «наступного покоління», здатний швидко знаходити інформацію в Інтернеті та аналізувати її. Схожа функція давно є й у конкурентів, але xAI запевняє, що Deep Search точніший.

Крім того, у Grok 3 також скоро додадуть голосовий інтерфейс, щоб з чат-ботом можна було спілкуватися як з живим співрозмовником. Його голос нібито здасться користувачам природнішим і емоційнішим, ніж у аналогів.

Используете ли вы искусственный интеллект для работы или учёбы?

Пройти опитування

Як справи на практиці

Користувачам соцмережі X (визнана екстремістською і заборонена в РФ) новий чат-бот доступний за умови оформлення підписки X Premium+ за $50 на місяць. Ранніх відгуків про Grok 3 поки не особливо багато, але є кілька цікавих.

Так, користувач під ніком Penny2x розповів, що зробив за допомогою нової версії ШІ цілу повноцінну гру:

Андрій Карпатий також оцінив цілеспрямованість Grok 3:

Мені подобається, що модель намагається вирішити гіпотезу Рімана за запитом, як і DeepSeek-R1, тоді як багато інших моделей (o1-pro, Claude, Gemini 2.0 Flash Thinking) просто здаються одразу і заявляють, що це велика нерозв'язана проблема. В кінці мені довелося її зупинити, тому що я почав відчувати до неї жаль, але вона проявила сміливість — хто знає, може, колись...

Не обійшлося, правда, і без недоліків. Питання викликав пошуковий агент Deep Search:

…модель, схоже, не любить посилатися на X як на джерело за замовчуванням (хоча при явному вказуванні вона це робить). Пару раз я помітив, що вона «галюцинує» і вигадує неіснуючі URL. Іноді вона видає нібито факти, які, на мій погляд, невірні, і не вказує на них джерел (очевидно, їх просто немає).

Підсумовуючи, Андрій Карпатий зазначив, що за першими враженнями Grok 3 наблизився до рівня передових моделей від OpenAI типу o1-pro за 200 доларів на місяць і навіть трохи перевершує DeepSeek-R1 і Gemini 2.0 Flash Thinking. Це з урахуванням того, що команда почала розробку ШІ з нуля приблизно рік тому. Темпи вражають. Однак необхідно провести більш комплексні тести, перш ніж стверджувати, чи виправдовує чат-бот титул «найрозумнішого».

Остороги через упередженість

Не секрет, що Ілон Маск активно бере участь у політичному житті США і відкрито висловлює свої погляди. Деякі користувачі Інтернету побоюються, що Grok 3 також буде просувати певні наративи.

Ці переживання виникли не на порожньому місці: Маск поділився скріншотом, на якому чат-бот критикує одне новинне медіа, але при цьому хвалить X як найнадійніше джерело інформації. Це при тому, що Grok 3 позиціонується як продукт з мінімальною цензурою. Небагато людей дотримуються думки, що необхідно уникати подібної упередженості: ІІ має бути нейтральним у судженнях.

***

Як би там не було, вихід ще однієї багатообіцяючої мовної моделі — чергове важливе подія в безперервній гонці. Чим вища конкуренція, тим швидше рухається прогрес.

А що про Grok 3 думаєте ви? Розкажіть у коментарях.

Как вы относитесь к стремительному развитию ИИ?

Пройти опитування
    Про автора
    Коментарі4
    Залишити коментар
    7 місяців
    Как то очень скептичен к таким моделям. Особенно в плане предвзятости. Ну, в любом случае запасаюсь попкорном и фольгой
    Відповісти
    7 місяців
    И даже игру не показали, которую сделали с помощью Grok 3
    Відповісти
    7 місяців
    Ну подожди... скоро завалят и стим, и остальные площадки. Хотя Габен и не против ии игор, но вроде как заикался о том, что проверяют особо тщательно из-за АП.
    Відповісти
    7 місяців
    Заранее уже не нравится вся эта идея с ИИ.
    Відповісти