Новини Безкоштовний DeepSeek R1 різко додав у логіці і майже наздогнав платний ChatGPT

Безкоштовний DeepSeek R1 різко додав у логіці і майже наздогнав платний ChatGPT

DoubleA
Читати у повній версії

Команда DeepSeek тихо випустила вагоме оновлення для свого безкоштовного ІІ-асистента R1. Хоча розробники скромно називають його «мінорним», тести показують серйозний ривок у здатності вирішувати складні завдання.

Головне поліпшення — посилення логіки та наукового мислення. Оновлена модель R1-0528 тепер справляється з олімпійською математикою майже в 9 випадках із 10. Для порівняння: у січні цей показник був помітно нижчим. Особливо вражає прогрес у надскладному тесті Humanity's Last Exam, де результат R1 виріс більш ніж удвічі — до 17,7%. Хоча тест все ще ставить у тупик більшість нейромереж.

В шести незалежних тестах (наука, програмування, складна математика) оновлений R1 показав результати, дуже близькі до платного ChatGPT-o3 від OpenAI. Відрив мінімальний скрізь, окрім одного тесту з кодування. Розробники стверджують, що модель стала рідше видавати недостовірну інформацію. Поки доступ до аналогічних можливостей ChatGPT-o3 коштує від $20 (близько 1 500 рублів) на місяць, DeepSeek R1 все ще відкритий для всіх без оплати.

Поліпшення досягнуті не за рахунок збільшення розміру моделі, а завдяки перерозподілу ресурсів на «донавчання» — прокачку саме навичок міркування та аналізу. Оновлення миттєво оцінили користувачі: мобільний додаток DeepSeek знову злетіло на перші місця в магазинах додатків США, Великобританії, Японії, Південної Кореї та Китаю.

Безкоштовний китайський асистент зробив серйозний крок уперед, скоротивши відрив від лідера ринку. Поки OpenAI зберігає перевагу в мультимодальності (робота з картинками, голосом), DeepSeek R1 стає все привабливішим для тих, кому потрібні саме глибокий аналіз і вирішення складних завдань без підписки.

🫡 Оцениваем обновлённую сцену с легендарным мемом из Metal Gear Solid 3
    Коментарі4
    Залишити коментар
    3 місяці
    Скайнет близко? кто то в курсе)?
    Відповісти
    3 місяці
    Насчёт скайнета не в курсе, но вот дел наворотить используя ИИ уже можно
    Відповісти
    2 місяці
    Все равно порою ересь портит в отличии от того же гпт
    Відповісти
    2 місяці
    Уровень растёт у Китайцев
    Відповісти