Последний флагманский модель Grok 3 компании xAI Элона Маска

Компания AI xAI Элона Маска в понедельник поздно представила свою последнюю флагманскую модель искусственного интеллекта Grok 3, а также описала новые возможности для мобильных приложений Grok для iOS и веб-приложений.

Grok, ответ xAI на модели, такие как GPT-4o от OpenAI и Gemini от Google, может анализировать изображения и отвечать на вопросы, а также поддерживает ряд функций на социальной сети Маска, X. Grok 3, над которой работали несколько месяцев, была оптимистично запланирована к выпуску в 2024 году, но сроки были пропущены.

Амбициозный запуск на понедельник.

xAI использовала огромный дата-центр в Мемфисе, который содержит около 200 000 видеокарт для обучения Grok 3. В сообщении на X Маск утверждал, что Grok 3 был разработан с «десятикратным» увеличением вычислительной мощности по сравнению с предшественником Grok 2 с использованием расширенного набора данных для обучения, который действительно включает в себя материалы из судебных дел.

Члены команды xAI, включая Маска (крайний правый), во время прямой трансляции презентации Grok 3. Кредиты: xAI

«Grok 3 способен гораздо больше, чем Grok 2», - сказал Маск во время прямой трансляции в понедельник. «[Это] максимально ищущий истину ИИ, даже если эта истина иногда противоречит тому, что политически корректно».

Грок 3, строго говоря, является семейством моделей. Более маленькая версия Grok 3, Grok 3 mini, отвечает на вопросы быстрее, но с некоторой потерей точности. Не все модели и связанные с ними функции Grok 3 уже доступны (некоторые находятся в бета-версии), но они начали поступать в продажу в понедельник.

xAI утверждает, что Grok 3 обходит GPT-4o по таким показателям, как AIME (оценка эффективности модели на выборке математических вопросов) и GPQA (оценка моделей с использованием проблем физики, биологии и химии на уровне аспирантов). По словам xAI, ранняя версия Grok 3 также успешно выступила в Chatbot Arena, краудсорсинговом тесте, который ставит различные модели ИИ друг против друга и предоставляет пользователям возможность голосовать за предпочтительные ответы.

Кредиты: xAI

Две модели в новой семье Grok 3, Grok 3 Reasoning и Grok 3 mini Reasoning, могут тщательно «проанализировать» проблемы, аналогично моделям «причинения» таким, как o3-mini OpenAI и R1 китайской компании DeepSeek. Модели рассуждения пытаются проверить себя перед выдачей результатов, что помогает избежать некоторых проблем, которые обычно тревожат модели.

xAI утверждает, что Grok 3 Reasoning превосходит лучшую версию o3-mini - o3-mini-high - по нескольким популярным показателям, включая новый математический бенчмарк AIME 2025.

Кредиты: xAI

Эти модели рассуждения могут быть доступны через приложение Grok. Пользователи могут попросить Grok 3 «Подумать» или - для более сложных запросов - использовать режим «Большой мозг» для рассуждения, который привлекает дополнительные вычисления. xAI описывает модели рассуждения как наиболее подходящие для вопросов по математике, наукам и программированию.

Маск сказал, что некоторые «мысли» моделей рассуждения затуманены в приложении Grok, чтобы предотвратить дистилляцию, метод, используемый разработчиками моделей ИИ для извлечения знаний из других моделей. Недавно DeepSeek была обвинена в дистилляции моделей OpenAI для создания своих собственных.

Модели рассуждения Grok легли в основу новой функции в приложении Grok под названием DeepSearch, ответ xAI на инструменты исследования, работающие на основе ИИ, такие как глубокие исследования OpenAI. DeepSearch сканирует интернет и X для анализа информации и предоставления краткого ответа на вопрос.

Подписчики премиум-класса X ($50 в месяц) получат доступ к Grok 3 первыми, и другие функции будут заблокированы за новым планом, который xAI называет SuperGrok. Цена составляет $30 в месяц или $300 в год (если верить утечкам), SuperGrok разблокирует дополнительные запросы рассуждения и DeepSearch, и включает неограниченную генерацию изображений.

Кредиты: xAI

В будущем - уже через неделю - приложение Grok получит «голосовой режим», сказал Маск, который даст моделям Grok синтезированный голос. Через несколько недель после этого модели Grok 3 будут доступны через корпоративный API xAI, а также возможность DeepSearch.

xAI планирует сделать Grok 2 открытым исходным кодом в ближайшие месяцы, сказал Маск.

«Наш общий подход заключается в том, что мы сделаем последнюю версию [Grok] открытым, когда следующая версия будет полностью выпущена», - продолжал он. «Когда Grok 3 будет зрелым и стабильным, что, вероятно, произойдет в течение нескольких месяцев, то мы сделаем Grok 2 открытым исходным кодом».

Когда Маск объявил о Grok примерно два года назад, он представил модель AI как дерзкую, нефильтрованную и анти-"вак". В общем, способную отвечать на спорные вопросы, на которые другие системы ИИ не ответят. Он оправдал некоторую часть этой обещанной программы. Попросите, например, Grok и Grok 2 быть вульгарными, и они с удовольствием согласятся, выделяя яркий язык, который вы, вероятно, не услышите от ChatGPT.

Но модели Grok до Grok 3 отходили от политических тем и не пересекали некоторые границы. Фактически, одно исследование обнаружило, что Grok был склонен к политической левой стороне в вопросах, таких как права трансгендеров, программы разнообразия и неравенство.

Маск обвинил в таком поведении данные обучения Grok - публичные веб-страницы - и обещал «приблизить Grok к политически нейтральной позиции». Пока не ясно, добился ли xAI этой цели и каковы могут быть последствия.