Еще один тест deep research: Grok 3

Про No-Code, AI и другие технологии, которые делают нашу жизнь проще. Канал исследователя и ноукодера. Контакт для связи: @natellanur

Grok 3x.aideep research

Вводные: Grok 3 - модель компании x.ai Маска. Запущена на прошлой неделе. Умеет deep research и reasoning.

Впечатления от Deep (re)Search:

  1. 1. В целом. Ресерчит хорошо, на уровне с chatgpt.

  2. 2. Про выводы. Больше всего меня впечатлило то, что модель, в отличие от любой другой, когда либо протестированной мной, на вопрос “найди доказательство чего-то”, может вежливо ответить, что доказательств не существует. То есть она не пытается наговорить из того, что нашла, а делает вывод и уведомляет отрицательным ответом. Далее уже описывает, что всё-таки смогла найти.

  3. 3. Про структуру и визуал. И путь ресерча (где описывается последовательность суждений и поисковых запросов), и сам отчет выглядят очень красиво и понятно. Меньше лишних слов, ясная подача, четкая структура.

  4. 4. Что не так? Помимо того, что конечно любую выдачу нужно перепроверять, бывают косяки итд (проблемы, свойственные языковым моделям), единственное, что систематически получается не очень, на мой взгляд, это секция “surprising finding”. Просто потому, что она есть в каждом отчете, но очень часто finding вообще не surprising 👀

Итого имеем: deep search с Grok 3 порой так крут, что круче chatgpt. При этом стоить он будет на 150 долларов дешевле (50 USD).

На лидерборде Grok 3 сейчас на первом месте. За ним гугл, за ним OpenAI (см. картинку ниже).

Чего ждем? Что в ближайшем будущем покажет Anthropic.

Вывод: если еще не тестили, то тестите, пока доступно. Нужен VPN, не нужна иностранная симка.

Модель доступна через платформу X (бывший твиттер) и на сайте. Модель будет доступна бесплатно ограниченное время

Скриншот лидерборда с таблицей сравнения моделей: Grok 3 на первом месте, за ним Google и OpenAI, видны позиции и оценки моделей.
Лидерборд Hugging Face: Grok 3 лидирует над Google и OpenAI.