Google выпустила режим Deep Think для Gemini 3

Новый режим исследует несколько вариантов решения одновременно и показал беспрецедентные 45,1% на тесте абстрактного рассуждения ARC-AGI-2, где большинство моделей не преодолевают планку в 30%.

Дарья АрцыбашеваАвтор новостей

Google запустила режим Deep Think для нейросети Gemini 3 — специальный формат работы, который дает модели больше времени на размышления и позволяет решать сложные математические, научные и логические задачи, с которыми не справляются обычные ИИ. Функция доступна подписчикам тарифа Google AI Ultra в приложении Gemini.

Ключевое отличие Deep Think от стандартного режима это параллельное рассуждение. Обычные языковые модели генерируют ответ последовательно: выбирают следующее слово на основе предыдущих, двигаясь от начала к концу без возможности «передумать». Если на каком-то этапе модель сделала неверное предположение, то весь дальнейший ответ строится на ошибочной базе.

Deep Think работает иначе: модель прорабатывает несколько гипотез одновременно, исследует разные пути решения и выбирает наиболее обоснованный вариант. Это похоже на то, как человек решает сложную задачу, пробует несколько подходов, отбрасывает тупиковые ветки, возвращается к развилкам и находит правильный маршрут. Такой метод критичен для задач, где один неверный шаг в логической цепочке уводит к полностью ошибочному выводу.

На тесте Humanity’s Last Exam (дословно «последний экзамен человечества»), который состоит из набора экстремально сложных задач, созданных чтобы «завалить» даже топовые ИИ — Gemini 3 Deep Think показала 41.0% без использования дополнительных инструментов. Это топовый результат среди существующих моделей.

Еще серьезнее достижение на ARC-AGI-2 тесте абстрактного рассуждения и обобщения. Здесь модель набрала беспрецедентные 45.1% с возможностью написать код. Большинство современных ИИ не преодолевают планку в 20−30% на этом тесте. ARC-AGI-2 проверяет не заученные факты, а способность к логике и переносу знаний на новые ситуации — именно то, что отличает настоящий интеллект от продвинутого автодополнения.

Gemini 3 Deep Think построен на фундаменте Gemini 2.5 Deep Think — вариантов модели, которые недавно достигли золотого стандарта на Международной математической олимпиаде и в финале Международного чемпионата по программированию. Эти соревнования считаются одними из самых сложных интеллектуальных испытаний: задачи требуют многоступенчатого рассуждения, креативных подходов и глубокого понимания математики или алгоритмов.

Deep Think не заменяет обычный режим, а дополняет его для специфических сценариев. Если нужен быстрый ответ на простой вопрос, стандартный Gemini справится мгновенно. Но если задача требует глубокого анализа, например, решить нетривиальное уравнение, разобрать сложную научную проблему, написать алгоритм для редкого случая — Deep Think даст более точный и обоснованный результат. Такое дополнение особенно полезно ученым, которые работают с математическими моделями. Студентам технических вузов, разбирающим олимпиадные задачи. Разработчикам, которые решают алгоритмические головоломки. В общем, тем, кому важна не скорость генерации текста, а качество рассуждений.

Также стало известно, что Amazon анонсировала три ИИ-агента: они могут писать код сутками. Подробности в статье.

  • Google
  • Нейросети
  • Искусственный интеллект

Поделиться

Добавить комментарий

Кнопка «Наверх»
Мы используем cookie-файлы для наилучшего представления нашего сайта. Продолжая использовать этот сайт, вы соглашаетесь с использованием cookie-файлов.
Принять
Отказаться
Политика конфиденциальности