OpenAI запустила ИИ-агента в ChatGPT: как он работает

Компания выпустила первого по-настоящему автономного помощника, который набрал 41.6% на экзамене Humanity’s Last Exam — результат вдвое лучше предыдущих моделей OpenAI.

OpenAI запустила ИИ-агента в ChatGPT: как он работает

Дарья АрцыбашеваАвтор новостей

OpenAI представила универсального цифрового помощника, способного выполнять сложные многоэтапные задачи без участия человека. Новинка может самостоятельно бронировать столики в ресторанах, составлять презентации и даже планировать путешествия.

ChatGPT agent объединяет функционал двух предыдущих разработок — браузерного помощника Operator и исследовательского инструмента Deep Research. Система получила доступ к визуальному и текстовому браузерам, терминалу для выполнения кода и прямому подключению к API различных сервисов.

В отличие от стандартного чат-бота, новый помощник работает на собственном виртуальном компьютере. Он может переключаться между разными инструментами в зависимости от поставленной задачи — от простого поиска информации до создания редактируемых документов.

Возможности агента

Разработчики обучили модель использовать множество инструментов с помощью обучения с подкреплением. Агент умеет:

  • Автоматизировать еженедельные задачи;
  • Работать с веб-сайтами и заполнять формы;
  • Создавать диаграммы, презентации, а также генерировать изображения;
  • Планировать встречи и путешествия через интеграцию с Google Calendar и OpenTable;
  • Анализировать данные в таблицах Excel;
  • Покупать товары с их анализом;
  • Писать и выполнять программный код;
  • Подключаться к Gmail и GitHub через коннекторы ChatGPT.

При необходимости система запрашивает у пользователя дополнительные данные или разрешения для входа в аккаунты. Безопасность обеспечивается через специальный режим просмотра браузера и ограничения на работу с финансовыми сервисами.

Безопасность

Меры защиты данных:

  • Система Watch Mode — агент останавливается, если пользователь покидает вкладку при работе с финансовыми сайтами;
  • Запрос подтверждения перед выполнением критических действий (отправка писем, бронирование);
  • Отсутствие сохранения памяти между сессиями агента;
  • Блокировка доступа к финансовым транзакциям и высокорисковым операциям.

OpenAI классифицировала агента как систему высокого уровня риска в биологических и химических областях, применив самые строгие меры безопасности, включая специальное обучение отказа от выполнения опасных задач.

Результаты тестирования

На академическом экзамене Humanity’s Last Exam агент показал результат 41.6% — это вдвое превышает показатели моделей o3 и o4-mini. На математическом бенчмарке FrontierMath система достигла 27.4% при использовании терминала, что в четыре раза лучше предыдущих достижений.

Средняя задача выполняется за 10−15 минут, хотя сложные исследовательские проекты могут занимать до 25 минут. Для персональных задач вроде планирования свидания достаточно 5 минут.

Доступность

Функция доступна подписчикам планов Pro, Plus и Team с 17 июля 2025 года. Для активации нужно выбрать режим Agent mode в выпадающем меню инструментов ChatGPT.

Команда разработчиков из 20−35 специалистов продолжает совершенствовать продукт. В планах — интеграция с памятью ChatGPT для более персонализированного опыта, хотя эта функция не войдет в первоначальный релиз из соображений безопасности.

Запуск агента происходит на фоне активной разработки ИИ-агентов компаниями Google, Perplexity и другими технологическими гигантами, однако текущие решения пока не достигли заявленного уровня автономности.

Кстати, о конкурентах OpenAI — Perplexity запустила умный браузер Comet с функциями ИИ-агента. Подробности в статье.

  • Искусственный интеллект
  • chatgpt

Поделиться

Кнопка «Наверх»
Мы используем cookie-файлы для наилучшего представления нашего сайта. Продолжая использовать этот сайт, вы соглашаетесь с использованием cookie-файлов.
Принять
Отказаться
Политика конфиденциальности