OpenAI запустила ИИ-агента в ChatGPT: как он работает
Компания выпустила первого по-настоящему автономного помощника, который набрал 41.6% на экзамене Humanity’s Last Exam — результат вдвое лучше предыдущих моделей OpenAI.
Дарья АрцыбашеваАвтор новостей
OpenAI представила универсального цифрового помощника, способного выполнять сложные многоэтапные задачи без участия человека. Новинка может самостоятельно бронировать столики в ресторанах, составлять презентации и даже планировать путешествия.
ChatGPT agent объединяет функционал двух предыдущих разработок — браузерного помощника Operator и исследовательского инструмента Deep Research. Система получила доступ к визуальному и текстовому браузерам, терминалу для выполнения кода и прямому подключению к API различных сервисов.
В отличие от стандартного чат-бота, новый помощник работает на собственном виртуальном компьютере. Он может переключаться между разными инструментами в зависимости от поставленной задачи — от простого поиска информации до создания редактируемых документов.
Возможности агента
Разработчики обучили модель использовать множество инструментов с помощью обучения с подкреплением. Агент умеет:
- Автоматизировать еженедельные задачи;
- Работать с веб-сайтами и заполнять формы;
- Создавать диаграммы, презентации, а также генерировать изображения;
- Планировать встречи и путешествия через интеграцию с Google Calendar и OpenTable;
- Анализировать данные в таблицах Excel;
- Покупать товары с их анализом;
- Писать и выполнять программный код;
- Подключаться к Gmail и GitHub через коннекторы ChatGPT.
При необходимости система запрашивает у пользователя дополнительные данные или разрешения для входа в аккаунты. Безопасность обеспечивается через специальный режим просмотра браузера и ограничения на работу с финансовыми сервисами.
Безопасность
Меры защиты данных:
- Система Watch Mode — агент останавливается, если пользователь покидает вкладку при работе с финансовыми сайтами;
- Запрос подтверждения перед выполнением критических действий (отправка писем, бронирование);
- Отсутствие сохранения памяти между сессиями агента;
- Блокировка доступа к финансовым транзакциям и высокорисковым операциям.
OpenAI классифицировала агента как систему высокого уровня риска в биологических и химических областях, применив самые строгие меры безопасности, включая специальное обучение отказа от выполнения опасных задач.
Результаты тестирования
На академическом экзамене Humanity’s Last Exam агент показал результат 41.6% — это вдвое превышает показатели моделей o3 и o4-mini. На математическом бенчмарке FrontierMath система достигла 27.4% при использовании терминала, что в четыре раза лучше предыдущих достижений.
Средняя задача выполняется за 10−15 минут, хотя сложные исследовательские проекты могут занимать до 25 минут. Для персональных задач вроде планирования свидания достаточно 5 минут.
Доступность
Функция доступна подписчикам планов Pro, Plus и Team с 17 июля 2025 года. Для активации нужно выбрать режим Agent mode в выпадающем меню инструментов ChatGPT.
Команда разработчиков из 20−35 специалистов продолжает совершенствовать продукт. В планах — интеграция с памятью ChatGPT для более персонализированного опыта, хотя эта функция не войдет в первоначальный релиз из соображений безопасности.
Запуск агента происходит на фоне активной разработки ИИ-агентов компаниями Google, Perplexity и другими технологическими гигантами, однако текущие решения пока не достигли заявленного уровня автономности.
Кстати, о конкурентах OpenAI — Perplexity запустила умный браузер Comet с функциями ИИ-агента. Подробности в статье.
- Искусственный интеллект
- chatgpt
Поделиться