OpenAI запустила ИИ-агента в ChatGPT: как он работает

18.07.2025

Компания выпустила первого по-настоящему автономного помощника, который набрал 41.6% на экзамене Humanity’s Last Exam — результат вдвое лучше предыдущих моделей OpenAI.

Дарья АрцыбашеваАвтор новостей

OpenAI представила универсального цифрового помощника, способного выполнять сложные многоэтапные задачи без участия человека. Новинка может самостоятельно бронировать столики в ресторанах, составлять презентации и даже планировать путешествия.

ChatGPT agent объединяет функционал двух предыдущих разработок — браузерного помощника Operator и исследовательского инструмента Deep Research. Система получила доступ к визуальному и текстовому браузерам, терминалу для выполнения кода и прямому подключению к API различных сервисов.

В отличие от стандартного чат-бота, новый помощник работает на собственном виртуальном компьютере. Он может переключаться между разными инструментами в зависимости от поставленной задачи — от простого поиска информации до создания редактируемых документов.

Возможности агента

Разработчики обучили модель использовать множество инструментов с помощью обучения с подкреплением. Агент умеет:

Автоматизировать еженедельные задачи;
Работать с веб-сайтами и заполнять формы;
Создавать диаграммы, презентации, а также генерировать изображения;
Планировать встречи и путешествия через интеграцию с Google Calendar и OpenTable;
Анализировать данные в таблицах Excel;
Покупать товары с их анализом;
Писать и выполнять программный код;
Подключаться к Gmail и GitHub через коннекторы ChatGPT.

При необходимости система запрашивает у пользователя дополнительные данные или разрешения для входа в аккаунты. Безопасность обеспечивается через специальный режим просмотра браузера и ограничения на работу с финансовыми сервисами.

Безопасность

Меры защиты данных:

Система Watch Mode — агент останавливается, если пользователь покидает вкладку при работе с финансовыми сайтами;
Запрос подтверждения перед выполнением критических действий (отправка писем, бронирование);
Отсутствие сохранения памяти между сессиями агента;
Блокировка доступа к финансовым транзакциям и высокорисковым операциям.

OpenAI классифицировала агента как систему высокого уровня риска в биологических и химических областях, применив самые строгие меры безопасности, включая специальное обучение отказа от выполнения опасных задач.

Результаты тестирования

На академическом экзамене Humanity’s Last Exam агент показал результат 41.6% — это вдвое превышает показатели моделей o3 и o4-mini. На математическом бенчмарке FrontierMath система достигла 27.4% при использовании терминала, что в четыре раза лучше предыдущих достижений.

Средняя задача выполняется за 10−15 минут, хотя сложные исследовательские проекты могут занимать до 25 минут. Для персональных задач вроде планирования свидания достаточно 5 минут.

Доступность

Функция доступна подписчикам планов Pro, Plus и Team с 17 июля 2025 года. Для активации нужно выбрать режим Agent mode в выпадающем меню инструментов ChatGPT.

Команда разработчиков из 20−35 специалистов продолжает совершенствовать продукт. В планах — интеграция с памятью ChatGPT для более персонализированного опыта, хотя эта функция не войдет в первоначальный релиз из соображений безопасности.

Запуск агента происходит на фоне активной разработки ИИ-агентов компаниями Google, Perplexity и другими технологическими гигантами, однако текущие решения пока не достигли заявленного уровня автономности.

Кстати, о конкурентах OpenAI — Perplexity запустила умный браузер Comet с функциями ИИ-агента. Подробности в статье.

Искусственный интеллект
chatgpt

18.07.2025

OpenAI запустила ИИ-агента в ChatGPT: как он работает

Возможности агента

Безопасность

Результаты тестирования

Доступность

Rivian переведёт некоторые электромобили на более доступные LFP-аккумуляторы, как и Tesla

Тепловые насосы электромобилей Tesla, которыми так гордится Илон Маск, начали выходить из строя

Tesla показала работу гигантского пресса по формовке задней части кузова одной деталью

Honda: водород вряд ли получит широкое распространение в легковых автомобилях

Ford будет продавать недоукомплектованные внедорожники Explorer — недостающие чипы обещают установить потом

Беспилотник впервые успешно дозаправил самолёт прямо в воздухе

Илон Маск пообещал сделать всё, чтобы не допустить восстания машин

Огромная роботизированная рука китайской космической станции вызвала у США озабоченность

Индонезия закупит 100 аэротакси китайской компании EHang

Робо-кафе с кассиром «Дуняшей» откроют в ОАЭ

Представлен смартфон Moto G60s со 120-Гц дисплеем и четверной камерой

Названа дата анонса смартфона Nothing Phone (1) с чипом Snapdragon 7 Gen 1

Google и iFixit запустят программу самостоятельного ремонта устройств Pixel

Samsung надеется утроить продажи смартфонов с гибкими дисплеями в этом году благодаря новинкам

Спад на рынке смартфонов почти не затронул iPhone — Apple даже ожидает, что iPhone 14 будут продаваться лучше предшественников

Возможности агента

Безопасность

Результаты тестирования

Доступность

Путин поручил разработать ограничения для мессенджеров из недружественных стран

СМИ сообщили, что военных врачей будут судить в Краснодаре за поборы с раненых бойцов СВО

Похожие статьи