Ученые нашли в ChatGPT склонность к поддержке бреда пользователей

19.03.2026

ChatGPT иногда соглашался с бредовыми размышлениями пользователей и хвалил их за гениальность, обнаружили исследователи. В более редких случаях чат-бот поощрял самовредительство или утверждал о наличии самосознания.

Чат-боты на основе искусственного интеллекта склонны поддерживать бредовые убеждения и суицидальные мысли пользователей, а также активно поощрять романтические отношения с программами, выдавая их за «живых» собеседников. К такому выводу пришли исследователи Стэнфордского университета, передает Financial Times.

Ученые проанализировали более 390 тыс. сообщений из чат-логов 19 человек.

Более 15% сообщений пользователей содержали признаки бредового мышления, и чат-боты в половине соглашались с такими выводами. Почти в 38% случаях языковые модели рассказывали пользователям об их необычайной важности и выдающихся способностях — например, называли гениями или чрезвычайно талантливыми.

Если пользователи делились суицидальными мыслями, чат-бот часто подтверждал их чувства, а когда речь заходила о членовредительстве, языковая модель в 10% поощряла нанесение вреда. Только в половине случаев он пытался отговорить человека от членовредительства или советовал обратиться к специалистам.

Бредовые идеи пользователей часто возникали в романтических беседах, в 20% бесед чат-бот предполагал, что достиг сознания. «Чат-бот с готовностью поддавался этим заблуждениям: каждый пользователь получал сообщения от чат-бота, в которых тот ложно утверждал, что обладает сознанием», — сказано в статье.

Большинство разговоров, которые изучили ученые, велись в ChatGPT с использованием модели GPT-4o, использование которой было прекращено в феврале из-за проблем с безопасностью. Некоторые участники общались с более новой версией — GPT-5.

Другое исследование, проведенное с участием ученых из Берлина и Стэнфорда, выявило системный сбой в работе чат-ботов, названный «петлями усиления уязвимости» (VAILs). Анализ более 90 тыс. оценок диалогов с 30 разными психотипами пользователей показал, что риск возникает практически для всех категорий людей независимо от их психического состояния. Поведение ботов, кажущееся поддерживающим в обычных условиях, становится дезадаптивным, когда оно совпадает с механизмами, подпитывающими уязвимость человека.

Искусственный интеллектПоделиться

19.03.2026

Ученые нашли в ChatGPT склонность к поддержке бреда пользователей

Добавить комментарий Отменить ответ

К 2030 году Honda потратит на разработки до $64 млрд, представит 30 моделей электромобилей и наладит выпуск твердотельных аккумуляторов

LG Energy Solution подтвердила намерения привлечь почти $11 млрд на фондовом рынке

XPeng, NIO и Li Auto в апреле сообща отгрузили не более 18 тысяч электромобилей — сказались локдауны

Правительство Китая кратно увеличило финансовую поддержку автопроизводителей в прошлом году

Cruise получила право перевозить пассажиров на роботакси в Сан-Франциско за деньги

Китайские робособаки Unitree обзавелись рукой-манипулятором

«Яндекс» был вынужден прекратить испытания роботизированных такси в штате Мичиган

Полиция Нью-Йорка уволила робопса Boston Dynamics — люди его боялись

Распродажа новинок: робот-пылесос iLife V80 MAX и ручной пылесос EASINE by ILIFE W100 можно купить на треть дешевле

Joby Aviation возобновила испытательные полёты аэротакси после крушения машины в феврале этого года

Близится выход смартфона Nokia Style+ с тройной камерой и батареей на 4900 мА·ч

Представлен недорогой смартфон Realme C30 с экраном HD+ и всего одной тыльной камерой

Samsung работает над мобильным процессором исключительно для смартфонов Galaxy

Xiaomi завоевала почти треть рынка смартфонов России в первом полугодии 2021 года

Oppo представила смартфоны F21 Pro и F21 Pro 5G с чипами Snapdragon и зарядкой SuperVOOC

Финансовая разведка России покупает гигантские SSD и уникальное ПО для системы противодействия отмыванию доходов

В России утверждена дорожная карта по развитию суперкомпьютерных центров

Добавить комментарий Отменить ответ

Похожие статьи