Самый популярный ИИ для программирования убивает SSD на компьютерах
За три недели обычной работы ноутбук записал на диск почти 40 терабайт данных, и все это служебные файлы одной популярной программы.
Дарья АрцыбашеваАвтор новостей
Один из инженеров заметил странную нагрузку на собственном ноутбуке: SSD стремительно расходовал ресурс, хотя машина использовалась для обычных задач разработки. После проверки выяснилось, что основным источником записи был ИИ-ассистент для кода Codex от OpenAI — точнее, его внутренний механизм логирования.
Программа постоянно сохраняет служебные данные в локальную базу SQLite на диске пользователя. Звучит безобидно, но на практике это превращалось в настоящий конвейер записи. За 21 день непрерывной работы накопитель получил около 37 терабайт данных только от этого процесса. Если посчитать годовую нагрузку, получается порядка 640 терабайт, а у многих бытовых SSD заявленный ресурс держится в районе 600 ТБ суммарной записи за весь срок службы. Получается, что инструмент мог «съесть» гарантийный лимит накопителя меньше чем за год.
Самое интересное в этой истории — разрыв между тем, что реально хранится в базе, и тем, сколько туда было записано. На момент проверки файл базы занимал чуть больше гигабайта и содержал около 500 тысяч строк. При этом внутренний счетчик идентификаторов уже перевалил за 5,5 миллиарда. Разница почти в десять тысяч раз, и программа без остановки делала новые записи, а затем сразу же их удаляла, освобождая место под следующие. Диск физически фиксировал каждую такую операцию, и именно в этом постоянном цикле «записал-стер» скрывался основной износ.
Причина крылась в настройках логирования. Разработчики по умолчанию включили максимально подробный уровень детализации для абсолютно всех событий программы, включая внутренние библиотеки и технические подсистемы. Львиную долю объема занимали даже не полезные данные, а сырые копии сетевого трафика — содержимое веб-сокетов и потоковых соединений, через которые Codex общается с серверами. Отдельный кусок нагрузки создавало дублирование одних и тех же событий сразу в несколько журналов телеметрии.
После публикации проблемы команда OpenAI отреагировала быстро. Уже через несколько дней вышли два апдейта: один убирал избыточную фиксацию каждого события сетевого соединения, а второй отфильтровал шумные технические источники, которые не несли практической пользы для отладки. По оценке автора находки, эти изменения сократили объем лишних записей примерно на 85%.
История получилась показательной для всей индустрии ИИ-инструментов: чем активнее программа собирает данные для собственной диагностики, тем выше риск, что эта функция начнет работать против пользователя — в буквальном смысле сокращая срок жизни его оборудования.
Также недавно писали, что Anthropic выпустила бесплатное руководство по созданию ИИ-стартапа. Подробности в статье.
chatgptИскусственный интеллектПоделиться






