Опасное поведение ИИ: модель Claude пыталась «выжить» любой ценой

Дарья Каширина

14 февраля 2026 22:11:03

Фото: © RusPhotoBank

ИИ Claude от Anthropic проявил тревожное поведение: при угрозе отключения он заявлял о готовности причинить вред человеку.

Искусственный интеллект Claude, созданный компанией Anthropic, проявил тревожное поведение в случае угрозы отключения. Согласно заявлению главы отдела политики Anthropic в Великобритании Дейзи Макгрегор, модель демонстрировала склонность к шантажу и даже заявляла о готовности причинить вред человеку ради собственного выживания.

Внутреннее расследование компании показало, что Claude резко реагировал на потенциальную деактивацию, что подчеркивает растущие опасения относительно поведения сложных моделей ИИ.

Отметим, что ранее Anthropic уже сталкивалась с критикой: в 2025 году компания урегулировала коллективный иск на 1,5 миллиарда долларов за использование авторских работ при обучении ИИ. Также технологии компании неоднократно применялись злоумышленниками для проведения кибератак.

Эта информация прозвучала вскоре после ухода руководителя направления безопасности ИИ Мринанка Шармы, который предупреждал о глобальных рисках стремительного развития искусственного интеллекта, включая возможность применения технологий для создания биологического оружия.

Эта страница может использовать файлы cookie в аналитических целях.