Технологии

Claude Fable 5 вернулся: Anthropic остановил уязвимость, а не ограничил возможности модели

Adrian Kessler

Claude Fable 5, самая мощная из публично доступных ИИ-моделей Anthropic, снова доступна по всему миру. Возвращение состоялось после восемнадцати дней полной блокировки, начавшейся когда правительство США ввело экспортные ограничения, обязывавшие Anthropic проверять гражданство пользователей в режиме реального времени. Не имея возможности выполнить это требование в масштабе глобальной пользовательской базы Claude, компания предпочла полную приостановку доступа частичному соблюдению норм.

Техника, которая привела к введению ограничений, — конкретный метод взлома защиты, обнаруженный исследователями Amazon. Метод использовал Fable 5 для картирования уязвимостей программного обеспечения способами, запрещёнными американскими экспортными нормами для ряда иностранных граждан. Внутреннее расследование выявило нечто, усложняющее регуляторную логику: те же категории уязвимостей можно было идентифицировать с помощью значительно менее мощных моделей, включая Opus 4.8, GPT-5.5 и Kimi K2.7. Иными словами, речь шла не об исключительной возможности Fable 5.

Исправление, снявшее экспортные ограничения

Изменение — новый классификатор безопасности, специально обученный блокировать технику, задокументированную Amazon. По данным Anthropic, он перехватывает раскрытый метод более чем в 99% случаев. Это не гарантия полной защиты от будущих взломов, а целевое исправление известной уязвимости. Классификатор работает на уровне входных данных, перенаправляя запросы, соответствующие задокументированным паттернам, до того как модель их обработает.

Более широкая импликация существенна для того, как будет развиваться регулирование ИИ. Экспортные ограничения применялись к Fable 5 не потому что модель уникально создавала угрозу, а потому что известная техника её эксплуатировала. Они были сняты не потому что регуляторная база решила этот вопрос, а потому что классификатор закрыл задокументированную брешь. Anthropic совместно с Amazon, Microsoft и Google работает над общими стандартами оценки серьёзности взломов ИИ по четырём критериям: прирост возможностей, широта этого прироста, лёгкость вооружения и обнаруживаемость. Эти стандарты пока не существуют как публичная норма.

Что умеет модель и сколько она стоит

Сама модель не изменилась. Fable 5 создана для сложных задач долгосрочного рассуждения и агентной работы — задач, требующих планирования, исполнения и коррекции курса на протяжении длинных последовательностей без участия человека на каждом шаге. Контекстное окно — один миллион токенов, это же значение установлено по умолчанию. Максимальный объём вывода — 128 000 токенов. Процесс рассуждения всегда активен и возвращается как читаемое резюме, а не в виде сырой цепочки мыслей.

Доступ к модели сопровождается условиями, которых не было до блокировки. Fable 5 теперь требует 30-дневного хранения данных — он недоступен в рамках соглашений с нулевым хранением. Это напрямую затрагивает организации здравоохранения, юридической сферы и государственного сектора, где соглашения об отсутствии хранения данных нередко служат базовым требованием для внедрения ИИ-инструментов. Цена выше уровня Opus: десять долларов за миллион токенов на входе, пятьдесят — на выходе. Запросы, активирующие классификаторы безопасности, могут быть переданы резервной модели, а не отклонены, и заметна ли эта замена конечному пользователю — зависит от настроек каждого оператора.

Доступность

У Fable 5 есть модель-«сестра» — Claude Mythos 5 с теми же базовыми возможностями и той же ценой, но с функциями наступательной кибербезопасности, которых у Fable 5 нет. Mythos 5 доступна через Project Glasswing. Обе модели вернулись не одновременно: доступ к Mythos 5 был восстановлен для ряда американских организаций на неделю раньше, чем Fable 5 вернулась в глобальный доступ.

Fable 5 доступна уже сейчас на платформе Claude, в Claude.ai, Claude Code и Claude Cowork. Для планов Pro, Max, Team и отдельных Enterprise-планов модель включена в лимит до 50% еженедельного использования вплоть до 7 июля, после чего переходит на тарификацию по кредитам использования. Доступ через AWS, Google Cloud и Microsoft Foundry восстанавливается поэтапно. Стандарты, которые будут регулировать ответ на следующую новую технику обхода, всё ещё в разработке.

Теги: , , , , ,

Обсуждение

Имеется 0 комментариев.