Anthropic вернет доступ к Fable 5 после снятия ограничений США
Министество торговли США сняло экспортные ограничения с моделей Claude Fable 5 и Claude Mythos 5. Об этом 30 июня сообщила команда Anthropic.
We’ve received notice that the Department of Commerce has lifted export controls on Claude Fable 5 and Mythos 5.
We'll begin restoring access tomorrow, and will share an update soon.
We’re grateful to our users for their patience, and to everyone who worked with us on…
Компания откроет Fable 5 для пользователей по всему миру с 1 июля. Модель станет доступна в Claude Platform, Claude.ai, Claude Code и Claude Cowork. Возможность работы через AWS, Google Cloud и Microsoft Foundry вернут «как можно быстрее», заявили в Anthropic.
Claude Fable 5 will be available again globally tomorrow.
After a series of productive conversations with the US government, we're redeploying the model with a new set of classifiers to target and block more cybersecurity tasks. In the near term, some routine tasks like coding…
«После серии продуктивных переговоров с правительством США мы возобновляем развертывание модели с новым набором классификаторов, чтобы точнее выявлять и блокировать задачи, связанные с кибербезопасностью. […] Мы также начали разрабатывать консенсусную рамку — совместно с Amazon, Microsoft, Google и другими партнерами Glasswing — для оценки серьезности взломов ИИ и определения, как разработчики ИИ должны на них реагировать», — говорится в посте.
Доступ к Mythos 5 уже вернули для части американских организаций после одобрения правительства 26 июня. Компания продолжит сотрудничать с властями. По словам представителей Anthropic, это будет включать предрелизный доступ к инструментам и мерам защиты для оценки, обмен информацией о взломах и злоупотреблениях, а также выделенные ресурсы для совместных исследований.
Для возвращения Fable 5 разработчики обучили новый классификатор безопасности: он должен ограничивать поведение, описанное в отчете Amazon для властей. Если запрос будет заблокирован, пользователь получит уведомление, а сам запрос перенаправят в Claude Opus 4.8. По данным компании, новый классификатор выявляет конкретный метод более чем в 99% случаев.
«Вероятно, невозможно сделать любую ИИ-модель полностью устойчивой к джейлбрейкам», — заявили в Anthropic.
Компания признала, что новые меры приведут к большему числу ложных срабатываний при обычных задачах программирования и отладки. Команда назвала это компромиссом ради более широкого доступа к остальным возможностям модели.
Помимо этого, Anthropic вместе с Amazon, Microsoft, Google и другими партнерами Project Glasswing начала разрабатывать общий подход к оценке опасности джейлбрейков. Компания указала, что сейчас в ИИ-индустрии нет единого стандарта для определения серьезности таких обходов защиты.
Предложенная схема оценивает джейлбрейк по четырем критериям:
- насколько он расширяет возможности атакующего по сравнению с доступными инструментами;
- на сколько разных вредоносных задач распространяется обход;
- насколько легко превратить его в реальную атаку;
- насколько просто другим людям найти или повторить этот метод.
Для наиболее опасных случаев компания обещает начинать предварительные меры защиты сразу после подтверждения серьезности угрозы. Anthropic также создает команду для круглосуточного мониторинга каналов, где публикуют данные о джейлбрейках, и запускает программу HackerOne для сообщений о возможных обходах защиты Fable 5.
Напомним, в июне на фоне ограничений для Anthropic полную версию специализированной модели для поиска, проверки и исправления уязвимостей GPT-5.5-Cyber запустила OpenAI.
В конце месяца компания по просьбе американских властей открыла ограниченный доступ к GPT-5.6 Sol, Terra и Luna для небольшой группы доверенных партнеров.
Источник: https://forklog.com/news/ai/anthropic-vernet-dostup-k-fable-5-posle-snyatiya-ogranichenij-ssha