この記事はAnthropicのインフラ障害に関する技術的ポストモーテムであり、Claude Codeの使い方を変えるための直接的なガイドではありません。参考情報として以下のように評価できます：

3つの最近の問題に関するポストモーテム

概要

2025年8月から9月初旬にかけてAnthropicは断続的にClaudeの応答品質を低下させていた3つのインフラバグを特定し解決しました。本記事では何が起こったのか、なぜ検出に時間がかかったのか、どのような改善を実施しているのかについて詳しく説明します。

8月5日に導入された設定ミスにより、短いコンテキストのSonnet 4リクエストが、100万トークンのコンテキストウィンドウ用に設定されたサーバーに誤ってルーティングされました。

8月25日のTPUサーバーの設定ミスにより、予期しないトークン確率の割り当てが発生しました。

症状:

影響範囲:

対応: 9月2日に変更をロールバック。その後、デプロイ手順に異常出力の検出テストを追加しました。

8月25日のトークン選択コードの改善により、近似top-k操作に影響を与える潜在的なコンパイラのバグが露呈しました。

症状:

根本原因:

解決策:

経緯:

Anthropicは以下のような複数のギャップを認めました：

評価の限界: 評価プロセスがユーザーから報告された品質低下を捉えられなかった。「Claudeは孤立したミスからうまく回復することが多い」ため、問題が見えにくかった
プライバシー制限: プライバシー管理により報告されていないユーザーとのやり取りへのエンジニアのアクセスが制限され、診断が複雑化
複合的な症状: 異なるバグがプラットフォームごとに異なる症状を生成し、体系的な問題ではなくランダムな品質低下のような矛盾したレポートとなった
ノイズの多い評価への依存: ノイズの多い評価により、問題を特定の変更に結びつけることができなかった

Anthropicは以下を実施しています：

Anthropicは次のことを強調しました：

「需要、時間帯、サーバー負荷によってモデル品質を低下させることは決してありません」

これらは純粋にインフラのバグでした。

ユーザーは以下の方法で問題を報告できます：