Claude Codeのトークンが異常に早く消える問題——キャッシュバグの全容とAnthropicの公式見解

「最近、Claude Codeのトークンの減りが明らかに早い気がする…」

そう感じ始めたのは2026年3月下旬のことだった。以前は1日の開発作業でも余裕を持って使えていたのに、気づけば午前中だけで使用量が跳ね上がり、制限に引っかかるようになっていた。Anthropicが$20分のトークンを追加付与してくれたのだが、それでも数日でなくなりそうなペースだ。Claude Codeで開発するのが「当たり前」になっていた分、快適な開発体験が突然崩れた感覚があった。

調べてみると、同じ現象に苦しんでいる開発者が世界中に大量にいることがわかった。これは個人の使い方の問題ではなく、Anthropic側のバグだったのだ。

何が起きているのか

2026年3月23日頃から、Claude Codeの全有料プランユーザーのあいだで「使用枠が異常な速さで減る」問題が大規模に発生している。

報告されている被害の例は深刻だ。

  • 「Max 20x(月$200プラン)で、たった1つのプロンプトを送っただけで使用率が21%から100%に跳び上がった」
  • 「5時間持つはずのセッション枠が19分で枯渇した」
  • 「Proプラン(月$20)で3プロンプトしか送っていないのに上限に達した」
  • 「セッションを再開したら、入力27Kトークンに対して出力65万トークンが発生した」

GitHubのissueには10件以上の独立した報告が集まり、Redditの関連スレッドは数日で数百件のコメントが付いた。The Register、DevOps.comなど主要な技術メディアも報道している。

原因:複数のバグが重なっていた

コミュニティによるリバースエンジニアリングとAnthropicの調査によって、原因は1つではなく複数のバグが複合的に絡み合っていたことが判明した。

① プロンプトキャッシュのバグ(最大の原因)

Claude Codeはコスト削減のためにプロンプトキャッシュ機能を使っている。一度送信した内容を再利用することでトークン消費を抑える仕組みだ。しかしこのキャッシュが機能しなくなっていた。

具体的には2つのバグが確認されている。

  • アテステーションデータの問題:APIリクエストごとに生成されるアテステーション(認証証明)データの値が毎回変わるため、キャッシュのハッシュが一致せず、キャッシュが毎回破棄される
  • 文字列置換の誤動作:チャット履歴に課金関連の文字列が含まれると文字列置換処理が誤動作し、キャッシュのプレフィックスが壊れる

この結果、同じ会話を続けているだけなのに毎回フルビルドが走り、コストが10〜20倍に膨れ上がっていた。

② セッション再開(–resume)バグ

途中から会話を再開する機能にもバグがあった。アタッチメント付きメッセージがトランスクリプトに正しく保存されず、再開時に大量のキャッシュミスが発生していた。前述の「入力27Kトークンに対して出力65万トークン」という異常な報告はこのバグによるものだ。

③ ピーク時間帯の制限(サイレント変更)

2026年3月26日、Anthropicは平日のピーク時間帯(日本時間の深夜〜早朝)にセッション枠の消費が速まる制限をひっそりと導入した。週次の上限は変わらないとされているが、ユーザーへの事前通知は最小限だった。

④ MCPサーバー接続によるコンテキスト肥大化

MCP(Model Context Protocol)サーバーを接続している場合、接続した全ツールのJSONスキーマが毎リクエストのコンテキストに注入される。GitHub・Playwright・Gmailの3つを接続するだけで、1メッセージあたり約26,000トークンが余分に消費される計算になる。

⑤ ファイル読み込み時の行番号オーバーヘッド

Readツールや@ファイル指定でファイルを読み込むと、行番号フォーマットが付加されるため、生のテキストより約70%多いトークンが消費される(GitHub Issue #20223)。

Anthropicの対応状況

2026年3月31日、AnthropicのエンジニアがRedditに公式コメントを投稿し、「ユーザーが想定より遥かに速く使用上限に達していることを確認した。最優先で調査中」と認めた。これが事実上の公式認定だ。

その後の対応タイムラインは以下の通り。

日付対応内容
2026/3/26ピーク時間帯の制限変更を導入(通知は最小限)
2026/3/31「想定より遥かに速く上限に達している」と公式認定
2026/4/1頃「Claude Code側でいくつかの修正を出荷した」と発表
2026/4/2v2.1.91リリース:–resumeのキャッシュミス修正、アタッチメント保存修正

ただし、2026年4月現在、v2.1.97時点でもキャッシュバグ2件は修正済みとされているが、残る9件のバグは未修正というコミュニティからの報告がある。完全解決にはまだ時間がかかりそうだ。

$20の補填——でも焼け石に水?

Anthropicはこの問題への対応として、一部のユーザーに$20分のトークンを追加付与した。私もこれを受け取ったが、正直なところ「バグが直っていない状態では焼け石に水」という感覚が否めない。

キャッシュが壊れているまま使い続ければ、補填されたトークンも通常の10〜20倍のペースで消えていく。根本的な修正が完了するまでは、使い方を工夫しないとあっという間に使い切ってしまう。

今できる回避策

完全解決を待つだけでなく、現時点でできる対策をまとめる。

  • Claude Codeを最新版に更新する:v2.1.91以降では–resumeのキャッシュミスが修正されている。npm update -g @anthropic-ai/claude-code で更新できる
  • 不要なMCPサーバーを切断する:使っていないMCPサーバーの接続を切るだけで1メッセージあたり数千〜数万トークンを節約できる
  • セッションをこまめに新規開始する:長いセッションほどコンテキストが肥大化してコストが増大する。作業が変わるタイミングで新しいセッションを開始する癖をつける
  • 大きなファイルの全体読み込みを避ける:必要な部分だけを読み込むよう指示することで、行番号オーバーヘッドによる無駄なトークン消費を減らせる

まとめ

Claude Codeのトークン過剰消費問題は、単なる「気のせい」や「使い過ぎ」ではなく、プロンプトキャッシュのバグを主因とする複合的な不具合だった。Anthropicも公式に認定し、修正を進めているが、2026年4月現在も全面解決には至っていない。

月$20〜$200を払っているのに、バグで何倍ものコストがかかる状態は開発体験として非常にストレスが高い。まずは最新版へのアップデートと不要なMCP接続の整理から始めてみてほしい。

引き続きAnthropicの修正状況を追いながら、情報があればこの記事をアップデートしていく予定だ。