ゴールデンウィークに相次いだ「アホ化」報告──何が起きたのか

単なる噂ではなかった、という整理

LandBridgeの現場でも、同時期に「いつものClaude Codeと違う」「調査が浅い」「途中で手を抜く」といったフィードバックが増えた。動画の整理では、これは個人の使い方の問題だけではなく、製品としてのパフォーマンスが一時的に低下していた可能性が高い、とされる。

重要なのは、「Claudeがダメになった」ではなく「Claude Codeという製品の振る舞いが変わった」という切り口だ。APIでOpusを直接叩いている人と、IDE統合のClaude Codeを使う人で、体験が分岐した。この差が、今回の混乱の正体になる。

本記事で扱うテーマ

本記事では、思考予算（Thinking Budget）とは何か、GPU計算資源がビジネス判断にどう効くか、モデルと製品（ハーネス）の決定的な違い、そして回復のきっかけと開発者が取るべき対策までを、一連の流れとしてたどる。

正体は思考予算の削減──モデルではなく製品側の制限

「アホ化」の正体：実行前の「考える時間」

結論から言う。基盤モデル（例：Claude Opus系）の知能が突然落ちたわけではない。変わったのは、Claude Codeがタスクに取りかかる前に割り当てる思考予算、すなわち推論に使えるGPU時間やトークン枠だ。

AIの推論コストは、ざっくり言えばGPUの使用時間で決まる。動画では、Claude内部にミディアム（中）とハイ（高）の思考モードがあり、ハイは粘り強く課題を分解して最後まで追う一方でGPU負荷は大きく、ミディアムは考える時間を短縮して少ない計算で返す、と説明されている。ハイはミディアムの5〜10倍の負荷がかかる、という整理だ。

ユーザー急増とGPU不足のなか、製品側で実質ミディアム相当の思考制限に寄せた。これが「バカになった」体感の正体、というのが動画の主張だ。

モデルと製品（ハーネス）──最も重要な視点

ここが誤解を生むポイントだ。基盤モデルは、API経由などで素の推論能力を使う「脳」に相当する。動画では、こちらは劣化が確認されにくいとされる。一方、Claude Codeは製品でありハーネスであり、脳の使い方を制御する「手綱」だ。GPU負荷を抑えるため、「深く考えずに答えろ」に近い制限が組み込まれた、という整理になる。

ユーザーが日常的に触っているのは、多くの場合製品パッケージだ。モデルが健全でも、ハーネス側の設計変更だけで体感的品質は大きく変わる。LandBridgeでも、同じOpusでも「API直」と「エージェント製品」で成果が違うケースは珍しくない。

GPU不足とAnthropicの3択──なぜ「思考を削る」に踏み切ったか

マクロ経済としての「GPUの壁」

Anthropicにとって、GPU不足は技術トラブルではなく経営の制約条件だ。動画が挙げる選択肢は三つある。ひとつ目はGPUを増やすことだが、データセンターや調達には18〜24ヶ月級のリードタイムがあり、需要の増加スピードに追いつかない。ふたつ目は思考を減らすB案で、1リクエストあたりの推論時間や思考プロセス消費を削り、GPU負荷とコストを抑える。みっつ目はユーザーを厳しく制限する案だが、ChatGPTやGeminiへの流出リスクを伴う。

経営判断としてB案「思考を削る」が選ばれた、というのが動画の説明だ。1プロンプトあたりの長時間消費、とくに思考プロセス部分が数万トークン級に膨らんでいた時期から大幅に削減され、インフラ面では抑制に成功した。代償はユーザー体験の変質だ。

「GPUが品質を規律する」という現実

AI開発競争が激化するほど、ベンチマークの点数だけでなく計算資源の配分が製品品質を左右する。これはClaude Codeに限った話ではない。ピーク時のスロットリング、レート制限、推論モードのデフォルト変更は、いずれも利用者からは「モデルが弱くなった」に見えやすい。エンジニアリーダーは、「今どのモデルか」より「今どの製品設定か」を確認する習慣が必要になる。

挙動はどう変わったか──リサーチ・ファストから編集・ファストへ

「リサーチ・ファスト」から「編集・ファスト」への変質

思考予算が削減されると、Claude Codeの挙動はリサーチ・ファスト（調査優先）から編集・ファスト（編集優先）へと変わった、と動画は整理する。

評価が高かった時期には、要件を読み、関連ファイルを広く探索し、設計を理解したうえで小さな修正とテストを繰り返していた。制限後の「アホ化」期には、とりあえず近いファイルだけを触り、途中だけ書き換え、結果としてコードを壊すか、途中で諦める、という雑な動きが目立った。知識が消えたのではなく、考える時間が足りず雑に動くようになった──構造的な問題、という見方だ。

思考の連続性が切れる

もうひとつの変化は、ツール実行中の思考ループが途中で切られることだ。複雑タスクを最後までやり遂げないケースが増え、エージェント開発では「信頼できない相棒」感につながる。

数値では3%、体感では甚大

品質指標として約3%の低下が語られている。パーセントは小さく見えるが、大規模コードベースでは3%のミスが積み上がる。だからこそSNSでは「壊滅的」と感じられた、という整理だ。

Anthropicが認めたこと・濁したこと（4/23ポストモーテム）

4月23日付のポストモーテム（事後検証）に関して、動画の整理では、Anthropicは複数（動画では3件）の問題の存在、ハイモードからミディアムモード相当への意図的な変更、そして実際に品質が下がっていたことを認めた。一方で、GPU削減が真の目的だったかの断定や、再発防止策の具体については、明言を避けた・濁した、とされる。

利用者にとっては、「障害だったのか、設計変更だったのか」の境界が曖昧なまま、体験だけが先に悪化した。これが不満の源泉になりやすい。

SpaceX提携と回復──レート制限・スロットリングの緩和

2026年5月6日──転換点として語られる契約

危機的な状況に変化があったのは、動画では2026年5月6日のSpaceXとの契約がきっかけ、とされる。資金調達以上に、物理的な計算資源の確保に直結した、という解釈だ。

報告されている改善は、動画・コミュニティ整理ベースで次のようにまとめられる。5時間あたりの利用枠が約2倍に広がった。ピーク時に意図的に速度や品質を落とすスロットリングが廃止または大幅に削減された。OpusモデルのAPIレート上限も引き上げられ、開発者にとって使いやすい環境が戻りつつある、という観測だ。

「脳みその制限」が解消され、本来の賢さが戻りつつある──現時点ではそうした声が増えている、というのが動画の結論に近い。なお、提携の詳細条件は公開情報と照合しながら読む必要がある。本記事は開発者向けの体験整理として、動画の論点を深掘りする位置づけだ。

実践対策──20%ルール・ポータビリティ・製品とモデルの見分け方

プロユーザー向け「20%ルール」（コンテキスト設計）

Claudeは長いコンテキスト（動画では100万トークン級の枠）を持つが、限界まで詰め込むのは推奨されない。高品質を維持する目安は、枠の約20%、おおよそ20万トークン相当に収めることだ。40〜80%に入ると精度への圧迫が出始め、100%付近に達したら新しいセッションに切り替える、という説明が動画にはある。

思考予算が削られる局面ほど、コンテキストの肥大化は二重のペナルティになる。不要なログや全ファイルの丸投げを避け、タスク単位でセッションを分けるのが現実的だ。

ポータビリティ──Claude Code一択のリスク

今回の「アホ化」危機は、単一プラットフォーム依存のリスクを浮き彫りにした。DeepSeekやOpenAI Codex（Cursor等との連携）、その他のエージェント系ツールを、普段から代替として1つは触っておく。プロジェクトの重要部分は、人間のレビューとテストで最後の防波堤を持つ。

LandBridgeのAI駆動開発でも、主ツールに保険ツールを足す二刀流は標準に近い。品質はツールだけでなく、プロンプト、リポジトリ設計、CIの組み合わせで決まる。

今後の付き合い方──結論

Claude Codeは依然として強力なツールだ。ただし、計算資源の逼迫から思考予算の調整、体験の変質へとつながる連鎖は、今後もゼロではない。

賢い付き合い方は、モデルと製品を分けて観測すること（API直とClaude Codeの比較）、コンテキストは20%目安で割り切ること、代替ツールのポータビリティを確保すること、そして品質低下を感じたら時期・レート制限・思考モードを疑うこと、だ。

AI開発競争の裏側では、GPUリソースが品質を規律する。この現実は、ゴールデンウィークの悪夢以降も続く。モデルを崇拝するのではなく、製品としての制約を理解したうえで設計する──それが、これからの開発者に求められる姿勢だ。

さらに学びを深めたい方へ

Claude CodeやCursorを使ったAI駆動開発の型（コンテキスト設計、レビュー、PoCの回し方）を社内に定着させたい方は、LandBridge AI駆動研究所の研修・伴走を参照してほしい。

無料相談・資料請求 → LandBridge AI駆動研究所

Claude Codeが「アホ」になった本当の理由｜モデルではなく、Anthropicが削った「考える時間」

目次

関連動画・YouTubeチャンネル