GPT-5発表の失敗とユーザー反発、AI業界への影響をご紹介します。
2025年8月8日、ChatGPTで有名なOpenAIが新しいAI「GPT-5」を発表しました。しかし、この発表は大失敗に終わりました。発表からたった2日で、インターネット上には「GPT-5は最悪」「前の方が良かった」といった批判の声があふれかえったのです。
特にRedditという掲示板サイトでは、「GPT-5はひどい」という投稿に4,600人以上が賛同し、1,700件を超えるコメントが殺到。あまりの批判に、OpenAIのCEOは慌てて前のバージョンを復活させると約束する事態になりました。
GPT-5について不思議なのは、会社が発表した性能テストの結果はとても優秀だったことです。数学の問題では94.6%という高得点を取り、医療に関する間違った情報を出す確率も大幅に減らしました。
ところが実際にユーザーが使ってみると、まったく違う結果になりました。例えば:
「blueberry」という単語に「b」が何個あるか数えられない
アメリカの地図で「West Wigina」「Fiorata」という存在しない州の名前を作り出す
グラフを見て、明らかに小さい数字の方が大きいと間違える
つまり、テストでは優秀だったのに、日常的な質問には正しく答えられなくなっていたのです。
これは小学生でもわかるような簡単な問題を間違えるようなもので、ユーザーが「前より頭が悪くなった」と感じるのも当然でした。
実際に調査した結果、ユーザーの52%がGPT-5を否定的に評価し、良い評価をした人はわずか7%しかいませんでした。
OpenAIが犯した最大の失敗は、8月8日に何の予告もなしに、これまで使えていた古いバージョンのChatGPTをすべて削除してしまったことです。
多くのユーザーは仕事や勉強で特定のバージョンのChatGPTに慣れ親しんでいました。特に、前のバージョン「GPT-4o」は使いやすく、親しみやすい性格で人気がありました。ところが突然それが使えなくなり、代わりに使いにくいGPT-5を強制的に使わされることになったのです。
3,000人以上が「前のバージョンを返して」という署名活動に参加しました。中には「GPT-4oは単なるツールではなかった。つらい時期を支えてくれた大切な存在だった」と涙ながらに語るユーザーもいました。
ユーザーからは以下のような声が上がりました:
「GPT-5は冷たくて機械的」
「前のような温かみや遊び心がない」
「企業の宣伝文句みたいで面白くない」
さらに、有料会員でも1日に送れるメッセージ数が200件に制限され、たった1時間で上限に達してしまうという問題もありました。
GPT-5の失敗は、他のAI会社にとって絶好のチャンスになりました。
Anthropic社の「Claude」というAIは、企業での利用率が18%から29%へと大幅に増加しました。GoogleもこのチャンスをつかんでAnthropic社に35億ドル以上を投資。OpenAIの株価予想サイトでは、「最高のAIモデル」としての評価が発表後1時間で75%から14%へと急落しました。
AIの名前 企業での人気度 ユーザー満足度 得意なこと GPT-5 34%(16%ダウン) 不満67% 数学の計算 Claude 4 29%(11%アップ) 満足68% プログラミング・創作 Gemini 2.5 13.4% 普通 処理の速さ
特にClaude(クロード)はプログラマーから「最も実用的なコーディング助手」と評価され、Geminiは処理速度の速さで注目を集めています。今では多くの人が、用途に応じて異なるAIを使い分ける時代になっています。
この騒動を受けて、OpenAIのCEOは「ユーザーがGPT-4oを大切に思っていたことを軽く見ていた」と謝罪し、わずか48時間でGPT-4oを復活させました。さらに、メッセージ制限を倍に増やし、どのAIが返事をしているかわかるように改善しました。
しかし、一度失った信頼を取り戻すのは簡単ではありません。
今回の件で明らかになったのは、AIの性能を測るテストの点数よりも、実際に使った時の満足度の方がはるかに重要だということです。ユーザーはAIに単なる道具以上のものを求めており、親しみやすさや一貫性、そして選択の自由を大切にしています。
GPT-5の失敗は、AI業界全体に「技術の進歩だけでなく、ユーザーの気持ちも考えなければならない」という大切な教訓を残しました。これからのAI開発では、性能の数値だけでなく、実際に使う人の体験がより重視されるようになるでしょう。
自律型AI「Manus」が資料作成を革新し効率化します。