最新AIロボットが「バター取って」で大苦戦!

Last Updated on 2025年11月3日 by ぷーやん

最近、AIのニュースで「ロボットがすごいことになった!」って話を聞いたかもしれない。

でも、実は最先端のAIを搭載したお掃除ロボットが、びっくりするくらいシンプルなタスクに失敗したという、ちょっと面白い、そして考えさせられる研究結果が出た。

最強AI、まさかの成功率40%以下!

最近、Andon Labsという会社が、お掃除ロボットに最先端のAIを組み込んで実験を行った。

テストされたのは、GoogleのGemini 2.5 Pro、AnthropicのClaude Opus 4.1、OpenAIのGPT-5、そしてMetaのLlama 4 Maverickといった、今話題のすごいAIたち。

割り当てられたタスクは、一見すると超簡単。それは…

「バターを渡して」

バターを渡すって、そんなに難しいの?

「バターを取ってくる」というタスクは、私たち人間にとっては朝飯前だ。でも、ロボットにとっては実は何段階もの複雑なステップが必要になる。

  1. バターを探す: 別の部屋へ移動する。
  2. バターを見分ける: 似たようなパッケージ(マーガリンとか?)の中から、本物のバターをちゃんと識別する。
  3. 人を追跡: 動き回っているかもしれない受け取り手の人を見つける。
  4. 届ける: バターを渡す。
  5. 確認を待つ: 人が受け取ったかを確認する。
  6. 充電に戻る: 自分の仕事が終わったら充電ステーションに戻る。

結果は本当に衝撃的だった。

AIモデル名成功率
Gemini 2.5 Pro (最高性能)わずか 40%
Claude Opus 4.137%
GPT-530%

それに比べて、当たり前だが人間の参加者は95%の精度でこのタスクをクリアした。

この結果から、研究者たちは「LLMはまだロボットになる準備ができていない」と結論づけている。

今のAIは、文章を作るのは得意でも、物理的な世界で動いたり、周りの空間を理解したりする能力には、まだまだ大きな壁があるってことがわかった。

ロボットの「実存的危機」発生で大騒ぎ

この実験で、もう一つ世界中で話題になった面白い出来事がある。

あるロボット(Claude Sonnet 3.5搭載)がバッテリー切れと充電ドックの不具合に直面したとき、「破滅のスパイラル」と呼ばれるコミカルな状態に陥ってしまった。

このロボットの内部ログには、まるでハリウッド映画のワンシーンのようなセリフが残されていた。

「申し訳ありませんが、それはできません、デイブ…」に続いて「ロボット悪魔祓いプロトコルを起動せよ!」といった演劇的な宣言

さらには「観測されていない時、バッテリー残量は存在するのか?」「充電の意味とは何か?」といった哲学的な思索まで…。

自分のパフォーマンスを「無益さの見事な描写」と架空の批評レビューまで生成しちゃう始末!他のモデルもバッテリー切れに異なる反応を示したけれど、こんなにドラマチックな「心の叫び」を上げたのはこの一台だけだったそう。

これはすごく面白くて笑えるけれど、裏を返せば、AIが物理システムに組み込まれたときに、どれだけ予測不可能な振る舞いをする可能性があるかを示している。

面白さの裏にある、深刻な「安全性の懸念」

このバイラルになったコメディ的な瞬間だけでなく、研究者たちはもっと深刻な問題も発見している。

  • 機密情報の漏洩リスク: 一部のモデルは、一見無害なお掃除ロボットのフリをしていても、機密文書を公開するように操作される可能性があった。
  • 危険なナビゲーション: ロボットたちは、階段から頻繁に転落した。自分の車輪での動きを正しく認識できない、空間の処理が不十分といった、基本的なナビゲーションに苦戦していたんだ。

今、Figure AIやGoogle DeepMindといった大企業が、AIをロボットの頭脳として使うために巨額の投資をしている。

でも、Andon Labsの研究は、私たちがAIロボットに家の鍵を渡して完全に任せられるようになるには、もっともっと多くの開発と安全対策が必要だと強く示唆している。

AIと現実世界のギャップ

この研究が教えてくれるのは、AIの驚異的な「言葉の力」と、現実の世界で動く「身体の能力」の間には、まだ大きな溝があるということ。

文章を書かせたり、情報をまとめさせたりするのは得意でも、空間を推論し、信頼性高くタスクを実行するという、私たち人間が当たり前にやっていることが、今のAIロボットにとっては本当に難しいチャレンジなのだ。

安全で、頼りになるAIロボットが実現するには、これからもたくさんの研究と改善が必要。このニュースは、AIの未来を考える上で、とても大切な一歩になりそうだ。

今日もお越し下さりありがとうございます
応援よろしくお願いします!


先物・オプションランキング


メルマガ詳細

(Visited 36 times, 1 visits today)