ガジェット 公開日 2024/05/08 19:26

ロボット犬に玉乗りも教えられるAIエージェント「DrEureka」

将来はサーカスもAIで?
Gadget Gate
Munenori Taniguchi
  • Twitter
  • FaceBook
  • LINE
Nvidia AIのシニアリサーチマネージャー兼AI Agents Initiativeのリーダーを務めるジム・ファン博士らのグループは、大規模言語モデル(LLM)を活用し、ロボットが仮想世界で現実世界の作業を習得するSim-to-Realityシステム「DrEureka」を開発している。

ファン博士はこのシステムを用い、Unitreeの4脚ロボットGo1にバランスボールを使った玉乗りを教えている。ロボットに特定のスキルを仕込むシミュレーション環境を用意する場合、一般的にはまず、正しい動作をしたときに与える報酬や、環境の物理的なパラメーターを手動で構築してやらなければならない。

しかし、たとえばChatGPTのようなLLMを用いれば、いくつかのプロンプトを入力するだけでAIに特定のタスクをバーチャルな空間で訓練する報酬/ペナルティシステムをコード化できると研究者らは述べている。

パラメーターとしては各関節の自由度、ボールの弾力性、運動強度、故障や破損のポイントなどを与え、それらを調整してロボット犬を「調教」するわけだ。

チームはこのために、NVIDIA Researchの「Eureka」と呼ばれるAIエージェントに手を加えた「DrEureka」を開発した。ここでいう「Dr」は「Domain randomization」の略で、DrEurekaは摩擦、質量、減衰、重心などの物理パラメータをランダム化することで、ロボットが現実世界で遭遇する予測不可能な状況に、シミュレーション環境での学習を一般化できる。

シミュレーションを繰り返して行くと、AIによってバーチャルロボットの出来栄えや改善点を振り返ることもできる。例えばモーターをオーバーヒートさせたり、手足を能力を超えて動かしてズルをしようとする。またズルを許して鍛えたAIを現実のロボット犬に適用して実際に動かしてみると、非常に非効率的だったり、奇怪な動作をわれわれに披露することになる。

そのような問題を軽減するため、パラメーターを超えたりルールに違反する動作をすると、システムはAIの評価を0点にするようになっている。いくらAIといえども、報酬システムで強化されるにあたって、0点は好まない。

こうして鍛えられたロボット犬の動作は、従来のカリキュラムスタイルの教育の仕方より効率的だ。報告によれば、DrEurekaは複雑なタスクを一度に覚え込ませるのに長けており、これで鍛えたロボット犬は現実世界の複雑な地形の歩行速度で34%、移動距離で20%もアドバンテージを示したという。

DrEurekaの開発者らは、AIに実世界のフィードバックを提供できれば、バーチャルから現実へのトレーニングをさらに改善できると考えている。

現在、シムトレーニングはすべてロボットに固有な受容入力値のフィードバック、イメージセンサーやその他のセンサーからのデータで行われているものの、もしAIがログに残されたエラー値だけでなく、実世界での動作の失敗の様子を見て、改善すべき点を知ることができれば、より効果的に動作を覚えることができるだろう。

そのような方法を試すためにチームは、ロボット犬にバランスボールでの玉乗りを教えることにした。その結果はYouTubeで公開された動画で確認できる。

Source: Eureka Research
via: New Atras

この記事をシェアする

  • Twitter
  • FaceBook
  • LINE

トピック

クローズアップCLOSEUP
アクセスランキング RANKING
1 スーパートゥイーター沼への誘い。フォステクスが引き出すマルチアンプ・パラゴンの桃源郷
2 HDRがもたらす画質の革新! ダイナミックレンジの進化で画質はどう良くなる?
3 究極の「音」は電源から。出水電器が贈るロジウムメッキ・ブレーカーの衝撃
4 順位の変動が激しいブルーレイレコーダー。1位はパナソニック「DMR-2W103」<ビジュアル&関連製品売れ筋ランキング3月>
5 EarFun、AmazonスマイルSALEでイヤーカフ型やANC対応の完全ワイヤレスが安く。セールと併用できるクーポンも公開中
6 ESOTERIC・TAD・OCTAVE ハイエンド プリメインアンプ比較試聴会。秋葉原テレオンで5/16開催
7 シリーズ60周年記念イベント「ウルトラマンの日 in 杉並公会堂」7/10開催。『ティガ』オリジナルキャストも登壇
8 コナン/マリオ/プラダを着た悪魔etc...最新映画の「前作」はどこのサブスクで観られる?
9 オーディオリプラス、航空機グレードアルミ合金削り出しボディの電源ボックス「SAA-4SZ-MK2-RU」
10 ユキム、YUKIMU SUPER AUDIO ACCESSORYの静電気除電ブラシ「ASB-1」を値上げ
5/1 14:36 更新
音元出版の雑誌
オーディオアクセサリー200号
季刊・オーディオアクセサリー
最新号
Vol.200
世界のオーディオアクセサリーブランド大全2025
特別増刊
世界のオーディオアクセサリーブランド大全2025
最新号
プレミアムヘッドホンガイドマガジン vol.23 2025冬
別冊・プレミアムヘッドホンガイドマガジン
最新号
Vol.23
プレミアムヘッドホンガイド Vol.33 2025 SUMMER
プレミアムヘッドホンガイド
(フリーマガジン)
最新号
Vol.33(電子版)
VGP受賞製品お買い物ガイド 2025年冬版
VGP受賞製品お買い物ガイド
(フリーマガジン)
最新号
2025年冬版(電子版)
DGPイメージングアワード2024受賞製品お買い物ガイド(2024年冬版)
DGPイメージングアワード受賞製品お買い物ガイド
(フリーマガジン)
最新号
2025年冬版(電子版)
WEB
  • PHILE WEB
  • PHILE WEB AUDIO
  • PHILE WEB BUSINESS
  • プレミアムヘッドホンガイド
  • ホームシアターCHANNEL
  • デジカメCHANNEL
AWARD
  • VGP
  • DGPイメージングアワード
  • DGPモバイルアワード
  • AEX
  • AA AWARD
  • analog Grand Prix