匍匐(ほふく)の学習
学習前:
学習後:
実ロボットの匍匐
ROBOTIS社製のBioloidの匍匐学習に適用した例です.
この動画は学習段階です.ロボットは同様にスクラッチから学習します(シミュレーションなし).
学習後,ロボットは匍匐の獲得に成功しました(約30分ほどです).
ほかの視点から:
メンバー
主要関連論文
- 山口 明彦, 高松 淳, 小笠原 司: 強化学習によるロボットの動作獲得のための基底関数に基づく行動空間生成手法, 日本ロボット学会誌, Vol.29, No.1, pp.55-66, 2011.
- 山口 明彦, 高松 淳, 小笠原司: 強化学習によるロボットの動作獲得のための基底関数に基づく行動空間生成手法DCOB —実機多自由度ロボットの匍匐動作への適用—, 日本機械学会ロボティクス・メカトロニクス講演会2010(ROBOMEC2010), 2P1-G10, 旭川, 2010年6月.
- Akihiko Yamaguchi, Jun Takamatsu, and Tsukasa Ogasawara: Constructing Action Set from Basis Functions for Reinforcement Learning of Robot Control, in Proceedings of the 2009 IEEE International Conference on Robotics and Automation (ICRA2009), pp.2525-2532, Kobe, Japan, May, 2009.