An Analysis of the Learning Process on Manual Control of Nonholonomic Systems

2006 
本論文では, 非ホロノミック系の手動制御における人間の試行錯誤による学習過程を解析することを目的とした. 解析する手段として強化学習の枠組みにおける価値関数の形成過程を利用する方法を提案し, この解析手法を非ホロノミック系のひとつである2リンク劣駆動マニピュレータ (2PUAM: 2-Link Planer Underactuated Manipulator) を対象とした手動制御実験に適用した. 試行の進行に応じた価値関数の形状の変化を調べた結果から, 非ホロノミック系における人間の学習過程は, (1) 目標軌道の探索, (2) 目標軌道への追従と通過速度の向上, という逐次的な構造を持っていることが示唆された.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    7
    References
    2
    Citations
    NaN
    KQI
    []