"吉田慎二,長谷川修","Q-reuse: 強化学習における行動価値関数を再利用した転移学習手法","ロボティクスシンポジア",,,,,,2012,Mar.