クレタ人の踵

AIならびにRobotに関する雑記。 世迷言など。

クレタ人の踵aibo Owner's WEBRINGに参加してます。
【ID:120 所有者:FebruaryMarch
[ 二つ前へもどる | 前へもどる | 次へ | 次の次へ ]
[ 前の5サイトを表示 | 次の5サイトを表示 | ランダムで移動 | リストを表示 ]

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

学習でロボットは賢くなるのか?[2]

学習でロボットは賢くなるのか?[2]
学習の目的と結果


関連
学習でロボットは賢くなるのか?[1]

 前回は、AIでいう学習というのはだいたいこんなもんですよ、みたいな話を書いた。それを受けて、学習の有用(?)な特性について語ってみる、ということを約束した。一応その線に沿って話を進めていくつもりなのだが、その前に、はっきりさせておいたほうが良いと思うことがひとつある。
 それは学習の目的である。

AIにおける学習の目的

 (AI用語でない)学習の目的を問われると、人間の場合、はたと困ることがある。留学のため語学を学習などというのは、わかりやすくて良いのだがどちらかと言えば少数派だろう。親や教師に言われてしかたなく、なんてあたりが普通のところだ。大学入試はひとつの目標ではあるが、社会人も学習している。意外なことではあるが、目的もなく学習したり勉強したりしていることも多い。学習そのものが目的化していると言うべきか。人間というのは、実は思いのほか学習が好きらしいのである。
 AIは学習が好きでも嫌いでもない。そしてAIの学習には目的がある。
 AIにおける「学習」の目的とは、「解」を求めることである。もう少し正確に言うと「近似解」を求めることだ。なぜならば、「学習」というのは近似解法のひとつだからである。ようするに、非常に乱暴な言い方をすればニュートン・ラフソン法なんかと仲間なわけである。非常に乱暴かつ不正確な言い回しではあるけれど。

 「学習」が近似解法のひとつである、というのは数学的にはあたりまえのことであるのだが、一般の感覚からすればちょっとした違和感を覚えずにはいられない。「学習で解き方を覚える」のであって「学習で問題を解く」とは普通は言わないからだ。微妙だがこの問題の根は意外と深い。普通の感覚からいくと、学習で理解するのは解を得る方法(たとえば近似解法自体もこの中に含まれる)であって、解そのものを求めることは目的になりにくいからからである。そういった意味で、AIの「学習」は一般で言う「学習」よりかなりクラスが下である。しかもAIは「学習」によって一般解すら求められない。得られるのは特定条件下の個別解だけだ。
 AIでいう「学習」に学習という単語をあててしまったのは、少し失敗だったのではないか? とFMは密かに思っている。AI研究の黎明期にはコンピュータパワーが現在にくらべて圧倒的に低かったので、この程度の「学習」をさせるのも一仕事だったという経緯はあるにせよ、もう少し高次の概念に当てて欲しかった、と思う。FMが、学習がキラいという最大の理由はコレである。

「学習」の近似解法としての評価

 「学習」は近似解法として、それなりの特徴を持っている。
最大の特徴は「初期状態で収束条件があやふやでもよい」ということだ。これは、かなり強力である。条件があやふやなのにどうやって解を求めるのか? という点に関して重要なのが教師信号である。「学習」は近似がスタートしてから教師信号によって条件を取り込むことができる。そして収束した時点をもって、本当に欲しかった収束条件のほうを得る、ということもできる。ようするに、何だかよくわからない問題に対して、とりあえず何だかわからないことをやってみる、という、まったくもって、何だかわからないことができるのである。
 ただ、「できる」というのと「役に立つ」というのは、また別問題だ。初期の「人工知能」のような何だかわからないものに対しては、たしかに学習は有効(というより他にはほとんど方法がない)だが、ある程度、研究が進んだあとのコンピュータ・チェスのようなものに対しては計算コストがかかるばかりでメリットは少ない。世界最強のチェスコンピュータDeep Blueが「学習」しないのにはわけがあるのである。


ロボットにおける「解」とは何か?

 「学習」の目的は「解」を求めることだと書いたが、ロボットのAIにおいて求められた「解」は、通常、「解」としての扱いを受けずに隠蔽されてしまう。ロボットは初期状態においてもっとも自由度の高い遷移状態系列を持つが、学習によって条件に不適合な状態を排除していって、最終的に条件に合致する最適な状態遷移系列が残る。これが「解」なのだが、これに対する人間の評価はおおむねこんな感じである。

 産業用ロボットなら、無駄な動きがなくなって、やっと仕事を覚えた。

 エンターテインメントロボットなら、最近、ばかなことをしなくなって、ちょっとつまらない。


 学習によって最適化された状態遷移系列は必ず初期値よりも小さくなるので、飽きるというのは、実は「学習」の仕様でもある。
 「仕様ですから」と言ってしまえば良かったのだろうが、SONYはMicrosoftではなかったらしく、状態遷移系列を小さくするのではなく、大きくする方向にむかった。
 環境の構造を反映した内部モデルの自己組織化とか言ったりするのだが、本当はこういうのを学習と呼んで欲しかったわけなのだな。FM的には。
 (なぜか、まだつづく)

まとめ
学習は近似解法のひとつである。
学習は何だかよくわからないものに対して何かしたいときに使える。
Deep Blueは学習しない。
一般論かと思って読んでいたら、最後に、やっぱりQRIO。
スポンサーサイト

コメント

『這えば立て、立てば歩めの親心』

一生是勉強ダス

  • 2005/05/29(日) 22:54:50 |
  • URL |
  • 人形つかい #JalddpaA
  • [ 編集]

『親心あれば下心』

生涯学習は良いとしても、問題は『動機』だ。
ロボットにはホメオスタシスがないので『動機』の素直な定義の仕方がわからないぃぃ。

コメントの投稿

管理者にだけ表示を許可する

トラックバック

トラックバックURLはこちら
http://febmarch.blog10.fc2.com/tb.php/10-4153f83d
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。