クレタ人の踵

AIならびにRobotに関する雑記。 世迷言など。

クレタ人の踵aibo Owner's WEBRINGに参加してます。
【ID:120 所有者:FebruaryMarch
[ 二つ前へもどる | 前へもどる | 次へ | 次の次へ ]
[ 前の5サイトを表示 | 次の5サイトを表示 | ランダムで移動 | リストを表示 ]

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

MINDYはQRIOを救えるか?[3]

MINDYはQRIOを救えるか?[3]
研究者のサロンの中でQRIOは夢を見るか?


関連
MINDYはQRIOを救えるか?[1]
MINDYはQRIOを救えるか?[2]


 煽りモノがずいぶん続いたので、少しマジメに論評する。
 FMはインテリジェンス・ダイナミクス2005には行っていないので、ネット上の情報からの推測でいろいろ書かせてもらうことにする。特に以下の記事を参考にさせていただいた。

http://pc.watch.impress.co.jp/docs/2005/0422/kyokai35.htm
http://www.itmedia.co.jp/lifestyle/articles/0504/10/news002.html

 もちろん、このブログに書いていることに問題があったとしても、上記の筆者の方々には、何の責任もないことを明記しておく。ようはFMがサボったのが悪いのだ。文句はFMに言って下さい。

QRIOのデモ

 行動モデルの生成が中心のようである。QRIOをエージェントとして使う以上はやむをえない所もあるのだが、環境モデリングについてのデモはなかったようである(ただし、IDEAを使用した環境モデリング実験はあったようだ)。
 QRIOはもともと行動制御に必要な最小限のセンサーしか積んでいないため、QRIO単体で環境モデルを構築するのは(外部のCPUパワーを使っても)かなり無理がある。この部分は、FMにとっても気になるところだったので、MINDYの提唱モデルについての記述(大本営発表)を何回か読んだが、一応、提唱モデルでは環境モデリングはやることになっているようで、少しだけ安心した。
 これ以外にも、ところどころ、デモとMINDY提唱モデルとの微妙な差異が感じられるのは、気になるところではある。もっとも、研究は始まったばかりなのであり、このあたりのすり合わせは、今後双方でなされていくことになるのだろうと(勝手に)期待している。

IDEAのデモ

 IDEAは、ぶっちゃけ、IBMから買ってきたコンピュータなので、本体はどうでもよい。画像処理を並行で走らせて環境モデルを構築するデモが行われていたようだ。
 環境モデルを構築していたというのはFMの勘違いだったようです。人形つかいさん情報ありがとう。そんなわけで、以下の数行はインテリジェンス・ダイナミクス2005とは、まったく関係なくなりましたが、書いていることは間違っていないハズなのでそのままにしておきます。
 ただ、マルチポイントイメージによる環境モデリングはパッケージングの問題で通常のエージェントでは使えない(双頭の悪魔みたいなメタファーを使うのなら別だが)ので興味は半減である。
 モノイメージをフィジカルセンサーで補償するタイプが妥当な線かと思うが、現行QRIOでは十分なフィジカルセンサーを持ち合わせていないので、難しいところである。もちろん、その場合には、クラスの異なる知識データを統合しなければならず、環境モデラーの負荷は、マルチポイントイメージの比ではない。


新しい音声認識(モノマネ?)

 FM的には、実はこれが一番の収穫かなとも思う。モノマネについては、まぁ、このさい、どうでもよい(よくないか)。このデモでは通常の音声認識よりも情報の粒度(granularity)が小さくなっている。本当は小さくなるだけでなくて、粒度の変更ができるようになると良いのだが、ともかく情報粒度の変更の方向に研究がシフトしたのはありがたい。
 このあたりの話は、回を改めて詳しく書きたいな、と勝手に思っている。

保育所入所

 発達心理学の中で言われていることだが、ひとり遊びから共同遊びへの移行の時期があるという(実は中間に平行遊び期間があるがメンドくさいのでパス)。QRIOの見かけレベルは「ひとり遊び」状態なので、これを「共同遊び」レベルまで持っていきたいということだろう。そのためのデータ取りかな、と思う。
 ただ、FMの読んだ本が悪かったのか、あるいはFMの理解度が低いせいなのか、この発達心理学というやつ、実際の子育てには役に立たないことが多い。あまり重要視するのはどうかと思う。
 地域によって子育てというのはかなり異なる部分もある。アメリカでデータ取りするのが無意味だとまでは言わない。しかし、制度上の問題等いろいろあるにせよ、どうせやるなら、日本の保育所でもデータ取りはやっておいたほうが良いと思う。
 あと、集団のデータも大切だが、一個体にフォーカスしてじっくり観察すると、いろいろ見えてくることもある。研究者の方々も自宅に帰って自分の子供をじっくり見てみることを「強く」お奨めする。

 かけ足で、ざっと流したが、やはり消化不足である。
 個々のテーマについては、回を新たに取り上げてみたいと思っている。

まとめ
瞼や口なんて飾りです。エライ人にはそれがわからんのです。
QRIOに必要なのは指先(の触感)。
ロボットとばかり遊んでいないで、ちゃんと子供と遊ばないと、良いお父さんやお母さんになれません。
FMは約束だけは守る男だが、内容までは保証しない。
スポンサーサイト

コメント

マブタ

いい加減に「緑色は機嫌が良い」「ピンクはボールに興味が出ている」という「色による感情の表現」からの卒業に向かったと言う事で、マブタのQRIOは重要視しとります。
乳幼児には、こうでもしないと何も伝わらないし、ただスピーカから音が出ただけではQRIOが発生した事さえ伝わらないからでしょう。(そういう意味では、クチパク出来ないQRIOはAIBOより退化していたから、ようやく元に戻っただけ)と思うデス。
画像処理のDEMOは、単に複数の画像認識ライブラリーをOPEN-R+MPIで並行処理+統合ができます。というOPEN-Rが分散処理に動的に?対応できると言うことだけで、環境のモデリングなんか入ってません。

  • 2005/05/20(金) 22:32:27 |
  • URL |
  • 人形つかい #JalddpaA
  • [ 編集]

マブタとクチは....
もともとQRIO(というかAIBOも)は、情報発信偏重型のエージェントなんで、もうこれ以上アウトプットはいいよぉ、みたいなつもりで書いたです。
ああ、こういう書き方だとまた誤解が......

AIBOもQRIOも、何も見ないは、人の話聞かないはの困ったチャンです。インプットが少なすぎです。
ということが言いたかったです。


IDEAの件は~
無理やりイイトコ探そうとして自爆したようです。情報サンクス。
で、実際、他のデモ含めて環境モデラーの実演てホントになかったの?

...
...
...


(引っ掛けられそうなのこれしかなかったんだが)

...
...
...

(;_;)泣かないもんっ。FM、男の子だから。ぜったい、泣かないもん。

FMさん今のAIBOは結構聞きますし見てますよ。不特定話者対応の音声認識ではダントツではないでしょうか。家庭内の雑音にも強いし(そのかわりマッチングが甘めで「聞き間違い」する傾向は210の頃から大きくは改善されていないが、程よいボケぶりです。)
顔認識以外にも「手を振っている」とかでもちゃんと反応します。

普通のQRIOのDEMOで、キョロキョロしながら、その場で歩行可能エリアのMAPを構成しながら、幅が狭いところは横歩きで通る なんていうDEMOはあったと思います。IDSとは関係の無い普通のDEMOです。

HMM+SOMによる「ききまね」はその学習(訓練)時に唯一IDEAをフルパワーで1日から2日使用するようで、(MINDYはDELLのPC1台で十分のようでした)DEMOをみた時、昔のgAIの画像認識の話を思い出して、久々にFMさんを「起こしに来た」わけです。
次はビジョンとモーションに応用するらしいですが、私としては、単音素のものまねから「言語」の獲得まで上がってきて欲しいです。(人間だって進化的発生的に「仕込み」の能力を使っていそうなので、逃げ道はありますよね)

  • 2005/05/21(土) 09:07:27 |
  • URL |
  • 人形つかい #JalddpaA
  • [ 編集]

情報ありがとう

 そうですね。本来、宣伝したほうが良いところをなかなかしませんからSONY、奥ゆかしいと言っておきましょう。

 結局、コメント欄では、なかなかうまく伝えられないんですが、今のロボットと人間ののコミュニケーションって情報粒度がうまく合っていない。
 あー、プログラムの粒度じゃなくて情報粒度って使ってるの、もしかしたら私ぐらいかもしれないんだよな。その説明もしなきゃいけないし....

 えーい、乗りかかった泥舟、最後までやりますとも(笑)
 というわけで、本編に期待だ。(いつになるかはわからないけど)

 QRIOの普通のデモ、かなり前から言われてたMAP機能ですね。何も無いよりましですけど、やはり寂しいです。
 正直、もったいないんですけどねQRIO、埋もれさせてしまうのは。
 「あれは、いいものだー」

 はい、アレはCPUパワー使うでしょうねぇ。ただ、人間の場合でも「最初」はエラいパワー食うんですよね。「苦節●十年」とか。
 速度的にはHMM+SOM使ってるところにも問題はあるんだが、あんまり他人の仕事あーだ、こーだ言える立場じゃないし(言ってるけど)。
単音節から言語まであげるには、何回か情報粒度変更の壁を超えなければいけません。昔、抽象化って言ってたんですが、抽象化だと階層構造しかとれないので、ネットワークモデルに対応できない。そこで、(個人的に)情報粒度と呼んでいるのですけど。
 で、人間のすごいところは、自力で情報粒度下げられるんですよね。他言語習得、って実は、この部分がたいへん難しい。

 うぉぉ、ネタばれの嵐だし。なんか、さっきからコメント欄、チャット状態になってるじゃん(しかも二人チャット)。

 正直、どうする?(笑)

コメントの投稿

管理者にだけ表示を許可する

トラックバック

トラックバックURLはこちら
http://febmarch.blog10.fc2.com/tb.php/7-ede17056
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。