対話システム

ユーザの理解状態に応じた対話制御

対話システムと会話するということを考えると,ついついちゃんとした質問を投げかけなければいけないと思ってしまうのではないでしょうか.現状の対話システムは確かにそのようなものが少なくありません.しかし,システムが話す番になって,ユーザが聞き手となっている場合には,ユーザはかしこまった質問を投げかける必要はなくなります.では,そんなときユーザは黙って聞いていなければいけないのでしょうか?システムが言ってることがよくわからなくても,(気を使って)最後まで話を聞いてあげる?それも逆に堅苦しいですね.そんな疑問に応えるべく,動画に示した対話システムを開発しました.

システムは,レストランの位置を説明していますが,たまにユーザが分からない表現を使っています.わざと難しく言っているわけではなくて,その表現をユーザが知っていれば簡潔に説明できるため,全体として会話が効率的に進むからです.でもこの場合は運悪くユーザがその表現を知らなかったので,それを疑問口調で繰り返すことで分からなかったことをアピールしています.システムはその口調を認識して,ユーザの理解状態を正しく把握し,別の分かりやすい表現(分かりやすいけど若干まわりくどい表現)を使って会話を進めています.

通信ミドルウェアMONEA

modules対話システム,特に音声を用いてやりとりをする音声対話システムは,どんなに簡単なものであっても,音声認識,音声合成,対話制御といったモジュールから成っています.実は,それぞれのモジュールで行っている処理ですら,非常に複雑なものとなっています.そのため,通常,対話システムや会話ロボットなどを制御するためのソフトウェアは,単体のプログラムで実現されることはほとんどなく,複数のモジュールが別々のプログラムとして実現され,モジュール間通信によって情報をやりとりすることでその機能を果たしています.

対話システムや会話ロボットは,まだまだ発展途上の段階です.そのため,それらを実現するためのソフトウェアは,修正・改造が頻繁に行われるだけでなく,新しい技術を実装した新しいソフトウェアが次々と開発されていきます.このようなことから,研究開発に適したモジュール間通信は,導入が簡単で,導入によってソフトウェアの性能(特に実行速度)に大きな影響を与えず,様々な開発環境への導入が可能であること,などが必要だと考えました.この状況のもと,対話システム・会話ロボットのためのモジュール間通信ミドルウェアMONEA(Message Oriented NEtworked robot Architecture)を開発しました.

MONEAは,XMLで定義された内容にしたがって,情報を公開したり,処理要求を受け付けることができます.モジュール開発者は,公開したい情報を書き出したり,受け付けた要求を処理する部分をプログラムに書くことで,簡単にモジュール間通信を導入することができるのです.実際の情報や要求のやり取りはTCP/IP通信によって実現されていますが,その部分はMONEAミドルウェアの中に隠蔽されているので,複雑な手続きを意識する必要はありません.また,モジュール同士のネゴシエーションもP2P技術を応用したMONEAの機能の一部として提供されるので,どのモジュールがどのコンピュータ上で実行されているかなどを意識する必要がなく,実行環境が変わっても問題ありません.さらに,MONEAにはC/C++,Java,C#の実装があります.それぞれのモジュールの開発環境にあわせた,柔軟な運用が可能となっています.

 関連する研究業績

  • S. Fujie, R. Miyake, and T. Kobayashi, “Spoken dialogue system using recognition of user’s feedback for rhythmic dialogue,” Proc. Int’l Conf on Speech Prosody, SP2006, OS2-4, Dresden, Germany, May 2006. [PDF]
  • 中野鐵兵,藤江真也,小林哲則,”MONEA: 効率的多機能ロボット開発環境を実現するメッセージ指向ネットワークロボットアーキテクチャ,” 日本ロボット学会誌, vol.24, no.4, pp.543-553, May 2006. [J-Stage]

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA: *