JP2849342B2 - 対話活性化装置 - Google Patents

対話活性化装置

Info

Publication number
JP2849342B2
JP2849342B2 JP6279446A JP27944694A JP2849342B2 JP 2849342 B2 JP2849342 B2 JP 2849342B2 JP 6279446 A JP6279446 A JP 6279446A JP 27944694 A JP27944694 A JP 27944694A JP 2849342 B2 JP2849342 B2 JP 2849342B2
Authority
JP
Japan
Prior art keywords
topic
speaker
information
word
utterance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP6279446A
Other languages
English (en)
Other versions
JPH08137875A (ja
Inventor
一志 西本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ei Tei Aaru Tsushin Shisutemu Kenkyusho Kk
Original Assignee
Ei Tei Aaru Tsushin Shisutemu Kenkyusho Kk
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ei Tei Aaru Tsushin Shisutemu Kenkyusho Kk filed Critical Ei Tei Aaru Tsushin Shisutemu Kenkyusho Kk
Priority to JP6279446A priority Critical patent/JP2849342B2/ja
Publication of JPH08137875A publication Critical patent/JPH08137875A/ja
Application granted granted Critical
Publication of JP2849342B2 publication Critical patent/JP2849342B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、対話活性化装置に関
し、特に、複数の話者間での対話を活性化することがで
きるような対話活性化装置に関する。
【0002】
【従来の技術および発明が解決しようとする課題】従来
においては、複数の人々の間で対話が行なわれている場
合に、その対話を活性化できるような装置は存在しなか
った。
【0003】一方、近年バーチャルリアリティ技術を応
用した臨場感通信会議システムの研究が行なわれてい
る。この臨場感会議システムは、3次元コンピュータグ
ラフィックスによって生成される仮想空間を会議の
「場」として提供することにより、従来のTV会議シス
テムのような単なる音声・映像の認識にとどまらず、実
空間に存在する人物に仮想空間の人物の雰囲気を伝える
ことや、また仮想物体を互いに遠隔地にいる会議参加者
が操作することによる高度な協調作業を可能とているも
のである。
【0004】そして、この臨場感会議システムを「発想
の場」としてより高度に応用するための研究も進められ
ており、そのような応用の1つとして、その発想の場で
画期的な発想を得るためのきっかけを得るようなものが
望まれている。その例として、発想支援システムという
ものが研究されている。
【0005】ところで、このような発想支援システムが
複数の人々の間で行なえる対話に対して適用されるため
には、その対話を実時間で処理する必要がある。しかし
ながら、そのような対話の処理、たとえば話題転換およ
び話題の同定を行なえるような技術は従来においてなか
った。
【0006】以上のことをまとめると、従来において
は、複数の人々の間で行なわれる対話を活性化できるよ
うな技術は存在しなかった。
【0007】ゆえに、本発明の目的は、複数の人々の間
で行なわれる対話を活性化することができるような対話
活性化装置を提供することである。
【0008】
【課題を解決するための手段】の発明にる対話活性
化装置は、データベースと、話者監視手段と、話者履歴
記録手段とを備える。データベースは、話者に提示され
るべき情報を蓄積する。話者監視手段は、いずれの話者
が発話しているかを監視する。話者履歴記録手段は、話
者監視手段の監視結果に基づいて発話した話者の履歴を
記録し、かつ、履歴に基づいて発話頻度が他の話者の発
話頻度よりも少ない不活発話者を検出したとき、データ
ベースから情報を読出して話者に提示する。
【0009】好ましくは、上記話者監視手段はさらに話
題を同定する。上記対話活性化装置はさらに、想起情報
抽出手段を備える。想起情報抽出手段は、話者監視手段
により同定された話題から連想される事項を想起する。
上記話者履歴記録手段は、不活発話者を検出したとき、
想起情報抽出手段により想起された事項に基づいてデー
タベースから情報を読出して話者に提示する。
【0010】好ましくは、上記対話活性化装置はさら
に、興味データベースを備える。興味データベースは、
各話者が興味を有する事項を蓄積する。上記話者履歴記
録手段は、興味データベースに蓄積された事項のうち不
活発話者が興味を有する事項に基づいてデータベースか
ら情報を読出して話者に提示する。
【0011】この発明によるもう1つの対話活性化装置
は、データベースと、時間監視手段と、時間記録手段と
を備える。データベースは、話者に提示されるべき情報
を蓄積する。時間監視手段は、話者の発話開始時刻およ
び発話終了時刻を監視する。時間記録手段は、時間監視
手段の監視結果に基づいて発話開始時刻および発話終了
時刻を記録し、かつ、前回の発話終了時刻から今回の発
話開始時刻までの時間が所定の時間よりも長い無発話期
間を検出したとき、データベースから情報を読出して話
者に提示する。
【0012】好ましくは、上記時間監視手段はさらに話
題を同定する。上記対話活性化装置はさらに、想起情報
抽出手段を備える。想起情報抽出手段は、時間監視手段
により同定された話題から連想される事項を想起する。
上記時間記録手段は、無発話期間を検出したとき、想起
情報抽出手段により想起された事項に基づいてデータベ
ースから情報を読出して話者に提示する。
【0013】この発明によるさらにもう1つの対話活性
化装置は、データベースと、話題転換検出手段と、話題
膠着監視手段とを備える。データベースは、話者に提示
されるべき情報を蓄積する。話題転換検出手段は、話題
の転換を検出する。話題膠着監視手段は、話題転換検出
手段の検出結果に基づいて話題が膠着しているか否かを
監視し、かつ、話題の膠着を検出したとき、データベー
スから情報を読出して話者に提示する。 好ましくは、上
記話題転換検出手段はさらに話題を同定する。上記対話
活性化装置はさらに、想起情報抽出手段を備える。想起
情報抽出手段は、話題転換検出手段により同定された話
題から連想される事項を想起する。上記話題膠着監視手
段は、話題の膠着を検出したとき、想起情報抽出手段に
より想起された事項に基づいてデータベースから情報を
読出して話者に提示する。
【0014】
【0015】
【作用】 の発明にる対話活性化装置は、いずれの話
者が発話しているかを監視し、その監視した話者の履歴
を記録するとともに、その履歴に現われることの少ない
話者が存在することに応じてその話者が発話するような
データを提示して、複数の話者間での対話を活性化する
ことができる。
【0016】好ましくは、上記対話活性化装置は、そ
履歴に現われることの少ない話者が発話するような興味
に偏ったデータを提示して、複数の話者の対話を活性化
することができる。
【0017】の発明にもう1つの対話活性化装置
は、それぞれの話者が発話しているその開始時刻とその
終了時刻とを監視して抽出し、そしてその発話の開始時
刻および終了時刻を記録紙、前回発話の終了時刻から今
回発話の開始時刻間の時間が大きくなることに応じてた
とえば沈黙期間を減らすような対話を活性化するために
必要なデータを提示し、複数の話者間での対話を活性化
することができる。
【0018】の発明にさらにもう1つの対話活性
化装置は、対話内における話題転換の有無を検出し、そ
の検出結果に応じて対話内における話題の膠着を監視
し、その監視結果に応じて対話を活性化するために必要
なデータを提示して、複数の話者間での対話を活性化す
ることができる。
【0019】好ましくは、上記対話活性化装置は、話
を同定し、同定結果から連想されるデータを提示して、
複数の話者間での対話を発散させて活性化することがで
きる。
【0020】
【実施例】図1は、この発明の第1の実施例による対話
活性化装置の概略ブロック図である。
【0021】図1を参照して、人々の間で行なわれる対
話を活性化する対話活性化装置501は、ユーザインタ
ーフェース503と、話者監視装置505と、話者履歴
部507と、データベース部509とを含む。
【0022】ユーザインターフェース503には、各話
者の発話が入力される。話者監視装置505は、いずれ
の話者が発話をしているかを監視する。その監視結果が
話者履歴部507に与えられる。話者履歴部507は、
話者監視装置505の監視結果である話者の履歴を記録
する。たとえば、話者がA,BおよびCいたとすれば、
ABCACAACCのようにその話者の履歴を記録す
る。
【0023】ここで、話者履歴部507に記録された話
者の履歴には、話者Bが一度記録された後には記録され
ていない。したがって、話者A,B,Cの中には、話者
Bのように対話に参加していないような話者が存在す
る。この場合、話者履歴部507は、データベース50
9から話者Bが対話に参加するような対話を活性化する
データをユーザインターフェース503から話者達に提
供できるように指示する。このように、データベース部
509から対話を活性化するためのデータが出力される
ために、データベース部509は種々のデータを蓄積し
ている。このデータベース部509は、一般的なデータ
ベースが用いられればよい。
【0024】このようにして、いずれの話者が発話して
いるかを監視することで、対話に参加していないような
話者を検出でき、その参加していないような話者が発話
できるようなデータが提示されて、対話が活性化され
る。
【0025】図2は、この発明の第2の実施例による対
話活性化装置の概略ブロック図である。
【0026】図2を参照して、対話活性化装置551
は、図1に示した実施例の構成に加えて、新たな構成が
付加されている。すなわち、対話活性化装置551は、
ユーザインターフェース503、話者監視装置505、
話者履歴部507およびデータベース部509に加え
て、興味データベース553を備えている。
【0027】この興味データベース553は、対話を行
なっている話者がA、B、Cであれば、話者Aが興味を
有していることがらについてのデータを記憶し、同様に
話者BおよびCのそれぞれの興味のあるデータを保持し
ている。
【0028】これによって、話者履歴部507からたと
えば前述のように話者Bが発話していないような情報が
興味データベース553に与えられ、興味データベース
553からは話者Bが興味を有しているデータがデータ
ベース部509に与えられる。したがって、データベー
ス部509は、話者履歴部507が出力する不活性な話
者の興味に関する情報を興味データベース553から獲
得し、これを使用することによってユーザインターフェ
ース503を介して話者Bの興味に偏ったデータを提示
することができる。
【0029】これにより、話者Bは自分の興味に関する
話題について発話でき、対話の活性化が行なわれる。
【0030】図3は、この発明の第3の実施例による対
話活性化装置の概略ブロック図である。
【0031】図3を参照して、対話活性化装置601
は、ユーザインターフェース603と、発話推移時間監
視装置605と、発話推移時間当りカウント装置607
と、データベース部609とを含む。
【0032】ユーザインターフェース603には各話者
の発話が与えられる。そして、発話推移時間監視装置6
05は、各発話の開始時刻および終了時刻を監視する。
これによって、各発話が発せられている間の推移時間が
監視される。この推移時間が発話推移時間当りカウント
装置607に与えられる。
【0033】発話推移時間当りカウント装置607は、
各発話の開始時刻および終了時刻を記録し、前回発話の
終了時刻から今回発話の開始時刻間の時間をカウントす
る。このように前回発話の終了時刻から今回発話の開始
時刻間の時間が大きい場合には、話題があまりないか、
あるいは一通り現在の話題に対する対話が収束してしま
った状態になっているものと思われる。したがって、発
話推移時間当りカウント装置607は、このように前回
発話の終了時刻から今回発話の開始時刻間の時間間隔が
大きい場合に、データベース部609から対話を活性化
するために必要なデータをユーザインターフェース60
3を介して話者に提示させる。
【0034】これにより、対話が非活性状態にあること
が時間的情報から検出され、その検出結果に基づき何ら
かのデータが話者に提示される。話者はこの提示された
データによって触発され、新たな話題が得られることに
よって以後の対話が活性化される。
【0035】図4は、この発明の第4の実施例による対
話活性化装置の概略ブロック図である。
【0036】図4を参照して、対話活性化装置651
は、ユーザインターフェース653と、対話処理部1
と、話題膠着監視装置657と、データベース部659
とを含む。
【0037】ユーザインターフェース653には各話者
の発話が入力される。そして、さらに各発話は対話処理
部1に与えられる。対話処理部1は後で説明するような
処理を行ない、話題の転換の有無を検出する。そして、
話題膠着監視装置657は、与えられた話題転換の有無
によって話題が膠着しているか否かを監視する。話題膠
着監視装置657は、話題が膠着していると判断する場
合には、データベース部659からユーザインターフェ
ース653を介して話題膠着を解消するようなデータを
話者に提示させる。
【0038】図4に示す対話処理部1は、特に話題転換
の有無を実時間で行なえる。したがって、データベース
部659からユーザインターフェース653を介して与
えられるデータは、ほぼ実時間で話者に提供される。以
下、対話処理部1について詳しく説明する。
【0039】図5は、図4の対話処理部の内部構成を示
した概略ブロック図である。図5を参照して、人々の間
で行なわれる対話を処理する対話処理部1は、対話入力
部3と、形態素解析部5と、話題転換要因抽出部7と、
話題候補語抽出部9と、解析情報統計処理部11と、単
語の話題転換寄与指数演算部13と、話題転換尤度評価
部15とを含む。
【0040】対話入力部3は、対話を行なっている人々
のそれぞれの発話を対話処理部1本体に入力する。対話
入力部3は、テキスト入力装置19で構成される。テキ
スト入力装置19は、人々の発話内容をテキスト形式で
装置本体に入力する。たとえば、テキスト入力装置19
が音声認識装置で構成された場合には、人々のうちの話
者の音声による発話に対して音声認識を行ない、その発
話内容をテキスト形式に変換して形態素解析部5に出力
する。また、テキスト入力装置19には、キーボードな
どが用いられてもよく、用いられたキーボードによって
話者の発話内容がテキスト形式に変換されて形態素解析
部5に与えられてもよい。さらに、テキスト入力装置1
9は、人々の間で行なわれる手話や点字に対しての対話
の発話内容を入力してもよい。
【0041】形態素解析部5は、単語辞書21を有して
いる。そして、単語辞書21を用いて、形態素解析部5
は、対話入力部3でテキスト化された発話文を単語に分
解する。その後、形態素解析部5は、分解された単語の
品詞を決定する。そして、形態素解析部5は、単語品詞
リストを話題転換要因抽出部7、話題候補語抽出部9お
よび解析情報統計処理部11に与える。
【0042】話題転換要因抽出部7は、予め定められた
話題転換要因規則22を知識として有している。そし
て、形態素解析部5が決定した単語の品詞に転換要因規
則22を利用して、話題転換を発生させやすい単語の検
出を行なう。たとえば、そのような単語としては、クル
ーワード(話変わって、ところで、など)、疑問文、ま
たは相手を特定する語もしくは言回しなどが挙げられ
る。そして、話題転換要因抽出部7は、たとえばクルー
ワードの有無を話題転換尤度評価部15に与える。
【0043】話題候補語抽出部9は話題化規則23を知
識として有している。そして、形態素解析部5が決定し
た単語の品詞にその話題化規則23が適用されて、規則
に当てはまる構文が発話中から検出される。そして、検
出が行なわれたことで、その構文を指示する話題候補が
得られ、話題候補語リストが解析情報統計処理部11に
出力される。
【0044】解析情報統計処理部11は、形態素解析部
5、話題候補語抽出部9、後で説明する単語の話題転換
寄与数演算部13、および後で説明する話題転換尤度評
価部15で得られる情報を基に、統計処理を行なう。そ
して、統計処理後に得られる各話題候補語の転換寄与指
数および話題候補語の数/有無を話題転換尤度評価部1
5に与える。
【0045】単語の話題転換寄与指数演算部13は、解
析情報統計処理部11で得られる、入力された名詞の出
現回数、最も最近にその語が使用されてからの経過時間
に基づいて、所定の方法によってその語の話題転換寄与
指数を演算して解析情報統計処理部11に出力する。
【0046】話題転換尤度評価部15は、解析情報統計
処理部11が統計処理することで得られた話題候補語の
数/有無および各話題候補語の転換寄与指数と、話題転
換要因抽出部7で得られたたとえばクルーワードの有無
に基づいて、現在の発話において話題転換が発生してい
るかどうかを評価する。そして、その評価結果によって
話題転換の有無25が得られる。また、話題転換したか
否かは、解析情報統計処理部11にも与えられる。
【0047】次に、動作について簡単に説明する。ま
ず、対話入力部3に入力された発話が、テキスト入力装
置19によってコンピュータ処理可能な形式(テキス
ト)に変換される。そして、変換されたテキストは形態
素解析部5に与えられる。
【0048】次に、形態素解析部5は、単語辞書21を
使用して、入力された発話を解析して単語に分解し、各
単語の品詞を決定する。解析結果である単語品詞リスト
は、話題転換要因抽出部7、話題候補語抽出部9および
解析情報統計処理部11に与えられる。
【0049】次に、話題転換要因抽出部7は、形態素解
析部5の解析結果中に話題の転換を促す語(句)が現れ
ているかどうかを話題転換要因規則22に従ってチェッ
クする。そのような語(句)が検出されれば、話題転換
要因抽出部7は解析情報統計処理部11に通知する。
【0050】話題候補語抽出部9は、形態素解析部5の
解析結果に話題化規則23を適用し、規則に一致する構
文が発見されれば、その構文が指示する話題候補語を抽
出して、解析情報統計処理部11に与える。
【0051】解析情報統計処理部11は、対話入力部
3、形態素解析部5、話題転換要因抽出部7、話題候補
抽出部9から入力される情報に基づき、単語/文/発話
単位に各量の統計を取る。また、形態素解析部5および
話題候補語抽出部9のそれぞれから名詞および話題候補
語が入力されて、その後の出現回数と、初出語でない場
合は前回に出現してからの経過時間を単語の話題転換寄
与指数演算部13に与える。そして、単語の話題転換寄
与指数演算部13の演算結果を受取って、その値も統計
処理する。
【0052】単語の話題転換寄与指数演算部13は、解
析情報統計処理部11から入力されるある語の出現回数
と前回に出現してからの経過時間を用いて、その語が話
題の転換発生に寄与する度合を計算し、結果を解析情報
統計処理部11に与える。
【0053】話題転換尤度評価部15は、解析情報統計
処理部11からたとえば話題転換候補語の数/有無や各
話題候補語の転換寄与指数のような各種の統計情報、話
題転換要因抽出部7から与えられるたとえばクルーワー
ドの有無のような話題転換要因に基づき、所定の評価手
法によって現在の発話において話題転換があったかどう
かを評価する。その評価結果は、解析情報統計処理部1
1に与えられる。また、話題転換尤度評価部15は、話
題の転換の有無を話題膠着監視装置657に通知する。
【0054】このような対話処理部1によって、目的指
向型の対話のみならず、特に目的を持たない自由展開型
の対話に適用可能である話題転換の有無が検出される。
また、モデルや話題分野に応じた辞書などの対話の内容
に依存する部分が処理の中で存在しないため、どんな分
野の話題に対しても変更する必要のない装置が提供され
る。これは、対話の構造、内容の分野などが一切仮定さ
れず、話題の転換の検出が実際の人間から獲得されたヒ
ューリスティックなルールに基づいて行なわれているた
めである。さらに、話題転換の検出が時間遅れなく行な
われる。
【0055】図6は、この発明の第5の実施例による対
話活性化装置の概略ブロック図である。
【0056】図6を参照して、対話活性化装置701
は、ユーザインターフェース703と、対話処理部10
1と、話題膠着監視装置707と、データベース部70
9とを含む。
【0057】この実施例においては、特に対話処理部1
01とデータベース部709とが特徴とされる。すなわ
ち、対話処理部101は、ユーザインターフェース70
3を介して入力される発話をテキスト化し、その後単語
品詞リストを作成してデータベース部709に与える。
また、対話処理部101は、後で説明する処理を行なっ
て話題の同定と話題転換の有無とを決定し、それらを表
わす出力を話題膠着監視装置707に与える。
【0058】話題膠着監視装置707は、与えられた話
題と話題転換の有無とから話題が膠着しているかを監視
し、その監視結果をデータベース部709に与える。デ
ータベース部709は、後で説明する門外漢の役割を果
たすデータベースであり、話者の対話を発散させるよう
なデータをユーザインターフェース703から話者に提
示するためのものである。
【0059】以下、この実施例の特徴的な構成である対
話処理部101とデータベース部709について詳しく
説明する。
【0060】図7は、対話処理部の内部構成を示した概
略ブロック図である。図7を参照して、この対話処理部
101は、対話入力部103と、形態素解析部105
と、話題転換要因抽出部107と、話題候補語抽出部1
09と、解析情報統計処理部111と、単語の話題転換
寄与指数演算部113と、話題転換尤度評価部115
と、話題語同定部117とを含む。
【0061】図5に示した対話処理部1と異なる部分に
ついて特に説明する。対話入力部103は、テキスト入
力装置19に加え、話者監視装置119と、発話推移時
間監視装置121とを含む。話者監視装置119には、
人々の発話が入力されており、話者監視装置119は現
在の話者が誰であるかを監視して、その監視結果を示す
話者IDを解析情報統計処理部111に与える。発話推
移時間監視装置121には、人々の発話が入力されてお
り、発話推移時間監視装置121は発話行為に係る時間
情報を獲得する。そのような時間情報としては、現在の
発話の開始時刻と、現在の発話の終了時刻とが挙げられ
る。これらの情報は解析情報統計処理部111に与えら
れる。
【0062】次に、形態素解析部105は、単語辞書2
1に加え、対比語辞書123と、同義語辞書125とを
有する。したがって、形態素解析部105は、対比語辞
書123を用いて対比語(反意語)を検出する。同様
に、形態素解析部105は、同義語辞書125を用いて
同義語を検出する。そして、形態素解析部105の対比
語辞書123で得られた対比語リストは、解析情報統計
処理部111および後で説明する話題語同定部117に
与えられる。さらに、形態素解析部105の同義語辞書
125で得られた同義語リストは、話題転換要因抽出部
107および話題語同定部117に与えられる。
【0063】話題転換要因抽出部107は、話題転換要
因規則22を用いて、以下のような話題転換要因を抽出
して話題転換尤度評価部115に与える。すなわち、図
5の対話処理部1で示したクルーワードの有無のみなら
ず、疑問文か否か、相手特定語の有無、同義語の数/有
無、指示語の数/有無、接続詞の数/有無を話題転換尤
度評価部115に与える。クルーワードの有無、疑問文
か否か、相手特定語の有無、指示語の数/有無および接
続詞の数/有無は、単語辞書21によって与えられた単
語品詞リストから、得られる。同義語の数/有無は、同
義語辞書125から得られた同義語リストによって得ら
れる。
【0064】話題候補語抽出部109は、図5の話題候
補語抽出部9とほぼ同様であり、得られた話題候補語リ
ストを解析情報統計処理部111だけでなく、話題語同
定部117にも与える。
【0065】次に、解析情報統計処理部111は、図5
の解析情報統計処理部11よりも多くの統計処理結果を
得て、それを話題転換尤度評価部115に与える。ま
ず、与えられた単語品詞リストに従って、解析情報統計
処理部111は、話題候補語の数/有無、各話題候補語
の転換寄与指数だけでなく、初出語の数/有無、初出語
かつ話題候補語の数/有無、各初出語の転換寄与指数を
話題転換尤度評価部115に与える。また、対話入力部
103に話者監視装置119および発話推移時間監視装
置121が加わったこと、形態素解析部105に対比語
辞書123が加わったことに伴って、解析情報統計処理
部111は以下のような統計情報を得て話題転換尤度評
価部115に与える。
【0066】まず、形態素解析部105に対比語辞書1
23が加わったことに伴って、前文対比語の数/有無の
情報が得られ、それを話題転換尤度評価部115に与え
る。対話入力部103に話者監視装置119および発話
推移時間監視装置121が加わったことに伴って、解析
情報統計処理部111は、話者の交代の有無、前話題転
換からの経過時間、現発話者の前発話からの経過時間、
現発話の発話時間、および前発話終了から現発話開始ま
での時間に関する情報を得て、それを話題転換尤度評価
部115に与える。
【0067】次に、単語の話題転換寄与指数演算部11
3は、解析情報統計処理部111が話題転換尤度評価部
115に各話題候補の転換寄与指数だけでなく、各初出
語の転換寄与指数をも与えるため、この各初出語の転換
寄与指数を演算して求め解析情報統計処理部111に与
える。
【0068】次に、話題転換尤度評価部115は、話題
転換要因抽出部107から与えられた話題転換要因、解
析情報統計処理部111から与えられた統計処理結果の
情報を含めて評価し、話題転換したか否かを決定する。
【0069】次に、話題語同定部117は、話題転換尤
度評価部115が話題転換があると評価したことに応じ
て、形態素解析部105の対比語辞書123および同義
語辞書125によって得られた対比語リストおよび同義
語リストと、話題候補語抽出部109によって得られた
話題候補語リストとに従って、話題語を同定し、話題1
27を話題膠着監視装置707に与える。
【0070】このような新たな構成を加えた対話処理部
101では、図5に示す対話処理部1と同様に、話題転
換のほぼ実時間による検出が可能となる。さらに、新た
な構成によって以下のような効果が得られる。
【0071】まず、話者監視装置119によって、話者
指定による話題転換の発生のルールが適用可能となり、
転換検出精度が向上する。次に、発話推移時間監視装置
121によって、発話と発話の間の空きかたによる話題
転換の発生のルールが適用可能となり、転換検出精度が
向上する。次に、同義語辞書125および対比語辞書1
23の使用により、同義語および対比語による話題転換
のルールが適用可能となり、転換検出精度が向上する。
次に、話題語同定部117の追加によって、話題転換検
出時に転換した話題を表わす語の抽出が可能となる。
【0072】なお、話題語同定部117が同定した結果
が解析情報統計処理部111に与えられてもよい。そし
て与えられた話題語が何度話題化に寄与したかを示す話
題化回数が解析情報統計処理部111で統計処理されれ
ば、より話題転換検出精度が向上する。
【0073】次に、このような効果をもたらす対話処理
部101の動作について詳しく説明する。
【0074】まず、対話入力部103のテキスト入力装
置19は、入力された発話をコンピュータ処理可能な形
式(テキスト)に変換し、形態素解析部105の対比語
辞書123、単語辞書21および同義語辞書125に与
える。また、話者監視装置119によって現在の話者が
監視される。そして、発話推移時間監視装置121は、
発話行為にかかる推移時間情報を検出する。そして、話
者監視装置119の出力である検出結果(話者id)お
よび話者推移時間監視装置の検出結果が解析情報統計処
理部111に与えられる。
【0075】形態素解析装置105は、同義語辞書12
5および対比語辞書123を使用して、同義語および対
比語の検出を行なう。その検出された結果である同義語
リストは話題転換要因抽出部107および話題語同定部
117に与えられ、対比語リストは解析情報統計処理部
111および話題語同定部117に与えられる。
【0076】話題転換要因抽出部107は、図5の対話
処理部1で示したように形態素解析部105の単語辞書
21から与えられた単語品詞リストに従って、話題転換
要因として以下の情報を検出する。その以下の情報と
は、第1はクルーワードの有無であり、第2は疑問文か
否かであり、第3は相手特定語の有無であり、第4は同
義語(同語)の数/有無であり、第5は、指示語の数/
有無であり、第6は、接続詞の数/有無である。
【0077】第1のクルーワードとは、一般に明示的に
話題の転換を促す語(句)であり、その例としては、と
ころで、次に、話変わって、それから、後、等が挙げら
れる。このクルーワードの有無は、話題転換要因抽出部
107に与えられる単語品詞リストから、話題転換要因
規則22に記述されるクルーワードに相当する語が見つ
け出されることで得られる。
【0078】第2の疑問文か否かは、疑問文が出現した
場合に話題転換として認識されやすいという、実験に基
づくヒューリスティックなルールによって得られる情報
である。この疑問文か否かは、話題転換要因抽出部10
7に与えられる単語品詞リストから、話題転換要因規則
22に記述される疑問文に相当するかどうかが判断され
ることで得られる。
【0079】第3の相手特定語の有無は、対話に参加し
ている特定の人に向かって話しかける場合に話題転換と
して認識されやすいという、実験に基づくヒューリステ
ィックなルールによって得られる情報である。たとえ
ば、参加者の名前、人称代名詞が挙げられる。この相手
特定語の有無は、話題転換要因抽出部107に与えられ
る単語品詞リストから、話題転換要因規則22に記述さ
れる相手特定語に相当する語が取出されることで得られ
る。
【0080】第4の同義語の数/有無は、1発話または
1文中に同義語(同語)が出現する場合、それらの語は
強調されている(つまり話題を示す語である)と認識さ
れやすいという、実験に基づくヒューリスティックなル
ールによって得られる情報である。この同義語の数/有
無は、話題転換要因抽出部107に与えられる同義語リ
ストから同義語が取出されることで得られる。
【0081】第5の指示語の数/有無は、前発話に関す
る指示語が出現する発話は話題が継続しているものと認
識しやすいという実験に基づくヒューリスティックなル
ールによって得られる情報である。この指示語の数/有
無は、話題転換要因抽出部107に与えられる単語品詞
リストから指示語が取出されることで得られる。
【0082】第6の接続詞の数/有無は、前発話に対す
る接続詞が出現する発話は話題が継続しているものと認
識されやすいという実験に基づくヒューリスティックな
ルールによって得られる情報である。この接続詞の数/
有無は、話題転換要因抽出部107に与えられる単語品
詞リストから接続詞が取出されることで得られる。
【0083】次に、話題候補語抽出部109は、話題化
規則23によって話題候補語を抽出する。その話題規則
23としては、以下のようなものが挙げられる。
【0084】まず第1は、強調文の名詞が話題候補語と
される。強調文の例としては名詞+助動詞「だ」、また
は名詞+助動詞「で」が挙げられる。第2は、体言止め
の名詞が話題候補語とされる。たとえば、名詞+句
点「。」の構文の場合の名詞が話題候補語とされる。
【0085】第3は、名詞+格助詞+提題助詞の構文の
場合の名詞が話題候補語とされる。第4は、名詞+提題
助詞の構文の場合の名詞が話題候補語とされる。第5
は、名詞+副助詞+提題助詞の構文の場合の名詞が話題
候補語とされる。第6は、名詞+取立助詞の構文の場合
の名詞が話題候補語とされる。第7は、名詞+格助詞+
取立助詞の構文の場合の名詞が話題候補語とされる。
【0086】第8は、存在文の場合の名詞が話題候補語
される。存在文の例としては、名詞+格助詞「が」+あ
る(本動詞語幹)、名詞+格助詞「が」+い(本動詞語
幹)、または名詞+格助詞「が」+あ(本動詞語幹)の
構文が挙げられる。
【0087】第9は、名詞+副助詞+取立助詞の構文の
場合の名詞が話題候補語とされる。第10は、名詞+副
助詞「とか」の構文の場合の名詞が話題候補語とされ
る。
【0088】このような話題候補語をも入力される解析
情報統計処理部111は、以下のように管理表を作成し
て情報を管理する。
【0089】図8は、そのような管理を説明するための
第1の図であり、図9は、そのような管理を説明するた
めの第2の図であり、図10は、そのような管理を説明
するための第3の図である。
【0090】図8から図10を参照して、解析情報統計
処理部111は、図8の対話管理表201で管理する。
対話管理表201には、カレント・メタ情報203と、
話者情報205と、言語情報207と、文脈情報209
とが含まれる。カレント・メタ203には、発話番号、
文番号、発話内文番号および発話IDが含まれる。
【0091】話者情報205は、話者IDを添字とする
配列で示されている。たとえば、話者IDが0の情報に
は、最近発話文番号211と、最近発話時刻213と、
全発話回数215と、名前217とが情報として含まれ
る。このような話者情報に関しては後で具体的に説明す
る。
【0092】言語情報207には名詞要素リスト219
が含まれる。名詞要素リスト219は、図9に示すよう
に、見出し語221、出現回数223、ENTRY(対
比語)225と、話題化回数227と、話題認識回数2
29と、最新使用文番号231と、Left(左)23
3と、Right(右)235とが含まれる。見出し語
221は、シソーラス同義語情報により正規化されてい
る。ENTRY(対比語)225は、反対語を参照する
ために取入れられている。そして、名詞要素リスト21
9のLeft(左)233には、さらに名詞要素リスト
237が記録され、名詞要素リスト219のRight
(右)235には名詞要素リスト239が記録されてい
る。このように、左右の名詞要素リストが各名詞要素リ
ストに記録されることにより、ツリー構造が作られる。
これにより、検索が容易となる。このような、名詞要素
リストについては後で具体的に説明する。
【0093】次に、図8の対話管理表201に戻って、
対話管理表201の文脈情報209には、カレント情報
241と、短期発話メモリ(FIFO)243とが含ま
れる。カレント情報241には、最近転換文番号245
と、現在の話題247とが含まれる。
【0094】このようなカレント情報241以外のカレ
ント情報は、短期発話メモリ(FIFO)243に含ま
れており、短期発話メモリ(FIFO)243は、5つ
の発話情報によって形成されている。その1つの発話情
報249は、図10に示すように、発話番号251と、
発話者番号253と、文情報リスト255と、前発話情
報ポインタ257とを含む。そして、文情報255は、
文番号259と、発話内文番号261と、各種指標(ビ
ット表現)263と、有題文フラグ265と、チャート
(形態素情報ほか)267と、次の文情報269とを含
む。さらに、各種指標(ビット表現)263は、位置と
区分と内容とによって項分けされた情報271を含む。
このような、発話情報249および文情報255につい
ては後で説明する。
【0095】次に、表1から表4を用いて具体的に説明
する。
【0096】
【表1】
【0097】
【表2】
【0098】
【表3】
【0099】
【表4】
【0100】表1に示すような対話管理表が得られてい
るとする。すなわち、発話番号は13であり、文番号は
23であり、発話内文番号は1であり、話者IDは0の
情報が得られているとする。この情報は、以下のような
状態を示している。すなわち、話者ID.0(名前は黒
鉄)の人が喋っている状態は、ある基準から数えて13
番目の発話であり、同じ基準から数えて23番目の文で
あること、さらに、13番目の発話内おける1番目の文
であることを示している。
【0101】さらに、表2の話者情報によって、現在発
話を行なっている話者IDが0の人の前に発話を行なっ
た人は、話者IDが2の人であることが最近の文番号の
示す値からわかる。また、話者IDが0、1および2の
全員の全発話回数を加えれば、12であることより、表
1の対話管理表における発話番号が13であることも明
らかである。そして、表2の話者情報の各話者IDごと
の情報は、図8の話者情報205と対応している。
【0102】次に、表1の対話管理表の言語情報(名詞
要素リスト)は、具体的には表3に示されるような情報
である。表3の各見出し語に対応した情報が、図9の名
詞要素リスト219,237,239のそれぞれに対応
している。特に、話題化回数は、話題候補語抽出部10
9によって得られ、話題認識回数は、話題語同定部11
7によって得られる。
【0103】ところで、表3には単語評価値(%)が記
載されているが、図9の名詞要素リストにはそのような
記載はない。これは、単語の話題転換寄与指数演算部1
13で得られる話題転換寄与指数が解析情報統計処理部
111にフィードバックされてもまたはされなくてもよ
いことを示すためである。すなわち、表3で得られる名
詞要素リストの場合には、単語の話題転換寄与指数演算
部113からの話題転換寄与指数のフィードバックがあ
った場合であり、図9に示す名詞要素リストの場合には
単語の話題転換寄与指数演算部113からの話題転換寄
与指数がフィードバックされず、話題転換尤度評価部1
15に直接与えられた場合である。したがって、単語の
話題転換寄与指数演算部113の出力が解析情報統計処
理部111にフィードバックされない場合には、各話題
候補語の転換寄与指数および各初出語の転換寄与指数は
単語の話題転換寄与指数演算部113から話題転換尤度
評価部115に直接入力される。話題転換寄与指数のフ
ィードバックが必要な場合としては、話題転換寄与指数
を求める関数が漸化式で表現されており、以前の話題転
換寄与指数の値が現在の話題転換寄与指数の計算のため
に必要な場合などが挙げられる。次に、対話管理表の文
情報は、具体的には表4に示すような情報である。表4
に示す文脈情報は、発話情報と文情報に大きく分けて別
れている。
【0104】発話情報には、Uで表わされる発話番号
と、各発話の開始時刻および終了時刻と、転で表わされ
る話題が転換した文番号と、ワダイとが示されている。
発話番号U=9は、開始時刻が14時30分05秒であ
り、終了時刻は14時30分10秒である。発話番号U
=10の開始時刻は14時30分11秒であり、終了時
刻は14時30分20秒である。発話番号U=11の開
始時刻は14時30分22秒であり、終了時刻は14時
30分43秒である。発話番号U=12の開始時刻は1
4時30分44秒であり、終了時刻は14時30分46
秒である。そして、発話番号U=13の開始時刻は14
時30分51秒である。発話情報の最新の入力文は、話
題番号が13、話題転換の文番号が23、話題がお二人
となっており、表1の対話管理表に対応している。
【0105】文情報には、メタ情報と、各種指標(ビッ
ト表現)と、その他の情報が示される。メタ情報には、
表でSで表わされる文番号と、SUで表わされる発話内
の文番号が示されている。最新の入力文である文番号が
23、発話内の文番号が1となっており、表1の対話管
理表と対応している。
【0106】各種指標(ビット表現)には、後続要因、
前節要因、転換要因、判定が含まれる。後続要因には、
表でQで表わされる疑問文であるか否かを示す情報が示
されている。前節要因には、表でそれぞれ接、指、同、
対で表わされるように、接続詞、指示語、同義語、対比
語を示す情報が示されている。転換要因には、それぞれ
初、クル、初提、相、題で示される、初出語の有無、ク
ルーワードの有無、初出語でありかつ話題候補語である
語の有無、対話の相手を特定する語の有無、話題候補語
の有無を示す情報が示されている。
【0107】判定には、表で転で示す話題の転換があっ
たか否かを示す情報が示されている。発話推移時間監視
装置121がある場合には、ここに話題転換が発生した
発話の開始時刻が記録される。
【0108】このように表4で示される文脈情報のたと
えばメタ情報の文番号が16から21にかけての情報
が、図10の発話情報249に対応し、文脈情報の各1
行が図10の文脈情報255に対応する。
【0109】なお、図8から図9および表1から表2を
用いた解析情報統計処理部では、統計処理する必要のな
い情報も管理しているが、図7に示すように、解析情報
統計処理部111から出力する情報に関してのみ管理し
てもよい。
【0110】以上のように、解析情報統計処理部111
は、種々の情報を統計処理する。次に、このような統計
処理の結果得られる入力された単語の出現頻度および最
近出現してからの経過時間に従って、単語の話題転換寄
与指数演算部113は話題転換寄与指数を求める。
【0111】入力された単語の出現頻度をfで表わし、
最近出現してからの経過時間をtで表わすと、第(1)
式に示すような関数によって寄与指数hが求められる。
また、第(1)式の右辺のg(t)は、第(2)式によ
って与えられる。
【0112】h=eg(t)f …(1) g(t)=(1+kt)-1…(2) ここで、kは時間の重みを調整する係数である。このよ
うな関数は図11に示されるような関数となる。
【0113】図11におけるグラフでは、平面座標の一
方の軸がt(経過時間)であり、他方の軸がf(出現頻
度)とされており、さらに縦軸にはh(評価値)が取ら
れている。図11から明らかなように、前に出現してか
ら今回出現するまでの経過時間が長いほど、評価値の値
は大きくなっている。これに対して、出現回数が増える
ほど、評価値の値は小さくなっている。
【0114】なお、第(1)式で初出語の場合のfの値
は0とする。すなわち、初出語は必ず評価値(h)の値
が1とされるように設定されている。
【0115】このように、ある単語が初めて出現した場
合に、または久し振りに出現した場合に寄与率が高く、
逆にしばしば出現する場合、またはほんのちょっと前に
も出現したことがある場合に寄与率が低くなるような関
数が用いられることで、話題転換の評価が可能となって
いる。
【0116】図12は、第(1)式に示されるような関
数が実際にどのような値を示すかを実験した結果を示し
たグラフである。図12において、横軸は出現時刻
(t)を示し、縦軸は出現単語話題転換指数(h)を示
す。ただし、出現時刻(t)として、実際の経過時間で
なく文字数を使用し、k=0.01と設定されている。
さらに、ある対談記事中の「男」という単語の寄与指数
について図12に示すグラフは表わしている。
【0117】図12を参照して、t=2000までは連
続的に「男」という単語が頻出するので、寄与指数は時
間とともに低下している。しかし、t=2000から5
000の間では発話中に出現していないため、t=50
00付近で出現した際の寄与指数は再び高く評価されて
いる。つまり、t=1500辺りでは「男」という単語
による話題転換はあまり促進されていないが、t=50
00付近で再出現した際には「男」によって話題が転換
する可能性が高いことを、図12に示すグラフは表わし
ている。
【0118】次に、話題転換尤度評価部115について
説明する。話題転換尤度評価部115は、3層のニュー
ラルネットで構成されている。入力層に与えられるデー
タと、各データの取り得る値は以下のとおりである。
【0119】第1は、クルーワードの有無である。この
クルーワードは、なしの場合0の値を取り、ありの場合
1の値を取る。このようなクルーワードの有無は、前述
したように話題転換要因抽出部107によって話題転換
尤度評価部115に与えられる。
【0120】第2は、疑問文か否かである。疑問文であ
る場合は1を取り、それ以外は0を取る。このような疑
問文か否かは、話題転換要因抽出部107によって与え
られる。
【0121】第3は、相手特定語の有無である。対話の
相手を特定する語がない場合には0を取り、ある場合に
は1を取る。このような対話の相手を特定する語の有無
は、話題転換要因抽出部107によって与えられる。
【0122】第4は、同義語の数/有無である。同義語
(同語)が1発話または1文中に含まれない場合には0
を取り、含まれる場合には1またはその個数の値を取
る。このような同義語(同語)が1発話または1文中に
含まれている数は、同義語辞書125で得られた同義語
リストから同義語の数がカウントされることで得られ
る。
【0123】第5は、指示語の数/有無である。指示語
がない場合には0を取り、ある場合には1またはその個
数の値を取る。このような指示語の数は、単語辞書21
から得られた単語品詞リストから指示語が数えられるこ
とで得られる。
【0124】第6は、接続詞の数/有無である。接続詞
がない場合には0を取り、ある場合には1またはその個
数の値を取る。このような接続詞の数は、単語辞書21
から得られる単語品詞リストの接続詞が取出されること
で得られる。
【0125】第7は、初出語の数/有無である。初出語
がない場合には0を取り、ある場合には1を取る。この
ような初出語の有無や数は単語辞書21から与えられる
単語品詞リストが解析情報統計処理部11で統計処理さ
れることで得られる。
【0126】第8は、話題候補語の数/有無である。話
題候補語がない場合には0を取り、ある場合には1また
はその個数の値を取る。話題候補語の数や有無は、話題
候補語抽出部109で得られた話題候補語リストから話
題候補語が抽出されて得られる。
【0127】第9は、初出語かつ話題候補語の語の有無
/数である。初出語かつ話題候補語である語がない場合
には0を取り、ある場合には1またはその個数の値を取
る。このような初出語かつ話題候補語である語の有無や
数は、初出語の数/有無と話題候補語の数/有無より得
られる。
【0128】第10は、前文または前発話に含まれた語
の対比語の数/有無である。前文または前発話に含まれ
た語の対比語がない場合には0を取り、ある場合には1
またはその個数の値を取る。このような前文または前発
話に含まれた語の対比語の数や有無は、単語品詞リスト
から統計処理されて得られた情報と、現発話から出力さ
れた対比語リストとが比べられることで、対比語リスト
に含まれる語は前発話に現れているかどうかが調べられ
て得られる。
【0129】第11は、各初出語の転換寄与指数であ
る。この話題転換寄与指数は0以上1以下の実数を取
り、初出語がない場合には0を取る。
【0130】第12は、各話題候補語の転換寄与指数で
ある。この話題転換寄与指数は0以上1以下の実数を取
り、候補語がない場合には0を取る。
【0131】第13は、話者の交代の有無である。話者
監視装置119で得られる話者IDと解析情報統計処理
部11で統計処理した統計情報から得られる。話者が交
代している場合には1を取り、交代していない場合には
0を取る。なお、この話者が交代したか否かに関して
は、処理が発話単位で行なわれれば通常は必ず1とな
る。
【0132】第14は、前話題転換からの経過時間であ
る。話題転換からの経過時間も0以上の実数を取る。こ
れは、話題転換尤度評価部115が転換を検出したとき
に、統計情報から前の話題転換検出発話の発話時刻が発
話推移時間監視装置121からの発話開始および終了時
刻から得られるので、現発話の発話開始時刻および終了
時刻とが演算されてその間の経過時間により得られる。
【0133】第15は、現発話者の前発話終了からの時
間である。この値は0以上の実数を取る。現発話の話者
IDと同じ話者IDの話者による前発話の開始時刻を統
計情報から得ることができ、現発話の開始時刻との差が
解析情報統計処理部11で統計処理されることで経過時
間が得られる。
【0134】第16は、現発話の発話時間である。この
現発話の発話時間は、発話推移時間監視装置121から
与えられる現発話の開始時刻および現発話の終了時刻の
差から得られる。
【0135】第17は、前発話終了から現発話開始まで
の時間である。この時間は、発話推移時間監視装置12
1から与えられる現発話の開始時刻と、統計情報として
記録されている前発話の終了時刻との差から得られる。
【0136】以上のような値が入力層に与えられると、
出力層には話題転換の可能性が実数として出力される。
最終的には、この出力される値に対して何らかの足切り
が行なわれ、転換があったか否かが判定される。このよ
うに、話題転換の判断に使用される情報は、基本的に現
在の発話から得られたものである。各種経過時間情報、
この出現頻度および対比語検出などで過去の発話の情報
がが使用されるが、話題同定/転換の認識を遡って行な
うためにそのような過去のデータが使用されるのではな
く、あくまでも現在の発話で転換が発生したかどうかの
判定のために使用される。これによって、対話処理部1
01の実時間性は損なわれない。
【0137】話題転換度の評価は、必ずしもニューラル
ネットが使用される必要はない。たとえば、何らかの妥
当な多項式などによる評価関数が定義されれば、それが
使用されても構わない。ただし、判定に用いられる要素
が上記のように非常に多く、しかも各要素の重み付けが
困難であり、主観評価実験の結果から解析的に何らかの
評価加数が獲得されることは、一般的に極めて困難であ
ると思われる。そこで、ニューラルネットが用いられて
主観評価実験から得られた結果が教師データとして与え
られて学習が行なわれれば、比較的容易に評価関数に相
当するものが得られる。そのために、本実施例ではニュ
ーラルネットが使用されている。
【0138】学習は、以下のように行なわれる。まず、
ある対話文を5名の被検者に粗読してもらう。そして、
話題転換があったと思った箇所にチェックをしてもら
う。このようにして得られた結果から、2名以上の被検
者が転換ありと判断した発話または文が話題転換のあっ
た発話または文とされる。
【0139】次に、ニューラルネットの入力層に、各発
話または文から得られる上記データが入力され、その発
話または文で話題転換があった場合には1、なかった場
合には0が出力層に与えられる。そして、バックプロパ
ゲーションによって学習が行なわれる。このような学習
が対話の初めから終わりまで順次繰返され、必要であれ
ば同じ対談について複数回学習が行なわれる。これによ
ってニューラルネットは次第に適正な評価を行なわれる
ように学習される。または、sin(xπ/2m)のよ
うな関数(ここで、xは話題転換を検出した被検者の数
であり、mは被検者総数である。)が用いられて教師デ
ータが生成される方法も考えられる。このような関数が
用いられれば、総被検者数が少ない場合には教師データ
の転換尤度をより低く、逆にある程度以上の検出者がい
る場合には全員が検出しなくても転換尤度をほぼ1にす
ることができ、より現実的な学習の可能性がある。
【0140】なお、実施例では被検者で2名以上が転換
と認めた箇所を転換ありとして学習が行なわれている。
しかし、他にも、たとえば5名のうち何名が転換ありと
認識したかの割合を使って学習する方法も考えられる。
たとえば、5名による主観評価実験で3名が転換ありと
した箇所については、出力層に与える教師データを0.
6とするような方法によってもよい。
【0141】このような方法によって、話題転換があっ
たかどうかが、時間遅れなく評価が可能となる。
【0142】次に、話題語同定部117について説明す
る。話題語同定部117は、話題転換尤度評価部115
から話題の転換ありと通知されたときに、話題候補語抽
出部109から与えられる現在の発話に含まれる話題候
補語から話題と見なされる語を抽出し、話題膠着監視装
置707に与える。話題候補語から話題と見なされる語
が抽出される方法としては、以下のようなやり方が挙げ
られる。
【0143】図13は、そのような話題候補語から話題
と見なされる語が抽出される種々の方法を説明するため
の図である。特に、図13には、図13(a)から13
(e)に示すように、以下のような5種類の方法を示し
ている。
【0144】第1は、図13(a)に示すように、話題
候補語すべてを話題候補語と見なして使用者に提示する
方法である。
【0145】第2は、図13(b)に示すように、話題
候補語で初出語があればそれを話題語として提示する。
初出語でなければ、前回の出現から最も長い時間出現し
ていなかった語を話題語として提示しておけばよい。ま
たは、初出語がなければ、前回の出現か長い時間出現し
なかった順に所定の数の語を話題語として提示してもよ
い。さらに、初出語がなければ、出現頻度の最も低い語
を話題語として提示してもよい。さらに、初出語がなけ
れば、出現頻度の低いものから順に所定の数の語を話題
語として提示してもよい。
【0146】第3の方法は、図13(c)に示すよう
に、話題候補語から、過去に話題語として同定された語
を削除した残りの語を話題語として提示する方法であ
る。このような第3の方法の場合には、話題語同定結果
である話題語が解析情報統計処理部111にフィードバ
ックされることで、過去に話題語として同定された語に
関する情報が解析情報統計処理部11に与えられる。
【0147】第4は、図13(d)に示すように、転換
が検出された発話内に複数回使用されている語、または
同義語が出現する語が強調されていると見なして、これ
を話題語として提示する方法である。
【0148】第5は、図13(e)に示すように、話題
転換要因抽出部107から、直前の発話内に含まれる語
の対比語は本発話内に含まれることが通知されていれ
ば、その対比語を話題語として提示する方法である。
【0149】以上のような種々の方法があるが、これら
の方法が単独で用いられるだけでなく、いくつかが組合
される方法でもよい。ただし、この対話処理部では、話
題の同定はあまり重要な位置を占めていない。すなわ
ち、この対話処理部の最も重要な目的は実時間に話題の
転換を検出することであり、その検出に当たって予め話
題が同定される必要がない。
【0150】図14は、図6のデータベース部が門外漢
の役割を果たすため、その門外漢について説明するため
の図である。
【0151】たとえば、ある研究室においてブレインス
トーミングを行なう場合、日頃似たような研究を行なっ
ている者同士ではどうしても発想の幅が狭まりがちであ
る。そこで、図14に示すような門外漢301が一人参
加させられる。
【0152】門外漢301は、他の会議参加者である専
門家303の発言内容(専門的意見)について深く理解
することは一般的に不可能である。しかし、その発言内
容のうちから理解可能な断片を用いて自分なりにそれら
の発言を部分的/表面的理解305する。この場合、門
外漢301は専門家303の発言内容を誤解する場合も
あり得る。そして、この部分的/表面的理解305を基
に、門外漢301は、自分の持つ知識307から現在の
話題309に関連のありそうな情報を取出して時には意
外性のある意見311を発言する。
【0153】もちろん浅い理解に基づく発言なので、こ
の内容はまるで的外れである可能性も十分にある。しか
し、ある場合にこの門外漢301が提供する一見異質で
無関係に見える意外性のある情報311が他の会議参加
者303の誰かに現在の話題と結び付けられれば、そこ
から何らかの新たな発見が得られる可能性がある。なぜ
ならば、「発想とは、全然性質の違う異質のデータの組
合せから発見されるものである」からである。
【0154】このような門外漢301が会議の話題や各
参加者の発言内容について深い理解を必要とせず、浅い
理解で十分であるとの観点から、後で詳しく説明するデ
ータベース部709でも文の意味の理解は避けられ、表
層レベルでの処理が行なわれる。もちろん文の意味が理
解できればより有効な場面も多いと思われるが、文の理
解のためにはドメイン知識の構成などの難しい問題が多
い。特に門外漢として別分野の知識を持ちつつ現在の話
題に関する理解を行なうようなデータベース部709を
構成することは非常に困難と思われる。しかも出来上が
ったデータベース部709が特定分野でしか対応できな
くなる可能性が多い。これらが現在意味理解を避けてい
る主な理由である。
【0155】また、キーワードの重み付けは明示的に行
なうことも基本的に避けられる。これは、ある情報のあ
るキーワードに対する重みが、そのときの議論のテーマ
に応じて変化すると予想されるためである。また、話題
の抽出や発言の意味理解が困難な状況、場面に応じた的
確な重み付けを行なうことが実質不可能と思われること
による。人間の対話の話題の変化や発想の飛躍が必ずし
も重みの大きいキーワードから行なわれているとは限ら
ないとも思われる。そこで、キーワードとして扱う単語
すべてが平等な重み付けで処理される。また、抽出され
る情報の関連性は直接的な場合も、極めて間接的な場合
もあり非常に幅広くなると思われる。これによって、非
常に発散的な情報が提供できるデータベース部709が
提供される。そこで、以下にデータベース部709につ
いて詳しく説明する。
【0156】図15は、データベース部709の概略ブ
ロック図である。図15を参照して、データベース部7
09は、キーワードベクトル生成部313と、想起情報
抽出部315と、データベース317とを含む。
【0157】キーワードベクトル生成部313には図7
の形態素解析部105の単語辞書21から出力された単
語品詞リストが入力される。そして、キーワードベクト
ル生成部313は単語品詞リストをキーワードベクトル
に変換して生成し、そのキーワードベクトルを想起情報
抽出部315およびデータベース317に与える。想起
情報抽出部315では、入力されたキーワードベクトル
が用いられて、連想的な想起が行なわれる。この結果、
想起情報抽出部315は何らかのキーワードベクトルを
想起でき、データベース317から想起されたキーワー
ドベクトルと、データベース317に登録されてある各
記事のキーワードベクトルとが比較され、最も両者の一
致している記事が連想の末に得られるデータ結果として
ユーザインターフェース703に入力される。そして、
対話を行なっている話者に、ユーザインターフェース7
03から対話を発散させることができるような情報が提
供される。
【0158】次に、より詳しく説明する。図16は、図
15のキーワードベクトル生成部313の動作を説明す
るための図である。
【0159】キーワードベクトル生成部313は、入力
された単語品詞リストにおける同じ意味の単語を1つの
代表単語に変換する。たとえば、動詞はすべてその基本
的現在形に変換される(例、was/am/isなどは
beに、gone/going/goesはgoに変換
される)。また、キーワードベクトル生成部313は、
基本的に同じ意味であるが、さまざまな品詞のある語
は、そのうちのいずれか1つの代表単語に変換する
(例、abolishable/abolishmen
t/abolisher/abolition/abo
litionismなどはabolishに変換され
る)。
【0160】そして、単語品詞リストはキーワードベク
トル化される。発話Ai のキーワードベクトルKi は第
(3)式のように構成される。第(3)式の要素k
j は、単語Wj が発話Ai に出現しているとき1、出現
していないとき0となる。つまり、発話のキーワードベ
クトルは、ある単語がその記事に表われたか否かだけで
構成されており、ある発話のその発話内における出現頻
度、重要度などは全く考慮されていない。発話のキーワ
ードベクトルの長さnは、形態素解析部105で処理し
たすべての発話に出現した総単語種類数となり、新たな
単語が出現するたびにnの値は大きくなる。
【0161】発話のキーワードベクトル化についてさら
に図16を用いて具体的に説明する。
【0162】たとえば発話A1 がAn apple i
s sweet.であり、発話A2がI am a b
oy.である場合、単語W1 がa、単語W2 がappl
e、単語W3 がbe、単語W4 がsweet、単語W5
がI、単語W6 がboyとなり、キーワードベクトルの
長さnは6となる。その結果得られるキーワードベクト
ルK1 ,K2 は、K1 =(111100)、K2 =(1
01011)となる。
【0163】次に、想起情報抽出部315の動作につい
て説明する。想起情報抽出部315の具体例としては、
アソシアトロンがある。以下では、アソシアトロンを用
いた場合の想起情報抽出部315について説明する。
【0164】アソシアトロンでは、各記憶事項ごとにベ
クトルxの自己相関を表わす行列xx′が求められ、そ
の行列を加え合わせた行列Mが保持される。ただし、x
は縦ベクトル、x′はxの転置ベクトルである。この行
列Mが連想記憶行列である。したがって、この想起情報
抽出部315の場合には、m個の発話のキーワードベク
トルが記銘されて得られる連想記憶行列Mは、第(4)
式で与えられる。なお、以下で使用するベクトルはすべ
て縦ベクトルとする。
【0165】次に、想起について説明する。単語品詞リ
ストから得られたキーワードベクトルをQとするとき、
想起されるベクトルRは第(5)式で得られる。第
(5)式で、φ0 は第(6)式で示すような量子化関数
であり、φ* は第(7)式に示すような量子化関数であ
る。このφ0 ,φ* はベクトルおよび行列に対しても適
用でき、この場合はそのベクトルおよび行列が要素ごと
に量子化される。θの値が適切に選ばれることで、アソ
シアトロンは無用なノイズなく記銘した情報をより正確
に想起できる。
【0166】想起について具体的に説明する。図16に
示したキーワードベクトルK1 ,K 2 が記銘された場
合、連想記憶行列Mは第(8)式のようになる。データ
ベース317にキーワードベクトルK1 ,K2 が記銘さ
れている状態で、利用者が「Boys like sw
eet apples」という発話を入力されたとす
る。このとき、likeはすでに記銘されている発話中
に表われていないので、単語数n=7、単語W7 “li
ke”とし、キーワードベクトルQが第(9)式のよう
に作成される。なお、転置を表わす記号′は、このよう
にベクトルを表わす小括弧にも適用できるものとする。
これにより、キーワードベクトルK1 ,K2は、それぞ
れ第(10)式および第(11)式のように拡張され
る。同時に、連想記憶行列Mも第(12)式のように拡
張される。
【0167】このキーワードベクトルQと連想記憶行列
MからベクトルRが想起される。すなわち、第(13)
式に示すφ0 (M)Qが得られるので、θ=1とするこ
とによって想起されるベクトルRは、第(14)式のよ
うになる。この想起されたベクトルRは、キーワードベ
クトルK1 に一致している。すなわち、「Boysli
ke sweet apples」という入力に対して
発話A1 の「Anapple is sweet」が想
起されたことになる。
【0168】
【数1】
【0169】
【数2】
【0170】結果的に重要なことは、boy,lik
e,sweet,appleという4つのキーワードに
対して、その結合をアンドでもオアでもない中間的な結
合によって検索が行なわれ、最終的に対話を発散させる
ような検索結果が得られて、ユーザインターフェースか
ら対話者に与えられる。
【0171】なお、図6に示す実施例の対話処理部10
1には、図7に示すように、話者監視装置119、発話
推移時間監視装置121が設けられているため、図6に
示す実施例に図1に示す実施例、図2に示す実施例、図
3に示す実施例が適用されてもよい。
【0172】
【発明の効果】以上のように、この発明によれば、複数
の話者に提示されるデータを蓄積し、その複数の話者間
での対話を活性化するための情報を対話から抽出し、抽
出した情報に応じて、蓄積されたデータのうちから対話
を活性化するために必要なデータを提示して、複数の話
者間での対話を活性化することができる。
【図面の簡単な説明】
【図1】この発明の第1の実施例による対話活性化装置
の概略ブロック図である。
【図2】この発明の第2の実施例による対話活性化装置
の概略ブロック図である。
【図3】この発明の第3の実施例による対話活性化装置
の概略ブロック図である。
【図4】この発明の第4の実施例による対話活性化装置
の概略ブロック図である。
【図5】図4の対話処理部の内部構成を示した概略ブロ
ック図である。
【図6】この発明の第5の実施例による対話活性化装置
の概略ブロック図である。
【図7】図6の対話処理部の内部構成を示した概略ブロ
ック図である。
【図8】図7の解析情報統計処理部の動作を説明するた
めの第1の図である。
【図9】図7の解析情報統計処理部の動作を説明するた
めの第2の図である。
【図10】図7の解析情報統計処理部の動作を説明する
ための第3の図である。
【図11】図7の単語の話題転換寄与指数演算部で用い
られる関数を示したグラフである。
【図12】図7の単語の話題転換寄与指数演算部で用い
られる関数に実験を施した場合のその実験結果を示した
グラフである。
【図13】図7の話題転換尤度評価部の動作を説明する
ための図である。
【図14】図6のデータベースが門外漢として用いられ
るために、その門外漢を説明するための図である。
【図15】図6のデータベース部の内部構成を示した概
略ブロック図である。
【図16】図15のキーワードベクトル生成部の動作を
説明するための図である。
【符号の説明】
501,551,601,651,701 対話活性化
装置 505 話者監視装置 507 話者履歴部 605 発話推移時間監視装置 607 発話推移時間当りカウント装置 1,101 対話処理部 657,707 話題膠着監視装置 509,609,659,709 データベース部 553 興味データベース
フロントページの続き (56)参考文献 特開 平4−332084(JP,A) 特開 平6−139276(JP,A) 竹下敦、「表層的処理による話題抽 出」、情報処理学会研究報告、Vol. 91、No.37(NL83−4)、p.23− p.30(1991) (58)調査した分野(Int.Cl.6,DB名) G06F 17/20 - 17/30 G06F 9/44 JICSTファイル(JOIS)

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 話者に提示されるべき情報を蓄積するデ
    ータベースと、 ずれの話者が発話しているかを監視する話者監視手段
    と、 記話者監視手段の監視結果に基づいて発話した話者の
    履歴を記録し、かつ、前記履歴に基づいて発話頻度が他
    の話者の発話頻度よりも少ない不活発話者を検出したと
    き、前記データベースから情報を読出して話者に提示す
    る話者履歴記録手段とを備える、対話活性化装置。
  2. 【請求項2】 前記話者監視手段はさらに話題を同定
    し、 前記対話活性化装置はさらに、前記話者監視手段により
    同定された話題から連想される事項を想起する想起情報
    抽出手段を備え、 前記話者履歴記録手段は、前記不活発話者を検出したと
    き、前記想起情報抽出手段により想起された事項に基づ
    いて前記データベースから情報を読出して話者に提示す
    る、請求項1に記載の対話活性化装置。
  3. 【請求項3】 前記対話活性化装置はさらに、各話者
    興味を有する事項を蓄積する興味データベース備え、 前記話者履歴記録手段は、前記興味データベースに蓄積
    された事項のうち前記不活発話者が興味を有する事項に
    基づいて前記データベースから情報を読出して話者に提
    示する、請求項1に 記載の対話活性化装置。
  4. 【請求項4】 話者に提示されるべき情報を蓄積するデ
    ータベースと、 話者の発話 開始時刻および発話終了時刻を監視する時間
    監視手段と、 前記時間監視手段監視結果に基づいて前記発話開始時
    刻および前記発話終了時刻を記録し、かつ、前回
    了時刻から今回話開始時刻までの時間が所定の時
    間よりも長い無発話期間を検出したとき、前記データ
    ースから情報を読出して話者に提示する時間記録手
    を備える、対話活性化装置。
  5. 【請求項5】 前記時間監視手段はさらに話題を同定
    し、 前記対話活性化装置はさらに、前記時間監視手段により
    同定された話題から連想される事項を想起する想起情報
    抽出手段を備え、 前記時間記録手段は、前記無発話期間を検出したとき、
    前記想起情報抽出手段により想起された事項に基づいて
    前記データベースから情報を読出して話者に提示する、
    請求項4に記載の対話活性化装置。
  6. 【請求項6】 話者に提示されるべき情報を蓄積するデ
    ータベースと、 換を検出する話題転換検出手段と、 記話題転換検出手段検出結果に基づいて話題膠着
    しているか否かを監視し、かつ、話題の膠着を検出した
    とき、前記データベースから情報を読出して話者に提示
    る話題膠着監視手とを備える、対話活性化装置。
  7. 【請求項7】 前記話題転換検出手段はさらに話題を同
    定し、 前記対話活性化装置はさらに、前記話題転換検出手段に
    より同定された話題から連想される事項を想起する想起
    情報抽出手段を備え、 前記話題膠着監視手段は、前記話題の膠着を検出したと
    き、前記想起情報抽出手段により想起された事項に基づ
    いて前記データベースから情報を読出して話者に提示す
    る、請求項6に記載の対話活性化装置。
JP6279446A 1994-11-14 1994-11-14 対話活性化装置 Expired - Fee Related JP2849342B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6279446A JP2849342B2 (ja) 1994-11-14 1994-11-14 対話活性化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6279446A JP2849342B2 (ja) 1994-11-14 1994-11-14 対話活性化装置

Publications (2)

Publication Number Publication Date
JPH08137875A JPH08137875A (ja) 1996-05-31
JP2849342B2 true JP2849342B2 (ja) 1999-01-20

Family

ID=17611188

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6279446A Expired - Fee Related JP2849342B2 (ja) 1994-11-14 1994-11-14 対話活性化装置

Country Status (1)

Country Link
JP (1) JP2849342B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169804A (ja) * 2000-12-01 2002-06-14 Namco Ltd 模擬会話システム、模擬会話方法、および情報記憶媒体

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099570A (ja) * 1998-09-22 2000-04-07 Fuji Xerox Co Ltd 会議支援システム
JP4225074B2 (ja) 2003-02-14 2009-02-18 富士ゼロックス株式会社 対話支援装置および方法並びにプログラム、対話支援システム
JP5294315B2 (ja) * 2008-11-28 2013-09-18 学校法人早稲田大学 対話活性化ロボット
JP5372788B2 (ja) * 2010-01-14 2013-12-18 Kddi株式会社 ディスカッション効率性指標算出装置およびコンピュータプログラム
JP6730843B2 (ja) * 2016-05-06 2020-07-29 日本ユニシス株式会社 コミュニケーション支援システム
JP6864831B2 (ja) * 2017-04-24 2021-04-28 富士フイルムビジネスイノベーション株式会社 ロボット装置及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
竹下敦、「表層的処理による話題抽出」、情報処理学会研究報告、Vol.91、No.37(NL83−4)、p.23−p.30(1991)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169804A (ja) * 2000-12-01 2002-06-14 Namco Ltd 模擬会話システム、模擬会話方法、および情報記憶媒体
JP3533371B2 (ja) 2000-12-01 2004-05-31 株式会社ナムコ 模擬会話システム、模擬会話方法、および情報記憶媒体

Also Published As

Publication number Publication date
JPH08137875A (ja) 1996-05-31

Similar Documents

Publication Publication Date Title
JP4987203B2 (ja) 分散型リアルタイム音声認識装置
Hori et al. A new approach to automatic speech summarization
JP6210239B2 (ja) 会話解析装置、会話解析方法及びプログラム
US6615172B1 (en) Intelligent query engine for processing voice based queries
US7203646B2 (en) Distributed internet based speech recognition system with natural language support
Bürki et al. Is there only one “fenêtre” in the production lexicon? On-line evidence on the nature of phonological representations of pronunciation variants for French schwa words
US20140316785A1 (en) Speech recognition system interactive agent
Ibarretxe-Antuñano Mind-as-body as a cross-linguistic conceptual metaphor
US20080040114A1 (en) Reranking QA answers using language modeling
JP2012159596A (ja) 情報処理装置、情報処理方法、情報処理システム、およびプログラム
Trnka et al. Topic modeling in fringe word prediction for AAC
Kaushik et al. Automatic audio sentiment extraction using keyword spotting.
Sugiyama Dialogue breakdown detection based on estimating appropriateness of topic transition
JP2849342B2 (ja) 対話活性化装置
Hori et al. Automatic speech summarization based on word significance and linguistic likelihood
Cavalieri et al. Combination of language models for word prediction: An exponential approach
Ries Segmenting conversations by topic, initiative, and style
Hori et al. Improvements in Automatic Speech Summarization and Evaluation
JP2849341B2 (ja) 対話処理装置
Shibata et al. Dialog system for open-ended conversation using web documents
Chen et al. A Reality Check and a Practical Baseline for Semantic Speech Embedding
Schofield et al. A speech interface for open-domain question-answering
Suzuki et al. Express emoticons choice method for smooth communication of e-business
Kim et al. Language models and dialogue strategy for a voice QA system
JP2020201748A (ja) 発話生成装置、発話生成方法及び発話生成プログラム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19981020

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071106

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081106

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081106

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091106

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101106

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111106

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111106

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121106

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131106

Year of fee payment: 15

LAPS Cancellation because of no payment of annual fees