JP6796326B2 - 対話型情報提供システムおよび対話型情報提供方法 - Google Patents

対話型情報提供システムおよび対話型情報提供方法 Download PDF

Info

Publication number
JP6796326B2
JP6796326B2 JP2016234723A JP2016234723A JP6796326B2 JP 6796326 B2 JP6796326 B2 JP 6796326B2 JP 2016234723 A JP2016234723 A JP 2016234723A JP 2016234723 A JP2016234723 A JP 2016234723A JP 6796326 B2 JP6796326 B2 JP 6796326B2
Authority
JP
Japan
Prior art keywords
user
utterance
attitude
interactive information
information providing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016234723A
Other languages
English (en)
Other versions
JP2018091979A (ja
Inventor
裕作 西脇
裕作 西脇
健太 吉見
健太 吉見
美智男 岡田
美智男 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyohashi University of Technology NUC
Original Assignee
Toyohashi University of Technology NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyohashi University of Technology NUC filed Critical Toyohashi University of Technology NUC
Priority to JP2016234723A priority Critical patent/JP6796326B2/ja
Publication of JP2018091979A publication Critical patent/JP2018091979A/ja
Application granted granted Critical
Publication of JP6796326B2 publication Critical patent/JP6796326B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、情報提供システムおよび情報提供方法に関するものであり、特に、ユーザとの間で対話しつつ提供情報をユーザに提供するための対話型情報提供システムおよび対話型情報提供方法に関するものである。
本発明が想定している提供情報はニュース等の情報であり、これをユーザとの間で対話的な状況を生み出しつつ提示する技術が本発明である。一般的に、ニュース等の情報をユーザに対して音声によって伝聞する際には、当該提供情報であるニュース・テキストを、そのまま音声合成により読み聞かせることが知られている。これは、ニュース・テキストが十分な情報を担っている場合であれば、明瞭に音声合成された発話により、聞き手であるユーザに対し、当該提供情報の内容が正確に伝達できるということを前提としている。そして、その際、ニュース等の情報を正確かつ流暢に伝えるために、音声合成にかかる装置が進歩したことも事実である。
しかし、正確かつ流暢な発話によってニュース等の情報を発話により伝達されたとしても、話し言葉による発話でないために、ユーザは違和感を覚えながら聞くこととなり、ユーザが意識的に聞かなければ、その内容を十分に伝達することは難しいものとなっていた。
そこで、テキストデータを音声合成により発話させる際、冗長表現言語等を挿入することにより、テキスト表現に人間が発話しているような自然さを与える情報提供システムが開発されている(特許文献1参照)。この技術は、人間同士の会話で使用される「あー」や「えー」などのフィラー、または「〜ですね」や「〜だそうです」などの語尾冗長語(これをモダリティという)をテキストデータに挿入することにより、会話文のように発話させるものであった。
特開2014−48443号公報
「Talking−Ally:聞き手性をリソースとする発話生成システムの実現に向けて」 岡田美智男外5名 ヒューマンインタフェース学会論文誌 Vol.17, No.2, 2015.
前記特許文献1に開示される発明は、テキストデータを話し言葉に近似させて発話させるものであるため、フィラーやモダリティの挿入方法をルール化したものであり、発話に関しては話し言葉のように変換し得るものであった。
しかしながら、この種の情報提供システムは、ユーザ側にとって一方的かつ受動的なものであって、一般的な会話のようなユーザの参加態度は低く、従って、提供される情報に対する理解は浅いものとなる傾向があった。また、一方的な発話によって情報が伝達されることから、ユーザに対する優しさや丁寧さを欠くこととなり、その振る舞いは機械的なものとなっていた。そのため、設計的な構えを引き出すだけとなり、ユーザに情報を伝達したいという意思や主体性を感じることができなかった。つまり、志向的な構えを引き出し難いものとなっていた。
そこで、本願の発明者らは、志向的な構えを引き出すことができる発話生成システムを開発した(非特許文献1参照)。この技術は、発話生成システム側が、ユーザの態度(目や顔の向きなど)を把握しつつ、当該ユーザの状態に応じて、丁寧な発話内容やタイミングを選ぶような振る舞いを実現させるものであった。
ところが、上記技術はユーザの参加態度を把握するために、各種の画像解析を必要とし、また、志向性の構えを引き出すための手法としてフィラーやモダリティを使用するものであって、聞き手であるユーザの関心を十分に引き出せていないという懸念があった。
本発明は、上記諸点にかんがみてなされたものであって、その目的とするところは、ユーザからの発話を促して、ユーザの関心を引き出すことができる対話型の情報提供システムとその方法を提供することである。
そこで、対話型情報提供システムに係る本発明は、提供情報について複数の文節に区切られた発話片を統合しつつ会話文を構築する発話制御手段と、ユーザが発する音声をテキストデータに変換して前記発話制御手段に入力する音声入力手段とを備え、前記発話制御手段は、ユーザの発話内容からユーザの参加態度を推定するユーザ態度推定手段と、該ユーザ態度推定手段により推定されるユーザの参加態度に基づき、前記発話片の統合方法を決定する発話方略手段と、該発話方略手段により決定された発話片の統合方法に従って欠落要素または忘却要素を決定する欠如文節決定手段とを備えることを特徴とするものである。
上記構成によれば、発話制御手段には、ユーザ態度推定手段と発話方略手段とが設けられており、この発話方略手段がユーザ態度推定手段により推定されるユーザ参加態度に応じて、予定される発話片の統合方法から選択される方法によりユーザの関心を引き出すような会話文を構築することができる。ユーザの関心を引き出すような会話文とは、欠如文節決定手段によって決定された欠落要素または忘却要素を反映し、言葉足らずの表現や忘却した要素をユーザに尋ねるような表現である。欠落要素とは、本来の提供情報の一つのセンテンス中の主要な要素であり、これを欠落させることにより不完全なセンテンス(言葉足らずの表現)となり得る要素である。このような言葉足らずの表現により発話することでユーザの関心や発話を引き出すことができる。他方、忘却要素とは、あたかも大切なキーワードを忘れたかのように振る舞うための単語などの要素であり、当該要素を忘却したものとして発話内容を組み立てることにより、ユーザの援助(ユーザの積極的な参加)を引き出すことができる。なお、ユーザの参加態度を推定するためには、ユーザが発する音声を取得し、ユーザから発せられた単語が、本来想定されている相槌などの応答やキーワードを含んでいるか否かなどを基準に判断される。また、ユーザ参加態度が良好な場合は、これら欠落要素または忘却要素を決定しない(言葉足らずや忘却した表現でない)会話文を構築することもあり得る。
対話型情報提供システムに係る本発明は、さらに、有線または無線によって接続される外部装置から提供情報を取得する情報提供手段を備えることを特徴とするものである。
上記構成によれば、外部装置に蓄積される多数の提供情報から選択される情報を音声としてユーザに提供することができる。ここで、外部装置とは、対話型情報提供システムに附属する記憶媒体でもよいが、インターネット回線を通じて他の情報媒体から情報を入手する場合も含まれる。この場合、提供情報に含まれる固有名詞等については、さらにインターネット回線を利用して、他の情報媒体から情報を入手し得る内容を統合させることもあり得る。
対話型情報提供システムに係る本発明は、さらに、入手された提供情報について文節ごとに区切って発話片を構築する形態素解析手段と、区切られた発話片における相互の係り受けを解析する係り受け解析手段とを備えることを特徴とするものである。
上記構成によれば、形態素解析手段により、提供情報を文節ごとに区切ることによって、発話片を構築することができ、また、係り受け解析手段により発話片相互の係り受けを解析することにより、文全体の主要述語要素を把握し、各文節における主格や目的格などの役割を把握することができる。文全体の主要述語要素を把握することにより、欠落要素または忘却要素として妥当な要素を決定することが容易となる。なお、発話片とは、発話に際して分割し得る一単位であり、実質的には文節と同義であるが、文節を会話調にするために文節に「〜ね」を付与する場合や、述語を含めた文全体のうちの述部を発話片とする場合もあり得る。
対話型情報提供システムに係る本発明は、前記発話制御手段が、さらに、前記欠如文節決定手段により決定された欠落要素または忘却要素が反映された会話文に合致するように、フィラーもしくはモダリティまたはこれら双方を付与するフィラー・モダリティ付与手段を備えることを特徴とするものである。
上記構成によれば、欠落要素または忘却要素が反映された会話文について、フィラーもしくはモダリティまたはこれら双方が付与されることにより、ユーザの関心を強く引き出すことができるとともに、会話文として自然な内容とすることができる。
また、対話型情報提供システムに係る上記の各発明においては、前記ユーザ態度推定手段が、ユーザによる発話の内容に応じてユーザの参加態度の推定値を適宜変更されるものであり、前記発話方略手段が、前記ユーザ態度推定手段によるユーザの参加態度の推定値の変更に応じて統合方法を修正するものとすることができる。
上記構成の場合には、対話型により情報提供しているうちに、ユーザの参加態度が変化する場合もあるため、そのような参加態度の変化に対応して、統合方法を変化させることから、ユーザの更なる関心を引き出すことができる。このとき、ユーザの参加態度を数値化し、その推定値に応じて、発話方略手段による統合方法を選択するように構成すれば、ユーザの関心を維持しつつ対話型の情報提供を継続することができる。
さらに、対話型情報提供システムに係る上記の各発明においては、前記欠落要素または忘却要素を記憶する欠如文節記憶手段を備える構成とし、前記発話方略手段が、前記ユーザ態度推定手段により推定されるユーザの参加態度の推定値に加えて、ユーザの発話と前記欠如文節記憶手段に記憶される欠落要素または忘却要素とを比較した結果に応じて、発話片の統合方法を決定するものとすることができる。
上記構成の場合には、ユーザの関心を引き出すために、欠落要素を反映した会話文では不十分な場合には、例えば、欠落要素を忘却要素に置き換えるなど、発話片の統合方法を変更することにより、ユーザの関心を一層引き出させることができる。また、ユーザの参加態度が良好になれば、これら欠落要素または忘却要素を決定することなく会話文を構築させるような統合方法に変更することができる。
他方、対話型情報提供方法に係る本発明は、提供情報について複数の文節に区切られた発話片を統合しつつ会話文を構築する発話制御手段と、ユーザが発する音声をテキストデータに変換して前記発話制御手段に入力する音声入力手段とを備える対話型情報提供システムにおいて、ユーザに対して対話型の情報を提供するよる対話型情報提供方法であって、前記発話制御手段による会話文の構築方法が、前記音声入力手段により入力されるユーザの発話内容からユーザの参加態度を推定する推定値を導出するユーザ態度推定ステップと、該ユーザ態度推定ステップにより推定されるユーザの参加態度の推定値に基づき、前記発話片の統合方法を決定する発話方略ステップと、該発話方略ステップにより決定された発話片の統合方法に従って欠落要素または忘却要素を決定する欠如文節決定ステップと
を含むことを特徴とするものである。
上記構成によれば、発話制御手段において、ユーザの参加態度を推定するとともに、その推定に基づいて、ユーザの関心の程度に応じた発話片の統合方法を決定することができる。そして、その統合方法に従って欠落要素または忘却要素が決定されることから、ユーザの参加態度に応じた情報提供を可能にすることができる。なお、前記対話型情報提供方法を実現するシステムには、提供情報を取得する情報取得手段、入手された提供情報について文節ごとに区切って発話片を構築する形態素解析手段、および、区切られた発話片における相互の係り受けを解析する係り受け解析手段を備え、外部のニュースソースを取得しつつ、当該ニュースソースの内容に沿った会話文を構築するものとしてもよい。
また、上記構成の対話型情報提供方法に係る本発明においては、前記発話制御手段による会話文の構築方法が、さらに、前記欠如文節決定ステップにより決定された欠落要素または忘却要素が反映された会話文に合致するように、フィラーもしくはモダリティまたはこれら双方を付与するフィラー・モダリティ付与ステップを備えるものとすることができる。
上記構成の場合には、欠落要素または忘却要素を反映した会話文において、さらにフィラーもしくはモダリティを付与することにより、一般的な会話文に近似させることができるとともに、これらを総合させることにより、ユーザの関心を引き出すような会話文を構築することも可能となる。
上記構成の各発明においては、前記発話制御手段による会話文の構築方法が、さらに、前記欠如文節決定ステップにより決定された欠落要素または忘却要素を反映した発話と前記音声入力手段により入力される情報とを比較し、発話と入力情報との相互の関係性を判定するインタラクション処理ステップとを備える構成とすることができる。
上記構成によれば、インタラクション処理ステップにより、ユーザの応答の内容に応じて、ユーザの参加態度を検出することが可能となる。このインタラクション処理ステップにより判定された相互の関係性は、ユーザ態度推定ステップによる推定値導出の要素とすることができるほか、発話方略ステップによる発話片の統合方法の決定に対する基準としてもよい。これは、単なるユーザからの反応(音声)によってユーザの参加態度の程度を推定する場合に比べて、実質的な参加態度を推定することに資するものとなる。
また、上記構成の対話型情報提供方法に係る両発明においては、前記対話型情報提供システムが、さらに、前記ユーザ態度推定ステップにより推定されるユーザの参加態度の推定値、前記欠落要素または忘却要素を記憶する記憶手段を備えるものであり、前記発話方略ステップが、前記ユーザ態度推定ステップにより推定されるユーザの参加態度の推定値に加えて、ユーザの発話と前記欠如文節記憶手段に記憶される欠落要素または忘却要素とを比較した結果に応じて、発話片の統合方法を決定するものとすることができる。
上記構成の場合には、ユーザの参加態度が変化した場合においても、その変化に対応した会話文を構築することができる。そして、ユーザが十分に関心を示した場合には、欠落要素または忘却要素を反映させない会話文を構築させることにより、円滑な情報提供が可能となり得る。
また、上記に示したインタラクション処理ステップを含む発明にあっては、前記対話型情報提供システムが、さらに、前記ユーザ態度推定ステップにより推定されるユーザの参加態度の推定値、前記欠落要素または忘却要素、および、前記インタラクション処理ステップによる判定結果を記憶する記憶手段を備えるものであり、前記発話方略ステップが、前記ユーザ態度推定ステップにより推定されるユーザの参加態度の推定値に加えて、前記インタラクション処理ステップにより判定された結果に応じて、発話片の統合方法を決定するものと構成することができる。
上記のような構成によれば、インタラクション処理ステップの実行のために、欠落要素または忘却要素が記憶手段に記憶されることとなり、この両要素とユーザからの反応(音声)とを比較することによりインタラクション処理が可能となる。さらに、ユーザの参加態度の推定値とともに、インタラクション処理による判定結果が記憶手段に記憶されることにより、ユーザの関心の程度の変化を推測することができ、発話方略ステップにおける発話片の統合方法の決定の要素とすることも可能となる。
さらに、上記構成の発明において、前記記憶手段が、さらに、前記ユーザ態度推定ステップにより推定されるユーザの参加態度、前記発話方略ステップにより決定された発話片の統合方法、および、前記インタラクション処理ステップにより判定された発話と入力情報との相互の関係性を累積的に記憶するものであり、前記ユーザ態度推定ステップが、累積的に記憶されるユーザの参加態度、統合方法および相互の関係性に基づいて、推定基準値を修正するものである請求項11に記載の対話型情報提供方法。
上記構成の場合には、各ステップによる処理結果が累積的に記憶されるため、ユーザの反応の程度(標準的な反応レベル)を検出することができ、ユーザの参加態度の推定値をユーザのレベルに相応させることができる。すなわち、ユーザの反応レベルは、人種や性別によっても異なり、年齢によっても異なる。従って、応答が敏感であるようなユーザと、口数の少ないユーザとでは、基準とすべき反応レベルが異なることから、基準となるべき反応レベルをユーザに応じて変化させることにより、ユーザの参加態度を推定は、適正なものとなり得る。また、発話片の統合方法を記憶することにより、継続的な統合方法による発話の繰り返しを避け、異なる統合方法による発話に変更させることも可能となる。さらには、発話片の統合方法と相互の関係性を記憶することにより、ユーザが最も関心を示す発話片の統合方法を推定することも可能となり、その種の統合方法による発話の回数を増やすような決定手法を構築することも可能となる。
本発明によれば、欠落要素または忘却要素を反映させた会話文によって、言葉足らずの表現や忘却した要素を尋ねる表現などをユーザに与えることができ、ユーザからの発話を促すことができる。このように、ユーザの発話を促すことにより、提供情報の内容について、ユーザの関心が引き出されることとなり、丁寧かつ正確な情報を提供することに資することとなる。また、このようなユーザの発話を促すことの結果として、対話型の情報提供が実現されるものである。
対話型情報提供システムに係る発明の実施形態を示す構成図である。 対話型情報提供方法に係る発明の実施形態(方略1)を示すフローチャートである。 対話型情報提供方法に係る発明の実施形態(方略2)を示すフローチャートである。 対話型情報提供方法に係る発明の実施形態(方略3)を示すフローチャートである。 方略決定方法の一例を示すフローチャートである。 対話型情報提供方法に係る発明の実施形態の変形例を示すフローチャートである。
以下、本発明の実施の形態を図面に基づいて説明する。図1は、対話型上表提供システムに係る実施形態の構成を示す図である。この図に示されているように、本システム10は、主に発話制御装置(発話制御手段)20とユーザの声を入力するための発話認識モジュール(音声入力手段)30とで構成されている。発話制御装置20は、後述する所定の機能を備えており、会話文を構築して出力するものであり、当該出力には、音声合成モジュール40を介してスピーカ41によって音声出力されるものである。なお、ユーザの音声を取得するためには、マイク31が設けられ、このマイクによって取得された音声信号を発話認識モジュールによりテキストデータ化したうえで、発話制御装置20に入力される。また、発話認識モジュール30およびテキスト音声合成モジュール40と、発話制御装置20との間には、インタラクション処理モジュール50が設けられ、出力される会話文(テキストデータ)と入力される音声(テキストデータ)との相互間の関連性を分析処理している。
発話正誤装置には、ユーザ態度推定モジュール(ユーザ態度推定手段)21が設けられ、インタラクション処理モジュール50を介して入力されるユーザの発話の状態から、ユーザの参加態度を推定することができる。ユーザの参加態度の推定は、インタラクション処理モジュール50による会話相互間の関係性のほかに、ユーザが発する語数、語調、強弱、応答のタイミングなど、複数の観点を数値化し、EL(Engagement Level)として、予め定めた数値との比較により行われる。この予定数値は複数の段階に区分し、第1次(θ1)および第2次(θ2)などを定め、EL値が第1次(θ1)未満の場合は、やや参加態度ありと推定し、EL値が第1次(θ1)と第2次(θ2)との中間であれば、十分な参加態度であると推定し、さらに、第2次(θ2)を超える場合は、非常に参加態度が大きいものと推定することができる。
このようにユーザの参加態度が(例示では3段階に)推定されると、その推定に応じた発話方略が発話方略モジュール(発話方略手段)22によって決定される。発話方略には、上記の参加態度に応じて複数の(ここでは3つの)方略が用意され、これらの中から形式的に選択されるものとしている。発話方略の選択は、例えば、やや参加態度ありの場合には方略1を、十分な参加態度ありの場合は方略2を、非常に参加態度が大きい場合には方略3を選択することができる。
方略1としては、「あのね」または「えーとね」などのターン開始要素を繰り返すことで、聞き手(ユーザ)の参加を引き出すものを例示することができる。これは、「いま、あなたの話しをちゃんと聞いていますよ」という聞き手(ユーザ)からの聞き手性(hearership)の表示を引き出すものである。また、「えー」や「あのー」などに代表されるフィラー、または、「・・・がね」や「・・・にね」などの発話片末のモダリティ、もしくは「・・・だって、知ってた?」のような発話終了後のモダリティなどを付与することによる聞き手(ユーザ)の応答を引き出すものも方略1に含めることができる。さらに、これらに代えて、またはこれらとともに、発話に間を置く(休止する)ことにより、聞き手(ユーザ)の関心を引き出すことを含めることができる。
方略2としては、欠落要素を反映させた言葉足らずの表現を例示することができる。これは、聞き手(ユーザ)の参加態度を引き出せていることが前提であるが、提供情報の一部を欠落させて(欠落要素を反映させて)表現を完結させることにより、聞き手(ユーザ)が大事な要素を聞きたいと志向することを利用し、さらなる聞き手(ユーザ)の関心や発話を引き出すものである。
方略3としては、忘却要素を反映させた表現を例示することができる。これは、聞き手(ユーザ)の参加態度が十分である場合に、聞き手(ユーザ)の積極的なアシストを引き出すものである。例えば、提供方法の途中において、一部要素を忘却したものとし(これを忘却要素という)、その要素をユーザにアシストしてもらえるように、例えば、「どこだったかな〜」や「何だっけな〜」などの表現を使用するものである。
また、発話制御装置20には、欠如文節決定モジュール(欠如文節決定手段)23が設けられ、上記のような複数の方略の中から特定の方略が決定されると、その方略に沿った会話文を構築するために、欠如文節決定モジュール23により、欠落要素となるべき文節または忘却要素となるべき文節を特定し、またはいずれも特定しないことを、決定することができるようになっている。欠落要素または忘却要素となるべき文節を特定することを決定するのは、前記方略2または方略3を実現する場合であり、特定しないことを決定するのは、方略1を実現する場合である。
さらに、本実施形態では、フィラー・モダリティ付与モジュール(フィラー・モダリティ付与手段)24が設けられており、ターン開始要素(「あのね」や「えーとね」など)、フィラー(「えー」や「あのー」など)、もしくはモダリティ(「・・・がね」や「・・・にね」など)を文節に付与し、会話文に近似させることができるものとしている。
なお、聞き手(ユーザ)の関心を引き出すための言葉足らずの表現は、幼児が発話するようなものであり、幼児の発話は、ある調査によれば平均して約2.86文節であることから、言葉足らずの表現では3文節以下とすることが望ましい。そして、言葉足らずであるため、例えば、「えーとね、今日はね、行ったんだよ。」と表現する場合、聞き手(ユーザ)は、「どこへ行ったの?」や「誰と行ったの?」などの問い掛けを発することとなり、その問い掛けに答える形式で「えーとね、・・・ちゃんと行ったの。」などの会話が成立することとなる。
また、忘却的な表現の場合には、「今日は、行ったんだよ。どこだっけ」、「あそこ、どこだっけ」、「・・・じゃないし」や「・・・でもないし」など、聞き手(ユーザ)からの回答を引き出すような表現とするものである。忘却要素が固有名詞であれば、その固有名詞に関連ある内容をヒントとして途中に発話させてもよい。
ところで、提供情報は、予め記憶させた内容でもよいが、本実施形態では、外部のニュースソースを情報源70として入力させるものとしている。外部のニュースソースとしては、外部装置に記憶させたものでもよいが、インターネット回線を通じて、リアルタイムにアップデイトされるニュースソースにアクセスして入手してもよい。これらの情報源を取得する構成が情報提供手段である。情報源の入力は有線で行ってもよいが無線によるものでもよい。入力された情報については、各種のニュースソースから入手されたテキストデータを解析して文節ごとに区切り、この文節から発話片を構築するのである。そのために、本実施形態は、形態素解析モジュール(形態素解析手段)11および係り受け解析モジュール(係り受け解析手段)12が設けられている。
形態素解析モジュール11は、複数の文節が連続する提供情報について、文節ごとに区切って発話片を構築するものであり、係り受け解析モジュール12は、発話片相互の係り受けを解析するものである。係り受けの解析は、文節ごとに一連の文章中の主格、目的格、場所格または述部などを把握するために用いられるものである。なお、形態素解析モジュール11としては、例えばMeCab(オープンソース)があり、係り受け解析モジュール12としては、例えばCabocha(オープンソース)がある。
また、本実施形態では、記憶部(記憶手段)60が設けられ、上記形態素解析や係り受け解析がなされた提供情報を一時的に記憶させることができるほか、インタラクション処理モジュール50により、出力データと入力データとの相互間の関係性を処理する際に、欠落要素や忘却要素などを一時的に記憶させておき、入力データとの比較のために利用させることができるものである。
上記のように、対話型情報提供システムに係る本実施形態は、外部から入手した提供情報から会話文を構築するとともに、その発話(出力)状態が、聞き手(ユーザ)の参加態度に応じて変化させることができるものであり、聞き手(ユーザ)の関心が引き出しながら、丁寧かつ正確な情報を提供することができる。そして、聞き手(ユーザ)の発話を促すことから、対話型の情報提供を実現するものである。
次に、上記システムによる対話型の情報提供方法について説明する。図2は、発話方略を決定するまでの流れを示すとともに、前記の方略1に係る情報提供方法を示している。また、図3は方略2、図4は方略4の各情報提供方法を示すものである。
図2に示すように、提供情報は、外部のニュースソースなどの情報源から入手し、これを形態素解析するとともに(S101)、係り受け解析することにより(S102)、発話片を構築しておき、これらを合成することにより会話文が構築できるように準備する。発話の最初は、ターン開始要素から開始し、さらに、場合によっては発話片にフィラーやモダリティを付与して、冒頭の会話文を構築したうえで出力するする(S103)。冒頭の会話文が出力されると、ユーザから発せられた音声を取得し、これをテキストデータに変換し、発話制御装置に入力する(S104)。入力されたデータに基づき、ユーザの参加態度が推定される(S105)。
参加態度の推定は、ユーザの発話状態を数値化することにより、予め定めた数値と比較によって方略を決定することができる。例えば、ユーザの発話状態を数値化したものをEL値とし、これを第1次レベル(θ1)および第2次レベル(θ2)と比較する。EL値が第1次レベル(θ1)以上の場合は、さらに、第2次レベル(θ2)未満か、またはそれ以上かが判断される(S107)。EL値が第1次レベル(θ1)以上かつ第2次レベル(θ2)未満の場合は、方略として、言葉足らずの発話の生成が選択される(S108)。これに対し、EL値が第2次レベル(θ2)以上である場合は、方略として忘却的な発話の生成が選択される。他方、EL値が第1次レベル(θ1)未満である場合には、当該EL値が「0」か否かが判断され(S110)、EL値が「0」の場合は、ユーザからの反応はないものとして、発話を終了させることができ、EL値が「0」でない場合は、ユーザは聞く姿勢を示していることから、ターン開始要素などを繰り返すことにより(S111)、ユーザの関心を高めるようにするのである。
なお、EL値が第1次レベル(θ1)未満の場合(0でない場合)は、ユーザの参加態度が低いものとして、前述の方策1による情報提供を行ってもよい。この場合には、「えー」や「あのー」などのフィラー、または、「・・・がね」や「・・・にね」などの発話片末のモダリティ、もしくは「・・・だって、知ってた?」のような発話終了後のモダリティなどを付与しながら、発話を出力し、ユーザの参加態度が上昇するまで、これを繰り返すことも可能である(S111)。
前記の方略決定段階(S107)において言葉足らずの発話の生成(方略2)が決定された場合は、図3に示すように、予め、形態素解析(S101)および係り受け解析(S102)により構築された発話片から、発話の文節数を決定し(S201)、かつ、欠落要素を決定したうえで(S202)、まずは、ターン開始要素とともに、フィラーやモダリティを付与した冒頭の表現を構築し(S203)、これを出力する。この出力により、ユーザの反応を前記と同様に、音声を入手し、さらにテキストデータ化して発話制御装置に入力して(S204)、再度、ユーザの参加態度を推定する(S205)。このとき、再度EL値を評価して(S206)、ユーザの参加態度が著しく低下している場合は方略1に戻る(A)。
適度な参加態度を示す場合は、欠落させた発話(言葉足らずの発話)を音声合成して出力する(S207)。この後、ユーザから欠落要素についての問い掛けの有無により、ユーザの反応を確認する(S208)。ユーザからの問い掛けがある場合は、欠落要素を補完する(問い掛けに答える)発話を音声合成して出力し(S209)、次の発話に備える(S210)。これに対し、ユーザからの問い掛けがない場合は、ターン開始要素から再度発話を繰り返すことにより、ユーザの関心を再度高めるような内容を出力する。なお、ユーザからの反応(S208)は、単なる声の入力をもって、ユーザからの問いかけがあるものと判断する方法でもよいが、欠落要素と、ユーザの応答とを比較し、欠落内容に関係があるキーワードの有無によって、相互の関係性を判断する方法(インタラクション処理ステップ)としてもよい。欠落要素とユーザの応答内容との比較には、記憶部(記憶手段)に欠落要素を記憶させておき、ユーザからの応答を入力するたびに比較することによることができる。
他方、前記の方略決定段階(S107)において忘却的な発話の生成(方略3)が決定された場合は、図4に示すように、忘却要素が決定される(S301)。この場合、方略2と同様に、予め、形態素解析(S101)および係り受け解析(S102)により発話片が構築されており、忘却要素は、上記発話片の中から選択される。なお、言葉足らずの発話と異なり、文節数は制限を設けず、その代わりに、忘却を示すモダリティが付与されるものである。
まず、ターン開始要素とともに、フィラーやモダリティを付与した冒頭の表現を構築し(S302)、これを出力することは方略2の場合と同様である。この出力により、ユーザの反応を前記と同様に、音声を入手し、さらにテキストデータ化して発話制御装置に入力して(S303)、再度、ユーザの参加態度を推定する(S304)。さらに、再度EL値を評価して(S305)、ユーザの参加態度が低下している場合は方略2に戻る(B)。
方略3が実行できる程度にユーザの参加態度が十分である場合には、忘却的な発話を音声合成して出力する(S306)。既に、ターン開始要素とともに冒頭の発話が出力されているため、当該冒頭の発話内容に関連付けて忘却的な内容が構築される。忘却要素が、ユーザに伝達されると、参加態度が十分なユーザは、当該忘却要素に関連ある単語を含む会話文を発するため、その内容を分析し、当該発話内容が忘却要素に関係あるものか、期待したものかを判断する(S307)。ユーザの発話が期待した単語を含まないものである場合は、モダリティを変更しながら、忘却的表現を繰り返すものとしている。期待された単語がユーザの発語に含められていれば、それに同調する表現を発し(S308)、例えば、「あ、そうそう」などを出力したうえで、次の提供情報を発話する(S309)。なお、継続する発話内容(伝達情報)がなければ、情報提供を終了させることとなる。
忘却的な発話を生成する場合には、ユーザからの反応(S307)は、忘却的な発話に対して期待できる回答であるか否かを中心に判断されるが、そのためには、記憶部(記憶手段)に忘却要素を記憶させておき、ユーザからの応答が入力される際、忘却要素に関係するキーワードの存否により判断するする方法(インタラクション処理ステップ)によることができる。なお、ユーザからの反応は、単純にユーザの発生した音声を入力したか否かによって、参加態度を推定してもよい。
このように、対話型情報提供方法に係る実施形態では、随時、ユーザの反応を確認し、その際の参加態度に応じて、方策を決定しつつ、情報を提供することができる。たとえ数分間といえども、ユーザの関心の程度は変化することから、情報提供しつつユーザの関心を引き出すような表現を構築しながら、適度な関係性を保った対話型の情報伝達が可能となっている。
本発明の実施形態は上記のとおりであるが、これらの実施形態は、本発明の一例を示すものであり、本発明がこれらに限定される趣旨ではない。例えば、過去の参加態度を参照しつつ、参加態度の基準値を設定し、当該基準値との比較により、現在の参加態度を推定してもよい。これは、ユーザの人種や性別、年齢などによって応答の程度が異なる場合に効果がある。例えば、欧米人の場合は、ターン開始要素や忘却要素を反映した発話の場合、音声で応答せず、次の発話を待つことがあり、女性は相槌に声を発するが男性は頷く程度であったり、また同じ男性でも応答する人がいるなど、ユーザの個性によって応答の状態は様々である。そのために、ユーザの個性に合った標準的な値をもって参加態度の基準とすることにより、当該基準値からどの程度の参加態度が認められるかを指標として、ユーザの個性に応じた参加態度の推定を行うことができる。
過去の参加態度を参照する場合として、例えば、図5に示すような方略の決定方法がある。この図に示すように、方略を決定する場合、まず、記憶部に記憶されているこれまでに蓄積されたユーザの参加態度の推定値、および、同様に蓄積されたインタラクション処理の結果を読み出し(S401,S402)、ユーザの参加態度の平均的な推定値から、ユーザにおける参加態度の基準値を算出する(S403)。インタラクション処理の蓄積結果から、インタラクション状態の評価の累計(反応の頻度など)を算出する(S404)。ここで、現在進行中の方略、または既に方略終了の場合は前回の方略を、記憶部に記憶されている情報から読み出し(S405)、参加態度の基準値やインタラクション状態を基準に、当該方略におけるユーザの参加態度を比較するのである(S406)。このとき、参加の状態が基準値よりも低ければ、またはインタラクション状態が悪ければ、参加状態を不良と判断して次回の方略を変更する。これに対して、当該方略におけるユーザの参加態度が良好であれば、当該方略を継続すべきか変更すべきかを判断する(S407)。このときの判断材料としては、同じ方略が数回継続していることなどを条件とすることができる。
なお、変更条件の回数としては、例えば、ルーレット選択法によることができる。これは、例示の3つの方略について、ランダムに方略を選択するのであり、ルーレットには、各方略について選択幅を有する選択項目を用意し、ユーザに対して有力な方略については、選択されやすいように、その選択幅(比重)を大きくするのである。そうすることにより、選択幅の広い方略は多くの回数が選択され、狭い方略は選択される回数が減少する。
また、方策の例示として、方策1、方策2および方策3を説明したが、ユーザの参加の程度が極めて大きい場合には、ユーザの反応を無視した情報提供を途中に挿入することも可能である。例えば、図6には、ユーザの参加態度が極めて大きい場合の欠落・忘却のない通常の発話を生成する際の情報提供方法を示すものである。この図に示されているように、EL値が、第2次レベル(θ2)を超え、さらに、その上の第3次レベル(θ3)を超える場合は、欠落・忘却のない発話を構築し、これを音声合成して出力する(S505)ものとしてもよい。この場合においてもターン開始要素から始まり(S501)、直前のEL値を比較する(S504)ことにより、最終的な方策として決定することができる。このEL値の比較(S504)において、EL値が第3次レベル(θ3)未満である場合は、忘却的な発話(方策3)に戻る(C)ようにしてもよい。
なお、通常の発話は、方略1、方略2または方略3の実行途中に、数回挿入してもよく、そのような場合には、一般的な会話としては自然なものとなる場合がある。
10 対話型情報提供システム
11 形態素解析モジュール(形態素解析手段)
12 係り受け解析モジュール(係り受け解析手段)
20 発話制御装置(発話制御手段)
21 ユーザ態度推定モジュール(ユーザ態度推定手段)
22 発話方略モジュール(発話方略手段)
23 欠如文節決定モジュール(発話文節決定手段)
24 フィラー・モダリティ付与モジュール(フィラー・モダリティ付与手段)
30 発話認識モジュール(音声入力手段)
31 マイク
40 テキスト音声合成モジュール
41 スピーカ
50 インタラクション処理モジュール
60 記憶部
70 情報源(外部装置など)

Claims (12)

  1. 提供情報について複数の文節に区切られた発話片を統合しつつ会話文を構築する発話制御手段と、ユーザが発する音声をテキストデータに変換して前記発話制御手段に入力する音声入力手段とを備え、
    前記発話制御手段は、ユーザの発話内容から随時ユーザの参加態度を数値化し、ユーザの参加態度を推定値として推定するユーザ態度推定手段と、該ユーザ態度推定手段により推定されるユーザの参加態度の推定値の大きさに応じて予め区分された複数段階ごとの前記発話片の統合方法が予め用意され、その中から推定された推定値に基づく特定の統合方法随時決定する発話方略手段と、該発話方略手段により決定された特定の統合方法に従って欠落要素もくしは忘却要素の反映またはこれらの非反映を決定する欠如文節決定手段と
    を備えることを特徴とする対話型情報提供システム。
  2. さらに、有線または無線によって接続される外部装置から提供情報を取得する情報提供手段を備えることを特徴とする請求項1に記載の対話型情報提供システム。
  3. さらに、入手された提供情報について文節ごとに区切って発話片を構築する形態素解析手段と、区切られた発話片における相互の係り受けを解析する係り受け解析手段とを備えることを特徴とする請求項2に記載の対話型情報提供システム。
  4. 前記発話制御手段は、さらに、前記欠如文節決定手段により決定された欠落要素もしくは忘却要素が反映された会話文またはこれらが反映されない会話文ついて、フィラーもしくはモダリティまたはこれら双方を前記いずれかの会話文に付与するフィラー・モダリティ付与手段を備えることを特徴とする請求項1ないし3のいずれかに記載の対話型情報提供システム。
  5. 前記ユーザ態度推定手段は、ユーザによる発話の内容に応じてユーザの参加態度の推定値を適宜変更るものであり、前記発話方略手段は、前記ユーザ態度推定手段によるユーザの参加態度の推定値の変更に応じて統合方法を修正するものである請求項1ないし4のいずれかに記載の対話型情報提供システム。
  6. さらに、前記欠落要素または忘却要素を記憶する欠如文節記憶手段を備え、前記発話方略手段は、前記ユーザ態度推定手段により推定されるユーザの参加態度の推定値に加えて、ユーザの発話の内容と前記欠如文節記憶手段に記憶される欠落要素または忘却要素の内容とを比較し、相互の関連性を判断した結果に応じて、発話片の統合方法を決定するものである請求項1ないし5のいずれかに記載の対話型情報提供システム。
  7. 提供情報について複数の文節に区切られた発話片を統合しつつ会話文を構築する発話制御手段と、ユーザが発する音声をテキストデータに変換して前記発話制御手段に入力する音声入力手段とを備える対話型情報提供システムにおいて、ユーザに対して対話型の情報を提供する対話型情報提供方法であって、
    前記発話制御手段による会話文の構築方法が、前記音声入力手段により入力されるユーザの発話内容から随時ユーザの参加態度を数値化し、ユーザの参加態度を推定する推定値を導出するユーザ態度推定ステップと、該ユーザ態度推定ステップにより推定されるユーザの参加態度の推定値の大きさに応じて予め区分された複数段階ごとの前記発話片の統合方法が予め用意され、その中から推定された推定値に基づく特定の統合方法随時決定する発話方略ステップと、該発話方略ステップにより決定された特定の統合方法に従って欠落要素もしくは忘却要素の反映またはこれらの非反映を決定する欠如文節決定ステップと
    を含むことを特徴とする対話型情報提供方法。
  8. 前記発話制御手段による会話文の構築方法は、さらに、前記欠如文節決定ステップにより決定された欠落要素もしくは忘却要素が反映された会話文またはこれらが反映されない会話文ついて、フィラーもしくはモダリティまたはこれら双方を前記いずれかの会話文に付与するフィラー・モダリティ付与ステップを備えることを特徴とする請求項7に記載の対話型情報提供方法。
  9. 前記発話制御手段による会話文の構築方法は、さらに、前記欠如文節決定ステップにより決定された欠落要素または忘却要素を反映した会話文の出力データと前記音声入力手段により入力される入力データとを比較し、前記出力データと入力データとの相互の関係性を判定するインタラクション処理ステップとを備えることを特徴とする請求項7または8に記載の対話型情報提供方法。
  10. 前記インタラクション処理ステップは、ユーザの発話の内容と前記欠如文節記憶手段に記憶される欠落要素または忘却要素の内容とを比較し、相互の関連性を判断するものである請求項に記載の対話型情報提供方法。
  11. 前記対話型情報提供システムは、さらに、前記ユーザ態度推定ステップにより推定されるユーザの参加態度の推定値、前記欠落要素または忘却要素、および、前記インタラクション処理ステップによる判定結果を記憶する記憶手段を備えるものであり、前記発話方略ステップは、前記ユーザ態度推定ステップにより推定されるユーザの参加態度の推定値に加えて、前記インタラクション処理ステップにより判定された結果に応じて、特定の統合方法を決定するものである請求項9または10に記載の対話型情報提供方法。
  12. 前記対話型情報提供システムは、さらに、前記ユーザ態度推定ステップにより推定されユーザの参加態度の推定値、前記発話方略ステップにより決定された発話片の統合方法、および、前記インタラクション処理ステップにより判定された結果を累積的に記憶する記憶手段を備えるものであり、前記ユーザ態度推定ステップは、累積的に記憶されるユーザの参加態度、統合方法および相互の関係性に基づいて、ユーザの参加態度の基準値を設定し、該基準値とユーザの参加態度の推定値との比較により、前記発話方略ステップにて決定された特定の統合方法を修正するものである請求項9ないし11のいずれかに記載の対話型情報提供方法。
JP2016234723A 2016-12-02 2016-12-02 対話型情報提供システムおよび対話型情報提供方法 Active JP6796326B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016234723A JP6796326B2 (ja) 2016-12-02 2016-12-02 対話型情報提供システムおよび対話型情報提供方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016234723A JP6796326B2 (ja) 2016-12-02 2016-12-02 対話型情報提供システムおよび対話型情報提供方法

Publications (2)

Publication Number Publication Date
JP2018091979A JP2018091979A (ja) 2018-06-14
JP6796326B2 true JP6796326B2 (ja) 2020-12-09

Family

ID=62565987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016234723A Active JP6796326B2 (ja) 2016-12-02 2016-12-02 対話型情報提供システムおよび対話型情報提供方法

Country Status (1)

Country Link
JP (1) JP6796326B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6731307B1 (en) * 2000-10-30 2004-05-04 Koninklije Philips Electronics N.V. User interface/entertainment device that simulates personal interaction and responds to user's mental state and/or personality

Also Published As

Publication number Publication date
JP2018091979A (ja) 2018-06-14

Similar Documents

Publication Publication Date Title
US11495217B2 (en) Automated assistants that accommodate multiple age groups and/or vocabulary levels
CN108536802B (zh) 基于儿童情绪的交互方法及装置
CN110730953B (zh) 基于创建者提供的内容定制交互式对话应用的方法、系统
CN107053186B (zh) 对话装置、机器人、对话方法以及存储介质
EP2157570B1 (en) Automatic conversation system and conversation scenario editing device
TWI376681B (en) Speech understanding system for semantic object synchronous understanding implemented with speech application language tags, and computer readable medium for recording related instructions thereon
EP1901283A2 (en) Automatic generation of statistical laguage models for interactive voice response applacation
US20170103757A1 (en) Speech interaction apparatus and method
Skantze et al. Towards incremental speech generation in conversational systems
JP2018124425A (ja) 音声対話装置及び音声対話方法
US20200243075A1 (en) Flexible-response dialogue system through analysis of semantic textual similarity
JP2018028752A (ja) 対話システム及びそのためのコンピュータプログラム
US20190206406A1 (en) Dialogue method, dialogue system, dialogue apparatus and program
James et al. Empathetic speech synthesis and testing for healthcare robots
KR101677859B1 (ko) 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치
JP2018072650A (ja) 音声対話装置及び音声対話方法
KR20150085145A (ko) 사용자 반응 기반 통역 시스템 및 그 방법
JP6715943B2 (ja) 対話装置、対話装置の制御方法、および制御プログラム
Needle et al. Gendered associations of English morphology
Strand et al. Grammatical context constrains lexical competition in spoken word recognition
Hansen et al. Systematic design of spoken prompts
JP6796326B2 (ja) 対話型情報提供システムおよび対話型情報提供方法
JP7172168B2 (ja) 対話装置、対話装置制御方法及びプログラム
Paci et al. Julius ASR for Italian children speech
JP2006330060A (ja) 音声合成装置、音声処理装置、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201002

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201109

R150 Certificate of patent or registration of utility model

Ref document number: 6796326

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250