JP6985311B2 - 相槌判定によって応答発話生成を制御する対話実施プログラム、装置及び方法 - Google Patents

相槌判定によって応答発話生成を制御する対話実施プログラム、装置及び方法 Download PDF

Info

Publication number
JP6985311B2
JP6985311B2 JP2019019481A JP2019019481A JP6985311B2 JP 6985311 B2 JP6985311 B2 JP 6985311B2 JP 2019019481 A JP2019019481 A JP 2019019481A JP 2019019481 A JP2019019481 A JP 2019019481A JP 6985311 B2 JP6985311 B2 JP 6985311B2
Authority
JP
Japan
Prior art keywords
utterance
word
response
question
utterances
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019019481A
Other languages
English (en)
Other versions
JP2020126186A (ja
Inventor
剣明 呉
啓一郎 帆足
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2019019481A priority Critical patent/JP6985311B2/ja
Publication of JP2020126186A publication Critical patent/JP2020126186A/ja
Application granted granted Critical
Publication of JP6985311B2 publication Critical patent/JP6985311B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ユーザとの間で対話を行う対話システムの技術に関する。
近年、ユーザとの間で対話を実施し、当該ユーザに種々のサービスを提供可能な対話システムの開発が盛んに進められている。例えば、現在普及しているスマートフォンには、ユーザの発話による問合せに音声で回答し、検索結果等の情報を提供する対話応答機能が常備されているものも少なくない。
このような対話システムでは、ユーザの発話であるユーザ発話に対し、如何に適切なシステム側の応答発話を生成するかが最重要の課題となる。
この課題に対し、例えば、非特許文献1には、リカレントニューラルネットワークの一種であるLSTM(Long Short term Memory)を用いたエンコーダ(encoder)及びデコーダ(Decoder)から構成された発話生成モデルであるSeq2Seq(Sequence to Sequence)モデルが開示されている。
このモデルのLSTMによるエンコーダでは、ユーザ発話の発話文を単語等のトークン(token)に分解し、当該発話文であるトークン列をID化した上で、各トークンをエンコーダに順次入力し、エンコーダ内で隠れベクトル(hidden vector)を順次生成して保持し、最後のトークンによる隠れベクトルをデコーダへ出力する。次いで、デコーダは、エンコーダから受け取った隠れベクトルを用いて、システム側の応答発話の発話文を構成するトークンを順次生成し、最終的に応答発話の発話文となるトークン列を出力するのである。
さらに、このようにして生成された大量の発話文・応答文のペアを学習データとして用いることによって、ユーザ発話からシステム側の応答発話を動的に生成可能なSeq2Seqモデルが構築されるのである。
Sutskever, I., Vinyals, O., and Le, Q. V., "Sequence to sequence learning with neural networks" NIPS Proceedings: Advances in Neural Information Processing Systems, 3104〜3112頁, 2014年
しかしながら、非特許文献1に記載された技術を含めた従来技術では、応答発話として単なる相槌が比較的に多く出力され、無難ではあるが内容の薄い対話になってしまう場合が少なくないとの問題が生じていた。
ここで、このような問題は、発話生成モデルを構築する際に使用される発話学習データが通常、人間同士の対話における発話から生成されたデータとなっており、当該データには実際に、「いいですね」、「そうですね」、「だよね」といった相槌が相当に多く含まれていることに起因して生じるのである。
このように、応答発話が無難な内容の提供に終始してしまうと、例えばユーザが対話を続けたいとの意欲も削がれがちとなってユーザの発話がそれほど行われなくなり、結果的に、対話システム設置の目的である、所望のユーザ情報の収集、ユーザへの適切なサービスの提供や、マーケティング成果の獲得等を達成することができなくなる場合も生じてしまう。
そこで、本発明は、対話の中で、対話先ユーザとのタッチポイント(接点,繋がり)をより拡充させることが可能な対話実施プログラム、装置及び方法を提供することを目的とする。
本発明によれば、入力発話を受け取って応答用発話を生成する応答用発話生成モデルを用いて対話を実施する装置に搭載されたコンピュータを機能させる対話実施プログラムであって、
上記の装置は、複数の名詞用の疑問詞を含む名詞用疑問詞リスト、及び複数の動詞用の疑問詞を含む動詞用疑問詞リストを備えた疑問詞リストと、多数の発話を含むコーパスとを有し、
本対話実施プログラムは、
当該応答用発話生成モデルの生成した応答用発話が、予め設定された相槌相当の発話であるか否かを判定する相槌判定手段と、
当該応答用発話が相槌相当の発話であると判定された際、当該入力発話から、所定条件を満たす語である重要語を抽出して、当該重要語が名詞の場合には当該名詞用疑問詞リストに含まれる疑問詞の中から、当該疑問詞と当該重要語とを含む語句が当該コーパスから検索される度合いに基づき疑問詞を選択し、また、当該重要語が動詞の場合には当該動詞用疑問詞リストに含まれる疑問詞の中から、当該疑問詞と当該重要語とを含む語句が当該コーパスから検索される度合いに基づき疑問詞を選択して、選択した疑問詞と当該重要語とを含んだ質問相当の追加発話を生成し、当該追加発話を当該応答用発話に追加した発話を、応答発話として出力する応答発話生成手段と
してコンピュータを機能させ
当該相槌相当の発話は、間投詞、又は理解、共感若しくは同意を示す語句・短文、又は当該間投詞若しくは当該語句・短文に類似する語句・短文である
ことを特徴とする対話実施プログラムが提供される。
さらに、本発明による対話実施プログラムの他の実施形態として
当該応答用発話生成モデルは、文脈情報としての追加発話、入力発話及び応答用発話が組になった学習データによって構築された、追加発話を考慮して応答用発話を出力する応答用発話生成モデルであり、または、当該学習データによって構築された、追加発話を考慮して応答用発話を出力する応答用発話生成モデルが別途設けられており、
本対話実施プログラムは、生成された追加発話を文脈情報として、次いで取得された入力発話とともに当該追加発話を考慮して応答用発話を出力する応答用発話生成モデル入力し、応答用発話を出力させるモデル制御手段としてコンピュータを更に機能させることも好ましい。
本発明によれば、また、入力発話を受け取って応答用発話を生成する応答用発話生成モデルを用いて対話を実施する装置であって、
複数の名詞用の疑問詞を含む名詞用疑問詞リスト、及び複数の動詞用の疑問詞を含む動詞用疑問詞リストを備えた疑問詞リストと、
多数の発話を含むコーパスと、
当該応答用発話生成モデルの生成した応答用発話が、予め設定された相槌相当の発話であるか否かを判定する相槌判定手段と、
当該応答用発話が相槌相当の発話であると判定された際、当該入力発話から、所定条件を満たす語である重要語を抽出して、当該重要語が名詞の場合には当該名詞用疑問詞リストに含まれる疑問詞の中から、当該疑問詞と当該重要語とを含む語句が当該コーパスから検索される度合いに基づき疑問詞を選択し、また、当該重要語が動詞の場合には当該動詞用疑問詞リストに含まれる疑問詞の中から、当該疑問詞と当該重要語とを含む語句が当該コーパスから検索される度合いに基づき疑問詞を選択して、選択した疑問詞と当該重要語とを含んだ質問相当の追加発話を生成し、当該追加発話を当該応答用発話に追加した発話を、応答発話として出力する応答発話生成手段と
を有し、
当該相槌相当の発話は、間投詞、又は理解、共感若しくは同意を示す語句・短文、又は当該間投詞若しくは当該語句・短文に類似する語句・短文である
ことを特徴とする対話実施装置が提供される。
本発明によれば、さらに、入力発話を受け取って応答用発話を生成する応答用発話生成モデルを用いて対話を実施する装置に搭載されたコンピュータにおいて実施される方法であって、
上記の装置は、複数の名詞用の疑問詞を含む名詞用疑問詞リスト、及び複数の動詞用の疑問詞を含む動詞用疑問詞リストを備えた疑問詞リストと、多数の発話を含むコーパスとを有し、
本方法は、
当該応答用発話生成モデルの生成した応答用発話が、予め設定された相槌相当の発話であるか否かを判定するステップと、
当該応答用発話が相槌相当の発話であると判定された際、当該入力発話から、所定条件を満たす語である重要語を抽出して、当該重要語が名詞の場合には当該名詞用疑問詞リストに含まれる疑問詞の中から、当該疑問詞と当該重要語とを含む語句が当該コーパスから検索される度合いに基づき疑問詞を選択し、また、当該重要語が動詞の場合には当該動詞用疑問詞リストに含まれる疑問詞の中から、当該疑問詞と当該重要語とを含む語句が当該コーパスから検索される度合いに基づき疑問詞を選択して、選択した疑問詞と当該重要語とを含んだ質問相当の追加発話を生成し、当該追加発話を当該応答用発話に追加した発話を、応答発話として出力するステップと
を有し、
当該相槌相当の発話は、間投詞、又は理解、共感若しくは同意を示す語句・短文、又は当該間投詞若しくは当該語句・短文に類似する語句・短文である
ことを特徴とする対話実施方法が提供される。
本発明の対話実施プログラム、装置及び方法によれば、対話の中で、対話先ユーザとのタッチポイント(接点,繋がり)をより拡充させることができる。
本発明による対話実施装置の一実施形態における機能構成を示す機能ブロック図である。 本発明に係る相槌判定部及び応答発話生成部における相槌判定処理及び応答発話生成処理の一実施例を説明するための模式図である。 本発明に係る追加発話生成部における追加発話生成処理の一実施例を説明するための模式図である。 本発明による対話実施装置の他の実施形態における機能構成を示す機能ブロック図である。
以下、本発明の実施形態について、図面を用いて詳細に説明する。
[対話実施装置]
図1は、本発明による対話実施装置の一実施形態における機能構成を示す機能ブロック図である。
図1によれば、本発明の一実施形態としての対話実施装置1は、ユーザが当該装置に対しユーザインタフェース(UI)101を介して対話を行うことができる装置である。
ここで、ユーザインタフェース101がマイク及びスピーカであって、ユーザがユーザ発話を音声で入力し、装置側発話が同じく音声で出力されてもよい。または、ユーザインタフェース101がタッチパネル・ディスプレイであって、ユーザがユーザ発話をタッチパネルに対するタップ等の入力操作をもって入力し、一方、装置側発話がディスプレイに表示されてもよい。さらに、上述した発話入出力の混合形態をとることも勿論可能である。
本実施形態において、対話実施装置1は、装置へ入力されたユーザ発話である入力発話を受け取って、装置側発話を生成するための応答用発話を生成する発話生成モデル102を備えている。この発話生成モデル102は、例えば公知のSeq2Seq(Sequence to Sequence)等のモデルとすることができる。
ここで従来、このようなモデルを構築するのに人間同士の対話に基づく発話学習データが利用されてきたが、当該データには実際に、「いいですね」、「そうですね」、「だよね」といった「相槌相当の発話」が相当に多く含まれている。その結果、発話生成モデル102から応答用発話として、単なる「相槌相当の発話」が比較的に多く出力されてしまう。ここで従来通りにこのような発話をそのまま装置側発話としてユーザに提供したならば、無難ではあるが内容の薄い対話になってしまう可能性が高くなる。
これに対し、対話実施装置1は、具体的にその特徴として、
(A)発話生成モデル102の生成した応答用発話が、予め設定された「相槌相当の発話」であるか否かを判定する相槌判定部113と、
(B)応答用発話が「相槌相当の発話」であると判定された際、入力発話の内容に基づいて「追加発話」を生成し、「追加発話」を応答用発話に追加した発話を、応答発話として出力する応答発話生成部114と
を有している。
ここで、「相槌相当の発話」とは、
(A1)間投詞(感嘆詞)、
(A2)理解、共感若しくは同意を示す語句・短文、又は
(A3)上記(A1)の間投詞若しくは上記(A2)の語句・短文に類似する語句・短文
との意味である。
また、上記(A3)の「類似する」とは、類似度算出対象の語句・短文間の類似度が所定閾値以上になることとしてもよい。さらに、この類似度としては、類似度算出対象の語句・短文を、品詞種別やその意味内容を特徴付ける特徴ベクトルVに変換し、例えば次式によって算出されるこれら特徴ベクトルV間におけるコサイン(cos)類似度sを、この類似度として採用することができる。
(1) s(i,j)=cosθij=(Vi・Vj)/(|Vi||Vj|)
Vi,Vj:類似度算出対象それぞれの特徴ベクトル
このように、対話実施装置1は、発話生成モデル102が「相槌相当の発話」を生成した際、単にその「相槌相当の発話」を応答発話として出力するのではなく、入力発話の内容に基づいて生成した「追加発話」を加味した発話を、応答発話として出力するのである。
これにより、ユーザは自らの発話に対し、単なるありがちな相槌や相槌相当の返答のみを受け取るのではなく、自らの発話に基づいた内容を有する応答を受け取ることになり、この装置1との対話について、より多くの充実感や親近感を得ることができる。
またそれとともに、ユーザは、このような装置側応答によって発話し易い感じを受けることになり、この後もより多くの発話を行う可能性が高くなる。このようにして、対話実施装置1は、当該対話の中で、対話先のユーザとのタッチポイント(接点,繋がり)をより拡充させることが可能となるのである。
なお変更態様として、対話実施装置1は、発話生成モデル102を保有する代わりに、発話送受信制御部116及び通信インタフェース106を介して対話制御サーバ2の保有する発話生成モデル21と通信接続し、この発話生成モデル21を利用して対話を実施してもよい。
また、後述する会話コーパス105についても、これを保有するのではなく、対話制御サーバ2の会話コーパス22を利用する態様をとることも可能である。このような変更態様では、対話実施装置1が発話生成モデルや会話コーパスを保有する必要がないので、例えばメモリ容量の小さな端末でも、対話実施装置1を具現可能となる。
[装置機能構成]
同じく図1の機能ブロック図によれば、対話実施装置1は、ユーザインタフェース(UI)101と、発話生成モデル102と、相槌リスト103と、疑問詞リスト104と、会話コーパス105と、通信インタフェース106と、プロセッサ・メモリとを有する。
ここで、このプロセッサ・メモリは、本発明による対話実施プログラムの一実施形態を保存しており、また、コンピュータ機能を有していて、この対話実施プログラムを実行することによって、対話処理を実施する。このことから、対話実施装置1は、対話ロボットやスマートスピーカ等の対話専用装置であってもよいが、本発明による対話実施プログラム(アプリ)を搭載した例えばスマートフォン、タブレット型若しくはノート型コンピュータや、パーソナル・コンピュータ(PC)等とすることも可能である。
さらに、このプロセッサ・メモリは、機能構成部として、発話入出力制御部111と、入力発話解析部112と、相槌判定部113と、追加発話生成部114aを含む応答発話生成部114と、モデル制御部115と、発話送受信制御部116とを有する。なお、これらの機能構成部は、プロセッサ・メモリに保存された対話実施プログラムの機能と捉えることができる。また、図1における対話実施装置1の機能構成部間を矢印で接続して示した処理の流れは、本発明による対話実施方法の一実施形態としても理解される。
同じく図1の機能ブロック図において、発話入出力制御部111は、ユーザインタフェース101を介して入力された入力発話であるユーザ発話を発話デジタルデータに変換して入力発話解析部112へ出力し、一方、応答発話生成部114で生成された応答発話である装置側発話を表示データや音声データに変換してユーザインタフェース101へ出力する。
入力発話解析部112は、入力された入力発話(ユーザ発話デジタルデータ)を、発話生成モデル102への入力に適した形に変換した上で、発話生成モデル102に対するインタフェースであるモデル制御部115を介し、発話生成モデル102へ出力する。
例えば、この後説明するように発話生成モデル102がSeq2Seq(Sequence to Sequence)モデルやHRED(Hierarchical Recurrent Encoder-Decoder)モデルである場合、入力発話解析部112は入力発話を、単語等のトークン(token)に分解してトークン列(さらには、それをID化したデータ)へ変換してもよい。
発話生成モデル102は、本実施形態では対話先ユーザのユーザ発話である入力発話を受け取って応答用発話を生成するモデルであり、例えば非特許文献1に開示されたSeq2Seqモデルとすることができる。Seq2Seqは一問一答の処理を行い、過去の1個の発話から応答用発話を生成するものである。
また、発話生成モデル102として、Seq2Seqを発展させたモデルであるHREDモデルを採用してもよい。HREDは、過去の複数個の発話から応答用発話を生成可能となっている。このように発話生成モデル102がHREDモデルである場合、上記(B)の「追加発話」の生成は、同じく過去の複数個の「入力発話」の内容に基づいて実施されてもよい。
相槌判定部113は、発話生成モデル102の生成した応答用発話が、「相槌相当の発話」であるか否かを判定する。ここで、「相槌相当の発話」は、予め設定された語句・短文であって上記(A1)〜(A3)に相当する語句・短文として相槌リスト103に登録されている。相槌判定部113は、入力された応答用発話が、相槌リスト103に登録された語句・短文のいずれかに該当するならば、当該応答用発話は「相槌相当の発話」であると判定するのである。
また変更態様として、上記(A1)及び(A2)に相当する語句・短文が相槌リスト103に登録されていて、相槌判定部113は、入力された応答用発話が、この相槌リスト103に登録された語句・短文のいずれかに該当するか、又は当該語句・短文のいずれかと類似するならば、当該応答用発話は「相槌相当の発話」であると判定してもよい。
同じく図1の機能ブロック図において、応答発話生成部114の追加発話生成部114aは、相槌判定部113において応答用発話が「相槌相当の発話」であると判定された際、発話生成モデル102へ入力された(1つ又は複数の)入力発話の内容に基づいて追加発話を生成する。次いで、応答発話生成部114は、このように生成された追加発話を応答用発話に追加した発話を、応答発話として出力する。
一方、応答発話生成部114は、相槌判定部113において応答用発話が「相槌相当の発話」ではないと判定された際には、発話生成モデル102の生成した応答用発話をそのまま、応答発話として出力する。
ここで、追加発話生成処理の一実施形態として、追加発話生成部114aは、発話生成モデル102へ入力された1つの入力発話から、所定条件を満たす語である「重要語」を抽出し、「重要語」と「疑問詞」とを含んだ質問相当の追加発話を生成することも好ましい。
このうち「重要語」については、入力発話に対し述語項構造解析を行って入力発話内の動詞(述語)に対する名詞を抽出し、当該名詞又は動詞を「重要語」としてもよい。または、入力発話に対し述語項構造解析又は形態素解析を行い、単純に入力発話中で最後に出現している名詞又は動詞を「重要語」とすることも可能である。ちなみに、上述したように「重要語」は、過去の複数の入力発話から抽出されて所定条件の下で選択されてもよい。
また、「疑問詞」については、複数の疑問詞が予め登録された疑問詞リスト104を用い、その中から、抽出された「重要語」を勘案して1つを選択することができる。具体的には、追加発話生成部114aは、多数の発話を含む会話コーパス105を利用し、疑問詞リスト104に登録された疑問詞の中から、当該疑問詞と「重要語」とを含む語句が会話コーパス105から検索される度合いに基づいて1つを選択し、追加発話生成用の「疑問詞」としてもよい。
なお、以上に述べた「重要語」及び「疑問詞」の選択処理及び追加発話生成処理については、後に図2及び図3に示した実施例を通して詳細に説明する。
モデル制御部115は、発話生成モデル104に対するインタフェース機能部であり、1つの好適な実施形態として、追加発話生成部114aで生成された追加発話を、文脈情報として、次いで取得された入力発話とともに発話生成モデル104に入力する。この追加発話を文脈情報として利用する実施形態については、この後、図2に示した実施例を通して詳細に説明を行う。
[実施例]
図2は、相槌判定部113及び応答発話生成部114における相槌判定処理及び応答発話生成処理の一実施例を説明するための模式図である。
図2に示した実施例では最初に、対話実施装置1は、「なんの食べ物が好きですか?」との装置側発話をユーザへ出力する。これに対し、ユーザは、ユーザ発話「カレーが好きです。」を装置1へ入力する。次いで、このユーザ発話を入力発話として受け取った発話生成モデル102は、応答用発話として「いいですね。」を出力する。
この応答用発話を受け取った相槌判定部113は、これが「相槌相当の発話」であるとの判定を行い、この判定結果を応答発話生成部114へ通知する。応答発話生成部114の追加発話生成部114aは、この判定結果を受け、入力発話「カレーが好きです」に基づいて追加発話「どこのカレーですか?」を生成する。ここでの追加発話生成処理については、後に図3を用いて詳細に説明する。
次いで、応答発話生成部114は、発話生成モデル102から出力された応答用発話「いいですね。」と生成した追加発話「どこのカレーですか?」とを結合させて、応答発話「いいですね。どこのカレーですか?」を生成し、ユーザへ出力するのである。
以上述べたように本実施例では、ユーザ発話「カレーが好きです。」に対する応答発話として、「いいですね。」との相槌だけでなく、会話を円滑に継続させその内容を深めるような疑問・掘り下げ質問の発話「どこのカレーですか?」も併せてユーザへ提示されている。
その結果、この後のユーザの発話が促され、次のターンのユーザ返答発話「よくインド料理屋で食べてるよ。」を得ることができる。またさらに、このユーザ発話に対し、相槌「そうなんだ。」だけでなく「誰と一緒に食べてますか?」との疑問・掘り下げ質問の発話を更に繰り出すこともできるのである。このようにして、対話をより進展させ深めることができるので、ユーザは、より多くの充実感や親近感を得ることも可能となる。
ちなみに、本実施例では、「そうなんだ。誰と一緒に食べてますか?」との装置側発話に対するユーザの返答発話「大学の友人。」に対し、発話生成モデル102は、応答用発話として「友達と一緒に食べるなんて最高。」を出力する。ここで、相槌判定部113は、このユーザの返答発話が「相槌相当の発話」ではないとの判定を行い、応答発話生成部114はこの判定結果を受けて、発話生成モデル102から出力された応答用発話「友達と一緒に食べるなんて最高。」を、そのまま応答発話としてユーザへ出力している。
また、本実施例では、最初に生成された追加発話「どこのカレーですか?」が、文脈情報としてモデル制御部115を介し、次のターンとして取得された入力発話「よくインド料理屋で食べてるよ。」とともに、発話生成モデル102へ入力されている。これにより、発話生成モデル102における応答用発話生成処理の精度(対話文脈上の適切さ)が向上するのである。
ちなみに本実施例では、発話生成モデル102はSeq2Seqモデルであり、入力発話(ユーザ発話)及び応答用発話(装置側発話)がペアになった学習データによってモデル構築処理(学習処理)が行われる。ここで、上述したような追加発話を文脈情報として利用する形態に合わせ、追加発話、入力発話及び応答用発話が組になった学習データによってモデル構築を行うことも好ましい。
さらに、追加発話を文脈情報として利用する際には、それに合わせて構築した別のモデルを用いることも可能である。例えば、発話生成モデル102が、追加発話を考慮せずに応答用発話を出力するSeq2Seqモデルと、追加発話を考慮して応答用発話を出力するSeq2Seqモデルとを備えていてもよい。
図3は、追加発話生成部114aにおける追加発話生成処理の一実施例を説明するための模式図である。
図3に示した実施例によれば、入力発話「カレーが好きです。」を受け取った発話生成モデル102は、応答用発話として「いいですね。」を出力して、相槌判定部113は、これを相槌であると判定し、さらに追加発話生成部114aは、この判定結果を受けて、入力発話「カレーが好きです。」から重要語「カレー」を抽出している。
具体的に、追加発話生成部114aは、入力発話「カレーが好きです。」に対し述語項構造解析を行い、発話文中において最後に出現する名詞又は動詞を特定し、これを重要語として抽出する処理を行っており、本実施例では、重要語として名詞「カレー」が抽出されている。
次に、追加発話生成部114aは、疑問詞リスト104に登録されている各疑問詞と重要語「カレー」とを連結させた複数の疑問詞・重要語候補を生成する。ここで本実施例において、疑問詞リスト104は、名詞用疑問詞リスト及び動詞用疑問詞リストを含んでおり、追加発話生成部114aは、
(a)抽出された重要語が名詞である場合、名詞用疑問詞リストから疑問詞を取り出して疑問詞・重要語候補を生成し、一方、
(b)抽出された重要語が動詞である場合、動詞用疑問詞リストから疑問詞を取り出して疑問詞・重要語候補を生成する。
したがって本実施例では、名詞用疑問詞リストの各疑問詞と、名詞である重要語「カレー」とを連結させた疑問詞・重要語候補が生成されるのである。
追加発話生成部114aは次いで、会話コーパス105を利用し、当該コーパス中に含まれる発話群における、各追加発話候補の出現確率を算出し、最も出現確率の高い疑問詞・重要語候補をなす疑問詞「どこの」を選定している。その結果本実施例では、この「どこの」及び重要語「カレー」を含む追加発話「どこのカレーですか?」が生成されるのである。またこれにより、重要語「カレー」と関連性の高い疑問詞「どこの」と連結した掘り下げ質問を含む発話をユーザへ提示することが可能となる。
ちなみに、上記の「出現確率」として例えば、N-gram言語モデルにおける疑問詞・重要語候補(本実施例では単語列:「疑問詞」,「カレー」)のN-gram確率を算出してもよい。ここで、N-gram言語モデルは、単語列wn=w1,w2,・・・,wnにおける各単語の生起確率P(wi)が直前の(N-1)個の単語のみに依存するという公知の言語モデルであり、N-gram確率は、このN-gram言語モデルにおける当該単語列wnの生起確率P(wn)のことである。
また以上に説明した追加発話生成処理の変更態様として、追加発話生成部114aは、疑問・掘り下げ質問の追加発話ではなく、「同意・共感の意を重ねる又は強調する追加発話」を生成してもよい。例えば、重要語の意味内容毎に、当該重要語を当て嵌めれば同意・共感を示す発話が完成する発話テンプレートを用意しておき、抽出された重要語の意味内容に応じ発話テンプレートを選択して当該重要語を当て嵌めることにより、その前の「相槌相当の発話」に対し「同意・共感の意を重ねる又は強調する追加発話」を生成してもよいのである。
具体的には、図2に示したユーザ発話「カレーが好きです。」に対し、抽出された重要語「カレー」を用いて、「私もカレーが食べたいです。」との追加発話を生成し、応答発話「いいですね。私もカレーが食べたいです。」を出力することができる。
ここで、「相槌相当の発話」の定義として述べた上記(A2)の「理解、共感若しくは同意を示す語句・短文」には、例えば「そうなんですよね」が該当する。これに対し、上述した追加発話は、例えば「私も(重要語)が好きなんです。」となり、まさに「同意・共感の意を重ねる又は強調する追加発話」となっているのである。
[対話実施装置の他の実施形態]
図4は、本発明による対話実施装置の他の実施形態における機能構成を示す機能ブロック図である。
図4によれば、本実施形態の対話実施装置3は、図1に示した対話実施装置1と同様、ユーザとの間で対話を実施することができる装置となっている。ただし、対話実施装置3は、対話実施装置1とは異なり、対話先であるユーザの有するユーザ端末4との間で通信ネットワークを介して通信接続されており、当該ユーザは、ユーザ端末4のユーザインタフェース(例えばマイク・スピーカやタッチパネル・ディスプレイ等)を介して、対話実施装置3との間で対話を行うことになる。
また、図4の機能ブロック図に示した対話実施装置3の機能構成部については、通信インタフェース306及び発話送受信制御部316を除き、対話実施装置1(図1)における同名の機能構成部と同様の機能を有し、同様の処理を実施する機能構成部となっている。
ここで、発話送受信制御部316は、
(a)通信インタフェース306を介し、ユーザ端末4からユーザ発話を受け取り、入力発話として入力発話解析部312に入力し、
(b)応答発話生成部314で生成された応答発話を、通信インタフェース306を介し、ユーザ端末4に送信する。
すなわち、発話送受信制御部316は、図1に示した対話実施装置1における発話入出力制御部111に対応する機能を果たす構成部となっている。
このような対話実施装置3によっても、ユーザは自らの発話に対し、単なるありがちな相槌や相槌相当の返答のみを受け取るのではなく、自らの発話に基づいた内容を有する応答を受け取ることになり、装置との対話について、より多くの充実感や親近感を得ることができる。またそれとともに、ユーザは、このような装置側応答によって発話し易い感じを受けることになり、この後もより多くの発話を行う可能性が高くなる。このようにして、対話実施装置3も、当該対話の中で、対話先のユーザとのタッチポイント(接点,繋がり)をより拡充させることが可能となるのである。
ちなみに、以上詳細に説明した本発明による対話実施装置における対話実施方法は、対話シナリオ生成方法にも適用可能となっている。例えば、「ユーザ発話」とそれに対する「装置側発話」との多数のペアを含む基準対話シナリオが存在する場合において、
(A’)この基準対話シナリオ中の「装置側発話」が、予め設定された「相槌相当の発話」であるか否かを判定するステップと、
(B1’)当該「装置側発話」が「相槌相当の発話」であると判定された際、それに対応する「ユーザ発話」の内容に基づいて「追加発話」を生成するステップと、
(B2’)基準対話シナリオにおいて、当該「装置側発話」に当該「追加発話」を追加した発話を、新たな「装置側発話」とする書き換えを行うステップと
を行うことができる。
これにより、それを用いた対話の中で、対話先ユーザとのタッチポイント(接点,繋がり)をより拡充させることができるような対話シナリオが生成可能となるのである。
以上詳細に説明したように、本発明によれば、対話先のユーザは自らの発話に対し、単なるありがちな相槌や相槌相当の返答のみを受け取るのではなく、自らの発話に基づいた内容を有する応答を受け取ることになり、装置との対話について、より多くの充実感や親近感を得ることができる。
またそれとともに、対話先ユーザは、このような装置側応答によって発話し易い感じを受けることになり、この後もより多くの発話を行う可能性が高くなる。このようにして、対話の中で、対話先ユーザとのタッチポイント(接点,繋がり)をより拡充させることが可能となる。
以上に述べた本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1、3 対話シナリオ生成装置
101 ユーザインタフェース(UI)
102、302 発話生成モデル
103、303 相槌リスト
104、304 疑問詞リスト
105、305 会話コーパス
106、306 通信インタフェース
111 発話入出力制御部
112、312 入力発話解析部
113、313 相槌判定部
114、314 応答発話生成部
114a、314a 追加発話生成部
115、315 モデル制御部
116、316 発話送受信制御部
2 対話制御サーバ
21 発話生成モデル
22 会話コーパス
4 ユーザ端末

Claims (4)

  1. 入力発話を受け取って応答用発話を生成する応答用発話生成モデルを用いて対話を実施する装置に搭載されたコンピュータを機能させる対話実施プログラムであって、
    前記装置は、複数の名詞用の疑問詞を含む名詞用疑問詞リスト、及び複数の動詞用の疑問詞を含む動詞用疑問詞リストを備えた疑問詞リストと、多数の発話を含むコーパスとを有し、
    前記対話実施プログラムは、
    当該応答用発話生成モデルの生成した応答用発話が、予め設定された相槌相当の発話であるか否かを判定する相槌判定手段と、
    当該応答用発話が相槌相当の発話であると判定された際、当該入力発話から、所定条件を満たす語である重要語を抽出して、当該重要語が名詞の場合には当該名詞用疑問詞リストに含まれる疑問詞の中から、当該疑問詞と当該重要語とを含む語句が当該コーパスから検索される度合いに基づき疑問詞を選択し、また、当該重要語が動詞の場合には当該動詞用疑問詞リストに含まれる疑問詞の中から、当該疑問詞と当該重要語とを含む語句が当該コーパスから検索される度合いに基づき疑問詞を選択して、選択した疑問詞と当該重要語とを含んだ質問相当の追加発話を生成し、当該追加発話を当該応答用発話に追加した発話を、応答発話として出力する応答発話生成手段と
    してコンピュータを機能させ
    当該相槌相当の発話は、間投詞、又は理解、共感若しくは同意を示す語句・短文、又は当該間投詞若しくは当該語句・短文に類似する語句・短文である
    とを特徴とする対話実施プログラム。
  2. 当該応答用発話生成モデルは、文脈情報としての追加発話、入力発話及び応答用発話が組になった学習データによって構築された、追加発話を考慮して応答用発話を出力する応答用発話生成モデルであり、または、当該学習データによって構築された、追加発話を考慮して応答用発話を出力する応答用発話生成モデルが別途設けられており、
    生成された追加発話を文脈情報として、次いで取得された入力発話とともに当該追加発話を考慮して応答用発話を出力する応答用発話生成モデル入力し、応答用発話を出力させるモデル制御手段としてコンピュータを更に機能させることを特徴とする請求項1に記載の対話実施プログラム。
  3. 入力発話を受け取って応答用発話を生成する応答用発話生成モデルを用いて対話を実施する装置であって、
    複数の名詞用の疑問詞を含む名詞用疑問詞リスト、及び複数の動詞用の疑問詞を含む動詞用疑問詞リストを備えた疑問詞リストと、
    多数の発話を含むコーパスと、
    当該応答用発話生成モデルの生成した応答用発話が、予め設定された相槌相当の発話であるか否かを判定する相槌判定手段と、
    当該応答用発話が相槌相当の発話であると判定された際、当該入力発話から、所定条件を満たす語である重要語を抽出して、当該重要語が名詞の場合には当該名詞用疑問詞リストに含まれる疑問詞の中から、当該疑問詞と当該重要語とを含む語句が当該コーパスから検索される度合いに基づき疑問詞を選択し、また、当該重要語が動詞の場合には当該動詞用疑問詞リストに含まれる疑問詞の中から、当該疑問詞と当該重要語とを含む語句が当該コーパスから検索される度合いに基づき疑問詞を選択して、選択した疑問詞と当該重要語とを含んだ質問相当の追加発話を生成し、当該追加発話を当該応答用発話に追加した発話を、応答発話として出力する応答発話生成手段と
    を有し、
    当該相槌相当の発話は、間投詞、又は理解、共感若しくは同意を示す語句・短文、又は当該間投詞若しくは当該語句・短文に類似する語句・短文である
    とを特徴とする対話実施装置。
  4. 入力発話を受け取って応答用発話を生成する応答用発話生成モデルを用いて対話を実施する装置に搭載されたコンピュータにおいて実施される方法であって、
    前記装置は、複数の名詞用の疑問詞を含む名詞用疑問詞リスト、及び複数の動詞用の疑問詞を含む動詞用疑問詞リストを備えた疑問詞リストと、多数の発話を含むコーパスとを有し、
    前記方法は、
    当該応答用発話生成モデルの生成した応答用発話が、予め設定された相槌相当の発話であるか否かを判定するステップと、
    当該応答用発話が相槌相当の発話であると判定された際、当該入力発話から、所定条件を満たす語である重要語を抽出して、当該重要語が名詞の場合には当該名詞用疑問詞リストに含まれる疑問詞の中から、当該疑問詞と当該重要語とを含む語句が当該コーパスから検索される度合いに基づき疑問詞を選択し、また、当該重要語が動詞の場合には当該動詞用疑問詞リストに含まれる疑問詞の中から、当該疑問詞と当該重要語とを含む語句が当該コーパスから検索される度合いに基づき疑問詞を選択して、選択した疑問詞と当該重要語とを含んだ質問相当の追加発話を生成し、当該追加発話を当該応答用発話に追加した発話を、応答発話として出力するステップと
    を有し、
    当該相槌相当の発話は、間投詞、又は理解、共感若しくは同意を示す語句・短文、又は当該間投詞若しくは当該語句・短文に類似する語句・短文である
    とを特徴とする対話実施方法。
JP2019019481A 2019-02-06 2019-02-06 相槌判定によって応答発話生成を制御する対話実施プログラム、装置及び方法 Active JP6985311B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019019481A JP6985311B2 (ja) 2019-02-06 2019-02-06 相槌判定によって応答発話生成を制御する対話実施プログラム、装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019019481A JP6985311B2 (ja) 2019-02-06 2019-02-06 相槌判定によって応答発話生成を制御する対話実施プログラム、装置及び方法

Publications (2)

Publication Number Publication Date
JP2020126186A JP2020126186A (ja) 2020-08-20
JP6985311B2 true JP6985311B2 (ja) 2021-12-22

Family

ID=72084860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019019481A Active JP6985311B2 (ja) 2019-02-06 2019-02-06 相槌判定によって応答発話生成を制御する対話実施プログラム、装置及び方法

Country Status (1)

Country Link
JP (1) JP6985311B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006039120A (ja) * 2004-07-26 2006-02-09 Sony Corp 対話装置および対話方法、並びにプログラムおよび記録媒体
JP6299563B2 (ja) * 2014-11-07 2018-03-28 トヨタ自動車株式会社 応答生成方法、応答生成装置及び応答生成プログラム

Also Published As

Publication number Publication date
JP2020126186A (ja) 2020-08-20

Similar Documents

Publication Publication Date Title
AU2022221387B2 (en) Facilitating end-to-end communications with automated assistants in multiple languages
US9805718B2 (en) Clarifying natural language input using targeted questions
US11354521B2 (en) Facilitating communications with automated assistants in multiple languages
JP6802005B2 (ja) 音声認識装置、音声認識方法及び音声認識システム
EP3899927B1 (en) Adapting automated assistants for use with multiple languages
AU2019219717B2 (en) System and method for analyzing partial utterances
JPWO2017200078A1 (ja) 対話方法、対話システム、対話装置、およびプログラム
WO2016173326A1 (zh) 基于主题的交互系统及方法
KR20190074508A (ko) 챗봇을 위한 대화 모델의 데이터 크라우드소싱 방법
Athikkal et al. Voice chatbot for Hospitality
Inupakutika et al. Integration of NLP and Speech-to-text Applications with Chatbots
KR20210051523A (ko) 도메인 자동 분류 대화 시스템
CN114064943A (zh) 会议管理方法、装置、存储介质及电子设备
JP6985311B2 (ja) 相槌判定によって応答発話生成を制御する対話実施プログラム、装置及び方法
JP7551579B2 (ja) ネガティブな発話をポジティブなオウム返しで返答するプログラム、装置及び方法
US20240331681A1 (en) Automatic adaptation of the synthesized speech output of a translation application
JP6298806B2 (ja) 音声翻訳システム及びその制御方法、並びに音声翻訳プログラム
Lerjebo et al. Intelligent chatbot assistant: A study of Natural Language Processing and Artificial Intelligence
JP2020160118A (ja) 情報処理装置、情報処理方法およびプログラム
Kuzmin Kentico Voice Interface (KEVIN)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210924

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211125

R150 Certificate of patent or registration of utility model

Ref document number: 6985311

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150