JP6615803B2 - 用件判定装置、用件判定方法およびプログラム - Google Patents

用件判定装置、用件判定方法およびプログラム Download PDF

Info

Publication number
JP6615803B2
JP6615803B2 JP2017021609A JP2017021609A JP6615803B2 JP 6615803 B2 JP6615803 B2 JP 6615803B2 JP 2017021609 A JP2017021609 A JP 2017021609A JP 2017021609 A JP2017021609 A JP 2017021609A JP 6615803 B2 JP6615803 B2 JP 6615803B2
Authority
JP
Japan
Prior art keywords
utterance
business
determination
message
dialogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017021609A
Other languages
English (en)
Other versions
JP2018128576A (ja
Inventor
節夫 山田
伸章 廣嶋
喜昭 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017021609A priority Critical patent/JP6615803B2/ja
Publication of JP2018128576A publication Critical patent/JP2018128576A/ja
Application granted granted Critical
Publication of JP6615803B2 publication Critical patent/JP6615803B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、複数の話者による対話における発話が、対話の用件を示す用件発話であるか否かを判定する用件判定装置、用件判定方法およびプログラムに関する。
コールセンタや窓口などでの顧客と応対担当者との対話の中から、顧客が応対担当者に問い合わせたい内容である用件を示す発話(用件発話)を検出することは、問い合わせ内容の明確化、応対担当者による回答の効率化、用件に対するシステムによる自動応答などを実現するために有益である。
顧客と応対担当者との対話のような複数の話者による対話における発話が用件発話であるか否かを判定する方法として、対話における発話に用件発話であるか否かの情報が付与された学習データ(用件発話学習データ)を用いる方法がある(非特許文献1参照)。この方法では、対話における発話に用件発話であるか否かの情報が付与された学習データが利用される。そして、その学習データを用いた機械学習により、対話における発話が用件発話であるか否かを判定する用件判定モデルが生成される。
R.-E. Fan, K.-W. Chang, C.-J. Hsieh, X.-R. Wang, and C.-J. Lin. LIBLINEAR: A library for large linear classification Journal of Machine Learning Research 9(2008), 1871-1874.
一般に、用件発話には、分野ごとに表現に違いがある。そのため、非特許文献1に開示されている方法では、ある分野の用件発話学習データを用いて生成された用件判定モデルを他の分野に適用した場合、発話が用件発話であるか否かを高精度に判定することができないことがある。判定を行いたい分野毎に、用件発話学習データを用意することも考えられるが、分野毎に用件発話学習データを用意することは、コストの増加を招いてしまう。
上記のような問題点に鑑みてなされた本発明の目的は、コストの増加を抑制しつつ、対話における発話が用件発話であるか否かを判定することができる用件判定装置、用件判定方法およびプログラムを提供することにある。
上記課題を解決するため、本発明に係る用件判定装置は、複数の話者による対話における発話が、前記対話の用件を示す用件発話であるか否かを判定する用件判定装置であって、前記対話における発話のなかから、用件を確認するための発話である用件確認発話を検出し、該検出した用件確認発話の話者とは別の話者による発話であって、少なくとも前記用件確認発話の直前の発話を前記用件発話であると判定する判定部と、対話における発話が前記用件発話であるか否かを判定する用件判定モデルの機械学習に用いる学習データを、前記判定部の判定結果に基づいて生成する学習データ生成部と、を備える。
また、上記課題を解決するため、本発明に係る用件判定方法は、複数の話者による対話における発話が、前記対話の用件を示す用件発話であるか否かを判定する用件判定方法であって、前記対話における発話のなかから、用件を確認するための発話である用件確認発話を検出し、該検出した用件確認発話の話者とは別の話者による発話であって、少なくとも前記用件確認発話の直前の発話を前記用件発話であると判定するステップと、対話における発話が前記用件発話であるか否かを判定する用件判定モデルの機械学習に用いる学習データを、前記判定の結果に基づいて生成するステップと、を含む。
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを上述した用件判定装置として機能させる。
本発明に係る用件判定装置、用件判定方法およびプログラムによれば、コストの増加を抑制しつつ、対話における発話が用件発話であるか否かを判定することができる。
本発明の第1の実施形態に係る用件判定装置の構成例を示すブロック図である。 本発明の第2の実施形態に係る用件判定装置の構成例を示すブロック図である。 用件判定モデルの生成について説明するための図である。 顧客と応対担当者との対話の一例を示す図である。 用件発話学習データの構成例を示す図である。 用件発話学習データの他の構成例を示す図である。 本発明の第3の実施形態に係る用件判定装置の構成例を示すブロック図である。 顧客と応対担当者との対話の一例を示す図である。 図7に示す用件判定モデルによる判定結果の一例を示す図である。 本発明の第4の実施形態に係る用件判定装置の構成例を示すブロック図である。 図10に示す判定部による用件確認発話の判定について説明するための図である。 図10に示す判定部による用件発話の判定について説明するための図である。 図10に示す学習データ生成部の動作について説明するための図である。 自然言語を入力とした機械学習について概念的に示す図である。 bag-of-wordsの具体例を示す図である。 従来の自然言語を入力とした機械学習の方法の問題点について説明するための図である。 本発明に係る自然言語を入力とした機械学習の方法について説明するための図である。
以下、本発明を実施するための形態について、図面を参照しながら説明する。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る用件判定装置10の構成例を示すブロック図である。本実施形態に係る用件判定装置10は、顧客と応対担当者との対話のような複数の話者による対話における発話が、対話の用件(顧客が応対担当者に問い合わせたい内容)を示す用件発話であるか否かを判定するものである。
なお、人間は常に伝えたい内容を整理してよどみなく話せるわけではなく、話の途中で考えたり、言い淀んだりする。そのため、発話者が話している途中に、音声が途切れる(無音区間が発生する)ことがある。発話とは、話者の話をこのような音声の途切れなどで区切ったものである。
図1に示す用件判定装置10は、判定部11を備える。
判定部11は、複数の話者による対話(顧客と応対担当者との対話)の対話構造に基づき、対話における発話が用件発話であるか否かを判定する。具体的には、判定部11は、対話における発話のなかから、用件を確認するための発話である用件確認発話を検出する。なお、顧客と応対担当者との対話の場合、顧客の問い合わせたい内容(用件)を確認するための用件確認発話は、応対担当者による発話である。判定部11は、検出した用件確認発話(応対担当者による発話)とは別の話者による発話(顧客による発話)であって、少なくとも用件確認発話の直前の発話を用件発話であると判定する。
一般に、顧客の問い合わせに対して、応対担当者は顧客の問い合わせ内容を確認した上で、顧客の問い合わせに答えることが多い。そのため、応対担当者の用件確認発話には、問い合わせ内容を確認するための特定の語句(「〜ですね。」、「〜ますね。」など)が含まれることが多いという傾向がある。また、顧客の問い合わせ内容を確認するために、応対担当者は顧客の問い合わせ内容を繰り返した上で、顧客の問い合わせに答えることが多い。そのため、応対担当者の用件確認発話には、顧客の用件発話と共通の語句が多く含まれていることが多いという傾向がある。
判定部11は、これらの傾向に基づき、応対担当者の発話が用件確認発話であるか否かを判定する。判定部11は、ディープラーニング、サポートベクタマシンなどの種々の手法を用いた機械学習により、応対担当者の発話が用件確認発話であるか否かを判定してもよい。なお、用件確認発話は用件発話と比べて、パターンが決まっている。そのため、用件確認発話の判定は比較的容易である。
そして、判定部11は、用件確認発話の判定結果に基づき、顧客の発話が用件発話であるか否かを判定する。具体的には、判定部11は、用件確認発話の話者(応対担当者)とは異なる話者(顧客)の発話であって、用件確認発話の直前の発話を用件発話であると判定する。
なお、顧客が複数の連続する発話に跨るように用件を話すこともある。そのため、用件確認発話の直前の発話だけでなく、例えば、判定部11は、用件確認発話の直前の連続する複数の顧客の発話を用件発話と判定してもよい。
また、顧客が、連続する発話の中で、最初は用件とは関係のない内容を話し、その後、用件を話すこともある。そのため、判定部11は、用件確認発話の直前の連続する複数の顧客の発話のうち、どこまでの範囲の発話を用件発話とするかを判定してもよい。例えば、用件確認発話の直前の連続する複数の顧客の発話それぞれと、用件確認発話との類似度を算出し、用件確認発話の直前の発話に向かって類似度が上がっていく範囲内の発話を用件発話と判定してもよい。
このように本実施形態においては、用件判定装置10は、対話における発話のなかから、用件を確認するための発話である用件確認発話を検出し、検出した用件確認発話の話者とは別の話者による発話であって、少なくとも用件確認発話の直前の発話を用件発話であると判定する判定部11を備える。
用件確認発話の直前に用件発話が存在するという対話構造は、対話が行われている分野に関わらず、よく見られる。この対話構造を用いて対話における発話が用件発話であるか否かを判定することで、判定を行いたい分野毎に、用件発話学習データを用意するといったコストの増加を招くことなく、対話における発話が用件発話であるか否かを判定することができる。
(第2の実施形態)
図2は、本発明の第2の実施形態に係る用件判定装置10Aの構成例を示す図である。本実施形態に係る用件判定装置10Aは、顧客と応対担当者との対話のような複数の話者による対話における発話が用件発話であるか否かを判定する用件判定モデルを生成するための用件発話学習データを生成するものである。なお、図2において、図1と同様の構成については同じ符号を付し、説明を省略する。
図2に示す用件判定装置10Aは、図1に示す用件判定装置10と比較して、学習データ生成部12を追加した点が異なる。
学習データ生成部12は、対話における発話が用件発話であるか否かを判定する用件判定モデルを機械学習により生成するための用件発話学習データ13を、判定部11の判定結果に基づき生成する。生成された用件発話学習データ13は、例えば、図3に示すように、判定モデル生成部14に入力され、判定モデル生成部14による機械学習により、対話における発話が用件発話であるか否かを判定する用件判定モデル15が生成される。この用件判定モデル15により、例えば、コールセンターにおける顧客と応対担当者との対話における発話が用件発話であるか否かが判定される。なお、用件判定モデル15および判定モデル生成部14は、用件判定装置10Aが備えていてもよいし、用件判定装置10Aとは別の外部装置が備えていてもよい。
図4は、顧客と応対担当者との対話の一例を示す図である。
図4に示す例では、顧客は、「定期預金についてですが、」という発話#1につづいて、「解約する場合、お店に行く必要がありますか」という発話#2を行っている。顧客の発話#1,#2は、顧客が応対担当者に対して、定期預金の解約について問い合わせる用件発話に相当する。
応対担当者は、顧客の発話#1,#2を受けて、「定期預金をお店以外で解約できるかどうかですね」という、顧客の問い合わせ内容を確認する発話#3を行っている。応対担当者の発話#3を受けて、顧客は、応対担当者による問い合わせ内容の確認が正しいことを示す発話#4を行っている。
応対担当者は、顧客の発話#4を受けて、顧客の問い合わせへの回答に必要な情報を尋ねる発話#5を行い、顧客は、応対担当者の発話#5への回答として発話#6を行っている。
図4に示す顧客と応対担当者との対話を例として、用件判定モデル15を生成するための用件発話学習データ13について図5を参照して説明する。
顧客と応対担当者との対話においては、用件対話は顧客による対話である。そのため、学習データとしては、図5に示すように、顧客の発話#1,#2,#4,#6が抽出される。なお、用件発話学習データ13は、対話の音声を音声認識処理によりテキスト化して作成される。ここで、「あー」、「えーと」などの対話の内容に関係しないフィラーは取り除いてもよい。そして、顧客の各発話に対して用件発話であるか否かを示す情報(用件フラグ)が付与される。図5に示す例では、用件フラグが「0」である場合には用件発話ではなく、用件フラグが「1」である場合には用件発話であることを示す。したがって、対話の用件(顧客が問い合わせたい内容)を示す発話#1,#2の用件フラグに「1」が設定され、他の発話#4,#6の用件フラグに「0」が設定される。このように、用件発話学習データ13は、顧客の発話と、その発話が用件発話であるか否かを示す情報とが対応付けられたデータである。
なお、図5においては、顧客の発話毎に用件フラグを設定する例を用いて説明したが、これに限られるものではない。例えば、図6に示すように、同一の話者(顧客)による話し終わりまでの連続する複数の発話を発話群としてまとめ、発話群単位で、用件フラグを設定してもよい。
図6に示す例では、顧客が話し終わるまでの1または連続する複数の発話(発話#1および発話#2)を1つの発話群としている。そして、発話群毎に用件発話であるか否かを用件フラグが付与されている。
図5,6に示すような用件発話学習データは、顧客と応対担当者との対話から手動により生成することができる。ただし、このような用件発話学習データを、用件判定を行いたい分野毎に生成するのはコストがかかってしまう。
そこで、本実施形態においては、対話構造から対話における発話が用件発話であるか否かを判定し、その判定結果を用件発話学習データ13として用いる。こうすることで、用件判定を行いたい分野の対話から自動的に用件発話学習データ13を生成することができる。そして、生成した用件発話学習データ13を用いて用件判定モデル15を生成することで、コストの増加を抑制しつつ、対話における発話が用件発話であるか否かを判定することができる。
(第3の実施形態)
図7は、本発明の第3の実施形態に係る用件判定装置10Bの構成例を示す図である。なお、図7において、図2,3と同様の構成については同じ符号を付し、説明を省略する。
図7に示す用件判定装置10Bは、図2に示す用件判定装置10Aと比較して、判定モデル生成部14および用件判定モデル15を追加した点が異なる。すなわち、本実施形態においては、用件判定装置10Bは、対話構造を用いた用件発話であるか否かの判定結果から用件発話学習データ13を生成し、生成した用件発話学習データ13を用いて用件判定モデル15を生成する。そして、用件判定モデル15による、対話における発話が用件発話であるか否かの判定結果を出力する。
次に、本実施形態に係る用件判定装置10Bの動作について説明する。
事前処理として、対話における発話に用件フラグが付与された用件発話学習データ13を用いた機械学習により、対話における発話が用件発話であるか否かを判定する用件判定モデル15が生成される。なお、事前処理で用いる用件発話学習データ13は、例えば、手動により用件フラグが付与されたデータ、前述した対話構造を利用した判定により用件フラグが付与されたデータなどを用いることができる。
機械学習の手法は、学習データに基づき適切なモデルを生成することできれば、特に限定されることはなく、ディープラーニング、サポートベクタマシンなどの種々の手法を用いることができる。用件発話であるか否かの判定に利用する情報(素性)についても特に限定されることはなく、正しい判定が可能となるように種々のものを用いることができる。
次に、オンライン処理(発話に応じたリアルタイム処理)として、用件判定装置10Aに対して、顧客と応対担当者との対話の音声データ(対話データ)が入力され、用件判定モデル15を用いて、その対話データが示す対話における発話が用件発話であるか否かが判定される。
以下では、対話データとして、図8に示すような、顧客と応対担当者との対話データが入力されたとする。なお、用件判定装置10Aには、顧客の発話と応対担当者の発話とが異なるチャンネル(2チャンネル)で入力される。
図8に示す例では、顧客は、「はい、わかりました。」という発話#11の後、設定の変更後にサービスをすぐに利用できるのかを問い合わせる発話#12を行っている。発話#12は、対話の用件(顧客が問い合わせたい内容)を示す用件対話に相当する。
応対担当者は、顧客の発話#12を受けて、顧客の問い合わせ内容を確認する発話#13を行った後、問い合わせに対して、外貨預金口座を開設している顧客はすぐにサービスが利用可能であることを回答する発話#14を行っている。そして、顧客は、応対担当者の発話#14を受けて、サービスが利用可能となるタイミングについてより詳細な回答を求める発話#15を行っている。さらに、応対担当者は、顧客の発話#15を受けて、サービスが利用可能となるタイミングについて回答する発話#16を行っている。
用件判定モデル15は、このような対話において、図9に示すように、顧客の発話#11は用件発話ではないと判定し、顧客の発話#12,#15は用件発話であると判定したとする。用件判定装置10Bは、この用件判定モデル15の判定結果を出力する。
なお、本実施形態においては、用件判定装置10Bが学習データ生成部12や判定モデル生成部14を備える例を用いて説明したが、これに限られるものではなく、用件判定装置10Bとは別の外部装置が、学習データ生成部12や判定モデル生成部14を備えていてよい。この場合、用件判定装置10Bは、外部装置により生成された用件判定モデル15を取得し、取得した用件判定モデル15の判定結果を出力する。
(第4の実施形態)
図10は、本発明の第4の実施形態に係る用件判定装置10Cの構成例を示す図である。なお、図10において、図7と同様の構成については同じ符号を付し、説明を省略する。
図10に示す用件判定装置10Cは、図7に示す用件判定装置10Bと比較して、学習データ生成部12を学習データ生成部12Cに変更した点が異なる。
学習データ生成部12Cは、判定部11の判定結果と用件判定モデル15の判定結果とが入力され、これらの判定結果に基づき用件発話学習データ13を生成する。
次に、本実施形態に係る用件判定装置10Cの動作について説明する。本実施形態に係る用件判定装置10Cにおいても、第3の実施形態に係る用件判定装置10Bと同様に事前処理およびオンライン処理が行われる。
次に、事後処理として、判定部11は、対話構造に基づき、入力された対話データが示す対話における発話が用件発話であるか否かを判定する。
まず、判定部11は、応対担当者の発話が、顧客の問い合わせ内容を確認する用件確認発話であるか否かを判定する。上述したように、応対担当者の用件確認発話には、顧客の問い合わせ内容を確認するための特定の語句(「〜ですね。」、「〜ますね。」など)が含まれることが多いという傾向がある。また、応対担当者の用件確認発話には、顧客の用件発話と共通の語句が多く含まれていることが多いという傾向がある。判定部11は、これらの傾向に基づき、応対担当者の発話が用件確認発話であるか否かを判定する。
図8に示す例では、応対担当者の発話#13は、「〜ますね。」という内容を確認するための語句を含んでいる。また、応対担当者の発話#3は、「外貨預金サービス」、「利用設定」など、発話#13の前の顧客の発話#12に含まれる語句を多く含んでいる。そのため、判定部11は、図11に示すように、応対担当者の発話#13を用件確認発話であると判定する。一方、応対担当者の発話#14,#16は、「〜ますね。」などの内容を確認するための語句を含んでいないため、判定部11は、応対担当者の発話#14,#16を用件確認発話ではないと判定する。
次に、判定部11は、用件確認発話の判定結果に基づき、顧客の発話が用件発話であるか否かを判定する。具体的には、判定部11は、図12に示すように、用件確認発話の話者(応対担当者)とは異なる話者(顧客)の発話であって、用件確認発話である発話#13の直前の発話#12を用件発話であると判定し、その他の発話#11,#15を用件発話でないと判定する。
なお、図12においては、用件確認発話の直前の発話のみを用件発話であると判定する例を示しているが、上述したように、用件確認発話の直前の発話を含む連続する複数の顧客の発話を用件発話と判定してもよい。
学習データ生成部12は、用件判定モデル15による判定結果と、判定部11による判定結果とを比較する。そして、学習データ生成部12は、図13に示すように、用件判定モデル15による判定結果と、判定部11による判定結果とが一致する発話を用件発話学習データ13に追加する。
図13に示す例では、用件判定モデル15と判定部11とで、発話#11の判定結果(用件発話でない)および発話#12の判定結果(用件発話)が一致している。学習データ生成部12Cは、発話#11,#12とその判定結果とを用件発話学習データ13に追加する。用件判定モデル15と判定部11とで判定結果が一致している場合、その判定結果の信頼性は高いと考えられる。そのため、用件判定モデル15と判定部11とで一致する判定結果を用件発話学習データ13とすることで、その用件発話学習データ13を用いた機械学習により、用件判定モデル15の信頼性の向上を図ることができる。
なお、学習データ生成部12Cは、用件判定モデル15による判定結果と、判定部11による判定結果とを比較することなく、判定部11による判定結果を用件発話学習データ13に追加してもよい。
このように本実施形態においては、用件判定装置10Cは、対話における発話が用件発話であるか否かが、判定部11と用件判定モデル15とで一致する判定結果を、用件発話学習データ13に追加する学習データ生成部12Cを備える。
用件判定モデル15と判定部11とで一致する判定結果を用件発話学習データ13とすることで、その用件発話学習データ13を用いた機械学習により、用件判定モデル15の信頼性の向上を図ることができる。
なお、上述したように、用件発話学習データ13は、発話単位ではなく、連続する複数の発話をまとめた発話群単位で生成してもよい。発話群単位で用件フラグが付与された学習データを用いることで、発話群単位での用件発話であるか否かの判定が可能となる。
発話群単位で用件判定を行うことで、顧客に対する自動応答や頻繁に訪ねられる質問を検索するFAQ検索(Frequently Asked Questions)において、発話に対する応答のタイミングを考慮した用件判定モデル15の生成が可能となる。
また、顧客と応対担当者との対話は、音声認識処理によりテキスト化した上で、用件判定モデル15での処理が行われる。ここで、音声認識処理においては、誤りが発生することがある。そこで、発話に含まれる単語の音声認識処理による認識結果として複数の候補を用意するN−best法を用いた処理を行ってもよい。
図14は、自然言語を入力とした機械学習について概念的に示す図である。
自然言語を入力とする機械学習では、機械学習(サポートベクターマシン(SVM))の入力に合わせた数値ベクトル化を行うために、入力テキストに対する素性計算が行われる。すなわち、学習時や判定時に、入力テキストに対して、機械学習の入力に合わせた数値ベクトル化を行う必要がある。このような素性計算としては、例えば、文章に単語が含まれているかどうかのみを考慮し、単語の並び方などは考慮しないモデル(bag-of-words)が用いられるのが一般的である。
図15は、bag-of-wordsの具体例を示す図である。
bag-of-wordsでは、文章に単語が含まれていれば、その単語に対応する数値を1とし、文章に単語が含まれているか否かを表現する入力ベクトルが計算される。入力テキストが「インターネットで定期預金の解約はできますか」であるとすると、入力テキストに対して形態素解析が行われる。
具体的には、図15に示すように、大量のテキストの形態素解析により、テキストに出現する単語をカバーするようにリスト化され、各単語に単語番号が割り当てられた単語リストが事前に生成される。そして、単語リストに含まれる単語のうち、入力テキストに出現する単語の単語番号に対応する入力ベクトルの値が「1」となり。入力テキストに出現しない単語の単語番号に対応する入力ベクトルの値が「0」となる。
なお、形態素解析の代わりに、品詞を用いるbag-of-posなどの素性計算方法、bag-of-wordsとbag-of-posとを組み合わせた素性計算も用いてもよい。
用件判定モデル15での処理のために、対話の音声を音声認識処理によりテキスト化した音声認識結果テキストを形態素解析し、形態素解析の結果からbag-of-wordsなどで素性計算を行うことが考えられる。
ここで、音声認識処理に誤りが生じたとする。例えば、「インターネットで定期預金の解約はできますか」という音声に対して、図16に示すように、「インターネットで敵よ金の害はできますか」と誤った音声認識が行われたとする。このような誤った音声認識結果テキストに対して形態素解析が行われ、入力ベクトルが計算されると、誤りが蓄積され、正しい入力音声を反映した素性計算を行うことができない。
このように、音声認識結果を機械学習の入力とする従来方法では、誤った形態素単位となりやすいという問題がある。このような問題が生じる原因としては、音声認識処理に用いられる音声認識辞書と、形態素解析に用いられる形態素解析辞書とが異なる場合が多く、これらの辞書に登録される単語の違いにより不整合が生じることがある。また、別の原因としては、形態素解析は、人が読める正常な文章を対象にしているため、音声認識結果テキストの誤りにより、誤った形態素解析が行われることがある。
また、音声認識結果を機械学習の入力とする従来方法では、音声認識処理に誤りが生じると、その誤りを含んだまま素性計算を行うため、正しい入力音声を反映する素性にならないという問題がある。
そこで、本発明においては、図17に示すように、音声認識処理の結果得られる、N位候補の単語系列(N−best結果)を、機械学習での素性計算(bag-of-wordsなど)に用いる。
音声認識処理では、音声認識辞書に登録されている登録(品詞情報なども含む)の組み合わせの中で、最も入力音声に近い単語列を探索するという処理が行われる。そのため、音声認識処理の結果として、単語(品詞情報なども含む)の列を得ることができる。また、入力音声への近さの順に、1位候補以外のN位候補までを得ることができる。そのため、仮に、1位候補が誤りであっても、N位候補内に正しい単語が含まれる可能性が高くなる。
このように本発明においては、形態素解析処理を行わず、音声認識処理の結果得られる、N位候補の単語系列を用いる。そのため、形態素解析による誤りが生じず、誤りも含めた音声認識処理の結果がそのまま素性に反映される。また、形態素解析を行わないため、処理量の削減を図ることができる。また、形態素解析を行わないため、形態素解析辞書を用意する必要がない。また、N位候補までの音声認識結果を素性に反映させるため、1位候補に音声認識誤りが生じても、N位候補内に正しい単語が含まれている可能性が高く、それらを素性計算に反映することができる。
実施形態では特に触れていないが、用件判定装置10として機能するコンピュータが行う各処理を実行するためのプログラムが提供されてもよい。また、プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD−ROMやDVD−ROMなどの記録媒体であってもよい。
上述の実施形態は代表的な例として説明したが、本発明の趣旨および範囲内で、多くの変更および置換が可能であることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。
10,10A,10B,10C 用件判定装置
11 判定部
12,12C 学習データ生成部
13 用件発話学習データ
14 判定モデル生成部
15 用件判定モデル

Claims (7)

  1. 複数の話者による対話における発話が、前記対話の用件を示す用件発話であるか否かを判定する用件判定装置であって、
    前記対話における発話のなかから、用件を確認するための発話である用件確認発話を検出し、該検出した用件確認発話の話者とは別の話者による発話であって、少なくとも前記用件確認発話の直前の発話を前記用件発話であると判定する判定部と、
    対話における発話が前記用件発話であるか否かを判定する用件判定モデルの機械学習に用いる学習データを、前記判定部の判定結果に基づいて生成する学習データ生成部と、を備えることを特徴とする用件判定装置。
  2. 請求項に記載の用件判定装置において、
    前記学習データ生成部は、対話における発話が前記用件発話であるか否かが、前記判定部と前記用件判定モデルとで一致する判定結果を、前記学習データに追加することを特徴とする用件判定装置。
  3. 請求項またはに記載の用件判定装置において、
    前記用件判定モデルを用いて、前記対話における発話が前記用件発話であるか否かを判定し、判定結果を出力することを特徴とする用件判定装置。
  4. 複数の話者による対話における発話が、前記対話の用件を示す用件発話であるか否かを判定する用件判定方法であって、
    前記対話における発話のなかから、用件を確認するための発話である用件確認発話を検出し、該検出した用件確認発話の話者とは別の話者による発話であって、少なくとも前記用件確認発話の直前の発話を前記用件発話であると判定するステップと、
    対話における発話が前記用件発話であるか否かを判定する用件判定モデルの機械学習に用いる学習データを、前記判定の結果に基づいて生成するステップと、を含むことを特徴とする用件判定方法。
  5. 請求項に記載の用件判定方法において、
    対話における発話が前記用件発話であるか否かが、前記用件確認発話の検出に基づく判定と前記用件判定モデルとで一致する判定結果を、前記学習データに追加することを特徴とする用件判定方法
  6. 請求項4または5に記載の用件判定方法において、
    前記用件判定モデルを用いて、前記対話における発話が前記用件発話であるか否かを判定し、判定結果を出力することを特徴とする用件判定方法。
  7. コンピュータを請求項1からのいずれか一項に記載の用件判定装置として機能させるためのプログラム。
JP2017021609A 2017-02-08 2017-02-08 用件判定装置、用件判定方法およびプログラム Active JP6615803B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017021609A JP6615803B2 (ja) 2017-02-08 2017-02-08 用件判定装置、用件判定方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017021609A JP6615803B2 (ja) 2017-02-08 2017-02-08 用件判定装置、用件判定方法およびプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019134062A Division JP6755633B2 (ja) 2019-07-19 2019-07-19 用件判定装置、用件判定方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2018128576A JP2018128576A (ja) 2018-08-16
JP6615803B2 true JP6615803B2 (ja) 2019-12-04

Family

ID=63172891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017021609A Active JP6615803B2 (ja) 2017-02-08 2017-02-08 用件判定装置、用件判定方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6615803B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3896687A4 (en) * 2018-12-11 2022-01-26 NEC Corporation TREATMENT SYSTEM, TREATMENT PROCEDURE AND PROGRAM

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7092888B1 (en) * 2001-10-26 2006-08-15 Verizon Corporate Services Group Inc. Unsupervised training in natural language call routing
JP5325140B2 (ja) * 2010-02-22 2013-10-23 日本電信電話株式会社 コンタクトセンタ向け用件区間抽出方法と、その装置と、プログラム
JP5726953B2 (ja) * 2013-06-17 2015-06-03 日本電信電話株式会社 対話行為付与モデル学習装置、対話行為付与装置、方法、及びプログラム
JP2015176099A (ja) * 2014-03-18 2015-10-05 株式会社東芝 対話システム構築支援装置、方法、及びプログラム

Also Published As

Publication number Publication date
JP2018128576A (ja) 2018-08-16

Similar Documents

Publication Publication Date Title
US11037553B2 (en) Learning-type interactive device
JP4786384B2 (ja) 音声処理装置、音声処理方法および音声処理プログラム
JP6576968B2 (ja) 話し終わり判定装置、話し終わり判定方法およびプログラム
KR102097710B1 (ko) 대화 분리 장치 및 이에서의 대화 분리 방법
US10325599B1 (en) Message response routing
JPWO2008114811A1 (ja) 情報検索システム、情報検索方法及び情報検索用プログラム
JP5731998B2 (ja) 対話支援装置、対話支援方法および対話支援プログラム
JP5385677B2 (ja) 対話状態分割装置とその方法、そのプログラムと記録媒体
US20240144933A1 (en) Voice-controlled communication requests and responses
JP7007617B2 (ja) 話し終わり判定装置、話し終わり判定方法およびプログラム
CA3160315C (en) Real-time speech-to-speech generation (rssg) apparatus, method and a system therefore
Siegert et al. Recognition performance of selected speech recognition apis–a longitudinal study
JP6755633B2 (ja) 用件判定装置、用件判定方法およびプログラム
JP6615803B2 (ja) 用件判定装置、用件判定方法およびプログラム
US20040006469A1 (en) Apparatus and method for updating lexicon
JP6736225B2 (ja) 対話装置、対話装置の制御方法およびプログラム
Adhikary et al. Investigating speech recognition for improving predictive aac
JP7177348B2 (ja) 音声認識装置、音声認識方法およびプログラム
Woollacott et al. Benchmarking speech technologies
Sárosi et al. Automated transcription of conversational Call Center speech–with respect to non-verbal acoustic events
JP6526602B2 (ja) 音声認識装置、その方法、及びプログラム
JP4236502B2 (ja) 音声認識装置
JP3526549B2 (ja) 音声認識装置、方法及び記録媒体
JP5762359B2 (ja) 用件区間抽出用特徴的単語学習装置と用件区間抽出装置とそれらの方法とプログラム
Takrim et al. Speech to Text Recognition

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190516

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190521

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190719

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191106

R150 Certificate of patent or registration of utility model

Ref document number: 6615803

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150