JP6615803B2

JP6615803B2 - 用件判定装置、用件判定方法およびプログラム

Info

Publication number: JP6615803B2
Application number: JP2017021609A
Authority: JP
Inventors: 節夫山田; 伸章廣嶋; 喜昭野田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2017-02-08
Filing date: 2017-02-08
Publication date: 2019-12-04
Anticipated expiration: 2037-02-08
Also published as: JP2018128576A

Description

本発明は、複数の話者による対話における発話が、対話の用件を示す用件発話であるか否かを判定する用件判定装置、用件判定方法およびプログラムに関する。

コールセンタや窓口などでの顧客と応対担当者との対話の中から、顧客が応対担当者に問い合わせたい内容である用件を示す発話（用件発話）を検出することは、問い合わせ内容の明確化、応対担当者による回答の効率化、用件に対するシステムによる自動応答などを実現するために有益である。

顧客と応対担当者との対話のような複数の話者による対話における発話が用件発話であるか否かを判定する方法として、対話における発話に用件発話であるか否かの情報が付与された学習データ（用件発話学習データ）を用いる方法がある（非特許文献１参照）。この方法では、対話における発話に用件発話であるか否かの情報が付与された学習データが利用される。そして、その学習データを用いた機械学習により、対話における発話が用件発話であるか否かを判定する用件判定モデルが生成される。

R.-E. Fan, K.-W. Chang, C.-J. Hsieh, X.-R. Wang, and C.-J. Lin. LIBLINEAR: A library for large linear classification Journal of Machine Learning Research 9(2008), 1871-1874.

一般に、用件発話には、分野ごとに表現に違いがある。そのため、非特許文献１に開示されている方法では、ある分野の用件発話学習データを用いて生成された用件判定モデルを他の分野に適用した場合、発話が用件発話であるか否かを高精度に判定することができないことがある。判定を行いたい分野毎に、用件発話学習データを用意することも考えられるが、分野毎に用件発話学習データを用意することは、コストの増加を招いてしまう。

上記のような問題点に鑑みてなされた本発明の目的は、コストの増加を抑制しつつ、対話における発話が用件発話であるか否かを判定することができる用件判定装置、用件判定方法およびプログラムを提供することにある。

上記課題を解決するため、本発明に係る用件判定装置は、複数の話者による対話における発話が、前記対話の用件を示す用件発話であるか否かを判定する用件判定装置であって、前記対話における発話のなかから、用件を確認するための発話である用件確認発話を検出し、該検出した用件確認発話の話者とは別の話者による発話であって、少なくとも前記用件確認発話の直前の発話を前記用件発話であると判定する判定部と、対話における発話が前記用件発話であるか否かを判定する用件判定モデルの機械学習に用いる学習データを、前記判定部の判定結果に基づいて生成する学習データ生成部と、を備える。

また、上記課題を解決するため、本発明に係る用件判定方法は、複数の話者による対話における発話が、前記対話の用件を示す用件発話であるか否かを判定する用件判定方法であって、前記対話における発話のなかから、用件を確認するための発話である用件確認発話を検出し、該検出した用件確認発話の話者とは別の話者による発話であって、少なくとも前記用件確認発話の直前の発話を前記用件発話であると判定するステップと、対話における発話が前記用件発話であるか否かを判定する用件判定モデルの機械学習に用いる学習データを、前記判定の結果に基づいて生成するステップと、を含む。

また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを上述した用件判定装置として機能させる。

本発明に係る用件判定装置、用件判定方法およびプログラムによれば、コストの増加を抑制しつつ、対話における発話が用件発話であるか否かを判定することができる。

本発明の第１の実施形態に係る用件判定装置の構成例を示すブロック図である。本発明の第２の実施形態に係る用件判定装置の構成例を示すブロック図である。用件判定モデルの生成について説明するための図である。顧客と応対担当者との対話の一例を示す図である。用件発話学習データの構成例を示す図である。用件発話学習データの他の構成例を示す図である。本発明の第３の実施形態に係る用件判定装置の構成例を示すブロック図である。顧客と応対担当者との対話の一例を示す図である。図７に示す用件判定モデルによる判定結果の一例を示す図である。本発明の第４の実施形態に係る用件判定装置の構成例を示すブロック図である。図１０に示す判定部による用件確認発話の判定について説明するための図である。図１０に示す判定部による用件発話の判定について説明するための図である。図１０に示す学習データ生成部の動作について説明するための図である。自然言語を入力とした機械学習について概念的に示す図である。 bag-of-wordsの具体例を示す図である。従来の自然言語を入力とした機械学習の方法の問題点について説明するための図である。本発明に係る自然言語を入力とした機械学習の方法について説明するための図である。

以下、本発明を実施するための形態について、図面を参照しながら説明する。

（第１の実施形態）
図１は、本発明の第１の実施形態に係る用件判定装置１０の構成例を示すブロック図である。本実施形態に係る用件判定装置１０は、顧客と応対担当者との対話のような複数の話者による対話における発話が、対話の用件（顧客が応対担当者に問い合わせたい内容）を示す用件発話であるか否かを判定するものである。

なお、人間は常に伝えたい内容を整理してよどみなく話せるわけではなく、話の途中で考えたり、言い淀んだりする。そのため、発話者が話している途中に、音声が途切れる（無音区間が発生する）ことがある。発話とは、話者の話をこのような音声の途切れなどで区切ったものである。

図１に示す用件判定装置１０は、判定部１１を備える。

判定部１１は、複数の話者による対話（顧客と応対担当者との対話）の対話構造に基づき、対話における発話が用件発話であるか否かを判定する。具体的には、判定部１１は、対話における発話のなかから、用件を確認するための発話である用件確認発話を検出する。なお、顧客と応対担当者との対話の場合、顧客の問い合わせたい内容（用件）を確認するための用件確認発話は、応対担当者による発話である。判定部１１は、検出した用件確認発話（応対担当者による発話）とは別の話者による発話（顧客による発話）であって、少なくとも用件確認発話の直前の発話を用件発話であると判定する。

一般に、顧客の問い合わせに対して、応対担当者は顧客の問い合わせ内容を確認した上で、顧客の問い合わせに答えることが多い。そのため、応対担当者の用件確認発話には、問い合わせ内容を確認するための特定の語句（「〜ですね。」、「〜ますね。」など）が含まれることが多いという傾向がある。また、顧客の問い合わせ内容を確認するために、応対担当者は顧客の問い合わせ内容を繰り返した上で、顧客の問い合わせに答えることが多い。そのため、応対担当者の用件確認発話には、顧客の用件発話と共通の語句が多く含まれていることが多いという傾向がある。

判定部１１は、これらの傾向に基づき、応対担当者の発話が用件確認発話であるか否かを判定する。判定部１１は、ディープラーニング、サポートベクタマシンなどの種々の手法を用いた機械学習により、応対担当者の発話が用件確認発話であるか否かを判定してもよい。なお、用件確認発話は用件発話と比べて、パターンが決まっている。そのため、用件確認発話の判定は比較的容易である。

そして、判定部１１は、用件確認発話の判定結果に基づき、顧客の発話が用件発話であるか否かを判定する。具体的には、判定部１１は、用件確認発話の話者（応対担当者）とは異なる話者（顧客）の発話であって、用件確認発話の直前の発話を用件発話であると判定する。

なお、顧客が複数の連続する発話に跨るように用件を話すこともある。そのため、用件確認発話の直前の発話だけでなく、例えば、判定部１１は、用件確認発話の直前の連続する複数の顧客の発話を用件発話と判定してもよい。

また、顧客が、連続する発話の中で、最初は用件とは関係のない内容を話し、その後、用件を話すこともある。そのため、判定部１１は、用件確認発話の直前の連続する複数の顧客の発話のうち、どこまでの範囲の発話を用件発話とするかを判定してもよい。例えば、用件確認発話の直前の連続する複数の顧客の発話それぞれと、用件確認発話との類似度を算出し、用件確認発話の直前の発話に向かって類似度が上がっていく範囲内の発話を用件発話と判定してもよい。

このように本実施形態においては、用件判定装置１０は、対話における発話のなかから、用件を確認するための発話である用件確認発話を検出し、検出した用件確認発話の話者とは別の話者による発話であって、少なくとも用件確認発話の直前の発話を用件発話であると判定する判定部１１を備える。

用件確認発話の直前に用件発話が存在するという対話構造は、対話が行われている分野に関わらず、よく見られる。この対話構造を用いて対話における発話が用件発話であるか否かを判定することで、判定を行いたい分野毎に、用件発話学習データを用意するといったコストの増加を招くことなく、対話における発話が用件発話であるか否かを判定することができる。

（第２の実施形態）
図２は、本発明の第２の実施形態に係る用件判定装置１０Ａの構成例を示す図である。本実施形態に係る用件判定装置１０Ａは、顧客と応対担当者との対話のような複数の話者による対話における発話が用件発話であるか否かを判定する用件判定モデルを生成するための用件発話学習データを生成するものである。なお、図２において、図１と同様の構成については同じ符号を付し、説明を省略する。

図２に示す用件判定装置１０Ａは、図１に示す用件判定装置１０と比較して、学習データ生成部１２を追加した点が異なる。

学習データ生成部１２は、対話における発話が用件発話であるか否かを判定する用件判定モデルを機械学習により生成するための用件発話学習データ１３を、判定部１１の判定結果に基づき生成する。生成された用件発話学習データ１３は、例えば、図３に示すように、判定モデル生成部１４に入力され、判定モデル生成部１４による機械学習により、対話における発話が用件発話であるか否かを判定する用件判定モデル１５が生成される。この用件判定モデル１５により、例えば、コールセンターにおける顧客と応対担当者との対話における発話が用件発話であるか否かが判定される。なお、用件判定モデル１５および判定モデル生成部１４は、用件判定装置１０Ａが備えていてもよいし、用件判定装置１０Ａとは別の外部装置が備えていてもよい。

図４は、顧客と応対担当者との対話の一例を示す図である。

図４に示す例では、顧客は、「定期預金についてですが、」という発話＃１につづいて、「解約する場合、お店に行く必要がありますか」という発話＃２を行っている。顧客の発話＃１，＃２は、顧客が応対担当者に対して、定期預金の解約について問い合わせる用件発話に相当する。

応対担当者は、顧客の発話＃１，＃２を受けて、「定期預金をお店以外で解約できるかどうかですね」という、顧客の問い合わせ内容を確認する発話＃３を行っている。応対担当者の発話＃３を受けて、顧客は、応対担当者による問い合わせ内容の確認が正しいことを示す発話＃４を行っている。

応対担当者は、顧客の発話＃４を受けて、顧客の問い合わせへの回答に必要な情報を尋ねる発話＃５を行い、顧客は、応対担当者の発話＃５への回答として発話＃６を行っている。

図４に示す顧客と応対担当者との対話を例として、用件判定モデル１５を生成するための用件発話学習データ１３について図５を参照して説明する。

顧客と応対担当者との対話においては、用件対話は顧客による対話である。そのため、学習データとしては、図５に示すように、顧客の発話＃１，＃２，＃４，＃６が抽出される。なお、用件発話学習データ１３は、対話の音声を音声認識処理によりテキスト化して作成される。ここで、「あー」、「えーと」などの対話の内容に関係しないフィラーは取り除いてもよい。そして、顧客の各発話に対して用件発話であるか否かを示す情報（用件フラグ）が付与される。図５に示す例では、用件フラグが「０」である場合には用件発話ではなく、用件フラグが「１」である場合には用件発話であることを示す。したがって、対話の用件（顧客が問い合わせたい内容）を示す発話＃１，＃２の用件フラグに「１」が設定され、他の発話＃４，＃６の用件フラグに「０」が設定される。このように、用件発話学習データ１３は、顧客の発話と、その発話が用件発話であるか否かを示す情報とが対応付けられたデータである。

なお、図５においては、顧客の発話毎に用件フラグを設定する例を用いて説明したが、これに限られるものではない。例えば、図６に示すように、同一の話者（顧客）による話し終わりまでの連続する複数の発話を発話群としてまとめ、発話群単位で、用件フラグを設定してもよい。

図６に示す例では、顧客が話し終わるまでの１または連続する複数の発話（発話＃１および発話＃２）を１つの発話群としている。そして、発話群毎に用件発話であるか否かを用件フラグが付与されている。

図５，６に示すような用件発話学習データは、顧客と応対担当者との対話から手動により生成することができる。ただし、このような用件発話学習データを、用件判定を行いたい分野毎に生成するのはコストがかかってしまう。

そこで、本実施形態においては、対話構造から対話における発話が用件発話であるか否かを判定し、その判定結果を用件発話学習データ１３として用いる。こうすることで、用件判定を行いたい分野の対話から自動的に用件発話学習データ１３を生成することができる。そして、生成した用件発話学習データ１３を用いて用件判定モデル１５を生成することで、コストの増加を抑制しつつ、対話における発話が用件発話であるか否かを判定することができる。

（第３の実施形態）
図７は、本発明の第３の実施形態に係る用件判定装置１０Ｂの構成例を示す図である。なお、図７において、図２，３と同様の構成については同じ符号を付し、説明を省略する。

図７に示す用件判定装置１０Ｂは、図２に示す用件判定装置１０Ａと比較して、判定モデル生成部１４および用件判定モデル１５を追加した点が異なる。すなわち、本実施形態においては、用件判定装置１０Ｂは、対話構造を用いた用件発話であるか否かの判定結果から用件発話学習データ１３を生成し、生成した用件発話学習データ１３を用いて用件判定モデル１５を生成する。そして、用件判定モデル１５による、対話における発話が用件発話であるか否かの判定結果を出力する。

次に、本実施形態に係る用件判定装置１０Ｂの動作について説明する。

事前処理として、対話における発話に用件フラグが付与された用件発話学習データ１３を用いた機械学習により、対話における発話が用件発話であるか否かを判定する用件判定モデル１５が生成される。なお、事前処理で用いる用件発話学習データ１３は、例えば、手動により用件フラグが付与されたデータ、前述した対話構造を利用した判定により用件フラグが付与されたデータなどを用いることができる。

機械学習の手法は、学習データに基づき適切なモデルを生成することできれば、特に限定されることはなく、ディープラーニング、サポートベクタマシンなどの種々の手法を用いることができる。用件発話であるか否かの判定に利用する情報（素性）についても特に限定されることはなく、正しい判定が可能となるように種々のものを用いることができる。

次に、オンライン処理（発話に応じたリアルタイム処理）として、用件判定装置１０Ａに対して、顧客と応対担当者との対話の音声データ（対話データ）が入力され、用件判定モデル１５を用いて、その対話データが示す対話における発話が用件発話であるか否かが判定される。

以下では、対話データとして、図８に示すような、顧客と応対担当者との対話データが入力されたとする。なお、用件判定装置１０Ａには、顧客の発話と応対担当者の発話とが異なるチャンネル（２チャンネル）で入力される。

図８に示す例では、顧客は、「はい、わかりました。」という発話＃１１の後、設定の変更後にサービスをすぐに利用できるのかを問い合わせる発話＃１２を行っている。発話＃１２は、対話の用件（顧客が問い合わせたい内容）を示す用件対話に相当する。

応対担当者は、顧客の発話＃１２を受けて、顧客の問い合わせ内容を確認する発話＃１３を行った後、問い合わせに対して、外貨預金口座を開設している顧客はすぐにサービスが利用可能であることを回答する発話＃１４を行っている。そして、顧客は、応対担当者の発話＃１４を受けて、サービスが利用可能となるタイミングについてより詳細な回答を求める発話＃１５を行っている。さらに、応対担当者は、顧客の発話＃１５を受けて、サービスが利用可能となるタイミングについて回答する発話＃１６を行っている。

用件判定モデル１５は、このような対話において、図９に示すように、顧客の発話＃１１は用件発話ではないと判定し、顧客の発話＃１２，＃１５は用件発話であると判定したとする。用件判定装置１０Ｂは、この用件判定モデル１５の判定結果を出力する。

なお、本実施形態においては、用件判定装置１０Ｂが学習データ生成部１２や判定モデル生成部１４を備える例を用いて説明したが、これに限られるものではなく、用件判定装置１０Ｂとは別の外部装置が、学習データ生成部１２や判定モデル生成部１４を備えていてよい。この場合、用件判定装置１０Ｂは、外部装置により生成された用件判定モデル１５を取得し、取得した用件判定モデル１５の判定結果を出力する。

（第４の実施形態）
図１０は、本発明の第４の実施形態に係る用件判定装置１０Ｃの構成例を示す図である。なお、図１０において、図７と同様の構成については同じ符号を付し、説明を省略する。

図１０に示す用件判定装置１０Ｃは、図７に示す用件判定装置１０Ｂと比較して、学習データ生成部１２を学習データ生成部１２Ｃに変更した点が異なる。

学習データ生成部１２Ｃは、判定部１１の判定結果と用件判定モデル１５の判定結果とが入力され、これらの判定結果に基づき用件発話学習データ１３を生成する。

次に、本実施形態に係る用件判定装置１０Ｃの動作について説明する。本実施形態に係る用件判定装置１０Ｃにおいても、第３の実施形態に係る用件判定装置１０Ｂと同様に事前処理およびオンライン処理が行われる。

次に、事後処理として、判定部１１は、対話構造に基づき、入力された対話データが示す対話における発話が用件発話であるか否かを判定する。

まず、判定部１１は、応対担当者の発話が、顧客の問い合わせ内容を確認する用件確認発話であるか否かを判定する。上述したように、応対担当者の用件確認発話には、顧客の問い合わせ内容を確認するための特定の語句（「〜ですね。」、「〜ますね。」など）が含まれることが多いという傾向がある。また、応対担当者の用件確認発話には、顧客の用件発話と共通の語句が多く含まれていることが多いという傾向がある。判定部１１は、これらの傾向に基づき、応対担当者の発話が用件確認発話であるか否かを判定する。

図８に示す例では、応対担当者の発話＃１３は、「〜ますね。」という内容を確認するための語句を含んでいる。また、応対担当者の発話＃３は、「外貨預金サービス」、「利用設定」など、発話＃１３の前の顧客の発話＃１２に含まれる語句を多く含んでいる。そのため、判定部１１は、図１１に示すように、応対担当者の発話＃１３を用件確認発話であると判定する。一方、応対担当者の発話＃１４，＃１６は、「〜ますね。」などの内容を確認するための語句を含んでいないため、判定部１１は、応対担当者の発話＃１４，＃１６を用件確認発話ではないと判定する。

次に、判定部１１は、用件確認発話の判定結果に基づき、顧客の発話が用件発話であるか否かを判定する。具体的には、判定部１１は、図１２に示すように、用件確認発話の話者（応対担当者）とは異なる話者（顧客）の発話であって、用件確認発話である発話＃１３の直前の発話＃１２を用件発話であると判定し、その他の発話＃１１，＃１５を用件発話でないと判定する。

なお、図１２においては、用件確認発話の直前の発話のみを用件発話であると判定する例を示しているが、上述したように、用件確認発話の直前の発話を含む連続する複数の顧客の発話を用件発話と判定してもよい。

学習データ生成部１２は、用件判定モデル１５による判定結果と、判定部１１による判定結果とを比較する。そして、学習データ生成部１２は、図１３に示すように、用件判定モデル１５による判定結果と、判定部１１による判定結果とが一致する発話を用件発話学習データ１３に追加する。

図１３に示す例では、用件判定モデル１５と判定部１１とで、発話＃１１の判定結果（用件発話でない）および発話＃１２の判定結果（用件発話）が一致している。学習データ生成部１２Ｃは、発話＃１１，＃１２とその判定結果とを用件発話学習データ１３に追加する。用件判定モデル１５と判定部１１とで判定結果が一致している場合、その判定結果の信頼性は高いと考えられる。そのため、用件判定モデル１５と判定部１１とで一致する判定結果を用件発話学習データ１３とすることで、その用件発話学習データ１３を用いた機械学習により、用件判定モデル１５の信頼性の向上を図ることができる。

なお、学習データ生成部１２Ｃは、用件判定モデル１５による判定結果と、判定部１１による判定結果とを比較することなく、判定部１１による判定結果を用件発話学習データ１３に追加してもよい。

このように本実施形態においては、用件判定装置１０Ｃは、対話における発話が用件発話であるか否かが、判定部１１と用件判定モデル１５とで一致する判定結果を、用件発話学習データ１３に追加する学習データ生成部１２Ｃを備える。

用件判定モデル１５と判定部１１とで一致する判定結果を用件発話学習データ１３とすることで、その用件発話学習データ１３を用いた機械学習により、用件判定モデル１５の信頼性の向上を図ることができる。

なお、上述したように、用件発話学習データ１３は、発話単位ではなく、連続する複数の発話をまとめた発話群単位で生成してもよい。発話群単位で用件フラグが付与された学習データを用いることで、発話群単位での用件発話であるか否かの判定が可能となる。

発話群単位で用件判定を行うことで、顧客に対する自動応答や頻繁に訪ねられる質問を検索するＦＡＱ検索（Frequently Asked Questions）において、発話に対する応答のタイミングを考慮した用件判定モデル１５の生成が可能となる。

また、顧客と応対担当者との対話は、音声認識処理によりテキスト化した上で、用件判定モデル１５での処理が行われる。ここで、音声認識処理においては、誤りが発生することがある。そこで、発話に含まれる単語の音声認識処理による認識結果として複数の候補を用意するＮ−ｂｅｓｔ法を用いた処理を行ってもよい。

図１４は、自然言語を入力とした機械学習について概念的に示す図である。

自然言語を入力とする機械学習では、機械学習（サポートベクターマシン（ＳＶＭ））の入力に合わせた数値ベクトル化を行うために、入力テキストに対する素性計算が行われる。すなわち、学習時や判定時に、入力テキストに対して、機械学習の入力に合わせた数値ベクトル化を行う必要がある。このような素性計算としては、例えば、文章に単語が含まれているかどうかのみを考慮し、単語の並び方などは考慮しないモデル（bag-of-words）が用いられるのが一般的である。

図１５は、bag-of-wordsの具体例を示す図である。

bag-of-wordsでは、文章に単語が含まれていれば、その単語に対応する数値を１とし、文章に単語が含まれているか否かを表現する入力ベクトルが計算される。入力テキストが「インターネットで定期預金の解約はできますか」であるとすると、入力テキストに対して形態素解析が行われる。

具体的には、図１５に示すように、大量のテキストの形態素解析により、テキストに出現する単語をカバーするようにリスト化され、各単語に単語番号が割り当てられた単語リストが事前に生成される。そして、単語リストに含まれる単語のうち、入力テキストに出現する単語の単語番号に対応する入力ベクトルの値が「１」となり。入力テキストに出現しない単語の単語番号に対応する入力ベクトルの値が「０」となる。

なお、形態素解析の代わりに、品詞を用いるbag-of-posなどの素性計算方法、bag-of-wordsとbag-of-posとを組み合わせた素性計算も用いてもよい。

用件判定モデル１５での処理のために、対話の音声を音声認識処理によりテキスト化した音声認識結果テキストを形態素解析し、形態素解析の結果からbag-of-wordsなどで素性計算を行うことが考えられる。

ここで、音声認識処理に誤りが生じたとする。例えば、「インターネットで定期預金の解約はできますか」という音声に対して、図１６に示すように、「インターネットで敵よ金の害はできますか」と誤った音声認識が行われたとする。このような誤った音声認識結果テキストに対して形態素解析が行われ、入力ベクトルが計算されると、誤りが蓄積され、正しい入力音声を反映した素性計算を行うことができない。

このように、音声認識結果を機械学習の入力とする従来方法では、誤った形態素単位となりやすいという問題がある。このような問題が生じる原因としては、音声認識処理に用いられる音声認識辞書と、形態素解析に用いられる形態素解析辞書とが異なる場合が多く、これらの辞書に登録される単語の違いにより不整合が生じることがある。また、別の原因としては、形態素解析は、人が読める正常な文章を対象にしているため、音声認識結果テキストの誤りにより、誤った形態素解析が行われることがある。

また、音声認識結果を機械学習の入力とする従来方法では、音声認識処理に誤りが生じると、その誤りを含んだまま素性計算を行うため、正しい入力音声を反映する素性にならないという問題がある。

そこで、本発明においては、図１７に示すように、音声認識処理の結果得られる、Ｎ位候補の単語系列（Ｎ−ｂｅｓｔ結果）を、機械学習での素性計算（bag-of-wordsなど）に用いる。

音声認識処理では、音声認識辞書に登録されている登録（品詞情報なども含む）の組み合わせの中で、最も入力音声に近い単語列を探索するという処理が行われる。そのため、音声認識処理の結果として、単語（品詞情報なども含む）の列を得ることができる。また、入力音声への近さの順に、１位候補以外のＮ位候補までを得ることができる。そのため、仮に、１位候補が誤りであっても、Ｎ位候補内に正しい単語が含まれる可能性が高くなる。

このように本発明においては、形態素解析処理を行わず、音声認識処理の結果得られる、Ｎ位候補の単語系列を用いる。そのため、形態素解析による誤りが生じず、誤りも含めた音声認識処理の結果がそのまま素性に反映される。また、形態素解析を行わないため、処理量の削減を図ることができる。また、形態素解析を行わないため、形態素解析辞書を用意する必要がない。また、Ｎ位候補までの音声認識結果を素性に反映させるため、１位候補に音声認識誤りが生じても、Ｎ位候補内に正しい単語が含まれている可能性が高く、それらを素性計算に反映することができる。

実施形態では特に触れていないが、用件判定装置１０として機能するコンピュータが行う各処理を実行するためのプログラムが提供されてもよい。また、プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、ＣＤ−ＲＯＭやＤＶＤ−ＲＯＭなどの記録媒体であってもよい。

上述の実施形態は代表的な例として説明したが、本発明の趣旨および範囲内で、多くの変更および置換が可能であることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを１つに組み合わせたり、あるいは１つの構成ブロックを分割したりすることが可能である。

１０，１０Ａ，１０Ｂ，１０Ｃ用件判定装置
１１判定部
１２，１２Ｃ学習データ生成部
１３用件発話学習データ
１４判定モデル生成部
１５用件判定モデル

Claims

複数の話者による対話における発話が、前記対話の用件を示す用件発話であるか否かを判定する用件判定装置であって、
前記対話における発話のなかから、用件を確認するための発話である用件確認発話を検出し、該検出した用件確認発話の話者とは別の話者による発話であって、少なくとも前記用件確認発話の直前の発話を前記用件発話であると判定する判定部と、
対話における発話が前記用件発話であるか否かを判定する用件判定モデルの機械学習に用いる学習データを、前記判定部の判定結果に基づいて生成する学習データ生成部と、を備えることを特徴とする用件判定装置。
請求項１に記載の用件判定装置において、
前記学習データ生成部は、対話における発話が前記用件発話であるか否かが、前記判定部と前記用件判定モデルとで一致する判定結果を、前記学習データに追加することを特徴とする用件判定装置。
請求項１または２に記載の用件判定装置において、
前記用件判定モデルを用いて、前記対話における発話が前記用件発話であるか否かを判定し、判定結果を出力することを特徴とする用件判定装置。
複数の話者による対話における発話が、前記対話の用件を示す用件発話であるか否かを判定する用件判定方法であって、
前記対話における発話のなかから、用件を確認するための発話である用件確認発話を検出し、該検出した用件確認発話の話者とは別の話者による発話であって、少なくとも前記用件確認発話の直前の発話を前記用件発話であると判定するステップと、
対話における発話が前記用件発話であるか否かを判定する用件判定モデルの機械学習に用いる学習データを、前記判定の結果に基づいて生成するステップと、を含むことを特徴とする用件判定方法。
請求項４に記載の用件判定方法において、
対話における発話が前記用件発話であるか否かが、前記用件確認発話の検出に基づく判定と前記用件判定モデルとで一致する判定結果を、前記学習データに追加することを特徴とする用件判定方法。
請求項４または５に記載の用件判定方法において、
前記用件判定モデルを用いて、前記対話における発話が前記用件発話であるか否かを判定し、判定結果を出力することを特徴とする用件判定方法。
コンピュータを請求項１から３のいずれか一項に記載の用件判定装置として機能させるためのプログラム。