JP5911911B2

JP5911911B2 - 結束性判定装置、モデル学習装置、方法、及びプログラム

Info

Publication number: JP5911911B2
Application number: JP2014108547A
Authority: JP
Inventors: 東中　竜一郎; 竜一郎東中; 豊美目黒; 今村　賢治; 賢治今村; 弘晃杉山; 牧野　俊朗; 俊朗牧野; 松尾　義博; 義博松尾
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2014-05-26
Filing date: 2014-05-26
Publication date: 2016-04-27
Anticipated expiration: 2034-05-26
Also published as: JP2015225415A

Description

本発明は、結束性判定装置、モデル学習装置、方法、及びプログラムに係り、特に、入力された発話列の結束性を判定するための結束性判定装置、モデル学習装置、方法、及びプログラムに関する。

対話システムは大きく分けて二種類あり、タスク指向型対話システムと非タスク指向型対話システムに分けられる。前者は特定のタスクをシステムとの対話により達成するものであり、例えば、フライトの予約システムや天気情報検索システムに用いられている。これらのシステムでは、予め話される内容が想定できるため、手作業で作り込んだ発話のデータベースを保持したり、データベースから抽出される天気情報などを手作業によるテンプレートに当てはめてシステムは発話を生成する（非特許文献１）。

非タスク指向型対話システムでは、目的のない対話を扱い、対話の内容はいわゆる雑談である。雑談はさまざまな話題が話される。雑談を行う対話システムの構築の仕方は主に二つあり、一つはルールベースの手法で、大量の応答ルールを手作業で記述する手法である（非特許文献２）。もう一つは、抽出ベースの手法で、ウェブやツイッター（登録商標）などの文章をデータベース化しておき、ユーザ発話に類似するものを選択することでシステム発話を生成する（非特許文献３）。

Ryuichiro Higashinaka, Katsuhito Sudoh, Mikio Nakano, "Incorporating Discourse Features into Confidence Scoring of Intention Recognition Results in Spoken Dialogue Systems", Speech Communication, Volume 48, Issues 3-4, pp.417-436,2006. R. S. Wallace, The Anatomy of A.L.I.C.E. A.L.I.C.E. Artificial Intelligence Foundation, Inc., 2004. Bessho, F., Harada, T., and Kuniyoshi, Y. (2012). "Dialog System Using Real-Time Crowdsourcing and Twitter Large-Scale Corpus." In Proc. SIGDIAL,pp. 227-231.

しかし、非特許文献１〜非特許文献３に示す、ルールベースの手法でも、抽出ベースの手法であっても、雑談ではユーザが様々な発話をするために完璧に応答することは難しいという問題がある。例えば、ルールベースの手法では何万というルールを記述することが多いが、準備していたルールとユーザ入力が完全に一致することは稀であり、部分的なルールとのマッチにより、不適切な発話をしてしまうことが多い。また、抽出ベースの手法では、雑多な内容を持つウェブやツイッター（登録商標）の文章を発話に用いるために、抽出されたものの質が悪ければ、不適切な発話をしてしまう場合がある。

本発明では、上記問題を解決するために成されたものであり、入力された発話列の結束性を高精度に判定することができる結束性判定装置、方法、及びプログラムを提供することを目的とする。

また、発話列の結束性を高精度に判定するモデルを学習することができるモデル学習装置、方法、及びプログラムを提供することを目的とする。

上記目的を達成するために、第１の発明に係る結束性判定装置は、入力された、複数の発話からなる発話列に含まれる、形態素解析済みの発話の各々について、少なくとも１つ以上の特徴量を抽出する特徴量抽出部と、前記発話列について、前記発話列に含まれる各発話に対応する各発話ノードを含み、前記発話ノードの各々について、前記発話ノードに対応する前記発話について前記特徴量抽出部において抽出した特徴量の各々を表すノードの各々を、前記発話ノードの子ノードとして追加した木構造を作成する木構造作成部と、前記木構造作成部において作成された木構造から得られる複数の部分木と、前記木構造に対応する発話列の結束性を判定するための予め学習されたモデルとに基づいて、前記発話列の結束性を表すスコアを算出するモデル適用部と、を含んで構成されている。

第２の発明に係る結束性判定方法は、特徴量抽出部と、木構造作成部と、モデル適用部と、を含む結束性判定装置における、結束性判定方法であって、前記特徴量抽出部は、入力された、複数の発話からなる発話列に含まれる、形態素解析済みの発話の各々について、少なくとも１つ以上の特徴量を抽出し、前記木構造作成部は、前記発話列について、前記発話列に含まれる各発話に対応する各発話ノードを含み、前記発話ノードの各々について、前記発話ノードに対応する前記発話について前記特徴量抽出部において抽出した特徴量の各々を表すノードの各々を、前記発話ノードの子ノードとして追加した木構造を作成し、前記モデル適用部は、前記木構造作成部において作成された木構造から得られる複数の部分木と、前記木構造に対応する発話列の結束性を判定するための予め学習されたモデルとに基づいて、前記発話列の結束性を表すスコアを算出する。

第１及び第２の発明によれば、特徴量抽出部により、入力された、複数の発話からなる発話列に含まれる、形態素解析済みの発話の各々について、少なくとも１つ以上の特徴量を抽出し、木構造作成部により、発話列について、発話列に含まれる各発話に対応する各発話ノードを含み、発話ノードの各々について、発話ノードに対応する発話について抽出した特徴量の各々を表すノードの各々を、発話ノードの子ノードとして追加した木構造を作成し、モデル適用部により、作成された木構造から得られる複数の部分木と、木構造に対応する発話列の結束性を判定するための予め学習されたモデルとに基づいて、発話列の結束性を表すスコアを算出する。

このように、発話列に含まれる発話の各々について、少なくとも１つ以上の特徴量を抽出し、発話列について、発話列に含まれる各発話に対応する各発話ノードを含み、発話ノードの各々について、発話ノードに対応する発話について抽出した特徴量の各々を表すノードの各々を、発話ノードの子ノードとして追加した木構造を作成し、作成された木構造から得られる複数の部分木と、木構造に対応する発話列の結束性を判定するための予め学習されたモデルとに基づいて、発話列の結束性を表すスコアを算出することによって、発話列の結束性を精度よく判定することができる。

また、第１の発明において、前記特徴量は、対話行為と、質問タイプと、述語項構造と、固有表現とのうちの少なくとも１つを含む。

また、第１の発明において、前記発話列に含まれる発話の各々について、係り受け解析を行う係り受け解析部を更に含み、前記特徴量は、依存構造を含む。

また、第１の発明において、前記特徴量抽出部は、前記発話の各々について、前記発話に含まれる各単語に対応して前記単語の品詞を表す各単語ノードを含み、単語の係り受け関係に応じたエッジで前記単語ノード間を結んだ木構造であって、前記単語ノードの各々について、前記単語ノードに対応する単語の表記を表すノード、前記単語ノードに対応する単語の標準表記を表すノード、前記単語ノードに対応する単語の終止形を表すノード、及び前記単語ノードに対応する単語の意味属性を表すノードの少なくとも１つを前記単語ノードの子ノードとして追加した前記発話の依存構造を表す木構造を、前記特徴量として作成する依存構造解析部を含み、前記木構造作成部は、前記発話列について、前記発話列に含まれる各発話に対応する各発話ノードを含み、前記発話ノードの各々について、前記発話ノードに対応する前記発話について前記依存構造解析部において作成した前記発話の依存構造を表す木構造を、前記発話ノードの子ノードに連結するように追加した前記木構造を作成してもよい。

第３の発明に係るモデル学習装置は、入力された、発話列の結束性を示すラベルが各々付加されている、複数の発話からなる発話列の各々について、前記発話列に含まれる形態素解析済みの発話毎に、少なくとも１つ以上の特徴量を抽出する特徴量抽出部と、前記発話列の各々について、前記発話列に含まれる各発話に対応する各発話ノードを含み、前記発話ノードの各々について、前記発話ノードに対応する前記発話について、前記特徴量抽出部において抽出した特徴量の各々を表すノードの各々を、前記発話ノードの子ノードとして追加した木構造を作成する木構造作成部と、前記発話列の各々についての、前記木構造作成部において作成された木構造と、前記発話列に付加されている前記ラベルと、に基づいて、前記木構造に対応する発話列の結束性を判定するためのモデルを学習するモデル学習部と、を含んで構成されている。

第４の発明に係るモデル学習方法は、特徴量抽出部と、木構造作成部と、モデル学習部と、を含むモデル学習装置における、モデル学習方法であって、前記特徴量抽出部は、入力された、発話列の結束性を示すラベルが各々付加されている、複数の発話からなる発話列の各々について、前記発話列に含まれる形態素解析済みの発話毎に、少なくとも１つ以上の特徴量を抽出し、前記木構造作成部は、前記発話列の各々について、前記発話列に含まれる各発話に対応する各発話ノードを含み、前記発話ノードの各々について、前記発話ノードに対応する前記発話について、前記特徴量抽出部において抽出した特徴量の各々を表すノードの各々を、前記発話ノードの子ノードとして追加した木構造を作成し、前記モデル学習部は、前記発話列の各々についての、前記木構造作成部において作成された木構造と、前記発話列に付加されている前記ラベルと、に基づいて、前記木構造に対応する発話列の結束性を判定するためのモデルを学習する。

第３及び第４の発明によれば、特徴量抽出部により、入力された、発話列の結束性を示すラベルが各々付加されている、複数の発話からなる発話列の各々について、発話列に含まれる形態素解析済みの発話毎に、少なくとも１つ以上の特徴量を抽出し、木構造作成部により、発話列の各々について、発話列に含まれる各発話に対応する各発話ノードを含み、発話ノードの各々について、発話ノードに対応する発話について、抽出した特徴量の各々を表すノードの各々を、発話ノードの子ノードとして追加した木構造を作成し、モデル学習部により、発話列の各々についての、作成された木構造と、発話列に付加されているラベルと、に基づいて、木構造に対応する発話列の結束性を判定するためのモデルを学習する。

このように、発話列の結束性を示すラベルが各々付加されている、複数の発話からなる発話列の各々について、発話列に含まれる発話毎に、少なくとも１つ以上の特徴量を抽出し、発話列の各々について、発話列に含まれる各発話に対応する各発話ノードを含み、発話ノードの各々について、発話ノードに対応する発話について、抽出した特徴量の各々を表すノードの各々を、発話ノードの子ノードとして追加した木構造を作成し、発話列の各々についての、作成された木構造と、発話列に付加されているラベルと、に基づいて、木構造に対応する発話列の結束性を判定するためのモデルを学習することによって、発話列の結束性を精度よく判定することができるモデルを学習することができる。

また、本発明のプログラムは、コンピュータを、上記の結束性判定装置、及びモデル学習装置を構成する各部として機能させるためのプログラムである。

以上説明したように、本発明の結束性判定装置、方法、及びプログラムによれば、発話列に含まれる発話の各々について、少なくとも１つ以上の特徴量を抽出し、発話列について、発話列に含まれる各発話に対応する各発話ノードを含み、発話ノードの各々について、発話ノードに対応する発話について抽出した特徴量の各々を表すノードの各々を、発話ノードの子ノードとして追加した木構造を作成し、作成された木構造から得られる複数の部分木と、木構造に対応する発話列の結束性を判定するための予め学習されたモデルとに基づいて、発話列の結束性を表すスコアを算出することによって、発話列の結束性を精度よく判定することができる。

また、本発明のモデル学習装置、方法、及びプログラムによれば、発話列の結束性を示すラベルが各々付加されている、複数の発話からなる発話列の各々について、発話列に含まれる発話毎に、少なくとも１つ以上の特徴量を抽出し、発話列の各々について、発話列に含まれる各発話に対応する各発話ノードを含み、発話ノードの各々について、発話ノードに対応する発話について、抽出した特徴量の各々を表すノードの各々を、発話ノードの子ノードとして追加した木構造を作成し、発話列の各々についての、作成された木構造と、発話列に付加されているラベルと、に基づいて、木構造に対応する発話列の結束性を判定するためのモデルを学習することによって、発話列の結束性を精度よく判定することができるモデルを学習することができる。

本発明の実施の形態に係るモデル学習装置の機能的構成を示すブロック図である。依存構造を表す木構造の例を示す図である。発話列の木構造の例を示す図である。Ｓ式で表された発話列の木構造の例を示す図である。学習データの例を示す図である。学習されたモデルの例を示す図である。本発明の実施の形態に係る結束性判定装置の機能的構成を示すブロック図である。本発明の実施の形態に係るモデル学習装置におけるモデル学習処理ルーチンのフローチャート図である。本発明の実施の形態に係る結束性判定装置における結束性判定処理ルーチンのフローチャート図である。実験例の結果を示す図である。

以下、図面を参照して本発明の実施の形態を詳細に説明する。

＜本発明の原理＞
雑談対話の特徴的なところは、発話の自由度であり、必ずしもある発話について何を言わなくてはならないと決まっているわけではないところである。例えば、ある質問があったとして、その対話相手は必ずしもその質問に答える必要はなく、話題を変えたり、相槌を打ったり、聞き返したりしても対話として問題はない。よって、結束性を計る際に、質問に対して答えていないから結束性が低いといったルールを用いることは早計である。直前の発話について続きうる発話の可能性は非常に多く、後の発話がどのような条件のときに、結束性が高くなるのか、低くなるのかは様々な要素が関係する。ここで、結束性とは発話間のつながりのよさを表し、つながりのよい発話ペアは結束性が高いといい、そうでないものは、結束性が低いという。

本実施の形態では、結束性のラベルが付与された発話列について、さまざまな特徴量を抽出し、これらの情報が、どのような条件で発話列に含まれているときに結束性が高くなるか、低くなるかを、パターンマイニングの手法で発見する。特徴量としては、対話行為、質問タイプ、述語項構造、固有表現に関する情報、依存構造に関する情報を用いる。これらは、発話のやり取り、内容、語彙、及び文法などの多角的な観点を含む情報である。発話列におけるこれらの特徴量を、木構造として表す。パターンマイニングによって発見されたパターン（部分木）は、未知の発話列について、結束性を判定する装置に用いられる。具体的には、結束性の高さに寄与する部分木を多く含むものを結束性が高いとして判定する。なお、本実施の形態では、発話列に含まれる発話数を限定せず、発話の組み合わせとして説明するが、本実施の形態の木構造の作成の仕方から分かるように、発話列に含まれる発話数は２つ（すなわち発話ペア）以上であれば、同様に処理が可能である。また、本実施の形態は、学習フェーズと判定フェーズとに分かれる。

＜本発明の実施の形態に係るモデル学習装置の構成＞
次に、本発明の実施の形態に係るモデル学習装置の構成について説明する。図１に示すように、本発明の実施の形態に係るモデル学習装置１００は、ＣＰＵと、ＲＡＭと、後述するモデル学習処理ルーチンを実行するためのプログラムや各種データを記憶したＲＯＭと、を含むコンピュータで構成することが出来る。このモデル学習装置１００は、機能的には図１に示すように入力部１０と、演算部２０と、出力部９０とを備えている。

入力部１０は、発話列の結束性を示すラベルが各々付加されている発話列の集合を受け付ける。ここで、発話列の結束性を示すラベルとして、結束（高い結束性）と非結束（低い結束性）とを用いる。

演算部２０は、形態素解析部２２と、係り受け解析部２４と、特徴量抽出部２５と、木構造作成部３６と、モデル学習部３８と、モデル記憶部４０と、を備えている。

形態素解析部２２は、入力部１０において受け付けた発話列の各々について、当該発話列に含まれる発話毎に、形態素解析を行う。本実施の形態においては、形態素解析を行うプログラムとして、ＪＴＡＧを用いる。なお、形態素解析を行うプログラムとして、ＣｈａｓｅｎやＭｅｃａｂ等を用いてもよい。

係り受け解析部２４は、形態素解析部２２において形態素解析された発話の各々について、係り受け解析を行う。具体的には、形態素解析済みの発話の各々について、当該発話を文節（文節は内容語とそれに伴う機能語からなる日本語の基本的な単位）毎にまとめ、まとめられた文節同士の依存関係を決定する。例えば、「私は彼と映画に行く」という発話については、形態素解析処理の結果から、「私は」「彼と」「映画に」「行く」という４つの文節を取得する。そして、取得された文節同士の依存構造を求めることで、「私は」、「彼と」、「映画に」は、すべて「行く」に係る構造であると解析できる。本実施の形態においては、係り受け解析を行うプログラムとしてＪＤＥＰを用いる。ここで、ＪＤＥＰは、ＪＴＡＧの出力を基にして、係り受け解析を行うソフトウェアである。なお、係り受け解析を行うプログラムとしてＣａｂｏｃｈａやＫＮＰを用いてもよい。

特徴量抽出部２５は、対話行為推定部２６と、質問タイプ判定部２８と、述語項構造解析部３０と、固有表現抽出部３２と、依存構造解析部３４と、木構造作成部３６と、モデル学習部３８と、モデル記憶部４０と、を備えている。また、特徴量抽出部２５は、入力部１０において受け付けた発話列の各々について、当該発話列に含まれる発話毎に、対話行為、質問タイプ、述語項構造、固有表現に関する情報、及び依存構造に関する情報の各々を、特徴量として抽出する。

対話行為推定部２６は、入力部１０において受け付けた発話列の各々について、当該発話列に含まれる発話毎に、当該発話の対話行為を推定し、推定された対話行為を当該発話の特徴量として抽出する。例えば、発話「こんにちは」に対して、対話行為「挨拶」を推定し、発話「私はラーメンが好きです」に対して、対話行為「自己開示_評価+」を推定する。具体的には、発話列の各々について、当該発話列に含まれる発話毎に、当該発話内の単語に基づいて、単語特徴量を抽出し、その単語特徴量から、対話行為を推定する推定器を用いて、対話行為を推定する。ここで、推定器は、機械学習の手法で予め構築しておけばよい。例えば、文書分類で一般的に用いられる手法である、サポートベクトルマシンなどを用いて構築できる。単語特徴量としては、たとえば発話内の単語の頻度ベクトルなどを用いればよい。本実施の形態においては、別途用意した約数万の発話について人手で対話行為を付与し、このデータを学習データとして、サポートベクトルマシンによって、発話からその対話行為を推定する多クラス分類器を学習した。なお、本実施の形態で扱う対話行為は全部で３３種類である（非特許文献４：T. Meguro, Y. Minami, R. Higashinaka, and K. Dohsaka, “Learning to control listening-oriented dialogue using partially observable markov decision processes," ACM Transactions on Speech and Language Processing (TSLP), vol.10, no.4,p.15, 2013.）。

質問タイプ判定部２８は、入力部１０において受け付けた発話列の各々について、当該発話列に含まれる発話毎に、質問タイプを判定し、判定された質問タイプを当該発話の特徴量として抽出する。ここで、質問の分類を示したタイプとして、本実施の形態においては、大まかに質問が何を尋ねているかを表す基本質問タイプと、質問がどのような固有表現（固有名詞や数量表現）を回答として求めているかを表す拡張固有表現質問タイプの２種類を用いる。例えば、発話「エベレストの高さは？」を対象とすると、基本質問タイプ「数量:その他」、拡張固有表現質問タイプ「Ｈｅｉｇｈｔ」が当該発話の特徴量として抽出される。なお、基本質問タイプとしては、「名称:その他、名称:人名、数量:その他、数量:日付、数量:期間、数量:金額、真偽、説明:原因、説明:意味、説明:方法、説明:評判、説明:連想、その他．」の１３種類を用いる。また、固有表現としては、種類が２００種類ある、拡張固有表現の体系を用いる（非特許文献５：Satoshi Sekine, Chikashi Nobata, Definition, dictionaries and tagger for Extended Named Entity Hierarchy LREC2004 pp．1977-1980）。

具体的には、発話列の各々について、当該発話列に含まれる発話毎に、当該発話内の単語に基づいて、単語特徴量を抽出し、その単語特徴量から、基本質問タイプを判定する判定器を用いて、基本質問タイプを判定し、当該発話の特徴量として抽出する。また、当該発話内の単語に基づいて、単語特徴量を抽出し、その単語特徴量から、拡張固有表現質問タイプを判定する判定器を用いて、拡張固有表現質問タイプを判定し、当該発話の特徴量として抽出する。ここで、基本質問タイプを判定する判定器及び拡張固有表現質問タイプを判定する判定器は、機械学習の手法で予め構築しておけばよい。例えば、文書分類で一般的に用いられる手法である、サポートベクトルマシンなどを用いて構築できる。単語特徴量としては発話内の単語の頻度ベクトルなどを用いればよい。本実施の形態においては、別途用意した大量の質問文について人手で基本質問タイプを付与し、このデータを学習データとして、サポートベクトルマシンによって、発話から基本質問タイプを判定する多クラス分類器を学習した。また、別途用意した大量の質問文について人手で拡張固有表現質問タイプを付与し、このデータを学習データとして、サポートベクトルマシンによって、発話から拡張固有表現質問タイプを判定する多クラス分類器を学習した。

述語項構造解析部３０は、入力部１０において受け付けた発話列の各々について、当該発話列に含まれる発話毎に、当該発話を先頭から順番に処理し、当該発話の述語項構造を特徴量として抽出する。ここで、述語項構造とは、述語と項からなるデータ構造のことである。例えば、発話「コンビニはいいですね」に対応する述語項構造は、述語が「いい」であり、項が「コンビニ」であり、ガ格（主格）である。なお、述語項構造は、発話において述語がない場合は取得できない場合もあり、また、１つの発話において複数の述語項構造が取得できる場合もある。

具体的には、形態素解析部２２及び係り受け解析部２４における形態素解析及び係り受け解析済みの発話について、当該発話に含まれる文節の各々について、当該文節の主辞（最も重要な要素）が述語（動詞、形容詞、動作性名詞、判定詞を伴う名詞）である文節を選択し、当該文節の述語を抽出する。そして、その述語の格要素となる名詞句（全体として名詞となる句）を当該発話中から抽出する。例えば、発話「コンビニでおにぎりを買う」の場合は、まず、「買う」が述語として抽出され、「コンビニ」がデ格の格要素として、「おにぎり」がヲ格の格要素として抽出され、最終的な述語項構造は「述語：買うデ格：コンビニヲ格：おにぎり」となる。

また、対話においては、項が省略されることが多いため、本実施の形態においては、項が省略されている場合には、項を補完する処理を行う。具体的には、まず、述語について格要素が抽出できなかった場合で、かつ、その格要素が必須とされる場合、文脈（処理中の文より前の文）からその格要素となり得る名詞句を検索し、見つかればその要素によって格要素を埋める。この処理を、ゼロ代名詞解消という。もし、格要素が文脈にも見つからない場合にはexog（外界照応）というシンボルによってこの格要素を埋める。ここで、格要素が必須であるか否かの判定は、メモリ（図示省略）に記憶されている必須格辞書に基づいて行えばよい。なお、必須格辞書は、大規模なテキストデータを解析して構築できる、述語の、その述語が伴う格のリストを保持したデータである。本実施の形態において用いる必須格辞書では、「行く」の必須格として「ニ格」が、「買う」の必須格として「ヲ格」と「デ格」が、「思う」の必須格として「ト格」が定義されている。

例えば「美味しいよね」という発話について考えると、述語は「美味しい」であり、格要素として「ガ格」が必要である。ガ格を埋めるものが文脈に存在しない場合、得られる述語項構造は「述語：美味しいガ格：exog」となる。なお、本実施の形態においては、述語項構造解析器として、非特許文献６（今村賢治, 東中竜一郎, 泉朋子，ゼロ代名詞照応付き述語項構造解析の対話への適応，言語処理学会年次大会，pp.709-712, 2014.）記載の、述語と格に対して得られる格要素の候補を統計的に並び替え、最も統計的に尤度が高いものを採用する方法を用いる述語項構造解析器を用いる。

固有表現抽出部３２は、入力部１０において受け付けた発話列の各々について、当該発話列に含まれる発話毎に、固有表現に関する情報を、当該発話の特徴量として抽出する。本実施の形態においては、固有表現として、２００種類ある拡張固有表現を用いる（非特許文献５）。固有表現抽出の手法としては、ＣＲＦ（conditional random fields）といった一般的な系列ラベリングの手法を用い、固有表現の箇所がラベル付けされた学習データから固有表現抽出器を学習し、用いる。特徴量としては、単語表記の並びや、品詞の並び、及び、これらの組み合わせなどを用いればよい。例えば、発話「太郎がエベレストに昇った」については、「太郎」がPersonであり、「エベレスト」がMountainであるという固有表現が抽出されるので、これらの情報が固有表現抽出部３２の出力となる。固有表現抽出は、フリーソフトであるＣａｂｏＣｈａを用いて行う事も可能である。

依存構造解析部３４は、入力部１０において受け付けた発話列の各々について、当該発話列に含まれる発話毎に、係り受け解析部２４の処理における係り受け解析結果に基づいて、当該発話に含まれる単語同士の依存構造に関する情報である、依存構造を表す木構造を作成し、当該発話の特徴量として抽出する。

具体的には、係り受け解析された発話に含まれる文節の各々に対し、当該文節に含まれる各単語について、当該単語から、当該単語から一番近く、かつ当該文節内で右側に位置する単語に係るようにする。また、文節の各々について、当該文節の最右の単語は、係先の文節内の主辞となる単語に係るようにする。係先が存在しない単語（文内最後の単語）については、木のルートノード（ｒｏｏｔ）に係るようにする。そして、当該発話に含まれる単語の各々について、当該単語の品詞を表すノードを、当該単語を代表するノード（以後、単語ノードとする）として作成し、単語の係り受け関係に応じたエッジで単語ノード間を結ぶ。また、当該発話に含まれる単語の各々について、当該単語の単語ノードの子ノードとして、当該単語の表記、標準表記、終止形の各々を表すノードを追加する。

また、当該発話に含まれる単語の各々について、当該単語に対応する意味属性が存在する場合は、当該単語の単語ノードの子ノードとして、その意味属性の情報を持つノードを追加する。なお、意味属性が複数存在する場合には、全ての意味属性についてのノードを各々追加する。ここで、意味属性とは、単語の持つ意味内容を指す番号のことである。日本語語彙大系という辞書には、単語とその意味属性の対応が記憶されている。意味属性情報は三種類あり、一般名詞に付与される一般名詞意味属性、固有名詞に付与される固有名詞意味属性、用言（主に動詞）に付与される用言意味属性がある。本実施の形態においては、発話毎に当該発話に含まれる単語の各々について、これらに対応する意味属性を日本語語彙大系から取得する。例えば、発話「私は彼と映画に行った」という文について、依存構造解析部３４において木構造を作成すると、図２のような木構造が作成できる。なお、一般名詞意味属性、固有名詞意味属性、用言意味属性をそれぞれ区別するため、接頭辞として、それぞれＮ，Ｐ、Ｙを付与している。

木構造作成部３６は、入力部１０において受け付けた発話列の各々について、当該発話列に含まれる発話毎の、対話行為と、基本質問タイプと、拡張固有表現質問タイプと、述語項構造と、固有表現に関する情報と、依存構造を表す木構造とに基づいて、図３に示すような、当該発話列の木構造を作成する。図３は、発話列に発話が２つ含まれる場合の例である。まず、ルートノードの子ノードに発話の各々に対応する、発話ノードを２つ追加する。次に、発話ノードの各々に、子ノードとして、特徴量の各々を表す、ＤＡ、Ｑ−Ｔｙｐｅ、ＰＡＳ、ＥＮＥ、ＤＥＰの各々のラベルが付与された子ノードの各々を追加する。そして、ＤＡノードの子ノードとして、当該ＤＡノードの親ノードの発話ノードに対応する発話において抽出した対話行為を追加し、Ｑ−Ｔｙｐｅノードの子ノードとして、当該Ｑ−Ｔｙｐｅノードの親ノードの発話ノードに対応する発話において抽出した基本質問タイプ及び拡張固有表現質問タイプの各々を追加し、ＰＡＳノードの子ノードとして、当該ＰＡＳノードの親ノードの発話ノードに対応する発話において抽出した述語項構造を追加し、ＥＮＥノードの子ノードとして、当該ＥＮＥノードの親ノードの発話ノードに対応する発話において抽出した固有表現を追加し、ＤＥＰノードの子ノードに、当該ＤＥＰノードの親ノードの発話ノードに対応する発話において抽出した依存構造を表す木構造を連結するように追加する。

図４に木構造の例を示す。図４の木構造は、発話「そうですね、外国に行ったことはありますか」と、発話「ええ」とが含まれている発話列について、木構造作成部３６において作成された木構造の例である。図４に示す木構造はＳ式で表されている。最初の発話は「14:質問経験」という対話行為であり、質問タイプは「真偽」、「Country」である。また、述語項構造として、「述語：行くガ格：あなた（YOU）ニ格：外国）」と、「述語：あるガ格：ことニ格：exog」とがある。図４の木構造では、番号で述語と格要素とを表している。０番は述語であり、１番はガ格、３番はニ格を表す。dep以下は依存構造を表す木構造である。なお、ここで、uttは発話ノードであり、da、qtype、pa、depはそれぞれ対話行為、質問タイプ、述語項構造、依存構造のノードである。この発話には拡張固有表現が存在しないため、ENEのノードが存在しない。次の発話「ええ」については、「30:感嘆」という対話行為であり、質問タイプには「説明：意味」と「Person」とがある。また、dep以下に独立詞のみからなる依存構造がある。

モデル学習部３８は、入力部１０において受け付けた発話列の各々について、木構造作成部３６において作成された当該発話列の木構造と、当該発話列に付加されているラベルとに基づいて、発話列の結束性を判定するためのモデルを学習し、モデル記憶部４０に記憶すると共に、出力部９０に出力する。本実施の形態においては、モデルの学習に用いるアルゴリズムとしてＢＡＣＴを用いる。当該アルゴリズムは、与えられたデータ中の木構造に含まれる部分木を列挙し、当該部分木が結束、非結束の判定にどの程度寄与しているかの重みを統計的な処理によって計算するものである。最終的に得られるモデルの学習結果は、部分木とその重みのペアの集合となる。ＢＡＣＴは木構造一般の判定に用いられるアルゴリズムである（非特許文献７：Taku Kudo, Yuji Matsumoto (2004) A Boosting Algorithm for Classification of Semi-Structured Text, EMNLP 2004.）。なお、学習アルゴリズムは、木構造中の部分木の存在を特徴量にでき、その特徴量に重みを付与できるものであれば、他のアルゴリズムを用いてもよい。

学習データの一例を図５に示す。結束のラベルが付加されたデータの先頭には結束を表す＋１が、非結束のラベルが付加されたデータの先頭には−１が付加されている。木構造はＢＡＣＴの入力形態であるＳ式となっている。また、対話システムと人間の対話データから２０００の発話列（当該発話列に含まれる発話は２つとする）を準備し、これらについてラベルを人手で付与したデータを元にモデル学習部３８に適用し、学習されたモデルの例を図６に示す。図６に示す例については、最初の行は切片であり、どのような部分木を持つかによらず分類対象に与えられる重みである。以降、最初の数字が重みであり、その後はその重みを持つ部分木の文字列表現である。文字列表現において、')'は、兄弟関係を表しており、それ以外は親子関係である。正の重みは、その部分木が含まれると結束になりやすいことを示し、負の重みは、その部分木が含まれると非結束になりやすいことを示す。

モデル記憶部４０には、モデル学習部３８において学習された発話列の結束性を判定するためのモデルが記憶されている。

＜本発明の実施の形態に係る結束性判定装置の構成＞
次に、本発明の実施の形態に係る結束性判定装置の構成について説明する。図７に示すように、本発明の実施の形態に係る結束性判定装置２００は、ＣＰＵと、ＲＡＭと、後述する結束性判定処理ルーチンを実行するためのプログラムや各種データを記憶したＲＯＭと、を含むコンピュータで構成することが出来る。この結束性判定装置２００は、機能的には図７に示すように入力部２１０と、演算部２２０と、出力部２９０とを備えている。

入力部２１０は、複数の発話からなる発話列を受け付ける。

演算部２２０は、形態素解析部２２２と、係り受け解析部２２４と、特徴量抽出部２２５と、木構造作成部２３６と、モデル適用部２３８と、モデル記憶部２４０と、判定部２４２と、を備えている。

形態素解析部２２２は、入力部２１０において受け付けた発話列に含まれる発話の各々について、モデル学習装置１００の形態素解析部２２と同様に、ＪＴＡＧを用いて形態素解析を行う。

係り受け解析部２２４は、形態素解析部２２２において形態素解析された発話の各々について、モデル学習装置１００の係り受け解析部２４と同様に、ＪＤＥＰを用いて係り受け解析を行う。

特徴量抽出部２２５は、対話行為推定部２２６と、質問タイプ判定部２２８と、述語項構造解析部２３０と、固有表現抽出部２３２と、依存構造解析部２３４と、を備えている。また、特徴量抽出部２２５は、入力部２１０において受け付けた発話列に含まれる発話の各々について、モデル学習装置１００の特徴量抽出部２５と同様に、対話行為、質問タイプ、述語項構造、固有表現に関する、及び依存構造を表す木構造の各々を、特徴量として抽出する。

対話行為推定部２２６は、入力部２１０において受け付けた発話列に含まれる発話の各々について、モデル学習装置１００の対話行為推定部２６と同様の推定器を用いて、対話行為を推定し、当該発話の特徴量として抽出する。

質問タイプ判定部２２８は、入力部２１０において受け付けた発話列に含まれる発話の各々について、モデル学習装置１００の質問タイプ判定部２８と同様に、基本質問タイプ及び拡張固有表現質問タイプの各々についての判定器を用いて、質問タイプを判定し、当該発話の特徴量として抽出する。

述語項構造解析部２３０は、入力部２１０において受け付けた発話列に含まれる発話の各々について、モデル学習装置１００の述語項構造解析部３０と同様に、係り受け解析部２２４において取得した、係り受け解析結果に基づいて、述語項構造を、当該発話の特徴量として抽出する。

固有表現抽出部２３２は、入力部２１０において受け付けた発話列に含まれる発話の各々について、モデル学習装置１００の固有表現抽出部３２と同様に、拡張固有表現を用いて、固有表現を、当該発話の特徴量として抽出する。

依存構造解析部２３４は、入力部２１０において受け付けた発話列に含まれる発話の各々について、モデル学習装置１００の依存構造解析部３４と同様に、係り受け解析部２２４において取得した、係り受け解析結果に基づいて、当該発話の依存構造を表す木構造を作成し、当該発話の特徴量として抽出する。

木構造作成部２３６は、入力部２１０において受け付けた発話列について、モデル学習装置１００の木構造作成部３６と同様に、当該発話列に含まれる発話の各々について、対話行為推定部２２６において推定された対話行為と、質問タイプ判定部２２８において判定された質問タイプと、述語項構造解析部２３０において取得した述語項構造と、固有表現抽出部２３２において抽出した固有表現に関する情報と、依存構造解析部２３４において作成した依存構造を表す木構造と、に基づいて、当該発話列の木構造を作成する。

モデル適用部２３８は、木構造作成部２３６において作成した、入力部１０において受け付けた発話列についての木構造と、モデル記憶部２４０に記憶されている発話列の結束性を判定するためのモデルとに基づいて、当該作成した木構造に対応する発話列の結束性を示すスコアを算出する。具体的には、当該木構造に含まれる部分木を列挙し、下記（１）式に従って、当該モデルを参照して、それぞれの部分木の重みを足し合わせることにより、発話列の結束性を示すスコアを算出する。

ここで、ｔは当該発話列の木構造であり、ｓｃｏｒｅは木構造についての発話列の結束性を示すスコアを返す。ｗｅｉｇｈｔ_０は切片を指し、ｓｕｂｔｒｅｅｓは木構造から部分木を列挙する関数である。ｗｅｉｇｈｔは部分木について、当該モデルを参照し、その重みを返す関数である。

モデル記憶部２４０には、モデル学習装置１００のモデル記憶部４０に記憶されている発話列の結束性を判定するためのモデルと同一のモデルが記憶されている。

判定部２４２は、入力部２１０にいて受け付けた発話列について、モデル適用部２３８において算出された発話列の結束性を示すスコアが、予め定められた閾値を超えているかを判定し、閾値を超えている場合には、当該発話列が結束していると判定し、出力部２９０に判定結果を出力する。また、発話列の結束性を示すスコアが閾値以下の場合には、当該発話列を非結束と判定し、出力部２９０に判定結果を出力する。閾値には、例えば０．０を用いる。

＜本発明の実施の形態に係るモデル学習装置の作用＞
次に、本発明の実施の形態に係るモデル学習装置１００の作用について説明する。発話列の結束性を示すラベルが各々付加されている発話列の集合を受け付けると、モデル学習装置１００は、図８に示すモデル学習処理ルーチンを実行する。

まず、ステップＳ１００では、入力部１０において受け付けた発話列の各々について、当該発話列に含まれる発話毎に、ＪＴＡＧを用いて形態素解析を行う。

次に、ステップＳ１０２では、入力部１０において受け付けた発話列の各々について、当該発話列に含まれる発話毎に、ステップＳ１００において取得した当該発話の形態素解析結果に基づいて、ＪＤＥＰを用いて係り受け解析を行う。

次に、ステップＳ１０４では、処理対象となる発話列に含まれる発話の各々について、予め構築された対話行為を推定する推定器を用いて、対話行為を推定する。

次に、ステップＳ１０６では、処理対象となる発話列に含まれる発話の各々について、予め構築された基本質問タイプ及び拡張固有表現質問タイプの各々の判定器を用いて、質問タイプを判定する。

次に、ステップＳ１０８では、処理対象となる発話列に含まれる発話の各々について、ステップＳ１０２において取得した当該発話の係り受け解析結果に基づいて、述語項構造を取得する。

次に、ステップＳ１１０では、処理対象となる発話列に含まれる発話の各々について、拡張固有表現を用いて、固有表現を抽出する。

次に、ステップＳ１１２では、処理対象となる発話列に含まれる発話の各々について、ステップＳ１０２において取得した当該発話の係り受け解析結果に基づいて、当該発話の依存構造を表す木構造を作成する。

次に、ステップＳ１１４では、処理対象となる発話列について、当該発話列に含まれる発話の各々について、ステップＳ１０４において取得した対話行為と、ステップＳ１０６において取得した質問タイプと、ステップＳ１０８において取得した述語項構造と、ステップＳ１１０において取得した固有表現と、ステップＳ１１２において取得した依存構造を表す木構造と、に基づいて、当該発話列の木構造を作成する。

次に、ステップＳ１１６では、受け付けた全ての発話列についてステップＳ１０４〜ステップＳ１１４の処理を終了したか否かを判定する。受け付けた全ての発話列についてステップＳ１０４〜ステップＳ１１４の処理を終了している場合には、ステップＳ１１８へ移行し、受け付けた全ての発話列についてステップＳ１０４〜ステップＳ１１４の処理を終了していない場合には、処理対象となる発話列を変更し、ステップＳ１０４〜ステップＳ１１４の処理を行う。

次に、ステップＳ１１８では、ステップＳ１１４において取得した入力部１０において受け付けた発話列の各々の木構造と、入力部１０において受け付けた発話列の各々に付加されているラベルとに基づいて、発話列の結束性を判定するためのモデルを学習し、モデル記憶部４０に記憶する。

次に、ステップＳ１２０では、ステップＳ１１８において取得した発話列の結束性を判定するためのモデルを出力部９０に出力してモデル学習処理ルーチンを終了する。

＜本発明の実施の形態に係る結束性判定装置の作用＞
次に、本発明の実施の形態に係る結束性判定装置２００の作用について説明する。まず、入力部２１０から、モデル学習装置１００において学習された発話列の結束性を判定するためのモデルが入力され、モデル記憶部２４０に記憶される。そして、処理対象となる発話列を受け付けると、結束性判定装置２００は、図９に示す結束性判定処理ルーチンを実行する。

まず、ステップＳ２００では、モデル記憶部２４０に記憶されている発話列の結束性を判定するためのモデルを読み込む。

次に、ステップＳ２０２では、ステップＳ１００と同様に、入力部２１０において受け付けた発話列に含まれる発話の各々について、ＪＴＡＧを用いて形態素解析を行う。

次に、ステップＳ２０４では、ステップＳ１０２と同様に、入力部２１０において受け付けた発話列に含まれる発話の各々について、ステップＳ１００において取得した形態素解析結果に基づいて、ＪＤＥＰを用いて係り受け解析を行う。

次に、ステップＳ２０６では、ステップＳ１０４と同様に、入力部２１０において受け付けた発話列に含まれる発話の各々について、予め構築された対話行為を推定する推定器を用いて、対話行為を推定する。

次に、ステップＳ２０８では、ステップＳ１０６と同様に、入力部２１０において受け付けた発話列に含まれる発話の各々について、予め構築された基本質問タイプ及び拡張固有表現質問タイプの各々の判定器を用いて、質問タイプを判定する。

次に、ステップＳ２１０では、ステップＳ１０８と同様に、入力部２１０において受け付けた発話列に含まれる発話の各々について、ステップＳ２０４において取得した当該発話の係り受け解析結果に基づいて、述語項構造を取得する。

次に、ステップＳ２１２では、ステップＳ１１０と同様に、入力部２１０において受け付けた発話列に含まれる発話の各々について、拡張固有表現を用いて、固有表現を抽出する。

次に、ステップＳ２１４では、ステップＳ１１２と同様に、入力部２１０において受け付けた発話列に含まれる発話の各々について、ステップＳ２０４において取得した当該発話の係り受け解析結果に基づいて、当該発話の依存構造を表す木構造を作成する。

次に、ステップＳ２１６では、ステップＳ１１４と同様に、ステップＳ２０６において取得した対話行為と、ステップＳ２０８にいて取得した質問タイプと、ステップＳ２１０において取得した述語項構造と、ステップＳ２１２において取得した固有表現と、ステップＳ２１４において取得した依存構造を表す木構造と、に基づいて、入力部２１０において受け付けた発話列について、木構造を作成する。

次に、ステップＳ２１８では、入力部２１０において受け付けた発話列について、ステップＳ２００において取得した発話列の結束性を判定するためのモデルと、ステップＳ２１６において取得した当該発話列の木構造とに基づいて、上記（１）式に従って、発話列の結束性を示すスコアを算出する。

次に、ステップＳ２２０では、ステップＳ２１８において算出した発話列の結束性を示すスコアが、予め定められた閾値を超えている否かを判定する。算出した発話列の結束性を示すスコアが閾値を超えている場合には、ステップＳ２２２へ移行し、算出した発話列の結束性を示すスコアが閾値以下である場合には、ステップＳ２２４へ移行する。

ステップＳ２２２では、入力部２１０において受け付けた発話列を結束であると判定する。

ステップＳ２２４では、入力部２１０において受け付けた発話列を非結束であると判定する。

次に、ステップＳ２２６では、ステップＳ２２２又はステップＳ２２４において判定された結果を、出力部２９０に出力して、結束性判定処理ルーチンを終了する。

＜実験例＞
図１０に、発話ノードの子ノードとしてＤＡ、Ｑ−Ｔｙｐｅ、ＰＡＳ、ＥＮＥ、ＤＥＰの各々のノードのみを追加した場合の精度と、ＥＮＥを除くすべての子ノードを追加した場合の精度を示す（１０分割交差検定による）。ここで精度というのは、結束、非結束をどれだけ正しく当てられたかを表す。ＥＮＥを除いているのは、本データについてはもっともよい組み合わせを自動的に求めたところ、ＥＮＥを除く場合が、一番精度がよかったからであるが、データによっては性能改善も見られた。このデータから分かるとおり、個々の情報を用いて性能が上がることが確認できた他、複数のノードを組み合わせて使うことでさらに精度が改善することが示された。なお、ベースラインはすべてを「非結束」とするマジョリティベースラインである。

以上説明したように、本発明の実施の形態に係る結束性判定装置によれば、発話列に含まれる発話の各々について、特徴量を抽出し、発話列について、発話列に含まれる各発話に対応する各発話ノードを含み、発話ノードの各々について、発話ノードに対応する発話について抽出した特徴量の各々を表すノードの各々を、発話ノードの子ノードとして追加した木構造を作成し、作成された木構造から得られる複数の部分木と、木構造に対応する発話列の結束性を判定するための予め学習されたモデルとに基づいて、発話列の結束性を表すスコアを算出することによって、発話列の結束性を精度よく判定することができる。

また、本発明の実施の形態に係るモデル学習装置によれば、発話列の結束性を示すラベルが各々付加されている発話列の各々について、発話列に含まれる発話毎に、特徴量を抽出し、発話列の各々について、発話列に含まれる各発話に対応する各発話ノードを含み、発話ノードの各々について、発話ノードに対応する発話について、抽出した特徴量の各々を表すノードの各々を、発話ノードの子ノードとして追加した木構造を作成し、発話列の各々についての、作成された木構造と、発話列に付加されているラベルと、に基づいて、木構造に対応する発話列の結束性を判定するためのモデルを学習することによって、発話列の結束性を精度よく判定することができるモデルを学習することができる。

また、対話システムが発話を行う際に、直前のユーザ発話と、対話システムが今発話しようとしている発話をペアにして、それらの結束性を判定し、もし、結束性が低い場合にはその発話を行わない判断をすることができる。そのような際には、対話システムは別の発話を試すことが可能となる。抽出ベースのシステムでは発話候補がインターネット上から大量に得られることが多い。これらの発話候補を直前のユーザ発話とペアにして、それぞれの結束性を判定し、結束性の高いものを発話に用いることで結束性の高い、不適切でない発話を行う事が可能となる。

また、対話システムの発話の結束性が高まり、ユーザにとって理解しやすいシステム発話を行うことができる。それにより、システムとユーザの意思疎通がしやすくなり、システムとユーザのインタラクションが円滑になる。

なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

例えば、本実施の形態において、拡張固有表現質問タイプに用いる固有表現として拡張固有表現を用いる場合について説明したが、これに限定されるものではなく、固有表現として、一般的なIREXの固有表現の分類を用いてもよい。

また、本実施の形態においては、述語項構造解析器として、非特許文献６に記載の述語項構造解析器を用いる場合について説明したが、これに限定されるものではない。例えば、述語項解析器として、ＳｙｎＣｈａやＣｈａＰＡＳを用いてもよく、述語項構造解析結果を取得するためにＫＮＰを用いてもよい。

また、本実施の形態においては、２００種類ある拡張固有表現を用いて、特徴量としての固有表現を抽出する場合について説明したが、これに限定されるものではない。例えば、ＩＲＥＸによる分類を用いて、特徴量としての固有表現を抽出するようにしてもよい。

また、本実施の形態においては、単語の意味を表す情報として、意味属性を用いる場合について説明したが、これに限定されるものではない。例えば、意味属性の代わりに、ＷｏｒｄＮｅｔにおける、ＳｙｎｓｅｔＩＤを用いてもよい。また、複数の単語をクラスタリングすることによって、各単語に割り当てられるクラスタの番号を意味情報として用いてもよい。

また、本実施の形態においては、特徴量として、対話行為と、質問タイプと、述語項構造と、固有表現と、依存構造を表す木構造とを全て抽出する場合について説明したが、これに限定されるものではない。例えば、対話行為と、質問タイプと、述語項構造と、固有表現と、依存構造を表す木構造とのうち、少なくとも１つを特徴量として抽出するようにしてもよい。この場合には、特徴量として抽出された、対話行為と、質問タイプと、述語項構造と、固有表現と、依存構造を表す木構造とのうち、少なくとも１つを用いて発話列の木構造を作成するようにすればよい。

また、本実施の形態においては、質問タイプとして、基本質問タイプと拡張固有表現質問タイプとを特徴量として抽出する場合について説明したが、これに限定されるものではなく、例えば、基本質問タイプ及び拡張固有表現質問タイプのうち少なくとも１つを特徴量として抽出してもよいし、他の分類の質問タイプを特徴量として抽出してもよい。

また、本実施の形態においては、単語ノードの子ノードとして、当該単語の表記を表すノード、標準表記を表すノード、終止形を表すノード、及び意味属性の情報を持つノード、を追加する場合を例に説明したが、これに限定されるものではない。例えば、単語ノードの子ノードとして、当該単語の表記を表すノード、標準表記を表すノード、終止形を表すノード、及び意味属性の情報を持つノードの少なくとも一つを追加するようにしてもよい。

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。

１０入力部
２０演算部
２２形態素解析部
２４係り受け解析部
２５特徴量抽出部
２６対話行為推定部
２８質問タイプ判定部
３０述語項構造解析部
３２固有表現抽出部
３４依存構造解析部
３６木構造作成部
３８モデル学習部
４０モデル記憶部
９０出力部
１００モデル学習装置
２００結束性判定装置
２１０入力部
２２０演算部
２２２形態素解析部
２２４係り受け解析部
２２５特徴量抽出部
２２６対話行為推定部
２２８質問タイプ判定部
２３０述語項構造解析部
２３２固有表現抽出部
２３４依存構造解析部
２３６木構造作成部
２３８モデル適用部
２４０モデル記憶部
２４２判定部
２９０出力部

Claims

入力された、複数の発話からなる発話列に含まれる、形態素解析済みの発話の各々について、少なくとも１つ以上の特徴量を抽出する特徴量抽出部と、
前記発話列について、前記発話列に含まれる各発話に対応する各発話ノードを含み、前記発話ノードの各々について、前記発話ノードに対応する前記発話について前記特徴量抽出部において抽出した特徴量の各々を表すノードの各々を、前記発話ノードの子ノードとして追加した木構造を作成する木構造作成部と、
前記木構造作成部において作成された木構造から得られる複数の部分木と、前記木構造に対応する発話列の結束性を判定するための予め学習されたモデルとに基づいて、前記発話列の結束性を表すスコアを算出するモデル適用部と、
を含む、結束性判定装置。
前記特徴量は、対話行為と、質問タイプと、述語項構造と、固有表現とのうちの少なくとも１つを含む請求項１記載の結束性判定装置。
前記発話列に含まれる発話の各々について、係り受け解析を行う係り受け解析部を更に含み、
前記特徴量は、依存構造を含む請求項１又は２記載の結束性判定装置。
前記特徴量抽出部は、
前記発話の各々について、前記発話に含まれる各単語に対応して前記単語の品詞を表す各単語ノードを含み、単語の係り受け関係に応じたエッジで前記単語ノード間を結んだ木構造であって、前記単語ノードの各々について、前記単語ノードに対応する単語の表記を表すノード、前記単語ノードに対応する単語の標準表記を表すノード、前記単語ノードに対応する単語の終止形を表すノード、及び前記単語ノードに対応する単語の意味属性を表すノードの少なくとも１つを前記単語ノードの子ノードとして追加した前記発話の依存構造を表す木構造を、前記特徴量として作成する依存構造解析部を含み、
前記木構造作成部は、前記発話列について、前記発話列に含まれる各発話に対応する各発話ノードを含み、前記発話ノードの各々について、前記発話ノードに対応する前記発話について前記依存構造解析部において作成した前記発話の依存構造を表す木構造を、前記発話ノードの子ノードに連結するように追加した前記木構造を作成する請求項３記載の結束性判定装置。
入力された、発話列の結束性を示すラベルが各々付加されている、複数の発話からなる発話列の各々について、前記発話列に含まれる形態素解析済みの発話毎に、少なくとも１つ以上の特徴量を抽出する特徴量抽出部と、
前記発話列の各々について、前記発話列に含まれる各発話に対応する各発話ノードを含み、前記発話ノードの各々について、前記発話ノードに対応する前記発話について、前記特徴量抽出部において抽出した特徴量の各々を表すノードの各々を、前記発話ノードの子ノードとして追加した木構造を作成する木構造作成部と、
前記発話列の各々についての、前記木構造作成部において作成された木構造と、前記発話列に付加されている前記ラベルと、に基づいて、前記木構造に対応する発話列の結束性を判定するためのモデルを学習するモデル学習部と、
を含む、モデル学習装置。
特徴量抽出部と、木構造作成部と、モデル適用部と、を含む結束性判定装置における、結束性判定方法であって、
前記特徴量抽出部は、入力された、複数の発話からなる発話列に含まれる、形態素解析済みの発話の各々について、少なくとも１つ以上の特徴量を抽出し、
前記木構造作成部は、前記発話列について、前記発話列に含まれる各発話に対応する各発話ノードを含み、前記発話ノードの各々について、前記発話ノードに対応する前記発話について前記特徴量抽出部において抽出した特徴量の各々を表すノードの各々を、前記発話ノードの子ノードとして追加した木構造を作成し、
前記モデル適用部は、前記木構造作成部において作成された木構造から得られる複数の部分木と、前記木構造に対応する発話列の結束性を判定するための予め学習されたモデルとに基づいて、前記発話列の結束性を表すスコアを算出する
結束性判定方法。
特徴量抽出部と、木構造作成部と、モデル学習部と、を含むモデル学習装置における、モデル学習方法であって、
前記特徴量抽出部は、入力された、発話列の結束性を示すラベルが各々付加されている、複数の発話からなる発話列の各々について、前記発話列に含まれる形態素解析済みの発話毎に、少なくとも１つ以上の特徴量を抽出し、
前記木構造作成部は、前記発話列の各々について、前記発話列に含まれる各発話に対応する各発話ノードを含み、前記発話ノードの各々について、前記発話ノードに対応する前記発話について、前記特徴量抽出部において抽出した特徴量の各々を表すノードの各々を、前記発話ノードの子ノードとして追加した木構造を作成し、
前記モデル学習部は、前記発話列の各々についての、前記木構造作成部において作成された木構造と、前記発話列に付加されている前記ラベルと、に基づいて、前記木構造に対応する発話列の結束性を判定するためのモデルを学習する
モデル学習方法。
コンピュータを、請求項１〜４の何れか１項記載の結束性判定装置又は請求項５記載のモデル学習装置を構成する各部として機能させるためのプログラム。