JP2018036580A

JP2018036580A - 疑問発話判定装置、その方法、及びプログラム

Info

Publication number: JP2018036580A
Application number: JP2016171463A
Authority: JP
Inventors: 厚志安藤; Atsushi Ando; 太一浅見; Taichi Asami; 山口　義和; Yoshikazu Yamaguchi; 義和山口
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2016-09-02
Filing date: 2016-09-02
Publication date: 2018-03-08
Anticipated expiration: 2036-09-02
Also published as: JP6594273B2

Abstract

【課題】従来技術と比べ、学習データが少ない場合でも高精度に疑問発話判定を行うことができる疑問発話判定装置、その方法、及びプログラムを提供する。【解決手段】疑問発話判定装置は、韻律特徴とその韻律特徴に対応する発話が疑問発話かどうかの関係性を示す韻律特徴疑問発話モデルを用いて、対象となる発話の音声データから得られる韻律特徴から発話が疑問発話か否かを判定する韻律特徴疑問発話判定部と、言語特徴とその言語特徴に対応する発話が疑問発話かどうかの関係性を示す言語特徴疑問発話モデルを用いて、音声データから得られる言語特徴から発話が疑問発話か否かを判定する言語特徴疑問発話判定部と、韻律特徴疑問発話判定部の判定結果と、言語特徴疑問発話判定部の判定結果とを用いて、発話が疑問発話か否かを判定する判定結果統合部とを含む。【選択図】図４

Description

本発明は、発話が疑問発話か非疑問発話かを判定する疑問発話判定装置、その方法、及びプログラムに関する。

質問や聞き返しを目的とした発話（以降、疑問発話と呼ぶ）は、人間のコミュニケーションにおいて非常に重要な役割を持つ。このため、機械により疑問発話を判定する技術（疑問発話判定技術）が求められている。例えば、音声対話システムにおける応答生成、音声認識を用いた会議書き起こしシステムにおける質問項目の抽出などに疑問発話判定技術を応用することができる。

疑問発話判定には、韻律特徴と言語特徴とに基づく判定手法が用いられる（非特許文献１参照）。

疑問発話には韻律情報や言語情報に一定の特徴が表れる。例えば、日本語東京方言（標準語）であれば、韻律情報として語尾上がり、すなわち発話末尾で声の高さの上昇が現れる。また、言語情報として「何」「ですか」などの単語の生起が表れる。この特徴を利用して疑問発話か否かを判定する。例えば、対象となる発話の音声データから韻律特徴（発話末尾での声の高さの平均値など）と言語特徴（疑問詞の出現有無など）とを抽出し、各特徴の組合せのしきい値処理により対象となる発話が疑問発話か非疑問発話かを判定する。なお、言語特徴は対象となる発話に音声認識を適用することで取得する。

なお、従来技術において、しきい値は人手ではなく機械学習により決定する。すなわち、発話の音声データと正解データ（その発話が疑問発話か非疑問発話かを示すデータ）との組を収集したデータ集合（以降、学習データと呼ぶ）を用意し、各特徴の組合せと疑問発話かどうかの関係性を示すモデル（以降、疑問発話モデルと呼ぶ）を機械学習により学習することで各特徴の組合せのしきい値を自動で決定する。大量の学習データを用いることで、精度が最大となるしきい値の決定が可能となり、人手で決定したしきい値に比べて高精度な疑問発話判定が可能となる。

K. Boakye, B. Favre, D. Hakkini-Tur, "Any Questions? Automatic Question Detection in Meetings", in Proc. ASRU, 2009.

一般に、疑問発話は利用環境により性質が変化するとされている。例えば、会議では「〜ですか？」など丁寧な言葉遣いをするために言語特徴が疑問発話判定には重要である。一方、雑談では「〜は？」などぞんざいな言葉遣いであるために言語特徴では疑問発話判定が難しく、韻律特徴が重要となる。この性質から、利用環境が変わる場合、新しく疑問発話モデルを学習する必要があり、そのために大量の学習データを収集する必要がある。

ある利用環境において疑問発話判定を行う場合、同じ利用環境の学習データを大量に収集することが求められる。これは、言語特徴と韻律特徴の組合せは一般に非常に膨大であり、ある利用環境における疑問発話モデルを正しく学習するためには、言語特徴と韻律特徴との膨大な組合せを網羅するほどの学習データが必要となるためである。学習データが少ない場合、疑問発話判定の精度は低下する。

本発明は、従来技術と比べ、学習データが少ない場合でも高精度に疑問発話判定を行うことができる疑問発話判定装置、その方法、及びプログラムを提供することを目的とする。

上記の課題を解決するために、本発明の一態様によれば、疑問発話判定装置は、韻律特徴とその韻律特徴に対応する発話が疑問発話かどうかの関係性を示す韻律特徴疑問発話モデルを用いて、対象となる発話の音声データから得られる韻律特徴から発話が疑問発話か否かを判定する韻律特徴疑問発話判定部と、言語特徴とその言語特徴に対応する発話が疑問発話かどうかの関係性を示す言語特徴疑問発話モデルを用いて、音声データから得られる言語特徴から発話が疑問発話か否かを判定する言語特徴疑問発話判定部と、韻律特徴疑問発話判定部の判定結果と、言語特徴疑問発話判定部の判定結果とを用いて、発話が疑問発話か否かを判定する判定結果統合部とを含む。

上記の課題を解決するために、本発明の他の態様によれば、疑問発話判定方法は、韻律特徴疑問発話判定部が、韻律特徴とその韻律特徴に対応する発話が疑問発話かどうかの関係性を示す韻律特徴疑問発話モデルを用いて、対象となる発話の音声データから得られる韻律特徴から発話が疑問発話か否かを判定する韻律特徴疑問発話判定ステップと、言語特徴疑問発話判定部が、言語特徴とその言語特徴に対応する発話が疑問発話かどうかの関係性を示す言語特徴疑問発話モデルを用いて、音声データから得られる言語特徴から発話が疑問発話か否かを判定する言語特徴疑問発話判定ステップと、判定結果統合部が、韻律特徴疑問発話判定ステップの判定結果と、言語特徴疑問発話判定ステップの判定結果とを用いて、発話が疑問発話か否かを判定する判定結果統合ステップとを含む。

本発明によれば、学習データが少ない場合でも高精度に疑問発話判定を行うことができるという効果を奏する。

第一実施形態に係る疑問発話判定システムの機能ブロック図。第一実施形態に係る疑問発話モデル学習装置の機能ブロック図。第一実施形態に係る疑問発話モデル学習装置の処理フローの例を示す図。第一実施形態に係る疑問発話判定装置の機能ブロック図。第一実施形態に係る疑問発話判定装置の処理フローの例を示す図。

以下、本発明の実施形態について、説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。

＜第一実施形態のポイント＞
大量の学習データが必要である理由は、言語特徴と韻律特徴との「組合せ」が膨大であるためと考えられる。本実施形態では、言語特徴と韻律特徴との組合せを考慮せず、言語特徴と韻律特徴とから独立に疑問発話かどうかをそれぞれ判定したのち、それらの判定結果を統合することで疑問発話判定を行う。これにより、言語特徴と韻律特徴との組合せではなく、個々の特徴の数を網羅できる学習データだけで疑問発話判定ができるようになると考えられる。例えば、100種類の言語特徴と50種類の韻律特徴を用いる場合、従来技術では言語特徴と韻律特徴の組合せの100×50=5000種類を網羅するために数万の学習データが必要と考えられる。一方、本実施形態では言語特徴であれば100種、韻律特徴であれば50種を網羅できればよく、それぞれ数百の学習データがあれば充分な学習が可能である。

本実施形態では、韻律特徴と言語特徴との組合せを考慮する必要がなくなり、各特徴で独立に疑問発話判定を行うことが可能となる。

なお本実施形態では、「言語特徴から疑問発話を判定する」「韻律特徴から疑問発話を判定する」という二つの疑問発話モデルを学習するため、正解データも「言語特徴から判定された疑問発話／非疑問発話」「韻律特徴から判定された疑問発話／非疑問発話」の二種類を用意する。一方で、従来技術の正解データは「疑問発話／非疑問発話」の一種類である。以下、上述の手法を実現するための構成について説明する。

＜疑問発話判定システム１０＞
図１は、疑問発話判定システム１０の機能ブロック図を示す。疑問発話判定システム１０は、疑問発話モデル学習装置１００と、疑問発話判定装置２００とを含む。

疑問発話モデル学習装置１００は、学習データを入力とし、韻律特徴疑問発話モデルと言語特徴疑問発話モデルとを学習し、疑問発話判定装置２００に出力する。なお、韻律特徴疑問発話モデルは韻律特徴とその韻律特徴に対応する発話が疑問発話かどうかの関係性を示すモデルであり、言語律特徴疑問発話モデルは言語特徴とその言語特徴に対応する発話が疑問発話かどうかの関係性を示すモデルである。本実施形態の学習データは、学習用の音声データと韻律特徴の正解データ(「韻律特徴から判定された疑問発話／非疑問発話」)と言語特徴の正解データ（「言語特徴から判定された疑問発話／非疑問発話」）との組を含む。

疑問発話判定装置２００は、疑問発話判定に先立ち韻律特徴疑問発話モデルと言語特徴疑問発話モデルとを受け取る。疑問発話判定装置２００は、これらのモデルを用いて、疑問発話判定の対象となる発話の音声データから得られる韻律特徴と言語特徴とに基づき、対象となる発話が疑問発話か否かを判定し、判定結果を出力する。

以下、各装置の処理例を説明する。

［疑問発話モデル学習装置１００］
図２は第一実施形態に係る疑問発話モデル学習装置１００の機能ブロック図を、図３はその処理フローを示す。

疑問発話モデル学習装置１００は、韻律抽出部１０１と、韻律特徴抽出部１０３と、韻律特徴疑問発話モデル学習部１０５と、音声認識部１０２と、言語特徴抽出部１０４と言語特徴疑問発話モデル学習部１０６とを含む。

まず、学習用の音声データと、その学習用の音声データに対する言語特徴の正解データと韻律特徴の正解データとを用意する。なお、各正解データは人手により作成する。例えば、人が発話（学習用の音声データ）を聞き、言葉の情報から疑問発話であるかを判定したものを言語特徴の正解データ、声のイントネーションから疑問発話であるかを判定したものを韻律特徴の正解データとする。そのため、同じ発話（学習用の音声データ）に対して、韻律特徴の正解データは疑問発話となり、言語特徴の正解データは非疑問発話となることもある。

次に、疑問発話モデル学習装置１００は、学習用の音声データと各正解データのペアに基づいて、言語特徴と韻律特徴とから独立に疑問発話モデルを学習する。以下、疑問発話モデル学習装置１００の処理例を示す。

＜韻律抽出部１０１＞
・入力：学習用の音声データ
・出力：学習用の韻律系列
入力された学習用の音声データに対し、時刻順に並べた韻律系列を計算する（Ｓ１０１）。なお、韻律を抽出する方法としていかなる方法を用いてもよく、利用環境等に合わせて最適なものを適宜選択すればよい。例えば、韻律は、基本周波数、パワー、音素継続長の少なくとも一つを含む。また、例えば、韻律は一定間隔ごとに音声波形を区切ったフレームと呼ばれる単位で抽出するものとし、フレーム長は20ミリ秒、フレーム間隔は10ミリ秒とする。基本周波数は、例えば参考文献１の手法によりフレームごとの値を得ることができる。パワーは、例えばフレーム内の音声信号の振幅の二乗の総和により求めることができる。音素継続長は、例えばフレームから取得した音響特徴（MFCCなど）を用いて音素認識を行うことで取得できる。
（参考文献１）中谷智弘、入野俊夫、「占有度を用いた耐雑音性の高い基本周波数推定法”」、信学技報、vol. 101, no. 744, pp. 21-28, 2002.

＜韻律特徴抽出部１０３＞
・入力：学習用の韻律系列
・出力：学習用の韻律特徴
学習用の韻律系列からその統計量を取得し、学習用の韻律特徴とする（Ｓ１０３）。なお、韻律特徴を抽出する方法としていかなる方法を用いてもよく、利用環境等に合わせて最適なものを適宜選択すればよい。例えば、韻律特徴は韻律の種類ごとに異なり、全体または一部の区間の統計量を用いるものとする。例えば、基本周波数に対しては、発話全体の基本周波数の平均や分散、また発話の末尾から200ミリ秒までの基本周波数の平均や分散、勾配を用いるものとする。パワーに対しては、例えば発話全体のパワーの平均や分散や勾配、発話末尾から200ミリ秒までのパワーの最大値と最小値の差を用いるものとする。音素継続長は、例えば発話全体での音素継続長の平均や分散、発話末尾の音素の継続長を用いるものとする。

＜韻律特徴疑問発話モデル学習部１０５＞
・入力：学習用の韻律特徴、韻律特徴の正解データ
・出力：韻律特徴疑問発話モデル
学習用の韻律特徴及びその学習用の韻律特徴に対応する韻律特徴の正解データの集合を用いて、韻律特徴疑問発話モデルの学習を行う（Ｓ１０５）。なお、韻律特徴疑問発話モデルの学習方法としていかなる方法を用いてもよく、利用環境等に合わせて最適なものを適宜選択すればよい。ただし、学習には、２クラス分類（疑問発話／非疑問発話）が可能である機械学習アルゴリズムを用いるものとする。例えば、サポートベクターマシンを用いるが、他の機械学習アルゴリズムを用いてもよい。また、例えば、韻律特徴の正解データは、事前に発話を人間が聴取し、声のイントネーションから疑問発話であると感じた場合は疑問発話、感じなかった場合は非疑問発話とするものとする。

＜音声認識部１０２＞
・入力：学習用の音声データ
・出力：学習用の認識結果
発話（学習用の音声データ）に音声認識技術を適用することで、学習用の音声データに含まれる単語列を取得する（Ｓ１０２）。なお、音声認識方法としていかなる方法を用いてもよく、利用環境等に合わせて最適なものを適宜選択すればよい。例えば、認識結果は少なくとも一つ以上の単語を含み、また各単語には品詞情報を含んでいても良い。

＜言語特徴抽出部１０４＞
・入力：学習用の認識結果
・出力：学習用の言語特徴
学習用の認識結果から言語特徴を取得する（Ｓ１０４）。なお、言語特徴の抽出方法としていかなる方法を用いてもよく、利用環境等に合わせて最適なものを適宜選択すればよい。例えば、言語特徴は、認識結果に含まれる単語および品詞の情報から決定する。また、例えば、発話中の単語の総数や、Bag-of-wordsと呼ばれる発話中の単語ごとの出現数を用いるものとする。単語に品詞の情報を含む場合、言語特徴は、例えば、発話末尾の単語の品詞の種類や内容語の数を含む。

＜言語特徴疑問発話モデル学習部１０６＞
・入力：学習用の言語特徴、言語特徴の正解データ
・出力：言語特徴疑問発話モデル
学習用の言語特徴およびその学習用の言語特徴に対応する言語特徴の正解データの集合を用いて、言語特徴疑問発話モデルの学習を行う（Ｓ１０６）。なお、言語特徴疑問発話モデルの学習方法としていかなる方法を用いてもよく、利用環境等に合わせて最適なものを適宜選択すればよい。ただし、韻律特徴疑問発話モデル学習部１０５と同様に、学習には、２クラス分類（疑問発話／非疑問発話）が可能であるアルゴリズムを用いるものとする。例えば、言語特徴の正解データは、事前に発話を人間が聴取し、言葉の情報から疑問発話であると感じた場合は疑問発話、感じなかった場合は非疑問発話とするものとする。

以上の構成により、疑問発話モデル学習装置１００は、韻律特徴疑問発話モデル及び言語特徴疑問発話モデルを学習する。

［疑問発話判定装置２００］
図４は第一実施形態に係る疑問発話判定装置２００の機能ブロック図を、図４はその処理フローを示す。

疑問発話判定装置２００は、韻律抽出部２０１と、韻律特徴抽出部２０３と、音声認識部２０２と、言語特徴抽出部２０４と、韻律特徴疑問発話判定部２１１と、言語特徴疑問発話判定部２１２と、判定結果統合部２１３とを含む。

疑問発話判定装置２００は、まず、対象となる発話の音声データから言語特徴と韻律特徴とを抽出する。次に、各特徴をそれに応じた疑問発話モデルに入力し、言語特徴のみ、韻律特徴のみに基づく疑問発話判定結果を取得する。最後に、それぞれの疑問発話判定結果を統合し、最終的な疑問発話判定結果とする。以下、疑問発話判定装置２００の処理例を示す。

韻律抽出部２０１、韻律特徴抽出部２０３、音声認識部２０２及び言語特徴抽出部２０４における処理は、韻律抽出部１０１、韻律特徴抽出部１０３、音声認識部１０２及び言語特徴抽出部１０４における処理と同様であり、学習用の音声データ及びその音声データに基づき得られる情報に代えて、対象となる発話の音声データ及びその音声データに基づき得られる情報を用いる点が異なる。そのため、処理内容については説明を省略する。

＜韻律特徴疑問発話判定部２１１＞
・入力：対象となる発話の韻律特徴、韻律特徴疑問発話モデル
・出力：韻律特徴による疑問発話判定結果
韻律特徴疑問発話モデルと用いて、対象となる発話の韻律特徴からその発話が疑問発話か否かを判定し（Ｓ２１１）、判定結果を出力する。例えば、判定結果は少なくとも疑問発話／非疑問発話の2つのうちどちらであったかの判定結果を含む。また、判定結果の疑問発話度合いを含んでいてもよい。例えば、韻律特徴疑問発話モデル学習部１０５においてサポートベクターマシンを用いる場合、識別平面からの距離を疑問発話度合いとして出力してもよい。

＜言語特徴疑問発話判定部２１２＞
・入力：対象となる発話の言語特徴、言語特徴疑問発話モデル
・出力：言語特徴による疑問発話判定結果
言語特徴疑問発話モデルを用いて、対象となる発話の言語特徴からその発話が疑問発話か否かを判定し（Ｓ２１２）、判定結果を出力する。例えば、判定結果は少なくとも疑問発話／非疑問発話の2つのうちどちらであったかの判定結果を含む。また、判定結果の疑問発話度合いを含んでいてもよい。例えば、言語特徴疑問発話モデル学習部１０６においてサポートベクターマシンを用いる場合、識別平面からの距離を疑問発話度合いとして出力してもよい。

＜判定結果統合部２１３＞
・入力：韻律特徴疑問発話判定部の判定結果、言語特徴疑問発話判定部の判定結果
・出力：判定結果
韻律特徴疑問発話判定部の判定結果と、言語特徴疑問発話判定部の判定結果とを用いて、対象となる発話が疑問発話か否かを判定し（Ｓ２１３）、出力する。以下、3つの判定方法を例示する。
(1)判定結果統合部２１３は、韻律特徴疑問発話判定部２１１の判定結果と言語特徴疑問発話判定部２１２の判定結果との少なくとも一方が発話が疑問発話であることを示す場合に、発話が疑問発話であると判定し、そうでない場合(判定結果統合部は、韻律特徴疑問発話判定部の判定結果と言語特徴疑問発話判定部の判定結果とが何れもが発話が非疑問発話であることを示す場合)に非疑問発話であると判定する。これは、「人間は韻律特徴と言語特徴のどちらかから疑問発話であると感じた場合、その発話が疑問発話であると判定する」という仮定に基づいている。つまり、どのような言葉を話した場合でも、語尾が上がっていれば聞き返しであるように感じ、またどのようなイントネーションで話しても、「何が〜」で始まっていれば質問であるように感じるといった仮定を置いている。
(2)判定結果統合部２１３は、韻律特徴疑問発話判定部２１１の判定結果と言語特徴疑問発話判定部２１２の判定結果とが何れもが発話が疑問発話であることを示す場合に、発話が疑問発話であると判定し、そうでない場合(判定結果統合部は、韻律特徴疑問発話判定部の判定結果と言語特徴疑問発話判定部の判定結果との少なくとも一方が発話が非疑問発話であることを示す場合)に非疑問発話であると判定する。このような判定方法とすることで、上述の(1)に比べ、誤って非疑問発話を疑問発話と判定する可能性を低減することができる。一方、疑問発話を検知できず、取りこぼす可能性が増加する。
(3)韻律特徴疑問発話判定部２１１の判定結果には韻律特徴から発話が疑問発話であると判定される度合いである韻律特徴疑問発話度合いが含まれ、言語特徴疑問発話判定部２１２の判定結果には言語特徴から発話が疑問発話であると判定される度合いである言語特徴疑問発話度合いが含まれる場合に、この判定方法を利用することができる。

韻律特徴による疑問発話の度合いと言語特徴による疑問発話の度合いとの重み付け和と、所定の閾値との大小関係により、発話が疑問発話であるか否かを判定する。例えば、疑問発話の度合いが大きければ大きいほど、疑問発話である可能性が高い場合には、重み付け和が所定の閾値よりも大きいときに疑問発話であると判定する。なお、重みは利用環境に合わせて柔軟に設定すればよい。例えば、利用者に「標準」、「会議室」、「雑談」等の利用環境を選択させ、「標準」を選択した場合には（言語特徴の重み）=（韻律特徴の重み）とし、「会議室」を選択した場合には（言語特徴の重み）>（韻律特徴の重み）とし、「雑談」を選択した場合には（言語特徴の重み）<（韻律特徴の重み）とする。

＜効果＞
以上の構成により、学習データが少ない場合でも高精度に疑問発話判定を行うことができ、疑問発話判定を導入する際の学習データ収集のコストを削減することができる。

＜変形例＞
疑問発話モデル学習装置１００と疑問発話判定装置２００とは同一の装置内に実装してもよく、韻律抽出部１０１と韻律抽出部２０１とを同一の構成としてもよい。韻律特徴抽出部１０３，２０３、音声認識部１０２，２０２、言語特徴抽出部１０４，２０４についても同様である。

疑問発話判定装置２００は、少なくとも韻律特徴疑問発話判定部２１１と言語特徴疑問発話判定部２１２と判定結果統合部２１３とを含めばよい。その場合には、既存の技術を用いて、他の装置において対象となる発話の韻律特徴と言語特徴とを抽出する。そして、疑問発話判定装置２００は、対象となる発話の韻律特徴及び言語特徴と、韻律特徴疑問発話モデル及び言語特徴疑問発話モデルとを受け取り、第一実施形態のＳ２１１，Ｓ２１２，Ｓ２１３と同様の処理を行う。

＜その他の変形例＞
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。

＜プログラム及び記録媒体＞
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。

また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ−ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims

韻律特徴とその韻律特徴に対応する発話が疑問発話かどうかの関係性を示す韻律特徴疑問発話モデルを用いて、対象となる発話の音声データから得られる韻律特徴から前記発話が疑問発話か否かを判定する韻律特徴疑問発話判定部と、
言語特徴とその言語特徴に対応する発話が疑問発話かどうかの関係性を示す言語特徴疑問発話モデルを用いて、前記音声データから得られる言語特徴から前記発話が疑問発話か否かを判定する言語特徴疑問発話判定部と、
前記韻律特徴疑問発話判定部の判定結果と、前記言語特徴疑問発話判定部の判定結果とを用いて、前記発話が疑問発話か否かを判定する判定結果統合部とを含む、
疑問発話判定装置。
請求項１の疑問発話判定装置であって、
前記判定結果統合部は、前記韻律特徴疑問発話判定部の判定結果と前記言語特徴疑問発話判定部の判定結果との少なくとも一方が前記発話が疑問発話であることを示す場合に、前記発話が疑問発話であると判定する、
疑問発話判定装置。
請求項１の疑問発話判定装置であって、
前記韻律特徴疑問発話判定部の判定結果には前記発話が疑問発話であると判定される度合いである韻律特徴疑問発話度合いが含まれ、前記言語特徴疑問発話判定部の判定結果には前記発話が疑問発話であると判定される度合いである言語特徴疑問発話度合いが含まれ、
前記判定結果統合部は、前記韻律特徴疑問発話度合いと前記言語特徴疑問発話度合いとの重み付け和と、所定の閾値との大小関係により、前記発話が疑問発話であるか否かを判定する、
疑問発話判定装置。
韻律特徴疑問発話判定部が、韻律特徴とその韻律特徴に対応する発話が疑問発話かどうかの関係性を示す韻律特徴疑問発話モデルを用いて、対象となる発話の音声データから得られる韻律特徴から前記発話が疑問発話か否かを判定する韻律特徴疑問発話判定ステップと、
言語特徴疑問発話判定部が、言語特徴とその言語特徴に対応する発話が疑問発話かどうかの関係性を示す言語特徴疑問発話モデルを用いて、前記音声データから得られる言語特徴から前記発話が疑問発話か否かを判定する言語特徴疑問発話判定ステップと、
判定結果統合部が、前記韻律特徴疑問発話判定ステップの判定結果と、前記言語特徴疑問発話判定ステップの判定結果とを用いて、前記発話が疑問発話か否かを判定する判定結果統合ステップとを含む、
疑問発話判定方法。
請求項１から請求項３の何れかの疑問発話判定装置としてコンピュータを機能させるためのプログラム。