WO2011083528A1

WO2011083528A1 - データ処理装置、そのコンピュータプログラムおよびデータ処理方法

Info

Publication number: WO2011083528A1
Application number: PCT/JP2010/007021
Authority: WO
Inventors: 岡部　浩司; 健花沢; 長田　誠也; 隆行荒川; 田中　大介
Original assignee: 日本電気株式会社
Priority date: 2010-01-06
Filing date: 2010-12-02
Publication date: 2011-07-14
Also published as: JPWO2011083528A1; US20120310866A1; JP5786717B2; US9047562B2

Abstract

　入力されるテストデータ(ＴＤ)の特徴量(ＣＶ)から複数の枝刈尺度(ＰＭ)を計算し、閾値空間(ＳＳ)にプロットして複数の等密度面(ＥＣ)を設定し、一つの等密度面(ＥＣ)の一部を一部として複数の枝刈尺度(ＰＭ)の少なくとも一つが低下すると少なくとも一つが上昇する閾値曲面(ＳＣ)を生成し、対象データ(ＣＤ)の仮説曲面(ＨＣ)を閾値空間(ＳＳ)に生成して閾値曲面(ＳＣ)と交差する位置を枝刈閾値(ＰＳ)とし、対象データ(ＣＤ)の複数の仮説を枝刈する。これにより、従来と比較して認識速度と認識精度との少なくとも一方が高いデータ処理装置を提供する。

Description

データ処理装置、そのコンピュータプログラムおよびデータ処理方法

　本発明は、入力される対象データから仮説を探索するデータ処理装置に関し、特に、探索の途中において枝刈閾値を超える仮説を枝刈りするデータ処理装置、そのコンピュータプログラムおよびデータ処理方法、に関する。

　仮説探索問題に関して、探索の途中において枝刈閾値を超える枝刈尺度を持つ仮説を枝刈りし、計算量を削減するビームサーチが探索の効率化のためにしばしば行われる。ビームサーチの枝刈尺度として、最尤仮説とのスコア差および仮説数の二つの尺度が広く一般に用いられている。

　スコア差閾値は、その閾値よりも最尤仮説とスコア差が開いた仮説を枝刈りするために用いられ、仮説数閾値は仮説順位が閾値よりも大きい仮説を枝刈りするために用いられる。

　これらの閾値はそれぞれ静的に固定した値としてもよいし、何らかの基準を用いて音声フレームごとに動的に変化させてもよい。例えば、各音声フレームでの音響的な信頼度を算出し、それに応じてスコア差閾値の調整を動的に行う技術が提案されている。

　図７に示すように、この従来のデータ処理装置は、データ入力手段１０１と、特徴量抽出手段１０２と、仮説スコア計算手段１０３と、統計モデル１０４と、動的閾値設定手段１０５と、仮説枝刈手段１０６と、結果出力手段１０７とを備える。

　このような構成を有する従来のデータ処理装置は、次のように動作する。すなわち、データ入力手段１０１は探索が行われるデータの入力を行い、特徴量抽出手段１０２は対象データから特徴量を抽出し、仮説スコア計算手段１０３は統計モデル１０４を用いて特徴量のスコアを計算し、動的閾値設定手段１０５は枝刈に用いられるそれぞれの尺度での閾値を設定し、仮説枝刈手段１０６が枝刈閾値を基準として仮説の枝刈を行い、結果出力手段１０７が最終的に最もスコアの高い仮説を結果として出力する(非特許文献１)。

"A Confidence-Guided Dynamic Pruning Approach - Utilization of Confidence Measurement in Speech Recognition -"　Tibor Fabian et al. INTERSPEECH 2005, ISCA

　しかし、例えば仮説数閾値を用いて探索を行う従来のデータ処理装置において、枝刈前の仮説数が仮説数閾値を超えてしまう場合に着目すると、図８に示すように、最尤仮説からのスコア差が大きい仮説で仮説数閾値に達した場合（Ａ）も、最尤仮説からのスコア差が小さい仮説で仮説数閾値に達した場合（Ｂ）も、同じ数（ｎ）の仮説を残すことになる。

　しかし、前者ではａ、後者ではｂのスコア差閾値を用いて枝刈りしているのと同等であり、小さいスコア差閾値であるｂで枝刈りを行った場合、正解仮説を誤って枝刈りし、探索誤りを引き起こす可能性が高くなってしまう。

　複数の枝刈尺度を用いる場合、上述のように一つの枝刈閾値を超えた場合には、他の枝刈尺度について全く閾値に達しない値だろうと、閾値に近い値であろうと、閾値を超えた尺度のみで枝刈を行ってしまい、探索誤りを引き起こしやすいという課題がある。

　本発明は上述のような課題に鑑みてなされたものであり、従来と比較して認識速度と認識精度との少なくとも一方が高いデータ処理装置、そのコンピュータプログラムおよびデータ処理方法、を提供するものである。

　本発明のデータ処理装置は、学習モードでは正解仮説が確定しているテストデータを所定の入力単位ごとに入力して探索モードでは仮説探索の対象データを入力単位ごとに入力するデータ入力手段と、入力されたテストデータおよび対象データを分析して特徴量を各々抽出する特徴量抽出手段と、抽出された特徴量を用いてテストデータおよび対象データの複数の仮説ごとに複数の枝刈尺度を計算する仮説尺度計算手段と、入力されたテストデータの複数の仮説を各々計算された枝刈尺度に対応して複数の枝刈尺度で規定されている閾値空間にプロットするデータプロット手段と、プロットされた複数の仮説の密度に対応して複数の等密度面を閾値空間に設定する等密度面設定手段と、複数の等密度面から選定された一つの一部を一部として複数の枝刈尺度の少なくとも一つが低下すると少なくとも一つが上昇する複数の枝刈閾値からなる閾値曲面を閾値空間に生成する閾値曲面生成手段と、対象データの複数の仮説からなる仮説曲面を各々計算された枝刈尺度に対応して閾値空間に生成する仮説曲面生成手段と、生成された仮説曲面が閾値曲面と交差する位置を枝刈閾値として対象データの複数の仮説を枝刈する仮説枝刈手段と、を有する。

　本発明のコンピュータプログラムは、本発明のデータ処理装置のコンピュータプログラムであって、学習モードでは正解仮説が確定しているテストデータを所定の入力単位ごとに入力して探索モードでは仮説探索の対象データを入力単位ごとに入力するデータ入力処理と、入力されたテストデータおよび対象データを分析して特徴量を各々抽出する特徴量抽出処理と、抽出された特徴量を用いてテストデータおよび対象データの複数の仮説ごとに複数の枝刈尺度を計算する仮説尺度計算処理と、入力されたテストデータの複数の仮説を各々計算された枝刈尺度に対応して複数の枝刈尺度で規定されている閾値空間にプロットするデータプロット処理と、プロットされた複数の仮説の密度に対応して複数の等密度面を閾値空間に設定する等密度面設定処理と、複数の等密度面から選定された一つの一部を一部として複数の枝刈尺度の少なくとも一つが低下すると少なくとも一つが上昇する複数の枝刈閾値からなる閾値曲面を閾値空間に生成する閾値曲面生成処理と、対象データの複数の仮説からなる仮説曲面を各々計算された枝刈尺度に対応して閾値空間に生成する仮説曲面生成処理と、生成された仮説曲面が閾値曲面と交差する位置を枝刈閾値として対象データの複数の仮説を枝刈する仮説枝刈処理と、をデータ処理装置に実行させる。

　本発明のデータ処理方法は、本発明のデータ処理装置のデータ処理方法であって、学習モードでは正解仮説が確定しているテストデータを所定の入力単位ごとに入力して探索モードでは仮説探索の対象データを入力単位ごとに入力するデータ入力動作と、入力されたテストデータおよび対象データを分析して特徴量を各々抽出する特徴量抽出動作と、抽出された特徴量を用いてテストデータおよび対象データの複数の仮説ごとに複数の枝刈尺度を計算する仮説尺度計算動作と、入力されたテストデータの複数の仮説を各々計算された枝刈尺度に対応して複数の枝刈尺度で規定されている閾値空間にプロットするデータプロット動作と、プロットされた複数の仮説の密度に対応して複数の等密度面を閾値空間に設定する等密度面設定動作と、複数の等密度面から選定された一つの一部を一部として複数の枝刈尺度の少なくとも一つが低下すると少なくとも一つが上昇する複数の枝刈閾値からなる閾値曲面を閾値空間に生成する閾値曲面生成動作と、対象データの複数の仮説からなる仮説曲面を各々計算された枝刈尺度に対応して閾値空間に生成する仮説曲面生成動作と、生成された仮説曲面が閾値曲面と交差する位置を枝刈閾値として対象データの複数の仮説を枝刈する仮説枝刈動作と、を有する。

　なお、本発明の各種の構成要素は、その機能を実現するように形成されていればよく、例えば、所定の機能を発揮する専用のハードウェア、所定の機能がコンピュータプログラムにより付与されたデータ処理装置、コンピュータプログラムによりデータ処理装置に実現された所定の機能、これらの任意の組み合わせ、等として実現することができる。

　また、本発明の各種の構成要素は、必ずしも個々に独立した存在である必要はなく、複数の構成要素が一個の部材として形成されていること、一つの構成要素が複数の部材で形成されていること、ある構成要素が他の構成要素の一部であること、ある構成要素の一部と他の構成要素の一部とが重複していること、等でもよい。

　また、本発明のコンピュータプログラムおよびデータ処理方法は、複数の処理および動作を順番に記載してあるが、その記載の順番は複数の処理および複数の動作を実行する順番を限定するものではない。

　このため、本発明のコンピュータプログラムおよびデータ処理方法を実施するときには、その複数の処理および複数の動作の順番は内容的に支障しない範囲で変更することができる。

　さらに、本発明のコンピュータプログラムおよびデータ処理方法は、複数の処理および複数の動作が個々に相違するタイミングで実行されることに限定されない。このため、ある処理および動作の実行中に他の処理および動作が発生すること、ある処理および動作の実行タイミングと他の処理および動作の実行タイミングとの一部ないし全部が重複していること、等でもよい。

　また、本発明で云うデータ処理装置は、コンピュータプログラムを読み取って対応する処理動作を実行できるように、ＣＰＵ（Central Processing Unit）、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）、Ｉ／Ｆ（Interface）ユニット、等の汎用デバイスで構築されたハードウェア、所定の処理動作を実行するように構築された専用の論理回路、これらの組み合わせ、等として実施することができる。

　なお、本発明でコンピュータプログラムに対応した各種動作をデータ処理装置に実行させることは、各種デバイスをデータ処理装置に動作制御させることなども意味している。

　例えば、データ処理装置に各種データを記憶させることは、データ処理装置に固定されているＨＤＤ（Hard Disc Drive）等の情報記憶媒体にＣＰＵが各種データを格納すること、データ処理装置に交換自在に装填されているＣＤ－Ｒ（Compact Disc-Recordable）等の情報記憶媒体にＣＰＵがＣＤドライブで各種データを格納すること、等を許容する。

　本発明のデータ処理装置では、データ入力手段が学習モードでは正解仮説が確定しているテストデータを所定の入力単位ごとに入力して探索モードでは仮説探索の対象データを入力単位ごとに入力する。入力されたテストデータおよび対象データを分析して特徴量を特徴量抽出手段が各々抽出する。抽出された特徴量を用いてテストデータおよび対象データの複数の仮説ごとに複数の枝刈尺度を仮説尺度計算手段が計算する。入力されたテストデータの複数の仮説を各々計算された枝刈尺度に対応して複数の枝刈尺度で規定されている閾値空間にデータプロット手段がプロットする。プロットされた複数の仮説の密度に対応して複数の等密度面を閾値空間に等密度面設定手段が設定する。複数の等密度面から選定された一つの一部を一部として複数の枝刈尺度の少なくとも一つが低下すると少なくとも一つが上昇する複数の枝刈閾値からなる閾値曲面を閾値空間に閾値曲面生成手段が生成する。対象データの複数の仮説からなる仮説曲面を各々計算された枝刈尺度に対応して閾値空間に仮説曲面生成手段が生成する。生成された仮説曲面が閾値曲面と交差する位置を枝刈閾値として対象データの複数の仮説を仮説枝刈手段が枝刈する。このため、探索モードで対象データから一つの仮説を探索するとき、枝刈閾値の複数の枝刈尺度が適正に変化する。従って、従来と比較して認識速度と認識精度との少なくとも一方が高いデータ処理装置を提供することができる。

　上述した目的、および、その他の目的、特徴および利点は、以下に述べる好適な実施の形態、および、それに付随する以下の図面によって、さらに明らかになる。

本発明の実施の形態のデータ処理システムの論理構造を示す模式的なブロック図である。データ処理装置による学習モードのデータ処理方法を示すフローチャートである。データ処理装置による探索モードのデータ処理方法を示すフローチャートである。閾値空間である閾値平面にテストデータの仮説がプロットされて等密度面である等密度線が生成された状態を示す模式的な特性図である。閾値平面に一つの等密度線に対応して閾値曲面である閾値曲線が生成された状態を示す模式的な特性図である。閾値平面に入力単位である音声フレームごとに仮説曲面である仮説曲線が生成された状態を示す模式的な特性図である。一従来例のデータ処理システムの論理構造を示す模式的なブロック図である。一従来例の閾値平面を示す模式的な特性図である。

　本発明の実施の一形態を図１ないし図６を参照して以下に説明する。本実施の形態のデータ処理装置２００は、図１に示すように、学習モードでは正解仮説が確定しているテストデータＴＤを所定の入力単位ごとに入力して探索モードでは仮説探索の対象データＣＤを入力単位ごとに入力するデータ入力部２０１と、入力されたテストデータＴＤおよび対象データＣＤを分析して特徴量ＣＶを各々抽出する特徴量抽出部２０２と、抽出された特徴量ＣＶを用いてテストデータＴＤおよび対象データＣＤの複数の仮説ごとに複数の枝刈尺度ＰＭを計算する仮説尺度計算部２０３と、入力されたテストデータＴＤの複数の仮説を各々計算された枝刈尺度ＰＭに対応して複数の枝刈尺度ＰＭで規定されている閾値空間ＳＳにプロットするデータプロット部２０４と、プロットされた複数の仮説の密度に対応して複数の等密度面ＥＣを閾値空間ＳＳに設定する等密度面設定部２０５と、複数の等密度面ＥＣから選定された一つの一部を一部として複数の枝刈尺度ＰＭの少なくとも一つが低下すると少なくとも一つが上昇する複数の枝刈閾値ＰＳからなる閾値曲面ＳＣを閾値空間ＳＳに生成する閾値曲面生成部２０６と、対象データＣＤの複数の仮説からなる仮説曲面ＨＣを各々計算された枝刈尺度ＰＭに対応して閾値空間ＳＳに生成する仮説曲面生成部２０７と、生成された仮説曲面ＨＣが閾値曲面ＳＣと交差する位置を枝刈閾値ＰＳとして対象データＣＤの複数の仮説を枝刈する仮説枝刈部２０８と、を有する。

　さらに、本実施の形態のデータ処理装置２００は、対象データのスコアを算出するための統計モデル２１０と、探索モードで枝刈された複数の仮説から累積されたスコアが最大の一つを探索結果ＳＲとして出力する結果出力部２０９と、も有する。

　より詳細には、閾値空間ＳＳが二つの枝刈尺度ＰＭである仮説の最尤仮説からのスコア差ＳＤと仮説順位ＨＲとで規定されている二次元の閾値平面ＳＳからなる。仮説尺度計算部２０３は、抽出された特徴量ＣＶを用いてテストデータＴＤおよび対象データＣＤの複数の仮説ごとにスコアを算出してスコア差ＳＤと仮説順位ＨＲとを枝刈尺度ＰＭとして計算する。

　等密度面設定部２０５は、プロットされた複数の仮説の密度に対応して複数の等密度面ＥＣである等密度線ＥＣを閾値平面ＳＳに設定する。閾値曲面生成部２０６は、複数の等密度線ＥＣから選定された一つの一部を一部としてスコア差ＳＤと仮説順位ＨＲとの一方が低下すると他方が上昇する複数の枝刈閾値ＰＳからなる閾値曲線ＳＣを閾値曲面ＳＣとして閾値平面ＳＳに生成する。

　仮説曲面生成部２０７は、対象データＣＤの複数の仮説からなる仮説曲線を仮説曲面ＨＣとして各々計算されたスコア差ＳＤと仮説順位ＨＲとに対応して閾値平面ＳＳに生成する。

　本実施の形態のデータ処理装置２００は、例えば、コンピュータプログラムが実装されたコンピュータ装置として実現される。そのコンピュータプログラムは、例えば、学習モードでは正解仮説が確定しているテストデータＴＤを所定の入力単位ごとに入力して探索モードでは仮説探索の対象データＣＤを入力単位ごとに入力するデータ入力処理と、入力されたテストデータＴＤおよび対象データＣＤを分析して特徴量ＣＶを各々抽出する特徴量抽出処理と、抽出された特徴量ＣＶを用いてテストデータＴＤおよび対象データＣＤの複数の仮説ごとに複数の枝刈尺度ＰＭを計算する仮説尺度計算処理と、入力されたテストデータＴＤの複数の仮説を各々計算された枝刈尺度ＰＭに対応して複数の枝刈尺度ＰＭで規定されている閾値平面ＳＳにプロットするデータプロット処理と、プロットされた複数の仮説の密度に対応して複数の等密度線ＥＣを閾値平面ＳＳに設定する等密度面設定処理と、複数の等密度線ＥＣから選定された一つの一部を一部として複数の枝刈尺度ＰＭの少なくとも一つが低下すると少なくとも一つが上昇する複数の枝刈閾値ＰＳからなる閾値曲線ＳＣを閾値平面ＳＳに生成する閾値曲面生成処理と、対象データＣＤの複数の仮説からなる仮説曲面ＨＣを各々計算された枝刈尺度ＰＭに対応して閾値平面ＳＳに生成する仮説曲面生成処理と、生成された仮説曲面ＨＣが閾値曲線ＳＣと交差する位置を枝刈閾値ＰＳとして対象データＣＤの複数の仮説を枝刈する仮説枝刈処理と、探索モードで枝刈された複数の仮説から累積されたスコアが最大の一つを探索結果ＳＲとして出力する結果出力処理と、をデータ処理装置２００に実行させるように記述されている。

　上述のような構成において、本実施の形態のデータ処理装置によるデータ処理方法を以下に説明する。まず、本実施の形態のデータ処理装置２００は、図２および図３に示すように、例えば、学習モードと探索モードとが切換自在な動作モードとして設定されている。

　図２に示すように、学習モードでは、入力されるテストデータＴＤから閾値曲線ＳＣである閾値曲線ＳＣが生成されてデータ処理装置２００に設定され、探索モードでは、設定されている閾値曲線ＳＣを利用して、入力される対象データＣＤから一つの仮説が探索結果として出力される。

　なお、以下ではデータ処理装置２００がテストデータＴＤおよび対象データＣＤを音声データとして、仮説探索を音声認識として実行する場合を例示する。まず、図２に示すように、学習モードでは(ステップＳ１－Ｙ)、正解仮説が確定しているテストデータＴＤが所定の入力単位である音声フレームごとに入力される(ステップＳ２)。このとき、十分な量のテストデータＴＤを十分に広げたビーム幅のもとで入力する。

　入力されたテストデータＴＤを分析して特徴量ＣＶを抽出する(ステップＳ３)。この抽出は、例えば、音声フレームごとに入力されるテストデータＴＤの入力音声のスペクトルからＭＦＣＣ(Mel Frequency Cepstrum Coefficient)を検出することで実行される。

　つぎに、抽出された特徴量ＣＶを用いてテストデータＴＤの複数の仮説ごとに複数の枝刈尺度ＰＭを計算する(ステップＳ４)。より詳細には、抽出されたテストデータＴＤの特徴量ＣＶと統計モデル２１０とから尤度であるスコアを求め、累積スコアに加算することで、各仮説のスコアを計算する。

　このようなスコアの算出は、例えば、音声認識では音響スコアと言語スコアとの加算などで実行される。そして、本実施の形態では、音声認識の枝刈尺度ＰＭとして、前述のように仮説の最尤仮説からのスコア差ＳＤと仮説順位ＨＲとが算出される。

　つぎに、入力されたテストデータＴＤの複数の仮説を、上述のように各々計算された最尤仮説からのスコア差ＳＤと仮説順位ＨＲとに対応して、図４に示すように、これらの枝刈尺度ＰＭで規定されている二次元の閾値空間ＳＳである閾値平面ＳＳにプロットする(ステップＳ５)。

　つぎに、上述のようにプロットされた複数の仮説の密度に対応して、図示するように、等密度面ＥＣの特殊解である複数の等密度線ＥＣを閾値平面ＳＳに設定する(ステップＳ６)。

　ここでデータ処理装置２００の性能や仕様や要求される認識精度などに対応して、図５に示すように、複数の等密度線ＥＣから一つが選定される。そして、この選定された一つの等密度線ＥＣの一部を一部として、二つの枝刈尺度ＰＭの一方が低下すると他方が上昇する複数の枝刈閾値ＰＳからなる閾値曲面ＳＣの特殊解である閾値曲線ＳＣが閾値平面ＳＳに生成される(ステップＳ７)。

　この閾値曲線ＳＣの生成は、上述のように等密度線ＥＣの一部を一部として二つの枝刈尺度ＰＭの一方が低下すると他方が上昇するように、例えば、放物線などの特定の曲線を等密度線ＥＣの一部に接続することなどで実行される。

　このように生成された閾値曲線ＳＣが仮説枝刈部２０８に設定されることで(ステップＳ８)、データ処理装置２００の学習モードが完了する。このように学習が完了したデータ処理装置２００は、準備された閾値曲線ＳＣを利用して音声認識を実行することができる。

　その場合、図３に示すように、データ処理装置２００が探索モードとされ(ステップＴ１－Ｙ)、仮説探索の対象データＣＤである対象音声を入力単位である音声フレームごとに入力する(ステップＴ２)。

　つぎに、学習モードの場合と同様に、入力されたテストデータＴＤを分析して特徴量ＣＶを各々抽出する(ステップＴ３)。つぎに、抽出された特徴量ＣＶを用いて対象データＣＤの複数の仮説ごとに複数の枝刈尺度ＰＭとして、最尤仮説からのスコア差ＳＤと仮説順位ＨＲとを計算する(ステップＴ４)。

　つぎに、対象データＣＤの複数の仮説からなる仮説曲面ＨＣの特殊解である仮説曲線ＨＣを、図６に示すように、各々計算された枝刈尺度ＰＭに対応して閾値平面ＳＳに生成する(ステップＴ６)。

　すると、図示するように、音声フレームごとの対象データＣＤの仮説曲線ＨＣは、閾値曲線ＳＣと交差することになる。そこで、このように仮説曲面ＨＣが閾値曲線ＳＣと交差する位置を枝刈閾値ＰＳとして、対象データＣＤの複数の仮説を枝刈する(ステップＴ７)。

　そして、音声フレームごとに対象データＣＤの最終の音声フレームかどうかを判断し(ステップＴ８)、最終音声フレームでなければ(ステップＴ８－Ｎ)、対象データから次の音声フレームを受け取る(ステップＴ２)。

　最終音声フレームであれば(ステップＴ８－Ｙ)、上述のように枝刈された複数の仮説の累積スコアが比較され(ステップＴ９)、累積スコアが最大の仮説を探索結果ＳＲとして出力する(ステップＴ１０)。最大スコアの仮説を結果として出力する。

　本実施の形態のデータ処理装置２００では、上述のようにデータ入力部２０１が学習モードでは正解仮説が確定しているテストデータＴＤを所定の入力単位ごとに入力して探索モードでは仮説探索の対象データＣＤを入力単位ごとに入力する。

　入力されたテストデータＴＤおよび対象データＣＤを分析して特徴量ＣＶを特徴量抽出部２０２が各々抽出する。抽出された特徴量ＣＶを用いてテストデータＴＤおよび対象データＣＤの複数の仮説ごとに複数の枝刈尺度ＰＭを仮説尺度計算部２０３が計算する。

　入力されたテストデータＴＤの複数の仮説を各々計算された枝刈尺度ＰＭに対応して複数の枝刈尺度ＰＭで規定されている閾値平面ＳＳにデータプロット部２０４がプロットする。

　プロットされた複数の仮説の密度に対応して複数の等密度線ＥＣを閾値平面ＳＳに等密度面設定部２０５が設定する。複数の等密度線ＥＣから選定された一つの一部を一部として複数の枝刈尺度ＰＭの少なくとも一つが低下すると少なくとも一つが上昇する複数の枝刈閾値ＰＳからなる閾値曲線ＳＣを閾値平面ＳＳに閾値曲面生成部２０６が生成する。

　対象データＣＤの複数の仮説からなる仮説曲線ＨＣを各々計算された枝刈尺度ＰＭに対応して閾値平面ＳＳに仮説曲面生成部２０７が生成する。生成された仮説曲線ＨＣが閾値曲線ＳＣと交差する位置を枝刈閾値ＰＳとして対象データＣＤの複数の仮説を仮説枝刈部２０８が枝刈する。

　このため、探索モードで対象データＣＤから一つの仮説を探索するとき、枝刈閾値ＰＳの複数の枝刈尺度ＰＭが適正に変化する。従って、従来と比較して認識速度と認識精度との少なくとも一方が高いデータ処理装置２００を提供することができる。

　なお、本発明は本実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で各種の変形を許容する。例えば、上記形態では二つの枝刈尺度ＰＭで規定されている二次元の閾値平面ＳＳに、閾値曲線ＳＣと仮説曲線ＨＣとを生成して仮説枝刈を実行することを例示した。

　しかし、三つ以上の枝刈尺度ＰＭで規定されている三次元以上の閾値空間ＳＳに、閾値曲面ＳＣと仮説曲面ＨＣとを生成して仮説枝刈を実行してもよい。閾値空間ＳＳが四次元以上の場合、閾値曲面ＳＣと仮説曲面ＨＣとは数学的な超曲面として表現される(図示せず)。

　また、上記形態ではテストデータＴＤおよび対象データＣＤが入力音声でデータ処理装置２００が音声認識を実行することを例示した。しかし、本実施の形態のデータ処理装置２００は、画像認識などにも同様に利用することができる。

　さらに、本実施の形態ではデータ処理装置の各部がコンピュータプログラムにより各種機能として論理的に実現されることを例示した。しかし、このような各部の各々を固有のハードウェアとして形成することもでき、ソフトウェアとハードウェアとの組み合わせとして実現することもできる。

　なお、当然ながら、上述した実施の形態および複数の変形例は、その内容が相反しない範囲で組み合わせることができる。また、上述した実施の形態および変形例では、各部の構造などを具体的に説明したが、その構造などは本願発明を満足する範囲で各種に変更することができる。

　この出願は、２０１０年０１月０６日に出願された日本出願特願２０１０－０００９４０号を基礎とする優先権を主張し、その開示の全てを、ここに取り込む。

Claims

　学習モードでは正解仮説が確定しているテストデータを所定の入力単位ごとに入力して探索モードでは仮説探索の対象データを前記入力単位ごとに入力するデータ入力手段と、
　入力された前記テストデータおよび前記対象データを分析して特徴量を各々抽出する特徴量抽出手段と、
　抽出された前記特徴量を用いて前記テストデータおよび前記対象データの複数の仮説ごとに複数の枝刈尺度を計算する仮説尺度計算手段と、
　入力された前記テストデータの複数の前記仮説を各々計算された前記枝刈尺度に対応して複数の前記枝刈尺度で規定されている閾値空間にプロットするデータプロット手段と、
　プロットされた複数の前記仮説の密度に対応して複数の等密度面を前記閾値空間に設定する等密度面設定手段と、
　複数の前記等密度面から選定された一つの一部を一部として複数の前記枝刈尺度の少なくとも一つが低下すると少なくとも一つが上昇する複数の前記枝刈閾値からなる閾値曲面を前記閾値空間に生成する閾値曲面生成手段と、
　前記対象データの複数の前記仮説からなる仮説曲面を各々計算された前記枝刈尺度に対応して前記閾値空間に生成する仮説曲面生成手段と、
　生成された前記仮説曲面が前記閾値曲面と交差する位置を前記枝刈閾値として前記対象データの複数の前記仮説を枝刈する仮説枝刈手段と、
を有するデータ処理装置。
　前記閾値空間が二つの前記枝刈尺度である前記仮説の最尤仮説からのスコア差と仮説順位とで規定されている二次元の閾値平面からなり、
　前記仮説尺度計算手段は、抽出された前記特徴量を用いて前記テストデータおよび前記対象データの複数の前記仮説ごとにスコアを算出して前記スコア差と前記仮説順位とを前記枝刈尺度として計算し、
　前記等密度面設定手段は、プロットされた複数の前記仮説の密度に対応して複数の前記等密度面である等密度線を前記閾値平面に設定し、
　前記閾値曲面生成手段は、複数の前記等密度線から選定された一つの一部を一部として前記スコア差と前記仮説順位との一方が低下すると他方が上昇する複数の前記枝刈閾値からなる閾値曲線を前記閾値曲面として前記閾値平面に生成し、
　前記仮説曲面生成手段は、前記対象データの複数の前記仮説からなる仮説曲線を前記仮説曲面として各々計算された前記スコア差と前記仮説順位とに対応して前記閾値平面に生成する請求項１に記載のデータ処理装置。
　前記探索モードで枝刈された複数の前記仮説から累積された前記スコアが最大の一つを探索結果として出力する結果出力手段を、さらに有する請求項２に記載のデータ処理装置。
　請求項１ないし３の何れか一項に記載のデータ処理装置のコンピュータプログラムであって、
　学習モードでは正解仮説が確定しているテストデータを所定の入力単位ごとに入力して探索モードでは仮説探索の対象データを前記入力単位ごとに入力するデータ入力処理と、
　入力された前記テストデータおよび前記対象データを分析して特徴量を各々抽出する特徴量抽出処理と、
　抽出された前記特徴量を用いて前記テストデータおよび前記対象データの複数の仮説ごとに複数の枝刈尺度を計算する仮説尺度計算処理と、
　入力された前記テストデータの複数の前記仮説を各々計算された前記枝刈尺度に対応して複数の前記枝刈尺度で規定されている閾値空間にプロットするデータプロット処理と、
　プロットされた複数の前記仮説の密度に対応して複数の等密度面を前記閾値空間に設定する等密度面設定処理と、
　複数の前記等密度面から選定された一つの一部を一部として複数の前記枝刈尺度の少なくとも一つが低下すると少なくとも一つが上昇する複数の前記枝刈閾値からなる閾値曲面を前記閾値空間に生成する閾値曲面生成処理と、
　前記対象データの複数の前記仮説からなる仮説曲面を各々計算された前記枝刈尺度に対応して前記閾値空間に生成する仮説曲面生成処理と、
　生成された前記仮説曲面が前記閾値曲面と交差する位置を前記枝刈閾値として前記対象データの複数の前記仮説を枝刈する仮説枝刈処理と、
をデータ処理装置に実行させるコンピュータプログラム。
　請求項１ないし３の何れか一項に記載のデータ処理装置のデータ処理方法であって、
　学習モードでは正解仮説が確定しているテストデータを所定の入力単位ごとに入力して探索モードでは仮説探索の対象データを前記入力単位ごとに入力するデータ入力動作と、
　入力された前記テストデータおよび前記対象データを分析して特徴量を各々抽出する特徴量抽出動作と、
　抽出された前記特徴量を用いて前記テストデータおよび前記対象データの複数の仮説ごとに複数の枝刈尺度を計算する仮説尺度計算動作と、
　入力された前記テストデータの複数の前記仮説を各々計算された前記枝刈尺度に対応して複数の前記枝刈尺度で規定されている閾値空間にプロットするデータプロット動作と、
　プロットされた複数の前記仮説の密度に対応して複数の等密度面を前記閾値空間に設定する等密度面設定動作と、
　複数の前記等密度面から選定された一つの一部を一部として複数の前記枝刈尺度の少なくとも一つが低下すると少なくとも一つが上昇する複数の前記枝刈閾値からなる閾値曲面を前記閾値空間に生成する閾値曲面生成動作と、
　前記対象データの複数の前記仮説からなる仮説曲面を各々計算された前記枝刈尺度に対応して前記閾値空間に生成する仮説曲面生成動作と、
　生成された前記仮説曲面が前記閾値曲面と交差する位置を前記枝刈閾値として前記対象データの複数の前記仮説を枝刈する仮説枝刈動作と、
を有するデータ処理方法。