JP6216809B2 - パラメータ調整システム、パラメータ調整方法、プログラム - Google Patents

パラメータ調整システム、パラメータ調整方法、プログラム Download PDF

Info

Publication number
JP6216809B2
JP6216809B2 JP2016013093A JP2016013093A JP6216809B2 JP 6216809 B2 JP6216809 B2 JP 6216809B2 JP 2016013093 A JP2016013093 A JP 2016013093A JP 2016013093 A JP2016013093 A JP 2016013093A JP 6216809 B2 JP6216809 B2 JP 6216809B2
Authority
JP
Japan
Prior art keywords
parameter set
parameter
group
value
evaluation index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016013093A
Other languages
English (en)
Other versions
JP2017134197A (ja
Inventor
智子 川瀬
智子 川瀬
隆朗 福冨
隆朗 福冨
岡本 学
学 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016013093A priority Critical patent/JP6216809B2/ja
Publication of JP2017134197A publication Critical patent/JP2017134197A/ja
Application granted granted Critical
Publication of JP6216809B2 publication Critical patent/JP6216809B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Navigation (AREA)

Description

本発明は、発話データの音声信号を音声認識する技術に関し、特に雑音抑圧処理や音声認識処理に係る各パラメータを最適化する技術に関する。
雑音下で音声認識精度を向上させる技術として、複数用意した適応用データセット各々とベースとなる音響モデル(以下、ベース音響モデルという)から合成した複数の合成後音響モデル各々に対して、調整用データを入力し、音声認識精度が最も高い合成後音響モデルを最適音響モデルとして選択する技術がある(特許文献1)。ここでは、音響モデルとして広く用いられているHidden Markov Model(HMM)を採用、適応用データセットを音響分析した結果をHMMの出力確率とし、ベース音響モデルのHMMをもとにHMMの状態遷移確率を学習することで利用環境に適応した合成後音響モデルが構成される。このとき、適応用データセットを複数に分割しているため、ベース音響モデルとの合成を別々の計算機で並列実行できる上、合成後音響モデルの中から調整用データに適するものを選択するため、音声認識精度が向上する。
また、雑音抑圧を目的とした収音処理側のパラメータ最適化技術として、反復スペクトルサブトラクションの反復回数を、ミュージカルノイズや音声歪みが小さくなるように、雑音の定常性に応じて最適に決定する技術もある(非特許文献1)。
特開2005−326672号公報
三宅亮太、福森隆寛、中山雅人、西浦敬信、"反復スペクトル減算のための連検定に基づく雑音環境識別手法の検討"、信学技報IEICE Technical Report SIP2014-73、電子情報通信学会、2014年8月、pp.7-12.
しかし、音声認識精度をより向上させるには、多様な収音処理側のパラメータや音声認識処理側のパラメータを調整する必要がある。調整対象となるパラメータの例として、ウィーナーフィルタリング時のフロアリング係数、信号のパワーを時間平均する際の平均時間、信号のパワーを時間平均する際の重みづけ係数、雑音パワー計算時の信号の時間平滑化に用いる平滑化係数、ディップホールド時の推定雑音レベルの上昇係数、尤度計算時の音響尤度と言語尤度の比がある。しかも、これらのパラメータを周波数帯域毎に調整する必要があるため、調整すべきパラメータは数十種類以上にもなる。
パラメータの値と音声認識精度の関係は決定論的に求められないため、音声認識精度を向上させるようなパラメータ値を計算により求めることができない。したがって、音声認識装置のパラメータの調整に非常に手間がかかってしまうという問題がある。
そこで、音声認識精度を最大化するように音声認識装置のパラメータを調整するパラメータ調整システムを提供することを目的とする。
本発明の一態様は、iを1以上の整数として、音声認識精度を最適化するために用いる学習データを用いて、第iパラメータセット候補群のパラメータセット値の評価指標の値の集合である第i評価指標群を生成する音声認識装置と、前記第i評価指標群を用いて、前記評価指標の値が最も高い最適パラメータセット値を生成するパラメータ調整装置とからなるパラメータ調整システムであって、前記パラメータ調整装置は、前記第i評価指標群を用いて、前記第iパラメータセット候補群から評価指標の値が上位のパラメータセット値を要素とする第iパラメータセット群を生成するパラメータセット群生成部と、終了条件を満たしているか否かを示す判定結果を生成する終了条件判定部と、前記判定結果が継続を示す場合、前記第iパラメータセット群から第i+1パラメータセット候補群を生成し、前記音声認識装置に出力するパラメータセット候補群生成部と、前記判定結果が終了を示す場合、前記第iパラメータセット群から評価指標の値が最も高いパラメータセット値を選択し、前記最適パラメータセット値として出力する出力生成部とを有する。
本発明によれば、多数のパラメータを要素として含むパラメータセットの値を繰り返し調整することにより、学習データの音声信号の音声認識精度を最大化する最適パラメータセット値を生成することが可能となる。
パラメータ調整システム200の構成を示すブロック図。 パラメータ調整システム200の動作を示すフローチャート。 パラメータ調整装置100の構成を示すブロック図。 パラメータ調整装置100の動作を示すフローチャート。 パラメータ調整装置300の構成を示すブロック図。 パラメータ調整装置300の動作を示すフローチャート。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
以下、図1、2を参照して音声認識装置900とパラメータ調整装置100を含むパラメータ調整システム200について説明する。図1は、パラメータ調整システム200の構成を示すブロック図である。図2は、パラメータ調整システム200の動作を示すフローチャートである。図1に示すようにパラメータ調整システム200は、音声認識装置900と、パラメータ調整装置100を含む。パラメータ調整システム200は、学習データ記録部201、第1パラメータセット候補群記録部202と接続している。
パラメータセットは調整対象となる音声認識装置900のK個のパラメータを要素として含む。このK個のパラメータは整列されており、それぞれ第1パラメータ要素、…、第Kパラメータ要素と呼び、p、…、pと表すこととする。また、パラメータセットを[p,…,p]と表す。なお、第kパラメータ要素p(1≦k≦K)のkのことをパラメータ要素番号という。
本実施形態では、Kが数十から数百の値をとり、人手での調整が困難であることを想定している。パラメータ調整装置100を用いてパラメータセット値を自動調整するために、各パラメータの取り得る値を定義しておく。パラメータには離散値をとるものと連続値をとるものとがあるが、本実施形態では、簡単のため連続値をとるパラメータについては離散値に量子化して扱う。連続値を離散値とするために用いる量子化ステップは人手により適当な値を設定する。
学習データ記録部201には、調整対象である音声認識装置900の最適なパラメータ値の組(最適パラメータセット値)を生成するために用いる学習データを記録しておく。最適パラメータセット値とは、学習データの音声信号の音声認識精度を最大化するパラメータの値の組のことである。学習データの集合Dは式(1)で表される。
Figure 0006216809
ただし、Sは雑音混入音声信号、Tは発話の文字列(発話データ)、Qは学習データの集合Dの濃度である学習データ量である(q=1,…,Q)。SはTを読み上げた音声信号である。つまり、TはSの正解文字列に相当するものである。
第1パラメータセット候補群記録部202には、音声認識装置900の各パラメータ要素の初期値の組(パラメータセットの初期値)を記録しておく。このパラメータセットの初期値のことを第1パラメータセット候補群といい、その値は人手で決定する。Nini個(Niniは2以上の整数)のパラメータセット値を第1パラメータセット候補群として用意し第1パラメータセット候補群記録部202に記録しておく。
また、音声認識装置900は、収音処理部910と、音声認識部920を含む。収音処理部910と音声認識部920は、特許文献1や非特許文献1のような既存の技術を用いて構成されるものである。どのような既存技術を採用するかにより、収音処理部910を構成するために必要なパラメータ、音声認識部920を構成するために必要なパラメータが決まることになる。
音声認識装置900には第iパラメータセット候補群(iは1以上の整数)が設定される。つまり、パラメータ調整システム200の処理開始時に、先ほどの第1パラメータセット候補群が設定されることになる。
収音処理部910は、学習データの音声信号である雑音混入音声信号S(q=1,…,Q)から雑音を抑圧した雑音抑圧音声信号を生成する。音声認識部920は、雑音抑圧音声信号を音声認識し、第i評価指標群を生成する(S900)。評価指標はパラメータセットの適切さを評価する指標であり、音声認識精度の程度を示す指標である。音声認識精度そのものは評価指標の例である。また、計算量削減のために、評価指標として音声認識精度と相関のある別の指標を用いてもよい。例えば、学習データの雑音混入音声信号に対応するクリーン音声信号が入手できる場合には、ケプストラム距離やPESQ(Perceptual Evaluation of Speech Quality)を評価指標として利用することができる。
第i評価指標群は、第iパラメータセット候補群に含まれるパラメータセット値の数の評価指標の値を含むものとなる。したがって、第1パラメータセット候補群については、各パラメータセット値に対応する形で第1評価指標値がNini個得られる。
パラメータ調整装置100は、音声認識装置900が出力した第iパラメータセット候補群と第i評価指標群を用いて第iパラメータセット群を生成し、終了条件を満たす場合は、第iパラメータセット群の中で評価指標の値が最も高いパラメータセット値を最適パラメータセット値として出力する(S100)。
なお、第iパラメータセット候補群は、i=1のときはパラメータ調整システム200の外部の第1パラメータセット候補群記録部202から、i>1のときはパラメータ調整装置100の出力として与えられるものである。したがって、第1パラメータセット候補群を処理開始時点でパラメータ調整装置100に保持するようにしておけば、音声認識装置900の出力(つまり、パラメータ調整装置100の入力)を第i評価指標群のみとすることもできる。
以下、図3、4を参照してパラメータ調整装置100について説明する。図3は、パラメータ調整装置100の構成を示すブロック図である。図4は、パラメータ調整装置100の動作を示すフローチャートである。図3に示すようにパラメータ調整装置100は、パラメータセット群生成部110と、パラメータセット群記録部101と、終了条件判定部120と、パラメータセット候補群生成部130と、出力生成部140を含む。
パラメータセット群生成部110は、第iパラメータセット候補群と第i評価指標群の組を用いて第iパラメータセット群を生成する(S110)。パラメータセット群生成部110はその内部に第1パラメータセット候補群と第1評価指標群の組、…、第i−1パラメータセット候補群と第i−1評価指標群の組(i=1のときはNULL)を保持しており、評価指標の値が高い上位M個(Mは1以上の整数)のパラメータセット値を第iパラメータセット群として生成する。
生成した第iパラメータセット群はパラメータセット群記録部101に記録される。その際、各パラメータセット値に対応する評価指標の値も組にして記録しておく。つまり、パラメータセット群記録部101には、第1パラメータセット群と対応する評価指標の値の集合、第2パラメータセット群と対応する評価指標の値の集合、…、第iパラメータセット群と対応する評価指標の値の集合が記録されている。
終了条件判定部120は、終了条件を満たしているか否かを示す判定結果を生成する(S120)。終了条件としては、“繰り返し回数があらかじめ設定した値I(Iは1以上の整数)に達した(終了条件1)”、“あらかじめ設定した値J(Jは1以上の整数)だけ、パラメータセット群に変動がない(上位M個に変動がない)状態が続いた(終了条件2)”またはその組み合わせ“終了条件1または終了条件2のいずれかが満たされた(JはI以下の整数)”などを用いればよい。
判定結果が継続を示す(終了条件を満たさない)場合、パラメータセット候補群生成部130は、第iパラメータセット群から、N個(Nは2以上の整数)のパラメータセット値からなる第i+1パラメータセット候補群を生成する(S130)。生成された第i+1パラメータセット候補群は音声認識装置900に設定される。音声認識装置900は先ほどの学習データに対して収音処理部910による処理、音声認識部920による処理を繰り返し、第i+1評価指標群を生成する。
一方、判定結果が終了を示す(終了条件を満たした)場合は、出力生成部140は、パラメータセット群記録部101に記録されている第1パラメータセット群から第iパラメータセット群の中で評価指標の値が最も高いパラメータセット値を最適パラメータセット値として出力する(S140)。
なお、第iパラメータセット群に含まれるパラメータセット値の個数Mは、典型的にはNiniやNより小さい値となる。より多くのパラメータセット値の候補を生成し、評価指標値が高いパラメータセット値を選択できるようにした方が、よりよい最適パラメータセット値が得られることが期待できるからである。
(パラメータセット候補群生成部130の動作)
以下、パラメータセット候補群生成部130の動作の詳細について説明する。パラメータセット候補群生成部130では、以下に述べる2つのパラメータセット値生成方法(方法I、方法II)により第iパラメータセット群から第i+1パラメータセット候補群を生成する。
第iパラメータセット群のM個のパラメータセット値から、方法Iのみを用いて第i+1パラメータセット候補群のN個のパラメータセット値を生成してもよい。また、方法IIのみを用いてN個のパラメータセット値を生成してもよい。N、NをN+N=N、1≦N,N≦Nを満たす整数とし、方法Iを用いてN個のパラメータセット値を生成、方法IIを用いてN個のパラメータセット値を生成してもよい。
(方法I)
M個のパラメータセット値を含む第iパラメータセット群に含まれる少なくとも2つのパラメータセット値から、パラメータ要素ごとにその値をランダムに選択し、1つのパラメータセット値(以下、第i+1パラメータセット候補群の要素を第i+1パラメータセット値という)を生成する。
第iパラメータセット群に含まれるm番目(mは1以上M以下の整数)のパラメータセット値pi,mは、第iパラメータセット群に含まれるm番目のパラメータセット値pi,mの第kパラメータ要素の値をp i,mとすると、式(2)と表現できる。
Figure 0006216809
このとき、{pi,1,…, pi,M}から生成されるn番目(nは1以上N以下の整数)のパラメータセット値p〜i+1,nは式(3)と表される。
Figure 0006216809
ここで、r1,r2,…,rKはいずれも1以上M以下の整数であり、[r1,r2,…,rK]はランダムに生成されるものである。例えば、集合として{r1,r2,…,rK}={m1,m2}のときは、第iパラメータセット群に含まれるm1番目のパラメータセット値とm2番目のパラメータセット値(m1、m2は1以上M以下の整数)とからパラメータセット値p〜i+1,nが生成されたことになる。
式(3)は、パラメータセット値p〜i+1,nのパラメータ要素の値を、第iパラメータセット群のいずれかのパラメータセットの値から選択することを表している。
方法Iで生成する第i+1パラメータセット値の個数がMでよい場合、式(3)で生成される1つのパラメータセット値を用いて式(4)のようにn番目のパラメータセット値(1≦n≦M)を生成してもよい。
Figure 0006216809
このようにすることにより、[r1,r2,…,rK]の生成が1回で済み、簡単にM個のパラメータセット値が得られる。
また、方法Iで生成する第i+1パラメータセット値の個数をM+1個以上とする場合は、式(4)を用いてM個のパラメータセット値を生成した上で、式(3)を用いて残りのパラメータセット値を生成してもよい。もちろん、式(3)のみを用いてすべてのパラメータセット値を生成してもよい。
(方法II)
第iパラメータセット群に含まれるパラメータセット値から、当該パラメータセット値の少なくとも1つのパラメータ要素の値を所定のステップだけ変動させることにより第i+1パラメータセット値を生成する。
i,m(mは1以上M以下の整数)から生成される第i+1パラメータセット値は式(5)で表される。
Figure 0006216809
ただし、δ i,m(kは1以上K以下の整数)は変動ステップであり、以下の式(6)を満たす。
Figure 0006216809
δ i,m,+(>0)、δ i,m,−(<0)はいずれも離散値をとるパラメータの量子化ステップの値と等しい。
なお、1、−1以外の整数を用いて、δ i,m,+、δ i,m,−を量子化ステップの整数倍となるように決定してもよい。この場合、変動ステップが大きくなるため、量子化ステップそのものを用いる場合に比べて、粗い近傍探索を行うことになる。
以下、δ i,mの決定方法を説明する。pi,mからp^i+1,mを生成する場合のδ i,m(1≦k≦K)の決定方法は、以下の2つの場合に応じて異なる方法をとる。
(場合1:i=1またはpi,mが第iパラメータセット候補群に含まれるパラメータセット値として方法Iにより生成されたものである場合)
i,mが第iパラメータセット候補群に含まれるパラメータセット値として方法Iにより生成されたものであるとは、pi,mが第iパラメータセット候補群に含まれるパラメータセット値として第i−1パラメータセット群から方法Iにより生成されたものであり、上位M個として第iパラメータセット群のパラメータセット値として残ったことを意味する。
なお、pi,mが第iパラメータセット候補群に含まれるパラメータセット値として方法Iにより生成されたものであるのか、方法IIにより生成されたものであるのかを示すフラグ、方法IIで生成された場合は、pi,mの生成元となった第i−1パラメータセット群のパラメータセット値(以下、生成元第i−1パラメータセット値という)、生成元第i−1パラメータセット値に加えた変動ステップセットδi−1,m、生成元第i−1パラメータセット値の第i−1評価指標の値については、パラメータ調整装置100が備える記録部に記録しておくものとする。もちろん、パラメータセット候補群生成部130の内部に記録しておいてもよい。
場合1では、pi,mを第iパラメータセット群の平均tに近づける方向へ移動するよう、δ i,m(1≦k≦K)を決定する。第iパラメータセット群の平均tとは、第iパラメータセット群に含まれるパラメータセット値についてパラメータ要素ごとに求めた平均t の組であり、式(7)で表せる。
Figure 0006216809
このとき、δ i,mは式(8)で表せる。
Figure 0006216809
つまり、pi,mをパラメータ要素ごとに平均tに近づけるよう、各δ i,mを決定する。
(場合2:場合1以外の場合)
場合1以外の場合とは、i>1かつpi,mが第iパラメータセット候補群に含まれるパラメータセット値として方法IIにより生成されたものである場合を意味する。また、pi,mが第iパラメータセット候補群に含まれるパラメータセット値として方法IIにより生成されたものであるとは、pi,mが第iパラメータセット候補群に含まれるパラメータセット値として第i−1パラメータセット群のあるパラメータセット値(生成元第i−1パラメータセット)から方法IIにより生成されたものであり、上位M個として第iパラメータセット群のパラメータセット値として残ったことを意味する。
そこで、場合2では、変動結果と評価結果に基づいて変動コストを定義し、変動コストが低い方へ確率的に変動させるよう、δ i,m(1≦k≦K)を決定する。
まず、第kパラメータ要素pの変動コストJを定義することを考える。一つのパラメータ要素に着目すると変動方向は正負の二択となるので、変動コストJを正方向の変動成分Jk+と負方向の変動成分Jk−とに分解し(Jk+>0、Jk−>0)、式(9)のように表すこととする。
Figure 0006216809
次に、変動結果と評価結果に基づいて変動コストJを決定するか方法について説明する。ここで、先ほど説明したpi,mの生成元第i−1パラメータセット値、pi,mの生成元第i−1パラメータセット値に加えた変動ステップセットδi−1,m、pi,mの生成元第i−1パラメータセット値の第i−1評価指標値に加えて、pi,mの第i評価指標値を用いて、変動結果と評価結果について説明する。δi−1,mの要素δ i−1,mがδ i,m,+のに等しいとき、第kパラメータ要素pは正の方向へ変動したといい、δ i,m,−のに等しいとき、第kパラメータ要素pは負の方向へ変動したという。また、pi,mの第i評価指標値からpi,mの生成元第i−1パラメータセット値の第i−1評価指標値を減じた値を評価結果といい、評価結果が正の場合は改善したといい、評価結果が負の場合は改悪したという。
第kパラメータ要素pの正方向への変動により、評価結果が改善した場合にはその評価結果の値に応じてJk+を減算し、評価結果が改悪した場合にはその評価結果の値に応じてJk+を加算する。第kパラメータ要素pの負方向への変動についても同様にJk−を変更する。つまり、第kパラメータ要素pの負方向への変動により、評価結果が改善した場合にはその評価結果の値に応じてJk−を減算し、評価結果が改悪した場合にはその評価結果の値に応じてJk−を加算する。
ρ(x)をxの絶対値|x|に関して単調増大であり、その値域が[0,1]である関数とする。このとき、第kパラメータ要素pの値を次のように変動させる。J>0である場合、確率ρ(J)で正方向へδ i,m,+だけ変動、確率1−ρ(J)で負方向へδ i,m,−だけ変動する。同様に、J<0である場合、確率ρ(J)で負方向へδ i,m,−だけ変動、確率1−ρ(J)で正方向へδ i,m,+だけ変動する。
つまり、第kパラメータ要素pの変動コストJを求め、その値に応じて確率的にδ i,mを決定する。
場合1では、pi,mが方法Iにより生成される。この場合、pi,mは1つの第i−1パラメータセット値から生成されたものではないため、どのパラメータ要素をどの方向(正または負の方向)に変動させればよいかわからない。そこで、平均は評価指標の値が改善する可能性がある値であるとして、これに近づくようにδ i,mを決定している。
一方、場合2では、評価結果の値が得られるので、変動結果との関係を見定めてδ i,mを決定するようにしている。
本実施形態では、雑音抑圧機能を有する音声認識装置900のパラメータを調整するものとして説明したが、これに限るものではない。音声認識部920のみからなる音声認識装置に学習データと第1パラメータセット候補群を与えて、パラメータ調整装置100でパラメータを調整するのでもよい。
本実施形態では、パラメータ調整装置100によるパラメータセット値の生成、生成したパラメータセット値を設定した音声認識装置900による音声認識結果の評価を繰り返す。このとき、これまでの処理で生成したパラメータセット値のうち、相対的に評価の高いものを用いて、新しいパラメータセット値を生成していく。相対的に評価の高いパラメータセット値の集合を更新することにより多数のパラメータ要素を含むパラメータセットの値を生成していくことにより、グリッドサーチによるパラメータの調整が現実的に不可能な音声認識装置に対しても、音声認識精度を最大化するパラメータ値(最適パラメータ値)を生成することが可能となる。
また、パラメータセット値の集合の更新に際して、方法Iを用いることにより広域な探索が行われ、局所最適に陥る可能性を軽減している。一方、方法IIを用いることにより細かく着実な局所探索が行われ、人手により初期値として与えられた第1パラメータセット候補群のパラメータセット値の組み合わせより適切なパラメータセット値が得られないという可能性を軽減している。これにより、第1パラメータセット候補群のパラメータセット値より適切なパラメータセット値を現実的な計算量で生成することができる。
音声認識装置900のパラメータセットには、取り得る値が近い値になるパラメータ要素が複数含まれることがある。この場合は、パラメータセット候補群生成部130での処理コストが軽減するようパラメータ調整装置を構成することができる。
例えば、以下のようにすればよい。まず、取り得る値が近いと考えられるパラメータ要素同士を事前にグループ化する。第kパラメータ要素pに対してグループを示すIDを付与し、当該IDが同一の値を有するパラメータ要素については、パラメータ要素番号が最も若いものを代表として選定する。そして、繰り返し処理の前半では(例えば、第I/2パラメータセット候補群生成前までは)、グループの代表となるパラメータ要素に対してのみパラメータ調整を行い、繰り返し処理の後半では(例えば、第I/2パラメータセット候補群生成以降は)、同一グループに属するパラメータ要素を個々に調整する。また、繰り返し処理の後半で、先ほどの終了条件2を組み合わせて終了か継続かの判定を行ってもよい。一般に、I、I、J、J、M、Mを1以上の整数とし、繰り返し処理の前半では、終了条件を、“繰り返し回数があらかじめ設定した値Iに達した(終了条件3)”、“あらかじめ設定した値Jだけ、パラメータセット群に変動がない(上位M個に変動がない)状態が続いた(終了条件4)”またはその組み合わせ“終了条件3または終了条件4のいずれかが満たされた(JはI以下の整数)”とし、繰り返し処理の後半では、終了条件を、“繰り返し回数があらかじめ設定した値Iに達した(終了条件5)”、“あらかじめ設定した値Jだけ、パラメータセット群に変動がない(上位M個に変動がない)状態が続いた(終了条件6)”またはその組み合わせ“終了条件5または終了条件6のいずれかが満たされた(JはI以下の整数)”としてもよい。
繰り返し処理の前半、繰り返し処理の後半の終了条件をそれぞれ第1の終了条件、第2の終了条件という。また、第1の終了条件の判定結果、第2の終了条件の判定結果をそれぞれ第1の判定結果、第2の判定結果という。
以下、図5、6を参照してパラメータ調整装置300について説明する。図5は、パラメータ調整装置300の構成を示すブロック図である。図6は、パラメータ調整装置300の動作を示すフローチャートである。図5に示すようにパラメータ調整装置300は、パラメータセット群生成部110と、パラメータセット群記録部101と、終了条件判定部320と、パラメータセット候補群生成部330と、出力生成部140を含む。
パラメータセット群生成部110、パラメータセット群記録部101は、実施例1と同様である。
終了条件判定部320は、繰り返し処理の前半では第1の終了条件を満たしているか否かを示す第1の判定結果を、繰り返し処理の後半では第2の終了条件を満たしているか否かを示す第2の判定結果を生成する(S320)。終了条件判定部320は繰り返し処理の前半では第1の終了条件について、繰り返し処理の後半では第2の終了条件について判定結果を出す必要があるが、例えば、第1の終了条件、第2の終了条件のいずれについて判定結果を生成するのかを示すフラグ(以下、処理識別フラグという)をパラメータ調整装置300に保持するようにすればよい。
終了条件判定部320の出力である判定結果が、第1の判定結果でありその値が継続を示す場合、第1の判定結果でありその値が終了を示す場合、第2の判定結果でありその値が継続を示す場合のいずれかである場合は、パラメータセット候補群生成部330は、実施例1のパラメータセット候補群生成部130と同様、第iパラメータセット群から第i+1パラメータセット候補群を生成する(S330)。ただし、上記3つの場合に応じて第i+1パラメータセット候補群の生成方法が異なる。
具体的な生成方法を説明する前に先ほど述べたグループ化について詳細に説明しておく。パラメータセットのパラメータ要素各々にグループを識別するためのグループIDが紐づけられる。グループIDの値が同じパラメータ要素の集合が近い値をとるパラメータ要素の集合となる。グループIDの値が同じパラメータ要素の集合に対して、先ほど述べたようにパラメータ要素番号が最も若いものを代表パラメータ要素とする。なお、グループIDの値が同じパラメータ要素の集合の濃度が1となる、つまりそのパラメータ要素と同じ値のグループIDを有するパラメータ要素がないこともあり、この場合はそのパラメータ要素が代表パラメータ要素となる。この代表パラメータ要素の値を集めたものを代表パラメータセット値という。第iパラメータセット群に含まれるパラメータセット値から生成した代表パラメータセット値の集合を第i代表パラメータセット群という。
第i+1パラメータセット候補群の生成方法について説明する。第1の判定結果でありその値が継続を示す場合は、第iパラメータセット群から第i代表パラメータセット群を生成し、この第i代表パラメータセット群から方法I、方法IIを用いて第i+1代表パラメータセット候補群を生成する。グループIDの値が同じパラメータ要素に対してそのグループの代表パラメータ要素の値を設定することにより、第i+1代表パラメータセット候補群から第i+1パラメータセット候補群を生成する。このとき、処理識別フラグは第1の終了条件を示すもののままとする。
第1の判定結果でありその値が終了を示す場合は、第1の判定結果でありその値が継続を示す場合と同様の方法で第i+1パラメータセット候補群を生成する。ただし、処理識別フラグは第2の終了条件を示すものに変更する。なお、実施例1と同様の方法で第i+1パラメータセット候補群を生成してもよい。
第2の判定結果でありその値が継続を示す場合は、実施例1と同様の方法で第i+1パラメータセット候補群を生成する。このとき、処理識別フラグは第2の終了条件を示すもののままとする。
いずれかの方法で生成された第i+1パラメータセット候補群に対して、第i+1評価指標群を生成するのは、実施例1と同様である。
一方、終了条件判定部320の出力である判定結果が第2の判定結果でありその値が終了を示す場合は、出力生成部140が実施例1と同様の方法にて最適パラメータセット値を決定し出力する(S140)。
なお、第1パラメータセット候補群に含まれるパラメータセット値は、代表パラメータ要素の値だけ人手で設定するようにして生成することができる。
このように取り得る値が近いパラメータ要素についてグループ化し代表パラメータ要素の値のみ算出することにより、パラメータセット候補群生成部330での処理コストを軽減することができる。
<補記>
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (7)

  1. iを1以上の整数として、
    音声認識精度を最適化するために用いる学習データを用いて、第iパラメータセット候補群のパラメータセット値の評価指標の値の集合である第i評価指標群を生成する音声認識装置と、
    前記第i評価指標群を用いて、前記評価指標の値が最も高い最適パラメータセット値を生成するパラメータ調整装置と
    からなるパラメータ調整システムであって、
    前記パラメータ調整装置は、
    前記第i評価指標群を用いて、前記第iパラメータセット候補群から評価指標の値が上位M個(Mは1以上の整数)のパラメータセット値を要素とする第iパラメータセット群を生成するパラメータセット群生成部と、
    終了条件を満たしているか否かを示す判定結果を生成する終了条件判定部と、
    前記判定結果が継続を示す場合、前記第iパラメータセット群から第i+1パラメータセット候補群を生成し、前記音声認識装置に出力するパラメータセット候補群生成部と、
    前記判定結果が終了を示す場合、前記第iパラメータセット群から評価指標の値が最も高いパラメータセット値を選択し、前記最適パラメータセット値として出力する出力生成部と
    含み、
    前記パラメータセット候補群生成部は、
    前記第iパラメータセット群の少なくとも2つのパラメータセット値から、パラメータ要素ごとにその値をランダムに選択することにより前記第i+1パラメータセット候補群に含まれるパラメータセット値を生成する第1のパラメータセット値生成方法と、前記第iパラメータセット群のパラメータセット値から、当該パラメータセット値の少なくとも1つのパラメータ要素の値を所定のステップだけ変動させることにより前記第i+1パラメータセット候補群に含まれるパラメータセット値を生成する第2のパラメータセット値生成方法を用いて、前記第i+1パラメータセット候補群を生成し、
    mを1以上M以下の整数、p i,m を次式で表される前記第iパラメータセット群に含まれるm番目のパラメータセット値とし、
    Figure 0006216809
    (ただし、p i,m (1≦k≦K、Kはパラメータ要素の数を表す1以上の整数)は、前記パラメータセット値p i,m の第kパラメータ要素の値)
    前記第1のパラメータセット値生成方法は、前記第i+1パラメータセット候補群に含まれるパラメータセット値p 〜i+1,n (1≦n≦M)を次式で生成する
    Figure 0006216809
    (ただし、r1,r2,…,rKは、いずれも1以上M以下の整数で、ランダムに生成されるもの)
    ことを特徴とするパラメータ調整システム。
  2. iを1以上の整数として、
    音声認識精度を最適化するために用いる学習データを用いて、第iパラメータセット候補群のパラメータセット値の評価指標の値の集合である第i評価指標群を生成する音声認識装置と、
    前記第i評価指標群を用いて、前記評価指標の値が最も高い最適パラメータセット値を生成するパラメータ調整装置と
    からなるパラメータ調整システムであって、
    前記パラメータ調整装置は、
    前記第i評価指標群を用いて、前記第iパラメータセット候補群から評価指標の値が上位M個(Mは1以上の整数)のパラメータセット値を要素とする第iパラメータセット群を生成するパラメータセット群生成部と、
    終了条件を満たしているか否かを示す判定結果を生成する終了条件判定部と、
    前記判定結果が継続を示す場合、前記第iパラメータセット群から第i+1パラメータセット候補群を生成し、前記音声認識装置に出力するパラメータセット候補群生成部と、
    前記判定結果が終了を示す場合、前記第iパラメータセット群から評価指標の値が最も高いパラメータセット値を選択し、前記最適パラメータセット値として出力する出力生成部と
    含み、
    前記パラメータセット候補群生成部は、
    前記第iパラメータセット群の少なくとも2つのパラメータセット値から、パラメータ要素ごとにその値をランダムに選択することにより前記第i+1パラメータセット候補群に含まれるパラメータセット値を生成する第1のパラメータセット値生成方法と、前記第iパラメータセット群のパラメータセット値から、当該パラメータセット値の少なくとも1つのパラメータ要素の値を所定のステップだけ変動させることにより前記第i+1パラメータセット候補群に含まれるパラメータセット値を生成する第2のパラメータセット値生成方法を用いて、前記第i+1パラメータセット候補群を生成し、
    mを1以上M以下の整数、p i,m を次式で表される前記第iパラメータセット群に含まれるm番目のパラメータセット値とし、
    Figure 0006216809
    (ただし、p i,m (1≦k≦K、Kはパラメータ要素の数を表す1以上の整数)は、前記パラメータセット値p i,m の第kパラメータ要素の値)
    前記第2のパラメータセット値生成方法は、i>1かつ前記パラメータセット値p i,m が第2のパラメータセット値生成方法により生成されたものである場合、第kパラメータ要素の変動結果と、前記パラメータセット値p i,m の第i評価指標値から前記パラメータセット値p i,m の生成元第i−1パラメータセット値の第i−1評価指標値を減じた値である評価結果とに基づいて定義される第kパラメータ要素の変動コストJ の値に応じて確率的に前記所定のステップδ i,m を決定する
    ことを特徴とするパラメータ調整システム。
  3. iを1以上の整数として、
    音声認識精度を最適化するために用いる学習データを用いて、第iパラメータセット候補群のパラメータセット値の評価指標の値の集合である第i評価指標群を生成する音声認識装置と、
    前記第i評価指標群を用いて、前記評価指標の値が最も高い最適パラメータセット値を生成するパラメータ調整装置と
    からなるパラメータ調整システムであって、
    前記パラメータ調整装置は、
    前記第i評価指標群を用いて、前記第iパラメータセット候補群から評価指標の値が上位のパラメータセット値を要素とする第iパラメータセット群を生成するパラメータセット群生成部と、
    第1の終了条件を満たしているか否かを示す第1の判定結果及び第2の終了条件を満たしているか否かを示す第2の判定結果を生成する終了条件判定部と、
    前記第1の判定結果が継続を示す場合、前記第1の判定結果が終了を示す場合、前記第2の判定結果が継続を示す場合のいずれかである場合、前記第iパラメータセット群から第i+1パラメータセット候補群を生成し、前記音声認識装置に出力するパラメータセット候補群生成部と、
    前記第2の判定結果が終了を示す場合、前記第iパラメータセット群から評価指標の値が最も高いパラメータセット値を選択し、前記最適パラメータセット値として出力する出力生成部と
    を含み、
    互いに近い値をとるパラメータセットのパラメータ要素からなる集合に属するパラメータ要素のひとつを代表パラメータ要素とし、
    前記パラメータセット候補群生成部は、
    前記第1の判定結果が継続を示す場合には、代表パラメータ要素に対してのみパラメータ調整を行うことで、前記第i+1パラメータセット候補群を生成し、前記第2の判定結果が継続を示す場合には、すべてのパラメータ要素に対してパラメータ調整を行うことで、前記第i+1パラメータセット候補群を生成する
    ことを特徴とするパラメータ調整システム。
  4. iを1以上の整数として、
    音声認識精度を最適化するために用いる学習データを用いて、第iパラメータセット候補群のパラメータセット値の評価指標の値の集合である第i評価指標群を生成する音声認識装置と、
    前記第i評価指標群を用いて、前記評価指標の値が最も高い最適パラメータセット値を生成するパラメータ調整装置と
    からなるパラメータ調整システムにおけるパラメータ調整方法であって、
    前記パラメータ調整装置は、
    前記第i評価指標群を用いて、前記第iパラメータセット候補群から評価指標の値が上位M個(Mは1以上の整数)のパラメータセット値を要素とする第iパラメータセット群を生成するパラメータセット群生成ステップと、
    終了条件を満たしているか否かを示す判定結果を生成する終了条件判定ステップと、
    前記判定結果が継続を示す場合、前記第iパラメータセット群から第i+1パラメータセット候補群を生成し、前記音声認識装置に出力するパラメータセット候補群生成ステップと、
    前記判定結果が終了を示す場合、前記第iパラメータセット群から評価指標の値が最も高いパラメータセット値を選択し、前記最適パラメータセット値として出力する出力生成ステップと
    を実行し、
    前記パラメータセット候補群生成ステップは、
    前記第iパラメータセット群の少なくとも2つのパラメータセット値から、パラメータ要素ごとにその値をランダムに選択することにより前記第i+1パラメータセット候補群に含まれるパラメータセット値を生成する第1のパラメータセット値生成方法と、前記第iパラメータセット群のパラメータセット値から、当該パラメータセット値の少なくとも1つのパラメータ要素の値を所定のステップだけ変動させることにより前記第i+1パラメータセット候補群に含まれるパラメータセット値を生成する第2のパラメータセット値生成方法を用いて、前記第i+1パラメータセット候補群を生成し、
    mを1以上M以下の整数、p i,m を次式で表される前記第iパラメータセット群に含まれるm番目のパラメータセット値とし、
    Figure 0006216809
    (ただし、p i,m (1≦k≦K、Kはパラメータ要素の数を表す1以上の整数)は、前記パラメータセット値p i,m の第kパラメータ要素の値)
    前記第1のパラメータセット値生成方法は、前記第i+1パラメータセット候補群に含まれるパラメータセット値p 〜i+1,n (1≦n≦M)を次式で生成する
    Figure 0006216809
    (ただし、r1,r2,…,rKは、いずれも1以上M以下の整数で、ランダムに生成されるもの)
    ことを特徴とするパラメータ調整方法。
  5. iを1以上の整数として、
    音声認識精度を最適化するために用いる学習データを用いて、第iパラメータセット候補群のパラメータセット値の評価指標の値の集合である第i評価指標群を生成する音声認識装置と、
    前記第i評価指標群を用いて、前記評価指標の値が最も高い最適パラメータセット値を生成するパラメータ調整装置と
    からなるパラメータ調整システムにおけるパラメータ調整方法であって、
    前記パラメータ調整装置は、
    前記第i評価指標群を用いて、前記第iパラメータセット候補群から評価指標の値が上位M個(Mは1以上の整数)のパラメータセット値を要素とする第iパラメータセット群を生成するパラメータセット群生成ステップと、
    終了条件を満たしているか否かを示す判定結果を生成する終了条件判定ステップと、
    前記判定結果が継続を示す場合、前記第iパラメータセット群から第i+1パラメータセット候補群を生成し、前記音声認識装置に出力するパラメータセット候補群生成ステップと、
    前記判定結果が終了を示す場合、前記第iパラメータセット群から評価指標の値が最も高いパラメータセット値を選択し、前記最適パラメータセット値として出力する出力生成ステップと
    を実行し、
    前記パラメータセット候補群生成ステップは、
    前記第iパラメータセット群の少なくとも2つのパラメータセット値から、パラメータ要素ごとにその値をランダムに選択することにより前記第i+1パラメータセット候補群に含まれるパラメータセット値を生成する第1のパラメータセット値生成方法と、前記第iパラメータセット群のパラメータセット値から、当該パラメータセット値の少なくとも1つのパラメータ要素の値を所定のステップだけ変動させることにより前記第i+1パラメータセット候補群に含まれるパラメータセット値を生成する第2のパラメータセット値生成方法を用いて、前記第i+1パラメータセット候補群を生成し、
    mを1以上M以下の整数、p i,m を次式で表される前記第iパラメータセット群に含まれるm番目のパラメータセット値とし、
    Figure 0006216809
    (ただし、p i,m (1≦k≦K、Kはパラメータ要素の数を表す1以上の整数)は、前記パラメータセット値p i,m の第kパラメータ要素の値)
    前記第2のパラメータセット値生成方法は、i>1かつ前記パラメータセット値p i,m が第2のパラメータセット値生成方法により生成されたものである場合、第kパラメータ要素の変動結果と、前記パラメータセット値p i,m の第i評価指標値から前記パラメータセット値p i,m の生成元第i−1パラメータセット値の第i−1評価指標値を減じた値である評価結果とに基づいて定義される第kパラメータ要素の変動コストJ の値に応じて確率的に前記所定のステップδ i,m を決定する
    ことを特徴とするパラメータ調整方法。
  6. iを1以上の整数として、
    音声認識精度を最適化するために用いる学習データを用いて、第iパラメータセット候補群のパラメータセット値の評価指標の値の集合である第i評価指標群を生成する音声認識装置と、
    前記第i評価指標群を用いて、前記評価指標の値が最も高い最適パラメータセット値を生成するパラメータ調整装置と
    からなるパラメータ調整システムにおけるパラメータ調整方法であって、
    前記パラメータ調整装置は、
    前記第i評価指標群を用いて、前記第iパラメータセット候補群から評価指標の値が上位のパラメータセット値を要素とする第iパラメータセット群を生成するパラメータセット群生成ステップと、
    第1の終了条件を満たしているか否かを示す第1の判定結果及び第2の終了条件を満たしているか否かを示す第2の判定結果を生成する終了条件判定ステップと、
    前記第1の判定結果が継続を示す場合、前記第1の判定結果が終了を示す場合、前記第2の判定結果が継続を示す場合のいずれかである場合、前記第iパラメータセット群から第i+1パラメータセット候補群を生成し、前記音声認識装置に出力するパラメータセット候補群生成ステップと、
    前記第2の判定結果が終了を示す場合、前記第iパラメータセット群から評価指標の値が最も高いパラメータセット値を選択し、前記最適パラメータセット値として出力する出力生成ステップ
    を実行し、
    互いに近い値をとるパラメータセットのパラメータ要素からなる集合に属するパラメータ要素のひとつを代表パラメータ要素とし、
    前記パラメータセット候補群生成ステップは、
    前記第1の判定結果が継続を示す場合には、代表パラメータ要素に対してのみパラメータ調整を行うことで、前記第i+1パラメータセット候補群を生成し、前記第2の判定結果が継続を示す場合には、すべてのパラメータ要素に対してパラメータ調整を行うことで、前記第i+1パラメータセット候補群を生成する
    ことを特徴とするパラメータ調整方法。
  7. 請求項1ないし3のいずれか1項に記載のパラメータ調整システムとしてコンピュータを機能させるためのプログラム。
JP2016013093A 2016-01-27 2016-01-27 パラメータ調整システム、パラメータ調整方法、プログラム Active JP6216809B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016013093A JP6216809B2 (ja) 2016-01-27 2016-01-27 パラメータ調整システム、パラメータ調整方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016013093A JP6216809B2 (ja) 2016-01-27 2016-01-27 パラメータ調整システム、パラメータ調整方法、プログラム

Publications (2)

Publication Number Publication Date
JP2017134197A JP2017134197A (ja) 2017-08-03
JP6216809B2 true JP6216809B2 (ja) 2017-10-18

Family

ID=59502713

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016013093A Active JP6216809B2 (ja) 2016-01-27 2016-01-27 パラメータ調整システム、パラメータ調整方法、プログラム

Country Status (1)

Country Link
JP (1) JP6216809B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7167640B2 (ja) * 2018-11-08 2022-11-09 日本電信電話株式会社 最適化装置、最適化方法、およびプログラム
CN112394982B (zh) * 2021-01-21 2021-04-13 腾讯科技(深圳)有限公司 生成语音识别系统的方法、装置、介质及电子设备
CN117311138B (zh) * 2023-11-30 2024-02-23 华中科技大学 一种水轮机调节系统控制参数稳定裕度域计算方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3160277B2 (ja) * 1989-03-13 2001-04-25 株式会社エイ・ティ・アール自動翻訳電話研究所 基本周波数パターン推定装置
JPH0778000A (ja) * 1993-09-10 1995-03-20 Matsushita Electric Ind Co Ltd 波形符号化装置

Also Published As

Publication number Publication date
JP2017134197A (ja) 2017-08-03

Similar Documents

Publication Publication Date Title
JP5411936B2 (ja) 音声信号区間推定装置と音声信号区間推定方法及びそのプログラムと記録媒体
JP5150542B2 (ja) パターン認識装置、パターン認識方法、及び、プログラム
CN111788629B (zh) 学习装置、声音区间检测装置及声音区间检测方法
JP7218601B2 (ja) 学習データ取得装置、モデル学習装置、それらの方法、およびプログラム
JP6452591B2 (ja) 合成音声品質評価装置、合成音声品質評価方法、プログラム
KR101026632B1 (ko) 포먼트 트랙킹 방법 및 컴퓨터 판독가능 기록 매체
JP6216809B2 (ja) パラメータ調整システム、パラメータ調整方法、プログラム
JP5974901B2 (ja) 有音区間分類装置、有音区間分類方法、及び有音区間分類プログラム
JP6721165B2 (ja) 入力音マスク処理学習装置、入力データ処理関数学習装置、入力音マスク処理学習方法、入力データ処理関数学習方法、プログラム
JP6157926B2 (ja) 音声処理装置、方法およびプログラム
JP5191500B2 (ja) 雑音抑圧フィルタ算出方法と、その装置と、プログラム
JP6142401B2 (ja) 音声合成モデル学習装置、方法、及びプログラム
JP2007304445A (ja) 周波数成分の修復・抽出方法、周波数成分の修復・抽出装置、周波数成分の修復・抽出プログラムならびに周波数成分の修復・抽出プログラムを記録した記録媒体
JP5852550B2 (ja) 音響モデル生成装置とその方法とプログラム
JP2020126141A (ja) 音響モデル学習装置、音響モデル学習方法、プログラム
CN1624765A (zh) 使用分段线性逼近的连续值声道共振跟踪方法和装置
KR101862352B1 (ko) 음성 인식을 위한 전처리 장치, 및 이를 이용한 음성 인식 장치 및 방법
JP4843646B2 (ja) 音声認識装置とその方法と、プログラムと記録媒体
JP6067760B2 (ja) パラメータ決定装置、パラメータ決定方法、およびプログラム
JP7333878B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP4242320B2 (ja) 音声認識方法、その装置およびプログラム、その記録媒体
JP2010286586A (ja) 音声認識装置及び音響モデル作成装置とそれらの方法と、プログラムと記録媒体
JP6903613B2 (ja) 音声認識装置、音声認識方法及びプログラム
JP7021437B2 (ja) 学習データ生成装置、学習データ生成方法、及びプログラム
JP4653673B2 (ja) 信号判定装置、信号判定方法、信号判定プログラムおよび記録媒体

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170919

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170925

R150 Certificate of patent or registration of utility model

Ref document number: 6216809

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150