JPH0341839B2 - - Google Patents
Info
- Publication number
- JPH0341839B2 JPH0341839B2 JP56041865A JP4186581A JPH0341839B2 JP H0341839 B2 JPH0341839 B2 JP H0341839B2 JP 56041865 A JP56041865 A JP 56041865A JP 4186581 A JP4186581 A JP 4186581A JP H0341839 B2 JPH0341839 B2 JP H0341839B2
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- similarity
- pattern
- phoneme
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000004458 analytical method Methods 0.000 claims description 57
- 238000004364 calculation method Methods 0.000 claims description 20
- 238000000605 extraction Methods 0.000 claims description 10
- 238000012950 reanalysis Methods 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims 2
- 238000000034 method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000000611 regression analysis Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Description
本発明は改良された音声識別装置に関する。
近年、入力音声を識別(認識)する音声識別装
置が種々開発され、実用化されてきている。この
ような音声識別装置では、音声入力信号を帯域フ
イルタ等により周波数領域に順次変換することに
よつて抽出された周波数特徴の時系列を動的計画
法によつて標準パターンとの整合をとるか、或い
は周波数特徴から音素系列に変換した後、標準の
音素系列と比較することによつて、音声の識別を
行なう手段が一般に採用されている。このような
従来の音声識別装置では、音声入力信号(入力音
声)の分析区間および始点の決定が固定的であ
り、入力音声に対する分析条件の最適化が充分に
図られているとは言い難かつた。このため、入力
音声の種々の条件下での変動に対し、識別精度を
維持することが困難となり、識別誤り或いは識別
不能が生じやすい欠点があつた。また、このよう
な欠点を補なうため、上述の変動に対応した種々
の変形パターンを用意しておく方法もあるが、適
切な変形パターンの設定は極めて困難であるとと
もに、辞書(メモリ容量)が膨大なものとなる不
都合があつた。 本発明は上記事情に鑑みてなされたものでその
目的は、入力音声に対する分析区間、分析始点等
の分析条件の決定の最適化が図れ、もつて入力音
声の種々の条件下での変動に対応する多種類の変
形パターンを準備することなく識別精度が著しく
向上する音声識別装置を提供することにある。 以下、本発明の一実施例を図面を参照して説明
する。第1図は音声識別装置の構成を示すもの
で、11は図示せぬ音声入力部たとえばマイクロ
ホンから入力された音声信号(入力音声)を適当
な電圧レベルに増幅するプリアンプである。この
プリアンプ11の出力はアナログ/デジタル変換
器(以下、A/D変換器と称する)12に入力さ
れる。A/D変換器12はプリアンプ11の出力
を所定のサンプリング周期でデジタル信号の列S
(ti)に変換する。A/D変換器12の出力S(ti)
すなわち量子化された入力音声S(ti)は、音声
バツフア13に入力され、該音声バツフア13内
に順次記憶される。 14は切り出し/重みづけ回路(以下、単に切
り出し回路と称する)である。切り出し回路14
は、与えられた分析区間すなわち分析窓の幅Tお
よびその始点αの分析条件に従つて、音声バツフ
ア13内に記憶されている量子化された入力音声
S(ti)の切り出しを行なうと共に、窓関数WT1α
(ti)を用いて重みづけを行ない、分析すべき信
号I(ti)を得る。切り出し回路14は、通常状
態(1回目の分析)における上記入力音声S(ti)
の切り出しを、特定の分析条件すなわちT=T0、
α=α0に従つて実行する。このT0、α0としては、
音声識別に際し、比較的高い識別精度が得られて
いる値があらかじめ設定されている。この場合、
窓関数はWT0、α0(ti)で表わされ、したがつて切
り出し回路14の出力(分析すべき信号)I(ti)
は I(ti)=S(ti)×WT0、α0(ti) となる。なお、窓関数としては、ハニング関数等
適当なものを用いる。切り出し回路14の出力す
なわち分析すべき信号I(ti)は周波数分析器た
とえば高速フーリエ変換装置(以下、FFTと称
する)15に入力される。FFT15は上記信号
I(ti)の周波数分析を行ない、対応する周波数
パターンF(ωi)に変換する。ここでF(ωi)は周
知のように F(ωi)=f〓(I(ti)) で示される。なお、f〓は離散フーリエ変換DFTを
意味している。 FFT15で得られた周波数パターンF(ωi)
は、平滑化、プリエンフアシス、標本化等の処理
を施された後(回路は図示せず)、類似度計算部
16に入力される。類似度計算部16は辞書17
および類似度計算回路18を備えている。この辞
書17には、標準音声の周波数パターン、更には
登録話者毎の周波数パターン(変形パターン)が
母音、子音の音素別にあらかじめ記憶されてい
る。類似度計算回路18は、類似度計算部16に
入力された入力音声の周波数パターンF(ωi)と、
辞書17に記憶されている周波数パターンとの類
似度を各音素別に計算する。そして、類似度計算
回路18は、類似度値の高得点の音素を上位n位
まで選び、始点α0とする分析窓における類似度値
と音素のペアのパターン列として出力する。類似
度計算回路18の出力は、回帰判定部19に入力
される。 回帰判定部19は記憶装置20および回帰判定
回路21を備えている。この記憶装置20には、
音素系列とその類似度値(閾値θ)との2次元の
リスト(パターン列)が標準音声、更には登録話
者の音声毎に記憶されている。また、記憶装置2
0には回帰判定回路21が後述する回帰判定を行
なうための判定条件等も記憶されている。 分析条件を決定するために、例えば予め回帰判
定回路21の記憶装置20には分析条件(Ti、
αi)についてのテーブルが記憶されている。この
分析条件テーブルは予め実行された大量のシミユ
レーシヨンにより作成される。このテーブルの例
を次の表に示す。
置が種々開発され、実用化されてきている。この
ような音声識別装置では、音声入力信号を帯域フ
イルタ等により周波数領域に順次変換することに
よつて抽出された周波数特徴の時系列を動的計画
法によつて標準パターンとの整合をとるか、或い
は周波数特徴から音素系列に変換した後、標準の
音素系列と比較することによつて、音声の識別を
行なう手段が一般に採用されている。このような
従来の音声識別装置では、音声入力信号(入力音
声)の分析区間および始点の決定が固定的であ
り、入力音声に対する分析条件の最適化が充分に
図られているとは言い難かつた。このため、入力
音声の種々の条件下での変動に対し、識別精度を
維持することが困難となり、識別誤り或いは識別
不能が生じやすい欠点があつた。また、このよう
な欠点を補なうため、上述の変動に対応した種々
の変形パターンを用意しておく方法もあるが、適
切な変形パターンの設定は極めて困難であるとと
もに、辞書(メモリ容量)が膨大なものとなる不
都合があつた。 本発明は上記事情に鑑みてなされたものでその
目的は、入力音声に対する分析区間、分析始点等
の分析条件の決定の最適化が図れ、もつて入力音
声の種々の条件下での変動に対応する多種類の変
形パターンを準備することなく識別精度が著しく
向上する音声識別装置を提供することにある。 以下、本発明の一実施例を図面を参照して説明
する。第1図は音声識別装置の構成を示すもの
で、11は図示せぬ音声入力部たとえばマイクロ
ホンから入力された音声信号(入力音声)を適当
な電圧レベルに増幅するプリアンプである。この
プリアンプ11の出力はアナログ/デジタル変換
器(以下、A/D変換器と称する)12に入力さ
れる。A/D変換器12はプリアンプ11の出力
を所定のサンプリング周期でデジタル信号の列S
(ti)に変換する。A/D変換器12の出力S(ti)
すなわち量子化された入力音声S(ti)は、音声
バツフア13に入力され、該音声バツフア13内
に順次記憶される。 14は切り出し/重みづけ回路(以下、単に切
り出し回路と称する)である。切り出し回路14
は、与えられた分析区間すなわち分析窓の幅Tお
よびその始点αの分析条件に従つて、音声バツフ
ア13内に記憶されている量子化された入力音声
S(ti)の切り出しを行なうと共に、窓関数WT1α
(ti)を用いて重みづけを行ない、分析すべき信
号I(ti)を得る。切り出し回路14は、通常状
態(1回目の分析)における上記入力音声S(ti)
の切り出しを、特定の分析条件すなわちT=T0、
α=α0に従つて実行する。このT0、α0としては、
音声識別に際し、比較的高い識別精度が得られて
いる値があらかじめ設定されている。この場合、
窓関数はWT0、α0(ti)で表わされ、したがつて切
り出し回路14の出力(分析すべき信号)I(ti)
は I(ti)=S(ti)×WT0、α0(ti) となる。なお、窓関数としては、ハニング関数等
適当なものを用いる。切り出し回路14の出力す
なわち分析すべき信号I(ti)は周波数分析器た
とえば高速フーリエ変換装置(以下、FFTと称
する)15に入力される。FFT15は上記信号
I(ti)の周波数分析を行ない、対応する周波数
パターンF(ωi)に変換する。ここでF(ωi)は周
知のように F(ωi)=f〓(I(ti)) で示される。なお、f〓は離散フーリエ変換DFTを
意味している。 FFT15で得られた周波数パターンF(ωi)
は、平滑化、プリエンフアシス、標本化等の処理
を施された後(回路は図示せず)、類似度計算部
16に入力される。類似度計算部16は辞書17
および類似度計算回路18を備えている。この辞
書17には、標準音声の周波数パターン、更には
登録話者毎の周波数パターン(変形パターン)が
母音、子音の音素別にあらかじめ記憶されてい
る。類似度計算回路18は、類似度計算部16に
入力された入力音声の周波数パターンF(ωi)と、
辞書17に記憶されている周波数パターンとの類
似度を各音素別に計算する。そして、類似度計算
回路18は、類似度値の高得点の音素を上位n位
まで選び、始点α0とする分析窓における類似度値
と音素のペアのパターン列として出力する。類似
度計算回路18の出力は、回帰判定部19に入力
される。 回帰判定部19は記憶装置20および回帰判定
回路21を備えている。この記憶装置20には、
音素系列とその類似度値(閾値θ)との2次元の
リスト(パターン列)が標準音声、更には登録話
者の音声毎に記憶されている。また、記憶装置2
0には回帰判定回路21が後述する回帰判定を行
なうための判定条件等も記憶されている。 分析条件を決定するために、例えば予め回帰判
定回路21の記憶装置20には分析条件(Ti、
αi)についてのテーブルが記憶されている。この
分析条件テーブルは予め実行された大量のシミユ
レーシヨンにより作成される。このテーブルの例
を次の表に示す。
【表】
この表でΔθ1は類似度順位の1位の類似度値と
2位の類似度値との差を示し、同様にΔθ2は類似
度順位の2位の類似度値と3位の類似度値との差
を示す。 回帰判定回路21は、初めに類似度計算回路1
8より出力される分析窓の幅Ti、分析窓の始点
αiとする分析条件における音素と類似度値のペア
のパターン列と、記憶装置20に予め記憶された
標準音素の類似度値(閾値θ)とを比較する。そ
して、この閾値θとの比較結果によつて、類似度
計算回路18より出力されたパターン列の中から
答を出力するか、または再分析を行うための分析
条件を求めるかの判断を行う。 類似度計算回路18より出力される分析条件
(T0、α0)とする分析窓における音素と類似度値
のペアのパターン列は、第2図に示されるよう
に、類似度値の最高得点の音素エ([e])(類似
度値0.4)が類似度順位第1位で、次に得点の高
い類似度値の音素ア([a])(類似度値0.3)が類
似度順位第2位…であるものとする。なお、第3
位以下の類似度値の音素については、示されてい
ない。一方、記憶装置10に記憶されている上述
の音素に対するパターン列の類似度値(閾値θ)
は、エ([e])、ア([a])共に0.5であるものと
する。回帰判定回路21は、類似度計算回路18
から受信したパターン列(エ([e])、ア([a])
…)内の第1位のデータに注目し、記憶装置20
に記憶された類似度値(閾値θ)との比較を行な
う。この場合、受信したパターン列の第1位の音
素エ([e])(類似度値0.4)は、閾値0.5を下回
つており、回帰判定回路21は音声識別結果
(答)の出力を行なわずに、再分析のための分析
条件の設定を行なう処理を実行する。そこで、回
帰判定回路21は、再分析のための分析条件を設
定するために、再び記憶装置20に記憶されてい
る前記表に示したテーブルを参照する。回帰判定
回路21は分析条件を設定するためにテーブルの
中から、類似度計算回路18から出力される音素
の類似度順位および類似度差のパターン列に対応
する分析条件Ti、αiを選択し、切り出し回路1
4に出力する。 上述したように、分析条件(T0、α0)におけ
る類似度計算回路18から出力されるパターン列
において、第1位の音素エ([e])の類似度値は
0.4で、第2位の音素ア([a])の類似度値は0.3
である。この第1位音素エ([e])と第2位の音
素ア([a])との類似度差Δθ1は0.1である。た
だし、ここでは説明簡略化のために第2位までの
順位を示している。回帰判定回路21は前記テー
ブルから、類似度順位が第1位音素エ([e])、
第2位の音素ア([a])…であり、また類似度差
Δθ1が0.1以下となるパターン列とマツチングす
るものがあるかどうか判定する。回帰判定回路2
1は、前記テーブルから再分析のための分析条件
(T1、α1)を選択し、この分析条件(T1、α1)を
切り出し回路14に出力する。さらに、回帰判定
回路21は、回帰コマンドを切り出し回路14に
出力して、再分析を指令する。 切り出し回路14は、これにより再び入力音声
S(ti)の切り出し/重み付けを行なう。以下、
FFT15、類似度計算部16で前述した場合と
同様の処理が再度行なわれ、第2図に示される音
素と類似度値のペアのパターン列が回帰判定回路
21に入力される。ここで、類似度計算回路18
から出力されるパターン列は、類似度値の最高得
点の音素ア([a])(類似度値0.73)が類似度順
位第1位で、次に得点の高い類似度値の音素エ
([e])(類似度値0.45)が類似度順位第2位…で
あるものとする。回帰判定回路21は、類似度計
算回路18から受信したパターン列(エ([e])、
ア([a])…)の第1位のデータに注目し、記憶
装置20に記憶された類似度値(閾値θ)との比
較を行なう。この場合、受信したパターン列の第
1位の音素ア([a])(類似度値0.73)は、閾値
0.5を上回る。回帰判定回路21は、回帰処理を
行なわずに、答を出力する処理に移る。そして、
音素ア([a])をひとつの音素の最終的な答(識
別結果)として出力する。 なお、本実施例では第2図から明らかなように
第1次近似の答(エ)と再分析時の答(ア)とが異なつて
いる。このような場合、回帰判定回路21は新た
な分析条件T=T2、α=α2を例えば前記のよう
な分析条件テーブルを利用して決定し、この分析
条件に基づいて再々分析を行なわしめ、第2図に
示されるように再々分析によつて得られたパター
ン列の中で最も高い類似度値を有する音素が再び
ア(〔a〕)であることをもつて答を出力するよう
にしてもよい。また、第1次近似の答に無関係
に、同一の音素が2度(またはそれ以上)連続し
て最高得点の類似度値となることをもつて答を出
力するようにしてもよい。なお、最も高い類似度
値が閾値θを越さないために、分析をやり直す
(回帰分析)場合、今回の分析で得られた類似度
値が前回の分析結果に比べて閾値θに近づいたか
否かによつて、分析条件の設定内容を変えること
が好ましい。この場合、分析条件の設定内容を変
更する方式としては、例えば回帰分析結果におけ
るパターン(例えば分析回数に応じて類似度値が
増大するパターン、また類似度値が上下するよう
に振動するパターン等を想定する)に応じた前記
のような分析条件テーブルを複数種用意して、そ
のパターンに対応する分析に適正な分析条件テー
ブルを選択する方式がある。そして、許される分
析時間の範囲で繰り返し回帰分析を行なつても、
最も高い類似度値が閾値θに達しない場合、回帰
判定回路21はリジエクト判定を行なう。 ところで、確実な音声識別を行なうためには上
述のように同一の音素が2度(またはそれ以上)
連続して最高得点の類似度値となることをもつて
当該音素を答とすることが好ましい。この場合、
最高得点の類似度値が閾値θを越しているもの
の、該当する音素がその都度異なる、いわゆる答
が振動する場合がある。このような場合には回帰
判定回路21はリジエクト判定することが好まし
い。更に音素の判定には、上述の内容のほかに、
図示せぬ測定回路によつて音圧レベルを測定し、
このレベレが或る一定値を越えていることを判定
条件に付加するようにしてもよい。なお、前記実
施例では音素の如何に無関係に閾値θが一定
(0.5)であるものとして説明したが、音素毎に閾
値θを設定するようにしてもよい。 以上詳述したように本発明の音声識別装置によ
れば、入力音声の分析結果に応じて新たな分析条
件を決定し、異なる分析条件で繰り返し入力音声
の分析(回帰分析)を行なうことによつて、分析
条件決定の最適化が図れるので、多種類の変形パ
ターンを準備せずとも識別精度を著しく向上する
ことができる。
2位の類似度値との差を示し、同様にΔθ2は類似
度順位の2位の類似度値と3位の類似度値との差
を示す。 回帰判定回路21は、初めに類似度計算回路1
8より出力される分析窓の幅Ti、分析窓の始点
αiとする分析条件における音素と類似度値のペア
のパターン列と、記憶装置20に予め記憶された
標準音素の類似度値(閾値θ)とを比較する。そ
して、この閾値θとの比較結果によつて、類似度
計算回路18より出力されたパターン列の中から
答を出力するか、または再分析を行うための分析
条件を求めるかの判断を行う。 類似度計算回路18より出力される分析条件
(T0、α0)とする分析窓における音素と類似度値
のペアのパターン列は、第2図に示されるよう
に、類似度値の最高得点の音素エ([e])(類似
度値0.4)が類似度順位第1位で、次に得点の高
い類似度値の音素ア([a])(類似度値0.3)が類
似度順位第2位…であるものとする。なお、第3
位以下の類似度値の音素については、示されてい
ない。一方、記憶装置10に記憶されている上述
の音素に対するパターン列の類似度値(閾値θ)
は、エ([e])、ア([a])共に0.5であるものと
する。回帰判定回路21は、類似度計算回路18
から受信したパターン列(エ([e])、ア([a])
…)内の第1位のデータに注目し、記憶装置20
に記憶された類似度値(閾値θ)との比較を行な
う。この場合、受信したパターン列の第1位の音
素エ([e])(類似度値0.4)は、閾値0.5を下回
つており、回帰判定回路21は音声識別結果
(答)の出力を行なわずに、再分析のための分析
条件の設定を行なう処理を実行する。そこで、回
帰判定回路21は、再分析のための分析条件を設
定するために、再び記憶装置20に記憶されてい
る前記表に示したテーブルを参照する。回帰判定
回路21は分析条件を設定するためにテーブルの
中から、類似度計算回路18から出力される音素
の類似度順位および類似度差のパターン列に対応
する分析条件Ti、αiを選択し、切り出し回路1
4に出力する。 上述したように、分析条件(T0、α0)におけ
る類似度計算回路18から出力されるパターン列
において、第1位の音素エ([e])の類似度値は
0.4で、第2位の音素ア([a])の類似度値は0.3
である。この第1位音素エ([e])と第2位の音
素ア([a])との類似度差Δθ1は0.1である。た
だし、ここでは説明簡略化のために第2位までの
順位を示している。回帰判定回路21は前記テー
ブルから、類似度順位が第1位音素エ([e])、
第2位の音素ア([a])…であり、また類似度差
Δθ1が0.1以下となるパターン列とマツチングす
るものがあるかどうか判定する。回帰判定回路2
1は、前記テーブルから再分析のための分析条件
(T1、α1)を選択し、この分析条件(T1、α1)を
切り出し回路14に出力する。さらに、回帰判定
回路21は、回帰コマンドを切り出し回路14に
出力して、再分析を指令する。 切り出し回路14は、これにより再び入力音声
S(ti)の切り出し/重み付けを行なう。以下、
FFT15、類似度計算部16で前述した場合と
同様の処理が再度行なわれ、第2図に示される音
素と類似度値のペアのパターン列が回帰判定回路
21に入力される。ここで、類似度計算回路18
から出力されるパターン列は、類似度値の最高得
点の音素ア([a])(類似度値0.73)が類似度順
位第1位で、次に得点の高い類似度値の音素エ
([e])(類似度値0.45)が類似度順位第2位…で
あるものとする。回帰判定回路21は、類似度計
算回路18から受信したパターン列(エ([e])、
ア([a])…)の第1位のデータに注目し、記憶
装置20に記憶された類似度値(閾値θ)との比
較を行なう。この場合、受信したパターン列の第
1位の音素ア([a])(類似度値0.73)は、閾値
0.5を上回る。回帰判定回路21は、回帰処理を
行なわずに、答を出力する処理に移る。そして、
音素ア([a])をひとつの音素の最終的な答(識
別結果)として出力する。 なお、本実施例では第2図から明らかなように
第1次近似の答(エ)と再分析時の答(ア)とが異なつて
いる。このような場合、回帰判定回路21は新た
な分析条件T=T2、α=α2を例えば前記のよう
な分析条件テーブルを利用して決定し、この分析
条件に基づいて再々分析を行なわしめ、第2図に
示されるように再々分析によつて得られたパター
ン列の中で最も高い類似度値を有する音素が再び
ア(〔a〕)であることをもつて答を出力するよう
にしてもよい。また、第1次近似の答に無関係
に、同一の音素が2度(またはそれ以上)連続し
て最高得点の類似度値となることをもつて答を出
力するようにしてもよい。なお、最も高い類似度
値が閾値θを越さないために、分析をやり直す
(回帰分析)場合、今回の分析で得られた類似度
値が前回の分析結果に比べて閾値θに近づいたか
否かによつて、分析条件の設定内容を変えること
が好ましい。この場合、分析条件の設定内容を変
更する方式としては、例えば回帰分析結果におけ
るパターン(例えば分析回数に応じて類似度値が
増大するパターン、また類似度値が上下するよう
に振動するパターン等を想定する)に応じた前記
のような分析条件テーブルを複数種用意して、そ
のパターンに対応する分析に適正な分析条件テー
ブルを選択する方式がある。そして、許される分
析時間の範囲で繰り返し回帰分析を行なつても、
最も高い類似度値が閾値θに達しない場合、回帰
判定回路21はリジエクト判定を行なう。 ところで、確実な音声識別を行なうためには上
述のように同一の音素が2度(またはそれ以上)
連続して最高得点の類似度値となることをもつて
当該音素を答とすることが好ましい。この場合、
最高得点の類似度値が閾値θを越しているもの
の、該当する音素がその都度異なる、いわゆる答
が振動する場合がある。このような場合には回帰
判定回路21はリジエクト判定することが好まし
い。更に音素の判定には、上述の内容のほかに、
図示せぬ測定回路によつて音圧レベルを測定し、
このレベレが或る一定値を越えていることを判定
条件に付加するようにしてもよい。なお、前記実
施例では音素の如何に無関係に閾値θが一定
(0.5)であるものとして説明したが、音素毎に閾
値θを設定するようにしてもよい。 以上詳述したように本発明の音声識別装置によ
れば、入力音声の分析結果に応じて新たな分析条
件を決定し、異なる分析条件で繰り返し入力音声
の分析(回帰分析)を行なうことによつて、分析
条件決定の最適化が図れるので、多種類の変形パ
ターンを準備せずとも識別精度を著しく向上する
ことができる。
第1図は本発明の音声識別装置の一実施例を示
すブロツク図、第2図は上記実施例において類似
度計算回路より出力される類似度値と音素のパタ
ーン列と閾値θとの関係を具体的に示す図であ
る。 12……アナログ/デジタル変換器(A/D変
換器)、13……音声バツフア、14……切り出
し/重みづけ回路(切り出し回路)、15……高
速フーリエ変換装置(FFT)、17……辞書、1
8……類似度計算回路、20……記憶装置、21
……回帰判定回路。
すブロツク図、第2図は上記実施例において類似
度計算回路より出力される類似度値と音素のパタ
ーン列と閾値θとの関係を具体的に示す図であ
る。 12……アナログ/デジタル変換器(A/D変
換器)、13……音声バツフア、14……切り出
し/重みづけ回路(切り出し回路)、15……高
速フーリエ変換装置(FFT)、17……辞書、1
8……類似度計算回路、20……記憶装置、21
……回帰判定回路。
Claims (1)
- 1 入力音声を量子化する量子化手段と、この手
段によつて量子化された入力音声を記憶する音声
バツフアと、窓関数を用い、与えられた分析窓の
幅および分析始点の分析条件に従つて上記音声バ
ツフアに記憶されている上記量子化された入力音
声の切り出し/重みづけを行う切り出し/重みづ
け回路と、この切り出し/重みづけ回路によつて
切り出された上記入力音声の周波数分析を行い対
応する周波数パターンを出力する周波数分析器
と、この周波数分析器から出力される上記周波数
パターンと予め記憶されている標準音声の周波数
パターンとの類似度を計算し、音素と類似度のペ
アのパターン列を出力する類似度計算部と、この
類似度計算部から出力される上記パターン列に応
じて音声識別結果を出力するか、或いは上記分析
条件とは異なる分析条件を上記切り出し/重みづ
け回路に出力して再分析を行なわしめる回帰判定
部とを具備することを特徴とする音声識別装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56041865A JPS57157299A (en) | 1981-03-23 | 1981-03-23 | Voice identification unit |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56041865A JPS57157299A (en) | 1981-03-23 | 1981-03-23 | Voice identification unit |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS57157299A JPS57157299A (en) | 1982-09-28 |
| JPH0341839B2 true JPH0341839B2 (ja) | 1991-06-25 |
Family
ID=12620147
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56041865A Granted JPS57157299A (en) | 1981-03-23 | 1981-03-23 | Voice identification unit |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS57157299A (ja) |
-
1981
- 1981-03-23 JP JP56041865A patent/JPS57157299A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS57157299A (en) | 1982-09-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4783802A (en) | Learning system of dictionary for speech recognition | |
| US4038503A (en) | Speech recognition apparatus | |
| JP3114975B2 (ja) | 音素推定を用いた音声認識回路 | |
| US6278970B1 (en) | Speech transformation using log energy and orthogonal matrix | |
| EP0763811B1 (en) | Speech signal processing apparatus for detecting a speech signal | |
| US6553342B1 (en) | Tone based speech recognition | |
| US8271283B2 (en) | Method and apparatus for recognizing speech by measuring confidence levels of respective frames | |
| US5144672A (en) | Speech recognition apparatus including speaker-independent dictionary and speaker-dependent | |
| US4924518A (en) | Phoneme similarity calculating apparatus | |
| EP0526347A2 (en) | A number-of-recognition candidates determining system in a speech recognizing device | |
| JPH0341839B2 (ja) | ||
| JPS6129518B2 (ja) | ||
| EP0420825A2 (en) | A method and equipment for recognising isolated words, particularly for very large vocabularies | |
| JP3083855B2 (ja) | 音声認識方法及び装置 | |
| US8688452B2 (en) | Automatic generation of distractors for special-purpose speech recognition grammars | |
| JPH0441357B2 (ja) | ||
| JPH0552509B2 (ja) | ||
| JPS62111295A (ja) | 音声認識装置 | |
| JPH0634193B2 (ja) | キ−ワ−ド抽出装置 | |
| JPS5936759B2 (ja) | 音声認識方法 | |
| JPH04365100A (ja) | 音声認識に使用する子音の認識方法 | |
| JPS6131476B2 (ja) | ||
| JPS63292199A (ja) | 音声認識装置 | |
| JPH01209499A (ja) | パターン照合方式 | |
| JPH0115078B2 (ja) |