JPH0436400B2 - - Google Patents
Info
- Publication number
- JPH0436400B2 JPH0436400B2 JP57231889A JP23188982A JPH0436400B2 JP H0436400 B2 JPH0436400 B2 JP H0436400B2 JP 57231889 A JP57231889 A JP 57231889A JP 23188982 A JP23188982 A JP 23188982A JP H0436400 B2 JPH0436400 B2 JP H0436400B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- standard
- input pattern
- input
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims 3
- 239000013598 vector Substances 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 10
- 230000011218 segmentation Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 230000001186 cumulative effect Effects 0.000 description 5
- 238000000926 separation method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は、連続して発声した複数の単語音声を
認識処理する方式に関し、特に、単語認識のため
の入力音声パターンと標準パターンとのマツチン
グ処理において、組み合わされる標準パターンの
隣接する端部同士の間に、一定範囲内での重複あ
るいは離隔した関係を許容することにより、最適
な連続単語認識を可能にする音声認識処理方法に
関する。
認識処理する方式に関し、特に、単語認識のため
の入力音声パターンと標準パターンとのマツチン
グ処理において、組み合わされる標準パターンの
隣接する端部同士の間に、一定範囲内での重複あ
るいは離隔した関係を許容することにより、最適
な連続単語認識を可能にする音声認識処理方法に
関する。
従来の連続単語音声認識方法としては、2段
D.Pマツチング法がある。これは入力パターンと
すべての標準パターン系列とのマツチングを動的
計画法を用いて行なうとき、第1図に示すよう
に、入力パターンC中に存在するものとしたとき
の各単語に対応する標準パターン系列An(1),
An(2),……が照合される入力パターンC中の各
部分パターンC(b(i),e(i))の始点b(i)を、そ
の単語より先に発声されたとされる単語に対応す
る標準パターンが照合される部分パターンC(b
(i−1),e(i−1))の終点e(i−1)の次
の点に固定する、すなわちb(i)=e(i−1)+1
という条件を課す方法である。
D.Pマツチング法がある。これは入力パターンと
すべての標準パターン系列とのマツチングを動的
計画法を用いて行なうとき、第1図に示すよう
に、入力パターンC中に存在するものとしたとき
の各単語に対応する標準パターン系列An(1),
An(2),……が照合される入力パターンC中の各
部分パターンC(b(i),e(i))の始点b(i)を、そ
の単語より先に発声されたとされる単語に対応す
る標準パターンが照合される部分パターンC(b
(i−1),e(i−1))の終点e(i−1)の次
の点に固定する、すなわちb(i)=e(i−1)+1
という条件を課す方法である。
しかしながら、このような単純な条件では、連
続して単語を発声した場合に、単語境界で生じる
調音結合や単語長の短縮化、さらに無音区間など
の影響による入力パターンの種々の変化に十分対
応できず、そのため認識やセグメンテーシヨンの
誤りを引き起こす欠点があつた。
続して単語を発声した場合に、単語境界で生じる
調音結合や単語長の短縮化、さらに無音区間など
の影響による入力パターンの種々の変化に十分対
応できず、そのため認識やセグメンテーシヨンの
誤りを引き起こす欠点があつた。
本発明の目的は、調音結合や単語長の短縮化、
さらに無音区間などの影響による入力パターンの
種々の変化に柔軟に対応して、標準パターンが照
合される入力パターンの部分パターンの始点と終
点の位置を決定することにより、認識やセグメン
テーシヨンの誤りを減らすことにある。
さらに無音区間などの影響による入力パターンの
種々の変化に柔軟に対応して、標準パターンが照
合される入力パターンの部分パターンの始点と終
点の位置を決定することにより、認識やセグメン
テーシヨンの誤りを減らすことにある。
本発明は、標準パターン系列を入力パターンの
各部分パターンにマツチングさせるとき、隣り合
う2つの部分パターンに共通部分をもたせること
により、単語境界における調音結合や単語境界に
共通部分があるような、単語長が短縮されている
場合が認識処理上考慮できることを利用して、認
識やセグメンテーシヨンの誤りを減らすものであ
る。
各部分パターンにマツチングさせるとき、隣り合
う2つの部分パターンに共通部分をもたせること
により、単語境界における調音結合や単語境界に
共通部分があるような、単語長が短縮されている
場合が認識処理上考慮できることを利用して、認
識やセグメンテーシヨンの誤りを減らすものであ
る。
本発明はまた、標準パターン系列を入力パター
ンの各部分パターンにマツチングさせるとき、隣
り合う2つの部分パターンの間に標準パターンに
照合されない部分をもたせることにより、単語境
界における調音結合や無音区間の影響をとりのぞ
くことができることを利用して、認識やセグメン
テーシヨンの誤りを減らすものである。
ンの各部分パターンにマツチングさせるとき、隣
り合う2つの部分パターンの間に標準パターンに
照合されない部分をもたせることにより、単語境
界における調音結合や無音区間の影響をとりのぞ
くことができることを利用して、認識やセグメン
テーシヨンの誤りを減らすものである。
はじめに、本発明の基礎となつていて、かつ改
良が意図されている従来の2段DPマツチング法
による連続単語音声認識処理システムについて説
明する。図面は第1図が参照される。
良が意図されている従来の2段DPマツチング法
による連続単語音声認識処理システムについて説
明する。図面は第1図が参照される。
認識の対象となる単語がN個あり、そのn番目
の単語の標準パターンAnがつぎのように特徴ベ
クトルの時系列で表わされるものとする。
の単語の標準パターンAnがつぎのように特徴ベ
クトルの時系列で表わされるものとする。
An=(a(1 n,a(2 n,……,a(p1 n,……,a(J
o
n),n=1,2,……,N (1) ここで、a(p nはM次元ベクトルとする。すな
わち、 a(p n=(ap1 n,ap2 n,……,apM n),p=1,2,
……,Jn (2) とする。また入力パターンCは、I個の特徴ベク
トル(Cqを用いて、 C=((C1,(C2,……,(Cq,……,(CI) (3) で表わされるものとする。ここで、(Cqは、 (Cq=(Cq1,Cq2,……,CqM),q=1,2,
……,I (4) とする。
o
n),n=1,2,……,N (1) ここで、a(p nはM次元ベクトルとする。すな
わち、 a(p n=(ap1 n,ap2 n,……,apM n),p=1,2,
……,Jn (2) とする。また入力パターンCは、I個の特徴ベク
トル(Cqを用いて、 C=((C1,(C2,……,(Cq,……,(CI) (3) で表わされるものとする。ここで、(Cqは、 (Cq=(Cq1,Cq2,……,CqM),q=1,2,
……,I (4) とする。
入力パターンCとk個の単語の標準パターン系
列An(1),An(2),……,An(k)との間の距離Sを、
つぎのように定義する。
列An(1),An(2),……,An(k)との間の距離Sを、
つぎのように定義する。
S=k
〓i=j
D(C(b(i),e(i)),An(i)) (5)
ここで、C(b(i),e(i)は、標準パターンAn(i)が
照合される入力パターンのi番目の部分パターン
であつて、第1図に示すように、b(i)からe(i)ま
での特徴ベクトルにより表わされ、 C(b(i),e(i)=((Cb(i),(Cb(i)+1,……,
(Ce(i)), (6) 1≦b(i)≦e(i)≦I で定義される。またD(C(b(i),e(i),An(i))
は、部分パターンC(b(i),e(i))と標準パター
ンAn(i)との間の距離であつて、 D(C(b(i),e(i)),An(i),)=mine(i) 〓j=j(l)l=b(i) d
((Cl,a(j n(i)) (7) で定義される。ここで、d((Cl,a(j n(i))は特徴
ベクトル(Clおよびa(j n(i)間の距離であつて、 d((Cl,a(j n(i))=M 〓m=i |Cln−ajn m(i)| (8) で定義される。また(7)式中のlとjの対応関係を
示す関数j(l)には、つぎのような条件が仮定され
る。
照合される入力パターンのi番目の部分パターン
であつて、第1図に示すように、b(i)からe(i)ま
での特徴ベクトルにより表わされ、 C(b(i),e(i)=((Cb(i),(Cb(i)+1,……,
(Ce(i)), (6) 1≦b(i)≦e(i)≦I で定義される。またD(C(b(i),e(i),An(i))
は、部分パターンC(b(i),e(i))と標準パター
ンAn(i)との間の距離であつて、 D(C(b(i),e(i)),An(i),)=mine(i) 〓j=j(l)l=b(i) d
((Cl,a(j n(i)) (7) で定義される。ここで、d((Cl,a(j n(i))は特徴
ベクトル(Clおよびa(j n(i)間の距離であつて、 d((Cl,a(j n(i))=M 〓m=i |Cln−ajn m(i)| (8) で定義される。また(7)式中のlとjの対応関係を
示す関数j(l)には、つぎのような条件が仮定され
る。
j(l+1)(−{j(l),j(l)+1,j(l)+2}
(9) j(b(i)=1,j(e(i))=Jn(i) (10) l−R≦j(l)≦l+R(Rはある定数) (11) i(l)=j(l+1)のときj(l+1)=j(l)−
1 (12) さらに部分パターンC(b(i),e(i)の始点b(i)
と終点e(i)に対しては、kを連続する標準パター
ン数すなわち部分パターン数として、つぎのよう
な条件を仮定する。
(9) j(b(i)=1,j(e(i))=Jn(i) (10) l−R≦j(l)≦l+R(Rはある定数) (11) i(l)=j(l+1)のときj(l+1)=j(l)−
1 (12) さらに部分パターンC(b(i),e(i)の始点b(i)
と終点e(i)に対しては、kを連続する標準パター
ン数すなわち部分パターン数として、つぎのよう
な条件を仮定する。
b(i)=e(i−1)+1,j=2,3,……,k
(13) b(1)=1,e(k)=I (13)の条件は、第1図にしたがつて既に述べ
たように、任意の相隣る2つの部分パターンの端
点が、連続して配置されていることを表わしてい
る。
(13) b(1)=1,e(k)=I (13)の条件は、第1図にしたがつて既に述べ
たように、任意の相隣る2つの部分パターンの端
点が、連続して配置されていることを表わしてい
る。
以上が、従来の連続単語音声認識方法の概要で
ある。
ある。
本発明の原理は、相隣る2つの部分パターンの
端部に対する条件(13)を変更して、両方の端部
同士について、一定範囲内での重複(重なり合
い)と離隔の関係を認めることにより、入力パタ
ーンの単語境界に関しての多様さに対して、認識
性能の改善を図るものである。
端部に対する条件(13)を変更して、両方の端部
同士について、一定範囲内での重複(重なり合
い)と離隔の関係を認めることにより、入力パタ
ーンの単語境界に関しての多様さに対して、認識
性能の改善を図るものである。
相隣る2つの部分パターンの端部同士間に、予
め定められた長さP以下の範囲での重複を認める
場合の条件は、次の通りである。
め定められた長さP以下の範囲での重複を認める
場合の条件は、次の通りである。
e(i−1)−P≦b(i)≦e(i−1)+1 (13)′
i=2,3,……,k
第2図は、この条件の下での部分パターンと標準
パターンとのマツチングの例を示したものであ
る。
パターンとのマツチングの例を示したものであ
る。
また、相隣る2つの部分パターンの端部同士間
に、予め定められた長さQ以下の範囲での離隔を
認める場合の条件は、次の通りである。
に、予め定められた長さQ以下の範囲での離隔を
認める場合の条件は、次の通りである。
e(i−1)+1≦b(i)≦e(i−1)+Q (13)″
i=2,3,……,k
第3図は、この条件にもとづくパターンマツチン
グの例である。
グの例である。
更に上記Pの範囲の重複と、Qの範囲の離隔を
ともに認める場合の条件は、(13)′および
(13)″を合成することにより得られ、次のように
表わされる。
ともに認める場合の条件は、(13)′および
(13)″を合成することにより得られ、次のように
表わされる。
e(i−1)−P≦b(i)≦e(i−1)+Q (13)
i=2,3,……,k
第4図は、この条件にもとづくパターンマツチン
グの例である。
グの例である。
本発明は、隣接する2つの部分パターンの端部
に対する上記した条件(13)′,(13)″,(13)
のいずれかと(14)式のもとで、入力パターンと
標準パターン系列との間の距離(5)式を最小にする
ような、k,{n(i),b(i),e(i),i=1,2,
……,k}を求め、それらを認識結果とするもの
である。ただし、標準パターン数すなわち部分パ
ターン数kは1≦k≦K(Kはある定数)であり、
n(i)は選択された標準パターンの番号を示す。
に対する上記した条件(13)′,(13)″,(13)
のいずれかと(14)式のもとで、入力パターンと
標準パターン系列との間の距離(5)式を最小にする
ような、k,{n(i),b(i),e(i),i=1,2,
……,k}を求め、それらを認識結果とするもの
である。ただし、標準パターン数すなわち部分パ
ターン数kは1≦k≦K(Kはある定数)であり、
n(i)は選択された標準パターンの番号を示す。
また、従来の2段DPマツチング法では、入力
パターンと標準パターン系列との間の距離が(5)式 S=K 〓i=1 (C(b(i),e(i)),An(i)) (14) で定義されているが、この式による距離Sは、部
分パターンの長さと標準パターンの個数とに依存
する性質をもつているため、前記(13)′,
(13)″,(13)のように、拡張された条件のも
とでのパターンマツチングのための評価関数とし
て使用するには、その特性が十分ではない。そこ
で、(5)式を、部分パターンの長さと標準パターン
の個数で平均した正規化距離 S′=1/kK 〓 〓i=1 D(C(b(i),e(i),An(i))/e(i)−b(i)+1
(15) を導入する。
パターンと標準パターン系列との間の距離が(5)式 S=K 〓i=1 (C(b(i),e(i)),An(i)) (14) で定義されているが、この式による距離Sは、部
分パターンの長さと標準パターンの個数とに依存
する性質をもつているため、前記(13)′,
(13)″,(13)のように、拡張された条件のも
とでのパターンマツチングのための評価関数とし
て使用するには、その特性が十分ではない。そこ
で、(5)式を、部分パターンの長さと標準パターン
の個数で平均した正規化距離 S′=1/kK 〓 〓i=1 D(C(b(i),e(i),An(i))/e(i)−b(i)+1
(15) を導入する。
次に、条件(13)と(14)式のもとで、距離
(15)式を最小にするk,{n(i),b(i),e(i),i
=1,2,……,k}を求める手順について述べ
る。
(15)式を最小にするk,{n(i),b(i),e(i),i
=1,2,……,k}を求める手順について述べ
る。
(15)式の最小化問題は、つぎの3つのステツ
プに分けて考えることができる。
プに分けて考えることができる。
min
1≦k≦K,
n(i),b(i),e(i)
i=1,2,……,kS=min
1≦k≦
K1/kSk (16) Sk=min b(i),e(i−1), i=2,3,……,kk 〓i=1 D^(b(i),e(i) (17) D^(b(i),e(i))=1/e(i)−b(i)+1min 1≦
n(i)≦N D(C(b(i),e(i)),e(i)),An(i
))(18) このことを利用して、計算手順をつぎのようにす
る。
K1/kSk (16) Sk=min b(i),e(i−1), i=2,3,……,kk 〓i=1 D^(b(i),e(i) (17) D^(b(i),e(i))=1/e(i)−b(i)+1min 1≦
n(i)≦N D(C(b(i),e(i)),e(i)),An(i
))(18) このことを利用して、計算手順をつぎのようにす
る。
まず、各b,e,nについて、(1≦b≦e≦
I,1≦n≦N),D(C(b,e),An)を求め
る。これには動的計画法が利用でき、つぎのよう
に求めることができる。
I,1≦n≦N),D(C(b,e),An)を求め
る。これには動的計画法が利用でき、つぎのよう
に求めることができる。
g(b,1)=d((Cb,a(1 n) (19)■
を初期値として、漸化式
g(l,j)=d((Cl,a(j n)+ming(l−2
,j−1)+d((Cl-1,a(j n) g(l−1),j−1) g(l−1,j−2) を、 b≦l≦e, 1≦j≦Jn (21) l−R≦j(l)≦l+R (22) の範囲で順次計算すると、次式で与えられる。
,j−1)+d((Cl-1,a(j n) g(l−1),j−1) g(l−1,j−2) を、 b≦l≦e, 1≦j≦Jn (21) l−R≦j(l)≦l+R (22) の範囲で順次計算すると、次式で与えられる。
D(C(b,e),Ao)=g(e,Jn) (23)
そこで、各C(b,e)について、D(C(b,
e),An)/(e−b+1)の最小値D^(b,e)
と、そのときの標準パターンの番号^N(b,e)
を求め表を作成する。
e),An)/(e−b+1)の最小値D^(b,e)
と、そのときの標準パターンの番号^N(b,e)
を求め表を作成する。
つぎに、k=1,2,……,Kに対して、(17)
式のSKを計算する。これに対しても動的計画法
が利用できる。すなわち、長さが0で、部分パタ
ーン数が0の場合の S0(0)=0 (24) を初期値とし、漸化式 Si(e(i))=min b(i),e(i−1) b(i),e(i−1) e(i−1)−P≦b(i)≦e(i−1)+Q〔D^(b(
i),e(i))Si-1(e(i−1))〕(25) を、 i=1,2,……,k e(i)=1,2,…
…,I (26) の範囲で順次計算すると、次式で与えられる。
式のSKを計算する。これに対しても動的計画法
が利用できる。すなわち、長さが0で、部分パタ
ーン数が0の場合の S0(0)=0 (24) を初期値とし、漸化式 Si(e(i))=min b(i),e(i−1) b(i),e(i−1) e(i−1)−P≦b(i)≦e(i−1)+Q〔D^(b(
i),e(i))Si-1(e(i−1))〕(25) を、 i=1,2,……,k e(i)=1,2,…
…,I (26) の範囲で順次計算すると、次式で与えられる。
Sk=Sk(I) (27)
ここで、(25)式を計算するときには、各iと
e(i)について、〔D^(b(i),e(i))+Si−1(e(
i
−1))〕を最小にするe(i−1)とb(i)をそれ
ぞれEi(e(i)),Bi(e(i))として表を作成し、記
憶しておく。
e(i)について、〔D^(b(i),e(i))+Si−1(e(
i
−1))〕を最小にするe(i−1)とb(i)をそれ
ぞれEi(e(i)),Bi(e(i))として表を作成し、記
憶しておく。
すべてのk=1,2,……,KについてSkが
求まると、Sk/kを最小にするk=^kが求ま
る。この^kから最適な{^b(i),^e(i),i=
1,2,……,^k}は、つぎのようにして求め
られる。すなわち ^e(^k)=I (28) を初期値としてi=^k,^k−1,……,2に
ついて、漸化式 ^b(i)=Bi(^e(i)) (29) ^e(i−1)=Ei(^e(i)) (30) によつて^b^(k),^e(^k−1),……,^b
(2),^e(1)を得る。ただし^b(1)=1である。
求まると、Sk/kを最小にするk=^kが求ま
る。この^kから最適な{^b(i),^e(i),i=
1,2,……,^k}は、つぎのようにして求め
られる。すなわち ^e(^k)=I (28) を初期値としてi=^k,^k−1,……,2に
ついて、漸化式 ^b(i)=Bi(^e(i)) (29) ^e(i−1)=Ei(^e(i)) (30) によつて^b^(k),^e(^k−1),……,^b
(2),^e(1)を得る。ただし^b(1)=1である。
このようにして、{^b(i),^e(i),i=1,
2,……,^k}が求まると、{^N(b,e)}
の表から最適な単語系列{^n(i),i=1,2,
……,^k}が、 ^n(i)=^N(^b(i),^e(i)),i=1,2,
……,^k (31) により求められる。
2,……,^k}が求まると、{^N(b,e)}
の表から最適な単語系列{^n(i),i=1,2,
……,^k}が、 ^n(i)=^N(^b(i),^e(i)),i=1,2,
……,^k (31) により求められる。
次に、上述した本発明の原理を応用した実施例
を第5図を用いて説明する。
を第5図を用いて説明する。
同図において、1は入力パターン保持部、2は
標準パターン保持部、3は部分パターン保持部、
4はベクトル間距離レジスタ、5は(8)式で表わさ
れるベクトル間距離を計算するベクトル間距離計
算部、6は第1加算回路、7は第1最小値選択回
路、8は第2加算回路、9は(20)式で表わされ
る累積距離を記憶する累積距離レジスタ、10は
(7)式で表わされるパターン間距離を記憶する第1
パターン間距離レジスタ、11は第1除算回路、
12は第2最小値選択回路、13は標準パターン
番号レジスタ、14は(18)式で表わされるパタ
ーン間距離レジスタ、15は第3加算回路、16
は(17)式で表わされるパターン系列間距離を記
憶するパターン系列間距離レジスタ、17は第3
最小値選択回路、18は第2除算回路、19は始
点レジスタ、20は始点レジスタ、21は第4最
小値選択回路、22は最適な部分パターンの始点
と終点を計算するパターン端点計算部、23は最
適な標準パターンの番号を計算する標準パターン
番号計算部である。
標準パターン保持部、3は部分パターン保持部、
4はベクトル間距離レジスタ、5は(8)式で表わさ
れるベクトル間距離を計算するベクトル間距離計
算部、6は第1加算回路、7は第1最小値選択回
路、8は第2加算回路、9は(20)式で表わされ
る累積距離を記憶する累積距離レジスタ、10は
(7)式で表わされるパターン間距離を記憶する第1
パターン間距離レジスタ、11は第1除算回路、
12は第2最小値選択回路、13は標準パターン
番号レジスタ、14は(18)式で表わされるパタ
ーン間距離レジスタ、15は第3加算回路、16
は(17)式で表わされるパターン系列間距離を記
憶するパターン系列間距離レジスタ、17は第3
最小値選択回路、18は第2除算回路、19は始
点レジスタ、20は始点レジスタ、21は第4最
小値選択回路、22は最適な部分パターンの始点
と終点を計算するパターン端点計算部、23は最
適な標準パターンの番号を計算する標準パターン
番号計算部である。
入力パターン保持部1は、(3)式で表わされる入
力パターンを保持し、標準パターン保持部2は、
(1)式で表わされる標準パターンを保持する。部分
パターン保持部3は、(6)式で定義されるような部
分パターンを保持する。ベクトル間距離計算部5
は、標準パターン保持部2から読み出されるa(j
nと部分パターン保持部3から読み出される(Cl
との間の距離d((Cl,a(j n)を(8)式のように計算
する。
力パターンを保持し、標準パターン保持部2は、
(1)式で表わされる標準パターンを保持する。部分
パターン保持部3は、(6)式で定義されるような部
分パターンを保持する。ベクトル間距離計算部5
は、標準パターン保持部2から読み出されるa(j
nと部分パターン保持部3から読み出される(Cl
との間の距離d((Cl,a(j n)を(8)式のように計算
する。
ベクトル間距離レジスタ4は、計算部5で計算
されるd((Cl,a(j n)を記憶する。第1加算回路
6は、レジスタ4から読み出されるd((Cl-1,a
(j n)と、累積距離レジスタ9から読み出される
g(l−2,j−1)との和を出力する。第1最
小値選択回路7は、第1加算回路6の出力g(l
−2,j−1)+d((Cl-1,a(j n)と、レジスタ
9から読み出されるg(l−1,j−1)および
g(l−1,j−2)の中から最小値を選びそれ
を出力する。
されるd((Cl,a(j n)を記憶する。第1加算回路
6は、レジスタ4から読み出されるd((Cl-1,a
(j n)と、累積距離レジスタ9から読み出される
g(l−2,j−1)との和を出力する。第1最
小値選択回路7は、第1加算回路6の出力g(l
−2,j−1)+d((Cl-1,a(j n)と、レジスタ
9から読み出されるg(l−1,j−1)および
g(l−1,j−2)の中から最小値を選びそれ
を出力する。
第2加算回路8は、7から出力される値と、計
算部5から出力されるd((Cl,a(j n)との和を出
力する。レジスタ9は加算回路8の出力をg(l,
j)として記憶する。第1パターン間距離レジス
タ10は、レジスタ9から読み出されるg(e,
Jn)を(23)式で示されるように、D(C(b,
e),An)として記憶する。以上の手順を各b,
e,nについて行う(1≦b≦e≦I,1≦n≦
N)。
算部5から出力されるd((Cl,a(j n)との和を出
力する。レジスタ9は加算回路8の出力をg(l,
j)として記憶する。第1パターン間距離レジス
タ10は、レジスタ9から読み出されるg(e,
Jn)を(23)式で示されるように、D(C(b,
e),An)として記憶する。以上の手順を各b,
e,nについて行う(1≦b≦e≦I,1≦n≦
N)。
第1除算回路11は、レジスタ10から読み出
されるD(C(b,e),An)を、部分パターンの
長さ(e−b+1)で除した値を出力する。第2
最小値選択回路12は、第1除算回路11から出
力されるD(b,e),An)/(e−b+1)を、
各nについて比較し、その最小値D^(b,e)と
そのときのnの値^N(b,e)を出力する。
されるD(C(b,e),An)を、部分パターンの
長さ(e−b+1)で除した値を出力する。第2
最小値選択回路12は、第1除算回路11から出
力されるD(b,e),An)/(e−b+1)を、
各nについて比較し、その最小値D^(b,e)と
そのときのnの値^N(b,e)を出力する。
標準パターン番号レジスタ13は、選択回路1
2の出力^N(b,e)を記憶し、第2パターン
間距離レジスタ14は、出力D^(b,e)を記憶
する。このようにして、各bとeに対してD^(b,
e),^N(b,e)を求める。
2の出力^N(b,e)を記憶し、第2パターン
間距離レジスタ14は、出力D^(b,e)を記憶
する。このようにして、各bとeに対してD^(b,
e),^N(b,e)を求める。
第3加算回路15はレジスタ14から読み出さ
れるD^(b(i),e)と、パターン系列間距離レジ
スタから読み出されるSi−1(e(i−1))との
和を出力する。第3最小値選択回路17は、加算
回路15の出力D^(b(i),e)+Si−1(e(i−
1))の最小値を(13)式の範囲内で求め、そ
の値Si(e)を出力する。これを各i=1,2,…
…,kと、各e=1,2,……,Iについて行な
う。
れるD^(b(i),e)と、パターン系列間距離レジ
スタから読み出されるSi−1(e(i−1))との
和を出力する。第3最小値選択回路17は、加算
回路15の出力D^(b(i),e)+Si−1(e(i−
1))の最小値を(13)式の範囲内で求め、そ
の値Si(e)を出力する。これを各i=1,2,…
…,kと、各e=1,2,……,Iについて行な
う。
始点レジスタ19と終点レジスタ20は、選択
回路17において最小値が求まつたときのb(i)と
e(i−1)との値をそれぞれBi(e),Ei(e)として
記憶する。第2除算回路18は、レジスタ16か
ら読み出されるSk(I)をkで除した値を出力す
る。
回路17において最小値が求まつたときのb(i)と
e(i−1)との値をそれぞれBi(e),Ei(e)として
記憶する。第2除算回路18は、レジスタ16か
ら読み出されるSk(I)をkで除した値を出力す
る。
第3最小値選択回路21は、除算回路18の出
力Sk(I)/kの値を各kについて比較し、それ
が最小となるときのkを^kとして出力する。パ
ターン端点計算部22は選択回路21から出力さ
れる^kをもとに、レジスタ19と20から読み
出されるBi(e),Ei(e)を、(29)(30)式のように
利用して、最適な部分パターンの始点^b(i)と終
点^e(i)を各i=1,2,……,^kについて計
算する。標準パターン番号計算部23は、(31)
式にしたがつて、パターン端点計算部22から出
力される^b(i),^e(i)及びレジスタ13から読
み出される^N(b,e)を利用して、最適な標
準パターンの番号^n(i),i=1,2,……,^
kを出力する。
力Sk(I)/kの値を各kについて比較し、それ
が最小となるときのkを^kとして出力する。パ
ターン端点計算部22は選択回路21から出力さ
れる^kをもとに、レジスタ19と20から読み
出されるBi(e),Ei(e)を、(29)(30)式のように
利用して、最適な部分パターンの始点^b(i)と終
点^e(i)を各i=1,2,……,^kについて計
算する。標準パターン番号計算部23は、(31)
式にしたがつて、パターン端点計算部22から出
力される^b(i),^e(i)及びレジスタ13から読
み出される^N(b,e)を利用して、最適な標
準パターンの番号^n(i),i=1,2,……,^
kを出力する。
なお、条件(13)′あるいは(13)″を適用する
場合の実施例は、第5図の実施例から容易に導く
ことができる。
場合の実施例は、第5図の実施例から容易に導く
ことができる。
第6図に本発明の方法を応用した場合の認識結
果の1例を示す。同図において、入力音声は/
949/であり、26,27,28,29,30,31は本発明
方式による正しい認識結果/949/と、入力パタ
ーンのセグメンテーシヨンを示している。27と28
で表わされた標準パターンの重なりは調音結合に
対する効果を示し、29と30で表わされた標準パタ
ーンの引き離しは、無音区間に対する効果を示し
ている。32,33,34,35は、2段DPマツチング
法による誤つた認識結果/99/と入力パターンの
セグメンテーシヨンを示している。
果の1例を示す。同図において、入力音声は/
949/であり、26,27,28,29,30,31は本発明
方式による正しい認識結果/949/と、入力パタ
ーンのセグメンテーシヨンを示している。27と28
で表わされた標準パターンの重なりは調音結合に
対する効果を示し、29と30で表わされた標準パタ
ーンの引き離しは、無音区間に対する効果を示し
ている。32,33,34,35は、2段DPマツチング
法による誤つた認識結果/99/と入力パターンの
セグメンテーシヨンを示している。
なお、本実施例においては、特徴ベクトル間の
距離として、(8)式が用いられているが、他の距離
尺度を用いてもよい。また特徴ベクトル間の対応
を示す関数j(l)についての条件(9)〜(12)式およ
びパターン間距離D(C(b,e),An)の計算法
(19)乃至(23)式についても種々の方法が考え
られ、これらは本発明の範囲を限定するものでは
ない。
距離として、(8)式が用いられているが、他の距離
尺度を用いてもよい。また特徴ベクトル間の対応
を示す関数j(l)についての条件(9)〜(12)式およ
びパターン間距離D(C(b,e),An)の計算法
(19)乃至(23)式についても種々の方法が考え
られ、これらは本発明の範囲を限定するものでは
ない。
本発明によれば、連続単語音声中の単語境界で
の調音結合や単語長の短縮化、さらに無音区間な
どの影響による認識や、セグメンテーシヨンの誤
りを減少させることができる。
の調音結合や単語長の短縮化、さらに無音区間な
どの影響による認識や、セグメンテーシヨンの誤
りを減少させることができる。
第1図は従来方式による入力パターンの各部分
パターンと標準パターンとのマツチングの方法を
説明する図であり、第2図乃至第4図は本発明方
法における入力パターンの各部分パターンと標準
パターンとのマツチングの方法を説明する図であ
り、第5図は本発明の実施例を説明するブロツク
図である。第6図は本発明方法の応用例の認識結
果の一例を示す。 図中、Cは入力音声パターン、C(b(1),e(1))
乃至C(b(k),e(k))はその部分パターン、b(1)
乃至b(k)は各部分パターンの始点、e(1)乃至e(k)
は終点、An(1)乃至An(k)は標準パターン、nは標
準パターン番号、kは部分パターン数すなわち単
語数を表わす。
パターンと標準パターンとのマツチングの方法を
説明する図であり、第2図乃至第4図は本発明方
法における入力パターンの各部分パターンと標準
パターンとのマツチングの方法を説明する図であ
り、第5図は本発明の実施例を説明するブロツク
図である。第6図は本発明方法の応用例の認識結
果の一例を示す。 図中、Cは入力音声パターン、C(b(1),e(1))
乃至C(b(k),e(k))はその部分パターン、b(1)
乃至b(k)は各部分パターンの始点、e(1)乃至e(k)
は終点、An(1)乃至An(k)は標準パターン、nは標
準パターン番号、kは部分パターン数すなわち単
語数を表わす。
Claims (1)
- 【特許請求の範囲】 1 複数個の単語を連続して発声した未知入力音
声を分析して得られた音響的特徴を表わす入力パ
ターンの各部分に、前以つて記憶しておいた単語
音声の標準パターンを必要な個数だけマツチング
させる音声認識方法において、上記マツチング
は、各隣り合う標準パターンの端部同士が、単一
の境界で連接している場合と重複している場合と
を対象に各端部を削除することなく行ない、それ
により入力パターンとの距離が最も小さくなる標
準パターン系列を求め、得られた標準パターン系
列に対応する単語系列を認識結果として出力する
ことを特徴とする連続単語音声認識方法。 2 前記第1項に記載の発明において、入力パタ
ーンと標準パターン系列との距離が、入力パター
ンの各部分にマツチングされる標準パターンの個
数と、各標準パターンがマツチングする入力パタ
ーンの長さとを用いて正規化されることを特徴と
する連続単語音声認識方法。 3 複数個の単語を連続して発声した未知入力音
声を分析して得られた音響的特徴を表わす入力パ
ターンの各部分に、前以つて記憶しておいた単語
音声の標準パターンを必要な個数だけマツチング
させる音声認識方法において、上記マツチング
は、各隣り合う標準パターンの端部同士が、単一
の境界で連接している場合と離隔している場合と
を対象に各端部を削除することなく行ない、それ
により入力パターンとの距離が最も小さくなる標
準パターン系列を求め、得られた標準パターン系
列に対応する単語系列を認識結果として出力する
ことを特徴とする連続単語音声認識方法。 4 前記第3項に記載の発明において、入力パタ
ーンと標準パターン系列との距離が、入力パター
ンの各部分にマツチングされる標準パターンの個
数と、各標準パターンがマツチングする入力パタ
ーンの長さとを用いて正規化されることを特徴と
する連続単語音声認識方法。 5 複数個の単語を連続して発声した未知入力音
声を分析して得られた音響的特徴を表わす入力パ
ターンの各部分に、前以つて記憶しておいた単語
音声の標準パターンを必要な個数だけマツチング
させる音声認識方法において、上記マツチング
は、各隣り合う標準パターンの端部同士が、単一
の境界で連接している場合と重複および離隔して
いる場合とを対象に各端部を削除することなく行
ない、それにより入力パターンとの距離が最も小
さくなる標準パターン系列を求め、得られた標準
パターン系列に対応する単語系列を認識結果とし
て出力することを特徴とする連続単語音声認識方
法。 6 前記第5項に記載の発明において、入力パタ
ーンと標準パターン系列との距離が、入力パター
ンの各部分にマツチングされる標準パターンの個
数と、各標準パターンがマツチングする入力パタ
ーンの長さとを用いて正規化されることを特徴と
する連続単語音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23188982A JPS59124387A (ja) | 1982-12-29 | 1982-12-29 | 連続単語音声認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23188982A JPS59124387A (ja) | 1982-12-29 | 1982-12-29 | 連続単語音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS59124387A JPS59124387A (ja) | 1984-07-18 |
JPH0436400B2 true JPH0436400B2 (ja) | 1992-06-16 |
Family
ID=16930614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP23188982A Granted JPS59124387A (ja) | 1982-12-29 | 1982-12-29 | 連続単語音声認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59124387A (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59172693A (ja) * | 1983-03-22 | 1984-09-29 | 富士通株式会社 | 連続単語音声認識方法 |
JPS59172692A (ja) * | 1983-03-22 | 1984-09-29 | 富士通株式会社 | 連続単語音声認識方法 |
JPS61180295A (ja) * | 1985-02-05 | 1986-08-12 | 富士通株式会社 | 連続音節認識方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5972578A (ja) * | 1982-10-19 | 1984-04-24 | Matsushita Electric Ind Co Ltd | パタ−ン比較装置 |
-
1982
- 1982-12-29 JP JP23188982A patent/JPS59124387A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5972578A (ja) * | 1982-10-19 | 1984-04-24 | Matsushita Electric Ind Co Ltd | パタ−ン比較装置 |
Also Published As
Publication number | Publication date |
---|---|
JPS59124387A (ja) | 1984-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH07334184A (ja) | 音響カテゴリ平均値計算装置及び適応化装置 | |
JPS5885499A (ja) | 連続音声認識装置 | |
JPS6024994B2 (ja) | パタ−ン類似度計算方式 | |
JPH0436400B2 (ja) | ||
JPH0251518B2 (ja) | ||
JPH0251519B2 (ja) | ||
US5956677A (en) | Speech recognizer having a speech data memory storing speech data and a reference pattern memory storing partial symbol trains of words for recognition | |
JPS62144200A (ja) | 連続音声認識装置 | |
JP3348735B2 (ja) | パターン照合方式 | |
JPH024919B2 (ja) | ||
JP3226716B2 (ja) | 音声認識装置 | |
JPH0223876B2 (ja) | ||
JP2785939B2 (ja) | 連続音声認識装置 | |
JPS5972578A (ja) | パタ−ン比較装置 | |
JPH0247758B2 (ja) | ||
JPH0449720B2 (ja) | ||
JPS59127098A (ja) | 連続単語音声認識装置 | |
JPH0449954B2 (ja) | ||
JPH0565908B2 (ja) | ||
JPS60159798A (ja) | 音声認識装置 | |
JPS592954B2 (ja) | パタンルイジドケイサンソウチ | |
JPH0574836B2 (ja) | ||
JPS62250498A (ja) | 連続単語音声認識装置 | |
JPH0134399B2 (ja) | ||
JPS61105598A (ja) | 連続音声認識装置 |