JPS5945583A - パタンマッチング装置 - Google Patents
パタンマッチング装置Info
- Publication number
- JPS5945583A JPS5945583A JP57154903A JP15490382A JPS5945583A JP S5945583 A JPS5945583 A JP S5945583A JP 57154903 A JP57154903 A JP 57154903A JP 15490382 A JP15490382 A JP 15490382A JP S5945583 A JPS5945583 A JP S5945583A
- Authority
- JP
- Japan
- Prior art keywords
- matching
- integral
- standard
- pattern
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 6
- 241001175904 Labeo bata Species 0.000 description 3
- 241001417495 Serranidae Species 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 241000288673 Chiroptera Species 0.000 description 2
- 241001441724 Tetraodontidae Species 0.000 description 1
- 235000014121 butter Nutrition 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- CJRQAPHWCGEATR-UHFFFAOYSA-N n-methyl-n-prop-2-ynylbutan-2-amine Chemical compound CCC(C)N(C)CC#C CJRQAPHWCGEATR-UHFFFAOYSA-N 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 235000014347 soups Nutrition 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 230000002747 voluntary effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/12—Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は音声バタンのような特徴ベクトルの系列として
表わされるバタ/の比較を行うバタンマツチフグ装置の
改良に関する。
表わされるバタ/の比較を行うバタンマツチフグ装置の
改良に関する。
パタ/認識の方法として認識すべきパタノ七あらかじめ
標準パタ/として登録しておき、認識時に入力される未
知バタンf標準バタンと比較し最も距離の小さいものt
−g識結果として決定するパタlマツチ/グ法は従来か
ら広くから用いられている。
標準パタ/として登録しておき、認識時に入力される未
知バタンf標準バタンと比較し最も距離の小さいものt
−g識結果として決定するパタlマツチ/グ法は従来か
ら広くから用いられている。
音声バタンのように特徴ベクトルの時系列として表わさ
れるバタンでは発声速度の変動のような時間的な変動に
対処することが重要であるが、動的計画法を利用しt時
間軸正規化マツチlグ法(日本音字会誌Vo1.27A
9 P 483 、 以下DP法と称す)は非常に有
効な方法として離散単語認識。
れるバタンでは発声速度の変動のような時間的な変動に
対処することが重要であるが、動的計画法を利用しt時
間軸正規化マツチlグ法(日本音字会誌Vo1.27A
9 P 483 、 以下DP法と称す)は非常に有
効な方法として離散単語認識。
連続単語認識等に広く実用に供されている。
DP法は、また連続音声認識への適用も【1能である。
日本語は、音節の系列として表わされるが。
通常9日本語の音節は子fHU)と母音(■とから構成
されている。したがって入力された汁声f(CVCV・
・・・、、CVの系列とみなすことが可能である。この
と@、CVパタンや■CVパタ/1t、−棟の単語トシ
て扱うことにすれば、Cv標準パタ/やvCV標準パタ
/を用いて従来の連続′単語認識の方式(例えば前掲文
献)を適用することができる。
されている。したがって入力された汁声f(CVCV・
・・・、、CVの系列とみなすことが可能である。この
と@、CVパタンや■CVパタ/1t、−棟の単語トシ
て扱うことにすれば、Cv標準パタ/やvCV標準パタ
/を用いて従来の連続′単語認識の方式(例えば前掲文
献)を適用することができる。
この場合、標準バタ/の用意の方法として次のようなも
のが一般に考えられる。
のが一般に考えられる。
(1)CVパタンを用意する。この場合には、標準パタ
ン数は少くてすむが、 V−+Cへの変化を記述する標
準パタ/が用意されないので、認識精度が下がることが
予想される。ま之、一般に連続音声中で子音の開始点を
見出すことは必ずしも容易でないので、標準バタンとの
マツチング全行う区間を決定するのが難しい。
ン数は少くてすむが、 V−+Cへの変化を記述する標
準パタ/が用意されないので、認識精度が下がることが
予想される。ま之、一般に連続音声中で子音の開始点を
見出すことは必ずしも容易でないので、標準バタンとの
マツチング全行う区間を決定するのが難しい。
(21VCVパタンを用意する。この場合には標準バタ
:/7は■→C,C→■への両方の変化を記述している
ので高い認識精度が期待できるが。
:/7は■→C,C→■への両方の変化を記述している
ので高い認識精度が期待できるが。
VCVパタンの種類は非常に多いので、標準バタンの登
録の負担、記憶容量、処理量の負担が犬きくなる。
録の負担、記憶容量、処理量の負担が犬きくなる。
−ま窺、マツチング区間の境界は母音であるので。
入力音Ib中の母音を見出すことができれば、これより
マツチング区間’KW易に決定することができる。
マツチング区間’KW易に決定することができる。
(3)evバメン及びVCパタ/を用意する。この場合
には(2)と同様高い認識精度が期待でき、まfc標準
パタンの種類もに)より少なくてすむ。反面VCに相轟
する区間忙切り出すことViW易ではない。
には(2)と同様高い認識精度が期待でき、まfc標準
パタンの種類もに)より少なくてすむ。反面VCに相轟
する区間忙切り出すことViW易ではない。
上記の方法はいずれもそれぞれ長所、短所tもっている
が、(3)の方法において■→Cへの変化を記述するた
めのバタンとしてVCバタンのかわりに■C■バタンを
用い、VCVパタンのVC部分とCvバタンを接続した
バタンを用いでVCV’i単位としたマツチングを行う
ことができれば、認誠利度の点でも、標準バタンの登録
の負担、記憶容量処理量の点でも1寸たマツチング区間
の切り出しやすさの点でも後れたマツチフグが実現され
る。
が、(3)の方法において■→Cへの変化を記述するた
めのバタンとしてVCバタンのかわりに■C■バタンを
用い、VCVパタンのVC部分とCvバタンを接続した
バタンを用いでVCV’i単位としたマツチングを行う
ことができれば、認誠利度の点でも、標準バタンの登録
の負担、記憶容量処理量の点でも1寸たマツチング区間
の切り出しやすさの点でも後れたマツチフグが実現され
る。
本発明は、標準バタンとしてeVパタ/及び−・部のv
Cvバタンを用意し、vevを学位としたマツチング区
間うことにより、マツチング区間川の切り出しが容易で
あり、かつ4慎準パタ/登録の工1担、記憶按箪、処理
量とも少ないパタ/マツチ/グ装置を提供すること上目
的としている。
Cvバタンを用意し、vevを学位としたマツチング区
間うことにより、マツチング区間川の切り出しが容易で
あり、かつ4慎準パタ/登録の工1担、記憶按箪、処理
量とも少ないパタ/マツチ/グ装置を提供すること上目
的としている。
VCV<単位としたマツチングでは人力廿声中の母音と
思われる部分y< v e v境界の候イ111とする
ことにより、マツチング区間ケ見出すことができる。今
、入力音声が特徴ベクトルの系列で表わされているとし
、入力音声から切出されたあるvCV区間の/l’J徴
ベクトル系列?(a(11、−、a(il 、−、a(
I) 1とする。また、このバタ/とマツチングを行な
う■C■バタンk V 1 * CV 2と表わす。
このとき標準バタンとしてvlcvの標準バタン(Vは
任ハ)及びCV2の標準バタ/が7114いられる。こ
れらのバタンは一般に複数個存在してよいが説明をわか
シやすくするため以下では、それぞれ1個のハタ/が存
在する場合を考える。VICVの標準ハタ/の特徴ベク
トル系列を 1b1(11,・・・、bIUl、・・・、 bt (
Jl) ICv2の標準ハタ/の特徴ベクトル系列金(
bz(11,・・・、 bz(jl、・・・、 bz
(J2) 1とする。
思われる部分y< v e v境界の候イ111とする
ことにより、マツチング区間ケ見出すことができる。今
、入力音声が特徴ベクトルの系列で表わされているとし
、入力音声から切出されたあるvCV区間の/l’J徴
ベクトル系列?(a(11、−、a(il 、−、a(
I) 1とする。また、このバタ/とマツチングを行な
う■C■バタンk V 1 * CV 2と表わす。
このとき標準バタンとしてvlcvの標準バタン(Vは
任ハ)及びCV2の標準バタ/が7114いられる。こ
れらのバタンは一般に複数個存在してよいが説明をわか
シやすくするため以下では、それぞれ1個のハタ/が存
在する場合を考える。VICVの標準ハタ/の特徴ベク
トル系列を 1b1(11,・・・、bIUl、・・・、 bt (
Jl) ICv2の標準ハタ/の特徴ベクトル系列金(
bz(11,・・・、 bz(jl、・・・、 bz
(J2) 1とする。
V I CV 211i V I CV ハタl (!
: CV 2 ハタ7 f 合成した形のハタ/であ
るからVICVパタ/の710部分とC■2パタンを接
続することにょ9マツチ・ソゲを行う。
: CV 2 ハタ7 f 合成した形のハタ/であ
るからVICVパタ/の710部分とC■2パタンを接
続することにょ9マツチ・ソゲを行う。
このため、まずvICvパタンに対しては正時間方向に
、cv2パタンに対しては逆時間方向にDPマツチング
を行う。すなわち特徴ベクトルa (i)とbl(j)
(又はbz(j))との距離d(i 、 j )に関す
る積分量について1次の漸化式を求める。
、cv2パタンに対しては逆時間方向にDPマツチング
を行う。すなわち特徴ベクトルa (i)とbl(j)
(又はbz(j))との距離d(i 、 j )に関す
る積分量について1次の漸化式を求める。
正時間方向の積分量g1(i、j)に関して、初期条件
IN(1,1)−”cll(1,1)として、漸化式1
式% 11 i = 1からi = Iまで順次求める。式(
1)はIxJl の時間点の格子上でど「51図(1
1に示す傾1(制限及び荷重で点(1,1)から点(1
,Jt)まで距離を積分することに対重ししている。
IN(1,1)−”cll(1,1)として、漸化式1
式% 11 i = 1からi = Iまで順次求める。式(
1)はIxJl の時間点の格子上でど「51図(1
1に示す傾1(制限及び荷重で点(1,1)から点(1
,Jt)まで距離を積分することに対重ししている。
また、逆時間方向の4′J(分1□+Hg2(i、j)
に[ダ1して、初期条件 g2(I、J2)二d2(1,J2) としてI’i
’=’l化式%式% f i = Iからi = 1までjll(次求める。
に[ダ1して、初期条件 g2(I、J2)二d2(1,J2) としてI’i
’=’l化式%式% f i = Iからi = 1までjll(次求める。
式(2)は第1図(2)に示す傾斜制限及び荷重で点(
L、J2)から点(1,1)まで距離′fr、積分する
ことに対応している。
L、J2)から点(1,1)まで距離′fr、積分する
ことに対応している。
次に上の2つのDPマツチングの結果忙結合することに
よりVICV2に対するマツチング結果を得る。このよ
うな正時間、逆時間のマツチングを結合する方法として
は逆DPマツチング法(日本音響学会講演論文集2−2
−18(1979,10月)参照)と呼ばれる方法があ
る。この方法は基本的には2単簡の連続単語認識のため
に提案された方法であり、入力の各時間点iにおいて、
正方向の積分量と逆方向の積分量の和 g’(市gl(t−Jl)+g2(i、1)
(31を求め、さらに g −msn g’(it
(41を求めることにより最適な(最小の)積分量を
もつ2単語系列全決定するものである。
よりVICV2に対するマツチング結果を得る。このよ
うな正時間、逆時間のマツチングを結合する方法として
は逆DPマツチング法(日本音響学会講演論文集2−2
−18(1979,10月)参照)と呼ばれる方法があ
る。この方法は基本的には2単簡の連続単語認識のため
に提案された方法であり、入力の各時間点iにおいて、
正方向の積分量と逆方向の積分量の和 g’(市gl(t−Jl)+g2(i、1)
(31を求め、さらに g −msn g’(it
(41を求めることにより最適な(最小の)積分量を
もつ2単語系列全決定するものである。
第2図は、この逆DPマツチ/グ法の原理を説明する几
めの図である。図より明らかなように式(3)は、入力
音声の第iフレームを単語境界としたときの正時間方向
マツチングの結果と逆時間方向のマツチングの結果との
和すなわち2単語系列とのマツチング結果となっている
。式(4)は、このような2単語系列とのマツチング結
果の中で距離の積分量が最小となる単語境界を見出すも
のである。
めの図である。図より明らかなように式(3)は、入力
音声の第iフレームを単語境界としたときの正時間方向
マツチングの結果と逆時間方向のマツチングの結果との
和すなわち2単語系列とのマツチング結果となっている
。式(4)は、このような2単語系列とのマツチング結
果の中で距離の積分量が最小となる単語境界を見出すも
のである。
しかしながら揃D Pマツチング法は2単語ノ連続とし
て認識することを]]的とし7でいるので。
て認識することを]]的とし7でいるので。
v1evパタ/とCV2 バタンとのマヴブーング結果
からvICv2パタンに74するマツチング結果を得る
ための方法とじでu、+戊ノir<f用ずろことQ、r
できない。tなわち逆」)1゛マツプ゛/グアノく乙・
旨用ずろとv1cvバクノの船端に(、’V2バクン
の始Vjtlik 従続したバタンと人力バタンとのマ
ツチングが行われてしまう。
からvICv2パタンに74するマツチング結果を得る
ための方法とじでu、+戊ノir<f用ずろことQ、r
できない。tなわち逆」)1゛マツプ゛/グアノく乙・
旨用ずろとv1cvバクノの船端に(、’V2バクン
の始Vjtlik 従続したバタンと人力バタンとのマ
ツチングが行われてしまう。
したかって本発明で1.、V、CVバタンについては終
端開放としVICVパタング)どの位置にC■2パタン
の始娼が接続し、ても工いようにする。
端開放としVICVパタング)どの位置にC■2パタン
の始娼が接続し、ても工いようにする。
すなわち、入力の各時間点iにおいてv 、 CVパタ
ンに対しては C■2バタンに対しては g2*(i)=g 2 (i 、 1 )
(61を求め、さらに g*=mi01 g1*(il+ g −(111(7
1によシ最適な積分量金求める。gli 3図に示すよ
うに式(5)は入力バタンの第1フレームより前の部分
と■lC■バタンHVICYパタン については終端開
放でマツチングさせた結果を示し9式(6)は入力バタ
ンの第1フレーム以降の部分とC■1バタン全両端固定
してマツチングさせた結果を示す。式(7)は入力バタ
ン全体と、終端開放としたVICVバタンと始端固定し
たC■2バタン を接続したものとの最適なマツチング
結果となっている。
ンに対しては C■2バタンに対しては g2*(i)=g 2 (i 、 1 )
(61を求め、さらに g*=mi01 g1*(il+ g −(111(7
1によシ最適な積分量金求める。gli 3図に示すよ
うに式(5)は入力バタンの第1フレームより前の部分
と■lC■バタンHVICYパタン については終端開
放でマツチングさせた結果を示し9式(6)は入力バタ
ンの第1フレーム以降の部分とC■1バタン全両端固定
してマツチングさせた結果を示す。式(7)は入力バタ
ン全体と、終端開放としたVICVバタンと始端固定し
たC■2バタン を接続したものとの最適なマツチング
結果となっている。
結局2本発明は従来の逆DPマツチング法に終端開放の
条件を新たに導入することにより、標準バタンとして存
在しない■C■パタンに対してもV CV 2単位とし
たマツチング企実現している。
条件を新たに導入することにより、標準バタンとして存
在しない■C■パタンに対してもV CV 2単位とし
たマツチング企実現している。
本発明による装置は特徴ベクトル系列として表わされる
へカバタンA”(a(1)、・・・*a(:+、・・・
。
へカバタンA”(a(1)、・・・*a(:+、・・・
。
a(ill を格納する入力バタン記憶部と、特徴ベク
トル系列として表わされる第1の標準バタンB1=(l
)l(11,・・・、 b 1(j)、−、b I C
Js) l 及び第2の標準バタ7 B 2:l b
2(1)、・・・−bz(jl、・・・、 b zG
Il l製格納する標準バタン記憶部と、指定されたi
。
トル系列として表わされる第1の標準バタンB1=(l
)l(11,・・・、 b 1(j)、−、b I C
Js) l 及び第2の標準バタ7 B 2:l b
2(1)、・・・−bz(jl、・・・、 b zG
Il l製格納する標準バタン記憶部と、指定されたi
。
jに対して特徴ベクトルa(ilとbl(jlないり、
b2Ulとの距19iIdk計算する距離計η、Bbと
、指定された(i、j)における距離の積分量g(i、
j) 孕現時点(i、j)の距離と:i/4去の距離
及び過去の積分量を用いて算出する順化式の@1′算を
、第1標準バタンに対しては(i、j)=(1,1)
から(I、J) まで正時111方向に行ない、3;
[2標準パタンに対しては(i 、j)=(1、、y
>から(1、]、 )まで逆時間方向に行ない秋分知、
の集合を得る漸化式計算部と、指定されたIにおける最
を槓多j鈑金。
b2Ulとの距19iIdk計算する距離計η、Bbと
、指定された(i、j)における距離の積分量g(i、
j) 孕現時点(i、j)の距離と:i/4去の距離
及び過去の積分量を用いて算出する順化式の@1′算を
、第1標準バタンに対しては(i、j)=(1,1)
から(I、J) まで正時111方向に行ない、3;
[2標準パタンに対しては(i 、j)=(1、、y
>から(1、]、 )まで逆時間方向に行ない秋分知、
の集合を得る漸化式計算部と、指定されたIにおける最
を槓多j鈑金。
正方向積分量に対しては前記により得られ几正方向積分
量の集合1g(i 、j)、j=1.J lのうちの最
小値として、−また逆方同種り]吊に対し、てl<j始
端(すなわちJ−1)のときの積分カi、g(i、1)
の値として算出する最適Kvt分量分量計色部上記正方
向最適積分量(gl(山i:=1.・・・、1)及び逆
方向最適積分量1g2(it、i二1.・・・、11金
賂納する最適積分量記憶部と、各iに対して正方向最適
積分量と逆方向最適積分量の和g*(il= g+ (
i l+ g□(nt界出し、これらの最小11区會求
めることにより入力バタンと標準バタンとの距陥+cバ
℃出するマ、チ/り距E准算出1述とを言んで6か成さ
れる。
量の集合1g(i 、j)、j=1.J lのうちの最
小値として、−また逆方同種り]吊に対し、てl<j始
端(すなわちJ−1)のときの積分カi、g(i、1)
の値として算出する最適Kvt分量分量計色部上記正方
向最適積分量(gl(山i:=1.・・・、1)及び逆
方向最適積分量1g2(it、i二1.・・・、11金
賂納する最適積分量記憶部と、各iに対して正方向最適
積分量と逆方向最適積分量の和g*(il= g+ (
i l+ g□(nt界出し、これらの最小11区會求
めることにより入力バタンと標準バタンとの距陥+cバ
℃出するマ、チ/り距E准算出1述とを言んで6か成さ
れる。
以下に本発明の原理2図1./IIを、l8j1′Aシ
て説明する。
て説明する。
、x 4 +aは本発明による装置の一夷尾・δ・1j
を示すブロック図で、ちる。入カバクツ記瓜都1.j1
標準バタン記1、低部2a、iル2標亭バタン記伝T≦
il 2 b b□こはそれ−Uれ人カバタンA、VI
CVバタン1」l。
を示すブロック図で、ちる。入カバクツ記瓜都1.j1
標準バタン記1、低部2a、iル2標亭バタン記伝T≦
il 2 b b□こはそれ−Uれ人カバタンA、VI
CVバタン1」l。
Cv2パタンB2の特徴ベクトル糸りIJ l a(1
) 、・・・。
) 、・・・。
a(ill 、 I b 1(1)、−、l)t (J
l)l 、 t bz(IL−。
l)l 、 t bz(IL−。
bz(J2))が洛矛内される。3はマルチプレクサで
制御部9の指定する制御信号により第1.第2標準バタ
ン記憶部2 a s 2 l)のいずれが’CS択する
。
制御部9の指定する制御信号により第1.第2標準バタ
ン記憶部2 a s 2 l)のいずれが’CS択する
。
4は距離計算部で漸化式計X部5により指定された凰、
jに対して距離d(i、j)を計算し結果を漸化式計算
部5へ出力する。漸化式計算部5は。
jに対して距離d(i、j)を計算し結果を漸化式計算
部5へ出力する。漸化式計算部5は。
制御信号かに=lのときは式(1)にょυ正方向上1公
量gi (’ y J ) ’fr、 I =11 J
−1がらi二1.」二J1まで計評し、に−2のときは
式(2)により連方向積分量g 2 (t・j)をi=
:1.j=J2 からi=1.j =liで計算する
。6は最適積分量計算部で、漸化式計算部5で計算され
た積分量から。
量gi (’ y J ) ’fr、 I =11 J
−1がらi二1.」二J1まで計評し、に−2のときは
式(2)により連方向積分量g 2 (t・j)をi=
:1.j=J2 からi=1.j =liで計算する
。6は最適積分量計算部で、漸化式計算部5で計算され
た積分量から。
制御信号に二1のときは式(5)を、1ぐ二2のときは
式(6)を用いて最適積分量1g1 (tl、−二1.
・・・。
式(6)を用いて最適積分量1g1 (tl、−二1.
・・・。
■)又はl g 2*(it、 i=1 、・・・、、
I)を計1フル、最適積分量記憶部7へ格納する。8ぐ
よマツチング距離算出部であり、最適積分世紀((1,
部7上の最〕1棋分量を読み出し1式(7)によりマツ
チング距離上11:出し、マツチング結果として出力す
る。9は制御部であり、椰1標準バタンと入力バタンと
の間で正方向1)Pマ、チングを、第2セ!に準バタン
と入力バタンの間で逆方向DPマツチングを11つよう
制御信号Kによって漸化式マルチプレクサ3計算部5及
び最適積分量計算部6をflillσ11する。
I)を計1フル、最適積分量記憶部7へ格納する。8ぐ
よマツチング距離算出部であり、最適積分世紀((1,
部7上の最〕1棋分量を読み出し1式(7)によりマツ
チング距離上11:出し、マツチング結果として出力す
る。9は制御部であり、椰1標準バタンと入力バタンと
の間で正方向1)Pマ、チングを、第2セ!に準バタン
と入力バタンの間で逆方向DPマツチングを11つよう
制御信号Kによって漸化式マルチプレクサ3計算部5及
び最適積分量計算部6をflillσ11する。
以上1本発明の原理を述べたが、DPの漸化式として非
対称形の式(1) 、 (2) を用いていた。l)P
の漸化式としてはこの他にも対称形のものがある。
対称形の式(1) 、 (2) を用いていた。l)P
の漸化式としてはこの他にも対称形のものがある。
例えば式(1)のかわpに
式(2)のかわりに
を用いることができる。
非対称形よりも対称形の方が高い認識性能を示すことが
実験的に確認されている(日本音響学会講演論文集P3
26(昭51 、io月)が、この場合には、積分量g
2*gi は入力バタン及び標準バタンの長さで正規
化する必要がある。通常両端固定のマツチングの場合に
は終端で得られた積分量を比較する2つのパタンの長さ
の和で正規化される。例えば比較する2つのバタンの長
さをそれぞれ1.Jとすると最終的にマツチング距離は
となる。同様の考え方を本発明に適用すると9例えば式
(7)のかわシに を用いる仁とができる。式(7′)では、入力バタンの
長さ、第1標準バタンの長さ、第2標準バタ/の長さの
荷重和で正〃L化が行われている6゜したがって、漸化
式(I′)及び(2′)を用いる場合には0本発明によ
る装置ではマツチング距離算出部は、各1における正方
向最適A″It分−ffflと逆方向最適Ui分員の和
g*(if 全入カバタン及び第1.第2標準パタンの
荷重和で除すことにより正規化した後これらの最小値を
求めるものとして(イイ成される。本発明はこのような
マツチング距離窮−出部を含むことによりより高い認識
性能を示す対称形L)Pマツチングを用いたバク/マツ
チング装置を提供することがoJ能となる。
実験的に確認されている(日本音響学会講演論文集P3
26(昭51 、io月)が、この場合には、積分量g
2*gi は入力バタン及び標準バタンの長さで正規
化する必要がある。通常両端固定のマツチングの場合に
は終端で得られた積分量を比較する2つのパタンの長さ
の和で正規化される。例えば比較する2つのバタンの長
さをそれぞれ1.Jとすると最終的にマツチング距離は
となる。同様の考え方を本発明に適用すると9例えば式
(7)のかわシに を用いる仁とができる。式(7′)では、入力バタンの
長さ、第1標準バタンの長さ、第2標準バタ/の長さの
荷重和で正〃L化が行われている6゜したがって、漸化
式(I′)及び(2′)を用いる場合には0本発明によ
る装置ではマツチング距離算出部は、各1における正方
向最適A″It分−ffflと逆方向最適Ui分員の和
g*(if 全入カバタン及び第1.第2標準パタンの
荷重和で除すことにより正規化した後これらの最小値を
求めるものとして(イイ成される。本発明はこのような
マツチング距離窮−出部を含むことによりより高い認識
性能を示す対称形L)Pマツチングを用いたバク/マツ
チング装置を提供することがoJ能となる。
第1図は本発明における漸化式の一例を示す図である。
第2図は逆DPマツチング法のJ東理を示す図である。
第3図は本発明の原理を示す図である。第4図は本発明
による一実施り1」を示すブロック図で2図中1.2a
、2bid記憶部、3ij−f#チブレクザ、4は距離
計算部、5は漸化式計算部。 6は最適積分量計算部、7は最適積分量記憶部。 8はマツチング距離算出部、9は制御部でおる。 第1図 (1) (2)とj、I)
L (1,1
)第2図 手続補正書(自発) 特許庁長官 殿 1、事件の表示 昭和57年 特 許 願第J 5
4903号2、発明の名称 バタンマツチング装置3
、補正をする者 事件との関係 出 願 人東京都港区芝I
1.1月133計1 ′j;。 (423) 日本電気株式会社 代表台 関本忠弘 4、代理人 (連絡先 11本電気株式会社特許部)5 補正の対象 明細iイの[l侍許、il’l求のR1iΣ囲」のfF
ij i、・よび明細ν[の「発明の詳細な説明」の(
1判。 6 補正の内容 (1)1特許請求の範囲」の欄を別紙のよ′)pこ補正
する。 (2) 明細書第6 LIE + 8 ’fj−目K
) u、 、 DV2jとあるのをl’ VICV
21と補正する。 (3)同第11頁第18行(」しくTI’1)7(J)
目とあるのを(bt(Jt)lJ と補止する、(4
) 同第12頁第11行目に1j==−1,Jj
とあるのを1−j=1.・・・、JJ々抽正するっ別
紙 2、特許請求の範囲 1、 特徴ベクトル系列として表わされる入カバタン人
=(a(11、−、a(+) 、 −、afl) l
を格納する入力バタン記憶部と、特徴ベクトル系列と(
7て表わされる第1の標準バタンBI=(J(1)、・
・・、b山)、・−、b、 (J+ )1及び第2の標
準バタンB2=(b2(1)、・・・、b2(j)−・
・・b2(J2))を格納する標準バタン記憶部と、指
定された1、」に対して特徴ベクトルa (ilとbl
(j)ないしb2Ulとの距離dを計算する距離計算部
と、指定された(i。 j)における距離の積分量gい、j)を現時点(i。 J)の距離と過去の距離及び過去の積分量を用いて算出
する漸化式の!″l算を、第1標準パタンに対しては(
i、j)=(1,1)から(1,、J )まで正時間方
向行ない、第2標準パタンに対しては(i、j)=(I
、J)から(] 、 I )fで逆時間方向知行ない積
分量の集合をイける漸化式計算部と、指定された1にお
ける最適積分量を、正方向積分量圧対しては前記により
得られた正方向積分量の集合(g(i、j)。 J=1.・・、Jlのうちの最小値とj、て1件だ逆方
向稍分量に対しては始端(ず2nわち3 =1 )のと
きの積分量g (i、])の値と(−で豹11ヒ1−Z
、最適積分′量計豹部と、)記正方向最滴情分仔(g+
fii、I −、−1。 ・・・、[)乃び逆方向最適請η楚fg2(i)、+−
1、−、J lを格納するJ符適第11(分骨記脩部シ
、各1に7j l、て正争 方向最適積分量と逆方向最適積’AIflyの和g(1
)・−g山1+g2(itを1り出11 これ11のh
↓小値を求めることにより人力バタンと標辺\バタソ2
の距P、1(をI)出するマツチング距離算出部とを含
んで11¥成シバ、ることを特徴とするバタンマツチン
グ装(1”; 。 2 上記マツチング距+1tr n山部d1各1に赴け
る正方向最適積分(f4と3v8方向J1σ滴債分11
」の和1ζ (1)を入力バタン及び第1.第2標jj
μバクンの長さの荷重和で除すことにより正規化した後
これらの最小値を求めることを特徴と一トる’l”f
j’f請求の範囲第1’fJAK記載のバタンマツチン
/’ L44 j、i’i。
による一実施り1」を示すブロック図で2図中1.2a
、2bid記憶部、3ij−f#チブレクザ、4は距離
計算部、5は漸化式計算部。 6は最適積分量計算部、7は最適積分量記憶部。 8はマツチング距離算出部、9は制御部でおる。 第1図 (1) (2)とj、I)
L (1,1
)第2図 手続補正書(自発) 特許庁長官 殿 1、事件の表示 昭和57年 特 許 願第J 5
4903号2、発明の名称 バタンマツチング装置3
、補正をする者 事件との関係 出 願 人東京都港区芝I
1.1月133計1 ′j;。 (423) 日本電気株式会社 代表台 関本忠弘 4、代理人 (連絡先 11本電気株式会社特許部)5 補正の対象 明細iイの[l侍許、il’l求のR1iΣ囲」のfF
ij i、・よび明細ν[の「発明の詳細な説明」の(
1判。 6 補正の内容 (1)1特許請求の範囲」の欄を別紙のよ′)pこ補正
する。 (2) 明細書第6 LIE + 8 ’fj−目K
) u、 、 DV2jとあるのをl’ VICV
21と補正する。 (3)同第11頁第18行(」しくTI’1)7(J)
目とあるのを(bt(Jt)lJ と補止する、(4
) 同第12頁第11行目に1j==−1,Jj
とあるのを1−j=1.・・・、JJ々抽正するっ別
紙 2、特許請求の範囲 1、 特徴ベクトル系列として表わされる入カバタン人
=(a(11、−、a(+) 、 −、afl) l
を格納する入力バタン記憶部と、特徴ベクトル系列と(
7て表わされる第1の標準バタンBI=(J(1)、・
・・、b山)、・−、b、 (J+ )1及び第2の標
準バタンB2=(b2(1)、・・・、b2(j)−・
・・b2(J2))を格納する標準バタン記憶部と、指
定された1、」に対して特徴ベクトルa (ilとbl
(j)ないしb2Ulとの距離dを計算する距離計算部
と、指定された(i。 j)における距離の積分量gい、j)を現時点(i。 J)の距離と過去の距離及び過去の積分量を用いて算出
する漸化式の!″l算を、第1標準パタンに対しては(
i、j)=(1,1)から(1,、J )まで正時間方
向行ない、第2標準パタンに対しては(i、j)=(I
、J)から(] 、 I )fで逆時間方向知行ない積
分量の集合をイける漸化式計算部と、指定された1にお
ける最適積分量を、正方向積分量圧対しては前記により
得られた正方向積分量の集合(g(i、j)。 J=1.・・、Jlのうちの最小値とj、て1件だ逆方
向稍分量に対しては始端(ず2nわち3 =1 )のと
きの積分量g (i、])の値と(−で豹11ヒ1−Z
、最適積分′量計豹部と、)記正方向最滴情分仔(g+
fii、I −、−1。 ・・・、[)乃び逆方向最適請η楚fg2(i)、+−
1、−、J lを格納するJ符適第11(分骨記脩部シ
、各1に7j l、て正争 方向最適積分量と逆方向最適積’AIflyの和g(1
)・−g山1+g2(itを1り出11 これ11のh
↓小値を求めることにより人力バタンと標辺\バタソ2
の距P、1(をI)出するマツチング距離算出部とを含
んで11¥成シバ、ることを特徴とするバタンマツチン
グ装(1”; 。 2 上記マツチング距+1tr n山部d1各1に赴け
る正方向最適積分(f4と3v8方向J1σ滴債分11
」の和1ζ (1)を入力バタン及び第1.第2標jj
μバクンの長さの荷重和で除すことにより正規化した後
これらの最小値を求めることを特徴と一トる’l”f
j’f請求の範囲第1’fJAK記載のバタンマツチン
/’ L44 j、i’i。
Claims (1)
- 【特許請求の範囲】 1、特徴ベクトル系列として表わされる入力バタンA=
l a(11,−、a(il、 −、a(II l’
i格納t ル入カパタノ記憶部と、特徴ベクトル系列と
して表わされる第1の標準パタンB l=(bl(11
,・・・。 トルa(i)とbl(j)ないしb2(j)との距離d
を計算する距離計算部と、指定された(i、j)にお−
ける距離の積分量g(i、j)t:現時点(i。 j)の距離と過去の距離及び過去の積分ik衾用いて算
出する漸化式の#算を、第1標準パタlに対しては(i
、j)=(1,1)から(1゜J)まで正時間方向性な
い、第2標準パタンに対しては(i、jン=(I、J)
から(1,1)まで逆時間方向に行ない積分量の集合を
得る漸化式計′14部と、指定されfc iにおける最
適積分量t、正方向績分墓に対しては?tJ記により得
られ之正方回、iλ分瀘の果曾1g(i、j)、j二1
゜・・・J)のうちの最小唾として、また逆方間積分量
に文1しては始り;鵡(すなわちj=1)のときの積分
量g(i、1) の11として磨出する最コ薗償分獅
、バ十3’を部と、上ト尼正方+1−IJ最鴻槙分電1
gx(il・i二J、・・、1)及び進方向1&通槓分
鑞tgz(it。 i−1,・・・、1)を格納する最適槓分瀘記1点部と
。 各1にズ=J して正方向最適積分量と逆方向最適積分
量の和g (11=gl(i)+gz(il kn出
し、これらの最小値を求めることにより人力パタ/と標
準パタンとの距離を算出するマツチング距離算出部とを
含んで構成されること全特徴とするバタンマツチフグ装
置。 2、上記マツチング距離算出部は、咎1における正方向
最適積分量と逆方向最適積分量、の和g*(i11c入
カパタ/及び第1.第2標準バタ、の長さの荷重和で除
すことにより正規化した後これ
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57154903A JPS5945583A (ja) | 1982-09-06 | 1982-09-06 | パタンマッチング装置 |
DE8383108773T DE3374908D1 (en) | 1982-09-06 | 1983-09-06 | Pattern matching apparatus |
EP83108773A EP0103258B1 (en) | 1982-09-06 | 1983-09-06 | Pattern matching apparatus |
US07/165,394 US4802226A (en) | 1982-09-06 | 1988-02-29 | Pattern matching apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57154903A JPS5945583A (ja) | 1982-09-06 | 1982-09-06 | パタンマッチング装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5945583A true JPS5945583A (ja) | 1984-03-14 |
JPH0361956B2 JPH0361956B2 (ja) | 1991-09-24 |
Family
ID=15594476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57154903A Granted JPS5945583A (ja) | 1982-09-06 | 1982-09-06 | パタンマッチング装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US4802226A (ja) |
EP (1) | EP0103258B1 (ja) |
JP (1) | JPS5945583A (ja) |
DE (1) | DE3374908D1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022515173A (ja) * | 2019-05-24 | 2022-02-17 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | オーディオクリップのマッチング方法及びその装置、コンピュータプログラム並びに電子機器 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62220998A (ja) * | 1986-03-22 | 1987-09-29 | 工業技術院長 | 音声認識装置 |
DE69028072T2 (de) * | 1989-11-06 | 1997-01-09 | Canon Kk | Verfahren und Einrichtung zur Sprachsynthese |
JPH04194999A (ja) * | 1990-11-27 | 1992-07-14 | Sharp Corp | 学習を用いた動的計画法 |
JP3066920B2 (ja) * | 1991-06-11 | 2000-07-17 | キヤノン株式会社 | 音声認識方法及び装置 |
JPH04362698A (ja) * | 1991-06-11 | 1992-12-15 | Canon Inc | 音声認識方法及び装置 |
EP1435087B1 (de) * | 2001-10-11 | 2005-08-31 | Siemens Aktiengesellschaft | Verfahren zur erzeugung von sprachbausteine beschreibenden referenzsegmenten und verfahren zur modellierung von spracheinheiten eines gesprochenen testmusters |
WO2011039764A2 (en) * | 2009-09-08 | 2011-04-07 | Tata Consultancy Services Ltd | Word recognition system |
US10056080B2 (en) * | 2016-10-18 | 2018-08-21 | Ford Global Technologies, Llc | Identifying contacts using speech recognition |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3816722A (en) * | 1970-09-29 | 1974-06-11 | Nippon Electric Co | Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer |
US4059725A (en) * | 1975-03-12 | 1977-11-22 | Nippon Electric Company, Ltd. | Automatic continuous speech recognition system employing dynamic programming |
US4489434A (en) * | 1981-10-05 | 1984-12-18 | Exxon Corporation | Speech recognition method and apparatus |
-
1982
- 1982-09-06 JP JP57154903A patent/JPS5945583A/ja active Granted
-
1983
- 1983-09-06 DE DE8383108773T patent/DE3374908D1/de not_active Expired
- 1983-09-06 EP EP83108773A patent/EP0103258B1/en not_active Expired
-
1988
- 1988-02-29 US US07/165,394 patent/US4802226A/en not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022515173A (ja) * | 2019-05-24 | 2022-02-17 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | オーディオクリップのマッチング方法及びその装置、コンピュータプログラム並びに電子機器 |
US11929090B2 (en) | 2019-05-24 | 2024-03-12 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for matching audio clips, computer-readable medium, and electronic device |
Also Published As
Publication number | Publication date |
---|---|
DE3374908D1 (en) | 1988-01-21 |
JPH0361956B2 (ja) | 1991-09-24 |
EP0103258A1 (en) | 1984-03-21 |
US4802226A (en) | 1989-01-31 |
EP0103258B1 (en) | 1987-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lapavitsas | The banking school and the monetary thought of Karl Marx | |
Conant | The number concept: Its origin and development | |
JPS5945583A (ja) | パタンマッチング装置 | |
US4837831A (en) | Method for creating and using multiple-word sound models in speech recognition | |
Hassaurek et al. | Four years among the Ecuadorians | |
US4901352A (en) | Pattern matching method using restricted matching paths and apparatus therefor | |
Nitzan et al. | Investment in human capital and social self protection under uncertainty | |
Lippmann et al. | Hybrid neural-network/HMM approaches to wordspotting | |
US4827522A (en) | Pattern recognition apparatus for determining a reference pattern by K-L expansion utilizing a power method | |
Wan et al. | Speaker Adaptive Training for Speech Recognition Based on Attention-Over-Attention Mechanism. | |
JPS58223193A (ja) | 多数単語音声認識方式 | |
Bimbot et al. | From segmental synthesis to acoustic rules using temporal decomposition | |
Edgeworth | The cost of war and ways of reducing it suggested by economic theory: a lecture | |
JP3348735B2 (ja) | パターン照合方式 | |
Roll | The Road to Serfdom | |
De Bruyn | Concepts in vector spaces with convergence structures | |
JPH0449720B2 (ja) | ||
Rees | The future of legal services: A review | |
Unger | Medieval-The World Encompassed: The First European Maritime Empires c. 800–1650. By GV Scammell. Berkeley: University of California Press, 1981. Pp. xiv, 538. $35.00. | |
Cowling | The practices of tommorrow | |
Tanner | Atlas of Men. A Guide for Somatotyping the Adult Male at All Ages | |
Glenday | Business forecasting: A quantitative investigation of the influence of money on trade development | |
Hall | Philippe Contamine, ed. War and Competition between States.(The Origins of the Modern State in Europe, 13th to 18th Centuries, 7.) Oxford: The Clarendon Press, 2000. xii+ 347 pp. index, illus. bibl. $74. ISBN: 0-19-820214-8. | |
Corder | Modern musical composition (Curwen ed. 8282) A manual for students | |
Aruri | THE EARLIER PALESTINIAN RESISTANCE: Ann Mosely Lesch. Arab Politics in Palestine, 1917-1939: The Frustration of a Nationalist Movement |