JPS63188199A - パタンマッチング装置 - Google Patents
パタンマッチング装置Info
- Publication number
- JPS63188199A JPS63188199A JP62021426A JP2142687A JPS63188199A JP S63188199 A JPS63188199 A JP S63188199A JP 62021426 A JP62021426 A JP 62021426A JP 2142687 A JP2142687 A JP 2142687A JP S63188199 A JPS63188199 A JP S63188199A
- Authority
- JP
- Japan
- Prior art keywords
- distance
- matching
- pattern
- time
- integral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008602 contraction Effects 0.000 claims description 14
- 238000000034 method Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 241000288673 Chiroptera Species 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/12—Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用公費)
本発明はパタンマッチング技術、特に音声パタンのよう
にパラメータの時系列として表されるパタンのマツチン
グの改良に関する。
にパラメータの時系列として表されるパタンのマツチン
グの改良に関する。
(従来の技術)
バタン認識の方法として、認識すべきパタンをあらかじ
め標準バタンとして登録しておき、認識時に入力される
未知パタンを標準バタンと比較し最も類似性の高いもの
を認識結果として決定するパタンマッチング法は従来か
ら広く用いられている。音声のように時間的なゆらぎを
持つパタンの場合には、このような時間的な変動に対処
することが重要であるが、動的計画法を利用した時間軸
正規化マツチング法(日本音響学会誌Vo1.27NQ
9 L 483以下DPマツチング法と称する)はこの
ための極めて有効な方法として、広く実用に供されてい
る。
め標準バタンとして登録しておき、認識時に入力される
未知パタンを標準バタンと比較し最も類似性の高いもの
を認識結果として決定するパタンマッチング法は従来か
ら広く用いられている。音声のように時間的なゆらぎを
持つパタンの場合には、このような時間的な変動に対処
することが重要であるが、動的計画法を利用した時間軸
正規化マツチング法(日本音響学会誌Vo1.27NQ
9 L 483以下DPマツチング法と称する)はこの
ための極めて有効な方法として、広く実用に供されてい
る。
DPマツチング法の基本的な方法は次のようなものであ
る。
る。
入力バタンの時系列、標準バタンの時系列をそれぞれ
^=(a(i)、 i=1.・j)
B=4b(j)、j=1.・・・,j)とする、2つの
バタンA、Bのマツチング距離は、により与えられ、こ
れは次の漸化式を計算することによって求められる。
バタンA、Bのマツチング距離は、により与えられ、こ
れは次の漸化式を計算することによって求められる。
I#MO(0,0)=O; a(i、O)=ω(i閥)
漸化式 g(i、j)= n+in (g(i−1,j
−D)+d(i、j)) i=1.・、1 :j=1
.・、J (i]P福1,2 ここでd(i,j)はベクトルa(i)とb(j)との
距離を表す、この方法はII!f間点の格子(IXJ)
上の時間点(i,1)から時間点(I,j)に至る時間
軸の伸縮を示す曲1ij=J (i)(マツチングパス
とよぶ)にそって距11d (a (i ) 。
漸化式 g(i、j)= n+in (g(i−1,j
−D)+d(i、j)) i=1.・、1 :j=1
.・、J (i]P福1,2 ここでd(i,j)はベクトルa(i)とb(j)との
距離を表す、この方法はII!f間点の格子(IXJ)
上の時間点(i,1)から時間点(I,j)に至る時間
軸の伸縮を示す曲1ij=J (i)(マツチングパス
とよぶ)にそって距11d (a (i ) 。
b(j))を累積した量の最小値を動的計画法によって
求めるものである。このとき、極端な時間軸の伸縮を避
けるため、マツチングパスに対して傾斜制限と呼ばれる
拘束が課せられる。上の漸化式は第2図(i)に示すよ
うな傾斜$(f@に対応しているが、このほかに、第2
図(2)〜(3)などの傾斜制限が用いられている。
求めるものである。このとき、極端な時間軸の伸縮を避
けるため、マツチングパスに対して傾斜制限と呼ばれる
拘束が課せられる。上の漸化式は第2図(i)に示すよ
うな傾斜$(f@に対応しているが、このほかに、第2
図(2)〜(3)などの傾斜制限が用いられている。
(発明が解決しようとする問題点)
上記のDPマツチングの原理により同一カテゴリ内の音
声バタンの時間軸の非線形な伸縮を正規化することがで
きるが、興なるカテゴリのバタンをマツチングさせたと
きにもなるべくマツチング距離が小さくなるような時間
軸対応付けがなされる。すなりち、同一カテゴリ内での
マツチングでは起こらなかったような不自然な時間軸対
応付けが興なるカテゴリ間では起こりうる。このため、
異なるカテゴリのバタンに対しては本来マツチング距離
が大きくなるべきであるのに、距離が小さくなってしま
うことがあり、認識率の低下をもたらす0本発明では、
同一カテゴリ内での時間軸正規化に必要な伸縮の自由度
は確保しながら同時に不必要な伸縮の自由度をなるべく
小さく抑えることによりマツチング性能を向上させ認識
精度を改善することを目的としている。
声バタンの時間軸の非線形な伸縮を正規化することがで
きるが、興なるカテゴリのバタンをマツチングさせたと
きにもなるべくマツチング距離が小さくなるような時間
軸対応付けがなされる。すなりち、同一カテゴリ内での
マツチングでは起こらなかったような不自然な時間軸対
応付けが興なるカテゴリ間では起こりうる。このため、
異なるカテゴリのバタンに対しては本来マツチング距離
が大きくなるべきであるのに、距離が小さくなってしま
うことがあり、認識率の低下をもたらす0本発明では、
同一カテゴリ内での時間軸正規化に必要な伸縮の自由度
は確保しながら同時に不必要な伸縮の自由度をなるべく
小さく抑えることによりマツチング性能を向上させ認識
精度を改善することを目的としている。
(問題点を解決するための手段)
前述の問題点を解決するために本発明が提供するパタン
マッチング方式は、特徴パラメータの時系列として表さ
れた入力バタンA=(a(i)。
マッチング方式は、特徴パラメータの時系列として表さ
れた入力バタンA=(a(i)。
1=1.・・・、11と特徴パラメータの時系列として
表された標準パタンB={b(j)、J=1゜・・・,
j)とを時間軸を非線形に伸縮させてマツチングするに
際して、標準パタンの各時刻jにおける伸縮度を表すパ
ラメータの時系列W=(w(j),j=1,・・・,j
)を用い、指定された時刻l、jに対してパラメータa
(i)とb(j)との間の距離d(i、j)を計算する
距離計算部、各時刻(t,j)における距離積分量g(
i,j)を過去の距離積分tgと過去の距離dと前記伸
縮度Wとから計算される複数の積分量の最小値として計
算する積分量計算部とを含んでなり、前記積分量の計算
においては、指定された複数の組合わせに対して過去の
dの荷重和を求め該組合わせの各々について用意されて
いる前記伸縮度パラメータを前記dの荷重和に乗じまた
は加えた値に過去の積分量を加えた値を積分量とするこ
とを特徴とする。
表された標準パタンB={b(j)、J=1゜・・・,
j)とを時間軸を非線形に伸縮させてマツチングするに
際して、標準パタンの各時刻jにおける伸縮度を表すパ
ラメータの時系列W=(w(j),j=1,・・・,j
)を用い、指定された時刻l、jに対してパラメータa
(i)とb(j)との間の距離d(i、j)を計算する
距離計算部、各時刻(t,j)における距離積分量g(
i,j)を過去の距離積分tgと過去の距離dと前記伸
縮度Wとから計算される複数の積分量の最小値として計
算する積分量計算部とを含んでなり、前記積分量の計算
においては、指定された複数の組合わせに対して過去の
dの荷重和を求め該組合わせの各々について用意されて
いる前記伸縮度パラメータを前記dの荷重和に乗じまた
は加えた値に過去の積分量を加えた値を積分量とするこ
とを特徴とする。
(作用)
本発明の基本的な原理は、マツチングパスに一律に傾斜
制限を課することによって生じる異なるカテゴリのバタ
ン間での不自然な時間軸対応付けを解消するため、標準
パタンの各時刻に依存して傾斜制限の強さく伸縮度)を
変えるというものである。このため、各カテゴリ複数個
の学習バタンを用いて、時刻に依存する伸縮度を求める
つ学習バタンをCI、・・・、Ck、・・・、CKとし
、各バタンを Ck= (ck(i)、n=1.・・・、Mlと表す、
パタンCkに付随する伸縮度をWk= (wk(p、
n)、 p=o、1,2 ; n+=1.・
、Mlと表す、ここでpは第2図(i)の傾斜制限の各
パスを表し、wk(p、m)は、時刻mでパスpが選択
される確度を示すパラメータである。
制限を課することによって生じる異なるカテゴリのバタ
ン間での不自然な時間軸対応付けを解消するため、標準
パタンの各時刻に依存して傾斜制限の強さく伸縮度)を
変えるというものである。このため、各カテゴリ複数個
の学習バタンを用いて、時刻に依存する伸縮度を求める
つ学習バタンをCI、・・・、Ck、・・・、CKとし
、各バタンを Ck= (ck(i)、n=1.・・・、Mlと表す、
パタンCkに付随する伸縮度をWk= (wk(p、
n)、 p=o、1,2 ; n+=1.・
、Mlと表す、ここでpは第2図(i)の傾斜制限の各
パスを表し、wk(p、m)は、時刻mでパスpが選択
される確度を示すパラメータである。
伸縮度Wkは、パタンCkを基準に他のパタンCk’を
DPマツチングにより時間軸を対応付けたのち、傾斜制
限のパスの分布を求めることによって得ることができる
9例えば、パタンCkをパタンCk’に時間軸を対応付
けた結果、マツチングパスとして Pk’ = (pk’ (n)、n=1.・・・、Ml
が得られたとすると、wk(p、m)は集合(pk’
(m)、に’ =1.−、Kl (Kはパタン敬)
のうち値がpであるものの個数をKで割った値(確率)
として求めることができる。ただし、pk’ (m)
はパタンCkを基準にパタンCk’とマツチングさせた
ときバタンCk上の時刻mにおけるパスを0.1.2の
値で表したものである(第3図多照)。
DPマツチングにより時間軸を対応付けたのち、傾斜制
限のパスの分布を求めることによって得ることができる
9例えば、パタンCkをパタンCk’に時間軸を対応付
けた結果、マツチングパスとして Pk’ = (pk’ (n)、n=1.・・・、Ml
が得られたとすると、wk(p、m)は集合(pk’
(m)、に’ =1.−、Kl (Kはパタン敬)
のうち値がpであるものの個数をKで割った値(確率)
として求めることができる。ただし、pk’ (m)
はパタンCkを基準にパタンCk’とマツチングさせた
ときバタンCk上の時刻mにおけるパスを0.1.2の
値で表したものである(第3図多照)。
Wkを用いたDPマツチングは(i)式を次式で置き換
えたものにより実現することができる。
えたものにより実現することができる。
ただしW(p,j)は可能性の高いもの程小さな値であ
ることが必要であるので、Wk(p,j)を W(D、j)=alo(i(Wk(D、j))
(a>O)に置き換えている。なお、記述の煩雑さを
避けるため添え字Xは省略している。
ることが必要であるので、Wk(p,j)を W(D、j)=alo(i(Wk(D、j))
(a>O)に置き換えている。なお、記述の煩雑さを
避けるため添え字Xは省略している。
(実施例)
第1図は本発明を実現した装置の一実施例を示すブロッ
ク図である。入力バタン記憶部1、標準パタン記憶部2
にはそれぞれ入力バタンA、標準パタンBが格納される
。また、伸縮度パラメータ記憶部3には、標準パタンB
に対応する伸縮度パラメータ(W(p,j)lが格納さ
れる。4は距離計算部であり、各(i、j)について計
算された距離値の組(d (i、j)lが出力され、距
離バッファ5へ格納される。6は漸化式計算部であり、
(2)式の漸化式計算を、距離バッファ5、距離積分量
バッファ7及び伸縮度パラメータ記憶部3から読み出さ
れた伸縮度パラメータを用いて実行し、得られた距離積
分量gをバッファ7に書込む、この動作が(i、j)=
(i,1>から(i、J )= (I,j)まで繰り返
され、最終的、に(i、j)=(I,j)の時点で得ら
れた積分量g(I,j)をマツチングスコアとして出力
する。
ク図である。入力バタン記憶部1、標準パタン記憶部2
にはそれぞれ入力バタンA、標準パタンBが格納される
。また、伸縮度パラメータ記憶部3には、標準パタンB
に対応する伸縮度パラメータ(W(p,j)lが格納さ
れる。4は距離計算部であり、各(i、j)について計
算された距離値の組(d (i、j)lが出力され、距
離バッファ5へ格納される。6は漸化式計算部であり、
(2)式の漸化式計算を、距離バッファ5、距離積分量
バッファ7及び伸縮度パラメータ記憶部3から読み出さ
れた伸縮度パラメータを用いて実行し、得られた距離積
分量gをバッファ7に書込む、この動作が(i、j)=
(i,1>から(i、J )= (I,j)まで繰り返
され、最終的、に(i、j)=(I,j)の時点で得ら
れた積分量g(I,j)をマツチングスコアとして出力
する。
(発明の効果)
以上述べたように、本発明によれば、同一カテゴリ内で
の時間軸正規化に必要な伸縮の自由度は確保しながら同
時に不必要な伸縮の自由度をなるべく小さく抑えること
が可能となるので、マツチング性能を向上させることが
可能となり、認識精度の改善が実現される。
の時間軸正規化に必要な伸縮の自由度は確保しながら同
時に不必要な伸縮の自由度をなるべく小さく抑えること
が可能となるので、マツチング性能を向上させることが
可能となり、認識精度の改善が実現される。
第1図は本発明の一実施例を示すブロック図、第2図お
よび第3図は本発明の詳細な説明するなめの図である。 図において、1,2.3は記憶部、4は距離計算部、5
.7はバッファ、6は漸化式計算部である。
よび第3図は本発明の詳細な説明するなめの図である。 図において、1,2.3は記憶部、4は距離計算部、5
.7はバッファ、6は漸化式計算部である。
Claims (1)
- 特徴パラメータの時系列として表された入力パタンA=
{a(i),i=1,・・・,1}と特徴パラメータの
時系列として表された標準パタンB={b(j),j=
1,・・・,J}とを時間軸を非線形に伸縮させてマッ
チングするに際して、標準パタンの各時刻jにおける伸
縮度を表すパラメータの時系列W={w(j),j=1
,・・・,J}を用い、指定された時刻i、jに対して
パラメータa(i)とb(j)との間の距離d(i,j
)を計算する距離計算部、各時刻(i,j)における距
離積分量g(i,j)を過去の距離積分量gと過去の距
離dと前記伸縮度Wとから計算される複数の積分量の最
小値として計算する積分量計算部とを含んでなり、前記
積分量の計算においては、指定された複数の組合わせに
対して過去のdの荷重和を求め該組合わせの各々につい
て用意されている前記伸縮度パラメータを前記dの荷重
和に乗じまたは加えた値に過去の積分量を加えた値を積
分量とすることを特徴とするパタンマッチング方式。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62021426A JPH0638195B2 (ja) | 1987-01-30 | 1987-01-30 | パタンマッチング装置 |
EP88101304A EP0280064A1 (en) | 1987-01-30 | 1988-01-29 | Pattern matching system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62021426A JPH0638195B2 (ja) | 1987-01-30 | 1987-01-30 | パタンマッチング装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63188199A true JPS63188199A (ja) | 1988-08-03 |
JPH0638195B2 JPH0638195B2 (ja) | 1994-05-18 |
Family
ID=12054669
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62021426A Expired - Lifetime JPH0638195B2 (ja) | 1987-01-30 | 1987-01-30 | パタンマッチング装置 |
Country Status (2)
Country | Link |
---|---|
EP (1) | EP0280064A1 (ja) |
JP (1) | JPH0638195B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2841404B2 (ja) * | 1989-01-12 | 1998-12-24 | 日本電気株式会社 | 連続音声認識装置 |
JPH05249990A (ja) * | 1992-03-04 | 1993-09-28 | Sony Corp | パターンマッチング方法およびパターン認識装置 |
CN109978934B (zh) * | 2019-03-04 | 2023-01-10 | 北京大学深圳研究生院 | 一种基于匹配代价加权的双目视觉立体匹配方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4400828A (en) * | 1981-03-27 | 1983-08-23 | Bell Telephone Laboratories, Incorporated | Word recognizer |
JP2595495B2 (ja) * | 1982-09-03 | 1997-04-02 | 日本電気株式会社 | パタンマッチング装置 |
-
1987
- 1987-01-30 JP JP62021426A patent/JPH0638195B2/ja not_active Expired - Lifetime
-
1988
- 1988-01-29 EP EP88101304A patent/EP0280064A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
JPH0638195B2 (ja) | 1994-05-18 |
EP0280064A1 (en) | 1988-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2595495B2 (ja) | パタンマッチング装置 | |
JPH07334184A (ja) | 音響カテゴリ平均値計算装置及び適応化装置 | |
TWI740315B (zh) | 聲音分離方法、電子設備和電腦可讀儲存媒體 | |
JPS63188199A (ja) | パタンマッチング装置 | |
JPS5852696A (ja) | 音声認識装置 | |
CN113071243B (zh) | 一种应用于乐谱的自动翻页系统 | |
JPS593491A (ja) | 音声認識装置 | |
JPS60130797A (ja) | 音声認識装置 | |
JPS59124387A (ja) | 連続単語音声認識方法 | |
JPS5898794A (ja) | パタンマツチング装置 | |
JPS6252320B2 (ja) | ||
JPS59172696A (ja) | 音声パタン類似度演算方式 | |
JPS592954B2 (ja) | パタンルイジドケイサンソウチ | |
JP3348735B2 (ja) | パターン照合方式 | |
JPS62209497A (ja) | 連続音声認識装置 | |
JPS62221000A (ja) | 連続音声認識装置 | |
JP2004309779A (ja) | 音声認証装置 | |
CN112489681A (zh) | 节拍识别方法、装置及存储介质 | |
JPS6265090A (ja) | パタ−ン比較装置 | |
JPS63305397A (ja) | 不特定話者音声認識装置 | |
JPS6026399A (ja) | 単語認識装置 | |
JPS63294600A (ja) | 単語音声認識装置 | |
JPS62173498A (ja) | 音声認識装置 | |
JPS61292698A (ja) | パタン類似度計算装置 | |
JPS5991498A (ja) | 音声認識装置 |