JPS63188199A - パタンマッチング装置 - Google Patents

パタンマッチング装置

Info

Publication number
JPS63188199A
JPS63188199A JP62021426A JP2142687A JPS63188199A JP S63188199 A JPS63188199 A JP S63188199A JP 62021426 A JP62021426 A JP 62021426A JP 2142687 A JP2142687 A JP 2142687A JP S63188199 A JPS63188199 A JP S63188199A
Authority
JP
Japan
Prior art keywords
distance
matching
pattern
time
integral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62021426A
Other languages
English (en)
Other versions
JPH0638195B2 (ja
Inventor
隆夫 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62021426A priority Critical patent/JPH0638195B2/ja
Priority to EP88101304A priority patent/EP0280064A1/en
Publication of JPS63188199A publication Critical patent/JPS63188199A/ja
Publication of JPH0638195B2 publication Critical patent/JPH0638195B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用公費) 本発明はパタンマッチング技術、特に音声パタンのよう
にパラメータの時系列として表されるパタンのマツチン
グの改良に関する。
(従来の技術) バタン認識の方法として、認識すべきパタンをあらかじ
め標準バタンとして登録しておき、認識時に入力される
未知パタンを標準バタンと比較し最も類似性の高いもの
を認識結果として決定するパタンマッチング法は従来か
ら広く用いられている。音声のように時間的なゆらぎを
持つパタンの場合には、このような時間的な変動に対処
することが重要であるが、動的計画法を利用した時間軸
正規化マツチング法(日本音響学会誌Vo1.27NQ
9 L 483以下DPマツチング法と称する)はこの
ための極めて有効な方法として、広く実用に供されてい
る。
DPマツチング法の基本的な方法は次のようなものであ
る。
入力バタンの時系列、標準バタンの時系列をそれぞれ ^=(a(i)、 i=1.・j) B=4b(j)、j=1.・・・,j)とする、2つの
バタンA、Bのマツチング距離は、により与えられ、こ
れは次の漸化式を計算することによって求められる。
I#MO(0,0)=O; a(i、O)=ω(i閥)
漸化式 g(i、j)= n+in (g(i−1,j
−D)+d(i、j))  i=1.・、1 :j=1
.・、J  (i]P福1,2 ここでd(i,j)はベクトルa(i)とb(j)との
距離を表す、この方法はII!f間点の格子(IXJ)
上の時間点(i,1)から時間点(I,j)に至る時間
軸の伸縮を示す曲1ij=J (i)(マツチングパス
とよぶ)にそって距11d (a (i ) 。
b(j))を累積した量の最小値を動的計画法によって
求めるものである。このとき、極端な時間軸の伸縮を避
けるため、マツチングパスに対して傾斜制限と呼ばれる
拘束が課せられる。上の漸化式は第2図(i)に示すよ
うな傾斜$(f@に対応しているが、このほかに、第2
図(2)〜(3)などの傾斜制限が用いられている。
(発明が解決しようとする問題点) 上記のDPマツチングの原理により同一カテゴリ内の音
声バタンの時間軸の非線形な伸縮を正規化することがで
きるが、興なるカテゴリのバタンをマツチングさせたと
きにもなるべくマツチング距離が小さくなるような時間
軸対応付けがなされる。すなりち、同一カテゴリ内での
マツチングでは起こらなかったような不自然な時間軸対
応付けが興なるカテゴリ間では起こりうる。このため、
異なるカテゴリのバタンに対しては本来マツチング距離
が大きくなるべきであるのに、距離が小さくなってしま
うことがあり、認識率の低下をもたらす0本発明では、
同一カテゴリ内での時間軸正規化に必要な伸縮の自由度
は確保しながら同時に不必要な伸縮の自由度をなるべく
小さく抑えることによりマツチング性能を向上させ認識
精度を改善することを目的としている。
(問題点を解決するための手段) 前述の問題点を解決するために本発明が提供するパタン
マッチング方式は、特徴パラメータの時系列として表さ
れた入力バタンA=(a(i)。
1=1.・・・、11と特徴パラメータの時系列として
表された標準パタンB={b(j)、J=1゜・・・,
j)とを時間軸を非線形に伸縮させてマツチングするに
際して、標準パタンの各時刻jにおける伸縮度を表すパ
ラメータの時系列W=(w(j),j=1,・・・,j
)を用い、指定された時刻l、jに対してパラメータa
(i)とb(j)との間の距離d(i、j)を計算する
距離計算部、各時刻(t,j)における距離積分量g(
i,j)を過去の距離積分tgと過去の距離dと前記伸
縮度Wとから計算される複数の積分量の最小値として計
算する積分量計算部とを含んでなり、前記積分量の計算
においては、指定された複数の組合わせに対して過去の
dの荷重和を求め該組合わせの各々について用意されて
いる前記伸縮度パラメータを前記dの荷重和に乗じまた
は加えた値に過去の積分量を加えた値を積分量とするこ
とを特徴とする。
(作用) 本発明の基本的な原理は、マツチングパスに一律に傾斜
制限を課することによって生じる異なるカテゴリのバタ
ン間での不自然な時間軸対応付けを解消するため、標準
パタンの各時刻に依存して傾斜制限の強さく伸縮度)を
変えるというものである。このため、各カテゴリ複数個
の学習バタンを用いて、時刻に依存する伸縮度を求める
つ学習バタンをCI、・・・、Ck、・・・、CKとし
、各バタンを Ck= (ck(i)、n=1.・・・、Mlと表す、
パタンCkに付随する伸縮度をWk=  (wk(p、
n)、  p=o、1,2  ;  n+=1.・  
、Mlと表す、ここでpは第2図(i)の傾斜制限の各
パスを表し、wk(p、m)は、時刻mでパスpが選択
される確度を示すパラメータである。
伸縮度Wkは、パタンCkを基準に他のパタンCk’を
DPマツチングにより時間軸を対応付けたのち、傾斜制
限のパスの分布を求めることによって得ることができる
9例えば、パタンCkをパタンCk’に時間軸を対応付
けた結果、マツチングパスとして Pk’ = (pk’ (n)、n=1.・・・、Ml
が得られたとすると、wk(p、m)は集合(pk’ 
 (m)、に’ =1.−、Kl  (Kはパタン敬)
のうち値がpであるものの個数をKで割った値(確率)
として求めることができる。ただし、pk’  (m)
はパタンCkを基準にパタンCk’とマツチングさせた
ときバタンCk上の時刻mにおけるパスを0.1.2の
値で表したものである(第3図多照)。
Wkを用いたDPマツチングは(i)式を次式で置き換
えたものにより実現することができる。
ただしW(p,j)は可能性の高いもの程小さな値であ
ることが必要であるので、Wk(p,j)を W(D、j)=alo(i(Wk(D、j))    
 (a>O)に置き換えている。なお、記述の煩雑さを
避けるため添え字Xは省略している。
(実施例) 第1図は本発明を実現した装置の一実施例を示すブロッ
ク図である。入力バタン記憶部1、標準パタン記憶部2
にはそれぞれ入力バタンA、標準パタンBが格納される
。また、伸縮度パラメータ記憶部3には、標準パタンB
に対応する伸縮度パラメータ(W(p,j)lが格納さ
れる。4は距離計算部であり、各(i、j)について計
算された距離値の組(d (i、j)lが出力され、距
離バッファ5へ格納される。6は漸化式計算部であり、
(2)式の漸化式計算を、距離バッファ5、距離積分量
バッファ7及び伸縮度パラメータ記憶部3から読み出さ
れた伸縮度パラメータを用いて実行し、得られた距離積
分量gをバッファ7に書込む、この動作が(i、j)=
(i,1>から(i、J )= (I,j)まで繰り返
され、最終的、に(i、j)=(I,j)の時点で得ら
れた積分量g(I,j)をマツチングスコアとして出力
する。
(発明の効果) 以上述べたように、本発明によれば、同一カテゴリ内で
の時間軸正規化に必要な伸縮の自由度は確保しながら同
時に不必要な伸縮の自由度をなるべく小さく抑えること
が可能となるので、マツチング性能を向上させることが
可能となり、認識精度の改善が実現される。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図お
よび第3図は本発明の詳細な説明するなめの図である。 図において、1,2.3は記憶部、4は距離計算部、5
.7はバッファ、6は漸化式計算部である。

Claims (1)

    【特許請求の範囲】
  1. 特徴パラメータの時系列として表された入力パタンA=
    {a(i),i=1,・・・,1}と特徴パラメータの
    時系列として表された標準パタンB={b(j),j=
    1,・・・,J}とを時間軸を非線形に伸縮させてマッ
    チングするに際して、標準パタンの各時刻jにおける伸
    縮度を表すパラメータの時系列W={w(j),j=1
    ,・・・,J}を用い、指定された時刻i、jに対して
    パラメータa(i)とb(j)との間の距離d(i,j
    )を計算する距離計算部、各時刻(i,j)における距
    離積分量g(i,j)を過去の距離積分量gと過去の距
    離dと前記伸縮度Wとから計算される複数の積分量の最
    小値として計算する積分量計算部とを含んでなり、前記
    積分量の計算においては、指定された複数の組合わせに
    対して過去のdの荷重和を求め該組合わせの各々につい
    て用意されている前記伸縮度パラメータを前記dの荷重
    和に乗じまたは加えた値に過去の積分量を加えた値を積
    分量とすることを特徴とするパタンマッチング方式。
JP62021426A 1987-01-30 1987-01-30 パタンマッチング装置 Expired - Lifetime JPH0638195B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP62021426A JPH0638195B2 (ja) 1987-01-30 1987-01-30 パタンマッチング装置
EP88101304A EP0280064A1 (en) 1987-01-30 1988-01-29 Pattern matching system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62021426A JPH0638195B2 (ja) 1987-01-30 1987-01-30 パタンマッチング装置

Publications (2)

Publication Number Publication Date
JPS63188199A true JPS63188199A (ja) 1988-08-03
JPH0638195B2 JPH0638195B2 (ja) 1994-05-18

Family

ID=12054669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62021426A Expired - Lifetime JPH0638195B2 (ja) 1987-01-30 1987-01-30 パタンマッチング装置

Country Status (2)

Country Link
EP (1) EP0280064A1 (ja)
JP (1) JPH0638195B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2841404B2 (ja) * 1989-01-12 1998-12-24 日本電気株式会社 連続音声認識装置
JPH05249990A (ja) * 1992-03-04 1993-09-28 Sony Corp パターンマッチング方法およびパターン認識装置
CN109978934B (zh) * 2019-03-04 2023-01-10 北京大学深圳研究生院 一种基于匹配代价加权的双目视觉立体匹配方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4400828A (en) * 1981-03-27 1983-08-23 Bell Telephone Laboratories, Incorporated Word recognizer
JP2595495B2 (ja) * 1982-09-03 1997-04-02 日本電気株式会社 パタンマッチング装置

Also Published As

Publication number Publication date
JPH0638195B2 (ja) 1994-05-18
EP0280064A1 (en) 1988-08-31

Similar Documents

Publication Publication Date Title
JP2595495B2 (ja) パタンマッチング装置
JPH07334184A (ja) 音響カテゴリ平均値計算装置及び適応化装置
TWI740315B (zh) 聲音分離方法、電子設備和電腦可讀儲存媒體
JPS63188199A (ja) パタンマッチング装置
JPS5852696A (ja) 音声認識装置
CN113071243B (zh) 一种应用于乐谱的自动翻页系统
JPS593491A (ja) 音声認識装置
JPS60130797A (ja) 音声認識装置
JPS59124387A (ja) 連続単語音声認識方法
JPS5898794A (ja) パタンマツチング装置
JPS6252320B2 (ja)
JPS59172696A (ja) 音声パタン類似度演算方式
JPS592954B2 (ja) パタンルイジドケイサンソウチ
JP3348735B2 (ja) パターン照合方式
JPS62209497A (ja) 連続音声認識装置
JPS62221000A (ja) 連続音声認識装置
JP2004309779A (ja) 音声認証装置
CN112489681A (zh) 节拍识别方法、装置及存储介质
JPS6265090A (ja) パタ−ン比較装置
JPS63305397A (ja) 不特定話者音声認識装置
JPS6026399A (ja) 単語認識装置
JPS63294600A (ja) 単語音声認識装置
JPS62173498A (ja) 音声認識装置
JPS61292698A (ja) パタン類似度計算装置
JPS5991498A (ja) 音声認識装置