JPH0638195B2 - パタンマッチング装置 - Google Patents

パタンマッチング装置

Info

Publication number
JPH0638195B2
JPH0638195B2 JP62021426A JP2142687A JPH0638195B2 JP H0638195 B2 JPH0638195 B2 JP H0638195B2 JP 62021426 A JP62021426 A JP 62021426A JP 2142687 A JP2142687 A JP 2142687A JP H0638195 B2 JPH0638195 B2 JP H0638195B2
Authority
JP
Japan
Prior art keywords
distance
time
pattern
sum
calculated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62021426A
Other languages
English (en)
Other versions
JPS63188199A (ja
Inventor
隆夫 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62021426A priority Critical patent/JPH0638195B2/ja
Priority to EP88101304A priority patent/EP0280064A1/en
Publication of JPS63188199A publication Critical patent/JPS63188199A/ja
Publication of JPH0638195B2 publication Critical patent/JPH0638195B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明はパタンマッチング技術、特に音声パタンのよう
にパラメータの時系列として表されるパタンのマッチン
グの改良に関する。
(従来の技術) パタン認識の方法として、認識すべきパタンをあらかじ
め標準パタンとして登録しておき、認識時に入力される
未知パタンを標準パタンと比較し最も類似性の高いもの
を認識結果として決定するパタンマッチング法は従来か
ら広く用いられている。音声のように時間的なゆらぎを
持つパタンの場合には、このような時間的な変動に対処
することが重要であるが、動的計画法を利用した時間軸
正規化マッチング法(日本音響学会誌Vol.27NO.9
p. 483 以下DPマッチング法と称する)はこのため
の極めて有効な方法として、広く実用に供されている。
DPマッチング法の基本的な方法は次のようなものであ
る。
入力パタンの時系列、標準パタンの時系列をそれぞれ A={a(i),i=1,…,I} B={b(j),j=1,…,J} とする。2つのパタンA,Bのマッチング距離は、 により与えられ、これは次の漸化式を計算することによ
って求められる。
初期条件g(0,0)=0;g(i,0)=∞(i>0) ここでd(i,j)はベクトルa(i)とb(j)との
距離を表す。この方法は時間点の格子(I×J)上の時
間点(1,1)から時間点(I,J)に至る時間軸の伸
縮を示す曲線j=j(i)(マッチングパスとよぶ)に
そって距離d(a(i),b(j))を累積した量の最
小値を動的計画法によって求めるものである。このと
き、極端な時間軸の伸縮を避けるため、マッチングパス
に対して傾斜制限と呼ばれる拘束が課せられる。上の漸
化式は第2図(1)に示すような傾斜制限に対応してい
るが、このほかに、第2図(2)〜(3)などの傾斜制
限が用いられている。
(発明が解決しようとする問題点) 上記のDPマッチングの原理により同一カテゴリ内の音
声パタンの時間軸の非線形な伸縮を正規化することがで
きるが、異なるカテゴリのパタンをマッチングさせたと
きにもなるべくマッチング距離が小さくなるような時間
軸対応付けがなされる。すなわち、同一カテゴリ内での
マッチングでは起こらなかったような不自然な時間軸対
応付けが異なるカテゴリ間では起こりうる。このため、
異なるカテゴリのパタンに対しては本来マッチング距離
が大きくなるべきであるのに、距離が小さくなってしま
うことがあり、認識率の低下をもたらす。本発明では、
同一カテゴリ内での時間軸正規化に必要な伸縮の自由度
は確保しながら同時に不必要な伸縮の自由度をなるべく
小さく抑えることによりマッチング性能を向上させ認識
精度を改善することを目的としている。
(問題点を解決するための手段) 前述の問題点を解決するために本発明が提供するパタン
マッチング方式は、特徴パラメータの時系列として表さ
れた入力パタンA={a(i),i=1,・・・,I}
を記憶する入力パタン記憶部と、 特徴パラメータの時系列として表された標準パタンB=
{b(j),j=1,・・・,J}を記憶する標準パタ
ン記憶部と、 前記標準パタンの各時刻jにおける伸縮度を表すパラメ
ータの時系列W={w(i),j=1,・・・,J}を
記憶する伸縮度パラメータ記憶部と、 指定された時刻(i,j)に対してパラメータa(i)
とb(j)との間の距離d(i,j)を計算する距離計
算部と、 前記距離計算部で計算された距離d(i,j)を保持す
る距離バッファと、 時刻(i,j)における距離積分量g(i,j)を、指
定された複数の組み合わせに対して過去の距離dの荷重
和を求め該組み合わせの各々について用意されている前
記伸縮度パラメータを前記距離dの荷重和に乗じるか又
は加えた値に過去の距離積分量を加えた値として算出す
る漸化式計算部と、 前記距離積分量g(i,j)を保持する距離積分量バッ
ファとを含んで構成されることを特徴とする。
(作用) 本発明の基本的な原理は、マッチングパスに一律に傾斜
制限を課することによって生じる異なるカテゴリのパタ
ン間での不自然な時間軸対応付けを解消するため、標準
パタンの各時刻に依存して傾斜制限の強さ(伸縮度)を
変えるというものである。このため、各カテゴリ複数個
の学習パタンを用いて、時刻に依存する伸縮度を求め
る。
学習パタンをC1,…,Ck,…,CKとし、各パタン
を Ck={ck(m),m=1,…,M} と表す。パタンCkに付随する伸縮度を Wk={wk(p,m),p=0,1,2;m=1,…,M} と表す。ここでpは第2図(1)の傾斜制限の各パスを
表し、wk(p,m)は、時刻mでパスpが選択される
確度を示すパラメータである。
伸縮度Wkは、パタンCkを基準に他のパタンCk′を
DPマッチングにより時間軸に対応付けたのち、傾斜制
限のパスの分布を求めることによって得ることができ
る。例えば、パタンCkをパタンCk′に時間軸を対応
付けた結果、マッチングパスとして Pk′={pk′(m),m=1,…,M} が得られたとすると、wk(p,m)は集合{pk′
(m),k′=1,…,K}(Kはパタン数)のうち値
がpであるものの個数をKで割った値(確率)として求
めることができる。ただし、pk′(m)はパタンCk
を基準にパタンCk′とマッチングさせたときパタンC
k上の時刻mにおけるパスを0,1,2の値で表したも
のである(第3図参照)。
Wkを用いたDPマッチングは(1)式を次式で置き換
えたものにより実現することができる。
ただしW(p,j)は可能性の高いもの程小さな値であ
ることが必要であるので、Wk(p,j)を W(p,j)=αlog(Wk(p,j)) (α>0) に置き換えている。なお、記述の煩雑さを避けるため添
え字は省略している。
(実施例) 第1図は本発明を実施した装置の一実施例を示すブロッ
ク図である。入力パタン記憶部1、標準パタン記憶部2
にはそれぞれ入力パタンA、標準パタンBが格納され
る。また、伸縮度パラメータ記憶部3には、標準パタン
Bに対応する伸縮度パラメータ{W(p,j)}が格納
される。4は距離計算部であり、各(i,j)について
計算された距離値の組{d(i,j)}が出力され、距
離バッファ5へ格納される。6は漸化式計算部であり、
(2)式の漸化式計算を、距離バッファ5、距離積分量
バッファ7及び伸縮度パラメータ記憶部3から読み出さ
れた伸縮度パラメータを用いて実行し、得られた距離積
分量gをバッファ7に書込む。この動作が(i,j)=
(1,1)から(i,j)=(I,J)まで繰り返さ
れ、最終的に(i,j)=(I,J)の時点で得られた
積分量g(I,J)をマッチングスコアとして出力す
る。
(発明の効果) 以上述べたように、本発明によれば、同一カテゴリ内で
の時間軸正規化に必要な伸縮の自由度は確保しながら同
時に不必要な伸縮の自由度をなるべく小さく抑えること
が可能となるので、マッチング性能を向上させることが
可能となり、認識精度の改善が実現される。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図お
よび第3図は本発明の原理を説明するための図である。 図において、1,2,3は記憶部、4は距離計算部、
5,7はバッファ、6は漸化式計算部である。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】特徴パラメータの時系列として表された入
    力パタンA={a(i),i=1,・・・,I}を記憶
    する入力パタン記憶部と、 特徴パラメータの時系列として表された標準パタンB=
    {b(j),j=1,・・・,J}を記憶する標準パタ
    ン記憶部と、 前記標準パタンの各時刻jにおける伸縮度を表すパラメ
    ータの時系列W={w(j),j=1,・・・,J}を
    記憶する伸縮度パラメータ記憶部と、 指定された時刻(i,j)に対してパラメータa(i)
    とb(j)との間の距離d(i,j)を計算する距離計
    算部と、 前記距離計算部で計算された距離d(i,j)を保持す
    る距離バッファと、 時刻(i,j)における距離積分量g(i,j)を、指
    定された複数の組み合わせに対して過去の距離dの荷重
    和を求め該組み合わせの各々について用意されている前
    記伸縮度パラメータを前記距離dの荷重和に乗じるか又
    は加えた値に過去の距離積分量を加えた値として算出す
    る漸化式計算部と、 前記距離積分量g(i,j)を保持する距離積分量バッ
    ファとを含んで構成されることを特徴とするパタンマッ
    チング装置。
JP62021426A 1987-01-30 1987-01-30 パタンマッチング装置 Expired - Lifetime JPH0638195B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP62021426A JPH0638195B2 (ja) 1987-01-30 1987-01-30 パタンマッチング装置
EP88101304A EP0280064A1 (en) 1987-01-30 1988-01-29 Pattern matching system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62021426A JPH0638195B2 (ja) 1987-01-30 1987-01-30 パタンマッチング装置

Publications (2)

Publication Number Publication Date
JPS63188199A JPS63188199A (ja) 1988-08-03
JPH0638195B2 true JPH0638195B2 (ja) 1994-05-18

Family

ID=12054669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62021426A Expired - Lifetime JPH0638195B2 (ja) 1987-01-30 1987-01-30 パタンマッチング装置

Country Status (2)

Country Link
EP (1) EP0280064A1 (ja)
JP (1) JPH0638195B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2841404B2 (ja) * 1989-01-12 1998-12-24 日本電気株式会社 連続音声認識装置
JPH05249990A (ja) * 1992-03-04 1993-09-28 Sony Corp パターンマッチング方法およびパターン認識装置
CN109978934B (zh) * 2019-03-04 2023-01-10 北京大学深圳研究生院 一种基于匹配代价加权的双目视觉立体匹配方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4400828A (en) * 1981-03-27 1983-08-23 Bell Telephone Laboratories, Incorporated Word recognizer
JP2595495B2 (ja) * 1982-09-03 1997-04-02 日本電気株式会社 パタンマッチング装置

Also Published As

Publication number Publication date
EP0280064A1 (en) 1988-08-31
JPS63188199A (ja) 1988-08-03

Similar Documents

Publication Publication Date Title
JP2692581B2 (ja) 音響カテゴリ平均値計算装置及び適応化装置
JP2595495B2 (ja) パタンマッチング装置
JP3664739B2 (ja) 話者の音声確認用の自動式時間的無相関変換装置
US6671666B1 (en) Recognition system
EP0144689A1 (en) Pattern matching system
JPH0673080B2 (ja) 連続音声認識方式
JPH0638195B2 (ja) パタンマッチング装置
JPH029359B2 (ja)
JPH0540497A (ja) 話者適応音声認識装置
JPS5852696A (ja) 音声認識装置
US5220609A (en) Method of speech recognition
JP2518007B2 (ja) 学習機構を有するダイナミック・ニユ―ラル・ネットワ―ク
JPH0638200B2 (ja) ダイナミックなニューラルネットワーク
JP3353334B2 (ja) 音声認識装置
JP3011997B2 (ja) 参照ベクトル更新方法
JPS5926960B2 (ja) 時系列パタンマツチング装置
JPS59200A (ja) パタ−ンマツチング装置
JPS63294600A (ja) 単語音声認識装置
JPS593491A (ja) 音声認識装置
JPS592954B2 (ja) パタンルイジドケイサンソウチ
JPH03253900A (ja) 音声認識装置
JPS62221000A (ja) 連続音声認識装置
JPS61145600A (ja) 単語認識装置
JPH03201027A (ja) 学習を用いた動的計画法
JPS62209497A (ja) 連続音声認識装置