JPS58120296A - 系列パターン・マッチング方法 - Google Patents

系列パターン・マッチング方法

Info

Publication number
JPS58120296A
JPS58120296A JP57002565A JP256582A JPS58120296A JP S58120296 A JPS58120296 A JP S58120296A JP 57002565 A JP57002565 A JP 57002565A JP 256582 A JP256582 A JP 256582A JP S58120296 A JPS58120296 A JP S58120296A
Authority
JP
Japan
Prior art keywords
matching
distance
pattern matching
value
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57002565A
Other languages
English (en)
Other versions
JPH0247755B2 (ja
Inventor
清宏 鹿野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57002565A priority Critical patent/JPS58120296A/ja
Priority to US06/448,085 priority patent/US4570232A/en
Priority to FR8221431A priority patent/FR2518783A1/fr
Priority to DE19823247229 priority patent/DE3247229A1/de
Publication of JPS58120296A publication Critical patent/JPS58120296A/ja
Publication of JPH0247755B2 publication Critical patent/JPH0247755B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は例えば音声酩誠等の分野で、系列ノ(ターン
のマツチングによって)くターン−繊する場合に用いら
れ、系列間の距離又は類似度を動的計画法を用いた非線
形正規化マツチングにより二つの系列パターンの距離又
は類似度を求める系列ノくターン・マツチング方式に関
する。
この発明による系列パターン・マツチング方式で取り扱
える系列は、vI微量の系列であって、特徴量間の距離
や類似度が定義されていれば、どのような対象からの系
列でもよいが、以下では代表的な系列の例として音声の
時系列を対象とする系列パターン・マツチング方式につ
いて説明する。
スペクトル時系列の動的計画法を用いたマツチング(以
下、DPマツチングと記す)は、単語音声認識装置など
に用いられ、広く使われはじめている。従来のl)Pマ
ツチングは、音声区間の切シ出しの夷いまいさのない入
力音声の時系列A’e=jLl&l@@@@anと標準
パターyo時系列13’−b1b1・・・・bmとの間
で、時間軸の非紐形伸縮を許して賛累関の対応づけを行
い、系列間の距離(スコカを計算するものであった。従
来からのDPffツチングの代表的な例を第1図に示す
。即ち従来のDPマツチングでは系列A * 、 n 
lの要素間の距離マトリックスD’=(dij)(di
jは要素a1とbj。
距IIm)は行方向に入力音声パターンAの要素番号i
が、列方向に標準パターンBの要素番号jがとられ、そ
の各格子点(i、j)11が距離dljでめシ、i+j
−2+1を満す各格子点111について動的針−法のく
シ返し逐次演算を実行し、次にi+j=2+2を満す各
格子点11mについて動的i′tIIllIl法のくシ
返し逐次演算を実行し、以下同様にしてi+j−2+3
 、 i+j−2+4 、・・・・Jk満す各格子点に
ついて動的針−法のくシ返−し逐次演算を実行する。こ
れらのくシ返し逐次演算の漸化式としては例えば次式が
用いられる。
このDPマツチングのくシ返し逐次演算は窓制限12内
の格子点について実行する。このような従来DPマツチ
ングでは、音声の始端(1,1)の切如出し点の要素a
x、blよシも後の1!素a1.J(1≦l≦n、1≦
j≦m)から計算できる距離マトリックスD’=(di
j)の上でのみのDPマツチングを実行していた。
この発明によるDPマツチングでは、音声区間の切シ出
し点(始端)の要素al、bs以前の系列情報@ n’
 * a a s @ 6 、 bm’ @ @ @ 
11 b@ (n’≦09m1≦0)から計算できる要
素間の距離も利用して、DPマツチングのスコアを求め
、スコアが最小になるように始端を事後的に決める。終
端においても、終端の喪*antbm以後の系列情報&
n+ s・・・・1Lfi”。
byl+s a 11 @ @ bm’ (n”)n 
、m”)m)も利用して、距離マトリックスD=(di
j)(n’≦l≦n”、m’≦j≦mつ上でDPマツチ
ングのスコアが最小になるように終端の位置が事後的に
決められる。たyし、実際のDP:ctラッチングはス
コアは必要であるが、切り出し点の情報は必らずしも必
費でないので、陽には求めること線しない。
このようにこの発明では、切シ出しのあいまいさをもっ
たままの時系列間のDPマツチングが実行できるので、
従来のDPマツチングがこうちっていた音声区間の切シ
出しの誤りに起因する認識誤りを大輪に削減することが
できる。
弔2図は音声認識装置の一般的構成を示し、入力龜子1
4からの入力音声は%徴パラメーシ2の抽出部15で入
力音声の特徴パラメータの時系列Aに変快される。一方
、標準パターン記憶部16にめらかじめ標準パターンの
特徴パラメータの時系タリBが蓄えられている。距離計
算部17で入力音声の時系列Aと標準パターンの特徴パ
ラメータの時希列Bとの距離マトリックスDが計算され
る。
この距離マトリックスはDPマツチング部18で各標準
パターンBについてのマツチングスコアがDPマツチン
グによシ計算され、その最小のスコアが単飴決定部19
で決定され、その決定された単飴名が端子21から出力
される。
この発明でのDPマツチングについて説明する前に、D
Pマツチングでの距離マトリックス上の距離の定義及び
DPマツチングの段の進め方について簡単に説明する。
DPiツチングの段を規定する距離としては、第3図に
示すような各種の距離を考える。纂3図Aは通常のDP
マツチングで用いられている市街化距離に基づく段を規
定する距離である。りまシ縦パス22、横パス23、斜
めパス24をとシ、すべての格子点について演算を行い
、その演算段は細25で示される。#g3図B、Cは傾
斜制限を考朧し、かつ、DPの段数を削減することを目
的として考え出された距離であり、演算段25はN段ご
とであシ、斜めパスのみである。これらの距離を用いる
場合には1.距離マトリックスDI= (dij)上で
の演算段を第□3図に示すようにi+j=Nt+2<だ
ソし、N22の正Ii数で、1=0゜1.2・・・Lm
ax )を満す格子点(IIJ)上で、動的計@法のく
シ返し逐次演算を行い、1=n+m t)、1,2.・・・、とtmax (Lmax =C
) )まで@算段を順次進める。
この%明によるDPマツチングにおいてはその入力は、
切り出しのあいまいな系列、A=an’・・・・・&(
lal・・・・an@@@@@ an”とB”bm ’
 @ ” ” ” b @ b 1・・・・bm・・・
・bm”が用いられる。従来のDP″Vツナングでは、
as、bsの始点(格子点(1,1))からIP!N 
an + bm (格子点(n、m))までを、くり返
し逐次m舅を順次くシ返し、スコアが蛾小になるように
非線形伸縮を行う。この様子は第1図にホした通りであ
る。この発明のDPマツチングでは始端においては、a
lあるいはblよシ前の簀木からの距離の値d1jも用
いる。そのためDPマツチングの段の格子点を!4図に
示すようにalあるいはblより前の要素の領域まで拡
張する。よって始端は従来のDPマツチングでは(lt
l)の格子点だ秒であったが、窓制限内のi十j=2を
満す格子点(i、j)の果合に拡張される。この始端の
格子点(i、j)gi+j=2の集合におけるDPマツ
チングのくり返し逐次?X算の初期櫨をg(0,k)=
0(たソし、k=J1)とする。
同様に、終端は格子点(n、m)を、窓制限内のi +
 j = jmax N+2を満すW、 tmix 段
の格子点の集合(ilJ)に拡張する。この始端の格子
点の集合からDPマツチングのくシ返し逐次演算をtm
JLX段までくり返せば、系列間の距離(スコア)S(
A、B) S(At B)= −”;; ”M” g (’max
+ k) ’ k=j jが求まる。
第5図はこの発明を第4図のN=3の場合に通用した一
実施例を示す。まず、バッファ26に標準パターンの特
徴パラメータの時系列B=bm I・・・・・bobl
・・・@bm・・・・bmIが、バッファ27に入力廿
声の特徴パラメータの時系列A=anl・・・・aOa
l・・II 111n・Φ・・a nlがそれぞれ配憶
される。くり返し逐次It n 4にのバッファレジス
タ028の初M値が初期一般厘姉29によシ決定され、
端点フリー無職のレジスタGの値線0に、その他の領域
で祉、大2きな1直に設定される。また、設定端子31
より、k41段目(i+J=M:M=5 )の格子点(
i、Dで第4図に示す窓制限内のjのもつとも大きい格
子点(’IJ)が違らばれ、その値が設電される。第5
図の場合に[j=4、i=1と設定される。この(i、
j)に対応してくシ返し逐K !ff JI! 111
のバッファレジスタG28の誉号にの値が叙述される。
第5図の場合には、k=j−1−4−1=3となる。
次に、責木間距離計真部32で、バッファ26のj−j
−2査目の41!素bJtbj−twbj−zと、バッ
フ 727 Oi −i −2査目の41’ * ’ 
i r & i −s +ai−i とを絖み出し、こ
れらの要素関の距離dij。
dj+j−1sdi−1*Jtdl−1sコーt、di
−i、j−iを計算する。この距陰の値と前段までのく
り返し逐次耐昇1mg(k−1)、g(kL g (k
+1)とからくシ返し逐次h↑鼻値の候補の計算s33
で、候補値a。
b、cを次のよう−に1其する。
a=g(k 1 )+d i 、 j−t+a i J
b=g(k)+(di−*、j−t+di−t、j−s
+d i* j )×百c=g(k+1 )+d i−
s 、 j+d i jその後、決定部34で候補値@
、b、cのうちの最小値を求め、その値を通路35を通
じてノくツファレジスタ28のに着目のG(k)に書き
込む。
次に(’IJ)設定部36で、同じ演X段での次の格子
点(i、j)の値及びkO値をtaする。。
つまシ、jO値をj−1に、iの値をi+1にし、kの
値をに−2に設定する。このようにして更新されたi、
jによる格子点(i、j)が窓制限内に依然として存在
しているときには、このl、jO値を通路37を通じて
バッフ726.27に送υ、かつ、kO値を通w638
を通じてバッファレジスタ28に送シ、計算部32.3
3、決定部34で同様の処理を行ってく夛返し逐次計算
を実行する。
(i、j)設x部36テvi、新した格子点(’tj)
が窓l1fll m内に存在していない場合には、次段
設建都39でMの(1mをM+3にし、l十j=Mを満
す格子点(i、j)で窓制限内のjのもつとも大きな1
vL!D栢子点の値に’+Jを設定する。更にkの−を
j−1に設定する。この設定した演算段が終了すべき段
でないときには、通路37を通じてj、iolmを/(
ッ7726,27に送シ、通路381r通じてkの11
[をバッファレジスタ28に送った恢、I″を鼻部32
,33、決足部34での谷処理を行ってくシ返し逐次計
算を実行する。次段設疋郁39で設定した演算段が終了
すべき段であるトキには、計算部41でバッファレジス
タ28の姐からklLm間距離を#It算し、単@決定
部に送る。
以下、第3図B1第4図に示したN=3の場合を例にと
9あげ、I&g繊実験の結果も含めて説明する。N=3
の場合のl)Pマツチングのく夛返し逐次演算は、次式
のように表わされる。
たyし、g(t、k)゛は、第を段のくシ返し邂次演其
値を示し、kは窓制限内のに=j−iを満足する値であ
る。
次に認識実験の粕来について述べる。酩繊対象は男性4
名が2回ずつ発声した641都市名単胎晋声データであ
る。単語音声紹織の方法としては昭和55年10月日本
音曽学会秋期発表会閘頂緬文集1−1−17に記載され
ている5PLIT法を用いた。DPマツチングの手法と
してti、N=3の場合について、昭和55年10月日
本廿曽学会秋期発表会Bll演嗣又巣1−1−10に記
載したシ似端点フリーの手法(DE米の手法と呼ぶ)と
、この発明の端点フリーの手法をとシあげた。端点フリ
ーマツチングを行うために、入力材声データのan l
・・・・aoト襟準パターンのbml・@11114)
@の特徴パラメータは、al及びbtO時歓パラメータ
で代用した。同様にin+l・・・・afi”、bm+
l・・・・bmlの特徴パラメータもan、bmで代用
した。従来の方法の4名の発声者での平均の単I@wt
緘率は96.2俤でおり、第2位以内に正しい単語名の
入る確率U98.3%となった。この:@明の端点フリ
ーDPマツチン【を用いた場合KFi、単@脳誠率が9
6.7優に、第2位以内に正しい単語名の入る確率が9
9.0−となシ、性能が向上した。更にパワー情報を用
いてこの発明のDPマツチングの始端と終−〇端点フリ
ーの領域を制限した場合には、単語−誠単がさらに向上
して97.4チとなった。これにより、この発明の端点
フリのDPマツチングアルゴリズムの有効性が実証でき
た。前述のようにail ’ @ @ @ @ aO、
b m’ @ @ @ @ b @をそれぞれas、b
xで代用し、またALL+S・・・’n”+bm+1・
・・・brn lをそtlぞれan、bmで代用しても
前述のように認識率が同上しておシ、このような代用を
しなければ−twag隊率が向上する。
以上のDPマツチングの説明では、特徴パラメータ間の
距mtもとにしたDPマツチングの手法について述べて
きたが、特徴パラメータ間の類似用−に対しても、同様
に定式化でき、その場合は前記式でminをmaxとす
ればよい。
以上述べたように、この発明によるDPマツチングの手
段を用いれば、切り出し点がわいまいでおる2個の系列
のマツチングが竹えるようになる。
よって、従来のL)Pマツチングを用いた認識装置で生
じていた、切シ出しのvAシによる認繊岨9を。
大幅に削減することができる。この発明のDPマツチン
グは音声−線以外にも、系列の切シ出しのあいまいさを
もつ様々な分野での系列マツチングの手段として癲用可
能である。
【図面の簡単な説明】
第1図は従来のDPマツチングにおける距離マトリック
スを示す図、第2図はDPマツチングによる単M音声−
鍼システムの一構成例を示すブロック図、第3図はDP
マツチングにおける段を規だする距離の説明と従来から
のDPマツチングのパスの例を示す図、第4図はこの発
明におけるDPマツチングのN=3の場合の説明図、第
5図はこの発明の実施例を示すブロック図である。 11:格子点、14:音声入力端子、15:%値パラメ
ータ抽出部、16:標準ノくターン記憶部、17:距隨
It、J!部、18:DPマツチング都、19:単−決
定部、21:率鹸名出力端鳴時計出績人  日本電信電
話公社 代理人 単針 卓

Claims (1)

    【特許請求の範囲】
  1. (1)2個のt¥j徽パラメータの系列A=in’・・
    ・・aOal・・・・an・・・・an@とB=bm’
    ・・拳・bobl・・・・・bm””bm”(at、b
    tはA、Bの始端の候補、&n+bmはA、Hの終端の
    候補)の系列パターン間の距嵯又は類似度を、系列のJ
    jk索間のマトリックスD = (di J )(di
     jハ系列A 17)*X jLiと系列BO豊zJと
    の距離又は類似度を表わす)上で1+j;M十N(Mは
    定数、N≧1)を満すすべての格子点について動的li
    −法のくり返し逐次演算を実行し、次にi+j=M+2
    Nを満すすべての格子点について動的計画法のくシ返し
    逐次演算を実行し、以下同様にしてi+j=M+3N、
    i+j=M+4N、・・・・について動的針1法のく)
    返し逐次OX算を実行する動的計画法を用いた非縁形伸
    縮止税化マツチングによシ上記二つの系列の距離又をよ
    類似度を求める系列パターン・マツチング方式において
    、上記始端候補al、b1  より前の系列情報@n’
     a @ 1111JL@ 、 k)m’・・・@bO
    の景累間dijを上記演算の実行に用い、かつ上記終端
    の候補an、bmlb後の系列情報afi+1 ””’
    n” 、bm+t・・−・bmI+の費索間d1jを上
    6己凛算の実行に用いることを特値トスる系列パターン
    ・マツチング方式。
JP57002565A 1981-12-21 1982-01-11 系列パターン・マッチング方法 Granted JPS58120296A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP57002565A JPS58120296A (ja) 1982-01-11 1982-01-11 系列パターン・マッチング方法
US06/448,085 US4570232A (en) 1981-12-21 1982-12-09 Speech recognition apparatus
FR8221431A FR2518783A1 (fr) 1981-12-21 1982-12-21 Appareil pour realiser la comparaison de formes de sequences
DE19823247229 DE3247229A1 (de) 1981-12-21 1982-12-21 Anpasseinrichtung fuer sequenzmuster

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57002565A JPS58120296A (ja) 1982-01-11 1982-01-11 系列パターン・マッチング方法

Publications (2)

Publication Number Publication Date
JPS58120296A true JPS58120296A (ja) 1983-07-18
JPH0247755B2 JPH0247755B2 (ja) 1990-10-22

Family

ID=11532889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57002565A Granted JPS58120296A (ja) 1981-12-21 1982-01-11 系列パターン・マッチング方法

Country Status (1)

Country Link
JP (1) JPS58120296A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002244697A (ja) * 2001-02-16 2002-08-30 Casio Comput Co Ltd 音声認証装置、音声認証方法、及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS532650A (en) * 1976-06-23 1978-01-11 Terrell Mach Co Strip out apparatus for spun yarn bobbin
JPS5485639A (en) * 1977-12-20 1979-07-07 Nec Corp Pattern matching device
JPS58106599A (ja) * 1981-12-21 1983-06-24 日本電信電話株式会社 系列パタ−ン・マツチング処理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS532650A (en) * 1976-06-23 1978-01-11 Terrell Mach Co Strip out apparatus for spun yarn bobbin
JPS5485639A (en) * 1977-12-20 1979-07-07 Nec Corp Pattern matching device
JPS58106599A (ja) * 1981-12-21 1983-06-24 日本電信電話株式会社 系列パタ−ン・マツチング処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002244697A (ja) * 2001-02-16 2002-08-30 Casio Comput Co Ltd 音声認証装置、音声認証方法、及びプログラム

Also Published As

Publication number Publication date
JPH0247755B2 (ja) 1990-10-22

Similar Documents

Publication Publication Date Title
US11216729B2 (en) Recognition system and recognition method
US11380315B2 (en) Characterizing accuracy of ensemble models for automatic speech recognition by determining a predetermined number of multiple ASR engines based on their historical performance
JPS58120296A (ja) 系列パターン・マッチング方法
CN110890086B (zh) 一种基于贪心算法的语音相似度计算方法和装置
Dermoune et al. Confidence intervals from local minimums of objective function
JPH0420197B2 (ja)
JP2785939B2 (ja) 連続音声認識装置
JPS593491A (ja) 音声認識装置
JPS60201398A (ja) 連続単語音声認識方式
JPH0436400B2 (ja)
JP3099845B2 (ja) パターン認識後処理方式
CN115617966A (zh) 音频处理方法、装置、电子设备和可读存储介质
JP2984287B2 (ja) 光学式文字読取装置
JPS62173498A (ja) 音声認識装置
JPS63188199A (ja) パタンマッチング装置
JPS62154078A (ja) オンライン手書文字認識における特徴点の抽出方式
JPS60111300A (ja) 連続単語音声認識方法
JP2969819B2 (ja) 画像認識装置
JPS63155389A (ja) オンライン文字認識装置
JPH05108695A (ja) レフトツーライト型隠れマルコフモデル法の並列処理方法
JPH022159B2 (ja)
JPH02165287A (ja) 文字列入力方式
JPH0786935B2 (ja) 輪郭データ圧縮方法
JPS6356700A (ja) 連続音声認識装置
JPH1091616A (ja) パターン・マッチング処理方法および装置