JPS58106599A - 系列パタ−ン・マツチング処理方法 - Google Patents

系列パタ−ン・マツチング処理方法

Info

Publication number
JPS58106599A
JPS58106599A JP56206351A JP20635181A JPS58106599A JP S58106599 A JPS58106599 A JP S58106599A JP 56206351 A JP56206351 A JP 56206351A JP 20635181 A JP20635181 A JP 20635181A JP S58106599 A JPS58106599 A JP S58106599A
Authority
JP
Japan
Prior art keywords
matching
distance
sequence
calculation
pattern matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56206351A
Other languages
English (en)
Other versions
JPH0420197B2 (ja
Inventor
清宏 鹿野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP56206351A priority Critical patent/JPS58106599A/ja
Priority to US06/448,085 priority patent/US4570232A/en
Priority to FR8221431A priority patent/FR2518783A1/fr
Priority to DE19823247229 priority patent/DE3247229A1/de
Publication of JPS58106599A publication Critical patent/JPS58106599A/ja
Publication of JPH0420197B2 publication Critical patent/JPH0420197B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1)発明の属する分野の説明 本発明は、系列パターン・マツチング処理方法。
特に例えば音声等の系列マツチングによるパターン認識
装置の主要構成部分であるパターン・マツチング処理方
法に関するものである。
(2)従来技術の説明 本発明による系列パターン・マツチング処理方法で取り
扱える系列は、系列データであれば、何でもよいが、以
下では1代表的な系列の例とじて音声の時系列を対象と
する系列パターン・マッチングカ珪について駅間する。
音声は人間にとって最も容易に使いうる情報伝達の手段
であり、音声認識装置の実用化により。
音声によるデータ入力1槻械との対話、音声によるダイ
アル等、数多くの分野での応用がある。
音声認識における動的計画法を利用したマツチング(以
下、DPマツチングと略す)は、入力音声の時系列A=
α1α2・・・−と標準パターンの特徴ベクトルの時系
列IB:b、 b2・・・bm との間で時間軸の伸縮
を許して、要素間の対応づけを行い、系列間距離を計算
する際に用いられる。
従来、この種の動的計画法では、系列A、 [Bの要素
間の距離マトリックスID−(dij)(dijけαi
とbjの距離)上で、第1回国のような窓制限11内の
すべての格子点(<、j)でDPマツチングのくり返し
逐次計算を実行するためや、1つの要素を2つ以上の要
素に対応ずけるのを防ぐための制限(傾斜制限)12の
ために多大な計算量を有するという欠潰や、DPマツチ
ングの際の第1図(B)図示の如き逐次計算値ct(i
 、j)の記憶のためバッファメモリ13が大となると
する欠点をもっていた。
(3)本発明の目的 本発明は、上記の欠点を大幅に除去するものであり、D
Pマツチングの逐次計算のくシ返し計算を3点ごとの格
子点のみで行うために、計算のくり返し回数が】/3に
、かつ、傾斜制限のだめの1回分の逐次計算の計算量も
1/2J:J下にするととができ、かつ1g(z、j)
の記憶のだめのバッファメモリも窓制限幅の2倍だけし
か必要としないという特徴を有している。よって、従来
からのDPマツチング(例えば昭和55年10月 日本
音響学会秋期発表会講演論文集1−1−10に示すDP
マツチング)と比較して、計算量で1/6以下にするこ
とが可能と々る。
(4)発明の構成および作用の説明 第2図は1本発明の一実施例であって、1は入力音声、
2は特徴パラメータの抽出部、3は入力音声の特徴パラ
メータ時系列A=a1a2・・・α?L+4はあらかじ
め蓄えられている標準パターンの特徴パラメータの時系
列旧=blb2・・・b−,5は入力音声の時系列A=
αl cL2・・・(LB  と標準パターンの特徴パ
ラメータの時系列B”bxb2・・・blとの間の距離
マトリックスID= (d<j)を計嘗する距離計算部
、6は距離マトリックス、7け本発明によるDPマツチ
ング部、8けマツチングスコア、9け最小のスコアの単
語を決定する単語決定部、】0は単語名である。
動的計画法は、第1図図示のような距離マトリックスD
= (dij )上で、始端(1,1)から終端(n+
毒)マで格子A (j 、j)の上をたどって、そのと
きの距離d4jの和が最小になるときのスコアを求める
ものであシ1例えば次の式のように表わされる。
これは、連続系で表わすと、距離関敷d(wry)上で
、(n、o)の点から(%+ m )の点までのもつと
も小さい積分値を求める問題の近似解であるO8= m
1nf d(z +v)da /fd#       
 (3)66             6 距離マトリツクス上での最適パスには1通常次の制約1
.IIがつけられている。
(I)  パスのたどシ方 通常、パス(1,1)(tt、jl)(イ2.j2)・
・・(竹、情)は(2)式のように、市街化距離が1に
なるようなパスが選ばれるか、あるいは。
maya (+(&−1−1  jkb I jic+
5−jkI )= 1   (4)になるようなパスが
選らばれている。よって。
格子廃止で進むパスは、第3図図示矢印のようガパス1
4である。縦、横の長さのパスヲ「1」とすると、斜め
のパスは長さが「2」とされている。実際の斜めの長さ
は、縦あるいは横の長さを「1」とすると5であ、D、
(3)式の連続系とは。
大幅な違いをもつことになってしまう。
(II)  傾斜制限 極端にかたよったマツチングを阻止するために、第4図
のような傾斜制限をもったパス15が用いられる。この
傾斜制限パスは、認識性能の向上には寄与しているが、
計算量を増大させている。
本発明は、DPマツチングの(りの縦・横のパスの長さ
と斜めのパスの長さの違いの矛盾を軽減し。
(II)の傾斜制限を、計算量を増大させるとと々〈実
現する手段に関してである。以下2詳しく説明するO 傾斜制限を距離マ) IJラックス上、自然に実現する
ために、第5図のような例えば3虞おきにずらした格子
点16を考える。すると第6図のように、ずらした格子
点間をひし形のパスで結ぶことができ、すべてのパスの
長さが等しくなる。よって、0)のパスの長さの矛盾が
緩和される。また。
111 (II)のパスの傾斜制限も第6図のように自然に導入
できるoしかも、DPマツチングのくり返し逐次計算は
、3点おきに行えばよく、従来からのものに比べて1/
3の段数になる。さらに、逐次計算値g((、j)を格
納するバッファメモリ13も少なくてすむ。つ−tD、
DPマツチングのくり返し逐次計算を第7図のように、
j+j=31+2を満す格子点(i、j)上で、l=0
.1.2.・・・・・・の順序で行うとき、各段の格子
点の数(デ)の2倍の第7図のようなバッファメモリr
t(−r)〜y (r)を用意すれば十分である。
以下、各格子点(S+Z>  でのくり返し逐次計算を
示す。ただし、格子点(<、j)に対応する逐次計算値
のバッファメモリをg(p)とする。
(方法l) σ(p)=閣(ti(p  +)、  y(p+1) 
 )+ dH(s)これは、第6図のパスを終端の点(
<、j)のf3で代用していることになる。(3)式の
積分値により近づけるためには、パスの近くの他の点の
距離の値も用いることにして1次の方法■、方法璽が考
えられる。
(方法n) ct (p) = m1ll (rt(p−1)+d仏
3−1. ct(p+1 >+di−1,j)+di−
+ 、 j−1(方法m) a(p)== (g(p−1)+d(+j II y(
p+1)+ds−1,i)+dij(7)(5)〜(6
)式で、pの値はr  p”j  ’で決定される。
方法■の計算式は第1図図示のDPマツチングの式に比
べて、1段轟シの計算式の計算量は】/4以下であυ、
DPマツチング全体でfdl/12以下となる。方法I
t、Itは、第1図図示のDPマツチングの式に比べて
、1段当りの計算量は1/2以下であり、全体では1/
6以下になっている。
以上述べた方法!〜方法■のDPマツチングの有効性を
調べるために、従来からの第1図のDPマツチング(従
来の方法と呼ぶ)との処理時間および認識性能の比較を
行った。認識対象は、男性4名が2回ずつ発声した64
1都市名単語音声データである。単語認識の方法として
は昭和55年10月 日本音響学会秋期発表会講演論文
集1−1−17に示す5PLjT法を用いた。5PLI
T法では、計算量のほとんどがDPマツチング部につい
やされている。
1ず、処理時間の比較を行う。従来の方法で641単語
×641単語の認識実験をミニコンP、E。
3240で行った場合、約8時間かかった。同じ条件で
方法■け、約60分、方法II、  IIIは約70分
であった。5PLiT法の計算量が全体で1/8近くに
なっていることがわかる。
次に、方法■、方法■の認識性能の評価を4人の発声者
の音声データを用いて行った。従来の方法では、4人の
平均で96.3% の認陳率が得られている。方法Iで
は、94.7%、方法■では、95゜6%の認識率が得
られた。方法■は、方法■とほぼ同じ性能である。認識
性能で従来の方法より。
若干下まわるものの、かなシ高い認識率が得られること
が確かめられた。
以上の説明では、要素間の距離をもとにDPマツチング
の手法を述べてきたが、要素間の類似度に対しても同様
に定式化できる。
壕だ9本発明では、DPマツチングのくり返し逐次計鉋
:を3点おき、つ−!シi+j=3J+2の上のA(i
、j)のみで行うことを述べたが、Q点おき。
つまシ、  i + j =Q−H−2 (ただし、 
Q=5.7.9.・・・)の上のfi(i、j)のみで
行うことにしても、さらに計算1°が少彦〈、シかも、
傾斜制限の強いくり返し逐次計算を行なうことができる
(5)効果の駁明 以上述べたように9本発明によれば、従来のDPマツチ
ングの計算量に比らべ、】/6〜】/】2以下の計斜量
で、DPマツチングを実行することができ、かつ、比較
的高い虻識性能も達成することができる。また、DPマ
ツチングによる単語音声認識装置の簡易化が可能である
。更に、その他の分野での系列の非線形伸縮マツチング
にも本発明を用いることができることは言う才でもない
【図面の簡単な説明】
第1図は、従来からのDPマツチングの例と距離マ) 
IJラックス示したもので、第2図は単語音声認識シス
テムの一実施例、第3図けDPマツチ、1″ ングにおける縦、横、斜めのパスを表わす説明図。 第4図は代表的な傾斜制限パスを表わす説明図。 第5図は1本発明で考える3廃おきにずらした距離マド
IJツクス上の格子点を表わす説明図、第6図は本発明
で考える長さが等しく、かつ、傾斜制限のつけられたD
Pマツチングのパスを表わす説明図、第7図は本発明で
のDPマツチングの逐次計算値を蓄えるバッファメモリ
について説明する説明図を示す。 図中、2は特徴パラメータ抽出部、4は標準パターン、
5は距離計算部、7はDPマツチング部。 9は単語決定部、13Fiバツフア・メモリ(又はバッ
ファメモリ格納範囲)、17はパスを我わす。 特許出願人 日本電信電話公社 代理人弁理士 森 1) 寛 ′  ジ 〜 、−【 盲 一ノ  5 −+ ’−1!!J#!r叉も一人 ′1F ?− や 手続補正書(自発) ■、事件の表示 昭和56年特許願第206351号2
・ 発明の名称 系列パターン・マツチング処理方法3
、補正をする者 事件との関係 特許出願人 住 所  東京都千代田区内幸町1丁目1番6号氏 名
  (422)  日本電信電話公社代表者  真 藤
    恒 4、代理人 5、補正により増加する発明の数 な し6、補正の対
象 特許請求の範囲の欄 7、補正の内容 別紙の通り 補正の内容 (1)特許請求の範囲の欄を次のように補正する。 「2個の特徴パラメータの系列A=α7.α2.・・・
。 αユとβ””h1+ htt・・・hmとの系列間の距
離を動的計画法を用いた非線形正規化マツチングで求め
る系列パターンマツチング処理方法において、系列の要
素間の距離マトリックスp=(dす)(但しtは系列尤
の1番目の要素αtを意味し、)は系列口のノ番目の要
素り゛を意味し、dす°は要素α、と要素りとの距離を
表わす)上のi+j=Q*J+2 (但しQは3.5.
7.9・・・)に該当する点を抽出するパラメータ抽出
部と、該抽出された点について距離計算を行なう距離計
算部とを少なくともそなえ、該距離計算部は動的計画法
のくり返し逐次演算の漸化式の値q(i、))として。 1(i、j )=min(g(i−1,j−2)  、
g(i−2,)’−1))  +f。 又は j(1,));m1n(!1(i 1.〕 2)+d@
、)’  1.y(z  2.)  1)+d7−1.
ノ゛)+dト1.ノ゛−1又は lc’rノ)==min(g(ト1 、ノー2 ) +
 d 6 、 )−1+ y (t  2 、 )  
1 )+d、 1.ノ)+d L) のくり返し逐次演算を、  J=0 、1 、2 、・
・・・・・の順序で逐次行うことにより、系列間距離S
(A:IF5)を計算することを特徴とする系列パター
ン・マツチング処理方法。」。

Claims (1)

  1. 【特許請求の範囲】 2個の特徴パラメータの系列A=a 1+ II! 2
    1・・・、α7とrf3=bx、 b2.・・・blと
    の系列間の距離を動的計画法を用いた非線形正規化マツ
    チングで求める系列パターンマツチング処理方法におい
    て、系列の要素間の距離マトリックスD=(d<j)(
    但しiは系列へのi@目の要素eLiを意味し、jは系
    列旧のj番目の要素bjを意味し+  dSjは要素α
    iと要素bjとの距離を表わす)上のi + j = 
    Q 、 ! + 2 (但しQは5゜7.9・・・ )
    に該当する点を抽出するパラメータ抽出部と、該抽出さ
    れた点について距離計算を行なう距離計算部とを少なく
    ともそなえ、該距離計算部は動的計画法のくり返し逐次
    演算の漸化式の値y(t、 j)をして。 σD、 j)=閣(g(s z、 j  2)、 g(
    4−2,j x)’1+d63又は a(t、j’)=即(σ(” +j2) +di、j−
    1.  g(i−2,1−1)+ d i−1、j ’
    j + d i−1、j−1又は rt(i、j)−闘(rt(i−1、j−2)+dイ、
    j−1.g(i−2,j−1)+ f−1、j ) +
     di j の〈シ返し逐次演算を、l=0.1.2.・・・・・・
    の順序で逐次行うことによυ、系列間距距離(A:B)
    を計算することを特徴とする系列パターン・マツチング
    処理方法。
JP56206351A 1981-12-21 1981-12-21 系列パタ−ン・マツチング処理方法 Granted JPS58106599A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP56206351A JPS58106599A (ja) 1981-12-21 1981-12-21 系列パタ−ン・マツチング処理方法
US06/448,085 US4570232A (en) 1981-12-21 1982-12-09 Speech recognition apparatus
FR8221431A FR2518783A1 (fr) 1981-12-21 1982-12-21 Appareil pour realiser la comparaison de formes de sequences
DE19823247229 DE3247229A1 (de) 1981-12-21 1982-12-21 Anpasseinrichtung fuer sequenzmuster

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56206351A JPS58106599A (ja) 1981-12-21 1981-12-21 系列パタ−ン・マツチング処理方法

Publications (2)

Publication Number Publication Date
JPS58106599A true JPS58106599A (ja) 1983-06-24
JPH0420197B2 JPH0420197B2 (ja) 1992-03-31

Family

ID=16521866

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56206351A Granted JPS58106599A (ja) 1981-12-21 1981-12-21 系列パタ−ン・マツチング処理方法

Country Status (1)

Country Link
JP (1) JPS58106599A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58120296A (ja) * 1982-01-11 1983-07-18 日本電信電話株式会社 系列パターン・マッチング方法
JPS58120295A (ja) * 1982-01-11 1983-07-18 日本電信電話株式会社 系列パターン・マッチング方法
US11261879B2 (en) 2017-09-05 2022-03-01 Ihi Corporation Fluid machine

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5485639A (en) * 1977-12-20 1979-07-07 Nec Corp Pattern matching device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5485639A (en) * 1977-12-20 1979-07-07 Nec Corp Pattern matching device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58120296A (ja) * 1982-01-11 1983-07-18 日本電信電話株式会社 系列パターン・マッチング方法
JPS58120295A (ja) * 1982-01-11 1983-07-18 日本電信電話株式会社 系列パターン・マッチング方法
JPH0247754B2 (ja) * 1982-01-11 1990-10-22 Nippon Denshin Denwa Kk
JPH0247755B2 (ja) * 1982-01-11 1990-10-22 Nippon Denshin Denwa Kk
US11261879B2 (en) 2017-09-05 2022-03-01 Ihi Corporation Fluid machine

Also Published As

Publication number Publication date
JPH0420197B2 (ja) 1992-03-31

Similar Documents

Publication Publication Date Title
Yang et al. Optimal weighted median filtering under structural constraints
CA2238642C (en) Method and apparatus for word counting in continuous speech recognition useful for reliable barge-in and early end of speech detection
KR100383352B1 (ko) 음성작동서비스
US7346507B1 (en) Method and apparatus for training an automated speech recognition-based system
US6847958B2 (en) Method of managing index data in main memory database
CN112712790B (zh) 针对目标说话人的语音提取方法、装置、设备及介质
JPS58106599A (ja) 系列パタ−ン・マツチング処理方法
CN113870860A (zh) 端到端的声纹识别方法和声纹识别装置
CN1613108A (zh) 多人的网络可访问依赖于说话者的声音模型
JPH0582599B2 (ja)
US20030061046A1 (en) Method and system for integrating long-span language model into speech recognition system
Irle et al. The detection of words and an ordering for Markov chains
JP2011022621A (ja) パターンマッチング装置及び方法
JP3042455B2 (ja) 連続音声認識方式
JP2002288155A (ja) 単語属性推定装置、単語属性推定方法、そのプログラムおよび記録媒体
JPH0247754B2 (ja)
US6636832B1 (en) Method and system for decoding a compressed data file
JP2886474B2 (ja) 規則音声合成装置
JPH0247755B2 (ja)
CN115858599A (zh) 业务推荐方法、装置、电子设备和存储介质
JP2003022091A (ja) 音声認識方法および音声認識装置ならびに音声認識プログラム
JPH06332766A (ja) データベースの結合方法
JPS63121099A (ja) 音声認識装置
JPH10214097A (ja) 音声特徴量の適応化方法及び音声認識装置、記録媒体
JPS63188199A (ja) パタンマッチング装置