JPH0465397B2 - - Google Patents

Info

Publication number
JPH0465397B2
JPH0465397B2 JP62061736A JP6173687A JPH0465397B2 JP H0465397 B2 JPH0465397 B2 JP H0465397B2 JP 62061736 A JP62061736 A JP 62061736A JP 6173687 A JP6173687 A JP 6173687A JP H0465397 B2 JPH0465397 B2 JP H0465397B2
Authority
JP
Japan
Prior art keywords
cumulative value
processing
pattern
optimal cumulative
recurrence formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP62061736A
Other languages
English (en)
Other versions
JPS63226697A (ja
Inventor
Hiroaki Sekoe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP62061736A priority Critical patent/JPS63226697A/ja
Priority to CA000561475A priority patent/CA1335001C/en
Priority to DE88104087T priority patent/DE3882062T2/de
Priority to EP88104087A priority patent/EP0283902B1/en
Publication of JPS63226697A publication Critical patent/JPS63226697A/ja
Priority to US07/508,503 priority patent/US5121465A/en
Publication of JPH0465397B2 publication Critical patent/JPH0465397B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は人間が発声した音声を自動認識する音
声認識等の主要処理であるパターンマツチング方
式に関する。
(従来の技術) 音声認識のパターンマツチングに関しては種々
の技術が開発されているが、それらの中で最も重
用されているものの一つとして「日本音響学会誌
第42巻9号(昭和61年9月発行)の第725頁に記
載されるが如きDPマツチング法がある。これは
音声の時間軸歪を整合する手法として極めて有効
とされている。また、DPマツチング法を連続単
語認識に拡張したものとして、特願昭56−199098
号明細書に記載される如きクロツクワイズDP法
がある。この手法は構文制御を有する連続単語認
識法として説明されているが、その特殊形として
当然離散単語認識をも包含している。ここでは簡
単のため離散単語認識の形式で、クロツクワイズ
DP法の要部を説明する。
単語名を番号nで指定することとして {n|n=1、2、……N} なる単語セツトを認識対象とする。各単語に標準
パターン Bn=〓1 n、〓2 n……〓j n……〓n Jo を考える。ここにjは時刻を示し、〓j nは標準パ
ターンBnの時刻jの特徴を意味する。入力音声
パターンを同様に A=a|1、a|2……a|i……a|I と示す。
音声認識は、入力パターンAと標準パターン
Bnとのパターン間距離D(A、Bn)を求め、それ
が最小となるnを定め、認識結果とすることによ
つて行なわれる。
DPマツチングではこのパターン間距離の計算
を一例として次のような動的計画法計算によつて
行なう。
Γ 初期条件 gn(1、1)=dn(1、1) ……(1) Γ漸化式 gn(i、j)=dn(i、j)+mingn(i−
1、j) gn(i−1、j−1) gn(i−1、j−2) ……(2) i=1、2、……I j=1、2、……J パターン間距離 D(A、Bn)=gn(I、Jn) ……(3) ここにdn(i、j)は特徴a|iと〓j nの距離dn
(i、j)=‖a|i、−〓j n‖である。これを積分し
た形式となる。gn(i、j)を最適累積距離と呼
ぶ。
このDPマツチング処理は当初、単語ごとに実
行されていたが、クロツクワイズDP法では各単
語に対して並列的に実行される形式に改良され
た。すなわち、第1図のような、i、j、nが張
る空間において入力パターンの各時刻iにおい
て、各標準パターンBnの指定nと、それらの中
のjのすべての組み合わせで指定されるn、jに
対してgn(i、j)なる最適累積値を計算し、し
かる後に時刻iを進めて処理を実行するという方
式になつている。
実際の計算においては図の空間すべてのワーク
エリアを用意する必要はなく、i方向に関しては
時刻iとi−1の2時刻分あれば(2)の計算を進め
ることができる。このような方法は入力パターン
の特徴a|iの入力に同期して処理を進めることが
できるので、発声と並行して認識のための計算を
進行することができ、実時間性が良いとされる。
(発明が解決しようとする問題点) しかし、この方法を大語いの認識に適用しよう
とする計算量が大でgn(i、j)を保持するため
のワークエリアが膨大になるという問題がある。
すなわち(2)式の漸化式はiのサイクル内でnとj
のすべての組み合わせについて実行し、かつ記憶
しなくてはならない。標準パターン長がJn=30
で、N=1000語を認識しようとすると、3×104
の点で(2)式を計算し、その結果を保持しなくては
ならない。
本発明はクロツクワイズDPマツチングの有す
る計算量が多く、かつワークエリアが大となると
いう上記欠点を改良して、高速で大語い認識が可
能でありながら、小型で低価格な音声認識装置を
実現できるパターンマツチング方式を提供するこ
とを目的とする。
(問題点を解決するための手段) 本発明によるパターンマツチング方式は、上記
クロツクワイズDPマツチングの(2)式の漸化式計
算を実行するに当り、過去に計算された最適累積
値に基づいて新たな最適累積値gn(i、j)を計
算する点(n、j)を制限し、かつこれらの新た
な最適累積値の記憶エリアを生成することを特徴
とする。
(作用・原理) 元来DPマツチングは第1図の如きn、i、j
が張る空間において、各単語ごとに、(1、1)
点から(I、Jn)点に至る経路でdn(i、j)の
総和、すなわち累積値が最小となるものを探索す
るものである。この過程で計算される最適累積値
gn(i、j)は、単語nの(1、1)点から(i、
j)点に至る距離dn(i、j)の累積値を与えて
いる。したがつてgn(i、j)の値が大であると
いうこと、この点(i、j)が最適経路上にある
可能性が低いことを意味する。本発明の第1の特
徴はgn(i、j)が大となる予測される場合は、
DPの漸化式計算を省略することによつて高速化
を画る点にある。
具体的には第2図に示すように、過去のクロツ
ク(i−1)で計算された最適累積値gn(i、j)
を所定の基準で検定し、その値が小である(n、
j)の点の集合w(図の○で表示)を定め、新た
な最適累積値gn(i、j)を算出するための(2)式
の漸化式計算は、これらの点の近傍のみで行なう
ものとする。
しかし、この対策のみでは確かに計算量は低減
されるが、gn(i、j)の記憶エリアが大である
という問題が依然として残る。そこで本発明では
新たに計算されたgn(i、j)を保持するための
ワークエリアを生成し用いることにより、算出さ
れないgn(i、j)に対する記憶を不要とするこ
とを特徴とする。
第3図a,bはこのためのワークエリアの構成
例である。第1のエリアは同図aのようにG1(k)
にgn(i、j)が記憶され、それに対応するnと
jがn1(k)とj1(k)に記憶される。第2のエリアは同
図bのように1時刻前の情報が記憶される。G2
(k)にgn(i−1、j)が、それに対応するnとj
がn2(k)とj2(k)とに、それぞれに記憶される。
このような形式でgn(i−1、j)やgn(i、
j)を扱う場合、第2図のように直接的な形式で
記憶様式のときのように、(2)式の漸化式をそのま
ま実行するのは不可能である。なぜならば、右辺
のgn(i−1、j)、gn(i−1、j−1)、gn(i
−1、j−2)の1部あるいは全部がG2(k)、n2
(k)、j2(k)として記憶されていない事態が生じるか
らである。
そこで本発明の実施態様においては、処理しよ
うとする(n、j)と、直前に処理したnとjの
組(n′、j′)との間の相互関係によつて、漸化式
の計算と、gn(i、j)のためのワークエリア生
成を制御することを特徴とする。
以上を整理して、動的計画法の漸化式(2)の例を
用い本発明の原理を以下に説明する。時刻iにお
いて漸化式(2)を計算しようとする場合、gn(i−
1、j)が大であるということは、この最適累積
値は漸化式(2)の最小値検出機能で除外されてしま
い、将来の時刻における最適累積値に貢献するこ
とは少ないと考えられる。そこで各時刻iにおい
て、閾値θ(i)を定め gn(i−1、j)>θ(i) ……(4) なる、最適累積値が関係する処理は省略すること
とする。すなわち、G2(k)≦θ(i)なるn=n2
(k)、j=j2(k)に対応する(n、j)のみで処理を
行なう。次に、このkの直前でG2(k)≦θ(i)とな
つて処理されたn′=n2(k)、j′=j2(k)の組(n′、j′

を考える。また、漸化式計算を行なうプロセツサ
にR0、R1、R2なるレジスタが内蔵され、(n′、
j′)における処理が終了した時点で、R1=gn
(i−1、j′)、R2=gn′(i−1、j′−1)となつ
ているとする。この状態で(n、j)において行
なう処理は(n、j)と(n′、j′)の相互関係に
よつて次のように切り分けることができる。
(A) n=n′、j−j′=1のとき 第4図aの場合に相当する。すなわち、(i、
j′)においてgn′(i、j′)が計算され、次にj
=j′+1なる点において、gn(i、j)を計算
する場合である。このときR1の内容はgn′(i
−1、j′)=gn(i−1、j−1)、R2の内容は
gn′(i−1、j′−1)=gn(i−1、j−2)で
ある。R0にG2(k)=gn(i−1、j)を読み出す
と、これらからgn(i、j)が gn(i、j)=dn(i、j)+min (R0、R1、R2) ……(5) と計算される。この値はG1(k′)に書き込ま
れ、かつnとjとがn1(k′)とj1(k′)とに書き
込まれる。かくして新たな情報がG1(k′)、n1
(k′)、j1(k′)に書き込まれたのでk′を1だけ
カウントアツプする。以上の処理の後でR1→
R2、R0→R1とすると次の(n、j)の処理を
行なうときにはR1=gn′(i−1、j′)、R2=
gn′(i−1、j′−1)という状態となる。
以上をまとめるとn=n′、j−j′=1のとき
の処理は、R0にすでにG1(k)=gn(i、j)がセ
ツトされているとして dn(i、j)+min(R0、R1、R2)→G1(k
′) n→n1(k′)、j→j1(k′) k′+1→k′ R1→R2、R0→R1 (6) となる。
(B) n=n′、j−j′=2のとき、 第4図bの場合である。このときはgn(i−
1、j′+1)がG2(k)のテーブルに含まれていな
かつたことになる。しかし、R1=gn′(i−
1、j′)、R2=gn′(i−1、j′−1)となつて
いるので、gn(i、j′+1)は次のように計算
される。
gn(i、j′+1)=dn(i、j′+1) +min(R1、R2) また、gn′(i−1、j′)=gn(i−1、j−2)と
なることから gn(i、j)=dn(i、j)+min(R0、R1) と計算される。以上を(6)式と同様にまとめると dn(i、j′+1)+min(R1、R2)→G1(k′) n→n1(k′)、j′+1→j1(k′) k′+1→k′ dn(i、j′)+min(R0、R1)→G1(k′) n→n1(k′)、j→j1(k′) k′+1→k′ R0→R1、∞→R2 ……(7) この中での∞→R2なる操作はgn(i−1、j−
1)が未定義であることを示すものである。
(C) n=n′、j−j′>2のとき 第4図cの場合である。上記(B)の類堆とし
て、次のような処理を行なうことになる。
(gn′(i、j′+1)のため) dn′(i、j′+1)+min(R1、R2)→G1(k′) n′→n1(k′)、j′+1→j1(k′) k′+1→k′ (gn′(i、j′+2)のため) dn′(i、j′+2)+R1→G1(k′) n′→n1(k′)、j′+2→j1(k′) k′+1→k′ (gn(i、j)のため) dn(i、j)+R0→G1(k′) n→n1(k′)、j→j1(k′) k′+1→k′ (次の(n、j)への準備) R0→R1、∞→R2 ……(8) (D) n≠n′のとき R1、R2の内容が、gn(i、j)に影響しない
ので、上記(C)と同様の処理でよい。
以上の如く、(n、j)と(n′、j′)の相互関係
によつて処理を切り替えて行なう。R0=G2(k)>
θ(i)なる総てのn=n2(k)、j=j2(k)に対してこの
ような処理を行なうことによつて、この時刻iで
の処理が終了する。G1(k)、n1(k)、j1(k)をG2(k)、
n2(k)、j2(k)とそれぞれ切り替え、i+1→iとし
て次の時刻での処理へ移行する。
かくして、元の漸化式空間(n、i、j)での
処理と同等の処理を、性能はほとんど落すことな
く少量の計算量とメモリー量で実行できることと
なつた。
実施例 以上のパターンマツチング原理により動作する
音声認識装置の構成例を第5図に示す。マイクロ
ホン10より入力された音声波形は分析部20に
よつて周波数分析され、特徴aiの時系列として、
マイクロプロセツサ30に入力される。このマイ
クロプロセツサ30には、レジスタR0、R1、R2
及びk、k′、nが内蔵され、かつ3種のメモリ4
0,50,60が接続されている。標準パターン
メモリ40には標準パターンBn=b1 n、b2 n……bj n
……bn Joが記憶される。ワークメモリ50には1
時刻前に計算されたデータG2(k)、n2(k)、j2(k)が
記憶され、ワークメモリ60は新たに計算される
G1(k)、n1(k)、j1(k)の記憶エリアとなる。入力パ
ターンが与えられると、a|1の入力に応じて(1)式
の初期条件設定がワークメモリ50に対して、次
のように行なわれる。
G2(k)=dk(1、1) n2(k)=k j2(k)=1 K=N ……(9) これはgn(1、1)=dn(1、1)なる初期条件
をn=1、2……Nに対して行なうことに相当す
る。時刻iでa|iが与えられた時の処理をフロー
チヤートして第6図a〜eに示す。a|iを入力し
て以後ブロツク110までの処理はk=1である
初期の(n、j)に対する処理である。ブロツク
113の処理でワークメモリ50よりG2(k)がレ
ジスタR0に移され、ブロツク114の判定処理
で闘値θ(i)との比較がなされる。闘値θ(i)の定義
には種々のものが考えられるが、最も簡単なもの
は θ(i)=α・i+β ……(10) なる単調増加関数とすることである。R0>θ(i)
なるときは、このkに対する処理は省略される。
R0≦(i)のとき、ワークメモリ50よりn=n2(k)、
j=j2(k)が読み出され、ブロツク111の処理で
定まつているn′、j′との相互比較がなされ、その
結果に応じて l1 、 l2 、 l3 、 l4 の処理(第
6図c〜e)が選択され、実行される。 l1 の処
理は上記の(D)に対応し、 l2 、 l3 、 l4 は(A)、
(B)、(C)の処理にそれぞれ対応する。それぞれの処
理が終了すると l5 に戻りkを1増加し、かつ、
ブロツク111の処理でn→n′、j→j′と推移さ
せた後にブロツク113以下同様の処理が繰り返
される。なお、例えば l3 の処理(第6図e)の
ブロツク130内のdn(i、j′+1)のような、
ベクトル間の距離の計算は、nとj′+1(図では
省略)を標準パターンメモリ40に与えてbn j′+
1を読み出して行なわれる。
ブロツク112によつて、ワークメモリ50内
のすべてのデータが処理されたと判定されたとき
は、 l0 の処理(第6図b)に移行する。ブロツ
ク120と121は最後の(n′、j′)に対して残
されていた処理を実行するものである。ブロツク
122によつてG1、n1、j1のデータをG2、n2、
j1へ移す処理が行なわれるが、これはデータの転
送でなく、ワークメモリ50と60の切り替えに
よつて実行される。ブロツク123の処理によつ
てこの時刻iの処理は終了し、次の時刻i+1で
の処理へ移行する。
以上の処理が、i=Iまで終了した時点では、
ワークメモリ60内にG1(k)、n1(k)、j1(k)にgn
(I、Jn)の情報が含まれている。n=n1(k)とし
て、j1(k)=Jnとなるkに対応するG1(k)がそれであ
る。これを入力パターンAと標準パターンBn
の距離D(A、Bn)とし、それらの最小値を与え
をn=n^を定め認識結果として出力する。
以上本発明の原理を実施例に基づいて説明した
が、これらの記載は本発明の範囲を限定するもの
ではない。特に第6図のブロツク114の判定の
基準としては種々考えられる。θ(i)をG2(k)=gn
(i−1、j)の最小値にリンクさせて適応させ
ることも可能である。別に、G2(k)=gn(i−1、
j)の小さなものから一定個数を選び、それ以外
のものに対しては処理を省略するという方式も可
能である。
また以上の説明では、基本的な漸化式として(2)
式を用いたが、「日経エレクロトニクスの1983年
11月7日号第184頁の表1」に記載されるが如き、
種々の変形の漸化式についても本発明の原理は適
用される。さらに本発明は特願昭56−199088記載
のクロツクワイズDP法と同様連続単語認識に利
用できるものである。
(発明の効果) 以上述べた本発明の原理によるとDP漸化式の
計算を、必要な(n、j)点のみで、極めて無駄
なく実行することができ、かつワークメモリの量
を低減され、安価かつ高速な音声認識装置を実
現・提供できる。
【図面の簡単な説明】
第1図、第2図、第3図a,b、第4図a,
b,cは本発明の原理説明図、第5図は実施例ブ
ロツク図、第6図a〜eはその動作を説明するフ
ローチヤートである。 10……マイクロホン、20……分析部、30
……マイクロプロセツサ、40……標準パターン
メモリー、50……ワークメモリ、60……ワー
クメモリー。

Claims (1)

  1. 【特許請求の範囲】 1 各単語nの標準パターンを特徴〓j nの時系列
    として記憶する手段と、入力音声パターンの特徴
    a|iを一時保持する手段と、それぞれの単語nに
    対応して前記特徴a|iと〓j(i、J)の最適累積
    値gn(i、j)を動的計画法の漸化式によつて計
    算する手段とを有し、各時刻iにて過去の最適累
    積値に基づいて新たな最適累積値gn(i、j)を
    計算する(n、j)を制限し、これらの(n、
    j)に対するgn(i、j)の記憶エリアを生成す
    ることを特徴とする高効率パターンマツチング方
    式。 2 最適累積値gn(i、j)を計算するための漸
    化式計算処理と、gn(i、j)の記憶エリア生成
    を現(n、j)と、直前に処理したn、jの組み
    (n′、j′)との相互関係によつて制御する特許請求
    の範囲第1項記載の高効率パターンマツチング方
    式。
JP62061736A 1987-03-16 1987-03-16 高効率パタ−ンマッチング方式 Granted JPS63226697A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP62061736A JPS63226697A (ja) 1987-03-16 1987-03-16 高効率パタ−ンマッチング方式
CA000561475A CA1335001C (en) 1987-03-16 1988-03-15 Pattern matching system
DE88104087T DE3882062T2 (de) 1987-03-16 1988-03-15 System zum Vergleichen von Mustern.
EP88104087A EP0283902B1 (en) 1987-03-16 1988-03-15 Pattern matching system
US07/508,503 US5121465A (en) 1987-03-16 1990-04-11 Pattern matching system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62061736A JPS63226697A (ja) 1987-03-16 1987-03-16 高効率パタ−ンマッチング方式

Publications (2)

Publication Number Publication Date
JPS63226697A JPS63226697A (ja) 1988-09-21
JPH0465397B2 true JPH0465397B2 (ja) 1992-10-19

Family

ID=13179777

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62061736A Granted JPS63226697A (ja) 1987-03-16 1987-03-16 高効率パタ−ンマッチング方式

Country Status (1)

Country Link
JP (1) JPS63226697A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4690703B2 (ja) * 2004-11-17 2011-06-01 株式会社東芝 エレベータ群管理方法及び装置

Also Published As

Publication number Publication date
JPS63226697A (ja) 1988-09-21

Similar Documents

Publication Publication Date Title
US9786272B2 (en) Decoder for searching a digraph and generating a lattice, decoding method, and computer program product
JP3459712B2 (ja) 音声認識方法及び装置及びコンピュータ制御装置
JPH0159600B2 (ja)
JPH07334184A (ja) 音響カテゴリ平均値計算装置及び適応化装置
US5577162A (en) Dynamic programming matching system for speech recognition
JPS6360920B2 (ja)
JPS60211498A (ja) 連続音声認識装置
US5121465A (en) Pattern matching system
JPH0465397B2 (ja)
US4670850A (en) Pattern matching apparatus
JPH0465396B2 (ja)
JPH0465395B2 (ja)
JPH0568718B2 (ja)
JP3148322B2 (ja) 音声認識装置
US8099280B2 (en) Speech recognition method and speech recognition apparatus
JP3094473B2 (ja) 動的計画法照合装置
Renals et al. Improving statistical speech recognition
JPS63226694A (ja) 音声認識のパタ−ンマッチング方式
JPS6356585B2 (ja)
JP3254933B2 (ja) 音声認識方法
JPH01138596A (ja) 音声認識装置
JPH0483297A (ja) Hmm作成装置
JPH07325598A (ja) 音声認識装置
JPS63226693A (ja) 音声認識のパタ−ンマツチング方式
JPS62161200A (ja) 連続音声認識装置