JPH049319B2 - - Google Patents

Info

Publication number
JPH049319B2
JPH049319B2 JP57019649A JP1964982A JPH049319B2 JP H049319 B2 JPH049319 B2 JP H049319B2 JP 57019649 A JP57019649 A JP 57019649A JP 1964982 A JP1964982 A JP 1964982A JP H049319 B2 JPH049319 B2 JP H049319B2
Authority
JP
Japan
Prior art keywords
pattern
vector
section
memory
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57019649A
Other languages
English (en)
Other versions
JPS58137899A (ja
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP57019649A priority Critical patent/JPS58137899A/ja
Publication of JPS58137899A publication Critical patent/JPS58137899A/ja
Publication of JPH049319B2 publication Critical patent/JPH049319B2/ja
Granted legal-status Critical Current

Links

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C35/00Rigid support of bearing units; Housings, e.g. caps, covers
    • F16C35/04Rigid support of bearing units; Housings, e.g. caps, covers in the case of ball or roller bearings
    • F16C35/06Mounting or dismounting of ball or roller bearings; Fixing them onto shaft or in housing
    • F16C35/062Dismounting of ball or roller bearings

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は、パタン認識装置に関する。
パタン認識装置は、例えば音声のように特徴ベ
クトルの時系列として表現される時系列パタンを
標準パタンとのマツチングにより同一性の認識を
行なう装置である。例えば音声認識装置は、認識
対象とする各音声に対して標準パタンが用意され
ており、入力音声パタンを上記各標準パタンと比
較し、すなわちマツチングを行なつて、最も良好
な一致が得られる標準パタンを決定することによ
つて、入力音声パタンが該標準パタンと同一音声
であると判定される。このようなパタン認識によ
り入力音声を機械コード化することができる。
上記標準パタンは、あらかじめ話者によつて入
力されるもので、従来は、各種入力パタンをその
ままメモリに記憶させて標準パタンとして利用し
ている。従つて、例えば単語認識装置の場合で
は、1つの単語に対して、入力パタン長に相当す
るメモリ容量を必要とし、さらに単語数分の容量
が必要である。このため、膨大なメモリ容量が必
要である。メモリ容量を減らすために、入力パタ
ンの一定時間間隔ごとの特徴ベクトルを、代表ベ
クトル列として抽出して標準パタンとする方法も
あるが、この方法では入力パタンの特徴に欠落が
生じるため認識率が低下するという欠点がある。
パタン認識は、音声パタンの認識に限るものでは
なく、特徴ベクトルの時系列として表現されるも
のであれば対象とされるが、音声以外のパタン認
識装置においても、上述の欠点、すなわち標準パ
タンのメモリ容量が膨大となること、又は、メモ
リ容量を低減した場合には認識率が低下すること
については、同様である。
また入力パタンを最適近似する特徴ベクトル系
列を選択して正規化を施すパタン正規化装置にお
いて、入力パタンを最適近似するあらかじめ定め
られた個数の特徴ベクトルおよび境界位置を動的
計画法によつて求める技術が提案されている(特
開昭53−142828号公報)。
しかし、この方法による演算では、代表ベクト
ルと他の特徴ベクトルとの距離合計の最小値を求
めるための演算量が多い問題がある。
本発明の目的は、上述の標準パタンを圧縮し、
標準パタンメモリの容量を低減しながら、動的計
画法による演算量を低減することができるパタン
認識装置を提供することにある。
本発明のパタン認識装置は、ベクトル列bj(j
=1、2、…、J)として表現される標準パタン
を保持するためのパタンバツフアと、該パタンバ
ツフアに格納されたベクトル列bjをK間(K<
J)に分割する区切り点列{lk}=l1、l2、…、lk
…lK+1を各区間の中央位置(lk+lk+1)/2のベク
トルb′kと該区間内の各ベクトルbjとの誤差‖b′k
−bj‖が全区間において最小となるように動的計
画の手法によつて計算する演算部および上記演算
によつて得られる区切り点列{lk}を決定保持す
る決定部と、該決定部の出力する各区間の中央位
置を示すアドレス信号によつて前記パタンバツフ
アから読み出した中央ベクトルb′kを圧縮パタン
C=c1、c2、…、ckとして格納する圧縮パタンメ
モリと、任意の入力パタンと前記圧縮パタンとの
比較を行なう認識処理部とを備えたことを特徴と
する。
次に、本発明について、図面を参照して詳細に
説明する。標本点t1、t2、…、をi、…、tIにおけ
る入力のスペクトラム的特徴を与えるベクトルを
a1、a2、…、ai…、aIとしたとき、入力パタンA
を、 A=a1、a2、…、ai、…、aI で表わす。また比較すべき標準パタンBを、 B=b1、b2、…、bj、…、bJ と表わす。本発明においては、標準パタンBを第
1図に示すようにK+1個の区切り点l1〜lK+1
よつてK区間に区切り、各区分内における中央の
ベクトルb′1、b′2、…、b′Kの列を圧縮パタンCと
する。各区分の中央のベクトルb′kは、区切り点lk
とlk+1の中央位置のベクトルb(lk+lk+1)/2を該区間の
代表ベクトルとして抽出したものである。すなわ
ち、 b′k=b(lk+lk+1)/2である。
区切り点列{lk}は、代表ベクトルb′kが第2図
に示すように、各区切り点lkとlk+1の間の区間に
含まれるベクトルbjに対するベクトル誤差の大き
さを‖b′k−bj‖と表わしたとき、下記(1)式の最
小化条件を満足するものとする。
T= Mio {lk} K+1k=1 lk+1j=lk+1 ‖b′k−bj‖ ……(1) (1)式の最小化問題の計算については後述する
が、この計算によつて、前記区切り点l1〜lK+1
決定される。区切り点列{lk}は、 {lk}=l1、l2、…、lk、…、lK+1 で表わされる。この区切り点間の中央のベクトル
b′kを改めてckと表わすことにすると、圧縮パタ
ンCは、 C=c1、c2、…、ck、…、cK で表わされる。Kは勿論Jより小であり、圧縮パ
タンCは標準パタンBより小容量のメモリに格納
することができる。
(1)式の最小化問題の計算は、動的計画の手法に
よつて可能である。今、l〜Jの値をとる整数m
と、l〜K+1の値をとるkと、m−δ≦l≦m
−1なるlによつて決定される下記漸化式 T(m、k)= Mio m−δl<m〔T(l−1、k−1)+nj=l ‖b(l+n)/2−bj‖〕 ……(2) を考える。ここにδは動的計画法演算の範囲を決
定するパラメータであり、隣り合う区切り点lk
lk+1との最大間隔を規制するために適宜設定され
る整数である。(2)式の漸化式は、初期条件T(0,
0)=0から逐次計算によつて求めることができ
る。そして標準パターンBを区切り点列{lk}で
K分割した場合に、各分割区間で発生する中央ベ
クトルb′kと割愛される各ベクトルbjとの誤差 d(b′k、bj) =lk+1j=lk+1 ‖b′k−bj‖ が全区間について最小となるような区切り点列
{lk}を最適区切り点列として求めることができ
る。
(2)式のT(m、k)の計算は、mについてはl
〜Jの範囲で行なわれ、各mの値に対してkが1
〜K+1の範囲で行なわれる。更に各kの値に対
してlをm−δからm−1の範囲で変化させて演
算される。そして、各lの値に対しては、 nj=l ‖b(l+n)/2−bj‖ ……(3) なる演算が行なわれ、次に初期値T(0,0)=0
から漸化的に求められるT(l−1、k−1)を
(3)式に加算することによつて(2)式右辺の〔 〕内
の値が該lに対して求められる。上述のように、
lはm−δからm−1の範囲で変化させるから(2)
式の〔 〕内の値は、任意の(m、k)に対して
δ個求められる。上記δ個の値のうち最小値がT
(m、k)として求められる。このT(m、k)に
対応するlの値(すなわち区切り点となるフレー
ム番号)をL(m、k)とすると、m=1〜J、
k=1〜K+1に対してL(m、k)テーブルが
作成される。該テーブルを参照することにより最
適区切り点列{lk}を求めることができる。すな
わち、上記Lテーブルにおいて、終端の区切り点
lK+1=L(J、K+1)より、lk=L(lk+1、k+
1)なる逆向きの漸化式によつて、順次始端の区
切り点l1へさかのぼることによつて最適区切り点
列{lk}が求められる。最適区切り点列{lk}が
求まると、各区切り点間の中央のベクトルck
b(lk+lk+1)/2が求まり、最適に圧縮された圧縮パタ
ンCが求められる。上記演算によつて求められた
圧縮パタンCは、圧縮前の標準パタンBに最も近
似したパタンとなるため、認識率の低下をまねく
ことなくパタン圧縮が可能となる。
第3図は、本発明の一実施例を示すブロツク図
である。すなわち、マイクロホン10の出力信号
Sは、音声分析部20でスペクトラム包絡の時系
列パタンに変換される。該パタンは音声パタンバ
ツフア30に蓄積される。今、入力音声から標準
パタンを作成する場合、音声パタンバツフア30
には標準パタンBが格納されている。動的計画法
計算部(DP計算部)40は、音声パタンバツフ
ア30から出力されるベクトル値bjを入力として
(2)式のT(m、k)を計算し、これに対応するL
(m、k)を求める(詳細については後述する)。
制御部200は、音声パタンバツフア30にJ個
の標準パタン列が格納されたとき音声パタンバツ
フア30から出力される信号Jを受け、クリヤ信
号CLRおよびマルチプレクサの切替を制御する
信号M並びにDP計算部40の計算に必要な数値
信号m、kを出力する。数値mは1からJまで順
に出力され、各mの値に対して信号kが1からK
+1まで出力される。マルチプレクサ50は、信
号Mによつて音声パタンバツフア30に与えるア
ドレス信号の切替えを行なう。すなわち、信号M
が“0”のときは、DP計算モードであり、音声
パタンバツフア30に格納されている圧縮前の標
準パタンBの各ベクトルbjを指定するobjの番地
jはDP計算部40の計算過程でDP計算部40か
ら出力される。信号Mが“1”のときは、圧縮パ
タンCを決定するモードであり、パタンBから抽
出する中央ベクトルb′kを指定する。b′kの番地は、
決定部80の出力する信号で与えられる。Tメ
モリ60はDP計算部40が計算するT(m、k)
をテーブルとして保持するメモリであり、Lメモ
リ70は同様にDP計算部40で得られるL(m、
k)テーブルを保持するメモリである。決定部8
0はLメモリ70に保持されるL(m、k)テー
ブルを参照して最適区切り点列{lk}を定め、ア
ドレス信号=(lk+lk+1)/2を出力して前記マ
ルチプレクサ50を介して音声パタンバツフア3
0の該当アドレスから中央ベクトルb′kすなわちbl
を読み出す。該ベクトルを圧縮パタンCのベクト
ルckとして圧縮パタンメモリ90に書き込ませ
る。圧縮パタンメモリ90は、上述の各ベクトル
ckを格納し、圧縮パタンCを保持するメモリであ
る。認識処理部100は、各区間内のベクトルを
圧縮パタンメモリ90の出力するベクトルckによ
つて近似し、音声パタンバツフア30の出力する
音声パタンAと比較し、周知のパタンマツチング
法により認識を行なう。
DP計算部40は、例えば第4図に示すように
構成されている。すなわち、DP制御部400は、
制御部200から入力する信号m、kによつて
(l+m)/2=jなるアドレス計算出力してマ
ルチプレクサ50を介して音声バツフア30の該
当番地から仮の中央ベクトルb′kを読み出す。読
み出された仮の中央ベクトルb′kはバツフア41
0に格納される。次に、距離計算部420は、音
声パタンバツフアのj番地から読み出されるベク
トルbjと上記中央ベクトルb′kとの距離の大きさ
‖b′k−bj‖を計算し、計算結果は累算部430
へ送る。累算部430はlからmまでについて上
記距離を累算してnj=l ‖b′k−bj‖なる積分を行な
う。加算部440は、Tメモリ60より読出され
るT(l−1、k−1)と累算部430の出力値nj=l ‖b′k−bj‖を加算してT(l、k)を求める。
上記T(l、k)はm−δからm−1までのlに
ついてそれぞれ計算されるからδ個求められる。
最小検出部450は、上記δ個のT(l、k)の
うち最小のものを決定して、該最小値をT(m、
k)としてTメモリ60へ出力し格納する。また
上記最小値T(m、k)に対応するL(l、k)を
L(m、k)としてLメモリ70へ出力格納する。
次に、第5図に示すタイムチヤートおよび第3
図、第4図を参照して本実施例の動作を説明す
る。音声パタンバツフア30にパタン長Jの標準
パタンBが入力すると、パタン長Jが制御部20
0に与えられ(第5図(a))、制御部200は該パ
タン長Jに基づいて圧縮フレーム数K(K<J)
を決定し(第5図(b))、圧縮フレーム数Kの決定
により信号Mを“0”とする(第5図(c))。また、
クリヤ信号CLRを出力して(第5図(d))Tメモ
リ60に送り、Tメモリ60はクリヤされT(0,
0)=0が初期設定される。以後第5図(e)に示す
ように出力値mが1からJまで順次出力される。
mの値のおのおのに対して出力値kが1からK+
1まで順次出力される(同図(f))。更に、各kの
値に対して第4図のDP制御部400内で、lの
値がm−δからm−1まで変化される(第5図
(g))。そして、DP制御部400は、各lの値に対
して先ず最初にj=(l+m)/2としたアドレ
ス信号jを作成して(第5図(h)参照)マルチプレ
クサ50に送り、マルチプレクサ50は該アドレ
ス信号jを選択出力して音声パタンバツフア30
に送る。音声パタンバツフア30の(l+m)/
2番地から(仮の)中央ベクトルb′kが読み出さ
れて第4図のバツフア410に格納される。次い
で、アドレス信号jの値がlからmまで順次変化
され(第5図(h)参照)、そのたびにベクトルbj
音声パタンバツフア30から読み出されて距離計
算部420で‖b′k−bj‖が算出される。各演算
結果は、累算部430で積分され(2)式の右辺の
〔 〕内の第2項が算出される。加算器440は
累算部430の出力値とTメモリ60から読出し
たT(l−1、k−1)とを加算してT(l、k)
を計算した結果を最小検出部450に送る。m−
δからm−1までのδ個のlの値に対して、上記
T(l、k)が計算されてそれぞれ最小検出部4
50に格納され、最小検出部450は、上記δ個
のT(l、k)の中の最小値をT(m、k)として
Tメモリ60に格納する(第5図(i))。一方これ
に対応するlがL(m、k)としてLメモリ70
に書き込まれる(第5図(j))。
以上の処理がm=Jまで終了すると、Lメモリ
70のL(m、k)テーブルが完成され、該テー
ブルを参照して決定部80で最適区切り点列
{lk}が決定される。すなわち、終端の区切り点
はlK+1であり、上記Lテーブルから読み出したL
(J、K+1)はlK番地を示すから、次にLテー
ブルからL(lk、K)を読み出せばlK-1が求められ
る。このようにlk=L(lk+1、k+1)なる逆向き
の漸化式によつて順次始端の区切り点l1へさかの
ぼることにより最適区切り点列{lk}が求められ
る。
この時点で、第3図の制御部200の出力する
信号Mが“1”となり、区切り点列{lk}にて決
定される圧縮パタンの読み出しモードに移る。す
なわち、決定部80から=(lk+lk+1)/2とし
て各区切り点間の中間点を示すアドレスを出力
し、マルチプレクサ50を介して音声パタンバツ
フア30の該当の番地からblを読み出し、これを
ckとして圧縮パタンメモリ90に格納する。すな
わち、圧縮パタンメモリ90には、圧縮パタンC
が格納される。該圧縮パタンの各ベクトルckはそ
れぞれの区間内における代表ベクトルとされ、後
に入力する入力パタンAとの間で認識処理部10
0によつて周知のパタンマツチング法が実行され
る。本実施例では標準パタンを、もつとも近似誤
差の少なくなるように選び出された代表ベクトル
によつて圧縮することが可能であり、従来よりメ
モリ容量を減少させることができる効果がある。
また、上記圧縮による誤差は小であり、認識率を
低下させることはない。なお、音声パタン以外の
特徴ベクトル列に対しても、同様な構成によつ
て、同様に認識率を低下させることなくメモリ容
量を減少させることが可能である。
さらにまた、本発明では、各区間の中央ベクト
ルの列を圧縮パタンとするため、その中央ベクト
ルと割愛される各ベクトルとの誤差が最小となる
ような区切り点を求める計算ですむため、相隣合
う候補ベクトルを用いて各組の候補ベクトル間の
最適境界位置を求めて演算するものに比べてその
演算量が少なくてすむ利点がある。
【図面の簡単な説明】
第1図は標準パタンを区切り点列{lk}によつ
てK区間に分割した各区間の中央ベクトルと圧縮
パタンとの関係を示す図、第2図は上記各区間内
における中央ベクトルb′kと各ベクトルbjとの距
離を示す図、第3図は本発明の一実施例を示すブ
ロツク図、第4図は上記実施例のDP計算部の構
成の1例を示すブロツク図、第5図は上記実施例
の動作を説明するためのタイムチヤートである。 図において、10……マイクロホン、20……
音声分析部、30……音声パタンバツフア、40
……DP計算部、50……マルチプレクサ、60
……Tメモリ、70……Lメモリ、80……決定
部、90……圧縮パタンメモリ、100……認識
処理部、200……制御部、400……DP制御
部、410……バツフア、420……距離計算
部、430……累算部、440……加算部、45
0……最小検出部。

Claims (1)

    【特許請求の範囲】
  1. 1 ベクトル列bj(j=1、2、…、J)として
    表現される標準パタンを保持するためのパタンバ
    ツフアと、該パタンバツフアに格納されたベクト
    ル列bjをK区間(K<J)に分割する区切り点列
    {lk}=l1、l2、…、lk、…、lk+1を各区間の中央位
    置(lk+lk+1)/2のベクトルb′kと該区間内の各
    ベクトルbjとの誤差‖b′k−bj‖が全区間において
    最小となるように動的計画の手法によつて計算す
    る演算部および上記演算によつて得られる区切り
    点列{lk}を決定保持する決定部と、該決定部の
    出力する各区間の中央位置を示すアドレス信号に
    よつて前記パタンバツフアから読み出した中央ベ
    クトルb′kを圧縮パタンC=c1、c2、…、ckとして
    格納する圧縮パタンメモリと、任意の入力パタン
    と前記圧縮パタンとの比較を行なう認識処理部と
    を備えたことを特徴とするパタン認識装置。
JP57019649A 1982-02-12 1982-02-12 パタン認識装置 Granted JPS58137899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57019649A JPS58137899A (ja) 1982-02-12 1982-02-12 パタン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57019649A JPS58137899A (ja) 1982-02-12 1982-02-12 パタン認識装置

Publications (2)

Publication Number Publication Date
JPS58137899A JPS58137899A (ja) 1983-08-16
JPH049319B2 true JPH049319B2 (ja) 1992-02-19

Family

ID=12005083

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57019649A Granted JPS58137899A (ja) 1982-02-12 1982-02-12 パタン認識装置

Country Status (1)

Country Link
JP (1) JPS58137899A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1299750C (en) * 1986-01-03 1992-04-28 Ira Alan Gerson Optimal method of data reduction in a speech recognition system
JPH02501827A (ja) * 1986-12-19 1990-06-21 イミュネックス・コーポレーション ヒト・インターロイキン‐4 ミューテイン

Also Published As

Publication number Publication date
JPS58137899A (ja) 1983-08-16

Similar Documents

Publication Publication Date Title
AU739238B2 (en) Speech coding
US6188981B1 (en) Method and apparatus for detecting voice activity in a speech signal
JP2692581B2 (ja) 音響カテゴリ平均値計算装置及び適応化装置
EP0249635A1 (en) WORD RECOGNITION IN A SPEECH RECOGNITION SYSTEM USING WORD MODELS WITH DATA REDUCTION.
JP3465628B2 (ja) オーディオ信号の時間軸圧伸方法及び装置
US5386492A (en) Speech recognition system utilizing vocabulary model preselection
US4426551A (en) Speech recognition method and device
EP1239458A2 (en) Voice recognition system, standard pattern preparation system and corresponding methods
JPH0465392B2 (ja)
JPH049319B2 (ja)
JP2002049397A (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP4603727B2 (ja) 音響信号分析方法及び装置
JP2780458B2 (ja) ベクトル量子化法および音声符号化復合化装置
JP2001147700A (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JPH0736119B2 (ja) 区分的最適関数近似方法
JP2758688B2 (ja) 音声合成器
JPH0754438B2 (ja) 音声処理装置
JPH0632037B2 (ja) 音声合成装置
JPH0731504B2 (ja) ピツチ抽出装置
JPH0346838B2 (ja)
JPH0574836B2 (ja)
JPH06110496A (ja) 音声合成器
JPH0122640B2 (ja)
JPS6240720B2 (ja)
JPH1165599A (ja) 音声圧縮伸張方法および装置並びに音声圧縮伸張処理プログラムを記憶する記憶媒体