JPS6255799B2 - - Google Patents

Info

Publication number
JPS6255799B2
JPS6255799B2 JP2873782A JP2873782A JPS6255799B2 JP S6255799 B2 JPS6255799 B2 JP S6255799B2 JP 2873782 A JP2873782 A JP 2873782A JP 2873782 A JP2873782 A JP 2873782A JP S6255799 B2 JPS6255799 B2 JP S6255799B2
Authority
JP
Japan
Prior art keywords
inner product
signal waveform
class
autocorrelation
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP2873782A
Other languages
English (en)
Other versions
JPS5910999A (ja
Inventor
Taizo Iijima
Masato Akagi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2873782A priority Critical patent/JPS5910999A/ja
Publication of JPS5910999A publication Critical patent/JPS5910999A/ja
Publication of JPS6255799B2 publication Critical patent/JPS6255799B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は音声等の信号波形の認識方式に関す
る。
〔発明の技術的背景〕
信号波形認識方式には種々の方法があるが、そ
の中に残差波形電力法と呼ばれる方法がある。本
発明は、残差波形電力法を発展改良したものであ
るので、残差波形電力法について説明する。
信号波形系列{xo}を、伝達関数の極が{α
n n=1で与えられるフイルタのインパルス応答と
する。すなわち、伝達関時をG(z)とするなら
ば、 となる。ゆえに、 となる。
信号波形系列{xo}を白色化するフイルタ
は、G(z)の逆の特性をもつフイルタ である。ここで、{ak k=1は線形予測係数であ
る。信号波形系列{xo}をフイルタA(z)に通す
ならば、 となる。実際の波形には擾乱項が含まれているた
めに、残差を{eo}として と書かれる。
もともと線形予測係数{ak}は、残差の自乗
和を最小にするように選ばれるのであるから、逆
フイルタA(z)の出力の自乗和は最小となる。こ
の原理を応用した方法が残差波形電力法である。
信号波形系列のカテゴリがL種存在するとす
る。それぞれに対して線形予測係数{a(l)
=1

l=1を決定し、逆フイルタA(l) (z)を作る
。信号波
形系列{X(l) }が、フイルタG(l) (z)=1
/A(l) (z)
らの出力であるとする。フイルタA(l) (z)の出力

{e(l) }とすれば、 となる。他のフイルタを用いれば、 となる。e(l) とe(l の間には、 の関係があるから、逆フイルタの添字を信号波形
系列が属するカテゴリとすることができる。
〔背景技術の問題点〕
本方法は、予め線形予測係数を用意しておく関
係上、認識処理時間中に線形予測係数を計算する
手続きがないので、高速な認識処理が可能である
という長所をもつ。
ところが、信号波形系列の生成フイルタG(l) (z

が変動したとすれば、波形{x(l) }は変動す
る。変動した波形を{x〓(l) }として式(6)、(7)

計算すれば、 となるが、必ずしも、 となるとは言えない。不等号が逆転すれば誤認識
となる。
〔発明の目的〕
本発明は、残差波形電力法のこのような欠点を
改良しつつ、長所を同時にもちあわせた認識装置
を実現することを目的とするものである。
〔発明の概要及び効果〕
本発明は、類の未知なる入力信号波形系列の自
己相関を求めた後、L種類の類の既知なる標準信
号系列に対応する逆スペクトル係数と前記自己相
関出力との主内積値を求め、この値により前記入
力信号波形系列の属する類を決定する認識方式に
おいて、 前記L種類の各類毎に前記入力信号波形系列の
変動を除くための第1及び第2の係数を1又は複
数組発生し、前記自己相関出力と第1の係数との
第1の内積値及び前記自己相関出力と第2の係数
との第2の内積値を求め、第1の内積値を自乗し
た自乗値を対応する第2の内積値で除算した後各
除算結果を加算し、この加算出力を前記主内積値
から減算し、各類毎に得られる減算結果から前記
入力信号波形系列の属する類を決定することを特
徴とする。
しかして、本発明によれば、残差波形電力法で
はできなかつた変動に対して許容度の大きい認識
が行なえる。また、必要な記憶場所も少なく高速
な認識を行なえる。
特に本発明を音声信号波形の認識に用いれば、
個人差の変動の影響を除けるので、不特定の話者
に対して高精度な認識が可能である。
〔発明の実施例〕
本発明の装置の具体的な構成を説明する前に、
本発明の装置で達成できる識別方式について述べ
る。
カテゴリlから生成された信号波形系列を、そ
の逆フイルタA(l) (z)に通したときの残差波形系

の作るベクトルe(l) =(ei1i2………eiN
T
正規直交ベクトル{〓(l) k=1によつてFour
ier展
開できるものとする。ここで〓(l) の選び方を考
える。ベクトル〓(l) の作る行列を E(l) =(〓(l) (l) i+1………〓
l)
i+N−1)(12) とすれば、共分散行列V(l) は V(l) =E(l)T (l) (13) となる。共分散行列の平均を考えて、 とすれば、P次の共分散の平均が求められる。こ
こでは任意の大数である。
()の固有値問題 V(l)(l) =λ(l) (l) 、‖〓(l) ‖=1、k=1、2、………、N (15) を解けば、固有値λ(l) は〓(l) 方向の分散を
表わ
している。そこで、固有値の大きい方からK個採
用することとし、 d(l) =(〓(l)、〓(l) )、k=1、2、………、K (16) とすれば、カテゴリlの任意の残差系列ベクトル
は、 〓(l)=M(l)(l)+O (17) とFourier展開できる。ここで、M(l)=(〓(l)
(l) ………〓(l) )、〓(l)=(d(l)
(l) ………d
(l) Tである。
式(15)より〓(l) は形式的にはN本とること
ができるが、もし予測フイルタの次元をPとする
ならば、〓(l) は最大P個計算できる。
{〓(l) k=1は分散の大きい方から選んで
きた
のであるから、式(17)よりM(l)(l)をとりの
ぞくことができれば、系列{e(l) }の変動は小
さくなることが期待できる。〓(l)より{〓(l)
k=1で規定される方向の成分をとりされば、〓(l)
は{〓(l) k=1の方向に極性をもつこととな
る。
を計算すれば、〓(l)は上記の性質をもつているの
で、この意味で〓(l) を極性誤差と呼ぶ。
(l)のノルムの自乗によつて判断すれば、〓(l)
のノルムの自乗によつて判定するよりもより変動
に強い認識が行なえる。そこで、〓(l)のノルムの
自乗を計算すれば、(〓k、〓k1′)=δkk′であるの
で次式が成立する。
式(19)により認識する方式を極性誤差識別法
と呼ぶ。極性誤差識別法は予め予測係数を用意す
るという点で残差波形電力法に類似し、その長所
をうけついでいる。なおかつ、予め正規直交ベク
トル{〓(l) }を1個以上K個用意し、残差系列
との内積値の自乗値を残差系列のノルムの自乗よ
りとりさることによつて統計的に分散の大きい方
向に対して許容度を増し、変動に強い認識方式と
なつている。
式(19)を用いて認識する方式を今まで考えて
きたが、式の変形により計算量が少なくなる方式
がある。この方法は、残差波形電力を計算する際
に、入力信号波形系列の自己相関とフイルタA
(l) (z)の係数の自己相関の内積により‖〓(l)

計算する方式を発展改良したものである。以下
に、本方式の達成できる認識方式と装置の説明を
行なう。
残差波形電力を入力信号波形列の自己相関とフ
イルタA(l) (z)の係数の自己相関の内積により計

する方式は次のようになる。‖〓(l)をフイ
ルタA(l) (z)を考慮して計算すれば、 となる。ここで右辺の中の括弧を自己相関と考え
れば、 となる。また、 とすれば、式(20)は となる。ここでA(l) は逆スペクトル係数であ
る。
残差波形電力法においては式(23)を計算すれ
ば良いのであるが、極性誤差識別法では系列{〓
(l) k=1を考える必要がある。そこで、入力
信号
波形系列{xo}より系列{〓(l) k=1を生
成する
フイルタ。
を考える。
(l) k(z)の係数ベクトルを〓(l) =(q
(l) k1(l) k2
……q(l) kP)、Xiを入力信号波形系列の第i区
間の
計画行列として、 X i(l) =X (l) (25) の関係があるものとする。入力信号波形系列の変
動を考慮して、入力信号波形系列の平均を とすれば、式(25)は R〓(l) =XT(l) (28) となる。これよりフイルタQ(l) k(z)の係数を決
定す
れば、 〓(l) =R-1XT(l) (29) となる。式(29)の〓(l) を用いれば〓(l)
成分
μ(l) koは最小自乗の意味で と計算できる。ただし、式(30)によつて生成さ
れた系列は厳密に直交関係を保つてはいない。ま
たノルムは入力xoに依存するため1とはならな
い。
そこで、〓(l) のノルムを正規化するために、〓
(l) /‖〓(l) ‖を計算する。
(l) のノルム‖〓(l) ‖は、 となる。
とし、また式(21)を用いれば式(31)は となる。ゆえに‖〓(l) ‖により正規化できる。
式(30)に示したμ(l) koとe(l) の内積を
計算す
れば、 となる。ここでq(l) =0である。
として式(21)を用いれば式(34)は となる。ただし、i0の場合B(l) ki、i<0の
場合B(l) k−iを用いる。
式(23)、(33)、(37)を用いれば式(19)は となる。
式(19)と式(38)を比較すれば、式(38)の
方は乗算回数が式(19)よりも少なくまた、{A
(l) (z) l=1の係数と{〓(l) k=
l=1を用意する代
わりに、{A(l) i=0 l=1 {B(l
ki k=1 i=−p
l=1、{C(l) ki k=1 i=0
l=1を用意すればよ
く、記憶場所も少なくてすむという利点がある。
式(38)は式(19)を変形したものであり、演
算を自己相関に限定しているものの、極性誤差識
別法の利点をそこなつておらず、前記式(19)に
よる認識方式よりも発展改良されている。
第1図は何えば母音の識別を行なう音声認識シ
ステムに本発明を適用したものである。
図において、1は信号波形系列{xo}のP次
の自己相関{vi i=0を計算する自己相関演算装
置、21,………,2l,………,2Lは類毎す
なわち母音毎に極性誤差の自乗和‖〓(l)
計算する演算回路1,………,l,………,L,
3は各類毎に得られた極性誤差の自乗和出力から
最小となるものを検出しその類名(l)を認識結
果として出力する最小値検出回路である。入力信
号系列としては、図示しないA/D変換器等によ
り音声信号を△t時間間隔でサンプリングされた
直列又は並列のデイジタル信号系列{xon1 o=o

が供給されるものとする。
第2図は演算回路2lの一構成例を示している
が、残りの演算回路も同様に構成することができ
る。図において、4は自己相関viと逆スペクト
ル係数A(l) との内積を計算することにより残差
波形系列のノルムの自乗‖〓(l)を求める回
路であり、残差波形電力法においてはこの回路の
出力の大小からxoの属する類を決定していた。
第2図において以下に説明する残りの回路は本発
明により付加さされたものである。51,……
…,5k,………,5Kは夫々式(38)の右辺第
2項中の(Σ i=−P(l) kii/Σ
=−P
(l) ki
i)を計算する回路、6は回路51,………,5
k,………,5Kの出力を加算して式(38)の右
辺第2項の値を求める加算回路、7は回路4の出
力から回路6の出力を減算する減算回路である。
したがつて、減算回路7の出力は、極性誤差系列
のノルムの自乗‖〓(l)となつている。
第3図は第2図における回路5kの一構成例を
示している。回路8は自己相関viと補助波形系
列〓(l) から予じめ求められた係数B(l) ki
の内積
を求める回路、回路9は回路8の出力を自乗する
自乗回路、回路10は自己相関viと補助波形系
列〓(l) から予じめ求められた係数C(l) ki
の内積
を求める回路であ。除算回路11は回路9の出力
を回路10の出力で除算し出力d(l) =(Σ i=
−P

(l) kii/Σ i=−P(l) kiiを得
ている。なお、
係数B(l) ki、C(l) kiは予じめ算出されて図
示しない
記憶装置に収容され、viと同期して取り出され
て回路8,10の計算に利用されている。
本実施例によれば、入力音声波形列の変動が残
差波形系列に与える影響を、各類毎に予じめ正規
直交関係にある補助系列{〓(l) k=1の成分
を残
差波形系列より取り除くことができる。従つて、
変動に対して許容度の大きい認識が行なえるとと
もに必要とする記憶領域を減少させかつ高速な認
識を行なうことができる。
〔発明の変形例〕
(1) 本発明は音声波形の識別に限られず、心電図
波形等の識別にも用いることができる。また、
これらの1次元波形以外のn次元の波形につい
てもn次元フイルタを用いることにより実現す
ることができる。例えばn=2としては平面画
像から得られた信号波形の識別も可能である。
(2) 上記実施例はすべてデイジタル回路により構
成したものであるが、その少なくとも一部をマ
イクロコンピユータ等によるプログラム制御で
実現することもできるし、アナログ演算回路で
構成することもできる。この場合、積和回路、
自乗和回路等は内積演算が可能な素子、例えば
光学フイルタを用いたもの、表面弾性波素子等
を用いることができる。
(3) 各類に対する変動方向の数Kは類毎に異なつ
ていてもよい。
(4) 上記実施例では最も好ましい補助系列として
正規直交関係にあるように選んであるが、必ず
しもその必要はない。
但しこの場合にはKを大きくとることが望ま
しい。
【図面の簡単な説明】
第1図は本発明の一実施例を示す図、第2図及
び第3図は本発明の一実施例の各部の構成例を示
す図である。 1……自己相関演算装置、21,………,2
l,………,2L……演算回路、3……最小値検
出回路。

Claims (1)

  1. 【特許請求の範囲】 1 類の未知なる入力信号波形系列の自己相関を
    求めた後、L種類の類の既知なる標準信号系列に
    対応する逆スペクトル係数と前記自己相関出力と
    の主内積値を求め、この値により前記入力信号波
    形系列の属する類を決定する認識方式において、 前記L種類の各類毎に前記入力信号波形系列の
    変動を除くための第1及び第2の係数を1又は複
    数組発生し、前記自己相関出力と第1の係数との
    第1の内積値及び前記自己相関出力と第2の係数
    との第2の内積値を求め、第1の内積値を自乗し
    た自乗値を対応する第2の内積値で除算した後各
    除算結果を加算し、この加算出力を前記主内積値
    から減算し、各類毎に得られる減算結果から前記
    入力信号波形系列の属する類を決定することを特
    徴とする信号波形認識方法。
JP2873782A 1982-02-26 1982-02-26 信号波形認識方式 Granted JPS5910999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2873782A JPS5910999A (ja) 1982-02-26 1982-02-26 信号波形認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2873782A JPS5910999A (ja) 1982-02-26 1982-02-26 信号波形認識方式

Publications (2)

Publication Number Publication Date
JPS5910999A JPS5910999A (ja) 1984-01-20
JPS6255799B2 true JPS6255799B2 (ja) 1987-11-20

Family

ID=12256732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2873782A Granted JPS5910999A (ja) 1982-02-26 1982-02-26 信号波形認識方式

Country Status (1)

Country Link
JP (1) JPS5910999A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2586688B2 (ja) * 1990-05-07 1997-03-05 上村工業株式会社 ガラス―金属複合物の電気めっき方法
JPH07215108A (ja) * 1994-01-31 1995-08-15 Katsumi Yaguchi 車両のシート装置

Also Published As

Publication number Publication date
JPS5910999A (ja) 1984-01-20

Similar Documents

Publication Publication Date Title
Jones Identification and autoregressive spectrum estimation
Kumaresan On the zeros of the linear prediction-error filter for deterministic signals
Xu et al. A pitch detector based on a generalized correlation function
Milner Inclusion of temporal information into features for speech recognition
Zhang et al. CGHA for principal component extraction in the complex domain
Al-Kaltakchi et al. Comparisons of extreme learning machine and backpropagation-based i-vector approach for speaker identification
CN112116922A (zh) 一种噪声盲源信号分离方法、终端设备及存储介质
EP0374604B1 (en) Pattern recognition system and method
Hu et al. A new eigenstructure method for sinusoidal signal retrieval in white noise: estimation and pattern recognition
JPS6273391A (ja) パタ−ン認識学習装置
KR102590887B1 (ko) 음원의 공간적 위치 및 비음수 행렬 분해를 이용한 음원 분리 방법 및 장치
CN110491408B (zh) 一种基于稀疏元分析的音乐信号欠定混叠盲分离方法
JPS6255799B2 (ja)
Karo et al. Compact Time-Domain Representation for Logical Access Spoofed Audio
JPS6258520B2 (ja)
Usevich et al. Characterization of finite signals with low-rank STFT
David et al. HRHATRAC algorithm for spectral line tracking of musical signals
Mazur et al. A new clustering approach for solving the permutation problem in convolutive blind source separation
JPS6255800B2 (ja)
Taha Efficient Blind Source Separation Algorithms with Applications in Speech and Biomedical Signal Processing
Bhargava et al. Linear methods for efficient and fast separation of two sources recorded with a single microphone
JPS5915993A (ja) 音声認識装置
Susuki et al. Koopman Resolvents of Nonlinear Discrete-Time Systems: Formulation and Identification
US6522996B1 (en) Non-stationary/transient signal feature extraction system
Chen On digital signal modelling and classification with the teleseismic data