JPS619700A - 音声の特徴抽出方式 - Google Patents

音声の特徴抽出方式

Info

Publication number
JPS619700A
JPS619700A JP59132192A JP13219284A JPS619700A JP S619700 A JPS619700 A JP S619700A JP 59132192 A JP59132192 A JP 59132192A JP 13219284 A JP13219284 A JP 13219284A JP S619700 A JPS619700 A JP S619700A
Authority
JP
Japan
Prior art keywords
noise
autocorrelation function
speech
equation
autocorrelation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59132192A
Other languages
English (en)
Inventor
哲 中村
藤本 好司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP59132192A priority Critical patent/JPS619700A/ja
Publication of JPS619700A publication Critical patent/JPS619700A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Sorting Of Articles (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 木兄F!Aは、音声の特徴として、自己相関係数葡抽出
する特徴抽出方式において、雑音中の音声の自己相関関
数から、雑音区間の自己相関関数を減算することにより
、真の音声の自己相関関数を推定し、より効果的な特徴
抽出を行なう音声特徴抽出方式に関するものである。
く従来技術及び背景〉 従来よシ、自己相関関数及び、これをパワーに偲 より正規化した自己相関関数が音声の特徴として用いら
れているが、これは、聴覚がスペクトル情報に対応して
いるこb基ついたもので、自己相関関数は、WIENE
R−KHINTHINEの公式よp1パワースペクトル
に対応している。今、デジタル化された音声信号= 5
(n)、自己相関関数tR(τ)とすると、 で表わされ、さらに、R(τ) 全R(0)で正規化す
ることによシ、(2)式のように自己相関係数C(τ)
を得るO C(τ)=R(τ)/ R(0)          
 ・・・・・(2)次に、雑音中で自己相関関数を抽出
する場合には、デジタル化された雑音信号’x N(n
)とするさ、雑音中の音声信号心)は(3)式で表され
る。
X(n)−5(n)十N(n)          −
−−−・−−+3+このとき、X(n)の自己相関関数
Rx(τ) n (4)式となる。
また、(4)式は(3)式を用いると、(5)式となる
Rx(τ)=]/N  Σ(Sllk)+N眞))・(
S(k十τ)十N(k十τ))K=1 己相関関数1Rs(τ美音声信号と雑音信号の相互間関
数をRsn(τ)とすると、(5)式は(6)式となる
Rx(t)= Rs(t)+Rn(r)+2Rsn(τ
)   −(6を従って、雑音中の音声信号から自己相
関関数を抽出した場合、常に、Rn(τ)+2 Rs 
n(τ)の誤差があり、真の自己相関関数Rs(τ)と
はならない。以上の、と、とより、雑音中で自己相関関
数全抽出する場合には、真の値が得られず、また、これ
を用いた音声認認装置においても、登録時、認識動作時
の雑音環境が異なれば、正しい認識ができないという問
題点がある。
〈発明の目的〉 そこで、本発明は、雑音環境下で発声された音声の自己
相関関数から時間軸上で最も近傍の雑音区間の自己相関
関数を減算して、常に、真値に近い自己相関関数を求め
る方式を提供することを目的とする。
〈実施例〉 以下、本発明の方式について詳細に説明する。
式(6)において、一般に、音声信号と雑音信号間の相
関は、非常に小さいと見做せるので、式(7)が成立す
る。
Rs n(τ)=0         ・・・・・・・
・・・・・・・・(7)従って、音声信号の推定された
自己相関関数△ Rs(τ)は、式(8)のように推定できる。
介s(τ)−Rx(τ)−Rn(τ)    ・・・・
・・・・・・・・・+8)ここで、Rn(τ)は、雑音
環境下の音声信号の同一分析フレーム内での雑音の自己
相関関数であるか、これを実際に正確に求めるのは困難
である。
しかし、雑音が定常であり、時間的に、その分析フレー
ムの十分近傍であれば、その雑音のみの部分(無音声フ
レーム)の自己相関関数Rn(τ)と、十分等しいと見
なすことができる。よって式(9)を得る。
Qs(r)= Rx(r)−Rn(τ)     −−
・−(9)次に、自己相関関数を、自己相関係数とパワ
ーの積の形で表現すると、式(10)となる。
ここで、Pst P’n、 Pxは、音声信号、雑音信
号、入力信号のパワ”を表わし、それぞれ、R8(0)
1Rn(0)、 Rx(0)に等しい。また、C8(T
)I C’n(τ)、 Cx(r)eけ、これらの自己
相関係数を表わす。
音声信号の推定された自己相関係数θS(τ)は、式[
9) 、 (10)を用いて、式(11)のようになる
P x CX(T) −P n−C’n(τ)=□ ・
・・・・・・・・・(11) Px−P’n ところで、雑音環境下での音声信号と雑音の比を、式(
I2)のように定義し、パワーの比とする。
α= P x / P n          −・=
 ・・・・(12)式(+2)k用いて、式(11)は
次の式(13)のようになる。
△ 式03)が示す様に、αが1に近いとき、Cs(τ)は
無限大に近くなり、Cs(τ)の推定誤差が極めて大き
くなる〇 また、自己相関係数の絶対値は、Ik超えないという条
件を満たすかの吟味については、式(14)をみたす必
要がある。
これを展開して、式α5)を得る。
(CX2(7)−1)a2−2α(1−Cx(r) C
’n(τ))+(Cn2(r)−1)≦0あり、式(1
6)に示す2根を持つ。
よって、α1≦α≦α2 又はα2≦α≦α1なるαに
対して、式(14)の不等式を満さず、相関係数の絶対
値が1を超える。
ここで、αの定義式(12)よシαが1よシl卦さいと
いう事は、信号がないことを示していて無意味であり、
今仮に1≧Cx(τ≧C′n(τ)≧−1とすると、α
〈1≦α2であるので、実質的にはα〉α2の領域で、
△ Ic5(τ)1が1以下の値を持つことを保証する。
l≧Cn(τ)≧Cx(τ)≧−1であるときは、・α
2≦1≦α1であり、この場合はα〉α1の領域で絶対
値1以下を保証する。
よって、α〉α2またはα〉α1′ff:満たさないα
全 −与える分析フレームでは、特にα=1付近で絶対
  ”△ 値が+■に発散してし才い、Cs(τ)の推定精度か極
めて要くなり、前記減算演算の効果はなくむしろ逆効果
となる。
さて、一般に音声以外の雑音部分と音声部分を区別する
ために、第3図のようなパワー情報を利用した閾値法が
用いられる 閾値θ2.θ3は、単語区間切り出しのアルゴリズムに
用いられる閾値で、パワーがθ2 を越えた時点で語頭
の候補を、θ3を越えた時点で単語の存在を確定する。
しかし実際には、音声の単語パワー系列は、急激にθ2
を越えるのではなく、(音韻にもよるが)ゆるやかな変
化を伴なうので、パワーの小さい音声と雑音が同一視さ
れてしまう恐れがある。このため、θ1の閾値を設け、
01以下で雑音、62以上で音声とする、2閾値法が用
いられる。
前記減算演算にふいて、雑音の経時変化に対応する必要
性から、適宜、雑音の自己相関関数の更新が必要である
。ここで、上述した2閾値法のように・θ1を設ければ
、雑音の自己相関更新時に、音声区間を誤−て平均しな
a−ようにできる。
すなわち、周囲雑音のパワーに対して、式Q4ji満た
すようにパワーの閾値θ2を決定するとき、(1,1)
Px)θ2なるとき、式(9)の減算演算、(2,1)
Px≦01なるとき、雑音の自己相関の更新演算、 全行なえば良い事になる。
θ2に対するパワーの比をαθ2とすると、αθ2〉α
2(又はα1)なるθ2が、減算演算を行なうパワーの
閾値となる。
α2(又はα1)については、 で、各次数により変化するが、ディジタル回路で実現す
る場合、相関係数をnビットで表現することになる。つ
まり、 であって、さらに負号性4ビット表現として、n = 
3とすると、 7≧α2(又はα1)≧014 と規定できる。上記から、いかなる相関次数の値に対し
ても、α2(又はα1)−7以上であれば絶対値を1以
下にできる。
α#2>α2(又はα1)より、θ2 /P ’n )
 7で良いから、θ2>P’n X?とすれば、式(1
4)の条件を常に満たすθ2を設定することができる。
P′nについてゆ大体の値を初めに設定しておくか、認
識時あるいは登録時のはじめの順方ミリ秒の間にこれを
自動的に設定する方法が考えられる。
しかし今、Pnの最大範囲が音声・雑音区分の2閾値法
の01に等しいものきすると、雑音の自己相関更新時に
、音声区間を誤って平均しないようにできる等の利点が
あって、非常に好都合である。なお、この場合、θ2と
してはθ1の7倍以上の値で設定すればよいことになる
実現の具体的回路例 第1図に、上記を実現するための具体的回路例を示す。
第1図において、マイクロホンIより、音声が入力され
アンプ2に入る。アンプ2は、約IKHzから6jB1
0CTの高域強調特性となっている。アンプ2で増巾さ
れた信号は、ローパスフィルタ(LPF3)  に入力
される。LPFaは、A/D変換の折シ返し雑音を除く
ためのアンチエイリアスフィルタと々っている。LPF
3’の出力はA/D変換器4に入力され、デジタル信号
に変換された後、自己相関器5に入力される。自己相関
器5では、5〜10m5程度の分析区間内の自己相関関
数が求められ、分析区間終了毎に、比較回路6に送られ
る。
比較器6では前述の知見(+、 ])(2,l)  に
基づいて、Px≦01なるとき、自己相関器5の出力を
雑音更新回路8へ送る。雑音更新回路8では、更新、あ
るいは平均操作により更新を行なう。
Px)θ2なるとき、自己相関器5の出力は雑音減算回
路7に送られる。雑音減算回路7では式(9)に基つき
、雑音更新回路8から雑音出力を用いて雑音減算処理を
行なう。減算された自己相関関数は、判別処理部9に送
られ、ここで音声の識別が行われる。
第2図に比較回路6、雑音更新回路8、雑音減算回路7
の詳細金示す。
第2図における各回路要素は、制御回路部10により統
括して制御される。初期状態では、パンツy+5の内容
はクリアされており、マルチプレクサ12は雑音更新(
下側信号線)にセレクトされている。
入力された自己相関関数のうちR(0)から、比較回路
11によシθ1.θ2と比較して犬か小かのセレクト信
号をマルチプレクサ12に送る。
(イ)Px=R(0)≦θ1なる場合、このとき、雑音
の自己相関関数の更新を行なうが、更新方法は式(17
)に%式%(17) この更新方法は、雑音の準定常が、実際上は極めていい
加減で、なだちかに変化する場合や、急に変化する場合
など様々であって、これに適応的に対処すること、また
逆に突発性の雑音や、音声との誤まりを適応スピードを
緩めて対処することを目的きしている。
Rn(r) ”ir: y(n)、Rn(v) ’tx
(n)  とすると、式(17)i−j、y(n)= 
y(n−1)+y(x(n)−y(n−1))”V(n
−t)(+十γ)十γx(n)Z変換して、 Y(z) −(I−7) Y(z)Z  ’ +7x(
z)H(z)一種か となり、γによって規定される ]−Z−’  の逆フ
ィルタ七なジ平滑フィルタと、なる。
このフィルタのγを十分小さく走ることにより、平滑ス
ピードを緩めることができ、突発性雑音を避けられるこ
と、及びγの値をRn(τ)−Rn−1−(r)の負号
によって変化させることにより、雑音のパワーの立ち上
がりでゆっくり、立ち下がりで急速に応答させることが
できる。また、計算式が、ロジックあるいはマイクロコ
ンピュータのプログラムに乗りやすく、γf1/2n(
nは正整数)に設定することで、容易に平滑が案現でき
、記憶すべき値も極めて少ないという利点かある。
図より、マルチプレクサ12は当初下側信号線をセレク
トしておシ、該下側信号線に入力された自己相関関数を
出力する。減算器13では、バッファ15内に格納しで
ある前分析フレームまでの雑音の自己相関関数を制御回
路10のリード信号とアドレスによシ読み出し、入力さ
れた自己相関関数との減算を行なうと同時に、レジスタ
16に値全格納する。
減算器13の出力を、γ回路14においてγ倍するが、
γ=O,I25  とすると右へ3回のシフトラ行えば
良い。ソフト後の値は、レジスタ16の値と加算器17
で加算され、加算器17の出力に、制御回路10のライ
ト信号とアドレスによりバッファ15に格納され、雑音
の自己相関関数の更新が行なわれた。
(ロ)Px=R(0))θ2なる場合、このとき、雑音
の自己相関関数を、音声の自己相関関数から減算する処
理を行なう。
マルチプレクサI 2 i’t: Px=R(0)>θ
2で上側信号線をセレクトし、該上側信号線に自己相関
関数全出力する。減算器18では、制御回路10のリー
ド信号とアドレスよシ更新された雑音の自己相関関数を
読み出し減算する。これにより求められた音声の推定臼
、己相関関数は、第1図に図示の判別処理回路9に出力
され、ここにおいて自己相関係数に変換され音声の識別
が行なわれる。
〈発明の効果〉 以上のように本発明によれば、時間軸上で最も近傍の雛
り童区間において更新演算される雑音の自己相関関数を
利用し、雑音環境下で発生された音声の自己相関関数か
ら真値に近い自己相関関数を求めるようにしたものであ
シ、効果的な特徴抽出を行なうことができる。さらに、
音声区間と雑音区間を区別するパワー情報による2閾値
法を併用すれば、雑音区間の更新演算に誤差がなくなシ
有用である。
【図面の簡単な説明】
第1図は本発明方式の具体的実現例を示すブロック回路
図、第2図は第1図の要部詳細図、第3図はパワー情報
の閾値を説明する図である。 5・・・自己相関器、6・・・比較回路、7・・・雑音
減算回路、8・・・雑音更新回路。 代理人 弁理士 福 士 愛 彦 (他2名)第1図 第3図

Claims (1)

  1. 【特許請求の範囲】 1、雑音中の音声の自己相関関数から、経時変化に対応
    して更新される雑音区間の自己相関関数を減算すること
    により、真の音声の自己相関関数を推定してなることを
    特徴とする音声の特徴抽出方式。 2、特許請求の範囲第1項記載において、パワー情報に
    対する2つの閾値(閾値1≦閾値2)を設け、分析区間
    内のパワーが閾値1より小なるとき、雑音の自己相関関
    数を更新演算し、閾値2より大なるとき音声区間と判断
    して、雑音中の自己相関関数から、前記更新された雑音
    の自己相関関数を減算することを特徴とする音声の特徴
    抽出方式。
JP59132192A 1984-06-25 1984-06-25 音声の特徴抽出方式 Pending JPS619700A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59132192A JPS619700A (ja) 1984-06-25 1984-06-25 音声の特徴抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59132192A JPS619700A (ja) 1984-06-25 1984-06-25 音声の特徴抽出方式

Publications (1)

Publication Number Publication Date
JPS619700A true JPS619700A (ja) 1986-01-17

Family

ID=15075543

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59132192A Pending JPS619700A (ja) 1984-06-25 1984-06-25 音声の特徴抽出方式

Country Status (1)

Country Link
JP (1) JPS619700A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5565999A (en) * 1978-11-10 1980-05-17 Nippon Electric Co Voice analytical synthesizer
JPS5781733A (en) * 1980-09-09 1982-05-21 Northern Telecom Ltd Method and means for detecting voice in voice channel signal
JPS5999497A (ja) * 1982-11-29 1984-06-08 松下電器産業株式会社 音声認識装置
JPS60195599A (ja) * 1984-03-19 1985-10-04 三洋電機株式会社 音声分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5565999A (en) * 1978-11-10 1980-05-17 Nippon Electric Co Voice analytical synthesizer
JPS5781733A (en) * 1980-09-09 1982-05-21 Northern Telecom Ltd Method and means for detecting voice in voice channel signal
JPS5999497A (ja) * 1982-11-29 1984-06-08 松下電器産業株式会社 音声認識装置
JPS60195599A (ja) * 1984-03-19 1985-10-04 三洋電機株式会社 音声分析方法

Similar Documents

Publication Publication Date Title
US5197113A (en) Method of and arrangement for distinguishing between voiced and unvoiced speech elements
CA2034354C (en) Signal processing device
US5490231A (en) Noise signal prediction system
US4415767A (en) Method and apparatus for speech recognition and reproduction
US5774847A (en) Methods and apparatus for distinguishing stationary signals from non-stationary signals
US5483594A (en) Method and device for analysis of a return signal and adaptive echo canceller including application thereof
EP0750292B1 (en) Speech recognition method and speech recognition system with reduced recognition time in consideration of environmental variation
US5732141A (en) Detecting voice activity
JPS619700A (ja) 音声の特徴抽出方式
JP3270866B2 (ja) 雑音除去方法および雑音除去装置
JPH04184400A (ja) 雑音除去装置
JPH04340599A (ja) 雑音除去装置
JPH04238399A (ja) 音声認識装置
JPH04163497A (ja) 音声区間検出方法
JPS6075898A (ja) 単語音声認識装置
JPH0458297A (ja) 有音検出装置および有音検出方法
JPH10124084A (ja) 音声処理装置
JPH09198079A (ja) 音声認識装置
JPH0635498A (ja) 音声認識装置及び方法
JPH01200294A (ja) 音声認識装置
JPH0293697A (ja) 雑音除去方法
JPH02198500A (ja) 音声認識装置
JP2599974B2 (ja) 音声検出方式
JPH0285898A (ja) 音声検出方式
JPS63262695A (ja) 音声認識方式