JP2002014694A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2002014694A
JP2002014694A JP2000197744A JP2000197744A JP2002014694A JP 2002014694 A JP2002014694 A JP 2002014694A JP 2000197744 A JP2000197744 A JP 2000197744A JP 2000197744 A JP2000197744 A JP 2000197744A JP 2002014694 A JP2002014694 A JP 2002014694A
Authority
JP
Japan
Prior art keywords
noise
frequency
frequency spectrum
subtraction
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000197744A
Other languages
English (en)
Inventor
Hiroyuki Hoshino
博之 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Central R&D Labs Inc
Original Assignee
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Central R&D Labs Inc filed Critical Toyota Central R&D Labs Inc
Priority to JP2000197744A priority Critical patent/JP2002014694A/ja
Publication of JP2002014694A publication Critical patent/JP2002014694A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 減算パラメータαを周波数ごとに設定するこ
と。 【解決手段】 例えばスペクトルサブトラクション法に
おける減算パラメータαを、音声信号区間の直前の区間
の雑音の周波数スペクトル包絡に基づき、周波数ごとに
設定する。こうして、雑音の周波数スペクトル包絡の最
大値では例えば減算パラメータαを3、雑音の周波数ス
ペクトル包絡の最小値では例えば減算パラメータαを1
とする。こうして、各周波数ごとに雑音の大きさに応じ
て雑音抑制効果が有効に働く。こうして音声認識性能を
大きく改善することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、継続的に雑音の発
生する騒音下において、有効に作用する音声認識装置に
関する。
【0002】
【従来の技術】入力された音声から発音、単語及び文章
を分析理解する装置である音声認識装置において、雑音
信号を除去し音声信号のみを取りだすことが望ましいこ
とは言うまでもない。ところが継続的ではあるものの一
定ではない雑音の発生する騒音下においては、雑音を予
め予測することは容易ではない。白色雑音でない騒音の
例としては、移動中の車両、船舶、航空機等の操縦室或
いは貨物室、作業機器及び輸送機器による騒音を有する
工場及び倉庫内などが挙げられる。
【0003】このような、継続的ではあるものの一定で
はない雑音の発生する騒音下における音声認識装置にお
いて、雑音を低下させる手法にスペクトルサブトラクシ
ョン法がある。線型スペクトルサブトラクション法は、
入力信号を周波数スペクトルに変換した後、音声を含む
信号区間と背景雑音信号区間とに判別し、音声を含む信
号区間の周波数スペクトルからその直前の背景雑音信号
区間の周波数スペクトルを減じることで音声信号の周波
数スペクトルを得るものである。この際、直前の背景雑
音信号区間の周波数スペクトルのパワーを一律に1乃至
3倍として音声を含む信号区間の周波数スペクトルから
減じることで、雑音抑制をより効果的にすることもでき
る。
【0004】一方、非線型スペクトルサブトラクション
法と呼ばれる、減算パラメータαを周波数毎に設定する
ものが知られている(P. Lockwood and J. Bondy, Spee
ch Communication, 11 (1992) 215)。これは、周波数
毎の減算パラメータα(ω)を、音声を含まない周波数ス
ペクトルの、各周波数ω毎の最大値(又はそれに比例さ
せる)とするものである。例えば時間軸上40個のフレー
ムを切り出し、各々を周波数変換して、周波数毎に40個
のスペクトル(パワー)のうちの最大値をとるとするも
のである。また、特開平9−160594には、周波数
帯域毎に減算パラメータαを最小二乗近似により求める
方法が記載されている。この文献においては、最小二乗
近似計算の計算量を減らすため周波数の帯域毎とする構
成である。また、特開平10−177394には、騒音
のスペクトル分析により予め記憶されたパターンのいず
れであるかを認識し、それにより減算パラメータαを読
み出す構成が開示されている。
【0005】
【発明が解決しようとする課題】非線型スペクトルサブ
トラクション法(NSS)においては、減算パラメータ
αの最適設定はその計算量が問題となる。上述の最大値
によるものでは、極めて多量の計算(上記文献では40区
間での最大値比較)が行われることとなり、計算量が膨
大となる。一方、最小二乗近似のものでは、過大な計算
を避けるため周波数の帯域毎とする構成としているが、
これでは減算パラメータαの値が周波数帯域の境界領域
において不適切なものとなる可能性が大きく、粗い算出
方法と言わざるを得ない。さらに予め騒音パターンを記
憶しておく方法では、各パターン毎に減算パラメータα
(ω)を記憶させるため、極めて膨大なメモリが必要とな
る。
【0006】本発明は上記の課題を解決するために成さ
れたものであり、その目的は簡易且つ計算量を抑えたま
ま、各周波数ごとの減算パラメータα(ω)を算出する方
法を提供することである。
【0007】
【課題を解決するための手段】上記の課題を解決するた
め、請求項1に記載の手段によれば、騒音下における音
声認識装置において、任意の区間に対し周波数スペクト
ルを求める周波数分析手段と、音声を含まない時間区間
に対し、周波数分析手段により求められた雑音周波数ス
ペクトルのスペクトル包絡を求め、各周波数における該
スペクトル包絡に対応して減算パラメータを設定する減
算パラメータ算定手段と、音声を含む時間区間に対し、
周波数分析手段により求められた周波数スペクトルか
ら、雑音周波数スペクトルの周波数ごとに減算パラメー
タ算定手段により決定された各周波数における減算パラ
メータを乗じた値を減算する減算手段とを備えたことを
特徴とする。
【0008】
【作用及び発明の効果】本発明においては、減算パラメ
ータを算出するための元となるものは、音声を含まない
時間区間の信号のみであり、実質的には1組の雑音デー
タから、観測データ中の音声信号を取りだすことができ
る。また、減算パラメータを算出する方法が、簡易な雑
音データのスペクトル包絡を求めることであり、極めて
容易である。この様にして得られた減算パラメータは、
各周波数ごとに設定され、且つ、雑音のパワーの確率論
的な周波数毎の時間変動を平均したものとすることがで
きる。即ち、この減算パラメータを用いることで、音声
を含む信号区間における雑音スペクトルを充分に抑制す
るよう推定した、減算パラメータとすることができる。
こうして、スペクトル包絡から減算パラメータを算出す
ることで、全体の構成としても小さく、且つ適切な減算
パラメータを算出できる音声認識装置とすることができ
る。
【0009】
【発明の実施の形態】以下、本発明の具体的な実施例に
ついて説明する。なお、本発明は以下の実施例に限定さ
れるものではない。
【0010】図1は、本発明の要部である、雑音周波数
スペクトルのスペクトル包絡と減算パラメータαとの関
係の一例を示すグラフ図である。本実施例では雑音周波
数スペクトル包絡に対し、減算パラメータαが最大2.
6最小0.9となるよう設定している。即ち、雑音周波
数スペクトル包絡の値が高いところでは減算パラメータ
αを大きく、雑音周波数スペクトル包絡の値が低いとこ
ろでは減算パラメータαを小さくする。このように、雑
音スペクトル包絡の各周波数ごとの値から減算パラメー
タαを決定するよう設定することで、容易に周波数依存
のパラメータαを決定できる。
【0011】図2に、雑音信号から雑音周波数スペクト
ルのスペクトル包絡を求める具体例を示す。ディジタル
データである雑音信号波形を高速フーリエ変換器(FF
T,1)により高速フーリエ変換し、各周波数毎のパワ
ー(雑音周波数スペクトル)を求める。これの対数(l
og、図2で11)をとって再度高速フーリエ変換(F
FT、図2で12)すれば、雑音信号のケプストラムを
得ることができる。ここでケフレンシーの低い部分のみ
を取りだし(図2で13)、低ケフレンシー成分を逆高
速フーリエ変換(IFFT、図2で14)すれば、雑音
周波数スペクトルの対数の包絡を得ることができる。こ
の後指数(exp、図2で20)をとって雑音周波数ス
ペクトルの包絡として、又は雑音周波数スペクトルの対
数の包絡自体から減算パラメータαを算出することが可
能となる。
【0012】図3は、上記のような減算パラメータαの
算定装置(減算パラメータ算定手段)10を有する音声
認識装置100の概略を示すブロック図である。入力信
号が高速フーリエ変換器(FFT、周波数分析手段)1
により周波数スペクトル信号となる。スペクトル信号は
例えば0〜10kHzの範囲である。次にその周波数スペクト
ル信号が音声有無判定器(音声区間判定手段)2によ
り、1連の入力信号の音声の有無が判定される。例えば
100〜1000Hzの範囲での周波数スペクトルのパワーが他
の範囲の周波数スペクトルのパワーよりも大きいか、な
どの特徴により判定される。ここで音声が含まれない雑
音信号区間であると判断されると、雑音周波数スペクト
ル記憶部(メモリ)3に周波数スペクトル(雑音周波数
スペクトルN(ω))が記憶される。また、減算パラメー
タ算定部(減算パラメータ算定手段)10に雑音周波数
スペクトルN(ω)が送られる。
【0013】減算パラメータ算定部10では、以下のよ
うにして雑音周波数スペクトルN(ω)から減算パラメー
タα(ω)を算定する。まず、雑音周波数スペクトルN
(ω)の対数logN(ω)が対数演算器11により求められ
る。次に高速フーリエ変換器(FFT)12により、ケ
プストラムCが求められる。次に低ケフレンシー窓器1
3によりケプストラムCのうち低ケフレンシー部分C'
が求められる。次に逆高速フーリエ変換器(IFFT)
14により、雑音周波数スペクトルN(ω)の対数logN
(ω)の包絡l(ω)が求められる。包絡l(ω)の値から減算
パラメータα(ω)が算出器15により求められる。
【0014】この様な演算が、音声を含む信号区間が入
力されるまで続けられ、雑音周波数スペクトルN(ω)と
減算パラメータα(ω)が更新されていく。そして、音声
を含む信号区間が入力されると、その高速フーリエ変換
器(周波数分析手段)1の出力(音声有無判定器2で音
声を含むとされたS(ω))が、雑音抑制処理器(減算手
段)4に出力され、雑音周波数スペクトル記憶部(メモ
リ)3に記憶された雑音周波数スペクトルN(ω)と算出
器15の出力である減算パラメータα(ω)から、次の処
理により出力P(ω)を算出し、音声認識処理部5に出力
する。P(ω)=S(ω)−α(ω)N(ω)
【0015】本願においては周波数スペクトルは、周波
数毎のパワーを意味する。また、ケプストラムを求める
際、スペクトルanから次のようにケプストラムcnを求
めても良い。尚、Σは、kについて、k=1からk=n-1まで
の和である。 cn=an−Σkckn-k/n
【図面の簡単な説明】
【図1】本発明の雑音周波数スペクトルと減算パラメー
タαを決定する雑音周波数スペクトル包絡との関係を示
すグラフ図。
【図2】雑音周波数スペクトル包絡を求めるためのブロ
ック図。
【図3】本発明の具体的な一実施例に係る音声認識装置
の構成を示すブロック図。
【符号の説明】
100 音声認識装置 10 減算パラメータ算定部 1、12 高速フーリエ変換器 2 音声有無判定器 3 雑音周波数スペクトル記憶部 4 雑音抑制処理器 11 対数演算器 13 低ケフレンシー窓器 14 逆高速フーリエ変換器 15 算出器

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 騒音下における音声認識装置において、 任意の区間に対し周波数スペクトルを求める周波数分析
    手段と、 音声を含まない時間区間に対し、前記周波数分析手段に
    より求められた雑音周波数スペクトルのスペクトル包絡
    を求め、各周波数における該スペクトル包絡に対応して
    減算パラメータを設定する減算パラメータ算定手段と、 音声を含む時間区間に対し、前記周波数分析手段により
    求められた周波数スペクトルから、前記雑音周波数スペ
    クトルの周波数ごとに前記減算パラメータ算定手段によ
    り決定された各周波数における減算パラメータを乗じた
    値を減算する減算手段とを備えたことを特徴とする音声
    認識装置。
JP2000197744A 2000-06-30 2000-06-30 音声認識装置 Pending JP2002014694A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000197744A JP2002014694A (ja) 2000-06-30 2000-06-30 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000197744A JP2002014694A (ja) 2000-06-30 2000-06-30 音声認識装置

Publications (1)

Publication Number Publication Date
JP2002014694A true JP2002014694A (ja) 2002-01-18

Family

ID=18696027

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000197744A Pending JP2002014694A (ja) 2000-06-30 2000-06-30 音声認識装置

Country Status (1)

Country Link
JP (1) JP2002014694A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005020212A1 (ja) * 2003-08-22 2005-03-03 Sharp Kabushiki Kaisha 信号分析装置、信号処理装置、音声認識装置、信号分析プログラム、信号処理プログラム、音声認識プログラム、記録媒体および電子機器
GB2413469A (en) * 2004-03-30 2005-10-26 Yamaha Corp Noise spectrum estimation
US8160732B2 (en) 2005-05-17 2012-04-17 Yamaha Corporation Noise suppressing method and noise suppressing apparatus
CN111387978A (zh) * 2020-03-02 2020-07-10 北京海益同展信息科技有限公司 一种表面肌电信号的动作段检测方法、装置、设备及介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005020212A1 (ja) * 2003-08-22 2005-03-03 Sharp Kabushiki Kaisha 信号分析装置、信号処理装置、音声認識装置、信号分析プログラム、信号処理プログラム、音声認識プログラム、記録媒体および電子機器
CN1839427B (zh) * 2003-08-22 2010-04-28 夏普株式会社 信号分析装置、信号处理装置、语音识别装置和电子设备
GB2413469A (en) * 2004-03-30 2005-10-26 Yamaha Corp Noise spectrum estimation
GB2413469B (en) * 2004-03-30 2006-05-03 Yamaha Corp Noise spectrum estimation method and apparatus
US7596495B2 (en) 2004-03-30 2009-09-29 Yamaha Corporation Current noise spectrum estimation method and apparatus with correlation between previous noise and current noise signal
US8160732B2 (en) 2005-05-17 2012-04-17 Yamaha Corporation Noise suppressing method and noise suppressing apparatus
CN111387978A (zh) * 2020-03-02 2020-07-10 北京海益同展信息科技有限公司 一种表面肌电信号的动作段检测方法、装置、设备及介质
CN111387978B (zh) * 2020-03-02 2023-09-26 京东科技信息技术有限公司 一种表面肌电信号的动作段检测方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
US6038532A (en) Signal processing device for cancelling noise in a signal
US6377637B1 (en) Sub-band exponential smoothing noise canceling system
US6108610A (en) Method and system for updating noise estimates during pauses in an information signal
EP2362389B1 (en) Noise suppressor
JP4753821B2 (ja) 音信号補正方法、音信号補正装置及びコンピュータプログラム
KR101737824B1 (ko) 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치
JPH11265198A (ja) ヴィーナーフィルタを用いた信号中のノイズ抑制のための周波数フィルタ方法
US6073152A (en) Method and apparatus for filtering signals using a gamma delay line based estimation of power spectrum
CN105103230B (zh) 信号处理装置、信号处理方法、信号处理程序
CN105144290B (zh) 信号处理装置、信号处理方法和信号处理程序
US9002030B2 (en) System and method for performing voice activity detection
JP2836271B2 (ja) 雑音除去装置
JP2000330597A (ja) 雑音抑圧装置
JP3693022B2 (ja) 音声認識方法及び音声認識装置
JP4123835B2 (ja) 雑音抑圧装置および雑音抑圧方法
JP2002014694A (ja) 音声認識装置
JP2005258158A (ja) ノイズ除去装置
JP2002140100A (ja) 騒音抑圧装置
JP4003566B2 (ja) 音声認識装置
JPH11102197A (ja) 雑音除去装置
KR101993003B1 (ko) 잡음 제거 장치 및 방법
JP3204892B2 (ja) 背景雑音消去装置
US20220319529A1 (en) Computer-readable recording medium storing noise determination program, noise determination method, and noise determination apparatus
Ma et al. A perceptual kalman filtering-based approach for speech enhancement
JP3761497B2 (ja) 音声認識装置、音声認識方法、および、音声認識プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041130

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050531