JPH096391A - 信号推定装置 - Google Patents

信号推定装置

Info

Publication number
JPH096391A
JPH096391A JP7155842A JP15584295A JPH096391A JP H096391 A JPH096391 A JP H096391A JP 7155842 A JP7155842 A JP 7155842A JP 15584295 A JP15584295 A JP 15584295A JP H096391 A JPH096391 A JP H096391A
Authority
JP
Japan
Prior art keywords
signal
frequency
frequency analysis
noise
wavelet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7155842A
Other languages
English (en)
Inventor
Ryuichi Nishimura
竜一 西村
Futoshi Asano
太 浅野
Yoichi Suzuki
陽一 鈴木
Toshio Sone
敏夫 曽根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ono Sokki Co Ltd
Original Assignee
Ono Sokki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ono Sokki Co Ltd filed Critical Ono Sokki Co Ltd
Priority to JP7155842A priority Critical patent/JPH096391A/ja
Publication of JPH096391A publication Critical patent/JPH096391A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】本発明は、原信号に雑音信号が重畳されている
入力信号から原信号を推定する信号推定装置、特に音声
強調に好適な信号推定装置に関し、入力信号の物理的な
S/Nの改善を図るとともに、人間の感覚的な面を考慮
した信号の明瞭度が向上するように原信号を推定する。 【構成】例えばウェーブレット変換法や等比周波数分析
手法等、人間の感覚に合うように、高周波域ほど周波数
分解能を低下させ、一方、高周波域ほど空間分解能ない
し時間分解能を向上させた分析手法を用い、その分析結
果に基づいて原信号を推定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、原信号に雑音信号が重
畳されている入力信号から原信号を推定する信号推定装
置、特に音声強調に好適な信号推定装置に関する。
【0002】
【従来の技術】雑音が付加されて劣化した信号からの元
の信号を復元することは重要な問題であり、古くから多
くの研究がなされてきた。通信の分野では、雑音が重畳
した受信信号から送信側で実際に送った元の信号を推定
できれば、送信側が伝えようとした信号を誤りなく伝達
することができる。
【0003】例えば、近年、利用されることが多くなっ
た衛星通信を考えてみると、通信信号を劣化させれる要
因として、2つの主要なものが考えられる。1つは、通
信経路の長さとともに増大する減衰である。通信信号
は、一度はるか上空を周回している衛星に向けて発せら
れ、そこから受信地点に向けて送られる。この間には、
空気や電離層など、電波を乱反射する媒体が多く存在す
る。したがって、伝送経路が長くなると、それだけ伝送
中に信号のレベルが低下してしまい、結果的に受信点に
おけるS/Nが低下することになる。もう1つは、外来
雑音の存在である。現代のような高度情報化社会におい
ては、多くの通信電波が昼夜を問わずに飛びかってい
る。そのため、いくつかの電波がお互いに干渉しあい、
通信信号にひずみが生じるのは日常茶飯事である。
【0004】また、計測の分野においても、実環境にお
ける測定では、測定したい目的信号の他に、環境に存在
する種々の雑音が同時に測定されることがしばしばあ
る。例えば、はるか遠くに存在する。ある天体の観測を
したいとする。望遠鏡で見ることができないぐらい遠く
にある天体に対しては、その天体が発する光の光量やス
ペクトル、電磁波などを測定し、それを基にして天体の
状態が調べられる。しかし、現代の地球上では、夜中で
も至るところに光があふれており、星の極めて小さな明
かりを測定するのは非常に困難である。例え砂漠の深奥
部に行ったとしても、大気そのものが汚染されているた
め、地上まで光が届かないものもある。また、電磁波に
しても宇宙からは宇宙線と呼ばれる様々な電磁波が地球
に降り注いでいるので、いくら指向性を上げたとしても
目的とする信号だけを測定することは不可能である。こ
のような雑音の中から、必要な信号だけを取り出すこと
は、測定精度や解析結果の信頼性の向上につながる。
【0005】この雑音除去の問題は、通信や計測の分野
のみならず、日常会話や音楽の聴取等、音情報の通信に
おいても重要である。日常、会話を交わす時などには、
環境に何らかの雑音が存在することが多い。元々我々の
耳には、雑音により劣化された信号から、聞きたい音だ
けを取捨選択して聞き取る能力が備わっている。この機
能は、脳内における高度な処理能力や聴覚神経系の巧妙
な働き、特に両耳による相互作用であると言われてい
る。このような優れた機能のおかげで、普段は、音声信
号が多少雑音により劣化されていても、ほとんど気にせ
ずに会話をすることができる。しかし、このような機能
も聴覚障害などが発生すると、その効果が低減されてし
まう。低下した聴力機能を補うための道具として、補聴
器が現在広く用いられている。しかし、聴力が低下した
人が補聴器をしようすると、今まで聴力が低下して聞こ
えなくなっていた雑音が補聴器で増幅されて聞こえるよ
うになることや周波数別に増幅されて自然な音が得られ
ないこと、イヤフォンを通して聞くことなどの種々の原
因により、小さな雑音が非常に耳障りな音として知覚さ
れる。実際、この問題は、補聴器装用者の補聴器に対す
る不満の中で大きな割合を占めている。また、健聴耳に
おいても電話で話をしていたり、イヤフォンを用いて聞
く場合などは、このような機構が十分に機能していると
は言い難い。
【0006】このような場合、雑音により劣化された信
号から原信号を正しく推定することができれば、これら
を解決することができる。それゆえ、これまでにも多く
の研究者がこの問題に問題に取り組み、多種多様な音声
強調法や雑音除去の方法が報告されている。これまで研
究されてきた音声強調法の多くは、フーリエ変換などを
用いて信号を周波数領域に変換し、この周波数軸上にお
いて原信号の振幅スペクトルを推定しようとするもので
あった。
【0007】フーリエ変換は、式(1)が2乗可積分関
数空間の正規直交(orthonomal)基底をなす
ことに注目し、信号をこれらの成分に分解するものであ
る。 ωn (t)=exp(jnωt),n=…,0,1,… ……(1) このような変換により、信号は時間領域から周波数領域
へ変換される。この変換は線形変換であるので、入力信
号のスペクトルが、音声信号のスペクトルと雑音信号の
スペクトルの和で表現されるという関係は保たれる。ま
た、雑音の統計的な性質も周波数領域ではかなり明確で
ある。このような理由から、これまで音声強調のための
信号解析手法としては、フーリエ変換が広く用いられて
きた。
【0008】しかし、フーリエ変換は原理的に−∞ 〜
∞の時間情報が必要となり、現実にそのような信号を
扱うのは不可能である。そこで、音声及び雑音の振幅ス
ペクトルが、短時間で見るとほとんど変化がないとみな
すことができることから、実際は、入力信号をある長さ
を持ったフレームに区切り、短区間に分けて処理するの
が一般的である。ただし、信号を単純に切り出しただけ
では、FFTを行ったときに信号の端における不連続の
影響が大きくなってしまう。この問題を解決するため
に、信号をフレームに区切る関数として、様々な窓関数
が用いられる。ところが、窓関数を用いて処理した場合
でも、信号を再生したときにmusical nois
eと呼ばれる周期的な雑音が聞こえるなどの問題点があ
る。短区間フーリエ変換は、入力信号をフレーム長を周
期として繰り返す周期波形と仮定して分析を行っている
ため、これらの問題点が生じているものと考えられる。
これは、短区間フーリエ変換が、音声のような時変信号
の強調を行う上で、必ずしも最適な変換手法であるとは
限らないことを示唆している。
【0009】ここでは、これら周波数領域における音声
強調法の効果を調べるために、これまでに報告されたア
ルゴリズムのいくつかを計算機上に構築し、S/N及び
残差パワーの改善度を検討する。更に、目的信号を音声
としたときに、どの程度の効果が得られるのかを調べる
ために、単音節明瞭度試験によりその性能を評価する。
ここで用いた音声強調法は、スペクトラル・サブトラク
ション(Spectral Subtraction)
法、ウィーナ(Wiener)法、側抑制を用いた手法
の3通りである。
【0010】(Spectral Subtracti
on法(S.S法))雑音信号のパワースペクトル推定
を用いて音声強調を図る最も基本的な手法に、Spec
tral Subtraction法がある。この手法
は、1974年にM.R.Weissが論文(M.R.
Weiss et al.“processing s
peech signals to attenuat
e inference”.IEEE SSR,Apr
il 1974.参照)で提案したもので、その後、こ
れまで多くの研究者達によって様々な実験、検討が行わ
れてきた(J.S.Lim “evaluation
of a correlation subtract
ion method for enhancing
speech degraded by additi
ve whitenoise”.IEEE Tran
s. Acoust., Speech,and Si
gnal Processing.,Vol.ASSP
−26,No.5,pp.471−472,Octob
er 1978.参照)(S.F.Boll.“sup
pression of acoustic nois
ein speech using spectral
subtraction”.IEEE Trans.
Acoust.,Speech,and Signa
l Processing.,Vol.ASSP−2
6,pp.113−120,April 1979.参
照) この手法の考え方は、以下に示すとおりである。定常ラ
ンダム信号s(n)に、無相関な雑音d(n)が付加さ
れているものとする。このとき、雑音のパワーが既知で
あれば、信号のパワースペクトルから雑音のパワースペ
クトルを引き去ることにより原信号のパワースペクトル
を復元することができる。
【0011】今、入力信号をy(n)、そのパワースペ
クトルをPy (ω)とおくと、時間領域、周波数領域そ
れぞれにおいて、式(2)、(3)が成立する。 y(n)=s(n)+d(n) ……(2) Py (ω)=Ps (ω)+Pd (ω) ……(3) 信号処理のために短時間窓で信号を切り取ったものを添
え字wで表すと、式(2),(3)は、それぞれ式
(4),(5)となる。
【0012】 yw (n)=sw (n)+dw (n) ……(4) |Yw (ω)|2 =|Sw (ω)|2 +|Dw (ω)|2 +Sw (ω)・D* w(ω)+S* w(ω)・Dw (ω) ……(5) ここでYw 、Sw 、Dw は、それぞれ入力信号、原信
号、雑音信号の短区間スペクトルを表している。|Dw
(ω)|2 ,Sw (ω)・D* w(ω),S* w(ω)・D
w (ω)に関しては、正確に値を求めることができない
ので、この手法では、これらをそれぞれ、E[|Dw
(ω)|2 ],E[Sw (ω)・D* w(ω)],E[S
* w(ω)・Dw (ω)]で近似する。E[……]は期待
値を表す。定常ランダム信号と雑音信号は無相関である
と仮定しているので、式(5)の右辺第3、4項の期待
値は共に0となる。したがって、原信号のパワースペク
トルの推定値|S’w (ω)|2 は、式(6)で与えら
れる。
【0013】 |S’w (ω)|2 =|Yw (ω)|2 −E[|Dw (ω)|2 ] ……(6) この手法を用いた音声強調システムのブロック図を図2
6に示す。図中F,F-1は、それぞれフーリエ変換,逆
フーリエ変換を表す。さらに式(6)を一般化したのが
次式である。
【0014】
【数1】
【0015】ここでk,αは定数である。この場合の音
声強調システムは、図27のようになる。(M.R.W
eiss et al.“processing sp
eech signals to attenuate
inference”.IEEE SSR,Apri
l 1974.参照) (Wiener法)一方、ウィーナフィルタリングに基
づいて、音声の短区間スペクトルの最小平均2乗誤差推
定を行う手法としてウィーナ(Wiener)法があ
る。この手法でもSpectral Subtract
ion法と同様に、雑音の推定スペクトルを用いている
が、単純に入力信号のスペクトルから雑音信号のスペク
トルを引き去るのではなく、入力信号スペクトルから推
定原信号スペクトルへの伝達関数を求め、それを入力信
号スペクトルに掛けることにより原信号スペクトルを推
定して音声強調を行うものである。
【0016】原信号の推定値S’w (ω)は、式(8)
の形式をとる。 S’w (ω)=H(ω)Yw (ω) ……(8) ここで、H(ω)は伝達関数である。原信号と雑音は無
相関であると仮定しているので、平均2乗誤差を最小に
するフィルタは、式(9)に示すようなウィーナフィル
タとなる。
【0017】
【数2】
【0018】ここで、Ps は原信号のパワースペクトル
であり、Pd は雑音信号のパワースペクトルである。直
接Ps を求めることはできないので、次式のような短区
間窓により切り出された信号を用いる適応ウィーナフィ
ルタを使用する。
【0019】
【数3】
【0020】Wiener法では、E[|Sw (ω)|
2 ]をどう求めるかで、色々な方法が考えられる。その
1つは、 E[|Sw (ω)|2 ]=|S’(ω)|2 ……(11) と近似するものである。この方法は、Wiener法の
近似的な実現法であるが、フレーム処理の時変信号に対
しても効果的に解析できるという利点をあまり損なわず
に済むという長所がある。またSpectral Su
btraction法の時と同様に、式(12)の形式
も用いられる。
【0021】
【数4】
【0022】ここで、α,βは定数である。ある短区間
窓で切り取られたデータから計算された伝達関数は、次
の短区間窓で原信号を推定するためのフィルタとして利
用されることになる。すなわち、 S’w (ω)i+1 =H(ω)iw (ω)i+1 ……(13) なる式を用いて信号を推定するのである。したがって、
Wiener法に基づく音声強調システムは、図28に
示すようなものとなる。
【0023】(側抑制を用いる手法(L.I.法))側
抑制は、生体系の感覚器においてよく見られる現象であ
り、ある神経の発火が、その近傍の発火を誘発、あるい
は、抑制する現象である。このような現象は、空間的だ
けでなく、時間的にも見ることができる。例えば、体の
どこかの部位には先鋭物を当てた状態で、その極く近く
に別の先鋭物を当ててもそれを認識することができな
い。これは、空間的な側抑制機能の効果である。また、
音の高さの知覚の一部は、基底膜上のどの部位が大きな
振幅を有しているかに基づいているものと考えられてい
る。したがって、空間的な側抑制効果が聴覚においては
スペクトル上での側抑制として現れることが予想され
る。側抑制の一般的な機能は、空間的、あるいは、時間
的なパターン変化を強調することにある。
【0024】ここでは、空間的な側抑制に着目したYa
nの研究の例について述べる。この研究では、心理物理
学的データを基にして、側抑制を図29に示す関数で表
現している。この図は、単一周波数(Fs )の信号A
と、平坦な周波数を持つ信号Bの2つの信号を入力した
ときに、信号Bが、人間の聴覚系において、どのように
変化されるのかを示したものである。ただし、信号A及
び信号Bの強度は、それぞれIs ,Ic とする。図中の
関数は空間(スペクトル)側抑制関数(FSLI:th
e function of spatial (or
spectral]lateral inhibit
ion)と呼ばれ、これにより信号BのI c を下回って
いる部分が抑制されているのが分かる。
【0025】今、式(14)で与えられるような、音声
信号s(k)に雑音n(k)が付加された信号を考え
る。短区間においては、音声信号も雑音も定常とみな
せ、式(14)はそのパワースペクトルとなる。ここ
で、雑音は、白色雑音を仮定した。 x(k)=s(k)+n(k) ……(14) Px (ω)=Ps (ω)+Pn (ω)=Ps (ω)+μ ……(15) Z(ω,Ω)がFSLを表すものとすると、この関数
は、次の制限を受ける。
【0026】
【数5】
【0027】このFSLIを入力信号のパワースペクト
ルに畳み込むことにより得られるスペクトルは、式(1
7)のようになる。
【0028】
【数6】
【0029】このようにホワイトノイズを仮定すると、
入力信号のパワースペクトルにFSLIを畳み込むこと
によって得られるスペクトルは、音声信号にFSLIを
畳み込むことによって得られるパワースペクトルと等し
くなる。この音声強調アルゴリズムは、この関数で入力
信号に重み付けを行うものであり、その結果、スペクト
ルの谷を更に減少させ、スペクトルのピークは強調され
る。スペクトルのピークの部分はS/Nが良く、最も多
くの情報を運んでいるので、上述の処理によってS/N
が改善され、音声が強調されることが期待される(Ya
m MingCheng and Douglas
O’Shaughnessy.“speech enh
ancement based conceptual
ly on auditory evidence.”
IEEE Trans. Acoust., Spee
ch, and Signal Processin
g., September 1991.参照)。FS
LIとしては、様々な形状のものが考えられるが、S/
Nの改善度はFSLIの形状にはあまり依存しないこと
から、ここでは計算が簡単なように図30に示すモデル
を用いることにする。
【0030】上述した考え方に基づく音声強調法を実現
するブロックダイアグラムを図31に示す。図において
w(k)はハミング窓を表している。入力信号は、窓掛
けされた後にケプストラム分析され、高次のケプストラ
ム係数が取り除かれて平滑化される。その後、再びフー
リエ変換され、5フレームに渡って平均化が行われる。
その際、現在対象としているフレームとの時間差に応じ
てwn (n=−2,−1,0,1,2)の重み付けがな
され、その結果に対し、FSLIと畳み込みが行われ
る。畳み込んだ結果として0を下回った成分は、物理的
な意味づけができなくなるため、その成分は0とする。
これを逆フーリエ変換すれば、入力信号に対して音声強
調を行うための非因果的従属フィルタの係数が得られ
る。しかし、フィルタが非因果的であったり、次数が高
い場合には、実用上不便であり計算量も多くなる。この
問題をスペクトルのひずみをできるだけ抑えながら解消
するために、再度これまで用いたハミング窓を円状に半
分だけシフトし、後半を0にした窓を用いて窓掛けを行
う。これを入力信号に対するフィルタとして用いること
によって音声強調を図る。
【0031】(周波数領域における音声強調法の性能評
価) (物理的指標による評価)上述の手法については、S/
Nの改善度等の物理的評価が、過去にもある程度行われ
ている。しかし、その評価に用いた音源の条件等が明確
でない場合もあり、また、これらの手法の間で同一の条
件下での比較も行われていない。加えて、後述する本発
明の手法について、その有用性を示すためにも、物理的
指標による評価を統一的な条件下で行っておく必要があ
る。そこで、ここでは、従来の方法により音声強調を行
ったことによるS/Nの変化と残差パワーの改善度との
2つの指標を用いて評価を行う。
【0032】S/Nの計算は、式(18)に従って行
う。
【0033】
【数7】
【0034】ここでPS'は、Spectral Sub
traction法等の音声強調処理を原信号に対して
のみ行って得られた信号の平均パワーであり、PN'は、
それと同じことを付加された雑音信号に対してのみ行っ
て得られた信号の平均パワーである。式(18)により
出力のS/Nを定義したのは、これまで述べた音声強調
法がほぼ線形な処理であり、かつ、元来S/Nが音声信
号と雑音信号との比で定義されることを意識してのこと
である。
【0035】一方、残差パワーの改善度は、式(19)
により計算される。
【0036】
【数8】
【0037】ここでLは、信号全体のポイント数であ
り、S0 (n),S’0 (n)及びS n (n)は、それ
ぞれ、nポイント目の原信号、推定信号及び入力信号で
ある。シミュレーション条件は、表1のとおりである。
また、ここで用いた窓関数の式を表2にまとめて示す
(城戸健一 ディジタル信号処理入門 丸善、1985
参照)
【0038】
【表1】
【0039】
【表2】
【0040】図32〜図37は、上述の3種類の音声強
調法について、窓関数を変えS/Nの改善度を見たもの
である。これらの図から、雑音がホワイトノイズの時に
は、側抑制を用いる手法(L.I.法)が非常に良い結
果を出しているが、ピンクノイズ(高域ほど−3dB/
Octaveで減衰するノイズ)の場合には、この手法
ではあまり効果が上がっていない。この原因は側抑制を
用いる手法が正にピーク強調を行っていることから説明
することができる。雑音がホワイトノイズの時には、雑
音のエネルギーは広範な周波数に一様に分布する。一
方、音声信号のうちの多くのエネルギーを運んでいる低
次のホルマントは、そのピークが比較的低い周波数に現
れる。このピークの部分はS/Nも高いので、ここを強
調すれば文章全体でのS/Nも向上するのは明らかであ
る。しかし、雑音信号がピンクノイズの場合、低い周波
数領域に雑音のパワーが集中するので、音声の低次のホ
ルマントがピークとなって現れ難い。また、雑音信号の
振幅スペクトルの傾斜が急になると本来の音声信号のピ
ークの位置と少しずれた位置にピークが現れる。その時
には、最もS/Nが高い音声のホルマントが抑制部分に
入ってしまい、その結果、文章全体の平均的なS/Nも
低下する。
【0041】これに対し、Wiener法ではこれと逆
の傾向を示している。ここで用いられているWiene
r法では、現在対象とするフレームの前フレームにおけ
る推定スペクトルを基に、現フレームにおける伝達関数
を求めている。そのため、フレームごとに雑音のパワー
スペクトルが大きく変化する様な場合には、あまり効果
が期待できないが、音声信号のパワースペクトルに対し
て、ある程度緩やかに変化する場合にはその威力を発揮
することができる。音声信号の平均的なパワースペクト
ルは高い周波数に行くに従って徐々に小さくなる。ピン
クノイズもそのようなパワースペクトルを有しているこ
とから、フレーム間における雑音のパワースペクトルの
変動は、それほど大きな影響を与えない。しかし、ホワ
イトノイズの場合には、フレーム間におけるパワースペ
クトルの変動が、比較的高い周波数においては、音声信
号のパワースペクトルに対して無視できない程度の影響
を与える可能性がある。その結果、ホワイトノイズでは
効果が上がらなかったが、ピンクノイズでは前フレーム
の伝達関数を次フレームで適用することにより、音声の
振幅スペクトルの連続的な変化が強調され、効果が上が
ったものと推測される。
【0042】雑音がマルチトーカノイズ(多数の人の話
声を重畳したノイズ)の時には、今回試したどの手法を
とっても、処理前と処理後でほとんどS/Nの変化が見
られなかった。このように非定常的な雑音に関しては、
雑音スペクトルを平均して用いるSpectral S
ubtraction法やWiener法ではあまり効
果が期待できず、また、マルチトーカノイズのように雑
音信号にも多くのスペクトルのピークが存在する場合に
は、側抑制を用いた手法でもS/Nは改善されないよう
である。用いた窓関数や入力信号のS/Nに関する影響
については、S/Nの改善という点からは、若干の差異
が見られるものの、用いた音声強調手法の差と比較する
と無視できる程度のものである。
【0043】図38〜図43に示す残差パワーの結果に
ついても、S/Nのシミュレーション結果と2、3の点
を除いて、ほとんど同様の傾向が見られる。S/Nでの
傾向との相違点は、側抑制を用いた音声強調法の結果
が、付加した雑音の種類に関係なく一様に悪いという点
と、入力信号のS/Nが増加するにつれ、残差パワーも
増加してしまう点である。側抑制を用いる手法で残差パ
ワーが改善されない理由は、この手法がピーク強調であ
るため、音声のうちでもパワーの大きな母音部等が、本
来の大きさよりも大きく強調されるため、残差を用いて
評価すると効果が下がったように見えるためであると思
われる。また、入力信号のS/Nが増加するにつれ残差
パワーの増加する現像は、入力信号のS/Nが増加する
ほど、音声強調処理によって生ずる音声信号のひずみの
影響が顕著に現れてくるためだと考えられる。
【0044】ここで目を引くのは、雑音がピンクノイズ
の時のSpectral Subtraction法の
屈曲である。最初、入力のS/Nが低い時にある程度の
改善が見られていたのが、S/Nの増加とともにその改
善が減少する。その後、他の手法では改善度が0dBを
下回り、音声強調処理を施すことによって、かえってS
/Nが低下するが、Spectral Subtrac
tion法の場合には、ほぼ0dBに漸近する。これ
は、次にような原因によるものだと考えられる。今、音
声信号及び雑音信号の振幅スペクトルをそれぞれ、S,
Nとする。このときSpectral Subtrac
tion法により音声強調を行った結果の残差パワー
は、次式のようにして求められる。
【0045】 (S+N)2 −E[|N|2 ]−|S|2 =|S|2 +|N|2 +2SN−[|N|2 ]−|S|2 |N|2 −E[|N|2 ] ……(20) ここで、音声と雑音がほぼ無相関であると仮定した。式
(20)は、雑音信号の分散と等しくなる。ここでの雑
音は計算機上で生成したのであり、その分散はパワーと
同程度であることが実際に計算することにより確認され
る。そのため、Spectral Subtracti
on法の時には、残差パワーが大きく増加することはな
く、その改善がほぼ0dBに漸近するものと考えられ
る。
【0046】これまで述べた音声強調手法の効果を心理
音響的に比較検討するために、単音節明瞭度試験を行っ
た。実験条件は表3のとおりである。
【0047】
【表3】
【0048】
【表4】
【0049】妨害音として用いた雑音のうち、ピンクノ
イズに関しては計算機上で作成したものである。マルチ
トーカノイズは、補聴器適合評価用CD(TY−89)
に含まれているものを使用した。信号は、全てワーク・
ステーション上で音声強調処理された後、A/Dの後D
ATに録音され、このDATを防音室にてヘッドフォン
HD−3(YAMAHA)で受聴した。解答は、被験者
が直接用紙に記入した。
【0050】母音,子音,音素,単音節のそれぞれにつ
いて明瞭度を算出した。その結果を図44〜図47に示
す。横軸はSN比であり、縦軸は明瞭度である。また、
明瞭度の値は、被験者3名の平均値を用いている。これ
らの結果から、単音節明瞭度試験では、S/Nや残差パ
ワーの評価で最も効果が上がらなかった側抑制を用いる
手法が、他の音声強調法と比べて比較的良い結果を出し
ている。特に、入力信号のS/Nが高い時には、音声信
号の振幅スペクトルがどのように分布しているのかを検
出するのが比較的容易になるため、このような場合に
は、側抑制機能が効果的に働いていることがわかる。こ
れに対し、物理的な評価指針ではある程度の効果が得ら
れていたSpectral Subtraction法
やWiener法による処理では、音声強調処理を施す
ことにより、明瞭度が大きく低下してしまう。これは、
音声強調処理を施すことによる音声信号のひずみが影響
しているものと思われる。しかし、どの音声強調法をと
って見ても、なにも処理を施さないものより、音声強調
処理を施したものの方が、かえって明瞭度が低下する。
このように、S/Nの改善や残差パワーの減少が、直ち
に明瞭度の改善に結びつくものではない。
【0051】
【発明が解決しようとする課題】本発明は、入力信号の
物理的なS/Nの改善を図るとともに、人間の感覚的な
面を考慮した信号の明瞭度が向上するように信号推定を
行なう信号推定装置を提供することを目的とする。
【0052】
【課題を解決するための手段】上記目的を達成する本発
明の信号推定装置は、 (1)被推定原信号に雑音信号が重畳されてなる第1の
入力信号と、雑音信号とのそれぞれに、高周波域ほど周
波数分解能を低下させた周波数解析手法を用いた周波数
解析を施す周波数解析部 (2)上記周波数解析部における周波数解析結果に基づ
いて、前記被推定原信号を推定する信号推定部 を備えたことを特徴とする。
【0053】ここで、上記(1)の周波数解析部が、周
波数解析手法としてウェーブレット変換を用いて、前記
周波数解析を施すものであることが好ましい。この場合
に、上記周波数解析部が、周波数解析手法として、減衰
波もしくは減衰波の繰り返しを含む波形を基底関数とす
るウェーブレット変換を用いて、前記周波数解析を施す
ものであることがさらに好ましい。
【0054】あるいは、上記本発明の信号推定装置にお
いて、上記(1)の周波数解析部は、周波数解析手法と
して等比周波数分析手法を用いて、周波数解析を施すも
のであってもよい。また、上記(2)の信号推定部は、
上記(1)の周波数解析部における入力信号および雑音
信号の周波数解析結果どうしの差分を求めるものである
ことが好ましい。
【0055】ただし、上記(2)の信号抽出部は、差分
を求める、いわゆるS.S法に限らず、入力信号の周波
数特性から原信号への周波数特性への伝達関数を求めて
原信号を推定するWiener法や、目的信号との誤差
が最小になるようにフィルタ係数を決めて、そのフィル
タ入力信号に適用するMMSE法や、側抑制を用いる
L.I.法等を用いたものであってもよい。
【0056】なお、本発明の信号推定装置は、上記被推
定原信号が音声を表わす音声信号であって、上記(2)
の信号推定部が音声強調を行なうものである場合に好適
である。本発明の信号推定装置における「周波数」は、
いわゆるフーリエ変換における狭義の周波数を指すもの
ではなく、その狭義の周波数を含め、例えばウェーブレ
ット変換やその他の変換手法によって変換した結果(広
義の周波数)を指す用語である。
【0057】
【作用】従来の、周波数領域における信号推定法、例え
ば音声強調法において、人間の感覚を考慮した評価法、
例えば単音節明瞭度が悪いということについて、音声強
調法を例にその原因を考えると、以下のような原因が考
えられる。 (フレーム処理)従来のFFTを用いた音声強調法では
短区間処理を行うため、入力信号はフレームに区切って
処理される。各フレームでFFTを行うときに、フレー
ムの端で大きな不連続があるとFFTの結果に悪影響を
及ぼすことがあり、この影響を抑えるために、フレーム
を切り出すための種々の窓関数が考えられている。この
ような目的から、窓関数として、端で滑らかに減衰する
関数が一般に用いられているが、その結果、音声強調し
た信号を再構成した時に、フレームのつなぎ目で振幅が
わずかに減衰する。この減衰が各フレームのつなぎ目ご
とに周期的に現れるため、再生音を実際に聴取するとm
usical noiseと呼ばれる周期的な音が混じ
って聞こえ、音声の聞き取りの妨げとなる。この現象
は、FFTとフレーム処理とを組合せた音声強調を行う
場合、避け難い問題である。
【0058】(固定的な時間−周波数分解能)また、音
声信号をフレーム処理しているということは、スペクト
ログラム(Spectrogram)と同様にして入力
信号を分解して解析していることを意味する。しかし、
Spectrogramでは周波数と時間との双方につ
いて高い分解能を得るのは不可能である。「広帯域(w
ideband)」Spectrogramでは、分析
に用いられる典型的な帯域幅は300Hzである。この
場合、時間分解能が高く、音声音の声帯音源パルスを個
別に見ることはできても、声の基本周波数の倍音を個別
に見ることはできない。一方、「狭帯域(narrow
band)」Spectrogramでは、典型的な分
析帯域幅は45Hzとなる。これは、通常、個々の倍音
を分解するには十分であるが、時間分解能は悪く、声帯
音源パルスは個別には見えないのが普通である(B.
C.J.ムーア著,大串健吾監訳、聴覚心理学概論、誠
信書房,1994 参照)。聴覚における信号回折の時
間−周波数分解能が、低い周波数では周波数分解能に重
点を置き、高い周波数では時間分解能を重要視している
ことを考えると、必ずしも全ての周波数領域において、
高い時間分解能と周波数分解能が要求されるわけではな
い。しかし、FFTを用いたフレーム処理では、一般的
には、時間分解能と周波数分解能が固定される。
【0059】(基底関数の選択性)さらに、フーリエ変
換は、正弦波の周波数を整数倍したものを基底として信
号を解析する手法である。このように時間的に無限に広
がる信号を用いて解析すれば、対象とする信号の各周波
数成分を調べることができる。しかし、音声信号のよう
な時変信号を解析する時に、このような時間的に無限大
の広がりを持つ関数を用いるのは、必ずしも適切ではな
い。音声強調のための信号解析法としては、その変換に
よって、音声信号のエネルギーが局在化され、雑音信号
との区別が容易になるものがふさわしい。このような意
味では、時間的に無限大の広がりを持つ正弦波を基底と
するフーリエ変換よりも、ある程度時間的にも局在性の
ある関数を基底とした変換法の方が、音声強調には適し
ているものと考えられる。
【0060】このように、フーリエ変換を基にした周波
数領域における音声強調では、本来時間的無限大の広が
りを持つ基底を用いて時変信号を解析しようとするた
め、それを実現するためにいくつかの付加処理を余儀な
くされる。これらの処理により、推定すべき原信号もひ
ずみを受けることがしばしばあり、そのために受聴明瞭
度が悪化したり、聞き難い音になったりする。
【0061】本発明の信号推定装置は、例えばウェーブ
レット変換法や等比周波数分析手法等、人間の感覚に合
うように、高周波域ほど周波数分解能を低下させ、その
一方で高周波域ほど空間分解能ないし時間分解能を向上
させた分析手法を用いるものであるため、人間の感覚に
適合した分析が行なわれ、前述した従来の分析手法を用
いた場合と比べ、物理的なS/Nのみでなく、例えば音
声強調の場合の単音節明瞭度に代表されるような人間の
感覚的な明瞭度も向上する。
【0062】また、ウェーブレット変換を用いる場合に
おいて、そのウェーブレット変換の基底関数として例え
ば減衰正弦波や、音声波形の一部を切り出したような減
衰波や、それらの減衰波(減衰正弦波を含む)の重ね合
わせ波形を採用すると、人間の発音は概ね減衰波の繰り
返し波形とみなすことができることから、人間の聴覚処
理に一層類似した分析が行なわれることとなり、人間の
感覚的な明瞭度を一層向上させることができる。
【0063】本発明の信号推定装置における信号推定部
は、周波数解析部における解析結果にどのような手法を
適用して原信号の推定を行なってもよいが、上述した従
来の分析手法を適用した結果によるとSpectral
Subtraction法(S.S法)が比較的優れ
ており、本発明においても、種々の信号推定手法のうち
S.S法を適用すると、周波数解析部における高周波域
ほど周波数分解能を低下させた周波数解析手法と相まっ
て、物理的なS/Nと人間の感覚的な明瞭度との双方を
大きく向上させることができる。
【0064】
【実施例】以下、本発明の実施例について説明する。図
1は、本発明の実施例における、信号処理装置のブロッ
ク図である。入力音声は、周波数解析部1に入力され
る。周波数解析部1では、音声が含まれている時と、音
声が休止しているとき(雑音のみのとき)との双方につ
いて周波数解析が行なわれる。この周波数解析手法とし
て、ここではウェーブレット変換が採用されている。以
下では、ウェーブレット変換の中でも直交系のウェーブ
レット変換を採用した例(実施例1)と非直交ウェーブ
レット変換を採用した例(実施例2)との双方について
説明する。
【0065】周波数解析部1で得られた解析結果は、信
号推定部2に入力される。信号推定部2では、入力され
た解析結果を基に音声強調が行なわれる。ここでは、実
施例1、実施例2の双方において、音声強調を行なうに
あたり、前述したSpectral Subtract
ion法が採用されている。ここでは先ず、周波数解析
手法として用いられるウェーブレット変換について説明
し、それに次いで、実施例1,実施例2について説明す
る。
【0066】ウェーブレット変換とは、フーリエ変換の
ような無限の長さを有する波exp(jωt)を用いて
分解するのではなく、ある範囲にだけ値を持つ小さい波
“ウェーブレット”を用いて分解する手法である。L2
を2乗可積分関数全体の集合とする。関数ψ(t)∈L
2 を与えたとき、任意の実関数f(t)∈L2 に対する
次の積分変換をf(t)のウェーブレット変換という。
【0067】
【数9】
【0068】ここでa>0,bはともに実数であり、a
はスケールパラメータ,bはシフトパラメータと呼ばれ
る。またψ(t)は基本ウェーブレットと呼ばれる。こ
の式は、任意の実関数f(t)と基本ウェーブレットを
図2に示すような相似変換して得られる波形との相関を
取っていると解釈することができる。係数|a|
-1/2は、基本ウェーブレットのスケールパラメータを変
換させてもエネルギーが保存するようにするためのもの
である。
【0069】ここで、ある窓関数wに対し、それの中心
m と半径Δw をそれぞれ以下のように定義する。
【0070】
【数10】
【0071】一方、式(21)は、パーセバルの公式を
用いることにより、
【0072】
【数11】
【0073】のように書き換えることができる。但し、
ここで、 H(ω)≡Ψ(ω+ω* ) Ψ(ω):ψ(t)のフーリエ変換 ω* :Ψ(ω)の中心 である。式(21),(24)から分かるように、ウェ
ーブレット変換は、信号fに下に記す時間−周波数の窓
をかけていることになる。
【0074】
【数12】
【0075】図3は、この時間−周波数の窓を図示した
ものであり、低い周波数を解析するときには長い時間窓
を用い、高い周波数を解析するときには、相対的に短い
時間窓を用いるズーム・イン,ズーム・アウトの機能を
ウェーブレット変換が自動的に行なっていることを示し
ている(Charles K. Chui著/桜井明・
新井 勉共訳、ウェーブレット入門、東京電気大学出版
局,1993. 参照)。
【0076】このような性質を持つウェーブレット変換
は、多くの応用において極めて有用である。例えば、適
当な許容レベル以下のW(ψ,f)の値を取り除くこと
により、データ圧縮に応用することができる。また、ロ
ーパスフィルタは、小さい値のαに対してW(ψ,f)
を0に置き換えることにより実現される。しかし、どの
場合にもW(ψ,f)の値から上のような関数fを再構
成する必要がある。W(ψ,f)を用いてf∈L2
(R)を表現する公式を反転公式(inversefo
rmula)と呼び、この公式に使われる関数ψ’を基
本ウェーブレットの共役(dual)と呼ぶ。したがっ
て厳密には、ψ’の存在と反転公式が分かっているとき
にのみψを基本ウェーブレットとして使うことができ
る。ここではRは実数全体の集合を表し、今後の論議で
使われるZは整数全体の集合を表す。
【0077】以下、W(ψ,f)の定義域の制限の度合
に応じて、4つの異なる場合の再構成公式を挙げる。 1.W(ψ,f)(b,a)、a,b∈Rからの再構成 W(ψ,f)からfを構成するためには、条件
【0078】
【数13】
【0079】が必要となる。このとき、次の再構成公式
が成立する。
【0080】
【数14】
【0081】ここで、R2 =R×Rである。したがっ
て、このときは、ψ’を基本ウェーブレットψの共役関
数であるということができる。しかし、共役関数の一意
性は期待できない。 2.W(ψ,f)(b,a)、b∈R,a>0からの再
構成
【0082】
【数15】
【0083】を満足するウェーブレットを考える。但し
ψ’はψの推定値を表す。この場合、再構成公式は、
【0084】
【数16】
【0085】で与えられる。このときも、1.と同様に
複素共役ψ* を基本ウェーブレットの共役と呼ぶ。 3.W(ψ,f)(b,a)、b∈R,a=2-j,j∈
Zからの再構成 この場合、再構成公式を作るには、基本ウェーブレット
に強い条件を課さねばならない。その条件は安定性条件
と呼ばれ、次式で与えられる。
【0086】
【数17】
【0087】ここで、A,Bはωに依存しない定数で、
0<AB<∞なるものである。ψが上に記した安定条
件を満たすときには、基本ウェーブレットψは共役ψ*
を持つ。但し関数ψ* はそのフーリエ変換が、
【0088】
【数18】
【0089】で与えられるものである。このとき、再構
成公式は共役ψ* を用いて、次のように書ける。
【0090】
【数19】
【0091】4.W(ψ,f)(b,a)、b=2
-jk,a=2-j,j∈Zからの再構成 この場合には、
【0092】
【数20】
【0093】であることに注意する。ここで、任意の関
数f、gに対して<f,g>は、fとgの内積を表す。
また、ψj,k は次式で定義されるものとする。 ψj,k (x)=2j/2 ψ(2j x−k), j,k∈Z ……(32) このとき、{ψj,k }がL2 (R)の正規直交基底であ
ることを要求してはいない。実際、安定な基底(sta
ble basis)であれば十分である。安定な基底
としては、次に定義するリース基底が考えられる。
【0094】(定義1) 関数ψ∈L2 (R)は、式
(32)で定義される{ψi,j }がL 2 (R)のリース
基底(Riesz basis)であるとき、R−関数
(R−function)であるという。ただし、{ψ
i,j }がL2 (R)のリース基底あるとは、以下の
(a),(b)が成立することである。 (a){ψj,k :j,k∈Z}の線形結合の全体がL2
(R)内の稠密な集合であること。 (b)定数A,B(0<AB<∞)が存在して、2乗
の和が収束するような任意の無限数列{cj,k }に対
し、
【0095】
【数21】
【0096】が成立すること。ただし、数列{cj,k
の2乗の和が収束するとは、
【0097】
【数22】
【0098】となることである。関数ψをR−関数とす
る。このとき{ψj,k }に対して次の意味で共役なL2
(R)のリース基底{ψj,k }が存在する。 <ψj,k ,ψl,m >=δj,l ・δk,m , j,k,l,m∈Z ……(35) これより、関数f∈L2 (R)に対して、
【0099】
【数23】
【0100】なる一意的な級数展開を得る。この級数展
開の係数は、式(31)からウェーブレット変換で与え
られているが、この級数がウェーブレット級数になると
は限らない。この級数がウェーブレット級数となるため
には、適当なウェーブレットψ’∈L2 (R)が存在し
て、級数(36)式内の共役基底{ψj,k }との間に、 ψj,k (x)=ψ’j,k (x) ……(37) なる関係が成立しなくてはならない。
【0101】このように、ウェーブレット変換は、再構
成を行うための条件によっても分類することができる
が、一般的には、そのウェーブレットが生成するリース
基底{ψj,k }の性質によって分類される。 (定義2) 関数ψ∈L2 (R)は式(31)で定義さ
れる関数の族{ψj,k}がL2 (R)の正規直交基底
(orthonomal basis)となるとき、直
交ウェーブレット(orthogonal wavel
et)であるという。ただしψj,k がL2 (R)の正規
直交基底であるとは、次の1.,2.が成立することで
ある。
【0102】1.<ψj,k ,ψl,m >=δj,l ・δ
k,m , j,k,l,m∈Z が成立する。 2.f∈L2 (R)が
【0103】
【数24】
【0104】のように展開される。ここで上の級数の収
束はL2 (R)の収束であり、
【0105】
【数25】
【0106】のことである。もし、ψが直交ウェーブレ
ットであるならば、ψはψ’≡ψであるという意味で自
己共役的(self−dual)である。関数ψをウェ
ーブレット{ψj,k }をψから作られるリース基底とす
る。各j∈Zに対し、{ψj,k :k∈Z}が生成する線
形部分空間の閉包を記号Wj で表す。すなわち、
【0107】
【数26】
【0108】とおく。すると空間L2 (R)は、 L2 (R)=…+W-1+W0 +W1 +… ……(39) のように、Wj の直和(direct sum)に分解
される。ここでは、+は直和を意味する。もし、ψが直
交ウェーブレットであれば、L2 (R)の部分空間Wj
は互いに直交し、 <gj ,gl >=0, j≠l,gi ∈Wj ,gl ∈Wj ……(40) が成り立つ。この場合空間L2 (R)は、 L2 (R)=…*W-1*W0*W1*… ……(41) のように直交和(orthogonal sum)で表
現される。ここで、*は直交和を表す。 (定義3) ウェーブレットψ∈L2 (R)は、それの
作るリース基底{ψj, k }が、 <ψj,k ,ψl,m >=0, j≠l, j,k,l,m∈Z ……(42) を満足するとき、半−直交ウェーブレット(semi−
orthogonalwavelet)であるという。
【0109】明らかに、半−直交ウェーブレットはL2
(R)の直交分解を生成し、また直交ウェーブレットは
半−直交ウェーブレットになっている。ウェーブレット
ψは、それが半−直交ウェーブレットでないとき、非直
交(nonorthogonal)ウェーブレットであ
るという。 (実施例1)ウェーブレット変換は、直交系のものと非
直交系のものに大別することができる。ここでは先ず、
音声強調のための信号解析法として直交系のウェーブレ
ット変換を導入する。直交系のウェーブレット変換で
は、ウェーブレット領域における各係数が独立なので数
値的な取り扱いが容易であり、かつ高速な変換アルゴリ
ズムも知られていることがその理由である。
【0110】ウェーブレット変換は、それまで別々の分
野においてそれぞれ独立に研究され、使われてきた考え
方を、数学的に統一的にとらえた理論体系である。した
がって、ウェーブレット変換は、さまざまな解釈をとる
ことができる。その中のひとつに、ウェーブレット変換
をある種のフィルタバンクとみなす方法がある。このこ
とを示すために、離散時間系におけるウェーブレット変
換の実現法について説明する。
【0111】今、h(n)をハイパスフィルタのインパ
ルス応答とし、g(n)をそれと相補的な関係にあるロ
ーパスフィルタのインパルス応答とする。この時、離散
時間信号x(n)にh(n)とg(n)をそれぞれ畳み
込むことにより、x(n)をその高周波成分からなる信
号と低周波成分からなる信号に分解することができる。
これらの信号を半分にダウンサンプリングし、低周波成
分からなる信号の方に対し、h(n)とg(n)を同様
に畳み込む。この操作を分解できなくなるまで繰り返し
行なうことにより、入力した離散時間信号とデータ数を
変えることなくウェーブレット変換を実現することがで
きる。図4は、これをブロックダイアグラムで示したも
のであり、このような考え方はサブバンド分析と呼ばれ
る。また、このような離散直交ウェーブレット変換を行
なった時の周波数分割は、図5に示すように中心周波数
が高くなるにつれ帯域幅が広がる形になる。
【0112】このような考え方を基にしたウェーブレッ
ト変換では、フーリエ変換におけるFFTのような高速
な変換アルゴリズムが存在する。実際Daubechi
es(Ingrid Daubechies. “th
e wavelet transform, time
−frequency localizationan
d signal analysis”.IEEE T
rans. Information Theory,
Vol.36, No.5, pp.961−100
5, September 1990. 参照)やMe
yer(Y.Meyer. wavelets. Sp
ringer 1989 参照)によりそのアルゴリズ
ムは証明され、変換係数も与えられている。ただし、そ
こで用いられる変換係数を変えることにより、信号を分
解するときのフィルタの形状が変化し、基本ウェーブレ
ットの選択に自由度がある点が、FFTとは異なる点の
1つである。
【0113】本章で試みる音声強調において使用される
Daubechiesのウェーブレットについて、ここ
で少し説明しておく。あるウェーブレットの組は、ウェ
ーブレットフィルタ係数と呼ばれる数値の組によって定
められる。Daubechiesにより導出されたウェ
ーブレットのうち、最も単純でかつ最も局在しているウ
ェーブレットは、4つの係数c0 ,…,c3 だけで生成
される。そこで、ここではこの場合を例にとって話を進
めることにする。
【0114】今、式(43)で示される変換行列を考え
る。
【0115】
【数27】
【0116】行列内で係数が書き込まれていない部分
は、全て0である。今、データベクトルをxとする。こ
の時C・xの演算において、奇数行はフィルタ係数とデ
ータとの畳み込みを行っている。もし、偶数行がローパ
スフィルタに対するハイパスフィルタという意味におい
て相補的な関係にあるならば、この演算を従来のFFT
アルゴリズムによって実現することができる。したがっ
て、この行列は2つの相互相関を計算し、その計算結果
はそれぞれ元のデータ数の半分になるような変換行列と
して動作する。
【0117】計算機で使用するための数値計算プログラ
ム例を集めた本“NUMERICAL RECIPES
in C(William H.Press, Sa
ulA. Teukolsky, William
T. Vetterling, and Brian
P. Flannery. NUMERICAL RE
CIPES in Cambridge Univer
sity Press, second editio
n, 1992. 参照)の中のDaubechies
のウェーブレットについて書かれているところでは、以
下のような説明がなされている。
【0118】−−フィルタc0 ,…,c3 を4ポイント
の移動平均を行う平滑化フィルタとみなすと便利であ
る。このとき、フィルタc3 ,−c2 ,c1 ,−c0
は、負の符号により平滑フィルタとは異なるフィルタG
になる。このHとGは、信号処理の分野において、Qu
ardrature Mirror Filters
(QMF)と呼ばれるものである。実際、この係数は、
Gが十分滑らかなデータに対しては、0を返すように決
定される。これはc3 ,−c2 ,c1 ,−c0 が消失モ
ーメントを持つことを要求している。このモーメントの
次数をpとすると、そのウェーブレットの組は、p階の
近似条件を満足していると言われる。Hの出力は、元デ
ータの半分のデータ量で元のデータの“おおまかな”情
報を表し、一方Gの出力は、元のデータの半分のデータ
量で“細かな部分”の情報だけを表している。−−この
ようなそれぞれ元データの半分のデータ数のおおまかな
情報と詳細な情報から、元のデータを再構成できると非
常に便利である。そのためには、式(43)で示される
行列が直交行列であればよく、これには、その逆行列が
Cの転置であればよい。
【0119】
【数28】
【0120】行列(44)が成立するためには、次の2
つの方程式が成立することが必要十分条件である。 c0 2 +c1 2 +c2 2 +c3 2 = 1 ……(45) c20 +c31 = 0 ……(46) 加えて、2階の近似条件を満足するためには、さらに2
つの方程式が要求される。
【0121】 c3 −c2 +c1 −c0 = 0 ……(47) 0c3 −1c2 +2c1 −3c0 = 0 ……(48) 方程式(45)〜(48)は、4つの未知数c0 ,……
3 に対する4つの方程式なので、次に示すように一意
に解くことができる。 c0 = (1+√3)/4√2 c1 = (3+√3)/4√2 c2 = (3−√3)/4√2 c3 = (1−√3)/4√2 このことは、Daubechiesにより初めて導出さ
れ解かれたものである。ウェーブレットフィルタ係数が
増えても、消失モーメントが高階になるため、要求され
る方程式の数も増加し、未知数を一意に決定することが
できる。
【0122】尚、これまでにも、ウェーブレット変換を
用いて音声強調を試みた例がいくつかある(Milos
Doroslovacki and Hong Fa
n.“wavelet−based adaptive
filtering”.IEEE, vol.II
I, pp.488−491, 1993. 参照)
(A.Teolis and J.J. Benede
tto. “noisesuppression us
ing a wavelet model”.In I
CASSP ’94, Vol.1, pp.17−2
0, 1994. 参照)。それらの音声強調法におけ
る音声強調の基準は、概ね、ウェーブレット変換領域で
ある閾値を設け、それより小さい係数を除去して逆ウェ
ーブレット変換を行うものである。再生したい信号が、
ウェーブレットの線形和でモデル化することができると
仮定すると、ウェーブレット変換が被解析信号と基本ウ
ェーブレットとの相関を取っているという観点からは、
このような方法により音声強調が実現できることが期待
される。なぜなら、再生すべき信号はウェーブレットと
相関が高いため、ウェーブレット変換した係数も大きく
なるが、雑音信号はウェーブレットとあまり相関が高く
ないため、変換して得られる係数は小さくなるからであ
る。
【0123】しかし、ここでは、周波数領域における音
声強調法として代表的なSpectral Subtr
action法をウェーブレット変換に拡張して用いる
ことにする。ウェーブレット変換を用いれば、信号を変
換した領域において、音声と雑音との局在性が高くなる
ことが予想される。このような場合、Spectral
Subtraction法のように、信号のパワース
ペクトルから雑音のパワースペクトルを引き去ることに
より、効果的な音声強調が実現されることが期待される
からである。
【0124】ウェーブレット変換では、フーリエ変換と
異なり、時間的に局在した波形を基底に用いるため、時
間的な情報が位相ではなく変換後の係数の何ポイント目
にあるかによって与えられる。そのため、単純に周波数
領域におけるSpectral Subtractio
n法を適用するわけには行かない。しかし、同一スケー
ルで処理されて得られた係数が、同じ周波数帯域に対応
する成分であるという、ウェーブレット変換のある種の
フィルタバンク的な性質に着目し、各帯域ごとに平均し
て処理すれば適用することが可能である。したがって、
ウェーブレット空間におけるSpectral Sub
traction法は、周波数軸上でSpectral
Subtractionを行う式(6)を少し変形し
た式(49)により実現される。
【0125】 |S’(a,b)|2 =|Y(a,b)|2 −Eb [|D(a,b)|2 ] ……(49) ここでY,S’,Dは、それぞれ入力信号、推定した原
信号、雑音信号をウェーブレット変換したものを表し、
b [ ]は各スケールにおけるシフトパラメータの変
化に対する平均を表している。したがって、この方法に
より音声強調を行うシステムのブロックダイアグラム
は、図6に示すようなものとなる。
【0126】次に、ウェーブレットを用いた音声強調法
の性能評価について説明する。 (物理的指標による評価)シミュレーション条件を表5
に示す。
【0127】
【表5】
【0128】前記では、簡単のために4次のDaube
chiesウェーブレットの構成法について説明した
が、4次のDaubechiesウェーブレットでは、
時間波形があまり滑らかではないので、実際のシミュレ
ーションでは、図7に示すような、20次のDaube
chiesウェーブレットを使用する。ここでも、従来
技術について行った評価と同様に、物理的な評価に関し
ては、S/Nの改善と残差パワーの改善から音声強調の
性能を評価する。また、フーリエ変換を用いた場合との
比較のために、窓関数としてハミング窓を使用し、FF
Tを用いて処理した結果を合わせて図8、図9に示す。
【0129】S/Nの改善は、同じ音声強調アルゴリズ
ムを短区間フーリエ変換を用いて、周波数領域で行った
従来のものより、直交系のウェーブレット変換を行って
ウェーブレット領域で行ったものの方が、2dB程度良
い結果を示している。また、残差パワーも同様な結果で
あるが、この差により、従来の周波数領域で行ったもの
では、音声強調処理をすることにより残差パワーがしば
しばかえって劣化していたのが、ウェーブレット領域で
行ったものでは、残差パワーの改善が得られている。こ
のことから、ウェーブレット変換を用いることにより、
音声信号のひずみを抑えたまま音声強調が実現できてい
ることが理解される。
【0130】(単音節明瞭度試験による評価)直交系の
ウェーブレット変換を用いて音声強調を試みた場合にお
いて、従来技術の検証のために行ったのと同じ方法で単
音節明瞭度試験を行う。実験条件は、表6のとおりであ
る。母音、子音、音素、単音節の明瞭度をそれぞれ図1
0〜図13に示す。
【0131】
【表6】
【0132】
【表7】
【0133】単音節明瞭度試験の結果は、全体的に見て
母音、子音、音素、単音節のどの明瞭度についても、未
処理の明瞭度とほぼ同じ程度まで向上した。このこと
は、短区間フーリエ変換を用いた従来技術の場合、明瞭
度が逆に低下していたことから考えて、直交系のウェー
ブレット変換を用いることにより、原信号のひずみを抑
えたまま雑音を抑圧することができる、というシミュレ
ーションの結果からの推測を裏付けるものである。
【0134】(実施例2)ここでは音声強調にさらに適
したウェーブレットを得るために、まず、人間が音声を
どのようにして発生しているのかについて検討する。人
間は、声帯を震わせて音を発生し、そこで発生したのこ
ぎり波状の波形を声道という共振系を通して変化させ、
さまざまな音声に変えている。したがって、人間の音声
発生の機構は、パルス発生器と共振回路によってモデル
化することができる(石坂謙三,James L. F
lanagan. 声帯音源の自励振動モデル 日本音
響学会論文誌、Vol.34,No.3,pp.122
−131,1978年3月参照)。実際、初期の音声認
識や音声合成には、このようなモデルが使われていた。
【0135】減衰が存在する共振系にインパルスを入力
した時の応答は減衰正弦波となり、実際、音声も減衰正
弦波をその構成要素にしているものと考えられる。この
ことは、図14に記す手順によって調べられる。まず、
図15に示すように音声の母音部から1ピッチを切り出
す。この例は、音声データベースに収録されている単語
「さくら」の「さ」の母音分から、目視により1ピッチ
分を切り出したものである。つづいてこの信号に対し、
ARモデルを仮定して線形予測分析を行う。得られた係
数を基にして、図16に示すように、そのモデルの極を
Z平面にプロットする。プロットされた極のうちの1つ
に着目し、その1つだけを極にもつモデルにインパルス
を入力したときの応答を調べてみた。図17は、およそ
5kHzに対応する極を用いた場合の応答である。確か
に、「あ」という母音部は、減衰正弦波をその構成要素
にしていることが分かる。
【0136】このように、人間の音声が減衰正弦波をそ
の構成要素に持つことから音声強調を行うための音声解
析手段として、減衰正弦波を基本ウェーブレットとした
ウェーブレット変換を用いることにより、より効果的な
解析ができる可能性があることがわかる。ただしこのよ
うに任意に選んだ関数を基本ウェーブレットとし、ウェ
ーブレット変換・逆変換によって完全に元の信号が再構
成されるという保証はない。音声強調への応用に際して
は、ウェーブレット係数から完全に変換前の信号が再構
成できることは必ずしも要求されないが、ある程度の再
生能力は必要である。最も一般的な、W(ψ,f)、
a,b∈Rから再構成を行うためには、
【0137】
【数29】
【0138】なる条件が満たされなければならない。こ
の条件を満たすためには、直流成分がなくかつ周波数領
域で局在していることが要求される。減衰正弦波では、
直流成分は極めて小さく、周波数領域においてもかなり
の局在性をもっている。そのため、減衰正弦波は、この
条件を完全に満たさないまでも、基本ウェーブレットと
して用いることに対し、十分な性質を有しているものと
推測され、その時には、前述した再構成公式を利用する
ことができる。
【0139】しかし、実際の応用に際しては、a,bが
離散的な値となるため、積分で定義された再構成公式を
そのまま適用することはできない。この場合、パラメー
タを微小区間に区切り、級数和により近似的に積分を行
う方法がしばしば取られるが、ウェーブレット変換の場
合には、計算量やデータ量が膨大になるため実用的では
ない。そこで、ここでは、減衰正弦波を基本ウェーブレ
ットとして用い、パラメータをある程度離散化して音声
信号をウェーブレット変換・逆変換を行っても、原信号
を十分に再生することができるかどうか検証する。
【0140】ここで用いたのは、Q5の減衰正弦波で
あり、図18に示す時間波形と周波数特性を持ってい
る。「さくら」という単語の音声データに対し、この減
衰正弦波を用いてウェーブレット変換し、全く同じ減衰
正弦波を共役ウェーブレットとして用いて、式(26)
により示される再構成公式により逆変数を行う。変換に
際し、スケールパラメータaはa=2-5/6から1/6オ
クターブごとに60ステップ変化させた。これは、図1
8の周波数特性におけるピーク周波数が、ほぼ可聴周波
数全体を覆うようにするためである。一方、シフトパラ
メータに関しては、1ポイントシフトで行った。その結
果ほぼ完全に原信号が再構成された。実際、再生信号の
残差パワーを計算したところ、およそ−20dBであっ
た。極めて限られた検討ではあるが、このことから、音
声強調を目的とした場合、ここで行った程度のパラメー
タの離散化を行っても、十分な再生能力を有しているも
のと判断される。
【0141】非直交系のウェーブレット変換を用いて、
直交系のウェーブレット変換の時と同様の手法で音声強
調を試みる。音声強調は、式(45)を用いる。 |S’(a,b)|=|Y’(a,b)−Eb [|D’(a,b)|] ……(45) ただし、非直交系のウェーブレット変換の場合には、ス
ケールパラメータaとシフトパラメータbを自由に設定
することができる。そこで、スケールパラメータに関し
ては、人間の聴覚における帯域幅がおよそ1/3オクタ
ーブであると言われていることを考慮して、その半分の
1/6オクターブごとに変化させることにする。また、
その範囲は、図18に示される周波数特性におけるピー
クの周波数が、人間の可聴周波数を網羅するように設定
する。一方、シフトパラメータについては、1ポイント
ずつシフトさせることにする。1ポイントずつシフトさ
せることにより、ウェーブレット変換における畳み込み
演算をFFTを用いて高速に実現することができる。
【0142】直交系のウェーブレット変換を用いてSp
ectral Subtractionを行う場合に使
用した式(49)との違いは、ウェーブレット領域にお
ける各成分のエネルギーに換算して引き去るのではな
く、係数の大きさで引き去る点にある。直交系の場合に
は、各係数が独立であり、それぞれがその成分のエネル
ギーに対応するものとなる。したがって、直交系の場合
には、入力信号のある成分のエネルギーが雑音信号のそ
のスケールにおける平均的なエネルギーよりも小さい場
合には、その成分に音声信号の要素は全く含まれていな
いと判断して、0としていた。しかし、非直交系でかつ
上記のようなパラメータの設定を行った場合には、過完
全となり、ウェーブレット係数がお互いに独立ではなく
なる。このような場合には、係数の符号にも大きな意味
が生じる。なぜなら音声信号のある成分を多くの係数に
より生成していたり、逆に信号がないという部分を多く
の係数から作っている可能性もあるからである。したが
って、もしも符号が間違っていると、本来あるべき波形
から大きくかけ離れたものになるおそれがある。そこ
で、非直交系における音声強調法では、subtrac
tionの処理により値が負になっても、そのままその
値を用いることにする。
【0143】このような方法で音声強調を行うシステム
のブロックダイアグラムを図19に示す。図19中、
W.T.はウェーブレット変換をI.W.T.はその逆
変換を表す。 (物理的評価)ここでは、上述の音声強調法を用いて音
声強調を行ったときに、S/N及び残差パワーがどの程
度改善されるかについてシミュレーションにより検討す
る。シミュレーション条件を表8に示す。
【0144】
【表8】
【0145】入力信号のS/Nは、次に行う聴取実験と
条件を同じにするために、−10,0,10dBとして
シミュレーションを行った。S/N及び残差パワーの改
善を、フーリエ変換を用いて行ったもの、直交ウェーブ
レット変換を用いて行なったものと合わせてそれぞれ図
20と図21に示す。これらの図を見ると、減衰正弦波
を基本ウェーブレットとしたウェーブレット変換を用い
ることにより、直交系のウェーブレット変換を用いたと
きよりも、S/Nに関してかなりの改善が得られてい
る。これらは、前述の議論から、音声信号と相関が高い
と考えられる減衰正弦波を基本ウェーブレットとして用
いたため、ウェーブレット領域における音声信号のエネ
ルギーの局在化が行われ、Spectral Subt
raction法により音声信号のエネルギーを残した
まま雑音のエネルギーだけを抑圧することができたため
と考えられる。一方、残差パワーも、非直交系のウェー
ブレット変換を用いることにより、直交系のウェーブレ
ット変換を用いた場合よりさらに改善していることが分
かる。特に雑音がホワイトノイズで、入力信号のS/N
が低いときに大きな効果が見られる。しかし、従来技術
の欄で述べたように、S/Nや残差パワーでは大きな改
善が得られていても、実際の聴取も改善されているのか
どうか保証はできない。そこで、さらに聴取実験を行
い、非直交系のウェーブレットを用いる効果について検
討する。
【0146】(単音節明瞭度試験による評価)ここでは
単音節明瞭度試験による評価を行う。実験条件は、実施
例1で行った直交系のウェーブレット変換を用いた音声
強調法に対する単音節明瞭度試験と同じである。単音節
明瞭度試験結果を母音、子音、音素、単音節それぞれの
明瞭度に分けて図22〜図25に示す。図に示したの
は、4人の被検者の平均値である。
【0147】試験結果を見ると、単音節明瞭度は何も処
理を行わなかったものと同程度にまで改善し、母音の明
瞭度については、入力信号のS/Nが−10dBの時に
さらに10ポイント近い改善が見られた。これは、今回
基本ウェーブレットとして用いた減衰正弦波のQを、母
音のそれと相関が高くなるように設定したためであると
考えられる。これによりウェーブレット領域における音
声信号、特に母音部のエネルギーを局在化することがで
き、音声強調の効果を改善したものと推測される。これ
に対し、入力信号のS/Nが高い時には、極くわずかで
はあるが未処理のものと比較して明瞭度が低下してい
る。これは、入力信号のS/Nが高くなると音声強調処
理を行ったことによる原信号のひずみが顕著に現れてく
るためであると考えられる。
【0148】
【発明の効果】以上説明したように、本発明によれば物
理的なS/Nの向上とともに人間の感覚を考慮した明瞭
度も向上する。これを音声強調に採用すると耳障りな雑
音が抑制されるとともに内容の聞き取りやすい音声が得
られる。
【図面の簡単な説明】
【図1】本発明の実施例における、信号処理装置のブロ
ック図である。
【図2】基本ウェーブレットを相似変換して得られる波
形(Daubechiesのウェーブレットを使用)を
表わした模式図である。
【図3】ウェーブレット変換と短時間フーリエ変換の時
間−周波数窓を表わした模式図である。
【図4】離散ウェーブレット変換のブロックダイアグラ
ムである。
【図5】離散ウェーブレット変換による周波数分割を表
わした図である。
【図6】ウェーブレット変換を用いてSpectral
Subtraction法を実現するシステムのブロ
ックダイアグラムである。
【図7】20次のDaubechiesのウェーブレッ
トの時間波形と周波数特性を表わした図である。
【図8】フーリエ変換を用いて音声強調を図ったときの
直交系のウェーブレット変換を用いて音声強調を図った
ときのS/Nの変化を表わした図である。
【図9】フーリエ変換を用いて音声強調を図ったときの
直交系のウェーブレット変換を用いて音声強調を図った
ときの残差パワーの変化を表わした図である。
【図10】直交ウェーブレット変換を用いたときの母音
の明瞭度を表わした図である。
【図11】直交ウェーブレット変換を用いたときの子音
の明瞭度を表わした図である。
【図12】直交ウェーブレット変換を用いたときの音素
の明瞭度を表わした図である。
【図13】直交ウェーブレット変換を用いたときの単音
節の明瞭度を表わした図である。
【図14】音声信号の構造の解析手順を表わした図であ
る。
【図15】母音部から切り出した1ピッチの時間波形を
表わした図である。
【図16】ARモデルを仮定し、音声を線形予測分析し
たときの極を表わした図である。
【図17】音声の1ピッチをモデル化したときの減衰正
弦波を表わした図である。
【図18】Q5の減衰正弦波の時間波形と周波数特性
を表わした図である。
【図19】非直交ウェーブレットを用いた音声強調法の
ブロックダイアグラムである。
【図20】Q5の減衰正弦波を用いて音声強調を行っ
たときのS/Nの変化を表わしたグラフである。
【図21】Q5の減衰正弦波を用いて音声強調を行っ
たときの残差パワーの変化を表わしたグラフである。
【図22】非直交ウェーブレット変換を用いたときの母
音の明瞭度を表わした図である。
【図23】非直交ウェーブレット変換を用いたときの子
音の明瞭度を表わした図である。
【図24】非直交ウェーブレット変換を用いたときの音
素の明瞭度を表わした図である。
【図25】非直交ウェーブレット変換を用いたときの単
音節の明瞭度を表わした図である。
【図26】スペクトラルサブトラクション法(S.S
法)に基づく音声強調システムのブロックダイヤグラム
である。
【図27】S.S法を一般化したときの音声強調システ
ムのブロックダイヤグラムである。
【図28】Wiener法に基づく音声強調システムの
ブロックダイヤグラムである。
【図29】心理物理学的データを基にした側抑制関数を
表わした図である。
【図30】FSLIモデルを表わした図である。
【図31】側抑制を用いる手法(L.I法)を実現する
ブロックダイヤグラムである。
【図32】窓処理に矩形窓を用いて種々の方法で音声強
調を図ったときのS/Nの変化を表わしたグラフであ
る。
【図33】窓処理にハニング窓を用いて種々の方法で音
声強調を図ったときのS/Nの変化を表わしたグラフで
ある。
【図34】窓処理にハミング窓を用いて種々の方法で音
声強調を図ったときのS/Nの変化を表わしたグラフで
ある。
【図35】窓処理にブラックマン−ハリス窓を用いて種
々の方法で音声強調を図ったときのS/Nの変化を表わ
したグラフである。
【図36】窓処理に半波余弦窓を用いて種々の方法で音
声強調を図ったときのS/Nの変化を表わしたグラフで
ある。
【図37】窓処理にリース窓を用いて種々の方法で音声
強調を図ったときのS/Nの変化を表わしたグラフであ
る。
【図38】窓処理に矩形窓を用いて種々の方法で音声強
調を図ったときの残差パワーの向上度を表わしたグラフ
である。
【図39】窓処理にハニング窓を用いて種々の方法で音
声強調を図ったときの残差パワーの向上度を表わしたグ
ラフである。
【図40】窓処理にハミング窓を用いて種々の方法で音
声強調を図ったときの残差パワーの向上度を表わしたグ
ラフである。
【図41】窓処理にブラックマン−ハリス窓を用いて種
々の方法で音声強調を図ったときの残差パワーの向上度
を表わしたグラフである。
【図42】窓処理に半波余弦窓を用いて種々の方法で音
声強調を図ったときの残差パワーの向上度を表わしたグ
ラフである。
【図43】窓処理にリース窓を用いて種々の方法で音声
強調を図ったときの残差パワーの向上度を表わしたグラ
フである。
【図44】従来手法を用いたときの子音の明瞭度を表わ
した図である。
【図45】従来手法を用いたときの母音の明瞭度を表わ
した図である。
【図46】従来手法を用いたときの音素の明瞭度を表わ
した図である。
【図47】従来手法を用いたときの単音節の明瞭度を表
わした図である。
【符号の説明】 1 周波数解析部 2 信号推定部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 被推定原信号に雑音信号が重畳されてな
    る第1の入力信号と、雑音信号とのそれぞれに、高周波
    域ほど周波数分解能を低下させた周波数解析手法を用い
    た周波数解析を施す周波数解析部と、 前記周波数解析部における周波数解析結果に基づいて、
    前記被推定原信号を推定する信号推定部とを備えたこと
    を特徴とする信号推定装置。
  2. 【請求項2】 前記周波数解析部が、前記周波数解析手
    法としてウェーブレット変換を用いて、前記周波数解析
    を施すものであることを特徴とする請求項1記載の信号
    推定装置。
  3. 【請求項3】 前記周波数解析部が、前記周波数解析手
    法として、減衰波もしくは減衰波の繰り返しを含む波形
    を基底関数とするウェーブレット変換を用いて、前記周
    波数解析を施すものであることを特徴とする請求項2記
    載の信号推定装置。
  4. 【請求項4】 前記周波数解析部が、前記周波数解析手
    法として等比周波数分析手法を用いて、前記周波数解析
    を施すものであることを特徴とする請求項1記載の信号
    推定装置。
  5. 【請求項5】 前記信号推定部が、前記周波数解析部に
    おける前記入力信号および前記雑音信号の周波数解析結
    果どうしの差分を求めるものであることを特徴とする請
    求項1から4のうちいずれか1項記載の信号推定装置。
  6. 【請求項6】 前記被推定原信号が音声を表わす音声信
    号であって、前記信号推定部が音声強調を行なうもので
    あることを特徴とする請求項1から5のうちいずれか1
    項記載の信号推定装置。
JP7155842A 1995-06-22 1995-06-22 信号推定装置 Pending JPH096391A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7155842A JPH096391A (ja) 1995-06-22 1995-06-22 信号推定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7155842A JPH096391A (ja) 1995-06-22 1995-06-22 信号推定装置

Publications (1)

Publication Number Publication Date
JPH096391A true JPH096391A (ja) 1997-01-10

Family

ID=15614695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7155842A Pending JPH096391A (ja) 1995-06-22 1995-06-22 信号推定装置

Country Status (1)

Country Link
JP (1) JPH096391A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008141734A (ja) * 2006-11-10 2008-06-19 Sony Corp エコーキャンセラ及び通話音声処理装置
JP2008287041A (ja) * 2007-05-18 2008-11-27 Sony Corp 撮像装置、音声処理回路、ノイズ低減回路、ノイズ低減方法およびプログラム
JP2010039215A (ja) * 2008-08-05 2010-02-18 Nippon Telegr & Teleph Corp <Ntt> 信号処理装置、信号処理方法、信号処理プログラムおよび記録媒体
JP2011522294A (ja) * 2008-05-29 2011-07-28 クゥアルコム・インコーポレイテッド スペクトルコントラスト強調のためのシステム、方法、装置、およびコンピュータプログラム製品
EP3627357A1 (en) 2018-08-28 2020-03-25 Yokogawa Electric Corporation Sound analysis apparatus, sound analysis method, and non-transitory computer readable storage medium
JP2020095202A (ja) * 2018-12-14 2020-06-18 日本電信電話株式会社 音響信号処理装置、その方法、およびプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008141734A (ja) * 2006-11-10 2008-06-19 Sony Corp エコーキャンセラ及び通話音声処理装置
JP4569618B2 (ja) * 2006-11-10 2010-10-27 ソニー株式会社 エコーキャンセラ及び通話音声処理装置
US8311234B2 (en) 2006-11-10 2012-11-13 Sony Corporation Echo canceller and communication audio processing apparatus
JP2008287041A (ja) * 2007-05-18 2008-11-27 Sony Corp 撮像装置、音声処理回路、ノイズ低減回路、ノイズ低減方法およびプログラム
JP2011522294A (ja) * 2008-05-29 2011-07-28 クゥアルコム・インコーポレイテッド スペクトルコントラスト強調のためのシステム、方法、装置、およびコンピュータプログラム製品
JP2010039215A (ja) * 2008-08-05 2010-02-18 Nippon Telegr & Teleph Corp <Ntt> 信号処理装置、信号処理方法、信号処理プログラムおよび記録媒体
EP3627357A1 (en) 2018-08-28 2020-03-25 Yokogawa Electric Corporation Sound analysis apparatus, sound analysis method, and non-transitory computer readable storage medium
US11094336B2 (en) 2018-08-28 2021-08-17 Yokogawa Electric Corporation Sound analysis apparatus, sound analysis method, and non-transitory computer readable storage medium
JP2020095202A (ja) * 2018-12-14 2020-06-18 日本電信電話株式会社 音響信号処理装置、その方法、およびプログラム
WO2020121860A1 (ja) * 2018-12-14 2020-06-18 日本電信電話株式会社 音響信号処理装置、その方法、およびプログラム

Similar Documents

Publication Publication Date Title
Vaseghi Multimedia signal processing: theory and applications in speech, music and communications
US8359195B2 (en) Method and apparatus for processing audio and speech signals
Vary et al. Digital speech transmission: Enhancement, coding and error concealment
George et al. Speech analysis/synthesis and modification using an analysis-by-synthesis/overlap-add sinusoidal model
US7313518B2 (en) Noise reduction method and device using two pass filtering
US6182035B1 (en) Method and apparatus for detecting voice activity
Kim et al. Nonlinear enhancement of onset for robust speech recognition.
Itoh et al. Environmental noise reduction based on speech/non-speech identification for hearing aids
US9245538B1 (en) Bandwidth enhancement of speech signals assisted by noise reduction
Avendano Temporal processing of speech in a time-feature space
Whitmal et al. Reducing correlated noise in digital hearing aids
JPH096391A (ja) 信号推定装置
Lim Speech enhancement
Hamid et al. Speech enhancement using EMD based adaptive soft-thresholding (EMD-ADT)
WO2006114100A1 (en) Estimation of signal from noisy observations
Lu et al. Comparative evaluation of modulation-transfer-function-based blind restoration of sub-band power envelopes of speech as a front-end processor for automatic speech recognition systems
Vashkevich et al. Petralex: A smartphone-based real-time digital hearing aid with combined noise reduction and acoustic feedback suppression
Whitmal et al. Denoising speech signals for digital hearing aids: a wavelet based approach
Li et al. A block-based linear MMSE noise reduction with a high temporal resolution modeling of the speech excitation
Upadhyay et al. A perceptually motivated stationary wavelet packet filterbank using improved spectral over-subtraction for enhancement of speech in various noise environments
Chokkarapu et al. Implementation of spectral subtraction noise suppressor using DSP processor
Fillon et al. Evaluation of an ERB frequency scale noise reduction for hearing aids: A comparative study
Mallidi et al. Modulation Spectrum Analysis for Recognition of Reverberant Speech.
Heute Noise reduction
WO2023197203A1 (en) Method and system for reconstructing speech signals

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040615