JP4348393B2 - 信号歪み除去装置、方法、プログラム及びそのプログラムを記録した記録媒体 - Google Patents
信号歪み除去装置、方法、プログラム及びそのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP4348393B2 JP4348393B2 JP2007522320A JP2007522320A JP4348393B2 JP 4348393 B2 JP4348393 B2 JP 4348393B2 JP 2007522320 A JP2007522320 A JP 2007522320A JP 2007522320 A JP2007522320 A JP 2007522320A JP 4348393 B2 JP4348393 B2 JP 4348393B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- filter
- inverse filter
- prediction error
- innovation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 75
- 238000004364 calculation method Methods 0.000 claims description 91
- 230000002087 whitening effect Effects 0.000 claims description 47
- 238000004458 analytical method Methods 0.000 claims description 26
- 238000009432 framing Methods 0.000 claims description 19
- 230000005236 sound signal Effects 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 3
- 230000014509 gene expression Effects 0.000 description 49
- 238000012545 processing Methods 0.000 description 49
- 230000008569 process Effects 0.000 description 44
- 238000005457 optimization Methods 0.000 description 34
- 230000006870 function Effects 0.000 description 33
- 238000012546 transfer Methods 0.000 description 20
- 238000003860 storage Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000012880 independent component analysis Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Filters That Use Time-Delay Elements (AREA)
Description
B.W.Gillespie, , H.S.Malvar, ,and D.A.F.Florencio, ,"Speech dereverberation via maximum-kurtosis subband adaptive filtering," IEEE International Conference on Acoustics, Speech, and Signal Processing, pp.3701-3704, 2001.
そこで本発明は、伝達特性に由来する歪みを観測信号から除去して精度の良い復元信号を得ることを目的とする。
この発明では、観測信号に伝達特性を除去するための逆フィルタを適用して得るアドホック信号に対して、このアドホック信号に基づいて求めた予測誤差フィルタを適用して得る信号(イノベーション推定値系列)が、その全サンプル間で独立となるような逆フィルタを求める。そして、所定の繰り返し終了条件を満たしたときの逆フィルタを観測信号に
適用することで復元信号を得る。
この構成は、イノベーション系列のサンプル間の独立性の尺度として相互情報量を規定し、これを最小化する予測誤差フィルタと逆フィルタを交代変数法で求めるものである。この詳細は後述する。
この構成は、イノベーション系列のサンプル間の独立性の尺度として相互情報量を規定し、これを最小化する予測誤差フィルタと逆フィルタを交代変数法で求めるものであるが、信号の高次統計量を用いることなく予測誤差フィルタと逆フィルタを交代変数法で求めることができる。
フレーム化して、各フレームのアドホック信号を線形予測分析して得た各フレームごとの予測誤差フィルタを出力する予測誤差フィルタ計算ステップと、逆フィルタ計算手段が、各フレームのアドホック信号に対して当該フレームに対応する予測誤差フィルタを適用して得る各信号(以下、イノベーション推定値という。)を結合した全フレームでのイノベーション推定値(以下、イノベーション推定値系列という。)が、その全サンプル間で独立となる逆フィルタを求め、この逆フィルタを出力する逆フィルタ計算ステップと、制御手段が、繰り返し終了条件を満たすまで逆フィルタ適用ステップ、予測誤差フィルタ計算ステップ、逆フィルタ計算ステップを繰り返し実行させる制御ステップと、を有する信号歪み除去方法とする。
以下、実施形態の説明に先立ち、本発明の理論を説明する。
以下の説明では、特に断りのない限り、信号源は1つとする。
本発明の対象となる信号は、人の音声、音楽、生体信号、測定対象物の物理量をセンサで観測した電気信号などの信号を広く包含する。より好ましくは、自己回帰(Autoregressive:AR)過程として表現することができる、あるいは表現することが好ましい信号であればよい。例えば音声信号は、通常、区分定常な自己回帰過程として表現される信号、すなわち独立同一分布(i.i.d. : Independent and Identically Distributed)信号に音韻性を表すAR系を作用させた信号として看做される(参考文献1参照)。
以下、信号の代表例として音声信号を挙げて本発明の理論を説明する。
(参考文献1) L.R.Rabiner, R.W.Schafer, "Digital Processing of Speech Signals", Bell Laboratories, Incorporated, 1978.
まず、原信号である音声信号s(t)を、以下の3つの条件を満足する信号としてモデル化する。
この[条件1]から、AR過程の次数をP、定常とみなせる区間長をWサンプルとして音声信号s(t)をフレーム化すると、第iフレームの音声信号si(n)は、式(1)のように表される。式(2)は、第iフレームの音声信号si(n)のサンプルと、フレーム化前の音声信号s(t)のサンプルとの対応を示している。つまり、第iフレームのn番目のサンプルは、フレーム化前の音声信号s(t)において、(i−1)W+n番目のサンプルに相当する。式(1)および式(2)において、bi(k)は線形予測係数、ei(n)はイノベーションを表す。但し、1≦n≦W、1≦t≦N、Nは全サンプル数である。以下、特に断りの無い限り、パラメータnは1フレームのサンプル番号を表し、パラメータtは全てのサンプル番号を表す。また、全フレーム数はFとする。
同一分布に属する。イノベーションe i (1),…,ei(W)の確率分布の平均及び歪度(3次キュムラント)は0、尖度(4次キュムラント)は正である。さらに、異なるフレームi、j〔i≠j〕に属するイノベーションei(n)とej(n′)同士も独立である。ただし、これらは必ずしも同一分布に属するとは限らない。
[条件3]予測誤差フィルタ1−Bi(z)は、相異なるフレーム間で共通する零点をもたない。
次に、M個のマイクロホンで音声信号を観測して観測信号を得たときの観測信号をモデル化する。但しMは、M≧1の整数である。
m番目(1≦m≦M)のマイクロホンで観測される残響信号xm(t)を、音源からm番目のマイクロホンに至る経路の伝達関数Hm(z)のタップ重み係数{hm(k);0≦k≦K;Kはインパルス応答の持続時間とする。}を用いて式(4)のようにモデル化する。ここでは、音声信号の場合の伝達特性の代表例として残響を挙げて、伝達特性を残響に言い換えて説明する。但し、伝達特性を残響に限定する趣旨ではない。
信号歪み除去後の復元信号y(t)は、多チャネル逆フィルタ{Gm(z);1≦m≦M}のタップ重み係数{gm(k);1≦m≦M,0≦k≦L;Lは逆フィルタの次数}を用いて式(6)により計算される。本発明においては、逆フィルタ係数であるgm(k)を観測信号x1(t),…,xM(t)のみから推定する。
本発明の基本原理は、伝達関数{Hm(z);1≦m≦M}の逆フィルタ{Gm(z);1≦m≦M}とARフィルタ{1/(1−Bi(z));1≦i≦F}の逆フィルタである予測誤差フィルタ{1−Ai(z);1≦i≦F}とを並行して推定することを主な特徴とする。
(参考文献A) Takuya Yoshioka, Takafumi Hikichi, Masato Miyoshi, Hiroshi G. Okuno: Robust Decomposition of Inverse Filter of Channel and Prediction Error Filter of Speech Signal for Dereverberation, Proceedings of the 14th European Signal
Processing Conference (EUSIPCO 2006), CD-ROM Proceedings, Florence, 2006.
よ」という問題の解として得る。この問題で留意しなければならないことは、予測誤差フィルタが、観測信号に逆フィルタを適用して得る信号に基づいて求められるため、逆フィルタだけでなく予測誤差フィルタも一緒に求めることになるということである。
この問題は、ICA(Independent Component Analysis)と同様の考え方によって定式化することができる。ここでは相互情報量を最小化する観点から説明を行うが、例えば最尤推定法に基づいて定式化することも可能である。いずれにしても問題の定式化の違いに過ぎない。
[1] ‖g‖=1 (但し‖・‖はノルムを表す。)
[2] 1−Ai(z)は、複素平面上で単位円の内部に全ての零点をもつ〔1≦i≦F〕。
式(7)の最適化を実行するためには、損失関数I(d1(1),…,dF(W))を有限長の信号系列{di(n);1≦i≦F,1≦n≦W}から推定しなければならない。(多変量)確率変数Uの微分エントロピーをD(U)と表記すると、I(d1(1),…,dF(W))は式(8)で定義される。ただし、d=[dF T,…,d1 T]T、di=[di(W),…,di(1)]Tである。
[1] ‖g‖=1 (但し‖・‖はノルムを表す。)
[2] 1−Ai(z)は、複素平面上で単位円の内部に全ての零点をもつ〔1≦i≦F〕。
式(16)について、交代変数の方法により、gとaを最適化する。すなわち、r回目の繰り返しにおけるg及びaの推定値をそれぞれg^(r)、a^(r)と表せば、式(17)および式(18)の交互の最適化により更新された推定値g^(r+1),a^(r+1)を得る。なお、g^およびa^は、記号^がg、aのそれぞれの上に付されたものを表す。例えば繰り返し回数の上限をR1とすれば、R1回目で得られるg^(R1+1)、a^(R1+1)が式(16)の最適解である。上付き文字のR1は、R1である。
[1] g=g^(r)
[2] 1−Ai(z)は、複素平面上で単位円の内部に全ての零点をもつ〔1≦i≦F〕。
[1] a=a^(r+1)
[2] ‖g‖=1
本発明では、式(17)の最適化を以下のように行う。
まず注意すべきことは、C(d1(1),…,dF(W))はdi(n)の2次の統計量に関連するのに対して、J(di(n))はdi(n)の高次の統計量に関連する値である。2次の統計量は信号の振幅情報のみ提供するが、高次の統計量は位相情報も提供する。したがって、一般に、高次統計量を含む最適化は、非最小位相系を導く可能性がある。そこで、1−Ai(z)が最小位相系であるという拘束条件から、aの最適化においては式(19)の最適化問題を解く。
[1] g=g^(r)
[2] 1−Ai(z)は、複素平面上で単位円の内部に全ての零点をもつ〔1≦i≦F〕。
[1] g=g^(r)
[2] 1−Ai(z)は、複素平面上で単位円の内部に全ての零点をもつ〔1≦i≦F〕。
本発明では、式(18)の最適化を以下のように行う。
前述したとおり、C(d1(1),…,dF(W))は{di(n);1≦i≦F,1≦n≦W}の相関の度合いに関わる指標であるが、(r+1)回目のaの最適化において最小化されているため、Σi=1 FΣn=1 WJ(di(n))に比べて無視できる。そこでgの最適化においては、式(23)の最適化問題を解く。
[1] a=a^(r+1)
[2] ‖g‖=1
(参考文献2) A.Hyvarinen, J.Karhunen, E.Oja, "INDEPENDENT COMPONENT ANALYSIS", John Wiley & Sons, Inc. 2001.
[1] a=a^(r+1)
[2] ‖g‖=1
上述の従来的手法の信号歪み除去方法は、比較的長時間の観測信号(例えば20秒程度である。)を要する。これは、一般に、正規化尖度のような高次統計量を計算するためには大量の観測信号のサンプルが必要となるからである。しかし、実際にはそうした長時間の観測信号を利用できない場合が多い。このため、従来的手法の信号歪み除去方法の適用
分野は極めて限られていた。
また高次統計量の計算は比較的複雑であるため、従来的手法の信号歪み除去方法では装置の構成が複雑になりやすい。
そこで、観測信号がより短時間(例えば3秒から5秒程度である。)の場合にも有効であり、かつ計算が従来に比して容易な信号歪み除去の原理を説明する。この原理は、信号の二次統計量のみを用いるものであり、§1で説明した本発明の基本原理より派生する。
二次統計量に基づく信号歪み除去では、上述の3つの条件に、次の2つの条件を設定する。
[条件4] M≧2である。すなわち、複数本のマイクロホンを用いる。
[条件5] Hm={hm(k)}k=0 Kは相異なるマイクロホンの間で共通の零点を持たない。
確率変数間の相関の度合いを示す指標Cは、二次の統計量で規定される。そこで、解くべき最適化問題を式(33)で定式化する。
45, No.3, pp. 694-705, 1997.
式(34)について、交代変数の方法により、gとaを最適化する。
逆フィルタの係数gm(k)を固定した状態で予測誤差フィルタの係数ai(k)に関して式(34)の損失関数を最小化する。
このとき、次の2点に注意する。1点目は、g=[g1 T,…,gM T]Tは固定されているので、逆フィルタGの出力である復元信号y(t)は予測誤差フィルタの最適化において不変であるということである。2点目は、i番目のフレームにおける予測誤差フィルタの係数ai(1),…,ai(P)は、di(1),…,di(W)にのみ寄与するということである。
予測誤差フィルタの係数ai(k)を固定した状態で逆フィルタの係数gm(k)に関して式(34)の損失関数を最小化する。
逆フィルタの係数gm(k)に関する損失関数の最小化には、勾配法を用いる。[条件2]を用いると、式(34)の最適化問題は、式(36)の最適化問題に転化される。
Wをgで微分してこれをゼロとしたときの解を求めればよい。この解は、一般的には、式(37)で表される更新則に従って求められる。δは学習率を表す。1≦m≦M、1≦k≦Lである。なお、式(37)では、式(35)の条件から‖g‖=1なる拘束条件が課されないことに留意しなければならない。同様に式(35)の条件からkが取る値の範囲は1≦k≦Lである。
本発明の信号歪み除去には、プリ・ホワイトニングを適用することができる。観測信号をプリ・ホワイトニングすることで、最適化計算の安定化、とくにフィルタ係数の推定値の高速な収束が可能となる。
各マイクロホンで得られた観測信号系列全体{xm(t);1≦t≦N}を白色化するフィルタ(白色化フィルタ)の係数{fm(k);0≦k≦X}をX次の線形予測分析によって計算する。
式(39)に従って、上記白色化フィルタを各マイクロホンで得られた観測信号xm(t)に適用する。wm(t)は、m番目のマイクロホンで得た観測信号xm(t)を白色化した信号を表す。
以下、本発明の実施形態を図面を参照して説明する。本発明の実施形態として、後述の各実施形態に限定するものではなく、各セクションで説明した原理を実現する実施形態であればよい。
本発明の第1実施形態を実施する場合、以下の手順に従ってセンサで得た観測信号を処理する。ここでは、実施形態を具体的に説明する観点から信号として音声信号を例に挙げて説明する。
なお、第1実施形態の説明に先立ち、観測信号およびフレーム化処理について概説する。
図示しないセンサ(例えばマイクロホン)によって得られたアナログ信号(このアナログ信号には伝達特性に由来する歪みが重畳されている。)は、例えば8,000Hzのサンプリングレートでサンプリングされ、適宜量子化された離散信号に変換される。以下、この離散信号を観測信号ということにする。アナログ信号から観測信号へのA/D変換などを実行するために必要となる構成要素(手段)は、いずれも公知技術の常套手段によって達成されるから、説明および図示を略する。
図示しない信号フレーム化手段が、離散信号から、時間軸方向に一定時間幅でフレームの始点を移動させながら、所定時間長の離散信号を切り出す。例えば200サンプル点(8,000Hz×25ms)長の離散信号を、80サンプル点(8,000Hz×10ms)ずつ始点を移動させながら切り出す。切り出された信号は、離散信号に公知の窓関数(例えば、ハミング窓、ガウス窓、方形窓など)が適用される。窓関数の適用によるフレーム化は公知の常套手段によって達成される。
図2に例示するように、信号歪み除去装置(1)は、キーボード、ポインティングデバイスなどが接続可能な入力部(11)、液晶ディスプレイ、CRT(Cathode Ray Tube)ディスプレイなどが接続可能な出力部(12)、信号歪み除去装置(1)外部に通信可能な通信装置(例えば通信ケーブル、LANカード、ルータ、モデムなど)が接続可能な通信部(13)、DSP(Digital Signal Processor)(14)〔CPU(Central Processing Unit)でも良い。またキャッシュメモリやレジスタ(19)などを備えていてもよい。〕、メモリであるRAM(15)、ROM(16)やハードディスク、光ディスク、半導体メモリなどである外部記憶装置(17)並びにこれらの入力部(11)、出力部(12)、通信部(13)、DSP(14)、RAM(15)、ROM(16)、外部記憶装置(17)間のデータのやり取りが可能なように接続するバス(18)を有している。
また必要に応じて、信号歪み除去装置(1)に、CD−ROM(Compact Disc Read Only
Memory)、DVD(Digital Versatile Disc)などの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。
大まかな処理の手順は、(a)観測信号x(t)に対して逆フィルタを適用した信号(以下、アドホック信号という。)を求め、(b)アドホック信号から予測誤差フィルタを求め、(c)この予測誤差フィルタから逆フィルタを求め、(d)前記(a)、(b)、(c)の処理を繰り返して最適な逆フィルタを求め、(e)最適化された逆フィルタを観測信号に対して適用した信号を復元信号y(t)として得る。
(b)は上述のaの最適化に相当し、(c)は上述のgの最適化に相当し、(d)は、式(17)および式(18)に相当する。(d)の処理の繰り返し回数は予め定めた回数R1とする。つまり、1≦r≦R1とする。また、(c)の処理でgを最適化する更新則の更新回数は予め定めた回数R2とする。つまり、1≦u≦R2とする。(d)の処理、つまり(a)、(b)、(c)の一連の処理を1回行うたびに、更新則によるR2回の更新が行なわれる。実施形態では、回数R1は、予め定めた回数とするが、これに限定されず、例えば、r回目のgを算出したときの式(26)のQの値とr+1回目のgを算出したときの式(26)のQの値との差の絶対値が所定の正の微小値ε以下(あるいはε未満)になったときに繰り返しを中止するようにしてもよい。同様に、回数R2は、予め定めた回数とするが、これに限定されず、例えば、u回目のgを算出したときの式(26)のQの値とu+1回目のgを算出したときの式(26)のQの値との差の絶対値が所定の正の微小値ε以下(あるいはε未満)になったときに繰り返しを中止するようにしてもよい。
逆フィルタ適用部(14)は、式(42)に従って逆フィルタを観測信号x(t)=[x1(t),…,xm(t),…,xM(t)]Tに適用することで、アドホック信号y(t)を求める。アドホック信号y(t)は、計算上は復元信号と全く同じであるが、こ
こでは後述のR1回の処理を経て求められた復元信号ではないことを明示するためアドホック信号と呼称する。ここでtは、全てのサンプル番号を示し、1≦t≦Nとする。Nは全サンプル数である。第1実施形態では、マイクロホンの個数Mは1以上であればよい。
予測誤差フィルタ計算部(15)は、フレーム化処理を行うフレーム化処理部(151)とフレーム予測誤差フィルタ計算部(152)によって構成される。そして、フレーム予測誤差フィルタ計算部(152)は、第iフレームのアドホック信号から予測誤差フィルタを求める第iフレーム用予測誤差フィルタ計算部(152i)からなる。ただし、iは、1≦i≦Fを満たす整数である。
逆フィルタ計算部(13)の機能構成例を、図4を参照して説明する。逆フィルタ計算部(13)は勾配計算部(131)、逆フィルタ更新部(132)および更新用逆フィルタ適用部(133)によって構成される。更に、勾配計算部(131)は、観測信号への予測誤差フィルタ適用部として機能する第1の予測誤差フィルタ適用部(1311)と、観測信号に更新用逆フィルタを適用して得られる信号(更新用逆フィルタ適用後信号)への予測誤差フィルタ適用部として機能する第2の予測誤差フィルタ適用部(1312)と、勾配ベクトル計算部(1313)とを備えて構成される。ここで更新用逆フィルタは、式(27)のg〈u〉に相当する。
31)を参照)。ここで述べた処理の詳細の一例は、後述の第3実施形態の説明に譲る。
第2実施形態は、第1実施形態の変形例に相当する。具体的には、§3で述べたプリ・ホワイトニングを行なう形態である。そこで、第1実施形態と異なる部分について図6および図7を参照して説明を加える。なお、プリ・ホワイトニングは観測信号に対して行なうプリ・プロセスであるから、ここで説明するプリ・ホワイトニングを行なう形態は、後述の第3実施形態にも適用可能である。
第2実施形態では、信号歪み除去装置(1)の外部記憶装置(17)〔あるいはROM
など〕に、白色化フィルタを求める処理のためのプログラム、白色化フィルタを観測信号に適用する処理のためのプログラムも記憶されている。
第2実施形態に係る信号歪み除去装置(1)では、外部記憶装置(17)〔あるいはROMなど〕に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAM(15)に読み込まれて、DSP(14)で解釈実行・処理される。その結果、DSP(14)が所定の機能(逆フィルタ適用部、予測誤差フィルタ計算部、逆フィルタ計算部、白色化フィルタ計算部、白色化フィルタ適用部)を実現することで、信号歪み除去が実現される。
白色化フィルタ計算部(11)は、各マイクロホンで得られた観測信号全体{xm(t);1≦t≦N}を白色化するフィルタ(白色化フィルタ)の係数{fm(k);0≦k≦X}をX次の線形予測分析によって計算する。この計算は線形予測分析と同じであり上記参考文献1を参照されたい。白色化フィルタの係数は、白色化フィルタ適用部(12)の入力となる。
白色化フィルタ適用部(12)は、式(39)に従って、上記白色化フィルタを各マイクロホンで得られた観測信号に適用して、白色化信号wm(t)を得る。既述のとおり、式(31)は式(40)に変更すればよいので、第1実施形態において、逆フィルタ計算部(13)、とくに第1の予測誤差フィルタ適用部(1311)による処理を式(31)ではなく式(40)による計算処理に改めればよい。また、第1実施形態において、逆フィルタ適用部(14)による処理を、式(42)ではなく式(44)による計算処理に改めればよい。ステップS100bの処理の後、第1実施形態のステップS100〜S104の処理を行うが、これらの処理では第1実施形態の各処理における観測信号をステップS100bの処理で得られた白色化信号に読み替えて第1実施形態と同様の処理を行う。このことを明示するため、図7では、第1実施形態のステップS100〜S104の各処理に相当する処理を示す符号に記号′を付している。
発明者らは第2実施形態の実証実験を行ったので、その実験結果を示す。実験条件として、マイクロホンの数M=4、白色化フィルタの次数X=500、逆フィルタの次数L=1000、窓関数の切出しサンプル数(1フレームのサンプル数)W=200、予測誤差フィルタの次数P=16、繰り返し回数R1=10、逆フィルタ計算部の更新回数R2=20とした。学習率η(u)は、初期値を0.05に設定し、もし式(27)によって式(26)の値が減少するならば、式(26)の値が増大するまでη(u)の値を再帰的に半減した。図6に示した逆フィルタ適用部(14)へ入力する初期逆フィルタは、式(45)のように設定した。
の全エネルギーに対する初期の50msecまでのエネルギーの比)を用いて評価した。連続発話データベースから男女各一名の発話を取り出し、残響時間0.5秒の残響室で測定したインパルス応答を畳み込むことで観測信号を合成した。
図8は、男声および女声について観測信号長Nを5秒、10秒、20秒、1分、3分に変化させたときの、繰り返し回数R1 (図6に示す逆フィルタ適用部(14)と、予測誤差フィルタ計算部(15)と、逆フィルタ計算部(13)を一巡する処理を実行して逆フィルタを求める回数)とD50値の関係を示している。いずれの場合においても、繰り返し回数を増加させるとD50値が向上しており、繰り返し処理の効果が顕著に見て取れる。特に観測信号長が5〜10秒程度の比較的短い長さであっても、繰り返し処理によってD50値が大きく向上したことが分かる。
図9Aは1分間の観測信号を用いて得られた残響を含まない音声(原音声)のスペクトログラムの抜粋、図9Bは1分間の観測信号を用いて得られた残響を含む音声(観測音声)のスペクトログラムの抜粋、図9Cは1分間の観測信号を用いて得られた残響除去後の音声(復元音声)のスペクトログラムの抜粋を示している。図9Aと図9Cとの対比および図9Bと図9Cとの対比から、観測信号に含まれる残響が抑制され、原音声固有の特徴である調波構造やフォルマント構造が回復されたことが分かる。
図10Bは原音声の波形、図10Aは原音声と観測音声とのLPCスペクトル歪みの時系列(図中の点線)および原音声と復元音声とのLPCスペクトル歪みの時系列(図中の実線)を示している。図10Aおよび図10Bの各横軸は秒単位の時間を表し、両図でタイムスケールを揃えている。図10Bの縦軸は振幅値を表している。但し、原信号の相対的な大きさが分かればよいので、この趣旨から図10Bの縦軸では単位を明示していない。図10Aの縦軸は、LPCスペクトル歪みSD(dB)を表している。
図10Aから、原音声と復元音声とのLPCスペクトル歪みの時系列(図中の実線)は、原音声と観測音声とのLPCスペクトル歪みの時系列(図中の点線)よりも常に小さいことがわかる。なお、観測音声ではLPCスペクトル歪みの平均が5.39dB、分散が4.20dBであったのに対して、復元音声では平均が2.38dB、分散が2.00dBであった。
また、図10Aと図10Bとの対比から、原音声と復元音声とのLPCスペクトル歪みの時系列(図中の実線)が大きな値を示す区間(例えば約1.0秒〜約1.2秒の区間を参照)は、原音声の波形の振幅値がほぼ0であることがわかる。実際、この区間では発声がなく無音区間である。このため、実際に知覚される歪みはかなり小さくなっていた。つまり、発声区間における原音声と復元音声とのLPCスペクトル歪みの時系列(図中の実線)は、原音声と観測音声とのLPCスペクトル歪みの時系列(図中の点線)よりもかなり小さく、このため原音声のスペクトルを高い精度で復元できたことが結論付けられる。
第3実施形態は、第1実施形態の変形例に相当する。具体的には、§2で述べた二次統計量に基づく信号歪み除去処理を行なう形態である。そこで、第1実施形態と異なる部分について図11および図12を参照して説明を加える。但し、第3実施形態では、マイクロホンの個数Mは2以上とする。
第3実施形態に係る逆フィルタ計算部(13)の機能構成例を、図11を参照して説明
する。
逆フィルタ計算部(13)は、観測信号への予測誤差フィルタ適用部として機能する第1の予測誤差フィルタ適用部(1311)と、観測信号に更新用逆フィルタを適用して得られる信号(更新用逆フィルタ適用後信号)への予測誤差フィルタ適用部として機能する第2の予測誤差フィルタ適用部(1312)と、勾配ベクトル計算部(1313)と、逆フィルタ更新部(132)および更新用逆フィルタ適用部(133)によって構成される。ここで更新用逆フィルタは、式(37)のgm(k)に相当する。
用逆フィルタ適用後信号y(t)は、第2の予測誤差フィルタ適用部(1312)の入力となる。
発明者らは第3実施形態の実証実験を行ったので、その実験結果を示す。実験条件として、M=4,L=1000,W=200,P=16,R1=6,R2=50とした。学習率δは、初期値を0.05に設定し、Σi=1 Flog<di(n)2>n=1 Wの値が増加するならば、Σ i=1 F log<d i (n) 2 > n=1 W が減少するまで、学習率δの値を順次半減させた。逆フィルタの初期推定値は、gm(k)=0,1≦m≦M,1≦k≦Lとして設定した。
(参考文献5) H. kuttruff. Room acoustics. Elsevier Applied Science, third edition, P.237 1991.
図14は、残響除去前後におけるエネルギー減衰曲線の例である。直接音が到達してから50ミリ秒後の反射音のエネルギーが15dB低減されていることが分かる。
Claims (14)
- 観測信号の信号歪みを除去して復元信号を得る信号歪み除去装置であって、
所定の繰り返し終了条件を満たした場合には、上記観測信号に適用するためのフィルタ(以下、逆フィルタという。)を、上記観測信号に適用して、この結果を上記復元信号として出力し、上記繰り返し終了条件を満たさない場合には、上記観測信号に上記逆フィルタを適用して、この結果をアドホック信号として出力する逆フィルタ適用手段と、
上記アドホック信号をフレーム化して、各フレームのアドホック信号を線形予測分析して得た各フレームごとの予測誤差フィルタを出力する予測誤差フィルタ計算手段と、
上記各フレームのアドホック信号に対して当該フレームに対応する上記予測誤差フィルタを適用して得る各信号(以下、イノベーション推定値という。)を結合した全フレームでのイノベーション推定値(以下、イノベーション推定値系列という。)が、その全サンプル間で独立となる上記逆フィルタを求め、この逆フィルタを出力する逆フィルタ計算手段と、
上記繰り返し終了条件を満たすまで上記逆フィルタ適用手段、上記予測誤差フィルタ計算手段、上記逆フィルタ計算手段を繰り返し実行させる制御手段と、
を備えた信号歪み除去装置。 - 上記予測誤差フィルタ計算手段は、
上記各イノベーション推定値の分散の全フレームでの総和が最小となるときの予測誤差フィルタ、または、上記各イノベーション推定値の分散の対数値の全フレームでの総和が最小となるときの予測誤差フィルタ、を求めるとして、各フレームのアドホック信号の線形予測分析を行ない、各フレームごとの上記予測誤差フィルタを出力するものであり、
上記逆フィルタ計算手段は、
上記イノベーション推定値系列がその全サンプル間で独立となる上記逆フィルタとして、上記各イノベーション推定値の正規化尖度の全フレームでの総和が最大となるときの逆フィルタを求め、この逆フィルタを出力するものである
ことを特徴とする請求項1に記載の信号歪み除去装置。 - 上記予測誤差フィルタ計算手段は、
上記各イノベーション推定値の分散の全フレームでの総和が最小となるときの予測誤差フィルタ、または、上記各イノベーション推定値の分散の対数値の全フレームでの総和が最小となるときの予測誤差フィルタ、を求めるとして、各フレームのアドホック信号の線形予測分析を行ない、各フレームごとの上記予測誤差フィルタを出力するものであり、
上記逆フィルタ計算手段は、
上記イノベーション推定値系列がその全サンプル間で独立となる上記逆フィルタとして、上記各イノベーション推定値の分散の全フレームでの総和が最小となるときの逆フィルタ、または、上記各イノベーション推定値の分散の対数値の全フレームでの総和が最小となるときの逆フィルタを求め、この逆フィルタを出力するものである
ことを特徴とする請求項1に記載の信号歪み除去装置。 - 観測信号の信号歪みを除去して復元信号を得る信号歪み除去装置であって、
上記観測信号を線形予測分析して得た白色化フィルタを出力する白色化フィルタ計算手段と、
上記白色化フィルタを上記観測信号に適用して白色化信号を出力する白色化フィルタ適用手段と、
所定の繰り返し終了条件を満たした場合には、上記白色化信号に適用するためのフィルタ(以下、逆フィルタという。)を、上記白色化信号に適用して、この結果を上記復元信号として出力し、上記繰り返し終了条件を満たさない場合には、上記白色化信号に上記逆フィルタを適用して、この結果をアドホック信号として出力する逆フィルタ適用手段と、
上記アドホック信号をフレーム化して、各フレームのアドホック信号を線形予測分析して得た各フレームごとの予測誤差フィルタを出力する予測誤差フィルタ計算手段と、
上記各フレームのアドホック信号に対して当該フレームに対応する上記予測誤差フィルタを適用して得る各信号(以下、イノベーション推定値という。)を結合した全フレームでのイノベーション推定値(以下、イノベーション推定値系列という。)が、その全サンプル間で独立となる上記逆フィルタを求め、この逆フィルタを出力する逆フィルタ計算手段と、
上記繰り返し終了条件を満たすまで上記逆フィルタ適用手段、上記予測誤差フィルタ計算手段、上記逆フィルタ計算手段を繰り返し実行させる制御手段と、
を備えた信号歪み除去装置。 - 上記繰り返し終了条件は、
繰り返し回数がR1回(但しR1は、R1≧1を満たす整数である。)となることである
ことを特徴とする請求項1から請求項4のいずれかに記載の信号歪み除去装置。 - 上記観測信号は、信号歪みを含む音声信号である
ことを特徴とする請求項1から請求項5のいずれかに記載の信号歪み除去装置。 - 観測信号の信号歪みを除去して復元信号を得る信号歪み除去方法であって、
逆フィルタ適用手段が、所定の繰り返し終了条件を満たした場合には、上記観測信号に適用するためのフィルタ(以下、逆フィルタという。)を、上記観測信号に適用して、この結果を上記復元信号として出力し、上記繰り返し終了条件を満たさない場合には、上記観測信号に上記逆フィルタを適用して、この結果をアドホック信号として出力する逆フィルタ適用ステップと、
予測誤差フィルタ計算手段が、上記アドホック信号をフレーム化して、各フレームのアドホック信号を線形予測分析して得た各フレームごとの予測誤差フィルタを出力する予測誤差フィルタ計算ステップと、
逆フィルタ計算手段が、上記各フレームのアドホック信号に対して当該フレームに対応する上記予測誤差フィルタを適用して得る各信号(以下、イノベーション推定値という。)を結合した全フレームでのイノベーション推定値(以下、イノベーション推定値系列という。)が、その全サンプル間で独立となる上記逆フィルタを求め、この逆フィルタを出力する逆フィルタ計算ステップと、
制御手段が、上記繰り返し終了条件を満たすまで上記逆フィルタ適用ステップ、上記予測誤差フィルタ計算ステップ、上記逆フィルタ計算ステップを繰り返し実行させる制御ステップと、
を有する信号歪み除去方法。 - 上記予測誤差フィルタ計算ステップは、
上記各イノベーション推定値の分散の全フレームでの総和が最小となるときの予測誤差フィルタ、または、上記各イノベーション推定値の分散の対数値の全フレームでの総和が最小となるときの予測誤差フィルタ、を求めるとして、各フレームのアドホック信号の線形予測分析を行ない、各フレームごとの上記予測誤差フィルタを出力するものであり、
上記逆フィルタ計算ステップは、
上記イノベーション推定値系列がその全サンプル間で独立となる上記逆フィルタとして、上記各イノベーション推定値の正規化尖度の全フレームでの総和が最大となるときの逆フィルタを求め、この逆フィルタを出力するものである
ことを特徴とする請求項7に記載の信号歪み除去方法。 - 上記予測誤差フィルタ計算ステップは、
上記各イノベーション推定値の分散の全フレームでの総和が最小となるときの予測誤差フィルタ、または、上記各イノベーション推定値の分散の対数値の全フレームでの総和が最小となるときの予測誤差フィルタ、を求めるとして、各フレームのアドホック信号の線形予測分析を行ない、各フレームごとの上記予測誤差フィルタを出力するものであり、
上記逆フィルタ計算ステップは、
上記イノベーション推定値系列がその全サンプル間で独立となる上記逆フィルタとして、上記各イノベーション推定値の分散の全フレームでの総和が最小となるときの逆フィルタ、または、上記各イノベーション推定値の分散の対数値の全フレームでの総和が最小となるときの逆フィルタを求め、この逆フィルタを出力するものである
ことを特徴とする請求項7に記載の信号歪み除去方法。 - 観測信号の信号歪みを除去して復元信号を得る信号歪み除去方法であって、
白色化フィルタ計算手段が、上記観測信号を線形予測分析して得た白色化フィルタを出力する白色化フィルタ計算ステップと、
白色化フィルタ適用手段が、上記白色化フィルタを上記観測信号に適用して白色化信号を出力する白色化フィルタ適用ステップと、
逆フィルタ適用手段が、所定の繰り返し終了条件を満たした場合には、上記白色化信号に適用するためのフィルタ(以下、逆フィルタという。)を、上記白色化信号に適用して、この結果を上記復元信号として出力し、上記繰り返し終了条件を満たさない場合には、上記白色化信号に上記逆フィルタを適用して、この結果をアドホック信号として出力する逆フィルタ適用ステップと、
予測誤差フィルタ計算手段が、上記アドホック信号をフレーム化して、各フレームのアドホック信号を線形予測分析して得た各フレームごとの予測誤差フィルタを出力する予測誤差フィルタ計算ステップと、
逆フィルタ計算手段が、上記各フレームのアドホック信号に対して当該フレームに対応する上記予測誤差フィルタを適用して得る各信号(以下、イノベーション推定値という。)を結合した全フレームでのイノベーション推定値(以下、イノベーション推定値系列という。)が、その全サンプル間で独立となる上記逆フィルタを求め、この逆フィルタを出力する逆フィルタ計算ステップと、
制御手段が、上記繰り返し終了条件を満たすまで上記逆フィルタ適用ステップ、上記予測誤差フィルタ計算ステップ、上記逆フィルタ計算ステップを繰り返し実行させる制御ステップと、
を有する信号歪み除去方法。 - 上記繰り返し終了条件は、
繰り返し回数がR1回(但しR1は、R1≧1を満たす整数である。)となることである
ことを特徴とする請求項7から請求項10のいずれかに記載の信号歪み除去方法。 - 上記観測信号は、信号歪みを含む音声信号である
ことを特徴とする請求項7から請求項11のいずれかに記載の信号歪み除去方法。 - 請求項1から請求項6のいずれかに記載された信号歪み除去装置としてコンピュータを機能させるための信号歪み除去プログラム。
- 請求項13に記載の信号歪み除去プログラムを記録した、コンピュータに読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007522320A JP4348393B2 (ja) | 2006-02-16 | 2007-02-16 | 信号歪み除去装置、方法、プログラム及びそのプログラムを記録した記録媒体 |
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006039326 | 2006-02-16 | ||
JP2006039326 | 2006-02-16 | ||
JP2006241364 | 2006-09-06 | ||
JP2006241364 | 2006-09-06 | ||
JP2007522320A JP4348393B2 (ja) | 2006-02-16 | 2007-02-16 | 信号歪み除去装置、方法、プログラム及びそのプログラムを記録した記録媒体 |
PCT/JP2007/052874 WO2007094463A1 (ja) | 2006-02-16 | 2007-02-16 | 信号歪み除去装置、方法、プログラム及びそのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2007094463A1 JPWO2007094463A1 (ja) | 2009-07-09 |
JP4348393B2 true JP4348393B2 (ja) | 2009-10-21 |
Family
ID=38371639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007522320A Expired - Fee Related JP4348393B2 (ja) | 2006-02-16 | 2007-02-16 | 信号歪み除去装置、方法、プログラム及びそのプログラムを記録した記録媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8494845B2 (ja) |
EP (1) | EP1883068B1 (ja) |
JP (1) | JP4348393B2 (ja) |
CN (1) | CN101322183B (ja) |
WO (1) | WO2007094463A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103747238B (zh) * | 2013-02-20 | 2015-07-08 | 华为技术有限公司 | 视频静止失真程度评估方法和装置 |
JP2014219607A (ja) * | 2013-05-09 | 2014-11-20 | ソニー株式会社 | 音楽信号処理装置および方法、並びに、プログラム |
JP6293314B2 (ja) * | 2014-07-08 | 2018-03-14 | ヴェーデクス・アクティーセルスカプ | 補聴器システムのパラメータ最適化方法および補聴器システム |
FR3055727B1 (fr) * | 2016-09-06 | 2019-10-11 | Centre National D'etudes Spatiales | Procede et dispositif de caracterisation des aberrations d'un systeme optique |
JP6728250B2 (ja) * | 2018-01-09 | 2020-07-22 | 株式会社東芝 | 音響処理装置、音響処理方法およびプログラム |
CN110660405B (zh) * | 2019-09-24 | 2022-09-23 | 度小满科技(北京)有限公司 | 一种语音信号的提纯方法及装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4672665A (en) * | 1984-07-27 | 1987-06-09 | Matsushita Electric Industrial Co. Ltd. | Echo canceller |
WO1995015550A1 (en) * | 1993-11-30 | 1995-06-08 | At & T Corp. | Transmitted noise reduction in communications systems |
US5574824A (en) * | 1994-04-11 | 1996-11-12 | The United States Of America As Represented By The Secretary Of The Air Force | Analysis/synthesis-based microphone array speech enhancer with variable signal distortion |
EP0766446B1 (en) * | 1995-09-26 | 2003-06-11 | Nippon Telegraph And Telephone Corporation | Method and apparatus for multi-channel acoustic echo cancellation |
US5774562A (en) * | 1996-03-25 | 1998-06-30 | Nippon Telegraph And Telephone Corp. | Method and apparatus for dereverberation |
JP2001175298A (ja) * | 1999-12-13 | 2001-06-29 | Fujitsu Ltd | 騒音抑圧装置 |
JP2002258897A (ja) * | 2001-02-27 | 2002-09-11 | Fujitsu Ltd | 雑音抑圧装置 |
JP3506138B2 (ja) * | 2001-07-11 | 2004-03-15 | ヤマハ株式会社 | 複数チャンネルエコーキャンセル方法、複数チャンネル音声伝送方法、ステレオエコーキャンセラ、ステレオ音声伝送装置および伝達関数演算装置 |
JP3568922B2 (ja) * | 2001-09-20 | 2004-09-22 | 三菱電機株式会社 | エコー処理装置 |
US7167568B2 (en) * | 2002-05-02 | 2007-01-23 | Microsoft Corporation | Microphone array signal enhancement |
US7555434B2 (en) * | 2002-07-19 | 2009-06-30 | Nec Corporation | Audio decoding device, decoding method, and program |
JP2004064584A (ja) * | 2002-07-31 | 2004-02-26 | Kanda Tsushin Kogyo Co Ltd | 信号分離抽出装置 |
JP4496379B2 (ja) * | 2003-09-17 | 2010-07-07 | 財団法人北九州産業学術推進機構 | 分割スペクトル系列の振幅頻度分布の形状に基づく目的音声の復元方法 |
US7533017B2 (en) * | 2004-08-31 | 2009-05-12 | Kitakyushu Foundation For The Advancement Of Industry, Science And Technology | Method for recovering target speech based on speech segment detection under a stationary noise |
US7844059B2 (en) * | 2005-03-16 | 2010-11-30 | Microsoft Corporation | Dereverberation of multi-channel audio streams |
-
2007
- 2007-02-16 CN CN200780000434XA patent/CN101322183B/zh not_active Expired - Fee Related
- 2007-02-16 EP EP07714404.6A patent/EP1883068B1/en not_active Ceased
- 2007-02-16 WO PCT/JP2007/052874 patent/WO2007094463A1/ja active Application Filing
- 2007-02-16 JP JP2007522320A patent/JP4348393B2/ja not_active Expired - Fee Related
- 2007-02-16 US US11/913,241 patent/US8494845B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP1883068A1 (en) | 2008-01-30 |
EP1883068A4 (en) | 2009-08-12 |
US20080189103A1 (en) | 2008-08-07 |
EP1883068B1 (en) | 2013-09-04 |
CN101322183B (zh) | 2011-09-28 |
US8494845B2 (en) | 2013-07-23 |
CN101322183A (zh) | 2008-12-10 |
JPWO2007094463A1 (ja) | 2009-07-09 |
WO2007094463A1 (ja) | 2007-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5124014B2 (ja) | 信号強調装置、その方法、プログラム及び記録媒体 | |
KR100549133B1 (ko) | 노이즈 감소 방법 및 장치 | |
Tsao et al. | Generalized maximum a posteriori spectral amplitude estimation for speech enhancement | |
JP2010282193A (ja) | 残響抑圧装置、及び残響抑圧方法 | |
JP4348393B2 (ja) | 信号歪み除去装置、方法、プログラム及びそのプログラムを記録した記録媒体 | |
JP6748304B2 (ja) | ニューラルネットワークを用いた信号処理装置、ニューラルネットワークを用いた信号処理方法及び信号処理プログラム | |
Habets et al. | Dereverberation | |
Islam et al. | Supervised single channel speech enhancement based on stationary wavelet transforms and non-negative matrix factorization with concatenated framing process and subband smooth ratio mask | |
Nelke | Wind noise reduction: signal processing concepts | |
JP6142402B2 (ja) | 音響信号解析装置、方法、及びプログラム | |
Yoshioka et al. | Dereverberation by using time-variant nature of speech production system | |
Astudillo et al. | Uncertainty propagation | |
Nower et al. | Restoration scheme of instantaneous amplitude and phase using Kalman filter with efficient linear prediction for speech enhancement | |
Raikar et al. | Single channel joint speech dereverberation and denoising using deep priors | |
JP4977100B2 (ja) | 残響除去装置、残響除去方法、そのプログラムおよび記録媒体 | |
Liu et al. | Speech enhancement of instantaneous amplitude and phase for applications in noisy reverberant environments | |
Roy et al. | Deep residual network-based augmented Kalman filter for speech enhancement | |
JP6827908B2 (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム | |
Hirsch et al. | A new HMM adaptation approach for the case of a hands-free speech input in reverberant rooms | |
Krueger et al. | Bayesian Feature Enhancement for ASR of Noisy Reverberant Real-World Data. | |
JPWO2017204226A1 (ja) | 目的音響信号復元システム及び方法 | |
JP4313740B2 (ja) | 残響除去方法、プログラムおよび記録媒体 | |
Wichern et al. | Removing lavalier microphone rustle with recurrent neural networks | |
Joorabchi et al. | Simultaneous Suppression of Noise and Reverberation by Applying a Two Stage Process | |
Raikar et al. | Multi-channel joint dereverberation and denoising using deep priors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090707 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090717 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4348393 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120724 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130724 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |