JP2010055024A - 信号補正装置 - Google Patents
信号補正装置 Download PDFInfo
- Publication number
- JP2010055024A JP2010055024A JP2008222700A JP2008222700A JP2010055024A JP 2010055024 A JP2010055024 A JP 2010055024A JP 2008222700 A JP2008222700 A JP 2008222700A JP 2008222700 A JP2008222700 A JP 2008222700A JP 2010055024 A JP2010055024 A JP 2010055024A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- group
- unit
- section
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012937 correction Methods 0.000 title claims abstract description 70
- 238000012545 processing Methods 0.000 claims abstract description 60
- 230000001629 suppression Effects 0.000 claims description 155
- 238000001228 spectrum Methods 0.000 claims description 117
- 238000004364 calculation method Methods 0.000 claims description 69
- 238000000034 method Methods 0.000 claims description 39
- 230000008569 process Effects 0.000 claims description 24
- 230000005236 sound signal Effects 0.000 abstract description 10
- 238000006243 chemical reaction Methods 0.000 abstract description 7
- 230000010354 integration Effects 0.000 description 98
- 238000004891 communication Methods 0.000 description 22
- 238000000926 separation method Methods 0.000 description 20
- 230000008878 coupling Effects 0.000 description 13
- 238000010168 coupling process Methods 0.000 description 13
- 238000005859 coupling reaction Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 230000009466 transformation Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 238000007476 Maximum Likelihood Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000005534 acoustic noise Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
Abstract
【解決手段】 直交変換を行った信号に対して補正を行う際、周波数帯域をグループ化して補正処理を行う。このとき、雑音やエコーなどの非目的信号が非常に大きい場合には、1グループに含まれるビン数を多くし、雑音やエコーなどの非目的信号と目的信号である音声信号が混在している場合には、1グループに含まれるビン数を少なくする。
【選択図】 図2
Description
バーラップのサンプル数をM=48として、1フレーム前の入力信号Mサンプルと当該フレームの入力信号x[n]のN=160サンプル分とMサンプル分の零詰めから、256サンプルを用意する。この256サンプルに対して数1で表される正弦波窓による窓関数w[n]をx[n]に乗じることで窓掛けを行い、FFTによる直交変換を行う。
さらに、直交変換部300では256点FFTによる直交変換を行って、入力信号は実信号であるため冗長な128ビンを除くと、周波数スペクトルX[f,ω](ω=0、1、…、127)が得られ、この周波数スペクトルX[f,ω]および振幅スペクトル|X[f,ω]|(ω=0、1、…、127)および位相スペクトルθX[f,ω](ω=0、1、
…、127)を出力する。なお、実信号のとき冗長なのは本来127ビンであり、最高域の周波数ビンω=128を考慮するべきであるが、ここでは入力信号として帯域制限された音声を含む信号を前提しており、帯域制限によって最高域の周波数ビンω=128を考慮しなくても音質に影響を及ぼさないため、これ以降説明の簡略化のために、最高域の周波数ビンω=128を考慮しない記述にする。勿論、最高域の周波数ビンω=128を考慮しても構わない。その際、最高域の周波数ビンω=128は、ω=127と同等に扱うか、単独で扱うようにする。
SLT: Slant Transform)、カルーネン・レーベ変換(KLT: Karhunen Loeve Transform)、直交離散ウェーブレット変換などを使用してもよい。
し出力する。
よりも大きいかどうかを判定する。次に、帯域ごとにパワースペクトル|X[f,ω]|2と
1フレーム前の各帯域の雑音量|N[f−1,ω]|2との差がある程度(例えば5dB)以
上大きいかどうかを判定し、隣接帯域で連続して差が大きくなっている帯域の数Bを数え
、この帯域数Bの当該同一フレーム中における最大数BMAXを保持する。そして、正規
化された1次自己相関係数の平均値が0.5以下で、かつBMAXが1以上であるときに、非目的信号であるノイズ成分が支配的に含まれている区間(雑音区間)であると判定する。一方、正規化された1次自己相関係数の平均値が0.5より大きく、またはBMAXが0であるときに、目的信号である音声信号と非目的信号であるノイズ成分が混在している区間(音声区間)であると判定する。
いて入力信号x[n]およびパワースペクトル|X[f,ω]|2を用いて1フレーム単位で
音声・雑音区間の判別を行うこともできる。なお、これに限定するものではない。上記の例では、音声・雑音区間の判別について2分類以上にする記載もあるが、これらを本実施例で用いる場合には適宜閾値を設定して2分類とする、すなわち全てのフレームを音声区間と雑音区間のどちらかに必ず分けるようにする。
るよう纏める処理を行う。ただし、グループ統合化部305とグループ統合化部308とでは、1つのグループとして纏めるビン数に違いがある。グループ統合化部305では、1つのグループにグループ化するビン数が少なく、グループ数が多い(以降、この状態を「(周波数方向の)解像度が高い」と称する)。それに対して、グループ統合化部308では、1つのグループにグループ化するビン数が多く、グループ数が少ない(以降、この状態を「(周波数方向の)解像度が低い」と称する)。以降の例では1つのグループにグループ化するビン数を一定としているが、バークスケールを利用するなどして、低域では1つのグループにグループ化するビン数を少なくして、高域では1つのグループにグループ化するビン数を多くして、周波数方向によって1つのグループにグループ化するビン数を変化させてもよい。
ループ統合化部305では64グループに纏め、グループ統合化部308では16グループに纏める場合、グループ統合化部305では2ビンずつを1グループとして64グループから成るパワースペクトル|X[f,m]|2(m=0、1、…、63)を生成し、グルー
プ統合化部308では8ビンずつを1グループとして16グループから成るパワースペクトル|X[f,k]|2(k=0、1、…、15)を生成する。グループ統合化部305、3
08で複数のビンを1グループに纏める場合には、1グループに纏めるビンのパワースペクトル|X[f,ω]|2を平均して得られた結果をグループごとのパワースペクトルとし代
表値として出力する。
させて平均パワースペクトルを算出し、これを各帯域の雑音量|N[f,ω]|2として出力
する。具体的には、1フレーム前の各帯域の雑音量を|N[f−1,ω]|2として、忘却係数αN[ω]を0.75〜0.95程度として数2の式で雑音量|N[f,ω]|2は算出される。
グループ統合化部320、321は、切替器319の切替えによって、いずれか一方が動作する。グループ統合化部320、321は、どちらも雑音量推定部318から出力される雑音量|N[f,ω]|2について所定数の周波数ビンごとに1グループに纏める処理を
おこなうが、グループ統合化部320とグループ統合化部321とでは、1グループに纏める周波数ビン数が異なる。グループ統合化部320では、入力信号のパワースペクトルを低解像度で統合化するグループ統合化部308と同じビン数ごとに1グループに纏める。それに対して、グループ統合化部321では、入力信号のパワースペクトルを高解像度で統合化するグループ統合化部305と同じビン数ごとに1グループに纏める。例えば、グループ統合化部320では、各帯域の雑音量|N[f,ω]|2(ω=0、1、…127)
を8ビンごとに纏め、16グループの帯域の雑音量|N[f,k]|2(k=0、1、…15
)を算出する。それに対して、グループ統合化部321では、各帯域の雑音量|N[f,ω]|2(ω=0、1、…127)の2ビンを1グループとして、64グループの帯域の雑音
量|N[f,m]|2(m=0、1、…63)を出力する。
度の雑音量|N[f,m]|2とを用いて、設定されたグループ数に相当する各帯域の抑圧ゲ
インG[f,m]を算出する。抑圧ゲインG[f,m]の算出は、例えば以下のアルゴリズムまたはそれらの組み合わせによって行う。すなわち、一般のノイズキャンセラであるスペクトル・サブトラクション(Spectral Subtraction)法(S. F. Boll, “Suppression of acoustic noise in speech using spectral subtraction”, IEEE Trans. Acoustics, Speech, and Signal Processing, vol.ASSP-29, pp.113-120 (1979).)、ウィナー・
フィルター(Wiener Filter)法(J. S. Lim, A. V. Oppenheim, “Enhancement and bandwidth compression of noisy speech”, Proc. IEEE Vol.67, No.12, pp.1586-1604, Dec.1979.)及び最尤推定(Maximum Likelihood)法(R. J. McAulay, M. L. Malpass, “Speech enhancement using a soft-decision noise suppression filter”, IEEE Trans. on Acoustics, Speech, and Signal Processing, vol.ASSP-28, no.2, pp.137-145, Apr.1980.)などである。ここでは一例としてウィナー・フィルター法を用いることとし、R
[・]を半波整流として、後述するグループ統合化部315から出力される1フレーム前の雑音抑圧された信号のパワースペクトル|Y[f−1,m]|2を用いて、事前SN比S
NRPRIO[f,m]及び事後SN比SNRPOST[f,m]は、それぞれ、以下の数3、数4により求められ、抑圧ゲインG[f,m]は、以下の数5により算出される。
なお、抑圧ゲイン算出部306では、過剰にノイズ成分を抑圧することによって音質が劣化することを防止し、背景雑音の断続的な抑圧を防止するため、抑圧ゲインG[f,m]が例えば−12dB以下とならないように0.252≦G[f,m]≦1.0を満たすように制限するなど所定の下限値以下とならないように制御しても良い。
低解像度の雑音量|N[f,k]|2と、後述するグループ統合化部316から出力される1
フレーム前の雑音抑圧された信号のパワースペクトル|Y[f−1,k]|2を用いて、設
定されたグループ数に相当する各帯域の抑圧ゲインG[f,k]を算出する。抑圧ゲイン算出部309で行う処理は、抑圧ゲイン算出部306の処理と同様であるため、詳細な説明は省略する。
周波数ビンごとに1グループに纏める処理を行うが、グループ統合化部315とグループ統合化部316とでは、1グループに纏める周波数ビン数が異なる。グループ統合化部316では、入力信号のパワースペクトルを低解像度で統合化するグループ統合化部308と同じビン数ごとに1グループに纏める。それに対して、グループ統合化部315では、入力信号のパワースペクトルを高解像度で統合化するグループ統合化部305と同じビン数ごとに1グループに纏める。例えば、グループ統合化部316では、各帯域の雑音抑圧された信号のパワースペクトル|Y[f,ω]|2(ω=0、1、…127)を8ビンごとに
纏め、16グループの帯域の雑音抑圧された信号のパワースペクトル|Y[f,k]|2(k
=0、1、…15)を算出する。それに対して、グループ統合化部315では、各帯域の雑音抑圧された信号のパワースペクトル|Y[f,ω]|2(ω=0、1、…127)の2ビ
ンを1グループとして、64グループの帯域の雑音抑圧された信号のパワースペクトル|
Y[f,m]|2(m=0、1、…63)を出力する。
る雑音抑圧された信号の振幅スペクトル|Y[f,ω]|を用いて、256点のIFFTで周波数逆変換を行い、適宜直交変換部300における窓掛けを考慮して、1フレーム前の雑音抑圧された時間領域の信号y[n]を用いてオーバーラップを戻す処理を行い、雑音抑圧された時間領域の信号y[n]を算出することができる。
X[f,ω]|2の平均値を代表値として用いているが、平均値に限らず適宜変更しても構わない。例えば、グループ内のパワースペクトルの最大値を代表値にしたり、グループ内のパワースペクトルの平均値に一番近い値を代表値にしたり、グループ内のパワースペクトルを昇順に並び変えて真ん中にくる値を代表値にしたりしてもよく、同様の効果が得られる。また、本実施例では、グループに纏める処理をパワースペクトル|X[f,ω]|2につ
いて処理を行っているが、パワースペクトルに限らず適宜変更しても構わない。例えば、スペクトルX[f,ω]についてグループに纏める処理を行ったり、振幅スペクトル|X[f,ω]|と位相スペクトルθX[f,ω]をペアで持ってグループに纏める処理を行ったりし
てもよく、同様の効果が得られる。また、本実施例ではFFTを用いて直交変換を行っているが、前述した周波数解析のための周波数領域へ変換する他の直交変換を用いて得られた変換係数についてグループに纏める処理を行うことでも、同様の効果が得ることができる。
、抑圧ゲイン解像度判別部303は、音声・雑音区間判別部302の出力を用いて、音声区間であるか雑音区間であるかに応じて、切替器304を切り替える代わりに、切替器304Aか切替器304Bのいずれか一方が動作するように切り替える。つまり、音声・雑音区間判別部302の出力が雑音区間である場合は、切替器304Aの切替えによって抑圧ゲイン算出部309が動作する。一方、音声・雑音区間判別部302の出力が音声区間である場合は、切替器304Aの切替えによって抑圧ゲイン算出部306が動作する。また、雑音量推定部318は、音声・雑音区間判別部302から出力される音声区間であるか雑音区間であるかを示す情報と、グループ統合化部308より出力された低解像度となるようグループ化された入力信号のパワースペクトル|X[f,k]|2とを用いて雑音量を
推定する。このため、雑音量推定部318から出力される各帯域の雑音量|N[f,k]|2
も低解像度である。そこで、音声・雑音区間判別部302によって音声区間であると判別され、抑圧ゲイン解像度判別部303が切替器319を高解像度に切替えた場合には、雑音量推定部318から出力される各帯域の雑音量|N[f,k]|2をグループ分離化部32
1−2によって高解像度として設定されたビン数に分離化する。このように図3に示す信号補正部3では、雑音量推定部318における雑音量推定の解像度を、雑音区間に対して雑音抑圧を行う解像度と同一(低解像度)にすることによって、図2に示す信号補正部3におけるグループ統合化部320の処理を省くことができ、処理の冗長性を排除することができる。
対して、入力信号の処理対象フレームが音声区間と判定された場合には、直交変換部300によって得られる各帯域(128点)に対して雑音抑圧のための抑圧ゲイン算出処理を行うとするような場合である。このように、入力区間に対する雑音抑圧のための抑圧ゲイン算出処理の場合の解像度と直交化変換部300の直交変換の解像度とが同じであるため、音声区間に対して高解像度に雑音抑圧のための抑圧ゲイン算出処理を行う場合のグループ化(図3の信号補正部3におけるグループ統合化部305)を必要としない。また、音声区間の場合にはグループ統合化を行わないため、音声区間に対して高解像度に雑音抑圧のための抑圧ゲイン算出処理を行った場合には、グループの分離化処理(図3の信号補正部3におけるグループ分離化部307)および雑音抑圧された信号のパワースペクトル|
Y[f,ω]|2のグループ統合化処理(図3の信号補正部3におけるグループ統合化部315)も必要としない。そのため、処理の冗長性を排除することができる。
記憶手段に記憶された信号をデコーダ7から出力するような構成でも良い。
ω=0、1、…、127)を出力する。
ごとに1グループとなるよう纏める処理を行うが、グループ統合化部605は、1グループに含むビン数が少なく、多くのグループを生成する高解像度な統合処理を行う。それに対して、グループ統合化部608では、1グループに含むビン数が多く、少ないグループを生成する低解像度な統合処理を行う。これらの統合処理は、図1の雑音抑圧処理を行う信号補正装置で説明したグループ統合化部305、308と同様の処理であるため、詳細な説明は省略する。勿論、以降の例では1つのグループにグループ化するビン数を一定としているが、バークスケールを利用するなどして、低域では1つのグループにグループ化するビン数を少なくして、高域では1つのグループにグループ化するビン数を多くして、周波数方向によって1つのグループにグループ化するビン数を変化させてもよい。
数ビンごとに1グループとなるよう纏める処理を行うが、グループ統合化部621は、1グループに含むビン数が少なく、多くのグループを生成する高解像度な統合処理を行う。
グループ化された受話信号のパワースペクトル|Z[f,m]|2とが入力される。
前の周波数ノイズレベル|Q[f−1,m]|2を用いる。なお、βQ1[ω]およびβQ2
[ω]は0以上1以下の所定の値であって、例えば、βQ1[ω]=0.001、βQ2[ω]=0.2などとする。
音響結合量推定部606Bは、入力信号のパワースペクトル|X[f,m]|2と、受話信
号のパワースペクトル|Z[f,m]|2と、雑音推定部606Aから出力される周波数ノイ
ズレベル|Q[f,m]|2とが入力される。音響結合量推定部606Bは、これらのパワー
スペクトルを用いてエコー経路特性の推定値である音響結合量|H[f,m]|2を以下のよ
うに算出する。
ただし、1フレーム前の音響結合量|H[f−1,m]|2から音響結合量|H[f,m]|2が急激に変化する場合(|H[f,m]|2>βH[ω]・|H[f−1,m]|2が満たされる場合。但し、βH[ω]は所定の値。)、もしくは、受話信号が十分に大きくない場合(|Z[f,m]|2<βX[ω]が満たされる場合。但し、βX[ω]は所定の値。)には、ダブ
ルトークとなる周波数帯域での音響結合量の算出を行わないようにするため、音響結合量を更新しないで、1フレーム前の音響結合量|H[f−1,m]|2の値を音響結合量|H[f
,m]|2として用いる。音響結合量推定部606Bは、このように算出した音響結合量|H[f,m]|2をエコーレベル推定部606Cに出力する。
結合量推定部606Bから音響結合量|H[f,m]|2が入力される。エコーレベル推定部
606Cは、これらの値を用いて、以下のように推定エコー量|E[f,m]|2を算出し、
抑圧ゲイン算出部606Dへ出力する。
抑圧ゲイン算出部606Dには、入力信号のパワースペクトル|X[f,m]|2と、エコ
ーレベル推定部606Cから推定エコー量|E[f,m]|2、雑音推定部606Aから周波
数ノイズレベル|Q[f,m]|2、後述するグループ統合化部615から1フレーム前のエ
コー抑圧された出力信号のパワースペクトル|Y[f−1,m]|2と、が入力される。抑圧
ゲイン算出部606Dにおける抑圧ゲインG[f,m]の算出は、例えば以下のアルゴリズムまたはそれらの組み合わせによって行う。すなわち、一般のノイズ
キャンセラであるスペクトル・サブトラクション(Spectral Subtraction)法(S. F. Boll, “Suppression of acoustic noise in speech using spectral subtraction”, IEEE Trans. Acoustics, Speech, and Signal Processing, vol.ASSP-29, pp.113-120 (1979).)、ウィナー・フィルター(Wiener Filter)法(J. S. Lim, A. V. Oppenheim, “Enhancement and bandwidth compression of noisy speech”, Proc. IEEE Vol.67, No.12, pp.1586-1604, Dec.1979.)及び最尤推定(Maximum Likelihood)法(R. J. McAulay, M. L. Malpass, “Speech enhancement using a soft-decision noise suppression filter
”, IEEE Trans. on Acoustics, Speech, and Signal Processing, vol.ASSP-28, no.2, pp.137-145, Apr.1980.)などである。ここでは一例としてウィナー・フィルター法を用
いることとし、R[・]を半波整流として、後述するグループ統合化部615から出力される1フレーム前のエコー抑圧された信号のパワースペクトル|Y[f−1,m]|2を用
いて、事前SN比SNRPRIO[f,m]及び事後SN比SNRPOST[f,m]は、それぞれ、以下の数9、数10により求められ、抑圧ゲインG[f,m]は、以下の数11により算出される。但し、μ[m]は0.9〜0.999程度の忘却係数である。
また別の一例として、抑圧ゲイン算出部606Dは、以下のようにエコー抑圧ゲインG[
f,m]を算出してもよい。ただし、数12のγG[ω]は事前に設定しておく所定のパ
ラメータ値である。この場合は、1フレーム前のエコー抑圧された信号のパワースペクトル|Y[f−1,m]|2を用いないので、後述するパワースペクトル算出部613、切替
器614、グループ統合化部615、616は省略してよい。
なお、エコー抑圧ゲインG[f,m]の値によっては、雑音レベルよりも過剰にエコー抑圧する場合がある。そこで、エコー抑圧ゲインG[f,m]の値が、数13に示すGFLOOR[f,m]よりも小さくならないよう、制御する。
このように算出したエコー抑圧ゲインG[f,m]は、グループ統合化607へ出力する。
パワースペクトル算出部613は、エコー抑圧部612から出力されたエコー抑圧された信号の振幅スペクトル|Y[f,ω]|から、エコー抑圧された信号のパワースペクトル|
Y[f,ω]|2(ω=0、1、…、127)を算出し出力する。
とに1グループに纏める処理を行うが、グループ統合化部615とグループ統合化部616とでは、1グループに纏める周波数ビン数が異なる。グループ統合化部616では、入力信号のパワースペクトルを低解像度で統合化するグループ統合化部608と同じビン数ごとに1グループに纏める。それに対して、グループ統合化部615では、入力信号のパワースペクトルを高解像度で統合化するグループ統合化部605と同じビン数ごとに1グループに纏める。例えば、グループ統合化部616では、各帯域のエコー抑圧された信号のパワースペクトル|Y[f,ω]|2(ω=0、1、…127)を8ビンごとに纏め、16
グループの帯域のエコー抑圧された信号のパワースペクトル|Y[f,k]|2(k=0、1
、…15)を算出する。それに対して、グループ統合化部315では、各帯域のエコー抑圧された信号のパワースペクトル|Y[f,ω]|2(ω=0、1、…127)の2ビンを1
グループとして、64グループの帯域のエコー抑圧された信号のパワースペクトル|Y[f,m]|2(m=0、1、…63)を出力する。
される雑音抑圧された信号の振幅スペクトル|Y[f,ω]|を用いて、256点のIFFTで周波数逆変換を行い、適宜直交変換部600における窓掛けを考慮して、1フレーム前のエコー抑圧された時間領域の信号y[n]を用いてオーバーラップを戻す処理を行い、エコー抑圧された時間領域の信号y[n]を算出することができる。
Claims (9)
- 目的信号である音声とそれ以外の不要な非目的信号が混在した入力信号に対して直交変換を行う直交変換手段と、
前記入力信号のフレームごとに非目的信号が支配的に存在している区間であるか否かを判別する区間判別手段と、
前記区間判別手段によって非目的信号が支配的に存在している区間であると判別されたフレームは、第1の周波数帯域幅ごとに非目的信号を抑圧するための抑圧ゲインを算出し、前記区間判別手段によって非目的信号が支配的に存在している区間でないと判別されたフレームは、第2の周波数帯域幅ごとに非目的信号を抑圧するための抑圧ゲインを算出する抑圧ゲイン算出手段と、
前記抑圧ゲイン算出手段によって算出された抑圧ゲインを用いて前記直交変換手段によって得られた変換係数に対して非目的信号を抑圧する信号補正処理を行う信号補正手段とを有することを特徴とする信号補正装置。 - 目的信号である音声とそれ以外の不要な非目的信号が混在した入力信号に対して直交変換を行う直交変換手段と、
前記入力信号のフレームごとに非目的信号が支配的に存在している区間であるか否かを判別する区間判別手段と、
前記区間判別手段によって非目的信号が支配的に存在している区間であると判別されたフレームは、前記直交変換手段から得られた変換係数を第1のグループ数のグループに分割し、第1のグループ数のグループごとに非目的信号を抑圧するための抑圧ゲインを算出し、前記区間判別手段によって非目的信号が支配的に存在している区間でないと判別されたフレームは、前記変換係数を第1のグループ数よりも多い第2のグループ数のグループに分割し、第2のグループ数のグループごとに非目的信号を抑圧するための抑圧ゲインを算出する抑圧ゲイン算出手段と、
前記抑圧ゲイン算出手段によって算出された抑圧ゲインを用いて前記直交変換手段によって得られた前記変換係数に対して非目的信号を抑圧する信号補正処理を行う信号補正手段とを有することを特徴とする信号補正装置。 - 前記抑圧ゲイン算出手段は、複数のグループごとにグループ内の前記変換係数の代表値を算出し、複数のグループごとに前記変換係数の代表値に基づいて抑圧ゲインを算出することを特徴とする請求項2に記載の信号補正装置。
- 前記抑圧ゲイン算出手段は、前記直交変換手段から得られた変換係数をパワースペクトルとし、前記区間判別手段によって非目的信号が支配的に存在している区間であると判別されたフレームは、前記パワースペクトルを第1のグループ数のグループに分割し、グループごとにグループ内のパワースペクトルの代表値を算出し、この代表値に基づいて抑圧ゲインを算出し、前記区間判別手段によって非目的信号が支配的に存在している区間でないと判別されたフレームは、前記パワースペクトルを第1のグループ数よりも多い第2のグループ数のグループに分割し、グループごとにグループ内のパワースペクトルの代表値を算出し、この代表値に基づいて抑圧ゲインを算出することを特徴とする請求項2に記載の信号補正装置。
- 前記変換係数の代表値は、グループ化した各グループに含まれる変換係数の平均値であることを特徴とする請求項3または請求項4に記載の信号補正装置。
- 前記第1または第2のグループ数に分割されたグループ内の変換係数の個数はグループごとに一定であることを特徴とする請求項2乃至請求項5のいずれか1項に記載の信号補正装置。
- 前記第2のグループ数に分割されたグループ内の変換係数の個数は1であることを特徴とする請求項2乃至請求項5のいずれか1項に記載の信号補正装置。
- 前記信号補正は、前記入力信号に対する雑音抑圧の処理であって、
前記区間判別手段は、前記入力信号のフレームごとに雑音成分が支配的に存在している区間であるか否かを判別することを特徴とする請求項1乃至請求項7のいずれか1項に記載の信号補正装置。 - 前記信号補正は、前記入力信号に対するエコー抑圧の処理であって、
前記区間判別手段は、前記入力信号のフレームごとにエコー成分が支配的に存在している区間であるか否かを判別することを特徴とする請求項1乃至請求項7のいずれか1項に記載の信号補正装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008222700A JP4660578B2 (ja) | 2008-08-29 | 2008-08-29 | 信号補正装置 |
US12/548,714 US8108011B2 (en) | 2008-08-29 | 2009-08-27 | Signal correction device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008222700A JP4660578B2 (ja) | 2008-08-29 | 2008-08-29 | 信号補正装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010055024A true JP2010055024A (ja) | 2010-03-11 |
JP4660578B2 JP4660578B2 (ja) | 2011-03-30 |
Family
ID=41726178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008222700A Expired - Fee Related JP4660578B2 (ja) | 2008-08-29 | 2008-08-29 | 信号補正装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8108011B2 (ja) |
JP (1) | JP4660578B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011111091A1 (ja) * | 2010-03-09 | 2011-09-15 | 三菱電機株式会社 | 雑音抑圧装置 |
JP2011203700A (ja) * | 2010-03-26 | 2011-10-13 | Toshiba Corp | 音声判別装置 |
WO2013065088A1 (ja) * | 2011-11-02 | 2013-05-10 | 三菱電機株式会社 | 雑音抑圧装置 |
US9418677B2 (en) | 2014-08-11 | 2016-08-16 | Oki Electric Industry Co., Ltd. | Noise suppressing device, noise suppressing method, and a non-transitory computer-readable recording medium storing noise suppressing program |
JP2021131536A (ja) * | 2020-02-20 | 2021-09-09 | 百度在綫網絡技術(北京)有限公司 | ダブルトーク状態検出方法、装置及び電子機器 |
JP2021149084A (ja) * | 2020-03-13 | 2021-09-27 | ペキン シャオミ パインコーン エレクトロニクス カンパニー, リミテッド | オーディオ信号処理方法および装置、記憶媒体 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5870476B2 (ja) * | 2010-08-04 | 2016-03-01 | 富士通株式会社 | 雑音推定装置、雑音推定方法および雑音推定プログラム |
US9508358B2 (en) * | 2010-12-15 | 2016-11-29 | Koninklijke Philips N.V. | Noise reduction system with remote noise detector |
CN104203089B (zh) * | 2012-03-30 | 2016-05-04 | 精工爱普生株式会社 | 搏动检测装置以及电子设备 |
US20130282372A1 (en) * | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
US9349383B2 (en) * | 2013-01-29 | 2016-05-24 | 2236008 Ontario Inc. | Audio bandwidth dependent noise suppression |
US9351137B2 (en) * | 2014-07-14 | 2016-05-24 | Qualcomm Incorporated | Simultaneous voice calls using a multi-SIM multi-active device |
CN108074587B (zh) * | 2016-11-16 | 2021-08-24 | 卢宇逍 | 检测通话断续的方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10254499A (ja) * | 1997-03-14 | 1998-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 帯域分割型雑音低減方法及び装置 |
JP2003514264A (ja) * | 1999-11-15 | 2003-04-15 | ノキア コーポレイション | 雑音抑圧装置 |
JP2005195955A (ja) * | 2004-01-08 | 2005-07-21 | Toshiba Corp | 雑音抑圧装置及び雑音抑圧方法 |
WO2006070560A1 (ja) * | 2004-12-28 | 2006-07-06 | Pioneer Corporation | 雑音抑圧装置、雑音抑圧方法、雑音抑圧プログラムおよびコンピュータに読み取り可能な記録媒体 |
WO2007026691A1 (ja) * | 2005-09-02 | 2007-03-08 | Nec Corporation | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR950013552B1 (ko) * | 1990-05-28 | 1995-11-08 | 마쯔시다덴기산교 가부시기가이샤 | 음성신호처리장치 |
CA2153170C (en) * | 1993-11-30 | 2000-12-19 | At&T Corp. | Transmitted noise reduction in communications systems |
JP3522986B2 (ja) | 1995-09-21 | 2004-04-26 | 株式会社東芝 | ノイズキャンセラおよびこのノイズキャンセラを使用した通信装置 |
FI100840B (fi) * | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
KR100250561B1 (ko) * | 1996-08-29 | 2000-04-01 | 니시무로 타이죠 | 잡음소거기 및 이 잡음소거기를 사용한 통신장치 |
US6549586B2 (en) * | 1999-04-12 | 2003-04-15 | Telefonaktiebolaget L M Ericsson | System and method for dual microphone signal noise reduction using spectral subtraction |
US8335311B2 (en) * | 2005-07-28 | 2012-12-18 | Kabushiki Kaisha Toshiba | Communication apparatus capable of echo cancellation |
JP4928922B2 (ja) * | 2006-12-01 | 2012-05-09 | 株式会社東芝 | 情報処理装置、およびプログラム |
-
2008
- 2008-08-29 JP JP2008222700A patent/JP4660578B2/ja not_active Expired - Fee Related
-
2009
- 2009-08-27 US US12/548,714 patent/US8108011B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10254499A (ja) * | 1997-03-14 | 1998-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 帯域分割型雑音低減方法及び装置 |
JP2003514264A (ja) * | 1999-11-15 | 2003-04-15 | ノキア コーポレイション | 雑音抑圧装置 |
JP2005195955A (ja) * | 2004-01-08 | 2005-07-21 | Toshiba Corp | 雑音抑圧装置及び雑音抑圧方法 |
WO2006070560A1 (ja) * | 2004-12-28 | 2006-07-06 | Pioneer Corporation | 雑音抑圧装置、雑音抑圧方法、雑音抑圧プログラムおよびコンピュータに読み取り可能な記録媒体 |
WO2007026691A1 (ja) * | 2005-09-02 | 2007-03-08 | Nec Corporation | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8989403B2 (en) | 2010-03-09 | 2015-03-24 | Mitsubishi Electric Corporation | Noise suppression device |
WO2011111091A1 (ja) * | 2010-03-09 | 2011-09-15 | 三菱電機株式会社 | 雑音抑圧装置 |
JPWO2011111091A1 (ja) * | 2010-03-09 | 2013-06-27 | 三菱電機株式会社 | 雑音抑圧装置 |
JP5528538B2 (ja) * | 2010-03-09 | 2014-06-25 | 三菱電機株式会社 | 雑音抑圧装置 |
JP2011203700A (ja) * | 2010-03-26 | 2011-10-13 | Toshiba Corp | 音声判別装置 |
JPWO2013065088A1 (ja) * | 2011-11-02 | 2015-04-02 | 三菱電機株式会社 | 雑音抑圧装置 |
WO2013065088A1 (ja) * | 2011-11-02 | 2013-05-10 | 三菱電機株式会社 | 雑音抑圧装置 |
US9368097B2 (en) | 2011-11-02 | 2016-06-14 | Mitsubishi Electric Corporation | Noise suppression device |
US9418677B2 (en) | 2014-08-11 | 2016-08-16 | Oki Electric Industry Co., Ltd. | Noise suppressing device, noise suppressing method, and a non-transitory computer-readable recording medium storing noise suppressing program |
JP2021131536A (ja) * | 2020-02-20 | 2021-09-09 | 百度在綫網絡技術(北京)有限公司 | ダブルトーク状態検出方法、装置及び電子機器 |
JP7159366B2 (ja) | 2020-02-20 | 2022-10-24 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | ダブルトーク状態検出方法、装置及び電子機器 |
US11804235B2 (en) | 2020-02-20 | 2023-10-31 | Baidu Online Network Technology (Beijing) Co., Ltd. | Double-talk state detection method and device, and electronic device |
JP2021149084A (ja) * | 2020-03-13 | 2021-09-27 | ペキン シャオミ パインコーン エレクトロニクス カンパニー, リミテッド | オーディオ信号処理方法および装置、記憶媒体 |
JP7062727B2 (ja) | 2020-03-13 | 2022-05-06 | ペキン シャオミ パインコーン エレクトロニクス カンパニー, リミテッド | オーディオ信号処理方法および装置、記憶媒体 |
US11490200B2 (en) | 2020-03-13 | 2022-11-01 | Beijing Xiaomi Pinecone Electronics Co., Ltd. | Audio signal processing method and device, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
US20100056063A1 (en) | 2010-03-04 |
US8108011B2 (en) | 2012-01-31 |
JP4660578B2 (ja) | 2011-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4660578B2 (ja) | 信号補正装置 | |
JP5127754B2 (ja) | 信号処理装置 | |
US8571231B2 (en) | Suppressing noise in an audio signal | |
JP3963850B2 (ja) | 音声区間検出装置 | |
JP4210521B2 (ja) | 雑音低減法および装置 | |
KR101210313B1 (ko) | 음성 향상을 위해 마이크로폰 사이의 레벨 차이를 활용하는시스템 및 방법 | |
CN104520925B (zh) | 噪声降低增益的百分位滤波 | |
JP5646077B2 (ja) | 雑音抑圧装置 | |
JP6703525B2 (ja) | 音源を強調するための方法及び機器 | |
JP4836720B2 (ja) | ノイズサプレス装置 | |
JP5923994B2 (ja) | 音声処理装置及び音声処理方法 | |
US20130322643A1 (en) | Multi-Microphone Robust Noise Suppression | |
JP2013534651A (ja) | 計算聴覚シーン解析に基づくモノラルノイズ抑制 | |
KR20120114327A (ko) | 레벨 큐를 사용한 적응형 잡음 감소 | |
CN101080766A (zh) | 使用bark频带weiner滤波器和线性衰减的噪声降低和舒适噪声增益控制 | |
US9343073B1 (en) | Robust noise suppression system in adverse echo conditions | |
CN104981870B (zh) | 声音增强装置 | |
KR101581885B1 (ko) | 복소 스펙트럼 잡음 제거 장치 및 방법 | |
US8543390B2 (en) | Multi-channel periodic signal enhancement system | |
JP2015143811A (ja) | 雑音抑圧装置および雑音抑圧方法 | |
JP5443547B2 (ja) | 信号処理装置 | |
CN110136734B (zh) | 使用非线性增益平滑以降低音乐伪声的方法和音频噪声抑制器 | |
JP2006113515A (ja) | ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置 | |
CN113593599A (zh) | 一种去除语音信号中噪声信号的方法 | |
CN110136740B (zh) | 使用最小最大值跟随器估计噪声的方法、噪声电平估计器、噪声抑制器及噪声抑制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100723 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101203 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101228 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140107 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140107 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |