JP2014508973A - オーディオ信号において卓越周波数を減衰させるための方法および装置 - Google Patents
オーディオ信号において卓越周波数を減衰させるための方法および装置 Download PDFInfo
- Publication number
- JP2014508973A JP2014508973A JP2014501033A JP2014501033A JP2014508973A JP 2014508973 A JP2014508973 A JP 2014508973A JP 2014501033 A JP2014501033 A JP 2014501033A JP 2014501033 A JP2014501033 A JP 2014501033A JP 2014508973 A JP2014508973 A JP 2014508973A
- Authority
- JP
- Japan
- Prior art keywords
- spectral density
- frequency
- mask
- evaluation
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000003595 spectral effect Effects 0.000 claims abstract description 64
- 238000011156 evaluation Methods 0.000 claims abstract description 39
- 238000009499 grossing Methods 0.000 claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000013016 damping Methods 0.000 claims 1
- 238000001228 spectrum Methods 0.000 abstract description 4
- 230000002238 attenuated effect Effects 0.000 abstract description 2
- 238000001914 filtration Methods 0.000 abstract description 2
- 230000006835 compression Effects 0.000 description 18
- 238000007906 compression Methods 0.000 description 18
- 238000004590 computer program Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/025—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
Abstract
Description
次に、本発明を、例示の実施の形態によって、添付の図面を参照してさらに詳しく説明する。
が、信号ykに関するケプストラムまたはケプストラム係数として周知であり、ここで
である。さらに、N個のケプストラム係数の多くが、典型的には小さな値をとることが知られている。したがって、これらの係数を理論的にサウンドの方法([1]および[2]を参照)でゼロへとしきい値処理し、あるいは断ち落とすことによって、(1)の滑らかな評価を
として得ることができ、ここで
であり、ならびにここで
は正規化定数である。(4)において、数列
は、しきい値処理され、あるいは断ち落とされた(2)の数列ckに相当する。
ここで、p=0,2,・・・,N−1。
を計算するために周波数ドメインにおいて評価によるスペクトル密度との直接の乗算によって使用され、あるいは例えば時間ドメインにおいてykへと適用することができる有限インパルス応答(FIR)フィルタの設計のための入力として使用される。
次に、オーディオ信号の時間部分の卓越周波数を減衰させる手順の典型的な実施の形態を、図3を参照して説明する。この手順を、例えばテレビ会議システムにおけるノードならびに/あるいは無線または有線通信システムにおけるノードまたは端末、オーディオ放送に関係するノード、もしくは音楽プロダクションにおいて使用されるエンティティまたは装置などのオーディオ処理エンティティにおいて実行することができる。
以下で、オーディオ信号の時間部分における卓越周波数の減衰に関する上述の手順の実行を可能にするように構成された典型的な装置400を、図4を参照して説明する。装置は、通信システムにおけるオーディオ処理エンティティ401に位置するものとして示されている。オーディオ処理エンティティは、例えばテレビ会議システムにおけるノードまたは端末ならびに/あるいは無線または有線通信システムにおけるノードまたは端末、オーディオ放送に関係するノード、もしくは音楽プロダクションにおいて使用されるエンティティまたは装置であってよい。さらに、装置400は、通信ユニット402(無線および/または有線通信のための伝統的な手段を備えると考えてよい)を介して他のエンティティと通信するものとして示されている。装置および/またはオーディオ処理エンティティは、他の通例の機能ユニット416および1つ以上の記憶ユニット414をさらに備えることができる。
図5が、オーディオ処理エンティティにおける別の装置500を示しており、コンピュータプログラム510がプロセッサ506へと接続されたコンピュータプログラム製品508によって保持されている。コンピュータプログラム製品508は、コンピュータプログラム510を保存したコンピュータにとって読み取り可能な媒体を備えている。コンピュータプログラム510を、コンピュータプログラムモジュールに構造化されたコンピュータプログラムコードとして構成することができる。したがって、説明される典型的な実施の形態においては、コンピュータプログラム510のコード手段が、オーディオ信号の時間部分を取得するための取得モジュール510aを含む。コンピュータプログラムは、時間部分のスペクトル密度の評価を導出するための評価モジュール510bをさらに備える。さらに、コンピュータプログラム510は、スペクトル密度の評価に平滑化を加えることによって評価の近似を導出する平滑化モジュール510cと、このスペクトル密度の評価の近似を反転させることによって周波数マスクを導出するマスクモジュール510dとを備える。コンピュータプログラムは、周波数マスクにもとづいてオーディオ時間部分に含まれる周波数を減衰させる減衰モジュール510eをさらに備える。
略語
AEC 音響エコー制御
DRC ダイナミックレンジ圧縮
FIR 有限長インパルス応答
FFT 高速フーリエ変換
参考文献
[1]Stoica,P.,Sandgren,N.Smoothed Nonparametric Spectral Estimation via Cepstrum Thresholding.IEEE Sign.Proc.Mag.2006.
[2]Stoica,P.,Sandgren,N.Total Variance Reduction via Thresholding:Application to Cepstral Analysis. IEEE Trans.Sign.Proc.2007
Claims (16)
- オーディオ処理エンティティにおいてオーディオ信号の時間部分の卓越周波数を減衰させるための方法であって、前記方法は、
オーディオ信号の時間部分を取得することと、
前記時間部分のスペクトル密度の評価を導出することと、
前記スペクトル密度の評価に平滑化を加えることによって、前記評価の近似を導出することと、
前記スペクトル密度の評価の近似を反転させることによって、周波数マスクを導出することと、
前記オーディオ時間部分に含まれる周波数を前記周波数マスクにもとづいて減衰させることと、
を含む方法。 - 前記平滑化が、
前記スペクトル密度の評価のケプストラム係数を導出すること
を含み、さらに
振幅の絶対値が特定のしきい値を下回るケプストラム係数を取り除くこと、および
予め設定されるしきい値よりも大きい指数を有する連続したケプストラム係数を取り除くこと
の少なくとも一方を含む請求項1に記載の方法。 - 前記周波数マスクが、1という最大利得を有するように構成されている請求項1または2に記載の方法。
- 前記周波数マスクの最大減衰が、特定のレベルに予め定められる請求項1乃至3のいずれか一項に記載の方法。
- 前記周波数マスクにおいて、前記評価および平滑化されたスペクトル密度が、前記評価された平滑化前のスペクトル密度によって正規化されている請求項1乃至3のいずれか一項に記載の方法。
- 前記信号部分の前記スペクトル密度の評価が、ピリオドグラムである請求項1乃至7のいずれか一項に記載の方法。
- 前記減衰が、
周波数ドメインにおいて前記スペクトル密度の評価に前記周波数マスクを乗算すること、および
FIRフィルタを前記周波数マスクにもとづいて設定し、時間ドメインにおいて前記オーディオ信号時間部分について使用すること
の少なくとも一方を含む請求項1乃至8のいずれか一項に記載の方法。 - オーディオ処理エンティティにおいてオーディオ信号の時間部分の卓越周波数を減衰させるための装置であって、前記装置は、
オーディオ信号の時間部分を取得するように構成された取得ユニットと、
前記時間部分のスペクトル密度の評価を導出するように構成された評価ユニットと、
前記スペクトル密度の評価に平滑化を加えることによって、前記評価の近似を導出するように構成された平滑化ユニットと、
前記スペクトル密度の評価の近似を反転させることによって、周波数マスクを導出するように構成されたマスクユニットと、
前記オーディオ時間部分に含まれる周波数を前記周波数マスクにもとづいて減衰させるように構成された減衰ユニットと
を含む装置。 - 前記平滑化ユニットが、前記スペクトル密度の評価のケプストラム係数を導出し、所定の規則に従ってケプストラム係数を取り除くように構成されている請求項10に記載の装置。
- 前記所定の規則が、
振幅の絶対値が特定のしきい値を下回るケプストラム係数を取り除くこと、および
予め設定されるしきい値よりも大きい指数を有する連続したケプストラム係数を取り除くこと
の一方を含む請求項11に記載の装置。 - 前記マスクユニットが、前記周波数マスクの最大利得を1に設定するように構成されている請求項10乃至12のいずれか一項に記載の装置。
- 前記マスクユニットが、前記周波数マスクの最大減衰を特定の予め定められるレベルに設定するように構成されている請求項10乃至13のいずれか一項に記載の装置。
- 前記マスクユニットが、前記評価および平滑化されたスペクトル密度を前記評価された平滑化前のスペクトル密度によって正規化するように構成されている請求項10乃至13のいずれか一項に記載の装置。
- 前記減衰ユニットが、
周波数ドメインにおいて前記スペクトル密度の評価に前記周波数マスクを乗算すること、および
FIRフィルタを前記周波数マスクにもとづいて設定し、時間ドメインにおいて前記オーディオ信号時間部分について使用すること
の少なくとも一方を行なうように構成されている請求項10乃至15のいずれか一項に記載の装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/SE2011/050306 WO2012128678A1 (en) | 2011-03-21 | 2011-03-21 | Method and arrangement for damping of dominant frequencies in an audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014508973A true JP2014508973A (ja) | 2014-04-10 |
JP5774191B2 JP5774191B2 (ja) | 2015-09-09 |
Family
ID=46877377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014501033A Expired - Fee Related JP5774191B2 (ja) | 2011-03-21 | 2011-03-21 | オーディオ信号において卓越周波数を減衰させるための方法および装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9065409B2 (ja) |
EP (1) | EP2689418B1 (ja) |
JP (1) | JP5774191B2 (ja) |
MY (1) | MY167843A (ja) |
TW (1) | TWI594232B (ja) |
WO (1) | WO2012128678A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2514422A (en) * | 2013-05-24 | 2014-11-26 | Alien Audio Ltd | Improvements in audio systems |
US9275136B1 (en) * | 2013-12-03 | 2016-03-01 | Google Inc. | Method for siren detection based on audio samples |
EP3089364B1 (en) | 2015-05-01 | 2019-01-16 | Nxp B.V. | A gain function controller |
EP3171614B1 (en) | 2015-11-23 | 2020-11-04 | Goodix Technology (HK) Company Limited | A controller for an audio system |
US11727926B1 (en) * | 2020-09-18 | 2023-08-15 | Amazon Technologies, Inc. | Systems and methods for noise reduction |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63259696A (ja) * | 1987-04-02 | 1988-10-26 | マサチューセッツ・インスティテュート・オブ・テクノロジー | 音声予処理方法および装置 |
JP2006243178A (ja) * | 2005-03-01 | 2006-09-14 | Japan Advanced Institute Of Science & Technology Hokuriku | 音声処理方法と装置及びプログラム並びに音声システム |
JP2007243856A (ja) * | 2006-03-13 | 2007-09-20 | Yamaha Corp | マイクロホンユニット |
JP2008076676A (ja) * | 2006-09-20 | 2008-04-03 | Fujitsu Ltd | 音信号処理方法、音信号処理装置及びコンピュータプログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3193032B2 (ja) * | 1989-12-05 | 2001-07-30 | パイオニア株式会社 | 車載用自動音量調整装置 |
EP0559348A3 (en) * | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
US6459914B1 (en) * | 1998-05-27 | 2002-10-01 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging |
US7610205B2 (en) * | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US20030216909A1 (en) * | 2002-05-14 | 2003-11-20 | Davis Wallace K. | Voice activity detection |
KR100754439B1 (ko) * | 2003-01-09 | 2007-08-31 | 와이더댄 주식회사 | 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법 |
US7574010B2 (en) * | 2004-05-28 | 2009-08-11 | Research In Motion Limited | System and method for adjusting an audio signal |
NO324318B1 (no) * | 2005-04-29 | 2007-09-24 | Tandberg Telecom As | Fremgangsmate og anordning for stoydeteksjon. |
JP4753821B2 (ja) * | 2006-09-25 | 2011-08-24 | 富士通株式会社 | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
DE102007030209A1 (de) * | 2007-06-27 | 2009-01-08 | Siemens Audiologische Technik Gmbh | Glättungsverfahren |
JP5089295B2 (ja) * | 2007-08-31 | 2012-12-05 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声処理システム、方法及びプログラム |
US8041325B2 (en) * | 2007-12-10 | 2011-10-18 | Telefonaktiebolaget Lm Ericsson (Publ) | Speed-based, hybrid parametric/non-parametric equalization |
WO2010027509A1 (en) * | 2008-09-05 | 2010-03-11 | Sourcetone, Llc | Music classification system and method |
EP2209117A1 (en) * | 2009-01-14 | 2010-07-21 | Siemens Medical Instruments Pte. Ltd. | Method for determining unbiased signal amplitude estimates after cepstral variance modification |
US8892050B2 (en) * | 2009-08-18 | 2014-11-18 | Qualcomm Incorporated | Sensing wireless communications in television frequency bands |
-
2011
- 2011-03-21 JP JP2014501033A patent/JP5774191B2/ja not_active Expired - Fee Related
- 2011-03-21 WO PCT/SE2011/050306 patent/WO2012128678A1/en active Application Filing
- 2011-03-21 EP EP11861333.0A patent/EP2689418B1/en active Active
- 2011-03-21 MY MYPI2013701442A patent/MY167843A/en unknown
- 2011-03-25 US US13/071,711 patent/US9065409B2/en active Active
-
2012
- 2012-03-20 TW TW101109568A patent/TWI594232B/zh not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63259696A (ja) * | 1987-04-02 | 1988-10-26 | マサチューセッツ・インスティテュート・オブ・テクノロジー | 音声予処理方法および装置 |
JP2006243178A (ja) * | 2005-03-01 | 2006-09-14 | Japan Advanced Institute Of Science & Technology Hokuriku | 音声処理方法と装置及びプログラム並びに音声システム |
JP2007243856A (ja) * | 2006-03-13 | 2007-09-20 | Yamaha Corp | マイクロホンユニット |
JP2008076676A (ja) * | 2006-09-20 | 2008-04-03 | Fujitsu Ltd | 音信号処理方法、音信号処理装置及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2012128678A1 (en) | 2012-09-27 |
US9065409B2 (en) | 2015-06-23 |
TWI594232B (zh) | 2017-08-01 |
MY167843A (en) | 2018-09-26 |
TW201246193A (en) | 2012-11-16 |
US20120243706A1 (en) | 2012-09-27 |
EP2689418A1 (en) | 2014-01-29 |
EP2689418B1 (en) | 2017-10-25 |
JP5774191B2 (ja) | 2015-09-09 |
EP2689418A4 (en) | 2014-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10891931B2 (en) | Single-channel, binaural and multi-channel dereverberation | |
CN110536215B (zh) | 音频信号处理的方法、装置、计算设置及存储介质 | |
US10210883B2 (en) | Signal processing apparatus for enhancing a voice component within a multi-channel audio signal | |
KR102132500B1 (ko) | 조화성 기반 단일 채널 음성 품질 추정 기법 | |
JP6793706B2 (ja) | 音声信号を検出するための方法および装置 | |
EP2689419B1 (en) | Method and arrangement for damping dominant frequencies in an audio signal | |
JP5774191B2 (ja) | オーディオ信号において卓越周波数を減衰させるための方法および装置 | |
CN113766073A (zh) | 会议系统中的啸叫检测 | |
CN104981870B (zh) | 声音增强装置 | |
US20230267947A1 (en) | Noise reduction using machine learning | |
CN112309414A (zh) | 基于音频编解码的主动降噪方法、耳机及电子设备 | |
CN112565981A (zh) | 啸叫抑制方法、装置、助听器及存储介质 | |
EP2943954B1 (en) | Improving speech intelligibility in background noise by speech-intelligibility-dependent amplification | |
CN106847299B (zh) | 延时的估计方法及装置 | |
CN108806711A (zh) | 一种提取方法及装置 | |
EP3896999A1 (en) | Systems and methods for a hearing assistive device | |
CN112312258B (zh) | 一种具有听力防护及听力补偿的智能耳机 | |
JP2004061567A (ja) | ノイズキャンセラ | |
CN116072133A (zh) | 一种低音增强方法、装置和音频输出设备 | |
CN116312586A (zh) | 一种降噪方法、装置、终端和存储介质 | |
JP2015004959A (ja) | 音響処理装置 | |
CN114333880A (zh) | 一种信号处理方法、装置、设备及存储介质 | |
Koria | Real-Time Adaptive Audio Mixing System Using Inter-Spectral Dependencies | |
Saracut et al. | HUMAN AUDIOGRAM FIR MODELING WITH MATLAB TOOLKITS | |
SĂRĂCUŢ et al. | HUMAN AUDIOGRAM FIR MODELING WITH MATLAB TOOLKITS. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140922 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141007 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150630 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5774191 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |