JP5507596B2 - スピーチ増強 - Google Patents
スピーチ増強 Download PDFInfo
- Publication number
- JP5507596B2 JP5507596B2 JP2012040093A JP2012040093A JP5507596B2 JP 5507596 B2 JP5507596 B2 JP 5507596B2 JP 2012040093 A JP2012040093 A JP 2012040093A JP 2012040093 A JP2012040093 A JP 2012040093A JP 5507596 B2 JP5507596 B2 JP 5507596B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- channel
- audio signal
- center
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims abstract description 40
- 230000005236 sound signal Effects 0.000 claims abstract description 38
- 238000001228 spectrum Methods 0.000 claims abstract description 27
- 239000003623 enhancer Substances 0.000 claims abstract description 7
- 230000002708 enhancing effect Effects 0.000 claims abstract description 7
- 239000000284 extract Substances 0.000 claims abstract description 3
- 238000000605 extraction Methods 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 10
- 230000001965 increasing effect Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 230000003595 spectral effect Effects 0.000 abstract description 29
- 230000000694 effects Effects 0.000 description 15
- 238000012545 processing Methods 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000009499 grossing Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000001755 vocal effect Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 210000002469 basement membrane Anatomy 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000003477 cochlea Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001054 cortical effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000005405 multipole Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
スピーチ・エンハンサー1の操作を以下に更に詳細に説明する。中央チャンネル抽出、スペクトル平坦化、発声活動検出及び混合の処理については、一つの実施例に沿って最初は概略的に次いでより詳細に順番に説明する。
中央チャンネル抽出
以下のように仮定する。
(1)対象17の信号はスピーチを包含する。
(2)多重チャンネル信号(即ち、左及び右、又はステレオ)の場合、スピーチは中央にパンされる。
(3)実際のパンされた中央は、音源左右信号の比アルファ(α)から成る。
(4)その比の減算の結果は一対の直交信号である。
聴覚フィルタは、推定されたスピーチ・チャンネルにおけるスピーチを知覚帯域へ分離する。最も多くのエネルギを有する帯域、データの各々のブロックについて判定される。そのブロックについてのスピーチ・チャンネルのスペクトル形状は、残りの帯域における低エネルギを補償するために修正される。このスペクトルは平坦化される。低エネルギを有すr帯域は、或る最大限まで増大された利得を持つ。一つの実施形態においては、全ての帯域は最大利得を共有してもよい。代替的な実施形態においては、各々の帯域は、それ自身の最大利得を有してもよい。(全ての帯域が同じエネルギを有するという望ましくない場合には、スペクトルは既に平坦である。スペクトル成形が生じないか、或いはスペクトル成形が同一の機能により達成されることも考慮されるであろう。)
スペクトル平坦化はチャンネルのコンテンツとは無関係に生じる。非スピーチを処理してもよいが、これがシステムにおいて後で用いられることはない。非スピーチは、スピーチとは非常に異なるスペクトルを有するので、非スピーチのための平坦化は、通常はスピーチについてのものと同じではない。
発声活動検出器
推定されたスピーチが単独のチャンネルへ分離されると、それはスピーチ・コンテンツについて分析される(それはスピーチを包含するか?)。コンテンツはスペクトル平坦化とは独立に分析される。スピーチ・コンテンツは、データの隣接するフレームにおけるスペクトル変動を測定することにより判定される。(各々のフレームはデータの多くのブロックから成り得るが、フレームは一般に48kHzサンプル・レートの2、4、又は8ブロックである。)
スピーチ・チャンネルがステレオから抽出されるところでは、残りのステレオ信号がスピーチ分析に役立つであろう。この概念は、任意の多重チャンネル源における隣接するチャンネルにより一般的に適用される。
ミキシング
スピーチが存在すると見做されるとき、平坦化されたスピーチ・チャンネルは、スピーチ・チャンネルが実際にスピーチを包含するという信頼度に関連する或る割合で原信号と混合される。一般に、信頼度が高いときは、より多くの平坦化スピーチ・チャンネルが用いられる。信頼度が低いときは、より少ない平坦化スピーチ・チャンネルが用いられる。
2チャンネル源からの仮の中央及びサラウンド・チャンネル抽出
スピーチ増強によれば、中央にパンされたオーディオのみを抽出、処理、及び再挿入することが望まれる。ステレオ混合においては、スピーチは最も頻繁に中央へパンされる。
或る2チャンネル信号が与えられると、そのチャンネルは左(L)と右(R)に分けられるであろう。この左右のチャンネルの各々は、共通の情報のみならず、各々に固有の情報を包含する。共通の情報をC(中央にパンされている)、固有の情報を左のみ右のみについてそれぞれL及びRとして表すことができる。
仮のサラウンド・チャンネルは同様にして以下のように導ける。
上述のように、スピーチ増強方法にとって、その主要な懸念は中央チャンネルの抽出である。この部分において、上述の技術は、オーディオ信号の複雑な周波数領域表現に適用される。
以下、本発明のスペクトル平坦化の実施例を説明する。大部分がスピーチである単独のチャンネルを仮定し、そのスピーチ信号を離散フーリエ変換(DFT)又は関連した変換によって周波数領域へ変換する。振幅スペクトルは、変換周波数ビンを二乗することによってパワースペクトルへ変換する。
上述のスペクトル平坦化システムは、入力された信号の特性を考慮していない。非スピーチ信号が平坦化されるならば、音質における知覚可能な変化は深刻なものとなろう。非スピーチ信号の処理を避けるために、上述の方法は、発声活動検出器13に結び付けることができる。発声活動検出器13がスピーチの存在を示すとき、平坦化スピーチが用いられる。
発声活動検出
スペクトル束は、信号の出力スペクトルが変化する速度を測定し、オーディオの隣接するフレームの間の出力を比較する。(フレームは、オーディオ・データの複数のブロックである。)スペクトル束は、発声活動検出、或いは「スピーチ対オーディオ分類における他の判定がなされたもの」を示す。多くの場合、付加的な指標が用いられ、その結果は、オーディオが本当にスピーチであるか否かの判定をなすために集積される。
ステレオの場合、スペクトルの中央チャンネルが抽出されるところで、DFT係数は先ず中央と横のオーディオ(原ステレオから仮の中央を減じたもの)に分けられる。これは、伝統的な中間/横ステレオ処理とは異なっており、伝統的な中間/横ステレオ処理が一般に(L+R)/2,(L−R)/2であるのに対し、中央/横処理はC,L+R−2Cである。
混合
平坦化された中央チャンネルは、発声活動検出器の出力に基づいて原オーディオン信号と混合される。
従来技術
Schaub,A.and P.,”Spectral sharpening for speech enhancement noise reduction”,Proc.ICASSP.1991,Toronto,Canada,May 1991,pp.993−996.
Sondhi,, ”New methods of pitch extraction”, Audio and Electroacoustics, IEEE Transactions, June 1968, Volume 16, Issue 2, pp 262−266.
Villchur, E., ”Signal Processing to Improve Speech Intelligibility for the Hearing Impaired”, 99th Audio Engineering Society Convention, September 1995.
Thomas, I. and Niederjohn, R., ”Preprocessing of Speech for Added Intelligibility in High Ambient Noise”, 34th Audio Engineering Society Convention, March 1968.
Moore, B. et. al., ”A Model for the Prediction of Thresholds, Loudness, and Partial Loudness”, J. Audio Eng. Soc, Vol. 45, No. 4, April 1997.
Moore, B. and Oxenham, A., ”Psychoacoustic consequences of compression in the peripheral auditory system”, The Journal of the Acoustical Society of America − December 2002 − Volume 112, Issue 6, pp. 2962−2966
従来技術 スペクトル平坦化
米国特許
米国特許第6732073 B1号 発明の名称”Spectral enhancement of acoustic signals to provide improved recognition of speech”
米国特許第0993480 B1号 発明の名称”Voice intelligibility enhancement system”
米国特許2006/026320 A1号 発明の名称”Apparatus and method for noise reduction and speech enhancement with microphones and loudspeakers”
米国特許第07191122号 発明の名称”Speech compression system and method”
米国特許第2007/0094017号 発明の名称”Frequency domain format enhancement”
国際特許
WO 2004/013840 Al号 発明の名称”Digital Signal Processing Techniques For Improving Audio Clarity And Intelligibility”
WO 2003/015082号 発明の名称”Sound Intelligibility Enhancement Using A Psychoacoustic Model And An Oversampled Filterbank”
論文
Sallberg, B. et. al; ”Analog Circuit Implementation for Speech Enhancement Purposes Signals”; Systems and Computers, 2004. Conference Record of the Thirty−Eighth Asilomar Conference.
Magotra, N. and Sirivara, S.; ”Real−time digital speech processing strategies for the hearing impaired”; Acoustics, Speech, and Signal Processing. 1997. ICASSP−97., 1997 page(s): 1211−1214 vol. 2
Walker, G., Byrne, D., and Dillon, H.; ”The effects of multichannel compression/expansion amplification on the intelligibility of nonsense syllables in noise”; The Journal of the Acoustical Society of America − September 1984 − Volume 76, Issue 3, pp. 746−757
従来技術 中央抽出
Adobe Audition has a vocal/instrument extraction function
http://www.adobeforums.eom/cgi−bin/webx/.3bc3a3e5
winampのための「中央カット」
http://www.hvdrogenaudio.org/forums/lofiversion/index.php/tl7450.html
従来技術 スペクトル束
Vinton, M, and Robinson C; ”Automated Speech/Other Discrimination for Loudness Monitoring,” AES 118th Convention. 2005
Scheirer E., and Slaney M., ”Construction and evaluation of a robust multifeature speech/music discriminator”, IEEE Transactions on Acoustics, Speech, and Signal Processing (ICASSP’97), 1997, pp. 1331 −− 1334.
Claims (7)
- スピーチを増強する方法であって、
オーディオ信号の中央チャンネルを抽出して、
前記中央チャンネルにおけるスピーチ検出の信頼度を生成し、
前記中央チャンネルのスペクトルを平坦化して、
前記平坦化されたスピーチ・チャンネルに前記オーディオ信号を前記検出されたスピーチの信頼度に比例させて混合することにより、オーディオ信号における任意のスピーチを増強することを含む方法。 - 請求項1の方法において、
前記信頼度は、可能性確率が最も低いものから可能性確率が最も高いものまで変動すると共に、
前記生成は、
最低可能性確率よりも高く、且つ最高可能性確率よりも低い値に生成された信頼度を更に制限することを含む方法。 - 請求項1の方法において、前記オーディオ信号の前記中央チャンネルを抽出することは、
前記オーディオ信号の第1のチャンネルと前記オーディオ信号の第2のチャンネルとの合計から仮中央チャンネルを得て、
前記仮中央チャンネルの比αより小さい前記オーディオ信号の前記第1のチャンネルと、前記仮中央チャンネルの比αより小さい前記オーディオ信号の前記第1のチャンネルと共役な前記第2のチャンネルとを乗じた積を計算し、
この積を最小化するαの値から抽出係数を得て、
前記仮中央チャンネルに前記抽出係数を乗じることにより、抽出された中央チャンネルを得ることを含む方法。 - 請求項3の方法において、前記中央チャンネルのスペクトルを平坦化することは、
前記中央チャンネルを知覚帯域に分離して、
知覚帯域のうちの何れが最も多くのエネルギを有しているかを判定し、
より少ないエネルギを有する知覚帯域の利得を増大させることを含む方法。 - 請求項1乃至4の何れか一項に記載の方法を実行するコンピュータ・プログラムが格納されたコンピュータ読み取り可能な記録媒体。
- コンピュータ・システムであって、
CPUと、
請求項5の記録媒体と、
前記CPUと前記記録媒体とを結合するバスとを含むコンピュータ・システム。 - スピーチエンハンサであって、
オーディオ信号の中央チャンネルを抽出するための中央チャンネル抽出器と、
前記中央チャンネルのスペクトルを平坦化するためのスペクトル平坦化器と、
前記中央チャンネルにおけるスピーチ検出における信頼度を生成するスピーチ信頼度生成器と、
前記平坦化されたスピーチ・チャンネルを原オーディオ信号に、検出されたスピーチの信頼度に比例して混合することにより、オーディオ信号における任意のスピーチを増強するミキサとを備えるスピーチエンハンサ。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US99360107P | 2007-09-12 | 2007-09-12 | |
US60/993,601 | 2007-09-12 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010524855A Division JP2010539792A (ja) | 2007-09-12 | 2008-09-10 | スピーチ増強 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012110049A JP2012110049A (ja) | 2012-06-07 |
JP5507596B2 true JP5507596B2 (ja) | 2014-05-28 |
Family
ID=40016128
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010524855A Pending JP2010539792A (ja) | 2007-09-12 | 2008-09-10 | スピーチ増強 |
JP2012040093A Active JP5507596B2 (ja) | 2007-09-12 | 2012-02-27 | スピーチ増強 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010524855A Pending JP2010539792A (ja) | 2007-09-12 | 2008-09-10 | スピーチ増強 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8891778B2 (ja) |
EP (1) | EP2191467B1 (ja) |
JP (2) | JP2010539792A (ja) |
CN (1) | CN101960516B (ja) |
AT (1) | ATE514163T1 (ja) |
WO (1) | WO2009035615A1 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102017402B (zh) | 2007-12-21 | 2015-01-07 | Dts有限责任公司 | 用于调节音频信号的感知响度的系统 |
ES2678415T3 (es) * | 2008-08-05 | 2018-08-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para procesamiento y señal de audio para mejora de habla mediante el uso de una extracción de característica |
WO2010021965A1 (en) * | 2008-08-17 | 2010-02-25 | Dolby Laboratories Licensing Corporation | Signature derivation for images |
US9215538B2 (en) * | 2009-08-04 | 2015-12-15 | Nokia Technologies Oy | Method and apparatus for audio signal classification |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
US9324337B2 (en) * | 2009-11-17 | 2016-04-26 | Dolby Laboratories Licensing Corporation | Method and system for dialog enhancement |
KR101690252B1 (ko) * | 2009-12-23 | 2016-12-27 | 삼성전자주식회사 | 신호 처리 방법 및 장치 |
JP2012027101A (ja) * | 2010-07-20 | 2012-02-09 | Sharp Corp | 音声再生装置、音声再生方法、プログラム、及び、記録媒体 |
US9237400B2 (en) | 2010-08-24 | 2016-01-12 | Dolby International Ab | Concealment of intermittent mono reception of FM stereo radio receivers |
JP6010539B2 (ja) * | 2011-09-09 | 2016-10-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 符号化装置、復号装置、符号化方法および復号方法 |
WO2013038459A1 (ja) * | 2011-09-16 | 2013-03-21 | パイオニア株式会社 | 音声処理装置、再生装置、音声処理方法およびプログラム |
US20130253923A1 (en) * | 2012-03-21 | 2013-09-26 | Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry | Multichannel enhancement system for preserving spatial cues |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
CN104078050A (zh) | 2013-03-26 | 2014-10-01 | 杜比实验室特许公司 | 用于音频分类和音频处理的设备和方法 |
IL294836B1 (en) | 2013-04-05 | 2024-06-01 | Dolby Int Ab | Audio encoder and decoder |
EP3503095A1 (en) | 2013-08-28 | 2019-06-26 | Dolby Laboratories Licensing Corp. | Hybrid waveform-coded and parametric-coded speech enhancement |
US9269370B2 (en) * | 2013-12-12 | 2016-02-23 | Magix Ag | Adaptive speech filter for attenuation of ambient noise |
JP6251809B2 (ja) * | 2013-12-13 | 2017-12-20 | アンビディオ,インコーポレイテッド | サウンドステージ拡張用の装置及び方法 |
US9344825B2 (en) | 2014-01-29 | 2016-05-17 | Tls Corp. | At least one of intelligibility or loudness of an audio program |
AU2014413559B2 (en) * | 2014-12-12 | 2018-10-18 | Huawei Technologies Co., Ltd. | A signal processing apparatus for enhancing a voice component within a multi-channel audio signal |
TWI569263B (zh) * | 2015-04-30 | 2017-02-01 | 智原科技股份有限公司 | 聲頻訊號的訊號擷取方法與裝置 |
EP3295687B1 (en) | 2015-05-14 | 2019-03-13 | Dolby Laboratories Licensing Corporation | Generation and playback of near-field audio content |
JP6687453B2 (ja) * | 2016-04-12 | 2020-04-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | ステレオ再生装置 |
CN115881146A (zh) * | 2021-08-05 | 2023-03-31 | 哈曼国际工业有限公司 | 用于动态语音增强的方法及系统 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04149598A (ja) * | 1990-10-12 | 1992-05-22 | Pioneer Electron Corp | 音場補正装置 |
DE69423922T2 (de) * | 1993-01-27 | 2000-10-05 | Koninkl Philips Electronics Nv | Tonsignalverarbeitungsanordnung zur Ableitung eines Mittelkanalsignals und audiovisuelles Wiedergabesystem mit solcher Verarbeitungsanordnung |
JP3284747B2 (ja) | 1994-05-12 | 2002-05-20 | 松下電器産業株式会社 | 音場制御装置 |
US6993480B1 (en) | 1998-11-03 | 2006-01-31 | Srs Labs, Inc. | Voice intelligibility enhancement system |
US6732073B1 (en) | 1999-09-10 | 2004-05-04 | Wisconsin Alumni Research Foundation | Spectral enhancement of acoustic signals to provide improved recognition of speech |
US6959274B1 (en) | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US20030023429A1 (en) | 2000-12-20 | 2003-01-30 | Octiv, Inc. | Digital signal processing techniques for improving audio clarity and intelligibility |
US20030028386A1 (en) | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
US7668317B2 (en) | 2001-05-30 | 2010-02-23 | Sony Corporation | Audio post processing in DVD, DTV and other audio visual products |
CA2354755A1 (en) | 2001-08-07 | 2003-02-07 | Dspfactory Ltd. | Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank |
KR20040034705A (ko) * | 2001-09-06 | 2004-04-28 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 재생 장치 |
JP2003084790A (ja) * | 2001-09-17 | 2003-03-19 | Matsushita Electric Ind Co Ltd | 台詞成分強調装置 |
US7257231B1 (en) * | 2002-06-04 | 2007-08-14 | Creative Technology Ltd. | Stream segregation for stereo signals |
FI118370B (fi) * | 2002-11-22 | 2007-10-15 | Nokia Corp | Stereolaajennusverkon ulostulon ekvalisointi |
CA2454296A1 (en) | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
JP2005258158A (ja) * | 2004-03-12 | 2005-09-22 | Advanced Telecommunication Research Institute International | ノイズ除去装置 |
US20060206320A1 (en) | 2005-03-14 | 2006-09-14 | Li Qi P | Apparatus and method for noise reduction and speech enhancement with microphones and loudspeakers |
-
2008
- 2008-09-10 US US12/676,410 patent/US8891778B2/en active Active
- 2008-09-10 EP EP08831097A patent/EP2191467B1/en active Active
- 2008-09-10 AT AT08831097T patent/ATE514163T1/de not_active IP Right Cessation
- 2008-09-10 JP JP2010524855A patent/JP2010539792A/ja active Pending
- 2008-09-10 WO PCT/US2008/010591 patent/WO2009035615A1/en active Application Filing
- 2008-09-10 CN CN200880106533.0A patent/CN101960516B/zh active Active
-
2012
- 2012-02-27 JP JP2012040093A patent/JP5507596B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2009035615A1 (en) | 2009-03-19 |
CN101960516B (zh) | 2014-07-02 |
US8891778B2 (en) | 2014-11-18 |
EP2191467A1 (en) | 2010-06-02 |
EP2191467B1 (en) | 2011-06-22 |
ATE514163T1 (de) | 2011-07-15 |
JP2012110049A (ja) | 2012-06-07 |
US20100179808A1 (en) | 2010-07-15 |
JP2010539792A (ja) | 2010-12-16 |
CN101960516A (zh) | 2011-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5507596B2 (ja) | スピーチ増強 | |
US10565970B2 (en) | Method and a system for decomposition of acoustic signal into sound objects, a sound object and its use | |
US8971551B2 (en) | Virtual bass synthesis using harmonic transposition | |
JP5341128B2 (ja) | 補聴器における安定性の改善 | |
KR101935183B1 (ko) | 멀티-채널 오디오 신호 내의 음성 성분을 향상시키는 신호 처리 장치 | |
RU2520420C2 (ru) | Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала | |
JP4818335B2 (ja) | 信号帯域拡張装置 | |
JP5730881B2 (ja) | 録音の適応的ダイナミックレンジ強化 | |
JP5127754B2 (ja) | 信号処理装置 | |
KR101670313B1 (ko) | 음원 분리를 위해 자동적으로 문턱치를 선택하는 신호 분리 시스템 및 방법 | |
US7970144B1 (en) | Extracting and modifying a panned source for enhancement and upmix of audio signals | |
JP2009518684A (ja) | チャネル間振幅スペクトルを用いた音声チャネルの抽出 | |
EP2720477B1 (en) | Virtual bass synthesis using harmonic transposition | |
CN102610232B (zh) | 一种自适应音频感知响度调整方法 | |
Kates | Modeling the effects of single-microphone noise-suppression | |
EP2828853B1 (en) | Method and system for bias corrected speech level determination | |
JP2008072600A (ja) | 音響信号処理装置、音響信号処理プログラム、音響信号処理方法 | |
US8175282B2 (en) | Method of evaluating perception intensity of an audio signal and a method of controlling an input audio signal on the basis of the evaluation | |
JPH07146700A (ja) | ピッチ強調方法および装置ならびに聴力補償装置 | |
Jiang et al. | Speech noise reduction algorithm in digital hearing aids based on an improved sub-band SNR estimation | |
Muhsina et al. | Signal enhancement of source separation techniques | |
JP2002049399A (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
US20240161762A1 (en) | Full-band audio signal reconstruction enabled by output from a machine learning model | |
US20240163529A1 (en) | Dolby atmos master compressor/limiter | |
JP2011141540A (ja) | 音声信号処理装置、テレビジョン受像機、音声信号処理方法、プログラム、および、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120227 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130507 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130514 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140304 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140319 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5507596 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |