JP2010539792A - スピーチ増強 - Google Patents
スピーチ増強 Download PDFInfo
- Publication number
- JP2010539792A JP2010539792A JP2010524855A JP2010524855A JP2010539792A JP 2010539792 A JP2010539792 A JP 2010539792A JP 2010524855 A JP2010524855 A JP 2010524855A JP 2010524855 A JP2010524855 A JP 2010524855A JP 2010539792 A JP2010539792 A JP 2010539792A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- channel
- audio signal
- spectrum
- flattening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 55
- 230000005236 sound signal Effects 0.000 claims abstract description 46
- 230000003595 spectral effect Effects 0.000 claims abstract description 32
- 238000001228 spectrum Methods 0.000 claims abstract description 31
- 238000001514 detection method Methods 0.000 claims abstract description 13
- 239000003623 enhancer Substances 0.000 claims abstract description 7
- 230000002708 enhancing effect Effects 0.000 claims abstract description 5
- 230000001965 increasing effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 238000005728 strengthening Methods 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 15
- 238000000605 extraction Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000009499 grossing Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000001755 vocal effect Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 210000002469 basement membrane Anatomy 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000003477 cochlea Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001054 cortical effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000005405 multipole Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【選択図】図1
Description
本明細書は、複数のチャンネルでオーディオ信号から音の中央チャンネルを抽出して、オーディオ信号のスペクトルを平坦化して、オーディオ信号におけるスピーチ(発話)を検出して、スピーチを引き立たせる方法及び装置を説明する。複数のチャンネルによりオーディオ信号から音の中央チャンネルを抽出する方法は、(1)候補中央チャンネルの比αより小さいオーディオ信号の第1のチャンネル及び(2)候補中央チャンネルの比αより小さいオーディオ信号の第2のチャンネルの共役を乗じて、αを概ね最小化して、候補中央チャンネルにその概ね最小化されたαを乗じることにより、抽出された中央チャンネルを形成することを含む。
図1は本発明の一つの実施例によるスピーチ・エンハンサーの機能ブロック図である。スピーチ・エンハンサー1は、入力信号17、離散フーリエ変換器10a,10b、中央チャンネル抽出器11、スペクトル平坦化器12、発声活動検出器13、可変利得増幅器15,15c、逆離散フーリエ変換器18a,18b及び出力信号18を含む。入力信号17はそれぞれ左右のチャンネ17a,17bから成り、同様に出力信号18はそれぞれ左右のチャンネル18a,18bから成る。
以下のように仮定する。
聴覚フィルタは、推定されたスピーチ・チャンネルにおけるスピーチを知覚帯域へ分離する。最も多くのエネルギを有する帯域、データの各々のブロックについて判定される。そのブロックについてのスピーチ・チャンネルのスペクトル形状は、残りの帯域における低エネルギを補償するために修正される。このスペクトルは平坦化される。低エネルギを有すr帯域は、或る最大限まで増大された利得を持つ。一つの実施形態においては、全ての帯域は最大利得を共有してもよい。代替的な実施形態においては、各々の帯域は、それ自身の最大利得を有してもよい。(全ての帯域が同じエネルギを有するという望ましくない場合には、スペクトルは既に平坦である。スペクトル成形が生じないか、或いはスペクトル成形が同一の機能により達成されることも考慮されるであろう。)
スペクトル平坦化はチャンネルのコンテンツとは無関係に生じる。非スピーチを処理してもよいが、これがシステムにおいて後で用いられることはない。非スピーチは、スピーチとは非常に異なるスペクトルを有するので、非スピーチのための平坦化は、通常はスピーチについてのものと同じではない。
推定されたスピーチが単独のチャンネルへ分離されると、それはスピーチ・コンテンツについて分析される(それはスピーチを包含するか?)。コンテンツはスペクトル平坦化とは独立に分析される。スピーチ・コンテンツは、データの隣接するフレームにおけるスペクトル変動を測定することにより判定される。(各々のフレームはデータの多くのブロックから成り得るが、フレームは一般に48kHzサンプル・レートの2、4、又は8ブロックである。)
スピーチ・チャンネルがステレオから抽出されるところでは、残りのステレオ信号がスピーチ分析に役立つであろう。この概念は、任意の多重チャンネル源における隣接するチャンネルにより一般的に適用される。
スピーチが存在すると見做されるとき、平坦化されたスピーチ・チャンネルは、スピーチ・チャンネルが実際にスピーチを包含するという信頼度に関連する或る割合で原信号と混合される。一般に、信頼度が高いときは、より多くの平坦化スピーチ・チャンネルが用いられる。信頼度が低いときは、より少ない平坦化スピーチ・チャンネルが用いられる。
スピーチ増強によれば、中央にパンされたオーディオのみを抽出、処理、及び再挿入することが望まれる。ステレオ混合においては、スピーチは最も頻繁に中央へパンされる。
或る2チャンネル信号が与えられると、そのチャンネルは左(L)と右(R)に分けられるであろう。この左右のチャンネルの各々は、共通の情報のみならず、各々に固有の情報を包含する。共通の情報をC(中央にパンされている)、固有の情報を左のみ右のみについてそれぞれL及びRとして表すことができる。
仮のサラウンド・チャンネルは同様にして以下のように導ける。
上述のように、スピーチ増強方法にとって、その主要な懸念は中央チャンネルの抽出である。この部分において、上述の技術は、オーディオ信号の複雑な周波数領域表現に適用される。
以下、本発明のスペクトル平坦化の実施例を説明する。大部分がスピーチである単独のチャンネルを仮定し、そのスピーチ信号を離散フーリエ変換(DFT)又は関連した変換によって周波数領域へ変換する。振幅スペクトルは、変換周波数ビンを二乗することによってパワースペクトルへ変換する。
上述のスペクトル平坦化システムは、入力された信号の特性を考慮していない。非スピーチ信号が平坦化されるならば、音質における知覚可能な変化は深刻なものとなろう。非スピーチ信号の処理を避けるために、上述の方法は、発声活動検出器13に結び付けることができる。発声活動検出器13がスピーチの存在を示すとき、平坦化スピーチが用いられる。
スペクトル束は、信号の出力スペクトルが変化する速度を測定し、オーディオの隣接するフレームの間の出力を比較する。(フレームは、オーディオ・データの複数のブロックである。)スペクトル束は、発声活動検出、或いは「スピーチ対オーディオ分類における他の判定がなされたもの」を示す。多くの場合、付加的な指標が用いられ、その結果は、オーディオが本当にスピーチであるか否かの判定をなすために集積される。
混合
平坦化された中央チャンネルは、発声活動検出器の出力に基づいて原オーディオン信号と混合される。
Schaub,A.and P.,”Spectral sharpening for speech enhancement noise reduction”,Proc.ICASSP.1991,Toronto,Canada,May 1991,pp.993−996.
Sondhi,, ”New methods of pitch extraction”, Audio and Electroacoustics, IEEE Transactions, June 1968, Volume 16, Issue 2, pp 262−266.
Villchur, E., ”Signal Processing to Improve Speech Intelligibility for the Hearing Impaired”, 99th Audio Engineering Society Convention, September 1995.
Thomas, I. and Niederjohn, R., ”Preprocessing of Speech for Added Intelligibility in High Ambient Noise”, 34th Audio Engineering Society Convention, March 1968.
Moore, B. et. al., ”A Model for the Prediction of Thresholds, Loudness, and Partial Loudness”, J. Audio Eng. Soc, Vol. 45, No. 4, April 1997.
Moore, B. and Oxenham, A., ”Psychoacoustic consequences of compression in the peripheral auditory system”, The Journal of the Acoustical Society of America − December 2002 − Volume 112, Issue 6, pp. 2962−2966
従来技術 スペクトル平坦化
米国特許
米国特許第6732073 B1号 発明の名称”Spectralenhancement of acoustic signals to provide improved recognition of speech”
米国特許第0993480 B1号 発明の名称”Voice intelligibility enhancement system”
米国特許2006/026320 A1号 発明の名称”Apparatus and method for noise reduction and speech enhancement with microphones and loudspeakers”
米国特許第07191122号 発明の名称”Speech compression system and method”
米国特許第2007/0094017号 発明の名称”Frequency domain format enhancement”
国際特許
WO 2004/013840 Al号 発明の名称”Digital Signal Processing Techniques For Improving Audio Clarity And Intelligibility”
WO 2003/015082号 発明の名称”Sound Intelligibility Enhancement Using A Psychoacoustic Model And An Oversampled Filterbank”
論文
Sallberg, B. et. al; ”Analog Circuit Implementation for Speech Enhancement Purposes Signals”; Systems and Computers, 2004. Conference Record of the Thirty−Eighth Asilomar Conference.
Magotra, N. and Sirivara, S.; ”Real−time digital speech processing strategies for the hearing impaired”; Acoustics, Speech, and Signal Processing. 1997. ICASSP−97., 1997 page(s): 1211−1214 vol. 2
Walker, G., Byrne, D., and Dillon, H.; ”The effects of multichannel compression/expansion amplification on the intelligibility of nonsense syllables in noise”; The Journal of the Acoustical Society of America − September 1984 − Volume 76, Issue 3, pp. 746−757
従来技術 中央抽出
Adobe Audition has a vocal/instrument extraction function
http://www.adobeforums.eom/cgi−bin/webx/.3bc3a3e5
winampのための「中央カット」
http://www.hvdrogenaudio.org/forums/lofiversion/index.php/tl7450.html
従来技術 スペクトル束
Vinton, M, and Robinson C; ”Automated Speech/Other Discrimination for Loudness Monitoring,” AES 118th Convention. 2005
Scheirer E., and Slaney M., ”Construction and evaluation of a robust multifeature speech/music discriminator”, IEEE Transactions on Acoustics, Speech, and Signal Processing (ICASSP’97), 1997, pp. 1331 −− 1334.
Claims (14)
- 複数のチャンネルによりオーディオ信号から音の中央チャンネルを抽出する方法であって、
(1)候補中央チャンネルの比αより小さいオーディオ信号の第1のチャンネルと、
(2)候補中央チャンネルの比αより小さいオーディオ信号の第2のチャンネルの共役とを乗じて、
αを概ね最小化して、
候補中央チャンネルを概ね最小化されたαに乗じることにより、抽出された中央チャンネルを形成することを含む方法。 - オーディオ信号のスペクトルを平坦化する方法であって、
推定されたスピーチ・チャンネルを知覚帯域に分離して、
知覚帯域のうちの何れが最も多くのエネルギを有しているかを判定し、
より少ないエネルギを有する知覚帯域の利得を増大させることにより、オーディオ信号における任意のスピーチのスペクトルを平坦化させることを含む方法。 - 請求項2の方法において、前記増大は、より少ないエネルギを有する知覚帯域の利得を最大まで増大することを含む方法。
- オーディオ信号におけるスピーチを検出する方法であって、
オーディオ信号の候補中央チャンネルにおけるスペクトル変動を測定し、
候補中央チャンネルよりも少ないオーディオ信号のスペクトル変動を測定して、
これらスペクトル変動を比較することにより、オーディオ信号におけるスピーチを検出することを含む方法。 - スピーチを増強する方法であって、
オーディオ信号の中央チャンネルを抽出して、
中央チャンネルのスペクトルを平坦化して、
平坦化されたスピーチ・チャンネルにオーディオ信号を混合することにより、オーディオ信号における任意のスピーチを増強することを含む方法。 - 請求項5の方法において、
中央チャンネルにおけるスピーチ検出に信頼度を生成すると共に、
前記混合は、
平坦化されたスピーチ・チャンネルにオーディオ信号を、検出されたスピーチを有する信頼度に比例させて混合することを更に含む方法。 - 請求項6の方法において、
前記信頼度は、可能性確率が最も低いものから可能性確率が最も高いものまで変動すると共に、
前記生成は、
最低可能性確率よりも高く、且つ最高可能性確率よりも低い値に対して生成された信頼度を更に制限することを含む方法。 - 請求項5の方法において、前記抽出は、請求項1の方法を用いてオーディオ信号の中央チャンネルを抽出することを含む方法。
- 請求項5の方法において、前記平坦化は、請求項2の方法を用いて前記中央チャンネルのスペクトルを平坦化することを含む方法。
- 請求項5の方法において、前記生成は、請求項3の方法を用いて前記中央チャンネルにおけるスピーチ検出に信頼度を生成することを含む方法。
- 請求項5の方法において、前記抽出は、請求項1の方法を用いてオーディオ信号の中央チャンネルを抽出することを含み、
前記平坦化は、請求項2の方法を用いて前記中央チャンネルのスペクトルを平坦化することを含み、
前記生成は、請求項3の方法を用いて前記中央チャンネルにおけるスピーチ検出に信頼度を生成することを含む方法。 - 請求項1乃至11の何れか一項に記載の方法を実行するコンピュータ・プログラムが格納されたコンピュータ読み取り可能な記録媒体。
- コンピュータ・システムであり、
CPUと、
請求項12の記録媒体と、
前記CPUと前記記録媒体とを結合するバスとを含むコンピュータ・システム。 - スピーチエンハンサであって、
オーディオ信号の中央チャンネルを抽出するための抽出器と、
前記中央チャンネルのスペクトルを平坦化するためのスペクトル平坦化器と、
前記中央チャンネルにおけるスピーチ検出における信頼度を生成するスピーチ信頼度生成器と、
前記平坦化されたスピーチ・チャンネルを原オーディオ信号に、検出されたスピーチの信頼度に比例して混合することにより、オーディオ信号における任意のスピーチを増強するミキサとを備えるスピーチエンハンサ。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US99360107P | 2007-09-12 | 2007-09-12 | |
PCT/US2008/010591 WO2009035615A1 (en) | 2007-09-12 | 2008-09-10 | Speech enhancement |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012040093A Division JP5507596B2 (ja) | 2007-09-12 | 2012-02-27 | スピーチ増強 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010539792A true JP2010539792A (ja) | 2010-12-16 |
Family
ID=40016128
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010524855A Pending JP2010539792A (ja) | 2007-09-12 | 2008-09-10 | スピーチ増強 |
JP2012040093A Active JP5507596B2 (ja) | 2007-09-12 | 2012-02-27 | スピーチ増強 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012040093A Active JP5507596B2 (ja) | 2007-09-12 | 2012-02-27 | スピーチ増強 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8891778B2 (ja) |
EP (1) | EP2191467B1 (ja) |
JP (2) | JP2010539792A (ja) |
CN (1) | CN101960516B (ja) |
AT (1) | ATE514163T1 (ja) |
WO (1) | WO2009035615A1 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009086174A1 (en) | 2007-12-21 | 2009-07-09 | Srs Labs, Inc. | System for adjusting perceived loudness of audio signals |
EP2151822B8 (en) * | 2008-08-05 | 2018-10-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal for speech enhancement using a feature extraction |
US8406462B2 (en) * | 2008-08-17 | 2013-03-26 | Dolby Laboratories Licensing Corporation | Signature derivation for images |
DE112009005215T8 (de) * | 2009-08-04 | 2013-01-03 | Nokia Corp. | Verfahren und Vorrichtung zur Audiosignalklassifizierung |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
US9324337B2 (en) * | 2009-11-17 | 2016-04-26 | Dolby Laboratories Licensing Corporation | Method and system for dialog enhancement |
KR101690252B1 (ko) * | 2009-12-23 | 2016-12-27 | 삼성전자주식회사 | 신호 처리 방법 및 장치 |
JP2012027101A (ja) * | 2010-07-20 | 2012-02-09 | Sharp Corp | 音声再生装置、音声再生方法、プログラム、及び、記録媒体 |
US9237400B2 (en) | 2010-08-24 | 2016-01-12 | Dolby International Ab | Concealment of intermittent mono reception of FM stereo radio receivers |
JP6010539B2 (ja) * | 2011-09-09 | 2016-10-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 符号化装置、復号装置、符号化方法および復号方法 |
US9496839B2 (en) * | 2011-09-16 | 2016-11-15 | Pioneer Dj Corporation | Audio processing apparatus, reproduction apparatus, audio processing method and program |
US20130253923A1 (en) * | 2012-03-21 | 2013-09-26 | Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry | Multichannel enhancement system for preserving spatial cues |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
CN104078050A (zh) | 2013-03-26 | 2014-10-01 | 杜比实验室特许公司 | 用于音频分类和音频处理的设备和方法 |
CN105247614B (zh) | 2013-04-05 | 2019-04-05 | 杜比国际公司 | 音频编码器和解码器 |
CN105493182B (zh) * | 2013-08-28 | 2020-01-21 | 杜比实验室特许公司 | 混合波形编码和参数编码语音增强 |
US9269370B2 (en) * | 2013-12-12 | 2016-02-23 | Magix Ag | Adaptive speech filter for attenuation of ambient noise |
CN108462936A (zh) * | 2013-12-13 | 2018-08-28 | 无比的优声音科技公司 | 用于音场增强的设备及方法 |
US9344825B2 (en) | 2014-01-29 | 2016-05-17 | Tls Corp. | At least one of intelligibility or loudness of an audio program |
RU2673390C1 (ru) * | 2014-12-12 | 2018-11-26 | Хуавэй Текнолоджиз Ко., Лтд. | Устройство обработки сигналов для усиления речевого компонента в многоканальном звуковом сигнале |
TWI569263B (zh) * | 2015-04-30 | 2017-02-01 | 智原科技股份有限公司 | 聲頻訊號的訊號擷取方法與裝置 |
WO2016183379A2 (en) | 2015-05-14 | 2016-11-17 | Dolby Laboratories Licensing Corporation | Generation and playback of near-field audio content |
JP6687453B2 (ja) * | 2016-04-12 | 2020-04-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | ステレオ再生装置 |
CN115881146A (zh) * | 2021-08-05 | 2023-03-31 | 哈曼国际工业有限公司 | 用于动态语音增强的方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06205500A (ja) * | 1992-10-15 | 1994-07-22 | Philips Electron Nv | 中央チャンネル信号導出装置 |
JPH06253398A (ja) * | 1993-01-27 | 1994-09-09 | Philips Electron Nv | オーディオ信号処理装置 |
JP2003084790A (ja) * | 2001-09-17 | 2003-03-19 | Matsushita Electric Ind Co Ltd | 台詞成分強調装置 |
JP2005258158A (ja) * | 2004-03-12 | 2005-09-22 | Advanced Telecommunication Research Institute International | ノイズ除去装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04149598A (ja) * | 1990-10-12 | 1992-05-22 | Pioneer Electron Corp | 音場補正装置 |
JP3284747B2 (ja) | 1994-05-12 | 2002-05-20 | 松下電器産業株式会社 | 音場制御装置 |
US6993480B1 (en) * | 1998-11-03 | 2006-01-31 | Srs Labs, Inc. | Voice intelligibility enhancement system |
US6732073B1 (en) * | 1999-09-10 | 2004-05-04 | Wisconsin Alumni Research Foundation | Spectral enhancement of acoustic signals to provide improved recognition of speech |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US20030023429A1 (en) | 2000-12-20 | 2003-01-30 | Octiv, Inc. | Digital signal processing techniques for improving audio clarity and intelligibility |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
US7668317B2 (en) * | 2001-05-30 | 2010-02-23 | Sony Corporation | Audio post processing in DVD, DTV and other audio visual products |
CA2354755A1 (en) | 2001-08-07 | 2003-02-07 | Dspfactory Ltd. | Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank |
JP2005502247A (ja) | 2001-09-06 | 2005-01-20 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ再生装置 |
US7257231B1 (en) * | 2002-06-04 | 2007-08-14 | Creative Technology Ltd. | Stream segregation for stereo signals |
FI118370B (fi) * | 2002-11-22 | 2007-10-15 | Nokia Corp | Stereolaajennusverkon ulostulon ekvalisointi |
CA2454296A1 (en) | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
US20060206320A1 (en) * | 2005-03-14 | 2006-09-14 | Li Qi P | Apparatus and method for noise reduction and speech enhancement with microphones and loudspeakers |
-
2008
- 2008-09-10 WO PCT/US2008/010591 patent/WO2009035615A1/en active Application Filing
- 2008-09-10 EP EP08831097A patent/EP2191467B1/en active Active
- 2008-09-10 JP JP2010524855A patent/JP2010539792A/ja active Pending
- 2008-09-10 AT AT08831097T patent/ATE514163T1/de not_active IP Right Cessation
- 2008-09-10 US US12/676,410 patent/US8891778B2/en active Active
- 2008-09-10 CN CN200880106533.0A patent/CN101960516B/zh active Active
-
2012
- 2012-02-27 JP JP2012040093A patent/JP5507596B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06205500A (ja) * | 1992-10-15 | 1994-07-22 | Philips Electron Nv | 中央チャンネル信号導出装置 |
JPH06253398A (ja) * | 1993-01-27 | 1994-09-09 | Philips Electron Nv | オーディオ信号処理装置 |
JP2003084790A (ja) * | 2001-09-17 | 2003-03-19 | Matsushita Electric Ind Co Ltd | 台詞成分強調装置 |
JP2005258158A (ja) * | 2004-03-12 | 2005-09-22 | Advanced Telecommunication Research Institute International | ノイズ除去装置 |
Also Published As
Publication number | Publication date |
---|---|
US20100179808A1 (en) | 2010-07-15 |
JP5507596B2 (ja) | 2014-05-28 |
EP2191467B1 (en) | 2011-06-22 |
ATE514163T1 (de) | 2011-07-15 |
EP2191467A1 (en) | 2010-06-02 |
JP2012110049A (ja) | 2012-06-07 |
US8891778B2 (en) | 2014-11-18 |
CN101960516B (zh) | 2014-07-02 |
CN101960516A (zh) | 2011-01-26 |
WO2009035615A1 (en) | 2009-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5507596B2 (ja) | スピーチ増強 | |
US10565970B2 (en) | Method and a system for decomposition of acoustic signal into sound objects, a sound object and its use | |
US8971551B2 (en) | Virtual bass synthesis using harmonic transposition | |
KR101935183B1 (ko) | 멀티-채널 오디오 신호 내의 음성 성분을 향상시키는 신호 처리 장치 | |
JP4818335B2 (ja) | 信号帯域拡張装置 | |
JP5341128B2 (ja) | 補聴器における安定性の改善 | |
RU2507608C2 (ru) | Устройства и способы для обработки аудио сигнала с целью повышения разборчивости речи, используя функцию выделения нужных характеристик | |
RU2520420C2 (ru) | Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала | |
KR101378696B1 (ko) | 협대역 신호로부터의 상위대역 신호의 결정 | |
JP5127754B2 (ja) | 信号処理装置 | |
US7970144B1 (en) | Extracting and modifying a panned source for enhancement and upmix of audio signals | |
KR101670313B1 (ko) | 음원 분리를 위해 자동적으로 문턱치를 선택하는 신호 분리 시스템 및 방법 | |
JP2009518684A (ja) | チャネル間振幅スペクトルを用いた音声チャネルの抽出 | |
CN102610232B (zh) | 一种自适应音频感知响度调整方法 | |
EP2720477B1 (en) | Virtual bass synthesis using harmonic transposition | |
Kates | Modeling the effects of single-microphone noise-suppression | |
EP2828853B1 (en) | Method and system for bias corrected speech level determination | |
JP2008072600A (ja) | 音響信号処理装置、音響信号処理プログラム、音響信号処理方法 | |
JPH07146700A (ja) | ピッチ強調方法および装置ならびに聴力補償装置 | |
US8175282B2 (en) | Method of evaluating perception intensity of an audio signal and a method of controlling an input audio signal on the basis of the evaluation | |
Jiang et al. | Speech noise reduction algorithm in digital hearing aids based on an improved sub-band SNR estimation | |
Muhsina et al. | Signal enhancement of source separation techniques | |
JP2002049399A (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
US20240161762A1 (en) | Full-band audio signal reconstruction enabled by output from a machine learning model | |
US20240163529A1 (en) | Dolby atmos master compressor/limiter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20111025 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111226 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120106 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120123 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120206 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120213 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120515 |