JP2010539539A - 音声明瞭化を伴うスピーチ改善 - Google Patents
音声明瞭化を伴うスピーチ改善 Download PDFInfo
- Publication number
- JP2010539539A JP2010539539A JP2010524854A JP2010524854A JP2010539539A JP 2010539539 A JP2010539539 A JP 2010539539A JP 2010524854 A JP2010524854 A JP 2010524854A JP 2010524854 A JP2010524854 A JP 2010524854A JP 2010539539 A JP2010539539 A JP 2010539539A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- audio signal
- sub
- processing
- subband
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005352 clarification Methods 0.000 title claims description 36
- 230000006872 improvement Effects 0.000 title claims description 24
- 230000005236 sound signal Effects 0.000 claims abstract description 75
- 238000000034 method Methods 0.000 claims abstract description 73
- 238000012545 processing Methods 0.000 claims abstract description 60
- 230000008569 process Effects 0.000 claims abstract description 49
- 230000000694 effects Effects 0.000 claims description 27
- 238000001514 detection method Methods 0.000 claims description 23
- 238000009499 grossing Methods 0.000 claims description 14
- 230000007423 decrease Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 5
- 230000007704 transition Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 22
- 230000009467 reduction Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 5
- 101100453593 Rattus norvegicus Kctd1 gene Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000005405 multipole Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 241000819038 Chichester Species 0.000 description 1
- 208000032041 Hearing impaired Diseases 0.000 description 1
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
Description
以下の刊行物は参照としてそのすべてを本明細書に編入する。
(文献2)Y. Ephraim, H. Lev-Ari and W. J. J. Robertsによる、The Electronic Handbook, CRC Press, April 2005、「A brief survey of Speech Enhancement」
(文献3)Y. Ephraim及びD. Malahによる、IEEE Trans. Acoust., Speech, Signal Processing, vol. 32, pp. 1109‐1121, Dec. 1984、「Speech enhancement using a minimum mean square error short time spectral amplitude estimator」
(文献4)Thomas,I.及びNiederjohn,R.による、34th Audio Engineerin Society Convention, March 1968、「Preprocessing of Speech for Added Intelligibility in High Ambient Noise」
(文献5)Villchur, E.による、99th Audio Engineering Society Convention, September 1995、「Signal Processing to Improve Speech Intelligibility for the Hearing Impaired」
(文献6)N. Viragによる、IEEE Tran. Speech and Audio Processing, vol. 7, pp. 126‐137, Mar. 1999、「Single channel speech enhancement based on masking properties of the human auditory system」
(文献7)R. Martinによる、Proc. EUSIPCO, 1994, pp. 1182‐1185、「Spectral subtraction based on minimum statistics」
(文献8)P. J. Wolfe及びS. J. Godsillによる、EURASIP Journal on Applied Signal Processing, vol. 2003, Issue 10, Pages 1043‐1051, 2003、「Efficient alternatives to Ephraim and Malah suppression rule for audio signal enhancement」
(文献9)B. Widrow及びS. D. Stearnsによる、Englewood Cliffs, NJ: Prentice Hall, 1985、「Adaptive Signal Processing」
(文献10)Y. Ephraim及びD. Malahによる、EEE Trans. Acoust., Speech, Signal Processing, vol. 33, pp. 443-445, Dec. 1985、「Speech enhancement using a minimum mean square error Log-spectral amplitude estimator」
(文献11)E. Terhardtによる、Hearing Research, pp. 155-182, 1, 1979、「Calculating Virtual Pitch」
(文献12)ISO/IEC JTC1/SC29/WG11の、IS 11172-3, 1992、「Information technology - Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s − Part3 Audio」
(文献13)J. Johnstonによる、EEEJ. Select. Areas Commun., vol. 6, pp. 314-323, Feb. 1988、「Transform coding of audio signals using perceptual noise criteria」
(文献14)S. Gustafsson, P. Jax, P Varyによる、Proceedings of the 1998 IEEE International Conference on Acoustics, Speech, and Signal Processing, 1998. ICASSP '98、「A novel psychoacoustically motivated audio enhancement algorithm preserving background noise characteristics」
(文献15)Yi Hu及びP. C. Loizouによる、EEE Signal Processing Letter, pp. 270 - 273, vol.11 , no. 2, Feb. 2004、「Incorporating a psychoacoustic model in frequency domain speech enhancement」
(文献16)L. Lin, W. H. Holmes及びE. Ambikairajahによる、Electronics Letter, pp 1486-1487, vol. 38, Nov, 2002、「Speech denoising using perceptual modification of Wiener filtering」
(文献17)A.M. Kondozによる、John Wiley & Sons, Ltd., 2nd Edition, 2004, Chichester, England, Chapter 10: Voice Activity Detection, pp. 357-377、「Digital Speech: Coding for Low Bit Rate Communication Systems」
図1は、トポロジカルな機能構成による、本発明の特徴の典型的な実施形態を示す。入力は、混じりけのないスピーチとノイズの両方を含むアナログスピーチ信号をディジタル化することにより作られる。この改変されていないオーディオ信号y(n)(ノイズの多いスピーチ)は、ここで、n=0,1,....は時間指標であるが、フィルターバンク装置又はフィルターバンク機能(分析フィルターバンク)2に送られ、k個のサブ帯域信号Yk(m)、ここでk=l,...,K、m=0,l,...,∞、が作られ、kはサブ帯域番号であり、mは各サブ帯域信号における時間指標である。分析フィルターバンク2は、オーディオ信号を時間領域から周波数領域における複数のサブ帯域に変換する。
(2)Rongshan Yuによる、2007年3月19日出願、S.N.60/918,986「Speech Enhancement Employing a Perceptual Model」
(3)Rongshan Yuによる、2007年9月12日出願、S.N.60/993,548「Speech Enhancement with Noise Level Estimation Adjustment」
(4)C. Philip Brownによる、2007年9月12日出願、S.N.60/993,601「Speech Enhancement」
スピーチ改善ゲインファクターGNRk(m)は、ノイズを削減することを目的とするため、「ゲイン削減」と称することができる。ゲイン削減を制御する1つの方法は、「スペクトル減算法」として知られており、サブ帯域信号Yk(m)に適用されるゲイン削減GNRk(m)は、以下のように表すことができる。
音声活動検出装置及び音声活動検出機能は公知である。適切なそのような装置又は機能は、文献17の第10章及びその文献目録に記載されている。特定の音声活動検出装置を用いることが本発明にとって必須条件とはならない。
本発明の現実的な実施形態において、種々の音声明瞭化装置及び音声明瞭化機能が有用である。
本発明は、ハードウェア又はソフトウェア又は両方を組み合わせたもの(例えば、プログラマブルロジックアレー)で実施することができる。特に記載がない限り、本発明の一部として含まれている処理は本質的に、特定のコンピュータや他の装置と関連付けられるものではない。特に、種々の汎用機をこの記載に従って書かれたプログラムと共に用いてもよい、あるいは、要求の方法を実行するために、より特化した装置(例えば、集積回路)を構成することが便利かもしれない。このように、本発明は、それぞれ少なくとも1つのプロセッサ、少なくとも1つの記憶システム(揮発性及び非揮発性メモリー及び/又は記憶素子を含む)、少なくとも1つの入力装置又は入力ポート、及び少なくとも1つの出力装置又は出力ポートを具備する、1つ以上のプログラマブルコンピュータシステム上で実行される1つ以上のコンピュータプログラムにより実現することができる。ここに記載した機能を遂行し、出力情報を出力させるために入力データにプログラムコードを適用する。この出力情報は、公知の方法で、1以上の出力装置に適用される。
Claims (14)
- オーディオ信号を時間領域から周波数領域の複数のサブ帯域に変換するステップと、
オーディオ信号のサブ帯域を処理するステップであって、該処理には、いくつかの前記サブ帯域中のオーディオ信号のゲインを制御することが含まれ、サブ帯域のゲインは、少なくとも、
サブ帯域中のスピーチ成分のレベルに対してノイズ成分のレベルが増大するにつれてサブ帯域のゲインを減少させるため、及び
オーディオ信号のサブ帯域中にスピーチ成分が存在するとき、サブ帯域中のゲインを増大させるために、
ゲイン中の差異を加算/減算するか、又はゲインの比を乗算する処理により制御され、
該処理は、それぞれオーディオ信号のサブ帯域に応答し、ゲインを独立に制御して、処理されたサブ帯域オーディオ信号を出力することを特徴とする、オーディオ信号のサブ帯域を処理するステップと、
処理されたサブ帯域オーディオ信号を周波数領域から時間領域に変換し、スピーチ成分を増強したオーディオ信号を出力するステップと、
を具備することを特徴とする、スピーチ成分とノイズ成分からなるオーディオ信号のスピーチ成分を改善する方法。 - 前記処理には、サブ帯域におけるスピーチ成分のレベルに関してノイズ成分のレベルが増大するにつれて該サブ帯域のゲインを減少させるように、オーディオ信号のサブ帯域に応答するスピーチ改善処理が含まれることを特徴とする、請求項1に記載の方法。
- 前記処理には、前記オーディオ信号のサブ帯域にスピーチ成分が存在するときに該サブ帯域中のゲインを増大させるように、オーディオ信号のサブ帯域に応答する音声明瞭化処理が含まれることを特徴とする、請求項1又は請求項2に記載の方法。
- 前記処理には、ノイズの多いスピーチ信号中にスピーチが存在するときに判断を行うために、オーディオ信号のサブ帯域に応答する音声活動検出処理が含まれ、音声明瞭化処理はこの音声活動検出処理にも応答することを特徴とする、請求項3に記載の方法。
- 前記処理には、ノイズの多いスピーチ信号中にスピーチが存在するときに判断を行うために、オーディオ信号のサブ帯域に応答する音声活動検出処理が含まれ、スピーチ改善処理及び音声明瞭化処理の各々は、音声活動検出処理にも応答することを特徴とする、請求項2又は請求項3に記載の方法。
- 前記音声明瞭化処理は、スピーチが存在するとき、スピーチ成分が存在する状態からスピーチ成分が存在しない状態への移行における時間平滑化に伴い、該ゲインが減少することを特徴とする、請求項4又は請求項5に記載の方法。
- オーディオ信号を時間領域から周波数領域の複数のサブ帯域に変換するステップと、
オーディオ信号のサブ帯域を処理するステップであって、該処理には、前記オーディオ信号のサブ帯域にスピーチ成分が存在するときに該サブ帯域中のゲインを増大させて処理されたサブ帯域オーディオ信号を出力する処理が含まれることを特徴とする、オーディオ信号のサブ帯域を処理するステップと、
前記処理されたサブ帯域オーディオ信号を処理するステップであって、該処理されたサブ帯域オーディオ信号の処理には、いくつかのサブ帯域の処理されたサブ帯域オーディオ信号のゲインを制御することが含まれ、サブ帯域のゲインは、サブ帯域中のスピーチ成分に関してノイズ成分のレベルが増大するにつれて減少し、さらなる処理を受けたサブ帯域オーディオ信号を出力することを特徴とする、処理されたサブ帯域オーディオ信号を処理するステップと、
前記さらなる処理を受けたサブ帯域オーディオ信号を周波数領域から時間領域に変換し、スピーチ成分を増強したオーディオ信号を出力するステップと、
を具備することを特徴とする、スピーチ成分とノイズ成分からなるオーディオ信号のスピーチ成分を改善する方法。 - 前記処理には、サブ帯域におけるスピーチ成分のレベルに関してノイズ成分のレベルが増大するにつれて該サブ帯域のゲインを減少させるように、オーディオ信号のサブ帯域に応答するスピーチ改善処理が含まれることを特徴とする、請求項7に記載の方法。
- 前記さらなる処理には、前記オーディオ信号のサブ帯域にスピーチ成分が存在するときに該サブ帯域中のゲインを増大させるように、オーディオ信号のサブ帯域に応答する音声明瞭化処理が含まれることを特徴とする、請求項7又は請求項8に記載の方法。
- 前記処理、及び/又は、前記さらなる処理には、ノイズの多いスピーチ信号中にスピーチが存在するときに判断を行うために、オーディオ信号のサブ帯域に応答する音声活動検出処理が含まれ、音声明瞭化処理はこの音声活動検出処理にも応答することを特徴とする、請求項9に記載の方法。
- 前記処理、及び/又は、前記さらなる処理には、ノイズの多いスピーチ信号中にスピーチが存在するときに判断を行うために、オーディオ信号のサブ帯域に応答する音声活動検出処理が含まれ、スピーチ改善処理及び音声明瞭化処理の各々は、音声活動検出処理にも応答することを特徴とする、請求項8又は請求項9に記載の方法。
- 前記音声明瞭化処理は、スピーチが存在するとき、スピーチ成分が存在する状態からスピーチ成分が存在しない状態への移行における時間平滑化に伴い、該ゲインが減少することを特徴とする、請求項10又は請求項11に記載の方法。
- 請求項1乃至請求項12のいずれか1項に記載の方法を実施するための装置。
- 請求項1乃至請求項12のいずれか1項に記載の方法をコンピュータに実行させるためのコンピュータ読取可能な媒体に記憶させたコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US99369107P | 2007-09-12 | 2007-09-12 | |
US60/993,691 | 2007-09-12 | ||
PCT/US2008/010590 WO2009035614A1 (en) | 2007-09-12 | 2008-09-10 | Speech enhancement with voice clarity |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010539539A true JP2010539539A (ja) | 2010-12-16 |
JP5302968B2 JP5302968B2 (ja) | 2013-10-02 |
Family
ID=40076697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010524854A Active JP5302968B2 (ja) | 2007-09-12 | 2008-09-10 | 音声明瞭化を伴うスピーチ改善 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8583426B2 (ja) |
EP (1) | EP2191466B1 (ja) |
JP (1) | JP5302968B2 (ja) |
CN (1) | CN101802910B (ja) |
BR (1) | BRPI0816792B1 (ja) |
RU (1) | RU2469423C2 (ja) |
WO (1) | WO2009035614A1 (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US9185500B2 (en) | 2008-06-02 | 2015-11-10 | Starkey Laboratories, Inc. | Compression of spaced sources for hearing assistance devices |
US8705751B2 (en) * | 2008-06-02 | 2014-04-22 | Starkey Laboratories, Inc. | Compression and mixing for hearing assistance devices |
US9485589B2 (en) | 2008-06-02 | 2016-11-01 | Starkey Laboratories, Inc. | Enhanced dynamics processing of streaming audio by source separation and remixing |
WO2010003068A1 (en) * | 2008-07-03 | 2010-01-07 | The Board Of Trustees Of The University Of Illinois | Systems and methods for identifying speech sound features |
US9324337B2 (en) * | 2009-11-17 | 2016-04-26 | Dolby Laboratories Licensing Corporation | Method and system for dialog enhancement |
US8718290B2 (en) | 2010-01-26 | 2014-05-06 | Audience, Inc. | Adaptive noise reduction using level cues |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8781137B1 (en) | 2010-04-27 | 2014-07-15 | Audience, Inc. | Wind noise detection and suppression |
US8447596B2 (en) | 2010-07-12 | 2013-05-21 | Audience, Inc. | Monaural noise suppression based on computational auditory scene analysis |
GB2484969B (en) * | 2010-10-29 | 2013-11-20 | Canon Kk | Improved reference frame for video encoding and decoding |
JP2012103395A (ja) * | 2010-11-09 | 2012-05-31 | Sony Corp | 符号化装置、符号化方法、およびプログラム |
WO2013142723A1 (en) | 2012-03-23 | 2013-09-26 | Dolby Laboratories Licensing Corporation | Hierarchical active voice detection |
CN103325383A (zh) * | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 音频处理方法和音频处理设备 |
JP6135106B2 (ja) | 2012-11-29 | 2017-05-31 | 富士通株式会社 | 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム |
WO2015010865A1 (en) | 2013-07-22 | 2015-01-29 | Harman Becker Automotive Systems Gmbh | Automatic timbre control |
EP3025516B1 (en) * | 2013-07-22 | 2020-11-04 | Harman Becker Automotive Systems GmbH | Automatic timbre, loudness and equalization control |
CN103559887B (zh) * | 2013-11-04 | 2016-08-17 | 深港产学研基地 | 用于语音增强系统的背景噪声估计方法 |
EP3103204B1 (en) * | 2014-02-27 | 2019-11-13 | Nuance Communications, Inc. | Adaptive gain control in a communication system |
US9953661B2 (en) * | 2014-09-26 | 2018-04-24 | Cirrus Logic Inc. | Neural network voice activity detection employing running range normalization |
RU2589298C1 (ru) * | 2014-12-29 | 2016-07-10 | Александр Юрьевич Бредихин | Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке |
RU2676022C1 (ru) * | 2016-07-13 | 2018-12-25 | Общество с ограниченной ответственностью "Речевая аппаратура "Унитон" | Способ повышения разборчивости речи |
CN106328159B (zh) * | 2016-09-12 | 2021-07-09 | 优酷网络技术(北京)有限公司 | 一种音频流的处理方法及装置 |
EP3312838A1 (en) * | 2016-10-18 | 2018-04-25 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for processing an audio signal |
US20210089887A1 (en) * | 2019-09-24 | 2021-03-25 | Apple Inc. | Variance-Based Learning Rate Control For Training Machine-Learning Models |
RU2726326C1 (ru) * | 2019-11-26 | 2020-07-13 | Акционерное общество "ЗАСЛОН" | Способ повышения разборчивости речи пожилыми людьми при приеме звуковых программ на наушники |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06208395A (ja) * | 1992-10-30 | 1994-07-26 | Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho | ホルマント検出装置及び音声加工装置 |
JPH10254499A (ja) * | 1997-03-14 | 1998-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 帯域分割型雑音低減方法及び装置 |
JP2002169599A (ja) * | 2000-11-30 | 2002-06-14 | Toshiba Corp | ノイズ抑制方法及び電子機器 |
JP2002519719A (ja) * | 1998-06-22 | 2002-07-02 | ディーエスピーシー・テクノロジーズ・リミテッド | 重み付け利得平滑化手段を含むノイズサプレッサ |
JP2005037650A (ja) * | 2003-07-14 | 2005-02-10 | Asahi Kasei Corp | 雑音低減装置 |
JP2005537702A (ja) * | 2002-07-12 | 2005-12-08 | ヴェーデクス・アクティーセルスカプ | 補聴器および音声の明瞭さを高める方法 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR9610290A (pt) * | 1995-09-14 | 1999-03-16 | Ericsson Ge Mobile Inc | Processo para aumentar a inteligibilidade de voz em sinais de áudio aparelho para reduzir ruído em quadros recebidos de sinais de áudio digitalizados e sistema de telecomunicações |
FR2768547B1 (fr) | 1997-09-18 | 1999-11-19 | Matra Communication | Procede de debruitage d'un signal de parole numerique |
US6415253B1 (en) * | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
US6993480B1 (en) | 1998-11-03 | 2006-01-31 | Srs Labs, Inc. | Voice intelligibility enhancement system |
US6289309B1 (en) | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
US6604071B1 (en) * | 1999-02-09 | 2003-08-05 | At&T Corp. | Speech enhancement with gain limitations based on speech activity |
US6732073B1 (en) | 1999-09-10 | 2004-05-04 | Wisconsin Alumni Research Foundation | Spectral enhancement of acoustic signals to provide improved recognition of speech |
US6959274B1 (en) | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
US6366880B1 (en) * | 1999-11-30 | 2002-04-02 | Motorola, Inc. | Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies |
US6760435B1 (en) | 2000-02-08 | 2004-07-06 | Lucent Technologies Inc. | Method and apparatus for network speech enhancement |
JP2002149200A (ja) * | 2000-08-31 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声処理装置及び音声処理方法 |
US20030023429A1 (en) | 2000-12-20 | 2003-01-30 | Octiv, Inc. | Digital signal processing techniques for improving audio clarity and intelligibility |
EP2239733B1 (en) * | 2001-03-28 | 2019-08-21 | Mitsubishi Denki Kabushiki Kaisha | Noise suppression method |
US20030028386A1 (en) | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
CA2354755A1 (en) | 2001-08-07 | 2003-02-07 | Dspfactory Ltd. | Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
CN1322488C (zh) * | 2004-04-14 | 2007-06-20 | 华为技术有限公司 | 一种语音增强的方法 |
US7492889B2 (en) | 2004-04-23 | 2009-02-17 | Acoustic Technologies, Inc. | Noise suppression based on bark band wiener filtering and modified doblinger noise estimate |
US20060206320A1 (en) | 2005-03-14 | 2006-09-14 | Li Qi P | Apparatus and method for noise reduction and speech enhancement with microphones and loudspeakers |
DK1760696T3 (en) * | 2005-09-03 | 2016-05-02 | Gn Resound As | Method and apparatus for improved estimation of non-stationary noise to highlight speech |
-
2008
- 2008-09-10 US US12/677,086 patent/US8583426B2/en active Active
- 2008-09-10 WO PCT/US2008/010590 patent/WO2009035614A1/en active Application Filing
- 2008-09-10 RU RU2010114272/08A patent/RU2469423C2/ru active
- 2008-09-10 JP JP2010524854A patent/JP5302968B2/ja active Active
- 2008-09-10 CN CN2008801065345A patent/CN101802910B/zh active Active
- 2008-09-10 EP EP08830357.3A patent/EP2191466B1/en active Active
- 2008-09-10 BR BRPI0816792A patent/BRPI0816792B1/pt active IP Right Grant
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06208395A (ja) * | 1992-10-30 | 1994-07-26 | Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho | ホルマント検出装置及び音声加工装置 |
JPH10254499A (ja) * | 1997-03-14 | 1998-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 帯域分割型雑音低減方法及び装置 |
JP2002519719A (ja) * | 1998-06-22 | 2002-07-02 | ディーエスピーシー・テクノロジーズ・リミテッド | 重み付け利得平滑化手段を含むノイズサプレッサ |
JP2002169599A (ja) * | 2000-11-30 | 2002-06-14 | Toshiba Corp | ノイズ抑制方法及び電子機器 |
JP2005537702A (ja) * | 2002-07-12 | 2005-12-08 | ヴェーデクス・アクティーセルスカプ | 補聴器および音声の明瞭さを高める方法 |
JP2005037650A (ja) * | 2003-07-14 | 2005-02-10 | Asahi Kasei Corp | 雑音低減装置 |
Also Published As
Publication number | Publication date |
---|---|
RU2010114272A (ru) | 2011-10-20 |
EP2191466B1 (en) | 2013-05-22 |
US20100211388A1 (en) | 2010-08-19 |
US8583426B2 (en) | 2013-11-12 |
EP2191466A1 (en) | 2010-06-02 |
BRPI0816792B1 (pt) | 2020-01-28 |
CN101802910B (zh) | 2012-11-07 |
RU2469423C2 (ru) | 2012-12-10 |
JP5302968B2 (ja) | 2013-10-02 |
WO2009035614A1 (en) | 2009-03-19 |
BRPI0816792A2 (pt) | 2015-09-01 |
CN101802910A (zh) | 2010-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5302968B2 (ja) | 音声明瞭化を伴うスピーチ改善 | |
JP4970596B2 (ja) | 雑音レベル推定値の調節を備えたスピーチ強調 | |
JP5260561B2 (ja) | 知覚モデルを使用した音声の強調 | |
JP5666444B2 (ja) | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 | |
RU2329550C2 (ru) | Способ и устройство для улучшения речевого сигнала в присутствии фонового шума | |
KR101120679B1 (ko) | 이득-제한된 잡음 억제 | |
US9805738B2 (en) | Formant dependent speech signal enhancement | |
WO2008101324A1 (en) | High-frequency bandwidth extension in the time domain | |
Shao et al. | A generalized time–frequency subtraction method for robust speech enhancement based on wavelet filter banks modeling of human auditory system | |
Meshram et al. | Denoising of speech signal by classification into voiced, unvoiced and silence regoin | |
Abd Almisreb et al. | Noise reduction approach for Arabic phonemes articulated by Malay speakers | |
EP2760022B1 (en) | Audio bandwidth dependent noise suppression | |
Krishnamoorthy et al. | Processing noisy speech for enhancement | |
CN116057626A (zh) | 使用机器学习的降噪 | |
Narayanam | Perceptual Wavelet packet transform based Wavelet Filter Banks Modeling of Human Auditory system for improving the intelligibility of voiced and unvoiced speech: A Case Study of a system development | |
Keshwani | Wavelet-based speech enhancement system using smart thresholding | |
Shao et al. | A generalized time–frequency subtraction method for | |
Harvilla | Compensation for Nonlinear Distortion in Noise for Robust Speech Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20111025 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120123 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120517 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120529 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120829 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120905 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121019 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130621 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5302968 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |