RU2009135829A - Повышение разборчивости речи в звукозаписи развлекательных программ - Google Patents
Повышение разборчивости речи в звукозаписи развлекательных программ Download PDFInfo
- Publication number
- RU2009135829A RU2009135829A RU2009135829/09A RU2009135829A RU2009135829A RU 2009135829 A RU2009135829 A RU 2009135829A RU 2009135829/09 A RU2009135829/09 A RU 2009135829/09A RU 2009135829 A RU2009135829 A RU 2009135829A RU 2009135829 A RU2009135829 A RU 2009135829A
- Authority
- RU
- Russia
- Prior art keywords
- speech
- sound recording
- level
- entertainment
- recording
- Prior art date
Links
- 230000002708 enhancing effect Effects 0.000 title 1
- 238000000034 method Methods 0.000 claims abstract 34
- 230000009471 action Effects 0.000 claims abstract 7
- 230000004044 response Effects 0.000 claims abstract 7
- 230000003044 adaptive effect Effects 0.000 claims abstract 6
- 230000015572 biosynthetic process Effects 0.000 claims abstract 3
- 238000012512 characterization method Methods 0.000 claims abstract 3
- 230000008569 process Effects 0.000 claims abstract 2
- 230000010349 pulsation Effects 0.000 claims abstract 2
- 230000007774 longterm Effects 0.000 claims 6
- 238000004590 computer program Methods 0.000 claims 4
- 230000006835 compression Effects 0.000 claims 2
- 238000007906 compression Methods 0.000 claims 2
- 230000006870 function Effects 0.000 claims 2
- 230000009467 reduction Effects 0.000 claims 2
- 230000003595 spectral effect Effects 0.000 claims 2
- 230000002123 temporal effect Effects 0.000 claims 2
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
- G10L2025/932—Decision in previous or following frames
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
- G10L2025/937—Signal energy in various frequency bands
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Television Receiver Circuits (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
1. Способ повышения разборчивости речи в звукозаписи развлекательных программ, содержащий этапы, на которых ! обрабатывают в ответ на одно или более управляющих воздействий звукозапись развлекательных программ для улучшения ясности и разборчивости участков речи в звукозаписи развлекательных программ, при этом обработка включает в себя этапы, на которых ! изменяют уровень звукозаписи развлекательных программ в каждой из множества полос частот в соответствии с характеристикой коэффициента усиления, которая соотносит уровень сигнала полосы с коэффициентом усиления, и ! формируют управляющий сигнал для изменения характеристики коэффициента усиления в каждой полосе частот, при этом формирование включает в себя этапы, на которых ! характеризуют отрезки времени звукозаписи развлекательных программ (a) как речевые или неречевые, либо (b) как вероятно являющиеся речевыми или неречевыми, при этом определение производится в одной широкой полосе частот, ! получают в каждой из упомянутого множества полос частот меру пульсаций уровней речи, ! отслеживают в каждой из множества полос частот минимум уровня звукозаписи в полосе, при этом время отклика отслеживания является реагирующим на меру пульсаций уровней речи, ! преобразуют отслеживаемые минимумы в каждой полосе в соответствующий адаптивный пороговый уровень, и ! смещают каждый соответствующий адаптивный пороговый уровень по результату характеризации для формирования управляющего сигнала для каждой полосы частот. ! 2. Способ повышения разборчивости речи в звукозаписи развлекательных программ, содержащий этапы, на которых ! обрабатывают в ответ на один или
Claims (32)
1. Способ повышения разборчивости речи в звукозаписи развлекательных программ, содержащий этапы, на которых
обрабатывают в ответ на одно или более управляющих воздействий звукозапись развлекательных программ для улучшения ясности и разборчивости участков речи в звукозаписи развлекательных программ, при этом обработка включает в себя этапы, на которых
изменяют уровень звукозаписи развлекательных программ в каждой из множества полос частот в соответствии с характеристикой коэффициента усиления, которая соотносит уровень сигнала полосы с коэффициентом усиления, и
формируют управляющий сигнал для изменения характеристики коэффициента усиления в каждой полосе частот, при этом формирование включает в себя этапы, на которых
характеризуют отрезки времени звукозаписи развлекательных программ (a) как речевые или неречевые, либо (b) как вероятно являющиеся речевыми или неречевыми, при этом определение производится в одной широкой полосе частот,
получают в каждой из упомянутого множества полос частот меру пульсаций уровней речи,
отслеживают в каждой из множества полос частот минимум уровня звукозаписи в полосе, при этом время отклика отслеживания является реагирующим на меру пульсаций уровней речи,
преобразуют отслеживаемые минимумы в каждой полосе в соответствующий адаптивный пороговый уровень, и
смещают каждый соответствующий адаптивный пороговый уровень по результату характеризации для формирования управляющего сигнала для каждой полосы частот.
2. Способ повышения разборчивости речи в звукозаписи развлекательных программ, содержащий этапы, на которых
обрабатывают в ответ на один или более управляющих сигналов звукозапись развлекательной программы для улучшения ясности и разборчивости участков речи звукозаписи развлекательных программ, при этом обработка включает в себя этапы, на которых
изменяют уровень звукозаписи развлекательной программы в каждой из множества полос частот в соответствии с характеристикой коэффициента усиления, которая соотносит уровень сигнала полосы с коэффициентом усиления, и
формируют управляющий сигнал для изменения характеристики коэффициента усиления в каждой полосе частот, при этом формирование включает в себя этапы, на которых
принимают характеризацию отрезков времени звукозаписи развлекательных программ как (a) речевые или неречевые, либо (b) как вероятно являющиеся речевыми или неречевыми, при этом характеризации относятся к одной широкой полосе частот,
получают в каждой из множества полос частот меру пульсаций уровней речи,
отслеживают в каждой из множества полос частот минимум уровня звукозаписи в полосе, при этом время отклика отслеживания является реагирующим на меру пульсаций уровней речи,
преобразуют отслеживаемые минимумы в каждой полосе в соответствующий адаптивный пороговый уровень, и
смещают каждый соответствующий адаптивный пороговый уровень по результату определения для выработки управляющего воздействия для каждой полосы.
3. Способ по п.1, в котором имеют доступ к временной эволюции звукозаписи развлекательных программ до и после момента обработки и при формировании управляющего воздействия реагируют на, по меньшей мере, некоторую звукозапись после момента обработки.
4. Способ по п.1, в котором обработку осуществляют в соответствии с одним или более параметров обработки.
5. Способ по п.4, в котором настройка одного или более параметров зависит от звукозаписи развлекательной программы, так чтобы показатель разборчивости речи обработанной звукозаписи был максимизирован или форсирован выше требуемого порогового уровня.
6. Способ по п.5, в котором звукозаписи развлекательных программ содержат многочисленные каналы звукозаписи, в которых один канал является главным образом речевым, а один или более других каналов являются главным образом неречевыми, при этом показатель разборчивости речи основан на уровне речевого канала и уровне в одном или более других каналов.
7. Способ по п.6, в котором показатель разборчивости речи также основан на уровне шума в среде прослушивания, в которой воспроизводится обработанная звукозапись.
8. Способ по п.4, в котором настройка одного или более параметров зависит от одного или более долгосрочных дескрипторов звукозаписи развлекательных программ.
9. Способ по п.8, в котором долгосрочный дескриптор является средним уровнем диалога звукозаписи развлекательной программы.
10. Способ по п.8, в котором долгосрочный дескриптор является оценкой обработки, уже примененной к звукозаписи развлекательной программы.
11. Способ по п.4, в котором настраивают один или более параметров в соответствии с предписывающей формулой, при этом предписывающая формула соотносит остроту слуха слушателя или группы слушателей с одним или более параметров.
12. Способ по п.4, в котором настраивают один или более параметров в соответствии с предпочтениями одного или более слушателей.
13. Способ по п.1, в котором при обработке обеспечивают управление динамическим диапазоном, динамическое выравнивание, спектральное уточнение, смещение частот, выделение речи, шумоподавление или другие действия по повышению разборчивости речи.
14. Способ по п.13, в котором управление динамическим диапазоном обеспечивают функцией сжатия/расширения динамического диапазона.
15. Устройство, содержащее средство для выполнения способа по п.1.
16. Компьютерная программа, сохраняемая на машиночитаемом носителе, для побуждения компьютера выполнять способ по п.1.
17. Машиночитаемый носитель, сохраняющий компьютерную программу, выполняющую способ по п.1.
18. Способ по п.2, в котором имеют доступ к временной эволюции звукозаписи развлекательных программ до и после момента обработки и при формировании управляющего воздействия реагируют на, по меньшей мере, некоторую звукозапись после момента обработки.
19. Способ по п.2, в котором обработку осуществляют в соответствии с одним или более параметров обработки.
20. Способ по п.19, в котором настройка одного или более параметров зависит от звукозаписи развлекательной программы, так чтобы показатель разборчивости речи обработанной звукозаписи был максимизирован или форсирован выше требуемого порогового уровня.
21. Способ по п.20, в котором звукозаписи развлекательных программ содержат многочисленные каналы звукозаписи, в которых один канал является главным образом речевым, а один или более других каналов являются главным образом неречевыми, при этом показатель разборчивости речи основан на уровне речевого канала и уровне в одном или более других каналов.
22. Способ по п.21, в котором показатель разборчивости речи также основан на уровне шума в среде прослушивания, в которой воспроизводится обработанная звукозапись.
23. Способ по п.19, в котором настройка одного или более параметров зависит от одного или более долгосрочных дескрипторов звукозаписи развлекательных программ.
24. Способ по п.23, в котором долгосрочный дескриптор является средним уровнем диалога звукозаписи развлекательной программы.
25. Способ по п.23, в котором долгосрочный дескриптор является оценкой обработки, уже примененной к звукозаписи развлекательной программы.
26. Способ по п.19, в котором настраивают один или более параметров в соответствии с предписывающей формулой, при этом предписывающая формула соотносит остроту слуха слушателя или группы слушателей с одним или более параметров.
27. Способ по п.19, в котором настраивают один или более параметров в соответствии с предпочтениями одного или более слушателей.
28. Способ по п.2, в котором при обработке обеспечивают управление динамическим диапазоном, динамическое выравнивание, спектральное уточнение, смещение частот, выделение речи, шумоподавление или другие действия по повышению разборчивости речи.
29. Способ по п.28, в котором управление динамическим диапазоном обеспечивают функцией сжатия/расширения динамического диапазона.
30. Устройство, содержащее средство для выполнения способа по п.2.
31. Компьютерная программа, сохраняемая на машиночитаемом носителе, для побуждения компьютера выполнять способ по п.2.
32. Машиночитаемый носитель, сохраняющий компьютерную программу, выполняющую способ по п.2.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US90339207P | 2007-02-26 | 2007-02-26 | |
US60/903,392 | 2007-02-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2009135829A true RU2009135829A (ru) | 2011-04-10 |
RU2440627C2 RU2440627C2 (ru) | 2012-01-20 |
Family
ID=39721787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2009135829/08A RU2440627C2 (ru) | 2007-02-26 | 2008-02-20 | Повышение разборчивости речи в звукозаписи развлекательных программ |
Country Status (8)
Country | Link |
---|---|
US (8) | US8195454B2 (ru) |
EP (1) | EP2118885B1 (ru) |
JP (2) | JP5530720B2 (ru) |
CN (1) | CN101647059B (ru) |
BR (1) | BRPI0807703B1 (ru) |
ES (1) | ES2391228T3 (ru) |
RU (1) | RU2440627C2 (ru) |
WO (1) | WO2008106036A2 (ru) |
Families Citing this family (84)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100789084B1 (ko) * | 2006-11-21 | 2007-12-26 | 한양대학교 산학협력단 | 웨이블릿 패킷 영역에서 비선형 구조의 과중 이득에 의한음질 개선 방법 |
EP2118885B1 (en) | 2007-02-26 | 2012-07-11 | Dolby Laboratories Licensing Corporation | Speech enhancement in entertainment audio |
US8315398B2 (en) | 2007-12-21 | 2012-11-20 | Dts Llc | System for adjusting perceived loudness of audio signals |
US8639519B2 (en) * | 2008-04-09 | 2014-01-28 | Motorola Mobility Llc | Method and apparatus for selective signal coding based on core encoder performance |
CA2720636C (en) * | 2008-04-18 | 2014-02-18 | Dolby Laboratories Licensing Corporation | Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience |
US8712771B2 (en) * | 2009-07-02 | 2014-04-29 | Alon Konchitsky | Automated difference recognition between speaking sounds and music |
DE112009005215T8 (de) * | 2009-08-04 | 2013-01-03 | Nokia Corp. | Verfahren und Vorrichtung zur Audiosignalklassifizierung |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
WO2011044153A1 (en) | 2009-10-09 | 2011-04-14 | Dolby Laboratories Licensing Corporation | Automatic generation of metadata for audio dominance effects |
JP5793500B2 (ja) | 2009-10-19 | 2015-10-14 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 音声区間検出器及び方法 |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
EP2352312B1 (en) * | 2009-12-03 | 2013-07-31 | Oticon A/S | A method for dynamic suppression of surrounding acoustic noise when listening to electrical inputs |
TWI459828B (zh) * | 2010-03-08 | 2014-11-01 | Dolby Lab Licensing Corp | 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統 |
CN102812636B (zh) | 2010-03-18 | 2016-06-08 | 杜比实验室特许公司 | 用于具有音质保护的失真减少多频带压缩器的技术 |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
JP5834449B2 (ja) * | 2010-04-22 | 2015-12-24 | 富士通株式会社 | 発話状態検出装置、発話状態検出プログラムおよび発話状態検出方法 |
US8781137B1 (en) | 2010-04-27 | 2014-07-15 | Audience, Inc. | Wind noise detection and suppression |
US8447596B2 (en) | 2010-07-12 | 2013-05-21 | Audience, Inc. | Monaural noise suppression based on computational auditory scene analysis |
JP5652642B2 (ja) * | 2010-08-02 | 2015-01-14 | ソニー株式会社 | データ生成装置およびデータ生成方法、データ処理装置およびデータ処理方法 |
KR101726738B1 (ko) * | 2010-12-01 | 2017-04-13 | 삼성전자주식회사 | 음성처리장치 및 그 방법 |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
KR101520212B1 (ko) | 2011-04-15 | 2015-05-13 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 낮은 정확성으로 재구성된 신호 영역의 감쇠를 위한 방법 및 디코더 |
US8918197B2 (en) | 2012-06-13 | 2014-12-23 | Avraham Suhami | Audio communication networks |
FR2981782B1 (fr) * | 2011-10-20 | 2015-12-25 | Esii | Procede d’envoi et de restitution sonore d’informations audio |
JP5565405B2 (ja) * | 2011-12-21 | 2014-08-06 | ヤマハ株式会社 | 音響処理装置および音響処理方法 |
US20130253923A1 (en) * | 2012-03-21 | 2013-09-26 | Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry | Multichannel enhancement system for preserving spatial cues |
CN103325386B (zh) * | 2012-03-23 | 2016-12-21 | 杜比实验室特许公司 | 用于信号传输控制的方法和系统 |
US9633667B2 (en) * | 2012-04-05 | 2017-04-25 | Nokia Technologies Oy | Adaptive audio signal filtering |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
US8843367B2 (en) * | 2012-05-04 | 2014-09-23 | 8758271 Canada Inc. | Adaptive equalization system |
US9460729B2 (en) | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
JP2014106247A (ja) * | 2012-11-22 | 2014-06-09 | Fujitsu Ltd | 信号処理装置、信号処理方法および信号処理プログラム |
JP6162254B2 (ja) * | 2013-01-08 | 2017-07-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 背景ノイズにおけるスピーチ了解度を増幅及び圧縮により向上させる装置と方法 |
WO2014108393A1 (en) * | 2013-01-08 | 2014-07-17 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
CN103079258A (zh) * | 2013-01-09 | 2013-05-01 | 广东欧珀移动通信有限公司 | 一种提高语音识别准确性的方法及移动智能终端 |
US9933990B1 (en) | 2013-03-15 | 2018-04-03 | Sonitum Inc. | Topological mapping of control parameters |
US10506067B2 (en) | 2013-03-15 | 2019-12-10 | Sonitum Inc. | Dynamic personalization of a communication session in heterogeneous environments |
CN104078050A (zh) | 2013-03-26 | 2014-10-01 | 杜比实验室特许公司 | 用于音频分类和音频处理的设备和方法 |
CN104079247B (zh) | 2013-03-26 | 2018-02-09 | 杜比实验室特许公司 | 均衡器控制器和控制方法以及音频再现设备 |
CN104080024B (zh) | 2013-03-26 | 2019-02-19 | 杜比实验室特许公司 | 音量校平器控制器和控制方法以及音频分类器 |
WO2014179021A1 (en) | 2013-04-29 | 2014-11-06 | Dolby Laboratories Licensing Corporation | Frequency band compression with dynamic thresholds |
TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
US9530422B2 (en) | 2013-06-27 | 2016-12-27 | Dolby Laboratories Licensing Corporation | Bitstream syntax for spatial voice coding |
US9031838B1 (en) | 2013-07-15 | 2015-05-12 | Vail Systems, Inc. | Method and apparatus for voice clarity and speech intelligibility detection and correction |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
CN103413553B (zh) * | 2013-08-20 | 2016-03-09 | 腾讯科技(深圳)有限公司 | 音频编码方法、音频解码方法、编码端、解码端和系统 |
RU2639952C2 (ru) * | 2013-08-28 | 2017-12-25 | Долби Лабораторис Лайсэнзин Корпорейшн | Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием |
CN105814630B (zh) * | 2013-10-22 | 2020-04-28 | 弗劳恩霍夫应用研究促进协会 | 用于音频设备的组合动态范围压缩和引导截断防止的构思 |
JP6361271B2 (ja) * | 2014-05-09 | 2018-07-25 | 富士通株式会社 | 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム |
CN105336341A (zh) | 2014-05-26 | 2016-02-17 | 杜比实验室特许公司 | 增强音频信号中的语音内容的可理解性 |
DE112015004185T5 (de) | 2014-09-12 | 2017-06-01 | Knowles Electronics, Llc | Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten |
WO2016050740A1 (en) | 2014-10-01 | 2016-04-07 | Dolby International Ab | Efficient drc profile transmission |
KR102482162B1 (ko) | 2014-10-01 | 2022-12-29 | 돌비 인터네셔널 에이비 | 오디오 인코더 및 디코더 |
US10163453B2 (en) | 2014-10-24 | 2018-12-25 | Staton Techiya, Llc | Robust voice activity detector system for use with an earphone |
CN104409081B (zh) * | 2014-11-25 | 2017-12-22 | 广州酷狗计算机科技有限公司 | 语音信号处理方法和装置 |
JP6501259B2 (ja) * | 2015-08-04 | 2019-04-17 | 本田技研工業株式会社 | 音声処理装置及び音声処理方法 |
EP3203472A1 (en) * | 2016-02-08 | 2017-08-09 | Oticon A/s | A monaural speech intelligibility predictor unit |
US9820042B1 (en) | 2016-05-02 | 2017-11-14 | Knowles Electronics, Llc | Stereo separation and directional suppression with omni-directional microphones |
RU2620569C1 (ru) * | 2016-05-17 | 2017-05-26 | Николай Александрович Иванов | Способ измерения разборчивости речи |
RU2676022C1 (ru) * | 2016-07-13 | 2018-12-25 | Общество с ограниченной ответственностью "Речевая аппаратура "Унитон" | Способ повышения разборчивости речи |
US10362412B2 (en) * | 2016-12-22 | 2019-07-23 | Oticon A/S | Hearing device comprising a dynamic compressive amplification system and a method of operating a hearing device |
WO2018152034A1 (en) * | 2017-02-14 | 2018-08-23 | Knowles Electronics, Llc | Voice activity detector and methods therefor |
CN110998724B (zh) | 2017-08-01 | 2021-05-21 | 杜比实验室特许公司 | 基于位置元数据的音频对象分类 |
WO2019027812A1 (en) | 2017-08-01 | 2019-02-07 | Dolby Laboratories Licensing Corporation | CLASSIFICATION OF AUDIO OBJECT BASED ON LOCATION METADATA |
EP3477641A1 (en) * | 2017-10-26 | 2019-05-01 | Vestel Elektronik Sanayi ve Ticaret A.S. | Consumer electronics device and method of operation |
US11894006B2 (en) * | 2018-07-25 | 2024-02-06 | Dolby Laboratories Licensing Corporation | Compressor target curve to avoid boosting noise |
US11335357B2 (en) * | 2018-08-14 | 2022-05-17 | Bose Corporation | Playback enhancement in audio systems |
CN110875059B (zh) * | 2018-08-31 | 2022-08-05 | 深圳市优必选科技有限公司 | 收音结束的判断方法、装置以及储存装置 |
US10795638B2 (en) | 2018-10-19 | 2020-10-06 | Bose Corporation | Conversation assistance audio device personalization |
US11164592B1 (en) * | 2019-05-09 | 2021-11-02 | Amazon Technologies, Inc. | Responsive automatic gain control |
US11146607B1 (en) * | 2019-05-31 | 2021-10-12 | Dialpad, Inc. | Smart noise cancellation |
WO2021041568A1 (en) * | 2019-08-27 | 2021-03-04 | Dolby Laboratories Licensing Corporation | Dialog enhancement using adaptive smoothing |
RU2726326C1 (ru) * | 2019-11-26 | 2020-07-13 | Акционерное общество "ЗАСЛОН" | Способ повышения разборчивости речи пожилыми людьми при приеме звуковых программ на наушники |
EP4073792A1 (en) * | 2019-12-09 | 2022-10-19 | Dolby Laboratories Licensing Corp. | Adjusting audio and non-audio features based on noise metrics and speech intelligibility metrics |
WO2021183916A1 (en) * | 2020-03-13 | 2021-09-16 | Immersion Networks, Inc. | Loudness equalization system |
US20230162754A1 (en) * | 2020-03-27 | 2023-05-25 | Dolby Laboratories Licensing Corporation | Automatic Leveling of Speech Content |
JP2023530225A (ja) | 2020-05-29 | 2023-07-14 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 初期オーディオ信号を処理するための方法および装置 |
US11790931B2 (en) | 2020-10-27 | 2023-10-17 | Ambiq Micro, Inc. | Voice activity detection using zero crossing detection |
TW202226226A (zh) * | 2020-10-27 | 2022-07-01 | 美商恩倍科微電子股份有限公司 | 具低複雜度語音活動檢測演算之設備及方法 |
US11595730B2 (en) * | 2021-03-08 | 2023-02-28 | Tencent America LLC | Signaling loudness adjustment for an audio scene |
CN113113049A (zh) * | 2021-03-18 | 2021-07-13 | 西北工业大学 | 一种联合语音增强的语音活动检测方法 |
EP4134954B1 (de) * | 2021-08-09 | 2023-08-02 | OPTImic GmbH | Verfahren und vorrichtung zur audiosignalverbesserung |
KR102628500B1 (ko) * | 2021-09-29 | 2024-01-24 | 주식회사 케이티 | 대면녹취단말장치 및 이를 이용한 대면녹취방법 |
Family Cites Families (125)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3803357A (en) * | 1971-06-30 | 1974-04-09 | J Sacks | Noise filter |
US4661981A (en) | 1983-01-03 | 1987-04-28 | Henrickson Larry K | Method and means for processing speech |
DE3370423D1 (en) * | 1983-06-07 | 1987-04-23 | Ibm | Process for activity detection in a voice transmission system |
US4628529A (en) | 1985-07-01 | 1986-12-09 | Motorola, Inc. | Noise suppression system |
US4912767A (en) | 1988-03-14 | 1990-03-27 | International Business Machines Corporation | Distributed noise cancellation system |
CN1062963C (zh) | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
US5632005A (en) | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
SG49883A1 (en) | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
EP0810599B1 (en) | 1991-05-29 | 2003-11-26 | Pacific Microsonics, Inc. | Improvements in signal encode/decode systems |
US5388185A (en) | 1991-09-30 | 1995-02-07 | U S West Advanced Technologies, Inc. | System for adaptive processing of telephone voice signals |
US5263091A (en) * | 1992-03-10 | 1993-11-16 | Waller Jr James K | Intelligent automatic threshold circuit |
US5251263A (en) | 1992-05-22 | 1993-10-05 | Andrea Electronics Corporation | Adaptive noise cancellation and speech enhancement system and apparatus therefor |
US5734789A (en) | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5425106A (en) | 1993-06-25 | 1995-06-13 | Hda Entertainment, Inc. | Integrated circuit for audio enhancement system |
US5400405A (en) | 1993-07-02 | 1995-03-21 | Harman Electronics, Inc. | Audio image enhancement system |
US5471527A (en) | 1993-12-02 | 1995-11-28 | Dsc Communications Corporation | Voice enhancement system and method |
US5539806A (en) | 1994-09-23 | 1996-07-23 | At&T Corp. | Method for customer selection of telephone sound enhancement |
US5623491A (en) | 1995-03-21 | 1997-04-22 | Dsc Communications Corporation | Device for adapting narrowband voice traffic of a local access network to allow transmission over a broadband asynchronous transfer mode network |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
US5812969A (en) * | 1995-04-06 | 1998-09-22 | Adaptec, Inc. | Process for balancing the loudness of digitally sampled audio waveforms |
US6263307B1 (en) * | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
US5661808A (en) | 1995-04-27 | 1997-08-26 | Srs Labs, Inc. | Stereo enhancement system |
JP3416331B2 (ja) | 1995-04-28 | 2003-06-16 | 松下電器産業株式会社 | 音声復号化装置 |
US5774557A (en) | 1995-07-24 | 1998-06-30 | Slater; Robert Winston | Autotracking microphone squelch for aircraft intercom systems |
FI102337B1 (fi) * | 1995-09-13 | 1998-11-13 | Nokia Mobile Phones Ltd | Menetelmä ja piirijärjestely audiosignaalin käsittelemiseksi |
FI100840B (fi) | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
DE19547093A1 (de) | 1995-12-16 | 1997-06-19 | Nokia Deutschland Gmbh | Schaltungsanordnung zur Verbesserung des Störabstandes |
US5689615A (en) | 1996-01-22 | 1997-11-18 | Rockwell International Corporation | Usage of voice activity detection for efficient coding of speech |
US5884255A (en) * | 1996-07-16 | 1999-03-16 | Coherent Communications Systems Corp. | Speech detection system employing multiple determinants |
US6570991B1 (en) * | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
DE19703228B4 (de) * | 1997-01-29 | 2006-08-03 | Siemens Audiologische Technik Gmbh | Verfahren zur Verstärkung von Eingangssignalen eines Hörgerätes sowie Schaltung zur Durchführung des Verfahrens |
JPH10257583A (ja) * | 1997-03-06 | 1998-09-25 | Asahi Chem Ind Co Ltd | 音声処理装置およびその音声処理方法 |
US5907822A (en) | 1997-04-04 | 1999-05-25 | Lincom Corporation | Loss tolerant speech decoder for telecommunications |
US6208637B1 (en) | 1997-04-14 | 2001-03-27 | Next Level Communications, L.L.P. | Method and apparatus for the generation of analog telephone signals in digital subscriber line access systems |
FR2768547B1 (fr) | 1997-09-18 | 1999-11-19 | Matra Communication | Procede de debruitage d'un signal de parole numerique |
US6169971B1 (en) * | 1997-12-03 | 2001-01-02 | Glenayre Electronics, Inc. | Method to suppress noise in digital voice processing |
US6104994A (en) | 1998-01-13 | 2000-08-15 | Conexant Systems, Inc. | Method for speech coding under background noise conditions |
JP2003524906A (ja) | 1998-04-14 | 2003-08-19 | ヒアリング エンハンスメント カンパニー,リミティド ライアビリティー カンパニー | 聴覚障害および非聴覚障害リスナーの好みに合わせてユーザ調整能力を提供する方法および装置 |
US6122611A (en) | 1998-05-11 | 2000-09-19 | Conexant Systems, Inc. | Adding noise during LPC coded voice activity periods to improve the quality of coded speech coexisting with background noise |
US6453289B1 (en) * | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
US6223154B1 (en) | 1998-07-31 | 2001-04-24 | Motorola, Inc. | Using vocoded parameters in a staggered average to provide speakerphone operation based on enhanced speech activity thresholds |
US6188981B1 (en) | 1998-09-18 | 2001-02-13 | Conexant Systems, Inc. | Method and apparatus for detecting voice activity in a speech signal |
US6061431A (en) | 1998-10-09 | 2000-05-09 | Cisco Technology, Inc. | Method for hearing loss compensation in telephony systems based on telephone number resolution |
US6993480B1 (en) | 1998-11-03 | 2006-01-31 | Srs Labs, Inc. | Voice intelligibility enhancement system |
US6256606B1 (en) | 1998-11-30 | 2001-07-03 | Conexant Systems, Inc. | Silence description coding for multi-rate speech codecs |
US6208618B1 (en) | 1998-12-04 | 2001-03-27 | Tellabs Operations, Inc. | Method and apparatus for replacing lost PSTN data in a packet network |
US6289309B1 (en) | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
US6922669B2 (en) | 1998-12-29 | 2005-07-26 | Koninklijke Philips Electronics N.V. | Knowledge-based strategies applied to N-best lists in automatic speech recognition systems |
US6246345B1 (en) * | 1999-04-16 | 2001-06-12 | Dolby Laboratories Licensing Corporation | Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding |
US6618701B2 (en) * | 1999-04-19 | 2003-09-09 | Motorola, Inc. | Method and system for noise suppression using external voice activity detection |
US6633841B1 (en) | 1999-07-29 | 2003-10-14 | Mindspeed Technologies, Inc. | Voice activity detection speech coding to accommodate music signals |
US6910011B1 (en) * | 1999-08-16 | 2005-06-21 | Haman Becker Automotive Systems - Wavemakers, Inc. | Noisy acoustic signal enhancement |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
US6813490B1 (en) * | 1999-12-17 | 2004-11-02 | Nokia Corporation | Mobile station with audio signal adaptation to hearing characteristics of the user |
US6449593B1 (en) | 2000-01-13 | 2002-09-10 | Nokia Mobile Phones Ltd. | Method and system for tracking human speakers |
US6351733B1 (en) * | 2000-03-02 | 2002-02-26 | Hearing Enhancement Company, Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
US7962326B2 (en) | 2000-04-20 | 2011-06-14 | Invention Machine Corporation | Semantic answering system and method |
US20030179888A1 (en) * | 2002-03-05 | 2003-09-25 | Burnett Gregory C. | Voice activity detection (VAD) devices and methods for use with noise suppression systems |
US7246058B2 (en) | 2001-05-30 | 2007-07-17 | Aliph, Inc. | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors |
US6898566B1 (en) * | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
US6862567B1 (en) * | 2000-08-30 | 2005-03-01 | Mindspeed Technologies, Inc. | Noise suppression in the frequency domain by adjusting gain according to voicing parameters |
US7020605B2 (en) * | 2000-09-15 | 2006-03-28 | Mindspeed Technologies, Inc. | Speech coding system with time-domain noise attenuation |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
JP2002169599A (ja) * | 2000-11-30 | 2002-06-14 | Toshiba Corp | ノイズ抑制方法及び電子機器 |
US6631139B2 (en) | 2001-01-31 | 2003-10-07 | Qualcomm Incorporated | Method and apparatus for interoperability between voice transmission systems during speech inactivity |
US6694293B2 (en) * | 2001-02-13 | 2004-02-17 | Mindspeed Technologies, Inc. | Speech coding system with a music classifier |
US20030028386A1 (en) | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
ATE318062T1 (de) | 2001-04-18 | 2006-03-15 | Gennum Corp | Mehrkanal hörgerät mit übertragungsmöglichkeiten zwischen den kanälen |
CA2354755A1 (en) * | 2001-08-07 | 2003-02-07 | Dspfactory Ltd. | Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank |
DE60222445T2 (de) * | 2001-08-17 | 2008-06-12 | Broadcom Corp., Irvine | Verfahren zum verbergen von bitfehlern für die sprachcodierung |
US20030046069A1 (en) * | 2001-08-28 | 2003-03-06 | Vergin Julien Rivarol | Noise reduction system and method |
CN1552171A (zh) * | 2001-09-06 | 2004-12-01 | �ʼҷ����ֵ��ӹɷ�����˾ | 音频再现设备 |
US6937980B2 (en) | 2001-10-02 | 2005-08-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech recognition using microphone antenna array |
US6785645B2 (en) * | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US7328151B2 (en) | 2002-03-22 | 2008-02-05 | Sound Id | Audio decoder with dynamic adjustment of signal modification |
US7167568B2 (en) | 2002-05-02 | 2007-01-23 | Microsoft Corporation | Microphone array signal enhancement |
US7072477B1 (en) * | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
ATE375072T1 (de) * | 2002-07-12 | 2007-10-15 | Widex As | Hörgerät und methode für das erhöhen von redeverständlichkeit |
US7454331B2 (en) | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US7283956B2 (en) * | 2002-09-18 | 2007-10-16 | Motorola, Inc. | Noise suppression |
WO2004034379A2 (en) | 2002-10-11 | 2004-04-22 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US7174022B1 (en) * | 2002-11-15 | 2007-02-06 | Fortemedia, Inc. | Small array microphone for beam-forming and noise suppression |
DE10308483A1 (de) * | 2003-02-26 | 2004-09-09 | Siemens Audiologische Technik Gmbh | Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät |
US7343284B1 (en) * | 2003-07-17 | 2008-03-11 | Nortel Networks Limited | Method and system for speech processing for enhancement and detection |
US7398207B2 (en) * | 2003-08-25 | 2008-07-08 | Time Warner Interactive Video Group, Inc. | Methods and systems for determining audio loudness levels in programming |
US7099821B2 (en) * | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
SG119199A1 (en) * | 2003-09-30 | 2006-02-28 | Stmicroelectronics Asia Pacfic | Voice activity detector |
US7539614B2 (en) * | 2003-11-14 | 2009-05-26 | Nxp B.V. | System and method for audio signal processing using different gain factors for voiced and unvoiced phonemes |
US7483831B2 (en) | 2003-11-21 | 2009-01-27 | Articulation Incorporated | Methods and apparatus for maximizing speech intelligibility in quiet or noisy backgrounds |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
KR101079066B1 (ko) | 2004-03-01 | 2011-11-02 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 멀티채널 오디오 코딩 |
US7492889B2 (en) | 2004-04-23 | 2009-02-17 | Acoustic Technologies, Inc. | Noise suppression based on bark band wiener filtering and modified doblinger noise estimate |
US7451093B2 (en) | 2004-04-29 | 2008-11-11 | Srs Labs, Inc. | Systems and methods of remotely enabling sound enhancement techniques |
US20080144864A1 (en) | 2004-05-25 | 2008-06-19 | Huonlabs Pty Ltd | Audio Apparatus And Method |
US8788265B2 (en) | 2004-05-25 | 2014-07-22 | Nokia Solutions And Networks Oy | System and method for babble noise detection |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
KR100964436B1 (ko) | 2004-08-30 | 2010-06-16 | 퀄컴 인코포레이티드 | V o I P 용 적응성 디-지터 버퍼 |
FI20045315A (fi) | 2004-08-30 | 2006-03-01 | Nokia Corp | Ääniaktiivisuuden havaitseminen äänisignaalissa |
EP1792520A1 (en) | 2004-09-06 | 2007-06-06 | Koninklijke Philips Electronics N.V. | Audio signal enhancement |
US7383179B2 (en) * | 2004-09-28 | 2008-06-03 | Clarity Technologies, Inc. | Method of cascading noise reduction algorithms to avoid speech distortion |
US7949520B2 (en) | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
JP2008519991A (ja) | 2004-11-09 | 2008-06-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声の符号化及び復号化 |
RU2284585C1 (ru) | 2005-02-10 | 2006-09-27 | Владимир Кириллович Железняк | Способ измерения разборчивости речи |
US20060224381A1 (en) | 2005-04-04 | 2006-10-05 | Nokia Corporation | Detecting speech frames belonging to a low energy sequence |
PL1875463T3 (pl) | 2005-04-22 | 2019-03-29 | Qualcomm Incorporated | Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia |
US8566086B2 (en) | 2005-06-28 | 2013-10-22 | Qnx Software Systems Limited | System for adaptive enhancement of speech signals |
US20070078645A1 (en) | 2005-09-30 | 2007-04-05 | Nokia Corporation | Filterbank-based processing of speech signals |
EP1640972A1 (en) | 2005-12-23 | 2006-03-29 | Phonak AG | System and method for separation of a users voice from ambient sound |
US20070147635A1 (en) | 2005-12-23 | 2007-06-28 | Phonak Ag | System and method for separation of a user's voice from ambient sound |
US20070198251A1 (en) | 2006-02-07 | 2007-08-23 | Jaber Associates, L.L.C. | Voice activity detection method and apparatus for voiced/unvoiced decision and pitch estimation in a noisy speech feature extraction |
ES2525427T3 (es) * | 2006-02-10 | 2014-12-22 | Telefonaktiebolaget L M Ericsson (Publ) | Un detector de voz y un método para suprimir sub-bandas en un detector de voz |
ATE527833T1 (de) | 2006-05-04 | 2011-10-15 | Lg Electronics Inc | Verbesserung von stereo-audiosignalen mittels neuabmischung |
US8032370B2 (en) * | 2006-05-09 | 2011-10-04 | Nokia Corporation | Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes |
CN100578622C (zh) * | 2006-05-30 | 2010-01-06 | 北京中星微电子有限公司 | 一种自适应麦克阵列系统及其语音信号处理方法 |
US20080071540A1 (en) | 2006-09-13 | 2008-03-20 | Honda Motor Co., Ltd. | Speech recognition method for robot under motor noise thereof |
DK2127467T3 (en) | 2006-12-18 | 2015-11-30 | Sonova Ag | Active system for hearing protection |
EP2118885B1 (en) * | 2007-02-26 | 2012-07-11 | Dolby Laboratories Licensing Corporation | Speech enhancement in entertainment audio |
US8315398B2 (en) * | 2007-12-21 | 2012-11-20 | Dts Llc | System for adjusting perceived loudness of audio signals |
US8175888B2 (en) | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
CN102044243B (zh) * | 2009-10-15 | 2012-08-29 | 华为技术有限公司 | 语音激活检测方法与装置、编码器 |
EP3726530B1 (en) * | 2010-12-24 | 2024-05-22 | Huawei Technologies Co., Ltd. | Method and apparatus for adaptively detecting a voice activity in an input audio signal |
CN102801861B (zh) * | 2012-08-07 | 2015-08-19 | 歌尔声学股份有限公司 | 一种应用于手机的语音增强方法和装置 |
JP6127143B2 (ja) * | 2012-08-31 | 2017-05-10 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | 音声アクティビティ検出のための方法及び装置 |
US20140126737A1 (en) * | 2012-11-05 | 2014-05-08 | Aliphcom, Inc. | Noise suppressing multi-microphone headset |
-
2008
- 2008-02-20 EP EP08725831A patent/EP2118885B1/en active Active
- 2008-02-20 CN CN2008800099293A patent/CN101647059B/zh active Active
- 2008-02-20 ES ES08725831T patent/ES2391228T3/es active Active
- 2008-02-20 BR BRPI0807703-7A patent/BRPI0807703B1/pt active IP Right Grant
- 2008-02-20 US US12/528,323 patent/US8195454B2/en active Active
- 2008-02-20 JP JP2009551991A patent/JP5530720B2/ja active Active
- 2008-02-20 WO PCT/US2008/002238 patent/WO2008106036A2/en active Application Filing
- 2008-02-20 RU RU2009135829/08A patent/RU2440627C2/ru active
-
2012
- 2012-05-03 US US13/463,600 patent/US8271276B1/en active Active
- 2012-08-10 US US13/571,344 patent/US8972250B2/en active Active
- 2012-12-26 JP JP2012283295A patent/JP2013092792A/ja active Pending
-
2015
- 2015-01-26 US US14/605,003 patent/US9368128B2/en active Active
- 2015-05-01 US US14/701,622 patent/US9418680B2/en active Active
-
2016
- 2016-07-11 US US15/207,155 patent/US9818433B2/en active Active
-
2017
- 2017-10-12 US US15/730,908 patent/US10418052B2/en active Active
-
2019
- 2019-07-19 US US16/516,634 patent/US10586557B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20150243300A1 (en) | 2015-08-27 |
US20100121634A1 (en) | 2010-05-13 |
US20150142424A1 (en) | 2015-05-21 |
BRPI0807703B1 (pt) | 2020-09-24 |
US20190341069A1 (en) | 2019-11-07 |
US8195454B2 (en) | 2012-06-05 |
JP2010519601A (ja) | 2010-06-03 |
US9368128B2 (en) | 2016-06-14 |
US20180033453A1 (en) | 2018-02-01 |
WO2008106036A3 (en) | 2008-11-27 |
CN101647059A (zh) | 2010-02-10 |
US9818433B2 (en) | 2017-11-14 |
JP2013092792A (ja) | 2013-05-16 |
RU2440627C2 (ru) | 2012-01-20 |
US20120310635A1 (en) | 2012-12-06 |
ES2391228T3 (es) | 2012-11-22 |
JP5530720B2 (ja) | 2014-06-25 |
EP2118885B1 (en) | 2012-07-11 |
US20160322068A1 (en) | 2016-11-03 |
BRPI0807703A2 (pt) | 2014-05-27 |
US10418052B2 (en) | 2019-09-17 |
EP2118885A2 (en) | 2009-11-18 |
US8271276B1 (en) | 2012-09-18 |
US9418680B2 (en) | 2016-08-16 |
WO2008106036A2 (en) | 2008-09-04 |
US8972250B2 (en) | 2015-03-03 |
US20120221328A1 (en) | 2012-08-30 |
US10586557B2 (en) | 2020-03-10 |
CN101647059B (zh) | 2012-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2009135829A (ru) | Повышение разборчивости речи в звукозаписи развлекательных программ | |
CN107124149B (zh) | 一种音量调整方法、装置和设备 | |
CN102016994B (zh) | 用于处理音频信号的设备及其方法 | |
CN106612482B (zh) | 一种调整音频参数的方法及移动终端 | |
US20120275625A1 (en) | Signal processing device, method thereof, program, and data recording medium | |
US10861472B2 (en) | Algorithm-based audio optimization method, intelligent terminal and storage device | |
KR20210020751A (ko) | 복수의 소비자 장치에 개인화된 오디오 재생 기능을 제공하기 위한 시스템 및 방법 | |
CN111128167B (zh) | 一种远场语音唤醒方法、装置、电子产品及存储介质 | |
JP2013172454A (ja) | オーディオ明瞭度増大方法および装置とコンピュータ装置 | |
US20100128882A1 (en) | Audio signal processing device and audio signal processing method | |
CN104900238A (zh) | 一种基于感知滤波的音频实时比对方法 | |
CN111554317A (zh) | 一种语音播报方法、设备、计算机存储介质及系统 | |
CN113949955A (zh) | 降噪处理方法、装置、电子设备、耳机及存储介质 | |
CN105869656B (zh) | 一种语音信号清晰度的确定方法及装置 | |
CN103812462A (zh) | 响度控制方法及装置 | |
CN110853606A (zh) | 一种音效配置方法、装置及计算机可读存储介质 | |
JP4922427B2 (ja) | 信号補正装置 | |
CN113259801A (zh) | 一种智能耳机的喇叭降噪方法和相关装置 | |
CN112995854A (zh) | 音频处理方法、装置及电子设备 | |
US11659340B2 (en) | Impulsive noise suppression method and system based on dual-microphone architecture | |
US20190074805A1 (en) | Transient Detection for Speaker Distortion Reduction | |
US9514765B2 (en) | Method for reducing noise and computer program thereof and electronic device | |
CN114067817A (zh) | 低音增强方法、装置、电子设备及存储介质 | |
US10887709B1 (en) | Aligned beam merger | |
KR102497425B1 (ko) | 오디오 신호의 개별 적응을 위한 파라미터들을 설정하기 위한 방법 |