RU2012141463A - Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала - Google Patents
Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала Download PDFInfo
- Publication number
- RU2012141463A RU2012141463A RU2012141463/08A RU2012141463A RU2012141463A RU 2012141463 A RU2012141463 A RU 2012141463A RU 2012141463/08 A RU2012141463/08 A RU 2012141463/08A RU 2012141463 A RU2012141463 A RU 2012141463A RU 2012141463 A RU2012141463 A RU 2012141463A
- Authority
- RU
- Russia
- Prior art keywords
- speech
- channel
- attenuation
- speech channel
- sign
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract 51
- 230000005236 sound signal Effects 0.000 title claims abstract 41
- 230000001629 suppression Effects 0.000 title claims 7
- 238000011524 similarity measure Methods 0.000 claims abstract 11
- 238000001914 filtration Methods 0.000 claims abstract 5
- 238000001228 spectrum Methods 0.000 claims 8
- 230000000052 comparative effect Effects 0.000 claims 5
- 230000002238 attenuated effect Effects 0.000 claims 3
- 230000003313 weakening effect Effects 0.000 claims 2
- 241000283074 Equus asinus Species 0.000 claims 1
- 238000013500 data storage Methods 0.000 claims 1
- 230000003014 reinforcing effect Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/09—Electronic reduction of distortion of stereophonic sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
1. Способ фильтрации многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определяемой сигналом, причем указанный способ отличается тем, что предусматривает следующие этапы:(a) определение по меньшей мере одного значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенный речевым каналом, и относящимся к речи содержанием, определенным по меньшей мере одним неречевым каналом многоканального звукового сигнала; и(b) ослабление по меньшей мере одного неречевого канала многоканального звукового сигнала в ответ по меньшей мере на одно значение управления ослаблением.2. Способ по п. 1, отличающийся тем, что каждое значение управления ослаблением, определенное на этапе (а) служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным одним неречевым каналом звукового сигнала, и этап (b) предусматривает этап ослабления указанного неречевого канала в ответ на указанное значение управления ослаблением.3. Способ по п. 1, отличающийся тем, что этап (а) предусматривает этап получения производного неречевого канала из по меньшей мере одного неречевого канала звукового сигнала, и по меньшей мере одно значение управления ослаблением служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным производным неречевым каналом.4. Способ по п. 3, отличающийся тем, что производный неречевой канал получается путем комбинир�
Claims (66)
1. Способ фильтрации многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определяемой сигналом, причем указанный способ отличается тем, что предусматривает следующие этапы:
(a) определение по меньшей мере одного значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенный речевым каналом, и относящимся к речи содержанием, определенным по меньшей мере одним неречевым каналом многоканального звукового сигнала; и
(b) ослабление по меньшей мере одного неречевого канала многоканального звукового сигнала в ответ по меньшей мере на одно значение управления ослаблением.
2. Способ по п. 1, отличающийся тем, что каждое значение управления ослаблением, определенное на этапе (а) служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным одним неречевым каналом звукового сигнала, и этап (b) предусматривает этап ослабления указанного неречевого канала в ответ на указанное значение управления ослаблением.
3. Способ по п. 1, отличающийся тем, что этап (а) предусматривает этап получения производного неречевого канала из по меньшей мере одного неречевого канала звукового сигнала, и по меньшей мере одно значение управления ослаблением служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным производным неречевым каналом.
4. Способ по п. 3, отличающийся тем, что производный неречевой канал получается путем комбинирования первого неречевого канала многоканального звукового сигнала и второго неречевого канала многоканального звукового сигнала.
5. Способ по п. 3, отличающийся тем, что многоканальный звуковой сигнал содержит по меньшей мере два неречевых канала, и этап (b) предусматривает этап ослабления некоторых, но не всех, неречевых каналов в ответ по меньшей мере на одно значение управления ослаблением.
6. Способ по п. 3, отличающийся тем, что многоканальный звуковой сигнал имеет по меньшей мере два неречевых канала, и этап (b) предусматривает этап ослабления всех неречевых каналов в ответ по меньшей мере на одно значение управления ослаблением.
7. Способ по п. 1, отличающийся тем, что этап (b) предусматривает масштабирование необработанного сигнала управления ослаблением для неречевого канала в ответ по меньшей мере на одно значение управления ослаблением.
8. Способ по п. 1, отличающийся тем, что этап (a) предусматривает этап генерирования сигнала управления ослаблением, служащего признаком последовательности значений управления ослаблением, где каждое из значений управления ослаблением служит признаком меры сходства в разное время между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным по меньшей мере одним неречевым каналом многоканального звукового сигнала, и этап (b) предусматривает этапы:
масштабирование сигнала управления усилением с подавлением слабого сигнала более сильным в ответ на сигнал управления ослаблением с целью генерирования масштабированного сигнала управления усилением; и
применение масштабированного сигнала управления усилением для ослабления по меньшей мере одного неречевого канала многоканального звукового сигнала.
9. Способ по п. 8, отличающийся тем, что этап (а) предусматривает этап сравнения первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного по меньшей мере одним неречевым каналом многоканального звукового сигнала, с целью генерирования сигнала управления ослаблением, и каждое из значений управления ослаблением, указываемое сигналом управления ослаблением, служит признаком меры сходства в разное время между первой последовательностью относящихся к речи характерных свойств и второй последовательностью относящихся к речи характерных свойств.
10. Способ по п. 1, отличающийся тем, что каждое указанное значение управления ослаблением монотонно связано с вероятностью того, что по меньшей мере один неречевой канал многоканального звукового сигнала служит признаком усиливающего речь содержания, которое улучшает воспринимаемое качество речевого содержания, определенное речевым каналом.
11. Способ фильтрации многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определенной сигналом, причем указанный способ отличается тем, что предусматривает следующие этапы:
(a) определение по меньшей мере одного значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным неречевым каналом; и
(b) ослабление неречевого канала в ответ по меньшей мере на одно значение управления ослаблением.
12. Способ по п. 11, отличающийся тем, что этап (b) предусматривает масштабирование необработанного сигнала управления ослаблением для неречевого канала в ответ по меньшей мере на одно значение управления ослаблением.
13. Способ по п. 11, отличающийся тем, что этап (a) предусматривает этап генерирования сигнала управления ослаблением, служащего признаком последовательности значений управления ослаблением, где каждое из значений управления ослаблением служит признаком меры сходства в разное время между относящимся к речи содержанием, определяемым речевым каналом, и относящимся к речи содержанием, определяемым неречевым каналом, и этап (b) предусматривает следующие этапы:
масштабирование сигнала управления усилением с подавлением слабого сигнала более сильным в ответ на сигнал управления ослаблением с целью генерирования масштабированного сигнала управления усилением; и
применение масштабированного сигнала управления усилением для ослабления неречевого канала.
14. Способ по п. 13, отличающийся тем, что этап (а) предусматривает этап сравнения первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного неречевым каналом, с целью генерирования сигнала управления ослаблением, и каждое из значений управления ослаблением, указываемое сигналом управления ослаблением, служит признаком меры сходства в разное время между первой последовательностью относящихся к речи характерных свойств и второй последовательностью относящихся к речи характерных свойств.
15. Способ по п. 14, отличающийся тем, что первая последовательность относящихся к речи характерных свойств представляет собой последовательность значений вероятности речи, где каждое их значений вероятности речи указывает вероятность в разное время того, что речевой канал служит признаком речи, и вторая последовательность относящихся к речи характерных свойств представляет собой другую последовательность значений вероятности речи, указывающих вероятность в разное время того, что неречевой канал служит признаком речи.
16. Способ по п. 13, отличающийся тем, что каждое из значений управления ослаблением представляет собой значение управления усилением.
17. Способ по п. 13, отличающийся тем, что каждое указанное значение управления ослаблением монотонно связано с вероятностью того, что неречевой канал служит признаком усиливающего речь содержания, которое улучшает воспринимаемое качество речевого содержания, определяемого речевым каналом.
18. Способ фильтрации многоканального звукового сигнала, содержащего речевой канал и по меньшей мере два неречевых канала, причем указанный способ отличается тем, что предусматривает этапы:
(a) определение по меньшей мере одного первого значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и вторым относящимся к речи содержанием, определенным первым неречевым каналом; и
(b) определение по меньшей мере одного второго значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и третьим относящимся к речи содержанием, определенным вторым неречевым каналом.
19. Способ по п. 18, отличающийся тем, что этап (а) предусматривает этап сравнения первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком второго относящегося к речи содержания, и этап (b) предусматривает этап сравнения первой последовательности относящихся к речи характерных свойств с третьей последовательностью относящихся к речи характерных свойств, служащей признаком третьего относящегося к речи содержания.
20. Способ по п. 18, отличающийся тем, что также предусматривает следующие этапы:
(c) ослабление первого неречевого канала в ответ по меньшей мере на одно первое значение управления ослаблением; и
(d) ослабление второго неречевого канала в ответ по меньшей мере на одно второе значение управления ослаблением.
21. Способ по п. 18, отличающийся тем, что этап (с) предусматривает этап масштабированного ослабления первого неречевого канала в ответ на первое значение управления ослаблением, и этап (d) предусматривает этап масштабированного ослабления второго неречевого канала в ответ на второе значение управления ослаблением.
22. Способ по п. 18, отличающийся тем, что по меньшей мере одно первое значение управления ослаблением, определенное на этапе (а), представляет собой последовательность значений управления ослаблением, и каждое из значений управления ослаблением представляет собой значение управления усилением, предназначенное для масштабирования величины усиления с подавлением слабого сигнала более сильным, применяемого к первому неречевому каналу так, чтобы улучшить разборчивость речи, определяемой речевым каналом, без нежелательного ослабления усиливающего речь содержания, определенного первым неречевым каналом, и
по меньшей мере, одно второе значение управления ослаблением, определенное на этапе (b), представляет собой последовательность вторых значений управления ослаблением, и каждое из вторых значений управления ослаблением представляет собой значение управления усилением, предназначенное для масштабирования величины усиления с подавлением слабого сигнала более сильным, применяемого ко второму неречевому каналу так, чтобы улучшить разборчивость речи, определяемой речевым каналом, без нежелательного ослабления усиливающего речь содержания, определенной вторым неречевым каналом.
23. Способ фильтрации многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определенной сигналом, причем указанный способ отличается тем, что предусматривает следующие этапы:
(a) сравнение характеристики речевого канала и характеристики неречевого канала с целью генерирования по меньшей мере одного значения коэффициента ослабления, предназначенного для управления ослаблением неречевого канала относительно речевого канала; и
(b) корректировку по меньшей мере одного значения коэффициента ослабления в ответ по меньшей мере на одно значение вероятности усиления речи с целью генерирования по меньшей мере одного скорректированного значения коэффициента ослабления, предназначенного для управления ослаблением неречевого канала относительно речевого канала.
24. Способ по п. 23, отличающийся тем, что этап (b) предусматривает масштабирование каждого указанного значения коэффициента ослабления в ответ на одно указанное значение вероятности усиления речи с целью генерирования одного указанного скорректированного значения коэффициента ослабления.
25. Способ по п. 23, отличающийся тем, что каждое указанное значение вероятности усиления речи монотонно связано с вероятностью того, что неречевой канал служит признаком усиливающего речь содержания, которое улучшает воспринимаемое качество речевого содержания, определенного речевым каналом.
26. Способ по п. 23, отличающийся тем, что по меньшей мере одно значение вероятности усиления речи представляет собой последовательность сравнительных значений, и способ предусматривает следующий этап:
определение последовательности сравнительных значений путем сравнения первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного неречевым каналом, где каждое из сравнительных значений представляет собой меру сходства в разное время между первой последовательностью относящихся к речи характерных свойств и второй последовательностью относящихся к речи характерных свойств.
27. Способ по п. 23, отличающийся тем, что также предусматривает этап:
(c) ослабление неречевого канала в ответ по меньшей мере на одно скорректированное значение коэффициента ослабления.
28. Способ по п. 23, отличающийся тем, что этап (b) предусматривает масштабирование каждого указанного значения коэффициента ослабления в ответ на одно указанное значение вероятности усиления речи с целью генерирования одного указанного скорректированного значения коэффициента ослабления.
29. Способ по п. 23, отличающийся тем, что каждое указанное значение коэффициента ослабления, генерируемое на этапе (а), представляет собой первый множитель, служащий признаком величины ослабления неречевого канала, необходимого для ограничения соотношения мощности сигнала в неречевом канале и мощности сигнала в речевом канале так, чтобы оно не превышало предварительно определенное пороговое значение, масштабированный посредством второго множителя, монотонно связанного с вероятностью того, что речевой канал служит признаком речи.
30. Способ по п. 23, отличающийся тем, что каждое указанное значение коэффициента ослабления, генерируемое на этапе (а), представляет собой первый множитель, служащий признаком величины ослабления неречевого канала, достаточной для того, чтобы вызывать превышение предварительно определенного порогового значения прогнозируемой разборчивостью речи, определяемой речевым каналом в присутствии содержания, определенного неречевым каналом, масштабированный посредством второго множителя, монотонно связанного с вероятностью того, что речевой канал служит признаком речи.
31. Способ по п. 23, отличающийся тем, что генерирование на этапе (а) каждого указанного значения коэффициента ослабления предусматривает следующие этапы:
определение спектра мощности, служащего признаком мощности как функции частоты речевого канала, и второго спектра мощности, служащего признаком мощности как функции частоты неречевого канала, и
выполнение определения в частотной области значения коэффициента ослабления в ответ на спектр мощности и второй спектр мощности.
32. Система, предназначенная для усиления речи, определенной многоканальным входным звуковым сигналом, содержащим речевой канал и по меньшей мере один неречевой канал, где указанная система отличается тем, что содержит:
подсистему анализа, сконфигурированную для анализа многоканального входного звукового сигнала с целью генерирования значений управления ослаблением, где каждое из значений управления ослаблением служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным по меньшей мере одним неречевым каналом входного сигнала; и
подсистему ослабления, сконфигурированную для применения ослабления с подавлением слабого сигнала более сильным, управляемого по меньшей мере некоторыми из значений управления ослаблением, к каждому указанному неречевому каналу с целью генерирования фильтрованного выходного звукового сигнала.
33. Система по п. 32, отличающаяся тем, что подсистема ослабления сконфигурирована для масштабирования необработанного сигнала управления ослаблением для по меньшей мере одного указанного неречевого канала в ответ по меньшей мере на подмножество значений управления ослаблением.
34. Система по п. 32, отличающаяся тем, что подсистема анализа сконфигурирована для генерирования сигнала управления ослаблением, служащего признаком последовательности значений управления ослаблением для по меньшей мере одного указанного неречевого канала, где каждое из значений управления ослаблением представляет собой последовательность, которая служит признаком меры сходства в разное время между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным неречевым каналом, и система ослабления сконфигурирована для:
масштабирования сигнала управления усилением с подавлением слабого сигнала более сильным в ответ на сигнал управления ослаблением с целью генерирования масштабированного сигнала управления усилением с подавлением слабого сигнала более сильным; и
применения масштабированного сигнала управления усилением с подавлением слабого сигнала более сильным для ослабления неречевого канала.
35. Система по п. 34, отличающаяся тем, что подсистема анализа сконфигурирована для сравнения первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного неречевым каналом, с целью генерирования сигнала управления ослаблением, и каждое из значений управления ослаблением, указываемое сигналом управления ослаблением, служит признаком меры сходства в разное время между первой последовательностью относящихся к речи характерных свойств и второй последовательностью относящихся к речи характерных свойств.
36. Система по п. 35, отличающаяся тем, что первая последовательность относящихся к речи характерных свойств представляет собой последовательность значений вероятности речи, где каждое из значений вероятности речи указывает вероятность в разное время того, что речевой канал служит признаком речи, и вторая последовательность относящихся к речи характерных свойств представляет собой другую последовательность значений вероятности речи, где каждое из значений вероятности речи указывающих вероятность в разное время того, что неречевой канал служит признаком речи.
37. Система по п. 32, отличающаяся тем, что указанная система содержит процессор, запрограммированный посредством программного обеспечения анализа на анализ многоканального входного звукового сигнала с целью генерирования значений управления ослаблением.
38. Система по п. 37, отличающаяся тем, что процессор запрограммирован посредством программного обеспечения ослабления на применение ослабления с подавлением слабого сигнала более сильным к каждому указанному неречевому каналу с целью генерирования фильтрованного выходного звукового сигнала.
39. Система по п. 32, отличающаяся тем, что указанная система содержит процессор, сконфигурированный для анализа многоканального входного звукового сигнала с целью генерирования значений управления ослаблением и для применения ослабления с подавлением слабого сигнала более сильным к каждому указанному неречевому каналу с целью генерирования фильтрованного выходного звукового сигнала.
40. Система по п. 32, отличающаяся тем, что указанная система представляет собой процессор обработки цифровых звуковых сигналов, который сконфигурирован для анализа многоканального входного звукового сигнала с целью генерирования значений управления ослаблением и для применения ослабления с подавлением слабого сигнала более сильным к каждому указанному неречевому каналу с целью генерирования фильтрованного выходного звукового сигнала.
41. Система по п. 32, отличающаяся тем, что указанная система содержит первую схему, сконфигурированную для реализации подсистемы анализа, и дополнительную схему, связанную с первой схемой и сконфигурированную для реализации подсистемы ослабления.
42. Система по п. 32, отличающаяся тем, что указанная система представляет собой процессор обработки цифровых звуковых сигналов, содержащий первую схему, сконфигурированную для реализации подсистемы анализа, и дополнительную схему, связанную с первой схемой и сконфигурированную для реализации подсистемы ослабления.
43. Система по п. 32, отличающаяся тем, что указанная система представляет собой систему обработки данных, сконфигурированную для реализации подсистемы анализа и подсистемы ослабления.
44. Система, предназначенная для усиления речи, определенной многоканальным входным звуковым сигналом, содержащим речевой канал и по меньшей мере один неречевой канал, где указанная система отличается тем, что содержит:
подсистему анализа, сконфигурированную для анализа многоканального входного звукового сигнала с целью генерирования значений управления ослаблением, где каждое из значений управления ослаблением служит признаком меры сходства между относящимся к речи содержанием, определяемым речевым каналом, и относящимся к речи содержанием, определенным по меньшей мере одним неречевым каналом входного сигнала; и
подсистему ослабления, сконфигурированную для применения ослабления с подавлением слабого сигнала более сильным, управляемого по меньшей мере некоторыми из значений управления ослаблением, к по меньшей мере одному неречевому каналу входного сигнала с целью генерирования фильтрованного выходного звукового сигнала.
45. Система по п. 44, отличающаяся тем, что подсистема анализа сконфигурирована для генерирования каждого из значений управления ослаблением так, чтобы оно служило признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным одним неречевым каналом звукового сигнала, и подсистема ослабления сконфигурирована для применения указанного ослабления с подавлением слабого сигнала более сильным к указанному одному неречевому каналу в ответ на значения управления ослаблением.
46. Система по п. 44, отличающаяся тем, что подсистема анализа сконфигурирована для получения производного неречевого канала из по меньшей мере одного неречевого канала звукового сигнала и для генерирования каждого из по меньшей мере некоторых из значений управления ослаблением так, чтобы оно служило признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным производным неречевым каналом звукового сигнала.
47. Машинно-читаемый носитель данных, который содержит код, предназначенный для программирования процессора на обработку данных, служащих признаком многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определенной сигналом, при помощи способа, отличающегося тем, что он предусматривает этапы:
(a) определения по меньшей мере одного значения управления ослаблением, служащего признаком сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным неречевым каналом;
(b) ослабления неречевого канала в ответ по меньшей мере на одно значение управления ослаблением.
48. Машинно-читаемый носитель данных по п. 47, отличающийся тем, что содержит код, предназначенный для программирования процессора на масштабирование данных, служащих признаком необработанного сигнала управления ослаблением для неречевого канала, в ответ по меньшей мере на одно значение управления ослаблением.
49. Машинно-читаемый носитель данных по п. 47, отличающийся тем, что содержит код, предназначенный для программирования процессора на:
генерирование данных, служащих признаком последовательности значений управления ослаблением, где каждое из значений управления ослаблением служит признаком меры сходства в разное время между относящимся к речи содержанием, определяемым речевым каналом, и относящимся к речи содержанием, определяемым неречевым каналом; и
масштабирование данных, служащих признаком сигнала управления усилением с подавлением слабого сигнала более сильным, в ответ на последовательность значений управления ослаблением с целью генерирования данных, служащих признаком масштабированного сигнала управления усилением с подавлением слабого сигнала более сильным.
50. Машинно-читаемый носитель данных по п. 49, отличающийся тем, что содержит код для программирования процессора на сравнение первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного неречевым каналом, с целью генерирования последовательности значений управления ослаблением так, чтобы каждое из значений управления ослаблением служило признаком меры сходства в разное время между первой последовательностью относящихся к речи характерных свойств и второй последовательностью относящихся к речи характерных свойств.
51. Машинно-читаемый носитель данных по п. 49, отличающийся тем, что первая последовательность относящихся к речи характерных свойств представляет собой последовательность первых значений вероятности речи, где каждое из первых значений вероятности речи указывает вероятность в разное время того, что речевой канал служит признаком речи, и вторая последовательность относящихся к речи характерных свойств представляет собой последовательность вторых значений вероятности речи, где каждое из вторых значений вероятности речи указывает вероятность в разное время того, что неречевой канал служит признаком речи.
52. Машинно-читаемый носитель данных по п. 47, отличающийся тем, что каждое указанное значение управления ослаблением монотонно связано с вероятностью того, что неречевой канал служит признаком усиливающего речь содержания, которое улучшает воспринимаемое качество речевого содержания, определенное речевым каналом.
53. Машинно-читаемый носитель данных, который содержит код, предназначенный для программирования процессора на обработку данных, служащих признаком многоканального звукового сигнала, содержащего речевой канал и по меньшей мере два неречевых канала, с целью улучшения разборчивости речи, определяемой сигналом, при помощи способа, отличающегося тем, что он предусматривает этапы:
(a) определения по меньшей мере одного значения управления ослаблением, служащего признаком сходства между относящимся к речи содержанием, определенным речевым каналом, и вторым относящимся к речи содержанием, определенным первым неречевым каналом; и
(b) определения по меньшей мере одного второго значения управления ослаблением, служащего признаком сходства между относящимся к речи содержанием, определенным речевым каналом, и третьим относящимся к речи содержанием, определенным вторым неречевым каналом.
54. Машинно-читаемый носитель данных по п. 53, отличающийся тем, что содержит код для программирования процессора на сравнение первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком второго относящегося к речи содержания, и на сравнение первой последовательности относящихся к речи характерных свойств с третьей последовательностью относящихся к речи характерных свойств, служащей признаком третьего относящегося к речи содержания.
55. Машинно-читаемый носитель данных по п. 53, отличающийся тем, что содержит код для программирования процессора на ослабление по меньшей мере одного первого неречевого канала в ответ на первое значение управления ослаблением и на ослабление второго неречевого канала в ответ по меньшей мере на одно второе значение управления ослаблением.
56. Машинно-читаемый носитель данных по п. 53, отличающийся тем, что по меньшей мере одно первое значение управления ослаблением представляет собой последовательность значений управления ослаблением, и указанный носитель данных содержит код, предназначенный для программирования процессора на масштабирование величины усиления с подавлением слабого сигнала более сильным, применяемого к первому неречевому каналу в ответ на последовательность значений управления усилением так, чтобы улучшать разборчивость речи, определенной речевым каналом, без нежелательного ослабления усиливающего речь содержания, определенного первым неречевым каналом.
57. Машинно-читаемый носитель данных, который содержит код, предназначенный для программирования процессора на обработку данных, служащих признаком многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определяемой сигналом, при помощи способа, отличающегося тем, что он предусматривает этапы:
(a) сравнения характеристики речевого канала и характеристики неречевого канала с целью генерирования по меньшей мере одного значения коэффициента ослабления, предназначенного для управления ослаблением неречевого канала относительно речевого канала; и
(b) корректировки по меньшей мере одного значения коэффициента ослабления в ответ по меньшей мере на одно значение вероятности усиления речи с целью генерирования по меньшей мере одного скорректированного значения коэффициента ослабления, предназначенного для управления ослаблением неречевого канала относительно речевого канала.
58. Машинно-читаемый носитель данных по п. 57, отличающийся тем, что содержит код для программирования процессора на масштабирование каждого указанного значения коэффициента ослабления в ответ на одно указанное значение вероятности усиления речи с целью генерирования одного указанного скорректированного значения коэффициента ослабления.
59. Машинно-читаемый носитель данных по п. 57, отличающийся тем, что каждое указанное значение вероятности усиления речи монотонно связано с вероятностью того, что неречевой канал служит признаком усиливающего речь содержания, которое улучшает воспринимаемое качество речевого содержания, определенного речевым каналом.
60. Машинно-читаемый носитель данных по п. 57, отличающийся тем, что по меньшей мере одно значение вероятности речи представляет собой последовательность сравнительных значений, и указанный носитель содержит код для программирования процессора на определение последовательности сравнительных значений путем сравнения первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного неречевым каналом, где каждое из сравнительных значений представляет собой меру сходства в разное время между первой последовательностью относящихся к речи характерных свойств и второй последовательностью относящихся к речи характерных свойств.
61. Машинно-читаемый носитель данных по п. 57, отличающийся тем, что каждое указанное значение коэффициента усиления представляет собой первый множитель, служащий признаком величины ослабления неречевого канала, необходимого для ограничения соотношения мощности сигнала в неречевом канале и мощности сигнала в речевом канале так, чтобы оно не превышало предварительно определенное пороговое значение, масштабированный посредством второго множителя, монотонно связанного с вероятностью того, что речевой канал служит признаком речи.
62. Машинно-читаемый носитель данных по п. 57, отличающийся тем, что каждое указанное значение коэффициента усиления представляет собой первый множитель, служащий признаком величины ослабления неречевого канала, достаточной для того, чтобы вызывать превышение предварительно определенного порогового значения прогнозируемой разборчивостью речи, определенной речевым каналом в присутствии содержания, определенного неречевым каналом, масштабированный посредством второго множителя, монотонно связанного с вероятностью того, что речевой канал служит признаком речи.
63. Машинно-читаемый носитель данных по п. 57, отличающийся тем, что содержит код для программирования процессора на определение спектра мощности, служащего признаком мощности как функции частоты речевого канала, и второго спектра мощности, служащего признаком мощности как функции частоты неречевого канала, и для определения каждого указанного значения коэффициента ослабления в частотной области в ответ на спектр мощности и второй спектр мощности.
64. Машинно-читаемый носитель данных, который содержит код, предназначенный для программирования процессора на обработку данных, служащих признаком многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определяемой сигналом, при помощи способа, отличающегося тем, что он предусматривает этапы:
определения по меньшей мере одного значения управления ослаблением, служащего признаком сходства между относящимся к речи содержанием, определяемым речевым каналом, и относящимся к речи содержанием, определяемым по меньшей мере одним неречевым каналом многоканального звукового сигнала; и
генерирования данных, служащих признаком по меньшей мере одного ослабленного неречевого канала многоканального звукового сигнала, в ответ по меньшей мере на одно значение управления ослаблением, где каждый указанный ослабленный неречевой канал был подвергнут ослаблению в ответ по меньшей мере на одно значение управления ослаблением.
65. Машинно-читаемый носитель данных по п. 64, отличающийся тем, что каждое указанное значение управления ослаблением служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным одним неречевым каналом звукового сигнала.
66. Машинно-читаемый носитель данных по п. 64, отличающийся тем, что содержит код, предназначенный для программирования процессора на обработку данных, служащих признаком многоканального звукового сигнала, которая заключается в: генерировании данных, служащих признаком производного неречевого канала, из по меньшей мере одного неречевого канала звукового сигнала, и определении по меньшей мере одного значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определяемым производным неречевым каналом.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31143710P | 2010-03-08 | 2010-03-08 | |
US61/311,437 | 2010-03-08 | ||
PCT/US2011/026505 WO2011112382A1 (en) | 2010-03-08 | 2011-02-28 | Method and system for scaling ducking of speech-relevant channels in multi-channel audio |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2012141463A true RU2012141463A (ru) | 2014-04-20 |
RU2520420C2 RU2520420C2 (ru) | 2014-06-27 |
Family
ID=43919902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2012141463/08A RU2520420C2 (ru) | 2010-03-08 | 2011-02-28 | Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала |
Country Status (9)
Country | Link |
---|---|
US (2) | US9219973B2 (ru) |
EP (1) | EP2545552B1 (ru) |
JP (1) | JP5674827B2 (ru) |
CN (2) | CN102792374B (ru) |
BR (2) | BR122019024041B1 (ru) |
ES (1) | ES2709523T3 (ru) |
RU (1) | RU2520420C2 (ru) |
TW (1) | TWI459828B (ru) |
WO (1) | WO2011112382A1 (ru) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2565394T3 (es) * | 2011-12-15 | 2016-04-04 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato, método y programa informático para evitar artefactos de recorte |
US9781529B2 (en) | 2012-03-27 | 2017-10-03 | Htc Corporation | Electronic apparatus and method for activating specified function thereof |
WO2013150340A1 (en) * | 2012-04-05 | 2013-10-10 | Nokia Corporation | Adaptive audio signal filtering |
US10156455B2 (en) | 2012-06-05 | 2018-12-18 | Apple Inc. | Context-aware voice guidance |
US9886794B2 (en) | 2012-06-05 | 2018-02-06 | Apple Inc. | Problem reporting in maps |
EP3957956A1 (en) * | 2012-06-05 | 2022-02-23 | Apple Inc. | Context-aware voice guidance |
US9516418B2 (en) | 2013-01-29 | 2016-12-06 | 2236008 Ontario Inc. | Sound field spatial stabilizer |
EP2760021B1 (en) * | 2013-01-29 | 2018-01-17 | 2236008 Ontario Inc. | Sound field spatial stabilizer |
SG11201507066PA (en) | 2013-03-05 | 2015-10-29 | Fraunhofer Ges Forschung | Apparatus and method for multichannel direct-ambient decomposition for audio signal processing |
MY197063A (en) * | 2013-04-05 | 2023-05-23 | Dolby Int Ab | Companding system and method to reduce quantization noise using advanced spectral extension |
US9271100B2 (en) | 2013-06-20 | 2016-02-23 | 2236008 Ontario Inc. | Sound field spatial stabilizer with spectral coherence compensation |
US9099973B2 (en) | 2013-06-20 | 2015-08-04 | 2236008 Ontario Inc. | Sound field spatial stabilizer with structured noise compensation |
US9106196B2 (en) | 2013-06-20 | 2015-08-11 | 2236008 Ontario Inc. | Sound field spatial stabilizer with echo spectral coherence compensation |
EP3503095A1 (en) | 2013-08-28 | 2019-06-26 | Dolby Laboratories Licensing Corp. | Hybrid waveform-coded and parametric-coded speech enhancement |
WO2015116687A1 (en) * | 2014-01-28 | 2015-08-06 | St. Jude Medical, Cardiology Division, Inc. | Elongate medical devices incorporating a flexible substrate, a sensor, and electrically-conductive traces |
US9654076B2 (en) * | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
US8874448B1 (en) * | 2014-04-01 | 2014-10-28 | Google Inc. | Attention-based dynamic audio level adjustment |
US9615170B2 (en) * | 2014-06-09 | 2017-04-04 | Harman International Industries, Inc. | Approach for partially preserving music in the presence of intelligible speech |
AU2015326856B2 (en) * | 2014-10-02 | 2021-04-08 | Dolby International Ab | Decoding method and decoder for dialog enhancement |
JP6508491B2 (ja) | 2014-12-12 | 2019-05-08 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | マルチチャネルオーディオ信号内の音声成分を強調するための信号処理装置 |
WO2016115622A1 (en) | 2015-01-22 | 2016-07-28 | Eers Global Technologies Inc. | Active hearing protection device and method therefore |
US9747923B2 (en) * | 2015-04-17 | 2017-08-29 | Zvox Audio, LLC | Voice audio rendering augmentation |
US9947364B2 (en) | 2015-09-16 | 2018-04-17 | Google Llc | Enhancing audio using multiple recording devices |
JP6567479B2 (ja) * | 2016-08-31 | 2019-08-28 | 株式会社東芝 | 信号処理装置、信号処理方法およびプログラム |
EP3566229B1 (en) * | 2017-01-23 | 2020-11-25 | Huawei Technologies Co., Ltd. | An apparatus and method for enhancing a wanted component in a signal |
US10013995B1 (en) * | 2017-05-10 | 2018-07-03 | Cirrus Logic, Inc. | Combined reference signal for acoustic echo cancellation |
US11335357B2 (en) * | 2018-08-14 | 2022-05-17 | Bose Corporation | Playback enhancement in audio systems |
CN111354356B (zh) * | 2018-12-24 | 2024-04-30 | 北京搜狗科技发展有限公司 | 一种语音数据处理方法及装置 |
MX2021012309A (es) | 2019-04-15 | 2021-11-12 | Dolby Int Ab | Mejora de dialogo en codec de audio. |
US11335361B2 (en) * | 2020-04-24 | 2022-05-17 | Universal Electronics Inc. | Method and apparatus for providing noise suppression to an intelligent personal assistant |
CN115699172A (zh) * | 2020-05-29 | 2023-02-03 | 弗劳恩霍夫应用研究促进协会 | 用于处理初始音频信号的方法和装置 |
CN115881146A (zh) * | 2021-08-05 | 2023-03-31 | 哈曼国际工业有限公司 | 用于动态语音增强的方法及系统 |
WO2023208342A1 (en) * | 2022-04-27 | 2023-11-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for scaling of ducking gains for spatial, immersive, single- or multi-channel reproduction layouts |
Family Cites Families (95)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5657422A (en) * | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5666429A (en) * | 1994-07-18 | 1997-09-09 | Motorola, Inc. | Energy estimator and method therefor |
JPH08222979A (ja) * | 1995-02-13 | 1996-08-30 | Sony Corp | オーディオ信号処理装置、およびオーディオ信号処理方法、並びにテレビジョン受像機 |
US5920834A (en) * | 1997-01-31 | 1999-07-06 | Qualcomm Incorporated | Echo canceller with talk state determination to control speech processor functional elements in a digital telephone system |
US5983183A (en) * | 1997-07-07 | 1999-11-09 | General Data Comm, Inc. | Audio automatic gain control system |
US20020002455A1 (en) * | 1998-01-09 | 2002-01-03 | At&T Corporation | Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system |
US6226321B1 (en) * | 1998-05-08 | 2001-05-01 | The United States Of America As Represented By The Secretary Of The Air Force | Multichannel parametric adaptive matched filter receiver |
US6591234B1 (en) * | 1999-01-07 | 2003-07-08 | Tellabs Operations, Inc. | Method and apparatus for adaptively suppressing noise |
US6442278B1 (en) * | 1999-06-15 | 2002-08-27 | Hearing Enhancement Company, Llc | Voice-to-remaining audio (VRA) interactive center channel downmix |
KR100304666B1 (ko) * | 1999-08-28 | 2001-11-01 | 윤종용 | 음성 향상 방법 |
ATE330818T1 (de) * | 1999-11-24 | 2006-07-15 | Donnelly Corp | Rückblickspiegel mit nutzfunktion |
WO2001041427A1 (en) * | 1999-12-06 | 2001-06-07 | Dmi Biosciences, Inc. | Noise reducing/resolution enhancing signal processing method and system |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
JP2001268700A (ja) * | 2000-03-17 | 2001-09-28 | Fujitsu Ten Ltd | 音響装置 |
US6523003B1 (en) * | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
US6766292B1 (en) * | 2000-03-28 | 2004-07-20 | Tellabs Operations, Inc. | Relative noise ratio weighting techniques for adaptive noise cancellation |
US20040096065A1 (en) * | 2000-05-26 | 2004-05-20 | Vaudrey Michael A. | Voice-to-remaining audio (VRA) interactive center channel downmix |
US20070233479A1 (en) * | 2002-05-30 | 2007-10-04 | Burnett Gregory C | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors |
JP4282227B2 (ja) * | 2000-12-28 | 2009-06-17 | 日本電気株式会社 | ノイズ除去の方法及び装置 |
US20020159434A1 (en) * | 2001-02-12 | 2002-10-31 | Eleven Engineering Inc. | Multipoint short range radio frequency system |
US7013269B1 (en) * | 2001-02-13 | 2006-03-14 | Hughes Electronics Corporation | Voicing measure for a speech CODEC system |
US20040148166A1 (en) * | 2001-06-22 | 2004-07-29 | Huimin Zheng | Noise-stripping device |
JP2005502247A (ja) * | 2001-09-06 | 2005-01-20 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ再生装置 |
JP2003084790A (ja) * | 2001-09-17 | 2003-03-19 | Matsushita Electric Ind Co Ltd | 台詞成分強調装置 |
WO2007106399A2 (en) * | 2006-03-10 | 2007-09-20 | Mh Acoustics, Llc | Noise-reducing directional microphone array |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
JP3810004B2 (ja) * | 2002-03-15 | 2006-08-16 | 日本電信電話株式会社 | ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム |
EP1520395B1 (en) * | 2002-07-01 | 2008-12-31 | Koninklijke Philips Electronics N.V. | Stationary spectral power dependent audio enhancement system |
CN100369111C (zh) * | 2002-10-31 | 2008-02-13 | 富士通株式会社 | 话音增强装置 |
US7305097B2 (en) * | 2003-02-14 | 2007-12-04 | Bose Corporation | Controlling fading and surround signal level |
US8271279B2 (en) * | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7127076B2 (en) * | 2003-03-03 | 2006-10-24 | Phonak Ag | Method for manufacturing acoustical devices and for reducing especially wind disturbances |
US8724822B2 (en) * | 2003-05-09 | 2014-05-13 | Nuance Communications, Inc. | Noisy environment communication enhancement system |
EP1509065B1 (en) * | 2003-08-21 | 2006-04-26 | Bernafon Ag | Method for processing audio-signals |
DE102004049347A1 (de) * | 2004-10-08 | 2006-04-20 | Micronas Gmbh | Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale |
US8170879B2 (en) * | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US7610196B2 (en) * | 2004-10-26 | 2009-10-27 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8306821B2 (en) * | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US8543390B2 (en) * | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
KR100679044B1 (ko) * | 2005-03-07 | 2007-02-06 | 삼성전자주식회사 | 사용자 적응형 음성 인식 방법 및 장치 |
US8280730B2 (en) * | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
JP4670483B2 (ja) * | 2005-05-31 | 2011-04-13 | 日本電気株式会社 | 雑音抑圧の方法及び装置 |
US8233636B2 (en) * | 2005-09-02 | 2012-07-31 | Nec Corporation | Method, apparatus, and computer program for suppressing noise |
US20070053522A1 (en) * | 2005-09-08 | 2007-03-08 | Murray Daniel J | Method and apparatus for directional enhancement of speech elements in noisy environments |
JP4356670B2 (ja) * | 2005-09-12 | 2009-11-04 | ソニー株式会社 | 雑音低減装置及び雑音低減方法並びに雑音低減プログラムとその電子機器用収音装置 |
US7366658B2 (en) * | 2005-12-09 | 2008-04-29 | Texas Instruments Incorporated | Noise pre-processor for enhanced variable rate speech codec |
WO2007098258A1 (en) * | 2006-02-24 | 2007-08-30 | Neural Audio Corporation | Audio codec conditioning system and method |
JP4738213B2 (ja) * | 2006-03-09 | 2011-08-03 | 富士通株式会社 | 利得調整方法及び利得調整装置 |
US7555075B2 (en) * | 2006-04-07 | 2009-06-30 | Freescale Semiconductor, Inc. | Adjustable noise suppression system |
KR101061132B1 (ko) * | 2006-09-14 | 2011-08-31 | 엘지전자 주식회사 | 다이알로그 증폭 기술 |
US20080082320A1 (en) * | 2006-09-29 | 2008-04-03 | Nokia Corporation | Apparatus, method and computer program product for advanced voice conversion |
ATE425532T1 (de) * | 2006-10-31 | 2009-03-15 | Harman Becker Automotive Sys | Modellbasierte verbesserung von sprachsignalen |
US8615393B2 (en) * | 2006-11-15 | 2013-12-24 | Microsoft Corporation | Noise suppressor for speech recognition |
WO2008073487A2 (en) * | 2006-12-12 | 2008-06-19 | Thx, Ltd. | Dynamic surround channel volume control |
JP2008148179A (ja) * | 2006-12-13 | 2008-06-26 | Fujitsu Ltd | 音声信号処理装置および自動利得制御装置における雑音抑圧処理方法 |
JP5140684B2 (ja) * | 2007-02-12 | 2013-02-06 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 高齢又は聴覚障害聴取者のための非スピーチオーディオに対するスピーチオーディオの改善された比率 |
BRPI0807703B1 (pt) * | 2007-02-26 | 2020-09-24 | Dolby Laboratories Licensing Corporation | Método para aperfeiçoar a fala em áudio de entretenimento e meio de armazenamento não-transitório legível por computador |
JP2008216720A (ja) * | 2007-03-06 | 2008-09-18 | Nec Corp | 信号処理の方法、装置、及びプログラム |
US20090010453A1 (en) * | 2007-07-02 | 2009-01-08 | Motorola, Inc. | Intelligent gradient noise reduction system |
GB2450886B (en) * | 2007-07-10 | 2009-12-16 | Motorola Inc | Voice activity detector and a method of operation |
US8600516B2 (en) * | 2007-07-17 | 2013-12-03 | Advanced Bionics Ag | Spectral contrast enhancement in a cochlear implant speech processor |
DE102007048973B4 (de) * | 2007-10-12 | 2010-11-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
US8326617B2 (en) * | 2007-10-24 | 2012-12-04 | Qnx Software Systems Limited | Speech enhancement with minimum gating |
US8296136B2 (en) * | 2007-11-15 | 2012-10-23 | Qnx Software Systems Limited | Dynamic controller for improving speech intelligibility |
KR101444100B1 (ko) * | 2007-11-15 | 2014-09-26 | 삼성전자주식회사 | 혼합 사운드로부터 잡음을 제거하는 방법 및 장치 |
CN102017402B (zh) * | 2007-12-21 | 2015-01-07 | Dts有限责任公司 | 用于调节音频信号的感知响度的系统 |
CN101911182A (zh) * | 2008-01-01 | 2010-12-08 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
KR101147780B1 (ko) * | 2008-01-01 | 2012-06-01 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
JP2011518345A (ja) * | 2008-03-14 | 2011-06-23 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | スピーチライク信号及びノンスピーチライク信号のマルチモードコーディング |
KR101227876B1 (ko) * | 2008-04-18 | 2013-01-31 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 서라운드 경험에 최소한의 영향을 미치는 멀티-채널 오디오에서 음성 가청도를 유지하는 방법과 장치 |
US9373339B2 (en) * | 2008-05-12 | 2016-06-21 | Broadcom Corporation | Speech intelligibility enhancement system and method |
US8321214B2 (en) * | 2008-06-02 | 2012-11-27 | Qualcomm Incorporated | Systems, methods, and apparatus for multichannel signal amplitude balancing |
US8983832B2 (en) | 2008-07-03 | 2015-03-17 | The Board Of Trustees Of The University Of Illinois | Systems and methods for identifying speech sound features |
US20100008520A1 (en) * | 2008-07-09 | 2010-01-14 | Yamaha Corporation | Noise Suppression Estimation Device and Noise Suppression Device |
EP2194526A1 (en) * | 2008-12-05 | 2010-06-09 | Lg Electronics Inc. | A method and apparatus for processing an audio signal |
US8185389B2 (en) * | 2008-12-16 | 2012-05-22 | Microsoft Corporation | Noise suppressor for robust speech recognition |
WO2010068997A1 (en) * | 2008-12-19 | 2010-06-24 | Cochlear Limited | Music pre-processing for hearing prostheses |
US8175888B2 (en) * | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
US8620008B2 (en) * | 2009-01-20 | 2013-12-31 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
EP2389773B1 (en) * | 2009-01-20 | 2017-05-03 | Widex A/S | Hearing aid and a method of detecting and attenuating transients |
US8428758B2 (en) * | 2009-02-16 | 2013-04-23 | Apple Inc. | Dynamic audio ducking |
US8538043B2 (en) * | 2009-03-08 | 2013-09-17 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
FR2948484B1 (fr) * | 2009-07-23 | 2011-07-29 | Parrot | Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile |
US8538042B2 (en) * | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
US8644517B2 (en) * | 2009-08-17 | 2014-02-04 | Broadcom Corporation | System and method for automatic disabling and enabling of an acoustic beamformer |
WO2011032024A1 (en) * | 2009-09-11 | 2011-03-17 | Advanced Bionics, Llc | Dynamic noise reduction in auditory prosthesis systems |
US8204742B2 (en) * | 2009-09-14 | 2012-06-19 | Srs Labs, Inc. | System for processing an audio signal to enhance speech intelligibility |
EP2486567A1 (en) * | 2009-10-09 | 2012-08-15 | Dolby Laboratories Licensing Corporation | Automatic generation of metadata for audio dominance effects |
US20110099596A1 (en) * | 2009-10-26 | 2011-04-28 | Ure Michael J | System and method for interactive communication with a media device user such as a television viewer |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
US9324337B2 (en) * | 2009-11-17 | 2016-04-26 | Dolby Laboratories Licensing Corporation | Method and system for dialog enhancement |
US20110125494A1 (en) * | 2009-11-23 | 2011-05-26 | Cambridge Silicon Radio Limited | Speech Intelligibility |
US9536529B2 (en) * | 2010-01-06 | 2017-01-03 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
US8553892B2 (en) * | 2010-01-06 | 2013-10-08 | Apple Inc. | Processing a multi-channel signal for output to a mono speaker |
US20110178800A1 (en) * | 2010-01-19 | 2011-07-21 | Lloyd Watts | Distortion Measurement for Noise Suppression System |
-
2011
- 2011-02-18 TW TW100105440A patent/TWI459828B/zh active
- 2011-02-28 CN CN201180012782.5A patent/CN102792374B/zh active Active
- 2011-02-28 EP EP11707537.4A patent/EP2545552B1/en active Active
- 2011-02-28 ES ES11707537T patent/ES2709523T3/es active Active
- 2011-02-28 BR BR122019024041-8A patent/BR122019024041B1/pt active IP Right Grant
- 2011-02-28 JP JP2012557079A patent/JP5674827B2/ja active Active
- 2011-02-28 BR BR112012022571-5A patent/BR112012022571B1/pt active IP Right Grant
- 2011-02-28 RU RU2012141463/08A patent/RU2520420C2/ru active
- 2011-02-28 WO PCT/US2011/026505 patent/WO2011112382A1/en active Application Filing
- 2011-02-28 CN CN201410830734.2A patent/CN104811891B/zh active Active
- 2011-02-28 US US13/583,204 patent/US9219973B2/en active Active
-
2015
- 2015-11-16 US US14/942,706 patent/US9881635B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN104811891A (zh) | 2015-07-29 |
US20160071527A1 (en) | 2016-03-10 |
BR112012022571A2 (pt) | 2016-08-30 |
RU2520420C2 (ru) | 2014-06-27 |
TWI459828B (zh) | 2014-11-01 |
US9881635B2 (en) | 2018-01-30 |
EP2545552B1 (en) | 2018-12-12 |
CN104811891B (zh) | 2017-06-27 |
CN102792374A (zh) | 2012-11-21 |
CN102792374B (zh) | 2015-05-27 |
US20130006619A1 (en) | 2013-01-03 |
WO2011112382A1 (en) | 2011-09-15 |
BR112012022571B1 (pt) | 2020-11-17 |
ES2709523T3 (es) | 2019-04-16 |
US9219973B2 (en) | 2015-12-22 |
JP5674827B2 (ja) | 2015-02-25 |
EP2545552A1 (en) | 2013-01-16 |
TW201215177A (en) | 2012-04-01 |
BR122019024041B1 (pt) | 2020-08-11 |
JP2013521541A (ja) | 2013-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2012141463A (ru) | Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала | |
US11580995B2 (en) | Reconstruction of audio scenes from a downmix | |
JP6517723B2 (ja) | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 | |
JP7427752B2 (ja) | 時間領域デコーダにおける量子化雑音を低減するためのデバイスおよび方法 | |
EP3522157B1 (en) | Concept for combined dynamic range compression and guided clipping prevention for audio devices | |
US8831958B2 (en) | Method and an apparatus for a bandwidth extension using different schemes | |
EP3039675B1 (en) | Parametric speech enhancement | |
KR102517285B1 (ko) | 오디오 신호를 처리하기 위한 장치 및 방법 | |
CN101968781B (zh) | 在音频编码过程中根据mdct数据进行视窗类型判定的方法 | |
CN101533641B (zh) | 对多声道信号的声道延迟参数进行修正的方法和装置 | |
US20180240467A1 (en) | Low-frequency emphasis for lpc-based coding in frequency domain | |
JP2020512598A (ja) | トランジェント位置検出を使用したオーディオ信号の後処理のための装置 | |
RU2015117332A (ru) | Избирательный басовый постфильтр | |
IL186046A (en) | Economical loudness measurement of coded audio | |
JP2018045244A (ja) | 低レートcelpデコーダに関する非音声コンテンツの向上 | |
WO2009142466A2 (ko) | 오디오 신호 처리 방법 및 장치 | |
CN105144290B (zh) | 信号处理装置、信号处理方法和信号处理程序 | |
CN105103230B (zh) | 信号处理装置、信号处理方法、信号处理程序 | |
KR101108955B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
Oukherfellah et al. | FPGA implementation of voice activity detector for efficient speech enhancement | |
KR101096091B1 (ko) | 음성 분리 장치 및 이를 이용한 단일 채널 음성 분리 방법 | |
US20130304462A1 (en) | Signal processing apparatus and method and program | |
WO2023192039A1 (en) | Source separation combining spatial and source cues | |
JP2024540567A (ja) | 信号処理におけるソース分離およびリミックス |