RU2012141463A - Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала - Google Patents

Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала Download PDF

Info

Publication number
RU2012141463A
RU2012141463A RU2012141463/08A RU2012141463A RU2012141463A RU 2012141463 A RU2012141463 A RU 2012141463A RU 2012141463/08 A RU2012141463/08 A RU 2012141463/08A RU 2012141463 A RU2012141463 A RU 2012141463A RU 2012141463 A RU2012141463 A RU 2012141463A
Authority
RU
Russia
Prior art keywords
speech
channel
attenuation
speech channel
sign
Prior art date
Application number
RU2012141463/08A
Other languages
English (en)
Other versions
RU2520420C2 (ru
Inventor
Ханнес МЮШ
Original Assignee
Долби Лабораторис Лайсэнзин Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лабораторис Лайсэнзин Корпорейшн filed Critical Долби Лабораторис Лайсэнзин Корпорейшн
Publication of RU2012141463A publication Critical patent/RU2012141463A/ru
Application granted granted Critical
Publication of RU2520420C2 publication Critical patent/RU2520420C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/09Electronic reduction of distortion of stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. Способ фильтрации многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определяемой сигналом, причем указанный способ отличается тем, что предусматривает следующие этапы:(a) определение по меньшей мере одного значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенный речевым каналом, и относящимся к речи содержанием, определенным по меньшей мере одним неречевым каналом многоканального звукового сигнала; и(b) ослабление по меньшей мере одного неречевого канала многоканального звукового сигнала в ответ по меньшей мере на одно значение управления ослаблением.2. Способ по п. 1, отличающийся тем, что каждое значение управления ослаблением, определенное на этапе (а) служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным одним неречевым каналом звукового сигнала, и этап (b) предусматривает этап ослабления указанного неречевого канала в ответ на указанное значение управления ослаблением.3. Способ по п. 1, отличающийся тем, что этап (а) предусматривает этап получения производного неречевого канала из по меньшей мере одного неречевого канала звукового сигнала, и по меньшей мере одно значение управления ослаблением служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным производным неречевым каналом.4. Способ по п. 3, отличающийся тем, что производный неречевой канал получается путем комбинир�

Claims (66)

1. Способ фильтрации многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определяемой сигналом, причем указанный способ отличается тем, что предусматривает следующие этапы:
(a) определение по меньшей мере одного значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенный речевым каналом, и относящимся к речи содержанием, определенным по меньшей мере одним неречевым каналом многоканального звукового сигнала; и
(b) ослабление по меньшей мере одного неречевого канала многоканального звукового сигнала в ответ по меньшей мере на одно значение управления ослаблением.
2. Способ по п. 1, отличающийся тем, что каждое значение управления ослаблением, определенное на этапе (а) служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным одним неречевым каналом звукового сигнала, и этап (b) предусматривает этап ослабления указанного неречевого канала в ответ на указанное значение управления ослаблением.
3. Способ по п. 1, отличающийся тем, что этап (а) предусматривает этап получения производного неречевого канала из по меньшей мере одного неречевого канала звукового сигнала, и по меньшей мере одно значение управления ослаблением служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным производным неречевым каналом.
4. Способ по п. 3, отличающийся тем, что производный неречевой канал получается путем комбинирования первого неречевого канала многоканального звукового сигнала и второго неречевого канала многоканального звукового сигнала.
5. Способ по п. 3, отличающийся тем, что многоканальный звуковой сигнал содержит по меньшей мере два неречевых канала, и этап (b) предусматривает этап ослабления некоторых, но не всех, неречевых каналов в ответ по меньшей мере на одно значение управления ослаблением.
6. Способ по п. 3, отличающийся тем, что многоканальный звуковой сигнал имеет по меньшей мере два неречевых канала, и этап (b) предусматривает этап ослабления всех неречевых каналов в ответ по меньшей мере на одно значение управления ослаблением.
7. Способ по п. 1, отличающийся тем, что этап (b) предусматривает масштабирование необработанного сигнала управления ослаблением для неречевого канала в ответ по меньшей мере на одно значение управления ослаблением.
8. Способ по п. 1, отличающийся тем, что этап (a) предусматривает этап генерирования сигнала управления ослаблением, служащего признаком последовательности значений управления ослаблением, где каждое из значений управления ослаблением служит признаком меры сходства в разное время между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным по меньшей мере одним неречевым каналом многоканального звукового сигнала, и этап (b) предусматривает этапы:
масштабирование сигнала управления усилением с подавлением слабого сигнала более сильным в ответ на сигнал управления ослаблением с целью генерирования масштабированного сигнала управления усилением; и
применение масштабированного сигнала управления усилением для ослабления по меньшей мере одного неречевого канала многоканального звукового сигнала.
9. Способ по п. 8, отличающийся тем, что этап (а) предусматривает этап сравнения первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного по меньшей мере одним неречевым каналом многоканального звукового сигнала, с целью генерирования сигнала управления ослаблением, и каждое из значений управления ослаблением, указываемое сигналом управления ослаблением, служит признаком меры сходства в разное время между первой последовательностью относящихся к речи характерных свойств и второй последовательностью относящихся к речи характерных свойств.
10. Способ по п. 1, отличающийся тем, что каждое указанное значение управления ослаблением монотонно связано с вероятностью того, что по меньшей мере один неречевой канал многоканального звукового сигнала служит признаком усиливающего речь содержания, которое улучшает воспринимаемое качество речевого содержания, определенное речевым каналом.
11. Способ фильтрации многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определенной сигналом, причем указанный способ отличается тем, что предусматривает следующие этапы:
(a) определение по меньшей мере одного значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным неречевым каналом; и
(b) ослабление неречевого канала в ответ по меньшей мере на одно значение управления ослаблением.
12. Способ по п. 11, отличающийся тем, что этап (b) предусматривает масштабирование необработанного сигнала управления ослаблением для неречевого канала в ответ по меньшей мере на одно значение управления ослаблением.
13. Способ по п. 11, отличающийся тем, что этап (a) предусматривает этап генерирования сигнала управления ослаблением, служащего признаком последовательности значений управления ослаблением, где каждое из значений управления ослаблением служит признаком меры сходства в разное время между относящимся к речи содержанием, определяемым речевым каналом, и относящимся к речи содержанием, определяемым неречевым каналом, и этап (b) предусматривает следующие этапы:
масштабирование сигнала управления усилением с подавлением слабого сигнала более сильным в ответ на сигнал управления ослаблением с целью генерирования масштабированного сигнала управления усилением; и
применение масштабированного сигнала управления усилением для ослабления неречевого канала.
14. Способ по п. 13, отличающийся тем, что этап (а) предусматривает этап сравнения первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного неречевым каналом, с целью генерирования сигнала управления ослаблением, и каждое из значений управления ослаблением, указываемое сигналом управления ослаблением, служит признаком меры сходства в разное время между первой последовательностью относящихся к речи характерных свойств и второй последовательностью относящихся к речи характерных свойств.
15. Способ по п. 14, отличающийся тем, что первая последовательность относящихся к речи характерных свойств представляет собой последовательность значений вероятности речи, где каждое их значений вероятности речи указывает вероятность в разное время того, что речевой канал служит признаком речи, и вторая последовательность относящихся к речи характерных свойств представляет собой другую последовательность значений вероятности речи, указывающих вероятность в разное время того, что неречевой канал служит признаком речи.
16. Способ по п. 13, отличающийся тем, что каждое из значений управления ослаблением представляет собой значение управления усилением.
17. Способ по п. 13, отличающийся тем, что каждое указанное значение управления ослаблением монотонно связано с вероятностью того, что неречевой канал служит признаком усиливающего речь содержания, которое улучшает воспринимаемое качество речевого содержания, определяемого речевым каналом.
18. Способ фильтрации многоканального звукового сигнала, содержащего речевой канал и по меньшей мере два неречевых канала, причем указанный способ отличается тем, что предусматривает этапы:
(a) определение по меньшей мере одного первого значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и вторым относящимся к речи содержанием, определенным первым неречевым каналом; и
(b) определение по меньшей мере одного второго значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и третьим относящимся к речи содержанием, определенным вторым неречевым каналом.
19. Способ по п. 18, отличающийся тем, что этап (а) предусматривает этап сравнения первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком второго относящегося к речи содержания, и этап (b) предусматривает этап сравнения первой последовательности относящихся к речи характерных свойств с третьей последовательностью относящихся к речи характерных свойств, служащей признаком третьего относящегося к речи содержания.
20. Способ по п. 18, отличающийся тем, что также предусматривает следующие этапы:
(c) ослабление первого неречевого канала в ответ по меньшей мере на одно первое значение управления ослаблением; и
(d) ослабление второго неречевого канала в ответ по меньшей мере на одно второе значение управления ослаблением.
21. Способ по п. 18, отличающийся тем, что этап (с) предусматривает этап масштабированного ослабления первого неречевого канала в ответ на первое значение управления ослаблением, и этап (d) предусматривает этап масштабированного ослабления второго неречевого канала в ответ на второе значение управления ослаблением.
22. Способ по п. 18, отличающийся тем, что по меньшей мере одно первое значение управления ослаблением, определенное на этапе (а), представляет собой последовательность значений управления ослаблением, и каждое из значений управления ослаблением представляет собой значение управления усилением, предназначенное для масштабирования величины усиления с подавлением слабого сигнала более сильным, применяемого к первому неречевому каналу так, чтобы улучшить разборчивость речи, определяемой речевым каналом, без нежелательного ослабления усиливающего речь содержания, определенного первым неречевым каналом, и
по меньшей мере, одно второе значение управления ослаблением, определенное на этапе (b), представляет собой последовательность вторых значений управления ослаблением, и каждое из вторых значений управления ослаблением представляет собой значение управления усилением, предназначенное для масштабирования величины усиления с подавлением слабого сигнала более сильным, применяемого ко второму неречевому каналу так, чтобы улучшить разборчивость речи, определяемой речевым каналом, без нежелательного ослабления усиливающего речь содержания, определенной вторым неречевым каналом.
23. Способ фильтрации многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определенной сигналом, причем указанный способ отличается тем, что предусматривает следующие этапы:
(a) сравнение характеристики речевого канала и характеристики неречевого канала с целью генерирования по меньшей мере одного значения коэффициента ослабления, предназначенного для управления ослаблением неречевого канала относительно речевого канала; и
(b) корректировку по меньшей мере одного значения коэффициента ослабления в ответ по меньшей мере на одно значение вероятности усиления речи с целью генерирования по меньшей мере одного скорректированного значения коэффициента ослабления, предназначенного для управления ослаблением неречевого канала относительно речевого канала.
24. Способ по п. 23, отличающийся тем, что этап (b) предусматривает масштабирование каждого указанного значения коэффициента ослабления в ответ на одно указанное значение вероятности усиления речи с целью генерирования одного указанного скорректированного значения коэффициента ослабления.
25. Способ по п. 23, отличающийся тем, что каждое указанное значение вероятности усиления речи монотонно связано с вероятностью того, что неречевой канал служит признаком усиливающего речь содержания, которое улучшает воспринимаемое качество речевого содержания, определенного речевым каналом.
26. Способ по п. 23, отличающийся тем, что по меньшей мере одно значение вероятности усиления речи представляет собой последовательность сравнительных значений, и способ предусматривает следующий этап:
определение последовательности сравнительных значений путем сравнения первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного неречевым каналом, где каждое из сравнительных значений представляет собой меру сходства в разное время между первой последовательностью относящихся к речи характерных свойств и второй последовательностью относящихся к речи характерных свойств.
27. Способ по п. 23, отличающийся тем, что также предусматривает этап:
(c) ослабление неречевого канала в ответ по меньшей мере на одно скорректированное значение коэффициента ослабления.
28. Способ по п. 23, отличающийся тем, что этап (b) предусматривает масштабирование каждого указанного значения коэффициента ослабления в ответ на одно указанное значение вероятности усиления речи с целью генерирования одного указанного скорректированного значения коэффициента ослабления.
29. Способ по п. 23, отличающийся тем, что каждое указанное значение коэффициента ослабления, генерируемое на этапе (а), представляет собой первый множитель, служащий признаком величины ослабления неречевого канала, необходимого для ограничения соотношения мощности сигнала в неречевом канале и мощности сигнала в речевом канале так, чтобы оно не превышало предварительно определенное пороговое значение, масштабированный посредством второго множителя, монотонно связанного с вероятностью того, что речевой канал служит признаком речи.
30. Способ по п. 23, отличающийся тем, что каждое указанное значение коэффициента ослабления, генерируемое на этапе (а), представляет собой первый множитель, служащий признаком величины ослабления неречевого канала, достаточной для того, чтобы вызывать превышение предварительно определенного порогового значения прогнозируемой разборчивостью речи, определяемой речевым каналом в присутствии содержания, определенного неречевым каналом, масштабированный посредством второго множителя, монотонно связанного с вероятностью того, что речевой канал служит признаком речи.
31. Способ по п. 23, отличающийся тем, что генерирование на этапе (а) каждого указанного значения коэффициента ослабления предусматривает следующие этапы:
определение спектра мощности, служащего признаком мощности как функции частоты речевого канала, и второго спектра мощности, служащего признаком мощности как функции частоты неречевого канала, и
выполнение определения в частотной области значения коэффициента ослабления в ответ на спектр мощности и второй спектр мощности.
32. Система, предназначенная для усиления речи, определенной многоканальным входным звуковым сигналом, содержащим речевой канал и по меньшей мере один неречевой канал, где указанная система отличается тем, что содержит:
подсистему анализа, сконфигурированную для анализа многоканального входного звукового сигнала с целью генерирования значений управления ослаблением, где каждое из значений управления ослаблением служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным по меньшей мере одним неречевым каналом входного сигнала; и
подсистему ослабления, сконфигурированную для применения ослабления с подавлением слабого сигнала более сильным, управляемого по меньшей мере некоторыми из значений управления ослаблением, к каждому указанному неречевому каналу с целью генерирования фильтрованного выходного звукового сигнала.
33. Система по п. 32, отличающаяся тем, что подсистема ослабления сконфигурирована для масштабирования необработанного сигнала управления ослаблением для по меньшей мере одного указанного неречевого канала в ответ по меньшей мере на подмножество значений управления ослаблением.
34. Система по п. 32, отличающаяся тем, что подсистема анализа сконфигурирована для генерирования сигнала управления ослаблением, служащего признаком последовательности значений управления ослаблением для по меньшей мере одного указанного неречевого канала, где каждое из значений управления ослаблением представляет собой последовательность, которая служит признаком меры сходства в разное время между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным неречевым каналом, и система ослабления сконфигурирована для:
масштабирования сигнала управления усилением с подавлением слабого сигнала более сильным в ответ на сигнал управления ослаблением с целью генерирования масштабированного сигнала управления усилением с подавлением слабого сигнала более сильным; и
применения масштабированного сигнала управления усилением с подавлением слабого сигнала более сильным для ослабления неречевого канала.
35. Система по п. 34, отличающаяся тем, что подсистема анализа сконфигурирована для сравнения первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного неречевым каналом, с целью генерирования сигнала управления ослаблением, и каждое из значений управления ослаблением, указываемое сигналом управления ослаблением, служит признаком меры сходства в разное время между первой последовательностью относящихся к речи характерных свойств и второй последовательностью относящихся к речи характерных свойств.
36. Система по п. 35, отличающаяся тем, что первая последовательность относящихся к речи характерных свойств представляет собой последовательность значений вероятности речи, где каждое из значений вероятности речи указывает вероятность в разное время того, что речевой канал служит признаком речи, и вторая последовательность относящихся к речи характерных свойств представляет собой другую последовательность значений вероятности речи, где каждое из значений вероятности речи указывающих вероятность в разное время того, что неречевой канал служит признаком речи.
37. Система по п. 32, отличающаяся тем, что указанная система содержит процессор, запрограммированный посредством программного обеспечения анализа на анализ многоканального входного звукового сигнала с целью генерирования значений управления ослаблением.
38. Система по п. 37, отличающаяся тем, что процессор запрограммирован посредством программного обеспечения ослабления на применение ослабления с подавлением слабого сигнала более сильным к каждому указанному неречевому каналу с целью генерирования фильтрованного выходного звукового сигнала.
39. Система по п. 32, отличающаяся тем, что указанная система содержит процессор, сконфигурированный для анализа многоканального входного звукового сигнала с целью генерирования значений управления ослаблением и для применения ослабления с подавлением слабого сигнала более сильным к каждому указанному неречевому каналу с целью генерирования фильтрованного выходного звукового сигнала.
40. Система по п. 32, отличающаяся тем, что указанная система представляет собой процессор обработки цифровых звуковых сигналов, который сконфигурирован для анализа многоканального входного звукового сигнала с целью генерирования значений управления ослаблением и для применения ослабления с подавлением слабого сигнала более сильным к каждому указанному неречевому каналу с целью генерирования фильтрованного выходного звукового сигнала.
41. Система по п. 32, отличающаяся тем, что указанная система содержит первую схему, сконфигурированную для реализации подсистемы анализа, и дополнительную схему, связанную с первой схемой и сконфигурированную для реализации подсистемы ослабления.
42. Система по п. 32, отличающаяся тем, что указанная система представляет собой процессор обработки цифровых звуковых сигналов, содержащий первую схему, сконфигурированную для реализации подсистемы анализа, и дополнительную схему, связанную с первой схемой и сконфигурированную для реализации подсистемы ослабления.
43. Система по п. 32, отличающаяся тем, что указанная система представляет собой систему обработки данных, сконфигурированную для реализации подсистемы анализа и подсистемы ослабления.
44. Система, предназначенная для усиления речи, определенной многоканальным входным звуковым сигналом, содержащим речевой канал и по меньшей мере один неречевой канал, где указанная система отличается тем, что содержит:
подсистему анализа, сконфигурированную для анализа многоканального входного звукового сигнала с целью генерирования значений управления ослаблением, где каждое из значений управления ослаблением служит признаком меры сходства между относящимся к речи содержанием, определяемым речевым каналом, и относящимся к речи содержанием, определенным по меньшей мере одним неречевым каналом входного сигнала; и
подсистему ослабления, сконфигурированную для применения ослабления с подавлением слабого сигнала более сильным, управляемого по меньшей мере некоторыми из значений управления ослаблением, к по меньшей мере одному неречевому каналу входного сигнала с целью генерирования фильтрованного выходного звукового сигнала.
45. Система по п. 44, отличающаяся тем, что подсистема анализа сконфигурирована для генерирования каждого из значений управления ослаблением так, чтобы оно служило признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным одним неречевым каналом звукового сигнала, и подсистема ослабления сконфигурирована для применения указанного ослабления с подавлением слабого сигнала более сильным к указанному одному неречевому каналу в ответ на значения управления ослаблением.
46. Система по п. 44, отличающаяся тем, что подсистема анализа сконфигурирована для получения производного неречевого канала из по меньшей мере одного неречевого канала звукового сигнала и для генерирования каждого из по меньшей мере некоторых из значений управления ослаблением так, чтобы оно служило признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным производным неречевым каналом звукового сигнала.
47. Машинно-читаемый носитель данных, который содержит код, предназначенный для программирования процессора на обработку данных, служащих признаком многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определенной сигналом, при помощи способа, отличающегося тем, что он предусматривает этапы:
(a) определения по меньшей мере одного значения управления ослаблением, служащего признаком сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным неречевым каналом;
(b) ослабления неречевого канала в ответ по меньшей мере на одно значение управления ослаблением.
48. Машинно-читаемый носитель данных по п. 47, отличающийся тем, что содержит код, предназначенный для программирования процессора на масштабирование данных, служащих признаком необработанного сигнала управления ослаблением для неречевого канала, в ответ по меньшей мере на одно значение управления ослаблением.
49. Машинно-читаемый носитель данных по п. 47, отличающийся тем, что содержит код, предназначенный для программирования процессора на:
генерирование данных, служащих признаком последовательности значений управления ослаблением, где каждое из значений управления ослаблением служит признаком меры сходства в разное время между относящимся к речи содержанием, определяемым речевым каналом, и относящимся к речи содержанием, определяемым неречевым каналом; и
масштабирование данных, служащих признаком сигнала управления усилением с подавлением слабого сигнала более сильным, в ответ на последовательность значений управления ослаблением с целью генерирования данных, служащих признаком масштабированного сигнала управления усилением с подавлением слабого сигнала более сильным.
50. Машинно-читаемый носитель данных по п. 49, отличающийся тем, что содержит код для программирования процессора на сравнение первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного неречевым каналом, с целью генерирования последовательности значений управления ослаблением так, чтобы каждое из значений управления ослаблением служило признаком меры сходства в разное время между первой последовательностью относящихся к речи характерных свойств и второй последовательностью относящихся к речи характерных свойств.
51. Машинно-читаемый носитель данных по п. 49, отличающийся тем, что первая последовательность относящихся к речи характерных свойств представляет собой последовательность первых значений вероятности речи, где каждое из первых значений вероятности речи указывает вероятность в разное время того, что речевой канал служит признаком речи, и вторая последовательность относящихся к речи характерных свойств представляет собой последовательность вторых значений вероятности речи, где каждое из вторых значений вероятности речи указывает вероятность в разное время того, что неречевой канал служит признаком речи.
52. Машинно-читаемый носитель данных по п. 47, отличающийся тем, что каждое указанное значение управления ослаблением монотонно связано с вероятностью того, что неречевой канал служит признаком усиливающего речь содержания, которое улучшает воспринимаемое качество речевого содержания, определенное речевым каналом.
53. Машинно-читаемый носитель данных, который содержит код, предназначенный для программирования процессора на обработку данных, служащих признаком многоканального звукового сигнала, содержащего речевой канал и по меньшей мере два неречевых канала, с целью улучшения разборчивости речи, определяемой сигналом, при помощи способа, отличающегося тем, что он предусматривает этапы:
(a) определения по меньшей мере одного значения управления ослаблением, служащего признаком сходства между относящимся к речи содержанием, определенным речевым каналом, и вторым относящимся к речи содержанием, определенным первым неречевым каналом; и
(b) определения по меньшей мере одного второго значения управления ослаблением, служащего признаком сходства между относящимся к речи содержанием, определенным речевым каналом, и третьим относящимся к речи содержанием, определенным вторым неречевым каналом.
54. Машинно-читаемый носитель данных по п. 53, отличающийся тем, что содержит код для программирования процессора на сравнение первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком второго относящегося к речи содержания, и на сравнение первой последовательности относящихся к речи характерных свойств с третьей последовательностью относящихся к речи характерных свойств, служащей признаком третьего относящегося к речи содержания.
55. Машинно-читаемый носитель данных по п. 53, отличающийся тем, что содержит код для программирования процессора на ослабление по меньшей мере одного первого неречевого канала в ответ на первое значение управления ослаблением и на ослабление второго неречевого канала в ответ по меньшей мере на одно второе значение управления ослаблением.
56. Машинно-читаемый носитель данных по п. 53, отличающийся тем, что по меньшей мере одно первое значение управления ослаблением представляет собой последовательность значений управления ослаблением, и указанный носитель данных содержит код, предназначенный для программирования процессора на масштабирование величины усиления с подавлением слабого сигнала более сильным, применяемого к первому неречевому каналу в ответ на последовательность значений управления усилением так, чтобы улучшать разборчивость речи, определенной речевым каналом, без нежелательного ослабления усиливающего речь содержания, определенного первым неречевым каналом.
57. Машинно-читаемый носитель данных, который содержит код, предназначенный для программирования процессора на обработку данных, служащих признаком многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определяемой сигналом, при помощи способа, отличающегося тем, что он предусматривает этапы:
(a) сравнения характеристики речевого канала и характеристики неречевого канала с целью генерирования по меньшей мере одного значения коэффициента ослабления, предназначенного для управления ослаблением неречевого канала относительно речевого канала; и
(b) корректировки по меньшей мере одного значения коэффициента ослабления в ответ по меньшей мере на одно значение вероятности усиления речи с целью генерирования по меньшей мере одного скорректированного значения коэффициента ослабления, предназначенного для управления ослаблением неречевого канала относительно речевого канала.
58. Машинно-читаемый носитель данных по п. 57, отличающийся тем, что содержит код для программирования процессора на масштабирование каждого указанного значения коэффициента ослабления в ответ на одно указанное значение вероятности усиления речи с целью генерирования одного указанного скорректированного значения коэффициента ослабления.
59. Машинно-читаемый носитель данных по п. 57, отличающийся тем, что каждое указанное значение вероятности усиления речи монотонно связано с вероятностью того, что неречевой канал служит признаком усиливающего речь содержания, которое улучшает воспринимаемое качество речевого содержания, определенного речевым каналом.
60. Машинно-читаемый носитель данных по п. 57, отличающийся тем, что по меньшей мере одно значение вероятности речи представляет собой последовательность сравнительных значений, и указанный носитель содержит код для программирования процессора на определение последовательности сравнительных значений путем сравнения первой последовательности относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного речевым каналом, со второй последовательностью относящихся к речи характерных свойств, служащей признаком относящегося к речи содержания, определенного неречевым каналом, где каждое из сравнительных значений представляет собой меру сходства в разное время между первой последовательностью относящихся к речи характерных свойств и второй последовательностью относящихся к речи характерных свойств.
61. Машинно-читаемый носитель данных по п. 57, отличающийся тем, что каждое указанное значение коэффициента усиления представляет собой первый множитель, служащий признаком величины ослабления неречевого канала, необходимого для ограничения соотношения мощности сигнала в неречевом канале и мощности сигнала в речевом канале так, чтобы оно не превышало предварительно определенное пороговое значение, масштабированный посредством второго множителя, монотонно связанного с вероятностью того, что речевой канал служит признаком речи.
62. Машинно-читаемый носитель данных по п. 57, отличающийся тем, что каждое указанное значение коэффициента усиления представляет собой первый множитель, служащий признаком величины ослабления неречевого канала, достаточной для того, чтобы вызывать превышение предварительно определенного порогового значения прогнозируемой разборчивостью речи, определенной речевым каналом в присутствии содержания, определенного неречевым каналом, масштабированный посредством второго множителя, монотонно связанного с вероятностью того, что речевой канал служит признаком речи.
63. Машинно-читаемый носитель данных по п. 57, отличающийся тем, что содержит код для программирования процессора на определение спектра мощности, служащего признаком мощности как функции частоты речевого канала, и второго спектра мощности, служащего признаком мощности как функции частоты неречевого канала, и для определения каждого указанного значения коэффициента ослабления в частотной области в ответ на спектр мощности и второй спектр мощности.
64. Машинно-читаемый носитель данных, который содержит код, предназначенный для программирования процессора на обработку данных, служащих признаком многоканального звукового сигнала, содержащего речевой канал и по меньшей мере один неречевой канал, с целью улучшения разборчивости речи, определяемой сигналом, при помощи способа, отличающегося тем, что он предусматривает этапы:
определения по меньшей мере одного значения управления ослаблением, служащего признаком сходства между относящимся к речи содержанием, определяемым речевым каналом, и относящимся к речи содержанием, определяемым по меньшей мере одним неречевым каналом многоканального звукового сигнала; и
генерирования данных, служащих признаком по меньшей мере одного ослабленного неречевого канала многоканального звукового сигнала, в ответ по меньшей мере на одно значение управления ослаблением, где каждый указанный ослабленный неречевой канал был подвергнут ослаблению в ответ по меньшей мере на одно значение управления ослаблением.
65. Машинно-читаемый носитель данных по п. 64, отличающийся тем, что каждое указанное значение управления ослаблением служит признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определенным одним неречевым каналом звукового сигнала.
66. Машинно-читаемый носитель данных по п. 64, отличающийся тем, что содержит код, предназначенный для программирования процессора на обработку данных, служащих признаком многоканального звукового сигнала, которая заключается в: генерировании данных, служащих признаком производного неречевого канала, из по меньшей мере одного неречевого канала звукового сигнала, и определении по меньшей мере одного значения управления ослаблением, служащего признаком меры сходства между относящимся к речи содержанием, определенным речевым каналом, и относящимся к речи содержанием, определяемым производным неречевым каналом.
RU2012141463/08A 2010-03-08 2011-02-28 Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала RU2520420C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US31143710P 2010-03-08 2010-03-08
US61/311,437 2010-03-08
PCT/US2011/026505 WO2011112382A1 (en) 2010-03-08 2011-02-28 Method and system for scaling ducking of speech-relevant channels in multi-channel audio

Publications (2)

Publication Number Publication Date
RU2012141463A true RU2012141463A (ru) 2014-04-20
RU2520420C2 RU2520420C2 (ru) 2014-06-27

Family

ID=43919902

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012141463/08A RU2520420C2 (ru) 2010-03-08 2011-02-28 Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала

Country Status (9)

Country Link
US (2) US9219973B2 (ru)
EP (1) EP2545552B1 (ru)
JP (1) JP5674827B2 (ru)
CN (2) CN104811891B (ru)
BR (2) BR112012022571B1 (ru)
ES (1) ES2709523T3 (ru)
RU (1) RU2520420C2 (ru)
TW (1) TWI459828B (ru)
WO (1) WO2011112382A1 (ru)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2565394T3 (es) * 2011-12-15 2016-04-04 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, método y programa informático para evitar artefactos de recorte
US9781529B2 (en) 2012-03-27 2017-10-03 Htc Corporation Electronic apparatus and method for activating specified function thereof
US9633667B2 (en) * 2012-04-05 2017-04-25 Nokia Technologies Oy Adaptive audio signal filtering
US9230556B2 (en) 2012-06-05 2016-01-05 Apple Inc. Voice instructions during navigation
US9886794B2 (en) 2012-06-05 2018-02-06 Apple Inc. Problem reporting in maps
US9516418B2 (en) * 2013-01-29 2016-12-06 2236008 Ontario Inc. Sound field spatial stabilizer
EP2760021B1 (en) * 2013-01-29 2018-01-17 2236008 Ontario Inc. Sound field spatial stabilizer
CN105409247B (zh) 2013-03-05 2020-12-29 弗劳恩霍夫应用研究促进协会 用于音频信号处理的多声道直接-周围分解的装置及方法
CN114566183A (zh) 2013-04-05 2022-05-31 杜比实验室特许公司 使用高级频谱延拓降低量化噪声的压扩装置和方法
US9271100B2 (en) 2013-06-20 2016-02-23 2236008 Ontario Inc. Sound field spatial stabilizer with spectral coherence compensation
US9099973B2 (en) 2013-06-20 2015-08-04 2236008 Ontario Inc. Sound field spatial stabilizer with structured noise compensation
US9106196B2 (en) 2013-06-20 2015-08-11 2236008 Ontario Inc. Sound field spatial stabilizer with echo spectral coherence compensation
BR112016004299B1 (pt) 2013-08-28 2022-05-17 Dolby Laboratories Licensing Corporation Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida
EP3082588B8 (en) * 2014-01-28 2018-12-19 St. Jude Medical International Holding S.à r.l. Elongate medical devices incorporating a flexible substrate, a sensor, and electrically-conductive traces
US9654076B2 (en) * 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
US8874448B1 (en) * 2014-04-01 2014-10-28 Google Inc. Attention-based dynamic audio level adjustment
US9615170B2 (en) 2014-06-09 2017-04-04 Harman International Industries, Inc. Approach for partially preserving music in the presence of intelligible speech
EP3201918B1 (en) * 2014-10-02 2018-12-12 Dolby International AB Decoding method and decoder for dialog enhancement
BR112017003218B1 (pt) * 2014-12-12 2021-12-28 Huawei Technologies Co., Ltd. Aparelho de processamento de sinal para aprimorar um componente de voz dentro de um sinal de áudio multicanal
EP3251376B1 (en) 2015-01-22 2022-03-16 Eers Global Technologies Inc. Active hearing protection device and method therefore
US9747923B2 (en) * 2015-04-17 2017-08-29 Zvox Audio, LLC Voice audio rendering augmentation
US9947364B2 (en) * 2015-09-16 2018-04-17 Google Llc Enhancing audio using multiple recording devices
JP6567479B2 (ja) * 2016-08-31 2019-08-28 株式会社東芝 信号処理装置、信号処理方法およびプログラム
EP3566229B1 (en) * 2017-01-23 2020-11-25 Huawei Technologies Co., Ltd. An apparatus and method for enhancing a wanted component in a signal
US10013995B1 (en) * 2017-05-10 2018-07-03 Cirrus Logic, Inc. Combined reference signal for acoustic echo cancellation
US11335357B2 (en) * 2018-08-14 2022-05-17 Bose Corporation Playback enhancement in audio systems
CN111354356B (zh) * 2018-12-24 2024-04-30 北京搜狗科技发展有限公司 一种语音数据处理方法及装置
US11335361B2 (en) * 2020-04-24 2022-05-17 Universal Electronics Inc. Method and apparatus for providing noise suppression to an intelligent personal assistant
JP2023530225A (ja) 2020-05-29 2023-07-14 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. 初期オーディオ信号を処理するための方法および装置
CN115881146A (zh) * 2021-08-05 2023-03-31 哈曼国际工业有限公司 用于动态语音增强的方法及系统
WO2023208342A1 (en) * 2022-04-27 2023-11-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for scaling of ducking gains for spatial, immersive, single- or multi-channel reproduction layouts

Family Cites Families (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5666429A (en) * 1994-07-18 1997-09-09 Motorola, Inc. Energy estimator and method therefor
JPH08222979A (ja) * 1995-02-13 1996-08-30 Sony Corp オーディオ信号処理装置、およびオーディオ信号処理方法、並びにテレビジョン受像機
US5920834A (en) * 1997-01-31 1999-07-06 Qualcomm Incorporated Echo canceller with talk state determination to control speech processor functional elements in a digital telephone system
US5983183A (en) * 1997-07-07 1999-11-09 General Data Comm, Inc. Audio automatic gain control system
US20020002455A1 (en) * 1998-01-09 2002-01-03 At&T Corporation Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system
US6226321B1 (en) * 1998-05-08 2001-05-01 The United States Of America As Represented By The Secretary Of The Air Force Multichannel parametric adaptive matched filter receiver
DE60034212T2 (de) * 1999-01-07 2008-01-17 Tellabs Operations, Inc., Naperville Verfahren und vorrichtung zur adaptiven rauschunterdrückung
US6442278B1 (en) * 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
KR100304666B1 (ko) * 1999-08-28 2001-11-01 윤종용 음성 향상 방법
ATE330818T1 (de) * 1999-11-24 2006-07-15 Donnelly Corp Rückblickspiegel mit nutzfunktion
AU2066501A (en) * 1999-12-06 2001-06-12 Dmi Biosciences, Inc. Noise reducing/resolution enhancing signal processing method and system
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
JP2001268700A (ja) * 2000-03-17 2001-09-28 Fujitsu Ten Ltd 音響装置
US6766292B1 (en) * 2000-03-28 2004-07-20 Tellabs Operations, Inc. Relative noise ratio weighting techniques for adaptive noise cancellation
US6523003B1 (en) * 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
US20040096065A1 (en) * 2000-05-26 2004-05-20 Vaudrey Michael A. Voice-to-remaining audio (VRA) interactive center channel downmix
US20070233479A1 (en) * 2002-05-30 2007-10-04 Burnett Gregory C Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors
JP4282227B2 (ja) * 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
US20020159434A1 (en) * 2001-02-12 2002-10-31 Eleven Engineering Inc. Multipoint short range radio frequency system
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
WO2003001173A1 (en) * 2001-06-22 2003-01-03 Rti Tech Pte Ltd A noise-stripping device
WO2003022003A2 (en) * 2001-09-06 2003-03-13 Koninklijke Philips Electronics N.V. Audio reproducing device
JP2003084790A (ja) * 2001-09-17 2003-03-19 Matsushita Electric Ind Co Ltd 台詞成分強調装置
US8942387B2 (en) * 2002-02-05 2015-01-27 Mh Acoustics Llc Noise-reducing directional microphone array
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
JP3810004B2 (ja) 2002-03-15 2006-08-16 日本電信電話株式会社 ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム
DE60325595D1 (de) * 2002-07-01 2009-02-12 Koninkl Philips Electronics Nv Von der stationären spektralleistung abhängiges audioverbesserungssystem
JP4219898B2 (ja) * 2002-10-31 2009-02-04 富士通株式会社 音声強調装置
US7305097B2 (en) * 2003-02-14 2007-12-04 Bose Corporation Controlling fading and surround signal level
US8271279B2 (en) * 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7127076B2 (en) * 2003-03-03 2006-10-24 Phonak Ag Method for manufacturing acoustical devices and for reducing especially wind disturbances
US8724822B2 (en) * 2003-05-09 2014-05-13 Nuance Communications, Inc. Noisy environment communication enhancement system
DK1509065T3 (da) * 2003-08-21 2006-08-07 Bernafon Ag Fremgangsmåde til behandling af audiosignaler
DE102004049347A1 (de) * 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
US8543390B2 (en) * 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US7610196B2 (en) * 2004-10-26 2009-10-27 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US8170879B2 (en) * 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US8306821B2 (en) * 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
KR100679044B1 (ko) * 2005-03-07 2007-02-06 삼성전자주식회사 사용자 적응형 음성 인식 방법 및 장치
US8280730B2 (en) * 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
JP4670483B2 (ja) * 2005-05-31 2011-04-13 日本電気株式会社 雑音抑圧の方法及び装置
JP5092748B2 (ja) * 2005-09-02 2012-12-05 日本電気株式会社 雑音抑圧の方法及び装置並びにコンピュータプログラム
US20070053522A1 (en) * 2005-09-08 2007-03-08 Murray Daniel J Method and apparatus for directional enhancement of speech elements in noisy environments
JP4356670B2 (ja) * 2005-09-12 2009-11-04 ソニー株式会社 雑音低減装置及び雑音低減方法並びに雑音低減プログラムとその電子機器用収音装置
US7366658B2 (en) * 2005-12-09 2008-04-29 Texas Instruments Incorporated Noise pre-processor for enhanced variable rate speech codec
WO2007098258A1 (en) * 2006-02-24 2007-08-30 Neural Audio Corporation Audio codec conditioning system and method
JP4738213B2 (ja) * 2006-03-09 2011-08-03 富士通株式会社 利得調整方法及び利得調整装置
US7555075B2 (en) * 2006-04-07 2009-06-30 Freescale Semiconductor, Inc. Adjustable noise suppression system
EP2064915B1 (en) * 2006-09-14 2014-08-27 LG Electronics Inc. Controller and user interface for dialogue enhancement techniques
US20080082320A1 (en) * 2006-09-29 2008-04-03 Nokia Corporation Apparatus, method and computer program product for advanced voice conversion
DE602006005684D1 (de) * 2006-10-31 2009-04-23 Harman Becker Automotive Sys Modellbasierte Verbesserung von Sprachsignalen
US8615393B2 (en) * 2006-11-15 2013-12-24 Microsoft Corporation Noise suppressor for speech recognition
EP2092789A4 (en) * 2006-12-12 2009-12-23 Thx Ltd DYNAMIC SURROUND CHANNEL VOLUME CONTROL
JP2008148179A (ja) * 2006-12-13 2008-06-26 Fujitsu Ltd 音声信号処理装置および自動利得制御装置における雑音抑圧処理方法
ATE474312T1 (de) * 2007-02-12 2010-07-15 Dolby Lab Licensing Corp Verbessertes verhältnis von sprachlichen zu nichtsprachlichen audio-inhalten für ältere oder hörgeschädigte zuhörer
US8195454B2 (en) * 2007-02-26 2012-06-05 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
JP2008216720A (ja) * 2007-03-06 2008-09-18 Nec Corp 信号処理の方法、装置、及びプログラム
US20090010453A1 (en) * 2007-07-02 2009-01-08 Motorola, Inc. Intelligent gradient noise reduction system
GB2450886B (en) * 2007-07-10 2009-12-16 Motorola Inc Voice activity detector and a method of operation
US8600516B2 (en) * 2007-07-17 2013-12-03 Advanced Bionics Ag Spectral contrast enhancement in a cochlear implant speech processor
DE102007048973B4 (de) 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
US8326617B2 (en) * 2007-10-24 2012-12-04 Qnx Software Systems Limited Speech enhancement with minimum gating
KR101444100B1 (ko) * 2007-11-15 2014-09-26 삼성전자주식회사 혼합 사운드로부터 잡음을 제거하는 방법 및 장치
US8296136B2 (en) * 2007-11-15 2012-10-23 Qnx Software Systems Limited Dynamic controller for improving speech intelligibility
WO2009086174A1 (en) * 2007-12-21 2009-07-09 Srs Labs, Inc. System for adjusting perceived loudness of audio signals
WO2009084914A1 (en) * 2008-01-01 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8654994B2 (en) * 2008-01-01 2014-02-18 Lg Electronics Inc. Method and an apparatus for processing an audio signal
EP2269188B1 (en) * 2008-03-14 2014-06-11 Dolby Laboratories Licensing Corporation Multimode coding of speech-like and non-speech-like signals
MY159890A (en) * 2008-04-18 2017-02-15 Dolby Laboratories Licensing Corp Method and apparatus for maintaining speech audibiliy in multi-channel audio with minimal impact on surround experience
US9373339B2 (en) * 2008-05-12 2016-06-21 Broadcom Corporation Speech intelligibility enhancement system and method
US8321214B2 (en) * 2008-06-02 2012-11-27 Qualcomm Incorporated Systems, methods, and apparatus for multichannel signal amplitude balancing
WO2010003068A1 (en) 2008-07-03 2010-01-07 The Board Of Trustees Of The University Of Illinois Systems and methods for identifying speech sound features
US20100008520A1 (en) * 2008-07-09 2010-01-14 Yamaha Corporation Noise Suppression Estimation Device and Noise Suppression Device
WO2010064877A2 (en) * 2008-12-05 2010-06-10 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8185389B2 (en) * 2008-12-16 2012-05-22 Microsoft Corporation Noise suppressor for robust speech recognition
WO2010068997A1 (en) * 2008-12-19 2010-06-24 Cochlear Limited Music pre-processing for hearing prostheses
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
DK2389773T3 (en) * 2009-01-20 2017-06-19 Widex As HEARING AND A PROCEDURE TO DETECT AND MUTE TRANSIENTS
WO2010085083A2 (en) * 2009-01-20 2010-07-29 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US8428758B2 (en) * 2009-02-16 2013-04-23 Apple Inc. Dynamic audio ducking
WO2010104299A2 (en) * 2009-03-08 2010-09-16 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
FR2948484B1 (fr) * 2009-07-23 2011-07-29 Parrot Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
US8538042B2 (en) * 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US8644517B2 (en) * 2009-08-17 2014-02-04 Broadcom Corporation System and method for automatic disabling and enabling of an acoustic beamformer
EP2475423B1 (en) * 2009-09-11 2016-12-14 Advanced Bionics AG Dynamic noise reduction in auditory prosthesis systems
US8204742B2 (en) * 2009-09-14 2012-06-19 Srs Labs, Inc. System for processing an audio signal to enhance speech intelligibility
EP2486567A1 (en) * 2009-10-09 2012-08-15 Dolby Laboratories Licensing Corporation Automatic generation of metadata for audio dominance effects
US20110099596A1 (en) * 2009-10-26 2011-04-28 Ure Michael J System and method for interactive communication with a media device user such as a television viewer
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US9324337B2 (en) * 2009-11-17 2016-04-26 Dolby Laboratories Licensing Corporation Method and system for dialog enhancement
US20110125494A1 (en) * 2009-11-23 2011-05-26 Cambridge Silicon Radio Limited Speech Intelligibility
US8553892B2 (en) * 2010-01-06 2013-10-08 Apple Inc. Processing a multi-channel signal for output to a mono speaker
KR101405976B1 (ko) * 2010-01-06 2014-06-12 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US20110178800A1 (en) * 2010-01-19 2011-07-21 Lloyd Watts Distortion Measurement for Noise Suppression System

Also Published As

Publication number Publication date
BR112012022571B1 (pt) 2020-11-17
TW201215177A (en) 2012-04-01
US20130006619A1 (en) 2013-01-03
ES2709523T3 (es) 2019-04-16
JP2013521541A (ja) 2013-06-10
US9219973B2 (en) 2015-12-22
EP2545552B1 (en) 2018-12-12
CN102792374B (zh) 2015-05-27
CN104811891A (zh) 2015-07-29
US20160071527A1 (en) 2016-03-10
JP5674827B2 (ja) 2015-02-25
CN102792374A (zh) 2012-11-21
BR112012022571A2 (pt) 2016-08-30
BR122019024041B1 (pt) 2020-08-11
TWI459828B (zh) 2014-11-01
WO2011112382A1 (en) 2011-09-15
CN104811891B (zh) 2017-06-27
EP2545552A1 (en) 2013-01-16
US9881635B2 (en) 2018-01-30
RU2520420C2 (ru) 2014-06-27

Similar Documents

Publication Publication Date Title
RU2012141463A (ru) Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала
US11580995B2 (en) Reconstruction of audio scenes from a downmix
JP6517723B2 (ja) 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法
JP7427752B2 (ja) 時間領域デコーダにおける量子化雑音を低減するためのデバイスおよび方法
EP3522157B1 (en) Concept for combined dynamic range compression and guided clipping prevention for audio devices
US8831958B2 (en) Method and an apparatus for a bandwidth extension using different schemes
EP3039675B1 (en) Parametric speech enhancement
KR102517285B1 (ko) 오디오 신호를 처리하기 위한 장치 및 방법
CN101968781B (zh) 在音频编码过程中根据mdct数据进行视窗类型判定的方法
EP2116997A1 (en) Audio decoding device and audio decoding method
US10692513B2 (en) Low-frequency emphasis for LPC-based coding in frequency domain
JP2020512598A (ja) トランジェント位置検出を使用したオーディオ信号の後処理のための装置
RU2015117332A (ru) Избирательный басовый постфильтр
IL186046A (en) Economical loudness measurement of coded audio
JP2018045244A (ja) 低レートcelpデコーダに関する非音声コンテンツの向上
WO2009142466A2 (ko) 오디오 신호 처리 방법 및 장치
CN105103230B (zh) 信号处理装置、信号处理方法、信号处理程序
CN105144290B (zh) 信号处理装置、信号处理方法和信号处理程序
RU2662693C2 (ru) Устройство декодирования, устройство кодирования, способ декодирования и способ кодирования
KR20130109793A (ko) 잡음 감쇄를 위한 오디오 신호 부호화 방법 및 장치
KR101108955B1 (ko) 오디오 신호 처리 방법 및 장치
KR101096091B1 (ko) 음성 분리 장치 및 이를 이용한 단일 채널 음성 분리 방법
US20130304462A1 (en) Signal processing apparatus and method and program
WO2023192039A1 (en) Source separation combining spatial and source cues