RU2006126530A - Способ и устройство для улучшения речевого сигнала в присутствии фонового шума - Google Patents

Способ и устройство для улучшения речевого сигнала в присутствии фонового шума Download PDF

Info

Publication number
RU2006126530A
RU2006126530A RU2006126530/09A RU2006126530A RU2006126530A RU 2006126530 A RU2006126530 A RU 2006126530A RU 2006126530/09 A RU2006126530/09 A RU 2006126530/09A RU 2006126530 A RU2006126530 A RU 2006126530A RU 2006126530 A RU2006126530 A RU 2006126530A
Authority
RU
Russia
Prior art keywords
frequency
frequency bands
speech
noise
scaling
Prior art date
Application number
RU2006126530/09A
Other languages
English (en)
Other versions
RU2329550C2 (ru
Inventor
Милан ДЖЕЛИНЕК (CA)
Милан ДЖЕЛИНЕК
Original Assignee
Нокиа Корпорейшн (Fi)
Нокиа Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Нокиа Корпорейшн (Fi), Нокиа Корпорейшн filed Critical Нокиа Корпорейшн (Fi)
Publication of RU2006126530A publication Critical patent/RU2006126530A/ru
Application granted granted Critical
Publication of RU2329550C2 publication Critical patent/RU2329550C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Telephone Function (AREA)
  • Devices For Executing Special Programs (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Claims (83)

1. Способ подавления шумов в речевом сигнале, включающий:
проведение частотного анализа для создания спектрального представления речевого сигнала, содержащего множество частотных бинов, и
группировку частотных бинов в множество полос частот, отличающийся тем, что, когда в речевом сигнале обнаруживают вокализованную речевую активность, для первого количества полос частот подавление шумов выполняют по частотным бинам, а для второго количества полос частот подавление шумов выполняют по полосам частот.
2. Способ по п.1, в котором первое количество полос частот определяют по количеству полос частот, которые являются вокализованными.
3. Способ по п.1, в котором первое количество полос частот определяют относительно граничной частоты вокализованности, которая является частотой, ниже которой речевой сигнал считают вокализованным.
4. Способ по п.3, в котором первое количество полос частот включает все полосы частот речевого сигнала, которые имеют верхнюю частоту, не превышающую граничной частоты вокализованности.
5. Способ по п.1, в котором первое количество полос частот равно заранее заданному фиксированному числу.
6. Способ по п.1, в котором, если ни одна из полос частот в речевом сигнале не является вокализованной, подавление шумов выполняют по полосам частот для всех полос частот.
7. Способ по п.1, в котором речевой сигнал включает речевые кадры, содержащие множество отсчетов, и способ по п.1 применяют для подавления шумов в речевом кадре.
8. Способ по п.7, включающий проведение частотного анализа согласно способу по п.1 с использованием окна анализа, которое смещено на m отсчетов относительно первого отсчета речевого кадра.
9. Способ по п.7, включающий проведение первого частотного анализа с использованием первого окна анализа, которое смещено на m отсчетов относительно первого отсчета речевого кадра, и второго окна анализа, которое смещено на p отсчетов относительно первого отсчета речевого кадра.
10. Способ по п.9, в котором m=24 и p=128.
11. Способ по п.9, в котором второе окно анализа имеет опережающую часть, которая выходит из указанного речевого кадра в последующий речевой кадр речевого сигнала.
12. Способ по п.1, включающий подавление шумов путем применения масштабирующего коэффициента передачи к частотным бинам и/или полосам частот.
13. Способ по п.1, который при подавлении шумов по частотным бинам включает определение специфичного для частотного бина масштабирующего коэффициента передачи.
14. Способ по п.1, который при подавлении шумов по полосам частот включает определение специфичного для полосы частот масштабирующего коэффициента передачи.
15. Способ по п.6, включающий подавление шумов путем применения постоянного масштабирующего коэффициента передачи для всех полос частот.
16. Способ по п.13, включающий определение значения масштабирующего коэффициента передачи для частотного бина на основе отношения сигнал/шум (SNR), определенного для этого частотного бина.
17. Способ по п.14, включающий определение значения масштабирующего коэффициента передачи для полосы частот на основе отношения сигнал/шум (SNR), определенного для этой полосы частот.
18. Способ по п.16, включающий выполнение шагов по п.16 для каждого из первого и второго частотных анализов.
19. Способ по п.17, включающий выполнение шагов по п.17 для каждого из первого и второго частотных анализов.
20. Способ по любому из пп.12-14, в котором масштабирующий коэффициент передачи представляет собой сглаженный масштабирующий коэффициент передачи.
21. Способ по любому из пп.12-14, включающий вычисление сглаженного масштабирующего коэффициента передачи, который должен быть применен к конкретному частотному бину или конкретной полосе частот, с использованием коэффициента сглаживания, величина которого находится в обратном отношении к масштабирующему коэффициенту передачи для конкретного частотного бина или конкретной полосы частот.
22. Способ по любому из пп.12-14, включающий вычисление сглаженного масштабирующего коэффициента передачи, который должен быть применен к конкретному частотному бину или конкретной полосе частот, с использованием коэффициента сглаживания, значение которого определяют так, чтобы сглаживание было сильнее для меньших значений масштабирующего коэффициента передачи.
23. Способ по п.13 или 14, в котором определение значения масштабирующего коэффициента передачи происходит n раз за речевой кадр, где n больше единицы.
24. Способ по п.23, в котором n=2.
25. Способ по п.13 или 14, включающий определение значения масштабирующего коэффициента передачи n раз за речевой кадр, где n больше единицы, а граничная частоты вокализованности по меньшей мере частично зависит от речевого сигнала в предыдущем речевом кадре.
26. Способ по п.13, в котором подавление шумов по частотным бинам выполняют максимально на 74 бинах, соответствующих 17 полосам частот.
27. Способ по п.13, в котором подавление шумов по частотным бинам выполняют на максимальном количестве частотных бинов, соответствующем частоте 3700 Гц.
28. Способ по п.16, в котором для первого значения отношения сигнал/шум величину масштабирующего коэффициента передачи устанавливают на минимальное значение, а для второго значения отношения сигнал/шум, большего, чем первое значение отношения сигнал/шум, величину масштабирующего коэффициента передачи устанавливают равной единице.
29. Способ по п.28, в котором первое значение отношения сигнал/шум составляет около 1 дБ, а второе значение отношения сигнал/шум составляет около 45 дБ.
30. Способ по п.20, включающий обнаружение сегментов речевого сигнала, которые не содержат активной речи.
31. Способ по п.30, включающий возврат сглаженного масштабирующего коэффициента передачи к минимальному значению в ответ на обнаружение сегмента речевого сигнала, который не содержит активной речи.
32. Способ по п.7, в котором подавление шумов не выполняют, если максимальная энергия шумов в множестве полос частот лежит ниже порогового значения.
33. Способ по п.7, дополнительно включающий, в ответ на появление речевого кадра, соответствующего короткому периоду поддержания в силе решения об обнаружении речевой активности, выполнение подавления шумов путем применения масштабирующего коэффициента передачи, определенного по полосам частот для первых х полос частот, а для оставшихся полос частот - выполнение подавления шумов путем применения единого значения масштабирующего коэффициента передачи.
34. Способ по п.33, в котором первые х полос частот соответствуют частотам до 1700 Гц.
35. Способ по п.20, который для узкополосного речевого сигнала дополнительно включает выполнение подавления шумов путем применения сглаженных масштабирующих коэффициентов передачи, определенных по полосам частот, для первых х полос частот, соответствующих частотам до 3700 Гц, выполнение подавления шумов путем применения значения масштабирующего коэффициента передачи частотного бина, соответствующего 3700 Гц, к бинам между частотами 3700 и 4000 Гц, и обнуление оставшихся полос частот частотного спектра речевого сигнала.
36. Способ по п.35, в котором узкополосный речевой сигнал преобразован с повышением частоты дискретизации до 12800 Гц.
37. Способ по п.3, дополнительно включающий определение граничной частоты вокализованности с использованием вычисленной меры вокализованности.
38. Способ по п.37, дополнительно включающий определение множества критических полос, имеющих верхнюю частоту, которая не превышает граничную частоту вокализованности, причем границы установлены так, что подавление шумов по частотным бинам выполняют минимально на х полосах и максимально на у полосах.
39. Способ по п.38, в котором х=3 и у=17.
40. Способ по п.37, в котором граничную частоту вокализованности ограничивают так, чтобы она была не менее 325 Гц и не более 3700 Гц.
41. Устройство для подавления шумов в речевом сигнале, выполненное с возможностью:
проведения частотного анализа для создания спектрального представления речевого сигнала, содержащего множество частотных бинов, и
группировки частотных бинов в множество полос частот,
отличающееся тем, что оно выполнено с возможностью обнаруживать вокализованную речевую активность и при обнаружении в речевом сигнале вокализованной речевой активности выполнять для первого количества полос частот подавление шумов по частотным бинам, а для второго количества полос частот - подавление шумов по полосам частот.
42. Устройство по п.41, в котором первое количество полос частот определяется по количеству полос частот, которые являются вокализованными.
43. Устройство по п.41, которое выполнено с возможностью определять первое количество полос частот относительно граничной частоты вокализованности, которая является частотой, ниже которой речевой сигнал считается вокализованным.
44. Устройство по п.43, в котором первое количество полос частот включает все полосы частот речевого сигнала, которые имеют верхнюю частоту, не превышающую граничной частоты вокализованности.
45. Устройство по п.41, в котором первое количество полос частот равно заранее заданному фиксированному числу.
46. Устройство по п.41, которое выполнено с возможностью подавления шумов по полосам частот для всех полос частот, если ни одна полоса частот речевого сигнала не является вокализованной.
47. Устройство по п.41, в котором речевой сигнал включает речевые кадры, содержащие множество отсчетов, а указанное устройство выполнено с возможностью подавлять шум в речевом кадре.
48. Устройство по п.47, выполненное с возможностью проводить указанный частотный анализ с использованием окна анализа, которое смещено на m отсчетов относительно первого отсчета речевого кадра.
49. Устройство по п.47, выполненное с возможностью проводить первый частотный анализ с использованием первого окна анализа, которое смещено на m отсчетов относительно первого отсчета речевого кадра, и второго окна анализа, которое смещено на p отсчетов относительно первого отсчета речевого кадра.
50. Устройство по п.49, в котором m=24 и p=128.
51. Устройство по п.49, в котором второе окно анализа имеет опережающую часть, которая выходит из указанного речевого кадра в последующий речевой кадр речевого сигнала.
52. Устройство по п.41, которое выполнено с возможностью подавления шумов путем применения масштабирующих коэффициентов передачи к частотным бинам и/или полосам частот.
53. Устройство по п.41, которое выполнено с возможностью при подавлении шумов по частотным бинам определять специфичный для частотного бина масштабирующий коэффициент передачи.
54. Устройство по п.41, которое выполнено с возможностью при подавлении шумов по полосам частот определять специфичный для полосы частот масштабирующий коэффициент передачи.
55. Устройство по п.46, которое выполнено с возможностью выполнять подавление шумов путем применения постоянного масштабирующего коэффициента передачи для всех полос частот.
56. Устройство по п.53, которое выполнено с возможностью определять значение масштабирующего коэффициента передачи для частотного бина на основе отношения сигнал/шум (SNR), определенного для этого частотного бина.
57. Устройство по п.54, которое выполнено с возможностью определять значение масштабирующего коэффициента передачи для полосы частот на основе отношения сигнал/шум (SNR), определенного для этой полосы частот.
58. Устройство по п.56, которое выполнено с возможностью выполнения шагов по п.56 для каждого из первого и второго частотных анализов.
59. Устройство по п.57, которое выполнено с возможностью выполнения шагов по п.57 для каждого из первого и второго частотных анализов.
60. Устройство по любому из пп.52-54, в котором масштабирующий коэффициент передачи представляет собой сглаженный масштабирующий коэффициент передачи.
61. Устройство по любому из пп.52-54, которое выполнено с возможностью вычисления сглаженного масштабирующего коэффициента передачи, который должен быть применен к конкретному частотному бину или конкретной полосе частот, с использованием коэффициента сглаживания, величина которого находится в обратной зависимости от масштабирующего коэффициента передачи для конкретного бина или конкретной полосы частот.
62. Устройство по любому из пп.52-54, которое выполнено с возможностью вычисления сглаженного масштабирующего коэффициента передачи, который должен быть применен к конкретному частотному бину или конкретной полосе частот, с использованием коэффициента сглаживания, значение которого определяется так, чтобы сглаживание было сильнее для меньших значений масштабирующего коэффициента передачи.
63. Устройство по п.53 или 54, которое выполнено с возможностью определения значения масштабирующего коэффициента передачи n раз за речевой кадр, где n больше единицы.
64. Устройство по п.63, в котором n=2.
65. Устройство по п.53 или 54, которое выполнено с возможностью определения значения масштабирующего коэффициента передачи n раз за речевой кадр, где n больше единицы, а граничная частоты вокализованности по меньшей мере частично зависит от речевого сигнала в предыдущем речевом кадре.
66. Устройство по п.53, которое выполнено с возможностью подавления шумов по частотным бинам максимально на 74 бинах, соответствующих 17 полосам частот.
67. Устройство по п.53, которое выполнено с возможностью подавления шумов по частотным бинам на максимальном количестве частотных бинов, соответствующем частоте 3700 Гц.
68. Устройство по п.56, которое выполнено с возможностью устанавливать величину масштабирующего коэффициента передачи на минимальное значение для первого значения отношения сигнал/шум и устанавливать величину масштабирующего коэффициента передачи равной единице для второго значения отношения сигнал/шум, большего, чем первое значение отношения сигнал/шум.
69. Устройство по п.68, в котором первое значение отношения сигнал/шум составляет около 1 дБ, а второе значение отношения сигнал/шум составляет около 45 дБ.
70. Устройство по п.60, выполненное с возможностью обнаруживать сегменты речевого сигнала, которые не содержат активной речи.
71. Устройство по п.70, выполненное с возможностью осуществлять возврат сглаженного масштабирующего коэффициента передачи к минимальному значению в ответ на обнаружение сегмента речевого сигнала, который не содержит активной речи.
72. Устройство по п.47, выполненное с возможностью не выполнять подавления шумов, если максимальная энергия шумов в множестве полос частот лежит ниже порогового значения.
73. Устройство по п.47, которое выполнено с возможностью в ответ на появление речевого кадра, соответствующего короткому периоду поддержания в силе решения об обнаружении речевой активности, выполнять подавление шумов путем применения масштабирующего коэффициента передачи, определенного по полосам частот для первых х полос частот, а для оставшихся полос частот выполнять подавление шумов путем применения единого значения масштабирующего коэффициента передачи.
74. Устройство по п.73, в котором первые х полос частот соответствуют частотам до 1700 Гц.
75. Устройство по п.60, которое выполнено с возможностью для узкополосного речевого сигнала выполнять подавление шумов путем применения сглаженных масштабирующих коэффициентов передачи, определенных по полосам частот, для первых х полос частот, соответствующих частотам до 3700 Гц, выполнять подавление шумов путем применения сглаженного масштабирующего коэффициента передачи частотного бина, соответствующего 3700 Гц, к бинам между 3700 и 4000 Гц и обнулять оставшиеся полосы частот частотного спектра речевого сигнала.
76. Устройство по п.75, в котором узкополосный речевой сигнал преобразован с повышением частоты дискретизации до 12800 Гц.
77. Устройство по п.43, которое выполнено с возможностью определения граничной частоты вокализованности с использованием вычисленной меры вокализованности.
78. Устройство по п.77, которое выполнено с возможностью определения множества критических полос, имеющих верхнюю частоту, которая не превышает граничную частоту вокализованности, причем границы устанавливаются так, что подавление шумов по частотным бинам выполняется минимально на х полосах и максимально на у полосах.
79. Устройство по п.78, в котором х=3 и y=17.
80. Устройство по п.77, в котором граничная частота вокализованности ограничена так, чтобы она была не менее 325 Гц и не более 3700 Гц.
81. Речевой кодер, включающий устройство для подавления шумов, выполненное с возможностью:
проведения частотного анализа для создания спектрального представления речевого сигнала, содержащего множество частотных бинов, и
группировки частотных бинов в множество полос частот,
отличающийся тем, что указанное устройство выполнено с возможностью обнаруживать вокализованную речевую активность и при обнаружении в речевом сигнале вокализованной речевой активности выполнять для первого количества полос частот подавление шумов по частотным бинам, а для второго количества полос частот - подавление шумов по полосам частот.
82. Система автоматического распознавания речи, включающая устройство для подавления шумов, выполненное с возможностью:
проведения частотного анализа для создания спектрального представления речевого сигнала, содержащего множество частотных бинов, и
группировки частотных бинов в множество полос частот,
отличающаяся тем, что указанное устройство выполнено с возможностью обнаруживать вокализованную речевую активность и при обнаружении в речевом сигнале вокализованной речевой активности выполнять для первого количества полос частот подавление шумов по частотным бинам, а для второго количества полос частот - подавление шумов по полосам частот.
83. Мобильный телефон, включающий устройство для подавления шумов, выполненное с возможностью:
проведения частотного анализа для создания спектрального представления речевого сигнала, содержащего множество частотных бинов, и
группировки частотных бинов в множество полос частот,
отличающийся тем, что указанное устройство выполнено с возможностью обнаруживать вокализованную речевую активность и при обнаружении в речевом сигнале вокализованной речевой активности выполнять для первого количества полос частот подавление шумов по частотным бинам, а для второго количества полос частот - подавление шумов по полосам частот.
RU2006126530/09A 2003-12-29 2004-12-29 Способ и устройство для улучшения речевого сигнала в присутствии фонового шума RU2329550C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CA2454296 2003-12-29
CA002454296A CA2454296A1 (en) 2003-12-29 2003-12-29 Method and device for speech enhancement in the presence of background noise

Publications (2)

Publication Number Publication Date
RU2006126530A true RU2006126530A (ru) 2008-02-10
RU2329550C2 RU2329550C2 (ru) 2008-07-20

Family

ID=34683070

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2006126530/09A RU2329550C2 (ru) 2003-12-29 2004-12-29 Способ и устройство для улучшения речевого сигнала в присутствии фонового шума

Country Status (19)

Country Link
US (1) US8577675B2 (ru)
EP (1) EP1700294B1 (ru)
JP (1) JP4440937B2 (ru)
KR (1) KR100870502B1 (ru)
CN (1) CN100510672C (ru)
AT (1) ATE441177T1 (ru)
AU (1) AU2004309431C1 (ru)
BR (1) BRPI0418449A (ru)
CA (2) CA2454296A1 (ru)
DE (1) DE602004022862D1 (ru)
ES (1) ES2329046T3 (ru)
HK (1) HK1099946A1 (ru)
MX (1) MXPA06007234A (ru)
MY (1) MY141447A (ru)
PT (1) PT1700294E (ru)
RU (1) RU2329550C2 (ru)
TW (1) TWI279776B (ru)
WO (1) WO2005064595A1 (ru)
ZA (1) ZA200606215B (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2644527C2 (ru) * 2010-01-19 2018-02-12 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование на основе блока поддиапазонов

Families Citing this family (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7113580B1 (en) * 2004-02-17 2006-09-26 Excel Switching Corporation Method and apparatus for performing conferencing services and echo suppression
CN101014997B (zh) * 2004-02-18 2012-04-04 皇家飞利浦电子股份有限公司 用于生成用于自动语音识别器的训练数据的方法和系统
DE102004049347A1 (de) * 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
EP1864281A1 (en) * 2005-04-01 2007-12-12 QUALCOMM Incorporated Systems, methods, and apparatus for highband burst suppression
PL1875463T3 (pl) * 2005-04-22 2019-03-29 Qualcomm Incorporated Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia
JP4765461B2 (ja) * 2005-07-27 2011-09-07 日本電気株式会社 雑音抑圧システムと方法及びプログラム
US7366658B2 (en) * 2005-12-09 2008-04-29 Texas Instruments Incorporated Noise pre-processor for enhanced variable rate speech codec
US7930178B2 (en) * 2005-12-23 2011-04-19 Microsoft Corporation Speech modeling and enhancement based on magnitude-normalized spectra
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US7593535B2 (en) * 2006-08-01 2009-09-22 Dts, Inc. Neural network filtering techniques for compensating linear and non-linear distortion of an audio transducer
CN101246688B (zh) * 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
US8195454B2 (en) 2007-02-26 2012-06-05 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
TWI420509B (zh) * 2007-03-19 2013-12-21 Dolby Lab Licensing Corp 語音增強用雜訊變異量估計器
CN101320559B (zh) * 2007-06-07 2011-05-18 华为技术有限公司 一种声音激活检测装置及方法
JP5395066B2 (ja) * 2007-06-22 2014-01-22 ヴォイスエイジ・コーポレーション 音声区間検出および音声信号分類ための方法および装置
JP2010539792A (ja) * 2007-09-12 2010-12-16 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション スピーチ増強
US8892432B2 (en) * 2007-10-19 2014-11-18 Nec Corporation Signal processing system, apparatus and method used on the system, and program thereof
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
US8554550B2 (en) 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multi resolution analysis
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
WO2009109050A1 (en) * 2008-03-05 2009-09-11 Voiceage Corporation System and method for enhancing a decoded tonal sound signal
CN101483042B (zh) * 2008-03-20 2011-03-30 华为技术有限公司 一种噪声生成方法以及噪声生成装置
US8606573B2 (en) * 2008-03-28 2013-12-10 Alon Konchitsky Voice recognition improved accuracy in mobile environments
KR101317813B1 (ko) * 2008-03-31 2013-10-15 (주)트란소노 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
US9142221B2 (en) * 2008-04-07 2015-09-22 Cambridge Silicon Radio Limited Noise reduction
US9253568B2 (en) * 2008-07-25 2016-02-02 Broadcom Corporation Single-microphone wind noise suppression
US8515097B2 (en) * 2008-07-25 2013-08-20 Broadcom Corporation Single microphone wind noise suppression
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
EP2416315B1 (en) * 2009-04-02 2015-05-20 Mitsubishi Electric Corporation Noise suppression device
US8834386B2 (en) * 2009-07-07 2014-09-16 Koninklijke Philips N.V. Noise reduction of breathing signals
EP2491548A4 (en) * 2009-10-19 2013-10-30 Ericsson Telefon Ab L M VOICE ACTIVITY METHOD AND DETECTOR FOR SPEECH ENCODER
CA2778342C (en) * 2009-10-19 2017-08-22 Martin Sehlstedt Method and background estimator for voice activity detection
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
WO2011110496A1 (en) * 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for handling transient sound events in audio signals when changing the replay speed or pitch
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
KR101176207B1 (ko) * 2010-10-18 2012-08-28 (주)트란소노 음성통신 시스템 및 음성통신 방법
KR101173980B1 (ko) * 2010-10-18 2012-08-16 (주)트란소노 음성통신 기반 잡음 제거 시스템 및 그 방법
US8831937B2 (en) * 2010-11-12 2014-09-09 Audience, Inc. Post-noise suppression processing to improve voice quality
EP2458586A1 (en) * 2010-11-24 2012-05-30 Koninklijke Philips Electronics N.V. System and method for producing an audio signal
DK3493205T3 (da) * 2010-12-24 2021-04-19 Huawei Tech Co Ltd Fremgangsmåde og indretning til adaptiv detektion af stemmeaktivitet i et lydindgangssignal
KR20120080409A (ko) * 2011-01-07 2012-07-17 삼성전자주식회사 잡음 구간 판별에 의한 잡음 추정 장치 및 방법
US20130346460A1 (en) * 2011-01-11 2013-12-26 Thierry Bruneau Method and device for filtering a signal and control device for a process
US8650029B2 (en) * 2011-02-25 2014-02-11 Microsoft Corporation Leveraging speech recognizer feedback for voice activity detection
US20140114653A1 (en) * 2011-05-06 2014-04-24 Nokia Corporation Pitch estimator
TWI459381B (zh) * 2011-09-14 2014-11-01 Ind Tech Res Inst 語音增強方法
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
EP3288033B1 (en) * 2012-02-23 2019-04-10 Dolby International AB Methods and systems for efficient recovery of high frequency audio content
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
EP2786376A1 (en) 2012-11-20 2014-10-08 Unify GmbH & Co. KG Method, device, and system for audio data processing
EP2936486B1 (en) 2012-12-21 2018-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Comfort noise addition for modeling background noise at low bit-rates
CN103886867B (zh) * 2012-12-21 2017-06-27 华为技术有限公司 一种噪声抑制装置及其方法
US9495951B2 (en) 2013-01-17 2016-11-15 Nvidia Corporation Real time audio echo and background noise reduction for a mobile device
RU2660605C2 (ru) 2013-01-29 2018-07-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Концепция заполнения шумом
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
JP6303340B2 (ja) 2013-08-30 2018-04-04 富士通株式会社 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム
KR20150032390A (ko) * 2013-09-16 2015-03-26 삼성전자주식회사 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법
DE102013111784B4 (de) 2013-10-25 2019-11-14 Intel IP Corporation Audioverarbeitungsvorrichtungen und audioverarbeitungsverfahren
US9449615B2 (en) * 2013-11-07 2016-09-20 Continental Automotive Systems, Inc. Externally estimated SNR based modifiers for internal MMSE calculators
US9449609B2 (en) * 2013-11-07 2016-09-20 Continental Automotive Systems, Inc. Accurate forward SNR estimation based on MMSE speech probability presence
US9449610B2 (en) * 2013-11-07 2016-09-20 Continental Automotive Systems, Inc. Speech probability presence modifier improving log-MMSE based noise suppression performance
CN104681034A (zh) 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
GB2523984B (en) * 2013-12-18 2017-07-26 Cirrus Logic Int Semiconductor Ltd Processing received speech data
CN104916292B (zh) * 2014-03-12 2017-05-24 华为技术有限公司 检测音频信号的方法和装置
US10176823B2 (en) * 2014-05-09 2019-01-08 Apple Inc. System and method for audio noise processing and noise reduction
KR20160000680A (ko) * 2014-06-25 2016-01-05 주식회사 더바인코퍼레이션 광대역 보코더용 휴대폰 명료도 향상장치와 이를 이용한 음성출력장치
RU2713852C2 (ru) 2014-07-29 2020-02-07 Телефонактиеболагет Лм Эрикссон (Пабл) Оценивание фонового шума в аудиосигналах
WO2016033364A1 (en) 2014-08-28 2016-03-03 Audience, Inc. Multi-sourced noise suppression
DE112015004185T5 (de) 2014-09-12 2017-06-01 Knowles Electronics, Llc Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten
US9947318B2 (en) * 2014-10-03 2018-04-17 2236008 Ontario Inc. System and method for processing an audio signal captured from a microphone
US9886966B2 (en) * 2014-11-07 2018-02-06 Apple Inc. System and method for improving noise suppression using logistic function and a suppression target value for automatic speech recognition
TWI569263B (zh) * 2015-04-30 2017-02-01 智原科技股份有限公司 聲頻訊號的訊號擷取方法與裝置
JP6289774B2 (ja) * 2015-12-01 2018-03-07 三菱電機株式会社 音声認識装置、音声強調装置、音声認識方法、音声強調方法およびナビゲーションシステム
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
CN108022595A (zh) * 2016-10-28 2018-05-11 电信科学技术研究院 一种语音信号降噪方法和用户终端
CN106782504B (zh) * 2016-12-29 2019-01-22 百度在线网络技术(北京)有限公司 语音识别方法和装置
US11450339B2 (en) * 2017-10-06 2022-09-20 Sony Europe B.V. Audio file envelope based on RMS power in sequences of sub-windows
US10771621B2 (en) * 2017-10-31 2020-09-08 Cisco Technology, Inc. Acoustic echo cancellation based sub band domain active speaker detection for audio and video conferencing applications
RU2701120C1 (ru) * 2018-05-14 2019-09-24 Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-Морского Флота "Военно-морская академия имени Адмирала флота Советского Союза Н.Г. Кузнецова" Устройство для обработки речевого сигнала
US10681458B2 (en) * 2018-06-11 2020-06-09 Cirrus Logic, Inc. Techniques for howling detection
KR102327441B1 (ko) * 2019-09-20 2021-11-17 엘지전자 주식회사 인공지능 장치
US11217262B2 (en) * 2019-11-18 2022-01-04 Google Llc Adaptive energy limiting for transient noise suppression
US11264015B2 (en) 2019-11-21 2022-03-01 Bose Corporation Variable-time smoothing for steady state noise estimation
US11374663B2 (en) * 2019-11-21 2022-06-28 Bose Corporation Variable-frequency smoothing
CN111429932A (zh) * 2020-06-10 2020-07-17 浙江远传信息技术股份有限公司 语音降噪方法、装置、设备及介质
CN112634929A (zh) * 2020-12-16 2021-04-09 普联国际有限公司 一种语音增强方法、装置及存储介质

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57161800A (en) * 1981-03-30 1982-10-05 Toshiyuki Sakai Voice information filter
AU633673B2 (en) * 1990-01-18 1993-02-04 Matsushita Electric Industrial Co., Ltd. Signal processing device
US5432859A (en) * 1993-02-23 1995-07-11 Novatel Communications Ltd. Noise-reduction system
JP3297307B2 (ja) * 1996-06-14 2002-07-02 沖電気工業株式会社 背景雑音消去装置
US6098038A (en) * 1996-09-27 2000-08-01 Oregon Graduate Institute Of Science & Technology Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates
US6097820A (en) * 1996-12-23 2000-08-01 Lucent Technologies Inc. System and method for suppressing noise in digitally represented voice signals
US6456965B1 (en) * 1997-05-20 2002-09-24 Texas Instruments Incorporated Multi-stage pitch and mixed voicing estimation for harmonic speech coders
US6044341A (en) * 1997-07-16 2000-03-28 Olympus Optical Co., Ltd. Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice
US20020002455A1 (en) * 1998-01-09 2002-01-03 At&T Corporation Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system
US6088668A (en) * 1998-06-22 2000-07-11 D.S.P.C. Technologies Ltd. Noise suppressor having weighted gain smoothing
US7209567B1 (en) * 1998-07-09 2007-04-24 Purdue Research Foundation Communication system with adaptive noise suppression
US6351731B1 (en) * 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6233549B1 (en) * 1998-11-23 2001-05-15 Qualcomm, Inc. Low frequency spectral enhancement system and method
US6363345B1 (en) * 1999-02-18 2002-03-26 Andrea Electronics Corporation System, method and apparatus for cancelling noise
US6618701B2 (en) * 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
JP4242516B2 (ja) 1999-07-26 2009-03-25 パナソニック株式会社 サブバンド符号化方式
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US6366880B1 (en) * 1999-11-30 2002-04-02 Motorola, Inc. Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US6862567B1 (en) * 2000-08-30 2005-03-01 Mindspeed Technologies, Inc. Noise suppression in the frequency domain by adjusting gain according to voicing parameters
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
US6947888B1 (en) * 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
US6925435B1 (en) 2000-11-27 2005-08-02 Mindspeed Technologies, Inc. Method and apparatus for improved noise reduction in a speech encoder
JP4282227B2 (ja) * 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
US7155385B2 (en) * 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
US7492889B2 (en) * 2004-04-23 2009-02-17 Acoustic Technologies, Inc. Noise suppression based on bark band wiener filtering and modified doblinger noise estimate

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2644527C2 (ru) * 2010-01-19 2018-02-12 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
RU2665298C1 (ru) * 2010-01-19 2018-08-28 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
US10109296B2 (en) 2010-01-19 2018-10-23 Dolby International Ab Subband block based harmonic transposition
US10699728B2 (en) 2010-01-19 2020-06-30 Dolby International Ab Subband block based harmonic transposition
US11341984B2 (en) 2010-01-19 2022-05-24 Dolby International Ab Subband block based harmonic transposition
US11646047B2 (en) 2010-01-19 2023-05-09 Dolby International Ab Subband block based harmonic transposition
US11935555B2 (en) 2010-01-19 2024-03-19 Dolby International Ab Subband block based harmonic transposition

Also Published As

Publication number Publication date
CN100510672C (zh) 2009-07-08
US8577675B2 (en) 2013-11-05
AU2004309431C1 (en) 2009-03-19
KR20060128983A (ko) 2006-12-14
MY141447A (en) 2010-04-30
EP1700294B1 (en) 2009-08-26
US20050143989A1 (en) 2005-06-30
RU2329550C2 (ru) 2008-07-20
JP2007517249A (ja) 2007-06-28
DE602004022862D1 (de) 2009-10-08
ATE441177T1 (de) 2009-09-15
AU2004309431A1 (en) 2005-07-14
CN1918461A (zh) 2007-02-21
BRPI0418449A (pt) 2007-05-22
HK1099946A1 (en) 2007-08-31
JP4440937B2 (ja) 2010-03-24
CA2550905A1 (en) 2005-07-14
PT1700294E (pt) 2009-09-28
EP1700294A4 (en) 2007-02-28
TW200531006A (en) 2005-09-16
EP1700294A1 (en) 2006-09-13
WO2005064595A1 (en) 2005-07-14
MXPA06007234A (es) 2006-08-18
KR100870502B1 (ko) 2008-11-25
CA2454296A1 (en) 2005-06-29
ZA200606215B (en) 2007-11-28
CA2550905C (en) 2010-12-14
ES2329046T3 (es) 2009-11-20
AU2004309431B2 (en) 2008-10-02
TWI279776B (en) 2007-04-21

Similar Documents

Publication Publication Date Title
RU2006126530A (ru) Способ и устройство для улучшения речевого сигнала в присутствии фонового шума
US8311819B2 (en) System for detecting speech with background voice estimates and noise estimates
US7711123B2 (en) Segmenting audio signals into auditory events
KR100911679B1 (ko) 오디오 신호를 오디토리 이벤트로 세그먼트하는 방법
CA2448182C (en) Segmenting audio signals into auditory events
US20090154726A1 (en) System and Method for Noise Activity Detection
EP1059628A3 (en) Signal for noise reduction by spectral subtraction
US20110103615A1 (en) Wind Noise Suppression
US20150106087A1 (en) Efficient Discrimination of Voiced and Unvoiced Sounds
WO2000017859A1 (en) Noise suppression for low bitrate speech coder
CN109119096B (zh) 一种vad判决中当前激活音保持帧数的修正方法及装置
US8520861B2 (en) Signal processing system for tonal noise robustness
DE602005000539D1 (de) Verstärkungsgesteuerte Geräuschunterdrückung
US20150058002A1 (en) Detecting Wind Noise In An Audio Signal
US9058821B2 (en) Computer-readable medium for recording audio signal processing estimating a selected frequency by comparison of voice and noise frame levels
JP2005535920A (ja) バックエンドの音声検出装置を有する配信音声認識および方法
KR101250596B1 (ko) 신호 경계 주파수의 결정을 용이하게 하는 방법 및 장치
KR100798056B1 (ko) 높은 비정적인 잡음 환경에서의 음질 개선을 위한 음성처리 방법
CN115995234A (zh) 音频降噪方法、装置、电子设备及可读存储介质
CN113593604A (zh) 检测音频质量方法、装置及存储介质
Prodeus et al. Objective estimation of the quality of radical noise suppression algorithms
RU2485608C2 (ru) Способ и устройство для способствования определению ограничивающих частот сигнала
JP2004053626A (ja) 雑音重畳量評価方法、雑音抑制方法、雑音抑制装置、雑音重畳量評価プログラム、雑音抑制プログラム、雑音重畳量評価プログラム又は雑音抑制プログラムの何れか一方又は双方を記録した記録媒体
CN118016106A (zh) 老年人情感健康分析与支持系统

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20160602