RU2006126530A - Способ и устройство для улучшения речевого сигнала в присутствии фонового шума - Google Patents
Способ и устройство для улучшения речевого сигнала в присутствии фонового шума Download PDFInfo
- Publication number
- RU2006126530A RU2006126530A RU2006126530/09A RU2006126530A RU2006126530A RU 2006126530 A RU2006126530 A RU 2006126530A RU 2006126530/09 A RU2006126530/09 A RU 2006126530/09A RU 2006126530 A RU2006126530 A RU 2006126530A RU 2006126530 A RU2006126530 A RU 2006126530A
- Authority
- RU
- Russia
- Prior art keywords
- frequency
- frequency bands
- speech
- noise
- scaling
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract 46
- 230000001629 suppression Effects 0.000 claims abstract 29
- 230000003595 spectral effect Effects 0.000 claims abstract 6
- 230000005540 biological transmission Effects 0.000 claims 15
- 230000000694 effects Effects 0.000 claims 11
- 238000009499 grossing Methods 0.000 claims 6
- 230000001419 dependent effect Effects 0.000 claims 2
- 238000005070 sampling Methods 0.000 claims 2
- 238000001228 spectrum Methods 0.000 claims 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims 1
- 244000046052 Phaseolus vulgaris Species 0.000 claims 1
- 238000005192 partition Methods 0.000 abstract 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
- Telephone Function (AREA)
- Devices For Executing Special Programs (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Claims (83)
1. Способ подавления шумов в речевом сигнале, включающий:
проведение частотного анализа для создания спектрального представления речевого сигнала, содержащего множество частотных бинов, и
группировку частотных бинов в множество полос частот, отличающийся тем, что, когда в речевом сигнале обнаруживают вокализованную речевую активность, для первого количества полос частот подавление шумов выполняют по частотным бинам, а для второго количества полос частот подавление шумов выполняют по полосам частот.
2. Способ по п.1, в котором первое количество полос частот определяют по количеству полос частот, которые являются вокализованными.
3. Способ по п.1, в котором первое количество полос частот определяют относительно граничной частоты вокализованности, которая является частотой, ниже которой речевой сигнал считают вокализованным.
4. Способ по п.3, в котором первое количество полос частот включает все полосы частот речевого сигнала, которые имеют верхнюю частоту, не превышающую граничной частоты вокализованности.
5. Способ по п.1, в котором первое количество полос частот равно заранее заданному фиксированному числу.
6. Способ по п.1, в котором, если ни одна из полос частот в речевом сигнале не является вокализованной, подавление шумов выполняют по полосам частот для всех полос частот.
7. Способ по п.1, в котором речевой сигнал включает речевые кадры, содержащие множество отсчетов, и способ по п.1 применяют для подавления шумов в речевом кадре.
8. Способ по п.7, включающий проведение частотного анализа согласно способу по п.1 с использованием окна анализа, которое смещено на m отсчетов относительно первого отсчета речевого кадра.
9. Способ по п.7, включающий проведение первого частотного анализа с использованием первого окна анализа, которое смещено на m отсчетов относительно первого отсчета речевого кадра, и второго окна анализа, которое смещено на p отсчетов относительно первого отсчета речевого кадра.
10. Способ по п.9, в котором m=24 и p=128.
11. Способ по п.9, в котором второе окно анализа имеет опережающую часть, которая выходит из указанного речевого кадра в последующий речевой кадр речевого сигнала.
12. Способ по п.1, включающий подавление шумов путем применения масштабирующего коэффициента передачи к частотным бинам и/или полосам частот.
13. Способ по п.1, который при подавлении шумов по частотным бинам включает определение специфичного для частотного бина масштабирующего коэффициента передачи.
14. Способ по п.1, который при подавлении шумов по полосам частот включает определение специфичного для полосы частот масштабирующего коэффициента передачи.
15. Способ по п.6, включающий подавление шумов путем применения постоянного масштабирующего коэффициента передачи для всех полос частот.
16. Способ по п.13, включающий определение значения масштабирующего коэффициента передачи для частотного бина на основе отношения сигнал/шум (SNR), определенного для этого частотного бина.
17. Способ по п.14, включающий определение значения масштабирующего коэффициента передачи для полосы частот на основе отношения сигнал/шум (SNR), определенного для этой полосы частот.
18. Способ по п.16, включающий выполнение шагов по п.16 для каждого из первого и второго частотных анализов.
19. Способ по п.17, включающий выполнение шагов по п.17 для каждого из первого и второго частотных анализов.
20. Способ по любому из пп.12-14, в котором масштабирующий коэффициент передачи представляет собой сглаженный масштабирующий коэффициент передачи.
21. Способ по любому из пп.12-14, включающий вычисление сглаженного масштабирующего коэффициента передачи, который должен быть применен к конкретному частотному бину или конкретной полосе частот, с использованием коэффициента сглаживания, величина которого находится в обратном отношении к масштабирующему коэффициенту передачи для конкретного частотного бина или конкретной полосы частот.
22. Способ по любому из пп.12-14, включающий вычисление сглаженного масштабирующего коэффициента передачи, который должен быть применен к конкретному частотному бину или конкретной полосе частот, с использованием коэффициента сглаживания, значение которого определяют так, чтобы сглаживание было сильнее для меньших значений масштабирующего коэффициента передачи.
23. Способ по п.13 или 14, в котором определение значения масштабирующего коэффициента передачи происходит n раз за речевой кадр, где n больше единицы.
24. Способ по п.23, в котором n=2.
25. Способ по п.13 или 14, включающий определение значения масштабирующего коэффициента передачи n раз за речевой кадр, где n больше единицы, а граничная частоты вокализованности по меньшей мере частично зависит от речевого сигнала в предыдущем речевом кадре.
26. Способ по п.13, в котором подавление шумов по частотным бинам выполняют максимально на 74 бинах, соответствующих 17 полосам частот.
27. Способ по п.13, в котором подавление шумов по частотным бинам выполняют на максимальном количестве частотных бинов, соответствующем частоте 3700 Гц.
28. Способ по п.16, в котором для первого значения отношения сигнал/шум величину масштабирующего коэффициента передачи устанавливают на минимальное значение, а для второго значения отношения сигнал/шум, большего, чем первое значение отношения сигнал/шум, величину масштабирующего коэффициента передачи устанавливают равной единице.
29. Способ по п.28, в котором первое значение отношения сигнал/шум составляет около 1 дБ, а второе значение отношения сигнал/шум составляет около 45 дБ.
30. Способ по п.20, включающий обнаружение сегментов речевого сигнала, которые не содержат активной речи.
31. Способ по п.30, включающий возврат сглаженного масштабирующего коэффициента передачи к минимальному значению в ответ на обнаружение сегмента речевого сигнала, который не содержит активной речи.
32. Способ по п.7, в котором подавление шумов не выполняют, если максимальная энергия шумов в множестве полос частот лежит ниже порогового значения.
33. Способ по п.7, дополнительно включающий, в ответ на появление речевого кадра, соответствующего короткому периоду поддержания в силе решения об обнаружении речевой активности, выполнение подавления шумов путем применения масштабирующего коэффициента передачи, определенного по полосам частот для первых х полос частот, а для оставшихся полос частот - выполнение подавления шумов путем применения единого значения масштабирующего коэффициента передачи.
34. Способ по п.33, в котором первые х полос частот соответствуют частотам до 1700 Гц.
35. Способ по п.20, который для узкополосного речевого сигнала дополнительно включает выполнение подавления шумов путем применения сглаженных масштабирующих коэффициентов передачи, определенных по полосам частот, для первых х полос частот, соответствующих частотам до 3700 Гц, выполнение подавления шумов путем применения значения масштабирующего коэффициента передачи частотного бина, соответствующего 3700 Гц, к бинам между частотами 3700 и 4000 Гц, и обнуление оставшихся полос частот частотного спектра речевого сигнала.
36. Способ по п.35, в котором узкополосный речевой сигнал преобразован с повышением частоты дискретизации до 12800 Гц.
37. Способ по п.3, дополнительно включающий определение граничной частоты вокализованности с использованием вычисленной меры вокализованности.
38. Способ по п.37, дополнительно включающий определение множества критических полос, имеющих верхнюю частоту, которая не превышает граничную частоту вокализованности, причем границы установлены так, что подавление шумов по частотным бинам выполняют минимально на х полосах и максимально на у полосах.
39. Способ по п.38, в котором х=3 и у=17.
40. Способ по п.37, в котором граничную частоту вокализованности ограничивают так, чтобы она была не менее 325 Гц и не более 3700 Гц.
41. Устройство для подавления шумов в речевом сигнале, выполненное с возможностью:
проведения частотного анализа для создания спектрального представления речевого сигнала, содержащего множество частотных бинов, и
группировки частотных бинов в множество полос частот,
отличающееся тем, что оно выполнено с возможностью обнаруживать вокализованную речевую активность и при обнаружении в речевом сигнале вокализованной речевой активности выполнять для первого количества полос частот подавление шумов по частотным бинам, а для второго количества полос частот - подавление шумов по полосам частот.
42. Устройство по п.41, в котором первое количество полос частот определяется по количеству полос частот, которые являются вокализованными.
43. Устройство по п.41, которое выполнено с возможностью определять первое количество полос частот относительно граничной частоты вокализованности, которая является частотой, ниже которой речевой сигнал считается вокализованным.
44. Устройство по п.43, в котором первое количество полос частот включает все полосы частот речевого сигнала, которые имеют верхнюю частоту, не превышающую граничной частоты вокализованности.
45. Устройство по п.41, в котором первое количество полос частот равно заранее заданному фиксированному числу.
46. Устройство по п.41, которое выполнено с возможностью подавления шумов по полосам частот для всех полос частот, если ни одна полоса частот речевого сигнала не является вокализованной.
47. Устройство по п.41, в котором речевой сигнал включает речевые кадры, содержащие множество отсчетов, а указанное устройство выполнено с возможностью подавлять шум в речевом кадре.
48. Устройство по п.47, выполненное с возможностью проводить указанный частотный анализ с использованием окна анализа, которое смещено на m отсчетов относительно первого отсчета речевого кадра.
49. Устройство по п.47, выполненное с возможностью проводить первый частотный анализ с использованием первого окна анализа, которое смещено на m отсчетов относительно первого отсчета речевого кадра, и второго окна анализа, которое смещено на p отсчетов относительно первого отсчета речевого кадра.
50. Устройство по п.49, в котором m=24 и p=128.
51. Устройство по п.49, в котором второе окно анализа имеет опережающую часть, которая выходит из указанного речевого кадра в последующий речевой кадр речевого сигнала.
52. Устройство по п.41, которое выполнено с возможностью подавления шумов путем применения масштабирующих коэффициентов передачи к частотным бинам и/или полосам частот.
53. Устройство по п.41, которое выполнено с возможностью при подавлении шумов по частотным бинам определять специфичный для частотного бина масштабирующий коэффициент передачи.
54. Устройство по п.41, которое выполнено с возможностью при подавлении шумов по полосам частот определять специфичный для полосы частот масштабирующий коэффициент передачи.
55. Устройство по п.46, которое выполнено с возможностью выполнять подавление шумов путем применения постоянного масштабирующего коэффициента передачи для всех полос частот.
56. Устройство по п.53, которое выполнено с возможностью определять значение масштабирующего коэффициента передачи для частотного бина на основе отношения сигнал/шум (SNR), определенного для этого частотного бина.
57. Устройство по п.54, которое выполнено с возможностью определять значение масштабирующего коэффициента передачи для полосы частот на основе отношения сигнал/шум (SNR), определенного для этой полосы частот.
58. Устройство по п.56, которое выполнено с возможностью выполнения шагов по п.56 для каждого из первого и второго частотных анализов.
59. Устройство по п.57, которое выполнено с возможностью выполнения шагов по п.57 для каждого из первого и второго частотных анализов.
60. Устройство по любому из пп.52-54, в котором масштабирующий коэффициент передачи представляет собой сглаженный масштабирующий коэффициент передачи.
61. Устройство по любому из пп.52-54, которое выполнено с возможностью вычисления сглаженного масштабирующего коэффициента передачи, который должен быть применен к конкретному частотному бину или конкретной полосе частот, с использованием коэффициента сглаживания, величина которого находится в обратной зависимости от масштабирующего коэффициента передачи для конкретного бина или конкретной полосы частот.
62. Устройство по любому из пп.52-54, которое выполнено с возможностью вычисления сглаженного масштабирующего коэффициента передачи, который должен быть применен к конкретному частотному бину или конкретной полосе частот, с использованием коэффициента сглаживания, значение которого определяется так, чтобы сглаживание было сильнее для меньших значений масштабирующего коэффициента передачи.
63. Устройство по п.53 или 54, которое выполнено с возможностью определения значения масштабирующего коэффициента передачи n раз за речевой кадр, где n больше единицы.
64. Устройство по п.63, в котором n=2.
65. Устройство по п.53 или 54, которое выполнено с возможностью определения значения масштабирующего коэффициента передачи n раз за речевой кадр, где n больше единицы, а граничная частоты вокализованности по меньшей мере частично зависит от речевого сигнала в предыдущем речевом кадре.
66. Устройство по п.53, которое выполнено с возможностью подавления шумов по частотным бинам максимально на 74 бинах, соответствующих 17 полосам частот.
67. Устройство по п.53, которое выполнено с возможностью подавления шумов по частотным бинам на максимальном количестве частотных бинов, соответствующем частоте 3700 Гц.
68. Устройство по п.56, которое выполнено с возможностью устанавливать величину масштабирующего коэффициента передачи на минимальное значение для первого значения отношения сигнал/шум и устанавливать величину масштабирующего коэффициента передачи равной единице для второго значения отношения сигнал/шум, большего, чем первое значение отношения сигнал/шум.
69. Устройство по п.68, в котором первое значение отношения сигнал/шум составляет около 1 дБ, а второе значение отношения сигнал/шум составляет около 45 дБ.
70. Устройство по п.60, выполненное с возможностью обнаруживать сегменты речевого сигнала, которые не содержат активной речи.
71. Устройство по п.70, выполненное с возможностью осуществлять возврат сглаженного масштабирующего коэффициента передачи к минимальному значению в ответ на обнаружение сегмента речевого сигнала, который не содержит активной речи.
72. Устройство по п.47, выполненное с возможностью не выполнять подавления шумов, если максимальная энергия шумов в множестве полос частот лежит ниже порогового значения.
73. Устройство по п.47, которое выполнено с возможностью в ответ на появление речевого кадра, соответствующего короткому периоду поддержания в силе решения об обнаружении речевой активности, выполнять подавление шумов путем применения масштабирующего коэффициента передачи, определенного по полосам частот для первых х полос частот, а для оставшихся полос частот выполнять подавление шумов путем применения единого значения масштабирующего коэффициента передачи.
74. Устройство по п.73, в котором первые х полос частот соответствуют частотам до 1700 Гц.
75. Устройство по п.60, которое выполнено с возможностью для узкополосного речевого сигнала выполнять подавление шумов путем применения сглаженных масштабирующих коэффициентов передачи, определенных по полосам частот, для первых х полос частот, соответствующих частотам до 3700 Гц, выполнять подавление шумов путем применения сглаженного масштабирующего коэффициента передачи частотного бина, соответствующего 3700 Гц, к бинам между 3700 и 4000 Гц и обнулять оставшиеся полосы частот частотного спектра речевого сигнала.
76. Устройство по п.75, в котором узкополосный речевой сигнал преобразован с повышением частоты дискретизации до 12800 Гц.
77. Устройство по п.43, которое выполнено с возможностью определения граничной частоты вокализованности с использованием вычисленной меры вокализованности.
78. Устройство по п.77, которое выполнено с возможностью определения множества критических полос, имеющих верхнюю частоту, которая не превышает граничную частоту вокализованности, причем границы устанавливаются так, что подавление шумов по частотным бинам выполняется минимально на х полосах и максимально на у полосах.
79. Устройство по п.78, в котором х=3 и y=17.
80. Устройство по п.77, в котором граничная частота вокализованности ограничена так, чтобы она была не менее 325 Гц и не более 3700 Гц.
81. Речевой кодер, включающий устройство для подавления шумов, выполненное с возможностью:
проведения частотного анализа для создания спектрального представления речевого сигнала, содержащего множество частотных бинов, и
группировки частотных бинов в множество полос частот,
отличающийся тем, что указанное устройство выполнено с возможностью обнаруживать вокализованную речевую активность и при обнаружении в речевом сигнале вокализованной речевой активности выполнять для первого количества полос частот подавление шумов по частотным бинам, а для второго количества полос частот - подавление шумов по полосам частот.
82. Система автоматического распознавания речи, включающая устройство для подавления шумов, выполненное с возможностью:
проведения частотного анализа для создания спектрального представления речевого сигнала, содержащего множество частотных бинов, и
группировки частотных бинов в множество полос частот,
отличающаяся тем, что указанное устройство выполнено с возможностью обнаруживать вокализованную речевую активность и при обнаружении в речевом сигнале вокализованной речевой активности выполнять для первого количества полос частот подавление шумов по частотным бинам, а для второго количества полос частот - подавление шумов по полосам частот.
83. Мобильный телефон, включающий устройство для подавления шумов, выполненное с возможностью:
проведения частотного анализа для создания спектрального представления речевого сигнала, содержащего множество частотных бинов, и
группировки частотных бинов в множество полос частот,
отличающийся тем, что указанное устройство выполнено с возможностью обнаруживать вокализованную речевую активность и при обнаружении в речевом сигнале вокализованной речевой активности выполнять для первого количества полос частот подавление шумов по частотным бинам, а для второго количества полос частот - подавление шумов по полосам частот.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CA2454296 | 2003-12-29 | ||
CA002454296A CA2454296A1 (en) | 2003-12-29 | 2003-12-29 | Method and device for speech enhancement in the presence of background noise |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2006126530A true RU2006126530A (ru) | 2008-02-10 |
RU2329550C2 RU2329550C2 (ru) | 2008-07-20 |
Family
ID=34683070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2006126530/09A RU2329550C2 (ru) | 2003-12-29 | 2004-12-29 | Способ и устройство для улучшения речевого сигнала в присутствии фонового шума |
Country Status (19)
Country | Link |
---|---|
US (1) | US8577675B2 (ru) |
EP (1) | EP1700294B1 (ru) |
JP (1) | JP4440937B2 (ru) |
KR (1) | KR100870502B1 (ru) |
CN (1) | CN100510672C (ru) |
AT (1) | ATE441177T1 (ru) |
AU (1) | AU2004309431C1 (ru) |
BR (1) | BRPI0418449A (ru) |
CA (2) | CA2454296A1 (ru) |
DE (1) | DE602004022862D1 (ru) |
ES (1) | ES2329046T3 (ru) |
HK (1) | HK1099946A1 (ru) |
MX (1) | MXPA06007234A (ru) |
MY (1) | MY141447A (ru) |
PT (1) | PT1700294E (ru) |
RU (1) | RU2329550C2 (ru) |
TW (1) | TWI279776B (ru) |
WO (1) | WO2005064595A1 (ru) |
ZA (1) | ZA200606215B (ru) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2644527C2 (ru) * | 2010-01-19 | 2018-02-12 | Долби Интернешнл Аб | Усовершенствованное гармоническое преобразование на основе блока поддиапазонов |
Families Citing this family (91)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7113580B1 (en) * | 2004-02-17 | 2006-09-26 | Excel Switching Corporation | Method and apparatus for performing conferencing services and echo suppression |
CN101014997B (zh) * | 2004-02-18 | 2012-04-04 | 皇家飞利浦电子股份有限公司 | 用于生成用于自动语音识别器的训练数据的方法和系统 |
DE102004049347A1 (de) * | 2004-10-08 | 2006-04-20 | Micronas Gmbh | Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale |
EP1864281A1 (en) * | 2005-04-01 | 2007-12-12 | QUALCOMM Incorporated | Systems, methods, and apparatus for highband burst suppression |
PL1875463T3 (pl) * | 2005-04-22 | 2019-03-29 | Qualcomm Incorporated | Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia |
JP4765461B2 (ja) * | 2005-07-27 | 2011-09-07 | 日本電気株式会社 | 雑音抑圧システムと方法及びプログラム |
US7366658B2 (en) * | 2005-12-09 | 2008-04-29 | Texas Instruments Incorporated | Noise pre-processor for enhanced variable rate speech codec |
US7930178B2 (en) * | 2005-12-23 | 2011-04-19 | Microsoft Corporation | Speech modeling and enhancement based on magnitude-normalized spectra |
US9185487B2 (en) * | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US7593535B2 (en) * | 2006-08-01 | 2009-09-22 | Dts, Inc. | Neural network filtering techniques for compensating linear and non-linear distortion of an audio transducer |
CN101246688B (zh) * | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
US8195454B2 (en) | 2007-02-26 | 2012-06-05 | Dolby Laboratories Licensing Corporation | Speech enhancement in entertainment audio |
TWI420509B (zh) * | 2007-03-19 | 2013-12-21 | Dolby Lab Licensing Corp | 語音增強用雜訊變異量估計器 |
CN101320559B (zh) * | 2007-06-07 | 2011-05-18 | 华为技术有限公司 | 一种声音激活检测装置及方法 |
JP5395066B2 (ja) * | 2007-06-22 | 2014-01-22 | ヴォイスエイジ・コーポレーション | 音声区間検出および音声信号分類ための方法および装置 |
JP2010539792A (ja) * | 2007-09-12 | 2010-12-16 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | スピーチ増強 |
US8892432B2 (en) * | 2007-10-19 | 2014-11-18 | Nec Corporation | Signal processing system, apparatus and method used on the system, and program thereof |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
US8554550B2 (en) | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context processing using multi resolution analysis |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
WO2009109050A1 (en) * | 2008-03-05 | 2009-09-11 | Voiceage Corporation | System and method for enhancing a decoded tonal sound signal |
CN101483042B (zh) * | 2008-03-20 | 2011-03-30 | 华为技术有限公司 | 一种噪声生成方法以及噪声生成装置 |
US8606573B2 (en) * | 2008-03-28 | 2013-12-10 | Alon Konchitsky | Voice recognition improved accuracy in mobile environments |
KR101317813B1 (ko) * | 2008-03-31 | 2013-10-15 | (주)트란소노 | 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체 |
US9142221B2 (en) * | 2008-04-07 | 2015-09-22 | Cambridge Silicon Radio Limited | Noise reduction |
US9253568B2 (en) * | 2008-07-25 | 2016-02-02 | Broadcom Corporation | Single-microphone wind noise suppression |
US8515097B2 (en) * | 2008-07-25 | 2013-08-20 | Broadcom Corporation | Single microphone wind noise suppression |
US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
EP2416315B1 (en) * | 2009-04-02 | 2015-05-20 | Mitsubishi Electric Corporation | Noise suppression device |
US8834386B2 (en) * | 2009-07-07 | 2014-09-16 | Koninklijke Philips N.V. | Noise reduction of breathing signals |
EP2491548A4 (en) * | 2009-10-19 | 2013-10-30 | Ericsson Telefon Ab L M | VOICE ACTIVITY METHOD AND DETECTOR FOR SPEECH ENCODER |
CA2778342C (en) * | 2009-10-19 | 2017-08-22 | Martin Sehlstedt | Method and background estimator for voice activity detection |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
WO2011110496A1 (en) * | 2010-03-09 | 2011-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for handling transient sound events in audio signals when changing the replay speed or pitch |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
KR101176207B1 (ko) * | 2010-10-18 | 2012-08-28 | (주)트란소노 | 음성통신 시스템 및 음성통신 방법 |
KR101173980B1 (ko) * | 2010-10-18 | 2012-08-16 | (주)트란소노 | 음성통신 기반 잡음 제거 시스템 및 그 방법 |
US8831937B2 (en) * | 2010-11-12 | 2014-09-09 | Audience, Inc. | Post-noise suppression processing to improve voice quality |
EP2458586A1 (en) * | 2010-11-24 | 2012-05-30 | Koninklijke Philips Electronics N.V. | System and method for producing an audio signal |
DK3493205T3 (da) * | 2010-12-24 | 2021-04-19 | Huawei Tech Co Ltd | Fremgangsmåde og indretning til adaptiv detektion af stemmeaktivitet i et lydindgangssignal |
KR20120080409A (ko) * | 2011-01-07 | 2012-07-17 | 삼성전자주식회사 | 잡음 구간 판별에 의한 잡음 추정 장치 및 방법 |
US20130346460A1 (en) * | 2011-01-11 | 2013-12-26 | Thierry Bruneau | Method and device for filtering a signal and control device for a process |
US8650029B2 (en) * | 2011-02-25 | 2014-02-11 | Microsoft Corporation | Leveraging speech recognizer feedback for voice activity detection |
US20140114653A1 (en) * | 2011-05-06 | 2014-04-24 | Nokia Corporation | Pitch estimator |
TWI459381B (zh) * | 2011-09-14 | 2014-11-01 | Ind Tech Res Inst | 語音增強方法 |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
EP3288033B1 (en) * | 2012-02-23 | 2019-04-10 | Dolby International AB | Methods and systems for efficient recovery of high frequency audio content |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
EP2786376A1 (en) | 2012-11-20 | 2014-10-08 | Unify GmbH & Co. KG | Method, device, and system for audio data processing |
EP2936486B1 (en) | 2012-12-21 | 2018-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Comfort noise addition for modeling background noise at low bit-rates |
CN103886867B (zh) * | 2012-12-21 | 2017-06-27 | 华为技术有限公司 | 一种噪声抑制装置及其方法 |
US9495951B2 (en) | 2013-01-17 | 2016-11-15 | Nvidia Corporation | Real time audio echo and background noise reduction for a mobile device |
RU2660605C2 (ru) | 2013-01-29 | 2018-07-06 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Концепция заполнения шумом |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
JP6303340B2 (ja) | 2013-08-30 | 2018-04-04 | 富士通株式会社 | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム |
KR20150032390A (ko) * | 2013-09-16 | 2015-03-26 | 삼성전자주식회사 | 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법 |
DE102013111784B4 (de) | 2013-10-25 | 2019-11-14 | Intel IP Corporation | Audioverarbeitungsvorrichtungen und audioverarbeitungsverfahren |
US9449615B2 (en) * | 2013-11-07 | 2016-09-20 | Continental Automotive Systems, Inc. | Externally estimated SNR based modifiers for internal MMSE calculators |
US9449609B2 (en) * | 2013-11-07 | 2016-09-20 | Continental Automotive Systems, Inc. | Accurate forward SNR estimation based on MMSE speech probability presence |
US9449610B2 (en) * | 2013-11-07 | 2016-09-20 | Continental Automotive Systems, Inc. | Speech probability presence modifier improving log-MMSE based noise suppression performance |
CN104681034A (zh) | 2013-11-27 | 2015-06-03 | 杜比实验室特许公司 | 音频信号处理 |
GB2523984B (en) * | 2013-12-18 | 2017-07-26 | Cirrus Logic Int Semiconductor Ltd | Processing received speech data |
CN104916292B (zh) * | 2014-03-12 | 2017-05-24 | 华为技术有限公司 | 检测音频信号的方法和装置 |
US10176823B2 (en) * | 2014-05-09 | 2019-01-08 | Apple Inc. | System and method for audio noise processing and noise reduction |
KR20160000680A (ko) * | 2014-06-25 | 2016-01-05 | 주식회사 더바인코퍼레이션 | 광대역 보코더용 휴대폰 명료도 향상장치와 이를 이용한 음성출력장치 |
RU2713852C2 (ru) | 2014-07-29 | 2020-02-07 | Телефонактиеболагет Лм Эрикссон (Пабл) | Оценивание фонового шума в аудиосигналах |
WO2016033364A1 (en) | 2014-08-28 | 2016-03-03 | Audience, Inc. | Multi-sourced noise suppression |
DE112015004185T5 (de) | 2014-09-12 | 2017-06-01 | Knowles Electronics, Llc | Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten |
US9947318B2 (en) * | 2014-10-03 | 2018-04-17 | 2236008 Ontario Inc. | System and method for processing an audio signal captured from a microphone |
US9886966B2 (en) * | 2014-11-07 | 2018-02-06 | Apple Inc. | System and method for improving noise suppression using logistic function and a suppression target value for automatic speech recognition |
TWI569263B (zh) * | 2015-04-30 | 2017-02-01 | 智原科技股份有限公司 | 聲頻訊號的訊號擷取方法與裝置 |
JP6289774B2 (ja) * | 2015-12-01 | 2018-03-07 | 三菱電機株式会社 | 音声認識装置、音声強調装置、音声認識方法、音声強調方法およびナビゲーションシステム |
US9820042B1 (en) | 2016-05-02 | 2017-11-14 | Knowles Electronics, Llc | Stereo separation and directional suppression with omni-directional microphones |
CN108022595A (zh) * | 2016-10-28 | 2018-05-11 | 电信科学技术研究院 | 一种语音信号降噪方法和用户终端 |
CN106782504B (zh) * | 2016-12-29 | 2019-01-22 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
US11450339B2 (en) * | 2017-10-06 | 2022-09-20 | Sony Europe B.V. | Audio file envelope based on RMS power in sequences of sub-windows |
US10771621B2 (en) * | 2017-10-31 | 2020-09-08 | Cisco Technology, Inc. | Acoustic echo cancellation based sub band domain active speaker detection for audio and video conferencing applications |
RU2701120C1 (ru) * | 2018-05-14 | 2019-09-24 | Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-Морского Флота "Военно-морская академия имени Адмирала флота Советского Союза Н.Г. Кузнецова" | Устройство для обработки речевого сигнала |
US10681458B2 (en) * | 2018-06-11 | 2020-06-09 | Cirrus Logic, Inc. | Techniques for howling detection |
KR102327441B1 (ko) * | 2019-09-20 | 2021-11-17 | 엘지전자 주식회사 | 인공지능 장치 |
US11217262B2 (en) * | 2019-11-18 | 2022-01-04 | Google Llc | Adaptive energy limiting for transient noise suppression |
US11264015B2 (en) | 2019-11-21 | 2022-03-01 | Bose Corporation | Variable-time smoothing for steady state noise estimation |
US11374663B2 (en) * | 2019-11-21 | 2022-06-28 | Bose Corporation | Variable-frequency smoothing |
CN111429932A (zh) * | 2020-06-10 | 2020-07-17 | 浙江远传信息技术股份有限公司 | 语音降噪方法、装置、设备及介质 |
CN112634929A (zh) * | 2020-12-16 | 2021-04-09 | 普联国际有限公司 | 一种语音增强方法、装置及存储介质 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57161800A (en) * | 1981-03-30 | 1982-10-05 | Toshiyuki Sakai | Voice information filter |
AU633673B2 (en) * | 1990-01-18 | 1993-02-04 | Matsushita Electric Industrial Co., Ltd. | Signal processing device |
US5432859A (en) * | 1993-02-23 | 1995-07-11 | Novatel Communications Ltd. | Noise-reduction system |
JP3297307B2 (ja) * | 1996-06-14 | 2002-07-02 | 沖電気工業株式会社 | 背景雑音消去装置 |
US6098038A (en) * | 1996-09-27 | 2000-08-01 | Oregon Graduate Institute Of Science & Technology | Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates |
US6097820A (en) * | 1996-12-23 | 2000-08-01 | Lucent Technologies Inc. | System and method for suppressing noise in digitally represented voice signals |
US6456965B1 (en) * | 1997-05-20 | 2002-09-24 | Texas Instruments Incorporated | Multi-stage pitch and mixed voicing estimation for harmonic speech coders |
US6044341A (en) * | 1997-07-16 | 2000-03-28 | Olympus Optical Co., Ltd. | Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice |
US20020002455A1 (en) * | 1998-01-09 | 2002-01-03 | At&T Corporation | Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system |
US6088668A (en) * | 1998-06-22 | 2000-07-11 | D.S.P.C. Technologies Ltd. | Noise suppressor having weighted gain smoothing |
US7209567B1 (en) * | 1998-07-09 | 2007-04-24 | Purdue Research Foundation | Communication system with adaptive noise suppression |
US6351731B1 (en) * | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6233549B1 (en) * | 1998-11-23 | 2001-05-15 | Qualcomm, Inc. | Low frequency spectral enhancement system and method |
US6363345B1 (en) * | 1999-02-18 | 2002-03-26 | Andrea Electronics Corporation | System, method and apparatus for cancelling noise |
US6618701B2 (en) * | 1999-04-19 | 2003-09-09 | Motorola, Inc. | Method and system for noise suppression using external voice activity detection |
JP4242516B2 (ja) | 1999-07-26 | 2009-03-25 | パナソニック株式会社 | サブバンド符号化方式 |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
US6366880B1 (en) * | 1999-11-30 | 2002-04-02 | Motorola, Inc. | Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
US6898566B1 (en) * | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
US6862567B1 (en) * | 2000-08-30 | 2005-03-01 | Mindspeed Technologies, Inc. | Noise suppression in the frequency domain by adjusting gain according to voicing parameters |
JP2002149200A (ja) * | 2000-08-31 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声処理装置及び音声処理方法 |
US6947888B1 (en) * | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
US6925435B1 (en) | 2000-11-27 | 2005-08-02 | Mindspeed Technologies, Inc. | Method and apparatus for improved noise reduction in a speech encoder |
JP4282227B2 (ja) * | 2000-12-28 | 2009-06-17 | 日本電気株式会社 | ノイズ除去の方法及び装置 |
US7155385B2 (en) * | 2002-05-16 | 2006-12-26 | Comerica Bank, As Administrative Agent | Automatic gain control for adjusting gain during non-speech portions |
US7492889B2 (en) * | 2004-04-23 | 2009-02-17 | Acoustic Technologies, Inc. | Noise suppression based on bark band wiener filtering and modified doblinger noise estimate |
-
2003
- 2003-12-29 CA CA002454296A patent/CA2454296A1/en not_active Abandoned
-
2004
- 2004-12-22 US US11/021,938 patent/US8577675B2/en active Active
- 2004-12-27 TW TW093140706A patent/TWI279776B/zh active
- 2004-12-27 MY MYPI20045377A patent/MY141447A/en unknown
- 2004-12-29 AU AU2004309431A patent/AU2004309431C1/en active Active
- 2004-12-29 CA CA2550905A patent/CA2550905C/en active Active
- 2004-12-29 AT AT04802378T patent/ATE441177T1/de not_active IP Right Cessation
- 2004-12-29 BR BRPI0418449-1A patent/BRPI0418449A/pt not_active Application Discontinuation
- 2004-12-29 WO PCT/CA2004/002203 patent/WO2005064595A1/en active Application Filing
- 2004-12-29 DE DE602004022862T patent/DE602004022862D1/de active Active
- 2004-12-29 KR KR1020067015437A patent/KR100870502B1/ko active IP Right Grant
- 2004-12-29 MX MXPA06007234A patent/MXPA06007234A/es active IP Right Grant
- 2004-12-29 EP EP04802378A patent/EP1700294B1/en active Active
- 2004-12-29 RU RU2006126530/09A patent/RU2329550C2/ru active
- 2004-12-29 JP JP2006545874A patent/JP4440937B2/ja active Active
- 2004-12-29 ES ES04802378T patent/ES2329046T3/es active Active
- 2004-12-29 CN CNB2004800417014A patent/CN100510672C/zh active Active
- 2004-12-29 PT PT04802378T patent/PT1700294E/pt unknown
-
2006
- 2006-07-27 ZA ZA200606215A patent/ZA200606215B/xx unknown
-
2007
- 2007-07-13 HK HK07107508.3A patent/HK1099946A1/xx unknown
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2644527C2 (ru) * | 2010-01-19 | 2018-02-12 | Долби Интернешнл Аб | Усовершенствованное гармоническое преобразование на основе блока поддиапазонов |
RU2665298C1 (ru) * | 2010-01-19 | 2018-08-28 | Долби Интернешнл Аб | Усовершенствованное гармоническое преобразование на основе блока поддиапазонов |
US10109296B2 (en) | 2010-01-19 | 2018-10-23 | Dolby International Ab | Subband block based harmonic transposition |
US10699728B2 (en) | 2010-01-19 | 2020-06-30 | Dolby International Ab | Subband block based harmonic transposition |
US11341984B2 (en) | 2010-01-19 | 2022-05-24 | Dolby International Ab | Subband block based harmonic transposition |
US11646047B2 (en) | 2010-01-19 | 2023-05-09 | Dolby International Ab | Subband block based harmonic transposition |
US11935555B2 (en) | 2010-01-19 | 2024-03-19 | Dolby International Ab | Subband block based harmonic transposition |
Also Published As
Publication number | Publication date |
---|---|
CN100510672C (zh) | 2009-07-08 |
US8577675B2 (en) | 2013-11-05 |
AU2004309431C1 (en) | 2009-03-19 |
KR20060128983A (ko) | 2006-12-14 |
MY141447A (en) | 2010-04-30 |
EP1700294B1 (en) | 2009-08-26 |
US20050143989A1 (en) | 2005-06-30 |
RU2329550C2 (ru) | 2008-07-20 |
JP2007517249A (ja) | 2007-06-28 |
DE602004022862D1 (de) | 2009-10-08 |
ATE441177T1 (de) | 2009-09-15 |
AU2004309431A1 (en) | 2005-07-14 |
CN1918461A (zh) | 2007-02-21 |
BRPI0418449A (pt) | 2007-05-22 |
HK1099946A1 (en) | 2007-08-31 |
JP4440937B2 (ja) | 2010-03-24 |
CA2550905A1 (en) | 2005-07-14 |
PT1700294E (pt) | 2009-09-28 |
EP1700294A4 (en) | 2007-02-28 |
TW200531006A (en) | 2005-09-16 |
EP1700294A1 (en) | 2006-09-13 |
WO2005064595A1 (en) | 2005-07-14 |
MXPA06007234A (es) | 2006-08-18 |
KR100870502B1 (ko) | 2008-11-25 |
CA2454296A1 (en) | 2005-06-29 |
ZA200606215B (en) | 2007-11-28 |
CA2550905C (en) | 2010-12-14 |
ES2329046T3 (es) | 2009-11-20 |
AU2004309431B2 (en) | 2008-10-02 |
TWI279776B (en) | 2007-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2006126530A (ru) | Способ и устройство для улучшения речевого сигнала в присутствии фонового шума | |
US8311819B2 (en) | System for detecting speech with background voice estimates and noise estimates | |
US7711123B2 (en) | Segmenting audio signals into auditory events | |
KR100911679B1 (ko) | 오디오 신호를 오디토리 이벤트로 세그먼트하는 방법 | |
CA2448182C (en) | Segmenting audio signals into auditory events | |
US20090154726A1 (en) | System and Method for Noise Activity Detection | |
EP1059628A3 (en) | Signal for noise reduction by spectral subtraction | |
US20110103615A1 (en) | Wind Noise Suppression | |
US20150106087A1 (en) | Efficient Discrimination of Voiced and Unvoiced Sounds | |
WO2000017859A1 (en) | Noise suppression for low bitrate speech coder | |
CN109119096B (zh) | 一种vad判决中当前激活音保持帧数的修正方法及装置 | |
US8520861B2 (en) | Signal processing system for tonal noise robustness | |
DE602005000539D1 (de) | Verstärkungsgesteuerte Geräuschunterdrückung | |
US20150058002A1 (en) | Detecting Wind Noise In An Audio Signal | |
US9058821B2 (en) | Computer-readable medium for recording audio signal processing estimating a selected frequency by comparison of voice and noise frame levels | |
JP2005535920A (ja) | バックエンドの音声検出装置を有する配信音声認識および方法 | |
KR101250596B1 (ko) | 신호 경계 주파수의 결정을 용이하게 하는 방법 및 장치 | |
KR100798056B1 (ko) | 높은 비정적인 잡음 환경에서의 음질 개선을 위한 음성처리 방법 | |
CN115995234A (zh) | 音频降噪方法、装置、电子设备及可读存储介质 | |
CN113593604A (zh) | 检测音频质量方法、装置及存储介质 | |
Prodeus et al. | Objective estimation of the quality of radical noise suppression algorithms | |
RU2485608C2 (ru) | Способ и устройство для способствования определению ограничивающих частот сигнала | |
JP2004053626A (ja) | 雑音重畳量評価方法、雑音抑制方法、雑音抑制装置、雑音重畳量評価プログラム、雑音抑制プログラム、雑音重畳量評価プログラム又は雑音抑制プログラムの何れか一方又は双方を記録した記録媒体 | |
CN118016106A (zh) | 老年人情感健康分析与支持系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PC41 | Official registration of the transfer of exclusive right |
Effective date: 20160602 |