RU2010101881A - Способ и устройство для обнаружения звуковой активности и классификации звуковых сигналов - Google Patents
Способ и устройство для обнаружения звуковой активности и классификации звуковых сигналов Download PDFInfo
- Publication number
- RU2010101881A RU2010101881A RU2010101881/09A RU2010101881A RU2010101881A RU 2010101881 A RU2010101881 A RU 2010101881A RU 2010101881/09 A RU2010101881/09 A RU 2010101881/09A RU 2010101881 A RU2010101881 A RU 2010101881A RU 2010101881 A RU2010101881 A RU 2010101881A
- Authority
- RU
- Russia
- Prior art keywords
- audio signal
- signal
- sound
- classification
- noise
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract 50
- 230000000694 effects Effects 0.000 title claims 28
- 230000005236 sound signal Effects 0.000 claims abstract 146
- 238000001228 spectrum Methods 0.000 claims abstract 42
- 230000007774 longterm Effects 0.000 claims abstract 21
- 230000003595 spectral effect Effects 0.000 claims abstract 18
- 238000001514 detection method Methods 0.000 claims abstract 10
- 238000012986 modification Methods 0.000 claims 8
- 230000004048 modification Effects 0.000 claims 8
- 230000030808 detection of mechanical stimulus involved in sensory perception of sound Effects 0.000 claims 6
- 230000000295 complement effect Effects 0.000 claims 5
- 238000011156 evaluation Methods 0.000 claims 4
- 238000001914 filtration Methods 0.000 claims 3
- 230000003044 adaptive effect Effects 0.000 claims 1
- 230000001419 dependent effect Effects 0.000 claims 1
- 238000009499 grossing Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
1. Способ оценки тональности звукового сигнала, который включает: ! вычисление текущего остаточного спектра звукового сигнала; ! обнаружение пиков в текущем остаточном спектре; ! вычисление карты корреляции между текущим остаточным спектром и предыдущим остаточным спектром для каждого обнаруженного пика; ! вычисление долгосрочной карты корреляции на основе вычисленной карты корреляции, причем долгосрочная карта корреляции характеризует тональность звукового сигнала. ! 2. Способ по п.1, отличающийся тем, что вычисление спектра текущего сигнала включает: ! поиск минимумов в спектре звукового сигнала в текущем кадре; ! оценку спектрального дна путем соединения минимумов друг с другом; ! вычитание оценки спектрального дна из спектра звукового сигнала в текущем кадре для получения текущего остаточного спектра. ! 3. Способ по п.1, отличающийся тем, что обнаружение пиков в текущем остаточном спектре включает определение положения максимума между каждой парой из двух последовательных минимумов. ! 4. Способ по п.1, отличающийся тем, что вычисление карты корреляции включает: ! вычисление для каждого пика, обнаруженного в текущем остаточном спектре, величины нормированной корреляции с предыдущим остаточным спектром по элементам разрешения по частоте между двумя последовательными минимумами в текущем остаточном спектре, которые ограничивают пик; и ! присвоение каждому обнаруженному пику оценки, соответствующей значению нормированной корреляции; и ! присвоение величины нормированной корреляции пика по элементам разрешения по частоте между двумя последовательными минимумами, ограничивающими пик, для каждого об�
Claims (66)
1. Способ оценки тональности звукового сигнала, который включает:
вычисление текущего остаточного спектра звукового сигнала;
обнаружение пиков в текущем остаточном спектре;
вычисление карты корреляции между текущим остаточным спектром и предыдущим остаточным спектром для каждого обнаруженного пика;
вычисление долгосрочной карты корреляции на основе вычисленной карты корреляции, причем долгосрочная карта корреляции характеризует тональность звукового сигнала.
2. Способ по п.1, отличающийся тем, что вычисление спектра текущего сигнала включает:
поиск минимумов в спектре звукового сигнала в текущем кадре;
оценку спектрального дна путем соединения минимумов друг с другом;
вычитание оценки спектрального дна из спектра звукового сигнала в текущем кадре для получения текущего остаточного спектра.
3. Способ по п.1, отличающийся тем, что обнаружение пиков в текущем остаточном спектре включает определение положения максимума между каждой парой из двух последовательных минимумов.
4. Способ по п.1, отличающийся тем, что вычисление карты корреляции включает:
вычисление для каждого пика, обнаруженного в текущем остаточном спектре, величины нормированной корреляции с предыдущим остаточным спектром по элементам разрешения по частоте между двумя последовательными минимумами в текущем остаточном спектре, которые ограничивают пик; и
присвоение каждому обнаруженному пику оценки, соответствующей значению нормированной корреляции; и
присвоение величины нормированной корреляции пика по элементам разрешения по частоте между двумя последовательными минимумами, ограничивающими пик, для каждого обнаруженного пика, чтобы сформировать карту корреляции.
5. Способ по п.1, отличающийся тем, что вычисление долгосрочной карты корреляции включает:
фильтрацию карты корреляции через однополюсный фильтр на элементе разрешения по частоте на основе элементов разрешения по частоте;
суммирование отфильтрованной карты корреляции по элементам разрешения по частоте с тем, чтобы получить суммарную долгосрочную карту корреляции.
6. Способ по п.1, отличающийся тем, что дополнительно включает обнаружение в звуковом сигнале сильных тонов.
7. Способ по п.6, отличающийся тем, что обнаружение сильных тонов в звуковом сигнале включает поиск по карте корреляции элементов разрешения по частоте, имеющих величину, которая превышает заданный фиксированный порог.
8. Способ по п.6, отличающийся тем, что обнаружение сильных тонов в звуковом сигнале включает сопоставление суммарной долгосрочной карты корреляции с адаптивным порогом, характеризующим звуковую активность в звуковом сигнале.
9. Способ по п.1, отличающийся тем, что дополнительно включает проверку присутствия сильных тонов.
10. Способ обнаружения звуковой активности в звуковом сигнале, где звуковой сигнал классифицируют как неактивный звуковой сигнал или активный звуковой сигнал, в соответствии с обнаруженной в звуковом сигнале звуковой активностью, который включает:
оценку параметра, связанного с тональностью звукового сигнала, применяемую для того, чтобы отличить музыкальный сигнал от сигнала фонового шума;
причем оценку тональности производят по одному из пп.1-9.
11. Способ по п.10, отличающийся тем, что дополнительно включает предотвращение модификации оценок энергии шума в случае обнаружения тонального звукового сигнала.
12. Способ по п.10, отличающийся тем, что обнаружение звуковой активности в звуковом сигнале дополнительно включает обнаружение звуковой активности на основе отношения сигнал/шум (SNR).
13. Способ по п.12, отличающийся тем, что обнаружение звуковой активности на основе отношения сигнал/шум (SNR) включает обнаружение звукового сигнала на основе частотно-зависимого отношения сигнал/шум (SNR).
14. Способ по п.12, отличающийся тем, что обнаружение звуковой активности на основе отношения сигнал/шум (SNR) включает сопоставление среднего отношения сигнал/шум (SNR av) с порогом, вычисленным как функция долгосрочного отношения сигнал/шум (SNR LT).
15. Способ по п.14, отличающийся тем, что обнаружение звуковой активности в звуковом сигнале на основе отношения сигнал/шум (SNR) дополнительно включает оценку энергии шума, произведенную в предыдущем кадре при вычислении SNR.
16. Способ по п.15, отличающийся тем, что обнаружение звуковой активности на основе отношения сигнал/шум (SNR) дополнительно включает модификацию оценок шума для следующего кадра.
17. Способ по п.16, отличающийся тем, что модификация оценок энергии шума для следующего кадра включает принятие решения о модификации, основанного, по меньшей мере, на одном из следующих показателей: устойчивости основного тона, вокализованности, параметра нестационарности звукового сигнала и отношения между линейными предсказаниями остаточных энергий погрешности второго и шестнадцатого порядка.
18. Способ по п.14, отличающийся тем, что включает классификацию звукового сигнала как неактивного звукового сигнала или активного звукового сигнала и включает обнаружение неактивного звукового сигнала в случае, если среднее отношение сигнал/шум (SNR av) не превышает вычисленный порог.
19. Способ по п.14, отличающийся тем, что включает классификацию звукового сигнала как неактивного звукового сигнала или активного звукового сигнала и включает обнаружение активного звукового сигнала в случае, если среднее отношение сигнал/шум (SNR av) превышает вычисленный порог.
20. Способ по п.10, отличающийся тем, что оценка параметра, связанного с тональностью звукового сигнала, предотвращает модификацию оценок энергии шума в случае обнаружения музыкального сигнала.
21. Способ по п.10, отличающийся тем, что дополнительно включает вычисление параметров комплементарной нестационарности и характера шума для установления отличия музыкального сигнала от сигнала фонового шума и предотвращения модификации оценок энергии шума на музыкальном сигнале.
22. Способ по п.21, отличающийся тем, что вычисление параметра комплементарной нестационарности включает вычисление параметра, подобного параметру обычной нестационарности, со сбросом долгосрочной энергии в случае обнаружения спектральной атаки.
23. Способ по п.22, отличающийся тем, что сброс долгосрочной энергии включает приравнивание долгосрочной энергии к энергии текущего кадра.
24. Способ по п.22, отличающийся тем, что обнаружение спектральной атаки и сброс долгосрочной энергии включает вычисление параметра спектральной разнородности.
25. Способ по п.24, отличающийся тем, что вычисление параметра спектральной разнородности включает:
вычисление отношения энергии звукового сигнала в текущем кадре к энергии звукового сигнала в предыдущем кадре для диапазонов частот, превышающих заданное число; и
вычисление спектральной разнородности как взвешенной суммы вычисленного отношения по всем диапазонам частот, превышающим заданное число.
26. Способ по п.22, отличающийся тем, что вычисление параметра комплементарной нестационарности дополнительно включает вычисление параметра предсказания активности, характеризующего активность звукового сигнала.
27. Способ по п.26, отличающийся тем, что вычисление параметра предсказания активности включает:
вычисление долгосрочного значения двоичного выбора, полученного из оценки параметра, связанного с тональностью звукового сигнала, и обычного параметра нестационарности.
28. Способ по п.21, отличающийся тем, что модификация оценок энергии шума предотвращается в случае, если параметр предсказания активности превышает первый заданный фиксированный порог, и параметр комплементарной нестационарности превышает второй заданный фиксированный порог.
29. Способ по п.21, отличающийся тем, что вычисление параметра характера шума включает:
разделение набора диапазонов частот на первую группу, содержащую определенное количество первых диапазонов частот, и вторую группу, содержащую остальные диапазоны частот;
вычисление первого значения энергии для первой группы диапазонов частот и второго значения энергии - для второй группы диапазонов частот;
вычисление отношения первого значения энергии ко второму с тем, чтобы получить параметр характера шума;
вычисление долгосрочного значения параметра характера шума на основе вычисленного параметра характера шума.
30. Способ по п.29, отличающийся тем, что модификация оценок энергии шума предотвращается в случае, если значение параметра характера шума не превышает заданный фиксированный порог.
31. Способ классификации звукового сигнала для оптимизации кодирования звукового сигнала с использованием классификации звукового сигнала, который включает:
обнаружение звуковой активности в звуковом сигнале;
классификацию звукового сигнала как активного звукового сигнала или неактивного звукового сигнала в соответствии со звуковой активностью, обнаруженной в звуковом сигнале;
в случае если звуковой сигнал классифицирован как активный звуковой сигнал, дальнейшую классификацию активного звукового сигнала как невокализованного речевого сигнала или речевого сигнала, не являющегося невокализованным;
причем классификация активного звукового сигнала как невокализованного речевого сигнала включает оценку тональности звукового сигнала для предотвращения классификации музыкальных сигналов как невокализованных речевых сигналов, причем оценку тональности выполняют по одному из пп.1-9.
32. Способ по п.31, отличающийся тем, что дополнительно включает кодирование звукового сигнала в соответствии с классификацией звукового сигнала.
33. Способ по п.32, отличающийся тем, что кодирование звукового сигнала в соответствии с классификацией звукового сигнала включает кодирование неактивных звуковых сигналов с генерацией комфортного шума.
34. Способ по п.31, отличающийся тем, что классификация активного звукового сигнала как невокализованного речевого сигнала включает вычисление правила принятия решения на основе, по меньшей мере, одного из параметров: степени вокализованности, степени среднего наклона спектра, максимального кратковременного увеличения энергии на низком уровне, тональной устойчивости и относительной энергии кадра.
35. Способ по п.31, отличающийся тем, что дополнительно включает классификацию речевого сигнала, не являющегося невокализованным, как устойчивого речевого сигнала или сигнала другого типа, отличающегося от устойчивого вокализованного речевого сигнала.
36. Способ по п.35, отличающийся тем, что классификация речевого сигнала, не являющегося невокализованным, как устойчивого вокализованного речевого сигнала включает вычисление правила принятия решения на основе, по меньшей мере, одной из оценок звукового сигнала: нормированной корреляции, среднего спектрального наклона и основного тона с разомкнутой петлей.
37. Способ кодирования верхнего диапазона звукового сигнала с использованием классификации звукового сигнала, который включает:
классификацию звукового сигнала как тонального звукового сигнала или нетонального звукового сигнала;
причем классификация звукового сигнала как тонального звукового сигнала содержит оценку тональности звукового сигнала по одному из пп.1-9.
38. Способ по п.37, отличающийся тем, что оценка параметра, связанного с тональностью звукового сигнала по одному из пп.1-9, дополнительно включает применение альтернативного способа для вычисления спектрального дна.
39. Способ по п.38, отличающийся тем, что применение альтернативного способа для вычисления спектрального дна включает фильтрацию log-энергии спектра звукового сигнала в текущем кадре с использованием фильтра скользящего среднего.
40. Способ по п.37, отличающийся тем, что оценка тональности звукового сигнала по одному из пп.1-9 дополнительно включает сглаживание остаточного спектра посредством кратковременного фильтра скользящего среднего.
41. Способ по п.37, отличающийся тем, что дополнительно включает кодирование верхнего диапазона звукового сигнала в соответствии с классификацией указанного звукового сигнала.
42. Способ по п.41, отличающийся тем, что кодирование верхнего диапазона звукового сигнала в соответствии с классификацией указанного звукового сигнала включает кодирование тональных звуковых сигналов с использованием модели, оптимизированной для этих сигналов.
43. Способ по п.37, отличающийся тем, что верхний диапазон звукового сигнала включает диапазон частот выше 7 КГц.
44. Устройство для оценки тональности звукового сигнала, включающее:
средства для вычисления текущего остаточного спектра звукового сигнала;
средства для обнаружения пиков в текущем остаточном спектре;
средства для вычисления карты корреляции между текущим остаточным спектром и предыдущим остаточным спектром для каждого обнаруженного пика; и
средства для вычисления долгосрочной карты корреляции на основе вычисленной карты корреляции, причем долгосрочная карта корреляции характеризует тональность звукового сигнала.
45. Устройство для оценки тональности звукового сигнала, включающее:
вычислитель текущего остаточного спектра звукового сигнала;
детектор пиков в текущем остаточном спектре;
вычислитель карты корреляции между текущим остаточным спектром и предыдущим остаточным спектром для каждого обнаруженного пика;
вычислитель долгосрочной карты корреляции на основе вычисленной карты корреляции, причем долгосрочная карта корреляции характеризует тональность звукового сигнала.
46. Устройство по п.45, отличающееся тем, что вычислитель текущего остаточного спектра включает:
устройство обнаружения минимумов в спектре звукового сигнала в текущем кадре;
устройство оценки спектрального дна, которое соединяет минимумы друг с другом; и
вычитатель оценки спектрального дна из спектра с тем, чтобы получить текущий остаточный спектр.
47. Устройство по п.45, отличающееся тем, что вычислитель долгосрочной карты корреляции включает:
фильтр для фильтрации карты корреляции на основе элементов разрешения по частоте;
сумматор для суммирования отфильтрованной карты корреляции на элементах разрешения по частоте с тем, чтобы получить суммарную долгосрочную карту корреляции.
48. Устройство по п.45, отличающееся тем, что дополнительно включает детектор сильных тонов в звуковом сигнале.
49. Устройство для обнаружения звуковой активности в звуковом сигнале, где звуковой сигнал классифицируют как неактивный звуковой сигнал или активный звуковой сигнал в соответствии с обнаруженной звуковой активностью, которое включает:
средства для оценки параметра, связанного с тональностью звукового сигнала, которые применяют для установления отличия музыкального сигнала от сигнала фонового шума;
причем средства оценки параметра тональности включают устройство по п.44.
50. Устройство для обнаружения звуковой активности в звуковом сигнале, где звуковой сигнал классифицируют как неактивный звуковой сигнал или активный звуковой сигнал в соответствии с обнаруженной звуковой активностью, которое включает:
эстиматор тональности звукового сигнала, применяемый для установления отличия музыкального сигнала от сигнала фонового шума;
причем эстиматор тональности включает устройство по одному из пп.45-48.
51. Устройство по п.50, отличающееся тем, что дополнительно включает детектор звуковой активности на основе отношения сигнал/шум (SNR).
52. Устройство по п.51, отличающееся тем, что детектор звуковой активности на основе отношения сигнал/шум (SNR) включает компаратор среднего отношения сигнал/шум (SNR av) с порогом, являющимся функцией долгосрочного отношения сигнал/шум (SNR TL).
53. Устройство по п.50, отличающееся тем, что дополнительно включает эстиматор для модификации оценок энергии шума при вычислении отношения сигнал/шум (SNR) в детекторе звуковой активности на основе отношения сигнал/шум (SNR).
54. Устройство по п.50, отличающееся тем, что дополнительно включает вычислитель параметра комплементарной нестационарности и вычислитель характера шума звукового сигнала для установления отличия музыкального сигнала от сигнала фонового шума и предотвращения модификации оценок энергии шума.
55. Устройство по п.50, отличающееся тем, что дополнительно включает вычислитель спектрального параметра, применяемого для обнаружения в звуковом сигнале изменений спектра и спектральных атак.
56. Устройство для классификации звукового сигнала с целью оптимизации кодирования звукового сигнала с использованием классификации звукового сигнала, которое включает:
средства для обнаружения звуковой активности в звуковом сигнале;
средства для классификации звукового сигнала как активного звукового сигнала или неактивного звукового сигнала в соответствии с обнаруженной в звуковом сигнале звуковой активностью;
в случае, если звуковой сигнал классифицирован как активный звуковой сигнал, средства для дальнейшей классификации активного звукового сигнала как невокализованного речевого сигнала или речевого сигнала, не являющегося невокализованным;
причем средства для дальнейшей классификации звукового сигнала как невокализованного речевого сигнала содержат средства для оценки параметра, связанного с тональностью звукового сигнала, для предотвращения классификации музыкальных сигналов как невокализованных речевых сигналов, где средства для оценки параметра, связанного с тональностью звукового сигнала, включают устройство по одному из пп.45-48.
57. Устройство для классификации звукового сигнала с целью оптимизации кодирования звукового сигнала с использованием классификации звукового сигнала, которое включает:
детектор звуковой активности в звуковом сигнале;
первый классификатор звукового сигнала для классификации звукового сигнала как активного звукового сигнала или неактивного звукового сигнала в соответствии с обнаруженной в звуковом сигнале звуковой активностью;
второй классификатор звукового сигнала, соединенный с первым классификатором звукового сигнала, для классификации активного звукового сигнала как невокализованного речевого сигнала или речевого сигнала, не являющегося невокализованным,
где детектор звуковой активности включает эстиматор тональности для измерения тональности звукового сигнала для оценки тональности звукового сигнала с целью предотвращения классификации музыкальных сигналов как невокализованных речевых сигналов, который включает устройство по одному из пп.45-48.
58. Устройство по п.57, отличающееся тем, что дополнительно включает кодировщик звука для кодирования звукового сигнала в соответствии с классификацией звукового сигнала.
59. Устройство по п.58, отличающееся тем, что кодировщик звука включает кодировщик шума для кодирования неактивных звуковых сигналов.
60. Устройство по п.58, отличающееся тем, что кодировщик звука включает оптимизированный кодер невокализованной речи.
61. Устройство по п.58, отличающееся тем, что кодировщик звука включает оптимизированный кодер вокализованной речи для кодирования устойчивых вокализованных сигналов.
62. Устройство по п.58, отличающееся тем, что кодировщик звука включает обобщенный кодер звукового сигнала для кодирования быстро развивающихся вокализованных сигналов.
63. Устройство для кодирования верхнего диапазона звукового сигнала с использованием классификации звукового сигнала, которое включает:
средства для классификации звукового сигнала как тонального звукового сигнала или нетонального звукового сигнала;
средства для кодирования верхнего диапазона классифицированного звукового сигнала,
где средства для классификации звукового сигнала как тонального включают устройство для оценки тональности звукового сигнала по одному из пп.45-48.
64. Устройство для кодирования верхнего диапазона звукового сигнала с использованием классификации звукового сигнала, которое включает:
классификатор звукового сигнала для классификации звукового сигнала как тонального звукового сигнала или нетонального звукового сигнала;
кодировщик звука для кодирования верхнего диапазона классифицированного звукового сигнала,
где классификатор звукового сигнала включает устройство для оценки тональности звукового сигнала по одному из пп.45-48.
65. Устройство по п.64, отличающееся тем, что дополнительно включает фильтр скользящего среднего для вычисления спектрального дна, полученного из звукового сигнала, где спектральное дно применяют для оценки тональности звукового сигнала.
66. Устройство по п.64, отличающееся тем, что дополнительно включает кратковременный фильтр скользящего среднего для сглаживания остаточного спектра звукового сигнала, где остаточный спектр применяют для оценки тональности звукового сигнала.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US92933607P | 2007-06-22 | 2007-06-22 | |
US60/929,336 | 2007-06-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2010101881A true RU2010101881A (ru) | 2011-07-27 |
RU2441286C2 RU2441286C2 (ru) | 2012-01-27 |
Family
ID=40185136
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2010101881/08A RU2441286C2 (ru) | 2007-06-22 | 2008-06-20 | Способ и устройство для обнаружения звуковой активности и классификации звуковых сигналов |
Country Status (7)
Country | Link |
---|---|
US (1) | US8990073B2 (ru) |
EP (1) | EP2162880B1 (ru) |
JP (1) | JP5395066B2 (ru) |
CA (1) | CA2690433C (ru) |
ES (1) | ES2533358T3 (ru) |
RU (1) | RU2441286C2 (ru) |
WO (1) | WO2009000073A1 (ru) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2583717C1 (ru) * | 2012-01-09 | 2016-05-10 | Долби Лабораторис Лайсэнзин Корпорейшн | Способ и система кодирования аудиоданных с адаптивной низкочастотной коррекцией |
RU2744477C2 (ru) * | 2012-03-29 | 2021-03-10 | Телефонактиеболагет Л М Эрикссон (Пабл) | Преобразующее кодирование/декодирование гармонических звуковых сигналов |
Families Citing this family (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
CN101246688B (zh) * | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
US8521530B1 (en) * | 2008-06-30 | 2013-08-27 | Audience, Inc. | System and method for enhancing a monaural audio signal |
TWI384423B (zh) * | 2008-11-26 | 2013-02-01 | Ind Tech Res Inst | 以聲音事件為基礎之緊急通報方法與系統以及行為軌跡建立方法 |
US20110301946A1 (en) * | 2009-02-27 | 2011-12-08 | Panasonic Corporation | Tone determination device and tone determination method |
CN101847412B (zh) * | 2009-03-27 | 2012-02-15 | 华为技术有限公司 | 音频信号的分类方法及装置 |
DE112009005215T8 (de) * | 2009-08-04 | 2013-01-03 | Nokia Corp. | Verfahren und Vorrichtung zur Audiosignalklassifizierung |
US8571231B2 (en) * | 2009-10-01 | 2013-10-29 | Qualcomm Incorporated | Suppressing noise in an audio signal |
JP2013508773A (ja) * | 2009-10-19 | 2013-03-07 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 音声エンコーダの方法およびボイス活動検出器 |
EP2816560A1 (en) | 2009-10-19 | 2014-12-24 | Telefonaktiebolaget L M Ericsson (PUBL) | Method and background estimator for voice activity detection |
US8892428B2 (en) | 2010-01-14 | 2014-11-18 | Panasonic Intellectual Property Corporation Of America | Encoding apparatus, decoding apparatus, encoding method, and decoding method for adjusting a spectrum amplitude |
EP2540133B1 (en) * | 2010-02-25 | 2014-08-27 | Telefonaktiebolaget LM Ericsson (publ) | Switching off dtx for music |
US8886523B2 (en) * | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
WO2011132368A1 (ja) * | 2010-04-19 | 2011-10-27 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法及び復号方法 |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US8907929B2 (en) * | 2010-06-29 | 2014-12-09 | Qualcomm Incorporated | Touchless sensing and gesture recognition using continuous wave ultrasound signals |
US20130268265A1 (en) * | 2010-07-01 | 2013-10-10 | Gyuhyeok Jeong | Method and device for processing audio signal |
US9082416B2 (en) * | 2010-09-16 | 2015-07-14 | Qualcomm Incorporated | Estimating a pitch lag |
US8521541B2 (en) * | 2010-11-02 | 2013-08-27 | Google Inc. | Adaptive audio transcoding |
ES2665944T3 (es) * | 2010-12-24 | 2018-04-30 | Huawei Technologies Co., Ltd. | Aparato para realizar una detección de actividad de voz |
SI3493205T1 (sl) * | 2010-12-24 | 2021-03-31 | Huawei Technologies Co., Ltd. | Postopek in naprava za adaptivno zaznavanje glasovne aktivnosti v vstopnem avdio signalu |
US20140006019A1 (en) * | 2011-03-18 | 2014-01-02 | Nokia Corporation | Apparatus for audio signal processing |
US20140114653A1 (en) * | 2011-05-06 | 2014-04-24 | Nokia Corporation | Pitch estimator |
US8990074B2 (en) * | 2011-05-24 | 2015-03-24 | Qualcomm Incorporated | Noise-robust speech coding mode classification |
US9099098B2 (en) * | 2012-01-20 | 2015-08-04 | Qualcomm Incorporated | Voice activity detection in presence of background noise |
CN108831501B (zh) | 2012-03-21 | 2023-01-10 | 三星电子株式会社 | 用于带宽扩展的高频编码/高频解码方法和设备 |
WO2013142723A1 (en) * | 2012-03-23 | 2013-09-26 | Dolby Laboratories Licensing Corporation | Hierarchical active voice detection |
KR101398189B1 (ko) * | 2012-03-27 | 2014-05-22 | 광주과학기술원 | 음성수신장치 및 음성수신방법 |
US20130317821A1 (en) * | 2012-05-24 | 2013-11-28 | Qualcomm Incorporated | Sparse signal detection with mismatched models |
EP3113184B1 (en) | 2012-08-31 | 2017-12-06 | Telefonaktiebolaget LM Ericsson (publ) | Method and device for voice activity detection |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
JP6170172B2 (ja) * | 2012-11-13 | 2017-07-26 | サムスン エレクトロニクス カンパニー リミテッド | 符号化モード決定方法及び該装置、オーディオ符号化方法及び該装置、並びにオーディオ復号化方法及び該装置 |
JP6335190B2 (ja) * | 2012-12-21 | 2018-05-30 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加 |
SG11201510513WA (en) | 2013-06-21 | 2016-01-28 | Fraunhofer Ges Forschung | Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals |
CN108364657B (zh) | 2013-07-16 | 2020-10-30 | 超清编解码有限公司 | 处理丢失帧的方法和解码器 |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
CN104347067B (zh) | 2013-08-06 | 2017-04-12 | 华为技术有限公司 | 一种音频信号分类方法和装置 |
CN104424956B9 (zh) * | 2013-08-30 | 2022-11-25 | 中兴通讯股份有限公司 | 激活音检测方法和装置 |
US9570093B2 (en) * | 2013-09-09 | 2017-02-14 | Huawei Technologies Co., Ltd. | Unvoiced/voiced decision for speech processing |
US9769550B2 (en) | 2013-11-06 | 2017-09-19 | Nvidia Corporation | Efficient digital microphone receiver process and system |
US9454975B2 (en) * | 2013-11-07 | 2016-09-27 | Nvidia Corporation | Voice trigger |
JP2015099266A (ja) * | 2013-11-19 | 2015-05-28 | ソニー株式会社 | 信号処理装置、信号処理方法およびプログラム |
EP3719801B1 (en) | 2013-12-19 | 2023-02-01 | Telefonaktiebolaget LM Ericsson (publ) | Estimation of background noise in audio signals |
US9899039B2 (en) | 2014-01-24 | 2018-02-20 | Foundation Of Soongsil University-Industry Cooperation | Method for determining alcohol consumption, and recording medium and terminal for carrying out same |
WO2015111771A1 (ko) | 2014-01-24 | 2015-07-30 | 숭실대학교산학협력단 | 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기 |
US9916844B2 (en) * | 2014-01-28 | 2018-03-13 | Foundation Of Soongsil University-Industry Cooperation | Method for determining alcohol consumption, and recording medium and terminal for carrying out same |
KR101621797B1 (ko) | 2014-03-28 | 2016-05-17 | 숭실대학교산학협력단 | 시간 영역에서의 차신호 에너지법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 |
KR101621780B1 (ko) | 2014-03-28 | 2016-05-17 | 숭실대학교산학협력단 | 차신호 주파수 프레임 비교법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 |
KR101569343B1 (ko) | 2014-03-28 | 2015-11-30 | 숭실대학교산학협력단 | 차신호 고주파 신호의 비교법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치 |
CN111710342B (zh) * | 2014-03-31 | 2024-04-16 | 弗朗霍弗应用研究促进协会 | 编码装置、解码装置、编码方法、解码方法及程序 |
FR3020732A1 (fr) * | 2014-04-30 | 2015-11-06 | Orange | Correction de perte de trame perfectionnee avec information de voisement |
EP3140831B1 (en) * | 2014-05-08 | 2018-07-11 | Telefonaktiebolaget LM Ericsson (publ) | Audio signal discriminator and coder |
CN105225666B (zh) | 2014-06-25 | 2016-12-28 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
RU2713852C2 (ru) | 2014-07-29 | 2020-02-07 | Телефонактиеболагет Лм Эрикссон (Пабл) | Оценивание фонового шума в аудиосигналах |
CN106797512B (zh) | 2014-08-28 | 2019-10-25 | 美商楼氏电子有限公司 | 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质 |
US10163453B2 (en) * | 2014-10-24 | 2018-12-25 | Staton Techiya, Llc | Robust voice activity detector system for use with an earphone |
US10049684B2 (en) * | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
US9401158B1 (en) * | 2015-09-14 | 2016-07-26 | Knowles Electronics, Llc | Microphone signal fusion |
KR102446392B1 (ko) * | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
CN106910494B (zh) | 2016-06-28 | 2020-11-13 | 创新先进技术有限公司 | 一种音频识别方法和装置 |
US9978392B2 (en) * | 2016-09-09 | 2018-05-22 | Tata Consultancy Services Limited | Noisy signal identification from non-stationary audio signals |
CN109360585A (zh) * | 2018-12-19 | 2019-02-19 | 晶晨半导体(上海)股份有限公司 | 一种语音激活检测方法 |
KR20200133525A (ko) | 2019-05-20 | 2020-11-30 | 삼성전자주식회사 | 생체 정보 추정 모델의 유효성 판단 장치 및 방법 |
JP7552137B2 (ja) | 2020-08-13 | 2024-09-18 | 沖電気工業株式会社 | 音声検出装置、音声検出プログラム、及び音声検出方法 |
CN112908352B (zh) * | 2021-03-01 | 2024-04-16 | 百果园技术(新加坡)有限公司 | 一种音频去噪方法、装置、电子设备及存储介质 |
US11545159B1 (en) | 2021-06-10 | 2023-01-03 | Nice Ltd. | Computerized monitoring of digital audio signals |
CN116935900A (zh) * | 2022-03-29 | 2023-10-24 | 哈曼国际工业有限公司 | 语音检测方法 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5040217A (en) | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
FI92535C (fi) | 1992-02-14 | 1994-11-25 | Nokia Mobile Phones Ltd | Kohinan vaimennusjärjestelmä puhesignaaleille |
JPH05335967A (ja) * | 1992-05-29 | 1993-12-17 | Takeo Miyazawa | 音情報圧縮方法及び音情報再生装置 |
DE69421911T2 (de) * | 1993-03-25 | 2000-07-20 | British Telecommunications P.L.C., London | Spracherkennung mit pausedetektion |
JP3321933B2 (ja) | 1993-10-19 | 2002-09-09 | ソニー株式会社 | ピッチ検出方法 |
JPH07334190A (ja) | 1994-06-14 | 1995-12-22 | Matsushita Electric Ind Co Ltd | 高調波振幅値量子化装置 |
US5712953A (en) | 1995-06-28 | 1998-01-27 | Electronic Data Systems Corporation | System and method for classification of audio or audio/video signals based on musical content |
JP3064947B2 (ja) | 1997-03-26 | 2000-07-12 | 日本電気株式会社 | 音声・楽音符号化及び復号化装置 |
US6330533B2 (en) * | 1998-08-24 | 2001-12-11 | Conexant Systems, Inc. | Speech encoder adaptively applying pitch preprocessing with warping of target signal |
US6424938B1 (en) | 1998-11-23 | 2002-07-23 | Telefonaktiebolaget L M Ericsson | Complex signal activity detection for improved speech/noise classification of an audio signal |
US6160199A (en) | 1998-12-21 | 2000-12-12 | The Procter & Gamble Company | Absorbent articles comprising biodegradable PHA copolymers |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US6510407B1 (en) | 1999-10-19 | 2003-01-21 | Atmel Corporation | Method and apparatus for variable rate coding of speech |
JP2002169579A (ja) | 2000-12-01 | 2002-06-14 | Takayuki Arai | オーディオ信号への付加データ埋め込み装置及びオーディオ信号からの付加データ再生装置 |
DE10109648C2 (de) | 2001-02-28 | 2003-01-30 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals |
DE10134471C2 (de) | 2001-02-28 | 2003-05-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals |
GB2375028B (en) * | 2001-04-24 | 2003-05-28 | Motorola Inc | Processing speech signals |
EP1280138A1 (de) * | 2001-07-24 | 2003-01-29 | Empire Interactive Europe Ltd. | Verfahren zur Analyse von Audiosignalen |
US7124075B2 (en) * | 2001-10-26 | 2006-10-17 | Dmitry Edward Terez | Methods and apparatus for pitch determination |
FR2850781B1 (fr) | 2003-01-30 | 2005-05-06 | Jean Luc Crebouw | Procede pour le traitement numerique differencie de la voix et de la musique, le filtrage du bruit, la creation d'effets speciaux et dispositif pour la mise en oeuvre dudit procede |
US7333930B2 (en) * | 2003-03-14 | 2008-02-19 | Agere Systems Inc. | Tonal analysis for perceptual audio coding using a compressed spectral representation |
US6988064B2 (en) * | 2003-03-31 | 2006-01-17 | Motorola, Inc. | System and method for combined frequency-domain and time-domain pitch extraction for speech signals |
SG119199A1 (en) * | 2003-09-30 | 2006-02-28 | Stmicroelectronics Asia Pacfic | Voice activity detector |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
JP4434813B2 (ja) | 2004-03-30 | 2010-03-17 | 学校法人早稲田大学 | 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置 |
ATE429698T1 (de) * | 2004-09-17 | 2009-05-15 | Harman Becker Automotive Sys | Bandbreitenerweiterung von bandbegrenzten tonsignalen |
RU2404506C2 (ru) * | 2004-11-05 | 2010-11-20 | Панасоник Корпорэйшн | Устройство масштабируемого декодирования и устройство масштабируемого кодирования |
KR100657948B1 (ko) * | 2005-02-03 | 2006-12-14 | 삼성전자주식회사 | 음성향상장치 및 방법 |
US20060224381A1 (en) * | 2005-04-04 | 2006-10-05 | Nokia Corporation | Detecting speech frames belonging to a low energy sequence |
JP2007025290A (ja) | 2005-07-15 | 2007-02-01 | Matsushita Electric Ind Co Ltd | マルチチャンネル音響コーデックにおける残響を制御する装置 |
KR101116363B1 (ko) * | 2005-08-11 | 2012-03-09 | 삼성전자주식회사 | 음성신호 분류방법 및 장치, 및 이를 이용한 음성신호부호화방법 및 장치 |
JP4736632B2 (ja) * | 2005-08-31 | 2011-07-27 | 株式会社国際電気通信基礎技術研究所 | ボーカル・フライ検出装置及びコンピュータプログラム |
US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
JP2007114417A (ja) * | 2005-10-19 | 2007-05-10 | Fujitsu Ltd | 音声データ処理方法及び装置 |
TWI330355B (en) * | 2005-12-05 | 2010-09-11 | Qualcomm Inc | Systems, methods, and apparatus for detection of tonal components |
KR100653643B1 (ko) * | 2006-01-26 | 2006-12-05 | 삼성전자주식회사 | 하모닉과 비하모닉의 비율을 이용한 피치 검출 방법 및피치 검출 장치 |
SG136836A1 (en) * | 2006-04-28 | 2007-11-29 | St Microelectronics Asia | Adaptive rate control algorithm for low complexity aac encoding |
JP4236675B2 (ja) | 2006-07-28 | 2009-03-11 | 富士通株式会社 | 音声符号変換方法および装置 |
US8015000B2 (en) * | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
US8428957B2 (en) * | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
-
2008
- 2008-06-20 CA CA2690433A patent/CA2690433C/en active Active
- 2008-06-20 EP EP08783143.4A patent/EP2162880B1/en active Active
- 2008-06-20 US US12/664,934 patent/US8990073B2/en active Active
- 2008-06-20 JP JP2010512474A patent/JP5395066B2/ja active Active
- 2008-06-20 ES ES08783143.4T patent/ES2533358T3/es active Active
- 2008-06-20 WO PCT/CA2008/001184 patent/WO2009000073A1/en active Application Filing
- 2008-06-20 RU RU2010101881/08A patent/RU2441286C2/ru active
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2583717C1 (ru) * | 2012-01-09 | 2016-05-10 | Долби Лабораторис Лайсэнзин Корпорейшн | Способ и система кодирования аудиоданных с адаптивной низкочастотной коррекцией |
RU2744477C2 (ru) * | 2012-03-29 | 2021-03-10 | Телефонактиеболагет Л М Эрикссон (Пабл) | Преобразующее кодирование/декодирование гармонических звуковых сигналов |
US11264041B2 (en) | 2012-03-29 | 2022-03-01 | Telefonaktiebolaget Lm Ericsson (Publ) | Transform encoding/decoding of harmonic audio signals |
US12027175B2 (en) | 2012-03-29 | 2024-07-02 | Telefonaktiebolaget Lm Ericsson (Publ) | Transform encoding/decoding of harmonic audio signals |
Also Published As
Publication number | Publication date |
---|---|
CA2690433C (en) | 2016-01-19 |
EP2162880B1 (en) | 2014-12-24 |
WO2009000073A1 (en) | 2008-12-31 |
ES2533358T3 (es) | 2015-04-09 |
RU2441286C2 (ru) | 2012-01-27 |
US8990073B2 (en) | 2015-03-24 |
CA2690433A1 (en) | 2008-12-31 |
WO2009000073A8 (en) | 2009-03-26 |
EP2162880A4 (en) | 2013-12-25 |
JP2010530989A (ja) | 2010-09-16 |
JP5395066B2 (ja) | 2014-01-22 |
US20110035213A1 (en) | 2011-02-10 |
EP2162880A1 (en) | 2010-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2010101881A (ru) | Способ и устройство для обнаружения звуковой активности и классификации звуковых сигналов | |
US8380497B2 (en) | Methods and apparatus for noise estimation | |
KR100986957B1 (ko) | 토널 컴포넌트들을 감지하는 시스템들, 방법들, 및 장치들 | |
Moattar et al. | A simple but efficient real-time voice activity detection algorithm | |
US8311819B2 (en) | System for detecting speech with background voice estimates and noise estimates | |
KR100944252B1 (ko) | 오디오 신호 내에서 음성활동 탐지 | |
US9418681B2 (en) | Method and background estimator for voice activity detection | |
US6427134B1 (en) | Voice activity detector for calculating spectral irregularity measure on the basis of spectral difference measurements | |
KR100744352B1 (ko) | 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치 | |
KR102267986B1 (ko) | 오디오 신호의 배경 잡음 추정 | |
CA2488918A1 (en) | Method and apparatus for selecting an encoding rate in a variable rate vocoder | |
CN105830154B (zh) | 估计音频信号中的背景噪声 | |
KR20070102904A (ko) | 음성 신호의 유성음화 비율 검출 장치 및 방법 | |
Pencak et al. | The NP speech activity detection algorithm | |
Li et al. | Robust speech endpoint detection based on improved adaptive band-partitioning spectral entropy | |
KR101088181B1 (ko) | 신뢰성이 높은 우도비를 사용한 음성 검출 장치 및 방법 | |
KR100718749B1 (ko) | 복소수 감마 통계 모델에 기초한 음성 검출 방법 및 음성검출기 | |
Murty et al. | Voice activity detection in degraded speech using excitation source information. | |
Jelinek et al. | Robust signal/noise discrimination for wideband speech and audio coding | |
US20240013803A1 (en) | Method enabling the detection of the speech signal activity regions | |
KR100312334B1 (ko) | 에너지와 lsp 파라메타를 이용한 음성신호처리부호화기에서의 음성 활동 검출 방법 | |
Sorensen et al. | Speech presence detection in the time-frequency domain using minimum statistics | |
Jang et al. | A uniformly most powerful test for statistical model-based voice activity detection. | |
Zhang et al. | Performance and Optimization of the SEEVOC Algorithm | |
KR20100044424A (ko) | 이동 기반 유성음 측정 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PC41 | Official registration of the transfer of exclusive right |
Effective date: 20220301 |