RU2010116727A - Средство обнаружения голосовой активности с использованием нескольких микрофонов - Google Patents
Средство обнаружения голосовой активности с использованием нескольких микрофонов Download PDFInfo
- Publication number
- RU2010116727A RU2010116727A RU2010116727/08A RU2010116727A RU2010116727A RU 2010116727 A RU2010116727 A RU 2010116727A RU 2010116727/08 A RU2010116727/08 A RU 2010116727/08A RU 2010116727 A RU2010116727 A RU 2010116727A RU 2010116727 A RU2010116727 A RU 2010116727A
- Authority
- RU
- Russia
- Prior art keywords
- speech
- determining
- characteristic value
- voice activity
- signal
- Prior art date
Links
- 230000000694 effects Effects 0.000 title claims abstract 34
- 238000000034 method Methods 0.000 claims 15
- 230000008447 perception Effects 0.000 claims 6
- 230000003595 spectral effect Effects 0.000 claims 3
- 230000035945 sensitivity Effects 0.000 claims 2
- 230000005855 radiation Effects 0.000 claims 1
- 238000000926 separation method Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Push-Button Switches (AREA)
- Details Of Audible-Bandwidth Transducers (AREA)
Abstract
1. Способ обнаружения голосовой активности, содержащий этапы, на которых: ! принимают речевой сигнал от микрофона для восприятия речи; !принимают шумовой сигнал от микрофона для восприятия шумов, отличного от микрофона для восприятия речи; ! определяют характеристическое значение речи на основе, по меньшей мере, частично, речевого сигнала; ! определяют объединенное характеристическое значение на основе, по меньшей мере, частично, речевого сигнала и шумового сигнала; ! определяют метрику голосовой активности на основе, по меньшей мере, частично, речевого характеристического значения и объединенного характеристического значения, причем этап определения характеристического значения речи содержит этап, на котором определяют абсолютное значение автокорреляции речевого сигнала; и ! определяют состояние голосовой активности на основе метрики голосовой активности. ! 2. Способ по п.1, дополнительно содержащий этап, на котором формируют диаграмму направленности, по меньшей мере, либо речевого сигнала, либо голосового сигнала. ! 3. Способ по п.1, дополнительно содержащий этап, на котором выполняют слепое разделение источников (BSS) применительно к речевому сигналу и шумовому сигналу для выделения речевого компонента сигнала в речевом сигнале. ! 4. Способ по п.1, дополнительно содержащий этап, на котором выполняют спектральное вычитание применительно, по меньшей мере, к речевому или шумовому сигналу. ! 5. Способ по п.1, дополнительно содержащий этап, на котором определяют характеристическое значение шумов на основе, по меньшей мере, частично, шумового сигнала, и причем метрика голосовой активности основывается, по меньшей
Claims (25)
1. Способ обнаружения голосовой активности, содержащий этапы, на которых:
принимают речевой сигнал от микрофона для восприятия речи;
принимают шумовой сигнал от микрофона для восприятия шумов, отличного от микрофона для восприятия речи;
определяют характеристическое значение речи на основе, по меньшей мере, частично, речевого сигнала;
определяют объединенное характеристическое значение на основе, по меньшей мере, частично, речевого сигнала и шумового сигнала;
определяют метрику голосовой активности на основе, по меньшей мере, частично, речевого характеристического значения и объединенного характеристического значения, причем этап определения характеристического значения речи содержит этап, на котором определяют абсолютное значение автокорреляции речевого сигнала; и
определяют состояние голосовой активности на основе метрики голосовой активности.
2. Способ по п.1, дополнительно содержащий этап, на котором формируют диаграмму направленности, по меньшей мере, либо речевого сигнала, либо голосового сигнала.
3. Способ по п.1, дополнительно содержащий этап, на котором выполняют слепое разделение источников (BSS) применительно к речевому сигналу и шумовому сигналу для выделения речевого компонента сигнала в речевом сигнале.
4. Способ по п.1, дополнительно содержащий этап, на котором выполняют спектральное вычитание применительно, по меньшей мере, к речевому или шумовому сигналу.
5. Способ по п.1, дополнительно содержащий этап, на котором определяют характеристическое значение шумов на основе, по меньшей мере, частично, шумового сигнала, и причем метрика голосовой активности основывается, по меньшей мере, частично, на характеристическом значении шумов.
6. Способ по п.1, в котором речевой сигнал включает в себя наличие или отсутствие речевой активности.
7. Способ по п.6, в котором автокорреляция содержит взвешенную сумму предшествующей автокорреляции с речевой энергией в конкретном интервале времени.
8. Способ по п.1, в котором этап определения речевого характеристического значения содержит этап, на котором определяют энергию речевого сигнала.
9. Способ по п.1, в котором этап определения объединенного характеристического значения содержит этап, на котором определяют взаимную корреляцию на основе речевого сигнала и шумового сигнала.
10. Способ по п.1, в котором этап определения состояния голосовой активности содержит этап, на котором сравнивают метрику голосовой активности с пороговым значением.
11. Способ по п.1, в котором:
микрофон для восприятия речи содержит, по меньшей мере, один речевой микрофон;
микрофон для восприятия шумов содержит, по меньшей мере, один шумовой микрофон, отличный, по меньшей мере, от одного речевого микрофона;
этап определения речевого характеристического значения содержит этап, на котором определяют автокорреляцию на основе речевого сигнала;
этап определения объединенного характеристического значения содержит этап, на котором определяют взаимную корреляцию на основе речевого сигнала и шумового сигнала;
этап определения метрики голосовой активности основывается, частично, на определении отношения абсолютного значения автокорреляции речевого сигнала к взаимной корреляции; и
этап определения состояния голосовой активности содержит этап, на котором сравнивают метрику голосовой активности, по меньшей мере, с одним пороговым значением.
12. Способ по п.11, дополнительно содержащий этап, на котором выполняют выделение, по меньшей мере, или речевого, или шумового сигнала, и где метрика голосовой активности основывается, по меньшей мере, частично, либо на выделенном речевом сигнале, либо на выделенном шумовом сигнале.
13. Способ по п.11, дополнительно содержащий этап, на котором изменяют рабочий параметр на основе состояния голосовой активности.
14. Способ по п.13, в котором рабочий параметр содержит усиление, применяемое к речевому сигналу.
15. Способ по п.13, в котором рабочий параметр содержит состояние средства кодирования речи, оперирующего с речевым сигналом.
16. Устройство, сконфигурированное для обнаружения голосовой активности, содержащее:
микрофон для восприятия речи, сконфигурированный для вывода речевого сигнала;
микрофон для восприятия шумов, сконфигурированный для вывода шумового сигнала;
генератор речевых характеристических значений, соединенный с микрофоном для восприятия речи, а также сконфигурированный для определения речевого характеристического значения, причем этап определения речевого характеристического значения содержит этап, на котором определяют абсолютное значение автокорреляции речевого сигнала;
генератор объединенных характеристических значений, соединенный с микрофоном для восприятия речи и микрофоном для восприятия шумов, а также сконфигурированный для определения объединенного характеристического значения;
модуль метрики голосовой активности, сконфигурированный для определения метрики голосовой активности на основе, по меньшей мере, частично, характеристического значения речи и объединенного характеристического значения; и
средство сравнения, сконфигурированное для сравнения метрики голосовой активности с пороговым значением, а также для вывода состояния голосовой активности.
17. Устройство по п.16, в котором микрофон для восприятия речи включает в себя несколько микрофонов.
18. Устройство по п.16, в котором генератор характеристических значений речи сконфигурирован для определения средневзвешенного значения на основе экспоненциального затухания предшествующих речевых характеристических значений.
19. Устройство по п.16, в котором генератор объединенных характеристических значений сконфигурирован для определения взаимной корреляции на основе речевого сигнала и шумового сигнала.
20. Устройство по п.16, в котором модуль метрики голосовой активности сконфигурирован для определения отношения речевого характеристического значения к шумовому характеристическому значению.
21. Устройство, сконфигурированное с возможностью обнаружения голосовой активности, содержащее:
средство для приема речевого сигнала;
средство для приема шумового сигнала;
средство для определения автокорреляции на основе речевого сигнала;
средство для определения взаимной корреляции на основе речевого сигнала и шумового сигнала;
средство для определения метрики голосовой активности на основе, частично, отношения абсолютного значения автокорреляции речевого сигнала к взаимной корреляции; и
средство для определения состояния голосовой активности посредством сравнения метрики голосовой активности, по меньшей мере, с одним пороговым значением.
22. Устройство по п.21, дополнительно содержащее средство для калибровки спектральной чувствительности пути прохождения речевого сигнала так, чтобы она была, по существу, аналогичной спектральной чувствительности пути прохождения шумового сигнала.
23. Машиночитаемый носитель информации, включающий в себя команды, которые могут быть использованы одним или несколькими процессорами, содержащий:
команды для определения речевого характеристического значения на основе, по меньшей мере, частично, речевого сигнала, по меньшей мере, от одного микрофона для восприятия речи, причем этап определения речевого характеристического значения содержит этап, на котором определяют абсолютное значение автокорреляции речевого сигнала;
команды для определения объединенного характеристического значения на основе, по меньшей мере, частично, речевого сигнала и шумового сигнала, по меньшей мере, от одного микрофона для восприятия шумов;
команды для определения метрики голосовой активности на основе, по меньшей мере, частично, голосового характеристического значения и объединенного характеристического значения; и
команды для определения состояния голосовой активности на основе метрики голосовой активности.
24. Схема, сконфигурированная с возможностью обнаружения голосовой активности, содержащая:
первый блок, выполненный с возможностью приема выходного речевого сигнала от микрофона для восприятия речи;
второй блок, выполненный с возможностью приема выходного сигнала от микрофона для восприятия шумов;
третий блок, содержащий генератор речевых характеристических значений, соединенный с первым блоком, сконфигурированный для определения речевого характеристического значения, причем этап определения речевого характеристического значения содержит этап, на котором определяют абсолютное значение автокорреляции речевого сигнала;
четвертый блок, содержащий генератор объединенных характеристических значений, соединенный с первым блоком и вторым блоком, сконфигурированный для определения объединенного характеристического значения;
пятый блок, содержащий модуль метрики голосовой активности, сконфигурированный для определения метрики голосовой активности на основе, по меньшей мере, частично, речевого характеристического значения и объединенного характеристического значения; и
средство сравнения, сконфигурированное для сравнения метрики голосовой активности с пороговым значением, а также для вывода состояния голосовой активности.
25. Схема по п.24, в которой любые два блока группы, состоящей из первого блока, второго блока, третьего блока, четвертого блока и пятого блока, содержат подобную схему.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/864,897 US8954324B2 (en) | 2007-09-28 | 2007-09-28 | Multiple microphone voice activity detector |
US11/864,897 | 2007-09-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2010116727A true RU2010116727A (ru) | 2011-11-10 |
RU2450368C2 RU2450368C2 (ru) | 2012-05-10 |
Family
ID=40002930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2010116727/08A RU2450368C2 (ru) | 2007-09-28 | 2008-09-26 | Средство обнаружения голосовой активности с использованием нескольких микрофонов |
Country Status (12)
Country | Link |
---|---|
US (1) | US8954324B2 (ru) |
EP (1) | EP2201563B1 (ru) |
JP (1) | JP5102365B2 (ru) |
KR (1) | KR101265111B1 (ru) |
CN (1) | CN101790752B (ru) |
AT (1) | ATE531030T1 (ru) |
BR (1) | BRPI0817731A8 (ru) |
CA (1) | CA2695231C (ru) |
ES (1) | ES2373511T3 (ru) |
RU (1) | RU2450368C2 (ru) |
TW (1) | TWI398855B (ru) |
WO (1) | WO2009042948A1 (ru) |
Families Citing this family (119)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8280072B2 (en) | 2003-03-27 | 2012-10-02 | Aliphcom, Inc. | Microphone array with rear venting |
US8019091B2 (en) | 2000-07-19 | 2011-09-13 | Aliphcom, Inc. | Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression |
US8326611B2 (en) * | 2007-05-25 | 2012-12-04 | Aliphcom, Inc. | Acoustic voice activity detection (AVAD) for electronic systems |
US9066186B2 (en) | 2003-01-30 | 2015-06-23 | Aliphcom | Light-based detection for acoustic applications |
US9099094B2 (en) | 2003-03-27 | 2015-08-04 | Aliphcom | Microphone array with rear venting |
US8477961B2 (en) * | 2003-03-27 | 2013-07-02 | Aliphcom, Inc. | Microphone array with rear venting |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US8321213B2 (en) * | 2007-05-25 | 2012-11-27 | Aliphcom, Inc. | Acoustic voice activity detection (AVAD) for electronic systems |
US8503686B2 (en) | 2007-05-25 | 2013-08-06 | Aliphcom | Vibration sensor and acoustic voice activity detection system (VADS) for use with electronic systems |
US8046219B2 (en) * | 2007-10-18 | 2011-10-25 | Motorola Mobility, Inc. | Robust two microphone noise suppression system |
DE602008002695D1 (de) * | 2008-01-17 | 2010-11-04 | Harman Becker Automotive Sys | Postfilter für einen Strahlformer in der Sprachverarbeitung |
US8554551B2 (en) * | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context replacement by audio level |
US8184816B2 (en) * | 2008-03-18 | 2012-05-22 | Qualcomm Incorporated | Systems and methods for detecting wind noise using multiple audio sources |
US8812309B2 (en) * | 2008-03-18 | 2014-08-19 | Qualcomm Incorporated | Methods and apparatus for suppressing ambient noise using multiple audio signals |
US9113240B2 (en) * | 2008-03-18 | 2015-08-18 | Qualcomm Incorporated | Speech enhancement using multiple microphones on multiple devices |
US8606573B2 (en) * | 2008-03-28 | 2013-12-10 | Alon Konchitsky | Voice recognition improved accuracy in mobile environments |
EP2107553B1 (en) * | 2008-03-31 | 2011-05-18 | Harman Becker Automotive Systems GmbH | Method for determining barge-in |
WO2009130388A1 (en) * | 2008-04-25 | 2009-10-29 | Nokia Corporation | Calibrating multiple microphones |
US8244528B2 (en) | 2008-04-25 | 2012-08-14 | Nokia Corporation | Method and apparatus for voice activity determination |
US8275136B2 (en) * | 2008-04-25 | 2012-09-25 | Nokia Corporation | Electronic device speech enhancement |
JP4516157B2 (ja) * | 2008-09-16 | 2010-08-04 | パナソニック株式会社 | 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム |
US8724829B2 (en) * | 2008-10-24 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coherence detection |
US8229126B2 (en) * | 2009-03-13 | 2012-07-24 | Harris Corporation | Noise error amplitude reduction |
US9049503B2 (en) * | 2009-03-17 | 2015-06-02 | The Hong Kong Polytechnic University | Method and system for beamforming using a microphone array |
US8620672B2 (en) | 2009-06-09 | 2013-12-31 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal |
EP2491549A4 (en) * | 2009-10-19 | 2013-10-30 | Ericsson Telefon Ab L M | DETECTOR AND METHOD FOR DETECTING VOICE ACTIVITY |
US20110125497A1 (en) * | 2009-11-20 | 2011-05-26 | Takahiro Unno | Method and System for Voice Activity Detection |
EP2339574B1 (en) * | 2009-11-20 | 2013-03-13 | Nxp B.V. | Speech detector |
US8462193B1 (en) * | 2010-01-08 | 2013-06-11 | Polycom, Inc. | Method and system for processing audio signals |
US8718290B2 (en) | 2010-01-26 | 2014-05-06 | Audience, Inc. | Adaptive noise reduction using level cues |
US8626498B2 (en) * | 2010-02-24 | 2014-01-07 | Qualcomm Incorporated | Voice activity detection based on plural voice activity detectors |
TWI408673B (zh) * | 2010-03-17 | 2013-09-11 | Issc Technologies Corp | Voice detection method |
CN102201231B (zh) * | 2010-03-23 | 2012-10-24 | 创杰科技股份有限公司 | 语音侦测方法 |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
JP5575977B2 (ja) * | 2010-04-22 | 2014-08-20 | クゥアルコム・インコーポレイテッド | ボイスアクティビティ検出 |
US9378754B1 (en) * | 2010-04-28 | 2016-06-28 | Knowles Electronics, Llc | Adaptive spatial classifier for multi-microphone systems |
CN101867853B (zh) * | 2010-06-08 | 2014-11-05 | 中兴通讯股份有限公司 | 基于传声器阵列的语音信号处理方法及装置 |
US8898058B2 (en) | 2010-10-25 | 2014-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for voice activity detection |
US20120114130A1 (en) * | 2010-11-09 | 2012-05-10 | Microsoft Corporation | Cognitive load reduction |
EP2656341B1 (en) | 2010-12-24 | 2018-02-21 | Huawei Technologies Co., Ltd. | Apparatus for performing a voice activity detection |
ES2489472T3 (es) | 2010-12-24 | 2014-09-02 | Huawei Technologies Co., Ltd. | Método y aparato para una detección adaptativa de la actividad vocal en una señal de audio de entrada |
CN102740215A (zh) * | 2011-03-31 | 2012-10-17 | Jvc建伍株式会社 | 声音输入装置、通信装置、及声音输入装置的动作方法 |
CN102300140B (zh) | 2011-08-10 | 2013-12-18 | 歌尔声学股份有限公司 | 一种通信耳机的语音增强方法及降噪通信耳机 |
US9648421B2 (en) | 2011-12-14 | 2017-05-09 | Harris Corporation | Systems and methods for matching gain levels of transducers |
US9064497B2 (en) | 2012-02-22 | 2015-06-23 | Htc Corporation | Method and apparatus for audio intelligibility enhancement and computing apparatus |
US20130282372A1 (en) * | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
JP6028502B2 (ja) * | 2012-10-03 | 2016-11-16 | 沖電気工業株式会社 | 音声信号処理装置、方法及びプログラム |
JP6107151B2 (ja) * | 2013-01-15 | 2017-04-05 | 富士通株式会社 | 雑音抑圧装置、方法、及びプログラム |
US9107010B2 (en) * | 2013-02-08 | 2015-08-11 | Cirrus Logic, Inc. | Ambient noise root mean square (RMS) detector |
US9560444B2 (en) * | 2013-03-13 | 2017-01-31 | Cisco Technology, Inc. | Kinetic event detection in microphones |
US10306389B2 (en) | 2013-03-13 | 2019-05-28 | Kopin Corporation | Head wearable acoustic system with noise canceling microphone geometry apparatuses and methods |
US9312826B2 (en) | 2013-03-13 | 2016-04-12 | Kopin Corporation | Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction |
EP3000241B1 (en) * | 2013-05-23 | 2019-07-17 | Knowles Electronics, LLC | Vad detection microphone and method of operating the same |
US20140358552A1 (en) * | 2013-05-31 | 2014-12-04 | Cirrus Logic, Inc. | Low-power voice gate for device wake-up |
US9978387B1 (en) * | 2013-08-05 | 2018-05-22 | Amazon Technologies, Inc. | Reference signal generation for acoustic echo cancellation |
WO2015034504A1 (en) * | 2013-09-05 | 2015-03-12 | Intel Corporation | Mobile phone with variable energy consuming speech recognition module |
CN104751853B (zh) * | 2013-12-31 | 2019-01-04 | 辰芯科技有限公司 | 双麦克风噪声抑制方法及系统 |
CN107086043B (zh) * | 2014-03-12 | 2020-09-08 | 华为技术有限公司 | 检测音频信号的方法和装置 |
US9530433B2 (en) * | 2014-03-17 | 2016-12-27 | Sharp Laboratories Of America, Inc. | Voice activity detection for noise-canceling bioacoustic sensor |
US9516409B1 (en) | 2014-05-19 | 2016-12-06 | Apple Inc. | Echo cancellation and control for microphone beam patterns |
CN104092802A (zh) * | 2014-05-27 | 2014-10-08 | 中兴通讯股份有限公司 | 音频信号的消噪方法及系统 |
US9288575B2 (en) * | 2014-05-28 | 2016-03-15 | GM Global Technology Operations LLC | Sound augmentation system transfer function calibration |
CN105321528B (zh) * | 2014-06-27 | 2019-11-05 | 中兴通讯股份有限公司 | 一种麦克风阵列语音检测方法及装置 |
CN104134440B (zh) * | 2014-07-31 | 2018-05-08 | 百度在线网络技术(北京)有限公司 | 用于便携式终端的语音检测方法和语音检测装置 |
US9953661B2 (en) * | 2014-09-26 | 2018-04-24 | Cirrus Logic Inc. | Neural network voice activity detection employing running range normalization |
US9516159B2 (en) * | 2014-11-04 | 2016-12-06 | Apple Inc. | System and method of double talk detection with acoustic echo and noise control |
TWI616868B (zh) * | 2014-12-30 | 2018-03-01 | 鴻海精密工業股份有限公司 | 會議記錄裝置及其自動生成會議記錄的方法 |
US9685156B2 (en) * | 2015-03-12 | 2017-06-20 | Sony Mobile Communications Inc. | Low-power voice command detector |
US9330684B1 (en) * | 2015-03-27 | 2016-05-03 | Continental Automotive Systems, Inc. | Real-time wind buffet noise detection |
US10242689B2 (en) * | 2015-09-17 | 2019-03-26 | Intel IP Corporation | Position-robust multiple microphone noise estimation techniques |
US11631421B2 (en) * | 2015-10-18 | 2023-04-18 | Solos Technology Limited | Apparatuses and methods for enhanced speech recognition in variable environments |
CN105280195B (zh) * | 2015-11-04 | 2018-12-28 | 腾讯科技(深圳)有限公司 | 语音信号的处理方法及装置 |
US20170140233A1 (en) * | 2015-11-13 | 2017-05-18 | Fingerprint Cards Ab | Method and system for calibration of a fingerprint sensing device |
US10325134B2 (en) | 2015-11-13 | 2019-06-18 | Fingerprint Cards Ab | Method and system for calibration of an optical fingerprint sensing device |
CN105609118B (zh) * | 2015-12-30 | 2020-02-07 | 生迪智慧科技有限公司 | 语音检测方法及装置 |
CN106971741B (zh) * | 2016-01-14 | 2020-12-01 | 芋头科技(杭州)有限公司 | 实时将语音进行分离的语音降噪的方法及系统 |
CN106997768B (zh) | 2016-01-25 | 2019-12-10 | 电信科学技术研究院 | 一种语音出现概率的计算方法、装置及电子设备 |
KR102468148B1 (ko) | 2016-02-19 | 2022-11-21 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 음성 및 잡음 분류 방법 |
US10249325B2 (en) | 2016-03-31 | 2019-04-02 | OmniSpeech LLC | Pitch detection algorithm based on PWVT of Teager Energy Operator |
US10074380B2 (en) * | 2016-08-03 | 2018-09-11 | Apple Inc. | System and method for performing speech enhancement using a deep neural network-based signal |
JP6567478B2 (ja) * | 2016-08-25 | 2019-08-28 | 日本電信電話株式会社 | 音源強調学習装置、音源強調装置、音源強調学習方法、プログラム、信号処理学習装置 |
US10237647B1 (en) * | 2017-03-01 | 2019-03-19 | Amazon Technologies, Inc. | Adaptive step-size control for beamformer |
EP3392882A1 (en) * | 2017-04-20 | 2018-10-24 | Thomson Licensing | Method for processing an input audio signal and corresponding electronic device, non-transitory computer readable program product and computer readable storage medium |
JP2018191145A (ja) * | 2017-05-08 | 2018-11-29 | オリンパス株式会社 | 収音装置、収音方法、収音プログラム及びディクテーション方法 |
US10395667B2 (en) * | 2017-05-12 | 2019-08-27 | Cirrus Logic, Inc. | Correlation-based near-field detector |
US20210200692A1 (en) | 2017-06-20 | 2021-07-01 | Hewlett-Packard Development Company, L.P. | Signal combiner |
US11316865B2 (en) | 2017-08-10 | 2022-04-26 | Nuance Communications, Inc. | Ambient cooperative intelligence system and method |
US11404148B2 (en) | 2017-08-10 | 2022-08-02 | Nuance Communications, Inc. | Automated clinical documentation system and method |
US9973849B1 (en) * | 2017-09-20 | 2018-05-15 | Amazon Technologies, Inc. | Signal quality beam selection |
US10839822B2 (en) * | 2017-11-06 | 2020-11-17 | Microsoft Technology Licensing, Llc | Multi-channel speech separation |
CN111344778B (zh) * | 2017-11-23 | 2024-05-28 | 哈曼国际工业有限公司 | 用于语音增强的方法和系统 |
CN109994122B (zh) * | 2017-12-29 | 2023-10-31 | 阿里巴巴集团控股有限公司 | 语音数据的处理方法、装置、设备、介质和系统 |
KR102475989B1 (ko) | 2018-02-12 | 2022-12-12 | 삼성전자주식회사 | 오디오 신호의 주파수의 변화에 따른 위상 변화율에 기반하여 노이즈가 감쇠된 오디오 신호를 생성하는 장치 및 방법 |
US20190272895A1 (en) | 2018-03-05 | 2019-09-05 | Nuance Communications, Inc. | System and method for review of automated clinical documentation |
WO2019173333A1 (en) | 2018-03-05 | 2019-09-12 | Nuance Communications, Inc. | Automated clinical documentation system and method |
US11250383B2 (en) | 2018-03-05 | 2022-02-15 | Nuance Communications, Inc. | Automated clinical documentation system and method |
SG11202009556XA (en) * | 2018-03-28 | 2020-10-29 | Telepathy Labs Inc | Text-to-speech synthesis system and method |
EP3776552A1 (en) * | 2018-03-29 | 2021-02-17 | 3M Innovative Properties Company | Voice-activated sound encoding for headsets using frequency domain representations of microphone signals |
US10957337B2 (en) | 2018-04-11 | 2021-03-23 | Microsoft Technology Licensing, Llc | Multi-microphone speech separation |
US11341987B2 (en) * | 2018-04-19 | 2022-05-24 | Semiconductor Components Industries, Llc | Computationally efficient speech classifier and related methods |
US10847178B2 (en) * | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
CN108632711B (zh) * | 2018-06-11 | 2020-09-04 | 广州大学 | 扩声系统增益自适应控制方法 |
JP6942282B2 (ja) * | 2018-07-12 | 2021-09-29 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 補助信号を用いたオーディオデバイスの送信制御 |
EP3667662B1 (en) * | 2018-12-12 | 2022-08-10 | Panasonic Intellectual Property Corporation of America | Acoustic echo cancellation device, acoustic echo cancellation method and acoustic echo cancellation program |
CN111294473B (zh) * | 2019-01-28 | 2022-01-04 | 展讯通信(上海)有限公司 | 信号处理方法及装置 |
JP7404664B2 (ja) * | 2019-06-07 | 2023-12-26 | ヤマハ株式会社 | 音声処理装置及び音声処理方法 |
US11216480B2 (en) | 2019-06-14 | 2022-01-04 | Nuance Communications, Inc. | System and method for querying data points from graph data structures |
US11227679B2 (en) | 2019-06-14 | 2022-01-18 | Nuance Communications, Inc. | Ambient clinical intelligence system and method |
US11043207B2 (en) | 2019-06-14 | 2021-06-22 | Nuance Communications, Inc. | System and method for array data simulation and customized acoustic modeling for ambient ASR |
CN112153505A (zh) * | 2019-06-28 | 2020-12-29 | 中强光电股份有限公司 | 降噪系统及降噪方法 |
US11531807B2 (en) | 2019-06-28 | 2022-12-20 | Nuance Communications, Inc. | System and method for customized text macros |
US11670408B2 (en) | 2019-09-30 | 2023-06-06 | Nuance Communications, Inc. | System and method for review of automated clinical documentation |
CN111049848B (zh) * | 2019-12-23 | 2021-11-23 | 腾讯科技(深圳)有限公司 | 通话方法、装置、系统、服务器及存储介质 |
WO2021226515A1 (en) | 2020-05-08 | 2021-11-11 | Nuance Communications, Inc. | System and method for data augmentation for multi-microphone signal processing |
CN115699173A (zh) * | 2020-06-16 | 2023-02-03 | 华为技术有限公司 | 语音活动检测方法和装置 |
US11222103B1 (en) | 2020-10-29 | 2022-01-11 | Nuance Communications, Inc. | Ambient cooperative intelligence system and method |
EP4075822B1 (en) * | 2021-04-15 | 2023-06-07 | Rtx A/S | Microphone mute notification with voice activity detection |
WO2023085749A1 (ko) * | 2021-11-09 | 2023-05-19 | 삼성전자주식회사 | 빔포밍을 제어하는 전자 장치 및 이의 동작 방법 |
CN115831145B (zh) * | 2023-02-16 | 2023-06-27 | 之江实验室 | 一种双麦克风语音增强方法和系统 |
Family Cites Families (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2047664T3 (es) | 1988-03-11 | 1994-03-01 | British Telecomm | Deteccion de actividad de voz. |
US5276779A (en) * | 1991-04-01 | 1994-01-04 | Eastman Kodak Company | Method for the reproduction of color images based on viewer adaption |
IL101556A (en) * | 1992-04-10 | 1996-08-04 | Univ Ramot | Multi-channel signal separation using cross-polyspectra |
TW219993B (en) | 1992-05-21 | 1994-02-01 | Ind Tech Res Inst | Speech recognition system |
US5459814A (en) * | 1993-03-26 | 1995-10-17 | Hughes Aircraft Company | Voice activity detector for speech signals in variable background noise |
US5825671A (en) * | 1994-03-16 | 1998-10-20 | U.S. Philips Corporation | Signal-source characterization system |
JP2758846B2 (ja) | 1995-02-27 | 1998-05-28 | 埼玉日本電気株式会社 | ノイズキャンセラ装置 |
US5694474A (en) | 1995-09-18 | 1997-12-02 | Interval Research Corporation | Adaptive filter for signal processing and method therefor |
FI100840B (fi) | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
US5774849A (en) | 1996-01-22 | 1998-06-30 | Rockwell International Corporation | Method and apparatus for generating frame voicing decisions of an incoming speech signal |
TW357260B (en) | 1997-11-13 | 1999-05-01 | Ind Tech Res Inst | Interactive music play method and apparatus |
JP3505085B2 (ja) | 1998-04-14 | 2004-03-08 | アルパイン株式会社 | オーディオ装置 |
US6526148B1 (en) * | 1999-05-18 | 2003-02-25 | Siemens Corporate Research, Inc. | Device and method for demixing signal mixtures using fast blind source separation technique based on delay and attenuation compensation, and for selecting channels for the demixed signals |
US6694020B1 (en) * | 1999-09-14 | 2004-02-17 | Agere Systems, Inc. | Frequency domain stereophonic acoustic echo canceller utilizing non-linear transformations |
US6424960B1 (en) * | 1999-10-14 | 2002-07-23 | The Salk Institute For Biological Studies | Unsupervised adaptation and classification of multiple classes and sources in blind signal separation |
EP1254513A4 (en) * | 1999-11-29 | 2009-11-04 | Syfx | SYSTEMS AND METHODS FOR SIGNAL PROCESSING |
US6606382B2 (en) | 2000-01-27 | 2003-08-12 | Qualcomm Incorporated | System and method for implementation of an echo canceller |
AU2000251208A1 (en) | 2000-06-05 | 2001-12-17 | Nanyang Technological University | Adaptive directional noise cancelling microphone system |
US20030179888A1 (en) * | 2002-03-05 | 2003-09-25 | Burnett Gregory C. | Voice activity detection (VAD) devices and methods for use with noise suppression systems |
US20070233479A1 (en) * | 2002-05-30 | 2007-10-04 | Burnett Gregory C | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors |
KR100394840B1 (ko) * | 2000-11-30 | 2003-08-19 | 한국과학기술원 | 독립 성분 분석을 이용한 능동 잡음 제거방법 |
US7941313B2 (en) | 2001-05-17 | 2011-05-10 | Qualcomm Incorporated | System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system |
JP3364487B2 (ja) | 2001-06-25 | 2003-01-08 | 隆義 山本 | 複合音声データの音声分離方法、発言者特定方法、複合音声データの音声分離装置、発言者特定装置、コンピュータプログラム、及び、記録媒体 |
JP2003241787A (ja) | 2002-02-14 | 2003-08-29 | Sony Corp | 音声認識装置および方法、並びにプログラム |
GB0204548D0 (en) * | 2002-02-27 | 2002-04-10 | Qinetiq Ltd | Blind signal separation |
US6904146B2 (en) * | 2002-05-03 | 2005-06-07 | Acoustic Technology, Inc. | Full duplex echo cancelling circuit |
JP3682032B2 (ja) * | 2002-05-13 | 2005-08-10 | 株式会社ダイマジック | オーディオ装置並びにその再生用プログラム |
US7082204B2 (en) | 2002-07-15 | 2006-07-25 | Sony Ericsson Mobile Communications Ab | Electronic devices, methods of operating the same, and computer program products for detecting noise in a signal based on a combination of spatial correlation and time correlation |
US7359504B1 (en) * | 2002-12-03 | 2008-04-15 | Plantronics, Inc. | Method and apparatus for reducing echo and noise |
KR20050115857A (ko) | 2002-12-11 | 2005-12-08 | 소프트맥스 인코퍼레이티드 | 안정성 강제하에서 독립 성분 분석을 사용하여 음향을처리하는 시스템 및 방법 |
JP2004274683A (ja) | 2003-03-12 | 2004-09-30 | Matsushita Electric Ind Co Ltd | エコーキャンセル装置、エコーキャンセル方法、プログラムおよび記録媒体 |
EP2068308B1 (en) | 2003-09-02 | 2010-06-16 | Nippon Telegraph and Telephone Corporation | Signal separation method, signal separation device, and signal separation program |
US7099821B2 (en) * | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
GB0321722D0 (en) * | 2003-09-16 | 2003-10-15 | Mitel Networks Corp | A method for optimal microphone array design under uniform acoustic coupling constraints |
US20050071158A1 (en) * | 2003-09-25 | 2005-03-31 | Vocollect, Inc. | Apparatus and method for detecting user speech |
SG119199A1 (en) * | 2003-09-30 | 2006-02-28 | Stmicroelectronics Asia Pacfic | Voice activity detector |
JP2005227511A (ja) | 2004-02-12 | 2005-08-25 | Yamaha Motor Co Ltd | 対象音検出方法、音信号処理装置、音声認識装置及びプログラム |
JP2005227512A (ja) | 2004-02-12 | 2005-08-25 | Yamaha Motor Co Ltd | 音信号処理方法及びその装置、音声認識装置並びにプログラム |
US8687820B2 (en) | 2004-06-30 | 2014-04-01 | Polycom, Inc. | Stereo microphone processing for teleconferencing |
DE102004049347A1 (de) * | 2004-10-08 | 2006-04-20 | Micronas Gmbh | Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale |
US7925504B2 (en) * | 2005-01-20 | 2011-04-12 | Nec Corporation | System, method, device, and program for removing one or more signals incoming from one or more directions |
WO2006131959A1 (ja) | 2005-06-06 | 2006-12-14 | Saga University | 信号分離装置 |
US7464029B2 (en) * | 2005-07-22 | 2008-12-09 | Qualcomm Incorporated | Robust separation of speech signals in a noisy environment |
JP4556875B2 (ja) | 2006-01-18 | 2010-10-06 | ソニー株式会社 | 音声信号分離装置及び方法 |
US7970564B2 (en) | 2006-05-02 | 2011-06-28 | Qualcomm Incorporated | Enhancement techniques for blind source separation (BSS) |
US8068619B2 (en) * | 2006-05-09 | 2011-11-29 | Fortemedia, Inc. | Method and apparatus for noise suppression in a small array microphone system |
US7817808B2 (en) * | 2007-07-19 | 2010-10-19 | Alon Konchitsky | Dual adaptive structure for speech enhancement |
US8175871B2 (en) * | 2007-09-28 | 2012-05-08 | Qualcomm Incorporated | Apparatus and method of noise and echo reduction in multiple microphone audio systems |
US8046219B2 (en) * | 2007-10-18 | 2011-10-25 | Motorola Mobility, Inc. | Robust two microphone noise suppression system |
US8223988B2 (en) * | 2008-01-29 | 2012-07-17 | Qualcomm Incorporated | Enhanced blind source separation algorithm for highly correlated mixtures |
-
2007
- 2007-09-28 US US11/864,897 patent/US8954324B2/en active Active
-
2008
- 2008-09-25 TW TW097136965A patent/TWI398855B/zh not_active IP Right Cessation
- 2008-09-26 ES ES08833863T patent/ES2373511T3/es active Active
- 2008-09-26 CA CA2695231A patent/CA2695231C/en not_active Expired - Fee Related
- 2008-09-26 AT AT08833863T patent/ATE531030T1/de not_active IP Right Cessation
- 2008-09-26 RU RU2010116727/08A patent/RU2450368C2/ru not_active IP Right Cessation
- 2008-09-26 KR KR1020107009383A patent/KR101265111B1/ko not_active IP Right Cessation
- 2008-09-26 WO PCT/US2008/077994 patent/WO2009042948A1/en active Application Filing
- 2008-09-26 CN CN200880104664.5A patent/CN101790752B/zh active Active
- 2008-09-26 EP EP08833863A patent/EP2201563B1/en active Active
- 2008-09-26 JP JP2010527214A patent/JP5102365B2/ja active Active
- 2008-09-26 BR BRPI0817731A patent/BRPI0817731A8/pt not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
CN101790752B (zh) | 2013-09-04 |
TW200926151A (en) | 2009-06-16 |
KR20100075976A (ko) | 2010-07-05 |
JP5102365B2 (ja) | 2012-12-19 |
ES2373511T3 (es) | 2012-02-06 |
KR101265111B1 (ko) | 2013-05-16 |
EP2201563A1 (en) | 2010-06-30 |
ATE531030T1 (de) | 2011-11-15 |
TWI398855B (zh) | 2013-06-11 |
JP2010541010A (ja) | 2010-12-24 |
WO2009042948A1 (en) | 2009-04-02 |
RU2450368C2 (ru) | 2012-05-10 |
CA2695231C (en) | 2015-02-17 |
BRPI0817731A8 (pt) | 2019-01-08 |
EP2201563B1 (en) | 2011-10-26 |
US8954324B2 (en) | 2015-02-10 |
CN101790752A (zh) | 2010-07-28 |
US20090089053A1 (en) | 2009-04-02 |
CA2695231A1 (en) | 2009-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2010116727A (ru) | Средство обнаружения голосовой активности с использованием нескольких микрофонов | |
US8065115B2 (en) | Method and system for identifying audible noise as wind noise in a hearing aid apparatus | |
RU2010136338A (ru) | Оповещение пользователя о прикрытии микрофона | |
US9959886B2 (en) | Spectral comb voice activity detection | |
DK1491068T3 (da) | Fremgangsmåde til dynamisk bestemmelse af tidskonstanter, fremgangsmåde til niveaudetektering, fremgangsmåde til komprimering af et elektrisk lydsignal og höreapparat, hvori fremgangsmåden til komprimering anvendes | |
DE60133533D1 (de) | Verfahren und vorrichtung zur erfassung eines physiologischen parameters | |
NO331226B1 (no) | Fremgangsmate og innretning for a angi aktivering av en rokdetektoralarm. | |
TW200629754A (en) | Method and apparatus for guard interval detection in multi-carrier receiver | |
RU2001105990A (ru) | Способ регулирования громкости звуковоспроизведения и устройства для его реализации | |
CN107170465A (zh) | 一种音频质量检测方法及音频质量检测系统 | |
RU2008133571A (ru) | Обнаружение присутствия телевизионных сигналов, погруженных в шум, с использованием набора инструментальных средств циклостационарности | |
ATE447802T1 (de) | Detektionsverfahren für ack/nack-signale und detektor dafür | |
WO2010092914A1 (ja) | 多チャンネル音響信号処理方法、そのシステム及びプログラム | |
EP2997741A1 (en) | Automated gain matching for multiple microphones | |
ATE446561T1 (de) | Sensoranordnung | |
KR20090127182A (ko) | 잡음 환경들에 대한 음성 활동도 검출기 및 검증기 | |
CA2485728A1 (en) | Detecting acoustic echoes using microphone arrays | |
Guski et al. | Impulsive noise detection in sweep measurements | |
Vesa et al. | Automatic estimation of reverberation time from binaural signals | |
TWI258936B (en) | Signal detection method with high detective rate and low false alarm rate | |
RU2278424C1 (ru) | Устройство измерения максимальной разборчивости речи | |
GB2609303A8 (en) | Single-microphone wind detection for audio device | |
US20230087854A1 (en) | Selection criteria for passive sound sensing in a lighting iot network | |
KR101073632B1 (ko) | 반향 환경에서의 영교차 기반 다음원 국지화 방법 및 장치 | |
Shabtai et al. | Estimating the room volume from room impulse response via hypothesis verification approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20180927 |