RU2010116727A - Средство обнаружения голосовой активности с использованием нескольких микрофонов - Google Patents

Средство обнаружения голосовой активности с использованием нескольких микрофонов Download PDF

Info

Publication number
RU2010116727A
RU2010116727A RU2010116727/08A RU2010116727A RU2010116727A RU 2010116727 A RU2010116727 A RU 2010116727A RU 2010116727/08 A RU2010116727/08 A RU 2010116727/08A RU 2010116727 A RU2010116727 A RU 2010116727A RU 2010116727 A RU2010116727 A RU 2010116727A
Authority
RU
Russia
Prior art keywords
speech
determining
characteristic value
voice activity
signal
Prior art date
Application number
RU2010116727/08A
Other languages
English (en)
Other versions
RU2450368C2 (ru
Inventor
Сун ВАН (US)
Сун ВАН
Самир Кумар ГУПТА (US)
Самир Кумар ГУПТА
Эдди Л.Т. ЧОЙ (US)
Эдди Л.Т. ЧОЙ
Original Assignee
Квэлкомм Инкорпорейтед (US)
Квэлкомм Инкорпорейтед
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Квэлкомм Инкорпорейтед (US), Квэлкомм Инкорпорейтед filed Critical Квэлкомм Инкорпорейтед (US)
Publication of RU2010116727A publication Critical patent/RU2010116727A/ru
Application granted granted Critical
Publication of RU2450368C2 publication Critical patent/RU2450368C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Push-Button Switches (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)

Abstract

1. Способ обнаружения голосовой активности, содержащий этапы, на которых: ! принимают речевой сигнал от микрофона для восприятия речи; !принимают шумовой сигнал от микрофона для восприятия шумов, отличного от микрофона для восприятия речи; ! определяют характеристическое значение речи на основе, по меньшей мере, частично, речевого сигнала; ! определяют объединенное характеристическое значение на основе, по меньшей мере, частично, речевого сигнала и шумового сигнала; ! определяют метрику голосовой активности на основе, по меньшей мере, частично, речевого характеристического значения и объединенного характеристического значения, причем этап определения характеристического значения речи содержит этап, на котором определяют абсолютное значение автокорреляции речевого сигнала; и ! определяют состояние голосовой активности на основе метрики голосовой активности. ! 2. Способ по п.1, дополнительно содержащий этап, на котором формируют диаграмму направленности, по меньшей мере, либо речевого сигнала, либо голосового сигнала. ! 3. Способ по п.1, дополнительно содержащий этап, на котором выполняют слепое разделение источников (BSS) применительно к речевому сигналу и шумовому сигналу для выделения речевого компонента сигнала в речевом сигнале. ! 4. Способ по п.1, дополнительно содержащий этап, на котором выполняют спектральное вычитание применительно, по меньшей мере, к речевому или шумовому сигналу. ! 5. Способ по п.1, дополнительно содержащий этап, на котором определяют характеристическое значение шумов на основе, по меньшей мере, частично, шумового сигнала, и причем метрика голосовой активности основывается, по меньшей

Claims (25)

1. Способ обнаружения голосовой активности, содержащий этапы, на которых:
принимают речевой сигнал от микрофона для восприятия речи;
принимают шумовой сигнал от микрофона для восприятия шумов, отличного от микрофона для восприятия речи;
определяют характеристическое значение речи на основе, по меньшей мере, частично, речевого сигнала;
определяют объединенное характеристическое значение на основе, по меньшей мере, частично, речевого сигнала и шумового сигнала;
определяют метрику голосовой активности на основе, по меньшей мере, частично, речевого характеристического значения и объединенного характеристического значения, причем этап определения характеристического значения речи содержит этап, на котором определяют абсолютное значение автокорреляции речевого сигнала; и
определяют состояние голосовой активности на основе метрики голосовой активности.
2. Способ по п.1, дополнительно содержащий этап, на котором формируют диаграмму направленности, по меньшей мере, либо речевого сигнала, либо голосового сигнала.
3. Способ по п.1, дополнительно содержащий этап, на котором выполняют слепое разделение источников (BSS) применительно к речевому сигналу и шумовому сигналу для выделения речевого компонента сигнала в речевом сигнале.
4. Способ по п.1, дополнительно содержащий этап, на котором выполняют спектральное вычитание применительно, по меньшей мере, к речевому или шумовому сигналу.
5. Способ по п.1, дополнительно содержащий этап, на котором определяют характеристическое значение шумов на основе, по меньшей мере, частично, шумового сигнала, и причем метрика голосовой активности основывается, по меньшей мере, частично, на характеристическом значении шумов.
6. Способ по п.1, в котором речевой сигнал включает в себя наличие или отсутствие речевой активности.
7. Способ по п.6, в котором автокорреляция содержит взвешенную сумму предшествующей автокорреляции с речевой энергией в конкретном интервале времени.
8. Способ по п.1, в котором этап определения речевого характеристического значения содержит этап, на котором определяют энергию речевого сигнала.
9. Способ по п.1, в котором этап определения объединенного характеристического значения содержит этап, на котором определяют взаимную корреляцию на основе речевого сигнала и шумового сигнала.
10. Способ по п.1, в котором этап определения состояния голосовой активности содержит этап, на котором сравнивают метрику голосовой активности с пороговым значением.
11. Способ по п.1, в котором:
микрофон для восприятия речи содержит, по меньшей мере, один речевой микрофон;
микрофон для восприятия шумов содержит, по меньшей мере, один шумовой микрофон, отличный, по меньшей мере, от одного речевого микрофона;
этап определения речевого характеристического значения содержит этап, на котором определяют автокорреляцию на основе речевого сигнала;
этап определения объединенного характеристического значения содержит этап, на котором определяют взаимную корреляцию на основе речевого сигнала и шумового сигнала;
этап определения метрики голосовой активности основывается, частично, на определении отношения абсолютного значения автокорреляции речевого сигнала к взаимной корреляции; и
этап определения состояния голосовой активности содержит этап, на котором сравнивают метрику голосовой активности, по меньшей мере, с одним пороговым значением.
12. Способ по п.11, дополнительно содержащий этап, на котором выполняют выделение, по меньшей мере, или речевого, или шумового сигнала, и где метрика голосовой активности основывается, по меньшей мере, частично, либо на выделенном речевом сигнале, либо на выделенном шумовом сигнале.
13. Способ по п.11, дополнительно содержащий этап, на котором изменяют рабочий параметр на основе состояния голосовой активности.
14. Способ по п.13, в котором рабочий параметр содержит усиление, применяемое к речевому сигналу.
15. Способ по п.13, в котором рабочий параметр содержит состояние средства кодирования речи, оперирующего с речевым сигналом.
16. Устройство, сконфигурированное для обнаружения голосовой активности, содержащее:
микрофон для восприятия речи, сконфигурированный для вывода речевого сигнала;
микрофон для восприятия шумов, сконфигурированный для вывода шумового сигнала;
генератор речевых характеристических значений, соединенный с микрофоном для восприятия речи, а также сконфигурированный для определения речевого характеристического значения, причем этап определения речевого характеристического значения содержит этап, на котором определяют абсолютное значение автокорреляции речевого сигнала;
генератор объединенных характеристических значений, соединенный с микрофоном для восприятия речи и микрофоном для восприятия шумов, а также сконфигурированный для определения объединенного характеристического значения;
модуль метрики голосовой активности, сконфигурированный для определения метрики голосовой активности на основе, по меньшей мере, частично, характеристического значения речи и объединенного характеристического значения; и
средство сравнения, сконфигурированное для сравнения метрики голосовой активности с пороговым значением, а также для вывода состояния голосовой активности.
17. Устройство по п.16, в котором микрофон для восприятия речи включает в себя несколько микрофонов.
18. Устройство по п.16, в котором генератор характеристических значений речи сконфигурирован для определения средневзвешенного значения на основе экспоненциального затухания предшествующих речевых характеристических значений.
19. Устройство по п.16, в котором генератор объединенных характеристических значений сконфигурирован для определения взаимной корреляции на основе речевого сигнала и шумового сигнала.
20. Устройство по п.16, в котором модуль метрики голосовой активности сконфигурирован для определения отношения речевого характеристического значения к шумовому характеристическому значению.
21. Устройство, сконфигурированное с возможностью обнаружения голосовой активности, содержащее:
средство для приема речевого сигнала;
средство для приема шумового сигнала;
средство для определения автокорреляции на основе речевого сигнала;
средство для определения взаимной корреляции на основе речевого сигнала и шумового сигнала;
средство для определения метрики голосовой активности на основе, частично, отношения абсолютного значения автокорреляции речевого сигнала к взаимной корреляции; и
средство для определения состояния голосовой активности посредством сравнения метрики голосовой активности, по меньшей мере, с одним пороговым значением.
22. Устройство по п.21, дополнительно содержащее средство для калибровки спектральной чувствительности пути прохождения речевого сигнала так, чтобы она была, по существу, аналогичной спектральной чувствительности пути прохождения шумового сигнала.
23. Машиночитаемый носитель информации, включающий в себя команды, которые могут быть использованы одним или несколькими процессорами, содержащий:
команды для определения речевого характеристического значения на основе, по меньшей мере, частично, речевого сигнала, по меньшей мере, от одного микрофона для восприятия речи, причем этап определения речевого характеристического значения содержит этап, на котором определяют абсолютное значение автокорреляции речевого сигнала;
команды для определения объединенного характеристического значения на основе, по меньшей мере, частично, речевого сигнала и шумового сигнала, по меньшей мере, от одного микрофона для восприятия шумов;
команды для определения метрики голосовой активности на основе, по меньшей мере, частично, голосового характеристического значения и объединенного характеристического значения; и
команды для определения состояния голосовой активности на основе метрики голосовой активности.
24. Схема, сконфигурированная с возможностью обнаружения голосовой активности, содержащая:
первый блок, выполненный с возможностью приема выходного речевого сигнала от микрофона для восприятия речи;
второй блок, выполненный с возможностью приема выходного сигнала от микрофона для восприятия шумов;
третий блок, содержащий генератор речевых характеристических значений, соединенный с первым блоком, сконфигурированный для определения речевого характеристического значения, причем этап определения речевого характеристического значения содержит этап, на котором определяют абсолютное значение автокорреляции речевого сигнала;
четвертый блок, содержащий генератор объединенных характеристических значений, соединенный с первым блоком и вторым блоком, сконфигурированный для определения объединенного характеристического значения;
пятый блок, содержащий модуль метрики голосовой активности, сконфигурированный для определения метрики голосовой активности на основе, по меньшей мере, частично, речевого характеристического значения и объединенного характеристического значения; и
средство сравнения, сконфигурированное для сравнения метрики голосовой активности с пороговым значением, а также для вывода состояния голосовой активности.
25. Схема по п.24, в которой любые два блока группы, состоящей из первого блока, второго блока, третьего блока, четвертого блока и пятого блока, содержат подобную схему.
RU2010116727/08A 2007-09-28 2008-09-26 Средство обнаружения голосовой активности с использованием нескольких микрофонов RU2450368C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/864,897 US8954324B2 (en) 2007-09-28 2007-09-28 Multiple microphone voice activity detector
US11/864,897 2007-09-28

Publications (2)

Publication Number Publication Date
RU2010116727A true RU2010116727A (ru) 2011-11-10
RU2450368C2 RU2450368C2 (ru) 2012-05-10

Family

ID=40002930

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2010116727/08A RU2450368C2 (ru) 2007-09-28 2008-09-26 Средство обнаружения голосовой активности с использованием нескольких микрофонов

Country Status (12)

Country Link
US (1) US8954324B2 (ru)
EP (1) EP2201563B1 (ru)
JP (1) JP5102365B2 (ru)
KR (1) KR101265111B1 (ru)
CN (1) CN101790752B (ru)
AT (1) ATE531030T1 (ru)
BR (1) BRPI0817731A8 (ru)
CA (1) CA2695231C (ru)
ES (1) ES2373511T3 (ru)
RU (1) RU2450368C2 (ru)
TW (1) TWI398855B (ru)
WO (1) WO2009042948A1 (ru)

Families Citing this family (119)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8280072B2 (en) 2003-03-27 2012-10-02 Aliphcom, Inc. Microphone array with rear venting
US8019091B2 (en) 2000-07-19 2011-09-13 Aliphcom, Inc. Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression
US8326611B2 (en) * 2007-05-25 2012-12-04 Aliphcom, Inc. Acoustic voice activity detection (AVAD) for electronic systems
US9066186B2 (en) 2003-01-30 2015-06-23 Aliphcom Light-based detection for acoustic applications
US9099094B2 (en) 2003-03-27 2015-08-04 Aliphcom Microphone array with rear venting
US8477961B2 (en) * 2003-03-27 2013-07-02 Aliphcom, Inc. Microphone array with rear venting
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8321213B2 (en) * 2007-05-25 2012-11-27 Aliphcom, Inc. Acoustic voice activity detection (AVAD) for electronic systems
US8503686B2 (en) 2007-05-25 2013-08-06 Aliphcom Vibration sensor and acoustic voice activity detection system (VADS) for use with electronic systems
US8046219B2 (en) * 2007-10-18 2011-10-25 Motorola Mobility, Inc. Robust two microphone noise suppression system
DE602008002695D1 (de) * 2008-01-17 2010-11-04 Harman Becker Automotive Sys Postfilter für einen Strahlformer in der Sprachverarbeitung
US8554551B2 (en) * 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level
US8184816B2 (en) * 2008-03-18 2012-05-22 Qualcomm Incorporated Systems and methods for detecting wind noise using multiple audio sources
US8812309B2 (en) * 2008-03-18 2014-08-19 Qualcomm Incorporated Methods and apparatus for suppressing ambient noise using multiple audio signals
US9113240B2 (en) * 2008-03-18 2015-08-18 Qualcomm Incorporated Speech enhancement using multiple microphones on multiple devices
US8606573B2 (en) * 2008-03-28 2013-12-10 Alon Konchitsky Voice recognition improved accuracy in mobile environments
EP2107553B1 (en) * 2008-03-31 2011-05-18 Harman Becker Automotive Systems GmbH Method for determining barge-in
WO2009130388A1 (en) * 2008-04-25 2009-10-29 Nokia Corporation Calibrating multiple microphones
US8244528B2 (en) 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
US8275136B2 (en) * 2008-04-25 2012-09-25 Nokia Corporation Electronic device speech enhancement
JP4516157B2 (ja) * 2008-09-16 2010-08-04 パナソニック株式会社 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム
US8724829B2 (en) * 2008-10-24 2014-05-13 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coherence detection
US8229126B2 (en) * 2009-03-13 2012-07-24 Harris Corporation Noise error amplitude reduction
US9049503B2 (en) * 2009-03-17 2015-06-02 The Hong Kong Polytechnic University Method and system for beamforming using a microphone array
US8620672B2 (en) 2009-06-09 2013-12-31 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal
EP2491549A4 (en) * 2009-10-19 2013-10-30 Ericsson Telefon Ab L M DETECTOR AND METHOD FOR DETECTING VOICE ACTIVITY
US20110125497A1 (en) * 2009-11-20 2011-05-26 Takahiro Unno Method and System for Voice Activity Detection
EP2339574B1 (en) * 2009-11-20 2013-03-13 Nxp B.V. Speech detector
US8462193B1 (en) * 2010-01-08 2013-06-11 Polycom, Inc. Method and system for processing audio signals
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8626498B2 (en) * 2010-02-24 2014-01-07 Qualcomm Incorporated Voice activity detection based on plural voice activity detectors
TWI408673B (zh) * 2010-03-17 2013-09-11 Issc Technologies Corp Voice detection method
CN102201231B (zh) * 2010-03-23 2012-10-24 创杰科技股份有限公司 语音侦测方法
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
JP5575977B2 (ja) * 2010-04-22 2014-08-20 クゥアルコム・インコーポレイテッド ボイスアクティビティ検出
US9378754B1 (en) * 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
CN101867853B (zh) * 2010-06-08 2014-11-05 中兴通讯股份有限公司 基于传声器阵列的语音信号处理方法及装置
US8898058B2 (en) 2010-10-25 2014-11-25 Qualcomm Incorporated Systems, methods, and apparatus for voice activity detection
US20120114130A1 (en) * 2010-11-09 2012-05-10 Microsoft Corporation Cognitive load reduction
EP2656341B1 (en) 2010-12-24 2018-02-21 Huawei Technologies Co., Ltd. Apparatus for performing a voice activity detection
ES2489472T3 (es) 2010-12-24 2014-09-02 Huawei Technologies Co., Ltd. Método y aparato para una detección adaptativa de la actividad vocal en una señal de audio de entrada
CN102740215A (zh) * 2011-03-31 2012-10-17 Jvc建伍株式会社 声音输入装置、通信装置、及声音输入装置的动作方法
CN102300140B (zh) 2011-08-10 2013-12-18 歌尔声学股份有限公司 一种通信耳机的语音增强方法及降噪通信耳机
US9648421B2 (en) 2011-12-14 2017-05-09 Harris Corporation Systems and methods for matching gain levels of transducers
US9064497B2 (en) 2012-02-22 2015-06-23 Htc Corporation Method and apparatus for audio intelligibility enhancement and computing apparatus
US20130282372A1 (en) * 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing
JP6028502B2 (ja) * 2012-10-03 2016-11-16 沖電気工業株式会社 音声信号処理装置、方法及びプログラム
JP6107151B2 (ja) * 2013-01-15 2017-04-05 富士通株式会社 雑音抑圧装置、方法、及びプログラム
US9107010B2 (en) * 2013-02-08 2015-08-11 Cirrus Logic, Inc. Ambient noise root mean square (RMS) detector
US9560444B2 (en) * 2013-03-13 2017-01-31 Cisco Technology, Inc. Kinetic event detection in microphones
US10306389B2 (en) 2013-03-13 2019-05-28 Kopin Corporation Head wearable acoustic system with noise canceling microphone geometry apparatuses and methods
US9312826B2 (en) 2013-03-13 2016-04-12 Kopin Corporation Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction
EP3000241B1 (en) * 2013-05-23 2019-07-17 Knowles Electronics, LLC Vad detection microphone and method of operating the same
US20140358552A1 (en) * 2013-05-31 2014-12-04 Cirrus Logic, Inc. Low-power voice gate for device wake-up
US9978387B1 (en) * 2013-08-05 2018-05-22 Amazon Technologies, Inc. Reference signal generation for acoustic echo cancellation
WO2015034504A1 (en) * 2013-09-05 2015-03-12 Intel Corporation Mobile phone with variable energy consuming speech recognition module
CN104751853B (zh) * 2013-12-31 2019-01-04 辰芯科技有限公司 双麦克风噪声抑制方法及系统
CN107086043B (zh) * 2014-03-12 2020-09-08 华为技术有限公司 检测音频信号的方法和装置
US9530433B2 (en) * 2014-03-17 2016-12-27 Sharp Laboratories Of America, Inc. Voice activity detection for noise-canceling bioacoustic sensor
US9516409B1 (en) 2014-05-19 2016-12-06 Apple Inc. Echo cancellation and control for microphone beam patterns
CN104092802A (zh) * 2014-05-27 2014-10-08 中兴通讯股份有限公司 音频信号的消噪方法及系统
US9288575B2 (en) * 2014-05-28 2016-03-15 GM Global Technology Operations LLC Sound augmentation system transfer function calibration
CN105321528B (zh) * 2014-06-27 2019-11-05 中兴通讯股份有限公司 一种麦克风阵列语音检测方法及装置
CN104134440B (zh) * 2014-07-31 2018-05-08 百度在线网络技术(北京)有限公司 用于便携式终端的语音检测方法和语音检测装置
US9953661B2 (en) * 2014-09-26 2018-04-24 Cirrus Logic Inc. Neural network voice activity detection employing running range normalization
US9516159B2 (en) * 2014-11-04 2016-12-06 Apple Inc. System and method of double talk detection with acoustic echo and noise control
TWI616868B (zh) * 2014-12-30 2018-03-01 鴻海精密工業股份有限公司 會議記錄裝置及其自動生成會議記錄的方法
US9685156B2 (en) * 2015-03-12 2017-06-20 Sony Mobile Communications Inc. Low-power voice command detector
US9330684B1 (en) * 2015-03-27 2016-05-03 Continental Automotive Systems, Inc. Real-time wind buffet noise detection
US10242689B2 (en) * 2015-09-17 2019-03-26 Intel IP Corporation Position-robust multiple microphone noise estimation techniques
US11631421B2 (en) * 2015-10-18 2023-04-18 Solos Technology Limited Apparatuses and methods for enhanced speech recognition in variable environments
CN105280195B (zh) * 2015-11-04 2018-12-28 腾讯科技(深圳)有限公司 语音信号的处理方法及装置
US20170140233A1 (en) * 2015-11-13 2017-05-18 Fingerprint Cards Ab Method and system for calibration of a fingerprint sensing device
US10325134B2 (en) 2015-11-13 2019-06-18 Fingerprint Cards Ab Method and system for calibration of an optical fingerprint sensing device
CN105609118B (zh) * 2015-12-30 2020-02-07 生迪智慧科技有限公司 语音检测方法及装置
CN106971741B (zh) * 2016-01-14 2020-12-01 芋头科技(杭州)有限公司 实时将语音进行分离的语音降噪的方法及系统
CN106997768B (zh) 2016-01-25 2019-12-10 电信科学技术研究院 一种语音出现概率的计算方法、装置及电子设备
KR102468148B1 (ko) 2016-02-19 2022-11-21 삼성전자주식회사 전자 장치 및 전자 장치의 음성 및 잡음 분류 방법
US10249325B2 (en) 2016-03-31 2019-04-02 OmniSpeech LLC Pitch detection algorithm based on PWVT of Teager Energy Operator
US10074380B2 (en) * 2016-08-03 2018-09-11 Apple Inc. System and method for performing speech enhancement using a deep neural network-based signal
JP6567478B2 (ja) * 2016-08-25 2019-08-28 日本電信電話株式会社 音源強調学習装置、音源強調装置、音源強調学習方法、プログラム、信号処理学習装置
US10237647B1 (en) * 2017-03-01 2019-03-19 Amazon Technologies, Inc. Adaptive step-size control for beamformer
EP3392882A1 (en) * 2017-04-20 2018-10-24 Thomson Licensing Method for processing an input audio signal and corresponding electronic device, non-transitory computer readable program product and computer readable storage medium
JP2018191145A (ja) * 2017-05-08 2018-11-29 オリンパス株式会社 収音装置、収音方法、収音プログラム及びディクテーション方法
US10395667B2 (en) * 2017-05-12 2019-08-27 Cirrus Logic, Inc. Correlation-based near-field detector
US20210200692A1 (en) 2017-06-20 2021-07-01 Hewlett-Packard Development Company, L.P. Signal combiner
US11316865B2 (en) 2017-08-10 2022-04-26 Nuance Communications, Inc. Ambient cooperative intelligence system and method
US11404148B2 (en) 2017-08-10 2022-08-02 Nuance Communications, Inc. Automated clinical documentation system and method
US9973849B1 (en) * 2017-09-20 2018-05-15 Amazon Technologies, Inc. Signal quality beam selection
US10839822B2 (en) * 2017-11-06 2020-11-17 Microsoft Technology Licensing, Llc Multi-channel speech separation
CN111344778B (zh) * 2017-11-23 2024-05-28 哈曼国际工业有限公司 用于语音增强的方法和系统
CN109994122B (zh) * 2017-12-29 2023-10-31 阿里巴巴集团控股有限公司 语音数据的处理方法、装置、设备、介质和系统
KR102475989B1 (ko) 2018-02-12 2022-12-12 삼성전자주식회사 오디오 신호의 주파수의 변화에 따른 위상 변화율에 기반하여 노이즈가 감쇠된 오디오 신호를 생성하는 장치 및 방법
US20190272895A1 (en) 2018-03-05 2019-09-05 Nuance Communications, Inc. System and method for review of automated clinical documentation
WO2019173333A1 (en) 2018-03-05 2019-09-12 Nuance Communications, Inc. Automated clinical documentation system and method
US11250383B2 (en) 2018-03-05 2022-02-15 Nuance Communications, Inc. Automated clinical documentation system and method
SG11202009556XA (en) * 2018-03-28 2020-10-29 Telepathy Labs Inc Text-to-speech synthesis system and method
EP3776552A1 (en) * 2018-03-29 2021-02-17 3M Innovative Properties Company Voice-activated sound encoding for headsets using frequency domain representations of microphone signals
US10957337B2 (en) 2018-04-11 2021-03-23 Microsoft Technology Licensing, Llc Multi-microphone speech separation
US11341987B2 (en) * 2018-04-19 2022-05-24 Semiconductor Components Industries, Llc Computationally efficient speech classifier and related methods
US10847178B2 (en) * 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
CN108632711B (zh) * 2018-06-11 2020-09-04 广州大学 扩声系统增益自适应控制方法
JP6942282B2 (ja) * 2018-07-12 2021-09-29 ドルビー ラボラトリーズ ライセンシング コーポレイション 補助信号を用いたオーディオデバイスの送信制御
EP3667662B1 (en) * 2018-12-12 2022-08-10 Panasonic Intellectual Property Corporation of America Acoustic echo cancellation device, acoustic echo cancellation method and acoustic echo cancellation program
CN111294473B (zh) * 2019-01-28 2022-01-04 展讯通信(上海)有限公司 信号处理方法及装置
JP7404664B2 (ja) * 2019-06-07 2023-12-26 ヤマハ株式会社 音声処理装置及び音声処理方法
US11216480B2 (en) 2019-06-14 2022-01-04 Nuance Communications, Inc. System and method for querying data points from graph data structures
US11227679B2 (en) 2019-06-14 2022-01-18 Nuance Communications, Inc. Ambient clinical intelligence system and method
US11043207B2 (en) 2019-06-14 2021-06-22 Nuance Communications, Inc. System and method for array data simulation and customized acoustic modeling for ambient ASR
CN112153505A (zh) * 2019-06-28 2020-12-29 中强光电股份有限公司 降噪系统及降噪方法
US11531807B2 (en) 2019-06-28 2022-12-20 Nuance Communications, Inc. System and method for customized text macros
US11670408B2 (en) 2019-09-30 2023-06-06 Nuance Communications, Inc. System and method for review of automated clinical documentation
CN111049848B (zh) * 2019-12-23 2021-11-23 腾讯科技(深圳)有限公司 通话方法、装置、系统、服务器及存储介质
WO2021226515A1 (en) 2020-05-08 2021-11-11 Nuance Communications, Inc. System and method for data augmentation for multi-microphone signal processing
CN115699173A (zh) * 2020-06-16 2023-02-03 华为技术有限公司 语音活动检测方法和装置
US11222103B1 (en) 2020-10-29 2022-01-11 Nuance Communications, Inc. Ambient cooperative intelligence system and method
EP4075822B1 (en) * 2021-04-15 2023-06-07 Rtx A/S Microphone mute notification with voice activity detection
WO2023085749A1 (ko) * 2021-11-09 2023-05-19 삼성전자주식회사 빔포밍을 제어하는 전자 장치 및 이의 동작 방법
CN115831145B (zh) * 2023-02-16 2023-06-27 之江实验室 一种双麦克风语音增强方法和系统

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2047664T3 (es) 1988-03-11 1994-03-01 British Telecomm Deteccion de actividad de voz.
US5276779A (en) * 1991-04-01 1994-01-04 Eastman Kodak Company Method for the reproduction of color images based on viewer adaption
IL101556A (en) * 1992-04-10 1996-08-04 Univ Ramot Multi-channel signal separation using cross-polyspectra
TW219993B (en) 1992-05-21 1994-02-01 Ind Tech Res Inst Speech recognition system
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise
US5825671A (en) * 1994-03-16 1998-10-20 U.S. Philips Corporation Signal-source characterization system
JP2758846B2 (ja) 1995-02-27 1998-05-28 埼玉日本電気株式会社 ノイズキャンセラ装置
US5694474A (en) 1995-09-18 1997-12-02 Interval Research Corporation Adaptive filter for signal processing and method therefor
FI100840B (fi) 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
US5774849A (en) 1996-01-22 1998-06-30 Rockwell International Corporation Method and apparatus for generating frame voicing decisions of an incoming speech signal
TW357260B (en) 1997-11-13 1999-05-01 Ind Tech Res Inst Interactive music play method and apparatus
JP3505085B2 (ja) 1998-04-14 2004-03-08 アルパイン株式会社 オーディオ装置
US6526148B1 (en) * 1999-05-18 2003-02-25 Siemens Corporate Research, Inc. Device and method for demixing signal mixtures using fast blind source separation technique based on delay and attenuation compensation, and for selecting channels for the demixed signals
US6694020B1 (en) * 1999-09-14 2004-02-17 Agere Systems, Inc. Frequency domain stereophonic acoustic echo canceller utilizing non-linear transformations
US6424960B1 (en) * 1999-10-14 2002-07-23 The Salk Institute For Biological Studies Unsupervised adaptation and classification of multiple classes and sources in blind signal separation
EP1254513A4 (en) * 1999-11-29 2009-11-04 Syfx SYSTEMS AND METHODS FOR SIGNAL PROCESSING
US6606382B2 (en) 2000-01-27 2003-08-12 Qualcomm Incorporated System and method for implementation of an echo canceller
AU2000251208A1 (en) 2000-06-05 2001-12-17 Nanyang Technological University Adaptive directional noise cancelling microphone system
US20030179888A1 (en) * 2002-03-05 2003-09-25 Burnett Gregory C. Voice activity detection (VAD) devices and methods for use with noise suppression systems
US20070233479A1 (en) * 2002-05-30 2007-10-04 Burnett Gregory C Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors
KR100394840B1 (ko) * 2000-11-30 2003-08-19 한국과학기술원 독립 성분 분석을 이용한 능동 잡음 제거방법
US7941313B2 (en) 2001-05-17 2011-05-10 Qualcomm Incorporated System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system
JP3364487B2 (ja) 2001-06-25 2003-01-08 隆義 山本 複合音声データの音声分離方法、発言者特定方法、複合音声データの音声分離装置、発言者特定装置、コンピュータプログラム、及び、記録媒体
JP2003241787A (ja) 2002-02-14 2003-08-29 Sony Corp 音声認識装置および方法、並びにプログラム
GB0204548D0 (en) * 2002-02-27 2002-04-10 Qinetiq Ltd Blind signal separation
US6904146B2 (en) * 2002-05-03 2005-06-07 Acoustic Technology, Inc. Full duplex echo cancelling circuit
JP3682032B2 (ja) * 2002-05-13 2005-08-10 株式会社ダイマジック オーディオ装置並びにその再生用プログラム
US7082204B2 (en) 2002-07-15 2006-07-25 Sony Ericsson Mobile Communications Ab Electronic devices, methods of operating the same, and computer program products for detecting noise in a signal based on a combination of spatial correlation and time correlation
US7359504B1 (en) * 2002-12-03 2008-04-15 Plantronics, Inc. Method and apparatus for reducing echo and noise
KR20050115857A (ko) 2002-12-11 2005-12-08 소프트맥스 인코퍼레이티드 안정성 강제하에서 독립 성분 분석을 사용하여 음향을처리하는 시스템 및 방법
JP2004274683A (ja) 2003-03-12 2004-09-30 Matsushita Electric Ind Co Ltd エコーキャンセル装置、エコーキャンセル方法、プログラムおよび記録媒体
EP2068308B1 (en) 2003-09-02 2010-06-16 Nippon Telegraph and Telephone Corporation Signal separation method, signal separation device, and signal separation program
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
GB0321722D0 (en) * 2003-09-16 2003-10-15 Mitel Networks Corp A method for optimal microphone array design under uniform acoustic coupling constraints
US20050071158A1 (en) * 2003-09-25 2005-03-31 Vocollect, Inc. Apparatus and method for detecting user speech
SG119199A1 (en) * 2003-09-30 2006-02-28 Stmicroelectronics Asia Pacfic Voice activity detector
JP2005227511A (ja) 2004-02-12 2005-08-25 Yamaha Motor Co Ltd 対象音検出方法、音信号処理装置、音声認識装置及びプログラム
JP2005227512A (ja) 2004-02-12 2005-08-25 Yamaha Motor Co Ltd 音信号処理方法及びその装置、音声認識装置並びにプログラム
US8687820B2 (en) 2004-06-30 2014-04-01 Polycom, Inc. Stereo microphone processing for teleconferencing
DE102004049347A1 (de) * 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
US7925504B2 (en) * 2005-01-20 2011-04-12 Nec Corporation System, method, device, and program for removing one or more signals incoming from one or more directions
WO2006131959A1 (ja) 2005-06-06 2006-12-14 Saga University 信号分離装置
US7464029B2 (en) * 2005-07-22 2008-12-09 Qualcomm Incorporated Robust separation of speech signals in a noisy environment
JP4556875B2 (ja) 2006-01-18 2010-10-06 ソニー株式会社 音声信号分離装置及び方法
US7970564B2 (en) 2006-05-02 2011-06-28 Qualcomm Incorporated Enhancement techniques for blind source separation (BSS)
US8068619B2 (en) * 2006-05-09 2011-11-29 Fortemedia, Inc. Method and apparatus for noise suppression in a small array microphone system
US7817808B2 (en) * 2007-07-19 2010-10-19 Alon Konchitsky Dual adaptive structure for speech enhancement
US8175871B2 (en) * 2007-09-28 2012-05-08 Qualcomm Incorporated Apparatus and method of noise and echo reduction in multiple microphone audio systems
US8046219B2 (en) * 2007-10-18 2011-10-25 Motorola Mobility, Inc. Robust two microphone noise suppression system
US8223988B2 (en) * 2008-01-29 2012-07-17 Qualcomm Incorporated Enhanced blind source separation algorithm for highly correlated mixtures

Also Published As

Publication number Publication date
CN101790752B (zh) 2013-09-04
TW200926151A (en) 2009-06-16
KR20100075976A (ko) 2010-07-05
JP5102365B2 (ja) 2012-12-19
ES2373511T3 (es) 2012-02-06
KR101265111B1 (ko) 2013-05-16
EP2201563A1 (en) 2010-06-30
ATE531030T1 (de) 2011-11-15
TWI398855B (zh) 2013-06-11
JP2010541010A (ja) 2010-12-24
WO2009042948A1 (en) 2009-04-02
RU2450368C2 (ru) 2012-05-10
CA2695231C (en) 2015-02-17
BRPI0817731A8 (pt) 2019-01-08
EP2201563B1 (en) 2011-10-26
US8954324B2 (en) 2015-02-10
CN101790752A (zh) 2010-07-28
US20090089053A1 (en) 2009-04-02
CA2695231A1 (en) 2009-04-02

Similar Documents

Publication Publication Date Title
RU2010116727A (ru) Средство обнаружения голосовой активности с использованием нескольких микрофонов
US8065115B2 (en) Method and system for identifying audible noise as wind noise in a hearing aid apparatus
RU2010136338A (ru) Оповещение пользователя о прикрытии микрофона
US9959886B2 (en) Spectral comb voice activity detection
DK1491068T3 (da) Fremgangsmåde til dynamisk bestemmelse af tidskonstanter, fremgangsmåde til niveaudetektering, fremgangsmåde til komprimering af et elektrisk lydsignal og höreapparat, hvori fremgangsmåden til komprimering anvendes
DE60133533D1 (de) Verfahren und vorrichtung zur erfassung eines physiologischen parameters
NO331226B1 (no) Fremgangsmate og innretning for a angi aktivering av en rokdetektoralarm.
TW200629754A (en) Method and apparatus for guard interval detection in multi-carrier receiver
RU2001105990A (ru) Способ регулирования громкости звуковоспроизведения и устройства для его реализации
CN107170465A (zh) 一种音频质量检测方法及音频质量检测系统
RU2008133571A (ru) Обнаружение присутствия телевизионных сигналов, погруженных в шум, с использованием набора инструментальных средств циклостационарности
ATE447802T1 (de) Detektionsverfahren für ack/nack-signale und detektor dafür
WO2010092914A1 (ja) 多チャンネル音響信号処理方法、そのシステム及びプログラム
EP2997741A1 (en) Automated gain matching for multiple microphones
ATE446561T1 (de) Sensoranordnung
KR20090127182A (ko) 잡음 환경들에 대한 음성 활동도 검출기 및 검증기
CA2485728A1 (en) Detecting acoustic echoes using microphone arrays
Guski et al. Impulsive noise detection in sweep measurements
Vesa et al. Automatic estimation of reverberation time from binaural signals
TWI258936B (en) Signal detection method with high detective rate and low false alarm rate
RU2278424C1 (ru) Устройство измерения максимальной разборчивости речи
GB2609303A8 (en) Single-microphone wind detection for audio device
US20230087854A1 (en) Selection criteria for passive sound sensing in a lighting iot network
KR101073632B1 (ko) 반향 환경에서의 영교차 기반 다음원 국지화 방법 및 장치
Shabtai et al. Estimating the room volume from room impulse response via hypothesis verification approach

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20180927