JP5819324B2 - 複数の音声区間検出器に基づく音声区間検出 - Google Patents
複数の音声区間検出器に基づく音声区間検出 Download PDFInfo
- Publication number
- JP5819324B2 JP5819324B2 JP2012554993A JP2012554993A JP5819324B2 JP 5819324 B2 JP5819324 B2 JP 5819324B2 JP 2012554993 A JP2012554993 A JP 2012554993A JP 2012554993 A JP2012554993 A JP 2012554993A JP 5819324 B2 JP5819324 B2 JP 5819324B2
- Authority
- JP
- Japan
- Prior art keywords
- vad
- signal
- handset
- headset
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 22
- 238000000034 method Methods 0.000 claims description 42
- 230000007613 environmental effect Effects 0.000 claims description 26
- 230000005236 sound signal Effects 0.000 claims description 17
- 238000004891 communication Methods 0.000 claims description 16
- 210000000988 bone and bone Anatomy 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 description 16
- 238000012545 processing Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 230000007423 decrease Effects 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 102100026436 Regulator of MON1-CCZ1 complex Human genes 0.000 description 2
- 101710180672 Regulator of MON1-CCZ1 complex Proteins 0.000 description 2
- 230000005534 acoustic noise Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- IRLPACMLTUPBCL-KQYNXXCUSA-N 5'-adenylyl sulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OS(O)(=O)=O)[C@@H](O)[C@H]1O IRLPACMLTUPBCL-KQYNXXCUSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000003625 skull Anatomy 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
- Mobile Radio Communication Systems (AREA)
Description
Y=P1*V1+P2*V2, 式1
であり、Y=VAD出力信号、P1=外部確率値、V1=外部VAD信号、P2=内部確率値、V2=内部VAD信号である。式1の各項P1*V1およびP2*V2は、信頼レベルを表わす。いくつかの状況において、外部および内部外部確率値P1,P2は、それぞれ0と1の範囲内であり、またさらに、確率値の合計は、1の値であるように要求されてもよい。VAD出力信号は、音声区間がオーディオ信号内に存在するか否かを決定するために、しきい値と比較される。もし、VAD出力信号が例えばしきい値を越える場合、音声はオーディオ信号の中に存在する。反対に、VAD出力信号がしきい値以下の場合、例として、音声はオーディオ信号の中に存在しない。他のしきい値の比較が使用されてもよい。使用されてもよい別の例示的な重み付け式は、次のように表現され:
Y=P*V1+(1−P)*V2, 式2
ここで、ここでPはP1またはP2のいずれかである。Pに値を割り当てることによって、(1−P)の値は、V2のための残りの重み付け因子として得られ、Yを計算する。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[1]
音声区間検出(VAD)の方法において、
デバイスに含まれる第1の音声区間検出器からの第1のVAD信号を受け取ることと、
前記デバイスに含まれない第2の音声区間検出器からの第2のVAD信号を受け取ることと、
前記第1および第2のVAD信号をVAD出力信号に組み合わせることと、
前記VAD出力信号に基づいて音声区間を検出することと、
を具備する、方法。
[2]
環境状態に基づいて前記第1のVAD信号を重み付けすること、
をさらに具備する、[1]の方法。
[3]
前記環境状態は、前記デバイスで測定された信号対ノイズ雑音比(SNR)を含む、[2]の方法。
[4]
環境状態に基づいて前記第2のVAD信号を重み付けすること、
をさらに具備する、[1]の方法。
[5]
前記環境状態は、前記第2の音声区間検出器を含む外部デバイスで測定された信号対ノイズ雑音比(SNR)を含む、[4]の方法。
[6]
前記第2の音声区間検出器の前記機能を決定すること、
をさらに具備する、[1]の方法。
[7]
前記第2の音声区間検出器の前記機能は、骨伝導マイクロフォン、オーディオマイクロフォン、皮膚振動センサ、マイクロフォンのアレイ、または、レーダ信号に基づく、[6]の方法。
[8]
ワイヤレスリンクを越えて前記第2のVAD信号を送信すること、
をさらに具備する、[1]の方法。
[9]
前記ワイヤレスリンクは、ブルートゥースワイヤレスリンクである、請求項8の方法。
[10]
音声区間検出(VAD)の方法において、
第1のデバイスおよび第2のデバイスを提供し、各デバイスがワイヤレスリンク経由で相互に通信するように構成される、ことと、
前記第2のデバイスにおけるVAD信号を決定することと、
前記第2のデバイスで、前記VAD信号に基づいてフラグをセットし、前記フラグがデジタル化されたオーディオ含むパケットに含まれる、ことと、
第2のデバイスから前記第1のデバイスへ、前記ワイヤレスリンク経由で、前記パケットを送信することと、
前記パケットに含まれる前記フラグに基づいて、前記第1のデバイスで音声区間を検出することと、
を具備する、方法。
[11]
前記フラグは、ブルートゥースパケットヘッダに含まれる1ビット値である、[10]の方法。
[12]
デバイスに含まれ、第1の音声区間検出(VAD)信号を生成するように構成される第1の音声区間検出器と、
前記デバイスに含まれず、第2の音声区間検出(VAD)信号を生成するように構成される第2の音声区間検出器と、
前記第1および第2の音声区間検出器との通信において、前記第1および第2のVAD信号をVAD出力信号に組み合わせるように構成される制御ロジックと、
を具備する、システム。
[13]
前記VAD出力信号を受け取るプロセッサをさらに具備する[12]のシステム。
[14]
前記プロセッサはボコーダを含む、[13]のシステム。
[15]
前記デバイスはワイヤレスハンドセットである、[12]のシステム。
[16]
前記第2の音声区間検出器は、前記デバイスとの通信におけるヘッドセットヘッドセットに含まれる、[12]のシステム。
[17]
前記ヘッドセットはワイヤレスヘッドセットである、[16]のシステム。
[18]
前記第2のVAD信号は、ブルートゥースヘッダに含まれるシングルビット値として、前記制御ロジックに送られる、[12]のシステム。
[19]
前記制御ロジックは前記デバイスに含まれる、[13]のシステム。
[20]
第1の位置で、音声区間を検出する第1の手段と、
第2の位置で、音声区間を検出する第2の手段と、
前記第1および第2の手段からの出力を、音声区間検出(VAD)出力信号に組み合わせる手段と、
を具備する、システム。
[21]
前記VAD出力信号を受け取るプロセッサ手段と、
をさらに具備する、[20]のシステム。
[22]
前記第1の手段は、ワイヤレスハンドセットに含まれる、[20]のシステム。
[23]
前記第2の手段は、デバイスとの通信におけるヘッドセットに含まれる、[20]のシステム。
[24]
前記ヘッドセットはワイヤレスヘッドセットである、[23]のシステム。
[25]
ブルートゥースヘッダに含まれるシングルビット値として、前記第1または第2の手段からのVAD信号を、前記組み合わせる手段に送る手段をさらに具備する、[20]のシステム。
[26]
前記組み合わせる手段は前記第1の位置で含まれる、[20]のシステム。
[27]
1つ以上のプロセッサによって実行可能な命令のセットを包含するコンピュータ可読媒体において、
デバイスに含まれる第1の音声区間検出器からの第1のVAD信号を受け取るコードと、
前記デバイスに含まれない第2の音声区間検出器からの第2のVAD信号を受け取るコードと、
前記第1および第2のVAD信号を、VAD出力信号に組み合わせるコードと、
を具備する、コンピュータ可読媒体。
[28]
前記VAD出力信号に基づいて、音声区間を検出するコードをさらに具備する、[27]のコンピュータ可読媒体。
[29]
環境状態に基づいて、前記第1のVAD信号を重み付けするコードをさらに具備する、[27]のコンピュータ可読媒体。
[30]
前記環境状態は、前記デバイスで測定された信号対ノイズ雑音比(SNR)を含む、[29]のコンピュータ可読媒体。
[31]
環境状態に基づいて前記第2のVAD信号を重み付けするコードをさらに具備する、[27]のコンピュータ可読媒体。
[32]
前記環境状態は、前記第2の音声区間検出器を含む外部デバイスで測定された信号対ノイズ雑音比(SNR)を含む、[31]のコンピュータ可読媒体。
Claims (27)
- 音声区間検出(VAD)の方法において、
ハンドセット中に含まれる第1の音声区間検出器から第1のVAD信号を受け取ることと、
外部のヘッドセット中に含まれる第2の音声区間検出器から第2のVAD信号を受け取ることと、
前記第1および第2のVAD信号を組み合わせて1つのVAD出力信号とすることと、
前記VAD出力信号に基づいて音声区間を検出することと、
を含み、
前記第1の音声区間検出器は、プロセッサによって実現され、第1のセンサ信号に応答して前記第1のVAD信号を生成させるためのVADアルゴリズムを実行するように構成されており、
前記第2の音声区間検出器は、プロセッサによって実現され、第2のセンサ信号に応答して前記第2のVAD信号を生成させるためのVADアルゴリズムを実行するように構成されている方法。 - 環境状態に基づいて前記第1のVAD信号を重み付けすること、
をさらに含む、請求項1の方法。 - 前記環境状態は、前記ハンドセットにおいて測定された信号対ノイズ比(SNR)を含む、請求項2の方法。
- 環境状態に基づいて前記第2のVAD信号を重み付けすること、
をさらに含む、請求項1乃至3のいずれか一項の方法。 - 前記環境状態は、前記第2の音声区間検出器を含む前記外部のヘッドセットにおいて測定された信号対ノイズ比(SNR)を含む、請求項4の方法。
- 前記第2の音声区間検出器の機能を決定すること、
をさらに含む、請求項1の方法。 - 前記第2の音声区間検出器の前記機能は、骨伝導マイクロフォン、オーディオマイクロフォン、皮膚振動センサ、マイクロフォンのアレイ、または、レーダ信号に基づく、請求項6の方法。
- ワイヤレスリンクを介して前記第2のVAD信号を送信すること、
をさらに含む、請求項1の方法。 - 前記ワイヤレスリンクは、ブルートゥースワイヤレスリンクである、請求項8の方法。
- 前記第1および第2のVAD信号の各々はオーディオ信号を含む、請求項1乃至9のいずれか一項の方法。
- 音声区間検出(VAD)の方法において、
ハンドセットと外部のヘッドセットとを提供し、それぞれワイヤレスリンクを介して相互に通信するように構成されている、ことと、
前記ヘッドセットにおいてVAD信号を決定することと、
前記ヘッドセットにおいて、前記VAD信号に基づいてフラグをセットし、前記フラグは、デジタル化されたオーディオを含むパケット中に含まれ、前記フラグは、ブルートゥースパケットヘッダ中に含まれる1ビット値である、ことと、
前記ヘッドセットから前記ハンドセットへ、前記ワイヤレスリンクを介して、前記パケットを送信することと、
前記パケット中に含まれる前記フラグに基づいて、前記ハンドセットにおいて音声区間を検出することと、
を含む、方法。 - ハンドセット中に含まれる第1の音声区間検出器において、前記第1の音声区間検出器は、ハンドセットプロセッサによって実現され、第1のセンサ信号に応答して第1の音声区間検出(VAD)信号を生成させるためのVADアルゴリズムを実行するように構成されている、前記第1の音声区間検出器と、
外部のヘッドセット中に含まれる第2の音声区間検出器において、前記第2の音声区間検出器は、ヘッドセットプロセッサによって実現され、第2のセンサ信号に応答して第2のVAD信号を生成させるためのVADアルゴリズムを実行するように構成されている、前記第2の音声区間検出器と、
前記第1および第2の音声区間検出器と通信し、前記第1および第2のVAD信号を組み合わせて1つのVAD出力信号とするようにと、前記VAD出力信号に基づいて音声区間を検出するように構成されているプロセッサと、
を具備する、システム。 - 前記プロセッサはボコーダを含む、請求項12のシステム。
- 前記ハンドセットはワイヤレスハンドセットである、請求項12のシステム。
- 前記ヘッドセットは、前記ハンドセットと通信を行う、請求項12のシステム。
- 前記ヘッドセットはワイヤレスヘッドセットである、請求項15のシステム。
- 前記第2のVAD信号は、ブルートゥースヘッダ中に含まれるシングルビット値として、前記プロセッサに送信される、請求項12のシステム。
- 前記プロセッサは前記ハンドセット中に含まれる、請求項12のシステム。
- 前記第1および第2のVAD信号の各々はオーディオ信号を含む、請求項12乃至18のいずれか一項のシステム。
- ハンドセット中に含まれ、第1のセンサ信号に応答して第1の出力信号を生成させる音声区間検出(VAD)アルゴリズムを実行することによって第1の位置において音声区間を検出する第1の手段と、
外部のヘッドセット中に含まれ、第2のセンサ信号に応答して第2の出力信号を生成させるVADアルゴリズムを実行することによって第2の位置において音声区間を検出する第2の手段と、
前記第1および第2の手段からのそれぞれの出力信号を組み合わせて1つのVAD出力信号とする第3の手段と、
前記VAD出力信号に基づいて音声区間を検出する第4の手段と、
を具備する、システム。 - 前記ハンドセットはワイヤレスハンドセットである、請求項20のシステム。
- 前記ヘッドセットは、前記ハンドセットと通信を行う、請求項20のシステム。
- 前記ヘッドセットはワイヤレスヘッドセットである、請求項22のシステム。
- ブルートゥースヘッダ中に含まれるシングルビット値として、前記第1または第2の手段からのVAD信号を、前記第3の手段に送信する手段をさらに具備する、請求項20のシステム。
- 前記第3および第4の手段は前記ハンドセット中に含まれる、請求項20のシステム。
- 前記第1および第2の手段からの前記それぞれの出力信号の各々はオーディオ信号を含む、請求項20乃至25のいずれか一項のシステム。
- 1つ以上のプロセッサによって実行可能な、実行時に請求項1乃至5のいずれか一項の方法を行うプログラムを記憶するコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/711,943 | 2010-02-24 | ||
US12/711,943 US8626498B2 (en) | 2010-02-24 | 2010-02-24 | Voice activity detection based on plural voice activity detectors |
PCT/US2010/060363 WO2011106065A1 (en) | 2010-02-24 | 2010-12-14 | Voice activity detection based on plural voice activity detectors |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013520707A JP2013520707A (ja) | 2013-06-06 |
JP5819324B2 true JP5819324B2 (ja) | 2015-11-24 |
Family
ID=43881004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012554993A Active JP5819324B2 (ja) | 2010-02-24 | 2010-12-14 | 複数の音声区間検出器に基づく音声区間検出 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8626498B2 (ja) |
EP (1) | EP2539887B1 (ja) |
JP (1) | JP5819324B2 (ja) |
KR (1) | KR101479386B1 (ja) |
CN (1) | CN102770909B (ja) |
WO (1) | WO2011106065A1 (ja) |
Families Citing this family (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
US8831937B2 (en) * | 2010-11-12 | 2014-09-09 | Audience, Inc. | Post-noise suppression processing to improve voice quality |
SI3493205T1 (sl) * | 2010-12-24 | 2021-03-31 | Huawei Technologies Co., Ltd. | Postopek in naprava za adaptivno zaznavanje glasovne aktivnosti v vstopnem avdio signalu |
US10218327B2 (en) * | 2011-01-10 | 2019-02-26 | Zhinian Jing | Dynamic enhancement of audio (DAE) in headset systems |
JP5699749B2 (ja) * | 2011-03-31 | 2015-04-15 | 富士通株式会社 | 携帯端末装置の位置判定システムおよび携帯端末装置 |
WO2012176199A1 (en) * | 2011-06-22 | 2012-12-27 | Vocalzoom Systems Ltd | Method and system for identification of speech segments |
US20130090926A1 (en) * | 2011-09-16 | 2013-04-11 | Qualcomm Incorporated | Mobile device context information using speech detection |
US8989058B2 (en) * | 2011-09-28 | 2015-03-24 | Marvell World Trade Ltd. | Conference mixing using turbo-VAD |
KR20130133629A (ko) * | 2012-05-29 | 2013-12-09 | 삼성전자주식회사 | 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 |
CN102820032B (zh) * | 2012-08-15 | 2014-08-13 | 歌尔声学股份有限公司 | 一种语音识别系统和方法 |
US9313572B2 (en) * | 2012-09-28 | 2016-04-12 | Apple Inc. | System and method of detecting a user's voice activity using an accelerometer |
US9438985B2 (en) | 2012-09-28 | 2016-09-06 | Apple Inc. | System and method of detecting a user's voice activity using an accelerometer |
CN103065631B (zh) * | 2013-01-24 | 2015-07-29 | 华为终端有限公司 | 一种语音识别的方法、装置 |
CN103971680B (zh) * | 2013-01-24 | 2018-06-05 | 华为终端(东莞)有限公司 | 一种语音识别的方法、装置 |
US9363596B2 (en) | 2013-03-15 | 2016-06-07 | Apple Inc. | System and method of mixing accelerometer and microphone signals to improve voice quality in a mobile device |
US10020008B2 (en) | 2013-05-23 | 2018-07-10 | Knowles Electronics, Llc | Microphone and corresponding digital interface |
US9111548B2 (en) | 2013-05-23 | 2015-08-18 | Knowles Electronics, Llc | Synchronization of buffered data in multiple microphones |
US20180317019A1 (en) | 2013-05-23 | 2018-11-01 | Knowles Electronics, Llc | Acoustic activity detecting microphone |
KR20160010606A (ko) | 2013-05-23 | 2016-01-27 | 노우레스 일렉트로닉스, 엘엘시 | Vad 탐지 마이크로폰 및 그 마이크로폰을 동작시키는 방법 |
US9711166B2 (en) | 2013-05-23 | 2017-07-18 | Knowles Electronics, Llc | Decimation synchronization in a microphone |
KR102282366B1 (ko) * | 2013-06-03 | 2021-07-27 | 삼성전자주식회사 | 음성 향상 방법 및 그 장치 |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
CN104424956B9 (zh) | 2013-08-30 | 2022-11-25 | 中兴通讯股份有限公司 | 激活音检测方法和装置 |
US9502028B2 (en) | 2013-10-18 | 2016-11-22 | Knowles Electronics, Llc | Acoustic activity detection apparatus and method |
US9147397B2 (en) | 2013-10-29 | 2015-09-29 | Knowles Electronics, Llc | VAD detection apparatus and method of operating the same |
CN106104686B (zh) * | 2013-11-08 | 2019-12-31 | 美商楼氏电子有限公司 | 麦克风中的方法、麦克风组件、麦克风设备 |
US10812900B2 (en) | 2014-06-02 | 2020-10-20 | Invensense, Inc. | Smart sensor for always-on operation |
CN105142055A (zh) * | 2014-06-03 | 2015-12-09 | 阮勇华 | 声控耳机 |
US11166167B2 (en) * | 2014-06-18 | 2021-11-02 | Texas Instruments Incorporated | Audio stream identification by a wireless network controller |
US10360926B2 (en) | 2014-07-10 | 2019-07-23 | Analog Devices Global Unlimited Company | Low-complexity voice activity detection |
CN105261375B (zh) * | 2014-07-18 | 2018-08-31 | 中兴通讯股份有限公司 | 激活音检测的方法及装置 |
US10229686B2 (en) * | 2014-08-18 | 2019-03-12 | Nuance Communications, Inc. | Methods and apparatus for speech segmentation using multiple metadata |
DE112015004185T5 (de) | 2014-09-12 | 2017-06-01 | Knowles Electronics, Llc | Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten |
KR102301880B1 (ko) | 2014-10-14 | 2021-09-14 | 삼성전자 주식회사 | 전자 장치 및 이의 음성 대화 방법 |
CN107112012B (zh) | 2015-01-07 | 2020-11-20 | 美商楼氏电子有限公司 | 用于音频处理的方法和系统及计算机可读存储介质 |
US9830080B2 (en) | 2015-01-21 | 2017-11-28 | Knowles Electronics, Llc | Low power voice trigger for acoustic apparatus and method |
US10121472B2 (en) | 2015-02-13 | 2018-11-06 | Knowles Electronics, Llc | Audio buffer catch-up apparatus and method with two microphones |
US10097912B2 (en) * | 2015-03-27 | 2018-10-09 | Intel Corporation | Intelligent switching between air conduction speakers and tissue conduction speakers |
US9736782B2 (en) * | 2015-04-13 | 2017-08-15 | Sony Corporation | Mobile device environment detection using an audio sensor and a reference signal |
US9736578B2 (en) | 2015-06-07 | 2017-08-15 | Apple Inc. | Microphone-based orientation sensors and related techniques |
US10070342B2 (en) * | 2015-06-19 | 2018-09-04 | Apple Inc. | Measurement denoising |
US9478234B1 (en) | 2015-07-13 | 2016-10-25 | Knowles Electronics, Llc | Microphone apparatus and method with catch-up buffer |
CN105120198A (zh) * | 2015-08-26 | 2015-12-02 | 无锡华海天和信息科技有限公司 | 一种能够消除通话中回音的视频通话系统及其实现方法 |
EP3157266B1 (en) * | 2015-10-16 | 2019-02-27 | Nxp B.V. | Controller for a haptic feedback element |
US9978397B2 (en) * | 2015-12-22 | 2018-05-22 | Intel Corporation | Wearer voice activity detection |
KR102468148B1 (ko) | 2016-02-19 | 2022-11-21 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 음성 및 잡음 분류 방법 |
US11138987B2 (en) | 2016-04-04 | 2021-10-05 | Honeywell International Inc. | System and method to distinguish sources in a multiple audio source environment |
US9820042B1 (en) | 2016-05-02 | 2017-11-14 | Knowles Electronics, Llc | Stereo separation and directional suppression with omni-directional microphones |
US10079027B2 (en) * | 2016-06-03 | 2018-09-18 | Nxp B.V. | Sound signal detector |
US10281485B2 (en) | 2016-07-29 | 2019-05-07 | Invensense, Inc. | Multi-path signal processing for microelectromechanical systems (MEMS) sensors |
US10566007B2 (en) * | 2016-09-08 | 2020-02-18 | The Regents Of The University Of Michigan | System and method for authenticating voice commands for a voice assistant |
US10535364B1 (en) * | 2016-09-08 | 2020-01-14 | Amazon Technologies, Inc. | Voice activity detection using air conduction and bone conduction microphones |
JP2018046525A (ja) * | 2016-09-16 | 2018-03-22 | カシオ計算機株式会社 | 骨伝導波生成装置、骨伝導波生成方法、骨伝導波生成装置用のプログラム及び骨伝導波出力機 |
CN109844857B (zh) | 2016-10-17 | 2024-02-23 | 哈曼国际工业有限公司 | 具有语音能力的便携式音频装置 |
US10403287B2 (en) | 2017-01-19 | 2019-09-03 | International Business Machines Corporation | Managing users within a group that share a single teleconferencing device |
US20180285056A1 (en) * | 2017-03-28 | 2018-10-04 | Microsoft Technology Licensing, Llc | Accessory human interface device |
DK3396978T3 (da) * | 2017-04-26 | 2020-06-08 | Sivantos Pte Ltd | Fremgangsmåde til drift af en høreindretning og en høreindretning |
US10573329B2 (en) * | 2017-05-31 | 2020-02-25 | Dell Products L.P. | High frequency injection for improved false acceptance reduction |
GB201713946D0 (en) * | 2017-06-16 | 2017-10-18 | Cirrus Logic Int Semiconductor Ltd | Earbud speech estimation |
KR102466293B1 (ko) * | 2018-07-12 | 2022-11-14 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 보조 신호를 사용하는 오디오 디바이스에 대한 송신 제어 |
US10861484B2 (en) * | 2018-12-10 | 2020-12-08 | Cirrus Logic, Inc. | Methods and systems for speech detection |
EP4362440A2 (en) * | 2019-05-06 | 2024-05-01 | Apple Inc. | Spoken notifications |
CN110265056B (zh) * | 2019-06-11 | 2021-09-17 | 安克创新科技股份有限公司 | 音源的控制方法以及扬声设备、装置 |
US11650625B1 (en) * | 2019-06-28 | 2023-05-16 | Amazon Technologies, Inc. | Multi-sensor wearable device with audio processing |
CN110310625A (zh) * | 2019-07-05 | 2019-10-08 | 四川长虹电器股份有限公司 | 语音断句方法及系统 |
TWI765261B (zh) * | 2019-10-22 | 2022-05-21 | 英屬開曼群島商意騰科技股份有限公司 | 語音事件偵測裝置及方法 |
US11375322B2 (en) * | 2020-02-28 | 2022-06-28 | Oticon A/S | Hearing aid determining turn-taking |
CN113393865B (zh) * | 2020-03-13 | 2022-06-03 | 阿里巴巴集团控股有限公司 | 功耗控制、模式配置与vad方法、设备及存储介质 |
US11521643B2 (en) | 2020-05-08 | 2022-12-06 | Bose Corporation | Wearable audio device with user own-voice recording |
US20210407510A1 (en) * | 2020-06-24 | 2021-12-30 | Netflix, Inc. | Systems and methods for correlating speech and lip movement |
US11335362B2 (en) | 2020-08-25 | 2022-05-17 | Bose Corporation | Wearable mixed sensor array for self-voice capture |
US11363367B1 (en) * | 2020-11-30 | 2022-06-14 | Dopple Ip B.V. | Dual-microphone with wind noise suppression method |
WO2023136385A1 (ko) * | 2022-01-17 | 2023-07-20 | 엘지전자 주식회사 | 발화인지를 지원하는 이어버드 및 관련 방법 |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7627499B2 (en) * | 1996-11-12 | 2009-12-01 | Syncada Llc | Automated transaction processing system and approach |
US6453285B1 (en) | 1998-08-21 | 2002-09-17 | Polycom, Inc. | Speech activity detector for use in noise reduction system, and methods therefor |
US6618701B2 (en) * | 1999-04-19 | 2003-09-09 | Motorola, Inc. | Method and system for noise suppression using external voice activity detection |
US6339706B1 (en) * | 1999-11-12 | 2002-01-15 | Telefonaktiebolaget L M Ericsson (Publ) | Wireless voice-activated remote control device |
US8467543B2 (en) | 2002-03-27 | 2013-06-18 | Aliphcom | Microphone and voice activity detection (VAD) configurations for use with communication systems |
US20030179888A1 (en) | 2002-03-05 | 2003-09-25 | Burnett Gregory C. | Voice activity detection (VAD) devices and methods for use with noise suppression systems |
US20020116186A1 (en) * | 2000-09-09 | 2002-08-22 | Adam Strauss | Voice activity detector for integrated telecommunications processing |
US7203643B2 (en) * | 2001-06-14 | 2007-04-10 | Qualcomm Incorporated | Method and apparatus for transmitting speech activity in distributed voice recognition systems |
JP3923828B2 (ja) | 2002-03-27 | 2007-06-06 | 株式会社エヌ・ティ・ティ・ドコモ | 無線制御装置、データ通信制御方法、及び移動通信システム |
US7146315B2 (en) | 2002-08-30 | 2006-12-05 | Siemens Corporate Research, Inc. | Multichannel voice detection in adverse environments |
US7174022B1 (en) | 2002-11-15 | 2007-02-06 | Fortemedia, Inc. | Small array microphone for beam-forming and noise suppression |
KR100513175B1 (ko) | 2002-12-24 | 2005-09-07 | 한국전자통신연구원 | 복소수 라플라시안 통계모델을 이용한 음성 검출기 및 음성 검출 방법 |
US20040234067A1 (en) | 2003-05-19 | 2004-11-25 | Acoustic Technologies, Inc. | Distributed VAD control system for telephone |
CA2473195C (en) | 2003-07-29 | 2014-02-04 | Microsoft Corporation | Head mounted multi-sensory audio input system |
US20050033571A1 (en) | 2003-08-07 | 2005-02-10 | Microsoft Corporation | Head mounted multi-sensory audio input system |
JP4713111B2 (ja) * | 2003-09-19 | 2011-06-29 | 株式会社エヌ・ティ・ティ・ドコモ | 発話区間検出装置、音声認識処理装置、送信システム、信号レベル制御装置、発話区間検出方法 |
US7925510B2 (en) | 2004-04-28 | 2011-04-12 | Nuance Communications, Inc. | Componentized voice server with selectable internal and external speech detectors |
US8340309B2 (en) | 2004-08-06 | 2012-12-25 | Aliphcom, Inc. | Noise suppressing multi-microphone headset |
US7283850B2 (en) * | 2004-10-12 | 2007-10-16 | Microsoft Corporation | Method and apparatus for multi-sensory speech enhancement on a mobile device |
JP4632831B2 (ja) * | 2005-03-24 | 2011-02-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声認識方法および音声認識装置 |
GB2430129B (en) * | 2005-09-08 | 2007-10-31 | Motorola Inc | Voice activity detector and method of operation therein |
CN101390438A (zh) * | 2006-02-28 | 2009-03-18 | 株式会社坦姆科日本 | 眼镜型音响/通信装置 |
US8068619B2 (en) | 2006-05-09 | 2011-11-29 | Fortemedia, Inc. | Method and apparatus for noise suppression in a small array microphone system |
EP2089877B1 (en) * | 2006-11-16 | 2010-04-07 | International Business Machines Corporation | Voice activity detection system and method |
US7769585B2 (en) | 2007-04-05 | 2010-08-03 | Avidyne Corporation | System and method of voice activity detection in noisy environments |
US8498678B2 (en) * | 2007-07-10 | 2013-07-30 | Texas Instruments Incorporated | System and method for reducing power consumption in a wireless device |
US8954324B2 (en) * | 2007-09-28 | 2015-02-10 | Qualcomm Incorporated | Multiple microphone voice activity detector |
KR101437830B1 (ko) * | 2007-11-13 | 2014-11-03 | 삼성전자주식회사 | 음성 구간 검출 방법 및 장치 |
US8190440B2 (en) * | 2008-02-29 | 2012-05-29 | Broadcom Corporation | Sub-band codec with native voice activity detection |
US8244528B2 (en) * | 2008-04-25 | 2012-08-14 | Nokia Corporation | Method and apparatus for voice activity determination |
US20100332236A1 (en) * | 2009-06-25 | 2010-12-30 | Blueant Wireless Pty Limited | Voice-triggered operation of electronic devices |
CN102576528A (zh) * | 2009-10-19 | 2012-07-11 | 瑞典爱立信有限公司 | 用于语音活动检测的检测器和方法 |
-
2010
- 2010-02-24 US US12/711,943 patent/US8626498B2/en active Active
- 2010-12-14 CN CN201080064720.4A patent/CN102770909B/zh active Active
- 2010-12-14 EP EP10796549.3A patent/EP2539887B1/en active Active
- 2010-12-14 KR KR1020127024805A patent/KR101479386B1/ko active IP Right Grant
- 2010-12-14 JP JP2012554993A patent/JP5819324B2/ja active Active
- 2010-12-14 WO PCT/US2010/060363 patent/WO2011106065A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JP2013520707A (ja) | 2013-06-06 |
US8626498B2 (en) | 2014-01-07 |
EP2539887B1 (en) | 2015-07-22 |
CN102770909B (zh) | 2016-06-01 |
US20110208520A1 (en) | 2011-08-25 |
KR20120125986A (ko) | 2012-11-19 |
KR101479386B1 (ko) | 2015-01-05 |
EP2539887A1 (en) | 2013-01-02 |
CN102770909A (zh) | 2012-11-07 |
WO2011106065A1 (en) | 2011-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5819324B2 (ja) | 複数の音声区間検出器に基づく音声区間検出 | |
US11569789B2 (en) | Compensation for ambient sound signals to facilitate adjustment of an audio volume | |
US8781142B2 (en) | Selective acoustic enhancement of ambient sound | |
JP5727025B2 (ja) | 音声アクティビティ検出のための、システム、方法、および装置 | |
KR101260131B1 (ko) | 잡음 감소를 위한 센서 어레이를 사용한 오디오 소스 근접도 추정 | |
JP4247002B2 (ja) | マイクロホンアレイを用いた話者距離検出装置及び方法並びに当該装置を用いた音声入出力装置 | |
JP4922455B2 (ja) | パケット・ネットワークでエコーを検出し、抑制する方法および装置 | |
US20110010172A1 (en) | Noise reduction system using a sensor based speech detector | |
US20120284022A1 (en) | Noise reduction system using a sensor based speech detector | |
JP2013535915A (ja) | 多重マイク位置選択性処理用のシステム、方法、装置、およびコンピュータ可読媒体 | |
CN116324969A (zh) | 具有定位反馈的听力增强和可穿戴系统 | |
WO2023004223A1 (en) | Noise suppression using tandem networks | |
US11445286B1 (en) | Wireless connection management | |
JP2005227511A (ja) | 対象音検出方法、音信号処理装置、音声認識装置及びプログラム | |
US10867619B1 (en) | User voice detection based on acoustic near field | |
JP6973652B2 (ja) | 音声処理装置、方法およびプログラム | |
US20240233741A9 (en) | Controlling local rendering of remote environmental audio | |
US20240135944A1 (en) | Controlling local rendering of remote environmental audio | |
US20120106756A1 (en) | System and method for a noise reduction switch in a communication device | |
WO2024059427A1 (en) | Source speech modification based on an input speech characteristic | |
JP2012175235A (ja) | 遠隔地間コミュニケーション装置、遠隔地間コミュニケーション方法、プログラム | |
JP2011081322A (ja) | 音声認識システム及び音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130924 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131008 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131219 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141014 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150316 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150901 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150930 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5819324 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |