JP7129422B2 - 音声コマンドを検出及びキャプチャするシステムと方法 - Google Patents
音声コマンドを検出及びキャプチャするシステムと方法 Download PDFInfo
- Publication number
- JP7129422B2 JP7129422B2 JP2019555430A JP2019555430A JP7129422B2 JP 7129422 B2 JP7129422 B2 JP 7129422B2 JP 2019555430 A JP2019555430 A JP 2019555430A JP 2019555430 A JP2019555430 A JP 2019555430A JP 7129422 B2 JP7129422 B2 JP 7129422B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- digital
- digital audio
- amplitude
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 54
- 230000005236 sound signal Effects 0.000 claims description 117
- 230000000694 effects Effects 0.000 claims description 46
- 230000007246 mechanism Effects 0.000 claims description 34
- 230000003595 spectral effect Effects 0.000 claims description 28
- 238000010183 spectrum analysis Methods 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 23
- 238000005070 sampling Methods 0.000 claims description 18
- 230000000977 initiatory effect Effects 0.000 claims description 7
- 238000001228 spectrum Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 description 36
- 239000000872 buffer Substances 0.000 description 11
- 238000012545 processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 230000001143 conditioned effect Effects 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 101100458289 Drosophila melanogaster msps gene Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011010 flushing procedure Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M3/00—Conversion of analogue values to or from differential modulation
- H03M3/30—Delta-sigma modulation
- H03M3/458—Analogue/digital converters using delta-sigma modulation as an intermediate step
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Telephone Function (AREA)
Description
Claims (20)
- 音声コマンドを検出及びキャプチャするシステムであって、
オーディオ信号を受信するべく構成された入力部と、
前記オーディオ信号をデジタルオーディオ信号に変換するべく構成されたアナログデジタル変換器と、
前記デジタルオーディオ信号の振幅を決定する振幅検出器と、
制御器と
を含み、
前記制御器は、
前記デジタルオーディオ信号の振幅を第1しきい値と及び第2しきい値と比較することと、
前記デジタルオーディオ信号の振幅が前記第1しきい値及び前記第2しきい値を超えない場合に割り込み信号を差し控えることと、
前記デジタルオーディオ信号の振幅が前記第1しきい値及び前記第2しきい値を超える場合に前記割り込み信号を生成することと、
前記デジタルオーディオ信号の振幅が前記第1しきい値と前記第2しきい値との間にある場合に前記デジタルオーディオ信号のスペクトル分析をトリガーすることと
を行うべく構成される、システム。 - 前記アナログデジタル変換器は、
前記オーディオ信号がオーディオアクティビティの開始レベルを有するか否かを決定することと、
前記オーディオ信号が前記オーディオアクティビティの開始レベルを有しない場合に前記アナログデジタル変換器を、前記アナログデジタル変換器の変換器部分が前記デジタルオーディオ信号を生成しないスリープモードに置くことと、
前記オーディオ信号が前記オーディオアクティビティの開始レベルを有する場合に前記アナログデジタル変換器を、前記アナログデジタル変換器の変換器部分が前記デジタルオーディオ信号を生成するアクティブモードに置くことと
を行うべく構成されたウェイクアップ回路を含む、請求項1のシステム。 - 前記オーディオ信号がオーディオアクティビティの開始レベルを有するか否かを決定するべく、前記ウェイクアップ回路は、前記オーディオ信号をウェイクアップ開始しきい値と比較するべく構成される、請求項2のシステム。
- 前記ウェイクアップ回路は、
前記オーディオ信号をブーストするべく構成されたオーディオプリアンプ利得段と、
ブーストされた前記オーディオ信号を、前記オーディオアクティビティの開始レベルを示すウェイクアップ開始しきい値と比較するべく構成された比較器段と
を含む、請求項2のシステム。 - 前記アナログデジタル変換器の変換器部分は、前記アナログデジタル変換器が前記スリープモードにある場合に電力供給なしとなり、
前記アナログデジタル変換器の変換器部分は、前記アナログデジタル変換器が前記アクティブモードにある場合に電力供給される、請求項2のシステム。 - 前記アナログデジタル変換器と前記振幅検出器との間にデシメーションフィルタをさらに含み、
前記デシメーションフィルタは、前記デジタルオーディオ信号を受信して前記デジタルオーディオ信号を処理し、前記アナログデジタル変換器のサンプリングレートよりも低い低減サンプリングレートを有する低減デジタルオーディオサンプルを生成するべく構成される、請求項1のシステム。 - サンプリングレートを有するデジタルオーディオ信号を入力として受信して前記デジタルオーディオ信号を、振幅を有するとともに前記デジタルオーディオ信号の前記サンプリングレートよりも低いサンプリングレートを有する結合デジタルオーディオ信号を生成するように処理するべく構成されたサンプル結合ブロックをさらに含む、請求項1のシステム。
- 前記割り込み信号を受信してトリガーフレーズのために前記デジタルオーディオ信号を分析するべく構成されたデジタル信号プロセッサをさらに含む、請求項1のシステム。
- 前記デジタルオーディオ信号を受信して先入れ先出しフォーマットで格納するべく構成された音声ランダムアクセスメモリをさらに含み、
前記音声ランダムアクセスメモリはデジタル信号プロセッサによりアクセスされるように構成される、請求項8のシステム。 - 複数の非同期クロック生成メカニズムを含むクロックシステムをさらに含み、
前記非同期クロック生成メカニズムはそれぞれが異なる電流消費を有し、
前記クロックシステムは、前記非同期クロック生成メカニズム間でスイッチングするべく構成される、請求項8のシステム。 - 音声コマンドを検出及びキャプチャする方法であって、
音声アクティビティ検出器がデジタルオーディオ信号を受信することと、
前記音声アクティビティ検出器が前記デジタルオーディオ信号の振幅を決定することと、
前記音声アクティビティ検出器が前記デジタルオーディオ信号の振幅を第1しきい値と及び第2しきい値と比較することと、
前記デジタルオーディオ信号の振幅が前記第1しきい値及び前記第2しきい値を超えない場合に前記音声アクティビティ検出器が割り込み信号を差し控えることと、
前記デジタルオーディオ信号の振幅が前記第1しきい値及び前記第2しきい値を超える場合に前記音声アクティビティ検出器が前記割り込み信号を生成することと、
前記デジタルオーディオ信号の振幅が前記第1しきい値と前記第2しきい値との間にある場合に前記音声アクティビティ検出器が前記デジタルオーディオ信号のスペクトル分析を行うことと
を含む、方法。 - アナログデジタル変換器がオーディオ信号を受信することと、
前記オーディオ信号がオーディオアクティビティの開始レベルを有するか否かをウェイクアップ回路が決定することと、
前記オーディオ信号が前記オーディオアクティビティの開始レベルを有しない場合に前記アナログデジタル変換器を、前記アナログデジタル変換器の変換器部分がデジタルオーディオ信号を生成しないスリープモードに置くことと、
前記オーディオ信号が前記オーディオアクティビティの開始レベルを有する場合に前記アナログデジタル変換器を、前記アナログデジタル変換器の変換器部分が、デジタルオーディオ信号を前記オーディオ信号からアナログデジタル変換器サンプリングレートで生成するアクティブモードに置くことと
をさらに含む、請求項11の方法。 - 前記オーディオ信号がオーディオアクティビティの開始レベルを有するか否かをウェイクアップ回路が決定することは、前記オーディオ信号をウェイクアップ開始しきい値と比較することを含む、請求項12の方法。
- 前記アナログデジタル変換器が前記スリープモードにある場合に前記アナログデジタル変換器の変換器部分に電力供給をしないことと、
前記アナログデジタル変換器が前記アクティブモードにある場合に前記アナログデジタル変換器の変換器部分に電力供給をすることと
をさらに含む、請求項12の方法。 - デジタル信号プロセッサが前記割り込み信号を前記音声アクティビティ検出器から受信することと、
前記デジタル信号プロセッサが、トリガーフレーズを検出するべく、前記デジタルオーディオ信号を分析することと
をさらに含む、請求項12の方法。 - 音声ランダムアクセスメモリが前記デジタルオーディオ信号を受信して先入れ先出しフォーマットで格納することと、
前記デジタル信号プロセッサが前記トリガーフレーズを検出する場合に前記トリガーフレーズのエンドポイント前の前記音声ランダムアクセスメモリにおけるすべてのデータを破棄することと
をさらに含む、請求項15の方法。 - 前記デジタル信号プロセッサがトリガーフレーズを検出する場合に、前記トリガーフレーズの後の予め特定されたタイムアウトの間にユーザが話したか否かを決定することをさらに含む、請求項15の方法。
- 音声アクティビティ検出器であって、
デジタルオーディオ信号を受信するべく構成された入力部と、
前記デジタルオーディオ信号の振幅を決定するべく構成された振幅検出器と、
コントローラと、
スペクトル分析器と
を含み、
前記コントローラは、
前記デジタルオーディオ信号の振幅が第1しきい値及び第2しきい値を超えない場合に割り込み信号を差し控えることと、
前記デジタルオーディオ信号の振幅が前記第1しきい値及び前記第2しきい値を超える場合に前記割り込み信号を生成することと、
前記デジタルオーディオ信号の振幅が前記第1しきい値と前記第2しきい値との間にある場合に前記デジタルオーディオ信号のスペクトル分析をトリガーすることと
を行うべく構成され、
前記スペクトル分析器は、前記コントローラに前記割り込み信号を生成するべきか否かを命令するべく前記デジタルオーディオ信号のスペクトル分析を行うべく構成される、音声アクティビティ検出器。 - サンプリングレートを有するデジタルオーディオ信号を入力として受信して前記デジタルオーディオ信号を、振幅を有するとともに前記デジタルオーディオ信号の前記サンプリングレートよりも低いサンプリングレートを有する結合デジタルオーディオ信号を生成するように処理するべく構成されたサンプル結合器をさらに含む、請求項18の音声アクティビティ検出器。
- 前記スペクトル分析器は、
前記サンプル結合器から前記結合デジタルオーディオ信号を受信して前記結合デジタルオーディオ信号を格納するべく構成された音声アクティビティ検出器ランダムアクセスメモリと、
前記音声アクティビティ検出器ランダムアクセスメモリに格納された前記結合デジタルオーディオ信号の高速フーリエ変換を行って高速フーリエ変換結果を出力するべく構成された高速フーリエ変換ブロックと、
前記高速フーリエ変換結果の平均振幅を決定するべく構成されたスペクトルローパスフィルタと、
前記スペクトルローパスフィルタの結果を評価し、前記スペクトルローパスフィルタの結果の評価に基づいて前記割り込み信号を生成するか又は引き続いて前記割り込み信号を差し控えるかするように前記コントローラに信号を送るべく構成されたスペクトルコントローラと
を含む、請求項19の音声アクティビティ検出器。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662437598P | 2016-12-21 | 2016-12-21 | |
US62/437,598 | 2016-12-21 | ||
US15/706,178 | 2017-09-15 | ||
US15/706,178 US10403279B2 (en) | 2016-12-21 | 2017-09-15 | Low-power, always-listening, voice command detection and capture |
PCT/US2017/067712 WO2018119138A1 (en) | 2016-12-21 | 2017-12-20 | Low-power, always-listening, voice-command detection and capture |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020502593A JP2020502593A (ja) | 2020-01-23 |
JP2020502593A5 JP2020502593A5 (ja) | 2021-02-04 |
JP7129422B2 true JP7129422B2 (ja) | 2022-09-01 |
Family
ID=62562629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019555430A Active JP7129422B2 (ja) | 2016-12-21 | 2017-12-20 | 音声コマンドを検出及びキャプチャするシステムと方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US10403279B2 (ja) |
JP (1) | JP7129422B2 (ja) |
KR (1) | KR102501601B1 (ja) |
CN (1) | CN110520927A (ja) |
DE (1) | DE112017006411T5 (ja) |
GB (1) | GB2573424B (ja) |
TW (1) | TW201835895A (ja) |
WO (1) | WO2018119138A1 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7337699B2 (ja) * | 2017-03-23 | 2023-09-04 | ジョイソン セイフティ システムズ アクイジション エルエルシー | 口の画像を入力コマンドと相互に関連付けるシステム及び方法 |
US11189273B2 (en) * | 2017-06-29 | 2021-11-30 | Amazon Technologies, Inc. | Hands free always on near field wakeword solution |
CN110800045B (zh) * | 2017-10-24 | 2024-09-20 | 北京嘀嘀无限科技发展有限公司 | 用于不间断应用唤醒和语音识别的系统和方法 |
CN107808670B (zh) * | 2017-10-25 | 2021-05-14 | 百度在线网络技术(北京)有限公司 | 语音数据处理方法、装置、设备及存储介质 |
US10916252B2 (en) * | 2017-11-10 | 2021-02-09 | Nvidia Corporation | Accelerated data transfer for latency reduction and real-time processing |
US20190237067A1 (en) * | 2018-01-31 | 2019-08-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Multi-channel voice recognition for a vehicle environment |
US10332543B1 (en) * | 2018-03-12 | 2019-06-25 | Cypress Semiconductor Corporation | Systems and methods for capturing noise for pattern recognition processing |
DE102018212902A1 (de) * | 2018-08-02 | 2020-02-06 | Bayerische Motoren Werke Aktiengesellschaft | Verfahren zum Bestimmen eines digitalen Assistenten zum Ausführen einer Fahrzeugfunktion aus einer Vielzahl von digitalen Assistenten in einem Fahrzeug, computerlesbares Medium, System, und Fahrzeug |
US10861457B2 (en) * | 2018-10-26 | 2020-12-08 | Ford Global Technologies, Llc | Vehicle digital assistant authentication |
CN112740321A (zh) * | 2018-11-20 | 2021-04-30 | 深圳市欢太科技有限公司 | 唤醒设备的方法、装置、存储介质及电子设备 |
CN111261143B (zh) * | 2018-12-03 | 2024-03-22 | 嘉楠明芯(北京)科技有限公司 | 一种语音唤醒方法、装置及计算机可读存储介质 |
TWI713016B (zh) * | 2019-01-03 | 2020-12-11 | 瑞昱半導體股份有限公司 | 語音偵測處理系統與語音偵測方法 |
CN111414071B (zh) * | 2019-01-07 | 2021-11-02 | 瑞昱半导体股份有限公司 | 处理系统与语音检测方法 |
TWI684912B (zh) * | 2019-01-08 | 2020-02-11 | 瑞昱半導體股份有限公司 | 語音喚醒裝置及方法 |
US11650625B1 (en) * | 2019-06-28 | 2023-05-16 | Amazon Technologies, Inc. | Multi-sensor wearable device with audio processing |
CN110196914B (zh) * | 2019-07-29 | 2019-12-27 | 上海肇观电子科技有限公司 | 一种将人脸信息录入数据库的方法和装置 |
US11380321B2 (en) | 2019-08-01 | 2022-07-05 | Semiconductor Components Industries, Llc | Methods and apparatus for a voice detector |
CN110890104B (zh) * | 2019-11-26 | 2022-05-03 | 思必驰科技股份有限公司 | 语音端点检测方法及系统 |
KR20210112726A (ko) * | 2020-03-06 | 2021-09-15 | 엘지전자 주식회사 | 차량의 좌석별로 대화형 비서를 제공하는 방법 |
CN111816216A (zh) * | 2020-08-25 | 2020-10-23 | 苏州思必驰信息科技有限公司 | 语音活性检测方法和装置 |
CN112382312A (zh) * | 2020-09-23 | 2021-02-19 | 福建信通慧安科技有限公司 | 目标探测器及目标探测方法 |
KR20220059629A (ko) * | 2020-11-03 | 2022-05-10 | 현대자동차주식회사 | 차량 및 그의 제어방법 |
US12086501B2 (en) * | 2020-12-09 | 2024-09-10 | Cerence Operating Company | Automotive infotainment system with spatially-cognizant applications that interact with a speech interface |
US20220208185A1 (en) * | 2020-12-24 | 2022-06-30 | Cerence Operating Company | Speech Dialog System for Multiple Passengers in a Car |
CN113470660A (zh) * | 2021-05-31 | 2021-10-01 | 翱捷科技(深圳)有限公司 | 一种基于路由器流量的语音唤醒阈值调整方法及系统 |
CN114125676A (zh) * | 2022-01-10 | 2022-03-01 | 苏州芯仪微电子科技有限公司 | 信号处理asic电路及微机电系统骨振动传感器 |
CN115019835A (zh) * | 2022-05-27 | 2022-09-06 | 江西省天轴通讯有限公司 | 一种设备智能管理方法、系统、存储介质及设备 |
CN115547312B (zh) * | 2022-11-30 | 2023-03-21 | 深圳时识科技有限公司 | 带活动检测的预处理器、芯片和电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016508007A (ja) | 2013-02-07 | 2016-03-10 | アップル インコーポレイテッド | デジタルアシスタントのためのボイストリガ |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61156298A (ja) * | 1984-12-28 | 1986-07-15 | 日本電気株式会社 | 時定数を変動させる可変閾値型音声検出器 |
JP3674990B2 (ja) * | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
US7031916B2 (en) | 2001-06-01 | 2006-04-18 | Texas Instruments Incorporated | Method for converging a G.729 Annex B compliant voice activity detection circuit |
US7606330B2 (en) * | 2002-09-27 | 2009-10-20 | Broadcom Corporation | Dual-rate single band communication system |
CN100548060C (zh) | 2006-02-06 | 2009-10-07 | 海信集团有限公司 | Tetra集群手机语音处理方法 |
US8311814B2 (en) * | 2006-09-19 | 2012-11-13 | Avaya Inc. | Efficient voice activity detector to detect fixed power signals |
WO2010078386A1 (en) * | 2008-12-30 | 2010-07-08 | Raymond Koverzin | Power-optimized wireless communications device |
KR20160036104A (ko) * | 2011-12-07 | 2016-04-01 | 퀄컴 인코포레이티드 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
US9142215B2 (en) * | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
CN103578470B (zh) * | 2012-08-09 | 2019-10-18 | 科大讯飞股份有限公司 | 一种电话录音数据的处理方法及系统 |
US9697831B2 (en) * | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
US20150356982A1 (en) * | 2013-09-25 | 2015-12-10 | Robert Bosch Gmbh | Speech detection circuit and method |
US10133332B2 (en) * | 2014-03-31 | 2018-11-20 | Intel Corporation | Location aware power management scheme for always-on-always-listen voice recognition system |
TWI569263B (zh) | 2015-04-30 | 2017-02-01 | 智原科技股份有限公司 | 聲頻訊號的訊號擷取方法與裝置 |
-
2017
- 2017-09-15 US US15/706,178 patent/US10403279B2/en active Active
- 2017-12-20 GB GB1909295.6A patent/GB2573424B/en active Active
- 2017-12-20 WO PCT/US2017/067712 patent/WO2018119138A1/en active Application Filing
- 2017-12-20 KR KR1020197021179A patent/KR102501601B1/ko active IP Right Grant
- 2017-12-20 CN CN201780086471.0A patent/CN110520927A/zh active Pending
- 2017-12-20 JP JP2019555430A patent/JP7129422B2/ja active Active
- 2017-12-20 DE DE112017006411.2T patent/DE112017006411T5/de active Pending
- 2017-12-20 TW TW106144833A patent/TW201835895A/zh unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016508007A (ja) | 2013-02-07 | 2016-03-10 | アップル インコーポレイテッド | デジタルアシスタントのためのボイストリガ |
Also Published As
Publication number | Publication date |
---|---|
CN110520927A (zh) | 2019-11-29 |
GB201909295D0 (en) | 2019-08-14 |
GB2573424B (en) | 2022-06-29 |
WO2018119138A1 (en) | 2018-06-28 |
KR102501601B1 (ko) | 2023-02-17 |
GB2573424A (en) | 2019-11-06 |
US20180174583A1 (en) | 2018-06-21 |
US10403279B2 (en) | 2019-09-03 |
DE112017006411T5 (de) | 2019-09-05 |
TW201835895A (zh) | 2018-10-01 |
KR20190100270A (ko) | 2019-08-28 |
JP2020502593A (ja) | 2020-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7129422B2 (ja) | 音声コマンドを検出及びキャプチャするシステムと方法 | |
US11735175B2 (en) | Apparatus and method for power efficient signal conditioning for a voice recognition system | |
US10824391B2 (en) | Audio user interface apparatus and method | |
US20140358552A1 (en) | Low-power voice gate for device wake-up | |
US9613626B2 (en) | Audio device for recognizing key phrases and method thereof | |
US9775113B2 (en) | Voice wakeup detecting device with digital microphone and associated method | |
US9043211B2 (en) | Low power activation of a voice activated device | |
US9959865B2 (en) | Information processing method with voice recognition | |
TW201519222A (zh) | 聲音活動偵測裝置和方法 | |
US9406313B2 (en) | Adaptive microphone sampling rate techniques | |
US8972252B2 (en) | Signal processing apparatus having voice activity detection unit and related signal processing methods | |
JP2020502593A5 (ja) | 音声コマンドを検出及びキャプチャするシステムと方法 | |
CN111837179B (zh) | 捕获噪声用于模式识别处理的系统和方法 | |
JP2011039222A (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
Chelloug et al. | Robust Voice Activity Detection Against Non Homogeneous Noisy Environments | |
KR20220151660A (ko) | 노이즈에 강건한 키워드 스포팅을 위한 캐스케이드 아키텍처 | |
CN117594041A (zh) | 用于分级唤醒词语检测的系统、方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201218 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220418 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220816 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220822 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7129422 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |