JP2020502593A5 - 音声コマンドを検出及びキャプチャするシステムと方法 - Google Patents

音声コマンドを検出及びキャプチャするシステムと方法 Download PDF

Info

Publication number
JP2020502593A5
JP2020502593A5 JP2019555430A JP2019555430A JP2020502593A5 JP 2020502593 A5 JP2020502593 A5 JP 2020502593A5 JP 2019555430 A JP2019555430 A JP 2019555430A JP 2019555430 A JP2019555430 A JP 2019555430A JP 2020502593 A5 JP2020502593 A5 JP 2020502593A5
Authority
JP
Japan
Prior art keywords
signal
digital audio
audio signal
digital
analog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019555430A
Other languages
English (en)
Other versions
JP2020502593A (ja
JP7129422B2 (ja
Filing date
Publication date
Priority claimed from US15/706,178 external-priority patent/US10403279B2/en
Application filed filed Critical
Publication of JP2020502593A publication Critical patent/JP2020502593A/ja
Publication of JP2020502593A5 publication Critical patent/JP2020502593A5/ja
Application granted granted Critical
Publication of JP7129422B2 publication Critical patent/JP7129422B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (20)

  1. 音声コマンドを検出及びキャプチャするシステムであって、
    ーディオ信号を受信するべく構成された入力部と、
    前記オーディオ信号をデジタルオーディオ信号に変換するべく構成されたアナログデジタル変換器と、
    記デジタルオーディオ信号の振幅を決定する振幅検出器と、
    制御器と
    を含み、
    前記制御器は、
    記デジタルオーディオ信号の振幅を第1しきい値と及び第2しきい値と比較することと、
    記デジタルオーディオ信号の振幅が前記第1しきい値又は前記第2しきい値を超えない場合に割り込み信号を差し控えることと、
    記デジタルオーディオ信号の振幅が前記第1しきい値及び前記第2しきい値を超える場合に前記割り込み信号を生成することと、
    記デジタルオーディオ信号の振幅が前記第1しきい値と前記第2しきい値との間にある場合に前記デジタルオーディオ信号のスペクトル分析をトリガーすることと
    を行うべく構成され、システム。
  2. 前記アナログデジタル変換器は、
    記オーディオ信号がオーディオアクティビティの開始レベルを有するか否かを決定することと、
    記オーディオ信号が前記オーディオアクティビティの開始レベルを有しない場合に前記アナログデジタル変換器を、前記アナログデジタル変換器の変換器部分が前記デジタルオーディオ信号を生成しないスリープモードに置くことと、
    記オーディオ信号が前記オーディオアクティビティの開始レベルを有する場合に前記アナログデジタル変換器を、前記アナログデジタル変換器の変換器部分が前記デジタルオーディオ信号を生成するアクティブモードに置くことと
    を行うべく構成されたウェイクアップ回路を含む、請求項のシステム。
  3. 記オーディオ信号がオーディオアクティビティの開始レベルを有するか否かを決定するべく、前記ウェイクアップ回路は、前記オーディオ信号をウェイクアップ開始しきい値と比較するべく構成される、請求項のシステム。
  4. 前記ウェイクアップ回路は、
    記オーディオ信号をブーストするべく構成されたオーディオプリアンプ利得段と、
    ブーストされた前記オーディオ信号を、前記オーディオアクティビティの開始レベルを示すウェイクアップ開始しきい値と比較するべく構成された比較器段と
    を含む、請求項のシステム。
  5. 前記アナログデジタル変換器の変換器部分は、前記アナログデジタル変換器が前記スリープモードにある場合に電力供給なしとなり、
    前記アナログデジタル変換器の変換器部分は、前記アナログデジタル変換器が前記アクティブモードにある場合に電力供給される、請求項のシステム。
  6. 前記アナログデジタル変換器と前記振幅検出器との間にデシメーションフィルタをさらに含み、
    前記デシメーションフィルタは、前記デジタルオーディオ信号を受信して前記デジタルオーディオ信号を処理し、前記アナログデジタル変換器のサンプリングレートよりも低い低減サンプリングレートを有する低減デジタルオーディオサンプルを生成するべく構成される、請求項のシステム。
  7. サンプリングレートを有するデジタルオーディオ信号を入力として受信して前記デジタルオーディオ信号を、振幅を有するとともに前記デジタルオーディオ信号の前記サンプリングレートよりも低いサンプリングレートを有する結合デジタルオーディオ信号を生成するように処理するべく構成されたサンプル結合ブロックをさらに含む、請求項1のシステム。
  8. 記割り込み信号を受信してトリガーフレーズのために前記デジタルオーディオ信号を分析するべく構成されたデジタル信号プロセッサをさらに含む、請求項1のシステム。
  9. 記デジタルオーディオ信号を受信して先入れ先出しフォーマットで格納するべく構成された音声ランダムアクセスメモリをさらに含み、
    前記音声ランダムアクセスメモリデジタル信号プロセッサによりアクセスされるように構成される、請求項のシステム。
  10. 複数の非同期クロック生成メカニズムを含むクロックシステムをさらに含み、
    前記非同期クロック生成メカニズムはそれぞれが異なる電流消費を有し、
    前記クロックシステムは、前記非同期クロック生成メカニズム間でスイッチングするべく構成される、請求項のシステム。
  11. 音声コマンドを検出及びキャプチャする方法であって、
    音声アクティビティ検出器がデジタルオーディオ信号を受信することと、
    前記音声アクティビティ検出器が前記デジタルオーディオ信号の振幅を決定することと、
    前記音声アクティビティ検出器が前記デジタルオーディオ信号の振幅を第1しきい値と及び第2しきい値と比較することと、
    記デジタルオーディオ信号の振幅が前記第1しきい値又は前記第2しきい値を超えない場合に前記音声アクティビティ検出器が割り込み信号を差し控えることと、
    記デジタルオーディオ信号の振幅が前記第1しきい値及び前記第2しきい値を超える場合に前記音声アクティビティ検出器が前記割り込み信号を生成することと、
    記デジタルオーディオ信号の振幅が前記第1しきい値と前記第2しきい値との間にある場合に前記音声アクティビティ検出器が前記デジタルオーディオ信号のスペクトル分析を行うことと
    を含む、方法。
  12. アナログデジタル変換器がオーディオ信号を受信することと、
    記オーディオ信号がオーディオアクティビティの開始レベルを有するか否かをウェイクアップ回路が決定することと、
    記オーディオ信号が前記オーディオアクティビティの開始レベルを有しない場合に前記アナログデジタル変換器を、前記アナログデジタル変換器の変換器部分がデジタルオーディオ信号を生成しないスリープモードに置くことと、
    記オーディオ信号が前記オーディオアクティビティの開始レベルを有する場合に前記アナログデジタル変換器を、前記アナログデジタル変換器の変換器部分が、デジタルオーディオ信号を前記オーディオ信号からアナログデジタル変換器サンプリングレートで生成するアクティブモードに置くことと
    をさらに含む、請求項11の方法。
  13. 記オーディオ信号がオーディオアクティビティの開始レベルを有するか否かをウェイクアップ回路が決定することは、前記オーディオ信号をウェイクアップ開始しきい値と比較することを含む、請求項12の方法。
  14. 前記アナログデジタル変換器が前記スリープモードにある場合に前記アナログデジタル変換器の変換器部分に電力供給をしないことと、
    前記アナログデジタル変換器が前記アクティブモードにある場合に前記アナログデジタル変換器の変換器部分に電力供給をすることと
    をさらに含む、請求項12の方法。
  15. デジタル信号プロセッサが記割り込み信号を前記音声アクティビティ検出器から受信することと、
    前記デジタル信号プロセッサトリガーフレーズを検出するべく記デジタルオーディオ信号を分析することと
    をさらに含む、請求項12の方法。
  16. 音声ランダムアクセスメモリが記デジタルオーディオ信号を受信して先入れ先出しフォーマットで格納することと、
    前記デジタル信号プロセッサ前記トリガーフレーズを検出する場合に前記トリガーフレーズのエンドポイント前の前記音声ランダムアクセスメモリにおけるすべてのデータを破棄することと
    をさらに含む、請求項15の方法。
  17. 前記デジタル信号プロセッサがトリガーフレーズを検出する場合に、前記トリガーフレーズ後の予め特定されたタイムアウトの間にユーザが話したか否かを決定することをさらに含む、請求項15の方法。
  18. 音声アクティビティ検出器であって、
    デジタルオーディオ信号を受信するべく構成された入力部と、
    前記デジタルオーディオ信号の振幅を決定するべく構成された振幅検出器と、
    コントローラと、
    スペクトル分析器と
    を含み、
    前記コントローラは、
    前記デジタルオーディオ信号の振幅が第1しきい値又は第2しきい値を超えない場合に割り込み信号を差し控えることと、
    前記デジタルオーディオ信号の振幅が前記第1しきい値及び前記第2しきい値を超える場合に前記割り込み信号を生成することと、
    前記デジタルオーディオ信号の振幅が前記第1しきい値と前記第2しきい値との間にある場合に前記デジタルオーディオ信号のスペクトル分析をトリガーすることと
    を行うべく構成され、
    前記スペクトル分析器は、前記コントローラに前記割り込み信号を生成するべきか否かを命令するべく前記デジタルオーディオ信号のスペクトル分析を行うべく構成される、音声アクティビティ検出器。
  19. サンプリングレートを有するデジタルオーディオ信号を入力として受信して前記デジタルオーディオ信号を、振幅を有するとともに前記デジタルオーディオ信号の前記サンプリングレートよりも低いサンプリングレートを有する結合デジタルオーディオ信号を生成するように処理するべく構成されたサンプル結合器をさらに含む、請求項18の音声アクティビティ検出器。
  20. 前記スペクトル分析は、
    前記サンプル結合から前記結合デジタルオーディオ信号を受信して前記結合デジタルオーディオ信号を格納するべく構成された音声アクティビティ検出器ランダムアクセスメモリと
    前記音声アクティビティ検出器ランダムアクセスメモリに格納された前記結合デジタルオーディオ信号の高速フーリエ変換を行って高速フーリエ変換結果を出力するべく構成された高速フーリエ変換ブロックと、
    前記高速フーリエ変換結果の平均振幅を決定するべく構成されたスペクトルローパスフィルタと
    前記スペクトルローパスフィルタの結果を評価し、前記スペクトルローパスフィルタの結果の評価に基づいて前記割り込み信号を生成するか又は引き続いて前記割り込み信号を差し控えるかするように前記コントローラに信号を送るべく構成されたスペクトルコントローラ
    を含む、請求項19音声アクティビティ検出器
JP2019555430A 2016-12-21 2017-12-20 音声コマンドを検出及びキャプチャするシステムと方法 Active JP7129422B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662437598P 2016-12-21 2016-12-21
US62/437,598 2016-12-21
US15/706,178 2017-09-15
US15/706,178 US10403279B2 (en) 2016-12-21 2017-09-15 Low-power, always-listening, voice command detection and capture
PCT/US2017/067712 WO2018119138A1 (en) 2016-12-21 2017-12-20 Low-power, always-listening, voice-command detection and capture

Publications (3)

Publication Number Publication Date
JP2020502593A JP2020502593A (ja) 2020-01-23
JP2020502593A5 true JP2020502593A5 (ja) 2021-02-04
JP7129422B2 JP7129422B2 (ja) 2022-09-01

Family

ID=62562629

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019555430A Active JP7129422B2 (ja) 2016-12-21 2017-12-20 音声コマンドを検出及びキャプチャするシステムと方法

Country Status (8)

Country Link
US (1) US10403279B2 (ja)
JP (1) JP7129422B2 (ja)
KR (1) KR102501601B1 (ja)
CN (1) CN110520927A (ja)
DE (1) DE112017006411T5 (ja)
GB (1) GB2573424B (ja)
TW (1) TW201835895A (ja)
WO (1) WO2018119138A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3602544A4 (en) 2017-03-23 2020-02-05 Joyson Safety Systems Acquisition LLC SYSTEM AND METHOD FOR CORRELATION OF MOUTH IMAGES WITH INPUT COMMANDS
US11189273B2 (en) * 2017-06-29 2021-11-30 Amazon Technologies, Inc. Hands free always on near field wakeword solution
WO2019079974A1 (en) * 2017-10-24 2019-05-02 Beijing Didi Infinity Technology And Development Co., Ltd. SYSTEM AND METHOD FOR UNINTERRUPTED APPLICATION REVIEW AND VOICE RECOGNITION
CN107808670B (zh) * 2017-10-25 2021-05-14 百度在线网络技术(北京)有限公司 语音数据处理方法、装置、设备及存储介质
US10916252B2 (en) * 2017-11-10 2021-02-09 Nvidia Corporation Accelerated data transfer for latency reduction and real-time processing
US20190237067A1 (en) * 2018-01-31 2019-08-01 Toyota Motor Engineering & Manufacturing North America, Inc. Multi-channel voice recognition for a vehicle environment
US10332543B1 (en) * 2018-03-12 2019-06-25 Cypress Semiconductor Corporation Systems and methods for capturing noise for pattern recognition processing
DE102018212902A1 (de) * 2018-08-02 2020-02-06 Bayerische Motoren Werke Aktiengesellschaft Verfahren zum Bestimmen eines digitalen Assistenten zum Ausführen einer Fahrzeugfunktion aus einer Vielzahl von digitalen Assistenten in einem Fahrzeug, computerlesbares Medium, System, und Fahrzeug
US10861457B2 (en) * 2018-10-26 2020-12-08 Ford Global Technologies, Llc Vehicle digital assistant authentication
CN112740321A (zh) * 2018-11-20 2021-04-30 深圳市欢太科技有限公司 唤醒设备的方法、装置、存储介质及电子设备
CN111261143B (zh) * 2018-12-03 2024-03-22 嘉楠明芯(北京)科技有限公司 一种语音唤醒方法、装置及计算机可读存储介质
TWI713016B (zh) * 2019-01-03 2020-12-11 瑞昱半導體股份有限公司 語音偵測處理系統與語音偵測方法
CN111414071B (zh) * 2019-01-07 2021-11-02 瑞昱半导体股份有限公司 处理系统与语音检测方法
TWI684912B (zh) * 2019-01-08 2020-02-11 瑞昱半導體股份有限公司 語音喚醒裝置及方法
US11650625B1 (en) * 2019-06-28 2023-05-16 Amazon Technologies, Inc. Multi-sensor wearable device with audio processing
CN110196914B (zh) * 2019-07-29 2019-12-27 上海肇观电子科技有限公司 一种将人脸信息录入数据库的方法和装置
US11380321B2 (en) 2019-08-01 2022-07-05 Semiconductor Components Industries, Llc Methods and apparatus for a voice detector
CN110890104B (zh) * 2019-11-26 2022-05-03 思必驰科技股份有限公司 语音端点检测方法及系统
KR20210112726A (ko) * 2020-03-06 2021-09-15 엘지전자 주식회사 차량의 좌석별로 대화형 비서를 제공하는 방법
CN111816216A (zh) * 2020-08-25 2020-10-23 苏州思必驰信息科技有限公司 语音活性检测方法和装置
KR20220059629A (ko) * 2020-11-03 2022-05-10 현대자동차주식회사 차량 및 그의 제어방법
EP4260013A2 (en) * 2020-12-09 2023-10-18 Cerence Operating Company Automotive infotainment system with spatially-cognizant applications that interact with a speech interface
CN113470660A (zh) * 2021-05-31 2021-10-01 翱捷科技(深圳)有限公司 一种基于路由器流量的语音唤醒阈值调整方法及系统
CN115547312B (zh) * 2022-11-30 2023-03-21 深圳时识科技有限公司 带活动检测的预处理器、芯片和电子设备

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61156298A (ja) * 1984-12-28 1986-07-15 日本電気株式会社 時定数を変動させる可変閾値型音声検出器
JP3674990B2 (ja) * 1995-08-21 2005-07-27 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
US7031916B2 (en) 2001-06-01 2006-04-18 Texas Instruments Incorporated Method for converging a G.729 Annex B compliant voice activity detection circuit
US7606330B2 (en) * 2002-09-27 2009-10-20 Broadcom Corporation Dual-rate single band communication system
CN100548060C (zh) 2006-02-06 2009-10-07 海信集团有限公司 Tetra集群手机语音处理方法
US8311814B2 (en) * 2006-09-19 2012-11-13 Avaya Inc. Efficient voice activity detector to detect fixed power signals
WO2010078386A1 (en) * 2008-12-30 2010-07-08 Raymond Koverzin Power-optimized wireless communications device
KR20200074260A (ko) * 2011-12-07 2020-06-24 퀄컴 인코포레이티드 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로
US9142215B2 (en) * 2012-06-15 2015-09-22 Cypress Semiconductor Corporation Power-efficient voice activation
CN103578470B (zh) * 2012-08-09 2019-10-18 科大讯飞股份有限公司 一种电话录音数据的处理方法及系统
DE212014000045U1 (de) 2013-02-07 2015-09-24 Apple Inc. Sprach-Trigger für einen digitalen Assistenten
US9697831B2 (en) 2013-06-26 2017-07-04 Cirrus Logic, Inc. Speech recognition
WO2015048254A1 (en) * 2013-09-25 2015-04-02 Robert Bosch Gmbh Speech detection circuit and method
KR102018152B1 (ko) * 2014-03-31 2019-09-04 인텔 코포레이션 항상-온-항상-청취 음성 인식 시스템을 위한 위치 인식 전력 관리 스킴
TWI569263B (zh) 2015-04-30 2017-02-01 智原科技股份有限公司 聲頻訊號的訊號擷取方法與裝置

Similar Documents

Publication Publication Date Title
JP2020502593A5 (ja) 音声コマンドを検出及びキャプチャするシステムと方法
JP7129422B2 (ja) 音声コマンドを検出及びキャプチャするシステムと方法
US10824391B2 (en) Audio user interface apparatus and method
TWI474317B (zh) 訊號處理裝置以及訊號處理方法
US9349386B2 (en) System and method for processor wake-up based on sensor data
KR102335717B1 (ko) 음성 제어 시스템 및 그 웨이크업 방법, 웨이크업 장치 및 가전제품, 코프로세서
US9775113B2 (en) Voice wakeup detecting device with digital microphone and associated method
US9779725B2 (en) Voice wakeup detecting device and method
US9406313B2 (en) Adaptive microphone sampling rate techniques
US20160135047A1 (en) User terminal and method for unlocking same
US20170287480A1 (en) Voice wake-up method and device
US20160212527A1 (en) Duty-cycling microphone/sensor for acoustic analysis
CN103543814A (zh) 信号处理装置以及信号处理方法
US11437022B2 (en) Performing speaker change detection and speaker recognition on a trigger phrase
CN106504756B (zh) 嵌入式语音识别系统及方法
US11250849B2 (en) Voice wake-up detection from syllable and frequency characteristic
JP4931927B2 (ja) マイクロコントローラーを利用した信号認識法
US11758334B2 (en) Acoustic activity detection
JP2007206154A (ja) 実環境騒音下の音声区間の検出
CN114141272A (zh) 声音事件侦测系统及方法
hao Design of Speech Remote Control Intelligent Power Supply Based on STM32
Wang et al. Design of speech recognition system
CN101258537A (zh) 使用低成本微控制器的信号识别方法
KR20200090441A (ko) 신규 발생 음향에 기초한 위험 상황 검출 방법 및 장치
JPS628200A (ja) 音声分析方式