JP2020502593A5 - 音声コマンドを検出及びキャプチャするシステムと方法 - Google Patents
音声コマンドを検出及びキャプチャするシステムと方法 Download PDFInfo
- Publication number
- JP2020502593A5 JP2020502593A5 JP2019555430A JP2019555430A JP2020502593A5 JP 2020502593 A5 JP2020502593 A5 JP 2020502593A5 JP 2019555430 A JP2019555430 A JP 2019555430A JP 2019555430 A JP2019555430 A JP 2019555430A JP 2020502593 A5 JP2020502593 A5 JP 2020502593A5
- Authority
- JP
- Japan
- Prior art keywords
- signal
- digital audio
- audio signal
- digital
- analog
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims 43
- 230000000694 effects Effects 0.000 claims 22
- 238000005070 sampling Methods 0.000 claims 9
- 230000003595 spectral Effects 0.000 claims 4
- 238000010183 spectrum analysis Methods 0.000 claims 4
- 238000001228 spectrum Methods 0.000 claims 3
- 238000000034 method Methods 0.000 claims 2
- 230000001808 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 238000011156 evaluation Methods 0.000 claims 1
Claims (20)
- 音声コマンドを検出及びキャプチャするシステムであって、
オーディオ信号を受信するべく構成された入力部と、
前記オーディオ信号をデジタルオーディオ信号に変換するべく構成されたアナログデジタル変換器と、
前記デジタルオーディオ信号の振幅を決定する振幅検出器と、
制御器と
を含み、
前記制御器は、
前記デジタルオーディオ信号の振幅を第1しきい値と及び第2しきい値と比較することと、
前記デジタルオーディオ信号の振幅が前記第1しきい値又は前記第2しきい値を超えない場合に割り込み信号を差し控えることと、
前記デジタルオーディオ信号の振幅が前記第1しきい値及び前記第2しきい値を超える場合に前記割り込み信号を生成することと、
前記デジタルオーディオ信号の振幅が前記第1しきい値と前記第2しきい値との間にある場合に前記デジタルオーディオ信号のスペクトル分析をトリガーすることと
を行うべく構成される、システム。 - 前記アナログデジタル変換器は、
前記オーディオ信号がオーディオアクティビティの開始レベルを有するか否かを決定することと、
前記オーディオ信号が前記オーディオアクティビティの開始レベルを有しない場合に前記アナログデジタル変換器を、前記アナログデジタル変換器の変換器部分が前記デジタルオーディオ信号を生成しないスリープモードに置くことと、
前記オーディオ信号が前記オーディオアクティビティの開始レベルを有する場合に前記アナログデジタル変換器を、前記アナログデジタル変換器の変換器部分が前記デジタルオーディオ信号を生成するアクティブモードに置くことと
を行うべく構成されたウェイクアップ回路を含む、請求項1のシステム。 - 前記オーディオ信号がオーディオアクティビティの開始レベルを有するか否かを決定するべく、前記ウェイクアップ回路は、前記オーディオ信号をウェイクアップ開始しきい値と比較するべく構成される、請求項2のシステム。
- 前記ウェイクアップ回路は、
前記オーディオ信号をブーストするべく構成されたオーディオプリアンプ利得段と、
ブーストされた前記オーディオ信号を、前記オーディオアクティビティの開始レベルを示すウェイクアップ開始しきい値と比較するべく構成された比較器段と
を含む、請求項2のシステム。 - 前記アナログデジタル変換器の変換器部分は、前記アナログデジタル変換器が前記スリープモードにある場合に電力供給なしとなり、
前記アナログデジタル変換器の変換器部分は、前記アナログデジタル変換器が前記アクティブモードにある場合に電力供給される、請求項2のシステム。 - 前記アナログデジタル変換器と前記振幅検出器との間にデシメーションフィルタをさらに含み、
前記デシメーションフィルタは、前記デジタルオーディオ信号を受信して前記デジタルオーディオ信号を処理し、前記アナログデジタル変換器のサンプリングレートよりも低い低減サンプリングレートを有する低減デジタルオーディオサンプルを生成するべく構成される、請求項1のシステム。 - サンプリングレートを有するデジタルオーディオ信号を入力として受信して前記デジタルオーディオ信号を、振幅を有するとともに前記デジタルオーディオ信号の前記サンプリングレートよりも低いサンプリングレートを有する結合デジタルオーディオ信号を生成するように処理するべく構成されたサンプル結合ブロックをさらに含む、請求項1のシステム。
- 前記割り込み信号を受信してトリガーフレーズのために前記デジタルオーディオ信号を分析するべく構成されたデジタル信号プロセッサをさらに含む、請求項1のシステム。
- 前記デジタルオーディオ信号を受信して先入れ先出しフォーマットで格納するべく構成された音声ランダムアクセスメモリをさらに含み、
前記音声ランダムアクセスメモリはデジタル信号プロセッサによりアクセスされるように構成される、請求項8のシステム。 - 複数の非同期クロック生成メカニズムを含むクロックシステムをさらに含み、
前記非同期クロック生成メカニズムはそれぞれが異なる電流消費を有し、
前記クロックシステムは、前記非同期クロック生成メカニズム間でスイッチングするべく構成される、請求項8のシステム。 - 音声コマンドを検出及びキャプチャする方法であって、
音声アクティビティ検出器がデジタルオーディオ信号を受信することと、
前記音声アクティビティ検出器が前記デジタルオーディオ信号の振幅を決定することと、
前記音声アクティビティ検出器が前記デジタルオーディオ信号の振幅を第1しきい値と及び第2しきい値と比較することと、
前記デジタルオーディオ信号の振幅が前記第1しきい値又は前記第2しきい値を超えない場合に前記音声アクティビティ検出器が割り込み信号を差し控えることと、
前記デジタルオーディオ信号の振幅が前記第1しきい値及び前記第2しきい値を超える場合に前記音声アクティビティ検出器が前記割り込み信号を生成することと、
前記デジタルオーディオ信号の振幅が前記第1しきい値と前記第2しきい値との間にある場合に前記音声アクティビティ検出器が前記デジタルオーディオ信号のスペクトル分析を行うことと
を含む、方法。 - アナログデジタル変換器がオーディオ信号を受信することと、
前記オーディオ信号がオーディオアクティビティの開始レベルを有するか否かをウェイクアップ回路が決定することと、
前記オーディオ信号が前記オーディオアクティビティの開始レベルを有しない場合に前記アナログデジタル変換器を、前記アナログデジタル変換器の変換器部分がデジタルオーディオ信号を生成しないスリープモードに置くことと、
前記オーディオ信号が前記オーディオアクティビティの開始レベルを有する場合に前記アナログデジタル変換器を、前記アナログデジタル変換器の変換器部分が、デジタルオーディオ信号を前記オーディオ信号からアナログデジタル変換器サンプリングレートで生成するアクティブモードに置くことと
をさらに含む、請求項11の方法。 - 前記オーディオ信号がオーディオアクティビティの開始レベルを有するか否かをウェイクアップ回路が決定することは、前記オーディオ信号をウェイクアップ開始しきい値と比較することを含む、請求項12の方法。
- 前記アナログデジタル変換器が前記スリープモードにある場合に前記アナログデジタル変換器の変換器部分に電力供給をしないことと、
前記アナログデジタル変換器が前記アクティブモードにある場合に前記アナログデジタル変換器の変換器部分に電力供給をすることと
をさらに含む、請求項12の方法。 - デジタル信号プロセッサが前記割り込み信号を前記音声アクティビティ検出器から受信することと、
前記デジタル信号プロセッサが、トリガーフレーズを検出するべく、前記デジタルオーディオ信号を分析することと
をさらに含む、請求項12の方法。 - 音声ランダムアクセスメモリが前記デジタルオーディオ信号を受信して先入れ先出しフォーマットで格納することと、
前記デジタル信号プロセッサが前記トリガーフレーズを検出する場合に前記トリガーフレーズのエンドポイント前の前記音声ランダムアクセスメモリにおけるすべてのデータを破棄することと
をさらに含む、請求項15の方法。 - 前記デジタル信号プロセッサがトリガーフレーズを検出する場合に、前記トリガーフレーズの後の予め特定されたタイムアウトの間にユーザが話したか否かを決定することをさらに含む、請求項15の方法。
- 音声アクティビティ検出器であって、
デジタルオーディオ信号を受信するべく構成された入力部と、
前記デジタルオーディオ信号の振幅を決定するべく構成された振幅検出器と、
コントローラと、
スペクトル分析器と
を含み、
前記コントローラは、
前記デジタルオーディオ信号の振幅が第1しきい値又は第2しきい値を超えない場合に割り込み信号を差し控えることと、
前記デジタルオーディオ信号の振幅が前記第1しきい値及び前記第2しきい値を超える場合に前記割り込み信号を生成することと、
前記デジタルオーディオ信号の振幅が前記第1しきい値と前記第2しきい値との間にある場合に前記デジタルオーディオ信号のスペクトル分析をトリガーすることと
を行うべく構成され、
前記スペクトル分析器は、前記コントローラに前記割り込み信号を生成するべきか否かを命令するべく前記デジタルオーディオ信号のスペクトル分析を行うべく構成される、音声アクティビティ検出器。 - サンプリングレートを有するデジタルオーディオ信号を入力として受信して前記デジタルオーディオ信号を、振幅を有するとともに前記デジタルオーディオ信号の前記サンプリングレートよりも低いサンプリングレートを有する結合デジタルオーディオ信号を生成するように処理するべく構成されたサンプル結合器をさらに含む、請求項18の音声アクティビティ検出器。
- 前記スペクトル分析器は、
前記サンプル結合器から前記結合デジタルオーディオ信号を受信して前記結合デジタルオーディオ信号を格納するべく構成された音声アクティビティ検出器ランダムアクセスメモリと、
前記音声アクティビティ検出器ランダムアクセスメモリに格納された前記結合デジタルオーディオ信号の高速フーリエ変換を行って高速フーリエ変換結果を出力するべく構成された高速フーリエ変換ブロックと、
前記高速フーリエ変換結果の平均振幅を決定するべく構成されたスペクトルローパスフィルタと、
前記スペクトルローパスフィルタの結果を評価し、前記スペクトルローパスフィルタの結果の評価に基づいて前記割り込み信号を生成するか又は引き続いて前記割り込み信号を差し控えるかするように前記コントローラに信号を送るべく構成されたスペクトルコントローラと
を含む、請求項19の音声アクティビティ検出器。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662437598P | 2016-12-21 | 2016-12-21 | |
US62/437,598 | 2016-12-21 | ||
US15/706,178 | 2017-09-15 | ||
US15/706,178 US10403279B2 (en) | 2016-12-21 | 2017-09-15 | Low-power, always-listening, voice command detection and capture |
PCT/US2017/067712 WO2018119138A1 (en) | 2016-12-21 | 2017-12-20 | Low-power, always-listening, voice-command detection and capture |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020502593A JP2020502593A (ja) | 2020-01-23 |
JP2020502593A5 true JP2020502593A5 (ja) | 2021-02-04 |
JP7129422B2 JP7129422B2 (ja) | 2022-09-01 |
Family
ID=62562629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019555430A Active JP7129422B2 (ja) | 2016-12-21 | 2017-12-20 | 音声コマンドを検出及びキャプチャするシステムと方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US10403279B2 (ja) |
JP (1) | JP7129422B2 (ja) |
KR (1) | KR102501601B1 (ja) |
CN (1) | CN110520927A (ja) |
DE (1) | DE112017006411T5 (ja) |
GB (1) | GB2573424B (ja) |
TW (1) | TW201835895A (ja) |
WO (1) | WO2018119138A1 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3602544A4 (en) | 2017-03-23 | 2020-02-05 | Joyson Safety Systems Acquisition LLC | SYSTEM AND METHOD FOR CORRELATION OF MOUTH IMAGES WITH INPUT COMMANDS |
US11189273B2 (en) * | 2017-06-29 | 2021-11-30 | Amazon Technologies, Inc. | Hands free always on near field wakeword solution |
WO2019079974A1 (en) * | 2017-10-24 | 2019-05-02 | Beijing Didi Infinity Technology And Development Co., Ltd. | SYSTEM AND METHOD FOR UNINTERRUPTED APPLICATION REVIEW AND VOICE RECOGNITION |
CN107808670B (zh) * | 2017-10-25 | 2021-05-14 | 百度在线网络技术(北京)有限公司 | 语音数据处理方法、装置、设备及存储介质 |
US10916252B2 (en) * | 2017-11-10 | 2021-02-09 | Nvidia Corporation | Accelerated data transfer for latency reduction and real-time processing |
US20190237067A1 (en) * | 2018-01-31 | 2019-08-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Multi-channel voice recognition for a vehicle environment |
US10332543B1 (en) * | 2018-03-12 | 2019-06-25 | Cypress Semiconductor Corporation | Systems and methods for capturing noise for pattern recognition processing |
DE102018212902A1 (de) * | 2018-08-02 | 2020-02-06 | Bayerische Motoren Werke Aktiengesellschaft | Verfahren zum Bestimmen eines digitalen Assistenten zum Ausführen einer Fahrzeugfunktion aus einer Vielzahl von digitalen Assistenten in einem Fahrzeug, computerlesbares Medium, System, und Fahrzeug |
US10861457B2 (en) * | 2018-10-26 | 2020-12-08 | Ford Global Technologies, Llc | Vehicle digital assistant authentication |
CN112740321A (zh) * | 2018-11-20 | 2021-04-30 | 深圳市欢太科技有限公司 | 唤醒设备的方法、装置、存储介质及电子设备 |
CN111261143B (zh) * | 2018-12-03 | 2024-03-22 | 嘉楠明芯(北京)科技有限公司 | 一种语音唤醒方法、装置及计算机可读存储介质 |
TWI713016B (zh) * | 2019-01-03 | 2020-12-11 | 瑞昱半導體股份有限公司 | 語音偵測處理系統與語音偵測方法 |
CN111414071B (zh) * | 2019-01-07 | 2021-11-02 | 瑞昱半导体股份有限公司 | 处理系统与语音检测方法 |
TWI684912B (zh) * | 2019-01-08 | 2020-02-11 | 瑞昱半導體股份有限公司 | 語音喚醒裝置及方法 |
US11650625B1 (en) * | 2019-06-28 | 2023-05-16 | Amazon Technologies, Inc. | Multi-sensor wearable device with audio processing |
CN110196914B (zh) * | 2019-07-29 | 2019-12-27 | 上海肇观电子科技有限公司 | 一种将人脸信息录入数据库的方法和装置 |
US11380321B2 (en) | 2019-08-01 | 2022-07-05 | Semiconductor Components Industries, Llc | Methods and apparatus for a voice detector |
CN110890104B (zh) * | 2019-11-26 | 2022-05-03 | 思必驰科技股份有限公司 | 语音端点检测方法及系统 |
KR20210112726A (ko) * | 2020-03-06 | 2021-09-15 | 엘지전자 주식회사 | 차량의 좌석별로 대화형 비서를 제공하는 방법 |
CN111816216A (zh) * | 2020-08-25 | 2020-10-23 | 苏州思必驰信息科技有限公司 | 语音活性检测方法和装置 |
KR20220059629A (ko) * | 2020-11-03 | 2022-05-10 | 현대자동차주식회사 | 차량 및 그의 제어방법 |
EP4260013A2 (en) * | 2020-12-09 | 2023-10-18 | Cerence Operating Company | Automotive infotainment system with spatially-cognizant applications that interact with a speech interface |
CN113470660A (zh) * | 2021-05-31 | 2021-10-01 | 翱捷科技(深圳)有限公司 | 一种基于路由器流量的语音唤醒阈值调整方法及系统 |
CN115547312B (zh) * | 2022-11-30 | 2023-03-21 | 深圳时识科技有限公司 | 带活动检测的预处理器、芯片和电子设备 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61156298A (ja) * | 1984-12-28 | 1986-07-15 | 日本電気株式会社 | 時定数を変動させる可変閾値型音声検出器 |
JP3674990B2 (ja) * | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
US7031916B2 (en) | 2001-06-01 | 2006-04-18 | Texas Instruments Incorporated | Method for converging a G.729 Annex B compliant voice activity detection circuit |
US7606330B2 (en) * | 2002-09-27 | 2009-10-20 | Broadcom Corporation | Dual-rate single band communication system |
CN100548060C (zh) | 2006-02-06 | 2009-10-07 | 海信集团有限公司 | Tetra集群手机语音处理方法 |
US8311814B2 (en) * | 2006-09-19 | 2012-11-13 | Avaya Inc. | Efficient voice activity detector to detect fixed power signals |
WO2010078386A1 (en) * | 2008-12-30 | 2010-07-08 | Raymond Koverzin | Power-optimized wireless communications device |
KR20200074260A (ko) * | 2011-12-07 | 2020-06-24 | 퀄컴 인코포레이티드 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
US9142215B2 (en) * | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
CN103578470B (zh) * | 2012-08-09 | 2019-10-18 | 科大讯飞股份有限公司 | 一种电话录音数据的处理方法及系统 |
DE212014000045U1 (de) | 2013-02-07 | 2015-09-24 | Apple Inc. | Sprach-Trigger für einen digitalen Assistenten |
US9697831B2 (en) | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
WO2015048254A1 (en) * | 2013-09-25 | 2015-04-02 | Robert Bosch Gmbh | Speech detection circuit and method |
KR102018152B1 (ko) * | 2014-03-31 | 2019-09-04 | 인텔 코포레이션 | 항상-온-항상-청취 음성 인식 시스템을 위한 위치 인식 전력 관리 스킴 |
TWI569263B (zh) | 2015-04-30 | 2017-02-01 | 智原科技股份有限公司 | 聲頻訊號的訊號擷取方法與裝置 |
-
2017
- 2017-09-15 US US15/706,178 patent/US10403279B2/en active Active
- 2017-12-20 KR KR1020197021179A patent/KR102501601B1/ko active IP Right Grant
- 2017-12-20 JP JP2019555430A patent/JP7129422B2/ja active Active
- 2017-12-20 CN CN201780086471.0A patent/CN110520927A/zh active Pending
- 2017-12-20 GB GB1909295.6A patent/GB2573424B/en active Active
- 2017-12-20 WO PCT/US2017/067712 patent/WO2018119138A1/en active Application Filing
- 2017-12-20 DE DE112017006411.2T patent/DE112017006411T5/de active Pending
- 2017-12-20 TW TW106144833A patent/TW201835895A/zh unknown
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2020502593A5 (ja) | 音声コマンドを検出及びキャプチャするシステムと方法 | |
JP7129422B2 (ja) | 音声コマンドを検出及びキャプチャするシステムと方法 | |
US10824391B2 (en) | Audio user interface apparatus and method | |
TWI474317B (zh) | 訊號處理裝置以及訊號處理方法 | |
US9349386B2 (en) | System and method for processor wake-up based on sensor data | |
KR102335717B1 (ko) | 음성 제어 시스템 및 그 웨이크업 방법, 웨이크업 장치 및 가전제품, 코프로세서 | |
US9775113B2 (en) | Voice wakeup detecting device with digital microphone and associated method | |
US9779725B2 (en) | Voice wakeup detecting device and method | |
US9406313B2 (en) | Adaptive microphone sampling rate techniques | |
US20160135047A1 (en) | User terminal and method for unlocking same | |
US20170287480A1 (en) | Voice wake-up method and device | |
US20160212527A1 (en) | Duty-cycling microphone/sensor for acoustic analysis | |
CN103543814A (zh) | 信号处理装置以及信号处理方法 | |
US11437022B2 (en) | Performing speaker change detection and speaker recognition on a trigger phrase | |
CN106504756B (zh) | 嵌入式语音识别系统及方法 | |
US11250849B2 (en) | Voice wake-up detection from syllable and frequency characteristic | |
JP4931927B2 (ja) | マイクロコントローラーを利用した信号認識法 | |
US11758334B2 (en) | Acoustic activity detection | |
JP2007206154A (ja) | 実環境騒音下の音声区間の検出 | |
CN114141272A (zh) | 声音事件侦测系统及方法 | |
hao | Design of Speech Remote Control Intelligent Power Supply Based on STM32 | |
Wang et al. | Design of speech recognition system | |
CN101258537A (zh) | 使用低成本微控制器的信号识别方法 | |
KR20200090441A (ko) | 신규 발생 음향에 기초한 위험 상황 검출 방법 및 장치 | |
JPS628200A (ja) | 音声分析方式 |