JP6936936B2 - ウェイクアップモデルの最適化方法、装置、デバイス及び記憶媒体 - Google Patents
ウェイクアップモデルの最適化方法、装置、デバイス及び記憶媒体 Download PDFInfo
- Publication number
- JP6936936B2 JP6936936B2 JP2019219602A JP2019219602A JP6936936B2 JP 6936936 B2 JP6936936 B2 JP 6936936B2 JP 2019219602 A JP2019219602 A JP 2019219602A JP 2019219602 A JP2019219602 A JP 2019219602A JP 6936936 B2 JP6936936 B2 JP 6936936B2
- Authority
- JP
- Japan
- Prior art keywords
- wakeup
- data
- model
- wake
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 48
- 238000005457 optimization Methods 0.000 title claims description 34
- 238000012549 training Methods 0.000 claims description 111
- 238000012795 verification Methods 0.000 claims description 55
- 238000010200 validation analysis Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 10
- 230000003252 repetitive effect Effects 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000012804 iterative process Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013434 data augmentation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
- G10L2015/0636—Threshold criteria for the updating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Description
トレーニングセット及び検証セットを取得するステップと、
前記トレーニングセット及び前記検証セットに基づいてウェイクアップモデルに対して反復トレーニングを行うステップと、
反復トレーニング過程で、周期的に前記ウェイクアップモデル及び予め設定されたコーパスに基づいて前記トレーニングセット及び前記検証セットを更新し、且つ更新後のトレーニングセット及び検証セットに基づいて前記ウェイクアップモデルに対して反復トレーニングを続けるステップと、
予め設定された中止条件に達すると、前記ウェイクアップモデルを出力するステップと、を含む。
トレーニングセット及び検証セットを取得するための取得モジュールと、
前記トレーニングセット及び前記検証セットに基づいてウェイクアップモデルに対して反復トレーニングを行うためのトレーニングモジュールと、
反復トレーニング過程で、周期的に前記ウェイクアップモデル及び予め設定されたコーパスに基づいて前記トレーニングセット及び前記検証セットを更新するためのチューニングモジュールと、
予め設定された中止条件に達すると、前記ウェイクアップモデルを出力するための出力モジュールと、を含み、
前記トレーニングモジュールは更に、更新後のトレーニングセット及び検証セットに基づいて前記ウェイクアップモデルに対して反復トレーニングを続けるために用いられる。
メモリと、
プロセッサと、
前記メモリに記憶され、且つ第1態様に記載の方法を実現するように前記プロセッサにより実行されるように配置されるコンピュータプログラムと、を含む。
ウェイクアップワードセット及び誤りウェイクアップワードセットを取得するS1011と、
前記ウェイクアップワードセット及び前記誤りウェイクアップワードセットに基づいてそれぞれ正例データ及び反例データを取得するS1012と、
前記正例データ及び前記反例データから前記トレーニングセット及び前記検証セットを得るS1013と、を含んでもよい。
予め設定された反復回数を1つの反復周期とし、各反復周期の終了時に、前記予め設定されたコーパス内のセンテンスを前記ウェイクアップモデルに入力し、ウェイクアップ結果を取得するS201と、
前記ウェイクアップ結果に基づき、予め設定された数の誤りウェイクアップの発生したセンテンスを取得するS202と、
前記予め設定された数の誤りウェイクアップの発生したセンテンスに基づいて前記トレーニングセット及び前記検証セット内の反例データを更新するS203と、を含むことができる。
誤りウェイクアップの発生したセンテンスについて、誤りウェイクアップ確率を取得するS2021と、
前記誤りウェイクアップ確率に基づいて誤りウェイクアップの発生したセンテンスをソートし、その中で誤りウェイクアップ確率が比較的高い、予め設定された数の誤りウェイクアップの発生したセンテンスを選ぶS2022と、を含む。
前記予め設定された数の誤りウェイクアップの発生したセンテンスに対してデータ拡張操作を行った後に前記トレーニングセット及び前記検証セット内の反例データを更新するステップを含んでよい。
データ拡張操作が行われる目標データに対して、予め設定されたノイズデータ及び/又はリバーブデータを重畳すること、及び/又は前記目標データの再生話速を調整することを含むことができる。
トレーニングモジュール52は、前記トレーニングセット及び前記検証セットに基づいてウェイクアップモデルに対して反復トレーニングを行うために用いられ、
チューニングモジュール53は、反復トレーニング過程で、周期的に前記ウェイクアップモデル及び予め設定されたコーパスに基づいて前記トレーニングセット及び前記検証セットを更新するために用いられ、
トレーニングモジュール52はまた、更新後のトレーニングセット及び検証セットに基づいて前記ウェイクアップモデルに対して反復トレーニングを続けるために用いられ、
出力モジュール54は、予め設定された中止条件に達すると、前記ウェイクアップモデルを出力するために用いられる。
予め設定された反復回数を1つの反復周期とし、各反復周期の終了時に、前記予め設定されたコーパス内のセンテンスを前記ウェイクアップモデルに入力し、ウェイクアップ結果を取得し、
前記ウェイクアップ結果に基づき、予め設定された数の誤りウェイクアップの発生したセンテンスを取得し、
前記予め設定された数の誤りウェイクアップの発生したセンテンスに基づいて前記トレーニングセット及び前記検証セット内の反例データを更新するために用いられる。
誤りウェイクアップの発生したセンテンスについて、誤りウェイクアップ確率を取得し、
前記誤りウェイクアップ確率に基づいて誤りウェイクアップの発生したセンテンスをソートし、その中で誤りウェイクアップ確率が比較的高い、予め設定された数の誤りウェイクアップの発生したセンテンスを選ぶために用いられる。
ウェイクアップワードセット及び誤りウェイクアップワードセットを取得し、
前記ウェイクアップワードセット及び前記誤りウェイクアップワードセットに基づいてそれぞれ正例データ及び反例データを取得し、
前記正例データ及び前記反例データから前記トレーニングセット及び前記検証セットを得るために用いられる。
取得モジュール51により呼び出され、前記ウェイクアップワードセット及び前記誤りウェイクアップワードセット内のデータに対してデータ拡張操作を行い、前記正例データ及び前記反例データを得るために用いられる。
前記チューニングモジュール53により呼び出され、前記予め設定された数の誤りウェイクアップの発生したセンテンスに対してデータ拡張操作を行った後に前記トレーニングセット及び前記検証セット内の反例データを更新するために用いられる。
データ拡張操作が行われる目標データに対して、予め設定されたノイズデータ及び/又はリバーブデータを重畳し、及び/又は
前記目標データの再生話速を調整するために用いられる。
Claims (14)
- ウェイクアップモデルの最適化方法であって、
トレーニングセット及び検証セットを取得するステップと、
前記トレーニングセット及び前記検証セットに基づいてウェイクアップモデルに対して反復トレーニングを行うステップと、
反復トレーニング過程で、周期的に前記ウェイクアップモデル及び予め設定されたコーパスに基づいて前記トレーニングセット及び前記検証セットを更新し、且つ更新後のトレーニングセット及び検証セットに基づいて前記ウェイクアップモデルに対して反復トレーニングを続けるステップと、
予め設定された中止条件に達すると、前記ウェイクアップモデルを出力するステップと、を含み、
ここで、周期的に前記ウェイクアップモデル及び予め設定されたコーパスに基づいて前記トレーニングセット及び前記検証セットを更新する前記ステップは、
予め設定された反復回数を1つの反復周期とし、各反復周期の終了時に、前記予め設定されたコーパス内のセンテンスを前記ウェイクアップモデルに入力し、ウェイクアップ結果を取得するステップと、
前記ウェイクアップ結果に基づき、予め設定された数の誤りウェイクアップの発生したセンテンスを取得するステップと、
前記予め設定された数の誤りウェイクアップの発生したセンテンスに基づいて前記トレーニングセット及び前記検証セット内の反例データを更新するステップと、を含むことを特徴とするウェイクアップモデルの最適化方法。 - 前記ウェイクアップ結果に基づき、予め設定された数の誤りウェイクアップの発生したセンテンスを取得する前記ステップは、
誤りウェイクアップの発生したセンテンスについて、誤りウェイクアップ確率を取得するステップと、
前記誤りウェイクアップ確率に基づいて誤りウェイクアップの発生したセンテンスをソートし、その中で誤りウェイクアップ確率が比較的高い、予め設定された数の誤りウェイクアップの発生したセンテンスを選ぶステップと、を含むことを特徴とする請求項1に記載の方法。 - トレーニングセット及び検証セットを取得する前記ステップは、
ウェイクアップワードセット及び誤りウェイクアップワードセットを取得するステップと、
前記ウェイクアップワードセット及び前記誤りウェイクアップワードセットに基づいてそれぞれ正例データ及び反例データを取得するステップと、
前記正例データ及び前記反例データから前記トレーニングセット及び前記検証セットを得るステップと、を含むことを特徴とする請求項1に記載の方法。 - 前記ウェイクアップワードセット及び前記誤りウェイクアップワードセットに基づいてそれぞれ正例データ及び反例データを取得する前記ステップは、
前記ウェイクアップワードセット及び前記誤りウェイクアップワードセット内のデータに対してデータ拡張操作を行い、前記正例データ及び前記反例データを得るステップを含むことを特徴とする請求項3に記載の方法。 - 前記予め設定された数の誤りウェイクアップの発生したセンテンスに基づいて前記トレーニングセット及び前記検証セット内の反例データを更新する前記ステップは、
前記予め設定された数の誤りウェイクアップの発生したセンテンスに対してデータ拡張操作を行った後に前記トレーニングセット及び前記検証セット内の反例データを更新するステップを含むことを特徴とする請求項1に記載の方法。 - 前記データ拡張操作は、
データ拡張操作が行われる目標データに対して、予め設定されたノイズデータ及び/又はリバーブデータを重畳すること、及び/又は
前記目標データの再生話速を調整することを含むことを特徴とする請求項4又は請求項5に記載の方法。 - ウェイクアップモデルの最適化装置であって、
トレーニングセット及び検証セットを取得するための取得モジュールと、
前記トレーニングセット及び前記検証セットに基づいてウェイクアップモデルに対して反復トレーニングを行うためのトレーニングモジュールと、
反復トレーニング過程で、周期的に前記ウェイクアップモデル及び予め設定されたコーパスに基づいて前記トレーニングセット及び前記検証セットを更新するためのチューニングモジュールと、
予め設定された中止条件に達すると、前記ウェイクアップモデルを出力するための出力モジュールと、を含み、
前記トレーニングモジュールは更に、更新後のトレーニングセット及び検証セットに基づいて前記ウェイクアップモデルに対して反復トレーニングを続けるために用いられ、
ここで、前記チューニングモジュールは更に、
予め設定された反復回数を1つの反復周期とし、各反復周期の終了時に、前記予め設定されたコーパス内のセンテンスを前記ウェイクアップモデルに入力し、ウェイクアップ結果を取得し、
前記ウェイクアップ結果に基づき、予め設定された数の誤りウェイクアップの発生したセンテンスを取得し、
前記予め設定された数の誤りウェイクアップの発生したセンテンスに基づいて前記トレーニングセット及び前記検証セット内の反例データを更新するために用いられることを特徴とするウェイクアップモデルの最適化装置。 - 前記チューニングモジュールは、
誤りウェイクアップの発生したセンテンスについて、誤りウェイクアップ確率を取得し、
前記誤りウェイクアップ確率に基づいて誤りウェイクアップの発生したセンテンスをソートし、その中で誤りウェイクアップ確率が比較的高い、予め設定された数の誤りウェイクアップの発生したセンテンスを選ぶために用いられることを特徴とする請求項7に記載の装置。 - 前記取得モジュールは、
ウェイクアップワードセット及び誤りウェイクアップワードセットを取得し、
前記ウェイクアップワードセット及び前記誤りウェイクアップワードセットに基づいてそれぞれ正例データ及び反例データを取得し、
前記正例データ及び前記反例データから前記トレーニングセット及び前記検証セットを得るために用いられることを特徴とする請求項7に記載の装置。 - 前記取得モジュールにより呼び出され、前記ウェイクアップワードセット及び前記誤りウェイクアップワードセット内のデータに対してデータ拡張操作を行い、前記正例データ及び前記反例データを得るためのデータ拡張モジュールをさらに含むことを特徴とする請求項9に記載の装置。
- 前記チューニングモジュールにより呼び出され、前記予め設定された数の誤りウェイクアップの発生したセンテンスに対してデータ拡張操作を行った後に前記トレーニングセット及び前記検証セット内の反例データを更新するためのデータ拡張モジュールをさらに含むことを特徴とする請求項7に記載の装置。
- 前記データ拡張モジュールは、
データ拡張操作が行われる目標データに対して、予め設定されたノイズデータ及び/又はリバーブデータを重畳し、及び/又は
前記目標データの再生話速を調整するために用いられることを特徴とする請求項10又は請求項11に記載の装置。 - ウェイクアップモデルの最適化デバイスであって、
メモリと、
プロセッサと、
前記メモリに記憶され、且つ請求項1乃至請求項6のいずれか一項に記載の方法を実現するように前記プロセッサにより実行されるように配置されるコンピュータプログラムと、を含むことを特徴とするウェイクアップモデルの最適化デバイス。 - コンピュータ読み取り可能な記憶媒体であって、
コンピュータプログラムが記憶されており、
前記コンピュータプログラムがプロセッサに実行される時に請求項1乃至請求項6のいずれか一項に記載の方法を実現することを特徴とするコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910569405.XA CN110310628B (zh) | 2019-06-27 | 2019-06-27 | 唤醒模型的优化方法、装置、设备及存储介质 |
CN201910569405.X | 2019-06-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021006889A JP2021006889A (ja) | 2021-01-21 |
JP6936936B2 true JP6936936B2 (ja) | 2021-09-22 |
Family
ID=68076830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019219602A Active JP6936936B2 (ja) | 2019-06-27 | 2019-12-04 | ウェイクアップモデルの最適化方法、装置、デバイス及び記憶媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11189287B2 (ja) |
JP (1) | JP6936936B2 (ja) |
CN (1) | CN110310628B (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110706695B (zh) * | 2019-10-17 | 2022-02-18 | 北京声智科技有限公司 | 一种数据标注方法及装置 |
CN111091813B (zh) * | 2019-12-31 | 2022-07-22 | 北京猎户星空科技有限公司 | 语音唤醒模型更新及唤醒方法、系统、装置、设备及介质 |
CN111312222B (zh) * | 2020-02-13 | 2023-09-12 | 北京声智科技有限公司 | 一种唤醒、语音识别模型训练方法及装置 |
KR20210123633A (ko) * | 2020-04-03 | 2021-10-14 | 삼성전자주식회사 | 음성 명령에 대응하는 태스크를 수행하는 전자 장치 및 그 동작 방법 |
CN111599350B (zh) * | 2020-04-07 | 2023-02-28 | 云知声智能科技股份有限公司 | 一种命令词定制识别方法及系统 |
CN111540346A (zh) * | 2020-05-13 | 2020-08-14 | 慧言科技(天津)有限公司 | 一种远场声音分类方法和装置 |
CN112992170B (zh) * | 2021-01-29 | 2022-10-28 | 青岛海尔科技有限公司 | 模型训练方法及装置、存储介质及电子装置 |
CN113012682B (zh) * | 2021-03-24 | 2022-10-14 | 北京百度网讯科技有限公司 | 误唤醒率确定方法、装置、设备、存储介质和程序产品 |
CN112967718B (zh) * | 2021-04-02 | 2024-04-12 | 深圳吉祥星科技股份有限公司 | 基于声音的投影仪控制方法、装置、设备及存储介质 |
CN113129874B (zh) * | 2021-04-27 | 2022-05-10 | 思必驰科技股份有限公司 | 语音唤醒方法及系统 |
CN113782016B (zh) * | 2021-08-06 | 2023-05-05 | 佛山市顺德区美的电子科技有限公司 | 一种唤醒处理方法、装置、设备和计算机存储介质 |
CN116543758B (zh) * | 2023-06-27 | 2023-09-15 | 中国第一汽车股份有限公司 | 语音唤醒模型的更新方法、系统和介质 |
CN117475998A (zh) * | 2023-12-28 | 2024-01-30 | 慧言科技(天津)有限公司 | 基于lora微调辅助的语音唤醒快速自适应方法 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3521429B2 (ja) | 1992-03-30 | 2004-04-19 | セイコーエプソン株式会社 | ニューラルネットワークを用いた音声認識装置およびその学習方法 |
US7533019B1 (en) * | 2003-12-23 | 2009-05-12 | At&T Intellectual Property Ii, L.P. | System and method for unsupervised and active learning for automatic speech recognition |
CN101393740B (zh) * | 2008-10-31 | 2011-01-19 | 清华大学 | 一种计算机多方言背景的汉语普通话语音识别的建模方法 |
US9275637B1 (en) * | 2012-11-06 | 2016-03-01 | Amazon Technologies, Inc. | Wake word evaluation |
US9508347B2 (en) * | 2013-07-10 | 2016-11-29 | Tencent Technology (Shenzhen) Company Limited | Method and device for parallel processing in model training |
US9922364B1 (en) * | 2013-11-18 | 2018-03-20 | X Development Llc | Voice initiated purchase request |
US9373321B2 (en) * | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
CN105869637B (zh) * | 2016-05-26 | 2019-10-15 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法和装置 |
WO2018086033A1 (en) * | 2016-11-10 | 2018-05-17 | Nuance Communications, Inc. | Techniques for language independent wake-up word detection |
CN106611597B (zh) * | 2016-12-02 | 2019-11-08 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
US10692489B1 (en) * | 2016-12-23 | 2020-06-23 | Amazon Technologies, Inc. | Non-speech input to speech processing system |
CN107221326B (zh) * | 2017-05-16 | 2021-05-28 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法、装置和计算机设备 |
CN107358951A (zh) * | 2017-06-29 | 2017-11-17 | 阿里巴巴集团控股有限公司 | 一种语音唤醒方法、装置以及电子设备 |
CN107610702B (zh) * | 2017-09-22 | 2021-01-29 | 百度在线网络技术(北京)有限公司 | 终端设备待机唤醒方法、装置及计算机设备 |
CN109741735B (zh) * | 2017-10-30 | 2023-09-01 | 阿里巴巴集团控股有限公司 | 一种建模方法、声学模型的获取方法和装置 |
US10672380B2 (en) * | 2017-12-27 | 2020-06-02 | Intel IP Corporation | Dynamic enrollment of user-defined wake-up key-phrase for speech enabled computer system |
CN108520743B (zh) * | 2018-02-02 | 2021-01-22 | 百度在线网络技术(北京)有限公司 | 智能设备的语音控制方法、智能设备及计算机可读介质 |
CN108564954B (zh) * | 2018-03-19 | 2020-01-10 | 平安科技(深圳)有限公司 | 深度神经网络模型、电子装置、身份验证方法和存储介质 |
CN108766420B (zh) * | 2018-05-31 | 2021-04-02 | 中国联合网络通信集团有限公司 | 语音交互设备唤醒词生成方法及装置 |
CN108898222A (zh) * | 2018-06-26 | 2018-11-27 | 郑州云海信息技术有限公司 | 一种自动调节网络模型超参数的方法和装置 |
US10720151B2 (en) * | 2018-07-27 | 2020-07-21 | Deepgram, Inc. | End-to-end neural networks for speech recognition and classification |
CN109243446A (zh) * | 2018-10-01 | 2019-01-18 | 厦门快商通信息技术有限公司 | 一种基于rnn网络的语音唤醒方法 |
CN109273007B (zh) * | 2018-10-11 | 2022-05-17 | 西安讯飞超脑信息科技有限公司 | 语音唤醒方法及装置 |
CN109886386B (zh) * | 2019-01-30 | 2020-10-27 | 北京声智科技有限公司 | 唤醒模型的确定方法及装置 |
US11127394B2 (en) * | 2019-03-29 | 2021-09-21 | Intel Corporation | Method and system of high accuracy keyphrase detection for low resource devices |
US11189286B2 (en) * | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
-
2019
- 2019-06-27 CN CN201910569405.XA patent/CN110310628B/zh active Active
- 2019-12-04 US US16/703,596 patent/US11189287B2/en active Active
- 2019-12-04 JP JP2019219602A patent/JP6936936B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2021006889A (ja) | 2021-01-21 |
US20200411000A1 (en) | 2020-12-31 |
CN110310628B (zh) | 2022-05-20 |
US11189287B2 (en) | 2021-11-30 |
CN110310628A (zh) | 2019-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6936936B2 (ja) | ウェイクアップモデルの最適化方法、装置、デバイス及び記憶媒体 | |
KR102302609B1 (ko) | 신경망 아키텍처 최적화 | |
KR102532658B1 (ko) | 신경 아키텍처 검색 | |
US11514925B2 (en) | Using a predictive model to automatically enhance audio having various audio quality issues | |
JP2022549238A (ja) | 意味理解モデルのトレーニング方法、装置、電子デバイスおよびコンピュータプログラム | |
CN107909998A (zh) | 语音指令处理方法、装置、计算机设备和存储介质 | |
CN110164435A (zh) | 语音识别方法、装置、设备及计算机可读存储介质 | |
CN111709476A (zh) | 一种基于知识蒸馏的小分类模型训练方法及装置 | |
CN104854654A (zh) | 用于使用搜索查询信息的言语识别处理的方法和系统 | |
CN104391793B (zh) | 测试步骤及测试脚本生成方法及装置 | |
CN103631590B (zh) | 自动化测试脚本的编辑方法 | |
CN109614400A (zh) | 失败任务的影响及溯源分析方法、装置、设备及存储介质 | |
CN111312230A (zh) | 用于语音对话平台的语音交互监测方法及装置 | |
CN108039168A (zh) | 声学模型优化方法及装置 | |
CN110058969A (zh) | 一种数据恢复方法及装置 | |
CN106354515A (zh) | 基于模型的SystemC代码生成系统 | |
CN109165286A (zh) | 自动问答方法、装置及计算机可读存储介质 | |
CN110929087A (zh) | 一种音频分类方法、装置、电子设备及存储介质 | |
CN104580109A (zh) | 生成点选验证码的方法及装置 | |
CN106776779A (zh) | 基于Mac平台的JSON数据生成实体文件的方法 | |
CN115617673A (zh) | 基于Cosim平台的测试用例配置的方法及应用 | |
CN106203538B (zh) | 电子笔迹的单字拆解方法及装置 | |
БАРКОВСЬКА | Performance study of the text analysis module in the proposed model of automatic speaker’s speech annotation | |
CN114357984A (zh) | 一种基于拼音的同音字变体处理方法 | |
CN109101239B (zh) | 一种在线Verilog代码自动判决系统的标准答案生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210301 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210525 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20210531 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210604 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6936936 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |