JP2019204112A - 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 - Google Patents
音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 Download PDFInfo
- Publication number
- JP2019204112A JP2019204112A JP2019137200A JP2019137200A JP2019204112A JP 2019204112 A JP2019204112 A JP 2019204112A JP 2019137200 A JP2019137200 A JP 2019137200A JP 2019137200 A JP2019137200 A JP 2019137200A JP 2019204112 A JP2019204112 A JP 2019204112A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- listening
- audio
- wakeup
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 239000000872 buffer Substances 0.000 claims description 26
- 238000000605 extraction Methods 0.000 claims description 9
- 230000005236 sound signal Effects 0.000 claims description 9
- 230000003139 buffering effect Effects 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
Description
音声ウェイクアップ装置によって、周囲環境における音声情報を聴取するステップと、
聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定したとき、音声ウェイクアップ装置によって、聴取することによって取得される第1のプリセットされた持続時間の音声情報をバッファし、音声認識装置のイネーブル化をトリガするためのトリガ信号を送るステップであって、トリガ信号は、音声認識装置に対して、音声認識装置がイネーブルされた後、音声ウェイクアップ装置によってバッファされた音声情報を読み出し、認識するように指示するために用いられる、ステップとを含む。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するステップを含む。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声信号の声紋特徴を抽出し、抽出された声紋特徴が所定の声紋特徴と一致すると決定し、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するステップを含む。
音声認識装置によって、音声ウェイクアップ装置によって送られたトリガ信号を受信するステップであって、トリガ信号は、音声認識装置に対して、それ自体をイネーブルし、音声ウェイクアップ装置によってバッファされた第1の音声情報を認識するように指示するために用いられる、ステップと、
トリガ信号を受信した後、音声認識装置によって、それ自体をイネーブル化し、第2のプリセットされた持続時間の第2の音声情報を聴取するステップと、
音声ウェイクアップ装置によってバッファされた第1の音声情報、および聴取することによって取得された第2の音声情報を認識して、認識結果を取得するステップとを含む。
音声認識装置によって、取得された認識結果と、予め記憶された音声命令情報との間の突き合わせを行うステップと、
一致した音声命令情報に対応する動作を、音声認識装置によって行うステップとをさらに含む。
トリガ信号が受信された後、第3のプリセットされた持続時間内でトリガ信号が再び受信されなかったと決定したとき、音声認識装置によってそれ自体を自動的にディセーブルするステップをさらに含む。
音声ウェイクアップ装置によって、周囲環境における音声情報を聴取するステップと、
聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定したとき、音声ウェイクアップ装置によって、音声認識装置のイネーブル化をトリガするためのトリガ信号を送るステップとを含む。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するステップを含む。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声信号の声紋特徴を抽出し、抽出された声紋特徴が所定の声紋特徴と一致すると決定し、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するステップを含む。
音声認識装置によって、音声ウェイクアップ装置によって送られたトリガ信号を受信するステップと、
音声認識装置によって、トリガ信号を受信した後、それ自体をイネーブル化し、ユーザに音声プロンプト命令を送るステップと、
音声認識装置によって、音声プロンプト命令に従ってユーザによって入力された音声信号を記録し、音声信号に対する認識を行って認識結果を取得するステップとを含む。
周囲環境における音声情報を聴取するように構成された聴取モジュールと、
聴取モジュールによって聴取することによって取得された音声情報が、音声ウェイクアップモデルと一致するかどうかを決定するように構成された決定モジュールと、
決定モジュールが、聴取モジュールによって聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定したとき、聴取モジュールによって聴取することによって取得される第1のプリセットされた持続時間の音声情報をバッファするように構成されたバッファモジュールと、
音声認識装置のイネーブル化をトリガするためのトリガ信号を送るように構成された送出モジュールであって、トリガ信号は、音声認識装置に対して、音声認識装置がイネーブルされた後、音声ウェイクアップ装置によってバッファされた音声情報を読み出し、認識するように指示するために用いられる、送出モジュールとを含む。
決定モジュールが、聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致すると決定したとき、聴取することによって取得された音声信号の声紋特徴を抽出するように構成された抽出モジュールをさらに含み、
決定モジュールは、抽出モジュールによって抽出された声紋特徴が所定の声紋特徴と一致すると決定したとき、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するようにさらに構成される。
音声ウェイクアップ装置によって送られたトリガ信号を受信するように構成された受信モジュールであって、トリガ信号は、音声認識装置に対して、それ自体をイネーブルし、音声ウェイクアップ装置によってバッファされた第1の音声情報を認識するように指示するために用いられる、受信モジュールと、
受信モジュールがトリガ信号を受信した後、それ自体をイネーブルし、第2のプリセットされた持続時間の第2の音声情報を聴取するように構成された聴取モジュールと、
音声ウェイクアップ装置によってバッファされた第1の音声情報、および聴取モジュールによって聴取することによって取得された第2の音声情報を認識して、認識結果を取得するように構成された認識モジュールとを含む。
認識モジュールが認識を行った後に取得された認識結果と、予め記憶された音声命令情報との間の突き合わせを行うように構成された突き合わせモジュールと、
一致した音声命令情報に対応する動作を行うように構成された実行モジュールとをさらに含む。
トリガ信号が受信された後、第3のプリセットされた持続時間内でトリガ信号が再び受信されなかったとき、音声認識モジュールをディセーブルするように構成されたディセーブル化モジュールをさらに含む。
周囲環境における音声情報を聴取するように構成された聴取モジュールと、
聴取することによって取得された音声情報が音声ウェイクアップモデルと一致するかどうかを決定するように構成された決定モジュールと、
決定モジュールが、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定したとき、音声認識装置のイネーブル化をトリガするためのトリガ信号を送るように構成された送出モジュールとを含む。
決定モジュールが、聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致すると決定したとき、聴取することによって取得された音声信号の声紋特徴を抽出するように構成された抽出モジュールをさらに含み、
決定モジュールは、抽出された声紋特徴が所定の声紋特徴と一致すると決定したとき、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するように特に構成される。
音声ウェイクアップ装置によって送られたトリガ信号を受信するように構成された受信モジュールと、
受信モジュールがトリガ信号を受信した後、それ自体をイネーブルし、ユーザに音声プロンプト命令を送るように構成された送出モジュールと、
音声プロンプト命令に従ってユーザによって入力された音声信号を記録し、音声信号を認識して認識結果を取得するように構成された処理モジュールとを含む。
音声ウェイクアップ装置と、音声認識装置とを含み、
音声ウェイクアップ装置は、周囲環境における音声情報を聴取し、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定したとき、第1のプリセットされた持続時間内で聴取することによって取得される第1の音声情報をバッファし、音声認識装置のイネーブル化をトリガするためのトリガ信号を送るように構成され、
音声認識装置は、音声ウェイクアップ装置によって送られたトリガ信号を受信した後、それ自体をイネーブルし、第2のプリセットされた持続時間内で第2の音声情報を聴取し、音声ウェイクアップ装置によってバッファされた第1の音声情報、および聴取することによって取得された第2の音声情報を認識して認識結果を取得するように構成される。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声情報は、音声ウェイクアップモデルと一致する。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声信号の声紋特徴が抽出され、抽出された声紋特徴は所定の声紋特徴と一致し、聴取することによって取得された音声情報は音声ウェイクアップモデルと一致する。
ピッチ曲線、線形予測係数、スペクトル包絡線パラメータ、高調波エネルギー比率、共鳴ピーク周波数およびその帯域幅、ケプストラム(パワーケプストラムとも呼ばれる)、またはメル周波数ケプストラム係数(Mel Frequency Cepstrum Coefficient、略してMFCC)などの声紋特徴を反映する音響パラメータ。この実施形態は、上記で述べられた声紋特徴パラメータに限定されない。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声情報は、音声ウェイクアップモデルと一致する。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声信号の声紋特徴が抽出され、抽出された声紋特徴は所定の声紋特徴と一致し、聴取することによって取得された音声情報は音声ウェイクアップモデルと一致する。
音声認識装置によって、取得された認識結果と、予め記憶された音声命令情報との間の突き合わせを行うステップと、
音声認識装置によって、一致した音声命令情報に対応する動作の実行を制御するステップとをさらに含む。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声情報は、音声ウェイクアップモデルと一致する。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声信号の声紋特徴が抽出され、抽出された声紋特徴は所定の声紋特徴と一致し、聴取することによって取得された音声情報は音声ウェイクアップモデルと一致する。
音声認識装置によって、取得された認識結果と、予め記憶された音声命令情報との間の突き合わせを行うステップと、
音声認識装置によって、一致した音声命令情報に対応する動作の実行を制御するステップとをさらに含む。
周囲環境における音声情報を聴取するように構成された聴取モジュール601と、
聴取モジュール601によって聴取することによって取得された音声情報が、音声ウェイクアップモデルと一致するかどうかを決定するように構成された決定モジュール602と、
決定モジュール602が、聴取モジュール601によって聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定したとき、聴取モジュール601によって聴取することによって取得される第1のプリセットされた持続時間の音声情報をバッファするように構成されたバッファモジュール603と、
音声認識装置のイネーブル化をトリガするためのトリガ信号を送るように構成された送出モジュール604であって、トリガ信号は、音声認識装置に対して、音声認識装置がイネーブルされた後、音声ウェイクアップ装置によってバッファされた音声情報を読み出し、認識するように指示するために用いられる、送出モジュール604とを含む。
決定モジュール602が、聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致すると決定したとき、聴取することによって取得された音声信号の声紋特徴を抽出するように構成された抽出モジュールをさらに含み、
決定モジュール602は、抽出モジュールによって抽出された声紋特徴が所定の声紋特徴と一致すると決定したとき、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するようにさらに構成される。
音声ウェイクアップ装置によって送られたトリガ信号を受信するように構成された受信モジュール701であって、トリガ信号は、音声認識装置に対して、それ自体をイネーブルし、音声ウェイクアップ装置によってバッファされた第1の音声情報を認識するように指示するために用いられる、受信モジュール701と、
受信モジュール701がトリガ信号を受信した後、それ自体をイネーブルし、第2のプリセットされた持続時間の第2の音声情報を聴取するように構成された聴取モジュール702と、
音声ウェイクアップ装置によってバッファされた第1の音声情報、および聴取モジュールによって聴取することによって取得された第2の音声情報を認識して、認識結果を取得するように構成された認識モジュール703とを含む。
認識モジュール703が認識を行った後に取得された認識結果と、予め記憶された音声命令情報との間の突き合わせを行うように構成された突き合わせモジュールと、
一致した音声命令情報に対応する動作を行うように構成された実行モジュールとをさらに含む。
受信モジュールがトリガ信号を受信した後、第3のプリセットされた持続時間内でトリガ信号が再び受信されなかったとき、音声認識モジュールをディセーブルするように構成されたディセーブル化モジュールをさらに含む。
周囲環境における音声情報を聴取するように構成された聴取モジュール801と、
聴取することによって取得された音声情報が音声ウェイクアップモデルと一致するかどうかを決定するように構成された決定モジュール802と、
決定モジュール802が、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定したとき、音声認識装置のイネーブル化をトリガするためのトリガ信号を送るように構成された送出モジュール803とを含む。
決定モジュール802が、聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致すると決定したとき、聴取することによって取得された音声信号の声紋特徴を抽出するように構成された抽出モジュールをさらに含み、
決定モジュール802は、抽出された声紋特徴が所定の声紋特徴と一致すると決定したとき、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するように特に構成される。
音声ウェイクアップ装置によって送られたトリガ信号を受信するように構成された受信モジュール901と、
受信モジュール901がトリガ信号を受信した後、それ自体をイネーブルし、ユーザに音声プロンプト命令を送るように構成された送出モジュール902と、
音声プロンプト命令に従ってユーザによって入力された音声信号を記録し、音声信号を認識して認識結果を取得するように構成された処理モジュール903とを含む。
Serviceは、Bufferデータおよび記録データに対して、認識処理を行う。
Claims (23)
- 音声ウェイクアップ装置によって、周囲環境における音声情報を聴取するステップと、
聴取することによって取得された前記音声情報が音声ウェイクアップモデルと一致すると決定したとき、前記音声ウェイクアップ装置によって、聴取することによって取得される、第1のプリセットされた持続時間の音声情報をバッファし、音声認識装置のイネーブル化をトリガするためのトリガ信号を送るステップであって、前記トリガ信号は、前記音声認識装置に対して、前記音声認識装置がイネーブルされた後、前記音声ウェイクアップ装置によってバッファされた前記音声情報を読み出し、認識するように指示するために用いられる、ステップと
を含む、音声認識方法。 - 聴取することによって取得された前記音声情報が音声ウェイクアップモデルと一致すると決定する前記ステップは、
聴取することによって取得された前記音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された前記音声情報が前記音声ウェイクアップモデルと一致すると決定するステップを含む
請求項1に記載の方法。 - 聴取することによって取得された前記音声情報が音声ウェイクアップモデルと一致すると決定する前記ステップは、
聴取することによって取得された前記音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声信号の声紋特徴を抽出し、前記抽出された声紋特徴が所定の声紋特徴と一致すると決定し、聴取することによって取得された前記音声情報が前記音声ウェイクアップモデルと一致すると決定するステップを含む
請求項1に記載の方法。 - 音声認識装置によって、音声ウェイクアップ装置によって送られたトリガ信号を受信するステップであって、前記トリガ信号は、前記音声認識装置に対して、それ自体をイネーブルし、前記音声ウェイクアップ装置によってバッファされた第1の音声情報を認識するように指示するために用いられる、ステップと、
前記トリガ信号を受信した後、前記音声認識装置によって、それ自体をイネーブル化し、第2のプリセットされた持続時間の第2の音声情報を聴取するステップと、
前記音声ウェイクアップ装置によってバッファされた前記第1の音声情報、および聴取することによって取得された前記第2の音声情報を認識して、認識結果を取得するステップと
を含む音声認識方法。 - 前記音声認識装置が前記認識結果を取得した後、前記方法は、
前記音声認識装置によって、前記取得された認識結果と、予め記憶された音声命令情報との間の突き合わせを行うステップと、
前記音声認識装置によって、一致した音声命令情報に対応する動作を行うステップとをさらに含む
請求項4に記載の方法。 - 前記トリガ信号が受信された後、第3のプリセットされた持続時間内で前記トリガ信号が再び受信されなかったと決定したとき、前記音声認識装置によってそれ自体を自動的にディセーブルするステップをさらに含む
請求項4または5に記載の方法。 - 音声ウェイクアップ装置によって、周囲環境における音声情報を聴取するステップと、
聴取することによって取得された前記音声情報が音声ウェイクアップモデルと一致すると決定したとき、前記音声ウェイクアップ装置によって、音声認識装置のイネーブル化をトリガするためのトリガ信号を送るステップと
を含む音声認識方法。 - 聴取することによって取得された前記音声情報が音声ウェイクアップモデルと一致すると決定する前記ステップは、
聴取することによって取得された前記音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された前記音声情報が前記音声ウェイクアップモデルと一致すると決定するステップを含む
請求項7に記載の方法。 - 聴取することによって取得された前記音声情報が音声ウェイクアップモデルと一致すると決定する前記ステップは、
聴取することによって取得された前記音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声信号の声紋特徴を抽出し、前記抽出された声紋特徴が所定の声紋特徴と一致すると決定し、聴取することによって取得された前記音声情報が前記音声ウェイクアップモデルと一致すると決定するステップを含む
請求項7に記載の方法。 - 音声認識装置によって、音声ウェイクアップ装置によって送られたトリガ信号を受信するステップと、
前記音声認識装置によって、前記トリガ信号を受信した後、それ自体をイネーブル化し、ユーザに音声プロンプト命令を送るステップと、
前記音声認識装置によって、前記音声プロンプト命令に従って前記ユーザによって入力された音声信号を記録し、前記音声信号に対する認識を行って認識結果を取得するステップと
を含む音声認識方法。 - 周囲環境における音声情報を聴取するように構成された聴取モジュールと、
前記聴取モジュールによって聴取することによって取得された前記音声情報が、音声ウェイクアップモデルと一致するかどうかを決定するように構成された決定モジュールと、
前記決定モジュールが、前記聴取モジュールによって聴取することによって取得された前記音声情報が前記音声ウェイクアップモデルと一致すると決定したとき、前記聴取モジュールによって聴取することによって取得される第1のプリセットされた持続時間の音声情報をバッファするように構成されたバッファモジュールと、
音声認識装置のイネーブル化をトリガするためのトリガ信号を送るように構成された送出モジュールであって、前記トリガ信号は、前記音声認識装置に対して、前記音声認識装置がイネーブルされた後、前記音声ウェイクアップ装置によってバッファされた前記音声情報を読み出し、認識するように指示するために用いられる、送出モジュールと
を含む音声ウェイクアップ装置。 - 前記決定モジュールは、聴取することによって取得された前記音声情報が所定のウェイクアップ音声情報と一致すると決定したとき、聴取することによって取得された前記音声情報が前記音声ウェイクアップモデルと一致すると決定するように特に構成される
請求項11に記載の装置。 - 前記決定モジュールが、聴取することによって取得された前記音声情報が所定のウェイクアップ音声情報と一致すると決定したとき、聴取することによって取得された音声信号の声紋特徴を抽出するように構成された抽出モジュールをさらに備え、
前記決定モジュールは、前記抽出モジュールによって抽出された前記声紋特徴が所定の声紋特徴と一致すると決定したとき、聴取することによって取得された前記音声情報が前記音声ウェイクアップモデルと一致すると決定するようにさらに構成される
請求項11に記載の装置。 - 音声ウェイクアップ装置によって送られたトリガ信号を受信するように構成された受信モジュールであって、前記トリガ信号は、前記音声認識装置に対して、それ自体をイネーブルし、前記音声ウェイクアップ装置によってバッファされた第1の音声情報を認識するように指示するために用いられる、受信モジュールと、
前記受信モジュールが前記トリガ信号を受信した後、それ自体をイネーブルし、第2のプリセットされた持続時間の第2の音声情報を聴取するように構成された聴取モジュールと、
前記音声ウェイクアップ装置によってバッファされた前記第1の音声情報、および前記聴取モジュールによって聴取することによって取得された前記第2の音声情報を認識して、認識結果を取得するように構成された認識モジュールと
を備える音声認識装置。 - 前記認識モジュールが認識を行った後に取得された前記認識結果と、予め記憶された音声命令情報との間の突き合わせを行うように構成された突き合わせモジュールと、
一致した音声命令情報に対応する動作を行うように構成された実行モジュールとをさらに備える
請求項14に記載の装置。 - 前記トリガ信号が受信された後、第3のプリセットされた持続時間内で前記トリガ信号が再び受信されなかったとき、前記認識モジュールをディセーブルするように構成されたディセーブル化モジュールをさらに備える
請求項14または15に記載の装置。 - 周囲環境における音声情報を聴取するように構成された聴取モジュールと、
聴取することによって取得された前記音声情報が音声ウェイクアップモデルと一致するかどうかを決定するように構成された決定モジュールと、
前記決定モジュールが、聴取することによって取得された前記音声情報が前記音声ウェイクアップモデルと一致すると決定したとき、音声認識装置のイネーブル化をトリガするためのトリガ信号を送るように構成された送出モジュールと
を備える、音声ウェイクアップ装置。 - 前記決定モジュールは、聴取することによって取得された前記音声情報が所定のウェイクアップ音声情報と一致すると決定したとき、聴取することによって取得された前記音声情報が前記音声ウェイクアップモデルと一致すると決定するように特に構成される
請求項17に記載の装置。 - 前記決定モジュールが、聴取することによって取得された前記音声情報が所定のウェイクアップ音声情報と一致すると決定したとき、聴取することによって取得された音声信号の声紋特徴を抽出するように構成された抽出モジュールをさらに備え、
前記決定モジュールは、前記抽出された声紋特徴が所定の声紋特徴と一致すると決定したとき、聴取することによって取得された前記音声情報が前記音声ウェイクアップモデルと一致すると決定するように特に構成される
請求項17に記載の装置。 - 音声ウェイクアップ装置によって送られたトリガ信号を受信するように構成された受信モジュールと、
前記受信モジュールが前記トリガ信号を受信した後、それ自体をイネーブルし、ユーザに音声プロンプト命令を送るように構成された送出モジュールと、
前記音声プロンプト命令に従って前記ユーザによって入力された音声信号を記録し、前記音声信号を認識して認識結果を取得するように構成された処理モジュールと
を備える、音声認識装置。 - 音声ウェイクアップ装置と、音声認識装置とを備え、
前記音声ウェイクアップ装置は、周囲環境における音声情報を聴取し、聴取することによって取得された前記音声情報が音声ウェイクアップモデルと一致すると決定したとき、第1のプリセットされた持続時間内で聴取することによって取得される第1の音声情報をバッファし、前記音声認識装置のイネーブル化をトリガするためのトリガ信号を送るように構成され、
前記音声認識装置は、前記音声ウェイクアップ装置によって送られた前記トリガ信号を受信した後、それ自体をイネーブルし、第2のプリセットされた持続時間内で第2の音声情報を聴取し、前記音声ウェイクアップ装置によってバッファされた前記第1の音声情報、および聴取することによって取得された前記第2の音声情報を認識して認識結果を取得するように構成される、端末。 - 前記音声ウェイクアップ装置は、デジタル信号プロセッサDSPである
請求項21に記載の端末。 - 前記音声認識装置は、アプリケーションプロセッサAPである
請求項21または22に記載の端末。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019137200A JP6817386B2 (ja) | 2019-07-25 | 2019-07-25 | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019137200A JP6817386B2 (ja) | 2019-07-25 | 2019-07-25 | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017553159A Division JP6564058B2 (ja) | 2015-04-10 | 2015-04-10 | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020215271A Division JP7258007B2 (ja) | 2020-12-24 | 2020-12-24 | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019204112A true JP2019204112A (ja) | 2019-11-28 |
JP2019204112A5 JP2019204112A5 (ja) | 2020-11-12 |
JP6817386B2 JP6817386B2 (ja) | 2021-01-20 |
Family
ID=68726870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019137200A Active JP6817386B2 (ja) | 2019-07-25 | 2019-07-25 | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6817386B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111192581A (zh) * | 2020-01-07 | 2020-05-22 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法、设备及存储介质 |
CN111724780A (zh) * | 2020-06-12 | 2020-09-29 | 北京小米松果电子有限公司 | 设备的唤醒方法及装置、电子设备、存储介质 |
CN112241249A (zh) * | 2020-10-21 | 2021-01-19 | 北京小米松果电子有限公司 | 确定唤醒时延的方法、装置、存储介质及终端设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140222436A1 (en) * | 2013-02-07 | 2014-08-07 | Apple Inc. | Voice trigger for a digital assistant |
-
2019
- 2019-07-25 JP JP2019137200A patent/JP6817386B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140222436A1 (en) * | 2013-02-07 | 2014-08-07 | Apple Inc. | Voice trigger for a digital assistant |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111192581A (zh) * | 2020-01-07 | 2020-05-22 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法、设备及存储介质 |
CN111724780A (zh) * | 2020-06-12 | 2020-09-29 | 北京小米松果电子有限公司 | 设备的唤醒方法及装置、电子设备、存储介质 |
US11665644B2 (en) | 2020-06-12 | 2023-05-30 | Beijing Xiaomi Pinecone Electronics Co., Ltd. | Device wakeup method and apparatus, electronic device, and storage medium |
CN112241249A (zh) * | 2020-10-21 | 2021-01-19 | 北京小米松果电子有限公司 | 确定唤醒时延的方法、装置、存储介质及终端设备 |
Also Published As
Publication number | Publication date |
---|---|
JP6817386B2 (ja) | 2021-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11783825B2 (en) | Speech recognition method, speech wakeup apparatus, speech recognition apparatus, and terminal | |
JP6811758B2 (ja) | 音声対話方法、装置、デバイス及び記憶媒体 | |
US11056117B2 (en) | Enhanced voiceprint authentication | |
KR102223017B1 (ko) | 공유된 음성 작동 디바이스상의 호출 핸들링 | |
US9978369B2 (en) | Method and apparatus for voice control of a mobile device | |
US8909537B2 (en) | Device capable of playing music and method for controlling music playing in electronic device | |
JP6817386B2 (ja) | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 | |
EP2446434A1 (en) | Telecommunications device with voice-controlled functionality including walk-through pairing and voice-triggered operation | |
WO2020063451A1 (zh) | 通话留言方法、终端和具有存储功能的装置 | |
JP7258007B2 (ja) | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 | |
US6625474B1 (en) | Method and apparatus for audio signal based answer call message generation | |
US10887693B2 (en) | Method for switching mode and electronic device employing the method | |
EP2772908B1 (en) | Method And Apparatus For Voice Control Of A Mobile Device | |
TW201336290A (zh) | 通信裝置及通信方法 | |
JP2013257428A (ja) | 音声認識装置 | |
WO2019047220A1 (zh) | 一种应用程序启动方法及终端、计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190826 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190826 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200917 |
|
TRDD | Decision of grant or rejection written | ||
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200925 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200929 |
|
AA91 | Notification that invitation to amend document was cancelled |
Free format text: JAPANESE INTERMEDIATE CODE: A971091 Effective date: 20201110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201224 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6817386 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |