JP6817386B2 - 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 - Google Patents
音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 Download PDFInfo
- Publication number
- JP6817386B2 JP6817386B2 JP2019137200A JP2019137200A JP6817386B2 JP 6817386 B2 JP6817386 B2 JP 6817386B2 JP 2019137200 A JP2019137200 A JP 2019137200A JP 2019137200 A JP2019137200 A JP 2019137200A JP 6817386 B2 JP6817386 B2 JP 6817386B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- information
- wakeup
- recognition device
- wake
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 58
- 230000003595 spectral effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 230000002618 waking effect Effects 0.000 claims description 2
- 239000000872 buffer Substances 0.000 description 24
- 230000004913 activation Effects 0.000 description 10
- 238000004590 computer program Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Images
Description
音声ウェイクアップ装置によって、周囲環境における音声情報を聴取するステップと、
聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定したとき、音声ウェイクアップ装置によって、聴取することによって取得される第1のプリセットされた持続時間の音声情報をバッファし、音声認識装置のイネーブル化をトリガするためのトリガ信号を送るステップであって、トリガ信号は、音声認識装置に対して、音声認識装置がイネーブルされた後、音声ウェイクアップ装置によってバッファされた音声情報を読み出し、認識するように指示するために用いられる、ステップとを含む。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するステップを含む。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声信号の声紋特徴を抽出し、抽出された声紋特徴が所定の声紋特徴と一致すると決定し、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するステップを含む。
音声認識装置によって、音声ウェイクアップ装置によって送られたトリガ信号を受信するステップであって、トリガ信号は、音声認識装置に対して、それ自体をイネーブルし、音声ウェイクアップ装置によってバッファされた第1の音声情報を認識するように指示するために用いられる、ステップと、
トリガ信号を受信した後、音声認識装置によって、それ自体をイネーブル化し、第2のプリセットされた持続時間の第2の音声情報を聴取するステップと、
音声ウェイクアップ装置によってバッファされた第1の音声情報、および聴取することによって取得された第2の音声情報を認識して、認識結果を取得するステップとを含む。
音声認識装置によって、取得された認識結果と、予め記憶された音声命令情報との間の突き合わせを行うステップと、
一致した音声命令情報に対応する動作を、音声認識装置によって行うステップとをさらに含む。
トリガ信号が受信された後、第3のプリセットされた持続時間内でトリガ信号が再び受信されなかったと決定したとき、音声認識装置によってそれ自体を自動的にディセーブルするステップをさらに含む。
音声ウェイクアップ装置によって、周囲環境における音声情報を聴取するステップと、
聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定したとき、音声ウェイクアップ装置によって、音声認識装置のイネーブル化をトリガするためのトリガ信号を送るステップとを含む。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するステップを含む。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声信号の声紋特徴を抽出し、抽出された声紋特徴が所定の声紋特徴と一致すると決定し、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するステップを含む。
音声認識装置によって、音声ウェイクアップ装置によって送られたトリガ信号を受信するステップと、
音声認識装置によって、トリガ信号を受信した後、それ自体をイネーブル化し、ユーザに音声プロンプト命令を送るステップと、
音声認識装置によって、音声プロンプト命令に従ってユーザによって入力された音声信号を記録し、音声信号に対する認識を行って認識結果を取得するステップとを含む。
周囲環境における音声情報を聴取するように構成された聴取モジュールと、
聴取モジュールによって聴取することによって取得された音声情報が、音声ウェイクアップモデルと一致するかどうかを決定するように構成された決定モジュールと、
決定モジュールが、聴取モジュールによって聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定したとき、聴取モジュールによって聴取することによって取得される第1のプリセットされた持続時間の音声情報をバッファするように構成されたバッファモジュールと、
音声認識装置のイネーブル化をトリガするためのトリガ信号を送るように構成された送出モジュールであって、トリガ信号は、音声認識装置に対して、音声認識装置がイネーブルされた後、音声ウェイクアップ装置によってバッファされた音声情報を読み出し、認識するように指示するために用いられる、送出モジュールとを含む。
決定モジュールが、聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致すると決定したとき、聴取することによって取得された音声信号の声紋特徴を抽出するように構成された抽出モジュールをさらに含み、
決定モジュールは、抽出モジュールによって抽出された声紋特徴が所定の声紋特徴と一致すると決定したとき、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するようにさらに構成される。
音声ウェイクアップ装置によって送られたトリガ信号を受信するように構成された受信モジュールであって、トリガ信号は、音声認識装置に対して、それ自体をイネーブルし、音声ウェイクアップ装置によってバッファされた第1の音声情報を認識するように指示するために用いられる、受信モジュールと、
受信モジュールがトリガ信号を受信した後、それ自体をイネーブルし、第2のプリセットされた持続時間の第2の音声情報を聴取するように構成された聴取モジュールと、
音声ウェイクアップ装置によってバッファされた第1の音声情報、および聴取モジュールによって聴取することによって取得された第2の音声情報を認識して、認識結果を取得するように構成された認識モジュールとを含む。
認識モジュールが認識を行った後に取得された認識結果と、予め記憶された音声命令情報との間の突き合わせを行うように構成された突き合わせモジュールと、
一致した音声命令情報に対応する動作を行うように構成された実行モジュールとをさらに含む。
トリガ信号が受信された後、第3のプリセットされた持続時間内でトリガ信号が再び受信されなかったとき、音声認識モジュールをディセーブルするように構成されたディセーブル化モジュールをさらに含む。
周囲環境における音声情報を聴取するように構成された聴取モジュールと、
聴取することによって取得された音声情報が音声ウェイクアップモデルと一致するかどうかを決定するように構成された決定モジュールと、
決定モジュールが、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定したとき、音声認識装置のイネーブル化をトリガするためのトリガ信号を送るように構成された送出モジュールとを含む。
決定モジュールが、聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致すると決定したとき、聴取することによって取得された音声信号の声紋特徴を抽出するように構成された抽出モジュールをさらに含み、
決定モジュールは、抽出された声紋特徴が所定の声紋特徴と一致すると決定したとき、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するように特に構成される。
音声ウェイクアップ装置によって送られたトリガ信号を受信するように構成された受信モジュールと、
受信モジュールがトリガ信号を受信した後、それ自体をイネーブルし、ユーザに音声プロンプト命令を送るように構成された送出モジュールと、
音声プロンプト命令に従ってユーザによって入力された音声信号を記録し、音声信号を認識して認識結果を取得するように構成された処理モジュールとを含む。
音声ウェイクアップ装置と、音声認識装置とを含み、
音声ウェイクアップ装置は、周囲環境における音声情報を聴取し、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定したとき、第1のプリセットされた持続時間内で聴取することによって取得される第1の音声情報をバッファし、音声認識装置のイネーブル化をトリガするためのトリガ信号を送るように構成され、
音声認識装置は、音声ウェイクアップ装置によって送られたトリガ信号を受信した後、それ自体をイネーブルし、第2のプリセットされた持続時間内で第2の音声情報を聴取し、音声ウェイクアップ装置によってバッファされた第1の音声情報、および聴取することによって取得された第2の音声情報を認識して認識結果を取得するように構成される。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声情報は、音声ウェイクアップモデルと一致する。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声信号の声紋特徴が抽出され、抽出された声紋特徴は所定の声紋特徴と一致し、聴取することによって取得された音声情報は音声ウェイクアップモデルと一致する。
ピッチ曲線、線形予測係数、スペクトル包絡線パラメータ、高調波エネルギー比率、共鳴ピーク周波数およびその帯域幅、ケプストラム(パワーケプストラムとも呼ばれる)、またはメル周波数ケプストラム係数(Mel Frequency Cepstrum Coefficient、略してMFCC)などの声紋特徴を反映する音響パラメータ。この実施形態は、上記で述べられた声紋特徴パラメータに限定されない。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声情報は、音声ウェイクアップモデルと一致する。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声信号の声紋特徴が抽出され、抽出された声紋特徴は所定の声紋特徴と一致し、聴取することによって取得された音声情報は音声ウェイクアップモデルと一致する。
音声認識装置によって、取得された認識結果と、予め記憶された音声命令情報との間の突き合わせを行うステップと、
音声認識装置によって、一致した音声命令情報に対応する動作の実行を制御するステップとをさらに含む。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声情報は、音声ウェイクアップモデルと一致する。
聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致するとき、聴取することによって取得された音声信号の声紋特徴が抽出され、抽出された声紋特徴は所定の声紋特徴と一致し、聴取することによって取得された音声情報は音声ウェイクアップモデルと一致する。
音声認識装置によって、取得された認識結果と、予め記憶された音声命令情報との間の突き合わせを行うステップと、
音声認識装置によって、一致した音声命令情報に対応する動作の実行を制御するステップとをさらに含む。
周囲環境における音声情報を聴取するように構成された聴取モジュール601と、
聴取モジュール601によって聴取することによって取得された音声情報が、音声ウェイクアップモデルと一致するかどうかを決定するように構成された決定モジュール602と、
決定モジュール602が、聴取モジュール601によって聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定したとき、聴取モジュール601によって聴取することによって取得される第1のプリセットされた持続時間の音声情報をバッファするように構成されたバッファモジュール603と、
音声認識装置のイネーブル化をトリガするためのトリガ信号を送るように構成された送出モジュール604であって、トリガ信号は、音声認識装置に対して、音声認識装置がイネーブルされた後、音声ウェイクアップ装置によってバッファされた音声情報を読み出し、認識するように指示するために用いられる、送出モジュール604とを含む。
決定モジュール602が、聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致すると決定したとき、聴取することによって取得された音声信号の声紋特徴を抽出するように構成された抽出モジュールをさらに含み、
決定モジュール602は、抽出モジュールによって抽出された声紋特徴が所定の声紋特徴と一致すると決定したとき、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するようにさらに構成される。
音声ウェイクアップ装置によって送られたトリガ信号を受信するように構成された受信モジュール701であって、トリガ信号は、音声認識装置に対して、それ自体をイネーブルし、音声ウェイクアップ装置によってバッファされた第1の音声情報を認識するように指示するために用いられる、受信モジュール701と、
受信モジュール701がトリガ信号を受信した後、それ自体をイネーブルし、第2のプリセットされた持続時間の第2の音声情報を聴取するように構成された聴取モジュール702と、
音声ウェイクアップ装置によってバッファされた第1の音声情報、および聴取モジュールによって聴取することによって取得された第2の音声情報を認識して、認識結果を取得するように構成された認識モジュール703とを含む。
認識モジュール703が認識を行った後に取得された認識結果と、予め記憶された音声命令情報との間の突き合わせを行うように構成された突き合わせモジュールと、
一致した音声命令情報に対応する動作を行うように構成された実行モジュールとをさらに含む。
受信モジュールがトリガ信号を受信した後、第3のプリセットされた持続時間内でトリガ信号が再び受信されなかったとき、音声認識モジュールをディセーブルするように構成されたディセーブル化モジュールをさらに含む。
周囲環境における音声情報を聴取するように構成された聴取モジュール801と、
聴取することによって取得された音声情報が音声ウェイクアップモデルと一致するかどうかを決定するように構成された決定モジュール802と、
決定モジュール802が、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定したとき、音声認識装置のイネーブル化をトリガするためのトリガ信号を送るように構成された送出モジュール803とを含む。
決定モジュール802が、聴取することによって取得された音声情報が所定のウェイクアップ音声情報と一致すると決定したとき、聴取することによって取得された音声信号の声紋特徴を抽出するように構成された抽出モジュールをさらに含み、
決定モジュール802は、抽出された声紋特徴が所定の声紋特徴と一致すると決定したとき、聴取することによって取得された音声情報が音声ウェイクアップモデルと一致すると決定するように特に構成される。
音声ウェイクアップ装置によって送られたトリガ信号を受信するように構成された受信モジュール901と、
受信モジュール901がトリガ信号を受信した後、それ自体をイネーブルし、ユーザに音声プロンプト命令を送るように構成された送出モジュール902と、
音声プロンプト命令に従ってユーザによって入力された音声信号を記録し、音声信号を認識して認識結果を取得するように構成された処理モジュール903とを含む。
Serviceは、Bufferデータおよび記録データに対して、認識処理を行う。
Claims (25)
- 音声ウェイクアップ装置及び音声認識装置を含む端末に適用され、
前記音声ウェイクアップ装置によって、周辺環境内の第1の音声情報を聴取するステップであって、前記第1の音声情報は、ウェイクアップ情報と、コマンドワードの第1の部分とを含み、前記ウェイクアップ情報は、前記音声認識装置をイネーブルにするために使用される、ステップと、
前記音声ウェイクアップ装置によって、前記ウェイクアップ情報に従って、前記音声認識装置をイネーブルにするステップと、
前記音声認識装置によって、第2の音声情報を聴取するステップであって、前記第2の音声情報は、前記コマンドワードの第2の部分を含む、ステップと、
前記音声認識装置によって、前記第1の音声情報及び前記第2の音声情報に従って、音声指示情報を取得するステップであって、前記音声指示情報は、前記コマンドワードに一致し、前記コマンドワードは、前記コマンドワードの前記第1の部分と前記コマンドワードの前記第2の部分とを含む、ステップと
を含むことを特徴とする、音声制御方法。 - 前記音声ウェイクアップ装置によって、前記ウェイクアップ情報に従って、前記音声認識装置をイネーブルする前記ステップは、
前記音声ウェイクアップ装置によって、前記ウェイクアップ情報が音声ウェイクアップモデルと一致すると決定する場合に、前記音声認識装置をイネーブルにするためのトリガ信号を生成するステップを含む
請求項1に記載の方法。 - 前記ウェイクアップ情報が音声ウェイクアップモデルと一致すると決定することは、
前記ウェイクアップ情報が所定のウェイクアップ音声情報と一致する場合に、前記ウェイクアップ情報が音声ウェイクアップモデルと一致すると決定すること、を含む、
請求項2に記載の方法。 - 前記ウェイクアップ情報が音声ウェイクアップモデルと一致すると決定することは、
前記ウェイクアップ情報が所定のウェイクアップ音声情報と一致する場合に前記ウェイクアップ情報内の声紋特徴を抽出し、抽出された前記声紋特徴が所定の声紋特徴と一致する場合に前記ウェイクアップ情報が音声ウェイクアップモデルと一致すると決定することを含む
請求項2に記載の方法。 - 前記声紋特徴は、以下の特徴、即ち、ピッチ曲線、線形予測係数、スペクトル包絡線パラメータ、高調波エネルギー比率、共鳴ピーク周波数及びその帯域幅、ケプストラム、或いは、メル周波数ケプストラム係数のうちの1つ以上のものを含む
請求項4に記載の方法。 - 前記音声認識装置によって、前記第1の音声情報及び前記第2の音声情報に従って、音声指示情報を取得する前記ステップは、
前記音声認識装置によって、前記第1の音声情報及び前記第2の音声情報に従って、認識結果を取得するステップであって、前記認識結果は、コマンドワード情報を含む、ステップと、
前記音声認識装置によって、取得された前記認識結果と予め格納された音声指示情報との間のマッチングによって、前記認識結果に一致する前記音声指示情報を取得するステップとを含む、
請求項1に記載の方法。 - 前記ウェイクアップ情報は、第1の期間内に前記音声ウェイクアップ装置によって聴取され、前記コマンドワードの前記第1の部分は、第2の期間内に前記音声ウェイクアップ装置によって聴取され、
前記第2の音声情報は、第3の期間内に前記音声認識装置によって聴取される、
請求項1〜6のいずれか1項に記載の方法。 - 前記音声ウェイクアップ装置によって、周辺環境内の第1の音声情報を聴取する前記ステップは、
スタンバイ状態において周辺環境内の前記第1の音声情報を聴取するステップ、又は
非スタンバイ状態において周辺環境内の前記第1の音声情報を聴取するステップ、又は
スクリーンロック状態において周辺環境内の前記第1の音声情報を聴取するステップ
を含む、
請求項1〜6のいずれか1項に記載の方法。 - 前記音声ウェイクアップ装置によって、前記トリガ信号を前記音声認識装置に送信して、前記音声認識装置をイネーブルにするステップをさらに含む、
請求項2に記載の方法。 - 前記音声認識装置によって、一致した音声指示情報に対応する動作の実行を制御するステップをさらに含む、
請求項1〜6のいずれか1項に記載の方法。 - 前記音声認識装置をイネーブルにした後の事前設定された期間内に音声情報が再び受信されないと決定するとき、前記音声認識装置によって自動的にディセーブルにするステップをさらに含む、
請求項1〜6のいずれか1項に記載の方法。 - 前記音声ウェイクアップ装置は、デジタル信号プロセッサDSPである、
請求項1〜6のいずれか1項に記載の方法。 - 前記音声認識装置は、アプリケーションプロセッサAPである、
請求項1〜6のいずれか1項に記載の方法。 - 端末であって、
1つ又は複数のプロセッサと、
命令を格納するメモリであって、前記1つ又は複数のプロセッサによって前記命令が実行されたときに、請求項1〜13のいずれか1項に規定される前記方法を前記端末に実行させることを特徴とする、メモリと
を備える、端末。 - プロセッサによる実行のためにそこに格納されたコンピュータ利用可能命令を有する非一時的なコンピュータ読み取り可能媒体であって、前記命令が、前記プロセッサに、請求項1〜13のいずれか1項に記載の前記方法を実行させる、ことを特徴とする、
非一時的なコンピュータ読み取り可能媒体。 - 音声ウェイクアップ装置及び音声認識装置を含み、
前記音声ウェイクアップ装置は、周辺環境内の第1の音声情報を聴取することであって、前記第1の音声情報は、ウェイクアップ情報と、コマンドワードの第1の部分とを含み、前記ウェイクアップ情報は、前記音声認識装置をイネーブルにするために使用される、ことを行うように構成され、
前記音声ウェイクアップ装置は、前記ウェイクアップ情報に従って、前記音声認識装置をイネーブルにするように構成され、
前記音声認識装置は、第2の音声情報を聴取することであって、前記第2の音声情報は、前記コマンドワードの第2の部分を含む、ことを行うように構成され、
前記音声認識装置は、前記第1の音声情報及び前記第2の音声情報に従って、音声指示情報を取得することであって、前記音声指示情報は、前記コマンドワードに一致し、前記コマンドワードは、前記コマンドワードの前記第1の部分と前記コマンドワードの前記第2の部分とを含む、ことを行うように構成される、
ことを特徴とする、端末。 - 前記音声ウェイクアップ装置は、前記ウェイクアップ情報が所定のウェイクアップ音声情報と一致する場合に、前記ウェイクアップ情報が音声ウェイクアップモデルと一致すると決定するように構成される、
請求項16に記載の端末。 - 前記音声ウェイクアップ装置は、前記ウェイクアップ情報が所定のウェイクアップ音声情報と一致する場合に前記ウェイクアップ情報内の声紋特徴を抽出し、抽出された前記声紋特徴が所定の声紋特徴と一致する場合に前記ウェイクアップ情報が音声ウェイクアップモデルと一致すると決定する、ように構成される、
請求項16に記載の端末。 - 前記声紋特徴は、以下の特徴、即ち、ピッチ曲線、線形予測係数、スペクトル包絡線パラメータ、高調波エネルギー比率、共鳴ピーク周波数及びその帯域幅、ケプストラム、或いは、メル周波数ケプストラム係数のうちの1つ以上のものを含む
請求項18に記載の端末。 - 前記音声認識装置は、
前記第1の音声情報及び前記第2の音声情報に従って、認識結果を取得することであって、前記認識結果は、コマンドワード情報を含む、ことを行い、
取得された前記認識結果と予め格納された音声指示情報との間のマッチングによって、前記認識結果に一致する前記音声指示情報を取得する、ように構成される
請求項16に記載の端末。 - 前記ウェイクアップ情報は、第1の期間内に前記音声ウェイクアップ装置によって聴取され、前記コマンドワードの前記第1の部分は、第2の期間内に前記音声ウェイクアップ装置によって聴取され、
前記第2の音声情報は、第3の期間内に前記音声認識装置によって聴取される、
請求項16〜20のいずれか1項に記載の端末。 - 前記音声ウェイクアップ装置は、
スタンバイ状態において周辺環境内の前記第1の音声情報を聴取するか、又は
非スタンバイ状態において周辺環境内の前記第1の音声情報を聴取するか、又は
スクリーンロック状態において周辺環境内の前記第1の音声情報を聴取する
ように構成される、
請求項16〜20のいずれか1項に記載の端末。 - 前記音声認識装置は、
前記音声認識装置をイネーブルにした後の事前設定された期間内に音声情報が再び受信されないと決定するとき、自動的にディセーブルにするように構成される、
請求項16〜20のいずれか1項に記載の端末。 - 前記音声認識装置は、実行モジュールをさらに含み、
前記音声認識装置は、また、前記音声指示情報に一致する実行命令を前記実行モジュールに送るように構成され、
前記実行モジュールは、前記実行命令に対応する動作を実行するように構成される、
請求項16〜20のいずれか1項に記載の端末。 - 前記音声ウェイクアップ装置は、デジタル信号プロセッサDSPであり、
前記音声認識装置は、アプリケーションプロセッサAPである、
請求項16〜20のいずれか1項に記載の端末。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019137200A JP6817386B2 (ja) | 2019-07-25 | 2019-07-25 | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019137200A JP6817386B2 (ja) | 2019-07-25 | 2019-07-25 | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017553159A Division JP6564058B2 (ja) | 2015-04-10 | 2015-04-10 | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020215271A Division JP7258007B2 (ja) | 2020-12-24 | 2020-12-24 | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019204112A JP2019204112A (ja) | 2019-11-28 |
JP2019204112A5 JP2019204112A5 (ja) | 2020-11-12 |
JP6817386B2 true JP6817386B2 (ja) | 2021-01-20 |
Family
ID=68726870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019137200A Active JP6817386B2 (ja) | 2019-07-25 | 2019-07-25 | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6817386B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111192581A (zh) * | 2020-01-07 | 2020-05-22 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法、设备及存储介质 |
CN111724780B (zh) * | 2020-06-12 | 2023-06-30 | 北京小米松果电子有限公司 | 设备的唤醒方法及装置、电子设备、存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112015018905B1 (pt) * | 2013-02-07 | 2022-02-22 | Apple Inc | Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico |
-
2019
- 2019-07-25 JP JP2019137200A patent/JP6817386B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019204112A (ja) | 2019-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11783825B2 (en) | Speech recognition method, speech wakeup apparatus, speech recognition apparatus, and terminal | |
JP6811758B2 (ja) | 音声対話方法、装置、デバイス及び記憶媒体 | |
US8909537B2 (en) | Device capable of playing music and method for controlling music playing in electronic device | |
US20170330566A1 (en) | Distributed Volume Control for Speech Recognition | |
CN108962262B (zh) | 语音数据处理方法和装置 | |
US10978070B2 (en) | Speaker diarization | |
CN103002147A (zh) | 一种移动终端自动应答方法和装置 | |
JP6817386B2 (ja) | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 | |
JP2017138536A (ja) | 音声処理装置 | |
CN110910876A (zh) | 物品声寻装置及控制方法、语音控制设置方法和系统 | |
CN107680592A (zh) | 一种移动终端语音识别方法、及移动终端及存储介质 | |
CN108492826A (zh) | 音频处理方法、装置、智能设备及介质 | |
JP7258007B2 (ja) | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 | |
US11699438B2 (en) | Open smart speaker | |
US6625474B1 (en) | Method and apparatus for audio signal based answer call message generation | |
CN111128166B (zh) | 连续唤醒识别功能的优化方法和装置 | |
TW202025701A (zh) | 電子裝置及電子裝置的模式切換方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190826 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190826 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200917 |
|
TRDD | Decision of grant or rejection written | ||
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200925 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200929 |
|
AA91 | Notification that invitation to amend document was cancelled |
Free format text: JAPANESE INTERMEDIATE CODE: A971091 Effective date: 20201110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201224 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6817386 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |