JP6936888B2 - トレーニングコーパスの生成方法、装置、機器及び記憶媒体 - Google Patents
トレーニングコーパスの生成方法、装置、機器及び記憶媒体 Download PDFInfo
- Publication number
- JP6936888B2 JP6936888B2 JP2020041151A JP2020041151A JP6936888B2 JP 6936888 B2 JP6936888 B2 JP 6936888B2 JP 2020041151 A JP2020041151 A JP 2020041151A JP 2020041151 A JP2020041151 A JP 2020041151A JP 6936888 B2 JP6936888 B2 JP 6936888B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- corpus
- action
- training corpus
- action log
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Description
図1は、本発明の実施例1により提供されるトレーニングコーパスの生成方法のフローチャートである。本実施例は、音声認識されたトレーニングコーパスを生成する場合に適用することができ、当該方法は、本発明の実施例により提供されるトレーニングコーパスの生成装置によって実行することができる。当該装置は、ソフトウェア及び/又はハードウェアの形態で実現することができ、一般に、トレーニングコーパスの生成機器に統合することができる。トレーニングコーパスの生成機器は、コンピュータなどを含むが、これらに限定されない。図1に示すように、本実施例の方法は、具体的には、以下のステップ101及びテップ102を含む。
ステップ101において、ターゲットアプリケーションプログラムに関連付けられたユーザ行動ログにおいて複数のラベル付け対象コーパスデータをマイニングし、コーパスデータには、ユーザ音声及び対応する音声認識結果を含む第1の行動ログと、第1の行動ログに時間的に関連付けられ、且つ同一のユーザに属する第2の行動ログとが含まれる。
図2aは、本発明の実施例2により提供されるトレーニングコーパスの生成方法のフローチャートである。本実施例は、上記の一つ又は複数の実施例における各選択可能な態様と組み合わせることができる。本実施例では、各ラベル付け対象コーパスデータにおける第1の行動ログと第2の行動ログとの関連づけに基づいて、各コーパスデータにおけるユーザ音声及び対応する音声認識結果を正のフィードバックトレーニングコーパス又は負のフィードバックトレーニングコーパスとして判定するステップは、第1の行動ログのログタイプに基づいて、第1の行動ログに対応するユーザ予期行動を取得するステップと、ユーザ予期行動が第2の行動ログにマッチングすると決定した場合、コーパスデータにおけるユーザ音声及び対応する音声認識結果を正のフィードバックトレーニングコーパスとして判定するステップと、を含むことができる。
ステップ201において、ターゲットアプリケーションプログラムに関連付けられたユーザ行動ログにおいて複数のラベル付け対象コーパスデータをマイニングし、コーパスデータには、ユーザ音声及び対応する音声認識結果を含む第1の行動ログと、第1の行動ログに時間的に関連付けられ、且つ同一のユーザに属する第2の行動ログとが含まれる。
図3aは、本発明の実施例3により提供されるトレーニングコーパスの生成方法のフローチャートである。本実施例は、上記の一つ又は複数の実施例における各選択可能な態様と組み合わせることができ、本実施例では、各ラベル付け対象コーパスデータにおける第1の行動ログと第2の行動ログとの関連づけに基づいて、各コーパスデータにおけるユーザ音声及び対応する音声認識結果を正のフィードバックトレーニングコーパス又は負のフィードバックトレーニングコーパスとして判定するステップは、第2の行動ログに対応するユーザ行動が所定の期間内の第1の行動ログに対する修正行動であると決定した場合、コーパスデータにおけるユーザ音声及び対応する音声認識結果を負のフィードバックトレーニングコーパスとして判定するステップを含むことができる。
ステップ301において、ターゲットアプリケーションプログラムに関連付けられたユーザ行動ログにおいて複数のラベル付け対象コーパスデータをマイニングし、コーパスデータには、ユーザ音声及び対応する音声認識結果を含む第1の行動ログと、第1の行動ログに時間的に関連付けられ、且つ同一のユーザに属する第2の行動ログとが含まれる。
図4aは、本発明の実施例4により提供されるトレーニングコーパスの生成方法のフローチャートである。本実施例は、上記の一つ又は複数の実施例における各選択可能な態様と組み合わせることができる。本実施例では、各コーパスデータにおけるユーザ音声及び対応する音声認識結果を正のフィードバックトレーニングコーパス又は負のフィードバックトレーニングコーパスとして判定するステップの後に、正のフィードバックトレーニングコーパス及び負のフィードバックトレーニングコーパスに基づいて、トレーニングコーパスセットを構築し、トレーニングコーパスセットをトレーニングコーパス検収プラットフォームに送信するステップと、トレーニングコーパス検収プラットフォームによってフィードバックされた、トレーニングコーパスセットに対応する正確率指標値を受信するステップと、正確率指標値が予め設定された正確率閾値を満たしていると決定した場合、トレーニングコーパスセットを使用してターゲットアプリケーションプログラムの音声認識モデルの最適化トレーニングを行うステップと、をさらに含むことができる。
ステップ401において、ターゲットアプリケーションプログラムに関連付けられたユーザ行動ログにおいて複数のラベル付け対象コーパスデータをマイニングし、コーパスデータには、ユーザ音声及び対応する音声認識結果を含む第1の行動ログと、第1の行動ログに時間的に関連付けられ、且つ同一のユーザに属する第2の行動ログとが含まれる。
ステップ411において、ログを直列接続する。
ステップ421において、音声で位置検索を開始する。
ステップ481において、音声でルート検索を開始する。
ステップ431において、音声でナビゲーションを開始する。
ステップ441において、音声で第1の行動を開始する。
ステップ451において、ログを直列接続する。
ステップ461において、音声で検索する。
ステップ471において、音声で第1の行動を開始する。
図5は、本発明の実施例5により提供されるトレーニングコーパスの生成装置の概略構成図である。図5に示すように、前記装置は、コーパスデータマイニングモジュール501とコーパス判定モジュール502とを備える。
図6は、本発明の実施例6によって提供されるコンピュータ機器の概略構成図である。図6は、本発明の実施形態の実現に適する例示的なコンピュータ機器612のブロック図である。図6に示されるコンピュータ機器612は、単なる一例であり、本発明の実施例の機能及び使用範囲を一切限定しない。
本発明の実施例7は、コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体を提供し、当該プログラムがプロセッサによって実行される場合に、本出願のすべての発明の実施例により提供されるトレーニングコーパスの生成方法が実現される。すなわち、ターゲットアプリケーションプログラムに関連付けられたユーザ行動ログにおいて、複数のラベル付け対象コーパスデータをマイニングし、コーパスデータには、ユーザ音声及び対応する音声認識結果を含む第1の行動ログと、第1の行動ログに時間的に関連付けられ、且つ同一のユーザに属する第2の行動ログとが含まれ、各ラベル付け対象コーパスデータにおける第1の行動ログと第2の行動ログとの関連づけに基づいて、各コーパスデータにおけるユーザ音声及び対応する音声認識結果を正のフィードバックトレーニングコーパス又は負のフィードバックトレーニングコーパスとして判定する。
Claims (14)
- ターゲットアプリケーションプログラムに関連付けられたユーザ行動ログにおいて複数のラベル付け対象コーパスデータをマイニングするステップであって、前記コーパスデータには、ユーザ音声及び対応する音声認識結果を含む第1の行動ログと、前記第1の行動ログに時間的に関連付けられ、且つ同一のユーザに属する第2の行動ログとが含まれるステップと、
各前記ラベル付け対象コーパスデータにおける第1の行動ログと第2の行動ログとの関連づけに基づいて、各前記コーパスデータにおけるユーザ音声及び対応する音声認識結果を正のフィードバックトレーニングコーパス又は負のフィードバックトレーニングコーパスとして判定するステップと、
前記正のフィードバックトレーニングコーパス及び前記負のフィードバックトレーニングコーパスに基づいてトレーニングコーパスセットを構築し、前記トレーニングコーパスセットをトレーニングコーパス検収プラットフォームに送信するステップと、
前記トレーニングコーパス検収プラットフォームによってフィードバックされた、前記トレーニングコーパスセットに対応する正確率指標値を受信するステップと、
前記正確率指標値が予め設定された正確率閾値を満たすと決定した場合、前記トレーニングコーパスセットを使用して前記ターゲットアプリケーションプログラムの音声認識モデルの最適化トレーニングを行うステップと、
を含むトレーニングコーパスの生成方法。 - 各前記ラベル付け対象コーパスデータにおける第1の行動ログと第2の行動ログとの関連づけに基づいて、各前記コーパスデータにおけるユーザ音声及び対応する音声認識結果を正のフィードバックトレーニングコーパス又は負のフィードバックトレーニングコーパスとして判定するステップが、
第1の行動ログのログタイプに基づいて、前記第1の行動ログに対応するユーザ予期行動を取得するステップと、
前記ユーザ予期行動が前記第2の行動ログにマッチングすると決定した場合、前記コーパスデータにおける前記ユーザ音声及び対応する音声認識結果を正のフィードバックトレーニングコーパスとして判定するステップと、
を含む請求項1に記載の方法。 - 各前記ラベル付け対象コーパスデータにおける第1の行動ログと第2の行動ログとの関連づけに基づいて、各前記コーパスデータにおけるユーザ音声及び対応する音声認識結果を正のフィードバックトレーニングコーパス又は負のフィードバックトレーニングコーパスとして判定するステップが、
第2の行動ログに対応するユーザ行動が所定の期間内の前記第1の行動ログに対する修正行動であると決定した場合、前記コーパスデータにおける前記ユーザ音声及び対応する音声認識結果を負のフィードバックトレーニングコーパスとして判定するステップを含む請求項1に記載の方法。 - 前記ターゲットアプリケーションプログラムが、地図類アプリケーションプログラムを含む請求項1に記載の方法。
- 第1の行動ログのログタイプに基づいて、前記第1の行動ログに対応するユーザ予期行動を取得するステップが、
前記第1の行動ログのログタイプが、前記ユーザ音声に対応する音声認識結果を目的地として使用して位置検索サービスを開始するものであると決定した場合、前記ユーザ予期行動が、ユーザが前記位置検索サービスにマッチングする検索結果ページで前記目的地にマッチングするルート検索サービスを開始するオプションを選択することであると決定するステップを含む請求項2に記載の方法。 - 第1の行動ログのログタイプに基づいて、前記第1の行動ログに対応するユーザ予期行動を取得するステップが、
前記第1の行動ログのログタイプが、前記ユーザ音声に対応する音声認識結果を目的地としてルート検索サービスを開始するものであると決定した場合、前記ユーザ予期行動が、ユーザが前記ルート検索サービスにマッチングするルート検索ページで前記目的地にナビゲーションするオプションを選択することであると決定するステップを含む請求項2に記載の方法。 - 第1の行動ログのログタイプに基づいて、前記第1の行動ログに対応するユーザ予期行動を取得するステップが、
前記第1の行動ログのログタイプが、前記ユーザ音声に対応する音声認識結果を目的地としてルートナビゲーションサービスを開始するものであると決定した場合、前記ユーザ予期行動が、ユーザが前記目的地に到着することに成功したことであると決定するステップを含む請求項2に記載の方法。 - 第2の行動ログに対応するユーザ行動が所定の期間内の前記第1の行動ログに対する修正行動であると決定するステップが、
前記第2の行動ログに対応するユーザ行動が修正音声を再入力することであり、且つ前記修正音声に対応する修正認識結果と前記音声認識結果とが意味的関連条件を満たすと決定した場合、前記第2の行動ログに対応するユーザ行動が修正行動であると決定するステップ、及び/又は、
前記第2の行動ログに対応するユーザ行動が修正テキストを入力することであり、且つ前記修正テキストと前記音声認識結果とが意味的関連条件を満たすと決定した場合、前記第2の行動ログに対応するユーザ行動が修正行動であると決定するステップを含む請求項3に記載の方法。 - 前記意味的関連条件が、前記修正認識結果又は前記修正テキストが前記音声認識結果と異なり、且つ前記修正認識結果又は前記修正テキストと前記音声認識結果とが、予め設定された意味的類似度条件を満たすことを含む請求項8に記載の方法。
- 前記コーパスデータにおける前記ユーザ音声及び対応する音声認識結果を負のフィードバックトレーニングコーパスとして判定するステップの後に、
修正認識結果又は修正テキストを潜在的な正しい結果として前記負のフィードバックトレーニングコーパスに追加するステップと、
前記負のフィードバックトレーニングコーパスを手動ラベル付けモデルに送信して、前記手動ラベル付けモデルが前記潜在的な正しい結果に対して前記ユーザ音声に対応する正しい認識結果をラベル付けするステップと、
前記手動ラベル付けモデルによってフィードバックされたラベル付け結果を使用して、前記負のフィードバックトレーニングコーパスを更新するステップと、
を含む請求項3に記載の方法。 - 前記トレーニングコーパス検収プラットフォームによってフィードバックされた、前記トレーニングコーパスセットに対応する正確率指標値を受信するステップの後に、
前記正確率指標値が予め設定された正確率閾値を満たさないと決定した場合、ターゲットアプリケーションプログラムに関連付けられたユーザ行動ログに基づいて、複数の新しいラベル付け対象コーパスデータを再度マイニングし、新しいラベル付け対象コーパスデータにおいて新しい正のフィードバックトレーニングコーパス又は負のフィードバックトレーニングコーパスを判定するステップを含む請求項1に記載の方法。 - ターゲットアプリケーションプログラムに関連付けられたユーザ行動ログにおいて、複数のラベル付け対象コーパスデータをマイニングするように構成されるコーパスデータマイニングモジュールであって、前記コーパスデータには、ユーザ音声及び対応する音声認識結果を含む第1の行動ログと、前記第1の行動ログに時間的に関連付けられ、且つ同一のユーザに属する第2の行動ログとが含まれるコーパスデータマイニングモジュールと、
各前記ラベル付け対象コーパスデータにおける第1の行動ログと第2の行動ログとの関連づけに基づいて、各前記コーパスデータにおけるユーザ音声及び対応する音声認識結果を正のフィードバックトレーニングコーパス又は負のフィードバックトレーニングコーパスとして判定するように構成されるコーパス判定モジュールと、
前記正のフィードバックトレーニングコーパス及び前記負のフィードバックトレーニングコーパスに基づいてトレーニングコーパスセットを構築し、前記トレーニングコーパスセットをトレーニングコーパス検収プラットフォームに送信するように構成されるコーパスセット送信モジュールと、
前記トレーニングコーパス検収プラットフォームによってフィードバックされた、前記トレーニングコーパスセットに対応する正確率指標値を受信するように構成される指標値受信モジュールと、
前記正確率指標値が予め設定された正確率閾値を満たすと決定した場合、前記トレーニングコーパスセットを使用して前記ターゲットアプリケーションプログラムの音声認識モデルの最適化トレーニングを行うように構成されるコーパスセット使用モジュールと、
を備えるトレーニングコーパスの生成装置。 - メモリと、プロセッサと、メモリに記憶され、プロセッサで実行可能なコンピュータプログラムと、を備えるコンピュータ機器であって、
前記プロセッサが前記プログラムを実行する場合に、請求項1から11のいずれか一項に記載のトレーニングコーパスの生成方法を実現するコンピュータ機器。 - コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、
当該コンピュータプログラムがプロセッサにより実行される場合に、請求項1から11のいずれか一項に記載のトレーニングコーパスの生成方法が実現されるコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910179796.4A CN109949797B (zh) | 2019-03-11 | 2019-03-11 | 一种训练语料的生成方法、装置、设备及存储介质 |
CN201910179796.4 | 2019-03-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020149053A JP2020149053A (ja) | 2020-09-17 |
JP6936888B2 true JP6936888B2 (ja) | 2021-09-22 |
Family
ID=67008690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020041151A Active JP6936888B2 (ja) | 2019-03-11 | 2020-03-10 | トレーニングコーパスの生成方法、装置、機器及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11348571B2 (ja) |
EP (1) | EP3709295B1 (ja) |
JP (1) | JP6936888B2 (ja) |
KR (1) | KR102345156B1 (ja) |
CN (1) | CN109949797B (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111091812B (zh) * | 2019-11-26 | 2022-05-17 | 思必驰科技股份有限公司 | 小语种语料的生成方法及系统 |
CN111312219B (zh) * | 2020-01-16 | 2023-11-28 | 上海携程国际旅行社有限公司 | 电话录音标注方法、系统、存储介质和电子设备 |
US11043208B1 (en) * | 2020-02-20 | 2021-06-22 | Clinc, Inc. | Systems and methods for mixed setting training for slot filling machine learning tasks in a machine learning task-oriented dialogue system |
CN111914114A (zh) * | 2020-07-31 | 2020-11-10 | 海信视像科技股份有限公司 | 一种badcase挖掘方法及电子设备 |
CN111916088B (zh) * | 2020-08-12 | 2022-09-27 | 腾讯科技(深圳)有限公司 | 一种语音语料的生成方法、设备及计算机可读存储介质 |
CN112002326A (zh) * | 2020-10-28 | 2020-11-27 | 深圳市一恒科电子科技有限公司 | 一种交互方法及机器人设备 |
CN112417116B (zh) * | 2020-11-18 | 2022-03-15 | 四川长虹电器股份有限公司 | 一种基于少样本语料的问句理解模型训练方法和系统 |
CN112614479B (zh) * | 2020-11-26 | 2022-03-25 | 北京百度网讯科技有限公司 | 训练数据的处理方法、装置及电子设备 |
US11676593B2 (en) * | 2020-12-01 | 2023-06-13 | International Business Machines Corporation | Training an artificial intelligence of a voice response system based on non_verbal feedback |
CN112700763B (zh) * | 2020-12-26 | 2024-04-16 | 中国科学技术大学 | 语音标注质量评价方法、装置、设备及存储介质 |
CN112905232B (zh) * | 2021-02-05 | 2023-11-28 | 中国海洋大学 | 一种基于语法分析树的程序代码平行语料挖掘方法及系统 |
US11816432B2 (en) * | 2021-02-09 | 2023-11-14 | Capital One Services, Llc | Systems and methods for increasing accuracy in categorizing characters in text string |
CN112767924A (zh) | 2021-02-26 | 2021-05-07 | 北京百度网讯科技有限公司 | 语音识别方法、装置、电子设备及存储介质 |
CN113327591B (zh) * | 2021-06-16 | 2023-01-17 | 北京有竹居网络技术有限公司 | 一种语音处理方法及装置 |
CN113539245B (zh) * | 2021-07-05 | 2024-03-15 | 思必驰科技股份有限公司 | 语言模型自动训练方法及系统 |
CN114974221B (zh) * | 2022-04-29 | 2024-01-19 | 中移互联网有限公司 | 语音识别模型训练方法及装置、计算机可读存储介质 |
CN115687935A (zh) * | 2023-01-05 | 2023-02-03 | 粤港澳大湾区数字经济研究院(福田) | 语音识别的后处理方法、装置、设备及存储介质 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6122613A (en) * | 1997-01-30 | 2000-09-19 | Dragon Systems, Inc. | Speech recognition using multiple recognizers (selectively) applied to the same input sample |
US6374221B1 (en) | 1999-06-22 | 2002-04-16 | Lucent Technologies Inc. | Automatic retraining of a speech recognizer while using reliable transcripts |
JP3726125B2 (ja) | 2001-08-15 | 2005-12-14 | 独立行政法人情報通信研究機構 | テキストコーパスの誤り検出方法及び装置 |
US7203644B2 (en) * | 2001-12-31 | 2007-04-10 | Intel Corporation | Automating tuning of speech recognition systems |
US7383170B2 (en) * | 2003-10-10 | 2008-06-03 | At&T Knowledge Ventures, L.P. | System and method for analyzing automatic speech recognition performance data |
US20080235018A1 (en) * | 2004-01-20 | 2008-09-25 | Koninklikke Philips Electronic,N.V. | Method and System for Determing the Topic of a Conversation and Locating and Presenting Related Content |
JP4784056B2 (ja) | 2004-08-18 | 2011-09-28 | パナソニック電工株式会社 | 音声認識機能付制御装置 |
US7412387B2 (en) * | 2005-01-18 | 2008-08-12 | International Business Machines Corporation | Automatic improvement of spoken language |
US9620117B1 (en) * | 2006-06-27 | 2017-04-11 | At&T Intellectual Property Ii, L.P. | Learning from interactions for a spoken dialog system |
TWI321313B (en) * | 2007-03-03 | 2010-03-01 | Ind Tech Res Inst | Apparatus and method to reduce recognization errors through context relations among dialogue turns |
US20080243504A1 (en) * | 2007-03-30 | 2008-10-02 | Verizon Data Services, Inc. | System and method of speech recognition training based on confirmed speaker utterances |
JP5336805B2 (ja) | 2008-09-26 | 2013-11-06 | 株式会社東芝 | 音声翻訳装置、方法、およびプログラム |
WO2013170344A1 (en) * | 2012-05-15 | 2013-11-21 | Whyz Technologies Limited | Method and system relating to sentiment analysis of electronic content |
US9601111B2 (en) * | 2012-11-13 | 2017-03-21 | GM Global Technology Operations LLC | Methods and systems for adapting speech systems |
CN103871402B (zh) * | 2012-12-11 | 2017-10-10 | 北京百度网讯科技有限公司 | 语言模型训练系统、语音识别系统及相应方法 |
CN103971677B (zh) * | 2013-02-01 | 2015-08-12 | 腾讯科技(深圳)有限公司 | 一种声学语言模型训练方法和装置 |
US9679558B2 (en) * | 2014-05-15 | 2017-06-13 | Microsoft Technology Licensing, Llc | Language modeling for conversational understanding domains using semantic web resources |
KR102225404B1 (ko) * | 2014-05-23 | 2021-03-09 | 삼성전자주식회사 | 디바이스 정보를 이용하는 음성인식 방법 및 장치 |
US9378731B2 (en) * | 2014-09-25 | 2016-06-28 | Google Inc. | Acoustic model training corpus selection |
US9792281B2 (en) * | 2015-06-15 | 2017-10-17 | Microsoft Technology Licensing, Llc | Contextual language generation by leveraging language understanding |
JP6548994B2 (ja) * | 2015-09-04 | 2019-07-24 | 株式会社東芝 | 操作装置、訂正方法およびプログラム |
CN106992001B (zh) * | 2017-03-29 | 2020-05-22 | 百度在线网络技术(北京)有限公司 | 语音指令的处理方法、装置和系统 |
CN107657048B (zh) | 2017-09-21 | 2020-12-04 | 麒麟合盛网络技术股份有限公司 | 用户识别方法及装置 |
US10453454B2 (en) * | 2017-10-26 | 2019-10-22 | Hitachi, Ltd. | Dialog system with self-learning natural language understanding |
JP6654611B2 (ja) | 2017-12-05 | 2020-02-26 | 株式会社日立製作所 | 成長型対話装置 |
CN108153875B (zh) | 2017-12-26 | 2022-03-11 | 北京金山安全软件有限公司 | 语料处理方法、装置、智能音箱和存储介质 |
CN110489517B (zh) | 2018-05-09 | 2023-10-31 | 鼎捷软件股份有限公司 | 虚拟助理的自动学习方法及系统 |
CN109192194A (zh) * | 2018-08-22 | 2019-01-11 | 北京百度网讯科技有限公司 | 语音数据标注方法、装置、计算机设备及存储介质 |
CN109308895B (zh) * | 2018-12-04 | 2019-12-27 | 百度在线网络技术(北京)有限公司 | 声学模型训练方法、装置、设备及计算机可读介质 |
-
2019
- 2019-03-11 CN CN201910179796.4A patent/CN109949797B/zh active Active
-
2020
- 2020-02-06 KR KR1020200014487A patent/KR102345156B1/ko active IP Right Grant
- 2020-03-05 US US16/810,070 patent/US11348571B2/en active Active
- 2020-03-06 EP EP20161452.6A patent/EP3709295B1/en active Active
- 2020-03-10 JP JP2020041151A patent/JP6936888B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
KR102345156B1 (ko) | 2021-12-29 |
US11348571B2 (en) | 2022-05-31 |
JP2020149053A (ja) | 2020-09-17 |
KR20200108775A (ko) | 2020-09-21 |
CN109949797A (zh) | 2019-06-28 |
US20200294489A1 (en) | 2020-09-17 |
EP3709295B1 (en) | 2022-11-30 |
EP3709295A1 (en) | 2020-09-16 |
CN109949797B (zh) | 2021-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6936888B2 (ja) | トレーニングコーパスの生成方法、装置、機器及び記憶媒体 | |
EP3648099B1 (en) | Voice recognition method, device, apparatus, and storage medium | |
CN109002510B (zh) | 一种对话处理方法、装置、设备和介质 | |
WO2020108063A1 (zh) | 特征词的确定方法、装置和服务器 | |
CN111090727B (zh) | 语言转换处理方法、装置及方言语音交互系统 | |
CN108959257B (zh) | 一种自然语言解析方法、装置、服务器及存储介质 | |
WO2020215554A1 (zh) | 语音识别方法、装置、设备及计算机可读存储介质 | |
CN111739514B (zh) | 一种语音识别方法、装置、设备及介质 | |
US11398228B2 (en) | Voice recognition method, device and server | |
CN110930980A (zh) | 一种中英文混合语音的声学识别模型、方法及系统 | |
CN110377750B (zh) | 评论生成及评论生成模型训练方法、装置及存储介质 | |
CN111291882A (zh) | 一种模型转换的方法、装置、设备和计算机存储介质 | |
CN113553414A (zh) | 智能对话方法、装置、电子设备和存储介质 | |
JP2021152957A (ja) | 対話感情スタイル予測方法、装置、電子機器、記憶媒体及びプログラム | |
JP2022120024A (ja) | オーディオ信号処理方法、モデルトレーニング方法、並びにそれらの装置、電子機器、記憶媒体及びコンピュータプログラム | |
CN114399772B (zh) | 样本生成、模型训练和轨迹识别方法、装置、设备和介质 | |
WO2020052060A1 (zh) | 用于生成修正语句的方法和装置 | |
CN113778455B (zh) | 一种代码转换方法、装置、电子设备及存储介质 | |
CN109036379B (zh) | 语音识别方法、设备及存储介质 | |
CN112084768A (zh) | 一种多轮交互方法、装置及存储介质 | |
CN112925889A (zh) | 自然语言处理方法、装置、电子设备和存储介质 | |
CN106682221B (zh) | 问答交互的响应方法、装置及问答系统 | |
CN109815325B (zh) | 答案抽取方法、装置、服务器及存储介质 | |
CN113204667B (zh) | 音频标注模型的训练与音频标注的方法、装置 | |
CN114475631B (zh) | 驾驶数据处理方法装置、设备、自动驾驶车辆介质及产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210316 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210824 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210827 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6936888 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |