JP5901001B1 - 音響言語モデルトレーニングのための方法およびデバイス - Google Patents
音響言語モデルトレーニングのための方法およびデバイス Download PDFInfo
- Publication number
- JP5901001B1 JP5901001B1 JP2015555551A JP2015555551A JP5901001B1 JP 5901001 B1 JP5901001 B1 JP 5901001B1 JP 2015555551 A JP2015555551 A JP 2015555551A JP 2015555551 A JP2015555551 A JP 2015555551A JP 5901001 B1 JP5901001 B1 JP 5901001B1
- Authority
- JP
- Japan
- Prior art keywords
- word
- class label
- segmentation data
- word segmentation
- language model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 165
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000011218 segmentation Effects 0.000 claims abstract description 225
- 238000006467 substitution reaction Methods 0.000 claims description 13
- 238000004891 communication Methods 0.000 description 23
- 230000008569 process Effects 0.000 description 22
- 238000012545 processing Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 8
- 238000010606 normalization Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 101000934888 Homo sapiens Succinate dehydrogenase cytochrome b560 subunit, mitochondrial Proteins 0.000 description 1
- 241001316062 Labeo victorianus Species 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 102100025393 Succinate dehydrogenase cytochrome b560 subunit, mitochondrial Human genes 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
- G10L15/05—Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
Abstract
Description
本出願は、その全体が参照により本明細書に組み込まれている、2013年2月1日に出願した、「Method and Device for Training Acoustic Language Models」と題する中国特許出願第CN201310040085.1号の優先権を主張するものである。
302 単語クラス置換ユニット
303 言語モデルトレーニングユニット
304 音響言語モデル取得ユニット
305 音声認識ユニット
306 正規化ユニット
400 システム
402 プロセッサ
404 メモリ
406 I/Oインターフェース
408 ネットワーク通信インターフェース
410 通信バス、信号ライン
412 オペレーティングシステム
414 I/Oモジュール
416 通信モジュール
418 動作制御モジュール
420 前処理モジュール
422 言語モデルトレーニングモジュール
424 単語クラス置換モジュール
426 単語分割モジュール
428 後処理モジュール
430 音声認識モジュール
432 トレーニングコーパス
434 分類用語集
436 初期言語モデル
438 単語クラスラベルを有する言語モデル
Claims (20)
- 音響言語モデルをトレーニングする方法であって、
1つまたは複数のプロセッサとメモリとを有するデバイスにおいて、
単語クラスラベルを含まない初期単語分割データを得るために、単語クラスラベルを含まない初期言語モデルを使用して、トレーニングコーパス内のトレーニングサンプルに対して単語分割を行うステップと、
単語クラスラベルを含む第1の単語分割データを得るために、単語クラスラベルを含まない前記初期単語分割データに対して単語クラス置換を実行するステップと、
単語クラスラベルを含む第1の言語モデルをトレーニングするために、単語クラスラベルを含む前記第1の単語分割データを使用するステップと、
単語クラスラベルを含む第2の単語分割データを得るように、前記トレーニングコーパス内の前記トレーニングサンプルに対して単語分割を行うために、単語クラスラベルを含む前記第1の言語モデルを使用するステップと、
1つまたは複数の所定の基準を満たす前記第2の単語分割データに従って、前記音響言語モデルをトレーニングするために、単語クラスラベルを含む前記第2の単語分割データを使用するステップと
を含む、方法。 - 単語クラスラベルを含む第1の単語分割データを得るために、単語クラスラベルを含まない前記初期単語分割データに対して単語クラス置換を実行するステップが、
分類用語集内で、単語クラスラベルを含まない前記初期単語分割データ内の1つまたは複数のそれぞれの単語に関するそれぞれの単語クラスラベルを識別するステップと、
単語クラスラベルを含む前記第1の単語分割データを得るために、単語クラスラベルを含まない前記初期単語分割データ内の前記1つまたは複数のそれぞれの単語を、識別されたそれぞれの単語クラスラベルで置換するステップと
を含む、請求項1に記載の方法。 - 単語クラスラベルを含む第2の単語分割データを得るように、前記トレーニングコーパス内の前記トレーニングサンプルに対して単語分割を行うために、単語クラスラベルを含む前記第1の言語モデルを使用するステップが、
分類用語集内で、前記トレーニングコーパス内の前記トレーニングサンプル内の1つまたは複数のそれぞれの単語に関するそれぞれの単語クラスラベルを識別するステップと、
単語クラスラベルを含む新たなトレーニングサンプルを得るために、前記トレーニングサンプル内の前記1つまたは複数のそれぞれの単語を、識別されたそれぞれの単語クラスラベルで置換するステップと、
単語クラスラベルを含む前記第2の単語分割データを得るために、単語クラスラベルを含む前記第1の言語モデルを使用し、前記新たなトレーニングサンプルに対して単語分割を行うステップと
を含む、請求項1に記載の方法。 - 単語クラスラベルを含む前記第2の単語分割データを得た後、
前記第1および第2の単語分割データ内の対応するトレーニングサンプルの分割結果を比較するステップと、
前記第1の単語分割データが前記第2の単語分割データと一致するという判断に従って、前記音響言語モデルの前記トレーニングにおいて使用するために前記第2の単語分割データを承認するステップと
をさらに含む、請求項3に記載の方法。 - 単語クラスラベルを含む前記第2の単語分割データを得た後、
前記第1の単語分割データが前記第2の単語分割データと一致しないという判断に従って、前記第2の単語分割データを使用して前記第1の言語モデルを再トレーニングするステップをさらに含む、請求項4に記載の方法。 - 前記第1の言語モデルが再トレーニングされた後、改訂された第2の単語分割データを得るために、単語クラスラベルを含む前記第1の言語モデルを使用して、第2のトレーニングサンプルに対する前記単語分割を繰り返すステップと、
前記改訂された第2の単語分割データが前記第2の単語分割データと一致するという判断に従って、前記音響言語モデルの前記トレーニングにおいて使用するために前記改訂された第2の単語分割データを承認するステップと
をさらに含む、請求項5に記載の方法。 - 前記第1の単語分割データが前記第2の単語分割データと一致するという判断が、前記第1の単語分割データにおけるそれぞれの単語クラスラベル置換が、前記第2の単語分割データ内のそれぞれの単語クラスラベル置換と同一であるという判断をさらに含む、請求項4に記載の方法。
- 音響言語モデルをトレーニングするためのシステムであって、
1つまたは複数のプロセッサと、
命令が記憶されているメモリとを含み、前記命令が、前記1つまたは複数のプロセッサによって実行されると、前記プロセッサに、
単語クラスラベルを含まない初期単語分割データを得るために、単語クラスラベルを含まない初期言語モデルを使用して、トレーニングコーパス内のトレーニングサンプルに対して単語分割を行う動作と、
単語クラスラベルを含む第1の単語分割データを得るために、単語クラスラベルを含まない前記初期単語分割データに対して単語クラス置換を実行する動作と、
単語クラスラベルを含む第1の言語モデルをトレーニングするために、単語クラスラベルを含む前記第1の単語分割データを使用する動作と、
単語クラスラベルを含む第2の単語分割データを得るように、前記トレーニングコーパス内の前記トレーニングサンプルに対して単語分割を行うために、単語クラスラベルを含む前記第1の言語モデルを使用する動作と、
1つまたは複数の所定の基準を満たす前記第2の単語分割データに従って、前記音響言語モデルをトレーニングするために、単語クラスラベルを含む前記第2の単語分割データを使用する動作と
を実行させる、システム。 - 単語クラスラベルを含む第1の単語分割データを得るために、単語クラスラベルを含まない前記初期単語分割データに対して単語クラス置換を実行する動作が、
分類用語集内で、単語クラスラベルを含まない前記初期単語分割データ内の1つまたは複数のそれぞれの単語に関するそれぞれの単語クラスラベルを識別する動作と、
単語クラスラベルを含む前記第1の単語分割データを得るために、単語クラスラベルを含まない前記初期単語分割データ内の前記1つまたは複数のそれぞれの単語を、識別されたそれぞれの単語クラスラベルで置換する動作と
を含む、請求項8に記載のシステム。 - 単語クラスラベルを含む第2の単語分割データを得るように、前記トレーニングコーパス内の前記トレーニングサンプルに対して単語分割を行うために、単語クラスラベルを含む前記第1の言語モデルを使用する動作が、
分類用語集内で、前記トレーニングコーパス内の前記トレーニングサンプル内の1つまたは複数のそれぞれの単語に関するそれぞれの単語クラスラベルを識別する動作と、
単語クラスラベルを含む新たなトレーニングサンプルを得るために、前記トレーニングサンプル内の前記1つまたは複数のそれぞれの単語を、識別されたそれぞれの単語クラスラベルで置換する動作と、
単語クラスラベルを含む前記第2の単語分割データを得るために、単語クラスラベルを含む前記第1の言語モデルを使用し、前記新たなトレーニングサンプルに対して単語分割を行う動作と
を含む、請求項8に記載のシステム。 - 前記動作が、
単語クラスラベルを含む前記第2の単語分割データを得た後、
前記第1および第2の単語分割データ内の対応するトレーニングサンプルの分割結果を比較する動作と、
前記第1の単語分割データが前記第2の単語分割データと一致するという判断に従って、前記音響言語モデルの前記トレーニングで使用するために前記第2の単語分割データを承認する動作と
をさらに含む、請求項10に記載のシステム。 - 前記動作が、
単語クラスラベルを含む前記第2の単語分割データを得た後、
前記第1の単語分割データが前記第2の単語分割データと一致しないという判断に従って、前記第2の単語分割データを使用して前記第1の言語モデルを再トレーニングする動作をさらに含む、請求項11に記載のシステム。 - 前記動作が、
前記第1の言語モデルが再トレーニングされた後、改訂された第2の単語分割データを得るために、単語クラスラベルを含む前記第1の言語モデルを使用して、第2のトレーニングサンプルに対する前記単語分割を繰り返す動作と、
前記改訂された第2の単語分割データが前記第2の単語分割データと一致するという判断に従って、前記音響言語モデルの前記トレーニングで使用するために前記改訂された第2の単語分割データを承認する動作と
をさらに含む、請求項12に記載のシステム。 - 前記第1の単語分割データが前記第2の単語分割データと一致するという判断が、前記第1の単語分割データにおけるそれぞれの単語クラスラベル置換が、前記第2の単語分割データ内のそれぞれの単語クラスラベル置換と同一であるという判断をさらに含む、請求項11に記載のシステム。
- 音響言語モデルをトレーニングするための非一時的なコンピュータ可読記憶媒体であって、
1つまたは複数のプロセッサによって実行されると、前記プロセッサに、
単語クラスラベルを含まない初期単語分割データを得るために、単語クラスラベルを含まない初期言語モデルを使用して、トレーニングコーパス内のトレーニングサンプルに対して単語分割を行う動作と、
単語クラスラベルを含む第1の単語分割データを得るために、単語クラスラベルを含まない前記初期単語分割データに対して単語クラス置換を実行する動作と、
単語クラスラベルを含む第1の言語モデルをトレーニングするために、単語クラスラベルを含む前記第1の単語分割データを使用する動作と、
単語クラスラベルを含む第2の単語分割データを得るように、前記トレーニングコーパス内の前記トレーニングサンプルに対して単語分割を行うために、単語クラスラベルを含む前記第1の言語モデルを使用する動作と、
1つまたは複数の所定の基準を満たす前記第2の単語分割データに従って、前記音響言語モデルをトレーニングするために、単語クラスラベルを含む前記第2の単語分割データを使用する動作と
を実行させる命令が記憶された、コンピュータ可読記憶媒体。 - 単語クラスラベルを含む第1の単語分割データを得るために、単語クラスラベルを含まない前記初期単語分割データに対して単語クラス置換を実行する動作が、
分類用語集内で、単語クラスラベルを含まない前記初期単語分割データ内の1つまたは複数のそれぞれの単語に関するそれぞれの単語クラスラベルを識別する動作と、
単語クラスラベルを含む前記第1の単語分割データを得るために、単語クラスラベルを含まない前記初期単語分割データ内の前記1つまたは複数のそれぞれの単語を、識別されたそれぞれの単語クラスラベルで置換する動作と
を含む、請求項15に記載のコンピュータ可読記憶媒体。 - 単語クラスラベルを含む第2の単語分割データを得るように、前記トレーニングコーパス内の前記トレーニングサンプルに対して単語分割を行うために、単語クラスラベルを含む前記第1の言語モデルを使用する動作が、
分類用語集内で、前記トレーニングコーパス内の前記トレーニングサンプル内の1つまたは複数のそれぞれの単語に関するそれぞれの単語クラスラベルを識別する動作と、
単語クラスラベルを含む新たなトレーニングサンプルを得るために、前記トレーニングサンプル内の前記1つまたは複数のそれぞれの単語を、識別されたそれぞれの単語クラスラベルで置換する動作と、
単語クラスラベルを含む前記第2の単語分割データを得るために、単語クラスラベルを含む前記第1の言語モデルを使用して、前記新たなトレーニングサンプルに対して単語分割を行う動作と
を含む、請求項15に記載のコンピュータ可読記憶媒体。 - 前記動作が、
単語クラスラベルを含む前記第2の単語分割データを得た後、
前記第1および第2の単語分割データ内の対応するトレーニングサンプルの分割結果を比較する動作と、
前記第1の単語分割データが前記第2の単語分割データと一致するという判断に従って、前記音響言語モデルの前記トレーニングで使用するために前記第2の単語分割データを承認する動作と
をさらに含む、請求項17に記載のコンピュータ可読記憶媒体。 - 前記動作が、
単語クラスラベルを含む前記第2の単語分割データを得た後、
前記第1の単語分割データが前記第2の単語分割データと一致しないという判断に従って、前記第2の単語分割データを使用して前記第1の言語モデルを再トレーニングする動作をさらに含む、請求項18に記載のコンピュータ可読記憶媒体。 - 前記動作が、
前記第1の言語モデルが再トレーニングされた後、改訂された第2の単語分割データを得るために、単語クラスラベルを含む前記第1の言語モデルを使用して、第2のトレーニングサンプルに対する前記単語分割を繰り返す動作と、
前記改訂された第2の単語分割データが前記第2の単語分割データと一致するという判断に従って、前記音響言語モデルの前記トレーニングで使用するために前記改訂された第2の単語分割データを承認する動作と
をさらに含む、請求項19に記載のコンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310040085.1A CN103971677B (zh) | 2013-02-01 | 2013-02-01 | 一种声学语言模型训练方法和装置 |
CN201310040085.1 | 2013-02-01 | ||
PCT/CN2013/085948 WO2014117548A1 (en) | 2013-02-01 | 2013-10-25 | Method and device for acoustic language model training |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5901001B1 true JP5901001B1 (ja) | 2016-04-06 |
JP2016513269A JP2016513269A (ja) | 2016-05-12 |
Family
ID=51241096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015555551A Active JP5901001B1 (ja) | 2013-02-01 | 2013-10-25 | 音響言語モデルトレーニングのための方法およびデバイス |
Country Status (6)
Country | Link |
---|---|
JP (1) | JP5901001B1 (ja) |
CN (1) | CN103971677B (ja) |
BR (1) | BR112015018205B1 (ja) |
CA (1) | CA2899532C (ja) |
TW (1) | TWI512719B (ja) |
WO (1) | WO2014117548A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7098853B2 (ja) | 2020-03-19 | 2022-07-12 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | ラベルラベリングモデルを確立する方法、装置、電子機器、プログラム及び可読記憶媒体 |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106486114A (zh) * | 2015-08-28 | 2017-03-08 | 株式会社东芝 | 改进语言模型的方法和装置以及语音识别方法和装置 |
US10748528B2 (en) * | 2015-10-09 | 2020-08-18 | Mitsubishi Electric Corporation | Language model generating device, language model generating method, and recording medium |
CN105654945B (zh) * | 2015-10-29 | 2020-03-06 | 乐融致新电子科技(天津)有限公司 | 一种语言模型的训练方法及装置、设备 |
CN107204184B (zh) * | 2017-05-10 | 2018-08-03 | 平安科技(深圳)有限公司 | 语音识别方法及系统 |
CN109427330B (zh) * | 2017-09-05 | 2023-04-07 | 中国科学院声学研究所 | 一种基于统计语言模型得分规整的语音识别方法及系统 |
TWI639997B (zh) * | 2017-09-28 | 2018-11-01 | 大仁科技大學 | 基於機率規則之對話理解方法 |
CN110019305B (zh) * | 2017-12-18 | 2024-03-15 | 上海智臻智能网络科技股份有限公司 | 知识库扩展方法及存储介质、终端 |
CN110083820B (zh) * | 2018-01-26 | 2023-06-27 | 普天信息技术有限公司 | 一种基准分词模型的改进方法及装置 |
CN108197116B (zh) * | 2018-01-31 | 2021-05-28 | 天闻数媒科技(北京)有限公司 | 一种中文文本分词的方法、装置、分词设备及存储介质 |
CN110648657B (zh) * | 2018-06-27 | 2024-02-02 | 北京搜狗科技发展有限公司 | 一种语言模型训练方法、构建方法和装置 |
CN109616121A (zh) * | 2018-11-28 | 2019-04-12 | 北京捷通华声科技股份有限公司 | 一种数字转换方法和装置 |
CN109949797B (zh) * | 2019-03-11 | 2021-11-12 | 北京百度网讯科技有限公司 | 一种训练语料的生成方法、装置、设备及存储介质 |
CN110110041B (zh) * | 2019-03-15 | 2022-02-15 | 平安科技(深圳)有限公司 | 错词纠正方法、装置、计算机装置及存储介质 |
CN111694962A (zh) * | 2019-03-15 | 2020-09-22 | 阿里巴巴集团控股有限公司 | 数据处理方法和装置 |
WO2020218635A1 (ko) * | 2019-04-23 | 2020-10-29 | 엘지전자 주식회사 | 인공 지능을 이용한 음성 합성 장치, 음성 합성 장치의 동작 방법 및 컴퓨터로 판독 가능한 기록 매체 |
WO2020256170A1 (ko) * | 2019-06-18 | 2020-12-24 | 엘지전자 주식회사 | 인공 지능을 이용한 음성 합성 장치, 음성 합성 장치의 동작 방법 및 컴퓨터로 판독 가능한 기록 매체 |
CN110442859B (zh) * | 2019-06-28 | 2023-05-26 | 中国人民解放军国防科技大学 | 标注语料生成方法、装置、设备及存储介质 |
CN110489744A (zh) * | 2019-07-25 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 一种语料的处理方法、装置、电子设备和存储介质 |
CN111143521B (zh) * | 2019-10-28 | 2023-08-15 | 广州恒巨信息科技有限公司 | 基于知识图谱的法条检索方法、系统、装置及存储介质 |
CN110992939B (zh) * | 2019-12-18 | 2023-06-27 | 广州市百果园信息技术有限公司 | 语言模型训练方法、解码方法、装置、存储介质及设备 |
CN111125360B (zh) * | 2019-12-19 | 2023-10-20 | 网易(杭州)网络有限公司 | 游戏领域的情感分析方法、装置及其模型训练方法、装置 |
CN111291560B (zh) * | 2020-03-06 | 2023-05-23 | 深圳前海微众银行股份有限公司 | 样本扩充方法、终端、装置及可读存储介质 |
CN112397054B (zh) * | 2020-12-17 | 2023-11-24 | 北京中电飞华通信有限公司 | 一种电力调度语音识别方法 |
CN112735380B (zh) * | 2020-12-28 | 2022-05-13 | 思必驰科技股份有限公司 | 重打分语言模型的打分方法及语音识别方法 |
CN113177109A (zh) * | 2021-05-27 | 2021-07-27 | 中国平安人寿保险股份有限公司 | 文本的弱标注方法、装置、设备以及存储介质 |
CN116612750A (zh) * | 2023-05-23 | 2023-08-18 | 苏州科帕特信息科技有限公司 | 一种语言模型自动训练方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004034378A1 (ja) * | 2002-10-08 | 2004-04-22 | Matsushita Electric Industrial Co., Ltd. | 言語モデル生成蓄積装置、音声認識装置、言語モデル生成方法および音声認識方法 |
WO2007138875A1 (ja) * | 2006-05-31 | 2007-12-06 | Nec Corporation | 音声認識用単語辞書・言語モデル作成システム、方法、プログラムおよび音声認識システム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6404925B1 (en) * | 1999-03-11 | 2002-06-11 | Fuji Xerox Co., Ltd. | Methods and apparatuses for segmenting an audio-visual recording using image similarity searching and audio speaker recognition |
JP4590692B2 (ja) * | 2000-06-28 | 2010-12-01 | パナソニック株式会社 | 音響モデル作成装置及びその方法 |
CN1141697C (zh) * | 2000-09-27 | 2004-03-10 | 中国科学院自动化研究所 | 一种带调三音子模型及训练方法 |
DE10350652B3 (de) * | 2003-10-29 | 2005-06-30 | Yazaki Europe Ltd., Hemel Hempstead | Steckverbindergehäuse mit Kurzschlußbrücke |
US7684987B2 (en) * | 2004-01-21 | 2010-03-23 | Microsoft Corporation | Segmental tonal modeling for tonal languages |
FR2892846A1 (fr) * | 2005-11-03 | 2007-05-04 | France Telecom | Procede et dispositif de calcul de mesure de similarite entre une representation d'un segment audio de reference et une representation d'un segment audio a tester et procede et dispositif de suivi d'un locuteur de reference |
TWI297487B (en) * | 2005-11-18 | 2008-06-01 | Tze Fen Li | A method for speech recognition |
US8204747B2 (en) * | 2006-06-23 | 2012-06-19 | Panasonic Corporation | Emotion recognition apparatus |
US7617103B2 (en) * | 2006-08-25 | 2009-11-10 | Microsoft Corporation | Incrementally regulated discriminative margins in MCE training for speech recognition |
CN101261832B (zh) * | 2008-04-21 | 2011-05-25 | 北京航空航天大学 | 汉语语音情感信息的提取及建模方法 |
TWI389100B (zh) * | 2008-11-19 | 2013-03-11 | Inst Information Industry | 語音情緒的分類方法及其情緒語意模型的建立方法 |
CN102568477A (zh) * | 2010-12-29 | 2012-07-11 | 盛乐信息技术(上海)有限公司 | 一种半监督的发音模型建模系统及方法 |
CN102651217A (zh) * | 2011-02-25 | 2012-08-29 | 株式会社东芝 | 用于合成语音的方法、设备以及用于语音合成的声学模型训练方法 |
-
2013
- 2013-02-01 CN CN201310040085.1A patent/CN103971677B/zh active Active
- 2013-10-25 BR BR112015018205-4A patent/BR112015018205B1/pt active IP Right Grant
- 2013-10-25 CA CA2899532A patent/CA2899532C/en active Active
- 2013-10-25 WO PCT/CN2013/085948 patent/WO2014117548A1/en active Application Filing
- 2013-10-25 JP JP2015555551A patent/JP5901001B1/ja active Active
-
2014
- 2014-01-07 TW TW103100469A patent/TWI512719B/zh active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004034378A1 (ja) * | 2002-10-08 | 2004-04-22 | Matsushita Electric Industrial Co., Ltd. | 言語モデル生成蓄積装置、音声認識装置、言語モデル生成方法および音声認識方法 |
WO2007138875A1 (ja) * | 2006-05-31 | 2007-12-06 | Nec Corporation | 音声認識用単語辞書・言語モデル作成システム、方法、プログラムおよび音声認識システム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7098853B2 (ja) | 2020-03-19 | 2022-07-12 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | ラベルラベリングモデルを確立する方法、装置、電子機器、プログラム及び可読記憶媒体 |
US11531813B2 (en) | 2020-03-19 | 2022-12-20 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method, electronic device and readable storage medium for creating a label marking model |
Also Published As
Publication number | Publication date |
---|---|
CN103971677A (zh) | 2014-08-06 |
CA2899532A1 (en) | 2014-08-07 |
JP2016513269A (ja) | 2016-05-12 |
BR112015018205A2 (pt) | 2017-07-18 |
CN103971677B (zh) | 2015-08-12 |
WO2014117548A1 (en) | 2014-08-07 |
TWI512719B (zh) | 2015-12-11 |
TW201432669A (zh) | 2014-08-16 |
CA2899532C (en) | 2017-09-19 |
BR112015018205B1 (pt) | 2022-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5901001B1 (ja) | 音響言語モデルトレーニングのための方法およびデバイス | |
US9396723B2 (en) | Method and device for acoustic language model training | |
CN108363790B (zh) | 用于对评论进行评估的方法、装置、设备和存储介质 | |
CN108121700B (zh) | 一种关键词提取方法、装置及电子设备 | |
CN107729313B (zh) | 基于深度神经网络的多音字读音的判别方法和装置 | |
JP6493866B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US20160306783A1 (en) | Method and apparatus for phonetically annotating text | |
US10242670B2 (en) | Syntactic re-ranking of potential transcriptions during automatic speech recognition | |
KR20180005850A (ko) | 자동 통역 방법 및 장치, 및 기계 번역 방법 및 장치 | |
TW202020691A (zh) | 特徵詞的確定方法、裝置和伺服器 | |
CN107437417B (zh) | 基于循环神经网络语音识别中语音数据增强方法及装置 | |
CN112528637B (zh) | 文本处理模型训练方法、装置、计算机设备和存储介质 | |
CN114580382A (zh) | 文本纠错方法以及装置 | |
JP5809381B1 (ja) | 自然言語処理システム、自然言語処理方法、および自然言語処理プログラム | |
CN111079432A (zh) | 文本检测方法、装置、电子设备及存储介质 | |
CN113053367A (zh) | 语音识别方法、语音识别的模型训练方法以及装置 | |
US9135326B2 (en) | Text mining method, text mining device and text mining program | |
CN110503956B (zh) | 语音识别方法、装置、介质及电子设备 | |
KR102608867B1 (ko) | 업계 텍스트를 증분하는 방법, 관련 장치 및 매체에 저장된 컴퓨터 프로그램 | |
CN112559725A (zh) | 文本匹配方法、装置、终端和存储介质 | |
JP7096199B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
KR102204395B1 (ko) | 개체명 인식을 이용한 음성인식 띄어쓰기 보정 방법 및 시스템 | |
JP2013109364A (ja) | Cjk名前検出 | |
CN113362809B (zh) | 语音识别方法、装置和电子设备 | |
CN115858776A (zh) | 一种变体文本分类识别方法、系统、存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160303 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5901001 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |