JP7441864B2 - 多音字の発音を予測する方法、装置、設備、および記憶媒体 - Google Patents
多音字の発音を予測する方法、装置、設備、および記憶媒体 Download PDFInfo
- Publication number
- JP7441864B2 JP7441864B2 JP2021574349A JP2021574349A JP7441864B2 JP 7441864 B2 JP7441864 B2 JP 7441864B2 JP 2021574349 A JP2021574349 A JP 2021574349A JP 2021574349 A JP2021574349 A JP 2021574349A JP 7441864 B2 JP7441864 B2 JP 7441864B2
- Authority
- JP
- Japan
- Prior art keywords
- target
- polyphonic
- character
- vector
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 50
- 239000013598 vector Substances 0.000 claims description 190
- 239000013604 expression vector Substances 0.000 claims description 106
- 230000011218 segmentation Effects 0.000 claims description 47
- 238000012545 processing Methods 0.000 claims description 33
- 230000007246 mechanism Effects 0.000 claims description 31
- 238000011176 pooling Methods 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 19
- 238000002372 labelling Methods 0.000 claims description 18
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000015654 memory Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 208000003028 Stuttering Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/245—Classification techniques relating to the decision surface
- G06F18/2451—Classification techniques relating to the decision surface linear, e.g. hyperplane
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
ラベリングされた、目標多音字を含む被処理中国語フレーズを取得し、かつ前記被処理中国語フレーズの文字表現ベクトルセットと多音字表現ベクトルを取得することと、
前記被処理中国語フレーズに対して単語分割処理を実行して目標分割単語を得て、かつ前記目標分割単語に応じて前記文字表現ベクトルセットを単語レベル特徴表現ベクトルに変換することと、
前記多音字表現ベクトルと前記単語レベル特徴表現ベクトルに対して、注意力メカニズムに基づくスティッチング処理を行い、目標ベクトルを得ることと、
予め設定された線形層により、前記目標ベクトルの目標ピンイン確率を計算し、かつ前記目標ピンイン確率に基づいて前記目標多音字の目標発音を特定することと、を含む。
ラベリングされた、目標多音字を含む被処理中国語フレーズを取得し、かつ前記被処理中国語フレーズの文字表現ベクトルセットと多音字表現ベクトルを取得するための取得モジュールと、
前記被処理中国語フレーズに対して単語分割処理を実行して目標分割単語を得て、かつ前記目標分割単語に応じて前記文字表現ベクトルセットを単語レベル特徴表現ベクトルに変換するための変換モジュールと、
前記多音字表現ベクトルと前記単語レベル特徴表現ベクトルに対して、注意力メカニズムに基づくスティッチング処理を行い、目標ベクトルを得るためのスティッチングモジュールと、
予め設定された線形層により、前記目標ベクトルの目標ピンイン確率を計算し、かつ前記目標ピンイン確率に基づいて前記目標多音字の目標発音を特定するための特定モジュールと、を含む。
ラベリングされた、目標多音字を含む被処理中国語フレーズを取得し、かつ前記被処理中国語フレーズの文字表現ベクトルセットと多音字表現ベクトルを取得し、
前記被処理中国語フレーズに対して単語分割処理を実行して目標分割単語を得て、かつ前記目標分割単語に応じて前記文字表現ベクトルセットを単語レベル特徴表現ベクトルに変換し、
前記多音字表現ベクトルと前記単語レベル特徴表現ベクトルに対して、注意力メカニズムに基づくスティッチング処理を行い、目標ベクトルを得て、
そして、予め設定された線形層により、前記目標ベクトルの目標ピンイン確率を計算し、かつ前記目標ピンイン確率に基づいて前記目標多音字の目標発音を特定すること、を実行させる。
ラベリングされた、目標多音字を含む被処理中国語フレーズを取得し、かつ前記被処理中国語フレーズの文字表現ベクトルセットと多音字表現ベクトルを取得し、
前記被処理中国語フレーズに対して単語分割処理を実行して目標分割単語を得て、かつ前記目標分割単語に応じて前記文字表現ベクトルセットを単語レベル特徴表現ベクトルに変換し、
前記多音字表現ベクトルと前記単語レベル特徴表現ベクトルに対して、注意力メカニズムに基づくスティッチング処理を行い、目標ベクトルを得て、
そして、予め設定された線形層により、前記目標ベクトルの目標ピンイン確率を計算し、かつ前記目標ピンイン確率に基づいて前記目標多音字の目標発音を特定すること、を実行させる。
ラベリングされた、目標多音字を含む被処理中国語フレーズを取得し、かつ被処理中国語フレーズの文字表現ベクトルセットと多音字表現ベクトルを取得するための取得モジュール301と、
被処理中国語フレーズに対して単語分割処理を実行して目標分割単語を得て、かつ目標分割単語に応じて文字表現ベクトルセットを単語レベル特徴表現ベクトルに変換するための変換モジュール302と、
多音字表現ベクトルと単語レベル特徴表現ベクトルに対して、注意力メカニズムに基づくスティッチング処理を行い、目標ベクトルを得るためのスティッチングモジュール303と、
予め設定された線形層により、目標ベクトルの目標ピンイン確率を計算し、かつ目標ピンイン確率に基づいて目標多音字の目標発音を特定するための特定モジュール304と、を含む。
ラベリングされた、目標多音字を含む被処理中国語フレーズを取得し、かつ被処理中国語フレーズの文字表現ベクトルセットと多音字表現ベクトルを取得するための取得モジュール301と、
被処理中国語フレーズに対して単語分割処理を実行して目標分割単語を得て、かつ目標分割単語に応じて文字表現ベクトルセットを単語レベル特徴表現ベクトルに変換するための変換モジュール302と、
多音字表現ベクトルと単語レベル特徴表現ベクトルに対して、注意力メカニズムに基づくスティッチング処理を行い、目標ベクトルを得るためのスティッチングモジュール303と、
ここで、スティッチングモジュール303が具体的に、
予め設定されたフィードフォワード注意力メカニズムによって、多音字表現ベクトルと単語レベル特徴表現ベクトルに対して注意力の計算を行い、注意力ベクトルを得るための計算ユニット3031、および
注意力ベクトルと多音字表現ベクトルをスティッチングして、目標ベクトルを得るためのスティッチングユニット3032を含み、
予め設定された線形層により、目標ベクトルの目標ピンイン確率を計算し、かつ目標ピンイン確率に基づいて目標多音字の目標発音を特定するための特定モジュール304と、を含む。
被処理中国語フレーズに対して単語分割処理を実行して目標分割単語を得ることと、
目標分割単語に応じて文字表現ベクトルセットを分割して各単語の表現ベクトル群を得ることと、
予め設定されたハイブリッドプーリング層によって、各単語の表現ベクトル群をハイブリッドプーリングして、単語レベル特徴表現ベクトルを得ることと、に使用され得る。
予め設定された線形層により、各ピンインに基づく目標ベクトルの確率を計算し、多音字ピンイン確率値セットを得ることと、
多音字ピンイン確率値セットにおける多音字ピンイン確率値を降順に並べ、かつ最初に並べられた多音字ピンイン確率値を目標ピンイン確率として特定することと、
目標ピンイン確率に対応するピンインを目標多音字の目標発音として特定することと、使用され得る。
初期中国語フレーズ、初期中国語フレーズにおける目標多音字、および目標多音字に対応する多音字位置情報を取得するための取得ユニット3011と、
多音字位置情報に応じて、初期中国語フレーズにおける目標多音字をラベリングし、被処理中国語フレーズを得るためのラベリングユニット3012と、
被処理中国語フレーズに対して文字ベクトルの符号化と多音字ベクトルの抽出を順次行い、文字表現ベクトルセットと多音字表現ベクトルを得るための符号化抽出ユニット3013と、を含む。
予め設定されたディープニューラルネットワークエンコーダーによって、被処理中国語フレーズにおける各文字を符号化し、文字表現ベクトルセットを得て、1つの文字表現ベクトルが1つの文字に対応することと、
多音字位置情報に応じて、文字表現ベクトルセットから目標多音字に対応する表現ベクトルを抽出し、多音字表現ベクトルを得ることと、に使用され得る。
ラベリング発音に基づく目標発音の誤差値を取得し、かつ誤差値に応じて、目標発音を取得する実行プロセス、アルゴリズムやネットワーク構造などを含む、目標発音の取得戦略を最適化するための最適化モジュール305を含む。
Claims (9)
- ラベリングされた、目標多音字を含む被処理中国語フレーズを取得し、かつ前記被処理中国語フレーズの文字表現ベクトルセットと多音字表現ベクトルを取得することと、
前記被処理中国語フレーズに対して元の文順に基づく単語分割処理を行い、初期分割単語を得て、予め設定されたワードスティッチングルールに応じて、前記初期分割単語をスティッチングして目標分割単語を得て、かつ前記目標分割単語に応じて前記文字表現ベクトルセットを単語レベル特徴表現ベクトルに変換することと、
前記多音字表現ベクトルと前記単語レベル特徴表現ベクトルに対して、注意力メカニズムに基づくスティッチング処理を行い、目標ベクトルを得ることと、
予め設定された線形層により、前記目標ベクトルの目標ピンイン確率を計算し、かつ前記目標ピンイン確率に基づいて前記目標多音字の目標発音を特定することと、を含む、多音字発音の予測方法。 - 上述した、前記被処理中国語フレーズに対して元の文順に基づく単語分割処理を行い、初期分割単語を得て、予め設定されたワードスティッチングルールに応じて、前記初期分割単語をスティッチングして目標分割単語を得て、かつ前記目標分割単語に応じて前記文字表現ベクトルセットを単語レベル特徴表現ベクトルに変換することは、
前記被処理中国語フレーズに対して元の文順に基づく単語分割処理を行い、初期分割単語を得て、予め設定されたワードスティッチングルールに応じて、前記初期分割単語をスティッチングして目標分割単語を得ることと、
前記目標分割単語に応じて前記文字表現ベクトルセットを分割して各単語の表現ベクトル群を得ることと、
予め設定されたハイブリッドプーリング層によって、前記各単語の表現ベクトル群をハイブリッドプーリングして、単語レベル特徴表現ベクトルを得ることと、を含む、請求項1に記載の多音字発音の予測方法。 - 上述した、前記多音字表現ベクトルと前記単語レベル特徴表現ベクトルに対して、注意力メカニズムに基づくスティッチング処理を行い、目標ベクトルを得ることは、
予め設定されたフィードフォワード注意力メカニズムによって、前記多音字表現ベクトルと前記単語レベル特徴表現ベクトルに対して注意力の計算を行い、注意力ベクトルを得ることと、
前記注意力ベクトルと前記多音字表現ベクトルをスティッチングして、目標ベクトルを得ることと、を含む、請求項1に記載の多音字発音の予測方法。 - 前記予め設定された線形層により、前記目標ベクトルの目標ピンイン確率を計算し、かつ前記目標ピンイン確率に基づいて前記目標多音字の目標発音を特定することは、
予め設定された線形層により、各ピンインに基づく前記目標ベクトルの確率を計算し、多音字ピンイン確率値セットを得ることと、
前記多音字ピンイン確率値セットにおける多音字ピンイン確率値を降順に並べ、かつ最初に並べられた多音字ピンイン確率値を目標ピンイン確率として特定することと、
前記目標ピンイン確率に対応するピンインを前記目標多音字の目標発音として特定することと、を含む、請求項1に記載の多音字発音の予測方法。 - 上述した、ラベリングされた、目標多音字を含む被処理中国語フレーズを取得し、かつ前記被処理中国語フレーズの文字表現ベクトルセットと多音字表現ベクトルを取得することは、
初期中国語フレーズ、前記初期中国語フレーズにおける目標多音字、および前記目標多音字に対応する多音字位置情報を取得することと、
前記多音字位置情報に応じて、前記初期中国語フレーズにおける目標多音字をラベリングし、被処理中国語フレーズを得ることと、
前記被処理中国語フレーズに対して文字ベクトルの符号化と多音字ベクトルの抽出を順次行い、文字表現ベクトルセットと多音字表現ベクトルを得ることと、を含む、請求項1に記載の多音字発音の予測方法。 - 上述した、前記被処理中国語フレーズに対して文字ベクトルの符号化と多音字ベクトルの抽出を順次行い、文字表現ベクトルセットと多音字表現ベクトルを得ることは、
予め設定されたディープニューラルネットワークエンコーダーによって、前記被処理中国語フレーズにおける各文字を符号化し、文字表現ベクトルセットを得て、1つの文字表現ベクトルが1つの文字に対応することと、
前記多音字位置情報に応じて、前記文字表現ベクトルセットから前記目標多音字に対応する表現ベクトルを抽出し、多音字表現ベクトルを得ることと、を含む、請求項5に記載の多音字発音の予測方法。 - 上述した、予め設定された線形層により、前記目標ベクトルの目標ピンイン確率を計算し、かつ前記目標ピンイン確率に基づいて前記目標多音字の目標発音を特定するステップの後、さらに、
ラベリング発音に基づく前記目標発音の誤差値を取得し、かつ前記誤差値に応じて、前記目標発音を取得する実行プロセス、アルゴリズムやネットワーク構造を含む、前記目標発音の取得戦略を最適化することを、含む、請求項1~6のいずれか1項に記載の多音字発音の予測方法。 - ラベリングされた、目標多音字を含む被処理中国語フレーズを取得し、かつ前記被処理中国語フレーズの文字表現ベクトルセットと多音字表現ベクトルを取得するための取得モジュールと、
前記被処理中国語フレーズに対して元の文順に基づく単語分割処理を行い、初期分割単語を得て、予め設定されたワードスティッチングルールに応じて、前記初期分割単語をスティッチングして目標分割単語を得て、かつ前記目標分割単語に応じて前記文字表現ベクトルセットを単語レベル特徴表現ベクトルに変換するための変換モジュールと、
前記多音字表現ベクトルと前記単語レベル特徴表現ベクトルに対して、注意力メカニズムに基づくスティッチング処理を行い、目標ベクトルを得るためのスティッチングモジュールと、
予め設定された線形層により、前記目標ベクトルの目標ピンイン確率を計算し、かつ前記目標ピンイン確率に基づいて前記目標多音字の目標発音を特定するための特定モジュールと、を含む、多音字発音の予測装置。 - 命令が記憶されたメモリと、少なくとも1つのプロセッサとを含んでおり、
前記少なくとも1つのプロセッサが前記メモリにおける前記命令を呼び出すことで、以下のような多音字発音の予測方法、すなわち、
被処理中国語フレーズに対して元の文順に基づく単語分割処理を行い、初期分割単語を得て、予め設定されたワードスティッチングルールに応じて、前記初期分割単語をスティッチングして目標分割単語を得て、かつ前記目標分割単語に応じて文字表現ベクトルセットを単語レベル特徴表現ベクトルに変換し、
多音字表現ベクトルと前記単語レベル特徴表現ベクトルに対して、注意力メカニズムに基づくスティッチング処理を行い、目標ベクトルを得て、
そして、予め設定された線形層により、前記目標ベクトルの目標ピンイン確率を計算し、かつ前記目標ピンイン確率に基づいて目標多音字の目標発音を特定すること、を前記多音字発音の予測設備に実行させる、多音字発音の予測設備。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011432585.6A CN112528648A (zh) | 2020-12-10 | 2020-12-10 | 多音字发音的预测方法、装置、设备及存储介质 |
CN202011432585.6 | 2020-12-10 | ||
PCT/CN2021/083522 WO2022121166A1 (zh) | 2020-12-10 | 2021-03-29 | 多音字发音的预测方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023509257A JP2023509257A (ja) | 2023-03-08 |
JP7441864B2 true JP7441864B2 (ja) | 2024-03-01 |
Family
ID=74998777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021574349A Active JP7441864B2 (ja) | 2020-12-10 | 2021-03-29 | 多音字の発音を予測する方法、装置、設備、および記憶媒体 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7441864B2 (ja) |
CN (1) | CN112528648A (ja) |
WO (1) | WO2022121166A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112528648A (zh) * | 2020-12-10 | 2021-03-19 | 平安科技(深圳)有限公司 | 多音字发音的预测方法、装置、设备及存储介质 |
CN112989821B (zh) * | 2021-04-13 | 2021-08-13 | 北京世纪好未来教育科技有限公司 | 多音字的注音方法及计算机存储介质 |
CN113268989B (zh) * | 2021-05-14 | 2024-10-18 | 北京金山数字娱乐科技有限公司 | 多音字处理方法及装置 |
CN113268974B (zh) * | 2021-05-18 | 2022-11-29 | 平安科技(深圳)有限公司 | 多音字发音标注方法、装置、设备及存储介质 |
CN113823259B (zh) * | 2021-07-22 | 2024-07-02 | 腾讯科技(深圳)有限公司 | 将文本数据转换为音素序列的方法及设备 |
CN113657109A (zh) * | 2021-08-31 | 2021-11-16 | 平安医疗健康管理股份有限公司 | 基于模型的临床术语的标准化方法、装置和计算机设备 |
CN113806479B (zh) * | 2021-09-02 | 2024-08-02 | 深圳市声扬科技有限公司 | 文本注音的方法、装置、电子设备及存储介质 |
CN114417832B (zh) * | 2021-12-08 | 2023-05-05 | 马上消费金融股份有限公司 | 消歧方法、消歧模型的训练方法及装置 |
CN114492418B (zh) * | 2022-02-09 | 2024-10-18 | 西安讯飞超脑信息科技有限公司 | 文本转换方法及相关装置 |
CN114662478A (zh) * | 2022-03-23 | 2022-06-24 | 京东科技信息技术有限公司 | 发音预测方法、装置、设备及存储介质 |
CN115273809A (zh) * | 2022-06-22 | 2022-11-01 | 北京市商汤科技开发有限公司 | 多音字读音预测网络的训练方法、语音生成方法及装置 |
CN116150697A (zh) * | 2023-04-19 | 2023-05-23 | 上海钐昆网络科技有限公司 | 一种异常应用识别方法、装置、设备、存储介质及产品 |
CN117592473B (zh) * | 2024-01-18 | 2024-04-09 | 武汉杏仁桉科技有限公司 | 一种多中文词组的谐音拆分处理方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144110A (zh) | 2019-12-27 | 2020-05-12 | 科大讯飞股份有限公司 | 拼音标注方法、装置、服务器及存储介质 |
CN111599340A (zh) | 2020-07-27 | 2020-08-28 | 南京硅基智能科技有限公司 | 一种多音字读音预测方法、装置及计算机可读存储介质 |
WO2020215694A1 (zh) | 2019-04-22 | 2020-10-29 | 平安科技(深圳)有限公司 | 一种基于深度学习的中文分词方法、装置、存储介质及计算机设备 |
CN111967260A (zh) | 2020-10-20 | 2020-11-20 | 北京金山数字娱乐科技有限公司 | 多音字处理方法及装置、模型训练方法及装置 |
CN112052331A (zh) | 2019-06-06 | 2020-12-08 | 武汉Tcl集团工业研究院有限公司 | 一种处理文本信息的方法及终端 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3385862A1 (en) * | 2017-04-03 | 2018-10-10 | Siemens Aktiengesellschaft | A method and apparatus for performing hierarchical entity classification |
CN110069781B (zh) * | 2019-04-24 | 2022-11-18 | 北京奇艺世纪科技有限公司 | 一种实体标签的识别方法及相关设备 |
CN111382567B (zh) * | 2020-05-29 | 2020-08-25 | 恒信东方文化股份有限公司 | 一种中文分词和汉字多音字识别的方法及装置 |
CN112528648A (zh) * | 2020-12-10 | 2021-03-19 | 平安科技(深圳)有限公司 | 多音字发音的预测方法、装置、设备及存储介质 |
-
2020
- 2020-12-10 CN CN202011432585.6A patent/CN112528648A/zh active Pending
-
2021
- 2021-03-29 JP JP2021574349A patent/JP7441864B2/ja active Active
- 2021-03-29 WO PCT/CN2021/083522 patent/WO2022121166A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020215694A1 (zh) | 2019-04-22 | 2020-10-29 | 平安科技(深圳)有限公司 | 一种基于深度学习的中文分词方法、装置、存储介质及计算机设备 |
CN112052331A (zh) | 2019-06-06 | 2020-12-08 | 武汉Tcl集团工业研究院有限公司 | 一种处理文本信息的方法及终端 |
CN111144110A (zh) | 2019-12-27 | 2020-05-12 | 科大讯飞股份有限公司 | 拼音标注方法、装置、服务器及存储介质 |
CN111599340A (zh) | 2020-07-27 | 2020-08-28 | 南京硅基智能科技有限公司 | 一种多音字读音预测方法、装置及计算机可读存储介质 |
CN111967260A (zh) | 2020-10-20 | 2020-11-20 | 北京金山数字娱乐科技有限公司 | 多音字处理方法及装置、模型训练方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2022121166A1 (zh) | 2022-06-16 |
CN112528648A (zh) | 2021-03-19 |
JP2023509257A (ja) | 2023-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7441864B2 (ja) | 多音字の発音を予測する方法、装置、設備、および記憶媒体 | |
JP6929466B2 (ja) | 音声認識システム | |
CN111324744B (zh) | 一种基于目标情感分析数据集的数据增强方法 | |
JP3768205B2 (ja) | 形態素解析装置、形態素解析方法及び形態素解析プログラム | |
CN111557029A (zh) | 用于训练多语言语音识别网络的方法和系统以及用于执行多语言语音识别的语音识别系统 | |
WO2017168252A1 (en) | Method and system for processing an input query | |
JP2008165786A (ja) | 機械翻訳用のシーケンス分類 | |
JP2008165783A (ja) | シーケンス分類のためのモデルの識別トレーニング | |
CN111145718A (zh) | 一种基于自注意力机制的中文普通话字音转换方法 | |
CN111401084A (zh) | 一种机器翻译的方法、设备以及计算机可读存储介质 | |
CN113268974B (zh) | 多音字发音标注方法、装置、设备及存储介质 | |
CN113655893B (zh) | 一种词句生成方法、模型训练方法及相关设备 | |
CN112527986B (zh) | 多轮对话文本生成方法、装置、设备及存储介质 | |
Moeng et al. | Canonical and surface morphological segmentation for nguni languages | |
CN112395888A (zh) | 机器翻译设备和方法 | |
Gales et al. | Low-resource speech recognition and keyword-spotting | |
Wang et al. | Enhance the word vector with prosodic information for the recurrent neural network based TTS system | |
WO2019163752A1 (ja) | 形態素解析学習装置、形態素解析装置、方法、及びプログラム | |
Route et al. | Multimodal, multilingual grapheme-to-phoneme conversion for low-resource languages | |
Alisamir et al. | An end-to-end deep learning model to recognize Farsi speech from raw input | |
WO2001016794A1 (fr) | Procede et dispositif informatique et support d'enregistrement | |
Scharenborg et al. | Building an asr system for mboshi using a cross-language definition of acoustic units approach | |
Mirishkar et al. | An investigation of hybrid architectures for low resource multilingual speech recognition system in indian context | |
CN114896404A (zh) | 文档分类方法及装置 | |
Sharma et al. | Language identification for hindi language transliterated text in roman script using generative adversarial networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211214 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230314 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20230509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230614 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7441864 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |