JP2023002730A - テキスト誤り訂正とテキスト誤り訂正モデルの生成方法、装置、機器及び媒体 - Google Patents
テキスト誤り訂正とテキスト誤り訂正モデルの生成方法、装置、機器及び媒体 Download PDFInfo
- Publication number
- JP2023002730A JP2023002730A JP2022169806A JP2022169806A JP2023002730A JP 2023002730 A JP2023002730 A JP 2023002730A JP 2022169806 A JP2022169806 A JP 2022169806A JP 2022169806 A JP2022169806 A JP 2022169806A JP 2023002730 A JP2023002730 A JP 2023002730A
- Authority
- JP
- Japan
- Prior art keywords
- text
- sample
- pinyin
- error correction
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012937 correction Methods 0.000 title claims abstract description 371
- 238000000034 method Methods 0.000 title claims abstract description 92
- 230000008569 process Effects 0.000 claims abstract description 16
- 238000001514 detection method Methods 0.000 claims description 47
- 238000012549 training Methods 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000013473 artificial intelligence Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
なお、本明細書では、便宜上、「爾」、「難」及び「過」を繁体字で標記しているが、図面では簡体字で標記している。
Claims (17)
- 誤り訂正対象のテキストを取得するステップと、
前記誤り訂正対象のテキストのピンインシーケンスを取得するステップと、
前記誤り訂正対象のテキストと前記ピンインシーケンスをテキスト誤り訂正モデルに入力して、誤り訂正後の誤り訂正済みテキストを得るステップであって、前記テキスト誤り訂正モデルが、前記誤り訂正対象のテキストの誤字を検出し、前記ピンインシーケンスにおける前記誤字に対応するピンインを決定し、前記ピンインに対応するピンイン特徴を前記誤字の後ろに追加して、ピンインテキストを得て、前記ピンインテキストの前記誤字及び前記ピンイン特徴を訂正して、前記誤り訂正済みテキストを得るステップによって前記誤り訂正済みテキストを得るステップと、
を含むテキスト誤り訂正方法。 - 前記テキスト誤り訂正モデルが、
前記誤り訂正対象のテキストに対して誤字検出を行って、誤り検出タグ付けシーケンスを得て、
前記誤り検出タグ付けシーケンスに基づいて前記誤り訂正対象のテキストにおける前記誤字を決定するステップによって、前記誤り訂正対象のテキストにおける前記誤字を検出する請求項1に記載のテキスト誤り訂正方法。 - 前記テキスト誤り訂正モデルが、
前記ピンインテキストの前記誤字及び前記ピンイン特徴に対して誤り訂正を行って、候補誤り訂正テキストを得て、
前記候補誤り訂正テキストに対して重複排除処理を行って、前記誤り訂正済みテキストを得るステップによって、前記ピンインテキストの前記誤字及び前記ピンイン特徴を訂正して、前記誤り訂正済みテキストを得る請求項1に記載のテキスト誤り訂正方法。 - サンプルテキスト、前記サンプルテキストのサンプルピンインシーケンス及び前記サンプルテキストのターゲットテキストを取得するステップと、
前記サンプルテキストと前記サンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力して、サンプル誤り訂正済みテキストを得るステップであって、前記トレーニング対象のテキスト誤り訂正モデルは、前記サンプルテキストのサンプル誤字を検出し、前記サンプルピンインシーケンスにおける前記サンプル誤字に対応するサンプルピンインを決定し、前記サンプルピンインに対応するサンプルピンイン特徴を前記サンプル誤字の後ろに追加して、サンプルピンインテキストを得て、前記サンプルピンインテキストの前記サンプル誤字と前記サンプルピンイン特徴を訂正して、前記サンプル誤り訂正済みテキストを得るステップによって前記サンプル誤り訂正済みテキストを得るステップと、
前記サンプルテキスト、前記サンプル誤り訂正済みテキスト及び前記ターゲットテキストに基づいて第1の損失値を生成するステップと、
前記第1の損失値に基づいて前記トレーニング対象のテキスト誤り訂正モデルをトレーニングして、テキスト誤り訂正モデルを得るステップと、
を含む、テキスト誤り訂正モデルの生成方法。 - 前記トレーニング対象のテキスト誤り訂正モデルが、
前記サンプルテキストに対して誤字検出を行って、サンプル誤り検出タグ付けシーケンスを得て
前記サンプル誤り検出タグ付けシーケンスに基づいて前記サンプルテキストにおける前記誤字を決定するステップによって、前記サンプルテキストの前記サンプル誤字を検出する請求項4に記載の生成方法。 - 前記トレーニング対象のテキスト誤り訂正モデルが、
前記サンプルピンインテキストの前記サンプル誤字と前記サンプルピンイン特徴に対して誤り訂正を行って、サンプル候補誤り訂正テキストを得て、
前記サンプル候補誤り訂正テキストに対して重複排除処理を行って、前記サンプル誤り訂正済みテキストを得るステップによって、前記サンプルピンインテキストの前記サンプル誤字と前記サンプルピンイン特徴を訂正して、前記サンプル誤り訂正済みテキストを得る請求項4に記載の生成方法。 - 前記サンプルテキストのターゲットピンインテキストを取得するステップを含み、
前記サンプルテキスト、前記サンプル誤り訂正済みテキスト及び前記ターゲットテキストに基づいて第1の損失値を生成するステップが、
前記サンプルテキスト、前記サンプルピンインテキスト及び前記ターゲットピンインテキストに基づいて第2の損失値を生成するステップと、
前記ターゲットピンインテキスト、前記サンプル誤り訂正済みテキスト及び前記ターゲットテキストに基づいて第3の損失値を生成するステップと、
前記第2の損失値と前記第3の損失値に基づいて前記第1の損失値を生成するステップと、
を含む請求項4に記載の生成方法。 - 誤り訂正対象のテキストを取得する第1の取得モジュールと、
前記誤り訂正対象のテキストのピンインシーケンスを取得する第2の取得モジュールと、
前記誤り訂正対象のテキストと前記ピンインシーケンスをテキスト誤り訂正モデルに入力して、誤り訂正後の誤り訂正済みテキストを得る第1の誤り訂正モジュールであって、前記テキスト誤り訂正モデルは、前記誤り訂正対象のテキストの誤字を検出し、前記ピンインシーケンスにおける前記誤字に対応するピンインを決定し、前記ピンインに対応するピンイン特徴を前記誤字の後ろに追加して、ピンインテキストを得て、前記ピンインテキストの前記誤字及び前記ピンイン特徴を訂正して、前記誤り訂正済みテキストを得るステップによって、前記誤り訂正済みテキストを得る第1の誤り訂正モジュールと、
を備えるテキスト誤り訂正装置。 - 前記テキスト誤り訂正モデルが、
前記誤り訂正対象のテキストに対して誤字検出を行って、誤り検出タグ付けシーケンスを得て、
前記誤り検出タグ付けシーケンスに基づいて前記誤り訂正対象のテキストにおける前記誤字を決定するステップによって、前記誤り訂正対象のテキストにおける前記誤字を検出する請求項8に記載のテキスト誤り訂正装置。 - 前記テキスト誤り訂正モデルが、
前記ピンインテキストの前記誤字及び前記ピンイン特徴に対して誤り訂正を行って、候補誤り訂正テキストを得て、
前記候補誤り訂正テキストに対して重複排除処理を行って、前記誤り訂正済みテキストを得るステップによって、前記ピンインテキストの前記誤字及び前記ピンイン特徴を訂正して、前記誤り訂正済みテキストを得る請求項8に記載のテキスト誤り訂正装置。 - サンプルテキスト、前記サンプルテキストのサンプルピンインシーケンス及び前記サンプルテキストのターゲットテキストを取得する第3の取得モジュールと、
前記サンプルテキストと前記サンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力して、サンプル誤り訂正済みテキストを得る第2の誤り訂正モジュールであって、前記トレーニング対象のテキスト誤り訂正モデルは、前記サンプルテキストのサンプル誤字を検出し、前記サンプルピンインシーケンスにおける前記サンプル誤字に対応するサンプルピンインを決定し、前記サンプルピンインに対応するサンプルピンイン特徴を前記サンプル誤字の後ろに追加して、サンプルピンインテキストを得て、前記サンプルピンインテキストの前記サンプル誤字と前記サンプルピンイン特徴を訂正して、前記サンプル誤り訂正済みテキストをステップによって前記サンプル誤り訂正済みテキストを得る第2の誤り訂正モジュールと、
前記サンプルテキスト、前記サンプル誤り訂正済みテキスト及び前記ターゲットテキストに基づいて第1の損失値を生成する第1の生成モジュールと、
前記第1の損失値に基づいて前記トレーニング対象のテキスト誤り訂正モデルをトレーニングして、テキスト誤り訂正モデルを得るトレーニングモジュールと、
を備える、テキスト誤り訂正モデルの生成装置。 - 前記トレーニング対象のテキスト誤り訂正モデルが、
前記サンプルテキストに対して誤字検出を行って、サンプル誤り検出タグ付けシーケンスを得て、
前記サンプル誤り検出タグ付けシーケンスに基づいて前記サンプルテキストにおける前記誤字を決定するステップによって前記サンプルテキストの前記サンプル誤字を検出する請求項11に記載の生成装置。 - 前記トレーニング対象のテキスト誤り訂正モデルが、
前記サンプルピンインテキストの前記サンプル誤字と前記サンプルピンイン特徴に対して誤り訂正を行って、サンプル候補誤り訂正テキストを得て、
前記サンプル候補誤り訂正テキストに対して重複排除処理を行って、前記サンプル誤り訂正済みテキストを得るステップによって、前記サンプルピンインテキストの前記サンプル誤字と前記サンプルピンイン特徴を訂正して、前記サンプル誤り訂正済みテキストを得る請求項11に記載の生成装置。 - 前記サンプルテキストのターゲットピンインテキストを取得する第4の取得モジュールを備え、
第1の生成モジュールが、
前記サンプルピンインテキストと前記ターゲットピンインテキストに基づいて第2の損失値を生成する第1の生成ユニットと、
前記ターゲットピンインテキスト、前記サンプル誤り訂正済みテキスト及び前記ターゲットテキストに基づいて第3の損失値を生成する第2の生成ユニットと、
前記第2の損失値と第3の損失値に基づいて前記第1の損失値を生成する第3の生成ユニットと、
を備える請求項11に記載の生成装置。 - 少なくとも1つのプロセッサと、
該少なくとも1つのプロセッサと通信可能に接続されるメモリと、
を備え、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令が、前記少なくとも1つのプロセッサが請求項1から3のいずれか一項に記載の方法、または、請求項4から7のいずれか一項に記載の方法を実行できるように、前記少なくとも1つのプロセッサによって実行される電子機器。 - コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令が、前記コンピュータに請求項1から3のいずれか一項に記載の方法、または請求項4から7のいずれか一項に記載の方法を実行させる非一時的なコンピュータ読み取り可能な記憶媒体。 - プロセッサによって実行される場合、請求項1から3のいずれか一項に記載の方法のステップ、または、請求項4から7のいずれか一項に記載の方法のステップを実現するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111350558.9 | 2021-11-15 | ||
CN202111350558.9A CN114239559B (zh) | 2021-11-15 | 2021-11-15 | 文本纠错和文本纠错模型的生成方法、装置、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023002730A true JP2023002730A (ja) | 2023-01-10 |
Family
ID=80749456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022169806A Pending JP2023002730A (ja) | 2021-11-15 | 2022-10-24 | テキスト誤り訂正とテキスト誤り訂正モデルの生成方法、装置、機器及び媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230090625A1 (ja) |
EP (1) | EP4109443A3 (ja) |
JP (1) | JP2023002730A (ja) |
CN (1) | CN114239559B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227468B (zh) * | 2023-01-06 | 2023-10-31 | 杭州健海科技有限公司 | 基于拼音转写翻译的语音识别模型纠错训练方法及装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104317780A (zh) * | 2014-09-28 | 2015-01-28 | 无锡卓信信息科技有限公司 | 一种中文输入文本的快速纠错方法 |
GB2533370A (en) * | 2014-12-18 | 2016-06-22 | Ibm | Orthographic error correction using phonetic transcription |
CN106297797B (zh) * | 2016-07-26 | 2019-05-31 | 百度在线网络技术(北京)有限公司 | 语音识别结果纠错方法和装置 |
CN110032722A (zh) * | 2018-01-12 | 2019-07-19 | 北京京东尚科信息技术有限公司 | 文本纠错方法和装置 |
CN110765772A (zh) * | 2019-10-12 | 2020-02-07 | 北京工商大学 | 拼音作为特征的中文语音识别后的文本神经网络纠错模型 |
CN111192586B (zh) * | 2020-01-08 | 2023-07-04 | 北京小米松果电子有限公司 | 语音识别方法及装置、电子设备、存储介质 |
CN111444705A (zh) * | 2020-03-10 | 2020-07-24 | 中国平安人寿保险股份有限公司 | 纠错方法、装置、设备及可读存储介质 |
CN112001169B (zh) * | 2020-07-17 | 2022-03-25 | 北京百度网讯科技有限公司 | 文本纠错的方法、装置、电子设备和可读存储介质 |
CN112287670A (zh) * | 2020-11-18 | 2021-01-29 | 北京明略软件系统有限公司 | 文本纠错方法、系统、计算机设备及可读存储介质 |
CN112232062A (zh) * | 2020-12-11 | 2021-01-15 | 北京百度网讯科技有限公司 | 文本纠错方法、装置、电子设备和存储介质 |
CN113051894A (zh) * | 2021-03-16 | 2021-06-29 | 京东数字科技控股股份有限公司 | 一种文本纠错的方法和装置 |
CN113553833B (zh) * | 2021-06-30 | 2024-01-19 | 北京百度网讯科技有限公司 | 文本纠错的方法、装置及电子设备 |
CN113642316B (zh) * | 2021-07-28 | 2023-11-28 | 平安国际智慧城市科技股份有限公司 | 中文文本纠错方法、装置、电子设备及存储介质 |
-
2021
- 2021-11-15 CN CN202111350558.9A patent/CN114239559B/zh active Active
-
2022
- 2022-10-24 JP JP2022169806A patent/JP2023002730A/ja active Pending
- 2022-11-07 US US18/053,034 patent/US20230090625A1/en active Pending
- 2022-11-08 EP EP22206102.0A patent/EP4109443A3/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
US20230090625A1 (en) | 2023-03-23 |
CN114239559A (zh) | 2022-03-25 |
CN114239559B (zh) | 2023-07-11 |
EP4109443A3 (en) | 2023-04-12 |
EP4109443A2 (en) | 2022-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7366984B2 (ja) | テキスト誤り訂正処理方法、装置、電子機器及び記憶媒体 | |
Choe et al. | A neural grammatical error correction system built on better pre-training and sequential transfer learning | |
CN106663092B (zh) | 具有罕见词处理的神经机器翻译系统 | |
WO2022095563A1 (zh) | 文本纠错的适配方法、装置、电子设备及存储介质 | |
JP2022003539A (ja) | テキスト誤り訂正方法、装置、電子機器及び記憶媒体 | |
EP3520035A1 (en) | Implicit bridging of machine learning tasks | |
JP7413630B2 (ja) | 要約生成モデルの訓練方法、装置、デバイス及び記憶媒体 | |
JP7335300B2 (ja) | 知識事前訓練モデルの訓練方法、装置及び電子機器 | |
WO2022116445A1 (zh) | 文本纠错模型建立方法、装置、介质及电子设备 | |
CN113743101B (zh) | 文本纠错方法、装置、电子设备和计算机存储介质 | |
US20210326538A1 (en) | Method, apparatus, electronic device for text translation and storage medium | |
KR20210158815A (ko) | 트리플 샘플 생성 방법, 장치, 전자 기기 및 기록 매체 | |
CN109359308B (zh) | 机器翻译方法、装置及可读存储介质 | |
CN113051894A (zh) | 一种文本纠错的方法和装置 | |
CN110728156B (zh) | 翻译方法、装置、电子设备及可读存储介质 | |
CN113918031A (zh) | 使用子字符信息进行中文标点恢复的系统和方法 | |
JP2023002730A (ja) | テキスト誤り訂正とテキスト誤り訂正モデルの生成方法、装置、機器及び媒体 | |
US9020803B2 (en) | Confidence-rated transcription and translation | |
US20230153550A1 (en) | Machine Translation Method and Apparatus, Device and Storage Medium | |
JP7349523B2 (ja) | 音声認識方法、音声認識装置、電子機器、記憶媒体コンピュータプログラム製品及びコンピュータプログラム | |
CN116484809A (zh) | 基于人工智能的文本处理方法及装置 | |
CN112687271B (zh) | 语音翻译方法、装置、电子设备和存储介质 | |
CN115357710A (zh) | 表格描述文本生成模型的训练方法、装置及电子设备 | |
CN114065777A (zh) | 双语语料检测方法、设备以及计算机可读介质 | |
CN113822053A (zh) | 一种语法错误检测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221024 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221026 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240319 |