JP7502370B2 - カスタマイズされたディープラーニングベースのテキスト修正のための方法及び装置 - Google Patents
カスタマイズされたディープラーニングベースのテキスト修正のための方法及び装置 Download PDFInfo
- Publication number
- JP7502370B2 JP7502370B2 JP2022092288A JP2022092288A JP7502370B2 JP 7502370 B2 JP7502370 B2 JP 7502370B2 JP 2022092288 A JP2022092288 A JP 2022092288A JP 2022092288 A JP2022092288 A JP 2022092288A JP 7502370 B2 JP7502370 B2 JP 7502370B2
- Authority
- JP
- Japan
- Prior art keywords
- deep learning
- learning model
- user
- base
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012937 correction Methods 0.000 title claims description 57
- 238000000034 method Methods 0.000 title claims description 27
- 238000013135 deep learning Methods 0.000 title description 27
- 238000013136 deep learning model Methods 0.000 claims description 96
- 238000012549 training Methods 0.000 claims description 73
- 230000004044 response Effects 0.000 claims description 23
- 238000012015 optical character recognition Methods 0.000 claims description 12
- 230000002457 bidirectional effect Effects 0.000 claims description 8
- 230000002123 temporal effect Effects 0.000 claims description 6
- 230000015654 memory Effects 0.000 claims description 5
- 238000013519 translation Methods 0.000 claims description 5
- 230000001537 neural effect Effects 0.000 claims description 4
- 230000006403 short-term memory Effects 0.000 claims description 4
- 239000013598 vector Substances 0.000 description 13
- 230000000873 masking effect Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 9
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008094 contradictory effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Description
BERT+CTC-モデルM1
BERT+CE-モデルM2
NMT+CTC-モデルM3
NMT+CE-モデルM4
Bi-LSTM+MLP-モデルM5
Bi-LSTM+BERT+CE-モデルM6
Bi-LSTM+BERT+CTC-モデルM7
Claims (20)
- プロセッサで、ベースデータ及びエンドユーザーデータの1つを提供し、ベースディープラーニングモデルまたはエンドユーザーディープラーニングモデルをそれぞれ、事前学習済みベースディープラーニングモデルまたは事前学習済みエンドユーザーディープラーニングモデルとして、前もって学習することと、
プロセッサベースのデータモード分類器を提供し、前記事前学習済みベースディープラーニングモデルまたは事前学習済みエンドユーザーディープラーニングモデルの1つを選択することと、
文字列である入力されたデータセットに応じて、入力されたデータセットが最初の入力データセットである場合は前記入力データセットの供給先として前記事前学習済みベースディープラーニングモデルを選択し、それ以外の場合は前記入力データセットの供給先として前記プロセッサベースのデータモード分類器を選択することと、
前記データモード分類器の出力に応じて、前記ベースディープラーニングモデルまたは前記エンドユーザーディープラーニングモデルの1つに学習を実行することと、
前記データセットの大きさに応じて、前記ベースディープラーニングモデルまたは前記エンドユーザーディープラーニングモデルの1つに再学習を実行することと、
前記ベースディープラーニングモデルまたは前記エンドユーザーディープラーニングモデルの1つの前記学習に応じて、前記学習の信頼度を示す複数の出力を提供することと、
前記学習の前記信頼度に応じて、エンドユーザーに、出力テキストとして文脈に基づき修正された前記文字列を提供することと、を含む、コンピュータ実装テキスト修正方法。 - 前記テキスト修正が、画像文字認識(ICR)と光学文字認識(OCR)の1つまたは複数を備える、請求項1に記載のコンピュータ実装テキスト修正方法。
- 前記エンドユーザーへの前記複数の出力の提供に応じて、前記出力テキストの修正を行うことを更に含む、請求項1又は2に記載のコンピュータ実装テキスト修正方法。
- 入力された前記データセットに応じて、前記ベースディープラーニングモデルに学習を実行することと、
前記データセットの大きさに応じて、前記ベースディープラーニングモデルに再学習を実行することと、
を更に含む、請求項1又は2に記載のコンピュータ実装テキスト修正方法。 - 前記データモード分類器の出力に応じて、前記ベースディープラーニングモデルに学習を実行することと、
前記データセットの大きさに応じて、前記ベースディープラーニングモデルに再学習を実行することと、
を更に含む、請求項1又は2に記載のコンピュータ実装テキスト修正方法。 - 前記データモード分類器の出力に応じて、前記エンドユーザーディープラーニングモデルに学習を実行することと、
前記データセットの大きさに応じて、前記エンドユーザーディープラーニングモデルに再学習を実行することと、
を更に含む、請求項1又は2に記載のコンピュータ実装テキスト修正方法。 - 前記エンドユーザーディープラーニングモデルの学習と再学習が、前記ベースディープラーニングモデルに影響しない、請求項6に記載のコンピュータ実装テキスト修正方法。
- 前記ベースディープラーニングモデル及び前記エンドユーザーディープラーニングモデルが、Transformerによる双方向のエンコード表現(BERT)双方向長短期記憶(Bi-LSTM)及びニューラル機械翻訳(NMT)から成る群から選択される、請求項1又は2に記載のコンピュータ実装テキスト修正方法。
- 前記ベースディープラーニングモデル及び前記エンドユーザーディープラーニングモデルが、コネクショニスト時間的分類(CTC)損失を用いたBi-LSTMとBERTのモデルを備える、請求項7に記載のコンピュータ実装テキスト修正方法。
- 前記エンドユーザーディープラーニングモデルが、前記ベースディープラーニングモデルと、前記ベースディープラーニングモデルの出力箇所に位置する出力層とを備える、請求項1又は2に記載のコンピュータ実装テキスト修正方法。
- プロセッサと、
プロセッサによって実行されると、方法の動作を可能にする命令を含む非一時的なメモリと、を備えるコンピュータ実装テキスト修正装置であって、
前記方法が、
ベースデータ及びエンドユーザーデータの1つを提供し、ベースディープラーニングモデルまたはエンドユーザーディープラーニングモデルをそれぞれ、事前学習済みベースディープラーニングモデルまたは事前学習済みエンドユーザーディープラーニングモデルとして、前もって学習することと、
データモード分類器を提供し、前記事前学習済みベースディープラーニングモデルまたは事前学習済みエンドユーザーディープラーニングモデルの1つを選択することと、
文字列である入力されたデータセットに応じて、入力されたデータセットが最初の入力データセットである場合は前記入力データセットの供給先として前記事前学習済みベースディープラーニングモデルを選択し、それ以外の場合は前記入力データセットの供給先として前記プロセッサベースのデータモード分類器を選択することと、
前記データモード分類器の出力に応じて、前記ベースディープラーニングモデルまたは前記エンドユーザーディープラーニングモデルの1つに学習を実行することと、
前記データセットの大きさに応じて、前記ベースディープラーニングモデルまたは前記エンドユーザーディープラーニングモデルの1つに再学習を実行することと、
前記ベースディープラーニングモデルまたは前記エンドユーザーディープラーニングモデルの1つの前記学習に応じて、前記学習の信頼度を示す複数の出力を提供することと、
前記学習の前記信頼度に応じて、エンドユーザーに、出力テキストとして文脈に基づき修正された前記文字列を提供することと、
を含む、コンピュータ実装テキスト修正装置。 - 前記テキスト修正が、画像文字認識(ICR)と光学文字認識(OCR)の1つまたは複数を備える、請求項11に記載のコンピュータ実装テキスト修正装置。
- 前記方法が、前記学習の信頼度に応じて、エンドユーザーに出力テキストを提供することを更に含む、請求項11又は12に記載のコンピュータ実装テキスト修正装置。
- 前記方法が、
入力された前記データセットに応じて、前記ベースディープラーニングモデルに学習を実行することと、
前記データセットの大きさに応じて、前記ベースディープラーニングモデルに再学習を実行することと、を更に含む、請求項11又は12に記載のコンピュータ実装テキスト修正装置。 - 前記方法が、
前記データモード分類器の出力に応じて、前記ベースディープラーニングモデルに学習を実行することと、
前記データセットの大きさに応じて、前記ベースディープラーニングモデルに再学習を実行することと、を更に含む、請求項11又は12に記載のコンピュータ実装テキスト修正装置。 - 前記方法が、
前記データモード分類器の出力に応じて、前記エンドユーザーディープラーニングモデルに学習を実行することと、
前記データセットの大きさに応じて、前記エンドユーザーディープラーニングモデルに再学習を実行することと、を更に含む、請求項11又は12に記載のコンピュータ実装テキスト修正装置。 - 前記エンドユーザーディープラーニングモデルの学習と再学習が、前記ベースディープラーニングモデルに影響しない、請求項16に記載のコンピュータ実装テキスト修正装置。
- 前記ベースディープラーニングモデル及び前記エンドユーザーディープラーニングモデルが、Transformerによる双方向のエンコード表現(BERT)双方向長短期記憶(Bi-LSTM)及びニューラル機械翻訳(NMT)から成る群から選択される、請求項11又は12に記載のコンピュータ実装テキスト修正装置。
- 前記ベースディープラーニングモデル及び前記エンドユーザーディープラーニングモデルが、コネクショニスト時間的分類(CTC)損失を用いたBi-LSTMとBERTのモデルを備える、請求項18に記載のコンピュータ実装テキスト修正装置。
- 前記エンドユーザーディープラーニングモデルが、前記ベースディープラーニングモデルと前記ベースディープラーニングモデルの出力箇所に位置する出力層とを備える、請求項11又は12に記載のコンピュータ実装テキスト修正装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/491,122 | 2021-09-30 | ||
US17/491,122 US12008826B2 (en) | 2021-09-30 | 2021-09-30 | Method and apparatus for customized deep learning-based text correction |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2023051724A JP2023051724A (ja) | 2023-04-11 |
JP2023051724A5 JP2023051724A5 (ja) | 2024-04-26 |
JP7502370B2 true JP7502370B2 (ja) | 2024-06-18 |
Family
ID=85706595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022092288A Active JP7502370B2 (ja) | 2021-09-30 | 2022-06-07 | カスタマイズされたディープラーニングベースのテキスト修正のための方法及び装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US12008826B2 (ja) |
JP (1) | JP7502370B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12008826B2 (en) * | 2021-09-30 | 2024-06-11 | Konica Minolta Business Solutions U.S.A., Inc. | Method and apparatus for customized deep learning-based text correction |
US20230162217A1 (en) * | 2021-11-19 | 2023-05-25 | Target Brands, Inc. | Hierarchical demand forecasting modeling |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090254819A1 (en) | 2008-04-07 | 2009-10-08 | Song Hee Jun | Spelling correction system and method for misspelled input |
US20090281972A1 (en) | 2008-05-06 | 2009-11-12 | Microsoft Corporation | Adaptive learning framework for data correction |
JP2011065322A (ja) | 2009-09-16 | 2011-03-31 | Konica Minolta Holdings Inc | 文字認識システム及び文字認識プログラム、並びに音声認識システム及び音声認識プログラム |
CN113298632A (zh) | 2021-06-16 | 2021-08-24 | 武汉行健道信息技术有限公司 | 一种基于移动互联网和数据特征分析的智能财务管理系统 |
JP2021135695A (ja) | 2020-02-26 | 2021-09-13 | 株式会社日立製作所 | 文書認識装置および文書認識方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11734567B2 (en) * | 2018-02-13 | 2023-08-22 | Samsung Electronics Co., Ltd. | Method and system for reducing deep neural network architectures |
US11055527B2 (en) * | 2019-02-01 | 2021-07-06 | Intuit Inc. | System and method for information extraction with character level features |
WO2021087334A1 (en) * | 2019-11-01 | 2021-05-06 | Vannevar Labs, Inc. | Neural network-based optical character recognition |
US12008826B2 (en) * | 2021-09-30 | 2024-06-11 | Konica Minolta Business Solutions U.S.A., Inc. | Method and apparatus for customized deep learning-based text correction |
-
2021
- 2021-09-30 US US17/491,122 patent/US12008826B2/en active Active
-
2022
- 2022-06-07 JP JP2022092288A patent/JP7502370B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090254819A1 (en) | 2008-04-07 | 2009-10-08 | Song Hee Jun | Spelling correction system and method for misspelled input |
US20090281972A1 (en) | 2008-05-06 | 2009-11-12 | Microsoft Corporation | Adaptive learning framework for data correction |
JP2011065322A (ja) | 2009-09-16 | 2011-03-31 | Konica Minolta Holdings Inc | 文字認識システム及び文字認識プログラム、並びに音声認識システム及び音声認識プログラム |
JP2021135695A (ja) | 2020-02-26 | 2021-09-13 | 株式会社日立製作所 | 文書認識装置および文書認識方法 |
CN113298632A (zh) | 2021-06-16 | 2021-08-24 | 武汉行健道信息技术有限公司 | 一种基于移动互联网和数据特征分析的智能财务管理系统 |
Also Published As
Publication number | Publication date |
---|---|
US20230096700A1 (en) | 2023-03-30 |
US12008826B2 (en) | 2024-06-11 |
JP2023051724A (ja) | 2023-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7502370B2 (ja) | カスタマイズされたディープラーニングベースのテキスト修正のための方法及び装置 | |
JP7109557B2 (ja) | 質問応答としてのマルチタスク学習 | |
CN110209817B (zh) | 文本处理模型的训练方法、装置和文本处理方法 | |
US11640505B2 (en) | Systems and methods for explicit memory tracker with coarse-to-fine reasoning in conversational machine reading | |
US11334791B2 (en) | Learning to search deep network architectures | |
CN110929515A (zh) | 基于协同注意力和自适应调整的阅读理解方法及系统 | |
CN111368545B (zh) | 一种基于多任务学习的命名实体识别方法和装置 | |
CN110210032A (zh) | 文本处理方法及装置 | |
CN111695052A (zh) | 标签分类方法、数据处理设备、可读存储介质 | |
CN115293138B (zh) | 一种文本纠错方法及计算机设备 | |
KR102258002B1 (ko) | 인공지능을 활용하여 이미지 번역 서비스를 제공하기 위한 방법 및 서버 | |
CN115293139B (zh) | 一种语音转写文本纠错模型的训练方法和计算机设备 | |
WO2023010916A1 (zh) | 软件自动修复方法、系统、电子设备及存储介质 | |
JP2023539954A (ja) | 多次元ディープニューラルネットワーク | |
CN117529755A (zh) | 图像识别系统中的迁移学习 | |
Gao et al. | Generating natural adversarial examples with universal perturbations for text classification | |
CN113806646A (zh) | 序列标注系统及序列标注模型的训练系统 | |
CN114020887A (zh) | 用于确定响应语句的方法、设备、装置和介质 | |
EP3627403A1 (en) | Training of a one-shot learning classifier | |
US20220138425A1 (en) | Acronym definition network | |
US20240005131A1 (en) | Attention neural networks with tree attention mechanisms | |
CN116992942A (zh) | 自然语言模型优化方法、装置、自然语言模型、设备和介质 | |
Mendonça et al. | Adversarial training with informed data selection | |
KR102589074B1 (ko) | 챗봇 운영 방법 및 장치 | |
CN115357712A (zh) | 方面级情感分析方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221222 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240130 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20240418 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240606 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7502370 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |