JP7444495B2 - Ocrベース文書分析システム及び方法 - Google Patents
Ocrベース文書分析システム及び方法 Download PDFInfo
- Publication number
- JP7444495B2 JP7444495B2 JP2022563495A JP2022563495A JP7444495B2 JP 7444495 B2 JP7444495 B2 JP 7444495B2 JP 2022563495 A JP2022563495 A JP 2022563495A JP 2022563495 A JP2022563495 A JP 2022563495A JP 7444495 B2 JP7444495 B2 JP 7444495B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- ocr
- character
- document analysis
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 232
- 238000000034 method Methods 0.000 title claims description 52
- 238000001514 detection method Methods 0.000 claims description 130
- 238000012937 correction Methods 0.000 claims description 29
- 238000003058 natural language processing Methods 0.000 claims description 25
- 230000008520 organization Effects 0.000 claims description 15
- 239000003550 marker Substances 0.000 claims description 14
- 238000013136 deep learning model Methods 0.000 claims description 12
- 230000000750 progressive effect Effects 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 7
- 239000000470 constituent Substances 0.000 claims 1
- 238000012015 optical character recognition Methods 0.000 description 168
- 238000010586 diagram Methods 0.000 description 43
- 238000012790 confirmation Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 7
- 230000003190 augmentative effect Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012800 visualization Methods 0.000 description 4
- 238000003909 pattern recognition Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
を含む。
Claims (32)
- 認識対象イメージを受信する入力部(110);
前記受信した認識対象イメージにおいて客体探知モデルを用いて任意の形式(form)、文字及び数字の客体のうち少なくとも一つの位置を探知し、探知された形式、文字及び数字の客体の周りに四角形状を表示し、表示された四角形状のピクセル位置値を生成する客体探知モデリング部(120);
OCRモデルを用いて前記四角形状のピクセル内で認識される文字及び数字情報を出力するOCRモデリング部(130);
前記生成された四角形状のピクセル位置値と、前記認識された文字及び数字情報に基づいて、数字情報を有する任意の四角形状のピクセル位置を開始位置にして左側方向及び上側方向に移動するが、文字情報が検索されると、移動中に検索された全ての四角形状のピクセルを連結し、前記連結された四角形状のピクセル位置に、前記OCRモデルによって認識された文字及び数字情報をマッチさせてディスプレイさせるフォーム構成モデリング部(140);及び
前記生成された四角形状のピクセル位置値、認識された文字、数字情報及びマッチング結果と、特定機関で使用する文書データのフォームを保存するデータベース(150);
を含む文書分析装置(100)を含む、OCRベース文書分析システム。 - 前記客体探知モデルは、PSENet(Progressive Scale Expansion Network)ベースのディープラーニングモデルを用いて、文書イメージを含む学習データから形式、文字及び数字の客体の位置探知と、探知された形式、文字及び数字の客体の周りに沿って四角形状を表示し、前記表示された四角形状のピクセル位置値生成を学習することを特徴とする、請求項1に記載のOCRベース文書分析システム。
- 前記客体探知モデルは、原本イメージ、文書の任意の部分が折れたイメージ、文書の位置が任意の角度で傾いたイメージ、任意の照度を有する明るさが調節されたイメージ、文書に表示された内容が鮮明でなく途切れた連結線を持つイメージ、文書の任意の部分が屈曲したイメージ、数字と連結線が重なったイメージに基づいて学習データを学習することを特徴とする、請求項2に記載のOCRベース文書分析システム。
- 前記フォーム構成モデリング部(140)は、前記生成された四角形状のピクセル位置値と、前記認識された数字情報に基づいて、数字情報を有する任意の四角形状のピクセル位置を開始位置にして左側方向及び上側方向に移動し、
移動中に検索される全ての四角形状のピクセルを連結し、前記連結された四角形状の配列情報を分析し、あらかじめ保存された特定機関文書の配列情報と比較し、前記比較の結果、特定機関文書の配列情報がマッチすれば、前記特定機関文書の四角形状ピクセル位置に、認識された数字情報をマッチさせてディスプレイさせることを特徴とする、請求項1に記載のOCRベース文書分析システム。 - 前記フォーム構成モデリング部(140)は、生成された四角形状のピクセル中心点にマーカー(520)を表示し、前記認識された数字情報に基づいて、数字情報を有する任意の四角形状のピクセル位置を開始位置にして左側方向及び上側方向に移動し、
移動中に検索される全ての四角形状のピクセルを連結し、連結された四角形状のマーカー(520)位置情報を分析し、あらかじめ保存された特定機関文書の配列情報と比較し、前記比較の結果、特定機関文書の配列情報がマッチすれば、前記特定機関文書の四角形状ピクセル位置に、認識された数字情報をマッチさせてディスプレイさせることを特徴とする、請求項1に記載のOCRベース文書分析システム。 - 認識対象イメージを受信する入力部(110’);
前記認識対象イメージから認識される文字情報と比較するために、任意の文書で用いられる文字(項目)情報を定義した項目DB(300’)を生成する項目DB生成部(120’);
前記受信した認識対象イメージにおいて客体探知モデルを用いて任意の形式(form)、文字及び数字の客体のうち少なくとも一つの位置を探知し、探知された形式、文字及び数字の客体の周りに四角形状を表示し、表示された四角形状のピクセル位置値を生成する客体探知モデリング部(130’);
OCRモデルを用いて前記四角形状のピクセル内で認識される文字及び数字情報を出力するOCRモデリング部(140’);
前記認識された文字情報を項目DB(300’)と比較し、認識された文字を項目DB(300’)の文字情報に矯正することにより、数字情報を有する任意の四角形状のピクセル位置を開始位置にして左側方向及び上側方向に移動するが、文字情報が検索されると、移動中に検索された全ての四角形状のピクセルを連結し、前記連結された四角形状のピクセル位置に、前記OCRモデルによって矯正された文字及び数字情報をマッチさせてディスプレイさせるフォーム構成モデリング部(150’);及び
前記生成された四角形状のピクセル位置値、矯正された文字及び数字情報及びマッチング結果と、特定機関で使用する文書データのフォームを保存するデータベース(160’);
を含む文書分析装置(100’)を含む、OCRベース文書分析システム。 - 前記フォーム構成モデリング部(150’)は、自然語処理(Natural Language Processing,NLP)により、探知された文字に対して分析することを特徴とする、請求項6に記載のOCRベース文書分析システム。
- 前記フォーム構成モデリング部(150’)は、認識された文字と項目DB(300’)情報とを比較し、認識された文字に対する信頼点数を算出することを特徴とする、請求項7に記載のOCRベース文書分析システム。
- 前記フォーム構成モデリング部(150’)は、数字の客体の四角形状ピクセルサイズに対して、横長及び縦長が、隣接した他の四角形状ピクセルの横長及び縦長と同一であるか又は他のボックスの横長及び縦長に含まれると連結されるようにすることを特徴とする、請求項8に記載のOCRベース文書分析システム。
- 前記フォーム構成モデリング部(150’)は、最も近い左側及び上側の四角形状ピクセルのうち少なくとも一つを連結し、連結された四角形状ピクセル内の文字の客体を探すまで連結することを特徴とする、請求項9に記載のOCRベース文書分析システム。
- 前記フォーム構成モデリング部(150’)は、検索された四角形状のピクセル(920’)が空欄であれば、左側方向に位置した後、四角形状のピクセルと連結することを特徴とする、請求項8に記載のOCRベース文書分析システム。
- 認識対象イメージを受信する入力部(110”);
前記受信した認識対象イメージにおいて客体探知モデルを用いて形式、文字及び数字の客体のうち少なくとも一つの位置を探知し、探知された形式、文字及び数字の客体の周りに四角形状を表示し、表示された四角形状のピクセル位置値を生成する客体探知モデリング部(130”);
OCRモデルを用いて前記四角形状のピクセル内で認識される文字及び数字情報を出力するOCRモデリング部(140”);
前記認識された文字を項目DB(300’)の文字情報に矯正することにより、数字情報を有する任意の四角形状のピクセル位置を開始位置にして左側方向及び上側方向に移動するが、文字情報が検索されると、移動中に検索された全ての四角形状のピクセルを連結し、前記連結された四角形状のピクセル位置に、前記OCRモデルによって矯正された文字及び数字情報をマッチさせてディスプレイさせるフォーム構成モデリング部(150”);
補正モデルを用いて前記認識された文字及び数字の信頼点数を算出し、算出された信頼点数に基づいて前記ディスプレイに反映して視覚的に表示されるようにする信頼度評価部(160”);及び
前記生成された四角形状のピクセル位置値、認識された文字、数字情報、信頼情報と、特定機関で使用する文書データのフォームを保存するデータベース(170”);
を含む文書分析装置(100”)を含む、OCRベース文書分析システム。 - 前記認識対象イメージに含まれた文字に対して任意の文書からあらかじめ設定された文字に対する項目DB(300’)情報を生成する項目DB生成部(120”);をさらに含み、
前記フォーム構成モデリング部(150”)は、前記探知された文字の客体に対して項目DB(300’)情報とマッチさせ、マッチング結果によって認識された文字が矯正されると、前記矯正された文字を反映させることを特徴とする、請求項12に記載のOCRベース文書分析システム。 - 前記フォーム構成モデリング部(150”)は、文字及び数字の四角形状ボックスの色相が、正常認識領域と、誤った領域及び補正領域を含む誤り発生領域とが互いに異なる色相で表示されることを特徴とする、請求項12に記載のOCRベース文書分析システム。
- 客体探知モデルを用いて認識対象イメージにおいて任意の形式(form)、文字及び数字のうち少なくとも一つの客体の位置を探知するが、探知された形式、文字及び数字の客体の周りに沿って四角形状を表示して四角形状のピクセル位置値を生成し、
OCRモデルを用いて前記四角形状のピクセル内で認識される文字及び数字情報を出力し、前記生成された四角形状のピクセル位置値に基づいて隣接した全ての四角形状のピクセルを連結し、前記連結された四角形状のピクセル位置に、前記OCRモデルによって認識された文字及び数字情報をマッチさせてディスプレイし、
前記生成された文字の客体のピクセル位置値に基づいて、イメージの左側領域に文字の客体が配置される左側ヘッダー領域(500”’)と、イメージの上側領域に文字の客体が配置される上側ヘッダー領域(510”’)とに区分し、前記左側ヘッダー領域(500”’)と上側ヘッダー領域(510”’)を基準に仮想セル客体を生成して配置し、前記配置された仮想セル客体と数字客体をマッチさせて行/列(row/column)情報に基づいて連結し、前記OCRモデルによって認識された文字及び数字情報がディスプレイされるようにすることを特徴とする、
文書分析装置(100”’)を含む、OCRベース文書分析システム。 - 前記文書分析装置(100”’)は、
認識対象イメージを受信する入力部(110”’);
前記受信した認識対象イメージにおいて客体探知モデルを用いて任意の形式(form)、文字及び数字の客体のうち少なくとも一つの位置を探知し、探知された形式、文字及び数字の客体の周りに四角形状を表示し、表示された文字及び数字の客体のピクセル位置値を生成する客体探知モデリング部(120”’);
OCRモデルを用いて前記四角形状のピクセル内で認識される文字及び数字情報を出力するOCRモデリング部(130”’);
前記生成された文字の客体のピクセル位置値に基づいて、イメージの左側領域に文字の客体が配置される左側ヘッダー領域(500”’)と、イメージの上側領域に文字の客体が配置される上側ヘッダー領域510”’とに区分し、前記左側ヘッダー領域(500”’)と上側ヘッダー領域510”’を基準にM×Nサイズの仮想セル客体を生成して配置し、前記配置された仮想セル客体と数字客体をマッチさせて行/列情報に基づいて連結し、前記OCRモデルによって認識された文字及び数字情報がディスプレイされるようにする仮想セルフォーム構成モデリング部(140”’);及び
前記生成された四角形状のピクセル位置値、認識された文字、数字情報及びマッチング結果と、特定機関で使用する文書データのフォームを保存するデータベース(150”’);を含むことを特徴とする、請求項15に記載のOCRベース文書分析システム。 - 前記仮想セルフォーム構成モデリング部(140”’)は、文字の客体の左側ヘッダー領域(500”’)と上側ヘッダー領域(510”’)とに区分し、前記区分された左側ヘッダー領域(500”’)と上側ヘッダー領域(510”’)に含まれた文字の客体間の間隔及びサイズを算出し、前記区分された左側ヘッダー領域(500”’)と上側ヘッダー領域(510”’)を基準に仮想セル客体を配置することを特徴とする、請求項15に記載のOCRベース文書分析システム。
- 前記仮想セルフォーム構成モデリング部(140”’)は、左側上端に配置された仮想セル客体と数字客体をマッチさせ、
前記マッチした数字客体と仮想セル客体間の勾配を算出し、前記算出された勾配は、右側下端に配置された仮想セル客体と数字客体のマッチングまで反映されるようにすることを特徴とする、請求項15に記載のOCRベース文書分析システム。 - a)文書分析装置(100,100’,100”)が、受信した認識対象イメージにおいて客体探知モデルを用いて任意の形式、文字及び数字の客体のうち少なくとも一つの位置を探知し、探知された形式、文字及び数字の客体の周りに四角形状を表示して四角形状のピクセル位置値を生成する段階;
b)前記文書分析装置(100,100’,100”)が、OCRモデルを用いて探知された四角形状ピクセル内で認識される文字及び数字情報を出力する段階;及び
c)前記文書分析装置(100,100’,100”)が、前記生成された四角形状のピクセル位置値と、前記認識された文字及び数字情報に基づいて、数字情報を有する任意の四角形状のピクセル位置を開始位置にして左側方向及び上側方向に移動するが、文字情報が検索されると、移動中に検索された全ての四角形状のピクセルを連結し、前記連結された四角形状のピクセル位置に、前記OCRモデルによって認識された文字及び数字情報をマッチさせてディスプレイさせる段階;を含むOCRベース文書分析方法。 - 前記a)段階の客体探知モデルは、PSENet(Progressive Scale Expansion Network)ベースのディープラーニングモデルを用いて、文書イメージを含む学習データから形状、文字及び数字の客体の位置探知と、探知された形状、文字及び数字の客体の周りに沿って四角形状のボックスと前記四角形状のピクセル位置値生成を学習することを特徴とする、請求項19に記載のOCRベース文書分析方法。
- 前記a)段階の客体探知モデルは、原本イメージ、文書の任意の部分が折れたイメージ、文書の位置が任意の角度で傾いたイメージ、任意の照度を有する明るさが調節されたイメージ、文書に表示された内容が鮮明でなく途切れた連結線を持つイメージ、文書の任意の部分が屈曲したイメージ、数字と連結線が重なったイメージに基づいて学習データを学習することを特徴とする、請求項19に記載のOCRベース文書分析方法。
- 前記c)段階は、c-1)生成された四角形状のピクセル位置値と、前記認識された文字及び数字情報に基づいて、数字情報を有する任意の四角形状のピクセル位置を開始位置にして文字情報が検索されるまで左側方向及び上側方向に移動する段階;
c-2)前記文字情報が検索されると、移動中に検索された全ての四角形状のピクセルを連結する段階;及び
c-3)前記四角形状のピクセル位置には認識された文字と数字情報をマッチさせてディスプレイする段階;を含むことを特徴とする、請求項19に記載のOCRベース文書分析方法。 - 前記c)段階は、c’-1)前記生成された四角形状のピクセル位置値と、前記認識された数字情報に基づいて、数字情報を有する任意の四角形状のピクセル位置を開始位置にして左側方向及び上側方向に移動する段階;
c’-2)前記移動中に検索される全ての四角形状のピクセルを連結する段階;及び
c’-3)前記連結された四角形状の配列情報を分析し、あらかじめ保存された特定機関文書の配列情報と比較し、前記比較の結果、特定機関文書の配列情報がマッチすれば、前記特定機関文書の四角形状ピクセル位置に、認識された数字情報をマッチさせてディスプレイする段階;を含むことを特徴とする、請求項19に記載のOCRベース文書分析方法。 - 前記c)段階は、c”-1)生成された四角形状のピクセルの中心点にマーカー(520)を表示する段階;
c”-2)前記認識された数字情報に基づいて、数字情報を有する任意の四角形状のピクセル位置を開始位置にして左側方向及び上側方向に移動し、移動中に検索される全ての四角形状のピクセルを連結する段階;
c”-3)連結された四角形状のマーカー(520)位置情報を分析し、あらかじめ保存された特定機関文書の配列情報と比較する段階;及び
c”-4)前記比較の結果、特定機関文書の配列情報がマッチすれば、前記特定機関文書の四角形状ピクセル位置に、認識された数字情報をマッチさせてディスプレイする段階;を含むことを特徴とする、請求項19に記載のOCRベース文書分析方法。 - 前記b)段階は、文書分析装置(100’,100”)が、前記認識対象イメージから認識される文字情報と比較するために、任意の文書で用いられる文字(項目)情報を定義した項目DB(300’)を生成する段階;及び
文書分析装置(100’,100”)が探知された文字の客体に対して項目DB(300’)情報とマッチさせ、マッチング結果によって、認識された文字を矯正する段階;をさらに含むことを特徴とする、請求項19に記載のOCRベース文書分析方法。 - 前記文書分析装置(100’)は、探知された文字の客体に対して自然語処理(Natural Language Processing,NLP)によって文字を分析し、
分析された文字と項目DB(300’)情報との比較に基づいて、分析された文字に対する信頼点数を算出し、認識された文字を矯正するか否か判断し、
前記認識された文字の矯正を行うことによってNLPベースの矯正を行うことを特徴とする、請求項25に記載のOCRベース文書分析方法。 - 文書分析装置(100’)は、四角形状のピクセルが空欄であれば、左側方向に位置した後、四角形状のピクセルと連結することを特徴とする、請求項25に記載のOCRベース文書分析方法。
- d)前記文書分析装置(100”)が、補正モデルを用いて前記認識された文字及び数字の信頼点数を算出し、算出された信頼点数に基づいてディスプレイに反映して視覚的に表示する段階;をさらに含むことを特徴とする、請求項19又は25に記載のOCRベース文書分析方法。
- 前記d)段階の補正モデルはフォーム、形状、位置のうち少なくとも一つの補正を行うことによる再建率と、項目DB(300’)情報とのマッチング結果による矯正された文字の反映有無に基づいて信頼点数を算出することを特徴とする、請求項28に記載のOCRベース文書分析方法。
- i)文書分析装置(100”’)が、認識対象イメージを受信する段階;
ii)前記文書分析装置(100”’)が、受信した認識対象イメージにおいて客体探知モデルを用いて任意の形式、文字及び数字の客体のうち少なくとも一つの位置を探知し、探知された形式、文字及び数字の客体の周りに四角形状を表示して文字及び数字の客体のピクセル位置値を生成する段階;
iii)前記文書分析装置(100”’)が、OCRモデルを用いて探知された四角形状ピクセル内で認識される文字及び数字情報を出力する段階;及び
iv)前記文書分析装置(100”’)が、前記生成された文字の客体のピクセル位置値に基づいて、イメージの左側領域に文字の客体が配置される左側ヘッダー領域(500”’)と、イメージの上側領域に文字の客体が配置される上側ヘッダー領域(510”’)とに区分し、前記左側ヘッダー領域(500”’)と上側ヘッダー領域(510”’)を基準に仮想セル客体を生成して配置し、前記配置された仮想セル客体と数字客体をマッチさせて行/列情報に基づいて連結し、前記OCRモデルによって認識された文字及び数字情報がディスプレイされるように最終結果を出力する段階;
を含むOCRベース文書分析方法。 - 前記iv)段階の文字の客体の左側及び上側ピクセル位置を基準に配置する段階は、
iv-1)文書分析装置(100”’)が文字の客体の左側ヘッダー領域(500”’)と上側ヘッダー領域(510”’)を区分する段階;
iv-2)前記区分された左側ヘッダー領域(500”’)と上側ヘッダー領域(510”’)に含まれた文字の客体間の間隔及びサイズを算出する段階;及び
iv-3)前記区分された左側ヘッダー領域(500”’)と上側ヘッダー領域(510”’)を基準に仮想セル客体を配置する段階を含むことを特徴とする、請求項30に記載のOCRベース文書分析方法。 - 前記iv)段階の配置された仮想セル客体と数字客体をマッチさせて行/列情報に基づいて連結する段階は、
iv-4)前記文書分析装置(100”’)が左側上端に配置された仮想セル客体と数字客体をマッチさせて数字客体と仮想セル客体間の勾配を算出する段階;及び
iv-5)前記文書分析装置(100”’)が行/列情報によって順次に移動して前記算出された勾配を右側下端に配置された仮想セル客体と数字客体のマッチングまで反映して連結する段階を含むことを特徴とする、請求項30に記載のOCRベース文書分析方法。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200050179A KR102149050B1 (ko) | 2020-04-24 | 2020-04-24 | 인공지능을 이용한 ocr 기반 문서 분석 시스템 및 방법 |
KR1020200050180A KR102149052B1 (ko) | 2020-04-24 | 2020-04-24 | Nlp를 이용한 ocr 기반 문서 분석 시스템 및 방법 |
KR10-2020-0050179 | 2020-04-24 | ||
KR10-2020-0050180 | 2020-04-24 | ||
KR1020200050181A KR102149051B1 (ko) | 2020-04-24 | 2020-04-24 | 자기 신뢰도 정보를 이용한 ocr 기반 문서 분석 시스템 및 방법 |
KR10-2020-0050181 | 2020-04-24 | ||
PCT/KR2020/011210 WO2021215589A1 (ko) | 2020-04-24 | 2020-08-21 | Ocr 기반 문서 분석 시스템 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023522360A JP2023522360A (ja) | 2023-05-30 |
JP7444495B2 true JP7444495B2 (ja) | 2024-03-06 |
Family
ID=78269491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022563495A Active JP7444495B2 (ja) | 2020-04-24 | 2020-08-21 | Ocrベース文書分析システム及び方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7444495B2 (ja) |
WO (1) | WO2021215589A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114120322B (zh) * | 2022-01-26 | 2022-05-10 | 深圳爱莫科技有限公司 | 订单商品数量识别结果校正方法及处理设备 |
CN114689512B (zh) * | 2022-04-15 | 2024-09-24 | 中科芯集成电路有限公司 | 一种融合机器视觉和深度学习的口罩检测方法 |
CN116168409B (zh) * | 2023-04-20 | 2023-07-21 | 广东聚智诚科技有限公司 | 一种应用于标准、专利分析报告自动生成系统 |
CN116311311B (zh) * | 2023-05-23 | 2023-10-10 | 荣耀终端有限公司 | 电子表格生成方法、装置、电子设备及可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130063620A1 (en) | 2011-09-08 | 2013-03-14 | Samsung Electronics Co., Ltd. | Apparatus for recognizing character and barcode simultaneously and method for controlling the same |
JP2016126796A (ja) | 2014-12-27 | 2016-07-11 | 株式会社 ハンモック | 活字ocrシステム |
JP2019191665A (ja) | 2018-04-18 | 2019-10-31 | Tis株式会社 | 財務諸表読取装置、財務諸表読取方法及びプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100707943B1 (ko) * | 2005-04-27 | 2007-04-18 | 최철규 | 광학문자인식 기능을 활용한 재무제표인식 방법 및 그시스템 |
JP2011150466A (ja) * | 2010-01-20 | 2011-08-04 | Fujitsu Ltd | 文字列認識装置、文字列認識プログラムおよび文字列認識方法 |
KR102000221B1 (ko) * | 2017-11-02 | 2019-07-15 | (주)중외정보기술 | 자연어 처리 기반 요양급여 심사지원 서비스 시스템 및 방법 |
-
2020
- 2020-08-21 JP JP2022563495A patent/JP7444495B2/ja active Active
- 2020-08-21 WO PCT/KR2020/011210 patent/WO2021215589A1/ko active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130063620A1 (en) | 2011-09-08 | 2013-03-14 | Samsung Electronics Co., Ltd. | Apparatus for recognizing character and barcode simultaneously and method for controlling the same |
JP2016126796A (ja) | 2014-12-27 | 2016-07-11 | 株式会社 ハンモック | 活字ocrシステム |
JP2019191665A (ja) | 2018-04-18 | 2019-10-31 | Tis株式会社 | 財務諸表読取装置、財務諸表読取方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2023522360A (ja) | 2023-05-30 |
WO2021215589A1 (ko) | 2021-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7444495B2 (ja) | Ocrベース文書分析システム及び方法 | |
KR102149050B1 (ko) | 인공지능을 이용한 ocr 기반 문서 분석 시스템 및 방법 | |
US20230005285A1 (en) | Multi-page document recognition in document capture | |
US10120537B2 (en) | Page-independent multi-field validation in document capture | |
KR102149051B1 (ko) | 자기 신뢰도 정보를 이용한 ocr 기반 문서 분석 시스템 및 방법 | |
JP7437837B2 (ja) | 仮想セルを用いたocrベースの文書分析システム及び方法 | |
US8660294B2 (en) | Form data extraction without customization | |
US7106904B2 (en) | Form identification method | |
US20030107586A1 (en) | Image synthesization method | |
US20010043740A1 (en) | Character recognizing device, image reading device, character recognizing method, and program product | |
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JPH0573598A (ja) | 書類処理方法と書類処理システム | |
KR102149052B1 (ko) | Nlp를 이용한 ocr 기반 문서 분석 시스템 및 방법 | |
JP6458239B1 (ja) | 画像認識システム | |
JP2021043775A (ja) | 情報処理装置及びプログラム | |
JP4859054B2 (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
JP2003242441A (ja) | 帳票処理方法および装置並びにプログラム | |
JP3463008B2 (ja) | 媒体処理方法及び媒体処理装置 | |
JPH08329187A (ja) | 文書読取装置 | |
US6351560B1 (en) | Apparatus, method, and program for locating an objective on a form and a recording medium for recording the program for locating the objective on the form | |
JP4853313B2 (ja) | 文字認識装置 | |
JP2003223610A (ja) | 文字認識装置及び文字認識方法 | |
JPH06103411A (ja) | 文書読取装置 | |
JP2006053622A (ja) | 文書リンク情報取得システム | |
JP2000113100A (ja) | 媒体処理方法及び媒体処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230912 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7444495 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |