JP7150809B2 - 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム - Google Patents
多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム Download PDFInfo
- Publication number
- JP7150809B2 JP7150809B2 JP2020219612A JP2020219612A JP7150809B2 JP 7150809 B2 JP7150809 B2 JP 7150809B2 JP 2020219612 A JP2020219612 A JP 2020219612A JP 2020219612 A JP2020219612 A JP 2020219612A JP 7150809 B2 JP7150809 B2 JP 7150809B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- document image
- layout
- document
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
- Electrically Operated Instructional Devices (AREA)
Description
記憶部24は、記憶装置として利用でき、電子文書生成装置10が動作する上で必要となる各種アプリケーション及び当該アプリケーションによって利用される各種データなどが記録される。GPU28は、機械学習などを実行する上で行われる繰り返し演算を多用する場合に適しており、CPU25とともに用いる。
電子文書生成装置10は、次に述べる処理I~IIIをこの順に行う。
前処理55とは、文字列を含む画像に対して、学習モデルを用いた文字認識を実行(認識)しやすくするための事前の処理を行うことをいい、処理II、IIIで行う認識処理の認識精度を向上させることを目的とする。
レイアウト認識処理56では、先ず文書画像の「レイアウト認識」を行う。レイアウト認識処理56とは、入力された画像内で、どの位置に、どのような情報があるのかを認識する処理である。
文字列認識処理57とは、文字列を含む画像を、画像と画像に含まれる文字列との対応関係を学習した文字列学習モデル13を用いて、テキストデータに変換する処理のことである。文字列認識処理57は、「テキストデータの配置」及び「ノイズ除去」などの処理を含むものとしてもよい。
「テキストデータの配置」とは、切出した文字列の画像にスペースが含まれている場合には文字列とともにスペースも一緒に認識されるので、テキストデータはスペースとともに配置されることを指す。
文書画像取得部31は、文書画像データベース15から文書画像を取得してもよい。或いは、文書画像取得部31は、入力装置26のスキャナーから文書画像を入手してもよい。
図5は電子文書生成装置10の入力データと出力データとを説明する図であり、図5(a)は入力データとして文書画像取得部31に取得された文書画像を示す。当該文書画像には、ホチキス跡50、手書き51、印章52、及び画像53などのノイズが存在する。
前処理55は、後述するレイアウト認識部33及び文字列認識部35による、学習モデルを用いる画像認識の認識精度を向上させるために行われる。
背景除去部32a(図4参照)は、文書画像取得部31が取得した文書画像の背景を除去する。
図7を参照して、傾き補正部32bにより行われる処理について説明する。図7は、前処理55で行う傾き補正を説明する図である。図7(a)は傾き補正される前の文書画像59aを示し、図7(b)は傾き補正された後の文書画像59bを示す。
図8を参照して、形状調整部32cにより行われる処理について説明する。図8は、前処理で行う形状調整を説明する図である。図8(a)は形状調整される前の文書画像60aを示し、図8(b)は形状調整された後の文書画像60bを示す。
この場合、レイアウト認識部33は、文書画像61に含まれる複数の要素のうち、認識した要素が不要なものに該当する場合は当該要素の位置情報は取得されず、認識した要素が必要なものに該当する場合は当該要素の位置情報を取得することとしてもよい。または、レイアウト認識部33は、文書画像61に含まれる複数の要素のうち、必要な要素のみを認識し、当該要素の位置情報を取得することとしてもよい。
図13を参照して、切出部34によるセル画素の切り出しについて説明する。図13は、セル画像の切り出しを説明する図である。切出部34により切り出されたセル67は、複数の文字列を含む場合もある。
文字列認識部35は、英語で書かれた文書画像を文字認識する場合に、英語の文字列の認識に適した文字列学習モデルを用いることで、認識精度を向上させることができる。
図15は、文字列認識処理57で行うテキストデータの配置を説明する図であり、図15(a)は文字認識が行われる前の文字列の画像67aであり、図15(b)は文字認識が行われた後の文字列68a、すなわちテキストデータ68aである。
従って、文字列認識部35は、字句と字句の間にあるスペースについても認識してテキストデータに変換するので、画像67aと同様に2つの字句を離して配置することができる。
出力部36は、複数の要素に係る範囲の各々の位置情報に、複数の要素に係るテキストデータの各々を電子媒体のテキストとして出力してもよい。
要素の位置情報は、文書画像62内の所定点を原点とした平面直交座標によって表されてもよい。
レイアウト学習用データに蓄積される文書画像に、アノテーションとともに文書画像に含まれる複数の要素に係る範囲の各々の文書画像内における位置情報が付与されてもよい。
レイアウト学習モデル14は再学習されることで、文書画像のレイアウトの認識精度を向上させることができる。
文字列学習用データ修正部44(図4参照)は、入力に基づいて、文字列認識部35により生成されたテキストデータが修正され、この修正されたテキストデータを追加することで文字列学習用データを更新する。
文書画像の形式は、一例としてPDF、JPG、及びGIFなどがあり、この他電子文書生成装置10が画像として処理できるデータ形式のものは含み得る。
前処理機能は背景除去機能、傾き補正機能、及び形状調整機能を備え、背景除去機能は文書画像取得機能が取得した文書画像の背景を除去し、傾き補正機能は文書画像取得機能が取得した文書画像の傾きを補正し、形状調整機能は文書画像取得機能が取得した文書画像の全体の形状及び大きさを調整する。
この場合、レイアウト認識機能は、文書画像取得機能に取得された文書画像に含まれる複数の要素のうち、認識した要素が不要なものに該当する場合は当該要素の位置情報は取得されず、認識した要素が必要なものに該当する場合は当該要素の位置情報を取得することとしてもよい。または、レイアウト認識機能は、文書画像61に含まれる複数の要素のうち、必要な要素のみを認識し、当該要素の位置情報を取得することとしてもよい。
切出機能は、レイアウト認識機能により認識された表を構成する全ての縦線及び横線を再生し、全てのセルの位置情報を生成する。
出力機能は、レイアウト認識機能により取得された文字列の位置情報、及び切出部により取得されたセルの文書画像内における位置情報に基づいてテキストデータを出力し、電子媒体のテキストとして再生する。
ステップS103において、文書画像取得部31が取得したデータがPDFか否かの判定を行う。PDFではない場合(No:S103)、即ち、文書画像取得部31が取得したデータが文書画像であった場合、ステップS106に移行する。
取得された前処理後の文書画像は、後述のステップS115、ステップS120、及びステップS136の文書画像切り出し処理に送られる。
要素の種類は、文字列、表、画像、印章、手書きである。
最小境界ボックスとは、要素を囲う矩形のうち面積が最小のものをいい、当該要素が占める範囲を意味する。レイアウト認識部33は、文書画像と取得した要素とを照合し、文書画像と取得した要素の位置情報との間に齟齬があった場合は取得した要素の最小境界ボックスの位置情報の調整を行う。
文書画像に表が残っていない場合(No:S113)、後述のステップS130へ表以外のレイアウト情報を送る。
ステップS116において、切出部34は、ステップS115にて切り出された表の画像を取得する。
ステップS118にて取得されたセルの情報は、後述するステップS127に送られる。
ステップS121において、切出部34は、ステップS120の処理により切り出されたセルの画像を取得する。
ステップS123において、文字列認識部35は、文字列認識の処理が行われた文字列の位置情報を取得する。
文字列認識部35は、文書画像と取得した文字列の位置情報とを照合し、文書画像と取得した文字列の位置情報との間に齟齬があった場合は取得した文字列の最小境界ボックスの位置情報の調整を行う。
文字列認識部35は、後述のステップS140の処理により送られてきた内部記憶された要素のレイアウト情報を参照して、文書画像の中に他の要素が残っているか否かを判定する。
文字列認識部35が、文書画像に残っている要素が文字列であると判定した場合(Yes:S133)、ステップS135に移行する。
ステップS135において、文字列認識部35は、文字列の位置情報を取得する。
なお、上記した各機能部の処理は、電子文書生成装置10のCPU25により実行される処理である。
11 情報通信ネットワーク
12 ユーザ端末
13 文字列学習モデル
14 レイアウト学習モデル
15 文書画像データベース
20 入出力インターフェース
21 通信インターフェース
22 ROM
23 RAM
24 記憶部
25 CPU
26 入力装置
27 出力装置
28 GPU
31 文書画像取得部
32 前処理部
32a 背景除去部
32b 傾き補正部
32c 形状調整部
33 レイアウト認識部
34 切出部
35 文字列認識部
36 出力部
40 レイアウト学習用データ生成部
41 レイアウト学習用データ修正部
42 レイアウト学習部
43 文字列学習用データ生成部
44 文字列学習用データ修正部
45 文字列学習部
47 傾き補正前の文書画像
48 文字列
49 表
50 ホッチキス跡
51 手書き
52 印章
53 画像
54 ノイズ除去
55 前処理
56 レイアウト認識処理
57 文字列認識処理
58a、59a、60a 文書画像
58b、59b、60b 文書画像
61、62 文書画像
63、64 表
65 縦線
66 横線
67 セル画像
69、70、73 文字列の画像
71a 文字列の画像
71b テキストデータ
72 認識範囲
73 表
75 認識範囲
76 文字列の注釈記号
77 表の注釈記号
78 画像の注釈記号
79 印章の注釈記号
80 外枠の注釈記号
81 ノイズの注釈記号
82 手書きの注釈記号
83 縦線の注釈記号
84 横線の注釈記号
85 テキストデータの注釈
100 電子文書生成システム
S31 文書画像取得ステップ
S32 前処理ステップ
S33 レイアウト認識ステップ
S34 切出ステップ
S35 文字認識ステップ
S36 出力ステップ
Claims (16)
- 文書を画像化した文書画像を取得する文書画像取得部と、
前記文書画像取得部が取得した前記文書画像についてレイアウトを認識する前に、前記文書画像の背景色を検出し、当該背景色が白色か否かを判断し、当該背景色が白色でないと判断した場合、前記文書画像の背景以外の情報を抽出し、当該背景色を白色にした後に抽出した情報を重ね合わせることで背景色を除去する背景除去部と、
前記文書画像取得部が取得した前記文書画像についてレイアウトを認識する前に、前記文書画像の中の文字列を抽出し、抽出した文字列の中に傾斜した文字列があるか否かを判断し、前記文書画像の中に傾いた文字列が有る場合に、傾斜した当該文字列の書字方向に対する傾斜角を検出し、傾斜した当該文字列に対して傾斜角がゼロになるように回転処理を施して当該文字列の傾きを補正する傾き補正部と、
前記文書画像取得部が取得した前記文書画像についてレイアウトを認識する前に、前記文書画像の全体の縦横比が実際の文書の全体の縦横比と異なる場合は、当該文書画像の全体の縦横比が実際の文書の全体の縦横比と等しくなるように調整する形状調整部と、
文書画像に含まれる複数の要素と、当該複数の要素の各々の識別情報との対応関係を学習したレイアウト学習モデルを用いて、
前記背景除去部、前記傾き補正部、及び前記形状調整部の処理を経た前記文書画像に含まれる複数の要素の各々の前記文書画像内における範囲を特定し、前記要素の種類は前記文書の種類に応じて必要なものと不要なものとに予め分類し、前記文書画像に含まれる複数の要素のうち、認識した要素が不要なものに該当する場合は当該要素の位置情報は取得せず、認識した要素が必要なものに該当する場合は当該要素の位置情報を取得するレイアウト認識部と、
前記レイアウト認識部により認識された前記種類が前記表に該当する前記要素において、当該要素に含まれる前記表の中のセルの各々の単体毎の画像に切り出し、前記表に含まれる全ての前記セルについてセル単体毎の画像と前記セルの各々の前記文書画像内における位置情報を取得する切出部と、
文書画像と当該文書画像に含まれる文字列との対応関係を学習した文字列学習モデルを用いて、
前記切出部において切り出された前記セルの各々に含まれる文字列について、前記文字列学習モデルを用いて文字認識し、前記文字列の画像にスペースが含まれている場合に当該文字列とともにスペースも一緒に認識し、かつ、前記文字列の画像に文字を構成しない画素であるノイズが含まれている場合に当該ノイズを除去して、前記文字列に係るテキストデータを生成する文字列認識部と、
前記文字列認識部により生成された前記文字列に係るテキストデータを、当該テキストデータを含む前記セルに係る前記切出部が取得した前記文書画像内における位置情報に、電子媒体のテキストとして出力する出力部と、
を備えることを特徴とする電子文書生成装置。 - 前記レイアウト認識部により認識された前記種類が前記表に該当する前記要素において、前記レイアウト認識部は、前記表を構成する全ての縦線及び横線の各々の長さと位置を認識することで、隣接する2本の前記縦線及び隣接する2本の前記横線により構成される四角形を前記表のセルとして認識し、
さらに、前記レイアウト認識部は前記表を構成する線の線種についても認識し、認識された当該線種は、前記文書画像取得部が取得した文書画像に基づいて電子文書を再現する際に、当該電子文書に含まれる表を構成する線のオブジェクトに反映されることを特徴とする請求項1に記載の電子文書生成装置。 - 前記レイアウト認識部は、前記文書画像取得部が取得した文書画像と取得した前記要素とを照合し、前記文書画像取得部が取得した文書画像と取得した前記要素の位置情報との間に齟齬があった場合は取得した前記要素の最小境界ボックスの位置情報の調整を行うことを特徴とする請求項1又は2に記載の電子文書生成装置。
- 前記レイアウト認識部は、認識範囲の周囲の所定範囲以内に文字と同色の色又は予め設定された色の線が有るか否かの判定を行い、当該線が有る場合には当該線を含む範囲を認識範囲に追加する補正を行うことを特徴とする請求項1乃至3のいずれか1項に記載の電子文書生成装置。
- 前記レイアウト認識部は、認識範囲の内部に所定の大きさの空白が有るか否かの判定を行い、当該空白が有る場合には、当該空白及び当該空白より右側の部分に係る範囲を削除して認識範囲とする補正を行うことを特徴とする請求項1乃至4のいずれか1項に記載の電子文書生成装置。
- 複数の前記要素を含む文書画像であって、当該要素に当該要素の各々に該当する前記種類に関連付けられたアノテーションが付与されており、
前記アノテーションが付与された複数の前記文書画像を蓄積してレイアウト学習用データを生成するレイアウト学習用データ生成部をさらに備え、
前記レイアウト学習用データは前記レイアウト学習モデルの教師有り学習に用いられる、
ことを特徴とする請求項1ないし5のいずれか1項に記載の電子文書生成装置。 - 前記文書画像に、前記アノテーションとともに前記文書画像に含まれる前記複数の要素に係る範囲の各々の前記文書画像内における位置情報が付与されることを特徴とする請求項6に記載の電子文書生成装置。
- 入力に基づいて、前記レイアウト認識部により認識された前記複数の要素の各々の種類、及び前記複数の要素の各々の範囲の前記文書画像内における位置情報の少なくともいずれかが修正され、この修正されたデータを追加することで前記レイアウト学習用データを更新するレイアウト学習用データ修正部をさらに備える、
ことを特徴とする請求項6または7に記載の電子文書生成装置。 - 前記レイアウト学習用データ修正部により更新された前記レイアウト学習用データを用いて、前記レイアウト学習モデルの再学習を行うレイアウト学習部をさらに備える、
ことを特徴とする請求項8に記載の電子文書生成装置。 - 前記文字列学習モデルの教師有り学習に用いる文字列学習用データを生成する文字列学習用データ生成部をさらに備える、
ことを特徴とする請求項1ないし9のいずれか1項に記載の電子文書生成装置。 - 入力に基づいて、前記文字列認識部により生成されたテキストデータが修正され、この修正されたテキストデータを追加することで前記文字列学習用データを更新する文字列学習用データ修正部をさらに備える、
ことを特徴とする請求項10に記載の電子文書生成装置。 - 前記文字列学習用データ修正部により更新された前記文字列学習用データを用いて、前記文字列学習モデルの再学習を行う文字列学習部をさらに備える、
ことを特徴とする請求項11に記載の電子文書生成装置。 - 前記文字列認識部は、複数の前記文字列学習モデルを備え、前記複数の要素の各々に含まれる文字列の言語に適応した前記文字列学習モデルを用いる、
ことを特徴とする請求項1ないし12のいずれか1項に記載の電子文書生成装置。 - 前記レイアウト学習モデルは、契約書用のレイアウト学習モデル、請求書用のレイアウト学習モデル、覚書用のレイアウト学習モデル、納品書用のレイアウト学習モデル、又は領収書用のレイアウト学習モデルのいずれかであることを特徴とする請求項1ないし13のいずれか1項に記載の電子文書生成装置。
- 電子文書生成装置に用いられるコンピュータが、
文書を画像化した文書画像を取得する文書画像取得ステップと、
前記文書画像取得ステップにおいて取得した前記文書画像についてレイアウトを認識する前に、前記文書画像の背景色を検出し、当該背景色が白色か否かを判断し、当該背景色が白色でないと判断した場合、前記文書画像の背景以外の情報を抽出し、当該背景色を白色にした後に抽出した情報を重ね合わせることで背景色を除去する背景除去ステップと、
前記文書画像取得ステップにおいて取得した前記文書画像についてレイアウトを認識する前に、前記文書画像の中の文字列を抽出し、抽出した文字列の中に傾斜した文字列があるか否かを判断し、前記文書画像の中に傾いた文字列が有る場合に、傾斜した当該文字列の書字方向に対する傾斜角を検出し、傾斜した当該文字列に対して傾斜角がゼロになるように回転処理を施して当該文字列の傾きを補正する傾き補正ステップと、
前記文書画像取得ステップにおいて取得した前記文書画像についてレイアウトを認識する前に、前記文書画像の全体の縦横比が実際の文書の全体の縦横比と異なる場合は、当該文書画像の全体の縦横比が実際の文書の全体の縦横比と等しくなるように調整する形状調整ステップと、
文書画像に含まれる複数の要素と、当該複数の要素の各々の識別情報との対応関係を学習したレイアウト学習モデルを用いて、
前記背景除去ステップ、前記傾き補正ステップ、及び前記形状調整ステップの処理を経た前記文書画像に含まれる複数の要素の各々の前記文書画像内における範囲を特定し、前記要素の種類は前記文書の種類に応じて必要なものと不要なものとに予め分類し、前記文書画像に含まれる複数の要素のうち、認識した要素が不要なものに該当する場合は当該要素の位置情報は取得せず、認識した要素が必要なものに該当する場合は当該要素の位置情報を取得するレイアウト認識ステップと、
前記レイアウト認識ステップにおいて認識された前記種類が前記表に該当する前記要素において、当該要素に含まれる前記表の中のセルの各々の単体毎の画像に切り出し、前記表に含まれる全ての前記セルについてセル単体毎の画像と前記セルの各々の前記文書画像内における位置情報を取得する切出ステップと、
文書画像と当該文書画像に含まれる文字列との対応関係を学習した文字列学習モデルを用いて、
前記切出ステップにおいて切り出された前記セルの各々に含まれる文字列について、前記文字列学習モデルを用いて文字認識し、前記文字列の画像にスペースが含まれている場合に当該文字列とともにスペースも一緒に認識し、かつ、前記文字列の画像に文字を構成しない画素であるノイズが含まれている場合に当該ノイズを除去して、前記文字列に係るテキストデータを生成する文字列認識ステップと、
前記文字列認識ステップにおいて生成された前記文字列に係るテキストデータを、当該テキストデータを含む前記セルに係る前記切出ステップにおいて取得した前記文書画像内における位置情報に、電子媒体のテキストとして出力する出力ステップと、
を行うことを特徴とする電子文書生成方法。 - 電子文書生成装置に用いられるコンピュータに、
文書を画像化した文書画像を取得する文書画像取得機能と、
前記文書画像取得機能において取得した前記文書画像についてレイアウトを認識する前に、前記文書画像の背景色を検出し、当該背景色が白色か否かを判断し、当該背景色が白色でないと判断した場合、前記文書画像の背景以外の情報を抽出し、当該背景色を白色にした後に抽出した情報を重ね合わせることで背景色を除去する背景除去機能と、
前記文書画像取得機能において取得した前記文書画像についてレイアウトを認識する前に、前記文書画像の中の文字列を抽出し、抽出した文字列の中に傾斜した文字列があるか否かを判断し、前記文書画像の中に傾いた文字列が有る場合に、傾斜した当該文字列の書字方向に対する傾斜角を検出し、傾斜した当該文字列に対して傾斜角がゼロになるように回転処理を施して当該文字列の傾きを補正する傾き補正機能と、
前記文書画像取得機能において取得した前記文書画像についてレイアウトを認識する前に、前記文書画像の全体の縦横比が実際の文書の全体の縦横比と異なる場合は、当該文書画像の全体の縦横比が実際の文書の全体の縦横比と等しくなるように調整する形状調整機能と、
文書画像に含まれる複数の要素と、当該複数の要素の各々の識別情報との対応関係を学習したレイアウト学習モデルを用いて、
前記背景除去機能、前記傾き補正機能、及び前記形状調整機能の処理を経た前記文書画像に含まれる複数の要素の各々の前記文書画像内における範囲を特定し、前記要素の種類は前記文書の種類に応じて必要なものと不要なものとに予め分類し、前記文書画像に含まれる複数の要素のうち、認識した要素が不要なものに該当する場合は当該要素の位置情報は取得せず、認識した要素が必要なものに該当する場合は当該要素の位置情報を取得するレイアウト認識機能と、
前記レイアウト認識機能において認識された前記種類が前記表に該当する前記要素において、当該要素に含まれる前記表の中のセルの各々の単体毎の画像に切り出し、前記表に含まれる全ての前記セルについてセル単体毎の画像と前記セルの各々の前記文書画像内における位置情報を取得する切出機能と、
文書画像と当該文書画像に含まれる文字列との対応関係を学習した文字列学習モデルを用いて、
前記切出機能において切り出された前記セルの各々に含まれる文字列について、前記文字列学習モデルを用いて文字認識し、前記文字列の画像にスペースが含まれている場合に当該文字列とともにスペースも一緒に認識し、かつ、前記文字列の画像に文字を構成しない画素であるノイズが含まれている場合に当該ノイズを除去して、前記文字列に係るテキストデータを生成する文字列認識機能と、
前記文字列認識機能において生成された前記文字列に係るテキストデータを、当該テキストデータを含む前記セルに係る前記切出機能において取得した前記文書画像内における位置情報に、電子媒体のテキストとして出力する出力機能と、
を発揮することを特徴とする電子文書生成プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020219612A JP7150809B2 (ja) | 2020-12-28 | 2020-12-28 | 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム |
PCT/JP2021/047935 WO2022145343A1 (ja) | 2020-12-28 | 2021-12-23 | 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム |
AU2021412659A AU2021412659A1 (en) | 2020-12-28 | 2021-12-23 | Architecture for digitalizing documents using multi-model deep learning, and document image processing program |
JP2022137023A JP2022169754A (ja) | 2020-12-28 | 2022-08-30 | 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020219612A JP7150809B2 (ja) | 2020-12-28 | 2020-12-28 | 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022137023A Division JP2022169754A (ja) | 2020-12-28 | 2022-08-30 | 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022104411A JP2022104411A (ja) | 2022-07-08 |
JP7150809B2 true JP7150809B2 (ja) | 2022-10-11 |
Family
ID=82259389
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020219612A Active JP7150809B2 (ja) | 2020-12-28 | 2020-12-28 | 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム |
JP2022137023A Pending JP2022169754A (ja) | 2020-12-28 | 2022-08-30 | 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022137023A Pending JP2022169754A (ja) | 2020-12-28 | 2022-08-30 | 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム |
Country Status (3)
Country | Link |
---|---|
JP (2) | JP7150809B2 (ja) |
AU (1) | AU2021412659A1 (ja) |
WO (1) | WO2022145343A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004178010A (ja) | 2002-11-22 | 2004-06-24 | Toshiba Corp | 文書処理装置並びにその方法及びプログラム |
JP2020046860A (ja) | 2018-09-18 | 2020-03-26 | 株式会社三菱Ufj銀行 | 帳票読取装置 |
JP2020184109A (ja) | 2019-04-26 | 2020-11-12 | Arithmer株式会社 | 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH045779A (ja) * | 1990-04-24 | 1992-01-09 | Oki Electric Ind Co Ltd | 文字認識装置 |
JP3162158B2 (ja) * | 1992-02-20 | 2001-04-25 | 株式会社リコー | 画像読取装置 |
JPH07160809A (ja) * | 1993-12-08 | 1995-06-23 | Nec Corp | Ocr装置 |
JPH08263588A (ja) * | 1995-03-28 | 1996-10-11 | Fuji Xerox Co Ltd | 文字認識装置 |
JP3940491B2 (ja) * | 1998-02-27 | 2007-07-04 | 株式会社東芝 | 文書処理装置および文書処理方法 |
-
2020
- 2020-12-28 JP JP2020219612A patent/JP7150809B2/ja active Active
-
2021
- 2021-12-23 WO PCT/JP2021/047935 patent/WO2022145343A1/ja active Application Filing
- 2021-12-23 AU AU2021412659A patent/AU2021412659A1/en active Pending
-
2022
- 2022-08-30 JP JP2022137023A patent/JP2022169754A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004178010A (ja) | 2002-11-22 | 2004-06-24 | Toshiba Corp | 文書処理装置並びにその方法及びプログラム |
JP2020046860A (ja) | 2018-09-18 | 2020-03-26 | 株式会社三菱Ufj銀行 | 帳票読取装置 |
JP2020184109A (ja) | 2019-04-26 | 2020-11-12 | Arithmer株式会社 | 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2022169754A (ja) | 2022-11-09 |
WO2022145343A1 (ja) | 2022-07-07 |
AU2021412659A9 (en) | 2024-02-08 |
JP2022104411A (ja) | 2022-07-08 |
AU2021412659A1 (en) | 2023-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8508756B2 (en) | Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions | |
US8718364B2 (en) | Apparatus and method for digitizing documents with extracted region data | |
JP5121599B2 (ja) | 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 | |
KR101985612B1 (ko) | 종이문서의 디지털화 방법 | |
JP4854491B2 (ja) | 画像処理装置及びその制御方法 | |
US9262679B2 (en) | System and method for identification and separation of form and feature elements from handwritten and other user supplied elements | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
US8170862B2 (en) | Document image processing device and document image processing program for maintaining layout in translated documents | |
CN107633055B (zh) | 一种将图片转成html文档的方法 | |
JP2012199901A (ja) | 文字の形状特徴を使用した文字比較による文書改変検知方法 | |
JP2022066321A (ja) | 情報処理装置及びプログラム | |
US8600175B2 (en) | Apparatus and method of processing image including character string | |
CN113836971B (zh) | 一种图像型扫描件识别后的视觉信息重现方法、系统及存储介质 | |
JP2008181174A (ja) | 特許出願又は実用新案登録出願の図面原稿の作成方法 | |
JP7150809B2 (ja) | 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム | |
JP5696394B2 (ja) | 画像処理装置、画像処理方法、及び、画像処理プログラム | |
JP2009223363A (ja) | 文書処理装置および文書処理プログラム | |
JP4741363B2 (ja) | 画像処理装置、画像処理方法、及び、画像処理プログラム | |
US9411547B1 (en) | Compensation for print shift in standardized forms to facilitate extraction of data therefrom | |
JP2007299321A (ja) | 情報処理装置、情報処理方法、情報処理プログラム、及び、情報記憶媒体 | |
JP4651407B2 (ja) | 画像処理装置およびコンピュータプログラムおよび記憶媒体 | |
JP6844574B2 (ja) | 画像処理装置、及び画像処理方法 | |
JP6743401B2 (ja) | 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム | |
JP6852359B2 (ja) | 画像処理装置及びプログラム | |
JP2682873B2 (ja) | 表形式文書の認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211029 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20211029 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220325 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220830 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220830 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220912 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220920 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220928 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7150809 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |