JP2022011037A - Image processing device, image processing method and program - Google Patents
Image processing device, image processing method and program Download PDFInfo
- Publication number
- JP2022011037A JP2022011037A JP2020111903A JP2020111903A JP2022011037A JP 2022011037 A JP2022011037 A JP 2022011037A JP 2020111903 A JP2020111903 A JP 2020111903A JP 2020111903 A JP2020111903 A JP 2020111903A JP 2022011037 A JP2022011037 A JP 2022011037A
- Authority
- JP
- Japan
- Prior art keywords
- area
- document image
- image
- registered
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、画像処理装置、画像処理方法およびプログラムに関する。 The present invention relates to an image processing apparatus, an image processing method and a program.
近年、コンピュータの普及に伴う労働環境の変化により、業務で扱う文書の電子化が進んでいる。例えば、受発注業務や申込審査業務を行う企業をはじめ、多くの企業では、請求書、見積書、注文書、申込書など、様々な帳票書類に対する電子化に取り組んでいる。このような業務においては、取り扱う大量の帳票書類の中から、どの帳票書類に該当するのかを特定し、帳票書類ごとにワークフローに沿った処理を行っている。例えば、ワークフローには、データ登録業務が挙げられる。具体的には、特定された帳票書類の中から、決められたデータ項目(帳票名、帳票番号、発行元会社情報、発行日、請求内容など)の情報を抽出し、会計処理システムや経費精算システムなどの所定業務システムにデータを登録する。このデータ登録業務を行う担当者は、様々な帳票書類に記載されたこれらのデータ項目の記載内容を目視で確認しつつ、所定の業務システムへ手動で記載内容を入力しているため、業務効率が低下している。そこで、データ登録業務を効率化するために、業務の自動化を図る取り組みがなされている。具体的には、入手した帳票書類をスキャンして電子化し、帳票種類を特定するための帳票認識処理や、光学的に文字情報を認識する光学的文字認識(以下、OCRと呼称)処理を適用することで、帳票内のデータ項目および記載内容を自動で抽出する。 In recent years, due to changes in the working environment due to the spread of computers, the digitization of documents handled in business is progressing. For example, many companies, including companies that perform ordering and application screening, are working on digitizing various forms such as invoices, quotations, purchase orders, and application forms. In such work, it is specified which form document corresponds to from a large amount of form documents to be handled, and processing is performed according to the workflow for each form document. For example, the workflow includes data registration work. Specifically, the information of the determined data items (form name, form number, issuer company information, issue date, billing details, etc.) is extracted from the specified form documents, and the accounting system and expense settlement are performed. Register data in a predetermined business system such as a system. The person in charge of this data registration work visually confirms the description contents of these data items described in various form documents and manually inputs the description contents into the predetermined business system, so that the business efficiency Is declining. Therefore, in order to improve the efficiency of data registration work, efforts are being made to automate the work. Specifically, the form recognition process for scanning and digitizing the obtained form documents to specify the form type and the optical character recognition (hereinafter referred to as OCR) process for optically recognizing character information are applied. By doing so, the data items and description contents in the form are automatically extracted.
帳票種類を特定する手法として、特許文献1の手法がある。この手法では、まず、帳票様式の特徴(罫線情報および、文字列の画像特徴情報)および確認情報(項目値が記入されている位置情報など)を、あらかじめ登録しておく。スキャンされた帳票を推定する際には、登録された帳票様式の特徴に基づき、処理対象文書の帳票様式を特定する。そして、特定された帳票様式に基づいた確認情報との照合を行うことにより帳票識別を行って項目値を抽出する。なお、照合に失敗した場合にはエラー提示を行う。これにより、該当項目値を自動抽出することによりユーザ作業負荷を大きく軽減することができる。また、帳票様式が類似しているが記載されている項目の位置が異なるような別の帳票が入力された場合であっても、誤検出を防止することが可能となる。
As a method for specifying the form type, there is a method of
この手法では、帳票の照合を行う際の確認情報として、帳票内の項目名情報を用いている。そのため、帳票内に項目名が記載されていない場合には適用できない。また、照合時に不一致となった場合には、帳票様式が類似しているが記載されている項目の位置が異なるような別の帳票が登録されていたとしても、帳票識別エラーとして処理が中断されてしまうため、項目値が抽出できなくなってしまう。 In this method, the item name information in the form is used as the confirmation information when collating the form. Therefore, it cannot be applied when the item name is not described in the form. In addition, if there is a discrepancy at the time of collation, even if another form is registered in which the form format is similar but the position of the described item is different, the processing is interrupted as a form identification error. Therefore, the item value cannot be extracted.
前述した課題を解決するために、複数の文書画像が登録文書画像として登録されている画像処理装置において、取得された文書画像と類似する複数の登録文書画像が選択されると、比較判定のための領域を決定する領域決定手段と、前記領域決定手段で決定された、前記取得された文書画像の領域に対して文字認識を行い、当該領域の属性を決定し、前記取得された文書画像の前記領域に対応する登録文書画像の領域の属性と比較する比較手段と、同一の属性を有する登録文書画像を類似文書画像として判定する判定手段とを備えることを特徴とする。 In order to solve the above-mentioned problem, when a plurality of registered document images similar to the acquired document image are selected in an image processing device in which a plurality of document images are registered as registered document images, for comparison determination. Character recognition is performed on the area of the acquired document image determined by the area determining means and the area determining means, the attributes of the area are determined, and the acquired document image is used. It is characterized by comprising a comparison means for comparing with the attribute of the area of the registered document image corresponding to the area, and a determination means for determining a registered document image having the same attribute as a similar document image.
本発明によれば、レイアウト構造の類似した登録文書画像が複数登録されていた場合にも、最も類似した類似文書画像を正しく特定でき、項目値の抽出精度を高めることができるようになる。 According to the present invention, even when a plurality of registered document images having similar layout structures are registered, the most similar similar document images can be correctly identified, and the extraction accuracy of item values can be improved.
以下、本発明を実施するための形態について図面を参照して説明する。ただし、この実施形態に記載されている構成要素はあくまで例示であり、本発明の範囲をそれらに限定する趣旨のものではない。 Hereinafter, embodiments for carrying out the present invention will be described with reference to the drawings. However, the components described in this embodiment are merely examples, and the scope of the present invention is not intended to be limited thereto.
[第1の実施形態]
<スキャンアシストシステム>
図1は、本発明の一実施形態における画像処理装置のハードウェア構成を示すブロック図の一例である。このような構成により、画像処理装置100は、所定の業務システムへ入力するのに必要な項目(以下、バリュー属性と呼称)に対応する項目値(以下、バリュー値と呼称)を、スキャンされた帳票中から自動で抽出するスキャンアシスト処理を実行する。
[First Embodiment]
<Scan Assist System>
FIG. 1 is an example of a block diagram showing a hardware configuration of an image processing apparatus according to an embodiment of the present invention. With such a configuration, the
図1に示すように、画像処理装置100は、CPU111、ROM112、RAM113、記憶部114、画像処理部115、ユーザインターフェース116、画像読取部117、画像出力部118、表示デバイス119を備える。これらのデバイスは、データバス110によって相互通信可能に接続されている。また、外部インターフェース120を介して、不図示の外部の情報処理装置、クラウドシステム、業務システムなどに接続されている。
As shown in FIG. 1, the
CPU111は、画像処理装置100を統括的に制御するためのコントローラ基盤である。CPU111は、ROM112に格納されているブートプログラムによりOS(オペレーティングシステム)を起動する。このOS上で、記憶部114に記憶されているコントローラプログラムが実行される。コントローラプログラムは、画像処理装置100を制御するためのプログラムである。CPU111は、データバス110によって接続されている各デバイスを統括的に制御する。RAM113は、CPU111の主メモリやワークエリアなどの一時記憶領域として動作する。
The
記憶部114は、HDDなどの、読み出しと書き込みが可能な不揮発メモリであり、ここには、前述のコントローラプログラム、処理結果など、様々なデータが記録される。
The
画像処理部115は、後述する画像読取部117で読み取られ、記憶部114上に格納された文書画像を解析し、スキャンアシストのための情報を生成する。解析処理は、以下の4つの処理からなる。1つ目は、文書画像内の文字列等のオブジェクトのブロック(オブジェクトの領域)を抽出するブロックセレクション処理(BS処理)である。2つ目は、文字列画像から文字列情報を抽出する光学文字認識処理(OCR処理)である。3つ目は、登録されている文書画像と新たにスキャンされた文書画像との間の類似度を求め、文書画像の種類を判定する処理である。4つ目は、判定処理に基づきスキャンアシストのための情報を生成する処理である。スキャンアシストのための情報は、各種業務システムへ入力するのに必要となる項目値(例えば、帳票名や帳票番号、請求元会社情報、請求金額など)からなる。
The
ユーザインターフェース116は、例えばキーボード、マウス、タッチパネル、ハードキーなどから構成される入出力装置である。ユーザインターフェース116は、ユーザからの各種の設定値または指定値を受け付け、指示情報をCPU111に伝達する。
The
画像読取部117は、スキャナデバイスであり、CCDなどの光学読取装置を用いて紙文書などを読取ることにより画像データ形式の文書画像を取得することができる。CPU111は、画像読取部117から文書画像を取得すると、記憶部114に記憶する。そして、CPU111は、スキャンアシスト処理を実行する際に、記憶部114に記憶された文書画像をRAM113に読み出す。
The
画像出力部118はプリンタデバイスであり、例えば、画像出力部118は、文書画像に係る画像データを、記憶媒体に出力する処理を実行することができる。あるいは、画像出力部118は印刷機能を備え、紙媒体などの出力媒体に文書画像を出力する処理を実行してもよい。
The
表示デバイス119は、LCDやCRTなどの表示装置であり、CPU111が生成した表示データを表示する。
The
外部インターフェース120は、LANや電話回線、赤外線といった近接無線などのネットワークを介して、外部機器と、画像データや抽出された帳票情報など各種データの送受信を行う。 The external interface 120 transmits and receives various data such as image data and extracted form information to and from an external device via a network such as a LAN, a telephone line, or a proximity radio such as infrared rays.
以上説明した画像処理装置100は一例であり、画像読取部117および画像出力部118、表示デバイス119のいずれかを有さない構成の画像処理装置100であってもよい。その際は、外部インターフェース120を介して必要な情報が相互に通信される構成とすればよい。また、画像処理装置100の一部機能を、外部インターフェース120を介して通信を相互に行うことにより、外部処理装置で実行するようにしても構わない。なお、外部処理装置は、サーバーなどのコンピュータ装置で実装してもよいし、インターネット上のクラウドサーバーで実装してもよい。その他必要に応じて、その他の構成を備えるものであってもよい。
The
<全体処理フロー>
本実施形態の画像処理装置100における全体フローについて、図2を用いて説明する。図2は、画像処理装置100における新しくスキャンされた文書画像に対するスキャンアシスト処理の全体を示すフローチャートである。図2のフローは、ユーザインターフェース116により、ユーザからの文書画像のスキャン指示を受け付けることにより起動する。その際、起動したユーザ名についての情報を、CPU111は、RAM113に保持しておく。ユーザ名は、不図示の認証装置などを利用することにより取得可能である。図2に示されるフローチャートによる処理は、記憶部114に記憶されたプログラムコードがRAM113に展開され、CPU111により実行される。
<Overall processing flow>
The overall flow of the
図2のステップS201において、CPU111は画像読取部118を介して文書をスキャンし、文書画像を取得して記憶部114に保存する。この文書画像を以後、クエリ文書画像と呼称する。
In step S201 of FIG. 2, the
ステップS202において、CPU111は、記憶部114に保存されているクエリ文書画像をRAM113に読み出し、クエリ文書画像に対して補正処理を行う。補正処理は、色変換処理、階調補正などの文書画像用の補正処理、および、回転補正処理を行う。回転補正処理は、文書画像内の文字列や線がデジタル的には水平方向に並ぶことを利用して、回転角度を算出し、算出された回転角度を用いて、画像を回転させることにより行う。
In step S202, the
ステップS203において、CPU111は、画像処理部115に対して、クエリ文書画像に対するブロックセレクション(BS)処理を実行させる。ブロックセレクション処理とは、画像内の領域を分割してオブジェクトブロックにし、それぞれのブロックの属性を判定する処理(領域分割処理)である。ブロックセレクション処理で得られた各ブロックに対する属性情報は、以降に説明する類似度計算などのための情報として用いる。なお、ブロックセレクション処理の詳細は図3を用いて後述する。
In step S203, the
ステップS204において、CPU111は、クエリ文書画像と登録文書画像群との間でマッチング処理を行う。マッチング処理とは、クエリ文書画像とすべての登録文書画像との間で類似度を算出する処理である。このとき、類似度が所定値以上である登録文書画像は、クエリ文書画像と同一種類の文書画像である可能性が高いと判断することができる。ここで、登録文書画像群は、後述するステップS212で記憶部114上に保存されるデータベースに登録された過去に処理された文書画像の集まりである。登録文書画像群は文書画像そのものでなく、各文書画像のブロックセレクション処理結果などのマッチング処理に利用可能な特徴量であってもよい。CPU111は、この登録文書画像群を記憶部114からRAM113に読み出して利用する。なお、マッチング処理の詳細は図4を用いて後述する。
In step S204, the
ステップS205において、CPU111は、登録文書画像群の中から、クエリ文書と同一種類文書である可能性が高い候補画像を抽出する。これは、ステップS204で得られたマッチング結果を用いて、所定値以上の類似度を得た登録画像を同一種類文書候補画像として抽出する。なお、すべての登録文書画像群との類似度が所定値を上回らなかった場合には、クエリ文書画像と同一種類文書画像は存在しなかったと判定される。
In step S205, the
ステップS206において、CPU111は、ステップS205において、同一種類文書候補画像として抽出判定された登録文書群があったかどうかを判断する。同一種類文書候補画像が抽出された場合にはステップS207に進む。一方、同一種類文書候補画像が抽出されなかった場合には、処理をスキップしてステップS211まで進む。
In step S206, the
ステップS207において、CPU111は、ステップS204で得られた同一種類文書候補画像と判定された各登録文書画像に対応するバリュー領域位置を、クエリ文書画像の中で推定する。バリュー領域位置推定処理は、登録文書画像に紐づいて登録されているすべてのバリュー領域位置が、クエリ文書画像中のどこに位置するかを推定する処理である。なお、バリュー領域位置推定処理の詳細は、図5を用いて後述する。
In step S207, the
ステップS208において、CPU111は、同一種類文書画像抽出処理を行う。同一種類文書画像抽出処理では、複数検出された同一種類文書候補画像から最も類似した登録文書画像を、類似文書画像として決定する処理である。なお、同一種類文書補画像判定処理の詳細は、図6および図7を用いて後述する。
In step S208, the
ステップS209において、CPU111は、クエリ文書画像に対して、ステップS208で決定された同一種類文書画像から推定されたバリュー領域位置に記載されているバリュー値を取得する。具体的には、BS処理で得られた各BSテキストブロックに対し、OCR処理を行うことにより、各バリュー属性に対するバリュー値を取得することができる。なお、ステップS208の判定処理で用いたBSテキストブロックについては、すでにOCR処理を適用しているため、記憶部114からRAM114に読み出して利用すればよい。
In step S209, the
ステップS210において、CPU111は、図9に示すようなバリュー値推定結果の確認画面を表示デバイス119上に表示する。なお、ここではクエリ文書画像の各項目に対するリコメンドとして、ステップS209で取得したバリュー値が埋められた状態で表示される。一方、ステップS206で同一種類文書候補画像なしと判断された場合は、リコメンドできるバリュー値が取得できていないことから、すべての項目欄が空欄の状態で表示されることになる。そして、ユーザはこの確認画面を見ながら、リコメンドされたバリュー値の修正作業を行うことになる。
In step S210, the
ステップS211において、CPU111は、文書画像登録処理を行う。文書画像登録処理は、クエリ文書画像のリコメンド結果に対してユーザによる修正が行われた際に、ユーザの修正内容を反映させた文書画像情報をデータベースに登録し、次回以降の処理で参照できるようにするための処理である。なお、文書画像登録処理の詳細は、図8を用いて後述する。
In step S211 the
ステップS212において、CPU111は、外部インターフェース120を介して所定の業務システムへの登録に必要な情報を送信する。送信する情報の一例としては、ステップS201で得られたスキャン画像およびスキャン情報(日時情報、スキャン設定情報など)、ステップS210でユーザによって確認/修正が行われた項目名と項目値の情報である。なお、送信する情報はこれに限らず、スキャン作業あるいは確認/修正作業を行ったユーザ情報などを含んでもよいことは言うまでもない。
In step S212, the
<ブロックセレクション処理>
図2のステップS203で行われるブロックセレクション処理(領域分割処理)について、図3を用いて説明する。図3(a)はステップS201で読み取った文書画像の一例である。図3(b)は読み取ったクエリ文書画像をオブジェクトブロックに分割した結果である。画像処理部115は、クエリ文書画像上のオブジェクトについて、文字(TEXT)/線(LINE)/表(TABLE)/写真(PHOTO)/図画(PICTURE)などの属性を判定する。オブジェクトブロックは、それぞれの属性を持つ領域が、画定された領域として示されている。図3(c)はブロックセレクションの処理フローを示している。
<Block selection processing>
The block selection process (regional division process) performed in step S203 of FIG. 2 will be described with reference to FIG. FIG. 3A is an example of the document image read in step S201. FIG. 3B shows the result of dividing the read query document image into object blocks. The
図3(c)を用いて、ブロックセレクション処理の方法について説明する。ステップS301において、画像処理部115は、文書画像に対して二値化処理を行うことにより、白黒の二値画像を生成する。
A method of block selection processing will be described with reference to FIG. 3 (c). In step S301, the
ステップS302において、画像処理部115は、黒画素輪郭で囲まれる画素の塊を抽出する。これはステップS301で生成された二値画像に対して輪郭線追跡を行うことで抽出する。なお、輪郭線追跡で得られた黒画素の塊の面積が所定の面積よりも大きい場合については、内部にある白画素に対しても輪郭線追跡を行い、白画素の塊を抽出する。さらに一定面積以上の白画素の塊の内部から再帰的に黒画素の塊を抽出することを繰り返す。
In step S302, the
ステップS303において、画像処理部115は、ステップS302で得られた黒画素の塊に対し、大きさおよび形状で分類し、異なる属性を持つ領域へ分類する。例えば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とする。さらに近接する文字が整列よくグループ化されている部分を、文字領域(TEXT)とする。扁平な画素塊を線領域(LINE)とする。一定の大きさ以上でかつ四角形の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域(TABLE)とする。不定形の画素塊が散在している領域を写真領域(PHOTO)とする。そして、それ以外の任意形状の画素塊を図画領域(PICTURE)とする。以後、文字領域と判定されたブロックをBSテキストブロックと呼称する。なお、BSテキストブロックの情報は、OCR処理にも利用可能であり、本ステップで必要に応じてOCR処理を行ってもよい。
In step S303, the
<マッチング処理>
図2のステップS204で行われるマッチング処理の概要について、図4を用いて説明を行う。図4(a)はクエリ文書画像400であり、図4(b)および図4(c)は登録文書画像410および420の一例である。図4(a)に示すクエリ文書画像400と図4(b)に示す登録文書画像410は、テキストの配置が類似していることがわかる。一方、図4(a)に示すクエリ文書画像400と図4(c)に示す登録文書画像420は、テキストの配置が類似していないことがわかる。そのため、画像処理部115は、適切な手法を利用して、図4(a)と図4(b)の類似度と、図4(a)と図4(c)の類似度を算出する。前者の方の類似度の方が高くなるので、マッチングの結果として、図4(b)に示す登録文書画像410が選択されることになる。
<Matching process>
The outline of the matching process performed in step S204 of FIG. 2 will be described with reference to FIG. 4 (a) is a
続いて、BSテキストブロックを用いた類似度算出処理の概念について説明を行う。図4(d)は、図4(a)のクエリ文書画像400に対して文字領域と判定されたBSテキストブロックを示す。点線がBSテキストブロックであり、ID401~ID405は各テキストブロックのIDである。図4(a)中の文字列が図4(d)のBSテキストブロックに対応していることがわかる。同様に、図4(e)は、図4(b)の登録文書画像410に対するBSテキストブロックを示し、ID411~416のBSテキストブロックで構成されている。図4(f)は、図4(c)の登録文書画像420に対するBSテキストブロックを示し、ID421~425のBSテキストブロックで構成されている。
Subsequently, the concept of the similarity calculation process using the BS text block will be described. FIG. 4D shows a BS text block determined to be a character area with respect to the
BSテキストブロックを用いた類似度算出は、BSテキストブロックの形状と配置がどれだけ類似しているかに着目して、類似度を算出する方法である。例えば、図4(d)と図4(e)を比較する場合、最初に、各文書の上部に位置する複数のテキストブロックの配置の比較を行う。具体的には、図4(d)中のID401、ID402、ID403、ID404と、図4(e)中のID411,ID412、ID413、ID414とを比較した場合、各テキストブロックの配置がそれぞれ類似している。さらに、図4(d)と図4(e)の各文書の下部に位置する複数のテキストブロックの配置の比較を行う。具体的には、図4(d)中のID405と図4(e)中のID416が同じ位置になるように位置合わせして考える。そうすると、図4(d)中のID403、ID404、ID405と、図4(e)中のID414、ID415、ID416が類似するようになる。したがって、図4(d)と図4(e)を比較した場合、文書の上部におけるテキストブロックの配置と、文書の下部におけるテキストブロックの配置の両方が類似しているので、同一種類文書の可能性が高いと判断され、高い類似度が算出される。このように、文書の上部と下部とにおいて、それぞれを比較することにより、図4に示すように、商品の数などに応じて文字領域の行数が変わるような文書に対する比較が容易になる。
The similarity calculation using the BS text block is a method of calculating the similarity by paying attention to how similar the shape and arrangement of the BS text block are. For example, when comparing FIG. 4 (d) and FIG. 4 (e), first, the arrangement of a plurality of text blocks located at the top of each document is compared. Specifically, when ID401, ID402, ID403, and ID404 in FIG. 4D are compared with ID4111, ID412, ID413, and ID414 in FIG. 4E, the arrangement of each text block is similar. ing. Further, the arrangement of a plurality of text blocks located at the bottom of each document of FIGS. 4 (d) and 4 (e) is compared. Specifically, the
一方で、図4(d)と図4(f)は、若干オーバーラップしているBSテキストブロックは存在するものの、類似度が高いBSテキストブロックは存在しない。そのため、同一種類の文書画像ではないと判断され、低い類似度が算出される。 On the other hand, in FIGS. 4 (d) and 4 (f), although there is a BS text block that slightly overlaps, there is no BS text block having a high degree of similarity. Therefore, it is determined that the document images are not of the same type, and a low degree of similarity is calculated.
なお、類似度の算出方法は、上記の方法に限定されるものではなく、BSテキストブロックを位置合わせする際の移動量、BSテキストブロック同士でオーバーラップした面積、類似したBSテキストブロック数などの情報を用いて算出することができる。 The method of calculating the similarity is not limited to the above method, and the amount of movement when aligning the BS text blocks, the area of overlap between the BS text blocks, the number of similar BS text blocks, etc. It can be calculated using information.
<バリュー領域位置推定処理>
図2のステップS207で行われるバリュー領域位置推定処理について、図5を用いて説明を行う。図5(a)はBSテキストブロック501~510で構成されたクエリ文書画像500である。図5(b)は、ステップS204において同一種類文書候補画像として得られた登録文書画像520であり、BSテキストブロック521~530から構成されている。図5(c)は、ステップS204において同一種類文書候補画像として得られた登録文書画像540であり、BSテキストブロック541~552から構成されている。また、図5(b)および図5(c)の登録文書画像520および540には、一部のBSテキストブロックにバリュー属性が付与されている。具体的には、ID521には帳票の表題を表すtitle属性、ID522には帳票発行元の会社名を表すissuer属性、ID523には帳票発行元会社の電話番号を表すissuerTel属性などのバリュー属性が付与されている。本実施形態においては、帳票番号(issueNo)、帳票発行日(issueDate)、小計(subTotal)、税合計(taxTotal)、合計(total)などを付与しているが、その他のバリュー属性を付与しても構わない。
<Value area position estimation process>
The value region position estimation process performed in step S207 of FIG. 2 will be described with reference to FIG. FIG. 5A is a
バリュー領域位置推定処理は、バリュー属性が付与された登録文書画像中のBSテキストブロックに対して形状と配置が類似しているクエリ文書画像中のBSテキストブロックを推定する処理である。具体的には、CPU111は、図5(b)に示す登録文書画像520のバリュー属性が付与されたBSテキストブロック521~524、527、529のそれぞれを、図5(a)に示すクエリ文書画像500上の同じ位置に射影する。例えば、登録文書画像520のissuerTel属性が付与されたBSテキストブロック(ID523)をクエリ文書画像上の同じ位置に射影すると、図5(d)に示すように、ID563の位置に射影されたとする。このとき、射影されたID563の近傍にあるクエリ文書画像500のBSテキストブロックを探索すると、ID502およびID503が近傍に位置すると判断される。そこで、ID563を、ID502とID503のいずれかに対応させるべきかを判断するために、テキストブロック間の配置の比較を行う。
The value area position estimation process is a process of estimating a BS text block in a query document image whose shape and arrangement are similar to those of the BS text block in the registered document image to which the value attribute is given. Specifically, the
最初に、ID563がID502と同じ位置になるように位置合わせして、クエリ文書500及び登録文書520のテキストブロックの配置の比較を行って類似度を算出する。次に、ID563がID503と同じ位置になるように位置合わせして、クエリ文書500及び登録文書520のテキストブロックの配置の比較を行って類似度を算出する。最後に、算出した類似度を比較すると、ID563をID503に位置合わせしたときの方が、テキストブロックの配置の類似度が高くなるので、類似度が高い方の位置でテキストブロック同士を対応付ける。すなわち、登録文書520の各BSテキストブロックID522、ID523、ID524は、それぞれクエリ文書500の各BSテキストブロックID502、ID503、ID504に対応づけられる。
First, the
一方、図5(c)に示す登録文書画像540の各バリュー属性が付与されたBSテキストブロック541~544、548、550、552についても、同様に、クエリ文書500上に射影して、テキストブロックの配置の比較を行う。類似度の比較の結果、登録文書540の各BSテキストブロックID542、ID543、ID544は、それぞれクエリ文書500のID502、ID503、ID504に対応付けられる。その他のバリュー属性が付与されたBSテキストブロックに対しても同様にして処理を行う。これにより、各登録文書520、540のバリュー属性を、クエリ文書の各BSテキストブロックに対応付けた結果として、図5(e)に示すようなバリュー領域位置の推定結果が得られる。
On the other hand, the BS text blocks 541 to 544, 548, 550, and 552 to which each value attribute of the registered
<同一種類文書画像抽出処理>
図2のステップS208で行われる同一種類文書画像抽出処理について、図6および図7を用いて説明を行う。図6(a)は、同一種類文書画像抽出処理のフロー図、図6(b)は、BSテキストブロックに対する判定に用いる順番を決定した結果を示している。また、図7(a)は、バリュー属性のデータ形式の一例であり、図7(b)はバリュー属性間における比較順位の優先度決定表を表している。ここで、バリュー属性のデータ形式は、バリュー値として抽出されるべき文字列がどのような特徴で構成されているかを、バリュー属性ごとに定義した対応表である。例えば、文字列中に特定の文字列を含むか否か、所定のデータフォーマットに従った文字列構成になっているか、使用されている文字種別に限定があるか、などを事前に定義しておく。なお、データ形式に関してはこれらに限るものではなく、文字列長や文字サイズなどの文字列情報の他、様々な条件をデータ形式として登録しても構わない。
<Same type document image extraction process>
The same type document image extraction process performed in step S208 of FIG. 2 will be described with reference to FIGS. 6 and 7. FIG. 6A shows a flow chart of the same type document image extraction process, and FIG. 6B shows the result of determining the order to be used for the determination for the BS text block. Further, FIG. 7A is an example of the data format of the value attribute, and FIG. 7B shows a priority determination table of the comparison order among the value attributes. Here, the data format of the value attribute is a correspondence table that defines the characteristics of the character string to be extracted as the value value for each value attribute. For example, it is defined in advance whether or not a specific character string is included in the character string, whether or not the character string structure conforms to a predetermined data format, and whether or not the character type used is limited. deep. The data format is not limited to these, and various conditions may be registered as the data format in addition to the character string information such as the character string length and the character size.
図7(b)の優先度決定表は、異なるバリュー属性間でデータ形式を比較したとき、図7(a)に示したデータ形式の差分が大きい順に優先度を定めている。優先度が高いほど、同一種類文書画像を判定する際に、BSテキストブロックに付与されている複数のバリュー属性の中から適切なバリュー属性を判定しやすいからである。例えば、帳票発行元の会社名(issuer)と帳票番号(issuerNo)の場合は、issuer属性に特定文字列が含まれているか否かのみで判断するしかないため、優先度は低く(3として)設定される。また、帳票発行元の会社名(issuer)と電話番号(issuerTel)の場合は、特定文字列の有無、フォーマット形式の適合有無、文字種の限定有無によって判断できるため、優先度は高く(1として)設定される。また、小計(subTotal)と税合計(taxTotal)の場合は、データ形式が全く同じであるため、判別不能として優先度は0として設定される。 In the priority determination table of FIG. 7 (b), when the data formats are compared between different value attributes, the priorities are determined in descending order of the difference in the data formats shown in FIG. 7 (a). This is because the higher the priority, the easier it is to determine an appropriate value attribute from a plurality of value attributes assigned to the BS text block when determining the same type of document image. For example, in the case of the company name (issuer) and form number (issuerNo) of the form issuer, the priority is low (as 3) because it is only judged whether or not the specific character string is included in the issuer attribute. Set. In addition, in the case of the company name (issuer) and telephone number (issuerTel) of the form issuer, the priority is high (as 1) because it can be judged by the presence / absence of a specific character string, the presence / absence of conformity with the format format, and the presence / absence of limitation of the character type. Set. Further, in the case of the subtotal (subTotal) and the tax total (taxTotal), since the data formats are exactly the same, the priority is set to 0 because it cannot be discriminated.
図6のステップS601において、CPU111は、後述のステップS606で複数の候補の中から登録文書が1つに決定されたか否かを判定する。複数の文書画像が候補に残っている場合には、以後のステップS602以降の処理を繰り返すことにより、候補の絞り込みを行う。そして、1つに決定された場合は、登録文書画像を同一種類文書画像と決定できるため、処理を終了する。
In step S601 of FIG. 6, the
ステップS602において、CPU111は、同一種類文書画像を比較判定する際に用いる、クエリ文書画像500のBSテキストブロックを決定する。判定に使用するBSテキストブロックは、ステップS207で推定して得られたバリュー領域位置の中から、以下の条件に基づいて決定される。
条件1 1つのBSテキストブロックに異なる複数のバリュー属性が付与されていて
条件1-1 比較判定の優先度が1の領域
条件1-2 比較判定の優先度が2の領域
条件1-3 比較判定の優先度が3の領域
条件2 1つのBSテキストブロックに1つのバリュー属性が付与されている領域
条件3 判定用の領域なし。
In step S602, the
上記の条件に基づき、ステップS207で得られた図5(e)に示すバリュー領域位置の推定結果に対して、判定に使用するBSテキストブロックの順番を決定する。図6(b)は、図5(e)の推定結果に判定順番を追記したものである。図6(b)に示すように、クエリ文書画像500のID501、ID507に対しては、登録文書520、540のいずれにおいても同一のバリュー属性が付与されており、上記の条件1~3のいずれに当てはまらないため、処理対象外となる。また、クエリ文書画像500のID509に対しては、登録文書520と登録文書540とで異なるバリュー属性(taxTotalとsubTotal)が付与されている。しかし、同一データ形式であるため、比較対象に適さないと判断して、同じく処理対象外となる。クエリ文書画像500のID503に対しては、異なるバリュー属性(issuerTelとissuer)が付与されており、図7(b)の優先度決定表で最大の優先度(1)となる組み合わせであることから、判定順番を1として設定する。
Based on the above conditions, the order of the BS text blocks used for the determination is determined with respect to the estimation result of the value region position shown in FIG. 5 (e) obtained in step S207. FIG. 6 (b) shows the estimation result of FIG. 5 (e) with the determination order added. As shown in FIG. 6B, the same value attribute is given to the
同様にして、残りのテキストブロックに対しても判定順番を決定していく。そして、ステップS602の領域決定が実行される場合には、1回目の処理においては判定順番1が付与されたBSテキストブロックであるID503が選択される。ステップS602が2回目以降に実行される場合は、判定順番2、3が付与されたBSテキストボックスを順番に選択していけばよい。すなわち、2回目はID504およびID502、3回目はID510、そして4回目は領域なしとして領域が決定されることになる。なお、優先度決定表に関してはこれに限るものではなく、条件1用として3つ以上の組み合わせの優先度決定表を用いても構わない。また、条件2用として、単体のバリュー属性での判定のしやすさに基づいた優先度決定表を用いて、領域決定を行っても構わない。
In the same way, the judgment order is determined for the remaining text blocks. Then, when the area determination in step S602 is executed,
ステップS603において、CPU111は、ステップS602で比較判定用のBSテキストブロックが決定されたか否かを判定する。決定されたBSテキストブロックがある場合にはステップS604へ進み、なかった場合はステップS607へ進む。
In step S603, the
ステップS604において、CPU111は、ステップS602で決定された判定用のBSテキストブロックに対してOCR処理を適用し、OCR結果の文字列を取得する。具体的には、最初に、クエリ文書画像500のID503に対してOCR処理を適用することにより、「〇〇株式会社」という文字列を取得する。なお、ここで取得した文字列情報は、図2のステップS209のバリュー値取得処理で再利用可能なため、記憶部114に保存しておく。
In step S604, the
ステップS605において、CPU111は、ステップS604で得られた文字列と、図7(a)で定義されているデータ形式との比較を行う。そして、データ形式との比較結果により、クエリ文書画像500のバリュー領域位置の文字列に付与するバリュー属性を決定する。ここでは、ID503に付与される属性としてissuerTel属性とissuer属性のどちらが適しているか判断することでバリュー属性を決定すればよい。そこで、ID503の文字列「〇〇株式会社」が、issuerTel属性およびissuer属性のデータ形式にあてはまるか否かをそれぞれ判定する。issuerTel属性のデータ形式と比較した場合、フォーマットや文字種の条件のいずれにも当てはまらないことがわかる。一方、issuer属性のデータ形式に対しては、特定文字列を含むという条件に合致することがわかる。よって、issuerTel属性のデータ形式に当てはまらなかったため、クエリ文書画像500のID503に付与されるバリュー属性としてはissuer属性であると推定される。なお、データ形式が、比較対象にした複数の属性に当てはまる場合は、当該比較対象にしたどちらの属性にも当てはまる可能性があると推定される。
In step S605, the
ステップS606において、CPU111は、ステップS605によって得られた結果に基づき、比較に用いた同一種類文書候補画像のうちのどれが同一種類文書として適切かを判定し、再びステップS601へ戻る。図5に示した例では、ステップS605でID503に対してissuer属性を付与すべきと推定したので、図6(b)でID503にissuer属性を対応付けていた登録文書画像540を同一種類文書画像であると決定する。なお、ステップS605における1つのBSテキストブロックに対する推定結果に基づいて、登録文書画像を1つに特定できない場合は、ステップS602に戻って次のBSテキストブロックを比較対象としてステップS605の処理が再度行われることになる。その場合、ステップS606では、それまでにステップS605で対象となったテキストブロックの比較結果すべてに基づいて、候補の中から同一種類文書が判定される。この場合、比較に使用した領域のうちデータ形式が一致すると判定されたバリュー属性の割合が所定のしきい値以上である登録文書画像を選択するなどすればよい。
In step S606, the
ステップS607において、CPU111は、図2のステップS204のマッチング処理で算出された類似度が最大となる登録文書画像を同一種類文書画像として選択すし、処理を終了する。
In step S607, the
<文書画像登録処理>
図2のステップS211で行われる文書画像登録処理について、図8を用いて説明を行う。
<Document image registration process>
The document image registration process performed in step S211 of FIG. 2 will be described with reference to FIG.
図8のステップS801において、CPU111は、ステップS208で決定された同一種類文書画像に対し、ステップS204のマッチング処理で算出された類似度が所定値以下であるか否かを判定する。所定値以下の場合はステップS802へ進み、所定値以上の場合はステップS804へ進む。
In step S801 of FIG. 8, the
ステップS802において、CPU111は、ステップS210でユーザによる修正が行われたか否かを判定する。修正が行われた場合はステップS803へ進み、修正が行われなかった場合はデータベースへの追加登録が不要であるため、処理を終了する。
In step S802, the
ステップS803において、CPU111は、ユーザによる修正内容が、バリュー領域の推定間違いに起因する修正であったか否かを判定する。バリュー領域の推定間違い起因する修正であった場合はステップS804へ進む。一方、単純にOCRの間違いの修正や、リコメンドされたバリュー値の前後に付与されていた文字列を削除した場合などは、データベースへの追加登録が不要であると判断し、処理を終了する。バリュー前後に付与されていた文字列を削除する具体例としては、会社名(issuer)に付与されている「株式会社」や、合計(total)および小計(subTotal)に付与されている「円」などが挙げられる。
In step S803, the
図9は、バリュー値推定結果の確認画面を表示デバイス119上に表示した例である。確認画面900は、スキャンしたクエリ文書画像901と、ステップS209において、同一種類文書画像から推定されたバリュー領域位置に記載されているバリュー値を示した推定結果902とを表示する。
FIG. 9 is an example in which the confirmation screen of the value value estimation result is displayed on the
ステップS804において、CPU111は、図9のバリュー値推定結果の確認画面上に入力されている各項目に対するバリュー値を取得する。
In step S804, the
ステップS805において、CPU111は、クエリ文書画像に対してブロックセレクション処理を行うことにより、BSテキストブロックを生成する。なお、本ブロックセレクション処理は、図2のステップS203で行ったブロックセレクション処理と同じである。
In step S805, the
ステップS806において、CPU111は、ステップS804で取得したバリュー値が記載されたBSテキストブロックの位置情報(座標およびサイズ)を取得する。バリュー領域位置は、クエリ文書画像に対して全文OCR処理を実行し、文字列が一致するBSテキストブロックを探索すればよい。あるいは、図9に示したバリュー値推定結果の確認画面上で、ユーザに正しいバリューが記載された領域を選択させることで取得することも可能である。
In step S806, the
ステップS807において、CPU111は、ステップS804およびステップS806で得られた結果に基づき、文書画像情報を記憶部114に保存されたデータベースに登録し、処理を終了する。登録する内容としては、BSテキストブロックの位置情報、バリュー属性とバリュー属性が付与されたバリュー領域位置情報である。なお、登録内容はこれに限るものではなく、クエリ画像データやバリュー値のOCR結果、スキャン設定条件、操作者情報など、必要な情報を登録しても構わないことは言うまでもない。
In step S807, the
以上の処理フローにより、クエリ文書画像とレイアウト構造が類似した登録文書画像が複数登録されていた場合に対しても、最も類似した登録文書画像を類似文書画像として特定できるようになる。加えて、帳票情報として各項目に対するバリュー値を精度よく推定することが可能となる。なお、類似文書画像を判定する際にも、比較判定が容易に可能なBSテキストブロックに限定して比較処理を行うため、効率的な類似判定処理が可能となる。 With the above processing flow, even when a plurality of registered document images having a layout structure similar to that of the query document image are registered, the most similar registered document image can be specified as a similar document image. In addition, it is possible to accurately estimate the value value for each item as form information. Even when determining a similar document image, the comparison process is limited to the BS text block that can be easily compared and determined, so that the efficient similarity determination process can be performed.
[第2の実施形態]
本実施形態では、バリュー属性のデータ形式の出現頻度を学習する仕組みを提供することで、第1の実施形態では判定できなかった同じバリュー属性を有するBSテキストブロックに対しても比較判定できるようにすることを目的とする。なお、第1の実施形態と同様の処理については同じ番号を付与し、詳細な説明は割愛する。
[Second Embodiment]
In the present embodiment, by providing a mechanism for learning the appearance frequency of the data format of the value attribute, it is possible to make a comparative judgment even for a BS text block having the same value attribute, which could not be determined in the first embodiment. The purpose is to do. The same numbers are assigned to the same processes as in the first embodiment, and detailed explanations are omitted.
<文書画像登録処理>
本実施形態における図2のステップS211で行われる文書画像登録処理について、図10および図11を用いて説明を行う。図10は、文書画像登録処理の処理フローを説明する図であり、図11は、バリュー属性のデータ形式の出現頻度を学習した結果を示す図である。なお、図11は登録文書画像ごとの集計回数が追加された以外は、図7(a)に示した図面と同じである。
<Document image registration process>
The document image registration process performed in step S211 of FIG. 2 in the present embodiment will be described with reference to FIGS. 10 and 11. FIG. 10 is a diagram for explaining the processing flow of the document image registration process, and FIG. 11 is a diagram showing the result of learning the appearance frequency of the data format of the value attribute. Note that FIG. 11 is the same as the drawing shown in FIG. 7 (a) except that the total number of times for each registered document image is added.
図10のステップS801~S807において、CPU111は、第1の実施形態と同様の処理を行うことで、クエリ文書画像を記憶部114に保存されたデータベースに登録する。
In steps S801 to S807 of FIG. 10, the
ステップS1001において、CPU111は、データ形式の出現頻度の登録処理を行う。出現頻度登録処理は、登録文書画像ごとに、同一種類文書画像として判定されたクエリ文書画像内での各バリュー属性に対応して使用されたデータ形式を集計する処理である。具体的には、図2のステップS209において、クエリ文書画像500に付与されたバリュー属性ごとに、図11で定義されたデータ形式のどの条件に当てはまるかを判断し、登録文書画像と紐づけて集計する。例えば、issuer属性が付与されたID503は、特定文字列「株式会社」の条件に当てはまることから、出現頻度を1回増加させ、29回と集計する。またtotal属性が付与されたID510、subTotal属性が付与されたID507およびID509は、特定文字列「円」の条件に当てはまることから、出現頻度を3回増加させ、27回と集計する。issuerTel属性が付与されたID504は、フォーマット「##-####-####」の条件に当てはまることから、出現頻度を1増加させ11回と集計する。
In step S1001, the
<同一種類文書画像抽出処理>
本実施形態における図2のステップS208で行われる同一種類文書画像抽出処理について、第1の実施形態との違いを図6(a)の詳細処理フローおよび図12を用いて説明を行う。図12(a)はクエリ文書画像500を、図12(b)および図12(c)は図2のステップS205で選択された同一種類文書候補画像である登録文書画像540および登録文書画像1200を表している。図12(d)はステップS207で得られたバリュー領域位置の推定結果を表している。なお、図12(a)および図12(b)は、第1の実施形態の説明で用いた図5(a)および図5(c)と同じ文書画像である。
<Same type document image extraction process>
The same type document image extraction process performed in step S208 of FIG. 2 in this embodiment will be described with reference to the detailed process flow of FIG. 6A and FIG. 12 to explain the difference from the first embodiment. 12 (a) shows the
図6(a)のステップS601において、CPU111は、同一種類文書の候補が1つに決定されたかを判断する。1つに決定された場合は処理を終了し、複数候補残っている場合にはステップS602以降を繰り返す。
In step S601 of FIG. 6A, the
ステップS602において、CPU111は、同一種類文書画像を判定する際に用いるBSテキストブロックを決定する。判定に使用するBSテキストブロックは、ステップS207で推定して得られたバリュー領域位置の中から、以下の条件に基づいて決定される。
条件1 1つのBSテキストブロックに異なる複数のバリュー属性が付与されていて
条件1-1 比較判定の優先度が1の領域
条件1-2 比較判定の優先度が2の領域
条件1-3 比較判定の優先度が3の領域
条件2 1つのBSテキストブロックに1つのバリュー属性が付与されている領域
条件3 1つのBSテキストブロックに対して共通のバリュー属性が付与されていて
比較する登録文書同士のデータ形式の出現頻度に有意差がある領域
条件4 判定用の領域なし。
In step S602, the
Area where there is a significant difference in the frequency of appearance of data formats between registered documents to be compared
本実施形態で追加された条件3について、図11および図12を用いて説明を行う。図12(d)に示すように、条件3に適合する候補として、1つのBSテキストブロックに共通のバリュー属性が付与された領域としてID501、ID502、ID503、ID504が選ばれる。そして、この領域のうち、登録文書画像540と登録文書画像1200との間で、各バリュー属性のデータ形式の条件に有意差がある領域を検出する。有意差の有無については、図11に示した出現頻度で判定すればよい。例えば、title属性が付与されたID501には、出現頻度に有意差があるデータ形式の条件がないため、判定不可と判断される。同様にして、issueNo属性が付与されたID502も判定不可と判断される。一方、issuer属性が付与されたID503では、特定文字列として登録文書画像540では「株式会社」が多用されているのに対し、登録文書画像1100では「(株)」が多用されているという違いがある。このため、条件3の比較判断として利用可能であると判断される。同様にして、issuerTel属性が付与されたID504は、フォーマットとして「(##)-####-####」の表記があるか否かで比較できると判断される。
The
ステップS605において、CPU111は、ステップS602で選択されたBSテキストブロックに対して、データ形式の比較を行う。具体的には、ID503の文字列「〇〇株式会社」に対して、issuer属性のデータ形式を比較すると、「株式会社」という特定文字列を多用している登録文書画像540の可能性が高いと判断できる。また、ID504の文字列「03-1234-5678」に対して、issuerTel属性のデータ形式を比較すると、フォーマット「(##)-####-####」の表記がないため、登録文書画像1100の可能性は低いと判断できる。
In step S605, the
ステップS606において、CPU111は、ステップS605での判定結果を受け、同一種類文書画像を判定する。ここでは、データ形式の出現頻度の比較において、同一種類文書画像の可能性が高いと判断された登録文書画像540を選択する。
In step S606, the
その他の処理に関しては、第1の実施形態と同様であるため、説明を省略する。 Since other processes are the same as those in the first embodiment, the description thereof will be omitted.
以上の処理により、登録文書画像毎にデータ形式の出現頻度を学習することによって、第1の実施形態では判別することができなかった、同一のバリュー属性においても比較を行うことができるようになる。加えて、同一種類文書画像の特定精度を向上させることができる。その結果として、バリュー値の推定精度の向上を実現できる。 By the above processing, by learning the appearance frequency of the data format for each registered document image, it becomes possible to perform comparison even with the same value attribute, which could not be determined in the first embodiment. .. In addition, the accuracy of specifying the same type of document image can be improved. As a result, it is possible to improve the estimation accuracy of the value value.
[その他の実施形態]
本発明は、以下の処理を実行することによっても実現される。上述した実施形態の機能を実現するソフトウエア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPUなど)がプログラムを読み出して実行する処理である。
[Other embodiments]
The present invention is also realized by executing the following processing. The software (program) that realizes the functions of the above-described embodiment is supplied to the system or device via a network or various storage media, and the computer (or CPU, MPU, etc.) of the system or device reads and executes the program. It is a process to do.
また、本実施形態の機能を実現するためのプログラムコードを、1つのコンピュータ(CPU、MPU)で実行する場合であってもよいし、複数のコンピュータが協働することによって実行する場合であってもよい。さらに、プログラムコードをコンピュータが実行する場合であってもよいし、プログラムコードの機能を実現するための回路などのハードウェアを設けてもよい。またはプログラムコードの一部をハードウェアで実現し、残りの部分をコンピュータが実行する場合であってもよい。 Further, the program code for realizing the function of the present embodiment may be executed by one computer (CPU, MPU) or may be executed by a plurality of computers collaborating with each other. May be good. Further, the program code may be executed by a computer, or hardware such as a circuit for realizing the function of the program code may be provided. Alternatively, a part of the program code may be implemented by hardware and the rest may be executed by a computer.
100 画像処理システム
111 CPU
112 ROM
113 RAM
114 記憶部
115 画像処理部
116 ユーザインターフェース
117 画像読取部
118 画像出力部
119 表示デバイス
120 外部インターフェース
100
112 ROM
113 RAM
114
Claims (12)
取得された文書画像と類似する複数の登録文書画像が選択されると、比較判定のための領域を決定する領域決定手段と、
前記領域決定手段で決定された、前記取得された文書画像の領域に対して文字認識を行い、当該領域の属性を決定し、前記取得された文書画像の前記領域に対応する登録文書画像の領域の属性と比較する比較手段と、
同一の属性を有する登録文書画像を類似文書画像として判定する判定手段と
を備えたことを特徴とする画像処理装置。 In an image processing device in which multiple document images are registered as registered document images,
When a plurality of registered document images similar to the acquired document image are selected, the area determination means for determining the area for comparison determination and the area determination means.
Character recognition is performed on the area of the acquired document image determined by the area determining means, the attribute of the area is determined, and the area of the registered document image corresponding to the area of the acquired document image is determined. A comparison method to compare with the attributes of
An image processing apparatus including a determination means for determining a registered document image having the same attribute as a similar document image.
取得された文書画像と類似する複数の登録文書画像が選択されると、比較判定のための領域を決定する領域決定ステップと、
前記領域決定手段で決定された、前記取得された文書画像の領域に対して文字認識を行い、当該領域の属性を決定し、前記取得された文書画像の前記領域に対応する登録文書画像の領域の属性と比較する比較ステップと、
同一の属性を有する登録文書画像を類似文書画像として判定する判定ステップと
を備えたことを特徴とする画像処理方法。 In the image processing method in an image processing device in which a plurality of document images are registered as registered document images,
When a plurality of registered document images similar to the acquired document image are selected, an area determination step for determining an area for comparison determination and an area determination step,
Character recognition is performed on the area of the acquired document image determined by the area determining means, the attribute of the area is determined, and the area of the registered document image corresponding to the area of the acquired document image is determined. Comparison steps to compare with the attributes of
An image processing method comprising: a determination step of determining a registered document image having the same attribute as a similar document image.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020111903A JP2022011037A (en) | 2020-06-29 | 2020-06-29 | Image processing device, image processing method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020111903A JP2022011037A (en) | 2020-06-29 | 2020-06-29 | Image processing device, image processing method and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022011037A true JP2022011037A (en) | 2022-01-17 |
Family
ID=80147894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020111903A Pending JP2022011037A (en) | 2020-06-29 | 2020-06-29 | Image processing device, image processing method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022011037A (en) |
-
2020
- 2020-06-29 JP JP2020111903A patent/JP2022011037A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7013182B2 (en) | Information processing equipment, information processing methods and programs | |
US8660294B2 (en) | Form data extraction without customization | |
US7769772B2 (en) | Mixed media reality brokerage network with layout-independent recognition | |
US7587412B2 (en) | Mixed media reality brokerage network and methods of use | |
JP5181888B2 (en) | Method and system for generating a graphical user interface | |
JP4533273B2 (en) | Image processing apparatus, image processing method, and program | |
US20170147552A1 (en) | Aligning a data table with a reference table | |
CN103975342A (en) | Systems and methods for mobile image capture and processing | |
US8675260B2 (en) | Image processing method and apparatus, and document management server, performing character recognition on a difference image | |
JP6357621B1 (en) | Accounting processing apparatus, accounting processing system, accounting processing method and program | |
EP2884425B1 (en) | Method and system of extracting structured data from a document | |
JP2013164740A (en) | Accounting information reading system, accounting information reading method, and program | |
CN112487859A (en) | Information processing apparatus, information processing method, and computer readable medium | |
US10032232B2 (en) | Information processing system, information processing method, and computer program product | |
JP2018042067A (en) | Image processing system, image processing method, and information processing device | |
JP2016192223A (en) | Accounting information reading system and program | |
JP2019191665A (en) | Financial statements reading device, financial statements reading method and program | |
US11151373B2 (en) | Information processing apparatus and information processing method | |
JP2022011037A (en) | Image processing device, image processing method and program | |
JP2019153919A (en) | Image processing device, control method thereof, and program | |
JP2021064122A (en) | Image processing device, image processing method, and program | |
JP2009182530A (en) | Business processing execution support device | |
JP2019168856A (en) | Image processing apparatus, image processing method, and image processing program | |
US20230273952A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP7484176B2 (en) | Information processing device, information processing system, and program |