JP7181445B2 - 情報処理装置、その制御方法とプログラム - Google Patents

情報処理装置、その制御方法とプログラム Download PDF

Info

Publication number
JP7181445B2
JP7181445B2 JP2017230519A JP2017230519A JP7181445B2 JP 7181445 B2 JP7181445 B2 JP 7181445B2 JP 2017230519 A JP2017230519 A JP 2017230519A JP 2017230519 A JP2017230519 A JP 2017230519A JP 7181445 B2 JP7181445 B2 JP 7181445B2
Authority
JP
Japan
Prior art keywords
data
entry
entry data
post
comparison
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017230519A
Other languages
English (en)
Other versions
JP2019101647A (ja
Inventor
健翔 大田
唯仁 八尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Original Assignee
Canon Marketing Japan Inc
Canon IT Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon IT Solutions Inc filed Critical Canon Marketing Japan Inc
Priority to JP2017230519A priority Critical patent/JP7181445B2/ja
Publication of JP2019101647A publication Critical patent/JP2019101647A/ja
Application granted granted Critical
Publication of JP7181445B2 publication Critical patent/JP7181445B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、記入形式が合っている記入前データと記入後データのセットであるか否かを自動判別する技術に関する。
帳票から文字を読み取るOCR(Optical Character Recognition)装置を利用するにあたり、スキャン等で入力する帳票の種類(記入形式)のレイアウト情報を事前にOCR装置に設定してことは、OCRをする際には一般的である。
使用する帳票の種類は、ユーザが明示的に与えることもできるが、機械が自動で識別する方法も考えられる。自動識別にすることで、帳票用紙をバッチ単位で入力する際に、ページ数を固定して帳票を読み込ませたり、順番を決めたりする必要が無くなり、便利である。帳票の自動識別手法の主要なものは、入力した帳票画像中から識別に有用な特徴点を抽出し、帳票の種類(記入形式)の候補群の中から一番特徴点の近いものを、該当する帳票の種類(記入形式)として識別するものである。
しかしながら、帳票の種類(記入形式)のレイアウトによっては特徴点の取りにくいものもある。例えば、下線で構成されたレイアウトの帳票である。
特許文献1には、上記のような、特徴点の取りにくいレイアウトの帳票の種類(記入形式)でも、帳票識別を可能にする方法として、論理演算と不一致尺度に基づいて識別する技術について開示されている。
特開2013-196611号公報
このように、特許文献1には、記入前帳票画像(記入前データ)、記入例帳票画像、識別対象帳票画像の3種のデータを用意する。それぞれの帳票画像をグリッドに分け、各小領域が前景領域(1)か背景領域(0)かの判定を行う。そうすると0と1で構成されたグリッドができる。記入前帳票グリッドと識別対象帳票グリッド間、および記入例帳票グリッドと識別対象帳票グリッド間で論理演算をすることで、グリッド間で0と1が不一致な小領域の量を求める。不一致な小領域の量をもとに、特定の尺度で不一致の度合いをはかる。記入前帳票画像と識別対象帳票画像で不一致の度合いを求め、不一致の度合いにもとづき、識別対象帳票画像が記入前帳票画像により生成されたものかどうかを判定する技術が記載されている。
しかしこの手法では、精度を良くするために事前に記入例帳票画像を作成する必要があり煩雑である。
更に、用紙のズレや画像間でのサイズの違いを吸収するために領域分割を行っているが、領域分割する粒度を複数設定しておく必要があり煩雑である。
更に、傾きのズレ等に対しては未対応であり、精度に問題がある
そのため、記入例帳票画像を作成することなく、またスキャンした識別対象帳票画像のサイズの違いや傾きのズレ、位置のズレを自動で補正することが望まれる。
本発明は、記入前データと記入後データの差分から情報を得るために記入前データと記入後データとの記入形式の整合性を判定することが可能な仕組みを提供することを目的とする。
本発明は、記入前データおよび記入後データからそれぞれ読み取られたデータ箇所に共通して存在する特徴点同士の位置を合わせるべく前記記入後データを変形させ、さらに前記記入後データをデータのある箇所とデータのない箇所とに二値化した比較用記入後データに変換し、前記記入前データを同様に二値化した比較用記入前データに変換する変換手段と、前記比較用記入後データ前記比較用記入前データとの対応する箇所どうしの論理積によるデータを生成する生成手段と、前記比較用記入前データと前記生成された論理積によるデータとの間で不一致となる箇所の量、および、前記比較用記入前データのデータのある箇所の量に基づいて、記入前データ及び記入後データとの記入形式の整合性を判定する判定手段と、を備えることを特徴とする。
本発明は、報処理装置の制御方法であって、前記情報処理装置の変換手段が、記入前データおよび記入後データからそれぞれ読み取られたデータ箇所に共通して存在する特徴点同士の位置を合わせるべく前記記入後データを変形させ、さらに前記記入後データをデータのある箇所とデータのない箇所とに二値化した比較用記入後データに変換し、前記記入前データを同様に二値化した比較用記入前データに変換する変換工程と、前記情報処理装置の除去手段が、前記比較用記入後データから、前記比較用記入前データにおいてデータのない箇所に係るデータを除去する除去工程と、前記情報処理装置の判定手段が、前記比較用記入前データと前記データを除去された比較用記入後データとの差異に基づいて、記入前データ及び記入後データとの記入形式の整合性を判定する判定工程と、を含むことを特徴とする。
本発明は、報処理装置で読み取り実行可能なプログラムであって、前記情報処理装置を、記入前データおよび記入後データからそれぞれ読み取られたデータ箇所に共通して存在する特徴点同士の位置を合わせるべく前記記入後データを変形させ、さらに前記記入後データをデータのある箇所とデータのない箇所とに二値化した比較用記入後データに変換し、前記記入前データを同様に二値化した比較用記入前データに変換する変換手段と、前記比較用記入後データから、前記比較用記入前データにおいてデータのない箇所に係るデータを除去する除去手段と、前記比較用記入前データと前記データを除去された比較用記入後データとの差異に基づいて、記入前データ及び記入後データとの記入形式の整合性を判定する判定手段と、して機能させる。
本発明により、記入前データと記入後データの差分から情報を得るために記入前データと記入後データとの記入形式の整合性を判定することが可能な仕組みを提供することが可能となる。
本発明の実施形態における、帳票識別のシステム(手書き文字OCRシステム)構成の一例を示す図である。 本発明の実施形態における、OCR装置等のハードウェア構成の一例を示すブロック図である。 本発明の実施形態における、帳票識別する処理の一例を示すフローチャートである。 本発明の実施形態における、フィッティングする処理の一例を示すフローチャートである。 本発明の実施形態における、不一致率の算出の一例を示すフローチャートである。 本発明の実施形態における、記入前帳票情報データベースの一例を示す図である。 本発明の実施形態における、記入前帳票画像(表紙)の一例を示す図である。 本発明の実施形態における、記入前帳票画像(本文)の一例を示す図である。 本発明の実施形態における、識別対象帳票画像の一例を示す図である。 本発明の実施形態における、フィッティング処理により得られた、変形後識別対象帳票画像の一例を表す図である。 本発明の実施形態における、変形のための特徴点の対応付け処理の一例を表す図である。 本発明の実施形態における、記入前帳票画像(表紙)と変形後識別対象帳票画像(表紙)の画素同士の積を取り、AND画像(1)を生成する処理の一例を表す図である。 本発明の実施形態における、記入前帳票画像(本文)と変形後識別対象帳票画像(表紙)の画素同士の積を取り、AND画像(2)を生成する処理の一例を表す図である。 本発明の実施形態における、AND画像(1)と変形後識別対象帳票(表紙)の画素同士の排他的論理和を取り、XOR画像を生成する処理の一例を表す図である。 本発明の実施形態における、AND画像(2)と変形後識別対象帳票(表紙)の画素同士の排他的論理和を取り、XOR画像を生成する処理の一例を表す図である。 本発明の実施形態における、変形前、変形後の画素の位置関係を示す式、不一致率を算出する式の一例を示す図である。
図1を説明する。
図1は、本発明の実施形態における帳票識別のシステムのシステム構成の一例を示す図である。
手書き文字抽出の主要な処理を行うためのOCR装置(情報処理装置)1001および、帳票をスキャンして画像ファイル化(画像スキャン)するスキャナ3001が通信経路4001を介して接続される構成となっている。
通信経路4001はスキャナ3001の有する物理インターフェースに応じて、有線LAN,無線LAN,USBなどの形態をとることができる。
通信経路4001上にはファイルサーバ5001を置いてもよい。スキャナ3001でスキャンした画像をOCR装置1001に取り込む方法として、スキャナ3001からOCR装置1001に直接画像を送信する方法、スキャナ3001で取り込んだ画像ファイルをいったんファイルサーバ5001に保管し、OCR装置1001がファイルサーバ5001から画像ファイルを取り出す方法どちらをとっても良い。
図2を説明する。
図2は、本発明の実施形態におけるOCR装置1001のハードウェア構成の一例を示すブロック図である。ファイルサーバ5001も同様の構成となる。
CPU1は、システムバス4に接続される各デバイスやコントローラを統括的に制御する。また、ROM2あるいは外部メモリ11には、CPU1の制御プログラムであるBIOS(Basic Input / Output System)やオペレーティングシステムプログラム(以下、OS)や、各サーバ或いは各OCR装置の実行する機能を実現するために必要な後述する各種プログラム等が記憶されている。
RAM3は、CPU1の主メモリ、ワークエリア等として機能する。CPU1は、処理の実行に際して必要なプログラム等をROM2あるいは外部メモリ11からRAM3にロードして、該ロードしたプログラムを実行することで各種動作を実現するものである。
また、5は入力コントローラで、キーボード(KB)9やカメラデバイス12(撮像装置)、不図示のマウス等のポインティングデバイス等からの入力を制御する。206はビデオコントローラで、CRTディスプレイ(CRT)10等の表示器への表示を制御する。なお、CRT10と記載しているが、表示器はCRTだけでなく、液晶ディスプレイ等の他の表示器であってもよい。これらは必要に応じて管理者が使用するものである。
メモリコントローラ7は、ブートプログラム,各種のアプリケーション,フォントデータ,ユーザファイル,編集ファイル,各種データ等を記憶する外部記憶装置(ハードディスク(HD))や、フレキシブルディスク(FD)、或いはOCR装置MCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ11へのアクセスを制御する。
通信I/Fコントローラ8は、ネットワーク(例えば、図に示したLAN)を介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信等が可能である。
なお、CPU1は、例えばRAM3内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、CRT10上での表示を可能としている。また、CPU1は、CRT10上の不図示のマウスカーソル等でのユーザによる指示を可能とする。
本発明を実現するための後述する各種プログラムは、外部メモリ11に記録されており、必要に応じてRAM3にロードされることによりCPU1によって実行されるものである。さらに、上記プログラムの実行時に用いられる定義ファイル及び各種情報テーブル等も、外部メモリ11に格納されており、これらについての詳細な説明も後述する。
また、本発明における実行可能なプログラムは、図3乃至図4の処理をコンピュータに実行させるプログラムである。なお、本発明におけるプログラムは、図3乃至図4の各処理ごとのプログラムであってもよい。
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読み出し、実行することによっても本発明の目的が達成されることは言うまでもない。
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記録した記録媒体は本発明を構成することになる。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、CD-R、DVD-ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク等を用いることが出来る。
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
また、本発明は、複数の機器から構成されるシステムに適用しても、ひとつの機器から成る装置に適用しても良い。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。
次に図3~図5のフローチャートを用いて、本発明の実施形態におけるOCR装置1001が実行する処理について説明する。
図3のフローチャートは、OCR装置1001のCPU201が所定の制御プログラムを読み出して実行する処理であり、帳票識別する処理を示すフローチャートである。
ユースケースの一例として、識別対象帳票が学校のレポートであり、表紙か本文を識別するタスクを考える。
尚、以降で説明する記入後データは連続するページで構成されているものする。更に記入後データは、記入形式が異なる複数種類(表紙用、本文用)の記入前データの連続するページ毎に、記入前データとの差分から得られる情報(手書きの学籍番号、手書きの氏名、手書きの得点等)が既に記入済みのものとする。
ステップS301では、図2のCPU201は、ユーザから帳票識別要求を受け付ける。
ステップS3011では、記入後データのデータ箇所を連続するページの中で何ページ目かを選択する。
ステップS302では、図2のCPU201は、識別対象帳票情報をメモリに読み込む。
識別対象帳票情報には、スキャナ1101でスキャンした識別対象帳票画像501(今回は表紙とする)と、その帳票が属するグループの情報321のうちグループ1に属するという情報が含まれているとする。また識別対象帳票画像(記入後データ)501はスキャンに伴う傾きがあるものとする。さらに記入後データにおけるデータ箇所(罫線や記入枠や項目名、手書きの学籍番号、手書きの氏名、手書きの得点等)を読み取る(読取手段)。
図6のデータベーステーブル301は、記入前帳票情報候補を格納した一例を示すテーブルである。この例では、画像ID、画像ファイル名、グループのインデックス321、表紙か本文かの情報を属性として持つ。
このように、データベーステーブル301には、記入前帳票情報候補として記入形式が異なる複数種類の記入前データを記憶している(記憶手段)。
図7A、図7Bの画像は、データベーステーブル301内のグループ1に属する記入前帳票画像を読み出したものである。レコード311の画像が記入前帳票画像(記入前データ)401(表紙)にあたり、レコード312の画像が記入前帳票画像402(本文)にあたるとする。
ステップS303では、図2のCPU201は、ファイルサーバ5001より、記入前帳票情報候補を抽出し、メモリ上のキューに格納する。ファイルサーバ5001はデータベーステーブル301の通りの構成になっている。
記入前帳票情報候補はステップS302で与えられた識別対象帳票情報をもとに、その帳票が属するグループ1に該当する候補が抽出される。
ステップS304では、図2のCPU201は、ステップS303で用意したキューを参照し、記入前帳票情報のレコードがあるかどうかを判定する。キューにレコードが残っていれば、ステップS305へ進み、残っていなければ、ステップS309へ進む。
ステップS305では、図2のCPU201は、ステップS303で用意したキューを参照し、先頭のレコード1つを取り出し、そのレコードをメモリに格納する。
さらに記入前データにおけるデータ箇所(罫線や記入枠や項目名等)を読み取る(読取手段)。
ステップS306では、図2のCPU201は、ステップS302で読み込んだ識別対象帳票情報と、ステップS305で読み込んだ、記入前帳票情報のレコード1つを、「フィッティング」サブプロセスへ渡し、識別対象帳票画像を構成する画素が記入前帳票画像の画素にフィッティングした、変形後識別対象帳票画像502を返り値として受取り、この返り値をメモリに格納する。
ステップS307では、図2のCPU201は、ステップS305で読み込んだ、記入前帳票情報のレコード1つと、ステップS306で受け取った変形後識別対象帳票画像502を「不一致率の算出」サブプロセスへ渡し、これら2つの画像の不一致率を算出する。
ステップS308では、図2のCPU201は、ステップS308で算出した不一致率を、記入前帳票情報のレコードと対応付けて、メモリへ格納する。その後、ステップS303の直前へ処理が渡される。
ステップS309では、図2のCPU201は、ステップS308で格納された記入前帳票情報のレコードと不一致率のペアの中から、不一致率が最小のものを抽出しメモリに格納する。
つまりここで、ステップS506で既に判定をした、二値化した記入形式が異なる複数種類の記入前データと二値化した記入後データとの重複度(不一致率)をそれぞれ比較することで、読み取った記入後データと記入形式が異なる複数種類の記入前データの中で記入形式が合う記入前データを選択していることになる(選択手段)。
ステップS310では、図2のCPU201は、ステップS309で格納した最小の不一致率を事前に設定したしきい値と比較する。このしきい値は、帳票かそれ以外かを判断するためのものである。不一位率がしきい値未満ならば、ステップS311へ、そうでなければS312へ進む。
ステップS311では、図2のCPU201は、ステップS308で格納された記入前帳票情報の画像が該当帳票であるという認識結果を出力する。この際に、複数の候補に対する不一致率を比較して、、クライアント端末7001で、その結果(複数の候補に対する不一致率)を表示できるように制御させる。
更にここでは、ステップS308で格納された記入前帳票情報の画像が該当帳票であるので、ステップS309で選択された二値化した記入前データと、二値化した記入後データとの差分から得られる情報(手書きの学籍番号、手書きの氏名、手書きの得点等)を取得してもよい(取得手段)。
ステップS312では、図2のCPU201は、ステップS302で読み込んだ識別対象帳票情報の画像は、ファイルサーバ5001に登録されている記入前帳票情報のいずれとも一致しなかったとして、「OTHER(未登録)」という認識結果を返して、クライアント端末7001で「OTHER(未登録)」という認識結果を表示させるように制御させる。
ステップS313では、記入後データに未処理のページがあるか否かを判断する。未処理のページがあると判断した場合には、S3011に戻って、以降の処理を繰り返す。未処理のページがないと判断した場合には、処理を終了する。
このように、記入後データが連続ページ(表紙、本文等)である場合には、ページ毎に読み取った記入後データのデータ箇所と記入形式の整合性が良い記入前データを、判定手段の記入形式の整合性の判定結果に従って、記入形式が異なる複数種類の記入前データの中からページ単位で選択することになる。
図4のフローチャートは、OCR装置1001のCPU201が所定の制御プログラムを読み出して実行する処理であり、2つの画像を一方へ画素単位でフィッティングする処理を示すフローチャートである
ステップS401では、図2のCPU201は、ステップS302で抽出した識別対象帳票情報中の識別対象帳票画像501を抽出し、特徴点群602を抽出する。なお、特徴点群602は、識別対象帳票画像501の一部であり、画像全体から特徴点が抽出されている。 特徴点は画像中の線分の端点、交点、輝度や色の境界になる線上の点が望ましい。こうした条件に合致する点を抽出するための手法として、KAZE、ORB(Oriented-BRIEF)、SIFT (Scale-invariant feature transform)などが知られている。 特徴点同士の対応がとれることを目的としているので、特徴点の質は識別に有用な質である必要はない。
ステップS402では、図2のCPU201は、ステップS401と同様にして、記入前帳票画像401から、特徴点群601を抽出する。
ステップS403では、図2のCPU201は、特徴点群601と特徴点群602間で、記入前後の帳票の同一個所から検出されたと推定される特徴点の対応付けを行う。特徴点の対応付けのアルゴリズムとしては、KNN(K-Nearest Neighbor algorithm)、Blute-Force、FLANN(Fast Library for Approximate Nearest Neighbors)などが知られている。
つまりここで、読み取った記入前データと記入後データのデータ箇所に共通して存在する特徴点同士の位置を、読み取った記入前データと記入後データ間で対応付けしていることになる(対応付け手段)。
図10は、ステップ403における特徴点の対応付け処理の一例を示す図である。識別対象帳票画像501上の手書き文字から検出された特徴点は、記入前帳票画像401からは検出されないのでここで対応付けから除外され、帳票にもともと存在する罫線、見出しに対応する特徴点対応情報603が得られる。
ステップS404では、図2のCPU201は、対応する特徴点同士の座標から、識別対象帳票画像501を記入前帳票画像401と重なるように変形するための変換行列を算出する。変換行列を算出するための手法としては、RANSACやLeast Medianなどが知られている。
ステップS405では、識別対象帳票画像501に変換行列Tをかけて変形を行う。ここで行う変形は画像全体に対して単一の変換行列をかけるものである。この変形により、サイズの違いや、ズレ、スキャン時に発生した大きな傾きや、天地を逆にスキャンした場合でも補正できるというメリットがある。ここで得られる画像を変形後識別対象帳票画像502とする。
つまりここで、ステップS403で対応付けした特徴点同士の位置を読み取った記入前データに合わせるように、読み取った記入後データの特徴点の位置を変形させていることになる(変形手段)。
数式1は変形後識別対象帳票画像502上の任意の点(x,y)と変形前の識別対象帳票画像501上の対応する点(x’,y’)との関係を表す式である。
数式2は変形後識別対象帳票画像502上の任意の点(x,y)における色C2(x,y)を表す式である。C2(x,y)は変形前の識別対象帳票画像501上の点(x’,y’)におけるC1(x’,y’)となる。
図5のフローチャートは、OCR装置1001のCPU201が所定の制御プログラムを読み出して実行する処理であり、識別対象画像に対して、オリジナルの帳票との不一致率を算出する処理を示すフローチャートである。
ステップS501では、図2のCPU201は、記入前帳票画像401と変形後識別対象帳票画像502に対し、二値化処理をかけ、二値化記入前帳票画像701と二値化変形後識別対象帳票画像702を生成する。
つまりここで、ステップS405で変形させた後に、読み取った記入前データ及び記入後データにおいて、データのある箇所を示す階調と、データの無い箇所を示す階調に二値化させていることになる(二値化手段)。
ステップS502では、図2のCPU201は、二値化記入前帳票画像701と二値化変形後識別対象帳票画像702に対し、画素同士の論理積(AND)をとったAND画像703を生成する。AND画像は、二値化変形後識別対象帳票画像702が二値化記入前帳票画像701と情報を多く含んでいるほど、二値化記入前帳票画像701とAND画像703は近いものになる。逆に、違う二値化フォーム画像711と二値化変形後識別対象帳票画像702でANDを取ると、二値化フォーム画像711と異なるAND画像712ができる。
ステップS503では、図2のCPU201は、二値化記入前帳票画像701とAND画像703に対し、画素同士の排他的論理和(XOR)をとったXOR画像704を生成する。XOR演算では2枚の画像間で違う画素であるとき不一致画素(この例では黒画素)とする。よって、不一致画素が少ないほど、二値化記入前帳票画像701に近いとみなせる。異なるAND画像712とXORを取って生成すると、不一致画素が多く残る。
ステップS504では、図2のCPU201は、二値化記入前帳票画像701内の全ての前景画素(この例では黒画素)の量を集計し、メモリに格納する。
ステップS505では、図2のCPU201は、ステップS503で得られたXOR画像704内の全ての不一致画素(この例では黒画素)の量を集計し、メモリに格納する。
ステップS506では、図2のCPU201は、ステップS504で得られた二値化記入前帳票画像701内の全ての前景画素の量とステップS505で得られたXOR画像704内の全ての不一致画素の量を用いて数式3により、不一致率を求める。今回の例では、前者で後者を割ることで、どのくらいの誤差画素が論理演算結果として残存しているかの比率を出すこととした。
つまりここで、ステップS501で二値化した記入前データ及び二値化した記入後データの重複度(不一致率)に従って、読み取った記入前データ及び記入後データとの記入形式の整合性を判定していることになる(判定手段)。
本実施例では、下記の5点が可能になる
1. 各学生でページ数が違い、かつ、表紙と本文が混在した用紙の束を入力することが出来ること
2. 記入例帳票画像を用意する必要がないこと
3. 識別対象帳票画像のスキャン時の傾き、ズレ、サイズの違いがあってもよいこと。
4. 識別に必要な特徴が正確に抽出できなくてもよいこと
5. 複数のレイアウトでの不一致率の比較表示やエラー時の警告をすること
1001 OCR装置本体(情報処理装置)
3001 スキャナ本体(画像読取装置)
4001 ネットワーク経路
5001 ファイルサーバ(読取画像管理装置)
6001 サーバ(OCR結果管理装置)
7001 クライアント端末



Claims (5)

  1. 記入前データおよび記入後データからそれぞれ読み取られたデータ箇所に共通して存在する特徴点同士の位置を合わせるべく前記記入後データを変形させ、さらに前記記入後データをデータのある箇所とデータのない箇所とに二値化した比較用記入後データに変換し、前記記入前データを同様に二値化した比較用記入前データに変換する変換手段と、
    前記比較用記入後データ前記比較用記入前データとの対応する箇所どうしの論理積によるデータを生成する生成手段と、
    前記比較用記入前データと前記生成された論理積によるデータとの間で不一致となる箇所の量、および、前記比較用記入前データのデータのある箇所の量に基づいて、記入前データ及び記入後データとの記入形式の整合性を判定する判定手段と、
    を備えることを特徴とする情報処理装置。
  2. 記入形式が異なる複数種類の記入前データを記憶する記憶手段と、
    前記記入形式が異なる複数種類の記入前データと記入後データとで前記判定される記入形式の整合性に基づいて、前記記入後データと前記記入形式が異なる複数種類の記入前データの中で記入形式が合う記入前データを選択する選択手段と、
    を更に備えることを特徴とする請求項1に記載の情報処理装置。
  3. 前記判定手段は、前記比較用記入前データのデータのある箇所の量に対する前記不一致となる箇所の量の比率で、記入前データ及び記入後データとの記入形式の整合性を判定することを特徴とする請求項1または2に記載の情報処理装置。
  4. 情報処理装置の制御方法であって、
    前記情報処理装置の変換手段が、記入前データおよび記入後データからそれぞれ読み取られたデータ箇所に共通して存在する特徴点同士の位置を合わせるべく前記記入後データを変形させ、さらに前記記入後データをデータのある箇所とデータのない箇所とに二値化した比較用記入後データに変換し、前記記入前データを同様に二値化した比較用記入前データに変換する変換工程と、
    前記情報処理装置の生成手段が、前記比較用記入後データ前記比較用記入前データとの対応する箇所どうしの論理積によるデータを生成する生成工程と、
    前記情報処理装置の判定手段が、前記比較用記入前データと前記生成された論理積によるデータとの間で不一致となる箇所の量、および、前記比較用記入前データのデータのある箇所の量に基づいて、記入前データ及び記入後データとの記入形式の整合性を判定する判定工程と、
    を含むことを特徴とする制御方法。
  5. 情報処理装置で読み取り実行可能なプログラムであって、
    前記情報処理装置を、
    記入前データおよび記入後データからそれぞれ読み取られたデータ箇所に共通して存在する特徴点同士の位置を合わせるべく前記記入後データを変形させ、さらに前記記入後データをデータのある箇所とデータのない箇所とに二値化した比較用記入後データに変換し、前記記入前データを同様に二値化した比較用記入前データに変換する変換手段と、
    前記比較用記入後データ前記比較用記入前データとの対応する箇所どうしの論理積によるデータを生成する生成手段と、
    前記比較用記入前データと前記生成された論理積によるデータとの間で不一致となる箇所の量、および、前記比較用記入前データのデータのある箇所の量に基づいて、記入前データ及び記入後データとの記入形式の整合性を判定する判定手段と、
    して機能させるためのプログラム。
JP2017230519A 2017-11-30 2017-11-30 情報処理装置、その制御方法とプログラム Active JP7181445B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017230519A JP7181445B2 (ja) 2017-11-30 2017-11-30 情報処理装置、その制御方法とプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017230519A JP7181445B2 (ja) 2017-11-30 2017-11-30 情報処理装置、その制御方法とプログラム

Publications (2)

Publication Number Publication Date
JP2019101647A JP2019101647A (ja) 2019-06-24
JP7181445B2 true JP7181445B2 (ja) 2022-12-01

Family

ID=66976966

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017230519A Active JP7181445B2 (ja) 2017-11-30 2017-11-30 情報処理装置、その制御方法とプログラム

Country Status (1)

Country Link
JP (1) JP7181445B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7428039B2 (ja) 2020-03-25 2024-02-06 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000057266A (ja) 1998-08-07 2000-02-25 Ricoh Co Ltd 帳票識別装置、帳票識別方法及び帳票識別プログラムを記録した媒体
JP2004280654A (ja) 2003-03-18 2004-10-07 Ricoh Co Ltd 画像処理装置、記録媒体、プログラム並びに画像処理方法
JP2008098876A (ja) 2006-10-11 2008-04-24 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2012198684A (ja) 2011-03-18 2012-10-18 Pfu Ltd 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム
JP2013196611A (ja) 2012-03-22 2013-09-30 Fuji Xerox Co Ltd 帳票判別装置及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000057266A (ja) 1998-08-07 2000-02-25 Ricoh Co Ltd 帳票識別装置、帳票識別方法及び帳票識別プログラムを記録した媒体
JP2004280654A (ja) 2003-03-18 2004-10-07 Ricoh Co Ltd 画像処理装置、記録媒体、プログラム並びに画像処理方法
JP2008098876A (ja) 2006-10-11 2008-04-24 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2012198684A (ja) 2011-03-18 2012-10-18 Pfu Ltd 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム
JP2013196611A (ja) 2012-03-22 2013-09-30 Fuji Xerox Co Ltd 帳票判別装置及びプログラム
JP5862396B2 (ja) 2012-03-22 2016-02-16 富士ゼロックス株式会社 帳票判別装置及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
長谷川 史裕 外2名,アフィン変換の係数を用いた定型帳票内の文字抽出,電子情報通信学会技術研究報告,日本,1997年12月19日,Vol.97,No.459,pp.7-14

Also Published As

Publication number Publication date
JP2019101647A (ja) 2019-06-24

Similar Documents

Publication Publication Date Title
CN102117269B (zh) 对文档进行数字化的装置及方法
US7609914B2 (en) Image processing apparatus and its method
US8675260B2 (en) Image processing method and apparatus, and document management server, performing character recognition on a difference image
US20060210162A1 (en) Image processing apparatus and its method
US7969631B2 (en) Image processing apparatus, image processing method and computer readable medium storing image processing program
KR20190033451A (ko) 화상 처리 장치, 화상 처리 방법, 및 저장 매체
US10142499B2 (en) Document distribution system, document distribution apparatus, information processing method, and storage medium
JP2014225932A (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法
US20190379795A1 (en) Image processing device, image processing method, image processing program, and recording medium storing program
JP4232679B2 (ja) 画像形成装置およびプログラム
JP5094682B2 (ja) 画像処理装置、画像処理方法およびプログラム
US10834281B2 (en) Document size detecting by matching between image of entire document and read size image
JP7181445B2 (ja) 情報処理装置、その制御方法とプログラム
JP3733310B2 (ja) 文書書式識別装置および識別方法
JP4143655B2 (ja) 画像処理装置、画像処理方法、プログラム、記憶媒体、システム
JP2002109521A (ja) 文書処理装置及び方法
JP4706764B2 (ja) 画像処理装置及び画像処理プログラム
JP6989790B2 (ja) 情報処理システム、その制御方法、及びプログラム
JP2002024838A (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JP2005149323A (ja) 画像処理システム及び画像処理装置並びに画像処理方法
JP2017199288A (ja) 画像処理装置、画像処理方法及びプログラム
JP6947971B2 (ja) 情報処理装置、制御方法、プログラム
JP4070486B2 (ja) 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
US20230273952A1 (en) Image processing apparatus, image processing method, and storage medium

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180703

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20181031

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190115

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221018

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221031

R151 Written notification of patent or utility model registration

Ref document number: 7181445

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151