JP2018185702A - 情報処理装置、その制御方法とプログラム - Google Patents

情報処理装置、その制御方法とプログラム Download PDF

Info

Publication number
JP2018185702A
JP2018185702A JP2017087867A JP2017087867A JP2018185702A JP 2018185702 A JP2018185702 A JP 2018185702A JP 2017087867 A JP2017087867 A JP 2017087867A JP 2017087867 A JP2017087867 A JP 2017087867A JP 2018185702 A JP2018185702 A JP 2018185702A
Authority
JP
Japan
Prior art keywords
data
image
reference data
feature points
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017087867A
Other languages
English (en)
Inventor
唯仁 八尾
Tadahito Yao
唯仁 八尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Original Assignee
Canon Marketing Japan Inc
Canon IT Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon IT Solutions Inc filed Critical Canon Marketing Japan Inc
Priority to JP2017087867A priority Critical patent/JP2018185702A/ja
Publication of JP2018185702A publication Critical patent/JP2018185702A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

【課題】逆向きスキャンに対応しつつ、細かいフィッティングを行うこと。【解決手段】内容に差がある基準データ及び比較データとの差分から得られる情報を取得する情報処理装置が、読み取った当該基準データと比較データ間のデータ箇所に共通して存在する特徴点同士の位置を、読み取った基準データと比較データ間の画像全体で対応付けし、画像全体で対応付けした特徴点同士の位置を読み取った基準データに合わせるように、読み取った比較データの特徴点の位置を変形させ、読み取った基準データのデータ箇所と、変形させた比較データのデータ箇所に共通して存在する複数の特徴点を所定の形状に分割させ、読み取った基準データと変形させた比較データ間のデータ箇所に共通して存在する特徴点同士の位置を、分割した形状単位で対応付けし、対応付けした特徴点同士の位置を読み取った基準データに合わせるように、変形させた比較データの特徴点の位置を変形させる。【選択図】図4

Description

本発明は、画像データ間の歪みやムラを適切に変形する技術に関する。
帳票に手書きで記入した文字をOCR(光学文字認識)で認識して業務に利用するシステムは古くから存在しているが、帳票上の手書き文字を認識するには、記入後の帳票から、元の帳票と手書きの部分をどのように分離するかという課題がある。元の帳票に存在する罫線や見出しは後から手書きをした文字を認識する際には障害となる。
特許文献1の画像処理装置には、歪補正部と差分抽出部によって2つの画像データ間の歪を補正後、1の画像データと歪を補正した2の画像データとを比較して、その差分データを抽出し、解答者情報欄の記入内容を抽出する技術が開示されている。
非特許文献1には、画像中の特徴点を抽出し、画像の差分を取るための位置基準を決定するし、その基準に基づいて画像を変形させて合わせ込む方法について記載されている。
特開2008−20506号公報
「イメージ差分抽出技術」富士ゼロックス テクニカルレポート No.20 2011
しかしながら、先行技術では、画像全体に対してアフィン変換をかけており、画像中の局所的な歪みやムラの変形にはうまく対応ができない。
局所的な歪みやムラの変形にうまく対応するには、画像全体に対するアフィン変換でなく、特徴点単位で画像を変形させて合わせ込む方法で細かいフィッティングを行えばよいが、特徴点が取れない外周部分の特徴点単位で画像を変形させて合わせ込む場合、例えば、記入前のデータと記入後のデータの向きをそれぞれ逆向きにスキャンしてしまった場合に、画像を変形させる合わせ込みに対応できないといった問題が発生してしまう。
本発明は、逆向きスキャンに対応しつつ、細かいフィッティングを行うことができる仕組みを提供することを目的とする。
本発明は、内容に差がある基準データ及び比較データとの差分から得られる情報を取得する情報処理装置であって、当該基準データ及び比較データにおけるデータ箇所を読み取る読取手段と、前記読み取った基準データと比較データ間のデータ箇所に共通して存在する特徴点同士の位置を、前記読み取った基準データと比較データ間の画像全体で対応付けする全体対応付け手段と前記画像全体で対応付けした特徴点同士の位置を前記読み取った基準データに合わせるように、前記読み取った比較データの特徴点の位置を変形させる全体変形手段と、前記読み取った基準データのデータ箇所と、前記変形させた比較データのデータ箇所に共通して存在する複数の特徴点を所定の形状に分割させて、前記画像全体を形状単位に分割する画像分割手段と、前記読み取った基準データと前記変形させた比較データ間のデータ箇所に共通して存在する特徴点同士の位置を、前記分割した形状単位で対応付けする部分対応付け手段と、前記分割した形状単位で対応付けした特徴点同士の位置を前記読み取った基準データに合わせるように、前記変形させた比較データの特徴点の位置を変形させる部分変形手段と、を備えることを特徴とする。
本発明は、内容に差がある基準データ及び比較データとの差分から得られる情報を取得する情報処理装置の制御方法であって、前記情報処理装置の読取手段が、当該基準データ及び比較データにおけるデータ箇所を読み取る読取工程と、前記情報処理装置の全体対応付け手段が、前記読み取った基準データと比較データ間のデータ箇所に共通して存在する特徴点同士の位置を、前記読み取った基準データと比較データ間の画像全体で対応付けする全体対応付け工程と、前記情報処理装置の全体変形手段が、前記画像全体で対応付けした特徴点同士の位置を前記読み取った基準データに合わせるように、前記読み取った比較データの特徴点の位置を変形させる全体変形工程と、前記情報処理装置の画像分割手段が、前記読み取った基準データのデータ箇所と、前記変形させた比較データのデータ箇所に共通して存在する複数の特徴点を所定の形状に分割させて、前記画像全体を形状単位に分割する画像分割工程と、前記情報処理装置の部分対応付け手段が、前記読み取った基準データと前記変形させた比較データ間のデータ箇所に共通して存在する特徴点同士の位置を、前記分割した形状単位で対応付けする部分対応付け工程と、前記情報処理装置の部分変形手段が、前記分割した形状単位で対応付けした特徴点同士の位置を前記読み取った基準データに合わせるように、前記変形させた比較データの特徴点の位置を変形させる部分変形工程と、を含むことを特徴とする。
本発明は、内容に差がある基準データ及び比較データとの差分から得られる情報を取得する情報処理装置で読み取り実行可能なプログラムであって、前記情報処理装置を、当該基準データ及び比較データにおけるデータ箇所を読み取る読取手段と、前記読み取った基準データと比較データ間のデータ箇所に共通して存在する特徴点同士の位置を、前記読み取った基準データと比較データ間の画像全体で対応付けする全体対応付け手段と、前記画像全体で対応付けした特徴点同士の位置を前記読み取った基準データに合わせるように、前記読み取った比較データの特徴点の位置を変形させる全体変形手段と、前記読み取った基準データのデータ箇所と、前記変形させた比較データのデータ箇所に共通して存在する複数の特徴点を所定の形状に分割させて、前記画像全体を形状単位に分割する画像分割手段と、前記読み取った基準データと前記変形させた比較データ間のデータ箇所に共通して存在する特徴点同士の位置を、前記分割した形状単位で対応付けする部分対応付け手段と、前記分割した形状単位で対応付けした特徴点同士の位置を前記読み取った基準データに合わせるように、前記変形させた比較データの特徴点の位置を変形させる部分変形手段と、して機能させることを特徴とする。
本発明により、逆向きスキャンに対応しつつ、細かいフィッティングを行うことができる仕組みを提供することが可能となる。
本発明の実施形態における、手書き文字抽出システム構成の一例を示す図である。 本発明の実施形態における、OCR装置のハードウェア構成の一例を示すブロック図である。 本発明の実施形態における、OCR装置内部の機能構成の一例を示すブロック図である。 本発明の実施形態における、画像をフィッティングする処理の一例を示すフローチャートである。 本発明の実施形態における、画像をフィッティングする処理の概要を示す図である。 本発明の実施形態における、帳票データベースの一例を示す図である。 本発明の実施形態における、概略変形のための特徴点の対応付け処理の一例を表す図である。 本発明の実施形態における、詳細変形のための特徴点の対応付け処理および記入個所推定処理の一例を示す図である。 本発明の実施形態における、詳細変形処理一例を示す図である。 本発明の実施形態における、手書き入力箇所推定のための、対応付けがされない特徴点領域の抽出の一例を示す図である。 本発明の実施形態における、概略変形前、概略変形後の画素の位置関係を示す式である。
図1を説明する。
図1は、本発明の実施形態における手書き文字抽出システムのシステム構成の一例を示す図である。
手書き文字抽出の主要な処理を行うためのOCR装置(情報処理装置)101および、帳票をスキャンして画像ファイル化(画像スキャン)するスキャナ301が通信経路401を介して接続される構成となっている。
通信経路401はスキャナ301の有する物理インターフェースに応じて、有線LAN,無線LAN,USBなどの形態をとることができる。
通信経路401上にはファイルサーバー501を置いてもよい。スキャナ301でスキャンした画像をOCR装置101に取り込む方法として、スキャナ301からOCR装置101に直接画像を送信する方法、スキャナ301で取り込んだ画像ファイルをいったんファイルサーバー501に保管し、OCR装置101がファイルサーバー501から画像ファイルを取り出す方法どちらをとっても良い。
図2を説明する。
図2は、本発明の実施形態におけるOCR装置101のハードウェア構成の一例を示すブロック図である。ファイルサーバー501も同様の構成となる。
CPU1は、システムバス4に接続される各デバイスやコントローラを統括的に制御する。また、ROM2あるいは外部メモリ11には、CPU1の制御プログラムであるBIOS(Basic Input / Output System)やオペレーティングシステムプログラム(以下、OS)や、各サーバ或いは各OCR装置の実行する機能を実現するために必要な後述する各種プログラム等が記憶されている。
RAM3は、CPU1の主メモリ、ワークエリア等として機能する。CPU1は、処理の実行に際して必要なプログラム等をROM2あるいは外部メモリ11からRAM3にロードして、該ロードしたプログラムを実行することで各種動作を実現するものである。
また、5は入力コントローラで、キーボード(KB)9やカメラデバイス12(撮像装置)、不図示のマウス等のポインティングデバイス等からの入力を制御する。206はビデオコントローラで、CRTディスプレイ(CRT)10等の表示器への表示を制御する。なお、CRT10と記載しているが、表示器はCRTだけでなく、液晶ディスプレイ等の他の表示器であってもよい。これらは必要に応じて管理者が使用するものである。
メモリコントローラ7は、ブートプログラム,各種のアプリケーション,フォントデータ,ユーザファイル,編集ファイル,各種データ等を記憶する外部記憶装置(ハードディスク(HD))や、フレキシブルディスク(FD)、或いはOCR装置MCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ11へのアクセスを制御する。
通信I/Fコントローラ8は、ネットワーク(例えば、図に示したLAN)を介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信等が可能である。
なお、CPU1は、例えばRAM3内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、CRT10上での表示を可能としている。また、CPU1は、CRT10上の不図示のマウスカーソル等でユーザによる指示を可能とする。
本発明を実現するための後述する各種プログラムは、外部メモリ11に記録されており、必要に応じてRAM3にロードされることによりCPU1によって実行されるものである。さらに、上記プログラムの実行時に用いられる定義ファイル及び各種情報テーブル等も、外部メモリ11に格納されており、これらについての詳細な説明も後述する。
また、本発明における実行可能なプログラムは、図3乃至図4の処理をコンピュータに実行させるプログラムである。なお、本発明におけるプログラムは、図3乃至図4の各処理ごとのプログラムであってもよい。
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読み出し、実行することによっても本発明の目的が達成されることは言うまでもない。
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記録した記録媒体は本発明を構成することになる。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク等を用いることが出来る。
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
また、本発明は、複数の機器から構成されるシステムに適用しても、ひとつの機器から成る装置に適用しても良い。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。
図3を説明する。
OCR装置101の機能ブロックを示したものである。
入力受付部251は、帳票ID及びドキュメントスキャナや画像形成装置にて読み取られ、OCR装置101に送信された記入後帳票画像を受け付ける機能を有している。
特徴点検出部252は、受け付けた記入後帳票画像と、受け付けた帳票IDに対応する記入前帳票画像から、特徴点群701、特徴点群702を検出し、特徴点対応情報703を作成する機能を有している。
変換行列算出部253は、特徴点群701と特徴点群702との特徴点同士の座標が、ぴったり重なるように、記入後帳票画像1001の画像全体を変形するための変換行列Tを算出する機能を有している。
変換行列算出部253は、特徴点群901と特徴点群902との特徴点同士の座標が、ぴったり重なるように、記入後帳票画像1002の三角領域だけを独立して変形するための変換行列Tnを算出する機能を有している。
画像概略変形部254は、記入後帳票画像1001に変換行列算出部253が算出した変換行列Tをかけて、記入後帳票画像1001の画像全体の変形を実行する機能を有している。
画像分割部255は、特徴点群801を基に概略変形後の記入後帳票画像1002に三角形分割を行う機能を有している。
画像詳細変形部256は、記入後帳票画像1002に変換行列算出部253が算出した変換行列Tnをかけて、記入後帳票画像1002の三角領域だけを独立した変形を実行する機能を有している。
記入箇所推定部257は、特定した特徴点の位置に従って、記入前帳票画像1101と概略変形後の記入後帳票画像1002間のデータ箇所で、差分となる箇所を推定する機能を有している。
図4を説明する。
次に図4のフローチャートを用いて、本発明の実施形態におけるOCR装置101が実行する画像フィッティング処理について説明する。
図4のフローチャートは、OCR装置101上のCPU201が所定の制御プログラムを読み出して実行する処理であり、記入後帳票画像(基準となる画像データAと内容の差を比較する画像データB)を記入前帳票画像(基準となる画像データA)にフィッティングする処理を示すフローチャートである。尚、記入後帳票画像(基準となる画像データAと内容の差を比較する画像データB)は、スキャナで読み取られる画像データである。
このように、記入後帳票画像(基準となる画像データAと内容の差を比較する画像データB)と記入前帳票画像(基準となる画像データA)との間でフィッティングしている。
CPU201上に読み込まれた制御プログラムは図3に示す機能ブロックに分割されており、ここではその機能ブロックに照らし合わせて説明する。
図5を説明する。
図5は本発明の画像フィッティング処理の入力および出力を簡易的に示した図である。記入後帳票画像1001を、OCR装置101が帳票データベース260に保管している記入前帳票画像1101を、帳票管理部258を通して取得し、後述の処理を通じて概略変形画像1002、詳細変形画像1003として出力する。この際、検出された特徴点から推定記入領域806,807を得る。
ステップS401では、入力受付部251が、ユーザから手書き文字抽出の要求を受け付ける。この要求には、スキャナ等でスキャンされた手書き文字を抽出する対象の記入後帳票画像1001(例えば、学籍番号、得点等が記入された後の講義レポートの画像データ)及び対象帳票の種類を識別可能な帳票ID(例えば、講義レポートを特定可能)のセットが電文として含まれている。記入後帳票画像1001はスキャナ301から直接取得してOCR装置101上のRAM203を介して送信してもよいし、ファイルサーバー501を経由してファイルの形で送信してもよい。
受信した記入後帳票画像1001は、OCR装置101のRAM203に記憶される。
さらに、RAM203に記憶された記入後帳票画像1001の中で、記入後データ(比較データである。)のデータ箇所(罫線や記入枠や項目名、手書きの学籍番号、手書きの氏名、手書きの得点等)を読み取る(読取手段)。例えば図5に示したような概略変形前の状態である。
ステップS402では、帳票管理部258が、ステップS401で受け付けた要求に含まれる帳票IDに基づき、帳票IDをキーに、帳票データベース260(図6)から帳票IDに対応する記入前帳票画像1101を引き出す。引き出した記入前帳票画像はOCR装置101のRAM203に記憶される。
さらに、RAM203に記憶された記入前帳票画像1101の中で、記入前データ(基準データである。)のデータ箇所(罫線や記入枠や項目名等)を読み取る(読取手段)。例えば図5の1101に示したような照合前の状態である。
図6を説明する。
図6は本発明における帳票データベース260の一例である。帳票の種類を識別可能な帳票IDと一意に対応づけて、各記入前帳票画像が画像ファイルの形式で帳票データベース260にそれぞれ格納されており、S401で要求された帳票IDに基づいてレコード601〜から記入前帳票画像1101を取得する。
ステップS403では、特徴点検出部252が、記入後帳票画像1001から、特徴点群701を抽出する。特徴点は画像中の線分の端点、交点、輝度や色の境界になる線上の点が望ましい。こうした条件に合致する点を抽出するための手法として、KAZE、ORB(Oriented−BRIEF)、SIFT (Scale−invariant feature transform)などが知られている。
ステップS404では、ステップS403と同様にして、記入前帳票画像1101から、特徴点群702を抽出する。
ステップS405では、特徴点検出部252が、特徴点群701と特徴点群702間で、記入前後の帳票の同一個所から検出されたと推定される特徴点の対応付けを行う(全体対応付け手段)。特徴点の対応付けのアルゴリズムとしては、KNN(K−Nearest Neighbor algorithm)、Blute−Force、FLANN(Fast Library for Approximate Nearest Neighbors)などが知られている。
つまり、ここでステップS401とステップS402でそれぞれ読み取った記入前帳票画像1101と記入後帳票画像1001間のデータ箇所に共通して存在する特徴点同士の位置を、記入前帳票画像1101と記入後帳票画像1001間の画像全体で図7のように対応付けすることになる。
図7を説明する。
図7は、ステップS405における特徴点の対応付け処理の一例を示す図である。記入後帳票画像1001上の手書き文字から検出された特徴点は、記入前帳票画像1101からは検出されないのでここで対応付けから除外され、帳票にもともと存在する罫線、見出しに対応する特徴点対応情報703が得られる。
ここで特徴点対応情報703は、記入後帳票画像1001上のある特徴点と、記入前帳票画像1101上のある特徴点を紐づけたものである。
つまり、図7のように、記入後帳票画像1001の特徴点群702と記入前帳票画像1101の特徴点群703間で、同じ特徴量を持つ特徴点対応情報703群がマッピングテーブルとして管理されている。
ステップS406では、変換行列算出部253が、対応する特徴点同士の座標から、記入後帳票画像1001と記入前帳票画像1101との特徴点同士の座標が、ぴったり重なるように、記入後帳票画像1001の画像全体を変形するための変換行列Tを算出する。変換行列を算出するための手法としては、RANSACやLeast Medianなどが知られている。
ステップS407では、画像概略変形部254が、記入後帳票画像1001に変換行列Tをかけて概略変形を行う(全体変形手段)。ここで行う概略変形は画像全体に対して単一の変換行列をかけるものであり、ここでは概略変形と呼ぶ。この概略変形により、スキャン時に発生した大きな傾きや、記入前のデータと記入後のデータの向きをそれぞれ逆向きにスキャンしてしまった場合でも対応できるというメリットがある。
ステップS407で得られる画像を概略変形後画像1002とする。
つまり、ステップS405で、画像全体で対応付けした特徴点同士の位置を、画像全体で記入前帳票画像1101に合わせるように、記入後帳票画像1001の特徴点の位置を、画像全体で変形させることになる。
ここで得られる画像を変形後の記入後帳票画像1002とする。例えば図5の1002に示したような詳細変形前の状態である。
数式1は概略変形後の記入後帳票画像1002上の任意の点(x,y)と、変形前の記入後帳票画像1001上の対応する点(x’,y’)との関係を表す式であり、画像概略変形部254による変形後の記入後帳票画像1002上の任意の座標を(x,y)を示したものである。
更に、数式2は概略変形後の記入後帳票1002上の任意の点(x,y)における色C2(x,y)を表す式である。C2(x,y)は概略変形前の記入後帳票1001上の点(x’,y’)における色C1(x’,y’)と同じである。
ステップS408では、特徴点検出部252が、概略変形後の記入後帳票画像1002から、特徴点群801を再度抽出する。
ステップS409では、特徴点検出部252が、ステップS405と同様に、特徴点群801と特徴点群702間で、記入前後の帳票の同一個所から検出されたと推定される特徴点の対応付けを行う。
ここでの記入前後の帳票の同一個所から検出されたと推定される特徴点の対応付けの結果から、記入前帳票画像1101と概略変形後の記入後帳票画像1002間のデータ箇所で、記入前帳票画像1101には無く概略変形後の記入後帳票画像1002に存在する特徴点の位置を特定する(特徴点特定手段)。
ここで特徴点対応情報802が得られ、このとき対応付けから漏れた特徴点群803は、後述の手書き入力推定処理で利用される。
図8を説明する。
図8は、ステップS409における特徴点対応付け処理の一例を示す図である。特徴点群803中には、手書き文字から抽出された特徴点群804,805が含まれる。
ステップS410では、画像詳細変形部256が、特徴点群801を基に概略変形後の記入後帳票画像1002に三角形分割を行う(画像分割手段)。
つまり、図9のように、記入前帳票画像1101のデータ箇所と、概略変形させた記入後帳票画像1002のデータ箇所に共通して存在する複数の特徴点を所定の形状(例えば三角形)に分割させて、画像全体を形状単位(全て三角領域)に分割する。
図9を説明する。
図9は、ステップS410の処理の一例を示す図である。ここでは、概略変形後の記入後画像にまだ局所的な歪みが残っているケースを考える。
概略変形後の記入後帳票画像1002を特徴点群801の各点を頂点とする三角領域に分割する。図形を三角形に分化する手法としてはドロネー三角形分割法が知られている。ここで、局所的に歪みが発生している三角領域901があるとする。ここでは、特徴点対応情報802に含まれる特徴点の記入前帳票画像1101上の各点を、特徴点群801と各三角形が対応するように分割する。ここで三角領域901に対応する三角領域902とする。
記入前帳票画像1101と概略変形させた記入後画像1002間のデータ箇所に共通して存在する特徴点同士(901と902)の位置を、分割した三角形単位で独立して対応付けしている(部分対応付け手段)。
次に、三角形分割をしたそれぞれの三角領域に対して詳細変形を行う(部分変形手段)。この画像の内の一部の領域ごとに行う変形をここでは詳細変形と呼ぶ。この処理で得られる画像を詳細変形後の記入後画像1003とする。
画像詳細変形部256が、三角領域に分割して対応付けをした特徴点同士の位置を、三角領域に分割して対応付けをした特徴点同士で記入前帳票画像1101に合わせるように、概略変形させた記入後画像1002の特徴点の位置を独立して変形(アフィン変換)させることになる。
つまり、三角領域901の3つの頂点から、三角領域901内の任意の点を三角領域902に合わせ込むためのアフィン変換行列Tnを求める。Tnの求め方は既知であるものとする。
同様に、概略変形後帳票画像1002内のすべての三角領域に対して、独立して変換行列Tnを求め、図9のように、それぞれ分割した三角領域で独立してアフィン変換を行う。
数式3は詳細変形後の記入後帳票画像1003上の任意の点(x,y)と、詳細変形前の記入後帳票画像1002上の対応する点(x’,y’)との関係を表す式であり、画像詳細変形部256による変形後の記入後帳票画像1003上の任意の座標を(x,y)を示したものである。
概略変形後の帳票1002から検出された対応点群901を三角形分割したうちの任意の点(x,y)を含む三角領域nに対して、前ステップで対応付けされた対応点群803上の対応する三角形に合わせ込むための変換行列をTnとする。
更に、数式4は詳細変形後の記入後帳票1003上の任意の点(x,y)における色Cn,2(x,y)を表す式である。Cn,2(x,y)は詳細変形前の記入後帳票1002上の点(x’,y’)における色Cn,1(x’,y’)と同じである。
ステップS411では、記入個所推定部258が、ステップS409で対応付けから除外された特徴点群803から、手書き文字が帳票に追記された場所を推定する(差分推定手段)。つまりステップS409で特定した特徴点の位置に従って、記入前帳票画像1101と概略変形後の記入後帳票画像1002間のデータ箇所で、差分となる箇所を推定することになる。
図10を説明する。
図10は、ステップS411における追記個所推定処理の一例である。この処理においては、対応付けから漏れた特徴点群803の中には、罫線や帳票に印刷された見出し、ノイズから検出される特徴点の中にも対応付けから漏れるものは存在するが、手書き文字から抽出された特徴点はそれらに比べて密に検出されるという仮定に基づいている。
記入個所推定部258は、特徴点群803内の特徴点をクラスタリングによって分類する。クラスタリングの手法としては、K−MEANS法が知られている。
前記のクラスタリングによって、一定以上の特徴点数、密度を示した領域を文字記入領域とみなし、後続のOCR処理においてヒント情報として利用する。
このように、本発明のOCR装置101は、内容に差がある基準データ及び比較データとの差分から得られる情報(文字、罫線、オブジェクト)を取得することができる。
ステップS411で推定した箇所を利用して、情報(文字、罫線、オブジェクト)を取得する位置を特定する(位置特定手段)ことができる。
更に、OCR装置101は、が、記入に差がある記入前データ及び記入後データとの差分から得られる情報も取得することもできる。
この場合、記入後データで読み取ったデータ箇所には、罫線、記入枠、項目名、手書きの文字を含んでおり、記入前データで読み取ったデータ箇所には、罫線、記入枠、項目名を含んでいるものとする。
この場合、差分から得られる手書きの文字の認識をする(文字認識手段)こともできる。
101 OCR装置本体
251 入力受付部
252 特徴点検出部
253 変換行列算出部
254 画像概略変形部
255 画像分割部
256 画像詳細変形部
258 帳票管理部
257 記入個所推定部
260 帳票データベース
301 スキャナ本体
401 ネットワーク経路
501 ファイルサーバー
701 概略変形前の記入後帳票から抽出された特徴点群
702 記入前帳票から抽出された特徴点群
703 特徴点群701と特徴点群702間の特徴点対応情報
801 概略変形後の記入後帳票から抽出された特徴点群
802 特徴点群801と特徴点群702間の特徴点対応情報
803 特徴点群801中において、対応情報802に含まれなかった特徴点群
804,805 特徴点群803から抽出された特徴点クラスタ
806,807 特徴点クラスタ804,805に基づいて推定された推定文字記入領域
901 三角形分割した特徴点群上の一つの三角領域
902 三角形分割した特徴点群上の一つの三角領域
1001 記入後帳票画像
1002 概略変形後記入後帳票画像
1003 詳細変形後記入後帳票画像
1101 記入前帳票画像

Claims (7)

  1. 内容に差がある基準データ及び比較データとの差分から得られる情報を取得する情報処理装置であって、
    当該基準データ及び比較データにおけるデータ箇所を読み取る読取手段と、
    前記読み取った基準データと比較データ間のデータ箇所に共通して存在する特徴点同士の位置を、前記読み取った基準データと比較データ間の画像全体で対応付けする全体対応付け手段と、
    前記画像全体で対応付けした特徴点同士の位置を前記読み取った基準データに合わせるように、前記読み取った比較データの特徴点の位置を変形させる全体変形手段と、
    前記読み取った基準データのデータ箇所と、前記変形させた比較データのデータ箇所に共通して存在する複数の特徴点を所定の形状に分割させて、前記画像全体を形状単位に分割する画像分割手段と、
    前記読み取った基準データと前記変形させた比較データ間のデータ箇所に共通して存在する特徴点同士の位置を、前記分割した形状単位で対応付けする部分対応付け手段と、
    前記分割した形状単位で対応付けした特徴点同士の位置を前記読み取った基準データに合わせるように、前記変形させた比較データの特徴点の位置を変形させる部分変形手段と、
    を備えることを特徴とする情報処理装置。
  2. 前記読み取った基準データと比較データ間のデータ箇所で、前記基準データには無く前記比較データに存在する特徴点の位置を特定する特徴点特定手段と、
    前記特定した特徴点の位置に従って、前記読み取った基準データと比較データ間のデータ箇所で、前記差分となる箇所を推定する差分推定手段と、
    前記推定した箇所を利用して、前記情報を取得する位置を特定する位置特定手段と、
    更に備えることを特徴とする請求項1に記載の情報処理装置。
  3. 前記比較データは、スキャナで読み取られる画像データであることを特徴とする請求項1または請求項2に記載の情報処理装置。
  4. 前記情報処理装置が、記入に差がある記入前データ及び記入後データとの差分から得られる情報を取得すること請求項1乃至請求項3の何れか1項に記載の情報処理装置。
  5. 前記記入後データで読み取ったデータ箇所には、罫線、記入枠、項目名、手書きの文字を含み、前記記入前データで読み取ったデータ箇所には、罫線、記入枠、項目名を含み、
    前記差分から得られる前記手書きの文字の認識をする文字認識手段を更に備えることを特徴とする請求項4に記載の情報処理装置。
  6. 内容に差がある基準データ及び比較データとの差分から得られる情報を取得する情報処理装置の制御方法であって、
    前記情報処理装置の読取手段が、当該基準データ及び比較データにおけるデータ箇所を読み取る読取工程と、
    前記情報処理装置の全体対応付け手段が、前記読み取った基準データと比較データ間のデータ箇所に共通して存在する特徴点同士の位置を、前記読み取った基準データと比較データ間の画像全体で対応付けする全体対応付け工程と、
    前記情報処理装置の全体変形手段が、前記画像全体で対応付けした特徴点同士の位置を前記読み取った基準データに合わせるように、前記読み取った比較データの特徴点の位置を変形させる全体変形工程と、
    前記情報処理装置の画像分割手段が、前記読み取った基準データのデータ箇所と、前記変形させた比較データのデータ箇所に共通して存在する複数の特徴点を所定の形状に分割させて、前記画像全体を形状単位に分割する画像分割工程と、
    前記情報処理装置の部分対応付け手段が、前記読み取った基準データと前記変形させた比較データ間のデータ箇所に共通して存在する特徴点同士の位置を、前記分割した形状単位で対応付けする部分対応付け工程と、
    前記情報処理装置の部分変形手段が、前記分割した形状単位で対応付けした特徴点同士の位置を前記読み取った基準データに合わせるように、前記変形させた比較データの特徴点の位置を変形させる部分変形工程と、
    を含むことを特徴とする制御方法。
  7. 内容に差がある基準データ及び比較データとの差分から得られる情報を取得する情報処理装置で読み取り実行可能なプログラムであって、
    前記情報処理装置を、
    当該基準データ及び比較データにおけるデータ箇所を読み取る読取手段と、
    前記読み取った基準データと比較データ間のデータ箇所に共通して存在する特徴点同士の位置を、前記読み取った基準データと比較データ間の画像全体で対応付けする全体対応付け手段と、
    前記画像全体で対応付けした特徴点同士の位置を前記読み取った基準データに合わせるように、前記読み取った比較データの特徴点の位置を変形させる全体変形手段と、
    前記読み取った基準データのデータ箇所と、前記変形させた比較データのデータ箇所に共通して存在する複数の特徴点を所定の形状に分割させて、前記画像全体を形状単位に分割する画像分割手段と、
    前記読み取った基準データと前記変形させた比較データ間のデータ箇所に共通して存在する特徴点同士の位置を、前記分割した形状単位で対応付けする部分対応付け手段と、
    前記分割した形状単位で対応付けした特徴点同士の位置を前記読み取った基準データに合わせるように、前記変形させた比較データの特徴点の位置を変形させる部分変形手段と、
    して機能させることを特徴とするプログラム。
JP2017087867A 2017-04-27 2017-04-27 情報処理装置、その制御方法とプログラム Pending JP2018185702A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017087867A JP2018185702A (ja) 2017-04-27 2017-04-27 情報処理装置、その制御方法とプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017087867A JP2018185702A (ja) 2017-04-27 2017-04-27 情報処理装置、その制御方法とプログラム

Publications (1)

Publication Number Publication Date
JP2018185702A true JP2018185702A (ja) 2018-11-22

Family

ID=64357315

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017087867A Pending JP2018185702A (ja) 2017-04-27 2017-04-27 情報処理装置、その制御方法とプログラム

Country Status (1)

Country Link
JP (1) JP2018185702A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0689342A (ja) * 1992-09-08 1994-03-29 Toshiba Corp 動画像処理装置
JP2005050384A (ja) * 2004-11-08 2005-02-24 Toshiba Corp 動画像処理装置
JP2007274597A (ja) * 2006-03-31 2007-10-18 Oki Electric Ind Co Ltd 帳票処理装置、帳票処理システム及び帳票画像補正方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0689342A (ja) * 1992-09-08 1994-03-29 Toshiba Corp 動画像処理装置
JP2005050384A (ja) * 2004-11-08 2005-02-24 Toshiba Corp 動画像処理装置
JP2007274597A (ja) * 2006-03-31 2007-10-18 Oki Electric Ind Co Ltd 帳票処理装置、帳票処理システム及び帳票画像補正方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
中居友弘,外2名: "特徴点の局所的配置に基づく位置合わせを用いた文書からの書き込み抽出法", 電子情報通信学会技術研究報告 VOL.106 NO.605, vol. 第106巻, JPN6020004873, 2007, JP, pages 61 - 66, ISSN: 0004305467 *

Similar Documents

Publication Publication Date Title
US8126206B2 (en) Image processing apparatus, image processing method, and program
JP5261501B2 (ja) 不変の視覚場面及び物体の認識
JP2001273091A (ja) 多重解像度画像解析による指示位置検出
JPWO2009060975A1 (ja) 特徴点配置照合装置及び画像照合装置、その方法及びプログラム
JP2014071850A (ja) 画像処理装置、端末装置、画像処理方法、およびプログラム
EP2808828A2 (en) Image matching method, image matching device, model template generation method, model template generation device, and program
CN108573471B (zh) 图像处理装置、图像处理方法以及记录介质
JP2019215647A (ja) 情報処理装置、その制御方法及びプログラム。
JP2016212784A (ja) 画像処理装置、画像処理方法
US10586099B2 (en) Information processing apparatus for tracking processing
JP5656768B2 (ja) 画像特徴量抽出装置およびそのプログラム
US10643095B2 (en) Information processing apparatus, program, and information processing method
US8891836B2 (en) Stripe pattern image analysis device, stripe pattern image analysis method, and program thereof
JP5094682B2 (ja) 画像処理装置、画像処理方法およびプログラム
US10872263B2 (en) Information processing apparatus, information processing method and storage medium
JP6171660B2 (ja) 情報処理装置、情報処理システム及びプログラム
JP2006113832A (ja) ステレオ画像処理装置およびプログラム
JP2017199288A (ja) 画像処理装置、画像処理方法及びプログラム
JP5147640B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2018185702A (ja) 情報処理装置、その制御方法とプログラム
JP7181445B2 (ja) 情報処理装置、その制御方法とプログラム
JP2015060421A (ja) 類似画像検索方法及び類似画像検索装置
JP5636966B2 (ja) 誤差検出装置及び誤差検出プログラム
JP7333759B2 (ja) 画像データ生成システム、画像データ生成方法及びコンピュータプログラム
JP2018185810A (ja) 情報処理装置、その制御方法とプログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180703

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20181031

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190115

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200410

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200714