JP2010134548A - 情報処理装置、情報処理方法及び情報処理プログラム - Google Patents

情報処理装置、情報処理方法及び情報処理プログラム Download PDF

Info

Publication number
JP2010134548A
JP2010134548A JP2008307736A JP2008307736A JP2010134548A JP 2010134548 A JP2010134548 A JP 2010134548A JP 2008307736 A JP2008307736 A JP 2008307736A JP 2008307736 A JP2008307736 A JP 2008307736A JP 2010134548 A JP2010134548 A JP 2010134548A
Authority
JP
Japan
Prior art keywords
document
point information
information
vanishing
feature point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008307736A
Other languages
English (en)
Other versions
JP5146289B2 (ja
Inventor
Yuji Kasuya
勇児 糟谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2008307736A priority Critical patent/JP5146289B2/ja
Publication of JP2010134548A publication Critical patent/JP2010134548A/ja
Application granted granted Critical
Publication of JP5146289B2 publication Critical patent/JP5146289B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】
既存文書に対してマイナーチェンジが施された文書を自動的に検知する情報処理装置、情報処理方法及び情報処理プログラムを提供する。
【解決手段】
開示の情報処理装置は、既存文書毎に、既存文書に関する特徴点情報と一の文書に関する特徴点情報との類似度を算出した後、最も該類似度の大きい該既存文書に関する特徴点情報を選択する類似文書選択手段と、前記類似文書選択手段により選択された前記既存文書に関する特徴点情報のうち、前記一の文書に関する特徴点情報に含まれない特徴点の情報である消失点情報を抽出する消失点情報抽出手段と、他の文書に関する前記消失点情報と前記消失点情報抽出手段により抽出された前記消失点情報との類似度を算出した後、該類似度に基づいて、前記一の文書は前記既存文書に対して様式変更が行われた文書であると判定する様式変更判定手段と、を有することを特徴とする。
【選択図】図2

Description

本発明は、既存文書に対しマーナーチェンジが施された文書を検出する技術に関する。
従来、帳票などの白紙の文書画像から特徴点を抽出し、抽出した特徴点を対応付けることで記入済み文書画像を分類する仕組みが既に知られている。
一方、特許文献1では、記入済み帳票から白紙の帳票を作成する目的で、複数の記入済み帳票のANDを取り、合成することで白紙の帳票を作成する技術が開示されている。
特許3378439号公報
しかし、従来の文書画像の分類方法では、文書画像がマイナーチェンジしたとき、既存文書の特徴点DBを新たに登録し直さないと分類精度が低下する恐れがあるが、マイナーチェンジが軽微である場合、人ではマイナーチェンジが検知できないという問題があった。
また、異なるマイナーチェンジを施した複数の文書画像が同時並行で使用された場合、人手を使ってマイナーチェンジに合わせて特徴点DBを登録し直す作業にはコストが掛かるという問題もあった。
従って、上記問題点に鑑み、既存文書に対してマイナーチェンジが施された文書を自動的に検知する情報処理装置、情報処理方法及び情報処理プログラムを提供する。
開示する情報処理装置の一形態では、既存文書の画像データから抽出した該既存文書に関する特徴点情報を複数有する情報処理装置であって、一の文書の画像データから該一の文書に関する特徴点情報を抽出する特徴情報抽出手段と、前記既存文書毎に、前記既存文書に関する特徴点情報と前記一の文書に関する特徴点情報との類似度を算出した後、最も該類似度の大きい該既存文書に関する特徴点情報を選択する類似文書選択手段と、前記類似文書選択手段により選択された前記既存文書に関する特徴点情報のうち、前記一の文書に関する特徴点情報に含まれない特徴点の情報である消失点情報を抽出する消失点情報抽出手段と、他の文書に関する前記消失点情報と前記消失点情報抽出手段により抽出された前記消失点情報との類似度を算出した後、該類似度に基づいて、前記一の文書は前記既存文書に対して様式変更が行われた文書であると判定する様式変更判定手段と、を有することを特徴とする。
また、開示する情報処理装置の一形態では、さらに、前記他の文書に関する消失点情報と前記消失点情報抽出手段により抽出された消失点情報との類似度が所定の値より大きくなる前記一の文書の数を計測するカウンタ手段を有し、前記カウンタ手段により計測された前記一の文書の数が所定数より大きくなった場合、前記様式変更判定手段は、前記一の文書は前記既存文書に対して様式変更が行われた文書であると判定することを特徴とする。
また、開示する情報処理装置の一形態では、さらに、前記特徴情報抽出手段により抽出する前記一の文書に関する特徴点情報は、該一の文書に記載される文字又は図形の位置情報、該一の文書に記載される罫線の位置情報、及び該一の文書に記載される複数の罫線が交差する点の位置情報のうち、少なくとも1つに関する情報であることを特徴とする。
また、開示する情報処理装置の一形態では、さらに、前記類似文書線選択手段により算出される前記類似度は、前記既存文書に関する特徴点情報と前記一の文書に関する特徴点情報とに関し、対応する前記特徴点の数、該対応する特徴点間の距離に反比例する値、及び該対応する特徴点であって位置ずれ方向が同じである該特徴点の数のうち、少なくとも1つ以上に基づき算出することを特徴とする。
また、開示する情報処理装置の一形態では、さらに、前記様式変更判定手段により算出される前記類似度は、前記他の文書に関する消失点情報と前記消失点情報抽出手段により抽出された消失点情報とに関し、対応する前記消失点の数、該対応する消失点間の距離に反比例する値、及び該対応する消失点であって位置ずれ方向が同じである該消失点の数のうち、少なくとも1つ以上に基づき算出することを特徴とする。
また、開示する情報処理装置の一形態では、さらに、前記一の文書に関する複数の画像データを蓄積する画像データ蓄積手段と、前記様式変更判定手段により前記一の文書は前記既存文書に対して様式変更が行われた文書であると判定された場合、前記画像データ蓄積手段により蓄積された前記複数の画像データのAND画像を作成する新規帳票作成手段と、を有することを特徴とする。
また、開示する情報処理装置の一形態では、さらに、前記様式変更判定手段により前記一の文書は前記既存文書に対して様式変更が行われた文書であると判定された場合、該一の文書に関する特徴点情報を、前記既存文書に関する特徴点情報として保持することを特徴とする。
帳票等の文書にマイナーチェンジがあった場合、既存文書に関する特徴点DBで対応できない特徴点が発生する。この対応できない特徴点を消失点と呼ぶこととする。この消失点のみを文書画像から全て抽出し、新しいDB(消失点DB)として登録する。この消失点DBを用いて消失点情報を分類し、分類の履歴を使用することで、ある時期から頻出するようになった消失点情報を発見できるため、マイナーチェンジ後の文書を検知することができる。
既存文書に対してマイナーチェンジが施された文書を自動的に検知する情報処理装置、情報処理方法及び情報処理プログラムを提供する。
図面を参照しながら、本発明を実施するための最良の形態について説明する。
(本実施の形態に係る情報処理装置の動作原理)
図1は、情報処理装置100のハードウェア構成の一例を示す図である。図1で示すように、情報処理装置100は、CPU(Central Processing Unit)310、ROM(Read-Only Memory)320、RAM(Random Access Memory)330、HDD(Hard Disc Drive)340、表示装置350、通信I/F(InterFace)360を有する。
CPU310は、ROM320に記憶されたプログラムを実行する装置であり、RAM330に展開(ロード)されたデータを、プログラムの命令に従って演算処理し、情報処理装置100の全体を制御する。ROM320は、CPU310が実行するプログラムやデータを記憶している。RAM330は、CPU310でROM320に記憶されたプログラムを実行する際に、実行するプログラムやデータが展開(ロード)され、演算の間、演算データを一時的に保持する。HDD340は、基本ソフトウェアであるOS(Operating System)や本実施の形態に係るアプリケーションプログラムなどを、関連するデータとともに記憶する装置である。
表示装置350は、ハードキーによるキースイッチやLCD(Liquid Crystal Display)等で構成され、情報処理装置100が有する機能をユーザが利用する際や各種設定を行う際のユーザインタフェースとして機能する装置である。
通信I/F360は、無線又は有線の通信ネットワークを介して接続された他の通信制御機能を備えた周辺機器(例えば、管理者用PC端末(不図示)等)と情報(データ)を送受信するためのインタフェースである。本実施の形態に係る情報処理装置100は、通信I/F360を介してLANに接続され、TCP/IP(Transmission Control Protocol / Internet Protocol)などの通信プロトコルに従って、LANに接続された管理者用PC端末等に対し「既存文書に対しマイナーチェンジを施した文書を検知した旨」を通知する形態としても良い。
情報処理装置100が有する各手段は、CPU310が、ROM320又はHDD340に記憶された各手段に対応するプログラムを実行することにより実現される形態としても良いし、当該各手段に関する処理をハードウェアで実現する形態としても良い。
図2を用いて、本実施の形態に係る情報処理装置100の動作原理について説明する。図2は、情報処理装置100の動作原理を説明するための図である。図2で示すように、情報処理装置100は、特徴情報抽出手段110、特徴点類似度算出手段120、類似文書選択手段130、消失点情報抽出手段140、消失点類似度算出手段150、様式変更判定手段160、カウンタ手段170、新規帳票作成手段180、画像データ蓄積手段190、特徴点DB登録手段200、既存文書に関する特徴点DB230、消失点DB240を有する。
既存文書に関する特徴点DB230は、既存文書毎に、該既存文書の画像データから抽出した特徴点の情報を蓄積したデータベースであり、例えば、HDD340に保持される形態としても良い。ここで、文書とは、例えば、帳票であっても良く、その他帳票のように、同一の雛形に対し繰り返し同一の処理を施すような書類であっても良い。さらに、既存文書が従来使用している帳票の雛形である場合、後述する一の文書は、記入済みの帳票に該当する。
また、特徴点とは、図3(a)の網掛け丸印で示すように、文書画像データ中の文字又は図形の位置情報であっても良く、また、図3(b)の網掛け丸印で示すように、文書画像データ中の罫線が交わる点の位置情報であっても良い。さらに、特徴点とは、図3(c)の網掛け丸印で示すように、文書画像データ中の罫線の角の位置情報であっても良く、また、図3(d)の網掛け丸印で示すように、文書画像データ中の一定以上の大きさの黒い矩形の位置情報であっても良い。その他、特徴点は、Sift(画像解像度を変えてもエッジが変化しない点)、HOG特徴、顔検知を行い顔らしいものがある点、エッジの強さが閾値よりも強い点等、任意に定めることができる。上記の場合、特徴点情報には特徴点の性質(例えば、文書画像データ中の文字又は図形であるということ)を表す情報を含むものとする。
特徴情報抽出手段110は、情報処理装置100に入力された一の文書に関する画像データ210から、該一の文書に関する特徴点の情報(以下、特徴点情報220という。)を抽出する。ここで、特徴情報抽出手段110によって抽出される特徴点は、上記図3を用いて説明した特徴点と同様のものであり、特徴点情報220は特徴点の性質を表す情報及び当該特徴点の位置情報を含む情報である。
また、一の文書に関する画像データ210は、画像データ蓄積手段190によって、例えば、HDD340に蓄積される。
特徴点類似度算出手段120は、特徴点DB230に蓄積されている個々の特徴点情報と特徴情報抽出手段110により抽出された特徴点情報220とを比較して、両者の類似度を算出する。より具体的に言えば、特徴点類似度算出手段120は、特徴点DB230に蓄積されている個々の特徴点情報と特徴情報抽出手段110により抽出された特徴点情報220との類似度を計るためのスコアリングを行う。
ここで、図4、5を用いて、特徴点類似度算出手段120により行われる類似度の算出、すなわち、スコアリングについて説明する。また、図4、5では、網掛け丸印を特徴点DB230に蓄積されている1つの特徴点情報とし、塗り潰し丸印を特徴情報抽出手段110により抽出された特徴点情報220として示している。
特徴点類似度算出手段120により行われる類似度の算出方法又はスコア算出方法は、例えば、図4の点線丸印で示すように、一致した特徴点の数や一致した特徴点間の距離に反比例する値に基づいて算出する方法としても良い。また、別形態としては、図5の点線丸印で示すように、一致した特徴点であって位置ずれの方向が一致している特徴点の数に基づいて算出する方法としても良い。さらには、一致する特徴点の周囲のエッジやヒストグラムにより算出した距離に反比例する値に基づいて算出する方法としても良く、その他適宜算出方法は定めて良いし、これらを適宜組み合わせて算出する方法であっても良い。
類似文書選択手段130は、特徴点類似度算出手段120により算出された類似度の最も大きい特徴点情報を特徴点DB230内から抽出(選択)する、すなわち、スコアリングの結果の最も高い特徴点情報を特徴点DB230内から抽出(選択)する。
消失点情報抽出手段140は、類似文書選択手段130により抽出された特徴点情報と特徴情報抽出手段110により抽出された特徴点情報220とを比較して、前者に含まれるが、後者には存在しない(含まれない)特徴点の情報(以下、消失点情報という。)を抽出する。
ここで、図6−8を用いて、消失点情報抽出手段140による情報処理について具体的に説明する。図6は類似文書選択手段130により抽出された特徴点情報を示す図であり、図7は特徴情報抽出手段110により抽出された特徴点情報220を示す図であり、図8は消失点情報抽出手段140により抽出された消失点情報を示す図である。図6−8では、網掛け三角印で類似文書選択手段130により抽出された特徴点及び特徴情報抽出手段110により抽出された特徴点を示し、網掛け星印で消失点情報抽出手段140により抽出された消失点を示す。
図6で示す白地帳票に関する特徴点情報には20個の特徴点が存在し、図7で示す入力帳票に関する特徴点情報220には14個の特徴点が存在する場合、消失点情報抽出手段140は、図6、7の特徴点情報を比較して、図8で示す6個の消失点を抽出する。
また、消失点DB240は、消失点情報抽出手段140による情報処理によって抽出された消失点情報を複数蓄積するデータベースであり、例えば、HDD340に保持される形態としても良い。
消失点類似度算出手段150は、消失点DB240に蓄積されている個々の消失点情報と消失点情報抽出手段140により抽出された消失点点情報とを比較して、両者の類似度を算出する。より具体的に言えば、消失点類似度算出手段150は、消失点DB240に蓄積されている個々の消失点情報と消失点情報抽出手段140により抽出された消失点情報との類似度を計るためのスコアリングを行う。
消失点類似度算出手段150は、特徴点類似度算出手段120と同様に、例えば、一致した消失点の数や一致した消失点間の距離に反比例する値に基づいてスコアリングを行う。また、消失点類似度算出手段150は、一致した消失点であって位置ずれの方向が一致している消失点の数や、一致する消失点の周囲のエッジやヒストグラムにより算出した距離に反比例する値に基づいてスコアリングを行っても良い。その他、適宜スコアリング方法を定めても良いし、これらを適宜組み合わせてスコアリングする方法であっても良い。
様式変更判定手段160は、消失点類似度算出手段150により算出された類似度、つまり、類似度を計るためのスコアリング結果に基づいて、「一の文書」は「既存文書」に対して様式変更が行われた文書であると判定する。
また、様式変更判定手段160は、消失点類似度算出手段150によるスコアリング結果が最も高い消失点情報を消失点DB240内から抽出(選択)し、カウンタ手段170に対し、当該消失点情報に対応するカウンタを1だけインクリメントさせる。
そして、様式変更判定手段160は、1つの消失点情報に関して、カウンタ手段170によるカウント数が所定のカウント数より大きくなった場合、当該消失点情報に対応する「一の文書」は「既存文書」に対して様式変更が行われた文書であると判定する。また、様式変更判定手段160により上記の判定がされた場合、所定の通知先にその旨を通知する形態としても良い。
新規帳票作成手段180は、様式変更判定手段160によって上記判定がされた場合、当該「一の文書」に対応する複数の画像データを画像データ蓄積手段190から抽出(選択)し、複数の画像データのAND画像を作成する。より具体的に説明すると、新規帳票作成手段180は、抽出(選択)した複数の画像データの位置合わせ行い、位置合わせ後の複数の画像データのAND画像を作成して、「既存文書」に対して様式変更が行われた「一の文書」に対応する帳票を新規作成する。
特徴点DB登録手段200は、様式変更判定手段160によって上記判定がされた場合、当該「一の文書」に対応する特徴点情報を特等点DB230に新たに登録する。ここで、当該「一の文書」に対応する特徴点情報は、新規帳票作成手段180によって新規作成された「一の文書」に対応する帳票に基づいて作成する形態としても良い。この場合、新規作成された「一の文書」に対応する帳票の画像データに対して、特徴点情報抽出手段110を適用することで、当該「一の文書」に対応する特徴点情報を作成する形態としても良い。
上記のような動作原理に基づいて、情報処理装置100は、既存文書に対してマイナーチェンジが施された文書を自動的に検知することができる。
(本実施の形態に係る情報処理装置による処理例)
図9、10を用いて、本実施の形態に係る情報処理装置100による処理例を説明する。図9は、情報処理装置100による特徴情報抽出手段110、特徴点類似度算出手段120、類似文書選択手段130、消失点情報抽出手段140の処理例を示すフローチャートである。図10は、情報処理装置100による消失点類似度算出手段150、様式変更判定手段160、カウンタ手段170、新規帳票作成手段180、特徴点DB登録手段200の処理例を示すフローチャートである。
(1)特徴情報抽出手段110、特徴点類似度算出手段120、類似文書選択手段130、消失点情報抽出手段140の処理例
情報処理装置100が処理を開始した後、S10で特徴情報抽出手段110が、情報処理装置100に入力された一の文書に関する画像データ210から、該一の文書に関する特徴点情報220を抽出する。
S20で特徴点類似度算出手段120が、特徴点DB230から特徴点情報を1つ抽出し(読み込み)、S30で特徴点類似度算出手段120が、特徴点DB230から抽出した特徴点情報と特徴情報抽出手段110により抽出した特徴点情報220の類似度を算出する。より具体的に言えば、特徴点類似度算出手段120は、特徴点DB230から抽出された1つの特徴点情報と特徴情報抽出手段110により抽出された特徴点情報220との類似度を計るためのスコアリングを行って、そのスコアリング結果を保持する。
S40で特徴点類似度算出手段120が、特徴点DB230に蓄積される全ての特徴点情報に対し上記類似度を計るためのスコアリングを行った場合(S40でYesの場合)処理はS50に移行し、そうでない場合(S40でNoの場合)処理はS20に移行する。
S50で類似文書選択手段130が、S30で行われた特徴点類似度算出手段120によるスコアリング結果のうち、最も高いスコアの特徴点情報を特徴点DB230から抽出する。
S110で消失点情報抽出手段140が、S50で類似文書選択手段130により抽出された特徴点情報とS10で特徴情報抽出手段110により抽出された特徴点情報220とを比較する(図6、7を使用した説明を参照)。S120で消失点情報抽出手段140が、類似文書選択手段130により抽出された特徴点情報に含まれるが、特徴情報抽出手段110により抽出された特徴点情報220には存在しない(含まれない)特徴点の情報である消失点情報を抽出する(図8を使用した説明を参照)。そして、情報処理装置100は一連の処理を終了する。
(2)消失点類似度算出手段150、様式変更判定手段160、カウンタ手段170、新規帳票作成手段180、特徴点DB登録手段200の処理例
情報処理装置100が処理を開始すると、S210で消失点類似度算出手段150が、S120において消失点情報抽出手段140により抽出された消失点情報を保持する。
S220で消失点類似度算出手段150が、消失点DB240より消失点情報を1つだけ抽出し(読み込み)、S230で消失点類似度算出手段150が、消失点DB240から抽出した消失点情報と消失点情報抽出手段140により抽出された消失点点情報とを比較して、両者の類似度を算出する。より具体的に言えば、消失点類似度算出手段150は、両者の類似度を計るためのスコアリングを行う。
S240で消失点類似度算出手段150が、消失点DB240に蓄積される全ての消失点情報に対し上記類似度を計るためのスコアリングを行った場合(S240でYesの場合)処理はS250に移行し、そうでない場合(S240でNoの場合)処理はS220に移行する。
S250で様式変更判定手段160が、S230で行われた消失点類似度算出手段150によるスコアリング結果のうち、最も高いスコアの消失点情報を消失点DB240から抽出(選択)し、当該最も高いスコアの消失点情報に関するスコア値を保持する。
S260で上記最も高いスコアの消失点情報に関するスコア値が所定の閾値以上であった場合(S260でYesの場合)処理はS270へ移行し、そうでない場合(S260でNoの場合)処理はS280に移行する。S280では様式変更判定手段160が、消失点情報抽出手段140により抽出された消失点情報を消失点DB240に新たに登録する。
S270では様式変更判定手段160が、カウンタ手段170に対し、スコアリング結果が最も高い消失点情報に対応するカウンタを1だけインクリメントさせる。S280でカウンタ手段170が計測するカウンタ数が所定のカウント数以上となった場合(S290でYesの場合)処理はS300へ移行し、そうでない場合(S290でNoの場合)情報処理装置100は一連の処理を終了する。
S300では様式変更判定手段160が、最も高いスコアの消失点情報に対応する「一の文書」は「既存文書」に対して様式変更が行われた文書であると判定する。その後、新規帳票作成手段180、特徴点DB登録手段200による処理が適宜実行され、情報処理装置100は一連の処理を終了する。
(総括)
本発明では、既存文書に対してマイナーチェンジが施された文書を自動的に検知する情報処理装置、情報処理方法及び情報処理プログラムを提供することができる。
以上、本発明の実施の形態について詳述したが、本発明は係る特定の実施の形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲において、種々の変形・変更が可能である。
本実施の形態に係る情報処理装置のハードウェア構成の一例を示す図である。 本実施の形態に係る情報処理装置の動作原理を説明するための図である。 本実施の形態に係る特徴点の一例を示す図である。 本実施の形態に係る類似文書選択手段による処理を説明するための図である。 本実施の形態に係る類似文書選択手段による処理を説明するための図である。 本実施の形態に係る消失点情報抽出手段による処理を説明するための図である。 本実施の形態に係る消失点情報抽出手段による処理を説明するための図である。 本実施の形態に係る消失点情報抽出手段による処理を説明するための図である。 本実施の形態に係る情報処理装置による処理例を説明するフローチャートである。 本実施の形態に係る情報処理装置による処理例を説明するフローチャートである。
符号の説明
100 情報処理装置、110 特徴情報抽出手段、120 特徴点類似度算出手段、130 類似文書選択手段、140 消失点情報抽出手段、150 消失点類似度算出手段、160 様式変更判定手段、170 カウンタ手段、180 新規帳票作成手段、190 画像データ蓄積手段、200 特徴点DB登録手段、220 特徴点情報、230 特徴点DB、240 消失点DB、310 CPU、320 ROM、330 RAM、340 HDD、350 表示装置、360 通信I/F

Claims (15)

  1. 既存文書の画像データから抽出した該既存文書に関する特徴点情報を複数有する情報処理装置であって、
    一の文書の画像データから該一の文書に関する特徴点情報を抽出する特徴情報抽出手段と、
    前記既存文書毎に、前記既存文書に関する特徴点情報と前記一の文書に関する特徴点情報との類似度を算出した後、最も該類似度の大きい該既存文書に関する特徴点情報を選択する類似文書選択手段と、
    前記類似文書選択手段により選択された前記既存文書に関する特徴点情報のうち、前記一の文書に関する特徴点情報に含まれない特徴点の情報である消失点情報を抽出する消失点情報抽出手段と、
    他の文書に関する前記消失点情報と前記消失点情報抽出手段により抽出された前記消失点情報との類似度を算出した後、該類似度に基づいて、前記一の文書は前記既存文書に対して様式変更が行われた文書であると判定する様式変更判定手段と、を有することを特徴とする情報処理装置。
  2. 前記他の文書に関する消失点情報と前記消失点情報抽出手段により抽出された消失点情報との類似度が所定の値より大きくなる前記一の文書の数を計測するカウンタ手段を有し、
    前記カウンタ手段により計測された前記一の文書の数が所定数より大きくなった場合、
    前記様式変更判定手段は、前記一の文書は前記既存文書に対して様式変更が行われた文書であると判定することを特徴とする請求項1に記載の情報処理装置。
  3. 前記特徴情報抽出手段により抽出する前記一の文書に関する特徴点情報は、該一の文書に記載される文字又は図形の位置情報、該一の文書に記載される罫線の位置情報、及び該一の文書に記載される複数の罫線が交差する点の位置情報のうち、少なくとも1つに関する情報であることを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記類似文書線選択手段により算出される前記類似度は、前記既存文書に関する特徴点情報と前記一の文書に関する特徴点情報とに関し、対応する前記特徴点の数、該対応する特徴点間の距離に反比例する値、及び該対応する特徴点であって位置ずれ方向が同じである該特徴点の数のうち、少なくとも1つ以上に基づき算出することを特徴とする請求項1乃至3の何れか一に記載の情報処理装置。
  5. 前記様式変更判定手段により算出される前記類似度は、前記他の文書に関する消失点情報と前記消失点情報抽出手段により抽出された消失点情報とに関し、対応する前記消失点の数、該対応する消失点間の距離に反比例する値、及び該対応する消失点であって位置ずれ方向が同じである該消失点の数のうち、少なくとも1つ以上に基づき算出することを特徴とする請求項1乃至4の何れか一に記載の情報処理装置。
  6. 前記一の文書に関する複数の画像データを蓄積する画像データ蓄積手段と、
    前記様式変更判定手段により前記一の文書は前記既存文書に対して様式変更が行われた文書であると判定された場合、前記画像データ蓄積手段により蓄積された前記複数の画像データのAND画像を作成する新規帳票作成手段と、を有することを特徴とする請求項1乃至5の何れか一に記載の情報処理装置。
  7. 前記様式変更判定手段により前記一の文書は前記既存文書に対して様式変更が行われた文書であると判定された場合、該一の文書に関する特徴点情報を、前記既存文書に関する特徴点情報として保持することを特徴とする請求項1乃至6の何れか一に記載の情報処理装置。
  8. 既存文書の画像データから抽出した該既存文書に関する特徴点情報を複数有する情報処理装置の情報処理方法であって、
    特徴情報抽出手段が、一の文書の画像データから該一の文書に関する特徴点情報を抽出するステップと、
    類似文書選択手段が、前記既存文書毎に、前記既存文書に関する特徴点情報と前記一の文書に関する特徴点情報との類似度を算出した後、最も該類似度の大きい該既存文書に関する特徴点情報を選択するステップと、
    消失点情報抽出手段が、前記類似文書選択手段により選択された前記既存文書に関する特徴点情報のうち、前記一の文書に関する特徴点情報に含まれない特徴点の情報である消失点情報を抽出するステップと、
    様式変更判定手段が、他の文書に関する前記消失点情報と前記消失点情報抽出手段により抽出された前記消失点情報との類似度を算出した後、該類似度に基づいて、前記一の文書は前記既存文書に対して様式変更が行われた文書であると判定するステップと、を有することを特徴とする情報処理方法。
  9. カウンタ手段が、前記他の文書に関する消失点情報と前記消失点情報抽出手段により抽出された消失点情報との類似度が所定の値より大きくなる前記一の文書の数を計測するステップを有し、
    前記カウンタ手段により計測された前記一の文書の数が所定数より大きくなった場合、
    前記様式変更判定手段は、前記一の文書は前記既存文書に対して様式変更が行われた文書であると判定することを特徴とする請求項8に記載の情報処理方法。
  10. 前記特徴情報抽出手段により抽出する前記一の文書に関する特徴点情報は、該一の文書に記載される文字又は図形の位置情報、該一の文書に記載される罫線の位置情報、及び該一の文書に記載される複数の罫線が交差する点の位置情報のうち、少なくとも1つに関する情報であることを特徴とする請求項8又は9に記載の情報処理方法。
  11. 前記類似文書線選択手段により算出される前記類似度は、前記既存文書に関する特徴点情報と前記一の文書に関する特徴点情報とに関し、対応する前記特徴点の数、該対応する特徴点間の距離に反比例する値、及び該対応する特徴点であって位置ずれ方向が同じである該特徴点の数のうち、少なくとも1つ以上に基づき算出することを特徴とする請求項8乃至10の何れか一に記載の情報処理方法。
  12. 前記様式変更判定手段により算出される前記類似度は、前記他の文書に関する消失点情報と前記消失点情報抽出手段により抽出された消失点情報とに関し、対応する前記消失点の数、該対応する消失点間の距離に反比例する値、及び該対応する消失点であって位置ずれ方向が同じである該消失点の数のうち、少なくとも1つ以上に基づき算出することを特徴とする請求項8乃至11の何れか一に記載の情報処理方法。
  13. 画像データ蓄積手段が、前記一の文書に関する複数の画像データを蓄積するステップと、
    新規帳票作成手段が、前記様式変更判定手段により前記一の文書は前記既存文書に対して様式変更が行われた文書であると判定された場合、前記画像データ蓄積手段により蓄積された前記複数の画像データのAND画像を作成するステップと、を有することを特徴とする請求項8乃至12の何れか一に記載の情報処理方法。
  14. さらに、前記様式変更判定手段により前記一の文書は前記既存文書に対して様式変更が行われた文書であると判定された場合、該一の文書に関する特徴点情報を、前記既存文書に関する特徴点情報として保持するステップを有することを特徴とする請求項8乃至13の何れか一に記載の情報処理方法。
  15. コンピュータに、請求項8乃至14の何れか一に記載の情報処理方法を実行させるための情報処理プログラム。
JP2008307736A 2008-12-02 2008-12-02 情報処理装置、情報処理方法及び情報処理プログラム Expired - Fee Related JP5146289B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008307736A JP5146289B2 (ja) 2008-12-02 2008-12-02 情報処理装置、情報処理方法及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008307736A JP5146289B2 (ja) 2008-12-02 2008-12-02 情報処理装置、情報処理方法及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2010134548A true JP2010134548A (ja) 2010-06-17
JP5146289B2 JP5146289B2 (ja) 2013-02-20

Family

ID=42345813

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008307736A Expired - Fee Related JP5146289B2 (ja) 2008-12-02 2008-12-02 情報処理装置、情報処理方法及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP5146289B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012014403A1 (ja) * 2010-07-30 2012-02-02 パナソニック株式会社 空間における変化領域検出装置及び方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3378439B2 (ja) * 1996-07-19 2003-02-17 株式会社リコー 帳票画像作成装置
JP2003208565A (ja) * 2002-01-11 2003-07-25 Glory Ltd 帳票登録支援方法および装置並びにプログラム
JP2007179307A (ja) * 2005-12-28 2007-07-12 Hitachi Computer Peripherals Co Ltd 帳票識別装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3378439B2 (ja) * 1996-07-19 2003-02-17 株式会社リコー 帳票画像作成装置
JP2003208565A (ja) * 2002-01-11 2003-07-25 Glory Ltd 帳票登録支援方法および装置並びにプログラム
JP2007179307A (ja) * 2005-12-28 2007-07-12 Hitachi Computer Peripherals Co Ltd 帳票識別装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012014403A1 (ja) * 2010-07-30 2012-02-02 パナソニック株式会社 空間における変化領域検出装置及び方法
US9064171B2 (en) 2010-07-30 2015-06-23 Panasonic Intellectual Property Management Co., Ltd. Detection device and method for transition area in space

Also Published As

Publication number Publication date
JP5146289B2 (ja) 2013-02-20

Similar Documents

Publication Publication Date Title
US10789504B2 (en) Method and device for extracting information in histogram
JP2018102916A (ja) 制御方法、情報端末、及びプログラム
CN110070533B (zh) 一种目标检测结果的评测方法、装置、设备及存储介质
CN111625668B (zh) 对象检测和候选过滤系统
WO2022105569A1 (zh) 页面方向识别方法、装置、设备及计算机可读存储介质
JP5914732B2 (ja) 画像検証方法、画像検証装置、およびプログラム
JP7379684B2 (ja) 画像生成方法及び装置並びにコンピュータプログラム
US20170091956A1 (en) Identifying shapes in an image by comparing bezier curves
US20210303838A1 (en) Image classification using color profiles
EP3644227A1 (en) Signature verification apparatus, system, method, and program
JP5764527B2 (ja) 画像検証方法、画像検証装置、およびプログラム
JP5146289B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
CN107209862B (zh) 识别装置和信息存储介质
CN110162362B (zh) 动态控件位置检测与测试方法、装置、设备及存储介质
JP4570207B2 (ja) 3次元モデル解析装置および記録媒体
JP2010102396A (ja) 人物検出装置、人物検出方法及びプログラム
US9229608B2 (en) Character display apparatus, character display method, and computer readable medium
US11611678B2 (en) Image processing apparatus and non-transitory computer readable medium
US9280840B2 (en) Figure display device, figure display method and storage medium storing a figure display program
JP2017132095A5 (ja)
JP2022013433A5 (ja)
US20240233163A1 (en) Image comparison device
JP6379664B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP7383684B2 (ja) 情報処理装置、情報処理方法、並びにプログラム
EP4343690A1 (en) Information processing method, program, and information processing device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111006

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120821

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121030

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121112

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151207

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees