JP2012199901A - 文字の形状特徴を使用した文字比較による文書改変検知方法 - Google Patents

文字の形状特徴を使用した文字比較による文書改変検知方法 Download PDF

Info

Publication number
JP2012199901A
JP2012199901A JP2011206637A JP2011206637A JP2012199901A JP 2012199901 A JP2012199901 A JP 2012199901A JP 2011206637 A JP2011206637 A JP 2011206637A JP 2011206637 A JP2011206637 A JP 2011206637A JP 2012199901 A JP2012199901 A JP 2012199901A
Authority
JP
Japan
Prior art keywords
character
pair
predetermined
threshold
pairs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011206637A
Other languages
English (en)
Other versions
JP5616308B2 (ja
Inventor
jian yu Song
ユ ソンヤン
Mei I
メイ イ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Laboratory USA Inc
Original Assignee
Konica Minolta Laboratory USA Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Laboratory USA Inc filed Critical Konica Minolta Laboratory USA Inc
Publication of JP2012199901A publication Critical patent/JP2012199901A/ja
Application granted granted Critical
Publication of JP5616308B2 publication Critical patent/JP5616308B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • G06T7/001Industrial image inspection using an image reference approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1473Recognising objects as potential recognition candidates based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】文書改変検知方法は、文字を実際に認識することなく、文字の形状特徴を比較することにより、オリジナル画像とターゲット画像を比較する。
【解決手段】文字の境界ボックスが両方の画像について生成され、それぞれの境界ボックスは一つの文字に関する一つ以上の連結されたピクセル群を有する。オリジナル画像およびターゲット画像の境界ボックスは、対応するペアを形成する。一方の画像中にある境界ボックスが、もう一方の画像中に対となる境界ボックスを持たない場合、文書の追加および削除が検知される。境界ボックスの各ペアはその形状特徴を比較するために処理される。形状特徴は、文字のオイラー数と、境界ボックスのアスペクト比と、境界ボックスのピクセル密度と、二つの文字間のハウスドルフ距離とを含む。二つの文字は、形状特徴の比較に基づき、同一の文字または異なる文字と判定される。
【選択図】図1

Description

本発明は、ターゲットとする文書におけるオリジナルの文書に関する改変を検知する方法に関し、特に改変を検知するために文字の形状特徴を用いる改変検知方法に関する。
閉ループプロセスとは、オリジナルのデジタル文書(文字、図形、画像等を含む)を印刷し、印刷された文書のハードコピーを配布および複製等の方法で利用し、また文書のハードコピーをスキャンして再びデジタル形式に戻すことを指す。スキャンされたデジタル文書の認証とは、スキャンされた文書がオリジナルのデジタル文書の真正な複製であるかどうか、すなわちその文書がハードコピーの状態で改変されたかどうかを判定することを指す。様々な種類の文書認証および文書改変検知方法が提唱されている。多くの文書認証方法の目的は、追加や削除といった改変の内容を検知することである。文書認証方法の一種類においては、オリジナルのデジタル文書とスキャンされた文書の画像比較を行う。これは、ピクセルベースの改変検知方法と呼ばれることがある。他の種類の文書認証方法においては、文書の内容を表すデータまたは文書の内容に関連するデータがバーコードとして符号化され、後で行う文書認証を補助するために、そのバーコードが文書そのものの上に印刷される。
従来のピクセルベースの改変検知方法において、対象となるスキャンされた画像に改変点があるかどうかを判定するために、オリジナルのデジタル画像とスキャンされた画像についてピクセル毎の比較を行う。プリンターとスキャナーの両方の解像度が高ければ、スキャンされた画像の解像度も高くなる。従来の改変検知方法における画像全体について網羅的に画像比較を行う処理は、非常に計算量が多い。
さらに、ピクセル毎の比較は、誤った改変検知を行うことがある。例えば、オリジナル画像とターゲット画像の同じ位置にある二つの文字が、たとえ二つの文字が同一(すなわち文字が改変されていない)の場合でも、ターゲット画像とオリジナル画像においてピクセルレベルでの相違点は存在しうる。ターゲット文書を生成する印刷およびスキャンの過程によって生じる、このようなピクセルレベルの違いが、誤った改変検知につながる可能性がある。
本発明は、オリジナルのデジタル文書の画像とスキャンされた文書の画像との画像比較を行うことにより、文書の認証方法の改良を目指したものである。
本発明の目的は、誤った改変検知を抑止する画像比較に基づく改変検知方法を提供することである。
本発明の追加の特徴および利点は以下の説明に記載され、ある程度は説明から明らかであり、または本発明の実施により知ることができる。本発明の目的および他の利点は、それについて記載された明細書、特許請求の範囲および添付の図面において特に指摘された構造によって実現および達成される。
本書において具現化され、広範に記載された目的及び他の目的を達成するために、本発明は二値のビットマップ画像であるオリジナル画像およびターゲット画像の間における改変を検知するために、情報処理装置内に実装される方法であって、(a)それぞれが一文字に関する一つ以上の連結したピクセル群を有する複数の境界ボックスを、オリジナル画像およびターゲット画像の中に定義するステップと、(b)オリジナル画像およびターゲット画像それぞれにおいて実質的に同じ位置にある複数の対となる境界ボックスのペアを、オリジナル画像およびターゲット画像の中に特定するステップと、(c)それぞれの対となる境界ボックスのペアについて、(c1)(1)境界ボックスのペアにより囲まれる文字のペアそれぞれに関するオイラー数と、(2)境界ボックスのペアそれぞれのアスペクト比と、(3)境界ボックスの文字に属するピクセル数を境界ボックス全体のピクセル数で割って得られる境界ボックスのペアそれぞれのピクセル密度と、(4)文字のペア間のハウスドルフ距離とを含む複数の形状特徴を算出し、(c2)(1)文字のペアのオイラー数が等しいかどうか、(2)境界ボックスのペアのアスペクト比の差分が所定の第一閾値よりも小さいかどうか、(3)境界ボックスのペアのピクセル密度の差分が所定の第二閾値よりも小さいかどうか、(4)文字のペア間のハウスドルフ距離が所定の第三閾値よりも小さいかどうか、を評価することにより境界ボックスのペアにより囲まれる文字が、同一の文字か異なる文字かを判定するステップと、を含む文書改変検知方法を提供する。
一つの例において、ステップ(c2)は、(1)文字のペアのオイラー数が等しく、(2)文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さく、(3)境界ボックスのペアのアスペクト比の差分が前記所定の第二閾値よりも小さく、かつ、(4)境界ボックスのペアのピクセル密度の差分が前記所定の第三閾値よりも小さい場合には、その文字のペアが同一の文字だと判定するステップと、そうでない場合には、その文字のペアが異なる文字だと判定するステップとを含む。
その他の態様において、本発明は、各境界ボックスに囲まれた一つ以上の連結されたピクセル群である文字であって二値のビットマップ画像であるオリジナル画像およびターゲット画像のそれぞれの中にある二つの文字を比較するために、情報処理装置において実行される方法であって、(a)(1)境界ボックスのペアにより囲まれる文字のペアそれぞれに関するオイラー数と、(2)境界ボックスのペアそれぞれのアスペクト比と、(3)境界ボックスの文字に属するピクセル数を境界ボックス全体のピクセル数で割って得られる境界ボックスのペアそれぞれのピクセル密度と、(4)文字のペア間のハウスドルフ距離とを含む複数の形状特徴を算出するステップと、(b)(1)文字のペアのオイラー数が等しいかどうか、(2)境界ボックスのペアのアスペクト比の差分が所定の第二閾値よりも小さいかどうか、(3)境界ボックスのペアのピクセル密度の差分が所定の第三閾値よりも小さいかどうか、(4)文字のペア間のハウスドルフ距離が所定の第一閾値よりも小さいかどうかを評価することにより境界ボックスのペアにより囲まれる文字が、同一の文字か異なる文字かを判定するステップと、を含む文字比較方法を提供する。
その他の態様において、本発明は、情報処理装置を制御するために組み込まれたコンピュータプログラムと、情報処理装置が上記の方法を実行するように設定されたコンピュータプログラムとをその中に含むコンピュータで使用可能な非一時的記憶媒体(例えばメモリまたは記憶装置)を有するコンピュータプログラムおよびコンピュータプログラム製品を提供する。
前述の概要及び以下の詳述は、いずれも典型例及び説明を示すものであり、特許請求の範囲に記載された発明の仔細な説明を提供することを目的としている。
本発明の実施形態に係る改変検知方法のフローチャートを示す図である。 図1のプロセスにおける形状特徴比較のステップを仔細に示すフローチャートである。 それぞれが一つの文字を囲む二つの境界ボックスを示す図である。 図3aに示す二つの文字から生成される二つのスケルトンを示す図である。
本発明の実施形態に係る文書改変検知方法は、文字の形状特徴の比較を用いて、オリジナルのデジタル文書画像とスキャンされたデジタル文書画像(ターゲット画像)の比較を行う。ターゲット画像とオリジナル画像にある二つの文字は、実際に文字を認識することなく様々な文字の形状特徴を分析することにより、同じ文字または異なる文字と判定される。言い換えれば、文字認識(すなわちある文字を特定の言語における特定の文字と認識すること)は必要ではない。
図1および図2を参照して、改変検知方法をより詳細に説明する。図1は本発明の実施形態に係る改変検知方法のフローチャートである。図2は図1におけるステップS15を更に詳細を示すものである。
第一に、未加工オリジナル画像および未加工ターゲット画像を取得する(ステップ11)。両方の画像はビットマップ画像とする。一般に、未加工ターゲット画像は、元々オリジナルのデジタル文書から印刷された文書のハードコピーをスキャンすることにより取得する。例えば、オリジナルのデジタル文書は、コンピュータの文書加工アプリケーションにより生成した文書、ハードコピーをスキャンすることにより得られる画像、カメラで撮影した写真等である。オリジナルのデジタル文書が印刷された後、そのハードコピーは、未加工ターゲット画像を生成するためにスキャンし直されるまでの間に、回覧や複写等が行われる。ある実施形態における認証または改変検知プロセスの目的は、最初に印刷された時からスキャンし直されるまでの間、ハードコピー文書が改変されたかどうかを検知することである。
ステップS11で取得する未加工オリジナル画像は、オリジナルのデジタル文書から生成した画像でもよいし、オリジナルのデジタル文書そのものでもよい。例えば、オリジナルのデジタル文書が文書加工アプリケーションにより生成された文書である場合、未加工オリジナル画像は、オリジナルのデジタル文書を表示する画像を生成するコンピュータプログラムを使用して取得してもよい。また、未加工オリジナル画像は、オリジナルのデジタル文書を印刷後すぐに改変することなくスキャンして取得してもよい。また、未加工オリジナル画像は、オリジナルとみなされるハードコピー文書をスキャンして取得してもよい。未加工オリジナル画像を得るための他の方法も使用してもよい。未加工オリジナル画像はオリジナル文書を改変していない画像を表す。
未加工オリジナル画像およびターゲット画像が例えばマイクロソフト社のワード形式やPDF形式等のようなアプリケーション特有の形式を持つ場合、それらは以降のプロセスのためにビットマップ画像に変換される。加えて、未加工オリジナル画像およびターゲット画像のビットマップ画像は、好ましくは解像度が同一となるように調整されている。
改変検知の典型的なシナリオにおいて、未加工ターゲット画像はオリジナル文書のコピーであり、従って通常、未加工ターゲット画像は一般的にオリジナル文書に類似した外観を持ち、もし改変されていたとしても限定的な改変だと想定されていることに留意されたい。
未加工オリジナル画像および未加工ターゲット画像は事前処理される(ステップS12)。事前処理は、すでに二値画像である場合を除き、グレースケールまたはカラーの画像を閾値により二値画像に変換する処理を含む。事前処理はまた、傾き補正、サイズ補正、位置補正のような一つ以上の歪み補正工程も含む。傾き補正は、一般に印刷工程やスキャン工程において生じる回転誤差の修正を指す。ハフ変換およびフーリエ‐メリン変換等の多くの傾き補正方法が知られている。傾き補正を行うために、未加工ターゲット画像のみを使用する方法もあれば、未加工ターゲット画像と未加工オリジナル画像の両方を使用する方法もある。本ステップにおいて、いかなる好適な傾き補正方法を使用してもよい。同様に、多くのサイズ補正方法が知られている。未加工ターゲット画像のサイズ補正を行うためには、一般に未加工オリジナル画像と未加工ターゲット画像を比較する必要がある。二つの画像の実効的なコンテンツの面積を比較するサイズ補正方法もある。本ステップにおいて、いかなる好適なサイズ補正方法を使用してもよい。未加工ターゲット画像のサイズ補正は、例えば印刷された解像度とは異なる解像度でハードコピー文書がスキャンされる場合のように、未加工オリジナル画像と未加工ターゲット画像が異なる解像度を持つようなケースにおいて、特に必要となる。サイズ補正された未加工ターゲット画像は、少なくとも対象となる画像領域においては、未加工オリジナル画像と同じ解像度と同じピクセル数を持つ。未加工ターゲット画像を移動させる位置補正は、未加工ターゲット画像を未加工オリジナル画像に正確に揃えるように行われる。位置補正は、一般に二つの画像を比較することにより行われる。テンプレートマッチング等、多くの画像位置補正方法が知られている。本ステップにおいて、いかなる好適な画像位置補正方法を使用してもよい。未加工オリジナル画像については、印刷およびスキャンの工程を経ない場合、歪み補正工程を省略してもよい。
加工されたオリジナル画像およびターゲット画像は、改変を検知するために比較される。これを行うために、オリジナル画像およびターゲット画像のそれぞれの文字について境界ボックスを生成する(ステップS13)。各境界ボックスは、通常一つの文字について一つ以上の連結したピクセル群を囲う。境界ボックスは長方形であることが望ましい。文字の境界ボックスを生成するステップはOCR(光学文字認識)技術において一般に使用されており、ステップS13においては、いかなる好適な境界ボックス生成方法を使用してもよい。
オリジナル画像およびターゲット画像の境界ボックスは対応するペアを形成する。対となる境界ボックスのペアは、各画像上において実質的に同じ位置にある、オリジナル画像の境界ボックスと、ターゲット画像の境界ボックスとから構成される。ここで、実質的に同じ位置とは、二つの境界ボックスにおける位置の違いが水平および垂直方向において所定の閾値より小さいことを意味する。閾値はインチ単位またはピクセル単位(この場合、値は画像の解像度に依存する)で計測してもよい。閾値は様々な要素に依存してもよい。さらに、動的な閾値を使用してもよい。例えば、閾値は水平および垂直それぞれの閾値について、文章の該当する行における文字の平均的な幅および高さの半分としてもよい。閾値を該当する行における隣接した境界ボックスの平均距離とする例もある。一方の画像中にある境界ボックスが、他方の画像中に対となる境界ボックスを持たない場合、例えば文字の削除または追加といった改変が検知される(ステップS14)。
図3aは、それぞれ文字「y」を含む境界ボックスの典型的なペアを示す
そして、オリジナル画像およびターゲット画像中の対となる境界ボックスのペアは、文字のペアが同一の文字かどうかを判定するために、境界ボックスの文字における形状特徴を比較する処理が施される(ステップS15)。図2を参照して、ステップS15をより詳細に説明する。
図2の工程は、ここでは図2の改変検知工程全体の中の一つのステップとして記載されているが、図2に示すアルゴリズムは、他の実用的なアプリケーションにおいてもより一般的に適用可能であり、二つの文字が同一の文字かどうかを判断するための比較に使用できる点に留意されたい。
図2に示すように、対となる境界ボックスの各ペアについて、以下の形状特徴がそれぞれの境界ボックスについて算出される。
文字のオイラー数(ステップS21)。オイラー数(対数)は画像のトポロジーを測る尺度である。これは、E=C−Hという数式により定義され、ここで、Eはオイラー数、Cは画像中の接続された画像構成要素の数、Hは穴の数である。英文字およびアラビア数字のオイラー数は、一般に1、0または−1である。本ステップにおいて、文字のオイラー数を算出するためのいかなる好適なアルゴリズムも使用可能である。
境界ボックスのアスペクト比(ステップS22)。長方形の境界ボックスについて、アスペクト比は幅と高さの比として定義してもよい。境界ボックスが平行四辺形などの他の形状である場合、他の尺度を使用してもよい。
境界ボックスのピクセル密度(ステップS23)。これは文字に属するピクセル数(前景ピクセルと呼ばれることがある)を、バウンディングボ境界ボックスの全ピクセル数、例えば境界ボックスが長方形であればその高さ掛ける幅(ピクセル単位)、で割ったものと定義される。
加えて、二つの文字間のハウスドルフ距離が算出される(ステップS24)。本ステップは、まずは二つの文字それぞれのスケルトンを取得することにより実現される。文字のスケルトンは、文字の中線または中心線である。図3bは、図3aに示す二つの文字から取得した二つのスケルトンを示す。スケルトンは形態的細線化アルゴリズムを使用して取得してもよい。ここで、二つ文字に関する二つのスケルトン間のハウスドルフ距離が算出される。数学的には、ハウスドルフ距離は一方の集合から他方の集合における最も近い点までの距離の最大値である。より正式には、集合Aから集合Bまでのハウスドルフ距離は以下に定義される最大値関数である。
ここで、aおよびbはそれぞれ集合Aおよび集合B上の点であり、またd(a、b)はこれらの点間の任意の距離であり、例えばd(a、b)はaとbのユークリッド距離としてもよい。ハウスドルフ距離はコンピュータビジョン、コンピュータグラフィックスおよび他の分野で広く使用される。二つのスケルトン間のハウスドルフ距離を算出するためのいかなる好適なアルゴリズムを使用してもよい。
そして、二つの文字が同一かどうかを判断する決定が行われる。好ましい実施形態において、二つの文字が下記の四つの条件を満たした場合、二つの文字は同一だと判定される。
二つの文字のオイラー数が同一である(ステップS25)。
二つのアスペクト比の差分値が所定の第一閾値より小さい(ステップS26)。
二つのピクセル密度の差分値が所定の第二閾値より小さい(ステップ27)。
二つの文字間のハウスドルフ距離が所定の第三閾値より小さい(ステップ28)。
これらの条件において使用される閾値は、事前の統計的分析を行うことにより予め設定可能である。好適な実施形態において、上記の条件(ステップS26、S27、S28)における三つの所定の閾値は、それぞれ約0.1、0.2、5.5(解像度600dpiの画像について、ピクセルを単位として計測)である。しかし、いかなる他の好適な値を使用してもよい。特に、ハウスドルフ距離の閾値は画像の解像度に依存する。他の実施形態においては、ハウスドルフ距離の閾値は文字の大きさ(文字の幅、文字の高さ、またはその二つの組み合わせ)により正規化された距離である。好適な実施形態において、正規化された閾値は0.2である。
上記四つの条件がすべて満たされた場合(ステップS25からS28までの全てにおいて「Y」となった場合)、二つの文字は同一と判定される(ステップS29)。いずれかの条件が満たされない場合(ステップS25からS28までのいずれかにおいて「N」となった場合)、二つの文字は異なると判断される(ステップS30)。上記の工程(ステップS21からS30まで)は、オリジナル画像およびターゲット画像にある全ての対となる境界ボックスのペアについて、繰り返し実行される。
図2は四つの算出ステップ(S21からS24まで)および四つの判定ステップ(S25からS28まで)を記載しているが、ステップの順番は図2に記載したものから変更可能な点である点に留意されたい。例えば、各判定ステップは対応する算出ステップの後にすぐ実施可能であり、判定ステップの一つにおいて判定条件を満たさない場合、二つの文字は異なると判定され(ステップS30)、残りの算出および判定ステップは(もしあれば)スキップされる。
さらに、図2の実施形態において、二つの文字が同一とみなされるためには四つの条件全てを満たす必要があるが、条件を緩和することも可能である。例えば、ある実施形態において、四つの条件(ステップS25からS28までに示す)のうち少なくとも三つを満たせば、二つの文字は同一と判定される。他の実施形態において、ハウスドルフ距離の条件(ステップS28)を満たし、かつ、他の三つの条件(ステップS25からS27まで)のうち少なくとも二つを満たせば、二つの文字は同一と判定される。この点において、四つの条件のそれぞれは、多くの実際の環境においては、これらの条件が単独で使用された場合、対となる二つの文字が同一かどうかを判定するには不十分だと言える。実際の経験から、発明者はオイラー数条件およびハウスドルフ距離条件の組み合わせが誤判定の割合を減少させることを発見した。ハウスドルフ距離条件の判定精度は、オイラー数条件の判定精度と組み合わせることにより補完することが可能だと言われている。その理由は、ハウスドルフ距離条件は、どのように対応する文字のスケルトンを抽出するかというアルゴリズムに大きく依存しており、比較される画像の質が低い場合には、精度が相対的に低くなるためである。しかし、他の組み合わせを使用してもよい。
全ての対となる境界ボックスのペアが処理された後(図2の「リターン」)、ステップS14において検知された全ての改変およびステップS15(すなわち図2)において検知された全ての改変は、改変検知結果表示(便宜上、ここでは改変マップという)を生成するために統合され、改変マップはユーザにディスプレイ表示、印刷、保管等される(図1のステップS16)。
改変マップはオリジナル画像およびターゲット画像における改変点(差異点)を表示できるものであれば、いかなる好適な形式とすることも可能である。例えば、改変マップは、二つの画像の間でどのピクセルが異なるかを示す二値の差異マップとしてもよい。そのようなマップにおいて、改変されていない領域は空白であり、改変された領域はマップ上に表れる。他の例として、改変マップは、画像中の改変(追加、削除、変更等)された部分を示すマーカーまたはハイライト(四角、円、線、矢印、色等)を用いた、オリジナル画像またはターゲット画像のマークアップ版としてもよい。追加または削除された文字は、その文字を表示または非表示とするマーカーによって表現してもよい。異なる種類の改変(追加、削除、変更等)を表現するために、改変マップにおいて異なる色を使用してもよい。他の例において、改変マップは、いかなる文字も含まず、改変された場所を示すマーカーだけを含むことも可能である。
図2に示す形状特徴の比較工程はいかなる言語におけるいかなる文字の比較にも使用することが可能である。先述したように、この比較のために、OCR処理のように実際に文字を認識する必要はない。
上記の改変検知方法は、メモリーに格納されたソフトウェアまたはファームウェアに実装され、例えばコンピュータや情報処理部を有するプリンターまたはスキャナーなどの好適な情報処理装置により実行してもよい。この点において、図1のフローチャートを実現するために作成されるコンピュータが実行可能なソフトウェアは、好適な情報処理装置の中央処理装置(CPU)またはマイクロ処理装置(MPU)からアクセスされるコンピュータメモリに格納してもよい。印刷およびスキャンのステップは、プリンターおよびスキャナー、もしくは印刷部分とスキャン部分を一つの装置の中に併せ持つオールインワン装置により実行してもよい。これらの装置および器具の構造はよく知られており、ここでは詳述しない。
上記の方法、特に図2のアルゴリズムは、文書改善検知の文脈において記載されているが、このアルゴリズムは二つの文字が同一の文字かどうかを判定するための比較方法として一般的に使用してもよい。
本発明の思想または範囲から逸脱することなく、本発明に係る改変検知方法の様々な修正および変更が可能であることは、当業者にとって明らかである。このように、本発明は、添付された特許請求の範囲およびそれらの同等物に記載の範囲で行われる修正や変更も含む。

Claims (39)

  1. 二値のビットマップ画像であるオリジナル画像およびターゲット画像の間における改変を検知するために、情報処理装置内に実装される方法であって、
    (a)それぞれが一つの文字に関する一つ以上の連結したピクセル群を囲む複数の境界ボックスを、前記オリジナル画像および前記ターゲット画像の中に定義するステップと、
    (b)前記オリジナル画像および前記ターゲット画像のそれぞれにおいて実質的に同じ位置にある複数の対となる前記境界ボックスのペアを、前記オリジナル画像および前記ターゲット画像の中に特定するステップと、
    (c)対となる前記境界ボックスのペアそれぞれについて、
    (c1)(1)前記境界ボックスのペアにより囲まれる文字のペアそれぞれに関するオイラー数、および、(2)前記文字のペア間のハウスドルフ距離、を含む複数の形状特徴を算出し、
    (c2)(1)前記文字のペアのオイラー数が等しいかどうか、および、(2)前記文字のペア間のハウスドルフ距離が所定の第一閾値よりも小さいかどうか、を評価することにより前記境界ボックスのペアにより囲まれる前記文字のペアが、同一の文字か異なる文字かを判定するステップと、
    を有する文書改変検知方法。
  2. 前記ステップ(c2)は、
    (1)前記文字のペアのオイラー数が等しく、かつ、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さい場合には、前記文字のペアが同一の文字と判定するステップと、
    上記以外の場合には、前記文字のペアが異なる文字と判定するステップと、
    を有する請求項1に記載の文書改変検知方法。
  3. 文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2である請求項1または請求項2に記載の文書改変検知方法。
  4. 前記ステップ(c1)において算出される複数の形状特徴は、(3)前記境界ボックスのペアそれぞれのアスペクト比、および、(4)前記境界ボックスの文字に属するピクセル数を前記境界ボックス全体のピクセル数で割って得られる、前記境界ボックスのペアそれぞれのピクセル密度をさらに含み、
    前記ステップ(c2)は、(3)前記境界ボックスのペアのアスペクト比の差分が所定の第二閾値よりも小さいかどうか、および、(4)前記境界ボックスのペアのピクセル密度の差分が所定の第三閾値よりも小さいかどうか、をさらに評価することにより実行される請求項1〜3のいずれかに記載の文書改変検知方法。
  5. 前記ステップ(c2)は、
    (1)前記文字のペアのオイラー数が等しく、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さく、(3)前記境界ボックスのペアのアスペクト比の差分が前記所定の第二閾値よりも小さく、かつ、(4)前記境界ボックスのペアのピクセル密度の差分が前記所定の第三閾値よりも小さい場合には、前記文字のペアが同一の文字だと判定するステップと、
    上記以外の場合には、前記文字のペアが異なる文字だと判定するステップと、
    を有する請求項4に記載の文書改変検知方法。
  6. 文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2であり、前記所定の第二閾値は0.1であり、前記所定の第三閾値は0.2である請求項4または請求項5に記載の文書改変検知方法。
  7. 前記文字のペアのそれぞれに一つずつとして、二つのスケルトンが取得され、前記二つのスケルトンの間のハウスドルフ距離が算出されることにより、前記文字のペア間のハウスドルフ距離が算出される請求項1〜6のいずれかに記載の文書改変検知方法。
  8. 前記境界ボックスは長方形である請求項1〜7のいずれかに記載の文書改変検知方法。
  9. 前記ステップ(c2)での判定に基づき、改変検知結果表示を生成するステップをさらに有する請求項1〜8のいずれかに記載の文書改変検知方法。
  10. 前記ステップ(a)の後に、ステップ(d)として、前記オリジナル画像および前記ターゲット画像の一方には存在する境界ボックスであって、もう一方には対となるものが存在しない境界ボックスを特定するステップをさらに有する請求項1〜9のいずれかに記載の文書改変検知方法。
  11. 前記ステップ(c2)での判定に基づく改変検知結果と、前記ステップ(d)で特定された境界ボックスとを表示する図を生成するステップをさらに有する請求項10に記載の文書改変検知方法。
  12. 情報処理装置に二値のビットマップ画像であるオリジナル画像とターゲット画像との間における改変を検知する処理を実行させるために、前記情報処理装置を制御するためのコンピュータプログラムであって、
    (a)それぞれが一つの文字に関する一つ以上の連結したピクセル群を囲む複数の境界ボックスを、前記オリジナル画像および前記ターゲット画像の中に定義するステップと、
    (b)前記オリジナル画像および前記ターゲット画像のそれぞれにおいて実質的に同じ位置にある複数の対となる前記境界ボックスのペアを、前記オリジナル画像および前記ターゲット画像の中に特定するステップと、
    (c)対となる前記境界ボックスのペアそれぞれについて、
    (c1)(1)前記境界ボックスのペアにより囲まれる文字のペアそれぞれに関するオイラー数、および、(2)前記文字のペア間のハウスドルフ距離、を含む複数の形状特徴を算出し、
    (c2)(1)前記文字のペアのオイラー数が等しいかどうか、および、(2)前記文字のペア間のハウスドルフ距離が所定の第一閾値よりも小さいかどうか、を評価することにより前記境界ボックスのペアにより囲まれる前記文字のペアが、同一の文字か異なる文字かを判定するステップと、
    をコンピュータに実行させるコンピュータプログラム。
  13. 前記ステップ(c2)は、(1)前記文字のペアのオイラー数が等しく、かつ、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さい場合には、前記文字のペアが同一の文字と判定するステップと、
    上記以外の場合には、前記文字のペアが異なる文字と判定するステップと、
    を有する請求項12に記載のコンピュータプログラム。
  14. 文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2である請求項12または請求項13に記載のコンピュータプログラム。
  15. 前記ステップ(c1)において算出される複数の形状特徴は、(3)前記境界ボックスのペアそれぞれのアスペクト比、および、(4)前記境界ボックスの文字に属するピクセル数を前記境界ボックス全体のピクセル数で割って得られる前記境界ボックスのペアそれぞれのピクセル密度をさらに含み、
    前記ステップ(c2)は、(3)前記境界ボックスのペアのアスペクト比の差分が所定の第二閾値よりも小さいかどうか、および、(4)前記境界ボックスのペアのピクセル密度の差分が所定の第三閾値よりも小さいかどうか、をさらに評価することにより実行される請求項12〜14のいずれかに記載のコンピュータプログラム。
  16. 前記ステップ(c2)は、(1)前記文字のペアのオイラー数が等しく、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さく、(3)前記境界ボックスのペアのアスペクト比の差分が前記所定の第二閾値よりも小さく、かつ、(4)前記境界ボックスのペアのピクセル密度の差分が前記所定の第三閾値よりも小さい場合には、前記文字のペアが同一の文字だと判定するステップと、
    そうでない場合には、前記文字のペアが異なる文字だと判定するステップと、
    を有する請求項15に記載のコンピュータプログラム。
  17. 文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2であり、前記所定の第二閾値は0.1であり、前記所定の第三閾値は0.2である請求項15または請求項16に記載のコンピュータプログラム。
  18. 前記文字のペアのそれぞれに一つずつとして、二つのスケルトンが取得され、前記二つのスケルトンの間のハウスドルフ距離が計算されることにより、前記文字のペア間のハウスドルフ距離が算出される請求項12〜17のいずれかに記載のコンピュータプログラム。
  19. 前記境界ボックスは長方形である請求項12〜18のいずれかに記載のコンピュータプログラム。
  20. 前記ステップ(c2)での判定に基づき、改変検知結果表示を生成するステップをさらに有する請求項12〜19のいずれかに記載のコンピュータプログラム。
  21. 前記ステップ(a)の後に、ステップ(d)として、前記オリジナル画像および前記ターゲット画像の一方には存在する境界ボックスであって、もう一方には対となるものが存在しない境界ボックスを特定するステップをさらに有する請求項12〜20のいずれかに記載のコンピュータプログラム。
  22. 前記ステップ(c2)での判定に基づく改変検知結果と、前記ステップ(d)で特定された境界ボックスとを表示する図を生成するステップをさらに有する請求項21に記載のコンピュータプログラム。
  23. 各境界ボックスに囲まれた一つ以上の連結されたピクセル群である文字であって、二値のビットマップ画像であるオリジナル画像およびターゲット画像のそれぞれの中にある二つの文字を比較するために、情報処理装置において実行される方法であって、
    (1)前記境界ボックスのペアにより囲まれる文字のペアそれぞれに関するオイラー数、および、(2)前記文字のペア間のハウスドルフ距離、を含む複数の形状特徴を算出する算出ステップと、
    (1)前記文字のペアのオイラー数が等しいかどうか、および、(2)前記文字のペア間のハウスドルフ距離が所定の第一閾値よりも小さいかどうか、を評価することにより前記境界ボックスのペアにより囲まれる前記文字のペアが同一の文字か異なる文字かを判定する判定ステップと、
    を有する文字比較方法。
  24. 前記判定ステップは、
    (1)前記文字のペアのオイラー数が等しく、かつ、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さい場合には、前記文字のペアが同一の文字と判定するステップと、
    上記以外の場合には、前記文字のペアが異なる文字と判定するステップと、
    を有する請求項23に記載の文字比較方法。
  25. 文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2である請求項23または請求項24に記載の文字比較方法。
  26. 前記算出ステップにおいて算出される複数の形状特徴は、(3)前記境界ボックスのペアそれぞれのアスペクト比、および、(4)前記境界ボックスの文字に属するピクセル数を前記境界ボックス全体のピクセル数で割って得られる前記境界ボックスのペアそれぞれのピクセル密度をさらに含み、
    前記判定ステップは、(3)前記境界ボックスのペアのアスペクト比の差分が所定の第二閾値よりも小さいかどうか、および、(4)前記境界ボックスのペアのピクセル密度の差分が所定の第三閾値よりも小さいかどうかをさらに評価することにより実行される請求項23〜25のいずれかに記載の文字比較方法。
  27. 前記判定ステップは、
    (1)前記文字のペアのオイラー数が等しく、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さく、(3)前記境界ボックスのペアのアスペクト比の差分が前記所定の第二閾値よりも小さく、かつ、(4)前記境界ボックスのペアのピクセル密度の差分が前記所定の第三閾値よりも小さい場合には、その文字のペアが同一の文字だと判定するステップと、
    そうでない場合には、その文字のペアが異なる文字だと判定するステップと、
    を有する請求項26に記載の文字比較方法。
  28. 文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2であり、前記所定の第二閾値は0.1であり、前記所定の第三閾値は0.2である請求項26または請求項27に記載の文字比較方法。
  29. 前記文字のペアのそれぞれに一つずつとして、二つのスケルトンが取得され、前記二つのスケルトンの間のハウスドルフ距離が算出されることにより前記文字のペア間のハウスドルフ距離が算出される請求項23〜28のいずれかに記載の文字比較方法。
  30. 前記境界ボックスは長方形である請求項23〜29のいずれかに記載の文字比較方法。
  31. 各境界ボックスに囲まれた一つ以上の連結されたピクセル群である文字であって、二値のビットマップ画像であるオリジナル画像とターゲット画像それぞれの中にある二つの文字を比較する処理を情報処理装置に実行させるために、前記情報処理装置を制御するためのコンピュータプログラムであって、
    (1)前記境界ボックスのペアにより囲まれる文字のペアそれぞれに関するオイラー数、および、(2)前記文字のペア間のハウスドルフ距離、を含む複数の形状特徴を算出する算出ステップと、
    (1)前記文字のペアのオイラー数が等しいかどうか、および、(2)前記文字のペア間のハウスドルフ距離が所定の第一閾値よりも小さいかどうか、を評価することにより前記境界ボックスのペアにより囲まれる前記文字のペアが同一の文字か異なる文字かを判定する判定ステップと、
    をコンピュータに実行させるコンピュータプログラム。
  32. 前記判定ステップは、(1)前記文字のペアのオイラー数が等しく、かつ、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さい場合には、その文字のペアが同一の文字と判定するステップと、
    上記以外の場合には、その文字のペアが異なる文字と判定するステップと、
    を有する請求項31に記載のコンピュータプログラム。
  33. 文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2である請求項31または請求項32に記載のコンピュータプログラム。
  34. 前記算出ステップにおいて算出される複数の形状特徴は、(3)前記境界ボックスのペアそれぞれのアスペクト比、および、(4)前記境界ボックスの文字に属するピクセル数を前記境界ボックス全体のピクセル数で割って得られる前記境界ボックスのペアそれぞれのピクセル密度をさらに含み、
    前記判定ステップは、(3)前記境界ボックスのペアのアスペクト比の差分が所定の第二閾値よりも小さいかどうか、および、(4)前記境界ボックスのペアのピクセル密度の差分が所定の第三閾値よりも小さいかどうか、をさらに評価することにより実行される請求項31〜33のいずれかに記載のコンピュータプログラム。
  35. 前記判定ステップは、(1)前記文字のペアのオイラー数が等しく、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さく、(3)前記境界ボックスのペアのアスペクト比の差分が前記所定の第二閾値よりも小さく、かつ、(4)前記境界ボックスのペアのピクセル密度の差分が前記所定の第三閾値よりも小さい場合には、その文字のペアが同一の文字だと判定するステップと、
    上記以外の場合には、その文字のペアが異なる文字だと判定するステップと、
    を有する請求項34に記載のコンピュータプログラム。
  36. 文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2であり、前記所定の第二閾値は0.1であり、前記所定の第三閾値は0.2である請求項34または請求項35に記載のコンピュータプログラム。
  37. 前記文字のペアのそれぞれに一つずつとして、二つのスケルトンが取得され、前記二つのスケルトンの間のハウスドルフ距離が算出されることにより前記文字のペアのハウスドルフ距離が算出される請求項31〜36のいずれかに記載のコンピュータプログラム。
  38. 前記境界ボックスは長方形である請求項31〜37のいずれかに記載のコンピュータプログラム。
  39. 請求項12〜22および請求項31〜38のいずれかに記載のコンピュータプログラムが保存されたコンピュータで読み取り可能な記録媒体。
JP2011206637A 2011-03-22 2011-09-21 文字の形状特徴を使用した文字比較による文書改変検知方法 Expired - Fee Related JP5616308B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/053,618 2011-03-22
US13/053,618 US8331670B2 (en) 2011-03-22 2011-03-22 Method of detection document alteration by comparing characters using shape features of characters

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2014184556A Division JP5934762B2 (ja) 2011-03-22 2014-09-10 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置

Publications (2)

Publication Number Publication Date
JP2012199901A true JP2012199901A (ja) 2012-10-18
JP5616308B2 JP5616308B2 (ja) 2014-10-29

Family

ID=46877409

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011206637A Expired - Fee Related JP5616308B2 (ja) 2011-03-22 2011-09-21 文字の形状特徴を使用した文字比較による文書改変検知方法
JP2014184556A Expired - Fee Related JP5934762B2 (ja) 2011-03-22 2014-09-10 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2014184556A Expired - Fee Related JP5934762B2 (ja) 2011-03-22 2014-09-10 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置

Country Status (3)

Country Link
US (1) US8331670B2 (ja)
JP (2) JP5616308B2 (ja)
CN (1) CN102722729A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014131278A (ja) * 2012-12-28 2014-07-10 Konicaminolta Laboratory Usa Inc 印刷された文書の認証方法
JP2015103252A (ja) * 2013-11-27 2015-06-04 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド 文書の電子メール送信と一体化された権限管理システムおよび方法
JP2018136927A (ja) * 2016-12-30 2018-08-30 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド マルチバイナリゼーション画像処理

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101102896B1 (ko) * 2011-03-04 2012-01-09 (주)올라웍스 복수의 사용자가 동시에 콜렉션을 수행할 수 있도록 지원하기 위한 방법, 서버 및 컴퓨터 판독 가능한 기록 매체
US9599575B2 (en) 2012-02-07 2017-03-21 Applied Materials Israel, Ltd. System, a method and a computer program product for CAD-based registration
US8855399B2 (en) * 2012-02-07 2014-10-07 Applied Materials Israel, Ltd. System, a method and a computer program product for CAD-based registration
WO2014174665A1 (ja) * 2013-04-26 2014-10-30 株式会社 東芝 システムおよび筆跡検索方法
CN105117733A (zh) * 2015-07-27 2015-12-02 中国联合网络通信集团有限公司 一种确定聚类样本差异的方法及装置
CN108476282B (zh) * 2016-01-22 2020-07-17 富士胶片株式会社 摄影辅助装置及摄影辅助方法
US20180047193A1 (en) * 2016-08-15 2018-02-15 Qualcomm Incorporated Adaptive bounding box merge method in blob analysis for video analytics
KR101954812B1 (ko) * 2017-08-16 2019-03-07 상명대학교산학협력단 필적 인식 장치 및 방법
CN112926617A (zh) * 2019-12-06 2021-06-08 顺丰科技有限公司 包装变更检测方法、装置、云端计算机设备和存储介质
US11288532B2 (en) * 2020-03-02 2022-03-29 Capital One Services, Llc Systems and methods for facilitating candidate interviews
CN112035821A (zh) * 2020-09-04 2020-12-04 平安科技(深圳)有限公司 图形验证码识别方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0778251A (ja) * 1993-07-22 1995-03-20 Xerox Corp ソースベリファイ方法
JPH0793445A (ja) * 1993-09-20 1995-04-07 Takayama:Kk 相関演算回路
JP2009258815A (ja) * 2008-04-14 2009-11-05 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5748763A (en) * 1993-11-18 1998-05-05 Digimarc Corporation Image steganography system featuring perceptually adaptive and globally scalable signal embedding
US7620200B2 (en) * 1995-05-08 2009-11-17 Digimarc Corporation Authentication of identification documents
US6035066A (en) * 1995-06-02 2000-03-07 Cognex Corporation Boundary tracking method and apparatus to find leads
US6104834A (en) * 1996-08-01 2000-08-15 Ricoh Company Limited Matching CCITT compressed document images
JP2007058882A (ja) * 1996-09-27 2007-03-08 Fujitsu Ltd パターン認識装置
US5933523A (en) * 1997-03-18 1999-08-03 Cognex Corporation Machine vision method and apparatus for determining the position of generally rectangular devices using boundary extracting features
US6061478A (en) * 1997-05-21 2000-05-09 Ricoh Company, Ltd. Content-based filing and retrieval system for name cards and hankos
US6560281B1 (en) * 1998-02-24 2003-05-06 Xerox Corporation Method and apparatus for generating a condensed version of a video sequence including desired affordances
DE59803158D1 (de) * 1998-03-07 2002-03-28 Claussen Claus F Verfahren und vorrichtung zur auswertung eines bewegungsmusters
US6446099B1 (en) * 1998-09-30 2002-09-03 Ricoh Co., Ltd. Document matching using structural information
US7394573B1 (en) * 1999-04-14 2008-07-01 Xerox Corporation System for authenticating hardcopy documents
DE19958553A1 (de) * 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
EP1349114A3 (en) * 2002-03-19 2011-06-15 Canon Kabushiki Kaisha Sensor calibration apparatus, sensor calibration method, program, storage medium, information processing method, and information processing apparatus
US7327887B2 (en) * 2002-04-10 2008-02-05 National Instruments Corporation Increasing accuracy of discrete curve transform estimates for curve matching
US7630560B2 (en) * 2002-04-10 2009-12-08 National Instruments Corporation Increasing accuracy of discrete curve transform estimates for curve matching in four or more dimensions
US20030198386A1 (en) * 2002-04-19 2003-10-23 Huitao Luo System and method for identifying and extracting character strings from captured image data
MXPA04011277A (es) * 2002-05-14 2006-02-22 Mediasec Technologies Gmbh Patrones de autenticacion visibles para documento impreso.
US7324711B2 (en) * 2004-02-26 2008-01-29 Xerox Corporation Method for automated image indexing and retrieval
US7292710B2 (en) * 2004-02-26 2007-11-06 Xerox Corporation System for recording image data from a set of sheets having similar graphic elements
US8332401B2 (en) * 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US7639387B2 (en) * 2005-08-23 2009-12-29 Ricoh Co., Ltd. Authoring tools using a mixed media environment
US8521737B2 (en) * 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
DE102005025578A1 (de) * 2005-06-01 2006-12-07 Universität Hannover Verfahren zur Charakterisierung von Objekten
JP4920928B2 (ja) * 2005-08-08 2012-04-18 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US8467566B2 (en) * 2005-10-06 2013-06-18 Pitney Bowes Inc. Method for detecting fraud in a printed image
JP4757008B2 (ja) * 2005-12-13 2011-08-24 キヤノン株式会社 文書管理方法及び装置
US8175394B2 (en) * 2006-09-08 2012-05-08 Google Inc. Shape clustering in post optical character recognition processing
WO2008110013A1 (en) * 2007-03-15 2008-09-18 Centre Hospitalier De L'universite De Montreal Image segmentation
US20080310736A1 (en) * 2007-06-15 2008-12-18 Microsoft Corporation Smart visual comparison of graphical user interfaces
US8155437B2 (en) * 2007-09-07 2012-04-10 CVISION Technologies, Inc. Perceptually lossless color compression
CN101493896B (zh) * 2008-01-24 2013-02-06 夏普株式会社 文档图像处理装置及文档图像处理方法
CN101571921B (zh) * 2008-04-28 2012-07-25 富士通株式会社 关键字识别方法和装置
US8196030B1 (en) * 2008-06-02 2012-06-05 Pricewaterhousecoopers Llp System and method for comparing and reviewing documents
US7965894B2 (en) * 2009-06-30 2011-06-21 Konica Minolta Systems Laboratory, Inc. Method for detecting alterations in printed document using image comparison analyses
US8000528B2 (en) * 2009-12-29 2011-08-16 Konica Minolta Systems Laboratory, Inc. Method and apparatus for authenticating printed documents using multi-level image comparison based on document characteristics
US8483427B2 (en) * 2010-09-28 2013-07-09 Futurewei Technologies, Inc. System and method for image authentication
US8947736B2 (en) * 2010-11-15 2015-02-03 Konica Minolta Laboratory U.S.A., Inc. Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0778251A (ja) * 1993-07-22 1995-03-20 Xerox Corp ソースベリファイ方法
JPH0793445A (ja) * 1993-09-20 1995-04-07 Takayama:Kk 相関演算回路
JP2009258815A (ja) * 2008-04-14 2009-11-05 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014131278A (ja) * 2012-12-28 2014-07-10 Konicaminolta Laboratory Usa Inc 印刷された文書の認証方法
JP2015103252A (ja) * 2013-11-27 2015-06-04 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド 文書の電子メール送信と一体化された権限管理システムおよび方法
JP2018136927A (ja) * 2016-12-30 2018-08-30 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド マルチバイナリゼーション画像処理
JP6998198B2 (ja) 2016-12-30 2022-01-18 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド マルチバイナリゼーション画像処理

Also Published As

Publication number Publication date
JP2014225932A (ja) 2014-12-04
CN102722729A (zh) 2012-10-10
US8331670B2 (en) 2012-12-11
JP5616308B2 (ja) 2014-10-29
US20120243785A1 (en) 2012-09-27
JP5934762B2 (ja) 2016-06-15

Similar Documents

Publication Publication Date Title
JP5616308B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法
US7965894B2 (en) Method for detecting alterations in printed document using image comparison analyses
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
US8000528B2 (en) Method and apparatus for authenticating printed documents using multi-level image comparison based on document characteristics
US9596378B2 (en) Method and apparatus for authenticating printed documents that contains both dark and halftone text
US11574489B2 (en) Image processing system, image processing method, and storage medium
JP4310288B2 (ja) 画像処理装置及びその方法、プログラム並びに記憶媒体
US20060018544A1 (en) Method and apparatus for detecting an orientation of characters in a document image
US20050271275A1 (en) Text character identification system and method thereof
JP4694613B2 (ja) 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体
RU2581786C1 (ru) Определение преобразований изображения для повышения качества оптического распознавания символов
US8229214B2 (en) Image processing apparatus and image processing method
CA2790210C (en) Resolution adjustment of an image that includes text undergoing an ocr process
US20130050765A1 (en) Method and apparatus for document authentication using image comparison on a block-by-block basis
JP2002199206A (ja) メッセージ埋込並びに抽出方法、装置および媒体
US9338310B2 (en) Image processing apparatus and computer-readable medium for determining pixel value of a target area and converting the pixel value to a specified value of a target image data
JP2021044803A (ja) 画像処理装置、画像処理方法、及びプログラム
KR20150099116A (ko) Ocr를 이용한 컬러 문자 인식 방법 및 그 장치
US7873228B2 (en) System and method for creating synthetic ligatures as quality prototypes for sparse multi-character clusters
US8125691B2 (en) Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information
JP2019195117A (ja) 情報処理装置、情報処理方法、及びプログラム
US11710331B2 (en) Systems and methods for separating ligature characters in digitized document images
JP4792117B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
US8340434B2 (en) Image processing apparatus, image processing system and computer readable medium
JP5298830B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140812

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140911

R150 Certificate of patent or registration of utility model

Ref document number: 5616308

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees