JP2009260886A - 文書作成支援システム及び文書検証システム - Google Patents

文書作成支援システム及び文書検証システム Download PDF

Info

Publication number
JP2009260886A
JP2009260886A JP2008110267A JP2008110267A JP2009260886A JP 2009260886 A JP2009260886 A JP 2009260886A JP 2008110267 A JP2008110267 A JP 2008110267A JP 2008110267 A JP2008110267 A JP 2008110267A JP 2009260886 A JP2009260886 A JP 2009260886A
Authority
JP
Japan
Prior art keywords
document
detection target
area
feature amount
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008110267A
Other languages
English (en)
Inventor
Yoshiyasu Takahashi
由泰 高橋
Takaaki Yamada
隆亮 山田
Kunihiko Miyazaki
邦彦 宮崎
Hiroko Hieda
寛子 稗田
Atsushi Hirao
篤史 平尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008110267A priority Critical patent/JP2009260886A/ja
Publication of JP2009260886A publication Critical patent/JP2009260886A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】改ざんされていない文書を改ざんされていると誤って認識する点を解決する。
【解決手段】ネットワークに接続されるインターフェースと、前記インターフェースに接続されるプロセッサと、前記プロセッサに接続されるメモリと、を備え、文書の作成を支援する文書作成支援システムにおいて、作成された文書から特徴量を抽出する領域が定められている改ざん検出対象領域情報を保持し、前記作成された文書から、前記改ざん検出対象領域情報に定められている領域内の画素の重心を算出し、前記算出された重心に基づいて、前記作成された文書の特徴量を生成し、前記生成された特徴量を、前記文書に記録する。
【選択図】図1A

Description

本発明は、文書作成システムに関し、特に、文書の改ざんの検知が可能な文書を作成及び文書の改ざんを検知するシステムに関する。
プリンタを用いて文書を印刷する前に文書の特徴を特徴量として抽出し、抽出した特徴量を電子透かし及び/又はバーコード等を用いて紙面に埋め込む技術が知られている。一方、紙面の改ざんを検証する場合、紙面をスキャンすることによって、紙面に埋め込まれている電子透かし又はバーコードから特徴量を読み取る。また、スキャンされた画像から、文書の特徴量を抽出する。そして、電子透かし及びバーコードから読み取った特徴量と、検証する紙面の文書から抽出された特徴量とを比較することによって、紙面の改ざん、偽造、及び変造等を検知する。
特許文献1に記載された技術では、まず、透かし画像形成部は、文書画像を参照して、機密情報に基づいて透かし画像を作成する。次に、所定のフィルタを用いて、所定のシンボルを識別可能なドットパターンを埋め込む埋め込み領域を文書画像から算出し、埋め込み領域に対する文字領域の割合が所定の閾値以下であるか否かを判定する。埋め込み領域に対する文字領域の割合が所定の閾値以下である場合、文字領域と重ならない埋め込み領域に、少なくとも一部の機密情報を含むシンボルを識別可能なドットパターン(シンボルユニット)を、所定の数埋め込む。
特許文献1に記載された技術は、文書画像を参照し、文字領域に重ならない領域に機密情報を埋め込むため、元の文書に関わらず、確実に機密情報を埋め込むことができるとしている。
米国特許出願公開第2005/0018845号明細書
前述したように、特許文献1に記載された技術では、埋め込み領域に対する文字領域の割合が所定の閾値以下であるか否かを判定し、埋め込み領域に対する文字領域の割合が所定の閾値以下である場合に処理を行うため、埋め込み領域に対する文字領域の割合が印刷後に変化しないことが要求される。しかし、家庭用インクジェットプリンタ等では、文書を印刷した場合にインクのにじみが発生し、埋め込み領域に対する文字領域の割合が大きくなる可能性がある。また、オフィス用のページプリンタでも、文書を印刷した場合にトナーの飛び散りが発生し、埋め込み領域に対する文字領域の割合が大きくなる可能性がある。
また、文書をスキャンする場合に、レンズ等の光学系によって発生するぼけの影響によって、埋め込み領域に対する文字領域の割合が変化する可能性がある。このため、印刷後の文書を再びスキャンし、紙面の改ざんを検知する場合、埋め込み領域に対する文字領域の割合が増大するため、改ざんされていない部分も改ざんであると検知されてしまう可能性があった。
よって、印刷媒体が改ざんされた場合に、改ざんされた事実が確認できない課題がある。
本発明は、印刷時及びスキャン時に発生するインクにじみ、トナーの飛び散り、及び光学系のぼけの影響によって、改ざんされていない文書を改ざんされていると誤って認識する点を解決するシステムを提供する。
具体的には、インクのにじみ及びトナーの飛び散りに対し変化がそれほど大きくならないように、文書を構成する画素の位置情報を考慮した特徴量を用いる。画素の位置情報を考慮することによって、インクのにじみ及びトナーの飛び散りがあっても、文書の特徴量の変化がそれほど大きくなく、改ざんされた場合と区別することができる。
これは、インクのにじみ及びトナーの飛び散りは、インクやトナーが本来印刷されるべき位置に依存して発生するため、文書のインクやトナーが本来印刷されるべき位置を考慮することによって、インクのにじみ及びトナーの飛び散りが発生しても、あまり変化が大きくない特徴量を定義できる、という性質によっている。
文書を構成する画素の位置情報を加味した量として、より具体的には,重心を用いることが可能である。
本発明の代表的な一例を示せば以下の通りである。すなわち、ネットワークに接続されるインターフェースと、前記インターフェースに接続されるプロセッサと、前記プロセッサに接続されるメモリと、を備え、文書の作成を支援する文書作成支援システムにおいて、作成された文書から特徴量を抽出する領域が定められている改ざん検出対象領域情報を保持し、前記作成された文書から、前記改ざん検出対象領域情報に定められている領域内の画素の重心を算出し、前記算出された重心に基づいて、前記作成された文書の特徴量を生成し、前記生成された特徴量を、前記文書に記録する。
本発明によれば、インクのにじみ及びトナーの飛び散りが発生しても、改ざんと区別することが可能になる。
以下、本発明の実施の形態について、図面を参照して説明する。
<実施形態1>
図1Aは、本発明の実施の形態の文書作成システム101の構成を示すブロック図である。
文書作成システム101は、文書の作成を支援するシステムであり、文書作成端末102、文書特徴量抽出装置103、透かしデータ作成装置106、地紋透かし埋込装置107、及び改ざん検出対象DB装置108を備える。
文書作成端末102、文書特徴量抽出装置103、透かしデータ作成装置106、地紋透かし埋込装置107、及び改ざん検出対象DB装置108は、それぞれネットワーク110によって接続され、ネットワーク110を介して情報を送受信する。
文書作成端末102は、文書作成システム101を制御する端末であり、例えば、一般的な計算機によって実現することができる。
文書特徴量抽出装置103は、位置情報を加味した文書特徴量を抽出する装置であり、例えば、一般的な計算機によって実現することができる。
ここで位置情報を加味した文書特徴量とは、後述する特徴量抽出プログラムによって文書から作成される数値又はデータである。文書特徴量は、ある文書の文書特徴量と、その文書に改ざん等の変更を加えた文書の文書特徴量とが、多くの場合異なるという性質を持つ。位置情報を加味した文書特徴量の例としては、例えば、後述する重心利用タイプ文書特徴量や、後述する細線化重心利用タイプ文書特徴量がある。
文書特徴量抽出装置103は、文書特徴量選択プログラム104、重心利用タイプ文書特徴量抽出プログラム105、細線化重心利用タイプ文書特徴量抽出プログラム119、及び文書特徴量タイプテーブル120を含み、各プログラムを実行することによって、文書特徴量抽出装置103の機能を実現することができる。
文書特徴量選択プログラム104は、指定された文書特徴量タイプに対応する特徴量抽出プログラムを選択する。
文書特徴量タイプとは、文書特徴量を識別する識別子であり、図4を用いて後述する。特徴量抽出プログラムとは、入力された文書から文書特徴量を抽出するために実行されるプログラムであり、例えば、重心利用タイプ文書特徴量抽出プログラム105及び細線化重心利用タイプ文書特徴量抽出プログラム119を含む。
重心利用タイプ文書特徴量抽出プログラム105は、入力された文書から、画像の重心を用いて文書特徴量を抽出する。また、細線化重心利用タイプ文書特徴量抽出プログラム119は、入力された文書から、画像を細線化し、細線化された画像の重心を用いて文書特徴量を抽出する。
文書特徴量タイプテーブル120は、文書特徴量のタイプと、特徴量抽出プログラムとを対応付けて管理する。なお、文書特徴量タイプテーブル120は、図4を用いて後述する。
透かしデータ作成装置106は、透かしデータを作成する装置である。
地紋透かし埋込装置107は、後述する地紋透かしの技術を用いて、文書に情報(例えば、透かしデータ)を埋め込む(記録する)装置である。
改ざん検出対象DB装置108は、改ざん検出対象DB109を格納する。改ざん検出対象DB109は、改ざんを検出する対象となる領域が規定されるデータベースである。改ざん検出対象DB109に格納されるデータについては、図6Aを用いて後述する。
なお、文書作成端末102、文書特徴量抽出装置103、透かしデータ作成装置106、地紋透かし埋込装置107、及び改ざん検出対象DB装置108は、それぞれ別装置として記載したが一つのハードウェアに実装されてもよい。
図2は、本発明の実施の形態の文書特徴量抽出装置103のハードウェアの構成を示すブロック図である。
文書特徴量抽出装置103は、CPU201、メモリ202、インターフェース203、ネットワークインターフェース204、キーボード205、画面206、スキャナ207、プリンタ208、ハードディスク209、及び時計210を備える。
CPU(プロセッサ)201は、中央処理装置(Central Processing Unit)であり、メモリ202に格納されているプログラム、又はハードディスク209からメモリ202に読み出されたプログラムを実行する。なお、プログラムは、必要に応じて、計算機が利用可能であり、着脱可能な記憶媒体によって導入されてもよい。また、ネットワークインターフェース204によって、通信媒体(通信回線又は通信回線上の搬送波)を介して、計算機に導入されてもよい。
メモリ202は、CPU201に実行されるプログラム及びデータを一時的に格納する。インターフェース203は、文書特徴量抽出装置103内の各構成を接続するインターフェースである。ネットワークインターフェース204は、ネットワーク110を介して外部と通信するインターフェースである。
キーボード205は、文書作成システム101への指示及びデータを入力するために、管理者が操作する入力装置である。画面206は、処理結果等を表示する装置である。スキャナ207は、印刷物等を光学的に読み取り、読み取った結果を画像として文書作成システム101内に入力する装置である。プリンタ208は、文書作成システム101の処理結果等を印刷媒体(例えば、紙面)に印刷する装置である。
ハードディスク209は、プログラム及びデータを格納する装置であり、例えば、不揮発性メモリ等によって構成することができる。この場合、ハードディスク209に格納されたプログラム及びデータは、電源がOFFとなった後にONになった場合でも、保持される。時計210は、CPU201が現在の時刻を検出する装置である。
なお、ネットワークインターフェース204、キーボード205、画面206、スキャナ207、プリンタ208、ハードディスク209、及び時計210は、それぞれ必要に応じて省略されてもよい。
なお、文書作成端末102、透かしデータ作成装置106、地紋透かし埋込装置107、及び改ざん検出対象DB装置108も、図2に示すハードウェアの構成と同じ構成を備える。
次に、文書作成システムで実行される文書作成処理を、図3を用いて説明する。
図3は、本発明の実施の形態の文書作成処理のフローチャートである。
図3に示される文書作成フローは、文書作成システム101に備わる各装置のメモリ202に格納されているプログラムをCPU201が実行することによって実行される。
まず、文書作成端末102は、文書作成者から、文書データ、文書特徴量タイプ、及び改ざん検出対象領域レコード番号の入力を受け付ける(301)。文書データは、例えば、一般のワープロソフト及びテキストエディタ等、計算機上で動作可能なソフトウェアで作成されるデータである。
ここで、文書特徴量タイプについて、図4を用いて説明する。図4は、本発明の実施の形態の文書特徴量タイプテーブル120の説明図である。
文書特徴量タイプテーブル120は、文書特徴量タイプ401、文書特徴量タイプの説明402、特徴量抽出プログラム403、及び特徴量比較プログラム404を含む。
文書特徴量タイプ401は、文書特徴量を抽出するタイプを識別する識別子であり、例えば、図4に示すように番号を用いることができる。
文書特徴量タイプの説明402は、文書特徴量タイプの内容であり、例えば、重心利用タイプ、細線化重心利用タイプ、面積利用タイプ、及びテキストタイプである。なお、図4に示されている以外の文書特徴量タイプがあってもよい。
特徴量抽出プログラム403は、文書特徴量タイプに対応する特徴量抽出プログラムである。特徴量比較プログラム404は、文書特徴量タイプに対応する特徴量比較プログラムである。なお、特徴量比較プログラム404については、後述する。
また、改ざん検出対象領域レコード番号は、改ざん検出対象DB109に格納されているデータ(レコード)を識別する番号であり、改ざんを検出する対象となる領域が決定される。
次に、文書作成端末は、ステップ301で受け付けた文書特徴量タイプ、文書データ、及び改ざん検出対象領域レコード番号を文書特徴量抽出装置103に送信する(302)。なお、本実施の形態では、文書特徴量タイプとして、重心利用タイプを用いる場合について説明する。
次に、文書特徴量抽出装置103は、文書特徴量タイプテーブル120を参照し、ステップ302で送信された文書特徴量タイプに応じて、特徴量抽出プログラム404を選択する(303)。
次に、文書特徴量抽出装置103は、ステップ303で選択された特徴量抽出プログラム404を起動する(304)。
次に、文書特徴量抽出装置103は、ステップ302で送信された文書データから、指定された文書特徴量タイプ及び改ざん検出対象領域レコード番号に基づいて文書特徴量を抽出し、抽出された文書特徴量を文書作成端末102に送信する(305)。ステップ305の具体的な処理は、図5を用いて後述する。
次に、文書作成端末102は、ステップ305で送信された文書特徴量を透かしデータ作成装置106に送信する(306)。
次に、透かしデータ作成装置106は、ステップ306で送信された文書特徴量から透かしデータを作成し、作成された透かしデータを文書作成端末102に送信する(307)。透かしデータには、文書特徴量がそのまま用いられてもよい。また、一般的な暗号アルゴリズムにしたがって、暗号化された文書特徴量が用いられてもよい。また、一般的な電子署名アルゴリズムにしたがって、電子署名が付与された文書特徴量が用いられてもよい。また、タイムスタンプが付与された文書特徴量が用いられてもよい。
次に、文書作成端末102は、文書データ及びステップ307で作成された透かしデータを地紋透かし埋込装置107に送信する(308)。
次に、地紋透かし埋込装置107は、ステップ308で送信された透かしデータを文書データに埋め込むことによって、透かし入り文書データを作成し、作成された透かし入り文書データを文書作成端末102に送信する(309)。
具体的には、まず、地紋透かし埋込装置107は、文書データを画像化する。文書データの画像化には、市販のワープロソフトから特定の仮想プリンタに印刷し、印刷された文書データがPDFデータに変換される公知技術、及び、PDFデータから画像データに変換する公知技術を用いることができる。
次に、画像化された文書データに透かしデータを埋め込む。画像化された文書データに透かしデータを埋め込む方法は、特開2006−279640号公報に開示されている技術を用いることができる。特開2006−279640号公報に開示された情報埋め込み装置201に、埋め込み情報として透かしデータを入力し、画像化された文書データを文書画像として入力する。そして、特開2006−279640号公報の図2に示す情報埋め込み装置201の情報点群決定処理部225は、文書画像212に埋め込み情報211を埋め込んでいるため、埋め込み情報211が埋め込まれた文書画像212をハードディスク等に出力することによって、透かし入り文書データである画像が作成される。
ステップ310では、文書作成端末102は、ステップ309で作成された透かし入り文書データを表示し、文書作成者の要求に応じて、透かし入り文書データを印刷又は送信する。本実施の形態では、透かし入り文書データは画像であるため、従来技術を用いて画像を表示することが可能であり、文書作成者の要求に応じて印刷又は送信することが可能である。
なお、ステップ301では、文書作成端末102は、文書データを直接受け付けているが、文書データを識別する識別子を受け付けてもよい。この場合、受け付けた識別子に基づいて、文書データが読み出される。読み出される文書データは、例えば、文書作成端末102に備わるハードディスク209及び文書作成端末102に接続されるハードディスク209等に格納されてもよい。
なお、ステップ305では、文書特徴量抽出装置103は、抽出された文書特徴量を文書作成端末102に送信しているが、抽出された文書特徴量を透かしデータ作成装置106に送信してもよい。この場合、処理はステップ306を省略し、ステップ307に進む。
また、ステップ307では、透かしデータ作成装置106は、作成された透かしデータを文書作成端末102に送信しているが、作成された透かしデータを地紋透かし埋込装置107に送信してもよい。この場合、処理はステップ308を省略し、ステップ309に進む。
図5は、本発明の実施の形態の重心利用タイプの文書特徴量の抽出処理のフローチャートであり、図3のステップ305で実行される処理の説明を示す。
まず、文書特徴量抽出装置103は、改ざん検出対象DB装置108にアクセスし、改ざん検出対象DB109から、図3のステップ301で入力された改ざん検出対象領域レコード番号に対応するレコードを取得する(601)。
ここで、改ざん検出対象DB109に格納されるレコード(改ざん検出対象領域レコード600)の例を図6Aに示す。改ざん検出対象領域レコード600には、文書データから文書特徴量を抽出する領域が規定されている。
図6Aに示す例は、改ざん検出対象DB109に格納されている改ざん検出対象領域レコード番号3の内容が示されている。他のレコード番号には異なる内容のレコードが格納されており、改ざんを検出する対象の領域(改ざん検出対象領域)を適宜変更することが可能である。
図6Aに示す改ざん検出対象領域レコード600は、改ざん検出対象領域ID701、始点702、及び終点703を含む。なお、改ざん検出対象領域レコード600の1行分のデータを一つのエントリとする。
改ざん検出対象領域ID701は、改ざん検出対象領域を識別する識別子である。始点702は、領域の始点を指定する座標である。終点703は、領域の終点を指定する座標である。
図6Bに示す例は、図6Aに示す改ざん検出対象領域レコード600によって特定される改ざん検出対象領域であり、領域704、領域705、領域706、及び領域707を含む。
図6Bに示す領域704は、改ざん検出対象領域ID701が「1」である領域に対応する。すなわち、領域704は、始点702が(2,3)であり、終点703が(8,6)である領域を示す。以下、同様に、図6Bに示す領域705は、改ざん検出対象領域ID701が「2」である領域に対応し、図6Bに示す領域706は、改ざん検出対象領域ID701が「3」である領域に対応し、図6Bに示す領域707は、改ざん検出対象領域ID701が「10」である領域に対応する。
このように、ステップ601では、改ざん検出対象DB109から、指定されたレコードを取得することによって、改ざん検出対象領域が決定される。
ステップ602では、文書特徴量抽出装置103は、ステップ601で取得したレコード内のエントリ(改ざん検出対象領域)のうち、処理が終了していないエントリがあるか否かを判定する。
少なくとも一つのエントリについて処理が終了していないと判定された場合、文書特徴量抽出装置103は、処理が終了していないエントリを取り出し、処理はステップ603に進む。すなわち、図6Aに示す例では、改ざん検出対象領域ID701によって特定される各改ざん検出対象領域が取り出される。一方、全てのエントリについて処理が終了したと判定された場合には、処理はステップ605に進む。
次に、文書特徴量抽出装置103は、文書データから、ステップ602で取り出されたエントリに対応する領域画像を生成する(603)。なお、領域画像を生成する処理は、前述したように、文書データから画像を取得する公知技術を用いることができる。例えば、予め文書データ全体の画像を生成し、生成された画像から、改ざん検出対象領域に対応する領域の画像を切り出すことによって、領域画像を生成することができる。
次に、文書特徴量抽出装置103は、ステップ603で生成された領域画像の重心を計算し、計算された重心を重心リスト900に格納する(604)。
重心の計算方法について、図7を用いて説明する。図7は、本発明の実施の形態の重心の計算例を示す説明図である。ここで、画素801は文書中の黒画素であり、座標が(1,9)である。また、画素802は文書中の黒画素であり、座標が(2,1)である。また、画素803は文書中の黒画素であり、座標が(6,8)である。また、画素804は、文書中の黒画素であり、座標が(7,2)である。ここで、文書中の黒画素とは、文書中の文字及び絵を構成する画素である。図7に示す例では、文書中の文字及び絵を構成する画素として、黒画素と表現しているが、赤い画素のように色が付いた画素であってもよい。
図7に示すように、黒画素が四つ存在する場合、重心のx座標は、計算対象となる黒画素のx座標の総和を、計算対象となる黒画素の数で除算した結果である。図7に示す例では、重心のx座標は4である。
また、重心のy座標は、計算対象となる黒画素のy座標の総和を、計算対象となる黒画素の数で除算した結果である。図7に示す例では、重心のy座標は5である。よって、重心の座標は(4,5)である。
図7に示す例では、重心の座標が整数であるが、重心の座標が小数であってもよい。この場合、計算機で表現可能な浮動小数点数表現を用いて、計算結果の数を近似して表現する。
なお、重心リスト900は、後述する図9Aに示すように、改ざん検出対象領域と重心とを対応付けたリストである。
図8A及び図8Bは、本発明の実施の形態の重心利用タイプの文書特徴量の例を示す説明図であり、文字「4」の重心を示す。
図8A示す例では、計算機内での文字を模式的に表現しており、重心901は、文字「4」の重心である。図8Bに示す例では、印刷された文書がスキャンされた後の文字を模式的に表現しており、文字「4」がにじんでいることを示す。しかし、重心902で表現される文字「4」の重心は、図8Aの重心901と比較して、大きく変化していないことを示す。これは、文書特徴量に重心を用いることによって実現することができる。
なお、ステップ604では、文書中の全ての黒画素に基づいて重心を計算しているが、文書中の黒画素のうち、黒画素以外の画素と接している画素のみを計算対象として重心を計算してもよい。これによって、にじみの影響をより少なくすることができる。
ステップ605では、文書特徴量抽出装置103は、ステップ604で作成された重心リスト900から文書特徴量を生成する。
重心リスト900から文書特徴量を生成する処理について、図9A及び図9Bを用いて説明する。図9Aは、本発明の実施の形態の重心リスト900の説明図である。図9Bは、本発明の実施の形態の特徴量の例を示す説明図である。
重心リスト900は、改ざん検出対象領域ID1001及び重心1002を含む。改ざん検出対象領域ID1001は、改ざん検出対象領域を識別する識別子であり、図6Aに示す改ざん検出対象領域ID701と対応する。重心1002は、図5のステップ604で計算された重心の座標である。なお、重心リスト900の1行分のデータを一つのエントリとする。
図9Aに示す例では、改ざん検出対象領域ID1001が「1」である領域の重心は(3,5)である。また、改ざん検出対象領域ID1001が「2」である領域の重心は(5.8,4)である。また、改ざん検出対象領域ID1001が「3」である領域の重心は(8,2.1)である。また、改ざん検出対象領域ID1001が「10」である領域の重心は(1.8,1.2)である。図9Aに示す重心リスト900から、以下に説明するように文書特徴量を生成する。
まず、文書特徴量タイプをメモリ202に格納する。図9Aに示す例では、重心利用タイプを用いているため、図4に示す文書特徴量タイプテーブル120を参照すると、文書特徴量タイプ401は「1」である。この文書特徴量タイプ401を計算機内部の表現(16進数)に変換すると、「0001」である。
次に、改ざん検出対象領域レコード番号をメモリ202に格納する。図9Aに示す例では、改ざん検出対象領域レコード番号が「3」であるため、計算機内部の表現に変換した「0003」をメモリ202に格納する。
次に、重心の個数をメモリ202に格納する。図9Aに示す例では、重心の個数は10個であるため、「10」を計算機内部の表現に変換すると、「000A」である。
次に、重心リスト900の改ざん検出対象領域ID1001の小さい順に、重心1002を計算機内部の表現に変換し、メモリ202に格納する。
改ざん検出対象領域ID1001が「1」の場合、重心1002が(3,5)であるため、「3」及び「5」を計算機内部の表現に変換すると、それぞれ「40400000」及び「40A00000」(ともに16進数)である。改ざん検出対象領域ID1001が「2」の場合、重心1002が(5.8,4)であるため、「5.8」及び「4」を計算機内部の表現に変換すると、それぞれ「40B9999A」及び「40800000」(ともに16進数)である。改ざん検出対象領域ID1001が「3」の場合、重心1002が(8,2.1)であるため、「8」及び「2.1」を計算機内部の表現に変換すると、それぞれ「41000000」及び「40066666」(ともに16進数)である。以後、同様に重心1002を計算機内部の表現に変換する。そして、改ざん検出対象領域ID1001が「10」の場合、重心1002が(1.8,1.2)であるため、「1.8」及び「1.2」を計算機内部表現に変換すると、それぞれ「3FE66666」及び「3F99999A」(ともに16進数)である。
次に、メモリ202に格納された数字を結合したものを文書特徴量として生成する。図9Bに示す例では、文書特徴量、「00010003000A4040000040A0000040B9999A408000004100000040066666・・・3FE666663F99999A」が生成される。
なお、図9Bに示す例では、文書特徴量、改ざん検出対象領域レコード番号、及び重心の個数を4桁の16進数で表現しているが、他の桁数の16進数で表現してもよい。例えば、重心1002と同様に、8桁の16進数で表現してもよい。
ステップ606では、文書特徴量抽出装置103は、ステップ605で生成された文書特徴量を文書作成端末102に送信する(606)。
本発明の文書作成システムは、文書から抽出する文書特徴量を適宜プログラムとして選択可能であるため、システムの動作中に動的にシステムを変更することができる。
また、本発明の文書作成システムは、文書特徴量に重心を用いるため、にじみ及びトナーの飛び散りに頑健であり、にじみ及びトナーの飛び散りが発生した場合にも、改ざんと区別することができる。
以上、本発明の文書作成システム101の説明である。本発明の文書作成システム101を用いることによって、文書作成端末102の操作者(文書作成者)は、文書特徴量が地紋透かしによって埋め込まれた文書を取得することができる。しかし、取得した文書が流通する間に改ざんされる危険が存在する。
そこで、次に、文書が流通する間に改ざんが行われたかどうかを検証する文書検証システム111について説明する。
図1Bは、本発明の実施の形態の文書検証システム111の構成を示すブロック図である。
文書検証システム111は、文書の改ざんを検証するシステムであり、文書検証端末112、地紋透かし読取装置113、文書画像修正装置114、文書特徴量抽出装置103、改ざん検出装置115、及び改ざん検出対象DB装置108を備える。
文書検証端末112、地紋透かし読取装置113、文書画像修正装置114、文書特徴量抽出装置103、改ざん検出装置115、及び改ざん検出対象DB装置108は、それぞれネットワーク118によって接続され、ネットワーク118を介して情報を送受信する。
文書検証端末112は、文書検証システム111を制御する端末であり、例えば、図2に示すような一般的な計算機によって実現することができる。
地紋透かし読取装置113は、印刷された文書の地紋透かしを読み取り、埋め込まれている情報を読み取る装置である。
文書画像修正装置114は、地紋透かし読取装置113が読み取った情報と、印刷された文書をスキャンした画像(文書画像)とを用いて、文書画像を修正する装置である。
改ざん検出装置115は、文書の改ざんを検出する装置であり、例えば、図2に示すような一般的な計算機によって実現することができる。改ざん検出装置115は、改ざん検出プログラム116、重心利用タイプ文書特徴量比較プログラム117、細線化重心利用タイプ文書特徴量比較プログラム121、及び文書特徴量タイプテーブル120を含み、各プログラムを実行することによって、改ざん検出装置115の機能を実現することができる。
改ざん検出プログラム116は、改ざん検出装置115を制御する。重心利用タイプ文書特徴量比較プログラム117は、重心利用タイプを用いて文書画像から抽出された文書特徴量と、印刷された文書に埋め込まれている情報から取得した文書特徴量とを比較する。細線化重心利用タイプ文書特徴量比較プログラム121は、細線化重心利用タイプを用いて、文書画像から抽出された文書特徴量と、印刷された文書に埋め込まれている情報から取得した文書特徴量とを比較する。
文書特徴量タイプテーブル120は、図1Aに示す文書特徴量タイプテーブル120と同じであるため、説明を省略する。
なお、改ざん検出装置115の構成が文書検証端末112に実装され、文書検証端末112が改ざん検出装置115の機能を実現してもよい。
文書特徴量抽出装置103及び改ざん検出対象DB装置108は、図1Aに示す文書作成システム101の文書特徴量抽出装置103及び改ざん検出対象DB装置108と同じ構成であるため、説明を省略する。
なお、文書検証端末112、地紋透かし読取装置113、文書画像修正装置114、文書特徴量抽出装置103、改ざん検出装置115、及び改ざん検出対象DB装置108は、図2に示すハードウェアの構成と同じ構成を備える。
なお、文書検証端末112、地紋透かし読取装置113、文書画像修正装置114、文書特徴量抽出装置103、改ざん検出装置115、及び改ざん検出対象DB装置108は、それぞれ別装置として記載したが一つのハードウェアに実装されてもよい。
図10は、本発明の実施の形態の文書検証処理のフローチャートである。
図10に示される文書検証フローは、文書検証システム111に備わる各装置のメモリ202に格納されているプログラムをCPU201が実行することによって実行される。
まず、文書検証端末112は、文書検証者から、改ざんを検証する文書(検証対象文書)を受け付ける。そして、受け付けた検証対象文書をスキャンし、検証対象文書画像を生成する(1101)。なお、検証対象文書のスキャンには、文書検証端末112に備わるスキャナ207が用いられる。
次に、文書検証端末112は、文書検証者から、閾値の設定及び改ざん検出の指示を受け付ける(1102)。ここで、設定される閾値は、後述する改ざんの有無を判定する処理に用いられる値であり、例えば、「100」等の値が設定される。改ざん検出の指示は、例えば、文書検証端末112のキーボード205から入力される。
次に、文書検証端末112は、ステップ1101で生成された検証対象文書画像を地紋透かし読取装置113に送信する(1103)。
次に、地紋透かし読取装置113は、ステップ1103で送信された検証対象文書画像から、透かしデータ及び領域規定情報1100を抽出し、抽出された透かしデータ及び領域規定情報1100を文書検証端末112に送信する(1104)。
具体的には、地紋透かし読取装置113は、特開2006−279640号公報に開示されている情報読み取り装置601を用いることによって、本発明の透かしデータ及び領域規定情報1100を抽出することができる。特開2006−279640号公報の図6には、情報読み取り装置601の処理が開示されており、印刷文書画像データ621が印刷文書入力処理部611の出力として記載されている。
本発明の検証対象文書画像は、特開2006−279640号公報に開示されている印刷文書画像データ621と同じである。すなわち、特開2006−279640号公報の情報読み取り装置601のメモリ又はハードディスクに、本発明の検証対象文書画像が格納される。特開2006−279640号公報の情報読み取り装置601は、格納された本発明の検証対象文書画像を印刷文書画像データ621として扱うことができる。
また、本発明の透かしデータは、特開2006−279640号公報の情報読み取り装置601から出力される読み取り情報623と同じである。また、本発明の領域規定情報1100は、特開2006−279640号公報の領域規定情報構成処理部904から出力される領域規定情報713と同じである。本発明の透かしデータ及び領域規定情報1100がメモリ又はハードディスクに格納されるようにプログラムが追加された特開2006−279640号公報の情報読み取り装置601が用いられる。
なお、特開2006−279640号公報に開示されている領域規定情報713は、情報埋め込み装置201によって領域規定点群領域311に配置された情報に基づいて抽出される。領域規定点群領域311には、横方向(X軸方向)に規則正しく並んだ複数の微小点(所定の間隔の画素に配置された微小点)と、縦方向(Y軸方向)に規則正しく並んだ複数の微小点(所定の間隔の画素に配置された微小点)とが領域規定点321として配置される。配置された領域規定点321の情報は、メモリ又はハードディスク等に保持される。保持されている領域規定点321の情報と、印刷文書画像データ621から読み取られる領域規定点群領域311内の微小点の情報とを対応付けることによって、領域規定情報713が抽出される。
領域規定情報1100について、図11Aを用いて説明する。図11Aは、本発明の実施の形態の領域規定情報1100の例を示した説明図である。
領域規定情報1100は、領域座標1201及び検証対象文書画像座標1202を含む。
領域座標1201は、検証対象文書の所定の領域に予め配置された複数の点の座標であり、予め配置された複数の点の相対的な座標が用いられる。また、領域座標1201は、予め複数の点が配置される画素の座標が用いられてもよい。検証対象文書画像座標1202は、検証対象文書画像の所定の領域から読み取られた点の座標であり、実際にスキャンされた検証対象文書画像から抽出される。なお、領域規定情報1100の1行分のデータを一つのエントリとする。
図11Bは、領域座標1201の各座標を模式的に表現した説明図である。図11Cは、検証対象文書画像座標1202の各座標を模式的に表現した説明図である。すなわち、理想的には図11Bのように印刷された文書が、流通後に文書のしわ等の影響を受けて、図11Cのように検証対象文書画像がスキャンされたことを示す。
ステップ1105では、文書検証端末112は、検証対象文書画像及びステップ1104で抽出された領域規定情報1100を文書画像修正装置114に送信する。
次に、文書画像修正装置114は、ステップ1105で送信された領域規定情報1100を用いて検証対象文書画像を修正し、修正された検証対象文書画像を修正画像として文書検証端末112に送信する(1106)。ステップ1106では、図11Cに示すようにスキャンされた検証対象文書画像を、図11Bに示すように修正し、修正された検証対象文書画像を修正画像として送信する。なお、ステップ1106の処理は、図12を用いて後述する。
次に、文書検証端末112は、ステップ1104で抽出された透かしデータから、文書特徴量タイプ、改ざん検出対象領域レコード番号、及び埋め込み特徴量を抽出する(1107)。埋め込み特徴量とは、文書特徴量タイプに応じて、文書特徴量に用いられる情報である。例えば、重心利用タイプを用いる場合には、重心の座標の情報である。なお、ステップ1107の処理は、図14を用いて後述する。
次に、文書検証端末112は、ステップ1107で抽出された文書特徴量タイプ及び改ざん検出対象領域レコード番号と、ステップ1106で送信された修正画像とを文書特徴量抽出装置103に送信する(1108)。
次に、文書特徴量抽出装置103は、ステップ1108で送信された修正画像から、文書特徴量タイプ及び改ざん検出対象領域レコード番号に基づいて重心の座標を計算し、計算された重心の座標を修正画像特徴量として文書検証端末112に送信する(1109)。なお、ステップ1109の処理は、図3のステップ305と同じ処理である。
次に、文書検証端末112は、文書特徴量タイプ、ステップ1107で抽出された埋め込み特徴量、ステップ1109で抽出された修正画像特徴量、及びステップ1102で設定された閾値を改ざん検出装置115に送信する(1110)。
次に、改ざん検出装置115は、ステップ1110で送信された閾値に基づいて、埋め込み特徴量と、修正画像特徴量とを比較し、改ざんの有無を判定する。そして、判定結果を文書検証端末112に送信する(1111)。なお、ステップ1111の処理は、図15を用いて後述する。
次に、文書検証端末112は、ステップ1111で送信された判定結果を画面206に表示する(1112)。なお、ステップ1112の処理は、図18を用いて後述する。
なお、ステップ1101では、文書検証端末112は、検証対象文書を直接受け付けているが、検証対象文書を識別する識別子を受け付けてもよい。この場合、受け付けた識別子に基づいて、検証対象文書が読み出される。読み出される検証対象文書は、例えば、文書検証端末112に備わるハードディスク209及び文書検証端末112に接続されるハードディスク209等に格納される。
なお、ステップ1104では、地紋透かし読取装置113は、抽出された透かしデータ及び領域規定情報1100を文書検証端末112に送信しているが、抽出された透かしデータ及び領域規定情報1100と、検証対象文書画像とを文書画像修正装置114に送信してもよい。この場合、処理はステップ1105を省略し、ステップ1106に進む。
図12は、本発明の実施の形態の文書画像修正装置114による処理のフローチャートであり、図10のステップ1106で実行される処理の説明を示す。
まず、文書画像修正装置114は、領域規定情報1100に含まれる領域座標1201のx座標の最大値xm及びy座標の最大値ymを求める(1301)。例えば、図11Aに示す領域規定情報1100の場合、x座標の最大値xmは「2」であり、y座標の最大値ymは「2」である。
次に、文書画像修正装置114は、予め設定された値gx及び値gyを用いて、横(xm×gx+1)画素及び縦(ym×gy+1)画素の修正中画像を作成する(1302)。
ここで、値gx及び値gyは、例えば、gx=60及びgy=60に設定することができる。また、値gx及び値gyは、領域規定情報1100に基づいて設定されてもよい。図12Aに示す検証対象文書画像座標1202の場合、特開2006−279640号公報に開示されている情報埋め込み装置201によって配置された領域規定点321の所定の画素の間隔に基づいて設定することができる。このように、修正中画像を作成する処理は、計算機内のメモリ202に所定の大きさの領域を確保し、修正中画像の大きさ等の情報を格納する処理である。
次に、文書画像修正装置114は、ステップ1302で作成された修正中画像の各画素のうち、処理が終了していない画素があるか否かを判定する(1303)。修正中画像の少なくとも一つの画素について処理が終了していないと判定された場合、修正中画素内で処理が終了していない画素(処理対象画素)を取り出し、処理はステップ1304に進む。一方、修正中画像の全ての画素について処理が終了したと判定された場合、処理はステップ1305に進む。
次に、文書画像修正装置114は、領域規定情報1100に基づいて、ステップ1303で取り出された処理対象画素の内部補間処理を行い、検証対象文書画像内の対応する画素を修正中画像内の処理対象画素にコピーする(1304)。内部補間処理について、図13A及び図13Bを用いて説明する。
図13A及び図13Bは、本発明の実施の形態の内部補間処理の例を示す説明図である。
図13Aに示す処理対象画素1401は、修正中画像内で処理の対象となる画素であり、図13Bに示す対応画素1402は、検証対象文書画像内で処理対象画素1401に対応する画素である。処理対象画素1401と対応画素1402との対応は以下のように特定する。
まず、処理対象画素1401の周りの領域座標1201を求める。図13Aに示す例では、処理対象画素1401の周囲に模式的に示した四つの領域座標1201の点が対応する。次に、処理対象画素1401が、領域座標1201をどのように内分しているかを調べる。図13Aに示す例では、処理対象画素1401は、領域座標1201をX軸方向に1:1−s、Y軸方向にt:1−tに内分している。
次に、領域規定情報1100を用いて、領域座標1201に対応する検証対象文書画像座標1202を求める。例えば、図13Bに示す例では、検証対象文書画像が少しゆがんでいるとする。次に、求めた四つの検証対象文書画像座標1202によってつくられる4辺を、領域座標の内分比と同じ比で内分する。そして、四つの内分点のうち、隣り合わない辺に属する二つの内分点を直線で結び、二つの直線の交点の画素を検証対象文書画像の対応画素1402とする。そして、対応画素1402の色及び濃度と同等になるよう、対応画素1402を処理対象画素1401に複製する。
ステップ1305では、文書画像修正装置114は、ステップ1304で内部補間処理が行われた修正中画像を修正画像として文書検証端末112に送信する。
図14は、本発明の実施の形態の透かしデータの解釈処理のフローチャートであり、図10のステップ1107で実行される処理の説明を示す。
まず、文書検証端末112は、透かしデータから特徴量タイプと及び改ざん検出対象領域レコード番号を抽出する(1501)。
透かしデータから抽出する処理は、まず、透かしデータが、暗号化されている場合には、透かしデータを復号化することによって文書特徴量を取得する。また、透かしデータに電子署名が付与されている場合には、電子署名を検証することによって文書特徴量を取得する。また、透かしデータにタイムスタンプが付与されている場合には、タイムスタンプを検証することによって文書特徴量を取得する。
次に、取得した文書特徴量から、図9Bに示すように計算機内部の表現で表わされている16進数の情報の初めの4桁を特徴量タイプとして抽出し、続く4桁の情報を改ざん検出対象領域レコード番号として抽出する。文書特徴量は固定長であるため、このように特定の部分から、特徴量タイプ及び検出対象領域レコード番号を抽出することができる。
次に、文書検証端末112は、ステップ1501で抽出された特徴量タイプが「1」であるか否かを判定する(1502)。ここで、特徴量タイプが「1」であるとは、重心利用タイプであることを示す。
特徴量タイプが「1」であると判定された場合、処理はステップ1503に進む。一方、特徴量タイプが「1」でないと判定された場合、処理はステップ1507に進む。
次に、文書検証端末112は、ステップ1502で取得した文書特徴量から、改ざん検出対象領域レコード番号に続く4桁の情報を重心の個数として抽出する(1503)。
次に、文書検証端末112は、ステップ1502で取得した文書特徴量から、抽出されていない重心があるか否かを判定する(1504)。少なくとも一つの重心が抽出されていないと判定した場合、ステップ1502で取得した特徴量から、重心の個数に続く情報を重心として抽出し、処理は1505に進む。一方、全ての重心を抽出したと判定した場合、処理はステップ1506に進む。なお、重心の個数に続く情報を重心として抽出する場合、重心は8桁の情報で表現されるX座標と、8桁の情報で表現されるY座標とを含むため、16桁の情報を一つの重心として抽出する。
次に、文書検証端末112は、ステップ1503で抽出された重心を重心リスト900に追加する(1505)。重心リスト900は、図9Aで示した重心リスト900と同じ形式が用いられる。
ステップ1506では、文書検証端末112は、特徴量タイプ、改ざん検出対象領域レコード番号、及びステップ1505で作成された重心リスト900を解釈結果として返す。
ステップ1507では、文書検証端末112は、不明な特徴量タイプとしてエラーを返す。
なお、ステップ1502では、特徴量タイプが「1」であるか否か、すなわち、特徴量タイプが重心利用タイプであるか否かを判定しているが、他の特徴量タイプに対応する特徴量抽出プログラムを実行する場合、他の特徴量タイプであるか否かを判定してもよい。
図15は、本発明の実施の形態の改ざん検出処理のフローチャートであり、図10のステップ1111で実行される処理の説明を示す。
まず、改ざん検出装置115は、特徴量タイプを用いて文書特徴量タイプテーブル120を参照し、特徴量タイプに応じた特徴量比較プログラムを起動する(1601)。特徴量比較プログラムとは、埋め込み特徴量と修正画像特徴量とを比較するために実行されるプログラムであり、例えば、重心利用タイプ文書特徴量比較プログラム117及び細線化重心利用タイプ文書特徴量比較プログラム121を含む。本実施の形態では、重心利用タイプ特徴量比較プログラム117を起動する場合について説明する。
次に、改ざん検出装置115は、改ざん検出対象領域レコード番号に基づいて、改ざん検出対象DB装置108にアクセスし、改ざん検出対象領域レコード600を取得する(1602)。改ざん検出対象領域レコード600を取得することによって、図6Bに示す改ざん検出対象領域が決定される。
次に、改ざん検出装置115は、ステップ1602で取得した改ざん検出対象領域レコード600のエントリ(改ざん検出対象領域)のうち、処理が終了していないエントリがあるか否かを判定する(1603)。少なくとも一つのエントリについて処理が終了していないと判定された場合、処理はステップ1604に進む。一方、全てのエントリについて処理が終了したと判定された場合、処理はステップ1607に進む。
次に、改ざん検出装置115は、ステップ1601で起動した特徴量比較プログラムを用いて、埋め込み特徴量と修正画像特徴量とを比較し、埋め込み特徴量と修正画像特徴量との差を算出する(1604)。なお、ステップ1604の処理は、図16を用いて後述する。
次に、改ざん検出装置115は、ステップ1604で算出された埋め込み特徴量と修正画像特徴量との差が、閾値より大きいか否かを判定する(1605)。埋め込み特徴量と修正画像特徴量との差が閾値より大きいと判定された(改ざんが検出された)場合、処理はステップ1606に進む。一方、埋め込み特徴量と修正画像特徴量との差が閾値以下であると判定された(改ざんが検出されなかった)場合、処理はステップ1603に戻り、次のエントリの処理を行う。
次に、改ざん検出装置115は、ステップ1604で算出された埋め込み特徴量と修正画像特徴量との差を、改ざん検出結果データ1700に格納する(1606)。ここで、改ざん検出結果データ1700の例を図17に示す。
図17は、本発明の実施の形態の改ざん検出結果データ1700の例を示す説明図である。
改ざん検出結果データ1700は、改ざん検出対象領域ID1801及び差1802を含む。改ざん検出対象領域ID1801は、改ざんが検出されたと判定された改ざん検出対象領域の識別子であり、図6Aに示す改ざん検出対象領域ID701に対応する。差1802は、埋め込み特徴量と修正画像特徴量との差の大きさである。なお、改ざん検出結果データ1700の1行分のデータを一つのエントリとする。
図17に示す例では、三つの改ざん検出対象領域で改ざんが検出されており、改ざん検出対象領域ID1801が「2」、「3」、及び「10」の埋め込み特徴量と修正画像特徴量との差は、それぞれ「120」、「125」、及び「110」である。
ステップ1607では、改ざん検出装置115は、ステップ1606で格納された改ざん検出結果データ1700を文書検証端末112に送信する。
図16は、本発明の実施の形態の重心利用タイプ特徴量比較プログラムによる処理のフローチャートであり、図15のステップ1604で実行される処理の説明を示す。
まず、改ざん検出装置115は、埋め込み特徴量に含まれる重心と、修正画像特徴量に含まれる重心との距離を算出する(1701)。ここで、算出される距離は、例えば、ユークリッド距離であり、埋め込み特徴量に含まれる重心を(x0,y0)、修正画像特徴量に含まれる重心を(x1,y1)とする場合、距離d=sqrt((x1−x0)×(x1−x0)+(y1−y0)×(y1−y0))によって距離が算出される。ここで、sqrt(x)は、xの二乗根である。また、距離dは、d=|x1−x0|+|y1−y0|によって算出されてもよい。ここで、|x|はxの絶対値である。
次に、改ざん検出装置115は、ステップ1701で算出された距離を定数N1で除算し、定数N2を乗算することによって標準化距離を算出する(1702)。N1及びN2は、埋め込み特徴量に含まれる重心と、修正画像特徴量に含まれる重心との差を、所定の値(例えば、100)に標準化するために設定される定数であり、例えば、N1=2及びN2=100に設定することができる。
次に、改ざん検出装置115は、ステップ1702で算出された標準化距離を結果として返す(1703)。
図18は、本発明の実施の形態の改ざん検出結果表示処理のフローチャートであり、図10のステップ1112で実行される処理の説明を示す。
まず、文書検証端末112は、改ざん検出結果データ1700に格納されている改ざん検出対象領域ID1901及び改ざん検出対象領域レコード番号に基づいて、改ざん検出対象DB装置108にアクセスし、改ざん検出対象領域ID1901に対応するエントリを取得する(1901)。
次に、文書検証端末112は、ステップ1901で取得したエントリのうち、処理が終了していないエントリがあるか否かを判定する(1902)。少なくとも一つのエントリについて処理が終了していない場合、処理が終了していないエントリ(改ざん検出対象領域)を取り出し、処理はステップ1903に進む。一方、ステップ1901で取得した全てのエントリについて処理が終了したと判定された場合、処理は終了する。
次に、文書検証端末112は、ステップ1902で取り出された改ざん検出対象領域の始点及び終点を、改ざん検出対象領域レコード600から取得する(1903)。
次に、文書検証端末112は、ステップ1903で取得した改ざん検出対象領域の始点及び終点に基づいて、検証対象文書の修正画像の改ざん検出対象領域を強調して表示する(1904)。そして、処理はステップ1902に戻り、次のエントリを処理する。
改ざん検出対象領域を強調して表示する例を、図19に示す改ざん検出結果画面を用いて説明する。
改ざん検出結果画面は、表示部2001及び警告表示部2004を含む。表示部2001は、修正画像を表示する部分であり、検出領域2002及び検出領域2003を含む。検出領域2002及び検出領域2003は、改ざんが検出された改ざん検出対象領域である。警告表示部2004は、改ざんが検出されたことを警告する表示部分である。
図19に示す例では、納税証明書に記載されている金額の改ざんが検出されたことを示している。また、警告表示部2004には、「改ざんが検出されました」という警告を表示している。
本実施の形態では、文書検証システム111を用いることによって、文書検証端末112の操作者(管理者)は、文書が流通している間に改ざんが行われたか否かを検証することが可能である。
また、本発明の文書検証システムは、文書から抽出する文書特徴量を適宜プログラムとして選択可能であるため、システムの動作中に動的にシステムを変更することができる。
以上、本実施の形態について説明したが、文書特徴量タイプとして、細線化重心利用タイプを用いる場合について説明する。
細線化重心利用タイプの場合、特徴量抽出プログラムとして細線化重心利用タイプ文書特徴量抽出プログラム119が用いられ、特徴量比較プログラムとして細線化重心利用タイプ文書特徴量比較プログラム121が用いられる。
図3のステップ304で細線化重心利用タイプ文書特徴量抽出プログラム119が起動された場合、図5に示すフローチャートのステップ603とステップ604との間に細線化処理が実行される。
細線化処理は、例えば、C.J.Hilditchによる“Linear skelton from square cupboards,”Machine Intelligence, 4, B, Edinbourgh Univ. Press, 1967, pp. 403-420.に開示されているHilditchの方式を用いて実現することができる。
また、図14に示す透かしデータの解釈処理のステップ1502では、文書検証端末112は、特徴量タイプが「2」であるか否かを判定する。
細線化重心利用タイプを用いると、細線化処理を実行した後に重心を算出するため、重心利用タイプを用いる場合と比較して、にじみに強い効果がある。
なお、本実施の形態は、カラー文書及びカラー階調を含む文書を文書データとして用いてもよい。この場合、文書画像を2値化することによって、本実施の形態を適用することが可能である。
本発明の実施の形態の文書作成システムの構成を示すブロック図である。 本発明の実施の形態の文書検証システムの構成を示すブロック図である。 本発明の実施の形態の文書特徴量抽出装置のハードウェアの構成を示すブロック図である。 本発明の実施の形態の文書作成処理のフローチャートである。 本発明の実施の形態の文書特徴量タイプテーブルの説明図である。 本発明の実施の形態の重心利用タイプの文書特徴量の抽出処理のフローチャートである。 本発明の実施の形態の改ざん検出対象DBに格納されるレコードの例の説明図である。 本発明の実施の形態の検出対象領域レコードによって特定される改ざん検出対象領域の説明図である。 本発明の実施の形態の重心の計算例を示す説明図である。 本発明の実施の形態の重心利用タイプ文の書特徴量の例を示す説明図である。 本発明の実施の形態の重心利用タイプ文の書特徴量の例を示す説明図である。 本発明の実施の形態の重心リストの説明図である。 本発明の実施の形態の特徴量の例を示す説明図である。 本発明の実施の形態の文書検証処理のフローチャートである。 本発明の実施の形態の領域規定情報の例を示した説明図である。 本発明の実施の形態の領域座標を模式的に表現した説明図である。 本発明の実施の形態の検証対象文書画像座標を模式的に表現した説明図である。 本発明の実施の形態の文書画像修正装置による処理のフローチャートである。 本発明の実施の形態の内部補間処理の例を示す説明図である。 本発明の実施の形態の内部補間処理の例を示す説明図である。 本発明の実施の形態の透かしデータの解釈処理のフローチャートである。 本発明の実施の形態の改ざん検出処理のフローチャートである。 本発明の実施の形態の重心利用タイプ特徴量比較プログラムによる処理のフローチャートである。 本発明の実施の形態の改ざん検出結果データの例を示す説明図である。 本発明の実施の形態の改ざん検出結果表示処理のフローチャートである。 本発明の実施の形態の改ざん検出結果画面の例を示す説明図である。
符号の説明
101 文書作成システム
102 文書作成端末
103 文書特徴量抽出装置
104 文書特徴量抽出プログラム選択プログラム
105 重心利用タイプ文書特徴量抽出プログラム
106 透かしデータ作成装置
107 地紋透かし埋込装置
108 改ざん検出対象DB装置
109 改ざん検出対象DB
110 文書作成システム内ネットワーク
111 文書検証システム
112 文書検証端末
113 地紋透かし読取装置
114 文書画像修正装置
115 改ざん検出装置
116 改ざん検出プログラム
117 重心利用タイプ文書特徴量比較プログラム
118 文書検証システム内ネットワーク
119 細線化重心利用タイプ文書特徴量抽出プログラム
121 細線化重心利用タイプ文書特徴量比較プログラム
201 CPU
202 メモリ
203 インターフェース
204 ネットワークインターフェース
205 キーボード
206 画面
207 スキャナ
208 プリンタ
209 ハードディスク
210 時計

Claims (10)

  1. ネットワークに接続されるインターフェースと、前記インターフェースに接続されるプロセッサと、前記プロセッサに接続されるメモリと、を備え、文書の作成を支援する文書作成支援システムにおいて、
    作成された文書から特徴量を抽出する領域が定められている改ざん検出対象領域情報を保持し、
    前記作成された文書から、前記改ざん検出対象領域情報に定められている領域内の画素の位置情報を算出し、
    前記算出された位置情報に基づいて、前記作成された文書の特徴量を生成し、
    前記生成された特徴量を、前記文書に記録することを特徴とする文書作成支援システム。
  2. 前記特徴量を抽出する文書、前記文書の特徴量の抽出方法、及び前記改ざん検出対象領域情報の指定をそれぞれ受け付け、
    前記指定された改ざん検出対象領域情報を取得し、
    前記指定された特徴量の抽出方法に対応するプログラムを起動し、
    前記起動されたプログラムによって、前記指定された文書から、前記取得した改ざん検出対象領域情報に定められている領域内の画素の位置情報を算出し、
    前記生成された特徴量から、透かしデータを作成し、
    前記作成された透かしデータを前記文書に記録することを特徴とする請求項1に記載の文書作成支援システム。
  3. 前記領域内の画素の位置情報は、前記領域内の画素の重心であることを特徴とする請求項1又は2に記載の文書作成支援システム。
  4. 前記指定された文書から、前記取得した改ざん検出対象領域情報に定められている領域の画像を生成し、
    前記生成された画像の領域内の画素の位置情報を算出し、
    前記算出された画素の位置情報、前記指定された特徴量の抽出方法、及び前記指定された改ざん検出対象領域情報を含む特徴量を生成することを特徴とする請求項2に記載の文書作成支援システム。
  5. 前記改ざん検出対象領域情報には、少なくとも一部が重なっている複数の領域が定められていることを特徴とする請求項1に記載の文書作成支援システム。
  6. 前記改ざん検出対象領域情報に定められた領域内の画素によって構成される線を細線化し、
    前記細線化された画素領域の位置情報を算出することを特徴とする請求項1に記載の文書作成支援システム。
  7. ネットワークに接続されるインターフェースと、前記インターフェースに接続されるプロセッサと、前記プロセッサに接続されるメモリと、を備え、文書の改ざんを検証する文書検証システムにおいて、
    検証する文書から特徴量を抽出する領域が定められている改ざん検出対象領域情報を保持し、
    前記検証する文書を受け付け、
    前記受け付けた識別子によって特定される文書から、透かしデータを抽出し、
    前記抽出された透かしデータから、前記文書の第1特徴量を取得し、
    前記文書から、前記改ざん検出対象領域情報に定められている領域内の画素の位置情報を算出し、
    前記算出された位置情報に基づいて、前記文書の第2特徴量を生成し、
    前記取得した第1特徴量と前記生成された第2特徴量とを比較することによって、前記文書の改ざんを検証することを特徴とする文書検証システム。
  8. 前記領域内の画素の位置情報は、前記領域内の画素の重心であることを特徴とする請求項7に記載の文書検証システム。
  9. 前記改ざん検出対象領域情報に定められた領域内の画素によって構成される線を細線化し、
    前記細線化された画素領域の位置情報を算出することを特徴とする請求項7に記載の文書検証システム。
  10. 前記文書の所定の領域に予め複数の点が配置される画素の座標を領域座標として保持し、
    前記領域座標のX座標の最大値及びY座標の最大値を取得し、
    前記取得したX座標の最大値及びY座標の最大値に基づいて修正画像を作成し、
    前記作成された修正画像から、前記改ざん検出対象領域情報に定められている領域内の画素の位置情報を算出することを特徴とする請求項7に記載の文書検証システム。
JP2008110267A 2008-04-21 2008-04-21 文書作成支援システム及び文書検証システム Pending JP2009260886A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008110267A JP2009260886A (ja) 2008-04-21 2008-04-21 文書作成支援システム及び文書検証システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008110267A JP2009260886A (ja) 2008-04-21 2008-04-21 文書作成支援システム及び文書検証システム

Publications (1)

Publication Number Publication Date
JP2009260886A true JP2009260886A (ja) 2009-11-05

Family

ID=41387690

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008110267A Pending JP2009260886A (ja) 2008-04-21 2008-04-21 文書作成支援システム及び文書検証システム

Country Status (1)

Country Link
JP (1) JP2009260886A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010081214A (ja) * 2008-09-25 2010-04-08 Hitachi Ltd 文書特徴量抽出装置及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010081214A (ja) * 2008-09-25 2010-04-08 Hitachi Ltd 文書特徴量抽出装置及び方法

Similar Documents

Publication Publication Date Title
EP1667422A1 (en) Printed matter processing system, watermark-containing document printing device, watermark-containing document read device, printed matter processing method, information read device, and information read method
US7949175B2 (en) Counterfeit deterrence using dispersed miniature security marks
JP2005328528A (ja) デジタル像符牒の処理方法及びシステム
US8422043B2 (en) Watermarked document reading apparatus with improved error processing
JP2001078006A (ja) 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置
CA2618738C (en) System and method for embedding dispersed miniature security marks
JP2008227930A (ja) 画像形成装置及び方法
JP2006245980A (ja) 画像処理方法、改ざん検出方法、画像処理装置、改ざん検出装置、画像処理プログラム、改ざん検出プログラムおよび記録媒体
EP1626565A1 (en) Printed document falsification detection device and falsification detection method
JP4426617B2 (ja) 符号化されたドットを使用したドキュメントの改ざん検知方法
US11979537B1 (en) Incorporation of source-identifying information in scanned documents
US7676058B2 (en) System and method for detection of miniature security marks
JP4958868B2 (ja) 文書特徴量抽出装置及び方法
JP4469301B2 (ja) 情報埋め込み装置、印刷用媒体、および、情報読み取り装置
JP2009260886A (ja) 文書作成支援システム及び文書検証システム
JP2009033356A (ja) 画像形成装置及び画像形成方法
JP2005341493A (ja) 情報埋め込み装置、情報検出装置、情報埋め込み・検出システム、情報埋め込み方法、情報検出方法、情報埋め込み・検出、情報埋め込みプログラム、情報検出プログラム、情報埋め込み・検出プログラムおよび記録媒体
US7792324B2 (en) System and method for embedding miniature security marks
JP2009200794A (ja) 文書の改竄検出プログラム及び改竄検出装置
JP2009060216A (ja) 画像処理装置及び画像処理プログラム
JP5128563B2 (ja) 文書検証システム、文書検証方法、文書検証プログラム及び記録媒体
CN118396825A (zh) 数字水印添加方法、数字水印检测方法及相关设备
JP4158681B2 (ja) 画像処理システム
JP5089800B2 (ja) 付加画像生成装置及び付加画像生成方法
JP2008219705A (ja) 画像処理装置、画像処理方法、画像処理プログラム