JP2007156896A - 文書電子化装置および文書電子化方法 - Google Patents

文書電子化装置および文書電子化方法 Download PDF

Info

Publication number
JP2007156896A
JP2007156896A JP2005352319A JP2005352319A JP2007156896A JP 2007156896 A JP2007156896 A JP 2007156896A JP 2005352319 A JP2005352319 A JP 2005352319A JP 2005352319 A JP2005352319 A JP 2005352319A JP 2007156896 A JP2007156896 A JP 2007156896A
Authority
JP
Japan
Prior art keywords
document
paper
unique information
paper document
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005352319A
Other languages
English (en)
Inventor
Tetsuya Kimura
哲也 木村
Tadashi Shimizu
正 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005352319A priority Critical patent/JP2007156896A/ja
Publication of JP2007156896A publication Critical patent/JP2007156896A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】電子文書が原本の紙文書から電子化されたことを客観的に保証可能な文書電子化装置を提供する。
【解決手段】紙文書を読み取るスキャナ110にて紙文書を読み取り、処理装置120において、読み取られた紙文書が形成された紙媒体上の第2の領域から、紙媒体の一意の特徴を表す固有情報を取得し、紙文書が電子化された文書データと、紙文書が形成された紙媒体上の第1の領域から取得された紙媒体の一意の特徴を表す固有情報とが相互に関連付けて記憶された紙文書情報登録データベース130から、取得された固有情報に対応する固有情報を検索して取得し、取得された固有情報と、紙文書情報登録データベース130から取得された固有情報とを照合部にて照合し、この照合結果に基づいて、スキャナ110にて読み取られた紙文書と、データベースに記憶されている紙文書との同一性を判定する。
【選択図】図1

Description

本発明は、紙等の媒体に記録された文書を電子化する文書電子化装置等に関する。
近年、紙等の媒体に記録された文書(紙文書)を保管する方法として、紙文書そのものを保管するのではなく、その紙文書を電子データ化して保管する形態が普及している。このような保管形態は、オフィスの省スペース化や紙文書の共有化が容易に図れることから、利便性が高いものである。これに対して、紙文書を閲覧したり、配布したりして、紙文書を利用する際には、保管された電子データを印刷して利用することも行われている。これは、紙媒体に印刷されることにより、閲覧がし易く、また可搬性が高いという紙媒体の長所に基づくものである。そのため、紙ベースでの取り扱いも継続して行なう必要のあるものである。したがって、紙文書と電子データとの整合性を取り、その原本性を確認する技術が重要となっている。
紙文書を電子データ化した際の原本性を確認する技術として、次のようなものが提案されている。例えば、入力した電子文書の内容をOCR技術により読み取り、読み取ったOCR結果に対するハッシュ値を原本性確認情報としてサーバ上に保存するとともに、その保存場所を示すURLを、電子透かしを用いて電子文書に埋め込むようにする。それにより、紙文書と紙文書を電子化した電子文書との間の整合性を、電子署名を用いなくても確認することができるようにして、紙文書の原本性を、ネットワークを用いて効率的に確認することができるようにするという技術が存在する(例えば、特許文献1参照)。
また、スキャナとプリンタとの機能を併せ持つ複合機により、保管対象の紙文書をスキャンして電子文書を生成し、原本性を保証するための電子透かし等を生成した電子文書に付加して、電子文書保管装置に送信する。電子文書保管装置は、複合機から送られた電子文書を受信し、電子文書管理DBに格納し、電子文書を管理するための管理情報を生成して電子文書管理DBに格納する。一方、紙文書管理装置に紙文書が登録され、紙文書管理DBに管理情報が格納されると、電子文書保管装置は、電子文書管理DBの管理情報に、紙文書と電子文書とを対応付ける情報を設定するという技術が存在する(例えば、特許文献2参照)。
特開2004−185312号公報(第4−5頁) 特開2004−310463号公報(第10−12頁)
ところで、上記した特許文献1や特許文献2に記載された技術では、紙文書の電子文書に対する原本性を保証することは可能である。
しかしながら、これらの従来技術においては、紙文書を電子化した電子文書が原本である紙文書から電子化されていることを客観的に保証することは困難である。そのために、原本である紙文書を再利用することによる紙文書の偽造や、原本でない紙文書から電子原本を作成することによる紙文書の偽造を抑止することができなかった。
そこで本発明は、以上のような技術的課題を解決するためになされたものであり、その目的とするところは、電子文書が原本の紙文書から電子化されたことを客観的に保証可能な文書電子化装置を提供することにある。
かかる目的のもと、本発明の文書電子化装置は、紙文書を電子化する文書電子化装置であって、紙文書が電子化された文書データと、紙文書が形成された紙媒体上の第1の領域から取得された紙媒体の一意の特徴を表す固有情報とが相互に関連付けて記憶された記憶部と、紙文書を読み取る読取入力部と、読取入力部にて読み取られた紙文書が形成された紙媒体上の第2の領域から、紙媒体の一意の特徴を表す固有情報を取得する固有情報取得部と、固有情報取得部にて取得された固有情報と、記憶部に記憶されている固有情報とを照合することで、読取入力部にて読み取られた紙文書と、記憶部に記憶されている紙文書との同一性を判定する照合判定部とを備えたことを特徴としている。
ここで、固有情報取得部は、記憶部に記憶されている固有情報が取得される第1の領域全体を含み、かつ、第1の領域よりも大きな面積を有する前記第2の領域から、固有情報を取得することを特徴とすることができる。また、照合判定部は、第2の領域の中の第1の領域と同一の大きさを有する照合領域を設定し、照合領域での固有情報と、第1の領域での固有情報とを、照合領域を第2の領域の中で移動させながら比較照合し、第2の領域の中に第1の領域での固有情報と相関の高い固有情報が存在するか否かを探索することを特徴とすることもできる。
さらに、紙文書は、紙文書の識別情報を示すコード画像を含み、記憶部は、文書データおよび固有情報に関連付けて、紙文書に含まれるコード画像がコード化されたIDデータを記憶するとともに、読取入力部にて読み取られた紙文書からIDデータを取得する紙ID取得部と、紙ID取得部で取得されたIDデータに基づいて、記憶部に記憶されているIDデータと同一のIDデータを検索し、検索されたIDデータに関連付けられた固有情報を取得する登録固有情報取得部とをさらに備え、照合判定部は、登録固有情報取得部にて取得された固有情報と、固有情報取得部にて取得された固有情報とを照合することを特徴とすることもできる。
また、照合判定部が、読取入力部にて読み取られた紙文書と、記憶部に記憶されている紙文書とが同一であると判定した場合に、記憶部に記憶された文書データと読取入力部にて読み取られた紙文書の文書データとのいずれか一方または双方を表示する表示部をさらに備えたことを特徴とすることができる。
さらに、照合判定部が、読取入力部にて読み取られた紙文書と、記憶部に記憶されている紙文書とが同一であると判定した場合に、記憶部に記憶された文書データと読取入力部にて読み取られた紙文書の文書データとの同一性を判定する文書判定部をさらに備えたことを特徴とすることもできる。
加えて、記憶部に記憶される固有情報と固有情報取得部で取得される固有情報とは、紙媒体に光を照射した際の光反射率分布または光透過率分布に基づき取得されたことを特徴とすることもできる。
また、本発明を文書電子化方法として捉え、本発明の文書電子化方法は、紙文書を電子化してデータベースに記憶する文書電子化方法であって、紙文書を読み取る読取入力部にて紙文書を読み取り、読取入力部にて読み取られた紙文書が形成された紙媒体上の第2の領域から、紙媒体の一意の特徴を表す固有情報を固有情報取得部にて取得し、紙文書が電子化された文書データと、紙文書が形成された紙媒体上の第1の領域から取得された紙媒体の一意の特徴を表す固有情報とが相互に関連付けて記憶されたデータベースから、固有情報取得部にて取得された固有情報に対応する固有情報を検索して取得し、固有情報取得部にて取得された固有情報と、データベースから取得された固有情報とを照合部にて照合し、照合部での照合結果に基づいて、読取入力部にて読み取られた紙文書と、データベースに記憶されている紙文書との同一性を判定することを特徴としている。
ここで、紙文書は、紙文書の識別情報を示すコード画像を含み、データベースは、文書データおよび固有情報に関連付けて、紙文書のコード画像がコード化されたIDデータを記憶するとともに、読取入力部は紙文書からコード画像を読み取り、読取入力部にて読み取られたIDコードがコード化されたIDデータに基づいて、データベースから固有情報取得部にて取得された固有情報に対応する固有情報を検索することを特徴とすることができる。
また、読取入力部にて読み取られた紙文書と、データベースに記憶されている紙文書とが同一であると判定された場合に、読取入力部にて読み取られた紙文書の電子化された回数を、紙文書の文書データと関連付けてデータベースに記憶することを特徴とすることもできる。特に、読取入力部にて読み取られた紙文書と、データベースに記憶されている紙文書とが同一であると判定された場合であって、読取入力部にて読み取られた紙文書の電子化された回数が所定回数を超えている場合には、紙文書のデータベースへの記憶を禁止し、または、データベースに記憶されている紙文書を削除することを特徴とすることもできる。
また、データベースでは固有情報が所定の秘密鍵により暗号化されて記憶され、照合部では記憶部に記憶されている固有情報が秘密鍵と対をなす公開鍵により復号化されて照合されることを特徴とすることもできる。また、データベースはネットワーク上に構成され、照合部は、ネットワークを介してデータベースに記憶されている固有情報を取得することを特徴とすることもできる。
本発明によれば、電子文書が原本の紙文書から電子化されたことを客観的に保証することができる。そのため、原本である紙文書を再利用することによる紙文書の偽造や、原本でない紙文書から電子原本を作成することによる紙文書の偽造を抑止することが可能となる。さらには、原本である紙文書に加筆、修正されて電子化された場合に、原本である紙文書が更新されたことを管理することも可能となる。
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
図1は本実施の形態が適用される紙文書電子化装置の構成を示した図である。本実施の形態の紙文書電子化装置は、図1に示したデジタル複写機100の内部にて構築されている。本実施の形態の紙文書電子化装置を備えたデジタル複写機100は、図1に示すように、紙文書全体に対して光を走査し、紙文書からの反射光を光反射率信号に変換する紙文書情報入力部(読取入力部)の一例としてのスキャナ110、スキャナ110により読み取られた光反射率信号を処理して文書データや各種データに変換し、紙文書についての登録処理または照合処理を実行する処理装置120を備えている。また、処理装置120により処理された文書データや各種データを紙文書毎に相互に関連付けて記憶する記憶部の一例としての紙文書情報登録データベース130、処理装置120により生成された文書データ等や紙文書情報登録データベース130に記憶されている文書データ等を印刷する画像形成装置140、種々の情報を表示する表示部の一例としてのディスプレイ150を備えている。
ここで、本明細書における「文書データ」とは、テキストを含む「文書」を電子化したデータや、例えば絵、写真、図形等の画像データ等といった、一般的に文書として目視により情報を得るものを電子化データとしたものを意味する。
スキャナ110は、フラットベッド型であり、原稿台上に載置された紙文書を走査するライン状の照明により紙文書全体を光照射して、その反射光をCCDラインセンサにより光学的に読み取る。そして、紙文書上に形成されている文字や図形等の光反射率、さらには紙文書が形成された記録用紙自体の光反射率を電気信号(光反射率信号)に変換する。それにより、スキャナ110は、紙文書が形成された記録用紙の繊維質材料の絡み具合(表面凹凸)のランダム性に基づいて発生する、記録用紙の表面に分布している光反射率のランダムな変化(光反射率分布)をも読み取ることが可能である。
また、スキャナ110は、処理装置120の入出力ポートに接続されており、スキャナ110による原稿の読み取りは処理装置120によって制御される。さらに、スキャナ110が原稿を読み取ることによって得られた光反射率信号は処理装置120に入力される。
処理装置120は、演算処理を行うCPU(Central Processing Unit:中央処理装置)、スキャナ110や紙文書情報登録データベース130、さらには画像形成装置140やディスプレイ150との入出力を管理するI/O回路、LAN(Local area Network)等のネットワークとの入出力を管理する通信回路、処理プログラムが格納されたROM(Read Only Memory)、一次記憶装置としてのRAM(Random Access Memory)を含んで構成されている。そして、スキャナ110により読み取られた紙文書についての登録処理または照合処理を行ない、紙文書に関する各種データと文書データとを相互関連付けて紙文書情報登録データベース130等に出力する。また、紙文書情報登録データベース130から相互関連付けられた各種データと文書データとを入力する。
さらには、処理装置120は、スキャナ110の動作を制御する信号をスキャナ110に出力する。また、文書データや各種データを画像形成装置140に出力する。さらに、表示データや、ディスプレイ150の動作を制御する信号をディスプレイ150に出力する。
紙文書情報登録データベース130は、ハードディスクドライブ(HDD)やDVD(Digital Versatile Disc)−RAM/±RW/±Rドライブ等の大容量記憶装置により構成されている。そして、処理装置120により処理された各種データと文書データとを紙文書毎に相互に関連付けて記憶する。
画像形成装置140としては、例えば電子写真方式を用いたものや、インクジェット方式を用いたもの等が使用される。そして、処理装置120により生成された文書データ等や紙文書情報登録データベース130に記憶されている文書データ等を記録用紙に印刷する。
また、ディスプレイ150は、CRTディスプレイ、液晶ディスプレイ等で構成される。
次に、本実施の形態のデジタル複写機100において実行される紙文書を電子化する紙文書電子化処理について説明する。
まず、紙文書電子化処理のうちの紙文書を登録する紙文書登録処理について述べる。本実施の形態のデジタル複写機100での紙文書登録処理は、原本としての文書が印刷された記録用紙における固有の情報を登録する処理(紙固有情報登録処理)を伴うものである。
デジタル複写機100における紙文書登録処理は、処理装置120内に構築された紙文書登録処理部300で実行される。図2は、紙文書登録処理部300の機能構成を説明するブロック図である。図2に示したように、紙文書登録処理部300は、固有情報取得部を構成する紙特徴画像切り出し部301と紙固有情報変換部302、紙ID取得部を構成する紙ID切り出し部303と紙IDデコード部304、さらには文書画像処理部305を備えて構成されている。そして、紙文書登録処理部300は、スキャナ110と紙文書情報登録データベース130とに接続されている。
紙特徴画像切り出し部301は、紙固有情報登録処理を行なう構成部の一つであり、紙文書の一部から紙文書の特徴画像を切り出す機能を有している。すなわち、紙特徴画像切り出し部301は、スキャナ110により読み取られた例えば図3(紙文書の一例を示した図)に示したような紙文書200から、例えば文字や図形が印刷されている文書領域203以外の余白領域に位置する第1領域201を切り出す。そして、この第1領域201を紙文書200の特徴画像(第1特徴画像)とする。さらに、スキャナ110から第1領域201での光反射率信号を取得する。
紙固有情報変換部302は、紙固有情報登録処理を行なう構成部の一つであり、紙特徴画像切り出し部301にて切り出された紙文書200の特徴画像(第1領域201)での光反射率信号を紙固有情報に変換する機能を有している。すなわち、紙固有情報変換部302は、紙特徴画像切り出し部301にて取得された第1領域201での光反射率信号をデジタルデータに変換する信号処理回路を備えている。
上記したように、スキャナ110では、紙文書200が形成された記録用紙の繊維質材料の絡み具合(表面凹凸)のランダム性に基づいて発生する、記録用紙の表面に分布している光反射率のランダムな変化(光反射率分布)を読み取る。紙固有情報変換部302に備えられた信号処理回路は、第1領域201での光反射率のランダムな変化に対応した光反射率信号を、所定の解像度(本実施の形態では、400dpi)かつ所定の階調(本実施の形態では、8ビットグレイスケール)のデジタルデータに変換する。変換されたデジタルデータは、さらにPKI暗号法などの秘密鍵により暗号化されてもよい。そして、このデジタルデータは、紙文書200を特徴付ける紙固有情報として紙文書情報登録データベース130に出力される。
なお、本実施の形態では、紙固有情報を記録用紙での光反射率分布に基づき生成したが、記録用紙での光透過率分布に基づき生成してもよい。
紙ID切り出し部303は、図3に示した紙文書200の紙IDを切り出す機能を有している。すなわち、紙ID切り出し部303は、紙文書200に記録されたIDコード202(ここではQRコードを用いているが、バーコードやその他のコードでもよい。)を切り出す。
紙IDデコード部304は、紙ID切り出し部303にて切り出した紙文書200のIDコード202をデコード化する機能を有している。すなわち、紙IDデコード部304は、IDコード202をデコードする信号処理回路を備えている。デコードされたデータは、さらにPKI暗号法などによる秘密鍵で暗号化されてもよい。このデータは、紙文書200の紙IDデータとして紙文書情報登録データベース130に出力される。
文書画像処理部305は、紙文書200の文書領域203に形成されている文字や図形等を電子化処理する機能を有している。すなわち、文書画像処理部305は、スキャナ110により読み取られた光反射率信号を、紙文書200に記録されている文字や図形等を再現するためのデジタルデータ(文書データ)に変換する。
そして、紙固有情報変換部302からの紙固有情報と、紙IDデコード部304からの紙IDデータと、文書画像処理部305からの文書データとは、紙文書200毎に相互に関連付けられて紙文書情報登録データベース130に記憶される。
続いて、本実施の形態のデジタル複写機100での紙文書登録処理の手順について述べる。図4は、紙文書登録処理の手順を示したフローチャートである。ここでは、図4のフローチャートを参照しながら説明する。
まず、図3に示すような紙文書200を用意する。この場合、紙文書200の予め定められている位置に、上記した特徴画像用として文章や図形等が何もプリントされていない第1領域201や、IDコード202(ここではQRコードを用いているが、バーコードやその他のコードでもよい。)を形成しておく。IDコード202は紙文書200の文書領域203に形成される文字や図形等を形成するときに同時に形成してもよい。また、予めIDコード202が形成された紙文書200に文字や図形等を形成してもよい。
紙文書200を図1に示すようなデジタル複写機100のスキャナ110に読み取り面を下にして載置し、紙文書登録開始ボタンを押す。すると、スキャナ110に載置された原稿をライン状の照明が走査し、その反射光をCCDラインセンサに入力する。CCDラインセンサに入力されるライン画像は、スキャナ110に搭載された処理回路によって光反射率信号に変換される。スキャナ110により生成された光反射率信号は処理装置120に送信され、予め処理装置120のROMに記憶されている紙文書登録プログラムに従って、所定の紙文書登録処理が実行される。
まず、紙文書登録プログラムに従って紙固有情報登録処理が実行される(S101)。この紙固有情報登録処理では、紙特徴画像切り出し部301により、紙文書200の予め定められている位置から紙文書200における第1特徴画像(第1領域201)が切り出される。そして、紙固有情報変換部302により、第1特徴画像における光反射率信号が紙固有情報に変換される。
ここで、紙特徴画像切り出し部301にて切り出される第1特徴画像(第1領域201)は、本実施の形態で使用する解像度が400dpiであって、例えば32dot×32dotの領域に設定するとして、約2mm×約2mmの面積領域である。そして、この第1特徴画像における光反射率信号が解像度400dpiかつ8ビットグレイスケール階調のデジタルデータに変換される。得られたデジタルデータは、PKI暗号法などによる秘密鍵で暗号化され、紙固有情報として紙文書情報登録データベース130に記憶される。
ここでは、第1特徴画像について、読み取り解像度が400dpi、読み取り階調を8ビットグレイスケール、読み取り対象領域を32dot×32dotとしている。そのため、紙固有情報に関しては、データサイズは1024バイトとなり、個々の画素(ドット)の階調値(明度値)は0〜255の範囲内の整数値となる。なお、かかる紙固有情報登録処理(S101)によって得られた紙固有情報を可視化(目視が容易なようにコントラスト補正)した画像の一例を図5に概念的に示した。
同時に、紙ID切り出し部303により、紙文書200の予め定められている位置からIDコード202が切り出され、紙IDデコード部304にてデコードされて、紙IDデータが取得される(S102)。
また、紙文書200に形成されている文字や図形等(文書領域203)が文書画像処理部305によりデジタルデータに変換され、文書データが取得される(S103)。
そして、ステップ101で生成された紙固有情報と、ステップ102で生成された紙IDデータと、ステップ103で生成された文書データとは、相互に関連付けられた図6に示すような構成を有するデータとして、紙文書情報登録データベース130に記憶される(S104)。紙文書情報登録データベース130には、紙固有情報と紙IDデータと文書データとの他に、紙文書の分類データ、スキャン日、デジタル複写機100のID等の情報を付加してもよい。
なお、紙文書情報登録データベース130に代えて、デジタル複写機100がインターネットに接続されている場合は、インターネットに接続されている紙固有情報管理用のサーバにデータを転送してもよい。また、フレキシブルディスク、CD−R、DVD−R、リムーバブルHDD等のように、光や磁気でデジタル情報を記録する媒体にデータを記録してもよい。また、その媒体を介して、別途、インターネットに接続されているPCから紙固有情報管理用のサーバにデータを転送してもよい。
このようにして、紙文書の登録処理が実行される。
また、本実施の形態のデジタル複写機100では、紙文書の電子化処理を行なうに際して、電子化の対象となる紙文書が以前に登録(電子化)が1度以上行われていたかどうかの判定を行なう照合処理を実行すること可能である。以下に、紙文書電子化処理のうちの電子化の対象となる紙文書についての照合処理について説明する。
デジタル複写機100における照合処理は、処理装置120内に構築された照合処理部400で実行される。図7は、照合処理部400の機能構成を説明するブロック図である。図7に示したように、照合処理部400は、固有情報取得部を構成する紙特徴画像切り出し部401と紙固有情報変換部402、紙ID取得部を構成する紙ID切り出し部403と紙IDデコード部404、文書画像処理部405、登録固有情報取得部を構成する紙固有情報変換部406、第1記憶部407、第2記憶部408、照合判定部を構成する画像照合部409と同一紙判定部421、文書画像比較表示部422、判定結果表示部423を含んで構成されている。また、照合処理部400は、紙文書情報登録データベース130を構成要素として含んでいる。さらに、文書画像比較表示部422、判定結果表示部423はディスプレイ150に構成されている。
また、照合処理部400は、スキャナ110およびディスプレイ150に接続されている。
紙特徴画像切り出し部401は、上記した紙文書登録処理部300にて構成されている紙特徴画像切り出し部301と同様の構成を有している。この照合処理部400での紙特徴画像切り出し部401は、紙文書の特徴画像として第2特徴画像を切り出す機能を有している。第2特徴画像は、紙文書登録処理部300での紙特徴画像切り出し部301にて切り出された第1特徴画像(第1領域201)全体を含む領域であって、この第1特徴画像よりも広い第2領域204(図3参照)を切り出すことにより取得する。
紙固有情報変換部402、紙ID切り出し部403、紙IDデコード部404、文書画像処理部405は、それぞれ上記した紙文書登録処理部300にて構成されている紙固有情報変換部302、紙ID切り出し部303、紙IDデコード部304、文書画像処理部305と同様の構成を有している。そのため、ここでの説明は省略する。
また、紙文書情報登録データベース130は、上記した紙文書登録処理により紙固有情報と紙IDデータと文書データとが紙文書毎に相互に関連付けられて記憶されたデータベースである。また、この場合に、紙文書登録処理の際に使用された紙文書情報登録データベース130から、相互に関連付けられた紙固有情報と紙IDデータと文書データとが複製されたデータベースを用いることもできる。
第1記憶部407は、紙固有情報変換部402にて取得された紙固有情報を一時的に保存しておく機能を有している。ここでの紙固有情報変換部402にて生成される紙固有情報は、上記した紙文書登録処理部300での紙特徴画像切り出し部301にて切り出された紙文書200の第1特徴画像(第1領域201)全体を含む領域であって、この第1特徴画像よりも広い第2特徴画像(第2領域204)が切り出されることで生成されるものである。
すなわち、上記した紙文書登録処理部300では、紙特徴画像切り出し部301にて解像度400dpiでの32dot×32dotの領域である約2mm×約2mmの面積領域(第1特徴画像)が切り出される。そして、紙固有情報変換部302にて、第1特徴画像についての解像度400dpi、8ビットグレイスケール階調のデジタルデータが紙固有情報として生成される。これに対して、本実施の形態の照合処理部400では、紙特徴画像切り出し部401にて、第1領域201全体を含む、例えば解像度が400dpiでの64dot×64dotの領域である約4mm×約4mmの面積領域(第2特徴画像(第2領域204))が特徴画像として切り出される。そして、紙固有情報変換部402にて、第2特徴画像についての解像度400dpi、8ビットグレイスケール階調のデジタルデータが紙固有情報として取得される。第1記憶部407は、かかる紙固有情報を照合データ(G)として記憶する。
紙固有情報変換部406は、紙IDデコード部404にてデコードされた紙IDデータに関連付けて記憶されている紙固有情報を、紙文書情報登録データベース130から検索する機能を有している。さらに、紙固有情報変換部406は、上記した紙文書登録処理部300での紙固有情報変換部302にて暗号化に使用された秘密鍵と対をなす公開鍵により、復号化する機能を有している。
第2記憶部408は、紙固有情報変換部406にて復号化された紙固有情報を登録データ(F)として一時的に保存しておく機能を有している。
画像照合部409は、第1記憶部407に記憶されている紙固有情報(照合データ(G))と、それに対応する第2記憶部408に記憶されている紙固有情報(登録データ(F))とを比較照合する機能を有している。
同一紙判定部421は、第1記憶部407に記憶されている照合データ(G)の中に、第2記憶部408に記憶されている対応する登録データ(F)が含まれているかどうかを判定する機能を有している。同一紙判定部421では、第1記憶部407に記憶されている照合データ(G)の中に、第2記憶部408に記憶されている対応する登録データ(F)が含まれている場合には、スキャナ110から入力された紙文書は、同一の紙IDを持つ紙文書情報登録データベース130に登録されている紙文書と同一であると判定する。
判定結果表示部423は、スキャナ110から入力された紙文書についての同一紙判定部421での判定結果を表示する機能を有している。
また、文書画像比較表示部422は、スキャナ110から入力された紙文書と、この紙文書と同じ紙IDを持つ紙文書情報登録データベース130に登録されている紙文書との目視による比較ができるように、スキャナ110から入力された紙文書と紙文書情報登録データベース130に登録されている紙文書とを表示する機能を有している。
続いて、本実施の形態のデジタル複写機100での照合処理の手順について述べる。図4は、照合処理の手順を示したフローチャートである。ここでは、図8のフローチャートを参照しながら説明する。
紙文書200を図1に示すようなデジタル複写機100のスキャナ110に読み取り面を下にして載置し、紙同一判定照合開始ボタンを押す。すると、スキャナ110に載置された原稿をライン状の照明が走査し、その反射光をCCDラインセンサに入力する。CCDラインセンサに入力されるライン画像は、スキャナ110に搭載された処理回路によって光反射率信号に変換される。スキャナ110により生成された光反射率信号は処理装置120に送信され、予め処理装置120のROMに記憶されている紙同一判定照合プログラムに従って、所定の照合処理が実行される。
まず、上記した紙文書登録処理の場合と同様に、紙固有情報登録処理が実行される。ここでの紙固有情報登録処理は、紙特徴画像切り出し部401により、紙文書200(図3参照)の予め定められている位置から紙文書200における第2特徴画像(第2領域204)が切り出される。そして、紙固有情報変換部402により、第2特徴画像における光反射率信号が紙固有情報に変換される。この紙固有情報を照合データ(G)として記憶する(S201)。
ここで、紙特徴画像切り出し部401にて切り出される第2特徴画像(第2領域204)は、本実施の形態で使用する解像度が400dpiであって、例えば64dot×64dotの領域に設定するとして、約4mm×約4mmの面積領域である。そして、この第2特徴画像における光反射率信号が紙固有情報変換部402にて解像度400dpiかつ8ビットグレイスケール階調のデジタルデータに変換される。得られたデジタルデータは、処理装置120内の第1記憶部407に、照合データ(G)として記憶される。
なお、紙特徴画像切り出し部401により切り出される第2特徴画像は、読み取り解像度が400dpi、読み取り階調を8ビットグレイスケール、読み取り対象領域を64dot×64dotとしている。そのため、紙固有情報変換部402にて取得されたデジタルデータは、データサイズは2048バイトとなり、個々の画素(ドット)の階調値(明度値)は0〜255の範囲内の整数値となる。
同時に、紙ID切り出し部403により、紙文書200の予め定められている位置からIDコード202が切り出され、紙IDデコード部404にてデコードされて、紙IDデータが取得される(S202)。
そして、紙固有情報変換部406により、紙IDデコード部404にてデコードされた紙IDデータに関連付けて記憶されている紙固有情報を、紙文書情報登録データベース130から検索する(S203)。ここで、紙文書情報登録データベース130が、インターネットを介してデジタル複写機100に接続されている紙固有情報管理用のサーバである場合には、紙固有情報管理用のサーバへ紙IDデータを転送し、紙IDデータと関連付けられている紙固有情報を検索する。
さらに、紙固有情報変換部406により、上記した紙文書登録処理部300での紙固有情報変換部302にて暗号化に使用された秘密鍵と対をなす公開鍵により、検索された紙固有情報を復号化する。そして、これを登録データ(F)として第2記憶部408に記憶する(S204)。
その際に、紙固有情報と同時に、紙固有情報に関連付けられた文書データをデジタル複写機100に取り込む。
また、紙文書200に形成されている文字や図形等(文書領域203)が文書画像処理部305によりデジタルデータに変換され、文書データが取得される。
次のステップでは、画像照合部409において、第2記憶部408に記憶された登録データ(F)(上記した約2mm×約2mmの第1特徴画像における紙固有情報)と、第1記憶部407に記憶された照合データ(G)(上記した約4mm×約4mmの第2特徴画像における紙固有情報)とを比較し、照合データ(G)の中に、登録データ(F)が含まれているかどうかを照合する(S205)。
ここでの照合には、例えば、登録データ(F)と照合データ(G)との相関値の最大値と相関最大値のノーマライズド・スコアとで判定する手法を用いることができる。
具体的には、登録データ(F)と照合データ(G)との相関値を、次式(1)を用いた正規化相関法により演算する。
Figure 2007156896
ここで、Fは登録データ、fは登録データ(F)を生成した第1特徴画像における個々の画素の明度値、Nは約2mm×約2mmの第1特徴画像の総画素数、Gは照合データ、gは照合データ(G)を生成した第2特徴画像における個々の画素の明度値、faveは第1特徴画像の個々の画素の明度値の平均値、gaveは第2特徴画像の個々の画素の明度値の平均値である。
ステップ205の照合に際しては、第2特徴画像の中で第1特徴画像と同じ大きさの領域(照合領域)の照合データを移動させながら、登録データと照合データとを比較照合し、第2特徴画像中に第1特徴画像と相関の高い登録データが存在するかどうかで行う。
すなわち、(1)式の演算をすべての照合領域毎に行う。その場合に、登録データのドット数をm×n、照合データのドット数をM×Nとすると、単一の照合領域当たり(M―m+1)×(N−n+1)個の相関値が得られる。本実施の形態では、登録データ(F)を生成した第1特徴画像が32dot×32dot、照合データ(G)を生成した第2特徴画像が64dot×64dotであるので、相関値の演算が1089回(=(64−32+1)×(64−32+1))行われ、1089個の相関値が得られることになる。
そして、上記の(1)式による演算によって得られた多数個の相関値の中から、その最大値を抽出する。
また、多数個の相関値の標準偏差および平均値を算出する。そして、算出された標準偏差・平均値および抽出された相関値の最大値を次の(2)式に各々代入することで、相関値の最大値のノーマライズド・スコアを算出する。
ノーマライズド・スコア
=(相関値の最大値−相関値の平均値)÷相関値の標準偏差 …(2)
同一紙判定部421においては、相関値の最大値が閾値以上で、かつノーマライズド・スコアが閾値以上か否か判定する。ここで、相関値の最大値の閾値としては例えば「0.3」を、ノーマライズド・スコアの閾値としては例えば「5.0」を用いることができる。そして、相関値の最大値が閾値以上で、かつノーマライズド・スコアが閾値以上である場合には、スキャナ110から入力された紙文書は、「以前に登録(電子化)が行われていた」と判定される。また、相関値の最大値が閾値以上で、かつノーマライズド・スコアが閾値以上でない場合には、スキャナ110から入力された紙文書は、「以前に登録(電子化)が行われたことがない」と判定される(S206)。これにより、スキャナ110から入力された紙文書の登録履歴を、簡単な処理により高精度に判定することができる。
この判定結果は、ディスプレイ150(図1参照)に構成された判定結果表示部423で表示される(S207)。
このようにして、紙文書の照合処理が実行される。
ここで、同一紙判定部421での判定結果により、スキャナ110から入力された紙文書と、この紙文書と同じ紙IDを持つ紙文書情報登録データベース130に登録されている紙文書とが同一であった場合には、紙文書の内容が改ざんされていないことを確認するために、双方の紙文書を目視で比較できるように、ディスプレイ150に構成された文書画像比較表示部422で表示することも可能である。また、文書画像比較表示部422を画像形成装置140(図1参照)で構成し、双方の紙文書をプリントアウトして、紙文書に形成されている文字や図形などの文書情報を目視で比較できるようにしてもよい。さらには、文書画像比較表示部422としては、目視に限らず、OCRした結果などを機械で比較できるような構成とし、双方の紙文書の同一性を判定する文書判定部として機能させることもできる。
また、紙文書情報登録データベース130に登録されている紙文書に、加筆、修正などをして、紙文書のバージョンを変更した場合には、紙文書情報登録データベース130にバージョンの情報とともに、新たな紙文書に形成されている情報を記録していってもよい。その場合には、新しい文書情報が原本になるとともに、変更履歴を残すことができる。
加えて、同一の紙文書を電子化することが可能な回数を予め設定できるように構成することもできる。そして、設定された回数を超えた電子化処理が行なわれようとした際には、電子化を不能としたり、または新たに電子化されたデータを削除するように構成することもできる。
さらに、紙文書に、加筆、修正などをしていないにも拘わらず、同じ紙IDを持つ紙文書が同一の紙文書であり、紙文書情報が異なっていると判定した場合は、原本である紙文書を再利用することによる偽造が懸念されるために、その旨を液晶ディスプレイなどに表示するなどの警告を発することもできる。
また、同じ紙IDを持つ紙文書が同一の紙文書ではないと判定した場合は、原本ではない紙文書から電子原本を作成することによる偽造が懸念されるために、その旨をディスプレイなどに表示するなどの警告を発することもできる。
なお、本実施の形態の紙文書電子化装置を備えたデジタル複写機100では、処理装置120はスキャナ110や画像形成装置140と別体に構成している。しかし、本発明はこのような構成に限定されない。例えば、処理装置120をスキャナ110または画像形成装置140の内部に構成することもできる。また、処理装置120、スキャナ110および画像形成装置140を一体として構成することも可能である。
さらに、処理装置120をPC(Personal Computer)により構成することもできる。
以上説明したように、本実施の形態の文書電子化装置では、新たに登録される紙文書にて切り出された第2特徴画像での紙固有情報と、紙文書情報登録データベース130に登録されている紙文書であって、第2特徴画像に含まれる面積領域である第1特徴画像が切り出された紙文書についての、かかる第1特徴画像での紙固有情報とによる照合を行なう。それにより、新たに登録される紙文書と、これに対応する紙文書情報登録データベース130に登録されている紙文書との同一性の有無を判断して、新たに登録される紙文書が以前に登録(電子化)が行われていたか否かを判定している。
そのため、本実施の形態の文書電子化装置では、電子文書が原本の紙文書から電子化されたことを客観的に保証することができる。それにより、原本である紙文書を再利用することによる紙文書の偽造や、原本でない紙文書から電子原本を作成することによる紙文書の偽造を抑止することが可能となる。さらには、原本である紙文書に加筆、修正されて電子化された場合に、原本である紙文書が更新されたことを管理することも可能となる。
本発明の紙文書電子化装置の構成を示した図である。 紙文書登録処理部の機能構成を説明するブロック図である。 紙文書の一例を示した図である。 紙文書登録処理の手順を示したフローチャートである。 紙固有情報を可視化した画像の一例を概念的に示した図である。 紙文書情報登録データベースに記憶されるデータの構成を示した図である。 照合処理部の機能構成を説明するブロック図である。 照合処理の手順を示したフローチャートである。
符号の説明
100…デジタル複写機、110…スキャナ、120…処理装置、130…紙文書情報登録データベース、140…画像形成装置、150…ディスプレイ、200…紙文書、201…第1領域、202…IDコード、203…文書領域、204…第2領域、300…紙文書登録処理部、301,401…紙特徴画像切り出し部、302,402…紙固有情報変換部、303,403…紙ID切り出し部、304,404…紙IDデコード部、305…文書画像処理部、400…照合処理部、405…文書画像処理部、406…紙固有情報変換部、407…第1記憶部、408…第2記憶部、409…画像照合部、421…同一紙判定部、422…文書画像比較表示部、423…判定結果表示部

Claims (13)

  1. 紙文書を電子化する文書電子化装置であって、
    紙文書が電子化された文書データと、当該紙文書が形成された紙媒体上の第1の領域から取得された当該紙媒体の一意の特徴を表す固有情報とが相互に関連付けて記憶された記憶部と、
    紙文書を読み取る読取入力部と、
    前記読取入力部にて読み取られた紙文書が形成された紙媒体上の第2の領域から、当該紙媒体の一意の特徴を表す固有情報を取得する固有情報取得部と、
    前記固有情報取得部にて取得された前記固有情報と、前記記憶部に記憶されている前記固有情報とを照合することで、前記読取入力部にて読み取られた紙文書と、当該記憶部に記憶されている紙文書との同一性を判定する照合判定部と
    を備えたことを特徴とする文書電子化装置。
  2. 前記固有情報取得部は、前記記憶部に記憶されている前記固有情報が取得される前記第1の領域全体を含み、かつ、当該第1の領域よりも大きな面積を有する前記第2の領域から、前記固有情報を取得することを特徴とする請求項1記載の文書電子化装置。
  3. 前記照合判定部は、前記第2の領域の中の前記第1の領域と同一の大きさを有する照合領域を設定し、当該照合領域での当該固有情報と、当該第1の領域での前記固有情報とを、当該照合領域を当該第2の領域の中で移動させながら比較照合し、当該第2の領域の中に当該第1の領域での当該固有情報と相関の高い固有情報が存在するか否かを探索することを特徴とする請求項2記載の文書電子化装置。
  4. 前記紙文書は、当該紙文書の識別情報を示すコード画像を含み、前記記憶部は、前記文書データおよび前記固有情報に関連付けて、当該紙文書に含まれるコード画像がコード化されたIDデータを記憶するとともに、
    前記読取入力部にて読み取られた紙文書からIDデータを取得する紙ID取得部と、
    前記紙ID取得部で取得された前記IDデータに基づいて、前記記憶部に記憶されている当該IDデータと同一のIDデータを検索し、検索されたIDデータに関連付けられた前記固有情報を取得する登録固有情報取得部とをさらに備え、
    前記照合判定部は、前記登録固有情報取得部にて取得された前記固有情報と、前記固有情報取得部にて取得された前記固有情報とを照合することを特徴とする請求項1記載の文書電子化装置。
  5. 前記照合判定部が、前記読取入力部にて読み取られた紙文書と、前記記憶部に記憶されている紙文書とが同一であると判定した場合に、前記記憶部に記憶された文書データと前記読取入力部にて読み取られた紙文書の文書データとのいずれか一方または双方を表示する表示部をさらに備えたことを特徴とする請求項1記載の文書電子化装置。
  6. 前記照合判定部が、前記読取入力部にて読み取られた紙文書と、前記記憶部に記憶されている紙文書とが同一であると判定した場合に、前記記憶部に記憶された文書データと前記読取入力部にて読み取られた紙文書の文書データとの同一性を判定する文書判定部をさらに備えたことを特徴とする請求項1記載の文書電子化装置。
  7. 前記記憶部に記憶される前記固有情報と前記固有情報取得部で取得される前記固有情報とは、前記紙媒体に光を照射した際の光反射率分布または光透過率分布に基づき取得されたことを特徴とする請求項1記載の文書電子化装置。
  8. 紙文書を電子化してデータベースに記憶する文書電子化方法であって、
    紙文書を読み取る読取入力部にて紙文書を読み取り、
    前記読取入力部にて読み取られた紙文書が形成された紙媒体上の第2の領域から、当該紙媒体の一意の特徴を表す固有情報を固有情報取得部にて取得し、
    紙文書が電子化された文書データと、当該紙文書が形成された紙媒体上の第1の領域から取得された当該紙媒体の一意の特徴を表す固有情報とが相互に関連付けて記憶された前記データベースから、前記固有情報取得部にて取得された前記固有情報に対応する固有情報を検索して取得し、
    前記固有情報取得部にて取得された前記固有情報と、前記データベースから取得された前記固有情報とを照合部にて照合し、
    前記照合部での照合結果に基づいて、前記読取入力部にて読み取られた紙文書と、当該データベースに記憶されている紙文書との同一性を判定することを特徴とする文書電子化方法。
  9. 前記紙文書は、当該紙文書の識別情報を示すコード画像を含み、前記データベースは、前記文書データおよび前記固有情報に関連付けて、当該紙文書のコード画像がコード化されたIDデータを記憶するとともに、
    読取入力部は前記紙文書から前記コード画像を読み取り、
    前記読取入力部にて読み取られた前記IDコードがコード化されたIDデータに基づいて、前記データベースから前記固有情報取得部にて取得された前記固有情報に対応する前記固有情報を検索することを特徴とする請求項8記載の文書電子化方法。
  10. 前記読取入力部にて読み取られた紙文書と、前記データベースに記憶されている紙文書とが同一であると判定された場合に、当該読取入力部にて読み取られた紙文書の電子化された回数を、当該紙文書の文書データと関連付けて前記データベースに記憶することを特徴とする請求項8記載の文書電子化方法。
  11. 前記読取入力部にて読み取られた紙文書と、前記データベースに記憶されている紙文書とが同一であると判定された場合であって、当該読取入力部にて読み取られた紙文書の電子化された回数が所定回数を超えている場合には、当該紙文書の当該データベースへの記憶を禁止し、または、当該データベースに記憶されている紙文書を削除することを特徴とする請求項9記載の文書電子化方法。
  12. 前記データベースでは前記固有情報が所定の秘密鍵により暗号化されて記憶され、前記照合部では当該記憶部に記憶されている当該固有情報が前記秘密鍵と対をなす公開鍵により復号化されて照合されることを特徴とする請求項8記載の文書電子化方法。
  13. 前記データベースはネットワーク上に構成され、前記照合部は、当該ネットワークを介して前記データベースに記憶されている前記固有情報を取得することを特徴とする請求項8記載の文書電子化方法。
JP2005352319A 2005-12-06 2005-12-06 文書電子化装置および文書電子化方法 Withdrawn JP2007156896A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005352319A JP2007156896A (ja) 2005-12-06 2005-12-06 文書電子化装置および文書電子化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005352319A JP2007156896A (ja) 2005-12-06 2005-12-06 文書電子化装置および文書電子化方法

Publications (1)

Publication Number Publication Date
JP2007156896A true JP2007156896A (ja) 2007-06-21

Family

ID=38241173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005352319A Withdrawn JP2007156896A (ja) 2005-12-06 2005-12-06 文書電子化装置および文書電子化方法

Country Status (1)

Country Link
JP (1) JP2007156896A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193487A (ja) * 2008-02-18 2009-08-27 Nec Corp 文書整理システム、文書整理方法および文書整理プログラム
JP2010246082A (ja) * 2009-04-06 2010-10-28 Toshiba Corp 画像形成装置、そのシステム及びその制御方法
JP2011028718A (ja) * 2009-06-26 2011-02-10 Fuji Xerox Co Ltd 登録装置、真偽判定システム及び登録プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193487A (ja) * 2008-02-18 2009-08-27 Nec Corp 文書整理システム、文書整理方法および文書整理プログラム
JP2010246082A (ja) * 2009-04-06 2010-10-28 Toshiba Corp 画像形成装置、そのシステム及びその制御方法
JP2011028718A (ja) * 2009-06-26 2011-02-10 Fuji Xerox Co Ltd 登録装置、真偽判定システム及び登録プログラム

Similar Documents

Publication Publication Date Title
US7769200B2 (en) Method, apparatus, and computer product for embedding an electronic watermark into image data
JP4975459B2 (ja) 複写管理システム、出力装置、複写装置、およびコンピュータプログラム
US8340346B2 (en) Information processing device, information processing method, and computer readable medium
US20080307521A1 (en) Image processing apparatus, image processing method, program, and storage medium for performing access control of document including two-dimensional code
US8780372B2 (en) Image processing apparatus and image processing method to read and prevent loss of coded information
US20080209549A1 (en) Computer readable medium, document processing apparatus, document processing system, document processing method, and computer data signal
JP2010246027A (ja) 画像形成装置、画像形成方法、及びコンピュータプログラム
US20110007348A1 (en) Process determining apparatus, image processing apparatus, process determining system, computer readable medium storing program, and process determining method
KR101536274B1 (ko) 화상형성장치, 그 화상처리방법, 및 화상형성시스템
CN1946123A (zh) 图像处理设备及其控制方法
US20050018237A1 (en) Digital transmitter security
US20110317227A1 (en) Image forming apparatus
JP4358879B2 (ja) 画像処理装置及び画像処理サーバ
JP2008288686A (ja) 画像読取装置、画像処理システム及び画像処理プログラム
US8570547B2 (en) Image registration device, image registration system, image registration method and computer readable medium that register the associated image acquired by the associated image acquisition unit with the associated image being assigned to the predetermined process
JP2011045024A (ja) 文書出力装置及びプログラム
US8416462B2 (en) Information processing apparatus, method, program, and storage medium
JP2007156896A (ja) 文書電子化装置および文書電子化方法
JP5408012B2 (ja) 画像処理装置、出力装置、及びプログラム
JP4754236B2 (ja) 情報処理装置、取得方法、及び取得プログラム
JP2008158587A (ja) 文書管理装置、プログラム、及び文書管理システム
JP4740166B2 (ja) 画像形成装置、画像形成システム、画像形成方法、プログラム、および記録媒体
JP2009223390A (ja) 画像処理監視システム及びプログラム
JP2006258898A (ja) 画像形成装置および画像形成方法
JP2007005862A (ja) 印刷システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081120

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20100712