JP4836735B2 - 電子情報検証プログラム、電子情報検証装置および電子情報検証方法 - Google Patents

電子情報検証プログラム、電子情報検証装置および電子情報検証方法 Download PDF

Info

Publication number
JP4836735B2
JP4836735B2 JP2006267772A JP2006267772A JP4836735B2 JP 4836735 B2 JP4836735 B2 JP 4836735B2 JP 2006267772 A JP2006267772 A JP 2006267772A JP 2006267772 A JP2006267772 A JP 2006267772A JP 4836735 B2 JP4836735 B2 JP 4836735B2
Authority
JP
Japan
Prior art keywords
information
feature amount
electronic
electronic information
verification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006267772A
Other languages
English (en)
Other versions
JP2008090389A (ja
Inventor
孝司 吉岡
正彦 武仲
哲也 伊豆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006267772A priority Critical patent/JP4836735B2/ja
Priority to US11/882,097 priority patent/US8335922B2/en
Publication of JP2008090389A publication Critical patent/JP2008090389A/ja
Application granted granted Critical
Publication of JP4836735B2 publication Critical patent/JP4836735B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3233Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Storage Device Security (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、例えばヘッダやプロパティ等々のメタ情報と文書内容であるコンテンツ情報を用いて生成される特徴量情報によって電子文書を特定することで、電子文書の真正性、完全性を確認又は検証することを支援し、更に第三者証明を可能とするための電子情報検証プログラム、電子情報検証装置、および電子情報検証方法に関するものである。
近年のITの進展に伴い、行政文書や民間企業の帳簿、契約書等々の形態は、従来の紙文書での運用、保管から電子(デジタル)文書へと徐々に移行されつつある。
具体的には、スキャナ装置の普及に伴い、従来紙で保存されていた文書を容易に電子文書化することが可能となった。更に、高解像度を内蔵するイメージスキャナの実用化に伴い、一定のセキュリティ要件を満足すれば従来認められなかった紙文書の大量の電子保存が容認されるようになった(e-文書法:2005年4月施行に伴う)。
一方、このような文書の電子保存要求の増加とともに、電子文書を安全に保管、管理する技術の必要性が高まっている。従来、紙として保存されていた文書を、紙と同等の証拠能力を維持した状態で電子的に保存するためには、“改ざん検出・防止”、“作成者の識別”、“アクセス管理・制御”、“履歴管理”等々の技術要件を満たす必要があると言われている。このような要件を満たすためには、従来の文書管理システムでは機能不足であり、そのため最近では、「原本性保証システム」の開発、市場投入が急速に進んでいる。
この「原本性保証システム」において、最も一般的に用いられているセキュリティ要素技術に電子署名とタイムスタンプがある。電子署名は、文書の作成者を特定できる(本人性)のと同時に、その文書が作成時点から変更がないこと(非改ざん性)を第三者に証明・確認できる技術である。またタイムスタンプは、電子署名の機能に加え、電子文書の確定時刻を証明することが可能である。どちらも、文書全体に対して電子署名・タイムスタンプを付与することが大きな特徴である。
上記のような技術を利用して実現されている従来の原本性保証の考え方は、確定された最終形態の文書を原本として安全に管理する、いわゆる紙文書を鍵付き書庫等々に保管するのと同様、原本の所在が明確である文書を対象としている。このような環境下においては、電子署名、タイムスタンプは本人性や非改ざん性を保証するのに非常に有効な技術となる。
これに関連する従来技術として、下記に示す1)のような技術が知られ、更に、1)の技術をより発展させた2)、3)のような技術が知られている。
1)電子文書原本保管技術
電子文書の原本性を確保する技術として、下記特許文献1および特許文献2が知られる。
特開2000−285024号公報 特開2001−117820号公報
2)電子文書墨塗り技術
電子文書の墨塗り問題を解決する技術として、情報処理学会/コンピュータセキュリティ研究会(CSEC)論文「電子文書墨塗り問題(2003/7/17)(2003-CSEC-22-009)にて解決方式が提案されている。本技術では、電子文書をブロックに区分し、各ブロックに対する部分署名(ハッシュ値)を生成。本文中の非開示部分にハッシュ値を埋め込めば、ハッシュ値が同じ箇所は非改変、異なる箇所は改変を検出できる技術である。また、2004年暗号と情報セキュリティシンポジウム(SCIS2004)論文「開示条件を制御可能な電子文書墨塗り技術」では、開示部分に対する追加的な墨塗りの可否を制御可能とする電子文書墨塗り技術についても提案されている。
3)電子文書部分完全性保証技術
電子文書に直接、追加や訂正、秘匿等々の部分操作・流通させる技術として、第3回情報科学技術フォーラム(FIT2004)論文「電子文書の訂正・流通を考慮した部分完全性保証技術」(M-066)を筆頭に、コンピュータセキュリティ研究会(CSEC)、暗号と情報セキュリティシンポジウム(SCIS)等々で提案されている。本技術では、電子文書中の各項目のハッシュ値を識別情報として記憶し、文書訂正の度に訂正項目・訂正後の識別情報も随時記憶していく。文書提出時、現在の文書・訂正項目・現版及び前版の識別情報を付すことで提出先での検証が可能となる技術である。変更箇所の特定とそれ以外の不変証明に加え、いつ、誰が、どの項目に対し、どのような操作を行ったかの履歴を追うことが可能である。
しかしながら、一般的な電子署名・タイムスタンプの方式を採用する上記1)のような技術では、申請書や稟議書のように、文書に直接、追加や訂正、秘匿等々の部分操作がなされ、転々流通するような文書における原本性保証に関する考慮が何らなされておらず、その性質上、一切の加工が許されないため、このような文書についての取り扱いに際しては、逆に障害となる。
文書全体に付与されることを特徴とする従来の電子署名方式の課題について以下に説明する。
単一/複数文書、単一/複数ページから構成されるファイリング、文書群(以下、総称して「バインダー」と呼ぶ)に着目して説明すると、従来の電子署名方式では、バインダー全体に対して電子署名が付与されることが多く、この方式ではバインダー全体が変更されていることが検出できても、バインダー内のどの文書(ページ)が変更されているのかを検出することができなかった。
この対策として、バインダー内の文書(ページ)単位に電子署名を付与し、更にバインダーに対しても、電子署名を付与する方式が考えられ、これによれば、バインダー内のどの文書(ページ)が変更されているかに加え、その他の文書(ページ)は不変であることを検出することができる。
しかしながら、かかる方式においては、非改変文書が作成時点から改変文書と一緒に存在していたことを証明することができない。つまり、一部でも改変が検知されると、非改変文書の真正性、完全性の証明力が低下することとなる。
更に、バインダー内の文書(ページ)を、電子署名付きで差し替えられるといった脅威や、他のバインダーのある文書(ページ)を持ってきて置き換える等々の脅威が発生した場合、バインダー全体の電子署名からはそのような検出、証明を行うことができない。つまり、該バインダー内の文書(ページ)の作成された順序性や作成時点の各文書(ページ)の真正性、完全性を同時に証明することができない。
上記1)の技術では、以上の点が考慮されておらず、単に電子署名を使って電子文書を完全なまま、何ら変更が行われない状態で保存することを目的とするものに過ぎなかった。
このような、1)の技術の問題を解決する技術として、上記2)、3)のような技術が広まりつつある。つまり、文書の一部を変更しても、それ以外の部分は不変であることを証明可能とする技術である。
しかしながら、上記2)、3)のような技術でも、以下のような課題がある。具体的には、PDF(Portable Document Format)やMicrosoft Office Word等々の非構造化文書に着目した場合、このようなフォーマットは、文書内容そのものを表す「コンテンツ情報」と、そのヘッダやプロパティ(バージョン情報、総ページ数、ページ順序、各ページの回転角度、注釈、倍率等々を含む)を表す「メタ情報」で概ね構成されるが、上記2)、3)のような従来の技術では、「コンテンツ情報+メタ情報」をひとつの文書として考え、コンテンツ情報の内容に着目している。
例えば、単純に「氏名」、「住所」、「電話番号」の3つの情報から構成されるコンテンツ情報が存在した場合、公開時に「氏名」を一部隠す(墨塗り)という操作が行われても、「住所」、「電話番号」は不変であることを証明するだけに留まり、バインダー内の文書(ページ)のページ回転や注釈追加等々の操作に関して考慮されたものではない。つまり、バインダー内の文書(ページ)の回転角度、注釈等々のメタ情報は一切考慮されていない。
以上のような課題を総括し、実運用・利用形態に即して説明すると以下のようになる。
バインダー(紙文書)をスキャナ読取装置で取り込み、電子化文書(例えば、PDF形式)とし、電子署名・タイムスタンプを付与・保存することを考える。
まず、現行のe-文書法における紙文書の電子化文書生成の業務プロセスでは、通常、電子化作業者(実際にスキャニングを操作する者)と、電子化責任者(電子化されたものを最終確認・承認する者)とに分かれる。
電子化作業者は、スキャニングと同時に電子化文書と紙原本との同一性確認を行った上で、電子化作業者の電子署名を付与することとなる。この際、バインダー(紙)が数万文書(ページ)にもおよぶ場合には、業務効率の観点から、スキャナ読取装置に装備されたオートドキュメントフィーダーに差し込み、自動処理させることが通常行われ、電子化文書と紙原本との同一性確認はこの時点では省略されることが多い。
よって、該同一性確認が未実施のまま電子化作業者の電子署名が付与され、電子化責任者へ承認処理が回送される。この場合でも、電子化文書と紙原本との同一性確認はそれ以降の時点で行われる必要があり、それを最終承認者となる電子化責任者が行うかどうかは別として、電子上での電子化文書と紙原本との同一性確認を行う担当者を設けるケースも存在する。
その際、例えば、電子化の結果、ある文書(ページ)が意図しない向きや傾きになっている場合、事後見読上、見やすさという観点から支障をきたす結果となってしまうこともあり得る。しかし、スキャニングによる文書(ページ)の向きや回転誤りをその時点で修正する必要がある場合、もしくは修正せざるを得ない場合、再度、スキャニング作業から始めることは業務効率を低下させる。
よって、必然的に該電子化文書から修正を施すこととなるが、該電子化文書は既に電子化作業者の電子署名が付与されており、回転誤りを修正してしまうと、電子署名技術の性質上、一種の改変行為と判断され、このような利用形態に十分に対応することができない。
つまり、ある文書(ページ)を回転させても、コンテンツ情報自身は原本には変わりなく、紙原本と同一であることを電子的に証明できなければならない。いわゆる作成時点から変更が加えられていないことを検出・証明できることが必要である。
同様に、電子化責任者により、最終承認された電子署名・タイムスタンプ付きの電子化文書に対して、各文書(ページ)内に検索キーワードや注釈等々のコメント、ノートや添付資料を付加する場合や、文書(ページ)順序の変更、一部挿入・削除、改変等々が行われても、その検出が可能で、かつバインダー内の文書(ページ)の真正性、完全性を確認・検証できることが必要である。
本発明は、上述した課題を解決するためになされたものであり、ヘッダやプロパティ等々のメタ情報とコンテンツ情報を保有する電子文書において、メタ情報とコンテンツ情報を用いて該電子文書の真正性、完全性を確認・検証することができ、かつ第三者証明を行うこと可能とし、例えば、スキャニング(電子署名・タイムスタンプ付与)の後でも、ページ回転や注釈付加等々の操作に柔軟に対応することができる電子情報検証プログラム、電子情報検証装置および電子情報検証方法を提供することを目的とする。
上述した課題を解決するため、本発明は、電子情報の検証をコンピュータに実行させる電子情報検証プログラムであって、前記電子情報のメタ情報とコンテンツ情報のそれぞれを用いて、前記電子情報を特定するための特徴量情報を生成する特徴量情報生成ステップと、前記特徴量生成ステップにより生成された前記特徴量情報と前記電子情報とを対応付けて登録する登録ステップと、前記登録ステップにより登録された前記電子情報に対応する他の一の電子情報について、前記特徴量情報生成ステップにより特徴量情報を生成し、該生成された特徴量情報と、前記登録ステップにより登録された前記特徴量情報とを用いて、前記登録ステップにより登録された前記電子情報からの変更の有無を判断すると共に、該変更があると判断された場合はその変更部分の特定を行うことで、前記電子情報の検証を行う特徴量情報検証ステップとをコンピュータに実行させるものである。
また、本発明は、電子情報の検証を行う電子情報検証装置であって、前記電子情報のメタ情報とコンテンツ情報のそれぞれを用いて、前記電子情報を特定するための特徴量情報を生成する特徴量情報生成部と、前記電子情報と、前記電子情報から生成された前記特徴量情報とを対応付けて登録する登録部と、前記登録部により登録された前記電子情報に対応する他の一の電子情報について、前記特徴量情報生成部により特徴量情報を生成し、該生成された特徴量情報と、前記登録部により登録された前記特徴量情報とを用いて、前記登録部により登録された前記電子情報からの変更の有無を判断すると共に、該変更があると判断された場合はその変更部分の特定を行うことで、前記電子情報の検証を行う特徴量情報検証部とを備えてなる。
また、本発明は、電子情報の検証をコンピュータに実行させる電子情報検証方法であって、前記電子情報のメタ情報とコンテンツ情報のそれぞれを用いて、前記電子情報を特定するための特徴量情報を生成する特徴量情報生成ステップと、前記特徴量生成ステップにより生成された前記特徴量情報と前記電子情報とを対応付けて登録する登録ステップと、前記登録ステップにより登録された前記電子情報に対応する他の一の電子情報について、前記特徴量情報生成ステップにより特徴量情報を生成し、該生成された特徴量情報と、前記登録ステップにより登録された前記特徴量情報とを用いて、前記登録ステップにより登録された前記電子情報からの変更の有無を判断すると共に、該変更があると判断された場合はその変更部分の特定を行うことで、前記電子情報の検証を行う特徴量情報検証ステップとを備えてなる。
上述したように、本発明によれば、ヘッダやプロパティ等々のメタ情報とコンテンツ情報を保有する電子文書において、メタ情報とコンテンツ情報を用いて該電子文書の真正性、完全性を確認・検証することができ、かつ第三者証明を行うこと可能とし、例えば、スキャニング(電子署名・タイムスタンプ付与)の後でも、ページ回転や注釈付加等々の操作に柔軟に対応することができるという効果を奏する。
(実施の形態の概要)
まず、本発明の実施の形態の概要について説明する。
図1は、本発明の実施の形態の概要を説明するための原理説明図である。図1に示される実施の形態は、例えばスキャナ等で読み取られた電子文書等の電子情報を解析し、メタ情報とコンテンツ情報を抽出する電子情報解析部10と、メタ情報とコンテンツ情報から特徴量情報を生成する特徴量情報生成部20と、検証対象の特徴量情報の確認・検証を行う特徴量情報検証部50とを備える。
電子情報解析部10は、電子情報を入力して、電子情報の解析処理を行い、該解析処理によって電子情報のヘッダ、プロパティ等々の情報を含むメタ情報と、電子情報の本文内容を含むコンテンツ情報とを分離・区分して抽出する機能を有する。なお、電子情報には図示しないスキャナ等から読み取られる情報、その他の電子情報管理装置から送信される情報等が含まれる。
特徴量情報生成部20は、メタ情報抽出法判断部21とコンテンツ情報抽出方法判断部23、及びメタ情報特徴量生成部22とコンテンツ情報特徴量生成部24とを備える。
メタ情報抽出法判断部21とコンテンツ情報抽出方法判断部23のそれぞれは、電子情報解析部10により、電子情報から分離・区分されて抽出されたメタ情報とコンテンツ情報のそれぞれから、所定の項目に関する項目情報を選択すると共に、これら項目情報から特徴量情報を生成するための生成方法を選択するための判断を行う機能(以下必要に応じて、これら機能を選択・判断機能及びそれにより得られた情報(項目と生成方法)を選択・判断情報と記す)を有する。
また、メタ情報特徴量生成部22とコンテンツ情報特徴量生成部24のそれぞれは、メタ情報抽出方法判断部21とコンテンツ情報抽出方法判断部23のそれぞれの選択・判断情報に基づき、メタ情報とコンテンツ情報のそれぞれから特徴量情報(それぞれメタ情報関連パラメータ及びコンテンツ情報関連パラメータ)を生成する機能を有する。
ここで、メタ情報には、電子情報のヘッダ、プロパティ等々に相当する電子情報のバージョン情報、総ページ数、ページ順番、各ページの回転角度等々の項目や操作内容(追加、変更、削除、統合、回転等)に関する項目が含まれ、メタ情報抽出方法判断部21は、その選択・判断機能により、本実施の形態の運用上、原本性検証に必要な上記メタ情報内の任意の項目、あるいはメタ情報内の全ての項目を選択するに際して、その選択されるべき項目を判断する。
なお、いずれの項目を選択するかについては、電子情報の種別(例えば件名)に応じた項目を予めユーザである管理者(又は文書作成責任者)等がテーブル等に設定しておくようにすることができる。あるいは、取り扱う電子情報毎にその項目を設定するようにすることもできる。もっとも、例えば、複数のスキャニング画像を格納するファイルフォーマットのバージョン番号など、完全性・原本性に関係無い情報と判断された場合については、テーブルとして設定する必要は特にないことは言うまでもない。
更に、メタ情報抽出方法判断部21は、特徴量情報の生成方法に関して、複数の生成パターン(生成方法)を使い分けて、後述のメタ情報特徴量生成部22に特徴量情報を生成させるよう指示することができる。
生成パターンとしては、例えば、メタ情報の内容が第三者に漏洩しないよう、一方向性ハッシュ関数を用いてメタ情報からハッシュ値を算出して特徴量情報を生成するパターンと、第三者への漏洩等々のセキュリティは考慮せず、メタ情報の内容そのままの情報を利用して特徴量情報を生成するパターンと、メタ情報の内容をエンコードするパターン等を備える。
そして、更にメタ情報抽出方法判断部21はこれら特徴量情報の生成パターンを適宜選択することで、メタ情報の特徴量情報の生成パターン(生成方法)にバリエーションを持たせる機能を有する。
生成パターンの選択判断については、電子情報の種別(例えば件名)に応じた項目(生成パターン)を予め管理者(文書作成責任者)、もしくはユーザ(文書利用者)等がテーブル等に設定しておくようにすることができる。あるいは、取り扱う電子情報又はメタ情報毎にその幾つかの生成パターンを順次又はランダムに選択するように構成されていてもよい。
そして、メタ情報特徴量生成部22は、メタ情報抽出方法判断部21から得られた、メタ情報と特徴量生成パターンに基づいて、メタ情報の特徴量情報を生成する。
更に、メタ情報特徴量生成部22は、生成された各特徴量情報に対して、この特徴量情報が複数のメタ情報のうちのどの項目(メタ情報)に対応するかの情報、ならびに特徴量情報生成方法を表す情報を付加情報として付加し、これら特徴量情報と付加情報を電子情報とは個別に処理可能として登録する機能を有する。
次に、コンテンツ情報抽出方法判断部23は、その選択・判断機能により、本実施の形態の運用上、原本性検証に必要な複数のコンテンツ情報内の任意の項目を適宜選択、あるいはコンテンツ情報内の全ての項目を選択するに際して、その選択されるべき項目を判断する。
この項目としては、例えば、文書(ページ)単位、または必要に応じて、文書(ページ)単位中の任意の箇所を選択することができる。
なお、コンテンツ情報抽出方法判断部23により選択されるコンテンツ情報は、メタ情報抽出法判断部21により選択されるメタ情報と同一の電子情報に関するものであることは言うまでもない。
また、いずれの項目を選択するかについても、メタ情報抽出方法判断部21の場合と同様に、電子情報の種別(例えば件名)に応じた項目を予めユーザである管理者(又は文書作成責任者)等がテーブル等に設定しておくようにすることができる。あるいは、取り扱う電子情報毎にその項目を設定するようにすることもできる。
更に、コンテンツ情報抽出方法判断部23は、特徴量情報の生成方法に関して、複数の生成パターン(生成方法)を使い分けて、後述のコンテンツ情報特徴量生成部24に特徴量情報を生成させるよう指示する。
生成パターンとしては、例えば、コンテンツ情報の内容が第三者に漏洩しないよう、一方向性ハッシュ関数を用いてコンテンツ情報からハッシュ値を算出して特徴量情報を生成するパターンと、第三者への漏洩等々のセキュリティは考慮せず、コンテンツ情報の内容そのままの情報を利用して特徴量情報を生成するパターンと、コンテンツ情報の内容をエンコードするパターンと、コンテンツ情報の内容の統計量を抽出することで特徴量情報を生成するパターン等を備える。
そして、更にコンテンツ情報抽出方法判断部23はこれら特徴量情報の生成パターンを適宜選択することで、コンテンツ情報の特徴量情報の生成パターン(生成方法)にバリエーションを持たせる機能を有する。
生成パターンの選択判断については、メタ情報抽出方法判断部21の場合と同様に、電子情報の種別(例えば件名)に応じた項目(生成パターン)を予め管理者(文書作成責任者)、もしくはユーザ(文書利用者)等がテーブル等に設定しておくようにすることができる。あるいは、取り扱う電子情報又はコンテンツ情報毎にその幾つかの生成パターンを順次又はランダムに選択するように構成されていてもよい。
なお、原本検証を目的とし、メタ情報抽出法判断部21とコンテンツ情報抽出方法判断部23はそれぞれ、互いに連携し、電子情報の種別(例えば件名)に応じて選択すべきメタ情報およびその特徴量生成パターンと、選択すべきコンテンツ情報およびその特徴量生成パターンが定まるよう構成することもできる。すなわち、選択されるメタ情報とコンテンツ情報は、本実施の形態に示される後述のページ情報(メタ情報)とその内容(コンテンツ情報)、又は操作内容とその操作に係る内容(コンテンツ情報)のように、互いに関連性を有する関係となるようにそれぞれが選択判断される。
そして、コンテンツ情報特徴量生成部24は、コンテンツ情報抽出方法判断部から得られたコンテンツ情報と特徴量生成パターンに基づいて、コンテンツ情報の特徴量情報を生成する。
これにより、例えば、文書(ページ)単位に特徴量情報が生成され、又は必要に応じて、文書(ページ)中の任意の箇所に対して特徴量情報が生成される。
更に、コンテンツ情報特徴量生成部24は、生成された各特徴量情報に対して、このコンテンツ情報が複数のコンテンツ情報(文書)のうちのどのコンテンツ情報(文書のどの箇所)に対応するかの情報、ならびに特徴量情報生成方法を表す情報を付加情報として付加し、これら特徴量情報と付加情報を電子情報とは個別に処理可能として登録する機能を有する。
そして、特徴量情報生成部20は、メタ情報の特徴量情報と、コンテンツ情報の特徴量情報を一体化して特徴量情報として登録する。更に、この場合に、電子情報と特徴量情報のそれぞれ全体に対して、電子署名200とタイムスタンプ300を付与する機能を有する。
特徴量情報検証部50は、検証対象となる新旧のメタ情報の特徴量情報(各項目)を比較し、項目毎に変更有無の確認・検証を行う機能を有するメタ情報検証部51と、検証対象となる新旧のコンテンツ情報の特徴量情報(各項目)を比較し、項目毎に変更有無の確認・検証を行う機能を有するコンテンツ情報検証部52を有し、該検証対象の特徴量情報の確認・検証を行うことを支援する。
実施の形態1.
次に、図2を用いて本実施の形態をより具体的に説明する。図2は、実施の形態の電子情報検証装置を示すブロック図である。
図2の電子情報検証装置(電子情報原本性検証システム)1は、電子情報解析部10、特徴量情報生成部20、証明情報処理部30、登録・管理部40、特徴量情報検証部50、および処理制御部60を備える。
電子情報解析部10は、後述する処理制御部60から電子情報解析依頼を受信し、上述した動作を行う。以下、電子情報解析部10、特徴量情報生成部20の構成及び動作は図1において実施の形態の概要で説明したものであり、ここでの説明を省略する。
証明情報処理部30は、処理制御部60から証明情報処理依頼を受信し、第三者証明に必要な証明情報を取得・付与・検証する処理を司る。証明情報とは、具体的には電子署名200、タイムスタンプ300等々の情報を意味する。この証明除法は事後、対象となる電子情報、特徴量情報がいつ、誰により作成され、又は作成時点から変更がないこと、を第三者に証明するために必要な情報となる。
電子署名200については、CA(第三者発行機関: Certificate Authority)500Aにより、タイムスタンプ300については、TA(時刻配信局: Time Authority)500Bによりそれぞれ公的な第三者機関が発行したものを用いることで、当情報の信憑性、真実性を強化し、厳密な第三者証明を行うことが可能となる。
本実施の形態における証明情報処理部30の役割は、電子情報と特徴量情報のそれぞれ全体に対して、電子署名200とタイムスタンプ300をCA500A、TA500Bからそれぞれ取得して付与し、後にそれらを用いて電子情報の検証を行うものとして説明する。
証明情報処理部30は、証明情報付与部31と、証明情報検証部32の2つのサブ要素から構成される。
証明情報付与部31は、後述する処理制御部60から受信した証明情報付与対象の電子情報と特徴量情報に対し、証明情報の取得・付与を行う処理を司る。
証明情報検証部32は、後述する処理制御部60から受信した証明情報付与対象の電子情報と特徴量情報に対し、証明情報の検証を行う処理を司る。
登録・管理部40は、後述する処理制御部60から登録・管理依頼を受信し、電子情報と特徴量情報、証明情報との関連付け、登録・管理する処理を司る。
図2では、証明情報を電子情報、特徴量情報にそれぞれ包含して管理する様子を示しているが、電子情報と特徴量情報とは別々に管理する形態を採用してもよい。本実施の形態では、電子情報、特徴量情報にそれぞれ包含して管理する方式について説明する。
特徴量情報検証部50は、後述する処理制御部60から特徴量情報検証依頼を受信し、入力として、検証対象となる新旧の特徴量情報が与えられ、検証対象特徴量情報の検証処理を司る。
特徴量情報検証部50は、メタ情報検証部51と、コンテンツ情報検証部52の2つのサブ要素から構成される。
メタ情報検証部51は、後述する処理制御部60から受信した検証対象となる新旧の少なくとも二つの電子情報のそれぞれに対応するメタ情報の特徴量情報(各項目)を比較し、項目毎に変更有無の確認・検証を行う処理を司る。
同様に、コンテンツ情報検証部52は、後述する処理制御部60から受信した検証対象となる新旧の少なくとも二つの電子情報のそれぞれに対応するコンテンツ情報の特徴量情報(各項目)を比較し、項目毎に変更有無の確認・検証を行う処理を司る。
処理制御部60は、電子情報検証装置1の中枢的役割を果たすものであり、上記記載の各部への処理依頼を発行する。また、上記記載の各部からの要求を受信し、利用者700への通知を司る。
以上までが電子情報検証装置1における各部の構成・役割である。以下より、利用シーンを想定した電子情報検証装置1の適用例について説明する。
利用者が電子情報検証装置1を利用する場面として、バインダー(単一、もしくは複数枚で構成された紙文書)をスキャナ読取装置で取り込み、電子化文書(先で説明した「電子情報」に該当)とし、該電子化文書に対して電子署名200、タイムスタンプ300を付与して、該電子化文書を保存する場面について説明する。
この一連の操作は、先にも説明したとおり、現行のe-文書法における紙文書の電子化文書生成の業務プロセスに相当する。また、電子署名200、タイムスタンプ300が付与された保存済みの電子化文書は、事後、必要に応じて取り出され、以下のような操作が行われることが想定される。
具体的には、スキャニングによる電子化の結果、ある文書(ページ)が意図しない向きや傾きになっていることを確認し、修正する場合や、各文書(ページ)内に検索キーワードや注釈等々のコメント、ノートや添付資料を付加する場合や、文書(ページ)順序の変更、一部挿入・削除等々を行う場合における操作が想定される。
この場合、電子署名200、タイムスタンプ300が付与された保存済みの電子化文書に対して、このような操作が行われても、その検出が可能で、かつバインダー内の文書(ページ)の真正性、完全性を保証することが求められる。
具体的には、変更された文書(ページ)と変更されていない文書(ページ)が区別でき、変更文書(ページ)以外は改変されていないことの証明、電子化文書(原本)の作成者、変更文書(ページ)における変更者の特定等々、これら一連の操作に対する証拠性、証明性の確保が求められる。また、例えば、スキャニング時の回転誤りを修正しただけで、原本は変更していないことを証明できることも求められる。
よって、利用者は事後、裁判沙汰等々になった場合に証拠として提出できるよう記録を残す手段として、また、第三者に対して電子化文書に対する証明を行う際に電子情報検証装置1を利用する。
本実施の形態では、上記一連の操作におけるスキャニング時の回転誤り修正を行うシーンについて説明する。更に、バインダーは3ページで構成されていることを想定し、説明する。
本利用シーンの登場人物として、バインダー(紙文書)をスキャナ読取装置で取り込み、電子化文書を電子情報検証装置1に登録する電子化作業者(電子化作業者クライアント)700Aと、電子化作業者700Aによって登録された電子化文書を電子情報検証装置1から取り出し、回転誤りの修正を行い、電子情報検証装置1に再登録を行う変更担当者(変更担当者クライアント)700Bと、電子情報検証装置1に登録されている電子化文書に対して第三者証明を行うための検証担当者700C(検証担当者クライアント)の3名が登場する。以上3名は、電子情報検証装置1を利用して以下のプロセスを行うものとする。
(プロセス1:作成)
電子化作業者700Aは、バインダー(紙文書)をスキャナ読取装置で取り込み、電子化文書を電子情報として入力し、電子情報検証装置1に登録を行う。
(プロセス2:変更)
スキャニング時の回転誤りを検知し、該ページの回転操作を行う。変更担当者700Bは、電子化作業者700Aが登録した電子情報に対して上記操作を行い、電子情報検証装置1に再度登録を行う。
(プロセス3:検証)
プロセス1、2の処理後、検証担当者700Cによって、変更箇所の特定と、変更箇所以外の不変確認、及びその検証を行う。
上記利用シーンにおいて、電子情報検証装置1では電子化作業者700A、変更担当者700B、検証担当者700Cに対して以下の3機能を提供する。
(A)登録機能(電子情報の登録時に電子化作業者700Aが利用)
(B)更新機能(電子情報の変更時に変更担当者700Bが利用)
(C)検証機能(電子情報の検証時に検証担当者700Cが利用)
以下より、上記(A)〜(C)の各事象における作用について詳細に説明する。
本利用シーンの事前条件として、電子化作業者700A、変更担当者700B、検証担当者700Cは、電子情報検証装置1を利用できるよう、利用者認証情報が事前登録されており、厳密なアクセス制御がなされていることを前提とする。本利用シーンでは、電子化作業者700A、変更担当者700B、検証担当者700Cの各人が電子情報検証装置1にアクセス/ログインするところから始まる。
まず、(A)における電子情報の登録時の処理から説明する。図3は、登録処理のフローチャート図である。
電子化作業者700Aは、バインダー(紙文書)をスキャナ読取装置のオートドキュメントフィーダーに差し込み、取り込みボタンを押下する。画面上には取り込まれたバインダーの内容が表示され、「登録」メニューが選択され、確定ボタンが押下されると、電子情報検証装置1内の処理制御部60に対して、電子情報の登録依頼が発行される。この時、電子化された電子情報が渡される。
電子情報検証装置1内の処理制御部60は、電子情報登録依頼を受信し(ステップST-R1)、入力された電子情報をパラメータとして、電子情報解析部10に対して解析処理依頼を発行する(ステップST-R2)。
電子情報解析部10は、受信した電子情報に対する解析処理を実行する(ステップST-R3)。電子情報解析部10は、該解析処理によって抽出される該電子情報のヘッダ、プロパティ等々に相当する電子情報のバージョン情報、総ページ数、ページ順番、各ページの回転角度等々の情報及び操作内容に関するメタ情報と、電子情報の本文内容を含むコンテンツ情報とに分離・区分を行う。
図4は、その様子を示している。図4によれば、3ページから構成されるバインダー(紙文書)がスキャナ読み込み処理により、電子情報として取り込まれ、電子情報解析部10により、メタ情報とコンテンツ情報とに分離・区分されている様子が示されている。
更に、図4によれば、該電子情報のバージョン情報(1.3(図中M-1))、総ページ数(3(図中M-2))、ページ順番(1→2→3(図中M-3))、各ページの回転角度(全ページの回転角度は0(ゼロ)(図中M-4))等々の情報がメタ情報として抽出され、1ページ目から3ページ目の各本文の内容が、コンテンツ情報として配置されている様子が示されている。ここでコンテンツ情報とメタ情報とは同じ電子情報又は電子情報の同じ部分から抽出されるものとして一定の関連性を有している。
続けて、電子情報解析部10は、分離・区分したメタ情報とコンテンツ情報をパラメータとして、特徴量情報生成部20に対して特徴量情報生成依頼を発行する(ステップST-R4)。
特徴量情報生成部20は、電子情報解析部10から特徴量情報生成依頼を受信し(ステップST-R5-1)、まずメタ情報の特徴量生成処理から処理を開始する。
特徴量情報生成部20内のメタ情報抽出方法判断部21は、抽出する項目の選択、および特徴量情報の生成方法に関する選択について上述した選択・判断機能による判断を行う(ステップST-R5-2)。具体的には、運用上、原本性検証に必要なメタ情報内の任意の項目を適宜選択、あるいはメタ情報内の全ての項目を選択する判断処理を行う。
本実施の形態は、スキャニング時の原稿の回転誤り(スキャニング方向に対する原稿の向きの誤り)を修正する場合に本発明を適用した場合について説明するものであるため、各ページの回転角度(図中M-4)に対する特徴量情報を生成するのはもちろんのこと、総ページ数(図中M-2)、ページ順番(図中M-3)についても生成することとする。
この例では、抽出されるメタ情報の項目の判断情報は、あらかじめ運用前に決められ、該メタ情報抽出方法判断部21内に定義体として保持されているものとする。このように、原本性検証に必要なメタ情報内の任意の項目を適宜選択する方式を採用することにより、メタ情報特徴量のデータ削減を図ることができる。
更に、特徴量情報の生成パターンとして、メタ情報の内容が第三者に漏洩しないよう、一方向性ハッシュ関数を用いてハッシュ値を算出するか、特に上記第三者への漏洩等々のセキュリティは考慮せず、メタ情報の内容そのままの情報を利用するか、更には、メタ情報の内容をエンコードするか等々について適宜選択を行う。
本実施の形態では特に、スキャニング時の回転誤り修正することを想定しているため、各ページの回転角度(図中M-4)が新規作成時点からどのように変更が加えられたか、つまり、新規作成時点の全ページの回転角度は0(ゼロ)度であったが、変更後、どのような角度修正が行われたかを確認するためにも、この場合は、メタ情報の内容そのままの情報を利用するという選択がなされる。
該メタ情報の特徴量情報の生成方法については、概要で説明したように、メタ情報中の各項目によって適宜選択されるものであり、抽出する項目の判断同様、該メタ情報の特徴量情報の生成方法については、あらかじめ運用前に決められ、該メタ情報抽出方法判断部21内に定義体として保持されている。
次に、メタ情報特徴量生成部22へ処理が移され、メタ情報抽出方法判断部21から特徴量情報生成のための情報(選択・判断情報)を取得し、該情報を基に、メタ情報の特徴量情報の生成を行う(ステップST-R5-3)。
図5は、その様子を示している。図5によれば、選択・判断情報(Meta-define)に即して、メタ情報特徴量生成部22でメタ情報の特徴量が生成されており、メタ情報のどの項目に対応するかの情報を「項目名」として対応付けて記録し、更に特徴量情報の生成方法を示す情報と対応付けて(本実施の形態の場合、「そのまま」という表現を)記録している様子を示している。
これにより、抽出項目として、総ページ数、ページ順序、回転角度の情報がそのままの値で記録されていることが後で利用者により確認できることとなる。本実施の形態での「項目名」と、「生成方法」は、付加情報に相当する。本実施の形態では、特徴量情報をそのままの形式で記録しているが、選択・判断情報(Meta-define)によっては、ハッシュ値変換したものやエンコードしたもの等々を記録する場合もあり得る。
次に、コンテンツ情報の特徴量生成処理を行う(ステップST-R5-4)。これにより、特徴量情報生成部20内のコンテンツ情報抽出方法判断部23は、抽出する項目および特徴量情報の生成方法に関する判断を行う。
本実施の形態では、バインダー内の全3ページに関し、ページ毎の原本性検証に特化して説明する。場合によっては、1、2ページのみ原本性検証の対象にする場合や、更に詳細にページ内の任意の項目、部分まで原本性検証を行う場面も想定されるが、ここでは、バインダー内のページ単位に対し、事後、原本性検証を行うことを想定する。
この抽出する項目の判断情報は、あらかじめ運用前に決められ、該コンテンツ情報抽出方法判断部23内に定義体として保持されている。このように、原本性検証に必要なコンテンツ情報内の任意の項目を適宜選択する方式を採用することにより、コンテンツ情報特徴量のデータ削減を図ることができる。
更に、特徴量情報の生成パターンとして、コンテンツ情報の内容が第三者に漏洩しないよう、一方向性ハッシュ関数を用いてハッシュ値を算出するか、特に上記第三者への漏洩等々のセキュリティは考慮せず、コンテンツ情報の内容そのままの情報を利用するか、コンテンツ情報の内容をエンコードするか、更にはコンテンツ情報の内容の統計量を抽出するか等々について適宜選択する。
なお、ここで、特徴量情報の生成パターンとして、「統計量を抽出する」とは、予めコンテンツ情報から所定の統計値を取得し、該取得値に基づいて特徴量情報を生成するようにしたものであり、例えば、コンテンツ情報として、「0010110100011100」のような2進数データが存在する場合、「1」の数の合計が奇数個だったら、'a'を記録するといった統計処理方法により統計値を出力し、その統計値を用いて特徴量情報を生成する場合がある。
この統計量を抽出することにより特徴量情報を生成することにより、上記2進数データのような16ビットを記録するのと比べ、'a'だけを記録すれば1ビットで済むため、特徴量情報(PIAT署名情報)の削減を図ることもできる。
本実施の形態では、コンテンツ情報の漏洩防止に着目し、一方向性ハッシュ関数を用いてハッシュ値を算出する方式を利用するという選択がなされる。該コンテンツ情報の特徴量情報の生成方法については、コンテンツ情報中の各項目によって適宜選択されるものであり、抽出する項目の判断同様、該コンテンツ情報の特徴量情報の生成方法については、あらかじめ運用前に決められ、該メタ情報抽出方法判断部23内に定義体として保持されている。
次に、コンテンツ情報特徴量生成部24へ処理が移され、コンテンツ情報抽出方法判断部23から特徴量情報生成のための選択・判断情報を取得し、該選択・判断情報を基に、コンテンツ情報の特徴量情報の生成を行う(ステップST-R5-5)。
図6は、その様子を示している。図6に示されるように、選択・判断情報(Contents-define)に即して、コンテンツ情報特徴量生成部24でコンテンツ情報の特徴量が生成されており、コンテンツ情報のどの項目に対応するかの情報を「項目名」として対応付けて記録し、更に特徴量情報の生成方法を示す情報と対応付けて(本実施の形態の場合、一方向性ハッシュ関数を用いてハッシュ値を算出したことを示す「Hash」という表現を)記録している様子が示されている。
これにより、抽出項目として、1ページ目〜3ページ目の本文内容がハッシュ値として記録されていることが後で確認できる。
例えば、1ページ目のコンテンツ情報に対する特徴量として、[abc123]が、2ページ目のコンテンツ情報に対する特徴量として、[def456]が、3ページ目のコンテンツ情報に対する特徴量として、[ghi789]がそれぞれ算出・記録されている。
本実施の形態での「項目名」と、「生成方法」は、付加情報に相当する。更に、この特徴量情報の生成において、一方向性ハッシュ関数を用いてハッシュ値を算出する際、コンテンツ情報に乱数や日時情報を付加してハッシュ値を算出するようにしてもよい。
ハッシュ値を用いるのは、コンテンツ情報の内容が第三者に漏洩しないようにするためであり、一方向性ハッシュ関数の特性として、算出されたハッシュ値からは元の内容が推測できない形式になっている。しかしながら、もともとの本文の内容を推測してハッシュ値を算出し、記録されているハッシュ値と比較して一致すれば、もともとの本文には推測した内容が記録されていることを容易に確認することが可能となる。これを防止するために、乱数や日時情報を付加することで、その脅威を防止することが可能となる。
しかしながら、本実施の形態では、ページ毎のハッシュ値算出を行っているため、本文内容の推測が困難(例えば、もともとの本文は、章や文節等々から構成され、文字数も多い)という理由から必ずしも乱数や日時情報を付加する必要はない。ただし、ページ内のある任意の項目(例えば、氏名、性別、電話番号等々)に関して特徴量を生成した場合、情報量の少なさから考慮して、上記のような方法で本文内容の推測が容易と判断し、この場合は、乱数や日時情報を付加することが得策と言える。これらの情報を付加するか否かは、元の情報量や状況に応じて適宜選択されることが望ましい。
続けて、特徴量情報生成部20は、メタ情報とコンテンツ情報の2つの情報を結合し(ステップST-R5-6)、一つの特徴量情報として電子情報解析部10へ出力する。
図7は、その結合の様子を示している。
次に、電子情報解析部10は、処理制御部60へ生成された特徴量情報を渡し、処理制御部60は、電子情報と該特徴量情報のペアを入力パラメータして、証明情報処理部30内の証明情報付与部31に対して、証明情報付与依頼を発行する(ステップST-R6)。
証明情報付与部31は、第三者証明に必要な電子署名200、タイムスタンプ300の生成依頼を行う。この時、電子署名200については、電子化作業者700Aの電子署名が付与される。先に説明したとおり、電子署名200については、CA500Aに対して、タイムスタンプ300については、TA500Bに対してそれぞれ発行を依頼する。
処理制御部60から受信した電子情報と特徴量情報のペアをCA500A、TA500Bへそれぞれ送付し、該電子情報、ならびに特徴量情報に対する電子署名200、タイムスタンプ300を取得する(ステップST-R7)。
これらの取得後、処理制御部60へ証明情報(電子署名200、タイムスタンプ300)付きの電子情報、ならびに特徴量情報を返信する。
処理制御部60は、証明情報付与部31からの証明情報付き電子情報、ならびに特徴量情報を取得し、登録・管理部40へ登録処理依頼を発行する。登録・管理部40は、各情報を一体化した形で格納し版数管理を行う(ステップST-R8)。
以上の処理が完了すれば電子化作業者700Aに対して、電子情報登録の完了を示す管理証と正常終了の旨を出力する。その後、電子化作業者700Aは、ログアウトし、登録処理を正常終了する。異常が発生した場合は、その旨、電子化作業者700Aにエラー通知し、異常終了する。
図8は、登録時の管理証の内容例を示している。当管理証は、預かり証として該システム内、もしくは専用の業務サーバ等々にて管理され、次回以降、当電子情報の更新、閲覧、検証を行う際に利用することとなる。
該管理証は、改ざん検出、盗み見防止等々の対策が必要なのはもちろんのこと、少なくとも該システム内にログインできる者のみ取り扱いが可能となるように、もしくは許可された者のみ該管理証を取り扱えるよう制御される仕組みが必要なのは言うまでもない。
図9は、登録時の格納状態のイメージを示しており、電子情報ID=8919201が割り振られ、該電子情報IDを検索タグとして各情報が関連付けられた形で管理されており、電子情報、特徴量情報にそれぞれ電子署名200、タイムスタンプ300が付与されている様子を示している。
以上までが(A)における電子情報の登録時の処理である。続けて、(B)における電子情報の更新時の処理を説明する。図10は、更新処理のフローチャート図である。なお、ステップST-U1、ST-U2の動作は変更担当者による動作を示しており、かかる動作によって、本処理が開始される。
変更担当者700Bは、登録・管理部40に登録された電子情報に対して、先に説明した管理証を基に全文検索を行い、画面上に表示された電子情報に対し、1件ずつ内容確認処理を行う(ステップST-U1)。この時、スキャニング時の回転誤りを発見し(ステップST-U2)、それを修正する動作が開始される(ステップST-U3以降)。
図11はその様子を示している。具体的には、先に登録した電子情報ID=8919201の電子情報の2ページ目が回転誤りを起こしており、意図した向きで電子化されていないことが発見されるものとする(ステップST-U2)。
ここで、変更担当者700Bは、図11に示されるように、まず、該電子情報の2ページ目を正しい向きに修正する操作を行う(ステップST-U2-1)。修正後、画面中に示された原本修正ボタンを押下すると(ステップST-U2-2)、原本修正確認画面が表示され、修正内容を反映するか否かが問われるので、確定ボタンを押下する(ステップST-U2-3)。これら操作を経て、該修正に伴う更新依頼を処理制御部60に対して発行する。この時、回転修正済みの電子情報と管理証が渡される。
処理制御部60は、電子情報更新依頼を受信し(ステップST-U3)、入力された電子情報をパラメータとして、電子情報解析部10に対して解析処理依頼を発行する(ステップST-U4)。
電子情報解析部10は、受信した電子情報に対する解析処理依頼を実行する(ステップST-U5)。登録処理で説明したとおり、電子情報解析部10は、電子情報からメタ情報とコンテンツ情報とを分離・区分して抽出を行う。
図12は、その様子を示している。この時、図中MU-1から明らかなように、2ページ目に該当する回転角度が“Right90”になっており、電子情報の操作内容として、2ページ目を元の状態から右90度回転させたことが抽出されて、メタ情報中のPageLotとして記録されていることがわかる。
続けて、電子情報解析部10は、分離・区分したメタ情報とコンテンツ情報をパラメータとして、特徴量情報生成部20に対して特徴量情報生成依頼を発行する(ステップST-U6)。
特徴量情報生成部20は、電子情報解析部10から特徴量情報生成依頼を受信し、(ステップST-R7-1)まず、メタ情報の特徴量生成処理から処理を開始する。
特徴量情報生成部20内のメタ情報抽出方法判断部21は、特徴量情報生成のための上述した選択・判断情報(新規登録時に使用した同一の情報: Meta-define)を取得する(ステップST-R7-2)。続けて、該選択・判断情報をメタ情報特徴量生成部22へ渡し、選択・判断情報を基に、メタ情報の特徴量情報の生成を行う(ステップST-R7-3)。
図13は、その様子を示している。図13のとおり、選択・判断情報(Meta-define)に即して、メタ情報特徴量生成部22でメタ情報の特徴量が生成されており、図中MU-2に示すとおり、2ページ目を元の状態から右90度回転させた情報もそのままの状態で抽出・記録されていることがわかる。
次に、コンテンツ情報の特徴量生成処理を継続する。特徴量情報生成部20内のコンテンツ情報抽出方法判断部23は、特徴量情報生成のための選択・判断情報(新規登録時に使用した同一の情報: Contents-define)を取得する(ステップST-U7-4)。続けて、該選択・判断情報をコンテンツ情報特徴量生成部24へ渡し、選択・判断情報を基に、コンテンツ情報の特徴量情報の生成を行う(ステップST-U7-5)。
その様子は、図6で示したとおりとなる。すなわち選択・判断情報(Contents-define)に即して、コンテンツ情報特徴量生成部24でコンテンツ情報の特徴量が生成されており、修正後のコンテンツ情報に関しては、登録処理時と同じ結果が得られていることがわかる。これは、2ページ目を元の状態から右90度回転させ、該電子情報を再保存した際、2ページ目のコンテンツ情報の内容が右90度回転させた状態に直接変更されたわけではなく、2ページ目のコンテンツ情報の内容自身は反映されない。
つまり、「次回以降、画面上に表示させる際は、2ページ目を右90度回転させて表示しなさい」という命令を含んだメタ情報が追記、もしくは上書きされることになり、その結果、2ページ目のコンテンツ情報の内容は不変ということとなり、登録処理時と同じ結果が得られる。このように非構造化文書のフォーマットを取り扱う各種エディター、アプリケーションの多くは、コンテンツ情報の内容は加工されないことが多く、基本的に表示させるための情報としてメタ情報に記録されることが多い。
続けて、特徴量情報生成部20は、メタ情報とコンテンツ情報の2つの情報を結合し(ステップST-U7-6)、一つの特徴量情報として電子情報解析部10へ出力される。図14は、その結合の様子を示している。
次に、電子情報解析部10は、処理制御部60へ生成された特徴量情報を渡し、処理制御部60は、電子情報と該特徴量情報のペアを入力パラメータして、証明情報処理部30内の証明情報付与部31に対して、証明情報付与依頼を発行する(ステップST-U8)。
証明情報付与部31は、第三者証明に必要な電子署名200、タイムスタンプ300の生成依頼を行う。この時、電子署名200については、変更担当者700Bの電子署名が付与される。先に説明したとおり、電子署名200については、CA500Aに対して、タイムスタンプ300については、TA500Bに対してそれぞれ発行を依頼する。処理制御部60から受信した電子情報と特徴量情報のペアをCA500A、TA500Bへそれぞれ送付し、該電子情報、ならびに特徴量情報に対する電子署名200、タイムスタンプ300を取得する(ステップST-U9)。これらの取得後、処理制御部60へ証明情報(電子署名200、タイムスタンプ300)付きの電子情報、ならびに特徴量情報を返信する。
処理制御部60は、証明情報付与部31からの証明情報付き電子情報、ならびに特徴量情報を取得し、登録・管理部40へ更新処理依頼を発行する。登録・管理部40は、各情報を一体化した形で格納し版数管理を行う(ステップST-U10)。
本実施の形態では、旧版の電子情報の上書きを行うのではなく、事後、各版数の第三者証明ができるよう全ての版数を残す形で格納しているが、版数管理にて全版数の電子情報を保持しない形態もあり得る。
以上の処理が完了すれば変更担当者700Bに対して、電子情報更新の完了を示す管理証と正常終了の旨が出力される。その後、変更担当者700Bは、ログアウトし、更新処理を正常終了する。異常が発生した場合は、その旨、変更担当者700Bにエラー通知がなされ、異常終了する。
図15は、更新時の管理証の内容例を示している。図15に示される管理証は、預かり証として電子情報検証装置1内、もしくは専用の業務サーバ等々で管理され、次回以降、当電子情報の更新、閲覧、検証を行う際に利用されることとなる。該管理証は、改ざん検出、盗み見防止等々の対策が必要なのはもちろんのこと、少なくとも該システム内にログインできる者のみ取り扱い可能であり、もしくは許可された者のみ取り扱い可能となるよう制御される仕組みが必要なのは言うまでもない。
図16は、更新時の格納状態のイメージを示しており、電子情報ID、版数を検索タグとして各情報が関連付けられた形で管理されており、更新済み電子情報、特徴量情報にそれぞれ変更担当者700Bの電子署名200‐2、タイムスタンプ300−2が付与されている様子を示している。第1版の電子情報、特徴量情報には、電子化作業者700Aの電子署名200−1、タイムスタンプ300−1が付与されており、第1版、第2版はそれぞれの担当者により作成されたことを示している。図中の各版の電子情報内に記載された全3ページのイメージは、実際に該電子情報を表示・閲覧した状態を表している。
本実施の形態では、スキャニング時の回転誤り修正を行う場面を想定して記載したが、検索キーワードや注釈等々のコメント追加他、種々の操作に関しても同様の処理で実現可能である。
以上までが(B)における電子情報の更新時の処理である。続けて、(C)における電子情報の検証時の処理を説明する。図17は、検証処理のフローチャート図である。
検証担当者700Cは、電子情報検証装置1内、もしくは専用の業務サーバ等々で管理された登録済み電子情報の管理証から検証対象を検索し(ステップST-V1)、目的の電子情報を画面上に表示させる。続けて、画面中の「検証」メニューを選択する。確定ボタンが押下されると、処理制御部60に対して、電子情報の検証依頼が発行される。この時、検証対象の管理証(最新版)が渡される。
本実施の形態では、先に登録した電子情報ID=8919201を検証する場面を想定し、図15で示したような該電子情報の最新版(第2版)の管理証が渡される。検証担当者700Cが検証対象とするものとして、スキャナ取り込み文書に対して何等かの修正が加えられたものを重点的に確認する場面が想定され、本実施の形態では、スキャナ取り込みされた電子化文書の回転誤りを修正していることから、検証担当者700Cは該電子情報を検証対象として選択することが考えられる。
また、該管理証に格納された件名には、“スキャナ取り込み文書(回転修正済み”という記載内容から検証対象とする場合もあり得るし、修正された電子情報群は一覧として管理され、一括して検証対象とする場合もあり得る。
処理制御部60は、電子情報検証依頼を受信し(ステップST-V2)、入力された管理証をパラメータとして、登録・管理部40に対して、該当する電子情報と特徴量情報の取得依頼を発行する(ステップST-V3)。取得依頼を受信した登録・管理部40は、入力として与えられた管理証の内容から該当する電子情報を検索し、該電子情報の特徴量情報の取り出しを行う(ステップST-V4)。この時、電子情報ID=8919201、版数=2.0の内容を含む管理証を受信することを想定し、特徴量情報(第2版)、前版の特徴量情報(第1版)の2つの電子情報の特徴量情報の取り出しを行い、処理制御部60へ返す。
これら2つの情報を受信した処理制御部60は、証明情報処理部30内の証明情報検証部32に対し、証明情報検証依頼を発行する(ステップST-V5)。この時、特徴量情報(第2版)と特徴量情報(第1版)の2つの情報が渡される。
証明情報検証依頼を受信した証明情報検証部32は、受信した特徴量情報(第2版)と特徴量情報(第1版)の2つの情報を用いて証明情報検証処理を実行する(ステップST-V6)。具体的には、特徴量情報(第2版)と特徴量情報(第1版)に付与されている電子署名200、タイムスタンプ300のそれぞれについての検証処理依頼を、CA500A、TA500Bのそれぞれに発行し、処理結果を得る(ステップST-V7)。
その結果、電子署名200、タイムスタンプ300のいずれかがNGである場合は、その旨が処理制御部60を通じて検証担当者700へ通知され、処理制御部60は処理を終了する。
NGでなければ(検証OKであれば)、処理を継続し、処理制御部60は、特徴量情報検証部50に対して特徴量情報検証依頼を発行する(ステップST-V8)。この時、特徴量情報(第2版)と特徴量情報(第1版)の2つの情報が渡される。
特徴量情報検証依頼を受信した特徴量情報検証部50は、受信した特徴量情報(第2版)と特徴量情報(第1版)の検証処理を実行する。
まず、メタ情報検証部51によるメタ情報の検証処理を実行する(ステップST-V9)。この時、メタ情報の検証処理においては、ステップST-V4で取得した特徴量情報(第2版)と、特徴量情報(第1版)を用いて、メタ情報中の各項目の比較が行われる。ここでは、第1版の状態からの変更の有無、変更があると判断された場合はどのように変更が加えられたかの判断、及び変更箇所(非変更箇所)の特定(判断)を行う。
図18は、その検証の様子を示した図である。例えば、項目名(総ページ数)に関しては、第1版、第2版共に抽出項目(3ページ)がそのままの情報で記録されており、同一のため変更がない(ステップST-V9-1)。項目名(ページ順序)に関しても同様の比較で検証可能である。
逆に、項目名(回転角度)に関しては、第1版が全ページの回転角度が0(ゼロ)度であるのに対し、第2版は、2ページ目の回転角度が右90度となっていて他と異なり、第1版から第2版への更新時に変更されたことを検証することが可能になる(ステップST-V9-2)。なお、このメタ情報の項目は第1版に対する第2版の操作内容に関するメタ情報にも相当している。
上記検証により、総ページ数、ページ順序は第1版の状態から変更されておらず、回転角度のみが2ページ目のみ第1版の状態から右90度回転されたことがわかる。
続けて、コンテンツ情報検証部52によるコンテンツ情報の検証処理を実行する(ステップST-V10)。この時、メタ情報同様、以下の手順を踏んでコンテンツ情報の検証処理を実行する。ステップST-V4で取得した特徴量情報(第2版)と、特徴量情報(第1版)を用いて、コンテンツ情報中の各項目を比較することで、第1版の状態からどのように変更が加えられたか、変更が加えられていない部分を判断する。
図19は、その検証の様子を示した図である。例えば、1ページ目に関しては、第1版、第2版共に抽出項目=abc123というハッシュ値が記録されており、これらは同一のため変更がない(ステップST-V10-1)。また、3ページ目に関しても、第1版、第2版共に抽出項目=ghi789というハッシュ値が記録されており、これらも同一のため変更がない(ステップST-V10-2)。2ページ目に関しても同様の比較で検証可能であり、ハッシュ値の一致から変更がないことを検証することが可能となる。上記検証により、全ページ数のコンテンツ情報は第1版の状態から変更されていないことがわかる。
特徴量情報検証部50は、メタ情報検証部51と、コンテンツ情報検証部52から得た各検証結果をマージ・分析し、処理制御部60へ検証結果を返す。処理制御部60は検証担当者700Cへ検証結果を出力する(ステップST-V11)。
図20は、この検証結果から得られる検証結果出力画面の一例を示している。例えば、画面中に該文書のページ構成が表示される。本実施の形態では僅かの3ページで構成される文書を想定していたため、全ページが表示される。各ページは原本修正確認を行うため押下(クリック)できる状態になっており、押下により各ページの原本修正情報を参照することができる。
また各ページの右上には原本修正状態を示すアイコンが表示され、例えば、◎印はメタ情報、コンテンツ情報共に原本から全く変更が加えられていない状態を表し、○印はメタ情報のみ変更が加えられている状態、△印はコンテンツ情報のみ変更が加えられている状態、×印はメタ情報、コンテンツ情報共に原本から変更が加えられている状態を表している。検証担当者700Cはこのような表示を確認することにより、視覚的に検証結果を確認することが可能となる。
本実施の形態の場合、2ページ目のみ右90度回転されたという検証結果が得られており、メタ情報のみ変更が加えられている状態(○印)が表示されていることがわかる。
検証担当者700Cは、2ページ目を押下することにより(ステップST-V11-1)、2ページ目の原本修正情報画面が表示され、原本修正内容を確認することができる(ステップST-V11-2)。検証担当者700Cは、画面中の終了ボタンを押下することにより、検証処理を終了する(ステップST-V11-3)。以上の処理が正常に完了すればログアウトし、検証処理を正常終了する。異常が発生した場合は、その旨、検証担当者700Cにエラー通知し、異常終了する。以上が(C)における電子情報の検証時の処理である。
なお、本実施の形態における検証処理では、第2版を最新版として、第1版(原本)との比較を行うことで実現しているが、最新版が第2版の場合しか検証できないというわけではなく、以降、版数アップが行われた場合でも、どの版数時点から検証するかを適宜選択することが可能であり、その場合、第1版(原本)の状態から、いつ、誰が、どの文書のどのページを、どのように変更したかを追うことが可能となり、監査証跡情報の管理・検証が容易に実現可能である。また、検証担当者700Cのみが本検証機能を利用する場合に限らず、電子化作業者700A、変更担当者700B自身も操作後に、該電子情報の確認を行う場合に利用する場合もあり得る。
また、本実施の形態では登録・管理部40から、検証情報となる特徴量情報を取得し、該特徴量情報を入力パラメータとして特徴量情報検証部40へ検証依頼を発行しているが、最新の電子情報を電子情報解析部10に渡し、リアルタイムに電子情報解析、および特徴量情報生成を行うようにしてもよい。この場合、登録・管理部40に格納されている特徴量情報は第1版(原本)のみ取得し、電子情報解析部10から取得した最新版の特徴量情報を特徴量情報検証部50へ渡し、確認のための検証を行うようにしてもよい。
実施の形態2.
次に、本発明の実施の形態2を説明する。本実施の形態では、2つのバインダーを1つのバインダーに統合(マージ)するシーンについて説明する。前述の実施の形態と同じように、それぞれのバインダーは3ページで構成されているものとする。図21は、本実施の形態を説明した図である。
本利用シーンの登場人物として、電子化作業者700Aと変更担当者700Bと検証担当者700Cと統合担当者700Dが登場する。電子化作業者700Aは、バインダー(紙文書)をスキャナ読取装置で取り込み、電子化文書を電子情報検証装置1に登録する。変更担当者700Bは、電子化作業者700Aによって登録された電子化文書を電子情報検証装置1から取り出し、回転誤り修正を行い、電子情報検証装置1に再登録を行う。
統合担当者700Dは、変更担当者700Bによって登録された2つの電子化文書を電子情報原本性システム1から取り出し、2つの電子化文書を統合(マージ)し、電子情報検証装置1に再登録を行う。そして、検証担当者700Cは、電子情報検証装置1に登録されている電子化文書に対して第三者証明を行う。以上4名は、電子情報検証装置1を利用して以下のプロセスを行うものとする。
(プロセス1:作成)
電子化作業者700Aは、バインダー(紙文書)をスキャナ読取装置で取り込み、電子化文書を電子情報として入力し、電子情報検証装置1に登録を行う。
(プロセス2:変更)
変更担当者700Bは、スキャニング時の回転誤りを検知し、該ページの回転操作を行う。変更担当者700Bは、電子化作業者700Aが登録した電子情報において上記操作を行い、電子情報検証装置1に再度登録を行う。
(プロセス3:統合)
統合担当者700Dは、2つの電子化文書を統合する。統合担当者700Dは、プロセス1とプロセス2を経て作成された電子化文書Aと電子化文書Bを電子情報検証装置1から取り出し、これら電子化文書を統合し、電子情報検証装置1に再度登録を行う。
(プロセス4:検証)
プロセス1、2、3の処理後、検証担当者700Cによって、変更箇所の特定と、変更箇所以外の不変確認、検証が行われる。
以下、各プロセスにおける詳細な作業内容について説明する。
プロセス1、2の作業手順、作業内容は、前述の実施の形態1と同じとする。プロセス1、2を通じて、2つの電子化文書Aと電子化文書Bは、メタ情報とコンテンツ情報が生成され、メタ情報の特徴量情報とコンテンツ情報の特徴量情報から生成される特徴量情報も生成されているとする。更には、特徴量情報に対する電子署名とタイムスタンプも付与されているとする。
次にプロセス3を説明する。統合担当者700Dは、電子情報検証装置1に登録された電子化文書Aと電子化文書Bを入手し、これら2つの電子化文書を統合(マージ)することを想定する。例えば、統合担当者700Dは、先に登録した電子情報ID=8919201の電子化文書A(3ページで構成)と、先に登録した電子化情報 ID=8968453 の電子化情報B(3ページで構成)とを呼び出し、これら2つの電子化文書をマージさせた新しい電子化文書C(6ページで構成)を作成後、電子情報検証装置1に登録し、新しい電子化情報 ID=9054686 を得る。
この時、一つの統合方法により得られる電子化文書Cのコンテンツ情報として、例えば、電子化文書Aのコンテンツ情報の後に、電子化文書Bのコンテンツ情報が連接されたものが得られる(図21中、DOC-C-1)。また、別の統合(マージ)方法により得られる電子化文書Cのコンテンツ情報として、例えば、電子化文書Aの1ページ目のコンテンツ情報の後に、電子化文書Bの3ページ分のコンテンツ情報が連接され、その後に電子化文書Aの2ページ目と3ページ目のコンテンツ情報が連接されたものも得られる(図中、DOC-C-2)。このように、統合した電子情報において、例えばページ等の順序を変更するようにした場合にもその特定、検証を行えることは明らかである。
また、電子化文書Cのメタ情報は、電子化文書Aのメタ情報と、電子化文書Bのメタ情報と、電子化文書Cのコンテンツ情報から生成されるものとする。電子情報検証装置1は、電子化文書Cの特徴量情報を生成し、電子署名とタイムスタンプを付与する。
プロセス4では、前述の実施の形態のプロセス3と同様に、検証担当者700Cは、電子化文書Cの変更箇所の特定と、変更箇所以外の不変確認、検証を行う。
本実施の形態では、2つのバインダーを1つのバインダーに統合(マージ)するシーンについて説明したが、3つ以上の複数のバインダーを1つのバインダーに統合(マージ)する場合も同様の方法で適用可能である。その他、バインダーを統合する操作に代えて、図22に示すように、ファイルフォーマットの変更(図22(a))、順序変更(図22(b))、ページ変更(図22(c))、ページのJPEG改ざん(図22(d))、ページ削除(図22(e))、ページ回転(図22(f))、コメント/注釈追加(図22(g))、ノート/添付資料追加(図22(h))等、種々の操作に対応できることも言うまでもない。
また、本実施の形態では、スキャナ読取装置によりバインダー(紙文書)を取り込み、電子化文書を取り扱う場面を説明したが、必ずしも上記シーンのみに対応するシステムではなく、パーソナルコンピュータ等々で最初から電子情報として作成された文書についても同様に適用可能である。
以上に詳述したように、本発明の実施の形態によれば、電子情報に対して特徴量情報を生成して電子情報に対応付けて登録しておき、次に前記電子情報に対する操作が行われた場合は、少なくともその操作内容に関するメタ情報及びコンテンツ情報についての特徴量情報(メタ情報関連パラメータ及びコンテンツ関連パラメータ)であって、操作前の電子情報に係る特徴量情報と同じ生成項目(メタ情報及びコンテンツ情報)についての特徴量情報を取得し、操作前後の特徴量情報を比較することで、電子情報に対する変更の有無、変更箇所の特定を行っている。
本発明の実施の形態によれば、ヘッダやプロパティ等々のメタ情報を保有する電子文書において、スキャニング(電子署名・タイムスタンプ付与)の後でも、ページ回転や注釈付加、文書の統合等々の操作に柔軟に対応するため、メタ情報を考慮しながら該電子文書の真正性、完全性を確認・検証することができ、かつ第三者証明を行うことが可能となる。
なお、本実施の形態で図示したフローチャートやステップに示された各動作をコンピュータにより実行させるプログラムを提供することにより、本発明の電子文書管理プログラムを提供することができる。これらプログラムはコンピュータにより読取可能な媒体に記録されてコンピュータにより実行させることができる。ここで、コンピュータにより読取可能な媒体としては、CD−ROMやフレキシブルディスク、DVDディスク、光磁気ディスク、ICカード等の可搬型記憶媒体や、コンピュータプログラムを保持するデータベース、或いは、他のコンピュータ並びにそのデータベースや、更に回線上の伝送媒体をも含むものである。
(付記1)電子情報の検証をコンピュータに実行させる電子情報検証プログラムであって、
前記電子情報のメタ情報とコンテンツ情報のそれぞれを用いて、前記電子情報を特定するための特徴量情報を生成する特徴量情報生成ステップと、
前記特徴量生成ステップにより生成された前記特徴量情報と前記電子情報とを対応付けて登録する登録ステップと、
前記登録ステップにより登録された前記電子情報に対応する他の一の電子情報について、前記特徴量情報生成ステップにより特徴量情報を生成し、該生成された特徴量情報と、前記登録ステップにより登録された前記特徴量情報とを用いて、前記登録ステップにより登録された前記電子情報からの変更の有無を判断すると共に、該変更があると判断された場合はその変更部分の特定を行うことで、前記電子情報の検証を行う特徴量情報検証ステップと
をコンピュータに実行させる電子情報検証プログラム。
(付記2)付記1に記載の電子情報検証プログラムにおいて、
前記電子情報の解析処理を行って、前記特徴量情報生成ステップで用いられる前記メタ情報と前記コンテンツ情報を区別して抽出する電子情報解析ステップを備えることを特徴とする電子情報検証プログラム。
(付記3)付記1に記載の電子情報検証プログラムにおいて、
前記特徴量情報生成ステップは、取得されたメタ情報とコンテンツ情報のそれぞれから少なくとも一部の情報を選択し、該選択された前記メタ情報とコンテンツ情報について、予め設定された複数の特徴量情報生成方法から一つの特徴量情報生成方法を選択し、該選択した特徴量情報生成方法を実行して前記特徴量情報を生成する
ことを特徴とする電子情報検証プログラム。
(付記4)付記1に記載の電子情報検証プログラムにおいて、
前記特徴量情報生成ステップは、前記メタ情報と前記コンテンツ情報の少なくともいずれか一方について、一方向性ハッシュ関数を用いてハッシュ値を算出することで前記特徴量情報を生成することを特徴とする電子情報検証プログラム。
(付記5)付記4に記載の電子情報検証プログラムにおいて、
前記特徴量情報生成ステップは、前記一方向性ハッシュ関数を用いてハッシュ値を算出する際、算出対象とされる情報に乱数を加えて前記ハッシュ値を算出することを特徴とする電子情報検証プログラム。
(付記6)付記4に記載の電子情報検証プログラムにおいて、
前記特徴量情報生成ステップは、一方向性ハッシュ関数を用いてハッシュ値を算出する際、算出対象とされる情報に日時情報を加えて前記ハッシュ値を算出することを特徴とする電子情報検証プログラム。
(付記7)付記1に記載の電子情報検証プログラムにおいて、
前記特徴量情報生成ステップは、前記メタ情報と前記コンテンツ情報の少なくともいずれか一方について、内容をエンコードすることで前記特徴量情報を生成することを特徴とする電子情報検証プログラム。
(付記8)付記1に記載の電子情報検証プログラムにおいて、
前記特徴量情報生成ステップは、生成された前記特徴量情報に対して、該特徴量情報が生成された根拠を示す所定の情報を付加することを特徴とする電子情報検証プログラム。
(付記9)付記8に記載の電子情報検証プログラムにおいて、
前記所定の情報は、前記特徴量情報が前記電子情報における前記メタ情報と前記コンテンツ情報のどの部分を用いて生成されたかに関する情報、前記メタ情報と前記コンテンツ情報から前記特徴量情報をどのように生成したかの特徴量生成方法に関する情報、前記特徴量情報を生成する際に利用した乱数又は日時を表す情報のいずれか少なくとも一つを含むことを特徴とする電子情報検証プログラム。
(付記10)付記1に記載の電子情報検証プログラムにおいて、
前記特徴量情報生成ステップは、前記コンテンツ情報について、前記コンテンツ情報の内容の統計量を抽出して、該統計量を用いて前記特徴量情報を生成することを特徴とする電子情報検証プログラム。
(付記11)付記1に記載の電子情報検証プログラムにおいて、
前記特徴量情報生成ステップは、前記文書情報が複数の文書又は複数のページからなる場合、前記コンテンツ情報について、文書単位又はページ単位、あるいは各文書又は各ページ中の任意の一部の箇所に対して前記特徴量情報を生成することを特徴とする電子情報検証プログラム。
(付記12)付記1に記載の電子情報検証プログラムにおいて、
前記特徴量情報生成ステップは、前記メタ情報と前記コンテンツ情報のそれぞれについて前記特徴量情報を生成するとともに、これら特徴量情報を結合し、一つの特徴量情報として一体化することを特徴とする電子情報検証プログラム。
(付記13)付記1に記載の電子情報検証プログラムにおいて、
前記登録ステップは、前記電子情報と前記特徴量情報のそれぞれ全体に対して、電子署名を付与して登録することを特徴とする電子情報検証プログラム。
(付記14)付記1に記載の電子情報検証プログラムにおいて、
前記他の一の電子情報について、前記特徴量情報生成ステップで生成される特徴量情報は、前記登録ステップで登録された前記電子情報に対する操作内容に関するメタ情報及びコンテンツ情報についての特徴量情報であって、前記登録ステップで登録された前記電子情報に係る特徴量情報と同じメタ情報及びコンテンツ情報についての特徴量情報であることを特徴とする電子情報検証プログラム。
(付記15)付記1に記載の電子情報検証プログラムにおいて、
前記登録ステップは、前記電子情報と前記特徴量情報のそれぞれ全体に対して、タイムスタンプを付与して登録することを特徴とする電子情報検証プログラム。
(付記16)付記1に記載の電子情報検証プログラムにおいて、
前記電子情報はスキャナにより読み取られた文書情報であり、
前記特徴量情報生成ステップは、前記スキャナにより読み取られた前記文書情報からページ単位で前記特徴量情報を生成し、
前記電子情報検証ステップは、前記登録ステップにより登録された前記電子情報と前記他の一の電子情報との二つの電子情報のそれぞれに対応する特徴量情報をページ単位で比較し、ページ単位で変更有無の判断を行うことを特徴とする電子情報検証プログラム。
(付記17)付記16に記載の電子情報検証プログラムにおいて、
前記特徴量情報生成ステップでは、スキャナにより読み取られた各ページの文書における回転角度を前記メタ情報として、その特徴量情報を生成することを特徴とする電子情報検証プログラム。
(付記18)電子情報の検証を行う電子情報検証装置であって、
前記電子情報のメタ情報とコンテンツ情報のそれぞれを用いて、前記電子情報を特定するための特徴量情報を生成する特徴量情報生成部と、
前記電子情報と、前記電子情報から生成された前記特徴量情報とを対応付けて登録する登録部と、
前記登録部により登録された前記電子情報に対応する他の一の電子情報について、前記特徴量情報生成部により特徴量情報を生成し、該生成された特徴量情報と、前記登録部により登録された前記特徴量情報とを用いて、前記登録部により登録された前記電子情報からの変更の有無を判断すると共に、該変更があると判断された場合はその変更部分の特定を行うことで、前記電子情報の検証を行う特徴量情報検証部と
を備えてなる電子情報検証装置。
(付記19)付記18に記載の電子情報検証装置において、
前記電子情報の解析処理を行って、前記特徴量情報生成部で用いられる前記メタ情報と前記コンテンツ情報を区別して抽出する電子情報解析部を備えることを特徴とする電子情報検証装置。
(付記20)電子情報の検証をコンピュータに実行させる電子情報検証方法であって、
前記電子情報のメタ情報とコンテンツ情報のそれぞれを用いて、前記電子情報を特定するための特徴量情報を生成する特徴量情報生成ステップと、
前記特徴量生成ステップにより生成された前記特徴量情報と前記電子情報とを対応付けて登録する登録ステップと、
前記登録ステップにより登録された前記電子情報に対応する他の一の電子情報について、前記特徴量情報生成ステップにより特徴量情報を生成し、該生成された特徴量情報と、前記登録ステップにより登録された前記特徴量情報とを用いて、前記登録ステップにより登録された前記電子情報からの変更の有無を判断すると共に、該変更があると判断された場合はその変更部分の特定を行うことで、前記電子情報の検証を行う特徴量情報検証ステップと
を備えてなる電子情報検証方法。
本発明の原理説明図である。 本発明の一実施の形態構成を示す図である。 登録処理のフローチャート図である。 電子情報の解析処理を示す図である。 メタ情報の特徴量生成処理を示す図である。 コンテンツ情報の特徴量生成処理を示す図である。 メタ情報とコンテンツ情報の特徴量を結合した特徴量情報を示す図である。 登録時の管理証の内容例を示す図である。 登録時の格納状態イメージを示す図である。 更新処理のフローチャート図である。 回転誤りを発見した際の変更操作を示す図である。 修正済み電子情報の解析処理を示す図である。 修正済み電子情報内のメタ情報の特徴量生成処理を示す図である。 修正済み電子情報のメタ情報とコンテンツ情報の特徴量を結合した特徴量情報を示す図である。 更新時の管理証の内容例を示す図である。 更新時の格納状態イメージを示す図である。 検証処理のフローチャート図である。 新旧のメタ情報特徴量を用いた比較・検証例を示す図である。 新旧のコンテンツ情報特徴量を用いた比較・検証例を示す図である。 検証結果出力画面の一例を示す図である。 複数文書の統合(マージ)の一例を示す図である。 本実施の形態の他の利用形態を示す図である。
符号の説明
1 電子情報検証装置、10 電子情報解析部、20 特徴量情報生成部、21 メタ情報抽出方法判断部、22 メタ情報特徴量生成部、23 コンテンツ情報抽出方法判断部、24 コンテンツ情報特徴量生成部、30 証明情報処理部、31 証明情報付与部、32 証明情報検証部、40 登録・管理部、50 電子情報検証部、51 メタ情報検証部、52 コンテンツ情報検証部、60 処理制御部、200 電子署名、300 タイムスタンプ、500 CA・TA、700A〜700D 利用者。

Claims (9)

  1. ンピュータ
    子情報のメタ情報とコンテンツ情報のそれぞれを用いて、前記電子情報を特定するための特徴量情報を生成し、生成された前記特徴量情報に対して、該特徴量情報が生成された根拠を示す所定の情報を付加する特徴量情報生成手段
    前記特徴量生成手段により生成された前記特徴量情報と付加された所定の情報と前記電子情報とを対応付けて登録する登録手段および、
    前記登録手段により登録された前記電子情報に対応する他の一の電子情報について、前記特徴量情報生成手段により特徴量情報を生成して所定の情報を付加し、該生成された特徴量情報と、該生成された特徴量情報に付加された所定の情報と、前記登録手段により登録された前記特徴量情報および所定の情報とを用いて、前記登録手段により登録された前記電子情報からの変更の有無を判断すると共に、該変更があると判断された場合はその変更部分の特定を行うことで、前記電子情報の検証を行う特徴量情報検証手段
    として機能させるための電子情報検証プログラム。
  2. 請求項1に記載の電子情報検証プログラムにおいて、前記コンピュータを、
    前記電子情報の解析処理を行って、前記特徴量情報生成手段で用いられる前記メタ情報と前記コンテンツ情報を区別して抽出する電子情報解析手段としてさらに機能させることを特徴とする電子情報検証プログラム。
  3. 請求項1に記載の電子情報検証プログラムにおいて、
    前記特徴量情報生成手段は、取得されたメタ情報とコンテンツ情報のそれぞれから少なくとも一部の情報を選択し、該選択された前記メタ情報とコンテンツ情報について、予め設定された複数の特徴量情報生成方法から一つの特徴量情報生成方法を選択し、該選択した特徴量情報生成方法を実行して前記特徴量情報を生成する
    ことを特徴とする電子情報検証プログラム。
  4. 請求項1に記載の電子情報検証プログラムにおいて、
    前記特徴量情報生成手段は、前記メタ情報と前記コンテンツ情報の少なくともいずれか一方について、一方向性ハッシュ関数を用いてハッシュ値を算出することで前記特徴量情報を生成することを特徴とする電子情報検証プログラム。
  5. 請求項1に記載の電子情報検証プログラムにおいて、
    前記他の一の電子情報について、前記特徴量情報生成手段で生成される特徴量情報は、前記登録手段で登録された前記電子情報に対する操作内容に関するメタ情報及びコンテンツ情報についての特徴量情報であって、且つ前記登録手段で登録された前記電子情報に係る特徴量情報と同じメタ情報及びコンテンツ情報についての特徴量情報であることを特徴とする電子情報検証プログラム。
  6. 請求項1に記載の電子情報検証プログラムにおいて、
    前記電子情報はスキャナにより読み取られた文書情報であり、
    前記特徴量情報生成手段は、前記スキャナにより読み取られた前記文書情報からページ単位で前記特徴量情報を生成し、
    前記電子情報検証手段は、前記登録手段により登録された前記電子情報と前記他の一の電子情報との二つの電子情報のそれぞれに対応する特徴量情報をページ単位で比較し、ページ単位で変更有無の判断を行うことを特徴とする電子情報検証プログラム。
  7. 請求項に記載の電子情報検証プログラムにおいて、
    前記特徴量情報生成手段では、スキャナにより読み取られた各ページの文書における回転角度を前記メタ情報として、その特徴量情報を生成することを特徴とする電子情報検証プログラム。
  8. 電子情報の検証を行う電子情報検証装置であって、
    前記電子情報のメタ情報とコンテンツ情報のそれぞれを用いて、前記電子情報を特定するための特徴量情報を生成し、生成された前記特徴量情報に対して、該特徴量情報が生成された根拠を示す所定の情報を付加する特徴量情報生成部と、
    前記電子情報と、前記電子情報から生成された前記特徴量情報および付加された所定の情報とを対応付けて登録する登録部と、
    前記登録部により登録された前記電子情報に対応する他の一の電子情報について、前記特徴量情報生成部により特徴量情報を生成して所定の情報を付加し、該生成された特徴量情報と、該生成された特徴量情報に付加された所定の情報と、前記登録部により登録された前記特徴量情報および所定の情報とを用いて、前記登録部により登録された前記電子情報からの変更の有無を判断すると共に、該変更があると判断された場合はその変更部分の特定を行うことで、前記電子情報の検証を行う特徴量情報検証部と
    を備えてなる電子情報検証装置。
  9. 電子情報の検証をコンピュータに実行させる電子情報検証方法であって、
    コンピュータの特徴量情報生成手段が、前記電子情報のメタ情報とコンテンツ情報のそれぞれを用いて、前記電子情報を特定するための特徴量情報を生成し、生成された前記特徴量情報に対して、該特徴量情報が生成された根拠を示す所定の情報を付加する特徴量情報生成ステップと、
    コンピュータの登録手段が、前記特徴量生成ステップにより生成された前記特徴量情報と付加された所定の情報と前記電子情報とを対応付けて登録する登録ステップと、
    コンピュータの特徴量情報検証手段が、前記登録ステップにより登録された前記電子情報に対応する他の一の電子情報について、前記特徴量情報生成ステップにより特徴量情報を生成して所定の情報を付加し、該生成された特徴量情報と、該生成された特徴量情報に付加された所定の情報と、前記登録ステップにより登録された前記特徴量情報および所定の情報とを用いて、前記登録ステップにより登録された前記電子情報からの変更の有無を判断すると共に、該変更があると判断された場合はその変更部分の特定を行うことで、前記電子情報の検証を行う特徴量情報検証ステップと
    を備えてなる電子情報検証方法。
JP2006267772A 2006-09-29 2006-09-29 電子情報検証プログラム、電子情報検証装置および電子情報検証方法 Expired - Fee Related JP4836735B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006267772A JP4836735B2 (ja) 2006-09-29 2006-09-29 電子情報検証プログラム、電子情報検証装置および電子情報検証方法
US11/882,097 US8335922B2 (en) 2006-09-29 2007-07-30 Recording medium, digital information verification apparatus, and digital information verification method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006267772A JP4836735B2 (ja) 2006-09-29 2006-09-29 電子情報検証プログラム、電子情報検証装置および電子情報検証方法

Publications (2)

Publication Number Publication Date
JP2008090389A JP2008090389A (ja) 2008-04-17
JP4836735B2 true JP4836735B2 (ja) 2011-12-14

Family

ID=39262408

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006267772A Expired - Fee Related JP4836735B2 (ja) 2006-09-29 2006-09-29 電子情報検証プログラム、電子情報検証装置および電子情報検証方法

Country Status (2)

Country Link
US (1) US8335922B2 (ja)
JP (1) JP4836735B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4593614B2 (ja) * 2007-12-27 2010-12-08 富士通株式会社 画像データ検証方法及び画像データ検証システム
JP5400319B2 (ja) * 2008-04-24 2014-01-29 キヤノン株式会社 電子文書制御装置、方法およびプログラム
JP2011039997A (ja) * 2009-08-18 2011-02-24 Fuji Xerox Co Ltd 情報処理装置及びコンピュータプログラム
WO2011089864A1 (ja) * 2010-01-21 2011-07-28 日本電気株式会社 ファイル群整合性検証システム、ファイル群整合性検証方法およびファイル群整合性検証用プログラム
JP5553670B2 (ja) * 2010-04-19 2014-07-16 キヤノン株式会社 管理装置、その制御方法およびプログラム
US8412944B1 (en) * 2010-12-17 2013-04-02 Pasquale Mazzone Document certification system and method
JP5874474B2 (ja) * 2012-03-21 2016-03-02 富士ゼロックス株式会社 画像情報登録システム、画像情報登録プログラム
US11650814B1 (en) * 2012-12-21 2023-05-16 EMC IP Holding Company LLC Generating customized documentation for applications

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3980785B2 (ja) 1999-03-30 2007-09-26 株式会社リコー 原本性保証電子保存装置、原本性保証電子保存方法およびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4011243B2 (ja) 1999-10-15 2007-11-21 富士通株式会社 電子原本管理装置および方法
JP2003114884A (ja) 2001-10-05 2003-04-18 Hitachi Ltd 電子文書編集表示システム
JP2003168019A (ja) * 2001-12-04 2003-06-13 Nippon Telegr & Teleph Corp <Ntt> 分散ネットワーク上でのコンテンツ流通システムおよび仲介装置
US20070226504A1 (en) * 2006-03-24 2007-09-27 Reconnex Corporation Signature match processing in a document registration system

Also Published As

Publication number Publication date
US8335922B2 (en) 2012-12-18
US20080082829A1 (en) 2008-04-03
JP2008090389A (ja) 2008-04-17

Similar Documents

Publication Publication Date Title
JP4836735B2 (ja) 電子情報検証プログラム、電子情報検証装置および電子情報検証方法
US8549303B2 (en) Apparatus, system and method for electronically signing electronic transcripts
EP3543891B1 (en) A computer implemented method and a system for tracking of certified documents lifecycle and computer programs thereof
US20050138382A1 (en) Method and process for creating an electronically signed document
US20090157987A1 (en) System and Method for Creating Self-Authenticating Documents Including Unique Content Identifiers
JP2010522497A (ja) 位置符号化パターンの印刷
JP6965972B2 (ja) 改ざん認識方法、装置及び記憶媒体
US10810325B2 (en) Method for custody and provenance of digital documentation
JP2010512579A (ja) 一意的なコンテンツ識別子を用いたファイル認証及びバージョニングのためのシステム及び方法
KR20200088995A (ko) 화상 형성 장치에서 블록체인을 기반한 문서의 보안 및 무결성 검증
WO2011121927A1 (ja) デジタルコンテンツ管理システム、装置、プログラムおよび方法
WO2012022830A1 (en) A service for signing documents electronically
WO2011121928A1 (ja) デジタルコンテンツ管理システム、検証装置、そのプログラムおよびデータ処理方法
JP2009301370A (ja) 電子署名管理装置及び電子署名管理プログラム
JP4877412B2 (ja) 手続システムの端末装置及び記憶媒体
US20100084849A1 (en) System and Method for Linking Digital and Printed Contents Using Unique Content Identifiers
US9277097B2 (en) Method for authenticating a document
EP1883035A2 (en) Electronic data disclosure method and system
US20210303640A1 (en) Document management system, processing terminal device, and control device
JP2009294896A (ja) データ保管装置、記憶装置に記憶されたデータの開示プログラム、及びデータの開示方法
JP5063440B2 (ja) 処理装置及び処理方法
JP7299662B1 (ja) 情報処理装置、方法、及びプログラム
JP2005167607A (ja) 画像処理システム
JP7127922B1 (ja) コンテンツ管理装置、コンテンツ管理方法及びコンテンツ管理プログラム
KR20040027649A (ko) 생체 정보를 이용한 문서 발급 전자 관리 대장 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110927

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110927

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees