JP2011097492A - 改ざん検知方式 - Google Patents

改ざん検知方式 Download PDF

Info

Publication number
JP2011097492A
JP2011097492A JP2009251634A JP2009251634A JP2011097492A JP 2011097492 A JP2011097492 A JP 2011097492A JP 2009251634 A JP2009251634 A JP 2009251634A JP 2009251634 A JP2009251634 A JP 2009251634A JP 2011097492 A JP2011097492 A JP 2011097492A
Authority
JP
Japan
Prior art keywords
character information
ocr
hash value
creator
calculated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009251634A
Other languages
English (en)
Inventor
Takashi Isoda
隆司 礒田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009251634A priority Critical patent/JP2011097492A/ja
Publication of JP2011097492A publication Critical patent/JP2011097492A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】作成者側のOCRと受領者側のOCRを同じOCRサービスで行うことによりOCRサービスの文字認識の性能を同じにする。また複数のOCRサービスで行うことにより、利用可能な作成者側のOCRサービスと受領者側OCRサービスが一致する可能性を大きくする。
【解決手段】印刷時OCRサービスでOCRを実行するとき、印刷時に利用可能なすべてのOCRサービスでOCRを実行し、その結果より得られるそれぞれのハッシュ値をOCRサービスを実行したOCRサービスの識別子と関連付けて、すべてを電子ファイルに記載して、画像化する。受領時、画像より取得した電子ファイルの中に記載されたすべてのOCRサービスの中ですべての利用可能なOCRサービスでOCRを実行する。そして結果より得られるそれぞれのハッシュ値を画像より得られるハッシュ値と比較する。
【選択図】図6

Description

本発明は紙等の記録材に印刷された文字情報が文字情報を作成者が作成した文字情報に対して改ざんが行われたかどうかを検知するシステムである。
本発明の先行技術について特許文献を挙げて説明する。
(特許文献1参照)
紙等の記録材上に印字された文字情報が、文字情報の作成者が作成した文字情報から改ざんされた可能性があるかどうかを検知する方法で、作成者が文字情報の作成時、作成したすべて、または指定部分すべての文字情報の文字コードよりハッシュ値を算出する。そして算出したハッシュ値に対して、作成者の公開秘密鍵方法の秘密鍵で署名する等で本人真正性を与えてそのデータを電子ファイル化する。前記電子ファイル化した電子ファイルをなんらかの方法で画像データ化し、その画像データを文字情報と同じ紙等の記録材上に印刷する。
そしてその紙等の記録材受領時、記録材を光学的に読み取りOCR(optical character recognition)によって文字情報に変換し、変換した文字情報のコードよりハッシュ値を算出する。そして記録材を光学的に読み取り画像データを認識して、その画像データから電子ファイルに変換し、電子ファイル上に記載されたデータを文字情報の作成者の公開鍵等で復号し、本人真正性を確認する。復号したデータと前記算出したハッシュ値と比較し、その結果が同値であれば記録材上の文字情報は作成者が作成した文字情報から改ざんされていないと判定するシステムがすでに特許文献で考案されている。
特開2004−13287号公報
先行技術は原理的には成立するが、実際に実装しようとするとOCRサービスの文字認識の正確性は完全ではないという課題がある。具体的にはOCRサービスの文字認識はOCRサービスで文字認識率は異なるのはもちろんのこと、また文字種や文字の字体、文字の背景等でOCRサービス毎に結果が異なる。そのために印刷時に文字情報を取得するOCRサービスと受領時に文字情報を取得するOCRサービスが同じでなければ事実上先行案は機能することは難しい。
印刷時OCRサービスでOCRを実行するとき、印刷時に利用可能なすべてのOCRサービスでOCRを実行し、その結果より得られるそれぞれのハッシュ値をOCRサービスを実行したOCRサービスの識別子と関連つけて、すべてを電子ファイルに記載して、画像化する。
受領時、画像より取得した電子ファイルの中に記載されたすべてOCRサービスの中ですべての利用可能なOCRサービスでOCRを実行する。そして結果より得られるそれぞれのハッシュ値を画像より取得した電子ファイルの中に記載された当該OCRサービスに関連つけられたそれぞれのハッシュ値と比較する。
これによりOCRサービス毎の文字認識の差異に起因する問題がなくなり、機能が事実上使用可能になる。
実施例1の文書作成者のシステム構成図 実施例1の文書受領者のシステム構成図 実施例1の文書作成者のーソナルコンピュータの内部ブロック構成図 実施例1の文書受領者のーソナルコンピュータの内部ブロック構成図 実施例1の印刷時の本発明のフローチャート 実施例1の印刷面に追記される内容の模式図 実施例1の受領時の本発明のフローチャート
以下、本発明の発明を実施するための最良の形態について図面を用いて説明する。
図1に本実施例の文書発行者のシステム構成例を示す。本発明が格納されているPC(パーソナルコンピュータ)がLAN回線でプリンタと接続されている。更にLAN回線及びインターネット/イントラネット介して接続されて1つ以上のOCRサービスに接続されている。もちろんPC内にOCRサービスが格納されていることもある。
図2本実施例の文書受領者のシステム構成例を示す。本発明が格納されているPC(パーソナルコンピュータ)がLAN回線でスキャナと接続されている。更にLAN回線及びインターネット/イントラネット介して接続されて1つ以上のOCRサービスに接続されている。もちろんPC内にOCRサービスが格納されていることもある。
図3に本実施例の文書発行者のシステムのパーソナルコンピュータ1の内部ブロック構成を記す。11は本発明を制御するCPU、12はCPU1のワークエリアを提供するRAM、13は本発明のプログラムを提供およびさまざまな設定、及びファイルを格納するハードディスク(NVRAM、等でも構わない)(以下HDD13)である。14はユーザーがGUI(グラフィックユーザーインターフェース)を介して様々な設定を行うユーザーコマンド入力装置、15はGUI(グラフィックユーザーインターフェース)の表示を行う表示装置である。16はプリンタとの通信およびインターネット/イントラネットとの通信をつかさどる通信装置、17はメインバスである。18はプリンタおよびインターネット/イントラネットと通信するためのLAN回線である。
尚、本実施例では特に断らない限り、パーソナルコンピュータ1ではCPU11がメインバス17を介してRAM12、ハードディスク13、ユーザーコマンド入力装置14、表示装置15、通信装置16を制御して実施する。
図4に本実施例の文書受領者のシステムのパーソナルコンピュータ2の内部ブロック構成を記す。21は本発明を制御するCPU、22はCPU1のワークエリアを提供するRAM、23は本発明のプログラムを提供およびさまざまな設定、及びファイルを格納するハードディスク(NVRAM、等でも構わない)(以下HDD23)である。24はユーザーがGUI(グラフィックユーザーインターフェース)を介して様々な設定を行うユーザーコマンド入力装置、25はGUI(グラフィックユーザーインターフェース)の表示を行う表示装置である。26はスキャナとの通信およびインターネット/イントラネットとの通信をつかさどる通信装置、27はメインバスである。28はスキャナおよびインターネット/イントラネットと通信するためのLAN回線である。
尚、本実施例では特に断らない限り、パーソナルコンピュータ2ではCPU21がメインバス27を介してRAM22、ハードディスク23、ユーザーコマンド入力装置24、表示装置25、通信装置26を制御して実施する。
次の図5に従い本提案技術が実装された文書作成者側のプログラムの動作を記述する。
文書作成アプリケーションを利用しユーザーが文書を作成しその印刷を要求する(S102)。文書作成の方法については本提案と直接関係がないので詳細を省略する。そして印刷画像データを受信する(S103)。このとき印刷画像データとして送信されてくるデータはビットマップ等の可視画像データになっているものとする。文書データから可視画像データへの変換の方法については本提案と直接関係がないので詳細を省略する。そして文書作成アプリケーションから前記印刷画像データを作成する文書の文字情報のみを取得する(S104)。そして取得した文字情報の文字コードすべてを入力としてハッシュ値を算出する(S105)。そしてそのハッシュ値に対して“正解”というOCRサービスの識別子をつけて電子ファイルに記載する(S106)。そしてまたOCR処理を依頼していない利用可能なOCRサービスがある確認する(S107)。
OCR処理を依頼していない利用可能なOCRサービスがあればそのOCRサービスに対して、受信した印刷画像データを送信しOCRの実行をLAN回線19を介して要求する(S108)。そしてOCRサービスからLAN回線19を介して文字情報を受信する(S109)。そして受信した文字情報の文字コードすべてを入力としてハッシュ値を算出する(S110)。そしてそのハッシュ値に対してOCR処理を依頼したOCRサービスの識別子をつけて電子ファイルに追記する(S111)。そしてS107を行う。
OCR処理を依頼していない利用可能なOCRサービスがなければすべてのOCRサービスの識別子とそのハッシュ値を1つの電子ファイルに記述する(S112)。その例を図6に示す。そして前記電子ファイルに対して文書作成者の秘密鍵で暗号化する(S113)。そして暗号化されたファイルを4分割にする(S114)。4分割されたそれぞれの電子ファイルを画像化する(S115)。電子ファイルの画像化の手法についてはQRコード、2次元バーコード等さまざまな手法がすでに考案されているので詳細は省略する。そして印刷物をスキャンで読み取り時に斜行補正マーカになるように4つの画像を印刷データ上に追加配置する(S116)。具体的な配置方法を図6に示す。追加配置された印刷面をプリンタが印刷可能なデータに変換する(S117)。そしてLAN回線19を介して前記印刷可能なデータをプリンタ3に送信する(S118)。
プリンタは受信した印刷可能データを紙に印刷する。
次に図7に従い本提案技術が実装された文書受領者側のプログラムの動作を記述する。
スキャナ4が印刷物を読み取る。そしてスキャナはLAN回線29を介してPC2へ読み取った印刷面画像データを送信する。
LAN回線29を介して画像データを受信する(S202)。受信した印刷面画像データから4つの画像データを認識してそれぞれの画像を取り出す。画像認識方法はさまざまな方法がすでに考案されているため詳細は省略する。取り出したそれぞれの画像を電子データに変換する(S203)。そして変換した4つの電子データを結合する(S204)。結合した電子データを文書作成者の公開鍵で復号する(S205)。
もし復号に失敗したならば改ざんされた可能性があると判断しUI表示装置25にその旨を表示する(S222)。
復号に成功したならば復号した電子ファイルの中にまだOCRを要求していない利用可能OCRサービスの識別子があるかどうか判断する(S207)。
まだOCRを要求していない利用可能OCRサービスの識別子があれば4つの画像データを利用して斜行補正を印刷面画像データに対して行う。そしてその識別子が示すOCRサービスに対してLAN回線29を介して印刷面画像データを送信し、OCR処理を要求する(S202)。OCRサービスからLAN回線29を介してOCR結果の文字情報を受信する。受信した文字情報の文字コードすべてを入力としてハッシュ値を算出する(S209)。そのハッシュ値と復号した電子ファイルの中の当該OCRサービスの識別子に関連つけられたハッシュ値と比較する(S210)。同じであれば改ざんの可能性なしをUI表示装置25に表示する(S221)。
異なれば、UI表示装置25にOCRサービスから受信した文字情報を表示する。そしてユーザーコマンド入力装置24から文字情報の修正が入力されたならば(S221)、修正された文字情報の文字コードすべてを入力としてハッシュ値を算出する(S222)。そのハッシュ値と復号した電子ファイルの中の当該OCRサービスの識別子に関連つけられたハッシュ値と比較する(S213)。同じであれば改ざんの可能性なしをUI表示装置25に表示する(S221)。
異なればS207を行う。
まだOCRを要求していない利用可能OCRサービスの識別子がなければ利用可能なOCRサービスの中で予め決められた最も文字認識の性能のよいOCRサービスを選択する(S214)。印刷面画像データをLAN回線29を介して送信し、OCR処理を要求するOCRサービスからLAN回線29を介してOCR結果の文字情報を受信する(S215)。受信した文字情報の文字コードすべてを入力としてハッシュ値を算出する(S216)。そのハッシュ値と復号した電子ファイルの中の正解のOCR識別子に関連つけられたハッシュ値と比較する(S217)。同じであれば改ざんの可能性なしをUI表示装置25に表示する(S221)。
異なれば、UI表示装置25にOCRサービスから受信した文字情報を表示する。そしてユーザーコマンド入力装置24から文字情報の修正が入力されたならば(S218)、修正された文字情報の文字コードすべてを入力としてハッシュ値を算出する(S219)。そのハッシュ値と復号した電子ファイルの中の当該OCRサービスの識別子に関連つけられたハッシュ値と比較する(S220)。同じであれば改ざんの可能性なしをUI表示装置25に表示する(S221)。
異なれば、改ざんされた可能性があると判断してUI表示装置25にその旨を表示する(S222)。
1 実施例1の文書作成者のパーソナルコンピュータ
2 実施例1の文書受領者のパーソナルコンピュータ
3 実施例1の文書作成者のプリンタ
4 実施例1の文書受領者のスキャナ

Claims (5)

  1. 紙等の記録材上に印字された文字情報が、文字情報の作成者が作成した文字情報から改ざんされた可能性があるかどうかを検知する方法で、作成者が文字情報の作成時、作成したすべて、または指定部分すべての文字情報の文字コードよりハッシュ値を算出し、算出したハッシュ値に対して、作成者の公開秘密鍵方法の秘密鍵で署名することで本人真正性を与えてそのデータを電子ファイル化し、前記電子ファイル化した電子ファイルをなんらかの方法で画像データ化し、その画像データを文字情報と同じ記録材上に印刷し、
    そしてその紙等の記録材受領時、記録材を光学的に読み取りOCR(optical character recognition)によって文字情報に変換し、変換した文字情報のコードよりハッシュ値を算出し、そして記録材を光学的に読み取り画像データを認識して、その画像データから電子ファイルに変換し、電子ファイル上に記載されたデータを文字情報の作成者の公開鍵で復号し、本人真正性を確認し、そして復号したデータと前記算出したハッシュ値と比較し、その結果が同値であれば記録材上の文字情報は作成者が作成した文字情報から改ざんされていないと判定するシステムで印刷時、文字情報の文字コードよりハッシュ値を算出するとき、文字情報の文字コードは作成者が作成した文字情報をビットマップ化しビットマップ化したファイルに対してOCRを実行し(S109)その結果得られた文字情報よりハッシュ値を算出すること(S110)を特徴するシステム制御方式。
  2. 請求項1のシステムで印刷時、文字情報の文字コードよりハッシュ値を算出するとき、文字情報の文字コードは作成者が作成した文字情報をビットマップ化しビットマップ化したファイルに対してOCRを実行しその結果得られた文字情報よりハッシュ値を算出するとき、利用可能な複数のOCRサービスで行い(S107)、ぞれぞれのOCRサービスの識別子とその結果のハッシュ値のデータすべてを電子ファイル化すること(S112)を特徴するシステム制御方式。
  3. 請求項2のシステムで印刷時、文字情報の文字コードよりハッシュ値を算出するとき、文字情報の文字コードは作成者が作成した文字情報をビットマップ化しビットマップ化したファイルに対してOCRを実行しその結果得られた文字情報よりハッシュ値を算出することを、利用可能な複数のOCRサービスで行い、ぞれぞれのOCRサービスの識別子とその結果のハッシュ値のデータすべてと、文字情報を作成したワードプロセッサ等のアプリケーションから文字情報を受け取りその文字情報からハッシュ値を算出し、正解の識別子と算出したハッシュ値を電子ファイル化すること(S106)を特徴するシステム制御方式。
  4. 請求項2のシステムで記録材受領時、記録材を光学的に読み取り画像データを認識して、その画像データから電子ファイルに変換し、電子ファイル上に記載されたデータを文字情報の作成者の公開鍵で復号し(S205)、本人真正性を確認し、そして復号したデータの中に記載されたOCRサービスの識別子で識別されるOCRサービスで利用可能なすべてOCRサービスで文字情報に変換し、変換した文字情報のコードよりハッシュ値を算出し、算出されたハッシュ値と復号されたデータの中に記載された当該OCRサービスの識別子に関連つけられているハッシュ値と比較し(S213)、いずれかが同値であれば記録材上の文字情報は作成者が作成した文字情報から改ざんされていないと判定することを特徴するシステム制御方式。
  5. 請求項3のシステムで記録材受領時、記録材を光学的に読み取り画像データを認識して、その画像データから電子ファイルに変換し、電子ファイル上に記載されたデータを文字情報の作成者の公開鍵で復号し、本人真正性を確認し、そして復号したデータの中に記載されたOCRサービスの識別子で識別されるOCRサービスで利用可能なすべてOCRサービスで文字情報に変換し、変換した文字情報のコードよりハッシュ値を算出し、算出されたハッシュ値と復号されたデータの中に記載された当該OCRサービスの識別子に関連つけられているハッシュ値と比較し、いずれかが同値で記録材上の文字情報は作成者が作成した文字情報から改ざんされていないと判定することを特徴するシステムであるとき、
    復号したデータの中に記載されたOCRサービスの識別子で識別されるOCRサービスがすべて利用できないとき、利用可能なOCRサービスで最も高い認識率のOCRサービスで文字情報に変換し、変換した文字情報のコードよりハッシュ値を算出し、算出されたハッシュ値と復号されたデータの中に記載された正解の識別子に関連つけられたハッシュ値と比較し同値であれば記録材上の文字情報は作成者が作成した文字情報から改ざんされていない(S220)と判定することを特徴するシステム制御方式。
JP2009251634A 2009-11-02 2009-11-02 改ざん検知方式 Pending JP2011097492A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009251634A JP2011097492A (ja) 2009-11-02 2009-11-02 改ざん検知方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009251634A JP2011097492A (ja) 2009-11-02 2009-11-02 改ざん検知方式

Publications (1)

Publication Number Publication Date
JP2011097492A true JP2011097492A (ja) 2011-05-12

Family

ID=44113905

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009251634A Pending JP2011097492A (ja) 2009-11-02 2009-11-02 改ざん検知方式

Country Status (1)

Country Link
JP (1) JP2011097492A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019211563A (ja) * 2018-06-01 2019-12-12 富士ゼロックス株式会社 データ処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019211563A (ja) * 2018-06-01 2019-12-12 富士ゼロックス株式会社 データ処理装置
JP7077792B2 (ja) 2018-06-01 2022-05-31 富士フイルムビジネスイノベーション株式会社 データ処理装置
US11412105B2 (en) 2018-06-01 2022-08-09 Fujifilm Business Innovation Corp. Data processing device

Similar Documents

Publication Publication Date Title
JP5014011B2 (ja) 書類を印刷する方法、印刷装置及びシステム
US7639820B2 (en) Image forming apparatus certificate sheet making method and certificate sheet processing method
JP4055807B2 (ja) ドキュメント管理方法、ドキュメント管理システム、およびコンピュータプログラム
JP5011233B2 (ja) 改竄検出用情報出力システム、方法およびプログラム
US9864920B2 (en) Semiautomatic multifunction device-based validation of secure documents
JP2005159557A (ja) スキャナ装置、スキャナシステム、画像保護方法
US20100188712A1 (en) Image processing apparatus and image processing method
US20050259289A1 (en) Print driver job fingerprinting
KR101536274B1 (ko) 화상형성장치, 그 화상처리방법, 및 화상형성시스템
US7463380B2 (en) Spooling/despooling subsystem job fingerprinting
JP4358879B2 (ja) 画像処理装置及び画像処理サーバ
JP2011010161A (ja) 画像形成装置、画像形成方法、プログラム
JP2016134915A (ja) 画像形成装置及び画像出力方法
US20070136787A1 (en) System and method for restricting and authorizing the use of software printing resources
US7841013B2 (en) Image forming device, computer program, and data file
JP2011097492A (ja) 改ざん検知方式
JP5773137B2 (ja) 文書印刷システム
JP2009129079A (ja) 印刷文書管理装置及びその管理方法
JP2010171596A (ja) 画像処理装置
JP4595985B2 (ja) ドキュメント管理方法、ドキュメント管理システム、およびコンピュータプログラム
JP2018012251A (ja) 情報処理装置、画像形成装置、複製方法、及び、プログラム
JP2008046554A (ja) 画像形成装置
JP2002185758A (ja) 画像データ製造装置および方法
JP2020077905A (ja) 画像形成装置および画像形成プログラム
JP2007102534A (ja) プリントシステム