JP2005520426A - 階調表現を用いた二値文書の電子透かし - Google Patents
階調表現を用いた二値文書の電子透かし Download PDFInfo
- Publication number
- JP2005520426A JP2005520426A JP2003577202A JP2003577202A JP2005520426A JP 2005520426 A JP2005520426 A JP 2005520426A JP 2003577202 A JP2003577202 A JP 2003577202A JP 2003577202 A JP2003577202 A JP 2003577202A JP 2005520426 A JP2005520426 A JP 2005520426A
- Authority
- JP
- Japan
- Prior art keywords
- data
- document content
- pixel group
- document
- gradation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 76
- 238000012545 processing Methods 0.000 claims description 11
- 230000000875 corresponding effect Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
- G06T1/0028—Adaptive watermarking, e.g. Human Visual System [HVS]-based watermarking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
- H04N1/32149—Methods relating to embedding, encoding, decoding, detection or retrieval operations
- H04N1/32203—Spatial or amplitude domain methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
- H04N1/32149—Methods relating to embedding, encoding, decoding, detection or retrieval operations
- H04N1/32203—Spatial or amplitude domain methods
- H04N1/32256—Spatial or amplitude domain methods in halftone data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2201/00—General purpose image data processing
- G06T2201/005—Image watermarking
- G06T2201/0051—Embedding of the watermark in the spatial domain
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2201/00—General purpose image data processing
- G06T2201/005—Image watermarking
- G06T2201/0083—Image watermarking whereby only watermarked image required at decoder, e.g. source-based, blind, oblivious
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3225—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3225—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
- H04N2201/3233—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark
- H04N2201/3236—Details of authentication information generation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3225—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
- H04N2201/3233—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark
- H04N2201/3239—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark using a plurality of different authentication information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3225—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
- H04N2201/3233—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark
- H04N2201/324—Selecting a particular authentication information from amongst a plurality of different authentication information
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
Abstract
本発明は、文書コンテンツにデータを隠蔽する方法(図1)である。この方法は、少なくとも一部が二値性を有する文書コンテンツに関する情報を受け取る工程(102)と、階調画素の組合せに対応する所定の二値クラス分けに応じてデータを階調画素群に変換する工程(104)と、上記階調画素群を上記文書コンテンツの二値の部分に埋め込む工程(104および114)を含んでいる。また、本発明は、文書コンテンツに隠蔽されたデータを抽出する方法(図7)である。この方法は、階調画素群を含んだ文書コンテンツに関する情報を受け取る工程(702)と、上記文書コンテンツから上記階調画素群を抽出する工程(712)と、階調画素の組合せに対応する所定の二値クラス分けに応じて上記階調画素群をデータに変換する工程(714)を含んでいる。
Description
本発明はデジタル情報処理に関し、特に、電子透かし技術を用いた文書認証およびステガノグラフィーに関する。
今日、文書の認証および電子透かし技術に大きな関心がもたれており、電子透かしを用いて文書コンテンツ内に情報を隠蔽する様々なシステムや方法が開発されている。しかしながら、データ隠蔽に関する取組みの大部分は、画像などの非二値の文書コンテンツに向けられている。
グレースケールおよびカラーの画像(以後、画像と称する)の場合、文書コンテンツが非二値性であるため、データ隠蔽容量が非常に大きくなる。例えば、1画像中の各画素は、通常、所定長さの多数のビットからなる数字によってデジタル形式で表現される。その数字の長さが大きいことは、カラー画像中の多数の色相を表現するために必要であり、グレースケール画像中の多数の濃淡を表現するためにも必要である。したがって、デジタル形式の非二値データを用いた最下位ビット変調により、表示または印刷された文書には画素のごくわずかな色調や濃淡の変化としてしか現れないデータ隠蔽を実現することができる。しかしながら、この技術は、二値性の文書コンテンツには広く適用可能であるわけではない。
図形やテキストなどの二値性の文書コンテンツに対するデータ隠蔽に関して主として問題となるのは、データの二値性にある。換言すれば、このような文書コンテンツは1画素あたり1ビットしか有していない。したがって、データのデジタル形式の数字を変調させると、いつ変調が発生しても、結果的にデータコンテンツが反転することになる。その結果、例えば、二値図形内のビットをごくわずかしか変更していないのに、図形の外観と内容が大きく変化してしまう可能性がある。全般的に見て、この種の文書コンテンツにデータを隠蔽することはほとんど困難であるが、テキストにデータを隠蔽する方法は開発されている。
テキストにデータを隠蔽する方法は、二値図形中のビットのごくわずかな変更が図形の場合ほどテキストの外観と内容を大幅に変化させないことを利用している。したがって、縦方向の文字の長さの変更や、単語間隔および/または行間隔の変更を用いて、テキスト内にデータが隠蔽される。例えば、従来の間隔変更方法とセリフ変更方法が、ともに本明細書に引用の形で盛り込まれた「文書複製を阻止する電子透かしおよび識別技術(Electronic Marking and Identification Techniques to Discourage Document Copying)」J.ブラッシル(Brassil), S.ロー(Low), N.マクゼムチュク(Maxemchuk), およびL.オゴーマン(O’Gorman), 米国電気電子技術者協会(IEEE)インフォコム(Infocom)94と、「行変位と単語変位の両方を用いた電子透かしと識別(Document Marking and Identification using Both Line and Word Shifting)」S.H.ロー(Low), N.F.マクゼムチュク(Maxemchuk), J.T.ブラッシル(Brassil), およびL.オゴーマン(O’Gorman), インフォコム(Infocom)95に提案されている。しかしながら、図形は画素レベルでさえテキストと同じ特性をもたない場合が多いので、これらの方法を図形にうまく適用することはできない。
したがって、二値性の文書コンテンツに対するデータ隠蔽に関する、特に、図形にデータを隠蔽する場合の問題の解決策の必要性は依然として存在しており、そのような解決策を提供することが本発明の目的である。
本発明は、第1の側面では、文書コンテンツにデータを隠蔽する方法である。この方法は、少なくとも一部が二値性を有する文書コンテンツに関する情報を受け取る工程と、階調画素の組合せに対応する所定の二値クラス分けに応じてデータを階調画素群に変換する工程と、上記文書コンテンツの二値の部分を上記階調画素群と置換する工程を含んでいる。
本発明は、第2の側面では、文書コンテンツに隠蔽されたデータを抽出する方法である。この方法は、階調画素群を含んだ文書コンテンツに関する情報を受け取る工程と、上記文書コンテンツから上記階調画素群を抽出する工程と、階調画素の組合せに対応する所定の二値クラス分けに応じて上記階調画素群をデータに変換する工程を含んでいる。
本発明のさらに他の利用可能分野は、以下に示す詳細な説明から明らかになるであろう。以下の詳細な説明と具体例は、本発明の好ましい実施形態を示す一方で、例示の目的のみを意図したものであり、本発明の範囲を限定することを意図したものではないことを理解されるべきである。
本発明は、以下の詳細な説明と添付の図面により、より深く理解されるであろう。
以下の好ましい実施形態の説明は、本質的に例示に過ぎず、本発明、そのアプリケーションまたは用途を限定することを意図したものでは全くない。
図1に、二値性の文書コンテンツにデータ、すなわち、電子透かし情報を隠蔽する現在好ましい方法を示す。この方法は、複数のステップを含んでいる。その一部は、本発明にとって必須ではないが、単に現在好ましい実施形態を説明するために含められている。この方法は、本実施例を用いて説明される。
符号100で開始し、ステップ102に進むと、文書コンテンツに関する情報が受け取られる。この情報はいくつかの形式をとることができる。1つの形式例では、情報はデジタル形式の電子ファイルの形の文書に相当し、このファイルは、文書のオリジナル形式、有形の文書からスキャナで取り込まれたビットマップ、または同様の文書転生物を成す。本実施例では、受け取られた情報は、図形と文字を含む文書のビットマップに相当しており、その全てが二値コンテンツであるが、二値コンテンツに加えて、非二値性のコンテンツを含んでいる場合もある。
ステップ104では、文書はテキストコンテンツと図形コンテンツに区分化される。文書内の図形をテキスト領域から区分することは、かなり研究されている課題となっている。例えば、本明細書に引例の形で盛り込まれたカレン(Cullen)他の米国特許第5,465,304号明細書および米国特許第5,335,290号明細書は、文書画像の文字、図絵、線のセグメント化について記述している。また、本明細書に引例の形で盛り込まれたヴェストダイク(Westdijk)の米国特許第5,073,953号明細書は、自動文書セグメント化システムおよび方法を開示している。さらに、本明細書に引例の形で盛り込まれたチョウ(Zhou)他の米国特許第5,892,843号明細書には、テキスト本体を文書の他の領域から分離することが教示されている。また、ワン(Wang)他の米国特許第5,379,130号明細書には、テキストから画像を分離する方法およびシステムが開示されている。これらの技術や他の公知の手法のいずれも、区分化ステップ104を実行するために容易に適応させることができる。このステップ102は、好ましい実施形態であっても、一定の状況下では随意である。そのような状況は、例えば、文書が図形しか含んでいない場合、ステップ102で受け取られた情報が区分化処理中、デジタル文書作成処理中、および同様の状況下で抽出された文書コンテンツの一部からなっている場合に発生する。
ステップ106では、テキスト内の図形部分のオブジェクトレベル表現が作成される。このデジタル形式のオブジェクトレベル表現は電子透かし情報、すなわちデータに相当する。別の実施形態では、著作権侵害を検出する場合に使用される当該文書の発行元および/または発行日など、他の種類の電子透かし情報やそれらの組合せが使用される。しかしながら、図形のオブジェクトレベル表現を使用すれば、以下にさらに詳細に説明するようなオリジナル文書の改変の検出が可能になる。図形のオブジェクトレベル表現を作成する現在好ましい処理は、図形のノードおよび線の特性を定義すること、ノードの形状、サイズ、色、位置および注釈を含ませること、それらを指定記号で記述することを含んでいる。また、この処理は、関係記号を用いてノード間の条件と類縁性を定義することを含んでいる。この処理は、コンピュータ化されてもよいが、オフラインによる実現、および/または図形の特定部分に対応する視覚および/または知的意味を反映させるカスタマイズが行われてもよい。
1つの図形例を示す図2に基づいて、本実施例中でステップ106をさらに説明する。オブジェクトの重要な特性が図形の種類に依存していることに注意することが大切である。すなわち、図2の棒グラフ200の場合、重要な情報は、図形の全体の高さではなく、各棒が示す実際の値(すなわち、個々の棒の相対高さに含まれる情報)である。同様に、円グラフ中の重要な情報は、円の全体の半径ではなく、円の個々の要素で記述される実際の値を示す相対円弧長に含まれている。棒グラフでも円グラフでも、注釈が重要な情報である場合もある。別の種類の図形は、ステップ106(図1)で同様に定義可能な追加のおよび/または異なる重要な特性を有している。しかしながら、本実施例では、ステップ104の処理の結果は、第1の棒202(図2)と第2の棒204がそれぞれ座標軸206を基準とする値で記述された最も単純な例に相当している。すなわち、第1の棒202は4の値を有し、第2の棒204は9の値を有している。当業者であれば、これらの数4と9が4ビットの二値の数字の形で表現できることは理解できるであろう。すなわち、棒グラフ200のオブジェクトレベル表現例は、第1の棒202が第2の棒204に相関している場合に、数値9(すなわち、1001)に相関する数値4(すなわち、0100)に相当する。このオブジェクトレベル表現が作成されると、処理が続行される。
図1に戻り、ステップ108に進むと、ステップ106で作成されたデータが、多数の公知のハッシュ技術のいずれかを用いてハッシュされる。ステップ110で、ハッシュされたデータに符号を付けてセキュリティを高めることが好ましい。公知のコンテンツ依存一方向ハッシュ関数を利用すれば、より高いレベルのセキュリティが実現されることは理解できるであろう。公開鍵と秘密鍵を用いた暗号化は当分野で公知である。しかしながら、他の適切な暗号プロトコルも使用できることに注意することが大切である。例えば、本明細書に引用の形で盛り込まれた論文「プライバシー制限の場合の脆弱な知覚できない電子透かし(Fragile imperceptible digital watermark with privacy control)」C.W.ウー(Wu)、D.コッパースミス(Coppersmith)、F.C.ミンツァー(Mintzer)、C.P.トレッサー(Tresser)およびM.M.ヤング(Yeung)、1999年1月マルチメディアコンテンツのセキュリティと電子透かしに関するIS&T/SPIE会議 (IS&T/SPIE Conference on Security and Watermarking of Multimedia Content)、写真・光学計測技術者協会(SPIE) 3657の画像認証の文脈には、一方向ハッシュアルゴリズムMD5を用いた暗号化手順が記載されている。その解読処理は、照合を排他的論理和演算を用いて行う暗号化処理と同様である。いずれにせよ、データがハッシュされ、符号が付けられると、以下にさらに詳細に説明するように、そのハッシュおよび符号付けされたデータを対応する図形部分に挿入させることができる。
ステップ112に進むと、階調画素の組合せに対応する所定の二値クラス分けに応じて、データが階調画素群に変換される。所定の二値クラス分けは、それを持つ者しか透かしを解読できないような鍵の形で使用されてもよい。好ましい実施形態では、ハッシュされる前の符号付けされていないオブジェクトレベル表現データと、著作権などの情報とともにオブジェクトレベル表現のハッシュ関数でハッシュされ符号付けされたデータの両方が、本発明のシステムと方法に従って階調画素群に変換される。そのような符号化の本実施例を、本発明と整合するサンプル2階調符号化を示す図3に基づいてさらに詳細に説明する。階調画素群300は、説明を容易にするために拡大化されており、それぞれサンプル対応二値クラス302に関連させて図示されている。各二値クラスは、対応する画素群300の下方に表示されている。画素位置は、画素群300の中での可能な組合せを示す目的で、直線を用いて示されている。実施例では、サンプル画素群300は、ほぼ、各画素群の4つの画素位置内での画素の有無によって定義され、16通りの組合せが普通である。しかしながら、各画素群内で階調画素が様々なサイズであってもよいので、画素の有無が画素群300内の画素の組合せを作る唯一の方法ではないことに注意することが大切である。すなわち、組合せの作成方法が容易には見えない場合に、追加のセキュリティレベルが存在する。例えば、1画素のサイズの縮小が無画素と同じ目的を果たす場合もあれば、様々な英文字や図柄を使用することが同じ目的を果たす場合もある。さらに、様々なサイズの画素や他の図柄を使用すれば、16通り以上の組合せを作成することができる。しかしながら、この追加のセキュリティレベルは、階調画素群の可変特性に本質的に伴う唯一のセキュリティレベルではない。画素群300に関する二値クラスの形状、サイズおよび定義が多様であることに対して、複数の追加のセキュリティレベルが本質的に伴う。
画素群300の形状が多様であることは、1つの追加のセキュリティレベルを与える。例えば、画素群300は、好ましい実施形態ではほぼ一様な形状を有しているが、一様な形状である必要はない。しかしながら、一様な形状であれば、以下に詳細に説明する埋込み処理が容易になる。本発明とともに使用することを想定した別の種類の一様形状には、以下に限定されるものではないが、矩形、六角形、八角形、十角形などが含まれる。また、L字型、T字型およびH字型構造の階調画素も使用可能であり、上記リストからさらに別の種類の形状も推定することができる。したがって、形状の多様性と形状の選択はセキュリティを増大させるのに役立つ。例えば、上記の方法の手順が知られたとしても、解読のためには、画素群300に関する形状の選択も知られなければならない。本実施例の場合、広範囲の組合せの可能性とそれに関連する濃淡特性で挿入を容易にするために、正方形が選択されている。
画素群のサイズが多様であることは、さらに1つのセキュリティレベルを追加する。本実施例の正方形画素群は、例えば、16通りや256通りの画素位置ではなく、1画素群あたり4通りの画素位置のみから構成されている。したがって、画素群300について大きなサイズを他にさらに選択することは、隠蔽されたデータの可視性をさらに低下させる働きをするとともに、図形の一部に埋め込まれる画素群の数を低下させる働きもする。さらに、サイズの多様性とサイズの選択はセキュリティを増大させる働きをする。例えば、画素群の形状が知られたとしても、画素群のサイズは直ちには明らかにならないかもしれない。また、画素群のサイズも形状も知られていなければ、隠蔽されたデータを発見して解読することの難解度が増す。
階調画素群300の特定の組合せに対応する二値クラス302の定義の多様性と定義の選択には、さらに別のセキュリティレベルが存在する。例えば、図3の画素群300は、図4の画素群300とは異なる二値クラス定義を有している。すなわち、画素群300のサイズと形状が予め知られていても、各画素群300について正しい二値クラス302が特定されない限り、データの解読に成功することはできない。これらの変数が総合されれば、選択が予め知られていない場合に隠蔽データを検出および/または解読することの難解度が増す。全体的に見れば、データを階調画素群に変換することにより、データを図形に埋め込むことが可能になる。
図1に戻り、ステップ114に進むと、図形の少なくとも一部を階調画素群に置換することによって、データに対応する画素群が図形に埋め込まれる。図5に示すように、本実施例の棒グラフ500は、符号504で示す4ビット二値数4(すなわち、0100)に相当する画素群と、符号506で示すその符号付きハッシュ値5(すなわち、0101)の画素群とが埋め込まれた第1の棒502を有している。この処理のために、本実施例では、図3の二値クラス定義が使用されている。第1の棒502(図5)と同様に、第2の棒508には、符号510で示す4ビット二値数9(すなわち、1001)に相当する画素群と、符号512で示すその符号付きハッシュ値3(すなわち、0011)の画素群とが埋め込まれている。なお、上記の例は本発明の処理の説明に過ぎない。実際のシステムでは、強引な攻撃を阻止するためにコンピュータで実行可能にするには、128ビット以上のハッシュ値が必要である。一部のアプリケーションや実用システムでは、セキュリティのために、符号付きハッシュ値のみを埋め込むことが好ましい。その他のアプリケーションでは、上述の二重埋込み方法は、変更を検出する能力に加えて、変更に対して回復させる能力も提供しなければならない。これらの変更には、意図的でない変更や意図的な攻撃が含まれる。その後、符号116で処理を停止し、このようにして作成された文書コンテンツに対して、データ処理システムで動作可能なメモリへの格納および/またはデータ処理システムで使用される伝播用波への埋込みが行われてもよい。そのようなシステムは、文書生成システム、および/または電子透かしシステムなどのデータ隠蔽システムであってもよい。
すぐ分かるように、本実施例のデータの各4ビットの数字は上から下に画素群に変換され、画素群がページの下方に進んでいる。同じく、すぐ分かるように、画素群のクラスターは下から上に図形に埋め込まれ、ページの上方に進んでいる。同じく、すぐ分かるように、データストリームは左から右に図形に埋め込まれている。同じく、すぐ分かるように、棒グラフ508の画素群の第1列は冗長データを含んでいる。同じく、すぐ分かるように、棒502と508の両方で、それぞれ異なる回数のコードの反復が使用されている。例えば、502は、元の値に関して1回、符号付きハッシュ値に関して0回の反復を特徴とし、508は、元の値に関して3回、符号付きハッシュ値に関して1回の反復を特徴としている。これらの各埋込み方式は随意であって、埋込みは、多数の組合せの中のいずれか1つで左から右にあるいはその逆に起こり得る。コードの反復も随意である。データ隠蔽容量の上限はあるが、反復回数は様々である。多数のアプリケーションでは、符号付きハッシュ値のみを埋め込むことが好ましい。このように、復号器が処理を逆順に行うためには、実行された埋込み方式を知るか、あるいは突き止めることができなければならないので、埋込み方式に関する多様性は、更にいくつかのセキュリティレベルを追加する。その結果、得られる図形は、多数のセキュリティレベルを有する隠蔽データを含んでいる。上述の態様/変数の選択は、暗号化および解読のために、128ビット以上からなる秘密鍵Kで指定されていてもよい。
図6に、画素位置を示す線を除去して図形の最終的な外観をより正確に表現した、結果として得られた棒グラフ600を示す。本発明を説明するために棒グラフ600の画素が大きく拡大されているのであって、実サイズの図形に埋め込まれた階調画素群ではデータの隠蔽が実現されることを思い起こすことが大切である。また、第1の棒602に使用された画素群が第2の棒604の画素群よりも淡い陰影効果をもたらし、最終的な外観を満足のゆくものにするためには画素群に関して適切な選択がなされる必要があることを理解すべきである。
本発明が採用されるその他の方法としては、テキストへの情報埋込みがある。例えば、テキスト文字と等価なASCIIまたはユニコードが一方向ハッシュ関数を用いて認証されてもよいし、符号付きハッシュ値が文書のテキスト文字列や文書の図形に埋め込まれてもよい。階調画素群を用いて上記符号付きハッシュ値などの透かしを表題行や見出し行などの二値テキストコンテンツの一部にのみ埋め込むことも可能である。また、階調画素群を用いて上記符号付きハッシュ値などの透かしを図形の二値コンテンツの一部にのみ埋め込むことも可能である。しかしながら、階調画素群を図形全体に埋め込んで外観の統一性を図ること、そして、類似性および/または同一性に基づいてノード間の関係性を定義することが好ましい。実際のシステムでは、ノード自体の中と図形全体の両方に複数回透かしを埋め込むことが好ましい。これにより、ノード改変攻撃とノード削除攻撃の両方に対する防御が確保される。データ隠蔽容量が複数回埋込みの余裕がないほど小さい場合、アプリケーションによる必要度に応じて、自己埋込みと全体埋込みの選択が必要とされる。さらに、ハッシュ値がノードベースではなく図形ベースであれば、データ隠蔽容量の必要度をさらに低減させることができる。さらに、各ノートの元の値が埋め込まれていない場合、必要とされるデータ隠蔽容量はより少なくなる。個々のシステムの構成は、アプリケーションによる必要度と、各図形または文書のデータ隠蔽容量に基づく必要がある。結果的に、棒グラフ600は図形の認証値を示す隠蔽データを有しており、図形に対するいかなる改変も本発明の認証方法によって検知することができる。
図7に、文書コンテンツから隠蔽データを抽出する本発明の方法に従って機能する文書コンテンツ認証方法を示す。この方法は、符号700で始まると、ステップ702に進み、階調画素群を含んだ文書コンテンツに関連する情報を受け取る。ステップ102(図1)の場合と同様に、この情報はいくつかの形式をとることができる。1つの形式例では、情報はデジタル形式の電子ファイルの形の文書に相当し、このファイルは、文書のオリジナル形式、有形の文書からスキャナで取り込まれたビットマップ、または同様の文書転生物を成す。本実施例では、受け取られた情報は、図形と文字を含む文書のビットマップに相当しており、図形の少なくとも一部は階調画素から構成されている。
ステップ704(図7)に進むと、文書コンテンツは図形とテキストに区分化される。このステップは、ステップ104(図1)とほぼ同じであり、アプリケーションの種類に応じて随意である。別の実施形態では、ステップ704(図7)は随意であってもよく、このステップが随意であるか否かは、主として文書コンテンツに情報を隠蔽するために採られるステップ次第である。関連する点は、隠蔽された情報を抽出する方法が情報隠蔽方法を補完する必要があることであり、図形を区分化すると、ステップ106(図1)で行われたのと同じようにして、ステップ706で図形のオブジェクトレベル表現を作成することができる。ステップ108とステップ110は、同様に、ステップ708(図7)とステップ710のそれぞれのモデルとなり、データが文書コンテンツに隠蔽された時に使用されたものと同じオブジェクトレベル表現技術、同じハッシュ技術および同じ符号付け技術を使用することが必要である。したがって、ハッシュ関数および符号付け関数を演算するための適切な鍵を所有することが必要になる場合がある。
ステップ704からステップ712に進むと、文書コンテンツの区分化された部分から複数の階調画素群が抽出される。正確な画素群を適切な組合せで抽出する技術は、画素群を埋め込むために使用された技術を補完する必要があり、その画素群に関する二値クラス分け、サイズ、形状、埋込み方向および反復回数について同じ定義を導入する必要がある。
これらの定義は、128ビット以上のサイズの鍵Kの形で使用されてもよいし、安全な通信チャンネルを介して受信者に安全に転送されてもよい。
これらの定義は、128ビット以上のサイズの鍵Kの形で使用されてもよいし、安全な通信チャンネルを介して受信者に安全に転送されてもよい。
画素群が適正に抽出されると、ステップ714で、階調画素の組合せに対応する所定の二値クラス分けに応じて、階調画素群をデータに変換することができる。したがって、データ隠蔽処理で使用されたのと同じ画素群には同じ二値クラス定義を導入することが必要である。これにより、結果として抽出されたデータは、データ処理システムで動作可能なメモリへの格納および/またはデータ処理システムで使用される伝播用波への埋込みを行うことができる。そのようなシステムは、文書認証システムおよび/または隠蔽データ抽出システムであってもよい。
オブジェクトレベル表現が完了し、再構成されたデータがハッシュおよび符号付けされ、抽出された画素群が抽出データに変換されると、ステップ716で、再構成データの形式と抽出データの形式を比較して信憑性を検証した後、符号718で終了することができる。
上記好ましい実施形態を用いれば、かなりの改変が行われた場合でも、オリジナル文書がどのような様相であったかを突き止められる場合が多い。また、本発明のデータ隠蔽方法および抽出方法は、文書が何度も再現可能である一方でわずかな改変を検出できるという点で全般的にロバストである。また、縮尺変更や回転などの一部の幾何学的変換に対して、さらには非線形幾何学的変換に対してもロバストである。複写が行われた場合には、再現物はそれほどロバストではなく、100回目に作成された複写物は、隠蔽情報を確実に抽出可能な形で保持することはない。その一方で、電子的な再現は、抽出可能性を妨げることなく無制限に行うことができる。
この開示に整合する更なる用途を補足する本発明の変型も実施可能である。例えば、本発明を用いてIDやタイムスタンプなどの他の種類の電子透かしを埋め込むことも可能である。この場合、ステップ106、108および110(図1)を、「透かしデータ生成」ステップに置換し、ステップ706、708、710および716を削除する必要がある。
本発明の記述は本質的に例示に過ぎず、したがって、本発明の主旨から逸脱しない変型は、本発明の範囲に包含されるものとする。そのような変型は本発明の精神および範囲から逸脱するものとみなされるべきではない。
Claims (15)
- 文書コンテンツにデータを隠蔽する方法であって、
少なくとも一部が二値性を有する文書コンテンツに関する情報を受け取る工程と、
階調画素の組合せに対応する所定の二値クラス分けに応じてデータを階調画素群に変換する工程と、
上記文書コンテンツの二値の部分を上記階調画素群と置換する工程を含む方法。 - 上記文書コンテンツを解析する工程と、
上記文書コンテンツのオブジェクトレベル表現を作成する工程と、
上記オブジェクトレベル表現に基づいて上記データを作成する工程をさらに含んでいる請求項1記載の方法。 - 上記データに基づいてハッシュ値を算出する工程をさらに含んでいる請求項2記載の方法。
- 上記ハッシュ値に符号を付ける工程をさらに含んでいる請求項3記載の方法。
- 請求項1記載の方法によって作成された文書コンテンツを含んだ、データ処理システムで転送される伝播用波。
- データ処理システムで動作可能なメモリに格納される情報であって、請求項1記載の方法によって作成された文書コンテンツに相当する情報。
- 請求項1記載の方法に従って動作する電子透かしシステム。
- 文書コンテンツに隠蔽されたデータを抽出する方法であって、
階調画素群を含んだ文書コンテンツに関する情報を受け取る工程と、
上記文書コンテンツから上記階調画素群を抽出する工程と、
階調画素の組合せに対応する所定の二値クラス分けに応じて上記階調画素群をデータに変換する工程を含む方法。 - 請求項8記載の方法に従って抽出されたデータを含んだ伝播用波。
- データ処理システムで動作可能なメモリに格納される情報であって、請求項8記載の方法に従って抽出されたデータに相当する情報。
- 請求項8記載の方法に従って機能する文書コンテンツ認証方法であって、
上記文書コンテンツを解析する工程と、
上記文書コンテンツのオブジェクトレベル表現を作成する工程と、
上記オブジェクトレベル表現に基づいて追加のデータを作成する工程をさらに含んでいる方法。 - 上記追加のデータに基づいてハッシュ値を算出する工程をさらに含んでいる請求項11記載の方法。
- 上記ハッシュ値に符号を付ける工程をさらに含んでいる請求項12記載の方法。
- 上記データと上記追加のデータを比較する工程をさらに含んでいる請求項11記載の方法。
- 請求項11記載の方法に従って動作する文書認証システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/095,493 US6775394B2 (en) | 2002-03-12 | 2002-03-12 | Digital watermarking of binary document using halftoning |
PCT/US2003/006782 WO2003079277A1 (en) | 2002-03-12 | 2003-03-07 | Digital watermarking of binary document using halftoning |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005520426A true JP2005520426A (ja) | 2005-07-07 |
Family
ID=28038890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003577202A Pending JP2005520426A (ja) | 2002-03-12 | 2003-03-07 | 階調表現を用いた二値文書の電子透かし |
Country Status (6)
Country | Link |
---|---|
US (1) | US6775394B2 (ja) |
EP (1) | EP1488369A4 (ja) |
JP (1) | JP2005520426A (ja) |
CN (1) | CN1759406A (ja) |
AU (1) | AU2003217948A1 (ja) |
WO (1) | WO2003079277A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7920737B2 (en) | 2006-07-11 | 2011-04-05 | Fujitsu Limited | Code image processing method and code image processing apparatus |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7215770B2 (en) | 2002-01-02 | 2007-05-08 | Sony Corporation | System and method for partially encrypted multimedia stream |
US20040205662A1 (en) * | 2002-05-30 | 2004-10-14 | Brad Anderson | Image preservation and reconstruction |
US20040037448A1 (en) * | 2002-06-20 | 2004-02-26 | Brundage Trent J. | Digitally watermarking paper and objects with stamps and related digitally watermarked stamper |
US7254772B2 (en) * | 2002-07-30 | 2007-08-07 | Xerox Corporation | Systems and methods for visually representing the aging and/or expiration of electronic documents |
JP2004297778A (ja) * | 2003-03-07 | 2004-10-21 | Canon Inc | 画像データ暗号化方法及び装置、並びにコンピュータプログラム及びコンピュータ可読記憶媒体 |
US8438395B2 (en) * | 2003-09-18 | 2013-05-07 | Digimarc Corporation | Digitally watermarking documents associated with vehicles |
US8363282B2 (en) * | 2003-10-31 | 2013-01-29 | Hewlett-Packard Development Company, L.P. | Halftone screening and bitmap based encoding of information in images |
JP2008501995A (ja) * | 2004-06-04 | 2008-01-24 | ヤコブ・ハッテランド・ディスプレイ・アーエス | 画像フリーズ検出器 |
US7352879B2 (en) * | 2004-12-06 | 2008-04-01 | Xerox Corporation | Conjugate cluster screens for embedding digital watermarks into printed halftone documents |
EP1691539A1 (en) * | 2005-02-15 | 2006-08-16 | European Central Bank | Two-dimensional security pattern that can be authenticated with one-dimensional signal processing |
US20070017979A1 (en) * | 2005-07-25 | 2007-01-25 | Chunghwa Telecom Co., Ltd. | Mobile ticketing via information hiding |
JP4555212B2 (ja) * | 2005-11-10 | 2010-09-29 | 株式会社沖データ | 透かし情報埋め込み装置,透かし情報埋め込み方法,およびコンピュータプログラム |
US7986441B2 (en) * | 2007-04-04 | 2011-07-26 | Wong Technologies L.L.C. | Embedding watermark into halftone image with low distortion using parity values for overlapping groups of candidate sites |
US8650402B2 (en) * | 2007-08-17 | 2014-02-11 | Wong Technologies L.L.C. | General data hiding framework using parity for minimal switching |
US8049930B2 (en) * | 2008-09-15 | 2011-11-01 | National Taiwan University Of Science And Technology | Method of halftone watermarking for hiding multi-tone watermark or two-tone watermark |
US9749607B2 (en) | 2009-07-16 | 2017-08-29 | Digimarc Corporation | Coordinated illumination and image signal capture for enhanced signal detection |
US8289574B2 (en) * | 2009-09-02 | 2012-10-16 | Xerox Corporation | Method and system for controlling darkening of image data |
ES2381244T3 (es) | 2009-09-09 | 2012-05-24 | European Central Bank | Un procedimiento para generar una imagen de seguridad en dos niveles para un billete de banco |
CN103646195B (zh) * | 2013-11-27 | 2016-03-30 | 南京师范大学 | 一种面向版权保护的数据库水印方法 |
US10872392B2 (en) | 2017-11-07 | 2020-12-22 | Digimarc Corporation | Generating artistic designs encoded with robust, machine-readable data |
US11062108B2 (en) | 2017-11-07 | 2021-07-13 | Digimarc Corporation | Generating and reading optical codes with variable density to adapt for visual quality and reliability |
US10896307B2 (en) | 2017-11-07 | 2021-01-19 | Digimarc Corporation | Generating and reading optical codes with variable density to adapt for visual quality and reliability |
CN117668787B (zh) * | 2023-12-04 | 2024-06-14 | 湖南工商大学 | 基于卷积神经网络的电子文档识别加密及防伪检测方法 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3564130A (en) | 1966-03-21 | 1971-02-16 | Rca Corp | Electronic photocopy system |
GB1204542A (en) | 1967-02-20 | 1970-09-09 | Rca Corp | Improved printing process |
DE3851724T2 (de) | 1987-07-08 | 1995-05-04 | Matsushita Electric Ind Co Ltd | Verfahren und Gerät zum Schutz von Kopiersignalen. |
US5862260A (en) | 1993-11-18 | 1999-01-19 | Digimarc Corporation | Methods for surveying dissemination of proprietary empirical data |
US5499294A (en) | 1993-11-24 | 1996-03-12 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Digital camera with apparatus for authentication of images produced from an image file |
US5710636A (en) * | 1995-06-05 | 1998-01-20 | Xerox Corporation | Method and apparatus for generating halftone images having human readable patterns formed therein |
US5822432A (en) | 1996-01-17 | 1998-10-13 | The Dice Company | Method for human-assisted random key generation and application for digital watermark system |
US5905819A (en) | 1996-02-05 | 1999-05-18 | Eastman Kodak Company | Method and apparatus for hiding one image or pattern within another |
US5761686A (en) * | 1996-06-27 | 1998-06-02 | Xerox Corporation | Embedding encoded information in an iconic version of a text image |
US5765176A (en) * | 1996-09-06 | 1998-06-09 | Xerox Corporation | Performing document image management tasks using an iconic image having embedded encoded information |
US5734752A (en) * | 1996-09-24 | 1998-03-31 | Xerox Corporation | Digital watermarking using stochastic screen patterns |
US5915027A (en) | 1996-11-05 | 1999-06-22 | Nec Research Institute | Digital watermarking |
US5790703A (en) * | 1997-01-21 | 1998-08-04 | Xerox Corporation | Digital watermarking using conjugate halftone screens |
DE69840308D1 (de) | 1997-02-24 | 2009-01-22 | Nec Corp | System zur Kodierung digitaler Daten |
US5951055A (en) * | 1997-06-11 | 1999-09-14 | The Standard Register Company | Security document containing encoded data block |
EP0901282B1 (en) | 1997-09-03 | 2006-06-28 | Hitachi, Ltd. | Method for recording and reproducing electronic watermark information |
JP4064506B2 (ja) | 1997-09-17 | 2008-03-19 | パイオニア株式会社 | 電子透かし重畳方法及び検出方法並びに装置 |
US6263086B1 (en) | 1998-04-15 | 2001-07-17 | Xerox Corporation | Automatic detection and retrieval of embedded invisible digital watermarks from halftone images |
US6252971B1 (en) | 1998-04-29 | 2001-06-26 | Xerox Corporation | Digital watermarking using phase-shifted stoclustic screens |
US6456393B1 (en) * | 1998-08-18 | 2002-09-24 | Seiko Epson Corporation | Information embedding in document copies |
US6285775B1 (en) | 1998-10-01 | 2001-09-04 | The Trustees Of The University Of Princeton | Watermarking scheme for image authentication |
US6526155B1 (en) * | 1999-11-24 | 2003-02-25 | Xerox Corporation | Systems and methods for producing visible watermarks by halftoning |
JP2001309150A (ja) * | 2000-04-20 | 2001-11-02 | Matsushita Information System Co Ltd | データ埋め込み装置、データ埋め込み方法及び記録媒体 |
-
2002
- 2002-03-12 US US10/095,493 patent/US6775394B2/en not_active Expired - Fee Related
-
2003
- 2003-03-07 CN CN03808855.XA patent/CN1759406A/zh active Pending
- 2003-03-07 AU AU2003217948A patent/AU2003217948A1/en not_active Abandoned
- 2003-03-07 WO PCT/US2003/006782 patent/WO2003079277A1/en not_active Application Discontinuation
- 2003-03-07 JP JP2003577202A patent/JP2005520426A/ja active Pending
- 2003-03-07 EP EP03713924A patent/EP1488369A4/en not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7920737B2 (en) | 2006-07-11 | 2011-04-05 | Fujitsu Limited | Code image processing method and code image processing apparatus |
Also Published As
Publication number | Publication date |
---|---|
CN1759406A (zh) | 2006-04-12 |
US6775394B2 (en) | 2004-08-10 |
EP1488369A4 (en) | 2006-05-24 |
AU2003217948A1 (en) | 2003-09-29 |
EP1488369A1 (en) | 2004-12-22 |
WO2003079277A1 (en) | 2003-09-25 |
US20030174857A1 (en) | 2003-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005520426A (ja) | 階調表現を用いた二値文書の電子透かし | |
JP3989433B2 (ja) | ソフト・コピー・テキスト文書の中に見えないようにデータを埋め込み隠すための方法 | |
Holliman et al. | Counterfeiting attacks on oblivious block-wise independent invisible watermarking schemes | |
KR100465950B1 (ko) | 정보 처리 장치 및 그 제어 방법, 컴퓨터 프로그램을 저장한 저장 매체 | |
EP0953938B1 (en) | A method and apparatus for digital watermarking of images | |
JP5253352B2 (ja) | 文書内にメッセージを埋め込む方法、及び距離場を使用して文書内にメッセージを埋め込む方法 | |
Shih et al. | Enhancement of image watermark retrieval based on genetic algorithms | |
US8014557B2 (en) | Watermarking electronic text documents | |
US20060045309A1 (en) | Systems and methods for digital content security | |
JP2010016816A (ja) | 重要コンテンツを認証データに保持した状態で文書を自己認証する方法 | |
Sun | A new information hiding method based on improved BPCS steganography | |
Saha et al. | Security on fragile and semi-fragile watermarks authentication | |
Jaiswal et al. | Implementation of a new technique for web document protection using unicode | |
JP4652167B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2005143135A (ja) | テキストドキュメントに表示されたグラフのコンテンツに基づいた認証 | |
Zhang et al. | Chinese text watermarking based on occlusive components | |
JP4260076B2 (ja) | 文書作成装置、文書検証装置、文書作成方法、文書検証方法、文書作成プログラム、文書検証プログラム、文書作成プログラムを格納した記録媒体、および文書検証プログラムを格納した記録媒体 | |
Serteep et al. | Using mono chrome image in secure data transfer based on book cipher | |
Puhan et al. | Secure tamper localization in binary document image authentication | |
Chan et al. | Security of Lin's image watermarking system | |
Singh et al. | Tamper Detection Technique for Text Images based on Vowels and Unicode Zero Length Characters | |
El-Seoud et al. | On the information hiding technique using least significant bits steganography | |
Varghese et al. | Reversible Encrypted Data Hiding In Encrypted Video | |
Kanishka et al. | IMPROVED IMAGE QUALITY WITH CRYPTOGRAPHY AND STEGANOGRAPHY FOR COLOURED IMAGE PROCESSING | |
Burdescu et al. | An Algorithm for Authentication of Digital Images |