JP2005520426A - 階調表現を用いた二値文書の電子透かし - Google Patents

階調表現を用いた二値文書の電子透かし Download PDF

Info

Publication number
JP2005520426A
JP2005520426A JP2003577202A JP2003577202A JP2005520426A JP 2005520426 A JP2005520426 A JP 2005520426A JP 2003577202 A JP2003577202 A JP 2003577202A JP 2003577202 A JP2003577202 A JP 2003577202A JP 2005520426 A JP2005520426 A JP 2005520426A
Authority
JP
Japan
Prior art keywords
data
document content
pixel group
document
gradation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003577202A
Other languages
English (en)
Inventor
ホン ヘザー ユー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JP2005520426A publication Critical patent/JP2005520426A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/0028Adaptive watermarking, e.g. Human Visual System [HVS]-based watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32203Spatial or amplitude domain methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32203Spatial or amplitude domain methods
    • H04N1/32256Spatial or amplitude domain methods in halftone data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0051Embedding of the watermark in the spatial domain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0083Image watermarking whereby only watermarked image required at decoder, e.g. source-based, blind, oblivious
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3233Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark
    • H04N2201/3236Details of authentication information generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3233Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark
    • H04N2201/3239Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark using a plurality of different authentication information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3233Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark
    • H04N2201/324Selecting a particular authentication information from amongst a plurality of different authentication information

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Abstract

本発明は、文書コンテンツにデータを隠蔽する方法(図1)である。この方法は、少なくとも一部が二値性を有する文書コンテンツに関する情報を受け取る工程(102)と、階調画素の組合せに対応する所定の二値クラス分けに応じてデータを階調画素群に変換する工程(104)と、上記階調画素群を上記文書コンテンツの二値の部分に埋め込む工程(104および114)を含んでいる。また、本発明は、文書コンテンツに隠蔽されたデータを抽出する方法(図7)である。この方法は、階調画素群を含んだ文書コンテンツに関する情報を受け取る工程(702)と、上記文書コンテンツから上記階調画素群を抽出する工程(712)と、階調画素の組合せに対応する所定の二値クラス分けに応じて上記階調画素群をデータに変換する工程(714)を含んでいる。

Description

本発明はデジタル情報処理に関し、特に、電子透かし技術を用いた文書認証およびステガノグラフィーに関する。
今日、文書の認証および電子透かし技術に大きな関心がもたれており、電子透かしを用いて文書コンテンツ内に情報を隠蔽する様々なシステムや方法が開発されている。しかしながら、データ隠蔽に関する取組みの大部分は、画像などの非二値の文書コンテンツに向けられている。
グレースケールおよびカラーの画像(以後、画像と称する)の場合、文書コンテンツが非二値性であるため、データ隠蔽容量が非常に大きくなる。例えば、1画像中の各画素は、通常、所定長さの多数のビットからなる数字によってデジタル形式で表現される。その数字の長さが大きいことは、カラー画像中の多数の色相を表現するために必要であり、グレースケール画像中の多数の濃淡を表現するためにも必要である。したがって、デジタル形式の非二値データを用いた最下位ビット変調により、表示または印刷された文書には画素のごくわずかな色調や濃淡の変化としてしか現れないデータ隠蔽を実現することができる。しかしながら、この技術は、二値性の文書コンテンツには広く適用可能であるわけではない。
図形やテキストなどの二値性の文書コンテンツに対するデータ隠蔽に関して主として問題となるのは、データの二値性にある。換言すれば、このような文書コンテンツは1画素あたり1ビットしか有していない。したがって、データのデジタル形式の数字を変調させると、いつ変調が発生しても、結果的にデータコンテンツが反転することになる。その結果、例えば、二値図形内のビットをごくわずかしか変更していないのに、図形の外観と内容が大きく変化してしまう可能性がある。全般的に見て、この種の文書コンテンツにデータを隠蔽することはほとんど困難であるが、テキストにデータを隠蔽する方法は開発されている。
テキストにデータを隠蔽する方法は、二値図形中のビットのごくわずかな変更が図形の場合ほどテキストの外観と内容を大幅に変化させないことを利用している。したがって、縦方向の文字の長さの変更や、単語間隔および/または行間隔の変更を用いて、テキスト内にデータが隠蔽される。例えば、従来の間隔変更方法とセリフ変更方法が、ともに本明細書に引用の形で盛り込まれた「文書複製を阻止する電子透かしおよび識別技術(Electronic Marking and Identification Techniques to Discourage Document Copying)」J.ブラッシル(Brassil), S.ロー(Low), N.マクゼムチュク(Maxemchuk), およびL.オゴーマン(O’Gorman), 米国電気電子技術者協会(IEEE)インフォコム(Infocom)94と、「行変位と単語変位の両方を用いた電子透かしと識別(Document Marking and Identification using Both Line and Word Shifting)」S.H.ロー(Low), N.F.マクゼムチュク(Maxemchuk), J.T.ブラッシル(Brassil), およびL.オゴーマン(O’Gorman), インフォコム(Infocom)95に提案されている。しかしながら、図形は画素レベルでさえテキストと同じ特性をもたない場合が多いので、これらの方法を図形にうまく適用することはできない。
したがって、二値性の文書コンテンツに対するデータ隠蔽に関する、特に、図形にデータを隠蔽する場合の問題の解決策の必要性は依然として存在しており、そのような解決策を提供することが本発明の目的である。
本発明は、第1の側面では、文書コンテンツにデータを隠蔽する方法である。この方法は、少なくとも一部が二値性を有する文書コンテンツに関する情報を受け取る工程と、階調画素の組合せに対応する所定の二値クラス分けに応じてデータを階調画素群に変換する工程と、上記文書コンテンツの二値の部分を上記階調画素群と置換する工程を含んでいる。
本発明は、第2の側面では、文書コンテンツに隠蔽されたデータを抽出する方法である。この方法は、階調画素群を含んだ文書コンテンツに関する情報を受け取る工程と、上記文書コンテンツから上記階調画素群を抽出する工程と、階調画素の組合せに対応する所定の二値クラス分けに応じて上記階調画素群をデータに変換する工程を含んでいる。
本発明のさらに他の利用可能分野は、以下に示す詳細な説明から明らかになるであろう。以下の詳細な説明と具体例は、本発明の好ましい実施形態を示す一方で、例示の目的のみを意図したものであり、本発明の範囲を限定することを意図したものではないことを理解されるべきである。
本発明は、以下の詳細な説明と添付の図面により、より深く理解されるであろう。
以下の好ましい実施形態の説明は、本質的に例示に過ぎず、本発明、そのアプリケーションまたは用途を限定することを意図したものでは全くない。
図1に、二値性の文書コンテンツにデータ、すなわち、電子透かし情報を隠蔽する現在好ましい方法を示す。この方法は、複数のステップを含んでいる。その一部は、本発明にとって必須ではないが、単に現在好ましい実施形態を説明するために含められている。この方法は、本実施例を用いて説明される。
符号100で開始し、ステップ102に進むと、文書コンテンツに関する情報が受け取られる。この情報はいくつかの形式をとることができる。1つの形式例では、情報はデジタル形式の電子ファイルの形の文書に相当し、このファイルは、文書のオリジナル形式、有形の文書からスキャナで取り込まれたビットマップ、または同様の文書転生物を成す。本実施例では、受け取られた情報は、図形と文字を含む文書のビットマップに相当しており、その全てが二値コンテンツであるが、二値コンテンツに加えて、非二値性のコンテンツを含んでいる場合もある。
ステップ104では、文書はテキストコンテンツと図形コンテンツに区分化される。文書内の図形をテキスト領域から区分することは、かなり研究されている課題となっている。例えば、本明細書に引例の形で盛り込まれたカレン(Cullen)他の米国特許第5,465,304号明細書および米国特許第5,335,290号明細書は、文書画像の文字、図絵、線のセグメント化について記述している。また、本明細書に引例の形で盛り込まれたヴェストダイク(Westdijk)の米国特許第5,073,953号明細書は、自動文書セグメント化システムおよび方法を開示している。さらに、本明細書に引例の形で盛り込まれたチョウ(Zhou)他の米国特許第5,892,843号明細書には、テキスト本体を文書の他の領域から分離することが教示されている。また、ワン(Wang)他の米国特許第5,379,130号明細書には、テキストから画像を分離する方法およびシステムが開示されている。これらの技術や他の公知の手法のいずれも、区分化ステップ104を実行するために容易に適応させることができる。このステップ102は、好ましい実施形態であっても、一定の状況下では随意である。そのような状況は、例えば、文書が図形しか含んでいない場合、ステップ102で受け取られた情報が区分化処理中、デジタル文書作成処理中、および同様の状況下で抽出された文書コンテンツの一部からなっている場合に発生する。
ステップ106では、テキスト内の図形部分のオブジェクトレベル表現が作成される。このデジタル形式のオブジェクトレベル表現は電子透かし情報、すなわちデータに相当する。別の実施形態では、著作権侵害を検出する場合に使用される当該文書の発行元および/または発行日など、他の種類の電子透かし情報やそれらの組合せが使用される。しかしながら、図形のオブジェクトレベル表現を使用すれば、以下にさらに詳細に説明するようなオリジナル文書の改変の検出が可能になる。図形のオブジェクトレベル表現を作成する現在好ましい処理は、図形のノードおよび線の特性を定義すること、ノードの形状、サイズ、色、位置および注釈を含ませること、それらを指定記号で記述することを含んでいる。また、この処理は、関係記号を用いてノード間の条件と類縁性を定義することを含んでいる。この処理は、コンピュータ化されてもよいが、オフラインによる実現、および/または図形の特定部分に対応する視覚および/または知的意味を反映させるカスタマイズが行われてもよい。
1つの図形例を示す図2に基づいて、本実施例中でステップ106をさらに説明する。オブジェクトの重要な特性が図形の種類に依存していることに注意することが大切である。すなわち、図2の棒グラフ200の場合、重要な情報は、図形の全体の高さではなく、各棒が示す実際の値(すなわち、個々の棒の相対高さに含まれる情報)である。同様に、円グラフ中の重要な情報は、円の全体の半径ではなく、円の個々の要素で記述される実際の値を示す相対円弧長に含まれている。棒グラフでも円グラフでも、注釈が重要な情報である場合もある。別の種類の図形は、ステップ106(図1)で同様に定義可能な追加のおよび/または異なる重要な特性を有している。しかしながら、本実施例では、ステップ104の処理の結果は、第1の棒202(図2)と第2の棒204がそれぞれ座標軸206を基準とする値で記述された最も単純な例に相当している。すなわち、第1の棒202は4の値を有し、第2の棒204は9の値を有している。当業者であれば、これらの数4と9が4ビットの二値の数字の形で表現できることは理解できるであろう。すなわち、棒グラフ200のオブジェクトレベル表現例は、第1の棒202が第2の棒204に相関している場合に、数値9(すなわち、1001)に相関する数値4(すなわち、0100)に相当する。このオブジェクトレベル表現が作成されると、処理が続行される。
図1に戻り、ステップ108に進むと、ステップ106で作成されたデータが、多数の公知のハッシュ技術のいずれかを用いてハッシュされる。ステップ110で、ハッシュされたデータに符号を付けてセキュリティを高めることが好ましい。公知のコンテンツ依存一方向ハッシュ関数を利用すれば、より高いレベルのセキュリティが実現されることは理解できるであろう。公開鍵と秘密鍵を用いた暗号化は当分野で公知である。しかしながら、他の適切な暗号プロトコルも使用できることに注意することが大切である。例えば、本明細書に引用の形で盛り込まれた論文「プライバシー制限の場合の脆弱な知覚できない電子透かし(Fragile imperceptible digital watermark with privacy control)」C.W.ウー(Wu)、D.コッパースミス(Coppersmith)、F.C.ミンツァー(Mintzer)、C.P.トレッサー(Tresser)およびM.M.ヤング(Yeung)、1999年1月マルチメディアコンテンツのセキュリティと電子透かしに関するIS&T/SPIE会議 (IS&T/SPIE Conference on Security and Watermarking of Multimedia Content)、写真・光学計測技術者協会(SPIE) 3657の画像認証の文脈には、一方向ハッシュアルゴリズムMD5を用いた暗号化手順が記載されている。その解読処理は、照合を排他的論理和演算を用いて行う暗号化処理と同様である。いずれにせよ、データがハッシュされ、符号が付けられると、以下にさらに詳細に説明するように、そのハッシュおよび符号付けされたデータを対応する図形部分に挿入させることができる。
ステップ112に進むと、階調画素の組合せに対応する所定の二値クラス分けに応じて、データが階調画素群に変換される。所定の二値クラス分けは、それを持つ者しか透かしを解読できないような鍵の形で使用されてもよい。好ましい実施形態では、ハッシュされる前の符号付けされていないオブジェクトレベル表現データと、著作権などの情報とともにオブジェクトレベル表現のハッシュ関数でハッシュされ符号付けされたデータの両方が、本発明のシステムと方法に従って階調画素群に変換される。そのような符号化の本実施例を、本発明と整合するサンプル2階調符号化を示す図3に基づいてさらに詳細に説明する。階調画素群300は、説明を容易にするために拡大化されており、それぞれサンプル対応二値クラス302に関連させて図示されている。各二値クラスは、対応する画素群300の下方に表示されている。画素位置は、画素群300の中での可能な組合せを示す目的で、直線を用いて示されている。実施例では、サンプル画素群300は、ほぼ、各画素群の4つの画素位置内での画素の有無によって定義され、16通りの組合せが普通である。しかしながら、各画素群内で階調画素が様々なサイズであってもよいので、画素の有無が画素群300内の画素の組合せを作る唯一の方法ではないことに注意することが大切である。すなわち、組合せの作成方法が容易には見えない場合に、追加のセキュリティレベルが存在する。例えば、1画素のサイズの縮小が無画素と同じ目的を果たす場合もあれば、様々な英文字や図柄を使用することが同じ目的を果たす場合もある。さらに、様々なサイズの画素や他の図柄を使用すれば、16通り以上の組合せを作成することができる。しかしながら、この追加のセキュリティレベルは、階調画素群の可変特性に本質的に伴う唯一のセキュリティレベルではない。画素群300に関する二値クラスの形状、サイズおよび定義が多様であることに対して、複数の追加のセキュリティレベルが本質的に伴う。
画素群300の形状が多様であることは、1つの追加のセキュリティレベルを与える。例えば、画素群300は、好ましい実施形態ではほぼ一様な形状を有しているが、一様な形状である必要はない。しかしながら、一様な形状であれば、以下に詳細に説明する埋込み処理が容易になる。本発明とともに使用することを想定した別の種類の一様形状には、以下に限定されるものではないが、矩形、六角形、八角形、十角形などが含まれる。また、L字型、T字型およびH字型構造の階調画素も使用可能であり、上記リストからさらに別の種類の形状も推定することができる。したがって、形状の多様性と形状の選択はセキュリティを増大させるのに役立つ。例えば、上記の方法の手順が知られたとしても、解読のためには、画素群300に関する形状の選択も知られなければならない。本実施例の場合、広範囲の組合せの可能性とそれに関連する濃淡特性で挿入を容易にするために、正方形が選択されている。
画素群のサイズが多様であることは、さらに1つのセキュリティレベルを追加する。本実施例の正方形画素群は、例えば、16通りや256通りの画素位置ではなく、1画素群あたり4通りの画素位置のみから構成されている。したがって、画素群300について大きなサイズを他にさらに選択することは、隠蔽されたデータの可視性をさらに低下させる働きをするとともに、図形の一部に埋め込まれる画素群の数を低下させる働きもする。さらに、サイズの多様性とサイズの選択はセキュリティを増大させる働きをする。例えば、画素群の形状が知られたとしても、画素群のサイズは直ちには明らかにならないかもしれない。また、画素群のサイズも形状も知られていなければ、隠蔽されたデータを発見して解読することの難解度が増す。
階調画素群300の特定の組合せに対応する二値クラス302の定義の多様性と定義の選択には、さらに別のセキュリティレベルが存在する。例えば、図3の画素群300は、図4の画素群300とは異なる二値クラス定義を有している。すなわち、画素群300のサイズと形状が予め知られていても、各画素群300について正しい二値クラス302が特定されない限り、データの解読に成功することはできない。これらの変数が総合されれば、選択が予め知られていない場合に隠蔽データを検出および/または解読することの難解度が増す。全体的に見れば、データを階調画素群に変換することにより、データを図形に埋め込むことが可能になる。
図1に戻り、ステップ114に進むと、図形の少なくとも一部を階調画素群に置換することによって、データに対応する画素群が図形に埋め込まれる。図5に示すように、本実施例の棒グラフ500は、符号504で示す4ビット二値数4(すなわち、0100)に相当する画素群と、符号506で示すその符号付きハッシュ値5(すなわち、0101)の画素群とが埋め込まれた第1の棒502を有している。この処理のために、本実施例では、図3の二値クラス定義が使用されている。第1の棒502(図5)と同様に、第2の棒508には、符号510で示す4ビット二値数9(すなわち、1001)に相当する画素群と、符号512で示すその符号付きハッシュ値3(すなわち、0011)の画素群とが埋め込まれている。なお、上記の例は本発明の処理の説明に過ぎない。実際のシステムでは、強引な攻撃を阻止するためにコンピュータで実行可能にするには、128ビット以上のハッシュ値が必要である。一部のアプリケーションや実用システムでは、セキュリティのために、符号付きハッシュ値のみを埋め込むことが好ましい。その他のアプリケーションでは、上述の二重埋込み方法は、変更を検出する能力に加えて、変更に対して回復させる能力も提供しなければならない。これらの変更には、意図的でない変更や意図的な攻撃が含まれる。その後、符号116で処理を停止し、このようにして作成された文書コンテンツに対して、データ処理システムで動作可能なメモリへの格納および/またはデータ処理システムで使用される伝播用波への埋込みが行われてもよい。そのようなシステムは、文書生成システム、および/または電子透かしシステムなどのデータ隠蔽システムであってもよい。
すぐ分かるように、本実施例のデータの各4ビットの数字は上から下に画素群に変換され、画素群がページの下方に進んでいる。同じく、すぐ分かるように、画素群のクラスターは下から上に図形に埋め込まれ、ページの上方に進んでいる。同じく、すぐ分かるように、データストリームは左から右に図形に埋め込まれている。同じく、すぐ分かるように、棒グラフ508の画素群の第1列は冗長データを含んでいる。同じく、すぐ分かるように、棒502と508の両方で、それぞれ異なる回数のコードの反復が使用されている。例えば、502は、元の値に関して1回、符号付きハッシュ値に関して0回の反復を特徴とし、508は、元の値に関して3回、符号付きハッシュ値に関して1回の反復を特徴としている。これらの各埋込み方式は随意であって、埋込みは、多数の組合せの中のいずれか1つで左から右にあるいはその逆に起こり得る。コードの反復も随意である。データ隠蔽容量の上限はあるが、反復回数は様々である。多数のアプリケーションでは、符号付きハッシュ値のみを埋め込むことが好ましい。このように、復号器が処理を逆順に行うためには、実行された埋込み方式を知るか、あるいは突き止めることができなければならないので、埋込み方式に関する多様性は、更にいくつかのセキュリティレベルを追加する。その結果、得られる図形は、多数のセキュリティレベルを有する隠蔽データを含んでいる。上述の態様/変数の選択は、暗号化および解読のために、128ビット以上からなる秘密鍵Kで指定されていてもよい。
図6に、画素位置を示す線を除去して図形の最終的な外観をより正確に表現した、結果として得られた棒グラフ600を示す。本発明を説明するために棒グラフ600の画素が大きく拡大されているのであって、実サイズの図形に埋め込まれた階調画素群ではデータの隠蔽が実現されることを思い起こすことが大切である。また、第1の棒602に使用された画素群が第2の棒604の画素群よりも淡い陰影効果をもたらし、最終的な外観を満足のゆくものにするためには画素群に関して適切な選択がなされる必要があることを理解すべきである。
本発明が採用されるその他の方法としては、テキストへの情報埋込みがある。例えば、テキスト文字と等価なASCIIまたはユニコードが一方向ハッシュ関数を用いて認証されてもよいし、符号付きハッシュ値が文書のテキスト文字列や文書の図形に埋め込まれてもよい。階調画素群を用いて上記符号付きハッシュ値などの透かしを表題行や見出し行などの二値テキストコンテンツの一部にのみ埋め込むことも可能である。また、階調画素群を用いて上記符号付きハッシュ値などの透かしを図形の二値コンテンツの一部にのみ埋め込むことも可能である。しかしながら、階調画素群を図形全体に埋め込んで外観の統一性を図ること、そして、類似性および/または同一性に基づいてノード間の関係性を定義することが好ましい。実際のシステムでは、ノード自体の中と図形全体の両方に複数回透かしを埋め込むことが好ましい。これにより、ノード改変攻撃とノード削除攻撃の両方に対する防御が確保される。データ隠蔽容量が複数回埋込みの余裕がないほど小さい場合、アプリケーションによる必要度に応じて、自己埋込みと全体埋込みの選択が必要とされる。さらに、ハッシュ値がノードベースではなく図形ベースであれば、データ隠蔽容量の必要度をさらに低減させることができる。さらに、各ノートの元の値が埋め込まれていない場合、必要とされるデータ隠蔽容量はより少なくなる。個々のシステムの構成は、アプリケーションによる必要度と、各図形または文書のデータ隠蔽容量に基づく必要がある。結果的に、棒グラフ600は図形の認証値を示す隠蔽データを有しており、図形に対するいかなる改変も本発明の認証方法によって検知することができる。
図7に、文書コンテンツから隠蔽データを抽出する本発明の方法に従って機能する文書コンテンツ認証方法を示す。この方法は、符号700で始まると、ステップ702に進み、階調画素群を含んだ文書コンテンツに関連する情報を受け取る。ステップ102(図1)の場合と同様に、この情報はいくつかの形式をとることができる。1つの形式例では、情報はデジタル形式の電子ファイルの形の文書に相当し、このファイルは、文書のオリジナル形式、有形の文書からスキャナで取り込まれたビットマップ、または同様の文書転生物を成す。本実施例では、受け取られた情報は、図形と文字を含む文書のビットマップに相当しており、図形の少なくとも一部は階調画素から構成されている。
ステップ704(図7)に進むと、文書コンテンツは図形とテキストに区分化される。このステップは、ステップ104(図1)とほぼ同じであり、アプリケーションの種類に応じて随意である。別の実施形態では、ステップ704(図7)は随意であってもよく、このステップが随意であるか否かは、主として文書コンテンツに情報を隠蔽するために採られるステップ次第である。関連する点は、隠蔽された情報を抽出する方法が情報隠蔽方法を補完する必要があることであり、図形を区分化すると、ステップ106(図1)で行われたのと同じようにして、ステップ706で図形のオブジェクトレベル表現を作成することができる。ステップ108とステップ110は、同様に、ステップ708(図7)とステップ710のそれぞれのモデルとなり、データが文書コンテンツに隠蔽された時に使用されたものと同じオブジェクトレベル表現技術、同じハッシュ技術および同じ符号付け技術を使用することが必要である。したがって、ハッシュ関数および符号付け関数を演算するための適切な鍵を所有することが必要になる場合がある。
ステップ704からステップ712に進むと、文書コンテンツの区分化された部分から複数の階調画素群が抽出される。正確な画素群を適切な組合せで抽出する技術は、画素群を埋め込むために使用された技術を補完する必要があり、その画素群に関する二値クラス分け、サイズ、形状、埋込み方向および反復回数について同じ定義を導入する必要がある。
これらの定義は、128ビット以上のサイズの鍵Kの形で使用されてもよいし、安全な通信チャンネルを介して受信者に安全に転送されてもよい。
画素群が適正に抽出されると、ステップ714で、階調画素の組合せに対応する所定の二値クラス分けに応じて、階調画素群をデータに変換することができる。したがって、データ隠蔽処理で使用されたのと同じ画素群には同じ二値クラス定義を導入することが必要である。これにより、結果として抽出されたデータは、データ処理システムで動作可能なメモリへの格納および/またはデータ処理システムで使用される伝播用波への埋込みを行うことができる。そのようなシステムは、文書認証システムおよび/または隠蔽データ抽出システムであってもよい。
オブジェクトレベル表現が完了し、再構成されたデータがハッシュおよび符号付けされ、抽出された画素群が抽出データに変換されると、ステップ716で、再構成データの形式と抽出データの形式を比較して信憑性を検証した後、符号718で終了することができる。
上記好ましい実施形態を用いれば、かなりの改変が行われた場合でも、オリジナル文書がどのような様相であったかを突き止められる場合が多い。また、本発明のデータ隠蔽方法および抽出方法は、文書が何度も再現可能である一方でわずかな改変を検出できるという点で全般的にロバストである。また、縮尺変更や回転などの一部の幾何学的変換に対して、さらには非線形幾何学的変換に対してもロバストである。複写が行われた場合には、再現物はそれほどロバストではなく、100回目に作成された複写物は、隠蔽情報を確実に抽出可能な形で保持することはない。その一方で、電子的な再現は、抽出可能性を妨げることなく無制限に行うことができる。
この開示に整合する更なる用途を補足する本発明の変型も実施可能である。例えば、本発明を用いてIDやタイムスタンプなどの他の種類の電子透かしを埋め込むことも可能である。この場合、ステップ106、108および110(図1)を、「透かしデータ生成」ステップに置換し、ステップ706、708、710および716を削除する必要がある。
本発明の記述は本質的に例示に過ぎず、したがって、本発明の主旨から逸脱しない変型は、本発明の範囲に包含されるものとする。そのような変型は本発明の精神および範囲から逸脱するものとみなされるべきではない。
図1は、本発明にかかるデータ隠蔽方法のフロー図である。 図2は、本発明の説明に使用される棒グラフに相当するサンプル図形である。 図3は、本発明にかかる対応する二値クラス定義を有するサンプル階調画素群を示すブロック図である。 図4は、本発明にかかる別の二値クラス定義を示すブロック図である。 図5は、本発明にかかる埋込み階調画素群を示すサンプル図形である。 図6は、本発明にかかる隠蔽データを示すサンプル図形である。 図7は、本発明にかかる隠蔽データ抽出方法を用いる文書認証方法を示すフロー図である。

Claims (15)

  1. 文書コンテンツにデータを隠蔽する方法であって、
    少なくとも一部が二値性を有する文書コンテンツに関する情報を受け取る工程と、
    階調画素の組合せに対応する所定の二値クラス分けに応じてデータを階調画素群に変換する工程と、
    上記文書コンテンツの二値の部分を上記階調画素群と置換する工程を含む方法。
  2. 上記文書コンテンツを解析する工程と、
    上記文書コンテンツのオブジェクトレベル表現を作成する工程と、
    上記オブジェクトレベル表現に基づいて上記データを作成する工程をさらに含んでいる請求項1記載の方法。
  3. 上記データに基づいてハッシュ値を算出する工程をさらに含んでいる請求項2記載の方法。
  4. 上記ハッシュ値に符号を付ける工程をさらに含んでいる請求項3記載の方法。
  5. 請求項1記載の方法によって作成された文書コンテンツを含んだ、データ処理システムで転送される伝播用波。
  6. データ処理システムで動作可能なメモリに格納される情報であって、請求項1記載の方法によって作成された文書コンテンツに相当する情報。
  7. 請求項1記載の方法に従って動作する電子透かしシステム。
  8. 文書コンテンツに隠蔽されたデータを抽出する方法であって、
    階調画素群を含んだ文書コンテンツに関する情報を受け取る工程と、
    上記文書コンテンツから上記階調画素群を抽出する工程と、
    階調画素の組合せに対応する所定の二値クラス分けに応じて上記階調画素群をデータに変換する工程を含む方法。
  9. 請求項8記載の方法に従って抽出されたデータを含んだ伝播用波。
  10. データ処理システムで動作可能なメモリに格納される情報であって、請求項8記載の方法に従って抽出されたデータに相当する情報。
  11. 請求項8記載の方法に従って機能する文書コンテンツ認証方法であって、
    上記文書コンテンツを解析する工程と、
    上記文書コンテンツのオブジェクトレベル表現を作成する工程と、
    上記オブジェクトレベル表現に基づいて追加のデータを作成する工程をさらに含んでいる方法。
  12. 上記追加のデータに基づいてハッシュ値を算出する工程をさらに含んでいる請求項11記載の方法。
  13. 上記ハッシュ値に符号を付ける工程をさらに含んでいる請求項12記載の方法。
  14. 上記データと上記追加のデータを比較する工程をさらに含んでいる請求項11記載の方法。
  15. 請求項11記載の方法に従って動作する文書認証システム。
JP2003577202A 2002-03-12 2003-03-07 階調表現を用いた二値文書の電子透かし Pending JP2005520426A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/095,493 US6775394B2 (en) 2002-03-12 2002-03-12 Digital watermarking of binary document using halftoning
PCT/US2003/006782 WO2003079277A1 (en) 2002-03-12 2003-03-07 Digital watermarking of binary document using halftoning

Publications (1)

Publication Number Publication Date
JP2005520426A true JP2005520426A (ja) 2005-07-07

Family

ID=28038890

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003577202A Pending JP2005520426A (ja) 2002-03-12 2003-03-07 階調表現を用いた二値文書の電子透かし

Country Status (6)

Country Link
US (1) US6775394B2 (ja)
EP (1) EP1488369A4 (ja)
JP (1) JP2005520426A (ja)
CN (1) CN1759406A (ja)
AU (1) AU2003217948A1 (ja)
WO (1) WO2003079277A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7920737B2 (en) 2006-07-11 2011-04-05 Fujitsu Limited Code image processing method and code image processing apparatus

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7215770B2 (en) 2002-01-02 2007-05-08 Sony Corporation System and method for partially encrypted multimedia stream
US20040205662A1 (en) * 2002-05-30 2004-10-14 Brad Anderson Image preservation and reconstruction
US20040037448A1 (en) * 2002-06-20 2004-02-26 Brundage Trent J. Digitally watermarking paper and objects with stamps and related digitally watermarked stamper
US7254772B2 (en) * 2002-07-30 2007-08-07 Xerox Corporation Systems and methods for visually representing the aging and/or expiration of electronic documents
JP2004297778A (ja) * 2003-03-07 2004-10-21 Canon Inc 画像データ暗号化方法及び装置、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
US8438395B2 (en) * 2003-09-18 2013-05-07 Digimarc Corporation Digitally watermarking documents associated with vehicles
US8363282B2 (en) * 2003-10-31 2013-01-29 Hewlett-Packard Development Company, L.P. Halftone screening and bitmap based encoding of information in images
JP2008501995A (ja) * 2004-06-04 2008-01-24 ヤコブ・ハッテランド・ディスプレイ・アーエス 画像フリーズ検出器
US7352879B2 (en) * 2004-12-06 2008-04-01 Xerox Corporation Conjugate cluster screens for embedding digital watermarks into printed halftone documents
EP1691539A1 (en) * 2005-02-15 2006-08-16 European Central Bank Two-dimensional security pattern that can be authenticated with one-dimensional signal processing
US20070017979A1 (en) * 2005-07-25 2007-01-25 Chunghwa Telecom Co., Ltd. Mobile ticketing via information hiding
JP4555212B2 (ja) * 2005-11-10 2010-09-29 株式会社沖データ 透かし情報埋め込み装置,透かし情報埋め込み方法,およびコンピュータプログラム
US7986441B2 (en) * 2007-04-04 2011-07-26 Wong Technologies L.L.C. Embedding watermark into halftone image with low distortion using parity values for overlapping groups of candidate sites
US8650402B2 (en) * 2007-08-17 2014-02-11 Wong Technologies L.L.C. General data hiding framework using parity for minimal switching
US8049930B2 (en) * 2008-09-15 2011-11-01 National Taiwan University Of Science And Technology Method of halftone watermarking for hiding multi-tone watermark or two-tone watermark
US9749607B2 (en) 2009-07-16 2017-08-29 Digimarc Corporation Coordinated illumination and image signal capture for enhanced signal detection
US8289574B2 (en) * 2009-09-02 2012-10-16 Xerox Corporation Method and system for controlling darkening of image data
ES2381244T3 (es) 2009-09-09 2012-05-24 European Central Bank Un procedimiento para generar una imagen de seguridad en dos niveles para un billete de banco
CN103646195B (zh) * 2013-11-27 2016-03-30 南京师范大学 一种面向版权保护的数据库水印方法
US10872392B2 (en) 2017-11-07 2020-12-22 Digimarc Corporation Generating artistic designs encoded with robust, machine-readable data
US11062108B2 (en) 2017-11-07 2021-07-13 Digimarc Corporation Generating and reading optical codes with variable density to adapt for visual quality and reliability
US10896307B2 (en) 2017-11-07 2021-01-19 Digimarc Corporation Generating and reading optical codes with variable density to adapt for visual quality and reliability
CN117668787B (zh) * 2023-12-04 2024-06-14 湖南工商大学 基于卷积神经网络的电子文档识别加密及防伪检测方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3564130A (en) 1966-03-21 1971-02-16 Rca Corp Electronic photocopy system
GB1204542A (en) 1967-02-20 1970-09-09 Rca Corp Improved printing process
DE3851724T2 (de) 1987-07-08 1995-05-04 Matsushita Electric Ind Co Ltd Verfahren und Gerät zum Schutz von Kopiersignalen.
US5862260A (en) 1993-11-18 1999-01-19 Digimarc Corporation Methods for surveying dissemination of proprietary empirical data
US5499294A (en) 1993-11-24 1996-03-12 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Digital camera with apparatus for authentication of images produced from an image file
US5710636A (en) * 1995-06-05 1998-01-20 Xerox Corporation Method and apparatus for generating halftone images having human readable patterns formed therein
US5822432A (en) 1996-01-17 1998-10-13 The Dice Company Method for human-assisted random key generation and application for digital watermark system
US5905819A (en) 1996-02-05 1999-05-18 Eastman Kodak Company Method and apparatus for hiding one image or pattern within another
US5761686A (en) * 1996-06-27 1998-06-02 Xerox Corporation Embedding encoded information in an iconic version of a text image
US5765176A (en) * 1996-09-06 1998-06-09 Xerox Corporation Performing document image management tasks using an iconic image having embedded encoded information
US5734752A (en) * 1996-09-24 1998-03-31 Xerox Corporation Digital watermarking using stochastic screen patterns
US5915027A (en) 1996-11-05 1999-06-22 Nec Research Institute Digital watermarking
US5790703A (en) * 1997-01-21 1998-08-04 Xerox Corporation Digital watermarking using conjugate halftone screens
DE69840308D1 (de) 1997-02-24 2009-01-22 Nec Corp System zur Kodierung digitaler Daten
US5951055A (en) * 1997-06-11 1999-09-14 The Standard Register Company Security document containing encoded data block
EP0901282B1 (en) 1997-09-03 2006-06-28 Hitachi, Ltd. Method for recording and reproducing electronic watermark information
JP4064506B2 (ja) 1997-09-17 2008-03-19 パイオニア株式会社 電子透かし重畳方法及び検出方法並びに装置
US6263086B1 (en) 1998-04-15 2001-07-17 Xerox Corporation Automatic detection and retrieval of embedded invisible digital watermarks from halftone images
US6252971B1 (en) 1998-04-29 2001-06-26 Xerox Corporation Digital watermarking using phase-shifted stoclustic screens
US6456393B1 (en) * 1998-08-18 2002-09-24 Seiko Epson Corporation Information embedding in document copies
US6285775B1 (en) 1998-10-01 2001-09-04 The Trustees Of The University Of Princeton Watermarking scheme for image authentication
US6526155B1 (en) * 1999-11-24 2003-02-25 Xerox Corporation Systems and methods for producing visible watermarks by halftoning
JP2001309150A (ja) * 2000-04-20 2001-11-02 Matsushita Information System Co Ltd データ埋め込み装置、データ埋め込み方法及び記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7920737B2 (en) 2006-07-11 2011-04-05 Fujitsu Limited Code image processing method and code image processing apparatus

Also Published As

Publication number Publication date
CN1759406A (zh) 2006-04-12
US6775394B2 (en) 2004-08-10
EP1488369A4 (en) 2006-05-24
AU2003217948A1 (en) 2003-09-29
EP1488369A1 (en) 2004-12-22
WO2003079277A1 (en) 2003-09-25
US20030174857A1 (en) 2003-09-18

Similar Documents

Publication Publication Date Title
JP2005520426A (ja) 階調表現を用いた二値文書の電子透かし
JP3989433B2 (ja) ソフト・コピー・テキスト文書の中に見えないようにデータを埋め込み隠すための方法
Holliman et al. Counterfeiting attacks on oblivious block-wise independent invisible watermarking schemes
KR100465950B1 (ko) 정보 처리 장치 및 그 제어 방법, 컴퓨터 프로그램을 저장한 저장 매체
EP0953938B1 (en) A method and apparatus for digital watermarking of images
JP5253352B2 (ja) 文書内にメッセージを埋め込む方法、及び距離場を使用して文書内にメッセージを埋め込む方法
Shih et al. Enhancement of image watermark retrieval based on genetic algorithms
US8014557B2 (en) Watermarking electronic text documents
US20060045309A1 (en) Systems and methods for digital content security
JP2010016816A (ja) 重要コンテンツを認証データに保持した状態で文書を自己認証する方法
Sun A new information hiding method based on improved BPCS steganography
Saha et al. Security on fragile and semi-fragile watermarks authentication
Jaiswal et al. Implementation of a new technique for web document protection using unicode
JP4652167B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2005143135A (ja) テキストドキュメントに表示されたグラフのコンテンツに基づいた認証
Zhang et al. Chinese text watermarking based on occlusive components
JP4260076B2 (ja) 文書作成装置、文書検証装置、文書作成方法、文書検証方法、文書作成プログラム、文書検証プログラム、文書作成プログラムを格納した記録媒体、および文書検証プログラムを格納した記録媒体
Serteep et al. Using mono chrome image in secure data transfer based on book cipher
Puhan et al. Secure tamper localization in binary document image authentication
Chan et al. Security of Lin's image watermarking system
Singh et al. Tamper Detection Technique for Text Images based on Vowels and Unicode Zero Length Characters
El-Seoud et al. On the information hiding technique using least significant bits steganography
Varghese et al. Reversible Encrypted Data Hiding In Encrypted Video
Kanishka et al. IMPROVED IMAGE QUALITY WITH CRYPTOGRAPHY AND STEGANOGRAPHY FOR COLOURED IMAGE PROCESSING
Burdescu et al. An Algorithm for Authentication of Digital Images