JP7162216B2 - Digital watermarking device and method - Google Patents
Digital watermarking device and method Download PDFInfo
- Publication number
- JP7162216B2 JP7162216B2 JP2019000178A JP2019000178A JP7162216B2 JP 7162216 B2 JP7162216 B2 JP 7162216B2 JP 2019000178 A JP2019000178 A JP 2019000178A JP 2019000178 A JP2019000178 A JP 2019000178A JP 7162216 B2 JP7162216 B2 JP 7162216B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- image
- embedded
- information
- embedding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Facsimile Transmission Control (AREA)
Description
本発明は,著作権保護や偽造防止を目的として、デジタル画像データに著作権情報などの透かし情報を埋め込む電子透かし法で、高画質化と高耐性を維持しつつ、特に、埋め込み情報量を増大させた電子透かし装置および方法に関するものである。 The present invention is an electronic watermarking method that embeds watermark information such as copyright information in digital image data for the purpose of copyright protection and forgery prevention. The present invention relates to a digital watermarking apparatus and method.
現在のデジタル情報社会において,情報の複製により多くの人が情報を共有することが可能となり,社会が大きく発展してきた。しかし,その利便性が,他人の著作物を違法に複製し流通させることにより,著作権侵害などの事件が起きるようになった。画像においては,近年のデジタルカメラやプリンタの高画質化により,原画と寸分も違わぬ複製が容易に得られるようになり,著作権を侵害した違反コピーだけでなく,紙幣や有価証券等の偽造行為という悪質な犯罪行為を助長させる結果となっている。 In today's digital information society, information duplication has made it possible for many people to share information, and society has developed significantly. However, this convenience has led to incidents such as copyright infringement due to the illegal duplication and distribution of other people's works. In the case of images, the high image quality of digital cameras and printers in recent years has made it possible to easily obtain exact reproductions of original images. It is a result of encouraging vicious criminal acts called acts.
そのような状況の中で,画像情報の中に別の情報,例えば,著作者情報等を埋め込み,著作権を保護したり、違法複写に警告を与えたりする不可視の電子透かし(Digital Watermark)技術が発展してきた。この電子透かし技術は、例えば、著作権保護の目的には、文書や画像の著作物の中に著作権者やURL、連絡先、利用条件などを埋め込み、利用者に注意を喚起するのみならず、不正利用された場合には、その追跡を可能とする。このように、著作権の管理・保護、ならびに不正複写の監視など、セキュリティ対策として電子透かしが広く使われ始めている。 In such a situation, invisible digital watermark technology embeds other information, such as author information, in image information to protect copyright or warn against illegal duplication. has developed. For example, for the purpose of copyright protection, this digital watermarking technology not only embeds the copyright owner, URL, contact information, terms of use, etc. , and in case of unauthorized use, it is possible to trace it. In this way, electronic watermarks are beginning to be widely used as security measures such as copyright management/protection and unauthorized copying monitoring.
このセキュリティ対策としての電子透かしは、頑強で簡単に消失あるいは除去できないものでなければならない。画像の編集加工や簡単な操作で透かし情報を除去や消去ができるならば、不正使用して追跡や監視の目から逃れることができるからである。すなわち、様々な攻撃に対して耐性を強化する必要がある。 The electronic watermark as a security measure must be robust and cannot be easily lost or removed. This is because if the watermark information can be removed or erased by editing the image or by a simple operation, it can be used illegally and escaped from tracking and surveillance. That is, it is necessary to strengthen resistance to various attacks.
通常、耐性を強化するためには、電子透かしを画像データの深層に埋め込む必要がある。このため、埋め込みの強度(gain) を大きくして埋め込む。これは、原画像に対してダメージが増大し、画質が劣化するという弊害をもたらす。つまり、画質と耐性とはお互いにトレードオフの関係にあり、両方を満たすことは通常困難である。 Typically, to enhance robustness, a digital watermark needs to be embedded deep into the image data. Therefore, the embedding strength (gain) is increased for embedding. This increases damage to the original image, resulting in deterioration of image quality. In other words, image quality and durability are in a trade-off relationship, and it is usually difficult to satisfy both.
画質と耐性を満たす電子透かし法として、特許文献1から4に示されるグリーンノイズパターンを画像データに埋め込む手法(以降、グリーンノイズ拡散法と呼ぶ)を以前提案した。グリーンノイズパターンは,そのスペクトルが特定の帯域fmax~fminに閉じ込められ、その主周波数は、人の視覚特性で認識できにくい周波数帯に設定できる。このため、電子透かしに用いた場合、埋め込み画像を明視の距離で観察した場合、ドットパターンは低い応答性を示し認識されにくい。このため、埋め込み強度(gain)を上げて編集・加工に強靭にしてもアーティファクトが感じられず,高画質性が保たれたまま高耐性を保持できる。
As a digital watermarking method that satisfies image quality and robustness, we previously proposed a method of embedding a green noise pattern in image data (hereinafter referred to as a green noise diffusion method), which is shown in
一方、埋め込み可能な情報量から見た場合、耐性を強化すると埋め込み可能な情報量は減少する。通常、不可視の電子透かし手法では、抽出時の誤判定、すなわち抽出誤りが生じることは避けて通れない。このため、同じ情報を繰り返し埋め込み、多数決や信頼度の高い情報を選択する方法や、エラー訂正符号を同時に埋め込む方法により回避する。これらの方法は、埋め込む情報量を増大させる。このため、本来埋め込まれるべき透かし情報が減少する。 On the other hand, in terms of the amount of information that can be embedded, increasing the resistance reduces the amount of information that can be embedded. Normally, the invisible electronic watermarking method cannot avoid the occurrence of erroneous determinations at the time of extraction, that is, extraction errors. For this reason, the same information is repeatedly embedded, and information with a majority vote or high reliability is selected, or an error correction code is embedded at the same time to avoid this. These methods increase the amount of embedded information. Therefore, watermark information to be originally embedded is reduced.
かかるグリーンノイズ拡散法では、画像をR×Rのブロックに分割し、埋め込みビットに応じたグリーンノイズドットパターンを画像データに重畳することにより埋め込み操作が行われる。埋め込まれる容量は、このブロックの数により決まる。したがって、画像サイズが小さい場合、埋め込みブロック数が少なく埋め込み容量が不足する。したがって、画質と耐性は満たすことができても、埋め込み容量においては十分ではない。 In such a green noise diffusion method, an embedding operation is performed by dividing an image into R×R blocks and superimposing a green noise dot pattern corresponding to embedding bits on the image data. The embedded capacity is determined by the number of blocks. Therefore, when the image size is small, the number of embedding blocks is small and the embedding capacity is insufficient. Therefore, even if the image quality and durability are satisfied, the embedding capacity is not sufficient.
この対策として埋め込み情報の複数ビットをまとめて、複数のパターンを用いて埋め込む、いわゆる多値化の方法がある。例えば、4値の場合、各ブロックに2ビットの情報を埋め込むため、2ビットの情報(00,01,10,11)に対応した4つの異なるドットパターンを用意する必要がある。 As a countermeasure for this, there is a so-called multi-value method in which a plurality of bits of embedded information are grouped together and embedded using a plurality of patterns. For example, in the case of four values, since 2-bit information is embedded in each block, it is necessary to prepare four different dot patterns corresponding to 2-bit information (00, 01, 10, 11).
このため、グリーンノイズの帯域の最大周波数fmaxや最小周波数fminを変えた複数のスペクトル形状のドットパターンを用いたり、スペクトルが矩形や円となるような全く異なるドットパターンを組み合わせたり、ブルーノイズパターンなどを組み合わるなどの方法で、4つのパターンを用意する方法を提案した。しかしながら、これらの方法では、各ブロック毎に空間周波数の帯域が変化するため、耐性を強くするためにgainを上げるとブロックの境界がわずかながら視認され(これをブロック歪と呼ぶ)、画質的には十分ではない。 For this reason, it is possible to use dot patterns with multiple spectral shapes that change the maximum frequency fmax and minimum frequency fmin of the green noise band, combine completely different dot patterns with rectangular or circular spectra, blue noise patterns, etc. We proposed a method of preparing four patterns by combining However, with these methods, the spatial frequency band changes for each block, so if the gain is increased to strengthen the tolerance, the boundaries of the blocks will be slightly visible (this is called block distortion), resulting in poor image quality. is not enough.
そこで、高画質と高耐性を維持し、埋め込み容量を増大させる電子透かし法を得ることが課題である。すなわち、強く埋め込んでもブロック歪が目立つことなく画質の劣化が少ない電子透かしで、画像編集や加工、第三者からの攻撃などに対して強い耐性を示し、かつ、十分な埋め込み量を可能とする電子透かし法を得ることが課題である。 Therefore, it is a problem to obtain a digital watermarking method that maintains high image quality and high durability and increases the embedding capacity. In other words, it is a digital watermark that does not cause noticeable block distortion even if it is strongly embedded, and has little deterioration in image quality. The challenge is to obtain a digital watermarking method.
以上の課題を解決するために、本発明は、画像をブロック分割し、ブロックごとに2ビットの透かし情報を埋め込む、すなわち多値化(この場合は4値化)することにより、従来の2倍の埋め込み容量を確保し、かつ、各ブロック歪などの画質劣化のないドットパターンで上記問題を解決する。つまり、各ブロックでドットパターンの空間周波数帯域(レンジ)が同じで、方向だけが異なるドットパターンを用いることで、高画質、高耐性で従来の2倍の埋め込み量となる手法を提供する。 In order to solve the above problems, the present invention divides an image into blocks and embeds 2-bit watermark information in each block, i.e., multi-value (quaternarization in this case), thereby doubling the conventional image. To solve the above problem with a dot pattern that secures an embedding capacity of , and does not cause deterioration of image quality such as distortion of each block. In other words, by using dot patterns with the same spatial frequency band (range) for each block and different dot patterns only in different directions, we provide a method that doubles the amount of embedding with high image quality and high durability.
すなわち、デジタル画像データに埋め込まれる透かし情報をビット列に展開した透かしデータと、同じ楕円リング形状で、その主軸方向が0°、45°、90°、135°の方向に向いたグリーンノイズ・スペクトル特性を示す4つのドットパターン(パターン0、パターン1、パターン2、パターン3)を用意し、埋め込みは、画像データをR画素×R画素単位のブロックに分割し、ブロック毎に透かしデータから2ビットの情報を取り出し、2ビットの情報(00,01,10,11)に対応したドットパターンにgainを乗じたパターンで画像データに埋め込み、透かし情報の抽出は、透かしの埋め込まれた画像データをブロックに分割し、ブロック毎にスペクトルパターンを求め、識別器によりその形状から,4つのドットパターンの中から最も近いものを識別し、埋め込まれた2ビットの情報を抽出する。
That is, the green noise spectral characteristics of the same elliptical ring shape as the watermark data obtained by developing the watermark information embedded in the digital image data into a bit string, with the main axis directions oriented in the directions of 0°, 45°, 90°, and 135° 4 dot patterns (
また、4つのドットパターン(パターン0、パターン1、パターン2、パターン3)は、主軸方向が0°、45°、90°、135°の方向となる4つの楕円リング形状のフィルタD(u,v)を用いて、
(工程1)疑似乱数発生器により、ランダムドットp(x,y)を生成する。
(工程2)p(x,y)に二次元フーリエ変換を行い,スペクトルP(u,v)を得る。(ここで、(x,y)は空間座標、(u,v)は空間周波数座標を表す。)
(工程3) P(u,v)にフィルタD(u,v)を掛けて、新たなP'(u,v)を得る。
(工程4) P'(u,v)に逆フーリエ変換を行い,多値の点プロファイルp'(x,y)を得る。
(工程5)誤差関数e(x,y)=p'(x,y)-p(x,y)を求め,各画素位置での誤差の大きい順に白,黒反転する。
(工程6)工程2から工程5までの操作を誤差が許容量以内になるまで繰り返し,ドットパターンを得る。
なる、工程で生成され、そのスペクトル特性は、それぞれ主軸方向が0°、45°、90°、135°の方向に向いた楕円リング形状のグリーンノイズ特性を示す。
The four dot patterns (
(Step 1) Random dots p(x, y) are generated by a pseudo-random number generator.
(Step 2) A two-dimensional Fourier transform is performed on p(x,y) to obtain a spectrum P(u,v). (where (x,y) are spatial coordinates and (u,v) are spatial frequency coordinates.)
(Step 3) Multiply P(u,v) by filter D(u,v) to obtain new P'(u,v).
(Step 4) Perform an inverse Fourier transform on P'(u, v) to obtain a multivalued point profile p'(x, y).
(Step 5) Obtain an error function e(x, y)=p'(x, y)-p(x, y), and perform white and black inversion in descending order of error at each pixel position.
(Step 6)
, whose spectral characteristics exhibit elliptical ring-shaped green noise characteristics with the principal axis directions oriented at 0°, 45°, 90°, and 135°, respectively.
また、4つのドットパターンうち、2つドットパターン(パターン0、パターン1)を、主軸方向が0°、45°の方向となる2つの楕円リング形状のフィルタD(u,v)を用いて、前述と同様の工程で生成し、残り2つのドットパターン(パターン2、パターン3)は、生成されたパターン0およびパターン1を90°回転することにより生成することもできる。それぞれのスペクトル特性はグリーンノイズ特性を示す。
Also, two of the four dot patterns (
また、識別器は、主軸方向が0°、45°、90°、135°の方向となる4つの楕円リング形状の抽出用のマスク(マスク0、マスク1、マスク2、マスク3)を用いて、ブロック毎の画像スペクトルパターンW(u, v)に対して,出力Qi (i=0,1,2,3) を、
Qi=(1/Z) Σ Mi(u, v)・W(u, v)
Z=ΣMi(u,v)
として求め(ここで、Mi(u,v)はマスクiの分布 (i=0,1,2,3) である)、かかる出力Qi (i=0,1,2,3) のうち、最も大きな値の出力Qmax、および次に大きい出力Qnextを求め、Qmaxに対応する埋め込みパターンから埋め込まれた2ビットを抽出し,Qmax-Qnextから信頼度を得る。
The discriminator uses four elliptical ring-shaped extraction masks (
Qi=(1/Z) ΣMi(u,v)・W(u,v)
Z=ΣMi(u,v)
(where Mi(u,v) is the distribution of mask i (i=0,1,2,3)), and among such outputs Qi (i=0,1,2,3), the most Find the largest output Qmax and the next largest output Qnext, extract the two embedded bits from the embedding pattern corresponding to Qmax, and obtain the reliability from Qmax- Qnext .
本発明により、ブロック歪を抑え、gainを大きくしても高画質を維持し、高耐性で透かし埋め込み情報量を増大させることが可能となる。このため、小サイズの画像でも十分な情報量を埋め込むことが可能となる。ブロック歪の抑制は、4つのドットパターンのスペクトル特性が、方向は異なるが、主軸に沿ってfmaxとfminの間の値をとるため、ドットサイズは変化しないためである。 According to the present invention, it is possible to suppress block distortion, maintain high image quality even when the gain is increased, and increase the amount of watermark embedding information with high durability. Therefore, it is possible to embed a sufficient amount of information even in a small-sized image. The suppression of blockiness is due to the fact that the spectral characteristics of the four dot patterns take values between fmax and fmin along the major axis, although in different directions, so that the dot size does not change.
また、鍵により元の画像に復元可能である。これは画像の購入者が、配信者から直接原画を配信してもらう手間を省くことができるし、原画で、の配信を行うことがないため、漏洩や盗難などの心配もなく、セキュリティ上も安全性が高い。さらに購入者はその鍵を用いて、編集加工した画像に第二著作者としての著作権情報を埋め込むことができる。 Also, the original image can be restored with a key. This saves the purchaser of the image the trouble of having the original image delivered directly from the distributor. High safety. Furthermore, the purchaser can use the key to embed the copyright information as the second author in the edited image.
また、4つのドットパターンうち、2つのドットパターン(パターン0、パターン1)をフィルタリングにより生成し、残り2つのドットパターンを90°回転することにより生成することにより、除去のための鍵は2つのパターンのみを必要とし、鍵のサイズを小さくすることが可能となる。鍵サイズが小さくなることにより利便性が増す。
Also, of the four dot patterns, two dot patterns (
図1は本発明の情報埋め込みと抽出のための電子透かしシステムの構成図である。著作権保有者のコンピュータ3には、著作権を有す画像データが、例えばハードディスクなどのデータメモリ7に保管されている。画像データは、プログラムメモリ6にある画像処理プログラムにより、CPU11,ROM 4,RAM5などを用いて画像処理され、モニター8に表示される。コンピュータ3にはスキャナー1、プリンタ2が接続され、処理された画像はプリンタから出力し、またスキャナー1から画像読み取りができる。かかる画像処理は大きなサイズの画像を取り扱う場合,演算負荷が増大するため,並列処理を行うことや、GPUなどの高速化を図るための処理ボードが入っている場合もある。
FIG. 1 is a configuration diagram of a digital watermarking system for information embedding and extraction according to the present invention. In the copyright holder's computer 3, copyrighted image data is stored in a data memory 7 such as a hard disk. The image data is image-processed by the image processing program in the
画像中に著作権情報を埋め込むためには、キーボード9から、例えば、著作者の名前や日付、URLなどの文字情報を入れるが、埋め込む文字数は、最低16文字は必要となる。これはASCIIコードの文字でうめこむとして16バイト(128ビット)が必要となる。 In order to embed the copyright information in the image, character information such as the author's name, date, URL, etc. is input from the keyboard 9, and at least 16 characters are required to be embedded. This requires 16 bytes (128 bits) assuming that it is filled with ASCII code characters.
図2は、一つの運用形態を示すもので,インターネット配信の処理手順を示すものである。透かし情報を埋め込まれた画像は、配信者あるいは著作権者16のコンピュータからインターネット12により配信される(13)。それを見た購入希望者17は、購入希望を配信者に連絡する(14)。所定の手続き後、配信者は透かしの埋め込みと除去のための秘密鍵を配信する(15)。購入者は、配信者との契約に基づき、送付された画像の埋め込まれた電子透かしを除去し、画像の編集加工を行うことができる。
FIG. 2 shows one operation mode, showing a processing procedure for internet distribution. The image embedded with the watermark information is distributed via the
購入者は、さらに編集加工された画像データを、2次著作者として自己の著作情報やURLなどの情報をこの秘密鍵を用いて埋め込むことができる。これらの透かし情報を埋め込まれた画像は、公開され市場に流通し様々な利用がされる。 The purchaser can embed information such as his/her own work information and URL as a secondary author in the edited image data using this secret key. Images embedded with such watermark information are released to the public, circulated on the market, and used in various ways.
その画像を見た第三者は、透かし抽出ソフトにより、この画像に著作権があることを確認できる。透かし抽出ソフトウェアには秘密性はなく、例えば,配信者や著作権者のホームページなどから自由にダウンロードできるようにして広く公開し、だれでも使用できる。第三者はこれにより画像の所有者や著作権情報、連絡先などを知ることができるため、不正使用の防止・警告にもなる。 A third party who sees the image can confirm that the image has the copyright by using watermark extraction software. The watermark extracting software is not confidential and can be freely downloaded from, for example, the homepages of distributors and copyright holders and made widely available for anyone to use. Third parties can know the owner of the image, copyright information, contact information, etc. by this, so it can also prevent unauthorized use and warn.
一方、著作権者や二次著作権者は、その透かしにより、著作物としての画像データの追跡と監視を行うことが可能である。もし、第三者が不正に使用した場合、著作権者や二次著作権者は、監視ソフトウェアにより画像から透かし情報を読みだし、自己の著作物であること、さらに第三者が無断で使用している場合には摘発が可能となる。 On the other hand, copyright holders and secondary copyright holders can track and monitor image data as copyrighted works by using the watermark. If a third party uses the image illegally, the copyright holder or secondary copyright holder will read the watermark information from the image using monitoring software, confirm that it is their own work, and that the third party will use it without permission. If so, it can be detected.
鍵は埋め込む画像ごとに1対1で対応する。このため、著作権者は悪用されないように画像ごとに異なる鍵を用いる。この鍵を用いて他の画像の透かしを除去することはできない。鍵の紛失や第三者による結託攻撃による鍵の取得が起きても、その被害は該当する1枚の画像のみで、他の画像に対しては透かし除去はできない。このとき、透かし読み出しのソフトウェアは、鍵が異なっても共通に使える。また。鍵の発行はほぼ無限に行えるため,同じ鍵となる確率は極めて低い。 A key corresponds to each embedded image on a one-to-one basis. For this reason, the copyright holder uses a different key for each image to prevent abuse. This key cannot be used to remove watermarks on other images. Even if the key is lost or the key is obtained through a collusion attack by a third party, the damage will be limited to one image, and the watermark cannot be removed from the other images. At this time, the watermark reading software can be used in common even if the keys are different. Also. Since keys can be issued almost infinitely, the probability of having the same key is extremely low.
以下、実施例に沿って詳しく説明する。
ここで,まず本発明に用いられるグリーンノイズ特性を示すドットパターンの生成について図3に沿って説明する.
今,マトリックスサイズをR画素×R画素 ( R=2^m ここで^はべき乗)として,その中に1画素サイズの黒ドットを埋め込むものとする。黒ドットの面積率をg(0≦g≦1:g =1が全黒,g =0 が全白)とする。点(x,y)におけるドットパターンを p(x,y)として、g=1/2のグリーンノイズ特性を示すドットパターンを以下の様にして求める。
(工程1) まず,疑似乱数発生器により、ランダムドットp(x,y)を生成する(20)。
(工程2) p(x,y)を二次元フーリエ変換を行いスペクトルP(u,v)を得る(21)。ここで、(x,y)は空間座標、(u,v)は空間周波数座標を表す。g=0.5 の場合、(R^2)/2個のランダムドット(初期状態はホワイトノイズ)を発生させ、p(x,y)とする.この時,疑似乱数発生器のSEED値を変えることにより初期状態を変更可能である。
(工程3) P(u,v)にフィルタD(u,v)を掛けて新たなP'(u,v)を得る(22)。すなわち、
P’(u,v)=P(u,v)*D(u,v)
(工程4) P'(u,v)に逆フーリエ変換を行い,多値の点プロファイルp'(x,y)を得る(23)。
(工程5)誤差関数e(x,y)=p'(x,y)-p(x,y)を求め(24),各画素位置での誤差の大きい順に白,黒反転する(25)。
(工程6)工程2から工程5までの操作を誤差が許容量以内になるまで繰り返し,最終的にg=1/2のドットパターンを得る。
A detailed description will be given below along with examples.
Here, the generation of the dot pattern showing the green noise characteristics used in the present invention will be explained with reference to FIG.
Assume that the matrix size is R pixels × R pixels (R=2^m where ^ is a power), and 1-pixel size black dots are embedded in it. Let the area ratio of black dots be g (0 ≤ g ≤ 1: g = 1 is all black, g = 0 is all white). Assuming that the dot pattern at the point (x, y) is p(x, y), the dot pattern showing the green noise characteristics of g=1/2 is obtained as follows.
(Step 1) First, a pseudo-random number generator generates random dots p(x,y) (20).
(Step 2) A two-dimensional Fourier transform is performed on p(x,y) to obtain a spectrum P(u,v) (21). Here, (x, y) represent spatial coordinates, and (u, v) represent spatial frequency coordinates. For g=0.5, generate (R^2)/2 random dots (initial state is white noise) and let p(x,y). At this time, the initial state can be changed by changing the SEED value of the pseudo-random number generator.
(Step 3) Multiply P(u,v) by filter D(u,v) to obtain new P'(u,v) (22). i.e.
P'(u,v)=P(u,v)*D(u,v)
(Step 4) Perform an inverse Fourier transform on P'(u, v) to obtain a multivalued point profile p'(x, y) (23).
(Step 5) Calculate the error function e(x, y)=p'(x, y)-p(x, y) (24), and perform white and black inversion in descending order of error at each pixel position (25) .
(Step 6) The operations from
ここで、フィルタD(u,v)のパターンの設定について説明する。今、D(u,v)が円形のリングパターンで、その最大ラジアル周波数をfmax、最小ラジアル周波数をfminであるとする。g=1/2での平均的ドット間隔による周波数f0は,
f0=√g・fn=√(1/2)・fn
で与えられ,fmax及びfminはf0を基準として,
a≡(fmax - f0)/fn
b≡(fmin - f0)/fn
として、パラメータ(a,b)を定義する。ここで,fnはナイキスト周波数を示す。かかる(a,b)を変化させて、視覚特性に合わせてクラスターサイズの異なるドットパターンを得ることができる。
Here, the setting of the pattern of the filter D(u,v) will be explained. Now let D(u,v) be a circular ring pattern with its maximum radial frequency fmax and minimum radial frequency fmin. The frequency f0 due to the average dot spacing at g=1/2 is
f0=√g・fn=√(1/2)・fn
and fmax and fmin are based on f0,
a ≡ (fmax - f0)/fn
b ≡ (fmin - f0)/fn
Define the parameters (a,b) as Here, fn indicates the Nyquist frequency. By changing (a, b), it is possible to obtain dot patterns with different cluster sizes according to visual characteristics.
透かし埋め込みのためには埋め込み2ビット(00,01,10,11)に対応した4種類のパターンが必要である。そのためフィルタD(u,v)のパターンが楕円リングパターンで、45°づつ回転した4つのパターンとなるようにする。図4はフィルタパターンを模式的に示すもので、楕円リングの短軸の最小値をfmin、最大値をfmaxとし、長軸の最小値をβ・fmin、最大値をβ・fmaxとする。ここで、βは倍率を表す。正立したものを2ビットの(00)に対応するフィルタパターン、それを45°回転したものを(01)、90°回転したものをビット(10)、135°回転したものを(11)にそれぞれ対応するものとする。 For watermark embedding, four types of patterns corresponding to embedding 2 bits (00, 01, 10, 11) are required. Therefore, the pattern of the filter D(u,v) is an elliptical ring pattern, and four patterns are rotated by 45 degrees. FIG. 4 schematically shows a filter pattern, where the minimum value of the minor axis of the elliptical ring is fmin, the maximum value is fmax, and the minimum value of the major axis is β·fmin, and the maximum value is β·fmax. Here, β represents magnification. Filter pattern corresponding to 2-bit (00) upright, (01) rotated by 45°, bit (10) rotated by 90°, and (11) rotated by 135° shall correspond to each other.
図5に、かかる4つのフィルタ(フィルタ0、フィルタ1、フィルタ2、フィルタ3)の形状を示す。図で黒領域は0、白領域は1を表す。図6に、このフィルタD(u,v)を用いて、前述の工程を経て作成されたパターンおよびスペクトルを示す。各パターンはR×Rのサイズで、パターン0は2ビットの埋め込み情報(00)に対応し、パターン1は(01)、パターン2は(10)、パターン3は(11)にそれぞれ対応する。
FIG. 5 shows the shapes of such four filters (
続いて、画像データへの透かし埋め込み手法について説明する。透かし情報の埋め込みは、赤(R),緑(G)、青(B)からなるカラー画像データの青(B)データに埋め込むか、あるいは、輝度、色差信号となる(Y,Cb,Cr)信号に変換し,輝度(Y)データに埋め込むことが考えられる。電子データでのみ透かし情報を取り扱う場合は、青(B)に埋め込むのがもっとも視覚的には認識されにくく理想的である。印刷画像やモニター画像をカメラやスキャナーで読み取るような応用を考えた場合は、青(B)データ(印刷時はイエロー)は精度よく色分離することが難しいため、輝度(Y)データを用いるのが良い。 Next, a method of embedding a watermark in image data will be described. Watermark information is embedded in blue (B) data of color image data consisting of red (R), green (G), and blue (B), or it becomes luminance and color difference signals (Y, Cb, Cr). It is conceivable to convert it into a signal and embed it in luminance (Y) data. When watermark information is handled only in electronic data, embedding it in blue (B) is ideal because it is the least visually recognizable. When considering applications such as reading printed images or monitor images with a camera or scanner, it is difficult to accurately separate blue (B) data (yellow when printing), so luminance (Y) data should be used. is good.
続いて、図7のフローに沿って処理手順を説明する。まず、埋め込み情報をビット列に変換する(20)。例えば、埋め込みたい情報が“0123456789abcdef”となるASCII16文字をビット列に展開すると、wm=“0011000000110001…”となる128ビット列となる。先頭ビットからi番目のビットをwm(i)とする。
Next, a processing procedure will be described along the flow of FIG. First, the embedded information is converted into a bit string (20). For example, if the information to be embedded is "0123456789abcdef" and the
次に、画像データをR画素×R画素のブロックに分割する(21)。これはドットパターンのサイズと同じサイズにする必要がある。ブロックサイズとしては、64画素×64画素を用いると高精度に抽出できるが、多くの情報を埋め込みたい場合は32画素×32画素をブロックサイズとすると、4倍の情報の埋め込みが可能となる。 Next, the image data is divided into blocks of R pixels×R pixels (21). It should be the same size as the dot pattern size. A block size of 64 pixels x 64 pixels enables highly accurate extraction, but if a large amount of information is to be embedded, a block size of 32 pixels x 32 pixels enables embedding of four times as much information.
埋め込み作業はブロック単位で行われる。n番目のブロックに埋め込む(23)として、まず、n=1からスタートする(22)。埋め込み透かし情報を先頭から連続した2ビットを取り出し、これをb=(wm(i) , wm(i+1))とする。 The embedding work is done in block units. As embedding in the n-th block (23), first, start from n=1 (22). Consecutive 2 bits are extracted from the head of the embedded watermark information, and this is defined as b=(wm(i), wm(i+1)).
bの値により埋め込むパターンを選択する(24)。b=(00)の場合はパターン0を用いて埋め込む(25a)。同様に、b=(01)の場合はパターン1を用いて埋め込む(25b)。b=(10)の場合はパターン2を用いて埋め込む(25c)。b=(11)の場合はパターン3を用いて埋め込む(25d)。
The pattern to be embedded is selected (24) according to the value of b. If b=(00), embed using pattern 0 (25a). Similarly, when b=(01),
かかる透かし情報の埋め込みは実空間(画素空間)で行う。今、画像データをimg(x,y),埋め込み強度をgain、透かしの埋め込まれた画像データをw(x,y)とすると、
w(x,y)=img(x,y)+gain・pi(x,y) (i=0,1,2,3)-------------(1)
ただし、
b=(00) の時 pi=p0 :パターン0
b=(01) の時 pi=p1 :パターン1
b=(10) の時 pi=p2 :パターン2
b=(11) の時 pi=p3 :パターン3
となる。piは(1,0)の二値であるが,平均輝度を保存するため(1/2,-1/2)とする。埋め込んだ結果、画素データがダイナミックレンジを超えてオーバーフローやアンダーフローが生じることがあるため、あらかじめ画像データに以下の線形変換を施した画像img’(x,y)にて行うこともある。
img’(x,y)=(1-gain)・img(x,y)+gain/2--------------------(2)
この処理は後述の透かし情報を完全に除去する場合には必須であるが、除去を必要としない場合や、オーバーフローやアンダーフローの頻度が低い場合は省略しても構わない。
全ブロックが終了かを判断し(26)、終了でない場合は次のブロックへ移る(27)。
Such embedding of watermark information is performed in a real space (pixel space). Let img(x,y) be the image data, gain be the embedding strength, and w(x,y) be the watermark embedded image data.
w(x,y)=img(x,y)+gain・pi(x,y) (i=0,1,2,3)-------------(1)
however,
When b=(00) pi=p0 :
When b=(01) pi=p1 :
When b=(10) pi=p2 :
When b=(11) pi=p3 : Pattern 3
becomes. Although pi is a binary value of (1,0), it is set to (1/2,-1/2) to preserve the average luminance. As a result of embedding, the pixel data may exceed the dynamic range, causing overflow or underflow.
img'(x,y)=(1-gain)・img(x,y)+gain/2--------------------(2)
This process is essential for completely removing watermark information, which will be described later, but may be omitted if the removal is unnecessary or if the frequency of overflow or underflow is low.
It is determined whether or not all blocks are completed (26), and if not completed, the process moves to the next block (27).
以上のようにして、埋め込みビット列wm(i)をすべて埋め込む。埋め込みブロック数が埋め込みビット数より多い場合は、繰り返し埋め込むことで信頼度を高めることができる。この場合は文字列の先頭を示す区切りマーカが必要である。
piはランダムドットであるため,ブロック境界は目立たない。グリーンノイズ特性を示すドットパターンは、印刷におけるFMスクリーンとしても用いられ、分散性ドットで均一性にすぐれているため視覚的にも一様で粒状性も感じさせない。
All embedding bit strings wm(i) are embedded as described above. If the number of embedding blocks is larger than the number of embedding bits, the reliability can be increased by repeatedly embedding. In this case, a delimiter marker indicating the beginning of the string is required.
Since pi is a random dot, block boundaries are inconspicuous. The dot pattern, which exhibits green noise characteristics, is also used as an FM screen in printing. Dispersive dots are excellent in uniformity, so they are visually uniform and do not give the impression of graininess.
続いて、透かし情報の抽出について図8の処理フローに沿って説明する。抽出作業は、埋め込み時と同様R×Rのブロックに分割し(30)、ブロック単位で行われる。n番目のブロックから抽出するものとして、n=1からスタートする(31)。n番目のブロックからR×Rの画像を取り出しFFT(高速フーリエ変換)を行い、スペクトル情報Wnに変換する(32)。続いて、ヒストグラムイコライゼーションによる規格化を行う(33)。これは、ブロック毎に輝度が異なるため、コントラストを向上させて識別精度を向上させることと、後述の信頼度を各ブロックで平等に評価するためである。続いて後述のパターンの識別を行い(40)、識別パターンから埋め込み情報の2ビットデータを抽出する(34)。ブロックがすべて終わったか否かを判断し(35)、終了していない場合はnをn+1として(36)、次のブロックへ移る。終了した場合は全ビットを取り出して、元の文字情報を復元する(37)。 Next, extraction of watermark information will be described along the processing flow of FIG. The extraction work is performed in units of blocks by dividing into R×R blocks (30) as in the case of embedding. Starting from n=1 (31), we extract from the nth block. An R×R image is extracted from the n-th block, FFT (Fast Fourier Transform) is performed, and the image is converted into spectral information Wn (32). Subsequently, normalization by histogram equalization is performed (33). This is because the luminance differs for each block, so that the contrast is improved to improve the identification accuracy, and the degree of reliability, which will be described later, is equally evaluated for each block. Subsequently, the pattern is identified as described later (40), and 2-bit data of embedded information is extracted from the identification pattern (34). It is judged whether or not all the blocks have ended (35), and if not, n is set to n+1 (36), and the next block is started. When finished, all bits are taken out to restore the original character information (37).
図9はパターン識別処理(40)の処理フローを示す。ブロック内のスペクトル情報Wnは、用意されたマスクパターンとのマッチングを行い、その出力Qiを求める(41)。マスクパターンは図10に示すようにフィルタパターンと同じで、45°づつ回転したマスク0(M0)、マスク1(M1)、マスク2(M2)、マスク3(M3)の4つが用意されている。
図9に戻って、i番目のマスクをMiとして、Wnとのマッチングの出力Qiは、
Qi=(1/Zi)ΣMi・Wn (i=0,1,2,3)------------(3)
ただし Zi=ΣMi
として求められる(42)。ただし、Σはブロック内の各画素(今の場合は空間周波数に対応)について行われる。その結果、各マスクに対応した出力(Q0,Q1,Q2,Q3)が得られる。この4つの出力のうち最も大きいものをQmaxとして、
Qmax=Q0 の時、b=00
Qmax=Q1 の時、b=01
Qmax=Q2 の時、b=10
Qmax=Q3 の時、b=11
となる2ビットの透かし情報bを得る(43および44a、44b、 44c、 44d)。
FIG. 9 shows the processing flow of pattern identification processing (40). Spectral information Wn in the block is matched with a prepared mask pattern to obtain its output Qi (41). The mask pattern is the same as the filter pattern, as shown in Fig. 10. There are four masks, mask 0 (M0), mask 1 (M1), mask 2 (M2), and mask 3 (M3) rotated by 45 degrees. .
Returning to FIG. 9, with Mi as the i-th mask, the output Qi of matching with Wn is
Qi=(1/Zi)ΣMi・Wn (i=0,1,2,3)-----------(3)
However, Zi = ΣMi
(42). However, Σ is performed for each pixel in the block (corresponding to spatial frequency in this case). As a result, outputs (Q0, Q1, Q2, Q3) corresponding to each mask are obtained. Letting the largest of these four outputs be Qmax,
When Qmax = Q0, b = 00
When Qmax = Q1, b = 01
When Qmax = Q2, b = 10
When Qmax = Q3, b = 11
2-bit watermark information b is obtained (43 and 44a, 44b, 44c, 44d).
次に、Qmaxの次に大きな出力をQnextとすると、信頼度relは
rel=Qmax-Qnext--------------------------(4)
で表される。すなわちQnextがQmaxに非常に近い値の場合は誤判定の確率が高く、QmaxとQnextとの差が大きい程信頼性は高い。この差を信頼度の指標とすることができる。
以上のようにして、2ビットの埋め込み情報bと信頼度relが求まる。
Next, if the next largest output after Qmax is Qnext, the reliability rel is
rel=Qmax-Qnext--------------------------(4)
is represented by That is, when Qnext is a value very close to Qmax, the probability of misjudgment is high, and the greater the difference between Qmax and Qnext, the higher the reliability. This difference can be used as an indicator of reliability.
As described above, the 2-bit embedded information b and the reliability rel are obtained.
図11は実際に画像に埋め込んだ時の画像とそのスペクトルを示す。(a)は埋め込み画像で、512×512のLena の標準画像に、64×64のブロックサイズで“0123456789abcdef”の16文字(128ビット)をgain=0.1875で埋め込んだものである。埋め込んだパターンは明視の距離では視認されにくい。(b)は埋め込み画像の一部(Aで示す矩形部分)を拡大したもので、拡大することによりドットパターンが埋め込まれているのが識別できる。(c)は抽出されたスペクトルで、16文字が誤りなく抽出できた。平均信頼度(各ブロックの信頼度の平均)は16.62、最低信頼度(各ブロックの信頼度のうち最も低いもの)は12.19である。これは非常に高い精度で透かし情報を抽出できたことを物語っている。 FIG. 11 shows the image and its spectrum when actually embedded in the image. (a) is an embedded image, in which 16 characters (128 bits) of “0123456789abcdef” are embedded in a 512×512 Lena standard image with a block size of 64×64 with a gain of 0.1875. The embedded pattern is difficult to see at a distance of clear vision. (b) is an enlarged view of part of the embedded image (rectangular portion indicated by A), and the embedded dot pattern can be identified by enlarging it. (c) is the extracted spectrum, and 16 characters were extracted without error. The average reliability (the average of the reliability of each block) is 16.62, and the minimum reliability (the lowest reliability of each block) is 12.19. This indicates that the watermark information could be extracted with very high precision.
図12は256×256の一様な画像に意図的に強いgainで埋め込み、ブロック歪を評価したものである。原画はデータが,200/255 の一様な灰色画像で、(a)は、R=64, (a,b)=(-1/16,-5/16)、β=1.3、gain=0.625で、”0123”の4文字を埋め込んだものである。(b)はβ=1.5、(c)はβ=1.7の埋め込みパターンとスペクトルを示す。埋め込み画像から、どの画像もブロック歪はあまり識別されないことが分かるが、β(楕円率)を大きくするに従い、パターンの異方性が大きくなりわずかに目立つようになる。一方、信頼度の数字を見ると、楕円率βが小さいと(ブロック歪は小さくなるが)信頼度が低下する。β=1.5がブロック歪および信頼度から最適であるといえる。
通常の埋め込みは、gainは0.1から0.3程度であるので、ブロック歪はほとんど目立たないといえる。
FIG. 12 is a result of evaluating block distortion by intentionally embedding a 256×256 uniform image with a strong gain. The original image is a uniform gray image with data of 200/255. , and the four characters "0123" are embedded. (b) shows the embedding pattern and spectrum for β=1.5 and (c) β=1.7. From the embedded images, it can be seen that block distortion is not very discernible in any image, but as β (ellipticity) increases, the anisotropy of the pattern increases and becomes slightly noticeable. On the other hand, if the ellipticity β is small, the reliability decreases (although the block distortion decreases). It can be said that β=1.5 is optimal from the viewpoint of block distortion and reliability.
In normal embedding, the gain is about 0.1 to 0.3, so it can be said that block distortion is hardly conspicuous.
埋め込み画質に対する評価はPSNR(ピーク信号雑音比)により評価することができる.埋め込み画像のダイナミックレンジをDRとするとPSNRは,画像サイズをW×Hとすると,
PSNR=10 Log (DR^2/MSE)
MSE=1/(WH) Σ(img(x,y)-w(x,y))^2
従って、
PSNR=-20 Log (gain/2)------------------------(5)
となり,gainのみの関数となる。ここで、^はべき乗を表し、Logは常用対数を表す。図13はgainに対するPSNR値を示す。
The embedded image quality can be evaluated by PSNR (Peak Signal to Noise Ratio). If the dynamic range of the embedded image is DR, then PSNR is, if the image size is W×H,
PSNR=10 Log (DR^2/MSE)
MSE=1/(WH) Σ(img(x,y)-w(x,y))^2
Therefore,
PSNR=-20 Log (gain/2)------------------------(5)
, which is a gain-only function. where ^ represents exponentiation and Log represents common logarithm. FIG. 13 shows PSNR values for gain.
一方,埋め込み画像を明視の距離で見た場合,視覚系のVTF(Visual Transfer Function)により高空間周波数域が低下する.明視の距離で画像を見た場合、VTFによる影響でPSNRは5~7dB向上することが分かった。したがって、gain=0.1875以下で埋め込みを行えば、視覚的に30dB以上となり、画質劣化は感じられない。 On the other hand, when the embedded image is viewed at a distance of clear vision, the high spatial frequency region is lowered by the VTF (Visual Transfer Function) of the visual system. It was found that when viewing the image at a distance of clear vision, the PSNR was improved by 5-7 dB due to the effects of VTF. Therefore, if the embedding is performed with a gain of 0.1875 or less, it becomes visually 30 dB or more, and the image quality deterioration is not felt.
透かしの埋め込みは、全画素に対して±gain/2 のデータを加算するため、画像の位置によるPSNRの空間的変動はなく、局部的に大きな画質劣化が生じることはない。通常の電子透かし法では、画像の一部(例えばエッジ領域など)に埋め込み、埋め込まない領域が存在するためPSNR値は高い数値となる。しかしながら、局部的に大きな画質劣化が生じ、このため埋め込み画質は一様性を欠き、粒状性として発現する。一方、本手法では画像全体に一様に埋め込むため、粒状性も感じることがない。また、gainにより画質が予測され、運用がやりやすいといえる。 Since watermark embedding adds data of ±gain/2 to all pixels, there is no spatial variation in PSNR depending on the position of the image, and large local degradation of image quality does not occur. In a normal digital watermarking method, some parts of the image (for example, edge areas) are embedded and some areas are not embedded, resulting in a high PSNR value. However, large image quality deterioration occurs locally, and as a result, the embedded image quality lacks uniformity and appears as graininess. On the other hand, in this method, since the entire image is uniformly embedded, graininess is not perceived. Also, the image quality is predicted by the gain, and it can be said that it is easy to operate.
埋め込み情報量Vは、画像サイズをW×Hとすると、
V=2×int(W/R)×int(H/R) ビット
であたえられる。ここでint()は少数以下切り捨てを示す。例えば、540×530の画像でR=64のブロックで埋め込むとすると、V=128 ビットとなり、ASCCI 文字コードで16文字が埋め込み可能である。32×32のブロックで埋め込むとすると、64文字が埋め込み可能である。著作権保護の用途で使用する場合、少なくとも16文字以上が必要となるため、64×64のブロックサイズで埋め込む場合は512×512の画像サイズ以上、32×32のブロックの場合は256×256の画像サイズ以上が必要となる。
Assuming that the image size is W×H, the amount of embedded information V is
V = 2 x int(W/R) x int(H/R) bits. Here, int() indicates truncation below the decimal point. For example, if a 540×530 image is embedded in R=64 blocks, V=128 bits and 16 characters can be embedded in ASCII character code. 64 characters can be embedded if it is embedded in a 32×32 block. When used for copyright protection purposes, at least 16 characters or more are required. Therefore, when embedding in a block size of 64 x 64, the image size is 512 x 512 or more, and when embedding in a block of 32 x 32, it is 256 x 256. Image size or larger is required.
図14は、通常のネット利用の場合を想定したもので、(a)は512×512の画像に32×32のブロックサイズで、gain=0.1875で埋め込んだ時の画像である。最大64文字(512ビット)まで埋め込むことができ、著作者の名前、URL,日付などの情報を繰り返し埋め込むことやエラー訂正符号を埋め込むことが可能となる。”0123456789abcdef”の16文字をうめこんだもので、4回繰り返して埋め込まれている。(b)はそのスペクトルを示す。埋め込み情報は繰り返しによる埋め込みでの信頼度の高いものを選択し、高い信頼度で正答が抽出されている。 FIG. 14 assumes normal use of the Internet, and (a) is an image when a 32×32 block size is embedded in a 512×512 image with a gain of 0.1875. Up to 64 characters (512 bits) can be embedded, and information such as the author's name, URL, and date can be repeatedly embedded, and error correction codes can be embedded. It is embedded with 16 characters of "0123456789abcdef", which is repeated four times. (b) shows its spectrum. As the embedded information, information with high reliability in repeated embedding is selected, and correct answers are extracted with high reliability.
次に透かしの除去について説明する。
透かしの除去は、埋め込みと全く逆に行うことで可能となる。すなわち、式(1)より,
img(x,y)=w(x,y)-gain・pi(x,y) (i=0,1,2,3) ----------------------(6)
となり、透かし埋め込み画像から埋め込みパターンにgainを乗じて引くことで、完全に原画に戻すことが可能である。ただし、埋め込み時にオーバーフローやアンダーフローを避けるために線形ダイナミックレンジ補正を行った場合は、逆補正をする必要がある。
以上のようにして透かし除去が可能であるが、埋め込みパターン(パターン0、パターン1、パターン2、パターン3)およびgainと埋め込み情報が必要となる。これらの情報は“秘密鍵”として授受される。
Next, watermark removal will be described.
Removal of the watermark is possible by doing exactly the opposite of embedding. That is, from equation (1),
img(x,y)=w(x,y)-gain・pi(x,y) (i=0,1,2,3) ------------------ -----(6)
By subtracting the embedding pattern from the watermark-embedded image by multiplying the gain, it is possible to completely restore the original image. However, if linear dynamic range correction is performed to avoid overflow or underflow during embedding, inverse correction must be performed.
Watermark removal is possible as described above, but embedding patterns (
かかる秘密鍵の容量は、例えばブロックサイズが64×64の場合、パターン0~パターン3までの4パターン分で16Kビット(2Kバイト)、それにgainと埋め込み情報の容量が加わる。32×32の場合はパターン0~パターン3までの4パターン分で4Kビット(512バイト)となる。gainと埋め込み情報は、通常、100バイト以下であるので、鍵容量の大半は埋め込みパターン情報が占める。
For example, when the block size is 64×64, the capacity of the private key is 16 Kbits (2 Kbytes) for four patterns from
かかる鍵の容量はなるべく小さくした方が取り扱いが容易である。鍵容量を減らすため、パターン2、パターン3は、それぞれ、パターン0、パターン1から生成する。すなわち、パターン2はパターン0を90°回転したもの、パターン3はパターン1を90°回転したものを採用する。ドットパターンの回転はそのままスペクトルの回転となるため、各種処理は全く同じでよい。
It is easier to handle if the capacity of such a key is made as small as possible. To reduce the key capacity,
鍵の紛失や盗難に対しては、画像ごとに異なるドットパターンを用いることにより、同じ鍵で別の画像の透かしを除去することはできなくすることができる。これらは、グリーンノイズパターン生成時の、初期乱数のseed値を変えることによって得られる。スペクトル分布は同一であり,抽出ソフトウェアは共通であるが,ドットプロファイルは異なる。R=64の場合,1つのドットパターンにつき異なるパターン数は,4096 C 2048 個あり、複数のドットパターンを用いる場合は、その積となるため,同じパターンとなる確率は極めて低いため,安全性は高い。 ここで、Cはcombinationを表す。
著作権者は購入者に対してそれぞれ異なる乱数から求めたドットパターンを秘密鍵として提供する。購入者ごとにこの鍵は異なるため、他の購入者の画像から透かしを除去することはできない。
For loss or theft of a key, using a different dot pattern for each image makes it impossible to remove the watermark of another image with the same key. These are obtained by changing the seed value of the initial random number when generating the green noise pattern. The spectral distribution is the same, the extraction software is common, but the dot profile is different. In the case of R = 64, there are 4096 C 2048 different patterns per dot pattern, and when using multiple dot patterns, the product is the product, so the probability of having the same pattern is extremely low. high. Here, C represents a combination.
The copyright holder provides each purchaser with a dot pattern obtained from different random numbers as a secret key. Since this key is different for each purchaser, it is not possible to remove the watermark from another purchaser's image.
次に本手法の耐性について説明する。電子透かしに対する攻撃としては,例えば信号の強調(シャープネス調整),ノイズの付加,フィルタリング(線形,非線形),非可逆圧縮(JPEG,MPEG),変形(回転,拡大縮小)などがある.
図15にJPEG圧縮に対する耐性を示す。(a)は256×256の画像にブロックサイズ64×64でgain=0.1875で“0123”の4文字を埋め込んだもので圧縮前のものである。平均信頼度=16.51, 最小信頼度=15.00で問題なく4文字が正答されている。(b)はJPEG圧縮のQ値(Qulity Factor)が50の時の埋め込み画像とスペクトルを示したもので、平均信頼度=12.94, 最小信頼度=12.02 となり、正答を得ている。(c)はQ=20で、平均信頼度=6.62, 最小信頼度=2.45 となり、相当低下しているが正答を得た。このようにJPEG圧縮には高い耐性を示すことが分かる。
Next, the robustness of this method will be explained. Attacks on digital watermarking include signal enhancement (sharpness adjustment), noise addition, filtering (linear, nonlinear), lossy compression (JPEG, MPEG), and transformation (rotation, scaling).
Figure 15 shows the resistance to JPEG compression. (a) is a 256×256 image with a block size of 64×64, a gain of 0.1875, and four characters of “0123” embedded before compression. Average confidence = 16.51, minimum confidence = 15.00, and 4 characters were answered correctly. (b) shows the embedded image and spectrum when the Q factor (Qulity Factor) of JPEG compression is 50. Average reliability = 12.94, minimum reliability = 12.02, and a correct answer is obtained. In (c), Q=20, average reliability = 6.62, minimum reliability = 2.45. Thus, it can be seen that high resistance to JPEG compression is exhibited.
本手法は、分散ドットの集合によるスペクトル分布から識別をするため、一般に輝度変化に対して強靭であるといえる。このため、埋め込み画像をカメラやスキャナーで読み取って透かしを抽出などの応用では、外光の影響を受けにくい。通常、画像処理は輝度に対する処理が多く、このため本手法での透かし埋め込み画像透かし情報が除去されにくく、耐性が高いといえる。gainを大きくすることにより,さらに耐性を高めることができる。 Since this method discriminates from the spectral distribution of a set of dispersed dots, it can be said that it is generally robust against changes in luminance. Therefore, applications such as extracting watermarks by reading embedded images with a camera or scanner are less susceptible to external light. Normally, image processing involves a lot of processing for luminance, and therefore the watermark embedded image watermark information in this method is difficult to remove, and it can be said that this method has high resistance. Tolerance can be further enhanced by increasing gain.
図16は印刷耐性を評価したものである。512×512のLenaの画像にgain=0.25で16文字の透かし情報を埋め込んだものを175ppi(Pixel per inch)で光沢紙にプリント出力を行い、スキャナで300dpi(dot per inch)で読み取り、透かしを抽出した。上段は、ブロックサイズR=64で埋め込んだもので、抽出は平均信頼度10.90、最小信頼度3.79で正答をえた。一方、下段のR=32のものは平均信頼度12.00、最小信頼度6.83で正答を得た。いずれも、紙出力によるため信頼度はかなり低下するが、紙媒体でも透かしが維持できることが確認できた。R=32で信頼度が良くなっているのは、繰り返し埋め込みによる効果である。 FIG. 16 evaluates printing durability. A 512×512 Lena image with 16-character watermark information embedded with gain=0.25 is printed out on glossy paper at 175 ppi (pixel per inch), read at 300 dpi (dot per inch) with a scanner, and the watermark is removed. Extracted. The upper row is embedded with a block size of R=64, and the extraction gave a correct answer with an average confidence of 10.90 and a minimum confidence of 3.79. On the other hand, those with R = 32 in the lower row obtained correct answers with an average confidence of 12.00 and a minimum confidence of 6.83. In both cases, the reliability is considerably lowered because of the paper output, but it was confirmed that the watermark can be maintained even on the paper medium. The improvement in reliability at R=32 is the effect of repeated embedding.
以上、本発明の電子透かし法について説明したが、本手法は視認されにくいグリーンノイズ特性を示すドットパターンを埋め込むため,視覚的な画質劣化が少なく,強く埋め込むことが可能であり、画像の編集や加工などの攻撃に対して強い耐性がある。埋め込み容量も2パターンの場合と比べ2倍となり、また,鍵情報により原画像に復元することも可能であるなどの特徴があるため、単に著作権保護のみならず、印刷画像と電子データとのリンクによるさまざまなアプリケーションに有効である。 The digital watermarking method of the present invention has been described above, but since this method embeds a dot pattern that exhibits green noise characteristics that are difficult to see, it is possible to embed strongly with less visual deterioration in image quality. Strong resistance to attacks such as processing. The embedding capacity is doubled compared to the two-pattern case, and the key information can be used to restore the original image. Useful for various applications with links.
また、本透かしの埋め込みは,ブロック単位で実空間にて埋め込むため、大きなサイズの画像など画像サイズに制限がなく、ディザ法並みに高速に処理可能である。このため動画像のリアルタイム埋め込みも可能で、監視カメラやドライブレコーダなどへの展開も期待できる。 In addition, since the watermark is embedded in the real space in units of blocks, there is no restriction on the size of the image such as a large image, and processing can be performed at a high speed equivalent to that of the dither method. Therefore, it is possible to embed moving images in real time, and it is expected to be applied to surveillance cameras and drive recorders.
本透かし埋め込み及び抽出手法は、アルゴリズムを公開しても問題ない。機密性はすべてドットパターンに集約され、これは秘密鍵として納められる。仮に、鍵の紛失や盗難にあっても、画像ごとに異なるドットパターンを用いれば、鍵は原則、1枚の画像に対して1つであるため、他の画像にその鍵を使って透かしを除去することはできない。
このため、安全性は極めて高く、アルゴリズムの公開、標準化、抽出ソフトウェアの公開などは問題とならない。
The present watermark embedding and extraction method is algorithm-friendly. All confidentiality is encapsulated in the dot pattern, which is stored as the private key. Even if the key is lost or stolen, if a different dot pattern is used for each image, since there is, in principle, one key for one image, another image can be watermarked using that key. cannot be removed.
For this reason, security is extremely high, and there are no problems with disclosure of algorithms, standardization, and disclosure of extraction software.
1はスキャナー、2はプリンタ、3はコンピュータシステム、4はROM, 5はRAM,6はプログラムメモリ、7はデータメモリ、8はモニター、9はキーボード、10は通信機能、11はCPU、12はインターネット、 13は画像データの配信、14は購入希望の連絡、15は秘密鍵の送付、16は著作権者のコンピュータ、17は購入者のコンピュータを表す。 1 is scanner, 2 is printer, 3 is computer system, 4 is ROM, 5 is RAM, 6 is program memory, 7 is data memory, 8 is monitor, 9 is keyboard, 10 is communication function, 11 is CPU, 12 is Internet, 13 image data distribution, 14 purchase request notification, 15 secret key delivery, 16 copyright holder's computer, and 17 purchaser's computer.
Claims (3)
埋め込まれる透かし情報をビット列に展開した透かしデータと、
同じ楕円リング形状で、その主軸方向が0°、45°、90°、135°の方向に向いたグリーンノイズスペクトル特性を示す4つのドットパターン(パターン0、パターン1、パターン2、パターン3)を用意し、
埋め込みは、画像データをR画素×R画素単位のブロックに分割し、ブロック毎に透かしデータから2ビットの情報を取り出し、2ビットの情報(00,01,10,11)に対応したドットパターンにgainを乗じたパターンで画像データに埋め込み、
透かし情報の抽出は、透かしの埋め込まれた画像データをブロックに分割し、ブロック毎にスペクトルパターンを求め、識別器によりその形状から,4つのドットパターンの中から最も近いものを識別し、埋め込まれた2ビットの情報を抽出するものであり、
前記4つのドットパターン(パターン0、パターン1、パターン2、パターン3)は、主軸方向が0°、45°、90°、135°の方向となる4つの楕円リング形状のフィルタD(u,v)を用いて、
(工程1)疑似乱数発生器により、ランダムドットp(x,y)を生成する。
(工程2)p(x,y)に二次元フーリエ変換を行い,スペクトルP(u,v)を得る。(ここで、(x,y)は空間座標、(u,v)は空間周波数座標を表す。)
(工程3) P(u,v)にフィルタD(u,v)を掛けて、新たなP'(u,v)を得る。
(工程4) P'(u,v)に逆フーリエ変換を行い,多値の点プロファイルp'(x,y)を得る。
(工程5)誤差関数e(x,y)=p'(x,y)-p(x,y)を求め,各画素位置での誤差の大きい順に白、黒反転する。
(工程6)工程2から工程5までの操作を誤差が許容量以内になるまで繰り返し、ドットパターンを得る。
なる工程で生成され、
そのスペクトル特性は、それぞれ主軸方向が0°、45°、90°、135°の方向に向いた楕円リング形状のグリーンノイズ特性を示すことを特徴とする電子透かし方法。 In the digital watermarking method for embedding watermark information in digital image data,
watermark data obtained by expanding the watermark information to be embedded into a bit string;
Four dot patterns (pattern 0, pattern 1, pattern 2, pattern 3) exhibiting green noise spectral characteristics with the same elliptical ring shape and with their principal axes oriented in the directions of 0°, 45°, 90°, and 135°. prepare,
For embedding, the image data is divided into R pixel × R pixel blocks, 2-bit information is extracted from the watermark data for each block, and a dot pattern corresponding to the 2-bit information (00, 01, 10, 11) is created. Embed in the image data with the pattern multiplied by gain,
The watermark information is extracted by dividing the watermarked image data into blocks, obtaining a spectrum pattern for each block, and using a discriminator to discriminate the closest dot pattern from among the four dot patterns. It extracts 2 bits of information ,
The four dot patterns (pattern 0, pattern 1, pattern 2, pattern 3) are four elliptical ring-shaped filters D (u, v )Using,
(Step 1) Random dots p(x, y) are generated by a pseudo-random number generator.
(Step 2) A two-dimensional Fourier transform is performed on p(x,y) to obtain a spectrum P(u,v). (where (x,y) are spatial coordinates and (u,v) are spatial frequency coordinates.)
(Step 3) Multiply P(u,v) by filter D(u,v) to obtain new P'(u,v).
(Step 4) Perform an inverse Fourier transform on P'(u, v) to obtain a multivalued point profile p'(x, y).
(Step 5) Obtain an error function e(x, y)=p'(x, y)-p(x, y), and perform white and black inversion in descending order of error at each pixel position.
(Step 6) Steps 2 to 5 are repeated until the error is within the allowable amount to obtain a dot pattern.
generated in a process that
A digital watermarking method , wherein the spectral characteristics thereof exhibit elliptical ring-shaped green noise characteristics with principal axis directions oriented in directions of 0°, 45°, 90°, and 135°, respectively .
(工程1)疑似乱数発生器により、ランダムドットp(x,y)を生成する。
(工程2)p(x,y)に二次元フーリエ変換を行い,スペクトルP(u,v)を得る。(ここで、(x,y)は空間座標、(u,v)は空間周波数座標を表す。)
(工程3) P(u,v)にフィルタD(u,v)を掛けて、新たなP'(u,v)を得る。
(工程4) P'(u,v)に逆フーリエ変換を行い、多値の点プロファイルp'(x,y)を得る。
(工程5)誤差関数e(x,y)=p'(x,y)-p(x,y)を求め、各画素位置での誤差の大きい順に白、黒反転する。
(工程6)工程2から工程5までの操作を誤差が許容量以内になるまで繰り返し、ドットパターンを得る。
なる工程で生成され、
残り2つのドットパターン(パターン2、パターン3)は、生成されたパターン0およびパターン1を90°回転することにより生成され、
それぞれのスペクトル特性はグリーンノイズ特性を示すことを特徴とする請求項1に記載の電子透かし方法。 Of the four dot patterns , two dot patterns (pattern 0, pattern 1) are obtained by using two elliptical ring-shaped filters D (u, v) whose main axis directions are 0 ° and 45 °. ,
(Step 1) Random dots p(x, y) are generated by a pseudo-random number generator.
(Step 2) A two-dimensional Fourier transform is performed on p(x,y) to obtain a spectrum P(u,v). (where (x,y) are spatial coordinates and (u,v) are spatial frequency coordinates.)
(Step 3) Multiply P(u,v) by filter D(u,v) to obtain new P'(u,v).
(Step 4) Perform inverse Fourier transform on P'(u, v) to obtain a multivalued point profile p'(x, y).
(Step 5) Obtain an error function e(x, y)=p'(x, y)-p(x, y), and perform white and black inversion in descending order of error at each pixel position.
(Step 6) Steps 2 to 5 are repeated until the error is within the allowable amount to obtain a dot pattern.
generated in a process that
The remaining two dot patterns (pattern 2, pattern 3) are generated by rotating the generated pattern 0 and pattern 1 by 90°,
2. A digital watermarking method according to claim 1, wherein each spectral characteristic exhibits a green noise characteristic.
ブロック毎の画像スペクトルパターンW(u, v)に対して,出力Qi (i=0,1,2,3) を、
Qi=(1/Z) Σ Mi(u, v)・W(u, v)
Z=ΣMi(u,v)
として求め(ここで、Mi(u,v)はマスクiの分布 (i=0,1,2,3) である)、
かかる出力Qi (i=0,1,2,3) のうち、最も大きな値の出力Qmax および次に大きい出力Qnextを求め、Qmaxに対応する埋め込みパターンから埋め込まれた2ビットを抽出し,
Qmax-Qnextから信頼度を得ることを特徴とする請求項1あるいは請求項2に記載の電子透かし方法。 The discriminator uses four elliptical ring-shaped extraction masks (mask 0, mask 1, mask 2, mask 3) whose main axis directions are 0 °, 45 °, 90 °, and 135 °,
Output Qi (i = 0, 1, 2, 3) for the image spectral pattern W(u, v) for each block is
Qi=(1/Z) ΣMi(u,v)・W(u,v)
Z=ΣMi(u,v)
(where Mi(u,v) is the distribution of mask i (i=0,1,2,3)),
Among these outputs Qi (i = 0, 1, 2, 3), the largest value output Qmax and the next largest output Qnext are obtained, and the embedded 2 bits are extracted from the embedding pattern corresponding to Qmax,
3. A digital watermarking method according to claim 1 or claim 2 , wherein the reliability is obtained from Qmax -Qnext .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019000178A JP7162216B2 (en) | 2019-01-04 | 2019-01-04 | Digital watermarking device and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019000178A JP7162216B2 (en) | 2019-01-04 | 2019-01-04 | Digital watermarking device and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020109902A JP2020109902A (en) | 2020-07-16 |
JP7162216B2 true JP7162216B2 (en) | 2022-10-28 |
Family
ID=71570167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019000178A Active JP7162216B2 (en) | 2019-01-04 | 2019-01-04 | Digital watermarking device and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7162216B2 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006050069A (en) | 2004-08-02 | 2006-02-16 | Kyodo Printing Co Ltd | Electronic watermark inserting method, electronic watermark inserting apparatus, and electronic watermark inserting program, and electronic watermark detecting method, electronic watermark detecting apparatus, and electronic watermark detection program |
JP2010011460A (en) | 2008-06-27 | 2010-01-14 | Toshiba Corp | Image generating apparatus and method |
JP2018207247A (en) | 2017-06-01 | 2018-12-27 | 河村 尚登 | Digital watermarking apparatus and method |
-
2019
- 2019-01-04 JP JP2019000178A patent/JP7162216B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006050069A (en) | 2004-08-02 | 2006-02-16 | Kyodo Printing Co Ltd | Electronic watermark inserting method, electronic watermark inserting apparatus, and electronic watermark inserting program, and electronic watermark detecting method, electronic watermark detecting apparatus, and electronic watermark detection program |
JP2010011460A (en) | 2008-06-27 | 2010-01-14 | Toshiba Corp | Image generating apparatus and method |
JP2018207247A (en) | 2017-06-01 | 2018-12-27 | 河村 尚登 | Digital watermarking apparatus and method |
Also Published As
Publication number | Publication date |
---|---|
JP2020109902A (en) | 2020-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Blind dual watermarking for color images’ authentication and copyright protection | |
Paul | Review of robust video watermarking techniques | |
US7280669B2 (en) | Digital image watermarking apparatus and method | |
CN109191361B (en) | Image watermark embedding method, image watermark extracting method and related method | |
US7171021B2 (en) | Data processing apparatus and method, and storage medium therefor | |
Ernawan et al. | An improved watermarking technique for copyright protection based on tchebichef moments | |
Chandramouli et al. | Digital watermarking | |
Hadmi et al. | Perceptual image hashing | |
Hadmi et al. | A robust and secure perceptual hashing system based on a quantization step analysis | |
JP6937012B2 (en) | Digital watermarking device and method | |
JP6937010B2 (en) | Digital watermarking device and method | |
JP6937007B2 (en) | Digital watermarking device and method | |
JP7162216B2 (en) | Digital watermarking device and method | |
JP6920719B2 (en) | Digital watermarking device and method | |
JP7207627B2 (en) | High-tolerance digital watermarking method | |
Datta et al. | Data authentication using digital watermarking | |
JP7142256B2 (en) | Digital watermarking device and method | |
Hsu et al. | A visual cryptography and statistics based method for ownership identification of digital images | |
Cho et al. | Print to Scan Resistant Watermarking based on Green Noise Diffusion Method using Machine Learning | |
JP3787059B2 (en) | Digital watermark composition method, digital watermark composition device, watermark information detection method, watermark information detection device, printed material manufacturing method, printed material, and recording medium | |
CN110648271A (en) | Method for embedding digital watermark in halftone image by using special dots | |
JP7008950B2 (en) | Digital watermarking device and method | |
ZEEBAREE et al. | COPYRIGHT PROTECTION SYSTEM BASED WATERMARKING | |
JP2021034771A (en) | Digital watermark embedding and detection method | |
Genov | Digital watermarking of bitmap images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220818 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220829 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221005 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7162216 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |