JP3986150B2 - 一次元データへの電子透かし - Google Patents
一次元データへの電子透かし Download PDFInfo
- Publication number
- JP3986150B2 JP3986150B2 JP03049298A JP3049298A JP3986150B2 JP 3986150 B2 JP3986150 B2 JP 3986150B2 JP 03049298 A JP03049298 A JP 03049298A JP 3049298 A JP3049298 A JP 3049298A JP 3986150 B2 JP3986150 B2 JP 3986150B2
- Authority
- JP
- Japan
- Prior art keywords
- watermark
- dimensional data
- watermark information
- spread
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims abstract description 39
- 230000009466 transformation Effects 0.000 claims abstract description 19
- 238000001228 spectrum Methods 0.000 claims description 39
- 238000000605 extraction Methods 0.000 claims description 23
- 238000013139 quantization Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 17
- 238000009792 diffusion process Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 6
- 230000008569 process Effects 0.000 abstract description 12
- 238000003892 spreading Methods 0.000 abstract description 9
- 230000007480 spreading Effects 0.000 abstract description 7
- 230000005236 sound signal Effects 0.000 description 61
- 230000006870 function Effects 0.000 description 36
- 238000012545 processing Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 10
- 238000005070 sampling Methods 0.000 description 9
- 230000006866 deterioration Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00086—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00086—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
- G11B20/00884—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
- G11B20/00913—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm based on a spread spectrum technique
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/69—Spread spectrum techniques
- H04B1/707—Spread spectrum techniques using direct sequence modulation
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Computer Security & Cryptography (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Editing Of Facsimile Originals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Image Processing (AREA)
Description
【発明の属する技術分野】
この発明は、電子透かし技術に関し、特に、音声データなどの一次元データに透かし情報を埋め込む技術、および、透かし情報が埋め込まれた一次元データから透かし情報を抽出する技術に関する。
【0002】
【従来の技術】
デジタル音声データを生成する方法として、PCM(PCM:Pulse Code Modulation)が良く用いられている。PCMでは、まずアナログ音声信号を標本化し、量子化した後に、線形パルス符号化を行うことによってデジタル音声データが生成される。通常の音楽ソフトは、サンプリングレート44.1kHz、量子化幅16ビットのPCMによりデジタル化されていることが多い。この方法によると、人間の可聴周波数帯域の音声を良好に再現できるため、非常に高い音質を保ったままで音声をデジタル化することができる。
【0003】
ところで、デジタル音声データは容易に完全な形式で複製できる(すなわち、忠実な再現性を有している)という特徴がある。このような音声データの忠実な再現性はデジタル化の大きな利点である反面、その著作権保護の重要性がより一層高まってくる。この対策として、近年では、いわゆる「電子透かし」が利用されている。電子透かしは、人間が知覚できない形式で、著作権情報などの透かし情報を音声データの中に電子的に埋め込む技術である。
【0004】
【発明が解決しようとする課題】
しかし、従来の電子透かし技術では、透かし情報の埋め込みに起因する雑音が大きいため、例えば音楽ソフトでは音質がかなり劣化してしまい、高品質なデータには適していないという問題があった。また、透かし情報の秘匿性が低く、第三者が透かし情報を比較的容易に抽出できてしまうという問題もあった。このような問題は、音声データへの電子透かしに限らず、計測データや、デジタル制御のフィードバック信号等の他の種々の一次元データに電子透かしを行う場合にも共通する問題であった。
【0005】
この発明は、従来技術における上述の課題を解決するためになされたものであり、透かし情報の埋め込みに起因する雑音の発生を緩和することができ、また、透かし情報の秘匿性が高い技術を提供することを目的とする。
【0006】
【課題を解決するための手段およびその作用・効果】
上述の課題の少なくとも一部を解決するため、本発明では、透かし情報を原一次元データに埋め込む際に、まず、特定の絶対値を有する正負の値を不規則的に取る特定の正負系列と、前記原一次元データと、を乗算する演算と等価な演算を行うことによってスペクトル拡散を実行し、これによって、第1の拡散一次元データを生成する。次に、前記第1の拡散一次元データに関して直交変換を行う。そして、前記直交変換で得られた変換係数の特定の周波数成分の値を、前記透かし情報と対応付けるように調整する。また、前記調整済みの周波数成分を逆直交変換することによって、第2の拡散一次元データを生成する。そして、前記特定の正負系列を用いて前記第2の拡散一次元データをスペクトル逆拡散することによって、前記透かし情報が埋め込まれた電子透かし一次元データを生成する。
【0007】
上記発明によれば、透かし情報を埋め込む前に、原一次元データに対して特定の正負系列を用いたスペクトル拡散を行っているので、この特定の正負系列を知らなければ、電子透かし一次元データから透かし情報を抽出することは困難である。従って、スペクトル拡散を行うことによって、透かし情報の秘匿性を高めることができる。また、本発明では、直交変換係数の特定の周波数成分の値を透かし情報と対応付けているので、逆直交変換された一次元データにおいて発生する透かし情報による雑音を緩和することができれる。
【0008】
なお、前記特定の正負系列は、特定の周波数発生鍵に応じて発生させることが好ましい。
【0009】
こうすれば、特定の正負系列のすべてを保存しておく必要がなく、周波数発生鍵を保存しておけば、同一のスペクトル拡散/逆拡散処理を実行することができる。
【0010】
なお、前記直交変換は、前記第1の拡散一次元データの中の2M個(Mは2以上の整数)のデータで構成される各フレーム毎に、所定の窓関数を用いた変換を行う変形離散コサイン変換であり、
前記第1の拡散一次元データは、隣接するフレームがM個のデータ区間ずつ互いにずれた位置を取るように、前記変形離散コサイン変換において複数のフレームに区分されるようにしてもよい。
【0011】
このような変形離散コサイン変換を用いると、フレーム歪みを小さく抑えることができるので、雑音の発生をさらに緩和することができる。
【0012】
また、前記透かし情報と対応付けられる前記特定の周波数成分は、ほぼM/2に相当する周波数成分であることが好ましい。
【0013】
こうすれば、雑音の発生をさらに緩和することができる。
【0014】
なお、特定の周波数成分への透かし情報の埋め込みは、
所定の整数kd で前記特定の周波数成分を量子化することによって第1の量子化値を生成し、
前記第1の量子化値の最下位ビットを前記透かし情報のビット値と対応付けるように調整することによって第2の量子化値を生成し、
前記第2の量子化値に前記所定の整数kd を乗じることによって前記調整済みの周波数成分を生成する、ことによって実行するようにしてもよい。
【0015】
整数kd の値を大きくすれば、電子透かし一次元データに或る程度のビット誤りが生じても、正しい透かし情報を抽出できる可能性が高まるという利点がある。
【0016】
一方、本発明において、透かし情報が埋め込まれた電子透かし一次元データから前記透かし情報を抽出する際には、まず、特定の絶対値を有する正負の値を不規則的に取る特定の正負系列と、前記電子透かし一次元データと、を乗算する演算と等価な演算を行うことによってスペクトル拡散を実行し、これによって、第1の拡散電子透かし一次元データを生成する。次に、前記第1の拡散電子透かし一次元データに関して直交変換を行う。そして、前記直交変換で得られた変換係数の特定の周波数成分の値から、前記特定の周波数成分の値に対応付けられた前記透かし情報を抽出する。
【0017】
こうすれば、上述した埋め込み処理によって埋め込まれた透かし情報を一次元データから抽出することが可能である。
【0018】
なお、本発明の態様としては、以下のような種々のものがある。
(a)透かし情報を原一次元データに埋め込む方法。
(b)透かし情報を原一次元データに埋め込む装置。
(c)透かし情報を原一次元データに埋め込むためのコンピュータプログラムを記録した記録媒体。
(d)透かし情報が埋め込まれた電子透かし一次元データを記録した記録媒体。
(e)透かし情報を電子透かし一次元データから抽出する方法。
(f)透かし情報を電子透かし一次元データから抽出する装置。
(g)透かし情報を電子透かし一次元データから抽出するためのコンピュータプログラムを記録した記録媒体。
【0019】
【発明の他の態様】
この発明は、以下のような他の態様も含んでいる。第1の態様は、コンピュータに上記の発明の各工程または各部の機能を実現させるコンピュータプログラムを通信経路を介して供給するプログラム供給装置としての態様である。こうした態様では、プログラムをネットワーク上のサーバなどに置き、通信経路を介して、必要なプログラムをコンピュータにダウンロードし、これを実行することで、上記の方法や装置を実現することができる。
【0020】
【発明の実施の形態】
A.装置の全体構成:
以下、本発明の実施の形態を実施例に基づいて説明する。図1は、本発明の一実施例としての電子透かし処理装置の構成を示すブロック図である。この電子透かし処理装置は、CPU22と、ROMおよびRAMを含むメインメモリ24と、フレームメモリ26と、キーボード30と、マウス32と、表示装置34と、ハードディスク36と、モデム38と、これらの各要素を接続するバス40と、を備えるコンピュータである。なお、図1では各種のインターフェイス回路は省略されている。モデム38は、図示しない通信回線を介してコンピュータネットワークに接続されている。コンピュータネットワークの図示しないサーバは、通信回線を介してコンピュータプログラムを画像処理装置に供給するプログラム供給装置としての機能を有する。
【0021】
メインメモリ24には、電子透かし埋め込み部42と、電子透かし抽出部44との機能をそれぞれ実現するためのコンピュータプログラムが格納されている。これらの各部42,44の機能については後述する。
【0022】
これらの各部42,44の機能を実現するコンピュータプログラムは、フレキシブルディスクやCD−ROM等の、コンピュータ読み取り可能な記録媒体に記録された形態で提供される。コンピュータは、その記録媒体からコンピュータプログラムを読み取って内部記憶装置または外部記憶装置に転送する。あるいは、通信経路を介してコンピュータにコンピュータプログラムを供給するようにしてもよい。コンピュータプログラムの機能を実現する時には、内部記憶装置に格納されたコンピュータプログラムがコンピュータのマイクロプロセッサによって実行される。また、記録媒体に記録されたコンピュータプログラムをコンピュータが読み取って直接実行するようにしてもよい。
【0023】
この明細書において、コンピュータとは、ハードウェア装置とオペレーションシステムとを含む概念であり、オペレーションシステムの制御の下で動作するハードウェア装置を意味している。また、オペレーションシステムが不要でアプリケーションプログラム単独でハードウェア装置を動作させるような場合には、そのハードウェア装置自体がコンピュータに相当する。ハードウェア装置は、CPU等のマイクロプロセッサと、記録媒体に記録されたコンピュータプログラムを読み取るための手段とを少なくとも備えている。コンピュータプログラムは、このようなコンピュータに、上述の各手段の機能を実現させるプログラムコードを含んでいる。なお、上述の機能の一部は、アプリケーションプログラムでなく、オペレーションシステムによって実現されていても良い。
【0024】
なお、この発明における「記録媒体」としては、フレキシブルディスクやCD−ROM、光磁気ディスク、ICカード、ROMカートリッジ、パンチカード、バーコードなどの符号が印刷された印刷物、コンピュータの内部記憶装置(RAMやROMなどのメモリ)および外部記憶装置等の、コンピュータが読取り可能な種々の媒体を利用できる。
【0025】
B.透かし情報の埋め込み処理:
図2は、電子透かし埋め込み部42の機能を示すブロック図である。電子透かし埋め込み部42は、第1のPN系列発生部52と、第1の乗算器54と、フレーム抽出部56と、MDCT部(変形離散コサイン変換部)58と、埋め込み部60と、IMDCT部(変形離散コサイン逆変換部)62と、フレーム再生部64と、第2の乗算器66と、第2のPN系列発生部68と、の機能を有している。
【0026】
なお、第1のPN系列発生部52と第1の乗算器54は、スペクトル拡散を行うスペクトル拡散部に相当する。また、フレーム抽出部56とMDCT部58は、直交変換を行う直交変換部に相当し、IMDCT部62とフレーム再生部64は逆交変換を行う逆変換部に相当する。さらに、第2の乗算器66と第2のPN系列発生部68は、スペクトル逆拡散を行う逆拡散部に相当する。
【0027】
PN系列発生部52,68は、+1と−1の値をランダムに取る2値のPN系列(正負系列)g(t)を発生する。PN系列g(t)のランダムなパターンは、PN系列発生部52,68に入力されるPN系列発生鍵ks (ks は整数)の値に応じて決定される。すなわち、PN系列発生鍵ks の値が同一であれば、2つのPN系列発生部52,68は同一のパターンを有するPN系列g(t)を発生する。PN系列発生部52,68としては、例えば、C言語の標準の疑似乱数発生関数を利用することができ、この際、PN系列発生鍵ks は乱数発生の種(seed)として関数に入力される。また、発生した乱数の最下位ビットが1のときにはそのビット値「1」をそのままPN系列g(t)として出力し、一方、最下位ビットが0のときには−1をPN系列g(t)として出力する。こうすれば、+1と−1の値をランダムに取る2値のPN系列g(t)を生成することができる。
【0028】
PN系列発生鍵ks を用いる理由は次の通りである。すなわち、スペクトル拡散に用いられるPN系列は、一般に膨大な量になる。しかも、透かし情報を抽出するためには,このPN列と同一のものが必要になるので、PN系列の全体を完全に保持(保存)しておく必要がある。そこで、本実施例では、疑似乱数発生器(例えばC言語の標準関数である疑似乱数発生関数)を利用し、それに乱数鍵ks を設定して乱数を発生させることによって、膨大な量のPN系列全体を保持すること無しに、同一のPN系列を発生できるようにしている。
【0029】
図3は、透かし情報の埋め込み処理の手順を示すフローチャートである。ステップS1では、第1の乗算器54が、原音声信号s(t)にPN系列g(t)を乗算することによって第1の拡散音声信号x(t)を生成する。この演算は、次の数式1で示される。
【0030】
【数1】
【0031】
数式1で示される演算は、一般にスペクトル拡散の直接拡散方式と呼ばれている処理に相当する。図4は、スペクトル拡散の原理を示す説明図である。図4(a)は原音声信号s(t)を示し、図4(b)はPN系列g(t)を、また、図4(c)は第1の拡散音声信号x(t)を示している。原音声信号s(t)は、例えばアナログ音声信号をサンプリングレート44.1kHz、量子化幅16ビットでデジタル化して得られたデジタル音声信号である。本実施例において使用されるPN系列g(t)(図4(b))は、原音声信号s(t)のサンプリング周波数と等しい周波数で変化する信号である。従って、これらの信号s(t),g(t)を乗算することによって得られる第1の拡散音声信号x(t)(図4(c))は、原音声信号s(t)と等しい周波数を有しており、一部の信号値の符号が原音声信号s(t)から反転している信号である。なお、図4(d)に示すように、同一のPN系列g(t)を第1の拡散音声信号x(t)に再度乗算すると、原音声信号s(t)を再現することができる。この理由は、PN系列g(t)は+1と−1を取る2値信号なので、同一のPN系列g(t)を2乗した値g2(t)は1に等しくなるからである。このように、PN系列g(t)を再度乗ずる処理は、「逆拡散」と呼ばれている。
【0032】
ところで、スペクトル拡散は、主に通信分野において利用されている技術である。但し、通信分野では、原信号s(t)としてはデジタル変調された変調信号が用いられる。また、PN系列g(t)としては、原信号s(t)の周波数の数十倍以上の高周波数の系列が使用されるので、拡散信号x(t)のスペクトル分布は原信号s(t)に比べて数十倍以上に拡散される。送信器は拡散信号x(t)を発信し、受信器は図4(d)に示すように、受信した拡散信号x(t)に同一のPN信号g(t)を乗算することによって原信号s(t)を再生する。通信経路で混入した妨害波や干渉波のスペクトル分布は、逆拡散によって数十倍に拡散されるので、スペクトル拡散通信は妨害波や干渉波の排除能力を高めることができる。
【0033】
本実施例では、PN系列g(t)が原音声信号s(t)のサンプリング周波数と等しい周波数で変化するので、厳密な意味ではスペクトル分布は拡散されていない。しかし、この明細書では「スペクトル拡散」という用語を、通常よりも広い意味で用いており、PN系列g(t)が原音声信号s(t)のサンプリング周波数と等しい周波数で変化する場合にも、「スペクトル拡散」と呼んでいる。なお、本発明による処理においても、PN系列g(t)の周波数を原音声信号s(t)のサンプリング周波数の整数倍に設定することが可能である。
【0034】
図4(a)〜(d)に示すスペクトル拡散および逆拡散は、PN系列g(t)を鍵として用いて、原音声信号s(t)を暗号化および復号化しているものと考えることができる。従って、スペクトル拡散を行うことによって、音声信号に埋め込まれる透かし情報の秘匿性を高めることができる。この点についてはさらに後述する。
【0035】
図3のステップS2では、フレーム抽出部56が第1の拡散音声信号x(t)の中からi番目(初期値はi=1)のフレームを抽出し、MDCT部58がそのフレームについて変形離散コサイン変換(MDCT)を実行する。ここで、「フレーム」とは、変形離散コサイン変換の対象となる信号区間を意味しており、本実施例では1フレームに2M個(Mは2以上の整数)の信号値が含まれる。i番目のフレームにおけるMDCT係数Xi(k) は次の数式2で与えられる。
【0036】
【数2】
【0037】
ここで、kは周波数を示す整数値である。また、数式2の右辺の窓関数w(n)とMDCT基底c(k,n)は、それぞれ数式3と数式4で与えられる。
【0038】
【数3】
【0039】
【数4】
【0040】
数式2から解るように、各フレームの2M個の信号値x(n+iM)は、M個の変換係数Xi(k) (k=0〜(M−1))に変換される。なお、k=0の変換係数Xi (0)は直流成分、それ以外の変換係数Xi (k)(k≠0)は交流成分と呼ばれている。
【0041】
図5は、変形離散コサイン変換に使用されるフレームと窓関数w(n)との関係を示す説明図である。図5には、隣接する2つのフレームの位置関係と、各フレームに適用される窓関数w(n)の形状とが示されている。このように、各フレームは、M個分の信号値x(t)に相当する区間ずつ順次ずれた位置に設定されるので、隣接する2つのフレームには、共通するM個の信号値x(t)が含まれている。従って、1フレームに含まれる実効的(実質的)な信号値の個数はMである。
【0042】
窓関数w(n)は、各フレームの中央でピークを有する正弦関数である。なお、窓関数w(n)としては、正弦関数以外の関数を用いることも可能であり、一般には、変形離散コサイン変換とその逆変換とを可逆的に行えるような任意の関数を使用することができる。
【0043】
なお、変形離散コサイン変換の代わりに、他の種々の直交変換(離散コサイン変換(DCT)、離散フーリエ変換(DFT)、アダマール変換等)を利用することができる。他の直交変換では、フレーム(「ブロック」とも呼ばれる)が互いに重複しないように設定される。一方、変形離散コサイン変換では、隣接するフレームが部分的に重複するようにフレームが設定されるので、周波数分離度を高くすることができ、かつ、フレーム歪み(ブロック歪み)を抑制することができるという利点がある。従って、変形離散コサイン変換を利用すると、他の直交変換を利用した場合に比べて、透かし情報の埋め込みに起因する音質の劣化を低減することができる。
【0044】
図3のステップS3〜S6では、埋め込み部60によって、変換係数の特定の周波数成分に透かし情報が埋め込まれる。透かし情報は複数のビットで構成されており、以下では、透かし情報の各ビットを「透かしビットbi 」と呼ぶ。透かしビットbi の埋め込みの際には、周波数鍵kf とスケール鍵kd とが使用される。周波数鍵kf は、1フレーム分のM個のMDCT係数Xi(k) (k=0〜(M−1))の中で、透かしビットbi が埋め込まれる特定の周波数成分Xi (kf )の周波数を示す整数である。周波数鍵kf としては、0〜Mの範囲から好ましい整数値が予め選択される。また、スケール鍵kd は、MDCT係数Xi (kf )の量子化を行う際の量子化幅であり、0以外の任意の正の整数に設定される。周波数鍵kf とスケール鍵kd の好ましい値については後述する。
【0045】
ステップS3では、次の数式5で示されるように、周波数鍵kf で特定される周波数成分Xi(kf)をスケール鍵kd で除算し、小数点以下を切り捨てることによって、整数値ei (「量子化値」と呼ぶ)を求める。
【0046】
【数5】
【0047】
ステップS4では、量子化値ei と埋め込みビットbi が、次の2つの条件のうちのいずれか一方を満足するか否かが判断される。
【0048】
[条件1]ei が奇数でかつbi =0,
[条件2]ei が偶数でかつbi =1。
【0049】
条件1,2のいずれか一方が成立する場合には、次の数式6で示されるように、MDCT係数Xi(kf)をスケール鍵kd で除算し、小数点以下を切り上げた値を量子化値ei として採用する(ステップS5)。
【0050】
【数6】
【0051】
一方、上記条件1,2がいずれも成立しない場合には、ステップS3で得られた量子化値ei がそのまま採用される。この結果、透かしビットbi が0ならば量子化値ei が偶数(最下位ビットが0)に設定され、透かしビットbi が1ならば量子化値ei が奇数(最下位ビットが1)に設定される。すなわち、ステップS3〜S5の処理では、MDCT係数Xi (kf )の量子化値ei が透かしビットbi に対応付けられるように量子化値ei が調整されており、この結果、量子化値ei の中に透かしビットbi が埋め込まれる。
【0052】
なお、MDCT係数Xi(kf)をスケール鍵kd で除算した値Xi(kf)/kd が小数部を含まず、整数である場合には、ステップS5で切り上げを行っても量子化値ei がステップS3の値と変わらない。従って、ステップS5の処理としては、切り上げの代わりに、ステップS3で得られた量子化値ei に1を加算するか、または、1を減算する演算を採用するようにしてもよい。
【0053】
図6は、ステップS3〜S5の処理内容を示す説明図である。図6の右側に示されているように、スケール鍵kd の範囲にわたるMDCT係数Xi(kf)に対する量子化値ei は、透かしビットbi が0であれば切り上げによって得られ、一方、透かしビットbi が1であれば切り捨てによって得られる。なお、図6の左側の「丸め範囲」は、比較のために、四捨五入で量子化値ei が奇数となる範囲を示したものである。
【0054】
図3のステップS6では、次の数式7に示されるように、透かしビットbi が埋め込まれた量子化値ei にスケール鍵kd を乗ずることによって逆量子化を行い、透かしビットbi が埋め込まれたMDCT係数X'i(kf)を生成する。
【0055】
【数7】
【0056】
なお、上記ステップS3の処理は、変換係数の特定の周波数成分Xi(kf)をスケール鍵kd で量子化する量子化部としての機能に対応している。また、ステップS4,S5の処理は、量子化値ei の最下位ビットを透かしビットbi と対応付けるように調整するビット調整部としての機能に対応している。さらに、ステップS6の処理は、透かしビットが埋め込まれた量子化値ei にスケール鍵kd を乗じることによって逆量子化を行う逆量子化部としての機能に対応している。
【0057】
ステップS7では、透かしビットbi が埋め込まれた周波数成分X'i(kf )を含む1フレーム分のMDCT係数X'i(kf )(k=0〜(M−1))に関して、IMDCT部62(図2)が変形離散コサイン逆変換を実行する。なお、透かしビットbi が埋め込まれた周波数成分X'i(kf )以外のMDCT係数X'i(k)(k≠kf )の値は、ステップS2で得られたMDCT係数Xi(k) と同じである。変形離散コサイン逆変換は、次の数式8で表される。
【0058】
【数8】
【0059】
なお、逆変換に用いられる窓関数w(n)と基底c(k、n)は、順変換と同じものである。
【0060】
ステップS7では、さらに、フレーム再生部64が次の数式9に従って、時系列信号としての第2の拡散音声信号x'i(t)を生成する。
【0061】
【数9】
【0062】
ここで、x'i-1(n+M)は(i−1)番目のフレームの逆変換信号、x'i(n)はi番目のフレームの逆変換信号であり、x'i-1(n+M)とx'i(n)は互いに重複する区間(図5)の信号である。
【0063】
ステップS8では、全フレームへの透かし情報の埋め込みが終了したか否かが判断され、終了していなければステップS9でiをインクリメントしてステップS2に戻る。一方、全フレームへの透かし情報の埋め込みが終了すると、ステップS8からステップS10に移行し、第2の乗算器66が第2の拡散音声信号x'i(t)にPN系列g(t)を乗ずることによって、スペクトル逆拡散を行う。この結果、透かし情報が埋め込まれた音声信号s’(t)が得られる。以下では、この音声信号s’(t)を「電子透かし音声信号」と呼ぶ。
【0064】
本実施例では、1フレーム分の電子透かし音声信号s’(t)に1ビットの透かし情報が埋め込まれており、また、1フレームは実質的にM個の信号値で構成されている。従って、透かし情報の埋め込み割合Brは、次の数式10で与えられる。
【0065】
【数10】
【0066】
ここで、fs は原音声信号s(t)のサンプリング周波数である。
【0067】
なお、透かし情報がNビットで構成されている場合には、Nフレーム分の音声信号区間に1つの透かし情報を埋め込むことができる。従って、Nビットの透かし情報は、Nフレーム毎に繰り返し埋め込まれる。
【0068】
こうして得られた電子透かし音声信号s’(t)は種々の形態で配布することができる。例えば、通信回線を介して電子透かし音声信号s’(t)を伝送することが可能である。また、CD−ROMやDVDなどの音楽専用の記録媒体や、コンピュータ読み取り可能な記録媒体などに収納された形で配布することも可能である。このとき、電子透かし音声信号s’(t)を変調したり、圧縮したりすることも可能である。特に、電子透かし音声信号s’(t)がコンピュータ読み取り可能な記録媒体に収納されている場合には、その記録媒体から電子透かし音声信号s’(t)を読み出して、透かし情報を抽出することができる。
【0069】
なお、上述したように、透かし情報は、MDCT係数に埋め込まれた後に逆直交変換されるので、透かし情報に起因する音質劣化は従来に比べて低く抑えられる。透かし情報の埋め込みと音質劣化との関係については、さらに後述する。
【0070】
C.透かし情報の抽出処理:
図7は、電子透かし抽出部44(図1)の機能を示すブロック図である。電子透かし抽出部44は、PN系列発生部72と、乗算器74と、フレーム抽出部76と、MDCT部78と、デコード部80と、の機能を有している。PN系列発生部72は、図2に示したPN系列発生部52,68と同じものであり、PN系列発生鍵ks の値に応じた特定のPN系列g(t)を発生する。また、乗算器74、フレーム抽出部76、および、MDCT部78も、図2に示す乗算器54、フレーム抽出部56、および、MDCT部58とそれぞれ同じ構成と機能を有している。
【0071】
図8は、透かし情報の抽出処理の手順を示すフローチャートである。ステップS11では、乗算器74が、埋込み時と同一のPN系列g(t)を用いて電子透かし音声信号s’(t)をスペクトル拡散することによって、拡散音声信号x’(t)を生成する。この処理は、次の数式11で表される。
【0072】
【数11】
【0073】
ここでは、PN系列g(t)が、g2(t)=1となる性質(図4(d)参照)を有していることを利用している。
【0074】
ステップS12では、フレーム抽出部76が、拡散音声信号x’(t)の中からi番目(初期値はi=1)のフレームを抽出し、MDCT部78がそのフレームについて変形離散コサイン変換を実行する。ステップS13では、デコード部80が、1フレーム分のMDCT係数X'i(k)の中から、埋め込み時に用いた周波数鍵kf で特定される周波数成分X'i(kf )を抽出し、さらに、次の数式12に従って、その周波数成分X'i(kf )をスケール鍵kd で量子化した量子化値e'iを求める。
【0075】
【数12】
【0076】
ここで、演算子Round()は、四捨五入によって整数値を得る演算を示す。
【0077】
なお、変形離散コサイン変換は可逆変換なので、数式12の右辺のかっこ内の値「X'i(kf)/kd」は通常は整数になり、丸め演算を行う必要は無い.ただし、第三者が不正な波形処理を行った場合などのように、何らかの原因でビット誤りが生じた場合には、スケール鍵kd で除算した値「X'i(kf)/kd」が正しい整数値とならないことがある。この場合にも、数式10のように、この値「X'i(kf)/kd」を四捨五入することによって、電子透かし音声信号s’(t)の変形による透かし情報の抽出誤りを訂正することができる可能性がある。すなわち、四捨五入を行うことによって透かし情報の誤り耐性が向上する。この誤り耐性は、スケール鍵kd が大きいほど大きい。例えば、スケール鍵kd を大きな値に設定すれば、電子透かし音声信号s’(t)がある程度大きな変形を受けても、透かし情報を正しく抽出することができる。一方、後で詳述するように、スケール鍵kd が大きくなるほど音質劣化が増大する傾向にある。すなわち、スケール鍵kd をより小さな値にすれば、電子透かし音声信号s’(t)の変形による透かし情報の消失の可能性は高くなるが、音質劣化はより少なくなる。
【0078】
図8のステップS14では、デコード部80が、量子化値e'iの値に応じて透かしビットboiを復元する。すなわち、量子化値e'iが偶数の場合には透かしビットboiが0であると決定し、奇数の場合には透かしビットboiが1であると決定する。ステップS15では、全フレームからの透かし情報の抽出が終了したか否かが判断され、終了していなければ、ステップS16においてパラメータiをインクリメントしてステップS12に戻る。一方、全フレームからの透かし情報の抽出が終了すると、処理を終了する。この結果、複数ビットで構成される透かし情報が抽出される。なお、複数ビットで構成される正しい透かし情報が1回抽出されたときに、図8の処理を直ちに終了するようにしてもよい。
【0079】
なお、透かしの抽出処理に用いられるPN系列が、埋め込み処理に用いられたPN系列と異なる場合には、電子透かし抽出部44の乗算器74から出力される信号は、埋め込み処理部42において透かし情報が埋め込まれた拡散音声信号x’(t)とは異なる信号となる。従って、この場合には、正しい透かし情報を復元することができない。すなわち、本実施例では、スペクトル拡散を利用することによって、透かし情報の秘匿性が高められている。特に、本実施例では、透かし情報の埋込みが音質に与える影響を少なくするために、特定の周波数の変換係数に埋込みを施しているので、スペクトル拡散を用いない場合には、第三者が透かし情報を抽出することは比較的容易である。一方、PN系列を用いたスペクトル拡散を行うと、そのPN系列を一種の暗号化/復号化の鍵として使用できるので、音声データなどの一次元データに埋め込まれた透かし情報の秘匿性を高めることができるという利点がある。
【0080】
D.埋込み周波数の最適化:
以下では、透かし情報の埋込みによる音質への影響を検討する。まず、MDCT係数への透かし情報の埋込みにより生じた量子化誤差δi (k)を、次の数式13で定義する。
【0081】
【数13】
【0082】
ここで、Xi(k) は埋め込み前の係数値、X'i(k)は埋め込み後の係数値である。上記実施例では周波数鍵kf で特定される周波数成分に埋め込みを行ったので、次の数式14で示されるように、k=kf 以外の周波数成分の量子化誤差δi (k)はゼロである。
【0083】
【数14】
【0084】
但し、量子化誤差δi(kf )の値は周波数鍵kf の値に依存せず、その絶対値|δi(kf )|はスケール鍵kd 以下である。
【0085】
各フレームの音声信号xi(n)に生じる埋込みの影響Di(n)は、上記数式8(逆変換の式)と数式14とから、次の数式15で与えられる。
【0086】
【数15】
【0087】
したがって、透かし情報の埋込みが音声信号に与える影響(すなわち雑音成分)D(n)は、次の数式16で与えられる。
【0088】
【数16】
【0089】
また、デジタル音声信号値に生じる誤差は、次の数式17に示すように、D(n)を整数化した値で与えられる。
【0090】
【数17】
【0091】
ところで、MDCT係数の特定の周波数成分Xi(kf)に透かし情報の埋込みを行うことは、図9に示すように、狭帯域の雑音干渉δi(kf )を与えることと等価である。従って、透かし情報に起因する雑音の帯域幅は、音声復元時にはM倍(Mは1フレームに含まれる信号値の実質個数)に拡大され、この結果、透かし情報の雑音電力は非常に小さくなると考えられる。
【0092】
ところで、一般に、音質の客観的な評価尺度として使用される基本的なものに信号対量子化雑音比SNRがある。SNR[dB]の評価式は、入力音声信号So(m)とその量子化誤差Er(m)を用いて次の数式18のように定義される。
【0093】
【数18】
【0094】
本実施例では、SNRを改良して主観評価との対応関係を向上したSNRseg (セグメンタルSNR)を用いる。SNRseg は次の数式19で与えられる。
【0095】
【数19】
【0096】
ここで、Nf は測定区間のフレーム数を表し、SNRf は、f番目のフレームにおけるSNRである。以下に示す測定例では、1フレームの長さを32msとした。また、誤差のない音声フレーム、すなわちSNRf =∞の音声フレームを除外して測定した。
【0097】
図10は、実際にデジタル音声信号を用いて周波数鍵kf の値と信号対量子化雑音比SNRseg との関係を求めた結果を示すグラフである。ここでは、1フレームに含まれる信号値の実質的な個数M(すなわち1フレーム分の変換係数の数)を256とした。また、スケール鍵kd とPN系列発生鍵ks (図2)はいずれも1とした。図10の結果から、kf =127または128のときの波形歪みが他の場合と比べて非常に少ないことがわかる。この理由は、上記数式15,17に示したように、周波数鍵kf の違いによる雑音成分Di(n)への影響が、MDCT基底c(k,n)とデジタル化の丸め処理とに起因しているからであると考えられる。このように、1フレームに含まれる実質的な信号値の個数Mが256のときには、周波数鍵kf の値を127または128とすれば、音質の劣化が最小限に抑えられる。一般には、周波数鍵kf の値を、1フレームに含まれる音声信号値の実質的な個数Mの約1/2の値とすることが好ましい。
【0098】
なお、1フレーム中に複数の透かしビットを埋め込むことも可能である。例えば、kf =127および128の2つの周波数成分に透かしビットを埋め込むようにしてもよい。この明細書において「特定の周波数成分に埋め込む」とは、このように、1フレーム中に複数の透かしビットを埋め込む場合も含んでいる。但し、1フレーム中に埋め込まれる透かし情報のビット数が増加するほど音質が劣化する傾向にある。
【0099】
E.実験結果:
音質の高さに価値がある音楽ソフトに透かし情報の埋込みを行う場合には、埋込みによって音質が劣化しないことが重要である。そこで、実際に高品質の音楽データに透かし情報の埋込みを行って、音質に与える影響を調べた。この実験では、クラシックと、ジャズと、ダンスの3種類の音楽を、サンプリング周波数44.1kHz、量子化幅16ビットで量子化した原音声信号s(t)を用いた。ただし、音楽ソフトは通常ステレオであるが、その片側成分のみに埋込みを行った。
【0100】
この実験では、M=256に設定したので、透かし情報の埋め込み量Brは、上記数式10から約172ビット/秒である。この埋込みを施した再生音声信号と埋込みのない再生音声信号の音質を比較検討した。
【0101】
図11は、スケール鍵kd を固定し、周波数鍵kf を変化させてクラシック音楽に埋込みを施した場合のSNRseg を示すグラフである。ここでは、kd =2,ks =1(ks はPN系列発生鍵)とした。図11においても、周波数鍵kf の値が128付近のときに最高音質が得られている。図12は、PN系列発生鍵ks の値を2とすることによって、図11とは異なる変化パターンを有するPN系列を発生させ、また、スケール鍵kd を図11と同じ値に設定した場合の結果である。図12においても、図10や図11と同様に、周波数鍵kf の値が128付近のときに最高音質が得られている。
【0102】
図13は、クラシック音楽に透かし情報を埋め込んだ音声信号に対して、異なるPN系列発生鍵ks を用いて透かし情報の検出を試みた場合の検出率を示すグラフである。ここでは、透かし情報の埋め込み時のスケール鍵kd を2、周波数鍵kf を128、PN系列発生鍵ks を128とした。図13の結果から、正しいPN系列発生鍵ks (=128)で生成したPN系列で復号すると、検出率は1であり、透かし情報を完全に復号できるが、PN系列発生鍵ks が他の異なった値のときには検出率が0.5となる。検出率が0.5のときは、0と1のビットがランダムに出現するので透かし情報を正しく検出できない。このように、本実施例の電子透かし技術によれば、埋め込みに用いたPN系列g(t)が暗号化の鍵として機能しており、透かし情報に関して高い秘匿性を確保できる。しかし、埋め込みに用いたPN系列g(t)と相関の高いPN系列を偶然に用いた場合には、透かし情報が不正に発見されてしまうことも考えられる。したがって、PN系列g(t)としては、相関の高い系列を容易に生成できないようなものを用いることが望ましい。この意味からは、C言語の標準関数のように一般に入手が容易なPN系列発生部を使用することは好ましくなく、一般に入手が困難なPN系列発生部を使用することが好ましい。
【0103】
図14は、周波数鍵kf を128の一定値とし、スケール鍵kd を変化させた場合の音質の変化に示すグラフである。図14から、スケール鍵kd を増大させると復元音声の音質を示すSNRseg が低下することがわかる。高音質を維持するためには、スケール鍵kd を1〜3程度の比較的小さな値にすることが好ましい。一方、電子透かし音声信号から透かし情報を確実に検出するためには、スケール鍵kd をなるべく大きな値にすることが好ましい。なお、音楽ソフトの商品的価値を失わないように(すなわち音質を過度に劣化させないように)デジタルコピーした場合には、スケール鍵kd が小さな値であっても正しい透かし情報を取り出すことは可能である。一方、音質劣化(損失圧縮)した音声信号からも透かし情報を取り出したいときには、スケール鍵kd を大きな値に設定すれば良い。
【0104】
図15は、透かし情報の埋込みのない再生音声波形と、埋込みのある再生音声波形と、それらの差分波形とを示す説明図である。これら波形は、ジャズにおけるピアノの演奏音に相当する部分である。図15(c)に示す差分波形から、図15(a)と(b)の波形にほとんど差異がないことがわかる。
【0105】
このように、上記実施例によれば、音楽ソフトの音質を損なわずに高い秘匿性を持つ透かし情報を埋め込むことができる。また、上記実施例では、原音声信号をMDCT変換して得られた変換係数の特定の周波数成分に透かし情報を埋め込んでいるので、原音声信号s(t)のサンプリング周波数がどのような値であっても、透かし情報を埋め込んだり、抽出したりすることが可能である。換言すれば、上記実施例の電子透かし技術は、高音質の音声データにも、低音質の音声データにも適用することが可能である。
【0106】
なお、この発明は上記の実施例や実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能であり、例えば次のような変形も可能である。
【0107】
(1)上記実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部をハードウェアに置き換えるようにしてもよい。例えば、図2に示した電子透かし埋め込み部42の構成や、図7に示した電子透かし抽出部44の構成をハードウェア回路で実現することも可能である。
【0108】
(2)上記実施例では、PN系列g(t)として、+1と−1の2値をランダムに取る系列を使用していたが、PN系列g(t)の絶対値としては1以外の整数値pを用いることも可能である。すなわち、一般には、特定の絶対値pを有する正負の値を不規則的に取る正負系列を用いることができる。但し、この場合には、図2の第2の乗算器66の出力x’(t)・g(t)を整数値pの2乗で除算することによって、電子透かし音声信号s’(t)を生成する。
【0109】
(3)スペクトル拡散の演算としては、PN系列(正負系列)を原音声信号に乗算する演算と等価な他の種々の演算を用いることができる。例えば、0レベルと1レベルをランダムにとる2値系列を用いた論理演算を行うことによって、スペクトル拡散を実現することも可能である。この場合には、原音声信号の各ビットが入力される複数のEXOR(排他的論理和)回路を設け、これらの複数のEXOR回路に2値系列を共通に入力することによって、PN系列を原音声信号に乗算する演算と等価な演算を実現することができる。すなわち、複数のEXOR回路に2値系列の0レベルが入力される場合には、原音声信号がそのまま出力されるので、原音声信号に+1を乗算した場合と等価な演算が実現される。一方、複数のEXOR回路に2値系列の1レベルが入力される場合には、原音声信号の各ビットが反転されて出力されるので、原音声信号に−1を乗算した場合と等価な演算が実現される。また、こうしてスペクトル拡散された拡散音声信号に関して、同一の2値系列を用いて再度EXOR回路で処理を行えば、原音声信号を再現することができる。
【図面の簡単な説明】
【図1】本発明の第1実施例としての電子透かし処理装置の構成を示すブロック図。
【図2】電子透かし埋め込み部42の機能を示すブロック図。
【図3】透かし情報の埋め込み処理の手順を示すフローチャートである。
【図4】スペクトル拡散の原理を示す説明図。
【図5】変形離散コサイン変換に使用されるフレームと窓関数w(n)との関係を示す説明図。
【図6】ステップS3〜S5の処理内容を示す説明図。
【図7】電子透かし抽出部44の機能を示すブロック図。
【図8】透かし情報の抽出処理の手順を示すフローチャート。
【図9】透かし情報に起因する雑音の影響を示す説明図。
【図10】周波数鍵kf の値と信号対量子化雑音比SNRseg との関係を示すグラフ。
【図11】周波数鍵kf の値と信号対量子化雑音比SNRseg との関係を示すグラフ。
【図12】周波数鍵kf の値と信号対量子化雑音比SNRseg との関係を示すグラフ。
【図13】埋め込み時と異なるPN系列発生鍵ks を用いて透かし情報の検出を試みた場合の検出率を示すグラフ。
【図14】スケール鍵kd を変化させた場合の音質の変化に示すグラフ。
【図15】透かし情報の埋込みのない再生音声波形と、埋込みにある再生音声波形と、それらの差分波形とを示すグラフ。
【符号の説明】
22…CPU
24…メインメモリ
26…フレームメモリ
30…キーボード
32…マウス
34…表示装置
36…ハードディスク
38…モデム
40…バス
42…電子透かし埋め込み部部
44…電子透かし抽出部
52…PN系列発生部
54…乗算器
56…フレーム抽出部
58…MDCT部
60…埋め込み部
62…IMDCT部
64…フレーム再生部
66…乗算器
68…PN系列発生部
72…PN系列発生部
74…乗算器
76…フレーム抽出部
78…MDCT部
80…デコード部
Claims (16)
- 透かし情報を原一次元データに埋め込む方法であって、
(a)特定の絶対値を有する正負の値を不規則的に取る特定の正負系列と、前記原一次元データと、を乗算する演算と等価な演算を行うことによってスペクトル拡散を実行し、これによって、第1の拡散一次元データを生成する工程と、
(b)前記第1の拡散一次元データに関して直交変換を行う工程と、
(c)前記直交変換で得られた変換係数の特定の周波数成分の値を、前記透かし情報と対応付けるように調整する工程と、
(d)前記調整済みの周波数成分を逆直交変換することによって、第2の拡散一次元データを生成する工程と、
(e)前記特定の正負系列を用いて前記第2の拡散一次元データをスペクトル逆拡散することによって、前記透かし情報が埋め込まれた電子透かし一次元データを生成する工程と、
を備える電子透かしの埋め込み方法。 - 請求項1記載の電子透かしの埋め込み方法であって、
前記工程(a)および工程(e)は、特定の周波数発生鍵に応じて前記特定の正負系列を発生する工程をそれぞれ含む、
電子透かしの埋め込み方法。 - 請求項1または2記載の電子透かしの埋め込み方法であって、
前記直交変換は、前記第1の拡散一次元データの中の2M個(Mは2以上の整数)のデータで構成される各フレーム毎に、所定の窓関数を用いた変換を行う変形離散コサイン変換であり、
前記第1の拡散一次元データは、隣接するフレームがM個のデータ区間ずつ互いにずれた位置を取るように、前記変形離散コサイン変換において複数のフレームに区分される、
電子透かしの埋め込み方法。 - 請求項3記載の電子透かしの埋め込み方法であって、
前記透かし情報と対応付けられる前記特定の周波数成分は、ほぼM/2に相当する周波数成分である、
電子透かしの埋め込み方法。 - 請求項1ないし4のいずれかに記載の電子透かしの埋め込み方法であって、
前記工程(c)は、
(i)所定の整数kd で前記特定の周波数成分を量子化することによって第1の量子化値を生成する工程と、
(ii)前記第1の量子化値の最下位ビットを前記透かし情報のビット値と対応付けるように調整することによって第2の量子化値を生成する工程と、
(iii)前記第2の量子化値に前記所定の整数kd を乗じることによって前記調整済みの周波数成分を生成する工程と、
を含む、電子透かしの埋め込み方法。 - 透かし情報を原一次元データに埋め込む装置であって、
特定の絶対値を有する正負の値を不規則的に取る特定の正負系列と、前記原一次元データと、を乗算する演算と等価な演算を行うことによってスペクトル拡散を実行し、これによって、第1の拡散一次元データを生成するスペクトル拡散部と、
前記第1の拡散一次元データに関して直交変換を行う直交変換部と、
前記直交変換で得られた変換係数の特定の周波数成分の値を、前記透かし情報と対応付けるように調整する埋め込み部と、
前記調整済みの周波数成分を逆直交変換することによって、第2の拡散一次元データを生成する逆変換部と、
前記特定の正負系列を用いて前記第2の拡散一次元データをスペクトル逆拡散することによって、前記透かし情報が埋め込まれた電子透かし一次元データを生成する逆拡散部と、
を備える電子透かしの埋め込み装置。 - 請求項6記載の電子透かしの埋め込み装置であって、
前記スペクトル拡散部は、特定の周波数発生鍵に応じて前記特定の正負系列を発生する正負系列発生部を含む、
電子透かしの埋め込み装置。 - 請求項6または7記載の電子透かしの埋め込み装置であって、
前記直交変換部は、前記第1の拡散一次元データの中の2M個(Mは2以上の整数)のデータで構成される各フレーム毎に、所定の窓関数を用いた変形離散コサイン変換を実行し、
前記第1の拡散一次元データは、隣接するフレームがM個のデータ区間ずつ互いにずれた位置を取るように、前記変形離散コサイン変換において複数のフレームに区分される、
電子透かしの埋め込み装置。 - 請求項8記載の電子透かしの埋め込み装置であって、
前記透かし情報と対応付けられる前記特定の周波数成分は、ほぼM/2に相当する周波数成分である、
電子透かしの埋め込み装置。 - 請求項6ないし9のいずれかに記載の電子透かしの埋め込み装置であって、
前記埋め込み部は、
所定の整数kd で前記特定の周波数成分を量子化することによって第1の量子化値を生成する量子化部と、
前記第1の量子化値の最下位ビットを前記透かし情報のビット値と対応付けるように調整することによって第2の量子化値を生成するビット調整部と、
前記第2の量子化値に前記所定の整数kd を乗じることによって前記調整済みの周波数成分を生成する逆量子化部と、
を含む、電子透かしの埋め込み装置。 - 透かし情報を原一次元データに埋め込むためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
特定の絶対値を有する正負の値を不規則的に取る特定の正負系列と、前記原一次元データと、を乗算する演算と等価な演算を行うことによってスペクトル拡散を実行し、これによって、第1の拡散一次元データを生成するスペクトル拡散機能と、
前記第1の拡散一次元データに関して直交変換を行う直交変換機能と、
前記直交変換で得られた変換係数の特定の周波数成分の値を、前記透かし情報と対応付けるように調整する埋め込み機能と、
前記調整済みの周波数成分を逆直交変換することによって、第2の拡散一次元データを生成する逆変換機能と、
前記特定の正負系列を用いて前記第2の拡散一次元データをスペクトル逆拡散することによって、前記透かし情報が埋め込まれた電子透かし一次元データを生成する逆拡散機能と、
をコンピュータに実現させるためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。 - 透かし情報が埋め込まれた電子透かし一次元データを記録したコンピュータ読み取り可能な記録媒体であって、
特定の絶対値を有する正負の値を不規則的に取る特定の正負系列と、前記原一次元データと、を乗算する演算と等価な演算を行うことによってスペクトル拡散を実行し、これによって、第1の拡散一次元データを生成し、
前記第1の拡散一次元データに関して直交変換を行い、
前記直交変換で得られた変換係数の特定の周波数成分の値を、前記透かし情報と対応付けるように調整し、
前記調整済みの周波数成分を逆直交変換することによって、第2の拡散一次元データを生成し、
前記特定の正負系列を用いて前記第2の拡散一次元データをスペクトル逆拡散することによって、前記透かし情報が埋め込まれた電子透かし一次元データを生成する、
ことによって生成された前記電子透かし一次元データを記録したコンピュータ読み取り可能な記録媒体。 - 透かし情報が埋め込まれた電子透かし一次元データから前記透かし情報を抽出する方法であって、
(a)特定の絶対値を有する正負の値を不規則的に取る特定の正負系列と、前記電子透かし一次元データと、を乗算する演算と等価な演算を行うことによってスペクトル拡散を実行し、これによって、第1の拡散電子透かし一次元データを生成する工程と、
(b)前記第1の拡散電子透かし一次元データに関して直交変換を行う工程と、
(c)前記直交変換で得られた変換係数の特定の周波数成分の値から、前記特定の周波数成分の値に対応付けられた前記透かし情報を抽出する工程と、
を備える電子透かしの抽出方法。 - 透かし情報が埋め込まれた電子透かし一次元データから前記透かし情報を抽出する装置であって、
特定の絶対値を有する正負の値を不規則的に取る特定の正負系列と、前記電子透かし一次元データと、を乗算する演算と等価な演算を行うことによってスペクトル拡散を実行し、これによって、第1の拡散電子透かし一次元データを生成するスペクトル拡散部と、
前記第1の拡散電子透かし一次元データに関して直交変換を行う直交変換部と、
前記直交変換で得られた変換係数の特定の周波数成分の値から、前記特定の周波数成分の値に対応付けられた前記透かし情報を抽出するデコード部と、
を備える電子透かしの抽出装置。 - 透かし情報が埋め込まれた電子透かし一次元データから前記透かし情報を抽出するためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
特定の絶対値を有する正負の値を不規則的に取る特定の正負系列と、前記電子透かし一次元データと、を乗算する演算と等価な演算を行うことによってスペクトル拡散を実行し、これによって、第1の拡散電子透かし一次元データを生成するスペクトル拡散機能と、
前記第1の拡散電子透かし一次元データに関して直交変換を行う直交変換機能と、
前記直交変換で得られた変換係数の特定の周波数成分の値から、前記特定の周波数成分の値に対応付けられた前記透かし情報を抽出するデコード機能と、
をコンピュータに実現させるためのコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。 - 透かし情報が埋め込まれた電子透かし一次元データを記録したコンピュータ読み取り可能な記録媒体であって、
特定の絶対値を有する正負の値を不規則的に取る特定の正負系列と、前記電子透かし一次元データと、を乗算する演算と等価な演算を行うことによってスペクトル拡散を実行し、これによって、第1の拡散電子透かし一次元データを生成し、
前記第1の拡散電子透かし一次元データに関して直交変換を行い、
前記直交変換で得られた変換係数の特定の周波数成分の値から、前記特定の周波数成分の値に対応付けられた前記透かし情報を抽出する、
ことによって前記透かし情報が抽出可能な前記電子透かし一次元データを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03049298A JP3986150B2 (ja) | 1998-01-27 | 1998-01-27 | 一次元データへの電子透かし |
IL13747198A IL137471A (en) | 1998-01-27 | 1998-04-01 | Watermark for one-dimensional data |
KR10-2000-7007745A KR100492021B1 (ko) | 1998-01-27 | 1998-04-01 | 전자무늬의 매립 방법과 매립 장치, 추출 방법과 추출 장치, 및 컴퓨터 판독 가능한 기록매체 |
EP98911172A EP1052612B1 (en) | 1998-01-27 | 1998-04-01 | Watermark applied to one-dimensional data |
CNB988133539A CN1173312C (zh) | 1998-01-27 | 1998-04-01 | 电子水印埋入方法和装置 |
PCT/JP1998/001519 WO1999038144A1 (fr) | 1998-01-27 | 1998-04-01 | Filigrane applique a des donnees unidimensionnelles |
AT98911172T ATE329338T1 (de) | 1998-01-27 | 1998-04-01 | Wasserzeichen angewendet auf eindimensionalen daten |
DE1998634841 DE69834841T2 (de) | 1998-01-27 | 1998-04-01 | Wasserzeichen angewendet auf eindimensionalen daten |
US09/619,022 US6425082B1 (en) | 1998-01-27 | 2000-07-19 | Watermark applied to one-dimensional data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03049298A JP3986150B2 (ja) | 1998-01-27 | 1998-01-27 | 一次元データへの電子透かし |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11212463A JPH11212463A (ja) | 1999-08-06 |
JP3986150B2 true JP3986150B2 (ja) | 2007-10-03 |
Family
ID=12305345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP03049298A Expired - Lifetime JP3986150B2 (ja) | 1998-01-27 | 1998-01-27 | 一次元データへの電子透かし |
Country Status (9)
Country | Link |
---|---|
US (1) | US6425082B1 (ja) |
EP (1) | EP1052612B1 (ja) |
JP (1) | JP3986150B2 (ja) |
KR (1) | KR100492021B1 (ja) |
CN (1) | CN1173312C (ja) |
AT (1) | ATE329338T1 (ja) |
DE (1) | DE69834841T2 (ja) |
IL (1) | IL137471A (ja) |
WO (1) | WO1999038144A1 (ja) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3809297B2 (ja) * | 1998-05-29 | 2006-08-16 | キヤノン株式会社 | 画像処理方法、装置及び媒体 |
JP3453122B2 (ja) * | 1998-08-17 | 2003-10-06 | ヒューズ・エレクトロニクス・コーポレーション | 最適性能に近いターボコードインターリーバ |
JP3507743B2 (ja) | 1999-12-22 | 2004-03-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 圧縮オーディオデータへの電子透かし方法およびそのシステム |
JP3567975B2 (ja) | 2000-01-24 | 2004-09-22 | 日本電気株式会社 | 電子透かし検出・挿入装置 |
JP3659321B2 (ja) * | 2000-06-29 | 2005-06-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 電子透かし方法およびそのシステム |
JP5105686B2 (ja) * | 2000-07-27 | 2012-12-26 | アクティヴェィテッド コンテント コーポレーション インコーポレーテッド | ステゴテキスト・エンコーダおよびデコーダ |
WO2002049363A1 (en) * | 2000-12-15 | 2002-06-20 | Agency For Science, Technology And Research | Method and system of digital watermarking for compressed audio |
JP2002244685A (ja) * | 2001-02-22 | 2002-08-30 | Kowa Co | 電子透かしの埋め込みおよび検出 |
US6973574B2 (en) | 2001-04-24 | 2005-12-06 | Microsoft Corp. | Recognizer of audio-content in digital signals |
US6996273B2 (en) * | 2001-04-24 | 2006-02-07 | Microsoft Corporation | Robust recognizer of perceptually similar content |
US7020775B2 (en) | 2001-04-24 | 2006-03-28 | Microsoft Corporation | Derivation and quantization of robust non-local characteristics for blind watermarking |
US7356188B2 (en) * | 2001-04-24 | 2008-04-08 | Microsoft Corporation | Recognizer of text-based work |
US7043050B2 (en) * | 2001-05-02 | 2006-05-09 | Microsoft Corporation | Software anti-piracy systems and methods utilizing certificates with digital content |
WO2002091376A1 (en) * | 2001-05-08 | 2002-11-14 | Koninklijke Philips Electronics N.V. | Generation and detection of a watermark robust against resampling of an audio signal |
JP2003058453A (ja) * | 2001-08-10 | 2003-02-28 | Yamaha Corp | ネットワークサービスシステム、コンテンツ提供サービス装置、および、中継サービス装置 |
US6696989B2 (en) * | 2001-09-17 | 2004-02-24 | Matsushita Electric Industrial Co., Ltd. | Data-update apparatus, reproduction apparatus, data-addition apparatus, data-detection apparatus and data-removal apparatus |
DE60223067T2 (de) * | 2001-10-17 | 2008-08-21 | Koninklijke Philips Electronics N.V. | Vorrichtung zur kodierung von hilfsinformationen in einem signal |
US7546466B2 (en) * | 2002-03-28 | 2009-06-09 | Koninklijke Philips Electronics N.V. | Decoding of watermarked information signals |
WO2003107653A1 (en) * | 2002-06-17 | 2003-12-24 | Koninklijke Philips Electronics N.V. | Lossless data embedding |
JP4576229B2 (ja) * | 2002-06-24 | 2010-11-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 画像認証サインの埋め込み |
FR2854995B1 (fr) * | 2003-05-14 | 2005-07-29 | Nortel Networks Ltd | Modulateur et demodulateur a etalement de spectre |
US7460684B2 (en) | 2003-06-13 | 2008-12-02 | Nielsen Media Research, Inc. | Method and apparatus for embedding watermarks |
US7831832B2 (en) * | 2004-01-06 | 2010-11-09 | Microsoft Corporation | Digital goods representation based upon matrix invariances |
US7770014B2 (en) * | 2004-04-30 | 2010-08-03 | Microsoft Corporation | Randomized signal transforms and their applications |
AU2005270105B2 (en) | 2004-07-02 | 2011-03-31 | Nielsen Media Research, Inc. | Methods and apparatus for mixing compressed digital bit streams |
EP1703460A1 (en) * | 2005-03-18 | 2006-09-20 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for encoding and decoding symbols carrying payload data for watermarking an audio or video signal |
US20070076869A1 (en) * | 2005-10-03 | 2007-04-05 | Microsoft Corporation | Digital goods representation based upon matrix invariants using non-negative matrix factorizations |
WO2008045950A2 (en) | 2006-10-11 | 2008-04-17 | Nielsen Media Research, Inc. | Methods and apparatus for embedding codes in compressed audio data streams |
US8148385B2 (en) * | 2006-10-31 | 2012-04-03 | Janssen Pharmaceutica N.V. | Substituted [1,2,3] triazolo[4,5-d]pyrimidine derivatives as ADP P2Y12 receptor antagonists |
US8494903B2 (en) | 2007-03-16 | 2013-07-23 | Activated Content Corporation | Universal advertising model utilizing digital linkage technology “U AD” |
US7965838B2 (en) * | 2007-11-30 | 2011-06-21 | Faraday Technology Corp. | Watermark generating circuit and related method thereof |
CA2958360C (en) | 2010-07-02 | 2017-11-14 | Dolby International Ab | Audio decoder |
US8930182B2 (en) * | 2011-03-17 | 2015-01-06 | International Business Machines Corporation | Voice transformation with encoded information |
US9620133B2 (en) * | 2013-12-04 | 2017-04-11 | Vixs Systems Inc. | Watermark insertion in frequency domain for audio encoding/decoding/transcoding |
US20220206884A1 (en) * | 2020-12-30 | 2022-06-30 | Genesys Telecommunications Laboratories, Inc. | Systems and methods for conducting an automated dialogue |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69636084T2 (de) * | 1995-09-28 | 2006-09-14 | Nec Corp. | Verfahren und Vorrichtung zum Einfügen eines Spreizspektrumwasserzeichens in Multimediadaten |
US6061793A (en) * | 1996-08-30 | 2000-05-09 | Regents Of The University Of Minnesota | Method and apparatus for embedding data, including watermarks, in human perceptible sounds |
US6226387B1 (en) * | 1996-08-30 | 2001-05-01 | Regents Of The University Of Minnesota | Method and apparatus for scene-based video watermarking |
US5809139A (en) * | 1996-09-13 | 1998-09-15 | Vivo Software, Inc. | Watermarking method and apparatus for compressed digital video |
US6037984A (en) * | 1997-12-24 | 2000-03-14 | Sarnoff Corporation | Method and apparatus for embedding a watermark into a digital image or image sequence |
US6208745B1 (en) * | 1997-12-30 | 2001-03-27 | Sarnoff Corporation | Method and apparatus for imbedding a watermark into a bitstream representation of a digital image sequence |
US6192139B1 (en) * | 1999-05-11 | 2001-02-20 | Sony Corporation Of Japan | High redundancy system and method for watermarking digital image and video data |
-
1998
- 1998-01-27 JP JP03049298A patent/JP3986150B2/ja not_active Expired - Lifetime
- 1998-04-01 DE DE1998634841 patent/DE69834841T2/de not_active Expired - Lifetime
- 1998-04-01 AT AT98911172T patent/ATE329338T1/de not_active IP Right Cessation
- 1998-04-01 WO PCT/JP1998/001519 patent/WO1999038144A1/ja active IP Right Grant
- 1998-04-01 CN CNB988133539A patent/CN1173312C/zh not_active Expired - Fee Related
- 1998-04-01 EP EP98911172A patent/EP1052612B1/en not_active Expired - Lifetime
- 1998-04-01 IL IL13747198A patent/IL137471A/en not_active IP Right Cessation
- 1998-04-01 KR KR10-2000-7007745A patent/KR100492021B1/ko not_active IP Right Cessation
-
2000
- 2000-07-19 US US09/619,022 patent/US6425082B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
ATE329338T1 (de) | 2006-06-15 |
KR100492021B1 (ko) | 2005-05-31 |
WO1999038144A1 (fr) | 1999-07-29 |
US6425082B1 (en) | 2002-07-23 |
KR20010034132A (ko) | 2001-04-25 |
EP1052612A1 (en) | 2000-11-15 |
EP1052612B1 (en) | 2006-06-07 |
IL137471A (en) | 2004-07-25 |
DE69834841T2 (de) | 2007-01-04 |
DE69834841D1 (de) | 2006-07-20 |
JPH11212463A (ja) | 1999-08-06 |
EP1052612A4 (en) | 2002-09-18 |
CN1284192A (zh) | 2001-02-14 |
IL137471A0 (en) | 2001-07-24 |
CN1173312C (zh) | 2004-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3986150B2 (ja) | 一次元データへの電子透かし | |
US8474059B2 (en) | Apparatus and method for embedding and extracting information in analog signals using distributed signal features and replica modulation | |
JP4251378B2 (ja) | アナログ信号への情報の埋込みおよび抽出を分布信号特徴を用いて行なう装置および方法 | |
Dhar et al. | Blind SVD-based audio watermarking using entropy and log-polar transformation | |
US7668673B2 (en) | Data watermarks created by using an uneven sampling period | |
KR20010012707A (ko) | 분산 신호 특징을 이용하여 아날로그 신호안에 정보를삽입 및 추출하는 장치 및 방법 | |
JP2007171933A (ja) | オーディオ信号処理装置及び方法 | |
Wang et al. | A new audio watermarking based on modified discrete cosine transform of MPEG/audio layer III | |
JP2005513543A (ja) | マルチメディア信号のqimデジタルウォーターマーキング | |
Hemis et al. | Adjustable audio watermarking algorithm based on DWPT and psychoacoustic modeling | |
Li et al. | An audio watermarking technique that is robust against random cropping | |
JP2002244685A (ja) | 電子透かしの埋め込みおよび検出 | |
Khalil et al. | Informed audio watermarking based on adaptive carrier modulation | |
Cichowski et al. | Analysis of impact of audio modifications on the robustness of watermark for non-blind architecture | |
KR20010104817A (ko) | 컬러 이미지 워터마크를 이용한 디지털 오디오 워터마킹방법 및 장치 | |
KR20000018063A (ko) | 웨이브렛 변환의 분해 특성을 이용한 오디오 워터마크 방법 | |
Horvatic et al. | Robust audio watermarking: based on secure spread spectrum and auditory perception model | |
Ketcham et al. | An algorithm for intelligent audio watermaking using genetic algorithm | |
KR20020079242A (ko) | 시간축 공격에 강인한 오디오 워터마크 삽입 및추출방법과 그 장치 | |
Bhowal et al. | A Steganographic Approach to Hide Information in Audio Signal using Discrete Wavelet Transforms. | |
Salah et al. | Survey of imperceptible and robust digital audio watermarking systems | |
Garlapati et al. | A symbol based watermarking approach for spread spectrum audio watermarking methods | |
GB2365296A (en) | Encoder/decoder for watermarking a covertext signal | |
KR20020053980A (ko) | 오디오 워터마크 삽입 장치 및 그 방법과 그의 검출 장치및 그방법 | |
Xu et al. | Digital Audio Watermarking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070612 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070710 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100720 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100720 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130720 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |