JP2004515799A

JP2004515799A - ステゴテキスト・エンコーダおよびデコーダ

Info

Publication number: JP2004515799A
Application number: JP2002515737A
Authority: JP
Inventors: セウェル，ロジャー，フェイン; オウエン，マーク，セント．ジョン; バーロウ，ステファン，ジョン; ロング，サイモン，ポール
Original assignee: アクティヴェィテッドコンテントコーポレーションインコーポレーテッド
Priority date: 2000-07-27
Filing date: 2001-07-27
Publication date: 2004-05-27
Anticipated expiration: 2021-07-27
Also published as: ATE293316T1; JP5105686B2; EP1305901A2; US20080152128A1; WO2002011326A2; CA2417499A1; US20090190755A1; US7917766B2; US7916862B2; US7298841B2; DE60110086D1; AU2001275712A1; DE60110086T2; US20040028222A1; WO2002011326A3; EP1305901B1

Abstract

本発明はステゴテキストをエンコードするエンコーダと、エンコードされたステゴテキストをデコードするためのデコーダとからなっており、ステゴテキストは、少なくとも１つのキーでカバーテキスト信号の対数パワー・スペクトログラムを変調することによって生成され、上記キーまたは各キーは、ステゴテキストがそれによって生成された電子透かしコードのデータに従って対数領域でカバーテキストのパワー・スペクトログラムに加算または減算され、変調されたパワー・スペクトログラムはカバーテキストの元の領域へと戻されたものである。デコーダは、高速フーリエ変換、および方形極変換を実行し、それによってステゴテキスト信号を対数パワー・スペクトログラム領域に変換し、対数パワー・スペクトログラム領域で対数パワー・スペクトログラムのブロックからキー（単数または複数）の正と負の倍数を減算し、所定の統計モデルに従って、かつカバーテキストの未補正ブロックを表すこのような減算の結果の確率を評価する。

Description

【０００１】
本発明は、アナログ信号またはデジタル信号の電子透かし処理（ｗａｔｅｒｍａｒｋｉｎｇ：ウォーターマーキング）に関する。信号はビデオ信号またはデータ信号でもよいが、本発明は、それに限られるものではないが、特にオーディオ信号の電子透かし処理に関するものであることを理解されたい。
【０００２】
「電子透かし」という用語は、加算されたデータが主信号の主目的に影響を及ぼさないように、主信号にデータを加算する手順を対象として含むことを意味する。主信号は「カバーテキスト」と呼ばれることが多く、加算された電子透かしデータを含む信号は「ステゴテキスト」と呼ばれることが多い。このようにオーディオ信号の場合は、ステゴテキストが再生される際に、ステゴテキストに加算データが存在することは聴き手には事実上知覚できないように意図されている。しかし、ステゴテキストに加算データが存在することによって、ユーザが適宜のデコード装置を持っている場合は、カバーテキストの基点を識別できる。ユーザの装置に適宜の回路が備えられていれば、復元された電子透かしデータがその装置と適合しない場合は、ユーザが元のカバーテキスト信号に含まれている主データを再生できないようにし得る。加えて、ユーザがカバーテキストを再生できなければならない。
【０００３】
このような技術は明らかに音楽のレコーディングに関して大きな可能性を有している。その結果、ステゴテキストを聴く権利がある者が、加算されたコード化データにより生じたスプリアス・サウンドによって楽しみを損なわれないように、オーディオ信号に電子透かし処理を施すという課題に相当な努力が払われてきた。
【０００４】
一方では、記録され、伝送されたオーディオ素材に施されることができる様々な種類の従来の信号処理の後に有効であり、かつ加算されたコード化データを除去または無効にする直接的な試みに対して抗することができるほど充分に、電子透かしが頑強であることが重要である。
【０００５】
アナログ信号に電子透かし処理を行う装置と方法は国際特許明細書ＷＯ９８／５３５６５号に記載されており、この明細書は電子透かし信号に使用されてきたいくつかの技術を開示している。
【０００６】
先行して公刊されたこの明細書で提案されている１つの電子透かし処理方法には、オーディオ信号の短期の自己相関関数を算定し、その後、聴きにくく、ある特定の遅延（単数または複数）を経て短期の自己相関関数の値を変更する加算信号を付加し、それによって低速度でデータを伝える特定の波長を生成することが含まれている。この波長へのデータの実際の変調は、いくつかの適宜の変調技術のいずれかを用いて行うことができる。装置の受信端末で電子透かし読み取り器（すなわちデコーダ）がステゴテキストの短期の自己相関関数を算定し、用いた変調技術に適した復調を施す。読み取り器が自己相関関数を変調するために最初に用いられたデータを利用できれば、加算されたコード化データをステゴテキストから除去することができる。
【０００７】
しかし、多くのオーディオ信号の短期の自己相関関数は、基本音声のサウンドを変更することなく任意の長さを遅延を経てゼロに任意に近づくように容易に変更することができる。したがって、比較的簡単に電子透かし処理された信号を侵害して、電子透かし処理の効果が無効になるようにすることができる。
【０００８】
本発明は上記の欠点がない電子透かし処理システムを提供し、かつ電子透かし処理された信号をデコードするデコーダを提供することに関するものである。
【０００９】
本発明の第１の態様では、カバーテキスト信号をエンコードしてステゴテキストを生成するためのエンコーダであって、
カバーテキスト信号の高速フーリエ変換および方形極変換を実行するための第１の変換手段であって、それによりカバーテキスト信号を対数パワー・スペクトログラムへと変換する、第１の変換手段と、
一つのキーまたは各キーが所定サイズの二次元パターンの形式である少なくとも１つのキーを供給する手段と、
対数パワー・スペクトログラム領域内でキーの倍数を、または複数のキーがある場合には１つまたは複数のキーの倍数を、変換されたカバーテキスト信号のブロックに加算または減算するマルチプライアと、
所望のコードを表すデータに従ってマルチプライアによるキー（単数または複数）の加算または減算を制御する手段と、
変調されたカバーテキスト信号の極方形変換および逆高速フーリエ変換を実行するための第２の変換手段であって、それによりステゴテキストを生成する、第２の変換手段と、を備えたエンコーダが提供される。
【００１０】
本発明の第２の態様では、カバーテキスト信号をエンコードしてステゴテキストを生成する方法であって、
カバーテキスト信号の高速フーリエ変換および方形極変換を実行することであって、それによりカバーテキスト信号をパワー・スペクトログラム領域へと変換する、実行することと
一つのキーまたは各キーが所定サイズの二次元パターンの形式である少なくとも１つのキーを供給することと、
対数パワー・スペクトログラム領域内でキーの倍数を、または複数のキーがある場合には１つまたは複数のキーの倍数を、変換されたカバーテキスト信号のセグメントに加算または減算することと、
所望のコードを表すデータに従って加算／乗算ステップでキー（単数または複数）の倍数の加算または減算を制御することと、
変調されたカバーテキスト信号の極方形変換および逆高速フーリエ変換を実行することであって、それによりステゴテキストを生成する、実行することと、を含む方法が提供される。
【００１１】
本発明の第３の態様では、カバーテキスト信号の対数パワー・スペクトログラムを、１つのキーまたは各キーの倍数が、それによってステゴテキストが生成された電子透かしコードに従って対数領域でカバーテキスト・パワー・スペクトログラムに加算または減算された少なくとも１つのキー（Ｋ）で変調し、かつ変調されたパワー・スペクトログラムをカバーテキストの元の領域に戻すことによって生成されたステゴテキストをデコードするデコーダであって、ステゴテキスト信号の高速フーリエ変換および方形極変換を実行する変換手段であって、それによりステゴテキスト信号を対数パワー・スペクトログラム領域に変換する、変換手段と、元のカバーテキスト信号の対数パワー・スペクトログラムがそれによってエンコードされたキー（単数または複数を）を供給する手段と、対数パワー領域で対数パワー・スペクトログラムのブロックからキー（単数または複数）の正と負の倍数を減算し、かつ所定の統計モデルに従ってカバーテキストの未修正ブロックを表す上記減算の結果の確率を評価するための計算手段と、計算手段の出力からエンコードされたデータを復元する抽出手段と、を備えたデコーダが提供される。
【００１２】
本発明の第４の態様では、カバーテキスト信号の対数パワー・スペクトログラムを、１つのキーまたは各キーの倍数が、それによってステゴテキストが生成された電子透かしコードのデータに従って対数領域でカバーテキスト・パワー・スペクトログラムに加算または減算された少なくとも１つのキー（Ｋ）で変調し、かつ変調されたパワー・スペクトログラムをカバーテキストの元の領域に戻すことによって生成されたステゴテキストをデコードする方法であって、ステゴテキスト信号の高速フーリエ変換および方形極変換を実行することであって、それによりステゴテキスト信号を対数パワー・スペクトログラム領域に変換する、実行することと、元のカバーテキスト信号の対数パワー・スペクトログラムがそれによってエンコードされたキー（単数または複数を）を供給することと、対数パワー領域で対数パワー・スペクトログラムのブロックからキー（単数または複数）の正と負の倍数を減算し、かつ所定の統計モデルに従ってカバーテキストの未修正ブロックを表す上記減算の結果の確率を評価することと、計算手段の出力からエンコードされたデータを復元することと、を含む方法が提供される。
【００１３】
本発明の第４の態様では、請求項４５に記載の電子透かしキー・ジェネレータが提供される。
【００１４】
本発明をより良く理解できるように、ここで添付図面を参照するとともに本発明の実施形態を例をあげて説明する。
【００１５】
ここで図１を参照すると、基本システムはキー・ジェネレータ（１）と、エンコーダ（２）と、デコーダ（３）とから構成されている。キー・ジェネレータ（１）は（１’）で入力された整数シード値に基づいて疑似ランダム・キーを生成する。デコーダ（２）はステゴテキストを生成するためにキーを用いて、データを有するカバーテキストとして（４）で入力された音楽ファイルをマーキング（ｍａｒｋ：電子透かし処理）する。データは（２’）でエンコーダ（２）へと入力される。伝送線（５）を経てステゴテキストを受信したデコーダ（３）は、この場合もキーを用いてマーキングされたファイルからデータをリードバックし、復元されたデータを（６）で出力する。データが適正にリードバックされたことを確実にするために、エンコード動作とデコード動作には同じキーを用いなければならない。このキーは勿論、必要な場合にシードから再生可能なので、シード値はマーキングされたファイルをデコードするのに必要な全ての値である。伝送線（５）は勿論、広範の多様な形式をとることができる。したがって、ステゴテキストは任意の適宜の媒体に記録し、または無線、ファイバー・ケーブル等によって伝送することができよう。以下ではマーキングされないファイルはどれもカバーテキストと呼び、電子透かし処理されたファイルはステゴテキストと呼ぶ。この実施形態は音楽で使用することに関連して説明するが、記載される技術および装置は音声またはビデオ・データのような音楽ではない場合にも利用できることが理解されよう。
【００１６】
添付図面の図２は本発明によるより詳細な実施形態のブロック図を示している。この図ではカバーテキストは（１０）で示されたマーキングされていないオーディオ・ファイルである。このオーディオ・ファイルの音源は１０’で示されている。これはライブ・イベントをピックアップする、テープまたはディスクのようなレコーディング媒体、またはラジオまたはインターネットで伝送された信号であってよい。このオーディオ・ファイルはエンコーダ（２）に入力され、回路（１１）においてパワー・スペクトログラムへと変換される。この変換の理由は以下のようである。情報をステゴテキストの位相成分で伝えることは不可能である。人間の耳は基本的に位相には敏感ではなく、これはある圧縮アルゴリズムによって引き出されたものである。したがって、位相に依存する電子透かし処理技術は圧縮に対し頑強であるとは考えられない。その上、オーディオ・ファイルにランダムな「グループ遅延」を加えることによって、その周波数成分の位相にスクランブルをかけ、オーディオ・ファイルを処理することができる。計算上集約的ではないこのような処理は一般に、オーディオ・ファイル内にある何らかの特定の波形を破壊する。したがって、時間領域形式の信号上の波形に依存する電子透かしは、この処理によって読み取り不能にすることができる。
【００１７】
したがって本発明では、カバーテキストのパワー・スペクトログラムを利用してカバーテキストの電子透かし処理を行うことが提案される。このようにして、カバーテキスト内の各々の周波数成分の大きさだけが修正され、各周波数成分の位相はマーキング処理を通して保存される。位相情報はデコーダで廃棄される。ここでこの手順を詳細に説明する。
【００１８】
カバーテキストのパワー・スペクトログラムを計算するために、カバーテキストは長さの半分だけ重複するブロック２Ｙサンプルの長さに分割される。このようにして、Ｙのサンプルごとに新たなブロックが始まる。記載のようにサンプル率ｆ_ｓ＝４４１００Ｈｚのオーディオ・ファイル用に設計されているこの実施形態では、Ｙは１０２４に設定される。
【００１９】
各ブロックは分析ウインドウとして知られているウインドウ関数で乗算され、ウインドウモードにされた（ｗｉｎｄｏｗｅｄ）ブロックのフーリエ変換が計算される。ウインドゥ関数の目的は、サンプル値がブロックのいずれかの終端でゼロの方向に漸減し、不連続性の回避を確実にすることである。フーリエ変換はブロックを周期的な関数の反復ユニットとして処理する。ウインドウモードにされたブロックは実際のサンプルから構成されているので、そのフーリエ変換は正と負の周波数に対して共役対称である。負の周波数成分は付加的な情報を伝えず、したがって廃棄することができる。
【００２０】
各フーリエ係数は、その大きさが対応する周波数成分の振幅を表し、その引き数が位相を表す複素数である。位相情報が廃棄されると、残るのは信号のパワー・スペクトルである。厳密な意味では、パワー・スペクトルは各フーリエ係数の大きさを二乗することによって得られる。
【００２１】
いくつかの連続するパワー・スペクトルが互いに横並びに配列されると、数値の格子が形成される。一般には垂直である一方の軸は周波数を表し、一般には水平であるもう一方の軸は時間を表す。この格子がオーディオ・サンプルのパワー・スペクトログラムである。図３は音楽の一節から取り出されたパワー・スペクトログラムの例を示している。この図では、格子内の数値は様々な濃淡として示されている。−８から３までの右側の列は、スペククトログラムを評価できるようにするため、スペクトログラムの輝度レベルを突き合わせる（ｍａｔｃｈ）ことができるスケールである。
【００２２】
Ｙを選択することでスペクトログラムの分解能が決まる。周波数方向では分解能はｆ_ｓ／２Ｙであり、時間方向では分解能はＹ／ｆ_ｓである。この実施形態では、これらの値はそれぞれ２１．５ヘルツと２３．２ｍｓである。図３の軸はこれらの単位で測定される。
【００２３】
そのパワー・スペクトログラムからオーディオ波形を充分良好に再構成することは困難であるように思われるが、位相情報が保持されていれば可能である。スペクトログラム・データは逆フーリエ変換で時間領域に戻され、以前と同じようにして重複され、互いに加算されることができる。
【００２４】
そこからスペクトログラムが得られるカバーテキストを電子透かし処理するために、スペクトログラムへの修正が少なく、かつ元の位相情報が保持されている限りは、前述の方法によって満足できるオーディオ波形を再現できることが判明している。再構成された時間−領域セグメントは何れかの端部でゼロまで漸減することはもはや保証されず、したがって、合成ウインドウが前述のように互いに加算されて、セグメントがウインドウモードにされると、最終的な波形の主観的なクオリティが高まることに注目するべきである。分析および合成ウインドウは、システムを通して全体的な振幅変調がないよう確実にするように選択されなければならない。この実施形態では、これらのウインドウはそれぞれ二乗余弦関数の平方根である。
【００２５】
図２では、スペクトログラムの変調はエンコードされる予定のビット・ストリームに応答して、全体的に（１２）で示された回路で行われる。
【００２６】
最後にブロック（２）で、回路（１３）は変調されたパワー・スペクトログラムを時間領域に戻し、これらをステゴテキストに変換するために合成する。図２では、ステゴテキストは１５で示されている。
【００２７】
デコーダ（３）はステゴテキストを対数スペクトログラムに変換するための回路（１６）と、キーを用いて対数スペクトログラムを相関することで、回路（１８）で電子透かしコードを表し、（１９）で出力されるビット・ストリームを抽出するようにする回路（１７）とを備えている。
【００２８】
可聴効果を伴わずにオーディオ信号のパワー・スペクトログラムの要素が変調される範囲は、その元のレベルとほぼ比例することが判明している。したがって、デシベル・タームで一定量までパワー・スペクトログラムへの加算または減算を行ってもよい。知覚できる変調の量は聴く環境に左右されるが、標準的には約１ｄＢである。したがって、この実施形態では、電子透かし処理プロセスは「対数パワー・スペクトログラム領域」で実行され、キー・ジェネレータ１によって生成されたキー、および電子透かしとしてエンコードすべきデータに従ってパワー・スペクトログラムに加算または減算を行うことからなっている。
【００２９】
より大きいスペクトログラム要素に、より大幅に変調を加えることができるので、これらの要素によって伝えられる情報は、振幅がより小さい要素の場合よりもノイズに対する感度が低くなる。しかし、これらの要素が何であるかを予め知ることは不可能である。したがって、記載している電子透かし処理は、カバーテキストが情報を伝えるために利用できるどのような要素をも引き出せるように備えられている。このように、この実施形態では回路１２内の各スペクトログラム要素は、電子透かしの情報伝達能力を最大限にするように変調される。したがって、電子透かし内の各データ・ビットはスペクトログラムの領域で変調パターンを誘発する。変調パターンは一面では「１」ビットをエンコードするために適用され、他面では「ゼロ」ビットをエンコードするために適用される。ビットは規則的な間隔で、すなわちスペクトログラム内の規則的な水平間隔Ｔでエンコードされる。
【００３０】
オーディオ・ファイルのサイレント部分のように電子透かしを隠すことができない短いセグメントがカバーテキストにあることもある。したがって、各データ・ビットができるだけ長くステゴテキストの部分に作用することが必須である。この実施形態では、この課題に対して２つのアプローチを用いている。
【００３１】
添付図面の図４はこれらのアプローチの１つをグラフで示している。このアプローチでは、スペクトログラム変調パターンは隣接するビットについて重複している。図４では各方形Ｋは変調パターンのコピーを表している。各スペクトログラム変調パターンＫは幅がＸの時間単位であり、高さがＹの周波数単位である。Ｙはスペクトログラムの全高である。この実施形態ではＸは３２であり、Ｔ＝５である。したがって、カバーテキストのパワー・スペクトログラムの最初の３２列幅のブロックが同じサイズのキーによって変調され、次にキーがＴ（５列）だけステップされると、カバーテキストの最初の５列は、対応する５列のキーによって変調されるに留まる。変調の次の繰り返しでは、カバーテキストの６列〜３７列までがキーによって変調されるので、６列〜３２列は二回変調されたことになる。三回目の繰り返しでは、最初のブロックの６列〜１０列までが二重の変調だけに留まるが、１１列〜３２列は３回変調され、一方、３３列〜３７列までは２回目の変調がなされ、３８列〜４２列までは最初の変調がなされる。このシーケンスがカバーテキストの長さ全体にわたって繰り返される。勿論、ＸとＴの値は広い範囲にわたって異なる。例えばＸは２５６でよく、Ｔは１０であってよい。
【００３２】
第２のアプローチは、依然として適時に各ビットの効果を広げるためにメッセージ・ビットにエラー補正コードを適用するものである。
【００３３】
図５に示した畳込みエンコーダは、より長いキーを用いた場合と比較してデコーダ内でのメモリの必要性を減らすように、音楽の長い部分にわたって各入力ビットの効果を広げるために用いられる。エンコードすべきデータ・ストリームは線（３０）上でシフトレジスタに入力され、このレジスタはこの実施形態では３個のＤ形フリップフロップ（３１、３２、および３３）から構成されている。クロック（ｃｌｋ／２）は線（３４）上で供給される。クロック速度（ｃｌｋ）でフリップされる出力スイッチ（３５）は、３個のフリップフロップによって形成されたシフトレジスタ内でビットの１つまたは２つの排他的ＯＲ結合のいずれかを選択するように、一対の排他的ＯＲゲート（３６、３７）の出力に接続される。この実施例では、上部の排他的ＯＲゲート（３６）がシフトレジスタの３つのビットの全てに接続され、下部のゲート（３７）がビット０とビット２に接続される。このエンコーダは二次元マトリクス〔１１１；１０１〕によって規定され、ただしマトリクスの最初の行は上部の排他的ＯＲゲートに対するシフトレジスタの接続に対応し、第２の行は下部の排他的ＯＲゲート（３７）に対する接続に対応する。接続のパターンはセット｛０，１｝からの係数を有する多項式の形式で表すことができる。この場合は、多項式はＸ^２＋Ｘ＋１（ゲート３６）とＸ^２＋１（ゲート３７）である。
【００３４】
このエンコーダでは、各入力ビットは連続する６つの出力ビット（マトリクス内のエントリの総数）に作用し、出力ビット速度は入力ビット速度の２倍である（マトリクス内の行数）。このようなコードは「速度１／２コード」と呼ばれる。マトリクスの各行内のエントリ「ジェネレータ多項式」は伸張にに選択されなければならない。この実施形態では、速度が整数の逆数であるコードだけを用いることができる。この制約の理由は、この実施形態で用いられるエンコーダの種類によるだけであり、他の関連性はないことを理解されたい。したがって、他の形式のエラー補正コーディングを用いる必要があった場合は、上記の制約は必ずしも該当しない。出力に不変のままに送られる識別コードはマトリクス〔１〕によって指定される。
【００３５】
コードが「畳み込み」と呼ばれる理由は、以下のような畳み込み関数を用いて実施できるからである。入力されたデータ・ビットにはまずコード速度に従ってゼロが挿入される。例えば、元のデータが（１０１１）であるものと想定する。（１０００１０１）を得るためにこのデータにはゼロが挿入されるので、このデータはその時点で元の速度の半分である。単一の行として書き込まれた上記のエンコーダ・マトリクスである（１１１０１１）をこれらのデータに畳み込むと、（１１１０２２２１２１１１）となる。（１１１００００１０１１１）であるモジュロ−２を採用する。モジュロ−２演算はエンコーダ内で排他的ＯＲゲート（３６および３７）の機能を果たす。このように、４ビットのシーケンスが１２ビット・コード語にエンコードされたことになる。一般に、ｎビットのシーケンスは（２ｎ＋４）−ビット・コード語へとエンコードされる。
【００３６】
畳み込みコードについて説明してきたが、その他の多くの種類の適宜のエラー補正コードを利用できることが理解されよう。このようなコードにはＲｅｅｄ−Ｓｏｌｏｍｏｎコード、ＢＣＨコード、Ｇ０ｌａｙコード、Ｆｉｒｅコード、Ｔｕｒｂｏコード、Ｇａｌｌａｇｈｅｒコード、およびＭａｃｋａｙ−Ｎｅａｌコードが含まれる。
【００３７】
畳み込みエンコードの前に同期化エンコードが実行される。したがって、エンコードされたデータ・ビットのストリームに同期化フラグが挿入される。このようにして、エンコードされたビット・ストリームの同期化はこれに開始フラグを挿入することによって達成される。フラグ・パターンは５つの「１」が後に続く「０」である。それ以外ではデータ・ストリーム内にこのパターンが発生しないことを確実にするため、４つの「１」のどのシーケンスの後にも追加のゼロ・ビットが挿入される。これは、「ゼロ詰め込み（ｚｅｒｏｓｔｕｆｆｉｎｇ）」として知られている。詰め込まれたゼロはデコーダによって除去される。この手順によって、開始フラグあたり６ビット＋ちょうど３％を超えるデータ速度の全体的な低下というペナルティが生ずる。これの代わりに多くの代替方法が可能であることが当業者には理解されよう。
【００３８】
ここで図６に戻ると、この図は、説明したばかりの２つのプロセスをどのようにエンコーダに組込むかを示している。したがって、この場合も（１０）はエンコードすべきカバーテキストを示し、Ｋは現在処理中の電流ウインドウを示し、Ｋ−１は以前のウインドウを示している。マルチプライヤ（４１）で、抽出されたウインドウＫは分析フインドウ関数（４２）で乗算されるので、抽出されたウインドウはその各々の端部で漸減する。回路（４３）では、分析ウインドウ関数によって修正された抽出済みのウインドウの高速フーリエ変換が達成される。必要なパワー・スペクトログラムを生成するために、回路（４４）で方形極変換が行われる。このパワー・スペクトログラムは、既に述べたように回路（４５）で修正され、この回路はスペクトログラムの位相成分が不変のままである、図２の回路１２に対応している。
【００３９】
ステゴテキストの生成を完了するために、極方形変換が回路（４６）で行われる。逆高速フータエ変換が回路（４７）で行われ、かつ合成ウインドウ関数（４８）を用いて、（４９）で逆高速フーリエ変換回路（４７）の出力を乗算する。最後に、重複したウインドウが（５０）で加算されて、（１５）に示したステゴテキストが作成される。
【００４０】
いくつかの異なる電子透かしを利用できるようにすることが望ましいことが理解されよう。基本的に、いくつかの異なる電子透かしを使用することが可能であることによって、どの透かしを使用すべきかの知識がなければ、侵害者が隠されたメッセージをデコード、除去、または偽造することは著しく困難になる。
【００４１】
この実施形態では、「キー」という用語は特定数の同系統の電子透かしを表すために用いられている。この実施形態の場合も、キーは疑似ランダムに生成され、いずれか１つのキーはシードとして用いられる単一の整数によって定められる。これは図１に示したシード入力である。
【００４２】
この実施形態では、キーはスペクトログラム変調値のアレイＫ（ｔ，ｆ）であり、ｔとｆは整数指数であり、−１≦Ｋ（ｔ，ｆ）≦＋１である。Ｋ（ｔ，ｆ）は、Ｈ−ｘ／２≦ｔ＜ｘ／２および０≦ｆ＜Ｙの範囲外ではゼロになるように定義されている。カバーテキストのスペクトログラムをＧ（ｔ，ｆ）とし、ステゴテキストのスペクトログラムをＨ（ｔ，ｆ）とする。ｄ_ｉはエンコードすべきデータ・ビットを表すものとする。ただし、ｄ_ｉは（０または１ではなく）±１である。簡略にするため、エラー補正コーディングは無視するものとする。したがってエンコーディング・アルゴリズムは下記によって得られる：
【００４３】
【数３】

【００４４】
したがって、分岐切断の適切な選択が得られる。
【００４５】
【数４】

【００４６】
ただし、ｓはエンコーディング強度を定める実定数である。方程式（１）および（２）では、ＧとＨは複素数であるが、Ｋは実数である。したがって、方程式（１）では、ａｒｇＨ＝ａｒｇＧとなる。したがって電子透かしはパワー・スペクトル内でエンコードされ、元のスペクトル成分の位相が保存される。
【００４７】
キーの設計は侵害に対して頑強なステゴテキストの生成の際に最も重要であることが理解されよう。ここで、キーを設計するための考慮事項を詳細に説明する。
【００４８】
ホワイト・ノイズ・パターンだけから構成され、キー内の各々のセルが独立し、かつ全く同一に分布しているキーは、多くの理由から魅力あるものである。これは計算上生成し易く、最大可能な情報伝達能力を有している。一般に、これはカバーテキストとの相関性は低く、単一の狭い自己相関ピークを有している。実験により、これはオーディオ・ファイルの多岐にわたる改ざん（ｍａｎｉｐｕｌａｔｉｏｎ）に対して頑強であり、しかも聴こえないような充分に低い強度でエンコードされることが判明している。しかし、個々の行がランダムに左右シフトされる、スペクトログラムへのグループ遅延侵害を用いてステゴテキストを改ざんすることによって、既に得られたスペクトログラム分解能により、行を１列以上シフトするようにグループ遅延パラメータを配列することができる。これによってステゴテキストとキーとの間にある何らかの相関性が破壊される。ステゴテキストの知覚的に満足できる構造と、あらゆる形式の上記のグループ遅延侵害に対して頑強であることが同時に得られるスペクトログラム分解能を選択することは不可能であるように思われる。
【００４９】
更に、全ての周波数が例えば５％（１半音未満）だけ上昇し、テキストが同じ係数だけ時間的に短縮されるようにステゴテキストをリサンプルすることが可能である。スペクトログラムに及ぼすこの作用は、スペクトログラムを垂直方向に拡大し、水平方向に縮小することである。この手順は図７にグラフで示されており、ただし１５Ａは元のステゴテキストを表し、１５Ｂは変更されたステゴテキストである。セルのうちで依然として符合するのは極めて少ないことが分かる。周波数軸に沿って、ｆ≧２０であるセルはセルの以前の位置とは全く重複しない。この場合も相関関数は破壊される。
【００５０】
これらの２つの問題のうちの第１の点、すなわち１つの次元での拡大は、反復する列を含むようにキーを修正することによって解消できる。実験により、各スペクトログラム列を１２回反復すれば、相関関数を破壊するのに必要なグループ遅延が、知覚的に受け入れられない影響をステゴテキストに確実に及ぼすのに充分であることが分かっている。そのための代償は情報伝達能力の低下である。すなわち、キーの自己相関ピークはより広く、かつ低くなり、したがって所定の頑強性を得るのにより高いエンコード強度が必要になる。
【００５１】
第２の問題点は徹底的な探索によって解消できる。相関関数は異なるリサンプリング速度の範囲で評価されることができ、また、最強の相関性を与える相関関数を発見することによって、どのような係数（ｆａｃｔｏｒ：因子）でファイルがリサンプルされたかを判定することができる。残念なことに、ピッチは変化するが、全体的な時間は一定に留まるように、またはピッチは一定に留まるが全体の時間が変化するようにステゴテキストをリサンプルすることが可能である。この後者のプロセスは、例えば一作品の音楽を所定のスロットに正確にフィットさせることが望ましい放送の用途では一般的なものである。したがって、探索するための二次元空間の可能性がある。すなわち、ステゴテキストが周波数および／または時間で任意に拡張された可能性がある。キーが上記のように反復する列を含むように修正されている場合は、自己相関関数は広く、したがって可能性がある時間拡大の範囲は散在的にサンプリングするだけでよいが、それにも関わらず、計算上の負担は大きい。
【００５２】
しかし、本発明はこの問題の解決方法を提供するものである。ある固定的な基点に対する拡張がキーに及ぼす影響を慎重に検討すると、拡張の相対効果はキー全体にわたって一定であることが分かる。これは、変化し、かつ上記の問題点を誘発する絶対的な効果である。この実施形態では、より高い空間周波数が更にフィルタリングされ、基点から除去されるようにキー・パターンが修正される。
【００５３】
以下の説明目的のため、カバーテキスト、ステゴテキスト、およびキーを対数スペクトログラム領域内の画像と見なすことにする。「周波数」とは、これらの画像内の平均空間周波数を意味し、背後にあるオーディオの周波数のことではない。
【００５４】
まず、一次元での問題点を検討する。ｆ（ｔ）を正弦波とし、ｆ（ｔ）＝ｓｉｎ ωｔとする。係数αを押し込むと、ｇ（ｔ）＝ｓｉｎ αωｔとなる。これらの位相角φ＝αωｔ−ωｔ＝ωｔ（α−１）で得られる。適宜に選択されたｔの周囲の間隔で計算された、ｆ（ｔ）とｇ（ｔ）の相関が、ある閾値を超えるものと断言することは位相角φを制約することと等価であるので、｜φ｜＜φ０である。したがって、ｔ：｜ω｜＜φ／（α−１）ｔの項でωは拘束され、もしくは、αが抵抗が必要なほどの最大の拡張であるものと選択される場合は、ある正の定数Ｃについて１／ω＞Ｃ｜ｔ｜である。この関係に照らして、正弦波のタイムスケールτに関して述べる方が簡明である。ただしτ＝１／ωである。
【００５５】
ここで、拡張した場合にそれ自体と相関する関数の周波数内容を指定することが可能である。これはタイムスケールの閾値よりも短いタイムスケールを有する周波数成分を含んでいてはならず（τ＝Ｃ｜ｔ｜）、ただし定数Ｃは所望の拡張抵抗の程度を設定する。このような関数はホワイト・ノイズ信号を適宜にフィルタリングして除去することによって得ることができる。遮断周波数がｔと反比例して変化する低域フィルタが必要である。このようなフィルタを以下では「掃引」フィルタと呼ぶ。
【００５６】
この実施形態で既に説明したように、連続的なデータ・ビットに対応するキーは重複される。キーの１回のコピーによって特定の時点に存在する周波数成分と、以前または後続のコピーによって存在する周波数成分との重複を最小限にするため、キーには高域フィルタも適用される。したがって、全体的な効果は帯域フィルタの効果となる。高域フィルタの遮断周波数は、隣接するキーの低域特性と適合するように掃引される。このことは図８のグラフに示されている。タイムスケールに関して一定である「帯域幅」△は△＝ＣＴで得られ、Ｔはカバーテキストに対するキーの連続的な適用間の間隔である。図９は４つの連続するビットｄ_０、ｄ_１、ｄ_２、およびｄ_３のためのキーのコピーがどのように重複するかを示している。
【００５７】
このような上記の種類の掃引帯域フィルタを、ホワイト・ノイズ信号に適用した結果の例が図１０に示されている。
【００５８】
同様にして、二次元キーも二次元のホワイト・ノイズ・パターンから生成することができる。前述のように変化する特性を有するフィルタは各次元に別個に適用される。フィルタリングの後、−１≦Ｋ（ｔ，ｆ）≦＋１の条件を実現するために、データ値は非線形関数を通過するようにされる。この実施形態では正弦（ｓｉｎｅ）が用いられる。
【００５９】
その結果として生ずるパターンの例が、図１１のパワー・スペクトログラムに示されている。ここでは、軸は「時間」と「周波数」（ここではオーディオ周波数の意である）である。これらは、キーが適用される図３のスペクトログラムの軸と適合している。時間方向での基点はキーの中心にあり、一方、周波数方向での基点は最上部にある。図１１の右側の列は図３のスケール列と同様の機能を有している。
【００６０】
この実施形態はＸ軸に沿ってだけではなく、Ｙ軸に沿っても帯域フィルタによるフィルタリングを適用しているが、キーのコピーはその方向には重複しないので、低域フィルタによるフィルタリングでも充分であろう。帯域フィルタではなく低域フィルタを使用することによってキーの情報伝達能力を高めることができる。
【００６１】
上記の方程式中の定数Ｃの値が増大すると、生成されるキーはより大幅な拡張に耐えるようになる。高域フィルタおよび低域フィルタの特性は互いに類似するようになり、したがってフィルタの帯域幅はより狭くなる。これによってキーの情報伝達能力は低下する。したがって、拡張に対する抵抗と情報伝達能力との間で調整（ｔｒａｄｅｏｆｆ）がなされる。この実施形態では、ピクセル当たりＣ＝０．１５（サイクルごとのピクセル）であり、このように生成されたキーは、時間方向にも周波数方向にも約±６％まで拡張があっても充分良好に作用する。Ｃの上記の定義はピクセルに関していることが分かる。この文脈では、ピクセルという用語は、スペクトログラムの水平方向でのフィルタリングと、垂直方向でのフィルタリングを検討する場合には意味が異なる。
【００６２】
水平方向ではピクセルという用語はスペクトログラムの列間での時間間隔を意味するものとして用いられる。垂直方向でのフィルタリングを考える場合は、ピクセルという用語はスペクトログラムの２つの隣接する行の周波数差を意味するものとして用いられる。
【００６３】
したがって、図１１では水平ピクセルは約２３ミリ秒であり、垂直方向のピクセルは約２２Ｈｚである。
【００６４】
したがって、低域フィルタの帯域幅にτ＞Ｃ｜ｔ｜を用いる際には、τはサイクルごとのピクセルで計測され、ｔは基準点、すなわち基点からの前述で定義されたように、ピクセル内で測定された当該のスペクトログラムのポイントのＸまたはＹ座標を表す。図１１では基準点は画像の上縁の中心にある。この基準点はゼロ周波数に対応するように選択されたものである。他の基準点を選択することもできるが、ゼロ周波数の条件が好適である。
【００６５】
周波数と時間の双方におけるある範囲での拡張後の標準的なキー自体の相関性のピークが図１２に示されている。数値はキーのピーク自己相関が１になるように正規化されている。
【００６６】
キーとステゴテキストとの間の二次元相関を計算すると、ステゴテキストが周波数範囲で拡張した場合、相関のピークは線ｙ＝０からわずかに移動することがあることが判明する。このような理由から、この実施形態は二次元相関を用いている。すなわち、ｙ方向にわずかにずれた関数の値が互いに加算されて、ビット・シンクロナイザを通過する一次元関数が形成される。
【００６７】
ここで図２３を参照すると、この図はキーＫの生成の流れ図を示している。
【００６８】
ステップＫ_１では、シード整数が入力され、ステップＫ_２でこの数値が、均一に分布する乱数を生成するＴａｕｓｗｏｒｔｈｅジェネレータに供給される。Ｔａｕｓｗｏｒｔｈｅジェネレータ出力は、ボックス−コックス方式によって一次元ガスウ分布乱数へと変換されるようにステップＫ_３で供給される。Ｘ＝３２、およびＹ＝１０２４であるキーでは、このような乱数は３２７６８になる。Ｔａｕｓｗｏｒｔｈｅジェネレータおよびボックス−コックス方式によって実行されるプロセスは、１９８８年にＣｌａｒｅｎｄｏｎ出版によってオックスフォード科学出版叢書で刊行されたＪｏｈｎＤａｇｐｕｎａｒ著の書籍「ランダム変数生成の原理（ＰｒｉｎｃｉｐｌｅｏｆＲａｎｄｏｍＶａｒｉａｔｅＧｅｎｅｒａｔｉｏｎ）」に詳細に記載されている。
【００６９】
ステップＫ_４で、３２７６８の乱数が３２×１０２４の乱数の二次元アレイへと再構成される。
【００７０】
ステップＫ_５で、前述の二次元掃引フィルタリングが実行される。
【００７１】
ステップＫ_６で、データ値は−１≦Ｋ（ｔ，ｆ）≦＋１の条件を実現するために、データ値は非線形正弦関数を通過するようにされる。
【００７２】
最後に、ステップＫ_９で、キーをエンコーダまたはデコーダで直接使用するか、または適宜の読み出し可能メモリに記憶しておくことができる。
【００７３】
上記のプロセスは全て、３００に示すように適宜にプログラムされたコンピュータによって実行され、ＣＤ、ＲＯＭ、ＤＶＤ、ディスク、テープ、またはその他の任意の適宜の記憶媒体とすることができる記録媒体３０１に記憶されることができる。
【００７４】
これまで本発明に基づくカバーテキストのエンコーディングの基本ステップおよび原理を説明してきたが、図１３はエンコーダのブロック図を示している。
【００７５】
上述の各図と同様に、（１０）はこの実施形態ではエンコードすべき音楽であるカバーテキストを表し、（１５）は最終的なステゴテキストを表す。
【００７６】
回路（５１）において、カバーテキストは対数絶対値スペクトログラムへと変換される。
【００７７】
このようにして生成されたスペクトログラムはＦＦＴ回路（５１）に供給され、そこで受信されたスペクトログラムはクロック（５２）によってスペクトログラム・バッファへとクロックされる。ＦＦＴ回路（５１）は、入力されたスペクトログラムの重複分割と、図６で説明したウインドウ機能とを実行する。クロック（５２）によって、スペクトログラム・バッファ（５３）のコンテンツがスペクトログラム形式で、この実施形態では２５６または３２列であるキーの長さに等しい音楽量を表すことが確実にされる。
【００７８】
エンコードすべきデータは、（５５）で、前述のように同期化フラグを加算し、かつゼロ詰め込みを実行するために回路（５４）に供給される。
【００７９】
回路（５４）の出力は、図５を参照して説明したエンコーダに対応し、かつ（５７）で必要な多項式が供給される畳み込みエンコーダ（５６）に供給される。
【００８０】
キー・マトリクスは、（５８）で回路（５９）へのエンコーダに供給され、そこではキー・マトリクスはスペクトログラム・パッファ（５３）内に保持されているスペクトログラムへと直接乗算できる数値のセットへと変換される。これらの値は２つのマトリクスの形式をとり、一方はゼロ・ビットをエンコードするためであり、他方は１ビットをエンコードするためのものである。これらのマトリクスはキーの真数、およびキーの真数の逆数である。これらのマトリクスを、保持されたスペクトログラムへと乗算する動作は、対数スペクトログラム領域内で加算または減算する動作と等価である。
【００８１】
キーがバッファ（５３）のコンテンツを変調する強度は、入力（６０）によって決定される。この入力は方程式２の実定数ｓに相当する。
【００８２】
２つのマトリクスは、（６１）で示すようにスペクトログラム・バッファ（５３）のコンテンツと選択的に乗算され、この選択は、バッファ（５３）内に記憶された音楽が単一のデータ・ビットでエンコードされるように畳み込みエンコーダ（５６）の出力に従って行われる。バッファ（５３）のコンテンツは、ＩＦＦＴ回路（６２）へと書き込まれた各ビットごとに１クロックの周期だけシフトされるので、主エンコード・ループは書き込まれた各ビットごとに一度実行される。
【００８３】
ＩＦＦＴ回路（６２）の出力はクリップ防止バッファ（６３）に印加される。これは、データが音楽ファイルとして読み出される時に、回路（６２）から読み出されたデータが確実にクリッピングしないようにするためである。クリッピングが起こりそうな場合は、出力のボリュームを漸減させて、クリッピングがかろうじて回避されるように、振幅変調曲線が生成される。そうすることが安全ならば、ボリュームはこの場合も漸次に規準まで増加させる。
【００８４】
最後に、クリップ防止バッファ回路（６３）から出力がステゴテキスト（１５）として出力される。
【００８５】
図１３はスクランブラ６５をも含んでいる。可能な多くのスクランブラを使用できるが、標準的なものはＣＣＩＴＴのＶ３２規格に記載されている。スクランブラを含めることは、畳み込みエンコーダと同様にオプションである。
【００８６】
上記の説明は、簡潔にするために単一のキーを使用するものとして記載した。勿論、各キーが異なるシード整数によって生成された１つ以上のキーを使用してもよいことが理解されよう。付加的に、ステゴテキストを電子透かし処理するためにキー（単数または複数）の倍数を用いることが可能である。上記の実施形態では倍数は「１」であるので、キーの倍数に言及される場合は常に、倍数が「１」であってよいこと、すなわちキーはその符号は別にしても不変のままに留まることが示唆される。
【００８７】
ステゴテキストを電子透かし処理するために、または電子透かしコードを検索するために、２つ以上の異なるキーを使用する実際の方法は、本明細書に記載された実施形態と全く同類である。したがって、１つ以上のキーがある場合は、いずれかの時点でどのキーが（６１）でスペクトログラムへと乗算されるかはエンコードすべきデータに従って定まる。スペクトログラムを変調するために±１以外の倍数が用いられる場合は、その都度、１ビット以上をエンコードすることが可能である。勿論、デコーディングには同じ倍数のセットが使用される。
【００８８】
本発明によるエンコーダの実施形態を説明してきたが、ここで、コード化されたデータを復元するために圧縮または拡張されることがあるステゴテキストのデコーディングの問題に焦点を当てることにする。
【００８９】
カバーテキストのパワー・スペクトルを変調するために、図１３のエンコーダで用いられるキーの特性を説明してきたが、電子透かしデータを抽出するためにステゴテキストをデコードする場合、キーとステゴテキストのパワー・スペクトログラムとを相関させることによってデータ・ビットを特定できることが理解されよう。ステゴテキストが侵害にさらされておらず、またはそれ以外の理由で拡張または圧縮されていない場合には、データに従って補正されたこれらの対数要素でステゴテキストとキーとに明確な相関がある。
【００９０】
前述のキーは、垂直または水平のいずれかの方向でステゴテキストの±６％の拡張を含むステゴテキストの歪みに対処することができる。
【００９１】
ステゴテキストがキーによって許容される±６％以上の拡張を受けた場合に対処するために、いくつかのアプローチが可能である。
【００９２】
しかし、本発明の実施形態は直接的な相関を含まない別のアプローチを採用しており、次にそれを詳細に説明する。デコーダの実際の回路を説明する前に、まず、それに含まれる原理を基本的に説明する。
【００９３】
世界中のほどんどのデモジュレータおよびデコーダは、望ましい信号は加算ノイズ、ホワイト・ノイズ、固定ノイズ、およびガウス・ノイズであるノイズによって損なわれるということを前提にして最適であるように設計されてきた。そのほとんどが、任意の個々の時間で１つの実際値だけが受信されるという意味で一次元であり、いくつかは二次元である。この実施形態では、任意の時点でスペクトログラム列全体の形式の多くの実際値が受信される場合に信号が発生される（ｅｎｃｏｕｎｔｅｒｅｄ）。
【００９４】
任意の個々のサンプルについて、そのサンプル内のノイズ値の周辺確率分布（すなわち他のサンプルの値が何であるか不明である場合に認められる分布）がガウス分布、正規分布、または平均ゼロ分布である場合に、そのノイズはガウス・ノイズと呼ばれる。
【００９５】
ノイズのフーリエ・スペクトルが検討された場合に、そのスペクトルの任意の個々の要素の周辺確率分布が他の任意の要素の周辺確率分布と同一である場合は、そのノイズはホワイト・ノイズと呼ばれる。
【００９６】
任意の時間領域サンプルの周辺確率分布が他の任意のサンプルの周辺確率分布と同一であり、所定の長さのノイズの任意の１つの抜粋の結合確率分布が他の任意のこのような抜粋の結合確率分布と同一である場合、そのノイズは固定ノイズと呼ばれる。
【００９７】
ほとんど全ての場合、これらの前提の全てはある程度まで破られる。一般にこのことは重要ではない。しかし、本発明では、上記の前提からの例外は極めて重要であり、したがって詳細に説明する。
【００９８】
例えば、スチューデント・ノイズは非ガウス一次元ノイズの例であると見なすことができる。スチューデント分布は、各サンプルごとに標準偏差が異なること以外はガウス分布と同様である。特に、逆変数はガンマ分布からのサンプルごとに新たに引き出される。
【００９９】
図１４および１５は、変数１の一次元ホワイト・ガウス・ノイズの抜粋と、（１に等しい関連するガンマ分布の形状パラメータｍを有し、変数１をも有するようにスケーリングされた）一次元ホワイト・スチューデント・ノイズの抜粋をそれぞれ示している。双方とも同じ変数を有しているが、見かけは全く異なる。スチューデント分布ノイズはある種の大きなスパイク（ｓｐｉｋｅ：ピーク）を有しているが、これはガウス分布ノイズでは極めて稀にしか発生しないであろう。
【０１００】
このことは、ノイズが衝撃ノイズである場合、および異常値が（ガウスの前提の下で）適正とは程遠い結論を余儀なくさせるような状況では問題である。
【０１０１】
発生の頻度が低い非ガウス・ノイズの別の例は、各々がガンマ分布されている２つの数量の比率の対数として分布されているノイズである。このようなノイズは下方へのスパイクを多く有しているが、上方へのスパイクはない（または逆である）。このようなノイズはオーディオの電子透かし処理の問題に関連があることが判明している。
【０１０２】
非ホワイト性は直ちに分かる程度以上に乱されることがある。その例がカラー・ノイズである。これはある周波数が他の周波数以上に存在するが、ノイズが固定的であるようなノイズである。典型的には、低周波数が最も多くを占めるピンク・ノイズ、他の周波数がフィルタリングされて除去される帯域制限ノイズ、およびパワー・スペクトル密度が、ゼロよりも高いある限度まで低下した周波数と反比例する「１／ｆ」ノイズがある。
【０１０３】
しかし、一般に、他の種類の非ホワイト・ノイズがある。
【０１０４】
その一例が一次元非固定ノイズである。１つの次元だけが考慮される場合は、このノイズは非固定ノイズであり得る。例えば、断続的な熱源に近づきすぎるレジスタからのノイズである。または、（「カラー」の変化ならびに時間と共に振幅の変化を引き起こす）可変キャパシタンスを含むフィルタの後に記録されたノイズである。
【０１０５】
一方、信号が多次元である場合は、異なる次元でのノイズは、信号（単数または複数）が時間に対して固定的であるとしても、そのノイズに相関性があることがある。あるいは、あるチャネル／次元でのノイズが他のチャネル／次元でのノイズよりも大きい振幅を有することがある。勿論、音楽の対数絶対値のスペクトログラムを除外することがまさに不合理であるように、これも時間に対して非固定的である多次元ノイズを止めるものはない。
【０１０６】
一般に、これらの前提のいずれかを破ることは、ステゴテキストから電子透かしをデコードすることの試みに際して重要であるだろう。しかし、関心点が本発明に関わる種類の電子透かしをデコードする際の、特に音楽での強靱さにあるならば、非ガウス性はそれほど重要ではなく、一方、信号間の相関と、異なる周波数成分と異なる周波数での振幅変化との相関の、双方の相関の形式の一般的な非ホワイト性は極めて重要であることが実験により明らかに判明している。非ガウス性を考慮に入れたデコーダは、計算に際して様々な中間変数にとってより検知可能な数値を生成する上で利点があり、一方、非ホワイト性を考慮に入れないデコーダは性能が低下し、メモリおよびフロップを浪費する。
【０１０７】
従うべき基本は多次元ガウス分布の概念である。ｘを実数のＮベクトル（すなわちＮの要素を有する列ベクトル）であるものと仮定する。μがｘ（同じくＮベクトル）の分布の平均であるものとする。
【０１０８】
ここで、一次元の場合に標準偏差を表す変数σ（あるいは１／σ^２を表すｓ）があるのと全く同様に、Ｎ次元の場合は、実数のＮｘＮマトリクスｓがあり、これは一次元の場合と同様であるが、より複雑なｓの役割に対し、より単純な役割を果たす。
【０１０９】
まず、Ｘの分布がμを中心として球対称（すなわち円対称）である二次元の場合を検討する。この場合は、μを通過する分布を横切るどのスライスも標準偏差が例えばσである一次元ガウス分布と類似して見える。この場合は、ＳはＩ／σ^２であり、ただしＩは単位マトリクスを表す。分布が円対称ではなく、座標軸の１つと位置合わせされた楕円の長軸と楕円対称である場合は、Ｓは２つの対角要素が異なり、かつ正である対角マトリクスとなる。楕円が座標軸と位置合わせされていない場合は、Ｓは全てのエントリが非ゼロであり、対角要素が正である２ｘ２の対称マトリクスになる。Ｓの逆数Ｖは分布の共分散マトリクスとして知られており、Ｓはｉｃｏｖマトリクス（ｉｃｏｖ：逆共分散の略語）と呼ばれる。
【０１１０】
Ｓは更に他の重要な特性を有している。これは任意の非ゼロベクトルＹについてｙ’ｓｙが正のスカラになることを意味する正定（ｐｏｓｉｔｉｖｄｅｆｉｎｉｔｅ）である（ここで’は移項を表す。ｙ’ｓｙは常にスカラであるが、Ｓが正定であり、ｙがゼロではない場合に常に正であることだけが保証される。）
【０１１１】
Ｎ次元の場合は、「円」の代わりに「Ｎ次元の球」に、および「楕円」の代わりに「Ｎ次元の楕円面」になることを除いては、同じ画像が保持される。
【０１１２】
この場合は、このような密度の確率分布の公式は下記になる：
【０１１３】
【数５】

【０１１４】
ここでゼロ平均の「ランダム」Ｎ次元のガウス分布を考慮する必要があるものと仮定する。「ランダム」は勿論、どの分布から引き出されるかが言明されない限りは実際の意味を持つものではない。必要なことは、ゼロ平均を伴うＮ次元ガウス分布上の分布である。それが意味するのはｉｃｏｖマトリクス上の分布の必要性である。または、正定の対称的なＮｘＮマトリクスＳ上の分布の必要性である。
【０１１５】
これらの要求基準を満たす分布の１つがウィシャート分布である。
【０１１６】
ウィシャート分布は（Ｎ以外に）２つのパラメータを有している。すなわち、「緊密度」または「形状」パラメータであるｋと、「スケール・マトリクス」であるＶである。ｋはＮ−１より大きくなければならない。これが大きい程、その平均を中心とした分布は緊密になる。Ｖは正定で、かつ対称でなければならない。平均はｋＶ ^−１である。密度は下記となる：
【０１１７】
【数６】

【０１１８】
Ｎが１である場合は、これはガンマ分布にまで劣化する。しかし、ｍおよびｒがガンマ分布の形状およびスケール・パラメータである場合は、Ｖは２ｒであり、ｋは２ｍである。
【０１１９】
一次元のスチューデント・ノイズを以前説明した際に、各サンプルごとにガンマ分布からｓ＝１／σ^２の新たな値が引き出されることに言及したが、その場合、実際のサンプルはゼロ平均と逆共分散ｓとを伴う一次元ガウスから引き出される。
【０１２０】
その場合、多次元スチューデント・ノイズを生成する１つの方法は、新たに各サンプルごとに新たなｉｃｏｖマトリクスＳを引き出すことであり、その後で、ゼロ平均およびｉｃｏｖマトリクスＳを伴う多次元ガウス分布からサンプル自体が引き出される。各新たなｉｃｏｖマトリクスは、ある適宜のパラメータｋおよびＶを伴うウィシャート分布から引き出されるものとする。
【０１２１】
上記のウィシャート分布のスケール・マトリクスＶが何らかの正の実数ｒのための形式ｒＩのスケール・マトリクスである特殊な場合は、このスチューデント分布は球対称であり、下記によって得られる：
【０１２２】
【数７】

【０１２３】
したがって、基点からのｘの距離Ｒの確率密度は下記のように表すことができる：
【０１２４】
【数８】

【０１２５】
ここで音楽の対数絶対値スペクトログラムが実際にどのように見えるかが分かる。これは多次元スチューデント・ノイズとしてモデリングすることができるが、やや異なるモデリングがなされればより良好な適合が得られる。全てのサンプルについて新たなｉｃｏｖマトリクスを引き出す代わりに、ビット周期ごとに１回、またはより少ない頻度で、新たなｉｃｏｖマトリクスが引き出される。次に、結果として生じた準スチューデント分布からの各サンプルが、スペクトログラムの１列と見なされる。これは、以下に明らかにされる理由から「ｄｅｔＶ」分布と呼ばれる。
【０１２６】
関連するウィシャート分布のパラメータがいかなるものであるべきかの問題については、本明細書で後に扱う。しかし、理想的にはこれらのパラメータはある種の広範な音楽の集成に関して決定されるものであるが、実際には、出会う可能性がある種類の音楽の代表的なものを含んでいれば、少数の作品だけを用いたとしても恐らくは大きな相違にはならないであろう。「残存する不確実性」は、Ｎよりも大幅に大きくないｋを有するウィシャート分布によって処理することができる。
【０１２７】
ウィシャート・スケール・マトリクスＶが極めて小さい単位倍数（ｍｕｌｔｉｐｌｅｏｆｔｈｅｉｄｅｎｔｉｔｙ）（実際にはｅ^−１２Ｉ）であるような特殊な場合は、「ｄｅｔＺ」分布と呼ばれる。この場合「Ｚ」はゼロを意味する。
【０１２８】
上記のように背景を説明をしてきたが、ここで、本発明に従って生成されるステゴテキストをデコードするために使用できるデコーダの特性を定義することができる。各デコーダは、特定のノイズのモデル（すなわちカバーテキストまたは音楽）用の最適なビット・バイ・ビット式メモリレス・デコーダとして設計されている。したがって、各デコーダは何が受信されたかに鑑みて、当該のデータ・ビットでのベイズ事後分布を計算し、次に最高の事後確率を有する値（０または１）を選別する。ここで「最適」という用語は極めて特殊な意味を持つことに留意されたい。すなわち、デコーダは、それが実装コストが最も安価なデコーダであるか、あるいは最も高価なデコーダであるかに関わらず、最良の出力を生成するデコーダである。
【０１２９】
このようなデコーダは明らかに、モデルが正確である場合に限って実際に最適なものになる。そうでなければ、チャネルの有効キャパシティが低減する。
【０１３０】
このように、相関関数を用いてデコーダを実施することができ、一方、「ノイズ」が固定ノイズ、ホワイト・ノイズおよびガウス・ノイズであるという前提で、ビット・バイ・ビット式メモリレス・デコーダを生成するためにＦＦＴを用いて実施することができる。実際には、信号強度が０．００５にまで低減された場合にキャパシティは大幅に損失する結果になる。この損失は、キーの低周波成分を全て放棄することで、ある程度までは緩和されるが、それでも相当な損失である。
【０１３１】
したがって、説明しようとするデコーダの実施形態には、時間が固定であるように、また周知のｉｃｏｖマトリクスを有するように限定される非ホワイト多次元ガウス・ノイズとしてノイズを定義するノイズ・モデルへの変更が含まれる。
【０１３２】
デコーダはこのノイズ・モデル用に極めて簡単に実施することができる。周知のｉｃｏｖマトリクスＳが採用され、Ｃｈｏｌｅｓｋｙ分解がなされ（すなわちＣ’Ｃ＝Ｓであるようなその三角正定移項平方根Ｃ）、受信された信号の対数絶対値スペクトログラムとキーの双方にＣが事前乗算される。Ｃを事前乗算するプロセスは前提とされている非ホワイト・ノイズをホワイト・ノイズに変換するので、このデコーダを「ホワイト化されたガウス」デコーダと呼ぶことができる。
【０１３３】
このデコーダはｉｃｏｖマトリクスＳがまさにノイズをモデリングするマトリクスＳ（すなわち音楽の対数絶対値スペクトログラム）である場合に良好に動作する。その理由を理解するため、ノイズをＮ空間内の極めて細長い楕円面であるとみなしてもよい。このデコーダは楕円面を球面に拡張することによる一方で、伝えられた信号を同時に各方向に同じ量だけ拡張することによって動作する。その結果、楕円面の最短軸と平行な信号部分がノイズを越えて著しく拡張され、したがって容易に復元可能である。
【０１３４】
しかし、使用しているＳが、電子透かしがデコードされている音楽のＳではない場合は、このデコーダに問題が生じる。このことが生じる理由は直観的には、ノイズを球面に拡張する代わりに、別の細長い楕円面に拡張し、したがってノイズの絶対的な大きさが、課意宇町された信号の大きさと比較して大きいままであるからである。したがって、この方法は非常に少なく見積もっても、電子透かしを読み取る時点で各々の音楽作品ごとに適正なｉｃｏｖマトリクスを利用できることが必要となり、既にこれだけでも相当に不利である。
【０１３５】
しかし、動作が対数絶対値領域で行われることから、状況は上記よりもさらにいっそう悪い。時間領域の音楽信号にホワイト・ガウス・ノイズが加わることによる歪みを検討してみる。動作が時間領域で行われる場合、それは単に楕円面の狭い寸法の全てをわずかに広げるだけであろう。しかし、これが対数絶対値スペクトログラム領域において当てはまる場合、加算された歪みノイズは、音楽のスペクトル内容に厳密に比例したままであるように、スペクトル内容を常に変更しなければならないであろう。これは事実とは異なるので、より複雑な挙動が予測される。この挙動は楕円面を１つまたは複数の異なる方向に回転させることを含み、デコーダは、異なる音楽作品のｉｃｏｖマトリクスを使用した場合とまったく同様に失敗することが判明する。
【０１３６】
これらの問題点を解消するため、これから説明するデコーダは「ｄｅｔＶ」分布、すなわちウィシャート分布から引き出され、１ビットの周期にわたって局所的に一定である未知のｉｃｏｖマトリクスを有する多次元ガウス・ノイズ分布を使用する。これは、デコードしている音楽の元のｉｃｏｖマトリクスも、分布内に発生した歪みがそれに及ぼす正確な影響も判明していないが、このようなマトリクスが存在することは分かっているという事実を考慮するものである。
【０１３７】
したがって、説明されるデコーダはこのノイズ・モデル用の最適なデコーダになるように設計されている。したがって、以下に説明されるデコーダの実施形態は、所定の受信信号で各データ・ビットの事後分布を計算する確率的なアプローチを採用する。そのために、説明されるデコーダはベイズの理論を用いる。
【０１３８】
このように、各々がＮの要素のベクトルである対数絶対値スペクトログラムのＭ列である信号が１ビット周期中に受信されたものと考えてみる。
【０１３９】
ノイズ分布の平均値はゼロであるものと想定される。スペクトログラム全体の実際に観測された平均値が差し引かれるものと想定すれば、これは平均値が不明であり、かつそれがどのような値をも等しくとることができるとア・プリオリに信じられるということに極めて等しい。
【０１４０】
ここでＫを、実際に使用された場合の対数絶対値スペクトログラム内のキーの値であるものとする。すなわち、これが使用された強度で既に乗算されたものとし、（かつ、対数の底としてｅの代わりに１０をどのように使用することも許容されたものとする）。キーが各々の高さがＮであるＭの列から構成されていれば、ＫはＮｘＭマトリクスとなる。ｂを問題のビット値であるとする。簡潔にするために、重複するビットはないものと想定できるが、それがあってもなくてもデコーダにはほとんど相違がないことが判明しているので、重複するビットはないものと仮定する。完結にするため、ｂを１または０ではなく＋１または−１であるものとする。Ｘを、ｂが電子透かし処理された音楽のＭ列の対数絶対値スペクトログラムからなるマトリクスであるとする。Ｙを、ステゴテキスト内のＸに対応する受信された対数絶対値スペクトログラム列であるものとする。ここでタイミングが判明しているものと仮定する。
【０１４１】
ここで判明させるべきはＰ（ｂ｜ｙ）である。勿論、Ｐ（ｂ＝＋１｜Ｙ）／Ｐ（ｂ＝−１｜Ｙ）（またはその対数）を知ることも同様に望ましく、デコードするためにこれが１（それぞれが正）より大きい場合は、ｂ＝１となり、それ以外の場合はｂ＝−１となる。
【０１４２】
起点となる情報は何であろうか？これは以下の方程式に要約することができる：
【０１４３】
【数９】

【０１４４】
【数１０】

【０１４５】
【数１１】

【０１４６】
【数１２】

【０１４７】
ただし、Ｘ_ｍはＸのｍ番目の列であり、ｋとＶは関連するウィシャート分布のパラメータである。
【０１４８】
次にデコーダは、連続的に受信されたデータ・ビットの必要な事後確率を発見するために以下の方程式で示すようなベイズの定理を適用する。
【０１４９】
【数１３】

【０１５０】
【数１４】

【０１５１】
【数１５】

【０１５２】
【数１６】

【０１５３】
【数１７】

【０１５４】
【数１８】

【０１５５】
【数１９】

【０１５６】
【数２０】

【０１５７】
上記で方程式１３は、方程式７を呼び出すことによって方程式１２から成り立つ。方程式１４は方程式８を呼び出すことによって成り立つ。
【０１５８】
方程式１５は、Ｐ（Ａ）＝∫Ｐ（Ａ、Ｂ）ｄＢ、すなわち排反事象が結合する確率は個々の確率の合計または積分であるという基本確率理論を用いた上記の方程式から、また、Ｐ（Ａ｜Ｂ）＝Ｐ（Ａ、Ｂ）／Ｐ（Ｂ）であることを示す条件確率の定義によって導出される。
【０１５９】
方程式１６は方程式９を用いて方程式１５から成り立つ。方程式１７は方程式１０を用いて方程式１６から成り立つ。最後に方程式１８は収集係数（ｃｏｌｌｅｃｔｉｎｇｆａｃｔｏｒ）によって簡略化することによって得られる。
【０１６０】
方程式１８の積分は例外的に複雑であるが、方程式１９を生じ、そこから方程式２０が成り立つ。このように、方程式２０は方程式１９の変形を除算することによって方程式１９から得られ、ただしｂ＝−１である変形を伴って、ｂ＝１である。
【０１６１】
【数２１】

【０１６２】
【数２２】

【０１６３】
ｄｅｔＶデコーディグは最良のアルゴリズムの中核をなすので、ここでこの最後の方程式の右辺を評価する最良の方法を論考する。
【０１６４】
ＷをＶのＣｈｏｌｅｓｋｙ分解とすると、Ｗ’Ｗ＝Ｖとなる。Ｕ＝Ｗ^−１とすると、Ｕ’ＶＵ＝Ｉである。したがって、
【０１６５】
【数２３】

【０１６６】
【数２４】

【０１６７】
【数２５】

【０１６８】
最も内側の括弧の内容に特異値分解（ＳＶＤ）を適用する。ＳＶＤによってどのマトリクスも直交マトリクス、対角マトリクス、およびその他の直交マトリクスの積として書き込むことができる。ＳＶＤは、１回は分子内の括弧用に、もう１回は分母内の括弧用に２回用いられなければならない。この手順は分子だけを考慮して示されている。
【０１６９】
このようにＵ’Ｙ−Ｕ’Ｋはマトリクスであり、ＳＶＤによって、ＬＤＲ＝Ｕ’Ｙ−Ｕ’Ｋ（方程式２４）になるように、Ｌ、Ｄ、およびＲの計算が可能である。ただし、ＬおよびＲは直交マトリクスであり、Ｄは対角マトリクスである。次の７つの方程式は方程式（２４）から順次成り立つ。
【０１７０】
【数２６】

【０１７１】
これらの方程式中、Ｒの直交性によって必然的にＲ’Ｒ＝Ｉとなり（Ｌについても同様）、Ｌは直交かつ実数であるので、ｄｅｔ（Ｌ）＝ｄｅｔ（Ｌ’）＝±１であることから最後の行が成り立つ。
【０１７２】
しかし、Ｉ＋ＤＤ’は対角マトリクスから計算された対角マトリクスであり、したがってその行列式は、各々を簡単に評価できる対角上の要素の積である。したがって、Ｄだけを知ればよく、ＬまたはＲを知る必要はない。
【０１７３】
これまでデコード手順の基本原理を論考してきたが、ここで図１６を参照してデコーダの実施形態を説明する。
【０１７４】
図１６の実際のデコーダを論考する前に、デコーダ内の様々な段階を前述の理論的論考と関連付けることが可能であることが不可欠である。
【０１７５】
このように、Ｙがデコーダによって受信されたスペクトログラム・ブロックを表し、Ｘ＋ｂＫに等しいことが理解されよう。ただし、ｂはコードであり、Ｋはキーである。したがって、ｂとＫの値が判明していれば、受信されるＹが特定の値をとる確率は、Ｙ−ｂＫが元ののカバーテキストを表す確率と全く同じである。これが方程式（８）で表されていることである。
【０１７６】
ここで方程式（９）に転ずると、これはＸが電子透かし処理されていない音楽のスペクトログラムである確率を表現している。この方程式で、Ｓは未知のｉｃｏｖマトリクスである。音楽がホワイト・ガウス・ノイズとして表されるべきものであるならば、方程式（９）のＳは常に単位行列の倍数であるはずである。しかし、前述のように、これは実際の音楽を正確に表すものではない。このことが、本発明でｉｃｏｖマトリクスを使用する理由である。
【０１７７】
したがって、音楽作品全体ではないものの、Ｘの各列がこの未知のｉｃｏｖマトリクススＳによって定義される同じ多次元ガウス分布から別個にもたらさえるものと想定される。したがって、デコーダは、音楽の異なる部分ではＳが異なることを前提として動作する。方程式９はこのことを数学的に表している。
【０１７８】
しかし、電子透かし処理されたスペクトログラムをデコードするためには、Ｘがどの値をとる可能性があるかを知ることが不可欠である。方程式９は、Ｓの値が判明している場合だけこの情報を提供することができる。
【０１７９】
したがって、方程式１０の機能はＳがどの値をとる可能性があるかを判定することである。この方程式では、ＳはパラメータＶとＫを有するウィシャート分布に従って分布されているものと想定されている。これらのパラメータが選択される方法は本明細書で後に説明する。
【０１８０】
関連する基本原理を論考してきたが、ここで添付図面のうち図１６を参照してデコーダの第１の実施形態を説明する。
【０１８１】
図１６では音楽をベースにしたステゴテキストが再び（１５）によって表されている。以下の説明は簡略にするために音楽だけに言及するが、勿論、他の形式のカバーテキストも同様に処理することができる。
【０１８２】
（１００）において、カバーテキストは図６の（５１、５２）で開示されているウインドウ関数に匹敵するウインドウ関数でポイントごとに乗算され、（１０１）において、ウインドウ処理されたステゴテキストの高速フーリエ変換が行われ、これが（１０２）において対数領域に変換される。
【０１８３】
（１０３）において、方程式２２〜２５で示したマトリクスＵ’を表すように、既に生成されているマトリクスＵ’で（１０２）の出力が事前乗算される。Ｕ’の生成については後述する。（１０２）の出力をＦと定義すると、（１０３）の出力はＵ’＊Ｆとなり、これはＤＣオフセットがあればそれを除去するように高域フィルタ（１０４）に印加される。（１０４）の出力Ｕ’＊Ｆは初期ステゴテキストに応じた長さの対数絶対値スペクトログラムである。
【０１８４】
このスペクトログラムを処理するために、これは各々がＫに対応する幅を有するブロックに区分される。本実施形態および第２の実施形態では、各ブロックは時間次元で３２列幅であり、周波数次元で１０２４行幅であるが、これらの値は勿論変更できる。区分された各ブロックは方程式２３、２４、および２５の設定と同様にＵ’Ｙを表す。
【０１８５】
この区分化は、各区分ブロックが添付図面の図４に示された状況に対応してブロックの幅よりも１行だけ狭い先行ブロックと重複するように、（１０５）で行われる。
【０１８６】
上記のようにして得られた各ブロックは（１０６）でＵ’Ｋに加算され、（１０７）でＵ’Ｋから減算されるので、（１０８）と（１０９）で２つの異なる結果が得られる。すなわち、（１）左辺：Ｘ_−１＝Ｕ’Ｙ＋Ｕ’Ｋ、および（２）右辺：Ｘ_＋１＝Ｕ’Ｙ−Ｕ’Ｋである。
【０１８７】
ここで、これらの値が方程式２３および２４で見いだされる値に対応することが理解されよう。
【０１８８】
デコーダの次の段階には、方程式２３の分母と分子それぞれの対数を計算することが含まれる。これは２４で示された方程式を用いて達成される。段階（１１０、１１１）では、方程式２３の分母と分子の対数行列式が決定され、段階（１１２、１１３）で出力された対数行列式が−（（ｋ＋Ｍ）／２）でそれぞれスケーリングされる。この因数は勿論上記の方程式にもある。この因数の導出については後述する。
【０１８９】
段階（１１４）において、（１１２）および（１１３）において得られたスケリーング済みの値によって表される加算決定子の対数から分母の対数を減算することによって、方程式２３の数量が計算される。
【０１９０】
このようにして得られた値は、１または−１のデータ・ビットが存在する場合は、当該データ・ビットの確率の対数比としてバッファ（１１５）に記憶される。したがって、バッファ（１１５）はコード・ビットのシーケンスの事後確率を保持するものと見なすことができ、シーケンスの長さはバッファのサイズによって決まる。
【０１９１】
バッファ（１１５）への個々のエントリのシーケンスを検討すると、これらのエントリは、前述したように個々の値がマトリクス処理の結果を表す、ゼロ軸を中心に分布している値からなるものである。バッファ（１１５）は２５６の計数値を保持することができるが、勿論、この数も可変である。図１７はバッファ（１１５）に記憶された値のシーケンスを示すグラフである。
【０１９２】
バッファ（１１５）内の値は黒い曲線（１５０）によって表される。縦の実線１５１はビットがエンコードされた時間を表す。これらの時間は後述する様式でクロック抽出回路（１１６）によって決定される。
【０１９３】
ここでバッファ（１１５）からオリジナル・コードを表す値を抽出することが必要である。この場合も、元のステゴテキストは拡張または圧縮されることがあるので、コードのビット速度の抽出はこのことに考慮しなければならないことを理解しなければならない。
【０１９４】
これはクロック抽出回路（１１６）で実行される手順である。ここでは可能性があるスライス・ポイントのあらゆるシーケンスが考慮され、ゼロからの総合偏差が最大であるポイントのシーケンスが、埋め込まれたコードのためのクロックとして選択される。
【０１９５】
ネストされた一対のループが、可能性があるビットのクロック周波数、および位相のオフセットにわたって効果的に反復される。各々の反復で、スライスされた値の二乗和が計算される。この和が最大になるような周波数と位相の値が、クロックを表す標識の集合として段階（１１７）に戻される。
【０１９６】
段階（１１７）において、バッファ（１１５）内で最初と最後の値が発見されると予期される場所を指示するために２つのポインタが使用される。これらは、データがブロックからブロックへとスライスされて、ギャップや繰り返しなく抽出されたビットを共に結合できるように処理される。事後確率ベクトルはスペクトログラム・バッファ（１０５）内のデータと同じ速度でシフトされる。
【０１９７】
クロック抽出回路（１１６）によって生成されたクロックは（１１７）で、読み取られるべきデータをバッファ（１１５）からバッファ段（１１８）へとスライスするために使用される。オリジナル・キーは５列間隔でカバーテキストの対数絶対値スペクトログラムの３２列に加算されたことが理解されよう。したがって、デコーディングの前にステゴテキストが圧縮または拡張された場合でも、コード・ビットはバッファ内に記憶された値のシーケンスのほぼ５列目ごとに予期される。しかし、抽出されたクロックに応答して緩衝記憶されたデータをスライスした結果は、音楽がｄｅｔＶ分布を有していることをデコーダが想定している限りは、依然として充分に正確なオリジナル・コードの表現ではない。前述したように、これは完全な真実ではない。したがって、５列間隔のポイントのあるものは誤っている場合がある。したがって、元の音楽がｄｅｔＶ分布ではないことが許容される必要がある。
【０１９８】
まず段階（１１８）への出力を検討する。これは、ｌｏｇ（Ｐ（ｂ_ｎ＝１｜Ｙ_ｎ）／Ｐ（ｂ_ｎ＝０｜Ｙ_ｎ））
であることを意味する値のシーケンスからなっている。
【０１９９】
これは音楽が実際にｄｅｔＶ分布を有していれば必要なシーケンスであろう。しかし、既に説明したようにそうではない。
【０２００】
Ｃ_１，Ｃ_２，．．．Ｃ_ｎを段階（１１７）から出力された値のシーケンスであると定義すると、音楽がｄｅｔＶ分布を有していれば、Ｃ_ｎ＝ｌｏｇ（Ｐ（ｂ_ｎ＝１｜Ｙ_ｎ）／Ｐ（ｂ_ｎ＝０｜Ｙ_ｎ））
となる。
【０２０１】
音楽はｄｅｔＶ分布を有していないので、ｆ（Ｃ_ｎ）がＣ_ｎよりもその対数により近似しており、したがって、より適正なシーケンスをデコーダのエラー補正デコード段（１２０）に入力できるような関数ｆを発見することが必要であり、その際に、エンコーダで電子透かしコードが付加的にエラー補正コードでエンコードされたことが理解されよう。
【０２０２】
データ・スライス段階（１１７）の出力は正の値の可能性「＋１」と負の値の可能性「−１」とを有するゼロのいずれかの側の一連の値である。
【０２０３】
各々の「＋１」の値はαといわれる値から偏差している。同様に各々の「−１」の値は−αから偏差し、αはＣ_ｎの絶対値平均に等しい、すなわちα−平均｜Ｃ_ｎ｜であるものと推定される。
【０２０４】
正のＣ_ｎがαと異なり、負のＣ_ｎが−αと異なる数量も推定される必要がある。この値はσであると定義されるので、σ＝ｓｔｄ（｜Ｃ_ｎ｜−α）
となる。
【０２０５】
ここでσが得られたので、元のの値Ｃ_１，Ｃ_２，．．．Ｃ_ｎが段階（１１８）でスケーリングされ、その結果、これらの値は＋または−α／σに対して標準偏差１を有する。これは方程式ａ_ｎ＝Ｃ_ｎ／σおよびβ＝α／σによって要約される。
【０２０６】
したがって、ｈ_ｎ＝｜ａ_ｎ｜−βである場合、ｈ_ｎは平均値ゼロ、および１の標準偏差を有するが、必ずしもガウス分布されているわけではない。
【０２０７】
本実施形態では、ｈ_ｎが既に論考した種類の一次元スチューデント分布であるものと想定されている。したがって、
【０２０８】
【数２７】

となり、
【０２０９】
その結果、
【数２８】

となる。
【０２１０】
方程式２６から、必要な
【数２９】

が成り立つ。
【０２１１】
ここで値ｒとｍの導出について説明する。これは実際に典型的に見られるｈ_ｎの値の大サンプルを収集し、かつ方程式（２５）を用いて、ｈ_ｎの個々の値と、ｍおよびｌｏｇ（ｒ）での不適切な均一な事前分布の尤度としてＭＡＰ推定を実行することによって行われる。
【０２１２】
したがって、段階（１１８）において方程式２８を用いて、計算された対数尤度比のベクトルを含む「尤度」マップと呼ばれるものを得るためにデコードされた加算された、エラー補正エンコーディングを最終的に有している必要がある補正されたシーケンスが計算される。
【０２１３】
図１８は前述したばかりの手順によってバッファ（１１５）の内容から導出される対数尤度マップを示している。参照番号１５０、１５１は図１８では図１７と同じ意味で用いられている。
【０２１４】
図１６のデコーダの最終段は従来のものである。
【０２１５】
図５に示した畳み込みエンコーダは各入力コード・ビットごとに２つの出力ビットを生成する。
【０２１６】
したがって、回路（１１８）の出力に存在する２ビットごとに、どのビットが所望のコードの一部であるかについて判定を行わなければならない。
【０２１７】
この機能を実行するため、最も簡単な形式の畳み込みデコーダ（１２０）は可能性がある各出力ビットを吟味し、このような各ビットについて固定ウインドウ内の周囲のビットの考え得る値を全て検討する。この手順は位相探索回路（１１９）で行われる。ウインドウのサイズは性能と計算量との調整によって定められる。例えば、バッファ内に１０の値を含むウインドウの場合は、全部で１０２４のシーケンスが評価されなければならない。
【０２１８】
１０２４のシーケンスの各々について、関連するビットが＋１であるか−１であるかに応じてバッファ内の関連値を加算または減算することによって、そのウインドウにわたるバッファ内の値の確率が計算される。
【０２１９】
検討中の位置に＋１を有する５１２の全シーケンスの確率が加算され、また、関連位置にゼロを有する他の５１２のシーケンスが加算される。それによって検討中のビットが１であるか０であるかの確率が得られる。
【０２２０】
この手順は図１９に示されている。この図では（２５０）は回路（１１８）からスライスされた値の概略的な表現である。ｗｉｎ_１は１０値ウインドウを表し、７は当該ピクセルを表している。ｗｉｎ_ｉ＋２はこのシーケンス内の次のウインドウを表し、８は当該値の次のピクセルを表している。最後にＶ_ｉは当該ピクセル７について実行されたばかりの評価の結果を表し、Ｖ_ｉ＋２は次の評価の結果を表している。
【０２２１】
図１９に示すように、図５の畳み込みエンコーダの出力は各コード・ビットにつき２つの出力ビットを供給するので、ウインドウはバッファの内容に沿って２ビット間隔で段階付けされる。この手順は、バッファ内のそれぞれの偶数値および奇数値にわたって２回実行されなければならない。このようにして、各々が関連する確率を有する２つのシーケンスが生成され、最後により確率が高いシーケンスに基づいて選択がなされる。
【０２２２】
これまで説明してきたのは最も簡単な形式のエンコーダ／デコーダである。
【０２２３】
しかし、２対１以外の他の何らかの比率を有することが有利であろう。
【０２２４】
例えば比率が４対１である場合は、ウインドウがバッファ内の４つの値について均一かつ連続的に段階付けされた４つのシーケンスを用い、かつこれらのシーケンスから最も確率が高い出力ビットを選択することが必要であろう。
【０２２５】
同様に、ビタビデコーダのように、コードをデコードできる他の方法もあることが当業者には明らかであろう。
【０２２６】
エンコード段階で用いられるデコーダ多項式に対応する多項式が１２０’において最大尤度デコーダ１２０に供給され、最終的に加算された同期化ビット、およびゼロ詰め込み中に加算されたゼロは（１２０）において除去されて、デコードされたデータが残される。図１３の任意のスクランブラ（６５）がエンコード・プロセスで使用された場合にのみ、デスクランブラ（１２２）が必要である。
【０２２７】
添付図面の図２０はデコーダの別の実施形態を示している。図２０のデコーダは図１６のデコーダと共通の整数の大部分を有していることが分かるであろう。したがって、これらの共通の整数が出現する場所には同じ参照番号が用いられている。
【０２２８】
図２１のデコーダの動作の基本はベクトル空間内での投影マップの概念である。
【０２２９】
図面中、図２１は二次元ベクトル空間から一次元部分空間への直交投影マップｆを示している。
【０２３０】
この図ではランダムなポイントの集合ｖ_１、ｖ_２、ｖ_３、ｖ_４、およびｖ_５が関数ｆによって単一の線、すなわちＬが付された直交線へとマッピングされている。
【０２３１】
概略的に、ｖをｖ_１・ｖ_２と書かれたドット積を有する実Ｎ次元ベクトル空間とする。Ｖへの投影マップは以下の方程式を満たすｆ・Ｖ→Ｖである。
任意のｖ_１、ｖ_２、ｖ_３∈ｖおよび任意の実数ｒについて、
ｒｆ（ｖ）＝ｆ（ｒｖ）
ｆ（ｖ_１＋ｖ_２）＝ｆ（ｖ_１）＋ｆ（ｖ_２）
ｆ（ｆ（ｖ））＝ｆ（ｖ）
である。加えて、任意のｖ_１、ｖ_２∈ｖについて、
ｆ（ｖ_１）＝０→ｖ_１・ｆ（ｖ_２）＝０
であるならば、直交投影マップといわれる。
【０２３２】
Ｖの部分空間Ｗは、任意のｗ_１、ｗ_２∈ｗ、および任意の実数ｒについてｒｗ_１＋ｗ_２∈ＷであるようなＶの部分集合である。Ｖの各々の部分空間Ｗごとに、ｆ_ｗのＷへの正確に１つの直交投影マップが存在する。
【０２３３】
例えば、Ｎは２であってよく、ｖは全ての実２−ベクトルの集合でよく、ｗはその最初の要素が第２の要素の２倍である全ての２−ベクトルの集合でよい。図１９ではＷは線Ｌで表され、ランダム・ポイントは点線で、ｆ_ｗの下のＷ内の画像へと結合されている。
【０２３４】
図１３のエンコーダ、および図１６のデコーダのような、説明してきた本発明の実施形態は全て、計算の要件は低減するが、特にステゴテキストからコードを抽出する場合に必要な情報は保持するいかなるマトリクスの操作も相当な価値があるように、対数絶対値スペクトログラム内の値のマトリクスが操作されていることに基づいて動作することが理解されよう。ベクトル空間における前述の投影マップの概念がこのようなツールを提供する。したがって、Ａを列間隔がＷであるマトリクスとすると、ｆ_ｗ（ｖ）＝ＢｖであるようなマトリクスＢが存在する。
【０２３５】
以下はＭａｔｌａｂ（ＲＴＭ）プログラミング言語を用いた、必要な投影マトリクスの計算方法の一例である。
【０２３６】
Ａを列間隔がＷであるマトリクスとすると、ｆ_ｗ（ｖ）＝Ｂｖであるように以下のＭａｔｌａｂステートメントによって計算できるマトリクスＢが存在する。
【０２３７】

％ここでＤの対角上の比ゼロ要素を１に置き換え
％ＤをＬと同じサイズになるようにゼロで埋める
ｄ＝ｄｉａｇｆｒｏｍ（Ｄ）；
ｄｎｎｚ＝ｓｕｍ（ｄｋｅｙ＞１ｅ−１０＊ｄｋｅｙ（１））；
Ｄ１＝ｄｉａｇｓｚ（ｏｎｅｓ（ｄｎｎｚ、１）ｓｉｚｅ（Ｌ））；
％Ｂは基底Ｌ内のＶ内の任意のｖの成分を計算することによって動作し、
％Ｖと直交する成分をゼロにし、
％次に直交座標系に戻る
Ｂ＝Ｌ＊Ｄ１＊Ｌ’；
これらのステートメントの最後の行をＢ_０で置き換えると
＝Ｌ（：、１：ｄｎｎｚ）’；
【０２３８】
このように、Ｂ_０は投影マップｆ_ｗを実行するだけではなく、勿論Ｗ＝Ｖであるという些細な例外を伴って、Ｖ用の直交座標系よりも次元が少ないＷ用の直交座標への切換えも行う。
【０２３９】
図１６のデコーダ、およびこのデコーダの動作に関連する方程式を論考する際に、Ｕ’Ｙは以前計算されたカバーテキストと同様のサンプルの統計によって補正されたステゴテキストのセグメントの対数絶対値スペクトログラムを表したものであることが想起されよう。ＷがＵ’Ｙの列によって埋められた部分空間を表し、この受信データが図２１の簡単な例で論考したようにＷへと直交投影されると、電子透かしコードを抽出するために必要な計算は、新たな部分空間へのＹの投影によって情報の過剰な損失が生じない限りは大幅に簡略化することができる。
【０２４０】
このような投影を実行することは攻撃に対するステゴテキストの頑強性をほとんど損なわないことが判明している。
【０２４１】
このように、方程式２５を再び検討すると、投影Ｂ_０を実行することによって今度は^ｄｅｔ（Ｉ＋Ｂ_０Ｕ’Ｙ−Ｂ_０Ｕ’Ｋ）（Ｂ_０Ｕ’Ｙ−Ｂ_０Ｕ’Ｋ）’）を評価することが必要であり、ただし、Ｂ_０は図２０を参照して既に論考したようにｆ_ｗに関連するマトリクスである。
【０２４２】
この評価を実行するためにＢ_０Ｕ’をＢ_０Ｕ’Ｋと共に事前計算し、ＲＯＭに記憶しておくことができる。
【０２４３】
実行されるべき次の段階は、ｄｅｔ（Ｉ＋（Ｂ_０Ｕ’Ｙ−Ｂ_０Ｕ’Ｋ）（Ｂ_０Ｕ’Ｙ−Ｂ_０Ｕ’Ｋ）’）＝ｄｅｔ（Ｃ）^２であることに留意しながら、Ｔ＝（Ｂ_０Ｕ’）Ｙ−（Ｂ_０Ｕ’Ｋ）を評価し、Ｉ＋ＴＴ’を評価し、かつＣ’Ｃ＝ＴＴ’となるようにＣｈｏｌｅｓｋｙ分解を行うことである。Ｃは三角形であるのでｄｅｔ（Ｃ）^２は評価し易い。
【０２４４】
上記が認識されれば、ここで図２０のエンコーダと図１６のエンコーダの相違について論考することができる。
【０２４５】
図２０では、点線のボックス（１２４）は、後述する実施形態の１つの変形だけに存在する制御可能なリサンプラ回路を表している。加えて、ボックス（１２４）と回路（１１６）とを結ぶ点線の接続線も以下に説明する変形だけに存在する。Ｋは以前と同様に、カバーテキストをエンコードするために当初から使用されたキーを表す。前述したように、このキーは次にランダムな整数のシード数によって生成されるランダムなホワイト・ノイズを用い、次に二次元掃引帯域フィルタによってフィルタリングされて生成されたものである。
【０２４６】
マトリクス・マルチプライア（２０１）は前述の事前定義された統計データＵ’と共にＲＯＭ（２０２）に保持されたキーＫをマトリクス乗算してＵ’Ｋを生成する。このデータＵ’はＲＯＭ（２０３）に記憶される。マルチプライア（２０１）の出力は投影マトリクスＢ_０を生成するボックス（２０４）に供給され、この投影マトリクスはマルチプライア（２０５）によってマルチプライア（２０１）の出力で乗算されてＢ_０Ｕ’Ｋが生成される。加えて、（２０４）によって出力されたＢ_０もマトリクス・マルチプライア（２０６）の一方の入力に供給される。他方の入力にはＵ’が供給されるので、マルチプライア（２０６）の出力はＢ_０Ｕ’となる。
【０２４７】
ここで図２０のデコーダは図１６のデコーダと同様に動作し、図１６のエンコーダの素子と同様に動作する図２０のエンコーダの素子には同じ参照番号が付されている。
【０２４８】
このように、マルチプライア（１０３）において、既に定義されたＹの各ブロックはＢ_０Ｕ’で乗算される。同様に（１０６、１０７）において、Ｕ’Ｋではなく値Ｂ_０Ｕ’Ｋがそれぞれ加算および減算される。
【０２４９】
デコーダの第２の実施形態のその他の素子は第１の実施形態の素子と全く同様に動作する。
【０２５０】
ここで、上記で説明したエンコーダの２つの実施形態のベイズ・プロセスに必要な先の統計値の生成手順を説明する必要がある。これは図２２の流れ図に関連して説明する。
【０２５１】
この図のステップＳ１で、複数の音楽サンプルが連結される。音楽サンプルは広範囲の音楽から選択することができ、例えば適当な数のＣＤからの抜粋を再生することによって作成することができる。ＣＤの抜粋はテープ、ライブ、または放送された音楽とミキシングするか、または置き換えることができる。
【０２５２】
この抜粋の最終結果が広範囲の音楽をカバーできる長さの音楽の抜粋となる。勿論、ユーザがデコード目的で適切なデータ・セットを選択できるように、統計データが異なる種類の音楽をベースにできるようにするため、選択された音楽の抜粋をスキューすることもできる。このようにして、統計データのいくつかの異なるセットをＲＯＭ（２０３）内に記憶しておいて、ユーザが適宜に選択することができる。
【０２５３】
ステップＳ２で、連結された音楽サンプルの対数パワー・スペクトログラムが生成される。ステップＳ３で、このようにして得られたパワー・スペクトログラムの列の平均値が計算され、ステップＳ４でこの平均値が個々の列から減算されてＡが算出される。
【０２５４】
後者の２つのステップは、スペクトログラムの行が適切な特性を備えた高域フィルタを通過するようにさせることによって概算することができる。
【０２５５】
ステップＳ５において、ステップＳ４で得られた値の共分散マトリクスが生成され、したがってＥ＝ＡＡ’／Ｎとなる。
【０２５６】
ステップＳ６において、スケール・マトリクスの場合はウィシャート・パラメータがｒ＊Ｅであり、形状パラメータがＫである前述の種類のｄｅｔＶ分布から各列が別個に引き出されるものと想定される。更に、対数ｒが不適切に均一な事前分布を有し、Ｋが不適切に均一な事前分布を有することも想定される。ステップＳ６で、ベイズの定理を用いてγおよびｋのＭＡＰ（最大事後確率）が計算される。
【０２５７】
ステップＳ７でＶがｒＥに等しく、またｋ＝ｋに設定され、これらの値を用いてＵ’が計算される。したがってＵ’はサンプルの対数パワー・スペクトログラムの平均局所共分散マトリクスを単位マトリクスに変換するマトリクスである。最後にステップＳ８でＵ’が記憶される。
【０２５８】
図２０に示したいくつかの変形をここで説明する。
【０２５９】
バッファ（１１５）からタイミング周波数および位相のＭＡＰ値を抽出した結果、最も正確な性能を生じない可能性がある。したがって、説明した２つのデコーダの変形では、考え得るタイミング周波数ωと位相φの全ての範囲が考慮される。ωとφの各々について、ωおよびφに基づいてスライスが行われるバッファ（１１５）からスライスされた値の絶対値を加算し、その結果を累乗することによって、データをＤとすると事後確率Ｐ（ω、φ｜Ｄ）が推定される。
【０２６０】
前述のデコーダの場合、その後でＰ（ω、φ｜Ｄ）が最大値になるωとφの値を用いて、バッファ（１１５）内の値がスライスされる。
【０２６１】
説明している変形の代わりに、最初にリサンプラ回路（１２３）によって自動入力をリサンプリングして、ステゴテキストを拡張または圧縮する。次に、ランダムなサンプルを、クロック抽出回路（１１６）の代わりとなるランダムサンプラによってｐ（ω、φ｜Ｄ）から引き出す。この手順は、実際に真の値が、より低いもののより高い確率を含む広範囲のピークに属している場合に、ＭＡＰが分布内の狭く高いスパイクとして出現することがあるということを考慮に入れる。
【０２６２】
そこで、前述した回路（１１６）内のバッファ（１１５）のランダムなサンプリングがリサンプラ（１２３）と連係して行われる様式を検討する。
【０２６３】
最初に、ステゴテキストが６％未満だけ拡張（圧縮）されている場合は、回路（１１６）がキー（Ｋ）の性質によってデータ・スライス回路（１１７）用の適宜のタイミングを即座に選択し、同様に回路（１２３）に適正な補正値を出力して、検知された拡張（圧縮）を解除するようにする可能性が高い。
【０２６４】
これに対して、拡張（圧縮）が６％以上である場合は、バッファ（１１５）内の値、ひいては計算されたＰ（ω、φ｜Ｄ）の値は不適正であり、全て同じ大きさを有する。その結果、乱数値がリサンプラ回路に送られる。ここでは２つの場合を検討する必要がある。第１に、フィードバックされた値が偶然に適正値の±６％内にある場合である。可能な拡張の全範囲が±１０％である場合は、これが生ずる可能性は少なくとも１／２である。新たにリサンプルされたステゴテキストがバッファ（１１５）に到達すると、回路（１１６）は現在必要な適正な補正を決定することができる。そこから、適正な値が回路（１２３）にフィードバックされ、回路（１１７）に送られる。
【０２６５】
第２に、回路（１２３）にフィードバックされた値が適正値の±６％に含まれない場合である。これが再び不適正である場合は、フィードバックされる次の値はランダムに選択され、前述の手順が継続される。それぞれの反復ごとに適正な値を選択する確率は１／２であるので、適正なタイミングと位相が評価されるまで反復は数回しか必要ない。勿論、リサンプラ回路は入力されたステゴテキストを不変のままに止めることによって始動できる。
【０２６６】
最後に、正確に再現可能な入力を処理する全てのデコーダの共通の問題点は、ある環境では特定の入力が適正にデコードされず、入力にいずれかの不規則性がない場合は、入力が繰り返されるごとに同じ問題が再び生ずることである。したがって、例えば図１６および図２１に関連して前述したデコーダ、およびその変形がこの問題を回避する手段を有するようなデコーダを提供することが提案される。その１つは、デコーダへの入力に真にランダムなノイズを単に加算することである。これにはデコーダの性能を劣化させるという欠点がある。
【０２６７】
別の代替形態は、所定の範囲内で真にランダムな長さを有しているゼロ信号、またはランダム・ノイズの周期で実際の入力がデコードされるように処理することである。
【０２６８】
前述の明細書ではエンコーダおよびデコーダの様々な実施形態が「フィルタ」、「マルチプライア」、「バッファ」および「回路」等のような回路素子に関して定義されてきたことが理解されよう。しかし、信号の実際のレコーディング、または再生とは別個に、これらの回路素子は全て、適宜のソフトウェア操作で代用することができる。したがって、特に図１３を参照して説明したエンコーダはその全ての機能的な様相で、適宜のコードを受信する汎用コンピュータにより代用することができる。このようなコードの例は、図２０のデコーダで使用されるマトリクスＢ_０のジェネレータに関連して得られる。したがって、図１３、１６、および２０に示した全てのステップとブロックの機能はソフトウェア・ステップとして実行されることができる。
【０２６９】
デコーダの実施形態の場合、それらがステゴテキストをデコードするだけではなく、例えば音楽のような出力としてステゴテキストを生成する個々のシステムで使用される場合は、デコーダは、場合によっては超大規模集積回路を使用する集積マイクロプロセッサ（単数または複数）の形態でもよい。
【図面の簡単な説明】
【図１】
ステゴテキストを生成するように付加的なデータを伴うカバーテキスト信号をエンコードし、かつデコードするためのシステムのブロック図である。
【図２】
ステゴテキストを生成し、かつデコードするために図１の実施形態で使用できるエンコーダおよびデコーダのブロック図である。
【図３】
音楽の一節のパワー・スペクトルのグラフである。
【図４】
パワー・スペクトログラムが補正された場合の変調パターンの重複を示したグラフである。
【図５】
畳み込みエンコーダのブロック図である。
【図６】
図２の実施形態よりも詳細に示したエンコーダ／デコーダのブロック図である。
【図７】
ステゴテキストへの時間−拡張による侵害を示したグラフである。
【図８】
図１のシステムの本発明の実施形態に従って使用されるフィルタのパラメータを示したグラフである。
【図９】
連続するキーのフィルタ特性を示したグラフである。
【図１０】
掃引帯域フィルタを使用した一次元のホワイト・ノイズ信号を示したグラフである。
【図１１】
各方向に掃引フィルタを使用した二次元のホワイト・ノイズ信号の結果を示したグラフである。
【図１２】
相関に対する拡張の影響を示したグラフである。
【図１３】
本発明に基づくエンコーダの一実施形態のブロック図である。
【図１４】
異なる種類のノイズを示したグラフである。
【図１５】
異なる種類のノイズを示したグラフである。
【図１６】
図１６は、図１６Ａ及び図１６Ｂの合体した状態を示す図である。
【図１６Ａ】
図１６Ａは図１に示したシステムのデコーダの一実施形態の前半を示す図である。
【図１６Ｂ】
図１６Ｂは図１に示したシステムのデコーダの一実施形態の後半を示す図である。
【図１７】
図１６のデコーダのバッファの内容を示したグラフである。
【図１８】
図１７に示した値の処理結果を示したグラフである。
【図１９】
図１６および２０のデコーダの一部を形成する最大尤度畳み込みコード・デコーダの動作を示したグラフである。
【図２０】
図２０は、図２０Ａ及び図２０Ｂの合体した状態を示す図である。
【図２０Ａ】
図２０Ａは、デコーダの第２の実施形態の前半を示す図である。
【図２０Ｂ】
図２０Ｂは、デコーダの第２の実施形態の後半を示す図である。
【図２１】
ベクトル空間での投影マップを示したグラフである。
【図２２】
図１６および２０のデコーダで使用される音楽に関するパラメータの生成を示した図である。
【図２３】
キーの生成を示したグラフである。

Claims

カバーテキスト信号をエンコードしてステゴテキストを生成するためのエンコーダであって、
カバーテキスト信号の高速フーリエ変換および方形極変換を実行する第１の変換手段であって、それによって、カバーテキスト信号を対数パワー・スペクトログラムへと変換する、第１の変換手段と、
一つのキーまたは各キーが所定サイズの二次元パターンの形式である少なくとも１つのキーを供給する手段と、
対数パワー・スペクトログラム領域内でキーの倍数を、または複数のキーがある場合には１つまたは複数のキーの倍数を、変換されたカバーテキスト信号のブロックに加算または減算するマルチプライアと、
所望のコードを表すデータに従ってマルチプライアによる前記キー（単数または複数）の加算または減算を制御する手段と、
変調されたカバーテキスト信号の極方形変換および逆高速フーリエ変換を実行する第２の変換手段であって、それによりステゴテキストを生成する、第２の変換手段と、を備えたエンコーダ。
前記第１の変換手段は、高速フーリエ変換および方形極変換を実行する前に前記カバーテキストを重複セグメントに分割するようにされており、各セグメントが両端で漸減するような関数で前記カバーテキストの各セグメントを乗算するためのマルチプライアを含む請求項１に記載のエンコーダ。
前記第１の変換手段は各セグメントを対数パワー・スペクトログラム領域へと変換して、前記キーと同じ長さと同じ列数を有するブロックを生成するようにされている請求項１または２に記載のエンコーダ。
前記カバーテキスト信号の対数パワー・スペクトログラムの各ブロックはＸ列幅であると共に、マルチプライアは、キーが少なくとも部分的に、約２ｘ／Ｔ回だけ各スペクトログラム・ブロックに適用されるように、前記キーをＴステップでブロックに適用するようにされており、ただしＴは整数のキー列数である請求項３に記載のエンコーダ。
前記第２の変換手段は、前記カバーテキスト信号の各変調済みブロックで極方形変換および逆高速フーリエ変換を実行し、かつその結果生じたセグメントを合成してステゴテキストを生成するようにされている先行の請求項のいずれか一項に記載のエンコーダ。
電子透かしコード・データを使用して、前記カバーテキストの電子透かしを制御する前に前記電子透かしコード・データをエラー補正エンコードするためのエラー補正畳み込みエンコーダを含む先行の請求項のいずれか一項に記載のエンコーダ。
カバーテキスト信号をエンコードしてステゴテキストを生成する方法であって、
カバーテキスト信号の高速フーリエ変換および方形極変換を実行することであって、それにより前記カバーテキスト信号をパワー・スペクトログラム領域へと変換する、実行することと、
一つのキーまたは各キーが所定サイズの二次元パターンの形式である少なくとも１つのキーを供給することと、
対数パワー・スペクトログラム領域内でキーの倍数を、または複数のキーがある場合には１つまたは複数のキーの倍数を、変換されたカバーテキスト信号のセグメントに加算または減算することと、
所望のコードを表すデータに従って加算／乗算ステップで前記キー（単数または複数）の倍数の加算または減算を制御することと、
変調されたカバーテキスト信号の極方形変換および逆高速フーリエ変換を実行することであって、それによりステゴテキストを生成する、実行することと、を含む方法。
高速フーリエ変換および方形極変換を実行する前に前記カバーテキストを重複セグメントに分割し、かつ各セグメントが両端で漸減するような関数で前記カバーテキストの各セグメントを乗算することを含む請求項７に記載の方法。
前記カバーテキストの各セグメントは、対数パワー領域へと変換されて、前記キーと同じ高さ、および同じ列数を有するブロックが生成されると共に、前記カバーテキスト信号の対数パワー・スペクトログラムの各ブロックはＸ列幅であり、マルチプライアは前記キーが少なくとも部分的に、２ｘ／Ｔ回だけ各スペクトログラム・ブロックに適用されるように、前記キーをＴステップでブロックに適用するようにされており、ただしＴは整数のキー列数である請求項７または８のいずれかに記載の方法。
変調済みのカバーテキスト信号のステゴテキストへの変換は、カバーテキスト信号の各変調済みブロックで極方形変換および逆高速フーリエ変換を実行し、かつその結果生じたセグメントを合成することによって行われると共に、極方形変換および逆高速フーリエ変換の結果生じた各セグメントは、合成してステゴテキストを生成する前に各セグメントが両端で漸減するような関数で乗算される請求項７、８、または９のいずれか一項に記載の方法。
プロセッサを制御して、請求項７ないし９のいずれか一項に記載の方法を実行するためのプロセッサ実行可能命令、または、プロセッサを制御して、請求項７ないし９のいずれか一項に記載の方法を実行するためのプロセッサ実行可能命令を伝える電気信号を記憶する記憶媒体。
請求項７ないし９のいずれか一項に記載の方法によってエンコードされたステゴテキストを読み取り可能なフォーマットで、または請求項７から９のいずれか一項に記載の方法によってエンコードされたステゴテキストを伝える信号を記憶する記憶媒体。
カバーテキスト信号の対数パワー・スペクトログラムを、１つのキーまたは各キーの倍数が、それによってステゴテキストが生成された電子透かしコードのデータに従って前記対数領域でカバーテキスト・パワー・スペクトログラムに加算または減算された少なくとも１つのキー（Ｋ）で変調し、かつ変調されたパワー・スペクトログラムをカバーテキストの元の領域に戻すことによって生成されたステゴテキストをデコードするデコーダであって、
ステゴテキスト信号の高速フーリエ変換および方形極変換を実行する変換手段であって、それによりステゴテキスト信号を対数パワー・スペクトログラム領域に変換する、変換手段と、
前記元のカバーテキスト信号の対数パワー・スペクトログラムがそれによってエンコードされた前記キー（単数または複数を）を供給する手段と、
前記対数パワー領域で前記対数パワー・スペクトログラムのブロックから前記キー（単数または複数）の正と負の倍数を減算し、かつ所定の統計モデルに従ってカバーテキストの未修正ブロックを表す前記減算の結果の確率を評価するための計算手段と、
計算手段の出力からエンコードされたデータを復元する抽出手段と、を備えたデコーダ。
評価された確率を対数比の値として記憶する手段、および記憶された値から個々のタイムスライスを抽出する手段を含むと共に、前記所定の統計モデルは、平均および共分散マトリクス・パラメータがタイムスライス毎に変化しても変化なくてもよい多次元ガウス分布に従ってスペクトログラムの個々のタイムスライスが分布されるものとして想定される請求項１３に記載のデコーダ。
前記所定の統計モデルは、平均値が一定であり、予め定まっているものとして、あるいは平均パラメータがタイムスライスごとに一定であるが、予め定まっておらず、別の分布から引き出されるものとして、あるいは平均値がキーの幅を超えない分だけ離れたタイムスライス間で異なっておらず、ある別の分布から引き出されるものとして想定される請求項１４に記載のデコーダ。
前記所定の統計モデルは、共分散マトリクス・パラメータが一定であり、かつ予め定まっているものとして、または共分散マトリクス・パラメータがタイムスライスごとに一定であるが、予め定まっておらず、別の分布から引き出されるものとして想定され、あるいは共分散マトリクス・パラメータが、前記キーの幅を超えない分だけ離れたタイムスライス間で異なっておらず、ある別の分布から引き出されるものとして想定される請求項１４または１５のいずれかに記載のデコーダ。
前記別の分布は不適切な一様分布である請求項１４、１５、または１６のいずれか一項に記載のデコーダ。
前記別の分布はパラメータｋ、ｖを有するウィシャート分布である請求項１６に記載のデコーダ。
前記先行の統計モデルは、カバーテキストの複数のサンプル・セクションを結合し、結合されたサンプルの対数パワー・スペクトログラムを生成し、かつ前記対数パワー・スペクトログラムから共分散マトリクス（Ｕ’）を生成することによって生成されたものであり、該マトリクス（Ｕ’）はサンプルの対数パワー・スペクトログラムの平均局所共分散マトリクスを単位行列へと変換する請求項１２に記載のデコーダ。
先行のサンプル・マトリクス（Ｕ’）を供給する手段と、カバーテキストのパワー・スペクトログラムがそれを用いて先行のサンプル・マトリクス（Ｕ’）でエンコードして、少なくとも１つのマトリクス（Ｕ’Ｋ）を生成するキー（単数または複数）（Ｋ）のマトリクス乗算の結果を供給する手段と、
前記カバーテキストのパワー・スペクトログラムの連続セグメント（Ｙ）を供給する手段と、
各セグメント（Ｙ）を前記マトリクス（Ｕ’）で乗算してマトリクス（Ｕ’Ｙ）を生成する手段と、
ベイズの定理を用いてそれぞれのマトリクス（Ｕ’Ｙ）および（Ｕ’Ｋ）から、データ・ビットがある場合にはその確率の対数比が「＋１」、または「−１」であることをそれぞれ示す一連の値を導出する手段と、を備えた請求項１９に記載のデコーダ。
対数領域でステゴテキストのパワー・スペクトログラムを前記先行サンプル・マトリクス（Ｕ’）で乗算する第１のマトリクス乗算手段であって、それによりマトリクス（Ｕ’Ｆ）を生成する、第１のマトリクス乗算手段と、
前記マトリクス（Ｕ’Ｆ）を、長さと高さが前記キー（単数または複数）（Ｋ）に対応するブロック（Ｙ）へと分割するための手段と、
マトリクス（Ｕ’Ｋ）を各ブロック（Ｙ）にそれぞれ加算および減算する手段であって、それにより（Ｕ’Ｙ＋Ｕ’Ｋ）および（Ｕ’Ｙ−Ｕ’Ｋ）を生成する、加算および減算する手段と、
前記マトリクス（Ｕ’Ｙ＋Ｕ’Ｋ）および（Ｕ’Ｙ−Ｕ’Ｋ）の各々のスケーリングされた対数行列式を生成する手段と、
（Ｕ’Ｙ＋Ｕ’Ｋ）のスケーリングされた対数行列式を（Ｕ’Ｙ−Ｕ’Ｋ）から減算する手段であって、それにより当該の各データ・ビットの確率の対数比が「−１」または「＋１」のいずれであるかを表す前記一連の値を生成する、減算する手段と、を備えた請求項２０に記載のデコーダ。
前記スケーリングされた対数行列式を生成する手段は、（Ｕ’Ｙ＋Ｕ’Ｋ）および（Ｕ’Ｙ−Ｕ’Ｋ）を生成する手段と、それぞれの対数行列式を−〔ｋ＋Ｍ〕／２でスケーリングする手段とを備え、ただし、ｋはウィシャート分布の形状パラメータを表し、Ｍはキー内の列数を表し、各キーＫはｘ列幅、ｙビット高を有し、かつ、ステゴテキストは各キーＫをＴステップでステゴテキストのブロック（Ｙ）に加算または減算することによって生成されたものであり、ただしＴは各キーを各スペクトログラム・ブロックに複数回適用できるように整数のキー列数である、請求項１８に記載の、および請求項１８に従属する場合の請求項１９ないし２１のいずれか一項に記載のデコーダ。
前記対数比の値を記憶するバッファと、該バッファ内の値からクロックを抽出するためのクロック抽出手段とを含むと共に、該クロック抽出手段は、入力されたステゴテキストの正規クロックを利用して前記バッファ内の値の一連のスライス・ポイントを生成し、かつ前記バッファ内のデータに埋め込まれたコード用のクロックとしてゼロからの総合偏差が最大である一連のポイントを選択する請求項１３に記載の、および請求項１３に従属する場合の請求項１４から２２のいずれか一項に記載のデコーダ。
前記クロック抽出手段は、前記カバーテキストを拡張または圧縮できるようにステゴテキストをリサンプルするようにされた制御可能なリサンプラと、
前記バッファのコンテンツから無作為サンプルを引き出す手段と、
前記リサンプラの出力が前記コードの抽出を可能にする周波数になるまで、前記バッファから無作為に抽出されたサンプルに応答して前記リサンプラを制御する手段と、を備えた請求項２３に記載のデコーダ。
前記クロック抽出手段の動作に応答して前記バッファから出力された一連の出力値をスケーリングする手段であって、それにより前記値が１＋または１−約α／σの標準偏差を有するようにする、スケーリングする手段を備え、ただしαは前記バッファから抽出された一連の値（Ｃ_ｎ）の絶対値の平均値であり、σ＝ｓｔｄ（｜Ｃ_ｎ｜−α）である請求項２３または２４に記載のデコーダ。
前記所定の統計モデルから得られた統計データに従って、スケーリングされた値Ｃ_ｎを補正する手段を含むと共に、該補正は下記の関数：

を適用することによって実行され、
ｒおよびｍは事前に計算されたステューデント分布のパラメータである請求項２５に記載のデコーダ。
マトリクス（Ｕ’）はマトリクス（Ｂ_０Ｕ’）を表し、ただし（Ｂ_０）はマトリクス（Ｕ’）を（Ｕ’）の元の座標系よりも次元が少ない直交座標へと変換するマトリクスである、請求項１９に記載の、または請求項１９に従属する場合の請求項２０ないし２６のいずれか一項に記載のデコーダ。
カバーテキスト信号の対数パワー・スペクトログラムを、１つのキーまたは各キーの倍数が、それによってステゴテキストが生成された電子透かしコードのデータに従って前記対数領域でカバーテキスト・パワー・スペクトログラムに加算または減算された少なくとも１つのキー（Ｋ）で変調し、かつ変調されたパワー・スペクトログラムをカバーテキストの元の領域に戻すことによって生成されたステゴテキストをデコードする方法であって、
ステゴテキスト信号の高速フーリエ変換および方形極変換を実行することであって、それにより前記ステゴテキスト信号を対数パワー・スペクトログラム領域に変換する、実行することと、
前記元のカバーテキスト信号の対数パワー・スペクトログラムがそれによってエンコードされたキー（単数または複数を）を供給することと、
対数パワー領域で対数パワー・スペクトログラムのブロックからキー（単数または複数）の正と負の倍数を減算し、かつ所定の統計モデルに従ってカバーテキストの未修正ブロックを表す前記減算の結果の確率を評価することと、
計算手段の出力からエンコードされたデータを復元することと、を含む方法。
評価された確率を対数比の値として記憶すること、および記憶された値から個々のタイムスライスを抽出することを含むと共に、前記所定の統計モデルは、多次元ガウス分布に従ってスペクトログラムの個々のタイムスライスが分布されるものとして想定される請求項２８に記載の方法。
前記所定の統計モデルは、共分散マトリクス・パラメータがタイムスライスごとに一定であるが、予め定まっておらず、別の分布から引き出されるものとして想定され、または前記キーの幅を超えない分だけ離れたタイムスライス間で異なっておらず、ある別の分布から引き出されるものとして想定される請求項２９に記載の方法。
別の分布はパラメータｋ，ｖを有するウィシャート分布である請求項３０に記載の方法。
前記所定の統計モデルはカバーテキストの複数のサンプル・セクションを結合し、該結合されたサンプルの対数パワー・スペクトログラムを生成し、かつ前記対数パワー・スペクトログラムから共分散マトリクス（Ｕ’）を生成することによって生成されたものであり、該マトリクス（Ｕ’）は前記サンプルの対数パワー・スペクトログラムの平均局所共分散マトリクスを単位行列へと変換する請求項２８ないし３１のいずれか一項に記載の方法。
先行のサンプル・マトリクス（Ｕ’）を供給することと、
カバーテキストのパワー・スペクトログラムがそれを用いて先行のサンプル・マトリクス（Ｕ’）でエンコードされたキー（単数または複数）（Ｋ）のマトリクス乗算の結果を供給し、それによって少なくとも１つのマトリクス（Ｕ’Ｋ）を生成することと、
前記カバーテキストのパワー・スペクトログラムの連続セグメント（Ｙ）を供給することと、
各セグメント（Ｙ）を前記マトリクス（Ｕ’）で乗算し、それによりマトリクス（Ｕ’Ｙ）を生成することと、
ベイズの定理を用いてそれぞれのマトリクス（Ｕ’Ｙ）および（Ｕ’Ｋ）から、データ・ビットがある場合はその確率の対数比が「＋１」、または「−１」であることをそれぞれ示す一連の値を導出することと、を含む請求項３２に記載の方法。
対数領域でステゴテキストのパワー・スペクトログラムを前記先行サンプル・マトリクス（Ｕ’）で乗算する第１のマトリクス乗算手段を使用し、それによりマトリクス（Ｕ’Ｆ）を生成することと、
前記マトリクス（Ｕ’Ｆ）を長さと高さがキー（単数または複数）（Ｋ）に対応するブロック（Ｙ）へと分割することと、
前記マトリクス（Ｕ’Ｋ）を各ブロック（Ｙ）にそれぞれ加算および減算し、それにより（Ｕ’Ｙ＋Ｕ’Ｋ）および（Ｕ’Ｙ−Ｕ’Ｋ）を生成加算および減算することと、
前記マトリクス（Ｕ’Ｙ＋Ｕ’Ｋ）および（Ｕ’Ｙ−Ｕ’Ｋ）のそれぞれのスケーリングされた対数行列式を生成することと、
前記（Ｕ’Ｙ＋Ｕ’Ｋ）のスケーリングされた対数行列式を前記（Ｕ’Ｙ−Ｕ’Ｋ）から減算し、それにより当該の各データ・ビットの確率の対数比が「−１」または「＋１」のいずれであるかを表す前記一連の値を生成することと、を含む請求項３３に記載の方法。
（Ｕ’Ｙ＋Ｕ’Ｋ）および（Ｕ’Ｙ−Ｕ’Ｋ）の対数行列式が生成され、次にそれぞれの対数行列式が−〔ｋ＋Ｍ〕／２でスケーリングされ、ただし、ｋはウィシャート分布の形状パラメータを表し、Ｍはキー内の列数を表す請求項３１に記載の、および請求項３１に従属する場合の請求項３２ないし３４のいずれか一項に記載の方法。
各キー（Ｋ）はｘ列幅、ｙビット高を有し、ステゴテキストは各キー（Ｋ）をＴステップでステゴテキストのブロック（Ｙ）に加算または減算することによって生成されたものであり、ただしＴは各キーを各スペクトログラム・ブロックに複数回適用できるように整数のキー列数である請求項２８ないし３５のいずれか一項に記載の方法。
前記対数比の値をバッファに記憶し、かつ該バッファ内の値から個々のタイムスライスを抽出するために使用されるクロックを抽出することと、入力されたステゴテキストの正規クロックを利用して前記バッファ内の値の一連のスライス・ポイントを生成することと、前記バッファ内のデータに埋め込まれたコード用のクロックとしてゼロからの総合偏差が最大である一連のポイントを選択することとを含む、請求項２９に記載の、および請求項２９に従属する場合の請求項３０ないし３６のいずれか一項に記載の方法。
前記カバーテキストを拡張または圧縮できるようにステゴテキストを制御可能にリサンプルすることと、
前記バッファのコンテンツから無作為サンプルを引き出すことと、
前記リサンプラの出力が前記コードの抽出を可能にする周波数になるまで、前記バッファから無作為に抽出されたサンプルに応答して前記リサンプラを制御することと、を備えた請求項３７に記載の方法。
前記クロック抽出手段の動作に応答して前記バッファから出力された一連の出力値Ｃ_ｎをスケーリングすることであって、それにより、前記値が１＋または１−約α／σの標準偏差を有するようにする、スケーリングすることを備え、ただしαは抽出された一連の値（Ｃ_ｎ）の絶対値の平均値であり、σ＝ｓｔｄ（｜Ｃ_ｎ｜−α）である請求項３７または３８に記載の方法。
前記所定の統計モデルから得られた統計データに従って、スケーリングされた値を補正する請求項３９に記載の方法。
前記補正は抽出された一連の値（Ｃ_ｎ）に下記の関数：

を適用することによって実行され、
ｒおよびｍは事前に計算されたステューデント分布のパラメータである請求項４０に記載の方法。
前記マトリクス（Ｕ’）はマトリクス（Ｂ_０Ｕ’）を表し、ただし（Ｂ_０）はマトリクス（Ｕ’）を（Ｕ’）の元の座標系よりも次元が少ない直交座標へと変換するマトリクスである、請求項３２に記載の、または請求項３２に従属する場合の請求項３３ないし４１のいずれか一項に記載の方法。
請求項２８ないし４２のいずれか一項に記載の方法を実行するためにプロセッサを制御するためのプロセッサ実行可能命令を記憶する記憶媒体。
請求項２８ないし４２のいずれか一項に記載の方法を実行するためにプロセッサを制御するためのプロセッサ実行可能命令を伝える電気信号。
カバーテキストを電子透かし処理するためのキーを生成するための電子透かしキー・ジェネレータであって、所定の高さと幅の二次元ノイズ・パターンを生成するための手段と、一次元のノイズ信号をパターン内の位置によって変化する遮断周波数でフィルタリングするための手段とを備えた電子透かしキー・ジェネレータ。
位置による変化は、パターン内の基準ポイントに対する位置の前記次元内の座標係数にほぼ反比例する請求項４５に記載のキー・ジェネレータ。
前記基準ポイントは前記次元の中心、または他の次元の一端にある、請求項４６に記載のキー・ジェネレータ。
前記フィルタリング手段は低域フィルタとして機能し、タイムスケールの閾値τよりも短いタイムスケールを伴う周波数成分を有さないようにノイズ・パターンをフィルタリングし、ただしτ＝Ｃ｜ｔ｜であり、Ｃはピクセル毎のサイクル当たり０．０５〜０．４ピクセルの範囲の正の定数であり、ｔは基準ポイントに対する前記次元内の座標であり、かつ前記一次元に対して横方向のホワイトノイズ信号をフィルタリングするための第２の手段を含む、請求項４３ないし４７のいずれか一項に記載のキー・ジェネレータ。
第２のフィルタリング手段は、ノイズ・パターンがτ＝Ｃ｜ｔ｜よりも短いタイムスケールを伴う周波数成分を有さないように、第２の次元内の座標係数と反比例して変化する遮断周波数を有しており、ただし、ｔは基準ポイントに対する第２の次元内の座標であり、さらに、一様に分布された乱数を生成するために数値シード入力に応答する乱数ジェネレータを含み、
上記のように生成された乱数を１−ｄガウス分布された乱数へと変換するための変換手段と、
前記ガウス分布された乱数を二次元のノイズ・パターンへと再構成するための手段とを含むと共に、乱数を生成するための前記乱数ジェネレータはＴａｕｓｗｏｒｔｈジェネレータであり、変換手段はボックス・コックス変換方式を用いる、請求項４８に記載のキー・ジェネレータ。
カバーテキストを電子透かし処理するためのキーを生成する方法であって、所定の高さと幅の二次元ノイズ・パターンを生成することと、一次元のノイズ信号をパターン内の位置によって変化する遮断周波数でフィルタリングすることとを含み、位置による変化は、パターン内の基準ポイントに対する位置の前記次元内の座標係数とほぼ反比例し、前記フィルタリングはタイムスケールの閾値τよりも短いタイムスケールを伴う周波数成分を有さないようにノイズ・パターンをフィルタリングする低域フィルタとして機能し、ただしτ＝Ｃ｜ｔ｜であり、Ｃはピクセル毎のサイクル当たり０．０５〜０．４ピクセルの範囲の正の定数であり、ｔは基準ポイントに対する前記次元内の座標である方法。
請求項５０に記載の方法によって生成されるキーを記憶する記憶媒体、または請求項５０に記載の方法によって生成されるキーを伝える電気信号。
カバーテキスト信号をエンコードしてステゴテキストを生成するためのエンコーダであって、
前記カバーテキスト信号の高速フーリエ変換および方形極変換を実行する変換手段であって、それにより前記カバーテキスト信号を対数パワー・スペクトログラムへと変換する、変換手段と、請求項５０に記載の方法によって生成された二次元ノイズ・パターンの形式のキーを供給する手段と、
電子透かしコードに従って前記対数パワー・スペクトログラムをキーで変調する手段と、を備えたエンコーダ。