以下、本発明の実施形態について図面を参照して詳細に説明する。
(1.本発明の基本概念)
最初に、本発明の基本概念について説明しておく。本発明では、特許文献3と同様にエイリアシングと呼ばれる折り返し歪みを利用して、複製を防止したい原音響信号に、警告メッセージや妨害音等の異なる音響信号を埋め込み、改変音響信号を得る処理を行う。埋め込まれた異なる音響信号は、改変音響信号の通常再生時には聴き取ることができないが、再生された改変音響信号を録音して再サンプリングされ複製された複製音響信号(複製方法はデジタルコピーであるか、アナログコピーであるかは問わないが、原音響信号と同一のサンプリング周波数による複製を防止する場合にはアナログコピーに限定される)を再生すると、異なる音響信号に基づく警告メッセージや妨害音等が可聴な状態で再生される。
図1は、エイリアシングの原理を示す図である。このうち、図1(a)は、原音響信号の信号波形、図1(b)は図1(a)の原音響信号をサンプリング周波数Fsでサンプリングしたサンプリングデータの直線近似波形を示している。原音響信号に対して、サンプリング周波数Fsでサンプリングを行うと、ナイキスト周波数Fs/2を超える高周波の信号成分が、Fs/2を中心に低域側に折り返され、Fs/2以下の低域信号成分として誤解析され重畳されてしまう。これが、エイリアシングである。図1の例では、サンプリング周波数Fsでサンプリングを行うことにより、周波数Fs/2〜Fsの信号成分は周波数方向に反転して重畳され、周波数Fs〜3・Fs/2の信号成分は周波数方向に2回反転して元の向きで重畳される。図1(b)の例では、3種のスペクトル成分を重ねて表示しているが、実際には複素ベクトルで加算される。
図2は、本発明の基本原理を示す図である。図2において、図2(a)は、サンプリング周波数Fsでサンプリングされた原音響信号の信号波形、図2(b)は、サンプリング周波数Fsでサンプリングされた異なる音響信号の信号波形、図2(c)は、本発明による埋め込み処理の結果得られた改変音響信号の信号波形、図2(d)は、改変音響信号をなんらかの複製手段で再サンプリングして得られた複製音響信号の信号波形である。
図2(a)に示した原音響信号、図2(b)に示した異なる音響信号は、ともにサンプリング前にハイカットフィルタ処理により高域成分を削除し、エイリアシングが生じていないものを用いる。本発明では、図1(a)に示した原音響信号に対してあらかじめ同サンプリング周波数を2・Fsに拡大して、図2(b)に示した異なる音響信号を周波数Fs/2を中心に高域側へ折り返したものをサンプリング周波数が拡大された原音響信号に合成し、図2(c)に示す改変音響信号を得る。このようにして得られた図2(c)に示す改変音響信号を再生した場合、Fs/2を人間の可聴域より高い値(例えば、22.05kHz)に設定しておくことにより、Fs/2より高い異なる音響信号に由来する信号成分に基づく音は、人間にはほとんど聴こえない。図2(c)に示す改変音響信号を、複製してサンプリング周波数Fsで再サンプリングすると、図2(d)に示す複製音響信号が得られる。図2(d)に示す複製音響信号は、エイリアシングが発生し、異なる音響信号に由来する信号成分が、人間の可聴域であるFs/2以下に折り返されるため、異なる音響信号として記録された警告メッセージや妨害音等が原音響信号として記録された音とともに人間に聴こえることになる。警告メッセージや妨害音が音楽に重ねて聴こえると、正常な状態で音楽を鑑賞することができない。このため、複製に対する抑止力が働くことになる。
(2.1.埋め込み装置の構成)
次に、本発明に係る音響信号に対する異なる音響信号の埋め込み装置について説明する。図3は、本発明に係る音響信号に対する異なる音響信号の埋め込み装置のハードウェア構成図である。音響信号に対する異なる音響信号の埋め込み装置は、汎用のコンピュータで実現することができ、図3に示すように、CPU1(CPU: Central Processing Unit)と、コンピュータのメインメモリであるRAM2(RAM: Random Access Memory)と、CPU1が実行するプログラムやデータを記憶するための大容量の記憶装置3(例えば、ハードディスク、フラッシュメモリ等)と、キーボード、マウス等のキー入力I/F(インターフェース)4と、外部装置(データ記憶媒体等)とデータ通信するためのデータ入出力I/F(インターフェース)5と、表示装置(ディスプレイ)に情報を送出するための表示出力I/F(インターフェース)6と、を備え、互いにバスを介して接続されている。
図4は、本発明に係る音響信号に対する異なる音響信号の埋め込み装置の構成を示す機能ブロック図である。図4において、10は音響フレーム読込手段、20は周波数変換手段、30は周波数成分改変手段、40は周波数逆変換手段、50は改変音響フレーム出力手段、60は記憶手段、61は音響信号記憶部、62は改変音響信号記憶部である。なお、図4に示す装置は、ステレオ音響信号、モノラル音響信号あるいは3チャンネル以上のサラウンド音響信号のいずれにも対応可能であるが、本実施形態では、2チャンネルのステレオ音響信号に対して処理を行う場合について説明していく。
音響フレーム読込手段10は、原音響信号である第1音響信号、異なる音響信号である第2音響信号それぞれの各チャンネルから所定数のサンプルを1音響フレームとして読み込む機能を有している。周波数変換手段20は、音響フレーム読込手段10が第1音響信号から読み込んだ音響フレーム(以下、第1音響フレームという。)、第2音響信号から読み込んだ音響フレーム(以下、第2音響フレームという。)をフーリエ変換等により周波数変換して周波数次元の複素数のスペクトルを生成する機能を有している。周波数成分改変手段30は、第1音響フレームから得られたスペクトルを、第2音響フレームから得られたスペクトルを用いて改変する機能を有している。周波数逆変換手段40は、改変されたスペクトル集合を含む複数の複素数のスペクトルに対して周波数逆変換を行うことにより、時間次元の改変音響フレームを生成する機能を有している。改変音響フレーム出力手段50は、生成された改変音響フレームを順次出力する機能を有している。
記憶手段60は、第1音響信号、第2音響信号を記憶した音響信号記憶部61と、改変音響信号を記憶する改変音響信号記憶部62を有しており、その他処理に必要な各種情報を記憶するものである。
図4に示した各構成手段は、現実には図3に示したように、コンピュータおよびその周辺機器等のハードウェアに専用のプログラムを搭載することにより実現される。すなわち、コンピュータが、専用のプログラムに従って各手段の内容を実行することになる。
図3の記憶装置3には、CPU1を動作させ、コンピュータを、音響信号に対する異なる音響信号の埋め込み装置として機能させるための専用のプログラムが実装されている。この専用のプログラムを実行することにより、CPU1は、音響フレーム読込手段10、周波数変換手段20、周波数成分改変手段30、周波数逆変換手段40、改変音響フレーム出力手段50、記憶手段60としての機能を実現することになる。また、記憶装置3は、処理に必要な様々なデータを記憶する。
(2.2.埋め込み装置の処理動作)
(2.2.1.第1の実施形態)
次に、図4に示した音響信号に対する異なる音響信号の埋め込み装置の処理動作について説明する。図5は、本実施形態に係る音響信号に対する異なる音響信号の埋め込み装置の処理動作を示すフローチャートである。本実施形態では、第1音響信号、第2音響信号ともに、サンプリング周波数Fsとして96kHz、48kHz(映画など映像・放送業務用)または44.1kHz(CDなど民生用)でサンプリングしたものを用いる。音響フレーム読込手段10は、第1音響信号記憶部61に記憶されたステレオの第1音響信号の左右の各チャンネルから、それぞれ所定数Nのサンプルを1つの第1音響フレームとして読み込む(ステップS1)。同様に、音響フレーム読込手段10は、音響信号記憶部61に記憶されたステレオの第2音響信号の左右の各チャンネルから、それぞれ所定数Nのサンプルを1つの第2音響フレームとして読み込む(ステップS2)。
音響フレーム読込手段10が読み込む1つの第1音響フレーム、第2音響フレームのサンプル数Nは、適宜設定することができるが、サンプリング周波数が44.1kHzの場合、4096サンプル程度とすると、最も原音に対するダメージを少なくできることが分かっているので、以下この設定値で説明する。したがって、音響フレーム読込手段10は、第1音響信号、第2音響信号それぞれから、左チャンネル、右チャンネルについてそれぞれ4096サンプルずつ、順次第1音響フレーム、第2音響フレームとして読み込んでいくことになる。
本実施形態では、第1音響フレーム、第2音響フレームともに、奇数番目の音響フレーム、偶数番目の音響フレームは、互いに所定数(本実施形態ではN/2、例えば2048)のサンプルを重複して設定される。したがって、奇数番目の音響フレームを先頭からA1、A2、A3…とし、偶数番目の音響フレームを先頭からB1、B2、B3…とすると、A1はサンプル1〜4096、A2はサンプル4097〜8192、A3はサンプル8193〜12288、B1はサンプル2049〜6144、B2はサンプル6145〜10240、B3はサンプル10241〜14336となる。なお、重複させるサンプル数は適宜設定することが可能である。
次に、周波数変換手段20が、第1音響フレームに対して周波数変換を行って、その第1音響フレームの複素数のスペクトルを得る(ステップS3)。同様に、周波数変換手段20が、第2音響フレームに対して周波数変換を行って、その第2音響フレームの複素数のスペクトルを得る(ステップS4)。ステップS3、S4では、具体的には、窓関数を利用して周波数変換を行う。周波数変換としては、フーリエ変換、ウェーブレット変換その他公知の種々の手法を用いることができるが、複素数のスペクトルを得られる手法である必要がある。本実施形態では、フーリエ変換を用いた場合を例にとって説明する。
一般に、所定の信号に対してフーリエ変換を行う場合、信号を所定の長さに区切って行う必要があるが、この場合、区切った信号に対してそのまま矩形窓でフーリエ変換を行うと、区切った境界部に基づく擬似高調波成分が発生する。そこで、一般にフーリエ変換を行う場合には、ハニング窓と呼ばれる窓関数を用いて、窓境界部の値を減衰変化させた後、変化後の値に対してフーリエ変換を実行する。
本実施形態においても、ハニング窓関数W(i)を利用している。ハニング窓関数W(i)は、中央の所定のサンプル番号iの位置において最大値1をとり、両端付近のサンプル番号iの位置において最小値0をとるように設定されている。本実施形態では、各第1音響フレーム、第2音響フレームについてのフーリエ変換は、以下の〔数式1〕で定義されるハニング窓関数W(i)を乗じたものに対して行われることになる。
〔数式1〕
W(i)=0.5−0.5cos(2πi/N)
本実施形態においては、第1音響フレーム、第2音響フレームいずれについても、奇数番目の音響フレームと偶数番目の音響フレームを、所定サンプルずつ重複して読み込む。したがって、周波数成分の改変を行った後、音響信号の状態に復元する際、窓関数を乗じた奇数番目の音響フレームと、窓関数を乗じた偶数番目の音響フレームの重複サンプルを加算した場合に、ほぼ元の値に戻るようにしなければならない。このため、奇数番目の音響フレームと偶数番目の音響フレームの重複部分において、窓関数W(i)を加算すると、全区間固定値1になるように定義される必要がある。
周波数変換手段20が、第1音響フレームに対してフーリエ変換を行う場合は、左チャンネル信号X1l(i)、右チャンネル信号X1r(i)(i=0,…,N−1)に対して、窓関数W(i)を用いて、以下の〔数式2〕に従った処理を行い、左チャンネルに対応する変換データの実部A1l(j)、虚部B1l(j)、右チャンネルに対応する変換データの実部A1r(j)、虚部B1r(j)を得る。
〔数式2〕
A1l(j)=Σi=0,…,N-1W(i)・X1l(i)・cos(2πij/N)
B1l(j)=Σi=0,…,N-1W(i)・X1l(i)・sin(2πij/N)
A1r(j)=Σi=0,…,N-1W(i)・X1r(i)・cos(2πij/N)
B1r(j)=Σi=0,…,N-1W(i)・X1r(i)・sin(2πij/N)
周波数変換手段20が、第2音響フレームに対してフーリエ変換を行う場合は、左チャンネル信号X2l(i)、右チャンネル信号X2r(i)(i=0,…,N−1)に対して、窓関数W(i)を用いて、以下の〔数式3〕に従った処理を行い、左チャンネルに対応する変換データの実部A2l(j)、虚部Bl(j)、右チャンネルに対応する変換データの実部A2r(j)、虚部Br(j)を得る。
〔数式3〕
A2l(j)=Σi=0,…,N-1W(i)・X2l(i)・cos(2πij/N)
B2l(j)=Σi=0,…,N-1W(i)・X2l(i)・sin(2πij/N)
A2r(j)=Σi=0,…,N-1W(i)・X2r(i)・cos(2πij/N)
B2r(j)=Σi=0,…,N-1W(i)・X2r(i)・sin(2πij/N)
上記〔数式2〕〔数式3〕において、iは、各音響フレーム内のN個のサンプルに付した通し番号であり、i=0,1,2,…N−1の整数値をとる。また、jは周波数の値について、値の小さなものから順に付した通し番号であり、iと同様にj=0,1,2,…N/2−1の整数値をとる。サンプリング周波数が44.1kHz、N=4096の場合、jの値が1つ異なると、周波数が約10.8Hz異なることになる。
ステップS3、S4においてそれぞれ上記〔数式2〕〔数式3〕に従った処理を実行することにより、各第1音響フレーム、第2音響フレームに対応する複素数のスペクトルが得られる。続いて、周波数成分改変手段30が、第2音響フレームから得られた第2スペクトルに対する改変処理を行う(ステップS5)。具体的には、高域成分除去、低域成分減衰、減衰後の低域成分の高域部への折り返し処理を実行する。
図6は、ステップS5における第2スペクトルに対する改変処理を示す図である。図6(a)は、サンプリング周波数Fsでサンプリングされた第2音響信号のうち有効な周波数Fs/2以下の第2スペクトルを示している。図6(a)に示した第2スペクトルに対して、周波数成分改変手段30は、高域成分を除去する処理を行う。具体的には、有効な周波数Fs/2以下のスペクトルのうち、周波数Fkより大きい周波数成分を除去する。本実施形態では、有効な周波数Fs/2以下のスペクトルのうち、高域半分を除去するため、Fk=Fs/4に設定している。この結果、第2スペクトルは、図6(b)に示すような状態となる。
次に、周波数成分改変手段30は、低域成分を減衰させる処理を行う。具体的には、高域成分を除去することにより得られた周波数Fs/4以下のスペクトルの成分強度を1/2に減衰させる。この結果、第2スペクトルは、図6(c)に示すような状態となる。続いて、周波数成分改変手段30は、減衰後の低域成分を高域部へ折り返す処理を行う。具体的には、周波数Ftを中心として減衰後の低域成分を反転させた状態にスペクトルを改変する。本実施形態では、Ft=Fs/4に設定している。周波数Fs/4を中心として減衰後の低域成分を反転させた状態にスペクトルを改変する。この結果、第2スペクトルは、図6(d)に示すような状態となる。
ステップS5における第2スペクトルに対する改変処理を行ったら、次に、周波数成分改変手段30は、第1スペクトルと改変後の第2スペクトルの合成を行う(ステップS6)。図7は、ステップS6における第1スペクトルと改変後の第2スペクトルの合成処理を示す図である。図7(a)は、サンプリング周波数Fsでサンプリングされた第1音響信号のうち有効な周波数Fs/2以下の第1スペクトルを示している。図7(b)は、図6(d)と同一であり、高域成分除去、低域成分減衰、減衰後の低域成分の高域部への折り返し処理後の第2スペクトルを示している。
ステップS6において、周波数成分改変手段30は、第1スペクトルと改変後の第2スペクトルの合成処理として、各スペクトルの成分を周波数ごとに加算する処理を行う。この結果、第1スペクトル(合成スペクトル)は、図7(c)に示すような状態となる。図7(b)に示したように、改変処理後の第2スペクトルには、周波数Fs/4以下の周波数成分が存在しないため、図7(c)に示すように、合成後の第1スペクトルの周波数Fs/4以下の周波数成分は、元の第1スペクトルから変化がない。合成後の第1スペクトルにおいては、周波数Fs/4より大きい範囲において、2つのスペクトル成分が合成される。
図7(c)の例では、2種のスペクトル成分を重ねて表示しているが、実際には複素ベクトルで加算される。図7(c)に示すように、合成後のスペクトルでは、第2音響信号に由来する成分は雑音化されて、第1音響信号の成分にマスキングされるため、改変音響信号を再生したとしても、第2音響信号として記録された音は、人間には聴取されない。
周波数成分改変手段30が上記ステップS5、S6で行った処理は以下の〔数式4〕としてまとめることができる。
〔数式4〕
A1l´(j)← A1l(j)+A2l(N/4−j)・γ
B1l´(j)← B1l(j)+B2l(N/4−j)・γ
A1r´(j)← A1r(j)+A2r(N/4−j)・γ
B1r´(j)← B1r(j)+B2r(N/4−j)・γ
周波数成分改変手段30は、周波数成分A1l(j)、B1l(j)、A2l(j)、B2l(j)に対して、上記〔数式4〕に従った処理を、j=N/8+1,・・・,N/4−1の各jについて実行する。1音響フレームのサンプル数N=4096、サンプリング周波数Fs=44.1kHzの場合、j=N/8は、周波数Fs/4に対応し、j=N/4は、周波数Fs/2に対応する。したがって、〔数式4〕においては、j=513,・・・,1025が処理対象となり、約5.5kHz〜約11kHzの周波数成分が変更される。
上記〔数式4〕において、γは減衰係数であり、0<γ<1の範囲で設定される実数値である。本実施形態ではγ=0.5に設定されている。上記〔数式4〕に示した各式右辺の第2項(A2l(N/4−j)・γ等)は、高域成分除去、低域成分減衰、減衰後の低域成分の高域部への折り返し処理後の第2スペクトルの成分であり、減衰係数γに応じて減衰されることを示している。このように、第2音響信号の成分を減衰させると、警告メッセージや妨害音等の出力レベルが小さくなってしまうため、本来は実施したくないが、この減衰処理は、第2音響信号の成分が、折り返し前の高域に存在する際、聴感度が低い帯域ではあるが可聴帯域であるため、通常再生において聴取されないようにするためのオプション的な処理であり、サンプリング周波数Fs=96kHzの場合はこのような減衰は不要でγ=1.0で良い。
図5のフローチャートと上記〔数式4〕の対応関係を示すと、ステップS5における第2スペクトルに対する改変処理が、上記〔数式4〕の右辺第2項を算出する処理に対応し、ステップS6における第1スペクトルと第2スペクトルの合成処理が、上記〔数式4〕の右辺第1項と第2項を加算する処理に対応することになる。
周波数成分改変手段30が、ステップS6における合成処理を終えたら、次に、周波数逆変換手段40が、改変後の第1スペクトルを周波数逆変換して改変音響フレームを得る処理を行う(ステップS7)。この周波数逆変換は、当然のことながら、周波数変換手段20が実行した手法に対応していることが必要となる。本実施形態では、周波数変換手段20において、フーリエ変換を施しているため、周波数逆変換手段40は、フーリエ逆変換を実行することになる。
具体的には、周波数逆変換手段40は、周波数成分改変手段30により得られた第1スペクトルの左チャンネルの実部A1l´(j)、虚部B1l´(j)、右チャンネルの実部A1r´(j)、虚部B1r´(j)を用いて、以下の〔数式5〕に従った処理を行い、X1l´(i)、X1r´(i)を算出する。なお、周波数成分改変手段30において改変されていない周波数成分については、A1l´(j)、B1l´(j)、A1r´(j)、B1r´(j)として、それぞれ元の周波数成分であるA1l(j)、B1l(j)、A1r(j)、B1r(j)を用いる。
〔数式5〕
X1l´(i)=1/N・{ΣjA1l´(j)・cos(2πij/N)−ΣjB1l´(j)・sin(2πij/N)}+X1lp(i+N/2)
X1r´(i)=1/N・{ΣjA1r´(j)・cos(2πij/N)−ΣjB1r´(j)・sin(2πij/N)}+X1rp(i+N/2)
上記〔数式5〕においては、式が繁雑になるのを防ぐため、Σj=0,…,N-1をΣjとして示している。上記〔数式5〕における第1式の“+X1lp(i+N/2)”、第2式の“+X1rp(i+N/2)”の項は、直前に改変された改変音響フレームのデータX1lp(i)、X1rp(i)が存在する場合に、時間軸上N/2サンプル分重複することを考慮して加算するためのものである。上記〔数式5〕により改変音響フレームの左チャンネルの各サンプルX1l´(i)、右チャンネルの各サンプルX1r´(i)、が得られることになる。
改変音響フレーム出力手段50は、周波数逆変換手段40の処理により得られた改変音響フレームを順次出力ファイルに出力する。上記図5のフローチャートに示した処理は、第1音響信号の全ての第1音響フレームに対して実行される。第1音響フレームの数が、第2音響フレームの数より多い場合は、先頭の第2音響フレームに戻って繰り返し処理を行う。このようにして全ての第1音響フレームに対して処理を行った結果、改変音響フレームの集合である改変音響信号が、改変音響信号記憶部62に記憶される。本実施形態では、第1音響信号の先頭から最後まで第2音響信号を埋め込むようにしたが、埋め込む位置を設定して、その範囲にだけ埋め込むようにすることも可能である。
このようにして得られた改変音響信号は、元の第1音響信号に、上述のような改変がなされた第2音響信号が埋め込まれたものとなる。この改変音響信号のスペクトルは、図7(c)に示したようなものとなるので、再生した場合、Fs/2以下の周波数成分が音として発せられる。Fs/2を人間の可聴域の上限付近に設定しておくことにより、Fs/4〜Fs/2の範囲の音も発せられるが、第2音響信号に由来する成分はあらかじめ減衰させていて、かつスペクトルが周波数方向に反転されているため雑音化されて、第1音響信号の成分にマスキングされるため、第2音響信号として記録された音は、人間には聴取されない。
改変音響信号を再生してスピーカから発せられた音を録音するなど改変音響信号に対して何らかの複製手段でサンプリング周波数Fs/2で再サンプリングし、複製音響信号とした場合について説明する。この場合、改変音響信号の信号成分のうち、ナイキスト周波数Fs/4を超える高周波の信号成分が、Fs/4以下の低域信号成分として折り返され重畳される。すなわち、エイリアシングが発生し、周波数Fs/4〜Fs/2の信号成分は反転してFs/4以下の周波数帯に重畳される。この結果、複製音響信号のスペクトルは、図8(b)に示したようなものになる。図8(b)の例では、2種のスペクトル成分を重ねて表示しているが、実際には複素ベクトルで加算される。
図8(b)に示すように、複製音響信号では、第2音響信号に由来する信号成分が、複製音響信号のFs/4以下の低域部分に復元される。このため、図8(b)に示した複製音響信号を再生すると、第2音響信号に記録された音と同等の音が原音響信号と共に発せられ、人間の耳に明瞭に聴取されることになる。したがって、複製音響信号を再生しても、鑑賞に堪える再生音を得ることができなくなるため、複製を抑止することが可能となる。また、改変音響信号に対して複製する際のサンプリング周波数がFs/2より若干小さくFs/4より大きいFs´の場合でも、同様にエイリアシングが発生し、周波数Fs´/2〜Fs´の信号成分は反転してFs´/2以下の周波数帯に重畳される。即ち、図8(a)の右半分より左端が左側にずれて、図8(a)の右半分より帯域幅が狭い信号成分が図8(b)の左半分より右端が左側にずれた位置に折り返される。この複製音響信号を再生すると、第2音響信号に記録された音と同等の音が発せられることは期待できないが、歪みやかなりの雑音を伴って第2音響信号に基づく音が人間の耳に明瞭に聴取されることになる。この場合でも、少なくとも鑑賞に堪える再生音を得ることができなくなるという目的は達成できるため、複製を抑止することが可能となる。
更に、改変音響信号に対して複製する際のサンプリング周波数がFs/4より小さい場合には、顕著なエイリアシングが発生して原音響信号自身の主要信号成分が破壊され鑑賞に堪える再生音を得ることができなくなる。逆に、改変音響信号に対して複製する際のサンプリング周波数がFs/2より若干大きく3・Fs/4より小さいFs´の場合でも、同様にエイリアシングが発生し、周波数Fs´/2〜Fs´の信号成分は反転してFs´/2以下の周波数帯に重畳される。即ち、図8(a)の右半分より右端が右側にずれて、図8(a)の右半分より帯域幅が広い信号成分が図8(b)の左半分より右端が右側にずれた位置に折り返される。この複製音響信号を再生すると、第2音響信号に記録された音と同等の音が発せられることは期待できないが、歪みやかなりの雑音を伴って第2音響信号に基づく音が人間の耳に明瞭に聴取されることになる。この場合でも、少なくとも鑑賞に堪える再生音を得ることができなくなるという目的は達成できるため、複製を抑止することが可能となる。しかし、3・Fs/4より大きい場合には、エイリアシングが殆ど発生せず、原音響信号および第2音響信号の品質は維持され、第2音響信号は可聴化されず複製を抑止することはできない。以上のことから、改変音響信号に対して複製する際のサンプリング周波数が3・Fs/4より小さい場合には、エイリアシングが発生して。複製を抑止することが可能となる。
(2.2.2.第1の実施形態の変形例)
上記実施形態では、第1音響信号のサンプリング周波数Fsの半分の周波数であるFs/2前後以下でサンプリングして複製される場合に対応することができる。次に、第1音響信号のサンプリング周波数Fsと同一周波数であるFs前後以下でサンプリングして複製される場合に対応する例について説明する。
この場合、周波数Fk、周波数FtをいずれもFs/2に設定する。そして、図2に示したように、第2音響信号(異なる音響信号)を周波数Fs/2を中心に反転して第1音響信号(原音響信号)と合成する。具体的な処理は、上記ステップS1〜S5と同様に行う。ただし、上記ステップS3の周波数変換において、補間して1つの第1音響フレームにおけるサンプル数を2倍に増やしながら、周波数変換を行い、音響フレームの左チャンネルの各サンプルX1l(i)、右チャンネルの各サンプルX1r(i)を得る。これにより、1つの第1音響フレームにおけるサンプル数は2N個となる。その後、ステップS6およびステップS7を経て、改変音響フレームの左チャンネルの各サンプルX1l´(i)、右チャンネルの各サンプルX1r´(i)を得る。この結果、改変音響信号は、サンプリング周波数2・Fsでサンプリングした場合と同様の形態となる。
このようにして得られた改変音響信号は、図2(c)に示すようになる。このような改変音響信号を再生した場合、Fs/2を人間の可聴域の上限に設定しておくことにより、Fs/2より高い第2音響信号に由来する信号成分に基づく音は、人間にはほとんど聴こえない。図2(c)に示す改変音響信号に対して同音響信号を再生して発せられた音を、アナログ系で録音するなどの複製手段によりサンプリング周波数Fsで再サンプリングすると、図2(d)に示す複製音響信号が得られる。図2(d)に示す複製音響信号は、エイリアシングが発生し、第2音響信号に由来する信号成分が、人間の可聴域であるFs/2以下に存在するため、第2音響信号として記録された警告メッセージや妨害音等が原音響信号として記録された音とともに人間に聴こえることになる。警告メッセージや妨害音が音楽に重ねて聴こえると、正常な状態で音楽を鑑賞することができない。このため、複製に対する抑止力が働くことになる。
また、改変音響信号に対して複製する際のサンプリング周波数がFsより若干小さくFs/2より大きいFs´の場合でも、同様にエイリアシングが発生し、周波数Fs´/2〜Fs´の信号成分は反転してFs´/2以下の周波数帯に重畳される。即ち、図2(c)の右半分より左端が左側にずれて、図2(c)の右半分より帯域幅が狭い信号成分が図2(d)の左半分より右端が左側にずれた位置に折り返される。この複製音響信号を再生すると、第2音響信号に記録された音と同等の音が発せられることは期待できないが、歪みやかなりの雑音を伴って第2音響信号に基づく音が人間の耳に明瞭に聴取されることになる。この場合でも、少なくとも鑑賞に堪える再生音を得ることができなくなるという目的は達成できるため、複製を抑止することが可能となる。更に、改変音響信号に対して複製する際のサンプリング周波数がFs/2より小さい場合には、顕著なエイリアシングが発生して原音響信号自身の主要信号成分が破壊され鑑賞に堪える再生音を得ることができなくなる。逆に、改変音響信号に対して複製する際のサンプリング周波数がFsより若干大きく3・Fs/2より小さいFs´の場合でも、同様にエイリアシングが発生し、周波数Fs´/2〜Fs´の信号成分は反転してFs´/2以下の周波数帯に重畳される。即ち、図2(c)の右半分より右端が右側にずれて、図2(c)の右半分より帯域幅が広い信号成分が図2(d)の左半分より右端が右側にずれた位置に折り返される。この複製音響信号を再生すると、第2音響信号に記録された音と同等の音が発せられることは期待できないが、歪みやかなりの雑音を伴って第2音響信号に基づく音が人間の耳に明瞭に聴取されることになる。この場合でも、少なくとも鑑賞に堪える再生音を得ることができなくなるという目的は達成できるため、複製を抑止することが可能となる。しかし、3・Fs/2より大きい場合には、エイリアシングが殆ど発生せず、原音響信号および第2音響信号の品質は維持され、第2音響信号は可聴化されず複製を抑止することはできない。以上のことから、改変音響信号に対して複製する際のサンプリング周波数が3・Fs/2より小さい場合には、エイリアシングが発生して。複製を抑止することが可能となる。
(2.2.3.第2の実施形態)
次に、本発明の音響信号に対する異なる音響信号の埋め込み装置の第2の実施形態について説明する。図9は、第2の実施形態に係る音響信号に対する異なる音響信号の埋め込み装置の処理動作を示すフローチャートである。第1の実施形態では、第1音響信号に、第2音響信号1つを異なる音響信号として埋め込むのみであったが、第2の実施形態では、第1音響信号に、第2音響信号、第3音響信号の2つの異なる音響信号を埋め込む処理を行う。本実施形態では、第1音響信号、第2音響信号、第3音響信号のいずれも、サンプリング周波数Fsとして44.1kHzでサンプリングしたものを用いる。音響フレーム読込手段10は、音響信号記憶部61に記憶されたステレオの第1音響信号の左右の各チャンネルから、それぞれ所定数Nのサンプルを1つの第1音響フレームとして読み込む(ステップS11)。同様に、音響フレーム読込手段10は、音響信号記憶部61に記憶されたステレオの第2音響信号の左右の各チャンネルから、それぞれ所定数Nのサンプルを1つの第2音響フレームとして読み込む(ステップS12)。同様に、音響フレーム読込手段10は、音響信号記憶部61に記憶されたステレオの第3音響信号の左右の各チャンネルから、それぞれ所定数Nのサンプルを1つの第3音響フレームとして読み込む(ステップS13)。
音響フレーム読込手段10が読み込む1つの第1音響フレーム、第2音響フレーム、第3音響フレームのサンプル数Nは、適宜設定することができるが、サンプリング周波数が44.1kHzの場合、4096サンプル程度とすると、最も原音に対するダメージを少なくできることが分かっているので、以下この設定値で説明する。したがって、音響フレーム読込手段10は、第1音響信号、第2音響信号、第3音響信号それぞれから、左チャンネル、右チャンネルについてそれぞれ4096サンプルずつ、順次第1音響フレーム、第2音響フレーム、第3音響フレームとして読み込んでいくことになる。
本実施形態でも、第1の実施形態と同様、第1音響フレーム、第2音響フレーム、第3音響フレームともに、奇数番目の音響フレーム、偶数番目の音響フレームは、互いに所定数(本実施形態では2048)のサンプルを重複して設定される。したがって、奇数番目の音響フレームを先頭からA1、A2、A3…とし、偶数番目の音響フレームを先頭からB1、B2、B3…とすると、A1はサンプル1〜4096、A2はサンプル4097〜8192、A3はサンプル8193〜12288、B1はサンプル2049〜6144、B2はサンプル6145〜10240、B3はサンプル10241〜14336となる。
次に、周波数変換手段20が、第1音響フレームに対して周波数変換を行って、その第1音響フレームの複素数のスペクトルを得る(ステップS14)。同様に、周波数変換手段20が、第2音響フレームに対して周波数変換を行って、その第2音響フレームの複素数のスペクトルを得る(ステップS15)。さらに、周波数変換手段20が、第3音響フレームに対して周波数変換を行って、その第3音響フレームの複素数のスペクトルを得る(ステップS16)。ステップS14、S15、S16では、第1の実施形態におけるステップS3、S4と同様、上記〔数式1〕に示した窓関数W(i)を利用して周波数変換を行う。
周波数変換手段20が、第1音響フレームに対してフーリエ変換を行う場合は、左チャンネル信号X1l(i)、右チャンネル信号X1r(i)(i=0,…,N−1)に対して、窓関数W(i)を用いて、上記〔数式2〕に従った処理を行い、左チャンネルに対応する変換データの実部A1l(j)、虚部B1l(j)、右チャンネルに対応する変換データの実部A1r(j)、虚部B1r(j)を得る。
周波数変換手段20が、第2音響フレームに対してフーリエ変換を行う場合は、左チャンネル信号X2l(i)、右チャンネル信号X2r(i)(i=0,…,N−1)に対して、窓関数W(i)を用いて、上記〔数式3〕に従った処理を行い、左チャンネルに対応する変換データの実部A2l(j)、虚部Bl(j)、右チャンネルに対応する変換データの実部A2r(j)、虚部Br(j)を得る。
周波数変換手段20が、第3音響フレームに対してフーリエ変換を行う場合は、左チャンネル信号X3l(i)、右チャンネル信号X3r(i)(i=0,…,N−1)に対して、窓関数W(i)を用いて、以下の〔数式6〕に従った処理を行い、左チャンネルに対応する変換データの実部A3l(j)、虚部B3l(j)、右チャンネルに対応する変換データの実部A3r(j)、虚部B3r(j)を得る。
〔数式6〕
A3l(j)=Σi=0,…,N-1W(i)・X3l(i)・cos(2πij/N)
B3l(j)=Σi=0,…,N-1W(i)・X3l(i)・sin(2πij/N)
A3r(j)=Σi=0,…,N-1W(i)・X3r(i)・cos(2πij/N)
B3r(j)=Σi=0,…,N-1W(i)・X3r(i)・sin(2πij/N)
上記〔数式6〕においては、上記〔数式2〕〔数式3〕と同様、iは、各音響フレーム内のN個のサンプルに付した通し番号であり、i=0,1,2,…N−1の整数値をとる。また、jは周波数の値について、値の小さなものから順に付した通し番号であり、iと同様にj=0,1,2,…N/2−1の整数値をとる。サンプリング周波数が44.1kHz、N=4096の場合、jの値が1つ異なると、周波数が約10.8Hz異なることになる。
ステップS14、S15、S16においてそれぞれ上記〔数式2〕〔数式3〕〔数式6〕に従った処理を実行することにより、各第1音響フレーム、第2音響フレーム、第3音響フレームに対応する複素数のスペクトルが得られる。続いて、周波数成分改変手段30が、第2音響フレームから得られた第2スペクトルに対する改変処理を行う(ステップS17)。具体的には、高域成分除去、低域成分減衰、減衰後の低域成分の高域部への折り返し処理を実行する。
図10は、ステップS17における第2スペクトルに対する改変処理を示す図である。図10(a)は、サンプリング周波数Fsでサンプリングされた第2音響信号のうち有効な周波数Fs/2以下の第2スペクトルを示している。図10(a)に示した第2スペクトルに対して、周波数成分改変手段30は、高域成分を除去する処理を行う。具体的には、有効な周波数Fs/2以下のスペクトルのうち、周波数Fkより大きい周波数成分を除去する。本実施形態では、有効な周波数Fs/2以下のスペクトルのうち、上位3/4となる周波数までの成分を除去するため、Fk=Fs/8に設定している。この結果、第2スペクトルは、図10(b)に示すような状態となる。
次に、周波数成分改変手段30は、低域成分を減衰させる処理を行う。具体的には、高域成分を除去することにより得られた周波数Fs/8以下のスペクトルの成分強度を1/2に減衰させる。この結果、第2スペクトルは、図10(c)に示すような状態となる。続いて、周波数成分改変手段30は、減衰後の低域成分を高域部へ折り返す処理を行う。具体的には、周波数Ftを中心として減衰後の低域成分を反転させた状態にスペクトルを改変する。本実施形態では、Ft=Fs/4に設定している。この結果、第2スペクトルは、図10(d)に示すような状態となる。
同様に、周波数成分改変手段30は、第3音響フレームから得られた第3スペクトルに対する改変処理を行う(ステップS18)。具体的には、高域成分除去、低域成分減衰、減衰後の低域成分の高域部への折り返し処理を実行する。第2音響フレームに対する処理とは、高域部への折り返し処理の際の中心となる周波数が異なる。
図11は、ステップS18における第3スペクトルに対する改変処理を示す図である。図11(a)は、サンプリング周波数Fsでサンプリングされた第3音響信号のうち有効な周波数Fs/2以下の第2スペクトルを示している。図10、図11の例では、説明の便宜上、スペクトルを示す波形として同一のものを用いている。実際に、第2音響信号、第3音響信号として図10、図11に示すように同一の音響信号を用いても良いし、互いに異なる音響信号を用いても良い。(同一の音響信号を2回埋め込む場合には、2種類の異なるサンプリング周波数のいずれかを用いて複製処理を行っても、同一の音響信号が適切に再生されるという効果がある。)図11(a)に示した第3スペクトルに対して、周波数成分改変手段30は、高域成分を除去する処理を行う。具体的には、有効な周波数Fs/2以下のスペクトルのうち、周波数Fk2より大きい周波数成分を除去する。本実施形態では、有効な周波数Fs/2以下のスペクトルのうち、上位3/4となる周波数Fs/8より大きい成分を除去するため、Fk2=Fs/8に設定している。この結果、第3スペクトルは、図11(b)に示すような状態となる。
次に、周波数成分改変手段30は、低域成分を減衰させる処理を行う。具体的には、高域成分を除去することにより得られた周波数Fs/8以下のスペクトルの成分強度を1/2に減衰させる。この結果、第2スペクトルは、図11(c)に示すような状態となる。続いて、周波数成分改変手段30は、減衰後の低域成分を高域部へ折り返す処理を行う。具体的には、周波数Ft2を中心として減衰後の低域成分を反転させた状態にスペクトルを改変する。本実施形態では、Ft2=3・Fs/16(<Ft)に設定している。この結果、第2スペクトルは、図11(d)に示すような状態となる。
上記ステップS17、S18の処理は、どちらを先に実行しても良い。ステップS17、S18における第2スペクトルに対する改変処理、第3スペクトルに対する改変処理を行ったら、次に、周波数成分改変手段30は、第1スペクトルと改変後の第2スペクトル、改変後の第3スペクトルの合成を行う(ステップS19)。まず、第2スペクトルとの合成から説明する。図12は、ステップS19における第1スペクトルと改変後の第2スペクトルの合成処理を示す図である。同図はスカラー量で概念的に図示しているが、実際は実部と虚部の2次元要素をもつ複素数ベクトル量同士の合成となり、合成後のスカラー量は単一の曲線となるが図示を省略してある。図12(a)は、サンプリング周波数Fsでサンプリングされた第1音響信号のうち有効な周波数Fs/2以下の第1スペクトルを示している。図12(b)は、図10(d)と同一であり、高域成分除去、低域成分減衰、減衰後の低域成分の高域部への折り返し処理後の第2スペクトルを示している。
ステップS19において、周波数成分改変手段30は、第1スペクトルと改変後の第2スペクトルの合成処理として、各スペクトルの成分を周波数ごとに加算する処理を行う。この結果、第1スペクトル(合成スペクトル)は、図12(c)に示すような状態となる。図12(b)に示したように、改変処理後の第2スペクトルには、周波数3・Fs/8以下の周波数成分が存在しないため、図12(c)に示すように、合成後の第1スペクトルの周波数3・Fs/8以下の周波数成分は、元の第1スペクトルから変化がない。合成後の第1スペクトルにおいては、周波数3・Fs/8より大きい範囲において、2つのスペクトル成分が合成される。
次に、第3スペクトルとの合成について説明する。図13は、ステップS19における第1スペクトルに改変後の第2スペクトルを合成したスペクトルと、改変後の第3スペクトルの合成処理を示す図である。図13(a)は、図12(c)と同一であり、第1スペクトルに改変後の第2スペクトルを合成したスペクトルを示している。図13(b)は、図11(d)と同一であり、高域成分除去、低域成分減衰、減衰後の低域成分の高域部への折り返し処理後の第3スペクトルを示している。
ステップS19において、周波数成分改変手段30は、第1スペクトルに改変後の第2スペクトルを合成したスペクトルと、改変後の第3スペクトルの合成処理として、各スペクトルの成分を周波数ごとに加算する処理を行う。この結果、第1スペクトル(合成スペクトル)は、図13(c)に示すような状態となる。図13(c)に示すように、合成後の第1スペクトルは、周波数Fs/4以下は元の第1スペクトルの状態、周波数Fs/4〜3・Fs/8の範囲は、元の第1スペクトルと元の第3スペクトルの成分が合成された状態、周波数3・Fs/8〜Fs/2の範囲は、元の第1スペクトルと元の第2スペクトルの成分が合成された状態となる。
周波数成分改変手段30が上記ステップS17、S19で行った処理は以下の〔数式7〕としてまとめることができる。
〔数式7〕
A1l´(j)← A1l(j)+A2l(N/4−j)・γ2
B1l´(j)← B1l(j)+B2l(N/4−j)・γ2
A1r´(j)← A1r(j)+A2r(N/4−j)・γ2
B1r´(j)← B1r(j)+B2r(N/4−j)・γ2
周波数成分改変手段30は、周波数成分A1l(j)、B1l(j)、A2l(j)、B2l(j)に対して、上記〔数式7〕に従った処理を、j=3・N/16+1,・・・,N/4−1の各jについて実行する。1音響フレームのサンプル数N=4096、サンプリング周波数Fs=44.1kHzの場合、j=3・N/16は、周波数3・Fs/8に対応し、j=N/4は、周波数Fs/2に対応する。したがって、〔数式7〕においては、j=769,・・・,1025が処理対象となり、約8.3kHz〜約11kHzの周波数成分が変更される。
周波数成分改変手段30が上記ステップS18、S19で行った処理は以下の〔数式8〕としてまとめることができる。
〔数式8〕
A1l´(j)← A1l(j)+A3l(3・N/16−j)・γ3
B1l´(j)← B1l(j)+B3l(3・N/16−j)・γ3
A1r´(j)← A1r(j)+A3r(3・N/16−j)・γ3
B1r´(j)← B1r(j)+B3r(3・N/16−j)・γ3
周波数成分改変手段30は、周波数成分A1l(j)、B1l(j)、A3l(j)、B3l(j)に対して、上記〔数式4〕に従った処理を、j=N/8+1,・・・,3・N/16−1の各jについて実行する。1音響フレームのサンプル数N=4096、サンプリング周波数Fs=44.1kHzの場合、j=N/8は、周波数Fs/4に対応し、j=3・N/16は、周波数3・Fs/8に対応する。したがって、〔数式8〕においては、j=513,・・・,767が処理対象となり、約5.5kHz〜約8.28kHzの周波数成分が変更される。
上記〔数式7〕〔数式8〕において、γ2、γ3はいずれも減衰係数であり、0<γ2<1、0<γ3<1の範囲で設定される実数値である。本実施形態ではγ2=γ3=0.5に設定されている。γ2とγ3の値は等しくなくても良い。上記〔数式7〕に示した各式右辺の第2項(A2l(N/4−j)・γ2等)は、高域成分除去、低域成分減衰、減衰後の低域成分の高域部への折り返し処理後の第2スペクトルの成分であり、減衰係数γ2に応じて減衰されることを示している。また、上記〔数式8〕に示した各式右辺の第2項(A3l(3・N/16−j)・γ3等)は、高域成分除去、低域成分減衰、減衰後の低域成分の高域部への折り返し処理後の第3スペクトルの成分であり、減衰係数γ3に応じて減衰されることを示している。このように、第2音響信号、第3音響信号の成分を減衰させることにより、警告メッセージや妨害音等の出力レベルを小さくすることができる。この減衰処理は、第1音響信号の成分に影響を与えすぎないため、行うことが望ましい。
図9のフローチャートと上記〔数式7〕〔数式8〕の対応関係を示すと、ステップS17における第2スペクトルに対する改変処理が、上記〔数式7〕の右辺第2項を算出する処理に対応し、ステップS18における第3スペクトルに対する改変処理が、上記〔数式8〕の右辺第2項を算出する処理に対応し、ステップS19における第1スペクトルと第2スペクトル、第3スペクトルの合成処理が、上記〔数式7〕〔数式8〕の右辺第1項と第2項を加算する処理に対応することになる。
周波数成分改変手段30が、ステップS19における合成処理を終えたら、次に、周波数逆変換手段40が、改変後の第1スペクトルを周波数逆変換して改変音響フレームを得る処理を行う(ステップS20)。この周波数逆変換は、当然のことながら、周波数変換手段20が実行した手法に対応していることが必要となる。本実施形態では、周波数変換手段20において、フーリエ変換を施しているため、周波数逆変換手段40は、フーリエ逆変換を実行することになる。
具体的には、第1の実施形態におけるステップS6と同様、周波数逆変換手段40は、周波数成分改変手段30により得られた第1スペクトルの左チャンネルの実部A1l´(j)、虚部B1l´(j)、右チャンネルの実部A1r´(j)、虚部B1r´(j)を用いて、上記〔数式5〕に従った処理を行い、X1l´(i)、X1r´(i)を算出する。
改変音響フレーム出力手段50は、周波数逆変換手段40の処理により得られた改変音響フレームを順次出力ファイルに出力する。この結果、改変音響フレームの集合である改変音響信号が、改変音響信号記憶部62に記憶される。上記図9に示した処理は、第1音響信号の全ての第1音響フレームに対して実行される。第2音響フレームの数、第3音響フレームの数が第1音響フレームの数より少ない場合、第2音響フレーム、第3音響フレームについては、それぞれ全フレーム終了後、先頭の音響フレームに戻って繰り返し処理を行う。このようにして全ての第1音響フレームに対して処理を行った結果、改変音響フレームの集合である改変音響信号が、改変音響信号記憶部62に記憶される。本実施形態では、第1音響信号の先頭から最後まで第2音響信号、第3音響信号を埋め込むようにしたが、埋め込む位置を設定して、その範囲にだけ埋め込むようにすることも可能である。
第2の実施形態において得られた改変音響信号は、元の第1音響信号に、上述のような改変がなされた第2音響信号および第3音響信号が埋め込まれたものとなる。この改変音響信号のスペクトルは、図13(c)に示したようなものとなるので、再生した場合、Fs/2以下の周波数成分が音として発せられる。Fs/2を人間の可聴域の上限付近に設定しておくことにより、Fs/4〜Fs/2の範囲の音も発せられるが、高音部の聴感度が低い帯域であり、第2音響信号に由来する成分、第3音響信号に由来する成分はスペクトルが反転して雑音化されて、第1音響信号の成分によりマスキングされるため、第2音響信号として記録された音、第3音響信号として記録された音は、人間には聴取されない。
図14は、改変音響信号と複製音響信号を示す図である。このうち、図14(a)は、図13(c)と同一であり、第2音響信号と第3音響信号が埋め込まれた改変音響信号を示している。改変音響信号に対して同信号を再生してスピーカから発せられた音を録音するなどの複製手段により、サンプリング周波数2・Ft(=Fs/2)で再サンプリングし、複製音響信号とした場合について説明する。この場合、改変音響信号の信号成分のうち、ナイキスト周波数Fs/4(=Ft)を超える高周波の信号成分が、Fs/4以下の低域信号成分として折り返され重畳される。すなわち、エイリアシングが発生し、周波数Fs/4〜Fs/2の信号成分は反転して重畳される。この結果、複製音響信号のスペクトルは、図14(b)に示したようなものになる。図14(b)の例では、3種のスペクトル成分を重ねて表示しているが、実際には複素ベクトルで加算される。
図14(b)に示すように、複製音響信号では、第2音響信号に由来する信号成分が、複製音響信号のFs/8以下の低域部分に復元され、第3音響信号に由来する信号成分が、複製音響信号のFs/8〜Fs/4の低域部分に復元される。このため、図14(b)に示した複製音響信号を再生すると、第2音響信号に記録された音が原音再生され、第3音響信号については、第3音響信号に記録された本来の音とFs/8だけ高域にずれて雑音再生される。したがって、複製音響信号を再生しても、鑑賞に堪える再生音を得ることができなくなるため、複製を抑止することが可能となる。
改変音響信号に対して同信号を再生してスピーカから発せられた音を録音するなどの複製手段により、サンプリング周波数2・Ft2(=3・Fs/8)で再サンプリングし、複製音響信号とした場合について説明する。この場合、改変音響信号の信号成分のうち、ナイキスト周波数3・Fs/16(=Ft2)を超える高周波の信号成分が、3・Fs/16以下の低域信号成分として折り返され重畳される。すなわち、エイリアシングが発生し、周波数3・Fs/16〜3・Fs/8の信号成分は反転して重畳され、周波数3・Fs/8〜Fs/2の信号成分は2回反転して重畳される。この結果、複製音響信号のスペクトルは、図14(c)に示したようなものになる。図14(c)の例では、3種のスペクトル成分を重ねて表示しているが、実際には複素ベクトルで加算される。
図14(c)に示すように、複製音響信号では、第2音響信号に由来する信号成分が、複製音響信号の3・Fs/16以下の低域部分に反転して復元され、第3音響信号に由来する信号成分が、複製音響信号の3・Fs/16以下の低域部分に復元される。このため、図14(c)に示した複製音響信号を再生すると、第3音響信号に記録された音が原音再生され、第2音響信号については、スペクトルが反転して雑音再生される。したがって、複製音響信号を再生しても、鑑賞に堪える再生音を得ることができなくなるため、複製を抑止することが可能となる。また、改変音響信号に対して複製する際のサンプリング周波数が2・Ft2未満、あるいは2・Ft2と2・Ftの中間、すなわち3・Ft以下のいずれかの周波数Fs´の場合でも、同様にエイリアシングが発生し、周波数Fs´/2以上の信号成分は周波数Fs´/2を中心に1回または複数回反転してFs´/2以下の低域周波数帯に重畳される。この複製音響信号を再生すると、Fs´の値により再生音は変化し、第2音響信号や第3音響信号に記録された音と同等の音が発せられることは期待できず、歪みやかなりの雑音を伴って各々再生され、場合により両者が混ざった不快な音になることもあるが、少なくとも鑑賞に堪える再生音を得ることができなくなるという目的は達成できるため、複製を抑止することが可能となる。しかし、3・Ftより大きい場合には、エイリアシングが殆ど発生せず、原音響信号および第2音響信号の品質は維持され、第2音響信号は可聴化されず複製を抑止することはできない。以上のことから、改変音響信号に対して複製する際のサンプリング周波数が3・Ftより小さい場合には、エイリアシングが発生して。複製を抑止することが可能となる。
(3.変形例等)
以上、本発明の好適な実施形態について限定したが、本発明は上記実施形態に限定されず、種々の変形が可能である。例えば、上記第1の実施形態では、原音響信号に対して1つの異なる音響信号、上記第2の実施形態では、原音響信号に対して2つの異なる音響信号を埋め込む処理を行ったが、3つ以上の異なる音響信号を埋め込むようにしても良い。
また、上記実施形態では、異なる音響信号において周波数Fk、Fk2以上の信号成分を除去し、周波数Ft、Ft2を中心に信号成分を高域の周波数方向に折り返し、折り返された周波数Ft+(Ft−Fk)、Ft2+(Ft2−Fk2)から周波数2・Ft、2・Ft2までの範囲の信号成分を原音響信号の成分に合成しているが、具体的なFk、Ft、Fk2、Ft2の値は上記実施形態に限定されず、様々な値を設定することが可能である。
また、上記実施形態では、商品として一般に流通している2チャンネルのステレオ音響信号を利用した場合を例にとって説明したが、5.1チャンネルのサラウンド音響信号に対してもLFCを除く5チャンネルの各音響信号に同様な処理を施せば良く(LFC重低音チャンネルに対しては、第2の周波数範囲のみ適用)、逆に1チャンネルのモノラル音響信号を利用しても良い。この場合は、上記LチャンネルまたはRチャンネルのいずれか一方に対して行った処理を実行すれば良い。