WO2001031629A1

WO2001031629A1 - Dispositif de traitement de signaux et procede associe et support de stockage de programme

Info

Publication number: WO2001031629A1
Application number: PCT/JP2000/007593
Authority: WO
Inventors: Yuuki Matsumura; Hideo Sato
Original assignee: Sony Corporation
Priority date: 1999-10-29
Filing date: 2000-10-27
Publication date: 2001-05-03
Also published as: EP1202250A1; EP1202250A4; US7272718B1; JP4582384B2

Description

明細書信号処理装置及びその方法並びにプログラム格納媒体技術分野

本発明は信号処理装置及びその方法並びにプロダラム格納媒体に関し、例えば音楽データ等の著作権を保護する場合に適用して好適なものである。

背景技術

近年、ウェブサイトからィンタ一ネット等のネットワークを介して不特定多数のネットワーク端末装置（コンピュータ）に音楽コンテンツ等が配信されるようになっている。

コンピュータのユーザは配信された音楽コンテンツをディジタルデータの状態で種々の記録媒体に記録することにより、好みの音楽を高音質で記録した音楽ソフトをュ一ザが意のままに作成することができる。

このように、コンピュータを操作するユーザがウェブサイトにアクセスするだけで、自由に音楽コンテンツを記録媒体に記録することができるのであるが、ゥェブサイトの開設側が著作権者の許可なく無断でその著作物である音楽コンテンツを配信する行為は、当該音楽コンテンツの著作権侵害が発生する問題がある。発明の開示

本発明は以上の点を考慮してなされたもので、例えばネットワークを介して不特定多数の端末装置に配信されたコンテンツについての著作権侵害行為を有効に抑制し得る信号処理装置及びその方法並びにプログラム格納媒体を提案しようとするものである。

かかる課題を解決するため本発明においては、入力信号を圧縮処理した際の入力信号の残存状態を圧縮処理に対応して心理聴覚分析し、当該分析結果を心理聴覚符号化情報として出力し、心理聴覚符号化情報に基づいて、入力信号に電子透かし情報を重畳するようにしたことにより、圧縮耐性の大きい電子透かし情報及び圧縮耐性の小さい電子透かし情報を容易に生成し得る。図面の簡単な説明

図 1は、本発明によるウォーターマークを利用したコピー制御システムの全体構成を示すブロック図である。

図 2は、コピー制御システムにおけるコピ一制御の適用例を示す略線図である図 3は、本発明の実施の形態によるウォーターマークエンコーダの構成を示すブロック図である。

図 4は、ウォーターマーク重畳原理の説明に供する略線図である。

図 5は、心理聴覚分析部の処理の説明に供する略線図である。

図 6は、心理聴覚分析部の処理の説明に供する略線図である。

図 7は、心理聴覚符号化の説明に供する略線図である。

図 8は、本発明によるゥォ一ターマークのェンコ一ド例を示す略線図である _c 図 9は、ウォーターマークエンコーダの処理手順を示すフローチヤ一トである

図 1 0は、ゥォ一タ一マークデコーダの構成を示すブロック図である。

図 1 1は、ゥォ一ターマークデコーダの処理手順を示すフローチャートである図 1 2は、コンピュータの内部構成を示すブロック図である。発明を実施するための最良の形態

以下図面について、本発明の一実施の形態を詳述する。図 1において、 1 0は全体としてコンテンツのコピー制御システムを示し、ォ —ディォソースであるディジタルオーディォ信号 D Aを光ディスク 2に記録する際に、ウォータ一マーク（電子透かし情報）エンコーダ 1により、 Ro b u s t (強い）ウォータ一マーク D C 1及び F r a g i 1 e (弱レ、）ウォーターマーク DC 2をディジタルオーディォ信号 D Aに付加して光ディスク 2に記録する。ここで、 R o b u s t ウォータ一マーク DC 1はオーディオソースの著作権者、コピーを許可するか否か等の情報により構成され、 F r a g i l eウォータ一マーク DC 2は圧縮履歴を検出するトリガ等の情報により構成される。因みに、 R o b u s t ウォーターマーク DC 1は MP 3等の圧縮系を介しても消えないゥオーターマ一クであり、 F r a g i l eゥォ一ターマーク D C 2は M P 3等の圧縮系を通るとその量子化誤差により消える（残存率が低くなる）ウォーターマークである。

このようにして Ro b u s t ゥォ一ターマーク DC 1及び F r a g i 1 eゥォ一ターマーク DC 2を含むディジタルオーディオ信号 D Aが記録された光ディスク 2のうち、例えば M P 3 (MPEG Au d i o L a y e r 3) ェンコ一ダ 3等による圧縮処理を介して、ネットワーク 4上のサイトにアップ口一ドされた圧縮ストリ一ム信号 D Sをパーソナルコンピュータ 5にダウン口一ドする場合、また R o b u s t ウォータ一マーク DC 1及び！ r a g i 1 eウォーターマ一ク DC 2を含むディジタルオーディォ信号 D Aが記録された光ディスク 2のうち、圧縮処理を介さずに流通する光ディスク 2をパーソナルコンピュータ 5に装填する場合において、まずパーソナルコンピュータ 5は、モデム（変復調装置）を構成するコーデック (C o d e c : C o d e a n d D e c o d e) に入力された入力信号に基づいて、当該入力信号が圧縮されていないディジタルオーディォ信号 D Aであるか、又は圧縮ストリーム信号 D Sであるか、さらにはいずれの圧縮規格によりエンコードされた圧縮ストリーム信号 DSであるかを判別し、当該判別結果に応じてスィッチ S Wを選択的に切り換える。そして、ウォータ一マークデコーダ 6により、パーソナルコンピュータ 5の入力信号から、埋め込まれた著作権情報を検出し、例えばメモリカードのような P D (P o t a b l e D e v i c e) 8への入力信号（ディジタルオーディオ信号 DA、圧縮ストリーム信号 DS等）のコピーを制御する。すなわち、ゥォ一タ —マークデコーダ 6は、 R o b u s t ウォータ一マーク DC 1及び F r a g i 1 e ゥォ一タ一マーク D C 2を検出する。 L CM (L i c e n s e d S DM I (S e c u r e D i g i t a l Mu s i c I n i t i a t i v e) C omp l i a n t Mo d u l e) 7は、ウォーターマークデコーダ 6によつて検出された 2種類のゥォ一タ一マーク（Ro b u s t ウォーターマーク DC 1 及び F r a g i 1 eウォーターマーク DC 2) により、音楽コンテンツを PD 8 にコピーするか否かを制御する。

図 2は、検出された 2種類のウォーターマークを用いて、 LCM7が音楽コンテンッを P D 8にコピーするか否かを制御する一例を示し、 LCM7は、 Ro b u s t ゥォ一タ一マーク DC 1が検出され、 F r a g i l e ウォータ一マーク DC 2が検出されない場合には、音楽コンテンツに圧縮履歴が有ると判断して当該音楽コンテンツの p D 8へのコピーを禁止する。

また LCM7は、 R o b u s t ウォータ一マ一ク DC 1及び F r a g i 1 e ウォータ一マーク DC 2が共に検出された場合には、音楽コンテンツに圧縮履歴がないと判断して当該音楽コンテンツの PD 8へのコピーを許可する。

さらに LCM7は、 R o b u s t ウォータ一マーク D C 1及び F r a g i 1 e ウォーターマーク DC 2が共に検出されなかった場合には、音楽コンテンツの著作権者及びコピーの許可の是非等の情報がないため、当該音楽コンテンツの PD 8へのコピ一を許可する。さらに LCM7は、 R o b u s t ウォーターマ一ク D C 1が検出されず、 F r a g i l eウォータ一マーク DC 2が検出されない場合とレヽうのは、技術的にありえないため例外とする。

図 3は、ウォーターマークエンコーダ 1の構成を示し、心理聴覚分析部 1 1は、順次入力されるディジタルオーディオ信号 DA 1に対して、心理聴覚モデルを利用して分析を行い、 R o b u s t ゥォ一ターマーク重畳部及び F r a g i 1 e ゥォ一ターマーク重畳部を有するウォーターマ一ク重畳部 1 6を制御する。ディジタルオーディオ信号 D A 1は、 MDCT (変形離散コサイン変換：

o d i f i e d D i s c r e t e し o s ! n e r a n s i o r m) 処理部 1 4において MDCT係数 D 1 4を生成し、これをウォーターマーク重畳処理部 1 6に出力する。

ウォータ一マーク重畳処理部 1 6は、 R o b u s tウォータ一マーク DC 1及び F r a g i 1 eウォーターマーク DC 2をそれぞれディジタルオーディオ信号 D A 1の時系列サンプルブロックを MD C T変換した周波数スぺクトラムのうち、後述する心理聴覚分析部 1 1の分析結果に基づいて決定された周波数帯域のスぺクトラムに重畳するようになされている。

具体的には、まずウォーターマーク重畳処理部 1 6は、入力オーディオ信号 D A 1の時系列サンプルブロックを MDCT変換した周波数スぺクトラムのうち、 R o b u s t ウォータ一マーク D C 1及び F r a g i 1 eウォータ一マーク DC 2を重畳する周波数帯域のスペクトラム f 1を抽出する（図 4 (A))。

そしてウォーターマーク重畳処理部 1 6は、この周波数スぺクトラム f 1に対して一定比率でスケーリングを行い、減衰させた周波数スぺクトラム f 2を生成する（図 4 (B))。このとき埋め込むデータの極性が「1」の場合にはそのまま、埋め込むデータの極性が「0」の場合には周波数スぺクトラム f 2を正負反転したものを用いる。

続いてウォーターマーク重畳処理部 1 6は、周波数スぺクトラム f 2を周波数が増加又は減少する方向に、例えばスぺクトラム 4本分離れるようにシフトする (図 4 (C))。図 4 Cでは周波数が増加する方向に 4本分シフトし、周波数スぺクトラム ί 3を生成する。

次にウォータ一マーク重畳処理部 1 6は、こうしてシフトした周波数スぺクトラム f 3 (図 4 (O) を、元の周波数スぺクトラム f 1 (図 4 (A)) に加算することにより、得られた周波数スぺクトラム f 4 (図 4 (D)) に Ro b u s t ゥォ一ターマーク D C 1及び F r a g i 1 eゥォ一ターマーク D C 2を重畳する (図 4 (D))。

ここで加算する際には、ある周波数スぺクトラムと 4本離れた周波数スぺクトラムとの極性の相関が正又は負に偏るように処理する。すなわち周波数スぺクトラム f 1に周波数スぺクトラム f 3を加算することによって周波数スぺクトラム f 4の符号が反転する場合のみ処理を行い、それ以外の符号反転を伴わない場合には処理を行わない。この図 4 (D) において、白枠は周波数スペクトラム f 1 (図 4 (A)) から除去された信号成分であり、ハツチング枠は当該加算結果として得られた信号成分である。

これにより音質劣化の原因となる一方で検出精度に寄与しないウォーターマークの埋め込み量を低減することができる。また元の周波数スぺクトラムをスケ一リングしてその近傍に加算することにより、マスキング効果を利用して音質劣化の小さい埋め込みを実現することができる。

因みに、ゥォ一タ一マークを埋め込むことが決定された第 1の周波数成分 f 1 (図 4 (A)) のレベルを一定の比率で減衰して、埋め込むウォーターマークの極性を乗算したレベルを、当該第 1の周波数成分 f 2 (図 4 (B)) と例えば 4 個の周波数成分だけ離れた第 2の周波数成分 f 3 (図 4 (C)) のレベルに加算してウォーターマ一クを埋め込むと、ウォーターマークを埋め込んだ後に、第 1 の周波数成分 f l (図 4 (A)) と第 2の周波数成分 f 3 (図 4 (C)) との相関をとつたときの極性が同じ（正又は負）になる確率が高くなり、後述するゥォ一ターマークデコーダでは、このことを利用してゥォ一ターマークの検出を行う。このようにしてウォーターマーク重畳処理部 1 6は、心理聴覚分析部 1 1において分析された分析結果 D 1 1を基に、 R o b u s t ゥォ一ターマーク DC 1及び F r a g i 1 eウォーターマーク DC 2をそれぞれ予め別々に割当てられた複数の周波数帯域の中で、後述する最小可聴限界やマスキング . スレショルド効果を考慮した周波数帯域及び音圧レベルとなるように埋め込む。

すなわち、心理聴覚分析部 1 1は、入力ディジタルオーディオ信号 D A 1を分析し、原音と最小可聴限界の曲線から実際に原音を聞きながら感知できる限界であるマスキング ' スレツショルドを算出する。与えられたディジタルオーディオ信号 D A 1に対するマスキング能力は、その周波数帯域と音圧レベルとに依存している

一般に圧縮処理を行うエンコーダでは、周波数帯域と音圧レベルとの情報を基に、限定されたビット分解能で入力オーディオ信号を表現する最良の方法を決定することになる。すなわち、圧縮で用いられる心理聴覚モデルを利用して、圧縮処理によって削られ易い周波数のポジション、エネルギーでウォータ一マークを埋め込むことにより、圧縮に弱い F r a g i 1 eウォーターマーク D C 2を実現することができる。

以下、圧縮処理によって削られ易い周波数帯域を利用して圧縮に強い R o b u s tウォータ一マーク D C 1及び圧縮に弱い F r a g i 1 eウォータ一マーク D C 2を埋め込む方法の原理について説明する。

図 5は、最小可聴限界を示し、静寂時の最小可聴限界とは聴覚が検知できる音の最小レベルであり、聴覚が静寂時に聞き取ることができるノィズの限界に関係している。図 5に示すように、ト一ン Aのように静寂時の最小可聴限界より高い音圧レベルの音は聞き取ることができるが、トーン Bのように諍寂時の最小可聴限界より低い音圧レベルの音は聞き取ることができない。また図 5に示すように、最小可聴限界は、静寂時の最小可聴限界は周波数に依存しており、同じ音圧レベルを有するトーン A及び Bであっても、その音の周波数によって聞き取ることができる場合とできない場合とがある。

また、図 6はマスキング効果を示すものであり、マスキング効果は主に量子化歪みや背景ノイズの検知限界と関係し、特定の音の検知限界は同時に聞いている他の音によって大きく変化する。図 6に示すように、トーン Cに対して一定の周波数範囲内では他の音は聞き取り難くなり、例えばトーン Dは比較的音圧レベルの高い純音であっても聞き取ることが困難であり、一方、トーン Eは聞き取り得ることになる。マスキング効果はマスクする音（マスカ一）とマスクされて聞こえなくなる音（マスキー）の周波数が近くなるほど強く働く。

従って、ゥォ一タ一マークエンコーダ 1では、これらの原理を利用して、 M P 3等の信号の圧縮処理の圧縮特性を考慮したウォーターマーク（R o b u s t ゥオーターマーク D C 1及び F r a g i 1 e D C 2 ) の埋め込み処理が行われる因みに、図 7は M P 3エンコーダ 3 (図 1 ) における符号化（心理聴覚を考慮した心理聴覚符号化）を示し、例えば M P 3エンコーダ 3では、入力オーディオ信号 D Aを 3 2個の周波数帯域（サブバンド）に分割した後、量子化ノイズが最小可聴限界以下に収まるように心理聴覚符号化を行う。図 7の実線はオーディォ信号 D Aの周波数分布、太線は静寂時の最小可聴限界を表す。

心理聴覚符号化では、まず、原音と最小可聴限界の曲線から、実際に原音を聞いた際に感知できる限界であるマスキング · スレツショルド（図 7の破線）を算出する。次に各サブバンド毎に、量子化ノイズがマスキング 'スレツショルドより小さいレベルとなるように、各サブバンドの量子化ステップを割り当てる。図 7において圧縮処理によりサンプルする範囲を矩形領域で示し、矩形の底辺が量子化ノイズレベルになる。原音がマスキング · スレツショルドより小さい領域では、原音は聞こえないためサンプルから削ることが可能であり、一方、聴覚の感度が高く、マスキングが十分働いていない領域では、量子化ステップを細かくして量子化ノイズのレベルを下げる。

従って、ゥォ一ターマークエンコーダ 1の心理聴覚分析部 1 1では、入力されたディジタルォ一ディォ信号 D A 1について、かかる M P 3エンコーダ 3の心理聴覚符号化の特性に基づいてディジタルオーディォ信号 D A 1を分析すると共に、当該分析結果に基づいて R o b u s tウォータ一マーク DC 1及び F r a g i 1 eウォーターマーク DC 2を埋め込むべき周波数帯域及びその音圧レベルを算出し、当該算出結果（心理聴覚符号化情報 D l 1 ) によってウォーターマーク重畳部 1 6を制御する。

この結果、図 8に示すように、圧縮処理でサンプルされる矩形領域に重なる様にウォータ一マークを埋め込むことにより、当該ウォーターマークは圧縮に強い R o b u s t ウォータ一マーク DC 1 として機能し、圧縮処理で削られる矩形領域外にウォーターマークを埋め込めむことにより、当該ウォータ一マークは圧縮に弱い F r a g i 1 eウォータ一マーク DC 2として機能する。

従って、ウォータ一マーク重畳部 1 6は、心理聴覚分析部 1 1により計算された心理聴覚符号化情報 D l 1に基づいて、ディジタルオーディオ信号 D A 1に R o b u s tウォーターマーク DC 1及び F r a g i 1 eウォーターマ一ク DC 2 を埋め込む。

なお、ウォータ一マークを埋め込む領域は周波数領域に限らず、時間領域であつても良い。

かくしてウォータ一マーク重畳部 1 6から出力された MDCT係数 D 1 6は、 I MDCT処理部 1 5において逆直交変換されることにより、元のディジタルォ —ディォ信号 D A 1 と同一の形式でありかつ R o b u s t ウォーターマーク D C 1及び F r a g i 1 e ウォーターマーク D C 2が埋め込まれたディジタルオーディォ信号 D A 2として出力される。

この実施の形態においては、ディジタルオーディォ信号 D A 2を所定のェンコ —ダ（図示せず）によりエンコードしてディスク原盤を露光し、このディスク原盤から光ディスク 2が量産される。

図 9はディジタルオーディォ信号 D A 1を処理するウォーターマ一クェンコーダ 1の処理手順を示し、ウォーターマークエンコーダ 1はステップ S P 1 1からステップ S P 1 2に移り、ディジタルオーディオ信号 D A 1を順次サンプルプロック毎に読み込む。続いて、ウォーターマークエンコーダ 1は、ステップ S P 1 3に移って、ディジタルオーディオ信号 D A 1を分析して当該ディジタルオーディォ信号 D A 1から心理聴覚符号化情報 D 1 1を抽出する。

そして、ウォーターマーク 1は続くステップ S P 1 4において、心理聴覚符号化情報 D 1 1に基づいて、 R o b u s t ウォーターマーク D C 1をディジタルォ —ディォ信号 D A 1に埋め込み、さらにステップ S P 1 5において心理聴覚符号化情報 D 1 1に基づき F r a g i 1 eウォータ一マーク DC 2をディジタルオーディォ信号 D A 1に埋め込む。

これにより、ゥォ一ターマークエンコーダ 1は入力されたディジタルオーディォ信号 D A 1 と同一形式でありかつ R o b u s t ゥォ一タ一マーク DC 1及び F r a g i 1 eゥォ一ターマーク DC 2が埋め込まれたディジタルオーディォ信号 D A 2を得る。

続いてウォータ一マークエンコーダ 1は、ステップ S P 1 6に移り、ディジタルオーディオ信号 D A 1の処理を完了したか否かを判断し、ここで否定結果が得られるとステップ S P 1 2に戻る。これによりウォータ一マークエンコーダ 1は、順次サンプルブロック毎にこの処理手順を繰り返してディジタルオーディォ信号 DA 1を処理し、ステップ S P 1 6において肯定結果が得られると、ステップ S P 1 6からステップ S P 1 7に移って当該処理手順を終了する。

図 1 0は、図 1について上述したパーソナルコンピュータ 5のウォータ一マークデコーダ 6の構成を示し、ウォータ一マークデコーダ 6は、光ディスク 2 (図 1 ) を再生して得られるディジタルオーディオ信号 DA 2から R o b u s tゥォ —ターマーク D C 1及び F r a g i 1 eウォーターマーク D C 2を検出する _c すなわちウォータ一マークデコーダ 6において、 R o b u s t ゥォ一ターマークデコード部 6 1は、順次入力されるディジタルオーディオ信号 D A 2を MD C T処理部 6 0において MDC T処理することにより MD CT係数 D 6 0を得、これをウォータ一マーク検出部 6 1に出力する。ウォーターマーク検出部 6 1は、入力された MDCT係数 D 60について、 R o b u s tゥォ一ターマーク DC 1及び F r a g i 1 eウォータ一マーク DC 2 の埋め込み周波数帯域として予め別々に割当てられている各複数の周波数成分を、例えば、周波数が増加又は減少する方向に例えば 4個の周波数成分だけシフトする処理を行い、当該処理によって得られた新たな MDCT係数と MDCT処理部 60から得られる MDCT係数 D 60とに基づいて、周波数成分の極性を比較し、極性の偏り分に基づいて R o b u s t ゥォ一ターマ一ク DC 1及び F r a g i 1 eウォータ一マーク D C 2を検出する。

なお、ウォーターマークを検出する領域は周波数領域に限らず、時間領域であつても良い。

かくして光ディスク 2に記録されているディジタルオーディォ信号 D A 2をパ —ソナルコンピュータ 5を介して P D 8にコピーする際に、 R o b u s tゥォ一ターマーク DC 1のみが検出されると、このことは MP 3による圧縮履歴が有ること、すなわちこのとき検出された R o b u s t ゥォ一タ一マーク DC 1が埋め込まれているディジタルオーディオ信号 D A 2がネットヮ一ク 4を介して配信されたコンテンツであると判断でき、著作権者によって予めコピー制限が設定されている場合には当該コピー制限を行うことにより著作権者が意図しない不正コピ一を防止できる。

また、 Ro b u s t ウォーターマーク D C 1及び F r a g i l eウォーターマーク DC 2の両方が検出されると、このことは MP 3の圧縮履歴がないこと、すなわちネットワーク 4を介して配信されたものではないことを表しており、著作権者によって無料で開放されているとして当該コピー制限を行う必要がないことが分かる。

このように、パーソナルコンピュータ 5では、 R o b u s t ウォーターマーク DC 1及び F r a g i 1 eウォータ一マーク DC 2による著作権情報や圧縮履歴情報に基づいてコピー制限を行うことができる。図 1 1はディジタルオーディォ信号 D A 2を処理するウォーターマークデコーダ 6の処理手順を示し、ウォーターマーク 6はステップ S P 2 1から当該処理手順に入るとステップ S P 2 2に移り、ディジタルオーディォ信号 D A 2を順次サンプルプロック毎に読み込む。続いてウォーターマークデコーダ 6はステップ S P 2 3に移って、ディジタルオーディオ信号 D A 2から R o b u s tウォータ一マーク D C 1を検出し、続くステップ S P 2 4において F r a g i 1 eウォータ一マーク D C 2を検出する。

F r a g i 1 eウォーターマーク D C 2を検出した後、ウォーターマークデコ —ダ 6は、ステップ S P 2 5に移り、ディジタルオーディオ信号 D A 2の処理を完了したか否かを判断し、否定結果が得られるとステップ S P 2 2に戻る。これにより、ウォータ一マークデコーダ 6は、順次サンプルブロック毎にこの処理手順を繰り返してディジタルオーディオ信号 D A 2を処理し、ステップ S P 2 5において肯定結果が得られると、ステップ S P 2 6に移って当該処理手順を終了する。

以上の構成において、ウォーターマークエンコーダ 1の心理聴覚分析部 1 1は、 MP 3エンコーダ 3における圧縮特性（種々の圧縮規格に採用されている最小可聴限界、マスキング効果等の心理聴覚モデル）に応じて R o b u s t ゥォ一タ —マーク D C 1及び F r a g i 1 e ウォータ一マーク D C 2の埋め込む位置（例えば周波数帯域）及び音圧レベルを決定することにより、 M P 3エンコーダ 3の圧縮特性に合致した圧縮に弱い F r a g i 1 eウォーターマ一ク D C 2をディジタルオーディオ信号 D A 1に埋め込むことができる。

従って、圧縮に弱い F r a g i 1 eウォータ一マーク D C 2は、 M P 3ェンコ —ダ 3を介して圧縮されると、その残存率は十分に低下することになり、ウォーターマークデコーダ 6において検出されないことになる。

かくして以上の構成によれば、圧縮に強い R o b u s tゥォ一タ一マーク D C 1及び圧縮に弱い F r a g i 1 eウォーターマーク D C 2を容易に実現することができる。因みに、圧縮耐性の強い R o b u s t ウォーターマーク D C 1に著作権情報を埋め込むことにより、圧縮系を通った後に検出された R o b u _S tゥォ一ターマーク D C 1に基づいて著作権情報を検出することができると共に、圧縮系を通った後に F r a g i 1 eウォーターマーク D C 2の除去又は減少に基づいて圧縮履歴を判断することができることにより、ネットワークを介した不正コピ一を未然に防止することができる。

なお上述の実施の形態においては、光ディスク 2を再生して得られるディジタルオーディォ信号から、 R o b u s t ウォーターマーク D C 1及び！⁷ r a g i 1 eウォーターマーク D C 2を検出する場合について述べたが、本発明はこれに限らず、例えばディジタルオーディオ信号を圧縮処理したストリーム信号から、ゥオーターマークを検出する場合にも適用することができる。このようにすれば、圧縮ストリ一ム信号を再び伸長して元のディジタルオーディォ信号と同一の形式に変換する手間を省くことができ、処理を高速化することができる。

またディジタルオーディオ信号に R o b u s tウォーターマーク D C 1及び F r a g i 1 eウォーターマ一ク D C 2を埋め込む場合に、 F r a g i 1 eウォータ一マーク D C 2が所定の圧縮処理に対しては消去されない形態で埋め込むようにしても良い。

この場合、 F r a g i 1 eゥォ一ターマーク D C 2は、正当な配布時の圧縮処理によって消去されない形態で埋め込んでおき、当該ウォーターマーク付きディジタルオーディオ信号を M P 3等の他の圧縮処理を行ったときに F r a g i 1 e ウォーターマーク D C 2が消去される形態で埋め込むようにすれば良い。具体的には、正当な配布時に用いる圧縮処理の圧縮特性と、他の圧縮処理の圧縮特性とを比較して、配布時に用いる圧縮処理では削除されないが、他の圧縮処理では圧縮処理時に上述した最小可聴限界及びマスキング ■ スレツショルドに基づいてデイジタルオーディオ信号に対して行われる量子化処理で削除される信号に F r a g i 1 eウォーターマーク D C 2を埋め込むようにする。さらに上述の実施の形態においては、ディジタルオーディオ信号に R o b u s tウォータ一マ一ク D C 1及び F r a g i 1 e ゥォ一タ一マーク D C 2を共に埋め込むようにした場合について述べたが、本発明はこれに限らず、ディジタルォ一ディォ信号に R o b u s tゥォ一タ一マーク D C 1を埋め込んでおき、圧縮処理を行った後で当該圧縮処理したストリーム信号に対して F r a g i 1 eウォータ一マーク D C 2を埋め込むようにしても良い。この結果、コ一デック（C o d e c ) の特性を考盧することなく F r a g i 1 eウォーターマーク D C 2の圧縮処理による消去の度合いを限りなく低いレベルで容易に設定することができる。さらに上述の実施の形態においては、 F r a g i 1 eゥォ一タ一マーク D C 2 を M P 3等の圧縮処理後に完全に削除される位置及びレベルでディジタルオーディォ信号に埋め込むように構成した場合について述べたが、本発明はこれに限らず、 M P 3等の圧縮処理後であっても完全に F r a g i 1 eウォーターマーク D C 2を削除しなくても良い。

すなわち検出側において F r a g i 1 e ウォータ一マーク D C 2の検出レベルが所定の閾値以下であるか否かを判断し、当該閾値未満の場合には、検出対象であるディジタルオーディオ信号が不正にコピーされたものであると判断するように構成しておく一方、当該閾値以上の場合には、検出対象であるディジタルォーディォ信号が正当にコピーされたものであると判断するように構成しておくようにすれば良い。要は、 R o b u s t ウォーターマーク D C 1及び F r a g i 1 e ゥォ一タ一マーク D C 2が埋め込まれたディジタルオーディォ信号に M P 3等の圧縮処理を行った後に、検出側において、 F r a g i 1 eウォータ一マーク D C 2の残存率の低下度に基づいて当該圧縮処理が行われた事実を検知することができれば、ディジタルオーディオ信号に対して F r a g i l eウォーターマーク D C 2をどのような構成で埋め込むようにしても良い。

さらに上述の実施の形態においては、 M P 3の圧縮特性である心理聴覚モデルを用いて、ディジタルオーディォ信号に R o b u s t ウォータ一マ一ク D C 1及び F r a g i 1 eウォータ一マーク DC 2を埋め込む場合について述べたが、本発明はこれに限らず、例えば MP EG— AAC、 ATRAC、 AT R AC 2 _x A TRA C 3、 D o l b y AC 3、 MS (M i c r o s o f t ) Au d i o、 Tw i n VQ等の種々の圧縮規格に基づく心理聴覚モデル、又はこれらの組み合わせた心理聴覚モデルを用いる場合に広く適用することができる。このようにすれば、より多くの圧縮規格に対応した汎用的な F r a g i l eウォーターマークを実現することができる。

また上述の実施の形態においては、ウォーターマークエンコーダ 1において R o b u s tウォーターマークェンコ一ド部及び F r a g i 1 eウォーターマークエンコード部を統合した構成について述べたが、本発明はこれに限らず、例えば R o b u s tウォーターマークェンコ一ド部及び F r a g i 1 eウォータ一マークェンコード部を直列に接続した構成、又は R o b u s t ウォーターマークェンコード部及び F r a g i 1 eウォーターマークェンコ一ド部を並列に接続する構成を適用することもできる。

また上述の実施の形態においては、ゥォ一ターマークデコーダ 6において R o b u s tゥォ一タ一マークデコ一ド部及び F r a g i 1 eウォーターマークデコ —ド部を統合した構成について述べたが、本発明はこれに限らず、例えば R o b u s t ウォーターマークデコード部及び F r a g i 1 eウォーターマークデコード部を直列に接続した構成、又は R o b u s tウォーターマークデコード部及び F r a g i 1 eウォーターマークデコード部を並列に接続する構成を適用することもできる。

また上述の実施の形態においては、著作権情報及び圧縮履歴情報をディジタルオーディオ信号に重畳する場合について述べたが、本発明はこれに限らず、必要に応じて種々の情報を重畳して伝送する場合に本発明を適用することができる。また上述の実施の形態においては、ウォーターマークエンコーダ 1によってゥォ一ターマークの埋め込み処理が行われる場合について述べたが、本発明はこれに限らず、ウォーターマークエンコーダ 1の各機能を実現するプログラムを格納したプログラム格納媒体（フロッピィディスク、光ディスク等）からこれらのプログラムを情報処理装置（コンピュータ）にロードして各機能を実行させるようにしても良レ、。

例えば図 1 2に示すような通常のコンピュータ 70においては、全体の制御を司る C PU (C e n t r a l P r o c e s s i n g Un i t ) 7 1 と、各種ソフトウェアが格納された ROM (R e a d On l y Me mo r y) 72と、 C PU 7 1のワークメモリとしての R AM (R a n d om Ac c e s s Me mo r y) 73と、各種データが格納されたハードディスク装置 74と、 C PU 7 1がネットワークを介して外部と通信するためのィンターフェ一スである通信ポート 75とを有し、これらがバス 76を介して相互に接続されることにより構成されている。

この場合コンピュータ 70では、上述の各機能を実現するプログラムがハードディスク装置 74又は ROM7 2に格納されており、実行時に C PU 7 1が R A M73に格納されているワークメモリに基づいて、対応する各機能部を実現するようにすれば良い。またコンピュータ 70では、上述の各機能を実現するプログラムを通信ポ一ト 75を介してインストールするようにしても良い。産業上の利用の可能性

本発明は信号処理装置及びその方法並びにプロダラム格納媒体に関し、例えば音楽データ等の著作権を保護する場合に適用することができる。

Claims

請求の範囲

1 . 所定の入力信号に電子透かし情報を重畳する信号処理装置において、上記入力信号を圧縮処理した際の上記入力信号の残存状態を上記圧縮処理に対応して心理聴覚分析し、当該分析結果を心理聴覚符号化情報として出力する心理聴覚分析手段と、

上記心理聴覚符号化情報に基づいて、上記入力信号に上記電子透かし情報を重畳する重畳手段と

を具えることを特徴とする信号処理装置。

2 . 上記心理聴覚分析手段は、

最小可聴限界に基づいて上記心理聴覚符号化情報を生成する

ことを特徴とする請求の範囲第 1項に記載の信号処理装置。

3 . 上記心理聴覚分析手段は、

音声信号のマスキング効果に基づいて上記心理聴覚符号化情報を生成することを特徴とする請求の範囲第 1項に記載の信号処理装置。

4 . 上記重畳手段は、

上記心理聴覚符号化情報に基づいて、上記圧縮処理に対する圧縮耐性の大きな電子透かし情報及び上記圧縮処理に対する圧縮耐性の小さな電子透かし情報を上記入力信号に重畳する

5 . 上記電子透かし情報は、上記入力信号に関する著作権情報である

6 . 所定の入力信号に電子透かし情報を重畳する信号処理方法において、上記入力信号を圧縮処理した際の上記入力信号の残存状態を上記圧縮処理に対応して心理聴覚分析し、当該分析結果を心理聴覚符号化情報として出力するステップと、

上記心理聴覚符号化情報に基づいて、上記入力信号に上記電子透かし情報を重畳するステップと

を具えることを特徴とする信号処理方法。

7 . 上記心理聴覚分析するステップでは、

最小可聴限界に基づいて上記心理聴覚符号化情報が生成される

ことを特徴とする請求の範囲第 6項に記載の信号処理方法。

8 . 上記心理聴覚分析するステップでは、

音声信号のマスキング効果に基づいて上記心理聴覚符号化情報が生成されることを特徴とする請求の範囲第 6項に記載の信号処理方法。

9 . 上記入力信号に上記電子透かし情報を重畳するステップでは、

上記心理聴覚符号化情報に基づいて、上記圧縮処理に対する圧縮耐性の大きな電子透かし情報及び上記圧縮処理に対する圧縮耐性の小さな電子透かし情報が上記入力信号に重畳される

1 0 . 上記電子透かし情報は、上記入力信号に関する著作権情報である

1 1 . 入力信号を圧縮処理した際の上記入力信号の残存状態を上記圧縮処理に対応して心理聴覚分析し、当該分析結果を心理聴覚符号化情報として出力するステップと、

を含むプログラムを信号処理装置に実行させるプログラム格納媒体。

1 2 . 上記心理聴覚分析するステップでは、

ことを特徴とする請求の範囲第 1 1項に記載のプログラム格納媒体。

1 3 . 上記心理聴覚分析するステップでは、

音声信号のマスキング効果に基づいて上記心理聴覚符号化情報が生成されることを特徴とする請求の範囲第 1 1項に記載のプログラム格納媒体。

1 4 . 上記入力信号に上記電子透かし情報を重畳するステップでは、

1 5 . 上記電子透かし情報は、上記入力信号に関する著作権情報である

ことを特徴とする請求の範囲第 1 1項に記載のプロダラム格納媒体。