JP4582384B2 - 信号処理装置及びその方法並びにプログラム格納媒体 - Google Patents

信号処理装置及びその方法並びにプログラム格納媒体 Download PDF

Info

Publication number
JP4582384B2
JP4582384B2 JP2001534134A JP2001534134A JP4582384B2 JP 4582384 B2 JP4582384 B2 JP 4582384B2 JP 2001534134 A JP2001534134 A JP 2001534134A JP 2001534134 A JP2001534134 A JP 2001534134A JP 4582384 B2 JP4582384 B2 JP 4582384B2
Authority
JP
Japan
Prior art keywords
compression
input signal
watermark
watermark information
digital watermark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001534134A
Other languages
English (en)
Inventor
祐樹 松村
英雄 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Application granted granted Critical
Publication of JP4582384B2 publication Critical patent/JP4582384B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00884Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
    • G11B20/00891Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm embedded in audio data

Description

【0001】
【技術分野】
本発明は信号処理装置及びその方法並びにプログラム格納媒体に関し、例えば音楽データ等の著作権を保護する場合に適用して好適なものである。
【0002】
【背景技術】
近年、ウェブサイトからインターネット等のネットワークを介して不特定多数のネットワーク端末装置(コンピュータ)に音楽コンテンツ等が配信されるようになっている。
【0003】
コンピュータのユーザは配信された音楽コンテンツをディジタルデータの状態で種々の記録媒体に記録することにより、好みの音楽を高音質で記録した音楽ソフトをユーザが意のままに作成することができる。
このように、コンピュータを操作するユーザがウェブサイトにアクセスするだけで、自由に音楽コンテンツを記録媒体に記録することができるのであるが、ウェブサイトの開設側が著作権者の許可なく無断でその著作物である音楽コンテンツを配信する行為は、当該音楽コンテンツの著作権侵害が発生する問題がある。
【0004】
【発明の開示】
本発明は以上の点を考慮してなされたもので、例えばネットワークを介して不特定多数の端末装置に配信されたコンテンツについての著作権侵害行為を有効に抑制し得る信号処理装置及びその方法並びにプログラム格納媒体を提案しようとするものである。
【0005】
かかる課題を解決するため本発明においては、圧縮処理で用いられる心理聴覚モデルに基づいて所定の入力信号を心理聴覚分析し、当該分析結果に基づいて、当該入力信号における圧縮処理でサンプルされる周波数帯域及びその音圧レベルの範囲に重なるように圧縮処理に対する圧縮耐性の大きな電子透かし情報を埋め込むべき周波数帯域及びその音圧レベルを算出し、当該入力信号における圧縮処理で削られる周波数帯域及びその音圧レベルの範囲に収まるように圧縮処理に対する圧縮耐性の小さな電子透かし情報を埋め込むべき周波数帯域及びその音圧レベルを算出し、当該算出結果に基づいて、当該入力信号に当該圧縮耐性の大きな電子透かし情報及び当該圧縮耐性の小さな電子透かし情報を重畳するようにしたことにより、当該入力信号をコピーする情報処理装置において、当該圧縮耐性の大きな電子透かし情報に基づいて当該入力信号に関する著作権情報を検出することができ、当該圧縮耐性の小さな電子透かし情報の除去又は減少に基づいて当該入力信号の圧縮履歴を判断することができるので、当該著作権情報と当該圧縮履歴とに基づいて当該入力信号のコピー制御を行うことができ、ネットワークを介した不正コピーを未然に防止することができる。
【0006】
【発明を実施するための最良の形態】
以下図面について、本発明の一実施の形態を詳述する。
【0007】
図1において、10は全体としてコンテンツのコピー制御システムを示し、オーディオソースであるディジタルオーディオ信号DAを光ディスク2に記録する際に、ウォーターマーク(電子透かし情報)エンコーダ1により、Robust(強い)ウォーターマークDC1及びFragile(弱い)ウォーターマークDC2をディジタルオーディオ信号DAに付加して光ディスク2に記録する。
【0008】
ここで、RobustウォーターマークDC1はオーディオソースの著作権者、コピーを許可するか否か等の情報により構成され、FragileウォーターマークDC2は圧縮履歴を検出するトリガ等の情報により構成される。因みに、RobustウォーターマークDC1はMP3等の圧縮系を介しても消えないウォーターマークであり、FragileウォーターマークDC2はMP3等の圧縮系を通るとその量子化誤差により消える(残存率が低くなる)ウォーターマークである。
【0009】
このようにしてRobustウォーターマークDC1及びFragileウォーターマークDC2を含むディジタルオーディオ信号DAが記録された光ディスク2のうち、例えばMP3(MPEG Audio Layer 3)エンコーダ3等による圧縮処理を介して、ネットワーク4上のサイトにアップロードされた圧縮ストリーム信号DSをパーソナルコンピュータ5にダウンロードする場合、またRobustウォーターマークDC1及びFragileウォーターマークDC2を含むディジタルオーディオ信号DAが記録された光ディスク2のうち、圧縮処理を介さずに流通する光ディスク2をパーソナルコンピュータ5に装填する場合において、まずパーソナルコンピュータ5は、モデム(変復調装置)を構成するコーデック(Codec:Code and Decode)に入力された入力信号に基づいて、当該入力信号が圧縮されていないディジタルオーディオ信号DAであるか、又は圧縮ストリーム信号DSであるか、さらにはいずれの圧縮規格によりエンコードされた圧縮ストリーム信号DSであるかを判別し、当該判別結果に応じてスイッチSWを選択的に切り換える。
【0010】
そして、ウォーターマークデコーダ6により、パーソナルコンピュータ5の入力信号から、埋め込まれた著作権情報を検出し、例えばメモリカードのようなPD(Potable Device)8への入力信号(ディジタルオーディオ信号DA、圧縮ストリーム信号DS等)のコピーを制御する。すなわち、ウォーターマークデコーダ6は、RobustウォーターマークDC1及びFragileウォーターマークDC2を検出する。LCM(Licensed SDMI(Secure Digital Music Initiative)Compliant Module)7は、ウォーターマークデコーダ6によって検出された2種類のウォーターマーク(RobustウォーターマークDC1及びFragileウォーターマークDC2)により、音楽コンテンツをPD8にコピーするか否かを制御する。
【0011】
図2は、検出された2種類のウォーターマークを用いて、LCM7が音楽コンテンツをPD8にコピーするか否かを制御する一例を示し、LCM7は、RobustウォーターマークDC1が検出され、Fragile ウォーターマークDC2が検出されない場合には、音楽コンテンツに圧縮履歴が有ると判断して当該音楽コンテンツのPD8へのコピーを禁止する。
【0012】
またLCM7は、RobustウォーターマークDC1及びFragile ウォーターマークDC2が共に検出された場合には、音楽コンテンツに圧縮履歴がないと判断して当該音楽コンテンツのPD8へのコピーを許可する。
【0013】
さらにLCM7は、RobustウォーターマークDC1及びFragile ウォーターマークDC2が共に検出されなかった場合には、音楽コンテンツの著作権者及びコピーの許可の是非等の情報がないため、当該音楽コンテンツのPD8へのコピーを許可する。さらにLCM7は、RobustウォーターマークDC1が検出されず、FragileウォーターマークDC2が検出されない場合というのは、技術的にありえないため例外とする。
【0014】
図3は、ウォーターマークエンコーダ1の構成を示し、心理聴覚分析部11は、順次入力されるディジタルオーディオ信号DA1に対して、心理聴覚モデルを利用して分析を行い、Robustウォーターマーク重畳部及びFragile ウォーターマーク重畳部を有するウォーターマーク重畳部16を制御する。
【0015】
ディジタルオーディオ信号DA1は、MDCT(変形離散コサイン変換:Modified Discrete Cosine Transform) 処理部14においてMDCT係数D14を生成し、これをウォーターマーク重畳処理部16に出力する。
【0016】
ウォーターマーク重畳処理部16は、RobustウォーターマークDC1及びFragileウォーターマークDC2をそれぞれディジタルオーディオ信号DA1の時系列サンプルブロックをMDCT変換した周波数スペクトラムのうち、後述する心理聴覚分析部11の分析結果に基づいて決定された周波数帯域のスペクトラムに重畳するようになされている。
【0017】
具体的には、まずウォーターマーク重畳処理部16は、入力オーディオ信号DA1の時系列サンプルブロックをMDCT変換した周波数スペクトラムのうち、RobustウォーターマークDC1及びFragileウォーターマークDC2を重畳する周波数帯域のスペクトラムf1を抽出する(図4(A))。
【0018】
そしてウォーターマーク重畳処理部16は、この周波数スペクトラムf1に対して一定比率でスケーリングを行い、減衰させた周波数スペクトラムf2を生成する(図4(B))。このとき埋め込むデータの極性が「1」の場合にはそのまま、埋め込むデータの極性が「0」の場合には周波数スペクトラムf2を正負反転したものを用いる。
【0019】
続いてウォーターマーク重畳処理部16は、周波数スペクトラムf2を周波数が増加又は減少する方向に、例えばスペクトラム4本分離れるようにシフトする(図4(C))。図4Cでは周波数が増加する方向に4本分シフトし、周波数スペクトラムf3を生成する。
【0020】
次にウォーターマーク重畳処理部16は、こうしてシフトした周波数スペクトラムf3(図4(C))を、元の周波数スペクトラムf1(図4(A))に加算することにより、得られた周波数スペクトラムf4(図4(D))にRobustウォーターマークDC1及びFragileウォーターマークDC2を重畳する(図4(D))。
【0021】
ここで加算する際には、ある周波数スペクトラムと4本離れた周波数スペクトラムとの極性の相関が正又は負に偏るように処理する。すなわち周波数スペクトラムf1に周波数スペクトラムf3を加算することによって周波数スペクトラムf4の符号が反転する場合のみ処理を行い、それ以外の符号反転を伴わない場合には処理を行わない。この図4(D)において、白枠は周波数スペクトラムf1 (図4(A))から除去された信号成分であり、ハッチング枠は当該加算結果として得られた信号成分である。
【0022】
これにより音質劣化の原因となる一方で検出精度に寄与しないウォーターマークの埋め込み量を低減することができる。また元の周波数スペクトラムをスケーリングしてその近傍に加算することにより、マスキング効果を利用して音質劣化の小さい埋め込みを実現することができる。
【0023】
因みに、ウォーターマークを埋め込むことが決定された第1の周波数成分f1(図4(A))のレベルを一定の比率で減衰して、埋め込むウォーターマークの極性を乗算したレベルを、当該第1の周波数成分f2(図4(B))と例えば4個の周波数成分だけ離れた第2の周波数成分f3(図4(C))のレベルに加算してウォーターマークを埋め込むと、ウォーターマークを埋め込んだ後に、第1の周波数成分f1(図4(A))と第2の周波数成分f3(図4(C))との相関をとったときの極性が同じ(正又は負)になる確率が高くなり、後述するウォーターマークデコーダでは、このことを利用してウォーターマークの検出を行う。
【0024】
このようにしてウォーターマーク重畳処理部16は、心理聴覚分析部11において分析された分析結果D11を基に、RobustウォーターマークDC1及びFragileウォーターマークDC2をそれぞれ予め別々に割当てられた複数の周波数帯域の中で、後述する最小可聴限界やマスキング・スレショルド効果を考慮した周波数帯域及び音圧レベルとなるように埋め込む。
【0025】
すなわち、心理聴覚分析部11は、入力ディジタルオーディオ信号DA1を分析し、原音と最小可聴限界の曲線から実際に原音を聞きながら感知できる限界であるマスキング・スレッショルドを算出する。与えられたディジタルオーディオ信号DA1に対するマスキング能力は、その周波数帯域と音圧レベルとに依存している。
【0026】
一般に圧縮処理を行うエンコーダでは、周波数帯域と音圧レベルとの情報を基に、限定されたビット分解能で入力オーディオ信号を表現する最良の方法を決定することになる。すなわち、圧縮で用いられる心理聴覚モデルを利用して、圧縮処理によって削られ易い周波数のポジション、エネルギーでウォーターマークを埋め込むことにより、圧縮に弱いFragileウォーターマークDC2を実現することができる。
【0027】
以下、圧縮処理によって削られ易い周波数帯域を利用して圧縮に強いRobustウォーターマークDC1及び圧縮に弱いFragileウォーターマークDC2を埋め込む方法の原理について説明する。
【0028】
図5は、最小可聴限界を示し、静寂時の最小可聴限界とは聴覚が検知できる音の最小レベルであり、聴覚が静寂時に聞き取ることができるノイズの限界に関係している。図5に示すように、トーンAのように静寂時の最小可聴限界より高い音圧レベルの音は聞き取ることができるが、トーンBのように静寂時の最小可聴限界より低い音圧レベルの音は聞き取ることができない。また図5に示すように、最小可聴限界は、静寂時の最小可聴限界は周波数に依存しており、同じ音圧レベルを有するトーンA及びBであっても、その音の周波数によって聞き取ることができる場合とできない場合とがある。
【0029】
また、図6はマスキング効果を示すものであり、マスキング効果は主に量子化歪みや背景ノイズの検知限界と関係し、特定の音の検知限界は同時に聞いている他の音によって大きく変化する。図6に示すように、トーンCに対して一定の周波数範囲内では他の音は聞き取り難くなり、例えばトーンDは比較的音圧レベルの高い純音であっても聞き取ることが困難であり、一方、トーンEは聞き取り得ることになる。マスキング効果はマスクする音(マスカー)とマスクされて聞こえなくなる音(マスキー)の周波数が近くなるほど強く働く。
【0030】
従って、ウォーターマークエンコーダ1では、これらの原理を利用して、MP3等の信号の圧縮処理の圧縮特性を考慮したウォーターマーク(RobustウォーターマークDC1及びFragile DC2)の埋め込み処理が行われる。
【0031】
因みに、図7はMP3エンコーダ3(図1)における符号化(心理聴覚を考慮した心理聴覚符号化)を示し、例えばMP3エンコーダ3では、入力オーディオ信号DAを32個の周波数帯域(サブバンド)に分割した後、量子化ノイズが最小可聴限界以下に収まるように心理聴覚符号化を行う。図7の実線はオーディオ信号DAの周波数分布、太線は静寂時の最小可聴限界を表す。
【0032】
心理聴覚符号化では、まず、原音と最小可聴限界の曲線から、実際に原音を聞いた際に感知できる限界であるマスキング・スレッショルド(図7の破線)を算出する。次に各サブバンド毎に、量子化ノイズがマスキング・スレッショルドより小さいレベルとなるように、各サブバンドの量子化ステップを割り当てる。
【0033】
図7において圧縮処理によりサンプルする範囲を矩形領域で示し、矩形の底辺が量子化ノイズレベルになる。原音がマスキング・スレッショルドより小さい領域では、原音は聞こえないためサンプルから削ることが可能であり、一方、聴覚の感度が高く、マスキングが十分働いていない領域では、量子化ステップを細かくして量子化ノイズのレベルを下げる。
【0034】
従って、ウォーターマークエンコーダ1の心理聴覚分析部11では、入力されたディジタルオーディオ信号DA1について、かかるMP3エンコーダ3の心理聴覚符号化の特性に基づいてディジタルオーディオ信号DA1を分析すると共に、当該分析結果に基づいてRobustウォーターマークDC1及びFragileウォーターマークDC2を埋め込むべき周波数帯域及びその音圧レベルを算出し、当該算出結果(心理聴覚符号化情報D11)によってウォーターマーク重畳部16を制御する。
【0035】
この結果、図8に示すように、圧縮処理でサンプルされる矩形領域に重なる様にウォーターマークを埋め込むことにより、当該ウォーターマークは圧縮に強いRobustウォーターマークDC1として機能し、圧縮処理で削られる矩形領域外にウォーターマークを埋め込むことにより、当該ウォーターマークは圧縮に弱いFragileウォーターマークDC2として機能する。
【0036】
従って、ウォーターマーク重畳部16は、心理聴覚分析部11により計算された心理聴覚符号化情報D11に基づいて、ディジタルオーディオ信号DA1にRobustウォーターマークDC1及びFragileウォーターマークDC2を埋め込む。
【0037】
なお、ウォーターマークを埋め込む領域は周波数領域に限らず、時間領域であっても良い。
【0038】
かくしてウォーターマーク重畳部16から出力されたMDCT係数D16は、IMDCT処理部15において逆直交変換されることにより、元のディジタルオーディオ信号DA1と同一の形式でありかつRobustウォーターマークDC1及びFragile ウォーターマークDC2が埋め込まれたディジタルオーディオ信号DA2として出力される。
【0039】
この実施の形態においては、ディジタルオーディオ信号DA2を所定のエンコーダ(図示せず)によりエンコードしてディスク原盤を露光し、このディスク原盤から光ディスク2が量産される。
【0040】
図9はディジタルオーディオ信号DA1を処理するウォーターマークエンコーダ1の処理手順を示し、ウォーターマークエンコーダ1はステップSP11からステップSP12に移り、ディジタルオーディオ信号DA1を順次サンプルブロック毎に読み込む。続いて、ウォーターマークエンコーダ1は、ステップSP13に移って、ディジタルオーディオ信号DA1を分析して当該ディジタルオーディオ信号DA1から心理聴覚符号化情報D11を抽出する。
【0041】
そして、ウォーターマークエンコーダ1は続くステップSP14において、心理聴覚符号化情報D11に基づいて、RobustウォーターマークDC1をディジタルオーディオ信号DA1に埋め込み、さらにステップSP15において心理聴覚符号化情報D11に基づきFragileウォーターマークDC2をディジタルオーディオ信号DA1に埋め込む。
【0042】
これにより、ウォーターマークエンコーダ1は入力されたディジタルオーディオ信号DA1と同一形式でありかつRobustウォーターマークDC1及びFragileウォーターマークDC2が埋め込まれたディジタルオーディオ信号DA2を得る。
【0043】
続いてウォーターマークエンコーダ1は、ステップSP16に移り、ディジタルオーディオ信号DA1の処理を完了したか否かを判断し、ここで否定結果が得られるとステップSP12に戻る。これによりウォーターマークエンコーダ1は、順次サンプルブロック毎にこの処理手順を繰り返してディジタルオーディオ信号DA1を処理し、ステップSP16において肯定結果が得られると、ステップSP16からステップSP17に移って当該処理手順を終了する。
【0044】
図10は、図1について上述したパーソナルコンピュータ5のウォーターマークデコーダ6の構成を示し、ウォーターマークデコーダ6は、光ディスク2(図1)を再生して得られるディジタルオーディオ信号DA2からRobustウォーターマークDC1及びFragileウォーターマークDC2を検出する。
【0045】
すなわちウォーターマークデコーダ6において、Robustウォーターマークデコード部61は、順次入力されるディジタルオーディオ信号DA2をMDCT処理部60においてMDCT処理することによりMDCT係数D60を得、これをウォーターマーク検出部61に出力する。
【0046】
ウォーターマーク検出部61は、入力されたMDCT係数D60について、RobustウォーターマークDC1及びFragileウォーターマークDC2の埋め込み周波数帯域として予め別々に割当てられている各複数の周波数成分を、例えば、周波数が増加又は減少する方向に例えば4個の周波数成分だけシフトする処理を行い、当該処理によって得られた新たなMDCT係数とMDCT処理部60から得られるMDCT係数D60とに基づいて、周波数成分の極性を比較し、極性の偏り分に基づいてRobustウォーターマークDC1及びFragileウォーターマークDC2を検出する。
【0047】
なお、ウォーターマークを検出する領域は周波数領域に限らず、時間領域であっても良い。
【0048】
かくして光ディスク2に記録されているディジタルオーディオ信号DA2をパーソナルコンピュータ5を介してPD8にコピーする際に、RobustウォーターマークDC1のみが検出されると、このことはMP3による圧縮履歴が有ること、すなわちこのとき検出されたRobustウォーターマークDC1が埋め込まれているディジタルオーディオ信号DA2がネットワーク4を介して配信されたコンテンツであると判断でき、著作権者によって予めコピー制限が設定されている場合には当該コピー制限を行うことにより著作権者が意図しない不正コピーを防止できる。
【0049】
また、RobustウォーターマークDC1及びFragileウォーターマークDC2の両方が検出されると、このことはMP3の圧縮履歴がないこと、すなわちネットワーク4を介して配信されたものではないことを表しており、著作権者によって無料で開放されているとして当該コピー制限を行う必要がないことが分かる。
【0050】
このように、パーソナルコンピュータ5では、RobustウォーターマークDC1及びFragileウォーターマークDC2による著作権情報や圧縮履歴情報に基づいてコピー制限を行うことができる。
【0051】
図11はディジタルオーディオ信号DA2を処理するウォーターマークデコーダ6の処理手順を示し、ウォーターマークデコーダ6はステップSP21から当該処理手順に入るとステップSP22に移り、ディジタルオーディオ信号DA2を順次サンプルブロック毎に読み込む。続いてウォーターマークデコーダ6はステップSP23に移って、ディジタルオーディオ信号DA2からRobustウォーターマークDC1を検出し、続くステップSP24においてFragileウォーターマークDC2を検出する。
【0052】
FragileウォーターマークDC2を検出した後、ウォーターマークデコーダ6は、ステップSP25に移り、ディジタルオーディオ信号DA2の処理を完了したか否かを判断し、否定結果が得られるとステップSP22に戻る。これにより、ウォーターマークデコーダ6は、順次サンプルブロック毎にこの処理手順を繰り返してディジタルオーディオ信号DA2を処理し、ステップSP25において肯定結果が得られると、ステップSP26に移って当該処理手順を終了する。
【0053】
以上の構成において、ウォーターマークエンコーダ1の心理聴覚分析部11は、MP3エンコーダ3における圧縮特性(種々の圧縮規格に採用されている最小可聴限界、マスキング効果等の心理聴覚モデル)に応じてRobustウォーターマークDC1及びFragileウォーターマークDC2の埋め込む位置(例えば周波数帯域)及び音圧レベルを決定することにより、MP3エンコーダ3の圧縮特性に合致した圧縮に弱いFragileウォーターマークDC2をディジタルオーディオ信号DA1に埋め込むことができる。
【0054】
従って、圧縮に弱いFragileウォーターマークDC2は、MP3エンコーダ3を介して圧縮されると、その残存率は十分に低下することになり、ウォーターマークデコーダ6において検出されないことになる。
【0055】
かくして以上の構成によれば、圧縮に強いRobustウォーターマークDC1及び圧縮に弱いFragileウォーターマークDC2を容易に実現することができる。因みに、圧縮耐性の強いRobustウォーターマークDC1に著作権情報を埋め込むことにより、圧縮系を通った後に検出されたRobustウォーターマークDC1に基づいて著作権情報を検出することができると共に、圧縮系を通った後にFragileウォーターマークDC2の除去又は減少に基づいて圧縮履歴を判断することができることにより、ネットワークを介した不正コピーを未然に防止することができる。
【0056】
なお上述の実施の形態においては、光ディスク2を再生して得られるディジタルオーディオ信号から、RobustウォーターマークDC1及びFragileウォーターマークDC2を検出する場合について述べたが、本発明はこれに限らず、例えばディジタルオーディオ信号を圧縮処理したストリーム信号から、ウォーターマークを検出する場合にも適用することができる。このようにすれば、圧縮ストリーム信号を再び伸長して元のディジタルオーディオ信号と同一の形式に変換する手間を省くことができ、処理を高速化することができる。
【0057】
またディジタルオーディオ信号にRobustウォーターマークDC1及びFragileウォーターマークDC2を埋め込む場合に、FragileウォーターマークDC2が所定の圧縮処理に対しては消去されない形態で埋め込むようにしても良い。
【0058】
この場合、FragileウォーターマークDC2は、正当な配布時の圧縮処理によって消去されない形態で埋め込んでおき、当該ウォーターマーク付きディジタルオーディオ信号をMP3等の他の圧縮処理を行ったときにFragile ウォーターマークDC2が消去される形態で埋め込むようにすれば良い。具体的には、正当な配布時に用いる圧縮処理の圧縮特性と、他の圧縮処理の圧縮特性とを比較して、配布時に用いる圧縮処理では削除されないが、他の圧縮処理では圧縮処理時に上述した最小可聴限界及びマスキング・スレッショルドに基づいてディジタルオーディオ信号に対して行われる量子化処理で削除される信号にFragileウォーターマークDC2を埋め込むようにする。
【0059】
さらに上述の実施の形態においては、ディジタルオーディオ信号にRobustウォーターマークDC1及びFragileウォーターマークDC2を共に埋め込むようにした場合について述べたが、本発明はこれに限らず、ディジタルオーディオ信号にRobustウォーターマークDC1を埋め込んでおき、圧縮処理を行った後で当該圧縮処理したストリーム信号に対してFragileウォーターマークDC2を埋め込むようにしても良い。この結果、コーデック(Codec)の特性を考慮することなくFragileウォーターマークDC2の圧縮処理による消去の度合いを限りなく低いレベルで容易に設定することができる。
【0060】
さらに上述の実施の形態においては、FragileウォーターマークDC2をMP3等の圧縮処理後に完全に削除される位置及びレベルでディジタルオーディオ信号に埋め込むように構成した場合について述べたが、本発明はこれに限らず、MP3等の圧縮処理後であっても完全にFragileウォーターマークDC2を削除しなくても良い。
【0061】
すなわち検出側においてFragileウォーターマークDC2の検出レベルが所定の閾値以下であるか否かを判断し、当該閾値未満の場合には、検出対象であるディジタルオーディオ信号が不正にコピーされたものであると判断するように構成しておく一方、当該閾値以上の場合には、検出対象であるディジタルオーディオ信号が正当にコピーされたものであると判断するように構成しておくようにすれば良い。要は、RobustウォーターマークDC1及びFragile ウォーターマークDC2が埋め込まれたディジタルオーディオ信号にMP3等の圧縮処理を行った後に、検出側において、FragileウォーターマークDC2の残存率の低下度に基づいて当該圧縮処理が行われた事実を検知することができれば、ディジタルオーディオ信号に対してFragileウォーターマークDC2をどのような構成で埋め込むようにしても良い。
【0062】
さらに上述の実施の形態においては、MP3の圧縮特性である心理聴覚モデルを用いて、ディジタルオーディオ信号にRobustウォーターマークDC1及びFragileウォーターマークDC2を埋め込む場合について述べたが、本発明はこれに限らず、例えばMPEG−AAC、ATRAC、ATRAC2、ATRAC3、Dolby AC3、MS(Microsoft) Audio、Twin VQ等の種々の圧縮規格に基づく心理聴覚モデル、又はこれらの組み合わせた心理聴覚モデルを用いる場合に広く適用することができる。このようにすれば、より多くの圧縮規格に対応した汎用的なFragileウォーターマークを実現することができる。
【0063】
また上述の実施の形態においては、ウォーターマークエンコーダ1においてRobustウォーターマークエンコード部及びFragileウォーターマークエンコード部を統合した構成について述べたが、本発明はこれに限らず、例えばRobustウォーターマークエンコード部及びFragileウォーターマークエンコード部を直列に接続した構成、又はRobustウォーターマークエンコード部及びFragileウォーターマークエンコード部を並列に接続する構成を適用することもできる。
【0064】
また上述の実施の形態においては、ウォーターマークデコーダ6においてRobustウォーターマークデコード部及びFragileウォーターマークデコード部を統合した構成について述べたが、本発明はこれに限らず、例えばRobustウォーターマークデコード部及びFragileウォーターマークデコード部を直列に接続した構成、又はRobustウォーターマークデコード部及びFragileウォーターマークデコード部を並列に接続する構成を適用することもできる。
【0065】
また上述の実施の形態においては、著作権情報及び圧縮履歴情報をディジタルオーディオ信号に重畳する場合について述べたが、本発明はこれに限らず、必要に応じて種々の情報を重畳して伝送する場合に本発明を適用することができる。
【0066】
また上述の実施の形態においては、ウォーターマークエンコーダ1によってウォーターマークの埋め込み処理が行われる場合について述べたが、本発明はこれに限らず、ウォーターマークエンコーダ1の各機能を実現するプログラムを格納したプログラム格納媒体(フロッピィディスク、光ディスク等)からこれらのプログラムを情報処理装置(コンピュータ)にロードして各機能を実行させるようにしても良い。
【0067】
例えば図12に示すような通常のコンピュータ70においては、全体の制御を司るCPU(Central Processing Unit)71と、各種ソフトウェアが格納されたROM(Read Only Memory)72と、CPU71のワークメモリとしてのRAM(Random Access Memory)73と、各種データが格納されたハードディスク装置74と、CPU71がネットワークを介して外部と通信するためのインターフェースである通信ポート75とを有し、これらがバス76を介して相互に接続されることにより構成されている。
【0068】
この場合コンピュータ70では、上述の各機能を実現するプログラムがハードディスク装置74又はROM72に格納されており、実行時にCPU71がRAM73に格納されているワークメモリに基づいて、対応する各機能部を実現するようにすれば良い。またコンピュータ70では、上述の各機能を実現するプログラムを通信ポート75を介してインストールするようにしても良い。
【0069】
【産業上の利用の可能性】
本発明は信号処理装置及びその方法並びにプログラム格納媒体に関し、例えば音楽データ等の著作権を保護する場合に適用することができる。
【0070】
【図面の簡単な説明】
【図1】本発明によるウォーターマークを利用したコピー制御システムの全体構成を示すブロック図である。
【図2】コピー制御システムにおけるコピー制御の適用例を示す略線図である。
【図3】本発明の実施の形態によるウォーターマークエンコーダの構成を示すブロック図である。
【図4】ウォーターマーク重畳原理の説明に供する略線図である。
【図5】心理聴覚分析部の処理の説明に供する略線図である。
【図6】心理聴覚分析部の処理の説明に供する略線図である。
【図7】心理聴覚符号化の説明に供する略線図である。
【図8】本発明によるウォーターマークのエンコード例を示す略線図である。
【図9】ウォーターマークエンコーダの処理手順を示すフローチャートである。
【図10】ウォーターマークデコーダの構成を示すブロック図である。
【図11】ウォーターマークデコーダの処理手順を示すフローチャートである。
【図12】コンピュータの内部構成を示すブロック図である。
【0071】
【符号の説明】
1……ウォーターマークエンコーダ、2……光ディスク、3……MP3エンコーダ、4……ネットワーク、5……パーソナルコンピュータ、6……ウォーターマークデコーダ、7……LCM。

Claims (9)

  1. 圧縮処理で用いられる心理聴覚モデルに基づいて所定の入力信号を心理聴覚分析し、当該分析結果に基づいて、当該入力信号における当該圧縮処理でサンプルされる周波数帯域及びその音圧レベルの範囲に重なるように当該圧縮処理に対する圧縮耐性の大きな電子透かし情報を埋め込むべき周波数帯域及びその音圧レベルを算出し、当該入力信号における当該圧縮処理で削られる周波数帯域及びその音圧レベルの範囲に収まるように当該圧縮処理に対する圧縮耐性の小さな電子透かし情報を埋め込むべき周波数帯域及びその音圧レベルを算出する心理聴覚分析手段と、
    上記心理聴覚分析手段による算出結果に基づいて、上記入力信号に上記圧縮耐性の大きな電子透かし情報及び上記圧縮耐性の小さな電子透かし情報を重畳する重畳手段と
    を具え
    上記圧縮耐性の大きな電子透かし情報及び上記圧縮耐性の小さな電子透かし情報は、
    上記入力信号をコピーする情報処理装置において、上記圧縮耐性の大きな電子透かし情報に基づいて上記入力信号に関する著作権情報を検出し、上記圧縮耐性の小さな電子透かし情報の除去又は減少に基づいて上記入力信号の圧縮履歴を判断し、当該著作権情報と当該圧縮履歴とに基づいて上記入力信号のコピー制御を行うために利用される
    信号処理装置。
  2. 上記心理聴覚分析手段は、
    圧縮処理で用いられる最小可聴限界に基づいて上記入力信号を心理聴覚分析する
    請求項1に記載の信号処理装置。
  3. 上記心理聴覚分析手段は、
    圧縮処理で用いられるマスキング効果に基づいて上記入力信号を心理聴覚分析する
    請求項1に記載の信号処理装置。
  4. 圧縮処理で用いられる心理聴覚モデルに基づいて所定の入力信号を心理聴覚分析し、当該分析結果に基づいて、当該入力信号における当該圧縮処理でサンプルされる周波数帯域及びその音圧レベルの範囲に重なるように当該圧縮処理に対する圧縮耐性の大きな電子透かし情報を埋め込むべき周波数帯域及びその音圧レベルを算出し、当該入力信号における当該圧縮処理で削られる周波数帯域及びその音圧レベルの範囲に収まるように当該圧縮処理に対する圧縮耐性の小さな電子透かし情報を埋め込むべき周波数帯域及びその音圧レベルを算出する心理聴覚分析ステップと、
    上記心理聴覚分析ステップによる算出結果に基づいて、上記入力信号に上記圧縮耐性の大きな電子透かし情報及び上記圧縮耐性の小さな電子透かし情報を重畳する重畳ステップと
    を具え
    上記圧縮耐性の大きな電子透かし情報及び上記圧縮耐性の小さな電子透かし情報は、
    上記入力信号をコピーする情報処理装置において、上記圧縮耐性の大きな電子透かし情報に基づいて上記入力信号に関する著作権情報を検出し、上記圧縮耐性の小さな電子透かし情報の除去又は減少に基づいて上記入力信号の圧縮履歴を判断し、当該著作権情報と当該圧縮履歴とに基づいて上記入力信号のコピー制御を行うために利用される
    信号処理方法。
  5. 上記心理聴覚分析ステップでは、
    圧縮処理で用いられる最小可聴限界に基づいて上記入力信号を心理聴覚分析する
    請求項4に記載の信号処理方法。
  6. 上記心理聴覚分析ステップでは、
    圧縮処理で用いられるマスキング効果に基づいて上記入力信号を心理聴覚分析する
    請求項4に記載の信号処理方法。
  7. 圧縮処理で用いられる心理聴覚モデルに基づいて所定の入力信号を心理聴覚分析し、当該分析結果に基づいて、当該入力信号における当該圧縮処理でサンプルされる周波数帯域及びその音圧レベルの範囲に重なるように当該圧縮処理に対する圧縮耐性の大きな電子透かし情報を埋め込むべき周波数帯域及びその音圧レベルを算出し、当該入力信号における当該圧縮処理で削られる周波数帯域及びその音圧レベルの範囲に収まるように当該圧縮処理に対する圧縮耐性の小さな電子透かし情報を埋め込むべき周波数帯域及びその音圧レベルを算出する心理聴覚分析ステップと、
    上記心理聴覚分析ステップによる算出結果に基づいて、上記入力信号に上記圧縮耐性の大きな電子透かし情報及び上記圧縮耐性の小さな電子透かし情報を重畳する重畳ステップと
    を含み、
    上記圧縮耐性の大きな電子透かし情報及び上記圧縮耐性の小さな電子透かし情報は、
    上記入力信号をコピーする情報処理装置において、上記圧縮耐性の大きな電子透かし情報に基づいて上記入力信号に関する著作権情報を検出し、上記圧縮耐性の小さな電子透かし情報の除去又は減少に基づいて上記入力信号の圧縮履歴を判断し、当該著作権情報と当該圧縮履歴とに基づいて上記入力信号のコピー制御を行うために利用される
    プログラムを信号処理装置に実行させるプログラム格納媒体。
  8. 上記心理聴覚分析ステップでは、
    圧縮処理で用いられる最小可聴限界に基づいて上記入力信号を心理聴覚分析する
    請求項7に記載のプログラム格納媒体。
  9. 上記心理聴覚分析ステップでは、
    圧縮処理で用いられるマスキング効果に基づいて上記入力信号を心理聴覚分析する
    請求項7に記載のプログラム格納媒体。
JP2001534134A 1999-10-29 2000-10-27 信号処理装置及びその方法並びにプログラム格納媒体 Expired - Fee Related JP4582384B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP31032499 1999-10-29
PCT/JP2000/007593 WO2001031629A1 (fr) 1999-10-29 2000-10-27 Dispositif de traitement de signaux et procede associe et support de stockage de programme

Publications (1)

Publication Number Publication Date
JP4582384B2 true JP4582384B2 (ja) 2010-11-17

Family

ID=18003874

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001534134A Expired - Fee Related JP4582384B2 (ja) 1999-10-29 2000-10-27 信号処理装置及びその方法並びにプログラム格納媒体

Country Status (4)

Country Link
US (1) US7272718B1 (ja)
EP (1) EP1202250A4 (ja)
JP (1) JP4582384B2 (ja)
WO (1) WO2001031629A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8144368B2 (en) 1998-01-20 2012-03-27 Digimarc Coporation Automated methods for distinguishing copies from original printed objects
US6744906B2 (en) 1995-05-08 2004-06-01 Digimarc Corporation Methods and systems using multiple watermarks
US7006661B2 (en) 1995-07-27 2006-02-28 Digimarc Corp Digital watermarking systems and methods
US6850626B2 (en) 1998-01-20 2005-02-01 Digimarc Corporation Methods employing multiple watermarks
US6633654B2 (en) 2000-06-19 2003-10-14 Digimarc Corporation Perceptual modeling of media signals based on local contrast and directional edges
US8094869B2 (en) 2001-07-02 2012-01-10 Digimarc Corporation Fragile and emerging digital watermarks
US7728048B2 (en) 2002-12-20 2010-06-01 L-1 Secure Credentialing, Inc. Increasing thermal conductivity of host polymer used with laser engraving methods and compositions
EP1595398A1 (en) * 2003-02-10 2005-11-16 Koninklijke Philips Electronics N.V. Import control of content
EP1614064B1 (en) 2003-04-16 2010-12-08 L-1 Secure Credentialing, Inc. Three dimensional data storage
CN101136202B (zh) * 2006-08-29 2011-05-11 华为技术有限公司 音频信号处理系统、方法以及音频信号收发装置
WO2008114432A1 (ja) * 2007-03-20 2008-09-25 Fujitsu Limited データ埋め込み装置、データ抽出装置、及び音声通信システム
WO2010018929A2 (ko) 2008-08-14 2010-02-18 에스케이 텔레콤주식회사 가청주파수 대역에서의 데이터 송수신 시스템 및 방법
US9160988B2 (en) * 2009-03-09 2015-10-13 The Nielsen Company (Us), Llc System and method for payload encoding and decoding
US8522032B2 (en) * 2010-03-30 2013-08-27 Disney Enterprises, Inc. System and method to prevent audio watermark detection
JP6007481B2 (ja) * 2010-11-25 2016-10-12 ヤマハ株式会社 マスカ音生成装置、マスカ音信号を記憶した記憶媒体、マスカ音再生装置、およびプログラム
US10573329B2 (en) * 2017-05-31 2020-02-25 Dell Products L.P. High frequency injection for improved false acceptance reduction
CN110110574A (zh) * 2018-01-30 2019-08-09 普天信息技术有限公司 心理压力参数的获取方法和标注方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11232779A (ja) * 1997-11-20 1999-08-27 Toshiba Corp コピー防止装置
JP2000058928A (ja) * 1998-08-12 2000-02-25 Shin Aizawa ブラウン官の三原色発光ダイオードの改良

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6760463B2 (en) * 1995-05-08 2004-07-06 Digimarc Corporation Watermarking methods and media
US6061793A (en) * 1996-08-30 2000-05-09 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible sounds
US6272634B1 (en) * 1996-08-30 2001-08-07 Regents Of The University Of Minnesota Digital watermarking to resolve multiple claims of ownership
US6031914A (en) * 1996-08-30 2000-02-29 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible images
US6282299B1 (en) * 1996-08-30 2001-08-28 Regents Of The University Of Minnesota Method and apparatus for video watermarking using perceptual masks
US6330672B1 (en) * 1997-12-03 2001-12-11 At&T Corp. Method and apparatus for watermarking digital bitstreams
US6332194B1 (en) * 1998-06-05 2001-12-18 Signafy, Inc. Method for data preparation and watermark insertion
US6154571A (en) * 1998-06-24 2000-11-28 Nec Research Institute, Inc. Robust digital watermarking
US6591365B1 (en) * 1999-01-21 2003-07-08 Time Warner Entertainment Co., Lp Copy protection control system
US6952774B1 (en) * 1999-05-22 2005-10-04 Microsoft Corporation Audio watermarking with dual watermarks
FR2816153B1 (fr) * 2000-10-27 2002-12-20 Canon Kk Procede de controle prealable de la detectabilite d'un signal de marquage
US20040059918A1 (en) * 2000-12-15 2004-03-25 Changsheng Xu Method and system of digital watermarking for compressed audio
US7043019B2 (en) * 2001-02-28 2006-05-09 Eastman Kodak Company Copy protection for digital motion picture image data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11232779A (ja) * 1997-11-20 1999-08-27 Toshiba Corp コピー防止装置
JP2000058928A (ja) * 1998-08-12 2000-02-25 Shin Aizawa ブラウン官の三原色発光ダイオードの改良

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6010014283, Mitchell D. Swanson, Bin Zhu, Ahmed H. Tewfik and Laurence Boney, "Robust audio watermarking using perceptual masking", Signal Processing, 19980528, Volume 66, Issue 3, p.337−355, EP, European Association for Signal Processing *

Also Published As

Publication number Publication date
EP1202250A4 (en) 2006-12-06
EP1202250A1 (en) 2002-05-02
US7272718B1 (en) 2007-09-18
WO2001031629A1 (fr) 2001-05-03

Similar Documents

Publication Publication Date Title
JP4582384B2 (ja) 信号処理装置及びその方法並びにプログラム格納媒体
US6738744B2 (en) Watermark detection via cardinality-scaled correlation
US7552336B2 (en) Watermarking with covert channel and permutations
US7366907B1 (en) Information processing device and method and program storage medium
US20040059918A1 (en) Method and system of digital watermarking for compressed audio
Foo et al. An adaptive audio watermarking system
JP3856652B2 (ja) 隠れデータ埋込み方法および装置
JP2001188549A (ja) 情報処理装置及びその方法並びにプログラム格納媒体
Qiao et al. Noninvertible watermarking methods for mpeg-encoded audio
Czerwinski et al. Digital music distribution and audio watermarking
CN101290773B (zh) 自适应的mp3数字水印嵌入和提取方法
Wang et al. A new audio watermarking based on modified discrete cosine transform of MPEG/audio layer III
KR20060023974A (ko) 서브-대역 필터링을 사용하여 워터마크를 임베딩하는 장치및 방법
Dittman et al. Advanced audio watermarking benchmarking
Petrovic et al. Data hiding within audio signals
Xu et al. Digital audio watermarking and its application in multimedia database
Lin et al. Audio watermarking techniques
US7773751B2 (en) Apparatus and method for controlling the copy and play of a digital audio contents
Kirbiz et al. Decode-time forensic watermarking of AAC bitstreams
Zmudzinski et al. Psycho-acoustic model-based message authentication coding for audio data
Takagi et al. Light weight MP3 watermarking method for mobile terminals
Kirbiz et al. Forensic watermarking during AAC playback
Ghorbani et al. Audio content security: attack analysis on audio watermarking
JP2001127643A (ja) 信号処理装置及びその方法並びにプログラム格納媒体
Salah et al. Survey of imperceptible and robust digital audio watermarking systems

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100318

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100805

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100818

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130910

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees