JP2004318126A - デジタルオーディオ処理 - Google Patents

デジタルオーディオ処理 Download PDF

Info

Publication number
JP2004318126A
JP2004318126A JP2004105243A JP2004105243A JP2004318126A JP 2004318126 A JP2004318126 A JP 2004318126A JP 2004105243 A JP2004105243 A JP 2004105243A JP 2004105243 A JP2004105243 A JP 2004105243A JP 2004318126 A JP2004318126 A JP 2004318126A
Authority
JP
Japan
Prior art keywords
data
signal
band
band data
watermark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004105243A
Other languages
English (en)
Inventor
William Edmund Cranstoun Kentish
エドマンド クランストン ケンティシュ、ウィリアム
Peter Damien Thorpe
ダミアン ソープ、ピーター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Europe BV United Kingdom Branch
Original Assignee
Sony United Kingdom Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony United Kingdom Ltd filed Critical Sony United Kingdom Ltd
Publication of JP2004318126A publication Critical patent/JP2004318126A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

【課題】可聴ウォータマークを埋め込んだデジタルオーディオ信号から可聴ウォータマークを取り除いた形で再生する際に、元のオーディオ信号を完全に復元するようにウォータマーク付与処理を行う。
【解決手段】各周波数帯域における音の貢献を表す帯域データ成分を含むスペクトル符号化オーディオ信号を処理する信号処理装置において、1以上の帯域データ成分のサブセットを変更し、変更された帯域データ成分を有する帯域変更デジタルオーディオ信号を生成し、変更された帯域データ成分の元の値を再構築するための復元データを生成する。
【選択図】図4a

Description

本発明は、デジタルオーディオ処理に関する。
可聴ウォータマーク法(audible watermarking method)は、オーディオ信号に他の(ウォータマーク)信号を結合して伝送又は記録することによりオーディオ信号を保護する技術であり、ここでは、元の信号は、識別及び/又は評価のためには十分にクリアであるが、ウォータマークが付された形式では商業的には使用できないようにウォータマークが付される。ウォータマーク付与処理の価値を高めるために、ウォータマーク付与処理は、正当な権原を有さない者がウォータマークを取り除こうとする行為を防ぐ必要がある。
ウォータマーク信号は、その信号が有用な情報(例えば著作権、広告又は他の識別データ)を伝えるように選択してもよい。適切なソフトウェア及び復号キーがあれば、元のソースマテリアルを参照することなく、ウォータマークが付された信号から元の信号を完全に復元できるウォータマーク付与法が望ましい。
欧州特許公開番号第1189372号明細書(松下)は、オーディオ信号を不正使用から保護する様々な手法を開示している。一手法においては、オーディオ信号は、ユーザに配信される前に、圧縮及び暗号化される。ユーザは、オーディオ信号を再生するためには、復号キーが必要となる。ユーザは、オーディオ信号を再生するために、復号キーを購入することができる。オーディオ信号は、ユーザが復号キーを購入するまでは再生されない。他の手法では、可聴ウォータマークをオーディオ信号に埋め込んで、オーディオ信号を保護する。一手法では、オーディオ信号は、所定の規則に則って可聴ウォータマーク信号と結合される。ウォータマーク信号は、オーディオ信号の音質を低下させる。結合された信号は、圧縮されてプレーヤに伝送される。プレーヤは、音質が悪いオーディオ信号を伸張及び再生し、これによりユーザは、ウォータマークを取り除くための「キー」を購入するか否かを判断することができる。ウォータマークは、伸張された低音質のオーディオ信号に、振幅が等しく極性が逆の可聴信号(equal and opposite audible signal)を加えることによって取り除くことができる。ウォータマークは、オーディオ信号の音質を下げるいかなる信号であってもよい。ウォータマークは、雑音であってもよい。ウォータマークは、「この音楽はサンプル再生です。」等のお知らせであってもよい。
例えばMP3(MPEG−1レイヤ3)信号、ATRAC(商標)信号、フィリップス(Phillips:商標)DCC(商標)信号、又はドルビー(Dolby:商標)AC−3(商標)信号等のデータ圧縮信号を始めとする周波数符号化(「スペクトル符号化」とも呼ばれる)オーディオ信号では、オーディオ情報は、一連の周波数帯域として表現されている。所謂音響心理学的な技術を用いて、オーディオ信号を表現するために符号化しなくてはならない帯域の数を削減することができる。上述した可聴ウォータマーク法は、周波数符号化オーディオ信号には適用されない。可聴ウォータマークをオーディオ信号に付与し、後に取り除くことを可能にするためには、周波数符号化オーディオ信号を再生可能な形式に戻すよう復号する必要がある。しかしながら、損失が多いシステムにおいては、オーディオ信号を符号化及び復号するたびに、オーディオ信号が劣化してしまうという問題がある。
本発明に係る信号処理装置は、各周波数帯域における音の貢献を表す帯域データ成分を含むスペクトル符号化オーディオ信号を処理する信号処理装置において、1以上の帯域データ成分のサブセットを変更し、変更された帯域データ成分を有する帯域変更デジタルオーディオ信号を生成するステップと、変更された帯域データ成分の元の値を再構築するための復元データを生成するステップとを有する。
本発明は、周波数符号化オーディオファイルからスペクトル情報を選択的に取り除き又は歪ませて価値を減じた場合、この価値を減じたファイルを復号して再生すれば、ファイルの元の理解可能性(intelligibility)及び/又は整合性がある程度維持されるという原理に基づいている。ファイルの元の品質が維持される程度は、除去されない周波数帯域の数及びファイルの全体的なスペクトルコンテンツにおける、除去される帯域の割合に依存する。元のファイルからの複数の周波数成分(又は「ライン」)は、単純に除去されるだけではなく、任意に選択された「ウォータマーク」ファイル(これも周波数符号化されている)から抽出された同じ周波数ラインのデータと置換(又は混合)され、これにより復号される出力データにおいて、両方のファイルについて、ある程度の理解可能性が維持される。
このため、ファイルのスペクトル帯域の一部又は全部を同様に符号化されたウォータマーク信号からの同等の帯域によって置換(又は結合)することによって、可聴ウォータマークを付与することができる。この処理は、いずれの信号も時間領域(オーディオサンプル)データに戻すことなく実行できる。変更されたスペクトル帯域の元の状態は、好ましくは、暗号化して、後に復元するために、周波数符号化ファイルのancillary_dataセクション(又はこの他の領域)に保存される。
本発明のこの他の様々な側面及び特徴は添付の特許請求の範囲に記載されている。独立請求項の特徴は、請求項において明示している場合に限らず、従属請求項の特徴に適切に組み合わせることができる。
以下では、MP3方式に則して本発明を説明するが、この技術(及び本発明)は、MP3に限定されるものではなく、例えば(以下に限定されるものではないが)、ATRAC(商標)フォーマット、フィリップス(Phillips:商標)DCC(商標)フォーマット、又はドルビー(Dolby:商標)AC−3(商標)フォーマット等の他の種類のスペクトル符号化(周波数符号化)オーディオファイル又はストリームデータにも同様に適用することができる。
図1は、オーディオデータ処理装置の構成を示しており、このオーディオデータ処理装置は、システムユニット10と、ディスプレイ20と、キーボードやマウス等のユーザ入力装置30とを有し、ソフトウェアによって制御される汎用パーソナルコンピュータを用いて実現されている。
システムユニット10は、例えば、中央演算処理装置(central processing unit:以下、CPUという。)40と、ランダムアクセスメモリ(random access memory:以下、RAMという。)50と、ディスクストレージ60(固定及びリムーバブルオプティカルディスク70等のリムーバブルディスク用)と、インターネット接続等のネットワーク接続90へのリンクを提供するネットワークインタフェースカード(network interface card:以下、NICという)80とを備える。このシステムユニット10は、例えば固定ディスク又はリムーバブルディスク等のストレージ媒体又はネットワーク接続等の伝送媒体を介して提供されるソフトウェアプログラムを実行することにより、以下に説明するデータ処理動作の一部又は全てを実現する。
図2は、後述する実施例の商業的な用途を説明する図である。図2には、インターネット接続120によって接続された2つのデータ処理システム100、110を示している。ここでは、一方のデータ処理システム100をMP3−圧縮オーディオファイルの「オーナ(Owner)」と呼び、他方のデータ処理システム110は、ファイルのユーザ(prospective purchaser)と呼ぶ。
第1のステップにおいて、ユーザは、オーディオファイルのダウンロード又は転送を要求する。第2のステップにおいて、オーナは、ウォータマークが付された形式でファイルをユーザに転送する。ユーザは、(ステップ3において)ウォータマークが付されたファイルを試聴する。ウォータマークが付されたバージョンは、ユーザにファイルの購入を促し、これによりユーザは、ステップ4において、オーナにキーを要求する。このキーの要求は、オーナを受取人とする会計処理(例えば、クレジットカード決済)を含んでいてもよい。
ステップ5において、オーナは、オーディオファイル内の所謂復元データ(recovery data)を復号するためのキーをユーザに供給する。復元データにより、ウォータマークを取り除き、完全な品質のファイルを再生することができる(もちろん、ファイルが圧縮されている場合、ここで言う「完全な品質」は、元のバージョンから若干劣化している場合もある。しかしながら、この劣化は、聴覚的には全く感知されないか、一般ユーザには殆どわからない程度のものである)。ユーザは、ステップ6において復元データを復号し、ステップ7において、ウォータマークが付されていないファイルを聴取する。
なお、ネットワークを介して、上述した全てのステップを必ずしも実行する必要はない。ユーザは、例えば雑誌の付録として添付されているコンパクトディスクからウォータマークが付されたマテリアル(ステップ2)を入手してもよい。これにより、上述したステップ1及びステップ2は省略される。
周波数符号化を用いたデータ圧縮
オーディオデータ圧縮のための一連の符号化処理は、(例えば多相フィルタを用いて)オーディオ信号を異なる周波数帯域に分割し、(フーリエ変換等の手法を用いて)異なる帯域の信号を周波数領域データに変換し、周波数領域においてデータを解析し、例えば音響心理学的な現象(例えば、隣接帯域マスキング効果及び雑音マスキング効果等)を利用して、再構築されるオーディオ信号を大きく劣化させることなく、信号成分を間引き又は量子化する処理を含む。
圧縮は、解析の結果に基づいて、スペクトルデータの帯域別再量子化(band-specific re-quantisation)を行うことによって実現される。処理の最終段では、スペクトルデータと関連するデータとを、デコーダによって逆パック化できる形式にパック化する。再量子化処理は、不可逆的であり、したがって、圧縮された形式からは、元のオーディオ情報は正確には復元できず、このため圧縮は「損失がある(lossy)」処理と言われる。所定の規格のデコーダは、符号化されたビットストリームからスペクトルデータを逆パック化し、スペクトル情報を時間領域サンプルに変換することによって、元のデータ(のバージョン)を効果的に再合成する。
「MP3」規格と呼ばれるMPEG1及びMPEG2オーディオ符号化規格(レイヤ3)は、概略的に上述した一連の処理を行う。MP3圧縮データファイルは、複数の独立したフレームから構成され、各フレームは、header(ヘッダ)、side_info(副情報)、main_data(主データ)、ancillary_data(補助データ)の4つのセクションから構成されている。MP3の完全な定義については、ISO規格11172−3MPEG−1レイヤ3(ISO Standard 11172-3 MPEG-1 layer III)に開示されている。
図3の上段の図は、上述した構造、すなわち、header(H)、side_info(S)、main_data(M)、ancillary_data(A)からなるMP3フレーム150を示している。フレームヘッダは、フレーム内の他のデータに関する、例えばビットレート、元のデータのサンプリングレート、符号化レベル、ステレオデータ組織(stereo-data-organisation)等の包括的な情報を含んでいる。全てのフレームは、効果的に独立しているが、この包括的な情報のフレーム毎の相違については、現実的には一定の制約がある。各フレームの総データ長は、常にフレームヘッダ内の情報から導き出すことができる。副情報セクションは、後続する主データセクションにおけるデータの組織を記述し、帯域換算係数(band scalefactor)やルックアップテーブル指示情報(lookup table indicator)等を提供する。
図3の中段に示す主データセクション160は、big_value領域(B)と、Count_1領域(C)とを有する。主データセクション160は、実際のオーディオスペクトル情報を提供し、ヘッダ及び副情報セクションに基づいて、複数の可能な異なるグループのうちの1つに分類される。なお、概略的に言えば、データは、周波数昇順に並べられた量子化された周波数帯域値として表現される。これらのうちの幾つかは、特定の周波数帯域におけるデータの有無を示す単純な1ビットフィールド(count_1サブセクション)及びデータが存在する場合の符号(sign)である。また、これらのうちの幾つかは、符号化情報がないために、暗黙のうちに0(zero_dataサブセクションにおける)とされる。main_dataセクションは、それぞれbig_value領域と呼ばれる3個の領域に分割される。これらの領域において、エンコーダは、スペクトル値をハフマンテーブルの参照値として格納する。ハフマン符号化は、より頻繁に用いられるスペクトル値をより短い符号で表すことによって、ビットレートを低減させるという機能のみを有する。
big_value領域におけるあらゆる任意の周波数ラインのための実際のスペクトル値は、次の3個の異なるデータに基づいて決定される。
・そのスペクトルラインのために用いられるハフマン符号(main_dataにおいて特定される)
・所定のハフマンテーブルの組からどのハフマンテーブルを用いるか(side_infoにおいて特定される)
・その周波数ラインに対して、いかなる換算係数を用いるか(side_info及びmain_dataにおいて特定される)
これらのデータは、全て、フレーム毎に異なるものであってもよい。
ancillary_data領域は、main_dataに続く現在未使用の領域である。エンコーダ間において、オーディオフレームに含まれるデータ量に関する規格は存在しないため、オーディオデータのサイズ、したがってancillary_dataのサイズは、フレーム毎に大きく異なるものであってもよい。ancillary_dataセクションのサイズは、先行するセクションのパック化の効率、スペクトルデータの量子化の度合い、ファイルの公称ビットレートの増減等によって変化することもある。
ウォータマーク技術
以下、MP3圧縮オーディオファイルへのウォータマーク付与の具体例を用いて、本発明に基づく技術を説明する。なお、本発明に基づく技術は、データフォーマット及び組織を適切に(周知の手法で)変更すれば、他のスペクトル符号化方式にも同様に適用できる。また、本発明は、このような状況に限定されるわけではないが、MP3ファイルは、ウォータマークが付与されていない状態では、十分な品質を有し(すなわち、圧縮処理によって生じる劣化は十分小さく)、したがって、ユーザは、ファイルを使用するためにウォータマークを取り除くことを望む。
説明を容易にするために、この実施例では、ウォータマーク及びソースファイルの初期のフォーマットは類似している(サンプリングレート、MPEGバージョン及びレイヤ、ステレオ符号化及びショート/ロングブロック利用(long block utilisation)が同じである)とする。但し、これは処理において必要不可欠な条件ではない。
この技術では、可聴ウォータマークは、ファイルにおける一部又は全てのスペクトル帯域を、同様に符号化されたウォータマーク信号の同じ帯域で置換(又は結合)することによって実現される。この処理は、MP3符号化レベル(又はハフマン符号化後のレベル(post-Huffman-lookup level))において、符号化ビットストリームを、いずれの信号も時間領域(オーディオサンプル)データに復号することなく行われる。変更された各スペクトル帯域の元の状態は、暗号化されてMP3ファイルのancillary_dataセクションに格納され、後に復元される。このようなデータを格納する空間は、ancillary_dataセクションを拡張することによって確保してもよく、既存の空間を用いてもよい。このため、オーディオデータの完全な復号及び再符号化を行う必要がなく、したがってオーディオ信号の更なる劣化(復号及び再符号化処理によって生じる)を回避することができる。
この説明では、次のような用語を用いる。
・ソースファイル:これは、ウォータマークが適用されるオーディオマテリアルを含むMP3ファイルである。
・ウォータマークファイル:これは、可聴ウォータマーク信号を含むMP3ファイルである。
次に周波数ラインを置換するための処理(policy)を設定する。この設定は、単に予め定められている固定されたラインの組を用いることによって行ってもよく、ソースファイル及びウォータマークファイルのコンテンツに基づいてラインを変更してもよい。第1の実施例では、単純な固定されたラインの組を選択する。これに代わる処理については、後に説明する。
このとき、どの処理を選択するかに応じて、復元データを保存するためにancillary_dataセクションにどれほどの空間が必要かが判断される。上述のように、この判断は、単にウォータマークデータの出力ビットレートを高めることによって行ってもよい。多くの場合、単にビットレートを次に高い規定値(legal value)に高める(及びこれを用いて保存できる復元データの量を制限する)ことで適切な処理を行うことができる。可変ビットレートを用いる符号化法では、より精密にビットレートを変更することもできる。
MP3エンコーダは、多くの場合、各フレーム内の空き領域を最小化しようとし、優れた又は理想的なエンコーダは、ancillary_data領域における空き領域をゼロにする。フレームにおいて使用可能な空間があるか否かを判定するためには、フレームヘッダを解析する必要がある。
暗号化された復元データを保存するためにフレームにおいて必要とされるデータ空間のサイズは、状況に応じて異なるが、復元ヘッダ情報を格納するために、フレーム毎に少なくとも数バイトの容量が必要である。変更されたスペクトルラインのための復元データを格納するために必要なデータ容量は、変更されたラインの数及び性質に依存する。この手法の実験的な試行によれば、ウォータマークが付されるマテリアルの初期ビットレートが128kbit/sの場合、フレーム毎に約100バイトが必要となるが、この数値は、ビットレートが128kbit/sから160kbit/sに増加すれば、必要なフレームサイズもこれに影響されて(これに応じて)更に100バイト増加する。この計算については、後に説明する。
全体のビットレート「B」を変数として、データフレーム毎のバイト数「bpf」は、数式によって求めることができる。MPEG1レイヤ3の場合、この数式は以下の通りとなる。
bpf = 144 * B / SR
「通常の」(すなわち、非可変ビットレート(non-'variable bit rate:non-BVR))MP3ファイルにおけるビットレートは、限られた数の規定値のうちの1つとして選択される。例えば、MPEG1レイヤ3の場合、これらの規定値は、32,40,48,56,64,80,96,112,128,160,192,224,256,320kbit/sである。
したがって、オーディオサンプリングレートが44.1kHzのファイルについて、ビットレートが128kbit/sから160kbit/sに増加したとすると、これにより必要となる追加的な容量は、以下のようになる。
144 * (160,000 - 128,000) / 44100 = 約104.5 バイト/フレーム
ビットレートを同じに維持しながら、与えられたいかなるオーディオフレームにおいても、補助的データ(ancillary data)をmain_dataに添付できることを保証することは難しいため、高いビットレートへの移行は非常に有効であると考えられる。これは、エンコーダの裁量によってオーディオフレームを3個のデータフレームに亘って格納できる、所謂「ビット貯蓄(bit reservoir)」のためである。オーディオフレームが(補助的領域の添付、main_data値の変更又は他のなんらかの処理によって)拡張されると、波及効果(multiple knock-on effect)が生じる虞があり、これにより後続するフレームを、利用可能な空間に格納できなくなることがある。以下、基本的な処理について、図4aに示すフローチャートを用いて説明する。
ステップ200において、ウォータマークをメモリに読み込み、(フレーム毎に、又はその全体に亘って)逆アセンブルする。次に、ウォータマーク付与処理によって要求されるウォータマークからのスペクトル情報を保存する。この処理段階において、実際のスペクトル値を利用できるように、関連するハフマンテーブル及び他の関連する情報(例えば、換算係数)を参照するとよい。
ステップ205において、初期のソースフレームヘッダ(及び幾つかの初期フレームの場合もある。)を読み出し、フレームフォーマット、使用可能な復元データ用の空間等を判定する。続いて、各ソースファイルフレームについて適用されるループ処理(ステップ210〜ステップ240)が開始される。
ステップ210において、次のソースファイルフレーム及び次のウォータマークファイルフレームを読み出す。ステップ215において、現在の処理に基づいて、変更すべきスペクトルラインを判定し、その処理に関連するソースファイルフレームの周波数ラインのスペクトル情報を復元領域(例えば、RAM50の一部)に保存する。
次に、ステップ220において、現在のソースファイルフレームにウォータマークの現在のフレームを適用する。この処理は、ループ処理として繰り返されるので、ウォータマークの第1のフレームがソースファイルの第1のフレームに適用され、以下、第2のフレームについても同様な処理が行われる。ウォータマークのフレーム数がソースファイルのフレーム数より少ない場合、ウォータマークフレームを繰り返して用いる。
処理によって決定される各スペクトル線の元の値は、以下に示す2つの手法のうちのいずれかに基づいて変更される。
・ウォータマークからのシーケンス内の対応するフレームを参照して、ウォータマーク内の対応するラインの値によって元の値を置き換える。このとき換算係数kによる乗算又は換算係数kを用いたこの他の変更を行ってもよい。(換算係数kは、多くの場合1又は0であってもよく、或いは1又は0以外の値でもよい。換算係数kは、変数であってもよく、この場合、換算係数は、復元データとともに保存される。また、この換算係数は、少なくとも特定のソースファイルに対しては固定の値であってもよく、この場合、そのファイルにおいて1回のみ値が示され、又は保存される)。
・元の値をウォータマークからの関連する値と結合する。例えば、50:50の平均化処理を行う。
これらの手法はいずれも、元の値を置き換えるスペクトル値が元のラインについて用いられたハフマンテーブルと同じハフマンテーブルから導出されている場合、最もうまく機能する。置換処理において要求される正確な値をテーブルが含んでいない場合、最も近い値を返すハフマン符号が用いられる。いずれの場合も、置換値を決定する際に、各ラインに影響を与える換算係数を考慮に入れてもよい。
ウォータマークを適用した後、ステップ225において、変更したヘッダ情報を含む、各フレームについて変更したフレームデータを保存する(例えば、ディスクストレージ60に保存する)。ステップ230において、そのフレームに適用できる復元データを暗号化して保存する。
ステップ225においては、既存のオーディオフレームにウォータマークを適用し、復元データ(ステップ215において保存された)をオーディオフレームのmain_data領域にancillary_dataとして追加するために必要な更なる空間を確保するために、ビットレートを高めるようにフレームヘッダを変更してもよい。最初に書き込むべき情報は、どのスペクトル帯域が保存されているか、及び可能なUMID(SMPTEユニバーサルマテリアル識別子)又はメタデータ情報であり、次に実際の保存された帯域を書き込む。更に、認証を受けていない者が元のデータを復元することを防ぐために、データを暗号化する必要があり、ここでは、周知のキーを用いたソフトウェア符号化法を用いる。
ヘッダデータを変更し、復元データを保存するために、使用可能なデータ容量を増加させる処理を図6a及び図6bを用いて説明する。図6aでは、ヘッダは、あるビットレートを特定し、これにより各フレームのサイズが定まる。図6bでは、ヘッダは、より高い規定値(例えば、次に高い規定値)に変更されている。これにより、フレームサイズを大きくできる。ヘッダ、side_info及びmain_data部分のサイズは大きくならないため、フレームサイズが大きくなった分、ancillary_data領域が増加する。
ステップ240において、全てのソースファイルが処理されたか否かを判定する。全てのソースファイルが未だ処理されていない場合、ステップ210〜ステップ240を繰り返し、全てのソースファイルが処理されるまで、必要に応じてウォータマークをファイルを繰り返し使用する。図5a〜図5cは、この処理を示しており、ここでは、ウォータマークファイル310は、ソースファイル300より短い。ウォータマークファイル310は、ソースファイル全体にウォータマークを適用するために必要な回数だけ繰り返して用いられている。
全てのソースファイルの処理が終了すると、ステップ250において、そのファイルに関するこのフローチャートに示す処理が終了する。
変更されたスペクトルラインデータ及び暗号化された復元データを含むウォータマークが付されたファイルは、例えばディスク60に保存され、及び/又はネットワーク90を介して送信される。
上述の手法では、変更は、オーディオフレーム毎に行っている。MP3規格では、複数のデータフレームに亘ってオーディオフレームを設けることを許容している。
図4bは、ウォータマークが付されたファイルからウォータマークを取り除く処理を説明するフローチャートである。
ステップ255において、ウォータマークが付されたファイルのフレームをロードする(例えば、図1に示すRAM50にロードする)。ステップ260において、上述したキーを用いて、そのフレームに関連する復元データを復号する。ステップ265において、復元データをウォータマークが付されたファイルに適用し、ヘッダ及びオーディオデータを含む対応するソースファイルを再構築する。ここで用いる「適用する(applied)」という用語は、先に行ったソースファイルにウォータマークを適用する処理とは逆の効果を有する処理を行うことを意味する。実際には、復元段階では、処理を設定する必要がなく、帯域を選択する必要がない等のため、この処理は、ウォータマークの適用に比べて、潜在的により単純である。各フレームに対して、次のような処理を行う。
a.復元情報を復号する(最初のデータは、例えば暗号化された「データ長」フィールドである)。
b.復元データの処理部分を解析し、どの位置に何を戻すことが適切かを確認する。これは、全てのフレームについて同じである場合もあり、この場合、非ストリーミングウォッシング(non-streaming washing、例えば処理自体)のために第1のフレームにおいてのみ解析を行ってもよい。また、これは、実際のスペクトル情報と同様にフレーム毎に異なる場合もある(処理に依存してもよい)。ストリームを復元するためには、復元データが全てのフレームに対する処理を含むことが好ましい。
c.復元データを用いて、フレーム内の変更されたデータをその(元の)値によって上書き又は変更する。
d.新たなフレームヘッダ(元のフレームレートを再設定する。)、side_info、main_dataを書き込む。但し、復元データは書き込まない。
ウォータマーク付与処理と同様に、上述の処理は、オーディオフレームがデータフレームと1:1の関係を必ずしも有していないために、データフレームを解放する前に何らかのバッファリング処理が必要になる場合があるため、複雑な処理となることがある。
なお、(ウォータマーク付与処理と同様)、元のマテリアルの復元は、データを時間領域データ(オーディオサンプル)レベルに復号することなく実行することができる。
ステップ270において、ウォータマークが付された更なるフレームを処理すべき場合、処理は、ステップ255に戻る。この他の場合、処理は、ステップ275に進み、終了する。
変形例
上述した基本的な処理は、幾つかの手法で変形することができる。以下では、幾つかの変形例を説明し、これらの変形例を個別に又は組み合わせて用いて、上述した基本的な処理を変更することができる。
1.置換される周波数ラインを選択する手法
基本的な処理では、単純に、固定された周波数ラインの組を変更した。この処理を図7a〜図7cに示す。図7aは、ソースファイルの1個のフレームの16個の周波数ラインのグループを示している。図7bは、ウォータマークファイルの対応するフレームにおける対応する16個の周波数ラインのグループを示している。ウォータマークファイルのラインは、影付きで示している。図7cでは、所定の(固定された)置換処理に基づいて、ソースファイルの(図面の上から下の順の序数として)第2、第4、第8、第10、第14、第16のラインがウォータマークファイルの対応するラインによって置換されている。
マテリアルの性質に応じて処理を変更する変形例により、よりよい結果(例えば、より主観的に理解できる結果)が期待できる。以下、3個の変形例1.1、1.2、1.3を示す。
変形例1.1
ウォータマークを分析することによって変更するスペクトルラインを選択する。ステップ200においてウォータマークを逆アセンブルするとき、スペクトル情報を調べ、各フレームにおいてどの周波数ラインが優勢であるかに基づいて、重み付けテーブルを作成する。全てのウォータマークフレームが読み出されると、(ウォータマークファイル全体に亘って平均化された)最も頻繁に優勢であったスペクトルラインを用いて、ソースファイルフレームにおいて使用可能な空間を考慮に入れて、全てのフレームにウォータマークを付す。
変形例1.2
各ウォータマークフレームにおいて優勢なラインに基づいて、変更するソースファイルラインをフレーム毎に変更する。各ウォータマークフレームについて、優勢な度合いによってソートされた周波数ラインテーブルを作成する。各ソースファイルフレームを処理するとき、現在のウォータマークフレームにおいて最も優勢な周波数ラインを変更するように選択する。この処理を図8a〜図8cに示す。上述の場合と同様、図8aは、ソースファイルの1個のフレームの16個の周波数ラインのグループを示し、図8bは、ウォータマークファイルの対応するフレームにおける対応する16個の周波数ラインのグループを示している。図8cは、ウォータマークフレームの最も優勢なライン(図8bにおける最も長いライン)を用いてソースファイルのラインを置き換えた結果を示している。ここでは、4個のラインのみを置換している。これは、後述する変形例1.4において説明する適応置換処理(adaptive substitution process)を示している。
変形例1.3
ウォータマークファイル及びソースファイルのスペクトルデータに基づいて、変更すべきソースファイルのラインを変更する。一具体例として、ウォータマークが付される前のラインと、ウォータマークが付された後のラインとの差に基づいて、重みを算出し、最も高い得点を得るライン(差が大きいほど、ウォータマークによってソースファイルの価値が下がる程度が大きくなる)を選択する。これにより、ソースファイルのハフマン符号化テーブルがウォータマーク値を含んでいない可能性を低くできる。この処理を図9a〜図9cに示す。図9aは、ソースファイルの1個のフレームの16個の周波数ラインのグループを示し、図9bは、ウォータマークファイルの対応するフレームにおける対応する16個の周波数ラインのグループを示している。図9cは、2つのフレームの対応するライン間の「距離」(この図式的表現における長さの差)を表している。現在の処理が幾つのラインを置換できるかに応じて、最も距離が大きいものから順に、n個のラインを選択して置換する。
変形例1.4
ここでは、擬似ランダム的にラインを選択する。換算するラインは、シード値によってシードされた擬似ランダム順に基づいて決定することができる。シード値は、ファイル全体に対する復元データの一部であってもよく、復号キーから導出してもよい。
上述した全ての手法、すなわち基本的な処理及び変形例1.1〜1.4は、ソースファイルラインをウォータマークファイルラインで置き換える方式、又はソースファイルラインをウォータマークファイルラインに基づいて変更する方式、及びこれらを組み合わせた方式のいずれにも適用できる。処理を固定する基本的な方式では、どのラインが変更されたかに関する情報を各フレーム毎に保存する必要はない。より適応化された処理では、単純な手法としては、どのラインが変更されたかを示す情報を復元データとともに保存する。実際には、復元データを復号することにより、復元情報が与えられたラインを復元データが特定するので、どのラインが変更されたかを示す情報は暗示される。
変形例1.5
ここでは、変更されるラインの数を適応化する。所定の又は固定されたラインの数を変更する必要は必ずしもない。ラインが固定された処理(上述した基本的な処理)においても、各フレームについて、変更するラインの数を変えることができる。この処理は、所望の順序(order of preference)(及び、変更が許可されるラインの最大数)に基づいて、ラインの数を変えることができる。ステップ210(図4a)において、ancillary_dataセクションの予備の空間の容量を判定することができる。必要な復元データのデータ量がancillary_dataにおいて使用可能な容量に適合するように、変更する複数のラインを選択する。ファイルの全体のビットレートを変更することによってancillary_dataの容量が増加する場合は、この増加も考慮する。
上述した変形例1.2、1.3では、変更すべき周波数ラインは、フレーム毎に変えられている。選択された帯域の変化のレートが高すぎると、可聴な副次的効果が生じる。このような副次的効果は、関連する重み付け処理の結果を低域通過フィルタリングすることによって、換言すれば、変更されるスペクトルラインの組に許可されるフレーム間の変化の量を制限することによって低減することができる。また、変更される周波数ラインのオーディオ周波数が高すぎる場合にも、好ましくない副次的効果が生じることがある。このような問題を回避するために、変更される周波数ラインによって表されるオーディオ周波数を制限してもよい。
同様に、ウォータマークファイル及びソースファイルの周波数ラインが短い又は長いブロック内にある場合、これらを直接置換することは好ましくない。更なる復号又は再符号化のいずれかが行われる場合もあり、又は置換が元のソースファイルと同じ符号になる場合もある。このような点に鑑み、MP3ファイルは、時間領域と空間領域との間の変換について、2つの異なるモディファイド離散コサイン変換(modified discrete cosine transform:以下、MDCTという。)ブロック長に基づくスペクトル情報を保存してもよい。所謂「長いブロック(long block)」は、18個のサンプルから構成され、「短いブロック(short block)」は、6個のサンプルから構成される。このように2つのブロックサイズを設ける目的は、時間分解能又は周波数分解能のいずれかについて、変換を最適化し又は少なくとも向上させるためである。短いブロックは、時間解像度に優れているが周波数解像度に劣っており、長いブロックはこの逆である。MDCT変換は、2個のブロックサイズについて異なるので、一方のタイプのブロックからの係数の組(すなわち、周波数ライン)は、他方のタイプのブロックに直接置換することができない。
更に、ウォータマークのステレオ符号化モードがソースファイルのステレオ符号化モードと異なる場合にも、好ましくない結果が生じる虞がある。このような場合、ウォータマークに対する更なる復号及び再符号化を用いてもよい。
変形例1.1〜1.5の全てにおいて、ウォータマーク付与処理において変更されるソースファイル周波数ラインの数は、固定され数(処理により導出される数、ユーザによって指定された数、又はハードコーディングされた数)に制限してもよく、又は使用可能な復元データ用空間によって制限してもよく、これら両方の手法を組み合わせてもよい。どの手法(単純な固定ライン法も含む)が最も好適かは、利用可能な処理パワー、ソースファイル及びウォータマークの性質、ソースファイルの価値を(ウォータマークによって)どれほど低下させる必要があるか等を含む様々な要素に依存する。
2.ハフマンテーブル及び換算係数の変更
以上では、main_dataスペクトル情報の変更(及び復元データ保存)のみに関する説明を行った。ここで、例えば特定の周波数ラインのスペクトルデータに対して用いられるハフマンテーブル等、元のデータの他の要素を変更することもできる。これは、変更されたスペクトルデータに対して、正確な符号(及び近似的なポストルックアップ値(post-lookup value)を与える正確ではない符号)。
同様に、side_info及びmain_dataにおける換算係数も、ウォータマークスペクトルデータのスペクトルレベルをより正確に表現するように変更してもよい。これにより、(例えば)ウォータマークが付されたマテリアル内のウォータマークのレベルが、ソースファイルマテリアル内のレベルに応じて変化するといった好ましくない効果を低減することができる。
3.復元データを保存する手法
上述のように、復元データを隠す最適な手法は、各オーディオフレーム内のancillary_dataスペースを用いることである。これは、既存の空間を用いて行ってもよく、ビットレートを高めて追加的な空間を生成して行ってもよい。この手法は、保存された復元データが関連するフレーム内に格納され、各フレームが、他のフレームを参照することなく復元できるという利点がある。ここで、次のような他の手法を用いることもできる。
・MP3フォーマットは、ファイルの一部、通常はファイルの最初又は最後に特別なIDフレームを設けることを許容している。このような特別なIDフレームを用いて、例えばUMID及びメタデータ情報、ウォータマーク方式、固定ウォータマークマスク等、全てのフレームに共通な、ウォータマーク処理に関する情報を保存してもよい。
・復元データは、データブロック(MP3フォーマットである必要はない。)として単にMP3に添付してもよい。
4.big_value領域以外における周波数ラインの使用
4.1 ウォータマークのCount_1領域の使用
上述の手法では、ウォータマークを付すために、main_dataセクションのbig_value領域内のスペクトルデータを変更している。ウォータマークファイル及びソースファイルのスペクトルデータもそれぞれのmain_dataセクションのcount_1領域に保存される。これらの領域からのデータをウォータマークの付与に用いることができ、(例えば)count_1領域内にウォータマークが重要なスペクトル情報を有している場合に、ウォータマークが付されたファイルの品質を向上させることができる。
4.2 ソースファイルの領域境界の再定義
ソースファイルは、ソースファイルのbig_value領域又はソースファイルのcount_1領域のいずれか(又は全て)の長さを長くすることによって、より容易にウォータマークを格納することができる。例えば、ウォータマークは、ソースファイルフレームのcount_1領域内の周波数ラインに対応する周波数ラインをbig_value領域内に有していてもよい。又は、ウォータマークは、ソースファイルフレームのゼロ領域内の周波数ラインに対応する周波数ラインをcount_1に有していてもよい。これは、例えば領域の境界の変更を考慮に入れる等、更なる復元情報が必要な場合に要求される。
5.ファイルとストリーミング
上述の説明では、ウォータマークシステムの入力データと出力データをMP3ファイルと仮定している。このシステムを拡張又は変更して、例えば放送環境(この場合、処理がデータストリームの最初又は最後にアクセスする可能性が低い。)等において、ストリーミングデータを処理するようにしてもよい。したがって、上述の説明では「ファイル」という用語を用いているが、同じ技術をストリーミング信号である可能性があるオーディオ「信号」にも同様に適用する必要がある。ここでは、各フレームが、全ての変更ライン処理情報及びウォータマーク(によって変更される)に使用されるラインの記述又は定義を含む、そのフレームの復元に必要な全ての復元データを含み、復元データ用の復号キーは、全てのフレームについて同じであるか、又は各フレーム内のデータから算出可能である(キー自体の公開キー符号化方式を利用してもよい)ことを確実にする必要がある。更に、パッドビットによってデータフレームのサイズが変化することを考慮する必要もある。フレームサイズは、フレーム毎の平均ビットレートを一定に維持するために変更される。
6. 固定トーンウォータマーク(Fixed tone watermarks)
上述の実施例では、ウォータマーク信号は、ウォータマークファイルに由来し、ソースファイルの長さに適合させるために必要な回数だけ繰り返して用いている。この変形例として、ウォータマークスペクトルデータを固定トーン(fixed tone)、雑音源、又はこの他の循環的又は反復的信号生成器から直接生成してもよい。この手法は場合によっては複雑であり、ソースファイル信号のコンテンツに適合するように制御する必要があるが、これにより、不正なウォータマークの除去をより困難にするような変調を行うことができる。
この手法は、(例えば)ソースファイルの自動的な価値の低減が要求され、且つ特別なウォータマークコンテンツが要求されない場合に有用である。後述する変形例7.1、7.2では、これに関連するこの他の手法を説明している。
7.スペクトルラインのインタリーブ
ウォータマークからのスペクトルラインを用いてソースファイルのラインを変更又は置換することに代えて、インタリーブ処理を用いることもできる。この手法では、ソースファイルのラインを、独立したウォータマークファイル又は直接生成された信号を参照することなく、交換し、換算し、又は削除する。ソースファイルの元の状態を復元するために必要なデータは、復元データとして保存する。交換し、換算し又は削除するラインは、フレーム毎に又はこの他の間隔で変更してもよい。変形例7.1、7.2のいずれにおいて処理されるラインも、上述した処理のいずれに基づいて選択してもよい。変形例7.1、7.2は、組み合わせて適用してもよい。
変形例7.1 インタリーブ/交換
一変形例においては、ソースファイルにおいて、ラインのグループを交換(interchange)する。この変形例に関連する復元データは、ラインを特定するのみのデータでよく、したがって、比較的小さなデータとすることができる。ラインの交換は、シード値によってシードされた擬似ランダム順に基づいて実行してもよい。この場合、シード値がファイル全体及び復号キーの復元データを構成してもよい。スペクトルラインのインタリーブ/交換は、必ずしも単一のフレーム内に限定されるわけではない。スペクトルラインのインタリーブ/交換は、フレーム間(例えば、連続するフレーム間)で行ってもよい。
この手法の具体例を図11a及び図11bに示す。上述と同様、図11aは、ソースファイルの1個のフレームの16個の周波数ラインのグループを示している。図11bは、ウォータマークファイルの対応するフレームにおける対応する16個の周波数ラインのグループを示している。これらのラインは、隣り合う対同士が交換され、すなわちソースファイルの第1のラインと第2のライン(図面の上から下に番号を振っている)、第3のラインと第4のライン、第5のラインと第6のラインを交換している。これは、説明を明瞭にするための単純な具体例である。もちろん、これより複雑な交換規則を用いて、適切なキーがなくては復元が困難になるようにしてもよい。
変形例7.2 削除(Deletion)
ここでは、ソースファイルの選択されたスペクトルラインを削除する。この手法に関連する復元データは、削除されたラインを表すデータである必要がある。
8.複数のレベル
例えばそれぞれ異なるキーによってアクセスされる2組以上の復元データを設けてもよい。第1のレベルでは、全てのウォータマークメッセージ(例えば、口頭メッセージ(spoken message))を取り除くことができるが、未処理の雑音(劣化)が残留し、このためプロフェッショナルの用途又は高い忠実度が求められる用途には適さない。第2のレベルでは、このような雑音も取り除くことができる。ユーザが第2のレベルに対応するキーを入手するために、ユーザに対してより高い料金を要求してもよく、及び/又は第2のレベルに対応するキーの使用をプロフェッショナルユーザ等、特定のクラスのユーザのみに限定してもよい。
9.部分的復元
ユーザが所定の料金を支払って、ある期間(例えば、タイムコード01:30:45:00から01:31:44:29までの60秒間)のデータの復元を可能とするようにしてもよい。このためには、ユーザの支払いに対応する期間を特定し、その期間のみに関して復元データを適用する追加的な処理が必要になる。
このような部分的な復元のための上述の処理の変形例を次に示す。
・ウォータマーク処理の間、個々のフレーム(又はフレームのグループ)の復元データを異なるキーの予測可能なシーケンスによって符号化する。
・ウォッシング(復元)時には、要求されたセグメントの範囲に対応するフレームのみを復元する。これらは、a.元のビットレートによって独立したファイルとして書き込んでもよく、b.ウォータマークファイル内に埋め込まれた復元されたセグメントとして書き込んでもよく、この場合、全てのフレームは、高められたビットレートで書き込まれる(ファイルのセクションが異なるビットレートを有することは、推奨されている規格に違反する)。
応用例
図10aは、ウォータマークファイルを受け取り、処理する構成の具体例を示している。デジタル放送信号は、アンテナ400(例えば、デジタルオーディオ放送アンテナ又は衛星放送アンテナ)を介して供給され、ケーブル接続(図示せず)からセットトップボックス(set-top box:STB)410に供給される。「セットトップボックス」とは、放送信号又はケーブル信号を処理する復調器及び/又は復号器及び/又は平文化器を指す。なお、STB410は、文字通りテレビジョンセット又はこの他のセットの上に設置する必要はなく、また、「セット」もテレビジョンセットである必要はない。
STB410は、電話回線(モデム)接続420を介してコンテンツプロバイダ(図示せず。但し、図2に示す「オーナ」100と同等)に接続されている。コンテンツプロバイダは、上述した可聴ウォータマークが適用されて、故意に価値が低減されたウォータマークが付されたオーディオファイルを供給する。STB410は、これらの信号を「ベースバンド」(アナログ)フォーマットに復号する。このベースバンド信号は、テレビジョンセット、ラジオセット又は増幅器430によって増幅され、これに基づく音がラウドスピーカ440から出力される。
実際の動作においては、ユーザは、ウォータマークが付されたオーディオコンテンツを受け取り、これを試聴する。ここで、ユーザが、ウォータマークが付されていないバージョンを望んだ場合、ユーザは、(例えば)STB410上の又はリモートのコマンド装置(図示せず)上の「支払い」ボタン450を操作する。ユーザがプロバイダに対してアカウント(支払い方法)を確立している場合、STB410は、単に、電話回線接続420を介してコンテンツプロバイダに要求を送信し、これに応じて復号キー420を受け取り、この復号キー420を用いて、上述したように、ウォータマークが付されたファイルから復元データを復号することができる。支払い方法が確立されていない場合、ユーザは、例えばSTB410にクレジットカード番号を入力(タイプ又はスワイプ(swipe))し、このクレジットカード番号は、この取引に関連付けてコンテンツプロバイダに送信される。
コンテンツプロバイダによって提供されているサービスに応じて、ユーザは、ウォータマークが付されていないコンテンツを1回だけ再生する権利を購入することもでき、又はユーザが望む限り何度でも再生する権利を購入することもでき、又は制限された回数のみ再生する権利を購入することもできる。
図10bに示す第2の構成例では、受信機460は、少なくとも復調器、復号器、平文化器及びオーディオ増幅器を備え、これによりアンテナ400(又はケーブル接続)を介して供給されてくるウォータマークが付されたオーディオデータを処理する。受信機460は、更に、「スマートカード(smart card)」リーダ470を備え、このスマートカードリーダ470には、スマートカード480が挿入される。現在の他の放送サービスと同様に、スマートカード480は、ユーザが受け取ることのできるコンテンツサービスの組を特定する。ユーザがどのコンテンツサービスを享受できるかは、ユーザと、コンテンツプロバイダ又は放送業者との間で確立された支払い契約に基づいて決定される。
コンテンツプロバイダは、上述のようにしてウォータマークが付されたコンテンツを放送する。このコンテンツは、適切な受信機を有する全ての者が受け取り、試聴することができる(但し、ウォータマークが付された、すなわち価値が低減された形式で)。これにより、ウォータマークが付されていないマテリアルを受け取るために、料金を支払うことをユーザに促すことができる。コンテンツを聴取することを許可するスマートカードを有するユーザは、復元データを復号し、ウォータマークによって価値が減じられていないコンテンツを聴くことができる。例えば、復号キーは、スマートカードに格納することができ、これにより電話回線に接続して復号キーを受け取る必要がなくなる。
もちろん、図10a及び図10bに示す具体例の間でスマートカードと電話回線を介した支払い処理は、交換することができる。これら2つの手法を組み合わせて用いることもでき、これによりユーザは、スマートカードを用いてサービスの基本セットを聴取し、電話回線を用いて、他の(プレミア)コンテンツサービスに関するキーを受け取ることができる。
上述した本発明の実施例の少なくとも一部は、ソフトウェアによって制御されるデータ処理装置によって実現することができ、このようなソフトウェア制御を提供するコンピュータプログラム、及びこのようなコンピュータプログラムを記録又は伝送する記録媒体又は伝送媒体も本発明の範囲内にある。なお、上述した構成及び変形例の一部では、復元されたファイルは、ウォータマークが付される前の元のファイルとビット単位で同一ではない場合もある。ここで、MP3と他の符号化法とで同等に音を表現する手法があり、したがって、入力ファイルとビット単位で同一ではない最終的なファイルも、入力ファイルと同じように再生される。例えば、データフレームが異なっていてもよく、ancillary_dataにおける未使用領域の大きさが異なっていてもよい。このような相違は、本発明の実施の形態において許容される。
添付の図面を用いて本発明の実施例を詳細に説明したが、本発明はこれらの詳細な実施例に限定されるものではなく、当業者は、添付の特許請求の範囲に定義された本発明の範囲及び思想から逸脱することなく、ここに説明した実施例を様々に変形及び変更することができる。
オーディオデータ処理装置の構成を示すブロック図である。 本発明の商業的な利用を説明する図である。 MP3フレームの構造を示す図である。 ソースファイルにウォータマークを適用する処理を説明するフローチャートである。 ウォータマークが付されたファイルからウォータマークを取り除く処理を説明するフローチャートである。 ソースファイルへのウォータマークの適用を説明する図である。 ビットレート変更を説明する図である。 ソースファイルの周波数ラインの置換を説明する図である。 ソースファイルの周波数ラインを最も顕著なウォータマーク周波数ラインによって置換する処理を説明する図である。 ソースファイルとウォータマークファイルの周波数ラインの間の距離の検出を説明する図である。 ウォータマークデータを受け取り、処理する装置の構成を示す図である。 ソースファイルの周波数ラインの交換を説明する図である。

Claims (42)

  1. 各周波数帯域における音の貢献を表す帯域データ成分を含むスペクトル符号化オーディオ信号を処理する信号処理装置において、
    1以上の上記帯域データ成分のサブセットを変更し、変更された帯域データ成分を有する帯域変更デジタルオーディオ信号を生成するステップと、
    上記変更された帯域データ成分の元の値を再構築するための復元データを生成するステップとを有する信号処理方法。
  2. 上記復元データを暗号化するステップを有する請求項1記載の信号処理方法。
  3. 上記復元データは、上記帯域データ成分のサブセットを含むことを特徴とする請求項1記載の信号処理方法。
  4. 上記帯域データ成分のサブセットを変更するステップは、1以上の上記帯域データ成分を、換算係数に乗算された、スペクトル符号化デジタルオーディオウォータマーク信号からの対応する帯域データ成分によって置換するステップを有することを特徴とする請求項1記載の信号処理方法。
  5. 上記帯域データ成分のサブセットを変更するステップは、スペクトル符号化デジタルオーディオウォータマーク信号からの対応する帯域データ成分によって置換するステップを有することを特徴とする請求項1記載の信号処理方法。
  6. 上記帯域データ成分のサブセットは、上記帯域データ成分の所定のサブセットであることを特徴とする請求項1記載の信号処理方法。
  7. 上記復元データは、上記帯域データ成分のサブセットにどの帯域データ成分が含まれるかを定義することを特徴とする請求項1記載の信号処理方法。
  8. 上記ウォータマーク信号のどの帯域データ成分が該ウォータマーク信号の少なくとも一部において最も顕著であるかを判定し、該最も顕著な帯域データ成分によって上記帯域データ成分のサブセットを構成するステップを有する請求項4記載の信号処理方法。
  9. 上記ウォータマーク信号のどの帯域データ成分が該ウォータマーク信号の少なくとも一部において最も顕著であるかを判定するステップは、どの帯域データ成分が該ウォータマーク信号の全体において最も顕著であるかを判定するステップであることを特徴とする請求項8記載の信号処理方法。
  10. 上記ウォータマーク信号と上記デジタルオーディオ信号は、それぞれ該ウォータマーク信号と該デジタルオーディオ信号の各期間を表す連続するデータフレームとして符号化され、上記ウォータマーク信号のどの帯域データ成分が該ウォータマーク信号の少なくとも一部において最も顕著であるかを判定するステップは、
    ウォータマーク信号のどの帯域データ成分が該ウォータマーク信号における1以上の上記データフレームのグループにおいて最も顕著であるかを判定し、該最も顕著な帯域データ成分によって、上記デジタルオーディオ信号の対応する1以上のフレームのグループに関して、上記帯域データ成分のサブセットを構成するステップを有することを特徴とする請求項8記載の信号処理方法。
  11. 上記ウォータマーク信号のどの帯域データ成分が該ウォータマーク信号の少なくとも一部において最も顕著であるかを判定し、該最も顕著な帯域データ成分によって上記帯域データ成分のサブセットを構成するステップを有する請求項5記載の信号処理方法。
  12. 上記ウォータマーク信号のどの帯域データ成分が該ウォータマーク信号の少なくとも一部において最も顕著であるかを判定するステップは、どの帯域データ成分が該ウォータマーク信号の全体において最も顕著であるかを判定するステップであることを特徴とする請求項11記載の信号処理方法。
  13. 上記ウォータマーク信号と上記デジタルオーディオ信号は、それぞれ該ウォータマーク信号と該デジタルオーディオ信号の各期間を表す連続するデータフレームとして符号化され、上記ウォータマーク信号のどの帯域データ成分が該ウォータマーク信号の少なくとも一部において最も顕著であるかを判定するステップは、
    ウォータマーク信号のどの帯域データ成分が該ウォータマーク信号における1以上の上記データフレームのグループにおいて最も顕著であるかを判定し、該最も顕著な帯域データ成分によって、上記デジタルオーディオ信号の対応する1以上のフレームのグループに関して、上記帯域データ成分のサブセットを構成するステップを有することを特徴とする請求項11記載の信号処理方法。
  14. 上記ウォータマーク信号及びデジタルオーディオ信号の少なくとも対応する部分において、該ウォータマーク信号のどの帯域データ成分が該デジタルオーディオ信号の対応する帯域データ成分から最も顕著に異なるかを判定し、該最も顕著に異なる帯域データ成分によって上記帯域データ成分のサブセットを構成するステップを有する請求項4記載の信号処理方法。
  15. 上記ウォータマーク信号及びデジタルオーディオ信号の少なくとも対応する部分において、該ウォータマーク信号のどの帯域データ成分が該デジタルオーディオ信号の対応する帯域データ成分から最も顕著に異なるかを判定し、該最も顕著に異なる帯域データ成分によって上記帯域データ成分のサブセットを構成するステップを有する請求項5記載の信号処理方法。
  16. 上記帯域データ成分のサブセットを構成する上記帯域データ成分は、擬似ランダム関数によって定義されることを特徴とする請求項7記載の信号処理方法。
  17. 上記デジタルオーディオ信号は、少なくとも、
    該デジタルオーディオ信号を保存するために使用可能なデータ領域の量を特定するフォーマット定義データと、
    上記帯域データ成分と、
    0以上の補助データ空間とを含むフォーマットを有することを特徴とする請求項1記載の信号処理方法。
  18. 上記復元データを補助データ空間に格納するステップを有する請求項17記載の信号処理方法。
  19. 上記フォーマット定義データを変更し、上記デジタルオーディオ信号を保存するためのより大きなデータ領域を特定して、上記補助データ空間のサイズを大きくするステップを有する請求項17記載の信号処理方法。
  20. 上記復元データを上記帯域変更デジタルオーディオ信号に添付するステップを有する請求項1記載の信号処理方法。
  21. 上記復元データのために使用できるデータ容量に応じて、上記帯域データ成分のサブセットにおける帯域データ成分の数を調整するステップを有する請求項1記載の信号処理方法。
  22. 各周波数帯域における音の貢献を表す帯域データ成分と、該帯域データ成分のサブセットの元の値を表す復元データとを含むスペクトル符号化オーディオ信号を処理する信号処理方法において、上記復元データに基づいて上記帯域データ成分のサブセットを変更することにより、該帯域データ成分のサブセットの上記元の値を再構築するステップを有する信号処理方法。
  23. 上記復元データを復号するステップを有する請求項22記載の信号処理方法。
  24. スペクトル符号化オーディオコンテンツマテリアルを配信する配信方法において、
    請求項1記載の信号処理方法に基づいて、上記スペクトル符号化オーディオコンテンツマテリアルを処理して帯域変更デジタルオーディオ信号及び復元データを生成するステップと、
    上記復元データを暗号化し、被暗号化復元データを生成するステップと、
    上記帯域変更デジタルオーディオ信号及び上記被暗号化復元データを受信ユーザに提供するステップと、
    上記被暗号化復元データを復号するための復号キーを上記受信ユーザに提供するステップとを有する信号配信方法。
  25. 上記復号キーを提供するステップは、上記受信ユーザから所定の料金が支払われた場合にのみ実行されることを特徴とする請求項24記載の信号配信方法。
  26. スペクトル符号化オーディオコンテンツマテリアルを受信する信号受信方法において、
    請求項1記載の信号処理方法に基づいて生成された帯域変更デジタル信号及び暗号化された復元データをコンテンツプロバイダから受信するステップと、
    上記暗号化された復元データを復号する復号キーを受信するステップと、
    上記暗号化された復元データを復号し復号された復元データを生成するステップと、
    請求項22記載の信号処理方法に基づいて、上記復号された復元データを用いて上記帯域変更デジタル信号を処理するステップとを有する信号受信方法。
  27. 上記コンテンツプロバイダに料金を支払うステップを有する請求項26記載の信号処理方法。
  28. 請求項1記載の信号処理方法を実行するためのプログラムコードを有するコンピュータソフトウェア。
  29. 請求項28記載のコンピュータソフトウェアを提供する提供媒体。
  30. 上記提供媒体は、ストレージ媒体であることを特徴とする請求項29記載の提供媒体。
  31. 上記提供媒体は、伝送媒体であることを特徴とする請求項29記載の提供媒体。
  32. 請求項22記載の信号処理方法を実行するためのプログラムコードを有するコンピュータソフトウェア。
  33. 請求項32記載のコンピュータソフトウェアを提供する提供媒体。
  34. 上記提供媒体は、ストレージ媒体であることを特徴とする請求項33記載の提供媒体。
  35. 上記提供媒体は、伝送媒体であることを特徴とする請求項33記載の提供媒体。
  36. 各周波数帯域における音の貢献を表す帯域データ成分を含むスペクトル符号化オーディオ信号を処理する信号処理装置において、
    1以上の上記帯域データ成分のサブセットを変更し、変更された帯域データ成分を有する帯域変更デジタルオーディオ信号を生成するデータ変更器と、
    上記変更された帯域データ成分の元の値を再構築するための復元データを生成するデータ生成器とを有する信号処理装置。
  37. 上記復元データを暗号化する暗号化器を備える請求項36記載の信号処理装置。
  38. 各周波数帯域における音の貢献を表す帯域データ成分と、該帯域データ成分のサブセットの元の値を表す復元データとを含むスペクトル符号化オーディオ信号を処理する信号装置方法において、上記復元データに基づいて上記帯域データ成分のサブセットを変更することにより、該帯域データ成分のサブセットの上記元の値を再構築するデータ変更器を備える信号処理装置。
  39. 上記復元データを復号する復号器を備える請求項38記載の信号処理装置。
  40. 請求項38記載の信号処理装置を備えるセットトップボックス。
  41. 請求項38記載の信号処理装置を備えるオーディオ受信機。
  42. フォーマット定義データと、
    帯域データ成分と、
    上記帯域データ成分の変更を定義する暗号化された復元データとを備えるスペクトル符号化オーディオデータ。
JP2004105243A 2003-03-31 2004-03-31 デジタルオーディオ処理 Withdrawn JP2004318126A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
GB0307456A GB2400285A (en) 2003-03-31 2003-03-31 Digital audio processing

Publications (1)

Publication Number Publication Date
JP2004318126A true JP2004318126A (ja) 2004-11-11

Family

ID=9955923

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004105243A Withdrawn JP2004318126A (ja) 2003-03-31 2004-03-31 デジタルオーディオ処理

Country Status (6)

Country Link
US (1) US7702404B2 (ja)
EP (1) EP1465157B1 (ja)
JP (1) JP2004318126A (ja)
CN (1) CN100384119C (ja)
DE (1) DE602004000884T2 (ja)
GB (1) GB2400285A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102651318B1 (ko) * 2022-10-28 2024-03-26 주식회사 뮤즈블라썸 트랜지언트 기반의 사이드체인 오디오 워터마크 코딩 시스템

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005071522A (ja) * 2003-08-27 2005-03-17 Sony Corp コンテンツ再生方法、コンテンツ再生装置およびコンテンツ配信方法
JP2005084625A (ja) * 2003-09-11 2005-03-31 Music Gate Inc 電子透かし合成方法及びプログラム
US8046838B1 (en) * 2007-04-30 2011-10-25 Hewlett-Packard Development Company, L.P. Using a modulation transfer function of a device to create digital content for the device
DE102007023543A1 (de) * 2007-05-21 2009-01-22 Staroveska, Dagmar Verfahren zur Bereitstellung von Audio- und/oder Videodateien
GB2455526A (en) 2007-12-11 2009-06-17 Sony Corp Generating water marked copies of audio signals and detecting them using a shuffle data store
CN102314881B (zh) * 2011-09-09 2013-01-02 北京航空航天大学 一种用于提高mp3文件中水印嵌入容量的mp3水印方法
US8719946B2 (en) * 2012-03-05 2014-05-06 Song1, Llc System and method for securely retrieving and playing digital media
CA2906049A1 (en) * 2013-03-15 2014-09-25 Canva Pty Ltd. System for single-use stock image design
TW201608390A (zh) * 2014-08-18 2016-03-01 空間數碼系統公司 數字版權管理和再廣播的數碼加封

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MXPA00010337A (es) * 1998-04-21 2003-05-19 Verance Corp Sistema codificador adaptable de medios multiples.
JP3735521B2 (ja) * 1999-09-30 2006-01-18 株式会社東芝 埋め込み符号生成方法及び装置、埋め込み符号検出方法及び装置並びに電子透かし埋め込み装置
US6571144B1 (en) * 1999-10-20 2003-05-27 Intel Corporation System for providing a digital watermark in an audio signal
WO2001045410A2 (en) * 1999-12-15 2001-06-21 Sun Microsystems, Inc. A method and apparatus for watermarking digital content
JP2002062888A (ja) * 2000-08-21 2002-02-28 Matsushita Electric Ind Co Ltd 電子音楽加工装置、電子音楽再生装置及び電子音楽配信システム
GB2378370B (en) * 2001-07-31 2005-01-26 Hewlett Packard Co Method of watermarking data

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102651318B1 (ko) * 2022-10-28 2024-03-26 주식회사 뮤즈블라썸 트랜지언트 기반의 사이드체인 오디오 워터마크 코딩 시스템

Also Published As

Publication number Publication date
US20040260559A1 (en) 2004-12-23
DE602004000884T2 (de) 2006-11-30
GB2400285A (en) 2004-10-06
CN100384119C (zh) 2008-04-23
EP1465157B1 (en) 2006-05-17
GB0307456D0 (en) 2003-05-07
EP1465157A1 (en) 2004-10-06
US7702404B2 (en) 2010-04-20
DE602004000884D1 (de) 2006-06-22
CN1534919A (zh) 2004-10-06

Similar Documents

Publication Publication Date Title
US7340609B2 (en) Data transform method and apparatus, data processing method and apparatus, and program
RU2375764C2 (ru) Кодирование сигнала
US7372375B2 (en) Signal reproducing method and device, signal recording method and device, and code sequence generating method and device
US9008306B2 (en) Adaptive and progressive audio stream scrambling
US7702404B2 (en) Digital audio processing
US20050021815A1 (en) Method and device for generating data, method and device for restoring data, and program
US20030112973A1 (en) Signal processing method and apparatus, and code string generating method and apparatus
JP4193100B2 (ja) 情報処理方法および情報処理装置、記録媒体、並びにプログラム
US20040083258A1 (en) Information processing method and apparatus, recording medium, and program
JP2004088619A (ja) 符号列暗号化方法、装置および暗号解除方法、装置および記録媒体
JP2004361602A (ja) データ生成方法およびデータ生成装置、データ復元方法およびデータ復元装置、並びにプログラム
JP4207109B2 (ja) データ変換方法およびデータ変換装置、データ再生方法、データ復元方法、並びにプログラム
JP2004362721A (ja) データ生成方法およびデータ生成装置、データ再生方法およびデータ再生装置、並びにプログラム
JP4066740B2 (ja) 信号再生装置及び方法、信号記録装置及び方法、並びに符号列生成方法及び装置
JP2003308099A (ja) データ変換方法およびデータ変換装置、データ復元方法およびデータ復元装置、データフォーマット、記録媒体、並びにプログラム
JP2003304158A (ja) 信号再生方法及び装置、信号記録方法及び装置、並びに符号列生成方法及び装置
WO2003085836A1 (fr) Procede d'enregistrement/lecture de signal, procede de generation d'une chaine de codes et programme
JP2003308013A (ja) データ変換方法およびデータ変換装置、データ復元方法およびデータ復元装置、データフォーマット、記録媒体、並びにプログラム
JP2003304238A (ja) 信号再生方法及び装置、信号記録方法及び装置、並びに符号列生成方法及び装置
JP2003337599A (ja) 信号再生方法及び装置、信号記録方法及び装置、並びに符号列生成方法及び装置
JP2003177791A (ja) コンテンツ符号化装置、コンテンツ符号化方法、コンテンツ符号化プログラム、及びコンテンツ符号化プログラムが記録された記録媒体、並びにコンテンツ復号装置、コンテンツ復号方法、コンテンツ復号プログラム、及びコンテンツ復号プログラムが記録された記録媒体
JP2003177798A (ja) コンテンツ符号化装置、コンテンツ符号化方法、コンテンツ符号化プログラム、及びコンテンツ符号化プログラムが記録された記録媒体、並びにコンテンツ復号装置、コンテンツ復号方法、コンテンツ復号プログラム、及びコンテンツ復号プログラムが記録された記録媒体
JP2003263195A (ja) 信号再生方法及び装置、信号記録方法及び装置、並びに符号列生成方法及び装置
JP2003257121A (ja) 信号再生方法及び装置、信号記録方法及び装置、並びに符号列生成方法及び装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070605