JP2004506947A - 補足情報に応答するオーディオ又はビデオ知覚符号化システムのパラメータ変調 - Google Patents

補足情報に応答するオーディオ又はビデオ知覚符号化システムのパラメータ変調 Download PDF

Info

Publication number
JP2004506947A
JP2004506947A JP2002520567A JP2002520567A JP2004506947A JP 2004506947 A JP2004506947 A JP 2004506947A JP 2002520567 A JP2002520567 A JP 2002520567A JP 2002520567 A JP2002520567 A JP 2002520567A JP 2004506947 A JP2004506947 A JP 2004506947A
Authority
JP
Japan
Prior art keywords
signal
parameters
parameter
perceptual
modulation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002520567A
Other languages
English (en)
Other versions
JP2004506947A5 (ja
Inventor
ワトソン、マシュー・オーベリ
トルーマン、マイケル・ミード
バーノン、スティーブン・デッカー
クロケット、ブレット・グラハム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JP2004506947A publication Critical patent/JP2004506947A/ja
Publication of JP2004506947A5 publication Critical patent/JP2004506947A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/0028Adaptive watermarking, e.g. Human Visual System [HVS]-based watermarking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0064Image watermarking for copy protection or copy management, e.g. CGMS, copy only once, one-time copy

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Stereophonic System (AREA)
  • Transmitters (AREA)

Abstract

ウォーターマークのような補足情報により、知覚符号化システムのエンコーダファンクション及び又はデコーダファンクションの操作を変更し、補足情報がデコーダファンクションの出力において検出される得るようにする方法である。補足情報に応答して1つ又はそれ以上のパラメータがエンコーダ及び又はデコーダファンクションにおいて変調される。
【選択図】図2

Description

【0001】
【技術分野】
本発明は、信号に関するステガノグラフィ、即ち、信号隠蔽に関する。特に、本発明は、補足情報による オーディオ又はビデオ知覚符号化システムのエンコーダ及び又はデコーダの操作を変更し、デコーダの出力で補助情報が検出され得るようにすることに関する。そんな補足情報は、しばしば「ウォーターマーク(透かし)」と呼ばれる。「ウォーターマーキング」はステガノグラフィ(隠蔽)の一面である。
【0002】
【背景技術】
ステガノグラフィ及びウォーターマーキング
ステガノグラフィは別の信号内に一信号を隠す科学である。ステガノグラフィク(隠蔽)アルゴリズム又はプロセスは、エラーに強い(耐エラー)か又は「もろい」かもしれない。即ち、それは隠された信号を改造するのが非常に困難であるか又は非常に容易であり得る。オーディオ用途を考慮すると、非常にもろい隠蔽技術は、上位ビットで伝えられるであろうオーディオプログラム内容から独立したデータストリームを伝えるためにPCMチャンネルの最下位ビットを用いることである。最下位ビットで伝えられる隠されたデータチャンネルは、オーディオプログラムを有意には歪ませないが、むしろ低レベルディザ信号として働く。この技術は、簡単なオーディオ処理は、利得変化、デジタル対アナログ変換等のような、データ信号を破壊し得るという意味でもろい。
【0003】
ウォーターマーキング(透かし)は隠蔽、即ち、遮蔽の一形式であり、そこでは、概して、信号隠蔽技術は、通常の処理又は故意の攻撃よる改造に対してエラー強いことを意図している。そういうものとして、ウォーターマークは、コンテント所有権のコピー保護又は識別のような、安全性に関する用途で価値がある。そんな用途では、ウォーターマークは、例えば、コピー制御条件、著作権情報及び主プログラム資料がどのように公開されたかに関する情報を伝え得る。主プログラムがその後盗まれるか又は不法にコピーされるとしても、理想的には、ウォーターマークはプログラム資料内に埋め込まれたままであり、所有権を立証する方法を与える。
【0004】
1つ又はそれ以上のウォーターマークが「コンテント」(例えば、オーディオ又はビデオ公演)流通経路に沿った多くの時点で挿入され得る。この経路の開始時点で信号に加えられる情報は著作権情報又はマスター(原盤)化地点を含み得る、同時に信号系の終了時点では、日付・時間スタンプ及び又は機械通し番号等の再生情報を含み得る。コンテントの起源を追跡するためには、ウォーターマークが流通経路に沿った各種の地点で埋め込まれ得る。
【0005】
オーディオ及びビデオ信号のウォーターマーキングに関する一重要な考慮事項は、隠された信号は不必要にそれが隠されている信号の品質を劣化させるべきではないということである。理想的には、ウォーターマークは完全に透明であるべきである。即ち、ウォーターマーク信号及び原信号間の差は知覚不能(助力のない観察者には)であるべきである。勿論、さもなければウォーターマーク信号は回復不能なので、差は幾つかの手段によって検出可能でなければならない。例えば、コマーシャル使用を避けるために画像は可視的にウォーターマークされ得る。さらに、紙は立証を知覚できるシールを伝えるためにウォーターマークされ得る。
【0006】
従って、ウォーターマーキングの目標は以下のように要約され得る。
【0007】
・二次的信号又は補足情報を加えるような方法での主信号の変更が改変された主信号に帰着し、
・原信号及び変更された信号間の差は検出可能であるが視覚不能であるべきである、
・当該変更は、除去又は隠蔽を困難にすべきである。
【0008】
知覚符号化
知覚符号化は、知覚的な諸無関連性をより効果的な表現に変えるために、信号からそれらを除去する科学である。例えば、いくつかの用途では、予め決められたチャンネル容量制限を満たすためにデジタルオーディオ又はビデオ信号の送信データレートを低減させるために知覚符号化が用いられる。オーディオ及びビデオ信号の知覚符号化は確立された科学分野であり、オーディオ及びビデオ信号が効率的な記憶及び伝送に関して比較的低データレートに変更されることを可能にする。
【0009】
多くの知覚コーダは、原信号のコンテントを分析しかつ各信号成分の知覚的関連性を識別することによって作動する。次いで、原信号より低いデータレートを用いて変更されたバージョンが表現され得るように変更されたバージョンが作り出される。理想的には、原信号及び変化された信号間の差が知覚不能にされる。ノイズ、即ち、通常は量子化雑音又は他のひずみは、信号のデータレートを低減させるために制御可能に導入される。ノイズ又は他のひずみを操作するために人の知覚特性が考慮され、それが知覚不能又は最小的にしか知覚されないようする。
【0010】
知覚コーダは、人の知覚を或る程度の正確さで反映させることを意図したマスキング(隠蔽、即ち、遮蔽)モデルを用いる。マスキングモデルは、知覚可能性の境界を確定する知覚マスキング閾値を与える。図1の実線は、音圧レベルを示し、そこでは、正弦波又は狭帯域ノイズのような音が丁度可聴になる、即ち、聴取閾値を示す。レベルが当該曲線より上の音は可聴であり、下のものは聴取不能である。この閾値が周波数に非常に依存していることは明らかである。例えば、4kHzでは、50Hz又は15kHzにおけるよりも遥かに軟らかな音を聞くことができる。25kHzでは、閾値は尺度から外れ、如何に大きくてもそれは聴取不能である。
【0011】
ある周波数に比較的大きな信号、例えば、図の垂線で示されるような、500Hzの正弦波が存在すると、図1の点線で示されるような閾値を考察せよ。閾値は500Hzの極近辺で劇的に上昇し、より遠くの周波数では幾分緩やかで、可聴範囲の遠方では全く見られない。
【0012】
この閾値の上昇はマスキングと呼ばれる。大きな500Hz正弦波信号(「マスキング信号」又は「遮蔽体」)の存在では、この「マスキング閾値」と呼ばれ得る閾値未満の信号は、大きい信号によって隠されるか又は遮蔽される。さらに遠くでは、他の信号が無信号閾値の幾分上になり得るが、それでもなお新しい遮蔽閾値の下になり、従って聴取不能である。しかし、無信号閾値が不変であるスペクトルの遠方部分では、500Hz遮蔽体なしで取可能であったあらゆるノイズは、それで丁度聴取可能なままである。従って、マスキングは、1つ又はそれ以上の各マスキング信号の単なる存在には依存しない。それらがスペクトル的にどこにあるかに依存する。例えば、ある楽節が可聴周波数範囲の全域に亘る多くのスペクトル成分を含み、従って、無信号閾値曲線に関してあらゆるところで上昇される遮蔽された閾値曲線を与える。他の楽節は、例えば、小部分に限定されるスペクトル成分を有するソロ楽器からの比較的大きな音からなり、従って、図1例の正弦波遮蔽体によりよく似た遮蔽曲線を与える。
【0013】
マスキングは同様に、遮蔽体及び遮蔽される信号間の時間関係に依存する一時的な面をも有する。あるマスキング信号は、本質的にマスキング信号が存在する間にのみマスキングを与える(「同時マスキング」)。他のマスキング信号は、遮蔽体が存在する間のみならず、それより早いか又はそれより遅い時間にもマスキングを与える(「後方マスキング」又は「前方マスキング」)。「転移(過渡現象)」、即ち、信号レベルの突然の、短いかつ意味のある増加は、3「種類」のマスキングの全て、即ち、後方マスキング、同時マスキング及び前方マスキングを展示し得るが、定常状態又は静止‐定常‐状態信号は同時マスキングしか提示できない。
【0014】
知覚符号化プロセスによって追加されるすべてのノイズ及び歪みは、知覚可能な障害を避けるためにはマスキング閾値以下にとどまるべきである。符号化プロセスによって追加されるノイズ及び歪みが、マスキング閾値には達するが、それを越えないならば、当該信号は「丁度知覚される差」のレベルで符号化されるといえる。システムの「符号化マージン(余裕)」は、追加されたノイズ又は歪みそれだけ分マスキング閾値より下にある量と定義され得る。即ち、0の符号化マージンは、信号が丁度知覚され得る差のレベルで符号化されることを意味し、一方正の符号化マージンは追加されたノイズ又は歪みがある余裕を持って感知されず、負の符号化マージンは感知できる障害があることを意味する。
【0015】
信号の差の面は、(例えば、帯域幅、時間分解能、空間精度等)異なった程度の精度に符号化されることが可能で、異なった信号特性につき異なった符号化マージンに帰着することに注目せよ。原始信号のすべての特性につき符号化マージンが負でないように符号化されるならば、それは知覚的に原始信号と等しいといい得る。
【0016】
知覚符号化システムは、ビット割当て情報又は知覚モデル情報を符号化されたデータと共にデコーダに伝達し得るエンコーダからなる。知覚符号化システムには3つの主要な種類がある。即ち、順方向適応、逆方向適応及びそれら2つのハイブリッドシステムである。順方向適応システムでは、エンコーダは明示的にビット割当て情報をデコーダに送る。逆方向適応システムは、ビット割当て情報又は知覚モデル情報のいずれをもデコーダには送らない。デコーダは符号化されたデータからビット割当て情報を再現させる。ハイブリッドシステムは、符号化されたデータに含まれるべき、知覚モデルの全分解能形式以下のようなある割当て情報は考慮するが、全順方向適応システムにおけるより遥かに少ないものは考慮しない。これらの3種類の知覚符号化システムのさらに詳細な論議は、Craig C.Todd他による「AC‐3:オーディオ送信及び記憶用順応知覚符号化」(Preprint 3796,96th Convention ofAudio Engineering Society,February26‐March1,1994)に記載されている。ドルビー研究所で開発された、Dolby Digital及びDolby Eシステムのような、以下でさらに確認される、知覚符号化システムは、ハイブリッド順方向・逆方向適応システムであり、一方同様に以下でさらに確認される、MPEG‐2AAC符号化システムは、順方向適応システムの例である。
【0017】
知覚コーダの目標は以下のように要約され得る。即ち、
・主信号の変更が変更された信号に帰着し、
・原信号及び変更された信号間の差は無知覚になるべきであり、
・変更された信号の表現は原信号のものよりさらに有効になるべきである。
【0018】
安全性
安全性の基準としてのウォーターマーキングは、ウォーターマークが直接攻撃から生き残れる能力と同程度に強いことだけである。現在用いられている多くのウォーターマーキング技術は、ウォーターマークが公知でないならば、ウォーターマークデータをおおい隠すために攻撃者はウォーターマーク付き信号をどのように変更するかを知らないであろうとの仮定の下にウォーターマークの詳細を秘密に保つことによってそれ自体を保護することを意図している。これは「隠蔽を通じた安全性」として知られる原理である。暗号法の分野では、隠蔽を通じた安全性は概して非論理的原理として捨てられる。アルゴリズム又はプロセスが、秘密を通じてその安全性を得るものならば、ただ1人の者が当該技術の詳細を開示するだけで全システムの安全性が危うくされる。
【0019】
安全性の目標は以下のように要約される。即ち、
・コンテントの盗難が役に立たないか又は海賊行為及び海賊行為の源への追跡可能性のその後の立証を可能にするような方法でコンテントを保護し、
・攻撃に対し強くなるようにし、
・当該システムの最も弱いリンクにおいてさえも高安全性を維持することである。
【0020】
【本発明の開示】
本発明は、補足情報に応答して知覚符号化システムのエンコーダ及び又はデコーダの操作を変更する方法に向けられ、当該補足情報がデコーダの出力で検出可能になるようにされる。エンコーダ及び又はデコーダの1つ又はそれ以上のパラメータが補足データに応答して変調される。
【0021】
本発明により、デコーダの出力において検出可能であるが、望ましくは感知不能な変化を生じさせるために知覚符号化システムのエンコーダ及び又はデコーダの1つ又はそれ以上のパラメータを変調することによって、ウォーターマーク情報のような補足情報が伝えられる。この情報は、符号化システムによって伝えられるオーディオ又はビデオ情報のような主情報に追加されるといういう理由で「補足的」である。概して、そんな補足情報は、必要性はないが、「ウォーターマーク(透かし)」の性質を帯びている。1つ又はそれ以上のパラメータの変調は、補足又はウォーターマーク情報を符号化された信号内(知覚エンコーダ内のパラメータを変調する場合には)及び復号された信号内(知覚エンコーダ及び又は知覚デコーダ内のパラメータを変調する場合には)に補足又はウォーターマーク情報を「埋め込む」と云うことができる。
【0022】
本発明のある実施例は、一エンコーダ内で少なくとも部分的に実施されるならば、主情報を表すビットストリームデータを間接的に変更し得るが、本発明は主情報を表すビットストリームデータの直接変更は考えていない(また知覚エンコーダでの量子化後ビットストリームデータになる主情報の変更も考えていない)。本発明は、復号されていないビットストリームにおけるよりはむしろ知覚デコーダ出力における補足情報の検出(エンコーダ及び又はデコーダの作動の結果としてそんな情報が伝えられるかどうか)を考慮している。
【0023】
「変調」によって我々は、1つ又はそれ以上の値(状態)間のパラメータの値を変えることを意味し、ここでは前記値は「デフォルト(省略時)値」を含むことが可能であり、それは本発明の働きがなかったならばそうであったのとは別にパラメータを評価する。例えば、パラメータ値は、そのデフォルト値及び1つ又はそれ以上の値間(唯2つの可能な値しかないパラメータの場合には、そんなパラメータは時々「フラッグ」と呼ばれ、パラメータはそれらの2つのフラッグ間で変更され得る)で変更され得るか又はそれは、デフォルト値を含まない、1つ又はそれ以上の値間で変更され得る。
【0024】
補足情報又はウォーターマーク信号又はシーケンスに「応答して変調する」との表現によって我々は、例えば、符号化システムに加えられる決定論的シーケンス又は入力信号のような一連の指令を含む、1つ又はそれ以上の他の信号の機能によって制御が変更される場合のように、パラメータの変調が直接又は間接的に補足情報又はウォーターマーク信号又はシーケンスによって制御されることを意味する。
【0025】
「パラメータ」の用語によって我々は、主情報を表すビットストリームデータではない知覚符号化システム内の変数を意味する。本発明の各面による変調に適する)、MPEG オーディオ及び MPEG ビデオパラメータの例は以下に示される図6、7及び8の表にそれぞれ示される。本発明は同様に、まだ定義されていないパラメータ等、発行された知覚コーダ標準では確認されていない1つ又はそれ以上のパラメータの変調をも考慮している。
【0026】
「主情報を表すビットストリームデータ」の用語により我々は、知覚エンコーダによって発生されるがまだ復号されたいない、オーディオ又はビデオ情報のような主情報を伝える符号化されたビットストリーム内のデータビットを意味する。主情報を表すビットストリームデータは、例えば、Dolby Digital (AC−3)システムの場合には、指数及び仮数、またMPEG−2AACシステムの場合には、目盛係数及びハフマン符号化係数等を表わす。
【0027】
複合知覚符号化システム(例えば、Dolby Digital及びDolby Eオーディオ、MPEG オーディオ、MPEG ビデオ等)では、多数の独立符号化パラメータは有意の符号化順応性を与える。“Dolby”、“Dolby Digital”及び“Dolby E”はDolby Laboratories Licensing Corporationの商標である。
【0028】
Dolby Digital符号化の詳細は、“Digital Audio Compression Standards(AC−3)”(Advanced Television Systems Committee(ATSC),Document A/52,December 20,1995)に記載されている。下記参照のこと。
【0029】
www.atsc.org/Standards/A52a_52.doc. ; www.dolby.com/tech/ATSC_err.pdf.

【0030】
Dolby E符号化の詳細は、「オーディオ分配システムにおける効率的ビット割当、量子化及び符号化」(AES Preprint 5068, 107th AES Conference, August 1999)及び「ビデオ用に最適化された専門オーディオコーダ」(AES Preprint 5033, 107th AES Conference August 1999)に記載されている。
【0031】
MPEG−2AAC符号化の詳細は、「情報技術−映画及び関連オーディオ情報の包括的符号化―パート7:高等オーディオ符号化」(ISO/IEC 1318−7:1997(E), International Standards Organization (April 1997)、「MP3及びAAC」(by Karlheinz Brandenburg, AES 17th International Conference on High Quality Audio Coding, August 1999) 及び「ISO/IEC MPEG−2 高等オーディオ符号化」 (by Bosi,et. al., AES preprint 4382, 101st AES Convention, October 1996)に記載されている。
【0032】
ドルビーエンコーダ、MPEGエンコーダ及びその他を含む各種の知覚コーダの概観は、「MPEGオーディオの概観:低ビットレートオーディオ符号化のための現在及び将来標準」(by Karlheinz Brandenburg and Marina Bosi, J. Audio Eng. Soc., Vol. 45, No. 1/2, January/February 1997) に記載されている。
【0033】
知覚符号化パラメータに対する特定のデフォルト値は、概して入力信号の特性に基づく符号化システムによって選択される。しかし、符号化パラメータ値を選択するためには通常2つ以上の方法がある。即ち、知覚可能な差を持たない復号された信号を生成するパラメータ値及び検知可能であるが知覚されない差を持つ復号された信号に帰着し得るような符号化パラメータ値の変化を持つ符号化パラメータ値がある。知覚不能性は人の知覚を指すが、一方検出可能性は人以外の検出器の能力に基づくことに注目のこと。
【0034】
補足信号又はウォーターマーク検出器は、再生(復号)された信号内に含まれる埋め込まれた情報を回復する。オーディオ信号の場合には、例えば、ある場合では、検出は音響的に行われ得るが、他の場合には電子的検出が必要とされ得る。電子検出はデジタル又はアナログ領域でなされ得る。デジタル領域での電子検出は、復号された出力の時間又は周波数領域又は周波数対時間変換前のデコーダ内の周波数領域でのものであり得る。音響的処理後にウォーターマークを引出すことは、部屋ノイズ、スピーカ、マイク特性及び総合的再生音量の付加ためにより困難な挑戦と考えられる。
【0035】
多くの実際的知覚符号化システムは、付加されたノイズを丁度認知できる差レベルより低く維持する要件を満たし得ない。知覚符号化システムにおける知覚可能性要件は、ビットレート目標又は複雑性制限を満たすためにしばしば緩和される。これらの場合には、知覚符号化中に加えられるノイズは知覚可能であるが、符号化パラメータ変調の対象とされ得るデフォルト値以外に、既に知覚可能なノイズを最早知覚不能にさせる値がありそうである。パラメータの変調は実質的にに知覚されたノイズの知覚可能な変化に帰着することはないが、それにもかかわらず、それは復号された信号の検出可能な変化に帰着し得る。
【0036】
本発明の各面によると、変調の効果(影響)で、知覚符号化によって加えられたノイズ及び歪みが、周波数スペクトルの全て又は一部において、丁度知覚可能な差のレベルを下回らずにそれに近づかせるように、1つ又はそれ以上のパラメータが変調されるのが望ましい(この意味では、「歪み」は、符号化された原信号間の差でありかつ聴取可能な人工品(物)に帰着し得るか又は帰着し得ない。)従って、マスキング閾値を越えかつ知覚可能な障害を生じさせることなく1つ又はそれ以上のパラメータを符号化することから結果的に生じる影響を除去又はおおい隠すことは困難であろう。これに反して、攻撃がマスキング閾値より下方ならば、パラメータ変調の効果の一部は残りそうである。
【0037】
すでに示唆したように、ノイズ及び歪みが丁度知覚可能な差のレベル未満になるようにエンコーダにより主原始信号が符号化されないならば、本発明の各面は同様に用いられ得る。この場合には、原始信号は原型に関して損傷され、パラメータ変調は復号された信号に、検出の観点からは異なった損傷を導入するが、望ましくは実質的に知覚可能性が同一になるように原始信号が符号化される。先の場合のように、損傷を誇大化するか又はより程度の大きな知覚可能性を有する追加の損傷を導入することなく、復号された信号において結果的に生じるパラメータ変調の効果を除去又はおおい隠すことは困難であろう。
【0038】
本発明の接近方法は、知覚符号化に先立ってウォーターマークを用いる諸技術とは基本的に異なる。これらの技術では、たとえ符号化システムがウォーターマークを伝えるのに十分なマージンを含むことが可能であっても、前のウォーターマークを伝えるのに選ばれた特定の方法が知覚符号化システムの符号化マージンの位置と一致する保証はない。そんな前の諸システムは独立して作動するので、それらは時々悪く相互作用して知覚可能な障害を導入するか又はウォーターマークがおおい隠されるようにさせる。
【0039】
すでに述べたように、知覚エンコーダは、知覚的に冗長な情報を除去することによって入力信号のデータレートを低減させる。例えば、定データレートエンコーダは、固定レートの入力情報をより低い固定レートの情報に低減させる。このデータ低減部分は、時々「レート制御」として特徴づけられる、エンコーダ出力が最終の固定情報サイズを越えないことを保証する機能を要する。レート制御は、それが最終符号化されたサイズを達成してしまうまで情報を低減させる。
【0040】
いくつかの知覚エンコーダでは、正しい情報が放棄されることを保証するために歪み測定がレート制御と組合される。歪み測定は、原入力信号を符号化された信号(レート制御の出力)と比較する。歪み測定は、レート制御プロセスの結果を変更するために符号化パラメータを制御するのに用いられ得る。
【0041】
本発明の歪みレート制御面は、埋め込まれた信号の強さを最大にしかつ埋め込まれた信号の知覚可能性を最小にすると同時に、どのようにしてウォーターマークを知覚エンコーダに埋め込むかの問題を解決することを追求する。一実施形態では、本発明はまた、使用者がウォーターマーキング埋め込みプロセスにおけるパラメータを調節することによって埋め込まれた信号の強さ又はエネルギーを選択可能にする。
【0042】
パラメータ変調に加えて、本発明の各面では、パラメータ変調のある面及び、従って、結果的に生じるウォーターマークの特性を変更するために、決定論的シーケンスのような一連の指令を用いる。決定論的シーケンスは、限定方程式(作成方程式)及び初期状態 (ソートキー)を前提として、2進1及び0の各シーケンスを生じる数学的プロセスによって発生される。決定論的シーケンスを用いる本発明のいくらかの代替面が開示される。これらの技術は、ウォーターマークの知覚不可能性を改良し、またウォーターマークの強さを改良することが可能であり、それは、知覚不可能性を改良する他の技術が強さを劣化させる傾向にある限り、興味のあるかつ有用な結果である。最後に、これらの技術は、システムの強さを犠牲にすることなくウォーターマーキングシステムのすべての面(決定論的シーケンスキーを除き)を示すことを可能にするという意味で安全性を改良し得る。
【0043】
本発明の決定論的シーケンス面は、下記の動作1つ又はそれ以上を含み得る。
【0044】
・パラメータ変調転移のレート及び、従って、ウォーターマークシンボル転移レートを変更するために決定論的シーケンスを用い(以下の表1参照)、
・変調用のパラメータ(以下の表2参照)を選択するために決定論的シーケンスを用い、
・変調用パラメータの選択が変化するレートを変更するために決定論的シーケンスを用いる(以下の表3参照)。
【0045】
さらに、本発明の代わりの各面は、パラメータ変調及び又は変調用パラメータの選択を制御するために原始信号の特性を用いる動作を含む。本発明の原始信号応答面は下記動作の1つ又はそれ以上を含む。即ち、
・パラメータ変調レート及び、従って、ウォーターマークシンボル転移レートを可変的に変更するために原始信号の特性を用い(以下の表4の部分a参照)、
・変調用パラメータの選択が変化するレートを可変的に変更するために原始信号の特性を用い(以下の表4の部分b参照)、
・変調用パラメータの可変セットのパラメータ数を可変的に変更するために原始信号の特性を用いる(以下の表5参照)。
【0046】
以下でさらに説明されるように、原始信号の決定論的シーケンス及び特性の双方は本発明の代わりの面による変調パラメータに関連して用いられ得る。以下の表6、7及び8参照。
【0047】
本発明のいくつかの実施例に関して、知覚デコーダの出力でのウォーターマーク検出は、エンコーダに加えられた主情報へのアクセスを必要としそうである。本発明のいくつかの他の実施例については、検出におけるより大きな複雑性を犠牲にして最初の主情報にアクセスすることなくウォーターマーク検出を行うことができる。
【0048】
信号が聴取者に伝えられる個所で独特の又は「逐次化された」(例えば通し番号)ウォーターマークを利用するのはしばしば望ましい。本発明の各面によると、補足情報又はウォーターマークが知覚復号プロセス中に埋め込まれる。1つ又はそれ以上のパラメータが、逆量子化に先立って変調される。
【0049】
デコーダパラメータ変調プロセスによって加えられたノイズ又は歪みが知覚閾値を超えないならば、知覚不可能性が維持され得る。復号プロセスの一部としてウォーターマークを知覚できないように埋め込むために知覚閾値が用いられる。多くの知覚コーダは、ある形式又は他の形式で知覚モデルを符号化プロセスから複合プロセスへ伝達する。しかし、他のコーダは知覚閾値の近似値又は雑な表示しか与えない。最も正確な知覚閾値は量子化されていない原始スペクトル係数から得られるが、そんなデータがデコーダに伝えられると、データレートの増加が著しくなる。その代わりに、知覚符号化システムにおいてデコーダに与えられる知覚閾値は、指数が臨界帯域内で最大エネルギーを持つ(ドルビーデジタルシステムにおけるように)情報サンプルを表す、仮数からなる指数でもよい。デコーダにおける知覚閾値の精度を改良するために、帯域内の最大エネルギーの代わりに同バンド内のサンプルエネルギーの平均値に基づく指数がエンコーダから伝達され得る。
【0050】
デコーダの変調パラメータは、多くの面でエンコーダのものと類似しているが、順応性が劣る。例えば、復号システムにおいて1つ又はそれ以上のパラメータを変調するためには、符号化パラメータに基づいてビット割り当て情報を再公式化する際に注意することを要する。また、デコーダにおいてパラメータ変調の影響を知覚不能にさせるのはさらに困難である。これに対する1つの理由は、少なくとも理想的なデコーダの場合には、符号化プロセスにおいて既に知覚可能な閾値まで量子化エラーが付加されてしまっていることである。しかし、例えば、知覚モデルの不完全性、正の信号対ノイズ比相殺又は信号状態のために符号化マージンが存在するので、これは必ずしも常に事実ではない。
【0051】
【本発明を実施する最良の態様】
図2は、本発明の基礎的原理を例示する機能的構成図である。知覚エンコーダファンクション2及び知覚デコーダファンクション4は知覚符号化システムを構成する。ビデオ又はオーディオのような主情報が、知覚エンコーダファンクション2に加えられる。エンコーダファンクション2は、知覚デコーダファンクション4によって受信されるデジタルビットストリームを発生させる。エンコーダファンクション及び又はデコーダファンクションの1つ又はそれ以上のパラメータは、補足情報(例えば、ウォーターマーク信号又はシーケンス)に応答して変調される。補足情報はエンコーダファンクション又はデコーダファンクションのいずれか又は双方に加えられるので、点線は補足情報からエンコーダファンクション及びデコーダファンクションまで、それぞれ示される。知覚デコーダファンクションの出力は埋め込まれた補助情報を有する主情報である。補足情報は、デコーダファンクションの出力において検出され得る。
【0052】
補足情報が、エンコーダファンクション2及びデコーダファンクション4の双方に加えられるならば、概して、一方に加えられた情報は他方に加えられたものと異なるであろう。例えば、1つ又はそれ以上のエンコーダファンクションパラメータを制御する補足情報は、オーディオ又はビデオコンテントの所有者を識別するウォーターマークであるかも知れない、また1つ又はそれ以上のデコーダファンクションパラメータを制御する補足情報は、オーディオ又はビデオコンテントを一人又はそれ以上の消費者に提供する装置を識別する通し番号であり得る。概して、補足情報は、異なった回数でエンコーダファンクション及びデコーダファンクションに加えられ得る。
【0053】
図3〜5は、デコーダファンクションの出力内の補足情報を検出する検出器ファンクションを含む、本発明の一面の基礎的原理を例示する機能的構成図である。検出は、デコーダファンクション出力のデジタル領域又はアナログ領域(電気的又は音響的)で行われ得る。検出は、符号化後であるが周波数領域対時間領域変換に先立って、同様にデコーダファンクションのデジタル領域において行われ得る。
【0054】
図3Aは、デコーダファンクションの出力内の補足情報検出するデコーダファンクション4の出力を受信する検出器ファンクション6を含むことを除けば、図2と同一である。検出器ファンクション6の出力は当該補足情報である。図4は、デコーダファンクション4の出力のみならず、エンコーダファンクションに加えられた同一の主情報をも受信する検出器ファンクション8を含むことを除けば、図3Aと同一である。検出器ファンクション8の本質的機能は、その出力として補足情報を与えるためにエンコーダファンクションに加えられた原入力情報をデコーダファンクションの出力と比較することである。図5は、図4装置の変形物である。図5では、図4におけると同様に、検出器ファンクション10はデコーダファンクション4の出力及びエンコーダファンクション2に加えられた主情報を受信する。しかし、検出器ファンクション10は検出器ファンクション8と異なり、比較器ファンクション12のみならず、知覚エンコーダファンクション14及び知覚デコーダファンクション16を含む。エンコーダファンクション14は、そのパラメータが変調されないことを除けばエンコーダファンクション2と同一である。デコーダファンクション16は、そのパラメータが変調されないことを除けばデコーダファンクション4と同一である。従って、デコーダの出力において補足情報を検出する動作は、以下の動作の1つによって達成される。即ち、
復号された信号を観察し、
復号された信号をエンコーダファンクションに加えられた信号と比較し、
復号された信号を実質的に同一の知覚符号化システムであって、そこではエンコーダファンクション又はデコーダファンクションのパラメータが補足情報に応答して変調されてない知覚符号化システムからの復号された信号と比較する。
【0055】
図3Aの検出装置は、帯域幅パラメータが変調される(帯域幅パラメータを変調することは以下に詳細に説明される)場合のようなある種類のパラメータ変調の効果を検出するのに最も適している。大抵のパラメータを変調する効果を検出するためには、エンコーダに加えられた主情報を、図4及び5の装置におけるようなデコーダによって与えられる埋め込まれた補足情報を伝える主情報と比較することを要する。図5の装置は、より厳しい比較を可能にする、その理由は比較される情報間の唯一の差が変調パラメータによって発生されるからである。図4の装置では、当該差は知覚符号化及び復号プロセスによって導入され得る他の効果を含む。
【0056】
図3Aの検出装置は、知覚エンコーダに加えられた主情報にアクセスする必要がないので、どのエンコーダ及び又はデコーダでパラメータが変調されるかに依存して、それは実時間又は実時間近くで達成され得る。例えば、帯域幅パラメータを変調することは、デコーダ出力のみを分析することによって実時間又は実時間近くで検出を可能にする。特に、図3A装置の検出器6は、デコーダファンクション4の出力がそれ自体に対して比較され得るように、1つ又はそれ以上の遅延ファンクションを含み得る。例えば、図3Bに示されるように、検出器ファンクション6は、復号された信号を観察する動作が復号された信号をそれ自体の時間遅延されたバージョンと比較することを含むように、比較器ファンクション12’及び1つ又はそれ以上の遅延ファンクション7、7’等を含み得る。1つ又はそれ以上の先のブロックからのエネルギー状態が、例えば、以下に記載される帯域幅変調検出の方法でシンボルを決定するために閾値を用いる比較器ファンクションにさらされる。ブロック長さは検出器によって知られかつ期待されるシンボルレートを実際のシンボルレートと整列させるためにいくつかの形の同期が起こらなければならない。他のパラメータの変調は、実時間又はそれに近い時間での検出を許さないか又は図4及び5の装置におけるようにデコーダ出力をエンコーダ入力信号と比較することを要するであろう。
【0057】
デコーダ出力がエンコーダ入力と比較される図4及び5のような装置では、入力信号を出力信号と同期させることは重要である。どのパラメータが変調のために選択されるか及び補足情報データレートに依存してこれらの信号間には高度の同期を与えることが必要であろう。そのようにする一方法は、PRNシーケンスのような決定論的シーケンスを主信号に埋め込み、当該シーケンスが同様にデコーダ出力内にも埋め込まれるようにすることである。入力及び出力信号内のシーケンスを比較することによってきめ細かい同期が可能になる。
【0058】
検出は人手で達成されるか又はいくつかの場合には自動的に達成され得る。主信号においてPRNシーケンスを用いることで、自動検出が促進され得る。人手でなされるならば、比較された信号のスペクトル分析のような視覚補助器具が用いられ得る。
【0059】
ウォーターマークを埋め込むために変調され得る符号化パラメータのいくつかの例が数個の表に記載されている。即ち、図6に示される第1表(ドルビーオーディオコーダパラメータ)、図7に示される第2表(MPEGオーディオコーダパラメータ)、図8に示される第3表(MPEGビデオコーダパラメータ)。パラメータ(例えば、「マスキングモデル及びビット割当て」の各範疇につき、それぞれの表はパラメータ(例えば、「SNR相殺」)の型、特殊のパラメータ(例えば、“csnroffst”“fsnroffst”等)、パラメータがエンコーダ内及び又はデコーダ内の変調に敏感かどうか及びパラメータが変調される場合復号された信号のウォーターマークの信号特性の結果的に生じる変化を示す。図6に示される表の第1欄には、パラメータの6つの範疇がアドレスされる:即ち、マスキングモデル及びビット割当て、チャンネル間結合、周波数帯域幅、ディザ制御、位相関係及び時間・周波数変換ウィンドである。第1表では、rematflgが“0”(エンコーダではリマトリックシングなし)ならば、リマトリックシングは復号中にのみ行われ、第2表では、ms_usedが0(エンコーダではM/S符号化無し)ならばM/S符号化は復号中にのみ行われ得ることに注目のこと。
【0060】
符号化システムにおいて1つの型のパラメータが1つ又はそれ以上のパラメータを持つところでは、それぞれのパラメータにつき識別された省略形が括弧内に示される。従って、例えば、パラメータの「SNR相殺」型はDolby Digitalでは4つのパラメータを含む。即ち、“csnroffst”(粗SNR相殺)、“fsnroffst”(チャンネル微細SNR相殺)、“cplfsnroffst”(結合微細SNR相殺)及び“lfesfsnroffst”(低周波効果チャンネル微細SNR相殺)を含む。これら及び他のDolby Digital符号化パラメータは上記A/52文書に詳説される。表記された大抵のドルビーオーディオコーダパラメータはDolby Digital及びDolby E符号化システムに共通であり、従って、A/52文書に説明され、Dolby E符号化システムに独特なものは少ない(例えば、Back利得コード“backgain”及びBack減退コード“backleak”)。Backgain及びbackleakに関するさらなる情報は以下に与えられる。
【0061】
図7に示される表の第1欄には4つの範疇のパラメータがアドレスされる。即ち、マスキングモデル及びビット割当て、チャンネル間結合、一時的ノイズ形成フィルタ係数及び時間・周波数変換ウィンドの4つがある。同様に、図8に示される表の第1欄には2つの範疇のパラメータがアドレスされる。即ち、フレーム型及び移動制御である。表記されたMPEGオーディオ及びビデオコーダパラメータについてのさらなる情報は、上記引用されたISO/IEC文書、MPEG−2AAC資料及び他の出版されたMPEG文書に記載される。本発明の各面はDolby及びMPEG知覚符号化システムに適用し得るのみならず、他の知覚符号化システムにも適用され、そこではエンコーダ及び又はデコーダのパラメータが変調される。他の知覚コーダの例は上記参照されたBrandenburg及びBosiによる機関紙記事(J. Audio Eng. Soc., 1997)で論じられる。
【0062】
知覚聴取モデルパラメータ変調
Dolby Digital及びDolby Eのような知覚オーディオ符号化システムでは、知覚聴取モデル又はマスキングモデルを表し、またビット割当てプロセスに用いられるパラメータがある。特に、あるパラメータはスペクトル的に人の耳のマスキングカーブを模する。即ち、周波数に関して険しく減退する下向きマスキングカーブ、周波数に関して険しく減退する上向きマスキングカーブ及び周波数に関して徐々に減退する上向きマスキングカーブがある。これらは概略的に図9に示される。スペクトルマスキングは周波数領域概念であるが、これらのマスキングパラメータに関する標準名称は時間領域用語(例えば、「おそい」「速い」)を用いる。
【0063】
図9に関して、スペクトルマスキングモデルに対応する符号化パラメータ要素は、マスキング信号に関してそれらのレベル及び傾斜(それぞれ、利得及びリーク)によって以下のように限定される。即ち、
下向きマスキングカーブ:backgain/backleak
上向きマスキングカーブ(速い):fastgain/fastleak
上向きマスキングカーブ(おそい):slowgain/slowleak
backgain及びbackleakはDolby E 符号化で特定されているが、Dolby Digital符号化で特定されているパラメータとは異なることに注目せよ。Dolby Digitalでは、上記参照したA/52文書に記載されるように、fastgainパラメータは速い利得コード(fgaincod,cplfgaincod及びlfegaincod)、fastleakパラメータは速い減退コード(fdcycod及びcplfleak)、slowgainパラメータはおそい利得コード(sgaincod)、slowleakはおそい遅延コード(sdycod及びclpsleak)である。
【0064】
上記限定されたパラメータの各々は、知覚符号化中ウォーターマークを伝えるための変調に適している。それらの任意の1つの変調はスペクトルマスキングモデルを僅かに変化させ、従ってビット割当てプロセスに影響を与える。従って、ウォーターマークを強くするようにマスキングパラメータは主入力信号としっかり結合される。図10は、変調され得るスペクトルマスキングモデルのパラメータを例示する。
【0065】
Dolby Digital及び Dolby E符号化システムのある他のパラメータは、総合的信号対ノイズ比(SNR)を制御する。Dolby DigitalではこれらのパラメータはSNR相殺パラメータである。即ち、cnsroffst,fsnrofst,cplfsnroffst及びlfesnroffstである。SNRパラメータは、信号及び量子化ノイズ間に所望の最低レベルの信号対ノイズヘッドルーム(上方空間)を維持するために存在する。これらのパラメータは、全スペクトルに一様に作用し、マスキング信号に関するスペクトルの一部分のみに主として影響を与えるスペクトルマスキングモデルパラメータとは異なる。
【0066】
さらに他のパラメータは、臨界帯域を基礎として、「帯域化されたSNR」又はデルタビット割当てと呼ばれる、微細SNR調節手段として作動する:即ち、Dolby Digital符号化におけるdeltba及びcpldeltbaである。
【0067】
図11A〜11C及び12A〜12Cは、知覚符号化システムのマスキング閾値(図11AのSNR相殺の変調及び図12Aの高速利得コードの変調)を変調する実例と、符号化システムがビット強制された場合(それぞれ、図11B及び12B)に結果的に生じる変調効果及び符号化システムがビット強制されてない場合(それぞれ、図11C及び12C)に結果的に生じる変調効果とを与える。図11Dは図11A〜11C及び図12A〜12Cで用いられる凡例を識別する。ビット強制は、同一長さを有する符号化されたブロックを生じさせるためにコーダが制限されている時に起こり、これは多くの伝送チャンネルの要件である。コーダが、ブロックからブロックへのビット数を変化させ得るならば、信号を表すのに用いられるビット数への有効な強制はない。図示されるように(図11B及び12B)、ビット強制されたコーダでは、全周波数において復号された信号の量子化器エラーはマスキング閾値と正確に適合しない。即ち、例は、必要以上のビットが存在し(閾値と復号された信号間の間隙)、いくつかの周波数においてマスキング閾値及び原量子化器エラー間の正のマージンに帰着することを例示する。デフォルトパラメータ値に関して、意図されたウォーターマークシンボルは“0”のビット値であり得る。変調されたパラメータに関して、意図されたシンボルは、この例におけるように“1”のビット値であり得る。図11A及び12Aは、変調前後のマスキング閾値を示す。図11B、11C、12B及び12Cは結果的に生じる復号された信号を示す。変調されたマスキング閾値は、変調され、復号された信号スペクトルと比較するために図11・12B及び11C・12Cにおいて重ねられている。図11Dは、図11A〜C及び12A〜Cで用いられる凡例を示す。
【0068】
非マスキングパラメータ変調
図13及び14は、ドルビーコーダのマスキングパラメータ以外の変調パラメータから結果的に生じる信号特性の実例を与える。同図の各々において信号特性は、デフォルトパラメータ値及び変調されたパラメータ値を用いて例示される。図13には結合パラメータを変調する効果が示される。水平軸上に示される適時の各ブロックにつき、左及び右と示された2つのチャンネルが例示される。使用中の結合フラッグが“0”ならば、各チャンネルは独立的に扱われる。使用中の結合フラッグが“1”ならば、2つのチャンネルは、cplbegfパラメータによって示される、ある周波数より上方で単一結合チャンネルに結合される。使用中の結合フラッグに加えて、同様に図13に示される、結合開始周波数も変調され得る。
【0069】
図14には、位相フラッグを変調する効果が例示される。位相フラッグが“0”と等しいならば、位相は変調されないが、位相フラッグが“1”と等しいならば、信号の位相は180度変えられる。
【0070】
TDACウィンドパラメータ変調
既に述べたように、知覚エンコーダは知覚的に冗長な情報を除くことによって入力信号のデータレートを低減させる。これらのシステムは、入力信号を1つ又はそれ以上の成分に分解することによって開始し、次いで量子化された成分が復号された後、原資料及び符号化された資料間の差が知覚不能にされる(又は許容可能な知覚可能性のレベルが達成される)ようにするために、知覚分析を用いてこれらの成分の各々がどれ位の精度を要するかを決定する。そのようなシステムの一例は、時間領域エイリアシング相殺(TDAC)変換を用いて一時的サンプルを周波数に基礎づけられた表現に変換する変換コーダである。完全な再構成を保証するために、変換に先立って重複ウィンドを用いて時間領域サンプルが処理される。変換後、次いでデータレートが低減される方法で周波数サンプルが量子化されかつ符号化されると共に復号に際して知覚的に無意味になるようにされる。デコーダにおける逆変換後完全な再構成を維持するために、時間領域サンプルは、エンコーダで用いられたものと適合するパラメータを用いてウィンド、重複及び加算される。概して、符号化及び復号ウィンドに対する各ウィンドパラメータは、順方向及び逆方向TDAC変換中にそれらが用いられる時、エイリアシングが最小化又は除去されるように選択される。TDAC変換を用いる変換符号化に関する詳細は、Princen and Bardleyによる「時間領域エイリアシング相殺に基づく分析・合成フィルタバンク設計」(IEEE Tran. On Acoustics, Speech, and Signal Processing, Vol. ASSP−34, No. 5, October 1986, pp. 1153−1161)及びPrincen他による「時間領域エイリアシング相殺に基づくフィルタバンク設計を用いたサブバンド・変換符号化」(Proceedings: ICASSP 87, 1978, Intl. Conf. On Acoustics, Speech, and Signal Proceedings, April, 1987, Dakkas, pp. 2161−2164)に記載されている。
【0071】
ウォーターマークは、変換された信号の構成又は再構成で用いられる時間領域変換のパラメータを変調することによって適用される。例えば、符号化及び復号中に用いられる時間領域ウィンドの傾斜又はアルファ(α)間の不適合は、臨界的にサンプリングされた変換を用いる場合時間領域エイリアシングに帰着する。このエイリアシングは、時間および周波数領域の双方において独特のノイズ又は歪みに帰着する。従って、エンコーダ又はデコーダのウィンドパラメータは、エンコーダ出力で検出可能なウォーターマークを伝えるために変調され得る。この意味での歪みは、符号化された原信号間の差として限定され、可聴人工品に帰着し得るか又は帰着し得ない。望ましい実施実施形態では時間領域ウィンドのアルファ(傾斜)値が変調される。知覚されないが原始信号に関連するか又はそれによって隠されているノイズ又は歪みを導入することによって、知覚され得る障害を生じることなく結果的に生じるウォーターマークを除去又は観察することは極端に困難になる。
【0072】
ウォーターマークを伝えるために変更され得る時間領域ウィンドの別のパラメータはウィンドそれ自体の型である。例えば、Kaiser−Bessel限定されたウィンドは“0”の ウォーターマークビットを埋め込むのに用いられ、一方Hanningウィンドは“1”の ウォーターマークビットを埋め込むのに用いられ得る。変調されたウィンド変更はエンコーダ又はデコーダで行われ得る。
【0073】
さらに、検出可能性を改良しかつ知覚可能性を最小化するためにウィンドパラメータは、信号特性に依存して時間適応的に変調され得る。例えば、転移(過渡)信号はウォーターマーク信号を隠し得る、従って心理音響的一時マスキング効果を利用するためにウォーターマーク信号の位置を再配置させるように、これらの信号を検出して当該ウィンドを変調し得ることは有利である。さらに、変調の強さ、従って、符号化された信号におけるウォーターマーク信号の強さは、原始信号特性に依存して適応的に変更され得る。ウィンドパラメータが不適合である量は、追加された歪みの強さに直接影響を与える。従って、入力信号の心理音響的マスキング特性は分析されると共に、信号コンテントによってそれが最大限に遮蔽されるようにウォーターマークシンボルに対する不適合の量を変えるようウォーターマーク埋め込みプロセスに信号で知らせるのに用いられ得る。
【0074】
直接形順方向TDAC変換方程式は下式で与えられる。即ち、
【数1】
Figure 2004506947
【0075】
ここでn=サンプル番号
k=周波数ビン番号
x(n)=入力PCMシーケンス
w(n)=ウィンド周波数
X(k)=出力変換係数シーケンス
N=変換サンプル総数
n0=変換サンプル総数の半分
Kaiser−Bessel 限定(KBD)ウィンドは下式で与えられる。即ち、
【数2】
Figure 2004506947
【0076】
ここでWKBは、下式で限定される、Kaiser Bessel Kernelウィンド関数である。
【0077】
【数3】
Figure 2004506947
【0078】
I0は、下式で限定される0次ベッセル(Bessel)関数である。
【0079】
【数4】
Figure 2004506947
【0080】
図15は、長さ256の5つの重複するエンコーダウィンドを例示する。ウォーターマークは、ウィンド番号5に対してα=4値を用いることによって符号化位相に挿入される。ウィンド4及び6は、α=3の各ウィンド及びα=4の一ウィンドの列間の平滑な転移を与えるためにα=3及びα=4の組合せを用いるハイブリッドウィンドであることに注目すべきである。同図では、各デコーダウィンドは全ての変換につきα=3のウィンドを用いる。この各ウィンド型の不適合が、結果的に生じる出力信号に時間領域エイリアシング人口品(物)を導入する。復号されたオーディオ内に導入された時間領域エイリアシングの量は、エンコーダα値(α=4)及びデコーダα値(α=3)間の差が増加するにつれて増加し、エンコーダウィンド番号5によって処理されたオーディオ区分においてのみ存在する。α変更のこの方法は、ウォーターマークされた信号を伝えるためにデコーダが変更されることを要せずかつ信号の分配源におけるウォーターマーキングに関して有用である。
【0081】
図16は、長さ256の5つの重複するウィンドを再び例示するが、この例では、復号プロセス間に逆TDAC変換ウィンドによってαウィンド値が変更される。再び、時間領域エイリアシングが起こり、ウォーターマーク信号を復号された信号内に射出する。しかし、この例では、埋め込まれる信号はデコーダにおいて射出され、ウォーターマーク情報が特定の最終使用者又は装置に対して導入されることを可能にする。このα変更はデコーダで連続化された情報を信号データに埋め込むことを可能にする。
【0082】
ウォーターマークを用いる場合より短い変換ウィンドを用いるのが有利であり得る。それは各ウィンドがエイリアシング歪みの継続時間を低減させると共にそれらが概して転移状態(オーディオ符号化においた)間に用いられるからである。転移信号に対する一時的マスキング特性は、「正しい」値からより大幅に異なるα値を用いるのに利用することが可能であり、それによってより強いウォーターマークを生じさせ得る。
【0083】
TDACウィンド変調検出器
TDACウィンドのα値を変更することによって、符号化された信号に関連する時間領域エイリアシング信号が導入される。このエイリアシングは、スペクトルノイズ又は符号化された信号のスペクトル成分の歪みの導入として測定され得る。
【0084】
可能な一検出方法では、図4及び5の方法のように、原始資料及びウォーターマークされたデータ間の差を比較し得る。この方法は、ウォーターマーク変更されたウィンドが用いられたスペクトル歪みに対する差信号を精査するであろう。スペクトル歪みが閾値を超えるならば、これは、データのウォーターマークされた部分につき「1」シンボルとして示される。閾値未満のスペクトル歪みは「0」シンボルとして検出されるであろう。
【0085】
この方法は、ウォーターマークされた信号を遮蔽するために導入され得る広帯域ノイズに対して敏感であろう。他の検出方法は、ウォーターマークされた信号のスペクトルピークを追跡し、ウォーターマーキング用途の時間領域エイリアシングによって導入されるスペクトルピークの前後の双方で周波数ビン(入れもの)の振幅変調を探すことである。以下に述べる一般的スペクトル歪み方法と同様に、この検出方法は、優勢なスペクトル成分を取囲む周波数ビンを閾値と比較するであろう。しかし、この閾値は原始信号のスペクトル成分の強さに関連づけられるであろう。閾値下方のスペクトルサイドローブ(側突出部)は「0」シンボルとして判断され、上方のスペクトルサイドローブは「1」シンボルとして判断されるであろう。
【0086】
TNSフィルタ係数変調
一時的ノイズ整形は、知覚符号化におけるプリエコー人工品の防止を助長し得る符号化技術である。それは、Jurgen Herre及び James Johnstonによる「一時的整形(TNS)による知覚オーディオコーダの性能向上」(101st AES(Audio Engineering Society) Convention Preprint 4384, November 8−11, 1996)に記載されている。周波数領域での予測符号化は、時間領域における量子化ノイズを整形するのに用いられる。予測は、時間領域において量子化ノイズがどこに配置されるかを制御するのを助長する。オーディオ符号化の場合には、プリエコーを避けるのを助長するためにノイズは時間領域マスキング信号の振幅包絡線以内に強制される。プリエコーは、転移状態間に起こる人工品であり、用いられた周波数変換が、出力信号の転移前に量子化ノイズが起こるのを防止するのに十分な時間分解能を持たない場合に発生する。
【0087】
一時的ノイズ整形(TNS)はMPEG−2AAC知覚符号化システムの特性であるが、Dolby Digitalのような他のシステムにも用いられ、従って、そんな他のシステムのパラメータを変調するさらなる方法を与える。
【0088】
本発明のこの面によると、1つ又はそれ以上のTNSフィルタパラメータが変調される。特に、TNSノイズ整形フィルタ順序及びTNSノイズ整形フィルタ形状は、以下にさらに述べるように変調されうる。
【0089】
TNSプロセスは以下の段階を含む。即ち、
1.時間対周波数変換を用いることによって信号をスペクトル係数に分解し、
2.ウィンド化された自動相関マトリックスを形成し、再帰(帰納)を用いることによって標準線形予測器を作動させ、
3.予測利得がある閾値を超えるならば、ノイズ整形フィルがスペクトル係数に用いられることである。
【0090】
本発明は、TNS処理間に用いられるノイズ整形フィルタに頼る。スペクトル領域フィルタは、任意の数の異なった一時的応答においてノイズを整形するように変更され得る。スペクトル領域濾波を介してこの一時的包絡線のいくつかのパラメータを変えることによってウォーターマークが信号内に埋め込まれ得る。言い換えると、ノイズ整形フィルタをスペクトル又は周波数領域において変調し、それによって時間領域における量子化ノイズを変化させる。
【0091】
時間に対して音圧レベル(SPL)をプロットする典型的な一時的包絡線応答が図17に例示される。
【0092】
一時的マスキングモデルは、いくつかの知覚コーダで用いられるスペクトルマスキングモデルに極めて類似する。特に、スペクトルマスキング用の下向き及び上向き包絡線は、逆方向及び順方向一時的マスキング包絡線に類似する。本発明の面により変調され得るTNSパラメータをより特定的に識別するために、一時的ノイズ整形プロセスの作用(操作)の一部をさらに詳細に検討することは有用である。時間対周波数変換を用いて信号をスペクトル係数に分解した後、予測利得がある閾値を超えるかどうかを決定すると共に信号の包絡線を得るために、スペクトルデータにつき線形予測符号化(LPC)計算がなされる。予測係数は次いで以下の各ブロックに対する各TNSフィルタにつき計算される。即ち、
h=Rxx−1rxx
ここで
rxxT={Rxx(i,j)};Rxx(i,j)=AutoCort(|i−j|);i,j=1,2,....,N
rxx’=rxx*win
ここでRxxはNxN自動相関平方マトリックス、NはTNS予測順序(オーダ)、hはベクトル最適化予測係数である。これらの方程式は、最少予測誤差場予測に用いられた全データに直角であるとの直交性原理に基づく。
【0093】
初期時点において、自動相関マトリックスは下式により計算される。即ち、
【数5】
Figure 2004506947
【0094】
【数6】
Figure 2004506947
【0095】
ここで
SAMP =信号サンプリングレート
TimeResolution(時間分解能)変数は、ビットレート及びチャンネル数に依存する。同様に、変換ブロック長さはtransformResolution(変換分解能)変数を限定する。
【0096】
ノイズ整形フィルタの最適順序は、反射係数を係数列の終端からある閾値下方に移動させることによって決定される。ウォーターマークを伝えるために変調され得る一パラメータは、ノイズ整形フィルタ順序である。例えば、1つの意味のウォーターマークビットは最適フィルタ順序によって表され、他の意味のウォーターマークビットは非最適フィルタ順序によって表され得る(より低いか又はより高く)。ウォーターマークを伝えるために変更され得る他のパラメータは、ノイズ整形フィルタそれ自体の形状である。例えば、1つの意味のウォーターマークビットは、LPC計算によって決められる最適係数を用いることによって示され、一方他の意味のウォーターマークビットは、係数を変更することによって、従って、ノイズ整形フィルタの形状によって示され得る。
【0097】
TNSパラメータ(フィルタ順序又はフィルタ係数)を変調することによって、それが復号された出力信号において検出され得るように、ノイズは入力信号の一時的包絡線内で変調される。図18は、一時的マスキング包絡線の一例及び同包絡線内で量子化器エラーが変調され得る可変性の一例を示す。丁度いい時点にある各ブロックでウォーターマークを伝えるためにTNSパラメータが変調され得る。
【0098】
本発明の実際的実施形態は、非常に強いウォーターマーキング解決策を与え得る。TNSプロセスによって加えられるノイズが原始信号の包絡線にしっかり結合されるので、原信号を劣化させることなくウォーターマークを除去することは非常に困難である。
【0099】
本発明に記載されるウォーターマークの透明性は、以下に記載される型の適応的歪みプロセスを用いることによって制御され得る。この場合には、TNSを用いて信号の一時的包絡線が一度変更されてしまうと、その結果が一時的マスキング閾値の一時的又はスペクトル表現と相互作用的に比較される。閾値が超えられると、一時的マスキングパラメータに調節がなされ、ウォーターマークされた信号の強さ及び知覚可能性間の所望のバランス(釣合い)を保証するために当該プロセスが反復される。
【0100】
図18に示されるマスキング特性は該信号のサブバンドに加えられ得る。これはウォーターマークを埋め込むために潜在的により多くの位置に沿ったウォーターマークの層形成を可能にする。
【0101】
変調帯域幅
オーディオ信号の帯域幅を低減させることは、それが約16kHzの最低レベルを超えて残る限り、本質的な品質の最少劣化を生じさせる。同様に実験によって帯域幅が動的に変えられると、それが最低レベルを超えて残る限り、最少の劣化が示されている。帯域幅が、エンコーダ又はデコーダ内の補足又はウォーターマーク信号により変調されるならば、同信号は復号されたオーディオから導出され得る。例えば、一ビットコードは、16kHzの帯域幅が“0”シンボルを表し、20kHzの帯域幅が“1”を示すところでオーディオ信号内に埋め込まれ得る。これは、より高い埋め込まれた信号データレートを生じる多重ビットシンボルを表す多重振幅に拡張され得る。図19は、4つの帯域幅を用いる2ビットシンボルを例示する。この戦略は、強くない、聴取不能なウォーターマークが必要とされるところで用いられ得る。聴取不能規準は、上記のように達成され得る。この戦略は強くない、それはウォーターマークが、復号されたオーディオ信号を低域・通過濾波することによって容易に除去され得るからである。
【0102】
図20は、異なったシンボルを表すために同信号の帯域幅を用いる、埋め込まれた信号を含むオーディオ信号の一例を示す。
【0103】
上記の帯域幅ウォーターマーキングに伴う一問題は、それが最少帯域幅を超えた信号コンテントの存在に依存することである。当該時間の大部分につき最少帯域幅を超えた信号コンテントは存在しない。一定の埋め込まれた信号データレートは、高周波信号コンテントなしでは達成され得ない。例えば、オーディオ信号コンテントが1kHzにおける単一正弦波からなるらば、この信号に埋め込まれたデータを送信する唯一の可能な方法は、帯域幅を1kHz未満に低減させることであろう。これは明らかに聴取可能でありかつ原信号を破壊するであろう。
【0104】
一定のウォーターマーク埋め込みレートを与え得る方法は、オーディオ信号が高周波エネルギーを含むことを保証することである。これを達成させる一方法は、聴取者がそれを知覚しないようにオーディオ信号の上部信号にノイズを付加することである。付加されたノイズが人の聴取閾値未満又はそれと等しいならば、それは知覚不能である。このノイズの付加で、埋め込まれた信号は、一定のデータレートを与える信号送信機構としてオーディオ帯域幅を用いることができる。このノイズは、信号送信信号帯域内に加えられることのみを必要とすることに注目せよ。この信号送信帯域幅は、ウォーターマークを配置するのに用いられる、最低周波数及び最高周波数間の帯域幅として限定される。信号送信帯域はより小さい区分に分割されることが可能で、ウォーターマークを生じさせるためにそこでは3つ以上の帯域幅が用いられる。
【0105】
図21は、聴取閾値の近似レベルへの整形されたノイズの付加を例示する。それは単一の正弦波のみからなる信号に加えられかつ信号送信帯域においてのみ付加される。信号送信帯域幅内へのノイズの付加は、聴取閾値のみによって制限されるべきではなく、エネルギーがそれを超えるならば、それは多分聴取可能であろう。ノイズの振幅を聴取閾値未満に調節することによって信号送信の別の次元(要素)が付加され得る。例えば、信号送信帯域の区域におけるエネルギーが唯1つのエネルギー状態を含みかつ半分のエネルギー状態を加えることによってエネルギー状態を含まないならば、付加データは隠されるか又は挿入される。 この振幅信号送信は、埋め込まれた信号のデータレートを増加させるであろう。
【0106】
いくつかの信号コンテントが丁度上部帯域幅未満であることが保証される限り、同信号は検出可能である。信号送信帯域幅以内において追加された信号が各チャンネル内で類似していることは重要である。多くの場合において、これらの信号は電気的又は音響的に混ぜられ、それらが互いに相殺しないことは重要である。同位相正弦波が多重チャンネルに加えられて信号送信のために用いられるならば、音響的に加算されるとそれらは位置に依存して相殺するであろう。これはウォーターマークの信頼性を低減させる。独立した無作為ノイズを用いることは、混ぜられる時それが相殺しないのでよりよい解決方法である。
【0107】
信号コンテントは信号送信帯域内で起こり、かつ一定の埋め込みレートを保証するために整形されたノイズが加えられるので、2つの信号が加えられ、時々信号送信帯域内のエネルギーを増加させる。このエネルギー可変性は、検出プロセスをより困難にさせる。本発明のこの面の望ましい実施形態では、信号送信帯域内のあらゆる原信号相互作用を除去するために、整形されたノイズの追加に先立って低域濾波フィルタが原始信号に用いられる。
【0108】
Dolby Digitalアルゴリズム又は符号化プロセスにおいては、たとえ上部周波数帯域内のコンテントが無意味と決定されても、整形された無作為ノイズをパワースペクトルに加えるためにデコーダが用いられ得るビットストリーム内に粗いパワースペクトルが送信される。これが、ビットストリーム内のディザフラッグが使用可能にされるとき作動されるデコーダの特徴である。デコーダ内で加えられたノイズは、たとえデコーダがそれを知覚的に無意味と判定していても、復号されたオーディオ内にウォーターマークを再現する。該ウォーターマークは、符号化又は復号のいずれかのプロセス間に挿入され得る。
【0109】
Dolby Digitalオーディオコーダは、2つの帯域幅パラメータ(図21の表の上方に列記されたchbwcod及びcplendfコード)の1つにより帯域幅内の諸変化を発生させ得る。これは、ウォーターマークを実行する有効な方法を作り出す。しかし、復号された信号に検出し得る変化を発生させるためにこれらのコードを変調することは、埋め込まれた信号データレートにいくつかの限定を与える。即ち、
1.信号をダウンミキシングすることで埋め込まれたデータを破壊しないように全てのチャンネルが同一帯域幅を含むべきである。これは、埋め込まれたデータレートをモノラルチャンネルの等価物に限定する。
【0110】
2.最適音質のために、帯域幅コードはフレーム当たり一度だけ送られるべきであり、それが埋め込まれたデータレートをシンボル深さ及び符号化されたサンプルレートに限定する。帯域幅コードがフレーム当たり一回を超えて変化されるならば、符号化されたオーディオの総合音質は低下されるであろう。
【0111】
3.利用可能なシンボル数は、最少帯域幅のを超える利用可能な帯域幅コードの数に限定される。
【0112】
例えば、48kHzでデータを埋め込むためにコーダが2つの異なった帯域幅状態を用いるならば、埋め込まれたデータレートは約31.25bps(毎秒31.25フレーム、各々が1ビットの情報を含む)である。48kHzで4つの帯域幅状態を用いるならば、データレートは62.5bspである。これ等の数字は、各Dolby Digitalフレームがフレーム当たり1536の独特のオーディオサンプルを含むことから得られる。フレーム当たり2048の独特のオーディオサンプルを含む、他のコーダが用いられるならば、データレートは、1ビットコードにつき約23.5bspになるであろう。
【0113】
Dolby Digitalコーダは、各オーディオフレームでエンコーダビットストリームのパワースペクトル密度の近似値を送る。それはオーディオスペクトルに有意な変化がある時点毎に更新される。パワースペクトル密度情報は、周波数で線形に隔置される指数として送られる。Dolby Digitalデコーダでは、信号情報は重要と見なされなかったので、量子化された情報を受信しなかったスペクトルの全ての部分にディザが加えられる。本質的に無作為ノイズであるディザは、指数のレベルに関して定率決定される。これはスペクトルのその部分に信号エネルギーを加える。信号送信帯域幅の各指数が聴取閾値未満又はそれと同一に整形されるならば、ディザは信号エネルギーを保証する。
【0114】
以下の段階は、Dolby Digital符号化された信号以内の信号送信帯域内にはエネルギーがあることを保証する現方法を略述する。
【0115】
1.聴取閾値又はそれ以下になるように整形されべき最少信号送帯域幅を超えて無作為ノイズが加えられる。これは最少エネルギーが聴取閾値の形状に従うようにさせる。
【0116】
2.ノイズ追加後計算される指数はこの最少エネルギーを捕捉する。
【0117】
3.デコーダは、たとえ最少信号送信帯域幅以上に割当てられているビットがなくても、ディザが通常加えられるので、送信される指数からスペクトルエネルギーを再現する。これは、埋め込まれた信号送信につき信号コンテントを保証する。
【0118】
上記の2つの技術(帯域幅変更及びディザ)は、低複雑性、固定ビットレートウォーターマークをDolby Digital内に統合するために用いられ得る。本システムは、ダウンミキシング、ダイナミックレンジ制御、ボリューム標準化、マトリックス環境復号等を含む、エンコーダ・デコーダ系の「通常使用」に対して強い。
【0119】
従って、本発明のこの面の実施形態は以下の段階を含む。即ち、
1.隠されたデータ信号を埋め込むために帯域幅を調節する。
【0120】
2.隠されたデータ信号を埋め込む帯域幅を調節するためにDolby Digital符号化・復号システムの帯域幅コードを用いる。
【0121】
3.一定レートでデータを埋め込むために信号コンテントが用いられることを保証するために信号送信帯域にノイズを加える。
【0122】
4.加えられたノイズの聴取可能な知覚を防止するためにこの追加されたノイズが人の聴取閾値未満又はそれと等しくなるように調節する。
【0123】
5.埋めこまれた信号のデータレートを増加させるために信号送信の別の次元を加えるこの追加されたノイズの振幅を調節する。
【0124】
6.信号送信帯域以内の信号コンテントを保証するための整形されたノイズとDolby Digitalコーダとの統合。
【0125】
ウォーターマーク検出器は、再生されたオーディオ信号以内に含まれる埋めこまれた情報を判断(解明)する。それが電気的かつ音響的の双方で情報を引き出せることが望ましいが、この能力は全ての用途につき必要としなくてもよい。音響的処理後ウォーターマークを引き出すことは、部屋ノイズの付加、スピーカ及びマイク特性及び総合的再生音量のためにより困難な挑戦と考えられる。
【0126】
検出器の目標は、オーディオの帯域幅を見出すために所与の信号送信帯域以内にエネルギーがあるかどうかを決定することである。これは、フーリエ変換、信号送信帯域を分析する帯域濾波フィルタのグループ等、によって計算され得る音声(オーディオ)の分解を要する。各信号送信帯域のエネルギーはこの信号分解から得ることができる。検出器は、埋めこまれたシンボルを決定するためにこのエネルギー情報を用い得る。
【0127】
可能な一検出方法では、符号化されたシンボルを決定するために各信号送信帯域における固定された閾値比較を用いる。この閾値は最低ノイズの丁度上のエネルギーレベルに設定され得る。このレベルを超えるものはすべて信号レベルを含むと考えられるであろう。図22は、2ビットシンボルを作り出す4つの異なった帯域幅を検出するのに要する3つの異なったエネルギーレベルを示す。検出閾値を越えるあらゆるエネルギーは「高」と見なされ、それ未満のものはすべて「低」とみなされる。
【0128】
この固定閾値は、システムの最低ノイズが常に既知でありかつピーク信号レベルが決して飽和しない閉じた環境においてのみ十分に作動する。例えば、上記図において任意のノイズが該最低ノイズに加えられると、第3のエネルギーレベルが「高」とみなされ、正しくないシンボルが判断されるであろう。
【0129】
閾値計算前にエネルギーレベルが等価化されるか又は正規化されるならば、固定閾値を用いることが可能である。これを達成する一技術は、エネルギーレベルがが決定される前にAGCアルゴリズム又はプロセスを信号送信帯域に用いることである。「低」及び「高」レベルがより一貫性を持つようにこれらのレベルがAGCによって正規化される。レベル正規化のためにこの場合には固定閾値が用いられ得る。
【0130】
ノイズレベル及び信号エネルギーが常に変化する環境に対しては適応閾値が最良と考えられる。適応閾値を用いる可能な一検出方法は、現状態に対する閾値を計算するために先のエネルギー状態を用いる。所与のエネルギー帯域に対する有限数の先行状態においては、それぞれ「高」及び「低」状態の幾つかのエネルギーレベルが存在すべきであることを前提としてこの検出器は作動する。 最大エネルギー及び最小エネルギーがそれぞれ「高」及び「低」と見なされ得る。これらの「高」及び「低」状態は2つの異なったグループと見なされ得る。閾値は、これら2つの群間のどこかにあると決定され得る。
【0131】
前記有限セットにおいて「高」及び「低」状態の数がひとしいと仮定されるならば、最大半分が「高」に属し、同時に最小半分が「低」に属する。各グループにつき平均エネルギーレベル又は平均が見出されるならば、これら2つの平均値の平均として簡単な閾値が計算され得る。平均及び分散のような各グループ統計をさらに考慮した2つのグループ及び閾値に対する異なった貢献度を仮定することによって、これは容易により複雑になり得る。
【0132】
「高」及び「低」グループへの分離を改良する他の考察もあり得る。3つ以上の帯域幅が埋め込みプロセスに含まれるならば、信号送信帯域のエネルギーレベルは相互に依存する。最高の帯域幅が「オン」ならば、各信号送信帯域内のすべてのエネルギーレベルが「高」として検出されるべきである。2番目の最高帯域幅が「オン」ならば、この帯域幅より低いすべての信号送信レベルが「高」として検出されるべきでである。これは各信号送信帯域につきエネルギーレベルの分配を変える。
【0133】
例えば、ウォーターマークエンコーダは4つの異なった帯域幅を用いて2ビットシンボルを発生していると想定する。A、B、C及びDが帯域幅を表わし、ここではAが最低帯域幅であり、Dは最高帯域幅である。これらの帯域幅を決定するためには3つの異なったエネルギーバンドが必要とされる。これらの3つのエネルギーバンドが、それぞれ帯域幅A−B、B−C及びC−Dで表わされる、1、2及び3によって表わされるとしよう。以下の表は、シンボルが一様に分配されるならば、各エネルギーバンドが「高」状態になる確率を列記する。
【0134】
【表1】
Figure 2004506947
【0135】
各エネルギーバンドの帯域幅への依存のために確率は等しくない。例えば、エネルギーバンド1の信号コンテントの確率は、B、C及びDシンボルの発生確率の和である。各シンボルは1/4の発生確率を持つ;従って、エネルギーバンド1の信号コンテントの確率は3/4である。
【0136】
各エネルギーバンドにつき現閾値を計算するために先の40状態が用いられるならば、最高30状態がエネルギーバンド1以内の信号コンテントを与えると想定される。残りの10サンプルは信号コンテントを表わさないであろう。この場合の現閾値は、これらの2グループ間の平均値の平均を取ることによって決定される。
【0137】
シンボル分配が実質的に一様であることを保証するためにチャンネル符号化の付加はこの検出器によって肝要である。エンコーダが、延長された期間に亘り丁度最高であった帯域幅シンボルを入力したならば、この検出器は埋め込まれたデータを復号するのが困難であろう。シンボル分配が想定された確率により接近すればするほど、埋め込まれたデータの検出はより正確になる。
【0138】
1つの可能なチャンネル符号化方法は、有限期間を通じて各シンボルが一回のみ起こることを保証することである。例えば、4つの異なった帯域幅コードがあれば、各シンボルは4シンボルのグループ内で一回起こることを要する。これは4つの帯域幅コードのグループである24の独特のシンボルを発生させる。24(4連乗積)は4帯域幅コードの順列の最大数である。A、B、C及びDが4つの帯域幅コードを表わすならば、シンボルは、ABCD、BACD、ABDC、BADC、BCAD等に見えるであろう。これが埋め込まれたデータレートを低減させることに注目せよ。
【0139】
従って、本発明のこの面によるウォーターマーク検出器は以下を含む。即ち、
1.先の状態を調査することによって計算される適応閾値を用いる埋め込まれた信号検出器。先の状態はエネルギーレベルに基づいてグループに分割される。閾値は、できる限りグループを分断せんと試みる各グループの統計に基づく。
【0140】
2.多重グループが関連するならば、グループ内の要素の数が帯域幅調節からの依存性に基づいて調節される。
【0141】
3.シンボルの分配が有限時間に亘って一様に近いことを保証するチャンネルコーダ。これはウォーターマーク検出器が適切に機能することを保証する。
【0142】
パラメータ変調適応歪み制御強さの制御
本発明の一目標は、最大化された検出可能性及び最少化された知覚可能性を有するウォーターマークを埋め込むことである。知覚コーダは、入力信号の冗長性をどのように低減させるかを決定するために知覚可能性の閾値を用いる。この同一閾値が、検出可能であるが同時に実質的に知覚されずに留まるようにウォーターマーク信号を調節するために用いられ得る。
【0143】
既に述べたように、幾つかの知覚エンコーダでは、正しい情報が放棄されることを保証するために歪み測定がレート制御と対をなすようにされる。歪み測定値は、原入力信号を符号化された信号(レート制御の出力)と比較する。歪み測定は、レート制御プロセスの成果を変えるようにいくつかの符号化パラメータを制御するのに有用であり得る。これは、以下に述べる、外側ループがひずみ測定値を含み、内側ループがレート制御手段である、入れ子式ループ構造を作り出し得る。符号化パラメータに対する変更は、いくつかの基準が満たされる迄歪み測定を調査することによって双方向的になされる。同じ接近手段が、レートループを移動することによって、可変データレートエンコーダに用いられ得る。
【0144】
本発明の一面による知覚可能性閾値を用いてウォーターマークを埋め込むプロセスは図24〜26に示される。このプロセスは、2つの入れ子式ループを用いて最適量子化が決定されるMPEG−2AAC知覚コーダで限定されたものと同様である。図24に示される内側繰返しループは、スペクトルデータが多数の利用可能なビット(レート制御)で符号化され得るまで量子化器ステップサイズを変更する。図25に示される外側繰返しループは、心理音響モデルの要求が可能な限り(歪み制御)満たされるように、すべてのスペクトルバンドのスペクトル係数を増幅する。図25のプロセスは、心理音響モデル又は知覚閾値を可能な限り満たすために知覚符号化パラメータ(図26に示される)を変調すると同時に、同様にウォーターマーク信号を埋め込むことによって変更される。図6、7及び8の表に列記されたパラメータの全てが、このように変調され得るが、いくつかのパラメータは他のものよりビット割当てプロセス中変化するのがより困難である。
【0145】
図24のレート制御プロセスは、当該信号を情報のより少ない固定量によって表わすことを試みる。入力信号は知覚閾値(段階20)により量子化され、量子化の結果として用いられるビットがカウント(段階22)される。用いられるビット数が利用可能ビット数を越えないならば、そこでプロセスが終了(段階24)される。その代わりに、繰返しプロセスは、用いられるビット数が利用可能ビット数に可能な限り適合するまで続く。これは通常、量子化器ステップサイズ変更を介して、十分な情報が放棄(段階26)されしまうまで知覚閾値を調節することによって達成される。
【0146】
図25に示される歪み測定プロセスは、レート制御符号化プロセスの単純化の幾つかが容易に知覚されるエラーを引き起こさなかったことを保証するために量子化器ステップサイズプロセスに追加され得る。歪み測定はそんなエラーを最少化させるために符号化パラメータの微細同調を可能にする。当該プロセスの第1段階では、レート強制(段階28)により入力信号を量子化するようにレートループ、即ち、内側ループが作動される。次いで、どれくらい歪みが存在するか(段階30)を計算して知覚閾値(段階32)に関して当該歪みが許容可能かどうかを決定する歪み評価がなされる。歪みが許容できないならば、スペクトル係数が増幅され(段階34)てプロセスが繰り返される。歪みが許容できるならば、量子化の結果が入力信号に加えられて(段階36)プロセスが完了される。この意味では、「歪み」は符号化された信号及び原信号間の差であり、聴取可能な人工品(物)に帰着し得るか又は帰着し得ない。
【0147】
本発明の各面では、図26に示される歪み測定プロセスは、符号化パラメータ値が変調された場合にその省略値から変化され得るが、それでもなお知覚閾値の限界内に止まる量を決定するために用いられる。これはウォーターマークの可能な検出を最大化させる。それはむしろ、知覚閾値によって強制されて、歪みが知覚されることなく可能な限り大きな歪を生じさせるからである。レート制御(段階28)、歪み制御(段階32)及び符号化パラメータ調節(段階38)の各段階は許容可能な妥協がなされるまで繰り返される。
【0148】
Dolby Digitalのような、ある符号化システムは符号化中レート制御プロセスを用いるが歪み制御は用いない。それ故に、そんな符号化システムが本発明のこの面を用いるために、歪み測定が加えられる。MPEG−2AACのような他のコーダは、符合化の目的で歪み制御プロセスが既に統合化され、僅かな変更で本発明のこの面により同様にウォーターマークを付けるために用いられ得る。可変レート符号化システムではレートループは不要であり、従ってパラメータ変調プロセスに最適解決手段を与えると同時に複雑性をも低減させることに注目すべきである。
【0149】
図27は、今説明した型の歪み測定プロセスを用いて本発明によりウォーターマークがどのように埋め込まれ得るかを例示する。望ましくは、目標は変調されたパラメータの効果を強制することによって、可能な限り知覚閾値に近くなるように、強さを最大化させることにあり、それがパス2の量子化エラーの変化として例示される。第1パスでは、知覚閾値が計算される。第2パスでは量子化器エラーが示される。量子化器エラーを知覚不能に変更させる入手可能なマージンがいくつかあることに注目せよ。パス3では、選ばれたウォーターマーク符号化パラメータ、この例ではデルタビット割当てパラメータ(即ち、デルタ又はcpldeltbaパラメータであり、それは臨界帯域以内で量子化器エラーに影響を与える)が調節されてしまっていて変更された量子化器に帰着する。量子化器エラーはなおさらに変更されることが可能であり、それでもまだ知覚不能のままである。符号化パラメータの変調は、利用可能な多数のビットが影響を受けるので、全スペクトルに亘って僅かに異なった量子化エラーに帰着することに注目せよ。これは符号化パラメータの変調及びいくつかのバンドにおける結果的に生じる量子化分解能が、パラメータが変調されるバンドのみならず全スペクトルのエラーを惹き起こすことを例示する。パス4では、符号化パラメータの変調度合いが再びパス3からの情報を用いて調節されてしまっており、かつ結果的に生じる量子化器エラーは知覚閾値に可能な限り近くなる。量子化器エラーを知覚閾値に近づけるが、それより下方にもたらすことは望ましいが、量子化器に影響を与える1つ又はそれ以上のパラメータを変調する場合、本発明は同様に量子化器エラーが、例えば図27のパス3に対するように、知覚閾値より下であるがそれに近くないように1つ又はそれ以上のパラメータの変調も考えている。
【0150】
図28は、選ばれたウォーターマーク符号化パラメータが総合SNR相殺型パラメータ(即ち、csnroffst,fsnroffst,cplfsnroffst又はlfesfsnroffstパラメータ)ウォーターマーク埋め込みプロセスを例示する。この例では、総合SNR相殺パラメータの変調は知覚閾値に正確に適合するものに帰着することに注目せよ。これは、パラメータのSNR相殺型が周波数スペクトル全体に亘る知覚閾値の一様な相殺だからである。従って、SNR相殺型パラメータを用いて量子化器エラーを知覚閾値に適合させるプロセスは、唯一段階を要するに過ぎない。
【0151】
本発明のこの面のさらなる局面は、使用者がウォーターマークの可能な「利得」又はエネルギーを制御する知覚閾値の相殺を制御することを可能にする。これは知覚閾値に対する線形相殺か又は特定のバンドにおいてより多くの歪みを可能にするより複雑な機能であり得る。これは知覚閾値曲線を固定した量だけ上げることによって達成され得る。さらに、視覚閾値を変更することによって、使用者はウォーターマーク符号化マージンが負である限りウォーターマークを埋め込み得る。
【0152】
Dolby Digital、Dolby E及びMPEG−2 AACコーダのような知覚コーダでは、量子化又はビット割当てプロセスは、当該コーダに用いられ得るビットの数及び総合的な信号対ノイズ比に基づいて計算される。次に、知覚閾値が量子化エラーと比較される。歪み(知覚閾値及び量子化エラー間の差)が完成要件を満たさないならば、選ばれた符号化パラメータ変調が歪みに基づいて変更されて歪みが許容され得るまでプロセスが繰り返される。
【0153】
本発明のこの面の望ましい実施形態では、ひずみは知覚閾値の基礎を形成するバンド化された係数のグループ(即ち、臨界バンドによってグループ化される)から計算される。同様に知覚閾値は、増大された複雑さを犠牲にして個々のスペクトル係数の量子化エラーに基づかされ得る。
【0154】
一度閾値が確立されると、本発明のこの面の歪み制御部分が始まる。試験中の符号化パラメータは、後続する歪みプロセスの繰り返しにより変調される。符号化パラメータの変調は、レート制御プロセスで行われるスペクトルバンドのビット割当ての結果に影響を与える。結果的に生じるビット割当ての閾値が原知覚閾値と比較され、完成要件が満たされるまで符号化パラメータが繰り返し変調される。完成要件が満たされないならば、変調されたパラメータを用いてマスキング閾値が変調される。
【0155】
本発明のこの面の望ましい実施形態では、知覚閾値及びマスキング閾値があらゆる興味のある所与のバンドにつき同等でありかつマスキング閾値の各バンドが知覚閾値を超えないならば、適応歪みプロセスの終結が起こり得る。知覚及びマスキングの各閾値が決して収束しないならば、マスキング閾値が知覚閾値を超えない限りさらなる終結論理が用いられ得る。終結要件は、複雑性を強制するために存在する。
【0156】
デコーダパラメータ変調
図29は、知覚オーディオデコーダのパラメータが変調される本発明の一面を示す。この例では、デコーダはハイブリッドビット割当て(即ち、知覚モデルがエンコーダからデコーダへ伝えられる)を用いる。受信された知覚復号されたビットストリーム40は、デコーダで符号化パラメータ42(ビット割当てモデルを表す)及び再フォーマット化されたデータ44(即ち、量子化されたデータ)に分離される。ビット割当て46及び逆量子化48が行われる。次の段階50で決定がなされる(知覚閾値は計算されたか?)。まだ計算されてないならば(即ち、始めてループを通る)、符号化されたビットストリームからの信号に基づいて知覚閾値が計算される(段階52)。知覚閾値が存在するならば(即ち、始めてループ通過後)、逆量子化された信号及び閾値間で比較がなされる(段階54)。次に、段階56で決定がなされる(許容可能な歪み?)結果的に生じる歪みが許容され得る(即ち、予め限定された終結要件を満たす)ならば、次いでプロセスが完了されてスペクトル係数がデコーダの他のファンクションに出力される。歪みが許容されないならば、変調中の符号化パラメータが調節されて(段階58)、ビット割当て、逆量子化及び知覚閾値比較のプロセスが繰り返される。符号化パラメータがウォーターマークシンボル(即ち、補足情報)入力に基づいて初期変調され、その後知覚閾値比較に基づいて調節される。
【0157】
順方向・適応ビット割当て(即ち、知覚モデルがエンコーダで作り出されて明示的にデコーダにおくられる)を用いる知覚オーディオデコーダシステムでは類似のプロセスが用いられ得る。信号データは、送信された知覚モデルを用いて再フォーマット化される。この知覚モデルは、次いでウォーターマークを埋め込むためにパラメータによって変更され得る。オーディオのウォーターマークされたバージョンはマークされてない信号と比較される。歪み測定が特定されて予め限定された完了要件を満たさないならば、変更されたパラメータ変調値を用いて信号が再公式化される。
【0158】
ウォーターマーク及び又は決定論的シーケンス応答制御パラメータ変調
本発明の他の各面では、1つ又はそれ以上のパラメータの変調が、補足情報又はウォーターマーク信号又はシーケンスによって間接的に制御される。例えば、ウォーターマークによる変調の制御は、例えば、決定論的シーケンス及び又は符号化システムに加えられた入力信号のような指令セットを含む、1つ又はそれ以上の他の各信号又は各データシーケンスの機能によって変更される。図30は、本発明のこの面を示す機能的構成図である。図2の基礎的装置におけるように、主情報が知覚デコーダファンクション4によって受信されるデジタルビットストリームを発生させる知覚エンコーダファンクション2に加えられる。本発明のこの面では、補足情報はパラメータ制御ファンクション62に加えられる。パラメータ制御器ファンクション62は、同様に主情報又は1つ又はそれ以上の決定論的シーケンス又は主情報又は1つ又はそれ以上の決定論的シーケンスの双方を受信する。パラメータ制御器62は、二次的情報でエンコーダファンクション又はデコーダファンクションパラメータが変調される方法を変更する。それは、次に記載されるように、各々が主情報のファンクション及び又は1つ又はそれ以上の決定論的シーケンスのいずれかを有する1つ又はそれ以上の二次的情報を変更することによってそれを行う。パラメータ制御器ファンクションからの変更された補足情報がエンコーダファンクション又はデコーダファンクションのいずれか又はその双方に加えられ得るので、点線が補足情報からエンコーダファンクション及びデコーダファンクションへそれぞれ示される。図2装置の場合のように、知覚デコーダファンクションの出力は埋め込まれた補足情報を有する主情報である。補足情報はデコーダファンクション出力で検出され得る。
【0159】
変更された補足情報がエンコーダファンクション2及びデコーダファンクション4の双方でパラメータ変調を制御するならば、概して、一方に加えられた情報は他方に加えられたものと異なるであろう。例えば、当該1つ又はそれ以上のエンコーダファンクションパラメータを制御する補足情報は、オーディオ又はビデオコンテントの所有者を識別するウォーターマークを表すかも知れず、また1つ又はそれ以上のデコーダファンクションパラメータを制御する補足情報は、オーディオ又はビデオコンテントを1つ又はそれ以上の消費者に提示する装置を識別する通し番号であるかも知れない。
【0160】
パラメータ制御器62が、補足情報によって1つ又はそれ以上のパラメータが変調される方法を変更するために決定論的シーケンスを用いるならば、デコーダファンクション出力における補足情報又はウォーターマークの検出は、発生器方程式及び検出器ファンクションによって知られるべき決定論的シーケンスのキーを必要とする。発生器方程式は一般的に知られ、検出器(一般的にではなく)によって先に知られ、又は安全なチャンネルを介して検出器に通知され得る。同様にキーは一般的に知られ、検出器(一般的にではなく)によって先に知られ、又は安全なチャンネルを介して検出器に通知され得る。システムが安全なためには、キーが一般的に開示されないことが唯一の要件である。
【0161】
パラメータ制御器62が、補足情報によって1つ又はそれ以上のパラメータが変調される方法を変更するために入力信号を用いる場合には、デコーダファンクション出力における補足情報又はウォーターマークの検出は、検出器ファンクションによって知られるべき原始信号(例えば、パラメータ制御器が応答するようにプログラムされる原始信号の特性)又は少なくともいくつかの原始信号についての情報を必要とする。これは、原始信号又は、望ましくは、パラメータ制御器が応答するようにプログラムされる原始信号の特性を検出器ファンクションに伝達することによってなされ得る。原始信号の関連する特性が伝達されるよりはむしろ、原始信号及びデコーダファンクション出力の分析に基づいて検出器ファンクションが独立的に関連特性を得ることが可能である。しかし、当該特性は量子化器エラーを持たない原始信号に基づいてもともと決定されるので、エラーが起こり得る。
【0162】
ウォーターマークシンボル転移レートを変更する決定論的シーケンス応答パラメータ変調制御
本発明のこの面の一変形は、決定的シーケンスによってパラメータ変調状態転移のレートを制御し、従って、ウォーターマークシンボル転移のレートを制御することを含む。特に、決定論的シーケンスに応答して、パラメータ変調状態の持続時間を変化させ、従って、ウォーターマークシンボルレートの持続時間を変化させることを含む。ウォーターマークシンボル転移が一定レートで埋め込まれるならば、ウォーターマークシンボルパターン内の反復的シーケンスは知覚され得る。パラメータ変調状態の持続時間、従って、シンボルの持続時間を変調することによって、反復効果は最小にされ得る。表1は、パラメータ変調状態の持続時間、従って、ウォーターマークシンボルの持続時間が決定論的シーケンスに依存する例を示し、従って、変更されたシーケンスとして示されるパターンに帰着する。この特殊の例では、決定論的シーケンス値が「1」ならばウォーターマークシーケンスは反復される。該DS(決定論シーケンス)が「0」の値を持つならば、ウォーターマークシーケンスは反復されない。従って、検出中同期が可能になるように適切にリセットする有限のシーケンスが用いられるべきである。
【0163】
【表2】
Figure 2004506947
【0164】
ウォーターマーク埋め込みパラメータ選択
本発明のこの面のさらなる変形によると、決定論的シーケンスではウォーターマークを埋め込むために用いられるパラメータが選択される。概して、ウォーターマークを埋め込むためには、いくつかのパラメータの内任意の1つを用いることが可能である。例えば、一パラメータの変調はある特定の周波数範囲のスペクトル変調に帰着し、別のパラメータの変調は復号された信号帯域幅の低下に帰着し得る。唯1つのパラメータが変調されるならば、結果的に生じるウォーターマークは、スペクトルエネルギー変調に鋭い感性を持つ人にはよりよく知覚され得る。他方、一方のパラメータ変調及び他方のパラメータ変調間で切り替える埋め込み技術が用いられるならば、結果的に生じるウォーターマークはより知覚されにくいであろう。ウォーターマーク埋め込みパラメータ数が増加するにつれて、この効果は一層明らかにされる(ウォーターマークによって導入される障害はより雑音状になる)。
【0165】
表2は、符号化パラメータが変調のために選択され得る2つの方法を示す。表2の“a”部分に示される第1例では、決定論的シーケンス(DS)に依存してパラメータ1及び2はウォーターマークシーケンス(WS)の値を獲得する。例えば、DS値が“0”ならば、パラメータ1はWS値を反映する状態まで変調され、さもなければ“0”値を反映する状態まで変調される(いずれの状態も、その必要はないが、パラメータのデフォルト値、即ち、省略値でよい)。従って、パラメータ2は、DS値が1ならばWS値を反映する状態まで変調され、さもなければそれは“0”値を反映する状態まで変調される(いずれの状態も、その必要はないが、パラメータのデフォルト値でよい)。パラメータ及びDS双方からのシーケンスは、本例のWSを検出するのに必要とされる。表2の“b”部分に示される第2例では、パラメータ1及び2は、WSそれ自体のみに依存してWS値を反映する状態まで変調される。例えば、パラメータ1はそのデフォルト状態から“0”のWS値を反映する状態まで変調され、パラメータ2はそのデフォルト状態から“1”のWS値を反映する状態まで変調される。このように、双方ともにWSを伝えるので、いずれのパラメータも独立して検出され得る。
【0166】
【表3】
Figure 2004506947
【0167】
変調パラメータの選択が変るレートの変更
本発明のこの面のさらなる変形によると、変調のためのパラメータの選択は決定論的シーケンスに依存して変化し得る。一定レートの埋め込み技術を変えることによって導入される周期的効果が除去されるので、これはウォーターマークの知覚可能性をさらに低減させ得る。この例は表3に例示される。この例では、パラメータ1はWSの逆を反映する状態まで変調され(いずれの状態も、必要ではないが、パラメータのデフォルト値でよい)てDS値が“1”ならばシンボルが反復し、さもなければそれは反復されない。表2の部分bの例におけるように、パラメータは双方共にウォーターマークを伝える。
【0168】
【表4】
Figure 2004506947
【0169】
原始信号特性に応答したパラメータ変調の制御
本発明のこの面の別の変形は、原始信号の特性を分析し、次いでパラメータ変調転移のレート、従って、この分析の結果に基づいてウォーターマークシンボル転移のレートを適応的に制御することを含む。特に、それは原始信号の特性に応答して、パラメータ変調状態の持続時間、従って、ウォーターマークシンボル状態を変えることを含む。例えば、急速に変化する信号状態は、ウォーターマークシンボル転移の知覚可能性を下げるために用いられ得る有用な程度の一時的マスキングを与え得る。時間領域原始信号の振幅が、フレーム1から2(原始信号がフレームを持つデジタル信号ストリームにフォーマットされてしまっていると仮定する)への予め決められた閾値を越えて変化するならば、ウォーターマークシンボルは、フレーム1の一方の値からフレーム2の他方の値へ変ることが可能にされ得る。フレーム3では、原始信号の特性が先のフレームからの閾値を越えて変らないならば、シンボルによって値が変えられることは許され得ない。ウォーターマークシンボル転移を、マスキング事象又は下に横たわる原始信号の「友好的変化」状態と相関させることによって、ウォーターマークの知覚不能性は改良され得る。
【0170】
表4では、原始(起源)限定シーケンス(SDS)が転移検出のような閾値(限界識別)プロセスの出力を表す。この例に関して、“0”のSDS値は転移状態が起こらなかったことを示し、“1”の値は転移がブロック内に存在したことを示す。表4の部分“a”では、SDSが“1”の値を持つならば、WS値が反復される(パラメータの同一変調状態を反復することによって)。SDSが“0”の値を持つならば、ウォーターマークシンボルは反復されない。この例では、単一符号化パラメータがウォーターマークを伝えることが想定される。
【0171】
原始信号分析を用いた変調用パラメータの選択が変るレートの変更
本発明の別の面では、パラメータ変調のレートと対照したものとして、変調のためのパラメータの選択が変るレートを変更するために原始信号の諸特性を利用するように今説明された面が変更される。丁度説明された面におけるように、原始信号が一時的マスキング又は他の「友好的に変化する」状態を与える時に各転移が起こるならそれらの知覚可能性が低くなるということが利点である。この実施形態の一例が表4の部分bに例示される。この例では、パラメータ1がWSの反転(逆)(いずれの状態も、その必要はないが、パラメータのデフォルト値でもよい)を反映する状態まで変調され、SDS値が“1”ならば同シンボルは反復し、さもなければそれは反復されない。パラメータ2がWSのデフォルト値(いずれの状態も、その必要はないが、パラメータのデフォルト値でもよい)を反映する状態まで変調され、SDS値が“1”ならば同シンボルは反復し、さもなければそれは反復されない。表2の部分bの例におけるように、両パラメータ共にウォーターマークを伝える。この接近手段は表3に示されるものと類似するが、ここでは転移レートがSDSによって限定されるということのみで異なる。
【0172】
【表5】
Figure 2004506947
【0173】
原始信号分析を用いたウォーターマーク埋め込みパラメータの選択
本発明の別の面では、変調のために利用可能なパラメータの利用可能なセット内のパラメータ数が原始信号の諸特性に基づいて変更される。特殊のウォーターマーキングシステムは、いくつかの異なったパラメータ(例えば、スペクトルエネルギー増強、一時的ノイズ挿入、帯域幅低減、等に帰着するパラメータ)の任意のものを変調することによってウォーターマークを埋め込むことができると仮定せよ。原始信号の現特性に依存して、これらのパラメータの全てが復号された信号において知覚不能な変化を生じさせ得るとは限らない。例えば、原始信号が動かないならば、知覚的に遮蔽される周波数範囲内でのスペクトルエネルギー増強よりは、一時的なノイズ挿入の方がより知覚され得る。その結果、現信号特性に対してより知覚可能な結果を起こしそうなものを許さないように利用可能なパラメータセットを縮小させるのが有利であり得る。
【0174】
表5では、先に述べたものと同一の閾値識別プロセス(転移検出)に基づいた信号限定シーケンス(SDS)の一例が示される。“1”のSDS値は、ブロック内に一転移状態が存在することを示し、“0”のSDS値は、転移状態がないことを示す。表5では、パラメータ1及び2は、転移状態が存在しない時(SDS=0)通常ウォーターマークを伝る。即ち、パラメータ1は“0”のWM(ウォーターマーク)値につき“1”の値を反映する変調状態を有し、さもなければ“0”の値を反映する変調状態を有し、またパラメータ2は“1”のWM(ウォーターマーク)値につき“1”の値を反映する変調状態を有し、さもなければ“0”の値を反映する変調状態を有する。転移状態が存在すると(SDS=1)、そこでパラメータ3及び4が変調される。それらのパラメータは、スペクトルひずみを起こさせるパラメータ1及び2の代わりに、一時的歪みを起こすのに最適である。パラメータの数を低減させ、次いで最小のセットからパラメータを選択するために決定論的シーケンスが用いられ、それによってパラメータ間で切り替えると同時に、現原始信号特性を考慮して望ましいパラメータ間から適応的に選択する利点を保有する。
【0175】
【表6】
Figure 2004506947
【0176】
決定論的シーケンス及び原始信号特性に応答するパラメータ変調制御
決定論的シーケンスのみ又は入力信号の特性のみを用いるパラメータ変調制御に加えて、本発明は同様に決定論的シーケンス及び入力信号の特性の双方に応答してパラメータ変調を制御することも意図する。
【0177】
パラメータ変調を制御するためには決定論的シーケンス及び原始信号特性の用法を結合した多数の方法がある。そうすることによって知覚不能性及び又は強さ(頑強性)がさらに改良され得る。そんな一方法では、決定論的シーケンスによって、信号特性の異なった状態に対して符号化パラメータのいずれかのサブセットが選択される。特に、上記表5の例を用いて、転移が存在しない(SDS=0)時には最初の2つのパラメータが変調のために選ばれると共に、これらのパラメータは決定論的シーケンスDSに基づいて選択される。表6はこの方法を例示する。
【0178】
【表7】
Figure 2004506947
【0179】
別の例では、決定論的シーケンスは、信号限定されたシーケンスによって変更されるウォーターマークシーケンスの転移のレートを変更する。表7はこの方法を例示する。第2欄はSDSに基づいて埋め込み技術を変える第1段階を例示し、第3欄はDSに基づいてシーケンスのレートをさらに変える第2段階を例示する。先の例におけるように、SDSが“1”の値を有するならばシーメンス値が繰り返される。SDSが“0”の値を有するならばシーメンス値は繰り返されない。
【0180】
【表8】
Figure 2004506947
【0181】
多数の符号化パラメータが埋めこまれたシーケンスを伝える当該例の各々に関して、同一ウォーターマーキングシーケンスを多数の符号化パラメータに用いることによって攻撃又は処理に対するエラー弾力性を増加させる冗長性を加える可能性も同様に存在する。複雑性がより低い検出を容易にするために、一方のパラメータがエラーを持つならば、検出器は他方の符号化パラメータからのメッセージを回復し得るように、そんな符号化パラメータは強制された関係又は予め決められた階級(階層)を持ち得る。
【0182】
さらに、攻撃者がウォーターマークを伝えているのがどのパラメータなのかを推論するのを困難にするために、決定論的シーケンスは1つ又はそれ以上の他の符号化パラメータを同時に変調するのに用いられ得る。表8に示される例では、パラメータ1はウォーターマークシーケンスを伝え、決定論的シーケンスはパラメータ2また3のいずれがウォーターマークシーケンスに基づいて変わるかを特定する。この場合パラメータ2及び3はウォーターマークを伝えないがおとりとして作動する。この例では、おとりパラメータは、DSの適切な状態に関してWSと等しく、さもなければ“0”である。
【0183】
【表9】
Figure 2004506947
【0184】
結論
本発明の他の変形物及び変更物並びにその各種の面の実施は当業者にとって明らかであり、また本発明は記載されたこれらの特定の実施形態によって限定されないことは理解されるべきである。従って、本明細書に開示されかつ請求された基本的原則の真の主旨及び範囲内に入るあらゆる変更、変形又は同等物は本発明に含まれると見なされる。
【0185】
本発明及びその各種の面は、デジタル信号プロセッサ、プログラムされた多目的デジタルコンピュータ及び又は特殊用途デジタルコンピュータで実行されるソフトウエアファンクションとして実施され得る。アナログ及びデジタル信号ストリーム間のインタフェースは、適切なハードウエア及び又はソフトウエア及び又はファームウエアのファンクションとして実行され得る。
【図面の簡単な説明】
【図1】
図1は理想化されたプロットである。同図はマスキング信号がない場合に音が丁度聞こえる(聴取閾値)音圧レベル(実線)及び500Hz正弦波の存在下における聴取閾値(点線)を示す。
【図2】
図2は本発明の基本原理を例示する機能的構成図である。同図では知覚符号化システム内の知覚エンコーダ機能及び又は知覚デコーダ機能の1つ又はそれ以上のパラメータが補足情報によって変調される。
【図3】
図3Aは、符号化システムの出力を受信する補足情報検出器を含む、本発明の一面を例示する機能的構成図である。図3Bは、図3Aの補足情報検出器の検出機能のさらなる詳細を含む、本発明の一面を例示する機能的構成図である。
【図4】
図4は、符号化システムの出力及び符号化システムへの入力の双方を受信する補足情報検出器機能を含む、本発明の一面を例示する機能的構成図である。
【図5】
図5は本発明の一面を例示する機能的構成図である。同図では、補足情報検出器機能は比較器機能のみならず、知覚エンコーダ機能及び知覚でコーダ機能をも含み、そのいずれもがそのパラメータを変調させていない。
【図6】
図6A及び6Bは、ハイブリッド順方向・逆方向適応型のいくつかの知覚オーディオコーダにおける変調に適したパラメータを示す表である。
【図7】
図7は、順方向適応型のいくつかの知覚オーディオコーダにおける変調に適したパラメータを示す表である。
【図8】
図8は、いくつかの知覚ビデオコーダにおける変調に適したパラメータを示す表である。
【図9】
図9は、いくつかの知覚オーディオコーダにおける人の耳のマスキングカーブをスペクトル的にモデル化するいくつかのパラメータ表す構成図である。
【図10】
図10は、一種の知覚オーディオコーダにおける変調され得るスペクトルマスキングモデルパラメータを表す構成図である。
【図11】
図11Aは、いくつかの知覚オーディオコーダにおける正弦波信号の存在下でのSNR相殺パラメータ(マスキング閾値パラメータ)の変調を示す理想化された表現である。図11Bは、ビット強制された符号化システムの場合に関して、SNR相殺パラメータが図11Aに示される方法で変調される場合に知覚デコーダの出力における効果を示す理想化された表現である。図11Cは、ビット強制されていない符号化システムの場合に関して、SNR相殺パラメータが図11Aに示される方法で変調される場合、知覚デコーダの出力における効果を示す理想化された表現である。図11Dは、図11A−Cで用いられた凡例を示す。
【図12】
図12Aは、ある知覚オーディオコーダにおいて正弦波信号の存在下における高速利得コードパラメータの変調を示す理想化された表現である。図12Bは、ビット強制された符号化システムの場合に関して、高速利得コードパラメータが図12Aに示される方法で変調される場合、知覚デコーダの出力における効果を示す理想化された表現である。図12Cは、ビット強制されていない符号化システムの場合に関して、高速利得コードパラメータが図12Aに示される方法で変調される場合、知覚デコーダの出力における効果を示す理想化された表現である。
【図13】
図13は、ある知覚オーディオコーダにおいて、ある知覚オーディオコーダにおけるマスキングパラメータ以外の変調パラメータ、即ち、「使用中結合」フラッグ、使用中再マトリックシングフラッグ及び結合開始周波数コードの効果を示す理想化された表現である。
【図14】
図14は、ある知覚オーディオコーダにおいて、マスキングパラメータ以外のパラメータを変調する効果、即ち、位相フラッグ、を示す理想化された表現である。
【図15】
図15は、符号化中に補足情報を埋め込むための時間領域エィリアスウィンド形状を示す一連の理想的波形である。
【図16】
図16は、復号化中に補足情報を埋め込むための時間領域エィリアスウィンド形状を示す一連の理想的波形である。
【図17】
図17は、マスキング信号の一時的マスキング効果を例示する音圧レベル(SPL)対時間をプロットする、理想化された一時的包絡線応答である。
【図18】
図18は、効果が一時的マスキング包絡線内に強制されるように、信号に加えられ得る変調の種類を示す理想化された表現である。
【図19】
図19は、2ビットシンボルが4つの異なった帯域幅によってどのように表され得るかを例示する、一連の理想化された振幅対周波数のプロットである。
【図20】
図20は、異なったシンボルを表すために信号の帯域幅を用いて、埋め込まれた信号を含むオーディオ信号の一例を示す理想化された周波数対時間プロットである。
【図21】
図21は、正弦波信号の存在下で人の聴取閾値の近似レベルに適合されたノイズの付加を例示する理想化された振幅対周波数プロットである。
【図22】
図22は、2ビットシンボルを作る4つの異なった振幅を検出するのに要する3つの異なったエネルギーレベルを示す、理想化されたエネルギー対周波数プロットである。
【図23】
図23は、「高」及び「低」状態の分布を例示するいくつかのヒストグラムの理想化された振幅対エネルギープロットである。
【図24】
図24は、知覚可能性の閾値を用いてウォーターマークを埋め込むプロセスの内側反復ループ部分を示す論理流れ図である。
【図25】
図25は、知覚可能性の閾値を用いてウォーターマークを埋め込むプロセスの外側反復ループを示す論理流れ図であり、同図では外側ループスペクトル係数が増幅される。
【図26】
図26は、心理音響的モデル又は知覚閾値を、可能な限り満たすために図25のプロセスの変更を示すと同時に、また補足情報又はウォーターマーク信号を埋め込む論理流れ図である。
【図27】
図27は、臨界帯域内で量子化器エラーに作用するパラメータを変調する場合に関して、歪み測定プロセスを用いてウォーターマークがどのようにして埋め込まれるかを例示する、
周波数スペクトルに亘って知覚閾値、量子化器エラー及び変更された量子化器エラーを描写する一連の理想化された波形を示す。
【図28】
図28は、周波数スペクトル全体に亘って信号対ノイズ比相殺に作用するパラメータを変調する場合に関して、歪み測定プロセスを用いてウォーターマークがどのようにして埋め込まれるかを例示する、周波数スペクトルに亘って知覚閾値、量子化器エラー及び変更された量子化器エラーを描写する一連の理想化された波形を示す。
【図29】
本発明の面により、復号中にウォーターマークを埋め込むプロセスの各段階を例示する論理流れ図である。
【図30】
図30は、本発明の他の面を示す機能的構成図である。同図では、ウォーターマークの補足情報による変調の制御が1つ又はそれ以上の他の信号又は、例えば、符号化システムに加えられた決定論的シーケンス及び又は入力信号などのデータシーケンスの作用によって変更される。

Claims (20)

  1. 補足情報がデコーダ機能の出力で検出され得るように、該補足情報による知覚符号化システムのエンコーダ、デコーダ機能の操作を変更する方法であって、
    前記補足情報に応答して前記エンコーダ、デコーダ機能の1つ又はそれ以上のパラメータを変調することから成るエンコーダ、デコーダ機能変更方法。
  2. 前記知覚コーダが、ハイブリッド順方向・逆方向ビット割当てを用いる種類のオーディオコーダである、請求項1の方法。
  3. 前記1つ又はそれ以上のパラメータが、マスキングモデル及びビット割当て、チャンネル間結合、周波数帯域幅、ディザ制御、位相関係及び時間・周波数変換ウインドの1つ又はそれ以上の範疇内に入る1つ又はそれ以上のパラメータを含む、請求項2の方法。
  4. 前記知覚コーダが順方向ビット割当てを用いる種類のオーディオコーダである、請求項1の方法。
  5. 前記1つ又はそれ以上のパラメータは、マスキングモデル及びビット割当て、チャンネル間結合、一時的ノイズ整形フィルタ係数及び時間・周波数変換ウインドの1つ又はそれ以上の範疇内に入る、請求項4の方法。
  6. 前記知覚コーダがビデオコーダであり、前記1つ又はそれ以上のパラメータが、フレーム種類及び移動制御の1つ又はそれ以上の範疇に入る1つ又はそれ以上のパラメータを含む、請求項1の方法。
  7. 前記1つ又はそれ以上のパラメータが、符号化された出力信号において、信号対雑音比、量子化器ノイズ、チャンネル間時間関係、周波数帯域幅、整形されたノイズ、チャンネル間位相関係及び廣スペクトル、時間エイリアシングノイズの1つ又はそれ以上に影響を与える該パラメータから選択される、請求項1の方法。
  8. 前記1つ又はそれ以上のパラメータが、2価値を有するパラメータの2価値間で該パラメータを変化させるか、該パラメータをそのデフォルト値と、1つ又はそれ以上の他の値間で変化させるか、又は該パラメータをそのデフォルト値以外の値間で変化させるかのいずれか1つを行うことによって変調される、請求項1の方法。
  9. 前記1つ又はそれ以上のパラメータ変調度が制御される、請求項1の方法。
  10. 前記1つ又はそれ以上のパラメータの変調度が、前記1つ又はそれ以上のパラメータの変調の結果生じる復号された出力信号の人工品の知覚性を限定するように制御される、請求項9の方法。
  11. 1つ又はそれ以上の変調特性、即ち、変調用の1つ又はそれ以上のパラメータ選択、パラメータ選択のレート及びパラメータ状態転移のレートが、補足情報に応答して、1つ又はそれ以上の他の信号又はシーケンスとして決定されるように、パラメータの変調が補足情報により間接的に制御される、請求項1の方法。
  12. 前記1つ又はそれ以上の他の信号又はシーケンスは、指令セット及び符号化システムのエンコーダへの入力信号特性の一方又は双方を含む、請求項11の方法。
  13. 前記指令セットは決定論的シーケンスを含む、請求項12の方法。
  14. 前記決定論的シーケンスが疑似乱数シーケンスである、請求項13の方法。
  15. 前記1つ又はそれ以上のパラメータが前記エンコーダ機能で変調される、請求項1の方法。
  16. 前記1つ又はそれ以上のパラメータが前記デコーダ機能で変調される、請求項1の方法。
  17. 前記1つ又はそれ以上のパラメータが前記エンコーダ機能及びデコーダ機能で変調される、請求項1の方法。
  18. 補足情報による知覚符号化システムの該エンコーダ、デコーダの操作を変更すると共に請求項1による該デコーダの出力の該補足情報を検出する方法であって、
    該デコーダ機能の該出力の該補足情報を検出することをさらに含む方法。
  19. 該デコーダ機能の出力における該補足情報を検出する機構は、符号化された信号を観察すること、符号化された信号と、該エンコーダ機能へ加えられた信号とを対比すること及び該復号された信号と、該エンコーダ機能又はデコーダ機能には補足情報に応答して変調されるパラメータが無い、実質的に同一の知覚符号化システムから符号化された信号とを比較することの1つによって達成される、請求項18の方法。
  20. 該復号された信号を観察する該動作は、該復号された信号をそれ自体の時間遅延されたバージョンと比較することを含む、請求項19の方法。
JP2002520567A 2000-08-16 2001-08-15 補足情報に応答するオーディオ又はビデオ知覚符号化システムのパラメータ変調 Pending JP2004506947A (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US22604400P 2000-08-16 2000-08-16
US22615100P 2000-08-16 2000-08-16
US25596700P 2000-12-15 2000-12-15
US25600000P 2000-12-15 2000-12-15
US25615700P 2000-12-15 2000-12-15
US25607800P 2000-12-15 2000-12-15
US25596500P 2000-12-15 2000-12-15
US25596400P 2000-12-15 2000-12-15
PCT/US2001/025473 WO2002015587A2 (en) 2000-08-16 2001-08-15 Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information

Publications (2)

Publication Number Publication Date
JP2004506947A true JP2004506947A (ja) 2004-03-04
JP2004506947A5 JP2004506947A5 (ja) 2008-10-02

Family

ID=27575224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002520567A Pending JP2004506947A (ja) 2000-08-16 2001-08-15 補足情報に応答するオーディオ又はビデオ知覚符号化システムのパラメータ変調

Country Status (12)

Country Link
US (1) US7395211B2 (ja)
EP (1) EP1310099B1 (ja)
JP (1) JP2004506947A (ja)
KR (1) KR100898879B1 (ja)
CN (1) CN100431355C (ja)
AT (1) ATE308858T1 (ja)
AU (2) AU2001284910B2 (ja)
BR (1) BRPI0113271B1 (ja)
CA (1) CA2418722C (ja)
DE (1) DE60114638T2 (ja)
HK (1) HK1080243B (ja)
WO (1) WO2002015587A2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007007666A1 (ja) * 2005-07-11 2007-01-18 Ntt Docomo, Inc. データ埋込装置、データ埋込方法、データ抽出装置、及び、データ抽出方法
WO2007029412A1 (ja) * 2005-09-01 2007-03-15 Matsushita Electric Industrial Co., Ltd. マルチチャンネル音響信号処理装置
JP2008009104A (ja) * 2006-06-29 2008-01-17 Dainippon Printing Co Ltd 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
JP2008536193A (ja) * 2005-04-13 2008-09-04 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 音声メタデータ確認
JP2009537033A (ja) * 2006-05-12 2009-10-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 情報信号符号化
JP2011521290A (ja) * 2008-05-22 2011-07-21 華為技術有限公司 フレーム損失隠蔽の方法及び装置
JP2014090443A (ja) * 2013-11-29 2014-05-15 Yamaha Corp 識別情報重畳装置

Families Citing this family (106)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8306811B2 (en) * 1996-08-30 2012-11-06 Digimarc Corporation Embedding data in audio and detecting embedded data in audio
US6735561B1 (en) * 2000-03-29 2004-05-11 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US7099830B1 (en) 2000-03-29 2006-08-29 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
DE10046575B4 (de) * 2000-09-20 2005-03-10 Siemens Ag Verfahren zur Frequenzakquisition, insbesondere zur Initialfrequenzakquisition, einer mobilen Kommunikationseinrichtung
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
DE10129239C1 (de) * 2001-06-18 2002-10-31 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
JP2005502920A (ja) * 2001-09-05 2005-01-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Dsd信号のための堅牢なウォーターマーク
US20030131350A1 (en) 2002-01-08 2003-07-10 Peiffer John C. Method and apparatus for identifying a digital audio signal
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
AU2003207883A1 (en) * 2002-03-28 2003-10-13 Koninklijke Philips Electronics N.V. Window shaping functions for watermarking of multimedia signals
FR2840147B1 (fr) * 2002-05-24 2004-08-27 France Telecom Procedes de brouillage et de debrouillage de signal video, systeme, decodeur, serveur de diffusion, support de donnees pour la mise en oeuvre de ces procedes
GB2390502A (en) 2002-07-04 2004-01-07 Sony Uk Ltd Watermarking material using a bandwidth adapted codeword
US7239981B2 (en) * 2002-07-26 2007-07-03 Arbitron Inc. Systems and methods for gathering audience measurement data
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
KR100477699B1 (ko) * 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
CN1748246A (zh) * 2003-02-07 2006-03-15 皇家飞利浦电子股份有限公司 信号处理
US7167209B2 (en) * 2003-02-07 2007-01-23 Warner Bros. Entertainment, Inc. Methods for encoding data in an analog video signal such that it survives resolution conversion
US7460684B2 (en) 2003-06-13 2008-12-02 Nielsen Media Research, Inc. Method and apparatus for embedding watermarks
CN1810034A (zh) * 2003-06-19 2006-07-26 皇家飞利浦电子股份有限公司 增加具有极少频率分量的媒体信号中附加数据的可检测性
KR20050026641A (ko) * 2003-09-09 2005-03-15 삼성전자주식회사 오디오 신호에 가라오케 정보를 삽입하기 위한 방법,삽입된 가라오케 정보의 재생 방법, 및 그 장치와 이를구현하기 위한 프로그램이 기록된 기록 매체
SG120118A1 (en) * 2003-09-15 2006-03-28 St Microelectronics Asia A device and process for encoding audio data
KR20050028193A (ko) * 2003-09-17 2005-03-22 삼성전자주식회사 오디오 신호에 적응적으로 부가 정보를 삽입하기 위한방법, 오디오 신호에 삽입된 부가 정보의 재생 방법, 및그 장치와 이를 구현하기 위한 프로그램이 기록된 기록 매체
KR101079066B1 (ko) 2004-03-01 2011-11-02 돌비 레버러토리즈 라이쎈싱 코오포레이션 멀티채널 오디오 코딩
JP4230953B2 (ja) * 2004-03-31 2009-02-25 株式会社ケンウッド ベースバンド信号生成装置、ベースバンド信号生成方法及びプログラム
CA2562137C (en) * 2004-04-07 2012-11-27 Nielsen Media Research, Inc. Data insertion apparatus and methods for use with compressed audio/video data
US7451093B2 (en) * 2004-04-29 2008-11-11 Srs Labs, Inc. Systems and methods of remotely enabling sound enhancement techniques
DE102004021403A1 (de) 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
DE102004021404B4 (de) * 2004-04-30 2007-05-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Wasserzeicheneinbettung
KR101087588B1 (ko) 2004-07-02 2011-11-29 닐슨 미디어 리서치 인코퍼레이티드 압축 디지털 비트스트림을 믹싱하는 방법 및 장치
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
EP1792306B1 (en) * 2004-09-17 2013-03-13 Koninklijke Philips Electronics N.V. Combined audio coding minimizing perceptual distortion
US7668715B1 (en) * 2004-11-30 2010-02-23 Cirrus Logic, Inc. Methods for selecting an initial quantization step size in audio encoders and systems using the same
KR101251426B1 (ko) 2005-06-03 2013-04-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
JP2006337851A (ja) * 2005-06-03 2006-12-14 Sony Corp 音声信号分離装置及び方法
KR100695158B1 (ko) * 2005-08-03 2007-03-14 삼성전자주식회사 영상 부호화장치 및 방법과 그 복호화장치 및 방법
GB2431839B (en) * 2005-10-28 2010-05-19 Sony Uk Ltd Audio processing
US7949131B2 (en) * 2005-12-19 2011-05-24 Sigmatel, Inc. Digital security system
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
FR2898458B1 (fr) * 2006-03-10 2008-05-16 Medialive Procede pour la distribution securisee de sequences audiovisuelles, decodeur et systeme pour la mise en oeuvre de ce procede
CN102684628B (zh) 2006-04-27 2014-11-26 杜比实验室特许公司 修正音频动态处理器的参数的方法以及执行该方法的设备
US7940833B2 (en) * 2006-06-21 2011-05-10 Telefonaktiebolaget Lm Ericsson (Publ) Transmitter with intelligent preconditioning of amplifier signal
KR101393298B1 (ko) * 2006-07-08 2014-05-12 삼성전자주식회사 적응적 부호화/복호화 방법 및 장치
EP2095560B1 (en) 2006-10-11 2015-09-09 The Nielsen Company (US), LLC Methods and apparatus for embedding codes in compressed audio data streams
EP2082527B1 (en) * 2006-10-18 2014-09-24 Destiny Software Productions Inc. Methods for watermarking media data
KR101571573B1 (ko) 2007-09-28 2015-11-24 돌비 레버러토리즈 라이쎈싱 코오포레이션 부가적인 정보 역량을 이용한 멀티미디어 코딩 및 디코딩
US8315398B2 (en) 2007-12-21 2012-11-20 Dts Llc System for adjusting perceived loudness of audio signals
US20090285402A1 (en) * 2008-05-16 2009-11-19 Stuart Owen Goldman Service induced privacy with synchronized noise insertion
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8508357B2 (en) * 2008-11-26 2013-08-13 The Nielsen Company (Us), Llc Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking
US8515239B2 (en) * 2008-12-03 2013-08-20 D-Box Technologies Inc. Method and device for encoding vibro-kinetic data onto an LPCM audio stream over an HDMI link
TWI459375B (zh) * 2009-01-28 2014-11-01 Fraunhofer Ges Forschung 音訊編碼器、音訊解碼器、包含經編碼音訊資訊之數位儲存媒體、用以將音訊信號編碼及解碼之方法及電腦程式
US8626516B2 (en) * 2009-02-09 2014-01-07 Broadcom Corporation Method and system for dynamic range control in an audio processing system
WO2010127268A1 (en) 2009-05-01 2010-11-04 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
RU2557455C2 (ru) * 2009-06-23 2015-07-20 Войсэйдж Корпорейшн Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
FR2948484B1 (fr) * 2009-07-23 2011-07-29 Parrot Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
WO2011013980A2 (en) 2009-07-27 2011-02-03 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
CN101651837B (zh) * 2009-09-10 2011-03-02 北京航空航天大学 一种基于帧间预测误差直方图修改的可逆视频水印方法
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
EP3693963B1 (en) * 2009-10-15 2021-07-21 VoiceAge Corporation Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
US8638851B2 (en) * 2009-12-23 2014-01-28 Apple Inc. Joint bandwidth detection algorithm for real-time communication
EP2524374B1 (en) * 2010-01-13 2018-10-31 Voiceage Corporation Audio decoding with forward time-domain aliasing cancellation using linear-predictive filtering
WO2012026039A1 (ja) * 2010-08-27 2012-03-01 富士通株式会社 電子透かし埋め込み装置、電子透かし埋め込み方法及び電子透かし埋め込み用コンピュータプログラムならびに電子透かし検出装置
JP5724338B2 (ja) * 2010-12-03 2015-05-27 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
PT2485488T (pt) 2011-02-02 2017-06-30 Nagravision Sa Descodificador de média e método de descodificação que permite o seguimento do descodificador de média
RU2648439C2 (ru) 2011-02-15 2018-03-26 Аллерган, Инк. Фармацевтическая композиция в виде крема, содержащая оксиметазолин, для лечения симптомов розацеа
JP5752324B2 (ja) * 2011-07-07 2015-07-22 ニュアンス コミュニケーションズ, インコーポレイテッド 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制
EP2549400A1 (en) * 2011-07-22 2013-01-23 Thomson Licensing Method for protecting an unprotected sound effect program
US8762146B2 (en) * 2011-08-03 2014-06-24 Cisco Technology Inc. Audio watermarking
WO2013032822A2 (en) 2011-08-26 2013-03-07 Dts Llc Audio adjustment system
US8527264B2 (en) * 2012-01-09 2013-09-03 Dolby Laboratories Licensing Corporation Method and system for encoding audio data with adaptive low frequency compensation
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US8909517B2 (en) * 2012-08-03 2014-12-09 Palo Alto Research Center Incorporated Voice-coded in-band data for interactive calls
US9401153B2 (en) * 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
US9305559B2 (en) 2012-10-15 2016-04-05 Digimarc Corporation Audio watermark encoding with reversing polarity and pairwise embedding
US9269363B2 (en) * 2012-11-02 2016-02-23 Dolby Laboratories Licensing Corporation Audio data hiding based on perceptual masking and detection based on code multiplexing
KR101726205B1 (ko) 2012-11-07 2017-04-12 돌비 인터네셔널 에이비 감소된 복잡성 변환기 snr 계산
US9099080B2 (en) 2013-02-06 2015-08-04 Muzak Llc System for targeting location-based communications
ES2634621T3 (es) 2013-02-20 2017-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para generar una señal de audio o imagen codificada o para descodificar una señal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposición múltiple
US9679053B2 (en) 2013-05-20 2017-06-13 The Nielsen Company (Us), Llc Detecting media watermarks in magnetic field data
US20150025894A1 (en) * 2013-07-16 2015-01-22 Electronics And Telecommunications Research Institute Method for encoding and decoding of multi channel audio signal, encoder and decoder
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US9711152B2 (en) 2013-07-31 2017-07-18 The Nielsen Company (Us), Llc Systems apparatus and methods for encoding/decoding persistent universal media codes to encoded audio
US20150039321A1 (en) 2013-07-31 2015-02-05 Arbitron Inc. Apparatus, System and Method for Reading Codes From Digital Audio on a Processing Device
US8768710B1 (en) 2013-12-05 2014-07-01 The Telos Alliance Enhancing a watermark signal extracted from an output signal of a watermarking encoder
US8768005B1 (en) * 2013-12-05 2014-07-01 The Telos Alliance Extracting a watermark signal from an output signal of a watermarking encoder
US8768714B1 (en) 2013-12-05 2014-07-01 The Telos Alliance Monitoring detectability of a watermark message
US8918326B1 (en) 2013-12-05 2014-12-23 The Telos Alliance Feedback and simulation regarding detectability of a watermark message
US9824694B2 (en) 2013-12-05 2017-11-21 Tls Corp. Data carriage in encoded and pre-encoded audio bitstreams
EP2930717A1 (en) * 2014-04-07 2015-10-14 Thomson Licensing Method and apparatus for determining in a 2nd screen device whether the presentation of watermarked audio content received via an acoustic path from a 1st screen device has been stopped
US20160173808A1 (en) * 2014-12-16 2016-06-16 Psyx Research, Inc. System and method for level control at a receiver
US9130685B1 (en) 2015-04-14 2015-09-08 Tls Corp. Optimizing parameters in deployed systems operating in delayed feedback real world environments
US10043527B1 (en) 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
US9454343B1 (en) 2015-07-20 2016-09-27 Tls Corp. Creating spectral wells for inserting watermarks in audio signals
US10115404B2 (en) 2015-07-24 2018-10-30 Tls Corp. Redundancy in watermarking audio signals that have speech-like properties
US9626977B2 (en) 2015-07-24 2017-04-18 Tls Corp. Inserting watermarks into audio signals that have speech-like properties
KR102201604B1 (ko) * 2016-08-04 2021-01-12 후아웨이 테크놀러지 컴퍼니 리미티드 예측 파라미터들에서의 데이터 숨김을 위한 방법 및 장치
WO2019163085A1 (ja) * 2018-02-23 2019-08-29 エヴィクサー株式会社 コンテンツ再生プログラム、コンテンツ再生方法及びコンテンツ再生システム
US11763832B2 (en) * 2019-05-01 2023-09-19 Synaptics Incorporated Audio enhancement through supervised latent variable representation of target speech and noise
US11978461B1 (en) * 2021-08-26 2024-05-07 Alex Radzishevsky Transient audio watermarks resistant to reverberation effects
WO2023212753A1 (en) * 2022-05-02 2023-11-09 Mediatest Research Gmbh A method for embedding or decoding audio payload in audio content
CN115546652B (zh) * 2022-11-29 2023-04-07 城云科技(中国)有限公司 一种多时态目标检测模型及其构建方法、装置及应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10510660A (ja) * 1995-10-04 1998-10-13 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ ディジタル符号化ビデオ及び/又はオーディオ信号のマーキング技術
JPH10303755A (ja) * 1997-04-25 1998-11-13 Nippon Telegr & Teleph Corp <Ntt> 量子化の符号化パラメータを用いる電子すかし作成方法およびその読出し方法
WO1999010837A1 (en) * 1997-08-26 1999-03-04 Digimarc Corporation Method and apparatus for watermarking video images
JPH1198341A (ja) * 1997-09-17 1999-04-09 Pioneer Electron Corp 電子透かし重畳装置及び電子透かし検出装置
WO1999039344A1 (en) * 1998-02-02 1999-08-05 Verance Corporation Method and apparatus for preventing removal of embedded information in cover signals
JP2000083014A (ja) * 1998-09-04 2000-03-21 Nippon Telegr & Teleph Corp <Ntt> 情報多重化方法、情報抽出方法および装置

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4636088A (en) 1984-05-21 1987-01-13 Therma-Wave, Inc. Method and apparatus for evaluating surface conditions of a sample
EP0200301A1 (en) 1985-03-01 1986-11-05 Therma-Wave Inc. Method and apparatus for evaluating surface and subsurface features in a semiconductor
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
FR2660131B1 (fr) * 1990-03-23 1992-06-19 France Etat Dispositif de transmissions de donnees numeriques a au moins deux niveaux de protection, et dispositif de reception correspondant.
US5121204A (en) * 1990-10-29 1992-06-09 General Electric Company Apparatus for scrambling side panel information of a wide aspect ratio image signal
US5254843A (en) * 1991-08-07 1993-10-19 Hynes John E Securing magnetically encoded data using timing variations in encoded data
US5539812A (en) * 1992-07-29 1996-07-23 Kitchin; Dwight W. Method and apparatus for detecting an attempted three-way conference call on a remote telephone
DE4241068C2 (de) * 1992-12-05 2003-11-13 Thomson Brandt Gmbh Verfahren zum Übertragen, Speichern oder Decodieren eines digitalen Zusatzsignals in einem digitalen Tonsignal
US6122403A (en) * 1995-07-27 2000-09-19 Digimarc Corporation Computer system linked by using information in data objects
US5748783A (en) * 1995-05-08 1998-05-05 Digimarc Corporation Method and apparatus for robust information coding
US5748763A (en) * 1993-11-18 1998-05-05 Digimarc Corporation Image steganography system featuring perceptually adaptive and globally scalable signal embedding
US5404377A (en) * 1994-04-08 1995-04-04 Moses; Donald W. Simultaneous transmission of data and audio signals by means of perceptual coding
US5774452A (en) * 1995-03-14 1998-06-30 Aris Technologies, Inc. Apparatus and method for encoding and decoding information in audio signals
WO1996032710A1 (en) * 1995-04-10 1996-10-17 Corporate Computer Systems, Inc. System for compression and decompression of audio signals for digital transmission
US5680462A (en) * 1995-08-07 1997-10-21 Sandia Corporation Information encoder/decoder using chaotic systems
DE69636084T2 (de) * 1995-09-28 2006-09-14 Nec Corp. Verfahren und Vorrichtung zum Einfügen eines Spreizspektrumwasserzeichens in Multimediadaten
CN1123221C (zh) * 1995-12-11 2003-10-01 皇家菲利浦电子有限公司 标记视频和/或音频信号
US5956430A (en) * 1996-02-19 1999-09-21 Fuji Xerox Co., Ltd. Image information coding apparatus and method using code amount of a selected pixel block for changing coding parameter
US6035177A (en) 1996-02-26 2000-03-07 Donald W. Moses Simultaneous transmission of ancillary and audio signals by means of perceptual coding
EP0875107B1 (de) 1996-03-07 1999-09-01 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer und decodierer
US5828416A (en) * 1996-03-29 1998-10-27 Matsushita Electric Corporation Of America System and method for interfacing a transport decoder to a elementary stream video decorder
US5812976A (en) * 1996-03-29 1998-09-22 Matsushita Electric Corporation Of America System and method for interfacing a transport decoder to a bitrate-constrained audio recorder
US5889868A (en) * 1996-07-02 1999-03-30 The Dice Company Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US6078664A (en) 1996-12-20 2000-06-20 Moskowitz; Scott A. Z-transform implementation of digital watermarks
EP0940037B1 (en) 1996-07-16 2005-09-14 Koninklijke Philips Electronics N.V. Detecting a watermark embedded in an information signal
US6031914A (en) * 1996-08-30 2000-02-29 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible images
US6061793A (en) * 1996-08-30 2000-05-09 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible sounds
US6069914A (en) 1996-09-19 2000-05-30 Nec Research Institute, Inc. Watermarking of image data using MPEG/JPEG coefficients
US5809139A (en) * 1996-09-13 1998-09-15 Vivo Software, Inc. Watermarking method and apparatus for compressed digital video
US5825892A (en) * 1996-10-28 1998-10-20 International Business Machines Corporation Protecting images with an image watermark
US5915027A (en) * 1996-11-05 1999-06-22 Nec Research Institute Digital watermarking
US5845251A (en) * 1996-12-20 1998-12-01 U S West, Inc. Method, system and product for modifying the bandwidth of subband encoded audio data
US6850567B1 (en) 1997-01-13 2005-02-01 Koninklijke Philips Electronics N.V. Embedding supplemental data in a digital video signal
US5940135A (en) * 1997-05-19 1999-08-17 Aris Technologies, Inc. Apparatus and method for encoding and decoding information in analog signals
US5960081A (en) 1997-06-05 1999-09-28 Cray Research, Inc. Embedding a digital signature in a video sequence
US6330672B1 (en) * 1997-12-03 2001-12-11 At&T Corp. Method and apparatus for watermarking digital bitstreams
US6037984A (en) * 1997-12-24 2000-03-14 Sarnoff Corporation Method and apparatus for embedding a watermark into a digital image or image sequence
US6064748A (en) * 1998-01-16 2000-05-16 Hewlett-Packard Company Method and apparatus for embedding and retrieving additional data in an encoded data stream
US6064764A (en) 1998-03-30 2000-05-16 Seiko Epson Corporation Fragile watermarks for detecting tampering in images
GB2340351B (en) 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6219634B1 (en) 1998-10-14 2001-04-17 Liquid Audio, Inc. Efficient watermark method and apparatus for digital signals
US6128736A (en) 1998-12-18 2000-10-03 Signafy, Inc. Method for inserting a watermark signal into data

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10510660A (ja) * 1995-10-04 1998-10-13 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ ディジタル符号化ビデオ及び/又はオーディオ信号のマーキング技術
JPH10303755A (ja) * 1997-04-25 1998-11-13 Nippon Telegr & Teleph Corp <Ntt> 量子化の符号化パラメータを用いる電子すかし作成方法およびその読出し方法
WO1999010837A1 (en) * 1997-08-26 1999-03-04 Digimarc Corporation Method and apparatus for watermarking video images
JPH1198341A (ja) * 1997-09-17 1999-04-09 Pioneer Electron Corp 電子透かし重畳装置及び電子透かし検出装置
WO1999039344A1 (en) * 1998-02-02 1999-08-05 Verance Corporation Method and apparatus for preventing removal of embedded information in cover signals
JP2000083014A (ja) * 1998-09-04 2000-03-21 Nippon Telegr & Teleph Corp <Ntt> 情報多重化方法、情報抽出方法および装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008536193A (ja) * 2005-04-13 2008-09-04 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 音声メタデータ確認
WO2007007666A1 (ja) * 2005-07-11 2007-01-18 Ntt Docomo, Inc. データ埋込装置、データ埋込方法、データ抽出装置、及び、データ抽出方法
JP2007017900A (ja) * 2005-07-11 2007-01-25 Ntt Docomo Inc データ埋込装置、データ埋込方法、データ抽出装置、及び、データ抽出方法
US8428756B2 (en) 2005-07-11 2013-04-23 Ntt Docomo, Inc. Data embedding device, data embedding method, data extraction device, and data extraction method
WO2007029412A1 (ja) * 2005-09-01 2007-03-15 Matsushita Electric Industrial Co., Ltd. マルチチャンネル音響信号処理装置
US8184817B2 (en) 2005-09-01 2012-05-22 Panasonic Corporation Multi-channel acoustic signal processing device
JP2009537033A (ja) * 2006-05-12 2009-10-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 情報信号符号化
JP2008009104A (ja) * 2006-06-29 2008-01-17 Dainippon Printing Co Ltd 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
JP2011521290A (ja) * 2008-05-22 2011-07-21 華為技術有限公司 フレーム損失隠蔽の方法及び装置
US8457115B2 (en) 2008-05-22 2013-06-04 Huawei Technologies Co., Ltd. Method and apparatus for concealing lost frame
JP2014090443A (ja) * 2013-11-29 2014-05-15 Yamaha Corp 識別情報重畳装置

Also Published As

Publication number Publication date
KR20030064381A (ko) 2003-07-31
AU8491001A (en) 2002-02-25
ATE308858T1 (de) 2005-11-15
CN100431355C (zh) 2008-11-05
DE60114638D1 (de) 2005-12-08
CA2418722A1 (en) 2002-02-21
HK1080243B (zh) 2009-05-15
KR100898879B1 (ko) 2009-05-25
BRPI0113271B1 (pt) 2016-01-26
EP1310099B1 (en) 2005-11-02
WO2002015587A3 (en) 2003-03-13
US20040024588A1 (en) 2004-02-05
AU2001284910B2 (en) 2007-03-22
EP1310099A2 (en) 2003-05-14
CA2418722C (en) 2012-02-07
DE60114638T2 (de) 2006-07-20
US7395211B2 (en) 2008-07-01
WO2002015587A2 (en) 2002-02-21
HK1080243A1 (en) 2006-04-21
CN1672418A (zh) 2005-09-21
BR0113271A (pt) 2003-09-23

Similar Documents

Publication Publication Date Title
AU2001284910B2 (en) Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
AU2001284910A1 (en) Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
Lin et al. Audio watermarking techniques
Djebbar et al. A view on latest audio steganography techniques
Seok et al. A novel audio watermarking algorithm for copyright protection of digital audio
US6061793A (en) Method and apparatus for embedding data, including watermarks, in human perceptible sounds
US20060111913A1 (en) Audio encoding/decoding apparatus having watermark insertion/abstraction function and method using the same
US20020009000A1 (en) Adding imperceptible noise to audio and other types of signals to cause significant degradation when compressed and decompressed
Xiang et al. Digital audio watermarking: fundamentals, techniques and challenges
Gopalan Audio steganography by cepstrum modification
Hu et al. Effective blind speech watermarking via adaptive mean modulation and package synchronization in DWT domain
Malik et al. Robust audio watermarking using frequency-selective spread spectrum
Bibhu et al. Secret key watermarking in WAV audio file in perceptual domain
Singh et al. Audio watermarking based on quantization index modulation using combined perceptual masking
Huang et al. Robust and inaudible multi-echo audio watermarking
Xu et al. Performance analysis of data hiding in MPEG-4 AAC audio
Lei et al. Perception-based audio watermarking scheme in the compressed bitstream
Wu et al. Comparison of two speech content authentication approaches
Xu et al. Content-based digital watermarking for compressed audio
Li et al. A novel audio watermarking in wavelet domain
WO2001088915A1 (en) Adding imperceptible noise to audio and other types of signals to cause significant degradation when compressed and decompressed
Adib A high capacity quantization-based audio watermarking technique using the DWPT
Xu et al. Digital Audio Watermarking
Battisti et al. Perceptual audio watermarking driven by Human Auditory System
Xu et al. Audio watermarking

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080814

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080814

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120124