JP2004506947A

JP2004506947A - 補足情報に応答するオーディオ又はビデオ知覚符号化システムのパラメータ変調

Info

Publication number: JP2004506947A
Application number: JP2002520567A
Authority: JP
Inventors: ワトソン、マシュー・オーベリ; トルーマン、マイケル・ミード; バーノン、スティーブン・デッカー; クロケット、ブレット・グラハム
Original assignee: Dolby Laboratories Licensing Corp
Current assignee: Dolby Laboratories Licensing Corp
Priority date: 2000-08-16
Filing date: 2001-08-15
Publication date: 2004-03-04
Also published as: KR20030064381A; AU8491001A; ATE308858T1; CN100431355C; DE60114638D1; CA2418722A1; HK1080243B; KR100898879B1; BRPI0113271B1; EP1310099B1; WO2002015587A3; US20040024588A1; AU2001284910B2; EP1310099A2; CA2418722C; DE60114638T2; US7395211B2; WO2002015587A2; HK1080243A1; CN1672418A

Abstract

ウォーターマークのような補足情報により、知覚符号化システムのエンコーダファンクション及び又はデコーダファンクションの操作を変更し、補足情報がデコーダファンクションの出力において検出される得るようにする方法である。補足情報に応答して１つ又はそれ以上のパラメータがエンコーダ及び又はデコーダファンクションにおいて変調される。
【選択図】図２

Description

【０００１】
【技術分野】
本発明は、信号に関するステガノグラフィ、即ち、信号隠蔽に関する。特に、本発明は、補足情報によるオーディオ又はビデオ知覚符号化システムのエンコーダ及び又はデコーダの操作を変更し、デコーダの出力で補助情報が検出され得るようにすることに関する。そんな補足情報は、しばしば「ウォーターマーク（透かし）」と呼ばれる。「ウォーターマーキング」はステガノグラフィ（隠蔽）の一面である。
【０００２】
【背景技術】
ステガノグラフィ及びウォーターマーキング
ステガノグラフィは別の信号内に一信号を隠す科学である。ステガノグラフィク（隠蔽）アルゴリズム又はプロセスは、エラーに強い（耐エラー）か又は「もろい」かもしれない。即ち、それは隠された信号を改造するのが非常に困難であるか又は非常に容易であり得る。オーディオ用途を考慮すると、非常にもろい隠蔽技術は、上位ビットで伝えられるであろうオーディオプログラム内容から独立したデータストリームを伝えるためにＰＣＭチャンネルの最下位ビットを用いることである。最下位ビットで伝えられる隠されたデータチャンネルは、オーディオプログラムを有意には歪ませないが、むしろ低レベルディザ信号として働く。この技術は、簡単なオーディオ処理は、利得変化、デジタル対アナログ変換等のような、データ信号を破壊し得るという意味でもろい。
【０００３】
ウォーターマーキング（透かし）は隠蔽、即ち、遮蔽の一形式であり、そこでは、概して、信号隠蔽技術は、通常の処理又は故意の攻撃よる改造に対してエラー強いことを意図している。そういうものとして、ウォーターマークは、コンテント所有権のコピー保護又は識別のような、安全性に関する用途で価値がある。そんな用途では、ウォーターマークは、例えば、コピー制御条件、著作権情報及び主プログラム資料がどのように公開されたかに関する情報を伝え得る。主プログラムがその後盗まれるか又は不法にコピーされるとしても、理想的には、ウォーターマークはプログラム資料内に埋め込まれたままであり、所有権を立証する方法を与える。
【０００４】
１つ又はそれ以上のウォーターマークが「コンテント」（例えば、オーディオ又はビデオ公演）流通経路に沿った多くの時点で挿入され得る。この経路の開始時点で信号に加えられる情報は著作権情報又はマスター（原盤）化地点を含み得る、同時に信号系の終了時点では、日付・時間スタンプ及び又は機械通し番号等の再生情報を含み得る。コンテントの起源を追跡するためには、ウォーターマークが流通経路に沿った各種の地点で埋め込まれ得る。
【０００５】
オーディオ及びビデオ信号のウォーターマーキングに関する一重要な考慮事項は、隠された信号は不必要にそれが隠されている信号の品質を劣化させるべきではないということである。理想的には、ウォーターマークは完全に透明であるべきである。即ち、ウォーターマーク信号及び原信号間の差は知覚不能（助力のない観察者には）であるべきである。勿論、さもなければウォーターマーク信号は回復不能なので、差は幾つかの手段によって検出可能でなければならない。例えば、コマーシャル使用を避けるために画像は可視的にウォーターマークされ得る。さらに、紙は立証を知覚できるシールを伝えるためにウォーターマークされ得る。
【０００６】
従って、ウォーターマーキングの目標は以下のように要約され得る。
【０００７】
・二次的信号又は補足情報を加えるような方法での主信号の変更が改変された主信号に帰着し、
・原信号及び変更された信号間の差は検出可能であるが視覚不能であるべきである、
・当該変更は、除去又は隠蔽を困難にすべきである。
【０００８】
知覚符号化
知覚符号化は、知覚的な諸無関連性をより効果的な表現に変えるために、信号からそれらを除去する科学である。例えば、いくつかの用途では、予め決められたチャンネル容量制限を満たすためにデジタルオーディオ又はビデオ信号の送信データレートを低減させるために知覚符号化が用いられる。オーディオ及びビデオ信号の知覚符号化は確立された科学分野であり、オーディオ及びビデオ信号が効率的な記憶及び伝送に関して比較的低データレートに変更されることを可能にする。
【０００９】
多くの知覚コーダは、原信号のコンテントを分析しかつ各信号成分の知覚的関連性を識別することによって作動する。次いで、原信号より低いデータレートを用いて変更されたバージョンが表現され得るように変更されたバージョンが作り出される。理想的には、原信号及び変化された信号間の差が知覚不能にされる。ノイズ、即ち、通常は量子化雑音又は他のひずみは、信号のデータレートを低減させるために制御可能に導入される。ノイズ又は他のひずみを操作するために人の知覚特性が考慮され、それが知覚不能又は最小的にしか知覚されないようする。
【００１０】
知覚コーダは、人の知覚を或る程度の正確さで反映させることを意図したマスキング（隠蔽、即ち、遮蔽）モデルを用いる。マスキングモデルは、知覚可能性の境界を確定する知覚マスキング閾値を与える。図１の実線は、音圧レベルを示し、そこでは、正弦波又は狭帯域ノイズのような音が丁度可聴になる、即ち、聴取閾値を示す。レベルが当該曲線より上の音は可聴であり、下のものは聴取不能である。この閾値が周波数に非常に依存していることは明らかである。例えば、４ｋＨｚでは、５０Ｈｚ又は１５ｋＨｚにおけるよりも遥かに軟らかな音を聞くことができる。２５ｋＨｚでは、閾値は尺度から外れ、如何に大きくてもそれは聴取不能である。
【００１１】
ある周波数に比較的大きな信号、例えば、図の垂線で示されるような、５００Ｈｚの正弦波が存在すると、図１の点線で示されるような閾値を考察せよ。閾値は５００Ｈｚの極近辺で劇的に上昇し、より遠くの周波数では幾分緩やかで、可聴範囲の遠方では全く見られない。
【００１２】
この閾値の上昇はマスキングと呼ばれる。大きな５００Ｈｚ正弦波信号（「マスキング信号」又は「遮蔽体」）の存在では、この「マスキング閾値」と呼ばれ得る閾値未満の信号は、大きい信号によって隠されるか又は遮蔽される。さらに遠くでは、他の信号が無信号閾値の幾分上になり得るが、それでもなお新しい遮蔽閾値の下になり、従って聴取不能である。しかし、無信号閾値が不変であるスペクトルの遠方部分では、５００Ｈｚ遮蔽体なしで取可能であったあらゆるノイズは、それで丁度聴取可能なままである。従って、マスキングは、１つ又はそれ以上の各マスキング信号の単なる存在には依存しない。それらがスペクトル的にどこにあるかに依存する。例えば、ある楽節が可聴周波数範囲の全域に亘る多くのスペクトル成分を含み、従って、無信号閾値曲線に関してあらゆるところで上昇される遮蔽された閾値曲線を与える。他の楽節は、例えば、小部分に限定されるスペクトル成分を有するソロ楽器からの比較的大きな音からなり、従って、図１例の正弦波遮蔽体によりよく似た遮蔽曲線を与える。
【００１３】
マスキングは同様に、遮蔽体及び遮蔽される信号間の時間関係に依存する一時的な面をも有する。あるマスキング信号は、本質的にマスキング信号が存在する間にのみマスキングを与える（「同時マスキング」）。他のマスキング信号は、遮蔽体が存在する間のみならず、それより早いか又はそれより遅い時間にもマスキングを与える（「後方マスキング」又は「前方マスキング」）。「転移（過渡現象）」、即ち、信号レベルの突然の、短いかつ意味のある増加は、３「種類」のマスキングの全て、即ち、後方マスキング、同時マスキング及び前方マスキングを展示し得るが、定常状態又は静止‐定常‐状態信号は同時マスキングしか提示できない。
【００１４】
知覚符号化プロセスによって追加されるすべてのノイズ及び歪みは、知覚可能な障害を避けるためにはマスキング閾値以下にとどまるべきである。符号化プロセスによって追加されるノイズ及び歪みが、マスキング閾値には達するが、それを越えないならば、当該信号は「丁度知覚される差」のレベルで符号化されるといえる。システムの「符号化マージン（余裕）」は、追加されたノイズ又は歪みそれだけ分マスキング閾値より下にある量と定義され得る。即ち、０の符号化マージンは、信号が丁度知覚され得る差のレベルで符号化されることを意味し、一方正の符号化マージンは追加されたノイズ又は歪みがある余裕を持って感知されず、負の符号化マージンは感知できる障害があることを意味する。
【００１５】
信号の差の面は、（例えば、帯域幅、時間分解能、空間精度等）異なった程度の精度に符号化されることが可能で、異なった信号特性につき異なった符号化マージンに帰着することに注目せよ。原始信号のすべての特性につき符号化マージンが負でないように符号化されるならば、それは知覚的に原始信号と等しいといい得る。
【００１６】
知覚符号化システムは、ビット割当て情報又は知覚モデル情報を符号化されたデータと共にデコーダに伝達し得るエンコーダからなる。知覚符号化システムには３つの主要な種類がある。即ち、順方向適応、逆方向適応及びそれら２つのハイブリッドシステムである。順方向適応システムでは、エンコーダは明示的にビット割当て情報をデコーダに送る。逆方向適応システムは、ビット割当て情報又は知覚モデル情報のいずれをもデコーダには送らない。デコーダは符号化されたデータからビット割当て情報を再現させる。ハイブリッドシステムは、符号化されたデータに含まれるべき、知覚モデルの全分解能形式以下のようなある割当て情報は考慮するが、全順方向適応システムにおけるより遥かに少ないものは考慮しない。これらの３種類の知覚符号化システムのさらに詳細な論議は、ＣｒａｉｇＣ．Ｔｏｄｄ他による「ＡＣ‐３：オーディオ送信及び記憶用順応知覚符号化」（Ｐｒｅｐｒｉｎｔ３７９６，９６^ｔｈＣｏｎｖｅｎｔｉｏｎｏｆＡｕｄｉｏＥｎｇｉｎｅｅｒｉｎｇＳｏｃｉｅｔｙ，Ｆｅｂｒｕａｒｙ２６‐Ｍａｒｃｈ１，１９９４）に記載されている。ドルビー研究所で開発された、ＤｏｌｂｙＤｉｇｉｔａｌ及びＤｏｌｂｙＥシステムのような、以下でさらに確認される、知覚符号化システムは、ハイブリッド順方向・逆方向適応システムであり、一方同様に以下でさらに確認される、ＭＰＥＧ‐２ＡＡＣ符号化システムは、順方向適応システムの例である。
【００１７】
知覚コーダの目標は以下のように要約され得る。即ち、
・主信号の変更が変更された信号に帰着し、
・原信号及び変更された信号間の差は無知覚になるべきであり、
・変更された信号の表現は原信号のものよりさらに有効になるべきである。
【００１８】
安全性
安全性の基準としてのウォーターマーキングは、ウォーターマークが直接攻撃から生き残れる能力と同程度に強いことだけである。現在用いられている多くのウォーターマーキング技術は、ウォーターマークが公知でないならば、ウォーターマークデータをおおい隠すために攻撃者はウォーターマーク付き信号をどのように変更するかを知らないであろうとの仮定の下にウォーターマークの詳細を秘密に保つことによってそれ自体を保護することを意図している。これは「隠蔽を通じた安全性」として知られる原理である。暗号法の分野では、隠蔽を通じた安全性は概して非論理的原理として捨てられる。アルゴリズム又はプロセスが、秘密を通じてその安全性を得るものならば、ただ１人の者が当該技術の詳細を開示するだけで全システムの安全性が危うくされる。
【００１９】
安全性の目標は以下のように要約される。即ち、
・コンテントの盗難が役に立たないか又は海賊行為及び海賊行為の源への追跡可能性のその後の立証を可能にするような方法でコンテントを保護し、
・攻撃に対し強くなるようにし、
・当該システムの最も弱いリンクにおいてさえも高安全性を維持することである。
【００２０】
【本発明の開示】
本発明は、補足情報に応答して知覚符号化システムのエンコーダ及び又はデコーダの操作を変更する方法に向けられ、当該補足情報がデコーダの出力で検出可能になるようにされる。エンコーダ及び又はデコーダの１つ又はそれ以上のパラメータが補足データに応答して変調される。
【００２１】
本発明により、デコーダの出力において検出可能であるが、望ましくは感知不能な変化を生じさせるために知覚符号化システムのエンコーダ及び又はデコーダの１つ又はそれ以上のパラメータを変調することによって、ウォーターマーク情報のような補足情報が伝えられる。この情報は、符号化システムによって伝えられるオーディオ又はビデオ情報のような主情報に追加されるといういう理由で「補足的」である。概して、そんな補足情報は、必要性はないが、「ウォーターマーク（透かし）」の性質を帯びている。１つ又はそれ以上のパラメータの変調は、補足又はウォーターマーク情報を符号化された信号内（知覚エンコーダ内のパラメータを変調する場合には）及び復号された信号内（知覚エンコーダ及び又は知覚デコーダ内のパラメータを変調する場合には）に補足又はウォーターマーク情報を「埋め込む」と云うことができる。
【００２２】
本発明のある実施例は、一エンコーダ内で少なくとも部分的に実施されるならば、主情報を表すビットストリームデータを間接的に変更し得るが、本発明は主情報を表すビットストリームデータの直接変更は考えていない（また知覚エンコーダでの量子化後ビットストリームデータになる主情報の変更も考えていない）。本発明は、復号されていないビットストリームにおけるよりはむしろ知覚デコーダ出力における補足情報の検出（エンコーダ及び又はデコーダの作動の結果としてそんな情報が伝えられるかどうか）を考慮している。
【００２３】
「変調」によって我々は、１つ又はそれ以上の値（状態）間のパラメータの値を変えることを意味し、ここでは前記値は「デフォルト（省略時）値」を含むことが可能であり、それは本発明の働きがなかったならばそうであったのとは別にパラメータを評価する。例えば、パラメータ値は、そのデフォルト値及び１つ又はそれ以上の値間（唯２つの可能な値しかないパラメータの場合には、そんなパラメータは時々「フラッグ」と呼ばれ、パラメータはそれらの２つのフラッグ間で変更され得る）で変更され得るか又はそれは、デフォルト値を含まない、１つ又はそれ以上の値間で変更され得る。
【００２４】
補足情報又はウォーターマーク信号又はシーケンスに「応答して変調する」との表現によって我々は、例えば、符号化システムに加えられる決定論的シーケンス又は入力信号のような一連の指令を含む、１つ又はそれ以上の他の信号の機能によって制御が変更される場合のように、パラメータの変調が直接又は間接的に補足情報又はウォーターマーク信号又はシーケンスによって制御されることを意味する。
【００２５】
「パラメータ」の用語によって我々は、主情報を表すビットストリームデータではない知覚符号化システム内の変数を意味する。本発明の各面による変調に適する）、ＭＰＥＧオーディオ及びＭＰＥＧビデオパラメータの例は以下に示される図６、７及び８の表にそれぞれ示される。本発明は同様に、まだ定義されていないパラメータ等、発行された知覚コーダ標準では確認されていない１つ又はそれ以上のパラメータの変調をも考慮している。
【００２６】
「主情報を表すビットストリームデータ」の用語により我々は、知覚エンコーダによって発生されるがまだ復号されたいない、オーディオ又はビデオ情報のような主情報を伝える符号化されたビットストリーム内のデータビットを意味する。主情報を表すビットストリームデータは、例えば、ＤｏｌｂｙＤｉｇｉｔａｌ（ＡＣ−３）システムの場合には、指数及び仮数、またＭＰＥＧ−２ＡＡＣシステムの場合には、目盛係数及びハフマン符号化係数等を表わす。
【００２７】
複合知覚符号化システム（例えば、ＤｏｌｂｙＤｉｇｉｔａｌ及びＤｏｌｂｙＥオーディオ、ＭＰＥＧオーディオ、ＭＰＥＧビデオ等）では、多数の独立符号化パラメータは有意の符号化順応性を与える。“Ｄｏｌｂｙ”、“ＤｏｌｂｙＤｉｇｉｔａｌ”及び“ＤｏｌｂｙＥ”はＤｏｌｂｙＬａｂｏｒａｔｏｒｉｅｓＬｉｃｅｎｓｉｎｇＣｏｒｐｏｒａｔｉｏｎの商標である。
【００２８】
ＤｏｌｂｙＤｉｇｉｔａｌ符号化の詳細は、“ＤｉｇｉｔａｌＡｕｄｉｏＣｏｍｐｒｅｓｓｉｏｎＳｔａｎｄａｒｄｓ（ＡＣ−３）”（ＡｄｖａｎｃｅｄＴｅｌｅｖｉｓｉｏｎＳｙｓｔｅｍｓＣｏｍｍｉｔｔｅｅ（ＡＴＳＣ），ＤｏｃｕｍｅｎｔＡ／５２，Ｄｅｃｅｍｂｅｒ２０，１９９５）に記載されている。下記参照のこと。
【００２９】
ｗｗｗ．ａｔｓｃ．ｏｒｇ／Ｓｔａｎｄａｒｄｓ／Ａ５２ａ＿５２．ｄｏｃ．；ｗｗｗ．ｄｏｌｂｙ．ｃｏｍ／ｔｅｃｈ／ＡＴＳＣ＿ｅｒｒ．ｐｄｆ．
。
【００３０】
ＤｏｌｂｙＥ符号化の詳細は、「オーディオ分配システムにおける効率的ビット割当、量子化及び符号化」（ＡＥＳＰｒｅｐｒｉｎｔ５０６８，１０７^ｔｈＡＥＳＣｏｎｆｅｒｅｎｃｅ，Ａｕｇｕｓｔ１９９９）及び「ビデオ用に最適化された専門オーディオコーダ」（ＡＥＳＰｒｅｐｒｉｎｔ５０３３，１０７^ｔｈＡＥＳＣｏｎｆｅｒｅｎｃｅＡｕｇｕｓｔ１９９９）に記載されている。
【００３１】
ＭＰＥＧ−２ＡＡＣ符号化の詳細は、「情報技術−映画及び関連オーディオ情報の包括的符号化―パート７：高等オーディオ符号化」（ＩＳＯ／ＩＥＣ１３１８−７：１９９７（Ｅ），ＩｎｔｅｒｎａｔｉｏｎａｌＳｔａｎｄａｒｄｓＯｒｇａｎｉｚａｔｉｏｎ（Ａｐｒｉｌ１９９７）、「ＭＰ３及びＡＡＣ」（ｂｙＫａｒｌｈｅｉｎｚＢｒａｎｄｅｎｂｕｒｇ，ＡＥＳ１７^ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＨｉｇｈＱｕａｌｉｔｙＡｕｄｉｏＣｏｄｉｎｇ，Ａｕｇｕｓｔ１９９９）及び「ＩＳＯ／ＩＥＣＭＰＥＧ−２高等オーディオ符号化」（ｂｙＢｏｓｉ，ｅｔ．ａｌ．，ＡＥＳｐｒｅｐｒｉｎｔ４３８２，１０１^ｓｔＡＥＳＣｏｎｖｅｎｔｉｏｎ，Ｏｃｔｏｂｅｒ１９９６）に記載されている。
【００３２】
ドルビーエンコーダ、ＭＰＥＧエンコーダ及びその他を含む各種の知覚コーダの概観は、「ＭＰＥＧオーディオの概観：低ビットレートオーディオ符号化のための現在及び将来標準」（ｂｙＫａｒｌｈｅｉｎｚＢｒａｎｄｅｎｂｕｒｇａｎｄＭａｒｉｎａＢｏｓｉ，Ｊ．ＡｕｄｉｏＥｎｇ．Ｓｏｃ．，Ｖｏｌ．４５，Ｎｏ．１／２，Ｊａｎｕａｒｙ／Ｆｅｂｒｕａｒｙ１９９７）に記載されている。
【００３３】
知覚符号化パラメータに対する特定のデフォルト値は、概して入力信号の特性に基づく符号化システムによって選択される。しかし、符号化パラメータ値を選択するためには通常２つ以上の方法がある。即ち、知覚可能な差を持たない復号された信号を生成するパラメータ値及び検知可能であるが知覚されない差を持つ復号された信号に帰着し得るような符号化パラメータ値の変化を持つ符号化パラメータ値がある。知覚不能性は人の知覚を指すが、一方検出可能性は人以外の検出器の能力に基づくことに注目のこと。
【００３４】
補足信号又はウォーターマーク検出器は、再生（復号）された信号内に含まれる埋め込まれた情報を回復する。オーディオ信号の場合には、例えば、ある場合では、検出は音響的に行われ得るが、他の場合には電子的検出が必要とされ得る。電子検出はデジタル又はアナログ領域でなされ得る。デジタル領域での電子検出は、復号された出力の時間又は周波数領域又は周波数対時間変換前のデコーダ内の周波数領域でのものであり得る。音響的処理後にウォーターマークを引出すことは、部屋ノイズ、スピーカ、マイク特性及び総合的再生音量の付加ためにより困難な挑戦と考えられる。
【００３５】
多くの実際的知覚符号化システムは、付加されたノイズを丁度認知できる差レベルより低く維持する要件を満たし得ない。知覚符号化システムにおける知覚可能性要件は、ビットレート目標又は複雑性制限を満たすためにしばしば緩和される。これらの場合には、知覚符号化中に加えられるノイズは知覚可能であるが、符号化パラメータ変調の対象とされ得るデフォルト値以外に、既に知覚可能なノイズを最早知覚不能にさせる値がありそうである。パラメータの変調は実質的にに知覚されたノイズの知覚可能な変化に帰着することはないが、それにもかかわらず、それは復号された信号の検出可能な変化に帰着し得る。
【００３６】
本発明の各面によると、変調の効果（影響）で、知覚符号化によって加えられたノイズ及び歪みが、周波数スペクトルの全て又は一部において、丁度知覚可能な差のレベルを下回らずにそれに近づかせるように、１つ又はそれ以上のパラメータが変調されるのが望ましい（この意味では、「歪み」は、符号化された原信号間の差でありかつ聴取可能な人工品（物）に帰着し得るか又は帰着し得ない。）従って、マスキング閾値を越えかつ知覚可能な障害を生じさせることなく１つ又はそれ以上のパラメータを符号化することから結果的に生じる影響を除去又はおおい隠すことは困難であろう。これに反して、攻撃がマスキング閾値より下方ならば、パラメータ変調の効果の一部は残りそうである。
【００３７】
すでに示唆したように、ノイズ及び歪みが丁度知覚可能な差のレベル未満になるようにエンコーダにより主原始信号が符号化されないならば、本発明の各面は同様に用いられ得る。この場合には、原始信号は原型に関して損傷され、パラメータ変調は復号された信号に、検出の観点からは異なった損傷を導入するが、望ましくは実質的に知覚可能性が同一になるように原始信号が符号化される。先の場合のように、損傷を誇大化するか又はより程度の大きな知覚可能性を有する追加の損傷を導入することなく、復号された信号において結果的に生じるパラメータ変調の効果を除去又はおおい隠すことは困難であろう。
【００３８】
本発明の接近方法は、知覚符号化に先立ってウォーターマークを用いる諸技術とは基本的に異なる。これらの技術では、たとえ符号化システムがウォーターマークを伝えるのに十分なマージンを含むことが可能であっても、前のウォーターマークを伝えるのに選ばれた特定の方法が知覚符号化システムの符号化マージンの位置と一致する保証はない。そんな前の諸システムは独立して作動するので、それらは時々悪く相互作用して知覚可能な障害を導入するか又はウォーターマークがおおい隠されるようにさせる。
【００３９】
すでに述べたように、知覚エンコーダは、知覚的に冗長な情報を除去することによって入力信号のデータレートを低減させる。例えば、定データレートエンコーダは、固定レートの入力情報をより低い固定レートの情報に低減させる。このデータ低減部分は、時々「レート制御」として特徴づけられる、エンコーダ出力が最終の固定情報サイズを越えないことを保証する機能を要する。レート制御は、それが最終符号化されたサイズを達成してしまうまで情報を低減させる。
【００４０】
いくつかの知覚エンコーダでは、正しい情報が放棄されることを保証するために歪み測定がレート制御と組合される。歪み測定は、原入力信号を符号化された信号（レート制御の出力）と比較する。歪み測定は、レート制御プロセスの結果を変更するために符号化パラメータを制御するのに用いられ得る。
【００４１】
本発明の歪みレート制御面は、埋め込まれた信号の強さを最大にしかつ埋め込まれた信号の知覚可能性を最小にすると同時に、どのようにしてウォーターマークを知覚エンコーダに埋め込むかの問題を解決することを追求する。一実施形態では、本発明はまた、使用者がウォーターマーキング埋め込みプロセスにおけるパラメータを調節することによって埋め込まれた信号の強さ又はエネルギーを選択可能にする。
【００４２】
パラメータ変調に加えて、本発明の各面では、パラメータ変調のある面及び、従って、結果的に生じるウォーターマークの特性を変更するために、決定論的シーケンスのような一連の指令を用いる。決定論的シーケンスは、限定方程式（作成方程式）及び初期状態（ソートキー）を前提として、２進１及び０の各シーケンスを生じる数学的プロセスによって発生される。決定論的シーケンスを用いる本発明のいくらかの代替面が開示される。これらの技術は、ウォーターマークの知覚不可能性を改良し、またウォーターマークの強さを改良することが可能であり、それは、知覚不可能性を改良する他の技術が強さを劣化させる傾向にある限り、興味のあるかつ有用な結果である。最後に、これらの技術は、システムの強さを犠牲にすることなくウォーターマーキングシステムのすべての面（決定論的シーケンスキーを除き）を示すことを可能にするという意味で安全性を改良し得る。
【００４３】
本発明の決定論的シーケンス面は、下記の動作１つ又はそれ以上を含み得る。
【００４４】
・パラメータ変調転移のレート及び、従って、ウォーターマークシンボル転移レートを変更するために決定論的シーケンスを用い（以下の表１参照）、
・変調用のパラメータ（以下の表２参照）を選択するために決定論的シーケンスを用い、
・変調用パラメータの選択が変化するレートを変更するために決定論的シーケンスを用いる（以下の表３参照）。
【００４５】
さらに、本発明の代わりの各面は、パラメータ変調及び又は変調用パラメータの選択を制御するために原始信号の特性を用いる動作を含む。本発明の原始信号応答面は下記動作の１つ又はそれ以上を含む。即ち、
・パラメータ変調レート及び、従って、ウォーターマークシンボル転移レートを可変的に変更するために原始信号の特性を用い（以下の表４の部分ａ参照）、
・変調用パラメータの選択が変化するレートを可変的に変更するために原始信号の特性を用い（以下の表４の部分ｂ参照）、
・変調用パラメータの可変セットのパラメータ数を可変的に変更するために原始信号の特性を用いる（以下の表５参照）。
【００４６】
以下でさらに説明されるように、原始信号の決定論的シーケンス及び特性の双方は本発明の代わりの面による変調パラメータに関連して用いられ得る。以下の表６、７及び８参照。
【００４７】
本発明のいくつかの実施例に関して、知覚デコーダの出力でのウォーターマーク検出は、エンコーダに加えられた主情報へのアクセスを必要としそうである。本発明のいくつかの他の実施例については、検出におけるより大きな複雑性を犠牲にして最初の主情報にアクセスすることなくウォーターマーク検出を行うことができる。
【００４８】
信号が聴取者に伝えられる個所で独特の又は「逐次化された」（例えば通し番号）ウォーターマークを利用するのはしばしば望ましい。本発明の各面によると、補足情報又はウォーターマークが知覚復号プロセス中に埋め込まれる。１つ又はそれ以上のパラメータが、逆量子化に先立って変調される。
【００４９】
デコーダパラメータ変調プロセスによって加えられたノイズ又は歪みが知覚閾値を超えないならば、知覚不可能性が維持され得る。復号プロセスの一部としてウォーターマークを知覚できないように埋め込むために知覚閾値が用いられる。多くの知覚コーダは、ある形式又は他の形式で知覚モデルを符号化プロセスから複合プロセスへ伝達する。しかし、他のコーダは知覚閾値の近似値又は雑な表示しか与えない。最も正確な知覚閾値は量子化されていない原始スペクトル係数から得られるが、そんなデータがデコーダに伝えられると、データレートの増加が著しくなる。その代わりに、知覚符号化システムにおいてデコーダに与えられる知覚閾値は、指数が臨界帯域内で最大エネルギーを持つ（ドルビーデジタルシステムにおけるように）情報サンプルを表す、仮数からなる指数でもよい。デコーダにおける知覚閾値の精度を改良するために、帯域内の最大エネルギーの代わりに同バンド内のサンプルエネルギーの平均値に基づく指数がエンコーダから伝達され得る。
【００５０】
デコーダの変調パラメータは、多くの面でエンコーダのものと類似しているが、順応性が劣る。例えば、復号システムにおいて１つ又はそれ以上のパラメータを変調するためには、符号化パラメータに基づいてビット割り当て情報を再公式化する際に注意することを要する。また、デコーダにおいてパラメータ変調の影響を知覚不能にさせるのはさらに困難である。これに対する１つの理由は、少なくとも理想的なデコーダの場合には、符号化プロセスにおいて既に知覚可能な閾値まで量子化エラーが付加されてしまっていることである。しかし、例えば、知覚モデルの不完全性、正の信号対ノイズ比相殺又は信号状態のために符号化マージンが存在するので、これは必ずしも常に事実ではない。
【００５１】
【本発明を実施する最良の態様】
図２は、本発明の基礎的原理を例示する機能的構成図である。知覚エンコーダファンクション２及び知覚デコーダファンクション４は知覚符号化システムを構成する。ビデオ又はオーディオのような主情報が、知覚エンコーダファンクション２に加えられる。エンコーダファンクション２は、知覚デコーダファンクション４によって受信されるデジタルビットストリームを発生させる。エンコーダファンクション及び又はデコーダファンクションの１つ又はそれ以上のパラメータは、補足情報（例えば、ウォーターマーク信号又はシーケンス）に応答して変調される。補足情報はエンコーダファンクション又はデコーダファンクションのいずれか又は双方に加えられるので、点線は補足情報からエンコーダファンクション及びデコーダファンクションまで、それぞれ示される。知覚デコーダファンクションの出力は埋め込まれた補助情報を有する主情報である。補足情報は、デコーダファンクションの出力において検出され得る。
【００５２】
補足情報が、エンコーダファンクション２及びデコーダファンクション４の双方に加えられるならば、概して、一方に加えられた情報は他方に加えられたものと異なるであろう。例えば、１つ又はそれ以上のエンコーダファンクションパラメータを制御する補足情報は、オーディオ又はビデオコンテントの所有者を識別するウォーターマークであるかも知れない、また１つ又はそれ以上のデコーダファンクションパラメータを制御する補足情報は、オーディオ又はビデオコンテントを一人又はそれ以上の消費者に提供する装置を識別する通し番号であり得る。概して、補足情報は、異なった回数でエンコーダファンクション及びデコーダファンクションに加えられ得る。
【００５３】
図３〜５は、デコーダファンクションの出力内の補足情報を検出する検出器ファンクションを含む、本発明の一面の基礎的原理を例示する機能的構成図である。検出は、デコーダファンクション出力のデジタル領域又はアナログ領域（電気的又は音響的）で行われ得る。検出は、符号化後であるが周波数領域対時間領域変換に先立って、同様にデコーダファンクションのデジタル領域において行われ得る。
【００５４】
図３Ａは、デコーダファンクションの出力内の補足情報検出するデコーダファンクション４の出力を受信する検出器ファンクション６を含むことを除けば、図２と同一である。検出器ファンクション６の出力は当該補足情報である。図４は、デコーダファンクション４の出力のみならず、エンコーダファンクションに加えられた同一の主情報をも受信する検出器ファンクション８を含むことを除けば、図３Ａと同一である。検出器ファンクション８の本質的機能は、その出力として補足情報を与えるためにエンコーダファンクションに加えられた原入力情報をデコーダファンクションの出力と比較することである。図５は、図４装置の変形物である。図５では、図４におけると同様に、検出器ファンクション１０はデコーダファンクション４の出力及びエンコーダファンクション２に加えられた主情報を受信する。しかし、検出器ファンクション１０は検出器ファンクション８と異なり、比較器ファンクション１２のみならず、知覚エンコーダファンクション１４及び知覚デコーダファンクション１６を含む。エンコーダファンクション１４は、そのパラメータが変調されないことを除けばエンコーダファンクション２と同一である。デコーダファンクション１６は、そのパラメータが変調されないことを除けばデコーダファンクション４と同一である。従って、デコーダの出力において補足情報を検出する動作は、以下の動作の１つによって達成される。即ち、
復号された信号を観察し、
復号された信号をエンコーダファンクションに加えられた信号と比較し、
復号された信号を実質的に同一の知覚符号化システムであって、そこではエンコーダファンクション又はデコーダファンクションのパラメータが補足情報に応答して変調されてない知覚符号化システムからの復号された信号と比較する。
【００５５】
図３Ａの検出装置は、帯域幅パラメータが変調される（帯域幅パラメータを変調することは以下に詳細に説明される）場合のようなある種類のパラメータ変調の効果を検出するのに最も適している。大抵のパラメータを変調する効果を検出するためには、エンコーダに加えられた主情報を、図４及び５の装置におけるようなデコーダによって与えられる埋め込まれた補足情報を伝える主情報と比較することを要する。図５の装置は、より厳しい比較を可能にする、その理由は比較される情報間の唯一の差が変調パラメータによって発生されるからである。図４の装置では、当該差は知覚符号化及び復号プロセスによって導入され得る他の効果を含む。
【００５６】
図３Ａの検出装置は、知覚エンコーダに加えられた主情報にアクセスする必要がないので、どのエンコーダ及び又はデコーダでパラメータが変調されるかに依存して、それは実時間又は実時間近くで達成され得る。例えば、帯域幅パラメータを変調することは、デコーダ出力のみを分析することによって実時間又は実時間近くで検出を可能にする。特に、図３Ａ装置の検出器６は、デコーダファンクション４の出力がそれ自体に対して比較され得るように、１つ又はそれ以上の遅延ファンクションを含み得る。例えば、図３Ｂに示されるように、検出器ファンクション６は、復号された信号を観察する動作が復号された信号をそれ自体の時間遅延されたバージョンと比較することを含むように、比較器ファンクション１２’及び１つ又はそれ以上の遅延ファンクション７、７’等を含み得る。１つ又はそれ以上の先のブロックからのエネルギー状態が、例えば、以下に記載される帯域幅変調検出の方法でシンボルを決定するために閾値を用いる比較器ファンクションにさらされる。ブロック長さは検出器によって知られかつ期待されるシンボルレートを実際のシンボルレートと整列させるためにいくつかの形の同期が起こらなければならない。他のパラメータの変調は、実時間又はそれに近い時間での検出を許さないか又は図４及び５の装置におけるようにデコーダ出力をエンコーダ入力信号と比較することを要するであろう。
【００５７】
デコーダ出力がエンコーダ入力と比較される図４及び５のような装置では、入力信号を出力信号と同期させることは重要である。どのパラメータが変調のために選択されるか及び補足情報データレートに依存してこれらの信号間には高度の同期を与えることが必要であろう。そのようにする一方法は、ＰＲＮシーケンスのような決定論的シーケンスを主信号に埋め込み、当該シーケンスが同様にデコーダ出力内にも埋め込まれるようにすることである。入力及び出力信号内のシーケンスを比較することによってきめ細かい同期が可能になる。
【００５８】
検出は人手で達成されるか又はいくつかの場合には自動的に達成され得る。主信号においてＰＲＮシーケンスを用いることで、自動検出が促進され得る。人手でなされるならば、比較された信号のスペクトル分析のような視覚補助器具が用いられ得る。
【００５９】
ウォーターマークを埋め込むために変調され得る符号化パラメータのいくつかの例が数個の表に記載されている。即ち、図６に示される第１表（ドルビーオーディオコーダパラメータ）、図７に示される第２表（ＭＰＥＧオーディオコーダパラメータ）、図８に示される第３表（ＭＰＥＧビデオコーダパラメータ）。パラメータ（例えば、「マスキングモデル及びビット割当て」の各範疇につき、それぞれの表はパラメータ（例えば、「ＳＮＲ相殺」）の型、特殊のパラメータ（例えば、“ｃｓｎｒｏｆｆｓｔ”“ｆｓｎｒｏｆｆｓｔ”等）、パラメータがエンコーダ内及び又はデコーダ内の変調に敏感かどうか及びパラメータが変調される場合復号された信号のウォーターマークの信号特性の結果的に生じる変化を示す。図６に示される表の第１欄には、パラメータの６つの範疇がアドレスされる：即ち、マスキングモデル及びビット割当て、チャンネル間結合、周波数帯域幅、ディザ制御、位相関係及び時間・周波数変換ウィンドである。第１表では、ｒｅｍａｔｆｌｇが“０”（エンコーダではリマトリックシングなし）ならば、リマトリックシングは復号中にのみ行われ、第２表では、ｍｓ＿ｕｓｅｄが０（エンコーダではＭ／Ｓ符号化無し）ならばＭ／Ｓ符号化は復号中にのみ行われ得ることに注目のこと。
【００６０】
符号化システムにおいて１つの型のパラメータが１つ又はそれ以上のパラメータを持つところでは、それぞれのパラメータにつき識別された省略形が括弧内に示される。従って、例えば、パラメータの「ＳＮＲ相殺」型はＤｏｌｂｙＤｉｇｉｔａｌでは４つのパラメータを含む。即ち、“ｃｓｎｒｏｆｆｓｔ”（粗ＳＮＲ相殺）、“ｆｓｎｒｏｆｆｓｔ”（チャンネル微細ＳＮＲ相殺）、“ｃｐｌｆｓｎｒｏｆｆｓｔ”（結合微細ＳＮＲ相殺）及び“ｌｆｅｓｆｓｎｒｏｆｆｓｔ”（低周波効果チャンネル微細ＳＮＲ相殺）を含む。これら及び他のＤｏｌｂｙＤｉｇｉｔａｌ符号化パラメータは上記Ａ／５２文書に詳説される。表記された大抵のドルビーオーディオコーダパラメータはＤｏｌｂｙＤｉｇｉｔａｌ及びＤｏｌｂｙＥ符号化システムに共通であり、従って、Ａ／５２文書に説明され、ＤｏｌｂｙＥ符号化システムに独特なものは少ない（例えば、Ｂａｃｋ利得コード“ｂａｃｋｇａｉｎ”及びＢａｃｋ減退コード“ｂａｃｋｌｅａｋ”）。Ｂａｃｋｇａｉｎ及びｂａｃｋｌｅａｋに関するさらなる情報は以下に与えられる。
【００６１】
図７に示される表の第１欄には４つの範疇のパラメータがアドレスされる。即ち、マスキングモデル及びビット割当て、チャンネル間結合、一時的ノイズ形成フィルタ係数及び時間・周波数変換ウィンドの４つがある。同様に、図８に示される表の第１欄には２つの範疇のパラメータがアドレスされる。即ち、フレーム型及び移動制御である。表記されたＭＰＥＧオーディオ及びビデオコーダパラメータについてのさらなる情報は、上記引用されたＩＳＯ／ＩＥＣ文書、ＭＰＥＧ−２ＡＡＣ資料及び他の出版されたＭＰＥＧ文書に記載される。本発明の各面はＤｏｌｂｙ及びＭＰＥＧ知覚符号化システムに適用し得るのみならず、他の知覚符号化システムにも適用され、そこではエンコーダ及び又はデコーダのパラメータが変調される。他の知覚コーダの例は上記参照されたＢｒａｎｄｅｎｂｕｒｇ及びＢｏｓｉによる機関紙記事（Ｊ．ＡｕｄｉｏＥｎｇ．Ｓｏｃ．，１９９７）で論じられる。
【００６２】
知覚聴取モデルパラメータ変調
ＤｏｌｂｙＤｉｇｉｔａｌ及びＤｏｌｂｙＥのような知覚オーディオ符号化システムでは、知覚聴取モデル又はマスキングモデルを表し、またビット割当てプロセスに用いられるパラメータがある。特に、あるパラメータはスペクトル的に人の耳のマスキングカーブを模する。即ち、周波数に関して険しく減退する下向きマスキングカーブ、周波数に関して険しく減退する上向きマスキングカーブ及び周波数に関して徐々に減退する上向きマスキングカーブがある。これらは概略的に図９に示される。スペクトルマスキングは周波数領域概念であるが、これらのマスキングパラメータに関する標準名称は時間領域用語（例えば、「おそい」「速い」）を用いる。
【００６３】
図９に関して、スペクトルマスキングモデルに対応する符号化パラメータ要素は、マスキング信号に関してそれらのレベル及び傾斜（それぞれ、利得及びリーク）によって以下のように限定される。即ち、
下向きマスキングカーブ：ｂａｃｋｇａｉｎ／ｂａｃｋｌｅａｋ
上向きマスキングカーブ（速い）：ｆａｓｔｇａｉｎ／ｆａｓｔｌｅａｋ
上向きマスキングカーブ（おそい）：ｓｌｏｗｇａｉｎ／ｓｌｏｗｌｅａｋ
ｂａｃｋｇａｉｎ及びｂａｃｋｌｅａｋはＤｏｌｂｙＥ符号化で特定されているが、ＤｏｌｂｙＤｉｇｉｔａｌ符号化で特定されているパラメータとは異なることに注目せよ。ＤｏｌｂｙＤｉｇｉｔａｌでは、上記参照したＡ／５２文書に記載されるように、ｆａｓｔｇａｉｎパラメータは速い利得コード（ｆｇａｉｎｃｏｄ，ｃｐｌｆｇａｉｎｃｏｄ及びｌｆｅｇａｉｎｃｏｄ）、ｆａｓｔｌｅａｋパラメータは速い減退コード（ｆｄｃｙｃｏｄ及びｃｐｌｆｌｅａｋ）、ｓｌｏｗｇａｉｎパラメータはおそい利得コード（ｓｇａｉｎｃｏｄ）、ｓｌｏｗｌｅａｋはおそい遅延コード（ｓｄｙｃｏｄ及びｃｌｐｓｌｅａｋ）である。
【００６４】
上記限定されたパラメータの各々は、知覚符号化中ウォーターマークを伝えるための変調に適している。それらの任意の１つの変調はスペクトルマスキングモデルを僅かに変化させ、従ってビット割当てプロセスに影響を与える。従って、ウォーターマークを強くするようにマスキングパラメータは主入力信号としっかり結合される。図１０は、変調され得るスペクトルマスキングモデルのパラメータを例示する。
【００６５】
ＤｏｌｂｙＤｉｇｉｔａｌ及びＤｏｌｂｙＥ符号化システムのある他のパラメータは、総合的信号対ノイズ比（ＳＮＲ）を制御する。ＤｏｌｂｙＤｉｇｉｔａｌではこれらのパラメータはＳＮＲ相殺パラメータである。即ち、ｃｎｓｒｏｆｆｓｔ，ｆｓｎｒｏｆｓｔ，ｃｐｌｆｓｎｒｏｆｆｓｔ及びｌｆｅｓｎｒｏｆｆｓｔである。ＳＮＲパラメータは、信号及び量子化ノイズ間に所望の最低レベルの信号対ノイズヘッドルーム（上方空間）を維持するために存在する。これらのパラメータは、全スペクトルに一様に作用し、マスキング信号に関するスペクトルの一部分のみに主として影響を与えるスペクトルマスキングモデルパラメータとは異なる。
【００６６】
さらに他のパラメータは、臨界帯域を基礎として、「帯域化されたＳＮＲ」又はデルタビット割当てと呼ばれる、微細ＳＮＲ調節手段として作動する：即ち、ＤｏｌｂｙＤｉｇｉｔａｌ符号化におけるｄｅｌｔｂａ及びｃｐｌｄｅｌｔｂａである。
【００６７】
図１１Ａ〜１１Ｃ及び１２Ａ〜１２Ｃは、知覚符号化システムのマスキング閾値（図１１ＡのＳＮＲ相殺の変調及び図１２Ａの高速利得コードの変調）を変調する実例と、符号化システムがビット強制された場合（それぞれ、図１１Ｂ及び１２Ｂ）に結果的に生じる変調効果及び符号化システムがビット強制されてない場合（それぞれ、図１１Ｃ及び１２Ｃ）に結果的に生じる変調効果とを与える。図１１Ｄは図１１Ａ〜１１Ｃ及び図１２Ａ〜１２Ｃで用いられる凡例を識別する。ビット強制は、同一長さを有する符号化されたブロックを生じさせるためにコーダが制限されている時に起こり、これは多くの伝送チャンネルの要件である。コーダが、ブロックからブロックへのビット数を変化させ得るならば、信号を表すのに用いられるビット数への有効な強制はない。図示されるように（図１１Ｂ及び１２Ｂ）、ビット強制されたコーダでは、全周波数において復号された信号の量子化器エラーはマスキング閾値と正確に適合しない。即ち、例は、必要以上のビットが存在し（閾値と復号された信号間の間隙）、いくつかの周波数においてマスキング閾値及び原量子化器エラー間の正のマージンに帰着することを例示する。デフォルトパラメータ値に関して、意図されたウォーターマークシンボルは“０”のビット値であり得る。変調されたパラメータに関して、意図されたシンボルは、この例におけるように“１”のビット値であり得る。図１１Ａ及び１２Ａは、変調前後のマスキング閾値を示す。図１１Ｂ、１１Ｃ、１２Ｂ及び１２Ｃは結果的に生じる復号された信号を示す。変調されたマスキング閾値は、変調され、復号された信号スペクトルと比較するために図１１・１２Ｂ及び１１Ｃ・１２Ｃにおいて重ねられている。図１１Ｄは、図１１Ａ〜Ｃ及び１２Ａ〜Ｃで用いられる凡例を示す。
【００６８】
非マスキングパラメータ変調
図１３及び１４は、ドルビーコーダのマスキングパラメータ以外の変調パラメータから結果的に生じる信号特性の実例を与える。同図の各々において信号特性は、デフォルトパラメータ値及び変調されたパラメータ値を用いて例示される。図１３には結合パラメータを変調する効果が示される。水平軸上に示される適時の各ブロックにつき、左及び右と示された２つのチャンネルが例示される。使用中の結合フラッグが“０”ならば、各チャンネルは独立的に扱われる。使用中の結合フラッグが“１”ならば、２つのチャンネルは、ｃｐｌｂｅｇｆパラメータによって示される、ある周波数より上方で単一結合チャンネルに結合される。使用中の結合フラッグに加えて、同様に図１３に示される、結合開始周波数も変調され得る。
【００６９】
図１４には、位相フラッグを変調する効果が例示される。位相フラッグが“０”と等しいならば、位相は変調されないが、位相フラッグが“１”と等しいならば、信号の位相は１８０度変えられる。
【００７０】
ＴＤＡＣウィンドパラメータ変調
既に述べたように、知覚エンコーダは知覚的に冗長な情報を除くことによって入力信号のデータレートを低減させる。これらのシステムは、入力信号を１つ又はそれ以上の成分に分解することによって開始し、次いで量子化された成分が復号された後、原資料及び符号化された資料間の差が知覚不能にされる（又は許容可能な知覚可能性のレベルが達成される）ようにするために、知覚分析を用いてこれらの成分の各々がどれ位の精度を要するかを決定する。そのようなシステムの一例は、時間領域エイリアシング相殺（ＴＤＡＣ）変換を用いて一時的サンプルを周波数に基礎づけられた表現に変換する変換コーダである。完全な再構成を保証するために、変換に先立って重複ウィンドを用いて時間領域サンプルが処理される。変換後、次いでデータレートが低減される方法で周波数サンプルが量子化されかつ符号化されると共に復号に際して知覚的に無意味になるようにされる。デコーダにおける逆変換後完全な再構成を維持するために、時間領域サンプルは、エンコーダで用いられたものと適合するパラメータを用いてウィンド、重複及び加算される。概して、符号化及び復号ウィンドに対する各ウィンドパラメータは、順方向及び逆方向ＴＤＡＣ変換中にそれらが用いられる時、エイリアシングが最小化又は除去されるように選択される。ＴＤＡＣ変換を用いる変換符号化に関する詳細は、ＰｒｉｎｃｅｎａｎｄＢａｒｄｌｅｙによる「時間領域エイリアシング相殺に基づく分析・合成フィルタバンク設計」（ＩＥＥＥＴｒａｎ．ＯｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，Ｖｏｌ．ＡＳＳＰ−３４，Ｎｏ．５，Ｏｃｔｏｂｅｒ１９８６，ｐｐ．１１５３−１１６１）及びＰｒｉｎｃｅｎ他による「時間領域エイリアシング相殺に基づくフィルタバンク設計を用いたサブバンド・変換符号化」（Ｐｒｏｃｅｅｄｉｎｇｓ：ＩＣＡＳＳＰ８７，１９７８，Ｉｎｔｌ．Ｃｏｎｆ．ＯｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｅｄｉｎｇｓ，Ａｐｒｉｌ，１９８７，Ｄａｋｋａｓ，ｐｐ．２１６１−２１６４）に記載されている。
【００７１】
ウォーターマークは、変換された信号の構成又は再構成で用いられる時間領域変換のパラメータを変調することによって適用される。例えば、符号化及び復号中に用いられる時間領域ウィンドの傾斜又はアルファ（α）間の不適合は、臨界的にサンプリングされた変換を用いる場合時間領域エイリアシングに帰着する。このエイリアシングは、時間および周波数領域の双方において独特のノイズ又は歪みに帰着する。従って、エンコーダ又はデコーダのウィンドパラメータは、エンコーダ出力で検出可能なウォーターマークを伝えるために変調され得る。この意味での歪みは、符号化された原信号間の差として限定され、可聴人工品に帰着し得るか又は帰着し得ない。望ましい実施実施形態では時間領域ウィンドのアルファ（傾斜）値が変調される。知覚されないが原始信号に関連するか又はそれによって隠されているノイズ又は歪みを導入することによって、知覚され得る障害を生じることなく結果的に生じるウォーターマークを除去又は観察することは極端に困難になる。
【００７２】
ウォーターマークを伝えるために変更され得る時間領域ウィンドの別のパラメータはウィンドそれ自体の型である。例えば、Ｋａｉｓｅｒ−Ｂｅｓｓｅｌ限定されたウィンドは“０”のウォーターマークビットを埋め込むのに用いられ、一方Ｈａｎｎｉｎｇウィンドは“１”のウォーターマークビットを埋め込むのに用いられ得る。変調されたウィンド変更はエンコーダ又はデコーダで行われ得る。
【００７３】
さらに、検出可能性を改良しかつ知覚可能性を最小化するためにウィンドパラメータは、信号特性に依存して時間適応的に変調され得る。例えば、転移（過渡）信号はウォーターマーク信号を隠し得る、従って心理音響的一時マスキング効果を利用するためにウォーターマーク信号の位置を再配置させるように、これらの信号を検出して当該ウィンドを変調し得ることは有利である。さらに、変調の強さ、従って、符号化された信号におけるウォーターマーク信号の強さは、原始信号特性に依存して適応的に変更され得る。ウィンドパラメータが不適合である量は、追加された歪みの強さに直接影響を与える。従って、入力信号の心理音響的マスキング特性は分析されると共に、信号コンテントによってそれが最大限に遮蔽されるようにウォーターマークシンボルに対する不適合の量を変えるようウォーターマーク埋め込みプロセスに信号で知らせるのに用いられ得る。
【００７４】
直接形順方向ＴＤＡＣ変換方程式は下式で与えられる。即ち、
【数１】

【００７５】
ここでｎ＝サンプル番号
ｋ＝周波数ビン番号
ｘ（ｎ）＝入力ＰＣＭシーケンス
ｗ（ｎ）＝ウィンド周波数
Ｘ（ｋ）＝出力変換係数シーケンス
Ｎ＝変換サンプル総数
ｎ０＝変換サンプル総数の半分
Ｋａｉｓｅｒ−Ｂｅｓｓｅｌ　限定（ＫＢＤ）ウィンドは下式で与えられる。即ち、
【数２】

【００７６】
ここでＷＫＢは、下式で限定される、ＫａｉｓｅｒＢｅｓｓｅｌＫｅｒｎｅｌウィンド関数である。
【００７７】
【数３】

【００７８】
Ｉ０は、下式で限定される０次ベッセル（Ｂｅｓｓｅｌ）関数である。
【００７９】
【数４】

【００８０】
図１５は、長さ２５６の５つの重複するエンコーダウィンドを例示する。ウォーターマークは、ウィンド番号５に対してα＝４値を用いることによって符号化位相に挿入される。ウィンド４及び６は、α＝３の各ウィンド及びα＝４の一ウィンドの列間の平滑な転移を与えるためにα＝３及びα＝４の組合せを用いるハイブリッドウィンドであることに注目すべきである。同図では、各デコーダウィンドは全ての変換につきα＝３のウィンドを用いる。この各ウィンド型の不適合が、結果的に生じる出力信号に時間領域エイリアシング人口品（物）を導入する。復号されたオーディオ内に導入された時間領域エイリアシングの量は、エンコーダα値（α＝４）及びデコーダα値（α＝３）間の差が増加するにつれて増加し、エンコーダウィンド番号５によって処理されたオーディオ区分においてのみ存在する。α変更のこの方法は、ウォーターマークされた信号を伝えるためにデコーダが変更されることを要せずかつ信号の分配源におけるウォーターマーキングに関して有用である。
【００８１】
図１６は、長さ２５６の５つの重複するウィンドを再び例示するが、この例では、復号プロセス間に逆ＴＤＡＣ変換ウィンドによってαウィンド値が変更される。再び、時間領域エイリアシングが起こり、ウォーターマーク信号を復号された信号内に射出する。しかし、この例では、埋め込まれる信号はデコーダにおいて射出され、ウォーターマーク情報が特定の最終使用者又は装置に対して導入されることを可能にする。このα変更はデコーダで連続化された情報を信号データに埋め込むことを可能にする。
【００８２】
ウォーターマークを用いる場合より短い変換ウィンドを用いるのが有利であり得る。それは各ウィンドがエイリアシング歪みの継続時間を低減させると共にそれらが概して転移状態（オーディオ符号化においた）間に用いられるからである。転移信号に対する一時的マスキング特性は、「正しい」値からより大幅に異なるα値を用いるのに利用することが可能であり、それによってより強いウォーターマークを生じさせ得る。
【００８３】
ＴＤＡＣウィンド変調検出器
ＴＤＡＣウィンドのα値を変更することによって、符号化された信号に関連する時間領域エイリアシング信号が導入される。このエイリアシングは、スペクトルノイズ又は符号化された信号のスペクトル成分の歪みの導入として測定され得る。
【００８４】
可能な一検出方法では、図４及び５の方法のように、原始資料及びウォーターマークされたデータ間の差を比較し得る。この方法は、ウォーターマーク変更されたウィンドが用いられたスペクトル歪みに対する差信号を精査するであろう。スペクトル歪みが閾値を超えるならば、これは、データのウォーターマークされた部分につき「１」シンボルとして示される。閾値未満のスペクトル歪みは「０」シンボルとして検出されるであろう。
【００８５】
この方法は、ウォーターマークされた信号を遮蔽するために導入され得る広帯域ノイズに対して敏感であろう。他の検出方法は、ウォーターマークされた信号のスペクトルピークを追跡し、ウォーターマーキング用途の時間領域エイリアシングによって導入されるスペクトルピークの前後の双方で周波数ビン（入れもの）の振幅変調を探すことである。以下に述べる一般的スペクトル歪み方法と同様に、この検出方法は、優勢なスペクトル成分を取囲む周波数ビンを閾値と比較するであろう。しかし、この閾値は原始信号のスペクトル成分の強さに関連づけられるであろう。閾値下方のスペクトルサイドローブ（側突出部）は「０」シンボルとして判断され、上方のスペクトルサイドローブは「１」シンボルとして判断されるであろう。
【００８６】
ＴＮＳフィルタ係数変調
一時的ノイズ整形は、知覚符号化におけるプリエコー人工品の防止を助長し得る符号化技術である。それは、ＪｕｒｇｅｎＨｅｒｒｅ及びＪａｍｅｓＪｏｈｎｓｔｏｎによる「一時的整形（ＴＮＳ）による知覚オーディオコーダの性能向上」（１０１^ｓｔＡＥＳ（ＡｕｄｉｏＥｎｇｉｎｅｅｒｉｎｇＳｏｃｉｅｔｙ）ＣｏｎｖｅｎｔｉｏｎＰｒｅｐｒｉｎｔ４３８４，Ｎｏｖｅｍｂｅｒ８−１１，１９９６）に記載されている。周波数領域での予測符号化は、時間領域における量子化ノイズを整形するのに用いられる。予測は、時間領域において量子化ノイズがどこに配置されるかを制御するのを助長する。オーディオ符号化の場合には、プリエコーを避けるのを助長するためにノイズは時間領域マスキング信号の振幅包絡線以内に強制される。プリエコーは、転移状態間に起こる人工品であり、用いられた周波数変換が、出力信号の転移前に量子化ノイズが起こるのを防止するのに十分な時間分解能を持たない場合に発生する。
【００８７】
一時的ノイズ整形（ＴＮＳ）はＭＰＥＧ−２ＡＡＣ知覚符号化システムの特性であるが、ＤｏｌｂｙＤｉｇｉｔａｌのような他のシステムにも用いられ、従って、そんな他のシステムのパラメータを変調するさらなる方法を与える。
【００８８】
本発明のこの面によると、１つ又はそれ以上のＴＮＳフィルタパラメータが変調される。特に、ＴＮＳノイズ整形フィルタ順序及びＴＮＳノイズ整形フィルタ形状は、以下にさらに述べるように変調されうる。
【００８９】
ＴＮＳプロセスは以下の段階を含む。即ち、
１．時間対周波数変換を用いることによって信号をスペクトル係数に分解し、
２．ウィンド化された自動相関マトリックスを形成し、再帰（帰納）を用いることによって標準線形予測器を作動させ、
３．予測利得がある閾値を超えるならば、ノイズ整形フィルがスペクトル係数に用いられることである。
【００９０】
本発明は、ＴＮＳ処理間に用いられるノイズ整形フィルタに頼る。スペクトル領域フィルタは、任意の数の異なった一時的応答においてノイズを整形するように変更され得る。スペクトル領域濾波を介してこの一時的包絡線のいくつかのパラメータを変えることによってウォーターマークが信号内に埋め込まれ得る。言い換えると、ノイズ整形フィルタをスペクトル又は周波数領域において変調し、それによって時間領域における量子化ノイズを変化させる。
【００９１】
時間に対して音圧レベル（ＳＰＬ）をプロットする典型的な一時的包絡線応答が図１７に例示される。
【００９２】
一時的マスキングモデルは、いくつかの知覚コーダで用いられるスペクトルマスキングモデルに極めて類似する。特に、スペクトルマスキング用の下向き及び上向き包絡線は、逆方向及び順方向一時的マスキング包絡線に類似する。本発明の面により変調され得るＴＮＳパラメータをより特定的に識別するために、一時的ノイズ整形プロセスの作用（操作）の一部をさらに詳細に検討することは有用である。時間対周波数変換を用いて信号をスペクトル係数に分解した後、予測利得がある閾値を超えるかどうかを決定すると共に信号の包絡線を得るために、スペクトルデータにつき線形予測符号化（ＬＰＣ）計算がなされる。予測係数は次いで以下の各ブロックに対する各ＴＮＳフィルタにつき計算される。即ち、
ｈ＝Ｒｘｘ−１ｒｘｘ
ここで
ｒｘｘＴ＝｛Ｒｘｘ（ｉ，ｊ）｝；Ｒｘｘ（ｉ，ｊ）＝ＡｕｔｏＣｏｒｔ（｜ｉ−ｊ｜）；ｉ，ｊ＝１，２，．．．．，Ｎ
ｒｘｘ’＝ｒｘｘ＊ｗｉｎ
ここでＲｘｘはＮｘＮ自動相関平方マトリックス、ＮはＴＮＳ予測順序（オーダ）、ｈはベクトル最適化予測係数である。これらの方程式は、最少予測誤差場予測に用いられた全データに直角であるとの直交性原理に基づく。
【００９３】
初期時点において、自動相関マトリックスは下式により計算される。即ち、
【数５】

【００９４】
【数６】

【００９５】
ここで
Ｆ_ＳＡＭＰ＝信号サンプリングレート
ＴｉｍｅＲｅｓｏｌｕｔｉｏｎ（時間分解能）変数は、ビットレート及びチャンネル数に依存する。同様に、変換ブロック長さはｔｒａｎｓｆｏｒｍＲｅｓｏｌｕｔｉｏｎ（変換分解能）変数を限定する。
【００９６】
ノイズ整形フィルタの最適順序は、反射係数を係数列の終端からある閾値下方に移動させることによって決定される。ウォーターマークを伝えるために変調され得る一パラメータは、ノイズ整形フィルタ順序である。例えば、１つの意味のウォーターマークビットは最適フィルタ順序によって表され、他の意味のウォーターマークビットは非最適フィルタ順序によって表され得る（より低いか又はより高く）。ウォーターマークを伝えるために変更され得る他のパラメータは、ノイズ整形フィルタそれ自体の形状である。例えば、１つの意味のウォーターマークビットは、ＬＰＣ計算によって決められる最適係数を用いることによって示され、一方他の意味のウォーターマークビットは、係数を変更することによって、従って、ノイズ整形フィルタの形状によって示され得る。
【００９７】
ＴＮＳパラメータ（フィルタ順序又はフィルタ係数）を変調することによって、それが復号された出力信号において検出され得るように、ノイズは入力信号の一時的包絡線内で変調される。図１８は、一時的マスキング包絡線の一例及び同包絡線内で量子化器エラーが変調され得る可変性の一例を示す。丁度いい時点にある各ブロックでウォーターマークを伝えるためにＴＮＳパラメータが変調され得る。
【００９８】
本発明の実際的実施形態は、非常に強いウォーターマーキング解決策を与え得る。ＴＮＳプロセスによって加えられるノイズが原始信号の包絡線にしっかり結合されるので、原信号を劣化させることなくウォーターマークを除去することは非常に困難である。
【００９９】
本発明に記載されるウォーターマークの透明性は、以下に記載される型の適応的歪みプロセスを用いることによって制御され得る。この場合には、ＴＮＳを用いて信号の一時的包絡線が一度変更されてしまうと、その結果が一時的マスキング閾値の一時的又はスペクトル表現と相互作用的に比較される。閾値が超えられると、一時的マスキングパラメータに調節がなされ、ウォーターマークされた信号の強さ及び知覚可能性間の所望のバランス（釣合い）を保証するために当該プロセスが反復される。
【０１００】
図１８に示されるマスキング特性は該信号のサブバンドに加えられ得る。これはウォーターマークを埋め込むために潜在的により多くの位置に沿ったウォーターマークの層形成を可能にする。
【０１０１】
変調帯域幅
オーディオ信号の帯域幅を低減させることは、それが約１６ｋＨｚの最低レベルを超えて残る限り、本質的な品質の最少劣化を生じさせる。同様に実験によって帯域幅が動的に変えられると、それが最低レベルを超えて残る限り、最少の劣化が示されている。帯域幅が、エンコーダ又はデコーダ内の補足又はウォーターマーク信号により変調されるならば、同信号は復号されたオーディオから導出され得る。例えば、一ビットコードは、１６ｋＨｚの帯域幅が“０”シンボルを表し、２０ｋＨｚの帯域幅が“１”を示すところでオーディオ信号内に埋め込まれ得る。これは、より高い埋め込まれた信号データレートを生じる多重ビットシンボルを表す多重振幅に拡張され得る。図１９は、４つの帯域幅を用いる２ビットシンボルを例示する。この戦略は、強くない、聴取不能なウォーターマークが必要とされるところで用いられ得る。聴取不能規準は、上記のように達成され得る。この戦略は強くない、それはウォーターマークが、復号されたオーディオ信号を低域・通過濾波することによって容易に除去され得るからである。
【０１０２】
図２０は、異なったシンボルを表すために同信号の帯域幅を用いる、埋め込まれた信号を含むオーディオ信号の一例を示す。
【０１０３】
上記の帯域幅ウォーターマーキングに伴う一問題は、それが最少帯域幅を超えた信号コンテントの存在に依存することである。当該時間の大部分につき最少帯域幅を超えた信号コンテントは存在しない。一定の埋め込まれた信号データレートは、高周波信号コンテントなしでは達成され得ない。例えば、オーディオ信号コンテントが１ｋＨｚにおける単一正弦波からなるらば、この信号に埋め込まれたデータを送信する唯一の可能な方法は、帯域幅を１ｋＨｚ未満に低減させることであろう。これは明らかに聴取可能でありかつ原信号を破壊するであろう。
【０１０４】
一定のウォーターマーク埋め込みレートを与え得る方法は、オーディオ信号が高周波エネルギーを含むことを保証することである。これを達成させる一方法は、聴取者がそれを知覚しないようにオーディオ信号の上部信号にノイズを付加することである。付加されたノイズが人の聴取閾値未満又はそれと等しいならば、それは知覚不能である。このノイズの付加で、埋め込まれた信号は、一定のデータレートを与える信号送信機構としてオーディオ帯域幅を用いることができる。このノイズは、信号送信信号帯域内に加えられることのみを必要とすることに注目せよ。この信号送信帯域幅は、ウォーターマークを配置するのに用いられる、最低周波数及び最高周波数間の帯域幅として限定される。信号送信帯域はより小さい区分に分割されることが可能で、ウォーターマークを生じさせるためにそこでは３つ以上の帯域幅が用いられる。
【０１０５】
図２１は、聴取閾値の近似レベルへの整形されたノイズの付加を例示する。それは単一の正弦波のみからなる信号に加えられかつ信号送信帯域においてのみ付加される。信号送信帯域幅内へのノイズの付加は、聴取閾値のみによって制限されるべきではなく、エネルギーがそれを超えるならば、それは多分聴取可能であろう。ノイズの振幅を聴取閾値未満に調節することによって信号送信の別の次元（要素）が付加され得る。例えば、信号送信帯域の区域におけるエネルギーが唯１つのエネルギー状態を含みかつ半分のエネルギー状態を加えることによってエネルギー状態を含まないならば、付加データは隠されるか又は挿入される。この振幅信号送信は、埋め込まれた信号のデータレートを増加させるであろう。
【０１０６】
いくつかの信号コンテントが丁度上部帯域幅未満であることが保証される限り、同信号は検出可能である。信号送信帯域幅以内において追加された信号が各チャンネル内で類似していることは重要である。多くの場合において、これらの信号は電気的又は音響的に混ぜられ、それらが互いに相殺しないことは重要である。同位相正弦波が多重チャンネルに加えられて信号送信のために用いられるならば、音響的に加算されるとそれらは位置に依存して相殺するであろう。これはウォーターマークの信頼性を低減させる。独立した無作為ノイズを用いることは、混ぜられる時それが相殺しないのでよりよい解決方法である。
【０１０７】
信号コンテントは信号送信帯域内で起こり、かつ一定の埋め込みレートを保証するために整形されたノイズが加えられるので、２つの信号が加えられ、時々信号送信帯域内のエネルギーを増加させる。このエネルギー可変性は、検出プロセスをより困難にさせる。本発明のこの面の望ましい実施形態では、信号送信帯域内のあらゆる原信号相互作用を除去するために、整形されたノイズの追加に先立って低域濾波フィルタが原始信号に用いられる。
【０１０８】
ＤｏｌｂｙＤｉｇｉｔａｌアルゴリズム又は符号化プロセスにおいては、たとえ上部周波数帯域内のコンテントが無意味と決定されても、整形された無作為ノイズをパワースペクトルに加えるためにデコーダが用いられ得るビットストリーム内に粗いパワースペクトルが送信される。これが、ビットストリーム内のディザフラッグが使用可能にされるとき作動されるデコーダの特徴である。デコーダ内で加えられたノイズは、たとえデコーダがそれを知覚的に無意味と判定していても、復号されたオーディオ内にウォーターマークを再現する。該ウォーターマークは、符号化又は復号のいずれかのプロセス間に挿入され得る。
【０１０９】
ＤｏｌｂｙＤｉｇｉｔａｌオーディオコーダは、２つの帯域幅パラメータ（図２１の表の上方に列記されたｃｈｂｗｃｏｄ及びｃｐｌｅｎｄｆコード）の１つにより帯域幅内の諸変化を発生させ得る。これは、ウォーターマークを実行する有効な方法を作り出す。しかし、復号された信号に検出し得る変化を発生させるためにこれらのコードを変調することは、埋め込まれた信号データレートにいくつかの限定を与える。即ち、
１．信号をダウンミキシングすることで埋め込まれたデータを破壊しないように全てのチャンネルが同一帯域幅を含むべきである。これは、埋め込まれたデータレートをモノラルチャンネルの等価物に限定する。
【０１１０】
２．最適音質のために、帯域幅コードはフレーム当たり一度だけ送られるべきであり、それが埋め込まれたデータレートをシンボル深さ及び符号化されたサンプルレートに限定する。帯域幅コードがフレーム当たり一回を超えて変化されるならば、符号化されたオーディオの総合音質は低下されるであろう。
【０１１１】
３．利用可能なシンボル数は、最少帯域幅のを超える利用可能な帯域幅コードの数に限定される。
【０１１２】
例えば、４８ｋＨｚでデータを埋め込むためにコーダが２つの異なった帯域幅状態を用いるならば、埋め込まれたデータレートは約３１．２５ｂｐｓ（毎秒３１．２５フレーム、各々が１ビットの情報を含む）である。４８ｋＨｚで４つの帯域幅状態を用いるならば、データレートは６２．５ｂｓｐである。これ等の数字は、各ＤｏｌｂｙＤｉｇｉｔａｌフレームがフレーム当たり１５３６の独特のオーディオサンプルを含むことから得られる。フレーム当たり２０４８の独特のオーディオサンプルを含む、他のコーダが用いられるならば、データレートは、１ビットコードにつき約２３．５ｂｓｐになるであろう。
【０１１３】
ＤｏｌｂｙＤｉｇｉｔａｌコーダは、各オーディオフレームでエンコーダビットストリームのパワースペクトル密度の近似値を送る。それはオーディオスペクトルに有意な変化がある時点毎に更新される。パワースペクトル密度情報は、周波数で線形に隔置される指数として送られる。ＤｏｌｂｙＤｉｇｉｔａｌデコーダでは、信号情報は重要と見なされなかったので、量子化された情報を受信しなかったスペクトルの全ての部分にディザが加えられる。本質的に無作為ノイズであるディザは、指数のレベルに関して定率決定される。これはスペクトルのその部分に信号エネルギーを加える。信号送信帯域幅の各指数が聴取閾値未満又はそれと同一に整形されるならば、ディザは信号エネルギーを保証する。
【０１１４】
以下の段階は、ＤｏｌｂｙＤｉｇｉｔａｌ符号化された信号以内の信号送信帯域内にはエネルギーがあることを保証する現方法を略述する。
【０１１５】
１．聴取閾値又はそれ以下になるように整形されべき最少信号送帯域幅を超えて無作為ノイズが加えられる。これは最少エネルギーが聴取閾値の形状に従うようにさせる。
【０１１６】
２．ノイズ追加後計算される指数はこの最少エネルギーを捕捉する。
【０１１７】
３．デコーダは、たとえ最少信号送信帯域幅以上に割当てられているビットがなくても、ディザが通常加えられるので、送信される指数からスペクトルエネルギーを再現する。これは、埋め込まれた信号送信につき信号コンテントを保証する。
【０１１８】
上記の２つの技術（帯域幅変更及びディザ）は、低複雑性、固定ビットレートウォーターマークをＤｏｌｂｙＤｉｇｉｔａｌ内に統合するために用いられ得る。本システムは、ダウンミキシング、ダイナミックレンジ制御、ボリューム標準化、マトリックス環境復号等を含む、エンコーダ・デコーダ系の「通常使用」に対して強い。
【０１１９】
従って、本発明のこの面の実施形態は以下の段階を含む。即ち、
１．隠されたデータ信号を埋め込むために帯域幅を調節する。
【０１２０】
２．隠されたデータ信号を埋め込む帯域幅を調節するためにＤｏｌｂｙＤｉｇｉｔａｌ符号化・復号システムの帯域幅コードを用いる。
【０１２１】
３．一定レートでデータを埋め込むために信号コンテントが用いられることを保証するために信号送信帯域にノイズを加える。
【０１２２】
４．加えられたノイズの聴取可能な知覚を防止するためにこの追加されたノイズが人の聴取閾値未満又はそれと等しくなるように調節する。
【０１２３】
５．埋めこまれた信号のデータレートを増加させるために信号送信の別の次元を加えるこの追加されたノイズの振幅を調節する。
【０１２４】
６．信号送信帯域以内の信号コンテントを保証するための整形されたノイズとＤｏｌｂｙＤｉｇｉｔａｌコーダとの統合。
【０１２５】
ウォーターマーク検出器は、再生されたオーディオ信号以内に含まれる埋めこまれた情報を判断（解明）する。それが電気的かつ音響的の双方で情報を引き出せることが望ましいが、この能力は全ての用途につき必要としなくてもよい。音響的処理後ウォーターマークを引き出すことは、部屋ノイズの付加、スピーカ及びマイク特性及び総合的再生音量のためにより困難な挑戦と考えられる。
【０１２６】
検出器の目標は、オーディオの帯域幅を見出すために所与の信号送信帯域以内にエネルギーがあるかどうかを決定することである。これは、フーリエ変換、信号送信帯域を分析する帯域濾波フィルタのグループ等、によって計算され得る音声（オーディオ）の分解を要する。各信号送信帯域のエネルギーはこの信号分解から得ることができる。検出器は、埋めこまれたシンボルを決定するためにこのエネルギー情報を用い得る。
【０１２７】
可能な一検出方法では、符号化されたシンボルを決定するために各信号送信帯域における固定された閾値比較を用いる。この閾値は最低ノイズの丁度上のエネルギーレベルに設定され得る。このレベルを超えるものはすべて信号レベルを含むと考えられるであろう。図２２は、２ビットシンボルを作り出す４つの異なった帯域幅を検出するのに要する３つの異なったエネルギーレベルを示す。検出閾値を越えるあらゆるエネルギーは「高」と見なされ、それ未満のものはすべて「低」とみなされる。
【０１２８】
この固定閾値は、システムの最低ノイズが常に既知でありかつピーク信号レベルが決して飽和しない閉じた環境においてのみ十分に作動する。例えば、上記図において任意のノイズが該最低ノイズに加えられると、第３のエネルギーレベルが「高」とみなされ、正しくないシンボルが判断されるであろう。
【０１２９】
閾値計算前にエネルギーレベルが等価化されるか又は正規化されるならば、固定閾値を用いることが可能である。これを達成する一技術は、エネルギーレベルがが決定される前にＡＧＣアルゴリズム又はプロセスを信号送信帯域に用いることである。「低」及び「高」レベルがより一貫性を持つようにこれらのレベルがＡＧＣによって正規化される。レベル正規化のためにこの場合には固定閾値が用いられ得る。
【０１３０】
ノイズレベル及び信号エネルギーが常に変化する環境に対しては適応閾値が最良と考えられる。適応閾値を用いる可能な一検出方法は、現状態に対する閾値を計算するために先のエネルギー状態を用いる。所与のエネルギー帯域に対する有限数の先行状態においては、それぞれ「高」及び「低」状態の幾つかのエネルギーレベルが存在すべきであることを前提としてこの検出器は作動する。最大エネルギー及び最小エネルギーがそれぞれ「高」及び「低」と見なされ得る。これらの「高」及び「低」状態は２つの異なったグループと見なされ得る。閾値は、これら２つの群間のどこかにあると決定され得る。
【０１３１】
前記有限セットにおいて「高」及び「低」状態の数がひとしいと仮定されるならば、最大半分が「高」に属し、同時に最小半分が「低」に属する。各グループにつき平均エネルギーレベル又は平均が見出されるならば、これら２つの平均値の平均として簡単な閾値が計算され得る。平均及び分散のような各グループ統計をさらに考慮した２つのグループ及び閾値に対する異なった貢献度を仮定することによって、これは容易により複雑になり得る。
【０１３２】
「高」及び「低」グループへの分離を改良する他の考察もあり得る。３つ以上の帯域幅が埋め込みプロセスに含まれるならば、信号送信帯域のエネルギーレベルは相互に依存する。最高の帯域幅が「オン」ならば、各信号送信帯域内のすべてのエネルギーレベルが「高」として検出されるべきである。２番目の最高帯域幅が「オン」ならば、この帯域幅より低いすべての信号送信レベルが「高」として検出されるべきでである。これは各信号送信帯域につきエネルギーレベルの分配を変える。
【０１３３】
例えば、ウォーターマークエンコーダは４つの異なった帯域幅を用いて２ビットシンボルを発生していると想定する。Ａ、Ｂ、Ｃ及びＤが帯域幅を表わし、ここではＡが最低帯域幅であり、Ｄは最高帯域幅である。これらの帯域幅を決定するためには３つの異なったエネルギーバンドが必要とされる。これらの３つのエネルギーバンドが、それぞれ帯域幅Ａ−Ｂ、Ｂ−Ｃ及びＣ−Ｄで表わされる、１、２及び３によって表わされるとしよう。以下の表は、シンボルが一様に分配されるならば、各エネルギーバンドが「高」状態になる確率を列記する。
【０１３４】
【表１】

【０１３５】
各エネルギーバンドの帯域幅への依存のために確率は等しくない。例えば、エネルギーバンド１の信号コンテントの確率は、Ｂ、Ｃ及びＤシンボルの発生確率の和である。各シンボルは１／４の発生確率を持つ；従って、エネルギーバンド１の信号コンテントの確率は３／４である。
【０１３６】
各エネルギーバンドにつき現閾値を計算するために先の４０状態が用いられるならば、最高３０状態がエネルギーバンド１以内の信号コンテントを与えると想定される。残りの１０サンプルは信号コンテントを表わさないであろう。この場合の現閾値は、これらの２グループ間の平均値の平均を取ることによって決定される。
【０１３７】
シンボル分配が実質的に一様であることを保証するためにチャンネル符号化の付加はこの検出器によって肝要である。エンコーダが、延長された期間に亘り丁度最高であった帯域幅シンボルを入力したならば、この検出器は埋め込まれたデータを復号するのが困難であろう。シンボル分配が想定された確率により接近すればするほど、埋め込まれたデータの検出はより正確になる。
【０１３８】
１つの可能なチャンネル符号化方法は、有限期間を通じて各シンボルが一回のみ起こることを保証することである。例えば、４つの異なった帯域幅コードがあれば、各シンボルは４シンボルのグループ内で一回起こることを要する。これは４つの帯域幅コードのグループである２４の独特のシンボルを発生させる。２４（４連乗積）は４帯域幅コードの順列の最大数である。Ａ、Ｂ、Ｃ及びＤが４つの帯域幅コードを表わすならば、シンボルは、ＡＢＣＤ、ＢＡＣＤ、ＡＢＤＣ、ＢＡＤＣ、ＢＣＡＤ等に見えるであろう。これが埋め込まれたデータレートを低減させることに注目せよ。
【０１３９】
従って、本発明のこの面によるウォーターマーク検出器は以下を含む。即ち、
１．先の状態を調査することによって計算される適応閾値を用いる埋め込まれた信号検出器。先の状態はエネルギーレベルに基づいてグループに分割される。閾値は、できる限りグループを分断せんと試みる各グループの統計に基づく。
【０１４０】
２．多重グループが関連するならば、グループ内の要素の数が帯域幅調節からの依存性に基づいて調節される。
【０１４１】
３．シンボルの分配が有限時間に亘って一様に近いことを保証するチャンネルコーダ。これはウォーターマーク検出器が適切に機能することを保証する。
【０１４２】
パラメータ変調適応歪み制御強さの制御
本発明の一目標は、最大化された検出可能性及び最少化された知覚可能性を有するウォーターマークを埋め込むことである。知覚コーダは、入力信号の冗長性をどのように低減させるかを決定するために知覚可能性の閾値を用いる。この同一閾値が、検出可能であるが同時に実質的に知覚されずに留まるようにウォーターマーク信号を調節するために用いられ得る。
【０１４３】
既に述べたように、幾つかの知覚エンコーダでは、正しい情報が放棄されることを保証するために歪み測定がレート制御と対をなすようにされる。歪み測定値は、原入力信号を符号化された信号（レート制御の出力）と比較する。歪み測定は、レート制御プロセスの成果を変えるようにいくつかの符号化パラメータを制御するのに有用であり得る。これは、以下に述べる、外側ループがひずみ測定値を含み、内側ループがレート制御手段である、入れ子式ループ構造を作り出し得る。符号化パラメータに対する変更は、いくつかの基準が満たされる迄歪み測定を調査することによって双方向的になされる。同じ接近手段が、レートループを移動することによって、可変データレートエンコーダに用いられ得る。
【０１４４】
本発明の一面による知覚可能性閾値を用いてウォーターマークを埋め込むプロセスは図２４〜２６に示される。このプロセスは、２つの入れ子式ループを用いて最適量子化が決定されるＭＰＥＧ−２ＡＡＣ知覚コーダで限定されたものと同様である。図２４に示される内側繰返しループは、スペクトルデータが多数の利用可能なビット（レート制御）で符号化され得るまで量子化器ステップサイズを変更する。図２５に示される外側繰返しループは、心理音響モデルの要求が可能な限り（歪み制御）満たされるように、すべてのスペクトルバンドのスペクトル係数を増幅する。図２５のプロセスは、心理音響モデル又は知覚閾値を可能な限り満たすために知覚符号化パラメータ（図２６に示される）を変調すると同時に、同様にウォーターマーク信号を埋め込むことによって変更される。図６、７及び８の表に列記されたパラメータの全てが、このように変調され得るが、いくつかのパラメータは他のものよりビット割当てプロセス中変化するのがより困難である。
【０１４５】
図２４のレート制御プロセスは、当該信号を情報のより少ない固定量によって表わすことを試みる。入力信号は知覚閾値（段階２０）により量子化され、量子化の結果として用いられるビットがカウント（段階２２）される。用いられるビット数が利用可能ビット数を越えないならば、そこでプロセスが終了（段階２４）される。その代わりに、繰返しプロセスは、用いられるビット数が利用可能ビット数に可能な限り適合するまで続く。これは通常、量子化器ステップサイズ変更を介して、十分な情報が放棄（段階２６）されしまうまで知覚閾値を調節することによって達成される。
【０１４６】
図２５に示される歪み測定プロセスは、レート制御符号化プロセスの単純化の幾つかが容易に知覚されるエラーを引き起こさなかったことを保証するために量子化器ステップサイズプロセスに追加され得る。歪み測定はそんなエラーを最少化させるために符号化パラメータの微細同調を可能にする。当該プロセスの第１段階では、レート強制（段階２８）により入力信号を量子化するようにレートループ、即ち、内側ループが作動される。次いで、どれくらい歪みが存在するか（段階３０）を計算して知覚閾値（段階３２）に関して当該歪みが許容可能かどうかを決定する歪み評価がなされる。歪みが許容できないならば、スペクトル係数が増幅され（段階３４）てプロセスが繰り返される。歪みが許容できるならば、量子化の結果が入力信号に加えられて（段階３６）プロセスが完了される。この意味では、「歪み」は符号化された信号及び原信号間の差であり、聴取可能な人工品（物）に帰着し得るか又は帰着し得ない。
【０１４７】
本発明の各面では、図２６に示される歪み測定プロセスは、符号化パラメータ値が変調された場合にその省略値から変化され得るが、それでもなお知覚閾値の限界内に止まる量を決定するために用いられる。これはウォーターマークの可能な検出を最大化させる。それはむしろ、知覚閾値によって強制されて、歪みが知覚されることなく可能な限り大きな歪を生じさせるからである。レート制御（段階２８）、歪み制御（段階３２）及び符号化パラメータ調節（段階３８）の各段階は許容可能な妥協がなされるまで繰り返される。
【０１４８】
ＤｏｌｂｙＤｉｇｉｔａｌのような、ある符号化システムは符号化中レート制御プロセスを用いるが歪み制御は用いない。それ故に、そんな符号化システムが本発明のこの面を用いるために、歪み測定が加えられる。ＭＰＥＧ−２ＡＡＣのような他のコーダは、符合化の目的で歪み制御プロセスが既に統合化され、僅かな変更で本発明のこの面により同様にウォーターマークを付けるために用いられ得る。可変レート符号化システムではレートループは不要であり、従ってパラメータ変調プロセスに最適解決手段を与えると同時に複雑性をも低減させることに注目すべきである。
【０１４９】
図２７は、今説明した型の歪み測定プロセスを用いて本発明によりウォーターマークがどのように埋め込まれ得るかを例示する。望ましくは、目標は変調されたパラメータの効果を強制することによって、可能な限り知覚閾値に近くなるように、強さを最大化させることにあり、それがパス２の量子化エラーの変化として例示される。第１パスでは、知覚閾値が計算される。第２パスでは量子化器エラーが示される。量子化器エラーを知覚不能に変更させる入手可能なマージンがいくつかあることに注目せよ。パス３では、選ばれたウォーターマーク符号化パラメータ、この例ではデルタビット割当てパラメータ（即ち、デルタ又はｃｐｌｄｅｌｔｂａパラメータであり、それは臨界帯域以内で量子化器エラーに影響を与える）が調節されてしまっていて変更された量子化器に帰着する。量子化器エラーはなおさらに変更されることが可能であり、それでもまだ知覚不能のままである。符号化パラメータの変調は、利用可能な多数のビットが影響を受けるので、全スペクトルに亘って僅かに異なった量子化エラーに帰着することに注目せよ。これは符号化パラメータの変調及びいくつかのバンドにおける結果的に生じる量子化分解能が、パラメータが変調されるバンドのみならず全スペクトルのエラーを惹き起こすことを例示する。パス４では、符号化パラメータの変調度合いが再びパス３からの情報を用いて調節されてしまっており、かつ結果的に生じる量子化器エラーは知覚閾値に可能な限り近くなる。量子化器エラーを知覚閾値に近づけるが、それより下方にもたらすことは望ましいが、量子化器に影響を与える１つ又はそれ以上のパラメータを変調する場合、本発明は同様に量子化器エラーが、例えば図２７のパス３に対するように、知覚閾値より下であるがそれに近くないように１つ又はそれ以上のパラメータの変調も考えている。
【０１５０】
図２８は、選ばれたウォーターマーク符号化パラメータが総合ＳＮＲ相殺型パラメータ（即ち、ｃｓｎｒｏｆｆｓｔ，ｆｓｎｒｏｆｆｓｔ，ｃｐｌｆｓｎｒｏｆｆｓｔ又はｌｆｅｓｆｓｎｒｏｆｆｓｔパラメータ）ウォーターマーク埋め込みプロセスを例示する。この例では、総合ＳＮＲ相殺パラメータの変調は知覚閾値に正確に適合するものに帰着することに注目せよ。これは、パラメータのＳＮＲ相殺型が周波数スペクトル全体に亘る知覚閾値の一様な相殺だからである。従って、ＳＮＲ相殺型パラメータを用いて量子化器エラーを知覚閾値に適合させるプロセスは、唯一段階を要するに過ぎない。
【０１５１】
本発明のこの面のさらなる局面は、使用者がウォーターマークの可能な「利得」又はエネルギーを制御する知覚閾値の相殺を制御することを可能にする。これは知覚閾値に対する線形相殺か又は特定のバンドにおいてより多くの歪みを可能にするより複雑な機能であり得る。これは知覚閾値曲線を固定した量だけ上げることによって達成され得る。さらに、視覚閾値を変更することによって、使用者はウォーターマーク符号化マージンが負である限りウォーターマークを埋め込み得る。
【０１５２】
ＤｏｌｂｙＤｉｇｉｔａｌ、ＤｏｌｂｙＥ及びＭＰＥＧ−２ＡＡＣコーダのような知覚コーダでは、量子化又はビット割当てプロセスは、当該コーダに用いられ得るビットの数及び総合的な信号対ノイズ比に基づいて計算される。次に、知覚閾値が量子化エラーと比較される。歪み（知覚閾値及び量子化エラー間の差）が完成要件を満たさないならば、選ばれた符号化パラメータ変調が歪みに基づいて変更されて歪みが許容され得るまでプロセスが繰り返される。
【０１５３】
本発明のこの面の望ましい実施形態では、ひずみは知覚閾値の基礎を形成するバンド化された係数のグループ（即ち、臨界バンドによってグループ化される）から計算される。同様に知覚閾値は、増大された複雑さを犠牲にして個々のスペクトル係数の量子化エラーに基づかされ得る。
【０１５４】
一度閾値が確立されると、本発明のこの面の歪み制御部分が始まる。試験中の符号化パラメータは、後続する歪みプロセスの繰り返しにより変調される。符号化パラメータの変調は、レート制御プロセスで行われるスペクトルバンドのビット割当ての結果に影響を与える。結果的に生じるビット割当ての閾値が原知覚閾値と比較され、完成要件が満たされるまで符号化パラメータが繰り返し変調される。完成要件が満たされないならば、変調されたパラメータを用いてマスキング閾値が変調される。
【０１５５】
本発明のこの面の望ましい実施形態では、知覚閾値及びマスキング閾値があらゆる興味のある所与のバンドにつき同等でありかつマスキング閾値の各バンドが知覚閾値を超えないならば、適応歪みプロセスの終結が起こり得る。知覚及びマスキングの各閾値が決して収束しないならば、マスキング閾値が知覚閾値を超えない限りさらなる終結論理が用いられ得る。終結要件は、複雑性を強制するために存在する。
【０１５６】
デコーダパラメータ変調
図２９は、知覚オーディオデコーダのパラメータが変調される本発明の一面を示す。この例では、デコーダはハイブリッドビット割当て（即ち、知覚モデルがエンコーダからデコーダへ伝えられる）を用いる。受信された知覚復号されたビットストリーム４０は、デコーダで符号化パラメータ４２（ビット割当てモデルを表す）及び再フォーマット化されたデータ４４（即ち、量子化されたデータ）に分離される。ビット割当て４６及び逆量子化４８が行われる。次の段階５０で決定がなされる（知覚閾値は計算されたか？）。まだ計算されてないならば（即ち、始めてループを通る）、符号化されたビットストリームからの信号に基づいて知覚閾値が計算される（段階５２）。知覚閾値が存在するならば（即ち、始めてループ通過後）、逆量子化された信号及び閾値間で比較がなされる（段階５４）。次に、段階５６で決定がなされる（許容可能な歪み？）結果的に生じる歪みが許容され得る（即ち、予め限定された終結要件を満たす）ならば、次いでプロセスが完了されてスペクトル係数がデコーダの他のファンクションに出力される。歪みが許容されないならば、変調中の符号化パラメータが調節されて（段階５８）、ビット割当て、逆量子化及び知覚閾値比較のプロセスが繰り返される。符号化パラメータがウォーターマークシンボル（即ち、補足情報）入力に基づいて初期変調され、その後知覚閾値比較に基づいて調節される。
【０１５７】
順方向・適応ビット割当て（即ち、知覚モデルがエンコーダで作り出されて明示的にデコーダにおくられる）を用いる知覚オーディオデコーダシステムでは類似のプロセスが用いられ得る。信号データは、送信された知覚モデルを用いて再フォーマット化される。この知覚モデルは、次いでウォーターマークを埋め込むためにパラメータによって変更され得る。オーディオのウォーターマークされたバージョンはマークされてない信号と比較される。歪み測定が特定されて予め限定された完了要件を満たさないならば、変更されたパラメータ変調値を用いて信号が再公式化される。
【０１５８】
ウォーターマーク及び又は決定論的シーケンス応答制御パラメータ変調
本発明の他の各面では、１つ又はそれ以上のパラメータの変調が、補足情報又はウォーターマーク信号又はシーケンスによって間接的に制御される。例えば、ウォーターマークによる変調の制御は、例えば、決定論的シーケンス及び又は符号化システムに加えられた入力信号のような指令セットを含む、１つ又はそれ以上の他の各信号又は各データシーケンスの機能によって変更される。図３０は、本発明のこの面を示す機能的構成図である。図２の基礎的装置におけるように、主情報が知覚デコーダファンクション４によって受信されるデジタルビットストリームを発生させる知覚エンコーダファンクション２に加えられる。本発明のこの面では、補足情報はパラメータ制御ファンクション６２に加えられる。パラメータ制御器ファンクション６２は、同様に主情報又は１つ又はそれ以上の決定論的シーケンス又は主情報又は１つ又はそれ以上の決定論的シーケンスの双方を受信する。パラメータ制御器６２は、二次的情報でエンコーダファンクション又はデコーダファンクションパラメータが変調される方法を変更する。それは、次に記載されるように、各々が主情報のファンクション及び又は１つ又はそれ以上の決定論的シーケンスのいずれかを有する１つ又はそれ以上の二次的情報を変更することによってそれを行う。パラメータ制御器ファンクションからの変更された補足情報がエンコーダファンクション又はデコーダファンクションのいずれか又はその双方に加えられ得るので、点線が補足情報からエンコーダファンクション及びデコーダファンクションへそれぞれ示される。図２装置の場合のように、知覚デコーダファンクションの出力は埋め込まれた補足情報を有する主情報である。補足情報はデコーダファンクション出力で検出され得る。
【０１５９】
変更された補足情報がエンコーダファンクション２及びデコーダファンクション４の双方でパラメータ変調を制御するならば、概して、一方に加えられた情報は他方に加えられたものと異なるであろう。例えば、当該１つ又はそれ以上のエンコーダファンクションパラメータを制御する補足情報は、オーディオ又はビデオコンテントの所有者を識別するウォーターマークを表すかも知れず、また１つ又はそれ以上のデコーダファンクションパラメータを制御する補足情報は、オーディオ又はビデオコンテントを１つ又はそれ以上の消費者に提示する装置を識別する通し番号であるかも知れない。
【０１６０】
パラメータ制御器６２が、補足情報によって１つ又はそれ以上のパラメータが変調される方法を変更するために決定論的シーケンスを用いるならば、デコーダファンクション出力における補足情報又はウォーターマークの検出は、発生器方程式及び検出器ファンクションによって知られるべき決定論的シーケンスのキーを必要とする。発生器方程式は一般的に知られ、検出器（一般的にではなく）によって先に知られ、又は安全なチャンネルを介して検出器に通知され得る。同様にキーは一般的に知られ、検出器（一般的にではなく）によって先に知られ、又は安全なチャンネルを介して検出器に通知され得る。システムが安全なためには、キーが一般的に開示されないことが唯一の要件である。
【０１６１】
パラメータ制御器６２が、補足情報によって１つ又はそれ以上のパラメータが変調される方法を変更するために入力信号を用いる場合には、デコーダファンクション出力における補足情報又はウォーターマークの検出は、検出器ファンクションによって知られるべき原始信号（例えば、パラメータ制御器が応答するようにプログラムされる原始信号の特性）又は少なくともいくつかの原始信号についての情報を必要とする。これは、原始信号又は、望ましくは、パラメータ制御器が応答するようにプログラムされる原始信号の特性を検出器ファンクションに伝達することによってなされ得る。原始信号の関連する特性が伝達されるよりはむしろ、原始信号及びデコーダファンクション出力の分析に基づいて検出器ファンクションが独立的に関連特性を得ることが可能である。しかし、当該特性は量子化器エラーを持たない原始信号に基づいてもともと決定されるので、エラーが起こり得る。
【０１６２】
ウォーターマークシンボル転移レートを変更する決定論的シーケンス応答パラメータ変調制御
本発明のこの面の一変形は、決定的シーケンスによってパラメータ変調状態転移のレートを制御し、従って、ウォーターマークシンボル転移のレートを制御することを含む。特に、決定論的シーケンスに応答して、パラメータ変調状態の持続時間を変化させ、従って、ウォーターマークシンボルレートの持続時間を変化させることを含む。ウォーターマークシンボル転移が一定レートで埋め込まれるならば、ウォーターマークシンボルパターン内の反復的シーケンスは知覚され得る。パラメータ変調状態の持続時間、従って、シンボルの持続時間を変調することによって、反復効果は最小にされ得る。表１は、パラメータ変調状態の持続時間、従って、ウォーターマークシンボルの持続時間が決定論的シーケンスに依存する例を示し、従って、変更されたシーケンスとして示されるパターンに帰着する。この特殊の例では、決定論的シーケンス値が「１」ならばウォーターマークシーケンスは反復される。該ＤＳ（決定論シーケンス）が「０」の値を持つならば、ウォーターマークシーケンスは反復されない。従って、検出中同期が可能になるように適切にリセットする有限のシーケンスが用いられるべきである。
【０１６３】
【表２】

【０１６４】
ウォーターマーク埋め込みパラメータ選択
本発明のこの面のさらなる変形によると、決定論的シーケンスではウォーターマークを埋め込むために用いられるパラメータが選択される。概して、ウォーターマークを埋め込むためには、いくつかのパラメータの内任意の１つを用いることが可能である。例えば、一パラメータの変調はある特定の周波数範囲のスペクトル変調に帰着し、別のパラメータの変調は復号された信号帯域幅の低下に帰着し得る。唯１つのパラメータが変調されるならば、結果的に生じるウォーターマークは、スペクトルエネルギー変調に鋭い感性を持つ人にはよりよく知覚され得る。他方、一方のパラメータ変調及び他方のパラメータ変調間で切り替える埋め込み技術が用いられるならば、結果的に生じるウォーターマークはより知覚されにくいであろう。ウォーターマーク埋め込みパラメータ数が増加するにつれて、この効果は一層明らかにされる（ウォーターマークによって導入される障害はより雑音状になる）。
【０１６５】
表２は、符号化パラメータが変調のために選択され得る２つの方法を示す。表２の“ａ”部分に示される第１例では、決定論的シーケンス（ＤＳ）に依存してパラメータ１及び２はウォーターマークシーケンス（ＷＳ）の値を獲得する。例えば、ＤＳ値が“０”ならば、パラメータ１はＷＳ値を反映する状態まで変調され、さもなければ“０”値を反映する状態まで変調される（いずれの状態も、その必要はないが、パラメータのデフォルト値、即ち、省略値でよい）。従って、パラメータ２は、ＤＳ値が１ならばＷＳ値を反映する状態まで変調され、さもなければそれは“０”値を反映する状態まで変調される（いずれの状態も、その必要はないが、パラメータのデフォルト値でよい）。パラメータ及びＤＳ双方からのシーケンスは、本例のＷＳを検出するのに必要とされる。表２の“ｂ”部分に示される第２例では、パラメータ１及び２は、ＷＳそれ自体のみに依存してＷＳ値を反映する状態まで変調される。例えば、パラメータ１はそのデフォルト状態から“０”のＷＳ値を反映する状態まで変調され、パラメータ２はそのデフォルト状態から“１”のＷＳ値を反映する状態まで変調される。このように、双方ともにＷＳを伝えるので、いずれのパラメータも独立して検出され得る。
【０１６６】
【表３】

【０１６７】
変調パラメータの選択が変るレートの変更
本発明のこの面のさらなる変形によると、変調のためのパラメータの選択は決定論的シーケンスに依存して変化し得る。一定レートの埋め込み技術を変えることによって導入される周期的効果が除去されるので、これはウォーターマークの知覚可能性をさらに低減させ得る。この例は表３に例示される。この例では、パラメータ１はＷＳの逆を反映する状態まで変調され（いずれの状態も、必要ではないが、パラメータのデフォルト値でよい）てＤＳ値が“１”ならばシンボルが反復し、さもなければそれは反復されない。表２の部分ｂの例におけるように、パラメータは双方共にウォーターマークを伝える。
【０１６８】
【表４】

【０１６９】
原始信号特性に応答したパラメータ変調の制御
本発明のこの面の別の変形は、原始信号の特性を分析し、次いでパラメータ変調転移のレート、従って、この分析の結果に基づいてウォーターマークシンボル転移のレートを適応的に制御することを含む。特に、それは原始信号の特性に応答して、パラメータ変調状態の持続時間、従って、ウォーターマークシンボル状態を変えることを含む。例えば、急速に変化する信号状態は、ウォーターマークシンボル転移の知覚可能性を下げるために用いられ得る有用な程度の一時的マスキングを与え得る。時間領域原始信号の振幅が、フレーム１から２（原始信号がフレームを持つデジタル信号ストリームにフォーマットされてしまっていると仮定する）への予め決められた閾値を越えて変化するならば、ウォーターマークシンボルは、フレーム１の一方の値からフレーム２の他方の値へ変ることが可能にされ得る。フレーム３では、原始信号の特性が先のフレームからの閾値を越えて変らないならば、シンボルによって値が変えられることは許され得ない。ウォーターマークシンボル転移を、マスキング事象又は下に横たわる原始信号の「友好的変化」状態と相関させることによって、ウォーターマークの知覚不能性は改良され得る。
【０１７０】
表４では、原始（起源）限定シーケンス（ＳＤＳ）が転移検出のような閾値（限界識別）プロセスの出力を表す。この例に関して、“０”のＳＤＳ値は転移状態が起こらなかったことを示し、“１”の値は転移がブロック内に存在したことを示す。表４の部分“ａ”では、ＳＤＳが“１”の値を持つならば、ＷＳ値が反復される（パラメータの同一変調状態を反復することによって）。ＳＤＳが“０”の値を持つならば、ウォーターマークシンボルは反復されない。この例では、単一符号化パラメータがウォーターマークを伝えることが想定される。
【０１７１】
原始信号分析を用いた変調用パラメータの選択が変るレートの変更
本発明の別の面では、パラメータ変調のレートと対照したものとして、変調のためのパラメータの選択が変るレートを変更するために原始信号の諸特性を利用するように今説明された面が変更される。丁度説明された面におけるように、原始信号が一時的マスキング又は他の「友好的に変化する」状態を与える時に各転移が起こるならそれらの知覚可能性が低くなるということが利点である。この実施形態の一例が表４の部分ｂに例示される。この例では、パラメータ１がＷＳの反転（逆）（いずれの状態も、その必要はないが、パラメータのデフォルト値でもよい）を反映する状態まで変調され、ＳＤＳ値が“１”ならば同シンボルは反復し、さもなければそれは反復されない。パラメータ２がＷＳのデフォルト値（いずれの状態も、その必要はないが、パラメータのデフォルト値でもよい）を反映する状態まで変調され、ＳＤＳ値が“１”ならば同シンボルは反復し、さもなければそれは反復されない。表２の部分ｂの例におけるように、両パラメータ共にウォーターマークを伝える。この接近手段は表３に示されるものと類似するが、ここでは転移レートがＳＤＳによって限定されるということのみで異なる。
【０１７２】
【表５】

【０１７３】
原始信号分析を用いたウォーターマーク埋め込みパラメータの選択
本発明の別の面では、変調のために利用可能なパラメータの利用可能なセット内のパラメータ数が原始信号の諸特性に基づいて変更される。特殊のウォーターマーキングシステムは、いくつかの異なったパラメータ（例えば、スペクトルエネルギー増強、一時的ノイズ挿入、帯域幅低減、等に帰着するパラメータ）の任意のものを変調することによってウォーターマークを埋め込むことができると仮定せよ。原始信号の現特性に依存して、これらのパラメータの全てが復号された信号において知覚不能な変化を生じさせ得るとは限らない。例えば、原始信号が動かないならば、知覚的に遮蔽される周波数範囲内でのスペクトルエネルギー増強よりは、一時的なノイズ挿入の方がより知覚され得る。その結果、現信号特性に対してより知覚可能な結果を起こしそうなものを許さないように利用可能なパラメータセットを縮小させるのが有利であり得る。
【０１７４】
表５では、先に述べたものと同一の閾値識別プロセス（転移検出）に基づいた信号限定シーケンス（ＳＤＳ）の一例が示される。“１”のＳＤＳ値は、ブロック内に一転移状態が存在することを示し、“０”のＳＤＳ値は、転移状態がないことを示す。表５では、パラメータ１及び２は、転移状態が存在しない時（ＳＤＳ＝０）通常ウォーターマークを伝る。即ち、パラメータ１は“０”のＷＭ（ウォーターマーク）値につき“１”の値を反映する変調状態を有し、さもなければ“０”の値を反映する変調状態を有し、またパラメータ２は“１”のＷＭ（ウォーターマーク）値につき“１”の値を反映する変調状態を有し、さもなければ“０”の値を反映する変調状態を有する。転移状態が存在すると（ＳＤＳ＝１）、そこでパラメータ３及び４が変調される。それらのパラメータは、スペクトルひずみを起こさせるパラメータ１及び２の代わりに、一時的歪みを起こすのに最適である。パラメータの数を低減させ、次いで最小のセットからパラメータを選択するために決定論的シーケンスが用いられ、それによってパラメータ間で切り替えると同時に、現原始信号特性を考慮して望ましいパラメータ間から適応的に選択する利点を保有する。
【０１７５】
【表６】

【０１７６】
決定論的シーケンス及び原始信号特性に応答するパラメータ変調制御
決定論的シーケンスのみ又は入力信号の特性のみを用いるパラメータ変調制御に加えて、本発明は同様に決定論的シーケンス及び入力信号の特性の双方に応答してパラメータ変調を制御することも意図する。
【０１７７】
パラメータ変調を制御するためには決定論的シーケンス及び原始信号特性の用法を結合した多数の方法がある。そうすることによって知覚不能性及び又は強さ（頑強性）がさらに改良され得る。そんな一方法では、決定論的シーケンスによって、信号特性の異なった状態に対して符号化パラメータのいずれかのサブセットが選択される。特に、上記表５の例を用いて、転移が存在しない（ＳＤＳ＝０）時には最初の２つのパラメータが変調のために選ばれると共に、これらのパラメータは決定論的シーケンスＤＳに基づいて選択される。表６はこの方法を例示する。
【０１７８】
【表７】

【０１７９】
別の例では、決定論的シーケンスは、信号限定されたシーケンスによって変更されるウォーターマークシーケンスの転移のレートを変更する。表７はこの方法を例示する。第２欄はＳＤＳに基づいて埋め込み技術を変える第１段階を例示し、第３欄はＤＳに基づいてシーケンスのレートをさらに変える第２段階を例示する。先の例におけるように、ＳＤＳが“１”の値を有するならばシーメンス値が繰り返される。ＳＤＳが“０”の値を有するならばシーメンス値は繰り返されない。
【０１８０】
【表８】

【０１８１】
多数の符号化パラメータが埋めこまれたシーケンスを伝える当該例の各々に関して、同一ウォーターマーキングシーケンスを多数の符号化パラメータに用いることによって攻撃又は処理に対するエラー弾力性を増加させる冗長性を加える可能性も同様に存在する。複雑性がより低い検出を容易にするために、一方のパラメータがエラーを持つならば、検出器は他方の符号化パラメータからのメッセージを回復し得るように、そんな符号化パラメータは強制された関係又は予め決められた階級（階層）を持ち得る。
【０１８２】
さらに、攻撃者がウォーターマークを伝えているのがどのパラメータなのかを推論するのを困難にするために、決定論的シーケンスは１つ又はそれ以上の他の符号化パラメータを同時に変調するのに用いられ得る。表８に示される例では、パラメータ１はウォーターマークシーケンスを伝え、決定論的シーケンスはパラメータ２また３のいずれがウォーターマークシーケンスに基づいて変わるかを特定する。この場合パラメータ２及び３はウォーターマークを伝えないがおとりとして作動する。この例では、おとりパラメータは、ＤＳの適切な状態に関してＷＳと等しく、さもなければ“０”である。
【０１８３】
【表９】

【０１８４】
結論
本発明の他の変形物及び変更物並びにその各種の面の実施は当業者にとって明らかであり、また本発明は記載されたこれらの特定の実施形態によって限定されないことは理解されるべきである。従って、本明細書に開示されかつ請求された基本的原則の真の主旨及び範囲内に入るあらゆる変更、変形又は同等物は本発明に含まれると見なされる。
【０１８５】
本発明及びその各種の面は、デジタル信号プロセッサ、プログラムされた多目的デジタルコンピュータ及び又は特殊用途デジタルコンピュータで実行されるソフトウエアファンクションとして実施され得る。アナログ及びデジタル信号ストリーム間のインタフェースは、適切なハードウエア及び又はソフトウエア及び又はファームウエアのファンクションとして実行され得る。
【図面の簡単な説明】
【図１】
図１は理想化されたプロットである。同図はマスキング信号がない場合に音が丁度聞こえる（聴取閾値）音圧レベル（実線）及び５００Ｈｚ正弦波の存在下における聴取閾値（点線）を示す。
【図２】
図２は本発明の基本原理を例示する機能的構成図である。同図では知覚符号化システム内の知覚エンコーダ機能及び又は知覚デコーダ機能の１つ又はそれ以上のパラメータが補足情報によって変調される。
【図３】
図３Ａは、符号化システムの出力を受信する補足情報検出器を含む、本発明の一面を例示する機能的構成図である。図３Ｂは、図３Ａの補足情報検出器の検出機能のさらなる詳細を含む、本発明の一面を例示する機能的構成図である。
【図４】
図４は、符号化システムの出力及び符号化システムへの入力の双方を受信する補足情報検出器機能を含む、本発明の一面を例示する機能的構成図である。
【図５】
図５は本発明の一面を例示する機能的構成図である。同図では、補足情報検出器機能は比較器機能のみならず、知覚エンコーダ機能及び知覚でコーダ機能をも含み、そのいずれもがそのパラメータを変調させていない。
【図６】
図６Ａ及び６Ｂは、ハイブリッド順方向・逆方向適応型のいくつかの知覚オーディオコーダにおける変調に適したパラメータを示す表である。
【図７】
図７は、順方向適応型のいくつかの知覚オーディオコーダにおける変調に適したパラメータを示す表である。
【図８】
図８は、いくつかの知覚ビデオコーダにおける変調に適したパラメータを示す表である。
【図９】
図９は、いくつかの知覚オーディオコーダにおける人の耳のマスキングカーブをスペクトル的にモデル化するいくつかのパラメータ表す構成図である。
【図１０】
図１０は、一種の知覚オーディオコーダにおける変調され得るスペクトルマスキングモデルパラメータを表す構成図である。
【図１１】
図１１Ａは、いくつかの知覚オーディオコーダにおける正弦波信号の存在下でのＳＮＲ相殺パラメータ（マスキング閾値パラメータ）の変調を示す理想化された表現である。図１１Ｂは、ビット強制された符号化システムの場合に関して、ＳＮＲ相殺パラメータが図１１Ａに示される方法で変調される場合に知覚デコーダの出力における効果を示す理想化された表現である。図１１Ｃは、ビット強制されていない符号化システムの場合に関して、ＳＮＲ相殺パラメータが図１１Ａに示される方法で変調される場合、知覚デコーダの出力における効果を示す理想化された表現である。図１１Ｄは、図１１Ａ−Ｃで用いられた凡例を示す。
【図１２】
図１２Ａは、ある知覚オーディオコーダにおいて正弦波信号の存在下における高速利得コードパラメータの変調を示す理想化された表現である。図１２Ｂは、ビット強制された符号化システムの場合に関して、高速利得コードパラメータが図１２Ａに示される方法で変調される場合、知覚デコーダの出力における効果を示す理想化された表現である。図１２Ｃは、ビット強制されていない符号化システムの場合に関して、高速利得コードパラメータが図１２Ａに示される方法で変調される場合、知覚デコーダの出力における効果を示す理想化された表現である。
【図１３】
図１３は、ある知覚オーディオコーダにおいて、ある知覚オーディオコーダにおけるマスキングパラメータ以外の変調パラメータ、即ち、「使用中結合」フラッグ、使用中再マトリックシングフラッグ及び結合開始周波数コードの効果を示す理想化された表現である。
【図１４】
図１４は、ある知覚オーディオコーダにおいて、マスキングパラメータ以外のパラメータを変調する効果、即ち、位相フラッグ、を示す理想化された表現である。
【図１５】
図１５は、符号化中に補足情報を埋め込むための時間領域エィリアスウィンド形状を示す一連の理想的波形である。
【図１６】
図１６は、復号化中に補足情報を埋め込むための時間領域エィリアスウィンド形状を示す一連の理想的波形である。
【図１７】
図１７は、マスキング信号の一時的マスキング効果を例示する音圧レベル（ＳＰＬ）対時間をプロットする、理想化された一時的包絡線応答である。
【図１８】
図１８は、効果が一時的マスキング包絡線内に強制されるように、信号に加えられ得る変調の種類を示す理想化された表現である。
【図１９】
図１９は、２ビットシンボルが４つの異なった帯域幅によってどのように表され得るかを例示する、一連の理想化された振幅対周波数のプロットである。
【図２０】
図２０は、異なったシンボルを表すために信号の帯域幅を用いて、埋め込まれた信号を含むオーディオ信号の一例を示す理想化された周波数対時間プロットである。
【図２１】
図２１は、正弦波信号の存在下で人の聴取閾値の近似レベルに適合されたノイズの付加を例示する理想化された振幅対周波数プロットである。
【図２２】
図２２は、２ビットシンボルを作る４つの異なった振幅を検出するのに要する３つの異なったエネルギーレベルを示す、理想化されたエネルギー対周波数プロットである。
【図２３】
図２３は、「高」及び「低」状態の分布を例示するいくつかのヒストグラムの理想化された振幅対エネルギープロットである。
【図２４】
図２４は、知覚可能性の閾値を用いてウォーターマークを埋め込むプロセスの内側反復ループ部分を示す論理流れ図である。
【図２５】
図２５は、知覚可能性の閾値を用いてウォーターマークを埋め込むプロセスの外側反復ループを示す論理流れ図であり、同図では外側ループスペクトル係数が増幅される。
【図２６】
図２６は、心理音響的モデル又は知覚閾値を、可能な限り満たすために図２５のプロセスの変更を示すと同時に、また補足情報又はウォーターマーク信号を埋め込む論理流れ図である。
【図２７】
図２７は、臨界帯域内で量子化器エラーに作用するパラメータを変調する場合に関して、歪み測定プロセスを用いてウォーターマークがどのようにして埋め込まれるかを例示する、
周波数スペクトルに亘って知覚閾値、量子化器エラー及び変更された量子化器エラーを描写する一連の理想化された波形を示す。
【図２８】
図２８は、周波数スペクトル全体に亘って信号対ノイズ比相殺に作用するパラメータを変調する場合に関して、歪み測定プロセスを用いてウォーターマークがどのようにして埋め込まれるかを例示する、周波数スペクトルに亘って知覚閾値、量子化器エラー及び変更された量子化器エラーを描写する一連の理想化された波形を示す。
【図２９】
本発明の面により、復号中にウォーターマークを埋め込むプロセスの各段階を例示する論理流れ図である。
【図３０】
図３０は、本発明の他の面を示す機能的構成図である。同図では、ウォーターマークの補足情報による変調の制御が１つ又はそれ以上の他の信号又は、例えば、符号化システムに加えられた決定論的シーケンス及び又は入力信号などのデータシーケンスの作用によって変更される。

Claims

補足情報がデコーダ機能の出力で検出され得るように、該補足情報による知覚符号化システムのエンコーダ、デコーダ機能の操作を変更する方法であって、
前記補足情報に応答して前記エンコーダ、デコーダ機能の１つ又はそれ以上のパラメータを変調することから成るエンコーダ、デコーダ機能変更方法。
前記知覚コーダが、ハイブリッド順方向・逆方向ビット割当てを用いる種類のオーディオコーダである、請求項１の方法。
前記１つ又はそれ以上のパラメータが、マスキングモデル及びビット割当て、チャンネル間結合、周波数帯域幅、ディザ制御、位相関係及び時間・周波数変換ウインドの１つ又はそれ以上の範疇内に入る１つ又はそれ以上のパラメータを含む、請求項２の方法。
前記知覚コーダが順方向ビット割当てを用いる種類のオーディオコーダである、請求項１の方法。
前記１つ又はそれ以上のパラメータは、マスキングモデル及びビット割当て、チャンネル間結合、一時的ノイズ整形フィルタ係数及び時間・周波数変換ウインドの１つ又はそれ以上の範疇内に入る、請求項４の方法。
前記知覚コーダがビデオコーダであり、前記１つ又はそれ以上のパラメータが、フレーム種類及び移動制御の１つ又はそれ以上の範疇に入る１つ又はそれ以上のパラメータを含む、請求項１の方法。
前記１つ又はそれ以上のパラメータが、符号化された出力信号において、信号対雑音比、量子化器ノイズ、チャンネル間時間関係、周波数帯域幅、整形されたノイズ、チャンネル間位相関係及び廣スペクトル、時間エイリアシングノイズの１つ又はそれ以上に影響を与える該パラメータから選択される、請求項１の方法。
前記１つ又はそれ以上のパラメータが、２価値を有するパラメータの２価値間で該パラメータを変化させるか、該パラメータをそのデフォルト値と、１つ又はそれ以上の他の値間で変化させるか、又は該パラメータをそのデフォルト値以外の値間で変化させるかのいずれか１つを行うことによって変調される、請求項１の方法。
前記１つ又はそれ以上のパラメータ変調度が制御される、請求項１の方法。
前記１つ又はそれ以上のパラメータの変調度が、前記１つ又はそれ以上のパラメータの変調の結果生じる復号された出力信号の人工品の知覚性を限定するように制御される、請求項９の方法。
１つ又はそれ以上の変調特性、即ち、変調用の１つ又はそれ以上のパラメータ選択、パラメータ選択のレート及びパラメータ状態転移のレートが、補足情報に応答して、１つ又はそれ以上の他の信号又はシーケンスとして決定されるように、パラメータの変調が補足情報により間接的に制御される、請求項１の方法。
前記１つ又はそれ以上の他の信号又はシーケンスは、指令セット及び符号化システムのエンコーダへの入力信号特性の一方又は双方を含む、請求項１１の方法。
前記指令セットは決定論的シーケンスを含む、請求項１２の方法。
前記決定論的シーケンスが疑似乱数シーケンスである、請求項１３の方法。
前記１つ又はそれ以上のパラメータが前記エンコーダ機能で変調される、請求項１の方法。
前記１つ又はそれ以上のパラメータが前記デコーダ機能で変調される、請求項１の方法。
前記１つ又はそれ以上のパラメータが前記エンコーダ機能及びデコーダ機能で変調される、請求項１の方法。
補足情報による知覚符号化システムの該エンコーダ、デコーダの操作を変更すると共に請求項１による該デコーダの出力の該補足情報を検出する方法であって、
該デコーダ機能の該出力の該補足情報を検出することをさらに含む方法。
該デコーダ機能の出力における該補足情報を検出する機構は、符号化された信号を観察すること、符号化された信号と、該エンコーダ機能へ加えられた信号とを対比すること及び該復号された信号と、該エンコーダ機能又はデコーダ機能には補足情報に応答して変調されるパラメータが無い、実質的に同一の知覚符号化システムから符号化された信号とを比較することの１つによって達成される、請求項１８の方法。
該復号された信号を観察する該動作は、該復号された信号をそれ自体の時間遅延されたバージョンと比較することを含む、請求項１９の方法。