JP3274667B2 - オーディオデータへ付加情報を埋め込む方法およびシステム - Google Patents

オーディオデータへ付加情報を埋め込む方法およびシステム

Info

Publication number
JP3274667B2
JP3274667B2 JP26924499A JP26924499A JP3274667B2 JP 3274667 B2 JP3274667 B2 JP 3274667B2 JP 26924499 A JP26924499 A JP 26924499A JP 26924499 A JP26924499 A JP 26924499A JP 3274667 B2 JP3274667 B2 JP 3274667B2
Authority
JP
Japan
Prior art keywords
additional information
frequency
embedding
frame
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26924499A
Other languages
English (en)
Other versions
JP2000172282A (ja
Inventor
誠士 小林
定遠 陳
良明 大嶋
周一 清水
典繁 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP26924499A priority Critical patent/JP3274667B2/ja
Publication of JP2000172282A publication Critical patent/JP2000172282A/ja
Application granted granted Critical
Publication of JP3274667B2 publication Critical patent/JP3274667B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B15/00Driving, starting or stopping record carriers of filamentary or web form; Driving both such record carriers and heads; Guiding such record carriers or containers therefor; Control thereof; Control of operating function
    • G11B15/02Control of operating function, e.g. switching from recording to reproducing
    • G11B15/05Control of operating function, e.g. switching from recording to reproducing by sensing features present on or derived from record carrier or container
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/28Arrangements for simultaneous broadcast of plural pieces of information
    • H04H20/30Arrangements for simultaneous broadcast of plural pieces of information by a single channel
    • H04H20/31Arrangements for simultaneous broadcast of plural pieces of information by a single channel using in-band signals, e.g. subsonic or cue signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00884Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
    • G11B20/00891Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm embedded in audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はオーディオ信号がデジタ
ル化されたオーディオデータに対し著作権情報等の付加
情報を埋め込み、検出する方法およびそのシステムに関
し、特に付加情報を埋め込んだオーディオデータの音質
に著しい劣化を引き起こさない範囲での改変に対して、
埋め込んだ情報を信頼性をもって検出できる方法および
そのシステムに関する。
【0002】
【従来の技術】現在、デジタル化された音楽コンテンツ
はCD のみでなく、インターネットを経由しても提供さ
れはじめている。このようなデジタル・オ−ディオデ−
タでは、何度聞いても音質の劣化がないという利点があ
る反面、完全な複製が容易に多量に作成できてしまうの
で、以前にまして不正コピ−防止技術が重要となってい
る。これらの不正なコピーを防ぐためには、あらかじめ
著作権情報等をオ−ディオデ−タ自身に埋め込むことで
著作権の所在を明確にすることや、また、コンテンツ配
布先の情報を埋め込むことで不正なコピーが出回った場
合にもその流出経路を追跡することが考えられる。この
とき、コンテンツの商品価値を下げないためには、情報
の埋込みによる音質の変化が人間の耳に聞こえてはなら
ない。また、コンテンツにはフィルター処理、MPEG やA
C3 やATRAC などの圧縮解凍、デジタルからアナログへ
の変換とアナログからデジタルへの変換、切り出し、再
生速度の変化などの処理が行われることが考えられるの
で、オーディオデータの音質に著しい劣化を引き起こさ
ない範囲でのデータ値の変更、欠損、挿入、リサンプリ
ングに対し、埋め込んだ情報が生き残る必要がある。
【0003】従来のオーディオデータへの付加情報の埋
め込み検出手法は、機密性に優れているものの、人間の
聴覚では検知できないように付加情報を弱く埋め込む
と、圧縮解凍、フィルター、デジタル/アナログ変換な
どのデータ処理に対し、埋め込んだ付加情報が消えてし
まうなど、耐性面で問題があった。オーディオデータへ
の付加情報の埋め込み検出手法として一般的なのはPN(P
seudo-random Noise)での変調による拡散スペクトラム
(Spread Spectrum)法である。この手法では、時間領
域で、疑似ランダムに見えるノイズで付加情報を変調し
て埋め込む。結果として、周波数空間では埋め込み情報
に対応する成分のスペクトルが広がって見える。上記に
属する技術としては USP 4979210, 5073925,5319735
などがある。
【0004】これら手法では、適当な暗号技術(例えば
DES)で生成された+1 と1 からなる疑似乱数列Rn を使
ってビット列情報Bm を変調し、オーディオのサンプル
列Anに次のように変調して埋め込む。
【数1】 ここで、 Bm は+1 または1 で1ビットを表わすとし、
また、n = 0, 1,...N-1で、cは埋め込みの強さであ
る。検出では、
【数2】 で、ビット列情報を抽出する。列Rn がランダムであれ
ば、ΣANm+n RNm+nが打ち消しあうことが期待できるか
らである。時間軸での埋め込みでは、人間の聴覚の周波
数特性を利用できず音質の劣化の制御が難しいので、埋
め込みによる音質の変化が耳で検知できないよう弱く埋
め込むと、圧縮解凍などの処理に埋め込み情報が生き残
らなかった。これに対し、USP 5687191 では、情報を埋
め込む際、時間信号であるサンプル列をポリフェーズフ
ィルタにより複数の周波数帯に分解し、各周波数帯ごと
に疑似ランダムなノイズで情報を変調して埋め込む。こ
の利点は、周波数帯ごとに異なる埋め込み強度が使用で
き、人間の聴覚の周波数特性を利用できることにある。
これにより、これまでの手法の中では、音質の劣化がな
く耐性のある埋め込みを実現した。
【0005】USP 5613004 や USP 5687236 の手法は、
本発明と同じく、周波数変換された周波数成分に情報を
埋め込み検出する。これらは機密性を高めるために信号
拡散の手段として周波数空間での埋め込み・検出を提案
する。しかしながら、上記 USPでは高音質で高耐性の埋
め込み・検出手法を提供しない。これらの手法では、無
圧縮のデジタルオーディオのサンプル列を区切って互い
に重ならない領域(ウィンドウと呼ぶ)に分け、各々にF
FT(Fast Fourier Transformation)を適用する。プラ
イマリマスク(primary mask)とコンボルーショナルマ
スク(convolutional mask)は、FFT で得られた周波数
成分に1 ビットの信号を埋め込むか否かを制御するのに
用いられる。プライマリマスクとコンボルーショナルマ
スクはともに疑似ランダムなビット列で、プライマリマ
スクのサイズは周波数の数に対応する。各ウィンドウは
コンボルーショナルマスクの特定の位置に対応し、その
ウィンドウの各周波数成分に埋め込むか否かを、周波数
に対応する位置のプライマリマスクのビット値とウィン
ドウに対応する位置のコンボルーショナルマスクのビッ
ト値との論理演算の結果が真か偽で埋め込むか否かを決
める。
【0006】埋め込みの手法については、USP 5613004
では、埋め込み周波数成分の特定のビット位置にマップ
情報(付加情報から作成された冗長性を含んだビット
列)のビットを埋め込むとし、USP 5687236 では、埋め
込み周波数成分を、元の値に対して相対的に事前に定め
られた範囲に入るよう変更することでビットを埋め込む
としている。いずれの場合も1ビットを1周波数成分に
埋め込むとしており、埋め込んだ情報の機密性はプライ
マリマスクとコンボルーショナルマスクとで守られてい
るが、圧縮・解凍や各周波数成分でのランダム・ノイズ
付加などのデータ処理には埋め込んだ情報が生き残らな
い。
【0007】またメッセージ開始の区切り(start of m
essage delimiter)は、比較的長いビット列からなる符
号で、検出ビット列上でウィンドウの区切りとメッセー
ジ開始位置を検出するために用いる。彼らの明細書によ
れば、1 ウィンドウあたり128サンプルとして64 ビット
が埋め込まれ、16 ウィンドウで1024 ビットの符号がで
き、これが偶然一致する確率は非常に小さいから、特定
の1024ビット符号をメッセージ開始の区切りとして使用
できるとしている。ウィンドウの区切りやメッセージ開
始位置の探索は、メッセージ開始の区切りを検出するま
でウィンドウの開始位置を1 サンプルづつずらすことで
行う。この手法では、埋め込み付加情報は長ければ、メ
ッセージ開始位置の探索にかかる負荷が大きくなり、デ
ジタル/アナログ変換で頻繁に起きるデータ欠損・挿入
による再同期の必要性には対応できない。
【0008】
【発明が解決しようとする課題】従って、本発明が解決
しようとする課題は、オーディオデータに対し著作権情
報等の付加情報の埋め込みによる音質の変化を人間の聴
覚では検知できないように埋め込みながら、一方で、音
質に著しい劣化を引き起こさない範囲でのオーディオデ
ータへの処理に対し、埋め込んだ付加情報が残り、信頼
性をもって検出できるための方法およびそのシステムを
提供することである。また別の課題は、高音質で高耐性
の埋め込み・検出が可能な、オーディオデータへ付加情
報を埋め込み・検出方法およびそのシステムを提供する
ことである。また別の課題は、オーディオデータのサン
プル列を周波数変換し、周波数空間上で操作を加えるこ
とにより、付加情報を埋め込む方法およびシステムを提
供することである。また別の課題は、圧縮・解凍や各周
波数成分でのランダム・ノイズ付加などのデータ処理に
耐えられる、オーディオデータへ付加情報を埋め込む方
法およびシステムを提供することである。また別の課題
は、埋め込まれた付加情報の探索にかかる負荷を小さく
できる、オーディオデータへ付加情報を埋め込み・検出
方法およびそのシステムを提供することである。また別
の課題は、デジタル/アナログ変換で頻繁に起きるデー
タ欠損・挿入による再同期の必要性に対応できる、オー
ディオデータへ付加情報を埋め込み・検出方法およびそ
のシステムを提供することである。
【0009】
【課題を解決するための手段】上記課題を解決するため
に、まず本発明は、無圧縮のデジタル・オーディオデー
タに対し、人間の聴覚ではその変化が検知できないよう
著作権情報等の付加情報を埋め込む「埋め込みシステ
ム」と、圧縮解凍や切り取りなどの処理が施されても、
付加情報が埋め込んであるか否かを判定でき、埋め込ん
であるならばその情報を抽出する「検出システム」とか
らなる。
【0010】各チャネルの無圧縮のデジタル・オーディ
オデータは、サンプルと呼ばれる整数の列からなる。CD
品質のオーディオデータでは、各チャネルが1 秒あた
り44,100 個の16 ビット長のサンプルの列からなる。本
発明では、聴覚心理モデルを適用できるよう、周波数空
間で埋め込み、検出を行う。従って、本発明の埋め込み
システム、検出システムでは、サンプル列を適当に区切
り、各々を周波数空間に変換する。この周波数変換の対
象となるサンプル列の各区間をここではフレーム(fram
e) と呼ぶ。
【0011】図4に本発明の付加情報埋め込み処理の流
れを示す。ステップ410では、周波数毎に埋め込み信
号の位相を定めるマスクを用いて、オーディオデータの
各フレームを周波数空間に変換し、付加情報に対応する
ビット情報や同期信号を周波数成分に埋め込み、周波数
空間から時間軸上のサンプル列に再び戻す。埋め込みで
は、フレーム同士は重ならないが、隙間があっても良
い。切り取り耐性を要するときは、付加情報は繰り返し
て埋め込む。
【0012】図5に本発明の付加情報検出処理の流れを
示す。ステップ510では、入力されたオーディオデー
タのサンプル列からフレームの開始点を探す。ステップ
520で、付加情報が埋め込んであると判定されれば、
検出マスクを用いて、周波数成分に埋め込んだビットを
抽出し、次にステップ530で付加情報の繰り返しの開
始点を探し、埋め込んだ付加情報を復元する。
【0013】本発明は、人間には不可聴だが処理耐性の
ある情報を各フレームで埋め込み、検出する手法とその
システム、検出時に正しいフレームの開始・終了位置を
探すフレーム同期の手法とそのシステム、各フレームで
検出された個々のビット情報からビット列(メッセー
ジ)を復元するためのビット繰り返しの開始・終了位置
を探すためのメッセージ同期の手法とそのシステムとか
ら構成される。
【0014】より具体的には、オーディオデータへ付加
情報を埋め込むにあたり、まずオーディオデータを周波
数変換し、オーディオデータに基づき、前記オーディオ
データに付加情報を埋め込むことのできる周波数の変更
範囲を決定し、付加情報埋め込み用のマスクを生成す
る。そして、周波数変換されたオーディオデータの前記
埋め込むことのできる周波数の変更範囲に、付加情報
を、付加情報埋め込み用のマスクを用いて埋め込む。最
後に付加情報の埋め込まれた周波数変換されたオーディ
オデータを、オーディオデータに逆変換するように構成
する。逆に、オーディオデータに埋め込まれた付加情報
を検出するには、まずオーディオデータを周波数変換
し、周波数変換されたオーディオデータから、付加情報
検出用のマスクを生成し、付加情報検出のための同期を
とる、同期検出手段を設ける。そして周波数変換された
オーディオデータから、同期をとりながら、付加情報検
出用マスクを用いて、付加情報を検出するように構成す
る。
【0015】
【発明の実施の形態】以下、オーディオデータへの付加
情報を埋め込み・検出の各手法とそのシステムに関し、
より詳細に説明する。
【0016】 [各フレームでの埋め込み/検出の手法とそのシステ
ム] フレームは周波数空間への変換の単位となるサンプル列
上の区間のことである。ここでは、各フレームでの埋め
込み、検出する手法とそのシステムについて記述する。
効果的に聴覚心理モデルを適用するためには、フレーム
に含まれるサンプルの数は、USP 5613004 や5687236 の
発明の明細に記載されている128 より大きい数、512 か
ら4048 程度の数が適切である。
【0017】以下では、無圧縮のオーディオデータに対
し、m 番目のフレームのn 番目のサンプルをAm(n) と記
し、m 番目のフレームに周波数変換を行なって得た周波
数kの成分をFm(k)と記す。フレームとフレームの間に隙
間がなければ、フレームのサンプル数をNとすると
【数3】 である。各周波数成分は実部と虚部からなる複素数だ
が、元のサンプルが実数なので、Fm (k) とFm (N-k) =
Fm (-k) とは複素共役の関係にある。すなわち、独立な
周波数の数はフレームのサンプル数の半分 N/2 とな
る。複素数を2 次元ベクトルとみなして、形式的に
【数4】 で内積を定義し、以下の記述で使用する。ここで、添え
字、x およびyはそれぞれ実部、虚部を指す。このと
き、定義よりα・α=|α|2となる。埋め込みシステ
ム、検出システムは、周波数kに対して疑似ランダムな
値をとる複素数列Mp(k) を複数個共有しているものと
し、以下ではマスクと呼ぶ。ただし、埋め込みが時間領
域で実数であるために、Mp(k) とMp(-k) とは複素共役
の関係にあるものとする。また、Mp(k) が絶対値1の複
素数のみからなるなら、その位相は疑似ランダムな向き
をとっているものとし、また、Mp(k) が純虚数なら、虚
数軸に沿って疑似ランダムとする。すなわち、Mp(k) の
とりうる範囲には目的によって適切な制限があるものと
する。
【0018】[フレームでの信号の埋め込み] 図6に本発明のフレームでの信号の埋め込み処理の流れ
を示す。まずステップ610でサンプル列をフレームに
分割する。そしてステップ620で分割したフレームの
各フレームを周波数空間に変換する。ステップ630で
は、得られた周波数成分を使って聴覚心理モデルを適用
し、平均的な人間の聴覚では検知できない変更範囲を各
周波数ごとに求める。そしてステップ640では、擬似
乱数より得られるマスクの向きに各周波数成分の値をこ
の求めた範囲内で最大に変更することにより、ビット情
報や符号情報や同期信号を埋め込む。このとき、音質よ
り耐性が重要な場合、各マスクに対する内積を計算し、
内積の値が耐性が要する閾値より小さい場合は、聴覚心
理モデルの最大の変更範囲を超えても、その閾値に達す
るまで変更幅を大きくする。音質が重要な場合、内積が
耐性の要する閾値より大きければ、その閾値に達するま
で変更幅を小さくする。各周波数成分での変更が終了す
ると、ステップ650で、変更された周波数成分に逆変
換を行い、周波数空間から時間軸上のサンプル列に再び
戻す。ビット情報や同期信号の埋め込みは、各フレーム
での周波数変換でえられた周波数成分Fm(k)を、
【数5】 と変更することでなされる。周波数成分は複素数なの
で、変更hm (k) も複素数である。聴覚心理モデルなど
の聴覚心理モデルを周波数分布Fm に適用して、平均的
な人間の聴覚ではその差異を検知できない変更hm (k)
の範囲を各周波数kごとに求める。検知できない変更範
囲は2 次元空間で一般には複雑な形状をなしている。こ
のため、変更hm (k)が人間の耳では検知できない最大の
変更であるとは必ずしも絶対値|hm (k)|が単純に最大
値であるとは限らず、一般には変更範囲の境界上にある
ことを言う。聴覚心理モデルとは、大きな純音があると
その前後の周波数成分の変更が人間の耳に検知しにくく
なるなど、周波数のスペクトル分布に応じて各周波数で
の差異が検知できない変更範囲が変わることをコンピュ
ータ上で模擬的に実現するものである。
【0019】マスクの向きに埋め込むとは、内積
【数6】 が、意図した符号、または値になるよう各周波数成分を
変更することを言う。ここで、C(Fm, k) は、周波数分
布Fm と周波数kに依存する正の規格化定数で、統計推定
の信頼度をあげるためのものである。各マスクが互いに
ほぼ直交していれば、埋め込みによる周波数成分の変更
【数7】 とし、実定数bpはおのおのマスクの内積Xp(m) の意図す
る符号、値に比例して決め、正定数a(k) は平均的な聴
覚では検知できない変更範囲の境界上にあるように調整
すれば良い。規格化定数C(F'm, k) は埋め込み結果に依
存するので、正定数a(k) を求める処理は逐次的とな
る。
【0020】埋め込みは各フレーム単位で行うので、埋
め込むビット値が違うなどの理由で隣り合うフレーム間
で変更値が異なると、フレームの区切りA'm(N-1)、A'
m+1(0)で大きな不連続が生じ、ノイズとして聞こえてし
まう可能性がある。そこで、すべてのフレームの両端で
変更幅が小さくなるよう、各周波数成分の変更の仕方や
マスクの形状を限定することで、音質の劣化を防ぐ。例
えば、各周波数成分の変更を純虚数に制限し、マスクも
純虚数とする。変更を純虚数に制限することは、時間軸
上では各フレームで正弦波からなる信号を埋め込むこと
と同じ。別の例とし、各周波数成分の変更とマスクをと
もに実数に制限するとともに、偶数の周波数からなる対
{2k,2k'} や奇数の周波数からなる対{2k+1, 2k'+1} を
作り、フレームの両端で互いに打ち消すよう、
【数8】
【数9】 と、対をなす周波数のマスクや変更値の大きさが同じだ
が符号を反対にとる。変更を実数に制限することは、時
間軸上では各フレームで余弦波からなる信号を埋め込む
ことと同じである。
【0021】また、マスクが互いに直交するよう選択す
ることで、順次、異なるマスクに対応して埋め込んで
も、互いに相手の埋め込んだ情報を壊したり、相手の埋
め込みで検出が誤ることのないようにできる。これによ
り、サーバにオーディオデータをアップロードする前に
音源の著作権情報を埋め込み、インターネット経由で消
費者がそのオーディオデータをダウンロードした後で、
ユーザID などの追跡情報を埋め込み、互いに干渉しな
いようにできる。例えば、マスクの値Mp(k) がゼロでな
い周波数kを限定された領域にとり、異なるマスクは異
なる領域がゼロでないようにとると、規格化定数C(Fm,
k) に依存せずに直交性を保つことができる。このと
き、各マスクのゼロでない周波数領域が単一の周波数帯
域ではなく、幅広い周波数にまたがるよう、複数の区間
にとることで、音質と耐性とを同時に向上させることが
できる。MPEG 圧縮処理では、ゲインを制御するパラメ
ータ(scale factor)を周波数帯(scale factor band) 毎
に定めるなど、周波数帯域毎に違ったパラメータで圧縮
を行っている。そのため、周波数帯を単純に分割し、各
マスクに単一の区間を割り当てると、コンテンツによ
り、マスクごとの耐性に著しい差異が生じてしまう。従
って、圧縮処理の単位となる周波数帯域(サブバンド)
よりも狭い幅で帯域分割し、低音とか高音とかにそれぞ
れの埋め込み周波数帯域が集中しないよう周波数帯域を
集めて、互いに直交するマスクを合成するものとする。
【0022】上記のように、本発明の各フレームでの埋
め込み手法は、従来技術と異なり、 ・1 ビットを1周波数成分に埋め込むのではなく、幅広
い周波数領域の各周波数成分をマスクの向きに変更して
埋め込むこと、 ・変更幅を周波数ごとに事前に決めておくのではなく、
周波数変換で得た周波数分布に基づいて人間の耳では検
知できない最大の変更範囲を各周波数ごとに求め、それ
に基づいて各周波数成分の変更幅を定めること ・時間軸上で各フレームの両端で変更幅がゼロに近づく
よう、マスクと周波数成分の変更に制限を加えること ・周波数を狭い帯域に分け、周波数が偏らないよう複数
の帯域を集めて直交するマスクを作成し、互いに相手を
壊さない多重の埋め込みを可能とすることに特徴があ
る。
【0023】[フレームでの信号の検出] 図7に本発明のフレームでの信号検出処理の流れを示
す。ステップ710でサンプル列を複数のフレームに分
割する。ステップ720でこれらの各フレームを周波数
空間に変換する。そしてステップ730で、検出用マス
クとの内積を求める。抽出の信頼性を上げるために、必
要に応じて、同じ情報が埋め込んであると知っている別
のフレームの内積を、適切な符号を掛けて加える。すな
わち、同符号で埋め込んであることを知っていれば同符
号で加え、反対符号で埋め込んであることを知っていれ
ば、符号を反転して加える。最後にステップ740で内
積の符号、もしくは、どのマスクとの内積が大きいか
で、ビット情報を抽出する。各フレームで、周波数成分
Fm (k) とマスクMp(k) との内積を
【数10】 で計算する。ここで規格化定数C(Fm, k) は、統計推定
の信頼度をあげるために導入された、周波数分布と周波
数に依存する正の数である。一般に周波数スペクトル|F
m(k)| は一様に分布しておらず、低周波成分から高周波
成分にかけて振幅が減ってゆく傾向にあるが、使用する
音源や曲の狙うテーマなどでコンテンツによっても、周
波数スペクトル分布は大きく揺らぐ。統計推定の信頼度
を上げるとは、人間の聴覚では検知できない範囲での最
大の変更を行ったときの統計平均<Xp(m) >の二乗が、何
も埋め込まないときの二乗統計平均< Xp(m)2>より大き
くなるようにすることである。
【数11】 かつ
【数12】 であるので、統計推定の信頼度を最も上げる規格化定数
【数13】 で、このとき、
【数14】 となる。ここで、c は任意の定数で、a(k) は平均的な
聴覚では検知できない最大の変更幅である。
【0024】規格化定数の分母の< (Mp(k)・Fm(k))2 >
は統計平均で何を母集団に取るかにより変わるが、フレ
ームの開始点が揺らいでいるというモデルを使うと
【数15】 で近似でき、
【数16】 を得る。しかし、分母がゼロになると困るので、|Fm(k)
| がa(k) より小さいときはそれと置き換えるか、また
は、
【数17】 とする。この置き換えまたは式の変更による上限の設定
は、埋め込み後、人間の聴覚で聞こえない程度のランダ
ムな変更は圧縮・解凍などで頻繁に生じることを考える
と妥当な近似である。上記で、さらに、a(k) が|Fm(k)|
に比例するとういう単純な聴覚モデルを使用すると、
【数18】 となり、|Fm(k)| が閾値より小さければ置き換えるもの
とする。取り出された内積の信頼度は、まず、
【数19】 を計算し、
【数20】 が正規分布に従うと仮定することで フォルスポジティ
ブエラー(False Positive Error)を計算できる。
【0025】オーディオデータは、すべてのサンプルAm
(n) を同時に−Am(n) と変えても、如何なる音質の変化
も生じない。このデータ処理を極性の反転と呼ぶが、機
器をつないでデータを流すとき、極性の反転は組み合わ
せによって生じる。従って、内積Xp(m) またはXp(m)の
符号で単純にビットを定めると、極性の反転に弱くな
る。この解決策として、 ・符号用マスクとビット用マスクとを用意し、ビット用
マスクの内積に符号用マスクの内積をかけたものの符号
でビットの値を抽出するか ・ビットの値0 用のマスク、ビットの値1 用のマスクを
用意し、どちらのマスクの内積の値が大きいかでビット
の値を抽出するかの二つの方法があるが、後者は前者の
変形とみなすことができる。
【0026】後者の解決策では、1 ビットの情報を埋め
込むのに二つのマスクM0(k) とM1(k)を使い、それぞれ
の内積X0(m) とX1(m) を求め、
【数21】 すなわち、M0(k) がビット0用のマスクを、M1(k) がビ
ット1用のマスクを表わしている。しかし、この方式
は、符号用マスクMs(k) とビット用マスクMb(k) を用い
る方式の一つとしてみなすことができる。すなわち、
【数22】 とすると、対応する符号用内積Xs(m) とビット用内積Xb
(m) にも、
【数23】 の関係が成り立つので、
【数24】 となる。この式より、Xs(m) が正ならば、Xb(m) が負の
ときビット0、Xb(m) が正のときビット1とし、Xs(m)
が負ならば、Xb(m) が負のときビット1、Xb(m)が正の
ときビット0として解釈すればよいことがわかる。
【0027】Ms(k) のように、そのマスクの内積の符号
で、他のビット用マスクの内積の解釈を変えるものを符
号用マスクと呼ぶ。極性の反転を検出し、正しくビット
を解釈するためならば、1回の埋め込みには一つの符号
用マスクで充分で、この符号用マスクの内積の符号で、
他の複数のビット用マスクの内積の符号の解釈を変えれ
ば良い。また、極性は短い間隔で揺らぐことは通常ない
ので、符号用マスクの信号は弱く埋め、その分、ビット
用マスクの信号を強く埋めてその信頼度をあげ、符号用
マスクの信号についてはフレームについて蓄積し、信頼
度を上げる。符号用マスクの信号は常に同じ向きに埋め
込むとすると、内積と分散を
【数25】 と連続するフレームm の和で求める。検出の対象となる
オーディオデータは極性の反転や時間軸上でのデータの
揺らぎを受けているかもしれないので、和のフレーム数
はあまり大きくできない。この符号用マスクはフレーム
同期用マスクや埋め込み有り無し判定と共用してもかま
わない。埋め込み有り無し判定は
【数26】 で行う。ここでt は判定の閾値で、対応するフォルスポ
ジティブエラーは
【数27】 が正規分布に従うとして計算する。このように、符号用
マスクを用いるほうがより有用である。
【0028】上記の様に、本発明の各フレームでの検出
手法は、従来技術と異なり、 ・周波数成分と疑似ランダム列のマスクとの単純な内積
をとるのではなく、周波数分布から決まる周波数依存の
規格化定数を掛けて内積を計算していること、 ・マスクとの内積の符号だけから単純にビットの値を定
めているのではなく、符号用マスクの内積の符号で他の
マスクのビット値の解釈を変えていること、 ・符号用マスクをすべてのフレームで同じ向き、また
は、交互に反対符号で埋め、フレーム間にまたがって集
め、信頼性を上げること、 ・蓄積された符号用マスクの内積を用いて埋め込みの有
り無しを判定することに特徴がある。
【0029】[フレーム同期の手法とそのシステム] 各フレームでの信号の検出では、サンプル列が埋め込み
時のフレームに正しく分割されているとしている。実際
のオーディオデータは、情報が埋め込まれた後、オーデ
ィオデータが時間方向に伸縮したり、切り取られるなど
しているかもしれないので、検出の最初、および、埋め
込みの有り無し判定で有りの信頼度が低い場合などに、
オーディオデータの時間軸の伸縮率の推定や埋め込み時
のフレームの開始位置の探索を行う必要がある。
【0030】 [位相を利用してフレーム開始位置の探索する手法] もし各フレームでの信号の埋め込みが充分に大きけれ
ば、サンプル列から開始位置を1サンプルづつずらして
仮の1フレームをとり、重ね和せ、周波数変換を行い、
各マスクとの内積の絶対値の和が最大となる位置を埋め
込み時のフレームの開始位置として推定する。もし埋め
込みによる音質の劣化を防ぐために弱く埋め込まれてい
るのであれば、埋め込みシステムで連らなるフレームの
間隔をすべて同じにとることで、検出システムにおいて
も、同じ開始位置のづれが複数の連なるフレームに適用
できるとして、単一フレームで開始位置を判断するので
はなく、複数のフレームに関して同時に良い値を与える
開始位置を1サンプルづつずらして探索することで、埋
め込み時のフレームの開始位置を精度よく推定できる。
しかし、いずれの場合も、このままでは、1サンプルづ
つずらしながら、その試しの開始位置での各フレームに
FFT を行うことになり、フレーム同期のための開始位置
探索の計算時間がかかり過ぎる。従って次の工夫で計算
を早める。 図8に本発明の位相を利用してフレーム開
始位置を探索する処理の流れを示す。埋め込みシステム
は、ステップ810で、サンプル列を隙間なく仮のフレ
ームに分割し、ステップ820でフレームを重ね合せ、
ステップ830で周波数変換する。一方フレーム同期用
マスクデータ(このフレーム同期用マスクは符号用マス
クと同一でもよい)はステップ840で位相が回転さ
れ、各フレームに同じフレーム同期用マスクで同じ向き
に埋め込むとすると、ステップ850で、周波数変換さ
れたフレームと回転したフレーム同期用マスクとの内積
を計算し、ステップ860でこの内積が最大となる位置
を埋め込み時のフレームの開始位置とする。もしそうで
なければ、処理はステップ840へ戻る。各フレームで
同じ信号が埋まっているので、検出システムでは、フレ
ーム区切りが埋め込み時のフレームの区切りからずれて
いても、埋め込み時のフレーム幅の倍数の幅のサンプル
列があれば、フレーム同期用マスクを位相回転(ステッ
プ840)させることで検出できる。時間軸上でvサン
プルだけフレームが移動することは、周波数空間では位
相が2πkv/Nだけ回転すること、すなわち、フレーム同
期用マスクMs(k) をMs(k)ej2πkv/Nに置き換えること
である。ここでjは虚数単位である。
【0031】具体的には以下の手続きで埋め込み時のフ
レームの開始位置を推定する。 (1)仮のフレーム区切りのまま、サンプルAm(n) を重ね
集め、1フレームのデータ
【数28】 を合成し、FFT などで周波数変換をし、周波数成分 F
(k) を得る。 (2)フレーム区切りの位置をずらすかわりにフレーム同
期用マスク Ms(k) の位相を回転して、内積
【数29】 を各vについて計算し、最大の|Sync(v)| を与えるvを求
め、埋め込み時のフレームの区切りの開始位置はこの仮
りの区切りの開始位置よりvサンプル先にあると推定す
る。
【0032】ここで、得られたSync(v) を、ビット用マ
スクの内積の解釈を変える符号用マスクの内積の代用と
して使用することもできる。いま、仮りの区切りが埋め
込み時の位置だとすると、上記のSync(v) は
【数30】 と予測される。ここで、λ(k) は埋め込み後の劣化から
くる揺らぎで、劣化が少なければ1に近い。高周波は圧
縮解凍で落ちやすい。従って上記を次でさらに近似す
る。
【数31】 すなわち、Sync(v) は一般には最適のvの周りで振動
し、その解像度はN/(kmax -kmin + 1)であると予測され
る。従って、フレーム同期用マスクのゼロでない周波数
が幅広く分布していることが望ましく、少なくとも、フ
レーム同期用マスクはビット用マスクと同じ周波数域を
使うべきである。
【0033】 [位相のそろった信号の埋め込みによる伸縮率の推定手
法] 図9に、位相のそろった信号の埋め込みによる伸縮率の
推定処理の流れを示す。埋め込み時のフレーム区切り位
置の推定では、オーディオデータの時間軸上での伸縮は
ないとしている。伸縮があった場合に埋め込み信号を検
出できるために次のようにして伸縮率を推定する。埋め
込みシステムと検出システムが一つまたは複数の特定の
周波数を知っていて、埋め込みシステムは、ステップ9
20で平均的人間の聴覚でその変化が検知できない範囲
で、その周波数が各フレームでできるだけ同じ位相にな
るように変更する。検出システムではステップ930で
フレームの幅を変更し、フレーム幅の変更を時間軸上の
伸縮率として変更された周波数の位相が各フレームでそ
ろっているかをステップ950でテストし、ステップ9
60において、最もそろっているフレーム幅の変更で、
時間軸上の伸縮率を定める。
【0034】いま、フレーム幅 N'でのサンプルをAm
(N')(n) = AN'm+n と記し、それに対応する周波数成分
【数32】 と記す。もし、時間軸上の伸縮でフレーム幅Nがフレー
ム幅N'に伸縮したのであれば、埋め込み時のFm(N)(k)
は検出時のFm(N')(k) に変換されるだけである。従っ
て、埋め込みシステムと検出システムが特定の周波数ki
を互いに知っていて、埋め込みシステムはその位相Fm
(N)(ki)=|Fm(N)(ki)| がすべてのフレームm でできるだ
け等しくなるよう埋め込み、検出システムでは、フレー
ム幅を変えて各周波数kiで
【数33】 が最大値をとるフレーム幅N'を求め、その比N'/Nで時間
軸上の伸縮率を求める。互いに知っている周波数kiが複
数あるとき、
【数34】 または、
【数35】 を最大にするフレーム幅N'を求め、その比N'/Nで時間軸
上の伸縮率を求める。
【0035】この変形として、埋め込みシステムと検出
システムが一つまたは複数の特定の周波数を知ってい
て、埋め込みシステムは、平均的人間の聴覚でその変化
が検知できない範囲で、その周波数が各フレームででき
るだけ同じ位相と振幅になるように変更し、検出システ
ムではフレームの幅を変更し、フレーム幅の変更を時間
軸上の伸縮率として変更された周波数の位相が各フレー
ムでそろっているかをテストし、最もそろっているフレ
ーム幅の変更で、時間軸上の伸縮率を定める。
【0036】いま、埋め込みシステムと検出システムが
特定の周波数kiを互いに知っていて、埋め込みシステム
はその周波数成分Fm(N)(ki) がすべてのフレームm でで
きるだけ等しくなるよう埋め込み、検出システムは、フ
レーム幅を変えて各周波数kiで
【数36】 が最大値をとるフレーム幅N'を求め、その比N'/Nで時間
軸上の伸縮率を求める。互いに知っている周波数kiが複
数あるとき、
【数37】 または、
【数38】 を最大にするフレーム幅N'を求め、その比N'/Nで時間軸
上の伸縮率を求める。
【0037】 [メッセージ同期の手法とそのシステム] オーディオデータに対してどこから切り取ってもメッセ
ージ(付加情報)が生き残るためにはメッセージを繰り
返して埋め込む必要がある。従って、各フレームからビ
ット情報が抽出できても、どこが繰り返しメッセージの
ビット列の先頭でどこが終わりかを推定する必要があ
る。すなわち、埋め込みシステムでのメッセージの先頭
と検出システムのメッセージの先頭が正しく同期してい
る必要がある。
【0038】[バイトやワードやメッセージなどの解釈
の区切りのフレームを使用する手法]図11に、バイト
やワードやメッセージなどの解釈の区切りのフレームを
使用した場合の概念図を示す。抽出されたビット列にバ
イトやワードやメッセージなどの解釈の区切りをいれる
ために、埋め込みシステムが、その区切りのフレームを
除き、各フレームに同じ向きに同期信号を埋め込み、区
切りのフレームには反対の向きに同期信号を埋め込む
か、または何も埋め込まない。検出システムは、その同
期信号の値が他のフレームと反対向きか、埋め込まれて
いないことをもって区切りのフレームと推定する。
【0039】同期信号は、フレーム同期用マスクや符号
用マスクを使用して埋め込んでもよい。この場合、フレ
ーム同期信号や符号信号は、充分多くのフレームでの内
積の和で判定することで、区切りのフレームの影響が無
視できるようにする。
【0040】埋め込みシステムでは区切りのフレーム以
外ではできるだけ同じ同期信号を埋め込むことで、検出
システムでは、検出した区切りのフレームの同期信号が
他のフレームの同期信号の揺らぎの範囲にあるかどうか
の統計推定することでその推定の信頼度を求めることが
できる。埋め込みシステムにより埋め込まれたフレーム
区切りの間隔を検出システムが知っていて、その間隔の
範囲で他と著しく異なるフレームを探索することで、音
質維持のために同期信号を比較的弱く埋め込んだ場合で
も検出することができる。埋め込みシステムと検出シス
テムが互いに了解していれば、ビット情報は区切りのフ
レームに埋め込んでも埋め込まなくても良い。
【0041】 [繰り返し周期の異なる複数情報埋め込み手法] 重要性が違う複数の情報をオーディオデータに埋め込む
場合、切り取り耐性が同じである必要はない。重要な情
報は頻繁に繰り返されて短い切り取り区間でも検出でき
たほうが良い。
【0042】切り取り耐性の異なる複数の情報を埋め込
み、検出するために、埋め込みシステムと検出システム
とが、それぞれの情報を分割する分割単位のビット長と
分割数を知っていて、埋め込み時にそれぞれの情報を分
割単位のビット長に分割し、各情報から順に分割された
ビット列を取り出し並べて均等なビット長の情報(合成
単位と呼ぶ)を作成し、その情報の合成単位の先頭のビ
ットを区切りのフレームに埋め込み、残りのビットを順
に続くフレームに埋め込む手法、及びシステム。
【0043】例えば、ビット列情報A、B、Cがあると
し、各情報を
【数39】 と分割したとする。埋め込みシステムは
【数40】 と分割されたビット列を並べることで、検出される周期
の違う複数の情報を切り取りに対して一様に埋め込む。
各ApBqCrの先頭ビットは区切りのフレームに埋め込む。
上記繰り返し周期の異なる複数情報埋め込み手法につい
て、従来の方法と本発明の方法の違いを図10に示す。
【0044】[特定のビット列を加算することでメッセ
ージの開始位置を推定する手法]埋め込みシステムと検
出システムは、付加情報のビット列より長く、また、巡
回シフトで自分自身と一致することのない特定のビット
列(区切り用ビット列と呼ぶ)を互いに知っているもの
とする。巡回シフトで自分自身と一致することのないと
は、そのビット列を繰り返したとき、元の区切りで切っ
たときのみ、元のビット列を復元できるものを言う。例
えば、"00100010"は、その繰り返しに 00100010,00100010,00100010,00100010,... と区切り","を入れても、 0010,00100010,00100010,00100010,0010... と区切り","を入れても"00100010"を復元できる。従っ
て、区切り用ビット列として使用できない。"00100010"
は"0010"をその内部で繰り返しているが、一般に、自分
自身の中で周期を持つビット列は巡回シフトで自分自身
と一致し、区切り用ビット列として使用できない。一
方、自己周期を持たない"00100011"は、その繰り返しは
特定の区切りでのみしか元のビット列を復元できないの
で、"00100011"は区切り用ビット列として使用できる。
【0045】また、埋め込みシステムと検出システム
は、ビット列に区切り用ビット列を排他的論理和(演算x
or) で加えたかどうかを判定する方法を知っているもの
とする。例えば、区切り用ビット"00100011"では、ビッ
ト列の最後のビットの値を見ることで、区切り用ビット
の演算xor が施されたかを判定できる。判定方法は一意
でなく、この区切り用ビット列の例では、すべての桁の
ビットの和が奇数か偶数かを使っても判定できる。図1
2は、上記特定のビット列を加算することでメッセージ
の開始位置を推定する方法の説明図である。
【0046】埋め込みシステムは、付加情報の作るビッ
ト列に1 ビット以上のビットを追加して、区切り用ビッ
ト列と同じ長さの拡張ビット列を作成し、オーディオデ
ータにそれを繰り返して埋め込むとき、一つおきの繰り
返しに区切り用ビット列を演算xor で加算して埋め込む
ものとする。追加ビットは、区切り用ビット列が加算さ
れているかを判定するのに使用する。
【0047】検出システムでは、抽出されたビット列
に、区切り用ビット列のビット長だけずらした同じ抽出
ビット列を演算xor で加え、得られたビット列から区切
り用ビット列とが一致する区切りを探索し、有ればそれ
を抽出ビットの区切りの位置とし、無ければ抽出ビット
に誤りがありとする。区切られたビット列は一区切りお
きに、区切り用ビット列が加算されているので、追加ビ
ットを使って、加算されていないほうのビット列を判定
し、それを復元ビット列とする。
【0048】例えば、"00100011"が区切り用ビット列と
する。埋め込みシステムで付加情報が7 ビットの"11011
01"とする。ことき、1ビット"0"を追加し、拡張ビット
列"11011010"を作成し、繰り返して埋め込むとき、 11011010,11111001,11011010,11111001,11011010,11111
001,... と、一つおきの繰り返しで区切り用ビット列を演算xor
で加算して、各ビットをフレームに埋め込む。ここで
は、区切り',' を見易さのために加えてあるが、実際に
各フレームで埋め込むのはビット値0 または1 のみであ
る。
【0049】埋め込み後の処理のため最初の3ビットが
上記から抜け落ち、検出システムでは、 11010,11111001,11011010,11111001,11011010,1111100
1,... とビット列が抽出できたとする。区切り用ビット列の長
さだけずらした、 11001,11011010,11111001,11011010,11111001,1101101
0,... を演算xor で加算すると、 00011,00100011,00100011,00100011,00100011,0010001
1,... となる。従って、区切り用ビット列"00100011"との一致
から、この区切りしかないことがわかる。次に、各区切
りで、追加ビットが"0"の拡張ビット列を選択すること
で、付加情報のビット列が"1101101"であることが導か
れる。
【0050】 [フレームでの検出信頼度を考慮してメッセージの開始
位置を推定する手法] 図13は、フレームでの検出信頼度を考慮してメッセー
ジの開始位置を推定する方法の説明図である。フレーム
での検出信頼度を考慮して、メッセージの開始位置を推
定するために、検出システムでは、区切り用ビット列の
長さから対応が定まる二つのフレームでおのおのビット
用マスクの内積の積を求め、それに区切り用ビット列の
定める符号を掛け、続くフレームでの和が最大となるこ
とで区切りを探索する。区切り用ビット列を{B(m)} と
し、その長さをMとする。また、いま、ビット用マスク
で得られた各フレームでの内積の値をXb(m) とする。こ
のとき、
【数41】 を計算し、最大となるvを求め、その位置をメッセージ
の開始位置とする。ここで、区切り用ビットの添え字が
元の定義域をこえたとき、 B(m + M) = B(m) で定義域
を拡張するものとし、また、(-1)0 = 1、(-1)1 = -1 と
する。この手法では、各フレームでビットの誤りがあっ
ても、メッセージの開始位置が求めることができる。
【0051】ビット情報自体は、一旦、メッセージの開
始位置がわかると、複数の繰り返しに関して蓄積した
【数42】 の符号で求める。ここで、p(r) は区切り用ビットが加
算してある繰り返しなら1、加算してない繰り返しなら
ゼロある。
【0052】 [特定のビット列を加算することで複数のメッセージの
開始位置を推定する手法] 複数の情報を異なる周期で埋め込むために、シフトで自
分自身と一致しない特定のビット列(区切り用部分ビッ
ト列と呼ぶ) を埋め込み時に排他的論理和で加算するこ
とで、検出時に情報の開始位置を検出する。
【0053】ここで、シフトで自分自身と一致しないと
は、長さMのビット列{B(m)} に対し、任意のシフトv (0
< v < M) を行ったとき、B(m) ≠ B(m+v) となるm が0
≦ m≦ m+v ≦M-1 の範囲に必ず有ることを言う。例え
ば、"01011011101111"や"010011000111"はシフトで自分
自身と一致しないビット列の例である。
【0054】いま、短い周期で繰り返して埋められる付
加情報のビット列や、それより長い周期で繰り返される
その他の付加情報の分割ビット列より長い、区切り用部
分ビット列を埋め込みシステムと検出システムは知って
いるとする。埋め込みシステムは、短い周期で繰り返す
付加情報のビット列にビットを追加して区切り用部分ビ
ット列の同じ長さの拡張ビット列を作成し、さらに、そ
の他の分割ビット列を付け加えて、合成単位のビット列
を作成し、順に合成単位のビット列を埋め込むとき、一
つおきに、区切り用部分ビット列を拡張ビット列に排他
的論理和(演算xor) で加算して埋め込むものとする。追
加ビットは、区切り用部分ビット列が加算されているか
を判定するのに使用する。
【0055】検出システムでは、抽出されたビット列
に、合成単位のビット列のビット長だけずらした同じ抽
出ビット列を演算xor で加え、得られたビット列から区
切り用部分ビット列とが一致する区切りを探索し、有れ
ばそれを抽出ビットの区切りの位置とし、無ければ抽出
ビットに誤りがありとする。区切られたビット列は一区
切りおきに、区切り用部分ビット列が加算されているの
で、追加ビットを使って、加算されていないほうのビッ
ト列を判定し、それを復元ビット列とする。
【0056】例えば、"00110111"が区切り用部分ビット
列とし、短い周期の付加情報が7 ビットの"1101101"と
する。このとき、埋め込みシステムは、1ビット"0"を
追加し、拡張ビット列"11011010"を作成し、それに、そ
の他の長い周期の付加情報の分割ビット列"*******"を
添付して合成単位のビット列"11011010*******"を作成
する。ここで"*"はおのおのが0 または1のいずれかと
いう意味である。合成単位のビット列を埋め込むとき、
一つおきに区切り用部分ビット列を演算xor で加算する
ので、 11011010*******,11101101*******,11011010*******,11
101101*******,... の各ビットが各フレームに埋め込まれる。ここでは、区
切り',' を見易さのために加えてあるが、実際に各フレ
ームで埋め込むのはビット値0 または1 のみである。
【0057】埋め込み後の処理のため最初の3ビットが
上記から抜け落ち、検出システムでは、 11010*******,11101101*******,11011010*******,11101
101*******,... とビット列が抽出できたとする。合成単位のビット列の
長さだけずらした、 01101*******,11011010*******,11101101*******,... を演算xor で加算すると、 10111*******,00110111*******,001101111*******,... となる。"*******"の部分の値が何であれ、区切り用部
分ビット列の長さより短いので一致することはなく、ま
た、シフトで自分自身と一致することも無いので、"001
10111"との一致するのは、埋め込み時の区切りしかない
ことがわかる。次に、各区切りで、追加ビットが"0"の
拡張ビット列を選択することで、短い周期の付加情報の
ビット列が"1101101"であることが導かれる。同様に、
添付したビット列"*******"を、その付加情報の中で短
いものを取り出し、その長さに対応した部分区切りビッ
ト列を使うことで、その付加情報の開始位置を検出でき
る。図14に上記特定のビット列を加算することで複数
のメッセージの開始位置を推定する手法を図示する。
【0058】 [巡回シフトの影響を受けない符号語の埋め込み] 付加情報が繰り返して埋め込まれるものとして、埋め込
みシステムと検出システムとが繰り返しまでのフレーム
数を知っており、その長さのビット列の集まりに対し、
巡回シフトで等しくなるビット列は同値とみなし、同値
でないビット列を異なる付加情報に対応させることで、
情報を埋め込み、ビット列の始まりを知ることなく付加
情報を抽出する手法、および、そのシステム。
【0059】巡回シフトで互いに等しくならないビット
列としては、例えば {00000},{00001},{00011},{00101},{00111},{01011},{0
1111},{11111} がある。5 ビット長の列をもちいて、8個の状態、すな
わち、3 ビットの情報を表現することができる。図15
に上記5 ビット長の列をもちいて3 ビットの情報を埋め
込む例を示す。一般にビットの長さMのビット列の集ま
りで、巡回シフトで互いに等しくならない独立のビット
列の数をS(M) とすると、素数p に対し、
【数43】
【数44】 となる。また、互いに素なp とqに対しては、
【数45】 となる。
【0060】
【実施例】以下、図面を参照して本発明の実施例を説明
する。図1に本発明の付加情報埋め込み装置のブロック
図を示す。入力制御ブロック 110は、入力されるオーデ
ィオ信号を時系列に並んだサンプル値として、周波数変
換ブロック120へ渡すものである。入力信号がアナログ
の場合、AD変換を行い、デジタル化されたものであれ
ば、フォーマットを解釈し、オーディオサンプル列をブ
ロック120へ渡す。
【0061】周波数変換ブロック120は、オーディオ信
号の各周波数成分を算出するブロックである。このブロ
ックはブロック110からのデジタル化されたオーディオ
信号を受け、その区間における周波数成分の計算を行
う。
【0062】聴覚心理モデル算出ブロック130は、人間
の耳の特性に基づき、変化に対し聞き分けにくい領域を
算出するブロックである。このブロックはブロック120
からの周波数変換されたオーディオ信号を受け、周波数
成分ごとに聞えに対する影響度を算出する。
【0063】疑似乱数生成ブロック160は、0,1の疑似ラ
ンダム列を生成するブロックである。生成された疑似ラ
ンダム列はブロック170へ渡され、付加情報埋め込み用
のマスク生成のために用いられる。
【0064】付加情報埋め込み用マスク生成ブロック17
0は、付加情報埋め込み時に用いられるマスクを生成す
るものである。このブロックは、ブロック160で生成さ
れた疑似ランダム列と位相方向とを対応づけ、周波数毎
に埋め込み信号の位相を定める複素数平面上での2次元
ベクトル(マスク)を生成するブロックである。
【0065】付加情報180は、ビット列情報としてブロ
ック140へ渡される。このビット列は、ブロック140で、
必要に応じてメッセージ同期検出用にビットが挿入、反
転される。
【0066】付加情報埋め込みブロック140は、オーデ
ィオ信号に非可聴の付加情報を埋め込むブロックであ
る。このブロックは、オーディオ信号の周波数成分のあ
る統計量が、付加情報180から受けるビット情報に従っ
て定められる符号となるよう、ブロック130で算出され
た聴覚心理モデルをもとに非可聴の範囲で、ブロック17
0より受けるマスク方向に信号および時間伸縮率検出用
の同期信号を、ブロック120より受ける周波数変換され
たオーディオ信号に付加する。
【0067】周波数逆変換ブロック190は、周波数変換
されたオーディオ信号を逆変換するブロックである。こ
のブロックは、ブロック140からの付加情報を埋め込ん
だ周波数変換されたオーディオ信号を逆変換し、時系列
に並んだオーディオサンプル列を算出するブロックであ
る。
【0068】出力制御ブロック150は、時系列に並んだ
オーディオサンプル列をオーディオデータとして出力す
るものである。このブロックは、ブロック190より受け
たオーディオサンプル列をDA変換、あるいは、ファイル
としてヘッダ情報等を付加し、オーディオ信号を出力す
る。
【0069】図2に本発明の付加情報検出装置のブロッ
ク図を示す。入力制御ブロック 210は、入力されるオー
ディオ信号を時系列に並んだサンプル値として、周波数
変換ブロック220へ渡すものである。入力信号がアナロ
グの場合、AD変換を行い、デジタル化されたものであれ
ば、フォーマットを解釈し、オーディオサンプル列をブ
ロック250へ渡す。
【0070】周波数変換ブロック220は、オーディオ信
号の各周波数成分を算出するブロックである。このブロ
ックはブロック210からのデジタル化されたオーディオ
信号を受け、その区間における周波数成分の計算を行
う。
【0071】付加情報同期検出ブロック250は、オーデ
ィオ信号に付加情報が埋め込まれているとして、入力さ
れるオーディオ信号の時間伸縮率や、付加情報埋め込み
処理単位(フレーム)開始位置を検出するブロックであ
る。このブロックでは、ブロック220より受けた周波数
変換されたオーディオ信号に対し、時間伸縮率検出用の
同期信号の伸縮率を測定することで、オーディオ信号の
伸縮率を求める。その後、ブロック280より受けるフレ
ーム同期用マスクを回転させて、時間伸縮率を補正した
オーディオ信号との内積値を計算し、その値が最大とな
る回転角度よりフレーム開始位置のずれを検出する。
【0072】疑似乱数生成ブロック270は、0,1の疑似ラ
ンダム列を生成するブロックである。生成された疑似ラ
ンダム列はブロック280へ渡され、付加情報検出用のマ
スク生成のために用いられる。
【0073】付加情報検出用マスク生成ブロック280
は、付加情報検出時に用いられるマスクを生成するもの
である。このブロックは、ブロック270で生成された疑
似ランダム列と位相方向とを対応づけ、周波数毎に埋め
込み信号の位相を定める複素数平面上での2次元ベクト
ル(マスク)を生成するブロックである。
【0074】付加情報検出ブロック260は、オーディオ
信号に埋め込まれている付加情報を検出するブロックで
ある。このブロックでは、ブロック250より受けた時間
伸縮率、フレームの同期のとれた周波数変換されたオー
ディオ信号と、ブロック280より受ける付加情報検出用
マスクとの内積値を統計量として算出する。なお統計量
の値により、同期をやり直す必要が生じた場合には、ブ
ロック250の付加情報同期検出に再同期の信号を与え
る。
【0075】付加情報有無検出ブロック230は、算出さ
れた統計量をもとに、オーディオ信号に付加情報が埋め
込まれているか否か有無を判定するブロックである。こ
のブロックは、ブロック260より受けた統計量の大きさ
が十分に大きな値であるかどうかにより、入力されたオ
ーディオ信号に意図的に情報が埋め込まれているか否か
を判定するブロックである。
【0076】付加情報復元ブロック240は、検出された
ビット情報を付加情報として復元するブロックである。
このブロックは、ブロック230により付加情報が埋め込
まれていると判定された場合には、その統計量の符号と
ビットとを対応づけてビット情報として解釈し、検出さ
れたビット情報の中から付加情報の開始ビットを検出
し、開始ビットに合わせ検出されたビット情報をシフト
し、メッセージ同期用にビットが挿入/反転されている
場合には、それらを除去/反転させ、埋め込んだ付加情
報を復元する。
【0077】図3には、本発明の付加情報の埋め込み/
検出において使用されるシステムのハードウェア構成の
一実施例が示されている。システム100は、中央処理
装置(CPU)1とメモリ4とを含んでいる。CPU1
とメモリ4は、バス2を介して、補助記憶装置としての
ハードディスク装置13(またはMO、CD−ROM2
3、DVD等の記憶媒体駆動装置)とIDEコントロー
ラ25を介して接続してある。同様にCPU1とメモリ
4は、バス2を介して、補助記憶装置としてのハードデ
ィスク装置30(またはMO28、CD−ROM23、
DVD等の記憶媒体駆動装置)とSCSIコントローラ
27を介して接続してある。フロッピーディスク装置2
0はフロッピーディスクコントローラ19を介してバス
2へ接続されている。
【0078】フロッピーディスク装置20には、フロッ
ピーディスクが挿入され、このフロッピーディスク等や
ハードディスク装置13(またはMO、CD−ROM、
DVD等の記憶媒体)、ROM14には、オペレーティ
ングシステムと協働してCPU等に命令を与え、本発明
を実施するための付加情報の埋め込みまたは検出を行う
コンピュータ・プログラムのコード若しくはデータを記
録することができ、メモリ4にロードされることによっ
て実行される。このコンピュータ・プログラムのコード
は圧縮し、または、複数に分割して、複数の媒体に記録
することもできる。
【0079】システム100は更に、ユーザ・インター
フェース・ハードウェアを備え、入力をするためのポイ
ンティング・デバイス(マウス、ジョイスティック等)
7またはキーボード6や、入力されたオーディオデー
タ、復元したオーディオデータ、付加情報などの視覚デ
ータをユーザに提示するためのディスプレイ12を有す
ることができる。また、パラレルポート16を介してプ
リンタを接続することや、シリアルポート15を介して
モデムを接続することが可能である。このシステム10
0は、シリアルポート15およびモデムまたは通信アダ
プタ18(イーサネットやトークンリング・カード)等を
介してネットワークに接続し、他のコンピュータ等と通
信を行うことが可能である。埋め込む付加情報を該通信
アダプタ18を介して外部ネットワークから取り込んだ
り、復元した付加情報をネットワークを介して外部に送
信することも可能である。またシリアルポート15若し
くはパラレルポート16に、遠隔送受信機器を接続し
て、赤外線若しくは電波によりデータの送受信を行うこ
とも可能である。
【0080】スピーカ23は、オーディオ・コントロー
ラ21によってD/A(デジタル/アナログ変換)変換
されたオーディオ、音声信号を、アンプ22を介して受
領し、オーディオや音声として出力する。また、オーデ
ィオ・コントローラ21は、マイクロフォン24から受
領した音声またはオーディオ情報をA/D(アナログ/
デジタル)変換し、埋め込むための付加情報としてシス
テムにとり込むことを可能にしている。
【0081】このように、本発明に使用できるシステム
100は、通常のパーソナルコンピュータ(PC)やワ
ークステーション、ノートブックPC、パームトップP
C、ネットワークコンピュータ、コンピュータを内蔵し
たテレビ等の各種家電製品、通信機能を有するゲーム
機、電話、FAX、携帯電話、PHS、電子手帳、等を
含む通信機能有する通信端末、または、これらの組合せ
によって実施可能であることを容易に理解できるであろ
う。ただし、これらの構成要素は例示であり、その全て
の構成要素が本発明の必須の構成要素となるわけではな
い。なお、図1、図2の付加情報埋め込み/検出の各ブ
ロックを専用のハードウェアにより構成しても何ら構わ
ない。
【0082】
【発明の効果】本発明により、オーディオデータに対し
著作権情報等の付加情報の埋め込みによる音質の変化を
人間の聴覚では検知できないように埋め込みながら、一
方で、音質に著しい劣化を引き起こさない範囲でのオー
ディオデータへの処理に対し、埋め込んだ付加情報が残
り、信頼性をもって検出できる方法およびそのシステム
が提供される。これにより、CD やインターネットで配
送された音楽コンテンツの著作権保護が実現され、高品
質の音楽コンテンツを安心してデジタルで供給できるよ
うになり、音楽文化の安定した再生産・消費を実現する
ことが可能となる。
【図面の簡単な説明】
【図1】本発明の付加情報埋め込み装置のブロック図で
ある。
【図2】本発明の付加情報検出装置のブロック図であ
る。
【図3】付加情報の埋め込/検出において使用されるシ
ステムのハードウェア構成例である。
【図4】本発明の付加情報埋め込み処理の流れを示す図
である。
【図5】本発明の付加情報検出処理の流れを示す図であ
る。
【図6】フレームでの信号の埋め込み処理の流れを示す
図である。
【図7】フレームでの信号検出処理の流れを示す図であ
る。
【図8】位相を利用してフレーム開始位置を探索する処
理の流れを示す図である。
【図9】位相のそろった信号の埋め込みによる伸縮率の
推定処理の流れを示す図である。
【図10】繰り返し周期の異なる複数情報埋め込みにお
いて、従来の方法と本発明の方法の違い示す図である。
【図11】バイトやワードやメッセージなどの解釈の区
切りのフレームを使用した場合の概念図である。
【図12】特定のビット列を加算することでメッセージ
の開始位置を推定する方法の説明図である。
【図13】フレームでの検出信頼度を考慮してメッセー
ジの開始位置を推定する方法の説明図である。
【図14】特定のビット列を加算することで複数のメッ
セージの開始位置を推定する手法を説明する図である。
【図15】5 ビット長の列をもちいて 3 ビットの情報
を埋め込む例を示す図である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 陳 定遠 神奈川県大和市下鶴間1623番地14 日本 アイ・ビー・エム株式会社 東京基礎研 究所内 (72)発明者 大嶋 良明 神奈川県大和市下鶴間1623番地14 日本 アイ・ビー・エム株式会社 東京基礎研 究所内 (72)発明者 清水 周一 神奈川県大和市下鶴間1623番地14 日本 アイ・ビー・エム株式会社 東京基礎研 究所内 (72)発明者 森本 典繁 神奈川県大和市下鶴間1623番地14 日本 アイ・ビー・エム株式会社 東京基礎研 究所内 (56)参考文献 特開 平9−191394(JP,A) 特開 平11−272299(JP,A) 特開2000−89796(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 H04N 7/08 G09C 5/00 G11B 20/10

Claims (40)

    (57)【特許請求の範囲】
  1. 【請求項1】オーディオデータへ付加情報を埋め込む、
    付加情報埋め込みシステムであって、 (1)オーディオデータを周波数変換する手段と、 (2)前記オーディオデータに基づき、前記オーディオ
    データに付加情報を埋め込むことのできる、周波数の変
    更範囲を決定する手段と、 (3)付加情報検出時の同期検出を可能とする、付加情
    報埋め込み用のマスクを生成する手段と、 (4)前記周波数変換されたオーディオデータの前記埋
    め込むことのできる周波数の変更範囲に、付加情報を、
    前記付加情報埋め込み用のマスクを用いて埋め込む手段
    と、 (5)周波数変換され付加情報の埋め込まれたオーディ
    オデータを、オーディオデータに逆変換する手段と、 を具備することを特徴とする、付加情報埋め込みシステ
    ム。
  2. 【請求項2】前記オーディオデータを周波数変換する手
    段(1)が、オーディオデータを、各々が複数のサンプ
    ル列からなる複数のフレームに分割し、各フレームを周
    波数変換する手段である、請求項1記載のシステム。
  3. 【請求項3】前記付加情報を埋め込むことのできる周波
    数の変更範囲を決定する手段(2)が、周波数変換され
    たオーディオデータの周波数分布に基づき、平均的な人
    間の聴覚では検知できない周波数の変更範囲を決定する
    手段である、請求項2記載のシステム。
  4. 【請求項4】前記付加情報埋め込み用のマスクは、擬似
    乱数生成器から得られた擬似乱数により生成される、周
    波数毎の埋め込み方を定める擬似ランダムな数である、
    請求項3記載のシステム。
  5. 【請求項5】前記付加情報を埋め込む手段(4)が、付
    加情報に応じて、前記擬似ランダムな数と前記周波数変
    換されたフレームの周波数成分との内積が特定の符号ま
    たは値になるように各周波数成分を、前記埋め込むこと
    のできる周波数の変更範囲内で変更することにより、付
    加情報を埋め込む手段である、請求項4記載のシステ
    ム。
  6. 【請求項6】前記付加情報を埋め込む手段(4)が、付
    加情報に応じて、前記擬似ランダムな数と前記周波数変
    換されたフレームの周波数成分との内積が特定の符号ま
    たは値になるように各周波数成分を、前記埋め込むこと
    のできる周波数の変更範囲内で最大となるように変更す
    ることにより、付加情報を埋め込む手段である、請求項
    4記載のシステム。
  7. 【請求項7】連続する2フレームにおいて、前方フレー
    ム内の最終サンプル列と後方フレーム内の最初のサンプ
    ル列の周波数変換後の値が、等しい値に近づくように、
    前記擬似ランダムな数を変更するか、または前記各フレ
    ームの周波数成分の変更に制限を加える手段を含む、請
    求項3記載のシステム。
  8. 【請求項8】前記付加情報を埋め込む手段(4)が、フ
    レーム内の周波数成分を複数の周波数帯域に分割し、各
    々の周波数帯域に対して、互いの内積が零となる直交す
    る複数の付加情報埋め込み用マスクを用いて情報を埋め
    込む、多重の付加情報の埋め込みを行う手段を含む、請
    求項3記載のシステム。
  9. 【請求項9】前記付加情報を埋め込む手段(4)が、付
    加情報の検出時に埋め込みを行ったフレームの区切りを
    特定するための同期信号を、各フレームに埋め込む手段
    を含む、請求項3記載のシステム。
  10. 【請求項10】前記付加情報を埋め込む手段(4)が、
    付加情報の検出時に時間方向への伸縮率を検出するため
    の同期信号を、各フレームに埋め込む手段を含む、請求
    項3記載のシステム。
  11. 【請求項11】前記付加情報を埋め込む手段(4)が、
    複数のフレームに同一の付加情報を繰り返して埋め込む
    手段を含む、請求項3記載のシステム。
  12. 【請求項12】複数のフレームに繰り返して埋め込まれ
    た付加情報の繰り返し開始もしくは終了フレームを特定
    するために、該付加情報の繰り返しを検出する区切りフ
    レームを設ける手段を含む、請求項11記載のシステ
    ム。
  13. 【請求項13】前記区切りフレームは、付加情報を埋め
    込むフレームに、他のフレームとは異なる同期信号を埋
    め込んだフレームである、請求項12記載のシステム。
  14. 【請求項14】前記区切りフレームは、付加情報を埋め
    込むフレームに、何も信号を埋め込まないフレームであ
    る、請求項12記載のシステム。
  15. 【請求項15】複数のフレームをまたいで繰り返して埋
    め込まれた付加情報の繰り返し開始もしくは終了フレー
    ムを特定するために、巡回シフトで一致しない区切り用
    ビット列を付加情報に加算したものを埋め込む手段を含
    む、請求項11記載のシステム。
  16. 【請求項16】複数のフレームをまたいで繰り返して埋
    め込まれた付加情報の繰り返し開始もしくは終了フレー
    ムを特定するために、付加情報として,埋め込もうとす
    る情報に1ビット以上の追加ビットを付し拡張ビット列
    を生成する手段を含む、請求項11記載のシステム。
  17. 【請求項17】前記拡張ビット列を付加情報として埋め
    込む際に、繰り返し周期の1つおきに前記区切り用ビッ
    ト列を排他的論理和により加算して付加情報を埋め込む
    手段を含む、請求項11記載のシステム。
  18. 【請求項18】巡回シフトしても他のビット列と区別で
    きるビット列の組(コードワード)を付加情報と対応さ
    せて繰り返し埋めることにより、繰返し周期の開始もし
    くは終了フレームを特定することなく埋め込み情報検出
    可能な手段を含む、請求項11記載のシステム。
  19. 【請求項19】前記付加情報を埋め込む手段(4)が、
    複数の付加情報をそれぞれ異なる繰り返し周期で埋め込
    む手段を含む、請求項3記載のシステム。
  20. 【請求項20】複数の付加情報をそれぞれ異なる繰り返
    し周期で埋め込む際に、最も短い周期で検出される付加
    情報に対し、他の付加情報を付加情報ごとに定められる
    ビット長に分割したものを付加し、それらを付加情報埋
    め込み繰り返し単位として埋め込む、請求項19記載の
    システム。
  21. 【請求項21】繰り返し単位が分かるように、最も短い
    周期で検出される情報に対し、区切り用ビット列を繰り
    返し周期1つおきに排他的論理和でくわえたものを埋め
    込む、請求項19記載のシステム。
  22. 【請求項22】オーディオデータに埋め込まれた付加情
    報を検出する、付加情報検出システムであって、 (1)オーディオデータを周波数変換する手段と、 (2)付加情報検出用のマスクを生成する手段と、 (3)前記周波数変換されたオーディオデータから、オ
    リジナルのオーディオデータを使用せずに、付加情報検
    出のための同期をとる、同期検出手段と、 (4)前記周波数変換されたオーディオデータから、同
    期をとりながら、前記付加情報検出用マスクを用いて、
    付加情報のビットを検出する、付加情報検出手段と、 を具備することを特徴とする、付加情報検出システム。
  23. 【請求項23】前記オーディオデータを周波数変換する
    手段(1)が、オーディオデータを、各々が複数のサン
    プル列からなる複数のフレームに分割し、各フレームを
    周波数変換する手段である、請求項22記載のシステ
    ム。
  24. 【請求項24】前記付加情報検出用のマスクは、擬似乱
    数生成器から得られた擬似乱数により生成される、擬似
    ランダムなベクトルである、請求項22記載のシステ
    ム。
  25. 【請求項25】前記付加情報検出用のマスクは、付加情
    報埋込み時に用いられたマスクと実質的に同一である、
    請求項22記載のシステム。
  26. 【請求項26】前記付加情報を検出する手段(4)が、
    各フレームが周波数変換された周波数成分と、前記擬似
    ランダムな数との内積を計算し、該内積の値の符号、ま
    たは内積の値により、付加情報を検出する手段である、
    請求項24記載のシステム。
  27. 【請求項27】前記内積は、各フレームが周波数変換さ
    れた周波数成分に周波数分布から決まる周波数依存の定
    数を掛けたものと、前記擬似ランダムな数との内積を算
    出することを特徴とする、請求項26記載のシステム。
  28. 【請求項28】前記付加情報を検出する手段(4)が、
    フレーム同期用マスクから生成される擬似ランダムな数
    と各フレームが周波数変換された周波数成分との内積の
    計算結果に従って、付加情報検出用マスクそれぞれにお
    いて検出された値とビット情報との対応関係を変更する
    手段を含む、請求項26記載のシステム。
  29. 【請求項29】前記付加情報を検出する手段(4)が、
    多重に情報が埋め込まれている場合、複数の検出用マス
    クを用いて,各フレームが周波数変換された周波数成分
    と、それぞれの検出用マスクから生成される前記擬似ラ
    ンダムな数との内積を計算し、該内積の値の符号、また
    は内積の値により、多重に埋め込まれた付加情報をそれ
    ぞれ検出する手段である、請求項26記載のシステム。
  30. 【請求項30】前記付加情報を検出する手段(4)が、
    フレーム間にまたがって同じ符号で、または、交互に反
    対符号で前記内積の値を総和することにより、付加情報
    検出の信頼性を上げることを特徴とする、請求項25記
    載のシステム。
  31. 【請求項31】前記付加情報を検出する手段(4)が、
    前記総和された前記内積の絶対値が、ある閾値より大き
    いか否かにより、付加情報の埋め込みの有り無しを判定
    する手段を含むことを特徴とする、請求項30記載のシ
    ステム。
  32. 【請求項32】前記同期検出手段が、前記複数のフレー
    ムを重ね合わせて得られる1フレームのデータを周波数
    変換して、位相を回転した付加情報検出用のマスクとの
    内積を求め、その内積の絶対値が最大となる位相の回転
    角から、埋め込み時のフレームの開始位置を特定する手
    段であることを特徴とする、請求項24記載のシステ
    ム。
  33. 【請求項33】前記オーディオデータを周波数変換する
    手段(1)が、フレームの幅を変更し、埋め込んだ同期
    信号の各フレームにおける位相または振幅を測定し、そ
    れらが検出するすべてのフレームにおいて最もそろって
    いる、フレーム幅の変更量を時間軸上の伸縮率として、
    時間軸上の伸縮率を定める手段を含む、請求項26記載
    のシステム。
  34. 【請求項34】(5)前記検出された付加情報のビット
    から、付加情報を復元するために、繰り返しの開始また
    は終了フレームを特定する手段を具備し、該手段が、フ
    レームから検出される同期信号の検出値が他の連続フレ
    ームと異なるフレームか、または同期信号が埋め込まれ
    ていないフレームを区切りのフレームとして特定する手
    段を含む、請求項26記載のシステム。
  35. 【請求項35】前記付加情報検出手段(4)が、区切り
    用ビット列を用いて、検出されたビット列の中から付加
    情報を構成するビット列の繰り返し位置を特定すること
    により、検出ビット列より付加情報を復元する手段を含
    む、請求項26のシステム。
  36. 【請求項36】前記付加情報検出手段(4)が、埋め込
    み時の付加情報の繰り返し開始位置を知ることなく付加
    情報を復元する手法を含む、請求項26記載のシステ
    ム。
  37. 【請求項37】オーディオデータへ付加情報を埋め込
    む、付加情報埋め込み方法であって、 (1)オーディオデータを周波数変換する段階と、 (2)前記オーディオデータに基づき、前記オーディオ
    データに付加情報を埋め込むことのできる、周波数の変
    更範囲を決定する段階と、 (3)付加情報検出時の同期検出を可能とする、付加情
    報埋め込み用のマスクを生成する段階と、 (4)前記周波数変換されたオーディオデータの前記埋
    め込むことのできる周波数の変更範囲に、付加情報を、
    前記付加情報埋め込み用のマスクを用いて埋め込む段階
    と、 (5)周波数変換され付加情報の埋め込まれたオーディ
    オデータを、オーディオデータに逆変換する段階と、 を有することを特徴とする、付加情報埋め込み方法。
  38. 【請求項38】オーディオデータに埋め込まれた付加情
    報を検出する、付加情報検出方法であって、 (1)オーディオデータを周波数変換する段階と、 (2)付加情報検出用のマスクを生成し、前記周波数変
    換されたオーディオデータから、オリジナルのオーディ
    オデータを使用せずに、付加情報検出のための同期をと
    る段階と、 (3)前記周波数変換されたオーディオデータから、同
    期をとりながら、前記付加情報検出用マスクを用いて、
    付加情報のビットを検出する段階と、 を有することを特徴とする、付加情報検出方法。。
  39. 【請求項39】オーディオデータへ付加情報を埋め込む
    プログラムを含むコンピュータ読み取り可能な記録媒体
    であって、該プログラムが、コンピュータに、 (1)オーディオデータを周波数変換する機能と、 (2)前記オーディオデータに基づき、前記オーディオ
    データに付加情報を埋め込むことのできる、周波数の変
    更範囲を決定する機能と、 (3)付加情報検出時の同期検出を可能とする、付加情
    報埋め込み用のマスクを生成する機能と、 (4)前記周波数変換されたオーディオデータの前記埋
    め込むことのできる周波数の変更範囲に、付加情報を、
    前記付加情報埋め込み用のマスクを用いて埋め込む機能
    と、 (5)周波数変換され付加情報の埋め込まれたオーディ
    オデータを、オーディオデータに逆変換する機能と、 を実現させる記録媒体。
  40. 【請求項40】オーディオデータに埋め込まれた付加情
    報を検出するプログラムを含むコンピュータ読み取り可
    能な記録媒体であって、該プログラムが、コンピュータ
    に、 (1)オーディオデータを周波数変換する機能と、 (2)付加情報検出用のマスクを生成し、前記周波数変
    換されたオーディオデータから、オリジナルのオーディ
    オデータを使用せずに、付加情報検出のための同期をと
    る機能と、 (3)前記周波数変換されたオーディオデータから、同
    期をとりながら、前記付加情報検出用マスクを用いて、
    付加情報のビットを検出する機能と、 を実現させる記録媒体。
JP26924499A 1998-09-29 1999-09-22 オーディオデータへ付加情報を埋め込む方法およびシステム Expired - Fee Related JP3274667B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26924499A JP3274667B2 (ja) 1998-09-29 1999-09-22 オーディオデータへ付加情報を埋め込む方法およびシステム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP10-276230 1998-09-29
JP27623098 1998-09-29
JP26924499A JP3274667B2 (ja) 1998-09-29 1999-09-22 オーディオデータへ付加情報を埋め込む方法およびシステム

Publications (2)

Publication Number Publication Date
JP2000172282A JP2000172282A (ja) 2000-06-23
JP3274667B2 true JP3274667B2 (ja) 2002-04-15

Family

ID=17566516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26924499A Expired - Fee Related JP3274667B2 (ja) 1998-09-29 1999-09-22 オーディオデータへ付加情報を埋め込む方法およびシステム

Country Status (5)

Country Link
US (1) US6526385B1 (ja)
JP (1) JP3274667B2 (ja)
KR (1) KR100341197B1 (ja)
CN (1) CN1199180C (ja)
GB (1) GB2343818B (ja)

Families Citing this family (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
GB2358999A (en) * 2000-02-02 2001-08-08 Central Research Lab Ltd A system and method for labelling a signal
AU2001264351A1 (en) * 2000-06-08 2002-01-02 Markany Inc. Watermark embedding and extracting method for protecting digital audio contents copyright and preventing duplication and apparatus using thereof
GB2365296A (en) * 2000-07-27 2002-02-13 Cambridge Consultants Encoder/decoder for watermarking a covertext signal
AU2001275712A1 (en) 2000-07-27 2002-02-13 Activated Content Corporation, Inc. Stegotext encoder and decoder
US6674876B1 (en) * 2000-09-14 2004-01-06 Digimarc Corporation Watermarking in the time-frequency domain
US7958213B1 (en) * 2000-09-21 2011-06-07 Siemens Enterprise Communications, Inc. Processing electronic messages
JP4348851B2 (ja) * 2000-09-21 2009-10-21 ソニー株式会社 記録媒体、ディスク記録装置および方法、並びにディスク再生装置及び方法
US8977683B2 (en) 2000-12-26 2015-03-10 Polycom, Inc. Speakerphone transmitting password information to a remote device
US7339605B2 (en) 2004-04-16 2008-03-04 Polycom, Inc. Conference link between a speakerphone and a video conference unit
US8964604B2 (en) 2000-12-26 2015-02-24 Polycom, Inc. Conference endpoint instructing conference bridge to dial phone number
US8948059B2 (en) 2000-12-26 2015-02-03 Polycom, Inc. Conference endpoint controlling audio volume of a remote device
US9001702B2 (en) 2000-12-26 2015-04-07 Polycom, Inc. Speakerphone using a secure audio connection to initiate a second secure connection
US7864938B2 (en) * 2000-12-26 2011-01-04 Polycom, Inc. Speakerphone transmitting URL information to a remote device
JP2002202787A (ja) * 2000-12-28 2002-07-19 Sony Corp コンテンツデータ、記録媒体、データ記録方法および装置、データ送信方法および装置、データ出力方法および装置、データ再生方法および装置、データ受信方法および装置
GB0110132D0 (en) * 2001-04-25 2001-06-20 Central Research Lab Ltd System to detect compression of audio signals
US8934382B2 (en) 2001-05-10 2015-01-13 Polycom, Inc. Conference endpoint controlling functions of a remote device
EP1396839A1 (en) * 2001-05-17 2004-03-10 International Business Machines Corporation Content boundary detecting device, monitoring method, content position determining method, program, and storage medium
GB2378370B (en) 2001-07-31 2005-01-26 Hewlett Packard Co Method of watermarking data
GB0119569D0 (en) * 2001-08-13 2001-10-03 Radioscape Ltd Data hiding in digital audio broadcasting (DAB)
JP3675745B2 (ja) * 2001-08-21 2005-07-27 ソニー株式会社 付加データ埋め込み装置、付加データ埋め込み方法及び付加データ埋め込みプログラム
US8934381B2 (en) * 2001-12-31 2015-01-13 Polycom, Inc. Conference endpoint instructing a remote device to establish a new connection
US8885523B2 (en) 2001-12-31 2014-11-11 Polycom, Inc. Speakerphone transmitting control information embedded in audio information through a conference bridge
US8705719B2 (en) 2001-12-31 2014-04-22 Polycom, Inc. Speakerphone and conference bridge which receive and provide participant monitoring information
US8102984B2 (en) * 2001-12-31 2012-01-24 Polycom Inc. Speakerphone and conference bridge which receive and provide participant monitoring information
US8223942B2 (en) * 2001-12-31 2012-07-17 Polycom, Inc. Conference endpoint requesting and receiving billing information from a conference bridge
US7742588B2 (en) * 2001-12-31 2010-06-22 Polycom, Inc. Speakerphone establishing and using a second connection of graphics information
US7978838B2 (en) 2001-12-31 2011-07-12 Polycom, Inc. Conference endpoint instructing conference bridge to mute participants
US8144854B2 (en) 2001-12-31 2012-03-27 Polycom Inc. Conference bridge which detects control information embedded in audio information to prioritize operations
US8947487B2 (en) 2001-12-31 2015-02-03 Polycom, Inc. Method and apparatus for combining speakerphone and video conference unit operations
US7787605B2 (en) 2001-12-31 2010-08-31 Polycom, Inc. Conference bridge which decodes and responds to control information embedded in audio information
WO2003061143A2 (en) * 2002-01-15 2003-07-24 University Of Miami Coding a masked data channel in a radio signal
EP1343097A1 (en) * 2002-03-04 2003-09-10 Hewlett-Packard Company Method for embedding of information in media files
US7606388B2 (en) 2002-05-14 2009-10-20 International Business Machines Corporation Contents border detection apparatus, monitoring method, and contents location detection method and program and storage medium therefor
US20040034655A1 (en) * 2002-07-17 2004-02-19 Tecu Kirk Steven Multimedia system and method
JP4088622B2 (ja) 2002-07-29 2008-05-21 インターナショナル・ビジネス・マシーンズ・コーポレーション Wm信号生成装置、wm信号生成方法、wm信号生成方法を実行するためのコンピュータ実行可能なプログラムおよび該プログラムを記録したコンピュータ可読な記録媒体、電子透かし埋め込み装置、および該電子透かし埋め込み装置を含むディジタル・テレビ装置
EP1429327A3 (en) * 2002-12-13 2005-03-09 Sony DADC Austria AG Data recording method and data recording medium
JP3871657B2 (ja) * 2003-05-27 2007-01-24 株式会社東芝 話速変換装置、方法、及びそのプログラム
WO2005034398A2 (en) * 2003-06-19 2005-04-14 University Of Rochester Data hiding via phase manipulation of audio signals
JP4379031B2 (ja) * 2003-07-17 2009-12-09 日本ビクター株式会社 情報伝送方式及びそれに用いる情報送信装置及び情報受信装置
GB2416285A (en) * 2004-07-14 2006-01-18 British Broadcasting Corp Transmission of a data signal in an audio signal
KR100617165B1 (ko) * 2004-11-19 2006-08-31 엘지전자 주식회사 워터마크 삽입/검출 기능을 갖는 오디오 부호화/복호화장치 및 방법
JP4713180B2 (ja) * 2005-02-25 2011-06-29 大日本印刷株式会社 音響信号からの情報の抽出装置
EP1729285A1 (en) * 2005-06-02 2006-12-06 Deutsche Thomson-Brandt Gmbh Method and apparatus for watermarking an audio or video signal with watermark data using a spread spectrum
US8126029B2 (en) 2005-06-08 2012-02-28 Polycom, Inc. Voice interference correction for mixed voice and spread spectrum data signaling
US7796565B2 (en) * 2005-06-08 2010-09-14 Polycom, Inc. Mixed voice and spread spectrum data signaling with multiplexing multiple users with CDMA
US8199791B2 (en) 2005-06-08 2012-06-12 Polycom, Inc. Mixed voice and spread spectrum data signaling with enhanced concealment of data
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
US8582729B2 (en) * 2006-02-24 2013-11-12 Qualcomm Incorporated System and method of controlling a graphical user interface at a wireless device
EP1837875A1 (en) * 2006-03-22 2007-09-26 Deutsche Thomson-Brandt Gmbh Method and apparatus for correlating two data sections
JP4827661B2 (ja) * 2006-08-30 2011-11-30 富士通株式会社 信号処理方法及び装置
US8494903B2 (en) 2007-03-16 2013-07-23 Activated Content Corporation Universal advertising model utilizing digital linkage technology “U AD”
JP2010074398A (ja) * 2008-09-17 2010-04-02 Ntt Docomo Inc Ofdm変復調方法、ofdm変調装置、ofdm復調装置およびofdm変復調システム
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US20100131417A1 (en) * 2008-11-25 2010-05-27 Hank Risan Enhancing copyright revenue generation
CN102625982B (zh) 2009-05-01 2015-03-18 尼尔森(美国)有限公司 提供与主要广播媒体内容关联的辅助内容的方法、装置和制品
KR101764926B1 (ko) 2009-12-10 2017-08-03 삼성전자주식회사 음향 통신을 위한 장치 및 방법
KR101200825B1 (ko) * 2009-12-21 2012-11-22 서울대학교산학협력단 가청주파수 대역 음향통신에서의 데이터 수신에러 감소 시스템 및 방법, 그리고 이에 적용되는 장치
US8917631B2 (en) 2010-08-23 2014-12-23 Ortsbo Inc. System and method for sharing information between two or more devices
KR101462427B1 (ko) * 2010-11-10 2014-11-17 서울대학교산학협력단 오디오 신호의 보존에 기초한 음파 통신에서 정보 송수신 시스템 및 방법, 그리고 이에 적용되는 장치
US20140135965A1 (en) * 2011-05-02 2014-05-15 Re-10 Ltd. Apparatus, systems and methods for production, delivery and use of embedded content delivery
JP2013026952A (ja) * 2011-07-25 2013-02-04 Sony Corp 画像処理方法、エンコード装置、デコード装置および画像処理装置
EP2565667A1 (en) * 2011-08-31 2013-03-06 Friedrich-Alexander-Universität Erlangen-Nürnberg Direction of arrival estimation using watermarked audio signals and microphone arrays
CN104871243A (zh) * 2012-12-31 2015-08-26 张江红 提供增强音频数据流的方法及装置
CN103079196B (zh) * 2013-01-11 2016-02-10 广东欧珀移动通信有限公司 加密通话方法及终端
HK1176805A2 (en) * 2013-01-15 2013-08-02 X On Comm Ltd A method and system for wireless communication
WO2014168777A1 (en) * 2013-04-10 2014-10-16 Dolby Laboratories Licensing Corporation Speech dereverberation methods, devices and systems
WO2014199449A1 (ja) 2013-06-11 2014-12-18 株式会社東芝 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム
US9881631B2 (en) * 2014-10-21 2018-01-30 Mitsubishi Electric Research Laboratories, Inc. Method for enhancing audio signal using phase information
CN106295253A (zh) * 2015-06-26 2017-01-04 南宁富桂精密工业有限公司 信息隐藏方法及系统
US10720959B2 (en) * 2017-10-12 2020-07-21 British Cayman Islands Intelligo Technology Inc. Spread spectrum based audio frequency communication system
US11714127B2 (en) 2018-06-12 2023-08-01 International Business Machines Corporation On-chip spread spectrum characterization
US11146307B1 (en) * 2020-04-13 2021-10-12 International Business Machines Corporation Detecting distortion in spread spectrum signals
US11693446B2 (en) 2021-10-20 2023-07-04 International Business Machines Corporation On-chip spread spectrum synchronization between spread spectrum sources

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8901032A (nl) 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
US5768426A (en) * 1993-11-18 1998-06-16 Digimarc Corporation Graphics processing system employing embedded code signals
EP0766468B1 (en) 1995-09-28 2006-05-03 Nec Corporation Method and system for inserting a spread spectrum watermark into multimedia data
US5949885A (en) * 1996-03-12 1999-09-07 Leighton; F. Thomson Method for protecting content using watermarking
US6282299B1 (en) * 1996-08-30 2001-08-28 Regents Of The University Of Minnesota Method and apparatus for video watermarking using perceptual masks
US5848155A (en) 1996-09-04 1998-12-08 Nec Research Institute, Inc. Spread spectrum watermark for embedded signalling
JP3355521B2 (ja) 1998-03-23 2002-12-09 東洋通信機株式会社 音声符号化時の透かしビットの埋込方法
JP2000089796A (ja) 1998-09-16 2000-03-31 Nippon Hoso Kyokai <Nhk> 音響信号へのデータ埋め込み装置およびデータ抽出装置

Also Published As

Publication number Publication date
JP2000172282A (ja) 2000-06-23
CN1199180C (zh) 2005-04-27
KR100341197B1 (ko) 2002-06-20
GB2343818B (en) 2004-01-21
CN1249517A (zh) 2000-04-05
GB2343818A (en) 2000-05-17
US6526385B1 (en) 2003-02-25
KR20000022748A (ko) 2000-04-25
GB9922676D0 (en) 1999-11-24

Similar Documents

Publication Publication Date Title
JP3274667B2 (ja) オーディオデータへ付加情報を埋め込む方法およびシステム
CN1975859B (zh) 音频处理方法和装置
US6879652B1 (en) Method for encoding an input signal
Lie et al. Robust and high-quality time-domain audio watermarking based on low-frequency amplitude modification
JP4690366B2 (ja) 音声透かしをベースとするメディア・プログラムの識別方法及び装置
Megías et al. Efficient self-synchronised blind audio watermarking system based on time domain and FFT amplitude modification
JP4030036B2 (ja) 放送番組特定システムに於いて使用するための、音声信号に不可聴コードを付加することにより可聴信号をエンコードするシステム及び装置
Dutta et al. Data hiding in audio signal: A review
CN101297354B (zh) 音频处理
JP2003500702A (ja) 可聴信号中の情報の復号化
JP4186531B2 (ja) データ埋め込み方法、データ抽出方法、データ埋め込み抽出方法、及びシステム
JPH11212463A (ja) 一次元データへの電子透かし
US7266466B2 (en) Watermark time scale searching
Hu et al. Hybrid blind audio watermarking for proprietary protection, tamper proofing, and self-recovery
JP4867765B2 (ja) 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
US20080273707A1 (en) Audio Processing
US7466742B1 (en) Detection of entropy in connection with audio signals
US20040054525A1 (en) Encoding method and decoding method for digital voice data
Foote et al. Time base modulation: a new approach to watermarking audio
JP2006195061A (ja) 音響信号に対する情報の埋め込み装置、音響信号からの情報の抽出装置および音響信号再生装置
Horvatic et al. Robust audio watermarking: based on secure spread spectrum and auditory perception model
Megías et al. An audio watermarking scheme robust against stereo attacks
JP2001184081A (ja) 情報処理装置及びその方法並びにプログラム格納媒体
JP5486839B2 (ja) 小型検出窓を利用した電子透かし埋め込み検出方法
JP4910921B2 (ja) 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080201

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090201

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100201

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110201

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120201

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130201

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130201

Year of fee payment: 11

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130201

Year of fee payment: 11

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S802 Written request for registration of partial abandonment of right

Free format text: JAPANESE INTERMEDIATE CODE: R311802

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130201

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140201

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees