JP3274667B2 - オーディオデータへ付加情報を埋め込む方法およびシステム - Google Patents
オーディオデータへ付加情報を埋め込む方法およびシステムInfo
- Publication number
- JP3274667B2 JP3274667B2 JP26924499A JP26924499A JP3274667B2 JP 3274667 B2 JP3274667 B2 JP 3274667B2 JP 26924499 A JP26924499 A JP 26924499A JP 26924499 A JP26924499 A JP 26924499A JP 3274667 B2 JP3274667 B2 JP 3274667B2
- Authority
- JP
- Japan
- Prior art keywords
- additional information
- frequency
- embedding
- frame
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 68
- 238000001514 detection method Methods 0.000 claims description 77
- 230000008859 change Effects 0.000 claims description 53
- 238000006243 chemical reaction Methods 0.000 claims description 23
- 230000008602 contraction Effects 0.000 claims description 20
- 230000013707 sensory perception of sound Effects 0.000 claims description 16
- 238000009826 distribution Methods 0.000 claims description 12
- 125000004122 cyclic group Chemical group 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 230000001360 synchronised effect Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000001419 dependent effect Effects 0.000 claims description 2
- 230000005236 sound signal Effects 0.000 description 22
- 238000012545 processing Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 19
- 230000006835 compression Effects 0.000 description 11
- 238000007906 compression Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 230000006837 decompression Effects 0.000 description 8
- 230000006866 deterioration Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B15/00—Driving, starting or stopping record carriers of filamentary or web form; Driving both such record carriers and heads; Guiding such record carriers or containers therefor; Control thereof; Control of operating function
- G11B15/02—Control of operating function, e.g. switching from recording to reproducing
- G11B15/05—Control of operating function, e.g. switching from recording to reproducing by sensing features present on or derived from record carrier or container
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/28—Arrangements for simultaneous broadcast of plural pieces of information
- H04H20/30—Arrangements for simultaneous broadcast of plural pieces of information by a single channel
- H04H20/31—Arrangements for simultaneous broadcast of plural pieces of information by a single channel using in-band signals, e.g. subsonic or cue signal
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00086—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
- G11B20/00884—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
- G11B20/00891—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm embedded in audio data
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Editing Of Facsimile Originals (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Description
ル化されたオーディオデータに対し著作権情報等の付加
情報を埋め込み、検出する方法およびそのシステムに関
し、特に付加情報を埋め込んだオーディオデータの音質
に著しい劣化を引き起こさない範囲での改変に対して、
埋め込んだ情報を信頼性をもって検出できる方法および
そのシステムに関する。
はCD のみでなく、インターネットを経由しても提供さ
れはじめている。このようなデジタル・オ−ディオデ−
タでは、何度聞いても音質の劣化がないという利点があ
る反面、完全な複製が容易に多量に作成できてしまうの
で、以前にまして不正コピ−防止技術が重要となってい
る。これらの不正なコピーを防ぐためには、あらかじめ
著作権情報等をオ−ディオデ−タ自身に埋め込むことで
著作権の所在を明確にすることや、また、コンテンツ配
布先の情報を埋め込むことで不正なコピーが出回った場
合にもその流出経路を追跡することが考えられる。この
とき、コンテンツの商品価値を下げないためには、情報
の埋込みによる音質の変化が人間の耳に聞こえてはなら
ない。また、コンテンツにはフィルター処理、MPEG やA
C3 やATRAC などの圧縮解凍、デジタルからアナログへ
の変換とアナログからデジタルへの変換、切り出し、再
生速度の変化などの処理が行われることが考えられるの
で、オーディオデータの音質に著しい劣化を引き起こさ
ない範囲でのデータ値の変更、欠損、挿入、リサンプリ
ングに対し、埋め込んだ情報が生き残る必要がある。
め込み検出手法は、機密性に優れているものの、人間の
聴覚では検知できないように付加情報を弱く埋め込む
と、圧縮解凍、フィルター、デジタル/アナログ変換な
どのデータ処理に対し、埋め込んだ付加情報が消えてし
まうなど、耐性面で問題があった。オーディオデータへ
の付加情報の埋め込み検出手法として一般的なのはPN(P
seudo-random Noise)での変調による拡散スペクトラム
(Spread Spectrum)法である。この手法では、時間領
域で、疑似ランダムに見えるノイズで付加情報を変調し
て埋め込む。結果として、周波数空間では埋め込み情報
に対応する成分のスペクトルが広がって見える。上記に
属する技術としては USP 4979210, 5073925,5319735
などがある。
DES)で生成された+1 と1 からなる疑似乱数列Rn を使
ってビット列情報Bm を変調し、オーディオのサンプル
列Anに次のように変調して埋め込む。
また、n = 0, 1,...N-1で、cは埋め込みの強さであ
る。検出では、
ば、ΣANm+n RNm+nが打ち消しあうことが期待できるか
らである。時間軸での埋め込みでは、人間の聴覚の周波
数特性を利用できず音質の劣化の制御が難しいので、埋
め込みによる音質の変化が耳で検知できないよう弱く埋
め込むと、圧縮解凍などの処理に埋め込み情報が生き残
らなかった。これに対し、USP 5687191 では、情報を埋
め込む際、時間信号であるサンプル列をポリフェーズフ
ィルタにより複数の周波数帯に分解し、各周波数帯ごと
に疑似ランダムなノイズで情報を変調して埋め込む。こ
の利点は、周波数帯ごとに異なる埋め込み強度が使用で
き、人間の聴覚の周波数特性を利用できることにある。
これにより、これまでの手法の中では、音質の劣化がな
く耐性のある埋め込みを実現した。
本発明と同じく、周波数変換された周波数成分に情報を
埋め込み検出する。これらは機密性を高めるために信号
拡散の手段として周波数空間での埋め込み・検出を提案
する。しかしながら、上記 USPでは高音質で高耐性の埋
め込み・検出手法を提供しない。これらの手法では、無
圧縮のデジタルオーディオのサンプル列を区切って互い
に重ならない領域(ウィンドウと呼ぶ)に分け、各々にF
FT(Fast Fourier Transformation)を適用する。プラ
イマリマスク(primary mask)とコンボルーショナルマ
スク(convolutional mask)は、FFT で得られた周波数
成分に1 ビットの信号を埋め込むか否かを制御するのに
用いられる。プライマリマスクとコンボルーショナルマ
スクはともに疑似ランダムなビット列で、プライマリマ
スクのサイズは周波数の数に対応する。各ウィンドウは
コンボルーショナルマスクの特定の位置に対応し、その
ウィンドウの各周波数成分に埋め込むか否かを、周波数
に対応する位置のプライマリマスクのビット値とウィン
ドウに対応する位置のコンボルーショナルマスクのビッ
ト値との論理演算の結果が真か偽で埋め込むか否かを決
める。
では、埋め込み周波数成分の特定のビット位置にマップ
情報(付加情報から作成された冗長性を含んだビット
列)のビットを埋め込むとし、USP 5687236 では、埋め
込み周波数成分を、元の値に対して相対的に事前に定め
られた範囲に入るよう変更することでビットを埋め込む
としている。いずれの場合も1ビットを1周波数成分に
埋め込むとしており、埋め込んだ情報の機密性はプライ
マリマスクとコンボルーショナルマスクとで守られてい
るが、圧縮・解凍や各周波数成分でのランダム・ノイズ
付加などのデータ処理には埋め込んだ情報が生き残らな
い。
essage delimiter)は、比較的長いビット列からなる符
号で、検出ビット列上でウィンドウの区切りとメッセー
ジ開始位置を検出するために用いる。彼らの明細書によ
れば、1 ウィンドウあたり128サンプルとして64 ビット
が埋め込まれ、16 ウィンドウで1024 ビットの符号がで
き、これが偶然一致する確率は非常に小さいから、特定
の1024ビット符号をメッセージ開始の区切りとして使用
できるとしている。ウィンドウの区切りやメッセージ開
始位置の探索は、メッセージ開始の区切りを検出するま
でウィンドウの開始位置を1 サンプルづつずらすことで
行う。この手法では、埋め込み付加情報は長ければ、メ
ッセージ開始位置の探索にかかる負荷が大きくなり、デ
ジタル/アナログ変換で頻繁に起きるデータ欠損・挿入
による再同期の必要性には対応できない。
しようとする課題は、オーディオデータに対し著作権情
報等の付加情報の埋め込みによる音質の変化を人間の聴
覚では検知できないように埋め込みながら、一方で、音
質に著しい劣化を引き起こさない範囲でのオーディオデ
ータへの処理に対し、埋め込んだ付加情報が残り、信頼
性をもって検出できるための方法およびそのシステムを
提供することである。また別の課題は、高音質で高耐性
の埋め込み・検出が可能な、オーディオデータへ付加情
報を埋め込み・検出方法およびそのシステムを提供する
ことである。また別の課題は、オーディオデータのサン
プル列を周波数変換し、周波数空間上で操作を加えるこ
とにより、付加情報を埋め込む方法およびシステムを提
供することである。また別の課題は、圧縮・解凍や各周
波数成分でのランダム・ノイズ付加などのデータ処理に
耐えられる、オーディオデータへ付加情報を埋め込む方
法およびシステムを提供することである。また別の課題
は、埋め込まれた付加情報の探索にかかる負荷を小さく
できる、オーディオデータへ付加情報を埋め込み・検出
方法およびそのシステムを提供することである。また別
の課題は、デジタル/アナログ変換で頻繁に起きるデー
タ欠損・挿入による再同期の必要性に対応できる、オー
ディオデータへ付加情報を埋め込み・検出方法およびそ
のシステムを提供することである。
に、まず本発明は、無圧縮のデジタル・オーディオデー
タに対し、人間の聴覚ではその変化が検知できないよう
著作権情報等の付加情報を埋め込む「埋め込みシステ
ム」と、圧縮解凍や切り取りなどの処理が施されても、
付加情報が埋め込んであるか否かを判定でき、埋め込ん
であるならばその情報を抽出する「検出システム」とか
らなる。
オデータは、サンプルと呼ばれる整数の列からなる。CD
品質のオーディオデータでは、各チャネルが1 秒あた
り44,100 個の16 ビット長のサンプルの列からなる。本
発明では、聴覚心理モデルを適用できるよう、周波数空
間で埋め込み、検出を行う。従って、本発明の埋め込み
システム、検出システムでは、サンプル列を適当に区切
り、各々を周波数空間に変換する。この周波数変換の対
象となるサンプル列の各区間をここではフレーム(fram
e) と呼ぶ。
れを示す。ステップ410では、周波数毎に埋め込み信
号の位相を定めるマスクを用いて、オーディオデータの
各フレームを周波数空間に変換し、付加情報に対応する
ビット情報や同期信号を周波数成分に埋め込み、周波数
空間から時間軸上のサンプル列に再び戻す。埋め込みで
は、フレーム同士は重ならないが、隙間があっても良
い。切り取り耐性を要するときは、付加情報は繰り返し
て埋め込む。
示す。ステップ510では、入力されたオーディオデー
タのサンプル列からフレームの開始点を探す。ステップ
520で、付加情報が埋め込んであると判定されれば、
検出マスクを用いて、周波数成分に埋め込んだビットを
抽出し、次にステップ530で付加情報の繰り返しの開
始点を探し、埋め込んだ付加情報を復元する。
ある情報を各フレームで埋め込み、検出する手法とその
システム、検出時に正しいフレームの開始・終了位置を
探すフレーム同期の手法とそのシステム、各フレームで
検出された個々のビット情報からビット列(メッセー
ジ)を復元するためのビット繰り返しの開始・終了位置
を探すためのメッセージ同期の手法とそのシステムとか
ら構成される。
情報を埋め込むにあたり、まずオーディオデータを周波
数変換し、オーディオデータに基づき、前記オーディオ
データに付加情報を埋め込むことのできる周波数の変更
範囲を決定し、付加情報埋め込み用のマスクを生成す
る。そして、周波数変換されたオーディオデータの前記
埋め込むことのできる周波数の変更範囲に、付加情報
を、付加情報埋め込み用のマスクを用いて埋め込む。最
後に付加情報の埋め込まれた周波数変換されたオーディ
オデータを、オーディオデータに逆変換するように構成
する。逆に、オーディオデータに埋め込まれた付加情報
を検出するには、まずオーディオデータを周波数変換
し、周波数変換されたオーディオデータから、付加情報
検出用のマスクを生成し、付加情報検出のための同期を
とる、同期検出手段を設ける。そして周波数変換された
オーディオデータから、同期をとりながら、付加情報検
出用マスクを用いて、付加情報を検出するように構成す
る。
情報を埋め込み・検出の各手法とそのシステムに関し、
より詳細に説明する。
ム] フレームは周波数空間への変換の単位となるサンプル列
上の区間のことである。ここでは、各フレームでの埋め
込み、検出する手法とそのシステムについて記述する。
効果的に聴覚心理モデルを適用するためには、フレーム
に含まれるサンプルの数は、USP 5613004 や5687236 の
発明の明細に記載されている128 より大きい数、512 か
ら4048 程度の数が適切である。
し、m 番目のフレームのn 番目のサンプルをAm(n) と記
し、m 番目のフレームに周波数変換を行なって得た周波
数kの成分をFm(k)と記す。フレームとフレームの間に隙
間がなければ、フレームのサンプル数をNとすると
が、元のサンプルが実数なので、Fm (k) とFm (N-k) =
Fm (-k) とは複素共役の関係にある。すなわち、独立な
周波数の数はフレームのサンプル数の半分 N/2 とな
る。複素数を2 次元ベクトルとみなして、形式的に
字、x およびyはそれぞれ実部、虚部を指す。このと
き、定義よりα・α=|α|2となる。埋め込みシステ
ム、検出システムは、周波数kに対して疑似ランダムな
値をとる複素数列Mp(k) を複数個共有しているものと
し、以下ではマスクと呼ぶ。ただし、埋め込みが時間領
域で実数であるために、Mp(k) とMp(-k) とは複素共役
の関係にあるものとする。また、Mp(k) が絶対値1の複
素数のみからなるなら、その位相は疑似ランダムな向き
をとっているものとし、また、Mp(k) が純虚数なら、虚
数軸に沿って疑似ランダムとする。すなわち、Mp(k) の
とりうる範囲には目的によって適切な制限があるものと
する。
を示す。まずステップ610でサンプル列をフレームに
分割する。そしてステップ620で分割したフレームの
各フレームを周波数空間に変換する。ステップ630で
は、得られた周波数成分を使って聴覚心理モデルを適用
し、平均的な人間の聴覚では検知できない変更範囲を各
周波数ごとに求める。そしてステップ640では、擬似
乱数より得られるマスクの向きに各周波数成分の値をこ
の求めた範囲内で最大に変更することにより、ビット情
報や符号情報や同期信号を埋め込む。このとき、音質よ
り耐性が重要な場合、各マスクに対する内積を計算し、
内積の値が耐性が要する閾値より小さい場合は、聴覚心
理モデルの最大の変更範囲を超えても、その閾値に達す
るまで変更幅を大きくする。音質が重要な場合、内積が
耐性の要する閾値より大きければ、その閾値に達するま
で変更幅を小さくする。各周波数成分での変更が終了す
ると、ステップ650で、変更された周波数成分に逆変
換を行い、周波数空間から時間軸上のサンプル列に再び
戻す。ビット情報や同期信号の埋め込みは、各フレーム
での周波数変換でえられた周波数成分Fm(k)を、
で、変更hm (k) も複素数である。聴覚心理モデルなど
の聴覚心理モデルを周波数分布Fm に適用して、平均的
な人間の聴覚ではその差異を検知できない変更hm (k)
の範囲を各周波数kごとに求める。検知できない変更範
囲は2 次元空間で一般には複雑な形状をなしている。こ
のため、変更hm (k)が人間の耳では検知できない最大の
変更であるとは必ずしも絶対値|hm (k)|が単純に最大
値であるとは限らず、一般には変更範囲の境界上にある
ことを言う。聴覚心理モデルとは、大きな純音があると
その前後の周波数成分の変更が人間の耳に検知しにくく
なるなど、周波数のスペクトル分布に応じて各周波数で
の差異が検知できない変更範囲が変わることをコンピュ
ータ上で模擬的に実現するものである。
変更することを言う。ここで、C(Fm, k) は、周波数分
布Fm と周波数kに依存する正の規格化定数で、統計推定
の信頼度をあげるためのものである。各マスクが互いに
ほぼ直交していれば、埋め込みによる周波数成分の変更
を
る符号、値に比例して決め、正定数a(k) は平均的な聴
覚では検知できない変更範囲の境界上にあるように調整
すれば良い。規格化定数C(F'm, k) は埋め込み結果に依
存するので、正定数a(k) を求める処理は逐次的とな
る。
め込むビット値が違うなどの理由で隣り合うフレーム間
で変更値が異なると、フレームの区切りA'm(N-1)、A'
m+1(0)で大きな不連続が生じ、ノイズとして聞こえてし
まう可能性がある。そこで、すべてのフレームの両端で
変更幅が小さくなるよう、各周波数成分の変更の仕方や
マスクの形状を限定することで、音質の劣化を防ぐ。例
えば、各周波数成分の変更を純虚数に制限し、マスクも
純虚数とする。変更を純虚数に制限することは、時間軸
上では各フレームで正弦波からなる信号を埋め込むこと
と同じ。別の例とし、各周波数成分の変更とマスクをと
もに実数に制限するとともに、偶数の周波数からなる対
{2k,2k'} や奇数の周波数からなる対{2k+1, 2k'+1} を
作り、フレームの両端で互いに打ち消すよう、
が符号を反対にとる。変更を実数に制限することは、時
間軸上では各フレームで余弦波からなる信号を埋め込む
ことと同じである。
ることで、順次、異なるマスクに対応して埋め込んで
も、互いに相手の埋め込んだ情報を壊したり、相手の埋
め込みで検出が誤ることのないようにできる。これによ
り、サーバにオーディオデータをアップロードする前に
音源の著作権情報を埋め込み、インターネット経由で消
費者がそのオーディオデータをダウンロードした後で、
ユーザID などの追跡情報を埋め込み、互いに干渉しな
いようにできる。例えば、マスクの値Mp(k) がゼロでな
い周波数kを限定された領域にとり、異なるマスクは異
なる領域がゼロでないようにとると、規格化定数C(Fm,
k) に依存せずに直交性を保つことができる。このと
き、各マスクのゼロでない周波数領域が単一の周波数帯
域ではなく、幅広い周波数にまたがるよう、複数の区間
にとることで、音質と耐性とを同時に向上させることが
できる。MPEG 圧縮処理では、ゲインを制御するパラメ
ータ(scale factor)を周波数帯(scale factor band) 毎
に定めるなど、周波数帯域毎に違ったパラメータで圧縮
を行っている。そのため、周波数帯を単純に分割し、各
マスクに単一の区間を割り当てると、コンテンツによ
り、マスクごとの耐性に著しい差異が生じてしまう。従
って、圧縮処理の単位となる周波数帯域(サブバンド)
よりも狭い幅で帯域分割し、低音とか高音とかにそれぞ
れの埋め込み周波数帯域が集中しないよう周波数帯域を
集めて、互いに直交するマスクを合成するものとする。
め込み手法は、従来技術と異なり、 ・1 ビットを1周波数成分に埋め込むのではなく、幅広
い周波数領域の各周波数成分をマスクの向きに変更して
埋め込むこと、 ・変更幅を周波数ごとに事前に決めておくのではなく、
周波数変換で得た周波数分布に基づいて人間の耳では検
知できない最大の変更範囲を各周波数ごとに求め、それ
に基づいて各周波数成分の変更幅を定めること ・時間軸上で各フレームの両端で変更幅がゼロに近づく
よう、マスクと周波数成分の変更に制限を加えること ・周波数を狭い帯域に分け、周波数が偏らないよう複数
の帯域を集めて直交するマスクを作成し、互いに相手を
壊さない多重の埋め込みを可能とすることに特徴があ
る。
す。ステップ710でサンプル列を複数のフレームに分
割する。ステップ720でこれらの各フレームを周波数
空間に変換する。そしてステップ730で、検出用マス
クとの内積を求める。抽出の信頼性を上げるために、必
要に応じて、同じ情報が埋め込んであると知っている別
のフレームの内積を、適切な符号を掛けて加える。すな
わち、同符号で埋め込んであることを知っていれば同符
号で加え、反対符号で埋め込んであることを知っていれ
ば、符号を反転して加える。最後にステップ740で内
積の符号、もしくは、どのマスクとの内積が大きいか
で、ビット情報を抽出する。各フレームで、周波数成分
Fm (k) とマスクMp(k) との内積を
の信頼度をあげるために導入された、周波数分布と周波
数に依存する正の数である。一般に周波数スペクトル|F
m(k)| は一様に分布しておらず、低周波成分から高周波
成分にかけて振幅が減ってゆく傾向にあるが、使用する
音源や曲の狙うテーマなどでコンテンツによっても、周
波数スペクトル分布は大きく揺らぐ。統計推定の信頼度
を上げるとは、人間の聴覚では検知できない範囲での最
大の変更を行ったときの統計平均<Xp(m) >の二乗が、何
も埋め込まないときの二乗統計平均< Xp(m)2>より大き
くなるようにすることである。
は
聴覚では検知できない最大の変更幅である。
は統計平均で何を母集団に取るかにより変わるが、フレ
ームの開始点が揺らいでいるというモデルを使うと
| がa(k) より小さいときはそれと置き換えるか、また
は、
は、埋め込み後、人間の聴覚で聞こえない程度のランダ
ムな変更は圧縮・解凍などで頻繁に生じることを考える
と妥当な近似である。上記で、さらに、a(k) が|Fm(k)|
に比例するとういう単純な聴覚モデルを使用すると、
とする。取り出された内積の信頼度は、まず、
ブエラー(False Positive Error)を計算できる。
(n) を同時に−Am(n) と変えても、如何なる音質の変化
も生じない。このデータ処理を極性の反転と呼ぶが、機
器をつないでデータを流すとき、極性の反転は組み合わ
せによって生じる。従って、内積Xp(m) またはXp(m)の
符号で単純にビットを定めると、極性の反転に弱くな
る。この解決策として、 ・符号用マスクとビット用マスクとを用意し、ビット用
マスクの内積に符号用マスクの内積をかけたものの符号
でビットの値を抽出するか ・ビットの値0 用のマスク、ビットの値1 用のマスクを
用意し、どちらのマスクの内積の値が大きいかでビット
の値を抽出するかの二つの方法があるが、後者は前者の
変形とみなすことができる。
込むのに二つのマスクM0(k) とM1(k)を使い、それぞれ
の内積X0(m) とX1(m) を求め、
ット1用のマスクを表わしている。しかし、この方式
は、符号用マスクMs(k) とビット用マスクMb(k) を用い
る方式の一つとしてみなすことができる。すなわち、
(m) にも、
ときビット0、Xb(m) が正のときビット1とし、Xs(m)
が負ならば、Xb(m) が負のときビット1、Xb(m)が正の
ときビット0として解釈すればよいことがわかる。
で、他のビット用マスクの内積の解釈を変えるものを符
号用マスクと呼ぶ。極性の反転を検出し、正しくビット
を解釈するためならば、1回の埋め込みには一つの符号
用マスクで充分で、この符号用マスクの内積の符号で、
他の複数のビット用マスクの内積の符号の解釈を変えれ
ば良い。また、極性は短い間隔で揺らぐことは通常ない
ので、符号用マスクの信号は弱く埋め、その分、ビット
用マスクの信号を強く埋めてその信頼度をあげ、符号用
マスクの信号についてはフレームについて蓄積し、信頼
度を上げる。符号用マスクの信号は常に同じ向きに埋め
込むとすると、内積と分散を
オーディオデータは極性の反転や時間軸上でのデータの
揺らぎを受けているかもしれないので、和のフレーム数
はあまり大きくできない。この符号用マスクはフレーム
同期用マスクや埋め込み有り無し判定と共用してもかま
わない。埋め込み有り無し判定は
ジティブエラーは
マスクを用いるほうがより有用である。
手法は、従来技術と異なり、 ・周波数成分と疑似ランダム列のマスクとの単純な内積
をとるのではなく、周波数分布から決まる周波数依存の
規格化定数を掛けて内積を計算していること、 ・マスクとの内積の符号だけから単純にビットの値を定
めているのではなく、符号用マスクの内積の符号で他の
マスクのビット値の解釈を変えていること、 ・符号用マスクをすべてのフレームで同じ向き、また
は、交互に反対符号で埋め、フレーム間にまたがって集
め、信頼性を上げること、 ・蓄積された符号用マスクの内積を用いて埋め込みの有
り無しを判定することに特徴がある。
時のフレームに正しく分割されているとしている。実際
のオーディオデータは、情報が埋め込まれた後、オーデ
ィオデータが時間方向に伸縮したり、切り取られるなど
しているかもしれないので、検出の最初、および、埋め
込みの有り無し判定で有りの信頼度が低い場合などに、
オーディオデータの時間軸の伸縮率の推定や埋め込み時
のフレームの開始位置の探索を行う必要がある。
ば、サンプル列から開始位置を1サンプルづつずらして
仮の1フレームをとり、重ね和せ、周波数変換を行い、
各マスクとの内積の絶対値の和が最大となる位置を埋め
込み時のフレームの開始位置として推定する。もし埋め
込みによる音質の劣化を防ぐために弱く埋め込まれてい
るのであれば、埋め込みシステムで連らなるフレームの
間隔をすべて同じにとることで、検出システムにおいて
も、同じ開始位置のづれが複数の連なるフレームに適用
できるとして、単一フレームで開始位置を判断するので
はなく、複数のフレームに関して同時に良い値を与える
開始位置を1サンプルづつずらして探索することで、埋
め込み時のフレームの開始位置を精度よく推定できる。
しかし、いずれの場合も、このままでは、1サンプルづ
つずらしながら、その試しの開始位置での各フレームに
FFT を行うことになり、フレーム同期のための開始位置
探索の計算時間がかかり過ぎる。従って次の工夫で計算
を早める。 図8に本発明の位相を利用してフレーム開
始位置を探索する処理の流れを示す。埋め込みシステム
は、ステップ810で、サンプル列を隙間なく仮のフレ
ームに分割し、ステップ820でフレームを重ね合せ、
ステップ830で周波数変換する。一方フレーム同期用
マスクデータ(このフレーム同期用マスクは符号用マス
クと同一でもよい)はステップ840で位相が回転さ
れ、各フレームに同じフレーム同期用マスクで同じ向き
に埋め込むとすると、ステップ850で、周波数変換さ
れたフレームと回転したフレーム同期用マスクとの内積
を計算し、ステップ860でこの内積が最大となる位置
を埋め込み時のフレームの開始位置とする。もしそうで
なければ、処理はステップ840へ戻る。各フレームで
同じ信号が埋まっているので、検出システムでは、フレ
ーム区切りが埋め込み時のフレームの区切りからずれて
いても、埋め込み時のフレーム幅の倍数の幅のサンプル
列があれば、フレーム同期用マスクを位相回転(ステッ
プ840)させることで検出できる。時間軸上でvサン
プルだけフレームが移動することは、周波数空間では位
相が2πkv/Nだけ回転すること、すなわち、フレーム同
期用マスクMs(k) をMs(k)ej2πkv/Nに置き換えること
である。ここでjは虚数単位である。
レームの開始位置を推定する。 (1)仮のフレーム区切りのまま、サンプルAm(n) を重ね
集め、1フレームのデータ
(k) を得る。 (2)フレーム区切りの位置をずらすかわりにフレーム同
期用マスク Ms(k) の位相を回転して、内積
め、埋め込み時のフレームの区切りの開始位置はこの仮
りの区切りの開始位置よりvサンプル先にあると推定す
る。
スクの内積の解釈を変える符号用マスクの内積の代用と
して使用することもできる。いま、仮りの区切りが埋め
込み時の位置だとすると、上記のSync(v) は
くる揺らぎで、劣化が少なければ1に近い。高周波は圧
縮解凍で落ちやすい。従って上記を次でさらに近似す
る。
し、その解像度はN/(kmax -kmin + 1)であると予測され
る。従って、フレーム同期用マスクのゼロでない周波数
が幅広く分布していることが望ましく、少なくとも、フ
レーム同期用マスクはビット用マスクと同じ周波数域を
使うべきである。
法] 図9に、位相のそろった信号の埋め込みによる伸縮率の
推定処理の流れを示す。埋め込み時のフレーム区切り位
置の推定では、オーディオデータの時間軸上での伸縮は
ないとしている。伸縮があった場合に埋め込み信号を検
出できるために次のようにして伸縮率を推定する。埋め
込みシステムと検出システムが一つまたは複数の特定の
周波数を知っていて、埋め込みシステムは、ステップ9
20で平均的人間の聴覚でその変化が検知できない範囲
で、その周波数が各フレームでできるだけ同じ位相にな
るように変更する。検出システムではステップ930で
フレームの幅を変更し、フレーム幅の変更を時間軸上の
伸縮率として変更された周波数の位相が各フレームでそ
ろっているかをステップ950でテストし、ステップ9
60において、最もそろっているフレーム幅の変更で、
時間軸上の伸縮率を定める。
(N')(n) = AN'm+n と記し、それに対応する周波数成分
を
ム幅N'に伸縮したのであれば、埋め込み時のFm(N)(k)
は検出時のFm(N')(k) に変換されるだけである。従っ
て、埋め込みシステムと検出システムが特定の周波数ki
を互いに知っていて、埋め込みシステムはその位相Fm
(N)(ki)=|Fm(N)(ki)| がすべてのフレームm でできるだ
け等しくなるよう埋め込み、検出システムでは、フレー
ム幅を変えて各周波数kiで
軸上の伸縮率を求める。互いに知っている周波数kiが複
数あるとき、
上の伸縮率を求める。
システムが一つまたは複数の特定の周波数を知ってい
て、埋め込みシステムは、平均的人間の聴覚でその変化
が検知できない範囲で、その周波数が各フレームででき
るだけ同じ位相と振幅になるように変更し、検出システ
ムではフレームの幅を変更し、フレーム幅の変更を時間
軸上の伸縮率として変更された周波数の位相が各フレー
ムでそろっているかをテストし、最もそろっているフレ
ーム幅の変更で、時間軸上の伸縮率を定める。
特定の周波数kiを互いに知っていて、埋め込みシステム
はその周波数成分Fm(N)(ki) がすべてのフレームm でで
きるだけ等しくなるよう埋め込み、検出システムは、フ
レーム幅を変えて各周波数kiで
軸上の伸縮率を求める。互いに知っている周波数kiが複
数あるとき、
上の伸縮率を求める。
ージ(付加情報)が生き残るためにはメッセージを繰り
返して埋め込む必要がある。従って、各フレームからビ
ット情報が抽出できても、どこが繰り返しメッセージの
ビット列の先頭でどこが終わりかを推定する必要があ
る。すなわち、埋め込みシステムでのメッセージの先頭
と検出システムのメッセージの先頭が正しく同期してい
る必要がある。
の区切りのフレームを使用する手法]図11に、バイト
やワードやメッセージなどの解釈の区切りのフレームを
使用した場合の概念図を示す。抽出されたビット列にバ
イトやワードやメッセージなどの解釈の区切りをいれる
ために、埋め込みシステムが、その区切りのフレームを
除き、各フレームに同じ向きに同期信号を埋め込み、区
切りのフレームには反対の向きに同期信号を埋め込む
か、または何も埋め込まない。検出システムは、その同
期信号の値が他のフレームと反対向きか、埋め込まれて
いないことをもって区切りのフレームと推定する。
用マスクを使用して埋め込んでもよい。この場合、フレ
ーム同期信号や符号信号は、充分多くのフレームでの内
積の和で判定することで、区切りのフレームの影響が無
視できるようにする。
外ではできるだけ同じ同期信号を埋め込むことで、検出
システムでは、検出した区切りのフレームの同期信号が
他のフレームの同期信号の揺らぎの範囲にあるかどうか
の統計推定することでその推定の信頼度を求めることが
できる。埋め込みシステムにより埋め込まれたフレーム
区切りの間隔を検出システムが知っていて、その間隔の
範囲で他と著しく異なるフレームを探索することで、音
質維持のために同期信号を比較的弱く埋め込んだ場合で
も検出することができる。埋め込みシステムと検出シス
テムが互いに了解していれば、ビット情報は区切りのフ
レームに埋め込んでも埋め込まなくても良い。
場合、切り取り耐性が同じである必要はない。重要な情
報は頻繁に繰り返されて短い切り取り区間でも検出でき
たほうが良い。
み、検出するために、埋め込みシステムと検出システム
とが、それぞれの情報を分割する分割単位のビット長と
分割数を知っていて、埋め込み時にそれぞれの情報を分
割単位のビット長に分割し、各情報から順に分割された
ビット列を取り出し並べて均等なビット長の情報(合成
単位と呼ぶ)を作成し、その情報の合成単位の先頭のビ
ットを区切りのフレームに埋め込み、残りのビットを順
に続くフレームに埋め込む手法、及びシステム。
し、各情報を
の違う複数の情報を切り取りに対して一様に埋め込む。
各ApBqCrの先頭ビットは区切りのフレームに埋め込む。
上記繰り返し周期の異なる複数情報埋め込み手法につい
て、従来の方法と本発明の方法の違いを図10に示す。
ージの開始位置を推定する手法]埋め込みシステムと検
出システムは、付加情報のビット列より長く、また、巡
回シフトで自分自身と一致することのない特定のビット
列(区切り用ビット列と呼ぶ)を互いに知っているもの
とする。巡回シフトで自分自身と一致することのないと
は、そのビット列を繰り返したとき、元の区切りで切っ
たときのみ、元のビット列を復元できるものを言う。例
えば、"00100010"は、その繰り返しに 00100010,00100010,00100010,00100010,... と区切り","を入れても、 0010,00100010,00100010,00100010,0010... と区切り","を入れても"00100010"を復元できる。従っ
て、区切り用ビット列として使用できない。"00100010"
は"0010"をその内部で繰り返しているが、一般に、自分
自身の中で周期を持つビット列は巡回シフトで自分自身
と一致し、区切り用ビット列として使用できない。一
方、自己周期を持たない"00100011"は、その繰り返しは
特定の区切りでのみしか元のビット列を復元できないの
で、"00100011"は区切り用ビット列として使用できる。
は、ビット列に区切り用ビット列を排他的論理和(演算x
or) で加えたかどうかを判定する方法を知っているもの
とする。例えば、区切り用ビット"00100011"では、ビッ
ト列の最後のビットの値を見ることで、区切り用ビット
の演算xor が施されたかを判定できる。判定方法は一意
でなく、この区切り用ビット列の例では、すべての桁の
ビットの和が奇数か偶数かを使っても判定できる。図1
2は、上記特定のビット列を加算することでメッセージ
の開始位置を推定する方法の説明図である。
ト列に1 ビット以上のビットを追加して、区切り用ビッ
ト列と同じ長さの拡張ビット列を作成し、オーディオデ
ータにそれを繰り返して埋め込むとき、一つおきの繰り
返しに区切り用ビット列を演算xor で加算して埋め込む
ものとする。追加ビットは、区切り用ビット列が加算さ
れているかを判定するのに使用する。
に、区切り用ビット列のビット長だけずらした同じ抽出
ビット列を演算xor で加え、得られたビット列から区切
り用ビット列とが一致する区切りを探索し、有ればそれ
を抽出ビットの区切りの位置とし、無ければ抽出ビット
に誤りがありとする。区切られたビット列は一区切りお
きに、区切り用ビット列が加算されているので、追加ビ
ットを使って、加算されていないほうのビット列を判定
し、それを復元ビット列とする。
する。埋め込みシステムで付加情報が7 ビットの"11011
01"とする。ことき、1ビット"0"を追加し、拡張ビット
列"11011010"を作成し、繰り返して埋め込むとき、 11011010,11111001,11011010,11111001,11011010,11111
001,... と、一つおきの繰り返しで区切り用ビット列を演算xor
で加算して、各ビットをフレームに埋め込む。ここで
は、区切り',' を見易さのために加えてあるが、実際に
各フレームで埋め込むのはビット値0 または1 のみであ
る。
上記から抜け落ち、検出システムでは、 11010,11111001,11011010,11111001,11011010,1111100
1,... とビット列が抽出できたとする。区切り用ビット列の長
さだけずらした、 11001,11011010,11111001,11011010,11111001,1101101
0,... を演算xor で加算すると、 00011,00100011,00100011,00100011,00100011,0010001
1,... となる。従って、区切り用ビット列"00100011"との一致
から、この区切りしかないことがわかる。次に、各区切
りで、追加ビットが"0"の拡張ビット列を選択すること
で、付加情報のビット列が"1101101"であることが導か
れる。
位置を推定する手法] 図13は、フレームでの検出信頼度を考慮してメッセー
ジの開始位置を推定する方法の説明図である。フレーム
での検出信頼度を考慮して、メッセージの開始位置を推
定するために、検出システムでは、区切り用ビット列の
長さから対応が定まる二つのフレームでおのおのビット
用マスクの内積の積を求め、それに区切り用ビット列の
定める符号を掛け、続くフレームでの和が最大となるこ
とで区切りを探索する。区切り用ビット列を{B(m)} と
し、その長さをMとする。また、いま、ビット用マスク
で得られた各フレームでの内積の値をXb(m) とする。こ
のとき、
の開始位置とする。ここで、区切り用ビットの添え字が
元の定義域をこえたとき、 B(m + M) = B(m) で定義域
を拡張するものとし、また、(-1)0 = 1、(-1)1 = -1 と
する。この手法では、各フレームでビットの誤りがあっ
ても、メッセージの開始位置が求めることができる。
始位置がわかると、複数の繰り返しに関して蓄積した
算してある繰り返しなら1、加算してない繰り返しなら
ゼロある。
開始位置を推定する手法] 複数の情報を異なる周期で埋め込むために、シフトで自
分自身と一致しない特定のビット列(区切り用部分ビッ
ト列と呼ぶ) を埋め込み時に排他的論理和で加算するこ
とで、検出時に情報の開始位置を検出する。
は、長さMのビット列{B(m)} に対し、任意のシフトv (0
< v < M) を行ったとき、B(m) ≠ B(m+v) となるm が0
≦ m≦ m+v ≦M-1 の範囲に必ず有ることを言う。例え
ば、"01011011101111"や"010011000111"はシフトで自分
自身と一致しないビット列の例である。
加情報のビット列や、それより長い周期で繰り返される
その他の付加情報の分割ビット列より長い、区切り用部
分ビット列を埋め込みシステムと検出システムは知って
いるとする。埋め込みシステムは、短い周期で繰り返す
付加情報のビット列にビットを追加して区切り用部分ビ
ット列の同じ長さの拡張ビット列を作成し、さらに、そ
の他の分割ビット列を付け加えて、合成単位のビット列
を作成し、順に合成単位のビット列を埋め込むとき、一
つおきに、区切り用部分ビット列を拡張ビット列に排他
的論理和(演算xor) で加算して埋め込むものとする。追
加ビットは、区切り用部分ビット列が加算されているか
を判定するのに使用する。
に、合成単位のビット列のビット長だけずらした同じ抽
出ビット列を演算xor で加え、得られたビット列から区
切り用部分ビット列とが一致する区切りを探索し、有れ
ばそれを抽出ビットの区切りの位置とし、無ければ抽出
ビットに誤りがありとする。区切られたビット列は一区
切りおきに、区切り用部分ビット列が加算されているの
で、追加ビットを使って、加算されていないほうのビッ
ト列を判定し、それを復元ビット列とする。
列とし、短い周期の付加情報が7 ビットの"1101101"と
する。このとき、埋め込みシステムは、1ビット"0"を
追加し、拡張ビット列"11011010"を作成し、それに、そ
の他の長い周期の付加情報の分割ビット列"*******"を
添付して合成単位のビット列"11011010*******"を作成
する。ここで"*"はおのおのが0 または1のいずれかと
いう意味である。合成単位のビット列を埋め込むとき、
一つおきに区切り用部分ビット列を演算xor で加算する
ので、 11011010*******,11101101*******,11011010*******,11
101101*******,... の各ビットが各フレームに埋め込まれる。ここでは、区
切り',' を見易さのために加えてあるが、実際に各フレ
ームで埋め込むのはビット値0 または1 のみである。
上記から抜け落ち、検出システムでは、 11010*******,11101101*******,11011010*******,11101
101*******,... とビット列が抽出できたとする。合成単位のビット列の
長さだけずらした、 01101*******,11011010*******,11101101*******,... を演算xor で加算すると、 10111*******,00110111*******,001101111*******,... となる。"*******"の部分の値が何であれ、区切り用部
分ビット列の長さより短いので一致することはなく、ま
た、シフトで自分自身と一致することも無いので、"001
10111"との一致するのは、埋め込み時の区切りしかない
ことがわかる。次に、各区切りで、追加ビットが"0"の
拡張ビット列を選択することで、短い周期の付加情報の
ビット列が"1101101"であることが導かれる。同様に、
添付したビット列"*******"を、その付加情報の中で短
いものを取り出し、その長さに対応した部分区切りビッ
ト列を使うことで、その付加情報の開始位置を検出でき
る。図14に上記特定のビット列を加算することで複数
のメッセージの開始位置を推定する手法を図示する。
みシステムと検出システムとが繰り返しまでのフレーム
数を知っており、その長さのビット列の集まりに対し、
巡回シフトで等しくなるビット列は同値とみなし、同値
でないビット列を異なる付加情報に対応させることで、
情報を埋め込み、ビット列の始まりを知ることなく付加
情報を抽出する手法、および、そのシステム。
列としては、例えば {00000},{00001},{00011},{00101},{00111},{01011},{0
1111},{11111} がある。5 ビット長の列をもちいて、8個の状態、すな
わち、3 ビットの情報を表現することができる。図15
に上記5 ビット長の列をもちいて3 ビットの情報を埋め
込む例を示す。一般にビットの長さMのビット列の集ま
りで、巡回シフトで互いに等しくならない独立のビット
列の数をS(M) とすると、素数p に対し、
する。図1に本発明の付加情報埋め込み装置のブロック
図を示す。入力制御ブロック 110は、入力されるオーデ
ィオ信号を時系列に並んだサンプル値として、周波数変
換ブロック120へ渡すものである。入力信号がアナログ
の場合、AD変換を行い、デジタル化されたものであれ
ば、フォーマットを解釈し、オーディオサンプル列をブ
ロック120へ渡す。
号の各周波数成分を算出するブロックである。このブロ
ックはブロック110からのデジタル化されたオーディオ
信号を受け、その区間における周波数成分の計算を行
う。
の耳の特性に基づき、変化に対し聞き分けにくい領域を
算出するブロックである。このブロックはブロック120
からの周波数変換されたオーディオ信号を受け、周波数
成分ごとに聞えに対する影響度を算出する。
ンダム列を生成するブロックである。生成された疑似ラ
ンダム列はブロック170へ渡され、付加情報埋め込み用
のマスク生成のために用いられる。
0は、付加情報埋め込み時に用いられるマスクを生成す
るものである。このブロックは、ブロック160で生成さ
れた疑似ランダム列と位相方向とを対応づけ、周波数毎
に埋め込み信号の位相を定める複素数平面上での2次元
ベクトル(マスク)を生成するブロックである。
ック140へ渡される。このビット列は、ブロック140で、
必要に応じてメッセージ同期検出用にビットが挿入、反
転される。
ィオ信号に非可聴の付加情報を埋め込むブロックであ
る。このブロックは、オーディオ信号の周波数成分のあ
る統計量が、付加情報180から受けるビット情報に従っ
て定められる符号となるよう、ブロック130で算出され
た聴覚心理モデルをもとに非可聴の範囲で、ブロック17
0より受けるマスク方向に信号および時間伸縮率検出用
の同期信号を、ブロック120より受ける周波数変換され
たオーディオ信号に付加する。
されたオーディオ信号を逆変換するブロックである。こ
のブロックは、ブロック140からの付加情報を埋め込ん
だ周波数変換されたオーディオ信号を逆変換し、時系列
に並んだオーディオサンプル列を算出するブロックであ
る。
オーディオサンプル列をオーディオデータとして出力す
るものである。このブロックは、ブロック190より受け
たオーディオサンプル列をDA変換、あるいは、ファイル
としてヘッダ情報等を付加し、オーディオ信号を出力す
る。
ク図を示す。入力制御ブロック 210は、入力されるオー
ディオ信号を時系列に並んだサンプル値として、周波数
変換ブロック220へ渡すものである。入力信号がアナロ
グの場合、AD変換を行い、デジタル化されたものであれ
ば、フォーマットを解釈し、オーディオサンプル列をブ
ロック250へ渡す。
号の各周波数成分を算出するブロックである。このブロ
ックはブロック210からのデジタル化されたオーディオ
信号を受け、その区間における周波数成分の計算を行
う。
ィオ信号に付加情報が埋め込まれているとして、入力さ
れるオーディオ信号の時間伸縮率や、付加情報埋め込み
処理単位(フレーム)開始位置を検出するブロックであ
る。このブロックでは、ブロック220より受けた周波数
変換されたオーディオ信号に対し、時間伸縮率検出用の
同期信号の伸縮率を測定することで、オーディオ信号の
伸縮率を求める。その後、ブロック280より受けるフレ
ーム同期用マスクを回転させて、時間伸縮率を補正した
オーディオ信号との内積値を計算し、その値が最大とな
る回転角度よりフレーム開始位置のずれを検出する。
ンダム列を生成するブロックである。生成された疑似ラ
ンダム列はブロック280へ渡され、付加情報検出用のマ
スク生成のために用いられる。
は、付加情報検出時に用いられるマスクを生成するもの
である。このブロックは、ブロック270で生成された疑
似ランダム列と位相方向とを対応づけ、周波数毎に埋め
込み信号の位相を定める複素数平面上での2次元ベクト
ル(マスク)を生成するブロックである。
信号に埋め込まれている付加情報を検出するブロックで
ある。このブロックでは、ブロック250より受けた時間
伸縮率、フレームの同期のとれた周波数変換されたオー
ディオ信号と、ブロック280より受ける付加情報検出用
マスクとの内積値を統計量として算出する。なお統計量
の値により、同期をやり直す必要が生じた場合には、ブ
ロック250の付加情報同期検出に再同期の信号を与え
る。
れた統計量をもとに、オーディオ信号に付加情報が埋め
込まれているか否か有無を判定するブロックである。こ
のブロックは、ブロック260より受けた統計量の大きさ
が十分に大きな値であるかどうかにより、入力されたオ
ーディオ信号に意図的に情報が埋め込まれているか否か
を判定するブロックである。
ビット情報を付加情報として復元するブロックである。
このブロックは、ブロック230により付加情報が埋め込
まれていると判定された場合には、その統計量の符号と
ビットとを対応づけてビット情報として解釈し、検出さ
れたビット情報の中から付加情報の開始ビットを検出
し、開始ビットに合わせ検出されたビット情報をシフト
し、メッセージ同期用にビットが挿入/反転されている
場合には、それらを除去/反転させ、埋め込んだ付加情
報を復元する。
検出において使用されるシステムのハードウェア構成の
一実施例が示されている。システム100は、中央処理
装置(CPU)1とメモリ4とを含んでいる。CPU1
とメモリ4は、バス2を介して、補助記憶装置としての
ハードディスク装置13(またはMO、CD−ROM2
3、DVD等の記憶媒体駆動装置)とIDEコントロー
ラ25を介して接続してある。同様にCPU1とメモリ
4は、バス2を介して、補助記憶装置としてのハードデ
ィスク装置30(またはMO28、CD−ROM23、
DVD等の記憶媒体駆動装置)とSCSIコントローラ
27を介して接続してある。フロッピーディスク装置2
0はフロッピーディスクコントローラ19を介してバス
2へ接続されている。
ピーディスクが挿入され、このフロッピーディスク等や
ハードディスク装置13(またはMO、CD−ROM、
DVD等の記憶媒体)、ROM14には、オペレーティ
ングシステムと協働してCPU等に命令を与え、本発明
を実施するための付加情報の埋め込みまたは検出を行う
コンピュータ・プログラムのコード若しくはデータを記
録することができ、メモリ4にロードされることによっ
て実行される。このコンピュータ・プログラムのコード
は圧縮し、または、複数に分割して、複数の媒体に記録
することもできる。
フェース・ハードウェアを備え、入力をするためのポイ
ンティング・デバイス(マウス、ジョイスティック等)
7またはキーボード6や、入力されたオーディオデー
タ、復元したオーディオデータ、付加情報などの視覚デ
ータをユーザに提示するためのディスプレイ12を有す
ることができる。また、パラレルポート16を介してプ
リンタを接続することや、シリアルポート15を介して
モデムを接続することが可能である。このシステム10
0は、シリアルポート15およびモデムまたは通信アダ
プタ18(イーサネットやトークンリング・カード)等を
介してネットワークに接続し、他のコンピュータ等と通
信を行うことが可能である。埋め込む付加情報を該通信
アダプタ18を介して外部ネットワークから取り込んだ
り、復元した付加情報をネットワークを介して外部に送
信することも可能である。またシリアルポート15若し
くはパラレルポート16に、遠隔送受信機器を接続し
て、赤外線若しくは電波によりデータの送受信を行うこ
とも可能である。
ラ21によってD/A(デジタル/アナログ変換)変換
されたオーディオ、音声信号を、アンプ22を介して受
領し、オーディオや音声として出力する。また、オーデ
ィオ・コントローラ21は、マイクロフォン24から受
領した音声またはオーディオ情報をA/D(アナログ/
デジタル)変換し、埋め込むための付加情報としてシス
テムにとり込むことを可能にしている。
100は、通常のパーソナルコンピュータ(PC)やワ
ークステーション、ノートブックPC、パームトップP
C、ネットワークコンピュータ、コンピュータを内蔵し
たテレビ等の各種家電製品、通信機能を有するゲーム
機、電話、FAX、携帯電話、PHS、電子手帳、等を
含む通信機能有する通信端末、または、これらの組合せ
によって実施可能であることを容易に理解できるであろ
う。ただし、これらの構成要素は例示であり、その全て
の構成要素が本発明の必須の構成要素となるわけではな
い。なお、図1、図2の付加情報埋め込み/検出の各ブ
ロックを専用のハードウェアにより構成しても何ら構わ
ない。
著作権情報等の付加情報の埋め込みによる音質の変化を
人間の聴覚では検知できないように埋め込みながら、一
方で、音質に著しい劣化を引き起こさない範囲でのオー
ディオデータへの処理に対し、埋め込んだ付加情報が残
り、信頼性をもって検出できる方法およびそのシステム
が提供される。これにより、CD やインターネットで配
送された音楽コンテンツの著作権保護が実現され、高品
質の音楽コンテンツを安心してデジタルで供給できるよ
うになり、音楽文化の安定した再生産・消費を実現する
ことが可能となる。
ある。
る。
ステムのハードウェア構成例である。
である。
る。
図である。
る。
理の流れを示す図である。
推定処理の流れを示す図である。
いて、従来の方法と本発明の方法の違い示す図である。
切りのフレームを使用した場合の概念図である。
の開始位置を推定する方法の説明図である。
ジの開始位置を推定する方法の説明図である。
セージの開始位置を推定する手法を説明する図である。
を埋め込む例を示す図である。
Claims (40)
- 【請求項1】オーディオデータへ付加情報を埋め込む、
付加情報埋め込みシステムであって、 (1)オーディオデータを周波数変換する手段と、 (2)前記オーディオデータに基づき、前記オーディオ
データに付加情報を埋め込むことのできる、周波数の変
更範囲を決定する手段と、 (3)付加情報検出時の同期検出を可能とする、付加情
報埋め込み用のマスクを生成する手段と、 (4)前記周波数変換されたオーディオデータの前記埋
め込むことのできる周波数の変更範囲に、付加情報を、
前記付加情報埋め込み用のマスクを用いて埋め込む手段
と、 (5)周波数変換され付加情報の埋め込まれたオーディ
オデータを、オーディオデータに逆変換する手段と、 を具備することを特徴とする、付加情報埋め込みシステ
ム。 - 【請求項2】前記オーディオデータを周波数変換する手
段(1)が、オーディオデータを、各々が複数のサンプ
ル列からなる複数のフレームに分割し、各フレームを周
波数変換する手段である、請求項1記載のシステム。 - 【請求項3】前記付加情報を埋め込むことのできる周波
数の変更範囲を決定する手段(2)が、周波数変換され
たオーディオデータの周波数分布に基づき、平均的な人
間の聴覚では検知できない周波数の変更範囲を決定する
手段である、請求項2記載のシステム。 - 【請求項4】前記付加情報埋め込み用のマスクは、擬似
乱数生成器から得られた擬似乱数により生成される、周
波数毎の埋め込み方を定める擬似ランダムな数である、
請求項3記載のシステム。 - 【請求項5】前記付加情報を埋め込む手段(4)が、付
加情報に応じて、前記擬似ランダムな数と前記周波数変
換されたフレームの周波数成分との内積が特定の符号ま
たは値になるように各周波数成分を、前記埋め込むこと
のできる周波数の変更範囲内で変更することにより、付
加情報を埋め込む手段である、請求項4記載のシステ
ム。 - 【請求項6】前記付加情報を埋め込む手段(4)が、付
加情報に応じて、前記擬似ランダムな数と前記周波数変
換されたフレームの周波数成分との内積が特定の符号ま
たは値になるように各周波数成分を、前記埋め込むこと
のできる周波数の変更範囲内で最大となるように変更す
ることにより、付加情報を埋め込む手段である、請求項
4記載のシステム。 - 【請求項7】連続する2フレームにおいて、前方フレー
ム内の最終サンプル列と後方フレーム内の最初のサンプ
ル列の周波数変換後の値が、等しい値に近づくように、
前記擬似ランダムな数を変更するか、または前記各フレ
ームの周波数成分の変更に制限を加える手段を含む、請
求項3記載のシステム。 - 【請求項8】前記付加情報を埋め込む手段(4)が、フ
レーム内の周波数成分を複数の周波数帯域に分割し、各
々の周波数帯域に対して、互いの内積が零となる直交す
る複数の付加情報埋め込み用マスクを用いて情報を埋め
込む、多重の付加情報の埋め込みを行う手段を含む、請
求項3記載のシステム。 - 【請求項9】前記付加情報を埋め込む手段(4)が、付
加情報の検出時に埋め込みを行ったフレームの区切りを
特定するための同期信号を、各フレームに埋め込む手段
を含む、請求項3記載のシステム。 - 【請求項10】前記付加情報を埋め込む手段(4)が、
付加情報の検出時に時間方向への伸縮率を検出するため
の同期信号を、各フレームに埋め込む手段を含む、請求
項3記載のシステム。 - 【請求項11】前記付加情報を埋め込む手段(4)が、
複数のフレームに同一の付加情報を繰り返して埋め込む
手段を含む、請求項3記載のシステム。 - 【請求項12】複数のフレームに繰り返して埋め込まれ
た付加情報の繰り返し開始もしくは終了フレームを特定
するために、該付加情報の繰り返しを検出する区切りフ
レームを設ける手段を含む、請求項11記載のシステ
ム。 - 【請求項13】前記区切りフレームは、付加情報を埋め
込むフレームに、他のフレームとは異なる同期信号を埋
め込んだフレームである、請求項12記載のシステム。 - 【請求項14】前記区切りフレームは、付加情報を埋め
込むフレームに、何も信号を埋め込まないフレームであ
る、請求項12記載のシステム。 - 【請求項15】複数のフレームをまたいで繰り返して埋
め込まれた付加情報の繰り返し開始もしくは終了フレー
ムを特定するために、巡回シフトで一致しない区切り用
ビット列を付加情報に加算したものを埋め込む手段を含
む、請求項11記載のシステム。 - 【請求項16】複数のフレームをまたいで繰り返して埋
め込まれた付加情報の繰り返し開始もしくは終了フレー
ムを特定するために、付加情報として,埋め込もうとす
る情報に1ビット以上の追加ビットを付し拡張ビット列
を生成する手段を含む、請求項11記載のシステム。 - 【請求項17】前記拡張ビット列を付加情報として埋め
込む際に、繰り返し周期の1つおきに前記区切り用ビッ
ト列を排他的論理和により加算して付加情報を埋め込む
手段を含む、請求項11記載のシステム。 - 【請求項18】巡回シフトしても他のビット列と区別で
きるビット列の組(コードワード)を付加情報と対応さ
せて繰り返し埋めることにより、繰返し周期の開始もし
くは終了フレームを特定することなく埋め込み情報検出
可能な手段を含む、請求項11記載のシステム。 - 【請求項19】前記付加情報を埋め込む手段(4)が、
複数の付加情報をそれぞれ異なる繰り返し周期で埋め込
む手段を含む、請求項3記載のシステム。 - 【請求項20】複数の付加情報をそれぞれ異なる繰り返
し周期で埋め込む際に、最も短い周期で検出される付加
情報に対し、他の付加情報を付加情報ごとに定められる
ビット長に分割したものを付加し、それらを付加情報埋
め込み繰り返し単位として埋め込む、請求項19記載の
システム。 - 【請求項21】繰り返し単位が分かるように、最も短い
周期で検出される情報に対し、区切り用ビット列を繰り
返し周期1つおきに排他的論理和でくわえたものを埋め
込む、請求項19記載のシステム。 - 【請求項22】オーディオデータに埋め込まれた付加情
報を検出する、付加情報検出システムであって、 (1)オーディオデータを周波数変換する手段と、 (2)付加情報検出用のマスクを生成する手段と、 (3)前記周波数変換されたオーディオデータから、オ
リジナルのオーディオデータを使用せずに、付加情報検
出のための同期をとる、同期検出手段と、 (4)前記周波数変換されたオーディオデータから、同
期をとりながら、前記付加情報検出用マスクを用いて、
付加情報のビットを検出する、付加情報検出手段と、 を具備することを特徴とする、付加情報検出システム。 - 【請求項23】前記オーディオデータを周波数変換する
手段(1)が、オーディオデータを、各々が複数のサン
プル列からなる複数のフレームに分割し、各フレームを
周波数変換する手段である、請求項22記載のシステ
ム。 - 【請求項24】前記付加情報検出用のマスクは、擬似乱
数生成器から得られた擬似乱数により生成される、擬似
ランダムなベクトルである、請求項22記載のシステ
ム。 - 【請求項25】前記付加情報検出用のマスクは、付加情
報埋込み時に用いられたマスクと実質的に同一である、
請求項22記載のシステム。 - 【請求項26】前記付加情報を検出する手段(4)が、
各フレームが周波数変換された周波数成分と、前記擬似
ランダムな数との内積を計算し、該内積の値の符号、ま
たは内積の値により、付加情報を検出する手段である、
請求項24記載のシステム。 - 【請求項27】前記内積は、各フレームが周波数変換さ
れた周波数成分に周波数分布から決まる周波数依存の定
数を掛けたものと、前記擬似ランダムな数との内積を算
出することを特徴とする、請求項26記載のシステム。 - 【請求項28】前記付加情報を検出する手段(4)が、
フレーム同期用マスクから生成される擬似ランダムな数
と各フレームが周波数変換された周波数成分との内積の
計算結果に従って、付加情報検出用マスクそれぞれにお
いて検出された値とビット情報との対応関係を変更する
手段を含む、請求項26記載のシステム。 - 【請求項29】前記付加情報を検出する手段(4)が、
多重に情報が埋め込まれている場合、複数の検出用マス
クを用いて,各フレームが周波数変換された周波数成分
と、それぞれの検出用マスクから生成される前記擬似ラ
ンダムな数との内積を計算し、該内積の値の符号、また
は内積の値により、多重に埋め込まれた付加情報をそれ
ぞれ検出する手段である、請求項26記載のシステム。 - 【請求項30】前記付加情報を検出する手段(4)が、
フレーム間にまたがって同じ符号で、または、交互に反
対符号で前記内積の値を総和することにより、付加情報
検出の信頼性を上げることを特徴とする、請求項25記
載のシステム。 - 【請求項31】前記付加情報を検出する手段(4)が、
前記総和された前記内積の絶対値が、ある閾値より大き
いか否かにより、付加情報の埋め込みの有り無しを判定
する手段を含むことを特徴とする、請求項30記載のシ
ステム。 - 【請求項32】前記同期検出手段が、前記複数のフレー
ムを重ね合わせて得られる1フレームのデータを周波数
変換して、位相を回転した付加情報検出用のマスクとの
内積を求め、その内積の絶対値が最大となる位相の回転
角から、埋め込み時のフレームの開始位置を特定する手
段であることを特徴とする、請求項24記載のシステ
ム。 - 【請求項33】前記オーディオデータを周波数変換する
手段(1)が、フレームの幅を変更し、埋め込んだ同期
信号の各フレームにおける位相または振幅を測定し、そ
れらが検出するすべてのフレームにおいて最もそろって
いる、フレーム幅の変更量を時間軸上の伸縮率として、
時間軸上の伸縮率を定める手段を含む、請求項26記載
のシステム。 - 【請求項34】(5)前記検出された付加情報のビット
から、付加情報を復元するために、繰り返しの開始また
は終了フレームを特定する手段を具備し、該手段が、フ
レームから検出される同期信号の検出値が他の連続フレ
ームと異なるフレームか、または同期信号が埋め込まれ
ていないフレームを区切りのフレームとして特定する手
段を含む、請求項26記載のシステム。 - 【請求項35】前記付加情報検出手段(4)が、区切り
用ビット列を用いて、検出されたビット列の中から付加
情報を構成するビット列の繰り返し位置を特定すること
により、検出ビット列より付加情報を復元する手段を含
む、請求項26のシステム。 - 【請求項36】前記付加情報検出手段(4)が、埋め込
み時の付加情報の繰り返し開始位置を知ることなく付加
情報を復元する手法を含む、請求項26記載のシステ
ム。 - 【請求項37】オーディオデータへ付加情報を埋め込
む、付加情報埋め込み方法であって、 (1)オーディオデータを周波数変換する段階と、 (2)前記オーディオデータに基づき、前記オーディオ
データに付加情報を埋め込むことのできる、周波数の変
更範囲を決定する段階と、 (3)付加情報検出時の同期検出を可能とする、付加情
報埋め込み用のマスクを生成する段階と、 (4)前記周波数変換されたオーディオデータの前記埋
め込むことのできる周波数の変更範囲に、付加情報を、
前記付加情報埋め込み用のマスクを用いて埋め込む段階
と、 (5)周波数変換され付加情報の埋め込まれたオーディ
オデータを、オーディオデータに逆変換する段階と、 を有することを特徴とする、付加情報埋め込み方法。 - 【請求項38】オーディオデータに埋め込まれた付加情
報を検出する、付加情報検出方法であって、 (1)オーディオデータを周波数変換する段階と、 (2)付加情報検出用のマスクを生成し、前記周波数変
換されたオーディオデータから、オリジナルのオーディ
オデータを使用せずに、付加情報検出のための同期をと
る段階と、 (3)前記周波数変換されたオーディオデータから、同
期をとりながら、前記付加情報検出用マスクを用いて、
付加情報のビットを検出する段階と、 を有することを特徴とする、付加情報検出方法。。 - 【請求項39】オーディオデータへ付加情報を埋め込む
プログラムを含むコンピュータ読み取り可能な記録媒体
であって、該プログラムが、コンピュータに、 (1)オーディオデータを周波数変換する機能と、 (2)前記オーディオデータに基づき、前記オーディオ
データに付加情報を埋め込むことのできる、周波数の変
更範囲を決定する機能と、 (3)付加情報検出時の同期検出を可能とする、付加情
報埋め込み用のマスクを生成する機能と、 (4)前記周波数変換されたオーディオデータの前記埋
め込むことのできる周波数の変更範囲に、付加情報を、
前記付加情報埋め込み用のマスクを用いて埋め込む機能
と、 (5)周波数変換され付加情報の埋め込まれたオーディ
オデータを、オーディオデータに逆変換する機能と、 を実現させる記録媒体。 - 【請求項40】オーディオデータに埋め込まれた付加情
報を検出するプログラムを含むコンピュータ読み取り可
能な記録媒体であって、該プログラムが、コンピュータ
に、 (1)オーディオデータを周波数変換する機能と、 (2)付加情報検出用のマスクを生成し、前記周波数変
換されたオーディオデータから、オリジナルのオーディ
オデータを使用せずに、付加情報検出のための同期をと
る機能と、 (3)前記周波数変換されたオーディオデータから、同
期をとりながら、前記付加情報検出用マスクを用いて、
付加情報のビットを検出する機能と、 を実現させる記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26924499A JP3274667B2 (ja) | 1998-09-29 | 1999-09-22 | オーディオデータへ付加情報を埋め込む方法およびシステム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10-276230 | 1998-09-29 | ||
JP27623098 | 1998-09-29 | ||
JP26924499A JP3274667B2 (ja) | 1998-09-29 | 1999-09-22 | オーディオデータへ付加情報を埋め込む方法およびシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000172282A JP2000172282A (ja) | 2000-06-23 |
JP3274667B2 true JP3274667B2 (ja) | 2002-04-15 |
Family
ID=17566516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26924499A Expired - Fee Related JP3274667B2 (ja) | 1998-09-29 | 1999-09-22 | オーディオデータへ付加情報を埋め込む方法およびシステム |
Country Status (5)
Country | Link |
---|---|
US (1) | US6526385B1 (ja) |
JP (1) | JP3274667B2 (ja) |
KR (1) | KR100341197B1 (ja) |
CN (1) | CN1199180C (ja) |
GB (1) | GB2343818B (ja) |
Families Citing this family (74)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19947877C2 (de) * | 1999-10-05 | 2001-09-13 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals |
GB2358999A (en) * | 2000-02-02 | 2001-08-08 | Central Research Lab Ltd | A system and method for labelling a signal |
AU2001264351A1 (en) * | 2000-06-08 | 2002-01-02 | Markany Inc. | Watermark embedding and extracting method for protecting digital audio contents copyright and preventing duplication and apparatus using thereof |
GB2365296A (en) * | 2000-07-27 | 2002-02-13 | Cambridge Consultants | Encoder/decoder for watermarking a covertext signal |
AU2001275712A1 (en) | 2000-07-27 | 2002-02-13 | Activated Content Corporation, Inc. | Stegotext encoder and decoder |
US6674876B1 (en) * | 2000-09-14 | 2004-01-06 | Digimarc Corporation | Watermarking in the time-frequency domain |
US7958213B1 (en) * | 2000-09-21 | 2011-06-07 | Siemens Enterprise Communications, Inc. | Processing electronic messages |
JP4348851B2 (ja) * | 2000-09-21 | 2009-10-21 | ソニー株式会社 | 記録媒体、ディスク記録装置および方法、並びにディスク再生装置及び方法 |
US8977683B2 (en) | 2000-12-26 | 2015-03-10 | Polycom, Inc. | Speakerphone transmitting password information to a remote device |
US7339605B2 (en) | 2004-04-16 | 2008-03-04 | Polycom, Inc. | Conference link between a speakerphone and a video conference unit |
US8964604B2 (en) | 2000-12-26 | 2015-02-24 | Polycom, Inc. | Conference endpoint instructing conference bridge to dial phone number |
US8948059B2 (en) | 2000-12-26 | 2015-02-03 | Polycom, Inc. | Conference endpoint controlling audio volume of a remote device |
US9001702B2 (en) | 2000-12-26 | 2015-04-07 | Polycom, Inc. | Speakerphone using a secure audio connection to initiate a second secure connection |
US7864938B2 (en) * | 2000-12-26 | 2011-01-04 | Polycom, Inc. | Speakerphone transmitting URL information to a remote device |
JP2002202787A (ja) * | 2000-12-28 | 2002-07-19 | Sony Corp | コンテンツデータ、記録媒体、データ記録方法および装置、データ送信方法および装置、データ出力方法および装置、データ再生方法および装置、データ受信方法および装置 |
GB0110132D0 (en) * | 2001-04-25 | 2001-06-20 | Central Research Lab Ltd | System to detect compression of audio signals |
US8934382B2 (en) | 2001-05-10 | 2015-01-13 | Polycom, Inc. | Conference endpoint controlling functions of a remote device |
EP1396839A1 (en) * | 2001-05-17 | 2004-03-10 | International Business Machines Corporation | Content boundary detecting device, monitoring method, content position determining method, program, and storage medium |
GB2378370B (en) | 2001-07-31 | 2005-01-26 | Hewlett Packard Co | Method of watermarking data |
GB0119569D0 (en) * | 2001-08-13 | 2001-10-03 | Radioscape Ltd | Data hiding in digital audio broadcasting (DAB) |
JP3675745B2 (ja) * | 2001-08-21 | 2005-07-27 | ソニー株式会社 | 付加データ埋め込み装置、付加データ埋め込み方法及び付加データ埋め込みプログラム |
US8934381B2 (en) * | 2001-12-31 | 2015-01-13 | Polycom, Inc. | Conference endpoint instructing a remote device to establish a new connection |
US8885523B2 (en) | 2001-12-31 | 2014-11-11 | Polycom, Inc. | Speakerphone transmitting control information embedded in audio information through a conference bridge |
US8705719B2 (en) | 2001-12-31 | 2014-04-22 | Polycom, Inc. | Speakerphone and conference bridge which receive and provide participant monitoring information |
US8102984B2 (en) * | 2001-12-31 | 2012-01-24 | Polycom Inc. | Speakerphone and conference bridge which receive and provide participant monitoring information |
US8223942B2 (en) * | 2001-12-31 | 2012-07-17 | Polycom, Inc. | Conference endpoint requesting and receiving billing information from a conference bridge |
US7742588B2 (en) * | 2001-12-31 | 2010-06-22 | Polycom, Inc. | Speakerphone establishing and using a second connection of graphics information |
US7978838B2 (en) | 2001-12-31 | 2011-07-12 | Polycom, Inc. | Conference endpoint instructing conference bridge to mute participants |
US8144854B2 (en) | 2001-12-31 | 2012-03-27 | Polycom Inc. | Conference bridge which detects control information embedded in audio information to prioritize operations |
US8947487B2 (en) | 2001-12-31 | 2015-02-03 | Polycom, Inc. | Method and apparatus for combining speakerphone and video conference unit operations |
US7787605B2 (en) | 2001-12-31 | 2010-08-31 | Polycom, Inc. | Conference bridge which decodes and responds to control information embedded in audio information |
WO2003061143A2 (en) * | 2002-01-15 | 2003-07-24 | University Of Miami | Coding a masked data channel in a radio signal |
EP1343097A1 (en) * | 2002-03-04 | 2003-09-10 | Hewlett-Packard Company | Method for embedding of information in media files |
US7606388B2 (en) | 2002-05-14 | 2009-10-20 | International Business Machines Corporation | Contents border detection apparatus, monitoring method, and contents location detection method and program and storage medium therefor |
US20040034655A1 (en) * | 2002-07-17 | 2004-02-19 | Tecu Kirk Steven | Multimedia system and method |
JP4088622B2 (ja) | 2002-07-29 | 2008-05-21 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Wm信号生成装置、wm信号生成方法、wm信号生成方法を実行するためのコンピュータ実行可能なプログラムおよび該プログラムを記録したコンピュータ可読な記録媒体、電子透かし埋め込み装置、および該電子透かし埋め込み装置を含むディジタル・テレビ装置 |
EP1429327A3 (en) * | 2002-12-13 | 2005-03-09 | Sony DADC Austria AG | Data recording method and data recording medium |
JP3871657B2 (ja) * | 2003-05-27 | 2007-01-24 | 株式会社東芝 | 話速変換装置、方法、及びそのプログラム |
WO2005034398A2 (en) * | 2003-06-19 | 2005-04-14 | University Of Rochester | Data hiding via phase manipulation of audio signals |
JP4379031B2 (ja) * | 2003-07-17 | 2009-12-09 | 日本ビクター株式会社 | 情報伝送方式及びそれに用いる情報送信装置及び情報受信装置 |
GB2416285A (en) * | 2004-07-14 | 2006-01-18 | British Broadcasting Corp | Transmission of a data signal in an audio signal |
KR100617165B1 (ko) * | 2004-11-19 | 2006-08-31 | 엘지전자 주식회사 | 워터마크 삽입/검출 기능을 갖는 오디오 부호화/복호화장치 및 방법 |
JP4713180B2 (ja) * | 2005-02-25 | 2011-06-29 | 大日本印刷株式会社 | 音響信号からの情報の抽出装置 |
EP1729285A1 (en) * | 2005-06-02 | 2006-12-06 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for watermarking an audio or video signal with watermark data using a spread spectrum |
US8126029B2 (en) | 2005-06-08 | 2012-02-28 | Polycom, Inc. | Voice interference correction for mixed voice and spread spectrum data signaling |
US7796565B2 (en) * | 2005-06-08 | 2010-09-14 | Polycom, Inc. | Mixed voice and spread spectrum data signaling with multiplexing multiple users with CDMA |
US8199791B2 (en) | 2005-06-08 | 2012-06-12 | Polycom, Inc. | Mixed voice and spread spectrum data signaling with enhanced concealment of data |
US8332216B2 (en) * | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
US8582729B2 (en) * | 2006-02-24 | 2013-11-12 | Qualcomm Incorporated | System and method of controlling a graphical user interface at a wireless device |
EP1837875A1 (en) * | 2006-03-22 | 2007-09-26 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for correlating two data sections |
JP4827661B2 (ja) * | 2006-08-30 | 2011-11-30 | 富士通株式会社 | 信号処理方法及び装置 |
US8494903B2 (en) | 2007-03-16 | 2013-07-23 | Activated Content Corporation | Universal advertising model utilizing digital linkage technology “U AD” |
JP2010074398A (ja) * | 2008-09-17 | 2010-04-02 | Ntt Docomo Inc | Ofdm変復調方法、ofdm変調装置、ofdm復調装置およびofdm変復調システム |
US9667365B2 (en) | 2008-10-24 | 2017-05-30 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US20100131417A1 (en) * | 2008-11-25 | 2010-05-27 | Hank Risan | Enhancing copyright revenue generation |
CN102625982B (zh) | 2009-05-01 | 2015-03-18 | 尼尔森(美国)有限公司 | 提供与主要广播媒体内容关联的辅助内容的方法、装置和制品 |
KR101764926B1 (ko) | 2009-12-10 | 2017-08-03 | 삼성전자주식회사 | 음향 통신을 위한 장치 및 방법 |
KR101200825B1 (ko) * | 2009-12-21 | 2012-11-22 | 서울대학교산학협력단 | 가청주파수 대역 음향통신에서의 데이터 수신에러 감소 시스템 및 방법, 그리고 이에 적용되는 장치 |
US8917631B2 (en) | 2010-08-23 | 2014-12-23 | Ortsbo Inc. | System and method for sharing information between two or more devices |
KR101462427B1 (ko) * | 2010-11-10 | 2014-11-17 | 서울대학교산학협력단 | 오디오 신호의 보존에 기초한 음파 통신에서 정보 송수신 시스템 및 방법, 그리고 이에 적용되는 장치 |
US20140135965A1 (en) * | 2011-05-02 | 2014-05-15 | Re-10 Ltd. | Apparatus, systems and methods for production, delivery and use of embedded content delivery |
JP2013026952A (ja) * | 2011-07-25 | 2013-02-04 | Sony Corp | 画像処理方法、エンコード装置、デコード装置および画像処理装置 |
EP2565667A1 (en) * | 2011-08-31 | 2013-03-06 | Friedrich-Alexander-Universität Erlangen-Nürnberg | Direction of arrival estimation using watermarked audio signals and microphone arrays |
CN104871243A (zh) * | 2012-12-31 | 2015-08-26 | 张江红 | 提供增强音频数据流的方法及装置 |
CN103079196B (zh) * | 2013-01-11 | 2016-02-10 | 广东欧珀移动通信有限公司 | 加密通话方法及终端 |
HK1176805A2 (en) * | 2013-01-15 | 2013-08-02 | X On Comm Ltd | A method and system for wireless communication |
WO2014168777A1 (en) * | 2013-04-10 | 2014-10-16 | Dolby Laboratories Licensing Corporation | Speech dereverberation methods, devices and systems |
WO2014199449A1 (ja) | 2013-06-11 | 2014-12-18 | 株式会社東芝 | 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム |
US9881631B2 (en) * | 2014-10-21 | 2018-01-30 | Mitsubishi Electric Research Laboratories, Inc. | Method for enhancing audio signal using phase information |
CN106295253A (zh) * | 2015-06-26 | 2017-01-04 | 南宁富桂精密工业有限公司 | 信息隐藏方法及系统 |
US10720959B2 (en) * | 2017-10-12 | 2020-07-21 | British Cayman Islands Intelligo Technology Inc. | Spread spectrum based audio frequency communication system |
US11714127B2 (en) | 2018-06-12 | 2023-08-01 | International Business Machines Corporation | On-chip spread spectrum characterization |
US11146307B1 (en) * | 2020-04-13 | 2021-10-12 | International Business Machines Corporation | Detecting distortion in spread spectrum signals |
US11693446B2 (en) | 2021-10-20 | 2023-07-04 | International Business Machines Corporation | On-chip spread spectrum synchronization between spread spectrum sources |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8901032A (nl) | 1988-11-10 | 1990-06-01 | Philips Nv | Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting. |
US5768426A (en) * | 1993-11-18 | 1998-06-16 | Digimarc Corporation | Graphics processing system employing embedded code signals |
EP0766468B1 (en) | 1995-09-28 | 2006-05-03 | Nec Corporation | Method and system for inserting a spread spectrum watermark into multimedia data |
US5949885A (en) * | 1996-03-12 | 1999-09-07 | Leighton; F. Thomson | Method for protecting content using watermarking |
US6282299B1 (en) * | 1996-08-30 | 2001-08-28 | Regents Of The University Of Minnesota | Method and apparatus for video watermarking using perceptual masks |
US5848155A (en) | 1996-09-04 | 1998-12-08 | Nec Research Institute, Inc. | Spread spectrum watermark for embedded signalling |
JP3355521B2 (ja) | 1998-03-23 | 2002-12-09 | 東洋通信機株式会社 | 音声符号化時の透かしビットの埋込方法 |
JP2000089796A (ja) | 1998-09-16 | 2000-03-31 | Nippon Hoso Kyokai <Nhk> | 音響信号へのデータ埋め込み装置およびデータ抽出装置 |
-
1999
- 1999-08-21 KR KR1019990034798A patent/KR100341197B1/ko not_active IP Right Cessation
- 1999-09-15 US US09/396,316 patent/US6526385B1/en not_active Expired - Fee Related
- 1999-09-17 CN CNB991202147A patent/CN1199180C/zh not_active Expired - Lifetime
- 1999-09-22 JP JP26924499A patent/JP3274667B2/ja not_active Expired - Fee Related
- 1999-09-27 GB GB9922676A patent/GB2343818B/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2000172282A (ja) | 2000-06-23 |
CN1199180C (zh) | 2005-04-27 |
KR100341197B1 (ko) | 2002-06-20 |
GB2343818B (en) | 2004-01-21 |
CN1249517A (zh) | 2000-04-05 |
GB2343818A (en) | 2000-05-17 |
US6526385B1 (en) | 2003-02-25 |
KR20000022748A (ko) | 2000-04-25 |
GB9922676D0 (en) | 1999-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3274667B2 (ja) | オーディオデータへ付加情報を埋め込む方法およびシステム | |
CN1975859B (zh) | 音频处理方法和装置 | |
US6879652B1 (en) | Method for encoding an input signal | |
Lie et al. | Robust and high-quality time-domain audio watermarking based on low-frequency amplitude modification | |
JP4690366B2 (ja) | 音声透かしをベースとするメディア・プログラムの識別方法及び装置 | |
Megías et al. | Efficient self-synchronised blind audio watermarking system based on time domain and FFT amplitude modification | |
JP4030036B2 (ja) | 放送番組特定システムに於いて使用するための、音声信号に不可聴コードを付加することにより可聴信号をエンコードするシステム及び装置 | |
Dutta et al. | Data hiding in audio signal: A review | |
CN101297354B (zh) | 音频处理 | |
JP2003500702A (ja) | 可聴信号中の情報の復号化 | |
JP4186531B2 (ja) | データ埋め込み方法、データ抽出方法、データ埋め込み抽出方法、及びシステム | |
JPH11212463A (ja) | 一次元データへの電子透かし | |
US7266466B2 (en) | Watermark time scale searching | |
Hu et al. | Hybrid blind audio watermarking for proprietary protection, tamper proofing, and self-recovery | |
JP4867765B2 (ja) | 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置 | |
US20080273707A1 (en) | Audio Processing | |
US7466742B1 (en) | Detection of entropy in connection with audio signals | |
US20040054525A1 (en) | Encoding method and decoding method for digital voice data | |
Foote et al. | Time base modulation: a new approach to watermarking audio | |
JP2006195061A (ja) | 音響信号に対する情報の埋め込み装置、音響信号からの情報の抽出装置および音響信号再生装置 | |
Horvatic et al. | Robust audio watermarking: based on secure spread spectrum and auditory perception model | |
Megías et al. | An audio watermarking scheme robust against stereo attacks | |
JP2001184081A (ja) | 情報処理装置及びその方法並びにプログラム格納媒体 | |
JP5486839B2 (ja) | 小型検出窓を利用した電子透かし埋め込み検出方法 | |
JP4910921B2 (ja) | 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080201 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090201 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100201 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110201 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120201 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130201 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130201 Year of fee payment: 11 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130201 Year of fee payment: 11 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S802 | Written request for registration of partial abandonment of right |
Free format text: JAPANESE INTERMEDIATE CODE: R311802 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130201 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140201 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |