JP4830172B2 - オーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法、秘匿データ編集方法、mpegオーディオ符号化データへの秘匿データ挿入装置、秘匿データ抽出装置、mpegオーディオ復元装置、および挿入データ編集装置。 - Google Patents

オーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法、秘匿データ編集方法、mpegオーディオ符号化データへの秘匿データ挿入装置、秘匿データ抽出装置、mpegオーディオ復元装置、および挿入データ編集装置。 Download PDF

Info

Publication number
JP4830172B2
JP4830172B2 JP2006187925A JP2006187925A JP4830172B2 JP 4830172 B2 JP4830172 B2 JP 4830172B2 JP 2006187925 A JP2006187925 A JP 2006187925A JP 2006187925 A JP2006187925 A JP 2006187925A JP 4830172 B2 JP4830172 B2 JP 4830172B2
Authority
JP
Japan
Prior art keywords
data
frequency component
secret data
quantized
secret
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006187925A
Other languages
English (en)
Other versions
JP2008015326A (ja
Inventor
康之 中島
清 田中
暁夫 米山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shinshu University NUC
KDDI Corp
Original Assignee
Shinshu University NUC
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shinshu University NUC, KDDI Corp filed Critical Shinshu University NUC
Priority to JP2006187925A priority Critical patent/JP4830172B2/ja
Publication of JP2008015326A publication Critical patent/JP2008015326A/ja
Application granted granted Critical
Publication of JP4830172B2 publication Critical patent/JP4830172B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、圧縮オーディオデータに秘匿情報を適用する技術に関し、特にオーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法、秘匿データ編集方法、MPEGオーディオ符号化データへの秘匿データ挿入装置、秘匿データ抽出装置、MPEGオーディオ復元装置、および挿入データ編集装置に関する。
圧縮オーディオデータに秘匿情報を埋め込む従来技術として、例えば下記の特許文献1,2に示されているものがある。
前記特許文献1には、聴覚心理モデルによって決定されるマスキングレベルと、ビット割り当てまたは量子化ステップ数によって定まる量子化誤差から求めたノイズレベルとの比率(MNR)を用いて、特定サブバンドにおけるMNRの品質順位をグループ化した信号値によって電子透かし情報を埋め込むことにより、音質劣化を抑えることのできる電子透かし埋め込に装置が開示されている。
この電子透かし埋め込に装置によれば、フレーム毎または間欠フレームの量子化後、信号の所定のサブバンドの復号時のMNRの品質順位をグループ化することにより得た信号値を、所望の透かし情報の信号値と一致するように調整することにより、所望の透かし情報を量子化後信号に埋め込むことができる。
また、前記特許文献2には、圧縮されたオーディオにデータを挿入する方法が開示されている。
特開2002−304184号公報 特開2001−184080号公報
しかしながら、前記した特許文献1のものは、符号化時に得られる符号化雑音情報(MNR)を制御情報として用いて挿入データにより再量子化する際に、透かし情報の埋め込み前のデータに戻せないため、音質劣化が生じるという問題、また情報量が増えた場合、書き換えができないという問題がある。
また、前記した特許文献2のものは、圧縮されたオーディオに付加情報が埋め込まれると、別の値に変換されてしまうため、元のMPEGデータに戻すことが困難であるという問題、及び書き換えができないという問題があった。
本発明の目的は、前記した従来技術の問題点を解決し、秘匿データを圧縮されたオーディオデータに効率的に挿入し、秘匿されたデータを効率的に検出することのできる圧縮オーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法、MPEGオーディオ符号化データへの秘匿データ挿入装置、及び秘匿データ抽出装置を提供することにある。また、他の目的は、秘匿データを別の秘匿データに書き換える秘匿データ編集方法、及び秘匿データ編集装置、ならびにMPEGオーディオ復元装置を提供することにある。
前記下目的を達成するために、本発明は、周波数変換され、さらに量子化されたオーディオデータへの秘匿データ挿入方法において、
各量子化周波数成分のうち、最も高い周波数成分の位置(m−1)と、非0となっている量子化周波数成分の中で2番目に高い周波数成分の位置qとの中点(以下、「キー位置k」という)を求め、
前記非0となっている量子化周波数成分の中で最も高い周波数成分の位置pを、前記キー位置kから、前記位置pと位置qとの距離dだけ高周波側へ移動することで、秘匿データを挿入するようにした点に第1の特徴がある。
また、本発明は、サブバンド符号化などで符号化されたオーディオデータを入力し、該オーディオデータを部分的に復号して、量子化周波数成分を抽出し、各量子化周波数成分のうち、最も高い周波数成分の位置(m−1)と、非0となっている量子化周波数成分の中で2番目に高い周波数成分の位置qとの中点(以下、「キー位置k」という)を求め、前記非0となっている量子化周波数成分の中で最も高い周波数成分の位置pが前記キー位置kより高周波側に位置するかどうかにより、秘匿データを抽出するようにした点に第2の特徴がある。
また、本発明は、抽出された秘匿データ“1”を“0”に変更する場合には、非0となっている量子化周波数成分の中で最も高い周波数成分の位置pを、2番目に高い周波数成分の位置qから、前記距離dだけ高周波側へ移動した位置に変更し、抽出された秘匿データ“0”を“1”に変更する場合には、前記位置pを前記キー位置kから前記距離dだけ高周波側へ移動するようにした点に第3の特徴がある。
さらに、本発明は、MPEGオーディオ符号化データへの秘匿データ挿入装置、秘匿データ抽出装置、MPEGオーディオ復元装置、および挿入データ編集装置を提供する点に第4の特徴がある。
本発明によれば、秘匿データを、単に、オーディオデータの量子化周波数成分の0係数情報と非0係数情報の位置の関係を用いて入することができるので、従来装置のように、MDCT係数等まで戻さずに秘匿データを挿入することができ、低処理負荷で秘匿データをオーディオデータに挿入できるようになる。また、秘匿データの抽出を容易に行うことができる。
また、秘匿データの挿入後も、挿入前の符号化仕様に準拠させることができる。また、高周波成分の位置を移動させるだけであるので、秘匿データの挿入後でも音質劣化が少ない。
また、前記移動した高周波成分を元に戻せば、完全に秘匿データ挿入前のオーディオデータに復元できる。また、このため、挿入データの書き換え(秘匿データ編集)が可能になる。
また、MPEG規格に準拠したオーディオデータへの秘匿データ挿入装置、秘匿データ抽出装置、MPEGオーディオ復元装置、および挿入データ編集装置を提供することができる。
以下に、図面を参照して、本発明を詳細に説明する。図1は、秘匿データを圧縮されたオーディオデータに効率的に挿入できるようにした一実施形態の概略のブロック図である。
量子化周波数成分復元部11に符号化オーディオデータaが入力される。量子化周波数成分復元部11では符号化データを部分的に復号して量子化された周波数成分11aが抽出される。例えば、MPEG-1オーディオでは、量子化サブバンドデータや量子化MDCT係数がこれに相当する。なお、量子化周波数成分と無関係なヘッダ情報11bなどは、そのまま符号化データ再構成部13に入力される。量子化周波数成分復元部11から出力された量子化周波数成分11aは、“0”や“1”などの挿入データg(ビットデータ)、すなわち秘匿データと共に、第1のデータ挿入部12に入力される。データ挿入された量子化周波数成分12aは符号化データ再構成部13に入力されて、ヘッダ情報11bなどのデータ挿入に関連しない符号化オーディオデータと合わせて再構成されて、データ挿入されたオーディオ符号化データ13aとして出力される。
図2は、前記第1のデータ挿入部12の動作を示したものである。ステップS1では、量子化周波数成分11aを受け取り、ステップS2では、非0成分と0成分が抽出され、ステップS3では、それらのデータからデータ挿入位置候補が決定される。ステップS4では、挿入データg(“0”、“1”)より決定されるデータ挿入位置に非0成分の位置を変更する。これにより、ステップS5では、量子化周波数成分上で量子化周波数成分の位置に透かしデータすなわち秘匿データを、1ビット埋め込むことができる。
図3は、MPEG-1オーディオレイヤーIIで符号化されたオーディオデータにデータ挿入する場合を示したものである。入力されたMPEG-1オーディオデータaは、量子化サブバンドサンプル復元部15で部分復号されてサブバンドサンプル15aを出力する。ヘッダ情報などサブバンドサンプルに関係しない情報15bについては、MPEG符号化データ再構成部17に入力される。サブバンドサンプル15aは、第2のデータ挿入部16に挿入データgと共に入力される。第2のデータ挿入部16では、挿入するデータに依存して量子化サブバンドサンプルを変更する。MPEG符号化データ再構成部17では、データ挿入された量子化サブバンドサンプル16aとヘッダ情報15bなどが再構成され、MPEG-1規格に準拠したデータフォーマットが生成される。これによりデータ挿入されたMPEG-1オーディオデータ17aが出力される。
図4は、MPEG-1の場合の第2のデータ挿入部16の動作を示したものである。ステップS11では、量子化サブサンプル復元部15から量子化周波数成分15aを受け取り、ステップS12では、非0量子化サブバンド成分と0量子化サブバンド成分を抽出する。ステップS13では、それらのデータからデータ挿入位置候補が決定される。なお、サブバンド成分とは、サブバンドサンプルにおける各サブバンドの成分を示す。ステップS14では、挿入データg(“0”、“1”)より決定されるデータ挿入位置に非0量子化サブバンド成分の位置を変更する。これにより、ステップS15では、量子化周波数成分上で量子化周波数成分の位置に透かしデータを1ビット埋め込むことができる。
図5に、挿入する1ビットデータに対する具体的なサブバンドサンプルの変更方法をMPEG-1オーディオの例を用いて示す。
符号化されたオーディオデータのサブバンド数はm個で、図の例では、非0となるサブバンドは、サブバンド番号#0,1,2やq、pである。これに対して0となるサブバンドは、サブバンド番号6・・・や、kなどのpより大きいサブバンド番号が該当する。データ埋め込みは、非0サブバンドの位置を変更することによって実現する。一例として、キーとなる位置kについて、挿入データgの値(“0”や“1”)に応じてある規則でサブバンドデータの位置を変更する。
たとえば、非0サブバンド成分のうち最高周波数成分の位置がpで、次に低い周波数の非0サブバンド成分の位置がq、0サブバンド成分の最高周波数(m−1)とした場合、キーとなるサブバンドkを、非0サブバンド成分qと最高周波数サブバンド(m−1)との中点に位置するサブバンドとして求める。求め方としては、k=((m−1)+q+1)/2として計算することができる。したがって、非0サブバンド成分qとサブバンドkとの間の距離、あるいは0サブバンド成分の最高周波数とサブバンドkとの間の距離lは、l=(m−1)−k=k−qとなる。
データの挿入方法としては、最高周波数に位置する2つの非0サブバンドサブバンド成分pとqの距離をd(=p−q)として、埋め込むデータが“1”の場合は、位置pにあるサブバンドデータs(p)を高周波側のk+dの位置xに移動させる。逆に、挿入データが“0”の場合は、サブバンドデータの移動は行わず、そのままにする。最高周波数の0サブバンド位置(m−1)と2番目に高周波に位置する非0サブバンド成分の位置qは挿入データに依存せずに一定であるため、データ挿入された符号化オーディオデータからこれらのデータを手がかりにデータ挿入値を検出することができる。
ここで、MPEG-1オーディオにおけるサブバンドサンプルについて図6に説明する。MPEG-1オーディオレイヤーIIでは、1秒間は38個のフレームデータで構成され(サンプリング周波数が44.1kHz の場合)、1フレームは36個のサブバンドサンプルで構成されている。また、1つのサブバンドサンプルには32個のサブバンドデータで構成されている。MPEG-1オーディオではサブバンド変換後にビット割り当てによって、各サブバンドについて聴覚心理モデルにより周波数特性やマスク効果を測定して、可聴音について、ビットが割り当てられている。このため、サブバンドサンプルにつき1ビットのデータを埋め込むことができた場合、1フレームにつき、最大36ビット埋め込むことが可能である。また、1秒間には最大36ビット×38フレーム=1368ビットの情報量を埋め込むことが可能である。サブバンドサンプルはMPEGオーディオデータの最小アクセス単位(AAU:Audio Access Unit)として用いられているため、挿入データの抽出や編集についても簡易に実現することができる。
なお、上記で説明したようなサブバンドデータの位置をずらすことにより透かしデータを挿入した場合、ビット割り当てされた位置が変わるだけであるため、全体の符号量に変化はない。また、データ挿入後もMPEG規格に準拠することが可能なため、透かし情報が入ったままの符号化データでも通常のMPEG復号器で再生することができる。なお、高周波成分にデータ挿入を行ってサブバンド情報を変更しているため、通常のMPEG復号器で再生しても聴覚的な違和感は少ない。
次に、本発明の第2の実施形態を説明する。この実施形態は、オーディオ符号化時にデータ挿入するものである。図7は、該実施形態の概略の構成を示すブロック図である。
図7において、オーディオデータaが周波数変換部21に入力され、周波数情報21aに変換される。また、オーディオデータaは、聴覚心理モデル22にも入力され、入力オーディオに対する周波数特性とマスクレベルを測定される。ビット割当部24ではこれらのデータ22aから各周波数でのビット割当量が決定される。そのビット割り当て情報24aは量子化部23に入力される。周波数変換部21から出力された周波数軸上のオーディオデータ21aは、量子化部23において、ビット割当量24aに従って、量子化の精度を決定し量子化処理を行い量子化周波数成分23aが出力される。該量子化周波数成分23aは第1のデータ挿入部25に“0”や“1”などの挿入データg(ビットデータ)と共に入力される。データ挿入された量子化周波数成分25aは符号化データ構成部26に入力されて、ヘッダ情報などデータ挿入に関連しない符号化オーディオデータと合わせて符号化データが構成されて、データ挿入されたオーディオ符号化データ26aとして出力される。
MPEG-1オーディオレイヤーII符号化におけるデータ挿入の実施例を図8に示す。オーディオデータaがサブバンド変換部31に入力され、サブバンド情報31aに変換される。また、オーディオデータaは、聴覚心理モデル32にも入力され、入力オーディオに対する周波数特性とマスクレベルを測定する。ビット割当部34ではこれらのデータ32aから各周波数でのビット割当量34aが決定される。そのビット割り当て情報は量子化部33に入力される。周波数変換部31から出力されたサブバンド上のオーディオデータ31aは、量子化部33において、ビット割当量34aに従って、量子化の精度を決定し、量子化処理を行い量子化周波数成分33aが出力される。量子化周波数成分33aは第2のデータ挿入部35に、“0”や“1”などの挿入データg(ビットデータ)と共に入力される。データ挿入された量子化周波数成分35aはMPEG符号化データ構成部36に入力されて、ヘッダ情報などデータ挿入に関連しない符号化オーディオデータと合わせて符号化データが構成されて、データ挿入されたMPEGオーディオ符号化データ36aとして出力される。
次に、本発明の第3実施形態を説明する。この実施形態は、前記第1、第2実施形態で説明したようにしてデータ挿入された符号化オーディオデータから、データ抽出して元の符号化データを出力するようにするものである。図9は、この実施形態の概略の構成を示すブロック図である。
図9において、データ挿入された符号化オーディオデータbが量子化周波数成分復元部41に入力され、量子化周波数成分41bが抽出される。また、ヘッダ情報などデータ抽出に関連のない符号化情報41cは符号化データ再構成部43に入力される。第1のデータ抽出部42では、“0”や“1”などの抽出データg(ビットデータ)が抽出されると共に、データ挿入前の量子化周波数成分42bが復元され、符号化データ再構成部43に入力される。符号化データ再構成部43では、ヘッダ情報などと共にデータ挿入前の量子化周波数成分を再構成して、データ挿入前のオーディオ符号化データ43bに完全に復元して出力する。
図10に、第1のデータ抽出部42における挿入データ抽出動作のフローを示す。ステップS31では、量子化周波数成分41bが入力され、ステップS32では、該量子化周波数成分41bから、非0成分と0成分が抽出される。ステップS33では、それらのデータからデータ抽出位置候補が決定される。図5の場合、最高周波数サブバンド(m−1)と2つ目に高い周波数の非0サブバンドqが決定される。ステップS34では、挿入データ抽出と非0成分の位置を変更する処理が行われる。例えば、キーとなる位置kが、前記最高周波数サブバンド(m−1)と2つ目に高い周波数の非0サブバンドqの中点から求められる。そして、1番高い周波数の非0サブバンド成分pが前記キーとなる位置kより大きい場合は埋め込みデータ=“1”、kより小さい場合は埋め込みデータ=“0”とされる。また、挿入データgが“1”の場合は、サブバンド位置がずらされているため、元のサブバンド位置に戻す。つまり、2つ目に高い周波数の非0サブバンドqから距離dの位置に戻す。これにより、量子化周波数成分上で量子化周波数成分の位置から透かしデータを1ビット抽出すると共に、ステップS35では、データ挿入前の量子化周波数成分を復元することができる。
図11に、MPEG-1オーディオの場合の挿入データ抽出と元のオーディオ符号化データ復元方法について示す。データ挿入されたMPEG-1符号化オーディオデータbが量子化サブバンドサンプル復元部45に入力され、量子化サブバンド成分45bが抽出される。また、ヘッダ情報などデータ抽出に関連のない符号化情報45cはMPEG-1符号化データ再構成部47に入力される。第2のデータ抽出部46では、“0”や“1”などの抽出データg(ビットデータ)が抽出されると共に、データ挿入前の量子化サブバンド成分が復元され、MPEG-1符号化データ再構成部47に入力される。該符号化データ再構成部47では、ヘッダ情報45cなどと共にデータ挿入前の量子化周波数成分を再構成して、データ挿入前のMPEG-1オーディオ符号化データ47bに完全に復元して出力する。
図12は、MPEG-1の場合における、第2のデータ抽出部46の動作を示したものである。ステップS41では、量子化サブバンドサンプル復元部45から量子化サブバンド成分45bを受け取り、ステップS42では、非0量子化サブバンド成分と0量子化サブバンド成分を抽出する。ステップS43では、それらのデータから抽出データ位置候補が決定される。ステップS44では、前記データ抽出位置候補に存在する非0サブバンド成分から挿入データg(“0”、“1”)を決定する。次に、データ挿入前の非0サブバンド成分の位置を決定し、その位置に非0サブバンド成分を変更する。これにより、量子化サブバンド成分上で量子化サブバンド成分の位置から透かしデータを1ビット抽出すると共に、ステップS45では、データ挿入前の量子化サブバンド成分を復元することができる。
図13に具体的な挿入データ1ビットの抽出方法と、元の符号化データに戻すためのサブバンドサンプルの変更方法を示す。最高周波数サブバンドがm-1、非0サブバンド成分の中で高周波側から順にサブバンドの位置をp、qとする。挿入ビット抽出でキーとなる位置kは、最高周波数サブバンド(m−1)と2つ目に高い周波数の非0サブバンドqの中点から求められる。データの抽出方法としては、pの位置がkより大きい場合は埋め込みデータ=“1”、kより小さい場合は埋め込みデータ=“0”とする。埋め込むデータが“1”の場合は、サブバンド位置がずらされているため、元のサブバンド位置に戻す。この場合、pとkの距離をd=p−kとして、位置pにあるサブバンドデータs(p)をx=q+dの位置に移動させる。逆に、挿入データが“0”の場合は、サブバンドデータの移動は行わず、そのままにする。これにより、データ抽出と同時にデータ挿入前の符号化データに復元できることがわかる。
次に、本発明の第4実施形態について説明する。この実施形態は、データ挿入された符号化オーディオデータにおける挿入データ編集(書き換え)に関するものである。図14は、この実施形態の概略の構成を示すブロック図である。
データ挿入された符号化オーディオデータdは量子化周波数成分復元部51において部分復元される。該部分復号により得られた量子化周波数成分51dは第1のデータ抽出部52に送られる。また、ヘッダ情報などデータ抽出に関連のない符号化情報51eは符号化データ再構成部54に入力される。第1のデータ抽出部52では、“0”や“1”などのビットデータが抽出されると共に、データ挿入前の量子化周波数成分52dが復元される。次に、第1のデータ挿入部53に“0”や“1”などの新たなビットデータ(書き換えデータr)と共に、先に求めたデータ挿入前の量子化周波数成分52dが入力される。データ挿入された量子化周波数成分53dは符号化データ再構成部54に入力されて、ヘッダ情報などデータ挿入に関連しない符号化オーディオデータと合わせて符号化データが構成されて、新たなデータが挿入されたオーディオ符号化データ54dとして出力される。これにより、データ挿入の値を符号化データ上で高速に書き換えて符号化データとして出力することができる。
図15を用いて、MPEG-1オーディオデータにおける挿入データの書き換えを説明する。データ挿入されたMPEGオーディオデータdは量子化サブバンド成分復元部55において部分復元され、量子化サブバンド成分55dが第2のデータ抽出部56に送られる。一方、ヘッダ情報などデータ抽出に関連のない符号化情報55eはMPEG符号化再構成部58に入力される。第2のデータ抽出部56では、“0”や“1”などのビットデータが抽出されると共に、データ挿入前の量子化サブバンド成分56dに復元される。次に、第2のデータ挿入部57に“0”や“1”などの新たなビットデータ(書き換えデータr)と共に、先に求めたデータ挿入前の量子化サブバンド成分56dが入力される。データ挿入された量子化サブバンド成分57dはMPEG符号化再構成部58に入力されて、ヘッダ情報などデータ挿入に関連しない符号化オーディオデータ55eと合わせて符号化データが構成されて、新たなデータが挿入されたMPEGオーディオ符号化データ58dとして出力される。これにより、データ挿入の値をMPEG符号化データ上で高速に書き換えてMPEG符号化データとして出力することができる。
具体的には、以下のような例のように、データ抽出プロセスとデータ挿入プロセスは、抽出されたデータや挿入するデータにより、簡略化して実現することができる。図16はデータ挿入されたMPEGオーディオデータのあるサブバンドサンプルの例で、データ“1”が挿入された状態にある。
挿入データの編集により、書き換えデータrが”0”になる場合は、挿入データがない場合と等価になるため、挿入データを抽出する場合と同様なプロセスを用いることができ、pの位置に存在するサブバンドs(p)をxの位置に変更することにより実現することができる。
次に、書き換えデータrが“0”から“1”に変更される場合は、図17のようにデータ“0”が挿入されたサブバンドサンプルは挿入データがない場合と等価なため、新たに“1”を挿入する場合と同じプロセスが利用でき、pの位置にあるサブバンドs(p)をxの位置に変更することにより実現することができる。
これらの手法では、挿入データの書き換えに伴う符号量の変化はなく、また、書き換えたあともMPEG規格に準拠することができる。
次に、本発明の第5の実施形態について説明する。前記第1,2の実施形態では、1個のデータを符号化オーディオデータへ挿入するものであったが、この実施形態は、符号化オーディオデータへ複数のデータを挿入するようにするするものである。
この実施形態は、図1、図3で示した構成で実現することができる。図18に、MPEG-1でのサブバンドサンプルにnビットを挿入する場合を示す。非0サブバンド成分が存在するサブバンドを高周波から順にpn、・・・、p1、qとする。また、キーとなるサブバンドkを1ビット挿入時と同様に最高周波数サブバンド(m−1)とqから求める。各非0サブバンド成分pi(i=1・・・n)とqとの距離di=pi-qをベースに、1ビット挿入の場合と同様に挿入するデータに応じてキーとなるサブバンドkを用いて非0サブバンド成分の位置を変更する。
もし、非0サブバンド成分piに“1”を埋め込む場合は、キーとなるサブバンドより高周波側に距離di移動した位置にサブバンドデータs(pi)を変更する(s(pi)→s(xi))。ただしxi=k+diである。また、非0サブバンド成分piに”0”を埋め込む場合は、サブバンド成分piについてはそのままにする。このようにしてサブバンドサンプルにnビットの情報を埋め込むことが可能になる。この場合も最大周波数サブバンド(m−1)と高周波側からn+1番目の非0サブバンド成分qはデータ挿入前後で不変であるため、これを手がかりに挿入データの抽出や元の符号化データへの復元や、図14、図15の構成による挿入データの編集が可能である。また、サブバンドサンプルに複数のビットが挿入可能であるため、1秒間には最大36ビット×38フレーム×nビット=1368× nビット挿入可能になる。
次に、本発明の第6の実施形態について説明する。この実施形態は、データ挿入された符号化オーディオデータからの複数のデータ抽出と元の符号化データ出力とを行えるようにしたものである。
複数のビットがある量子化周波数係数に埋め込まれた場合、図9や図11の構成で複数のビットを抽出することも可能である。
図19は、MPEG-1オーディオデータのサブバンドサンプルにnビットが挿入された場合のデータ抽出を説明するものである。この場合も最高周波数のサブバンド(m-1)と高周波からn+1番目の非0サブバンド成分qからキーとなるサブバンドkを求め、kより高周波側に存在する非0サブバンド成分piについては埋め込みデータ=“1”、kより低周波側に存在する非0サブバンド成分piについては埋め込みデータ=“0”として抽出することが可能である。これによりすべてのサブバンド成分piについて埋め込まれたデータを抽出するとともに、挿入データに応じてサブバンド成分piの位置を変更することにより、データ挿入前のMPEGオーディオデータに復元することができる。
なお、前記各実施形態では、最高周波数のサブバンド(m-1)を用いたが、本発明はこれに限定されず該最高周波数に近い周波数のサブバンド、例えば最高周波数の次に低い周波数のサブバンド(m-2)などを用いてもよい。
また、前記各実施形態では、キーとなる位置kを最高周波数の位置と特定の非0係数の位置との中点としたが、本発明はこれに限定されず、中点近傍、例えば、中点より1つ上又は下の周波数位置であってもよい。
本発明の一実施形態の概略の構成を示すブロック図である。 本実施形態のデータ挿入の動作を示すフローチャートである。 MPEG-1オーディオデータへ適用した概略の構成を示すブロック図である。 図3のデータ挿入部の動作を示すフローチャートである。 本発明の一実施例によるオーディオデータへの秘匿データ挿入方法の説明図である。 MPEG-1オーディオレイヤ2のデータ構成の説明図である。 本発明の第2実施形態のオーディオ符号化時にデータ挿入する符号化器の概略の構成を示すブロック図である。 MPEG-1オーディオ符号化器の概略の構成を示すブロック図である。 本発明の第3実施形態の、データ挿入された符号化オーディオデータからのデータ抽出方法または装置を説明するブロック図である。 図9のデータ抽出部の動作を示すフローチャートである。 MPEG-1オーディオからのデータ抽出方法または装置を説明するブロック図である。 図11のデータ抽出部の動作を示すフローチャートである。 挿入データ1ビットの抽出方法と、元の符号化データに戻すためのサブバンドサンプルの変更方法の説明図である。 データ挿入された符号化オーディオデータにおける挿入データ編集(書き換え)方法または装置を説明するブロック図である。 MPEG符号化オーディオに挿入されたデータの編集方法または装置を説明するブロック図である。 データ編集(“1”→“0”)されたサブバンドサンプルの例の説明図である。 データ編集(“0”→“1”)されたサブバンドサンプルの例の説明図である。 nビット挿入時のサブバンドサンプルの例の説明図である。 挿入されたnビットの抽出例の説明図である。
符号の説明
11・・・量子化周波数成分復元部、12、25、53・・・第1のデータ挿入部、13、54・・・符号化データ再構成部、15・・・量子化サブバンドサンプル復元部、16、35、57・・・第2のデータ挿入部、17・・・MPEG符号化データ再構成部、21・・・周波数変換部、23、33・・・量子化部、26・・・符号化データ構成部、31・・・サブバンド変換部、51・・・量子化周波数成分復元部、52・・・第1のデータ抽出部、55・・・量子化サブバンドサンプル復元部、56・・・第2のデータ抽出部、58・・・MPEG符号化再構成部。

Claims (17)

  1. 周波数変換され、さらに量子化されたオーディオデータへの秘匿データ挿入方法において、
    各量子化周波数成分のうち、最も高い周波数成分の位置(m−1)と、非0となっている量子化周波数成分の中で2番目に高い周波数成分の位置qとの中点(以下、「キー位置k」という)を求め、
    前記非0となっている量子化周波数成分の中で最も高い周波数成分の位置pを、前記キー位置kから、前記位置pと位置qとの距離dだけ高周波側へ移動することで、秘匿データを挿入することを特徴とするオーディオデータへの秘匿データ挿入方法。
  2. 請求項1に記載のオーディオデータへの秘匿データ挿入方法において、
    前記秘匿データが“1”の時には、前記位置pを前記キー位置kから前記距離dだけ高周波側へ移動し、該秘匿データが“0”の時には、前記位置pを移動しないことを特徴とするオーディオデータへの秘匿データ挿入方法。
  3. 周波数変換され、さらに量子化されたオーディオデータへの秘匿データ挿入方法において、
    各量子化周波数成分のうち、最も高い周波数成分の位置(m−1)と、非0となっている量子化周波数成分の中で(n+1)番目(ここに、nは正の整数)に高い周波数成分の位置qとの中点(以下、「キー位置k」という)を求め、
    前記非0となっている量子化周波数成分の中で最も高い周波数成分からn個の周波数成分の位置p (i=n,・・・,1)を、前記キー位置kから、前記位置p (i=n,・・・,1)と前記位置qとの距離d (i=n,・・・,1)だけ高周波側へ移動することで秘匿データ“1”を挿入し、秘匿データ“0”の場合は前記移動を行わないことにより、nビットの秘匿データを挿入することを特徴とするオーディオデータへの秘匿データ挿入方法。
  4. 請求項1ないし3のいずれかに記載のオーディオデータへの秘匿データ挿入方法において、
    前記オーディオデータの量子化周波数成分は、サブバンド符号化などにより符号化されたオーディオデータを入力し、該オーディオデータを部分復号することにより抽出されることを特徴とするオーディオデータへの秘匿データ挿入方法。
  5. 請求項1ないしのいずれかに記載のオーディオデータへの秘匿データ挿入方法において、
    前記オーディオデータの量子化周波数成分は、符号化されていないオーディオデータを入力し、符号化を行う際に、該オーディオデータをサブバンド符号化などにより周波数変換し、さらに量子化して得られることを特徴とするオーディオデータへの秘匿データ挿入方法。
  6. オーディオデータへの秘匿データ挿入装置であって、
    MPEGオーディオ符号化データの入力手段と、
    該MPEGオーディオ符号化データを部分的に復号して量子化周波数成分を抽出する量子化周波数成分抽出手段と、
    該抽出された量子化周波数成分に秘匿データを挿入する秘匿データ挿入手段と、
    該秘匿データが挿入されたデータを用いてMPEG規格に準拠したオーディオデータを再構成して出力する出力手段とを具備し、
    前記秘匿データ挿入手段は、各量子化周波数成分のうち、最も高い周波数成分の位置(m−1)と、非0となっている量子化周波数成分の中で2番目に高い周波数成分の位置qとの中点(以下、「キー位置k」という)を求め、前記非0となっている量子化周波数成分の中で最も高い周波数成分の位置pを、該秘匿データが“1“の時には、前記キー位置pから前記位置kと位置qとの距離dだけ高周波側へ移動し、該秘匿データが“0”の時には、前記位置pを移動しないことを特徴とするオーディオデータへの秘匿データ挿入装置。
  7. オーディオデータへの秘匿データ挿入装置であって、
    符号化されていないオーディオデータを入力する入力手段と、
    MPEGオーディオ符号化を行う際に、該オーディオデータをMPEGオーディオ符号化の過程で周波数変換し、さらに量子化して該オーディオデータの量子化周波数成分を求める手段と、
    該量子化周波数成分に秘匿データを挿入する秘匿データ挿入手段と、
    該秘匿データが挿入されたデータを用いてMPEG規格に準拠したオーディオデータを再構成して出力する出力手段とを具備し、
    前記秘匿データ挿入手段は、各量子化周波数成分のうち、最も高い周波数成分の位置(m−1)と、非0となっている量子化周波数成分の中で2番目に高い周波数成分の位置qとの中点(以下、「キー位置k」という)を求め、前記非0となっている量子化周波数成分の中で最も高い周波数成分の位置pを、該秘匿データが“1“の時には、前記キー位置kから前記位置pと位置qとの距離dだけ高周波側へ移動し、該秘匿データが“0”の時には、前記位置pを移動しないことを特徴とするオーディオデータへの秘匿データ挿入装置。
  8. 請求項6または7に記載のオーディオデータへの秘匿データ挿入装置において、
    前記秘匿データを挿入する手段は、各量子化周波数成分のうち、最も高い周波数成分の位置(m−1)と、非0となっている量子化周波数成分の中で(n+1)番目(ここに、nは正の整数)に高い周波数成分の位置qとの中点(以下、「キー位置k」という)を求め、
    前記非0となっている量子化周波数成分の中で最も高い周波数成分からn個の周波数成分の位置p (i=n,・・・,1)を、前記キー位置kから、前記位置p (i=n,・・・,1)と前記qとの距離d (i=n,・・・,1)だけ高周波側へ移動することで秘匿データ“1”を挿入し、秘匿データ“0”の場合は前記移動を行わないことにより、nビットの秘匿データを挿入することを特徴とするオーディオデータへの秘匿データ挿入装置。
  9. MPEGオーディオデータへの秘匿データ挿入装置であって、
    MPEGオーディオ符号化データの入力手段と、
    該MPEGオーディオ符号化データを部分的に復号して量子化周波数成分を抽出する量子化周波数成分抽出手段と、
    該抽出された量子化周波数成分に秘匿データを挿入する秘匿データ挿入手段と、
    該秘匿データが挿入されたデータを用いてMPEG規格に準拠したオーディオデータを再構成して出力する出力手段とを具備し、
    前記秘匿データ挿入手段は、各量子化周波数成分のうち、最も高い周波数成分の位置(m−1)と、非0となっている量子化周波数成分の中で2番目に高い周波数成分の位置qとの中点(以下、「キー位置k」という)を求め、前記非0となっている量子化周波数成分の中で最も高い周波数成分の位置pを、該秘匿データが“1“の時には、前記キー位置kから前記位置pと位置qとの距離dだけ高周波側へ移動し、該秘匿データが“0”の時には、前記位置pを移動しないことで、各サブバンドサンプルに1ビットの情報量を挿入することを特徴とするMPEGオーディオデータへの秘匿データ挿入装置。
  10. サブバンド符号化などで符号化されたオーディオデータを入力し、
    該オーディオデータを部分的に復号して、量子化周波数成分を抽出し、
    各量子化周波数成分のうち、最も高い周波数成分の位置(m−1)と、非0となっている量子化周波数成分の中で2番目に高い周波数成分の位置qとの中点(以下、「キー位置k」という)を求め、
    前記非0となっている量子化周波数成分の中で最も高い周波数成分の位置pが前記キー位置kより高周波側に位置するかどうかにより、秘匿データを抽出することを特徴とするオーディオデータに挿入された秘匿データの抽出方法。
  11. 請求項10に記載のオーディオデータに挿入された秘匿データの抽出方法において、
    前記位置pが前記キー位置kより高周波側に位置する場合には、秘匿データが“1”として抽出し、前記位置pが前記キー位置kより高周波側に位置しない場合には、秘匿データが“0”として抽出することを特徴とするオーディオデータに挿入された秘匿データの抽出方法。
  12. MPEGオーディオ符号化により符号化されたオーディオデータを入力する入力手段と、
    該MPEGオーディオデータを部分的に復号して、量子化周波数成分を抽出する量子化周波数成分抽出手段と、
    該量子化周波数成分抽出手段により抽出された量子化周波数成分から秘匿データを抽出する秘匿データ抽出手段とを具備し、
    前記秘匿データ抽出手段は、各量子化周波数成分のうち、最も高い周波数成分の位置(m−1)と、非0となっている量子化周波数成分の中で2番目に高い周波数成分の位置qとの中点(以下、「キー位置k」という)を求め、前記非0となっている量子化周波数成分の中で最も高い周波数成分の位置pが前記キー位置kより高周波側に位置する場合には、秘匿データが“1”として抽出し、前記位置pが前記キー位置kより高周波側に位置しない場合には、秘匿データが“0”として抽出することを特徴とするオーディオデータに挿入された秘匿データの抽出装置。
  13. MPEGオーディオ符号化により符号化されたオーディオデータを入力する入力手段と、
    該MPEGオーディオデータを部分的に復号して、量子化周波数成分を抽出する量子化周波数成分抽出手段と、
    該抽出された量子化周波数成分から秘匿データを抽出する秘匿データ抽出手段とを具備し、
    前記秘匿データ抽出手段は、各量子化周波数成分のうち、最も高い周波数成分の位置(m−1)と、非0となっている量子化周波数成分の中で(n+1)番目(ここに、nは正の整数)に高い周波数成分の位置qとの中点(以下、「キー位置k」という)を求め、前記非0となっている量子化周波数成分の位置p (i=n,・・・,1)が、前記キー位置kより高周波側に位置する場合は秘匿データが“1”として抽出し、前記高周波側に位置しない場合は“0”として抽出することで一度にnビットのデータを抽出することを特徴とするオーディオデータに挿入された秘匿データの抽出装置。
  14. 請求項2に記載のオーディオデータへの秘匿データ挿入方法により挿入された秘匿データの復元方法において、
    抽出された秘匿データが“1”の場合には、非0となっている量子化周波数成分の中で最も高い周波数成分の位置pを、2番目に高い周波数成分の位置qから、前記距離dだけ高周波側へ移動した位置に変更することを特徴とする秘匿データの復元方法。
  15. MPEGオーディオ符号化により符号化されたオーディオデータを入力する入力手段と、
    該MPEGオーディオデータを部分的に復号して、量子化周波数成分を抽出する量子化周波数成分抽出手段と、
    該抽出された量子化周波数成分から秘匿データを抽出する秘匿データ抽出手段と、
    前記抽出された秘匿データを復元する復元手段とを具備し、
    前記秘匿データ抽出手段は、各量子化周波数成分のうち、最も高い周波数成分の位置(m−1)と、非0となっている量子化周波数成分の中で2番目に高い周波数成分の位置qとの中点(以下、「キー位置k」という)を求め、前記非0となっている量子化周波数成分の中で最も高い周波数成分の位置pが前記キー位置kより高周波側に位置する場合には、秘匿データが“1”として抽出し、前記位置pが前記キー位置kより高周波側に位置しない場合には、秘匿データが“0”として抽出し、
    前記復元手段は、前記抽出された秘匿データが“1”の場合には、非0となっている量子化周波数成分の中で最も高い周波数成分の位置pを、2番目に高い周波数成分の位置qから、前記位置pと位置qとの距離dだけ高周波側へ移動した位置に変更することを特徴とするオーディオデータに挿入された秘匿データの復元装置。
  16. 請求項2に記載のオーディオデータへの秘匿データ挿入方法により挿入された秘匿データの編集方法において、
    抽出された秘匿データ“1”を“0”に変更する場合には、非0となっている量子化周波数成分の中で最も高い周波数成分の位置pを、2番目に高い周波数成分の位置qから、前記距離dだけ高周波側へ移動した位置に変更し、抽出された秘匿データ“0”を“1”に変更する場合には、前記位置pを前記キー位置kから前記距離dだけ高周波側へ移動することを特徴とする秘匿データの編集方法。
  17. MPEGオーディオ符号化データの入力手段と、
    該MPEGオーディオ符号化データを部分的に復号して量子化周波数成分を抽出する量子化周波数成分抽出手段と、
    該抽出された量子化周波数成分から秘匿データを抽出する秘匿データ抽出手段と、
    前記抽出された秘匿データを編集する編集手段と、
    該編集されたデータを用いてMPEG規格に準拠したオーディオデータを再構成して出力する出力手段とを具備し、
    前記秘匿データ抽出手段は、各量子化周波数成分のうち、最も高い周波数成分の位置(m−1)と、非0となっている量子化周波数成分の中で2番目に高い周波数成分の位置qとの中点(以下、「キー位置k」という)を求め、前記非0となっている量子化周波数成分の中で最も高い周波数成分の位置pが前記キー位置kより高周波側に位置する場合には、秘匿データが“1”として抽出し、前記位置pが前記キー位置kより高周波側に位置しない場合には、秘匿データが“0”として抽出し、
    前記編集手段は、前記抽出された秘匿データ“1”を“0”に変更する場合には、非0となっている量子化周波数成分の中で最も高い量子化周波数成分の位置pを、2番目に高い量子化周波数成分の位置qから、前記距離dだけ高周波側へ移動した位置に変更し、抽出された秘匿データ“0”を“1”に変更する場合には、前記位置pを前記キー位置kから前記位置pと位置qとの距離dだけ高周波側へ移動することを特徴とする秘匿データの編集装置。
JP2006187925A 2006-07-07 2006-07-07 オーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法、秘匿データ編集方法、mpegオーディオ符号化データへの秘匿データ挿入装置、秘匿データ抽出装置、mpegオーディオ復元装置、および挿入データ編集装置。 Active JP4830172B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006187925A JP4830172B2 (ja) 2006-07-07 2006-07-07 オーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法、秘匿データ編集方法、mpegオーディオ符号化データへの秘匿データ挿入装置、秘匿データ抽出装置、mpegオーディオ復元装置、および挿入データ編集装置。

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006187925A JP4830172B2 (ja) 2006-07-07 2006-07-07 オーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法、秘匿データ編集方法、mpegオーディオ符号化データへの秘匿データ挿入装置、秘匿データ抽出装置、mpegオーディオ復元装置、および挿入データ編集装置。

Publications (2)

Publication Number Publication Date
JP2008015326A JP2008015326A (ja) 2008-01-24
JP4830172B2 true JP4830172B2 (ja) 2011-12-07

Family

ID=39072388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006187925A Active JP4830172B2 (ja) 2006-07-07 2006-07-07 オーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法、秘匿データ編集方法、mpegオーディオ符号化データへの秘匿データ挿入装置、秘匿データ抽出装置、mpegオーディオ復元装置、および挿入データ編集装置。

Country Status (1)

Country Link
JP (1) JP4830172B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4226687B2 (ja) * 1998-05-01 2009-02-18 ユナイテッド・モジュール・コーポレーション 電子透かし埋め込み装置及びオーディオ符号化装置
JP3765413B2 (ja) * 2002-07-12 2006-04-12 ソニー株式会社 情報符号化装置および方法、情報復号装置および方法、記録媒体、並びにプログラム

Also Published As

Publication number Publication date
JP2008015326A (ja) 2008-01-24

Similar Documents

Publication Publication Date Title
JP5384780B2 (ja) 無損失オーディオ符号化方法、無損失オーディオ符号化装置、無損失オーディオ復号化方法、無損失オーディオ復号化装置及び記録媒体
US6493457B1 (en) Electronic watermarking in the compressed domain utilizing perceptual coding
KR100561869B1 (ko) 무손실 오디오 부호화/복호화 방법 및 장치
DK1878010T3 (en) VERIFICATION OF SOUND METADATA
JP5048680B2 (ja) オーディオ信号の符号化及び復号化方法、オーディオ信号の符号化及び復号化装置
JP4359312B2 (ja) 信号の符号化装置、復号化装置、方法、プログラム、記録媒体、及び信号のコーデック方法
JP4063508B2 (ja) ビットレート変換装置およびビットレート変換方法
CN106415713B (zh) 用于对音频透明无损地加水印的方法
JP2007523365A (ja) ビットストリーム処理方法
Lacy et al. On combining watermarking with perceptual coding
US9015042B2 (en) Methods and systems for avoiding partial collapse in multi-block audio coding
JP2009516402A (ja) 符号化/復号化方法及び装置
US6601032B1 (en) Fast code length search method for MPEG audio encoding
KR100618359B1 (ko) 계층 로스리스 부호화 및 복호화 방법, 계층 로스리스 부호화 방법, 계층 로스리스 복호화 방법, 그 장치 및 컴퓨터-판독가능 기록매체
JP2007503026A (ja) サブバンドフィルタ処理を用いた透かし埋め込みの装置と方法
KR100891666B1 (ko) 믹스 신호의 처리 방법 및 장치
JP4830172B2 (ja) オーディオデータへの秘匿データ挿入方法、秘匿データ抽出方法、秘匿データ編集方法、mpegオーディオ符号化データへの秘匿データ挿入装置、秘匿データ抽出装置、mpegオーディオ復元装置、および挿入データ編集装置。
EP2680261B1 (en) Method and apparatus for watermarking an AC-3 encoded bit stream
Cheng et al. Error concealment of mpeg-2 aac audio using modulo watermarks
JP3617804B2 (ja) Pcm信号符号化装置及び復号化装置
JP4705685B2 (ja) 信号の符号化装置、復号化装置、方法、プログラム、および記録媒体
KR100947065B1 (ko) 무손실 오디오 부호화/복호화 방법 및 장치
Wang et al. A novel data hiding algorithm for MP3 audio
JP5455222B2 (ja) ディジタルオーディオ信号の音質劣化装置、音質回復装置、及び音質劣化・回復システム
JP2007006337A (ja) 信号の符号化装置、方法、プログラム、記録媒体、および信号のコーデック方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110810

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110902

R150 Certificate of patent or registration of utility model

Ref document number: 4830172

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250