JP2014521112A - 入力信号に透かし入れするための量子化インデックス変調の方法および装置 - Google Patents

入力信号に透かし入れするための量子化インデックス変調の方法および装置 Download PDF

Info

Publication number
JP2014521112A
JP2014521112A JP2014517623A JP2014517623A JP2014521112A JP 2014521112 A JP2014521112 A JP 2014521112A JP 2014517623 A JP2014517623 A JP 2014517623A JP 2014517623 A JP2014517623 A JP 2014517623A JP 2014521112 A JP2014521112 A JP 2014521112A
Authority
JP
Japan
Prior art keywords
quantization
signal
frame
current
curve
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2014517623A
Other languages
English (en)
Other versions
JP2014521112A5 (ja
Inventor
ジャックス,ピーター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2014521112A publication Critical patent/JP2014521112A/ja
Publication of JP2014521112A5 publication Critical patent/JP2014521112A5/ja
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

量子化インデックス変調QIMでは、非常に高いデータ・レートを達成することが可能であり、透かし伝送の容量はほとんどもとのオーディオ信号の特性とは独立である。しかしながら、オーディオ品質は透かし埋め込みおよび除去ステップのたびに劣化を受ける。オーディオ品質の劣化を避けるために、本発明のオーディオ信号透かし入れは、透かしメッセージをオーディオ信号中に埋め込むために、時間領域におけるおよび特に変換領域における特定の量子化曲線を使い、それにより本処理はほとんど完璧に可逆となる。さらに、透かし埋め込みに起因するオーディオ信号の修正が聞いてわからないことを保証するために、パワー制約を組み込んだ。

Description

本発明は、入力信号に透かし入れするための量子化インデックス変調の方法および装置であって、前記入力信号を量子化するために種々の量子化手段曲線が使われるものに関する。
既知のデジタル・オーディオ信号透かし入れでは、透かしの埋め込みおよび除去ステップごとにオーディオ品質が劣化を受ける。
マルチメディア・コンテンツの透かし入れのための主要なアプローチの一つは、量子化インデックス変調(quantisation index modulation)と呼ばれ、QIMと記される。たとえば非特許文献1または非特許文献2参照。
QIMでは、非常に高いデータ・レートを達成することが可能であり、透かし伝送の容量はほとんどもとのオーディオ信号の特性とは独立である。
非特許文献1に記載されるQIMにおいては、入力値xは量子化によって離散的な出力値y=Qm(x)にマッピングされ、それにより各透かしメッセージmについて、異なる量子化手段(quantiser)Qmが選ばれる。したがって、検出器はあらゆる可能な量子化手段を試し、最小の量子化誤差をもつ量子化手段を見出すことによって透かしメッセージを検出することができる。
上記の非特許文献2は、特定の透かしチャネルにおけるよりよい容量を達成するためにQIMへの拡張を提案した。このα-QIMでは、すべての入力値xは参照値に向かって(すなわち、量子化手段の重心に向かって)一定の因子により線形にシフトされる。透かし入れされた出力値yは、y=Qm(x)+α(x−Qm(x))にによって計算されるものと考えることができる。
国際公開第2007/031423A1号 国際公開第2006/128769A2号 国際公開第2007/031423A1号
B. Chen, G.W. Wornell、"Quantization Index Modulation: A Class of Provably Good Methods for Digital Watermarking and Information Embedding"、IEEE Transaction on Information Theory, vol.47(4), pp.1423-1443、May 2001 J.J. Eggers, J.K. Su, B. Girod、"A Blind Watermarking Scheme Based on Structured Codebooks"、Proc. of the IEE Colloquium on Secure Images and Image Authentication, pp.1-6, 10 April 2000, London, GB ITV Recommendation BS.1387 (PEAQ)
非特許文献1の処理は、量子化段階において情報が失われるので、定義により不可逆である。非特許文献2の処理は可逆だが、いかなる時間変化する歪み制約条件(time-variable distortion constraint)も受けない。
本発明によって解決されるべき課題は、既知のQIM処理を改善することによって透かしの埋め込みおよび除去のたびにオーディオ品質が劣化するのを避けることである。
この問題は、請求項1に開示される量子化方法によって解決され、この方法を利用する装置は請求項2に開示される。対応する再現のための方法は請求項8に開示されている。
本発明のオーディオ信号透かし入れは、透かしメッセージをオーディオ信号中に埋め込むために、時間領域におけるおよび特に変換領域における特定の量子化手段曲線(quantiser curves)を使い、それによりほとんど完璧に可逆となる。「可逆」という用語は、高い(すなわちほとんどビット単位で正確な)品質をもってもとのPCMサンプルを復元するために透かしが除去できることを意味する。その前提条件は、透かし入れされたオーディオ信号が著しい信号修正を受けていないことと、透かしの検出のために必要とされる秘密鍵が既知であるということである。
本発明の可逆な量子化インデックス変調透かし入れ処理は、パワー制約条件を埋め込んだ。これは、オーディオ透かし入れでは、透かし埋め込みに起因する信号の修正が可聴でないことを保証するために、重要である。
有利なことに、本発明の処理は、現状技術の不可逆な透かし入れ方式に負けない堅牢さおよび容量特性を提供し、本発明は、データ・レート、堅牢さおよび透かし方式の計算量の観点で著しいペナルティなしに、透かし埋め込みプロセスを反転することを許容する。ここで、透かし埋め込みプロセスの反転は、ほとんど厳密に、もとのPCMオーディオ信号を与える。
原理的には、本発明の量子化方法は、入力信号xに透かし入れするための量子化インデックス変調に好適である。ここで、種々の量子化手段曲線Qmが前記入力信号xを量子化するために使われ、前記量子化手段曲線の現在の特性が、透かしメッセージmの現在の内容によって制御され、前記量子化において、どの位置でも入力値と出力値の間の差がTより大きくなく、前記諸量子化曲線Qmは、任意の入力値xについて一意的な出力値yがあるという意味で可逆であり、
±Tは前記量子化手段曲線Qmの外側セクションのy=0に向けたyシフトを定義する値であり、前記入力信号xの現在の音響心理学的なマスキング・レベルによって決定され、yは透かし入れされた出力信号であり、前記種々の量子化手段曲線Qmは、x方向における完全な量子化手段曲線の種々のシフトによってmの現在値に従って確立される。
特に、前記量子化は、y=Qm(x)+max(−T,min(T,α(x−Qm(x))))に従って実行されることができる。ここで、αは前記量子化手段曲線Qmの中間セクションの所定の急峻さであり、±Tは前記量子化手段曲線Qmの他のセクションのy=0に向けたyシフトを定義する値であり、前記入力信号xの現在の音響心理学的なマスキング・レベルによって決定され、yは透かし入れされた出力信号である。
原理的には、本発明の量子化装置は、入力信号xに透かし入れするための量子化インデックス変調に好適である。ここで、種々の量子化手段曲線Qmが前記入力信号xを量子化するために使われ、前記量子化手段曲線の現在の特性が、透かしメッセージmの現在の内容によって制御され、当該装置は:
・音響心理学的マスキング・レベル計算器と;
・どの位置でも入力値と出力値の間の差がTより大きくない前記量子化を実行する埋め込み器とを含み、前記諸量子化曲線Qmは、任意の入力値xについて一意的な出力値yがあるという意味で可逆であり、
±Tは前記量子化手段曲線Qmの外側セクション(I,III)のy=0に向けたyシフトを定義する値であり、前記入力信号xの現在の音響心理学的なマスキング・レベルによって決定され(26)、yは透かし入れされた出力信号であり、
前記種々の量子化手段曲線Qmは、x方向における完全な量子化手段曲線の種々のシフトによってmの現在値に従って確立される。
特に、前記量子化は、y=Qm(x)+max(−T,min(T,α(x−Qm(x))))に従って実行されることができる。ここで、αは前記量子化手段曲線Qmの中間セクションの所定の急峻さであり、±Tは前記量子化手段曲線Qmの他のセクションのy=0に向けたyシフトを定義する値であり、前記入力信号xの現在の音響心理学的なマスキング・レベルによって決定され、yは透かし入れされた出力信号である。
原理では、本発明の再現方法は、前記本発明の量子化方法に従って処理されたもとの入力信号xを再現するのに好適であり、当該方法は:
・前記量子化手段曲線Qmを対応する仕方で使ってy=Qm(x)+max(−T,min(T,α(x−Qm(x))))に従って受領された透かし入れされた信号を再量子化する段階であって、x方向における完全な量子化手段曲線の種々のシフトを適用することによって種々の候補量子化手段曲線Qmが検査され、前記再量子化は、もともと適用されたビット深さより大きなビット深さで実行される、段階と;
・周波数領域において最もよく一致する候補量子化手段曲線Qmを選択する段階と;
・そのようにして決定された現在のQmに基づいて、対応する現在の透かしmを信号yから除去してそれにより前記再現された信号xを提供する段階とを含む。
本発明の例示的な実施形態について、付属の図面を参照して述べる。
埋め込みパワー制約をもつ可逆QIM量子化手段曲線の例を示す図である。 本発明に基づく埋め込み器の信号フローを示す図である。 既知の位相ベースのオーディオWMのオーバーマーキング・パフォーマンスを示す図である。 本発明に基づくオーバーマーキング・パフォーマンスを示す図である(攻撃なし)。
〈埋め込みパワー制約をもつ可逆QIM透かし入れ〉
本発明は、
・埋め込み器において実行されたマッピングを、復号器において可逆にするとともに、
・透かしを埋め込むときにパワー制約を考慮することを許容する
ためにQIMを拡張する。
量子化手段の関係する特性曲線は、次の二つの制約条件を満たさなければならない:
・どの位置でも入力と出力値の間の差がTより大きくない(埋め込みパワー制約)、
・特性曲線は可逆でなければならない。すなわち、任意の入力値xについて、一意的な出力値yがなければならない。
埋め込みパワー制約をもつ本発明の可逆QIM処理のための量子化手段の一つのための特性曲線の例が、出力y対入力xとして図1に示されている。この曲線は、図の上部においてマークされた三つの線形セグメントI、II、IIIに分割できる。セグメントIおよびIIIでは、出力はTだけ参照値に向かって、すなわちy=0に向かってシフトされる。その結果、y1=x+Tであり、y3=x−Tとなる。シフトはパワー制約のため、より大きくなることはできない。セグメントIIでは、勾配αをもって線形曲線が使用される。その結果、y2=αxとなり、遷移点はP1=(T/1−α,αT/1−α)およびP2=−P1となる。すなわち、αの選択が三つのセグメントの間の遷移点P1およびP2を決定する。αが大きいほど、セグメントIIによってカバーされる範囲が大きくなる。
この例示的な特性曲線の計算は、スカラー入力値について、
y=Qm(x)+max(−T,min(T,α(x−Qm(x))))
によって定義される。ここで、mは透かしメッセージを表し、Qmはメッセージmを埋め込むために使われる種々の量子化手段の曲線を表す。たとえば、mの「0」のビットについてある量子化手段曲線および「1」のビットについて異なる量子化手段曲線である。
αの値はある用途では固定され、αの選択はトレードオフである。αが「1」に近ければ、埋め込まれた透かしの堅牢さは、αのより小さい値の場合より劣る可能性が高い。参照値に向けた平均シフトが可能なより小さくなるからである。他方、αの値が大きいほど、ノイズのある条件で埋め込み器の特性曲線を反転させる可能性がよくなる。Tの値は、入力信号の現在の音響心理学的マスキング・レベルに適応される。
図1の特性曲線は、入力値の参照値に向けた平均シフトを最大化するよう設計されている。種々の量子化手段曲線Qmは、mの現在値に従って、完全な量子化手段曲線のx方向における種々のシフトsxmによって確立される。上記の二つの制約条件を満たす限り、他の特性曲線も可能である。
〈MDCT領域における埋め込み〉
完全にまたはほとんど可逆なオーディオ透かし入れシステムを設計するためには、完璧な再構成属性をもつフィルタバンクを利用することが必要とされる。さらに、そのような用途では、フィルタバンク係数(たとえばMDCT周波数ビン)が互いに独立であればきわめて有利である。つまり、(埋め込みプロセスにおける)一つの係数のいかなる修正も、デコーダ側で厳密に同じ係数に影響するだけであることが望まれる(分析のために使われる信号セグメントの完璧な同期を想定している)。他の(近くの)係数とのいかなる干渉も回避される必要がある。こうした属性をもつ一つの例示的なフィルタバンクはMDCTである。
本発明の埋め込み器の対応する例示的な実施形態が図2に示されている。上の信号経路は、透かし入れされた信号から同様に決定できる加法的透かし信号を決定するために使われ、MDCTステップまたは段21と、2フレーム組み合わせステップ/段22と、上記の本発明の量子化を実行する埋め込み器23であって、Tの(現在)値がステップ/段22の出力からその入力を受け取る音響心理学的分析器26によって制御される、埋め込み器と、2フレーム拡散ステップ/段24と、逆MDCTステップ/段25と、IMDCTステップ/段25の出力をMDCTステップ/段21の入力信号と加算する組み合わせ器とを含む。
〈擬似複素スペクトルの定義〉
本発明の量子化処理は時間領域で実行できるが、好ましくは信号処理は周波数領域で行われる。すなわち、入力信号はMDCT分析ブロックに供給され、出力透かし信号は逆MDCTを介して生成される。MDCT/IMDCTの代わりに、他の任意の好適な時間領域から周波数領域/周波数領域から時間領域への変換が使用されることができる。それは、時間領域信号の完璧な(すなわちビット単位で厳密な)再構成を許容しなければならない。本発明によれば、二つの相続くMDCTフレームが一つの複素スペクトルの実部および虚部と解釈される。数学的に厳密には、この解釈は誤りである。だが、これは、透かしを埋め込む目的のために角スペクトル(angular spectrum)を定義することを許容する。実際の透かし埋め込みは、特許文献1、特許文献2または特許文献3において記述されている処理に対応する。透かし情報を挿入するために、擬似複素スペクトルの角度(すなわち位相)のみが、入力信号の音響心理学的分析によって与えられる制約条件に従って修正される。
MDCT領域における擬似複素信号の上記の定義は、特許文献1、特許文献2または特許文献3で使われるようなDFT領域における実の角度スペクトルに比べ、いくつかの利点をもつ。
・MDCTフィルタバンクの直交性のため、すべてのMDCT係数が互いと完全に独立であり、よって角度スペクトル解釈のすべての複素係数も独立である。上記で動機付けられたように、これは可逆透かし入れのための前提条件である。
・擬似複素スペクトルの角度だけが透かしを埋め込むために修正され、音響心理学的分析のためには振幅だけが必要とされるので、もとの入力信号および透かし入れた信号どちらについての音響心理学的分析の結果も完璧に同一である。ここでもまた、これは埋め込みプロセスの可逆性のために必要とされる。
〈埋め込みプロセス〉
透かしメッセージmの埋め込みは、図1との関連で述べた埋め込みパワー制約をもつ本発明の可逆QIMに従って実行される。もとの信号の音響心理学的分析が、擬似複素スペクトルの個々の係数の角度または位相の最大修正を導出するために使われる。これらの最大値が、〈埋め込みパワー制約をもつ可逆QIM透かし入れ〉の節の特性曲線で使われた制約条件Tを構成する。
その節の埋め込み曲線への入力値xは擬似複素スペクトルの角度であり、出力値yは、(MDCT領域において)加法的な透かしのみ信号y−xの角度を導出するために使われる。参照角度は、特許文献1、特許文献2または特許文献3において記述された原理に従って擬似ノイズ・シーケンスから導出される。二つの相続くMDCTスペクトルによって定義される複素数値の振幅は、透かし埋め込み器によって修正されない。
(前段で説明したy−xに基づく)新しい角度は、複素解釈の振幅と合わされて、再び二つの実数値の相続くMDCTスペクトルに分離される。加法的透かし信号を生成するために、MDCTスペクトルの結果として得られるストリームが逆MDCTフィルタバンク25に供給される。
〈可逆性〉
透かしプロセスが可逆なのは、加法的透かし信号を導出するために適用されるすべての分析ステップが透かしの埋め込みに対して不変であるからである。つまり、同じ加法的透かし信号が、もとの信号からも透かし入れされた信号からも導出されることができる。しかしながら、この属性には二つの前提条件がある。
・透かし入れされた信号は著しく改変されてはならない。本格的な攻撃または信号修正は、透かし信号の計算の再現性に影響する。
・除去される透かしメッセージの検出が誤りなしである必要がある。いかなる検出エラーも、誤った透かし修正の反転につながる。上記の条件とともに、これは、透かし処理が、攻撃なしまたは軽微な攻撃については、100%エラーなしの検出結果をもつ必要があることを意味する。
実際上は、埋め込み器の透かし入れされた出力信号が整数値に量子化される場合、透かし埋め込みプロセスは典型的には100%可逆ではない。たとえば、透かし入れされた信号が16ビット整数に量子化される場合、透かし除去器の出力信号は、もとのPCMサンプルに比べ、この16ビット量子化器の量子化ノイズを受ける。
〈実際上のシステムのオーバーマーキング・パフォーマンス〉
上記の例示的なシステムが構築され、オーバーマーキング・パフォーマンス数値を決定するために使われた。用語「オーバーマーキング(overmarking)」は、透かしの埋め込みおよび除去のシーケンスが一つのもとのオーディオ信号に適用されたことを意味する。
典型的には、信号の品質は、相続くオーバーマーキングの回数に従って劣化する。図3は、特許文献1、特許文献2または特許文献3に基づく位相ベースの透かし入れのパフォーマンスの例を示している。パフォーマンス指標は、客観差分等級(objective difference grade)ODGである(ODG値がより低いことはより悪い信号品質を示す;ODGは非特許文献3において記述されている)。ODGは、何回かのオーバーマーキング・ステップ後の、もとのオーディオ信号と透かし入れされた信号との間の主観的な差を推定する。ODGは0=気づかれないほどの歪み から3=わずらわしい、4=きわめてわずらわしいまでの範囲がある。かなりの数のオーバーマーキング後には、透かし入れされた信号の品質が著しく低下することが明確に見て取れる。
比較のために、図4は、図2に記述される実施形態を使っての同じ入力信号についての本発明の処理についての対応するオーバーマーキング・パフォーマンスを示している(攻撃なし、つまり透かし入れされた信号は修正されていない)。透かし入れされた信号の主観的品質は、100回のオーバーマーキング・ステップ後でさえ本質的に一定のままである。各オーバーマーキング・ステップについてのODGのノイズ様のゆらぎは、各オーバーマーキングについて、異なる埋め込み鍵(すなわち参照シーケンス)が適用されたという事実によって生じている。これが透かし入れされた信号の異なる主観的品質につながるのである。
〈完全に可逆な(ビット単位で厳密な)オーディオ透かし入れ〉
ある特殊な実施形態では、上記の原理は、透かしの完全な除去を提供するために適用されることもできる。これは、高い確率で、ビットレベルで正確な埋め込み器のもとの入力PCMサンプルを与える。この目的のため、図2に描かれたシステムにおいて、加算器27の出力において、埋め込み器の出力信号が、埋め込み側と同様に種々の候補量子化手段曲線を用いて、ただしもとの埋め込み器側の入力PCMサンプルのビット深さ(たとえばサンプル当たり16ビット)より一貫して高いビット深さ(たとえばサンプル当たり24ビット)を用いて、量子化される。実際のQM曲線は、上記のようにMDCT領域で決定される。そのように決定された現在のQmに基づいて、対応する現在の透かしメッセージmが信号yから除去され、再現された信号xを与える。上記で説明したように、透かしの除去は、透かし入れされた信号の量子化からの量子化ノイズを受けるPCMサンプルにつながる。記載される処理では、この量子化ノイズは透かし除去器のより高いビット深さ出力信号のいくつかのLSBに影響するだけである。したがって、この出力信号は、入力PCMサンプルのもとの精度(上記の例ではサンプル当たり16ビット)に量子化されることができる。これは、量子化ノイズによる損傷を除去し、もとのPCMサンプルを復元する。
本発明は次のような応用のために使用できる。
・オーディエンス測定を含むプロフェッショナルな作業フローにおけるコンテンツ追跡および法的鑑定;
・マークおよび関連する権利が透かしを交換することにより修正できる知的なDRM(digital rights management[デジタル権利管理]);
・コンテンツの可逆な劣化;
・ビデオ透かし入れ。
本発明の処理は、拡散スペクトル・ベースの透かし入れ技法との関連で使われることもできる。

Claims (11)

  1. 入力信号xに透かし入れするための量子化インデックス変調の方法であって、種々の量子化手段曲線Qmが前記入力信号xを量子化するために使われ、前記量子化手段曲線の現在の特性が、透かしメッセージmの現在の内容によって制御され、前記量子化において、どの位置でも入力値と出力値の間の差がTより大きくなく、前記諸量子化曲線Qmは、任意の入力値xについて一意的な出力値yがあるという意味で可逆であり、
    ±Tは前記量子化手段曲線Qmの外側セクション(I,III)のy=0に向けたyシフトを定義する値であり、前記入力信号xの現在の音響心理学的なマスキング・レベルによって決定され(26)、yは透かし入れされた出力信号であり、
    前記種々の量子化手段曲線Qmは、x方向における完全な量子化手段曲線の種々のシフトによってmの現在値に従って確立される、
    ことを特徴とする方法。
  2. 入力信号xに透かし入れするための量子化インデックス変調の装置であって、種々の量子化手段曲線Qmが前記入力信号xを量子化するために使われ、前記量子化手段曲線の現在の特性が、透かしメッセージmの現在の内容によって制御され、当該装置は:
    ・音響心理学的マスキング・レベル計算器(26)と;
    ・どの位置でも入力値と出力値の間の差がTより大きくない前記量子化を実行する埋め込み器(23)とを含み、前記諸量子化曲線Qmは、任意の入力値xについて一意的な出力値yがあるという意味で可逆であり、
    ±Tは前記量子化手段曲線Qmの外側セクション(I,III)のy=0に向けたyシフトを定義する値であり、前記入力信号xの現在の音響心理学的なマスキング・レベルによって決定され(26)、yは透かし入れされた出力信号であり、
    前記種々の量子化手段曲線Qmは、x方向における完全な量子化手段曲線の種々のシフトによってmの現在値に従って確立される、
    ことを特徴とする装置。
  3. 前記量子化は、y=Qm(x)+max(−T,min(T,α(x−Qm(x))))に従って実行され(23)、αは前記量子化手段曲線Qmの中間セクション(II)の所定の急峻さであり、±Tは前記量子化手段曲線Qmの他のセクション(I,III)のy=0に向けたyシフトを定義する値であり、前記入力信号xの現在の音響心理学的なマスキング・レベルによって決定され(26)、yは透かし入れされた出力信号である、請求項1記載の方法または請求項2記載の装置。
  4. 前記量子化が周波数領域で実行される、請求項1もしくは3記載の方法または請求項2もしくは3記載の装置。
  5. 請求項4記載の方法であって、前記量子化に先立って、前記入力信号xは時間から周波数への変換(21)および相続くフレーム対毎の組み合わせ(22)を通され、前記フレーム対の一方のフレームは一つの現在フレームの実部を表すものとして扱われ、他方のフレームはその現在フレームの虚部を表すものとして扱われ、量子化(23)された入力信号は相続くフレーム対毎の拡散(24)を通され、前記フレーム対の一方のフレームは一つの現在フレームの実部を表すものとして扱われ、他方のフレームはその現在フレームの虚部を表すものとして扱われ、周波数から時間への変換(25)を通されて前記透かし入れされた出力信号yを形成する方法、
    または、
    請求項4記載の装置であって、
    ・前記埋め込み器(23)の前に配置され、時間から周波数への変換およびフレーム対組み合わせのために適応された手段(21、22)であって、相続くフレーム対毎の一方のフレームは一つの現在フレームの実部を表すものとして扱われ、他方のフレームはその現在フレームの虚部を表すものとして扱われる、手段と、
    ・前記埋め込み器(23)の後に配置され、相続くフレーム対毎の拡散をするよう適応された手段(24、25)であって、前記フレーム対の一方のフレームは一つの現在フレームの実部を表すものとして扱われ、他方のフレームはその現在フレームの虚部を表すものとして扱われ、前記手段(24、25)はまた、周波数から時間への変換(25)により前記透かし入れされた出力信号yを形成するよう適応されている、
    装置。
  6. 前記時間から周波数への変換がMDCTであり、前記周波数から時間への変換がIMDCTである、請求項5記載の方法または請求項5記載の装置。
  7. 前記出力信号yが前記入力信号xの位相修正を制御する、請求項1および3ないし6のうちいずれか一項記載の方法または請求項2ないし6のうちいずれか一項記載の装置。
  8. 前記入力信号xがオーディオ信号である、請求項1および3ないし7のうちいずれか一項記載の方法または請求項2ないし7のうちいずれか一項記載の装置。
  9. 請求項3ないし8のうちいずれか一項記載の方法に従って処理されたもとの入力信号xを再現する方法であって、当該方法は:
    ・前記量子化手段曲線Qmを対応する仕方で使ってy=Qm(x)+max(−T,min(T,α(x−Qm(x))))に従って受領された透かし入れされた信号を再量子化する段階であって、x方向における完全な量子化手段曲線の種々のシフトを適用することによって種々の候補量子化手段曲線Qmが検査され、前記再量子化は、もともと適用されたビット深さより大きなビット深さで実行される、段階と;
    ・周波数領域において最もよく一致する候補量子化手段曲線Qmを選択する段階と;
    ・そのようにして決定された現在のQmに基づいて、対応する現在の透かしmを信号yから除去してそれにより前記再現された信号xを提供する段階とを含む、
    方法。
  10. 請求項1および3ないし8のうちいずれか一項記載の方法に従ってエンコードされたデジタル・オーディオまたはビデオ信号。
  11. 請求項10記載のデジタル・オーディオまたはビデオ信号を含むまたは記憶しているまたは記録している記憶媒体、たとえば光ディスク。
JP2014517623A 2011-07-08 2012-06-25 入力信号に透かし入れするための量子化インデックス変調の方法および装置 Ceased JP2014521112A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP11305883A EP2544179A1 (en) 2011-07-08 2011-07-08 Method and apparatus for quantisation index modulation for watermarking an input signal
EP11305883.8 2011-07-08
PCT/EP2012/062194 WO2013007500A1 (en) 2011-07-08 2012-06-25 Method and apparatus for quantisation index modulation for watermarking an input signal

Publications (2)

Publication Number Publication Date
JP2014521112A true JP2014521112A (ja) 2014-08-25
JP2014521112A5 JP2014521112A5 (ja) 2015-08-13

Family

ID=46397234

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014517623A Ceased JP2014521112A (ja) 2011-07-08 2012-06-25 入力信号に透かし入れするための量子化インデックス変調の方法および装置

Country Status (7)

Country Link
US (1) US10019997B2 (ja)
EP (2) EP2544179A1 (ja)
JP (1) JP2014521112A (ja)
KR (1) KR20140041696A (ja)
CN (1) CN103650039B (ja)
BR (1) BR112014000356A2 (ja)
WO (1) WO2013007500A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014165172A1 (en) * 2013-03-12 2014-10-09 Nipro Diagnostics, Inc. Wireless pairing of personal health device with a computing device
CN104064193B (zh) * 2013-03-21 2016-12-28 中国科学院声学研究所 一种线性预测语音编码的信息隐藏方法与提取方法
GB2524784B (en) 2014-04-02 2018-01-03 Law Malcolm Transparent lossless audio watermarking
US10410643B2 (en) * 2014-07-15 2019-09-10 The Nielson Company (Us), Llc Audio watermarking for people monitoring
GB2546963B (en) 2015-12-23 2020-10-21 Law Malcolm Transparent lossless audio watermarking enhancement
KR102021739B1 (ko) * 2018-06-04 2019-11-05 채령 양자암호키로 생성한 암호화 제품정보 데이터와 해시함수 2차 행렬 (x,y) 좌표 값으로 마킹하는 복제 위변조 방지 양자암호마킹기 및 양자암호마킹 물품관리 시스템
CN110619883B (zh) * 2019-08-23 2023-05-23 平安科技(深圳)有限公司 音乐的信息嵌入方法、提取方法、装置、终端及存储介质
CN113362835B (zh) * 2020-03-05 2024-06-07 杭州网易云音乐科技有限公司 音频水印处理方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050033579A1 (en) * 2003-06-19 2005-02-10 Bocko Mark F. Data hiding via phase manipulation of audio signals
JP2008502194A (ja) * 2004-06-02 2008-01-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 補助情報をメディア信号に埋め込む方法及び装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10129239C1 (de) * 2001-06-18 2002-10-31 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
US20030161469A1 (en) * 2002-02-25 2003-08-28 Szeming Cheng Method and apparatus for embedding data in compressed audio data stream
AU2002951815A0 (en) 2002-10-03 2002-10-24 Canon Kabushiki Kaisha Mark embedding and detection using projective transforms
WO2006052220A1 (en) 2004-11-04 2006-05-18 Agency For Science, Technology And Research Method and system for embedding data, method and system for detecting data and method and system for reconstructing data
CN101151637A (zh) 2005-04-01 2008-03-26 皇家飞利浦电子股份有限公司 量化水印的方法
EP1729285A1 (en) 2005-06-02 2006-12-06 Deutsche Thomson-Brandt Gmbh Method and apparatus for watermarking an audio or video signal with watermark data using a spread spectrum
EP1764780A1 (en) 2005-09-16 2007-03-21 Deutsche Thomson-Brandt Gmbh Blind watermarking of audio signals by using phase modifications
JP4353257B2 (ja) 2007-02-20 2009-10-28 セイコーエプソン株式会社 集積回路装置及び電子機器
CN101271690B (zh) * 2008-05-09 2010-12-22 中国人民解放军重庆通信学院 保护音频数据的音频扩频水印处理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050033579A1 (en) * 2003-06-19 2005-02-10 Bocko Mark F. Data hiding via phase manipulation of audio signals
JP2008502194A (ja) * 2004-06-02 2008-01-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 補助情報をメディア信号に埋め込む方法及び装置

Also Published As

Publication number Publication date
US20140156285A1 (en) 2014-06-05
CN103650039B (zh) 2016-08-03
KR20140041696A (ko) 2014-04-04
BR112014000356A2 (pt) 2017-02-14
WO2013007500A1 (en) 2013-01-17
EP2729933B1 (en) 2015-05-20
CN103650039A (zh) 2014-03-19
EP2729933A1 (en) 2014-05-14
EP2544179A1 (en) 2013-01-09
US10019997B2 (en) 2018-07-10

Similar Documents

Publication Publication Date Title
JP2014521112A (ja) 入力信号に透かし入れするための量子化インデックス変調の方法および装置
KR101271825B1 (ko) 디지털 워터마크를 유용 신호에 임베딩하는 방법
US7987371B2 (en) Optimization methods for the insertion, protection, and detection of digital watermarks in digital data
US7877609B2 (en) Optimization methods for the insertion, protection, and detection of digital watermarks in digital data
Dong et al. Data hiding via phase manipulation of audio signals
JP2007171933A (ja) オーディオ信号処理装置及び方法
WO2002049363A1 (en) Method and system of digital watermarking for compressed audio
KR20070015182A (ko) 워터마크 삽입
KR20050020040A (ko) 크기 변화에 강인한 양자화 기반 오디오 워터마킹 장치 및방법
JP2014521112A5 (ja)
US20070052560A1 (en) Bit-stream watermarking
JP2005513543A (ja) マルチメディア信号のqimデジタルウォーターマーキング
JP2007503026A (ja) サブバンドフィルタ処理を用いた透かし埋め込みの装置と方法
KR100355033B1 (ko) 선형예측 분석을 이용한 워터마크 삽입/추출 장치 및 그방법
Yu et al. Detecting MP3Stego using calibrated side information features.
Radhakrishnan et al. Audio content authentication based on psycho-acoustic model
Nishimura Reversible and robust audio watermarking based on spread spectrum and amplitude expansion
Kirbiz et al. Decode-time forensic watermarking of AAC bitstreams
Horvatic et al. Robust audio watermarking: based on secure spread spectrum and auditory perception model
Trivedi et al. An algorithmic digital audio watermarking in perceptual domain using direct sequence spread spectrum
Nishimura Reversible and robust audio watermarking based on quantization index modulation and amplitude expansion
Lalitha et al. Robust audio watermarking scheme with synchronization code and QIM
Czyżyk et al. Analysis of impact of lossy audio compression on the robustness of watermark embedded in the DWT domain for non-blind copyright protection
Neubauer et al. Robustness evaluation of transactional audio watermarking systems
Fallahpour et al. Transparent high capacity audio watermarking in wavelet domain

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150622

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160802

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20161101

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170620

A045 Written measure of dismissal of application

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20171031