JP6316288B2 - 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム - Google Patents

電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム Download PDF

Info

Publication number
JP6316288B2
JP6316288B2 JP2015522297A JP2015522297A JP6316288B2 JP 6316288 B2 JP6316288 B2 JP 6316288B2 JP 2015522297 A JP2015522297 A JP 2015522297A JP 2015522297 A JP2015522297 A JP 2015522297A JP 6316288 B2 JP6316288 B2 JP 6316288B2
Authority
JP
Japan
Prior art keywords
band
digital watermark
embedding
unit
watermark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015522297A
Other languages
English (en)
Other versions
JPWO2014199449A1 (ja
Inventor
匡伸 中村
匡伸 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of JPWO2014199449A1 publication Critical patent/JPWO2014199449A1/ja
Application granted granted Critical
Publication of JP6316288B2 publication Critical patent/JP6316288B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Description

本発明の実施形態は、電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラムに関する。
近年の音声信号処理技術では様々な音声を合成することが可能となっており、例えば合成した音声によって知人の音声を用いたなりすましや、著名人の音声の不正利用などの危険性が生じている。これらの犯罪を未然に防止するため、合成した音声に付加情報を埋め込み、不正利用を検知する需要が出てきている。例えば、付加情報の埋め込み方法としては、聴覚上のマスキング現象を利用した電子透かしの埋め込み法、量子化雑音に見せかけて電子透かしを埋め込む方法などが知られている。また、音声データのスペクトル分布の周波数振幅特性に付加情報信号を埋め込む方法などが存在する。
特開2006−171110号公報
岩切、松井「スペクトル拡散と変形離散コサイン変換による高品質デジタル音声のための電子透かし法」電子情報通信学会論文誌 Vol.39 No.9 1998
しかしながら、固定電話や携帯電話などを通じた会話にあっては、元々音声に対して、コーデック歪みなどが生じることにより埋め込んだ透かしが消失しやすく、付加情報の検出が難しくなるという問題があった。
本発明の実施形態は、上記に鑑みてなされたものであって、固定電話や携帯電話などの通話音声に対して、各種歪みに対して耐性を有し、付加情報の秘匿性に優れた電子透かしの埋め込み装置と、その検出装置を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明の実施形態は、入力された鍵乱数を用いて、電子透かしビットを埋め込む少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成部と、入力された音声信号の単位フレームに前記電子透かしビットを埋め込む場合に、前記第1帯域の振幅スペクトル強度和が、前記第2帯域の振幅スペクトル強度和より大きくなるよう、前記第1帯域、及び第2帯域の少なくとも一方の振幅スペクトル強度和を変更する埋め込み部と、を備えることを特徴とする。
実施形態に係る電子透かし埋め込み装置を例示するブロック図。 実施形態に係る電子透かし検出装置を例示するブロック図。 実施形態に係る埋め込み部での透かしの埋め込み方法を説明する図。 実施形態に係る生成部でのサブバンドフィルタの生成方法を説明する図。 実施形態の変形例に係る電子透かし埋め込み装置を例示するブロック図。 実施形態の変形例に係る電子透かし検出装置を例示するブロック図。 実施形態のハードウェア構成を示す図。
以下、図面を参照しながら本実施形態の電子透かし埋め込み装置、及び検出装置について説明する。図1は、電子透かし埋め込み装置の機能構成を示すブロック図である。図1に示されるように、電子透かし埋め込み装置1は、抽出部101、変換適用部102、埋め込み部103、逆変換適用部104、再合成部105、及び生成部106を備える。電子透かし埋め込み装置1には、音声信号10と鍵乱数16が入力され、電子透かしを埋め込んだ合成音声15が出力される。
抽出部101は、外部から入力された音声信号10を取得する。なお、音声信号10の入力は、例えばマイクなどの入力装置によって行われる。抽出部101は、音声信号10から単位時間毎に時間長2T(例えば、2T=64ミリ秒)の音声波形を切り出すことによって、時刻(t)での単位音声フレーム11を生成する。なお、以降の説明において、時間長2Tは分析窓幅とも呼ばれる。抽出部101は、時間長2Tの音声波形を切り出す処理とともに、切り出した音声波形の直流成分を除去する処理、切り出した音声波形の高周波成分を強調する処理、切り出した音声波形に窓関数(例えば、サイン窓)を乗算する処理などを行ってもよい。抽出部101は、単位音声フレーム11を変換適用部102へと出力する。
変換適用部102は、抽出部101からの単位音声フレーム11を入力とする。変換適用部102は、単位音声フレーム11に直交変換を適用し周波数領域に射影する。直交変換には離散フーリエ変換、離散コサイン変換、修正離散コサイン変換、サイン変換、離散ウェーブレット変換などの変換方式を用いてもよい。変換適用部102は、直交変換適用後の単位フレーム12を埋め込み部103へと出力する。
生成部106は、鍵乱数16を入力とする。生成部106は、入力された鍵乱数16によってサブバンドフィルタ17を生成する。サブバンドフィルタ17とは、電子透かしを埋め込む周波数の帯域であるP群とN群の幅を、乱数系列によってランダムに決定したフィルタである。本実施形態では、P群の帯域が第1帯域に、N群の帯域が第2帯域に相当し、単位フレーム12に1ビットの透かしビットを埋め込むことを可能にする。ただし、単位フレーム12に2ビット以上の透かしビットを埋め込む場合には、P群とN群は、2つのペア以上設定することが望ましい。なお、生成部106の処理フローは後述する。生成部106は、生成したサブバンドフィルタ17を埋め込み部103へと出力する。
埋め込み部103は、変換適用部102からの単位フレーム12と、サブバンドフィルタ17とを入力とする。埋め込み部103は、単位フレーム12ごとに、サブバンドフィルタ17によって指定されたサブバンドに電子透かしを埋め込む。なお、電子透かしの埋め込み方法は後述する。埋め込み部103は、透かし入り単位フレーム13を逆変換適用部104へと出力する。
逆変換適用部104は、埋め込み部103からの透かし入り単位フレーム13を入力とする。逆変換適用部104は、透かし入り単位フレーム13に逆直交変換を適用し時間領域に戻す。逆直交変換には、逆離散フーリエ変換、逆離散コサイン変換、逆修正離散コサイン変換、逆離散サイン変換、逆離散ウェーブレット変換などを用いてもよいが、変換適用部102で用いられた直交変換に対応する逆直交変換が望ましい。逆変換適用部104は、逆直交変換適用後の単位フレーム14を、再合成部105へと出力する。
再合成部105は、逆変換適用部104からの逆直交変換適用後の単位フレーム14を入力とする。再合成部105は、逆直交変換適用後の単位フレーム14に対し、前後のフレームを重複させて和を取ることで、透かし入り合成音声15を生成する。なお、抽出部101において音声波形を切り出す以外の処理を行った場合には、それらと逆の処理を行うことが相応しい。すなわち、切り出した音声波形の直流成分を除去する処理を行った場合には、除去した直流成分を単位フレーム14に戻す処理、切り出した音声波形の高周波成分を強調する処理を行った場合には、強調された単位フレーム14の高周波成分を元に戻す処理、切り出した音声波形に窓関数を乗算した場合には、単位フレーム14に窓関数(例えば、サイン窓)を乗算する処理、などを行う。単位フレーム14の前後のフレームは、例えば分析窓長2Tの半分である時間長Tだけ重複させる。
続いて、図1で示した電子透かし埋め込み装置1が埋め込んだ音声の電子透かしを検出する電子透かし検出装置2について図2を参照して説明する。図2に示されるように、電子透かし検出装置2は、抽出部101、変換適用部102、透かし検出部107、生成部106を備える。抽出部101、変換適用部102、生成部106は、図1で示した電子透かし埋め込み装置1と同様の構成である。電子透かし検出装置2は、透かし入り合成音声15と鍵乱数16とを入力し、入力された合成音声15に埋め込まれている透かしビット列18を出力する。そして、入力された透かし入り合成音声15は、抽出部101、及び変換適用部102を通じて、周波数領域に射影された単位フレーム12が抽出される。
透かし検出部107は、変換適用部102からの単位フレーム12を入力とする。透かし検出部107は、単位フレーム12ごとに、サブバンドフィルタ17によって指定された周波数の帯域から透かし情報を取り出す。電子透かし情報の検出方法は後述する。透かし検出部107は、透かしビット列18を出力する。
続いて、生成部106でのサブバンドフィルタの生成方法について述べる。サブバンドフィルタ生成部106は、電子透かし情報の秘匿性を向上させる役割を持つ。生成部106は、透かしを埋め込むデジタルデータ固有のサブバンドフィルタ17を生成する。サブバンドフィルタ17は、電子透かしを埋め込む周波数の帯域であるP群とN群の幅を、乱数系列によってランダムに決定したフィルタである。サブバンドフィルタ17は、図4に示されるような処理フローによって生成される。
サブバンドフィルタ17は、まずK個(例えばK=21)の代表周波数ビンを決める。続いて、サブバンドフィルタ17は、これらの各代表周波数ビンが各帯域の内部に属するよう、K+1個の乱数系列によって各代表周波数ビンの代表周波数境界Eをランダムに決定する。例えば、入力された鍵乱数16を用いてK+1個の乱数系列を生成し、各乱数値によって代表周波数ビンの境界を決定する。
サブバンドフィルタ17は、決定された各代表周波数ビンの代表周波数境界Eをサブバンド境界とみなし、サブバンドフィルタを生成する。代表周波数ビンの決め方としては、例えば全周波数ビンを線形に等分割し、それらの中心を選択する方法や、周波数軸をlogスケールで等分割しそれらの中心を選択する方法など、種々の方法が考えられる。なお、鍵乱数16によってサブバンド境界の異なるサブバンドフィルタを作成する処理は、上記のようにあらかじめ代表周波数ビンを決める方法以外でも可能である。
例えば、
・電子透かしを埋め込む周波数の帯域の数だけ用意した乱数系列の値によって全周波数ビンの分割比を求め、サブバンド境界を決定する方法
・サブバンド境界の異なる複数のサブバンドフィルタをあらかじめ用意しておき、適用するサブバンドフィルタを鍵乱数16によって決定する方法
などが考えられる。
そして、このようにして生成された帯域のうち、実際にP群とN群として設定された周波数帯域を含むものが埋め込み部103によって選択される。
次に、埋め込み部103における電子透かしの埋め込み方法を図3に示す。図3の左図は、変換適用部102から出力された単位フレーム12を表している。横軸は周波数、縦軸は振幅スペクトルの強度を表している。本実施形態では、図3においてP群とN群という2種類の帯域を設定する。帯域には少なくとも2つ以上隣接した周波数ビンが含まれる。P群とN群の設定方法として、図4で示したように予め全周波数帯域を特定のルールに基づいて指定個数の帯域に分割した後に、得られた帯域の中から選択してもよい。また、P群とN群は全ての単位フレーム12において同一のものを設定しても良いし、単位フレーム12ごとに変更してもよい。
電子透かしによる付加情報として、各単位フレーム12に1ビットの透かしビット{0、1}を埋め込む。ある時刻tにおけるk番目の周波数ビンWの振幅スペクトル強度を|X(W)|、P群に属する全周波数ビンの集合をΩとした時、P群に属する全周波数ビンの振幅スペクトル強度和は以下の数式1で表せる。
Figure 0006316288
同様に、N群に属する全周波数ビンの振幅スペクトル強度和をS(t)と、P群に属する全周波数ビンの振幅スペクトル強度和をS(t)表す。この時、以下の式を満たすように埋め込む透かしビットに応じてS(t)とS(t)の大小関係を変更する。
透かしビット“1”を埋め込むならばS(t)≧S(t)
透かしビット“0”を埋め込むならばS(t)<S(t)
例として、全単位フレーム12に電子透かしビット“1”を埋め込むケースを考える。全ての単位フレーム12で透かしビット“1”を埋め込むならば、全単位フレームで振幅スペクトル強度和の大小関係がS(t)≧S(t)となるように各周波数ビンの強度を変更する。例えば、図3の右下に示されるように、P群に属する全周波数ビンの振幅スペクトル強度を増加させ、かつN群に属する全周波数ビンの振幅スペクトル強度のみを減少させる方法が考えられる。振幅スペクトル強度の増加値もしくは減少値は、聴覚心理モデルを用いて、各周波数ビンに応じて知覚されにくい値を設定する方法が望ましい。なお、上記では全ての単位フレーム12に透かしを埋め込む方法を例示したが、透かしを埋め込まない単位フレーム12があってもよい。なお、透かしを埋め込まない場合、透かし検出処理を行うと、単位フレーム12の帯域が必ずどちらかの式を満たすため、検出されたビット列は{0、1}がほぼ等確率でランダムに出現する傾向がある。したがって、電子透かしを埋め込むためには、“00000・・・”や“01010・・・”など、単位フレームごとに何らかの規則性を持たせたビット配列を埋め込むことが望ましい。埋め込まれる透かしビットの配列は予め決められていてもよいし、特定のアルゴリズムに従い自動で生成されるようにしてもよいが、電子透かし埋め込み装置1で埋め込んだ透かしを電子透かし検出装置2で検出するためには、双方に共通の透かしビット配列を用いる必要がある。
次に、透かし検出部107における電子透かし(付加情報)の検出方法について述べる。本実施形態における透かし検出処理は、単位フレーム12ごとに、入力されたサブバンドフィルタ17によって指定された帯域であるP群とN群から、埋め込まれた1ビットを取り出す処理である。なお、P群とN群のペアが2つ以上ある場合には、以降の透かし検出処理をそのペアごとに行い、埋め込まれた2つ以上の透かしビットを取り出すものとする。P群に属する周波数ビンの振幅スペクトル強度和をS(t)、N群に属する周波数ビンの振幅スペクトル強度和をS(t)とした場合に、以下の式にしたがって、S(t)とS(t)を用いて埋め込まれたビットを検出する。
(t)≧S(t)ならば埋め込まれた透かしビットは“1”
(t)<S(t)ならば埋め込まれた透かしビットは“0”
すなわち、P群とN群という各帯域の振幅スペクトル強度和の大小関係により、埋め込まれた1ビットの透かしを抽出する方法を取っている。そのため、電子透かし検出装置2において、電子透かし埋め込み装置1において用いられたものと同様の鍵乱数16を持っておらずP群とN群のサブバンド境界が分からなければ、振幅スペクトル強度和の大小比較を行っても透かしビットを正確に検出することが困難になる。
ここで、従来の電子透かしの埋め込み方式について説明する。代表的な手法の一つとして、特定周波数ビンの振幅スペクトル強度を変更する方法が挙げられる。この手法にあっては、修正離散コサイン変換(Modified Discrete Cosine Transform:MDCT)により算出された各単位音声フレームに対し、埋め込む透かしビット{0、1}に応じて、特定周波数ビンのMDCT係数(振幅スペクトル強度)を変更する。透かしビット{0、1}に応じてMDCT係数を量子化することで、各単位音声フレームに1ビットの付加情報を埋め込んでいる。
この方式では、特定周波数ビンにのみ透かしを埋め込んでいるため埋め込み効率が高いという利点があるものの、耐雑音性が比較的弱いという欠点がある。しかし耐雑音性向上のために量子化幅を大きくして透かしの強度を上げると、特定周波数ビンの値が大きく変化するため、電子透かしの知覚不可能性が低下する原因となる。
また、耐雑音性を改善した方法の一つとして、各単位フレームにおいて2つの周波数ビンの集合を選択し、各帯域における振幅スペクトル強度和の大小関係によって透かしビット{0、1}を定義する方法がある。この方法では、各単位フレームにおいて、ある帯域に含まれる複数の周波数ビンを偶数番目と奇数番目に分け、透かしビットに“1”を埋め込む場合には偶数番目の振幅スペクトル強度和が、奇数番目のそれよりも大きくし、透かしビットに“0”を埋め込む場合には小さくする、と定義している。周波数ビンごとに振幅スペクトル強度を変更するよりも、このように帯域単位で変更することで、加法性雑音や乗法性歪みなどにも比較的頑健に付加情報を埋め込むことが可能となる。
しかしながら、この場合埋め込まれた透かし情報の秘匿性が低いという欠点がある。すなわち、クラッカーによって透かし情報が埋め込まれている帯域(P群とN群)の情報が漏洩した場合、透かし情報の不正取得が可能になることを意味している。そこで秘匿性を向上させる代表的な手法の一つとして、以下の方法が従来採られている。
具体的には、各単位フレームにおいてMDCT係数を変更する際に、鍵乱数から抽出した乱数値に応じて1つまたは複数個の周波数ビンを選択し、選択された周波数ビンのMDCT係数を変更する。この方法を使えば、クラッカーが鍵乱数を取得しない限り、透かし情報の取得は困難となる。
しかし、鍵乱数によって埋め込む周波数ビンを選択する方法では、電子透かしの知覚不可能性が低下する可能性がある。MPEGなどのメディア圧縮技術に多用されている聴覚心理モデルによれば、人間の聴覚には聴き取りやすい周波数帯域とそうでない帯域があるため、鍵乱数によってランダムで選択された周波数ビンが人間に聴き取られやすい周波数帯である可能性は否定できない。
これらの従来の電子透かしの埋め込み、及び検出方法と比較して、本実施形態においては以下の点で優位性を備えている。すなわち、特定周波数ビンに透かしを埋め込むのではなく、複数の帯域に電子透かしを埋め込むことで、耐雑音性が向上し、固定電話や携帯電話などのコーデック歪み、加法性雑音、乗法性歪みなどへの耐性が向上する。
また、電子透かしを埋め込む帯域を決定するために鍵乱数を用いているため、透かし情報が埋め込まれている帯域の情報が漏洩しても、第三者による情報の不正取得の可能性を低く抑えることができる。また、埋め込まれる電子透かしは、複数帯域での各振幅スペクトル強度和の大小比較によって定義される。そのため、鍵乱数が異なれば透かしの埋め込まれる帯域幅が異なり、振幅スペクトル強度和も異なるため、埋め込まれた透かしを正確に取り出すことは困難になる。
さらには、電子透かしの知覚不可能性が高い。乱数系列によって透かしを埋め込む周波数ビン(もしくは帯域)を決定する従来の方法では、乱数系列によって人間の聴き取りやすい周波数帯域が選択される可能性がある。一方、本実施形態では人間が聴き取りにくい周波数帯域の代表周波数ビンを指定しているため、乱数系列によって電子透かしの知覚不可能性が大きく劣化することは無い。
(変形例)
本実施形態では、鍵乱数を用いてサブバンドフィルタを生成することとしたが、更に秘匿性を高めるために、サブバンドフィルタ制御部508を設けることもできる。図5に示されるように、電子透かし埋め込み装置3は、上記実施形態で示した構成に加えて、サブバンドフィルタ制御部508を備える。生成部506は、入力された鍵乱数16によって1つまたは複数のサブバンドフィルタ57を生成し、サブバンドフィルタ制御部508へと出力する。サブバンドフィルタ制御部508は、生成部506からの1つまたは複数のサブバンドフィルタ57を入力とする。サブバンドフィルタ制御部508は、各単位フレーム12において、適用する1つのサブバンドフィルタ58を出力する。
サブバンドフィルタ制御部508は、各単位フレーム12において透かしを埋め込む際に、1つまたは複数のサブバンドフィルタの中で適用するものを1つ選択する。選択方法には種々の方法があり得るが、例えばNフレームごとにサブバンドフィルタを変更する方法(Nは1以上の整数)などが考えられる。なお、ある単位フレーム12に電子透かしを埋め込まないためには、サブバンドフィルタ制御部508において、サブバンドフィルタを適用しない制御信号を出力してもよい。
なお、このように適用されるサブバンドフィルタが、単位フレーム12ごとに選択される場合、図6に示されるように、電子透かし検出装置4にも、同様のサブバンドフィルタ制御部508が設けられる。サブバンドフィルタ制御部508は、電子透かし埋め込み装置3と同様のアルゴリズムに従い、検出対象の単位フレーム12に対して、サブバンドフィルタを適用する。
以上の構成によれば、鍵乱数を用いて生成した1つまたは複数のサブバンドフィルタを選択し、各単位フレーム12に適用することができ、適用されるサブバンドフィルタの秘匿性を向上させることが可能になる。
次に、各実施形態にかかる電子透かし埋め込み装置、および検出装置のハードウェア構成について図7を用いて説明する。図7は、実施形態にかかる電子透かし埋め込み装置、および検出装置のハードウェア構成を示す説明図である。
実施形態にかかる電子透かし埋め込み装置、および検出装置は、CPU(Central Processing Unit)51などの制御装置と、ROM(Read Only Memory)52やRAM(Random Access Memory)53などの記憶装置と、ネットワークに接続して通信を行う通信I/F54と、各部を接続するバス61を備えている。
実施形態にかかる電子透かし埋め込み装置、および検出装置で実行されるプログラムは、ROM52等に予め組み込まれて提供される。
実施形態にかかる電子透かし埋め込み装置、および検出装置で実行されるプログラムは、インストール可能な形式または実行可能な形式のファイルでCD−ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD−R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供されるように構成してもよい。
さらに、実施形態にかかる電子透かし埋め込み装置、および検出装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、実施形態にかかる電子透かし埋め込み装置、および検出装置で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
実施形態にかかる電子透かし埋め込み装置、および検出装置で実行されるプログラムは、コンピュータを上述した各部として機能させうる。このコンピュータは、CPU51がコンピュータ読取可能な記憶媒体からプログラムを主記憶装置上に読み出して実行することができる。
なお、本実施形態は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
1 電子透かし埋め込み装置
2 電子透かし検出装置
3 電子透かし埋め込み装置
4 電子透かし検出装置
10 音声信号
11 単位音声フレーム
12 単位フレーム
13 透かし入り単位フレーム
14 単位フレーム
15 合成音声
16 鍵乱数
17 サブバンドフィルタ
18 透かしビット列
57 サブバンドフィルタ
58 サブバンドフィルタ
101 抽出部
102 変換適用部
103 埋め込み部
104 逆変換適用部
105 再合成部
106 サブバンドフィルタ生成部
107 透かし検出部
506 生成部
508 サブバンドフィルタ制御部

Claims (6)

  1. 入力された鍵乱数を用いて、規則性を有するように配列される電子透かしビットを埋め込む少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成部と、
    入力された音声信号の単位フレームに前記電子透かしビットを埋め込む場合に、前記第1帯域の振幅スペクトル強度和が、前記第2帯域の振幅スペクトル強度和より大きくなるよう、前記第1帯域、及び第2帯域の少なくとも一方の振幅スペクトル強度和を変更する埋め込み部と、
    を備える電子透かし埋め込み装置。
  2. 入力された鍵乱数を用いて、規則性を有するように配列される電子透かしビットを埋め込む少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成ステップと、
    入力された音声信号の単位フレームに前記電子透かしビットを埋め込む場合に、前記第1帯域の振幅スペクトル強度和が、前記第2帯域の振幅スペクトル強度和より大きくなるよう、前記第1帯域、及び第2帯域の少なくとも一方の振幅スペクトル強度和を変更する埋め込みステップと、
    を含む電子透かし埋め込み方法。
  3. コンピュータに、
    入力された鍵乱数を用いて、規則性を有するように配列される電子透かしビットを埋め込む少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成ステップと、
    入力された音声信号の単位フレームに前記電子透かしビットを埋め込む場合に、前記第1帯域の振幅スペクトル強度和が、前記第2帯域の振幅スペクトル強度和より大きくなるよう、前記第1帯域、及び第2帯域の少なくとも一方の振幅スペクトル強度和を変更する埋め込みステップと、
    を実行させるための電子透かし埋め込みプログラム。
  4. 入力された鍵乱数を用いて、規則性を有するように配列された電子透かしビットを埋め込んだ少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成部と、
    入力された音声信号の単位フレームにおいて、適用された前記フィルタに基づいて指定される前記第1帯域の振幅スペクトル強度和と、前記第2帯域の振幅スペクトル強度和とを比較し、大小関係から、前記単位フレームに埋め込まれた前記電子透かしビットを検出する透かし検出部と、
    を備える電子透かし検出装置。
  5. 入力された鍵乱数を用いて、規則性を有するように配列された電子透かしビットを埋め込んだ少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成ステップと、
    入力された音声信号の単位フレームにおいて、適用された前記フィルタに基づいて指定される前記第1帯域の振幅スペクトル強度和と、前記第2帯域の振幅スペクトル強度和とを比較し、大小関係から、前記単位フレームに埋め込まれた前記電子透かしビットを検出する透かし検出ステップと、
    を含む電子透かし検出方法。
  6. コンピュータに、
    入力された鍵乱数を用いて、規則性を有するように配列された電子透かしビットを埋め込んだ少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成ステップと、
    入力された音声信号の単位フレームにおいて、適用された前記フィルタに基づいて指定される前記第1帯域の振幅スペクトル強度和と、前記第2帯域の振幅スペクトル強度和とを比較し、大小関係から、前記単位フレームに埋め込まれた前記電子透かしビットを検出する透かし検出ステップと、
    を実行させるための電子透かし検出プログラム。
JP2015522297A 2013-06-11 2013-06-11 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム Active JP6316288B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/066109 WO2014199449A1 (ja) 2013-06-11 2013-06-11 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム

Publications (2)

Publication Number Publication Date
JPWO2014199449A1 JPWO2014199449A1 (ja) 2017-02-23
JP6316288B2 true JP6316288B2 (ja) 2018-04-25

Family

ID=52021785

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015522297A Active JP6316288B2 (ja) 2013-06-11 2013-06-11 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム

Country Status (4)

Country Link
US (1) US10424310B2 (ja)
JP (1) JP6316288B2 (ja)
CN (1) CN105283915B (ja)
WO (1) WO2014199449A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106409301A (zh) * 2015-07-27 2017-02-15 北京音图数码科技有限公司 数字音频信号处理的方法
US20220230265A1 (en) * 2021-01-19 2022-07-21 Olympus NDT Canada Inc. Digital watermarking of acoustic data
EP4336496A1 (en) * 2022-09-08 2024-03-13 Utopia Music AG Digital data embedding and extraction in music and other audio signals
CN115910080B (zh) * 2023-01-09 2023-06-02 北京承启通科技有限公司 一种通信音频数字水印写入、读取方法及装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100341197B1 (ko) 1998-09-29 2002-06-20 포만 제프리 엘 오디오 데이터로 부가 정보를 매립하는 방법 및 시스템
EP1022895A3 (en) * 1999-01-22 2001-04-04 Matsushita Electric Industrial Co., Ltd. Apparatus for and method of embedding and extracting digital information, and medium having program for carrying out the method recorded thereon
US6385329B1 (en) * 2000-02-14 2002-05-07 Digimarc Corporation Wavelet domain watermarks
JP2002244685A (ja) 2001-02-22 2002-08-30 Kowa Co 電子透かしの埋め込みおよび検出
JP2003143390A (ja) * 2001-11-02 2003-05-16 Kowa Co 電子透かしの埋め込みおよび抽出
ATE323381T1 (de) * 2001-12-14 2006-04-15 Koninkl Philips Electronics Nv Quantisierungs-index-moduliertes (qim) einbetten eines digitalen wasserzeichens in ein multimedia- signal
US6904151B2 (en) * 2002-01-17 2005-06-07 Deguillaume Frederic Method for the estimation and recovering of general affine transform
JP4357791B2 (ja) 2002-03-29 2009-11-04 株式会社東芝 電子透かし入り音声合成システム、合成音声の透かし情報検出システム及び電子透かし入り音声合成方法
CN1148961C (zh) * 2002-04-30 2004-05-05 中山大学 一种数字水印的嵌入方法
US7461256B2 (en) * 2002-07-29 2008-12-02 International Business Machines Corporation Generating watermark signals
KR100492743B1 (ko) * 2003-04-08 2005-06-10 주식회사 마크애니 신호의 특성값의 양자화에 의한 워터마크 삽입 및 검출방법
KR100556848B1 (ko) * 2003-05-13 2006-03-10 엘지전자 주식회사 디지털 워터마킹을 이용한 동영상 부호화/복호화 장치 및방법
KR100554680B1 (ko) * 2003-08-20 2006-02-24 한국전자통신연구원 크기 변화에 강인한 양자화 기반 오디오 워터마킹 장치 및방법
TWI228376B (en) * 2003-12-23 2005-02-21 Ind Tech Res Inst Watermark encoding method and recording medium thereof
JP2006171110A (ja) * 2004-12-13 2006-06-29 Amk:Kk 音声データへの付加情報埋め込み方法、音声データからの付加情報埋読み取り方法及びそれらの装置
PL1684265T3 (pl) 2005-01-21 2009-01-30 Unlimited Media Gmbh Sposób wstawiania cyfrowego znaku wodnego w sygnale użytecznym
JP2006251676A (ja) * 2005-03-14 2006-09-21 Akira Nishimura 振幅変調を用いた音響信号への電子透かしデータの埋め込み・検出装置
JP2006330256A (ja) * 2005-05-25 2006-12-07 Kddi Corp オーディオ信号に対する電子透かし埋込み方法および検出方法
JP4343179B2 (ja) * 2006-02-17 2009-10-14 株式会社東芝 電子透かし検出方法及び装置
FR2918239A1 (fr) * 2007-06-29 2009-01-02 Thomson Licensing Sas Procede de selection de pixels d'image a tatouer et procede de tatouage utilisant cette selection
WO2011052992A2 (ko) * 2009-10-29 2011-05-05 엘지전자 주식회사 컨텐트에 워터마크를 삽입하고 삽입된 워터마크를 검출하는 방법 및 장치
CN201965906U (zh) * 2010-04-01 2011-09-07 北京邮电大学 适用于数字水印技术的语音信号处理装置
JP5857644B2 (ja) * 2011-11-10 2016-02-10 富士通株式会社 音データ送受信システム、送信装置、受信装置、音データ送信方法及び受信方法
US9401153B2 (en) * 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
CN103778918B (zh) * 2012-10-26 2016-09-07 华为技术有限公司 音频信号的比特分配的方法和装置

Also Published As

Publication number Publication date
US10424310B2 (en) 2019-09-24
US20160093309A1 (en) 2016-03-31
CN105283915A (zh) 2016-01-27
WO2014199449A1 (ja) 2014-12-18
JPWO2014199449A1 (ja) 2017-02-23
CN105283915B (zh) 2019-05-07

Similar Documents

Publication Publication Date Title
Bhat K et al. An audio watermarking scheme using singular value decomposition and dither-modulation quantization
EP1814105B1 (en) Audio processing
CN101271690B (zh) 保护音频数据的音频扩频水印处理方法
Bhat K et al. A new audio watermarking scheme based on singular value decomposition and quantization
US8032361B2 (en) Audio processing apparatus and method for processing two sampled audio signals to detect a temporal position
JP6316288B2 (ja) 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム
CN113782041B (zh) 一种基于音频变频域的嵌入和定位水印的方法
CN102142255B (zh) 一种在音频信号中嵌入及提取数字水印的方法
Budiman et al. QIM-based audio watermarking with combined techniques of SWT-DST-QR-CPT using SS-based synchronization
Attari et al. Robust audio watermarking algorithm based on DWT using Fibonacci numbers
KR101201076B1 (ko) 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법
Zhao et al. A robust audio watermarking algorithm based on SVD-DWT
Kanhe et al. A QIM-based energy modulation scheme for audio watermarking robust to synchronization attack
Zhang et al. Robust and transparent audio watermarking based on improved spread spectrum and psychoacoustic masking
Jebara A perceptual approach to reduce musical noise phenomenon with wiener denoising technique
Singh et al. Multiplicative watermarking of audio in DFT magnitude
Attari et al. Robust and blind audio watermarking in wavelet domain
El-Khamy et al. Chaos-based image hiding scheme between silent intervals of high quality audio signals using feature extraction and image bits spreading
Li et al. Spread-spectrum audio watermark robust against pitch-scale modification
Hu et al. A perceptually adaptive and retrievable QIM scheme for efficient blind audio watermarking
Koz et al. Adaptive selection of embedding locations for spread spectrum watermarking of compressed audio
Singh et al. Multiplicative Watermarking of Audio in Spectral Domain
Lin et al. Robust audio watermarking technique based on gammatone filterbank and coded-image
Montazeri et al. A Novel Phase-Domain Speech Watermarking Method using Perceptual Orthogonal Matching Pursuit
Dymarski et al. Audio Files Protection Using Logo Watermarking, Fingerprinting and Encryption

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180327

R151 Written notification of patent or utility model registration

Ref document number: 6316288

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350