JPH11296200A - 音声データに透かし情報を埋め込む装置とその方法及び音声データから透かし情報を検出する装置とその方法及びその記録媒体 - Google Patents

音声データに透かし情報を埋め込む装置とその方法及び音声データから透かし情報を検出する装置とその方法及びその記録媒体

Info

Publication number
JPH11296200A
JPH11296200A JP10095808A JP9580898A JPH11296200A JP H11296200 A JPH11296200 A JP H11296200A JP 10095808 A JP10095808 A JP 10095808A JP 9580898 A JP9580898 A JP 9580898A JP H11296200 A JPH11296200 A JP H11296200A
Authority
JP
Japan
Prior art keywords
watermark information
audio data
embedded
embedding
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10095808A
Other languages
English (en)
Other versions
JP3321767B2 (ja
Inventor
Shusaku Sawato
周作 澤戸
Mitsuto Ushio
充人 潮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
M KEN KK
Original Assignee
M KEN KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by M KEN KK filed Critical M KEN KK
Priority to JP09580898A priority Critical patent/JP3321767B2/ja
Publication of JPH11296200A publication Critical patent/JPH11296200A/ja
Application granted granted Critical
Publication of JP3321767B2 publication Critical patent/JP3321767B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

(57)【要約】 【課題】 音声データの変化率を求め、変化率が所定の
閾値よりも大きいところに透かし情報を埋め込むことに
より、聴覚特性への影響をなくし、又、音声の変化率が
相対的に高い部分に透かし情報を埋め込むことで、どの
ような波形でも周期的に透かし情報の埋め込みを可能に
する音声データへの透かし情報の埋め込み装置を提供す
る。 【解決手段】 パルス符号変調された音声データDTを
所定の長さのブロックに分割する手段1と、前記ブロッ
ク化した音声データDTに前記透かし情報を埋め込むた
め埋め込み位置での音声データDTの変化率sを演算す
る手段2と、前記変化率sに基づき透かし情報の埋め込
みの可否を決定する手段3と、前記埋め込みの可否を決
定する手段3が透かし情報の埋め込みの決定した部分に
前記透かし情報を埋め込む埋め込み手段4とで構成した
ことを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声データに透か
し情報を埋め込む装置とその方法及び音声データから透
かし情報を検出する装置とその方法及びその記録媒体に
係わり、特に、ディジタル化された音楽ソフトに著作権
情報等を人間の耳には識別できないように隠して付加
し、著作権保護等を行うのに好適な電子透かし技術に関
する。
【0002】
【従来の技術】音声データへの透かし情報埋め込み方式
としては、従来より、アナログをディジタル波形に量子
化する際の量子化差分、又は、量子化ノイズ等に透かし
情報を埋め込む量子化ノイズ利用型、音声信号の位相差
を利用する位相利用型、或いは、人間の耳のマスキング
効果を利用して透かし情報を埋め込むマスキング効果利
用型等が知られている。量子化ノイズ利用型は、下位ビ
ットに透かし情報を埋め込むため、多量のビット情報を
埋め込むことが出来るが、多量のビットを埋め込むと、
例えば、スポーツイベントのように観衆が発生する雑音
でかき消されてしまい、又、クラシック音楽のような場
合には聞こえてしまうという欠点があった。更に、下位
ビットに埋め込むため、雑音等による耐性が弱いという
欠点があった。一方、位相利用型やマスキング効果利用
型の透かし情報埋め込み方式では、透かし情報を埋め込
むことで、波形が歪むから音質を著しく悪化させるとい
う欠点があった。
【0003】
【発明が解決しようとする課題】本発明の目的は、上記
した従来技術の欠点を改良し、特に、音声データの変化
率を求め、変化率が所定の閾値よりも大きいところに透
かし情報を埋め込むことにより、聴覚特性への影響をな
くし、又、音声の変化率が相対的に高い部分に透かし情
報を埋め込むことで、どのような波形でも周期的に透か
し情報の埋め込みを可能にする新規な音声データへの透
かし情報の埋め込み装置とその方法及びその記録媒体を
提供するものである。又、本発明の他の目的は、少ない
情報量、即ち、短時間の再生音声データでも前記透かし
情報の検出を可能にした新規な透かし情報の検出装置と
その方法を提供するものである。又、本発明の他の目的
は、透かし情報を周期的に埋め込むことで、任意の区間
で透かし情報を検出可能にした新規な電子透かし技術を
提供するものである。
【0004】
【課題を解決するための手段】本発明は上記した目的を
達成するため、基本的には、以下に記載されたような技
術構成を採用するものである。即ち、本発明に係わる音
声データに透かし情報を埋め込む装置の第1態様は、音
声データに透かし情報を埋め込む装置であって、パルス
符号変調された音声データを所定の長さのブロックに分
割する手段と、前記ブロック化した音声データに前記透
かし情報を埋め込むため埋め込み位置での音声データの
変化率を演算する手段と、前記変化率に基づき透かし情
報の埋め込みの可否を決定する手段と、前記埋め込みの
可否を決定する手段が透かし情報の埋め込みの決定した
部分に前記透かし情報を埋め込む埋め込み手段とで構成
したことを特徴とするものであり、又、第2態様は、前
記透かし情報の埋め込みの可否を決定する手段は、透か
し情報を埋め込むための埋め込み位置での変化率が、所
定の閾値を超えているか否かを比較する比較手段を含
み、この比較手段が、前記埋め込もうとする位置での変
化率が前記所定の閾値を超えていることを検出した場
合、前記透かし情報を埋め込むものであることを特徴と
するものであり、又、第3態様は、前記透かし情報の埋
め込みの可否を決定する手段は、前記閾値を演算して求
める演算手段を含むことを特徴とするものであり、又、
第4態様は、前記演算手段は、前記閾値を変化率の移動
平均値に基づき求めるものであることを特徴とするもの
であり、又、第5態様は、前記透かし情報の埋め込み手
段は、透かし情報を識別するためのヘッダとこのヘッダ
に続く透かし情報を、前記ブロック内に所定の長さで埋
め込むものであることを特徴とするものであり、又、第
6態様は、前記透かし情報は、音声データの最下位ビッ
トを除くビットに埋め込むことを特徴とするものであ
り、又、第7態様は、前記透かし情報は、音声データの
最下位ビットに埋め込むことを特徴とするものであり、
又、第8態様は、前記透かし情報は周期的に埋め込まれ
ることを特徴とするものである。
【0005】又、本発明に係わる音声データから透かし
情報を検出する装置の第1態様は、音声データから透か
し情報を検出する装置であって、パルス符号変調された
音声データを所定の長さのブロックに分割する手段と、
前記ブロック化された各ブロックの各音声データの所定
のビットからビット情報を抽出する手段と、前記ビット
情報を抽出する手段が抽出したビットデータから埋め込
まれた透かし情報を推定するための手段とで構成したこ
とを特徴とするものであり、又、第2態様は、前記埋め
込まれた透かし情報を推定するための手段は、各透かし
情報が埋め込まれた前記各ブロックの同一位置での透か
し情報のビットデータが0である位置の重みを演算して
第1の値を求めると共に、同様に前記各ブロックの同一
位置での透かし情報のビットデータが1である位置の重
みを演算して第2の値を求める第1の演算手段と、前記
第1の値と第2の値とを比較する比較手段とを含み、前
記比較手段の比較結果に基づき透かし情報の埋め込みビ
ットを推定することを特徴とするものであり、又、第3
態様は、前記埋め込まれた透かし情報を推定するための
手段は、各透かし情報の埋め込み位置での音声データの
変化率を演算する第2の演算手段と、この第2の演算手
段の検出した変化率から前記重みを求める第3の演算手
段を含むことを特徴とするものである。
【0006】又、本発明に係る音声データに透かし情報
を埋め込む方法の第1態様は、音声データに透かし情報
を埋め込む方法であって、パルス符号変調された音声デ
ータを所定の長さのブロックに分割する第1のステップ
と、前記ブロック化した音声データに前記透かし情報を
埋め込むため、埋め込み位置での音声データの変化率を
求める第2のステップと、前記変化率から閾値を演算し
て求める第3のステップと、透かし情報を埋め込むため
の埋め込み位置の変化率が、前記閾値を超えている場
合、前記透かし情報をその位置に埋め込む第4のステッ
プと、を含むことを特徴とするものであり、又、第2態
様は、前記第4のステップでは、前記音声データを最下
位ビットを除くビットに埋め込むことを特徴とするもの
であり、又、第3態様は、前記第1乃至第4のステップ
を繰り返すことで、前記ブロック内に所定の長さの透か
し情報を埋め込むことを特徴とするものであり、又、第
4態様は、前記透かし情報は周期的に埋め込まれること
を特徴とするものである。
【0007】又、本発明に係る音声データから透かし情
報を検出する方法の第1態様は、音声データから透かし
情報を検出する方法であって、パルス符号変調された音
声データを所定の長さのブロックに分割する第1のステ
ップと、前記ブロック化された各ブロックの各音声デー
タの所定のビットからビット情報を抽出する第2のステ
ップと、前記ビット情報を抽出する手段が抽出したビッ
トデータから埋め込まれた透かし情報を推定する第3の
ステップと、を含むことを特徴とするものであり、又、
第2態様は、前記第4のステップは、各ブロックの同一
位置の透かし情報のビットデータが0である位置の重み
を演算して第1の値を求めると共に、同様に前記同一位
置のビットデータが1である位置の重みを演算して第2
の値を求め、前記第1の値と第2の値とを比較すること
で、透かし情報の埋め込みビットを推定するステップを
含むことを特徴とするものであり、又、第3態様は、前
記第4のステップは、各ブロックの埋め込み位置での音
声データの変化率を演算するステップと、求めた変化率
から前記重みを求めるステップと、検出した各ブロック
での透かし情報のビットデータに対応する前記重みをビ
ットデータ0、1毎に夫々累計するステップとを含むこ
とを特徴とするものである。
【0008】又、本発明に係る音声データに透かし情報
を埋め込んだ記録媒体の第1態様は、音声データに透か
し情報を埋め込んだ記憶媒体であって、音声データを埋
め込む位置の音声データの変化率が所定の閾値以上であ
るとき前記透かし情報を埋め込むと共に、前記閾値は音
声データを埋め込む位置近傍での音声データの変化率に
基づき決定され、且つ、前記透かし情報は略周期的に埋
め込まれていることを特徴とするものであり、又、第2
態様は、前記透かし情報は、音声データの最下位ビット
を除くビットに埋め込まれたものであることを特徴とす
るものであり、又、第3態様は、前記透かし情報は、音
声データの最下位ビットに埋め込まれたものであること
を特徴とするものである。
【0009】
【発明の実施の形態】本発明に係わる音声データに透か
し情報を埋め込む装置は、パルス符号変調された音声デ
ータを所定の長さのブロックに分割する手段と、前記ブ
ロック化した音声データに前記透かし情報を埋め込むた
め埋め込み位置での音声データの変化率を演算する手段
と、前記変化率に基づき透かし情報の埋め込みの可否を
決定する手段と、前記埋め込みの可否を決定する手段が
透かし情報の埋め込みを決定した部分に前記透かし情報
を埋め込む埋め込み手段とで構成したことを特徴とする
ものであるから、透かし情報を周期的に埋め込むことが
可能である。特に、音声の変化率の高い部分に埋め込む
方式であるから、音質を悪化させることもなく、埋め込
むことが出来る。又、相対的に変化率の高い部分に埋め
込む構成であるから、記録されている音声データがどの
ような波形であっても、透かし情報を周期的に埋め込む
ことが出来る。
【0010】又、本発明に係わる音声データから透かし
情報を検出する装置は、パルス符号変調された音声デー
タを所定の長さのブロックに分割する手段と、前記ブロ
ック化された各ブロックの各音声データの所定のビット
からビット情報を抽出する手段と、前記ビット情報を抽
出する手段が抽出したビットデータから埋め込まれた透
かし情報を推定するための手段とで構成したことを特徴
とするものであるから、任意に切り出された音声データ
から、常に埋め込まれた透かし情報を検出することが可
能である。
【0011】
【実施例】以下に、本発明に係わる音声データに透かし
情報を埋め込む装置とその方法及び音声データから透か
し情報を検出する装置とその方法の具体例を図面を参照
しながら詳細に説明する。始めに、本発明の音声データ
に透かし情報を埋め込む装置とその方法について説明す
る。本発明の透かし情報の埋め込み方式は、埋め込もう
とする音声データの時間的な位置において、その位置で
の音声データの変化率、即ち、所定時間での音声データ
の振幅の差異を検出し、その変化率が所定の閾値より高
いときのみ透かし情報を埋め込み、反対に、変化率が前
記所定の閾値より低いときには透かし情報を埋め込まな
いようにして、聴感上透かし情報を感知できないように
埋め込むものである。
【0012】特に、本発明では、前記閾値を透かし情報
を埋め込もうとする位置より前の所定の区間の移動平均
値を基に前記閾値を決定しているから、記録されている
音声データがどのような波形であっても、透かし情報を
周期的に埋め込むことが出来る。
【0013】図1は、本発明の音声データの透かし情報
を埋め込む装置の具体例の機能ブロック図、図2はこの
装置の動作を説明する流れ図、図3は音声データの時間
的な変化の一例を示す波形図、図4は透かし情報をブロ
ックに埋め込んだ状態を説明する図であって、これらの
図には、音声データに透かし情報を埋め込む装置であっ
て、パルス符号変調された音声データDTを所定の長さ
のブロックに分割する手段1と、前記ブロック化した音
声データDTに前記透かし情報を埋め込むため埋め込み
予定位置での音声データDTの変化率sを演算する手段
2と、前記変化率sに基づき透かし情報の埋め込みの可
否を決定する手段3と、前記埋め込みの可否を決定する
手段3が透かし情報の埋め込みの決定した位置に前記透
かし情報を埋め込む埋め込み手段4とで構成したことを
特徴とする装置100が示されている。
【0014】又、前記透かし情報の埋め込みの可否を決
定する手段3は、透かし情報を埋め込むための埋め込み
位置での変化率sが、所定の閾値haを超えているか否
かを比較する比較手段32を含み、この比較手段32
が、前記埋め込もうとする位置での変化率sが前記所定
の閾値haを超えていることを検出した場合、その位置
に前記透かし情報を埋め込むものであることが示され、
更に、前記透かし情報の埋め込みの可否を決定する手段
3は、前記閾値haを演算して求める演算手段31を含
むことが示されている。
【0015】次に、この装置について更に詳細に説明す
る。はじめに、透かし情報を周期的に埋め込むために、
音声データDT全体に対し、一定のサンプル点を含むよ
うにデータのブロック化を行い、各ブロックに対して、
以下の透かし情報の埋め込み処理を行う。透かし情報を
埋め込んだことによる聴感上歪みの影響を少なくするた
めに、音楽データの変化率sを求め、変化率sの大きい
サンプル点のデータに透かし情報を埋め込む。
【0016】変化率の計算例としては、サンプル点iの
変化率s[i]をiの前後10点間の音楽データの振幅
w[i+5]、w[i−5]の差として求め、簡略化し
て式(1)のように計算する。またここで、情報の検出
をするため、透かし情報埋め込み前後で、この変化率が
変わらないようにするため、変化率を求める前に透かし
情報を埋め込むビット以下を0にしてから、変化率を求
める。
【0017】
【数1】
【0018】さて、本発明では式(1)で求めた変化率
がある閾値よりも大きい位置にのみ、透かし情報を埋め
込むように構成しているが、この場合、閾値を全ブロッ
クに対し一定の値に設定すると、変化率の低い点の多い
ブロックでは、埋め込める透かし情報が非常に少なくな
ってしまうので、変化率の平均値に応じて、閾値の値を
決め、どのブロックにも一定以上の透かし情報が埋め込
めるようにする。
【0019】例えば、図3の音楽データDTで具体的に
説明すると、11点の変化率から変化率の移動平均値a
s[i]を式(2)のように求め、その1/3の値をサ
ンプル点iの閾値ha[i]とすれば移動平均値as
[i]と閾値ha[i]は次式より求めることができ
る。
【0020】 as[i]={s[i−10]+s[i−9]+s[i−8]+s[i−7] +s[i−6]+s[i−5]+s[i−4]+s[i−3]+s[i−2] +s[i−1]+s[i]}/11 ・・・(2) ha[i]=as[i]/3 ・・・(3)
【0021】次に、ヘッダと透かし情報の埋め込みにつ
いて説明する。ブロック化したブロックの先頭のサンプ
ル点から順番に透かし情報のビット情報をIb[i]を
割り当てる。そして、音声データの透かし情報を埋め込
むビット列の情報をwb[i]とすると、変化率が閾値
より大きい場合にだけ、そのサンプル点に対応する透か
し情報のビットを音楽データのビットと入れ替えること
により透かし情報のビットを埋め込む。例えば、閾値よ
り大きい音楽データのビットをwb[i−5]、wb
[i−3]、wb[i]とした場合、埋め込む透かし情
報のビットはIb[i−5]、Ib[i−3]、Ib
[i]であり、Ib[i−4]、Ib[i−2]、Ib
[i−1]は埋め込まない。以上の処理をブロック化し
た全ブロックに行うことにより、全音声データに対し、
透かし情報のビットを周期的に埋め込む。
【0022】図4は、ブロックA0 、A1 、A2 ・・・
・・An に対し、透かし情報Ib[0]〜Ib[9]を
閾値に基づき埋め込んだ状態を模式的に示した図であ
り、各ブロックでIbが記入されていないビットには透
かし情報が埋め込まれていないことを示している。
【0023】図2は、透かし情報の埋め込みの流れを示
すフローチャートであり、上記したように、パルス符号
変調された音声データを所定の長さのブロックに分割す
る第1のステップS1と、前記ブロック化した音声デー
タに前記透かし情報を埋め込むため、埋め込み位置での
音声データの変化率を求める第2のステップS2と、前
記変化率から閾値を演算して求める第3のステップと、
透かし情報を埋め込むための埋め込み位置の変化率が、
前記閾値を超えている場合、前記透かし情報をその位置
に埋め込む第4のステップS3、S4、S5とで、透か
し情報を埋め込んでいる。
【0024】次に、埋め込んだ透かし情報を検出するた
めの装置とその方法について説明する。本発明の透かし
情報は、閾値の値によっては、透かし情報が埋め込まれ
ていないビットも含まれている。この為、以下に示すよ
うな統計的手法を用いて、埋め込まれたビットを推定し
て特定するように構成している。
【0025】図5は、本発明の透かし情報を検出するた
めの装置の具体例の機能ブロック図、図6、7はこの装
置の動作を説明する流れ図であって、これらの図には、
音声データから透かし情報を検出する装置であって、パ
ルス符号変調された音声データを所定の長さのブロック
に分割する手段5と、前記ブロック化された各ブロック
の各音声データの所定のビットからビット情報を抽出す
る手段6と、前記ビット情報を抽出する手段6が抽出し
たビットデータから埋め込まれた透かし情報を推定する
ための手段7とで構成した透かし情報の検出装置110
が示されている。
【0026】又、前記埋め込まれた透かし情報を推定す
るための手段7は、各透かし情報が埋め込まれた前記各
ブロックの同一位置での透かし情報のビットデータが0
である位置の重みを演算して第1の値を求めると共に、
同様に前記各ブロックの同一位置での透かし情報のビッ
トデータが1である位置の重みを演算して第2の値を求
める第1の演算手段71と、前記第1の値と第2の値と
を比較する比較手段72とを含み、前記比較手段72の
比較結果に基づき透かし情報の埋め込みビットを推定す
るように構成した透かし情報の検出装置が示されてい
る。更に、前記埋め込まれた透かし情報を推定するため
の手段7は、各透かし情報の埋め込み位置での音声デー
タの変化率sを演算する第2の演算手段73と、この第
2の演算手段73の検出した変化率sから前記重みを求
める第3の演算手段74とで構成した透かし情報の検出
装置が示されている。
【0027】次に、この装置について更に具体的に説明
する。はじめに、埋め込み処理時と同一のデータ点数に
よる音楽データのブロック化を行う。次に、各ブロック
に対し、透かし情報の埋め込まれたビット列のビット情
報を抽出する。ところで、本発明では、透かし情報ビッ
トは音声データの変化率sの大きいところに埋め込まれ
ていることから、各ブロックの同一番目のサンプル点
で、抽出したビットが「0」の場合と、「1」の場合と
でそれぞれ、各々ブロックのサンプル点における変化率
の大きさに応じた重みを全ブロックにわたって足してい
き、その総和を求め、最後にその大小判定で透かし情報
ビットが0であるか1であるかを推定する。
【0028】これを実際の計算式で表すと以下のように
なる。iをサンプル点、jをブロックの順番、そのブロ
ックのサンプル点での重みをk[i][j]とし、ib
0[i][j]をビットが「0」の場合の各ブロックに
わたって重みを足していったものとし、ib1[i]
[j]をビットが「1」の場合の各ブロックにわたって
重みを足していったものとすると、次式で表すことがで
きる。 ib0[i][j]=ib0[i][j−1]+k[i][j] ・・・(4) ib1[i][j]=ib1[i][j−1]+k[i][j] ・・・(5)
【0029】また、重みk[i][j]としては、j番
目のブロック、i番目のサンプル点での変化率をs
[i][j]、音声データの最大振幅をmaxleve
lとすると、簡単化して以下のように表すことができ
る。 k[i][j]=s[i][j]/maxlevel ・・・(6)
【0030】そして、(4)、(5)式の結果からその
大小判定より透かし情報をビットを推定する。「0」の
場合の総和をIb0、「1」の場合の総和をIb1とす
ると、図6のステップS13は、図7の流れ図のように
示すことが出来る。
【0031】図8はib0とib1の計算途中を具体的
に示すものであり、図8(a)はブロック0(j=0)
の計算結果、図8(b)はブロック0の結果に、ブロッ
ク1(j=1)の結果をたし込んだ結果を示している。
【0032】次に、図8に示すように、最後に、透かし
埋め込みビットの推定結果から、図9のように、透かし
情報の先頭位置を表すヘッダ情報を検出し、続いてヘッ
ダ情報の次に来る透かし情報ビットを検出する。このよ
うに、本発明に係る音声データから透かし情報を検出す
る方法は、パルス符号変調された音声データを所定の長
さのブロックに分割する第1のステップS11と、前記
ブロック化された各ブロックの各音声データの所定のビ
ットからビット情報を抽出する第2のステップS12
と、前記ビット情報を抽出する手段が抽出したビットデ
ータから埋め込まれた透かし情報を推定する第3のステ
ップS13と、で透かし情報を検出するものであり、特
に、第4のステップS13は、各ブロックの同一位置の
透かし情報のビットデータが0である位置の重みを演算
して第1の値を求めると共に、同様に前記同一位置のビ
ットデータが1である位置の重みを演算して第2の値を
求め、前記第1の値と第2の値とを比較することで、透
かし情報の埋め込みビットを推定するステップを含むも
のであり、又、第4のステップS13は、各ブロックの
埋め込み位置での音声データの変化率を演算するステッ
プと、求めた変化率から前記重みを求めるステップと、
検出した各ブロックでの透かし情報のビットデータに対
応する前記重みをビットデータ0、1毎に夫々累計する
ステップとを含むものである。なお、本発明の透かし情
報の埋め込み及び検出は、ソフトウエアで目的を達成す
るようにしても良いし、ハードウエアで構成しても良
い。
【0033】従って、本発明に係る音声データに透かし
情報を埋め込んだ記録媒体は、音声データを埋め込む位
置の音声データの変化率が所定の閾値以上であるとき前
記透かし情報を埋め込むと共に、前記閾値は音声データ
を埋め込む位置近傍での音声データの変化率に基づき決
定され、且つ、前記透かし情報は略周期的に埋め込まれ
ているものである。
【0034】
【発明の効果】本発明は、上述のように構成したので、
以下のような効果を奏する。 (1)音声データの変化の大きいところに透かし情報を
埋め込むため、聴覚的にその影響が少ない。また、埋め
込まれるサンプル点の位置が分散されることからも、透
かし情報が発見されにくく、かつ音声に与える歪みも分
散して聴覚的にほとんど影響を与えない。 (2)音声データをブロック化して、ブロック化したデ
ータ各々に透かし情報を埋め込むため、透かし情報が全
音声データに周期的に埋め込まれることになり、任意に
切り出されたデータからも透かし情報が検出可能であ
る。 (3)埋め込まれた透かしビット情報を、重みづけした
多数決判定により特定するため、ビット誤りに強い。
【図面の簡単な説明】
【図1】本発明に係わる音声データに透かし情報を埋め
込む装置の機能ブロック図である。
【図2】図1の動作を説明する流れ図である。
【図3】音声データの時間的な変化の一例を示す波形図
である。
【図4】透かし情報を切り出したブロックに埋め込んだ
状態を説明するための図である。
【図5】埋め込んだ透かし情報を検出するための装置の
機能ブロック図である。
【図6】図5の動作を説明する流れ図である。
【図7】図5の動作を説明する流れ図である。
【図8】検出したビットの推定のための計算の具体例を
説明する図である。
【図9】検出した透かし情報であるビットの具体例を示
す図である。
【符号の説明】
1、5 音声データを所定の長さのブロックに分割す
る手段 2 音声データの変化率を演算する手段 3 埋め込みの可否を決定する手段 4 透かし情報を埋め込む埋め込み手段 6 ビット情報を抽出する手段 7 埋め込まれた透かし情報を推定するための手段 31 閾値を求める演算手段 32、72 比較手段 71 第1の演算手段 73 第2の演算手段 74 第3の演算手段
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成10年4月17日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】請求項20
【補正方法】変更
【補正内容】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】請求項21
【補正方法】変更
【補正内容】
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正内容】
【0008】又、本発明に係る音声データに透かし情報
を埋め込んだ記録媒体の第1態様は、音声データに透か
し情報を埋め込んだ記憶媒体であって、音声データを埋
め込む位置の音声データの変化率が所定の閾値以上であ
るとき前記透かし情報を埋め込むと共に、前記閾値は音
声データを埋め込む位置近傍での音声データの変化率に
基づき決定され、且つ、前記透かし情報は略周期的に埋
め込まれていることを特徴とするものである。又、本発
明のコンピュータプログラムを記録した記録媒体の第1
態様は、音声データに透かし情報を埋め込むコンピュー
タプログラムを記録した記録媒体であって、パルス符号
変調された音声データを所定の長さのブロックに分割す
る第1のステップと、前記ブロック化した音声データに
前記透かし情報を埋め込むため、埋め込み位置での音声
データの変化率を求める第2のステップと、前記変化率
から閾値を演算して求める第3のステップと、透かし情
報を埋め込むための埋め込み位置の変化率が、前記閾値
を超えている場合、前記透かし情報をその位置に埋め込
む第4のステップと、からなる一連の処理をコンピュー
タに実行させるためのプログラムを記録したことを特徴
とするものであり、又、第2態様は、パルス符号変調さ
れた音声データを所定の長さのブロックに分割する第5
のステップと、前記ブロック化された各ブロックの各音
声データの所定のビットからビット情報を抽出する第6
のステップと、前記第6のステップで抽出したビットデ
ータから埋め込まれた透かし情報を推定する第7のステ
ップと、からなる一連の処理をコンピュータに実行させ
るためのプログラムを記録したことを特徴とするもので
ある。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0033
【補正方法】変更
【補正内容】
【0033】従って、本発明に係る音声データに透かし
情報を埋め込んだ記録媒体は、音声データを埋め込む位
置の音声データの変化率が所定の閾値以上であるとき前
記透かし情報を埋め込むと共に、前記閾値は音声データ
を埋め込む位置近傍での音声データの変化率に基づき決
定され、且つ、前記透かし情報は略周期的に埋め込まれ
ているものである。又、本発明のコンピュータプログラ
ムを記録した記録媒体の第1態様は、音声データに透か
し情報を埋め込むコンピュータプログラムを記録した記
録媒体であって、パルス符号変調された音声データを所
定の長さのブロックに分割する第1のステップと、前記
ブロック化した音声データに前記透かし情報を埋め込む
ため、埋め込み位置での音声データの変化率を求める第
2のステップと、前記変化率から閾値を演算して求める
第3のステップと、透かし情報を埋め込むための埋め込
み位置の変化率が、前記閾値を超えている場合、前記透
かし情報をその位置に埋め込む第4のステップと、から
なる一連の処理をコンピュータに実行させるためのプロ
グラムを記録したことを特徴とするものであり、又、パ
ルス符号変調された音声データを所定の長さのブロック
に分割する第5のステップと、前記ブロック化された各
ブロックの各音声データの所定のビットからビット情報
を抽出する第6のステップと、前記第6のステップで抽
出したビットデータから埋め込まれた透かし情報を推定
する第7のステップと、からなる一連の処理をコンピュ
ータに実行させるためのプログラムを記録したことを特
徴とするものである。 ─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成11年7月12日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】全文
【補正方法】変更
【補正内容】
【書類名】 明細書
【発明の名称】 音声データに透かし情報を埋め込む装
置とその方法及び音声データから透かし情報を検出する
装置とその方法及びその記録媒体
【特許請求の範囲】
【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声データに透か
し情報を埋め込む装置とその方法及び音声データから透
かし情報を検出する装置とその方法及びその記録媒体に
係わり、特に、ディジタル化された音楽ソフトに著作権
情報等を人間の耳には識別できないように隠して付加
し、著作権保護等を行うのに好適な電子透かし技術に関
する。
【0002】
【従来の技術】音声データへの透かし情報埋め込み方式
としては、従来より、アナログをディジタル波形に量子
化する際の量子化差分、又は、量子化ノイズ等に透かし
情報を埋め込む量子化ノイズ利用型、音声信号の位相差
を利用する位相利用型、或いは、人間の耳のマスキング
効果を利用して透かし情報を埋め込むマスキング効果利
用型等が知られている。量子化ノイズ利用型は、下位ビ
ットに透かし情報を埋め込むため、多量のビット情報を
埋め込むことが出来るが、多量のビットを埋め込むと、
例えば、スポーツイベントのように観衆が発生する雑音
でかき消されてしまい、又、クラシック音楽のような場
合には聞こえてしまうという欠点があった。更に、下位
ビットに埋め込むため、雑音等による耐性が弱いという
欠点があった。一方、位相利用型やマスキング効果利用
型の透かし情報埋め込み方式では、透かし情報を埋め込
むことで、波形が歪むから音質を著しく悪化させるとい
う欠点があった。
【0003】
【発明が解決しようとする課題】本発明の目的は、上記
した従来技術の欠点を改良し、特に、音声の振幅の変化
率を求め、変化率が所定の閾値よりも大きいところに透
かし情報を埋め込むことにより、聴覚特性への影響をな
くし、又、音声の振幅の変化率が相対的に高い部分に透
かし情報を埋め込むことで、どのような波形でも周期的
に透かし情報の埋め込みを可能にする新規な音声データ
への透かし情報の埋め込み装置とその方法及びその記録
媒体を提供するものである。又、本発明の他の目的は、
少ない情報量、即ち、短時間の再生音声データでも前記
透かし情報の検出を可能にした新規な透かし情報の検出
装置とその方法を提供するものである。又、本発明の他
の目的は、透かし情報を周期的に埋め込むことで、任意
の区間で透かし情報を検出可能にした新規な電子透かし
技術を提供するものである。
【0004】
【課題を解決するための手段】本発明は上記した目的を
達成するため、基本的には、以下に記載されたような技
術構成を採用するものである。即ち、本発明に係わる音
声データに透かし情報を埋め込む装置の第1態様は、音
声データに透かし情報を埋め込む装置であって、パルス
符号変調された音声データを所定の長さのブロックに分
割する手段と、前記ブロック化した音声データに前記透
かし情報を埋め込むため埋め込み位置での音声の振幅
変化率を演算する手段と、前記変化率に基づき透かし情
報の埋め込みの可否を決定する手段と、前記埋め込みの
可否を決定する手段が透かし情報の埋め込みの決定した
部分に前記透かし情報を埋め込む埋め込み手段とで構成
したことを特徴とするものであり、又、第2態様は、前
記透かし情報の埋め込みの可否を決定する手段は、透か
し情報を埋め込むための埋め込み位置での前記変化率
が、所定の閾値を超えているか否かを比較する比較手段
を含み、この比較手段が、前記埋め込もうとする位置で
の変化率が前記所定の閾値を超えていることを検出した
場合、前記透かし情報を埋め込むものであることを特徴
とするものであり、又、第3態様は、前記透かし情報の
埋め込みの可否を決定する手段は、前記閾値を演算して
求める演算手段を含むことを特徴とするものであり、
又、第4態様は、前記演算手段は、前記閾値を変化率の
移動平均値に基づき求めるものであることを特徴とする
ものであり、又、第5態様は、前記透かし情報の埋め込
み手段は、透かし情報を識別するためのヘッダとこのヘ
ッダに続く透かし情報を、前記ブロック内に所定の長さ
で埋め込むものであることを特徴とするものであり、
又、第6態様は、前記透かし情報は、音声データの最下
位ビットを除くビットに埋め込むことを特徴とするもの
であり、又、第7態様は、前記透かし情報は、音声デー
タの最下位ビットに埋め込むことを特徴とするものであ
り、又、第8態様は、前記透かし情報は周期的に埋め込
まれることを特徴とするものである。
【0005】又、本発明に係わる音声データから透かし
情報を検出する装置の第1態様は、音声データから透か
し情報を検出する装置であって、パルス符号変調された
音声データを所定の長さのブロックに分割する手段と、
前記ブロック化された各ブロックの各音声データの所定
のビットからビット情報を抽出する手段と、前記ビット
情報を抽出する手段が抽出したビットデータから埋め込
まれた透かし情報を検出するための手段とで構成したこ
とを特徴とするものであり、又、第2態様は、前記埋め
込まれた透かし情報を検出するための手段は、各透かし
情報が埋め込まれた前記各ブロックの同一位置での透か
し情報のビットデータが0である位置の各重みの総和を
求めて第1の値を求めると共に、同様に前記各ブロック
の同一位置での透かし情報のビットデータが1である位
置の各重みの総和を求めて第2の値を求める第1の演算
手段と、前記第1の値と第2の値とを比較する比較手段
とを含み、前記比較手段の比較結果に基づき透かし情報
の埋め込みビットを検出することを特徴とするものであ
り、又、第3態様は、前記埋め込まれた透かし情報を
するための手段は、各透かし情報の埋め込み位置での
音声の振幅の変化率を演算する第2の演算手段と、この
第2の演算手段の検出した変化率から前記重みを求める
第3の演算手段を含むことを特徴とするものである。
【0006】又、本発明に係る音声データに透かし情報
を埋め込む方法の第1態様は、音声データに透かし情報
を埋め込む方法であって、パルス符号変調された音声デ
ータを所定の長さのブロックに分割する第1のステップ
と、前記ブロック化した音声の振幅に前記透かし情報を
埋め込むため、埋め込み位置での音声データの変化率を
求める第2のステップと、前記変化率から閾値を演算し
て求める第3のステップと、透かし情報を埋め込むため
の埋め込み位置の前記変化率が、前記閾値を超えている
場合、前記透かし情報をその位置に埋め込む第4のステ
ップと、を含むことを特徴とするものであり、又、第2
態様は、前記第4のステップでは、前記音声データを最
下位ビットを除くビットに埋め込むことを特徴とするも
のであり、又、第3態様は、前記第1乃至第4のステッ
プを繰り返すことで、前記ブロック内に所定の長さの透
かし情報を埋め込むことを特徴とするものであり、又、
第4態様は、前記透かし情報は周期的に埋め込まれるこ
とを特徴とするものである。
【0007】又、本発明に係る音声データから透かし情
報を検出する方法の第1態様は、音声データから透かし
情報を検出する方法であって、パルス符号変調された音
声データを所定の長さのブロックに分割する第1のステ
ップと、前記ブロック化された各ブロックの各音声デー
タの所定のビットからビット情報を抽出する第2のステ
ップと、前記ビット情報を抽出する手段が抽出したビッ
トデータから埋め込まれた透かし情報を検出する第3の
ステップと、を含むことを特徴とするものであり、又、
第2態様は、前記第4のステップは、各ブロックの同一
位置の透かし情報のビットデータが0である位置の各重
みの総和を求めて第1の値を求めると共に、同様に前記
同一位置のビットデータが1である位置の各重みの総和
を求めて第2の値を求め、前記第1の値と第2の値とを
比較することで、透かし情報の埋め込みビットを検出
るステップを含むことを特徴とするものであり、又、第
3態様は、前記第4のステップは、各ブロックの埋め込
み位置での音声の振幅の変化率を演算するステップと、
求めた変化率から前記重みを求めるステップと、検出し
た各ブロックでの透かし情報のビットデータに対応する
前記重みをビットデータ0、1毎に夫々累計するステッ
プとを含むことを特徴とするものである。
【0008】又、本発明に係る音声データに透かし情報
を埋め込んだ記録媒体の第1態様は、音声データに透か
し情報を埋め込んだ記憶媒体であって、前記透かし情報
を埋め込む位置の音声の振幅の変化率が所定の閾値以上
であるとき前記透かし情報を埋め込むと共に、前記閾値
前記透かし情報を埋め込む位置近傍での音声の振幅
変化率に基づき決定され、且つ、前記透かし情報は略周
期的に埋め込まれていることを特徴とするものである。
又、本発明のコンピュータプログラムを記録した記録媒
体の第1態様は、音声データに透かし情報を埋め込むコ
ンピュータプログラムを記録した記録媒体であって、パ
ルス符号変調された音声データを所定の長さのブロック
に分割する第1のステップと、前記ブロック化した音声
データに前記透かし情報を埋め込むため、埋め込み位置
での音声の振幅の変化率を求める第2のステップと、前
記変化率から閾値を演算して求める第3のステップと、
透かし情報を埋め込むための埋め込み位置の変化率が、
前記閾値を超えている場合、前記透かし情報をその位置
に埋め込む第4のステップと、からなる一連の処理をコ
ンピュータに実行させるためのプログラムを記録したこ
とを特徴とするものであり、又、第2態様は、パルス符
号変調された音声データを所定の長さのブロックに分割
する第5のステップと、前記ブロック化された各ブロッ
クの各音声データの所定のビットからビット情報を抽出
する第6のステップと、前記第6のステップで抽出した
ビットデータから埋め込まれた透かし情報を検出する第
7のステップと、からなる一連の処理をコンピュータに
実行させるためのプログラムを記録したことを特徴とす
るものである。
【0009】
【発明の実施の形態】本発明に係わる音声データに透か
し情報を埋め込む装置は、パルス符号変調された音声デ
ータを所定の長さのブロックに分割する手段と、前記ブ
ロック化した音声データに前記透かし情報を埋め込むた
め埋め込み位置での音声の振幅の変化率を演算する手段
と、前記変化率に基づき透かし情報の埋め込みの可否を
決定する手段と、前記埋め込みの可否を決定する手段が
透かし情報の埋め込みを決定した部分に前記透かし情報
を埋め込む埋め込み手段とで構成したことを特徴とする
ものであるから、透かし情報を周期的に埋め込むことが
可能である。特に、音声の振幅の変化率の高い部分に埋
め込む方式であるから、音質を悪化させることもなく、
埋め込むことが出来る。又、相対的に変化率の高い部分
に埋め込む構成であるから、記録されている音声データ
がどのような波形であっても、透かし情報を周期的に埋
め込むことが出来る。
【0010】又、本発明に係わる音声データから透かし
情報を検出する装置は、パルス符号変調された音声デー
タを所定の長さのブロックに分割する手段と、前記ブロ
ック化された各ブロックの各音声データの所定のビット
からビット情報を抽出する手段と、前記ビット情報を抽
出する手段が抽出したビットデータから埋め込まれた透
かし情報を検出するための手段とで構成したことを特徴
とするものであるから、任意に切り出された音声データ
から、常に埋め込まれた透かし情報を検出することが可
能である。
【0011】
【実施例】以下に、本発明に係わる音声データに透かし
情報を埋め込む装置とその方法及び音声データから透か
し情報を検出する装置とその方法の具体例を図面を参照
しながら詳細に説明する。始めに、本発明の音声データ
に透かし情報を埋め込む装置とその方法について説明す
る。本発明の透かし情報の埋め込み方式は、埋め込もう
とする音声データの時間的な位置において、その位置で
の音声データの変化率、即ち、所定時間での音声の振幅
の差異を検出し、その変化率が所定の閾値より高いとき
のみ透かし情報を埋め込み、反対に、変化率が前記所定
の閾値より低いときには透かし情報を埋め込まないよう
にして、聴感上透かし情報を感知できないように埋め込
むものである。
【0012】特に、本発明では、前記閾値を透かし情報
を埋め込もうとする位置より前の所定の区間の移動平均
値を基に前記閾値を決定しているから、記録されている
声波形がどのような波形であっても、透かし情報を周
期的に埋め込むことが出来る。
【0013】図1は、本発明の音声データの透かし情報
を埋め込む装置の具体例の機能ブロック図、図2はこの
装置の動作を説明する流れ図、図3は音声データの時間
的な変化の一例を示す波形図、図4は透かし情報をブロ
ックに埋め込んだ状態を説明する図であって、これらの
図には、音声データに透かし情報を埋め込む装置であっ
て、パルス符号変調された音声データDTを所定の長さ
のブロックに分割する手段1と、前記ブロック化した音
声データDTに前記透かし情報を埋め込むため埋め込み
予定位置での音声DTの振幅の変化率sを演算する手段
2と、前記変化率sに基づき透かし情報の埋め込みの可
否を決定する手段3と、前記埋め込みの可否を決定する
手段3が透かし情報の埋め込みの決定した位置に前記透
かし情報を埋め込む埋め込み手段4とで構成したことを
特徴とする装置100が示されている。
【0014】又、前記透かし情報の埋め込みの可否を決
定する手段3は、透かし情報を埋め込むための埋め込み
位置での変化率sが、所定の閾値haを超えているか否
かを比較する比較手段32を含み、この比較手段32
が、前記埋め込もうとする位置での変化率sが前記所定
の閾値haを超えていることを検出した場合、その位置
に前記透かし情報を埋め込むものであることが示され、
更に、前記透かし情報の埋め込みの可否を決定する手段
3は、前記閾値haを演算して求める演算手段31を含
むことが示されている。
【0015】次に、この装置について更に詳細に説明す
る。はじめに、透かし情報を周期的に埋め込むために、
音声データDT全体に対し、一定のサンプル点を含むよ
うにデータのブロック化を行い、各ブロックに対して、
以下の透かし情報の埋め込み処理を行う。透かし情報を
埋め込んだことによる聴感上歪みの影響を少なくするた
めに、音楽の振幅の変化率sを求め、変化率sの大きい
サンプル点のデータに透かし情報を埋め込む。
【0016】変化率の計算例としては、サンプル点iの
振幅の変化率s[i]をiの前後10点間の音楽データ
の振幅w[i+5]、w[i−5]の差として求め、簡
略化して式(1)のように計算する。またここで、情報
の検出をするため、透かし情報埋め込み前後で、この変
化率が変わらないようにするため、変化率を求める前に
透かし情報を埋め込むビット以下を0にしてから、変化
率を求める。
【0017】
【数1】
【0018】さて、本発明では式(1)で求めた変化率
がある閾値よりも大きい位置にのみ、透かし情報を埋め
込むように構成しているが、この場合、閾値を全ブロッ
クに対し一定の値に設定すると、変化率の低い点の多い
ブロックでは、埋め込める透かし情報が非常に少なくな
ってしまうので、変化率の平均値に応じて、閾値の値を
決め、どのブロックにも一定以上の透かし情報が埋め込
めるようにする。
【0019】例えば、図3の音楽データDTで具体的に
説明すると、11点の変化率から変化率の移動平均値a
s[i]を式(2)のように求め、その1/3の値をサ
ンプル点iの閾値ha[i]とすれば移動平均値as
[i]と閾値ha[i]は次式より求めることができ
る。
【0020】 as[i]={s[i−10]+s[i−9]+s[i−8]+s[i−7] +s[i−6]+s[i−5]+s[i−4]+s[i−3]+s[i−2] +s[i−1]+s[i]}/11 ・・・(2) ha[i]=as[i]/3 ・・・(3)
【0021】次に、ヘッダと透かし情報の埋め込みにつ
いて説明する。ブロック化したブロックの先頭のサンプ
ル点から順番に透かし情報のビット情報をIb[i]を
割り当てる。そして、音声データの透かし情報を埋め込
むビット列の情報をwb[i]とすると、変化率が閾値
より大きい場合にだけ、そのサンプル点に対応する透か
し情報のビットを音楽データのビットと入れ替えること
により透かし情報のビットを埋め込む。例えば、閾値よ
り大きい音楽データのビットをwb[i−5]、wb
[i−3]、wb[i]とした場合、埋め込む透かし情
報のビットはIb[i−5]、Ib[i−3]、Ib
[i]であり、Ib[i−4]、Ib[i−2]、Ib
[i−1]は埋め込まない。以上の処理をブロック化し
た全ブロックに行うことにより、全音声データに対し、
透かし情報のビットを周期的に埋め込む。
【0022】図4は、ブロックA0 、A1 、A2 ・・・
・・An に対し、透かし情報Ib[0]〜Ib[9]を
閾値に基づき埋め込んだ状態を模式的に示した図であ
り、各ブロックでIbが記入されていないビットには透
かし情報が埋め込まれていないことを示している。
【0023】図2は、透かし情報の埋め込みの流れを示
すフローチャートであり、上記したように、パルス符号
変調された音声データを所定の長さのブロックに分割す
る第1のステップS1と、前記ブロック化した音声デー
タに前記透かし情報を埋め込むため、埋め込み位置での
音声の振幅の変化率を求める第2のステップS2と、前
記変化率から閾値を演算して求める第3のステップと、
透かし情報を埋め込むための埋め込み位置の変化率が、
前記閾値を超えている場合、前記透かし情報をその位置
に埋め込む第4のステップS3、S4、S5とで、透か
し情報を埋め込んでいる。
【0024】次に、埋め込んだ透かし情報を検出するた
めの装置とその方法について説明する。本発明の透かし
情報は、閾値の値によっては、透かし情報が埋め込まれ
ていないビットも含まれている。この為、以下に示すよ
うな統計的手法を用いて、埋め込まれたビットを推定し
て特定するように構成している。
【0025】図5は、本発明の透かし情報を検出するた
めの装置の具体例の機能ブロック図、図6、7はこの装
置の動作を説明する流れ図であって、これらの図には、
音声データから透かし情報を検出する装置であって、パ
ルス符号変調された音声データを所定の長さのブロック
に分割する手段5と、前記ブロック化された各ブロック
の各音声データの所定のビットからビット情報を抽出す
る手段6と、前記ビット情報を抽出する手段6が抽出し
たビットデータから埋め込まれた透かし情報を検出する
ための手段7とで構成した透かし情報の検出装置110
が示されている。
【0026】又、前記埋め込まれた透かし情報を検出
るための手段7は、各透かし情報が埋め込まれた前記各
ブロックの同一位置での透かし情報のビットデータが0
である位置の各重みの総和を求めて第1の値を求めると
共に、同様に前記各ブロックの同一位置での透かし情報
のビットデータが1である位置の各重みの総和を求めて
第2の値を求める第1の演算手段71と、前記第1の値
と第2の値とを比較する比較手段72とを含み、前記比
較手段72の比較結果に基づき透かし情報の埋め込みビ
ットを推定するように構成した透かし情報の検出装置が
示されている。更に、前記埋め込まれた透かし情報を
するための手段7は、各透かし情報の埋め込み位置で
の音声の振幅の変化率sを演算する第2の演算手段73
と、この第2の演算手段73の検出した変化率sから前
記重みを求める第3の演算手段74とで構成した透かし
情報の検出装置が示されている。
【0027】次に、この装置について更に具体的に説明
する。はじめに、埋め込み処理時と同一のデータ点数に
よる音楽データのブロック化を行う。次に、各ブロック
に対し、透かし情報の埋め込まれたビット列のビット情
報を抽出する。ところで、本発明では、透かし情報ビッ
トは音声データの変化率sの大きいところに埋め込まれ
ていることから、各ブロックの同一番目のサンプル点
で、抽出したビットが「0」の場合と、「1」の場合と
でそれぞれ、各々ブロックのサンプル点における変化率
の大きさに応じた重みを全ブロックにわたって足してい
き、その総和を求め、最後にその大小判定で透かし情報
ビットが0であるか1であるかを推定する。
【0028】これを実際の計算式で表すと以下のように
なる。iをサンプル点、jをブロックの順番、そのブロ
ックのサンプル点での重みをk[i][j]とし、ib
0[i][j]をビットが「0」の場合の各ブロックに
わたって重みを足していったものとし、ib1[i]
[j]をビットが「1」の場合の各ブロックにわたって
重みを足していったものとすると、次式で表すことがで
きる。 ib0[i][j]=ib0[i][j−1]+k[i][j] ・・・(4) ib1[i][j]=ib1[i][j−1]+k[i][j] ・・・(5)
【0029】また、重みk[i][j]としては、j番
目のブロック、i番目のサンプル点での変化率をs
[i][j]、音声データの最大振幅をmaxleve
lとすると、簡単化して以下のように表すことができ
る。 k[i][j]=s[i][j]/maxlevel ・・・(6)
【0030】そして、(4)、(5)式の結果からその
大小判定より透かし情報をビットを推定する。「0」の
場合の総和をIb0、「1」の場合の総和をIb1とす
ると、図6のステップS13は、図7の流れ図のように
示すことが出来る。
【0031】図8はib0とib1の計算途中を具体的
に示すものであり、図8(a)はブロック0(j=0)
の計算結果、図8(b)はブロック0の結果に、ブロッ
ク1(j=1)の結果をたし込んだ結果を示している。
【0032】次に、図8に示すように、最後に、透かし
埋め込みビットの推定結果から、図9のように、透かし
情報の先頭位置を表すヘッダ情報を検出し、続いてヘッ
ダ情報の次に来る透かし情報ビットを検出する。このよ
うに、本発明に係る音声データから透かし情報を検出す
る方法は、パルス符号変調された音声データを所定の長
さのブロックに分割する第1のステップS11と、前記
ブロック化された各ブロックの各音声データの所定のビ
ットからビット情報を抽出する第2のステップS12
と、前記ビット情報を抽出する手段が抽出したビットデ
ータから埋め込まれた透かし情報を検出する第3のステ
ップS13と、で透かし情報を検出するものであり、特
に、第4のステップS13は、各ブロックの同一位置の
透かし情報のビットデータが0である位置の各重みの総
和を求めて第1の値を求めると共に、同様に前記同一位
置のビットデータが1である位置の各重みの総和を求め
第2の値を求め、前記第1の値と第2の値とを比較す
ることで、透かし情報の埋め込みビットを検出するステ
ップを含むものであり、又、第4のステップS13は、
各ブロックの埋め込み位置での音声の振幅の変化率を演
算するステップと、求めた変化率から前記重みを求める
ステップと、検出した各ブロックでの透かし情報のビッ
トデータに対応する前記重みをビットデータ0、1毎に
夫々累計するステップとを含むものである。なお、本発
明の透かし情報の埋め込み及び検出は、ソフトウエアで
目的を達成するようにしても良いし、ハードウエアで構
成しても良い。
【0033】従って、本発明に係る音声データに透かし
情報を埋め込んだ記録媒体は、前記透かし情報を埋め込
む位置の音声の振幅の変化率が所定の閾値以上であると
き前記透かし情報を埋め込むと共に、前記閾値は前記透
かし情報を埋め込む位置近傍での音声の振幅の変化率に
基づき決定され、且つ、前記透かし情報は略周期的に埋
め込まれているものである。又、本発明のコンピュータ
プログラムを記録した記録媒体の第1態様は、音声デー
タに透かし情報を埋め込むコンピュータプログラムを記
録した記録媒体であって、パルス符号変調された音声デ
ータを所定の長さのブロックに分割する第1のステップ
と、前記ブロック化した音声データに前記透かし情報を
埋め込むため、埋め込み位置での音声の振幅の変化率を
求める第2のステップと、前記変化率から閾値を演算し
て求める第3のステップと、透かし情報を埋め込むため
の埋め込み位置の変化率が、前記閾値を超えている場
合、前記透かし情報をその位置に埋め込む第4のステッ
プと、からなる一連の処理をコンピュータに実行させる
ためのプログラムを記録したことを特徴とするものであ
り、又、第2態様は、パルス符号変調された音声データ
を所定の長さのブロックに分割する第5のステップと、
前記ブロック化された各ブロックの各音声データの所定
のビットからビット情報を抽出する第6のステップと、
前記第6のステップで抽出したビットデータから埋め込
まれた透かし情報を検出する第7のステップと、からな
る一連の処理をコンピュータに実行させるためのプログ
ラムを記録したことを特徴とするものである。
【0034】
【発明の効果】本発明は、上述のように構成したので、
以下のような効果を奏する。 (1)音声の振幅の変化の大きいところに透かし情報を
埋め込むため、聴覚的にその影響が少ない。また、埋め
込まれるサンプル点の位置が分散されることからも、透
かし情報が発見されにくく、かつ音声に与える歪みも分
散して聴覚的にほとんど影響を与えない。 (2)音声データをブロック化して、ブロック化したデ
ータ各々に透かし情報を埋め込むため、透かし情報が全
音声データに周期的に埋め込まれることになり、任意に
切り出されたデータからも透かし情報が検出可能であ
る。 (3)埋め込まれた透かしビット情報を、重みづけした
多数決判定により特定するため、ビット誤りに強い。
【図面の簡単な説明】
【図1】本発明に係わる音声データに透かし情報を埋め
込む装置の機能ブロック図である。
【図2】図1の動作を説明する流れ図である。
【図3】音声データの時間的な変化の一例を示す波形図
である。
【図4】透かし情報を切り出したブロックに埋め込んだ
状態を説明するための図である。
【図5】埋め込んだ透かし情報を検出するための装置の
機能ブロック図である。
【図6】図5の動作を説明する流れ図である。
【図7】図5の動作を説明する流れ図である。
【図8】検出したビットの推定のための計算の具体例を
説明する図である。
【図9】検出した透かし情報であるビットの具体例を示
す図である。
【符号の説明】 1、5 音声データを所定の長さのブロックに分割す
る手段 2 音声の振幅の変化率を演算する手段 3 埋め込みの可否を決定する手段 4 透かし情報を埋め込む埋め込み手段 6 ビット情報を抽出する手段 7 埋め込まれた透かし情報を推定するための手段 31 閾値を求める演算手段 32、72 比較手段 71 第1の演算手段 73 第2の演算手段 74 第3の演算手段

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 音声データに透かし情報を埋め込む装置
    であって、 パルス符号変調された音声データを所定の長さのブロッ
    クに分割する手段と、 前記ブロック化した音声データに前記透かし情報を埋め
    込むため埋め込み位置での音声データの変化率を演算す
    る手段と、 前記変化率に基づき透かし情報の埋め込みの可否を決定
    する手段と、 前記埋め込みの可否を決定する手段が透かし情報の埋め
    込みを決定した部分に前記透かし情報を埋め込む埋め込
    み手段と、で構成したことを特徴とする音声データに透
    かし情報を埋め込む装置。
  2. 【請求項2】 前記透かし情報の埋め込みの可否を決定
    する手段は、透かし情報を埋め込むための埋め込み位置
    での変化率が、所定の閾値を超えているか否かを比較す
    る比較手段を含み、この比較手段が、前記埋め込もうと
    する位置での変化率が前記所定の閾値を超えていること
    を検出した場合、前記透かし情報を埋め込むものである
    ことを特徴とする請求項1記載の音声データに透かし情
    報を埋め込む装置。
  3. 【請求項3】 前記透かし情報の埋め込みの可否を決定
    する手段は、前記閾値を演算して求める演算手段を含む
    ことを特徴とする請求項1又は2記載の音声データに透
    かし情報を埋め込む装置。
  4. 【請求項4】 前記演算手段は、前記閾値を変化率の移
    動平均値に基づき求めるものであることを特徴とする請
    求項3記載の音声データに透かし情報を埋め込む装置。
  5. 【請求項5】 前記透かし情報の埋め込み手段は、透か
    し情報を識別するためのヘッダとこのヘッダに続く透か
    し情報を、前記ブロック内に所定の長さで埋め込むもの
    であることを特徴とする請求項1乃至4の何れかに記載
    の音声データに透かし情報を埋め込む装置。
  6. 【請求項6】 前記透かし情報は、音声データの最下位
    ビットを除くビットに埋め込むことを特徴とする請求項
    1乃至5の何れかに記載の音声データに透かし情報を埋
    め込む装置。
  7. 【請求項7】 前記透かし情報は、音声データの最下位
    ビットに埋め込むことを特徴とする請求項1乃至5の何
    れかに記載の音声データに透かし情報を埋め込む装置。
  8. 【請求項8】 前記透かし情報は周期的に埋め込まれる
    ことを特徴とする請求項1乃至7の何れかに記載の音声
    データに透かし情報を埋め込む装置。
  9. 【請求項9】 音声データから透かし情報を検出する装
    置であって、 パルス符号変調された音声データを所定の長さのブロッ
    クに分割する手段と、 前記ブロック化された各ブロックの各音声データの所定
    のビットからビット情報を抽出する手段と、 前記ビット情報を抽出する手段が抽出したビットデータ
    から埋め込まれた透かし情報を推定するための手段とで
    構成したことを特徴とする音声データから透かし情報を
    検出する装置。
  10. 【請求項10】 前記埋め込まれた透かし情報を推定す
    るための手段は、各透かし情報が埋め込まれた前記各ブ
    ロックの同一位置での透かし情報のビットデータが0で
    ある位置の重みを演算して第1の値を求めると共に、同
    様に前記各ブロックの同一位置での透かし情報のビット
    データが1である位置の重みを演算して第2の値を求め
    る第1の演算手段と、前記第1の値と第2の値とを比較
    する比較手段とを含み、前記比較手段の比較結果に基づ
    き透かし情報の埋め込みビットを推定することを特徴と
    する請求項9記載の音声データから透かし情報を検出す
    る装置。
  11. 【請求項11】 前記埋め込まれた透かし情報を推定す
    るための手段は、各透かし情報の埋め込み位置での音声
    データの変化率を演算する第2の演算手段と、この第2
    の演算手段の検出した変化率から前記重みを求める第3
    の演算手段を含むことを特徴とする請求項10記載の音
    声データから透かし情報を検出する装置。
  12. 【請求項12】 音声データに透かし情報を埋め込む方
    法であって、 パルス符号変調された音声データを所定の長さのブロッ
    クに分割する第1のステップと、 前記ブロック化した音声データに前記透かし情報を埋め
    込むため、埋め込み位置での音声データの変化率を求め
    る第2のステップと、 前記変化率から閾値を演算して求める第3のステップ
    と、 透かし情報を埋め込むための埋め込み位置の変化率が、
    前記閾値を超えている場合、前記透かし情報をその位置
    に埋め込む第4のステップと、 を含むことを特徴とする音声データに透かし情報を埋め
    込む方法。
  13. 【請求項13】 前記第4のステップでは、前記音声デ
    ータを最下位ビットを除くビットに埋め込むことを特徴
    とする請求項12記載の音声データに透かし情報を埋め
    込む方法。
  14. 【請求項14】 前記第1乃至第4のステップを繰り返
    すことで、前記ブロック内に所定の長さの透かし情報を
    埋め込むことを特徴とする請求項12又は13記載の音
    声データに透かし情報を埋め込む方法。
  15. 【請求項15】 前記透かし情報は周期的に埋め込まれ
    ることを特徴とする請求項12乃至14の何れかに記載
    の音声データに透かし情報を埋め込む方法。
  16. 【請求項16】 音声データから透かし情報を検出する
    方法であって、 パルス符号変調された音声データを所定の長さのブロッ
    クに分割する第1のステップと、 前記ブロック化された各ブロックの各音声データの所定
    のビットからビット情報を抽出する第2のステップと、 前記ビット情報を抽出する手段が抽出したビットデータ
    から埋め込まれた透かし情報を推定する第3のステップ
    と、 を含むことを特徴とする音声データから透かし情報を検
    出する方法。
  17. 【請求項17】 前記第4のステップは、各ブロックの
    同一位置の透かし情報のビットデータが0である位置の
    重みを演算して第1の値を求めると共に、同様に前記同
    一位置のビットデータが1である位置の重みを演算して
    第2の値を求め、前記第1の値と第2の値とを比較する
    ことで、透かし情報の埋め込みビットを推定するステッ
    プを含むことを特徴とする請求項16記載の音声データ
    から透かし情報を検出する方法。
  18. 【請求項18】 前記第4のステップは、各ブロックの
    埋め込み位置での音声データの変化率を演算するステッ
    プと、求めた変化率から前記重みを求めるステップと、
    検出した各ブロックでの透かし情報のビットデータに対
    応する前記重みをビットデータ0、1毎に夫々累計する
    ステップとを含むことを特徴とする請求項16又は17
    記載の音声データから透かし情報を検出する方法。
  19. 【請求項19】 音声データに透かし情報を埋め込んだ
    記憶媒体であって、 音声データを埋め込む位置の音声データの変化率が所定
    の閾値以上であるとき前記透かし情報を埋め込むと共
    に、前記閾値は音声データを埋め込む位置近傍での音声
    データの変化率に基づき決定され、且つ、前記透かし情
    報は略周期的に埋め込まれていることを特徴とする記録
    媒体。
  20. 【請求項20】 前記透かし情報は、音声データの最下
    位ビットを除くビットに埋め込まれたものであることを
    特徴とする請求項19記載の記録媒体。
  21. 【請求項21】 前記透かし情報は、音声データの最下
    位ビットに埋め込まれたものであることを特徴とする請
    求項19記載の記録媒体。
JP09580898A 1998-04-08 1998-04-08 音声データに透かし情報を埋め込む装置とその方法及び音声データから透かし情報を検出する装置とその方法及びその記録媒体 Expired - Fee Related JP3321767B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09580898A JP3321767B2 (ja) 1998-04-08 1998-04-08 音声データに透かし情報を埋め込む装置とその方法及び音声データから透かし情報を検出する装置とその方法及びその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09580898A JP3321767B2 (ja) 1998-04-08 1998-04-08 音声データに透かし情報を埋め込む装置とその方法及び音声データから透かし情報を検出する装置とその方法及びその記録媒体

Publications (2)

Publication Number Publication Date
JPH11296200A true JPH11296200A (ja) 1999-10-29
JP3321767B2 JP3321767B2 (ja) 2002-09-09

Family

ID=14147733

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09580898A Expired - Fee Related JP3321767B2 (ja) 1998-04-08 1998-04-08 音声データに透かし情報を埋め込む装置とその方法及び音声データから透かし情報を検出する装置とその方法及びその記録媒体

Country Status (1)

Country Link
JP (1) JP3321767B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001118330A (ja) * 1999-10-18 2001-04-27 Yamaha Corp データ生成方法、記録装置、記録媒体、および再生装置
EP1333424A2 (en) * 2002-02-04 2003-08-06 Fujitsu Limited Method, apparatus and system for embedding data in and extracting data from encoded voice code
KR100458492B1 (ko) * 2000-06-08 2004-12-03 주식회사 마크애니 디지털 오디오 컨텐츠 저작권 보호 및 복사 방지를 위한워터마크의 삽입/추출 방법 및 이를 이용한 장치
WO2005119650A1 (ja) * 2004-06-04 2005-12-15 Matsushita Electric Industrial Co., Ltd. 音声合成装置
JP2007325284A (ja) * 2007-06-18 2007-12-13 Trinity Security Systems Inc デジタルコピー防止処理装置、その装置により処理されたデジタルデータを記録した再生可能な記録媒体、デジタルコピー防止処理方法、その方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体およびその方法により処理されたデジタルデータを記録した再生可能な記録媒体
US7310596B2 (en) 2002-02-04 2007-12-18 Fujitsu Limited Method and system for embedding and extracting data from encoded voice code
WO2008114432A1 (ja) * 2007-03-20 2008-09-25 Fujitsu Limited データ埋め込み装置、データ抽出装置、及び音声通信システム
JP2010507109A (ja) * 2006-10-18 2010-03-04 デスティニー ソフトウェア プロダクションズ インコーポレイテッド メディアデータに電子透かしを付与する方法
CN105283916A (zh) * 2013-06-11 2016-01-27 株式会社东芝 电子水印嵌入装置、电子水印嵌入方法及电子水印嵌入程序

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001118330A (ja) * 1999-10-18 2001-04-27 Yamaha Corp データ生成方法、記録装置、記録媒体、および再生装置
KR100458492B1 (ko) * 2000-06-08 2004-12-03 주식회사 마크애니 디지털 오디오 컨텐츠 저작권 보호 및 복사 방지를 위한워터마크의 삽입/추출 방법 및 이를 이용한 장치
EP1693832A3 (en) * 2002-02-04 2007-06-20 Fujitsu Limited Method, apparatus and system for embedding data in and extracting data from encoded voice code
EP1333424A3 (en) * 2002-02-04 2005-07-13 Fujitsu Limited Method, apparatus and system for embedding data in and extracting data from encoded voice code
EP1693832A2 (en) * 2002-02-04 2006-08-23 Fujitsu Limited Method, apparatus and system for embedding data in and extracting data from encoded voice code
EP1333424A2 (en) * 2002-02-04 2003-08-06 Fujitsu Limited Method, apparatus and system for embedding data in and extracting data from encoded voice code
US7310596B2 (en) 2002-02-04 2007-12-18 Fujitsu Limited Method and system for embedding and extracting data from encoded voice code
WO2005119650A1 (ja) * 2004-06-04 2005-12-15 Matsushita Electric Industrial Co., Ltd. 音声合成装置
US7526430B2 (en) 2004-06-04 2009-04-28 Panasonic Corporation Speech synthesis apparatus
JP2010507109A (ja) * 2006-10-18 2010-03-04 デスティニー ソフトウェア プロダクションズ インコーポレイテッド メディアデータに電子透かしを付与する方法
WO2008114432A1 (ja) * 2007-03-20 2008-09-25 Fujitsu Limited データ埋め込み装置、データ抽出装置、及び音声通信システム
JP2007325284A (ja) * 2007-06-18 2007-12-13 Trinity Security Systems Inc デジタルコピー防止処理装置、その装置により処理されたデジタルデータを記録した再生可能な記録媒体、デジタルコピー防止処理方法、その方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体およびその方法により処理されたデジタルデータを記録した再生可能な記録媒体
JP4503048B2 (ja) * 2007-06-18 2010-07-14 株式会社トリニティーセキュリティーシステムズ デジタルコピー防止処理装置、その装置により処理されたデジタルデータを記録した再生可能な記録媒体、デジタルコピー防止処理方法、その方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体およびその方法により処理されたデジタルデータを記録した再生可能な記録媒体
CN105283916A (zh) * 2013-06-11 2016-01-27 株式会社东芝 电子水印嵌入装置、电子水印嵌入方法及电子水印嵌入程序

Also Published As

Publication number Publication date
JP3321767B2 (ja) 2002-09-09

Similar Documents

Publication Publication Date Title
US8055505B2 (en) Audio content digital watermark detection
JP5722912B2 (ja) 音響通信方法及び音響通信方法を実行させるためのプログラムを記録した記録媒体
JP4560269B2 (ja) 無音検出
WO2011070971A1 (ja) 制御装置および方法、並びにプログラム
JP4769673B2 (ja) オーディオ信号補間方法及びオーディオ信号補間装置
US20140278447A1 (en) Digital watermark detection device and digital watermark detection method, as well as tampering detection device using digital watermark and tampering detection method using digital watermark
DE60313370D1 (de) Verfahren zur einbettung und detektion eines wasserzeichens in einem digitalen audiosignal
KR20010021226A (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
Foo et al. An adaptive audio watermarking system
JP3321767B2 (ja) 音声データに透かし情報を埋め込む装置とその方法及び音声データから透かし情報を検出する装置とその方法及びその記録媒体
JP2005227782A (ja) 有声音および無声音の検出装置、並びにその方法
KR101081778B1 (ko) 저-레벨 신호들에 대한 정밀도의 손실을 감소시키기 위한 동적 정규화 시스템들 및 방법들
Kirovski et al. Spread-spectrum audio watermarking: requirements, applications, and limitations
JP5879075B2 (ja) 電子透かし検出装置及び電子透かし検出方法
US20090285410A1 (en) Restoring audio signals
JP4413175B2 (ja) 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体
JP4310145B2 (ja) オーディオデータの透かし情報埋め込み方法、埋め込みプログラム及び検出方法
JP4839721B2 (ja) 音響信号に対する情報の埋め込み装置
KR101261528B1 (ko) 복호화된 오디오 신호의 오류 은폐 방법 및 장치
CN107104650A (zh) 增益调节方法、装置、音频编码器及音响设备
JP2007515678A (ja) 信号内の透かしを検出する方法及び装置
KR20060112667A (ko) 워터마크 임베딩
JP3753956B2 (ja) 符号化装置
JP2014092677A (ja) データ埋め込みプログラム、方法及び装置、検出プログラム及び方法、並びに携帯端末
JP5889601B2 (ja) 音響信号に対する改ざん検出方法及び改ざん検出装置

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110628

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110628

Year of fee payment: 9

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110628

Year of fee payment: 9

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees