JP5987511B2 - 音響信号に対する妨害音の埋め込み装置 - Google Patents

音響信号に対する妨害音の埋め込み装置 Download PDF

Info

Publication number
JP5987511B2
JP5987511B2 JP2012154254A JP2012154254A JP5987511B2 JP 5987511 B2 JP5987511 B2 JP 5987511B2 JP 2012154254 A JP2012154254 A JP 2012154254A JP 2012154254 A JP2012154254 A JP 2012154254A JP 5987511 B2 JP5987511 B2 JP 5987511B2
Authority
JP
Japan
Prior art keywords
modified
sound
frequency
numbered
acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012154254A
Other languages
English (en)
Other versions
JP2014017687A (ja
Inventor
茂出木 敏雄
敏雄 茂出木
慎一 宮崎
慎一 宮崎
関口 剛
剛 関口
祐二 小須田
祐二 小須田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2012154254A priority Critical patent/JP5987511B2/ja
Publication of JP2014017687A publication Critical patent/JP2014017687A/ja
Application granted granted Critical
Publication of JP5987511B2 publication Critical patent/JP5987511B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、CD・DVD・BD等を用いた民生・業務用途における鑑賞用のパッケージ音楽分野、および音楽コンテンツプロバイダー等が商業目的で配信するネットワーク音楽配信分野に関し、特に、映画館・劇場等における音の盗音を防止する技術に関する。
従来、音楽コンテンツの複製防止のため、様々な技術が開発されている。例えば、DRM(Digital Rights Management:特許文献1参照)という方式では、デジタルの音楽コンテンツに暗号化を施すことにより音楽コンテンツの複製を防止している。しかし、DRM方式では、デジタルコンテンツのコピーを防止することは可能であるが、アナログコンテンツのコピーを防止することはできない。すなわち、再生信号をスピーカ出力よりボイスレコーダまたはマイクロフォンで録音することにより複製可能となる。この時、録音機器はポケットやカバンに収納した状態で複製行為が実行できるため、音楽コンテンツの違法複製の取り締まりを困難にしている。
現状、国内における最も大きな問題は、海外の映画館で違法録画された映像コンテンツの日本語版が上映されている映画館にポケットに収納可能な携帯型ボイスレコーダまたはスマートフォンを持ち込み、スピーカから流れるサウンドトラックだけを隠し録りし、先の海外で違法録画された映像コンテンツのサウンドトラックを差し替えて、ネットに配信する行為により、映画館の興業収入や正規版のDVD・BDの売り上げにダメージを与えていることである。日本国内で行われる映画の盗撮行為は海賊版作成といった商業目的ではなく、動画投稿サイトにアップするといったボランティア目的である。スクリーンの盗撮は、犯行が目立ちやすく、法整備により検挙されたときの罰則が厳しくなったため、リスクを背負ってまでボランティア目的で犯行する人はいなくなった。しかし、サウンドトラックの違法録音については、暗い映画館の中で目撃されるリスクは殆どないため、前述のような行為がポピュラーになり、業界関係者は対策に苦慮している。
特表2003−517767号公報 特開2008−256948号公報 特開2009−75332号公報
アナログ的な音響コンテンツの複製を防止する手法として、出願人は、音響信号に所定の改変を加えることにより、付加情報を聴取不能な状態で埋め込む技術を開発している。特に、ヒトの聴覚感度が高い周波数範囲においても、音脈分凝の原理により不快感なく付加情報の埋め込みを行う技術も提案している(特許文献2、3参照)。この方法では、スピーカから再生される音波に対してマイクロフォンで再録音した音響コンテンツや、種々な方法で圧縮が施された音響コンテンツからも所定の付加情報を抽出することができ、付加情報として著作権者を特定する情報を埋め込んでおけば、違法コピーであることを証明することができる。しかし、違法コピー行為自体を阻止することはできず、違法コピーされた音響コンテンツに埋め込まれている付加情報は聴取されないため、違法コピーされた音響コンテンツは商用品質を維持できないかもしれないが、通常の鑑賞には支障をきたさないという問題がある。
そこで、本発明は、音響信号に所定の改変を加えることにより改変を加えた音響信号の再生時に聴取されないように妨害音を埋め込み、改変を加えた音響信号の再生により発せられた音をアナログ的に録音または圧縮処理により帯域圧縮が施された場合に、帯域圧縮された複製音響信号の再生時に発生された妨害音が聴取されるようにすることが可能な音響信号に対する妨害音の埋め込み装置を提供することを課題とする。
上記課題を解決するため、本発明第1の態様では、時系列のサンプル列で構成される音響信号に対して、改変対象の周波数帯である改変周波数帯に対して改変を加え、改変を加えて得られる改変音響信号を再生した場合には聴取不能であり、前記改変音響信号を改変周波数帯に対して高域または低域の所定の成分を除いて複製した複製音響信号を再生した場合に可聴となるように妨害音を埋め込む装置であって、前記音響信号より、所定数のサンプルを1つの音響フレームとして読み込む音響フレーム読込手段と、前記読み込んだ音響フレームに対して、所定の窓関数を用いて時間−周波数変換を行い、周波数成分である窓スペクトルを得る時間−周波数変換手段と、前記窓スペクトルの中で奇数番目の音響フレームに対応する奇数窓スペクトルから前記改変周波数帯における奇数スペクトル集合を抽出し、前記奇数番目の音響フレームに隣接する偶数番目の音響フレームに対応する偶数窓スペクトルから前記改変周波数帯における偶数スペクトル集合を抽出し、互いに対応する前記奇数スペクトル集合の成分と偶数スペクトル集合の成分を、両者が互いの値を所定の割合だけ反映するように改変を加える周波数成分改変手段と、前記周波数成分が改変された奇数スペクトル集合を含む奇数窓スペクトル、および前記周波数成分が改変された偶数スペクトル集合を含む偶数窓スペクトルに対して周波数−時間変換を行って、改変音響フレームを生成する周波数−時間変換手段と、前記生成された改変音響フレームを順次出力する改変音響フレーム出力手段と、を有することを特徴とする音響信号に対する妨害音の埋め込み装置を提供する。
本発明第1の態様によれば、音響信号において、奇数番目および偶数番目の音響フレームに対して周波数変換を行って、奇数窓スペクトルおよび偶数窓スペクトルを得て、改変周波数帯における互いに対応する前記奇数スペクトル集合の成分と偶数スペクトル集合の成分を、両者が互いの値を所定の割合だけ反映するように改変を加えるようにしたので、改変周波数帯における音脈が局所的に逆転することになり、音響信号の逆回し再生に類似した顕著な雑音(妨害音)が発生するが、スピーカから発せられた音を人が聞いた場合には、改変周波数帯における音脈の局所的な逆転成分は、音脈分凝に類似の作用により改変周波数帯に隣接する上下の周波数帯からの原音の音脈に揃うように補間されるため、妨害音は聞こえない。しかし、録音機器で、スピーカから発せられた音を録音した場合には、録音機器等の感度特性に基づいて帯域幅が圧縮された複製音響信号が得られるため、その複製音響信号を再生した場合には、改変周波数帯に記録された妨害信号に隣接する上下いずれかの周波数成分が欠落するため、改変周波数帯における音脈の局所的な逆転成分に対する前記補間作用は働かなくなり、妨害音として再生されるため、鑑賞に堪える品質で再生可能な録音を防止することが可能になる。
本発明第2の態様では、本発明第1の態様の音響信号に対する妨害音の埋め込み装置において、前記改変周波数帯として互いに他の改変周波数帯と重ならないように複数個の改変周波数帯を設定し、前記周波数成分改変手段は、前記複数個の改変周波数帯に対して、改変を加えることを特徴とする。
本発明第2の態様によれば、改変周波数帯を複数個設定し、複数個の改変周波数帯に対して、改変を加えるようにしたので、録音機器の周波数感度の上限と下限の一方が、1つの改変周波数帯付近でない場合であっても、録音機器の周波数感度の上限と下限の他方が、別の改変周波数帯付近となる確率が高まり、複製音響信号において、改変周波数帯に隣接し、録音機器等の感度を超える成分を欠落させることができる可能性も高くなる。即ち、種々の入力周波数特性をもつ録音機器に対して所望の妨害音を発生させる効果をもたせることができる。
本発明第3の態様では、本発明第1または第2の態様の音響信号に対する妨害音の埋め込み装置において、前記周波数成分改変手段は、前記改変周波数帯における奇数スペクトル集合の成分と偶数スペクトル集合の成分を、それぞれ自身の割合と他方の割合を加えて1になる範囲で、両者が互いの値を所定の割合だけ反映するように改変を加えることを特徴とする。
本発明第3の態様によれば、改変周波数帯における処理で、奇数スペクトル集合の成分と偶数スペクトル集合の成分を、両者が互いの値を所定の割合だけ反映する改変を行う際に、奇数スペクトル集合の成分、偶数スペクトル集合の成分、それぞれについて一方の割合と他方の割合を加えて1になる範囲で反映させるようにしたので、音響信号の平均的な振幅は原音と大きく変化させることなく、2つの音響フレーム間における流れを逆転させることが可能となる。
本発明第4の態様では、本発明第3の態様の音響信号に対する妨害音の埋め込み装置において、前記周波数成分改変手段は、前記改変周波数帯における奇数スペクトル集合の成分と偶数スペクトル集合の成分を、それぞれ自身の割合を0、他方の割合を1として成分を交換するように改変を加えることを特徴とする。
本発明第4の態様によれば、改変周波数帯における奇数スペクトル集合の成分と偶数スペクトル集合の成分を、それぞれ自身の割合を0、他方の割合を1として成分を交換するようにしたので、連続する2つの音響フレーム間で流れが完全に逆転し、妨害音を明瞭に発生させることが可能となる。
本発明第5の態様では、本発明第1から第4のいずれかの態様の音響信号に対する妨害音の埋め込み装置において、前記改変周波数帯として、100Hzから500Hzの範囲、6kHzから16kHzの範囲のいずれか一方、または双方を少なくとも設定することを特徴とする。
本発明第5の態様によれば、改変周波数帯として、低域側については、100Hzから500Hzの範囲、高域側については6kHzから16kHzの範囲を設定するようにしたので、一般的な録音機器の下限、上限である250Hz、12kHzを超える成分が欠落して複製された音響信号を再生した場合に、妨害音を発生させることができる。また、スピーカにより出力可能な周波数範囲であり、ほとんどの録音機器の周波数感度の下限、上限であり、音声圧縮処理の場合でも下限、上限となる100Hz、16kHzを改変周波数帯の各々下限、上限としているため、精度の高い録音機器を用いて複製されたり、圧縮されたりした場合であっても、複製された音響信号の再生時に妨害音を発生させることが可能となる。発明者等による実験の結果、低域側については400Hzから600Hzの範囲、高域側については6kHzから8kHzの範囲に設定した場合に、最も効果的に妨害音を埋め込むことができることを確認したため、これらの範囲に設定することがより望ましい。
本発明第6の態様では、本発明第1から第5のいずれかの態様の音響信号に対する妨害音の埋め込み装置において、前記所定の窓関数は、前記1つの音響フレームのサンプル数をNとして、サンプル位置i(0≦i≦N−1)における重みW(i)(0≦W(i)≦1)が、W(i)=0.5−0.5cos(2πi/N)で定義されるハニング窓関数であることを特徴とする。
本発明第6の態様によれば、所定の窓関数として、奇数番目、偶数番目の音響フレームいずれに対しても、共通のハニング窓関数を用いるようにしたので、妨害音を埋め込む場合に、原音響信号に与えるダメージを低減でき、改変による再生品質への影響を抑えることが可能となる。
本発明によれば、音響信号に所定の改変を加えることにより改変を加えた音響信号の再生時に聴取されないように妨害音を埋め込み、改変を加えた音響信号の再生により発せられた音を録音または圧縮処理することにより帯域圧縮が施された場合に、帯域圧縮された複製音響信号の再生時に埋め込まれた妨害音が聴取されるようにすることが可能となる。
本発明の基本概念を説明するための図である。 2つの改変周波数帯に妨害音を埋め込んだ場合の周波数成分の変化を示す図である。 図2(b)に示した妨害音埋め込み後の改変音響信号を再生した場合の、人の聴取状態、録音機器等で複製された複製音響信号を示す図である。 本発明に係る音響信号に対する妨害音の埋め込み装置のハードウェア構成図である。 本発明に係る音響信号に対する妨害音の埋め込み装置の機能ブロック図である。 奇数番目の音響フレームと偶数番目の音響フレームの改変の概念図である。 本発明に係る音響信号に対する妨害音の埋め込み装置の処理概要を示すフローチャートである。
以下、本発明の実施形態について図面を参照して詳細に説明する。
(1.本発明の基本概念)
最初に、本発明の基本概念について説明しておく。本発明では、違法録音において利用が想定されるマイクロフォン等の録音機器の感度上限もしくは下限周波数付近、または違法録音において利用が想定される音声・音楽非可逆圧縮ツールの符号化上限もしくは下限周波数付近の所定の周波数範囲に妨害音を発生させるための妨害信号を記録する。そして、好適な実施形態として、さらにマイクロフォン等の録音機器の感度上限および下限双方の周波数付近の所定の周波数範囲にも妨害信号を記録する。妨害音とは、本来、原音響信号に記録された音を人が聴取するのを妨害するための音である。妨害信号とは、妨害音を発生させるための信号である。
図1は、本発明の基本概念を説明するための図である。図1(a)(b)(c)は、それぞれヒトの聴覚により取得された音、原音響信号、録音機器により取得され複製された音響信号、の周波数範囲別の構成を示している。図1において左右方向は周波数を示し、左側が低周波、右側が高周波である。ヒトの聴覚の感度領域は20Hz〜20kHzであり、一般的な音響コンテンツに含まれる音響信号もヒトの聴覚の感度領域に合わせて20Hz〜20kHzで構成されている。違法録音での使用が想定されるスマートフォン(ボイスレコーダ・アプリ)・ボイスレコーダなど録音時にポケットに収納可能な超小型の録音機器(スタジオ収録用の業務用録音機器等、感度領域がヒトの聴覚域に近いまたは聴覚域より広いものを除く)については、機器により若干のバラツキはあるが、大半の録音機器の感度領域は250Hz〜12kHzであり、精度の高いものでも100Hz〜16kHzである。
後述する本発明の好適な一実施形態では、図1(b)に示すように、6kHz〜16kHz内の所定の範囲に妨害信号を記録する。さらに、100Hz〜500Hz内の所定の範囲にも妨害信号を記録する。妨害信号を記録するために周波数成分の内容を改変することになるが、改変対象とする周波数帯を改変周波数帯と呼ぶことにする。また、2つ以上の改変周波数帯を設定する場合、高周波側の改変周波数帯を上位改変周波数帯、低周波側の改変周波数帯を下位改変周波数帯と呼ぶことにする。図1(b)の例では、100Hz〜500Hz、6kHz〜16kHzが改変周波数帯となる。高域側の6kHz〜16kHzと、低域側の100Hz〜500Hzの双方に埋め込むことが好ましいが、どちらか一方であっても良い。また、通常再生時における妨害音の発生をより抑えるため、各々を100Hz〜200Hzと400Hz〜500Hz、および6kHz〜9kHzと13kHz〜16kHzのように2分割し、トータル4種の改変周波数帯を設定するようにしても良い。更に、携帯電話やスマートフォンのボイスレコーダ・アプリが使用されることを想定して、高域側より低い中域の、3kHz〜5kHzに改変周波数帯を追加しても良い。
図1(b)に示したような音響信号が再生されると、高域側においては、6kHz〜16kHz内の所定の範囲の音脈が一部逆転しているが、前記周波数範囲より低域および高域に存在する原音信号の音脈に揃うように補正され、原音と同様に聴取されてしまう(音脈分凝、音の群化または補間作用とよばれる大脳聴覚野より高次の大脳連合野での錯覚現象)。しかし、前記周波数範囲より低域または高域の成分のいずれかが欠落すると、前記補正作用は働かなくなり、前記周波数範囲における逆転音脈は逆回し再生雑音と類似した不快な雑音(妨害音)が聴取される。また、低域側においても、100Hz〜500Hz内の所定の範囲の音脈が一部逆転しているが、前記周波数範囲より低域または高域に存在する原音信号の音脈に揃うように補正され、原音と同様に聴取されてしまう。しかし、前記周波数範囲より低域または高域の成分のいずれかが欠落すると、同様に前記補正作用は働かなくなり、前記周波数範囲における逆転音脈は逆回し再生雑音と類似した不快な雑音(妨害音)が聴取される。この結果、通常の再生条件では、高域側においても低域側においても、ヒトの耳には、音脈の一部逆転により発せられる妨害音が聞こえなくなり、本来の音響信号により発せられる音を正常な状態で聴くことが可能となる。しかし、録音または圧縮処理により帯域圧縮が施され、高域側の所定の範囲6kHz〜16kHzより高域の信号成分が欠落したり、低域側の所定の範囲100Hz〜500Hzより低域の信号成分が欠落すると、各々の周波数範囲における音脈の一部逆転により発せられる妨害音が聞こえるようになり、本来の音響信号により発せられる音を正常な状態で聴くことが不可能となる。
図1(b)に示したような音響信号を、感度領域が250Hz〜12kHzの一般的な録音機器で録音すると、図1(c)に示すように、250Hz〜12kHzの範囲の音響信号として録音される。図1(c)に示したような音響信号を再生すると、高域側においては、音響信号本来の信号成分が存在しないため、ヒト聴覚系(大脳聴覚野)の音脈分凝が働かなくなり、下側の周波数帯において加えられている音脈の局所的な逆転がそのまま聴取されるようになり、妨害信号が出力される。また、低域側においても、音響信号本来の信号成分が存在しないため、ヒト聴覚系(大脳聴覚野)の音脈分凝が働かなくなり、上側の周波数帯において加えられている音脈の局所的な逆転がそのまま聴取されるようになり、妨害信号が出力される。その結果、ヒトの聴覚系には、高域側・低域側双方の妨害信号に基づく妨害音が聞こえることになり、一般的な録音機器では、原音と同等な品質を保つ複製という意味での録音が不可能となる。
(1.2.音脈分凝の原理)
次に、図2、図3を用いて音脈分凝の原理について説明しておく。本発明では、人間の聴覚心理特性である音脈分凝の原理を利用する。音脈分凝には、様々な現象が知られているが、特許文献2・3に記載の現象とは異なり、ここでは、特定の周波数帯に対して意図的に逆転させた音脈が前記周波数帯より上下に位置する原音と同じ順方向の音脈に揃うように補正されながら聴取される錯覚現象を利用している。図2は、元の音響信号の下位改変周波数帯、上位改変周波数帯双方に、妨害音の埋め込みを行った場合の周波数成分の変化の様子を概念的に示した図である。図2(a)に示される信号に対して、Lu1とLu2、Lu3とLu4、Lu5とLu6、Hd1とHd2、Hd3とHd4、Hd5とHd6の各周波数成分を時間軸方向に逆転させたのが図2(b)である。図3は、図2(b)に示した妨害音埋め込み後の改変音響信号を再生した場合の、人の聴取状態、録音機器等で複製された複製音響信号を示す図である。図3(a)(b)の横方向の矢印は音脈を示しているが、図3(b)では上記逆転させた信号成分間の音脈が上下の音脈に揃うように逆転補正されて聴取されることを示している。しかし、図3(b)のようにLu1の列より下側のLd1の列が欠落し、Hd1の列より上側のHu1の列が欠落すると、Lu1とLu2、Lu3とLu4、Lu5とLu6、Hd1とHd2、Hd3とHd4、Hd5とHd6の各周波数成分間の音脈における逆転補正は働かなくなり、逆転した状態のまま、顕著な妨害音として聴取される。
(2.1.装置構成)
次に、本発明に係る音響信号に対する妨害音の埋め込み装置について説明する。図4は、本発明に係る音響信号に対する妨害音の埋め込み装置のハードウェア構成図である。音響信号に対する妨害音の埋め込み装置は、汎用のコンピュータで実現することができ、図4に示すように、CPU(Central Processing Unit)1と、コンピュータのメインメモリであるRAM(Random Access Memory)2と、CPU1が実行するプログラムやデータを記憶するための大容量の記憶装置(例えば、ハードディスク、フラッシュメモリ等)3と、キーボード、マウス等のキー入力I/F(インターフェース)4と、外部装置(データ記憶媒体等)とデータ通信するためのデータ入出力I/F(インターフェース)5と、表示装置(ディスプレイ)に情報を送出するための表示出力I/F(インターフェース)6と、を備え、互いにバスを介して接続されている。
図5は、本発明に係る音響信号に対する妨害音の埋め込み装置の構成を示す機能ブロック図である。図5において、10は音響フレーム読込手段、20は時間−周波数変換手段、30は周波数成分改変手段、40は周波数−時間変換手段、50は改変音響フレーム出力手段、60は記憶手段、61は音響信号記憶部、62は改変音響信号記憶部である。なお、図5に示す装置は、ステレオ音響信号、モノラル音響信号の両方に対応可能であるが、本実施形態では、ステレオ音響信号に対して処理を行う場合について説明していく。
音響フレーム読込手段10は、妨害音の埋め込み対象とする元のステレオ音響信号の各チャンネルから所定数のサンプルを1フレームとして読み込む機能を有している。時間−周波数変換手段20は、音響フレーム読込手段10が読み込んだ音響信号のフレームをフーリエ変換等により時間−周波数変換して複素数のスペクトルを生成する機能を有している。周波数成分改変手段30は、生成されたスペクトルから改変周波数範囲に相当するスペクトル集合を複数抽出し、妨害信号を埋め込むように、スペクトル集合の状態を改変する機能を有している。周波数−時間変換手段40は、改変されたスペクトル集合を含む複数の複素数のスペクトルに対して周波数−時間変換を行うことにより、改変前の音響フレームの位相を維持しながら改変音響フレームを生成する機能を有している。改変音響フレーム出力手段50は、生成された改変音響フレームを順次出力する機能を有している。
記憶手段60は、妨害音を埋め込む対象とするステレオ音響信号を記憶した音響信号記憶部61と、妨害音埋め込み後の改変音響信号を記憶する改変音響信号記憶部62を有しており、その他処理に必要な各種情報を記憶するものである。
図5に示した各構成手段は、現実には図4に示したように、コンピュータおよびその周辺機器等のハードウェアに専用のプログラムを搭載することにより実現される。すなわち、コンピュータが、専用のプログラムに従って各手段の内容を実行することになる。
図4の記憶装置3には、CPU1を動作させ、コンピュータを、音響信号に対する妨害音の埋め込み装置として機能させるための専用のプログラムが実装されている。この専用のプログラムを実行することにより、CPU1は、音響フレーム読込手段10、時間−周波数変換手段20、周波数成分改変手段30、周波数−時間変換手段40、改変音響フレーム出力手段50、記憶手段60、音響信号記憶部61、改変音響信号記憶部62としての機能を実現することになる。また、記憶装置3は、処理に必要な様々なデータを記憶する。
(2.2.処理動作)
次に、図4、図5に示した音響信号に対する妨害音の埋め込み装置の処理動作について説明する。音響フレーム読込手段10は、音響信号記憶部61に記憶されたステレオ音響信号の左右の各チャンネルから、それぞれ所定数Nのサンプルを1音響フレームとして読み込む。音響フレーム読込手段10が読み込む1音響フレームのサンプル数Nは、適宜設定することができるが、設定値により妨害音の聴取具合、音脈分凝の働き方が変化する。サンプリング周波数が44.1kHzの場合、4096サンプル程度とすると、最も原音に対するダメージを少なくできることが分かっているので、以下この設定値で説明する。(実用的には音脈分凝が最も働きやすい2048サンプルに設定することが多い。)したがって、音響フレーム読込手段10は、左チャンネル、右チャンネルについてそれぞれ4096サンプルずつ、順次音響フレームとして読み込んでいくことになる。
本実施形態では、奇数番目の音響フレーム、偶数番目の音響フレームは、互いに所定数(本実施形態では2048)のサンプルを重複して設定される。したがって、奇数番目の音響フレームを先頭からA1、A2、A3…とし、偶数番目の音響フレームを先頭からB1、B2、B3…とすると、A1はサンプル1〜4096、A2はサンプル4097〜8192、A3はサンプル8193〜12288、B1はサンプル2049〜6144、B2はサンプル6145〜10240、B3はサンプル10241〜14336となる。したがって、偶数番目の音響フレームから処理を行うようにしても良いが、以下では、奇数番目の音響フレームから処理を行う場合を例にとって説明する。
時間−周波数変換手段20は、振幅変換後の音響フレームに対して時間−周波数変換を行って、その音響フレームの複素数のスペクトルを得る。時間−周波数変換とは、時間次元から周波数次元への変換である。時間−周波数変換は、窓関数を利用して行う。時間−周波数変換としては、フーリエ変換、ウェーブレット変換その他公知の種々の手法を用いることができるが、複素数のスペクトルを得られる手法である必要がある。本実施形態では、フーリエ変換を用いた場合を例にとって説明する。
一般に、所定の信号に対してフーリエ変換を行う場合、信号を所定の長さに区切って行う必要があるが、この場合、所定長さの信号に対してそのままフーリエ変換を行うと、擬似高調波成分が発生する。そこで、一般にフーリエ変換を行う場合には、ハニング窓と呼ばれる窓関数を用いて、信号の値を変化させた後、変化後の値に対してフーリエ変換を実行する。
本実施形態においても、ハニング窓関数W(i)を利用している。ハニング窓関数W(i)は、中央の所定のサンプル番号iの位置において最大値1をとり、両端付近のサンプル番号iの位置において最小値0をとるように設定されている。どのサンプル番号の場合に最大値をとるかについては、ハニング窓関数W(i)の設計によって異なってくるが、本実施形態では、後述する〔数式1〕で定義される。音響フレームについてのフーリエ変換は、このハニング窓関数W(i)を乗じたものに対して行われることになる。
なお、上述のように、本実施形態においては、音響フレームは重複して読み込まれる。すなわち、奇数番目の音響フレームと偶数番目の音響フレームは、所定数のサンプルを重複して読み込む。本実施形態では、ハニング窓関数W(i)は、以下の〔数式1〕で定義される。
〔数式1〕
0<i≦N−1のとき、W(i)=0.5−0.5cos(2πi/N)
本実施形態においては、奇数番目の音響フレームと偶数番目の音響フレームを、所定サンプルずつ重複して読み込むため、妨害信号の記録を行った後、時系列の音響信号の形態に復元する際に、窓関数を乗じた奇数番目の音響フレームと、窓関数を乗じた偶数番目の音響フレームの重複サンプルを加算した場合に、ほぼ元の値に戻るようにしなければならない。このため、奇数番目の音響フレームと偶数番目の音響フレームの重複部分において、両者の窓関数W(i)を加算すると、全区間固定値1になるように定義されている。
時間−周波数変換手段20が、奇数番目および偶数番目の音響フレームに対してフーリエ変換を行う場合は、左チャンネル信号Xl(i)、右チャンネル信号Xr(i)(i=0,…,N−1)に対して、窓関数W(i)を用いて、以下の〔数式2〕に従った処理を行い、左チャンネルに対応する変換データの実部Al(j,t)、虚部Bl(j,t)、右チャンネルに対応する変換データの実部Ar(j,t)、虚部Br(j,t)を得る。
〔数式2〕
Al(j,t)=Σi=0,…,N-1W(i)・Xl(i,t)・cos(2πij/N)
Bl(j,t)=Σi=0,…,N-1W(i)・Xl(i,t)・sin(2πij/N)
Ar(j,t)=Σi=0,…,N-1W(i)・Xr(i,t)・cos(2πij/N)
Br(j,t)=Σi=0,…,N-1W(i)・Xr(i,t)・sin(2πij/N)
上記〔数式2〕において、iは、全T個の音響フレームのうちt番目の音響フレームt内のN個のサンプルに付した通し番号であり、i=0,1,2,…N−1の整数値をとる。tはt=0,1,2,…T−1の整数値である。また、jは周波数の値について、値の小さなものから順に付した通し番号であり、iと同様にj=0,1,2,…N−1の整数値をとる。サンプリング周波数が44.1kHz、N=4096の場合、jの値が1つ異なると、周波数が10.8Hz異なることになる。
上記〔数式2〕に従った処理を実行することにより、各音響フレームの各窓関数に対応する複素数のスペクトルが得られる。続いて、周波数成分改変手段30が、生成されたスペクトルから改変周波数帯に相当する周波数範囲のスペクトル集合を抽出する。本実施形態では、上位改変周波数帯、下位改変周波数帯の双方について抽出する。
周波数成分改変手段30は、妨害信号を埋め込むため、奇数番目および偶数番目の音響フレームについて、改変周波数帯の周波数成分を改変する処理を行う。
具体的には、埋め込み装置で、音響信号から抽出した所定数のサンプルで構成される音響フレーム内の改変周波数帯の周波数成分を改変するに際し、隣接する2つの音響フレームの成分を所定の割合で互いに反映させる処理を行う。これにより、改変周波数帯の信号成分には、本来の音脈と逆転した成分が加算されるが、改変周波数帯よりも低い周波数および高い周波数の音脈に揃うように補正されることにより、人間には、音脈の逆転による雑音が聞こえない。しかし、改変周波数帯の下限よりも高い方の周波数成分のみを抽出して録音した場合、または改変周波数帯の上限よりも低い方の周波数成分のみを抽出して録音した場合には、録音信号を再生すると逆転した音脈に伴う雑音が妨害音として発生することになる。
本実施形態では、音響フレームの改変周波数帯の成分を改変し、妨害信号を埋め込むようにしている。ここで、奇数番目の音響フレームと偶数番目の音響フレームの改変の概念図を図6に示す。図6は、左チャンネルのものを示しており、右チャンネルについては、左チャンネルと同様であるので省略してある。図6に示す各音響フレームにおいて、縦軸は周波数方向を示している。
図6においては、縦軸の周波数方向において、周波数領域が5つに区分されているが、上から2番目、4番目の領域、すなわち、周波数7kHz以上8kHz未満の間が改変対象となる上位改変周波数帯であり、周波数200Hz以上400Hz未満の間が改変対象となる下位改変周波数帯である。
妨害信号を記録する場合、図6(a)(b)に示すように、網掛けを施した下位改変周波数帯について、互いに隣接する音響フレームの成分をαだけ反映させる。同様に、図6(a)(b)に示すように、網掛けを施した上位改変周波数帯について、互いに隣接する音響フレームの成分をβだけ反映させる。
図6の例では、上記下位改変周波数帯の下限FL1、上限FL2を、それぞれ200Hz、400Hzに設定する。下位改変周波数帯の下限FH2を200Hzとしたのは、一般的な録音機器が取得可能な高周波の下限が250Hzであり、それに近い値にするためである。このようにして妨害信号が埋め込まれた改変音響信号を再生したものを、一般的な録音機器で録音したり、非可逆圧縮を行ったりした場合、250Hz未満の信号成分は複製信号に記録されない。したがって、妨害信号を補間する信号成分は、存在しなくなり、複製信号を再生した場合、妨害信号を補間することができず、妨害音が可聴な状態となる。また、上記上位改変周波数帯の下限FH1、上限FH2を、それぞれ7kHz、8kHzに設定する。上位改変周波数帯の上限FH2を8kHzとしたのは、一般的な録音機器が取得可能な高周波の上限が12kHzであり、それ以下にするためである。このようにして妨害信号が記録された改変音響信号を再生したものを、一般的な録音機器で録音したり、非可逆圧縮を行ったりした場合、12kHz〜22.05kHzの範囲の信号成分は複製信号に記録されない。したがって、妨害信号を補間する信号成分は、8kHz〜12kHzのみとなり、複製音響信号を再生した場合、妨害信号を完全に補間することができず、妨害音が可聴な状態となる。
下位改変周波数帯における周波数成分の改変は、j=L1,・・・,L2の各周波数成分Al(j,t)、Bl(j,t)、Ar(j,t)、Br(j,t)に対して、t=2kまたは2k+1とし、以下の〔数式3〕に従った処理を実行することにより行う。j=L1,・・・,L2の各周波数成分Al(j,2k+1)、Bl(j,2k+1)、Ar(j,2k+1)、Br(j,2k+1)が奇数スペクトル集合、j=L1,・・・,L2の各周波数成分Al(j,2k)、Bl(j,2k)、Ar(j,2k)、Br(j,2k)が偶数スペクトル集合である。本実施形態では、L1=18、L2=37に設定し、約200Hz〜約400Hzの周波数成分の強度を変更する。
〔数式3〕
Al´(j,2k)←Al(j,2k)・(1.0−α)+Al(j,2k+1)・α
Al´(j,2k+1)←Al(j,2k+1)・(1.0−α)+Al(j,2k)・α
Bl´(j,2k)←Bl(j,2k)・(1.0−α)+Bl(j,2k+1)・α
Bl´(j,2k+1)←Bl(j,2k+1)・(1.0−α)+Bl(j,2k)・α
Ar´(j,2k)←Ar(j,2k)・(1.0−α)+Ar(j,2k+1)・α
Ar´(j,2k+1)←Ar(j,2k+1)・(1.0−α)+Ar(j,2k)・α
Br´(j,2k)←Br(j,2k)・(1.0−α)+Br(j,2k+1)・α
Br´(j,2k+1)←Br(j,2k+1)・(1.0−α)+Br(j,2k)・α
上位改変周波数帯における周波数成分の改変は、j=H1,・・・,H2の各周波数成分Al(j,t)、Bl(j,t)、Ar(j,t)、Br(j,t)に対して、t=2kまたは2k+1とし、以下の〔数式4〕に従った処理を実行することにより行う。j=H1,・・・,H2の各周波数成分Al(j,2k+1)、Bl(j,2k+1)、Ar(j,2k+1)、Br(j,2k+1)が奇数スペクトル集合、j=L1,・・・,L2の各周波数成分Al(j,2k)、Bl(j,2k)、Ar(j,2k)、Br(j,2k)が偶数スペクトル集合である。本実施形態では、H1=650、H2=743に設定し、約7kHz〜約8kHzの周波数成分の強度を変更する。
〔数式4〕
Al´(j,2k)←Al(j,2k)・(1.0−β)+Al(j,2k+1)・β
Al´(j,2k+1)←Al(j,2k+1)・(1.0−β)+Al(j,2k)・β
Bl´(j,2k)←Bl(j,2k)・(1.0−β)+Bl(j,2k+1)・β
Bl´(j,2k+1)←Bl(j,2k+1)・(1.0−β)+Bl(j,2k)・β
Ar´(j,2k)←Ar(j,2k)・(1.0−β)+Ar(j,2k+1)・β
Ar´(j,2k+1)←Ar(j,2k+1)・(1.0−β)+Ar(j,2k)・β
Br´(j,2k)←Br(j,2k)・(1.0−β)+Br(j,2k+1)・β
Br´(j,2k+1)←Br(j,2k+1)・(1.0−β)+Br(j,2k)・β
上記〔数式3〕〔数式4〕において、α、βは、それぞれ、0<α≦1、0<β≦1を満たす実数であり、その範囲内で適宜設定可能であるが、α、βは少なくとも0.5以上に設定することが望ましい。α=1である場合は、下位改変周波数帯において、隣接する音響フレームの信号成分を完全に交換することを示し、β=1である場合は上位改変周波数帯において、隣接する音響フレームの信号成分を完全に交換することを示す。
周波数−時間変換手段40は、上記のようにして、妨害信号を記録するために周波数成分の状態が変更されたフレームスペクトルを周波数−時間変換して改変音響フレームを得る処理を行う。この周波数−時間変換は、当然のことながら、時間−周波数変換手段20が実行した手法に対応していることが必要となる。本実施形態では、時間−周波数変換手段20において、フーリエ変換を施しているため、周波数−時間変換手段40は、フーリエ逆変換を実行することになる。
具体的には、奇数番目の音響フレームに対しては、周波数−時間変換手段40は、周波数成分改変手段30により得られたスペクトルの左チャンネルの実部Al´(j,t)等、虚部Bl´(j,t)等、右チャンネルの実部Ar´(j,t)等、虚部Br´(j,t)等を用いて、以下の〔数式5〕に従った処理を行い、Xl´(i,t)、Xr´(i,t)を算出する。なお、周波数成分改変手段30において改変されていない周波数成分については、Al´(j,t)等として、元の周波数成分であるAl(j,t)等を用いる。
〔数式5〕
Xl´(i,t)=1/N・{ΣjAl´(j,t)・cos(2πij/N)−ΣjBl´(j,t)・sin(2πij/N)}+Xl´(i+N/2,t−1)
Xr´(i,t)=1/N・{ΣjAr´(j,t)・cos(2πij/N)−ΣjBr´(j,t)・sin(2πij/N)}+Xr´(i+N/2,t−1)
上記〔数式5〕においては、式が繁雑になるのを防ぐため、Σj=0,…,N-1をΣjとして示している。上記〔数式5〕における第1式の“+Xl´(i+N/2,t−1)”、第2式の“+Xr´(i+N/2,t−1)”の項は、直前に改変された改変音響フレームのデータXl´(i,t−1)、Xr´(i,t−1)が存在する場合に、時間軸上N/2サンプル分重複することを考慮して加算するためのものである。上記〔数式5〕により奇数番目の改変音響フレームの左チャンネルの各サンプルXl´(i,t−1)、右チャンネルの各サンプルXr´(i,t−1)、が得られることになる。
改変音響フレーム出力手段50は、周波数−時間変換手段40の処理により得られた奇数番目の改変音響フレーム、偶数番目の改変音響フレームを順次出力ファイルに出力する。
(2.3.処理の全体的な流れ)
次に、図5に示した音響信号に対する情報の埋め込み装置の処理の全体的な流れを、図7のフローチャートに従って説明する。図5に示した装置を構成する各構成要素は、連携して図7に従った処理を実行する。
図7においては、まず、音響フレーム読込手段10が、音響信号記憶部61に記憶されたステレオ音響信号の左右の各チャンネルから、それぞれ所定数のサンプルを奇数番目の1音響フレームとして読み込み、時間−周波数変換手段20が時間−周波数変換を行う(S101)。具体的には、まず、読み込んだ音響フレームに対して、時間−周波数変換を行って、その音響フレームのスペクトルであるフレームスペクトルを得る。すなわち、各音響フレームについて、窓関数W(i)を用いて、上記〔数式2〕に従った処理を行う。同様に、音響フレーム読込手段10が、音響信号記憶部61に記憶されたステレオ音響信号の左右の各チャンネルから、それぞれ所定数のサンプルを偶数番目の1音響フレームとして読み込み、時間−周波数変換手段20が周波数変換を行う(S102)。具体的には、上記ステップS101と同様、読み込んだ音響フレームに対して周波数変換を行って、その音響フレームのスペクトルであるフレームスペクトルを得る。
次に、周波数成分改変手段30は、妨害信号を埋め込むために、上記〔数式3〕〔数式4〕に従った処理を実行し、下位改変周波数帯、上位改変周波数帯の周波数成分の状態を改変する。(S103)。
次に、周波数−時間変換手段40が、上記S103の処理により奇数番目の音響フレームに対応する各スペクトル集合の成分が改変されたスペクトルを、周波数−時間変換して改変音響フレームを得る処理を行う(S104)。この周波数−時間変換は、当然のことながら、時間−周波数変換手段20がS101において実行した手法に対応していることが必要となる。本実施形態では、時間−周波数変換手段20において、フーリエ変換を施しているため、周波数−時間変換手段40は、フーリエ逆変換を実行することになる。具体的には、上記〔数式3〕〔数式4〕により得られたスペクトルの左チャンネルの実部Al´(j,t)、虚部Bl´(j,t)、右チャンネルの実部Ar´(j,t)、虚部Br´(j,t)を用いて、上記〔数式5〕に従った処理を行い、Xl´(i,t)、Xr´(i,t)を算出する。改変音響フレーム出力手段50は、得られた改変音響フレームを順次出力ファイルに出力する。
同様に、周波数−時間変換手段40が、上記S103の処理により偶数番目の音響フレームに対応する各スペクトル集合の成分が改変されたスペクトルを、周波数−時間変換して改変音響フレームを得る処理を行う(S105)。具体的には、上記ステップS104と同様、上記〔数式3〕〔数式4〕により得られたスペクトルの左チャンネルの実部Al´(j,t)、虚部Bl´(j,t)、右チャンネルの実部Ar´(j,t)、虚部Br´(j,t)を用いて、上記〔数式5〕に従った処理を行い、Xl´(i,t)、Xr´(i,t)を算出する。
改変音響フレーム出力手段50は、得られた改変音響フレームを順次出力ファイルに出力する。こうして各チャンネルについて、奇数番目および偶数番目の2つの音響フレームに対する処理を終えたら、以上のような処理を音響信号の両チャンネルの全サンプルに渡って実行していく。すなわち、所定数のサンプルを音響フレームとして読み込み、音響信号から読み込むべき音響フレームがなくなったら(S101、S102)、処理を終了する。この結果、全ての音響フレームに対して処理を行った全ての改変音響フレームが出力ファイルに記録されて、改変音響信号として得られる。得られた改変音響信号は、改変音響フレーム出力手段50により記憶手段60内の改変音響信号記憶部62に出力され、記憶される。
上記のようにして得られた改変音響信号のうち、下位改変周波数帯、上位改変周波数帯ともに1対の隣接する2フレーム間で本来記録された信号と逆転する流れを示す分布になる。
以上のようにして、妨害信号が埋め込まれた改変音響信号が再生されると、上述のように、下位改変周波数帯、上位改変周波数帯では音脈分凝に類似の作用により妨害信号が補間され知覚されなくなるため、スピーカから発せられた音を聴いた人には、妨害音は聞こえない。しかし、その音を一般的な録音機器により録音すると、その感度領域に含まれる下位改変周波数帯、上位改変周波数帯の音を比較的減衰されずに取得し、下位改変周波数帯より低周波側、上位改変周波数帯より高周波側の音を取得しない。そのため、録音により得られた複製音響信号を再生すると、妨害信号が記録された下位改変周波数帯、上位改変周波数帯の逆転音脈に対する補正が働かず、妨害音が聞こえることになり、鑑賞に堪えない再生音になる。この結果、ボイスレコーダ等のマイクを介した録音により音響信号を複製することを防止することが可能となる。
また、ボイスレコーダで記録される際に、MPEGなど公知の音声または音楽非可逆圧縮が施されることが多い。妨害信号が埋め込まれた音響信号に対して、音声または音楽非可逆圧縮を施すと、圧縮仕様によっては、上位改変周波数帯より高周波側の成分が符号化対象にならず完全に削除されることが多く、更に下位改変周波数帯の低周波側の成分も符号化対象にならず削除されることがある。(例えば、MPEG−1/Layer3方式では、24または32kHzで再サンプリングされるため、12kHzまたは16kHz以上の成分は完全に削除される。更に3GPP音声圧縮モードでは、8kHzで再サンプリングされるため、4kHz以上の成分は完全に削除されるとともに、300Hz以下の成分も削除される。)そのため、たとえマイクロフォンの感度領域が広帯域であっても、符号化・記録の段階で同様に帯域圧縮がなされ、記録された複製音響信号を再生すると、妨害音が聞こえることになり、同様に鑑賞に堪えない再生音になる。
(3.妨害信号の埋め込みと録音により得られる音)
ここで、妨害信号の埋め込みによる音のパターンの変化と、妨害信号が埋め込まれた改変音響信号の再生音を録音した場合に得られる音について説明する。図2は、上述のように、元の音響信号の下位改変周波数帯、上位改変周波数帯双方に、妨害音の埋め込みを行った場合の周波数成分の変化の様子を概念的に示した図である。
図2においては、L-ch(左チャンネル)のみを示している。また、図2においては、20Hz〜22.05kHzの周波数範囲を、5つの周波数帯“Ld” “Lu” “M” “Hd” “Hu”に分けて示している。下から2番目の“Lu”、下から4番目の“Hd”は、それぞれ下位改変周波数帯、上位改変周波数帯を示している。下から1番目の“Ld”、下から5番目の“Hu”は、それぞれ下位改変周波数帯、上位改変周波数帯による妨害信号を補間するための周波数帯である。また、1〜6は先頭からの音響フレームの順番を示している。したがって、図2の例では、6個の音響フレームを示しており、例えば、“Hd1”は、1番目の音響フレームの上位改変周波数帯の成分を示していることになる。また、奇数番目と偶数番目の音響フレームは、実際に半数のサンプルが重複して設定されるが、図2では、説明の便宜上独立した形態で示している。
図2においては、図2(a)は元の音響信号を示しており、図2(b)は埋め込み処理後の改変音響信号を示している。図2(a)と図2(b)を比較するとわかるように、下位改変周波数帯“Lu”、上位改変周波数帯“Hd”では、隣接する音響フレーム間において、音響フレームを示す数字が入れ替わっている。ただし、図2(a)のように、完全に隣接する音響フレーム間で成分が完全に入れ替わるのは、下位改変周波数帯“Lu”においてはα=1.0のとき、上位改変周波数帯“Hd”においてはβ=1.0のときのみである。
図3は、上述のように、図2(b)に示した妨害音埋め込み後の改変音響信号を再生した場合の、人の聴取状態、録音機器等で複製された複製音響信号を示す図である。図3(a)は、図2(b)に示した埋め込み後の改変音響信号の再生音が人に聞こえる状態、図3(b)は、録音機器により録音された複製音響信号を示す。図3(a)に示すように、図2(b)の改変音響信号は、そのまま人の耳に入る。図3においては、各周波数帯における本来の音の流れるべき方向(音脈)を矢印で示している。図3(a)では、下位改変周波数帯“Lu”、上位改変周波数帯“Hd”において、信号成分の流れが逆転している箇所が存在する。しかし、矢印(音脈)は、下位改変周波数帯“Lu”に対しては、より低周波側の周波数帯“Ld”に合わせ、上位改変周波数帯“Hd”に対しては、より高周波側の周波数帯“Hu”に合わせるように、逆転補正されている。この逆転補正により妨害信号は聴取されなくなる。尚、他の周波数帯“Ld” “M” “Hu”については、信号成分の流れが逆転している箇所は存在せず、元のままである。したがって、図3(a)の信号からは、人には音脈逆転による妨害音は聞こえない。
しかし、図3(b)に示すように、録音機器により録音された複製音響信号では、マイクロフォンの感度外である周波数帯“Ld”“Hu”が、記録されない。このため、複製音響信号を再生すると、下位改変周波数帯“Lu”、上位改変周波数帯“Hd”において、流れが逆転している箇所が補正されずにそのまま人に聴こえる。すなわち、妨害音として聴こえることになる。
(4.変形例等)
以上、本発明の好適な実施形態について限定したが、本発明は上記実施形態に限定されず、種々の変形が可能である。例えば、上記実施形態では、下位改変周波数帯、上位改変周波数帯の双方に妨害信号を埋め込むようにしたが、どちらか一方であっても良い。違法録音に用いられる録音機器によっては、その周波数感度の下限または上限が、改変音響信号の下位改変周波数帯、上位改変周波数帯に近いものであれば、どちらか一方に埋め込まれている場合でも、十分に妨害音を発生させることができる。しかし、録音機器の周波数感度の下限または上限が、下位改変周波数帯、上位改変周波数帯に必ずしも近いものになるとは限らないため、下位改変周波数帯、上位改変周波数帯双方に埋め込んでおくことにより、妨害音を発生させることができる確率が高まる。また、通常再生状態における音脈逆転に対する補正効果を高めるため、下位改変周波数帯、上位改変周波数帯の各々を2分割する方法もとれる。(2分割する場合は、2つの改変周波数帯の間に改変しない周波数帯を設ける。)更に、超低ビットレートの録音機器(携帯電話やスマートフォンでのボイスレコーダ・アプリ)で録音される場合に対応するため、下位改変周波数帯と上位改変周波数帯の中間に中位改変周波数帯を設けることもできる。ボイスレコーダ・アプリでは上限が4kHzであることが一般的であるため、中位改変周波数帯を2kHz〜4kHzに設定する。
また、上記実施形態では、商品として一般に流通している2チャンネルのステレオ音響信号を利用した場合を例にとって説明したが、5.1チャンネルのサラウンド音響信号に対しても、LFC重低音チャンネルを除く5チャンネルの各音響信号に同様な処理を施せば良く(LFC重低音チャンネルに対しては、下位改変周波数帯のみ適用)、逆に1チャンネルのモノラル音響信号を利用しても良い。モノラル音響信号の場合は、上記左チャンネルまたは右チャンネルのいずれか一方に対して行った処理を実行すれば良い。
1・・・CPU(Central Processing Unit)
2・・・RAM(Random Access Memory)
3・・・記憶装置
4・・・キー入力I/F
5・・・データ入出力I/F
6・・・表示出力I/F
10・・・音響フレーム読込手段
20・・・時間−周波数変換手段
30・・・周波数成分改変手段
40・・・周波数−時間変換手段
50・・・改変音響フレーム出力手段
60・・・記憶手段
61・・・音響信号記憶部
62・・・改変音響信号記憶部

Claims (7)

  1. 時系列のサンプル列で構成される音響信号に対して、改変対象の周波数帯である改変周波数帯に対して改変を加え、改変を加えて得られる改変音響信号を再生した場合には聴取不能であり、前記改変音響信号を改変周波数帯に対して高域または低域の所定の成分を除いて複製した複製音響信号を再生した場合に可聴となるように妨害音を埋め込む装置であって、
    前記音響信号より、所定数のサンプルを1つの音響フレームとして読み込む音響フレーム読込手段と、
    前記読み込んだ音響フレームに対して、所定の窓関数を用いて時間−周波数変換を行い、周波数成分である窓スペクトルを得る時間−周波数変換手段と、
    記窓スペクトルの中で奇数番目の音響フレームに対応する奇数窓スペクトルから前記改変周波数帯における奇数スペクトル集合を抽出し、前記奇数番目の音響フレームに隣接する偶数番目の音響フレームに対応する偶数窓スペクトルから前記改変周波数帯における偶数スペクトル集合を抽出し、互いに対応する前記奇数スペクトル集合の成分と偶数スペクトル集合の成分を、両者が互いの値を所定の割合だけ反映するように改変を加える周波数成分改変手段と、
    前記周波数成分が改変された奇数スペクトル集合を含む奇数窓スペクトル、および前記周波数成分が改変された偶数スペクトル集合を含む偶数窓スペクトルに対して周波数−時間変換を行って、改変音響フレームを生成する周波数−時間変換手段と、
    前記生成された改変音響フレームを順次出力する改変音響フレーム出力手段と、
    を有することを特徴とする音響信号に対する妨害音の埋め込み装置。
  2. 請求項1において、
    前記改変周波数帯として互いに他の改変周波数帯と重ならないように複数個の改変周波数帯を設定し、
    前記周波数成分改変手段は、前記複数個の改変周波数帯に対して、改変を加えることを特徴とする音響信号に対する妨害音の埋め込み装置。
  3. 請求項1または請求項2において、
    前記周波数成分改変手段は、前記改変周波数帯における奇数スペクトル集合の成分と偶数スペクトル集合の成分を、それぞれ自身の割合と他方の割合を加えて1になる範囲で、両者が互いの値を所定の割合だけ反映するように改変を加えることを特徴とする音響信号に対する妨害音の埋め込み装置。
  4. 請求項3において、
    前記周波数成分改変手段は、前記改変周波数帯における奇数スペクトル集合の成分と偶数スペクトル集合の成分を、それぞれ自身の割合を0、他方の割合を1として成分を交換するように改変を加えることを特徴とする音響信号に対する妨害音の埋め込み装置。
  5. 請求項1から請求項4のいずれか一項において、
    前記改変周波数帯として、
    100Hzから500Hzの範囲、6kHzから16kHzの範囲、のいずれか一方、または双方を少なくとも設定することを特徴とする音響信号に対する妨害音の埋め込み装置。
  6. 請求項1から請求項5のいずれか一項において、
    前記所定の窓関数は、前記1つの音響フレームのサンプル数をNとして、サンプル位置i(0≦i≦N−1)における重みW(i)(0≦W(i)≦1)が、W(i)=0.5−0.5cos(2πi/N)で定義されるハニング窓関数であることを特徴とする音響信号に対する妨害音の埋め込み装置。
  7. 請求項1から請求項6のいずれか一項に妨害音の埋め込み装置として、コンピュータを機能させるためのプログラム。
JP2012154254A 2012-07-10 2012-07-10 音響信号に対する妨害音の埋め込み装置 Expired - Fee Related JP5987511B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012154254A JP5987511B2 (ja) 2012-07-10 2012-07-10 音響信号に対する妨害音の埋め込み装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012154254A JP5987511B2 (ja) 2012-07-10 2012-07-10 音響信号に対する妨害音の埋め込み装置

Publications (2)

Publication Number Publication Date
JP2014017687A JP2014017687A (ja) 2014-01-30
JP5987511B2 true JP5987511B2 (ja) 2016-09-07

Family

ID=50112002

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012154254A Expired - Fee Related JP5987511B2 (ja) 2012-07-10 2012-07-10 音響信号に対する妨害音の埋め込み装置

Country Status (1)

Country Link
JP (1) JP5987511B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4867765B2 (ja) * 2007-04-05 2012-02-01 大日本印刷株式会社 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
JP5569033B2 (ja) * 2010-02-26 2014-08-13 大日本印刷株式会社 音響信号に対する情報の埋め込み装置
JP5906659B2 (ja) * 2011-10-21 2016-04-20 大日本印刷株式会社 音響信号に対する妨害信号の埋め込み装置

Also Published As

Publication number Publication date
JP2014017687A (ja) 2014-01-30

Similar Documents

Publication Publication Date Title
JP6608533B2 (ja) 音声および映像の無許可の記録、再伝送および悪用を防止するためのシステムおよび方法
JP2009526260A5 (ja)
JP4660275B2 (ja) 音響信号に対する情報の埋め込み装置および方法
US20180144755A1 (en) Method and apparatus for inserting watermark to audio signal and detecting watermark from audio signal
JP4867765B2 (ja) 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置
JP7447798B2 (ja) 信号処理装置および方法、並びにプログラム
JP4629495B2 (ja) 音響信号に対する情報の埋め込み装置および方法
TW201317984A (zh) 信號處理設備,信號處理方法及程式
JP2005522724A (ja) オーディオ配信
JP5987511B2 (ja) 音響信号に対する妨害音の埋め込み装置
JP6078993B2 (ja) 音響信号に対する妨害音の埋込み装置
JP2004039138A5 (ja)
JP2006195061A (ja) 音響信号に対する情報の埋め込み装置、音響信号からの情報の抽出装置および音響信号再生装置
JP5906659B2 (ja) 音響信号に対する妨害信号の埋め込み装置
JP6003098B2 (ja) 音響信号に対する妨害雑音の埋め込み装置
WO2022050087A1 (ja) 信号処理装置および方法、学習装置および方法、並びにプログラム
JP7359146B2 (ja) インパルス応答生成装置および方法、並びにプログラム
JP6003099B2 (ja) 音響信号に対する異なる音響信号の埋め込み装置
JP6003107B2 (ja) 音響信号に対する第2の音響信号の埋め込み装置および音響信号に対する妨害音の埋め込み装置
JP2007047223A (ja) 音響信号に対する情報の埋め込み装置
CN115346542A (zh) 音频信号处理方法、装置及存储介质
US20150146897A1 (en) Audio signal processing method and audio signal processing device
WO2018084848A1 (en) Dominant frequency processing of audio signals
JP4765460B2 (ja) 音声符号化装置および音声符号化方法
WO2021261235A1 (ja) 信号処理装置および方法、並びにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150528

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160301

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160725

R150 Certificate of patent or registration of utility model

Ref document number: 5987511

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees