JP2012048120A - 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム - Google Patents
秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム Download PDFInfo
- Publication number
- JP2012048120A JP2012048120A JP2010192133A JP2010192133A JP2012048120A JP 2012048120 A JP2012048120 A JP 2012048120A JP 2010192133 A JP2010192133 A JP 2010192133A JP 2010192133 A JP2010192133 A JP 2010192133A JP 2012048120 A JP2012048120 A JP 2012048120A
- Authority
- JP
- Japan
- Prior art keywords
- data
- spectrum
- music
- concealment
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
【解決手段】周波数解析処理32は、音声データ4及び音楽データ5の各々に対して周波数解析を行い、音声データ4の時間軸方向に最大のスペクトルである音声最大値スペクトルVv(j)を算出し、音楽データ5の時間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(j)を算出する。フィルタ関数作成処理33は、音声最大値スペクトルVv(j)に基づく値を、音楽平均値スペクトルVm(j)に基づく値によって除した値である除算値スペクトルDiv(j)に基づいて、フィルタ関数Fb(j)を作成する。フィルタリング処理34は、音楽データ5を所定の区間単位であるフレームfに分割し、分割された各フレームfをフーリエ変換し、フィルタ関数Fb(j)を乗じ、フーリエ逆変換することによって、秘匿化データ6を生成する。
【選択図】図4
Description
人間は、カクテルパーティ効果によって、より大きな音源(BGM等)により部分的にマスクされた音声を補間して興味のある音声を聴取しようとする働きがある為、通常のBGMによって音声を完全に秘匿化することまでは期待できない。このような問題を解決する為に、(1)エネルギーマスキング、(2)インフォメーションマスキングという2つの手法が提案されている。
また、特許文献3、4に記載の手法では、マスキング音が人間に不快感を与えるとう問題が指摘されている。また、録音する為のマイクロホン、高速信号処理装置などが必要となり、コストがかかるという問題が指摘されている。尚、不快なマスキング音を和らげるために、更にBGMを合成するという手法も考えられるが、音圧が大きくなり煩わしくなるという別の問題が発生する。
第1の発明によって、人間にとって心地良く、かつ秘匿効果が高い秘匿化データを安価に生成することができる。特に、音声最大値スペクトルVv(j)を利用することにより、マスキング効果を高めることができる。
マスキングは、高音側(周波数が高域側)に働きやすいという性質がある為、音声最大値スペクトルVv(jc)(jcは特定の周波数)を、周波数jcよりも高域側の範囲内の最大値に置換することにより、音声スペクトルを周波数方向に低音側に非線形シフトする補正を行っていることになり、ひいては、マスキング効果を高めることができる。
これによって、フィルタ関数が滑らかになり、ひいては、最終的に生成される秘匿化データが、人間にとって心地良い音楽データとなる。
音楽データが複数の楽節で構成され、比較的長い場合、一律の平均値スペクトルで表現すると、楽節によりマスキング効果が働きにくくなる箇所が生じてしまう。これに対して、音楽データを、複数のフレームfを含む音楽ブロックに分割することで、楽節に合ったフィルタ関数を生成することができ、ひいては、マスキング効果を高めることができる。
これによって、分割数が適切となり、マスキング効果は多少弱まるが、再生される音楽に不自然な単調感を与えることがなくなる。
これによって、複数の音楽データに基づいて、複数の秘匿化データを生成することができる。
第2の発明によって、人間にとって心地良く、かつ秘匿効果が高い秘匿化データを安価に生成することができる。特に、音声最大値スペクトルVv(j)を利用することにより、マスキング効果を高めることができる。
第3の発明によって、人間にとって心地良く、かつ秘匿効果が高い秘匿化データを再生することができる。特に、音声最大値スペクトルVv(j)を利用して生成した秘匿化データを再生することにより、マスキング効果を高めることができる。
第4の発明によって、人間にとって心地良く、かつ秘匿効果が高い秘匿化データを再生することができる。特に、音声最大値スペクトルVv(j)を利用して生成した秘匿化データを再生することにより、マスキング効果を高めることができる。
第5の発明によって、人間にとって心地良く、かつ秘匿効果が高い秘匿化データを再生することができる。特に、音声最大値スペクトルVv(j)を利用して生成した秘匿化データを再生することにより、マスキング効果を高めることができる。
第6の発明によって、人間にとって心地良く、かつ秘匿効果が高い秘匿化データを再生することができる。特に、音声最大値スペクトルVv(j)を利用して生成した秘匿化データを再生することにより、マスキング効果を高めることができる。
第7の発明のプログラムを汎用のコンピュータにインストールすることによって、第1の発明の秘匿化データ生成装置を得ることができる。
図1は、秘匿化装置1の概要図である。図1に示すように、秘匿化装置1は、少なくとも、秘匿化データ生成装置2及び音楽再生装置3から構成される。
秘匿化データ生成装置2は、例えば、コンピュータ等であり、対話音声を秘匿化するための音楽データである秘匿化データ6を生成する。秘匿化データ生成装置2の記憶部には、少なくとも音声データ4及び音楽データ5が記憶される。
音楽再生装置3は、音楽プレーヤ及びスピーカから構成され、秘匿化データ6を再生する。音楽再生装置3の記憶部には、少なくとも秘匿化データ生成装置2によって生成される秘匿化データ6が記憶される。
また、秘匿化データ生成装置2及び音楽再生装置3は、図1に示すように有線によって接続されても良いし、無線によって接続されても良いし、ネットワークを介して接続されても良いし、接続されていなくても良い。
秘匿化データ生成装置2及び音楽再生装置3が接続されていない場合、秘匿化データ生成装置2は、秘匿化データ6を記憶媒体(CD、MD、USBメモリ、SDカードなどコンピュータ及び音楽プレーヤが読取可能な記憶媒体)に出力し、音楽再生装置3は、記憶媒体から秘匿化データ6を入力する。
ここで、本発明の実施の形態に係る秘匿化データ生成装置2が生成する秘匿化データ6は、受付カウンターと待合室の間が簡易的な間仕切りのみであっても、通常の音量によって、待合室にいる人が受付カウンターの対話音声の内容を聞き取ることができない程度に、秘匿化することが可能である。
音楽再生装置3が設置される音響空間としては、その他に、金融機関、保険会社、携帯電話店などのカウンターに隣接する待機スペース、法律事務所などの面談室に隣接する通路、飲食店などの個室などが挙げられる。
秘匿化データ生成装置2は、制御部21、記憶部22、メディア入出力部23、通信制御部24、入力部25、表示部26、周辺機器I/F部27等が、バス28を介して接続される。
CPUは、記憶部22、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス28を介して接続された各装置を駆動制御し、秘匿化データ生成装置2が行う後述する処理を実現する。
ROMは、不揮発性メモリであり、秘匿化データ生成装置2のブートプログラムやBIOS等のプログラム、データ等を恒久的に保持している。
RAMは、揮発性メモリであり、記憶部22、ROM、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部11が各種処理を行う為に使用するワークエリアを備える。
これらの各プログラムコードは、制御部21により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。
通信制御部24は、通信制御装置、通信ポート等を有し、秘匿化データ生成装置2とネットワーク間の通信を媒介する通信インタフェースであり、ネットワークを介して、他の装置間との通信制御を行う。ネットワークは、有線、無線を問わない。
入力部25を介して、秘匿化データ生成装置2に対して、操作指示、動作指示、データ入力等を行うことができる。
表示部26は、CRTモニタ、液晶パネル等のディスプレイ装置、ディスプレイ装置と連携してコンピュータ1のビデオ機能を実現するための論理回路等(ビデオアダプタ等)を有する。
バス28は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
図3に示すように、秘匿化データ生成装置2の制御部21は、音声データ4及び音楽データ5を記憶部22に記憶する(S101)。音楽データ5は、複数記憶するようにしても良い。
音声データ4は、秘匿化対象の音響空間における対話音声ではなく、固定のサンプルデータとする。すなわち、本発明の実施の形態における秘匿化データ生成装置2は、リアルタイム処理は行わない。音声データ4は、予め録音された種々の男声、女声が混在した対話音声である。
音楽データ5は任意であるが、聴取者にとって意味のあるメロディ・リズム・和声進行が含まれているもので、マスキング効果が働きやすくなるという点では声楽データが含まれていることが望ましいが、騒がしくなるため、器楽データのみで楽器編成が少ない室内楽曲などが現実的である。秘匿化データ生成装置2は、音楽データ5ごとに秘匿化データ6を生成する。
次に、秘匿化データ生成装置2の制御部21は、S102において選択された単一の音楽データ5に基づいて、秘匿化データ6の生成処理を行う(S103)。秘匿化データ6の生成処理の詳細は後述する。
S102及びS103の処理を繰り返し、複数の秘匿化データ6を生成するようにしても良い。
次に、音楽再生装置3は、単一の秘匿化データ6を選択する(S105)。秘匿化データ6の選択は、ユーザが指示するようにしても良い。
次に、音楽再生装置3は、S105において選択された単一の秘匿化データ6を再生する(S106)。再生音量は、環境の変化に応じて、ユーザの指示により適宜変更される。
以下では、秘匿化データ6の生成処理の詳細について説明する。
ここでは、各処理の概要について説明し、詳細は後述する。
尚、音楽データ5が複数の楽節で構成され、比較的長い場合、一律の平均値スペクトルで表現すると、楽節によりマスキング効果が働きにくくなる箇所が生じる。そこで、必要に応じて、ブロック分割処理31によって、音楽データ5をスペクトル特性より複数のブロックに分割し、ブロックごとに音楽平均値スペクトルVm(j)を算出する。逆に、3〜4分程度の短い音楽データに対して、このような分割を施すと、マスキング効果は確かに働きやすくなるが、再生される音楽に不自然な単調感を与えるため適用しないこともある。例えば、A−B−Cという三部構成の曲でサビのBのパートをA、Cに比べ強く(フォルテ)演奏する指示になっている場合、三部ごとに異なるフィルタ関数を設定すると、AとCが相対的に盛り上がってしまい、サビのBパートが目立たなくなり、曲全体の構成が崩れてしまう。そこで、一律なフィルタ関数を適用し、AとCのパートは多少マスキング効果が弱くなっても、曲全体の音量バランスを維持するようにする。
最初に、ブロック分割処理31では、秘匿化データ生成装置2の制御部21が、サンプリング周波数Fsのモノラル音楽信号(ステレオの場合はLR(左右)の合算値とする。)に対して、各々N/2サンプル間隔ごとに(すなわち、N/2サンプル分ずつ重複する。)、N個ずつ、各々Fフレーム抽出したf番目のフレームデータX(f、j)(f=0、・・・、F−1;i=0、・・・、N−1)に対して、ハニング窓関数H(i)=0.5−0.5cos(2πi/N)を用いてフーリエ変換を行う。
次に、制御部21は、変換データの実部 A(f、j)(f=0、・・・、F−1;j=0、・・・、N−1)、虚部B(f、j)(f=0、・・・、F−1;j=0、・・・、N−1)及び強度値V(f、j)を各々、次式のように算出する。
変移フレームとは、直前又は直後のフレームと比較して、スペクトルの変化が大きいフレームを意味する。
変移フレーム解除処理42を実行する理由は、変移フレーム設定処理41による分割が細か過ぎる場合がある為である。変移フレーム解除処理42を実行し、各音楽ブロックが30秒程度以上になるようにすることが望ましい。
次に、制御部21は、強度値V(f、j)の[f1、fc]区間の平均スペクトル(左側平均スペクトル)Va1(j)と、[fc、f2]区間の平均スペクトル(左側平均スペクトル)Va2(j)の差分(第2差分)dVaを次式のように算出し、dVaが所定の閾値(第2閾値)Sdva以下の場合、即ちdVa<Sdvaの場合、D(fc)=0に再設定する(特定フレームを通常のフレームとして設定する)。
次に、制御部21は、f番目の音声フレームデータX1(f、i)(f=0、・・・、Fv−1;i=0、・・・、N−1)、及び、音楽フレームデータX2(f、i)(f=F(b)、・・・、F(b+1)−1;i=0、・・・、N−1)に対して、ハニング窓関数W(i)=0.5−0.5cos(2πi/N)を用いてフーリエ変換を行う。
次に、制御部21は、X1に対する変換データの実部Av(f、j)(f=0、・・・、Fv−1;j=0、・・・、N−1)、X2に対する変換データの実部Am(f、j)(f=F(b)、・・・、F(b+1)−1;j=0、・・・、N−1)、X1に対する変換データの虚部Bv(f、j)(f=0、・・・、Fv−1;j=0、・・・、N−1)、X2に対する変換データの虚部Bm(f、j)(f=F(b)、・・・、F(b+1)−1;j=0、・・・、N−1)を、それぞれ次式のように算出する。
更に、制御部21は、X1に対する変換データの強度値の最大値である音声最大値スペクトルVv(j)、X2に対する変換データの強度値の平均値である音楽平均値スペクトルVm(b、j)を、それぞれ次式のように算出する。
臨界帯域幅補正処理43は、秘匿化データ生成装置2の制御部21が、音声最大値スペクトルVv(jc)を、周波数jcよりも高域側の範囲内の最大値に置換することによって、置換音声最大値スペクトルを作成し、音楽平均値スペクトルVm(jc)を、周波数jcの前後の範囲内の平均値に置換することによって、置換音楽平均値スペクトルを作成する処理である。
除算処理44は、秘匿化データ生成装置2の制御部21が、音声最大値スペクトルVv(j)に基づく値を音楽平均値スペクトルVm(j)に基づく値によって除した値を除算値スペクトルDiv(j)とする処理である。特に、制御部21は、置換音声最大値スペクトルVv‘(jc)を置換音楽平均値スペクトルVm‘(b、jc)によって除した値を除算値スペクトルDiv(j)とすることが望ましい。
Fb(j)の上限値と下限値は予め設定しておく。例えば、中央値を1とすると、上限値を10倍の「10」、下限値を1/10の「0.1」とする。除算結果が上限値を上回る場合、又は、下限値を下回る場合、制御部21は、それぞれ、Fb(j)に上限値又は下限値を設定する。
図8に示すように、平滑化処理45を行うことで、フィルタ関数Fb(j)は、極値が少なく、滑らかな関数となっている。
前述のブロック分割処理31、周波数解析処理32及びフィルタ関数作成処理33では、実数値に対して計算を行っているが、フィルタリング処理34では、複素数値に対して計算を行う。
フィルタ関数乗算処理47は、制御部21が、ソース複素スペクトルにフィルタ関数Fb(j)を乗じ、改変複素スペクトルを算出する処理である。
フーリエ逆変換処理48は、制御部21が、改変複素スペクトルをフーリエ逆変換を行い、秘匿化フレームデータXl‘(f、i)及びXr‘(f、i)(f=F(b)、・・・、F(b+1)−1;i=0、・・・、N−1)を算出する処理である。
Ar(f、j)、Br(f、j)の各要素に対してフィルタ関数乗算処理47の結果を各々Al‘(f、j)、Bl’(f、j)、 Ar‘(f、j)、Br’(f、j)とする。
フーリエ逆変換処理48では、制御部21は、変換対象のフレームfの秘匿化フレームデータXl‘(f、i)及びXr‘(f、i)に対して、直前に変換されたフレームf−1の秘匿化フレームデータXl‘(f−1、i)及びXr‘(f−1、i)が存在する場合、両者が時間軸においてN/2サンプル分重複することを考慮し、次式のように計算を行う。
特に、本発明の実施の形態では、インフォメーションマスキング手法のように対話音源と同期させながら制御信号を提示する必要がないためリアルタイム信号処理を必要とせず、従来の館内BGMと同様な設備で安価に対話音声の秘匿化を実現できる。また、対話音声の制御に使用する音声・音楽信号として、CM音声を用いれば、BGMを新規な広告メディアとして活用でき、広告主側でBGM再生装置の設置コストを負担する新規な事業モデルを構築できるという効果がある。
図10は、実施例1の音声データを示す図である。図11は、実施例1の音楽データを示す図である。図12は、実施例1のフィルタ関数を示す図である。
また、図11(1)は、音楽データ5である。図11(2)は、音楽平均値スペクトルVm(j)である。図11(3)は、秘匿化データ6である。図11(4)は、秘匿化データ6の平均値スペクトルである。
図10(2)の音声最大値スペクトルVv(j)と、図11(4)の秘匿化データ6の平均値スペクトルとを比較すると、関数の形状が略同一となった。関数の形状が略同一ということは、秘匿化データ6が、音声データ4をマスキングする効果が高いことを示している。
図11(2)と図12(4)とを比較すると、高周波数部分のスペクトルがフィルタ関数により抑えられていることが分かる。
図13は、実施例2の音楽データを示す図である。図14は、実施例2のブロック1に係るフィルタ関数を示す図である。図15は、実施例2のブロック2に係るフィルタ関数を示す図である。図16は、実施例2のブロック3に係るフィルタ関数を示す図である。
尚、実施例2の音声データ4は、実施例1(図10)と同様である。
図14〜図16のフィルタ関数を比較すると、ブロック1のフィルタ関数は、特に目立つ極大値が2つとなった。ブロック2のフィルタ関数は、特に目立つ極大値が3つとなった。ブロック3のフィルタ関数は、特に目立つ極大値が1つ、特に目立つ極小値が1つとなった。このように、3つのフィルタ関数は、強調する部分が大きく異なった。
仮に、図13に示す音楽データ5を複数の音楽ブロックに分割せず、1つのフィルタ関数のみを生成すると、そのフィルタ関数では、マスキング効果が働きにくくなる箇所が生じることになると推察される。
2………秘匿化データ生成装置
3………音楽再生装置
4………音声データ
5………音楽データ
6………秘匿化データ
11………音楽ブロック群
12………音声最大値スペクトルデータ
13………音声平均値スペクトルデータ
14………フィルタ関数データ
31………ブロック分割処理
32………周波数解析処理
32a………周波数解析
33………フィルタ関数作成処理
34………フィルタリング処理
41………変移フレーム設定処理
42………変移フレーム解除処理
43………臨界帯域幅補正処理
44………除算処理
45………平滑化処理
46………フーリエ変換処理
47………フィルタ関数乗算処理
48………フーリエ逆変換処理
Claims (13)
- 対話音声を秘匿化するための音楽データである秘匿化データを生成する秘匿化データ生成装置であって、
予め記憶された音声データ及び音楽データの各々に対して周波数解析を行い、前記音声データの時間軸方向に最大のスペクトルである音声最大値スペクトルVv(j)(jは周波数)を算出し、前記音楽データの時間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(j)を算出する周波数解析手段と、
前記音声最大値スペクトルVv(j)に基づく値を前記音楽平均値スペクトルVm(j)に基づく値によって除した値である除算値スペクトルDiv(j)に基づいて、フィルタ関数Fb(j)を作成するフィルタ関数作成手段と、
前記音楽データを所定の区間単位であるフレームfに分割し、分割された各フレームfをフーリエ変換し、前記フィルタ関数Fb(j)を乗じ、フーリエ逆変換することによって、前記秘匿化データを生成するフィルタリング手段と、
を具備することを特徴とする秘匿化データ生成装置。 - 前記フィルタ関数作成手段は、
前記音声最大値スペクトルVv(jc)(jcは特定の周波数)を、周波数jcよりも高域側の範囲内の最大値に置換することによって、置換音声最大値スペクトルを算出し、
前記音楽平均値スペクトルVm(jc)を、周波数jcの前後の範囲内の平均値に置換することによって、置換音楽平均値スペクトルを算出し、
前記置換音声最大値スペクトルを前記置換音楽平均値スペクトルによって除した値を前記除算値スペクトルDiv(j)とすることを特徴とする請求項1に記載の秘匿化データ生成装置。 - 前記フィルタ関数作成手段は、
前記除算値スペクトルDiv(j)を、周波数jの前後の範囲内の平均値に置換することによって、前記除算値スペクトルDiv(j)を平滑化することを特徴とする請求項1又は請求項2に記載の秘匿化データ生成装置。 - スペクトルの変移に基づいて、前記音楽データを、複数のフレームfを含む音楽ブロックに分割するブロック分割手段、
を更に具備し、
前記周波数解析手段は、前記音楽ブロックごとに前記音楽平均値スペクトルVm(b、j)(bはブロック)を算出し、
前記フィルタ関数作成手段は、前記音楽ブロックごとに前記フィルタ関数F(b、j)を作成し、
前記フィルタリング手段は、前記音楽ブロックごとに前記秘匿化データを生成することを特徴とする請求項1乃至請求項3のいずれかに記載の秘匿化データ生成装置。 - 前記ブロック分割手段は、
フレームfのスペクトルと、隣接するフレーム(f−1)又は(f+1)のスペクトルと、の差分である第1差分を算出し、前記第1差分が第1閾値を超えているフレームfを変移フレームとして設定する変移フレーム設定手段と、
前記変移フレームの1つを特定フレームとし、前記特定フレームよりも前の変移フレーム又は先頭フレームを左端フレームとし、前記特定フレームよりも後の変移フレーム又は最終フレームを右端フレームとし、前記左端フレームから前記特定フレームまでの範囲のスペクトルの平均値である左側平均値スペクトルと、前記特定フレームから前記右端フレームまでの範囲のスペクトルの平均値である右側平均値スペクトルと、の差分である第2差分を算出し、前記第2差分が第2閾値以下である場合、前記特定フレームを通常のフレームとして設定する変移フレーム解除手段と、
を含み、
前記変移フレーム設定手段によって設定された全ての前記変移フレームに対して、前記変移フレーム解除手段による処理が実行された後、前記変移フレームごとに前記音楽データを前記音楽ブロックに分割するものであることを特徴とする請求項4に記載の秘匿化データ生成装置。 - 複数の前記音楽データを記憶する音楽データ記憶手段と、
前記音楽データ記憶手段によって記憶されている前記音楽データの中から単一の前記音楽データを選択する音楽データ選択手段と、
を更に具備し、
前記音楽データ選択手段によって選択された単一の前記音楽データに基づいて、前記秘匿化データを生成することを特徴とする請求項1乃至請求項5のいずれかに記載の秘匿化データ生成装置。 - 対話音声を秘匿化するための音楽データである秘匿化データを生成する秘匿化データ生成方法であって、
予め記憶された音声データ及び音楽データの各々に対して周波数解析を行い、前記音声データの時間軸方向に最大のスペクトルである音声最大値スペクトルVv(j)(jは周波数)を算出し、前記音楽データの時間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(j)を算出する周波数解析ステップと、
前記音声最大値スペクトルVv(j)に基づく値を前記音楽平均値スペクトルVm(j)に基づく値によって除した値である除算値スペクトルDiv(j)に基づいて、フィルタ関数Fb(j)を作成するフィルタ関数作成ステップと、
前記音楽データを所定の区間単位であるフレームfに分割し、分割された各フレームfをフーリエ変換し、前記フィルタ関数Fb(j)を乗じ、フーリエ逆変換することによって、前記秘匿化データを生成するフィルタリングステップと、
を含むことを特徴とする秘匿化データ生成方法。 - 請求項1乃至請求項6のいずれかに記載の秘匿化データ生成装置が生成する複数の前記秘匿化データを記憶する秘匿化データ記憶手段と、
前記秘匿化データ記憶手段によって記憶されている前記秘匿化データの中から単一の前記秘匿化データを選択する秘匿化データ選択手段と、
前記秘匿化データ選択手段によって選択された単一の前記秘匿化データを再生する秘匿化データ再生手段と、
を具備することを特徴とする秘匿化装置。 - 対話音声を秘匿化するための音楽データである秘匿化データを生成し、再生する秘匿化装置であって、
予め記憶された音声データ及び音楽データの各々に対して周波数解析を行い、前記音声データの時間軸方向に最大のスペクトルである音声最大値スペクトルVv(j)(jは周波数)を算出し、前記音楽データの時間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(j)を算出する周波数解析手段と、
前記音声最大値スペクトルVv(j)に基づく値を前記音楽平均値スペクトルVm(j)に基づく値によって除した値である除算値スペクトルDiv(j)に基づいて、フィルタ関数Fb(j)を作成するフィルタ関数作成手段と、
前記音楽データを所定の区間単位であるフレームfに分割し、分割された各フレームfをフーリエ変換し、前記フィルタ関数Fb(j)を乗じ、フーリエ逆変換することによって、前記秘匿化データを生成するフィルタリング手段と、
前記秘匿化データを再生する秘匿化データ再生手段と、
を具備することを特徴とする秘匿化装置。 - 請求項7に記載の秘匿化データ生成方法によって生成する複数の前記秘匿化データを記憶する秘匿化データ記憶ステップと、
前記秘匿化データ記憶手段によって記憶されている前記秘匿化データの中から単一の前記秘匿化データを選択する秘匿化データ選択ステップと、
前記秘匿化データ選択手段によって選択された単一の前記秘匿化データを再生する秘匿化データ再生ステップと、
を含むことを特徴とする秘匿化方法。 - 対話音声を秘匿化するための音楽データである秘匿化データを生成し、再生する秘匿化方法であって、
予め記憶された音声データ及び音楽データの各々に対して周波数解析を行い、前記音声データの時間軸方向に最大のスペクトルである音声最大値スペクトルVv(j)(jは周波数)を算出し、前記音楽データの時間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(j)を算出する周波数解析ステップと、
前記音声最大値スペクトルVv(j)に基づく値を前記音楽平均値スペクトルVm(j)に基づく値によって除した値である除算値スペクトルDiv(j)に基づいて、フィルタ関数Fb(j)を作成するフィルタ関数作成ステップと、
前記音楽データを所定の区間単位であるフレームfに分割し、分割された各フレームfをフーリエ変換し、前記フィルタ関数Fb(j)を乗じ、フーリエ逆変換することによって、前記秘匿化データを生成するフィルタリングステップと、
前記秘匿化データを再生する秘匿化データ再生ステップと、
を含むことを特徴とする秘匿化方法。 - コンピュータに、
予め記憶された音声データ及び音楽データの各々に対して周波数解析を行い、前記音声データの時間軸方向に最大のスペクトルである音声最大値スペクトルVv(j)(jは周波数)を算出し、前記音楽データの時間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(j)を算出する周波数解析ステップと、
前記音声最大値スペクトルVv(j)に基づく値を前記音楽平均値スペクトルVm(j)に基づく値によって除した値である除算値スペクトルDiv(j)に基づいて、フィルタ関数Fb(j)を作成するフィルタ関数作成ステップと、
前記音楽データを所定の区間単位であるフレームfに分割し、分割された各フレームfをフーリエ変換し、前記フィルタ関数Fb(j)を乗じ、フーリエ逆変換することによって、対話音声を秘匿化するための音楽データである秘匿化データを生成するフィルタリングステップと、
を実行させるためのコンピュータ読取可能なプログラム。 - コンピュータに、
予め記憶された音声データ及び音楽データの各々に対して周波数解析を行い、前記音声データの時間軸方向に最大のスペクトルである音声最大値スペクトルVv(j)(jは周波数)を算出し、前記音楽データの時間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(j)を算出する周波数解析ステップと、
前記音声最大値スペクトルVv(j)に基づく値を前記音楽平均値スペクトルVm(j)に基づく値によって除した値である除算値スペクトルDiv(j)に基づいて、フィルタ関数Fb(j)を作成するフィルタ関数作成ステップと、
前記音楽データを所定の区間単位であるフレームfに分割し、分割された各フレームfを周波数次元に変換し、変換された周波数成分V(f、j)に対して前記フィルタ関数Fb(j)を乗じ、更に時間次元に逆変換することで、前記秘匿化データを生成するフィルタリングステップと、
対話音声を秘匿化するための音楽データである秘匿化データを再生する秘匿化データ再生ステップと、
を実行させるためのコンピュータ読取可能なプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010192133A JP5644268B2 (ja) | 2010-08-30 | 2010-08-30 | 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010192133A JP5644268B2 (ja) | 2010-08-30 | 2010-08-30 | 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012048120A true JP2012048120A (ja) | 2012-03-08 |
JP5644268B2 JP5644268B2 (ja) | 2014-12-24 |
Family
ID=45903031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010192133A Expired - Fee Related JP5644268B2 (ja) | 2010-08-30 | 2010-08-30 | 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5644268B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10178695A (ja) * | 1996-10-18 | 1998-06-30 | Matsushita Electric Ind Co Ltd | 音響再生装置 |
JP2007264436A (ja) * | 2006-03-29 | 2007-10-11 | Matsushita Electric Ind Co Ltd | 音マスキング装置、音マスキング方法およびプログラム |
JP2009175558A (ja) * | 2008-01-25 | 2009-08-06 | Kawasaki Heavy Ind Ltd | 音響装置および音響制御装置 |
JP2010020133A (ja) * | 2008-07-11 | 2010-01-28 | Sony Corp | 再生装置、表示方法および表示プログラム |
-
2010
- 2010-08-30 JP JP2010192133A patent/JP5644268B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10178695A (ja) * | 1996-10-18 | 1998-06-30 | Matsushita Electric Ind Co Ltd | 音響再生装置 |
JP2007264436A (ja) * | 2006-03-29 | 2007-10-11 | Matsushita Electric Ind Co Ltd | 音マスキング装置、音マスキング方法およびプログラム |
JP2009175558A (ja) * | 2008-01-25 | 2009-08-06 | Kawasaki Heavy Ind Ltd | 音響装置および音響制御装置 |
JP2010020133A (ja) * | 2008-07-11 | 2010-01-28 | Sony Corp | 再生装置、表示方法および表示プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5644268B2 (ja) | 2014-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Blauert | Communication acoustics | |
Lindau et al. | A spatial audio quality inventory (SAQI) | |
JP5103974B2 (ja) | マスキングサウンド生成装置、マスキングサウンド生成方法およびプログラム | |
Verfaille et al. | Adaptive digital audio effects (A-DAFx): A new class of sound transformations | |
Zacharov | Sensory evaluation of sound | |
Schlittmeier et al. | Does irrelevant music cause an irrelevant sound effect for auditory items? | |
Roman et al. | Speech intelligibility in reverberation with ideal binary masking: Effects of early reflections and signal-to-noise ratio threshold | |
WO2007041231A2 (en) | Method and apparatus for removing or isolating voice or instruments on stereo recordings | |
US20090052681A1 (en) | System and a method of processing audio data, a program element, and a computer-readable medium | |
JP2010014913A (ja) | 声質変換音声生成装置および声質変換音声生成システム | |
CN103650538A (zh) | 用于使用采用谱权重生成器的频域处理分解立体声录音的方法和装置 | |
RU2595541C2 (ru) | Устройство, способ и компьютерная программа для генерирования выходного стереосигнала для обеспечения дополнительных выходных каналов | |
JP2014130251A (ja) | 会話保護システム及び会話保護方法 | |
Prud'Homme et al. | A harmonic-cancellation-based model to predict speech intelligibility against a harmonic masker | |
Akagi et al. | Privacy protection for speech based on concepts of auditory scene analysis | |
Blauert | Conceptual aspects regarding the qualification of spaces for aural performances | |
JP4680099B2 (ja) | 音声処理装置および音声処理方法 | |
WO2021111965A1 (ja) | 音場生成システム、音声処理装置および音声処理方法 | |
JP5707944B2 (ja) | 快音化データ生成装置、快音化データ生成方法、快音化装置、快音化方法及びプログラム | |
Rämö et al. | Perceptual frequency response simulator for music in noisy environments | |
JP5648485B2 (ja) | 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム | |
JP2015034932A (ja) | 秘匿化データ生成装置、秘匿化装置およびプログラム | |
JP5644268B2 (ja) | 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム | |
JP5741175B2 (ja) | 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム | |
JP2012008393A (ja) | 音声変更装置、音声変更方法および音声情報秘話システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130626 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140603 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140707 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141020 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5644268 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |