JP5648485B2 - 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム - Google Patents
秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム Download PDFInfo
- Publication number
- JP5648485B2 JP5648485B2 JP2011000929A JP2011000929A JP5648485B2 JP 5648485 B2 JP5648485 B2 JP 5648485B2 JP 2011000929 A JP2011000929 A JP 2011000929A JP 2011000929 A JP2011000929 A JP 2011000929A JP 5648485 B2 JP5648485 B2 JP 5648485B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- spectrum
- frame
- music
- concealment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
人間は、カクテルパーティ効果によって、より大きな音源(BGM等)により部分的にマスクされた音声を補間して興味のある音声を聴取しようとする働きがある為、通常のBGMによって音声を完全に秘匿化することまでは期待できない。このような問題を解決する為に、(1)エネルギーマスキング、(2)インフォメーションマスキングという2つの手法が提案されている。
また、特許文献3、4に記載の手法では、マスキング音が人間に不快感を与えるとう問題が指摘されている。また、録音する為のマイクロホン、高速信号処理装置などが必要となり、コストがかかるという問題が指摘されている。尚、不快なマスキング音を和らげるために、更にBGMを合成するという手法も考えられるが、音圧が大きくなり煩わしくなるという別の問題が発生する。
第1の発明によって、人手を費やさずに、どの再生箇所においてもマスキング効果が満遍なく働く秘匿化データを生成することができる。
マスキングは、高音側(周波数が高域側)に働きやすいという性質がある為、音声最大値スペクトルVv(j)を、周波数jよりも高域側の範囲内の最大値に置換すれば、音声スペクトルを周波数方向に低音側に非線形シフトする補正を行っていることになり、ひいては、マスキング効果を高めることができる。
これによって、フィルタ関数が滑らかになり、ひいては、最終的に生成される秘匿化データが、人間にとって心地良い音楽データとなる。
これによって、複数の音楽データに基づいて、複数の秘匿化データを生成することができる。
第2の発明によって、人手を費やさずに、どの再生箇所においてもマスキング効果が満遍なく働く秘匿化データを生成することができる。
第3の発明によって、人手を費やさずに、秘匿化データのどの再生箇所においてもマスキング効果を満遍なく働かせることができる。
これによって、秘匿化対象位置に伝搬される過程で減衰する音波のエネルギー量が、前記対話音声に比べ前記秘匿化データの方が小さくなり、相対的に前記秘匿化データのエネルギー量が前記対話音声に比べ大きくなるため、マスキング効果を高めることができる。
第5の発明によって、人手を費やさずに、秘匿化データのどの再生箇所においてもマスキング効果を満遍なく働かせることができる。
軸方向に最大のスペクトルである単一の音声最大値スペクトルVv(j)(jは周波数)を算出し、前記音楽データの各フレームfの前後Mフレームに渡って時 間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(f,j)をフレームfごとに算出する周波数解析ステップと、前記音声最大値スペクトルVv(j)に基づく値を、フレームfに対応する前記音楽平均値スペクトルVm(f,j)に基づく値によって互いに対応する周波 数jごとに除した値である除算値スペクトルDiv(f,j)に基づいて、フィルタ関数F(f,j)をフレームfごとに作成するフィルタ関数作成ステップ
と、前記音楽データを所定の区間単位であるフレームfに分割し、分割された各フレームfをフーリエ変換し、各フレームfに対応する前記フィルタ関数F(f,j)を乗じ、フーリエ逆変換することによって、前記秘匿化データを生成するフィルタリングステップと、生成された複数の前記秘匿化データを記憶する秘匿化データ記憶ステップと、前記秘匿化データ記憶ステップによって記憶されている前記秘匿化データの中から単一の前記秘匿化データを選択する秘匿化データ選択ステップと、前記秘匿化データ選択ステップによって選択された単一の前記秘匿化データを再生する秘匿化データ再生ステップと、を含むことを特徴とする秘匿化方法である。
第6の発明によって、人手を費やさずに、秘匿化データのどの再生箇所においてもマスキング効果を満遍なく働かせることができる。
第7の発明によって、人手を費やさずに、秘匿化データのどの再生箇所においてもマスキング効果を満遍なく働かせることができる。
第8の発明のプログラムを汎用のコンピュータにインストールすることによって、第1の発明の秘匿化データ生成装置を得ることができる。
第9の発明のプログラムを、音楽スピーカが接続された汎用のコンピュータにインストールすることによって、第5の発明の秘匿化装置を得ることができる。
図1は、秘匿化装置1の概要図である。図1に示すように、秘匿化装置1は、少なくとも、秘匿化データ生成装置2及び音楽再生装置3から構成される。
秘匿化データ生成装置2は、例えば、コンピュータ等であり、対話音声を秘匿化するための音楽データである秘匿化データ6を生成する。秘匿化データ生成装置2の記憶部には、少なくとも音声データ4及び音楽データ5が記憶される。
音楽再生装置3は、音楽プレーヤ及びスピーカから構成され、秘匿化データ6を再生する。音楽再生装置3の記憶部には、少なくとも秘匿化データ生成装置2によって生成される秘匿化データ6が記憶される。
また、秘匿化データ生成装置2及び音楽再生装置3は、図1に示すように有線によって接続されても良いし、無線によって接続されても良いし、ネットワークを介して接続されても良いし、接続されていなくても良い。
秘匿化データ生成装置2及び音楽再生装置3が接続されていない場合、秘匿化データ生成装置2は、秘匿化データ6を記憶媒体(CD、MD、USBメモリ、SDカードなどコンピュータ及び音楽プレーヤが読取可能な記憶媒体)に出力し、音楽再生装置3は、記憶媒体から秘匿化データ6を入力する。
ここで、本発明の実施の形態に係る秘匿化データ生成装置2が生成する秘匿化データ6は、受付カウンターと待合室の間が簡易的な間仕切りのみであっても、通常の音量によって、待合室にいる人が受付カウンターの対話音声の内容を聞き取ることができない程度に、秘匿化することが可能である。
音楽再生装置3が設置される音響空間としては、その他に、金融機関、保険会社、携帯電話店などのカウンターに隣接する待機スペース、法律事務所などの面談室に隣接する通路、企業などの応接室、飲食店などの個室などが挙げられる。
秘匿化データ生成装置2は、制御部21、記憶部22、メディア入出力部23、通信制御部24、入力部25、表示部26、周辺機器I/F部27等が、バス28を介して接続される。
CPUは、記憶部22、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス28を介して接続された各装置を駆動制御し、秘匿化データ生成装置2が行う後述する処理を実現する。
ROMは、不揮発性メモリであり、秘匿化データ生成装置2のブートプログラムやBIOS等のプログラム、データ等を恒久的に保持している。
RAMは、揮発性メモリであり、記憶部22、ROM、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部11が各種処理を行う為に使用するワークエリアを備える。
これらの各プログラムコードは、制御部21により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。
通信制御部24は、通信制御装置、通信ポート等を有し、秘匿化データ生成装置2とネットワーク間の通信を媒介する通信インタフェースであり、ネットワークを介して、他の装置間との通信制御を行う。ネットワークは、有線、無線を問わない。
入力部25を介して、秘匿化データ生成装置2に対して、操作指示、動作指示、データ入力等を行うことができる。
表示部26は、CRTモニタ、液晶パネル等のディスプレイ装置、ディスプレイ装置と連携してコンピュータ1のビデオ機能を実現するための論理回路等(ビデオアダプタ等)を有する。
バス28は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
マスキングとは、一方の音が、他方の音によってかき消され(マスクされ)、聞こえなくなる現象を意味する。聴覚マスキング現象は、図3に示すように、2種類に大別される。
尚、マスカー音7aの周波数が、マスキー音8aの周波数より僅かに低い方が、僅かに高い場合に比べマスキング効果は大きいが、両者の周波数が完全に一致する場合、互いに強め合うことになり、マスキング効果は生じない。また、マスカー音7aの周波数が、マスキー音8aの周波数より所定の範囲(臨界帯域幅とよばれる)より高いまたは低い場合も、マスキング効果は生じない。
順向マスキングは、マスカー音7bが先行して到達し、マスキー音8bが若干遅れて到達する場合、具体的には時間差が100msec以下の場合に働く。この場合、後続の音であるマスキー音8bが聞こえない。
逆向マスキングは、マスカー音7cがマスキー音8cよりも強く、かつ、マスキー音8cが先行して到達し、マスカー音7cが非常に微小な時間だけ遅れて到達する場合、具体的には時間差が20msec以下の場合に働く。この場合、先行音であるマスキー音8cが、後続音であるマスカー音7cに抜かれ、聞こえなくなる。マスキー音8cがマスカー音7cに抜かれる理由は、強い音であるマスカー音7cの方が、人間の耳の中での伝播時間が早まる為である。
尚、逆向マスキングよりも順向マスキングの方が、マスキング効果は高い。
図4に示すように、秘匿化データ生成装置2の制御部21は、音声データ4及び音楽データ5を記憶部22に記憶する(S101)。音楽データ5は、複数記憶するようにしても良い。
音声データ4は、秘匿化対象の音響空間における対話音声ではなく、固定のサンプルデータとする。すなわち、本発明の実施の形態における秘匿化データ生成装置2は、リアルタイムにサンプリングされた秘匿化対象の対話音声は使用しない。音声データ4は、予め録音された種々の男声、女声が混在した対話音声である。
音楽データ5は任意である。例えば、聴取者にとって意味のあるメロディ・リズム・和声進行が含まれている必要は必ずしもなく、川のせせらぎ音などの自然音でもかまわない。秘匿化対象の対話音声に類似した周波数成分を多く含む音楽データであれば、マスキング効果が働きやすくなるので、マスキング効果を高めるという意味では、声楽データが含まれていることが望ましい。但し、声楽データが含まれると騒がしくなるため、器楽データのみであり、楽器編成が少ない室内楽曲などが現実的である。秘匿化データ生成装置2は、音楽データ5ごとに秘匿化データ6を生成する。
次に、秘匿化データ生成装置2の制御部21は、S102において選択された単一の音楽データ5に基づいて、秘匿化データ6の生成処理を行う(S103)。秘匿化データ6の生成処理の詳細は後述する。
S102及びS103の処理を繰り返し、複数の秘匿化データ6を生成するようにしても良い。
次に、音楽再生装置3は、単一の秘匿化データ6を選択する(S105)。秘匿化データ6の選択は、ユーザが指示するようにしても良い。
次に、音楽再生装置3は、S105において選択された単一の秘匿化データ6を再生する(S106)。再生音量は、環境の変化に応じて、ユーザの指示により適宜変更される。
以下では、秘匿化データ6の生成処理の詳細について説明する。
ここでは、各処理の概要について説明し、詳細は後述する。
所定の区間単位(フレームの長さ)は、例えば、100msec以下が望ましい。これは、前述の時間マスキング、特に、順向マスキングによるマスキング効果を活用する為である。尚、所定の区間単位(フレームの長さ)を例えば10msec以下などにいたずらに短く設定しても、フレーム数が増えて計算時間が長くなるだけで効果は変わらない。
尚、Vv(j)の添え字「v」は、voiceの頭文字である。また、Vm(f、j)の添え字「m」は、musicの頭文字である。
音楽データ5は、フレーム単位の各瞬時スペクトル(位相成分は無視したエネルギー量)に対して、フレームfごとに、前後所定のフレーム数に対応する瞬時スペクトルを平均化した平均スペクトルVm(f,j)に置換する。
例えば、サンプリング周波数Fsを「44100Hz」、サンプル数Nを「4096」とする。サンプリング周波数Fs及びサンプル数Nによって、音声データ4に含まれるフレーム数Fvが定まる。
フレーム抽出処理31では、秘匿化データ生成装置2の制御部21が、サンプリング周波数Fsのモノラル音声信号(ステレオの場合はLR(左右)の合算値とする。)に対して、各々N/2サンプル間隔ごとに(すなわち、N/2サンプル分ずつ重複する。)、N個ずつ、各々Fvフレーム抽出する。
次に、制御部21は、変換データの実部 Av(f、j)(f=0、・・・、Fv−1;j=0、・・・、N−1)、虚部Bv(f、j)(f=0、・・・、Fv−1;j=0、・・・、N−1)及び強度値の時系列の最大値スペクトルVv(j)を各々、次式のように算出する。
音声データ4と同様、サンプリング周波数Fsを「44100Hz」、サンプル数Nを「4096」とする。サンプリング周波数Fs及びサンプル数Nによって、音楽データ5に含まれるフレーム数Fmが定まる。
フレーム抽出処理31では、秘匿化データ生成装置2の制御部21が、サンプリング周波数Fsのモノラル音楽信号(ステレオの場合はLR(左右)の合算値とする。)に対して、各々N/2サンプル間隔ごとに(すなわち、N/2サンプル分ずつ重複する。)、N個ずつ、各々Fmフレーム抽出する。
次に、制御部21は、瞬時スペクトル算出処理41として、フレームごとに、位相成分は無視したエネルギー量である瞬時スペクトルを算出する。また、制御部21は、平均スペクトル算出処理42として、前後Mフレーム(M個)の瞬時スペクトルの平均値である平均スペクトルを算出する。
但し、音楽データ5の先頭部、すなわち、f<M/2の場合、前後M/2フレーム(M/2個)ずつの平均を取ることができないことから、Vm(f、j)=Vm(M/2、j)とする。同様に、音楽データ5の後尾部、すなわち、f>Fm−M/2の場合、前後M/2フレーム(M/2個)ずつの平均を取ることができないことから、Vm(f、j)=Vm(Fm−M/2−1、j)とする。
図6には、音楽フレームデータXm(f、i)のフレーム1〜フレームM+1に対して、周波数解析42aが行われ、フレーム1〜フレームMまでの時系列平均が算出され、フレームfに対する音楽平均値スペクトルVm(f、j)が算出されることが図示されている。同様に、図6には、フレーム2〜フレームM+1までの時系列平均が算出され、フレームf+1に対する音楽平均値スペクトルVm(f+1、j)が算出されることが図示されている。
臨界帯域幅補正処理43は、秘匿化データ生成装置2の制御部21が、音声最大値スペクトルVv(j)を、周波数jごとに所定の範囲内の最大値に置換することによって、単一の置換音声最大値スペクトルVv’(j)を作成する処理である。また、臨界帯域幅補正処理43は、フレームfごとに、音楽平均値スペクトルVm(f、j)を、周波数jごとに所定の範囲内の平均値に置換することによって、置換音楽平均値スペクトルVm’(f、j)を作成する処理である。図8には、一例として、フレームfとフレームf+1に対する臨界帯域幅補正処理が示されている。
マスキングは、高音側(周波数が高域側)に働きやすいという性質がある為、音声最大値スペクトルVv(j)を、周波数jよりも高域側の範囲内の最大値に置換すれば、音声スペクトルを周波数方向に低音側に非線形シフトする補正を行っていることになり、ひいては、マスキング効果を高めることができる。
除算処理44は、秘匿化データ生成装置2の制御部21が、フレームfごとに、音声最大値スペクトルVv(j)に基づく値を音楽平均値スペクトルVm(j)に基づく値によって互いに対応する周波数jごとに除した値を除算値スペクトルDiv(f、j)として算出する処理である。特に、制御部21は、フレームfごとに、置換音声最大値スペクトルVv’(j)を置換音楽平均値スペクトルVm’(f、j)によって除した値を除算値スペクトルDiv(f、j)とすることが望ましい。
図9には、一例として、フレームfとフレームf+1に対する除算処理が示されている。
図9には、一例として、フレームfとフレームf+1に対する平滑化処理が示されている。
F(f、j)の上限値と下限値は予め設定しておく。例えば、中央値を1とすると、上限値を10倍の「10」、下限値を1/10の「0.1」とする。除算結果が上限値を上回る場合、又は、下限値を下回る場合、制御部21は、それぞれ、F(f、j)に上限値又は下限値を設定する。
図9に示すように、平滑化処理45を行うことで、フィルタ関数F(f、j)は、極値が少なく、滑らかな関数となっている。
前述の周波数解析処理32及びフィルタ関数作成処理33では、実数値に対して計算を行っているが、フィルタリング処理34では、複素数値をもつ瞬時スペクトルに対して計算を行う。
フィルタ関数乗算処理47は、制御部21が、ソース複素スペクトルにフィルタ関数F(f、j)を乗じ、改変複素スペクトルを算出する処理である。
フーリエ逆変換処理48は、制御部21が、改変複素スペクトルのフーリエ逆変換を行い、秘匿化フレームデータXml’(f、i)及びXmr’(f、i)(f=0、・・・、Fm−1;i=0、・・・、N−1)を算出する処理である。
フーリエ逆変換処理48では、制御部21は、変換対象のフレームfの秘匿化フレームデータXml’(f、i)及びXmr’(f、i)に対して、直前に変換されたフレームf−1の秘匿化フレームデータXml’(f−1、i)及びXmr’(f−1、i)が存在する場合、両者が時間軸においてN/2サンプル分重複することを考慮し、次式のように計算を行う。
そして、本発明の実施の形態では、フィルタ関数を生成する負荷が若干増大するものの、長時間のBGMを用いて、従来の館内BGMと同様の設備によって安価に対話音声の秘匿化を効果的に実現できる。
図11に示す例では、平面スピーカ51a及び51bを挟んで左側が面談スペース60であり、右側が待合スペース65になっている。
面談スペース60には、面談カウンターテーブル61、店員用椅子62、来客用椅子63等が設置されている。面談カウンターテーブル61は、パーティション64によって区切られている。また、待合スペース65には、待合ソファー65が設置されている。顧客は、来店すると待合スペース65において待機し、順番に面談スペース60に呼ばれて店員と面談する。
平面スピーカ51a及び51bのパネルは、待合スペース65より面談カウンターテーブル61にいる店員や来客が覗き込めないパーティション程度の大きさがあること望ましいが、A3サイズ程度の面積しかない立て看板などでも十分に効果を発揮する。すなわち、会話音声71が、平面スピーカ51a及び51bに物理的に遮られることなく、待合ソファー65まで到達しても、本発明の秘匿化データ6によって十分なマスキング効果が得られる。
尚、ポスラ(本出願人の登録商標)サウンドパネルは、横幅1メートル程度まで製作可能である。
図11に示す例では、平面スピーカ51a及び51bが、それぞれ、マスカー音であるBGMサウンドL72a及びBGMサウンドR72bを出力している(ステレオ再生)。尚、BGMサウンドは、モノラル再生でも良く、平面スピーカの数や配置位置は、環境に応じて適宜変更すれば良い。
図11に示すように、会話音声71は、球面波の音波として、観測位置である待合スペース65に到達する。同様に、通常のダイナミックスピーカから再生されるBGMも、球面波の音波である。
ここで、球面波の場合、距離の2乗に比例して伝搬される表面積が大きくなり音源に集中していたエネルギーが分散するため、エネルギー(音圧)が距離の2乗に反比例して減衰していくことが知られている。一方、平面波の場合、距離が離れてもエネルギーがあまり減衰しない。
一方、平面波に近い音波を放射する平面スピーカ51a及び51bを用いれば、再生されるBGMサウンドL72a、BGMサウンドR72bは、平面波の音波であり、離れてもエネルギーがあまり減衰しないから、面談スペース60により近い位置に待機している顧客に合わせて音量を調節しても、面談スペース60により遠い位置に待機している顧客に対して十分なマスキング効果が働く。
図12に示す例では、平面スピーカ51c及び51dを挟んで左側が第1応接スペース81aであり、右側が第2応接スペース81bになっている。
第1応接スペース81a及び第2応接スペース81bには、それぞれ、1つの応接テーブル82と4つの椅子83が設置されている。
第1応接スペース81a及び第2応接スペース81bでは、それぞれ独立して、別々の顧客を応接するようになっている。
平面スピーカ51c及び51dには、複数のスピーカ(エキサイタ)を備えており、それぞれのスピーカから、マスカー音であるBGMサウンドL72a、BGMサウンドR72bが出力される。
第1の設置例と同様、平面スピーカ51c及び51dは、音楽プレーヤ52によって、秘匿化データ6の波面が平面波に近い音波として、平面から均一に放射する機構を有することが望ましい。
第1会話音声71aに対しては、第2応接スペース81bにおいて、平面スピーカ51dから出力されるBGMサウンドL72a、BGMサウンドR72bがマスカー音となり、マスキング効果を発揮する。同様に、第2会話音声71bに対しては、第1応接スペース81aにおいて、平面スピーカ51cから出力されるBGMサウンドL72a、BGMサウンドR72bがマスカー音となり、マスキング効果を発揮する。
また、平面スピーカは、A3サイズ程度の立て看板から、横幅1メートル程度のパーティションまで、様々な態様とすることができる。
また、平面スピーカのパネル面の絵柄としては、壁紙などのインテリア素材やポスター広告を用いることができ、視覚的にもスピーカがむき出しになるようなインテリア上の不自然さを回避することができる。
2………秘匿化データ生成装置
3………音楽再生装置
4………音声データ
5………音楽データ
6………秘匿化データ
10………音声フレーム群
11………音楽フレーム群
12………音声最大値スペクトルデータ
13………音声平均値スペクトルデータ
14………フィルタ関数データ
31………フレーム抽出処理
32………周波数解析処理
32a………周波数解析
33………フィルタ関数作成処理
34………フィルタリング処理
41………瞬時スペクトル算出処理
42………平均スペクトル算出処理
43………臨界帯域幅補正処理
44………除算処理
45………平滑化処理
46………フーリエ変換処理
47………フィルタ関数乗算処理
48………フーリエ逆変換処理
51a、51b、51c、51d………平面スピーカ
52………音楽プレーヤ
Claims (12)
- 対話音声を秘匿化するための音楽データである秘匿化データを生成する秘匿化データ生成装置であって、
予め記憶された音声データ及び音楽データの各々に対して所定の区間単位のフレームfに分割し、フレームfごとに周波数解析を行い、前記音声データの時間
軸方向に最大のスペクトルである単一の音声最大値スペクトルVv(j)(jは周波数)を算出し、前記音楽データの各フレームfの前後Mフレームに渡って時 間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(f,j)をフレームfごとに算出する周波数解析手段と、
前記音声最大値スペクトルVv(j)に基づく値を、フレームfに対応する前記音楽平均値スペクトルVm(f,j)に基づく値によって互いに対応する周波 数jごとに除した値である除算値スペクトルDiv(f,j)に基づいて、フィルタ関数F(f,j)をフレームfごとに作成するフィルタ関数作成手段と、
前記音楽データを所定の区間単位であるフレームfに分割し、分割された各フレームfをフーリエ変換し、各フレームfに対応する前記フィルタ関数F(f,j)を乗じ、フーリエ逆変換することによって、前記秘匿化データを生成するフィルタリング手段と、
を具備することを特徴とする秘匿化データ生成装置。 - 前記フィルタ関数作成手段は、
前記音声最大値スペクトルVv(j)を、周波数jよりも高域側の範囲内の最大値に置換することによって、置換音声最大値スペクトルを算出し、
前記音楽平均値スペクトルVm(f,j)を、周波数jの前後の範囲内の平均値に置換することによって、置換音楽平均値スペクトルを算出し、前記置換音声 最大値スペクトルを前記置換音楽平均値スペクトルによって除した値を前記除算値スペクトルDiv(f,j)とすることを特徴とする請求項1に記載の秘匿化 データ生成装置。 - 前記フィルタ関数作成手段は、
前記除算値スペクトルDiv(f,j)を、周波数jの前後の範囲内の平均値に置換することによって、前記除算値スペクトルDiv(f,j)を平滑化することを特徴とする請求項1又は請求項2に記載の秘匿化データ生成装置。 - 複数の前記音楽データを記憶する音楽データ記憶手段と、
前記音楽データ記憶手段によって記憶されている前記音楽データの中から単一の前記音楽データを選択する音楽データ選択手段と、
を更に具備し、
前記音楽データ選択手段によって選択された単一の前記音楽データに基づいて、前記秘匿化データを生成することを特徴とする請求項1乃至請求項3のいずれかに記載の秘匿化データ生成装置。 - 対話音声を秘匿化するための音楽データである秘匿化データを生成する秘匿化データ生成方法であって、
予め記憶された音声データ及び音楽データの各々に対して所定の区間単位のフレームfに分割し、フレームfごとに周波数解析を行い、前記音声データの時間
軸方向に最大のスペクトルである単一の音声最大値スペクトルVv(j)(jは周波数)を算出し、前記音楽データの各フレームfの前後Mフレームに渡って時 間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(f,j)をフレームfごとに算出する周波数解析ステップと、
前記音声最大値スペクトルVv(j)に基づく値を、フレームfに対応する前記音楽平均値スペクトルVm(f,j)に基づく値によって互いに対応する周波 数jごとに除した値である除算値スペクトルDiv(f,j)に基づいて、フィルタ関数F(f,j)をフレームfごとに作成するフィルタ関数作成ステップ
と、
前記音楽データを所定の区間単位であるフレームfに分割し、分割された各フレームfをフーリエ変換し、各フレームfに対応する前記フィルタ関数F(f,j)を乗じ、フーリエ逆変換することによって、前記秘匿化データを生成するフィルタリングステップと、
を含むことを特徴とする秘匿化データ生成方法。 - 請求項1乃至請求項4のいずれかに記載の秘匿化データ生成装置を具備する秘匿化装置であって、更に、
前記秘匿化データ生成装置が生成する複数の前記秘匿化データを記憶する秘匿化データ記憶手段と、
前記秘匿化データ記憶手段によって記憶されている前記秘匿化データの中から
単一の前記秘匿化データを選択する秘匿化データ選択手段と、
前記秘匿化データ選択手段によって選択された単一の前記秘匿化データを再生する秘匿化データ再生手段と、
を具備することを特徴とする秘匿化装置。 - 請求項6に記載の前記秘匿化データ再生手段が前記秘匿化データを波面が平面波に近い音波として所定平面から均一に放射する機構をもつ平面型スピーカで構成されていることを特徴とする秘匿化装置。
- 対話音声を秘匿化するための音楽データである秘匿化データを生成し、再生する秘匿化装置であって、
予め記憶された音声データ及び音楽データの各々に対して所定の区間単位のフレームfに分割し、フレームfごとに周波数解析を行い、前記音声データの時間
軸方向に最大のスペクトルである単一の音声最大値スペクトルVv(j)(jは周波数)を算出し、前記音楽データの各フレームfの前後Mフレームに渡って時 間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(f,j)をフレームfごとに算出する周波数解析手段と、
前記音声最大値スペクトルVv(j)に基づく値を、フレームfに対応する前記音楽平均値スペクトルVm(f,j)に基づく値によって互いに対応する周波 数jごとに除した値である除算値スペクトルDiv(f,j)に基づいて、フィルタ関数F(f,j)をフレームfごとに作成するフィルタ関数作成手段と、
前記音楽データを所定の区間単位であるフレームfに分割し、分割された各フレームfをフーリエ変換し、各フレームfに対応する前記フィルタ関数F(f,j)を乗じ、フーリエ逆変換することによって、前記秘匿化データを生成するフィルタリング手段と、
前記秘匿化データを再生する秘匿化データ再生手段と、
を具備することを特徴とする秘匿化装置。 - 対話音声を秘匿化するための音楽データである秘匿化データを生成し、再生する秘匿化方法であって、
予め記憶された音声データ及び音楽データの各々に対して所定の区間単位のフレームfに分割し、フレームfごとに周波数解析を行い、前記音声データの時間
軸方向に最大のスペクトルである単一の音声最大値スペクトルVv(j)(jは周波数)を算出し、前記音楽データの各フレームfの前後Mフレームに渡って時 間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(f,j)をフレームfごとに算出する周波数解析ステップと、
前記音声最大値スペクトルVv(j)に基づく値を、フレームfに対応する前記音楽平均値スペクトルVm(f,j)に基づく値によって互いに対応する周波 数jごとに除した値である除算値スペクトルDiv(f,j)に基づいて、フィルタ関数F(f,j)をフレームfごとに作成するフィルタ関数作成ステップ
と、
前記音楽データを所定の区間単位であるフレームfに分割し、分割された各フレームfをフーリエ変換し、各フレームfに対応する前記フィルタ関数F(f,j)を乗じ、フーリエ逆変換することによって、前記秘匿化データを生成するフィルタリングステップと、
生成された複数の前記秘匿化データを記憶する秘匿化データ記憶ステップと、
前記秘匿化データ記憶ステップによって記憶されている前記秘匿化データの中から単一の前記秘匿化データを選択する秘匿化データ選択ステップと、
前記秘匿化データ選択ステップによって選択された単一の前記秘匿化データを再生する秘匿化データ再生ステップと、
を含むことを特徴とする秘匿化方法。 - 対話音声を秘匿化するための音楽データである秘匿化データを生成し、再生する秘匿化方法であって、
予め記憶された音声データ及び音楽データの各々に対して所定の区間単位のフレームfに分割し、フレームfごとに周波数解析を行い、前記音声データの時間
軸方向に最大のスペクトルである単一の音声最大値スペクトルVv(j)(jは周波数)を算出し、前記音楽データの各フレームfの前後Mフレームに渡って時 間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(f,j)をフレームfごとに算出する周波数解析ステップと、
前記音声最大値スペクトルVv(j)に基づく値を、フレームfに対応する前記音楽平均値スペクトルVm(f,j)に基づく値によって互いに対応する周波 数jごとに除した値である除算値スペクトルDiv(f,j)に基づいて、フィルタ関数F(f,j)をフレームfごとに作成するフィルタ関数作成ステップ
と、
前記音楽データを所定の区間単位であるフレームfに分割し、分割された各フレームfをフーリエ変換し、各フレームfに対応する前記フィルタ関数F(f,j)を乗じ、フーリエ逆変換することによって、前記秘匿化データを生成するフィルタリングステップと、
前記秘匿化データを再生する秘匿化データ再生ステップと、
を含むことを特徴とする秘匿化方法。 - コンピュータに、
予め記憶された音声データ及び音楽データの各々に対して所定の区間単位のフレームfに分割し、フレームfごとに周波数解析を行い、前記音声データの時間
軸方向に最大のスペクトルである単一の音声最大値スペクトルVv(j)(jは周波数)を算出し、前記音楽データの各フレームfの前後Mフレームに渡って時 間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(f,j)をフレームfごとに算出する周波数解析ステップと、
前記音声最大値スペクトルVv(j)に基づく値を、フレームfに対応する前記音楽平均値スペクトルVm(f,j)に基づく値によって互いに対応する周波 数jごとに除した値である除算値スペクトルDiv(f,j)に基づいて、フィルタ関数F(f,j)をフレームfごとに作成するフィルタ関数作成ステップ
と、
前記音楽データを所定の区間単位であるフレームfに分割し、分割された各フレームfをフーリエ変換し、各フレームfに対応する前記フィルタ関数
F(f,j)を乗じ、フーリエ逆変換することによって、対話音声を秘匿化するための音楽データである秘匿化データを生成するフィルタリングステップと、
を実行させるためのコンピュータ読取可能なプログラム。 - コンピュータに、
予め記憶された音声データ及び音楽データの各々に対して所定の区間単位のフレームfに分割し、フレームfごとに周波数解析を行い、前記音声データの時間
軸方向に最大のスペクトルである単一の音声最大値スペクトルVv(j)(jは周波数)を算出し、前記音楽データの各フレームfの前後Mフレームに渡って時 間軸方向に平均化したスペクトルである音楽平均値スペクトルVm(f,j)をフレームfごとに算出する周波数解析ステップと、
前記音声最大値スペクトルVv(j)に基づく値を、フレームfに対応する前記音楽平均値スペクトルVm(f,j)に基づく値によって互いに対応する周波 数jごとに除した値である除算値スペクトルDiv(f,j)に基づいて、フィルタ関数F(f,j)をフレームfごとに作成するフィルタ関数作成ステップ
と、
前記音楽データを所定の区間単位であるフレームfに分割し、分割された各フレームfをフーリエ変換し、各フレームfに対応する前記フィルタ関数
F(f,j)を乗じ、フーリエ逆変換することによって、対話音声を秘匿化するための音楽データである秘匿化データを生成するフィルタリングステップと、
前記秘匿化データを再生する秘匿化データ再生ステップと、
を実行させるためのコンピュータ読取可能なプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011000929A JP5648485B2 (ja) | 2011-01-06 | 2011-01-06 | 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011000929A JP5648485B2 (ja) | 2011-01-06 | 2011-01-06 | 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012141524A JP2012141524A (ja) | 2012-07-26 |
JP5648485B2 true JP5648485B2 (ja) | 2015-01-07 |
Family
ID=46677856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011000929A Expired - Fee Related JP5648485B2 (ja) | 2011-01-06 | 2011-01-06 | 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5648485B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018149625A (ja) * | 2017-03-13 | 2018-09-27 | 大日本印刷株式会社 | コミュニケーションロボット、プログラム及びシステム |
JP2018149626A (ja) * | 2017-03-13 | 2018-09-27 | 大日本印刷株式会社 | コミュニケーションロボット、プログラム及びシステム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4588944B2 (ja) * | 2001-09-19 | 2010-12-01 | 株式会社エフ・ピー・エス | 平面型音響変換装置 |
EP1770685A1 (en) * | 2005-10-03 | 2007-04-04 | Maysound ApS | A system for providing a reduction of audiable noise perception for a human user |
JP5103974B2 (ja) * | 2007-03-22 | 2012-12-19 | ヤマハ株式会社 | マスキングサウンド生成装置、マスキングサウンド生成方法およびプログラム |
US20110188666A1 (en) * | 2008-07-18 | 2011-08-04 | Koninklijke Philips Electronics N.V. | Method and system for preventing overhearing of private conversations in public places |
-
2011
- 2011-01-06 JP JP2011000929A patent/JP5648485B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018149625A (ja) * | 2017-03-13 | 2018-09-27 | 大日本印刷株式会社 | コミュニケーションロボット、プログラム及びシステム |
JP2018149626A (ja) * | 2017-03-13 | 2018-09-27 | 大日本印刷株式会社 | コミュニケーションロボット、プログラム及びシステム |
Also Published As
Publication number | Publication date |
---|---|
JP2012141524A (ja) | 2012-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5103974B2 (ja) | マスキングサウンド生成装置、マスキングサウンド生成方法およびプログラム | |
JP5955340B2 (ja) | 音響システム | |
TWI352971B (en) | Apparatus and method for generating an ambient sig | |
JP5103973B2 (ja) | サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム | |
US20110182438A1 (en) | Masker sound generation apparatus and program | |
Poletti | Active acoustic systems for the control of room acoustics | |
WO2006093019A1 (ja) | 音声処理方法と装置及び記憶媒体並びに音声システム | |
Luizard et al. | Perceptual thresholds for realistic double-slope decay reverberation in large coupled spaces | |
Bai et al. | Synthesis and implementation of virtual bass system with a phase-vocoder approach | |
Lukin et al. | Adaptive time-frequency resolution for analysis and processing of audio | |
Schlittenlacher et al. | Determinants of the irrelevant speech effect: Changes in spectrum and envelope | |
Akagi et al. | Privacy protection for speech based on concepts of auditory scene analysis | |
JP2014130251A (ja) | 会話保護システム及び会話保護方法 | |
JP5707944B2 (ja) | 快音化データ生成装置、快音化データ生成方法、快音化装置、快音化方法及びプログラム | |
Rapp et al. | Effect of voice support level and spectrum on conversational speech | |
JP5648485B2 (ja) | 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム | |
Soulodre | About this dereverberation business: A method for extracting reverberation from audio signals | |
Assmann et al. | Relationship between fundamental and formant frequencies in voice preference | |
JP5741175B2 (ja) | 秘匿化データ生成装置、秘匿化データ生成方法、秘匿化装置、秘匿化方法及びプログラム | |
Rämö et al. | Perceptual frequency response simulator for music in noisy environments | |
Griesinger | The importance of the direct to reverberant ratio in the perception of distance, localization, clarity, and envelopment | |
JP2015034932A (ja) | 秘匿化データ生成装置、秘匿化装置およびプログラム | |
Pätynen et al. | The acoustics of vineyard halls, is it so great after all? | |
JP2012008393A (ja) | 音声変更装置、音声変更方法および音声情報秘話システム | |
JP2005286876A (ja) | 環境音提示装置及び補聴器調整装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140722 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140922 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141014 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141027 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5648485 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |