JP5707944B2

JP5707944B2 - 快音化データ生成装置、快音化データ生成方法、快音化装置、快音化方法及びプログラム

Info

Publication number: JP5707944B2
Application number: JP2011001626A
Authority: JP
Inventors: 茂出木　敏雄; 敏雄茂出木
Original assignee: Dai Nippon Printing Co Ltd
Current assignee: Dai Nippon Printing Co Ltd
Priority date: 2011-01-07
Filing date: 2011-01-07
Publication date: 2015-04-30
Anticipated expiration: 2031-01-07
Also published as: JP2012145615A

Description

本発明は、騒音源を快音化したり、対話音声を秘匿化したりするための音楽データを生成する快音化データ生成装置等に関するものである。

施設等に設置される各種機器（コンピュータサーバー、プリンター、複写機、断裁機、空調機、送風機など）は、人間にとっては騒音源であり、このような騒音源から漏れる騒音を快音化し、不快感を和らげ、騒音レベルを心理的に低減化したいという要望がある。
また、医療機関（調剤薬局などの受付カウンター）、金融機関・保険会社の相談カウンター、法律事務所などの面談室、携帯電話店のカウンター、会食に使われる飲食店などにおいて交わされる対話音声は、第３者に聴取されることが好ましくない個人情報や企業の機密情報が含まれることが少なくない。そこで、このような対話音声を秘匿化したいという要望もある。
以下では、騒音源の快音化のみならず、対話音声の秘匿化も含めて、「快音化」と呼ぶこととする。

しかしながら、従来は、簡易的な間仕切りのみによって済ませている施設が多い。これは、工場、事務所、店舗などのスペース、コストの制約から、カラオケボックスのように遮音機能をもつ什器を導入したり、内装工事を行ったりすることは必ずしも容易ではないからである。そこで、現状設備に殆ど手を加えることなく、騒音を快音化する手法が求められている。

音を快音化する手法の１つとして、ＢＧＭ（ＢａｃｋＧｒｏｕｎｄＭｕｓｉｃ）を利用する手法がある。例えば、ショッピングセンター、カクテルパーティ、飲食店などではＢＧＭが流れていることが多い。これは、人間の聴覚マスキング効果を活用して雑踏騒音を和らげることを意図している。
騒音快音化の中で対話音声を秘匿化することに特化した手法としては、（１）エネルギーマスキング、（２）インフォメーションマスキングという２つの手法が提案されている。これらは基本的にはＢＧＭを使用しないが、不快な音を紛らわすため、実際にはＢＧＭも併用されることが多い。

（１）エネルギーマスキングについては、例えば、特許文献１に記載されている。特許文献１には、白色雑音（少なくとも可聴域にて、パワーが周波数によらず略均一な傾向を有した雑音）等をマスキング音として流し、聴覚マスキング効果によって音声等をマスキングすることが記載されている。

（２）インフォメーションマスキングについては、例えば、特許文献２、３に記載されている。特許文献２には、ある音響空間に設置されたマイクロホンから音信号を受取り、受け取った音信号にスクランブルをかけてマスキングサウンドを生成し、他の音響空間に放音することが記載されている。また、特許文献３には、リアルタイムに録音された対話音声を解析し、対話音声を加工してマスキング音を生成し、出力することが記載されている。

しかしながら、特許文献１に記載の手法では、音圧が高いマスキング音が四六時中流れることになり、秘匿化したい音声ではない対話音声が聞き取り難くなるという問題が指摘されている。
また、特許文献２、３に記載の手法では、マスキング音が人間に不快感を与えるとう問題が指摘されている。また、録音する為のマイクロホン、高速信号処理装置などが必要となり、コストがかかるという問題が指摘されている。
いずれにしても、これら２つの提案手法は対象を対話音声に特化し、対話音声を聞こえなくするわけではなく、聞き取りずらくさせ理解できなくすることを目的にしており、これら２つの提案手法を機械騒音など騒音一般の快音化に適用することは難しい。

そこで、本発明者は、制御対象の騒音信号の平均スペクトルに対してＢＧＭ信号の平均スペクトルを周波数別に除算し、周波数方向に平滑化処理した単一のフィルタ関数を用いてフィルタ処理を施す快音化装置等を発明した（特許文献４参照）。

特開２０１０−０３１５０１号公報特許第４２４５０６０号公報特許第４３３６５５２号公報特願２０１０−１７４７１６号公報

ところで、特許文献４に記載の手法では、騒音信号に対してマスキング効果が充分働くようにフィルタ加工を行うと、ＢＧＭ信号のレベルが大きくなり、騒音信号レベルが大きい場合、大音量の音楽を流す必要がある。即ち、騒音の不快度は低減されるが、煩さが返って増大する場合がある。また、クラシック曲など音楽がある程度長い場合、あるいは演奏音の強弱が激しい場合、マスキング効果が適切に働かない箇所が目立つこともある。

本発明は、前述した問題点に鑑みてなされたものであり、その目的とすることは、再生するＢＧＭの信号レベルをある程度落としてもマスキング効果を働かせることを可能にし、更に、ある程度長い楽曲又は演奏音の強弱が激しい楽曲を用いる場合であっても、どの再生箇所においてもマスキング効果を均等に働かせることができる快音化データ生成装置等を提供することである。

前述した目的を達成するために第１の発明は、快音化データを生成する快音化データ生成装置であって、予め記憶された騒音データ及び音楽データの各々に対して所定の区間単位のフレームに分割し、フレームｆごとに周波数解析を行い、前記騒音データの時間軸方向に最大のスペクトルである単一の騒音最大値スペクトルＶｖ（ｊ）（ｊは周波数）を算出するとともに、前記騒音データの時間軸方向に平均のスペクトルである単一の騒音平均値スペクトルＶａ（ｊ）を算出し、前記音楽データに対して時間軸方向に平均化したスペクトルである音楽平均値スペクトルＶｍ（ｊ）を算出する周波数解析手段と、前記騒音最大値スペクトルＶｖ（ｊ）に基づく値を、前記音楽平均値スペクトルＶｍ（ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｊ）に基づいて、フィルタ関数Ｆ（ｊ）を作成するフィルタ関数作成手段と、前記音楽データを所定の区間単位であるフレームｆに分割し、分割された各フレームｆをフーリエ変換して複素スペクトルＳｍ（ｆ、ｊ）を生成する周波数次元変換手段と、各フレームｆに対応する複素スペクトルＳｍ（ｆ、ｊ）に対して前記フィルタ関数Ｆ（ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）に変換するフィルタ関数乗算手段と、前記第１変換スペクトルＳｍ’（ｆ、ｊ）の周波数別の大きさ｜Ｓｍ’（ｆ、ｊ）｜から、前記騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じた値を互いに対応する周波数ｊごとに減算し、第２変換スペクトルＳｍ’’（ｆ、ｊ）に変換するスペクトル減算手段と、前記第２変換スペクトルＳｍ’’（ｆ、ｊ）に対してフーリエ逆変換することによって、前記快音化データを生成する時間次元逆変換手段と、を具備することを特徴とする快音化データ生成装置である。
第１の発明によって、再生するＢＧＭの信号レベルをある程度落としてもマスキング効果を働かせることができる快音化データを生成することができる。
ここで、快音化データとは、騒音源を快音化したり、対話音声を秘匿化したりするための音楽データである。

第１の発明における前記周波数解析手段は、前記音楽データの各フレームｆの前後Ｍフレームに渡って時間軸方向に平均化したスペクトルＶｍ（ｆ、ｊ）を前記音楽平均値スペクトルとしてフレームごとに算出するようにし、前記フィルタ関数作成手段は、前記騒音最大値スペクトルＶｖ（ｊ）に基づく値を、フレームｆに対応する前記音楽平均値スペクトルＶｍ（ｆ、ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｆ、ｊ）に基づいて、フィルタ関数Ｆ（ｆ、ｊ）をフレームごとに作成するようにし、前記フィルタ関数乗算手段は、各フレームの複素スペクトルＳｍ（ｆ、ｊ）に対して各フレームｆに対応する前記フィルタ関数Ｆ（ｆ、ｊ）を乗じることが望ましい。
これによって、人手を費やさずに、どの再生箇所においてもマスキング効果が満遍なく働く快音化データを生成することができる。

第１の発明における前記フィルタ関数作成手段は、前記騒音最大値スペクトルＶｖ（ｊｃ）（ｊｃは特定の周波数）を、周波数ｊｃよりも高域側の範囲内の最大値に置換することによって、置換騒音最大値スペクトルを算出し、前記音楽平均値スペクトルＶｍ（ｆ、ｊｃ）を、周波数ｊｃの前後の範囲内の平均値に置換することによって、置換音楽平均値スペクトルを算出し、前記置換騒音最大値スペクトルを前記置換音楽平均値スペクトルによって互いに対応する周波数ｊごとに除した値を前記除算値スペクトルＤｉｖ（ｆ、ｊ）とすることが望ましい。
マスキングは、高音側（周波数が高域側）に働きやすいという性質がある為、騒音最大値スペクトルＶｖ（ｊ）を、周波数ｊよりも高域側の範囲内の最大値に置換すれば、騒音スペクトルを周波数方向に低音側に非線形シフトする補正を行っていることになり、ひいては、マスキング効果を高めることができる。

第１の発明における前記フィルタ関数作成手段は、前記除算値スペクトルＤｉｖ（ｆ、ｊ）を、周波数ｊの前後の範囲内の平均値に置換することによって、前記除算値スペクトルＤｉｖ（ｆ、ｊ）を平滑化することが望ましい。
これによって、フィルタ関数が滑らかになり、ひいては、最終的に生成される快音化データが、人間にとって心地良い音楽データとなる。

第１の発明は、複数の前記音楽データを記憶する音楽データ記憶手段と、前記音楽データ記憶手段によって記憶されている前記音楽データの中から単一の前記音楽データを選択する音楽データ選択手段と、を更に具備し、前記音楽データ選択手段によって選択された単一の前記音楽データに基づいて、前記快音化データを生成することが望ましい。
これによって、複数の音楽データに基づいて、複数の快音化データを生成することができる。

第２の発明は、快音化データを生成する快音化データ生成方法であって、予め記憶された騒音データ及び音楽データの各々に対して所定の区間単位のフレームに分割し、フレームｆごとに周波数解析を行い、前記騒音データの時間軸方向に最大のスペクトルである単一の騒音最大値スペクトルＶｖ（ｊ）（ｊは周波数）を算出するとともに、前記騒音データの時間軸方向に平均のスペクトルである単一の騒音平均値スペクトルＶａ（ｊ）を算出し、前記音楽データに対して時間軸方向に平均化したスペクトルである音楽平均値スペクトルＶｍ（ｊ）を算出する周波数解析ステップと、前記騒音最大値スペクトルＶｖ（ｊ）に基づく値を、前記音楽平均値スペクトルＶｍ（ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｊ）に基づいて、フィルタ関数Ｆ（ｊ）を作成するフィルタ関数作成ステップと、前記音楽データを所定の区間単位であるフレームｆに分割し、分割された各フレームｆをフーリエ変換して複素スペクトルＳｍ（ｆ、ｊ）を生成する周波数次元変換ステップと、各フレームｆに対応する複素スペクトルＳｍ（ｆ、ｊ）に対して前記フィルタ関数Ｆ（ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）に変換するフィルタ関数乗算ステップと、前記第１変換スペクトルＳｍ’（ｆ、ｊ）の周波数別の大きさ｜Ｓｍ’（ｆ、ｊ）｜から、前記騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じた値を互いに対応する周波数ｊごとに減算し、第２変換スペクトルＳｍ’’（ｆ、ｊ）に変換するスペクトル減算ステップと、前記第２変換スペクトルＳｍ’’（ｆ、ｊ）に対してフーリエ逆変換することによって、前記快音化データを生成する時間次元逆変換ステップと、を含むことを特徴とする快音化データ生成方法である。
第２の発明によって、再生するＢＧＭの信号レベルをある程度落としてもマスキング効果を働かせることができる快音化データを生成することができる。

第３の発明は、第１の発明の快音化データ生成装置が生成する複数の前記快音化データを記憶する快音化データ記憶手段と、前記快音化データ記憶手段によって記憶されている前記快音化データの中から単一の前記快音化データを選択する快音化データ選択手段と、前記快音化データ選択手段によって選択された単一の前記快音化データを再生する快音化データ再生手段と、を具備することを特徴とする快音化装置である。
第３の発明によって、再生するＢＧＭの信号レベルをある程度落としてもマスキング効果を働かせることができる。

第３の発明は、前記快音化データ再生手段が前記快音化データを波面が平面波に近い音波として所定平面から均一に放射する機構をもつ平面型スピーカで構成されていることが望ましい。
これによって、快音化対象位置に伝搬される過程で減衰する音波のエネルギー量が、快音化対象の騒音に比べ快音化データの方が小さくなり、相対的に快音化データのエネルギー量が快音化対象の騒音に比べ大きくなるため、マスキング効果を高めることができる。

第４の発明は、快音化データを生成する快音化データ生成装置であって、予め記憶された騒音データ及び音楽データの各々に対して所定の区間単位のフレームに分割し、フレームｆごとに周波数解析を行い、前記騒音データの時間軸方向に最大のスペクトルである単一の騒音最大値スペクトルＶｖ（ｊ）（ｊは周波数）を算出するとともに、前記騒音データの時間軸方向に平均のスペクトルである単一の騒音平均値スペクトルＶａ（ｊ）を算出し、前記音楽データに対して時間軸方向に平均化したスペクトルである音楽平均値スペクトルＶｍ（ｊ）を算出する周波数解析手段と、前記騒音最大値スペクトルＶｖ（ｊ）に基づく値を、前記音楽平均値スペクトルＶｍ（ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｊ）に基づいて、フィルタ関数Ｆ（ｊ）を作成するフィルタ関数作成手段と、前記音楽データを所定の区間単位であるフレームｆに分割し、分割された各フレームｆをフーリエ変換して複素スペクトルＳｍ（ｆ、ｊ）を生成する周波数次元変換手段と、各フレームｆに対応する複素スペクトルＳｍ（ｆ、ｊ）に対して前記フィルタ関数Ｆ（ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）に変換するフィルタ関数乗算手段と、前記第１変換スペクトルＳｍ’（ｆ、ｊ）の周波数別の大きさ｜Ｓｍ’（ｆ、ｊ）｜から、前記騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じた値を互いに対応する周波数ｊごとに減算し、第２変換スペクトルＳｍ’’（ｆ、ｊ）に変換するスペクトル減算手段と、前記第２変換スペクトルＳｍ’’（ｆ、ｊ）に対してフーリエ逆変換することによって、前記快音化データを生成する時間次元逆変換手段と、前記快音化データを再生する快音化データ再生手段と、を具備することを特徴とする快音化装置である。
第４の発明によって、再生するＢＧＭの信号レベルをある程度落としてもマスキング効果を働かせることができる。

第５の発明は、第２の発明の快音化データ生成方法によって生成する複数の前記快音化データを記憶する快音化データ記憶ステップと、前記快音化データ記憶ステップによって記憶されている前記快音化データの中から単一の前記快音化データを選択する快音化データ選択ステップと、前記快音化データ選択ステップによって選択された単一の前記快音化データを再生する快音化データ再生ステップと、を含むことを特徴とする快音化方法である。
第５の発明によって、再生するＢＧＭの信号レベルをある程度落としてもマスキング効果を働かせることができる。

第６の発明は、快音化データを生成する快音化データ生成方法であって、予め記憶された騒音データ及び音楽データの各々に対して所定の区間単位のフレームに分割し、フレームｆごとに周波数解析を行い、前記騒音データの時間軸方向に最大のスペクトルである単一の騒音最大値スペクトルＶｖ（ｊ）（ｊは周波数）を算出するとともに、前記騒音データの時間軸方向に平均のスペクトルである単一の騒音平均値スペクトルＶａ（ｊ）を算出し、前記音楽データに対して時間軸方向に平均化したスペクトルである音楽平均値スペクトルＶｍ（ｊ）を算出する周波数解析ステップと、前記騒音最大値スペクトルＶｖ（ｊ）に基づく値を、前記音楽平均値スペクトルＶｍ（ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｊ）に基づいて、フィルタ関数Ｆ（ｊ）を作成するフィルタ関数作成ステップと、前記音楽データを所定の区間単位であるフレームｆに分割し、分割された各フレームｆをフーリエ変換して複素スペクトルＳｍ（ｆ、ｊ）を生成する周波数次元変換ステップと、各フレームｆに対応する複素スペクトルＳｍ（ｆ、ｊ）に対して前記フィルタ関数Ｆ（ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）に変換するフィルタ関数乗算ステップと、前記第１変換スペクトルＳｍ’（ｆ、ｊ）の周波数別の大きさ｜Ｓｍ’（ｆ、ｊ）｜から、前記騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じた値を互いに対応する周波数ｊごとに減算し、第２変換スペクトルＳｍ’’（ｆ、ｊ）に変換するスペクトル減算ステップと、前記第２変換スペクトルＳｍ’’（ｆ、ｊ）に対してフーリエ逆変換することによって、前記快音化データを生成する時間次元逆変換ステップと、前記快音化データを再生する快音化データ再生ステップと、を含むことを特徴とする快音化方法である。
第６の発明によって、再生するＢＧＭの信号レベルをある程度落としてもマスキング効果を働かせることができる。

第７の発明は、コンピュータに、予め記憶された騒音データ及び音楽データの各々に対して所定の区間単位のフレームに分割し、フレームｆごとに周波数解析を行い、前記騒音データの時間軸方向に最大のスペクトルである単一の騒音最大値スペクトルＶｖ（ｊ）（ｊは周波数）を算出するとともに、前記騒音データの時間軸方向に平均のスペクトルである単一の騒音平均値スペクトルＶａ（ｊ）を算出し、前記音楽データに対して時間軸方向に平均化したスペクトルである音楽平均値スペクトルＶｍ（ｊ）を算出する周波数解析ステップと、前記騒音最大値スペクトルＶｖ（ｊ）に基づく値を、前記音楽平均値スペクトルＶｍ（ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｊ）に基づいて、フィルタ関数Ｆ（ｊ）を作成するフィルタ関数作成ステップと、前記音楽データを所定の区間単位であるフレームｆに分割し、分割された各フレームｆをフーリエ変換して複素スペクトルＳｍ（ｆ、ｊ）を生成する周波数次元変換ステップと、各フレームｆに対応する複素スペクトルＳｍ（ｆ、ｊ）に対して前記フィルタ関数Ｆ（ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）に変換するフィルタ関数乗算ステップと、前記第１変換スペクトルＳｍ’（ｆ、ｊ）の周波数別の大きさ｜Ｓｍ’（ｆ、ｊ）｜から、前記騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じた値を互いに対応する周波数ｊごとに減算し、第２変換スペクトルＳｍ’’（ｆ、ｊ）に変換するスペクトル減算ステップと、前記第２変換スペクトルＳｍ’’（ｆ、ｊ）に対してフーリエ逆変換することによって、快音化データを生成する時間次元逆変換ステップと、を実行させるためのコンピュータ読取可能なプログラムである。
第７の発明のプログラムを汎用のコンピュータにインストールすることによって、第１の発明の快音化データ生成装置を得ることができる。

第８の発明は、コンピュータに、予め記憶された騒音データ及び音楽データの各々に対して所定の区間単位のフレームに分割し、フレームｆごとに周波数解析を行い、前記騒音データの時間軸方向に最大のスペクトルである単一の騒音最大値スペクトルＶｖ（ｊ）（ｊは周波数）を算出するとともに、前記騒音データの時間軸方向に平均のスペクトルである単一の騒音平均値スペクトルＶａ（ｊ）を算出し、前記音楽データに対して時間軸方向に平均化したスペクトルである音楽平均値スペクトルＶｍ（ｊ）を算出する周波数解析ステップと、前記騒音最大値スペクトルＶｖ（ｊ）に基づく値を、前記音楽平均値スペクトルＶｍ（ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｊ）に基づいて、フィルタ関数Ｆ（ｊ）を作成するフィルタ関数作成ステップと、前記音楽データを所定の区間単位であるフレームｆに分割し、分割された各フレームｆをフーリエ変換して複素スペクトルＳｍ（ｆ、ｊ）を生成する周波数次元変換ステップと、各フレームｆに対応する複素スペクトルＳｍ（ｆ、ｊ）に対して前記フィルタ関数Ｆ（ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）に変換するフィルタ関数乗算ステップと、前記第１変換スペクトルＳｍ’（ｆ、ｊ）の周波数別の大きさ｜Ｓｍ’（ｆ、ｊ）｜から、前記騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じた値を互いに対応する周波数ｊごとに減算し、第２変換スペクトルＳｍ’’（ｆ、ｊ）に変換するスペクトル減算ステップと、前記第２変換スペクトルＳｍ’’（ｆ、ｊ）に対してフーリエ逆変換することによって、快音化データを生成する時間次元逆変換ステップと、前記快音化データを再生する快音化データ再生ステップと、を実行させるためのコンピュータ読取可能なプログラムである。
第８の発明のプログラムを、音楽スピーカが接続された汎用のコンピュータにインストールすることによって、第４の発明の快音化装置を得ることができる。

本発明の快音化データ生成装置等により、再生するＢＧＭの信号レベルをある程度落としてもマスキング効果を働かせることを可能にし、更に、ある程度長い楽曲又は演奏音の強弱が激しい楽曲を用いる場合であっても、どの再生箇所においてもマスキング効果を均等に働かせることができる。

快音化装置の概要図快音化データ生成装置のハードウエア構成図聴覚マスキング現象を説明する図快音化処理の流れを示すフローチャート快音化データ生成処理の流れを示す図周波数解析処理を説明する図（１）周波数解析処理を説明する図（２）周波数解析処理を説明する図（３）フィルタ関数作成処理を説明する図（１）フィルタ関数作成処理を説明する図（２）フーリエ変換処理、フィルタ関数乗算処理を説明する図スペクトル減算処理、フーリエ逆変換処理を説明する図スペクトル減算処理を行わない場合の合成信号を示す図スペクトル減算処理を行う場合の合成信号を示す図快音化装置の設置例

以下図面に基づいて、本発明の実施形態を詳細に説明する。
図１は、快音化装置１の概要図である。図１に示すように、快音化装置１は、少なくとも、快音化データ生成装置２及び音楽再生装置３から構成される。
快音化データ生成装置２は、例えば、コンピュータ等であり、騒音源を快音化したり、対話音声を秘匿化したりするための音楽データである快音化データ７を生成する。快音化データ生成装置２の記憶部には、少なくとも騒音データ４及び音楽データ５が記憶される。ここで、騒音データ４には、本願発明の構成外である録音装置を用いてあらかじめ録音された騒音源による機械音の他、対話音声なども含まれる。
音楽再生装置３は、音楽プレーヤ及びスピーカから構成され、快音化データ７を再生する。音楽再生装置３の記憶部には、少なくとも快音化データ生成装置２によって生成される快音化データ７が記憶される。

快音化装置１は、用途に応じて様々な構成を採ることが可能である。快音化装置１を構成する快音化データ生成装置２及び音楽再生装置３は、図１に示すように異なる筐体としても良いし、１つの筐体としても良い。また、騒音データ４を収集するための録音装置を組み込んでも良い。
また、快音化データ生成装置２及び音楽再生装置３は、図１に示すように有線によって接続されても良いし、無線によって接続されても良いし、ネットワークを介して接続されても良いし、接続されていなくても良い。
快音化データ生成装置２及び音楽再生装置３が接続されていない場合、快音化データ生成装置２は、快音化データ７を記憶媒体（ＣＤ、ＭＤ、ＵＳＢメモリ、ＳＤカードなどコンピュータ及び音楽プレーヤが読取可能な記憶媒体）に出力し、音楽再生装置３は、記憶媒体から快音化データ７を入力する。

少なくとも音楽再生装置３は、騒音の快音化を所望する音響空間に設置される。このような音響空間としては、例えば、工場、事務所、店舗などにおいて、騒音源（コンピュータサーバー、プリンター、複写機、断裁機、空調機、送風機など）と隣接する事務室などが考えられる。また、例えば、調剤薬局などの受付カウンターに隣接する待合室などが考えられる。そして、音楽再生装置３は、このような事務室や待合室において快音化データ７を再生する。
ここで、本発明の実施の形態に係る快音化データ生成装置２が生成する快音化データ７は、騒音源と事務室の間が簡易的な間仕切りのみであっても、通常の音量によって、騒音を快音化したり、待合室にいる人が受付カウンターの対話音声の内容を聞き取ることができない程度に秘匿化したりすることが可能である。
音楽再生装置３が設置される音響空間としては、その他に、電車、自動車、航空機などの騒音に悩まされるオフィス、飲食店などや、幼児の鳴き声、生活音などによる隣人の不快感を和らげたい一般家庭などが挙げられる。

図２は、快音化データ生成装置２のハードウエア構成図である。尚、図２のハードウエア構成は一例であり、用途、目的に応じて様々な構成を採ることが可能である。
快音化データ生成装置２は、制御部２１、記憶部２２、メディア入出力部２３、通信制御部２４、入力部２５、表示部２６、周辺機器Ｉ／Ｆ部２７等が、バス２８を介して接続される。

制御部２１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等で構成される。
ＣＰＵは、記憶部２２、ＲＯＭ、記録媒体等に格納されるプログラムをＲＡＭ上のワークメモリ領域に呼び出して実行し、バス２８を介して接続された各装置を駆動制御し、快音化データ生成装置２が行う後述する処理を実現する。
ＲＯＭは、不揮発性メモリであり、快音化データ生成装置２のブートプログラムやＢＩＯＳ等のプログラム、データ等を恒久的に保持している。
ＲＡＭは、揮発性メモリであり、記憶部２２、ＲＯＭ、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部１１が各種処理を行う為に使用するワークエリアを備える。

記憶部２２は、ＨＤＤ（ハードディスクドライブ）であり、制御部２１が実行するプログラム、プログラム実行に必要なデータ、ＯＳ（オペレーティングシステム）等が格納される。プログラムに関しては、ＯＳ（オペレーティングシステム）に相当する制御プログラムや、後述する処理をコンピュータに実行させるためのアプリケーションプログラムが格納されている。
これらの各プログラムコードは、制御部２１により必要に応じて読み出されてＲＡＭに移され、ＣＰＵに読み出されて各種の手段として実行される。

メディア入出力部２３（ドライブ装置）は、データの入出力を行い、例えば、ＣＤドライブ（−ＲＯＭ、−Ｒ、−ＲＷ等）、ＤＶＤドライブ（−ＲＯＭ、−Ｒ、−ＲＷ等）、ＭＤドライブ等のメディア入出力装置を有する。
通信制御部２４は、通信制御装置、通信ポート等を有し、快音化データ生成装置２とネットワーク間の通信を媒介する通信インタフェースであり、ネットワークを介して、他の装置間との通信制御を行う。ネットワークは、有線、無線を問わない。

入力部２５は、データの入力を行い、例えば、キーボード、マウス等のポインティングデバイス、テンキー等の入力装置を有する。
入力部２５を介して、快音化データ生成装置２に対して、操作指示、動作指示、データ入力等を行うことができる。
表示部２６は、ＣＲＴモニタ、液晶パネル等のディスプレイ装置、ディスプレイ装置と連携してコンピュータ１のビデオ機能を実現するための論理回路等（ビデオアダプタ等）を有する。

周辺機器Ｉ／Ｆ（インタフェース）部２７は、快音化データ生成装置２に周辺機器を接続させるためのポートであり、快音化データ生成装置２は周辺機器Ｉ／Ｆ部２７を介して周辺機器とのデータの送受信を行う。周辺機器Ｉ／Ｆ部２７は、ＵＳＢやＳＤカードリーダ等で構成されている。
バス２８は、各装置間の制御信号、データ信号等の授受を媒介する経路である。

図３は、聴覚マスキング現象を説明する図である。
マスキングとは、一方の音が、他方の音によってかき消され（マスクされ）、聞こえなくなる現象を意味する。聴覚マスキング現象は、図３に示すように、２種類に大別される。

第１の聴覚マスキング現象は、周波数マスキング（同時マスキング）である。図３（ａ）は、周波数マスキングを示す模式図である。周波数マスキングは、同一時刻に到達した２種類の音波間の干渉である。２種類の音波の周波数が近接している場合、図３（ａ）に示すように、マスカー音８ａ（一方の音をかき消す音）の強さが、マスキー音９ａ（他方の音によってかき消される音）の強さより大きい場合に、マスキング効果が働く。
尚、マスカー音８ａの周波数が、マスキー音９ａの周波数より僅かに低い方が、僅かに高い場合に比べマスキング効果は大きいが、両者の周波数が完全に一致する場合、互いに強め合うことになり、マスキング効果は生じない。マスカー音８ａの周波数が、マスキー音９ａの周波数より所定の範囲（臨界帯域幅とよばれる）より高いまたは低い場合も、マスキング効果は生じない。

第２の聴覚マスキング現象は、時間マスキング（経時マスキング）である。図３（ｂ）は、時間マスキングを示す模式図である。時間マスキングは、若干の時間差を伴って到達した２種類の音波間の干渉である。２種類の音波の周波数が、周波数マスキングと同様に近接している場合、図３（ｂ）に示すように、順向マスキングや逆向マスキングが働く。
順向マスキングは、マスカー音８ｂが先行して到達し、マスキー音９ｂが若干遅れて到達する場合、具体的には時間差が１００ｍｓｅｃ以下の場合に働く。この場合、後続の音であるマスキー音９ｂが聞こえない。
逆向マスキングは、マスカー音８ｃがマスキー音９ｃよりも強く、かつ、マスキー音９ｃが先行して到達し、マスカー音８ｃが非常に微小な時間だけ遅れて到達する場合、具体的には時間差が２０ｍｓｅｃ以下の場合に働く。この場合、先行音であるマスキー音９ｃが、後続音であるマスカー音８ｃに抜かれ、聞こえなくなる。マスキー音９ｃがマスカー音８ｃに抜かれる理由は、強い音であるマスカー音８ｃの方が、人間の耳の中での伝播時間が早まる為である。
尚、逆向マスキングよりも順向マスキングの方が、マスキング効果は高い。

本発明の実施の形態では、ある程度長い楽曲又は演奏音の強弱が激しい楽曲を用いる場合であっても、どの再生箇所においてもマスキング効果を均等に働かせる為に、特願２０１０−１７４７１６号（特許文献４）において活用されている「周波数マスキング」に加えて、「時間マスキング」も活用するものである。

図４は、快音化処理の流れを示すフローチャートである。
図４に示すように、快音化データ生成装置２の制御部２１は、騒音データ４及び音楽データ５を記憶部２２に記憶する（Ｓ１０１）。音楽データ５は、複数記憶するようにしても良い。
騒音データ４は、快音化対象の音響空間における騒音をリアルタイムにまたは事前に録音したサンプルデータとする。また、対話音声の秘匿化を目的とする場合、騒音データ４は、秘匿化対象の音響空間におけるリアルタイムに録音された対話音声ではなく、事前に録音された第３者の音声に基づく固定のサンプルデータとする。いずれにしても、本発明の実施の形態における快音化データ生成装置２は、快音化対象の現場においてリアルタイムに録音を行った騒音データを使用することはあっても、録音途上の騒音データとリアルタイムに同期して快音化データを生成するような、リアルタイム処理は行わない。
音楽データ５は任意である。例えば、聴取者にとって意味のあるメロディ・リズム・和声進行が含まれている必要は必ずしもなく、川のせせらぎ音などの自然音でもかまわない。快音化対象の騒音や秘匿化対象の対話音声に類似した周波数成分を多く含む音楽データであれば、マスキング効果が働きやすくなるので、マスキング効果を高めるという意味では、白色雑音成分や声楽データが含まれていることが望ましい。但し、白色雑音成分や声楽データが含まれると騒がしくなるため、器楽データのみであり、楽器編成が少ない室内楽曲などが現実的である。快音化データ生成装置２は、音楽データ５ごとに快音化データ７を生成する。

次に、快音化データ生成装置２の制御部２１は、単一の音楽データ５を選択する（Ｓ１０２）。音楽データ５の選択は、入力部２５を介してユーザが指示するようにしても良い。
次に、快音化データ生成装置２の制御部２１は、Ｓ１０２において選択された単一の音楽データ５に基づいて、快音化データ７の生成処理を行う（Ｓ１０３）。快音化データ７の生成処理の詳細は後述する。
Ｓ１０２及びＳ１０３の処理を繰り返し、複数の快音化データ７を生成するようにしても良い。

次に、音楽再生装置３は、Ｓ１０３にて生成された快音化データ７を記憶する（Ｓ１０４）。快音化データ７は、複数記憶するようにしても良い。
次に、音楽再生装置３は、単一の快音化データ７を選択する（Ｓ１０５）。快音化データ７の選択は、ユーザが指示するようにしても良い。
次に、音楽再生装置３は、Ｓ１０５において選択された単一の快音化データ７を再生する（Ｓ１０６）。再生音量は、環境の変化に応じて、ユーザの指示により適宜変更される。

以上により、快音化装置１は、音響空間Ａにおける騒音が、所定の距離だけ離れている音響空間Ｂにいる人に不快感を与えないように快音化することができる。または、快音化装置１は、音響空間Ａにおける対話音声が、所定の距離だけ離れている音響空間Ｂにいる人に聴取されないように秘匿化することができる。
以下では、快音化データ７の生成処理の詳細について説明する。

図５は、快音化データ生成処理の流れを示す図である。図５に示すように、快音化データ生成処理は、フレーム抽出処理３１、周波数解析処理３２、フィルタ関数作成処理３３及びフィルタリング処理３４を含む。
ここでは、各処理の概要について説明し、詳細は後述する。

フレーム抽出処理３１は、騒音データ４及び音楽データ５を入力し、各々に対して所定の区間単位のフレームｆに分割し、騒音フレーム群１０及び音楽フレーム群１１を生成する。
所定の区間単位（フレームの長さ）は、例えば、１００ｍｓｅｃ以下が望ましい。これは、前述の時間マスキング、特に、順向マスキングによるマスキング効果を活用する為である。尚、所定の区間単位（フレームの長さ）を例えば１０ｍｓｅｃ以下などにいたずらに短く設定しても、フレーム数が増えて計算時間が長くなるだけで効果は変わらない。

周波数解析処理３２は、騒音フレーム群１０及び音楽フレーム群１１を入力し、騒音最大値スペクトルデータ１２、騒音平均値スペクトルデータ１３及び音楽平均値スペクトルデータ１４を出力する。周波数解析処理３２は、快音化データ生成装置２の制御部２１が、騒音フレーム群１０及び音楽フレーム群１１の各クレームに対して周波数解析を行い、騒音データの時間軸方向に最大のスペクトルである単一の騒音最大値スペクトルＶｖ（ｊ）（ｊは周波数）を算出し、騒音データの時間軸方向に平均のスペクトルである単一の騒音平均値スペクトルＶａ（ｊ）を算出し、音楽フレーム時間軸方向に平均化したスペクトルである音楽平均値スペクトルＶｍ（ｊ）を算出する処理である。
尚、Ｖｖ（ｊ）の添え字「ｖ」は、実際はｎｏｉｓｅを含むがｖｏｉｃｅの頭文字である。Ｖａ（ｊ）の添え字「ａ」は、ａｖｅｒａｇｅの頭文字である。また、Ｖｍ（ｊ）の添え字「ｍ」は、ｍｕｓｉｃの頭文字である。

また、周波数解析処理３２では、快音化データ生成装置２の制御部２１が、音楽データの各フレームｆの前後Ｍフレームに渡って時間軸方向に平均化したスペクトルＶｍ（ｆ、ｊ）を音楽平均値スペクトルとしてフレームごとに算出するようにしても良い。
ここで、Ｍは、前述した所定の区間単位（フレームの長さ）に応じて定めることが望ましく、「Ｍ（個）×フレームの長さ（秒）」が数秒程度であることが望ましい。これは、「Ｍ（個）×フレームの長さ（秒）」が短すぎると、音楽が不自然に聞こえてしまい、「Ｍ（個）×フレームの長さ（秒）」が長すぎると、マスキング効果、即ち騒音の快音化が適切に働かない箇所が目立つようになるからである。

騒音データ４に対しては、騒音最大値スペクトルＶｖ（ｊ）と、騒音平均値スペクトルＶａ（ｊ）を算出する。
音楽データ５に対しては、時間軸方向に平均化した音楽平均値スペクトルＶｍ（ｊ）を算出する。または、音楽データ５に対しては、フレーム単位の各瞬時スペクトル（位相成分は無視したエネルギー量）に対して、フレームｆごとに、前後所定のフレーム数に対応する瞬時スペクトルを平均化した音楽平均値スペクトルＶｍ（ｆ、ｊ）を算出するようにしても良い。

フィルタ関数作成処理３３は、騒音最大値スペクトルデータ１２及び音楽平均値スペクトルデータ１４を入力し、フィルタ関数データ１５を出力する。フィルタ関数作成処理３３は、快音化データ生成装置２の制御部２１が、騒音最大値スペクトルＶｖ（ｊ）に基づく値を、フレームｆに対応する音楽平均値スペクトルＶｍ（ｆ、ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｆ、ｊ）に基づいて、フィルタ関数Ｆ（ｆ、ｊ）を作成する処理である。
また、フィルタ関数作成処理３３では、快音化データ生成装置２の制御部２１が、騒音最大値スペクトルＶｖ（ｊ）に基づく値を、フレームｆに対応する音楽平均値スペクトルＶｍ（ｆ、ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｆ、ｊ）に基づいて、フィルタ関数Ｆ（ｆ、ｊ）をフレームごとに作成するようにしても良い。

フィルタリング処理３４は、周波数次元変換処理、フィルタ関数乗算処理、スペクトル減算処理、時間次元逆変換処理を含む。
周波数次元変換処理では、音楽データ５を周波数次元に変換し、瞬時複素スペクトルデータを出力する。すなわち、快音化データ生成装置２の制御部２１が、音楽データを所定の区間単位であるフレームｆに分割し、分割された各フレームｆをフーリエ変換して複素スペクトルＳｍ（ｆ、ｊ）を生成する。
フィルタ関数乗算処理では、フィルタ関数データ１５を入力し、瞬時複素スペクトルデータを、後述する第１変換スペクトルデータに変換する。すなわち、快音化データ生成装置２の制御部２１が、各フレームｆに対応する複素スペクトルＳｍ（ｆ、ｊ）に対してフィルタ関数Ｆ（ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）に変換する。また、快音化データ生成装置２の制御部２１が、各フレームの複素スペクトルＳｍ（ｆ、ｊ）に対して各フレームｆに対応するフィルタ関数Ｆ（ｆ、ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）に変換するようにしても良い。

スペクトル減算処理では、騒音平均値スペクトルデータ１３を入力し、第１変換スペクトルデータを第２変換スペクトルデータに変換する。すなわち、快音化データ生成装置２の制御部２１が、第１変換スペクトルＳｍ’（ｆ、ｊ）の周波数別の大きさ｜Ｓｍ’（ｆ、ｊ）｜から、騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じた値を互いに対応する周波数ｊごとに減算し、第２変換スペクトルＳｍ’’（ｆ、ｊ）に変換する。
時間次元逆変換処理では、第２変換スペクトルデータを時間次元に変換し、快音化データ７を出力する。すなわち、快音化データ生成装置２の制御部２１が、第２変換スペクトルＳｍ’’（ｆ、ｊ）に対してフーリエ逆変換することによって、快音化データ７を生成する。

以下では、快音化データ生成装置２の制御部２１は、フレームごとに各種の処理（周波数解析処理３２、フィルタ関数作成処理３３、及び、フィルタリング処理３４）を実行するものとする。

図６〜図８は、周波数解析処理を説明する図である。図６〜図８に示すように、周波数解析処理３２は、（狭義の）周波数解析３２ａ、瞬時スペクトル算出処理４１、平均スペクトル算出処理４２を含む。

最初に、騒音データ４に対する周波数解析処理について説明する。
例えば、サンプリング周波数Ｆｓを「４４１００Ｈｚ」、サンプル数Ｎを「４０９６」とする。サンプリング周波数Ｆｓ及びサンプル数Ｎによって、騒音データ４に含まれるフレーム数Ｆｖが定まる。
フレーム抽出処理３１では、快音化データ生成装置２の制御部２１が、サンプリング周波数Ｆｓのモノラル騒音信号（ステレオの場合はＬＲ（左右）の合算値とする。）に対して、各々Ｎ／２サンプル間隔ごとに（すなわち、Ｎ／２サンプル分ずつ重複する。）、Ｎ個ずつ、各々Ｆｖフレーム抽出する。

次に、周波数解析処理３２では、制御部２１は、抽出したｆ番目のフレームデータＸｖ（ｆ、ｉ）（ｆ＝０、・・・、Ｆｖ−１；ｉ＝０、・・・、Ｎ−１）に対して、ハニング窓関数Ｈ（ｉ）＝０．５−０．５ｃｏｓ（２πｉ／Ｎ）を用いてフーリエ変換を行う。
次に、制御部２１は、変換データの実部Ａｖ（ｆ、ｊ）（ｆ＝０、・・・、Ｆｖ−１；ｊ＝０、・・・、Ｎ−１）、虚部Ｂｖ（ｆ、ｊ）（ｆ＝０、・・・、Ｆｖ−１；ｊ＝０、・・・、Ｎ−１）、並びに、強度値の時系列の騒音最大値スペクトルＶｖ（ｊ）及び騒音平均値スペクトルＶａ（ｊ）を各々、次式のように算出する。

図６には、騒音フレームデータＸｖ（ｆ、ｉ）のフレーム１〜フレームＦに対して、周波数解析３２ａが行われ、騒音スペクトル１〜騒音スペクトルＦが算出され、騒音最大値スペクトルＶｖ（ｊ）が算出されることが図示されている。
図７には、騒音フレームデータＸｖ（ｆ、ｉ）のフレーム１〜フレームＦに対して、周波数解析３２ａが行われ、騒音スペクトル１〜騒音スペクトルＦが算出され、騒音平均値スペクトルＶａ（ｊ）が算出され、スケーリング処理４０によって、減弱した騒音平均値スペクトルＶａ’（ｊ）が算出されることが図示されている。
スケーリング処理４０は、騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じる処理である。スケーリング処理４０の詳細は、スペクトル減算処理４８の説明において後述する。

次に、音楽データ５に対する周波数解析処理について説明する。
騒音データ４と同様、サンプリング周波数Ｆｓを「４４１００Ｈｚ」、サンプル数Ｎを「４０９６」とする。サンプリング周波数Ｆｓ及びサンプル数Ｎによって、音楽データ５に含まれるフレーム数Ｆｍが定まる。
フレーム抽出処理３１では、快音化データ生成装置２の制御部２１が、サンプリング周波数Ｆｓのモノラル音楽信号（ステレオの場合はＬＲ（左右）の合算値とする。）に対して、各々Ｎ／２サンプル間隔ごとに（すなわち、Ｎ／２サンプル分ずつ重複する。）、Ｎ個ずつ、各々Ｆｍフレーム抽出する。

次に、周波数解析処理３２では、制御部２１は、抽出したｆ番目のフレームデータＸｍ（ｆ、ｉ）（ｆ＝０、・・・、Ｆｍ−１；ｉ＝０、・・・、Ｎ−１）に対して、ハニング窓関数Ｈ（ｉ）＝０．５−０．５ｃｏｓ（２πｉ／Ｎ）を用いてフーリエ変換を行う。
次に、制御部２１は、瞬時スペクトル算出処理４１として、フレームごとに、位相成分は無視したエネルギー量である瞬時スペクトルを算出する。また、制御部２１は、平均スペクトル算出処理４２として、前後Ｍフレーム（Ｍ個）の瞬時スペクトルの平均値である音楽平均値スペクトルを算出する。

具体的には、制御部２１は、変換データの実部Ａｍ（ｆ、ｊ）（ｆ＝０、・・・、Ｆｍ−１；ｊ＝０、・・・、Ｎ−１）、虚部Ｂｍ（ｆ、ｊ）（ｆ＝０、・・・、Ｆｍ−１；ｊ＝０、・・・、Ｎ−１）、及び、対象フレームを中点として前後Ｍ／２フレーム（Ｍ／２個）ずつ、合計Ｍフレーム（Ｍ個）（Ｍ＜Ｆｍ）の音楽平均値スペクトルＶｍ（ｆ、ｊ）（ｆ＝０、・・・、Ｆｍ−１；ｊ＝０、・・・、Ｎ／２）を各々、次式のように算出する。
但し、音楽データ５の先頭部、すなわち、ｆ＜Ｍ／２の場合、前後Ｍ／２フレーム（Ｍ／２個）ずつの平均を取ることができないことから、Ｖｍ（ｆ、ｊ）＝Ｖｍ（Ｍ／２、ｊ）とする。同様に、音楽データ５の後尾部、すなわち、ｆ＞Ｆｍ−Ｍ／２の場合、前後Ｍ／２フレーム（Ｍ／２個）ずつの平均を取ることができないことから、Ｖｍ（ｆ、ｊ）＝Ｖｍ（Ｆｍ−Ｍ／２−１、ｊ）とする。

図６には、一例として、音楽データ５のフレームｆとフレームｆ＋１に対する周波数解析処理が示されている。
図６には、音楽フレームデータＸｍ（ｆ、ｉ）のフレーム１〜フレームＭ＋１に対して、周波数解析３２ａが行われ、フレーム１〜フレームＭまでの時系列平均が算出され、フレームｆに対する音楽平均値スペクトルＶｍ（ｆ、ｊ）が算出されることが図示されている。同様に、図６には、フレーム２〜フレームＭ＋１までの時系列平均が算出され、フレームｆ＋１に対する音楽平均値スペクトルＶｍ（ｆ＋１、ｊ）が算出されることが図示されている。

また、図８には、図６の補足的な説明として、音楽データ５を入力とし、瞬時スペクトル算出処理４１によって、フレームごとに瞬時スペクトルが算出されることが図示されている。また、処理対象のフレームに対して、平均スペクトル算出処理５２によって、前後Ｍフレーム（Ｍ個）の瞬時スペクトルの平均値が算出され、音楽平均値スペクトルに置換され、音楽平均値スペクトルデータ１４が出力されることが図示されている。

図９、図１０は、フィルタ関数作成処理を説明する図である。フィルタ関数作成処理３３は、図９に示す臨界帯域幅補正処理４３、並びに、図１０に示す除算処理４４及び平滑化処理４５を含む。

まず、図９を参照して臨界帯域幅補正処理４３について説明する。
臨界帯域幅補正処理４３は、快音化データ生成装置２の制御部２１が、騒音最大値スペクトルＶｖ（ｊ）を、周波数ｊごとに所定の範囲内の最大値に置換することによって、単一の置換騒音最大値スペクトルＶｖ’（ｊ）を作成する処理である。また、臨界帯域幅補正処理４３は、フレームｆごとに、音楽平均値スペクトルＶｍ（ｆ、ｊ）を、周波数ｊごとに所定の範囲内の平均値に置換することによって、置換音楽平均値スペクトルＶｍ’（ｆ、ｊ）を作成する処理である。図９には、一例として、フレームｆとフレームｆ＋１に対する臨界帯域幅補正処理が示されている。

臨界帯域幅とは、ある周波数ｊの周波数成分Ｖｖ（ｊ）またはＶｍ（ｆ、ｊ）を中心にマスキングが及ぶ周波数の範囲（臨界帯域幅、Ｂａｒｋと呼ばれる。）である。臨界帯域幅の近似式としては、次式に示すＥ．Ｚｗｉｃｋｅｒの式が知られている。尚、一般に、周波数が高くなると、臨界帯域幅は広くなることが分かっている。

式（８）におけるｆｒの単位も「Ｈｚ」である。ｆｒとＢｚ（ｆｒ）を本実施の形態におけるフーリエ変換のポイント数の次元に変換すると、次式となる。

臨界帯域幅補正処理４３では、快音化データ生成装置２の制御部２１は、騒音信号スペクトルに対して、周波数ｊごとに周波数成分Ｖｖ（ｊ）をｊｃ＝ｊ−（１−α）×Ｂｚ（ｊ）からｊｃ＝ｊ＋α×Ｂｚ（ｊ）の範囲の最大値に置換する。即ち、制御部２１は、ｊ＝０、・・・、Ｎ／２に対して、置換後のスペクトル（置換騒音最大値スペクトル）Ｖｖ’（ｊ）を次式のように算出する。

αは０から１までの実数であり、通常はα＝１．０とする。式（１０）によって、騒音スペクトルを周波数方向に低音側に非線形シフトする補正を行っていることになる。
マスキングは、高音側（周波数が高域側）に働きやすいという性質がある為、騒音最大値スペクトルＶｖ（ｊ）を、周波数ｊよりも高域側の範囲内の最大値に置換すれば、騒音スペクトルを周波数方向に低音側に非線形シフトする補正を行っていることになり、ひいては、マスキング効果を高めることができる。

一方、音楽信号スペクトルに対しては、制御部２１は、フレームｆごとに処理を行い、周波数ｊごとに周波数成分Ｖｍ（ｆ、ｊ）をｊｃ＝ｊ−０．５×Ｂｚ（ｊ）からｊｃ＝ｊ＋０．５×Ｂｚ（ｊ）の範囲の平均値に置換する。即ち、制御部２１は、ｊ＝０、・・・、Ｎ／２に対して、置換後のスペクトル（置換音楽平均値スペクトル）Ｖｍ’（ｆ、ｊ）を次式のように算出する。

式（１１）によって、音楽平均値スペクトルを周波数方向に平滑化をかけていることになる。

図９では、Ｗ（ｊ）が、置換の際の計算範囲を示している。騒音最大値スペクトルＶｖ（ｊ）に対して、単一の置換騒音最大値スペクトルＶｖ’（ｊ）が算出されることが図示されている。また、音楽平均値スペクトルＶｍ（ｆ、ｊ）に対しては、置換音楽平均値スペクトルＶｍ’（ｆ、ｊ）が算出され、音楽平均値スペクトルＶｍ（ｆ＋１、ｊ）に対しては、置換音楽平均値スペクトルＶｍ’（ｆ＋１、ｊ）が算出されることが図示されている。

次に、図１０を参照して、除算処理４４及び平滑化処理４５について説明する。
除算処理４４は、快音化データ生成装置２の制御部２１が、フレームｆごとに、騒音最大値スペクトルＶｖ（ｊ）に基づく値を音楽平均値スペクトルＶｍ（ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値を除算値スペクトルＤｉｖ（ｆ、ｊ）とする処理である。特に、制御部２１は、フレームｆごとに、置換騒音最大値スペクトルＶｖ’（ｊ）を置換音楽平均値スペクトルＶｍ’（ｆ、ｊ）によって互いに対応する周波数ｊごとに除した値を除算値スペクトルＤｉｖ（ｆ、ｊ）とすることが望ましい。
図１０には、一例として、フレームｆとフレームｆ＋１に対する除算処理が示されている。

また、平滑化処理４５は、快音化データ生成装置２の制御部２１が、除算値スペクトルＤｉｖ（ｆ、ｊ）を、周波数ｊの前後の範囲内の平均値に置換することによって、除算値スペクトルＤｉｖ（ｆ、ｊ）を平滑化する処理である。
図１０には、一例として、フレームｆとフレームｆ＋１に対する平滑化処理が示されている。

具体的には、制御部２１は、周波数（ｊ＝０、・・・、Ｎ／２）ごとに、除算値スペクトルＤｉｖ（ｆ、ｊ）＝Ｖｖ’（ｊ）／Ｖｍ’（ｆ、ｊ）を算出し、これに対して所定のタップ数Ｔ（＜Ｎ／２）によって、次式のように、平滑フィルタをかけた結果をＦ（ｆ、ｊ）とする。

βは、音圧を調整するための比例定数（実数値）である。騒音信号の音圧と音楽信号の音圧を同程度とする場合、β＝１．０とする。
Ｆ（ｆ、ｊ）の上限値と下限値は予め設定しておく。例えば、中央値を１とすると、上限値を１０倍の「１０」、下限値を１／１０の「０．１」とする。除算結果が上限値を上回る場合、又は、下限値を下回る場合、制御部２１は、それぞれ、Ｆ（ｆ、ｊ）に上限値又は下限値を設定する。

図１０に示すように、除算値スペクトルＤｉｖ（ｆ、ｊ）は、極値（極大値及び極小値）を数多く持つ関数となっている。特に、ところどころ０で割り算する箇所が発生してしまい、その箇所では上限値をもつ極値になり不連続点になる。除算値スペクトルＤｉｖ（ｆ、ｊ）をそのままフィルタ関数とすると、人間にとって聞き苦しい快音化データ７が生成されてしまう。そこで、本発明の実施の形態では、平滑化処理４５を行っている。
図１０に示すように、平滑化処理４５を行うことで、フィルタ関数Ｆ（ｆ、ｊ）は、極値が少なく、滑らかな関数となっている。

図１１は、フーリエ変換処理、フィルタ関数乗算処理を説明する図である。フィルタリング処理３４は、フーリエ変換処理４６及びフィルタ関数乗算処理４７を含む。
前述の周波数解析処理３２及びフィルタ関数作成処理３３では、実数値に対して計算を行っているが、フィルタリング処理３４では、複素数値をもつ瞬時スペクトルに対して計算を行う。

フーリエ変換処理４６は、快音化データ生成装置２の制御部２１が、音楽フレームデータＸｍｌ（ｆ、ｉ）及びＸｍｒ（ｆ、ｉ）（ｆ＝０、・・・、Ｆｍ−１；ｉ＝０、・・・、Ｎ−１）をフーリエ変換し、ソース複素スペクトルを算出する処理である。
フィルタ関数乗算処理４７は、制御部２１が、ソース複素スペクトルにフィルタ関数Ｆ（ｆ、ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）を算出する処理である。

フーリエ変換処理４６では、制御部２１は、サンプリング周波数Ｆｓのステレオ騒音信号（モノラル信号の場合は一方を０とする。）に対して、各々Ｎ／２サンプル間隔ごとに（すなわち、Ｎ／２サンプル分ずつ重複する。）、Ｎ個ずつ、各々Ｆｍフレーム抽出したｆ番目の音楽フレームデータＸｍｌ（ｆ、ｉ）及びＸｍｒ（ｆ、ｉ）に対して、ハニング窓関数Ｈ（ｉ）＝０．５−０．５ｃｏｓ（２πｉ／Ｎ）を用いてフーリエ変換を行い、以下のように、変換データであるソース複素スペクトルＳｍ（ｆ、ｊ）の実部Ａｍｌ（ｆ、ｊ）及びＡｍｒ（ｆ、ｊ）、並びに、虚部Ｂｍｌ（ｆ、ｊ）及びＢｍｒ（ｆ、ｊ）（ｆ＝０、・・・、Ｆｍ）−１；ｊ＝０、・・・、Ｎ−１）を算出する。

フィルタ関数乗算処理４７では、制御部２１は、Ｆｍ個のフィルタ関数Ｆ（ｆ、ｊ）を用いて、フレームｆごとに所定の周波数区間［ｊ１、ｊ２］の全ての周波数成分に乗算し、第１変換スペクトルＳｍ’（ｆ、ｊ）の実部Ａｍｌ’（ｆ、ｊ）及びＡｍｒ’（ｆ、ｊ）、並びに、虚部Ｂｍｌ’（ｆ、ｊ）及びＢｍｒ’（ｆ、ｊ）（ｆ＝０、・・・、Ｆｍ）−１；ｊ＝０、・・・、Ｎ−１）を算出する。即ち、制御部２１は、各フレームｆ＝０、・・・、Ｆｍ−１、及び、各周波数ｊ＝ｊ１、・・・、ｊ２において、次式のように変換を行う。

図１１には、フレームｆの音楽フレームデータから、フレームｆのソース複素スペクトルＳｍ（ｆ、ｊ）が算出され、フィルタ関数Ｆ（ｆ、ｊ）によるフィルタ関数乗算処理４７がなされて、フレームｆの第１変換スペクトルＳｍ’（ｆ、ｊ）が算出されることが図示されている。同様に、フレームｆ＋１の音楽フレームデータから、フレームｆ＋１のソース複素スペクトルＳｍ（ｆ＋１、ｊ）が算出され、フィルタ関数Ｆ（ｆ＋１、ｊ）によるフィルタ関数乗算処理４７がなされて、フレームｆ＋１の第１変換スペクトルＳｍ’（ｆ＋１、ｊ）が算出されることが図示されている。

図１２は、スペクトル減算処理、フーリエ逆変換処理を説明する図である。フィルタリング処理３４は、スペクトル減算処理４８及びフーリエ逆変換処理４９を含む。

スペクトル減算処理４８では、制御部２１が、第１変換スペクトルＳｍ’（ｆ、ｊ）の周波数別の大きさ｜Ｓｍ’（ｆ、ｊ）｜から、騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じた値を互いに対応する周波数ｊごとに減算し、第２変換スペクトルＳｍ’’（ｆ、ｊ）に変換する。

具体的には、制御部２１は、騒音平均値スペクトルＶａ（ｊ）を用いて、γ（０＜γ＜１、通常γ＝０．２）なる実数係数を定義し、フレームｆごとに所定の周波数区間［ｊ１，ｊ２］の全ての周波数成分に以下減算する。即ち、各フレームｆ＝０，・・・，Ｆｍ−１、ｊ＝ｊ１，・・・，Ｊ２において、次式のように算出する。

但し、式（２２）、（２６）の右辺の計算結果が負になる場合、Ｅｍｌ’（ｊ）＝０とする。

フーリエ逆変換処理４９では、制御部２１が、第２変換スペクトルＳｍ’’（ｆ、ｊ）に対してフーリエ逆変換を行い、快音化フレームデータＸｍｌ’（ｆ、ｉ）及びＸｍｒ’（ｆ、ｉ）（ｆ＝０、・・・、Ｆｍ−１；ｉ＝０、・・・、Ｎ−１）を算出する。
フーリエ逆変換処理４９では、制御部２１は、変換対象のフレームｆの快音化フレームデータＸｍｌ’（ｆ、ｉ）及びＸｍｒ’（ｆ、ｉ）に対して、直前に変換されたフレームｆ−１の快音化フレームデータＸｍｌ’（ｆ−１、ｉ）及びＸｍｒ’（ｆ−１、ｉ）が存在する場合、両者が時間軸においてＮ／２サンプル分重複することを考慮し、次式のように計算を行う。

図１２には、フレームｆの第１変換スペクトルＳｍ’（ｆ、ｊ）に対して、単一の減弱した騒音平均値スペクトルＶａ’（ｊ）を用いてスペクトル減算処理４８がなされて、フレームｆの第２変換スペクトルＳｍ’’（ｆ、ｊ）が算出され、フーリエ逆変換処理４９がなされて、フレームｆの快音化フレームデータが算出されることが図示されている。同様に、フレームｆ＋１の第１変換スペクトルＳｍ’（ｆ＋１、ｊ）に対して、単一の減弱した騒音平均値スペクトルＶａ’（ｊ）を用いてスペクトル減算処理４８がなされて、フレームｆ＋１の第２変換スペクトルＳｍ’’（ｆ＋１、ｊ）が算出され、フーリエ逆変換処理４９がなされて、フレームｆ＋１の快音化フレームデータが算出されることが図示されている。

以上、本発明の実施の形態における快音化データ生成処理について説明したが、本発明の実施の形態によれば、フィルタ関数を用いてＢＧＭ信号に対してフィルタ処理を行った後に、騒音信号の平均スペクトルを一定の割合だけ減算する。
これによって、生成されるＢＧＭ信号成分は、平均騒音信号スペクトルの一部に相当する成分が欠如していることになり、ＢＧＭ信号レベルは全体的に低減される。尚、騒音信号がない状態で、生成されるＢＧＭをそのまま再生しても、顕著な不自然さは生じない。
そして、騒音源に近い音響空間にて、本発明の実施の形態により加工されたＢＧＭが再生され、騒音信号とＢＧＭ信号が合成されると、欠如している騒音信号成分の一部がＢＧＭ信号の一部として置換されて再生され、騒音信号のレベルが低減されるとともに、低減された騒音信号は部分的に騒音信号成分が加算されたＢＧＭ信号によりマスキングされる。従って、低減されたＢＧＭ信号を用いても、ＢＧＭ信号レベルが騒音信号レベルと同じ場合と比較して、同等のマスキング効果を働かせることが可能になる。

ここで、図１３、図１４を参照しながら、スペクトル減算処理を行わない場合と行なう場合とで、マスキング効果が異なることについて説明する。
図１３は、スペクトル減算処理を行わない場合の合成信号を示す図である。図１４は、スペクトル減算処理を行う場合の合成信号を示す図である。
尚、図１３及び図１４に示す快音化対象騒音のスペクトルは、ファンなどの回転機構を有する装置に特有のものである。

図１３では、スペクトル減算処理を行わずに、フィルタ加工ＢＧＭ信号が生成されている。図１３に示す例であっても、ＢＧＭの音量を騒音よりも大きくすることによって、騒音はマスクされる。しかしながら、ＢＧＭの音量が大きくなってしまい、煩わしくなる。
一方、図１４では、スペクトル減算処理を行い、フィルタ加工ＢＧＭ信号が生成されている。図１４に示す例では、騒音成分の一部はＢＧＭ信号成分に使用され、その分騒音音量が小さくなり、マスクされやすくなる。
特に、人間が騒音としてうるさいと感じる部分（周波数が約３〜４ｋＨｚ）についてのみＢＧＭ信号を大きくすることによって、全体の信号レベルを低減しつつ、騒音を快音化することができる。

また、本発明の実施の形態によれば、固定長の短い所定区間を定義し、フレーム単位に近傍の所定区間でスペクトルを平滑化し、平滑化されたスペクトルをもとにフレーム単位に異なるフィルタ関数を定義する。これにより、音量や音色の急激な変化に対してフィルタ関数が連続的に変化し、不自然な段差を発生させることなく、いかなる再生箇所でもマスキング効果が働くようになり、長い楽曲でも人手による作業は不要になる。また、本発明の実施の形態によれば、近傍の周波数特性をもとに楽曲信号が補正されているため、周波数マスキングに加えて、時間マスキングも働くようになり、騒音の快音化効果が更に高まる。
そして、本発明の実施の形態では、フィルタ関数を生成する負荷が若干増大するものの、長時間のＢＧＭを用いて、従来の館内ＢＧＭと同様の設備によって安価に騒音の快音化を効果的に実現できる。

次に、図１５を参照しながら、快音化装置の設置例について説明する。図１５に示す例では、快音化データ生成装置２によって快音化データ７が生成され、音楽再生装置３である音楽プレーヤ５２に快音化データ７が記憶されているものとする。

図１５に示す例では、平面スピーカ５１を挟んで左側に騒音源である各種機器６０が設置されており、右側が事務室スペース６１になっている。事務室スペース６１には、事務机６２等が設置されている。従業員は、専ら、事務室スペース６１にて、各種作業を行い、電話をしたり、お互いに対話したりする。

平面スピーカ５１は、ハニカム構造のパネル及びスピーカ（エキサイタ）から構成されており、例えば、ポスラサウンドパネル（本出願人の登録商標）等である。
平面スピーカ５１のパネルは、事務室スペース６１より騒音源である各種機器６０が覗き込めないパーティション程度の大きさがあること望ましいが、Ａ３サイズ程度の面積しかない立て看板などでも十分に効果を発揮する。すなわち、マスキー音である騒音７１が、平面スピーカ５１に物理的に遮られることなく、事務室スペース６１まで到達しても、本発明の快音化データ７によって十分なマスキング効果が得られる。
尚、ポスラサウンドパネル（本出願人の登録商標）は、横幅１メートル程度まで製作可能である。

音楽プレーヤ５２は、平面スピーカ５１と接続され、本発明の実施の形態に係る快音化データ７を再生する。
図１５に示す例では、平面スピーカ５１が、それぞれ、マスカー音であるＢＧＭサウンドＬ７２ａ及びＢＧＭサウンドＲ７２ｂを出力している（ステレオ再生）。尚、ＢＧＭサウンドは、モノラル再生でも良く、平面スピーカの数や配置位置は、環境に応じて適宜変更すれば良い。

平面スピーカ５１は、音楽プレーヤ５２によって、快音化データ７の波面が平面波に近い音波として、平面から均一に放射する機構を有することが望ましい。これによって、事務室スペース６１に伝搬される過程で減衰する音波のエネルギー量が、騒音源である各種機器６０から発せられる騒音７１に比べ前記平面スピーカ５１から出力されるＢＧＭサウンドＬ７２ａ及びＲ７２ｂの方が小さくなり、相対的にＢＧＭサウンドＬ７２ａ及びＬ７２ｂのエネルギー量が騒音源である各種機器６０から発せられる騒音７１に比べ大きくなるため、マスキング効果を高めることができる。このような平面スピーカ５１の一例としては、特開２００７−３０１８８８号公報に開示されている。特開２００７−３０１８８８号公報に開示されているスピーカは、微細な管構造アレイのパネルによって構成されており、平面波に近い音波を均一に放射する。

ここで、平面スピーカ５１が平面波に近い音波を放射することによって、マスキング効果を高めることができる理由について説明する。
図１５に示すように、騒音７１は、球面波の音波として、観測位置である事務室スペース６１に到達する。同様に、通常のダイナミックスピーカから再生されるＢＧＭも、球面波の音波である。
ここで、球面波の場合、距離の２乗に比例して伝搬される表面積が大きくなり音源に集中していたエネルギーが分散するため、エネルギー（音圧）が距離の２乗に反比例して減衰していくことが知られている。一方、平面波の場合、距離が離れてもエネルギーがあまり減衰しない。

すなわち、通常のダイナミックスピーカから再生されるＢＧＭは、球面波の音波であり、離れるとエネルギーが減衰するから、事務室スペース６１内で騒音源である各種機器６０により近い位置に待機している従業員に合わせて音量を調節すると、事務室スペース６１内で各種機器６０より遠い位置に待機している従業員にはマスキング効果が十分に働かない場合がある。
一方、平面波に近い音波を放射する平面スピーカ５１を用いれば、再生されるＢＧＭサウンドＬ７２ａ、ＢＧＭサウンドＲ７２ｂは、平面波の音波であり、離れてもエネルギーがあまり減衰しないから、事務室スペース６１内で各種機器６０により近い位置に待機している従業員に合わせて音量を調節しても、事務室スペース６１内で各種機器６０より遠い位置に待機している従業員に対して十分なマスキング効果が働く。

以上、快音化装置１の設置例を説明したが、前述したように、楽曲信号を再生するスピーカとして、平面波に近い音波を放射する平面スピーカを使用することによって、比較的低い音量でＢＧＭを流しても騒音快音化効果を発揮できる。
また、平面スピーカは、Ａ３サイズ程度の立て看板から、横幅１メートル程度のパーティションまで、様々な態様とすることができる。
また、平面スピーカのパネル面の絵柄としては、壁紙などのインテリア素材やポスター広告を用いることができ、視覚的にもスピーカがむき出しになるようなインテリア上の不自然さを回避することができる。

尚、図１５の説明では、平面スピーカが立て看板やパーティションとしたが、本発明の実施の形態はこれに限定されない。例えば、スピーカを部屋の壁に内蔵し、部屋の四方からマスカー音であるＢＧＭサウンドを出力させることも可能である。

また、図１５の説明では、快音化データ生成装置によって生成される快音化データは、騒音を快音化するものとしたが、本発明はこれに限定されない。
本発明の快音化データ生成装置によって生成される快音化データは、対話音声を秘匿化するＢＧＭとしても利用できる。例えば、医療機関（調剤薬局などの受付カウンター）、金融機関・保険会社の相談カウンター、法律事務所などの面談室、携帯電話店のカウンター、会食に使われる飲食店などにおいて交わされる対話音声は、第３者に聴取されることが好ましくない個人情報や企業の機密情報が含まれることが少なくない。そこで、本発明の快音化データ生成装置によって生成される快音化データを用いれば、従来よりも低減されたレベルで対話音声に対する秘匿化効果を実現できる。

以上、添付図面を参照しながら、本発明に係る快音化データ生成装置等の好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。

１………快音化装置
２………快音化データ生成装置
３………音楽再生装置
４………騒音データ
５………音楽データ
７………快音化データ
１０………騒音フレーム群
１１………音楽フレーム群
１２………騒音最大値スペクトルデータ
１３………騒音平均値スペクトルデータ
１４………音楽平均値スペクトルデータ
１５………フィルタ関数データ
３１………フレーム抽出処理
３２………周波数解析処理
３２ａ………周波数解析
３３………フィルタ関数作成処理
３４………フィルタリング処理
４０………スケーリング処理
４１………瞬時スペクトル算出処理
４２………平均スペクトル算出処理
４３………臨界帯域幅補正処理
４４………除算処理
４５………平滑化処理
４６………フーリエ変換処理
４７………フィルタ関数乗算処理
４８………スペクトル減算処理
４９………フーリエ逆変換処理
５１ａ、５１ｂ、５１ｃ、５１ｄ………平面スピーカ
５２………音楽プレーヤ

Claims

快音化データを生成する快音化データ生成装置であって、
予め記憶された騒音データ及び音楽データの各々に対して所定の区間単位のフレームに分割し、フレームｆごとに周波数解析を行い、前記騒音データの時間軸方向に最大のスペクトルである単一の騒音最大値スペクトルＶｖ（ｊ）（ｊは周波数）を算出するとともに、前記騒音データの時間軸方向に平均のスペクトルである単一の騒音平均値スペクトルＶａ（ｊ）を算出し、前記音楽データに対して時間軸方向に平均化したスペクトルである音楽平均値スペクトルＶｍ（ｊ）を算出する周波数解析手段と、
前記騒音最大値スペクトルＶｖ（ｊ）に基づく値を、前記音楽平均値スペクトルＶｍ（ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｊ）に基づいて、フィルタ関数Ｆ（ｊ）を作成するフィルタ関数作成手段と、
前記音楽データを所定の区間単位であるフレームｆに分割し、分割された各フレームｆをフーリエ変換して複素スペクトルＳｍ（ｆ、ｊ）を生成する周波数次元変換手段と、
各フレームｆに対応する複素スペクトルＳｍ（ｆ、ｊ）に対して前記フィルタ関数Ｆ（ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）に変換するフィルタ関数乗算手段と、
前記第１変換スペクトルＳｍ’（ｆ、ｊ）の周波数別の大きさ｜Ｓｍ’（ｆ、ｊ）｜から、前記騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じた値を互いに対応する周波数ｊごとに減算し、第２変換スペクトルＳｍ’’（ｆ、ｊ）に変換するスペクトル減算手段と、
前記第２変換スペクトルＳｍ’’（ｆ、ｊ）に対してフーリエ逆変換することによって、前記快音化データを生成する時間次元逆変換手段と、
を具備することを特徴とする快音化データ生成装置。
前記周波数解析手段は、前記音楽データの各フレームｆの前後Ｍフレームに渡って時間軸方向に平均化したスペクトルＶｍ（ｆ、ｊ）を前記音楽平均値スペクトルとしてフレームごとに算出するようにし、
前記フィルタ関数作成手段は、前記騒音最大値スペクトルＶｖ（ｊ）に基づく値を、フレームｆに対応する前記音楽平均値スペクトルＶｍ（ｆ、ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｆ、ｊ）に基づいて、フィルタ関数Ｆ（ｆ、ｊ）をフレームごとに作成するようにし、
前記フィルタ関数乗算手段は、各フレームの複素スペクトルＳｍ（ｆ、ｊ）に対して各フレームｆに対応する前記フィルタ関数Ｆ（ｆ、ｊ）を乗じることを特徴とする請求項１に記載の快音化データ生成装置。
前記フィルタ関数作成手段は、
前記騒音最大値スペクトルＶｖ（ｊｃ）（ｊｃは特定の周波数）を、周波数ｊｃよりも高域側の範囲内の最大値に置換することによって、置換騒音最大値スペクトルを算出し、
前記音楽平均値スペクトルＶｍ（ｆ、ｊｃ）を、周波数ｊｃの前後の範囲内の平均値に置換することによって、置換音楽平均値スペクトルを算出し、
前記置換騒音最大値スペクトルを前記置換音楽平均値スペクトルによって互いに対応する周波数ｊごとに除した値を前記除算値スペクトルＤｉｖ（ｆ、ｊ）とすることを特徴とする請求項２に記載の快音化データ生成装置。
前記フィルタ関数作成手段は、前記除算値スペクトルＤｉｖ（ｆ、ｊ）を、周波数ｊの前後の範囲内の平均値に置換することによって、前記除算値スペクトルＤｉｖ（ｆ、ｊ）を平滑化することを特徴とする請求項２又は請求項３に記載の快音化データ生成装置。
複数の前記音楽データを記憶する音楽データ記憶手段と、
前記音楽データ記憶手段によって記憶されている前記音楽データの中から単一の前記音楽データを選択する音楽データ選択手段と、
を更に具備し、
前記音楽データ選択手段によって選択された単一の前記音楽データに基づいて、前記快音化データを生成することを特徴とする請求項２乃至請求項４のいずれかに記載の快音化データ生成装置。
快音化データを生成する快音化データ生成方法であって、
予め記憶された騒音データ及び音楽データの各々に対して所定の区間単位のフレームに分割し、フレームｆごとに周波数解析を行い、前記騒音データの時間軸方向に最大のスペクトルである単一の騒音最大値スペクトルＶｖ（ｊ）（ｊは周波数）を算出するとともに、前記騒音データの時間軸方向に平均のスペクトルである単一の騒音平均値スペクトルＶａ（ｊ）を算出し、前記音楽データに対して時間軸方向に平均化したスペクトルである音楽平均値スペクトルＶｍ（ｊ）を算出する周波数解析ステップと、
前記騒音最大値スペクトルＶｖ（ｊ）に基づく値を、前記音楽平均値スペクトルＶｍ（ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｊ）に基づいて、フィルタ関数Ｆ（ｊ）を作成するフィルタ関数作成ステップと、
前記音楽データを所定の区間単位であるフレームｆに分割し、分割された各フレームｆをフーリエ変換して複素スペクトルＳｍ（ｆ、ｊ）を生成する周波数次元変換ステップと、
各フレームｆに対応する複素スペクトルＳｍ（ｆ、ｊ）に対して前記フィルタ関数Ｆ（ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）に変換するフィルタ関数乗算ステップと、
前記第１変換スペクトルＳｍ’（ｆ、ｊ）の周波数別の大きさ｜Ｓｍ’（ｆ、ｊ）｜から、前記騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じた値を互いに対応する周波数ｊごとに減算し、第２変換スペクトルＳｍ’’（ｆ、ｊ）に変換するスペクトル減算ステップと、
前記第２変換スペクトルＳｍ’’（ｆ、ｊ）に対してフーリエ逆変換することによって、前記快音化データを生成する時間次元逆変換ステップと、
を含むことを特徴とする快音化データ生成方法。
請求項１乃至請求項５のいずれかに記載の快音化データ生成装置が生成する複数の前記快音化データを記憶する快音化データ記憶手段と、
前記快音化データ記憶手段によって記憶されている前記快音化データの中から単一の前記快音化データを選択する快音化データ選択手段と、
前記快音化データ選択手段によって選択された単一の前記快音化データを再生する快音化データ再生手段と、
を具備することを特徴とする快音化装置。
請求項７に記載の前記快音化データ再生手段が前記快音化データを波面が平面波に近い音波として所定平面から均一に放射する機構をもつ平面型スピーカで構成されていることを特徴とする快音化装置。
快音化データを生成する快音化データ生成装置であって、
予め記憶された騒音データ及び音楽データの各々に対して所定の区間単位のフレームに分割し、フレームｆごとに周波数解析を行い、前記騒音データの時間軸方向に最大のスペクトルである単一の騒音最大値スペクトルＶｖ（ｊ）（ｊは周波数）を算出するとともに、前記騒音データの時間軸方向に平均のスペクトルである単一の騒音平均値スペクトルＶａ（ｊ）を算出し、前記音楽データに対して時間軸方向に平均化したスペクトルである音楽平均値スペクトルＶｍ（ｊ）を算出する周波数解析手段と、
前記騒音最大値スペクトルＶｖ（ｊ）に基づく値を、前記音楽平均値スペクトルＶｍ（ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｊ）に基づいて、フィルタ関数Ｆ（ｊ）を作成するフィルタ関数作成手段と、
前記音楽データを所定の区間単位であるフレームｆに分割し、分割された各フレームｆをフーリエ変換して複素スペクトルＳｍ（ｆ、ｊ）を生成する周波数次元変換手段と、
各フレームｆに対応する複素スペクトルＳｍ（ｆ、ｊ）に対して前記フィルタ関数Ｆ（ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）に変換するフィルタ関数乗算手段と、
前記第１変換スペクトルＳｍ’（ｆ、ｊ）の周波数別の大きさ｜Ｓｍ’（ｆ、ｊ）｜から、前記騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じた値を互いに対応する周波数ｊごとに減算し、第２変換スペクトルＳｍ’’（ｆ、ｊ）に変換するスペクトル減算手段と、
前記第２変換スペクトルＳｍ’’（ｆ、ｊ）に対してフーリエ逆変換することによって、前記快音化データを生成する時間次元逆変換手段と、
前記快音化データを再生する快音化データ再生手段と、
を具備することを特徴とする快音化装置。
請求項６に記載の快音化データ生成方法によって生成する複数の前記快音化データを記憶する快音化データ記憶ステップと、
前記快音化データ記憶ステップによって記憶されている前記快音化データの中から単一の前記快音化データを選択する快音化データ選択ステップと、
前記快音化データ選択ステップによって選択された単一の前記快音化データを再生する快音化データ再生ステップと、
を含むことを特徴とする快音化方法。
快音化データを生成する快音化データ生成方法であって、
予め記憶された騒音データ及び音楽データの各々に対して所定の区間単位のフレームに分割し、フレームｆごとに周波数解析を行い、前記騒音データの時間軸方向に最大のスペクトルである単一の騒音最大値スペクトルＶｖ（ｊ）（ｊは周波数）を算出するとともに、前記騒音データの時間軸方向に平均のスペクトルである単一の騒音平均値スペクトルＶａ（ｊ）を算出し、前記音楽データに対して時間軸方向に平均化したスペクトルである音楽平均値スペクトルＶｍ（ｊ）を算出する周波数解析ステップと、
前記騒音最大値スペクトルＶｖ（ｊ）に基づく値を、前記音楽平均値スペクトルＶｍ（ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｊ）に基づいて、フィルタ関数Ｆ（ｊ）を作成するフィルタ関数作成ステップと、
前記音楽データを所定の区間単位であるフレームｆに分割し、分割された各フレームｆをフーリエ変換して複素スペクトルＳｍ（ｆ、ｊ）を生成する周波数次元変換ステップと、
各フレームｆに対応する複素スペクトルＳｍ（ｆ、ｊ）に対して前記フィルタ関数Ｆ（ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）に変換するフィルタ関数乗算ステップと、
前記第１変換スペクトルＳｍ’（ｆ、ｊ）の周波数別の大きさ｜Ｓｍ’（ｆ、ｊ）｜から、前記騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じた値を互いに対応する周波数ｊごとに減算し、第２変換スペクトルＳｍ’’（ｆ、ｊ）に変換するスペクトル減算ステップと、
前記第２変換スペクトルＳｍ’’（ｆ、ｊ）に対してフーリエ逆変換することによって、前記快音化データを生成する時間次元逆変換ステップと、
前記快音化データを再生する快音化データ再生ステップと、
を含むことを特徴とする快音化方法。
コンピュータに、
予め記憶された騒音データ及び音楽データの各々に対して所定の区間単位のフレームに分割し、フレームｆごとに周波数解析を行い、前記騒音データの時間軸方向に最大のスペクトルである単一の騒音最大値スペクトルＶｖ（ｊ）（ｊは周波数）を算出するとともに、前記騒音データの時間軸方向に平均のスペクトルである単一の騒音平均値スペクトルＶａ（ｊ）を算出し、前記音楽データに対して時間軸方向に平均化したスペクトルである音楽平均値スペクトルＶｍ（ｊ）を算出する周波数解析ステップと、
前記騒音最大値スペクトルＶｖ（ｊ）に基づく値を、前記音楽平均値スペクトルＶｍ（ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｊ）に基づいて、フィルタ関数Ｆ（ｊ）を作成するフィルタ関数作成ステップと、
前記音楽データを所定の区間単位であるフレームｆに分割し、分割された各フレームｆをフーリエ変換して複素スペクトルＳｍ（ｆ、ｊ）を生成する周波数次元変換ステップと、
各フレームｆに対応する複素スペクトルＳｍ（ｆ、ｊ）に対して前記フィルタ関数Ｆ（ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）に変換するフィルタ関数乗算ステップと、
前記第１変換スペクトルＳｍ’（ｆ、ｊ）の周波数別の大きさ｜Ｓｍ’（ｆ、ｊ）｜から、前記騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じた値を互いに対応する周波数ｊごとに減算し、第２変換スペクトルＳｍ’’（ｆ、ｊ）に変換するスペクトル減算ステップと、
前記第２変換スペクトルＳｍ’’（ｆ、ｊ）に対してフーリエ逆変換することによって、快音化データを生成する時間次元逆変換ステップと、
を実行させるためのコンピュータ読取可能なプログラム。
コンピュータに、
予め記憶された騒音データ及び音楽データの各々に対して所定の区間単位のフレームに分割し、フレームｆごとに周波数解析を行い、前記騒音データの時間軸方向に最大のスペクトルである単一の騒音最大値スペクトルＶｖ（ｊ）（ｊは周波数）を算出するとともに、前記騒音データの時間軸方向に平均のスペクトルである単一の騒音平均値スペクトルＶａ（ｊ）を算出し、前記音楽データに対して時間軸方向に平均化したスペクトルである音楽平均値スペクトルＶｍ（ｊ）を算出する周波数解析ステップと、
前記騒音最大値スペクトルＶｖ（ｊ）に基づく値を、前記音楽平均値スペクトルＶｍ（ｊ）に基づく値によって互いに対応する周波数ｊごとに除した値である除算値スペクトルＤｉｖ（ｊ）に基づいて、フィルタ関数Ｆ（ｊ）を作成するフィルタ関数作成ステップと、
前記音楽データを所定の区間単位であるフレームｆに分割し、分割された各フレームｆをフーリエ変換して複素スペクトルＳｍ（ｆ、ｊ）を生成する周波数次元変換ステップと、
各フレームｆに対応する複素スペクトルＳｍ（ｆ、ｊ）に対して前記フィルタ関数Ｆ（ｊ）を乗じ、第１変換スペクトルＳｍ’（ｆ、ｊ）に変換するフィルタ関数乗算ステップと、
前記第１変換スペクトルＳｍ’（ｆ、ｊ）の周波数別の大きさ｜Ｓｍ’（ｆ、ｊ）｜から、前記騒音平均値スペクトルＶａ（ｊ）に所定値γ（所定値γは１以下の正の実数）を乗じた値を互いに対応する周波数ｊごとに減算し、第２変換スペクトルＳｍ’’（ｆ、ｊ）に変換するスペクトル減算ステップと、
前記第２変換スペクトルＳｍ’’（ｆ、ｊ）に対してフーリエ逆変換することによって、快音化データを生成する時間次元逆変換ステップと、
前記快音化データを再生する快音化データ再生ステップと、
を実行させるためのコンピュータ読取可能なプログラム。