JP2011154141A - マスカ音生成装置およびプログラム - Google Patents

マスカ音生成装置およびプログラム Download PDF

Info

Publication number
JP2011154141A
JP2011154141A JP2010014876A JP2010014876A JP2011154141A JP 2011154141 A JP2011154141 A JP 2011154141A JP 2010014876 A JP2010014876 A JP 2010014876A JP 2010014876 A JP2010014876 A JP 2010014876A JP 2011154141 A JP2011154141 A JP 2011154141A
Authority
JP
Japan
Prior art keywords
sound
signal
masker
sound signal
masker sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010014876A
Other languages
English (en)
Other versions
JP5644122B2 (ja
Inventor
Mai Koike
舞 小池
Yasushi Shimizu
寧 清水
Masahito Hata
雅人 秦
Takashi Yamakawa
高史 山川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2010014876A priority Critical patent/JP5644122B2/ja
Priority to EP11151957.5A priority patent/EP2367169A3/en
Priority to US13/013,634 priority patent/US8861742B2/en
Priority to CN2011100302968A priority patent/CN102136272B/zh
Publication of JP2011154141A publication Critical patent/JP2011154141A/ja
Application granted granted Critical
Publication of JP5644122B2 publication Critical patent/JP5644122B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

【課題】マスカ音を放射する領域内の者に違和感を感じさせることなくその領域内において高いマスキング効果を発生させる。
【解決手段】CPU22は、音信号Sa,Sb,Sc,Sd,Se,及びSfをフレームF(i=1〜15)に分割した後、フレームF内の配列を逆転させる処理を行い、この処理を施した音信号Sa,Sb,Sc,Sd,Se,及びSfの波形を整形する。その後、この波形を整形した音信号Sa,Sb,Sc,Sd,Se,及びSfのフレームFの配列をランダムに並べ替えてミキシングした信号をマスカ音信号Mとする処理を時間長T2毎に繰り返し、最新のマスカ音信号Mを領域Bに放音する。
【選択図】図1

Description

本発明は、マスカ音を生成して音の漏れ聞こえを防ぐ技術に関する。
マスキング効果を利用して音の漏れ聞こえを防ぐ技術が各種提案されている。マスキング効果は、2種類の音信号を同じ空間内に伝搬させた場合に、空間内の者が、2種類の音信号の音響的特徴(周波数成分,時間波形等)の関係に応じて、それらの音信号に気づき難くなる現象である。この種の技術の多くは、話者が居る領域と壁や衝立を介して隣接している領域に向けて話者の話声の聞き取りを妨げるマスカ音を放音するものである。そして、この場合のマスカ音は、広い帯域にスペクトルを有するノイズ音でもよいが、聞き取りを妨げる対象となる音(以下、ターゲット音という)と類似した特徴を持った音の方が高いマスキング効果の得られることが知られている。
特許文献1には、複数種類のマスカ音のなかから最も高いマスキング効果の得られるものを都度選択して放音するように構成されたマスキングシステムの開示がある。同文献に開示されたマスキングシステムは、壁を挟んで隣接する2つの領域である音響空間20Aおよび20B間の話声の漏れ聞こえを防ぐものである。このマスキングシステムでは、年齢、言語、性別などを異にする人物の声を予め採取する。そして、採取した各声の音信号のフレーム配列を並べ替えたスクランブル音信号をそれらの声のフォルマントやパワースペクトルなどを示す音響特性情報と対応づけてメモリに記憶させておく。このマスキングシステムでは、音響空間20A内における話者の声を分析してその声の音響特性情報を求め、求めた音響特性情報に最も近い音響特性情報と対応付けてメモリに記憶されているスクランブル音信号を読み出し、このスクランブル音信号をマスカ音として音響空間20B内に放音する。この技術によると、音響空間20A内の話者の声に最も類似した特徴を持ったマスカ音が音響空間20Bに放音されるため、音響空間20B内において高いマスキング効果を得ることができる。
特開2008−233672号公報
このマスキングシステムでは、音響空間20B内におけるマスキング効果を保つために、複数種類のなかから選んだスクランブル音信号をマスカ音として音響空間20B内に繰り返し放音し続ける必要がある。しかしながら、このようにして同じマスカ音を長時間に渡って繰り返し放音し続けた場合、音響空間20Bの者は、同じマスカ音が繰り返し放音されているのを感じ、違和感を持つという問題があった。
本発明は、このような背景の下に案出されたものであり、放音するマスカ音の周期性を目立たなくして、マスカ音を放音する領域内の者に違和感を与えることなくその領域内において高いマスキング効果を得ることを目的とする。
この発明の好適な態様であるマスカ音生成装置は、音信号を取得する取得手段と、前記取得手段が取得した音信号の配列順を変更した信号をマスカ音信号として出力する処理を繰り返すとともに、配列順の変更の方法の変更を繰り返す生成手段とを具備することを特徴とする。
このマスカ音生成装置によると、生成手段が配列順の変更の方法を変更する度にマスカ音信号の聴感が変化する。よって、同じマスカ音信号を放音し続ける場合に比べて、その放音先の領域内の者に与える違和感を小さくすることができる。
また、前記生成手段は、前記取得手段が取得した音信号を一定時間長の複数の区間に分割し、分割した各区間を並べ替える並べ替え処理を前記配列順を変更する処理として繰り返し、繰り返しの度に各区間の並べ替えの方法を変えてもよい。
このマスカ音生成装置によると、一定時間長分の音信号毎に配列順が変更される。よって、音信号の配列順を1サンプルずつ変更する場合に比べて、よりマスキング効果の高いマスカ音信号を生成することができる。
また、前記取得手段は、1種類のマスカ音信号を生成するために複数種類の音信号を取得し、前記生成手段は、前記複数種類の音信号の種類毎に、当該種類の音信号を一定時間長の複数の区間に分割し、各区間を並べ替える並べ替え処理を前記配列順を変更する処理として繰り返し、前記複数種類の音信号の種類毎に区間の並べ替え方法を変えるようにしてもよい。
このマスカ音生成装置によると、複数種類の音信号をミキシングしてマスカ音信号とするため、マスキングの対象となる音が複数に及ぶ場合でも、高いマスキング効果を発生させることができる。
また、前記生成手段は、音信号を分割した各区間内の音信号の配列を逆転させる区間内逆転処理を行い、この区間内逆転処理と前記区間並べ替え処理の両方を経た信号を用いて前記マスカ音信号を生成してもよい。
また、前記生成手段は、前記複数種類の音信号のうち少なくとも一部の種類の音信号について、前記区間の並べ替え後の信号に音響効果を付与し、この音響効果を付与した信号を前記ミキシングの対象としてもよい。
また、本発明の別の好適な態様であるマスカ音生成装置は、音信号を取得する取得手段と、前記取得手段が取得した音信号の配列順を変更し、配列順を変更した信号に音響効果を付与し、音響効果を付与した信号をマスカ音信号として出力する処理を繰り返し、音響効果の付与の方法の変更を繰り返す生成手段とを具備することを特徴とする。
このマスカ音生成装置によると、生成手段が音響効果の付与の方法を変更する度にマスカ音信号の聴感が変化する。よって、同じマスカ音信号を放音し続ける場合に比べて、その放音先の領域内の者に与える違和感を小さくすることができる。
また、本発明の別の好適な態様であるマスカ音生成装置は、複数種類の音信号を取得する取得手段と、前記取得手段が取得した複数種類の音信号の配列順を変更し、配列順を変更した複数種類の音信号のうち少なくとも一部の種類の音信号について、配列順の変更後の信号に音響効果を付与し、音響効果を付与した信号をミキシングしてマスカ音信号として出力する処理を繰り返し、ミキシングの方法の変更を繰り返す生成手段とを具備することを特徴とする。
このマスカ音生成装置によると、生成手段がミキシングの方法を変更する度にマスカ音信号の聴感が変化する。よって、同じマスカ音信号を放音し続ける場合に比べて、その放音先の領域内の者に与える違和感を小さくすることができる。
また、本発明の別の好適な態様であるマスカ音生成装置は、前記取得手段が取得した複数種類の音信号の配列順を変更し、配列順を変更した複数種類の音信号のうち少なくとも一部の種類の音信号について、配列順の変更後の信号に音響効果を付与し、音響効果を付与した信号をミキシングした信号を繰り返し処理の処理対象とし、処理対象とした信号の配列順を変更した音信号をマスカ音信号として出力する処理を繰り返し、配列順の変更の方法の変更を繰り返す生成手段とを具備することを特徴とする。
このマスカ音生成装置によっても、生成手段が配列順の変更の方法を変更する度にマスカ音信号の聴感が変化する。よって、同じマスカ音信号を放音し続ける場合に比べて、その放音先の領域内の者に与える違和感を小さくすることができる。
また、本発明の別の好適な態様であるプログラムは、コンピュータに、音信号を取得する取得手段と、前記取得手段が取得した音信号の配列順を変更した信号をマスカ音信号として出力する処理を繰り返すとともに、配列順の変更の方法の変更を繰り返す生成手段とを実現させる。
本発明の第1〜第5実施形態であるマスカ音生成装置の構成を示すブロック図である。 同マスカ音生成装置の設置の態様の一例を示す図である。 同マスカ音生成装置が記憶する音データベースのデータ構造図である。 本発明の第1実施形態であるマスカ音生成装置の動作を示すフローチャートである。 同マスカ音生成装置による音信号の処理の様子を示す図である。 本発明の第2実施形態であるマスカ音生成装置の動作を示すフローチャートである。 同マスカ音生成装置による音信号の処理の様子を示す図である。 本発明の第3実施形態であるマスカ音生成装置の動作を示すフローチャートである。 本発明の第4実施形態であるマスカ音生成装置の動作を示すフローチャートである。 本発明の第5実施形態であるマスカ音生成装置の動作を示すフローチャートである。
以下、図面を参照しつつ本発明の実施形態について説明する。
<第1実施形態>
図1は、本発明の第1実施形態であるマスカ音生成装置10の構成を示すブロック図である。図2は、マスカ音生成装置10の設置の態様の一例を示す図である。図2の例に示すように、マスカ音生成装置10は、衝立50によって外部と仕切られた領域Aに設置される。この領域Aには、領域A内への話者の進入および領域A外への話者の退出を検知する人感センサ30が設けられている。マスカ音生成装置10は、人感センサ30が領域A内に話者が進入したことを検知してから話者が領域A外に退出したことを検知するまでの間、領域Aから衝立50を超えてその外側の領域Bに伝搬される話声をターゲット音Tとし、このターゲット音Tの聴取を妨げるマスカ音信号Mを領域Bのスピーカ31から放音する。
図1において、マスカ音生成装置10は、ハードディスク11、制御部12、バッファ13、放音制御部14、D/A変換部15、およびアンプ16を有する。ハードディスク11は、音データベース21を記憶している。音データベース21は、様々な声の特徴を持った人物から収録した時間長T1(例えば、T1=30秒とする)分の音声と対応する複数のレコードの集合体である。図3に示すように、このデータベース21における1つの音声と対応するレコードは、その音声の時間長T1分の音信号Sを示す「音声」のフィールドと、その音声の属性情報を示す「属性」のフィールドとを有する。属性情報は、例えば、音声の収録元の人物の性別と声の高さ(高音、中音、低音)の組み合わせを示す情報である。属性情報には、「男性,高音」、「男性,中音」、「男性,低音」、「女性,高音」、「女性,中音」、「女性,低音」の6種類がある。
制御部12は、CPU22、RAM23、およびROM24を有する。CPU22は、RAM23をワークエリアとして利用しつつ、ROM24に記憶されたマスカ音生成プログラム25を実行する。マスカ音生成プログラム25は、取得処理と生成処理の2つの処理をCPU22に実行させるプログラムである。取得処理は、音データベース21から複数種類の音信号Sを取得してRAM23に格納する処理である。生成処理は、RAM23に格納された音信号Sの配列順を変更した信号をマスカ音信号Mとし、マスカ音信号Mのバッファ13への出力を繰り返すとともに、配列順の変更の方法の変更を繰り返す処理である。取得処理と生成処理の詳細については、後述する。放音制御部14は、バッファ13に書き込まれている最新のマスカ音信号Mを読み出してD/A変換部15に出力する処理を繰り返す回路である。D/A変換部15は、放音制御部14を介して出力されたマスカ音信号Mをアナログ信号に変換し、アンプ16に出力する。アンプ16は、D/A変換部15から出力されたアナログ信号を増幅し、スピーカ31から音として出力する。
次に、本実施形態の動作について説明する。マスカ音生成装置10のCPU22は、人感センサ30から領域A内に話者が進入したことを示す検知信号SINが与えられると、取得処理と生成処理とを実行する。取得処理では、CPU22は、「男性,高音」の属性情報と対応付けられた音信号S、「男性,中音」の属性情報と対応付けられた音信号S、「男性,低音」の属性情報と対応付けられた音信号S、「女性,高音」の属性情報と対応付けられた音信号S、「女性,中音」の属性情報と対応付けられた音信号S、および「女性,低音」の属性情報と対応付けられた音信号Sを音データベース21から1種類ずつ選び、これら6種類の音信号Sを同データベース21から取得してRAM23に格納する。以下では、説明の便宜のため、この取得処理によってRAM23に格納された6種類の音信号Sの各々を音信号Sa,Sb,Sc,Sd,Se,Sfと記す。
生成処理では、CPU22は、6種類の音信号Sa,Sb,Sc,Sd,Se,及びSfを処理対象として図4に示すステップS100〜ステップS120の処理を行い、以降は図4に示すステップS130〜ステップS190のループ処理を時間長T2(例えば、T2=1分間とする)毎に繰り返す。以下、ステップS100〜ステップS190の処理の詳細について説明する。
まず、CPU22は、図5(A)に示すように、6種類の音信号Sa,Sb,Sc,Sd,Se,及びSfを、各々が時間長T3(例えば、T3=100ミリ秒とする)の長さを有するN個(N=T1/T3)のフレームF(i=1〜N)に分割する(S100)。なお、図5(A)では、図面が煩雑になるのを防ぐため、N=15の場合が図示されている
CPU22は、図5(B)に示すように、フレーム内逆転処理を行う(S110)。フレーム内逆転処理は、音信号Sa,Sb,Sc,Sd,Se,及びSfの各々におけるフレームF内のサンプルデータの配列を逆転させた音信号Sa,Sb,Sc,Sd,Se,及びSfを生成する処理である。
CPU22は、フレーム内逆転処理を終えると、図5(C)に示すように、フレーム内逆転処理の処理結果である音信号Sa,Sb,Sc,Sd,Se,及びSfに窓関数ωを乗算する(S120)。この窓関数ωは、分割したフレームF間の結合を円滑にする波形整形のためのものである。
次に、CPU22は、図5(D)に示すように、窓関数ωを乗算した音信号Sa,Sb,Sc,Sd,Se,及びSfを処理対象としてフレーム並べ替え処理を行う(S130)。フレーム並べ替え処理では、CPU22は、音信号Sa,Sb,Sc,Sd,Se,及びSfの各々のフレームF(i=1〜15)の配列をランダムに並べ替えた音信号Sa,Sb,Sc,Sd,Se,及びSfを生成する。
以下、音信号Saを処理対象とするフレーム並べ替え処理を例にとり、その具体的な手順について説明する。CPU22は、音信号Saを分割したフレーム数Nが15である場合、1〜15までの数字からなる乱数列を発生する。そして、15個の乱数を先頭から順番に読んで行き、最初の乱数が8であれば並び替え前の1番目のフレームを並び替え後の8番目のフレームとし、2番目の乱数が4であれば並び替え前の2番目のフレームを並び替え後の4番目のフレームとし…、というようにして、乱数列に応じてフレームの並び替え後の順番を決定して行く。そして、1番目〜15番目のフレームを並び替えたものを音信号Saとする。ここで、本実施形態では、並び替え方法を変更するために、乱数の並びの異なった複数種類の乱数列(N=15である場合は、いずれも15個の乱数からなる乱数列)を用意する。そして、フレーム並び替え処理の度に、並び替えに使用する乱数列の種類を変更する。
CPU22は、音信号Sb,Sc,Sd,Se,及びSfを処理対象とするフレーム並べ替え処理も同様にして行う。
フレーム並べ替え処理を終えると、CPU22は、音信号Sa,Sb,Sc,Sd,Se,及びSfを処理対象とする音響効果付与処理を行う(S140)。音響効果付与処理では、CPU22は、フレーム並べ替え処理の処理結果として生成した音信号Sa,Sb,Sc,Sd,Se,及びSfに所定の音響効果(例えば、リバーブとする)を付与した音信号Sa’,Sb’,Sc’,Sd’,Se’,及びSf’を生成する。音響効果付与処理を終えると、CPU22は、ミキシング処理を行う(S150)。ミキシング処理では、CPU22は、音響効果付与処理を施した音信号Sa’,Sb’,Sc’,Sd’,Se’,及びSf’を所定のミキシング比率(例えば、1:1:1:1:1:1とする)でミキシングし、このミキシングした信号をマスカ音信号Mとする。ミキシング処理を終えると、CPU22は、話速変換処理を行う(S160)。話速変換処理では、CPU22は、ミキシング処理によって生成された時間長T1分のマスカ音信号Mの時間軸を伸長して時間長T1’(T1’>T1)分のマスカ音信号Mとする。より具体的に説明すると、この話速変換処理では、CPU22は、処理対象であるマスカ音信号MにおけるフレームF(i=1〜15)のうち音波形の立ち上がり部分と立ち下り部分とを除いた定常部分のフレームFを時間長T1と時間長T1’の時間差を埋め合わせるのに必要な数だけ複製し、この複製したフレームF’を定常部分のフレームFおよびFi+1間に挿入する。
CPU22は、話速変換処理を施したマスカ音信号Mを出力してバッファ13に上書きする(S170)。CPU22は、人感センサ30から領域A外に話者が退出したことを示す検知信号SOUTが与えられることなく(S180:No)、ステップS130の実行時から時間長T2(T2=1分間)が経過すると(S190:Yes)、ステップS130に戻って以降の処理を繰り返す。一方、人感センサ30から検知信号SOUTが与えられると(S180:Yes)、放音制御部14にマスカ音信号Mの読み出しの停止を指示して処理を終了する。
以上説明した本実施形態によると、次の効果が得られる。
第1に、本実施形態では、6種類の音信号Sa,Sb,Sc,Sd,Se,及びSfからマスカ音信号Mを生成する。よって、領域A内に異なる声の特徴をもった複数人の話者がいる場合でも、領域B内において高いマスキング効果を発生させることができる。
第2に、本実施形態では、音信号Sa,Sb,Sc,Sd,Se,及びSfを処理対象とするフレーム並べ替え処理を時間長T2毎に繰り返し、フレーム並べ替え処理によってフレームF(i=1〜15)の配列をランダムに変えた音信号Sa,Sb,Sc,Sd,Se,及びSfをマスカ音信号Mとして領域B内に放音する。また、本実施形態では、フレーム並べ替え処理(ステップS130)に進む都度、フレームの並び替え方法を変更する。この結果、領域B内に放音されるマスカ音信号Mの聴感が時間長T2毎に変化する。よって、同じフレームF(i=1〜15)の配列のマスカ音信号Mを領域B内へ長時間に渡って放音し続けた場合に比べて、領域B内の者に違和感を与え難くすることができる。
第3に、本実施形態では、音信号Sa’,Sb’,Sc’,Sd’,Se’,及びSf’をミキシングしてマスカ音信号Mとした後、そのマスカ音信号Mの時間軸を伸長してから領域Bに放音する。人の音声を示す音信号に対してその配列を変更する処理(ステップS110およびステップS130)を施した場合、通常であれば処理が施された音信号は早口で話している人の音声と似通った音の特徴を持つようになる。しかし、本実施形態によると、そのような早口の話声が聞えているとの印象を和らげることができる。また、本実施形態によれば、配列を変更した場合に早口の印象となり難いような音信号を厳選して音データベース21に記憶させておく必要もなくなる。
第4に、本実施形態では、6種類の音信号Sa’,Sb’,Sc’,Sd’,Se’,及びSf’をミキシングしてから音響効果を付与する。このようにして音響効果が付与されたマスカ音信号Mは、領域B内の伝搬によって空間的な音響効果(残響)が付与された話声(ターゲット音T)と音響的に類似したものとなる。従って、マスカ音を放音する領域内の者に違和感を与えることなくその領域内において高いマスキング効果を得ることができる。
<第2実施形態>
次に、本発明の第2実施形態について説明する。図6に示すように、本実施形態における生成処理では、CPU22は、ステップS130のフレーム並べ替え処理を行った後、このフレーム並べ替え処理によってフレームF(i=1〜15)を並べ替えた音信号Sa,Sb,Sc,Sd,Se,及びSfを処理対象とし、ステップS140〜ステップS190のループ処理を時間長T2毎に繰り返す。この場合において、CPU22は、各ループ処理におけるステップS140の音響効果付与処理の度に、音響効果であるリバーブの深さ(直接音と残響音のレベル比)をランダムに変える。より具体的に説明すると、図7に示すように、CPU22は、音響効果付与処理では、音信号Saから残響音信号RSaを生成する処理を行う。この処理では、音信号Saを遅延させた遅延音信号DSa−n(n=1,2,…)を求め、遅延音信号DSa−n(n=1,2,…)を加算したものを残響音信号RSaとする。次に、乱数を発生し、この乱数と残響音信号RSaの積を音信号Saに加算したものを、音響効果を付与した音信号Sa’とする。以下、同様に、CPU22は、個別に発生した乱数の各々と残響音信号RSb,RSc,RSd,RSe,及びRSfの積を音信号Sb,Sc,Sd,Se,及びSfの各々に加算したものを、音信号Sb’,Sc’,Sd’,Se’,及びSf’とする。
本実施形態では、音響効果付与処理(S140)の内容を時間長T2毎に変更するので、領域B内に放音されるマスカ音信号Mの聴感が時間長T2毎に変化する。よって、領域B内の者に違和感を与え難くすることができる。
<第3実施形態>
次に、本発明の第3実施形態について説明する。図8に示すように、本実施形態における生成処理では、CPU22は、ステップS140の音響効果付与処理を行った後、この音響効果付与処理によって音響効果を付与した音信号Sa’,Sb’,Sc’,Sd’,Se’,及びSf’を処理対象とし、ステップS150〜ステップS190のループ処理を時間長T2毎に繰り返す。この場合において、CPU22は、各ループ処理におけるステップS150のミキシング処理の度に、Sa’,Sb’,Sc’,Sd’,Se’,及びSf’のミキシング比率をランダムに変える。より具体的に説明すると、CPU22は、ミキシング処理では、6種類の乱数(0を除く)を発生し、それらの乱数の各々を音信号Sa’,Sb’,Sc’,Sd’,Se’,及びSf’の各々のミキシング比率とする。
本実施形態では、ミキシング処理(ステップS150)の内容を時間長T2毎に変更するので、領域B内に放音されるマスカ音信号Mの聴感が時間長T2毎に変化する。よって、領域B内の者に違和感を与え難くすることができる。
<第4実施形態>
次に、本発明の第4実施形態について説明する。図9に示すように、本実施形態における生成処理では、CPU22は、ステップS150におけるミキシング処理を行った後、ステップS160〜ステップS200のループ処理を時間長T2毎に繰り返す。このループ処理におけるステップS160〜ステップS190までの内容は第1実施形態のステップS160〜ステップS190までの内容と同じである。即ち、CPU22は、人感センサ30から領域A外に話者が退出したことを示す検知信号SOUTが与えられることなく(S180:No)、時間長T2が経過すると(S190:Yes)、ステップS200に進む。
ステップS200では、CPU22は、ステップS150のミキシング処理の処理結果であるマスカ音信号Mを処理対象としてフレーム並べ替え処理を行う。このステップS200のフレーム並べ替え処理では、CPU22は、マスカ音信号Mを再びフレームF(i=1〜15)に分割し、分割したフレームF(i=1〜15)をランダムに並べ替えたマスカ音信号Mを生成する。ステップS200のフレーム並べ替え処理を実行した後、CPU22は、ステップS160に戻り、新たに生成したマスカ音信号Mに話速変換処理を施し、ステップS170に進んでそのマスカ音信号Mをバッファ13に上書きする。
本実施形態では、時間長T2毎にフレームの並べ替え方法を変更するので、領域B内に放音されるマスカ音信号Mの聴感が時間長T2毎に変化する。よって、領域B内の者に違和感を与え難くすることができる。
<第5実施形態>
次に、本発明の第5実施形態について説明する。図10に示すように、本実施形態における生成処理では、CPU22は、ステップS160における話速変換処理を行った後、ステップS170〜ステップS200のループ処理を時間長T2毎に繰り返す。このループ処理におけるステップS200のフレーム並べ替え処理では、CPU22は、ステップS160の話速変換処理によって時間軸を伸長したマスカ音信号Mを処理対象としてフレーム並べ替え処理を行う。このステップS200のフレーム並べ替え処理の内容は、第4実施形態における同処理の内容と同じである。
本実施形態においても、時間長T2毎にフレームの並び替え方法を変更するので、領域B内に放音されるマスカ音信号Mの聴感が時間長T2毎に変化する。よって、領域B内の者に違和感を与え難くすることができる。
以上、この発明の第1〜第5実施形態について説明したが、この発明には他にも実施形態があり得る。例えば、以下の通りである。
(1)上記第1〜第5実施形態のマスカ音生成装置10において、性別や声の高さなどの複数種類の属性の各々について複数の選択項目を提示し、少なくとも1種類の属性の選択項目の選択を受け付ける選択支援手段を有し、CPU22は、この選択支援手段によって選択された選択項目の属性を持った人物を収録元とする一又は複数種類の音信号Sを音データベース21から読み出し、読み出した音信号Sを素材としてマスカ音信号Mを生成してもよい。
この実施形態は、例えば次のようして実現する。まず、音データベース21には、高音の男性、中音の男性、及び低音の男性の音声をミキシングしたものと「男性」の属性情報、高音の女性、中音の女性、及び低音の女性の音声をミキシングしたものと「女性」の属性情報、高音の男女の音声をミキシングしたものと「高音」の属性情報、中音の男女の音声をミキシングしたものと「中音」の属性情報、低音の男女の音声をミキシングしたものと「低音」の属性情報を各々対応付けて記憶しておく。
そして、CPU22は、性別の選択項目(男性,女性)の1つが操作支援手段によって選択された場合は、「男性」と「女性」のうち選択された属性情報と対をなす音信号Sを音データベース21から読み出し、この音信号Sを素材としてマスカ音信号Mを生成する。また、CPU22は、声の高さの選択項目(高音、中音、低音)の1つが操作支援手段によって選択された場合は、「高音」、「中音」、「低音」のうち選択された属性情報と対をなす音信号Sを音データベース21から読み出し、この音信号Sを素材としてマスカ音信号Mを生成する。
この実施形態によると、利用者が、自身についての複数種類の属性のうちの一部の種類の選択項目だけを指定した場合でも、その利用者の音声に対して高いマスキング効果を発生するマスカ音信号Mを生成することができる。また、他の種類の属性情報(例えば、言語や年齢)と対応付けた複数種類の音信号Sを音データベース21に記憶し、操作手段の指定に応じて選択したものをマスカ音信号Mの素材としてもよい。
(2)上記第1〜第5実施形態の音響効果付与処理において、ディレイ、ハーモニー、ディストーションなどといったリバーブ以外の種類の音響効果を音信号Sa,Sb,Sc,Sd,Se,及びSfに付与してもよい。
(3)上記第1〜第5実施形態において、ステップS110とステップS120の処理の順序を逆にし、音信号Sa,Sb,Sc,Sd,Se,及びSfの各々におけるフレームFに窓関数ωを乗算してから各々のフレームF内のサンプルデータの配列を逆転させてもよい。
(4)上記第2実施形態において、音響効果付与処理の繰り返しの度に、6種類の音信号Sa,Sb,Sc,Sd,Se,及びSfのうち音響効果を付与するものと音響効果を付与しないものの組合せを変えてもよい。また、音響効果付与処理の繰り返しの度に、6種類の音信号Sa,Sb,Sc,Sd,Se,及びSfの各々に付与する音響効果の種類を変えてもよい。また、音響効果付与処理の繰り返しの度に、6種類の音信号Sa,Sb,Sc,Sd,Se,及びSfの各々のフレームF(i=1〜15)のうち音響効果を付与するフレームFと音響効果を付与しないフレームFの組合せを変えてもよい。
(5)上記第1実施形態では、音信号Sa,Sb,Sc,Sd,Se,及びSfの各々を処理対象とするフレーム並べ替え処理を時間長T2毎に繰り返した。しかし、フレーム並べ替え処理を複数種類の音信号Sa,Sb,Sc,Sd,Se,及びSfに固有の相異なる時間長T2,T2,T2,T2,T2,T2毎に繰り返してもよい。この場合において、時間長T2,T2,T2,T2,T2,T2を互いに素な関係にある長さ(1:3:5などの互いに素数比となる長さ)にするとよい。このようにすれば、領域B内に放音するマスカ音Mの聴感が変わる周期が実質的に長くなり、領域B内の者に違和感をより一層与え難くすることができる。同様に、第2実施形態におけるステップS140の音響効果付与処理の繰り返し、第3実施形態におけるステップS150のミキシング処理の繰り返し、第4および第5実施形態におけるステップS200のフレーム並べ替え処理の繰り返しを時間長T2,T2,T2,T2,T2,T2毎に行ってもよい。
(6)上記第1〜第5実施形態では、ループ処理を繰り返す時間長T2をマスカ音信号Mの材料となる音声の時間長T1よりも長くした(T2=1分間、T1=30秒)。しかし、時間長T2を時間長T1と同じ長さにしてもよい。また、時間長T2を時間長T1’(話速変換処理を経たマスカ音信号Mの長さ)と同じ長さにしてもよい。また、ループ処理の繰り返す時間長T2を乱数を用いてランダムに決定してもよい。
(7)上記第1〜第5実施形態では、6種類の音信号Sa,Sb,Sc,Sd,Se,及びSfの全てを処理対象として音響効果付与処理(S140)を行った。しかし、6種類の音信号Sa,Sb,Sc,Sd,Se,及びSfのうち一部の種類のものを処理対象として音響効果付与処理を行ってもよい。
(8)上記第1〜第5実施形態では、6種類の音信号Sa,Sb,Sc,Sd,Se,及びSfの全てを処理対象として、フレーム内逆転処理(S110)、窓関数を乗算する処理(S120)、フレーム並べ替え処理(S130)、および音響効果付与処理(S140)の各処理を行い、処理結果である音信号Sa’,Sb’,Sc’,Sd’,Se’,及びSf’をミキシングしたものをマスカ音信号Mとした。しかし、6種類の音信号Sa,Sb,Sc,Sd,Se,及びSfのうち一部の種類のもの(例えば、音信号Sa,Sb,Sc,Sdとする)についてはステップS110〜ステップS140の各処理を行う一方で、残りの音信号Se,及びSfについては、ステップS110〜ステップS140の何れの処理も行わず、ステップS110〜ステップS140の各処理を行った処理結果である音信号Sa’,Sb’,Sc’,およびSd’と音信号SeおよびSfをミキシングしたものをマスカ音信号Mとしてもよい。この場合において、音信号Sa,Sb,Sc,Sdのうちの一部または全部の種類の音信号について、フレーム内逆転処理(S110)、窓関数を乗算する処理(S120)、またはフレーム並べ替え処理(S130)までを行った処理結果をミキシングの対象としてもよい。
(9)上記第1〜第5実施形態では、フレーム内逆転処理(S110)の後にフレーム並べ替え処理(S130)を行った。しかし、フレーム並べ替え処理の後にフレーム内逆転処理を行ってもよい。
(10)上記第1〜第5実施形態において、6種類の音信号Sa,Sb,Sc,Sd,Se,及びSfをまずミキシングし、ミキシングした音信号を処理対象としてステップS110〜ステップS140の各処理行い、ステップS110〜ステップS140の各処理の処理結果をマスカ音信号Mとしてもよい。
(11)第1〜第5実施形態では、領域A内への話者の進入を人感センサ30が検知する度に音データベース21から音信号Sa,Sb,Sc,Sd,Se,及びSfを読み出し、音信号Sa,Sb,Sc,Sd,Se,及びSfを処理対象としてステップS100〜ステップS190の各処理を行って得たマスカ音信号Mを領域Bに放射した。しかし、ステップS100〜ステップS190の各処理を行って得たマスカ音信号Mをメモリに記憶させ、以降は、話者の進入を人感センサ30が検知する度にメモリ内のマスカ音信号Mを読み出して領域Bに繰り返し放射するようにしてもよい。この場合において、時間長T1(T1=30秒)の長さの音信号Sa,Sb,Sc,Sd,Se,及びSfを素材として、図4,図6,図8,図9,または図10の一連の処理を複数回繰り返すことにより、時間長T1よりも十分に長い時間長T4(例えば、T4=10分)分のマスカ音信号Mを生成し、この時間長T4分のマスカ音信号Mをメモリに記憶させて利用してもよい。
(12)上記第1〜第5実施形態は、衝立50により仕切られた領域Aから外部の領域Bへの音声の漏れ聞こえの防止に本発明を適用したものであった。しかし、衝立50などが間に介在しない2つの領域A’およびB’のうち一方の領域A’(またはB’)で発生した音を他方の領域B’(またはA’)で聞こえ難くする用途に本発明を適用してもよい。また、4方の壁と天井とにより外部と区切られた部屋にマスカ音生成装置10を設置し、このマスカ音生成装置10によって生成したマスカ音信号Mを壁の外側の領域に向けて放音するようにしてもよい。また、異なる空間に居る者同士の通話を実現させる通話装置(例えば、携帯電話、IP電話、インターフォン等)における各話者の話声を周りに聞こえ難くする用途に本発明を適用してもよい。この実施形態は、例えば、通話装置に第1〜第5実施形態のマスカ音生成装置10を内蔵し、マスカ音生成装置10が生成したマスカ音信号Mを話者の周りに放音することによって実現可能である。この場合において、発話者にイヤホンを装着させたり通話装置のスピーカの指向性を制御することにより、マスカ音信号Mが通話の相手方まで伝送されて会話が混乱する事態を防ぐようにするとなおよい。
(13)上記第1〜第5実施形態において、領域Aにマイクロホンを設置してもよい。この場合において、CPU22は、取得処理では、この領域Aのマイクロホンが収音した音信号を取得し、生成処理では、その取得した音信号からマスカ音信号Mを生成するとよい。
(14)上記第1〜第5実施形態において、人感センサ30は、音響センサ(例えば、音波を検出するマイクロホン、振動を検出する振動ピックアップなど)であってもよいし、生体センサ(例えば、生体の熱を検出する感熱センサ、生体の赤外線を検出する赤外線センサなど)であってもよい。また、(15)に示したマイクロホンの機能と人感センサ30の機能とを兼ね備えた収音・検知装置を領域Aに設置し、収音・検知装置によって領域A内に話者が進入したことが検知された場合に、同装置が以降に収音した音信号を素材としてマスカ音信号Mを生成するようにしてもよい。
(16)上記第1〜第5実施形態において、ハードディスク11をマスカ音生成装置10の外部要素としてもよい。この実施形態では、外部の記憶装置内の音データベース21からネットワークを経由して音信号Sa,Sb,Sc,Sd,Se,及びSfを取得し、この音信号Sa,Sb,Sc,Sd,Se,及びSfを素材としてマスカ音信号Mを生成するとよい。また、バッファ13、放音制御部14、D/A変換部15、およびアンプ16のうち全部または一部をマスカ音生成装置10の外部要素としてもよい。この実施形態では、例えば、音信号Sa,Sb,Sc,Sd,Se,及びSfを素材として生成したマスカ音信号Mを、バッファ13の役割を果たす外部記憶装置に各種インターフェースを介して出力するとよい。
(18)上記第1〜第5実施形態では、マスカ音生成装置10のCPU22は、領域A内に話者が進入したことを示す検知信号SINが与えられると、取得処理と生成処理とを実行した。しかし、検知信号SINが与えられた場合に、取得処理と生成処理を実行せず、ハードディスク11やその他のメモリに予め記憶したマスカ音信号Mをスピーカ31から出力してもよい。
(19)上記第1〜第5実施形態のフレーム並べ替え処理では、互いに異なる1〜Nまでの数字からなる乱数列をフレームの並び替えに使用した。しかし、乱数列の中に同じ乱数が複数回現れるような乱数列をフレーム並び替えに使用してもよい。また、最初の乱数が8であれば並び替え前の8番目のフレームを並び替え後の1番目のフレームとし、2番目の乱数が4であれば並び替え前の4番目のフレームを並び替え後の2番目のフレームとし…、というようにして、乱数列に応じて並び替え前のもの中から選び出すフレームを決定するようにしてもよい。
(20)上記第2実施形態では、CPU22は、音響効果付与処理の度にリバーブの深さ(直接音と残響音の比率)を変更した。しかし、音響効果付与処理の度に残響音の長さ(ディケイ時間)を変更してもよい。この実施形態では、CPU22は、音響効果付与処理の度に、音信号Saを遅延させた遅延音信号DSa−n(n=1,2,…)の強さを変更することにより、残響音の長さ(ディケイ時間)を変更してもよいし、音響効果付与処理の度に、音信号Saを遅延させた遅延音信号DSa−n(n=1,2,…)の遅延時間を変更することにより、残響音の長さ(ディケイ時間)を変更してもよい。
10…マスカ音生成装置、11…ハードディスク、12…制御部、13…バッファ、14…放音制御部、15…D/A変換部、16…アンプ、21…音データベース、22…CPU、23…RAM、24…ROM、30…人感センサ、31…スピーカ。

Claims (5)

  1. 音信号を取得する取得手段と、
    前記取得手段が取得した音信号の配列順を変更した信号をマスカ音信号として出力する処理を繰り返すとともに、配列順の変更の方法の変更を繰り返す生成手段と
    を具備することを特徴とするマスカ音生成装置。
  2. 前記生成手段は、前記取得手段が取得した音信号を一定時間長の複数の区間に分割し、分割した各区間を並べ替える並べ替え処理を前記配列順を変更する処理として繰り返し、繰り返しの度に各区間の並べ替えの方法を変えることを特徴とする請求項1に記載のマスカ音生成装置。
  3. 前記取得手段は、1種類のマスカ音信号を生成するために複数種類の音信号を取得し、
    前記生成手段は、前記複数種類の音信号の種類毎に、当該種類の音信号を一定時間長の複数の区間に分割し、分割した各区間を並べ替える並べ替え処理を前記配列順を変更する処理として繰り返し、前記複数種類の音信号の種類毎に区間の並べ替えの方法を変える
    ことを特徴とする請求項1または2に記載のマスカ音生成装置。
  4. 前記生成手段は、音信号を分割した各区間内の音信号の配列を逆転させる区間内逆転処理を行い、この区間内逆転処理と前記区間並べ替え処理の両方を経た信号を用いて前記マスカ音信号を生成することを特徴とする請求項2または3に記載のマスカ音生成装置。
  5. コンピュータに、
    音信号を取得する取得手段と、
    前記取得手段が取得した音信号の配列順を変更した信号をマスカ音信号として出力する処理を繰り返すとともに、配列順の変更の方法の変更を繰り返す生成手段と
    を実現させるプログラム。

JP2010014876A 2010-01-26 2010-01-26 マスカ音生成装置 Expired - Fee Related JP5644122B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2010014876A JP5644122B2 (ja) 2010-01-26 2010-01-26 マスカ音生成装置
EP11151957.5A EP2367169A3 (en) 2010-01-26 2011-01-25 Masker sound generation apparatus and program
US13/013,634 US8861742B2 (en) 2010-01-26 2011-01-25 Masker sound generation apparatus and program
CN2011100302968A CN102136272B (zh) 2010-01-26 2011-01-26 掩蔽声音生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010014876A JP5644122B2 (ja) 2010-01-26 2010-01-26 マスカ音生成装置

Publications (2)

Publication Number Publication Date
JP2011154141A true JP2011154141A (ja) 2011-08-11
JP5644122B2 JP5644122B2 (ja) 2014-12-24

Family

ID=44540172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010014876A Expired - Fee Related JP5644122B2 (ja) 2010-01-26 2010-01-26 マスカ音生成装置

Country Status (1)

Country Link
JP (1) JP5644122B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014130251A (ja) * 2012-12-28 2014-07-10 Glory Ltd 会話保護システム及び会話保護方法
WO2021079761A1 (ja) * 2019-10-24 2021-04-29 インターマン株式会社 マスキング機能を備えた携帯端末用ブース、マスキングシステムおよびマスキング音発生方法
US11230852B2 (en) 2019-05-23 2022-01-25 Interman Corporation Mobile terminal booth with sound masking function

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008090296A (ja) * 2006-09-07 2008-04-17 Yamaha Corp 音声スクランブル信号作成方法と装置及び音声スクランブル方法と装置
JP2008233672A (ja) * 2007-03-22 2008-10-02 Yamaha Corp マスキングサウンド生成装置、マスキングサウンド生成方法、プログラムおよび記録媒体
JP2008233671A (ja) * 2007-03-22 2008-10-02 Yamaha Corp サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008090296A (ja) * 2006-09-07 2008-04-17 Yamaha Corp 音声スクランブル信号作成方法と装置及び音声スクランブル方法と装置
JP2008233672A (ja) * 2007-03-22 2008-10-02 Yamaha Corp マスキングサウンド生成装置、マスキングサウンド生成方法、プログラムおよび記録媒体
JP2008233671A (ja) * 2007-03-22 2008-10-02 Yamaha Corp サウンドマスキングシステム、マスキングサウンド生成方法およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014130251A (ja) * 2012-12-28 2014-07-10 Glory Ltd 会話保護システム及び会話保護方法
US11230852B2 (en) 2019-05-23 2022-01-25 Interman Corporation Mobile terminal booth with sound masking function
WO2021079761A1 (ja) * 2019-10-24 2021-04-29 インターマン株式会社 マスキング機能を備えた携帯端末用ブース、マスキングシステムおよびマスキング音発生方法

Also Published As

Publication number Publication date
JP5644122B2 (ja) 2014-12-24

Similar Documents

Publication Publication Date Title
US8861742B2 (en) Masker sound generation apparatus and program
Pätynen et al. Concert halls with strong and lateral sound increase the emotional impact of orchestra music
EP2645361A1 (en) Masker sound generation device, storage medium which stores masker sound signal, masker sound player device, and program
JP2016177204A (ja) サウンドマスキング装置
ES2915843T3 (es) Control de modos acústicos en una sala
Li et al. Primitive auditory memory is correlated with spatial unmasking that is based on direct-reflection integration
JP2012509632A (ja) オーディオ信号を変換するためのコンバータ及び方法。
JP5644122B2 (ja) マスカ音生成装置
JP5446926B2 (ja) マスカ音生成装置およびプログラム
US3535453A (en) Method for synthesizing auditorium sound
Xiang et al. Artificial enveloping reverberation for binaural auralization using reciprocal maximum-length sequences
EP3070709A1 (en) Sound masking apparatus and sound masking method
CN111128208B (zh) 一种便携式激励器
JP5446927B2 (ja) マスカ音生成装置およびプログラム
JP2007256527A (ja) 波形合成装置およびプログラム
JP5691180B2 (ja) マスカ音生成装置およびプログラム
JP6348773B2 (ja) インパルス応答生成装置、インパルス応答生成方法、インパルス応答生成プログラム
McKenzie et al. The auditory perceived aperture position of the transition between rooms
JP2016134767A (ja) オーディオ信号処理装置
US20240040328A1 (en) Information processing device, information processing method, and program
RU2284584C1 (ru) Способ передачи слушателю акустического сигнала и устройство для его осуществления
JP2008076710A (ja) 空間感生成方法と装置及びマスキング装置
JP2024001902A (ja) 音響処理システム及び音響処理方法
CN117351992A (zh) 情感关怀设备及其方法
CN116320899A (zh) 一种发声方法、装置及设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141007

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141020

R150 Certificate of patent or registration of utility model

Ref document number: 5644122

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees