JP6512607B2 - 環境音合成装置、その方法及びプログラム - Google Patents
環境音合成装置、その方法及びプログラム Download PDFInfo
- Publication number
- JP6512607B2 JP6512607B2 JP2016026744A JP2016026744A JP6512607B2 JP 6512607 B2 JP6512607 B2 JP 6512607B2 JP 2016026744 A JP2016026744 A JP 2016026744A JP 2016026744 A JP2016026744 A JP 2016026744A JP 6512607 B2 JP6512607 B2 JP 6512607B2
- Authority
- JP
- Japan
- Prior art keywords
- template
- sound
- environmental
- environmental sound
- reverberation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000007613 environmental effect Effects 0.000 title claims description 424
- 238000000034 method Methods 0.000 title description 23
- 230000005540 biological transmission Effects 0.000 claims description 92
- 238000004458 analytical method Methods 0.000 claims description 46
- 230000015572 biosynthetic process Effects 0.000 claims description 43
- 238000003786 synthesis reaction Methods 0.000 claims description 43
- 230000002194 synthesizing effect Effects 0.000 claims description 27
- 238000001308 synthesis method Methods 0.000 claims description 12
- 230000005236 sound signal Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 description 28
- 238000004364 calculation method Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 23
- 239000012634 fragment Substances 0.000 description 18
- 238000012545 processing Methods 0.000 description 13
- 238000012986 modification Methods 0.000 description 12
- 230000004048 modification Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 238000013507 mapping Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- AFCARXCZXQIEQB-UHFFFAOYSA-N N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]-2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidine-5-carboxamide Chemical compound O=C(CCNC(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)N1CC2=C(CC1)NN=N2 AFCARXCZXQIEQB-UHFFFAOYSA-N 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000005287 template synthesis Methods 0.000 description 2
- HMUNWXXNJPVALC-UHFFFAOYSA-N 1-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)C(CN1CC2=C(CC1)NN=N2)=O HMUNWXXNJPVALC-UHFFFAOYSA-N 0.000 description 1
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 1
- LDXJRKWFNNFDSA-UHFFFAOYSA-N 2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound C1CN(CC2=NNN=C21)CC(=O)N3CCN(CC3)C4=CN=C(N=C4)NCC5=CC(=CC=C5)OC(F)(F)F LDXJRKWFNNFDSA-UHFFFAOYSA-N 0.000 description 1
- YLZOPXRUQYQQID-UHFFFAOYSA-N 3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]propan-1-one Chemical compound N1N=NC=2CN(CCC=21)CCC(=O)N1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F YLZOPXRUQYQQID-UHFFFAOYSA-N 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 241000219095 Vitis Species 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
Description
以下、図1を参照して本発明の環境音伝送システムについて説明する。図1は本発明の環境音伝送システムの構成例を示すブロック図である。図1に示すように、本発明の環境音伝送システムは、伝送元の環境音分析装置と、伝送先の環境音合成装置から構成される。図1Aに示すように、後述する実施例1,2,2’の環境音分析装置は、入力された音響信号(環境音)の音量に対応する情報(環境音量パラメタPj、以下単にパラメタともいう)を抽出し、出力する。後述する実施例4,5の環境音合成装置は、予め記憶された環境音のテンプレートを用いて、入力された環境音量パラメタPjを用いてテンプレートを選択し、選択したテンプレートを用いて環境音を合成し、出力する。また、図1Bに示すように、後述する実施例6の環境音分析装置は、入力された音響信号(環境音)の音量に対応する情報(環境音量パラメタPj、以下単にパラメタPjともいう)と、音響信号(環境音)の残響に対応する情報(環境残響パラメタRPj、以下単にパラメタRPjともいう)とを抽出し、出力する。後述する実施例7,8の環境音合成装置は、予め記憶された環境音のテンプレートを用いて、入力された環境残響パラメタRPjまたは環境音量パラメタPjを用いて、テンプレートを選択し、選択したテンプレートを用いて環境音を合成し、出力する。以下、実施例1において環境音分析装置1、実施例2において環境音分析装置2、実施例2の変形例1において環境音分析装置2’、実施例3において環境音合成装置3、実施例4において環境音合成装置4、実施例5において環境音合成装置5、実施例6において環境音分析装置6、実施例7において環境音合成装置7、実施例8において環境音合成装置8をそれぞれ説明する。また、環境音分析装置1,2,2’と環境音合成装置3、4、5との組み合わせを環境音伝送システム1000、環境音分析装置6と環境音合成装置7,8との組み合わせを環境音伝送システム2000と呼ぶ。
収音部11は伝送元の音を収音する(S11)。ここでは、収音部11には伝送元の拍手音が入力されるものとする。
音量計算部12は、拍手音の音響信号を取得する。音量計算部12が取得する拍手音の音響信号は、所定のサンプリング周波数でサンプリングされた信号列とする。ここで、Xjを第jフレームの音響信号とし、Xj=(xj(1),xj(2),…,xj(N))(Nはフレームあたりのサンプル数)とする。例えば8kHzサンプリングのときに1フレーム20msとすると、N=160である。なお、遅延が短い方が良ければフレームの長さを短くし、遅延が長くなっても良ければ、フレームの長さを長くすれば良い。音量計算部12は、フレーム毎に、入力された拍手音の音響信号の音量に対応する値(以下、「拍手音量に対応する値」ともいう)を求めて出力する。具体的には、音量計算部12は、フレーム毎に、入力された拍手音の音響信号Xj=(xj(1),xj(2),…,xj(N))の平均エネルギー
パラメタ変換部13は、音量計算部12から出力された拍手音量に対応する値を取得する。パラメタ変換部13は、取得した拍手音量に対応する値を量子化し、環境音量パラメタを出力する。具体的には、パラメタ変換部13は、平均エネルギーEjの取りうる範囲(例えばxj(i)(i=1,2,…,N)が符号付き16bitの場合は最小値が0で最大値が2^30となる)をあらかじめ定められた場合の数(例えば16bit)に量子化し、そのインデックスを環境音量パラメタPjとして出力する(S13)。
データ送信部14は、パラメタ変換部13が出力した環境音量パラメタPjを伝送先の環境音合成装置3(または4、5)に送信する(S14)。環境音合成装置3,4,5についてはそれぞれ実施例3,4,5に記載する。
上述の実施例1では、伝送元の環境音の例として拍手音を対象とし、伝送元の拍手音を分析する環境音分析装置1の動作例を説明したが、これに限らず拍手音以外の環境音を対象としても良い。例えば、声援や掛け声などを環境音としても良いし、伝送元で収音される音の中から伝送元会場のメインコンテンツの音を除いた音響信号(雑音を含む)を環境音としても良い。
音量計算部12は、48kHzサンプリングでサンプリングされた信号列であり、1フレーム6サンプル(N=6)で構成される信号列Xj=(xj(1),xj(2),…,xj(6))を取得する。音量計算部12は、フレーム毎に、入力された拍手音響信号Xj=(xj(1),xj(2),…,xj(6))から、平均エネルギー
パラメタ変換部23は、求めた平均エネルギーEjを以下の式により変形した列Fjを求める。
以下、図7、図8を参照して実施例2のパラメタ変換部23に変更を加えた変形例1の環境音分析装置について説明する。図7は本変形例の環境音分析装置2’の構成を示すブロック図である。図8は本変形例の環境音分析装置2’の動作を示すフローチャートである。図7に示すように、本変形例の環境音分析装置2’は、収音部11と、音量計算部12と、パラメタ変換部23’と、データ送信部14とを備える。収音部11、音量計算部12、データ送信部14は実施例2の環境音分析装置2における同一番号の各構成部と同じであるから説明を適宜略する。
パラメタ変換部23’は、図6のようなマッピング演算の代わりに、Fjの取りうる0〜32768の値を直接8bitのシンボルにマッピングするマッピングテーブル23Aを予め備えており、マッピングテーブル23Aを参照してパラメタPjを求める(S23’)。または、パラメタ変換部23’は、Fjの取りうる0〜32768の値をあらかじめビットシフト等により場合の数を減らしてから、マッピングテーブル23Aを用いてパラメタPjを求めてもよい。この場合はマッピングテーブル23Aの大きさを削減できる。Fjはデシベル単位に変換したものを用いてもよい。
上述の実施例2および実施例2の変形例1では、伝送元の環境音の例として拍手音を対象とし、伝送元の拍手音を分析する環境音分析装置2(2’)の動作例を説明したが、これに限らず拍手音以外の環境音を対象としても良い。例えば、声援や掛け声などを環境音としても良いし、伝送元で収音される音の中から伝送元会場のメインコンテンツの音を除いた音響信号(雑音を含む)を環境音としても良い。
データ受信部31は、環境音分析装置から環境音量パラメタPjを受信する(S31)。
テンプレート記憶部33には、拍手音の各音量バリエーションに対して複数の拍手音(1フレーム分)のテンプレートが記憶されている。つまり、テンプレート記憶部33には、iをフレームのインデックスとした場合に、1フレーム分の拍手音を含む環境音のテンプレートTiと当該テンプレートの環境音の音量に対応する情報E’iとが対応付けて記憶されているものとする。なお、テンプレートの環境音の音量に対応する値は、各テンプレートTiを入力として、上記実施例1または2の音量計算部12及びパラメタ変換部13(23)と同じ方法により求めることができる。なお、実施例1または2のどの方法を用いるかは、環境音分析装置と環境音合成装置との間で統一しておくものとする。
残響付加音源合成部32は、入力された環境音量パラメタPjで特定される音量に応じたテンプレートのうちいずれか1つをテンプレート記憶部33からランダムに選択する。つまり、Pj=E’iを満たすE’iに対応づけられているテンプレートTiのうち、いずれか1つをランダムに選択する。残響付加音源合成部32は、選択したテンプレートに環境音量パラメタで特定される音量とその音量に応じた残響特性とを用いて、テンプレートに残響を加え、残響を加えたテンプレートを、必要に応じて前のフレームと補間をして、1フレーム分の音響信号を合成して環境音(この動作例では拍手音)を生成する(S32)。ここでは、環境音量パラメタで特定される音量が大きいほど、伝送元の空間の広いと仮定する。例えば、環境音量パラメタPjの値が所定の閾値よりも小さい場合は、狭い空間であることが想定されるので、図11Aのように、テンプレートに短い残響Hsを畳み込む。また、環境音量パラメタPjの値が閾値以上の場合は、広い空間であることが想定されるので、図11Bのように、テンプレートに短い残響Hsとともに長い残響Hlを畳み込む。所定の閾値は、例えば実験やシュミレーション等により適切な値を調べ、設定すればよい。例えば、20msのフレームあたり環境音量パラメタに8bitのバリエーションがあったとすると、400bit/secで拍手音を伝送できる。なお、音量が大きいほど、残響が長くなるという特性が前述の残響特性に相当する。
再生部34は、残響付加音源合成部32が合成した拍手音を再生する(S34)。
実施例3では、伝送元の環境音の例として拍手音を対象とし、伝送元の拍手音の音量に関するパラメタを取得して、伝送先で拍手音を生成する環境音合成装置3の動作例を説明したが、これに限らず拍手音以外の環境音を対象としても良い。例えば、声援や掛け声や、伝送元で収音される音の中から伝送元会場のメインコンテンツの音を除いた音響信号(雑音を含む)を環境音とし、伝送元の環境音量パラメタが入力され、伝送先で環境音を合成してもよい。
テンプレート記憶部43には、一人の人間による一拍分の拍手音(300ms程度)のテンプレートの複数のバリエーションが記憶されている。本実施例では環境音の例として拍手音を扱うため、拍手音のテンプレートを環境音素片テンプレートのバリエーションのひとつとする。従って、以下では拍手音のテンプレートを環境音素片テンプレートともいう。例えば、異なる人の一拍分の拍手音をそれぞれ異なる環境音素片テンプレートとして記憶しておく。以下、単にテンプレートという場合には、所定フレーム長の複数人による拍手音(環境音)全体を収録したテンプレートを指すものとし、環境音素片テンプレートという場合には、一人の人間による一拍分の拍手音(環境音)のテンプレートを指すものとする。
テンプレート音量記憶部46には、テンプレート記憶部43に記憶されている環境音素片テンプレートの音量に対応する情報(具体的には、実施例1または2の音量計算部12により計算される、平均エネルギー)が記憶されている。なお、1人分の拍手音の音量の差は小さいので、テンプレート記憶部43に記憶されている環境音素片テンプレートのいずれか一つについて計算された平均エネルギーを環境音素片テンプレートの音量に対応する情報として記憶しておいてもよい。また、テンプレート記憶部43に記憶されている全環境音素片テンプレートの平均エネルギーの平均値を、環境音素片テンプレートの音量に対応する情報としてテンプレート音量記憶部46に記憶しておいてもよい。あるいは、予め定めた定数を音量に対応する情報としてテンプレート音量記憶部46に記憶しておいても良い。
人数推定部45は、環境音量パラメタPjに応じて音量のゲイン調整を行うための構成である。人数推定部45は、伝送元から出力された環境音量パラメタPjを取得し、当該環境音量パラメタPjから音量に対応する情報E’jを求める。具体的には、実施例1または2のパラメタ変換部13(23)と逆の処理を行うことにより、音量に対応する情報E’jを得る。人数推定部45は、音量に対応する情報E’jを環境音素片テンプレートの音量に対応する情報で除算した値の整数値(小数点以下を四捨五入、または切り捨てた値)を拍手の人数Mとして出力する(S45)。
残響付加音源合成部42は、テンプレート記憶部43から環境音素片テンプレートをランダムに選択して、環境音量パラメタで特定される音量とその音量に応じた残響特性とを用いて、テンプレートに残響を加え、残響を加えた環境音素片テンプレートを合成することで環境音を生成する(S42)。ここでは(環境音量パラメタで特定される音量に応じた)人数に応じて空間の広さが変化すると仮定する。例えば、10人(M=10)程度の拍手であれば10人程度の人が入れる空間の大きさに応じた残響を加え、100人(M=100)程度の拍手であれば100人程度の人が入れる空間の大きさに応じた残響を加える。なお、空間の大きさに応じて残響の長さが変化するという特性が前述の残響特性に相当する。例えば、コンサート会場等における、観客間の間隔は50〜70cm程度なので、その値から空間の大きさを推定する。例えば、円形、正方形、直線、格子状または、それらの組合せからなる形状に、50〜70cmの間隔で人間を配置したとして、空間の大きさを推定する。人数が少ない場合、例えば、環境音量パラメタPjの値が小さく、Mの値が閾値よりも小さい場合は、狭い空間であることが想定されるので、図11Aのように、環境音素片テンプレートに短い残響Hsを畳み込む。人数が多い場合、例えば、環境音量パラメタPjの値が大きく、Mの値が閾値以上の場合は、広い空間であることが想定されるので、図11Bのように、環境音素片テンプレートに短い残響Hsとともに長い残響Hlを畳み込む。
実施例4は、伝送元の伝送元の環境音の例として拍手音を対象とし、伝送元の拍手音の音量に関するパラメタを取得して、伝送先で拍手音を生成する環境音合成装置4を説明したが、これに限らず拍手音以外の環境音を対象としても良い。上述では、一人の人間による一拍分の拍手音(300ms程度)のテンプレートを環境音素片テンプレートの例として示したが、これに限らず、たとえば、一人の人間による一拍分の声援、掛け声のテンプレートを環境音素片テンプレートとしてもよい。
テンプレート記憶部53には、拍手音の各音量バリエーションに対して残響を加えた複数の拍手音(以下「残響付加済の拍手音」ともいう、これを1フレーム分)のテンプレートが記憶されている。つまり、テンプレート記憶部53には、iをフレームのインデックスとした場合に、1フレーム分の残響付加済の拍手音を含む環境音のテンプレートTiと当該テンプレートの環境音の音量に対応する情報E’iとが対応付けて記憶されているものとする。ここでは、環境音量パラメタで特定される音量が大きいほど、伝送元の空間の広いと仮定する。そのため、音量が大きいほど、伝送元の空間の広く、残響は長くなる。つまり、本実施例のテンプレート記憶部53に記憶されるテンプレートには、既に、残響特性(音量が大きいほど、残響は長くなるという特性)に応じた残響が加えられていると言える。
残響付加音源合成部52は、入力された環境音量パラメタPjで特定される音量に応じた(残響付加済の拍手音の)テンプレートをテンプレート記憶部53から選択し、選択したテンプレートを合成して環境音を生成し(S52)、出力する。
例えば、二つの閾値Th1とTh2(Th1<Th2)を設け、E’i<Th1となるテンプレートを短い残響が畳み込まれたテンプレートのグループ(以下DB1-1ともいう)に、E’i>Th2となるテンプレートを長い残響が畳み込まれたテンプレートのグループ(以下DB1-3ともいう)に、Th1≦E’i≦Th2となるテンプレートを中くらいの残響が畳み込まれたテンプレートのグループ(以下DB1-2ともいう)に分類する。
残響付加音源合成部52は、Pj<Th1のときにDB1-1からテンプレートを選択し、Th1≦Pji≦Th2のときにDB1-1及びDB1-2からテンプレートを選択し、Th2<PjのときにDB1-1,DB1-2及びDB1-3からテンプレートを選択する。
閾値で完全に分けずに、音量に応じて各DBから選ばれるテンプレートに確率の重みを付けて選択しても良い。
例えば、二つの閾値Th1とTh2(Th1<Th2)を設け、E’i<Th1となるテンプレートを短い残響が畳み込まれたテンプレートのグループ(以下DB2-1ともいう)に、E’i≦Th2となるテンプレートを短い残響と中くらいの残響とが畳み込まれたテンプレートのグループ(以下DB2-2ともいう)に、E’i>Th2となるテンプレートを短い残響と中くらいの残響と長い残響とが畳み込まれたテンプレートのグループ(以下DB2-3ともいう)に分類する。
残響付加音源合成部52は、Pj<Th1のときにDB2-1からテンプレートを選択し、Th1≦Pji≦Th2のときにDB2-2からテンプレートを選択し、Th2<PjのときにDB2-3からテンプレートを選択する。
閾値で完全に分けずに、音量に応じて各DBから選ばれるテンプレートに確率の重みを付けて選択しても良い。例えば、選択例1−2と同様の方法により選択する。
空間計算部65は、拍手音の音響信号を取得する。空間計算部65は、フレーム毎に入力された拍手音の音響信号Xj=(xj(1),xj(2),…,xj(N))の残響に対応する値を求め(S65)、出力する。具体的には、空間計算部65は、フレーム毎に、入力された拍手音の音響信号Xj=(xj(1),xj(2),…,xj(N))の直接音と残響音との平均エネルギー比REjを計算し、残響に対応する値として出力する。例えば、参考文献1の残響制御技術を用いて音響信号から直接音と残響音との平均エネルギー比REjを計算することができる。
(参考文献1)木下慶介、中谷智広、三好正人、“実環境音声処理-音声認識に適した残響除去収音”、NTT技術ジャーナル、2007、Vol.19、No.6
また、直接音と残響音との平均エネルギー比REjに代えて、直接音の平均エネルギーと残響音の平均エネルギーとの組合せ(等価な値)を残響に対応する値として出力してもよい。残響に対応する値は、伝送元の空間の残響の特徴を示すような値であれば、上述の値以外の値でもよい。また、図示しないカメラ等を使って(または人手により)、横並びか正方形か円形かなどの配置に関する情報を残響に対応する値の一部として付加しても良い。
パラメタ変換部63は、音量計算部12から出力された拍手音量に対応する値及び残響に対応する値を取得する。パラメタ変換部13は、取得した拍手音量に対応する値及び残響に対応する値を量子化し、環境音量パラメタ及び環境残響パラメタを出力する。環境音量パラメタについては、実施例1で説明した通りである。例えば、パラメタ変換部13は、直接音と残響音との平均エネルギー比REjの取りうる範囲をあらかじめ定められた場合の数(例えば16bit)に量子化し、そのインデックスを環境残響パラメタRPjとして出力する(S63)。
データ受信部71は、環境音分析装置から環境音量パラメタPj及び環境残響パラメタRPjを受信する(S71)。
テンプレート記憶部73には、拍手音の各残響バリエーションに対して複数の拍手音(1フレーム分、残響バリエーションに対するものなので、当然、残響付加済の拍手音である)のテンプレートが記憶されている。つまり、テンプレート記憶部73には、iをフレームのインデックスとした場合に、1フレーム分の残響付加済の拍手音を含む環境音のテンプレートTiと当該テンプレートの環境音の残響に対応する情報R’iとが対応付けて記憶されているものとする。なお、当該テンプレートの環境音の残響に対応する情報R’iは、例えば、空間計算部65において、残響に対応する値を計算する際に用いた方法と同じ方法を用いて、テンプレートから計算すればよい。
残響付加音源合成部72は、入力された環境残響パラメタRPjで特定される残響に応じたテンプレートのうちいずれか1つをテンプレート記憶部73からランダムに選択する。つまり、RPj=R’iを満たすR’iに対応づけられているテンプレートTiのうち、いずれか1つをランダムに選択する。残響付加音源合成部72は、選択したテンプレートを、必要に応じて前のフレームと補間をして、1フレーム分の音響信号を合成して環境音(この動作例では拍手音)を生成する(S72)。例えば、20msのフレームあたり環境残響パラメタに8bitのバリエーションがあったとすると、400bit/secで拍手音を伝送できる。
例えば、二つの閾値Th1とTh2(Th1<Th2)を設け、R’i<Th1となるテンプレートを短い残響が畳み込まれたテンプレートのグループ(以下DB3-1ともいう)に、R’i>Th2となるテンプレートを長い残響が畳み込まれたテンプレートのグループ(以下DB3-3ともいう)に、Th1≦R’i≦Th2となるテンプレートを中くらいの残響が畳み込まれたテンプレートのグループ(以下DB3-2ともいう)に分類する。
残響付加音源合成部72は、RPj<Th1のときにDB3-1からテンプレートを選択し、Th1≦RPji≦Th2のときにDB3-2からテンプレートを選択し、Th2<RPjのときにDB3-3からテンプレートを選択する。
閾値で完全に分けずに、環境残響パラメタRPjに応じて各DBから選ばれるテンプレートに確率の重みを付けて選択しても良い。なお、本実施例と実施例2及びその変形例とを組合せてもよい。
残響付加音源合成部82は、入力された環境音量残響パラメタPjで特定される音量に応じたテンプレートのうちいずれか1つをテンプレート記憶部33からランダムに選択する。つまり、Pj=E’iを満たすE’iに対応づけられているテンプレートTiのうち、いずれか1つをランダムに選択する。残響付加音源合成部82は、選択したテンプレートに環境残響パラメタRPjで特定される残響を加え、残響を加えたテンプレートを、必要に応じて前のフレームと補間をして、1フレーム分の音響信号を合成して環境音(この動作例では拍手音)を生成する(S82)。例えば、環境残響パラメタRPjが直接音と残響音との平均エネルギー比を量子化したものである場合、平均エネルギー比が大きいほど残響が長くなるため、所定の閾値よりも環境残響パラメタRPjの値が小さい場合にはテンプレートに短い残響Hsを畳み込み、環境残響パラメタRPjの値が閾値以上の場合はテンプレートに短い残響Hsとともに長い残響Hlを畳み込む。
実施例7では、環境音分析装置により分析された部屋の広さ・大きさ(容積)に関連する情報である環境残響パラメタRPjを用いて残響畳み込み済のテンプレートを選択したが、実施例4のように残響が含まれないテンプレートを用いて、環境残響パラメタRPjに応じて特定される長さ、分布の残響を畳み込むこととしても良い。具体的には、環境残響パラメタRPjに基づき、残響の最大値を求め、所定の残響の最小値から求めた残響の最大値までの範囲の中から、ランダムに、環境音量パラメタPjに基づく個数の残響の長さを決定し、決定した各長さに応じてテンプレートに残響を畳み込むこととしても良い。
Claims (8)
- 環境音分析装置から出力された伝送元の音響信号の音量に関する環境音量パラメタを取得して環境音を生成する環境音合成装置であって、
前記環境音分析装置から出力された前記環境音量パラメタを取得するデータ受信部と、
1フレーム分の環境音のテンプレート(以下、テンプレートという)と当該テンプレートの環境音の音量に対応する情報とを対応付けて記憶するテンプレート記憶部と、
前記環境音量パラメタで特定される音量に応じたテンプレートを前記テンプレート記憶部から選択し、前記環境音量パラメタで特定される音量とその音量に応じた残響特性とを用いて、前記選択したテンプレートに残響を加え、当該残響を加えたテンプレートを合成することで環境音を生成する残響付加音源合成部とを含む、
環境音合成装置。 - 請求項1の環境音合成装置であって、
前記残響付加音源合成部は、伝送元に存在する音源の個数に応じた空間の大きさに基づく残響を加える、
環境音合成装置。 - 環境音分析装置から出力された伝送元の音響信号の音量に関する環境音量パラメタを取得して環境音を生成する環境音合成装置であって、
前記環境音分析装置から出力された前記環境音量パラメタを取得するデータ受信部と、
1フレーム分の残響を加えた環境音のテンプレート(以下、テンプレートという)と当該テンプレートの環境音の音量に対応する情報とを対応付けて記憶するテンプレート記憶部と、
前記環境音量パラメタで特定される音量に応じたテンプレートを前記テンプレート記憶部から選択し、前記選択したテンプレートを合成して環境音を生成する残響付加音源合成部とを含む、
環境音合成装置。 - 環境音分析装置から出力された伝送元の空間の大きさに基づく音響信号の残響に関する環境残響パラメタを取得して環境音を生成する環境音合成装置であって、
前記環境音分析装置から出力された前記環境残響パラメタを取得するデータ受信部と、
1フレーム分の残響を加えた環境音のテンプレート(以下、テンプレートという)と当該テンプレートの環境音の残響に対応する情報とを対応付けて記憶するテンプレート記憶部と、
前記環境残響パラメタで特定される残響に応じたテンプレートを前記テンプレート記憶部から選択し、前記選択したテンプレートを合成して環境音を生成する残響付加音源合成部とを含む、
環境音合成装置。 - 伝送元の音響信号の音量に関する環境音量パラメタを取得して環境音を生成する環境音合成方法であって、
データ受信部が、前記環境音量パラメタを取得するデータ受信ステップと、
残響付加音源合成部が、1フレーム分の環境音のテンプレート(以下、テンプレートという)と当該テンプレートの環境音の音量に対応する情報とを対応付けて記憶するテンプレート記憶部から前記環境音量パラメタで特定される音量に応じたテンプレートを選択し、前記環境音量パラメタで特定される音量とその音量に応じた残響特性とを用いて、前記選択したテンプレートに残響を加え、当該残響を加えたテンプレートを合成することで環境音を生成する残響付加音源合成ステップとを含む、
環境音合成方法。 - 伝送元の音響信号の音量に関する環境音量パラメタを取得して環境音を生成する環境音合成方法であって、
データ受信部が、前記環境音量パラメタを取得するデータ受信ステップと、
残響付加音源合成部が、1フレーム分の残響を加えた環境音のテンプレート(以下、テンプレートという)と当該テンプレートの環境音の音量に対応する情報とを対応付けて記憶するテンプレート記憶部から、前記環境音量パラメタで特定される音量に応じたテンプレートを選択し、前記選択したテンプレートを合成して環境音を生成する音源合成ステップとを含む、
環境音合成方法。 - 伝送元の空間の大きさに基づく音響信号の残響に関する環境残響パラメタを取得して環境音を生成する環境音合成方法であって、
データ受信部が、前記環境残響パラメタを取得するデータ受信ステップと、
残響付加音源合成部が、1フレーム分の残響を加えた環境音のテンプレート(以下、テンプレートという)と当該テンプレートの環境音の残響に対応する情報とを対応付けて記憶するテンプレート記憶部から、前記環境残響パラメタで特定される残響に応じたテンプレートを選択し、前記選択したテンプレートを合成して環境音を生成する音源合成ステップとを含む、
環境音合成方法。 - 請求項1から請求項4の何れかの環境音合成装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016026744A JP6512607B2 (ja) | 2016-02-16 | 2016-02-16 | 環境音合成装置、その方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016026744A JP6512607B2 (ja) | 2016-02-16 | 2016-02-16 | 環境音合成装置、その方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017146391A JP2017146391A (ja) | 2017-08-24 |
JP6512607B2 true JP6512607B2 (ja) | 2019-05-15 |
Family
ID=59682225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016026744A Active JP6512607B2 (ja) | 2016-02-16 | 2016-02-16 | 環境音合成装置、その方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6512607B2 (ja) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2698942B2 (ja) * | 1991-06-26 | 1998-01-19 | 株式会社河合楽器製作所 | 楽音発生装置 |
JPH09127983A (ja) * | 1995-10-31 | 1997-05-16 | Sony Corp | 音声合成装置および音声合成方法、並びに記憶媒体 |
JPH10340080A (ja) * | 1997-06-06 | 1998-12-22 | Casio Comput Co Ltd | 音響効果制御装置 |
JP2000148139A (ja) * | 1998-11-10 | 2000-05-26 | Roland Corp | 効果付加装置 |
JP3707457B2 (ja) * | 2002-03-01 | 2005-10-19 | ヤマハ株式会社 | 改修プラン作成支援装置、改修プラン作成支援方法およびそのプログラム |
JP4127094B2 (ja) * | 2003-03-26 | 2008-07-30 | ヤマハ株式会社 | 残響音生成装置およびプログラム |
ATE539431T1 (de) * | 2004-06-08 | 2012-01-15 | Koninkl Philips Electronics Nv | Kodierung von tonsignalen mit hall |
EP1794744A1 (en) * | 2004-09-23 | 2007-06-13 | Koninklijke Philips Electronics N.V. | A system and a method of processing audio data, a program element and a computer-readable medium |
JP6095223B2 (ja) * | 2012-08-27 | 2017-03-15 | 日本電信電話株式会社 | 環境音合成装置、環境音伝送システム、環境音合成方法、環境音伝送方法、プログラム |
-
2016
- 2016-02-16 JP JP2016026744A patent/JP6512607B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017146391A (ja) | 2017-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4742087B2 (ja) | オーディオ信号の2重変換符号化 | |
KR101443568B1 (ko) | 오디오 디코더 | |
JP5291096B2 (ja) | オーディオ信号処理方法及び装置 | |
JP5468092B2 (ja) | 高速格子ベクトル量子化 | |
JP2016510905A (ja) | ビットストリームにおける球面調和係数および/または高次アンビソニックス係数の指定 | |
JP2012032803A (ja) | フルバンド拡張可能なオーディオコーデック | |
JP4033840B2 (ja) | 音声ミキシング方法、音声ミキシング装置、音声ミキシングプログラム及びこれを記録した記録媒体 | |
JP6095223B2 (ja) | 環境音合成装置、環境音伝送システム、環境音合成方法、環境音伝送方法、プログラム | |
JP6160072B2 (ja) | オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置 | |
JP2003140692A (ja) | 符号化装置及び復号化装置 | |
JPH11242499A (ja) | 音声符号化/復号化方法および音声信号の成分分離方法 | |
JP6443841B2 (ja) | 環境音伝送システム及び環境音伝送方法 | |
TWI834163B (zh) | 三維音頻訊號編碼方法、裝置和編碼器 | |
JP6512607B2 (ja) | 環境音合成装置、その方法及びプログラム | |
JP2005512134A (ja) | リアルタイム時間伸縮用パラメータ付きデジタルオーディオ | |
JP4317355B2 (ja) | 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム | |
TW202305785A (zh) | 三維音訊訊號編碼方法、裝置、編碼器和系統 | |
TW202123220A (zh) | 使用方向性元資料之多通道音頻編碼及解碼 | |
JP6887620B2 (ja) | 環境音合成システム、その方法、及びプログラム | |
WO2022242481A1 (zh) | 三维音频信号编码方法、装置和编码器 | |
WO2024024468A1 (ja) | 情報処理装置および方法、符号化装置、音声再生装置、並びにプログラム | |
JP2024518846A (ja) | 3次元オーディオ信号符号化方法および装置、ならびにエンコーダ | |
Ratnarajah | Efficient learning-based sound propagation for virtual and real-world audio processing applications | |
KR100264389B1 (ko) | 키변환 기능을 갖는 컴퓨터 음악반주기 | |
Dong et al. | Robustness analysis of a digital audio steganographic method based on phase manipulation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20171121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181022 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181030 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6512607 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |