JP2008060725A - 音像定位強調再生方法、及びその装置とそのプログラムと、その記憶媒体 - Google Patents
音像定位強調再生方法、及びその装置とそのプログラムと、その記憶媒体 Download PDFInfo
- Publication number
- JP2008060725A JP2008060725A JP2006232598A JP2006232598A JP2008060725A JP 2008060725 A JP2008060725 A JP 2008060725A JP 2006232598 A JP2006232598 A JP 2006232598A JP 2006232598 A JP2006232598 A JP 2006232598A JP 2008060725 A JP2008060725 A JP 2008060725A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- band
- sound
- parameter value
- histogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Stereophonic System (AREA)
Abstract
【解決手段】帯域別チャネル間パラメータ値差検出手段4から入力されるチャネル間パラメータ値差ΔLev(ωi)のヒストグラムを、ヒストグラム算出部30で作成する。作成したヒストグラムの最大階級をヒストグラム最大階級算出部31で算出する。ヒストグラム最大階級算出部31で算出された最大階級は、ヒストグラム最大階級保存部32に保存される。保存された複数個の最大階級の値から、音源位置偏り判定部33が、その最大階級の値から違う位置にある音源として識別すべきかを判定する。識別すべきと判定された場合、閾値算出部34が新たな閾値LevTh1とLevTh2を算出して音源信号判定手段6に出力する。
【選択図】図3
Description
ステレオマイクロホン120の信号Lと信号Rは、それぞれFFT121で周波数帯域信号XL(ωi)とXR(ωi)とに変換・分割される。これら両周波数帯域信号の同一帯域毎に、ステレオマイクロホン120の位置に起因して生ずる信号Lと信号Rの音のパラメータの値の差を、帯域別チャネル間パラメータ値差検出手段122で算出する。算出された音のパラメータ値差に基づき、判定手段123が周波数帯域信号の各帯域に、いずれの音源から入力された音が主に含まれるかを判定する。その判定情報に基づき各周波数帯域信号XL(ωi)とXR(ωi)に重み値を乗算して、各音源と対応付けされた周波数帯域信号YL(ωi)とYC(ωi)とYR(ωi)を生成する。
音源と対応付けされた周波数帯域信号YL(ωi)とYC(ωi)とYR(ωi)は、それぞれIFFT124で時間領域の信号に変換されて、音源の位置と対応付けられたそれぞれの拡声手段Sp.L、Sp.C、Sp.Rから再生される。したがって聴取者の位置によらず、全ての聴取者に音の方向を正しく知覚させることができる。
青木、古屋、片岡、クローストークキャンセラを用いたステレオ再生の受聴位置拡大、日本音響学会秋季研究発表会、1‐2‐15、2005.9
通信会議システムでは、マイクロホンは一般に会議机上に置かれるが、発話者に対してマイクロホンを左右対称の位置に正確に配置することは、机上に置かれる物との関係で難しい場合が多い。図13に、70cmの間隔を空けて横一列に並んだ3人の発話者La、Cb、Rcに対して、発話者と50cmの間隔を空けて並行に配置される2個のマイクロホンMic.LとMIC.Rが、一方の発話者Rc側に偏って配置された場合を示す。
それら各収音信号を帯域分割手段により、各帯域の周波数帯域信号が主として一つの音源からの信号成分になる程度にそれぞれ複数の周波数帯域に分割する。
帯域分割手段で分割された2個の収音信号の同一帯域毎に、2個のマイクロホンの位置に起因して生ずる音のパラメータの値の差を帯域別チャネルパラメータ値差として帯域別チャネル間パラメータ値差検出手段により検出する。
音源信号判定手段により、帯域別チャネル間パラメータ値差検出手段から入力された帯域別チャネル間パラメータ値差と、閾値推定手段から入力された閾値に基づき、周波数帯域信号の各帯域がいずれの音源から入力された音を主に含むかを判定してその音源方向領域を判定し、その判定情報を重み乗算手段に出力する。
音源信号合成手段により、重み乗算手段で重み付けされた出力用音源帯域信号が、判定音源方向領域ごとに時間波形に戻され、受聴者に音源方向領域を区別できる様に配置された拡声手段へ、音源信号として出力される。
音源信号判定手段6は、各帯域別チャネル間パラメータ値差ΔLev(ωi)と閾値LevTh1及び閾値LevTh2とをそれぞれ比較して、各帯域ごとに周波数帯域信号XL(ωi)とXR(ωi)がいずれの音源から入力された音を主に含むかを判定してその音源方向領域を判定し、その判定情報Res(ωi),(i=1,…,N)を重み乗算手段7に出力する。
図2に実施例1の音像定位強調再生装置の全体の動作フローを示して動作の流れを説明する。
音像定位強調再生装置が動作を開始すると、最初に音源方向領域Lfと音源方向領域Cfとを区別する閾値LevTh1と、音源方向領域Rfと音源方向領域Cfとを区別する閾値LevTh2と、に初期値が設定される。この初期値は、マイクロホンMLとMRとが、例えば音源に対して左右対称で所定の距離離れた位置に配置された場合の閾値LevTh1とLevTh2である(ステップS20)。
閾値LevTh1とLevTh2が設定された後に、帯域分割手段3は、マイクロホンMLとMRの収音信号を周波数帯域の信号XL(ωi)とXR(ωi)に変換・分割する帯域分割処理を行う(ステップS21)。
次に帯域別チャネル間パラメータ値差ΔLev(ωi)に基づいて閾値推定処理を行う(ステップS23)。この実施例1では、閾値推定処理が逐次行われ、新たな閾値LevTh1,LevTh2が求まればその都度、閾値は更新される(ステップS23b)。閾値計算が終了するまでは、前の閾値LevTh1,LevTh2で動作する(ステップS23a)。したがって、動作開始直後は、上記した初期値の閾値LevTh1,LevTh2で動作する。
以上述べた動作フローの中で、実施例1は、従来技術として示した非特許文献1に開示された技術に対して、閾値推定処理S23が、閾値を更新する点が新しい。したがって、マイクロホンMLとMRとが音源に対して左右非対称に配置されたとしても、そのマイクロホンの配置に合わせて閾値が更新されるので、聴取者に正確な定位感を提供することが出来る。
以降にこの発明の新しい部分に関する動作を更に詳しく説明する。
図1を参照して音源とマイクロホンとの位置関係を説明する。
所定の間隔を空けて配置されたマイクロホンMLとMRの前方に距離を置いて、それぞれ所定間隔を空けて横方向に3個の音源LsとCsとRsが並んでいる。マイクロホンML側にある音源を音源Lsとし、マイクロホンMLに収音される信号をsLL(n)、マイクロホンMRに収音される信号をsLR(n)とする。マイクロホンMR側にある音源を音源Rsとし、マイクロホンMLに収音される信号をsRL(n)、マイクロホンMRに収音される信号をsRR(n)とする。マイクロホンMLとMRとの間にある音源を音源Csとし、マイクロホンMLに収音される信号をsCL(n)、マイクロホンMRに収音される信号をsCR(n)とする。
このような関係をもって収音される2個のマイクロホンMLとMRからの収音信号XL(n)とXR(n)を、帯域分割手段3でそれぞれN個の帯域に分割する。
このΔLev(ωi)の大小関係を利用することで、閾値推定手段5が閾値を算出する。その閾値推定手段5の機能構成ブロック図を図3に示して更に詳しく動作を説明する。
閾値推定手段5は、まず始めにチャネル間パラメータ値差ΔLev(ωi)のヒストグラムを、ヒストグラム算出部30で算出する。次に作成したヒストグラムの最大階級をヒストグラム最大階級算出部31で生成する。
ヒストグラム最大階級算出部31で算出された最大階級は、ヒストグラム最大階級保存部32に保存される。保存された複数の最大階級の値から、音源位置偏り判定部33が、音源がマイクロホンML,MRに対して偏っているか否かを判定する。音源が偏っていると判定された場合は、その偏りの判定に用いた最大階級の値を用いて閾値推定手段5が新たな閾値LevTh1又は及びLevTh2を算出して音源信号判定手段6に出力する。その新たな閾値LevTh1又は及び LevTh2を用いて、音源信号判定手段6が音源方向領域を区分けするので、音源位置に対応した音像定位感を提供することが可能になる。
閾値推定手段5の機能構成ブロックの各ブロックの動作を順に説明する。
ヒストグラム算出部30の動作フローを図4に示す。チャネル間パラメータ値差ΔLev(ωi)がチャネル間レベル値差ΔLev(ωi)の場合であり、このチャネル間レベル値差ΔLev(ωi)は、上記したように一般の会議室であれば、−20dB〜20dBの範囲に分布するので、ヒストグラムの階級を例えば1dBとしてΔLev(ωi)のヒストグラムを算出する。
全帯域間で平滑化したチャネル間レベル差ΔLev00でヒストグラムを算出する例を説明したが、このように全ての帯域のチャネル間パラメータ値差ΔLev(ωi)でヒストグラムを算出しても良いし、音声のパワーの大きな例えば100Hz〜4KHzの範囲、あるいは代表的な複数の帯域について平滑化した値を用いても良い。平滑化することで、雑音等の影響を受け難くすることが出来る。
このように帯域別チャネル間パラメータ値差検出手段4が出力するチャネル間パラメータ値差ΔLev(ωi)は、種々の変更が可能である。
そのチャネル間パラメータ値差ΔLev(ωi)のヒストグラムがヒストグラム算出部30で算出されると、次にヒストグラム最大階級算出部31が動作する。
ヒストグラム最大階級算出部31は、ヒストグラム算出部30で算出されたヒストグラムが最大値をとる階級SSを算出する。ヒストグラム最大階級算出部31の動作フローを図5に示す。
ステップS50で変数hとXXを0に初期化する。ステップS52で、ヒストグラムの階級0〜40の頻度が順に読み出され、その都度、頻度hmat0[h]は、変数ddata0に代入される。そして変数ddata0は、その都度、ヒストグラムの最大値であるXXと比較され、ddata0がXXより大きい場合にXXはddata0に書き換えられる(ステップS54)。そして、この時のヒストグラムの階級を表すhがSSに代入される(ステプS55)。
この動作をhが40になるまで繰り返す(ステップS51〜S56)と、ヒストグラムの最大値をとる階級を表す変数SS=ヒストグラムが最大値をとる階級hとなる。ヒストグラムの最大頻度の階級を表す変数SSが確定すると、ヒストグラム最大階級保存部32が動作する。ヒストグラム最大階級算出部31は、フレーム毎に動作する。
ヒストグラム最大階級保存部32は、ヒストグラム最大階級を複数個保存する。保存する個数は、音源方向領域を区別する数と同じ、または、1〜2個多い位の値で良い。例えば、音源方向領域を3分割する場合には、保存する個数は3乃至5個程度でよい。
Smax3=Smax2の場合は、1個の音源しか存在しないので、次のフレームの処理へ移行して(ステップS63)、図4〜図6の動作を繰り返す。
図7に音源位置偏り判定部33と閾値算出部34の動作フローを示す。Smax3≠Smax2ということは、音源が2個観測されたことを意味する。そしてそのSmax3とSmax2の値から、音源の位置を推定することが出来る。Smax3及びSmax2が例えば5dB以上20dB未満の値のとき、その2個の音源はマイクロホン対して左側に偏っていることを示す。同様に、例えば−20dB以上−5dB以下程度の値の時は、逆に右側に偏っていることを示す。Smax3及びSmax2が例えば−5dBより大きく5dB未満程度の値のときは、2個の音源はマイクロホンに対して真ん中付近に位置していることを示す。
上記した説明では、Smax1乃至Smax3はヒストグラムの階級である0〜40であるが、これはチャネル間パラメータ値差ΔLev(ωi)の−21dB〜20dBに一対一に対応している。図7は、Smax3とSmax2がチャネル間パラメータ値差ΔLev(ωi)であるとして書かれている。
Smax2がSmax3より大きい場合は、Smax2の音源がマイクロホンに対して左側に位置するので、閾値LevTh1,LevTh2は逆に操作される(ステップS81、S82)。この場合は、Smax2の音源が音源方向領域Lfに、Smax3の音源が音源方向領域Rfに区別される。
3個の音源がマイクロホンに対して左に偏っている場合は、Smax3、Smax2、Smax1の中の最大値と最小値の間に、音源方向領域Cfと音源方向領域Rfとを区別する閾値LevTh1を式(4)に示すように設定する。
LevTh1=(max(Smax1,Smax2,Smax3)+min(Smax1,Smax2,Smax3))/2
式(4)
この時、音源方向領域Cfと音源方向領域Rfを区別する閾値LevTh2は初期値のままとされる。
3個の音源がマイクロホンに対して中央付近に偏っている場合は、Smax3、Smax2、Smax1の中の最大値に当たるものが、マイクロホンに対して最も左側に位置する音源である。したがって、音源方向領域Cfと音源方向領域Lfを区別する閾値LevTh1を、式(5)に示す様にその最大値よりも例えば1小さな値に設定する。例えばdmax1=1とする。
LevTh1=max(Smax1,Smax2,Smax3)−dmax1 式(5)
LevTh2=min(Smax1,Smax2,Smax3)+dmax1 式(6)
このようにすると、Smax3〜Smax1の中の最大値を示す音源は音源方向領域Lfに、最小値を示す音源は音源方向領域Rfに、中間の値を示す音源は音源方向領域Cfにそれぞれ区別される。
以上述べたように閾値推定手段5が動作することで、逐次連続的に音源方向領域を区別する閾値LevTh1とLevTh2が更新される。
音源信号判定手段6及び重み乗算手段7及び音源信号合成手段8の動作は、従来技術で説明した非特許文献1に開示された発明と同一であるので、説明は簡単に行う。
音源信号判定手段6の動作フローを図8に示す。音源信号判定手段6は、閾値推定手段5で逐次更新される閾値を用いて、帯域別チャネル間パラメータ値差検出手段4が出力する帯域(ωi)ごとのチャネル間パラメータ値差ΔLev(ωi)を評価し、各帯域がいずれの音源の信号を主に含むか判定する。
ステップS84でΔLev(ωi)が閾値LevTh1より小さいと判定されると、次にステップS86で閾値LevTh2より小さいか判定され、小さい場合その帯域(ωi)は音源Rsの音を主に含むと判定される(Res(ωi)=R、ステップS87)。
ステップS86でΔLev(ωi)が閾値LevTh2より小さく無いと判定された帯域は、音源Csの音を主に含むと判定される(Res(ωi)=C、ステップS88)。
音源方向領域が判定された全帯域(ω1)〜(ωN)の判定結果Res(ω1)〜Res(ωN)は重み乗算手段7に出力される。
実施例1の場合、重み乗算手段7は、音源信号判定手段6の出力する帯域毎の判定結果に基づき、3個の拡声手段9a〜9cそれぞれに対する出力用音源帯域信号を生成する。
重み乗算手段7の動作フローを図9に示す。
収音信号XL(n)とXR(n)を、帯域分割手段3で周波数帯域信号に変換・分割したXL(ωi),(i=1,…,N)とXR(ωi),(i=1,…,N)の各帯域の信号に対して、音源信号判定手段6から同一帯域の判定結果Res(ω1)〜Res(ωN)を参照して出力用音源帯域信号を生成する。
聴取者から見て中央に配置される拡声手段9b用の同帯域の出力音源帯域信号YC(ωi)は、マイクロホンMLとMRに同じ大きさで受音されるため、XL(ωi)とXR(ωi)に重み値αの半分の値を乗算して出力音源帯域信号YC(ωi)を生成する(ステップS93)。
音源方向領域がRes(ωi)=Rと判定された帯域については、Res(ωi)=Lと判定された場合と同じ考え方で、上記したRes(ωi)=Lの場合のYL(ωi)とYR(ωi)の関係が逆転する。
音源信号合成手段8は、各拡声手段9a〜9c用に重み付けされた出力音源帯域信号を時間波形に変換して各拡声手段9a〜9cに出力する。L出力用音源帯域信号生成部7aで重み付けされたL出力用音源帯域信号YL(ωi),(i=1,…,N)は、L音源信号合成部8aで逆フーリエ変換により時間波形に戻され、聴取者の左側前方に配置される拡声手段9aの駆動信号とされる。
R出力用音源帯域信号生成部7cで重み付けされたR出力用音源帯域信号YR(ωi),(i=1,…,N)は、R音源信号合成部8cで逆フーリエ変換により時間波形に戻され、聴取者の左側前方に配置される拡声手段9cの駆動信号とされる。
例えば無指向性マイクを2本用い、2本のマイクの間隔を広げられない場合は、信号の差がレベル差に現れ難くなる。一方、マイクロホンの間隔が音の1波長を越えない周波数帯においては、位相の方が信号の差を求め易い。
そこで低い周波数帯域では位相差、高い帯域ではレベル差をチャネル間パラメータ値差として用いるこの発明の実施例2を図10に示す。図10は先に説明した実施例1の動作フローに対して、帯域別チャネル間パラメータ値差検出処理S22が低い帯域では位相差で、高い帯域ではレベル差で行われる点だけが異なる。位相差とレベル差を切替える帯域は、マイクロホンMLとMRの間隔に依存する。
その切替えを、マイクロホンMLとMRの間隔に相当する周波数の帯域を所定値に設定してステップS221で行うことで、低い周波数帯域は位相差検出(ステップS222)、高い周波数帯域はレベル差検出(ステップS223)でチャネル間パラメータ値差が算出される。
このように周波数帯域によって、チャネル間パラメータ値差の算出方法を切替えることによって、音源方向領域の検出精度を高めることが可能である。
この発明の音像定位強調再生方法で、音源方向領域を適切に分割でき、良好な定位感が得られるかを調べるために主観評価実験を行った。
残響時間が300msの屋内に、3個の音源を横一列に互いに70cm離して配置し、2個のバウンダリーマイクロホンを使用した。被験者は、3個の音源に対応する位置に配置された左右のスピーカを両端として、その間を5分割した箇所に貼られたラベルを目安に、音像が聞こえて来た位置をそのラベルを選択して回答した。音源は、16bit32KHzサンプリングで収録された男性話者2名、女性話者1名の音声(各5秒程度)をスピーカから再生して行い、繰り返し回数は4回とした。被験者は聴力の正常な男性4名、女性4名である。
「従来方法」として、図13に示したように右側の音源方向に2個のマイクロホンを12.5cm並行に移動させ、かつ、閾値もLevTh1=2dB、LevTh2=−2dBの固定にした場合とした。
「この発明」として、マイクロホンの位置を従来方法と同じ音源に対して左右非対称の位置とした状態で、閾値推定処理を行わせた場合とした。
実験結果を図11に示す。横軸は音源位置を示し、縦軸は被験者から見て右側を+、左側を−として得られた回答を距離で示す。「基準特性」は、音源位置と受聴位置が一致している。「従来方法」は、中央の音源の音が左側のスピーカから大きく再生されるため、受聴者には中央の音源からの音が左側から発せられたように聞こえてしまう。この「従来方法」の実験では、中央の音源の位置が左側のマイクロホンに近いために、従来の閾値固定による音源方向強調処理によって、左側のスピーカから中央の音源の音が強調されて再生されるからである。
このようにこの発明の音像定位強調再生方法は、有効であり、マイクロホンの配置が音源に対して左右対称の位置に配置されなくとも、良好な音像定位感を聴取者に提供することが出来る。
なお、帯域別チャネル間パラメータ値差としては、レベル差を例に説明を行ったが、周波数分析の結果で振幅と同時に得られる位相スペクトルからチャネル間位相差Δang(ωi)=angXL(ωi)−angXR(ωi)を求め、これを帯域別チャネル間パラメータ値差としても良い。上記したようにマイクロホンの配置と音源配置との関係は位相差でも得られるので、帯域別チャネル間パラメータ値差検出手段4はレベル差の場合と同様の考え方で実現することが可能である。
また、上記各装置における処理機能をコンピュータによって実現する場合、音像定位強調再生装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記音像定位強調再生装置における処理機能がコンピュータ上で実現される。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記憶媒体に記憶されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記憶媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、この形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
Claims (18)
- 複数の音源からの音を収音して再生する装置であって、
互いに離して配置された2個のマイクロホンから上記音源に対する収音信号が入力され、それら各収音信号をそれぞれ複数の周波数帯域に分割し、各帯域の周波数帯域信号が主として一つの音源からの信号成分になる程度に分割する帯域分割手段と、
上記帯域分割手段から上記各複数の周波数帯域信号が入力され、それら両周波数帯域信号の同一帯域毎に、上記2個のマイクロホンの位置に起因して生ずる上記音のパラメータの値の差を帯域別チャネル間パラメータ値差として検出する帯域別チャネル間パラメータ値差検出手段と、
上記帯域別チャネル間パラメータ値差検出手段から入力された上記帯域別チャネル間パラメータ値差に基づき上記周波数帯域信号がいずれの上記音源から入力された信号であるかを判定する閾値を生成する閾値推定手段と、
上記帯域別チャネル間パラメータ値差検出手段から入力された上記帯域別チャネル間パラメータ値差と、上記閾値推定手段から入力された閾値に基づき、上記周波数帯域信号の各帯域がいずれの上記音源から入力された音を主に含むかを判定してその音源方向領域を判定し、その判定情報を出力する音源信号判定手段と、
上記判定情報及び上記各複数の周波数帯域信号が入力され、上記判定情報に基づき、それら周波数帯域信号に重み値を乗算して、上記判定された音源方向領域の音源からの音が強調された出力用音源帯域信号を生成する重み乗算手段と、
上記重み乗算手段で重み付けされた上記出力用音源帯域信号が入力され、出力用音源帯域信号を、判定された同一音源方向領域ごとに時間波形に戻して受聴者に上記音源方向領域を区別できる様に配置された拡声手段へ出力する音源信号合成手段と、
を具備することを特徴とする音像定位強調再生装置。 - 請求項1に記載の音像定位強調再生装置において、
上記閾値推定手段は、上記音源の中央と上記2個のマイクロホンの中央とが対向している状態において、互いに区別されるべき音源方向領域に属する音源が、隣接する一方の音源領域に含まれる状態を検出すると、それら音源の音源方向領域を区別するための閾値を推定するものであることを特徴とする音像定位強調再生装置。 - 請求項1又は2に記載の音像定位強調再生装置において、
上記閾値推定手段は、上記音源方向領域の一つの音源方向領域内に上記帯域別チャネル間パラメータ値差が所定値以上の音源が複数ある場合に、上記複数の音源間で音源方向領域を区別する閾値を生成し、上記閾値を逐次修正するものであることを特徴とする音像定位強調再生装置。 - 請求項1乃至3の何れかに記載の音像定位強調再生装置において、
上記閾値推定手段は、上記帯域別チャネル間パラメータ値差検出手段から入力される帯域別チャネル間パラメータ値差のヒストグラムを算出するヒストグラム算出部と、
上記ヒストグラムの最大値をとる階級を算出するヒストグラム最大階級算出部と、
上記ヒストグラム最大階級算出手段が算出する最大階級を複数個保存するヒストグラム最大階級保存部と、
上記ヒストグラム最大階級保存部に保存された複数の最大階級の値から、音源位置の偏りを判定する音源位置偏り判定部と、
上記音源位置偏り判定の判定結果と上記複数の最大階級とから上記2本のマイクロホンに対する左側音源方向領域と中央領域を決定するための閾値LevTh1と、上記2本のマイクロホンに対する右側音源方向領域と中央音源方向領域を決定するための閾値LevTh2を算出する閾値算出部と、
を具備することを特徴とする音像定位強調再生装置。 - 請求項4に記載の音像定位強調再生装置において、
上記音源信号偏り判定部は、上記帯域別チャネル間パラメータ値差検出手段から入力される同一帯域毎の帯域別チャネル間パラメータ値差と、上記閾値推定手段から入力される閾値LevTh1と閾値LevTh2とを比較して、帯域毎のチャネル間パラメータ値差が閾値LevTh1より大、小の一方であれば音源Ls、閾値LevTh2よりも大、小の他方であれば音源Rs、そのどちらでもなければ音源Cs、のそれぞれの音源の信号を主に含むと判定するものであることを特徴とする音像定位強調再生装置。 - 請求項1乃至5の何れかに記載の音像定位強調再生装置において、
上記重み乗算手段は、上記音源信号判定手段において判定された音源と対応付けされた上記周波数帯域信号に重み値1を乗算し、その判定された音源以外の音源と対応付けされた上記周波数帯域信号に重み値0.1乃至0.3を乗算するものであることを特徴とする音像定位強調再生装置。 - 請求項1乃至6の何れかに記載の音像定位強調再生装置において、
上記閾値推定手段は、上記帯域別チャネル間パラメータ値差を所定の帯域間で平滑化するレベル差帯域間平滑部を備え、上記平滑化された帯域別チャネル間パラメータ値差のヒストグラムを算出するものであることを特徴とする音像定位強調再生装置。 - 請求項1乃至7の何れかに記載の音像定位強調再生装置において、
上記閾値推定手段は、帯域別チャネル間パラメータ値差をフレーム間で平滑化するレベル差フレーム間平滑化部を備え、上記平滑化された帯域別チャネル間パラメータ値差のヒストグラムを算出するものであることを特徴とする音像定位強調再生装置。 - 請求項1乃至8の何れかに記載の音像定位強調再生装置において、
上記帯域別チャネル間パラメータ値差は、所定帯域以下の低い帯域では位相差であり、上記所定帯域より高い帯域ではレベル差であることを特徴とする音像定位強調再生装置。 - 複数の音源からの音を2本のマイクロホンで収音する収音過程と、
帯域分割手段が、上記収音過程で収音された各収音信号をそれぞれ複数の周波数帯域に分割する帯域分割過程と、
帯域別チャネル間パラメータ値差検出手段が、2本のマイクロホンの位置に起因して生ずる上記収音信号のパラメータの値の差を帯域別チャネル間パラメータ値差として検出する帯域別チャネル間パラメータ値差検出過程と、
閾値推定手段が、上記帯域別チャネル間パラメータ値差検出過程で検出された帯域別チャネル間パラメータ値差から上記周波数帯域信号の各帯域がいずれの上記音源から入力された信号であるかを判定する閾値を生成する閾値推定過程と、
音源信号判定手段が、上記帯域別チャネル間パラメータ値差検出過程で検出された上記帯域別チャネル間パラメータ値差と、上記閾値推定過程で生成された閾値に基づき、上記周波数帯域信号の各帯域がいずれの上記音源から入力された音を主に含むかを判定して判定情報を出力する音源信号判定過程と、
重み乗算手段が、上記音源信号判定過程で判定された判定情報に基づき、上記帯域分割過程で分割された各帯域信号に重み値を乗算することで、対応付けされた音源からの音が強調された出力用音源信号を生成する音源生成過程と、
音源信号合成手段が、上記出力用音源信号をそれぞれ時間波形に戻して出力信号とする音源信号合成過程と、
拡声手段が、入力された上記出力信号を再生する再生過程と、
を有する音像定位強調再生方法。 - 請求項10に記載の音像定位強調再生方法において、
上記閾値推定過程は、上記閾値を逐次生成するものであることを特徴とする音像定位強調再生方法。 - 請求項10又は11に記載の音像定位強調再生方法において、
上記閾値推定過程は、ヒストグラム算出部が上記帯域別チャネル間パラメータ値差検出手段から入力される帯域別チャネル間パラメータ値差のヒストグラムを算出するヒストグラム算出過程と、
ヒストグラム最大階級保存部が、上記ヒストグラム算出過程で算出されたヒストグラムの最大値を算出するヒストグラム最大階級算出過程と、
ヒストグラム最大階級保存部が、上記ヒストグラム最大階級算出部が算出する最大階級を複数個保存するヒストグラム最大階級保存過程と、
閾値算出部が、上記ヒストグラム最大階級保存部に保存された複数の最大階級の値から、上記2本のマイクロホンに対する左側音源方向領域と中央音源方向領域を決定するための閾値LevTh1と、上記2本のマイクロホンに対する右側音源方向領域と中央音源方向領域を決定するための閾値LevTh2を算出する閾値算出過程と、
から成ることを特徴とする音像定位強調再生方法。 - 請求項10乃至12の何れかに記載の音像定位強調再生方法において、
上記閾値推定過程は、上記帯域別チャネル間パラメータ値差を所定の帯域間で平滑化し、上記平滑化された帯域別チャネル間パラメータ値差のヒストグラムを算出する過程を含むものであることを特徴とする音像定位強調再生方法。 - 請求項10乃至13の何れかに記載の音像定位強調再生方法において、
上記閾値推定過程は、上記帯域別チャネル間パラメータ値差をフレーム間で平滑し、上記フレーム間で平滑化された帯域別チャネル間パラメータ値差のヒストグラムを算出する過程を含むものであることを特徴とする音像定位強調再生方法。 - 請求項10乃至14の何れかに記載の音像定位強調再生方法において、
上記音源信号判定過程は、上記帯域別チャネル間パラメータ値差検出手段から入力される同一帯域毎の帯域別チャネル間パラメータ値差と、上記閾値推定手段から入力される閾値LevTh1と閾値LevTh2とを比較して、帯域毎のチャネル間パラメータ値差が閾値LevTh1より大、小の一方であれば音源Ls、閾値LevTh2よりも大、小の他方であれば音源Rs、そのどちらでもなければ音源Cs、のそれぞれの音源の信号を主に含むと判定する過程であることを特徴とする音像定位強調再生方法。 - 請求項10乃至15の何れかに記載の音像定位強調再生方法において、
上記重み乗算過程は、上記音源信号判定手段において判定された音源と対応付けされた上記周波数帯域信号に重み値1を乗算し、その判定された音源以外の音源と対応付けされた上記周波数帯域信号に重み値0.1乃至0.3を乗算する過程であることを特徴とする音像定位強調再生方法。 - 請求項1乃至9に記載した各装置としてコンピュータを機能させるための装置プログラム。
- 請求項17に記載した何れかのプログラムを記憶したコンピュータで読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006232598A JP4495704B2 (ja) | 2006-08-29 | 2006-08-29 | 音像定位強調再生方法、及びその装置とそのプログラムと、その記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006232598A JP4495704B2 (ja) | 2006-08-29 | 2006-08-29 | 音像定位強調再生方法、及びその装置とそのプログラムと、その記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008060725A true JP2008060725A (ja) | 2008-03-13 |
JP4495704B2 JP4495704B2 (ja) | 2010-07-07 |
Family
ID=39243007
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006232598A Active JP4495704B2 (ja) | 2006-08-29 | 2006-08-29 | 音像定位強調再生方法、及びその装置とそのプログラムと、その記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4495704B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018005526A (ja) * | 2016-06-30 | 2018-01-11 | 株式会社リコー | 情報処理装置、及びプログラム |
CN116760499A (zh) * | 2023-07-07 | 2023-09-15 | 恩平市天悦音响科技有限公司 | 一种基于大数据的调音台调音管理系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0259000A (ja) * | 1988-08-24 | 1990-02-28 | Nippon Telegr & Teleph Corp <Ntt> | 音像定位再生方式 |
JPH10313497A (ja) * | 1996-09-18 | 1998-11-24 | Nippon Telegr & Teleph Corp <Ntt> | 音源分離方法、装置及び記録媒体 |
JP2003169399A (ja) * | 2001-11-30 | 2003-06-13 | Advanced Telecommunication Research Institute International | ステレオ音像制御装置および多対地間通話システムにおける対地側装置 |
-
2006
- 2006-08-29 JP JP2006232598A patent/JP4495704B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0259000A (ja) * | 1988-08-24 | 1990-02-28 | Nippon Telegr & Teleph Corp <Ntt> | 音像定位再生方式 |
JPH10313497A (ja) * | 1996-09-18 | 1998-11-24 | Nippon Telegr & Teleph Corp <Ntt> | 音源分離方法、装置及び記録媒体 |
JP2003169399A (ja) * | 2001-11-30 | 2003-06-13 | Advanced Telecommunication Research Institute International | ステレオ音像制御装置および多対地間通話システムにおける対地側装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018005526A (ja) * | 2016-06-30 | 2018-01-11 | 株式会社リコー | 情報処理装置、及びプログラム |
CN116760499A (zh) * | 2023-07-07 | 2023-09-15 | 恩平市天悦音响科技有限公司 | 一种基于大数据的调音台调音管理系统及方法 |
CN116760499B (zh) * | 2023-07-07 | 2023-12-01 | 恩平市天悦音响科技有限公司 | 一种基于大数据的调音台调音管理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4495704B2 (ja) | 2010-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5149968B2 (ja) | スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法 | |
US10204614B2 (en) | Audio scene apparatus | |
JP3670562B2 (ja) | ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体 | |
CN100525101C (zh) | 使用波束形成算法来记录信号的方法和设备 | |
JP5957446B2 (ja) | 音響処理システム及び方法 | |
KR101989062B1 (ko) | 오디오 신호를 향상시키기 위한 장치 및 방법 및 음향 향상 시스템 | |
US9743215B2 (en) | Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio | |
JP2008015443A (ja) | 雑音抑圧音声品質推定装置、方法およびプログラム | |
CN106066782B (zh) | 一种数据处理方法及电子设备 | |
JP4495704B2 (ja) | 音像定位強調再生方法、及びその装置とそのプログラムと、その記憶媒体 | |
JP2000081900A (ja) | 収音方法、その装置及びプログラム記録媒体 | |
JP2022017880A (ja) | 信号処理装置および方法、並びにプログラム | |
CN115567845A (zh) | 一种信息处理方法及装置 | |
JP6714424B2 (ja) | 音響信号補償装置及びそのプログラム | |
Sanz-Robinson et al. | Robust blind source separation in a reverberant room based on beamforming with a large-aperture microphone array | |
US9972335B2 (en) | Signal processing apparatus, signal processing method, and program for adding long or short reverberation to an input audio based on audio tone being moderate or ordinary | |
EP3613043A1 (en) | Ambience generation for spatial audio mixing featuring use of original and extended signal | |
CN117153192B (zh) | 音频增强方法、装置、电子设备和存储介质 | |
CN112309419B (zh) | 多路音频的降噪、输出方法及其系统 | |
WO2023013019A1 (ja) | 発話フィードバック装置、発話フィードバック方法、プログラム | |
JP2012027101A (ja) | 音声再生装置、音声再生方法、プログラム、及び、記録媒体 | |
RU2022105152A (ru) | Управление акустической эхокомпенсацией для распределенных аудиоустройств | |
US9653065B2 (en) | Audio processing device, method, and program | |
CN116208908A (zh) | 录音文件播放方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090630 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090828 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100330 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100409 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4495704 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130416 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140416 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |