JP3810004B2 - ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム - Google Patents

ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム Download PDF

Info

Publication number
JP3810004B2
JP3810004B2 JP2002071971A JP2002071971A JP3810004B2 JP 3810004 B2 JP3810004 B2 JP 3810004B2 JP 2002071971 A JP2002071971 A JP 2002071971A JP 2002071971 A JP2002071971 A JP 2002071971A JP 3810004 B2 JP3810004 B2 JP 3810004B2
Authority
JP
Japan
Prior art keywords
sound source
source signal
power
phase difference
predetermined threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002071971A
Other languages
English (en)
Other versions
JP2003274492A (ja
Inventor
昌英 水島
真理子 青木
正人 三好
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002071971A priority Critical patent/JP3810004B2/ja
Publication of JP2003274492A publication Critical patent/JP2003274492A/ja
Application granted granted Critical
Publication of JP3810004B2 publication Critical patent/JP3810004B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
この発明は、音声、楽音、各種環境音源などの複数の音源から発せられた複数の音響信号が混ざった2チャネルステレオ信号において、中央付近に定位する音源信号を強調するステレオ音響信号処理方法、装置及びそのプログラムに関する。
【0002】
【従来の技術】
難聴者は、複数の音源が存在する中から目的とする音源信号を聞き取る能力(いわゆるカクテルパーティー効果と呼ばれる)が劣っているといわれている。このため、健聴者を対象に作成された音楽信号では、しばしば伴奏が歌よりも大きく感じられることが指摘されている。この場合にはセンターに定位する歌を強調し、伴奏を抑圧することが望まれる。
複数の音源が混合された信号から目的とする音源信号を抽出、もしくは強調する方法には以下のようなものがある。
【0003】
一つ目は、周期構造を持つ音源を周波数領域において基本周波数を推定し、調波構造を抜き出すことにより、同一音源と推定する成分を再合成する方法である。
しかしこの一つ目の方法では、音源は調波構造に限定され、さらに音源の調波構造の推定には必ず誤差が生じるため、それが雑音として知覚されることにより、目的音源信号の抽出精度が悪くなる問題があった。
二つ目は、周波数特性の変動が比較的ゆるやかな定常的な雑音源と周波数特性が定常的音源よりも頻繁に変動する例えば音声のような目的信号音源が重畳された信号から、後者の目的音源信号を抽出、もしくは強調する方法であり、スペクトラルサブトラクション法等が代表例である。これは混合された信号を周波数領域において、まず目的音源信号が重畳されていない部分、すなわち雑音源信号を推定し、雑音源信号の平均的な周波数特性を記憶する。そして、周波数領域において、雑音源信号と目的音源信号が重畳された信号から記憶された雑音源の平均的な周波数構造を減算することで目的音源信号を強調、もしくは抽出する方法である。
【0004】
しかしこの二つ目の方法では、雑音源信号が定常であることが必要で、歌の伴奏のように非定常な音源の伴奏のみの個所の推定、及び抑圧は困難であった。
三つ目は、ステレオ信号の左右差を利用し、左右差の小さい成分を抽出することで、中央に定位する音源信号を強調する方法である(特願2000−268442、特願2001−038344)。一つ目、二つ目の方法と違い、音源の調波性や定常性には依存しないで中央付近に定位する音源信号を強調できる。
しかしながら、前述の発明(特願2000−268442、特願2001−038344)は、中央以外に定位する音源信号を抑圧する量を受聴音の好みなどで所望な量に調整することは可能であったが、その調整は音量を調整するのと同様に、利用者自身の操作が必要であった。音楽の場合、伴奏と歌の大きさの差は楽曲によって様々である。その差に応じて、抑圧する量が制御できることが望ましい。また、歌の合間においては、必ずしもセンターに強調すべきメイン楽器が定位しているとは限らない。その場合は、抑圧を解除することが必要となるであろう。音楽を聴いている合間の頻繁な操作は鑑賞の妨げになるので、これらの調整は、システム側で自動に行われることが望ましい。
【0005】
【発明が解決しようとする課題】
本発明の目的は、ステレオ音響信号から中央付近に定位する音源信号(チャネル間レベル差及び位相差が所定の閾値より小さい音源信号)を強調する技術において、中央付近に定位する音源信号と中央以外に定位する音源信号(チャネル間レベル差及び位相差が所定の閾値より大きい音源信号)の大きさの差を計算し、その結果に応じて、中央以外に定位する音源信号を抑圧すべき量を自動的に調整することを可能とすることである。
【0006】
【課題を解決するための手段】
この発明ではステレオ信号を各チャネル毎に複数の周波数帯域に分割する周波数帯域分割処理と、各周波数帯域毎にチャネル間レベル差及び位相差が所定の閾値より小さい音源信号と、チャネル間レベル差及び位相差が所定の閾値より大きい音源信号とを判別する類似度判定処理と、前記チャネル間レベル差及び位相差が所定の閾値より小さい音源信号のパワーと前記チャネル間レベル差及び位相差が所定の閾値より大きい音源信号のパワーを推定するパワー計算処理と、前記パワー計算処理で得られた各音源信号のパワーの比を算出するパワー比計算処理と、前記パワー比計算処理で得られたパワー比に応じて前記チャネル間レベル差及び位相差が所定の閾値より大きい音源信号を抑圧する抑圧制御処理とを実行するステレオ音響信号処理方法を提案する。
【0007】
この発明では更に前記ステレオ音響信号処理方法において、前記チャネル間レベル差及び位相差が所定の閾値より大きい音源信号の抑圧制御は前記パワー比に基づいて前記周波数帯域に分割された各帯域毎に減衰係数を算出し、該減衰係数で各帯域成分に重み付けして実行するステレオ音響信号処理方法を提案する。
この発明では更に前記ステレオ音響信号処理方法において、前記チャネル間レベル差及びチャネル間位相差が所定の閾値より大きい音源信号の抑圧量は、前記パワー比に基づいて一意に決まる量に予め設定しておくステレオ音響信号処理方法を提案する。
【0008】
この発明では更にステレオ信号を各チャネル毎に複数の周波数帯域に分割する周波数帯域分割部と、各周波数帯域毎にチャネル間レベル差及び位相差が所定の閾値より小さい音源信号と、チャネル間レベル差及び位相差が所定の閾値より大きい音源信号とを判別する類似度判定部と、前記チャネル間レベル差及び位相差が所定の閾値より小さい音源信号のパワーと前記チャネル間レベル差及び位相差が所定の閾値より大きい音源信号のパワーを推定するパワー計算部と、前記パワー計算処理で得られた各音源信号のパワーの比を算出するパワー比計算部と、前記パワー比計算処理で得られたパワー比に応じて前記チャネル間レベル差及び位相差が所定の閾値より大きい音源信号を抑圧する抑圧制御部とを有するステレオ音響信号処理装置を提案する。
【0009】
この発明では更にコンピュータが読み取り可能な符号によって記述され、前記請求項1乃至3記載のステレオ音響信号処理方法の何れかをコンピュータに実行させるステレオ音響信号処理プログラムを提案する。
作用
入力されたステレオ信号をチャネルごとに複数の周波数成分に分割する。そして、各周波数成分ごとにチャネル間の信号成分の類似度をその振幅比や位相差によって決定する。そしてまず、類似度の高い周波数成分の合算パワーと、その残り、即ち類似度の低い周波数成分の合算パワーの比を計算する。次にそのパワー比に応じて、類似度の高い周波数成分に比べて類似度の低い周波数成分が小さくなるような一つ目の減衰係数を得る。さらに、類似度の低い周波数成分の時間平均値を計算し、その値と、前記パワー比から二つ目の減衰係数を得る。また、この二つの減衰係数から実際に各成分に乗算する減衰係数を選択して、各周波数成分に乗算、各チャネルごとに再合成して出力すれば、中央付近に定位する音源信号の中央付近以外に定位する音源信号からの相対的な大きさに応じて中央に定位する音源が強調される。
実施例
図1は本発明の一実施例を示すブロック図である。ステレオ信号入力部102に入力される音源信号は、強調したい目的音源信号が左右チャネル間のレベル差及び位相差が小さい状況に収音されているステレオ信号であれば本発明は有効である。
【0010】
ステレオ信号入力部102に入力されたステレオ信号は左右のチャネルごとに処理される。以下にその処理方法の詳細を述べる。
左チャネルの信号sLは、左チャネル周波数帯域分割部103によって周波数領域に変換される。同様に右チャネルの信号sRは、右チャネル周波数帯域分割部104によって周波数領域に変換される。ここで帯域分割数をNとする。左チャネルにおいて帯域分割された信号成分を低い周波数から順にfL(0),fL(1),fL(2)…fL(k)…fL(N−1)とする。右チャネルにおいて帯域分割された信号成分を低い周波数から順にfR(0),fR(1),fR(2)…fR(k)…fR(N−1)とする。類似度計算部105において、fL(k),fR(k)は、同じ周波数帯域ごとに類似度a(0),a(1),a(2)…a(k)…a(N−1)が計算される。ステレオ信号において、中央付近に定位する音源信号は左右の信号が一致、もしくはその差違が非常に小さい。これは即ち、周波数領域に変換した後も全ての周波数帯域において、左右の成分の差違は小さいことを意味する。このことから類似度は、kが等しい、即ち同じ周波数帯域間で、fL(k)とfR(k)の差違で決定することが出来る。
【0011】
次に類似度a(k)の計算方法について、左右チャネル周波数帯域分割部103,104が短時間フーリエ変換(以下、FFTと略する)である場合について述べる。FFTで周波数分割した場合、fL(k)およびfR(k)は一般に複素数となり、位相を考慮する必要がある。そこで、各成分の大きさの比と位相差によって二つの類似度を計算する。つまり、チャネル間レベル比に基づく尺度を示す類似度をai(k)、チャネル間位相差に基づく尺度を示す類似度をap(k)とすると、
ai(k)=|fR(k)|/|fL(k)| (|fR(k)|<=|fL(k)|の時)
=|fL(k)|/|fR(k)| (|fL(k)|<|fR(k)|の時)(1)
ここで|A|は、A(複素数)の大きさを表す。
【0012】
ap(k)=cosθ=Re(fR(k)fL(k)*)/(|fL(k)||fR(k)|) (2)ここでθはfL(k)とfR(k)の位相差(ただし、0<=|θ|<=π)を表す。また、A*は、A(複素数)の共役複素数、Re(A)は、A(複素数)の実数部を表す。
類似度ai(k),ap(k)はセンターパワー/非センターパワー計算部114及び左右差減衰係数計算部106及びSS減衰係数計算部107に送られる。
【0013】
まず、センターパワー/非センターパワー計算部114における、センターパワーと非センターパワーの比cbの計算方法とcbに基づいて最低減衰係数計算部115で計算されるGimin(cb),Gpmin(cb)及びGsmin(cb)の計算方法について順次説明する。
上記(1)式から明らかなように、類似度ai(k)は、fL(k)とfR(k)の大きさが等しい時に1になり、それ以外は1より小さい値になる。cbを計算するためのセンターと非センターの類似度ai(k)に対する閾値をaithd(k)として、1以下で1に近い値に設定し、中央付近に定位する音源とそれ以外を分ける閾値として、おおよそ0.3〜0.5程度が適当な値である。
【0014】
上記(2)式から明らかなように、類似度ap(k)は、fL(k)とfR(k)の位相が一致したときに1になり、それ以外は1より小さい値であり、位相差θがπ/2ラジアンのときに0,θがπラジアンの時、すなわち逆相の時に−1で最小である。少なくとも中央付近に定位する音源信号に関しては位相差は0に近く、よってap(k)は1に近い値であることが期待できる。cbを計算するためのセンターと非センターの類似度ap(k)に対する閾値をapthd(k)として、1以下で1に近い値に設定するが、中央付近に定位する音源とそれ以外を分ける閾値として、おおよそ0.7〜0.9程度が適当な値である。
【0015】
各時刻(周波数分割する単位フレーム)毎に、センター音パワーcpw及び非センター音パワーbpwが、下記のように計算される
cpw=Σk=m,n(|fR(k)|*|fR(k)|+|fL(k)|*|fL(k)|)
(ai(k)>=aithd(k)かつap(k)>=apthd(k)のとき) (3)
bpw=Σk=m,n(|fR(k)|*|fR(k)|+|fL(k)|*|fL(k)|)
(ai(k)<aithd(k)またはap(k)<apthd(k)のとき) (4)
Σk=m,n A(k)は、kをmからnまで、A(k)を加算する、即ち、
A(m)+A(m+1)+A(m+2)+……+A(n-1)+A(n)
ことを表す。
【0016】
m,nは、0以上N−1の自然数で、m<=nである。これらの値は、目的に応じてパワー計算時の帯域を制限する効果がある。歌の入った楽曲では、歌が中央に定位するのが一般的だが、歌の他に、ベースギターやベースドラム等も中央に定位させることが多い。歌を強調することが目的である場合、歌の中心帯域におけるセンター音パワーと非センター音パワーを知りたい。この場合mは、おおよそ100Hz〜200Hz、nは3kHz〜4kHz程度までの帯域に対応する値にすることが適当である。
【0017】
センター音パワーcpw及び非センター音パワーbpwより、cbが以下のように計算出来る。
cb=cpw/bpw (5)
cbは、信号と雑音の比を表すSN比に対応する。ここでは、中央付近に定位する音が(所望の)信号であり、非センター音が雑音ということになる。
次に、cbを使って、最低減衰係数計算部115においてGimin(cb),Gpmin(cb),Gsmin(cb)を計算する方法の一例を説明する。Gimin(cb)は、左右差減衰係数計算部106において計算される大きさの比による減衰係数gi(k)の最低値である。Gpmin(cb)は、左右差減衰係数計算部106において計算される位相差による減衰係数gp(i)の最低値である。Gsmin(cb)は、SS減衰係数計算部107で計算されるSS減衰係数gs(k)の最低値である。gi(k),gp(k),gs(k)の計算方法については、後述する。
【0018】
歌がセンター付近に定位した楽曲でのcbとGimin(cb),Gpmin(cb),Gsmin(cb)の関係の一例を説明する。
cbが大きいほど、センター定位音は大きく、cbが小さいとセンター定位音が小さい。cbが大きくなるにつれて、例えば伴奏に比べて歌が大きいことを意味するから、その場合はGimin(cb),Gpmin(cb),Gsmin(cb)を大きく、1に近い値にする。cbが小さくなるにつれて、伴奏に比べて歌が小さくなることを意味するから、その場合はGimin(cb),Gpmin(cb),Gsmin(cb)を小さくしていく。センター定位音がない、即ち歌の合間などの場合、非センター音、即ち伴奏を抑圧することは意味がないばかりか、不自然さを招く。よって、ある程度cbが小さくなったら、またGimin(cb),Gpmin(cb),Gsmin(cb)を大きくしていく。この関係を図2に示す。あるいは、センター音が存在する場合は、その大きさに関わらず、一定の抑圧をする場合は、図3のようにすれば良い。図2、3において、a1は概ね−6dB〜−3dB程度、a2は−3dBから0dB程度、a3は3dB〜6dB程度の値である。また、b1は、0dBより小さく、最低−20dB程度の値である。cbの値から実際にGimin(cb),Gpmin(cb),Gsmin(cb)を求めるには、図2や図3のような関係を満たす関数式で計算しても、いくつかに細分割してあらかじめ記憶してあるテーブルを参照しても構わない。図2、図3に示すようなcbに応じた設定は、受聴者の好み等に応じてあらかじめ設定しておくものである。その設定方法としては、例えば受聴者個々で、事前にcbの大きさの異なるサンプル曲で、好みのGimin(cb),Gpmin(cb),Gsmin(cb)を選択してもらい、その値から間を補間し、図2や図3のような関係を作成し、記憶しておけばよい。
【0019】
なお、(5)式で計算されるcbは、刻々と周波数分析するフレーム単位で変化する。この値でそのままGimin(cb),Gpmin(cb),Gsmin(cb)を計算すると、抑圧量の瞬時の変動幅が大きくなり、出力音が不自然になることがある。その場合、必要に応じて、cbの長時間平均をして変化を滑らかにすることも有効である。cbの長時間平均の方法には、移動平均を用いる方法がある。また、Gimin(cb),Gpmin(cb),Gsmin(cb)を求めた後、その値を平滑化しても良い。またこの二つの方法を併用しても良い。
【0020】
次に、左右差減衰係数計算部106で行なわれる左右差減衰係数gd(k)の計算方法について説明する。
まず大きさの比による減衰係数gi(k)を計算する。(1)式から明らかなように、類似度ai(k)は、fL(k)とfR(k)の大きさが等しい時に1になり、それ以外は1より小さい値になる。したがって、大きさの比による類似度ai(k)を引数とする関数において、単調増加の関数の出力をgi(k)に選べばよい。図4にその一例を示す。横軸は20*1og10(ai(k))、縦軸は20*1og10(gi(k))を示している。中央に定位する音源信号だけであるならば、全てのkに対してai(k)は1(20*1og10(ai(k)=0)になるが、その他に定位する信号が重畳されることにより、中央定位成分が支配的な帯域であっても1よりもやや小さくなることがある。
【0021】
よって図4のように適当な幅εを持たせることが有効である。Gimin(cb)は、非中央定位成分の抑圧量に相当し、前述のように計算され、例えば歌と伴奏のバランスに応じて、伴奏の大きさを調整することが可能となる。図4においてβをεと一致させても良いし、一致させなくても良い。βをεに近づけると非中央定位成分は等しくGimin(cb)の減衰量で減衰されることが期待できるが、中央定位音源信号の支配的な帯域が誤って抑圧された場合の誤差の影響も大きくなる。βをεから離すことで中央定位音源信号が支配的な帯域を誤って抑圧した場合の誤差の影響を小さく出来るが、定位する位置によって抑圧量が変ってしまい、歌の伴奏に例えるならば、伴奏楽器間の音量のバランスが変ってしまうことなども予想される。よって、中央定位音源信号の音質などの変化が無視できる範囲でβはεに近い値(0>ε>β)にすることが望ましい。εは概ね0dBより大きく最大6dB程度、βは、最大12dB程度である。
【0022】
次に位相差による減衰係数gp(k)の計算方法について説明する。(2)式から明らかなように、類似度ap(k)は、fL(k)とfR(k)の位相が一致したときに1になり、それ以外は1より小さい値であり、位相差θがπ/2ラジアンのときに0,θがπラジアンの時、すなわち逆相の時に−1で最小である。一般に位相差による定位知覚は周波数帯域にも依存し、大きさの比ほど単純ではない。しかし、少なくとも中央に定位する音源信号に関しては位相差は0に近く、よってap(k)は1に近い値であることが期待できる。このことから位相差による減衰係数gp(k)は例えば図5に示すように計算すれば良い。図5において、横軸はap(k)、縦軸は20*log10(gp(k))を表す。中央に定位する音源信号だけであるならば、全てのkに対してap(k)は1になるが、その他の雑音信号が重畳されることにより、中央定位音源信号が支配的な帯域であっても1よりもやや小さくなることがある。よって図5のように適当な幅ζを持たせることが有効である。Gpmin(cs)は、非中央定位成分の抑圧量に相当し、前述のように計算され、例えば歌と伴奏のバランスに応じて、伴奏の大きさを調整することが可能となる。図5においてαをζと一致させても良いし、一致させなくても良い。αをζに近づけると非中央定位成分は等しくGpmin(cs)の減衰量で減衰されることが期待できるが、中央定位音源信号の支配的な帯域が誤って抑圧された場合の誤差も大きくなる。αをζから離すことで中央定位音源信号が支配的な帯域を誤って抑圧された場合の誤差の影響を小さく出来るが、位相差による抑圧量の違いは周波数帯域によってその影響度が異なるため、歌の伴奏に例えるならば、伴奏楽器の音量のバランスだけではなく音色などが変ってしまうことなどが予想される。よって、中央定位音源信号の変化が無視できる範囲でαはζに近い値(0>ζ>α)にすることが望ましい。ζは0.9〜0.8程度で最低で0.5程度、αは最低で0.0程度である。
【0023】
次に二つの減衰係数gi(k)とgp(k)から左右差減衰係数gd(k)を計算する方法について述べる。適当な距離を離した二つのマイクロホンで比較的マイクロホンから距離が近い複数の音源信号を収音したステレオ信号が入力信号である場合には、ステレオ再生における定位は左右のマイクロホンに入ってくる信号の位相差と大きさの比(レベル差)に依存する。低い周波数においてはレベル差はつきにくく、位相差が大きく影響する。高い周波数では、大きさの比が大きく影響する。よって、例えば周波数帯域を二つに分けてそれよりも低い周波数においてはgi(k)を、高い周波数においてはgp(k)を採用することが考えられる。しかしながら、壁に囲まれた残響のある部屋において、マイクロホンから離れた位置に存在する音源からの信号は一般に左右のレベル差はほとんどなく、逆に位相が左右のマイクロホンでランダムになるため(2)式の値が0に近くなる。この場合は全ての周波数において優先的にgp(k)を使うことが望ましい。さらにポピュラー音楽等の場合は、直接マイクロホンで収音するだけでなく、左右チャネル信号に大きさの比や時間差、あるいは位相の時間的な変化を人工的に付加することで自然界には存在しない定位を得ることが普通であり、もっと複雑になる。以上のように様々なステレオ入力信号に応じて、最適なgd(k)の選択をすることは非常に困難である。しかしながら、どの場合も少なくとも中央に定位する音源信号の大きさの比と位相差は共に小さい。そこで、減衰係数gd(k)として、gi(k)とgp(k)の小さいほうを採用することにする。即ち、
gd(k)=min(gi(k),gp(k)) (6)
ここで、min(A,B)はAとBの何れかの小さいほうを出力することを意味する。つまり、どんなステレオ入力信号であっても、大きさか位相の少なくともどちらか一方が左右で異なる場合は抑圧することになり、その結果、中央に定位する音源信号を強調することが可能となる。ここでの抑圧制御は短時間(フレーム)毎のレベル比を抑圧制御の手がかりとしているため、短時間毎の非定常的非中心音源の抑圧に貢献する。
【0024】
cbとGimin(cb),Gpmin(cb)の関係は、同じであっても構わないが、それは必須ではない。例えば、Gpmin(cb)をcbに関わらず、常に1にしておけば、結果的に、位相差情報は使用せず、レベル差情報だけで、非センター音を抑圧をすることになる。ポピュラー音楽等ではしばしば特殊な音響処理によって、位相が時間的に回転を繰り返しているような場合があり、瞬時の位相情報で抑圧をすると、不自然な異音が発生することがある。その場合、Gpmin(cb)をcbに関わらず、常に1にしておけば良い。
【0025】
次にSS減衰係数gs(k)の計算方法について述べる。
まず、非中央定位成分の時間平均を計算する。周波数分析のフレーム長単位の各時刻における周波数成分の左右の平均を|fM(k)|として、それらのうち類似度がレベル差類似度ai(k)、位相差類似度ap(k)共に小さい成分を抽出し、|fN(k)|とする。次に|fN(k)|の時間平均を取り、その値を|fA(k)|とする。時間平均の方法には過去数時刻の|fN(k)|を記憶しておき、その移動平均を取る方法、その際、最近のフレームに大きな重みづけをする方法、忘却係数を用いる方法など各種考えられるが、どの方法を用いても本発明の効果には変わりはない。
【0026】
次に|fA(k)|からSS減衰係数gs(k)を算出する一例について述べる。|fA(k)|は、センターに定位しない成分の時間平均であり、スペクトラルサブトラクション法による雑音成分に相当するから、gs(k)は例えば下記のように求めることが出来る。
Figure 0003810004
gs(k)>1のとき、 gs(k)=1
gs(k)<Gsmin(cb)のとき、gs(k)=Gsmin(cb)
ここで、αは消し残りを防ぐための適当な大きさの重みであり、1〜2程度の値が適当である。Gsmin(b)は、前述の方法で計算され、gs(k)による非中央定位成分の最大抑圧量に相当し、例えば歌と伴奏のバランスに応じて、伴奏の大きさを調整することが可能となる。ここでの抑圧制御は長時間平均レベルに基づくため、定常的非中心音源の抑圧に貢献する。
【0027】
次に、左右差減衰係数gd(k)とSS減衰係数gs(k)から最終的にfL(k),fR(k)に乗算する減衰係数g(k)を算出する。各時刻でgd(k)が小さい時、それは中央成分ではないことを意味するから抑圧したい。gd(k)が大きく(1に近く)、一方gs(k)が小さい成分は定常的に中央成分ではないことを意味するから、その成分も抑圧したい。よってどちらか小さいほうを減衰係数として選べばよい。最小値選択部108はその選択を行なう。
g(k)=min(gd(k),gs(k)) (8)
cbとGimin(cb),Gpmin(cb)の関係と、Gsmin(cb)との関係は、同じであっても構わないが、それは必須ではない。例えば、Gpmin(cb),Gimin(cb)ともにcbに関わらず、常に1にしておけば、結果的に、瞬時の左右差情報を使用せずに、スペクトラルサブトラクションのように、平均的に、非センター音を抑圧をすることを意味する。これにより、非センター音の中で、比較的時間変動の少ない定常的な成分がより強く抑圧されるため、例えば、ピアノやアコースティックギター等の伴奏のように変動の大きな非定常な音源信号の成分は抑圧されずに残ってしまいやすい。しかし逆に、強調すべき歌は比較的非定常であるから、瞬時の左右差で非センター音を抑圧するより、歌の信号の劣化は少ないという利点がある。
【0028】
上記のように計算された減衰係数g(k)は図1にあるように各チャネル各周波数帯域のfL(k),fR(k)に乗算される。同じ帯域kにおいて左右のチャネルに同じ減衰係数g(k)を乗算することで、中央に定位する音源信号以外の音源信号を定位を維持したまま抑圧することが可能となる。g(k)を乗算した信号は、fL(k)は左チャネル音源信号合成部109で再合成、時間波形sL′に変換される。fR(k)は右チャネル音源信号合成部110で再合成、時間波形sR′に変換される。sL′,sR′はステレオ信号出力部111から、ステレオラウドスピーカ112やステレオヘッドホン113に送られる。
【0029】
以上の処理により、ステレオ音響信号のセンターに定位する音源信号を強調する際、センター定位音と非センター定位音のバランスに応じた強調が可能となる。
上述した各処理はコンピュータ上において、コンピュータが読み取り可能な符号によって記述されているプログラムを実行することにより実現される。プログラムはCD等の記録媒体もしくは通信回線を経由してコンピュータにダウンロードされインストールしてCPU等の演算手段でしてもよい。
【0030】
【発明の効果】
以上の説明のように本発明によれば、ステレオ音響信号から中央に定位する音源信号をステレオ音響信号の中央に定位する音源信号とその他の音源信号のレベル差に応じて強調することが、可能となり、以下のような効果が期待できる。
難聴者等の受聴者が市販の音楽ソースを受聴する際、中央に定位する主たる音源信号である歌とそれ以外の伴奏の音量バランスを、楽曲間の歌の大小に応じて自動的に調整することが可能となり、あらかじめ、楽曲間の歌の大小に応じた受聴者の好み等による音量バランスを設定しておけば、鑑賞中は、自動的にその調整がなされ、調整にわずらわせることなく、音楽をより良く楽しむことが期待できる。
【図面の簡単な説明】
【図1】この発明によるステレオ音響信号処理装置の一実施例を示すブロック図。
【図2】本発明で用いる抑圧最低量(Gimin(cb),Gpmin(cb),Gsmin(cb))とcbとの関係を示すグラフ。
【図3】本発明で用いる抑圧最低量(Gimin(cb),Gpmin(cb),Gsmin(cb))とcbとの関係を示すグラフ。
【図4】この発明により中央定位音源を強調する時のai(k)とgi(k)の関係を示すグラフ。
【図5】この発明により中央定位音源を強調する時のap(k)とgp(k)の関係を示すグラフ。
【符号の説明】
102 ステレオ信号入力部
103 左チャネル周波数帯域分割部
104 右チャネル周波数帯域分割部
105 類似度計算部
106 左右差減衰係数計算部
107 SS減衰係数計算部
108 最小値選択部
109 左チャネル音源信号合成部
110 右チャネル音源信号合成部
111 ステレオ信号出力部
112 ステレオラウドスピーカ
113 ステレオヘッドホン
114 センターパワー/非センターパワー計算部
115 最低減衰係数計算部

Claims (5)

  1. ステレオ信号を各チャネル毎に複数の周波数帯域に分割する周波数帯域分割処理と、
    各周波数帯域毎にチャネル間レベル差及び位相差が所定の閾値より小さい音源信号と、チャネル間レベル差及び位相差が所定の閾値より大きい音源信号とを判別する類似度判定処理と、
    前記チャネル間レベル差及び位相差が所定の閾値より小さい音源信号のパワーと前記チャネル間レベル差及び位相差が所定の閾値より大きい音源信号のパワーを推定するパワー計算処理と、
    前記パワー計算処理で得られた各音源信号のパワーの比を算出するパワー比計算処理と、
    前記パワー比計算処理で得られたパワー比に応じて前記チャネル間レベル差及び位相差が所定の閾値より大きい音源信号を抑圧する抑圧制御処理と、
    を実行することを特徴とするステレオ音響信号処理方法。
  2. 請求項1記載のステレオ音響信号処理方法において、前記チャネル間レベル差及び位相差が所定の閾値より大きい音源信号の抑圧制御は前記パワー比に基づいて前記周波数帯域に分割された各帯域毎に減衰係数を算出し、該減衰係数で各帯域成分に重み付けして実行することを特徴とするステレオ音響信号処理方法。
  3. 請求項1記載のステレオ音響信号処理方法において、前記チャネル間レベル差及びチャネル間位相差が所定の閾値より大きい音源信号の抑圧量は、前記パワー比に基づいて一意に決まる量に予め設定しておくことを特徴とするステレオ音響信号処理方法。
  4. ステレオ信号を各チャネル毎に複数の周波数帯域に分割する周波数帯域分割部と、
    各周波数帯域毎にチャネル間レベル差及び位相差が所定の閾値より小さい音源信号と、チャネル間レベル差及び位相差が所定の閾値より大きい音源信号とを判別する類似度判定部と、
    前記チャネル間レベル差及び位相差が所定の閾値より小さい音源信号のパワーと前記チャネル間レベル差及び位相差が所定の閾値より大きい音源信号のパワーを推定するパワー計算部と、
    前記パワー計算処理で得られた各音源信号のパワーの比を算出するパワー比計算部と、
    前記パワー比計算処理で得られたパワー比に応じて前記チャネル間レベル差及び位相差が所定の閾値より大きい音源信号を抑圧する抑圧制御部と、
    を有することを特徴とするステレオ音響信号処理装置。
  5. コンピュータが読み取り可能な符号によって記述され、前記請求項1乃至3記載のステレオ音響信号処理方法の何れかをコンピュータに実行させるステレオ音響信号処理プログラム。
JP2002071971A 2002-03-15 2002-03-15 ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム Expired - Fee Related JP3810004B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002071971A JP3810004B2 (ja) 2002-03-15 2002-03-15 ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002071971A JP3810004B2 (ja) 2002-03-15 2002-03-15 ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム

Publications (2)

Publication Number Publication Date
JP2003274492A JP2003274492A (ja) 2003-09-26
JP3810004B2 true JP3810004B2 (ja) 2006-08-16

Family

ID=29202095

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002071971A Expired - Fee Related JP3810004B2 (ja) 2002-03-15 2002-03-15 ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム

Country Status (1)

Country Link
JP (1) JP3810004B2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7490044B2 (en) 2004-06-08 2009-02-10 Bose Corporation Audio signal processing
JP4594681B2 (ja) 2004-09-08 2010-12-08 ソニー株式会社 音声信号処理装置および音声信号処理方法
JP2006100869A (ja) 2004-09-28 2006-04-13 Sony Corp 音声信号処理装置および音声信号処理方法
JP4580210B2 (ja) * 2004-10-19 2010-11-10 ソニー株式会社 音声信号処理装置および音声信号処理方法
JP4602204B2 (ja) 2005-08-31 2010-12-22 ソニー株式会社 音声信号処理装置および音声信号処理方法
JP4637725B2 (ja) 2005-11-11 2011-02-23 ソニー株式会社 音声信号処理装置、音声信号処理方法、プログラム
JP4940671B2 (ja) * 2006-01-26 2012-05-30 ソニー株式会社 オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
JP2007221445A (ja) * 2006-02-16 2007-08-30 Sharp Corp サラウンドシステム
JP4894386B2 (ja) 2006-07-21 2012-03-14 ソニー株式会社 音声信号処理装置、音声信号処理方法および音声信号処理プログラム
JP4835298B2 (ja) * 2006-07-21 2011-12-14 ソニー株式会社 オーディオ信号処理装置、オーディオ信号処理方法およびプログラム
US8369532B2 (en) * 2006-08-10 2013-02-05 Koninklijke Philips Electronics N.V. Device for and a method of processing an audio signal
US8908873B2 (en) 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US20080232601A1 (en) * 2007-03-21 2008-09-25 Ville Pulkki Method and apparatus for enhancement of audio reconstruction
US8290167B2 (en) 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
PL2154677T3 (pl) * 2008-08-13 2013-12-31 Fraunhofer Ges Forschung Urządzenie do wyznaczania konwertowanego przestrzennego sygnału audio
JP4840423B2 (ja) * 2008-09-11 2011-12-21 ソニー株式会社 音声信号処理装置および音声信号処理方法
JP5365380B2 (ja) * 2009-07-07 2013-12-11 ソニー株式会社 音響信号処理装置、その処理方法およびプログラム
TWI459828B (zh) * 2010-03-08 2014-11-01 Dolby Lab Licensing Corp 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統

Also Published As

Publication number Publication date
JP2003274492A (ja) 2003-09-26

Similar Documents

Publication Publication Date Title
JP3810004B2 (ja) ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム
JP3670562B2 (ja) ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体
JP6377249B2 (ja) オーディオ信号の強化のための装置と方法及び音響強化システム
JP5018193B2 (ja) 雑音抑圧装置およびプログラム
US7974838B1 (en) System and method for pitch adjusting vocals
JP5957446B2 (ja) 音響処理システム及び方法
JP3755739B2 (ja) ステレオ音響信号処理方法及び装置並びにプログラム及び記録媒体
CN108768330B (zh) 自动响度控制
WO2017135350A1 (ja) 記録媒体、音響処理装置および音響処理方法
JP5316127B2 (ja) 音処理装置およびプログラム
JP2010181448A (ja) 音響調整装置及び音響調整方法
EP3840404B1 (en) A method for audio rendering by an apparatus
JP5463924B2 (ja) 音響処理装置
JP5494085B2 (ja) 音響処理装置
WO2021060041A1 (ja) 音響信号解析方法、音響信号解析システムおよびプログラム
WO2023174951A1 (en) Apparatus and method for an automated control of a reverberation level using a perceptional model
JP2023012347A (ja) 音響装置および音響制御方法
JP5641187B2 (ja) 音響処理装置
JP2022531330A (ja) コヒーレンスを使用した信号コンポーネント推定
JP5454157B2 (ja) 音響処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060328

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060502

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060519

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060519

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090602

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100602

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100602

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110602

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120602

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130602

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140602

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees