本発明は、音響信号復号装置および音響信号復号装置におけるバランス調整方法に関する。
ステレオ音響信号を低ビットレートで符号化する方式として、インテンシティステレオ方式が知られている。インテンシティステレオ方式では、モノラル信号にスケーリング係数を乗じてLチャネル信号(左チャネル信号)とRチャネル信号(右チャネル信号)とを生成する手法を採る。このような手法は振幅パニング(amplitude panning)とも呼ばれる。
振幅パニングの最も基本的な手法は、時間領域におけるモノラル信号に振幅パニング用の利得係数(パニング利得係数)を乗じてLチャネル信号およびRチャネル信号を求めるものである(例えば非特許文献1参照)。また、別な手法として、周波数領域において個々の周波数成分ごと(または周波数グループごと)にモノラル信号にパニング利得係数を乗じてLチャネル信号およびRチャネル信号を求めるものもある(例えば非特許文献2および特許文献3参照)。
パニング利得係数をパラメトリックステレオの符号化パラメータとして利用すると、ステレオ信号のスケーラブル符号化(モノラル−ステレオスケーラブル符号化)を実現することができる(例えば特許文献1および特許文献2参照)。パニング利得係数は、特許文献1においてはバランスパラメータとして、特許文献2においてはILD(レベル差)として、それぞれ説明されている。
また、パニングをモノラル−ステレオ予測に用い、パニングによって得られるステレオ信号と入力ステレオ信号との誤差を符号化する、モノラル−ステレオスケーラブル符号化も提案されている(例えば特許文献3)。
特表2004−535145号公報
特表2005−533271号公報
国際公開第2009/038512号公報
しかしながら、モノラル−ステレオスケーラブル符号化において、ステレオ符号化データが伝送路上で失われてしまい、復号装置側に受信されないことがある。また、伝送路上においてステレオ符号化データに誤りが発生し、復号装置側においてそのステレオ符号化データが廃棄されることがある。このような場合、復号装置では、ステレオ符号化データに含まれるバランスパラメータ(パニング利得係数)を利用できないため、ステレオとモノラルとが切り替わることが発生し、復号される音響信号の定位が揺らいでしまう。その結果、ステレオ音響信号の品質が劣化してしまう。
本発明の目的は、復号信号の定位の揺らぎを抑えてステレオ感を保つことができる音響信号復号装置および音響信号復号装置におけるバランス調整(振幅パニング)方法を提供することである。
本発明の音響信号復号装置は、ステレオ符号化データから第1バランスパラメータを復号する復号手段と、過去に得られたステレオ信号の第1チャネル信号および第2チャネル信号を用いて第2バランスパラメータを算出する算出手段と、前記第1バランスパラメータが利用不可能な場合に、前記第2バランスパラメータをバランス調整パラメータとして用いてモノラル信号に対するバランス調整処理を行うバランス調整手段と、を具備する構成を採る。
本発明のバランス調整方法は、ステレオ符号化データから第1バランスパラメータを復号する復号ステップと、過去に得られたステレオ信号の第1チャネル信号および第2チャネル信号を用いて第2バランスパラメータを算出する算出ステップと、前記第1バランスパラメータが利用不可能な場合に、前記第2バランスパラメータをバランス調整パラメータとして用いてモノラル信号に対するバランス調整処理を行うバランス調整ステップと、を具備するようにした。
本発明によれば、復号信号の定位の揺らぎを抑えてステレオ感を保つことができる。
本発明の実施の形態1に係る音響信号符号化装置および音響信号復号装置の構成を示すブロック図
本発明の実施の形態1に係るステレオ復号部の構成の一例を示すブロック図
本発明の実施の形態1に係るバランス調整部の構成の一例を示すブロック図
本発明の実施の形態1に係る利得係数算出部の構成の一例を示すブロック図
本発明の実施の形態1に係るステレオ復号部の構成の一例を示すブロック図
本発明の実施の形態1に係るバランス調整部の構成の一例を示すブロック図
本発明の実施の形態1に係る利得係数算出部の構成の一例を示すブロック図
本発明の実施の形態2に係るバランス調整部の構成の一例を示すブロック図
本発明の実施の形態2に係る利得係数算出部の構成の一例を示すブロック図
本発明の実施の形態2に係るバランス調整部の構成の一例を示すブロック図
本発明の実施の形態2に係る利得係数算出部の構成の一例を示すブロック図
本発明の実施の形態2に係る利得係数算出部の構成の一例を示すブロック図
以下、本発明の実施の形態について、図面を用いて説明する。なお、本願におけるバランス調整処理とは、モノラル信号にバランスパラメータを乗じてステレオ信号に変換する処理のことを意味し、振幅パニング処理に相当する。また、本願においてバランスパラメータは、モノラル信号をステレオ信号に変換する際にモノラル信号に乗じる利得係数として定義され、振幅パニングにおけるパニング利得係数(gain factor)に相当する。
(実施の形態1)
図1に、実施の形態1に係る音響信号符号化装置100および音響信号復号装置200の各構成を示す。
図1に示すように、音響信号符号化装置100は、A/D変換部101、モノラル符号化部102、ステレオ符号化部103および多重化部104を具備する。
A/D変換部101は、アナログステレオ信号(Lチャネル信号:L,Rチャネル信号:R)を入力とし、このアナログステレオ信号をデジタルステレオ信号に変換してモノラル符号化部102およびステレオ符号化部103へ出力する。
モノラル符号化部102は、デジタルステレオ信号にダウンミックス処理を行ってモノラル信号に変換し、そのモノラル信号を符号化し、符号化結果(モノラル符号化データ)を多重化部104へ出力する。また、モノラル符号化部102は、符号化処理によって得られた情報(モノラル符号化情報)をステレオ符号化部103へ出力する。
ステレオ符号化部103は、デジタルステレオ信号をモノラル符号化情報を用いてパラメトリックに符号化し、バランスパラメータを含む符号化結果(ステレオ符号化データ)を多重化部104へ出力する。
多重化部104は、モノラル符号化データとステレオ符号化データとを多重化し、多重化結果(多重化データ)を音響信号復号装置200の多重化分離部201へ送出する。
なお、多重化部104と多重化分離部201との間には電話回線、パケット網などの伝送路(図示せず)が存在し、多重化部104から出力される多重化データは必要に応じてパケット化などの処理が行われた後に伝送路へ送出される。
一方、音響信号復号装置200は、多重化分離部201、モノラル復号部202、ステレオ復号部203およびD/A変換部204を具備する。
多重化分離部201は、音響信号符号化装置100から送出された多重化データを受信し、その多重化データをモノラル符号化データとステレオ符号化データとに分離し、モノラル符号化データをモノラル復号部202へ出力し、ステレオ符号化データをステレオ復号部203へ出力する。
モノラル復号部202は、モノラル符号化データをモノラル信号に復号し、その復号モノラル信号をステレオ復号部203へ出力する。また、モノラル復号部202は、この復号処理によって得られた情報(モノラル復号情報)をステレオ復号部203へ出力する。
なお、モノラル復号部202は、復号されたモノラル信号を、アップミックス処理されたステレオ信号としてステレオ復号部203へ出力してもよい。モノラル復号部202でアップミックス処理が行われない場合は、アップミックス処理に必要な情報がモノラル復号部202からステレオ復号部203へ出力され、ステレオ復号部203において、復号されたモノラル信号のアップミックス処理を行ってもよい。
ここで、アップミックス処理には特別な情報が必要ない場合が一般的である。しかし、Lチャネル−Rチャネル間の位相を合わせるダウンミックス処理が行われる場合には、位相差情報がアップミックス処理に必要な情報として考えられる。また、Lチャネル−Rチャネル間の振幅レベルを合わせるダウンミックス処理が行われる場合には、振幅レベルを合わせるためのスケーリング係数などがアップミックス処理に必要な情報として考えられる。
ステレオ復号部203は、ステレオ符号化データとモノラル復号情報とを用いて、復号モノラル信号をデジタルステレオ信号に復号し、そのデジタルステレオ信号をD/A変換部204へ出力する。
D/A変換部204は、デジタルステレオ信号をアナログステレオ信号に変換して、そのアナログステレオ信号を復号ステレオ信号(Lチャネル復号信号:L^信号,Rチャネル復号信号:R^信号)として出力する。
次いで図2に、音響信号復号装置200のステレオ復号部203の構成の一例を示す。本実施の形態では、一例として、バランス調整処理により、ステレオ信号をパラメトリックに表現する構成を説明する。
図2に示すように、ステレオ復号部203は、利得係数復号部210およびバランス調整部211を具備する。
利得係数復号部210は、多重化分離部201から入力されたステレオ符号化データからバランスパラメータを復号し、このバランスパラメータをバランス調整部211へ出力する。図2には、Lチャネル用のバランスパラメータとRチャネル用のバランスパラメータの各々が利得係数復号部210から出力される例が示されている。
バランス調整部211は、これらのバランスパラメータを用いて、モノラル信号に対するバランス調整処理を行う。すなわち、バランス調整部211は、これらのバランスパラメータを、モノラル復号部202より入力された復号モノラル信号に乗じて、Lチャネル復号信号とRチャネル復号信号とを生成する。ここで、復号モノラル信号は周波数領域の信号(例えば、FFT(Fast Fourier Transform)係数、MDCT(Modified Discrete Cosine Transform)係数等)であるとする。よって、これらのバランスパラメータは周波数毎に復号モノラル信号に乗算される。
通常の音響信号復号装置では、復号モノラル信号に対する処理はサブバンド毎に行われ、各サブバンドの幅は通常、周波数が高くなるに従って広くなるように設定される。本実施の形態においても、1つのサブバンドに対して1つのバランスパラメータが復号され、各サブバンド内の各周波数成分に対して同一のバランスパラメータが用いられる。なお、復号モノラル信号を時間領域の信号として扱うことも可能である。
次いで図3に、バランス調整部211の構成の一例を示す。
図3に示すように、バランス調整部211は、選択部220、乗算部221、周波数−時間変換部222および利得係数算出部223を具備する。
利得係数復号部210より入力されるバランスパラメータは、選択部220を介して乗算部221へ入力される。
選択部220は、利得係数復号部210からバランスパラメータの入力がある場合(ステレオ符号化データに含まれるバランスパラメータの利用が可能な場合)はそのバランスパラメータを選択し、利得係数復号部210からバランスパラメータの入力がない場合(ステレオ符号化データに含まれるバランスパラメータの利用が不可能な場合)は利得係数算出部223から入力されるバランスパラメータを選択し、選択したバランスパラメータを乗算部221へ出力する。選択部220は、例えば図3に示すように2つの切替スイッチにより構成される。一方の切替スイッチはLチャネル用、他方の切替スイッチはRチャネル用であり、これらの切替スイッチが連動して切り替わることにより上記選択が行われる。
ここで、利得係数復号部210から選択部220へのバランスパラメータの入力がない場合としては、ステレオ符号化データが伝送路上で失われて音響信号復号装置200に受信されなかった場合、または、音響信号復号装置200に受信されたステレオ符号化データに誤りが検出されて廃棄された場合等がある。つまり、利得係数復号部210からバランスパラメータの入力がない場合とは、ステレオ符号化データに含まれるバランスパラメータを利用できない場合に相当する。そこで、ステレオ符号化データに含まれるバランスパラメータの利用可否を示す制御信号が選択部220に入力され、この制御信号に基づき選択部220の切替スイッチの接続状態が切り替わる。
なお、例えばビットレートを下げるために、ステレオ符号化データに含まれるバランスパラメータを使用しない場合に、選択部220が利得係数算出部223から入力されるバランスパラメータを選択してもよい。
乗算部221は、選択部220から入力されたLチャネル用のバランスパラメータとRチャネル用のバランスパラメータのそれぞれを、モノラル復号部202より入力された復号モノラル信号(周波数領域パラメータであるモノラル信号)に乗算し、Lチャネル用およびRチャネル用それぞれの乗算結果(周波数領域パラメータであるステレオ信号)を周波数−時間変換部222および利得係数算出部223へ出力する。つまり、乗算部221は、モノラル信号に対するバランス調整処理を行う。
周波数−時間変換部222は、乗算部221でのLチャネルおよびRチャネルそれぞれにおける乗算結果を時間信号に変換して、LチャネルおよびRチャネルそれぞれのデジタルステレオ信号としてD/A変換部204へ出力する。
利得係数算出部223は、乗算部221でのLチャネルおよびRチャネルそれぞれにおける乗算結果からLチャネルおよびRチャネルそれぞれのバランスパラメータを算出し、それらのバランスパラメータを選択部220へ出力する。
利得係数算出部223でのバランスパラメータの具体的算出方法の一例を以下に示す。
i番目の周波数成分における、Lチャネル用のバランスパラメータをGL[i]、Rチャネル用のバランスパラメータをGR[i]、Lチャネルの復号ステレオ信号をL[i]、Rチャネルの復号ステレオ信号をR[i]とする。利得係数算出部223は、式(1),式(2)に従ってGL[i]およびGR[i]を算出する。
GL[i]=|L[i]|/(|L[i]|+|R[i]|) …式(1)
GR[i]=|R[i]|/(|L[i]|+|R[i]|) …式(2)
なお、式(1)および式(2)において、絶対値をとらないことも可能である。また、分母の計算において、LとRを加算してから絶対値を求めてもよい。ただし、LとRを加算してから絶対値を求める場合、LとRが異符号だとバランスパラメータが大きくなりすぎてしまうことがある。よって、この場合には、バランスパラメータの大きさに対する閾値を設けてバランスパラメータをクリッピングするなどの対策が必要となる。
また、乗算部221の出力信号と、Lチャネル信号およびRチャネル信号それぞれとの誤差を量子化したものが復号される場合には、その復号された量子化誤差を加算した後のLチャネル信号およびRチャネル信号を用いて式(1)および式(2)による利得係数算出を行うのがよい。これにより、バランス調整処理のみによる符号化性能(入力信号を忠実に表現する能力)が不十分な場合でも適切なバランスパラメータを求めることができる。また、上記誤差を量子化したものを復号するためには、図3におけるバランス調整部211は、乗算部221と周波数−時間変換部222との間に、バランス調整処理後の復号Lチャネル信号(すなわち、バランス調整を用いて量子化されたステレオ入力のLチャネル信号)とステレオ入力信号のLチャネル信号との誤差を量子化したもの、および、バランス調整処理後の復号Rチャネル信号(すなわち、バランス調整を用いて量子化されたステレオ入力のRチャネル信号)とステレオ入力信号のRチャネル信号との誤差を量子化したものをそれぞれ復号する量子化誤差復号部が挿入された構成となる(図示せず)。量子化誤差復号部は、乗算部221からLチャネルおよびRチャネルそれぞれの復号ステレオ信号を入力するとともに、多重化分離部201から量子化誤差符号化データを入力して復号を行い、得られる量子化誤差復号信号をLチャネルおよびRチャネルそれぞれの復号ステレオ信号に加算して、それらの加算結果を最終的な復号ステレオ信号として時間−周波数変換部222へ出力する。
次いで図4に、利得係数算出部223の構成の一例を示す。
図4に示すように、利得係数算出部223は、Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232、Rチャネル平滑化処理部233、Lチャネル利得係数算出部234、Rチャネル利得係数算出部235、加算部236およびスケーリング部237を具備する。
Lチャネル絶対値算出部230は、乗算部221より入力されるLチャネル信号の周波数領域パラメータの各周波数成分の絶対値を求めてLチャネル平滑化処理部232へ出力する。
Rチャネル絶対値算出部231は、乗算部221より入力されるRチャネル信号の周波数領域パラメータの各周波数成分の絶対値を求めてRチャネル平滑化処理部233へ出力する。
Lチャネル平滑化処理部232は、Lチャネル信号の周波数領域パラメータの各周波数成分の絶対値に対し、周波数軸での平滑化処理を行い、Lチャネル信号を周波数軸上で平滑化した周波数領域パラメータをLチャネル利得係数算出部234および加算部236に出力する。
ここで、周波数軸での平滑化処理とは、周波数領域パラメータに対して周波数軸上でローパスフィルタ処理を施すことに相当する。
具体的には式(3)に示すように各周波数成分に対して前後1成分を加算して平均値を求める、すなわち3点の移動平均を計算する、などの処理を行う。式(3)において、LF(f)はLチャネル信号の周波数領域パラメータ(絶対値をとった後のパラメータ)、LFs(f)はLチャネル信号の平滑化処理後の周波数領域パラメータであり、fは周波数番号(整数)である。
LFs(f)=(LF(f−1)+LF(f)+LF(f+1))/3 …式(3)
なお、式(4)に示すように、自己回帰型のローパスフィルタ処理を用いて周波数軸での平滑化処理を行うことも可能である。αは平滑化係数である。
LFs(f)=LF(f)+α×LFs(f−1) 0<α<1 …式(4)
Rチャネル平滑化処理部233は、Rチャネル信号の周波数領域パラメータの各周波数成分の絶対値に対し、周波数軸での平滑化処理を行い、Rチャネル信号を周波数軸上で平滑化した周波数領域パラメータをRチャネル利得係数算出部235および加算部236に出力する。
Rチャネル平滑化処理部233での平滑化処理としては、Lチャネル平滑化処理部232での平滑化処理と同様に、式(5)に示すように各周波数成分に対して前後1成分を加算して平均値を求める、すなわち3点の移動平均を計算する、などの処理を行う。式(5)において、RF(f)はRチャネル信号の周波数領域パラメータ(絶対値をとった後のパラメータ)であり、RFs(f)はRチャネル信号の平滑化処理後の周波数領域パラメータである。
RFs(f)=(RF(f−1)+RF(f)+RF(f+1))/3 …式(5)
なお、上記同様、式(6)に示すように、自己回帰型のローパスフィルタ処理を用いて周波数軸での平滑化処理を行うことも可能である。
RFs(f)=RF(f)+α×RFs(f−1) 0<α<1 …式(6)
なお、Lチャネルの平滑化処理とRチャネルの平滑化処理とは必ずしも同一の処理でなくてもよい。例えば、Lチャネルの信号特性とRチャネルの信号特性とが異なる場合、意図的に異なる平滑化処理を用いた方がよい場合もある。
加算部236は、Lチャネル信号の平滑化された周波数領域パラメータと、Rチャネル信号の平滑化された周波数領域パラメータとを周波数成分ごとに加算して、加算結果をLチャネル利得係数算出部234とRチャネル利得係数算出部235とに出力する。
Lチャネル利得係数算出部234は、Lチャネル信号の平滑化された周波数領域パラメータ(LFs(f))と、加算部236から入力される加算結果(LFs(f)+RFs(f))との振幅比を算出し、その振幅比をスケーリング部237へ出力する。すなわち、Lチャネル利得係数算出部234は、式(7)に示すgL(f)を算出する。
gL(f)=LFs(f)/(LFs(f)+RFs(f)) …式(7)
Rチャネル利得係数算出部235は、Rチャネル信号の平滑化された周波数領域パラメータ(RFs(f))と、加算部236から入力される加算結果(LFs(f)+RFs(f))との振幅比を算出し、その振幅比をスケーリング部237へ出力する。すなわち、Rチャネル利得係数算出部235は、式(8)に示すgR(f)を算出する。
gR(f)=RFs(f)/(LFs(f)+RFs(f)) …式(8)
スケーリング部237は、gL(f)およびgR(f)に対してスケーリング処理を行ってLチャネル用のバランスパラメータGL(f)およびRチャネル用のバランスパラメータGR(f)を算出し、1フレーム遅延後に、これらのバランスパラメータを選択部220へ出力する。
ここで、モノラル信号M(f)が、例えばM(f)=0.5(L(f)+R(f))で定義される場合、スケーリング部237はGL(f)+GR(f)=2.0となるように、gL(f)およびgR(f)のスケーリング処理を行う。具体的には、スケーリング部237は、2/(gL(f)+gR(f))をgL(f)およびgR(f)にそれぞれ乗じてGL(f)およびGR(f)を算出する。
なお、GL(f)+GR(f)=2.0の関係を満たすように、GL(f)およびGR(f)が、Lチャネル利得係数算出部234およびRチャネル利得係数算出部235でそれぞれ算出される場合には、スケーリング部237においてスケーリング処理を行う必要は無い。例えば、Lチャネル利得係数算出部234においてGL(f)が算出された後で、GR(f)がGR(f)=2.0−GL(f)で算出される場合にはスケーリング部237にてスケーリング処理を行う必要は無い。よって、この場合にはLチャネル利得係数算出部234およびRチャネル利得係数算出部235の出力を選択部220へ入力するようにしても良い。本構成の詳細については、図12を用いて後述する。また、ここでは、Lチャネル利得係数を先に算出する形態で説明したが、Rチャネル利得係数を先に算出し、Lチャネル利得係数GL(f)を、GL(f)=2.0−GR(f)にて算出するようにしても良い。
なお、ステレオ符号化データに含まれるバランスパラメータが連続して利用不可能な場合には、利得係数算出部223から出力されるバランスパラメータが選択される状態が続く。この場合でも、利得係数算出部223での上記処理を繰り返すようにすれば、上記平滑化処理が繰り返されることにより、利得係数算出部223において算出されるバランスパラメータは全帯域に渡って徐々に平均化され、Lチャネル−Rチャネル間のレベルバランスを適切なレベルバランスに収束させることができる。
また、利得係数算出部223から出力されるバランスパラメータが選択される状態が続く場合には、バランスパラメータを、最初に算出されたバランスパラメータから徐々に1.0に近づける(すなわちモノラルに近づける)処理を行ってもよい。例えば、式(9)に示す処理を行ってもよい。この場合は、バランスパラメータが最初に利用不可能になるフレーム以外において、上記の平滑化処理は不要となる。よって、この処理を用いることにより、上記の平滑化処理を行う場合に比べて、利得係数算出に係る演算量を低減することができる。なお、βは平滑化係数である。
GL(f)=βGL(f)+(1−β) 0<β<1 …式(9)
また、利得係数算出部223から出力されるバランスパラメータが選択される状態が続いた後、利得係数復号部210から出力されるバランスパラメータが選択される状態に切り替わる場合には、音像または定位が急変する現象が発生する。このような急変により主観的な品質が損なわれることがある。そこで、この場合には、利得係数復号部210から出力されたバランスパラメータと、選択状態が切り替わる直前に利得係数算出部223から出力されたバランスパラメータとの中間値を、乗算部221に入力するバランスパラメータとして用いてもよい。例えば、乗算部221に入力するバランスパラメータを式(10)に従って求めてもよい。ここでは、利得係数復号部210から入力されるバランスパラメータをG^、利得係数算出部223から最後に出力されたバランスパラメータをGp、乗算部221に入力するバランスパラメータをGmとする。γは内分係数であり、βはγを平滑化するための平滑化係数である。
Gm=γGp+(1−γ)G^ γ=βγ 0<β<1 …式(10)
このようにすれば、利得係数復号部210から出力されるバランスパラメータが選択される状態が続くとともに、すなわち式(10)の処理が繰り返される度に、γが0に近づき、利得係数復号部210から出力されるバランスパラメータが選択される状態がある程度のフレーム数続けば、Gm=G^となる。Gm=G^になるまでのフレーム数を予め決めておき、利得係数復号部210から出力されるバランスパラメータが選択される状態がそのフレーム数だけ続いた時点でGm=G^に設定するようにしてもよい。このように、乗算部221に入力されるバランスパラメータを、利得係数復号部210から入力されるバランスパラメータに徐々に近づけることにより、音像または定位の急変による主観的な品質の劣化を回避することができる。
このように、本実施の形態では、ステレオ符号化データに含まれるバランスパラメータを利用できない(あるいは利用しない)場合には、過去に得られたステレオ信号のLチャネル信号およびRチャネル信号から算出されるバランスパラメータを用いて、モノラル信号に対するバランス調整処理を行う。よって、本実施の形態によれば、復号信号の定位の揺らぎを抑えてステレオ感を保つことができる。
また、本実施の形態では、ステレオ信号のLチャネル信号とRチャネル信号とを加算した信号に対するLチャネル信号の振幅比またはRチャネル信号の振幅比を用いてバランスパラメータを算出する。よって、本実施の形態によれば、モノラル信号に対するLチャネル信号の振幅比またはRチャネル信号の振幅比を用いるよりも適切なバランスパラメータを求めることができる。
また、本実施の形態では、バランスパラメータの算出において、Lチャネル信号およびRチャネル信号に対して周波数軸での平滑化処理を行う。よって、本実施の形態によれば、バランス調整処理を行う周波数単位(周波数分解能)が細かい場合でも安定した定位とステレオ感を得ることができる。
よって、本実施の形態によれば、バランスパラメータ等のバランス調整情報をパラメトリックステレオパラメータとして利用できない場合にも、高品質な擬似ステレオ信号を生成することができる。
(変形例)
図5に、音響信号復号装置200のステレオ復号部203aの構成の変形例を示す。本変形例では、図2の構成に加えて、多重化分離部301と残差信号復号部302とを備える。図5において、図2と同じ動作をするブロックは図2と同じ番号を付し、その動作の説明を省略する。
多重化分離部301は、多重化分離部201が出力したステレオ符号化データを入力し、バランスパラメータ符号化データと残差信号符号化データとに分離し、バランスパラメータ符号化データを利得係数復号部210に、残差信号符号化データを残差信号復号部302に、それぞれ出力する。
残差信号復号部302は、多重化分離部301が出力した残差信号符号化データを入力し、復号した各チャネルの残差信号をバランス調整部211aへ出力する。
この変形例では、バランス調整処理により、ステレオ信号をパラメトリックに表現するとともにパラメトリックに表現しきれない誤差成分を残差信号として符号化するモノラル−ステレオスケーラブル符号化が行われる構成(つまり、例えば、特許文献3のFig.10に示されるような構成)に、本発明が適用される場合について説明されている。
次いで、図6に、本変形例におけるバランス調整部211aの構成を示す。
図6に示すように、本変形例におけるバランス調整部211aは、図3の構成に加えて、加算部303,304と、選択部305とをさらに備える。図6において、図3と同じ動作を行うブロックについては、同じ番号を付し、その動作説明を省略する。
加算部303は、乗算部221から出力されたLチャネル信号と、選択部305から出力されるLチャネル残差信号と、をそれぞれ入力し、両者の加算処理を行い、加算結果を周波数−時間変換部222および利得係数算出部223へ出力する。
加算部304は、乗算部221から出力されたRチャネル信号と、選択部305から出力されるRチャネル残差信号と、をそれぞれ入力し、両者の加算処理を行い、加算結果を周波数−時間変換部222および利得係数算出部223へ出力する。
選択部305は、残差信号復号部302から残差信号の入力がある場合(つまり、ステレオ符号化データに含まれる残差信号の利用が可能な場合)には、その残差信号を選択し、加算部303および加算部304へ出力する。また、選択部305は、残差信号復号部302から残差信号の入力がない場合(つまり、ステレオ符号化データに含まれる残差信号の利用が不可能な場合)には、何も出力しないか、又は、全零信号を加算部303および加算部304へ出力する。選択部305は、例えば、図6に示すように2つの切替スイッチにより構成される。一方の切替スイッチはLチャネル用で加算部303に出力端子が接続されており、他方の切替スイッチはRチャネル用で加算部304に出力端子が接続されている。そして、これらの切替スイッチが連動して切り替わることにより上記選択が行われる。
ここで、残差信号復号部302から選択部305への残差信号の入力がないケースとしては、ステレオ符号化データが伝送路上で失われて音響信号復号装置200に受信されなかったケース、又は、音響信号復号装置200に受信されたステレオ符号化データに誤りが検出されて破棄されたケースなどが想定される。つまり、残差信号復号部302から残差信号の入力がない場合とは、ステレオ符号化データに含まれる残差信号を何らかの理由により利用できない場合のことである。図6には、ステレオ符号化データに含まれる残差信号の利用可否を示す制御信号が選択部305に入力され、この制御信号に基づいて選択部305の切替スイッチの接続状態が切り替わる構成が示されている。
なお、例えばビットレートを下げる目的で、ステレオ符号化データに含まれる残差信号を使用しない場合に、選択部305が切替スイッチを開放して何も出力しないようにしても良いし、又は、全零信号を出力するようにしても良い。
周波数−時間変換部222は、加算部303から出力された加算結果と、加算部304から出力された加算結果とを時間信号に変換して、LチャネルおよびRチャネルそれぞれのデジタルステレオ信号としてD/A変換部204へ出力する。
利得係数算出部223でのバランスパラメータの具体的算出方法は、図4を参照して説明したものと同様である。ただし、Lチャネル絶対値算出部230への入力は加算部303の出力結果であり、Rチャネル絶対値算出部231への入力は加算部304の出力結果であるところのみが異なる。この様子は、図7に示されている。
(実施の形態2)
実施の形態2に係る音響信号復号装置の説明を行う。実施の形態2に係る音響信号復号装置の構成と実施の形態1に係る音響信号復号装置200の構成とが異なるのは、バランス調整部のみである。従って、以下では、主にバランス調整部の構成および動作について説明を行う。
図8に、実施の形態2に係るバランス調整部511の構成を示す。図8に示すように、バランス調整部511は、選択部220、乗算部221、周波数−時間変換部222および利得係数算出部523を具備する。選択部220、乗算部221および周波数−時間変換部222は、バランス調整部211を構成する各同一名称部と同一の動作をするので、説明を省略する。
利得係数算出部523は、モノラル復号部202より入力される復号モノラル信号、選択部220より入力されるLR両チャネルのバランスパラメータ、および、乗算部221より入力されるLチャネルおよびRチャネルそれぞれにおける乗算結果(つまり、LR両チャネルの周波数領域パラメータ)を用いて補償用のバランスパラメータを算出する。補償用バランスパラメータは、LチャネルおよびRチャネルそれぞれについて算出される。これらの補償用バランスパラメータは、選択部220に出力される。
次いで図9に、利得係数算出部523の構成を示す。
図9に示すように、利得係数算出部523は、Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232、Rチャネル平滑化処理部233、Lチャネル利得係数記憶部601、Rチャネル利得係数記憶部602、主要成分利得係数算出部603、主要成分検出部604および切替スイッチ605を具備する。Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232およびRチャネル平滑化処理部233は、実施の形態1で説明した利得係数算出部223を構成する各同一名称部と同一の動作をする。
主要成分検出部604は、モノラル復号部202より復号モノラル信号を受け取る。この復号モノラル信号は、周波数領域パラメータである。主要成分検出部604は、入力された復号モノラル信号に含まれる周波数成分のうち振幅が閾値を超える周波数成分を検出し、この検出周波数成分を主要成分周波数情報として主要成分利得係数算出部603および切替スイッチ605に出力する。ここで、検出に用いる閾値は、固定値としても良いし、周波数領域パラメータ全体の平均振幅に対する一定比としても良い。また、主要成分周波数情報として出力される検出周波数成分の数は特に限定されるものではなく、閾値を超える周波数成分のすべてとしても良いし、予め決められた数としても良い。
Lチャネル利得係数記憶部601は、選択部220よりLチャネルのバランスパラメータが入力され、記憶する。記憶されたLチャネルのバランスパラメータは、次フレーム以降に切替スイッチ605に出力される。また、Rチャネル利得係数記憶部602は、選択部220よりRチャネルのバランスパラメータが入力され、記憶する。記憶されたRチャネルのバランスパラメータは、次フレーム以降に切替スイッチ605に出力される。
ここで、選択部220は、利得係数復号部210で得られたバランスパラメータおよび利得係数算出部523から出力されたバランスパラメータのうちの一方を、乗算部221において次に用いられるバランスパラメータ(例えば、現フレームで用いられるバランスパラメータ)として選択する。この選択されたバランスパラメータは、Lチャネル利得係数記憶部601およびRチャネル利得係数記憶部602にも入力され、乗算部221で前回用いられたバランスパラメータ(例えば、1つ前のフレームで用いられたバランスパラメータ)として記憶される。また、バランスパラメータは周波数毎に記憶される。
主要成分利得係数算出部603は、Lチャネル利得係数算出部234、Rチャネル利得係数算出部235、加算部236およびスケーリング部237より構成される。主要成分利得係数算出部603を構成する各部位は、利得係数算出部223を構成する各同一名称部と同一の動作をする。
ただし、主要成分利得係数算出部603は、主要成分検出部604より入力される主要成分周波数情報、並びに、Lチャネル平滑化処理部232およびRチャネル平滑化処理部233より受け取る平滑化処理後の周波数領域パラメータに基づいて、主要成分周波数情報として与えられる周波数成分についてのみバランスパラメータを算出する。
すなわち、主要成分検出部604より入力された主要成分周波数情報をjとすると、例えば、上記した式(1)および式(2)に従って、GL[j]、GR[j]が算出される。ただし、j∈iの条件が満たされる。なお、ここでは説明を簡単にするために、平滑化処理は考慮されていない。
このように算出された主要周波数に対応するバランスパラメータは、切替スイッチ605へ出力される。
切替スイッチ605は、主要成分利得係数算出部603、Lチャネル利得係数記憶部601およびRチャネル利得係数記憶部602からそれぞれバランスパラメータが入力される。切替スイッチ605は、主要成分検出部604から入力される主要成分周波数情報に基づいて、主要成分利得係数算出部603から受け取るバランスパラメータ、又は、Lチャネル利得係数記憶部601およびRチャネル利得係数記憶部602から受け取るバランスパラメータを周波数成分毎に選択し、選択したバランスパラメータを選択部220へ出力する。
具体的には、切り換えスイッチ605は、主要成分周波数情報をjとすると、周波数成分jに対しては主要成分利得係数算出部603からの入力であるバランスパラメータGL[j]およびGR[j]を選択し、それ以外の周波数成分に対してはLチャネル利得係数記憶部601およびRチャネル利得係数記憶部602からの入力であるバランスパラメータを選択する。
以上のように本実施の形態によれば、利得係数算出部523において、主要成分利得係数算出部603が主要周波数成分についてのみバランスパラメータを算出し、切り換えスイッチ605は、主要周波数成分のバランスパラメータとしては主要成分利得係数算出部603で得られたバランスパラメータを選択的に出力する一方、主要周波数成分以外の周波数成分のバランスパラメータとしてはLチャネル利得係数記憶部601およびRチャネル利得係数記憶部602に記憶されているバランスパラメータを選択的に出力する。
こうすることで、振幅が大きい周波数成分でのみバランスパラメータが算出されて使用され、それ以外の周波数成分では過去のバランスパラメータが使用されるので、少ない処理量で高品質な擬似ステレオ信号を生成することができる。
(変形例1)
図10に、実施の形態2の変形例に係るバランス調整部511aの構成を示す。本変形例では、図8の構成に加えて、加算部303,304と、選択部305とを備える。図8に追加された構成要素の動作は、図6に示したものと同じであるので、同じ番号を付しその動作説明を省略する。
図11に、本変形例における利得係数算出部523の構成を示す。構成および動作は図9と同一であるので同じ番号を付し説明を省略する。Lチャネル絶対値算出部230への入力が加算部303の出力である点と、Rチャネル絶対値算出部231への入力が加算部304の出力である点のみが異なる。
(変形例2)
Lチャネル平滑化処理部232、Rチャネル平滑化処理部233で行う平滑化処理が、式(3)および式(5)のように主要成分周波数周辺の周波数成分のみを用いて平滑化処理を行う形態の場合には、Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232およびRチャネル平滑化処理部233のそれぞれで行われる処理は、全周波数成分で行われる必要はなく、必要な周波数成分でのみ行われれば良い。こうすることで、利得係数算出部523における処理量をさらに削減することができる。具体的には、主要成分周波数情報をjとすると、j−1、j、j+1の周波数成分に対してLチャネル絶対値算出部230およびRチャネル絶対値算出部231を動作させる。この結果を用いて、Lチャネル平滑化処理部232およびRチャネル平滑化処理部233は、周波数成分jに対してのみ平滑化した周波数領域パラメータを算出すれば良い。
図12に、本変形例における利得係数算出部523aの構成を示す。なお、実施の形態1で触れた、右チャネル利得係数GR(f)を、GR(f)=2.0−GL(f)により算出する構成も合わせて、図12に示されている。図11の構成と、同一の構成、動作するものは同じ番号を付し、説明を省略する。図11とは、主要成分利得係数算出部の内部構成が主に異なる。
主要成分利得係数算出部606は、Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232、Rチャネル平滑化処理部233、Lチャネル利得係数算出部234、Rチャネル利得係数算出部607、および加算部236により構成される。
主要成分利得係数算出部606は、主要成分検出部604より入力された主要成分周波数情報jに対してのみバランスパラメータを算出する。ここでは、Lチャネル平滑化処理部232およびRチャネル平滑化処理部233における平滑化処理が、上記した式(3)および式(5)に示す3点の平滑化を用いる場合を例にとって説明する。このため本変形例では、主要成分利得係数算出部606は、Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232、およびRチャネル平滑化処理部233を含めた構成を示すものとする。
Lチャネル絶対値算出部230およびRチャネル絶対値算出部231は、j−1、j、j+1の周波数成分に対してのみ絶対値処理を行う。
Lチャネル平滑化処理部232およびRチャネル平滑化処理部233は、j−1、j、j+1の各チャネルの周波数成分の絶対値がそれぞれ入力され、周波数成分jに対する平滑値を算出し、加算部236に出力する。Lチャネル平滑化処理部232の出力は、Lチャネル利得係数算出部234にも入力される。
Lチャネル利得係数算出部234は、図11と同様に、周波数成分jの左チャネル用のバランスパラメータを算出する。算出されたLチャネル用バランスパラメータは、切替スイッチ605およびRチャネル利得係数算出部607に出力される。
Rチャネル利得係数算出部607は、Lチャネル用バランスパラメータが入力されると、GR(f)=2.0−GL(f)の関係から、GR(f)を算出する。このように算出されるバランスパラメータは、GL(f)+GR(f)=2.0を満たすので、スケーリング部237によるスケーリング処理は不要となる。算出されたRチャネル用バランスパラメータは切替スイッチ605に出力される。
このような構成をとることにより、絶対値処理、平滑化処理、バランスパラメータ算出を主要成分についてのみ行うため、より少ない処理量にてバランスパラメータを算出することができる。
なお、利得係数算出部523aの構成を図8の利得係数算出部523に適用する場合には、Lチャネル絶対値算出部230およびRチャネル絶対値算出部231への入力は、乗算部221の出力となる。
また、図9および図11の利得係数算出部523の構成では、主要成分利得係数算出部603において、主要成分周波数についてのみの処理を行うこととした。しかし、図9および図11の利得係数算出部523においても、図12の利得係数算出部523aと同様に、Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232、およびRチャネル平滑化処理部233を含む構成を主要成分利得係数算出部とし、Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232、およびRチャネル平滑化処理部233における処理についても、主要成分周波数についてのみの処理としても良い。
以上、本発明の実施の形態およびその変形例について説明した。
なお、本発明の説明に用いた音響信号は、オーディオ信号、音声信号、等の信号を総称して用いたものである。本発明は、これら信号のいずれかでも、混在する場合でも適用可能である。
また、各実施の形態およびその変形例では、左チャネル信号をL、右チャネル信号をRとして説明したが、L、Rという表記により位置に関する条件が特定されるものではない。
また、各実施の形態およびその変形例では、LとRの2チャネルの構成を例として説明したが、複数のチャネルの平均信号をモノラル信号として定義し、各チャネルの信号への重み係数をバランスパラメータとしてモノラル信号に乗じることにより各チャネルの信号を表現するマルチチャネル符号化方式のフレーム消失隠蔽処理においても、本発明は適用可能である。この場合、式(1)、(2)に対応して、例えば3チャネルの場合は、以下のようにバランスパラメータを定義することができる。ここで、Cは3番目のチャネルの信号を、GCは3番目のチャネルのバランスパラメータを、それぞれ表す。
GL[i]=|L[i]|/(|L[i]|+|R[i]|+|C[i]|)
…式(11)
GR[i]=|R[i]|/(|L[i]|+|R[i]|+|C[i]|)
…式(12)
GC[i]=|C[i]|/(|L[i]|+|R[i]|+|C[i]|)
…式(13)
また、各実施の形態およびその変形例に係る音響信号復号装置は、本実施の形態に係る音響信号符号化装置が送信した多重化データ(ビットストリーム)を受信して処理を行う場合を例にとって説明したが、本発明はこれに限定されず、各実施の形態に係る音響信号復号装置が受信して処理するビットストリームは、この音響信号復号装置で処理可能なビットストリームを生成可能な音響信号符号化装置が送信したものであれば良い。
また、本発明に係る音響信号復号装置は、上記実施の形態およびその変形例に限定されず、種々変更して実施することが可能である。
また、本発明に係る音響信号復号装置は、移動体通信システムにおける通信端末装置または基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置および移動体通信システムを提供することができる。
また、各実施の形態およびその変形例では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係る音響信号復号方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明の音響信号復号装置と同様の機能を実現することができる。
また、各実施の形態およびその変形例の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
2008年6月27日出願の特願2008−168180及び2008年11月19日出願の特願2008−295814の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る音響信号復号装置は、利用可能なメモリ量に制限があり、かつ、低速での無線通信を強いられる携帯電話等の通信端末装置に特に有用である。
本発明は、音響信号復号装置および音響信号復号装置におけるバランス調整方法に関する。
ステレオ音響信号を低ビットレートで符号化する方式として、インテンシティステレオ方式が知られている。インテンシティステレオ方式では、モノラル信号にスケーリング係数を乗じてLチャネル信号(左チャネル信号)とRチャネル信号(右チャネル信号)とを生成する手法を採る。このような手法は振幅パニング(amplitude panning)とも呼ばれる。
振幅パニングの最も基本的な手法は、時間領域におけるモノラル信号に振幅パニング用の利得係数(パニング利得係数)を乗じてLチャネル信号およびRチャネル信号を求めるものである(例えば非特許文献1参照)。また、別な手法として、周波数領域において個々の周波数成分ごと(または周波数グループごと)にモノラル信号にパニング利得係数を乗じてLチャネル信号およびRチャネル信号を求めるものもある(例えば非特許文献2および特許文献3参照)。
パニング利得係数をパラメトリックステレオの符号化パラメータとして利用すると、ステレオ信号のスケーラブル符号化(モノラル−ステレオスケーラブル符号化)を実現することができる(例えば特許文献1および特許文献2参照)。パニング利得係数は、特許文献1においてはバランスパラメータとして、特許文献2においてはILD(レベル差)として、それぞれ説明されている。
また、パニングをモノラル−ステレオ予測に用い、パニングによって得られるステレオ信号と入力ステレオ信号との誤差を符号化する、モノラル−ステレオスケーラブル符号化も提案されている(例えば特許文献3)。
特表2004−535145号公報
特表2005−533271号公報
国際公開第2009/038512号公報
しかしながら、モノラル−ステレオスケーラブル符号化において、ステレオ符号化データが伝送路上で失われてしまい、復号装置側に受信されないことがある。また、伝送路上
においてステレオ符号化データに誤りが発生し、復号装置側においてそのステレオ符号化データが廃棄されることがある。このような場合、復号装置では、ステレオ符号化データに含まれるバランスパラメータ(パニング利得係数)を利用できないため、ステレオとモノラルとが切り替わることが発生し、復号される音響信号の定位が揺らいでしまう。その結果、ステレオ音響信号の品質が劣化してしまう。
本発明の目的は、復号信号の定位の揺らぎを抑えてステレオ感を保つことができる音響信号復号装置および音響信号復号装置におけるバランス調整(振幅パニング)方法を提供することである。
本発明の音響信号復号装置は、ステレオ符号化データから第1バランスパラメータを復号する復号手段と、過去に得られたステレオ信号の第1チャネル信号および第2チャネル信号を用いて第2バランスパラメータを算出する算出手段と、前記第1バランスパラメータが利用不可能な場合に、前記第2バランスパラメータをバランス調整パラメータとして用いてモノラル信号に対するバランス調整処理を行うバランス調整手段と、を具備する構成を採る。
本発明のバランス調整方法は、ステレオ符号化データから第1バランスパラメータを復号する復号ステップと、過去に得られたステレオ信号の第1チャネル信号および第2チャネル信号を用いて第2バランスパラメータを算出する算出ステップと、前記第1バランスパラメータが利用不可能な場合に、前記第2バランスパラメータをバランス調整パラメータとして用いてモノラル信号に対するバランス調整処理を行うバランス調整ステップと、を具備するようにした。
本発明によれば、復号信号の定位の揺らぎを抑えてステレオ感を保つことができる。
本発明の実施の形態1に係る音響信号符号化装置および音響信号復号装置の構成を示すブロック図
本発明の実施の形態1に係るステレオ復号部の構成の一例を示すブロック図
本発明の実施の形態1に係るバランス調整部の構成の一例を示すブロック図
本発明の実施の形態1に係る利得係数算出部の構成の一例を示すブロック図
本発明の実施の形態1に係るステレオ復号部の構成の一例を示すブロック図
本発明の実施の形態1に係るバランス調整部の構成の一例を示すブロック図
本発明の実施の形態1に係る利得係数算出部の構成の一例を示すブロック図
本発明の実施の形態2に係るバランス調整部の構成の一例を示すブロック図
本発明の実施の形態2に係る利得係数算出部の構成の一例を示すブロック図
本発明の実施の形態2に係るバランス調整部の構成の一例を示すブロック図
本発明の実施の形態2に係る利得係数算出部の構成の一例を示すブロック図
本発明の実施の形態2に係る利得係数算出部の構成の一例を示すブロック図
以下、本発明の実施の形態について、図面を用いて説明する。なお、本願におけるバランス調整処理とは、モノラル信号にバランスパラメータを乗じてステレオ信号に変換する処理のことを意味し、振幅パニング処理に相当する。また、本願においてバランスパラメータは、モノラル信号をステレオ信号に変換する際にモノラル信号に乗じる利得係数として定義され、振幅パニングにおけるパニング利得係数(gain factor)に相当する。
(実施の形態1)
図1に、実施の形態1に係る音響信号符号化装置100および音響信号復号装置200の各構成を示す。
図1に示すように、音響信号符号化装置100は、A/D変換部101、モノラル符号化部102、ステレオ符号化部103および多重化部104を具備する。
A/D変換部101は、アナログステレオ信号(Lチャネル信号:L,Rチャネル信号:R)を入力とし、このアナログステレオ信号をデジタルステレオ信号に変換してモノラル符号化部102およびステレオ符号化部103へ出力する。
モノラル符号化部102は、デジタルステレオ信号にダウンミックス処理を行ってモノラル信号に変換し、そのモノラル信号を符号化し、符号化結果(モノラル符号化データ)を多重化部104へ出力する。また、モノラル符号化部102は、符号化処理によって得られた情報(モノラル符号化情報)をステレオ符号化部103へ出力する。
ステレオ符号化部103は、デジタルステレオ信号をモノラル符号化情報を用いてパラメトリックに符号化し、バランスパラメータを含む符号化結果(ステレオ符号化データ)を多重化部104へ出力する。
多重化部104は、モノラル符号化データとステレオ符号化データとを多重化し、多重化結果(多重化データ)を音響信号復号装置200の多重化分離部201へ送出する。
なお、多重化部104と多重化分離部201との間には電話回線、パケット網などの伝送路(図示せず)が存在し、多重化部104から出力される多重化データは必要に応じてパケット化などの処理が行われた後に伝送路へ送出される。
一方、音響信号復号装置200は、多重化分離部201、モノラル復号部202、ステレオ復号部203およびD/A変換部204を具備する。
多重化分離部201は、音響信号符号化装置100から送出された多重化データを受信し、その多重化データをモノラル符号化データとステレオ符号化データとに分離し、モノラル符号化データをモノラル復号部202へ出力し、ステレオ符号化データをステレオ復号部203へ出力する。
モノラル復号部202は、モノラル符号化データをモノラル信号に復号し、その復号モノラル信号をステレオ復号部203へ出力する。また、モノラル復号部202は、この復号処理によって得られた情報(モノラル復号情報)をステレオ復号部203へ出力する。
なお、モノラル復号部202は、復号されたモノラル信号を、アップミックス処理されたステレオ信号としてステレオ復号部203へ出力してもよい。モノラル復号部202でアップミックス処理が行われない場合は、アップミックス処理に必要な情報がモノラル復号部202からステレオ復号部203へ出力され、ステレオ復号部203において、復号されたモノラル信号のアップミックス処理を行ってもよい。
ここで、アップミックス処理には特別な情報が必要ない場合が一般的である。しかし、Lチャネル−Rチャネル間の位相を合わせるダウンミックス処理が行われる場合には、位相差情報がアップミックス処理に必要な情報として考えられる。また、Lチャネル−Rチャネル間の振幅レベルを合わせるダウンミックス処理が行われる場合には、振幅レベルを合わせるためのスケーリング係数などがアップミックス処理に必要な情報として考えられ
る。
ステレオ復号部203は、ステレオ符号化データとモノラル復号情報とを用いて、復号モノラル信号をデジタルステレオ信号に復号し、そのデジタルステレオ信号をD/A変換部204へ出力する。
D/A変換部204は、デジタルステレオ信号をアナログステレオ信号に変換して、そのアナログステレオ信号を復号ステレオ信号(Lチャネル復号信号:L^信号,Rチャネル復号信号:R^信号)として出力する。
次いで図2に、音響信号復号装置200のステレオ復号部203の構成の一例を示す。本実施の形態では、一例として、バランス調整処理により、ステレオ信号をパラメトリックに表現する構成を説明する。
図2に示すように、ステレオ復号部203は、利得係数復号部210およびバランス調整部211を具備する。
利得係数復号部210は、多重化分離部201から入力されたステレオ符号化データからバランスパラメータを復号し、このバランスパラメータをバランス調整部211へ出力する。図2には、Lチャネル用のバランスパラメータとRチャネル用のバランスパラメータの各々が利得係数復号部210から出力される例が示されている。
バランス調整部211は、これらのバランスパラメータを用いて、モノラル信号に対するバランス調整処理を行う。すなわち、バランス調整部211は、これらのバランスパラメータを、モノラル復号部202より入力された復号モノラル信号に乗じて、Lチャネル復号信号とRチャネル復号信号とを生成する。ここで、復号モノラル信号は周波数領域の信号(例えば、FFT(Fast Fourier Transform)係数、MDCT(Modified Discrete Cosine Transform)係数等)であるとする。よって、これらのバランスパラメータは周波数毎に復号モノラル信号に乗算される。
通常の音響信号復号装置では、復号モノラル信号に対する処理はサブバンド毎に行われ、各サブバンドの幅は通常、周波数が高くなるに従って広くなるように設定される。本実施の形態においても、1つのサブバンドに対して1つのバランスパラメータが復号され、各サブバンド内の各周波数成分に対して同一のバランスパラメータが用いられる。なお、復号モノラル信号を時間領域の信号として扱うことも可能である。
次いで図3に、バランス調整部211の構成の一例を示す。
図3に示すように、バランス調整部211は、選択部220、乗算部221、周波数−時間変換部222および利得係数算出部223を具備する。
利得係数復号部210より入力されるバランスパラメータは、選択部220を介して乗算部221へ入力される。
選択部220は、利得係数復号部210からバランスパラメータの入力がある場合(ステレオ符号化データに含まれるバランスパラメータの利用が可能な場合)はそのバランスパラメータを選択し、利得係数復号部210からバランスパラメータの入力がない場合(ステレオ符号化データに含まれるバランスパラメータの利用が不可能な場合)は利得係数算出部223から入力されるバランスパラメータを選択し、選択したバランスパラメータを乗算部221へ出力する。選択部220は、例えば図3に示すように2つの切替スイッ
チにより構成される。一方の切替スイッチはLチャネル用、他方の切替スイッチはRチャネル用であり、これらの切替スイッチが連動して切り替わることにより上記選択が行われる。
ここで、利得係数復号部210から選択部220へのバランスパラメータの入力がない場合としては、ステレオ符号化データが伝送路上で失われて音響信号復号装置200に受信されなかった場合、または、音響信号復号装置200に受信されたステレオ符号化データに誤りが検出されて廃棄された場合等がある。つまり、利得係数復号部210からバランスパラメータの入力がない場合とは、ステレオ符号化データに含まれるバランスパラメータを利用できない場合に相当する。そこで、ステレオ符号化データに含まれるバランスパラメータの利用可否を示す制御信号が選択部220に入力され、この制御信号に基づき選択部220の切替スイッチの接続状態が切り替わる。
なお、例えばビットレートを下げるために、ステレオ符号化データに含まれるバランスパラメータを使用しない場合に、選択部220が利得係数算出部223から入力されるバランスパラメータを選択してもよい。
乗算部221は、選択部220から入力されたLチャネル用のバランスパラメータとRチャネル用のバランスパラメータのそれぞれを、モノラル復号部202より入力された復号モノラル信号(周波数領域パラメータであるモノラル信号)に乗算し、Lチャネル用およびRチャネル用それぞれの乗算結果(周波数領域パラメータであるステレオ信号)を周波数−時間変換部222および利得係数算出部223へ出力する。つまり、乗算部221は、モノラル信号に対するバランス調整処理を行う。
周波数−時間変換部222は、乗算部221でのLチャネルおよびRチャネルそれぞれにおける乗算結果を時間信号に変換して、LチャネルおよびRチャネルそれぞれのデジタルステレオ信号としてD/A変換部204へ出力する。
利得係数算出部223は、乗算部221でのLチャネルおよびRチャネルそれぞれにおける乗算結果からLチャネルおよびRチャネルそれぞれのバランスパラメータを算出し、それらのバランスパラメータを選択部220へ出力する。
利得係数算出部223でのバランスパラメータの具体的算出方法の一例を以下に示す。
i番目の周波数成分における、Lチャネル用のバランスパラメータをGL[i]、Rチャネル用のバランスパラメータをGR[i]、Lチャネルの復号ステレオ信号をL[i]、Rチャネルの復号ステレオ信号をR[i]とする。利得係数算出部223は、式(1),式(2)に従ってGL[i]およびGR[i]を算出する。
GL[i]=|L[i]|/(|L[i]|+|R[i]|) …式(1)
GR[i]=|R[i]|/(|L[i]|+|R[i]|) …式(2)
なお、式(1)および式(2)において、絶対値をとらないことも可能である。また、分母の計算において、LとRを加算してから絶対値を求めてもよい。ただし、LとRを加算してから絶対値を求める場合、LとRが異符号だとバランスパラメータが大きくなりすぎてしまうことがある。よって、この場合には、バランスパラメータの大きさに対する閾値を設けてバランスパラメータをクリッピングするなどの対策が必要となる。
また、乗算部221の出力信号と、Lチャネル信号およびRチャネル信号それぞれとの誤差を量子化したものが復号される場合には、その復号された量子化誤差を加算した後のLチャネル信号およびRチャネル信号を用いて式(1)および式(2)による利得係数算
出を行うのがよい。これにより、バランス調整処理のみによる符号化性能(入力信号を忠実に表現する能力)が不十分な場合でも適切なバランスパラメータを求めることができる。また、上記誤差を量子化したものを復号するためには、図3におけるバランス調整部211は、乗算部221と周波数−時間変換部222との間に、バランス調整処理後の復号Lチャネル信号(すなわち、バランス調整を用いて量子化されたステレオ入力のLチャネル信号)とステレオ入力信号のLチャネル信号との誤差を量子化したもの、および、バランス調整処理後の復号Rチャネル信号(すなわち、バランス調整を用いて量子化されたステレオ入力のRチャネル信号)とステレオ入力信号のRチャネル信号との誤差を量子化したものをそれぞれ復号する量子化誤差復号部が挿入された構成となる(図示せず)。量子化誤差復号部は、乗算部221からLチャネルおよびRチャネルそれぞれの復号ステレオ信号を入力するとともに、多重化分離部201から量子化誤差符号化データを入力して復号を行い、得られる量子化誤差復号信号をLチャネルおよびRチャネルそれぞれの復号ステレオ信号に加算して、それらの加算結果を最終的な復号ステレオ信号として時間−周波数変換部222へ出力する。
次いで図4に、利得係数算出部223の構成の一例を示す。
図4に示すように、利得係数算出部223は、Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232、Rチャネル平滑化処理部233、Lチャネル利得係数算出部234、Rチャネル利得係数算出部235、加算部236およびスケーリング部237を具備する。
Lチャネル絶対値算出部230は、乗算部221より入力されるLチャネル信号の周波数領域パラメータの各周波数成分の絶対値を求めてLチャネル平滑化処理部232へ出力する。
Rチャネル絶対値算出部231は、乗算部221より入力されるRチャネル信号の周波数領域パラメータの各周波数成分の絶対値を求めてRチャネル平滑化処理部233へ出力する。
Lチャネル平滑化処理部232は、Lチャネル信号の周波数領域パラメータの各周波数成分の絶対値に対し、周波数軸での平滑化処理を行い、Lチャネル信号を周波数軸上で平滑化した周波数領域パラメータをLチャネル利得係数算出部234および加算部236に出力する。
ここで、周波数軸での平滑化処理とは、周波数領域パラメータに対して周波数軸上でローパスフィルタ処理を施すことに相当する。
具体的には式(3)に示すように各周波数成分に対して前後1成分を加算して平均値を求める、すなわち3点の移動平均を計算する、などの処理を行う。式(3)において、LF(f)はLチャネル信号の周波数領域パラメータ(絶対値をとった後のパラメータ)、LFs(f)はLチャネル信号の平滑化処理後の周波数領域パラメータであり、fは周波数番号(整数)である。
LFs(f)=(LF(f−1)+LF(f)+LF(f+1))/3 …式(3)
なお、式(4)に示すように、自己回帰型のローパスフィルタ処理を用いて周波数軸での平滑化処理を行うことも可能である。αは平滑化係数である。
LFs(f)=LF(f)+α×LFs(f−1) 0<α<1 …式(4)
Rチャネル平滑化処理部233は、Rチャネル信号の周波数領域パラメータの各周波数
成分の絶対値に対し、周波数軸での平滑化処理を行い、Rチャネル信号を周波数軸上で平滑化した周波数領域パラメータをRチャネル利得係数算出部235および加算部236に出力する。
Rチャネル平滑化処理部233での平滑化処理としては、Lチャネル平滑化処理部232での平滑化処理と同様に、式(5)に示すように各周波数成分に対して前後1成分を加算して平均値を求める、すなわち3点の移動平均を計算する、などの処理を行う。式(5)において、RF(f)はRチャネル信号の周波数領域パラメータ(絶対値をとった後のパラメータ)であり、RFs(f)はRチャネル信号の平滑化処理後の周波数領域パラメータである。
RFs(f)=(RF(f−1)+RF(f)+RF(f+1))/3 …式(5)
なお、上記同様、式(6)に示すように、自己回帰型のローパスフィルタ処理を用いて周波数軸での平滑化処理を行うことも可能である。
RFs(f)=RF(f)+α×RFs(f−1) 0<α<1 …式(6)
なお、Lチャネルの平滑化処理とRチャネルの平滑化処理とは必ずしも同一の処理でなくてもよい。例えば、Lチャネルの信号特性とRチャネルの信号特性とが異なる場合、意図的に異なる平滑化処理を用いた方がよい場合もある。
加算部236は、Lチャネル信号の平滑化された周波数領域パラメータと、Rチャネル信号の平滑化された周波数領域パラメータとを周波数成分ごとに加算して、加算結果をLチャネル利得係数算出部234とRチャネル利得係数算出部235とに出力する。
Lチャネル利得係数算出部234は、Lチャネル信号の平滑化された周波数領域パラメータ(LFs(f))と、加算部236から入力される加算結果(LFs(f)+RFs(f))との振幅比を算出し、その振幅比をスケーリング部237へ出力する。すなわち、Lチャネル利得係数算出部234は、式(7)に示すgL(f)を算出する。
gL(f)=LFs(f)/(LFs(f)+RFs(f)) …式(7)
Rチャネル利得係数算出部235は、Rチャネル信号の平滑化された周波数領域パラメータ(RFs(f))と、加算部236から入力される加算結果(LFs(f)+RFs(f))との振幅比を算出し、その振幅比をスケーリング部237へ出力する。すなわち、Rチャネル利得係数算出部235は、式(8)に示すgR(f)を算出する。
gR(f)=RFs(f)/(LFs(f)+RFs(f)) …式(8)
スケーリング部237は、gL(f)およびgR(f)に対してスケーリング処理を行ってLチャネル用のバランスパラメータGL(f)およびRチャネル用のバランスパラメータGR(f)を算出し、1フレーム遅延後に、これらのバランスパラメータを選択部220へ出力する。
ここで、モノラル信号M(f)が、例えばM(f)=0.5(L(f)+R(f))で定義される場合、スケーリング部237はGL(f)+GR(f)=2.0となるように、gL(f)およびgR(f)のスケーリング処理を行う。具体的には、スケーリング部237は、2/(gL(f)+gR(f))をgL(f)およびgR(f)にそれぞれ乗じてGL(f)およびGR(f)を算出する。
なお、GL(f)+GR(f)=2.0の関係を満たすように、GL(f)およびGR(f)が、Lチャネル利得係数算出部234およびRチャネル利得係数算出部235でそれぞれ算出される場合には、スケーリング部237においてスケーリング処理を行う必要
は無い。例えば、Lチャネル利得係数算出部234においてGL(f)が算出された後で、GR(f)がGR(f)=2.0−GL(f)で算出される場合にはスケーリング部237にてスケーリング処理を行う必要は無い。よって、この場合にはLチャネル利得係数算出部234およびRチャネル利得係数算出部235の出力を選択部220へ入力するようにしても良い。本構成の詳細については、図12を用いて後述する。また、ここでは、Lチャネル利得係数を先に算出する形態で説明したが、Rチャネル利得係数を先に算出し、Lチャネル利得係数GL(f)を、GL(f)=2.0−GR(f)にて算出するようにしても良い。
なお、ステレオ符号化データに含まれるバランスパラメータが連続して利用不可能な場合には、利得係数算出部223から出力されるバランスパラメータが選択される状態が続く。この場合でも、利得係数算出部223での上記処理を繰り返すようにすれば、上記平滑化処理が繰り返されることにより、利得係数算出部223において算出されるバランスパラメータは全帯域に渡って徐々に平均化され、Lチャネル−Rチャネル間のレベルバランスを適切なレベルバランスに収束させることができる。
また、利得係数算出部223から出力されるバランスパラメータが選択される状態が続く場合には、バランスパラメータを、最初に算出されたバランスパラメータから徐々に1.0に近づける(すなわちモノラルに近づける)処理を行ってもよい。例えば、式(9)に示す処理を行ってもよい。この場合は、バランスパラメータが最初に利用不可能になるフレーム以外において、上記の平滑化処理は不要となる。よって、この処理を用いることにより、上記の平滑化処理を行う場合に比べて、利得係数算出に係る演算量を低減することができる。なお、βは平滑化係数である。
GL(f)=βGL(f)+(1−β) 0<β<1 …式(9)
また、利得係数算出部223から出力されるバランスパラメータが選択される状態が続いた後、利得係数復号部210から出力されるバランスパラメータが選択される状態に切り替わる場合には、音像または定位が急変する現象が発生する。このような急変により主観的な品質が損なわれることがある。そこで、この場合には、利得係数復号部210から出力されたバランスパラメータと、選択状態が切り替わる直前に利得係数算出部223から出力されたバランスパラメータとの中間値を、乗算部221に入力するバランスパラメータとして用いてもよい。例えば、乗算部221に入力するバランスパラメータを式(10)に従って求めてもよい。ここでは、利得係数復号部210から入力されるバランスパラメータをG^、利得係数算出部223から最後に出力されたバランスパラメータをGp、乗算部221に入力するバランスパラメータをGmとする。γは内分係数であり、βはγを平滑化するための平滑化係数である。
Gm=γGp+(1−γ)G^ γ=βγ 0<β<1 …式(10)
このようにすれば、利得係数復号部210から出力されるバランスパラメータが選択される状態が続くとともに、すなわち式(10)の処理が繰り返される度に、γが0に近づき、利得係数復号部210から出力されるバランスパラメータが選択される状態がある程度のフレーム数続けば、Gm=G^となる。Gm=G^になるまでのフレーム数を予め決めておき、利得係数復号部210から出力されるバランスパラメータが選択される状態がそのフレーム数だけ続いた時点でGm=G^に設定するようにしてもよい。このように、乗算部221に入力されるバランスパラメータを、利得係数復号部210から入力されるバランスパラメータに徐々に近づけることにより、音像または定位の急変による主観的な品質の劣化を回避することができる。
このように、本実施の形態では、ステレオ符号化データに含まれるバランスパラメータを利用できない(あるいは利用しない)場合には、過去に得られたステレオ信号のLチャ
ネル信号およびRチャネル信号から算出されるバランスパラメータを用いて、モノラル信号に対するバランス調整処理を行う。よって、本実施の形態によれば、復号信号の定位の揺らぎを抑えてステレオ感を保つことができる。
また、本実施の形態では、ステレオ信号のLチャネル信号とRチャネル信号とを加算した信号に対するLチャネル信号の振幅比またはRチャネル信号の振幅比を用いてバランスパラメータを算出する。よって、本実施の形態によれば、モノラル信号に対するLチャネル信号の振幅比またはRチャネル信号の振幅比を用いるよりも適切なバランスパラメータを求めることができる。
また、本実施の形態では、バランスパラメータの算出において、Lチャネル信号およびRチャネル信号に対して周波数軸での平滑化処理を行う。よって、本実施の形態によれば、バランス調整処理を行う周波数単位(周波数分解能)が細かい場合でも安定した定位とステレオ感を得ることができる。
よって、本実施の形態によれば、バランスパラメータ等のバランス調整情報をパラメトリックステレオパラメータとして利用できない場合にも、高品質な擬似ステレオ信号を生成することができる。
(変形例)
図5に、音響信号復号装置200のステレオ復号部203aの構成の変形例を示す。本変形例では、図2の構成に加えて、多重化分離部301と残差信号復号部302とを備える。図5において、図2と同じ動作をするブロックは図2と同じ番号を付し、その動作の説明を省略する。
多重化分離部301は、多重化分離部201が出力したステレオ符号化データを入力し、バランスパラメータ符号化データと残差信号符号化データとに分離し、バランスパラメータ符号化データを利得係数復号部210に、残差信号符号化データを残差信号復号部302に、それぞれ出力する。
残差信号復号部302は、多重化分離部301が出力した残差信号符号化データを入力し、復号した各チャネルの残差信号をバランス調整部211aへ出力する。
この変形例では、バランス調整処理により、ステレオ信号をパラメトリックに表現するとともにパラメトリックに表現しきれない誤差成分を残差信号として符号化するモノラル−ステレオスケーラブル符号化が行われる構成(つまり、例えば、特許文献3のFig.10に示されるような構成)に、本発明が適用される場合について説明されている。
次いで、図6に、本変形例におけるバランス調整部211aの構成を示す。
図6に示すように、本変形例におけるバランス調整部211aは、図3の構成に加えて、加算部303,304と、選択部305とをさらに備える。図6において、図3と同じ動作を行うブロックについては、同じ番号を付し、その動作説明を省略する。
加算部303は、乗算部221から出力されたLチャネル信号と、選択部305から出力されるLチャネル残差信号と、をそれぞれ入力し、両者の加算処理を行い、加算結果を周波数−時間変換部222および利得係数算出部223へ出力する。
加算部304は、乗算部221から出力されたRチャネル信号と、選択部305から出力されるRチャネル残差信号と、をそれぞれ入力し、両者の加算処理を行い、加算結果を
周波数−時間変換部222および利得係数算出部223へ出力する。
選択部305は、残差信号復号部302から残差信号の入力がある場合(つまり、ステレオ符号化データに含まれる残差信号の利用が可能な場合)には、その残差信号を選択し、加算部303および加算部304へ出力する。また、選択部305は、残差信号復号部302から残差信号の入力がない場合(つまり、ステレオ符号化データに含まれる残差信号の利用が不可能な場合)には、何も出力しないか、又は、全零信号を加算部303および加算部304へ出力する。選択部305は、例えば、図6に示すように2つの切替スイッチにより構成される。一方の切替スイッチはLチャネル用で加算部303に出力端子が接続されており、他方の切替スイッチはRチャネル用で加算部304に出力端子が接続されている。そして、これらの切替スイッチが連動して切り替わることにより上記選択が行われる。
ここで、残差信号復号部302から選択部305への残差信号の入力がないケースとしては、ステレオ符号化データが伝送路上で失われて音響信号復号装置200に受信されなかったケース、又は、音響信号復号装置200に受信されたステレオ符号化データに誤りが検出されて破棄されたケースなどが想定される。つまり、残差信号復号部302から残差信号の入力がない場合とは、ステレオ符号化データに含まれる残差信号を何らかの理由により利用できない場合のことである。図6には、ステレオ符号化データに含まれる残差信号の利用可否を示す制御信号が選択部305に入力され、この制御信号に基づいて選択部305の切替スイッチの接続状態が切り替わる構成が示されている。
なお、例えばビットレートを下げる目的で、ステレオ符号化データに含まれる残差信号を使用しない場合に、選択部305が切替スイッチを開放して何も出力しないようにしても良いし、又は、全零信号を出力するようにしても良い。
周波数−時間変換部222は、加算部303から出力された加算結果と、加算部304から出力された加算結果とを時間信号に変換して、LチャネルおよびRチャネルそれぞれのデジタルステレオ信号としてD/A変換部204へ出力する。
利得係数算出部223でのバランスパラメータの具体的算出方法は、図4を参照して説明したものと同様である。ただし、Lチャネル絶対値算出部230への入力は加算部303の出力結果であり、Rチャネル絶対値算出部231への入力は加算部304の出力結果であるところのみが異なる。この様子は、図7に示されている。
(実施の形態2)
実施の形態2に係る音響信号復号装置の説明を行う。実施の形態2に係る音響信号復号装置の構成と実施の形態1に係る音響信号復号装置200の構成とが異なるのは、バランス調整部のみである。従って、以下では、主にバランス調整部の構成および動作について説明を行う。
図8に、実施の形態2に係るバランス調整部511の構成を示す。図8に示すように、バランス調整部511は、選択部220、乗算部221、周波数−時間変換部222および利得係数算出部523を具備する。選択部220、乗算部221および周波数−時間変換部222は、バランス調整部211を構成する各同一名称部と同一の動作をするので、説明を省略する。
利得係数算出部523は、モノラル復号部202より入力される復号モノラル信号、選択部220より入力されるLR両チャネルのバランスパラメータ、および、乗算部221より入力されるLチャネルおよびRチャネルそれぞれにおける乗算結果(つまり、LR両
チャネルの周波数領域パラメータ)を用いて補償用のバランスパラメータを算出する。補償用バランスパラメータは、LチャネルおよびRチャネルそれぞれについて算出される。これらの補償用バランスパラメータは、選択部220に出力される。
次いで図9に、利得係数算出部523の構成を示す。
図9に示すように、利得係数算出部523は、Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232、Rチャネル平滑化処理部233、Lチャネル利得係数記憶部601、Rチャネル利得係数記憶部602、主要成分利得係数算出部603、主要成分検出部604および切替スイッチ605を具備する。Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232およびRチャネル平滑化処理部233は、実施の形態1で説明した利得係数算出部223を構成する各同一名称部と同一の動作をする。
主要成分検出部604は、モノラル復号部202より復号モノラル信号を受け取る。この復号モノラル信号は、周波数領域パラメータである。主要成分検出部604は、入力された復号モノラル信号に含まれる周波数成分のうち振幅が閾値を超える周波数成分を検出し、この検出周波数成分を主要成分周波数情報として主要成分利得係数算出部603および切替スイッチ605に出力する。ここで、検出に用いる閾値は、固定値としても良いし、周波数領域パラメータ全体の平均振幅に対する一定比としても良い。また、主要成分周波数情報として出力される検出周波数成分の数は特に限定されるものではなく、閾値を超える周波数成分のすべてとしても良いし、予め決められた数としても良い。
Lチャネル利得係数記憶部601は、選択部220よりLチャネルのバランスパラメータが入力され、記憶する。記憶されたLチャネルのバランスパラメータは、次フレーム以降に切替スイッチ605に出力される。また、Rチャネル利得係数記憶部602は、選択部220よりRチャネルのバランスパラメータが入力され、記憶する。記憶されたRチャネルのバランスパラメータは、次フレーム以降に切替スイッチ605に出力される。
ここで、選択部220は、利得係数復号部210で得られたバランスパラメータおよび利得係数算出部523から出力されたバランスパラメータのうちの一方を、乗算部221において次に用いられるバランスパラメータ(例えば、現フレームで用いられるバランスパラメータ)として選択する。この選択されたバランスパラメータは、Lチャネル利得係数記憶部601およびRチャネル利得係数記憶部602にも入力され、乗算部221で前回用いられたバランスパラメータ(例えば、1つ前のフレームで用いられたバランスパラメータ)として記憶される。また、バランスパラメータは周波数毎に記憶される。
主要成分利得係数算出部603は、Lチャネル利得係数算出部234、Rチャネル利得係数算出部235、加算部236およびスケーリング部237より構成される。主要成分利得係数算出部603を構成する各部位は、利得係数算出部223を構成する各同一名称部と同一の動作をする。
ただし、主要成分利得係数算出部603は、主要成分検出部604より入力される主要成分周波数情報、並びに、Lチャネル平滑化処理部232およびRチャネル平滑化処理部233より受け取る平滑化処理後の周波数領域パラメータに基づいて、主要成分周波数情報として与えられる周波数成分についてのみバランスパラメータを算出する。
すなわち、主要成分検出部604より入力された主要成分周波数情報をjとすると、例えば、上記した式(1)および式(2)に従って、GL[j]、GR[j]が算出される。ただし、j∈iの条件が満たされる。なお、ここでは説明を簡単にするために、平滑化
処理は考慮されていない。
このように算出された主要周波数に対応するバランスパラメータは、切替スイッチ605へ出力される。
切替スイッチ605は、主要成分利得係数算出部603、Lチャネル利得係数記憶部601およびRチャネル利得係数記憶部602からそれぞれバランスパラメータが入力される。切替スイッチ605は、主要成分検出部604から入力される主要成分周波数情報に基づいて、主要成分利得係数算出部603から受け取るバランスパラメータ、又は、Lチャネル利得係数記憶部601およびRチャネル利得係数記憶部602から受け取るバランスパラメータを周波数成分毎に選択し、選択したバランスパラメータを選択部220へ出力する。
具体的には、切り換えスイッチ605は、主要成分周波数情報をjとすると、周波数成分jに対しては主要成分利得係数算出部603からの入力であるバランスパラメータGL[j]およびGR[j]を選択し、それ以外の周波数成分に対してはLチャネル利得係数記憶部601およびRチャネル利得係数記憶部602からの入力であるバランスパラメータを選択する。
以上のように本実施の形態によれば、利得係数算出部523において、主要成分利得係数算出部603が主要周波数成分についてのみバランスパラメータを算出し、切り換えスイッチ605は、主要周波数成分のバランスパラメータとしては主要成分利得係数算出部603で得られたバランスパラメータを選択的に出力する一方、主要周波数成分以外の周波数成分のバランスパラメータとしてはLチャネル利得係数記憶部601およびRチャネル利得係数記憶部602に記憶されているバランスパラメータを選択的に出力する。
こうすることで、振幅が大きい周波数成分でのみバランスパラメータが算出されて使用され、それ以外の周波数成分では過去のバランスパラメータが使用されるので、少ない処理量で高品質な擬似ステレオ信号を生成することができる。
(変形例1)
図10に、実施の形態2の変形例に係るバランス調整部511aの構成を示す。本変形例では、図8の構成に加えて、加算部303,304と、選択部305とを備える。図8に追加された構成要素の動作は、図6に示したものと同じであるので、同じ番号を付しその動作説明を省略する。
図11に、本変形例における利得係数算出部523の構成を示す。構成および動作は図9と同一であるので同じ番号を付し説明を省略する。Lチャネル絶対値算出部230への入力が加算部303の出力である点と、Rチャネル絶対値算出部231への入力が加算部304の出力である点のみが異なる。
(変形例2)
Lチャネル平滑化処理部232、Rチャネル平滑化処理部233で行う平滑化処理が、式(3)および式(5)のように主要成分周波数周辺の周波数成分のみを用いて平滑化処理を行う形態の場合には、Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232およびRチャネル平滑化処理部233のそれぞれで行われる処理は、全周波数成分で行われる必要はなく、必要な周波数成分でのみ行われれば良い。こうすることで、利得係数算出部523における処理量をさらに削減することができる。具体的には、主要成分周波数情報をjとすると、j−1、j、j+1の周波数成分に対してLチャネル絶対値算出部230およびRチャネル絶対値算出部231を動作させ
る。この結果を用いて、Lチャネル平滑化処理部232およびRチャネル平滑化処理部233は、周波数成分jに対してのみ平滑化した周波数領域パラメータを算出すれば良い。
図12に、本変形例における利得係数算出部523aの構成を示す。なお、実施の形態1で触れた、右チャネル利得係数GR(f)を、GR(f)=2.0−GL(f)により算出する構成も合わせて、図12に示されている。図11の構成と、同一の構成、動作するものは同じ番号を付し、説明を省略する。図11とは、主要成分利得係数算出部の内部構成が主に異なる。
主要成分利得係数算出部606は、Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232、Rチャネル平滑化処理部233、Lチャネル利得係数算出部234、Rチャネル利得係数算出部607、および加算部236により構成される。
主要成分利得係数算出部606は、主要成分検出部604より入力された主要成分周波数情報jに対してのみバランスパラメータを算出する。ここでは、Lチャネル平滑化処理部232およびRチャネル平滑化処理部233における平滑化処理が、上記した式(3)および式(5)に示す3点の平滑化を用いる場合を例にとって説明する。このため本変形例では、主要成分利得係数算出部606は、Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232、およびRチャネル平滑化処理部233を含めた構成を示すものとする。
Lチャネル絶対値算出部230およびRチャネル絶対値算出部231は、j−1、j、j+1の周波数成分に対してのみ絶対値処理を行う。
Lチャネル平滑化処理部232およびRチャネル平滑化処理部233は、j−1、j、j+1の各チャネルの周波数成分の絶対値がそれぞれ入力され、周波数成分jに対する平滑値を算出し、加算部236に出力する。Lチャネル平滑化処理部232の出力は、Lチャネル利得係数算出部234にも入力される。
Lチャネル利得係数算出部234は、図11と同様に、周波数成分jの左チャネル用のバランスパラメータを算出する。算出されたLチャネル用バランスパラメータは、切替スイッチ605およびRチャネル利得係数算出部607に出力される。
Rチャネル利得係数算出部607は、Lチャネル用バランスパラメータが入力されると、GR(f)=2.0−GL(f)の関係から、GR(f)を算出する。このように算出されるバランスパラメータは、GL(f)+GR(f)=2.0を満たすので、スケーリング部237によるスケーリング処理は不要となる。算出されたRチャネル用バランスパラメータは切替スイッチ605に出力される。
このような構成をとることにより、絶対値処理、平滑化処理、バランスパラメータ算出を主要成分についてのみ行うため、より少ない処理量にてバランスパラメータを算出することができる。
なお、利得係数算出部523aの構成を図8の利得係数算出部523に適用する場合には、Lチャネル絶対値算出部230およびRチャネル絶対値算出部231への入力は、乗算部221の出力となる。
また、図9および図11の利得係数算出部523の構成では、主要成分利得係数算出部603において、主要成分周波数についてのみの処理を行うこととした。しかし、図9お
よび図11の利得係数算出部523においても、図12の利得係数算出部523aと同様に、Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232、およびRチャネル平滑化処理部233を含む構成を主要成分利得係数算出部とし、Lチャネル絶対値算出部230、Rチャネル絶対値算出部231、Lチャネル平滑化処理部232、およびRチャネル平滑化処理部233における処理についても、主要成分周波数についてのみの処理としても良い。
以上、本発明の実施の形態およびその変形例について説明した。
なお、本発明の説明に用いた音響信号は、オーディオ信号、音声信号、等の信号を総称して用いたものである。本発明は、これら信号のいずれかでも、混在する場合でも適用可能である。
また、各実施の形態およびその変形例では、左チャネル信号をL、右チャネル信号をRとして説明したが、L、Rという表記により位置に関する条件が特定されるものではない。
また、各実施の形態およびその変形例では、LとRの2チャネルの構成を例として説明したが、複数のチャネルの平均信号をモノラル信号として定義し、各チャネルの信号への重み係数をバランスパラメータとしてモノラル信号に乗じることにより各チャネルの信号を表現するマルチチャネル符号化方式のフレーム消失隠蔽処理においても、本発明は適用可能である。この場合、式(1)、(2)に対応して、例えば3チャネルの場合は、以下のようにバランスパラメータを定義することができる。ここで、Cは3番目のチャネルの信号を、GCは3番目のチャネルのバランスパラメータを、それぞれ表す。
GL[i]=|L[i]|/(|L[i]|+|R[i]|+|C[i]|)
…式(11)
GR[i]=|R[i]|/(|L[i]|+|R[i]|+|C[i]|)
…式(12)
GC[i]=|C[i]|/(|L[i]|+|R[i]|+|C[i]|)
…式(13)
また、各実施の形態およびその変形例に係る音響信号復号装置は、本実施の形態に係る音響信号符号化装置が送信した多重化データ(ビットストリーム)を受信して処理を行う場合を例にとって説明したが、本発明はこれに限定されず、各実施の形態に係る音響信号復号装置が受信して処理するビットストリームは、この音響信号復号装置で処理可能なビットストリームを生成可能な音響信号符号化装置が送信したものであれば良い。
また、本発明に係る音響信号復号装置は、上記実施の形態およびその変形例に限定されず、種々変更して実施することが可能である。
また、本発明に係る音響信号復号装置は、移動体通信システムにおける通信端末装置または基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置および移動体通信システムを提供することができる。
また、各実施の形態およびその変形例では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係る音響信号復号方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明の音響信号復号装置と同様の機能を実現することができる。
また、各実施の形態およびその変形例の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
2008年6月27日出願の特願2008−168180及び2008年11月19日出願の特願2008−295814の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る音響信号復号装置は、利用可能なメモリ量に制限があり、かつ、低速での無線通信を強いられる携帯電話等の通信端末装置に特に有用である。