JP5604933B2 - ダウンミクス装置およびダウンミクス方法 - Google Patents

ダウンミクス装置およびダウンミクス方法 Download PDF

Info

Publication number
JP5604933B2
JP5604933B2 JP2010078570A JP2010078570A JP5604933B2 JP 5604933 B2 JP5604933 B2 JP 5604933B2 JP 2010078570 A JP2010078570 A JP 2010078570A JP 2010078570 A JP2010078570 A JP 2010078570A JP 5604933 B2 JP5604933 B2 JP 5604933B2
Authority
JP
Japan
Prior art keywords
unit
matrix
spatial information
signal
rotation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010078570A
Other languages
English (en)
Other versions
JP2011209588A (ja
Inventor
洋平 岸
政直 鈴木
美由紀 白川
義照 土永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2010078570A priority Critical patent/JP5604933B2/ja
Priority to US13/074,379 priority patent/US8818764B2/en
Publication of JP2011209588A publication Critical patent/JP2011209588A/ja
Application granted granted Critical
Publication of JP5604933B2 publication Critical patent/JP5604933B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Description

この発明は、ダウンミクス装置およびダウンミクス方法に関する。
従来、複数チャネルの音声信号をより少ないチャネル数の音声信号に変換するダウンミクス技術が知られている。ダウンミクス技術の一つに予測ダウンミクス技術がある。予測ダウンミクス技術を用いる符号化方式の一つに例えばMPEG(Moving Picture Experts Group、エムペグ)サラウンド方式がある。MPEGサラウンド方式では、一般に5.1チャネルと呼ばれる6チャネルの入力信号を2チャネルの信号にダウンミクスするとき、2段階のダウンミキシング処理が行われる。
第1段階のダウンミキシング処理では、例えば6チャネルの入力信号は、2チャネルずつ1チャネルのダウンミクス信号に変換される。第2段階のダウンミキシング処理では、第1段階のダウンミキシング処理により得られた例えば3チャネルの信号Lin、RinおよびCinに対して、例えば次の(1)式の行列演算によるマトリクス変換が行われる。(1)式において、Dはダウンミクス行列であり、例えば次の(2)式で表される。
Figure 0005604933
Figure 0005604933
(1)式より得られたベクトルc^0は、次の(3)式に示すように、二つのベクトルl0およびr0の線形和に分解される。本明細書においてc^は、「c」の上に「^」が付されていることを表す。(3)式において、k1およびk2は係数である。これらk1およびk2に最も近いチャネル予測パラメータCPC(Channel Prediction Coefficients)をそれぞれc1およびc2とすると、予測信号c0は、次の(4)式で表される。
Figure 0005604933
Figure 0005604933
ところで、ダウンミクス技術に関し、入力信号とアップミクス信号とのエネルギー差に基づいてダウンミクス信号に対してスケーリング補正を行うことにより、ダウンミクス信号から複数チャネルの信号を生成する際のエネルギー損失を補償する方法がある。また、アップミキシング処理の際にダウンミクス信号および残差信号に回転行列をかけるため、予めダウンミキシング処理の際に左右のチャネル信号に、アップミキシング処理に用いられる回転行列の逆の回転行列をかけておく符号化技術がある。
特表2008−517337号公報 特表2008−536184号公報
しかしながら、従来のダウンミクス技術では、入力信号LinおよびRinが同じベクトルである場合、マトリクス変換によってl0およびr0は同じベクトルとなる((1)式および(2)式を参照)。この場合、ベクトルc^0を二つのベクトルl0およびr0の線形和で完全に再現することができず((3)式を参照)、予測信号c0はl0およびr0と同じ位相となる。
デコーダ側では、アップミキシング処理においてl0、r0、c1およびc2に対する逆マトリクス変換によって例えば3チャネルの出力信号Lout、RoutおよびCoutが生成される。その際、l0、r0およびc0が同じ位相であると、出力信号Lout、RoutおよびCoutも全て同じ位相になってしまう。そのため、エンコーダ側の元の入力信号Lin、RinおよびCinをデコーダ側で精度良く再現することができない。つまり、ダウンミキシング処理におけるマトリクス変換およびアップミキシング処理における逆マトリクス変換を経ることによって音質が劣化してしまうという問題点がある。
ダウンミクス信号に基づいてアップミキシング処理を行ったときの音質劣化を抑制することができるダウンミクス装置およびダウンミクス方法を提供することを目的とする。
ダウンミクス装置は、入力信号に対して行列演算を行うマトリクス変換部と、前記マトリクス変換部の出力信号のうち予測対象の信号を除く信号に対して回転を行う回転補正部と、前記回転補正部の出力信号から空間情報を抽出し、チャネル予測パラメータを得る空間情報抽出部と、前記回転補正部の出力信号と、前記空間情報抽出部により抽出されたチャネル予測パラメータに基づき求められる予測信号に対して、前記マトリクス変換部における行列演算に用いた行列の逆行列を用いて行列演算を行い、前記入力信号に対する該行列演算結果の誤差量を計算する誤差計算部と、を備え、前記回転補正部は、前記誤差計算部により計算された誤差量に基づいて最終的な回転結果を決定し、前記空間情報抽出部は、前記誤差計算部により計算された誤差量に基づいて最終的な空間情報を決定する。
このダウンミクス装置およびダウンミクス方法によれば、ダウンミクス信号に基づいてアップミキシング処理を行ったときの音質劣化を抑制することができるという効果を奏する。
実施例1にかかるダウンミクス装置を示すブロック図である。 実施例1にかかるダウンミクス方法を示すフローチャートである。 実施例1と比較例とで誤差量を比較した結果を示す特性図である。 実施例2にかかるダウンミクス装置を示すブロック図である。 実施例2にかかるダウンミクス装置における時間周波数変換を説明する図である。 MPEG−2 ADTS形式のフォーマット例を示す図である。 実施例2にかかるダウンミクス方法を示すフローチャートである。
以下に添付図面を参照して、このダウンミクス装置およびダウンミクス方法の好適な実施の形態を詳細に説明する。ダウンミクス装置およびダウンミクス方法は、入力信号から得たダウンミクス信号に対して、ダウンミクス信号から得たアップミクス信号の入力信号に対する誤差量に基づいて回転補正を加えることによって、デコーダ側で再生したときの音質劣化を抑制する。
(実施例1)
・ダウンミクス装置の説明
図1は、実施例1にかかるダウンミクス装置を示すブロック図である。図1に示すように、ダウンミクス装置は、マトリクス変換部1、回転補正部2、空間情報抽出部3および誤差計算部4を備えている。マトリクス変換部1は、入力信号Lin、RinおよびCinに対して行列演算を行う。マトリクス変換部1は、例えば上述した(1)式および(2)式で表される行列演算を行ってもよい。この行列演算により、二つのチャネルのベクトルl0およびr0と、予測する対象の信号のベクトルc^0が得られる。
回転補正部2は、マトリクス変換部1から出力されたl0およびr0に対して回転の演算を行う。回転補正部2は、例えば(5)式および(6)式で表される行列演算を行ってもよい。(5)式において、θlはl0の回転角であり、θrはr0の回転角である。この行列演算により、二つのチャネルのベクトルl0およびr0を回転させたベクトルl0'およびr0'が得られる。回転補正部2は、l0とr0とが同じベクトルであるときにのみ、l0およびr0に対して回転の演算を行ってもよい。
Figure 0005604933
Figure 0005604933
回転補正部2は、誤差計算部4により計算された誤差量Eに基づいて最終的な回転結果となるl0'およびr0'を決定する。例えば、回転補正部2は、誤差量Eが最小となるときのl0'およびr0'を最終的な回転結果に決定してもよい。最終的な回転結果として決定されたl0'およびr0'は、図1に示すダウンミクス装置の出力信号の一部となる。
空間情報抽出部3は、回転補正部2の出力信号l0'およびr0'に基づいて空間情報を抽出する。空間情報抽出部3は、例えば上述した(3)式と同様に、マトリクス変換部1により得られた予測対象のベクトルc^0を二つのベクトルl0'およびr0'の線形和に分解してもよい。空間情報抽出部3は、空間情報として、l0'の係数k1およびr0'の係数k2のそれぞれに最も近いチャネル予測パラメータc1およびc2を取得してもよい。チャネル予測パラメータc1およびc2は、予めテーブルとして用意されていてもよい。回転補正部2により補正された二つのベクトルl0'およびr0'、並びにチャネル予測パラメータc1およびc2を用いて、予測信号のベクトルc0'は、次の(7)式より求められる。
Figure 0005604933
空間情報抽出部3は、誤差計算部4により計算された誤差量Eに基づいて最終的な空間情報となるチャネル予測パラメータc1およびc2を決定する。例えば、空間情報抽出部3は、誤差量Eが最小となるときのc1およびc2を最終的な空間情報に決定してもよい。最終的な空間情報として決定されたc1およびc2は、図1に示すダウンミクス装置の出力信号の一部となる。
誤差計算部4は、回転補正部2により補正されたl0'およびr0'、並びに空間情報抽出部3により抽出されたc1およびc2に対して行列演算を行う。誤差計算部4は、例えばマトリクス変換部1における行列演算に用いた行列の逆行列を用いて行列演算を行ってもよい。すなわち、誤差計算部4は、例えば(8)式および(9)式で表される行列演算を行ってもよい。(8)式において、D-1は、例えば上述した(2)式で表されるダウンミクス行列の逆行列である。c0'は、(7)式より得られる。この行列演算により、三つのチャネルのアップミクスベクトルLout、RoutおよびCoutが得られる。
Figure 0005604933
Figure 0005604933
誤差計算部4は、入力信号Lin、RinおよびCinに対するLout、RoutおよびCoutの誤差量を計算する。Lout、RoutおよびCoutは、それぞれ入力信号Lin、RinおよびCinに対するアップミクス信号である。誤差計算部4は、例えば(10)式で表されるように、三つのチャネルのそれぞれについて入力信号とアップミクス信号との間の誤差電力を誤差量Eとして算出してもよい。
Figure 0005604933
・ダウンミクス方法の説明
図2は、実施例1にかかるダウンミクス方法を示すフローチャートである。図2に示すように、ダウンミキシング処理が開始されると、まず、マトリクス変換部1により、入力信号Lin、RinおよびCinに対して行列演算が行われる(ステップS1)。この行列演算により、l0、r0およびc^0が得られる。以下の処理はl0とr0が同じベクトルの場合に限定して行っても良い。
「min」という変数を用意し、回転補正部2において変数minがMAX(最大値)に設定される(ステップS2)。MAX(最大値)は、変数minの初期値として予め用意されている。変数minは、例えばバッファに保持される。また、回転補正部2においてl0の回転角θlおよびr0の回転角θrが初期値に設定される。例えばθlおよびθrの初期値はゼロであってもよい。そして、回転補正部2により、l0およびr0が、設定された回転角でもって回転される(ステップS3)。この回転の結果として、補正されたベクトルl0'およびr0'が得られる。
次いで、空間情報抽出部3により、l0'およびr0'に基づいて空間情報が抽出される(ステップS4)。この空間情報の抽出によって、チャネル予測パラメータc1およびc2が得られる。
次いで、誤差計算部4により、l0'、r0'、c1およびc2を用いてc0'が計算される。このc0'と、l0'およびr0'とに対して、ステップS1での行列演算の逆の行列演算が行われる。この行列演算により、アップミクス信号Lout、RoutおよびCoutが得られる。そして、誤差計算部4により、入力信号Lin、RinおよびCinに対するアップミクス信号Lout、RoutおよびCoutの誤差量Eが計算される(ステップS5)。
次いで、誤差計算部4により、ステップS5で得た誤差量Eが変数minと比較される(ステップS6)。誤差量Eが変数minよりも小さい場合(ステップS6:Yes)、変数minが、ステップS5で得た誤差量Eに更新される。また、ステップS3で得たl0'およびr0'、並びにステップS4で得たc1およびc2が例えばバッファに保持される(ステップS7)。誤差量Eが変数minよりも小さくない場合(ステップS6:No)、変数minは更新されない。また、l0'、r0'、c1およびc2は、保持されてもよいし、保持されなくてもよい(ステップS7)。
上述したステップS3からステップS7までの処理が、回転角θlおよびθrを0から例えば2πまでの範囲で変えながら繰り返し行われる。繰り返しの途中、ステップS5で得た誤差量Eを変数minと比較した結果(ステップS6)、誤差量Eが変数minよりも小さい場合(ステップS6:Yes)、変数minが、ステップS5で得た誤差量Eに更新される。また、ステップS3で得たl0'およびr0'、並びにステップS4で得たc1およびc2が更新される(ステップS7)。誤差量Eが変数minよりも小さくない場合(ステップS6:No)、変数min、l0'およびr0'、並びにc1およびc2は更新されない。
予め設定されている範囲内の全ての回転角θlおよびθrについてステップS3からステップS7までの処理が終了すると、一連のダウンミキシング処理が終了する。この時点で例えばバッファに、誤差量Eが最小となるときのl0'、r0'、c1およびc2が保持されていることになる。つまり、誤差量Eが最小となるときのl0'、r0'、c1およびc2が得られる。ダウンミクス装置は、この誤差量Eが最小となるときのl0'、r0'、c1およびc2を出力する。
・誤差量Eの比較
図3は、実施例1と比較例とで誤差量Eを比較した結果を示す特性図である。図3において、縦軸は誤差量Eであり、横軸は角度α(度)である。角度αは、入力信号LinとRinとを同じベクトルとし、このLin(Rin)のベクトルに対する入力信号Cinのベクトルのなす角度である。実施例1は、マトリクス変換部1から出力されたl0およびr0に対して回転補正部2による回転の補正を行った場合の誤差量Eのシミュレーション結果である。比較例は、マトリクス変換部1から出力されたl0およびr0に対して回転補正部2による回転の補正を行わなかった場合の誤差量Eのシミュレーション結果である。図3から明らかなように、実施例1の誤差量Eは比較例の誤差量Eよりも小さくなっていることがわかる。
実施例1によれば、入力信号LinとRinとが同じベクトルである場合、最終的に、入力信号に対するアップミクス信号の誤差量Eが最小となるときのダウンミクス信号l0'およびr0'とチャネル予測パラメータc1およびc2とが得られる。ダウンミクス装置は、この誤差量Eが最小となるときのダウンミクス信号l0'およびr0'とチャネル予測パラメータc1およびc2とを符号化してデコーダ側へ出力する。従って、デコーダ側で復号し、ダウンミクス信号l0'およびr0'とチャネル予測パラメータc1およびc2とに基づいてアップミキシング処理を行ったときに、ダウンミクス装置への入力信号を精度良く再現することができる。つまり、ダウンミクス装置への入力信号LinとRinとが同じベクトルである音声をデコーダ側で再生したときの音質劣化を抑制することができる。
(実施例2)
実施例2は、実施例1にかかるダウンミクス装置をMPS(MPEG Surround)エンコーダとして用いたものである。MPSデコーダおよびMPS復号技術については、ISO(International Organization for Standardization、国際標準化機構)/IEC(International Electrotechnical Commission、国際電気標準会議) 23003−1に規定されており、MPSエンコーダはこの規定されたMPSデコーダで復号可能な信号へ入力信号の変換を行うものである。なお、実施例1にかかるダウンミクス装置は、その他の符号化技術にも適用することができる。
・ダウンミクス装置の説明
図4は、実施例2にかかるダウンミクス装置を示すブロック図である。図4に示すように、ダウンミクス装置は、時間周波数変換部11、第1のR−OTT(Reverse one to two)部12、第2のR−OTT部13、第3のR−OTT部14、R−TTT(Reverse two to three)部15、周波数時間変換部16、AAC(Advanced Audio Coding)エンコード部17および多重化部18を備えている。これらの各構成部は、例えばプロセッサがエンコードプロセスを実行することにより実現される。なお、図4において、「L(t)」のように「(t)」を有する信号は、時間領域の信号であることを表している。
時間周波数変換部11は、MPSエンコーダに入力する時間領域のマルチチャネル信号を周波数領域の信号に変換する。5.1チャネルのサラウンドシステムでは、マルチチャネル信号は、例えば左前の信号L、左横の信号SL、右前の信号R、右横の信号SR、中央の信号Cおよび低周波域の信号LFE(Low Frequency Enhancement)である。
時間周波数変換部11として、例えば次の(11)式に示す複素型のQMF(Quadrature Mirror Filter)フィルタバンクを用いることができる。図5にLチャネルの信号の周波数変換の様子を示す。周波数軸のサンプル数は64であり、時間軸のサンプル数は128である場合の例である。図5において、L(k,n)21は時間nにおける周波数帯域kのサンプルである。SL、R、SR、CおよびLFEの各チャネルの信号についても同様である。
Figure 0005604933
R−OTT部12,13,14は、それぞれ二つのチャネルの信号を一つのチャネルの信号にダウンミクスする。第1のR−OTT部12は、Lチャネルの周波数信号LとSLチャネルの周波数信号SLとをダウンミクスしたダウンミクス信号Linを生成する。第1のR−OTT部12は、Lチャネルの周波数信号LおよびSLチャネルの周波数信号SLに基づいて空間情報を生成する。生成される空間情報は、ダウンミクスされた二つのチャネル間のレベル差CLD(Channel Level Difference)およびダウンミクスされた二つのチャネル間の相関ICC(Inter−channel Coherence)である。第2のR−OTT部13は、Rチャネルの周波数信号RおよびSRチャネルの周波数信号SRについて、第1のR−OTT部12と同様に、ダウンミクス信号Rinおよび空間情報(CLD、ICC)を生成する。第3のR−OTT部14は、Cチャネルの周波数信号CおよびLFEチャネルの周波数信号LFEについて、第1のR−OTT部12と同様に、ダウンミクス信号Cinおよび空間情報(CLD、ICC)を生成する。
第1のR−OTT部12、第2のR−OTT部13および第3のR−OTT部14における演算について、まとめて説明する。第1のR−OTT部12、第2のR−OTT部13および第3のR−OTT部14は、例えば(12)式で表される演算によりダウンミクス信号Mを算出してもよい。(12)式において、x1およびx2は、ダウンミクスされる二つのチャネルの信号である。第1のR−OTT部12、第2のR−OTT部13および第3のR−OTT部14は、例えば(13)式で表される演算によりチャネル間のレベル差CLDを算出してもよい。第1のR−OTT部12、第2のR−OTT部13および第3のR−OTT部14は、例えば(14)式で表される演算によりチャネル間の相関ICCを算出してもよい。
Figure 0005604933
Figure 0005604933
Figure 0005604933
R−TTT部15は、三つのチャネルの信号を二つのチャネルの信号にダウンミクスする。R−TTT部15は、三つのR−OTT部12,13,14からそれぞれ出力されたダウンミクス信号Lin、RinおよびCinに基づいて、l0'およびr0'と、チャネル予測パラメータc1およびc2を出力する。R−TTT部15は、例えば図1に示す実施例1のダウンミクス装置を備えている。R−TTT部15の詳細については、実施例1で説明したとおりであるので、説明を省略する。
周波数時間変換部16は、R−TTT部15の出力信号l0'およびr0'を時間領域の信号に変換する。周波数時間変換部16として、例えば次の(15)式に示す複素型のQMFフィルタバンクを用いることができる。
Figure 0005604933
AACエンコード部17は、時間領域の信号に変換されたl0'およびr0'を符号化することによってAACデータおよびAACパラメータを生成する。AACエンコード部17における符号化技術として、例えば特開2007−183528号に開示されている技術を用いることができる。
多重化部18は、チャネル間のレベル差CLD、チャネル間の相関ICC、チャネル予測パラメータc1、チャネル予測パラメータc2、AACデータおよびAACパラメータを多重化した出力データを生成する。出力データの形式の一例として、例えばMPEG−2 ADTS(Audio Data Transport Stream)形式が挙げられる。図6にMPEG−2 ADTS形式のフォーマット例を示す。ADTS形式のデータ31は、ADTSヘッダのフィールド32、AACデータのフィールド33およびフィルエレメントのフィールド34を有する。フィルエレメントのフィールド34にはMPEGサラウンドデータのフィールド35が含まれている。AACデータのフィールド33には、AACエンコード部17で生成されたAACデータが格納される。MPEGサラウンドデータのフィールド35には空間情報(CLD、ICC、c1およびc2)が格納される。
・ダウンミクス方法の説明
図7は、実施例2にかかるダウンミクス方法を示すフローチャートである。図7に示すように、ダウンミキシング処理が開始されると、まず、時間周波数変換部11により、MPSエンコーダに入力する時間領域のマルチチャネル信号が周波数領域の信号に変換される(ステップS11)。次いで、時間nにおける周波数帯域kのサンプルL(k,n)ごとに以下のステップS12からステップS15までの処理が行われる。
時間nにおける周波数帯域kとして、最初に例えばkおよびnとしてゼロが設定される。つまり、時間ゼロにおける周波数帯域ゼロのマルチチャネル信号について処理が行われる。時間ゼロにおける周波数帯域ゼロの各チャネルの信号に対して、第1のR−OTT部12、第2のR−OTT部13および第3のR−OTT部14により、それぞれダウンミクス信号Lin、RinおよびCinが算出される。また、各R−OTT部12,13,14においてチャネル間のレベル差CLDおよびチャネル間の相関ICCが算出される(ステップS12)。
次いで、R−TTT部15により、Lin、RinおよびCinから回転補正後のl0'およびr0'が算出される。また、R−TTT部15においてチャネル予測パラメータc1およびc2が算出される(ステップS13)。ステップS13における詳細な処理手順については、例えば図2に示す実施例1のダウンミクス方法と同様であるので、説明を省略する。
次いで、周波数時間変換部16により、l0'およびr0'が時間領域の信号に変換される(ステップS14)。次いで、AACエンコード部17により、時間領域の信号に変換されたl0'およびr0'がAAC符号化技術によって符号化(AACエンコード)され、AACデータおよびAACパラメータが生成される(ステップS15)。
上述したステップS12からステップS15までの処理が、時間ゼロにおける周波数帯域kが1から最大値のkMAXまでのサンプル(図5参照)に対して行われる。また、上述したステップS12からステップS15までの処理が、時間nが1から最大値のnMAXまでのそれぞれについて周波数帯域kが0からkMAXまでのサンプル(図5参照)に対して行われる。時間nおよび周波数帯域kの組み合わせの全てのサンプルについてステップS15のAACエンコードが終了すると、多重化部18により、CLD、ICC、c1、c2、AACデータおよびAACパラメータが多重化される(ステップS16)。そして、一連のダウンミキシング処理が終了する。
実施例2によれば、実施例1と同様のダウンミクス装置を備えているので、MPSエンコーダにおいても実施例1と同様の効果が得られる。
上述した実施例1、2に関し、さらに以下の付記を開示する。
(付記1)入力信号に対して行列演算を行うマトリクス変換部と、前記マトリクス変換部の出力信号に対して回転を行う回転補正部と、前記回転補正部の出力信号から空間情報を抽出する空間情報抽出部と、前記回転補正部の出力信号および前記空間情報抽出部により抽出された空間情報に対して、前記マトリクス変換部における行列演算に用いた行列の逆行列を用いて行列演算を行い、前記入力信号に対する該行列演算結果の誤差量を計算する誤差計算部と、を備え、前記回転補正部は、前記誤差計算部により計算された誤差量に基づいて最終的な回転結果を決定し、前記空間情報抽出部は、前記誤差計算部により計算された誤差量に基づいて最終的な空間情報を決定することを特徴とするダウンミクス装置。
(付記2)前記空間情報抽出部は、前記空間情報として、前記マトリクス変換部の出力信号のうちの予測対象の信号を前記回転補正部の出力信号にベクトル分解したときの各ベクトルの係数を算出することを特徴とする付記1に記載のダウンミクス装置。
(付記3)前記回転補正部は、前記マトリクス変換部の出力信号に対する回転角を変化させながら、前記誤差計算部により計算された誤差量を比較し、該誤差量が最小となるときの回転結果を最終的な出力信号とすることを特徴とする付記1に記載のダウンミクス装置。
(付記4)前記空間情報抽出部は、前記誤差計算部により計算された誤差量が最小となるときの回転結果に対応する空間情報を最終的な空間情報とすることを特徴とする付記1に記載のダウンミクス装置。
(付記5)前記回転補正部は、前記誤差計算部により計算された誤差量が最小となるときの回転結果を前記入力信号の周波数帯域ごとに求め、前記空間情報抽出部は、前記誤差計算部により計算された誤差量が最小となるときの回転結果に対応する空間情報を前記入力信号の周波数帯域ごとに求めることを特徴とする付記1に記載のダウンミクス装置。
(付記6)入力信号に対して行列演算を行うマトリクス変換ステップと、前記マトリクス変換ステップでの行列演算結果に対して回転を行う回転補正ステップと、前記回転補正ステップでの回転結果から空間情報を抽出する空間情報抽出ステップと、前記回転補正ステップでの回転結果および前記空間情報抽出ステップで抽出された空間情報に対して、前記マトリクス変換ステップでの行列演算に用いた行列の逆行列を用いて行列演算を行い、前記入力信号に対する該行列演算結果の誤差量を計算する誤差計算ステップと、前記誤差計算ステップで新たに得られた誤差量を過去の誤差量と比較する誤差比較ステップと、前記誤差比較ステップで得られた新たな誤差量が過去の誤差量よりも小さいときに、該新たな誤差量に対応する前記回転補正ステップでの回転結果および該新たな誤差量に対応する前記空間情報抽出ステップで抽出された空間情報を、それぞれ新たな回転結果および空間情報として更新する更新ステップと、を含み、前記マトリクス変換ステップでの行列演算結果に対する回転角を変化させながら前記回転補正ステップ、前記空間情報抽出ステップ、前記誤差計算ステップ、前記誤差比較ステップおよび前記更新ステップを含む処理を繰り返すことを特徴とするダウンミクス方法。
(付記7)前記空間情報抽出ステップでは、前記空間情報として、前記マトリクス変換ステップでの行列演算結果のうちの予測対象の信号を前記回転補正ステップでの回転結果にベクトル分解したときの各ベクトルの係数を算出することを特徴とする付記6に記載のダウンミクス方法。
(付記8)前記回転補正ステップでは、前記誤差計算ステップで計算された誤差量が最小となるときの回転結果を前記入力信号の周波数帯域ごとに求め、前記空間情報抽出ステップで部は、前記誤差計算ステップで計算された誤差量が最小となるときの回転結果に対応する空間情報を前記入力信号の周波数帯域ごとに求めることを特徴とする付記6に記載のダウンミクス方法。
1 マトリクス変換部
2 回転補正部
3 空間情報抽出部
4 誤差計算部

Claims (6)

  1. 入力信号に対して行列演算を行うマトリクス変換部と、
    前記マトリクス変換部の出力信号のうち予測対象の信号を除く信号に対して回転を行う回転補正部と、
    前記回転補正部の出力信号から空間情報を抽出し、チャネル予測パラメータを得る空間情報抽出部と、
    前記回転補正部の出力信号と、前記空間情報抽出部により抽出されたチャネル予測パラメータに基づき求められる予測信号に対して、前記マトリクス変換部における行列演算に用いた行列の逆行列を用いて行列演算を行い、前記入力信号に対する該行列演算結果の誤差量を計算する誤差計算部と、
    を備え、
    前記回転補正部は、前記誤差計算部により計算された誤差量に基づいて最終的な回転結果を決定し、
    前記空間情報抽出部は、前記誤差計算部により計算された誤差量に基づいて最終的な空間情報を決定することを特徴とするダウンミクス装置。
  2. 前記空間情報抽出部は、前記空間情報として、前記マトリクス変換部の出力信号のうちの予測対象の信号を前記回転補正部の出力信号にベクトル分解したときの各ベクトルの係数を算出することを特徴とする請求項1に記載のダウンミクス装置。
  3. 前記回転補正部は、前記マトリクス変換部の出力信号に対する回転角を変化させながら、前記誤差計算部により計算された誤差量を比較し、該誤差量が最小となるときの回転結果を最終的な出力信号とすることを特徴とする請求項1に記載のダウンミクス装置。
  4. 前記空間情報抽出部は、前記誤差計算部により計算された誤差量が最小となるときの回転結果に対応する空間情報を最終的な空間情報とすることを特徴とする請求項1に記載のダウンミクス装置。
  5. 前記回転補正部は、前記誤差計算部により計算された誤差量が最小となるときの回転結果を前記入力信号の周波数帯域ごとに求め、
    前記空間情報抽出部は、前記誤差計算部により計算された誤差量が最小となるときの回転結果に対応する空間情報を前記入力信号の周波数帯域ごとに求めることを特徴とする請求項1に記載のダウンミクス装置。
  6. 入力信号に対して行列演算を行うマトリクス変換ステップと、
    前記マトリクス変換ステップによる出力信号のうち予測対象の信号を除く信号に対して回転を行う回転補正ステップと、
    前記回転補正ステップでの出力信号から空間情報を抽出し、チャネル予測パラメータを得る空間情報抽出ステップと、
    前記回転補正ステップの出力信号と、前記空間情報抽出ステップで抽出されたチャネル予測パラメータに基づき求められる予測信号に対して、前記マトリクス変換ステップでの行列演算に用いた行列の逆行列を用いて行列演算を行い、前記入力信号に対する該行列演算結果の誤差量を計算する誤差計算ステップと、
    を含み、
    前記回転補正ステップは、前記誤差計算ステップにより計算された誤差量に基づいて最終的な回転結果を決定し、
    前記空間情報抽出ステップは、前記誤差計算ステップにより計算された誤差量に基づいて最終的な空間情報を決定することを特徴とするダウンミクス方法。
JP2010078570A 2010-03-30 2010-03-30 ダウンミクス装置およびダウンミクス方法 Expired - Fee Related JP5604933B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010078570A JP5604933B2 (ja) 2010-03-30 2010-03-30 ダウンミクス装置およびダウンミクス方法
US13/074,379 US8818764B2 (en) 2010-03-30 2011-03-29 Downmixing device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010078570A JP5604933B2 (ja) 2010-03-30 2010-03-30 ダウンミクス装置およびダウンミクス方法

Publications (2)

Publication Number Publication Date
JP2011209588A JP2011209588A (ja) 2011-10-20
JP5604933B2 true JP5604933B2 (ja) 2014-10-15

Family

ID=44710653

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010078570A Expired - Fee Related JP5604933B2 (ja) 2010-03-30 2010-03-30 ダウンミクス装置およびダウンミクス方法

Country Status (2)

Country Link
US (1) US8818764B2 (ja)
JP (1) JP5604933B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5799824B2 (ja) * 2012-01-18 2015-10-28 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP5990954B2 (ja) * 2012-03-19 2016-09-14 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、オーディオ復号装置、オーディオ復号方法ならびにオーディオ復号用コンピュータプログラム
JP5936905B2 (ja) * 2012-04-25 2016-06-22 大王製紙株式会社 段ボール用中芯及び段ボール用中芯の製造方法
JP6051621B2 (ja) * 2012-06-29 2016-12-27 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置
JP5949270B2 (ja) * 2012-07-24 2016-07-06 富士通株式会社 オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
EP2830333A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
EP3044784B1 (en) 2013-09-12 2017-08-30 Dolby International AB Coding of multichannel audio content
KR102231755B1 (ko) 2013-10-25 2021-03-24 삼성전자주식회사 입체 음향 재생 방법 및 장치
EP3092642B1 (en) * 2014-01-09 2018-05-16 Dolby Laboratories Licensing Corporation Spatial error metrics of audio content
WO2015186535A1 (ja) * 2014-06-06 2015-12-10 ソニー株式会社 オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム
US10176813B2 (en) * 2015-04-17 2019-01-08 Dolby Laboratories Licensing Corporation Audio encoding and rendering with discontinuity compensation
WO2018086946A1 (en) 2016-11-08 2018-05-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer and method for downmixing at least two channels and multichannel encoder and multichannel decoder
KR102615903B1 (ko) * 2017-04-28 2023-12-19 디티에스, 인코포레이티드 오디오 코더 윈도우 및 변환 구현들

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
JP4867914B2 (ja) * 2004-03-01 2012-02-01 ドルビー ラボラトリーズ ライセンシング コーポレイション マルチチャンネルオーディオコーディング
MXPA06011361A (es) * 2004-04-05 2007-01-16 Koninkl Philips Electronics Nv Codificador de canales multiples.
JP4938648B2 (ja) * 2004-04-05 2012-05-23 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネル・エンコーダ
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US7734053B2 (en) 2005-12-06 2010-06-08 Fujitsu Limited Encoding apparatus, encoding method, and computer product
JP2007183528A (ja) 2005-12-06 2007-07-19 Fujitsu Ltd 符号化装置、符号化方法、および符号化プログラム
US8345899B2 (en) * 2006-05-17 2013-01-01 Creative Technology Ltd Phase-amplitude matrixed surround decoder
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
US9565509B2 (en) * 2006-10-16 2017-02-07 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치

Also Published As

Publication number Publication date
US8818764B2 (en) 2014-08-26
JP2011209588A (ja) 2011-10-20
US20110246139A1 (en) 2011-10-06

Similar Documents

Publication Publication Date Title
JP5604933B2 (ja) ダウンミクス装置およびダウンミクス方法
JP7181671B2 (ja) マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ
US10136237B2 (en) Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
TWI420512B (zh) 用以利用相位值平滑化方式來對向下混合音訊信號進行向上混合之裝置、方法和電腦程式
JP5174973B2 (ja) ダウンミックスオーディオ信号をアップミックスするための装置、方法およびコンピュータ・プログラム
TWI415113B (zh) 用以把向下混合音訊信號向上混合之向上混合器、方法與電腦程式
CA2887228C (en) Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
EP2883225B1 (en) Encoder, decoder, system and method employing a residual concept for parametric audio object coding
RU2696952C2 (ru) Аудиокодировщик и декодер
WO2010140350A1 (ja) ダウンミックス装置、符号化装置、及びこれらの方法
CN112424861B (zh) 多声道音频编码
JP5333257B2 (ja) 符号化装置、符号化システムおよび符号化方法
RU2778832C2 (ru) Многоканальное кодирование аудио
CN113544774A (zh) 降混器及降混方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131022

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140415

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140616

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140729

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140811

R150 Certificate of patent or registration of utility model

Ref document number: 5604933

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees