JP5533502B2 - オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム - Google Patents
オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム Download PDFInfo
- Publication number
- JP5533502B2 JP5533502B2 JP2010217263A JP2010217263A JP5533502B2 JP 5533502 B2 JP5533502 B2 JP 5533502B2 JP 2010217263 A JP2010217263 A JP 2010217263A JP 2010217263 A JP2010217263 A JP 2010217263A JP 5533502 B2 JP5533502 B2 JP 5533502B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- signal
- frequency
- frequency signal
- spatial information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 78
- 238000004590 computer program Methods 0.000 title claims description 10
- 238000004364 calculation method Methods 0.000 claims description 87
- 230000005236 sound signal Effects 0.000 claims description 87
- 238000006243 chemical reaction Methods 0.000 claims description 50
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 48
- 230000008569 process Effects 0.000 description 41
- 230000015572 biosynthetic process Effects 0.000 description 36
- 238000003786 synthesis reaction Methods 0.000 description 36
- 238000013139 quantization Methods 0.000 description 28
- 230000002238 attenuated effect Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 15
- 230000006866 deterioration Effects 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 10
- 101100328518 Caenorhabditis elegans cnt-1 gene Proteins 0.000 description 5
- 101100328519 Caenorhabditis elegans cnt-2 gene Proteins 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Description
その一方で、MPEG Surround方式では、5.1chの信号を3チャネルの信号へダウンミックスする際、及び3チャネルの信号を2チャネルの信号へダウンミックスする際、音の広がりまたは定位を表す空間情報が算出され、この空間情報が符号化される。このように、MPEG Surround方式では、マルチチャネルオーディオ信号をダウンミックスすることにより生成されたステレオ信号とデータ量の比較的少ない空間情報が符号化される。これにより、MPEG Surround方式では、マルチチャネルオーディオ信号に含まれる各チャネルの信号を独立に符号化するよりも高い圧縮効率が得られる。
エネルギーモードでは、空間情報は、周波数帯域ごとのチャネル間の電力比を表す2種類のパラメータとして算出される。一方、予測モードでは、空間情報は、周波数帯域ごとに3種類のパラメータにより表される。その3種類のパラメータのうちの二つは、3チャネル中の一つのチャネルの信号をその他の二つのチャネルの信号に基づいて予測するための予測係数である。残りの一つは、予測係数を用いて再生される音声の予測値である予測音と入力音の電力比である。
そこで、符号化対象のオーディオ信号に応じて、このような2種類の符号化方式のうちの最適な方式が選択されることが好ましい。
このような公知技術の一例では、各チャネルの信号が周波数ドメインのスペクトル値に変換され、そのスペクトル値に基づいて精神音響計算によって決定される聴取閾値が計算される。そして聴取閾値を用いて選択または評価された実オーディオスペクトル成分に基づいて各チャネルの信号の類似度が算出される。類似度が所定の閾値を超えた場合、チャネルの分離した符号化方式が用いられ、一方、類似度が所定の閾値以下であれば、輝度−ステレオ符号化方式が用いられる。
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を限定するものではないことを理解されたい。
発明者は、鋭意研究の結果、特定の条件下で録音されたマルチチャネルオーディオ信号をMPEG Surround方式で符号化する際、空間情報をエネルギーモードで符号化すると、その符号化された信号の再生音質が著しく劣化することを突き止めた。特に、ダウンミックスされる二つのチャネル間で信号の類似度が高く、かつ、位相差が大きい場合、その符号化された信号の再生音質が著しく劣化する。このような条件は、例えば、オーケストラによる演奏またはコンサートの音声など、前方のチャネルに信号が集中するような音源から発した音が録音されたマルチチャネルオーディオ信号で生じ易い。
なお、本実施形態では、符号化対象となるマルチチャネルオーディオ信号は、5.1chオーディオ信号である。
本実施形態では、時間周波数変換部11は、次式のQuadrature Mirror Filter(QMF)フィルタバンクを用いて、各チャネルの信号を周波数信号に変換する。
なお、時間周波数変換部11は、高速フーリエ変換、離散コサイン変換、修正離散コサイン変換など、他の時間周波数変換処理を用いて、各チャネルの信号を、それぞれ、周波数信号に変換してもよい。
同様に、RRe(k,n)は、右前方チャネルの周波数信号R(k,n)のうちの実部を表し、RIm(k,n)は、右前方チャネルの周波数信号R(k,n)のうちの虚部を表す。またSRRe(k,n)は、右後方チャネルの周波数信号SR(k,n)のうちの実部を表し、SRIm(k,n)は、右後方チャネルの周波数信号SR(k,n)のうちの虚部を表す。そしてRin(k,n)は、ダウンミックスにより生成される右チャネルの周波数信号である。なお、RinRe(k,n)は、右チャネルの周波数信号のうちの実部を表し、RinIm(k,n)は、右チャネルの周波数信号のうちの虚部を表す。
さらに、CRe(k,n)は、中央チャネルの周波数信号C(k,n)のうちの実部を表し、CIm(k,n)は、中央チャネルの周波数信号C(k,n)のうちの虚部を表す。またLFERe(k,n)は、重低音チャネルの周波数信号LFE(k,n)のうちの実部を表し、LFEIm(k,n)は、重低音チャネルの周波数信号LFE(k,n)のうちの虚部を表す。そしてCin(k,n)は、ダウンミックスにより生成される中央チャネルの周波数信号である。なお、CinRe(k,n)は、中央チャネルの周波数信号Cin(k,n)のうちの実部を表し、CinIm(k,n)は、中央チャネルの周波数信号Cin(k,n)のうちの虚部を表す。
同様に、ダウンミックス部12は、次式に従って右チャネルについての周波数帯域kの強度差CLDR(k)と類似度ICCR(k)を算出する。
さらに、ダウンミックス部12は、次式に従って中央チャネルについての周波数帯域kの強度差CLDC(k)を算出する。
エネルギーモード合成部131は、例えば、次式に従ってステレオ周波数信号の左側周波数信号Le0(k,n)及び右側周波数信号Re0(k,n)を生成する。
予測モード合成部132は、例えば、次式に従ってステレオ周波数信号の左側周波数信号Lp0(k,n)及び右側周波数信号Rp0(k,n)を生成する。さらに予測モード合成部132は、空間情報を生成するために利用される中央チャネルの信号Cp0(k,n)を次式に従って算出する。
またセレクタ15は、判定部16からの制御信号に応じて、エネルギーモード合成部131または予測モード合成部132の何れかから出力されたステレオ周波数信号をチャネル信号符号化部17へ渡す。またセレクタ15は、判定部16からの制御信号に応じて、エネルギーモード合成部131または予測モード合成部132の何れかから出力された空間情報を空間情報符号化部18へ渡す。
上記のように、ダウンミックスされる二つのチャネルの信号の類似度が高く、かつ位相差が大きい場合に、その二つのチャネルの信号が互いに打ち消しあう可能性がある。そこで、判定部16は、ダウンミックス部12から受け取った3チャネルの周波数信号に基づいて、第2ダウンミックス部13によりダウンミックスされる二つの信号間の類似度と位相差を求める。そして判定部16は、その類似度と位相差がダウンミックスにより生成されるステレオ周波数信号の振幅が減衰する判定条件を満たすか否かに応じて、予測モードかエネルギーモードの何れかを選択する。そのために、判定部16は、類似度算出部161と、位相差算出部162と、制御信号生成部163とを有する。
類似度算出部161は、類似度α1及びα2を制御信号生成部163へ出力する。
位相差算出部162は、位相差θ1及びθ2を制御信号生成部163へ出力する。
なお、類似度閾値Thaは、例えば、エネルギーモードで生成された空間情報を用いてオーディオ信号が符号化され、かつ再生された場合において、リスナーがその再生されたオーディオ信号の音質の劣化に気付かない類似度の最大値、例えば0.7に設定される。また所定の位相差範囲は、例えば、エネルギーモードで生成された空間情報を用いてオーディオ信号が符号化され、かつ再生された場合において、リスナーがその再生されたオーディオ信号の音質の劣化に気付く位相差の最大範囲となるように設定される。例えば、下限Thb1は0.89πに設定され、上限Thb2は1.11πに設定される。
この場合、制御信号生成部163は、類似度α2及び位相差θ2が右側のステレオ周波数信号が減衰する判定条件を満たすか否か判定する。具体的には、制御信号生成部163は、右チャネルと中央チャネル間の周波数信号の類似度α2が所定の類似度閾値Thaより大きく、かつその二つのチャネル間の周波数信号の位相差θ2が所定の位相差範囲(Thb1〜Thb2)内か否か判定する(ステップS104)。類似度α2が所定の類似度閾値Thaより大きく、かつ位相差θ2が所定の位相差範囲内であれば(ステップS104−Yes)、判定条件は満たされ、右チャネルと中央チャネル間の周波数信号は互いに打ち消す可能性が高い。そこで制御信号生成部163は、第2ダウンミックス部13が予測モードを用いるようセレクタ14、15への制御信号を作成する(ステップS105)。
一方、類似度α2が類似度閾値Tha以下であるか、または位相差θ2が所定の位相差範囲外であれば(ステップS104−No)、判定条件は満たされず、右チャネルと中央チャネル間の周波数信号はダウンミックスされても互いに打ち消す可能性は低い。
そこで制御信号生成部163は、第2ダウンミックス部13がエネルギーモードを用いるようセレクタ14、15への制御信号を作成する(ステップS106)。
このように、判定部16は、ダウンミックスにより生成されるステレオ周波数信号の左側のチャネル及び右側のチャネルの何れか一方でも信号が減衰する可能性があれば、第2ダウンミックス部13に予測モードで空間情報を生成させる。
なお、判定部16は、ステップS101の処理とステップS102の処理を並列に実行してもよく、あるいは、ステップS101の処理とステップS102の処理の順序を入れ替えてもよい。また判定部16は、ステップS103の処理とステップS104の処理の順序を入れ替えてもよい。
例えば、SBR符号化部171は、特開2008−224902号公報に開示されているように、SBR符号化の対象となる高域成分と強い相関のある各チャネルの周波数信号の低域成分を複製する。なお、低域成分は、SBR符号化部171が符号化対象とする高域成分が含まれる高周波数帯域よりも低い低周波数帯域に含まれる各チャネルの周波数信号の成分であり、後述するAAC符号化部173により符号化される。そしてSBR符号化部171は、複製された高域成分の電力を、元の高域成分の電力と一致するように調整する。またSBR符号化部171は、元の高域成分のうち、低域成分との差異が大きく、低域成分を複写しても、高域成分を近似できない成分を補助情報とする。そしてSBR符号化部171は、複製に利用された低域成分と対応する高域成分の位置関係を表す情報と、電力調整量と補助情報を量子化することにより符号化する。
SBR符号化部171は、上記の符号化された情報であるSBR符号を多重化部19へ出力する。
周波数時間変換部172は、各チャネルの周波数信号を周波数時間変換することにより得られた各チャネルのステレオ信号をAAC符号化部173へ出力する。
そしてAAC符号化部173は、MDCT係数の組を量子化し、その量子化されたMDCT係数の組を可変長符号化する。
AAC符号化部173は、可変長符号化されたMDCT係数の組と、量子化係数など関連する情報を、AAC符号として多重化部19へ出力する。
なお、量子化テーブル及び符号化テーブルは、予め、空間情報符号化部18が有するメモリに格納される。
例えば、周波数帯域kに対する強度差CLDL(k)が10.8dBである場合、量子化テーブル600では、インデックス値5に対応する強度差の代表値がCLDL(k)に最も近い。そこで、空間情報符号化部18は、CLDL(k)に対するインデックス値を5に設定する。
なお、量子化テーブル及び符号化テーブルは、予め、空間情報符号化部18が有するメモリに格納される。
例えば、周波数帯域kに対する予測係数CPC1(k)が1.21である場合、量子化テーブル700では、インデックス値12に対応する予測係数の代表値がCPC1(k)に最も近い。そこで、空間情報符号化部18は、CPC1(k)に対するインデックス値を12に設定する。
空間情報符号化部18は、生成したMPS符号を多重化部19へ出力する。
図8は、符号化されたオーディオ信号が格納されたデータ形式の一例を示す図である。この例では、符号化されたオーディオ信号は、MPEG-4 ADTS(Audio Data Transport Stream)形式に従って作成される。
図8に示される符号化データ列800において、データブロック810にAAC符号は格納される。またADTS形式のFILLエレメントが格納されるブロック820の一部領域にSBR符号及びMPS符号が格納される。
セレクタ14及び15は、選択されたモードが予測モードか否かによって、エネルギーモード合成部131及び予測モード合成部132の何れか一方を、ダウンミックス部12、チャネル信号符号化部17及び空間情報符号化部18と接続する(ステップS204)。選択されたモードが予測モードであれば(ステップS204−Yes)、セレクタ14は、ダウンミックス部12から受け取った3チャネルの周波数信号を第2ダウンミックス部13の予測モード合成部132へ出力する。
そして予測モード合成部132は、3チャネルの周波数信号をダウンミックスすることによりステレオ周波数信号を生成する。また予測モード合成部132は、予測モードに従って空間情報を算出する(ステップS205)。そして予測モード合成部132は、セレクタ15を介して、ステレオ周波数信号をチャネル信号符号化部17へ出力する。また予測モード合成部132は、セレクタ15を介して、空間情報を空間情報符号化部18へ出力する。
そしてエネルギーモード合成部131は、3チャネルの周波数信号をダウンミックスすることによりステレオ周波数信号を生成する。またエネルギーモード合成部131は、エネルギーモードに従って空間情報を算出する(ステップS206)。そしてエネルギーモード合成部131は、セレクタ15を介して、ステレオ周波数信号をチャネル信号符号化部17へ出力する。またエネルギーモード合成部131は、セレクタ15を介して、空間情報を空間情報符号化部18へ出力する。
そしてチャネル信号符号化部17は、複製に利用された低域成分と対応する高域成分の位置関係を表す情報などのSBR符号と、AAC符号を多重化部19へ出力する。
多重化部19は、符号化されたオーディオ信号を出力する。そしてオーディオ符号化装置1は、符号化処理を終了する。
なお、オーディオ符号化装置1は、ステップS207の処理とステップS208の処理を並列に実行してもよい。あるいは、オーディオ符号化装置1は、ステップS207の処理を行う前にステップS208の処理を実行してもよい。
図10(a)〜図10(c)において、横軸は時間を表し、縦軸は周波数を表す。そして輝線は中央チャネルの信号を表し、輝線の輝度が高いほど、強度が高いことを表す。
これに対し、図10(c)では、周波数帯域1010及び1020においても、オリジナルの信号の強度と近い強度を持つ信号が観察される。そのため、この場合の再生音の品質は、図10(b)に示された信号による再生音の品質よりも良い。このように、オーディオ符号化装置1により符号化されたマルチチャネルオーディオ信号を復号することにより、オリジナルのマルチチャネルオーディオ信号を良好に再現できることが分かる。
この場合、類似度算出部は、上記の(13)式において、Lin(k,n)、Rin(k,n)の代わりに次式に従って算出される、位相補正された左チャネルの周波数信号L'in(k,n)と右チャネルの周波数信号R'in(k,n)を入力することにより類似度α1及びα2を算出する。
類似度算出部は、このように位相補正された左チャネル及び右チャネルの周波数信号を用いることにより、中央チャネルと左チャネルまたは右チャネル間の位相のずれによる周波数信号の相違を打ち消せるので、より正確に類似度を算出することができる。
制御信号生成部は、注目する周波数帯域kにおける、左チャネルと中央チャネル間の周波数信号の類似度α1(k)が類似度閾値Thaより大きく、かつその二つのチャネル間の周波数信号の位相差θ1(k)が位相差範囲(Thb1〜Thb2)内か否か判定する(ステップS304)。類似度α1(k)が類似度閾値Thaより大きく、かつ位相差θ1(k)が位相差範囲(Thb1〜Thb2)内であれば(ステップS304−Yes)、左チャネルと中央チャネル間の周波数信号は互いに打ち消す可能性が高い。そこで制御信号生成部は、第2ダウンミックス部が予測モードを用いるよう各セレクタへの制御信号を作成する(ステップS308)。
なお、類似度閾値Thaは、上記の実施形態における類似度閾値と同様に、例えば0.7に設定される。また位相差範囲も、上記の実施形態における位相差範囲と同様に設定される。例えば、位相差範囲の下限Thb1は0.89πに設定され、位相差範囲の上限Thb2は1.11πに設定される。
この場合、制御信号生成部は、注目する周波数帯域kにおける、右チャネルと中央チャネル間の周波数信号の類似度α2(k)が類似度閾値Thaより大きく、かつその二つのチャネル間の周波数信号の位相差θ2(k)が位相差範囲内か否か判定する(ステップS305)。類似度α2(k)が所定の類似度閾値Thaより大きく、かつ位相差θ2(k)が位相差範囲内であれば(ステップS305−Yes)、右チャネルと中央チャネル間の周波数信号は互いに打ち消す可能性が高い。そこで制御信号生成部は、第2ダウンミックス部13が予測モードを用いるよう各セレクタへの制御信号を作成する(ステップS308)。
この場合、制御信号生成部は、注目する周波数帯域kが所定の周波数範囲内の最大周波数帯域か否か判定する(ステップS306)。注目する周波数帯域kが所定の周波数範囲内の最大周波数帯域でなければ(ステップS306−No)、制御信号生成部は、注目する周波数帯域を一つ大きな周波数帯域に変更する(ステップS307)。その後制御信号生成部は、ステップS304以降の処理を繰り返す。
一方、注目する周波数帯域kが所定の周波数範囲内の最大周波数帯域であれば(ステップS306−Yes)、全ての周波数帯域について、予測モードを選択するためのステップS304及びS305の判定条件は満たされない。
そこで制御信号生成部は、第2ダウンミックス部がエネルギーモードを用いるよう各セレクタへの制御信号を作成する(ステップS309)。
ステップS308またはS309の後、制御信号生成部は、制御信号を各セレクタへ出力し、その後、判定部は空間情報生成モード選択処理を終了する。
なお、所定の周波数範囲は、各チャネルの周波数信号が生成される全ての周波数帯域を含むように設定される。あるいは、所定の周波数範囲は、リスナーが音声の品質の劣化を感知し易い周波数帯域(例えば、0〜9000Hzあるいは、20〜9000Hz)のみを含むように設定されてもよい。
なお、変形例によれば、2以上の所定数の周波数帯域において、ステップS304またはステップS305の判定条件が満たされる場合に、制御信号生成部は第2ダウンミックス部が予測モードを用いるよう各セレクタへの制御信号を生成してもよい。
あるいは、制御信号生成部は、周波数帯域ごとに、予め人の聴覚特性に応じた重み係数を設定してもよい。この重み係数は、例えば、0〜1の間の何れかの値に設定され、かつ音声品質の劣化に感知し易い周波数帯域ほど大きなが値が設定される。
そして制御信号生成部は、所定の周波数範囲内の各周波数帯域についてステップS304またはステップS305の判定条件が満たされるか否か判定する。そして制御信号生成部は、ステップS304またはステップS305の判定条件が満たされた周波数帯域に設定された重み係数の合計を算出する。制御信号生成部は、その合計が所定の閾値(例えば、1または2)を超えた場合にのみ、第2ダウンミックス部に予測モードで空間情報を生成させる。
また変形例によれば、類似度算出部は、周波数帯域ごとに位相差算出部で算出された位相差を用いて左チャネル及び右チャネルの周波数信号の位相と中央チャネルの位相差を打ち消すように、左チャネル及び右チャネルの周波数信号の位相を補正してもよい。そして類似度算出部は、周波数帯域ごとに位相補正された左チャネル及び右チャネルの周波数信号を用いて類似度を算出してもよい。
図12は、この実施形態によるオーディオ符号化装置の概略構成図である。図12に示されるオーディオ符号化装置2の各構成要素には、図1に示されたオーディオ符号化装置1の対応する構成要素と同一の参照番号を付した。オーディオ符号化装置2は、オーディオ符号化装置1と比較して、第2周波数時間変換部20を有する点で異なる。そこで、以下では、第2周波数時間変換部20及び関連する各部について説明する。オーディオ符号化装置2のその他の点については、上述したオーディオ符号化装置1の説明を参照されたい。
第2周波数時間変換部20は、左、右、中央の各チャネルの周波数信号を周波数時間変換することにより得られた各チャネルの時間信号を判定部16へ出力する。
類似度算出部161は、dを-DからDまで変化させつつ、それぞれのdの値について類似度α1(d)及びα2(d)を算出する。そして類似度算出部161は、α1(d)の最大値α1max(d)を、左チャネルの時間信号と中央チャネルの時間信号間の類似度α1とする。同様に、類似度算出部161は、α2(d)の最大値α2max(d)を、右チャネルの時間信号と中央チャネルの時間信号間の類似度α2とする。
そして類似度算出部161は、α1及びα2を制御信号生成部163へ出力する。また類似度算出部161は、α1max(d)に対応するサンプル点のずれ量d1及びα2max(d)に対応するサンプル点のずれ量d2を判定部16の位相差算出部162へ渡す。
位相差算出部162は、d1及びd2を制御信号生成部163へ出力する。
次に、位相差算出部は、xを0から1ずつ増加させつつ、次式に従って、ダウンミックスにより信号が減衰する可能性のある周波数帯域θ1(x)、θ2(x)をそれぞれ算出する(ステップS403)。
位相差算出部は、各周波数帯域θ1(x)及びθ2(x)を制御信号生成部へ通知する。
cnt1が所定数Thn以上であり、かつ、類似度α1が類似度閾値Thaより大きい場合(ステップS406−Yes)、制御信号生成部は予測モードを選択する。そこで制御信号生成部は、第2ダウンミックス部が予測モードを用いるよう各セレクタへの制御信号を作成する(ステップS408)。
一方、cnt1が所定数Thn未満であるか、または、類似度α1が類似度閾値Tha未満である場合(ステップS406−No)、左チャネルの時間信号と中央チャネルの時間信号が互いに打ち消す可能性は低い。そこで制御信号生成部は、所定の周波数範囲内で信号が減衰する可能性のある周波数帯域の数cnt2が所定数Thn以上であり、かつ、右チャネルと中央チャネル間の時間信号の類似度α2が類似度閾値Thaより大きいか否か判定する(ステップS407)。cnt2が所定数Thn以上であり、かつ、類似度α2が類似度閾値Thaより大きい場合(ステップS407−Yes)、制御信号生成部は予測モードを選択する。そこで制御信号生成部は、第2ダウンミックス部が予測モードを用いるよう各セレクタへの制御信号を作成する(ステップS408)。
そこで制御信号生成部は、第2ダウンミックス部がエネルギーモードを用いるよう各セレクタへの制御信号を作成する(ステップS409)。
ステップS408またはS409の後、制御信号生成部は、制御信号を各セレクタへ出力し、その後、判定部は空間情報生成モード選択処理を終了する。
なお、判定部は、ステップS406の処理とステップS407の処理の順序を入れ替えてもよい。
また所定数Thnは、cnt1またはcnt2が2以上の所定数である場合に限り、予測モードが選択されるように、2以上の値に設定されてもよい。また、類似度閾値Thaは、上記の実施形態における類似度閾値と同様に、例えば0.7に設定される。
この実施形態によれば、二つのチャネルの信号がダウンミックスされることにより互いに打ち消しあって信号が減衰する可能性のある周波数帯域が推定される。そのため、このオーディオ符号化装置は、そのような周波数帯域がリスナーが音質の劣化を感知できる周波数の範囲に含まれるか否かを調べることができる。したがって、このオーディオ符号化装置は、信号が減衰する可能性のある周波数帯域がリスナーが音質の劣化を感知できる周波数の範囲に含まれる場合にのみ予測モードで空間情報を生成できるので、より適切に空間情報の生成モードを選択できる。
多重化部105は、符号化動画像データと符号化オーディオデータが多重化されたストリームを通信処理部106へ出力する。
(付記1)
複数のチャネルを持つオーディオ信号に含まれる各チャネルの信号を所定の時間長を持つフレーム単位で時間周波数変換することにより、前記各チャネルの信号を、それぞれ周波数信号に変換する時間周波数変換部と、
前記複数のチャネルのうちの少なくとも一つの第1のチャネルの周波数信号と少なくとも一つの第2のチャネルの周波数信号をダウンミックスすることにより、第3のチャネルの周波数信号を生成するとともに、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号間で第1の空間情報を算出する第1の空間情報算出部と、
前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号をダウンミックスすることにより、前記第3のチャネルの周波数信号を生成するとともに、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号間で前記第1の空間情報よりも情報量が少ない第2の空間情報を算出する第2の空間情報算出部と、
前記少なくとも一つの第1のチャネルの信号と前記少なくとも一つの第2のチャネルの信号の類似度を算出する類似度算出部と、
前記少なくとも一つの第1のチャネルの信号と前記少なくとも一つの第2のチャネルの信号の位相差を算出する位相差算出部と、
前記類似度及び前記位相差が所定の判定条件を満たす場合に前記第1の空間情報算出部に前記第1の空間情報を算出させ、一方、前記類似度及び前記位相差が当該所定の判定条件を満たさない場合に前記第2の空間情報算出部に前記第2の空間情報を算出させる制御部と、
前記第3のチャネルの周波数信号を符号化するチャネル信号符号化部と、
前記第1の空間情報または前記第2の空間情報を符号化する空間情報符号化部と、
を有するオーディオ符号化装置。
(付記2)
前記所定の判定条件は、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号をダウンミックスすることにより、前記第3のチャネルの周波数信号が減衰する程度に前記類似度が高く、かつ前記位相差が大きいことである、付記1に記載のオーディオ符号化装置。
(付記3)
前記類似度算出部は、前記位相差算出部により算出された前記位相差を打ち消すように前記少なくとも一つの第1のチャネルの信号を補正し、当該補正された第1のチャネルの信号と前記少なくとも一つの第2のチャネルの信号間の前記類似度を算出する、付記1または2に記載のオーディオ符号化装置。
(付記4)
前記類似度算出部は、周波数帯域ごとに前記類似度を算出し、
前記位相差算出部は、周波数帯域ごとに前記位相差を算出し、
前記制御部は、所定の周波数範囲内において、前記類似度と前記位相差が前記所定の判定条件を満たす周波数帯域の数が1以上の所定数以上である場合に前記第1の空間情報算出部に前記第1の空間情報を算出させ、一方、前記類似度と前記位相差が前記所定の判定条件を満たす周波数帯域の数が前記所定数未満である場合、前記第2の空間情報算出部に前記第2の空間情報を算出させる、付記1〜3の何れか一項に記載のオーディオ符号化装置。
(付記5)
前記所定の周波数範囲は、リスナーが前記オーディオ信号の品質の劣化を感知できる周波数範囲である、付記4に記載のオーディオ符号化装置。
(付記6)
前記少なくとも一つの第1のチャネルの信号及び前記少なくとも一つの第2のチャネルの信号は、それぞれ、当該少なくとも一つの第1のチャネルの周波数信号及び当該少なくとも一つの第2のチャネルの周波数信号である、付記1〜5の何れか一項に記載のオーディオ符号化装置。
(付記7)
前記少なくとも一つの第1のチャネルの信号及び前記少なくとも一つの第2のチャネルの信号は、それぞれ、当該少なくとも一つの第1のチャネルの時間領域の信号及び当該少なくとも一つの第2のチャネルの時間領域の信号であり、
前記位相差算出部は、前記少なくとも一つの第1のチャネルの信号と前記少なくとも一つの第2のチャネルの信号が最も類似するときの時間のずれ量を前記位相差とするとともに、当該位相差に応じて前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号をダウンミックスすることにより得られた第3の周波数信号が減衰する可能性のある減衰周波数帯域を前記時間のずれ量に応じて推定し、
前記所定の判定条件は、前記類似度が所定の類似度閾値より大きく、かつ前記減衰周波数帯域の数が少なくとも1つの所定数以上であることである、付記1に記載のオーディオ符号化装置。
(付記8)
少なくとも4以上のチャネルを持つオーディオ信号に含まれる各チャネルの信号を所定の時間長を持つフレーム単位で時間周波数変換することにより、前記各チャネルの信号を、それぞれ周波数信号に変換する時間周波数変換部と、
前記各チャネルの周波数信号をダウンミックスすることにより第1のチャネルの周波数信号、第2のチャネルの周波数信号及び第3のチャネルの周波数信号を生成し、かつダウンミックスされる各チャネル間の3チャネル空間情報を算出する第1のダウンミックス部と、
前記第1のチャネルの周波数信号と前記第2のチャネルの周波数信号をダウンミックスすることにより第4のチャネルの周波数信号を生成し、かつ、前記第1のチャネルの周波数信号と前記第3のチャネルの周波数信号をダウンミックスすることにより第5のチャネルの周波数信号を生成するとともに、前記第1のチャネルの周波数信号と前記第2のチャネルの周波数信号間及び前記第1のチャネルの周波数信号と前記第3のチャネルの周波数信号間で第1の空間情報を算出する第1の空間情報算出部と、
前記第1のチャネルの周波数信号と前記第2のチャネルの周波数信号をダウンミックスすることにより第4のチャネルの周波数信号を生成し、かつ、前記第1のチャネルの周波数信号と前記第3のチャネルの周波数信号をダウンミックスすることにより第5のチャネルの周波数信号を生成するとともに、前記第1のチャネルの周波数信号と前記第2のチャネルの周波数信号間及び前記第1のチャネルの周波数信号と前記第3のチャネルの周波数信号間で前記第1の空間情報よりも情報量の少ない第2の空間情報を算出する第2の空間情報算出部と、
前記第1のチャネルの周波数信号と前記第2のチャネルの周波数信号間の第1の類似度及び前記第1のチャネルの周波数信号と前記第3のチャネルの周波数信号間の第2の類似度を算出する類似度算出部と、
前記第1のチャネルの周波数信号と前記第2のチャネルの周波数信号間の第1の位相差及び前記第1のチャネルの周波数信号と前記第3のチャネルの周波数信号間の第2の位相差を算出する位相差算出部と、
前記第1の類似度及び前記第1の位相差が前記第4の周波数信号が減衰する条件を満たす場合、あるいは前記第2の類似度及び前記第2の位相差が前記第5の周波数信号が減衰する条件を満たす場合に前記第1の空間情報算出部に前記第1の空間情報を算出させ、一方、前記第4の周波数信号及び前記第5の周波数信号の何れについても前記条件が満たされない場合に前記第2の空間情報算出部に前記第2の空間情報を算出させる制御部と、
前記第4のチャネルの周波数信号及び前記第5のチャネルの周波数信号を符号化するチャネル信号符号化部と、
前記3チャネル空間情報と、前記第1の空間情報または前記第2の空間情報とを符号化する空間情報符号化部と、
を有するオーディオ符号化装置。
(付記9)
複数のチャネルを持つオーディオ信号に含まれる各チャネルの信号を所定の時間長を持つフレーム単位で時間周波数変換することにより、前記各チャネルの信号を、それぞれ周波数信号に変換し、
前記複数のチャネルのうちの少なくとも一つの第1のチャネルの周波数信号と少なくとも一つの第2のチャネルの周波数信号の類似度を算出し、
前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号の位相差を算出し、
前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号をダウンミックスすることにより、第3のチャネルの周波数信号を生成し、
前記類似度及び前記位相差が所定の判定条件を満たす場合に、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号間で第1の空間情報を算出し、
一方、前記類似度及び前記位相差が当該所定の判定条件を満たさない場合に、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号間で前記第1の空間情報よりも情報量が少ない第2の空間情報を算出し、
前記第3のチャネルの周波数信号を符号化し、
前記第1の空間情報または前記第2の空間情報を符号化する、
ことを含むオーディオ符号化方法。
(付記10)
複数のチャネルを持つオーディオ信号に含まれる各チャネルの信号を所定の時間長を持つフレーム単位で時間周波数変換することにより、前記各チャネルの信号を、それぞれ周波数信号に変換し、
前記複数のチャネルのうちの少なくとも一つの第1のチャネルの周波数信号と少なくとも一つの第2のチャネルの周波数信号の類似度を算出し、
前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号の位相差を算出し、
前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号をダウンミックスすることにより、第3のチャネルの周波数信号を生成し、
前記類似度及び前記位相差が所定の判定条件を満たす場合に、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号間で第1の空間情報を算出し、
一方、前記類似度及び前記位相差が当該所定の判定条件を満たさない場合に、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号間で前記第1の空間情報よりも情報量が少ない第2の空間情報を算出し、
前記第3のチャネルの周波数信号を符号化し、
前記第1の空間情報または前記第2の空間情報を符号化する、
ことをコンピュータに実行させるオーディオ符号化用コンピュータプログラム。
(付記11)
入力された動画像信号を符号化する動画像符号化部と、
入力された複数のチャネルを持つオーディオ信号を符号化するオーディオ符号化部であって、
前記オーディオ信号に含まれる各チャネルの信号を所定の時間長を持つフレーム単位で時間周波数変換することにより、前記各チャネルの信号を、それぞれ周波数信号に変換する時間周波数変換部と、
前記複数のチャネルのうちの少なくとも一つの第1のチャネルの周波数信号と少なくとも一つの第2のチャネルの周波数信号をダウンミックスすることにより、第3のチャネルの周波数信号を生成するとともに、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号間で第1の空間情報を算出する第1の空間情報算出部と、
前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号をダウンミックスすることにより、前記第3のチャネルの周波数信号を生成するとともに、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号間で前記第1の空間情報よりも情報量が少ない第2の空間情報を算出する第2の空間情報算出部と、
前記少なくとも一つの第1のチャネルの信号と前記少なくとも一つの第2のチャネルの信号の類似度を算出する類似度算出部と、
前記少なくとも一つの第1のチャネルの信号と前記少なくとも一つの第2のチャネルの信号の位相差を算出する位相差算出部と、
前記類似度及び前記位相差が所定の判定条件を満たす場合に前記第1の空間情報算出部に前記第1の空間情報を算出させ、一方、前記類似度及び前記位相差が当該所定の判定条件を満たさない場合に前記第2の空間情報算出部に前記第2の空間情報を算出させる制御部と、
前記第3のチャネルの周波数信号を符号化することによりチャネル信号符号を生成するチャネル信号符号化部と、
前記第1の空間情報または前記第2の空間情報を符号化することにより空間情報符号を生成する空間情報符号化部と、
前記チャネル信号符号と前記空間情報符号を多重化することにより、符号化されたオーディオ信号を生成する多重化部とを有するオーディオ符号化部と、
前記動画像符号化部により符号化された動画像信号と前記オーディオ符号化部により符号化されたオーディオ信号を多重化することにより映像ストリームを生成する多重化部と、
を有する映像伝送装置。
11 時間周波数変換部
12 ダウンミックス部
13 第2ダウンミックス部
131 エネルギーモード合成部
132 予測モード合成部
14、15 セレクタ
16 判定部
161 類似度算出部
162 位相差算出部
163 制御信号生成部
17 チャネル信号符号化部
18 空間情報符号化部
19 多重化部
20 第2周波数時間変換部
171 SBR符号化部
172 周波数時間変換部
173 AAC符号化部
100 映像伝送装置
101 映像取得部
102 音声取得部
103 映像符号化部
104 音声符号化部
105 多重化部
106 通信処理部
107 出力部
Claims (6)
- 複数のチャネルを持つオーディオ信号に含まれる各チャネルの信号を所定の時間長を持つフレーム単位で時間周波数変換することにより、前記各チャネルの信号を、それぞれ周波数信号に変換する時間周波数変換部と、
前記複数のチャネルのうちの少なくとも一つの第1のチャネルの周波数信号と少なくとも一つの第2のチャネルの周波数信号をダウンミックスすることにより、第3のチャネルの周波数信号を生成するとともに、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号間で第1の空間情報を算出する第1の空間情報算出部と、
前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号をダウンミックスすることにより、前記第3のチャネルの周波数信号を生成するとともに、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号間で前記第1の空間情報よりも情報量が少ない第2の空間情報を算出する第2の空間情報算出部と、
前記少なくとも一つの第1のチャネルの信号と前記少なくとも一つの第2のチャネルの信号の類似度を算出する類似度算出部と、
前記少なくとも一つの第1のチャネルの信号と前記少なくとも一つの第2のチャネルの信号の位相差を算出する位相差算出部と、
前記類似度及び前記位相差が所定の判定条件を満たす場合に前記第1の空間情報算出部に前記第1の空間情報を算出させ、一方、前記類似度及び前記位相差が当該所定の判定条件を満たさない場合に前記第2の空間情報算出部に前記第2の空間情報を算出させる制御部と、
前記第3のチャネルの周波数信号を符号化するチャネル信号符号化部と、
前記第1の空間情報または前記第2の空間情報を符号化する空間情報符号化部と、
を有するオーディオ符号化装置。 - 前記所定の判定条件は、前記類似度が所定の閾値より大きく、かつ前記位相差が所定の位相差範囲に含まれることである、請求項1に記載のオーディオ符号化装置。
- 前記類似度算出部は、前記位相差算出部により算出された前記位相差を打ち消すように前記少なくとも一つの第1のチャネルの信号を補正し、当該補正された第1のチャネルの信号と前記少なくとも一つの第2のチャネルの信号間の前記類似度を算出する、請求項1または2に記載のオーディオ符号化装置。
- 前記類似度算出部は、周波数帯域ごとに前記類似度を算出し、
前記位相差算出部は、周波数帯域ごとに前記位相差を算出し、
前記制御部は、所定の周波数範囲内において、前記類似度と前記位相差が前記所定の判定条件を満たす周波数帯域の数が1以上の所定数以上である場合に前記第1の空間情報算出部に前記第1の空間情報を算出させ、一方、前記類似度と前記位相差が前記所定の判定条件を満たす周波数帯域の数が前記所定数未満である場合、前記第2の空間情報算出部に前記第2の空間情報を算出させる、請求項1〜3の何れか一項に記載のオーディオ符号化装置。 - 複数のチャネルを持つオーディオ信号に含まれる各チャネルの信号を所定の時間長を持つフレーム単位で時間周波数変換することにより、前記各チャネルの信号を、それぞれ周波数信号に変換し、
前記複数のチャネルのうちの少なくとも一つの第1のチャネルの周波数信号と少なくとも一つの第2のチャネルの周波数信号の類似度を算出し、
前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号の位相差を算出し、
前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号をダウンミックスすることにより、第3のチャネルの周波数信号を生成し、
前記類似度及び前記位相差が所定の判定条件を満たす場合に、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号間で第1の空間情報を算出し、
一方、前記類似度及び前記位相差が当該所定の判定条件を満たさない場合に、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号間で前記第1の空間情報よりも情報量が少ない第2の空間情報を算出し、
前記第3のチャネルの周波数信号を符号化し、
前記第1の空間情報または前記第2の空間情報を符号化する、
ことを含むオーディオ符号化方法。 - 複数のチャネルを持つオーディオ信号に含まれる各チャネルの信号を所定の時間長を持つフレーム単位で時間周波数変換することにより、前記各チャネルの信号を、それぞれ周波数信号に変換し、
前記複数のチャネルのうちの少なくとも一つの第1のチャネルの周波数信号と少なくとも一つの第2のチャネルの周波数信号の類似度を算出し、
前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号の位相差を算出し、
前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号をダウンミックスすることにより、第3のチャネルの周波数信号を生成し、
前記類似度及び前記位相差が所定の判定条件を満たす場合に、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号間で第1の空間情報を算出し、
一方、前記類似度及び前記位相差が当該所定の判定条件を満たさない場合に、前記少なくとも一つの第1のチャネルの周波数信号と前記少なくとも一つの第2のチャネルの周波数信号間で前記第1の空間情報よりも情報量が少ない第2の空間情報を算出し、
前記第3のチャネルの周波数信号を符号化し、
前記第1の空間情報または前記第2の空間情報を符号化する、
ことをコンピュータに実行させるオーディオ符号化用コンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217263A JP5533502B2 (ja) | 2010-09-28 | 2010-09-28 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
US13/176,932 US20120078640A1 (en) | 2010-09-28 | 2011-07-06 | Audio encoding device, audio encoding method, and computer-readable medium storing audio-encoding computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217263A JP5533502B2 (ja) | 2010-09-28 | 2010-09-28 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012073351A JP2012073351A (ja) | 2012-04-12 |
JP5533502B2 true JP5533502B2 (ja) | 2014-06-25 |
Family
ID=45871533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010217263A Expired - Fee Related JP5533502B2 (ja) | 2010-09-28 | 2010-09-28 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20120078640A1 (ja) |
JP (1) | JP5533502B2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8639605B2 (en) * | 2006-04-21 | 2014-01-28 | Thomson Reuters Global Resources | Systems and methods for the identification and messaging of trading parties |
JP5609591B2 (ja) * | 2010-11-30 | 2014-10-22 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP5799824B2 (ja) * | 2012-01-18 | 2015-10-28 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP6051621B2 (ja) * | 2012-06-29 | 2016-12-27 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置 |
EP2880773B1 (en) * | 2012-08-03 | 2018-05-02 | Mediatek Inc. | Radio-frequency processing circuit and related wireless communication device |
JP6065452B2 (ja) * | 2012-08-14 | 2017-01-25 | 富士通株式会社 | データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム |
JP6179122B2 (ja) * | 2013-02-20 | 2017-08-16 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
JP6146069B2 (ja) * | 2013-03-18 | 2017-06-14 | 富士通株式会社 | データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム |
CN110265047B (zh) | 2013-04-05 | 2021-05-18 | 杜比国际公司 | 音频信号的解码方法和解码器、介质以及编码方法 |
EP2830053A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP2854133A1 (en) | 2013-09-27 | 2015-04-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Generation of a downmix signal |
JP6303435B2 (ja) * | 2013-11-22 | 2018-04-04 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用プログラム、オーディオ復号装置 |
CN105518558B (zh) | 2014-09-30 | 2018-02-02 | 深圳市大疆创新科技有限公司 | 一种飞行任务处理方法、装置及系统 |
WO2016086365A1 (en) * | 2014-12-03 | 2016-06-09 | Nokia Solutions And Networks Oy | Control of transmission mode selection |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4331376C1 (de) * | 1993-09-15 | 1994-11-10 | Fraunhofer Ges Forschung | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen |
JP3951690B2 (ja) * | 2000-12-14 | 2007-08-01 | ソニー株式会社 | 符号化装置および方法、並びに記録媒体 |
JP2002268694A (ja) * | 2001-03-13 | 2002-09-20 | Nippon Hoso Kyokai <Nhk> | ステレオ信号の符号化方法及び符号化装置 |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
EP2065885B1 (en) * | 2004-03-01 | 2010-07-28 | Dolby Laboratories Licensing Corporation | Multichannel audio decoding |
KR100657916B1 (ko) * | 2004-12-01 | 2006-12-14 | 삼성전자주식회사 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
US7961890B2 (en) * | 2005-04-15 | 2011-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Multi-channel hierarchical audio coding with compact side information |
US7751572B2 (en) * | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
KR100755471B1 (ko) * | 2005-07-19 | 2007-09-05 | 한국전자통신연구원 | 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법 |
US20070055510A1 (en) * | 2005-07-19 | 2007-03-08 | Johannes Hilpert | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding |
WO2007055464A1 (en) * | 2005-08-30 | 2007-05-18 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8266195B2 (en) * | 2006-03-28 | 2012-09-11 | Telefonaktiebolaget L M Ericsson (Publ) | Filter adaptive frequency resolution |
US8027479B2 (en) * | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
EP2048658B1 (en) * | 2006-08-04 | 2013-10-09 | Panasonic Corporation | Stereo audio encoding device, stereo audio decoding device, and method thereof |
JP5232795B2 (ja) * | 2007-02-14 | 2013-07-10 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースのオーディオ信号の符号化及び復号化方法並びにその装置 |
JP4984983B2 (ja) * | 2007-03-09 | 2012-07-25 | 富士通株式会社 | 符号化装置および符号化方法 |
-
2010
- 2010-09-28 JP JP2010217263A patent/JP5533502B2/ja not_active Expired - Fee Related
-
2011
- 2011-07-06 US US13/176,932 patent/US20120078640A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2012073351A (ja) | 2012-04-12 |
US20120078640A1 (en) | 2012-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5533502B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
US9812136B2 (en) | Audio processing system | |
US9741354B2 (en) | Bitstream syntax for multi-process audio decoding | |
JP4934427B2 (ja) | 音声信号復号化装置及び音声信号符号化装置 | |
US8046214B2 (en) | Low complexity decoder for complex transform coding of multi-channel sound | |
JP5267362B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 | |
KR101414354B1 (ko) | 부호화 장치 및 부호화 방법 | |
JP5243527B2 (ja) | 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム | |
JP5036317B2 (ja) | スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法 | |
JP5737077B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
US20080255859A1 (en) | Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof | |
KR20090117883A (ko) | 부호화 장치, 복호 장치 및 그 방법 | |
CA2637185A1 (en) | Complex-transform channel coding with extended-band frequency coding | |
KR20100086000A (ko) | 오디오 신호 처리 방법 및 장치 | |
RU2420026C2 (ru) | Способы и устройства для кодирования и декодирования аудиосигналов на основе объектов | |
EP3164868A1 (en) | Method and apparatus for decoding a compressed hoa representation, and method and apparatus for encoding a compressed hoa representation | |
JP5340378B2 (ja) | チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法 | |
JP5990954B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、オーディオ復号装置、オーディオ復号方法ならびにオーディオ復号用コンピュータプログラム | |
WO2011058752A1 (ja) | 符号化装置、復号装置およびこれらの方法 | |
KR20070108312A (ko) | 오디오 신호의 인코딩/디코딩 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130702 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140310 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5533502 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140414 |
|
LAPS | Cancellation because of no payment of annual fees |