JP4892184B2 - 音響信号符号化装置及び音響信号復号装置 - Google Patents

音響信号符号化装置及び音響信号復号装置 Download PDF

Info

Publication number
JP4892184B2
JP4892184B2 JP2004300441A JP2004300441A JP4892184B2 JP 4892184 B2 JP4892184 B2 JP 4892184B2 JP 2004300441 A JP2004300441 A JP 2004300441A JP 2004300441 A JP2004300441 A JP 2004300441A JP 4892184 B2 JP4892184 B2 JP 4892184B2
Authority
JP
Japan
Prior art keywords
downmix
level difference
coefficient
difference information
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004300441A
Other languages
English (en)
Other versions
JP2006113294A (ja
Inventor
良明 高木
直也 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2004300441A priority Critical patent/JP4892184B2/ja
Priority to EP05793725A priority patent/EP1865497B1/en
Priority to PCT/JP2005/018885 priority patent/WO2006041137A1/ja
Priority to CN2005800352141A priority patent/CN101040323B/zh
Priority to US11/577,151 priority patent/US7689428B2/en
Priority to KR1020077008302A priority patent/KR101129877B1/ko
Publication of JP2006113294A publication Critical patent/JP2006113294A/ja
Application granted granted Critical
Publication of JP4892184B2 publication Critical patent/JP4892184B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/006Systems employing more than two channels, e.g. quadraphonic in which a plurality of audio signals are transformed in a combination of audio signals and modulated signals, e.g. CD-4 systems

Description

本発明は、マルチチャンネル信号を符号化する音響信号符号化装置及び当該音響信号符号化装置で符号化された信号を復号する音響信号復号装置に関する。
図5は、従来の音響信号符号化装置10及び音響信号復号装置20の構成を示すブロック図である。ここでは、マルチチャンネル信号を2チャンネルの信号とし、音響信号符号化装置10が2チャンネルの信号を1チャンネルにダウンミックスする場合について説明する。
まず、音響信号符号化装置10について説明する。図5において、ダウンミックス係数記憶部11は、ダウンミックスの比率を示すダウンミックス係数が記憶されており、ダウンミックス係数がダウンミックス部12に出力される。
ダウンミックス部12は、入力された2チャンネルの信号(マルチチャンネル信号)をダウンミックス係数に従って混合することにより1チャンネルのダウンミックス信号とし、ダウンミックス信号を多重化部14に出力する。
レベル差算出部13は、ダウンミックス部12に入力された信号と同一の2チャンネルの信号が入力され、入力された2チャンネルの信号のレベル差を算出し、算出したレベル差(レベル差情報)を多重化部14に出力する。
多重化部14は、ダウンミックス部12から出力された1チャンネルのダウンミックス信号と、レベル差算出部13から出力されたレベル差情報とを多重化することによりビットストリームを形成し、形成したビットストリームを音響信号符号化装置10から出力する。
次に、音響信号復号装置20について説明する。図5において、逆多重化部21は、音響信号符号化装置10から出力されたビットストリームからダウンミックス信号とレベル差情報とを抽出し、抽出したダウンミックス信号とレベル差情報とを分離部22に出力する。
分離部22は、逆多重化部21から出力されたレベル差情報を用いて、同じく逆多重化部21から出力された1チャンネルのダウンミックス信号から2チャンネルの信号を形成する。
ここでは、分離部22がレベル差情報のみを用いて、2チャンネル信号に分離するよう記載したが、レベル差情報に加えて2チャンネルの信号の相関情報や位相情報などを用いることができる。
このように、上述した音響信号符号化装置10及び音響信号復号装置20によれば、マルチチャンネル信号を少ないチャンネル数で符号化することができる(例えば、非特許文献1参照)。
"Text of ISO/IEC 14496-3:2001/FPDAM2 (Parametric Audio)"2003年7月
しかしながら、上述した音響信号符号化装置及び音響信号復号装置は、ステレオ信号をモノラル信号にダウンミックスすることを目的として発案されたものであり、ダウンミックス対象となる2チャンネルの信号の混合比率が1対1であることを前提とするものである。一方、5.1chサラウンドに代表されるマルチチャンネルをダウンミックスする際には、2つの信号をたとえば1対0.7など、1対1以外の混合比率でダウンミックスすることが推奨されており、上述した音響信号符号化装置及び音響信号復号装置ではこのようなダウンミックス信号に対して正しく元のマルチチャンネル信号を形成できない。
本発明はかかる点に鑑みてなされたものであり、異なる比率でダウンミックスを行い、マルチチャンネル信号を少ないチャンネル数で符号化する音響信号符号化装置と、当該音響信号符号化装置で符号化された信号を復号する音響信号復号装置とを提供することを目的とする。
本発明の第1の態様は、入力された複数チャンネルの信号をダウンミックス係数の示す異なる混合比率で1チャンネルのダウンミックス信号に混合するダウンミックス手段と、前記入力された複数チャンネルの信号のレベルに前記ダウンミックス係数に従った重み付けをそれぞれ行う重み付け手段と、前記重み付け手段によって重み付けされた前記複数チャンネルの信号のレベル差を算出するレベル差算出手段と、前記ダウンミックス手段によって混合されたダウンミックス信号と、前記レベル差算出手段によって算出されたレベル差情報とを多重化することによりビットストリームを形成する多重化手段と、を具備する音響信号符号化装置である。
この構成によれば、入力された複数チャンネルの信号のレベルにダウンミックス係数に従った重み付けをそれぞれ行うことにより、1対1以外の混合比率でダウンミックスを行った場合でも、1対1以外の混合比率を複数チャンネルの信号のレベル差に反映することができるので、音響信号復号装置において、出力信号のレベル差にダウンミックス係数の混合比率が重畳されることを回避することができる。
本発明の第3の態様は、入力された複数チャンネルの信号をダウンミックス係数の示す異なる混合比率で混合された1チャンネルのダウンミックス信号と前記入力された複数チャンネルの信号のレベル差を量子化されたレベル差情報とによって形成されたビットストリームからダウンミックス信号と量子化レベル差情報とを抽出する逆多重化手段と、前記逆多重化手段によって抽出された量子化レベル差情報を量子化前のレベル差情報に変換する逆量子化手段と、前記逆量子化手段によって変換されたレベル差情報に、前記ビットストリームの形成に用いられたダウンミックス係数に従って重み付けを行う重み付け手段と、前記重み付け手段によって重み付けされたレベル差情報を用いて、前記逆多重化手段によって抽出されたダウンミックス信号を混合前の複数チャンネルに分離する分離手段と、を具備する音響信号復号装置である。
これらの構成によれば、音響信号符号化装置において、レベル差情報の大きさが0から離れるにつれて低い分解能となる量子化特性でレベル差情報を量子化しても、音響信号復号装置においてダウンミックス係数に従った重み付けを逆量子化処理後に行うことにより、量子化によるレベル差情報の劣化を低減することができる。
本発明の第4の態様は、上記態様において、複数の異なるダウンミックス係数を有し、いずれかのダウンミックス係数を選択する係数選択手段を具備し、前記多重化手段は、前記係数選択手段によって選択されたダウンミックス係数を示す係数選択情報を多重化する音響信号符号化装置である。
本発明の第5の態様は、入力された複数チャンネルの信号を選択されたダウンミックス係数の示す異なる混合比率で混合された1チャンネルのダウンミックス信号と前記入力された複数チャンネルの信号のレベル差を量子化されたレベル差情報と選択されたダウンミックス係数を示す係数選択情報とによって形成されたビットストリームからダウンミックス信号、量子化レベル差情報及び係数選択情報を抽出する逆多重化手段と、前記逆多重化手段によって抽出された量子化レベル差情報を量子化前のレベル差情報に変換する逆量子化手段と、複数の異なるダウンミックス係数を有し、前記逆多重化手段によって抽出された係数選択情報に基づいてダウンミックス係数を選択する係数選択手段と、前記逆量子化手段によって変換されたレベル差情報に、前記係数選択手段によって選択されたダウンミックス係数に従って重み付けを行う重み付け手段と、前記重み付け手段によって重み付けされたレベル差情報を用いて、前記逆多重化手段によって抽出されたダウンミックス信号を混合前の複数チャンネルに分離する分離手段と、を具備する音響信号復号装置である。
これらの構成によれば、音響信号符号化装置において複数のダウンミックス係数を用いても、音響信号復号装置の出力信号のレベル差にダウンミックス係数の混合比率が重畳されることを回避することができる。
本発明の第6の態様は、入力された複数チャンネルの信号をダウンミックス係数の示す異なる混合比率で1チャンネルのダウンミックス信号に混合するステップと、前記入力された複数チャンネルの信号のレベルに前記ダウンミックス係数に従った重み付けをそれぞれ行うステップと、前記重み付けされた複数チャンネルの信号のレベル差を算出するステップと、前記混合されたダウンミックス信号と、前記算出されたレベル差情報とを多重化することによりビットストリームを形成するステップと、を具備する音響信号符号化方法である。
この方法によれば、入力された複数チャンネルの信号のレベルにダウンミックス係数に従った重み付けをそれぞれ行うことにより、1対1以外の混合比率でダウンミックスを行った場合でも、1対1以外の混合比率を複数チャンネルの信号のレベル差に反映することができるので、音響信号復号装置において、出力信号のレベル差にダウンミックス係数の混合比率が重畳されることを回避することができる。
本発明によれば、異なる比率でダウンミックスを行い、マルチチャンネル信号を少ないチャンネル数で符号化する音響信号符号化装置と、当該音響信号符号化装置で符号化された信号を復号する音響信号復号装置とを提供することができる。
以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、実施の形態において、同一機能を有する構成には同一符号を付し、重複する説明は省略する。
(実施の形態1)
図1は、本発明の実施の形態1に係る音響信号符号化装置100及び音響信号復号装置200の構成を示す図である。ここでは、マルチチャンネル信号を2チャンネルの信号とし、音響信号符号化装置100が2チャンネルの信号を1チャンネルにダウンミックスする場合について説明する。
まず、音響信号符号化装置100について説明する。図1において、ダウンミックス係数記憶部101には、ダウンミックスの比率を示すダウンミックス係数が記憶されており、ダウンミックス係数がダウンミックス部102及び重み付け部103に出力される。
ダウンミックス部102は、入力された2チャンネルの信号(マルチチャンネル信号)をダウンミックス係数記憶部101からのダウンミックス係数に従って混合することにより1チャンネルのダウンミックス信号とし、ダウンミックス信号を多重化部105に出力する。
重み付け部103は、ダウンミックス部102に入力された信号と同一の2チャンネルの信号が入力され、入力された2チャンネルの信号のレベルをダウンミックス係数に従ってそれぞれ重み付けする。重み付けされた2チャンネルの入力信号はレベル差算出部104に出力される。
レベル差算出部104は、重み付けされた2チャンネルの信号のレベル差を算出し、算出したレベル差(レベル差情報)を多重化部105に出力する。
多重化部105は、ダウンミックス部102から出力された1チャンネルのダウンミックス信号と、レベル差算出部104から出力されたレベル差情報とを多重化することによりビットストリームを形成し、形成したビットストリームを音響信号符号化装置100から出力する。
次に、音響信号復号装置200について説明する。図1において、逆多重化部201は、音響信号符号化装置100から出力されたビットストリームからダウンミックス信号とレベル差情報を抽出し、抽出したダウンミックス信号とレベル差情報とを分離部202に出力する。
分離部202は、逆多重化部201から出力されたレベル差情報を用いて、同じく逆多重化部201から出力された1チャンネルのダウンミックス信号から2チャンネルの信号を形成する。
次に、上記構成を有する音響信号符号化装置100及び音響信号復号装置200の動作について説明する。まず、音響信号符号化装置100に入力された2チャンネルの信号は、ダウンミックス部102において、ダウンミックス係数記憶部101に記憶されたダウンミックス係数の混合比率で1チャンネルの信号に混合される。このとき、ダウンミックス信号を圧縮符号化することも可能であるが、ここではその詳細な説明は省略する。1チャンネルに混合されたダウンミックス信号は多重化部105に出力される。
また、音響信号符号化装置100に入力された2チャンネルの信号は、重み付け部103において、図6に示すように、ダウンミックス係数記憶部101に記憶されたダウンミックス係数に従って重み付けされることによりレベルが変更され、レベルが変更された2チャンネルの信号はレベル差算出部104に出力される。これにより、ダウンミックス係数が1対1以外の混合比率、例えば1対ルート2などであった場合でも、2チャンネルの信号レベルをその混合比率に応じたレベルにすることができる。また、2チャンネルより多くの信号をダウンミックスする際には、2チャンネルを1チャンネルにダウンミックスする作業を繰り返して行うことにより実現できる。
重み付けされた2チャンネルの信号は、レベル差算出部104において、レベル差が算出され、算出されたレベル差が多重化部105に出力される。
ダウンミックス部102から出力されたダウンミックス信号と、レベル差算出部104から出力されたレベル差情報とは、多重化部105において、多重化されることによりビットストリームとして出力される。
音響信号復号装置200に入力されたビットストリームは、逆多重化部201において、ダウンミックス信号とレベル差情報とに分離される。分離されたダウンミックス信号は、分離部202において、分離されたレベル差情報に基づいて2チャンネルの信号に分離される。このとき、レベル差情報に加えて2チャンネルの信号の相互相関や位相差などの情報を使用することにより、分離部202の精度を高めることができる。以下に分離処理の計算例を示す。
L = M * 10^(energy_dB - ILD/2)
R = M' * 10^(energy_dB + ILD/2)
ここで、Lは分離された左チャンネル信号、Rは分離された右チャンネル信号、Mはダウンミックス信号、M’はダウンミックス信号から生成された擬似信号、energy_dBはダウンミックス信号のエネルギ、ILDはレベル差情報である。
このように実施の形態1によれば、音響信号符号化装置において、2チャンネルの入力信号にダウンミックス係数に従った重み付けをそれぞれ行って、重み付けを行った2チャンネルの信号のレベル差を算出することにより、1対1以外の混合比率でダウンミックスを行った場合でも、音響信号復号装置における出力信号のレベル差にダウンミックス係数の混合比率が重畳されることを回避し、よって、レベル差にずれが生じることを防止することができる。
(実施の形態2)
図2は、本発明の実施の形態2に係る音響信号符号化装置110及び音響信号復号装置210の構成を示すブロック図である。この図において、音響信号符号化装置110におけるレベル差算出部104は、ダウンミックス部102に入力された信号と同一の2チャンネルの信号が入力され、入力された2チャンネルの信号のレベル差を算出し、算出したレベル差(レベル差情報)を量子化部111に出力する。
量子化部111は、図3に示すように、レベル差算出部104から出力されたレベル差情報(入力)の大きさが0に近い領域では高い分解能で量子化を行い、レベル差情報の大きさが0から離れるにつれて低い分解能で量子化を行うという量子化特性を有する。そして、レベル差算出部104から出力されたレベル差情報を量子化することにより圧縮し、量子化レベル差情報を多重化部105に出力する。
音響信号復号装置210における逆多重化部201は、入力されたビットストリームからダウンミックス信号と量子化レベル差情報とを抽出し、ダウンミックス信号を分離部202に出力し、量子化レベル差情報を逆量子化部211に出力する。
逆量子化部211は、逆多重化部201から出力された量子化レベル差情報をレベル差情報に変換し、レベル差情報を重み付け部213に出力する。
ダウンミックス係数記憶部212には、音響信号符号化装置110におけるダウンミックス係数記憶部101に記憶されたダウンミックス係数と同一のダウンミックス係数が記憶され、記憶されたダウンミックス係数が重み付け部213に出力される。
重み付け部213は、ダウンミックス係数記憶部212から出力されたダウンミックス係数に従った重み付けを逆量子化部211から出力されたレベル差情報に行い、重み付けしたレベル差情報を分離部202に出力する。
次に、上記構成を有する音響信号符号化装置110及び音響信号復号装置210の動作について説明する。音響信号符号化装置110に入力された2チャンネルの信号は、レベル差算出部104においてレベル差情報が算出され、算出されたレベル差情報は量子化部111において量子化される。
ダウンミックス信号と量子化されたレベル差情報は、多重化部105において多重化されることによりビットストリームとして出力される。
音響信号復号装置210に入力されたビットストリームは、逆多重化部201において、ダウンミックス信号と量子化レベル差情報とに分離され、ダウンミックス信号は分離部202に、量子化レベル差情報は逆量子化部211にそれぞれ出力される。
量子化レベル差情報は逆量子化部211において量子化前のレベル差情報に変換され、変換されたレベル差情報は重み付け部213において音響信号符号化装置110で使用されたダウンミックス係数と同一のダウンミックス係数に従って重み付けが行われることにより補正される。以下に重み付け処理の計算例を示す。
ILD = ILD_org + 20 * log(α0 / α3)
ここで、ILDは分離処理で使用されるレベル差情報、ILD_orgは逆量子化されたレベル差情報、α0とα3はそれぞれダウンミックス係数である。
ダウンミックス信号は、分離部202において、補正されたレベル差情報に基づいて2チャンネルの信号に分離される。以下に分離処理の計算例を示す。
L = M * 10^(energy_dB - ILD/2)
R = M' * 10^(energy_dB + ILD/2)
ここで、Lは分離された左チャンネル信号、Rは分離された右チャンネル信号、Mはダウンミックス信号、M’はダウンミックス信号から生成された擬似信号、energy_dBはダウンミックス信号のエネルギ、ILDはレベル差情報である。
ここで、図1に示した音響信号符号化装置100に量子化部111を備えた場合を想定し、1対1以外の混合比率でダウンミックスを行うと、重み付け部103によってダウンミックス係数に従った重み付けが行われるため、レベル差が大きくなり、低い分解能で量子化を行わなければならなくなる。これに対し、本実施の形態では、入力された2チャンネルの信号に重み付けを行わず、ダウンミックス係数に従った重み付けを音響信号復号装置210において逆量子化処理後に行うことにより、高い分解能で量子化を行うと共に、1対1以外の混合比率でダウンミックスを行った場合でも、音響信号復号装置210における出力信号のレベル差にダウンミックス係数の混合比率が重畳されることを回避し、よって、レベル差にずれが生じることを防止することができる。
このように実施の形態2によれば、音響信号符号化装置において、レベル差情報の大きさが0に近い領域では高い分解能で量子化を行い、レベル差情報の大きさが0から離れるにつれて低い分解能で量子化を行うという量子化特性で2チャンネルの入力信号のレベル差情報を量子化し、音響信号復号装置において、量子化されたレベル差情報を量子化前のレベル差情報に変換し、変換されたレベル差情報を音響信号符号化装置で用いられたダウンミックス係数に従って補正することにより、量子化によるレベル差情報の劣化を低減することができる。
(実施の形態3)
図4は、本発明の実施の形態3に係る音響信号符号化装置120及び音響信号復号装置220の構成を示すブロック図である。この図において、音響信号符号化装置120におけるダウンミックス係数記憶部121には、複数の異なる混合比率を示す複数のダウンミックス係数が記憶されている。
係数選択部122は、ダウンミックス係数記憶部121に記憶された複数のダウンミックス係数のうち、いずれのダウンミックス係数を用いるか選択し、選択したダウンミックス係数をダウンミックス部102に出力し、選択したダウンミックス係数を示す係数選択情報を多重化部105に出力する。
多重化部105は、ダウンミックス部102から出力された1チャンネルのダウンミックス信号と、量子化部111から出力された量子化レベル差情報と、係数選択部122から出力された係数選択情報とを多重化することによりビットストリームを形成し、形成したビットストリームを音響信号符号化装置120から出力する。
音響信号復号装置220における逆多重化部201は、入力されたビットストリームからダウンミックス信号と、量子化レベル差情報と、係数選択情報とを抽出し、ダウンミックス信号を分離部202に出力し、量子化レベル差情報を逆量子化部211に出力し、係数選択情報を係数選択部222に出力する。
ダウンミックス係数記憶部221には、音響信号符号化装置120におけるダウンミックス係数記憶部121に記憶されたダウンミックス係数と同一の複数のダウンミックス係数が記憶されている。
係数選択部222は、逆多重化部201から出力された係数選択情報に基づいて、ダウンミックス係数をダウンミックス係数記憶部221から選択し、選択したダウンミックス係数を重み付け部213に出力する。
次に、上記構成を有する音響信号符号化装置120及び音響信号復号装置220の動作について説明する。まず、ダウンミックス係数記憶部121からいずれのダウンミックス係数を用いるかが係数選択部122によって選択される。ダウンミックスの例として、次式が挙げられる。
Lmix = α0*Lf ± α1*Rf ± α2*C ± α3*Ls ± α4*Rs ± α5*LFE
Rmix = β1*Rf ± β0*Lf ± β2*C ± β3*Ls ± β4*Rs ± β5*LFE
上記の式において、Lmixはダウンミックスされた左チャンネルの信号、Rmixはダウンミックスされた右チャンネルの信号、Lfは左前方チャンネルの信号、Rfは右前方チャンネルの信号、Cはセンターチャンネルの信号、Lsは左後方チャンネルの信号、Rsは右後方チャンネルの信号、LFEはサブウーハーチャンネルの信号を表し、α0,α1,α2,α3,α4,α5,β0,β1,β2,β3,β4,β5はそれぞれダウンミックス係数を表す。
ダウンミックス係数の一例として、以下の係数がITUによって定義されている。
Figure 0004892184
上記の係数はあくまで一例であり、各種の係数がダウンミックス作業者によって定義され、用いられている。
音響信号符号化装置120に入力された2チャンネルの信号は、係数選択部122によって選択されたダウンミックス係数の混合比率でダウンミックス部102において1チャンネルの信号に混合される。
一方、音響信号符号化装置120に入力された2チャンネルの信号は、レベル差算出部104においてレベル差情報が算出され、算出されたレベル差情報は、量子化部111において量子化される。
ダウンミックス信号、量子化レベル差情報及び係数選択情報は、多重化部105において多重化されることによりビットストリームとして出力される。
音響信号復号装置220に入力されたビットストリームは、逆多重化部201において、ダウンミックス信号、量子化レベル差情報及び係数選択情報に分離される。
係数選択部222では、係数選択情報に基づいてダウンミックス係数記憶部221から音響信号符号化装置120で使用されたダウンミックス係数と同一のダウンミックス係数が選択される。
量子化レベル差情報は、逆量子化部211において、量子化前のレベル差情報に変換される。変換されたレベル差情報は、重み付け部213において、係数選択部222によって選択されたダウンミックス係数に従って重み付けされることにより補正される。
ダウンミックス信号は、分離部202において、補正されたレベル差情報に基づいて2チャンネルの信号に分離される。
このように実施の形態3によれば、音響信号符号化装置において、複数の異なるダウンミックス係数から選択されたダウンミックス係数で2チャンネルの信号を1チャンネルに混合すると共に、選択されたダウンミックス係数を音響信号復号装置に通知し、音響信号復号装置において、通知されたダウンミックス係数に従ってレベル差情報を補正することにより、複数のダウンミックス係数を用いても、音響信号復号装置における出力信号のレベル差にダウンミックス係数の混合比率が重畳されることを回避し、よって、レベル差にずれが生じることを防止することができる。
なお、本実施の形態では、係数選択情報を伝送する場合を例に挙げて説明したが、本発明はこれに限らず、選択されたダウンミックス係数自身を伝送してもよく、この場合、音響信号復号装置が複数のダウンミックス係数と係数選択部を備える必要がなくなる。
本発明にかかる音響信号符号化装置は、異なる比率でダウンミックスを行い、マルチチャンネル信号を少ないチャンネル数で符号化するという効果を有し、小型化が必要な携帯機器等に適用することができ、また、本発明にかかる音響信号復号装置は、音響信号符号化装置で符号化された信号を復号するという効果を有し、小型化が必要な携帯機器等に適用することができる。
本発明の実施の形態1に係る音響信号符号化装置及び音響信号復号装置の構成を示すブロック図 本実施の形態2における音響信号符号化装置及び音響信号復号装置の構成を示すブロック図 量子化ステップを示す図 本実施の形態3における音響信号符号化装置及び音響信号復号装置の構成を示すブロック図 従来の音響信号符号化装置及び音響信号復号装置の構成を示すブロック図 重み付け部の構成を示す図
符号の説明
101、212、121、221 ダウンミックス係数記憶部
102 ダウンミックス部
103、213 重み付け部
104 レベル差算出部
105 多重化部
201 逆多重化部
202 分離部
111 量子化部
211 逆量子化部
122、222 係数選択部

Claims (5)

  1. 入力された複数チャンネルの信号をダウンミックス係数の示す異なる混合比率で1チャンネルのダウンミックス信号に混合するダウンミックス手段と、
    前記入力された複数チャンネルの信号のレベルに前記ダウンミックス係数に従った重み付けをそれぞれ行う重み付け手段と、
    前記重み付け手段によって重み付けされた前記複数チャンネルの信号のレベル差を算出するレベル差算出手段と、
    前記ダウンミックス手段によって混合されたダウンミックス信号と、前記レベル差算出手段によって算出されたレベル差情報とを多重化することによりビットストリームを形成する多重化手段と、
    を具備することを特徴とする音響信号符号化装置。
  2. 入力された複数チャンネルの信号をダウンミックス係数の示す異なる混合比率で混合された1チャンネルのダウンミックス信号と前記入力された複数チャンネルの信号のレベル差を量子化されたレベル差情報とによって形成されたビットストリームからダウンミックス信号と量子化レベル差情報とを抽出する逆多重化手段と、
    前記逆多重化手段によって抽出された量子化レベル差情報を量子化前のレベル差情報に変換する逆量子化手段と、
    前記逆量子化手段によって変換されたレベル差情報に、前記ビットストリームの形成に用いられたダウンミックス係数に従って重み付けを行う重み付け手段と、
    前記重み付け手段によって重み付けされたレベル差情報を用いて、前記逆多重化手段によって抽出されたダウンミックス信号を混合前の複数チャンネルに分離する分離手段と、
    を具備することを特徴とする音響信号復号装置。
  3. 複数の異なるダウンミックス係数を有し、いずれかのダウンミックス係数を選択する係数選択手段を具備し、
    前記多重化手段は、前記係数選択手段によって選択されたダウンミックス係数を示す係数選択情報を多重化する
    ことを特徴とする請求項に記載の音響信号符号化装置。
  4. 入力された複数チャンネルの信号を選択されたダウンミックス係数の示す異なる混合比率で混合された1チャンネルのダウンミックス信号と前記入力された複数チャンネルの信号のレベル差を量子化されたレベル差情報と選択されたダウンミックス係数を示す係数選択情報とによって形成されたビットストリームからダウンミックス信号、量子化レベル差情報及び係数選択情報を抽出する逆多重化手段と、
    前記逆多重化手段によって抽出された量子化レベル差情報を量子化前のレベル差情報に変換する逆量子化手段と、
    複数の異なるダウンミックス係数を有し、前記逆多重化手段によって抽出された係数選択情報に基づいてダウンミックス係数を選択する係数選択手段と、
    前記逆量子化手段によって変換されたレベル差情報に、前記係数選択手段によって選択されたダウンミックス係数に従って重み付けを行う重み付け手段と、
    前記重み付け手段によって重み付けされたレベル差情報を用いて、前記逆多重化手段によって抽出されたダウンミックス信号を混合前の複数チャンネルに分離する分離手段と、
    を具備することを特徴とする音響信号復号装置。
  5. 入力された複数チャンネルの信号をダウンミックス係数の示す異なる混合比率で1チャンネルのダウンミックス信号に混合するステップと、
    前記入力された複数チャンネルの信号のレベルに前記ダウンミックス係数に従った重み付けをそれぞれ行うステップと、
    前記重み付けされた複数チャンネルの信号のレベル差を算出するステップと、
    前記混合されたダウンミックス信号と、前記算出されたレベル差情報とを多重化することによりビットストリームを形成するステップと、
    を具備することを特徴とする音響信号符号化方法。
JP2004300441A 2004-10-14 2004-10-14 音響信号符号化装置及び音響信号復号装置 Expired - Fee Related JP4892184B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2004300441A JP4892184B2 (ja) 2004-10-14 2004-10-14 音響信号符号化装置及び音響信号復号装置
EP05793725A EP1865497B1 (en) 2004-10-14 2005-10-13 Acoustic signal decoding
PCT/JP2005/018885 WO2006041137A1 (ja) 2004-10-14 2005-10-13 音響信号符号化装置及び音響信号復号装置
CN2005800352141A CN101040323B (zh) 2004-10-14 2005-10-13 音响信号编解码装置和音响信号编码方法
US11/577,151 US7689428B2 (en) 2004-10-14 2005-10-13 Acoustic signal encoding device, and acoustic signal decoding device
KR1020077008302A KR101129877B1 (ko) 2004-10-14 2005-10-13 음향 신호 복호 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004300441A JP4892184B2 (ja) 2004-10-14 2004-10-14 音響信号符号化装置及び音響信号復号装置

Publications (2)

Publication Number Publication Date
JP2006113294A JP2006113294A (ja) 2006-04-27
JP4892184B2 true JP4892184B2 (ja) 2012-03-07

Family

ID=36148424

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004300441A Expired - Fee Related JP4892184B2 (ja) 2004-10-14 2004-10-14 音響信号符号化装置及び音響信号復号装置

Country Status (6)

Country Link
US (1) US7689428B2 (ja)
EP (1) EP1865497B1 (ja)
JP (1) JP4892184B2 (ja)
KR (1) KR101129877B1 (ja)
CN (1) CN101040323B (ja)
WO (1) WO2006041137A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4896449B2 (ja) * 2005-06-29 2012-03-14 株式会社東芝 音響信号処理方法、装置及びプログラム
DE602007012730D1 (de) * 2006-09-18 2011-04-07 Koninkl Philips Electronics Nv Kodierung und dekodierung von audio-objekten
WO2008069594A1 (en) 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US20110112843A1 (en) * 2008-07-11 2011-05-12 Nec Corporation Signal analyzing device, signal control device, and method and program therefor
WO2010038318A1 (en) * 2008-10-01 2010-04-08 Thomson Licensing Decoding apparatus, decoding method, encoding apparatus, encoding method, and editing apparatus
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
WO2011097903A1 (zh) * 2010-02-11 2011-08-18 华为技术有限公司 多声道信号编码、解码方法、装置及编解码系统
CN102157149B (zh) 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
KR101227932B1 (ko) * 2011-01-14 2013-01-30 전자부품연구원 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법
JP5715514B2 (ja) * 2011-07-04 2015-05-07 日本放送協会 オーディオ信号ミキシング装置およびそのプログラム、ならびに、オーディオ信号復元装置およびそのプログラム
CN102395097A (zh) * 2011-09-29 2012-03-28 深圳市万兴软件有限公司 一种多声道音频信号缩混方法及系统
ITTO20120274A1 (it) * 2012-03-27 2013-09-28 Inst Rundfunktechnik Gmbh Dispositivo per il missaggio di almeno due segnali audio.
KR20140016780A (ko) * 2012-07-31 2014-02-10 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 방법 및 장치
JP2016174257A (ja) * 2015-03-17 2016-09-29 ヤマハ株式会社 レベル制御装置
CN105812986A (zh) * 2016-05-09 2016-07-27 中山奥凯华泰电子有限公司 将多声道缩混成无线两声道的音箱和处理方法
CN108269577B (zh) 2016-12-30 2019-10-22 华为技术有限公司 立体声编码方法及立体声编码器
CN112352277A (zh) * 2018-07-03 2021-02-09 松下电器(美国)知识产权公司 编码装置及编码方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06319200A (ja) * 1993-05-10 1994-11-15 Fujitsu General Ltd ステレオ用バランス調整装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JPH10215500A (ja) * 1997-01-30 1998-08-11 Matsushita Electric Ind Co Ltd テレビジョン受像機の多チャンネル音声出力回路
JP4210237B2 (ja) 1998-05-25 2009-01-14 ダイセル化学工業株式会社 フォトレジスト用化合物およびフォトレジスト用樹脂組成物
US6961432B1 (en) * 1999-04-29 2005-11-01 Agere Systems Inc. Multidescriptive coding technique for multistream communication of signals
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
WO2003094369A2 (en) * 2002-05-03 2003-11-13 Harman International Industries, Incorporated Multi-channel downmixing device
US7447629B2 (en) * 2002-07-12 2008-11-04 Koninklijke Philips Electronics N.V. Audio coding
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
CN1748247B (zh) * 2003-02-11 2011-06-15 皇家飞利浦电子股份有限公司 音频编码
BRPI0415951B1 (pt) * 2003-10-30 2018-08-28 Coding Tech Ab método e codificador de áudio para codificar um sinal de áudio, e, método e decodificador de áudio para decodificar um sinal de áudio codificado
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal

Also Published As

Publication number Publication date
JP2006113294A (ja) 2006-04-27
EP1865497A4 (en) 2010-07-14
US20090030704A1 (en) 2009-01-29
EP1865497A1 (en) 2007-12-12
WO2006041137A1 (ja) 2006-04-20
CN101040323A (zh) 2007-09-19
KR101129877B1 (ko) 2012-03-23
EP1865497B1 (en) 2012-03-28
CN101040323B (zh) 2011-01-26
KR20070065370A (ko) 2007-06-22
US7689428B2 (en) 2010-03-30

Similar Documents

Publication Publication Date Title
US7689428B2 (en) Acoustic signal encoding device, and acoustic signal decoding device
KR101395254B1 (ko) 부가정보 비트스트림 변환을 포함하는 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법
JP4944029B2 (ja) オーディオデコーダおよびオーディオ信号の復号方法
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
US7719445B2 (en) Method and apparatus for encoding/decoding multi-channel audio signal
JP5053849B2 (ja) マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法
JP2010515099A5 (ja)
JP2008511040A (ja) 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
KR20160003572A (ko) 다채널 오디오 신호 처리 방법 및 장치
JP2006337767A (ja) 低演算量パラメトリックマルチチャンネル復号装置および方法
JP2006323314A (ja) マルチチャネル音声信号をバイノーラルキュー符号化する装置
EP2770505B1 (en) Audio coding device and method
KR101783967B1 (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법
WO2017148526A1 (en) Audio signal encoder, audio signal decoder, method for encoding and method for decoding
WO2022200666A1 (en) Combining spatial audio streams
KR20070041336A (ko) 오디오 신호의 인코딩 및 디코딩 방법, 및 이를 구현하기위한 장치
KR20150045879A (ko) 공간 필터를 이용한 다채널 오디오 부호화/복호화 장치 및 방법
KR20140122990A (ko) 다채널 오디오 신호 부호화/복호화 장치 및 방법
KR20160078321A (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법
KR20070108313A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111129

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111219

R150 Certificate of patent or registration of utility model

Ref document number: 4892184

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141222

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees