JP2006113294A - 音響信号符号化装置及び音響信号復号装置 - Google Patents

音響信号符号化装置及び音響信号復号装置 Download PDF

Info

Publication number
JP2006113294A
JP2006113294A JP2004300441A JP2004300441A JP2006113294A JP 2006113294 A JP2006113294 A JP 2006113294A JP 2004300441 A JP2004300441 A JP 2004300441A JP 2004300441 A JP2004300441 A JP 2004300441A JP 2006113294 A JP2006113294 A JP 2006113294A
Authority
JP
Japan
Prior art keywords
downmix
level difference
coefficient
difference information
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004300441A
Other languages
English (en)
Other versions
JP4892184B2 (ja
Inventor
Yoshiaki Takagi
良明 高木
Naoya Tanaka
直也 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2004300441A priority Critical patent/JP4892184B2/ja
Priority to EP05793725A priority patent/EP1865497B1/en
Priority to KR1020077008302A priority patent/KR101129877B1/ko
Priority to US11/577,151 priority patent/US7689428B2/en
Priority to CN2005800352141A priority patent/CN101040323B/zh
Priority to PCT/JP2005/018885 priority patent/WO2006041137A1/ja
Publication of JP2006113294A publication Critical patent/JP2006113294A/ja
Application granted granted Critical
Publication of JP4892184B2 publication Critical patent/JP4892184B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/006Systems employing more than two channels, e.g. quadraphonic in which a plurality of audio signals are transformed in a combination of audio signals and modulated signals, e.g. CD-4 systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】 異なる比率でダウンミックスを行い、マルチチャンネル信号を少ないチャンネル数で符号化する音響信号符号化装置と、当該音響信号符号化装置で符号化された信号を復号する音響信号復号装置とを提供すること。
【解決手段】 音響信号符号化装置100における重み付け手段103が2チャンネルの入力信号にダウンミックス係数に従った重み付けをそれぞれ行い、レベル差算出部104が重み付けを行った2チャンネルの信号のレベル差を算出し、音響信号復号装置200における分離部202が重み付けされたレベル差情報を用いてダウンミックス信号を2チャンネルの信号に分離する。
【選択図】 図1

Description

本発明は、マルチチャンネル信号を符号化する音響信号符号化装置及び当該音響信号符号化装置で符号化された信号を復号する音響信号復号装置に関する。
図5は、従来の音響信号符号化装置10及び音響信号復号装置20の構成を示すブロック図である。ここでは、マルチチャンネル信号を2チャンネルの信号とし、音響信号符号化装置10が2チャンネルの信号を1チャンネルにダウンミックスする場合について説明する。
まず、音響信号符号化装置10について説明する。図5において、ダウンミックス係数記憶部11は、ダウンミックスの比率を示すダウンミックス係数が記憶されており、ダウンミックス係数がダウンミックス部12に出力される。
ダウンミックス部12は、入力された2チャンネルの信号(マルチチャンネル信号)をダウンミックス係数に従って混合することにより1チャンネルのダウンミックス信号とし、ダウンミックス信号を多重化部14に出力する。
レベル差算出部13は、ダウンミックス部12に入力された信号と同一の2チャンネルの信号が入力され、入力された2チャンネルの信号のレベル差を算出し、算出したレベル差(レベル差情報)を多重化部14に出力する。
多重化部14は、ダウンミックス部12から出力された1チャンネルのダウンミックス信号と、レベル差算出部13から出力されたレベル差情報とを多重化することによりビットストリームを形成し、形成したビットストリームを音響信号符号化装置10から出力する。
次に、音響信号復号装置20について説明する。図5において、逆多重化部21は、音響信号符号化装置10から出力されたビットストリームからダウンミックス信号とレベル差情報とを抽出し、抽出したダウンミックス信号とレベル差情報とを分離部22に出力する。
分離部22は、逆多重化部21から出力されたレベル差情報を用いて、同じく逆多重化部21から出力された1チャンネルのダウンミックス信号から2チャンネルの信号を形成する。
ここでは、分離部22がレベル差情報のみを用いて、2チャンネル信号に分離するよう記載したが、レベル差情報に加えて2チャンネルの信号の相関情報や位相情報などを用いることができる。
このように、上述した音響信号符号化装置10及び音響信号復号装置20によれば、マルチチャンネル信号を少ないチャンネル数で符号化することができる(例えば、非特許文献1参照)。
"Text of ISO/IEC 14496-3:2001/FPDAM2 (Parametric Audio)"2003年7月
しかしながら、上述した音響信号符号化装置及び音響信号復号装置は、ステレオ信号をモノラル信号にダウンミックスすることを目的として発案されたものであり、ダウンミックス対象となる2チャンネルの信号の混合比率が1対1であることを前提とするものである。一方、5.1chサラウンドに代表されるマルチチャンネルをダウンミックスする際には、2つの信号をたとえば1対0.7など、1対1以外の混合比率でダウンミックスすることが推奨されており、上述した音響信号符号化装置及び音響信号復号装置ではこのようなダウンミックス信号に対して正しく元のマルチチャンネル信号を形成できない。
本発明はかかる点に鑑みてなされたものであり、異なる比率でダウンミックスを行い、マルチチャンネル信号を少ないチャンネル数で符号化する音響信号符号化装置と、当該音響信号符号化装置で符号化された信号を復号する音響信号復号装置とを提供することを目的とする。
本発明の第1の態様は、入力された複数チャンネルの信号をダウンミックス係数の示す混合比率で1チャンネルのダウンミックス信号に混合するダウンミックス手段と、前記入力された複数チャンネルの信号のレベルに前記ダウンミックス係数に従った重み付けをそれぞれ行う重み付け手段と、前記重み付け手段によって重み付けされた前記複数チャンネルの信号のレベル差を算出するレベル差算出手段と、前記ダウンミックス手段によって混合されたダウンミックス信号と、前記レベル差算出手段によって算出されたレベル差情報とを多重化することによりビットストリームを形成する多重化手段と、を具備する音響信号符号化装置である。
この構成によれば、入力された複数チャンネルの信号のレベルにダウンミックス係数に従った重み付けをそれぞれ行うことにより、1対1以外の混合比率でダウンミックスを行った場合でも、1対1以外の混合比率を複数チャンネルの信号のレベル差に反映することができるので、音響信号復号装置において、出力信号のレベル差にダウンミックス係数の混合比率が重畳されることを回避することができる。
本発明の第2の態様は、入力された複数チャンネルの信号をダウンミックス係数の示す混合比率で1チャンネルのダウンミックス信号に混合するダウンミックス手段と、前記入力された複数チャンネルの信号のレベル差を算出するレベル差算出手段と、レベル差情報の大きさが0から離れるにつれて低い分解能となる量子化特性で前記レベル差算出手段によって算出されたレベル差情報を量子化する量子化手段と、前記ダウンミックス手段によって混合されたダウンミックス信号と、前記量子化手段によって量子化されたレベル差情報とを多重化することによりビットストリームを形成する多重化手段と、を具備する音響信号符号化装置である。
本発明の第3の態様は、入力された複数チャンネルの信号をダウンミックス係数の示す混合比率で混合された1チャンネルのダウンミックス信号と前記入力された複数チャンネルの信号のレベル差を量子化されたレベル差情報とによって形成されたビットストリームからダウンミックス信号と量子化レベル差情報とを抽出する逆多重化手段と、前記逆多重化手段によって抽出された量子化レベル差情報を量子化前のレベル差情報に変換する逆量子化手段と、前記逆量子化手段によって変換されたレベル差情報に、前記ビットストリームの形成に用いられたダウンミックス係数に従って重み付けを行う重み付け手段と、前記重み付け手段によって重み付けされたレベル差情報を用いて、前記逆多重化手段によって抽出されたダウンミックス信号を混合前の複数チャンネルに分離する分離手段と、を具備する音響信号復号装置である。
これらの構成によれば、音響信号符号化装置において、レベル差情報の大きさが0から離れるにつれて低い分解能となる量子化特性でレベル差情報を量子化しても、音響信号復号装置においてダウンミックス係数に従った重み付けを逆量子化処理後に行うことにより、量子化によるレベル差情報の劣化を低減することができる。
本発明の第4の態様は、上記態様において、複数の異なるダウンミックス係数を有し、いずれかのダウンミックス係数を選択する係数選択手段を具備し、前記多重化手段は、前記係数選択手段によって選択されたダウンミックス係数を示す係数選択情報を多重化する音響信号符号化装置である。
本発明の第5の態様は、入力された複数チャンネルの信号を選択されたダウンミックス係数の示す混合比率で混合された1チャンネルのダウンミックス信号と前記入力された複数チャンネルの信号のレベル差を量子化されたレベル差情報と選択されたダウンミックス係数を示す係数選択情報とによって形成されたビットストリームからダウンミックス信号、量子化レベル差情報及び係数選択情報を抽出する逆多重化手段と、前記逆多重化手段によって抽出された量子化レベル差情報を量子化前のレベル差情報に変換する逆量子化手段と、複数の異なるダウンミックス係数を有し、前記逆多重化手段によって抽出された係数選択情報に基づいてダウンミックス係数を選択する係数選択手段と、前記逆量子化手段によって変換されたレベル差情報に、前記係数選択手段によって選択されたダウンミックス係数に従って重み付けを行う重み付け手段と、前記重み付け手段によって重み付けされたレベル差情報を用いて、前記逆多重化手段によって抽出されたダウンミックス信号を混合前の複数チャンネルに分離する分離手段と、を具備する音響信号復号装置である。
これらの構成によれば、音響信号符号化装置において複数のダウンミックス係数を用いても、音響信号復号装置の出力信号のレベル差にダウンミックス係数の混合比率が重畳されることを回避することができる。
本発明の第6の態様は、入力された複数チャンネルの信号をダウンミックス係数の示す混合比率で1チャンネルのダウンミックス信号に混合するステップと、前記入力された複数チャンネルの信号のレベルに前記ダウンミックス係数に従った重み付けをそれぞれ行うステップと、前記重み付けされた複数チャンネルの信号のレベル差を算出するステップと、前記混合されたダウンミックス信号と、前記算出されたレベル差情報とを多重化することによりビットストリームを形成するステップと、を具備する音響信号符号化方法である。
この方法によれば、入力された複数チャンネルの信号のレベルにダウンミックス係数に従った重み付けをそれぞれ行うことにより、1対1以外の混合比率でダウンミックスを行った場合でも、1対1以外の混合比率を複数チャンネルの信号のレベル差に反映することができるので、音響信号復号装置において、出力信号のレベル差にダウンミックス係数の混合比率が重畳されることを回避することができる。
本発明によれば、異なる比率でダウンミックスを行い、マルチチャンネル信号を少ないチャンネル数で符号化する音響信号符号化装置と、当該音響信号符号化装置で符号化された信号を復号する音響信号復号装置とを提供することができる。
以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、実施の形態において、同一機能を有する構成には同一符号を付し、重複する説明は省略する。
(実施の形態1)
図1は、本発明の実施の形態1に係る音響信号符号化装置100及び音響信号復号装置200の構成を示す図である。ここでは、マルチチャンネル信号を2チャンネルの信号とし、音響信号符号化装置100が2チャンネルの信号を1チャンネルにダウンミックスする場合について説明する。
まず、音響信号符号化装置100について説明する。図1において、ダウンミックス係数記憶部101には、ダウンミックスの比率を示すダウンミックス係数が記憶されており、ダウンミックス係数がダウンミックス部102及び重み付け部103に出力される。
ダウンミックス部102は、入力された2チャンネルの信号(マルチチャンネル信号)をダウンミックス係数記憶部101からのダウンミックス係数に従って混合することにより1チャンネルのダウンミックス信号とし、ダウンミックス信号を多重化部105に出力する。
重み付け部103は、ダウンミックス部102に入力された信号と同一の2チャンネルの信号が入力され、入力された2チャンネルの信号のレベルをダウンミックス係数に従ってそれぞれ重み付けする。重み付けされた2チャンネルの入力信号はレベル差算出部104に出力される。
レベル差算出部104は、重み付けされた2チャンネルの信号のレベル差を算出し、算出したレベル差(レベル差情報)を多重化部105に出力する。
多重化部105は、ダウンミックス部102から出力された1チャンネルのダウンミックス信号と、レベル差算出部104から出力されたレベル差情報とを多重化することによりビットストリームを形成し、形成したビットストリームを音響信号符号化装置100から出力する。
次に、音響信号復号装置200について説明する。図1において、逆多重化部201は、音響信号符号化装置100から出力されたビットストリームからダウンミックス信号とレベル差情報を抽出し、抽出したダウンミックス信号とレベル差情報とを分離部202に出力する。
分離部202は、逆多重化部201から出力されたレベル差情報を用いて、同じく逆多重化部201から出力された1チャンネルのダウンミックス信号から2チャンネルの信号を形成する。
次に、上記構成を有する音響信号符号化装置100及び音響信号復号装置200の動作について説明する。まず、音響信号符号化装置100に入力された2チャンネルの信号は、ダウンミックス部102において、ダウンミックス係数記憶部101に記憶されたダウンミックス係数の混合比率で1チャンネルの信号に混合される。このとき、ダウンミックス信号を圧縮符号化することも可能であるが、ここではその詳細な説明は省略する。1チャンネルに混合されたダウンミックス信号は多重化部105に出力される。
また、音響信号符号化装置100に入力された2チャンネルの信号は、重み付け部103において、図6に示すように、ダウンミックス係数記憶部101に記憶されたダウンミックス係数に従って重み付けされることによりレベルが変更され、レベルが変更された2チャンネルの信号はレベル差算出部104に出力される。これにより、ダウンミックス係数が1対1以外の混合比率、例えば1対ルート2などであった場合でも、2チャンネルの信号レベルをその混合比率に応じたレベルにすることができる。また、2チャンネルより多くの信号をダウンミックスする際には、2チャンネルを1チャンネルにダウンミックスする作業を繰り返して行うことにより実現できる。
重み付けされた2チャンネルの信号は、レベル差算出部104において、レベル差が算出され、算出されたレベル差が多重化部105に出力される。
ダウンミックス部102から出力されたダウンミックス信号と、レベル差算出部104から出力されたレベル差情報とは、多重化部105において、多重化されることによりビットストリームとして出力される。
音響信号復号装置200に入力されたビットストリームは、逆多重化部201において、ダウンミックス信号とレベル差情報とに分離される。分離されたダウンミックス信号は、分離部202において、分離されたレベル差情報に基づいて2チャンネルの信号に分離される。このとき、レベル差情報に加えて2チャンネルの信号の相互相関や位相差などの情報を使用することにより、分離部202の精度を高めることができる。以下に分離処理の計算例を示す。
L = M * 10^(energy_dB - ILD/2)
R = M' * 10^(energy_dB + ILD/2)
ここで、Lは分離された左チャンネル信号、Rは分離された右チャンネル信号、Mはダウンミックス信号、M’はダウンミックス信号から生成された擬似信号、energy_dBはダウンミックス信号のエネルギ、ILDはレベル差情報である。
このように実施の形態1によれば、音響信号符号化装置において、2チャンネルの入力信号にダウンミックス係数に従った重み付けをそれぞれ行って、重み付けを行った2チャンネルの信号のレベル差を算出することにより、1対1以外の混合比率でダウンミックスを行った場合でも、音響信号復号装置における出力信号のレベル差にダウンミックス係数の混合比率が重畳されることを回避し、よって、レベル差にずれが生じることを防止することができる。
(実施の形態2)
図2は、本発明の実施の形態2に係る音響信号符号化装置110及び音響信号復号装置210の構成を示すブロック図である。この図において、音響信号符号化装置110におけるレベル差算出部104は、ダウンミックス部102に入力された信号と同一の2チャンネルの信号が入力され、入力された2チャンネルの信号のレベル差を算出し、算出したレベル差(レベル差情報)を量子化部111に出力する。
量子化部111は、図3に示すように、レベル差算出部104から出力されたレベル差情報(入力)の大きさが0に近い領域では高い分解能で量子化を行い、レベル差情報の大きさが0から離れるにつれて低い分解能で量子化を行うという量子化特性を有する。そして、レベル差算出部104から出力されたレベル差情報を量子化することにより圧縮し、量子化レベル差情報を多重化部105に出力する。
音響信号復号装置210における逆多重化部201は、入力されたビットストリームからダウンミックス信号と量子化レベル差情報とを抽出し、ダウンミックス信号を分離部202に出力し、量子化レベル差情報を逆量子化部211に出力する。
逆量子化部211は、逆多重化部201から出力された量子化レベル差情報をレベル差情報に変換し、レベル差情報を重み付け部213に出力する。
ダウンミックス係数記憶部212には、音響信号符号化装置110におけるダウンミックス係数記憶部101に記憶されたダウンミックス係数と同一のダウンミックス係数が記憶され、記憶されたダウンミックス係数が重み付け部213に出力される。
重み付け部213は、ダウンミックス係数記憶部212から出力されたダウンミックス係数に従った重み付けを逆量子化部211から出力されたレベル差情報に行い、重み付けしたレベル差情報を分離部202に出力する。
次に、上記構成を有する音響信号符号化装置110及び音響信号復号装置210の動作について説明する。音響信号符号化装置110に入力された2チャンネルの信号は、レベル差算出部104においてレベル差情報が算出され、算出されたレベル差情報は量子化部111において量子化される。
ダウンミックス信号と量子化されたレベル差情報は、多重化部105において多重化されることによりビットストリームとして出力される。
音響信号復号装置210に入力されたビットストリームは、逆多重化部201において、ダウンミックス信号と量子化レベル差情報とに分離され、ダウンミックス信号は分離部202に、量子化レベル差情報は逆量子化部211にそれぞれ出力される。
量子化レベル差情報は逆量子化部211において量子化前のレベル差情報に変換され、変換されたレベル差情報は重み付け部213において音響信号符号化装置110で使用されたダウンミックス係数と同一のダウンミックス係数に従って重み付けが行われることにより補正される。以下に重み付け処理の計算例を示す。
ILD = ILD_org + 20 * log(α0 / α3)
ここで、ILDは分離処理で使用されるレベル差情報、ILD_orgは逆量子化されたレベル差情報、α0とα3はそれぞれダウンミックス係数である。
ダウンミックス信号は、分離部202において、補正されたレベル差情報に基づいて2チャンネルの信号に分離される。以下に分離処理の計算例を示す。
L = M * 10^(energy_dB - ILD/2)
R = M' * 10^(energy_dB + ILD/2)
ここで、Lは分離された左チャンネル信号、Rは分離された右チャンネル信号、Mはダウンミックス信号、M’はダウンミックス信号から生成された擬似信号、energy_dBはダウンミックス信号のエネルギ、ILDはレベル差情報である。
ここで、図1に示した音響信号符号化装置100に量子化部111を備えた場合を想定し、1対1以外の混合比率でダウンミックスを行うと、重み付け部103によってダウンミックス係数に従った重み付けが行われるため、レベル差が大きくなり、低い分解能で量子化を行わなければならなくなる。これに対し、本実施の形態では、入力された2チャンネルの信号に重み付けを行わず、ダウンミックス係数に従った重み付けを音響信号復号装置210において逆量子化処理後に行うことにより、高い分解能で量子化を行うと共に、1対1以外の混合比率でダウンミックスを行った場合でも、音響信号復号装置210における出力信号のレベル差にダウンミックス係数の混合比率が重畳されることを回避し、よって、レベル差にずれが生じることを防止することができる。
このように実施の形態2によれば、音響信号符号化装置において、レベル差情報の大きさが0に近い領域では高い分解能で量子化を行い、レベル差情報の大きさが0から離れるにつれて低い分解能で量子化を行うという量子化特性で2チャンネルの入力信号のレベル差情報を量子化し、音響信号復号装置において、量子化されたレベル差情報を量子化前のレベル差情報に変換し、変換されたレベル差情報を音響信号符号化装置で用いられたダウンミックス係数に従って補正することにより、量子化によるレベル差情報の劣化を低減することができる。
(実施の形態3)
図4は、本発明の実施の形態3に係る音響信号符号化装置120及び音響信号復号装置220の構成を示すブロック図である。この図において、音響信号符号化装置120におけるダウンミックス係数記憶部121には、複数の異なる混合比率を示す複数のダウンミックス係数が記憶されている。
係数選択部122は、ダウンミックス係数記憶部121に記憶された複数のダウンミックス係数のうち、いずれのダウンミックス係数を用いるか選択し、選択したダウンミックス係数をダウンミックス部102に出力し、選択したダウンミックス係数を示す係数選択情報を多重化部105に出力する。
多重化部105は、ダウンミックス部102から出力された1チャンネルのダウンミックス信号と、量子化部111から出力された量子化レベル差情報と、係数選択部122から出力された係数選択情報とを多重化することによりビットストリームを形成し、形成したビットストリームを音響信号符号化装置120から出力する。
音響信号復号装置220における逆多重化部201は、入力されたビットストリームからダウンミックス信号と、量子化レベル差情報と、係数選択情報とを抽出し、ダウンミックス信号を分離部202に出力し、量子化レベル差情報を逆量子化部211に出力し、係数選択情報を係数選択部222に出力する。
ダウンミックス係数記憶部221には、音響信号符号化装置120におけるダウンミックス係数記憶部121に記憶されたダウンミックス係数と同一の複数のダウンミックス係数が記憶されている。
係数選択部222は、逆多重化部201から出力された係数選択情報に基づいて、ダウンミックス係数をダウンミックス係数記憶部221から選択し、選択したダウンミックス係数を重み付け部213に出力する。
次に、上記構成を有する音響信号符号化装置120及び音響信号復号装置220の動作について説明する。まず、ダウンミックス係数記憶部121からいずれのダウンミックス係数を用いるかが係数選択部122によって選択される。ダウンミックスの例として、次式が挙げられる。
Lmix = α0*Lf ± α1*Rf ± α2*C ± α3*Ls ± α4*Rs ± α5*LFE
Rmix = β1*Rf ± β0*Lf ± β2*C ± β3*Ls ± β4*Rs ± β5*LFE
上記の式において、Lmixはダウンミックスされた左チャンネルの信号、Rmixはダウンミックスされた右チャンネルの信号、Lfは左前方チャンネルの信号、Rfは右前方チャンネルの信号、Cはセンターチャンネルの信号、Lsは左後方チャンネルの信号、Rsは右後方チャンネルの信号、LFEはサブウーハーチャンネルの信号を表し、α0,α1,α2,α3,α4,α5,β0,β1,β2,β3,β4,β5はそれぞれダウンミックス係数を表す。
ダウンミックス係数の一例として、以下の係数がITUによって定義されている。
Figure 2006113294
上記の係数はあくまで一例であり、各種の係数がダウンミックス作業者によって定義され、用いられている。
音響信号符号化装置120に入力された2チャンネルの信号は、係数選択部122によって選択されたダウンミックス係数の混合比率でダウンミックス部102において1チャンネルの信号に混合される。
一方、音響信号符号化装置120に入力された2チャンネルの信号は、レベル差算出部104においてレベル差情報が算出され、算出されたレベル差情報は、量子化部111において量子化される。
ダウンミックス信号、量子化レベル差情報及び係数選択情報は、多重化部105において多重化されることによりビットストリームとして出力される。
音響信号復号装置220に入力されたビットストリームは、逆多重化部201において、ダウンミックス信号、量子化レベル差情報及び係数選択情報に分離される。
係数選択部222では、係数選択情報に基づいてダウンミックス係数記憶部221から音響信号符号化装置120で使用されたダウンミックス係数と同一のダウンミックス係数が選択される。
量子化レベル差情報は、逆量子化部211において、量子化前のレベル差情報に変換される。変換されたレベル差情報は、重み付け部213において、係数選択部222によって選択されたダウンミックス係数に従って重み付けされることにより補正される。
ダウンミックス信号は、分離部202において、補正されたレベル差情報に基づいて2チャンネルの信号に分離される。
このように実施の形態3によれば、音響信号符号化装置において、複数の異なるダウンミックス係数から選択されたダウンミックス係数で2チャンネルの信号を1チャンネルに混合すると共に、選択されたダウンミックス係数を音響信号復号装置に通知し、音響信号復号装置において、通知されたダウンミックス係数に従ってレベル差情報を補正することにより、複数のダウンミックス係数を用いても、音響信号復号装置における出力信号のレベル差にダウンミックス係数の混合比率が重畳されることを回避し、よって、レベル差にずれが生じることを防止することができる。
なお、本実施の形態では、係数選択情報を伝送する場合を例に挙げて説明したが、本発明はこれに限らず、選択されたダウンミックス係数自身を伝送してもよく、この場合、音響信号復号装置が複数のダウンミックス係数と係数選択部を備える必要がなくなる。
本発明にかかる音響信号符号化装置は、異なる比率でダウンミックスを行い、マルチチャンネル信号を少ないチャンネル数で符号化するという効果を有し、小型化が必要な携帯機器等に適用することができ、また、本発明にかかる音響信号復号装置は、音響信号符号化装置で符号化された信号を復号するという効果を有し、小型化が必要な携帯機器等に適用することができる。
本発明の実施の形態1に係る音響信号符号化装置及び音響信号復号装置の構成を示すブロック図 本実施の形態2における音響信号符号化装置及び音響信号復号装置の構成を示すブロック図 量子化ステップを示す図 本実施の形態3における音響信号符号化装置及び音響信号復号装置の構成を示すブロック図 従来の音響信号符号化装置及び音響信号復号装置の構成を示すブロック図 重み付け部の構成を示す図
符号の説明
101、212、121、221 ダウンミックス係数記憶部
102 ダウンミックス部
103、213 重み付け部
104 レベル差算出部
105 多重化部
201 逆多重化部
202 分離部
111 量子化部
211 逆量子化部
122、222 係数選択部

Claims (6)

  1. 入力された複数チャンネルの信号をダウンミックス係数の示す混合比率で1チャンネルのダウンミックス信号に混合するダウンミックス手段と、
    前記入力された複数チャンネルの信号のレベルに前記ダウンミックス係数に従った重み付けをそれぞれ行う重み付け手段と、
    前記重み付け手段によって重み付けされた前記複数チャンネルの信号のレベル差を算出するレベル差算出手段と、
    前記ダウンミックス手段によって混合されたダウンミックス信号と、前記レベル差算出手段によって算出されたレベル差情報とを多重化することによりビットストリームを形成する多重化手段と、
    を具備することを特徴とする音響信号符号化装置。
  2. 入力された複数チャンネルの信号をダウンミックス係数の示す混合比率で1チャンネルのダウンミックス信号に混合するダウンミックス手段と、
    前記入力された複数チャンネルの信号のレベル差を算出するレベル差算出手段と、
    レベル差情報の大きさが0から離れるにつれて低い分解能となる量子化特性で前記レベル差算出手段によって算出されたレベル差情報を量子化する量子化手段と、
    前記ダウンミックス手段によって混合されたダウンミックス信号と、前記量子化手段によって量子化されたレベル差情報とを多重化することによりビットストリームを形成する多重化手段と、
    を具備することを特徴とする音響信号符号化装置。
  3. 入力された複数チャンネルの信号をダウンミックス係数の示す混合比率で混合された1チャンネルのダウンミックス信号と前記入力された複数チャンネルの信号のレベル差を量子化されたレベル差情報とによって形成されたビットストリームからダウンミックス信号と量子化レベル差情報とを抽出する逆多重化手段と、
    前記逆多重化手段によって抽出された量子化レベル差情報を量子化前のレベル差情報に変換する逆量子化手段と、
    前記逆量子化手段によって変換されたレベル差情報に、前記ビットストリームの形成に用いられたダウンミックス係数に従って重み付けを行う重み付け手段と、
    前記重み付け手段によって重み付けされたレベル差情報を用いて、前記逆多重化手段によって抽出されたダウンミックス信号を混合前の複数チャンネルに分離する分離手段と、
    を具備することを特徴とする音響信号復号装置。
  4. 複数の異なるダウンミックス係数を有し、いずれかのダウンミックス係数を選択する係数選択手段を具備し、
    前記多重化手段は、前記係数選択手段によって選択されたダウンミックス係数を示す係数選択情報を多重化する
    ことを特徴とする請求項2に記載の音響信号符号化装置。
  5. 入力された複数チャンネルの信号を選択されたダウンミックス係数の示す混合比率で混合された1チャンネルのダウンミックス信号と前記入力された複数チャンネルの信号のレベル差を量子化されたレベル差情報と選択されたダウンミックス係数を示す係数選択情報とによって形成されたビットストリームからダウンミックス信号、量子化レベル差情報及び係数選択情報を抽出する逆多重化手段と、
    前記逆多重化手段によって抽出された量子化レベル差情報を量子化前のレベル差情報に変換する逆量子化手段と、
    複数の異なるダウンミックス係数を有し、前記逆多重化手段によって抽出された係数選択情報に基づいてダウンミックス係数を選択する係数選択手段と、
    前記逆量子化手段によって変換されたレベル差情報に、前記係数選択手段によって選択されたダウンミックス係数に従って重み付けを行う重み付け手段と、
    前記重み付け手段によって重み付けされたレベル差情報を用いて、前記逆多重化手段によって抽出されたダウンミックス信号を混合前の複数チャンネルに分離する分離手段と、
    を具備することを特徴とする音響信号復号装置。
  6. 入力された複数チャンネルの信号をダウンミックス係数の示す混合比率で1チャンネルのダウンミックス信号に混合するステップと、
    前記入力された複数チャンネルの信号のレベルに前記ダウンミックス係数に従った重み付けをそれぞれ行うステップと、
    前記重み付けされた複数チャンネルの信号のレベル差を算出するステップと、
    前記混合されたダウンミックス信号と、前記算出されたレベル差情報とを多重化することによりビットストリームを形成するステップと、
    を具備することを特徴とする音響信号符号化方法。
JP2004300441A 2004-10-14 2004-10-14 音響信号符号化装置及び音響信号復号装置 Expired - Fee Related JP4892184B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2004300441A JP4892184B2 (ja) 2004-10-14 2004-10-14 音響信号符号化装置及び音響信号復号装置
EP05793725A EP1865497B1 (en) 2004-10-14 2005-10-13 Acoustic signal decoding
KR1020077008302A KR101129877B1 (ko) 2004-10-14 2005-10-13 음향 신호 복호 장치
US11/577,151 US7689428B2 (en) 2004-10-14 2005-10-13 Acoustic signal encoding device, and acoustic signal decoding device
CN2005800352141A CN101040323B (zh) 2004-10-14 2005-10-13 音响信号编解码装置和音响信号编码方法
PCT/JP2005/018885 WO2006041137A1 (ja) 2004-10-14 2005-10-13 音響信号符号化装置及び音響信号復号装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004300441A JP4892184B2 (ja) 2004-10-14 2004-10-14 音響信号符号化装置及び音響信号復号装置

Publications (2)

Publication Number Publication Date
JP2006113294A true JP2006113294A (ja) 2006-04-27
JP4892184B2 JP4892184B2 (ja) 2012-03-07

Family

ID=36148424

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004300441A Expired - Fee Related JP4892184B2 (ja) 2004-10-14 2004-10-14 音響信号符号化装置及び音響信号復号装置

Country Status (6)

Country Link
US (1) US7689428B2 (ja)
EP (1) EP1865497B1 (ja)
JP (1) JP4892184B2 (ja)
KR (1) KR101129877B1 (ja)
CN (1) CN101040323B (ja)
WO (1) WO2006041137A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010503887A (ja) * 2006-09-18 2010-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオオブジェクトのエンコード及びデコード
JPWO2010005050A1 (ja) * 2008-07-11 2012-01-05 日本電気株式会社 信号分析装置、信号制御装置及びその方法と、プログラム
JP2013017022A (ja) * 2011-07-04 2013-01-24 Nippon Hoso Kyokai <Nhk> オーディオ信号ミキシング装置およびそのプログラム、ならびに、オーディオ信号復元装置およびそのプログラム
JP2013511062A (ja) * 2009-11-12 2013-03-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメトリックエンコード及びデコード
CN104509131A (zh) * 2012-07-31 2015-04-08 英迪股份有限公司 一种用于处理音频信号的方法和设备

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4896449B2 (ja) * 2005-06-29 2012-03-14 株式会社東芝 音響信号処理方法、装置及びプログラム
KR101111520B1 (ko) * 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
EP2351024A1 (en) * 2008-10-01 2011-08-03 GVBB Holdings S.A.R.L Decoding apparatus, decoding method, encoding apparatus, encoding method, and editing apparatus
WO2011097903A1 (zh) 2010-02-11 2011-08-18 华为技术有限公司 多声道信号编码、解码方法、装置及编解码系统
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
KR101227932B1 (ko) * 2011-01-14 2013-01-30 전자부품연구원 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법
CN102395097A (zh) * 2011-09-29 2012-03-28 深圳市万兴软件有限公司 一种多声道音频信号缩混方法及系统
ITTO20120274A1 (it) * 2012-03-27 2013-09-28 Inst Rundfunktechnik Gmbh Dispositivo per il missaggio di almeno due segnali audio.
JP2016174257A (ja) * 2015-03-17 2016-09-29 ヤマハ株式会社 レベル制御装置
CN105812986A (zh) * 2016-05-09 2016-07-27 中山奥凯华泰电子有限公司 将多声道缩混成无线两声道的音箱和处理方法
CN108269577B (zh) 2016-12-30 2019-10-22 华为技术有限公司 立体声编码方法及立体声编码器
US11545165B2 (en) * 2018-07-03 2023-01-03 Panasonic Intellectual Property Corporation Of America Encoding device and encoding method using a determined prediction parameter based on an energy difference between channels

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06319200A (ja) * 1993-05-10 1994-11-15 Fujitsu General Ltd ステレオ用バランス調整装置
JPH10215500A (ja) * 1997-01-30 1998-08-11 Matsushita Electric Ind Co Ltd テレビジョン受像機の多チャンネル音声出力回路
WO2003007656A1 (en) * 2001-07-10 2003-01-23 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate applications
WO2004008805A1 (en) * 2002-07-12 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
JP2004078183A (ja) * 2002-06-24 2004-03-11 Agere Systems Inc オーディオ信号のマルチチャネル/キュー符号化/復号化

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP4210237B2 (ja) 1998-05-25 2009-01-14 ダイセル化学工業株式会社 フォトレジスト用化合物およびフォトレジスト用樹脂組成物
US6961432B1 (en) * 1999-04-29 2005-11-01 Agere Systems Inc. Multidescriptive coding technique for multistream communication of signals
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
KR100635022B1 (ko) * 2002-05-03 2006-10-16 하만인터내셔날인더스트리스인코포레이티드 다채널 다운믹싱 장치
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
EP1595247B1 (en) 2003-02-11 2006-09-13 Koninklijke Philips Electronics N.V. Audio coding
RU2374703C2 (ru) * 2003-10-30 2009-11-27 Конинклейке Филипс Электроникс Н.В. Кодирование или декодирование аудиосигнала
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06319200A (ja) * 1993-05-10 1994-11-15 Fujitsu General Ltd ステレオ用バランス調整装置
JPH10215500A (ja) * 1997-01-30 1998-08-11 Matsushita Electric Ind Co Ltd テレビジョン受像機の多チャンネル音声出力回路
WO2003007656A1 (en) * 2001-07-10 2003-01-23 Coding Technologies Ab Efficient and scalable parametric stereo coding for low bitrate applications
JP2004535145A (ja) * 2001-07-10 2004-11-18 コーディング テクノロジーズ アクチボラゲット 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化
JP2004078183A (ja) * 2002-06-24 2004-03-11 Agere Systems Inc オーディオ信号のマルチチャネル/キュー符号化/復号化
WO2004008805A1 (en) * 2002-07-12 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
JP2005533426A (ja) * 2002-07-12 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符合化方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010503887A (ja) * 2006-09-18 2010-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオオブジェクトのエンコード及びデコード
JPWO2010005050A1 (ja) * 2008-07-11 2012-01-05 日本電気株式会社 信号分析装置、信号制御装置及びその方法と、プログラム
JP2013511062A (ja) * 2009-11-12 2013-03-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメトリックエンコード及びデコード
JP2013017022A (ja) * 2011-07-04 2013-01-24 Nippon Hoso Kyokai <Nhk> オーディオ信号ミキシング装置およびそのプログラム、ならびに、オーディオ信号復元装置およびそのプログラム
CN104509131A (zh) * 2012-07-31 2015-04-08 英迪股份有限公司 一种用于处理音频信号的方法和设备
JP2015529046A (ja) * 2012-07-31 2015-10-01 インテレクチュアル ディスカバリー シーオー エルティディIntellectual Discovery Co.,Ltd. オーディオ信号処理方法および装置

Also Published As

Publication number Publication date
US20090030704A1 (en) 2009-01-29
CN101040323B (zh) 2011-01-26
US7689428B2 (en) 2010-03-30
KR20070065370A (ko) 2007-06-22
EP1865497B1 (en) 2012-03-28
JP4892184B2 (ja) 2012-03-07
EP1865497A1 (en) 2007-12-12
KR101129877B1 (ko) 2012-03-23
EP1865497A4 (en) 2010-07-14
WO2006041137A1 (ja) 2006-04-20
CN101040323A (zh) 2007-09-19

Similar Documents

Publication Publication Date Title
US7689428B2 (en) Acoustic signal encoding device, and acoustic signal decoding device
KR101395254B1 (ko) 부가정보 비트스트림 변환을 포함하는 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법
KR101823279B1 (ko) 인코딩된 표현에 기초하여 적어도 4개의 오디오 채널 신호들을 제공하기 위한 오디오 디코더, 오디오 인코더, 방법, 적어도 4개의 오디오 채널 신호들에 기초하여 인코딩된 표현을 제공하기 위한 방법, 및 대역폭 확장을 이용하는 컴퓨터 프로그램
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
KR101391110B1 (ko) 오디오 신호 디코더, 오디오 신호 인코더, 업믹스 신호 표현을 제공하는 방법, 다운믹스 신호 표현을 제공하는 방법, 공통 객체 간의 상관 파라미터 값을 이용한 컴퓨터 프로그램 및 비트스트림
EP2112652B1 (en) Apparatus and method for combining multiple parametrically coded audio sources
CN101036183B (zh) 用于立体声兼容的多声道音频编码/解码的方法和设备
KR20200091880A (ko) 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩 파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법
KR101453732B1 (ko) 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
JP5053849B2 (ja) マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法
US20080252510A1 (en) Method and Apparatus for Encoding/Decoding Multi-Channel Audio Signal
JP2010515099A5 (ja)
JP2008511040A (ja) 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
US20070160236A1 (en) Audio signal encoding device, audio signal decoding device, and method and program thereof
US10497375B2 (en) Apparatus and methods for adapting audio information in spatial audio object coding
KR20160003572A (ko) 다채널 오디오 신호 처리 방법 및 장치
JP2006337767A (ja) 低演算量パラメトリックマルチチャンネル復号装置および方法
EP2770505B1 (en) Audio coding device and method
KR101783967B1 (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법
KR20080035448A (ko) 다채널 오디오 신호의 부호화/복호화 방법 및 장치
EP3424048A1 (en) Audio signal encoder, audio signal decoder, method for encoding and method for decoding
KR101735619B1 (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법
KR20070041336A (ko) 오디오 신호의 인코딩 및 디코딩 방법, 및 이를 구현하기위한 장치
KR101635099B1 (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법
KR20140122990A (ko) 다채널 오디오 신호 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111129

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111219

R150 Certificate of patent or registration of utility model

Ref document number: 4892184

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141222

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees