JP5171256B2 - ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法 - Google Patents

ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法 Download PDF

Info

Publication number
JP5171256B2
JP5171256B2 JP2007533292A JP2007533292A JP5171256B2 JP 5171256 B2 JP5171256 B2 JP 5171256B2 JP 2007533292 A JP2007533292 A JP 2007533292A JP 2007533292 A JP2007533292 A JP 2007533292A JP 5171256 B2 JP5171256 B2 JP 5171256B2
Authority
JP
Japan
Prior art keywords
signal
evaluation
sound source
time domain
source signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007533292A
Other languages
English (en)
Other versions
JPWO2007026763A1 (ja
Inventor
チュン オエイ テオ
スア ホン ネオ
幸司 吉田
道代 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2007533292A priority Critical patent/JP5171256B2/ja
Publication of JPWO2007026763A1 publication Critical patent/JPWO2007026763A1/ja
Application granted granted Critical
Publication of JP5171256B2 publication Critical patent/JP5171256B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Description

本発明は、移動体通信システムまたはインターネットプロトコル(IP:Internet Protocol)を用いたパケット通信システム等において、ステレオ音声信号やステレオ・オーディオ信号の符号化/復号を行う際に用いられるステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法に関する。
移動体通信システムまたはIPを用いたパケット通信システム等において、DSP(Digital Signal Processor)によるディジタル信号処理速度と帯域幅の制限は徐々に緩和されつつある。伝送レートのさらなる高ビットレート化が進めば、複数チャネルを伝送するだけの帯域を確保できるようになるため、モノラル方式が主流の音声通信においても、ステレオ方式による通信(ステレオ通信)が普及することが期待される。
現在の携帯電話は既に、ステレオ機能を有するマルチメディアプレイヤやFMラジオの機能を搭載することができる。従って、第4世代の携帯電話及びIP電話等にステレオ・オーディオ信号だけでなく、ステレオ音声信号の録音、再生等の機能を追加するのは自然なことである。
従来、ステレオ信号を符号化する方法と言えば数多くあり、代表例として非特許文献1に記載されているMPEG−2 AAC(Moving Picture Experts Group-2 Advanced Audio Coding)があげられる。MPEG−2 AACは信号を、モノラル、ステレオ、及びマルチチャネルに符号化することができる。MPEG−2 AACはMDCT(Modified Discrete Cosine Transform)処理を用いて時間領域信号を周波数領域信号に変換し、人間聴覚システムの原理に基づき、符号化によって発生する雑音をマスキングして人間の可聴域以下のレベルに抑えることによって、良音質を実現している。
ISO/IEC 13818-7:1997-MPEG-2 Advanced Audio Coding(AAC)
しかしながら、MPEG−2 AACは、オーディオ信号により適しており、音声信号には適していないという問題がある。MPEG−2 AACはオーディオ信号の通信において重要でないスペクトル情報に対する量子化ビット数を抑制することによって、ステレオ感を有しつつ良好な音質を実現しながらビットレートを低く抑えている。しかし、オーディオ信号に比べて音声信号はビットレートの減少による音質劣化がより大きいため、オーディオ信号において非常に良好な音質が得られるMPEG−2 AACでも、これを音声信号に適用した場合には、満足できる音質を得られない場合がある。
MPEG−2 AACのもう1つの問題点は、アルゴリズムに起因する遅延である。MPEG−2 AACに使用されるフレームサイズは、1024サンプル/フレームである。例えば、サンプリング周波数が32kHzを超えるとフレーム遅延は32ミリ秒以下となり、これはリアルタイム音声通信システムにおいて許容できる遅延である。しかし、MPEG−2 AACは、符号化信号を復号するために、隣接する2つのフレームのオーバーラップ・アンド・アッド(重ね合わせ加算)を行うMDCT処理を必須としており、このアルゴリズムに起因した処理遅延が常に発生するので、リアルタイム通信システムには適さない。
なお、低ビットレート化のためには、AMR−WB(Adaptive Multi-Rate Wide Band
)方式の符号化を行うことも可能であり、この方法によれば、MPEG−2 AACと比べて2分の1以下のビットレートで済む。ただ、AMR−WB方式の符号化は、モノラル音声信号しかサポートしていないという問題がある。
本発明の目的は、ステレオ信号を低ビットレートで精度良く符号化することができ、また、音声通信等における遅延を抑えることができるステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法を提供することである。
本発明のステレオ符号化装置は、ステレオ信号の第1チャネル信号に対して時間領域における評価(estimation)を行い、この評価結果を符号化する時間領域評価手段と、前記第1チャネル信号の周波数帯域を複数に分割し、各帯域の前記第1チャネル信号に対し周波数領域における評価を行い、この評価結果を符号化する周波数領域評価手段と、を具備する構成を採る。
本発明によれば、ステレオ信号を低ビットレートで精度良く符号化することができ、また、音声通信等における遅延を抑えることができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
図1は本発明の一実施の形態に係るステレオ符号化装置100の主要な構成を示すブロック図である。
ステレオ符号化装置100は、主に第1レイヤ110と第2レイヤ120とからなる階層的な構成を採る。
第1レイヤ110では、ステレオ音声信号を構成する左チャネル信号Lと右チャネル信号Rとからモノラル信号Mが生成され、このモノラル信号が符号化されて符号化情報P及びモノラル駆動音源信号eが生成される。第1レイヤ110は、モノラル合成部101とモノラル符号化部102とからなり、各部は以下の処理を行う。
モノラル合成部101は、左チャネル信号Lと右チャネル信号Rとからモノラル信号Mを合成する。ここでは、左チャネル信号Lと右チャネル信号Rの平均値を求めることによりモノラル信号Mを合成する。この方法を式で表すとM=(L+R)/2となる。なお、モノラル信号の合成方法として他の方法を使っても良く、その一例を式で表すとM=wL+wRである。この式においてw、wは、w+w=1.0の関係を満たす重み付け係数である。
モノラル符号化部102は、AMR−WB方式の符号化装置の構成を採る。モノラル符号化部102は、モノラル合成部101から出力されるモノラル信号MをAMR−WB方式で符号化し、符号化情報Pを求めて多重化部108に出力する。また、モノラル符号化部102は、符号化の過程において得られるモノラル駆動音源信号eを第2レイヤ120に出力する。
第2レイヤ120では、ステレオ音声信号に対して、時間領域及び周波数領域における評価及び予測(prediction and estimation)が行われ、各種の符号化情報が生成される。この処理において、まず、ステレオ音声信号を構成する左チャネル信号Lが有する空間的情報が検出及び算出される。この空間的情報により、ステレオ音声信号は、臨場感(拡がり感)を生じる。次に、この空間的情報をモノラル信号に与えることにより、左チャネル信号Lに類似する評価信号が生成される。そして、各処理に関する情報が符号化情報として出力される。第2レイヤ120は、フィルタリング部103、時間領域評価部104、周波数領域評価部105、残差符号化部106、及びビット配分制御部107からなり、各部は以下の動作を行う。
フィルタリング部103は、左チャネル信号LからLPC分析によりLPC(Linear Predictive Coding)係数を生成し、符号化情報Pとして多重化部108に出力する。また、フィルタリング部103は、左チャネル信号LとLPC係数を用いて左チャネルの駆動音源信号eを生成し、時間領域評価部104に出力する。
時間領域評価部104は、第1レイヤ110のモノラル符号化部102において生成されるモノラル駆動音源信号eと、フィルタリング部103において生成される左チャネルの駆動音源信号eとに対し、時間領域における評価及び予測を行い、時間領域評価信号eest1を生成して周波数領域評価部105に出力する。即ち、時間領域評価部104は、モノラル駆動音源信号eと、左チャネルの駆動音源信号eとの間の時間領域における空間的情報を検出及び算出する。
周波数領域評価部105は、フィルタリング部103において生成される左チャネルの駆動音源信号eと、時間領域評価部104において生成される時間領域評価信号eest1とに対し、周波数領域における評価および予測を行い、周波数領域評価信号eest2を生成して残差符号化部106に出力する。即ち、周波数領域評価部105は、時間領域評価信号eest1と左チャネルの駆動音源信号eとの間の周波数領域における空間的情報を検出及び算出する。
残差符号化部106は、周波数領域評価部105において生成される周波数領域評価信号eest2と、フィルタリング部103において生成される左チャネルの駆動音源信号eとの間の残差信号を求め、この信号を符号化し、符号化情報Pを生成して多重化部108に出力する。
ビット配分制御部107は、モノラル符号化部102において生成されるモノラル駆動音源信号eと、フィルタリング部103において生成される左チャネルの駆動音源信号eとの類似具合に応じて、時間領域評価部104、周波数領域評価部105、及び残差符号化部106に符号化ビットを配分する。なお、ビット配分制御部107は、各部に配分するビット数に関する情報を符号化し、得られる符号化情報Pを出力する。
多重化部108は、PからPまでの符号化情報を多重化し、多重化後のビットストリームを出力する。
ステレオ符号化装置100に対応するステレオ復号装置は、第1レイヤ110で生成さ
れたモノラル信号の符号化情報P及び第2レイヤ120で生成された左チャネル信号の符号化情報P〜Pを取得し、これらの符号化情報からモノラル信号と左チャネル信号とを復号することができる。また、復号されたモノラル信号と左チャネル信号とから右チャネル信号も生成することができる。
図2は時間領域評価部104の主要な構成を示すブロック図である。時間領域評価部104には、モノラル駆動音源信号eが目標信号として、左チャネルの駆動音源信号eが参照信号として入力される。時間領域評価部104は、音声信号処理の毎フレームに1回、モノラル駆動音源信号eと左チャネルの駆動音源信号eとの間の空間的情報を検出及び算出し、これらの結果を符号化して符号化情報Pを出力する。ここで、時間領域における空間的情報は、振幅情報αと遅延情報τとから構成される。
エネルギ算出部141−1は、モノラル駆動音源信号eが入力され、この信号の時間領域におけるエネルギを算出する。
エネルギ算出部141−2は、左チャネルの駆動音源信号eが入力され、エネルギ算出部141−1と同様な処理によって、左チャネルの駆動音源信号eの時間領域におけるエネルギを算出する。
比率算出部142は、エネルギ算出部141−1と141−2においてそれぞれ算出されるエネルギ値が入力され、モノラル駆動音源信号eと左チャネルの駆動音源信号eとのエネルギ比率を算出し、モノラル駆動音源信号eと左チャネルの駆動音源信号eとの間の空間的情報(振幅情報α)として出力する。
相関値算出部143は、モノラル駆動音源信号eと左チャネルの駆動音源信号eとが入力され、この2つの信号間の相互相関値(cross correlation)を算出する。
遅延検出部144は、相関値算出部143で算出する相互相関値が入力され、左チャネルの駆動音源信号eとモノラル駆動音源信号eとの間の時間遅延を検出し、モノラル駆動音源信号eと左チャネルの駆動音源信号eとの間の空間的情報(遅延情報τ)として出力する。
評価信号生成部145は、比率算出部142で算出される振幅情報αと遅延検出部144で算出される遅延情報τとに基づいて、モノラル駆動音源信号eから、左チャネルの駆動音源信号eに類似する時間領域評価信号eest1を生成する。
このように、時間領域評価部104は、音声信号処理の毎フレームに1回、モノラル駆動音源信号eと左チャネルの駆動音源信号eとの間の時間領域における空間的情報を検出及び算出し、得られる符号化情報Pを出力する。ここで、空間的情報は振幅情報αと遅延情報τとから構成される。また、時間領域評価部104は、この空間的情報をモノラル駆動音源信号eに与え、左チャネルの駆動音源信号eに類似する時間領域評価信号eest1を生成する。
図3は周波数領域評価部105の主要な構成を示すブロック図である。周波数領域評価部105は、時間領域評価部104が生成した時間領域評価信号eest1を目標信号として、左チャネルの駆動音源信号eを参照信号として入力して、周波数領域における評価および予測を行い、これらの結果を符号化して符号化情報Pを出力する。ここで、周波数領域における空間的情報は、スペクトルの振幅情報βと位相差情報θとから構成される。
FFT部151−1は、高速フーリエ変換(FFT)により、時間領域信号である左チャネルの駆動音源信号eを周波数領域信号(スペクトル)に変換する。
分割部152−1は、FFT部151−1で生成される周波数領域信号の帯域を複数の帯域(サブバンド)に分割する。各サブバンドは、人間の聴覚システムに対応するバークスケール(Bark Scale)に従っても良いし、または帯域幅内において等分割しても良い。
エネルギ算出部153−1は、左チャネルの駆動音源信号eのスペクトルエネルギを、分割部152−1から出力される各サブバンド毎に算出する。
FFT部151−2は、FFT部151−1と同様な処理によって、時間領域評価信号eest1を周波数領域信号に変換する。
分割部152−2は、分割部152−1と同様な処理によって、FFT部151−2で生成される周波数領域信号の帯域を複数のサブバンドに分割する。
エネルギ算出部153−2は、エネルギ算出部153−1と同様な処理によって、時間領域評価信号eest1のスペクトルエネルギを、分割部152−2から出力される各サブバンド毎に算出する。
比率算出部154は、エネルギ算出部153−1とエネルギ算出部153−2とで算出される各サブバンドのスペクトルエネルギを用いて、左チャネルの駆動音源信号eと時間領域評価信号eest1とのスペクトルエネルギ比率を各サブバンド毎に算出し、符号化情報Pの一部である振幅情報βとして出力する。
位相算出部155−1は、左チャネルの駆動音源信号eの各サブバンドにおける各スペクトルの位相を算出する。
位相選択部156は、符号化情報の情報量を削減するために、各サブバンドにおけるスペクトルの位相から、符号化に適する位相を1つ選択する。
位相算出部155−2は、位相算出部155−1と同様な処理によって、時間領域評価信号eest1の各サブバンドにおける各スペクトルの位相を算出する。
位相差算出部157は、位相選択部156で選択された各サブバンドにおける位相において、左チャネルの駆動音源信号eと時間領域評価信号eest1との位相差を算出し、符号化情報Pの一部である位相差情報θとして出力する。
評価信号生成部158は、左チャネルの駆動音源信号eと時間領域評価信号eest1との間の振幅情報β、および、左チャネルの駆動音源信号eと時間領域評価信号eest1との間の位相差情報θ、の双方に基づき、時間領域評価信号eest1から周波数領域評価信号eest2を生成する。
このように、周波数領域評価部105は、左チャネルの駆動音源信号e及び時間領域評価部104で生成される時間領域評価信号eest1のそれぞれを複数のサブバンドに分割し、サブバンド毎に時間領域評価信号eest1と左チャネルの駆動音源信号eとの間のスペクトルエネルギ比率および位相差を算出する。時間領域における時間遅延と周波数領域における位相差とは等価であるから、周波数領域における位相差を算出し、これを正確に制御または調整することにより、時間領域では符号化しきれなかった特徴を周波数領域にて符号化することが可能となり、符号化精度はより向上する。周波数領域評価部
105は、時間領域評価により得られた左チャネルの駆動音源信号eに類似する時間領域評価信号eest1に、周波数領域評価によって算出される微細な差異を与えて、より左チャネルの駆動音源信号eに類似する周波数領域評価信号eest2を生成する。また、周波数領域評価部105は、この空間的情報を時間領域評価信号eest1に与えて、より左チャネルの駆動音源信号eに類似する周波数領域評価信号eest2を生成する。
次いで、ビット配分制御部107の動作の詳細について説明する。音声信号の各フレームに対し、符号化に割り当てられるビット数は予め決まっている。ビット配分制御部107は、この所定のビットレートにおいて最適な音声品質を実現するために、左チャネルの駆動音源信号eとモノラル駆動音源信号eとが類似しているか否かによって、各処理部に配分するビットの数を適応的に決定する。
図4はビット配分制御部107の動作を説明するフロー図である。
ST(ステップ)1071において、ビット配分制御部107は、モノラル駆動音源信号eと左チャネルの駆動音源信号eとを比較し、時間領域におけるこれら2つの信号の類似具合を判断する。具体的には、ビット配分制御部107は、モノラル駆動音源信号eと左チャネルの駆動音源信号eとの二乗平均誤差を算出し、これを既定の閾値と比較して閾値以下であれば、2つの信号は類似していると判断する。
モノラル駆動音源信号eと左チャネルの駆動音源信号eとが類似している場合(ST1072:YES)、この2つの信号の時間領域における差は小さく、より小さな差を符号化するのに必要とされるビット数はより少なくて良い。つまり、時間領域評価部104にはより少なく、他の各部(周波数領域評価部105、残差符号化部106)、特に周波数領域評価部105にはより多くのビットを配分するような不均一なビット配分を行えば、効率的なビット割り当てなので符号化効率が良くなる。従って、ビット配分制御部107は、ST1072において類似していると判断した場合、ST1073において時間領域評価へより少ない数のビットを配分し、ST1074で残りのビットを他の処理に均等に配分する。
一方、モノラル駆動音源信号eと左チャネルの駆動音源信号eとが類似していない場合(ST1072:NO)、2つの時間領域信号間の差は大きくなり、時間領域評価はある程度までの類似性を評価できるだけで、評価信号の精度を高めるためには周波数領域における信号評価も重要である。よって、時間領域評価及び周波数領域評価の両方とも同等に重要である。また、かかる場合、周波数領域評価後にも、評価信号と左チャネルの駆動音源信号eとの間には差が残っている可能性があるため、残差についても符号化して符号化情報を得ることが重要である。従って、ビット配分制御部107は、ST1072においてモノラル駆動音源信号eと左チャネルの駆動音源信号eとが類似していないと判断した場合、ST1075において、すべての処理の重要度を同等と見なして、すべての処理に均等にビットを配分する。
図5は本実施の形態に係るステレオ復号装置200の主要な構成を示すブロック図である。
ステレオ復号装置200もステレオ符号化装置100と同じく、主に第1レイヤ210と第2レイヤ220とからなる階層的な構成を採る。また、ステレオ復号装置200の各処理は、ステレオ符号化装置100の対応する各処理の基本的に逆処理となる。即ち、ステレオ復号装置200は、ステレオ符号化装置100から送られる符号化情報を用いて、モノラル信号から左チャネル信号を予測して生成し、さらにモノラル信号と左チャネル信
号とを用いて、右チャネル信号を生成する。
分離部201は、入力されるビットストリームをPからPまでの符号化情報に分離する。
第1レイヤ210は、モノラル復号部202から構成される。モノラル復号部202は、符号化情報Pを復号して、モノラル信号M’及びモノラル駆動音源信号e’を生成する。
第2レイヤ220は、ビット配分情報復号部203、時間領域評価部204、周波数領域評価部205、及び残差復号部206からなり、各部は以下の動作を行う。
ビット配分情報復号部203は、符号化情報Pを復号し、時間領域評価部204、周波数領域評価部205、及び残差復号部206でそれぞれ使用されるビット数を出力する。
時間領域評価部204は、モノラル復号部202において生成されるモノラル駆動音源信号e’、分離部201から出力される符号化情報P、及びビット配分情報復号部203から出力されるビット数を用いて、時間領域における評価及び予測を行い、時間領域評価信号eest1’を生成する。
周波数領域評価部205は、時間領域評価部204において生成される時間領域評価信号eest1’、分離部201から出力される符号化情報P、及びビット配分情報復号部203から渡されたビット数を用いて、周波数領域における評価及び予測を行い、周波数領域評価信号eest2’を生成する。周波数領域評価部205は、周波数領域における評価及び予測に先立ち、ステレオ符号化装置100の周波数領域評価部105と同様に、周波数変換を行うFFT部を有する。
残差復号部206は、分離部201から出力される符号化情報P及びビット配分情報復号部203から渡されたビット数を用いて、残差信号を復号する。また、残差復号部206は、周波数領域評価部205で生成される周波数領域評価信号eest2’に、この復号された残差信号を与え、左チャネルの駆動音源信号e’を生成する。
合成フィルタリング部207は、符号化情報PからLPC係数を復号し、このLPC係数と残差復号部206において生成される左チャネルの駆動音源信号e’とを合成して、左チャネル信号L’を生成する。
ステレオ変換部208は、モノラル復号部202で復号されるモノラル信号M’、および合成フィルタ207で生成される左チャネル信号L’を用いて、右チャネル信号R’を生成する。
このように、本実施の形態に係るステレオ符号化装置によれば、符号化対象であるステレオ音声信号に対し、まず時間領域において評価及び予測を行った後、周波数領域において更に詳細な評価及び予測を行って、これら2段階の評価及び予測に関する情報を符号化情報として出力する。従って、時間領域における評価及び予測では十分に表現できなかった情報に対して周波数領域において補完的な評価及び予測を行うことができ、ステレオ音声信号を低ビットレートで精度良く符号化することができる。
また、本実施の形態によれば、時間領域評価部104における時間領域評価は、全周波数帯域に渡る信号の空間的情報の平均レベルを評価することに相当する。例えば、時間領
域評価部104おいて空間的情報として求められるエネルギ比及び時間遅延は、1フレームの符号化対象の信号をそのまま1信号として処理し、この信号の全体的または平均的なエネルギ比及び時間遅延を求めたものである。一方、周波数領域評価部105における周波数領域評価は、符号化対象の信号の周波数帯域を複数のサブバンドに分割し、この細分化された個々の信号の評価を行っている。換言すると、本実施の形態によれば、時間領域においてステレオ音声信号の概略的な評価を行った後、周波数領域において更なる評価を行うことにより評価信号を微調整する。従って、符号化対象の信号を1信号として扱うと十分に表現できなかった情報に対し、複数の信号に細分化して更なる評価を行うため、ステレオ音声信号の符号化精度を向上させることができる。
また、本実施の形態によれば、モノラル信号と左チャネル信号(または右チャネル信号)との類似具合に応じて、すなわち、ステレオ音声信号の状況に応じて、所定ビットレートの範囲内において、時間領域評価、周波数領域評価等の各処理に対し適応的にビットを配分する。これにより、効率的でかつ精度良く符号化を行うことができると共に、ビットレートスケーラビリティを実現することができる。
また、本実施の形態によれば、MPEG−2 AACに必須のMDCT処理を必要としないため、リアルタイム音声通信システム等において、時間遅延を許容範囲限度内に抑えることができる。
また、本実施の形態によれば、時間領域評価において、エネルギ比および時間遅延という少ないパラメータで符号化を行うため、ビットレートを削減することができる。
また、本実施の形態によれば、2つのレイヤからなる階層的な構成を採るため、モノラルレベルからステレオレベルへスケーリングすることができる。よって、何らかの原因で、周波数領域評価に関する情報を復号できない場合でも、時間領域評価に関する情報だけを復号することにより、品質は多少劣化するものの、所定品質のステレオ音声信号を復号することができるため、スケーラビリティを向上させることができる。
また、本実施の形態によれば、第1レイヤにおいてモノラル信号をAMR−WB方式で符号化するため、ビットレートを低く抑えることができる。
なお、本実施の形態に係るステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法は、種々変更して実施することが可能である。
例えば、本実施の形態では、ステレオ符号化装置100でモノラル信号と左チャネル信号とを符号化対象とし、ステレオ復号装置200では、モノラル信号および左チャネル信号を復号してこれらの復号信号を合成することによって、右チャネル信号を復号する場合を例にとって説明したが、ステレオ符号化装置100の符号化対象の信号はこれに限定されず、ステレオ符号化装置100でモノラル信号と右チャネル信号とを符号化対象とし、ステレオ復号装置200で復号された右チャネル信号とモノラル信号とを合成することによって、左チャネル信号を生成するようにしても良い。
また、本実施の形態でフィルタリング部103において、LPC係数に対する符号化情報としては、LPC係数を他の等価なパラメータに変換したもの(例えばLSPパラメータ)を用いても良い。
また、本実施の形態では、所定数のビットをビット配分制御部107によって各処理に配分しているが、ビット配分制御処理を行わなくて、前もって各部に使われるビット数を決めておく固定ビット配分を行っても良い。かかる場合、ステレオ符号化装置100にお
いてはビット配分制御部107が不要である。また、この固定のビット配分の割合は、ステレオ符号化装置100及びステレオ復号装置200に共通であるので、ステレオ復号装置200においてもビット配分情報復号部203は不要である。
また、本実施の形態でビット配分制御部107は、ステレオ音声信号の状況に応じて適応的にビット配分を行っているが、ネットワークの状況に応じて適応的にビット配分を行っても良い。
また、本実施の形態に係る残差符号化部106は、ビット配分制御部107によって配分される所定数のビットを使用して符号化を行うことで、ロッシーシステムとなる。所定数のビットを使用する符号化としては、例えばベクトル量子化がある。一般的に、残差符号化部は、符号化方法の違いによって、ロッシーシステムまたはロスレスシステムという特徴の相異なる符号化システムとなる。ロスレスシステムは、ロッシーシステムに比べて、復号装置で信号をより正確に復号することができるという特徴があるが、圧縮率が低いためビットレートが高くなる。例えば、残差符号化部106において、残差信号がハフマン(Huffman)符号化、ライス(Rice)符号化等のノイズレス符号化方法によって符号化されれば、ロスレスシステムとなる。
また、本実施の形態で比率算出部142は、モノラル駆動音源信号eと左チャネルの駆動音源信号eとのエネルギ比率を算出して振幅情報αとするが、エネルギ比率の代わりにエネルギ差を算出して振幅情報αとしても良い。
また、本実施の形態で比率算出部154は、各サブバンドにおける、左チャネルの駆動音源信号eと時間領域評価信号eest1とのスペクトルエネルギ比率βを算出して振幅情報βとするが、エネルギ比率の代わりにエネルギ差を算出して振幅情報βとしても良い。
また、本実施の形態では、モノラル駆動音源信号eと左チャネルの駆動音源信号eとの間の時間領域における空間的情報が振幅情報αと遅延情報τとからなっているが、この空間的情報は他の情報をさらに含んでいても良いし、振幅情報α、遅延情報τ等とは全く異なる他の情報からなっていても良い。
また、本実施の形態では、左チャネルの駆動音源信号eと時間領域評価信号eest1との間の周波数領域における空間的情報が振幅情報βと位相差情報θとからなっているが、この空間的情報は他の情報をさらに含んでいても良いし、振幅情報β、位相差情報θ等とは全く異なる他の情報からなっていても良い。
また、本実施の形態で時間領域評価部104は、モノラル駆動音源信号eと左チャネルの駆動音源信号eとの間の空間的情報の検出及び算出をフレーム毎に行うが、この処理を1フレーム内において複数回行っても良い。
また、本実施の形態で位相選択部156は、各サブバンドにおいて、1つのスペクトル位相を選択しているが、複数のスペクトル位相を選択しても良い。かかる場合、位相差算出部157は、この複数の位相における、左チャネルの駆動音源信号eと時間領域評価信号eest1との位相差θの平均を算出し、位相差算出部157に出力する。
また、本実施の形態で残差符号化部106は、残差信号に対して時間領域符号化を行うが、周波数領域符号化を行っても良い。
また、本実施の形態では、音声信号を符号化対象とする場合を例にとって説明したが、
本発明に係るステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法は、音声信号のほかオーディオ信号にも適用することができる。
以上、本発明の実施の形態について説明した。
本発明に係るステレオ符号化装置およびステレオ復号装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るステレオ符号化方法及びステレオ復号方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係るステレオ符号化及びステレオ復号装置と同様の機能を実現することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてあり得る。
本明細書は、2005年8月31日出願の特願2005−252778に基づく。この内容はすべてここに含めておく。
本発明に係るステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法は、携帯電話、IP電話、テレビ会議等に好適である。
本発明の一実施の形態に係るステレオ符号化装置の主要な構成を示すブロック図 本発明の一実施の形態に係る時間領域評価部の主要な構成を示すブロック図 本発明の一実施の形態に係る周波数領域評価部の主要な構成を示すブロック図 本発明の一実施の形態に係るビット配分制御部の動作を説明するフロー図 本発明の一実施の形態に係るステレオ復号装置の主要な構成を示すブロック図

Claims (7)

  1. ステレオ信号から生成されるモノラル信号を符号化して、モノラル駆動音源信号を生成する第1レイヤ符号化手段と、
    前記ステレオ信号の第1チャネルの駆動音源信号に対して時間領域における評価を行い、この評価結果である第1空間的情報を符号化する時間領域評価手段、および、前記第1チャネルの駆動音源信号の周波数帯域を複数に分割し、各帯域の前記第1チャネルの駆動音源信号に対し周波数領域における評価を行い、この評価結果である第2空間的情報を符号化する周波数領域評価手段、を有する第2レイヤ符号化手段と、
    を具備し、
    前記時間領域評価手段は、
    前記時間領域における評価において、前記第1チャネルの駆動音源信号と前記モノラル駆動音源信号との間の前記第1空間的情報を求め、当該第1空間的情報を前記モノラル駆動音源信号に与えることにより、前記第1チャネルの駆動音源信号に類似する時間領域評価信号を生成し、
    前記周波数領域評価手段は、
    前記時間領域評価信号の周波数帯域を複数に分割し、前記周波数領域における評価において、各帯域における前記時間領域評価信号と前記第1チャネルの駆動音源信号との間の前記第2空間的情報を求め、当該第2空間情報を前記時間領域評価信号に与えることにより、前記第1チャネルの駆動音源信号に類似する周波数領域評価信号を生成する、
    ステレオ符号化装置。
  2. 前記第1チャネルの駆動音源信号と前記モノラル駆動音源信号との類似具合に応じて、前記時間領域評価手段と前記周波数領域評価手段とにビットを配分するビット配分手段、
    をさらに具備する請求項1記載のステレオ符号化装置。
  3. 前記ビット配分手段は、
    前記第1チャネルの駆動音源信号と前記モノラル駆動音源信号との類似度が所定値以上の場合、より多くのビットを前記周波数領域評価手段に配分する、
    請求項記載のステレオ符号化装置。
  4. 前記ビット配分手段は、
    前記第1チャネルの駆動音源信号と前記モノラル駆動音源信号との類似度が所定値未満の場合、前記時間領域評価手段と前記周波数領域評価手段とに均等にビットを配分する、
    請求項記載のステレオ符号化装置。
  5. 前記第1チャネルの駆動音源信号と前記周波数領域評価信号との間の残差を符号化する残差符号化手段、
    をさらに具備する請求項1記載のステレオ符号化装置。
  6. モノラル信号が符号化された符号化情報を復号して、モノラル駆動音源信号を生成する第1レイヤ復号手段と、
    前記モノラル駆動音源信号を用いて、ステレオ信号の第1チャネルの駆動音源信号に対する時間領域における評価結果である第1空間的情報が符号化された符号化情報を復号して、時間領域評価信号を生成する時間領域復号手段、および、前記時間領域評価信号を用いて、前記第1チャネルの駆動音源信号の周波数帯域が複数に分割され、各帯域の前記第1チャネルの駆動音源信号に対する周波数領域における評価結果である第2空間的情報が符号化された符号化情報を復号して、周波数領域評価信号を生成する周波数領域復号手段、を有する第2レイヤ復号手段と、
    を具備し、
    前記時間領域における評価結果は、前記第1チャネルの駆動音源信号と前記モノラル駆動音源信号との間の前記第1空間的情報であり、前記時間領域評価信号は、当該第1空間的情報を前記モノラル駆動音源信号に与えることにより生成され、
    前記周波数領域における評価結果は、複数の周波数帯域に分割された、各帯域における前記時間領域評価信号と前記第1チャネルの駆動音源信号との間の前記第2空間的情報であり、前記周波数領域評価信号は、当該第2空間情報を前記時間領域評価信号に与えることにより生成される、
    ステレオ復号装置。
  7. ステレオ信号から生成されるモノラル信号を符号化して、モノラル駆動音源信号を生成するステップと、
    前記ステレオ信号の第1チャネルの駆動音源信号に対して時間領域における評価を行うステップと、
    前記時間領域における評価結果である第1空間的情報を符号化するステップと、
    前記第1チャネルの駆動音源信号の周波数帯域を複数に分割するステップと、
    分割後の各帯域の前記第1チャネルの駆動音源信号に対し周波数領域における評価を行うステップと、
    前記周波数領域における評価結果である第2空間的情報を符号化するステップと、
    を具備し、
    前記時間領域における評価を行うステップは、
    前記時間領域における評価において、前記第1チャネルの駆動音源信号と前記モノラル駆動音源信号との間の前記第1空間的情報を求め、当該第1空間的情報を前記モノラル駆動音源信号に与えることにより、前記第1チャネルの駆動音源信号に類似する時間領域評価信号を生成し、
    前記周波数領域における評価を行うステップは、
    前記時間領域評価信号の周波数帯域を複数に分割し、前記周波数領域における評価において、各帯域における前記時間領域評価信号と前記第1チャネルの駆動音源信号との間の前記第2空間的情報を求め、当該第2空間情報を前記時間領域評価信号に与えることにより、前記第1チャネルの駆動音源信号に類似する周波数領域評価信号を生成する、
    ステレオ符号化方法。
JP2007533292A 2005-08-31 2006-08-30 ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法 Expired - Fee Related JP5171256B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007533292A JP5171256B2 (ja) 2005-08-31 2006-08-30 ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005252778 2005-08-31
JP2005252778 2005-08-31
PCT/JP2006/317104 WO2007026763A1 (ja) 2005-08-31 2006-08-30 ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
JP2007533292A JP5171256B2 (ja) 2005-08-31 2006-08-30 ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法

Publications (2)

Publication Number Publication Date
JPWO2007026763A1 JPWO2007026763A1 (ja) 2009-03-26
JP5171256B2 true JP5171256B2 (ja) 2013-03-27

Family

ID=37808848

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007533292A Expired - Fee Related JP5171256B2 (ja) 2005-08-31 2006-08-30 ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法

Country Status (6)

Country Link
US (1) US8457319B2 (ja)
EP (1) EP1912206B1 (ja)
JP (1) JP5171256B2 (ja)
KR (1) KR101340233B1 (ja)
CN (1) CN101253557B (ja)
WO (1) WO2007026763A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013508770A (ja) * 2009-10-23 2013-03-07 サムスン エレクトロニクス カンパニー リミテッド 位相情報と残余信号を用いる符号化/復号化装置及び方法

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
WO2009057327A1 (ja) * 2007-10-31 2009-05-07 Panasonic Corporation 符号化装置および復号装置
US8359196B2 (en) * 2007-12-28 2013-01-22 Panasonic Corporation Stereo sound decoding apparatus, stereo sound encoding apparatus and lost-frame compensating method
US7889103B2 (en) 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
EP2254110B1 (en) * 2008-03-19 2014-04-30 Panasonic Corporation Stereo signal encoding device, stereo signal decoding device and methods for them
US8639519B2 (en) 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
US8140342B2 (en) 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8200496B2 (en) 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
CN102292769B (zh) * 2009-02-13 2012-12-19 华为技术有限公司 一种立体声编码方法和装置
EP2476113B1 (en) 2009-09-11 2014-08-13 Nokia Corporation Method, apparatus and computer program product for audio coding
CN102081927B (zh) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
RU2559899C2 (ru) 2010-04-09 2015-08-20 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
BR112012026324B1 (pt) * 2010-04-13 2021-08-17 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V Codificador de aúdio ou vídeo, decodificador de aúdio ou vídeo e métodos relacionados para o processamento do sinal de aúdio ou vídeo de múltiplos canais usando uma direção de previsão variável
KR101276049B1 (ko) * 2012-01-25 2013-06-20 세종대학교산학협력단 조건부 스플릿 벡터 양자화를 이용한 음성 압축 장치 및 그 방법
WO2013149671A1 (en) * 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Multi-channel audio encoder and method for encoding a multi-channel audio signal
WO2013189030A1 (zh) * 2012-06-19 2013-12-27 深圳广晟信源技术有限公司 对单声道或立体声进行编码的方法
US9711150B2 (en) * 2012-08-22 2017-07-18 Electronics And Telecommunications Research Institute Audio encoding apparatus and method, and audio decoding apparatus and method
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
WO2014161996A2 (en) * 2013-04-05 2014-10-09 Dolby International Ab Audio processing system
EP3067887A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
JP6804528B2 (ja) * 2015-09-25 2020-12-23 ヴォイスエイジ・コーポレーション ステレオ音声信号をプライマリチャンネルおよびセカンダリチャンネルに時間領域ダウンミックスするために左チャンネルと右チャンネルとの間の長期相関差を使用する方法およびシステム
USD793458S1 (en) 2015-12-24 2017-08-01 Samsung Electronics Co., Ltd. Ice machine for refrigerator
USD794093S1 (en) 2015-12-24 2017-08-08 Samsung Electronics Co., Ltd. Ice machine handle for refrigerator
CN115132214A (zh) * 2018-06-29 2022-09-30 华为技术有限公司 立体声信号的编码、解码方法、编码装置和解码装置
WO2024111300A1 (ja) * 2022-11-22 2024-05-30 富士フイルム株式会社 音データ作成方法及び音データ作成装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105193A (ja) * 1996-09-26 1998-04-24 Yamaha Corp 音声符号化伝送方式
JPH11317672A (ja) * 1997-11-20 1999-11-16 Samsung Electronics Co Ltd ビット率の調節可能なステレオオーディオ符号化/復号化方法及び装置
WO2004086817A2 (en) * 2003-03-24 2004-10-07 Koninklijke Philips Electronics N.V. Coding of main and side signal representing a multichannel signal
JP2004289196A (ja) * 2002-03-08 2004-10-14 Nippon Telegr & Teleph Corp <Ntt> ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム
JP2004302259A (ja) * 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 音響信号の階層符号化方法および階層復号化方法
WO2005027095A1 (ja) * 2003-09-16 2005-03-24 Matsushita Electric Industrial Co., Ltd. 符号化装置および復号化装置
JP2005517987A (ja) * 2002-02-18 2005-06-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメトリックオーディオ符号化

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1021044A1 (en) * 1999-01-12 2000-07-19 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding or decoding audio or video frame data
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
AU2003213439A1 (en) * 2002-03-08 2003-09-22 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
US8340302B2 (en) 2002-04-22 2012-12-25 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
KR100528325B1 (ko) 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
JP4431568B2 (ja) * 2003-02-11 2010-03-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化
JP4329574B2 (ja) 2004-03-05 2009-09-09 沖電気工業株式会社 時間分割波長ホップ光符号による通信方法及び通信装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105193A (ja) * 1996-09-26 1998-04-24 Yamaha Corp 音声符号化伝送方式
JPH11317672A (ja) * 1997-11-20 1999-11-16 Samsung Electronics Co Ltd ビット率の調節可能なステレオオーディオ符号化/復号化方法及び装置
JP2005517987A (ja) * 2002-02-18 2005-06-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメトリックオーディオ符号化
JP2004289196A (ja) * 2002-03-08 2004-10-14 Nippon Telegr & Teleph Corp <Ntt> ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム
WO2004086817A2 (en) * 2003-03-24 2004-10-07 Koninklijke Philips Electronics N.V. Coding of main and side signal representing a multichannel signal
JP2004302259A (ja) * 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 音響信号の階層符号化方法および階層復号化方法
WO2005027095A1 (ja) * 2003-09-16 2005-03-24 Matsushita Electric Industrial Co., Ltd. 符号化装置および復号化装置

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
CSNG200700044120; 押切正浩 他: '"ピッチフィルタリングに基づくスペクトル符号化を用いた超広帯域スケーラブル音声符号化の改善"' 日本音響学会2004年秋季研究発表会講演論文集-I- , 20040921, p.297-298 *
CSNJ200610032118; 吉田幸司 他: '"スケーラブルステレオ音声符号化のチャネル間予測に関する予備検討"' 電子情報通信学会2005年総合大会講演論文集 情報・システム1 , 20050307, p.118 *
CSNJ200610032119; 後藤道代 他: '"チャネル間情報を用いた音声通信用ステレオ音声符号化方法の検討"' 電子情報通信学会2005年総合大会講演論文集 情報・システム1 , 20050307, p.119 *
CSNJ200610036115; 後藤道代 他: '"音声通信用スケーラブルステレオ音声符号化方法の検討"' 第4回情報科学技術フォーラム講演論文集 , 20050822, p.299-300 *
JPN6011067438; 吉田幸司 他: '"スケーラブルステレオ音声符号化のチャネル間予測に関する予備検討"' 電子情報通信学会2005年総合大会講演論文集 情報・システム1 , 20050307, p.118 *
JPN6011067441; 後藤道代 他: '"音声通信用スケーラブルステレオ音声符号化方法の検討"' 第4回情報科学技術フォーラム講演論文集 , 20050822, p.299-300 *
JPN6011067442; 押切正浩 他: '"ピッチフィルタリングに基づくスペクトル符号化を用いた超広帯域スケーラブル音声符号化の改善"' 日本音響学会2004年秋季研究発表会講演論文集-I- , 20040921, p.297-298 *
JPN6011067444; 後藤道代 他: '"チャネル間情報を用いた音声通信用ステレオ音声符号化方法の検討"' 電子情報通信学会2005年総合大会講演論文集 情報・システム1 , 20050307, p.119 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013508770A (ja) * 2009-10-23 2013-03-07 サムスン エレクトロニクス カンパニー リミテッド 位相情報と残余信号を用いる符号化/復号化装置及び方法

Also Published As

Publication number Publication date
WO2007026763A1 (ja) 2007-03-08
CN101253557A (zh) 2008-08-27
KR20080039462A (ko) 2008-05-07
JPWO2007026763A1 (ja) 2009-03-26
EP1912206A1 (en) 2008-04-16
CN101253557B (zh) 2012-06-20
US8457319B2 (en) 2013-06-04
EP1912206B1 (en) 2013-01-09
EP1912206A4 (en) 2011-03-23
US20090262945A1 (en) 2009-10-22
KR101340233B1 (ko) 2013-12-10

Similar Documents

Publication Publication Date Title
JP5171256B2 (ja) ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
US7983904B2 (en) Scalable decoding apparatus and scalable encoding apparatus
JP5383676B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5413839B2 (ja) 符号化装置および復号装置
JP5363488B2 (ja) マルチチャネル・オーディオのジョイント強化
JP4606418B2 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
CN106663432B (zh) 对压缩的hoa表示编码和解码的方法和装置
EP2133872B1 (en) Encoding device and encoding method
JPWO2009057329A1 (ja) 符号化装置、復号装置およびこれらの方法
WO2009048239A2 (en) Encoding and decoding method using variable subband analysis and apparatus thereof
US20100121632A1 (en) Stereo audio encoding device, stereo audio decoding device, and their method
JP4948401B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
CN106463132B (zh) 对压缩的hoa表示编码和解码的方法和装置
WO2010016270A1 (ja) 量子化装置、符号化装置、量子化方法及び符号化方法
US20100121633A1 (en) Stereo audio encoding device and stereo audio encoding method
JP4323520B2 (ja) ポリフォニック信号の制約付きフィルタ符号化
JP2006072269A (ja) 音声符号化装置、通信端末装置、基地局装置および音声符号化方法
Bang et al. Audio Transcoding Algorithm for Mobile Multimedia Application

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120321

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121225

R150 Certificate of patent or registration of utility model

Ref document number: 5171256

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees