JP5511848B2 - 音声符号化装置および音声符号化方法 - Google Patents

音声符号化装置および音声符号化方法 Download PDF

Info

Publication number
JP5511848B2
JP5511848B2 JP2011547334A JP2011547334A JP5511848B2 JP 5511848 B2 JP5511848 B2 JP 5511848B2 JP 2011547334 A JP2011547334 A JP 2011547334A JP 2011547334 A JP2011547334 A JP 2011547334A JP 5511848 B2 JP5511848 B2 JP 5511848B2
Authority
JP
Japan
Prior art keywords
signal
inter
subband
encoding
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011547334A
Other languages
English (en)
Other versions
JPWO2011080916A1 (ja
Inventor
ゾンシアン リウ
コック セン チョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2011547334A priority Critical patent/JP5511848B2/ja
Publication of JPWO2011080916A1 publication Critical patent/JPWO2011080916A1/ja
Application granted granted Critical
Publication of JP5511848B2 publication Critical patent/JP5511848B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、音声符号化装置および音声符号化方法に関し、特に、冗長なチャンネル間パラメータを削除可能な音声符号化装置および音声符号化方法に関する。
ステレオ音声符号化方法またはマルチチャンネル音声符号化には、一般的に2種類の方法が存在する。
一方の方法は、異なるチャンネルの信号を各々独立に符号化する方法である。ステレオ音声信号またはマルチチャンネル音声信号にこの方法を適用することは容易である。しかし、この方法では、チャンネル間の冗長性が取り除かれないため、全体の符号化ビットレートはチャンネルの数に比例してしまい、高ビットレートになってしまう。
他方の方法は、ステレオ音声信号またはマルチチャンネル音声信号をパラメトリックに符号化する方法である。この方法の基本的な原理は次の通りである。すなわち、はじめに、符号化側において、入力信号を、より少ない(または同じ)数の信号にダウンミックスまたは変換する。次に、ダウンミックスまたは変換された信号を、従来の音声符号化方法を使用して符号化する。これと並行して、原信号からチャンネル間の関係を表すチャンネル間パラメータを算出し、復号側にてステレオイメージまたはマルチチャンネルイメージを生成できるように、チャンネル間パラメータも符号化して復号側に送信する。この方法では、音声信号そのものを符号化するよりも少ない符号量でチャンネル間パラメータを符号化することができるため、低ビットレート化が実現できる。
パラメトリックステレオ符号化システムまたはマルチチャンネル符号化システムにおいては、主成分分析(PCA)(非特許文献1)、バイノーラルキュー符号化方法(BCC)(非特許文献2)、チャンネル間予測(ICP)(非特許文献3)、およびインテンシティステレオ(IS)(非特許文献4)が広く使用されている。ここに挙げた各方法では、何らかのチャンネル間パラメータを生成して復号側へ送信する。例えば、バイノーラルキュー符号化方法(BCC)ではチャンネル間レベル差(ICLD)、チャンネル間時間差(ICTD)、チャンネル間コヒーレンス(ICC)がチャンネル間パラメータに相当する。また、チャンネル間予測ではチャンネル間予測係数、インテンシティステレオではエネルギスケール係数、主成分分析では回転角がチャンネル間パラメータとなる。
BCC、ICP、IS、およびPCAでは、良好な精度のチャンネル間パラメータを求める必要があるために、サブバンドベースでチャンネル間パラメータの算出および符号化が行われることが一般的である。
図1および図2は、パラメトリックマルチチャンネルコーデックの構成を単純化して示している。図1および図2における各記号の意味は以下のとおりである。
{xi_sb}:複数のサブバンドに分割された一連のマルチチャンネル信号(これらは、周波数領域、時間領域、または周波数領域と時間領域を組み合わせたハイブリッド領域における信号を表す)
{yi_sb}:各サブバンドにて求められるダウンミックスまたは変換された一連の信号(これらは{xi_sb}と同じ領域の信号である)
{Pi_sb}:各サブバンドにて求められる一連のチャンネル間パラメータ
なお、以下では、ダウンミックスすることを前提に説明を行う。
図1に示した符号化側においては、チャンネル間パラメータ生成部101が、入力信号{xi_sb}を、例えば、BCC、PCA等によってダウンミックスしてダウンミックス信号{yi_sb}およびチャンネル間パラメータ{Pi_sb}を生成する。
ダウンミックス信号{yi_sb}は符号化部102によって符号化され、チャンネル間パラメータ{Pi_sb}は別途用意されている符号化部103(チャンネル間パラメータ符号化部)によって符号化される。
ダウンミックス信号{yi_sb}の符号化パラメータとチャンネル間パラメータ{Pi_sb}の符号化パラメータは多重化部104にて多重化されてビットストリームが生成される。このビットストリームは復号側に送信される。
図2に示した復号側においては、分離部201が、ビットストリームを分離してダウンミックス信号の符号化パラメータとチャンネル間パラメータの符号化パラメータを得る。
復号部202は、ダウンミックス信号の符号化パラメータを用いて復号処理を行い、復号ダウンミックス信号{y i_sb}を生成する。
復号部203(チャンネル間パラメータ復号部)は、チャンネル間パラメータ符号化パラメータを用いて復号処理を行い、復号チャンネル間パラメータ{P i_sb}を生成する。
チャンネル間パラメータ適用部204は、復号チャンネル間パラメータ{P i_sb}によって表される空間情報を用いて復号ダウンミックス信号{y i_sb}をアップミックスして復号信号{x i_sb}を生成する。
非特許文献1には、周波数領域における主成分分析(PCA)に基づくコーデックが記載されている。図3および図4は、非特許文献1におけるPCAベースの符号化装置および復号装置の構成を示している。各記号の意味は以下のとおりである。
{Lsb(f)}:複数のサブバンドに分割された左信号
{Rsb(f)}:複数のサブバンドに分割された右信号
{Pcsb(f)}:主成分分析によってサブバンド毎に算出される主成分信号
{Asb(f)}:主成分分析によってサブバンド毎に算出されるアンビエント信号(ambient signal)
{θsb}:主成分分析によってサブバンド毎に算出される回転角
{PcARsb}:サブバンド毎に算出される主成分分析信号とアンビエント信号のエネルギ比
図3に示した符号化側においては、主成分分析部301が、入力左信号{Lsb(f)}および入力右信号{Rsb(f)}を、主成分信号{Pcsb(f)}およびアンビエント信号{Asb(f)}に変換する。この変換過程において、変換の程度を示す回転角をサブバンド毎に計算する。回転角は以下のように計算する。
Figure 0005511848
また、主成分分析の変換は、以下の式のように行う。
Figure 0005511848
モノラル符号化部303は、主成分信号{Pcsb(f)}を符号化する。
符号化部302(回転角符号化部)は、回転角{θsb}を符号化する。
アンビエント信号{Asb(f)}は重要とはみなされないため、直接的に符号化せず、エネルギパラメータ抽出部304が、主成分信号とアンビエント信号との間のエネルギ比{PcARsb}を算出し、符号化部305(エネルギ比符号化部)が、エネルギ比{PcARsb}を符号化してエネルギ比符号化パラメータを生成する。エネルギ比{PcARsb}は以下の式のように求められる。
Figure 0005511848
多重化部306は、{Pcsb(f)}の符号化パラメータと回転角{θsb}の符号化パラメータ、そしてエネルギ比{PcARsb}の符号化パラメータを多重化して復号側にビットストリームを送信する。
図4に示した復号側においては、分離部401が、ビットストリームを分離し、主成分信号符号化パラメータ、回転角符号化パラメータ、およびエネルギ比符号化パラメータを得る。
復号部402(回転角復号部)は、回転角符号化パラメータを復号して復号回転角{θ i_sb}を主成分合成部406に出力する。
モノラル復号部403は、主成分信号符号化パラメータを復号して復号主成分信号{Psb(f)}を生成し、主成分合成部406およびアンビエント信号合成部405に出力する。
復号部404(エネルギ比復号部)は、エネルギ比符号化パラメータを復号して、主成分信号とアンビエント信号との復号エネルギ比{PcARsb}を生成する。
アンビエント信号合成部405は、復号主成分信号{Psb(f)}を復号エネルギ比によってスケーリングすることにより、復号アンビエント信号{A sb(f)}を生成する。
主成分合成部406は、復号主成分信号{Psb(f)}と復号アンビエント信号{A sb(f)}とを、復号回転角{θ i_sb}によって逆変換し、復号左信号{L sb(f)}および復号右信号{R sb(f)}を生成する。この逆変換は、以下の式のように行う。
Figure 0005511848
また、アンビエント信号が符号化されない場合、逆変換は以下の式のように行う。
Figure 0005511848
Manuel Briand, David Virette and Nadine Martin "Parametric coding of stereo audio based on principal component analysis", Proc of the 9th International Conference on Digital Audio Effects, Montreal, Canada, September 18-20, 2006. Christof Faller and Frank Baumgarte "Binaural Cue Coding - Part II: Schemes and Applications", IEEE Transactions on Speech and Audio Processing, Vol. 11, No 6, November 2003 Hendrik Fuchs "Improving Joint Stereo Audio Coding by Adaptive Inter-channel Prediction", Proc of IEEE ASSP Workshop on Applications of Signal Processing to Audio and Acoustics, New Paltz, NY, USA, Oct 17-20, 1993 Jurgen Herre, "From Joint Stereo to Spatial Audio Coding - Recent Progress and Standardization", Proc of the 7th International Conference on Digital Audio Effects, Naples, Italy, October 5-8, 2004.
上記従来技術においては、ダウンミックスされた信号{yi_sb}の符号化品質または信号レベルの大きさに関係なく、チャンネル間パラメータを所定のビットレートで符号化する。場合によっては1つまたは複数のサブバンドにおいて、ダウンミックスされた信号がまったく符号化されていなくても、チャンネル間パラメータの符号化はその状況とは関係なく行われる。
ここでは、極めて低いビットレートにおいて、1つまたは複数のサブバンドのダウンミックスされた信号が符号化されない場合を例として考える。ダウンミックスされた信号が符号化されないそれらのサブバンドでは、マルチチャンネルの音声信号を生成する上でチャンネル間パラメータは不要であり、これら不要なパラメータが符号化された場合に、そこで消費されるビットは無駄になってしまう。
以下では、周波数領域における主成分分析をベースとする上述したコーデックを例に説明を行う。
いま、入力信号がL(n)およびR(n)であり、これらの信号が、L(n)=S(n)+C(n)、R(n)=S(n)+B(n)(S(n)は主ソース信号,C(n)およびB(n)は何らかのアンビエントノイズ)と表すことができるものとする。
周波数領域においては、L(f)=S(f)+C(f),R(f)=S(f)+B(f)である。S(f)がさほど強くないサブバンドにおいてはアンビエントノイズが優勢であり、すなわち、L(f)においてはC(f)が優勢であり、R(f)においてはB(f)が優勢である。この場合、これらのサブバンドはスペクトル全体においてさほど重要ではなく、低ビットレートにおいては、これらサブバンドの信号は、符号化されない。従って、これらのサブバンドの回転角の符号化は本来不要である。よって、常にすべてのサブバンドの回転角を符号化する従来技術では、これらサブバンドの回転角の符号化に割り当てられるビットは無駄になる。
図5は問題となる上記の状況を図示したものである。低ビットレートの条件下では、図5に示したように、符号化側では、他のサブバンドよりも主成分信号のエネルギの小さい第2のサブバンドの主成分信号Pc(f)は符号化されない。したがって、復号側において、第2のサブバンドの復号後の主成分信号は0である。アンビエント信号は主成分信号をスケーリングすることによって生成されるため、アンビエント信号も0である。したがって、回転角がどのような値であっても、第2のサブバンドの復号左信号L (f)および復号右信号R (f)は0である。つまり、たとえ回転角が送信されなくても、復号左信号および復号右信号は回転角が送信された場合と同じである。
本発明の目的は、冗長なチャンネル間パラメータを削除することができる音声符号化装置および音声符号化方法を提供することである。
本発明の第1の態様においては、チャンネル間パラメータを符号化して送信する前に、各サブバンド信号それぞれについて、信号の特性を分析し、チャンネル間パラメータを送信する必要があるか否かを調べる。そして、送信する必要がないチャンネル間パラメータを識別して符号化の対象から削除する。
これにより、不要なチャンネル間パラメータを符号化の対象から削除して、不要なパラメータを符号化することが避けられるため、ビットが無駄にならず、符号化効率を向上させることができる。
本発明の第2の態様においては、閉ループ法によって、冗長なパラメータを識別する。符号化側に局所復号部を導入し、信号の符号化品質を分析することによって、冗長なパラメータを識別する。局所復号部を介して生成される復号ダウンミックス信号のエネルギまたは振幅を分析して、エネルギまたは振幅が小さいサブバンドを冗長なチャンネル間パラメータを有するサブバンドとみなす。このサブバンドのチャンネル間パラメータを符号化の対象から削除することにより、音質が低下する可能性が回避される。
これにより、局所復号部において冗長なパラメータ(重要でないチャンネル間パラメータ)を有するサブバンドを識別することができる。
本発明の第3の態様においては、開ループ法によって、冗長なパラメータを識別する。変換またはダウンミックスされた原信号の特性を分析することによって、冗長なパラメータを識別する。
これにより、局所復号部が必要なくなる。よって、局所復号部が利用できない条件において有効である。また、局所復号部が存在しないため、演算量を低減することができる。
本発明の第4の態様においては、復号側において、復号後の変換またはダウンミックスされた信号を分析することによって、チャンネル間パラメータが存在しないサブバンドを識別する。したがって、特定のサブバンドにおいてチャンネル間パラメータが存在しないことを復号部に通知するためのフラグ信号が要求されない。
これにより、フラグ信号を表すための付加情報が不要になるため、符号化効率を向上させることができる。
本発明の第5の態様においては、本発明を適用することによって節約されるビットを、何らかのより重要な信号(例えば、主成分信号の符号化パラメータ、変換またはダウンミックスされた信号の符号化パラメータ)を符号化するために利用する。
これにより、より良好なビット割当を実現することができ、符号化効率を向上させることができる。
本発明の第6の態様においては、復号側において、隣接するサブバンドのパラメータ、過去のフレームのパラメータ、またはその両方から、存在しないチャンネル間パラメータを予測する。予測された値は、逆変換またはアップミックスにおいて使用する。
これにより、存在しないチャンネル間パラメータを予測して、空間イメージを保持することができる。
本発明の第7の態様においては、本発明をスケーラブル符号化に適用する。各レイヤにおいて、チャンネル間パラメータを符号化して送信する前に、サブバンド毎に、変換またはダウンミックスされた信号の特性を分析し、チャンネル間パラメータを送信する必要があるか否かを調べる。そして、送信する必要がないチャンネル間パラメータを識別して符号化の対象から削除する。入力信号を生成するためにチャンネル間パラメータが必要であるレイヤの場合に、チャンネル間パラメータを送信する。
これにより、チャンネル間パラメータが必要なレイヤのときにのみチャンネル間パラメータを送信するため、良好なビット割当を実現することができる。
パラメトリックマルチチャンネル音声符号化の符号化側の構成を示す図 パラメトリックマルチチャンネル音声符号化の復号側の構成を示す図 PCAベースのステレオコーデックの符号化側の構成を示す図 PCAベースのステレオコーデックの復号側の構成を示す図 PCAベースのステレオコーデックでの問題を示す図 PCAベースのステレオコーデックにおける本発明の実施の形態1に係る音声符号化装置の構成を示す図 PCAベースのステレオコーデックにおける本発明の実施の形態1に係る符号化処理を示す図 PCAベースのステレオコーデックにおける本発明の実施の形態1に係る音声復号装置の構成を示す図 PCAベースのステレオコーデックにおける本発明の実施の形態1に係る復号処理を示す図 マルチチャンネル音声符号化における本発明の実施の形態2に係る音声符号化装置の構成を示す図 マルチチャンネル音声符号化における本発明の実施の形態2に係る符号化処理を示す図 マルチチャンネル音声符号化における本発明の実施の形態2に係る音声復号装置の構成を示す図 マルチチャンネル音声符号化における本発明の実施の形態2に係る復号処理を示す図 マルチチャンネル音声符号化における本発明の実施の形態3に係る音声復号装置の構成を示す図 マルチチャンネル音声符号化における本発明の実施の形態3に係る復号処理を示す図 マルチチャンネル音声符号化における本発明の実施の形態4に係る音声符号化装置の構成を示す図 マルチチャンネル音声符号化における本発明の実施の形態4に係る符号化処理を示す図 マルチチャンネル音声符号化における本発明の実施の形態4に係る音声復号装置の構成を示す図 マルチチャンネル音声符号化における本発明の実施の形態4に係る復号処理を示す図 マルチチャンネル音声符号化における本発明の実施の形態5に係る音声符号化装置の構成を示す図 マルチチャンネル音声符号化における本発明の実施の形態5に係る符号化処理を示す図 マルチチャンネル音声符号化における本発明の実施の形態5に係る音声復号装置の構成を示す図 マルチチャンネル音声符号化における本発明の実施の形態5に係る復号処理を示す図
以下、本発明の各実施の形態について図面を用いて説明する。
(実施の形態1)
本実施の形態について、図6−図9を用いて説明する。
図6に本実施の形態に係る音声符号化装置600の構成を示す。図6には、図3と比較して、局所モノラル復号部603および冗長パラメータ削除部604が追加されている。なお、図6において、図3と同一の構成部については説明を省略する。
局所モノラル復号部603は、主成分信号の符号化品質を符号化側において認識することができるように、復号後の主成分信号を生成する。
冗長パラメータ削除部604は、復号主成分信号の符号化品質を分析することによって、冗長なパラメータを識別し、これらを符号化の対象から削除する。
図7を用いて、本実施の形態に係る符号化処理について説明する。
図7に示すように、主成分信号のスペクトルを符号化および復号する。復号のスペクトルを生成した後、復号後のスペクトルを分析することによって、第2のサブバンドにおいては主成分がまったく符号化されず、第2のサブバンドの復号後のスペクトルが0となる。したがって、第2のサブバンドの回転角を符号化する必要がないことが認識される。よって、第2のサブバンドにおける回転角を冗長なパラメータとみなし、符号化の前にこのパラメータを符号化の対象から削除する。
図8に本実施の形態に係る音声復号装置800の構成を示す。図8には、図4と比較して、ゼロ値挿入部804が追加されている。なお、図8において、図4と同一の構成部については説明を省略する。
ゼロ値挿入部804は、復号主成分信号を分析し、回転角が存在しないサブバンドを識別し、逆変換をスムーズに行うことができるように、回転角が存在しないサブバンドにおいてゼロ値を挿入する。
図9を用いて、本実施の形態に係る復号処理について説明する。
図9に示すように、復号側においては、復号主成分信号を生成した後、復号主成分信号を分析することによって、第2のサブバンドにおいて復号主成分信号が0であることが認識され、第2のサブバンドの回転角が符号化されていないことが認識される。したがって、それ以外のサブバンドの回転角のみを復号する。また、復号処理をスムーズにするために、第2のサブバンドの復号された回転角を0値として挿入する。
本発明を、主成分信号とアンビエント信号との間のエネルギ比の符号化に適用することも可能である。
(実施の形態2)
本実施の形態について、図10−図13を用いて説明する。図10−図13において、各記号の意味は以下のとおりである。
{xi_sb}:複数のサブバンドに分割されたマルチチャンネル信号(これらは、周波数領域、時間領域、または周波数領域と時間領域とのハイブリッド領域における信号を表す)
{yi_sb}:複数サブバンドに分割されたダウンミックスまたは変換された信号(これらは{xi_sb}と同じ領域における信号である)
{Pi_sb}:各サブバンドで求められたチャンネル間パラメータ
{x i_sb}:{xi_sb}の復号信号
{y i_sb}:{yi_sb}の復号信号
{P i_sb}:復号チャンネル間パラメータ
本実施の形態では、マルチチャンネル音声符号化において冗長なパラメータを削除する。
図10に本実施の形態に係る音声符号化装置1000の構成を示す。
音声符号化装置1000において、チャンネル間パラメータ生成部1001が、入力信号{xi_sb}を、例えば、BCC、PCA等によって{yi_sb}に変換またはダウンミックスする。また、チャンネル間パラメータ生成部1001は、変換またはダウンミックスの過程において、チャンネル間パラメータ{Pi_sb}も生成する。
変換またはダウンミックスされた信号{yi_sb}は符号化部1002によって符号化される。
局所復号部1003は、変換またはダウンミックスされた信号の符号化品質を符号化側において認識することができるように、復号後の変換またはダウンミックスされた信号を生成する。
冗長パラメータ削除部1004は、変換またはダウンミックスされた信号の符号化品質を分析することによって、冗長なパラメータを識別し、これらを符号化の対象から削除する。
符号化部1005(チャンネル間パラメータ符号化部)は、冗長なパラメータを削除した後の残りのチャンネル間パラメータ{P‘i_sb}を符号化する。
多重化部1006は、{yi_sb}の符号化パラメータと{P‘i_sb}の符号化パラメータとを多重化してビットストリームを生成し、復号側に送信する。
図11を用いて、本実施の形態に係る符号化処理について説明する。
図11に示すように、変換またはダウンミックスされた信号のスペクトルを符号化および復号する。復号スペクトルを生成した後、復号スペクトルを分析することによって、例えば、第2のサブバンドにおいては、変換された信号またはダウンミックスされた信号が非常に弱いため(極端な場合、第2のサブバンドがまったく符号化されないため)、復号後の信号が0であることが認識される。このため、第2のサブバンドのチャンネル間パラメータを符号化する必要はない。よって、第2のサブバンドにおけるチャンネル間パラメータを冗長なパラメータとみなし、符号化の前にこのパラメータを符号化の対象から削除する。
復号後のサブバンド信号が十分に弱いか否かを判定するための方法は多数存在する。例えば、以下の2つの方法がある。しかし、本発明は以下の方法に限定されない。
<方法1>サブバンドの信号エネルギが、隣接するサブバンドと比較して非常に低い場合
この方法においては、各サブバンドのエネルギ{Esb}を計算する。各サブバンドについて、そのサブバンドと隣接するサブバンドとの間のエネルギ比を計算する。次いで、エネルギ比を所定の値Eth(Eth<1)と比較する。2つのエネルギ比の両方がEthより小さいならば、そのサブバンドの信号を弱いとみなす。例えば、第2のサブバンドにおいて、2つのエネルギ比E/EおよびE/Eを計算する。E/E<EthかつE/E<Ethであるならば、第2のサブバンドの信号を弱いとみなす。このとき、第2のサブバンドにおけるチャンネル間パラメータを冗長なパラメータとみなす。
<方法2>サブバンドの信号がマスキング曲線に近い、または曲線より低い場合
この方法においては、各サブバンドについて、エネルギ{Esb}およびマスキング曲線レベル{Msb}を計算する。次いで、各サブバンドについて、マスキング曲線のレベルをサブバンドのエネルギと比較する。この場合、別のしきい値Mth(Mth>0)を定義することができる。サブバンドのエネルギがマスキング曲線より小さい、または曲線に近い場合、すなわちEsb<Msb+Mthである場合、そのサブバンドの信号を弱いとみなす。例えば、第2のサブバンドについて、サブバンドのエネルギEをマスキング曲線のレベルMと比較する。E<M+Mthであるならば、その第2のサブバンドの信号を弱いとみなす。その第2のサブバンドにおけるチャンネル間パラメータを冗長なパラメータとみなす。
図12に本実施の形態に係る音声復号装置1200の構成を示す。
音声復号装置1200において、分離部1201は、ビットストリームを分離する。
復号部1202は、{yi_sb}の符号化パラメータを復号して、変換またはダウンミックスされた信号{y i_sb}を生成する。
復号部1203(チャンネル間パラメータ復号部)は、{P‘i_sb}の符号化パラメータを復号して、復号チャンネル間パラメータ{Pi_sb}を生成する。
ゼロ値挿入部1204は、変換またはダウンミックスされた信号の復号スペクトルを分析し、チャンネル間パラメータが存在しないサブバンドを識別し、逆変換またはアップミックスをスムーズに行うことができるようにそのサブバンドにおいてゼロ値を挿入する。
チャンネル間パラメータ適用部1205は、チャンネル間パラメータ{P i_sb}によって表される空間情報を利用することによって、復号された信号{y i_sb}を逆変換またはアップミックスして{x i_sb}を生成する。
図13を用いて、本実施の形態に係る復号処理について説明する。
図13に示すように、復号スペクトルを生成した後、復号スペクトルを分析することによって、第2のサブバンドの復号信号が非常に弱い(極端な場合、復号信号が0である)ことが認識される。したがって、第2のサブバンドのチャンネル間パラメータが符号化されていないことが認識される。したがって、それ以外のサブバンドのチャンネル間パラメータのみを復号する。また、復号処理をスムーズにするために、第2のサブバンドの復号されたチャンネル間パラメータに0値を挿入する。チャンネル間パラメータが符号化されているか否かを復号側において判定する方法は、符号化側との一貫性が保たれるようにするために、符号化側における上記方法と同じである。
このように、本実施の形態によれば、チャンネル間パラメータを符号化して送信する前に、各サブバンドにおける変換された信号それぞれについて、信号の特性を分析し、チャンネル間パラメータを送信する必要があるか否かを調べる。そして、送信する必要がないチャンネル間パラメータを識別して符号化の対象から削除する。
よって、本実施の形態によれば、不要なチャンネル間パラメータを符号化の対象から削除することによって、不要なパラメータを符号化することが避けられ、符号化効率を向上させることができる。
また、本実施の形態によれば、閉ループ法によって、冗長なパラメータを識別する。すなわち、符号化側の局所復号部が信号の符号化品質を分析することによって、冗長なパラメータを識別する。
よって、本実施の形態によれば、局所復号部は、冗長なパラメータ(重要でないチャンネル間パラメータ)を有するサブバンドを特定できる。これによって、音質が低下する可能性が回避される。
また、本実施の形態によれば、復号側において、復号後の変換またはダウンミックスされた信号を分析することによって、チャンネル間パラメータが存在しないサブバンドを識別する。したがって、特定のサブバンドにおいてチャンネル間パラメータが存在しないことを復号部に通知するためのフラグ信号が要求されない。
よって、本実施の形態によれば、フラグ信号を表すための付加情報が不要になるため、符号化効率を向上させることができる。
(実施の形態3)
本実施の形態について、図14および図15を用いて説明する。図14および図15における各記号の意味は、実施の形態2と同じである。
本実施の形態では、復号側において、隣接するサブバンドのパラメータ、過去のフレームのパラメータ、またはその両方から、存在しないチャンネル間パラメータを予測する。予測された値は、逆変換またはアップミックスにおいて使用する。
図14に本実施の形態に係る音声復号装置1400の構成を示す。図14においては、図12に示したゼロ値挿入部1204が、欠落パラメータ予測部1404に置き換わっている。なお、図14において、図12と同一の構成部については説明を省略する。
音声復号装置1400において、欠落パラメータ予測部1404は、存在しないチャンネル間パラメータをゼロ値によって埋めずに、隣接するサブバンドのパラメータまたは過去のフレームのパラメータを用いて、存在しないチャンネル間パラメータを予測する。
図15を用いて、本実施の形態に係る復号処理について説明する。
図15では、一例として、復号側において第2のサブバンドのチャンネル間パラメータが存在していないため、このパラメータを、隣接するサブバンドのパラメータまたは過去のフレームのパラメータによって予測する。
存在しないチャンネル間パラメータを予測するための方法は多数ある。
例えば、以下の式のようにして、存在しないチャンネル間パラメータを、隣接するサブバンドのパラメータを使用して補間する方法がある。
Figure 0005511848
また、以下の式のようにして、存在しないチャンネル間パラメータを、過去のフレームのパラメータを使用して予測する方法がる。この方法は、空間イメージが時間的に安定しているときに効果的である。
Figure 0005511848
このように、本実施の形態によれば、復号側において、隣接するサブバンドのパラメータ、過去のフレームのパラメータ、またはその両方から、存在しないチャンネル間パラメータを予測する。また、予測された値を、逆変換またはアップミックスにおいて使用する。
よって、本実施の形態によれば、存在しないチャンネル間パラメータを予測することによって、空間イメージを保持することができる。
(実施の形態4)
本実施の形態について、図16−図19を用いて説明する。図16−図19において、各記号の意味は以下のとおりである。
{xi_sb}:複数のサブバンドに分割されたマルチチャンネル信号(これらは、周波数領域、時間領域、または周波数領域と時間領域とのハイブリッド領域における信号を表す)
{yi_sb}:複数サブバンドに分割されたダウンミックスまたは変換された信号(これらは{xi_sb}と同じ領域における信号である)
{Pi_sb}:各サブバンドで求められたチャンネル間パラメータ
{x i_sb}:{xi_sb}の復号信号
{y i_sb}:{yi_sb}の復号信号
{P i_sb}:復号チャンネル間パラメータ
本実施の形態では、冗長なパラメータの識別に開ループ法を用いる。本実施の形態では、変換またはダウンミックスされた原信号の特性を分析することによって、冗長なチャンネル間パラメータを識別して、これを符号化の対象から削除する。
図16に本実施の形態に係る音声符号化装置1600の構成を示す。
音声符号化装置1600において、チャンネル間パラメータ生成部1601が、入力信号{xi_sb}を、例えば、BCC、PCA等によって{yi_sb}に変換またはダウンミックスする。また、チャンネル間パラメータ生成部1601は、変換またはダウンミックスの過程において、チャンネル間パラメータ{Pi_sb}も生成する。
変換またはダウンミックスされた信号{yi_sb}は符号化部1602によって符号化される。
信号分析部1603は、変換またはダウンミックスされた信号{yi_sb}の信号特性を分析して、冗長なパラメータを識別する。
冗長パラメータ削除部1604は、冗長なパラメータを識別し、符号化の対象からそれらを削除する。
符号化部1605(チャンネル間パラメータ符号化部)は、冗長なパラメータを削除した後の残りのチャンネル間パラメータ{P‘i_sb}を符号化する。
多重化部1606は、{yi_sb}の符号化パラメータと{P‘i_sb}の符号化パラメータとを多重化してビットストリームを生成し、復号側に送信する。
図17を用いて、本実施の形態に係る符号化処理について説明する。
図17に示すように、変換またはダウンミックスされた信号の特性を、例えば、エネルギ分析、心理音響解析、またはビット割当分析等により分析する。分析を通じて、例えば、第2のサブバンドにおいて、変換またはダウンミックスされた信号が非常に弱いことが認識される。この場合、第2のサブバンドのチャンネル間パラメータを符号化する必要はない。よって、第2のサブバンドにおけるチャンネル間パラメータを冗長なパラメータとみなし、符号化の前にこのパラメータを符号化の対象から削除する。
サブバンド信号が十分に弱いか否かを判定するための方法は多数存在する。例えば、以下の2つの方法がある。しかし、本発明は以下の方法に限定されない。
<方法1>信号エネルギが、隣接するサブバンドと比較して非常に低い場合
この方法においては、各サブバンドのエネルギ{Esb}を計算する。各サブバンドについて、そのサブバンドと隣接するサブバンドとの間のエネルギ比を計算する。次いで、エネルギ比を何らかの所定の値Eth(Eth<1)と比較する。2つのエネルギ比の両方がEthより小さいならば、そのサブバンドの信号を弱いとみなす。例えば、第2のサブバンドにおいて、2つのエネルギ比E/EおよびE/Eを計算する。E/E<EthかつE/E<Ethであるならば、第2のサブバンドの信号を弱いとみなす。このとき第2のサブバンドにおけるチャンネル間パラメータを冗長なパラメータとみなす。
<方法2>サブバンドの信号がマスキング曲線に近い、または曲線より低い場合
この方法においては、各サブバンドについて、エネルギ{Esb}およびマスキング曲線レベル{Msb}を計算する。次いで、各サブバンドについて、マスキング曲線のレベルをサブバンドのエネルギと比較する。この場合、別のしきい値Mth(Mth>0)を定義することができる。サブバンドのエネルギがマスキング曲線より小さい、または曲線に近い場合、すなわちEsb<Msb+Mthである場合、そのサブバンドの信号を弱いとみなす。例えば、第2のサブバンドについて、サブバンドのエネルギEをマスキング曲線のレベルMと比較する。E<M+Mthであるならば、その第2のサブバンドの信号を弱いとみなす。その第2のサブバンドにおけるチャンネル間パラメータを冗長なパラメータとみなす。
図18に本実施の形態に係る音声復号装置1800の構成を示す。
音声復号装置1800において、分離部1801は、ビットストリームを分離する。
復号部1802は、{yi_sb}の符号化パラメータを復号して、変換またはダウンミックスされた信号{y i_sb}を生成する。
復号部1803(チャンネル間パラメータ復号部)は、{P‘i_sb}の符号化パラメータを復号して、復号チャンネル間パラメータ{Pi_sb}を生成する。
ゼロ値挿入部1804は、変換またはダウンミックスされた信号の復号後のスペクトルを分析し、チャンネル間パラメータが存在しないサブバンドを識別し、逆変換またはアップミックスをスムーズに行うことができるようにそのサブバンドにおいてゼロ値を挿入する。
チャンネル間パラメータ適用部1805は、チャンネル間パラメータ{P i_sb}によって表される空間情報を利用することによって、復号された信号{y i_sb}を逆変換またはアップミックスして{x i_sb}を生成する。
図19を用いて、本実施の形態に係る復号処理について説明する。
図19に示すように、復号スペクトルを生成した後、復号スペクトルを分析することによって、第2のサブバンドの復号された信号が非常に弱い(極端な場合、復号された信号が0である)ことが認識される。したがって、第2のサブバンドのチャンネル間パラメータが符号化されていないことが認識される。したがって、それ以外のサブバンドのチャンネル間パラメータのみを復号する。また、復号処理をスムーズにするために、第2のサブバンドの復号されたチャンネル間パラメータに0値を挿入する。チャンネル間パラメータが符号化されているか否かを復号側において判定する方法は、符号化側との一貫性が保たれるようにするために、符号化側における上記方法と同じである。
このように、本実施の形態によれば、開ループ法によって、冗長なパラメータを識別する。すなわち、変換またはダウンミックスされた原信号の特性を分析することによって、冗長なパラメータを識別する。
よって、本実施の形態によれば、局所復号部が必要なくなる。よって、本実施の形態は、局所復号部が利用できない条件において有効である。また、局所復号部が存在しないため、演算量を低減することができる。
(実施の形態5)
本実施の形態について、図20−図23を用いて説明する。図20−図23において、各記号の意味は以下のとおりである。
{xi_sb}:複数のサブバンドに分割されたマルチチャンネル信号(これらは、周波数領域、時間領域、または周波数領域と時間領域とのハイブリッド領域における信号を表す)
{yi_sb}:複数サブバンドに分割されたダウンミックスまたは変換された信号(これらは{xi_sb}と同じ領域における信号である)
{Pi_sb}:各サブバンドで求められたチャンネル間パラメータ
{x i_sb}:{xi_sb}の復号信号
{y i_sb}:{yi_sb}の復号信号
{P i_sb}:復号チャンネル間パラメータ
本実施の形態では、スケーラブルコーデックにおいて、冗長なパラメータを削除する。
図20に本実施の形態に係る音声符号化装置2000の構成を示す。
音声符号化装置2000において、チャンネル間パラメータ生成部2001が、入力信号{xi_sb}を、例えば、BCC、PCA等によって{yi_sb}に変換またはダウンミックスする。また、チャンネル間パラメータ生成部2001は、変換またはダウンミックスの過程において、チャンネル間パラメータ{Pi_sb}も生成する。
変換またはダウンミックスされた信号{yi_sb}はスケーラブルな符号化部2002によって符号化される。
スケーラブルな局所復号部2003は、変換またはダウンミックスされた信号の符号化品質を符号化側において認識することができるように、各レイヤの復号信号を生成する。
スケーラブルな冗長パラメータ削除部2004は、変換またはダウンミックスされた信号の符号化品質を分析することによって、冗長なパラメータを識別し、各レイヤの符号化対象からこれらのパラメータを削除する。
符号化部2005(チャンネル間パラメータ符号化部)は、冗長なパラメータを削除した後の残りのチャンネル間パラメータ{P‘i_sb}を符号化する。
多重化部2006は、{yi_sb}の符号化パラメータと{P‘i_sb}の符号化パラメータとを多重化してビットストリームを生成し、復号側に送信する。
図21を用いて、本実施の形態に係る符号化処理について説明する。
図21に示すように、変換またはダウンミックスされた信号のスペクトルを符号化および復号する。復号スペクトルを生成した後、復号スペクトルを分析する。例えば、図21では、レイヤ1において、第2のサブバンドの復号後の変換またはダウンミックスされた信号が非常に弱いため(極端な場合、第2のサブバンドがまったく符号化されないため)、復号後の信号が0であることが認識される。この場合、レイヤ1では第2のサブバンドのチャンネル間パラメータを符号化する必要はない。このため、レイヤ1では、第2のサブバンドにおけるチャンネル間パラメータを冗長なパラメータとみなし、符号化の前にこのパラメータを符号化の対象から削除する。
一方で、レイヤ2においては、第2のサブバンドの復号信号は弱くなく、生じうる音質の劣化を回避するため、チャンネル間パラメータを符号化する必要がある。このため、レイヤ2において初めて第2のサブバンドのチャンネル間パラメータを符号化する。
サブバンド信号が十分に弱いか否かを判定するための方法は多数存在する。例えば、以下の2つの方法がある。しかし、本発明は以下の方法に限定されない。
<方法1>信号エネルギが、隣接するサブバンドと比較して非常に低い場合
この方法においては、各サブバンドのエネルギ{Esb}を計算する。各サブバンドについて、そのサブバンドと隣接するサブバンドとの間のエネルギ比を計算する。次いで、エネルギ比を所定の値Eth(Eth<1)と比較する。2つのエネルギ比の両方がEthより小さいならば、そのサブバンドの信号を弱いとみなす。例えば、第2のサブバンドにおいて、2つのエネルギ比E/EおよびE/Eを計算する。E/E<EthかつE/E<Ethであるならば、第2のサブバンドの信号を弱いとみなす。第2のサブバンドにおけるチャンネル間パラメータを冗長なパラメータとみなす。
<方法2>サブバンドの信号がマスキング曲線に近い、または曲線より低い場合
この方法においては、各サブバンドについて、エネルギ{Esb}およびマスキング曲線レベル{Msb}を計算する。次いで、各サブバンドについて、マスキング曲線のレベルをサブバンドのエネルギと比較する。この場合、別のしきい値Mth(Mth>0)を定義することができる。サブバンドのエネルギがマスキング曲線より小さい、または曲線に近い場合、すなわちEsb<Msb+Mthである場合、そのサブバンドの信号を弱いとみなす。例えば、第2のサブバンドについて、サブバンドのエネルギEをマスキング曲線のレベルMと比較する。E<M+Mthであるならば、その第2のサブバンドの信号を弱いとみなす。その第2のサブバンドにおけるチャンネル間パラメータを冗長なパラメータとみなす。
図22に本実施の形態に係る音声復号装置2200の構成を示す。
音声復号装置2200において、分離部2201は、各レイヤにおいてビットストリームを分離する。
スケーラブルな復号部2202は、{yi_sb}の符号化パラメータを復号して、変換またはダウンミックスされた信号{y i_sb}を生成する。
復号部2203(チャンネル間パラメータ復号部)は、{P‘i_sb}の符号化パラメータを復号して、復号チャンネル間パラメータ{Pi_sb}を生成する。
ゼロ値挿入部2204は、各レイヤにおいて、変換またはダウンミックスされた信号の復号スペクトルを分析し、チャンネル間パラメータが存在しないサブバンドを識別し、逆変換またはアップミックスをスムーズに行うことができるようにそのサブバンドにおいてゼロ値を挿入する。
チャンネル間パラメータ適用部2205は、チャンネル間パラメータ{P i_sb}によって表される空間情報を利用することによって、復号された信号{y i_sb}を逆変換またはアップミックスして{x i_sb}を生成する。
図23を用いて、本実施の形態に係る復号処理について説明する。
図23に示すように、復号スペクトルを生成した後、復号スペクトルを分析することによって、レイヤ1においては、第2のサブバンドの復号信号が非常に弱い(極端な場合、復号信号が0である)ことが認識される。したがって、第2のサブバンドのチャンネル間パラメータが符号化されていないことが認識される。したがって、それ以外のサブバンドのチャンネル間パラメータのみを復号する。また、復号処理をスムーズにするために、第2のサブバンドの復号されたチャンネル間パラメータに0値を挿入する。
一方で、レイヤ2においては、第2のサブバンドの復号信号は弱くないため、第2のサブバンドのチャンネル間パラメータを復号する。
チャンネル間パラメータが符号化されているか否かを復号側において判定する方法は、符号化側との一貫性が保たれるようにするために、符号化側における上記方法と同じである。
このように、本実施の形態によれば、スケーラブル符号化の各レイヤにおいて、チャンネル間パラメータを符号化して送信する前に、サブバンド毎に、変換またはダウンミックスされた信号の特性を分析し、チャンネル間パラメータを送信する必要があるか否かを調べる。そして、送信する必要がないチャンネル間パラメータを識別して符号化の対象から削除する。一方、入力信号を生成するためにチャンネル間パラメータが必要であるレイヤの場合には、チャンネル間パラメータを送信する。
よって、本実施の形態によれば、チャンネル間パラメータが必要なレイヤのときにのみチャンネル間パラメータを送信するため、良好なビット割当を実現することができる。
2009年12月28日出願の特願2009−298321の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明は、音声符号化を行う通信装置、音声復号を行う通信装置、特に無線通信装置に好適である。
600 音声符号化装置
603 局所モノラル復号部
604 冗長パラメータ削除部
800 音声復号装置
804 ゼロ値挿入部

Claims (5)

  1. 複数のチャンネルの入力信号を主成分信号に変換するとともに、チャンネル間の信号の関係を示すチャンネル間パラメータをサブバンド毎に計算する変換手段と、
    前記主成分信号を符号化して符号化主成分信号を得る第1符号化手段と、
    前記符号化主成分信号を復号して復号主成分信号を得る復号手段と、
    前記復号主成分信号を用いて、前記サブバンドの前記チャンネル間パラメータから冗長なパラメータを削除する削除手段と、
    前記冗長なパラメータを削除された後のチャンネル間パラメータを符号化する第2符号化手段と、
    を具備する音声符号化装置。
  2. 前記変換手段が主成分分析により前記入力信号を前記主成分信号に変換し、
    前記チャンネル間パラメータが回転角である、
    請求項1記載の音声符号化装置。
  3. 前記削除手段が、各サブバンドのエネルギと隣接するサブバンドのエネルギとの比と、閾値とを比較し、前記エネルギ比が前記閾値より小さい場合に前記チャンネル間パラメータを削除する、
    請求項1記載の音声符号化装置。
  4. 前記削除手段が、各サブバンドのエネルギとマスキング曲線のレベルとを比較し、前記エネルギが前記マスキング曲線に近いまたは小さい場合に前記チャンネル間パラメータを削除する、
    請求項1記載の音声符号化装置。
  5. 複数のチャンネルの入力信号を主成分信号に変換するとともに、チャンネル間の信号の関係を示すチャンネル間パラメータをサブバンド毎に計算する変換ステップと、
    前記主成分信号を符号化して符号化主成分信号を得る第1符号化ステップと、
    前記符号化主成分信号を復号して復号主成分信号を得る復号ステップと、
    前記復号主成分信号を用いて、前記サブバンドの前記チャンネル間パラメータから冗長なパラメータを削除する削除ステップと、
    前記冗長なパラメータを削除された後のチャンネル間パラメータを符号化する第2符号化ステップと、
    を具備する音声符号化方法。
JP2011547334A 2009-12-28 2010-12-27 音声符号化装置および音声符号化方法 Expired - Fee Related JP5511848B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011547334A JP5511848B2 (ja) 2009-12-28 2010-12-27 音声符号化装置および音声符号化方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009298321 2009-12-28
JP2009298321 2009-12-28
PCT/JP2010/007553 WO2011080916A1 (ja) 2009-12-28 2010-12-27 音声符号化装置および音声符号化方法
JP2011547334A JP5511848B2 (ja) 2009-12-28 2010-12-27 音声符号化装置および音声符号化方法

Publications (2)

Publication Number Publication Date
JPWO2011080916A1 JPWO2011080916A1 (ja) 2013-05-09
JP5511848B2 true JP5511848B2 (ja) 2014-06-04

Family

ID=44226340

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011547334A Expired - Fee Related JP5511848B2 (ja) 2009-12-28 2010-12-27 音声符号化装置および音声符号化方法

Country Status (4)

Country Link
US (1) US8942989B2 (ja)
JP (1) JP5511848B2 (ja)
CN (1) CN102714036B (ja)
WO (1) WO2011080916A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015517121A (ja) * 2012-04-05 2015-06-18 ホアウェイ・テクノロジーズ・カンパニー・リミテッド インターチャネル差分推定方法及び空間オーディオ符号化装置
WO2014005327A1 (zh) * 2012-07-06 2014-01-09 深圳广晟信源技术有限公司 对多声道数字音频编码的方法
PL2933799T3 (pl) 2012-12-13 2017-12-29 Panasonic Intellectual Property Corporation Of America Urządzenie kodujące głos, urządzenie dekodujące głos, sposób kodowania głosu i sposób dekodowania głosu
JP6139419B2 (ja) * 2014-01-06 2017-05-31 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法、およびプログラム
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
FR3048808A1 (fr) * 2016-03-10 2017-09-15 Orange Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal
CN108694955B (zh) * 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
GB2575305A (en) * 2018-07-05 2020-01-08 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8330885D0 (en) * 1983-11-18 1983-12-29 British Telecomm Data transmission
JP3328532B2 (ja) * 1997-01-22 2002-09-24 シャープ株式会社 デジタルデータの符号化方法
JP3576935B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数間引き装置、周波数間引き方法及び記録媒体
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
ES2341327T3 (es) * 2002-04-10 2010-06-18 Koninklijke Philips Electronics N.V. Codificacion y decodificacion de señales audio multicanal.
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
CN1973320B (zh) * 2004-04-05 2010-12-15 皇家飞利浦电子股份有限公司 立体声编码和解码的方法及其设备
CN1942929A (zh) * 2004-04-05 2007-04-04 皇家飞利浦电子股份有限公司 多信道编码器
RU2396608C2 (ru) 2004-04-05 2010-08-10 Конинклейке Филипс Электроникс Н.В. Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема
WO2005098824A1 (en) 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
CN102122509B (zh) 2004-04-05 2016-03-23 皇家飞利浦电子股份有限公司 多信道解码器和多信道解码方法
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
WO2007104882A1 (fr) * 2006-03-15 2007-09-20 France Telecom Dispositif et procede de codage par analyse en composante principale d'un signal audio multi-canal
FR2898725A1 (fr) * 2006-03-15 2007-09-21 France Telecom Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale
US8204237B2 (en) * 2006-05-17 2012-06-19 Creative Technology Ltd Adaptive primary-ambient decomposition of audio signals
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
JPWO2008132826A1 (ja) * 2007-04-20 2010-07-22 パナソニック株式会社 ステレオ音声符号化装置およびステレオ音声符号化方法
CN101802907B (zh) * 2007-09-19 2013-11-13 爱立信电话股份有限公司 多信道音频的联合增强
JP5383676B2 (ja) * 2008-05-30 2014-01-08 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
WO2010084756A1 (ja) * 2009-01-22 2010-07-29 パナソニック株式会社 ステレオ音響信号符号化装置、ステレオ音響信号復号装置およびそれらの方法
WO2011052221A1 (ja) * 2009-10-30 2011-05-05 パナソニック株式会社 符号化装置、復号装置、およびそれらの方法

Also Published As

Publication number Publication date
JPWO2011080916A1 (ja) 2013-05-09
CN102714036A (zh) 2012-10-03
US20120259622A1 (en) 2012-10-11
CN102714036B (zh) 2014-01-22
WO2011080916A1 (ja) 2011-07-07
US8942989B2 (en) 2015-01-27

Similar Documents

Publication Publication Date Title
JP5511848B2 (ja) 音声符号化装置および音声符号化方法
JP6170520B2 (ja) オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置
KR101452722B1 (ko) 신호 부호화 및 복호화 방법 및 장치
JP5485909B2 (ja) オーディオ信号処理方法及び装置
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
EP3093843B1 (en) Mpeg-saoc audio signal decoder, mpeg-saoc audio signal encoder, method for providing an upmix signal representation using mpeg-saoc decoding, method for providing a downmix signal representation using mpeg-saoc decoding, and computer program using a time/frequency-dependent common inter-object-correlation parameter value
KR101253699B1 (ko) 주파수 영역 위너 필터링을 사용한 공간 오디오 코딩을위한 시간적 엔벨로프 정형화
JP5753540B2 (ja) ステレオ信号符号化装置、ステレオ信号復号装置、ステレオ信号符号化方法及びステレオ信号復号方法
JP5930441B2 (ja) マルチチャネルオーディオ信号の適応ダウン及びアップミキシングを実行するための方法及び装置
US9489962B2 (en) Sound signal hybrid encoder, sound signal hybrid decoder, sound signal encoding method, and sound signal decoding method
JP6289613B2 (ja) オブジェクト特有時間/周波数分解能を使用する混合信号からのオーディオオブジェクト分離
JP2014063202A (ja) マルチチャネルの符号化及び復号化方法並びに装置
KR20230020553A (ko) 스테레오 오디오 인코더 및 디코더
JP2012512441A (ja) ピーク検出に基づいた選択型スケーリングマスク演算
KR101837686B1 (ko) 공간적 오디오 객체 코딩에 오디오 정보를 적응시키기 위한 장치 및 방법
WO2012004998A1 (ja) スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法
WO2024051954A1 (en) Encoder and encoding method for discontinuous transmission of parametrically coded independent streams with metadata
WO2024052499A1 (en) Decoder and decoding method for discontinuous transmission of parametrically coded independent streams with metadata
Li et al. Efficient stereo bitrate allocation for fully scalable audio codec

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140325

R151 Written notification of patent or utility model registration

Ref document number: 5511848

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees