JP2004509367A - 複数チャネル信号の符号化及び復号化 - Google Patents
複数チャネル信号の符号化及び復号化 Download PDFInfo
- Publication number
- JP2004509367A JP2004509367A JP2002527493A JP2002527493A JP2004509367A JP 2004509367 A JP2004509367 A JP 2004509367A JP 2002527493 A JP2002527493 A JP 2002527493A JP 2002527493 A JP2002527493 A JP 2002527493A JP 2004509367 A JP2004509367 A JP 2004509367A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- inter
- correlation
- subsequent
- codebook
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Abstract
Description
【発明の属する技術分野】
本発明は、ステレオ音響信号等の複数チャネル信号の符号化と復号化に関する。
【0002】
【従来の技術及び発明が解決しようとする課題】
従来の音声符号化方法は、単一チャネルの音声信号を基本としているのが一般的である。常設の電話機と移動電話機との間の接続において利用される音声符号化はその一例である。音声符号化は、周波数が制限された空中電波インタフェース上で帯域幅利用を縮減するために無線リンク上で利用される。よく知られた音声符号化の例としては、PCM(Pulse Code Modulation)、ADPCM(Adaptive Differential Pulse Code Modulation)、サブ−バンド符号化(sub−band coding)、変換符号化(transform coding)、LPC(Linear Predictive Coding)の音声作動符号化、及びハイブリッド符号化、例えばCELP(Code−Excited Linear Predictive)符号化のようなものなどがある[参考文献1−2]。
【0003】
例えばステレオのスピーカと2つのマイクロホン(ステレオ・マイクロホン)を有するコンピュータ・ワークステーションのように、音響/音声通信で一入力信号より多くの入力信号を使う環境においては、ステレオ信号を伝送するために2つの音響/音声チャネルが必要とされる。複数チャネルを使う環境の他の例としては、2チャネル、3チャネル若しくは4チャネルの入力/出力を備えた会議室が挙げられることになろう。この種のアプリケーションは、インターネット上や第3世代の移動電話システムにおいて利用されることが予想されている。
【0004】
通信システムにおいては、音声符号器のために利用可能な総ビットレートは、異なるリンクの能力に応じて定められる。無線リンクの高インタフェースまたは固定リンクのネットワークオーバーロードなどある特定の状況においては、利用可能なビットレートが減少する場合がある。ステレオ通信状態では、これは、パケットロス/誤ったフレームまたはマルチモード符号器については両チャネルのビットレートの低下を意味し、いずれの場合においても、両チャネルの質の低下を意味する。
【0005】
さらなる問題は、ステレオ可能端末の配置である。全ての音響通信端末は、アダプティブマルチレート(AMR)音声符号化/復号化等の単一チャネルを使用し、ステレオ端末のフォールバックモードは、単一チャネルである。関係者が複数のステレオ会議(例えばマルチキャストセッション)において1つの単一端末だと、相互運用性が必要となるため、ステレオ符号化の利用と高品質は制限されるであろう。
【0006】
複数チャネルの線形予測合成分析(LPAS)信号符号化/復号化のための一般的な原則が参考文献3に記載されている。しかし、記載された符号器には上記の問題に対応できるほどの柔軟性がない。
【課題を解決するための手段】
【0007】
本発明の目的は、チャネル間信号相関を活用し、組み込まれたビットストリームを維持する、効率的な複数チャネルLPAS音声符号化構造を見出すことである。
【0008】
さらなる目的は、任意の平均ビットレートで同一またはより良い音質を維持しつつ、Mチャネル音声信号につき、平均して、単一チャネル音声符号器のビットストリームをM倍少ないビットストリームを作成することである。
【0009】
他の課題は、合理的実施と、該構造の中で符号器を実現するための計算の複雑性である。
【0010】
上記の目的は、付属の請求項により解決される。
【0011】
簡潔に言えば、本発明は、複数チャネル符号化ビットストリームに単一チャネルを組み込み、様々なリンク品質等が原因する様々な総ビットレートに関連する品質上の課題を克服することに関する。これらの構成により、総ビットレートを減少させる必要性があれば、組み込まれた単一チャネルビットストリームが維持され、他方のチャネルが無視される。すると、通信は、より低い総ビットレートを有する単一符号化操作へ「バックオフ」することになるが、依然として高い単一クオリティを維持し続ける。いかなる通信地点においても「ステレオ」ビットを落とすことは可能であるし、無線通信シナリオでのより高い信頼性のためにより多くのチャネル符号化ビットを付加することができる。「ステレオ」ビットは、受信側の能力に応じて落とすこともできる。複数関係者による会議における一関係者の受信側に単一復号器がある場合、もう一方の側のビットストリームを落とすことによって、組み込まれた単一ビットストリームを使用できる。
【0012】
以下の添付図面と共に述べられる説明を参照すれば、本発明を最もよく理解することができる。また、これと同時に、本発明のさらなる目的と有効性についても、以下の添付図面と共に述べられる説明を参照することによって最もよく理解することができる。
【0013】
以下の説明において、同等または類似の要素には同一の参照番号を付した。
【0014】
【発明の実施の形態】
従来の単一チャネルの線形予測合成分析(LPAS)音声符号器と一般的な複数チャネル線形予測合成分析音声符号器(参考文献3)の説明を通じて本発明を説明していく。
【0015】
図1は、従来の単一チャネルLPAS音声符号器のブロック図である。この符号器は、2つの部分、すなわち、合成部と分析部とを具備している(これに対応する復号器は、合成部のみを有する)。
【0016】
合成部は、LPC合成フィルタ12を具備しており、そのLPC合成フィルタ12は、励振信号i(n)を受けて合成音声信号s^(n)を出力する(ここで、「s^(n)」は、上に^を付したsと(n)とを併記した図中の符号を指す)。励振信号i(n)は、2つの信号u(n)とv(n)を加算器22で加算することによって形成される。信号u(n)は、固定コードブック(fixed codebook)16からの信号f(n)をゲイン要素20におけるゲインgFでスケーリングすることによって形成される。信号v(n)は、適応コードブック(adaptive codebook)14からの励振信号i(n)の(遅延“lag”で)遅延されたものをゲイン要素18におけるゲインgAでスケーリングすることによって形成される。適応コードブックは、遅延要素24を含むフィードバック・ループによって形成され、その遅延要素24が励振信号i(n)を一サブフレームの長さNだけ遅延させるものとなっている。これにより、適応コードブックは、コードブック内にシフトされた過去の励振信号i(n)を有することになる(最も古い励振はコードブック外へシフトされて破棄される)。LPC合成フィルタのパラメータは、一般に20ms〜40msのフレーム毎にアップデートされるのに対し、適応コードブックは、5ms〜10msのサブフレーム毎にアップデートされる。
【0017】
LPAS符号器の分析部は、入来する音声信号s(n)のLPC分析を実行し、かつ、励振分析も実行する。
【0018】
LPC分析はLPC分析フィルタ10によって実行される。このフィルタは、音声信号s(n)を受け、その信号のパラメトリック・モデル(parametric model)をフレームベースで構築する。モデルのパラメータは、実際の音声フレームのベクトルとモデルによって生成される対応信号のベクトルとの差で形成される残差ベクトルのエネルギーを最小とするように選択される。モデルの各パラメータは、分析フィルタ10のフィルタ係数によって表される。それらのフィルタ係数は、フィルタの伝達関数A(z)を定める。合成フィルタ12の伝達関数は少なくとも近似的には1/A(z)に等しいため、それらのフィルタ係数はさらに、破線の制御線で示したように、合成フィルタ12を制御するものとなっている。
【0019】
励振分析は、音声信号ベクトル{s(n)}と最も適した合成信号ベクトル{s^(n)}を生じさせる、固定コードブックベクトル(コードブックのインデックス)、ゲインgF、適応コードブックベクトル(遅延)及びゲインgAの、最良の組合せを決定するために実行される(ここで、{}は、ベクトルないしフレームを形成するサンプルを収集したものを表す)。これは、それらのパラメータのすべての可能な組合せをテストする全数探索においてなされる(いくつかのパラメータを他のパラメータとは独立して定め、かつ、残ったパラメータの探索中それらを固定しておく準最適(sub−optimal)探索方式を採ることも可能である)。合成ベクトル{s^(n)}が対応する音声ベクトル{s(n)}にどのくらい近いかをテストするため、(加算器26で形成された)差ベクトル{e(n)}のエネルギーをエネルギー計算器30で計算することとしてもよい。しかし、重み付けされた誤差信号のベクトル{ew(n)}においては、大きい誤差を大きい振幅の周波数帯域(large amplitude frequency bands)によってマスクするような形態で誤差が再配分(re−distribute)されており、この重み付けされた誤差信号のベクトル{ew(n)}のエネルギーを考慮する方がより効率的である。これは、重み付けフィルタ28で行われる。
【0020】
次に、図1の単一チャネルLPAS符号器を参考文献3の記載に基づいて複数チャネルLPAS符号器とする変形について、図2〜図3を参照して説明する。音声信号として2つのチャネルの(ステレオの)音声信号を想定して説明を行うが、2つより多くのチャネルについて同様の原理を利用することとしてもよい。
【0021】
図2は、参考文献3に記載の複数チャネルLPAS音声符号器の分析部の一実施形態を示したブロック図である。図2においては、入力信号が信号成分s1(n)、s2(n)で示されているように複数チャネルの信号となっている。図1におけるLPC分析フィルタ10は、マトリクス値伝達関数行列A(z)を有するLPC分析フィルタ・ブロック10Mで置き換えられている。同様に、加算器26、重み付けフィルタ28、エネルギー計算器30は、それぞれ対応する複数チャネル用のブロック26M、28M、30Mによって置き換えられている。
【0022】
図3は、参考文献3に記載の複数チャネルLPAS音声符号器の合成部の一実施形態を示したブロック図である。複数チャネルの復号器もまた、このような合成部によって構成することとしてもよい。ここでは、図1におけるLPC合成フィルタ12が、マトリクス値伝達関数行列A−1(z)を有するLPC合成フィルタ・ブロック12Mで置き換えられている。この伝達関数行列A−1(z)は、(その表記文字記号が示すように)少なくとも近似的には行列A(z)の逆行列に等しいものとなっている。同様に、加算器22、固定コードブック16、ゲイン要素20、遅延要素24、適応コードブック14、ゲイン要素18は、それぞれ対応する複数チャネル用のブロック22M、16M、24M、14M、18Mによって置き換えられている。
【0023】
本発明に従って組み込まれた複数チャネルLPAS符号器のついての以下の記載により、様々なブロックにおいて符号化の柔軟性がどのように改善されたかが明らかにされている。しかし、全てのブロックを記載された方法で構成しなくてはならないわけではない。符号化の柔軟性と複雑性とのバランスは個別の符号器の態様に応じて定められなくてはならない。
【0024】
図4は、本発明の複数チャネルLPAS音声符号器の合成部の実施態様の一例を示したブロック図である。
【0025】
符号器の本質的特徴は、マルチパート固定コードブックの構造である。それには各チャネルについての個別の固定コードブックFC1、FC2が含まれている。典型的には、固定コードブックは、代数的なコードブックを具備し、該コードブックにおいて、ある規則に従ってそれぞれのベクトルに配分されたユニットパルスにより励振ベクトルが形成される(これは当業者にとって周知であるから、本書ではさらに詳述しない)。各固定コードブックFC1、FC2は、個別のゲインgF1、gF2に関連している。本発明の本質的な特徴は、固定コードブックの一つ、典型的には最も強いまたは先頭の(単一の)チャネルに関連しているコードブックが、一遅延要素D(整数または分数であってもよい)にわたるより弱いまたは後続のチャネルと、チャネル間のゲインgF12とによって共有される点である。
【0026】
各チャネルが同一信号をスケーリングし変換したチャネルからなる理想的な場合(エコーがない空間)、先頭チャネルの共有コードブックが必要とされるのみであり、遅延値Dは、音伝搬時間に直接対応している。チャネル間の相互相関が非常に低い、上記と反対の場合では、後続チャネルのための個別の固定コードブックが必要とされる。
【0027】
固定コードブックにクロスチャネルブランチが1つだけの場合、先頭チャネルと後続チャネルはフレームごとに定められなければならない。先頭チャネルは変わりうるので、遅延DとゲインgF12を適切なチャネルに関連させるための同調的に制御されたスイッチSW1とSW2がある。図4の構成では、チャネル1が先頭チャネルであり、チャネル2が後続チャネルである。両スイッチSW1とSW2をそれらの正反対の状態に切り替えることによって、役割が逆転される。先頭チャネルの重たい切り替えを回避するために、多数の連続フレームのために同一の先頭チャネルが選択されている場合のみ変更を可能とすることが必要となる。
【0028】
あるいは、後続チャネル固定コードブックのためのパルスの使用を先頭チャネル固定コードブックのパルスより少なくしてもよい。この実施態様では、固定コードブックの長さは、チャネルが後続チャネルに降格すると小さくなり、先頭チャネルに戻ると当初の大きさに戻される。
【0029】
図4は、2チャネル固定コードブック構造を図示しているが、各コードブックの数と遅延及びチャネル間のゲインの数を増加させることによって、この概念はより多くのチャネルに対して容易に一般化できることが理解されなければならない。
【0030】
先頭チャネルと後続チャネルの固定コードブックは、典型的には連続して順番に調べられる。好適な順序としては、第一に先頭チャネル固定コードブック励振ベクトル、遅延及びゲインを決定し、その後、後続チャネルの個別の固定コードブックベクトルとゲインを決定する。
【0031】
図5は、本発明のマルチパート固定コードブックの実施態様のフローチャートである。ステップS1は(最大のフレームエネルギーを有するチャネル)先頭チャネル、典型的には最も強いチャネルを判断し符号化する。ステップS2は、所定の間隔(例えば完全な一フレームの一部分)の各後続チャネルと先頭チャネルの間の相互相関を判断する。ステップS3は、各後続チャネルについての遅延候補を記憶する。これらの遅延候補は、多数の最高の相互相関のピークの位置と、各後続チャネルについての各ピークのまわりの最も近傍の位置によって定義される。例えば3つの最高ピークを選択し、各ピークの両側の最も近い位置を付加することによって、後続チャネルについて総計9つの遅延候補を与えることになる。高分解(分数)遅延を使用した場合は、各ピークのまわりの候補数を、例えば5ないし7に増加できる。より高い分解は入力信号のアップサンプリングによって得ることができる。ステップS4は、最高の遅延組み合わせを選択する。ステップS5は、最適のチャネル間ゲインを判断する。最後にステップS6は、後続チャネルの励振とゲインを判断する。
【0032】
固定コードブックゲインについては、各後続チャネルは、先頭チャネル固定コードブックに対して1チャネル間ゲインを必要とし、個別コードブックについては1ゲインを必要とする。これらのゲインは、典型的にはチャネル間で著しい相関関係を有している。これらはまた適応コードブックのゲインと相関付けられる。従ってこれらのゲインのチャネル間予測が可能である。
【0033】
図4に戻り、マルチパート適応コードブックは、各チャネルにつき1つの適応コードブックAC1、AC2を含む。マルチパート適応コードブックは複数チャネル符号器において多数の方法で構成されうる。例えば:
1.全てのチャネルはシングルピッチの遅延を共有する。各チャネルは、予測を改善するために個別にピッチゲインgA11、gA22を有してもよい。共有ピッチの遅延は、閉じられたループの態様で先頭(単一)チャネルで探索され、その後後続チャネルで使用される。
2.チャネルは、個別のピッチの遅延P11、P22を有する。後続チャネルのピッチ遅延値は、先頭チャネルのピッチ遅延と異なるように、または独立して、符号化されうる。後続チャネルのピッチ遅延の探索は、先頭(単一)チャネルのピッチ遅延値の周りでなされる。
3.励振履歴をチャネル横断の態様で使用することができる。遅延距離P12で先頭チャネル1からの励振履歴を有する予測チャネル2等の1個のチャネル横断励振ブランチを使用することができる。同調的に制御されたスイッチSW3とSW4は、どのチャネルが先頭なのかに応じて、チャネル横断励振を適切な加算器AA1、AA2に、チャネル横断ゲインgA12を通じて接続する。
【0034】
固定コードブックに関する場合のように、記載された適応コードブックの構造は非常に柔軟で、マルチモード操作に適している。共有ピッチ遅延または個別のピッチ遅延を使用するか否かの選択は残差信号エネルギーに基づいてもよい。第一のステップでは、最適な共有ピッチ遅延の残差エネルギーが決定される。第二のステップでは、最適な個別のピッチ遅延の残差エネルギーが決定される。共有ピッチ遅延の場合の残差エネルギーが個別のピッチ遅延の場合の残差エネルギーよりも所定量超過している場合、個別のピッチ遅延が使用される。そうでない場合は、共有ピッチ遅延が使用される。希望であれば、決定を円滑にするためにエネルギー差の平均移動を用いてもよい。
【0035】
この方策は、共有ピッチ遅延か個別のピッチ遅延かを決定するための「閉ループ」方法と考えることができる。あるいは、チャネル間相関等に基づく「開ループ」方法も可能である。この場合、チャネル間相関が所定の閾値を越える場合、共有ピッチ遅延が使用される。そうでない場合は、個別のピッチ遅延が使用される。
【0036】
チャネル間のピッチ遅延を使用するか否かを決定するために同様の方法を使用することができる。
【0037】
さらに、異なるチャネル間の適応コードブックゲインの間で重要な相関が期待されている。これらのゲインは、チャネルの内部ゲイン履歴から、他のチャネルに属する同一フレームのゲインから、及び固定コードブックゲインからも予測されうる。
【0038】
図4のLPC合成フィルタ・ブロック12Mでは、各チャネルは個別のLPC(線形予測符号化)フィルタを使用する。これらのフィルタは、単一チャネルの場合と同様の方法で個別に駆動することができる。しかし、チャネルの一部または全部が同一LPCフィルタを共有することもできる。これによって、LPCスペクトル間のスペクトル距離等の信号特性に応じて、複数フィルタモードと単一フィルタモードとを切り替えることができる。チャネル間予測をLSP(線スペクトル対)パラメータのために使用すると、該予測は低相関モードのために停止されるかまたは低減される。
【0039】
図6は、本発明の複数チャネルLPAS音声符号器の分析部の実施態様の一例を示すブロック図である。図1と図2を参照しながらすでに説明したブロックに加えて、図6に記載の分析部は、複数モード分析ブロック40を含む。ブロック40は、先頭チャネルの固定コードブック、遅延D及びゲインgF12のみを使用した後続チャネルの符号化を正当化するのに後続チャネルと先頭チャネルの間に十分な相関があるか否かを判断するために、チャネル間の相関を判断する。もしそうでない場合は、後続チャネルのために個別の固定コードブックとゲインを使用することが必要となるであろう。該相関は、時間ドメインにおける通常の相関、つまり、第二のチャネル信号を第一の信号に最も良く適合するまでシフトすることによって判断することができる。2つ以上のチャネルが存在する場合には、最小相関値が所定の閾値を超過したときに先頭チャネル固定コードブックが共有固定コードブックとして使用されることになる。あるいは、先頭チャネルに対する相関が所定の閾値を超過するチャネルのために共有固定コードブックを使用し、残りのチャネルのために個別の固定コードブックを使用してもよい。正確な閾値はリスニングテストによって判断される。
【0040】
本発明の上記に記載の実施態様の様々な要素の機能は、典型的には一または複数のマイクロプロセッサまたはマイクロ/信号プロセッサの組合せ、及びこれに対応するソフトウェアによって実行される。
【0041】
図面において、幾つかのブロック及びパラメータは任意のものであり、複数チャネル信号の特性及び音声品質の全体的な要求基準に応じて使用することができる。符号器のビットは、それらが最も必要とされている所に割り当てることができる。符号器は、フレームごとに選択してLPC部分、適応及び固定コードブックの間に様々にビットを分配する。これは、チャネル内マルチモード操作の一例である。
【0042】
マルチモード操作のさらなる例は、符号器のビットをチャネル間に分配するということ(非対称符号化)である。これは、チャネル間マルチモード操作と称される。ここでの一例は、一/複数のチャネルまたは一チャネルにおける複数のビットで符号化された符号器ゲインのためのより大きな固定コードブックであろう。ソース信号特性を効率的に活用するために該2つのマルチモード操作例を組み合わせることができる。
【0043】
該マルチモード操作は、閉ループ態様でまたは開ループ方法で制御することができる。閉ループ方法は、各モードについての残差符号化エラーに応じてモードを判断する。これは計算上、金のかかる方法である。開ループ方法では、符号化モードは、入力信号特性に基づく決定によって判断される。チャネル内の場合は、参考文献4に記載されたように、音声、スペクトル特性及び信号エネルギー等に基づいて、可変レートモードが判断される。チャネル間モードの決定のためには、チャネル間相互相関関数またはスペクトル距離関数が使用されモードが決定される。ノイズまたは無声符号化のためには、周波数ドメインにおける複数チャネル相関特性を使用することがより適切である。開ループと閉ループ技術の組み合わせも可能である。開ループ分析は、複数の候補モードを決定し、これらは符号化され、そして閉ループ決定時に最終残差エラーが使用される。
【0044】
(先頭チャネルと後続チャネルの間の)複数チャネル予測は、複数チャネルLPASゲイン及びLPCパラメータのために必要なビット数を減らすための高チャネル間相関モードのために使用することができる。
【0045】
一般化されたLPAS(参考文献5参照)としてすでに知られている技術を本発明の複数チャネルLPAS符号器に使用することもできる。簡単にいうと、この技術は実際の符号化前のフレームごとの入力信号の前処理に関係している。複数の可能性ある修正信号を検査し、最小の歪みで符号化されうる信号が符号化されるべき信号として選択される。
【0046】
上記の説明は主として符号器を対象としている。これに対応する復号器は、このような符号器の合成部を含むのみでありうる。典型的には、符号器/復号器の組み合わせは、帯域幅制限通信チャネル上で符号化信号を伝送/受信する端末において使用される。端末は、携帯電話または基地局の無線端末であってもよい。そのような端末は、アンテナ、増幅器、イコライザ、チャネル符号器/復号器等の他の様々な要素も含みうる。しかし、これらの要素は、本発明を説明するために重要ではないので、その説明は省略されている。
【0047】
本発明の範囲から逸脱することなく、本発明に対して様々な変形や変更がなされ得るのは、当業者に理解されるところであり、本発明の範囲は特許請求の範囲の記載によって定められる。
【0048】
参考文献
[1] A. Gersho, “Advances in Speech and Audio Compression”, Proc. of the IEEE, Vol. 82, No. 6, pp 900−918, June 1994,
[2] A. S. Spanias, “Speech Coding: A Tutorial Review”, Proc. of the IEEE, Vol 82, No. 10, pp 1541−1582, Oct 1994.
[3] WO00/19413(Telefonaktiebolaget LM Ericsson).
[4] Allen Gersho et.al, ”Variable rate speech coding for cellular networks”, page 77−84, Speech and audio coding for wireless and network applications, Kluwer Academic Press, 1993.
[5] Bastiaan Kleijn et.al, ”Generalized analysis−by−synthesis coding and its application to pitch prediction”, page 337−340, In Proc. IEEE Int. Conf. Acoust., Speech and Signal Processing, 1992.
【図面の簡単な説明】
【図1】従来の単一チャネルLPAS音声符号器のブロック図である。
【図2】従来の複数チャネルLPAS音声符号器の分析部の一実施態様を示したブロック図である。
【図3】従来の複数チャネルLPAS音声符号器の合成部の一実施態様を示したブロック図である。
【図4】本発明の複数チャネルLPAS音声符号器の分析部の実施態様の一例を示したブロック図である。
【図5】マルチパート固定コードブックの探索方法の実施態様の一例のフローチャートである。
【図6】本発明の複数チャネルLPAS音声符号器の分析部の実施態様の一例を示したブロック図である。
Claims (26)
- 先頭チャネルと少なくとも1つの後続チャネルを決定するステップと;
組み込まれたビットストリームとして該先頭チャネルを符号化するステップと;
後続チャネルを無視できるビットストリームとして符号化するステップ
を含む複数チャネル線形予測分析合成信号符号化方法。 - 該先頭チャネルとのチャネル間相関に応じて、後続チャネル符号化モードを選択するステップを含む、請求項1に記載の方法。
- 選択可能な符号化モードでは、結果として固定された総ビットレートが得られる、請求項2に記載の方法。
- 選択可能な符号化モードでは、結果として可変的総ビットレートが得られうる、請求項2に記載の方法。
- 低チャネル間相関のために、チャネル特定LPCフィルタを使用するステップと;
高チャネル間相関のために該先頭チャネルLPCフィルタを共有するステップを含む、請求項2ないし4のいずれか1項に記載の方法。 - 低チャネル間相関のために、チャネル特定固定コードブックを使用するステップと;
高チャネル間相関のために該先頭チャネル固定コードブックを共有するステップを含む、請求項2ないし4のいずれか1項に記載の方法。 - 該先頭チャネル固定コードブックから各後続チャネルまでのチャネル間遅延を使用するステップを含む、請求項6に記載の方法。
- チャネル間相関に応じて、後続チャネル固定コードブックと該先頭チャネル固定コードブックとにビットを適応的に配分するステップを含む、請求項2ないし4のいずれか1項に記載の方法。
- 低チャネル間相関のために、チャネル特定適応コードブック遅延を使用するステップと;
高チャネル間相関のために共有適応コードブック遅延を使用するステップを含む、請求項2ないし4のいずれか1項に記載の方法。 - 該先頭チャネル適応コードブックから各後続チャネルまでのチャネル間適応コードブック遅延を使用するステップを含む、請求項9に記載の方法。
- 先頭チャネルと少なくとも1つの後続チャネルを決定する手段と;
組み込まれたビットストリームとして該先頭チャネルを符号化する手段と;
後続チャネルを無視できるビットストリームとして符号化する手段
を含む複数チャネル線形予測分析合成信号符号器。 - 該先頭チャネルとのチャネル間相関に応じて、後続チャネル符号化モードを選択する手段を含む、請求項11に記載の符号器。
- 低チャネル間相関のためのチャネル特定LPCフィルタと;
高チャネル間相関のための共有先頭チャネルLPCフィルタを含む、請求項12に記載の符号器。 - 低チャネル間相関のためのチャネル特定固定コードブックと;
高チャネル間相関のための共有先頭チャネル固定コードブックを含む、請求項12に記載の符号器。 - 該先頭チャネル固定コードブックから各後続チャネルまでのチャネル間遅延を含む、請求項14に記載の符号器。
- チャネル間相関に応じて、後続チャネル固定コードブックと該先頭チャネル固定コードブックとにビットを適応的に配分するための手段を含む、請求項12に記載の符号器。
- 低チャネル間相関のためのチャネル特定適応コードブック遅延と;
高チャネル間相関のための共有適応コードブック遅延を含む、請求項12に記載の符号器。 - 該先頭チャネル適応コードブックから各後続チャネルまでのチャネル間適応コードブック遅延を含む、請求項17に記載の符号器。
- 先頭チャネルと少なくとも1つの後続チャネルを決定する手段と;
組み込まれたビットストリームとして該先頭チャネルを符号化する手段と;
後続チャネルを無視できるビットストリームとして符号化する手段
を含む複数チャネル線形予測分析合成信号符号器を具備した端末。 - 該先頭チャネルとのチャネル間相関に応じて、後続チャネル符号化モードを選択する手段を含む、請求項19に記載の端末。
- 低チャネル間相関のためのチャネル特定LPCフィルタと;
高チャネル間相関のための共有先頭チャネルLPCフィルタを含む、請求項20に記載の端末。 - 低チャネル間相関のためのチャネル特定固定コードブックと;
高チャネル間相関のための共有先頭チャネル固定コードブックを含む、請求項20に記載の端末。 - 該先頭チャネル固定コードブックから各後続チャネルまでのチャネル間遅延を含む、請求項22に記載の端末。
- チャネル間相関に応じて、後続チャネル固定コードブックと該先頭チャネル固定コードブックとにビットを適応的に配分するための手段を含む、請求項20に記載の端末。
- 低チャネル間相関のためのチャネル特定適応コードブック遅延と;
高チャネル間相関のための共有適応コードブック遅延を含む、請求項20に記載の端末。 - 該先頭チャネル適応コードブックから各後続チャネルまでのチャネル間適応コードブック遅延を含む、請求項25に記載の端末。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0003287A SE519985C2 (sv) | 2000-09-15 | 2000-09-15 | Kodning och avkodning av signaler från flera kanaler |
PCT/SE2001/001886 WO2002023529A1 (en) | 2000-09-15 | 2001-09-05 | Multi-channel signal encoding and decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004509367A true JP2004509367A (ja) | 2004-03-25 |
JP4498677B2 JP4498677B2 (ja) | 2010-07-07 |
Family
ID=20281034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002527493A Expired - Fee Related JP4498677B2 (ja) | 2000-09-15 | 2001-09-05 | 複数チャネル信号の符号化及び復号化 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7263480B2 (ja) |
EP (1) | EP1325495B1 (ja) |
JP (1) | JP4498677B2 (ja) |
AT (1) | ATE358317T1 (ja) |
AU (1) | AU2001286350A1 (ja) |
DE (1) | DE60127566T2 (ja) |
SE (1) | SE519985C2 (ja) |
WO (1) | WO2002023529A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006035705A1 (ja) * | 2004-09-28 | 2006-04-06 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置およびスケーラブル符号化方法 |
JP4812230B2 (ja) * | 2000-09-15 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 複数チャネル信号の符号化及び復号化 |
JP4809370B2 (ja) * | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル音声符号化における適応ビット割り当て |
US9626973B2 (en) | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3273599B2 (ja) * | 1998-06-19 | 2002-04-08 | 沖電気工業株式会社 | 音声符号化レート選択器と音声符号化装置 |
FI121583B (fi) * | 2002-07-05 | 2011-01-14 | Syslore Oy | Symbolijonon etsintä |
KR101183857B1 (ko) * | 2004-06-21 | 2012-09-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치 |
EP1763017B1 (en) * | 2004-07-20 | 2012-04-25 | Panasonic Corporation | Sound encoder and sound encoding method |
JP4963962B2 (ja) * | 2004-08-26 | 2012-06-27 | パナソニック株式会社 | マルチチャネル信号符号化装置およびマルチチャネル信号復号装置 |
CN101031960A (zh) | 2004-09-30 | 2007-09-05 | 松下电器产业株式会社 | 可扩展性编码装置和可扩展性解码装置及其方法 |
EP1814104A4 (en) * | 2004-11-30 | 2008-12-31 | Panasonic Corp | STEREO ENCODING APPARATUS, STEREO DECODING APPARATUS, AND METHODS THEREOF |
WO2006070751A1 (ja) * | 2004-12-27 | 2006-07-06 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
JP4842147B2 (ja) * | 2004-12-28 | 2011-12-21 | パナソニック株式会社 | スケーラブル符号化装置およびスケーラブル符号化方法 |
CN101116137B (zh) | 2005-02-10 | 2011-02-09 | 松下电器产业株式会社 | 语音编码中的脉冲分配方法 |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
US8000967B2 (en) * | 2005-03-09 | 2011-08-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Low-complexity code excited linear prediction encoding |
BRPI0608756B1 (pt) * | 2005-03-30 | 2019-06-04 | Koninklijke Philips N. V. | Codificador e decodificador de áudio de multicanais, método para codificar e decodificar um sinal de áudio de n canais, sinal de áudio de multicanais codificado para um sinal de áudio de n canais e sistema de transmissão |
JP4599558B2 (ja) * | 2005-04-22 | 2010-12-15 | 国立大学法人九州工業大学 | ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法 |
DE602006011600D1 (de) | 2005-04-28 | 2010-02-25 | Panasonic Corp | Audiocodierungseinrichtung und audiocodierungsverfahren |
CN101167124B (zh) * | 2005-04-28 | 2011-09-21 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
FR2916079A1 (fr) * | 2007-05-10 | 2008-11-14 | France Telecom | Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d'ordinateur associes |
EP2201566B1 (en) | 2007-09-19 | 2015-11-11 | Telefonaktiebolaget LM Ericsson (publ) | Joint multi-channel audio encoding/decoding |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
NO2669468T3 (ja) * | 2011-05-11 | 2018-06-02 | ||
CN110728986B (zh) * | 2018-06-29 | 2022-10-18 | 华为技术有限公司 | 立体声信号的编码方法、解码方法、编码装置和解码装置 |
GB2580899A (en) * | 2019-01-22 | 2020-08-05 | Nokia Technologies Oy | Audio representation and associated rendering |
CN112233682A (zh) * | 2019-06-29 | 2021-01-15 | 华为技术有限公司 | 一种立体声编码方法、立体声解码方法和装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10105193A (ja) * | 1996-09-26 | 1998-04-24 | Yamaha Corp | 音声符号化伝送方式 |
JPH1132399A (ja) * | 1997-05-13 | 1999-02-02 | Sony Corp | 符号化方法及び装置、並びに記録媒体 |
JPH1188184A (ja) * | 1997-02-05 | 1999-03-30 | Nippon Telegr & Teleph Corp <Ntt> | 多チャネル音声信号符号化方法及びその復号方法及びそれを使った符号化装置及び復号化装置 |
JPH11317672A (ja) * | 1997-11-20 | 1999-11-16 | Samsung Electronics Co Ltd | ビット率の調節可能なステレオオーディオ符号化/復号化方法及び装置 |
WO2000019413A1 (en) * | 1998-09-30 | 2000-04-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Multi-channel signal encoding and decoding |
WO2001012352A1 (fr) * | 1999-08-10 | 2001-02-22 | Sumitomo Metal Industries, Ltd. | Procede de traitement d'un materiau dangereux |
WO2001043503A2 (de) * | 1999-12-08 | 2001-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0744511B2 (ja) * | 1988-09-14 | 1995-05-15 | 富士通株式会社 | 高郊率多重化方式 |
GB8913758D0 (en) | 1989-06-15 | 1989-08-02 | British Telecomm | Polyphonic coding |
CA2046369C (en) * | 1990-07-05 | 1997-04-15 | Naoji Fujino | High performance digitally multiplexed transmission system |
US6345246B1 (en) * | 1997-02-05 | 2002-02-05 | Nippon Telegraph And Telephone Corporation | Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates |
TW384434B (en) | 1997-03-31 | 2000-03-11 | Sony Corp | Encoding method, device therefor, decoding method, device therefor and recording medium |
-
2000
- 2000-09-15 SE SE0003287A patent/SE519985C2/sv unknown
-
2001
- 2001-09-05 JP JP2002527493A patent/JP4498677B2/ja not_active Expired - Fee Related
- 2001-09-05 AT AT01965791T patent/ATE358317T1/de not_active IP Right Cessation
- 2001-09-05 AU AU2001286350A patent/AU2001286350A1/en not_active Abandoned
- 2001-09-05 US US10/380,419 patent/US7263480B2/en not_active Expired - Lifetime
- 2001-09-05 WO PCT/SE2001/001886 patent/WO2002023529A1/en active IP Right Grant
- 2001-09-05 DE DE60127566T patent/DE60127566T2/de not_active Expired - Lifetime
- 2001-09-05 EP EP01965791A patent/EP1325495B1/en not_active Expired - Lifetime
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10105193A (ja) * | 1996-09-26 | 1998-04-24 | Yamaha Corp | 音声符号化伝送方式 |
JPH1188184A (ja) * | 1997-02-05 | 1999-03-30 | Nippon Telegr & Teleph Corp <Ntt> | 多チャネル音声信号符号化方法及びその復号方法及びそれを使った符号化装置及び復号化装置 |
JPH1132399A (ja) * | 1997-05-13 | 1999-02-02 | Sony Corp | 符号化方法及び装置、並びに記録媒体 |
JPH11317672A (ja) * | 1997-11-20 | 1999-11-16 | Samsung Electronics Co Ltd | ビット率の調節可能なステレオオーディオ符号化/復号化方法及び装置 |
WO2000019413A1 (en) * | 1998-09-30 | 2000-04-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Multi-channel signal encoding and decoding |
WO2001012352A1 (fr) * | 1999-08-10 | 2001-02-22 | Sumitomo Metal Industries, Ltd. | Procede de traitement d'un materiau dangereux |
WO2001043503A2 (de) * | 1999-12-08 | 2001-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4812230B2 (ja) * | 2000-09-15 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 複数チャネル信号の符号化及び復号化 |
WO2006035705A1 (ja) * | 2004-09-28 | 2006-04-06 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置およびスケーラブル符号化方法 |
JP4809370B2 (ja) * | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル音声符号化における適応ビット割り当て |
US9626973B2 (en) | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
Also Published As
Publication number | Publication date |
---|---|
EP1325495A1 (en) | 2003-07-09 |
SE0003287D0 (sv) | 2000-09-15 |
DE60127566T2 (de) | 2007-08-16 |
US7263480B2 (en) | 2007-08-28 |
EP1325495B1 (en) | 2007-03-28 |
ATE358317T1 (de) | 2007-04-15 |
US20030191635A1 (en) | 2003-10-09 |
DE60127566D1 (de) | 2007-05-10 |
SE0003287L (sv) | 2002-03-16 |
WO2002023529A1 (en) | 2002-03-21 |
SE519985C2 (sv) | 2003-05-06 |
JP4498677B2 (ja) | 2010-07-07 |
AU2001286350A1 (en) | 2002-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4498677B2 (ja) | 複数チャネル信号の符号化及び復号化 | |
JP4485123B2 (ja) | 複数チャネル信号の符号化及び復号化 | |
RU2764287C1 (ru) | Способ и система для кодирования левого и правого каналов стереофонического звукового сигнала с выбором между моделями двух и четырех подкадров в зависимости от битового бюджета | |
RU2418324C2 (ru) | Поддиапазонный речевой кодекс с многокаскадными таблицами кодирования и избыточным кодированием | |
US5995923A (en) | Method and apparatus for improving the voice quality of tandemed vocoders | |
JP4812230B2 (ja) | 複数チャネル信号の符号化及び復号化 | |
EP1202251A2 (en) | Transcoder for prevention of tandem coding of speech | |
JP5153791B2 (ja) | ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法 | |
JPH10187197A (ja) | 音声符号化方法及び該方法を実施する装置 | |
JP2002526798A (ja) | 複数チャネル信号の符号化及び復号化 | |
WO2005112006A1 (en) | Method and apparatus for voice trans-rating in multi-rate voice coders for telecommunications | |
US8036390B2 (en) | Scalable encoding device and scalable encoding method | |
AU2001282801A1 (en) | Multi-channel signal encoding and decoding | |
JPH08146997A (ja) | 符号変換装置および符号変換システム | |
EP4179530B1 (en) | Comfort noise generation for multi-mode spatial audio coding | |
JP2002221994A (ja) | 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体 | |
CA2293165A1 (en) | Method for transmitting data in wireless speech channels | |
KR20030025092A (ko) | 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법 | |
JP4108396B2 (ja) | 多地点制御装置の音声符号化伝送システム | |
Yoon et al. | Transcoding Algorithm for G. 723.1 and AMR Speech Coders: for Interoperability between VoIP and Mobile Networks1 | |
GB2391440A (en) | Speech communication unit and method for error mitigation of speech frames |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051017 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090324 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090623 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090630 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100323 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100414 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4498677 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140423 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |