JP2004509365A - 複数チャネル信号の符号化及び復号化 - Google Patents

複数チャネル信号の符号化及び復号化 Download PDF

Info

Publication number
JP2004509365A
JP2004509365A JP2002527491A JP2002527491A JP2004509365A JP 2004509365 A JP2004509365 A JP 2004509365A JP 2002527491 A JP2002527491 A JP 2002527491A JP 2002527491 A JP2002527491 A JP 2002527491A JP 2004509365 A JP2004509365 A JP 2004509365A
Authority
JP
Japan
Prior art keywords
channel
fixed codebook
channels
codebook
shared
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002527491A
Other languages
English (en)
Other versions
JP4812230B2 (ja
Inventor
ミンデ, トール, ビョルン
ステイナーソン, アルネ
ウヴリデン, アンデルス
Original Assignee
テレフオンアクチーボラゲツト エル エム エリクソン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=20281031&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2004509365(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by テレフオンアクチーボラゲツト エル エム エリクソン filed Critical テレフオンアクチーボラゲツト エル エム エリクソン
Publication of JP2004509365A publication Critical patent/JP2004509365A/ja
Application granted granted Critical
Publication of JP4812230B2 publication Critical patent/JP4812230B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Abstract

マルチパート固定コードブックが、各チャネルのための個別の固定コードブック(FC1、FC2)と共有固定コードブック(FCS)をともに含んでいる。共有固定コードブック(FCS)は全チャネルに共通であり、該チャネルは、個別の遅延(D1,D2)と関連している。さらに、個別の固定コードブック(FC1、FC2)は個別のゲイン(gF1、gF2)に関連しており、個別の遅延(D1、D2)は個別のゲイン(gFs1、gFs2)に関連している。個別の固定コードブック(FS1、FS2)からの励振は、共有固定コードブック(FCS)からのこれに対応する励振(共通のコードブックベクトルであるが、各チャネルの個別の遅延とゲイン)に付加される。

Description

【0001】
【発明の属する技術分野】
本発明は、ステレオ音響信号等の複数チャネル信号の符号化と復号化に関する。
【0002】
【従来の技術及び発明が解決しようとする課題】
従来の音声符号化方法は、単一チャネルの音声信号を基本としているのが一般的である。常設の電話機と移動電話機との間の接続において利用される音声符号化はその一例である。音声符号化は、周波数が制限された空中電波インタフェース上で帯域幅利用を縮減するために無線リンク上で利用される。よく知られた音声符号化の例としては、PCM(Pulse Code Modulation)、ADPCM(Adaptive Differential Pulse Code Modulation)、サブ−バンド符号化(sub−band coding)、変換符号化(transform coding)、LPC(Linear Predictive Coding)の音声作動符号化、及びハイブリッド符号化、例えばCELP(Code−Excited Linear Predictive)符号化のようなものなどがある[参考文献1−2]。
【0003】
例えばステレオのスピーカと2つのマイクロホン(ステレオ・マイクロホン)を有するコンピュータ・ワークステーションのように、音響/音声通信で一入力信号より多くの入力信号を使う環境においては、ステレオ信号を伝送するために2つの音響/音声チャネルが必要とされる。複数チャネルを使う環境の他の例としては、2チャネル、3チャネル若しくは4チャネルの入力/出力を備えた会議室が挙げられることになろう。この種のアプリケーションは、インターネット上や第3世代の移動電話システムにおいて利用されることが予想されている。
【0004】
複数チャネルの線形予測合成分析(LPES)信号符号化/復号化のための一般的な原則が参考文献3に記載されている。しかし、これらに記載された原則は、チャネル間相関が強い場合またはチャネル間相関が可変的である場合には、常に最適であるとは限らない。
【課題を解決するための手段】
【0005】
本発明は、複数チャネルの線形予測合成分析信号の符号化/復号化の時にチャネル間相関をより良く活用すること、及び、好適には、符号化/復号化を可変的なチャネル間相関に容易に適応させることを目的とする。
【0006】
上記の目的は、付属の請求項により解決される。
【0007】
簡潔に言うならば、本発明は、各チャネルのための個別の固定コードブックと、全チャネルに共通の共有固定コードブックを含むマルチパート固定コードブックに関する。該方法によって、チャネル間相関に応じてフレームごとに、あるいは、所望の総ビットレートに応じて呼ごとに、個別のコードブックと共有コードブックに割り当てられるビット数を様々に変化させることができる。従って、チャネル間相関が高い場合は原則的に共有コードブックのみが要求され、チャネル間相関が低い場合は原則的に個別のコードブックのみが要求される。チャネル間相関が高いことがすでに知られているまたは推定される場合には、全てのチャネルに共通の共有固定コードブックで十分であろう。同様に、所望の総ビットレートが低い場合は、原則的に共有コードブックのみが要求され、所望の総ビットレートが高い場合は、個別のコードブックが使用されうる。
【0008】
以下の添付図面と共に述べられる説明を参照すれば、本発明を最もよく理解することができる。また、これと同時に、本発明のさらなる目的と有効性についても、以下の添付図面と共に述べられる説明を参照することによって最もよく理解することができる。
【0009】
【発明の実施の形態】
以下の説明において、同等または類似の要素には同一の参照番号を付した。
【0010】
従来の単一チャネルの線形予測合成分析(LPAS)音声符号器と一般的な複数チャネル線形予測合成分析音声符号器(参考文献3)の説明を通じて本発明を説明していく。
【0011】
図1は、従来の単一チャネルLPAS音声符号器のブロック図である。この符号器は、2つの部分、すなわち、合成部と分析部とを具備している(これに対応する復号器は、合成部のみを有する)。
【0012】
合成部は、LPC合成フィルタ12を具備しており、そのLPC合成フィルタ12は、励振信号i(n)を受けて合成音声信号s^(n)を出力する(ここで、「s^(n)」は、上に^を付したsと(n)とを併記した図中の符号を指す)。励振信号i(n)は、2つの信号u(n)とv(n)を加算器22で加算することによって形成される。信号u(n)は、固定コードブック(fixed codebook)16からの信号f(n)をゲイン要素20におけるゲインgFでスケーリングすることによって形成される。信号v(n)は、適応コードブック(adaptive codebook)14からの励振信号i(n)の(遅延“lag”で)遅延されたものをゲイン要素18におけるゲインgAでスケーリングすることによって形成される。適応コードブックは、遅延要素24を含むフィードバック・ループによって形成され、その遅延要素24が励振信号i(n)を一サブフレームの長さNだけ遅延させるものとなっている。これにより、適応コードブックは、コードブック内にシフトされた過去の励振信号i(n)を有することになる(最も古い励振はコードブック外へシフトされて破棄される)。LPC合成フィルタのパラメータは、一般に20ms〜40msのフレーム毎にアップデートされるのに対し、適応コードブックは、5ms〜10msのサブフレーム毎にアップデートされる。
【0013】
LPAS符号器の分析部は、入来する音声信号s(n)のLPC分析を実行し、かつ、励振分析も実行する。
【0014】
LPC分析はLPC分析フィルタ10によって実行される。このフィルタは、音声信号s(n)を受け、その信号のパラメトリック・モデル(parametric model)をフレームベースで構築する。モデルのパラメータは、実際の音声フレームのベクトルとモデルによって生成される対応信号のベクトルとの差で形成される残差ベクトルのエネルギーを最小とするように選択される。モデルの各パラメータは、分析フィルタ10のフィルタ係数によって表される。それらのフィルタ係数は、フィルタの伝達関数A(z)を定める。合成フィルタ12の伝達関数は少なくとも近似的には1/A(z)に等しいため、それらのフィルタ係数はさらに、破線の制御線で示したように、合成フィルタ12を制御するものとなっている。
【0015】
励振分析は、音声信号ベクトル{s(n)}と最も適した合成信号ベクトル{s^(n)}を生じさせる、固定コードブックベクトル(コードブックのインデックス)、ゲインgF、適応コードブックベクトル(遅延)及びゲインgAの、最良の組合せを決定するために実行される(ここで、{}は、ベクトルないしフレームを形成するサンプルを収集したものを表す)。これは、それらのパラメータのすべての可能な組合せをテストする全数探索においてなされる(いくつかのパラメータを他のパラメータとは独立して定め、かつ、残ったパラメータの探索中それらを固定しておく準最適(sub−optimal)探索方式を採ることも可能である)。合成ベクトル{s^(n)}が対応する音声ベクトル{s(n)}にどのくらい近いかをテストするため、(加算器26で形成された)差ベクトル{e(n)}のエネルギーをエネルギー計算器30で計算することとしてもよい。しかし、重み付けされた誤差信号のベクトル{ew(n)}においては、大きい誤差を大きい振幅の周波数帯域(large amplitude frequency bands)によってマスクするような形態で誤差が再配分(re−distribute)されており、この重み付けされた誤差信号のベクトル{ew(n)}のエネルギーを考慮する方がより効率的である。これは、重み付けフィルタ28で行われる。
【0016】
次に、図1の単一チャネルLPAS符号器を参考文献3の記載に基づいて複数チャネルLPAS符号器とする変形について、図2〜図3を参照して説明する。音声信号として2つのチャネルの(ステレオの)音声信号を想定して説明を行うが、2つより多くのチャネルについて同様の原理を利用することとしてもよい。
【0017】
図2は、参考文献3に記載の複数チャネルLPAS音声符号器の分析部の一実施形態を示したブロック図である。図2においては、入力信号が信号成分s1(n)、s2(n)で示されているように複数チャネルの信号となっている。図1におけるLPC分析フィルタ10は、マトリクス値伝達関数行列A(z)を有するLPC分析フィルタ・ブロック10Mで置き換えられている。同様に、加算器26、重み付けフィルタ28、エネルギー計算器30は、それぞれ対応する複数チャネル用のブロック26M、28M、30Mによって置き換えられている。
【0018】
図3は、参考文献3に記載の複数チャネルLPAS音声符号器の合成部の一実施形態を示したブロック図である。複数チャネルの復号器もまた、このような合成部によって構成することとしてもよい。ここでは、図1におけるLPC合成フィルタ12がLPC合成フィルタ・ブロック12Mで置き換えられている。LPC合成フィルタ・ブロック12Mは、マトリクス状の値を持つ伝達関数行列A−1(z)を有し、この伝達関数行列A−1(z)は、(その表記文字記号が示すように)少なくとも近似的には行列A(z)の逆行列に等しいものとなっている。同様に、加算器22、固定コードブック16、ゲイン要素20、遅延要素24、適応コードブック14、ゲイン要素18は、それぞれ対応する複数チャネル用のブロック22M、16M、24M、14M、18Mによって置き換えられている。
【0019】
上記の従来の複数チャネル符号器の問題点は、マイクロフォンの環境が変化することに起因する可変的なチャネル間相関に対してあまり柔軟性を有しない点である。例えば、複数のマイクロフォンが一人の話者から音声を拾う場合がある。そのような場合、異なるマイクロフォンからの信号は原則的に、(エコーは無視されうると想定した場合)遅延またはスケーリングされた形の同一信号によって形成されうる。つまりチャネルは強固に相関付けられている。他の状況では、個別のマイクロフォンに異なる話者が同時に存在する場合がある。この場合、チャネル間の相関はほとんど存在しない。
【0020】
図4は、本発明の複数チャネルLPAS音声符号器の合成部の実施態様の一例を示したブロック図である。本発明の本質的特徴は、マルチパート固定コードブックの構造である。本発明によると、該構造は、各チャネルのための個別の固定コードブックFC1、FC2と共有固定コードブックFCSをともに含んでいる。共有固定コードブックFCSは全チャネルに共通であるが(これは、同一のコードブックインデックスが全チャネルに使用されることを意味する)、該チャネルは、図4に図示されたように個別の遅延D1、D2と関連している。さらに、個別の固定コードブックFC1、FC2は個別のゲインgF1、gF2に関連しており、個別の遅延D1、D2(整数または分数であってもよい)は個別のゲインgFS1、gFS2に関連している。個別の固定コードブックFS1、FS2からの励振は、共有固定コードブックFCSからのこれに対応する励振(共通のコードブックベクトルであるが、各チャネルの個別の遅延とゲイン)に加算器AF1、AF2において付加される。典型的には、固定コードブックは、代数的なコードブックを具備し、該コードブックにおいて励振ベクトルは、ある規則に従ってそれぞれのベクトルに配分されたユニットパルスにより形成される(これは当業者にとって周知であるから、本書ではさらに詳述しない)。
【0021】
マルチパート固定コードブックは非常に柔軟性が高い。例えば、個別の固定コードブックでビットをより多く用いる符号器がある一方で、共有固定コードブックでビットをより多く用いる符号器もある。さらに、符号器は、チャネル間相関に応じて、個別のコードブックと共有コードブックとの間のビットの配分を動的に変更できる。ある信号については、他のチャネルよりも1個の独立チャネルにより多くのビットを割り当てることが適している場合がありうる(ビットの非対称分配)。
【0022】
図4は、2チャネル固定コードブック構造を図示しているが、各コードブックの数と遅延及びチャネル間のゲインの数を増加させることによって、この概念はより多くのチャネルに対して容易に一般化できることが理解されなければならない。
【0023】
先頭チャネルと後続チャネルの固定コードブックは、典型的には連続して順番に調べられる。好適な順序としては、第一に先頭チャネル固定コードブック励振ベクトル、遅延及びゲインを決定し、その後、後続チャネルの個別の固定コードブックベクトルとゲインを決定する。
【0024】
マルチパート固定コードブックの探索方法を図5と図6を参照しながら説明する。
【0025】
図5は、本発明のマルチパート固定コードブックの実施態様のフローチャートである。ステップS1は(最大のフレームエネルギーを有するチャネル)第一ないしは先頭チャネル、典型的には最も強いチャネルを判断し符号化する。ステップS2は、所定の間隔(例えば完全な一フレームの一部分)の各第二ないしは後続チャネルと第一チャネルの間の相互相関を判断する。ステップS3は、各第二チャネルについての遅延候補を記憶する。これらの遅延候補は、多数の最高の相互相関のピークの位置と、各第二チャネルについての各ピークのまわりの最も近傍の位置によって定義される。例えば3つの最高ピークを選択し、各ピークの両側の最も近い位置を付加することによって、総計9つの遅延候補を与えることになる。高分解(分数)遅延を使用した場合は、各ピークのまわりの候補数を、例えば5ないし7に増加できる。より高い分解は入力信号のアップサンプリングによって得ることができる。
最も単純な実施態様での第一のチャネルの遅延は、ゼロと見なすことができる。しかし、コードブックのパルスは典型的には任意の位置を有することができないので、ある符号化ゲインは第一チャネルにも遅延を割り当てることによって得られうる。このことは高分解遅延が使用される場合に特に該当する。ステップS4では、各記憶された遅延候補組み合わせのための一時的な共有固定コードブックベクトルが形成される。ステップS5は、最高の仮コードブックベクトルに対応した遅延組み合わせを選択する。ステップS6は、最適なチャネル間ゲインを判断する。最後に、ステップS7は、チャネル特定(非共有)励振とゲインを判断する。
【0026】
該アルゴリズムの変形例では、全てのまたは最高の仮コードブックベクトル、対応遅延及びチャネル間ゲインが保持されている。それぞれの保持された組み合わせについて、ステップS7に従ってチャネル特定探索が実行される。最後に、共有コードブック励振と個別コードブック励振の組み合わせが選択される。
【0027】
該方法の複雑性を軽減するために、仮コードブックの励振ベクトルをわずか数パルスまで制限することができる。例えば、GSMシステムでは、拡張されたフルレートチャネルの完全固定コードブックは、10パルスを含む。この場合、3ないし5仮コードブックパルスが合理的である。概して、全パルス数の25ないし50%が合理的数字でありうる。最高の遅延組み合わせが選択されると、完全なコードブックはこの組み合わせだけのために探索される(典型的にはすでに位置決めされたパルスは変更されず、完全コードブックの残りのパルスだけが位置決めされなくてはならない)。
【0028】
図6は、本発明に係るマルチパート固定コードブック探索方法の他の実施態様を示すフローチャートである。該実施態様では、ステップS1、S6、S7は、図5の実施態様の場合と同じである。ステップS10は、許可された遅延組み合わせのそれぞれのために最適な位置に新規な励振ベクトルパルスを位置付ける(該ステップが実行される最初の時には全ての遅延組み合わせが許可される)。ステップS11では、全パルスが使用されたか否かがテストされる。そうでない場合は、ステップS12は、許可遅延組み合わせを最高の残りの組み合わせに制限する。その後、さらなるパルスが残りの許可組み合わせに付加される。最後に、全てのパルスが使用されると、ステップS13は最高の残りの遅延組み合わせと、それに対応する共有固定コードブックベクトルを選択する。
【0029】
ステップS12に関しては可能性がいくつかある。一つには、それぞれの反復時に、一定の割合(例えば25%)だけ、最高の遅延組み合わせを維持することが可能である。しかし、全パルスが使用される前に1組しか残っていないということを回避するために、反復が終わるごとに、一定数の組み合わせを確実に残すことができる。また、残されたパルスに1を加えた数と少なくとも同数の組み合わせを常に確実に残すことができる。このように、反復ごとに選択候補となる組み合わせが複数常に存在することとなる。
【0030】
固定コードブックゲインについては、各チャネルは、共有固定コードブックに対して1ゲインを必要とし、個別コードブックについては1ゲインを必要とする。これらのゲインは、典型的にはチャネル間で著しい相関関係を有している。これらはまた適応コードブックのゲインと相関付けられる。従ってこれらのゲインのチャネル間予測が可能であり、これらを符号化するためにベクトル量子化を使用してもよい。
【0031】
図4に戻り、適応コードブックは、各チャネルにつき1つの適応コードブックAC1、AC2を含む。適応コードブックは複数チャネル符号器において多数の方法で構成されうる。
【0032】
一つには、全チャネルに共通ピッチ遅延を共有させることが可能である。これは、チャネル間相関が強い時に実行可能である。ピッチ遅延が共有されている時でさえ、チャネルは別個のピッチゲインgA11,gA22を依然として有しうる。共有ピッチ遅延は、閉ループの方法で全チャネルにおいて同時に探索される。
【0033】
さらには、それぞれのチャネルに個別のピッチ遅延を持たせることも可能である。これは、チャネル間相関が弱い時に実行可能である(チャネルは独立している)。ピッチ遅延は、異なるように又は絶対的に符号化されうる。
【0034】
さらには、励振履歴をチャネル横断の様態で使用することができる。例えば、チャネル間遅延P12においてチャネル1の励振履歴からチャネル2を予測することができる。これは、チャネル間相関が強い時に実行可能である。
【0035】
固定コードブックに関する場合のように、記載された適応コードブックの構造は非常に柔軟で、マルチモード操作に適している。共有ピッチ遅延または個別のピッチ遅延を使用するか否かの選択は残差信号エネルギーに基づいてもよい。第一のステップでは、最適な共有ピッチ遅延の残差エネルギーが決定される。第二のステップでは、最適な個別のピッチ遅延の残差エネルギーが決定される。共有ピッチ遅延の場合の残差エネルギーが個別のピッチ遅延の場合の残差エネルギーよりも所定量超過している場合、個別のピッチ遅延が使用される。そうでない場合は、共有ピッチ遅延が使用される。希望であれば、決定を円滑にするためにエネルギー差の平均移動を用いてもよい。
【0036】
この方策は、共有ピッチ遅延か個別のピッチ遅延かを決定するための「閉ループ」方法と考えることができる。あるいは、チャネル間相関等に基づく「開ループ」方法も可能である。この場合、チャネル間相関が所定の閾値を越える場合、共有ピッチ遅延が使用される。そうでない場合は、個別のピッチ遅延が使用される。
【0037】
チャネル間のピッチ遅延を使用するか否かを決定するために同様の方法を使用することができる。
【0038】
さらに、異なるチャネル間の適応コードブックゲインの間で重要な相関が期待されている。これらのゲインは、チャネルの内部ゲイン履歴から、他のチャネルに属する同一フレームのゲインから、及び固定コードブックゲインからも予測されうる。固定コードブックの場合と同様に、ベクトル量子化も可能である。
【0039】
図4のLPC合成フィルタ・ブロック12Mでは、各チャネルは個別のLPC(線形予測符号化)フィルタを使用する。これらのフィルタは、単一チャネルの場合と同様の方法で個別に駆動することができる。しかし、チャネルの一部または全部が同一LPCフィルタを共有することもできる。これによって、LPCスペクトル間のスペクトル距離等の信号特性に応じて、複数フィルタモードと単一フィルタモードとを切り替えることができる。
【0040】
図7は、本発明の複数チャネルLPAS音声符号器の分析部の実施態様の一例を示すブロック図である。図1と図2を参照しながらすでに説明したブロックに加えて、図7に記載の分析部は、複数モード分析ブロック40を含む。ブロック40は、共有固定コードブックFCS、遅延D1、D2およびゲインgFS1,gFS2のみを使用した符号化を正当化するのにチャネル間に十分な相関があるか否かを判断するために、チャネル間の相関を判断する。もしそうでない場合は、個別の固定コードブックFC1、FC2とゲインgF1,gF2を使用することが必要となるであろう。該相関は、時間ドメインにおける通常の相関、つまり、第二のチャネル信号を第一の信号に最も良く適合するまでシフトすることによって判断することができる。2つ以上のチャネルが存在する場合には、最小相関値が所定の閾値を超過したときに共有固定コードブックが使用されることになる。あるいは、第一のチャネルに対する相関が所定の閾値を超過するチャネルのために共有固定コードブックを使用し、残りのチャネルのために個別の固定コードブックを使用してもよい。正確な閾値はリスニングテストによって判断される。
【0041】
低ビットレート符号器では、固定コードブックは、共有コードブックFCSと対応する遅延要素D1、D2及びチャネル間ゲインgFS1,gFS2のみを含みうる。該実施態様は、ゼロに等しいチャネル間閾値に等しい。
【0042】
分析部はさらに、各チャネルについてスケール要素e1、e2を決定する相対的エネルギー計算器42を含みうる。これらのスケール要素は以下の式に従って決定することができる。
【数式1】
Figure 2004509365
ここで、Eiはフレームiのエネルギーを示す。これらのスケール要素を使用して、それぞれのチャネルのための重み付けされた残差エネルギーR、Rを、図7に図示されたように、チャネルの相対的強さに従ってリスケールすることができる。各チャネルのための残差エネルギーのリスケーリングは、各チャネルの絶対的エラーに関する最適化よりもむしろ、各チャネルにおける相対的エラーに関する最適化のほうに効果を有する。
【0043】
スケール要素は、相対的チャネル強さeiのより一般的な関数であってもよく、例えば以下の数式で示される。
【数式2】
Figure 2004509365
ここで、αは、インターバル4−7における定数であり、例えばαは5にほぼ等しい。スケーリング関数の正確な形は、主観的なリスニングテストによって判断することができる。
【0044】
本発明の上記に記載の実施態様の様々な要素の機能は、典型的には一または複数のマイクロプロセッサまたはマイクロ/信号プロセッサの組合せ、及びこれに対応するソフトウェアによって実行される。
【0045】
上記の説明は主として符号器を対象としている。これに対応する復号器は、このような符号器の合成部を含むのみでありうる。典型的には、符号器/復号器の組み合わせは、帯域幅制限通信チャネル上で符号化信号を伝送/受信する端末において使用される。端末は、携帯電話または基地局の無線端末であってもよい。そのような端末は、アンテナ、増幅器、イコライザ、チャネル符号器/復号器等の他の様々な要素も含みうる。しかし、これらの要素は、本発明を説明するために重要ではないので、その説明は省略されている。
【0046】
本発明の範囲から逸脱することなく、本発明に対して様々な変形や変更がなされ得るのは、当業者に理解されるところであり、本発明の範囲は特許請求の範囲の記載によって定められる。
【0047】
参考文献
[1] A. Gersho, “Advances in Speech and Audio Compression”, Proc. of the IEEE, Vol. 82, No. 6, pp 900−918, June 1994,
[2] A. S. Spanias, “Speech Coding: A Tutorial Review”, Proc. of the IEEE, Vol 82, No. 10, pp 1541−1582, Oct 1994.
[3] WO00/19413(Telefonaktiebolaget LM Ericsson).
【図面の簡単な説明】
【図1】従来の単一チャネルLPAS音声符号器のブロック図である。
【図2】従来の複数チャネルLPAS音声符号器の分析部の一実施態様を示したブロック図である。
【図3】従来の複数チャネルLPAS音声符号器の合成部の一実施態様を示したブロック図である。
【図4】本発明の複数チャネルLPAS音声符号器の分析部の実施態様の一例を示したブロック図である。
【図5】本発明に係る、マルチパート固定コードブックの探索方法の実施態様の一例のフローチャートである。
【図6】本発明に係る、マルチパート固定コードブックの探索方法の実施態様のさらなる例を示すフローチャートである。
【図7】本発明の複数チャネルLPAS音声符号器の分析部の実施態様の一例を示したブロック図である。

Claims (29)

  1. 各チャネルのための個別の固定コードブックと;
    全チャネルに共通の共有固定コードブックを含む、マルチパート固定コードブックを含む複数チャネル線形予測分析合成信号符号器。
  2. 全チャネルに共通の共有固定コードブックを含む、複数チャネル線形予測分析合成信号符号器。
  3. 該共有固定コードブックは各チャネルのための個別の遅延要素に接続されている、請求項1または2に記載の符号器。
  4. 上記個別の遅延要素が高分解要素である、請求項3に記載の符号器。
  5. それぞれの遅延要素が対応するゲイン要素と接続されている、請求項3に記載の符号器。
  6. 該個別の固定コードブックと該共有固定コードブックの間でビット割当が変更されるべきか否かを判断するためにチャネル間相関を分析するための手段を含む、請求項1に記載の符号器。
  7. 各チャネルのための個別の適応コードブックと個別のピッチ遅延を有するマルチパート適応コードブックを含む、請求項1または2に記載の符号器。
  8. 共通ピッチ遅延を全チャネルで共有可能か否かを判断するための手段を含む、請求項7に記載の符号器。
  9. 各チャネルと残りのチャネルとの間のチャネル間ピッチ遅延を含む、請求項7に記載の符号器。
  10. 相対的チャネル強さに従って各チャネルの残差エネルギーをリスケールするための手段を含む、請求項1または2に記載の符号器。
  11. 各チャネルのための個別の固定コードブックと;
    全チャネルに共通の共有固定コードブックを含む、マルチパート固定コードブックを含む複数チャネル線形予測分析合成信号復号器。
  12. 全チャネルに共通の共有固定コードブックを含む、複数チャネル線形予測分析合成信号復号器。
  13. 該共有固定コードブックは各チャネルのための個別の遅延要素に接続されている、請求項11または12に記載の復号器。
  14. 上記個別の遅延要素が高分解要素である、請求項13に記載の復号器。
  15. それぞれの遅延要素が対応するゲイン要素と接続されている、請求項13に記載の復号器。
  16. 該個別の固定コードブックと該共有固定コードブックの間でビット割当が変更されるべきか否かを判断するためにチャネル間相関を分析するための手段を含む、請求項11または12に記載の復号器。
  17. 各チャネルのための個別の適応コードブックと個別のピッチ遅延を有するマルチパート適応コードブックを含む、請求項16に記載の復号器。
  18. 各チャネルのための個別の固定コードブックと;
    全チャネルに共通の共有固定コードブックを含む、マルチパート固定コードブックを有する複数チャネル線形予測分析合成音声符号器/復号器を含む端末。
  19. 全チャネルに共通の共有固定コードブックを含む、複数チャネル線形予測分析合成信号復号器を含む端末。
  20. 該共有固定コードブックは各チャネルのための個別の遅延要素に接続されている、請求項18または19に記載の端末。
  21. 上記個別の遅延要素が高分解要素である、請求項20に記載の端末。
  22. それぞれの遅延要素が対応するゲイン要素と接続されている、請求項20に記載の端末。
  23. 該個別の固定コードブックと該共有固定コードブックの間でビット割当が変更されるべきか否かを判断するためにチャネル間相関を分析するための手段を含む、請求項18に記載の端末。
  24. 各チャネルのための個別の適応コードブックと個別のピッチ遅延を有するマルチパート適応コードブックを含む、請求項18または19に記載の端末。
  25. 共通ピッチ遅延を全チャネルで共有可能か否かを判断するための手段を含む、請求項24に記載の端末。
  26. 各チャネルと残りのチャネルとの間のチャネル間ピッチ遅延を含む、請求項24に記載の端末。
  27. 該端末は無線端末である、請求項18に記載の端末。
  28. チャネル間相関を分析するステップと;
    現在のチャネル間相関に応じて、個別のチャネル専用の固定コードブックと全チャネルに共通の共有固定コードブックの間の符号化ビット割当を動的に変更するステップを含む、複数チャネル線形予測分析合成信号符号化方法。
  29. 所望の総ビットレートを判断するステップと、
    判断された総ビットレートに応じて、個別のチャネル専用の固定コードブックと全チャネルに共通の共有固定コードブックの間の符号化ビット割当を適応させるステップを含む、複数チャネル線形予測分析合成信号符号化方法。
JP2002527491A 2000-09-15 2001-08-29 複数チャネル信号の符号化及び復号化 Expired - Fee Related JP4812230B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE0003284A SE519976C2 (sv) 2000-09-15 2000-09-15 Kodning och avkodning av signaler från flera kanaler
SE0003284-7 2000-09-15
PCT/SE2001/001828 WO2002023527A1 (en) 2000-09-15 2001-08-29 Multi-channel signal encoding and decoding

Publications (2)

Publication Number Publication Date
JP2004509365A true JP2004509365A (ja) 2004-03-25
JP4812230B2 JP4812230B2 (ja) 2011-11-09

Family

ID=20281031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002527491A Expired - Fee Related JP4812230B2 (ja) 2000-09-15 2001-08-29 複数チャネル信号の符号化及び復号化

Country Status (10)

Country Link
US (1) US7346110B2 (ja)
EP (1) EP1327240B1 (ja)
JP (1) JP4812230B2 (ja)
CN (1) CN1216365C (ja)
AT (1) ATE376239T1 (ja)
AU (2) AU2001282801B2 (ja)
DE (1) DE60131009T2 (ja)
ES (1) ES2291340T3 (ja)
SE (1) SE519976C2 (ja)
WO (1) WO2002023527A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006085586A1 (ja) * 2005-02-10 2006-08-17 Matsushita Electric Industrial Co., Ltd. 音声符号化におけるパルス割当方法
WO2006104017A1 (ja) * 2005-03-25 2006-10-05 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2368761B (en) * 2000-10-30 2003-07-16 Motorola Inc Speech codec and methods for generating a vector codebook and encoding/decoding speech signals
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
CN101027718A (zh) * 2004-09-28 2007-08-29 松下电器产业株式会社 可扩展性编码装置以及可扩展性编码方法
US8000967B2 (en) * 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
WO2006129615A1 (ja) 2005-05-31 2006-12-07 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
KR101398836B1 (ko) * 2007-08-02 2014-05-26 삼성전자주식회사 스피치 코덱들의 고정 코드북들을 공통 모듈로 구현하는방법 및 장치
EP2396637A1 (en) * 2009-02-13 2011-12-21 Nokia Corp. Ambience coding and decoding for audio applications
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
US9978379B2 (en) * 2011-01-05 2018-05-22 Nokia Technologies Oy Multi-channel encoding and/or decoding using non-negative tensor factorization
US9449607B2 (en) * 2012-01-06 2016-09-20 Qualcomm Incorporated Systems and methods for detecting overflow
PL3011555T3 (pl) 2013-06-21 2018-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Rekonstrukcja ramki sygnału mowy
SG11201510463WA (en) * 2013-06-21 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pitch lag estimation
US20150025894A1 (en) * 2013-07-16 2015-01-22 Electronics And Telecommunications Research Institute Method for encoding and decoding of multi channel audio signal, encoder and decoder
KR102636396B1 (ko) * 2015-09-25 2024-02-15 보이세지 코포레이션 스테레오 사운드 신호를 1차 및 2차 채널로 시간 영역 다운 믹싱하기 위해 좌측 및 우측 채널들간의 장기 상관 차이를 이용하는 방법 및 시스템
US20210027794A1 (en) * 2015-09-25 2021-01-28 Voiceage Corporation Method and system for decoding left and right channels of a stereo sound signal
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8913758D0 (en) * 1989-06-15 1989-08-02 British Telecomm Polyphonic coding
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP3435674B2 (ja) * 1994-05-06 2003-08-11 日本電信電話株式会社 信号の符号化方法と復号方法及びそれを使った符号器及び復号器
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
SE506379C3 (sv) * 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
US6081781A (en) * 1996-09-11 2000-06-27 Nippon Telegragh And Telephone Corporation Method and apparatus for speech synthesis and program recorded medium
GB2326572A (en) * 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
WO1999016036A1 (en) * 1997-09-24 1999-04-01 Eldridge Martin E Position-responsive, hierarchically-selectable information presentation system and control program
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE519981C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006085586A1 (ja) * 2005-02-10 2006-08-17 Matsushita Electric Industrial Co., Ltd. 音声符号化におけるパルス割当方法
US8024187B2 (en) 2005-02-10 2011-09-20 Panasonic Corporation Pulse allocating method in voice coding
JP4887282B2 (ja) * 2005-02-10 2012-02-29 パナソニック株式会社 音声符号化におけるパルス割当方法
WO2006104017A1 (ja) * 2005-03-25 2006-10-05 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
JP4887288B2 (ja) * 2005-03-25 2012-02-29 パナソニック株式会社 音声符号化装置および音声符号化方法
US8768691B2 (en) 2005-03-25 2014-07-01 Panasonic Corporation Sound encoding device and sound encoding method

Also Published As

Publication number Publication date
CN1216365C (zh) 2005-08-24
SE519976C2 (sv) 2003-05-06
DE60131009D1 (de) 2007-11-29
EP1327240B1 (en) 2007-10-17
WO2002023527A1 (en) 2002-03-21
DE60131009T2 (de) 2008-07-17
SE0003284L (sv) 2002-03-16
AU8280101A (en) 2002-03-26
ATE376239T1 (de) 2007-11-15
JP4812230B2 (ja) 2011-11-09
EP1327240A1 (en) 2003-07-16
SE0003284D0 (sv) 2000-09-15
US20040044524A1 (en) 2004-03-04
CN1455917A (zh) 2003-11-12
US7346110B2 (en) 2008-03-18
AU2001282801B2 (en) 2007-06-07
ES2291340T3 (es) 2008-03-01

Similar Documents

Publication Publication Date Title
JP4485123B2 (ja) 複数チャネル信号の符号化及び復号化
US7263480B2 (en) Multi-channel signal encoding and decoding
JP4812230B2 (ja) 複数チャネル信号の符号化及び復号化
JP4743963B2 (ja) 複数チャネル信号の符号化及び復号化
CN101681627B (zh) 使用音调规则化及非音调规则化译码的信号编码方法及设备
CN1158647C (zh) 话音编码设备的频谱幅度量化
CN101842832B (zh) 编码装置和解码装置
US6477502B1 (en) Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system
AU2001282801A1 (en) Multi-channel signal encoding and decoding
KR100935174B1 (ko) 고속 코드-벡터 탐색 장치 및 방법
ZA200205695B (en) Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals.
EP1535277B1 (en) Bandwidth-adaptive quantization
US8271275B2 (en) Scalable encoding device, and scalable encoding method
KR20070090217A (ko) 스케일러블 부호화 장치 및 스케일러블 부호화 방법
JP5199281B2 (ja) 第1のビット・レートに関連する第1のパケットを、第2のビット・レートに関連する第2のパケットにディミング(dimming)するシステム及び方法
Yoon et al. Transcoding Algorithm for G. 723.1 and AMR Speech Coders: for Interoperability between VoIP and Mobile Networks1

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080814

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110726

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110823

R150 Certificate of patent or registration of utility model

Ref document number: 4812230

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140902

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees