JP4970046B2 - ディジタル信号圧縮のためのコーディングのために用いられるマルチパルス・ディクショナリのインデクス間のトランスコーディング - Google Patents

ディジタル信号圧縮のためのコーディングのために用いられるマルチパルス・ディクショナリのインデクス間のトランスコーディング Download PDF

Info

Publication number
JP4970046B2
JP4970046B2 JP2006543573A JP2006543573A JP4970046B2 JP 4970046 B2 JP4970046 B2 JP 4970046B2 JP 2006543573 A JP2006543573 A JP 2006543573A JP 2006543573 A JP2006543573 A JP 2006543573A JP 4970046 B2 JP4970046 B2 JP 4970046B2
Authority
JP
Japan
Prior art keywords
pulse
positions
subframe
coding
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006543573A
Other languages
English (en)
Other versions
JP2007515676A (ja
Inventor
クロード・ランブラン
モハメド・ゲナニア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of JP2007515676A publication Critical patent/JP2007515676A/ja
Application granted granted Critical
Publication of JP4970046B2 publication Critical patent/JP4970046B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Description

本発明は、特に、オーディオ信号(スピーチ及び/またはサウンド)のようなマルチメディア信号を送信または記憶する応用において、ディジタル信号をコーディング及びデコーディングすることに関する。
圧縮コーディングの分野において、多くのコーダが、サンプルの全数よりも非常に少ない幾つかのパルスを用いて、Lサンプルの信号をモデル化する。これは、例えば、特に公開文書US−2001/027393に記載された“TDAC”オーディオ・コーダのような或るオーディオ周波数コーダの場合である。該公開文書においては、各バンドもしくは帯域における変更され正規化された離散余弦変換係数が、インターリーブされたサイズの代数的ディクショナリを用いてベクトルの限定子によって量子化され、これらの代数的コードは、概して、非ゼロである2、3の成分を含み、他の成分は、ゼロに等しい。これは、また、ほとんどのスピーチ・コーダが、代数的コード・エクサイティド・リニア・プリデクション(ACELP)、マルチパルス・マキシマム・ライクリフッド・クオンティゼーション(MP−MLQ)、及び他のタイプの特定のコーダにおける合成による分析を用いている場合である。革新(イノベーション)信号をモデル化するために、これらのコーダは、非ゼロである非常に少ない成分を有し、かつ所定のルールに追加的に従う位置及び振幅を有する波形から成るディクショナリを用いている。
合成による分析を用いた上述の種類のコーダ(coder)を以下に簡単に説明する。
合成による分析を用いたコーダにおいて、合成モデルは、電話周波数(Fe=8キロヘルツ(kHz))においてまたは拡げられたバンド・コーディング(50ヘルツ(Hz)から7kHzまでのパスバンド)のための一層高い周波数、例えば16kHzにおいてサンプリングされ得る、コーディングされるべき信号をモデル化するパラメータを抽出するためにコーディング時に用いられる。アプリケーション及び必要な品質に依存して、圧縮率は、1〜16まで変化する。これらのコーダは、電話バンドもしくは電話帯域においては、1秒につき2キロビット(kbps)から16kbpsまでのビット・レートで動作し、そして拡張されたバンドもしくは帯域においては、6kbpsから32kbpsまでのビット・レートで動作する。
コーディング/デコーディング・スピーチ信号に対して現在最も広く用いられているものである、合成による分析を用いた、CELPディジタル・コーディックの簡単な説明を以下に行う。スピーチ信号は、サンプリングされて、フレームと呼ばれるL’サンプルの一連のブロックに変換される。一般的ルールとして、各フレームは、サブフレームと呼ばれるLサンプルの一層小さいブロックに分割される。各ブロックは、時間的に変化する2つのフィルタを介して、利得によって乗算されるディレクトリ(ディクショナリとも呼ばれる)から抽出された波形をフィルタリングすることにより合成される。励起ディクショナリは、Lサンプルの有限のセットの波形である。第1のフィルタは、長期間予測(LTP)フィルタである。LTP分析は、音声化されたサウンド(代表的には、基本ピッチの周波数(ボーカル・コードの振動周波数)を表す)の周期的性質を利用する、このLTPフィルタのパラメータを評価する。第2のフィルタは、短期間予測フィルタである。線形予測コーディング(LPC)分析方法は、声道(ボーカル・トラクト)の伝達関数及び信号のスペクトルの特性を表す(代表的には、唇、舌の位置及び喉頭の位置等によって取られる形状から帰結する変調を表す)短期間予測パラメータを得るために用いられる。
革新シーケンスを決定するために用いられる方法は、合成による分析として知られた方法である。コーダにおいて、励起ディクショナリからの多くの革新シーケンスは、LTP及びLPCフィルタによってフィルタリングされ、CELP規準として概して知られている、知覚的な重み付け規準に従って元の信号に最も近い合成信号を生成する波形が選択される。
CELPコーダ及びCELPデコーダは当業者に良く知られているという理解の上で、これらの合成による分析コーダにおけるマルチパルス・ディクショナリの使用を以下に簡単に説明する。
ITU−T G.723.1規準の多数のビット・レート・コーダは、マルチパルス・ディクショナリを用いる合成による分析を用いたコーダの良い例である。ここで、パルス位置はすべて別々である。コーダの2つのビット・レート(6.3kbps及び5.3kbps)は、高いビット・レートに対し6または5、低いビット・レートに対し4、の小さい数の非ゼロ・パルスだけを含むディクショナリから抽出された波形によって革新信号をモデル化する。これらのパルスは、振幅+1または−1のものである。その6.3kbpsモードにおいて、G.723.1のコーダは、2つのディクショナリを交互に使用する:
・ 偶数のサブフレームに対して使用される、第1のディクショナリにおいて、波形は6パルスを備え、そして
・ 奇数のサブフレームに対して使用される、第2のディクショナリにおいて、それらは5つのパルスを備える。
双方のディクショナリにおいて、単一の制限が、すべて同じパリティを有さなければならない、任意のコード・ベクトルのパルスの位置に課せられ、すなわち、それらはすべて偶数であるかまたはすべて奇数でなければならない。5.3kbpsモード・ディクショナリにおいては、4つのパルスの位置は、一層厳重に制約される。高いビット・レート・モードのディクショナリと同じパリティの制約とは別に、各パルスに対して位置の制限された選択がある。
5.3kbpsモード・マルチパルス・ディクショナリは、ACELPディクショナリの良く知られたファミリィに属する。ACELPディレクトリの構造は、インターリーブされた単一パルス置換(ISPP)技術に基づいており、それは、L位置のセットをKのインターリーブされたトラックに分割することから成り、Nパルスは、或る予め限定されたトラック内に配置される。幾つかのアプリケーションにおいて、コード・ワードの寸法Lは、L+Nに拡張され得る。従って、ITU−T G.723.1コーダの低いビット・レート・モード・ディレクトリの場合において、60サンプルのブロックの寸法は、64サンプルに拡張され、32の偶数(場合によっては奇数)の位置が、長さ8の4つの非重複のインターリーブされたトラックに分割される。従って、4つのトラックの2つのグループがあり、1つは各パリティ用である。以下の表1は、各パルス(Pulse)i〜iのための偶数の位置(Position)に対して4つのトラックを述べている。
Figure 0004970046
表1: 5.3kbpsモードG.723.1コーダのACELPディクショナリのパルスの位置及び振幅
ACELP革新ディクショナリは、合成による分析を用いた多くの規準化されたコーダ(ITU−T G.723.1、 ITU−T G.729、 IS−641、 3GPP NB−AMR、 3GPP WB−AMR)において用いられる。以下の表2〜表4は、40サンプルのブロック長さのためのこれらのACELPディクショナリの数例を述べている。パリティの制約は、これらのディクショナリにおいては用いられていないということに留意されたし。表2は、8kbpsモードITU−T G.729コーダ、IS−641 7.4kbpsモード・コーダ、並びに7.4及び7.95kbpsモード3GPP NB−AMRコーダにおいて用いられる、振幅±1の4つの非ゼロ・パルス、及び17ビットのためのACELPディクショナリをカバーする。
Figure 0004970046
表2: 8kbpsモードITU−T G.729コーダ、7.4kbpsモードIS−641コーダ、並びに7.4及び7.95kbpsモード3GPP NB−AMRコーダのACELPディクショナリのパルスの位置及び振幅
表3は、各コード・ベクトルが振幅±1の10の非ゼロ・パルスを含む12.2kbpsモード3GPP NB−AMRコーダに用いられる35ビットのためのACELPディクショナリをカバーする。40サンプルのブロックは、各々が2つのパルスを含む長さ8の5つのトラックに分割される。同じトラックの2つのパルスは、重複することができ、振幅±2の単一のパルスに帰結するということに留意されたし。
Figure 0004970046
表3: 12.2kbpsモード3GPP NB−AMRコーダのACELPディクショナリのパルスの位置及び振幅
最後に、表4は、ITU−T G.729コーダの低いビット・レート(6.4kbps)拡張において、かつ5.9kbpsモード3GPP NB−AMRコーダにおいて用いられる振幅±1の2つの非ゼロ・パルス並びに11ビットのためのACELPディクショナリをカバーする。
Figure 0004970046
表4: 6.4kbpsモードITU−T G.729コーダ、並びに5.9kbpsモード3GPP NB−AMRコーダのACELPディクショナリのパルスの位置及び振幅
マルチパルス・ディクショナリを“探索する”ということが意味することを以下に説明する。
任意の量子化動作のように、コーディングされるべきベクトルの最適なモデル化を追及することは、ディクショナリのコード−ベクトルのセット(またはサブセット)から、それに最も近く“似ている”もの、すなわち、それとその入力ベクトルとの間の測定された距離を最小にするものを選択することにある。ディクショナリを“探索する”と称するステップは、この目的のために行われる。
マルチパルス・ディクショナリの場合において、このことは、モデル化されるべき信号の近接性を最適化するパルスと、パルスの選択から帰結する信号との組み合わせを追及することとなる。ディクショナリのサイズ及び/または構造に依存して、この探索は、網羅的であるかまたは非網羅的であり得る(従って、多かれ少なかれ複雑である)。
上で言及したTDACコーダに用いられるディクショナリは、タイプIIの置換コードの結合(ユニオン)であるので、正規化された変換係数のベクトルをコーディングするためのアルゴリズムは、(いわゆる“絶対リーダ”ベクトルを用いて)距離規準の制限された数だけを計算する、すべてのコーダ−ベクトルからその最も近い隣人(ネイバー(neighbor))を決定するためにこの特性を利用する。
合成による分析を用いたコーダにおいて、マルチパルス・ディクショナリの探索は、小さいディクショナリの場合を除いて網羅的ではない。一層高いビット・レートのディクショナリの小さいパーセンテージだけが探索される。例えば、マルチパルスACELPディクショナリが、概して、2つの段階で探索される。この探索を単純化するために、第1の段階は、入力信号に依存した信号を単に量子化することにより各々の可能なパルス位置の振幅(従って、符号、上述を参照されたし)を予め選択する。パルスの振幅は固定されているので、(CELP規準に一致した)合成による分析の技術を用いるために検索されるのはパルスの位置である。ISPP構造を用いるにもかかわらず、そしてパルスの小さい数にもかかわらず、位置の組み合わせの網羅的な検索は、低いビット・レートのディクショナリ(代表的には、12ビット以下)に対してのみ行われる。このことは、例えば、6.4kbpsモードG.729コーダ(表4参照)に用いられる11ビットACELPディクショナリに当てはまり、それにおいて、最良のものを選択するために、2つのパルスの位置の512の組み合わせがすべてテストされ、このことは、対応の512CELP規準を計算することになる。
一層高いビット・レートのディクショナリに対して、種々の収束法が提案されてきた。表現“収束された検索”が、次に、用いられる。
これらの従来技術の方法の幾つかは、上述した標準化されたコーダにおいて用いられる。それらの目的は、モデル化されるべき信号の特性に基づいて探索されるべき位置の組み合わせの数を減少することである。一例は、多くの標準化されたACELPコーダによって用いられる“深さ−第1ツリー”アルゴリズムであり、それにおいて、合成及び知覚的な重みフィルタから構成されるフィルタ、過去の合成信号、入力信号に依存して、ターゲット信号のトラックの局部最大数のような或る位置に優先権が与えられる。用いられるディクショナリのサイズに依存して、これの幾つかの変形がある。35ビット及び10パルス(表3参照)のためのACELPディクショナリを探索するために、第1のパルスは、ターゲット信号の全体的最大値と同じ位置に置かれる。この後に、連続的トラックの循環配列による4つの反復(逐次代入、イテレーション)が続く。各反復(イテレーション)で、第2のパルスの位置が、他の4つのトラックの1つの局部最大値に固定され、残りの他の8つのパルスの位置は、インターリーブされたループにおいて対で順次に探索される。256(8×8×4の対)の異なった組み合わせが各反復(イテレーション)上で検査され、このことは、ディクショナリの225の中の10のパルスの位置の1024の組み合わせだけが探索され得ると言うことを意味する。異なった変形は、IS641のコーダにおいて用いられ、それにおいて、17ビット及び4つのパルス(表2参照)に対するディクショナリの組み合わせの一層高いパーセンテージが探索される。パルス位置の8192(=213)の組み合わせの内の768の組み合わせが検査される。8kbps G.729コーダにおいて、同じACELPディクショナリは、異なった収束法によって探索される。アルゴリズムは、4つのパルスの検索ループ(パルスごとに1つ)をインターリーブすることにより、繰返し検索を行う。該検索は、(最初の3つのトラックの局部最大値及び平均値である)これもまたターゲット信号の特性に依存する適合スレショールドを超える際に、内部ループ(トラック3または4に属する最後のパルスに対する検索)へのエントリを条件付けることにより収束される。さらに、4つのパルスの組み合わせの探索の最大数は、1440(8192の組み合わせの17.6%を表す)に固定される。
6.3kbpsモードG.723.1コーダにおいて、5つ(または6つ)のパルスの
Figure 0004970046
の組み合わせのすべては探索されない。各チャートに対して、アルゴリズムは、パルスの位置及び振幅を順次に探索するために、既知の“マルチパルス”分析を用いる。ACELPディクショナリのように、検査される組み合わせの数を制限する変形例がある。
しかしながら、上述の技術は、以下の問題点を蒙る。
マルチパルス・ディクショナリの探索は、その幾分最適な探索でさえ、計算時間に関して値段のかかる動作を多くのコーダにおいて構成する。例えば、6.3kbpsモードG.723.1及び8kbpsモードG.729コーダにおいて、検索は、コーダの全複雑さの半分近くを表す。NB−AMRコーダに対して、それは、全複雑さの三分の一を表す。TDACコーダに対しては、それは全複雑さの四分の一を表す。
平行して多くの呼び出しを管理するゲートウェイのようなまたは多くのマルチメディア・コンテントを配分するサーバのような同じプロセッサ・ユニットによって、複数のコーディング動作が行われなければならない場合に、この複雑さが重要になるということが特に明瞭である。複雑さの問題は、ネットワーク上を巡回する圧縮フォーマットの多様性によって強調される。
移動性及び連続性を提供するために、現代の及び革新的なマルチメディア通信サービスは、広範な種類の条件下で動作することができなければならない。ネットワーク、アクセス・ポイント及びターミナルの不均一な性質及びマルチメディア通信セクタのダイナミズムは、極めて多量の圧縮フォーマットを発生してきており、通信システムにおけるその存在は、カスケード(トランスコーディング)でまたは並列で(マルチフォーマット・コーディングまたはマルチモード・コーディング)のいずれかで多数のコーディングを必要とする。
用語“トランスコーディング”の意味を以下に説明する。送信システムにおいて、コーダによって送られる圧縮された信号フレームが同じフォーマットではもはや進行することができない場合に、トランスコーディングは必要となる。トランスコーディングは、フレームを、送信システムの残りのものと適合する(コンパチブル)もう1つのフォーマットに変換する。最も基本的な解決法(従って、現在において最も普及した使用におけるもの)は、デコーダとコーダとを背中あわせに置くことである。圧縮されたフレームは、第1のフォーマットで到着し、圧縮解除(復元、デコンプレス)される。圧縮解除された信号は、次に、通信システムの残りものによって受容される第2のフォーマットで圧縮される。デコーダ及びコーダのこのようなカスケードは、“タンデム”と称される。この解決法は、複雑さに鑑みて(本質的には記録のために)非常に高価であり、元の信号の劣化されたバージョンであるデコーディングされた信号上で第2のコーディングが行われるので、品質を劣化させる。さらに、フレームは、その送信先に達する前に幾つかのタンデムに遭遇し得る。計算コスト及び品質のロスが想像に難くない。さらに、各タンデム動作にリンクされる遅延が累積され、呼び出しの相互作用力を危険にさらし得る。
さらには、複雑さは、同じコンテントが1つ以上のフォーマットに圧縮されるというマルチフォーマットの圧縮システムにおける問題をも惹起する。これは、異なった顧客のターミナル・ネットワーク及びアクセス状態に適合した複数のフォーマットに同じコンテントを同報通信するコンテント・サーバの場合である。このマルチコーディング動作は、必要とされるフォーマットの数が増加するにつれて極端に複雑となり、このことは、システムのリソースを急速に飽和させる。
並列における多数コーディングのもう1つの場合は、後での(ポステリオリ、posteriori)決定マルチモード圧縮である。複数の圧縮モードが、コーディングされるべき信号の各セグメントに与えられ、与えられた規準を最適化するもしくは最良のビット・レート/ひずみの妥協点(トレードオフ)を達成するものが選択される。再度、圧縮モードの各々の複雑さは、その数を制限し、及び/またはモードの非常に小さい数の事前(プライオリ、priori)選択をもたらす。
上述の問題を解決する従来技術の方法を以下に説明する。
新しいマルチメディア通信アプリケーション(例えば、オーディオ及びビデオ・アプリケーション)は、しばしば、カスケード(トランスコーディング)でのまたは並列(マルチコーディング及び後での(ポステリオリ)決定マルチモード・コーディング)でのいずれかでの複数のコーディング動作を必要とする。これらのすべてのコーディング動作から生じる複雑さの障害の問題は、現在の処理パワーにおける増加にもかかわらず、解決されるべき状態のままである。ほとんどの従来技術の多数のコーディング動作は、フォーマット間の並びにコーダEのフォーマット及びそのコンテント間の相互作用を考慮しない。それにもかかわらず、2、3の知的トランスコーディング技術が提案されてきており、それら技術は、デコーディングし、次に、記録することによってのみ満足されるだけでなく、代わりに、コーディング・フォーマット間の類似点を利用しており、それにより、結果の劣化を制限しつつ複雑さが減少され得る。
いわゆる“知的”トランスコーディング方法を以下に説明する。
コーダ(CELP、パラメトリック、変換、等)の同じファミリィにおけるすべてのコーダは、信号から同じ物理パラメータを抽出する。それにもかかわらず、これらのパラメータをモデル化及び/または量子化することについての多くの種類がある。従って、同じパラメータは、コーダごとに同じ方法で、または非常に異なってコーディングされ得る。
さらに、コーディングは、厳密に同一であって良く、またはパラメータの計算及びモデル化について同一であって良いが、コーディングがいかにしてビットの形態に変換されるかにおいて単に異なっている。最後に、コーディングは、パラメータをモデル化し量子化することについて、もしくは、その分析またはサンプリング周波数についてさえ、完全に異なっていて良い。
ビット形態への変換を含め、モデル化及びパラメータ計算が厳密に同一ならば、第1のコーダによって発生されたビット・ストリームから、第2のものへ、対応のビット・フィールドをコピーすれば充分である。この大いに都合の良い状況は、例えば、適合励起(LTP遅延)のためにG.729標準からIS−641標準へのトランスコーディング上で生じる。
同じパラメータに対して、2つのコーダが、計算されたパラメータのビット形態への変換についてのみ異なっているならば、第1のフォーマットのビット・フィールドをデコーディングし、次に、それを、第2のフォーマットのコーディング方法を用いて、バイナリ領域に戻せば充分である。この変換も一対一の対応テーブルによって行われ得る。これは、例えば、G.729標準からAMR標準(7.4kbps及び7.95kbpsモード)に、固定された励起をトランスコーディングする際の状況である。
上の2つの状況において、パラメータをトランスコーディングすることは、ビット・レベルに留まる。単純なビット操作は、該パラメータを、第2のコーディング・フォーマットと適合させる。他方、もし、信号から抽出されたパラメータが、2つのコーディング・フォーマットによって異なってモデル化されるかまたは量子化されるならば、一方から他方への通過は、このような簡単な事柄ではない。幾つかの方法が提案されてきた。それらは、パラメータ・レベル、励起レベル、またはデコーディングされた信号レベルで動作する。
パラメータ領域においてトランスコーディングするために、パラメータ・レベルに留まることは、もし、2つのコーディング・フォーマットが同じ方法でパラメータを計算し、かつ異なった方法でそれを量子化する場合には、可能である。量子化の差は、選択された方法(スカラ、ベクトル、予報、等)または精度に関連し得る。次に、パラメータをデコーディングし、それを第2のコーディング・フォーマットの方法を用いて量子化すれば充分である。その従来技術の方法は、現在では、特に、励起利得をトランスコーディングするために用いられている。デコーディングされたパラメータは、しばしば、それが再量子化される前に変更されなければならない。例えば、もし、コーダが異なったパラメータ分析頻度、もしくは異なったフレーム/サブフレーム長さを有するならば、パラメータを補間/デシメート(decimate)することが標準的に行われている。補間は、例えば、公開文書US2003/033142に記載された方法によって行われ得る。もう1つの変更オプションは、第2のコーディング・フォーマットによってそれに課せられる精度にパラメータをラウンド・オフ(round off)することである。この状況は、基本周波数(“ピッチ”)の高さに対するほとんどの部分に対して遭遇される。
パラメータ領域内のパラメータをトランスコーディングすることが可能でないならば、デコーディングは、一層高いレベルに行くことができる。このことは、信号領域からそう遠くに行くこと無しで、励起領域である。この技術は、Speech Coding,2000,Proceedings 2000,IEEE Workshop on Speech Coding,78−80頁のHong−Goo Kang, Hong Kook Kim,Cox,R.V.,による文献“清浄なフレーム消去されたチャンネル環境におけるスピーチ・コーダのトランスコーディング能力の改良”において、利得に対して提案されている。
最後に、最後の解決法(最も複雑で最も“知的”でない)は、合成された信号に基づいて、コーダがそうであるように、パラメータを明瞭に再計算することにある。この動作は、ある種の部分的タンデムに相当し、幾つかのパラメータだけが全体的に再計算される。この方法は、固定化された励起、上に引用されたIEEE基準における利得、またはピッチのような異なったパラメータに適用されてきた。
パルスをトランスコーディングするために、パラメータを迅速かつ一層低い価格で計算するよう幾つかの技術が開発されてきたけれども、今日利用可能な幾つかの解決法は、もう1つのフォーマットにおける等価パラメータから1つのフォーマットのパルスを計算する知的なアプローチを用いている。合成による分析を用いたコーディングにおいて、パルス・コードの知的トランスコーディングは、モデル化が同一(または近い)の場合にのみ適用される。対照的に、モデル化が異なっている場合には、部分的タンデム法が用いられる。この動作の複雑さを制限するために、ターゲット信号のような導出された信号またはデコーディングされた信号の特性を利用する、収束されたアプローチが提案されてきているということに留意されたし。上で引用された文献US−2001/027393において、MDCT変換コーダを用いた実施形態では、知的トランスコーディングの特別な場合が考慮され得るビット・レート変化手順が記載されている。その手順は、第2のディクショナリからのベクトルを用いて第1のディクショナリからのベクトルを再量子化する。このため、それは、再量子化されるべきベクトルが第2のディクショナリに属するか否かに依存して、2つの状況間で区別する。量子化されたベクトルが新しいディクショナリに属するならば、モデル化は同一であり、もしそうでないならば、部分的なデコーディング方法が適用される。
上述の従来技術のすべてとそれ自体区別して、本発明は、パルスのセットの集合(ensemble)のパルス位置の組み合わせのサブセットを、パルスのセットのもう1つの集合のパルス位置の組み合わせから選択することに基づいたマルチパルス・トランスコーディングの方法を提案するものであり、2つの集合は、それらが含んでいるパルスの数によって、かつそれらの位置及び/またはそれらの振幅を制御するルールによって、区別されるものである。トランスコーディングのこの形態は、カスケード(トランスコーディング)におけるまたは特に並列(マルチコーディング及びマルチモード・コーディング)における多数のコーディングに対して非常に利益的である。
このため、本発明は、最初に、第1の圧縮コーデックと第2の圧縮コーデックとの間でトランスコーディングする方法を提案する。第1及び第2のコーデックは、パルス・タイプのものであり、各パルスが関連のインデックスによってマーキングされる位置を有するマルチパルス・ディクショナリを使用する。
本発明のトランスコーディング方法は、以下のステップを含む:
a) 適切な場合に、前記第1及び第2のコーデック間でコーディング・パラメータを適合させるステップと、
b) 第1のコーデックから、パルス位置の選択された数及びそれらと関連したそれぞれの位置インデックスを得るステップと、
c) 与えられたインデックスの各現在のパルス位置に対して、少なくとも現在のパルス位置並びに与えられたインデックスの直ぐ下の及び直ぐ上の関連のインデックスを有するパルス位置を含むパルス位置のグループを形成するステップと、
d) ステップc)で形成された前記グループのユニオンによって構成された集合におけるパルス位置の少なくとも幾つかを第2のコーデックによって受容されたパルス位置の関数として選択するステップと、
e) 送られた位置からコーディング/デコーディングするために、第2のコーデックに選択されたパルス位置を送るステップと、
を含む。前記選択ステップd)は、従って、第2のコーデックのディクショナリにおけるパルス位置の全数よりも少ないパルス位置の数に関連する。
もし、ステップe)において、第2の上述のコーデックがコーダであるならば、選択されたパルス位置は、送信された位置だけを探索することにより、コーディングのための該コーダに送信される、ということが特に明瞭である。もし、第2の上述のコーデックがデコーダであるならば、選択された位置は、デコーディングされるべき位置に対して送信される。
ステップb)は、第1のコーデックが第1のコーディング・フォーマットにおいて使用するパルス位置の第1の数を識別するよう、第1のコーデックによって供給されるビット・ストリームの部分的レコーディングを使用するのが好ましい。従って、ステップb)において選択された数は、パルス位置のこの第1の数に対応するのが好ましい。
長所的な実施形態においては、上述のステップは、その趣旨のプログラム命令を含むソフトウェア・プロダクトによって実行される。この点に関して、本発明は、また、プロセッサ・ユニットの、特に、コンピュータまたは移動端末の、メモリに記憶されるよう適合された、もしくは、プロセッサ・ユニットの読取り器と協働するよう適合された取り外し可能なメモリ媒体上に記憶されるよう適合された、上述の種類のソフトウェア・プロダクトにも向けられている。
本発明は、また、第1及び第2の圧縮コーデック間でトランスコーディングするための装置にも向けられており、その場合において、該装置は、上述のタイプのソフトウェア・プロダクトの命令を記憶するよう適合されたメモリを含んでいる。
本発明の他の特徴及び利点は、添付図面を参照して為される以下の詳細な説明から明瞭となるであろう。
最初に、本発明は、マルチパルス・ディクショナリを用いたオーディオ(スピーチ及び/またはサウンド)信号のようなディジタル・マルチメディア信号をモデル化すること並びにコーディングすることに関するものであることに留意されたし。それは、カスケードにおけるまたは並列(平行)における多数のコーディング/デコーディングの文脈において、またはマルチパルス表示により信号をモデル化する任意の他のシステムの文脈において、履行され得るものであり、該任意の他のシステムは、第1の集合(ensemble)に属するパルスの第1のセットの情報に基づいて、第2の集合のパルスの少なくとも1つのセットを決定しなければならないものである。簡潔さのために、第1の集合からもう1つの集合への通路だけを説明したが、本発明は、の集合(n≧2)への通路にも等しく適用される。さらに、以下では、2つのコーダ間の“トランスコーディング”の状況だけを説明するが、コーダ及びデコーダ間のトランスコーディングももちろん大した困難性無しでこのことから推論され得る。
従って、2つのコーディング・システムに対応するパルスのセットによって信号をモデル化する場合を考慮する。図1a及び1bは、第1のコーディング・フォーマットCOD1を用いた第1のコーダEと、第2のコーディング・フォーマットCOD2を用いた第2のコーダSとの間のトランスコーダDを表している。コーダEは、一連のコーディングされたフレームの形態で、コーディングされたビット・ストリームSCEをトランスコーダDに出力する。トランスコーダDは、第1のコーディング・フォーマットで用いられるパルス位置の数Ne及びそれらパルスの位置Peを回収するための部分デコーダ・モジュール10を含んでいる。以下に詳細に明らかになるように、本発明のトランスコーダは、各パルス位置Peの右手ネイバー(neighbor)v 及び左手ネイバーv を抽出し、そして第2のコーダSによって認識されるこれらの近隣(neighborhoods)の結合において、パルス位置を選択する。従って、図1a及び1bに表されるトランスコーダのモジュール11は、位置(図1a及び1bにSjで示される)のこの選択を第2のコーダSに出力するためにこれらのステップを行う。この選択Sjから、第2のコーダSによって普通用いられるディクショナリよりも小さいサブディレクトリが構成されるということが特に明瞭であり、このことは、本発明の利点の1つである。このサブディレクトリを用いて、コーダSによって行われるコーディングは、もちろん、一層高速であり、その理由は、これがコーディング品質を劣化させること無く一層制限されるからである。
図1aに表されて例においては、トランスコーダDは、さらに、第1のコーダEが出力するコーディングされたストリームSCEを少なくとも部分的にデコーディングするためのモジュール12を含んでいる。モジュール12は、次に、第2のコーダSに、元の信号Sの少なくとも部分的にデコーディングされたバージョンS’を供給する。第2のコーダSは、次に、該バージョンS’に基づくコーディングされたビット・ストリームSCSを出力する。
従って、この形態において、トランスコーダDは、第2のコーダSによる一層高速の(一層制限されているという理由で)コーディングを長所的に与える、第1のコーダEと第2のコーダSとの間のコーディング適合を行う。もちろん、これに対する代替例として、図1a及び1bにSで参照されるエンティティは、デコーダであっても良く、この変形例においては、本発明のトランスコーダDは、コーダEとデコーダSとの間で適切にトランスコーディングを行い、このデコーディングは、トランスコーダDによって供給される情報のために高速である。プロセスは可逆的であるので、一層一般的には、本発明の意味において、トランスコーダDは、第1のコーデックE及び第2のコーデックSの間で動作するということが明瞭である。
コーダE、トランスコーダD及びコーダSの配列は、図1aに表されるように、“カスケード”構成に一致し得るということに留意されたし。図1bに表された変形例においては、この配列は、“並列(平行)”構成に一致し得る。この場合、2つのコーダE及びSは、元の信号Sを受信し、そして2つのコーダE及びSは、それぞれ、コーディングされたストリームSCE及びSCSを出力する。もちろん、ここで、第2のコーダSは、図1aからのバージョンS’をもはや受信する必要が無く、そして少なくとも部分的なデコーディングのためのトランスコーダDのモジュール12は、もはや必要では無い。もし、コーダEがモジュール11の入力(パルスの数とパルスの位置)と適合する出力を提供することができるならば、モジュール10は、単に省略され得、もしくは、バイパスされ得るということにさらに留意されたし。
さらに、トランスコーダDには、前述のステップを履行するための命令を記憶するメモリと、これらの命令を処理するためのプロセッサとが単に装備され得るということに留意されたし。
従って、本発明は以下のように適用され得る。第1のコーダEは、与えられた信号S(例えば、元の信号)上でそのコーディング動作を行ってきた。従って、第1のコーダEによって選択されたパルスの位置が利用可能である。該コーダは、コーディング・プロセス中にそれ自体の技術を用いてこれらの位置Peを決定した。第2のコーダSもそのコーディングを行わなければならない。トランスコーディングの場合において、第2のコーダSは、第1のコーダによって発生されたビット・ストリームだけを有し、そして本発明は、ここで、上述した“知的”トランスコーディングに適用可能である。並列(平行)における多数のコーディングの場合において、第2のコーダSも第1のコーダが有する信号を有し、そして、ここに、本発明は、“知的マルチコーディング”に適用される。複数のフォーマットにおける同じコンテントをコーディングすることを必要するシステムは、他のフォーマットをコーディングするのを単純化するよう第1のフォーマットの情報を利用することができる。本発明は、また、後での(ポステリオリ)決定マルチモード・コーディングを構成する並列(平行)における多数のコーディングの特定の状況にも適用され得る。
本発明は、第1のフォーマットのパルスの位置Pe(以下にeとして互いに交換可能に示される)から、もう1つのコーディング・フォーマットに対するパルスの位置Ps(以下にsとして互いに交換可能に示される)を迅速に決定するために用いられ得る。それは、可能な位置の数を制限することにより、第2のコーダのためのこの動作の計算の複雑さをかなり減少する。このため、それは、第2のコーダのすべての可能な位置から位置の制限されたセットを限定するために、第2のコーダによって選択された位置を使用し、その制限されたセットにおいては、パルスのための位置の最良のセットが探索される。このことは、標準の網羅的なまたは収束された検索に対し信号の劣化を制限しつつ、その複雑さにおける相当の増加に帰結する。
従って、本発明は、第1のコーディング・フォーマットからの位置に基づいて、位置の制限されたセットを限定することにより、可能な位置の数を制限することが明瞭である。それは、現存の解決法が、優先権を与えることにより及び/または位置を除去することにより、可能な位置の数を制限するようモデル化されるべき信号の特性だけを用いているという点において、現存の解決法とは異なっている。
第1の集合のセットの各パルスに対して、可変の幅の及び一層大きいまたは一層小さい制約の2つのネイバー(右上の1つと左上の1つ)が限定されるのが好ましく、そこから可能な位置の集合が抽出され、その内部において、第2の集合の制約を満たすパルスの少なくとも1つの組み合わせが予め選択される。
トランスコーディング方法は、認可された複雑さの及び/または開始位置のセットの関数として各サブフレームごとにまたは処理の開始においてのいずれかで、各パルスごとの右手及び左手の近隣のそれぞれのサイズ(パルス位置の組み合わせについて)及び/またはパルス位置の数を適合させることにより、複雑さ/品質の妥協点(トレードオフ)を最適にするという利点を有する。本発明は、また、直接の近隣を長所的に好むことにより、位置の組み合わせの数を調節/制限する。
上述したように、本発明は、また、第2の集合のパルスの組み合わせを構成するのを容易にするネイバー位置を抽出するために特に設計されたアルゴリズムを有するソフトウェア・プロダクトにも向けられている。
上述したように、ネットワーク及びコンテントの混成の性質は、大いに変えられたコーディング・フォーマットを利用し得る。コーダは、多くの特性によって区別され得、特にその内の2つ、サンプリング周波数及びサブフレームの期間、が本発明の動作のモードを実質的に決定する。これらの状況に適合した本発明の実施形態との対応関係において、オプションを以下に説明する。
図2は、これらの状況を要約している。最初に、以下のものが得られる:
・ パルス位置の数Ne、Ns
・ それぞれのサンプリング周波数Fe、Fs、及び
・ サブフレーム期間Le、Ls
これらは、それぞれ、コーダE及びSによって用いられる(ステップ21)。従って、適合のステップ及びパルス位置の数Ne、Nsを回収するステップは、長所的に取り替えられ得、もしくは、単に同時に行われ得るということがすでに明瞭である。
サンプリング周波数は、テスト22において比較される。周波数が等しいならば、サブフレーム期間がテスト23において比較される。等しくないならば、サンプリング周波数は、以下に説明する方法によってステップ32において適合される。テスト23に続いて、もし、サブフレーム期間が等しいならば、それぞれ、第1及び第2のコーディング・フォーマットによって用いられるパルス位置の数Ne及びNsが、テスト24において比較される。等しくないならば、サブフレーム期間は、これもまた以下で説明する方法を用いて、ステップ33において適合される。ステップ22、23、32及び33は、一緒に、コーディング・パラメータを適合させる上述のステップa)を限定することが明瞭である。一方ではステップ22及び32(サンプリング周波数の適合)、そして他方ではステップ23及び33(サブフレーム期間の適合)は、取り替えられ得るということに留意されたい。
サンプリング周波数が等しくかつサブフレーム期間が等しいという状況を最初に以下に説明する。
これは、最も好ましい状況であるが、それにもかかわらず、第1のフォーマットが、テスト24の結果に従って、第2の(Ne≧Ns)及び反対の状況(Ne<Ns)よりも多いパルスを使用するという状況を区別することが必要である。
* 図2におけるNe≧Ns
原理は以下の通りである。2つのコーダE及びSのディレクトリは、それぞれ、各サブフレームにおいてNe及びNsのパルスを用いる。
コーダEは、サブフレームSeに渡ってそのNeのパルスの位置を計算する。これらの位置は、互いに交換可能に以下でe及びpで示される。コーダSのディレクトリのパルスに対する特権が与えられた位置の制限された集合Psは、次に、Neの位置eから作られ、それらの近隣は、
Figure 0004970046
で表され、ここに、ν 及びν ≧0 は、パルスの右手及び/または左手の近隣のサイズである。図2におけるステップ27で選択されるν 及びν の値は、必要とされる品質及び複雑さに従って、より大きいかまたはより小さい。これらのサイズは、処理の開始において、任意に固定され得るか、または、各サブフレームsごとに選択され得る。
図2におけるステップ29において、集合Psは、次に、各位置e並びにその右手ネイバーν 及びその左手ネイバーν を含む。
次に、コーダSのディレクトリからNsのパルスの各々ごとに、Psによって提案されたものの中の1つを取るように該パルスが認可された位置を限定することが必要である。
このため、Sのディレクトリの構成を総括するルールが導入される。SのNsパルスが位置の予め限定されたサブセットに属し、パルスの与えられた数が、認可された位置の同じサブセットを共有するということが仮定される。例えば、12.2kbpsモード3GPP NB−AMRコーダの10のパルスが、上述の表3に示されるように5つの異なったサブセットに2つずつ配分される。Ns’は、異なった位置のサブセットの数を示し(Ns’=5であるので、この例においてはNs’≦Ns)、そしてT(j=1〜Ns’)は、Sのディレクトリを限定する位置のサブセットを示す。
集合Psから出発して、集合Tの1つとPsとの交差から帰結するNs’のサブセットSは、式 S=Ps∩T から図2におけるステップ30において構成される。近隣ν 及びν はどんな交差も空であるべきでない充分なサイズのものでなければならない。従って、パルスの開始セットの関数として、必要ならば、隣人のサイズの調節を許容することが必要である。これは、近隣のサイズにおける増加(ステップ35)と、交差の1つが空である場合にステップc)(図2におけるステップ29)において形成されるグループの結合(ユニオン)Psの定義への復帰と共に、図2におけるテスト34の目的である。他方、交差Sのいずれも空でないならば、それは、コーダSに送られるこれらの交差Sから成るサブディレクトリである(終了ステップ31)。
本発明は、ディレクトリの構造を長所的に利用する。例えば、コーダSのディレクトリがACELPタイプのものであるならば、それは、トラックの位置の、計算されたPsとの交差である。コーダEのディレクトリもACELPタイプのものであるならば、近隣抽出手順もトラック構造を利用し、近隣を抽出し、かつ位置の制限されたサブセットを構成するステップは、慎重に結合される。特に、第2の集合の制約に従って、パルスの結合の構成を考慮することは、近隣抽出アルゴリズムにとって有益である。以後明らかになるように、近隣抽出アルゴリズムは、第2の集合のパルスの結合の構成を容易にするために生成される。以後に説明する実施形態(2つのパルスを有するACELPから4つのパルスを有するACELPまで)の1つは、この種のアルゴリズムの例である。
従って、位置の可能な結合の数は小さく、コーダSのディレクトリのサブセットのサイズは、元のディレクトリのサイズよりも概して非常に小さく、このことは、最後から二番目のトランスコーディング・ステップの複雑さを多いに減少する。パルス位置の組み合わせの数は、上述のサブセットのサイズを限定する。パルスの位置の組み合わせの数における減少をもたらし、かつ制限されたサイズのサブディレクトリを得るのを可能とするのは、本発明が減少するパルス位置の数である。
図3におけるステップ46は、次に、減少されたサイズの該サブディレクトリにおけるNsパルスのための位置の最良のセットの検索を始めることにある。選択規準は、コーディング・プロセスのものと同様である。さらに複雑さを減少するために、このサブディレクトリの探索は、上述した従来技術の収束技術を用いて促進され得る。
図3は、コーダEがコーダSと少なくとも同じ位多くのパルスを用いている状況に対して本発明のステップを要約している。しかしながら、図2を参照してすでに指摘したように、第2のフォーマット(Sのフォーマット)に対する位置の数Nsが、第1のフォーマット(Eのフォーマット)に対する位置の数Neよりも大きいならば、処理は、後述する2、3の有利な変形例においてのみ異なる。
概略的に、図3のステップは、以下のように要約される。(必要な場合にのみ存在し、従って、図3におけるブロック41において点線で表されている)コーディング・パラメータを適合させるステップa)の後:
・ コーダEのパルスの位置e、好ましくは位置の数Neを回復し、(上述のステップb)に対応するステップ42)
・ 隣人を抽出し、以下の式に従って隣人のグループを形成し、
Figure 0004970046
(上述のステップc)に対応するステップ43)
・ 図3に表されたステップ44に対応する、上述のステップd)の選択を形成する位置の制限されたサブセット{S=Ps∩T}を構成し、そして
・ 該選択をコーダSに送る(上述のステップe)に対応するステップ45)。このステップ45の後、コーダSは、次に、ステップ44で得られた制限されたディレクトリにおける位置のセットを選択する。
従って、次のステップは、上で示した位置の第2の数Nsを含む最適な位置のセット(opt(S))のためのコーダSによって受信されるサブディレクトリを探索するステップ46である。サブディレクトリの探索を促進するために、位置の最適なセットを検索するステップ46は、好ましくは、収束された検索によって履行される。処理は、第2のコーダSによってその後に行われるコーディングと共に当然に続く。
次に、第1のコーディング・フォーマットによって用いられたパルスの数Neが、第2のコーディング・フォーマットによって用いられたパルスの数Nsよりも小さい状況に対して与えられる処理の形態を説明する。
* 図2におけるNe<Ns
SのフォーマットがEのフォーマットより大きいパルスを用いる場合には、プロセスは、上で説明したのと同様である。しかしながら、Sのフォーマットのパルスは、制限されたディレクトリにおける位置を有さないかもしれない。この場合には、第1の実施形態において、全ての可能な位置が、これらのパルスに対して認可される。第2の及び好適な実施形態においては、隣人V’及びV’のサイズは、図2におけるステップ28において単に増加される。
* 図2におけるNe<Ns<2Ne
ここでは、特別な場合が強調されなければならない。NeがNsに接近している場合には、代表的には、Ne<Ns<2Neの場合には、次に、処理の上述の形態が全体的に適用可能なままであるとしても、位置を決定するための好適な方法が予想される。複雑さにおけるさらなる減少は、Eのものに基づいてSのパルスの位置を直接固定することによって得られ得る。SのNeの第1のパルスは、Eのものの位置に置かれる。残りのNs−Neのパルスは、(それらの直ぐの隣人において)第1のNeパルスにできる限り接近して置かれる。図2のステップ25は、次に、数Ne及びNsが接近しているか否か(Ne>Nsの場合)をテストし、接近している場合、ステップ26におけるパルス位置の選択は、上述の通りである。
もちろん、双方の場合、Ne<Ns及びNe<Ns<2Neにおいて、交差Sの一方が上述の注意にかかわらず、空であるならば、近隣V 、V のサイズは、Ne≧Nsの状況において説明したように、ステップ35において単に増加される。
最後に、すべての場合において、交差Sのいずれも空でないならば、交差Sによって形成されたサブディレクトリは、第2のコーダSに送られる(ステップ31)。
次に、第1及び第2のフォーマットのコーディング・パラメータが、特にそれらのサンプリング周波数及びサブフレーム期間において同じでない場合に、適合ステップa)において用いられる処理の形態を説明する。
後続の状況が、次に、区別される。
* サブフレーム期間が等しいが、サンプリング周波数が異なっている
この状況は、図2におけるテスト22に対して“n”(いいえ)に、そしてステップ23に対して“y”(はい)に対応する。適合ステップa)は、次に、図2におけるステップ32に適用される。
先の処理は、2つのフォーマットが同じ時間副分割を有さないので、ここでは直接に適用されることができない。サンプリング周波数が異なっているので、2つのフレームは、同じ期間に渡って、サンプルの同じ数を有さない。
タンデムが行うであろうように、コーダEのフォーマットのものを考慮せずに、コーダSのフォーマットのパルスの位置を決定するのではなく、むしろ、2つの異なった実施形態を構成する処理の2つの異なった形態が、ここでは提案される。それらは、2つのフォーマットの位置間での対応を創設することにより複雑さを制限し、その後に、処理は、(あたかもサンプリング周波数が等しいかのように)上述した処理に戻る。
第1の実施形態の処理は、第2のフォーマットのものによる第1のフォーマットの時間スケールの直接の量子化を用いる。一覧表にされ得るか式から計算され得るこの量子化動作は、第1のフォーマットのサブフレームの各位置に対して、第2のフォーマットのサブフレームにおけるその等価物を見つけるか、またはその逆である。
例えば、2つのフォーマットのサブフレームにおける位置Pe及びPs間の対応は、以下の式によって限定され得、
Figure 0004970046
ここに、Fe及びFsは、それぞれE及びSのサンプリング周波数であり、Le及びLsは、それらのサブフレームの長さであり、
Figure 0004970046
は、整数部分を示す。
プロセッサ・ユニットの特性に依存して、この対応は、上の式を用いることができ、または、Leの値に対して長所的に一覧表にされることができる。中間の解決法も、第1のleの値(le=Le/d、ここに、dは、Le及びLsのうち最も高い共通因子である)だけを一覧表にすることにより選択され得、残りの位置は、次に、容易に推論される。
Sのサブフレームの複数の位置を、Eのサブフレームの位置に対応させることも可能であるということに留意されたし。例えば、
Figure 0004970046
のすぐ下及びすぐ上の位置を保持する。
上述の一般的処理は、位置Peに対応する位置Psの集合から出発して適用される(近隣の抽出、パルスの組み合わせの構成、最適な組み合わせの選択)。
サブフレーム期間が等しいが、サンプリング周波数が異なっているこの状況は、コーダEが3GPP NB−AMRタイプのものであり、コーダSがWB−AMRタイプのものである実施形態を参照して、以下の表5a〜5dに見られる。NB−AMRコーダは、8kHzのサンプリング周波数に対して40サンプルのサブフレームを有する。WB−AMRコーダは、12.8kHzにおいて、サブフレームごとに64サンプルを使用する。双方の場合において、サブフレームは、5msの期間を有する。表5aは、WB−AMRサブフレームに対してNB−AMRサブフレームにおける位置の対応を与え、表5bは、逆の対応を与える。表5c及び5dは、制限された対応表である。
Figure 0004970046
表5a: NB−AMRからWB−AMRへの時間対応表
Figure 0004970046
表5b: WB−AMRからNB−AMRへの時間対応表
Figure 0004970046
表5c: NB−AMRからWB−AMRへの制限された時間対応表
Figure 0004970046
表5d: WB−AMRからNB−AMRへの制限された時間対応表
簡略的に述べれば、以下のステップが適用される(図2a参照):
a1) 第1の周波数から第2の周波数への直接のタイムスケールの量子化(図2aにおけるステップ51)、
a2) 該量子化の関数として、第1のサンプリング周波数によって特徴付けられる第1のコーディング・フォーマットを有するサブフレームにおけるパルス位置から、第2のサンプリング周波数によって特徴付けられる第2のコーディング・フォーマットを有するサブフレームにおける各パルス位置の決定(図2aにおけるステップ52)。
総括的な用語において、量子化ステップa1)は、第2のフォーマットを有するサブフレームにおけるパルス位置Psを、第1のフォーマットを有するサブフレームにおけるパルス位置Peに対応させる関数からの計算及び/または作表によって行われ、該関数は、実際、第1のサンプリング周波数に対する第2のサンプリング周波数の比に対応する乗数係数に関連する線形結合の形態をとる。
さらに、第2のフォーマットを有するサブフレームにおけるパルス位置Psから、第1のフォーマットを有するサブフレームにおけるパルス位置Peに、反対方向に行くためには、もちろん、第2のフォーマットを有するサブフレームにおけるパルス位置Psに適用されるこの線形結合の逆関数が適用される。
明らかに、トランスコーディング・プロセスは、完全に可逆的であり、他方のトランスコーディング方向(S→E)に関して、一方のトランスコーディング方向(E→S)に等しく適合されるものとしている。
サンプリング周波数の適合の第2の実施形態は、サンプリング周波数の原理の通常の変更を用いる。第1のフォーマットによって発見されるパルスを含むサブフレームから出発して、2つのサンプリング周波数Fe及びFsの最小公倍数に等しい周波数において、オーバーサンプリングが適用される。次に、低域フィルタリングの後、第2のフォーマットのサンプリング周波数、すなわち、Fsに戻るようにアンダーサンプリングが適用される。Eからのフィルタリングされたパルスを含む周波数Fsにおいて、サブフレームが得られる。再度、オーバーサンプリング/LP(低域)フィルタリング/アンダーサンプリング動作の結果は、Eのサブフレームの各可能な位置に対して作表され得る。この処理は、“オン・ライン”計算によっても行われ得る。サンプリング周波数適合の第1の実施形態におけるように、Sの1つまたは複数の位置が、以下に説明されるように、Eの位置と関連し得、そして上述した本発明の意味において一般的処理が適用される。
図2bに表される変形例に示されるように、以下のステップが適用される:
a’1) 第1及び第2のサンプリング周波数の最小公倍数に等しい周波数Fpcmにおいて、第1のサンプリング周波数によって特徴付けられる第1のコーディング・フォーマットを有するサブフレームをオーバーサンプリングすること(図2bにおけるステップ53)、及び
a’2) オーバーサンプリングされたサブフレームに低域フィルタリングを適用し(図2bにおけるステップ54)、その後、第2のサンプリング周波数に対応するサンプリング周波数を達成するようアンダーサンプリングすることを続ける(図2bにおけるステップ55)。
プロセスは、上述の第1の実施形態におけるように、Eのパルスから適合される(ステップ56)、位置の数、おそらくは、位置の可変の数を、好ましくは、閾値方法によって得ることにより続く。
* サンプリング周波数が等しいが、サブフレーム期間が異なっている
サンプリング周波数が等しいがサブフレーム期間が異なっている状況において実行されるプロセスを次に説明する。この状況は、テスト23に対して“n”であるが、図2のテスト22に対しては“o”に対応する。適合ステップa)は、次に、図2におけるステップ33に適用される。
上述の状況におけるように、近隣抽出ステップは、このようなものとして、直接適用されることはできない。最初に、2つのサブフレームを適合させることが必要である。ここで、サブフレームは、サイズにおいて異なっている。この不適合性に直面して、タンデムが行うようにパルスの位置を計算するのではなく、むしろ、好適な実施形態は、第1のフォーマットのパルスの位置から第2のフォーマットのパルスのための位置の組み合わせの制限されたディレクトリを決定する、低い複雑さの解決法を提供する。しかしながら、Sのサブフレーム及びEのサブフレームは同じサイズではないので、SのサブフレームとEのサブフレームとの間の直接の時間的対応を創設することは可能ではない。(E及びSのサブフレームがそれぞれST及びSTで示される)図4に示されるように、2つのフォーマットのサブフレームの境界は、整列しておらず、時間に渡って、サブフレームは互いに対してシフトしている。
好適な実施形態においては、Eの励起を、Sのタイミング・レートにおいて、擬似サブフレーム、すなわち、Sの励起のサイズに分割することが提案されている。擬似サブフレームは、図5においてST’で示されている。実際において、これは、E及びSに共通のオリジンに対して位置を整列させるよう、サブフレームのサイズの差を考慮した2つのフォーマットにおける位置間の時間的対応を創設することに匹敵する。その共通のオリジンの決定は、後で詳細に説明する。
そのオリジンに対する第1のフォーマット(それぞれ第2のフォーマット)の位置P (それぞれP )は、サブフレームに対するE(それぞれS)のサブフレームi(それぞれj)の位置Pe(それぞれPs)と一致する。従って:
0≦Pe<Leかつ0≦Ps<Lsの場合、P =Pe+iかつP=Ps+j
Eのフォーマットのサブフレームiの位置Peに対して、Sのフォーマットをサブフレームjの位置Psが対応し、Ps及びjは、それぞれ、E及びSに共通のオリジンOに対するPeの位置P のLsによるユークリッド分割の余り及び商である。
Figure 0004970046
ここに、0≦Pe<Leかつ0≦Ps<Lsである。
Figure 0004970046
は、整数部分であり、≡は、モジュラスを示し、E(それぞれS)のサブフレームのインデックスは、共通オリジンOに対して与えられる。
従って、サブフレームjにおける位置Peは、上述の一般的プロセスによりサブフレームjにおけるSのパルスのための位置の制限された集合を決定するために用いられる。しかしながら、Le>Lsならば、Sのサブフレームは、何等パルスを含み得ない。図6の例においては、サブフレームSTE0のパルスは、垂直ラインによって表わされている。Eのフォーマットは、サブフレームの終わりでSTE0のパルスを非常に良く集中させ得、この場合において、擬似サブフレームSTE’0は、何等パルスを含まない。Eによって置かれるパルスのすべては、分割時にSTE’1に発見される。この場合において、従来の収束された探索が、擬似サブフレームSTE’0に適用されるのが好ましい。
2つのフォーマットに共通の時間オリジンOの決定のための好適な実施形態を次に説明する。その共通の基準は、位置(番号0)を構成し、該位置から、パルスの位置が引き続くサブフレームにおいて番号付けられる。この位置0は、本発明のトランスコーディング方法を用いたシステムに依存して、種々の方法で限定され得る。例えば、送信システム設備に含まれるトランスコーダ・モジュールに対しては、該設備がスタート・アップした後に受信される第1のフレームの第1の位置をオリジンに対して取ることが自然である。
しかしながら、その選択の欠点は、位置がますます大きな値を取り、それらを制限することが必要になり得るということである。このためには、可能な場合にはいつも、共通のオリジンの位置を更新すれば充分である。従って、もし、E及びSのサブフレームのそれぞれの長さLe及びLsが時間に渡って一定であるならば、共通のオリジンの位置は、E及びSのサブフレームの境界が整列される時間ごとにリセットされる。このことは、周期的に生じ、(サンプルで表わされる)該周期は、Le及びLsの最小公倍数に等しい。
Le及び/またはLsが時間中一定でないという状況も予想され得る。がサブフレーム番号を表わす場合のLe(n)及びLs(n)で現在示される2つのサブフレームの長さに共通の倍数を見つけることはもはや可能ではない。この場合において、作動中に値Le(n)及びLs(n)を合計すること及び各サブフレームにおいて得られる2つの合計を比較することが必要である:
Figure 0004970046
Te(k)=Ts(k’)である各時間ごとに、共通のオリジンは、更新される(そして、位置k×Leまたはk’×Lsにおいて取られる)。2つの合計Te及びTsは、リセットされるのが好ましい。
簡単かつ一層一般的に述べれば、第1の(それぞれ第2の)コーディング・フォーマットのサブフレーム期間を、第1の(それぞれ第2の)サブフレーム期間と呼べば、サブフレーム期間が異なっているときに実行される適合ステップは、図7に要約され、好ましくは、以下のようである:
a20) 第1及び第2のフォーマットでサブフレームに共通のオリジンOを限定する(ステップ70)、
a21) 第1のサブフレーム期間によって特徴付けられる第1のコーディング・フォーマットを有する引き続くサブフレームを、第2のサブフレーム期間に対応する期間L’eの擬似サブフレームに分割する(ステップ71)、
a22) 共通のオリジンOを更新する(ステップ79)、そして
a23) 擬似サブフレームP’eにおける及び第2のフォーマットを有するサブフレームにおけるパルス位置間の対応を決定する(ステップ80)。
共通のオリジンOを決定するために、図7におけるテスト72において以下の場合が区別される:
・ 第1及び第2の期間は時間中に固定される(テスト72から出る“o”);及び
・ 第1及び第2の期間は時間中に変る(テスト72から出る“n”)。
前者の場合においては、共通のオリジンの時間位置は、第1の期間St(Le)及び第2の期間St(Ls)のそれぞれのサブフレームの境界が時間中に整列するごとに(テスト73はこれらの境界に与えられる)、周期的に更新される(ステップ74)。
第2の場合においては、以下の場合であるのが好ましい:
a221) サブフレームの第1のフォーマットTe(k)との及びサブフレームの第2のフォーマットTs(k’)とのそれぞれの合計が引き続き行われる(ステップ76)、
a222) 前記2つの合計が等しいことが検出され、前記共通のオリジンを更新するための時間を限定する(テスト77)、及び
a223) 次の共通のオリジンの未来の検出のために、前記等しいことが検出された後、前述の2つの合計がリセットされる(ステップ78)。
さて、サブフレーム期間とサンプリング周波数とが異なっている状況においては、上述の2つの状況に対して説明したE及びSの位置間の対応のアルゴリズムを慎重に結合すれば充分である。
* 実施形態
本発明によるトランスコーディングの3つの実施形態を次に説明する。3つの実施形態は、合成による分析を用いた標準のスピーチ・コーダにおいて上で説明した状況で与えられる処理のアプリケーションを記載している。最初の2つの実施形態は、サンプリング周波数とサブフレーム期間が同一であるという好ましい状況を示している。最後の実施形態は、サブフレーム期間が異なっているという状況を示している。
* 第1の実施形態
第1の実施形態は、6.3kbpsモードG.723.1 MP−MLQモデルと、4つのパルスを有する5.3kbpsモードG.723.1 ACELPモデルとの間の知的トランスコーディングに適用される。
高ビット・レートからG.723.1の低ビット・レートまでの知的トランスコーディングは、4つのパルスを有するACELPモデルと共に、6つ及び5つのパルスを有するMP−MLQモデルを利用する。ここで説明する実施形態は、MP−MLQパルスの位置から4つのACELPパルスの位置を決定する。
G.723.1コーダの動作を以下に要約する。
ITU−T G.723.1の多数ビット・レート・コーダ及びそのマルチパルス・ディレクトリを上で説明してきた。G.723.1フレームが8kHzにおいて240サンプルを含み、各々60サンプルの4つのサブフレームに分割されるということを言えば充分である。同じ制限が、3つのマルチパルス・ディクショナリの各々の任意のコード−ベクトルのパルスの位置上に課せられる。これらの位置は、すべて、同じパリティを有していなければならない(それらは、すべて偶数であるかまたはすべて奇数でなければならない)。60(+4)の位置のサブフレームは、従って、各々が32の位置の2つのグリッドに分割される。偶数のグリッドは、[0、2、4、・・・、58、(60、62)]で番号付けられた位置を含んでいる。奇数のグリッドは、位置[1、3、5、・・・、59、(61、63)]を含んでいる。各ビット・レートごとに、ディレクトリの探索は、網羅的ではないけれども、上述したように複雑なままである。
6.3kbpsモードG.723.1 MP−MLQディレクトリの素子から5.3kbpsモードG.723.1 ACELPディレクトリのサブセットを選択するのを次に説明する。
第1のコーディング動作中に決定された6.3kbpsモードMP−MLQ G.723.1ディレクトリの素子を知っている、5.3kbpsモードG.723.1 ACELPディレクトリからの素子によりサブフレームの革新信号をモデル化することが目的である。従って、6.3kbpsモードG.723.1コーダによって選択されたパルスのNeの位置(Ne=5または6)が利用可能である。
例えば、Ne=5パルスによってモデル化される励起を有するサブフレームのための6.3kbpsモードG.723.1コーダのビット・ストリームから抽出された位置は、以下の通りであるということが仮定され得る。
=0; e=8; e=28; e=38; e=46;
サンプリング周波数またはサブフレーム期間の適合がここでは必要とされないということを思い起されたし。位置eを回復するこのステップの後、引き続くステップは、次に、これらの5つのパルスの右手及び左手の近隣を直接に抽出することにある。右手及び左手の近隣(neighborhodds)は、ここでは、2に等しいものとして取られている。選択された位置の集合Psは、以下の通りである。
Figure 0004970046
第3のステップは、前記ディレクトリ(表1に表される)によって認可された偶数トラック(それぞれ奇数トラック)の位置の4つの集合と共にPsのNs=4の交差を取ることにより、5.3kbpsモードG.723.1コーダのACELPディレクトリの各パルス(ここでは1つのトラック)のための可能な位置の制限された集合を構成することにある。
偶数パリティに対して、
Figure 0004970046
であり、ここに、
Figure 0004970046
である。
奇数パリティに対して、
Figure 0004970046
であり、ここに、
Figure 0004970046
である。
これらの選択された位置の組み合わせは、検索が行われる新しい制限されたディレクトリを構成する。このステップのために、最適な位置のセットを選択するための手順は、5.3kbpsモードG.723.1コーダにおけるように、CELP規準に基づいている。探索は、網羅的であり得るが、好ましく収束される。
制限されたディレクトリにおける位置の組み合わせの数は、5.3kbpsモードG.723.1コーダのACELPディレクトリの位置の8192(=2×8×8×8×8)の組み合わせの代わりに、180(=4×3×3×4+2×1×3×3)に等しい。
組み合わせの数は、(本例では偶数パリティである)6.3kbpsモードに対して選択されたパリティだけを考慮することにより、さらに制限され得る。この場合において、制限されたディレクトリにおける組み合わせの数は、144に等しい。
関係する近隣のサイズに依存して、4つのパルスの1つに対して集合Psは、ACELPモデルのトラックのための何等位置を含み得ない(集合Siの1つが空であるという状況)。従って、サイズ2の近隣に対して、Neパルスの位置がすべて同じトラック上にあるとき、Psは、該トラック及び隣接のトラックの位置だけを含む。この場合において、必要とされる品質/複雑さの妥協点(トレードオフ)に依存して、(該トラックの位置の集合を制限しないことになる)Tiで集合Siを置き換えるか、またはパルスの右手の(または左手の)近隣を増加することのいずれかが可能である。例えば、6.3kbpsモードのコーダのパルスのすべてがトラック2上にあり、右手及び/または左手の近隣が2に等しいならば、次に、トラック0は、パリティにかかわらず位置を持たないであろう。次に、該トラック0に位置を割り当てるために、左手及び/または右手の近隣のサイズを2だけ増加すれば充分である。
この実施形態を示すために、以下の例を考慮する:
=4; e=12; e=20; e=36; e=52;
選択された位置の集合Psは以下の通りである:
Figure 0004970046
同じパリティを保持することが望まれたと仮定すれば、4つのパルスのためのこれらの位置の初期の分割は以下の通りである:
=φ; S={2、10、18、34、50}; S={4、12、20、36、52}; S={6、14、22、38、54}
パルスの左手の近隣を2だけ増加することにより、以下を得る:
={0、8、16、32、48}; S={2、10、18、34、50};
={4、12、20、36、52}; S={6、14、22、38,54}
(従って、S≠φの場合)
* 第2の実施形態
以下の第2の実施形態は、同じ長さのACELPモデル間の知的トランスコーディングに本発明を適用したものを示す。特に、この第2の実施形態は、8kbpsモードG.729の4つのパルスを有するACELPモデルと、6.4kbpsモードG.729の2つのパルスを有するACELPとの間の知的トランスコーディングに適用される。
G.729コーダの6.4kbps及び8kbpsモード間での知的トランスコーディングは、2つのパルスを有する1つのACELPディレクトリ及び4つのパルスを有する第2のACELPディレクトリを用いる。ここで説明する実施形態は、2つのパルス(6.4kbps)の位置から4つのパルス(8kbps)の位置を決定し、及びその逆を決定する。
ITU−T G.729エンコーダの動作を簡単に説明する。このコーダは、6.4、8及び11.8kbpsの3つのビット・レートで動作し得る。最初の2つのビット・レートをここでは考慮する。G.729フレームは、8kHzにおいて80サンプルを含み、各々40サンプルの2つのサブフレームに分割される。各サブフレームに対して、G.729は、ACELPモデルに一致するパルスにより革新信号をモデル化する。それは、8kbpsモードに対して4つのパルスを用い、6.4kbpsモードに対して2つのパルスを用いる。上の表2及び4は、パルスがこれら2つのビット・レートに対して採用することができる位置を与える。6.4kbpsにおいては、位置のすべて(512)の組み合わせの網羅的な検索が行われる。8kbpsにおいては、収束された検索が用いられるのが好ましい。
本発明による一般的処理がここで再度用いられる。しかしながら、2つのディレクトリに共通のACELP構造がここで利用されるのが長所的である。従って、位置のセット間の対応を確率することは、以下の表6に述べるように、40サンプルのサブフレームを各々8位置の5つのトラックに分割することを利用する。
Figure 0004970046
表6: G.729ACELPディクショナリにおける5つのトラックに位置を分割する
2つのディレクトリにおいて、パルスの位置は、以下の表7に示すように、3つのトラックを共用する。
パルスのすべては、それらのトラック及び該トラックにおけるそれらのランクによって特徴付けられる。8kbpsモード(Mode)は、パルス(Pulses)を最初の3つのトラック(Tracks)の各々上に置き、最後のパルスを最後の2つのトラックの1つ上に置く。6.4kbpsモードは、その最初のパルスをトラックPまたはP上に置き、その第2のパルスをトラックP、P、PまたはP上に置く。
Figure 0004970046
表7: 8及び6.4kbpsモードG.729のACELPディレクトリのパルスを5つのトラックに分割
この実施形態は、近隣を抽出し、位置の制限された部分集合(subensembles)を構成するのを容易にするために、トラック(ISSP構造)のインターリービングを利用する。従って、1つのトラックからもう1つのトラックに移動するためには、右または左に1単位シフトさせれば充分である。例えば、トラック2の5番目の位置(絶対位置22)において、右への1単位のシフト(+1)は、トラック3上の5番目の位置(絶対位置23)に行き、左への1単位のシフト(−1)は、トラック1上の5番目の位置(絶対位置21)に行く。
一層一般的には、±dの位置シフトは、ここでは以下の影響において反映される。
トラックPiのレベルにおいて:
右手の近隣: Pi⇒P(i+d)≡5
左手の近隣: Pi⇒P(i−d)≡5
トラックにおけるランクmのレベルにおいて:
* 右手の近隣:
if (I+d)≦4: m ⇒ m
if not: m ⇒ m+1
* 左手の近隣:
if (I−d)≧0: m ⇒ m
if not: m ⇒ m−1
6.4kbpsモードG.729コーダの2つのパルスを有するACELPディレクトリの素子から、8kbpsG.729コーダの4つのパルスを有するACELPディレクトリの部分集合を選択することを次に説明する。
6.4kbpsモードG.729サブフレームを考慮する。2つのパルスは、コーダによって置かれるが、8kbpsモードG.729が置かなければならない他のパルスの位置を決定することが必要である。複雑さを完全に制限するために、パルスごとに1つの位置だけが選択され、位置の1つの組み合わせだけが保持される。このことは、従って、選択ステップが直接的であるという利点を有する。8kbpsモードG.729の4つのパルスのうちの2つは、6.4kbpsモードのものと同じ位置によって選択され、その後、残りの2つのパルスが、最初の2つのすぐ近隣に置かれる。上述したように、トラックの構造が利用される。2つの位置のバイナリ・インデックス(9つのビット上)をデコーディングすることにより、2つの位置を回復する第1のステップにおいて、対応の2つのトラックも決定される。(同一であって良い)これら2つのトラックから、近隣を抽出し、制限された部分集合を構成し、そしてパルスの組み合わせを選択する、最後の3つのステップは、次に、慎重に関連される。異なった場合が、2つの6.4kbpsモード・パルスを含むトラックPi(i=0〜4)に従って、次に識別される。
6.4kbpsモード・パルスの位置は、eで示され、8kbpsモード・パルスの位置は、sで示される。以下の表8は、各場合における選択された位置を与える。“Pj+d=Pi”で表わされている列は、トラックのレベルにおいて、近隣の法律を特定し、かつトラックPiにおいて終結する。トラックPiのレベルにおいて:
* 右手の近隣に対して: Pi ⇒ P(i+d)≡5
* 左手の近隣に対して: Pi ⇒ P(i−d)≡5
Figure 0004970046
表8: 6.4kbpsモードG.729ACELPディレクトリの2つのパルスから、8kbpsモードG.729の制限されたディレクトリを選択
従って、目的は、異なった選択が行われるけれども、2つの開始位置に対して、4つの位置の配分をバランスすることであることが好ましい。(表8に括弧書きの指数で示された)4つの状況が、それにもかかわらず、周辺効果の問題を生じ得る:
状況(1): e=0ならば、s=e−1を取ることができず、s=e+2を選択する。
状況(2): e=39ならば、s=e+1を取ることができず、s=e−1を選択する。
状況(3): e=38ならば、s=e+2を取ることができず、s=e−2を選択する。
状況(4): e=39ならば、s=e+1を取ることができず、s=e−3を選択する。
複雑さをさらに減少するために、各パルスsの符号は、それが推論されるパルスeの符号と等しく取られ得る。
4つのパルスを有する8kbpsモードG.729ACELPディレクトリの素子から、2つのパルスを有する6.4kbpsモードG.729ACELPディレクトリの部分集合を選択することを、次に説明する。
8kbpsモードG.729サブフレームに対して、第1のステップは、8kbpsモードによって発生される4つのパルスの位置を回復することである。これら4つの位置のバイナリ・インデックス(13ビット上の)をデコーディングすることは、最初の3つの位置(トラック0〜2)に対するそれらのそれぞれのトラックにそれらのランクをもたらし、そして該トラックにおけるそのランクと一緒に4番目のパルスのトラック(3または4)にそれらのランクをもたらす。各位置e(0≦i<4)は、pがそのトラックのインデックスであり、mが該トラックにおけるそのランクである対によって特徴付けられる。ここで、
=5m+p
この場合、I<3に対して0≦m<8かつp=i、そしてp=3または4である。
すでに述べたように、近隣抽出及び制限された部分集合構成は、組み合わされて、2つのディレクトリに共通のISSP構造を長所的に利用する。5つのトラックPとの、4つの位置の近隣の集合Psの5つの交差T’は、トラックをインターリービングすることにより誘導される隣接位置所有権を利用することにより構成される:
T’=P∩P
従って、パルス(p、m)の+1(それぞれ、−1)の右手(それぞれ左手)の近隣は、p<4ならば、T’p+1に(それぞれ、p>0ならば、T’p−1に)属し、そうでない(p=4)ならば、m<7という条件でT’に(それぞれ、m>0という条件でT’(I=0)に)属する。4番目のトラックに属する4番目のパルスの位置のための右手のネイバーに関する(それぞれ、第1のトラックの位置のための左手のネイバーに関する)制限は、隣の位置がサブフレームの外側にないということを確実にする。
従って、モジュロ(法)5の表記法(ノーテーション)(≡5)を用いれば、パルス(p、m)の+1(それぞれ、−1)の右手(それぞれ左手)のネイバーは、T’(p+1)≡5に(それぞれ、T’(p−1)≡5に)属する。周辺効果を考慮することが必要であるということに留意されたし。近隣サイズdに一般化して、パルス(p、m)の+dの右手ネイバー(それぞれ、−dの左手ネイバー)は、T’(p+d)≡5に(それぞれ、T’(p−d)≡5に)属する。±dのネイバーのランクは、p+d≦4(またはp−d≧0)ならば、mに等しく、そうでないならば、ランクmは、右手ネイバーに対して増分され、左手ネイバーに対して減分される。従って、周辺効果を考慮することは、p+d>4ならば、m<7、そしてp−d<0ならば、m>0ということを確実にすることとなる。
5つのトラックにおけるネイバーのこの配分から出発して、2つのパルスの位置の部分集合S及びSを決定することは、簡単な事柄である:
=T’∪T’及びS=T’∪T’∪T’∪T’
4番目及び最後のステップは、得られた2つの部分集合における最適な対を検索することにある。検索アルゴリズム(トラック構造を利用する標準化されたアルゴリズムのような)及びパルスのトラックごとの記憶は、再度、検索アルゴリズムを単純化する。実際、従って、集合T’が単独で用いられるので、制限された部分集合S及びSを明白に構成することは、無益である。
以下の例において、4つの8kbpsモードG.729パルスが、以下の位置に置かれた:
=5; e=21; e=22; e=34
これら4つの位置は、4つの対によって特徴付けられる。
(p、m)=(0、1)、(1、4)、(2、4)、(4、6)
1に等しい固定された近隣(neighborhood)を取ると、5つの交差T’は、以下のように構成される:
Figure 0004970046
従って、
Figure 0004970046
位置の表記法(ノーテーション)に戻して、
Figure 0004970046
最後のステップにおいて、G.729 6.4kbpsモードのものと同様のアルゴリズムは、パルスの最良の対に対する検索を行う。該アルゴリズムは、探索されるべき位置の組み合わせの数が非常に小さいので、ここでは、ましてや複雑ではない。該例において、テストされるべき組み合わせの数は、単に4(カーディナル(T’)+カーディナル(T’))に8(カーディナル(T’)+カーディナル(T’)+カーディナル(T’)+カーディナル(T’))を乗算しただけであり、すなわち、512の代わりに32の組み合わせだけである。
サイズ1の近隣に対して、8%より少ない位置の組み合わせが、10%(50の組み合わせ)を超えることなく、平均で探索されるべきである。サイズ2の近隣に対して、17%より少ない位置の組み合わせが、平均で探索されるべきであり、そして多くても25%の組み合わせが探索されるべきである。サイズ2の近隣に対して、(制限されたディレクトリを探索する価格、及び交差の構成と関連した近隣を抽出する価格を一緒に一まとめにする)本発明によって提案された処理の複雑さは、30%より少ない等価の品質に対する網羅的な検索を表わす。
* 第3の実施形態
最後の実施形態は、8kbpsモードG.729 ACELPモデル及び6.3kbpsモードG.723.1 MP−MLQモデル間の通過を示す。
G.723.1(6.3kbpsモード)及びG.729(8kbpsモード)間のパルスの知的トランスコーディングは、2つの主な困難を伴う。最初に、フレームのサイズが異なっている(G.723.1に対しては、60サンプルであるのに対して、G.729に対しては40サンプル)。第2の困難性は、ディクショナリの異なった構造にリンクされる(G.729に対してはACELPタイプ及びG.723.1に対してはMP−MLQタイプ)。ここで説明する実施形態は、トランスコーディングの品質を保持しつつ減少した価格でパルスをトランスコーディングするために、本発明がこれらの2つの問題をいかに除去するかを示している。
まず、時間的対応は、E及びSに共通のオリジンに対して位置を整列させるために、サブフレームのサイズの違いを考慮して、2つのフォーマットにおける位置間でセットアップされる。G.729及びG.723.1サブフレームの長さが120の最小公倍数を有するので、時間的対応は、120のサンプルのブロックによってセットアップされ、すなわち、図4bの例に示されるように、3つのG.729サブフレームごとに2つのG.723.1サブフレームによってセットアップされる。代替的には、フレームの完全なブロック上で動作することが好ましいかも知れない。この場合において、240サンプルのブロックが選択され、すなわち、3つのG.729フレーム(6つのサブフレーム)ごとにG.723.1フレーム(4つのサブフレーム)が選択される。
次に、4つのパルスを有する8kbpsモードG.729ACELPディレクトリの素子から、6.3kbpsモードG.723.1MP−MLQディレクトリの部分集合を選択することを説明する。第1のステップは、3つのG.729サブフレーム(インデックスiを有する、0≦i≦2)のブロックによってパルスの位置を回復することにある。サブフレームiにおける該ブロックの位置は、p(i)で示される。
近隣の抽出の前に、12の位置p(i)が、(インデックスjの、0≦j≦1)2つのG.723.1サブフレームに分割された12の位置p(i)に変換される。上の一般的な式は、サブフレームの期間の適合を行うために(サブフレームの長さのモジュラスに関連して)用いられ得る。しかしながら、インデックスiの値に従って、3つの状況を区別することがここでは単に好ましい:
=0ならば、次に、j=0及びp=pである
=2ならば、次に、j=1及びp=p+20である
=1ならば、次に、p<20の場合に、j=0及びp=p+40である
そうでない場合に(p≧20)、j=1及びp=p−20である
従って、どんな分割及びどんな動作モジュロnも行われない。
ブロックのサブフレームSTE0において回復された4つの位置は、同じ位置を有するサブフレームSTS0に直接割り当てられ、ブロックのサブフレームSTE2のそれらは、+20の位置増分を有するサブフレームSTS1に直接割り当てられ、20以下のサブフレームSTE1の位置は、+40の増分を有するサブフレームSTS0に割り当てられ、そして、他は、−20の増分を有するサブフレームSTS1に割り当てられる。
これら12の位置の近隣は、次に、抽出される。それらのサブフレームから抽出されるべきサブフレームSTS0(それぞれSTS1)の位置の右手(それぞれ左手)の近隣が認可され得るということに留意されたし。これらの近隣の位置は、次に、サブフレームSTS1(それぞれSTS0)にある。
時間的対応及び近隣抽出のステップは、相互交換され得る。この場合において、それらのサブフレームから抽出されるべきサブフレームSTE0(それぞれSTE2)の位置の右手(それぞれ左手)の近隣は、認可されることができ、これらのネイバー(neighbor)の位置は、次に、サブフレームSTE1にある。同様に、STE1における位置の右手(それぞれ左手)の近隣(neighborhoods)は、STE2(それぞれSTE0)におけるネイバーの位置に導くことができる。
各サブフレームSTSごとの制限された位置の集合が構成されてしまうと、最後のステップは、同じパリティを有するNp(=6または5)パルスを選択するよう各サブフレームSTSごとにこの方法で構成される制限されたディレクトリを探索することにある。この手順は、標準化されたアルゴリズムから導出されることができるし、または他の収束手順からそのインスピレーションを取ることができる。
この実施形態を示すために、2つのG.723.1サブフレームのサブディレクトリを構成するよう用いられ得る3つのG.729サブフレームを考慮する。G.729が以下の位置をもたらすと仮定する:
Figure 0004970046
上述の時間的対応ステップのアプリケーションの後、サブフレームSTS0及びSTS1へのこれら12の位置の割り当ては、以下の通りである:
Figure 0004970046
従って、サブフレームSTS0に対して位置{1、5、32、39、44、45}及びサブフレームSTS1に対して{2、11、20、21、44、57}のセットを有する。
この段階において、近隣を抽出することが必要である。例えば、1に固定された近隣を取ると、以下が得られる:
Figure 0004970046
MP−MLQは、それらのパリティとは別にパルスに制約を課さない。サブフレームに渡って、それらはすべて同じパリティを有さなければならない。従って、以下のように、Ps0及びPs1を2つの部分集合に分割することがここでは必要である。
Figure 0004970046
最後に、このサブディレクトリは、G.723.1サブフレームFTS0及びSTS1のためのCELP規準の意味において、Nの最良の位置を決定する選択アルゴリズムに送信される。このことは、テストされるべき組み合わせの数をかなり減少する。例えば、サブフレームSTS0に、9つの偶数位置及び8つの奇数位置が、30及び30ではなく、残る。
それにもかかわらず、近隣の抽出が位置のG.723.1の数よりも少ない可能な位置の数N(N<N)をもたらすように、G.729によって選択された位置があるという状況において、或る予備注意が必要とされる。このことは、特に、G.729の位置がすべて順番にある(例えば:{0、1、2、3})場合のケースである。次に、2つのオプションがある:
・ 充分なサイズがPsに対して得られるまで(サイズ≧N)、関係するサブフレームのための近隣のサイズを増加すること、または
・ 最初のNパルスを選択し、そして、上述のように、残りのNp−Nパルスに対して、グリッドの30−Nの残りの位置の中からの検索を認可すること、のいずれかのオプション。
6.3kbpsモードG.723.1 MP−MLQディレクトリの素子から、4つのパルスを有する8kbpsモードG.729ACELPディレクトリの部分集合を選択することにある、反対処理動作を次に説明する。
全体的に、プロセスは同様である。2つのG.723.1サブフレームは、3つのG.729フレームに対応する。再度、G.723.1の位置は、抽出されて、G.729の時間フレームに変換される。これらの位置は、近隣を抽出して最適な位置を検索するようACELP構造から以前のように恩恵を受けるために、“トラック−トラックにおけるランク”の形態で長所的に変換され得る。
同じ配列は、以前にように、近隣抽出が位置の不充分な数(ここでは、4つの位置よりも少ない)をもたらすであろう状況を阻止するために採用される。
従って、本発明は、パルスの第1のセットからパルスのセットの位置を一層低価格で決定し、パルスの2つのセットは、2つのマルチパルス・ディレクトリに属する。これら2つのディレクトリは、それらのサイズ、それらのコード・ワードのパルスの長さ及び数、並びにパルスの位置及び/または振幅を制御するルールによって区別され得る。第2のディレクトリにおけるセットのそれらを決定するために、第1のディレクトリにおける選択されたセットのパルスの位置の近隣に対して優先権が与えられる。本発明は、さらに、複雑さをさらに減少するために出発及び/または目的先ディレクトリの構造を利用する。MP−MLQモデルからACELPモデルへの変化を伴う上述の第1の実施形態から、本発明は、異なった構造的制約を有する2つのマルチパルス・モデルに適用することが容易であるということが明瞭であろう。同じACELP構造に基づいてパルスの異なった数を有する2つのモデル間での通過を伴う第2の実施形態から、本発明は、トランスコーディングの複雑さを減少するために、ディレクトリの構造を長所的に利用するということが明瞭であろう。MP−MLQモデル及びACELPモデル間の通過を伴う第3の実施形態から、本発明は、異なったサブフレームの長さまたはサンプリング周波数を有するコーダにさえ適用され得るということが明瞭であろう。本発明は、品質/複雑さの妥協点(トレードオフ)を調整し、特に、マルチパルス・モデルの従来の検索に比較して、最小の劣化に対して計算の複雑さを多いに減少する。
“カスケード”構成における本発明についてのトランスコーディング文脈の図である。 “並列”構成における本発明についてのトランスコーディング文脈の図である。 行われるべき種々のトランスコーディング・プロセスの図である。 第1のコーダE及び第2のコーダSのサンプリング周波数が異なっている場合に使用するための適合プロセスの図である。 図2aのプロセスの変形例の図である。 本発明のトランスコーディング方法のステップを要約した図である。 Le>Lsである場合の、それぞれ異なった期間Le及びLsを有するが、同じサンプリング周波数を有するコーダE及びSの2つのサブフレームの図である。 G.723.1コーダ及びG.729コーダ間の時間対応を示す図4の実際的履行を表す図である。 第2のコーダSのレートにおける第1のコーダEの励起の分割を示す図である。 擬似サブフレームSTE’0の1つが空である状況を示す図である。 第1のコーダE及び第2のコーダSのサブフレーム期間が異なっている場合に使用するための適合プロセスの図である。
符号の説明
COD1 第1のコーディング・フォーマット
E 第1のコーダ
COD2 第2のコーディング・フォーマット
S 第2のコーダ
D トランスコーダ
10 部分デコーダ・モジュール
11 トランスコーダのモジュール
12 トランスコーダのモジュール


Claims (21)

  1. 第1のサウンド圧縮コーデックと、第2のサウンド圧縮コーデックとの間のトランスコーディングの方法であって、前記第1及び第2の圧縮コーデックは、パルス・タイプのものであり、各パルスが関連のインデックスによってマークされる位置を有するマルチパルス・ディクショナリを用いるものであり、前記方法は、
    a) サブフレーム期間及びサンプリング周波数の中で少なくとも1つのコーディング/デコーディング・パラメータの前記第1及び第2の圧縮コーデック間の適合を検査するとともに、適合が必要な場合に、前記第1及び第2の圧縮コーデック間で前記コーディング/デコーディング・パラメータを適合させるステップと、
    b) 第1の圧縮コーデックから、選択されたパルス位置の数(N)及びそれらと関連したそれぞれの位置インデックス(e)を得るステップと、
    c) 前記第1の圧縮コーデックから得られた、与えられたインデックスの各現在のパルス位置に対して、少なくとも現在のパルス位置並びに与えられたインデックスの直ぐ下の及び直ぐ上の関連のインデックスを有するパルス位置を含むパルス位置のグループを形成するステップと、
    d) ステップc)で形成された前記グループの結合によって構成された集合(P)におけるパルス位置の少なくとも幾つかを第2の圧縮コーデックによって受容されたパルス位置(T)の中から選択するステップと、
    e)2の圧縮コーデックに、ステップd)で選択されたパルス位置を送るステップと、を含み、前記第2の圧縮コーデックは、コーディング/デコーディングを行うために、ステップd)で選択された前記パルス位置を用い、ステップd)における前記選択は、次に、第2の圧縮コーデックによって受容されたパルス位置の全数よりも少ないパルス位置の数に関連することを特徴とする方法。
  2. 第1の圧縮コーデック(E)は、第1のコーディング/デコーディング・フォーマットにおいてパルスの第1の数を用い、ステップb)における前記選択された数(N)は、パルス位置の前記第1の数に対応することを特徴とする請求項1に記載の方法。
  3. ・ 第1の圧縮コーデック(E)は、第1のコーディング・フォーマットにおけるパルス位置の第1の数(N)を用い、
    ・ 第2の圧縮コーデック()は、第2のコーディング・フォーマットにおけるパルス位置の第2の数(N)を用い、
    第1の数(N)は、第2の数(N)以上であり(N≧N)、そして、ステップc)で形成された各グループは、与えられたインデックスの前記現在のパルス位置の右手のネイバーのパルス位置(v )及び左手のネイバーのパルス位置(v )を含み、左手及び右手のネイバーのパルス位置のそれぞれの数は、複雑さ/トランスコーディング品質の妥協点の関数としてステップc)で前記各グループを形成するように選択されることを特徴とする請求項2に記載の方法。
  4. ・ ステップc)で形成された前記グループの結合によって構成された集合(P);
    及び
    ・ 第2の圧縮コーデックによって受容されたパルス位置(T)の交差(S)から帰結するパルス位置の組み合わせのサブディレクトリがステップd)において構成され、それにより、前記サブディレクトリは、第2の圧縮コーデックによって受容されるパルス位置(T)の組み合わせの数よりも小さいサイズを有することを特徴とする請求項3に記載の方法。
  5. ステップe)の後に、前記サブディレクトリは、第2のコーダ(S)のレベルにおいて位置の前記第2の数(N)を含む位置の最適なセットのために検索されることを特徴とする請求項4に記載の方法。
  6. 位置の最適なセットのために検索するステップは、前記サブディレクトリの探索を促進するよう、収束された検索により行われることを特徴とする請求項5に記載の方法。
  7. 前記第1の圧縮コーデックは、一連のコーディングされたフレームを出力するよう適合され、そして、ステップc)で形成されたグループにおけるパルス位置のそれぞれの数は、1つのフレームから他のフレームに引き続き選択されることを特徴とする請求項1乃至6のいずれかに記載の方法。
  8. ・ 第1の圧縮コーデック(E)は、第1のコーディング/デコーディング・フォーマットにおけるパルス位置の第1の数(N)を用い、
    ・ 第2の圧縮コーデック()は、第2のコーディング/デコーディング・フォーマットにおけるパルス位置の第2の数(N)を用い、
    第1の数(N)は、第2の数(N)よりも小さく(N<N)、そして、パルス位置の第2の数(N)において提供されたパルス位置が、ステップc)で形成されたグループのパルス位置に含まれるか否かを決定するよう、さらなるテストが行われ、該テストの否定的結果の場合には、ステップc)で形成されたグループにおけるパルス位置の数が増加されることを特徴とする請求項2に記載の方法。
  9. ・ 第1の圧縮コーデック(E)は、第1のコーディング/デコーディング・フォーマットにおけるパルス位置の第1の数(N)を用い、
    ・ 第2の圧縮コーデック()は、第2のコーディング/デコーディング・フォーマットにおけるパルス位置の第2の数(N)を用い、
    第1の数Nと第1の数Nの2倍との間に第2の数Nがある(N<N<2N)ならば:
    c1) Nのパルス位置が初めから選択され; そして
    c2) ステップc1)で選択されたパルス位置の直ぐ近隣に限定されるパルス位置の補数(a complementary number)N−Nがさらに選択される、ことを特徴とする請求項2に記載の方法。
  10. 前記第1の圧縮コーデックは、与えられた第1のサンプリング周波数で、かつ与えられた第1のサブフレーム期間から動作し、そして、前記適合がステップa)で実行される前記コーディング/デコーディング・パラメータが、サブフレーム期間及びサンプリング周波数を含、前記第2の圧縮コーデックが、第2のサンプリング周波数及び第2のサブフレーム期間で動作し、そして以下の4つの状況:
    ・ 第1及び第2の期間が等しく、第1及び第2のサンプリング周波数が等しい;
    ・ 第1及び第2の期間が等しく、第1及び第2のサンプリング周波数が異なっている;
    ・ 第1及び第2の期間が異なっており、第1及び第2のサンプリング周波数が等しい; そして
    ・ 第1及び第2の期間が異なっており、第1及び第2のサンプリング周波数が異なっている;
    が、ステップa)で区別されることを特徴とする請求項1乃至9のいずれかに記載の方法。
  11. 第1及び第2の期間は等しく、第1及び第2のサンプリング周波数は異なっており、該方法は、
    a1) 第1のサンプリング周波数から第2のサンプリング周波数への直接量子化のステップと、
    a2) 第1のサンプリング周波数によって特徴付けられる第1のコーディング/デコーディング・フォーマットを有するサブフレームにおけるパルス位置から、第2のサンプリング周波数によって特徴付けられる第2のコーディング/デコーディング・フォーマットを有するサブフレームにおける各パルス位置の、前記量子化の関数としての決定のステップと、を含むことを特徴とする請求項10に記載の方法。
  12. 量子化のステップa1)は、第1のフォーマット(p)を有するサブフレームにおけるパルス位置において、第2のフォーマット(p)を有するサブフレームにおけるパルス位置の対応を創設する関数に基づく計算及び/または作表によって行われ、前記関数は、実質的に、第1のサンプリング周波数に対する第2のサンプリング周波数の比に対応する乗数係数に関連した線形結合の形態を取るものである、請求項11に記載の方法。
  13. 第1のフォーマット(p)を有するサブフレームにおけるパルス位置に第2のフォーマット(p)を有するサブフレームにおけるパルス位置を逆に通過させるために、第2のフォーマット(p)を有するサブフレームにおけるパルス位置に与えられる前記線形結合に逆関数が与えられることを特徴とする請求項12に記載の方法。
  14. 第1及び第2の期間は等しく、第1及び第2のサンプリング周波数は異なっており、該方法は、
    a’1) 第1及び第2のサンプリング周波数の最小公倍数に等しいサンプリング周波数で第1のサンプリング周波数によって特徴付けられる第1のコーディング/デコーディング・フォーマットを有するサブフレームをオーバーサンプリングするステップと、
    a’2) 低域フィルタリングをオーバーサンプリングされたサブフレームに与え、その後、第2のサンプリング周波数に対応するサンプリング周波数を得るために、アンダーサンプリングするステップと、を含むことを特徴とする請求項10に記載の方法。
  15. 当該方法は、閾値処理法によって、位置の数を、適切な場合には、位置の可変数を得ることによって続けられることを特徴とする請求項14に記載の方法。
  16. 当該方法は、さらに、第2のサンプリング周波数によって特徴付けられる第2のコーディング/デコーディング・フォーマットを有するサブフレームにおけるパルス位置(p)のグループの、第1のサンプリング周波数によって特徴付けられる第1のコーディング/デコーディング・フォーマットを有するサブフレームのパルスの各位置(p)に対する対応を創設するステップを含み、各グループは、第2のサンプリング周波数と第1のサンプリング周波数との間の比(Fs/Fe)の関数である位置の数を含むことを特徴とする請求項11に記載の方法。
  17. 第1及び第2のサブフレーム期間は異なっており、当該方法は:
    a20) 第1及び第2のフォーマットのサブフレームに共通のオリジン(O)を限定するステップと;
    a21) 第2のフォーマットのサブフレーム期間に対応する期間の擬似サブフレームを形成するよう第1のサブフレーム期間によって特徴付けられる第1のコーディング/デコーディング・フォーマットの引き続くサブフレームを分割するステップと;
    a22) 前記共通のオリジンを更新するステップと; そして
    a23) 擬似サブフレームにおけるパルス位置と、第2のフォーマットを有するサブフレームにおけるパルス位置との間の対応を決定するステップと、
    を含むことを特徴とする請求項10に記載の方法。
  18. 第1及び第2の期間は時間的に固定されており、そして、第1及び第2の期間のそれぞれのサブフレームの境界が時間的に整列されるときはいつも、前記共通のオリジンの時間的な位置が周期的に更新されることを特徴とする請求項17に記載の方法。
  19. 第1及び第2の期間は時間的に変化し、そして:
    a221) 第1のフォーマットとのサブフレームの期間の、及び第2のフォーマットとのサブフレームの期間の、それぞれの合計が連続的に行われ;
    a222) 前記共通のオリジンを更新する時間を限定して、2つの合計が等しいことが検出され;
    a223) 次の共通のオリジンの未来の検出のために、前記等しいことが検出された後、前記2つの合計がリセットされる、
    ことを特徴とする請求項17に記載の方法。
  20. ソフトウェアが記録されたコンピュータ読み取り可能記録媒体であって、該ソフトウェアは、請求項1乃至19のいずれかに記載されたトランスコーディング方法を履行するための命令を含む、コンピュータ読み取り可能記録媒体。
  21. 各パルスが関連のインデックスによってマークされた位置を有するマルチパルス・ディクショナリを用いた、パルス・タイプのものである第1のサウンド圧縮コーデック及び第2のサウンド圧縮コーデック間でトランスコーディングするためのシステムであって、請求項1乃至19のいずれかに記載されたトランスコーディング方法を履行するシステム。
JP2006543573A 2003-12-10 2004-11-24 ディジタル信号圧縮のためのコーディングのために用いられるマルチパルス・ディクショナリのインデクス間のトランスコーディング Expired - Fee Related JP4970046B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0314489 2003-12-10
FR0314489A FR2867648A1 (fr) 2003-12-10 2003-12-10 Transcodage entre indices de dictionnaires multi-impulsionnels utilises en codage en compression de signaux numeriques
PCT/FR2004/003008 WO2005066936A1 (fr) 2003-12-10 2004-11-24 Transcodage entre indices de dictionnaires multi-impulsionnels utilises en codage en compression de signaux numeriques

Publications (2)

Publication Number Publication Date
JP2007515676A JP2007515676A (ja) 2007-06-14
JP4970046B2 true JP4970046B2 (ja) 2012-07-04

Family

ID=34746280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006543573A Expired - Fee Related JP4970046B2 (ja) 2003-12-10 2004-11-24 ディジタル信号圧縮のためのコーディングのために用いられるマルチパルス・ディクショナリのインデクス間のトランスコーディング

Country Status (12)

Country Link
US (1) US7574354B2 (ja)
EP (1) EP1692687B1 (ja)
JP (1) JP4970046B2 (ja)
KR (1) KR101108637B1 (ja)
CN (1) CN1890713B (ja)
AT (1) ATE389933T1 (ja)
DE (1) DE602004012600T2 (ja)
ES (1) ES2303129T3 (ja)
FR (1) FR2867648A1 (ja)
MX (1) MXPA06006621A (ja)
PL (1) PL1692687T3 (ja)
WO (1) WO2005066936A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
US20070250308A1 (en) * 2004-08-31 2007-10-25 Koninklijke Philips Electronics, N.V. Method and device for transcoding
FR2880724A1 (fr) * 2005-01-11 2006-07-14 France Telecom Procede et dispositif de codage optimise entre deux modeles de prediction a long terme
US20060262851A1 (en) * 2005-05-19 2006-11-23 Celtro Ltd. Method and system for efficient transmission of communication traffic
KR100918377B1 (ko) * 2006-05-30 2009-09-22 주식회사 메디슨 영상압축 방법
US8214200B2 (en) * 2007-03-14 2012-07-03 Xfrm, Inc. Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid
CN101295506B (zh) * 2007-04-29 2011-11-16 华为技术有限公司 脉冲编解码方法及脉冲编解码器
DK2827327T3 (da) 2007-04-29 2020-10-12 Huawei Tech Co Ltd Fremgangsmåde til excitationsimpulskodning
EP2045800A1 (en) * 2007-10-05 2009-04-08 Nokia Siemens Networks Oy Method and apparatus for transcoding
CN101931414B (zh) * 2009-06-19 2013-04-24 华为技术有限公司 脉冲编码方法及装置、脉冲解码方法及装置
US8738679B2 (en) * 2009-07-03 2014-05-27 Stmicroelectronics International N.V. Offset-free sinc interpolator and related methods
CN102299760B (zh) * 2010-06-24 2014-03-12 华为技术有限公司 脉冲编解码方法及脉冲编解码器
US8805697B2 (en) * 2010-10-25 2014-08-12 Qualcomm Incorporated Decomposition of music signals using basis functions with time-evolution information
CN102623012B (zh) * 2011-01-26 2014-08-20 华为技术有限公司 矢量联合编解码方法及编解码器
US9472199B2 (en) * 2011-09-28 2016-10-18 Lg Electronics Inc. Voice signal encoding method, voice signal decoding method, and apparatus using same
US8731081B2 (en) * 2011-12-07 2014-05-20 Motorola Mobility Llc Apparatus and method for combinatorial coding of signals
WO2019028602A1 (zh) * 2017-08-07 2019-02-14 深圳市汇顶科技股份有限公司 应用于超取样转换器的向量量化数模转换电路
CN114598558B (zh) * 2022-03-28 2023-10-31 厦门亿联网络技术股份有限公司 音频设备级联自修复系统及自修复方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3109594B2 (ja) * 1998-08-18 2000-11-20 日本電気株式会社 移動通信システムおよび移動端末接続方法
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US7315815B1 (en) * 1999-09-22 2008-01-01 Microsoft Corporation LPC-harmonic vocoder with superframe structure
US7222070B1 (en) * 1999-09-22 2007-05-22 Texas Instruments Incorporated Hybrid speech coding and system
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US6687668B2 (en) * 1999-12-31 2004-02-03 C & S Technology Co., Ltd. Method for improvement of G.723.1 processing time and speech quality and for reduction of bit rate in CELP vocoder and CELP vococer using the same
US6704703B2 (en) * 2000-02-04 2004-03-09 Scansoft, Inc. Recursively excited linear prediction speech coder
JP4231987B2 (ja) * 2001-06-15 2009-03-04 日本電気株式会社 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体
US7272555B2 (en) * 2001-09-13 2007-09-18 Industrial Technology Research Institute Fine granularity scalability speech coding for multi-pulses CELP-based algorithm
WO2003058407A2 (en) * 2002-01-08 2003-07-17 Dilithium Networks Pty Limited A transcoding scheme between celp-based speech codes
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
JP4304360B2 (ja) * 2002-05-22 2009-07-29 日本電気株式会社 音声符号化復号方式間の符号変換方法および装置とその記憶媒体
JP4238535B2 (ja) * 2002-07-24 2009-03-18 日本電気株式会社 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体
KR100711280B1 (ko) * 2002-10-11 2007-04-25 노키아 코포레이션 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치
US7363218B2 (en) * 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
US7523032B2 (en) * 2003-12-19 2009-04-21 Nokia Corporation Speech coding method, device, coding module, system and software program product for pre-processing the phase structure of a to be encoded speech signal to match the phase structure of the decoded signal
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding

Also Published As

Publication number Publication date
KR20060131781A (ko) 2006-12-20
DE602004012600D1 (de) 2008-04-30
EP1692687B1 (fr) 2008-03-19
ES2303129T3 (es) 2008-08-01
MXPA06006621A (es) 2006-08-31
DE602004012600T2 (de) 2009-04-30
PL1692687T3 (pl) 2008-10-31
FR2867648A1 (fr) 2005-09-16
CN1890713B (zh) 2010-12-08
WO2005066936A1 (fr) 2005-07-21
CN1890713A (zh) 2007-01-03
JP2007515676A (ja) 2007-06-14
KR101108637B1 (ko) 2012-02-09
EP1692687A1 (fr) 2006-08-23
US7574354B2 (en) 2009-08-11
US20070124138A1 (en) 2007-05-31
ATE389933T1 (de) 2008-04-15

Similar Documents

Publication Publication Date Title
JP4970046B2 (ja) ディジタル信号圧縮のためのコーディングのために用いられるマルチパルス・ディクショナリのインデクス間のトランスコーディング
JP4162933B2 (ja) 低ビットレートcelp符号化のための連続タイムワーピングに基づく信号の修正
JP4649208B2 (ja) オーディオコーディング
US11721349B2 (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
JP4390803B2 (ja) 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置
US7149683B2 (en) Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US7599833B2 (en) Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same
JP2002202799A (ja) 音声符号変換装置
JP2003044097A (ja) 音声信号および音楽信号を符号化する方法
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
US8670982B2 (en) Method and device for carrying out optimal coding between two long-term prediction models
JP3435310B2 (ja) 音声符号化方法および装置
US9620139B2 (en) Adaptive linear predictive coding/decoding
KR100341398B1 (ko) 씨이엘피형 보코더의 코드북 검색 방법
JPH0540500A (ja) 音声符号化装置
JPH09269798A (ja) 音声符号化方法および音声復号化方法
Sriratanaban Improved excitation techniques for fixed and variable rate CELP-based speech coding

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110111

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110401

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110408

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110511

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110518

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110613

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110620

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110809

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111109

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111116

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120110

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120306

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120404

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150413

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees