JP4004707B2 - 情報を含む信号のマルチレート符号化のための技法 - Google Patents

情報を含む信号のマルチレート符号化のための技法 Download PDF

Info

Publication number
JP4004707B2
JP4004707B2 JP2000090014A JP2000090014A JP4004707B2 JP 4004707 B2 JP4004707 B2 JP 4004707B2 JP 2000090014 A JP2000090014 A JP 2000090014A JP 2000090014 A JP2000090014 A JP 2000090014A JP 4004707 B2 JP4004707 B2 JP 4004707B2
Authority
JP
Japan
Prior art keywords
representation
representations
signal
packets
packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000090014A
Other languages
English (en)
Other versions
JP2000311000A (ja
Inventor
クローン ピーター
シンハ デープン
Original Assignee
ルーセント テクノロジーズ インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ルーセント テクノロジーズ インコーポレーテッド filed Critical ルーセント テクノロジーズ インコーポレーテッド
Publication of JP2000311000A publication Critical patent/JP2000311000A/ja
Application granted granted Critical
Publication of JP4004707B2 publication Critical patent/JP4004707B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、情報を含む信号を伝達するためのシステムおよび方法に関し、更に特定すれば、信号を符号化してその多重表現を発生するための通信システムおよび方法に関する。
【0002】
【従来の技術、及び、発明が解決しようとする課題】
マルチメディアの用途において、および、オン・デマンド式の音楽サービスや、オンラインでのコンパクト・ディスク(CD)購入のための音楽試聴のようなインターネットでの用途において、オーディオ情報の伝達は、重要な役割を担っている。帯域幅を有効利用してオーディオ情報を伝達するために、知覚オーディオ符号化(PAC)技法が開発されている。PAC技法の詳細については、1994年2月8日にJohnstonに発行された米国特許第5,285,498号、および1991年8月13日にBrandenburg等に発行された米国特許第5,040,217号を参照することができる。これらは双方とも、この言及により本願にも含まれるものとする。かかるPAC技法によれば、オーディオ情報を表すオーディオ信号の連続した時間領域ブロックの各々を、周波数領域で符号化する。具体的には、各ブロックの周波数領域表現を複数のコーダ帯に分ける。コーダ帯の各々を、心理音響学的な基準に基づいて、オーディオ情報を大幅に圧縮するように、個別に符号化する。これによって、PCMフォーマットのような大きく単純化したデジタル・フォーマットでオーディオ情報を表した場合に比べ、オーディオ情報を表すために必要なビット数が少なくて済む。
【0003】
例えば、上述のオン・デマンド式の音楽サービスを提供する際、インターネットに接続されているサーバは、クライアントのニーズに応えるために、利用可能な各楽曲のPAC圧縮バージョンを格納することができる。楽曲の各バージョンは、例えばモデムを有するパーソナル・コンピュータ(PC)のようなクライアントが、インターネット上で通信を行うことができる異なる接続速度に対応する。楽曲のバージョンの品質、すなわち歪みの無さは、それに対応する接続速度と共に向上する。このため、例えば、サーバが、(a)約28.8kb/秒という普通の従来の電話サービス(POTS)の接続速度、(b)約64kb/秒という統合サービス・デジタル網(ISDN)の接続速度、および(c)約100kb/秒というデュアルISDN接続速度に対応する場合、それぞれの品質を有する楽曲の3つの対応するバージョンをサーバに格納しておく必要がある。しかしながら、このように楽曲を格納することは、非効率であり、特に多数の楽曲を利用可能とする必要がある場合、多くのメモリ空間を占めるので望ましくない。
【0004】
所与の接続速度でクライアントにサービスを配信する場合、サーバは、記憶装置内の対応するオーディオ情報をパケット化し、得られたパケットを、例えばインターネットのようなパケット交換ネットワークを介して伝達することができる。しかしながら、ネットワークまたはチャネル状態は不十分である恐れがあり、このためにパケットの一部が伝送中に失われた場合には、楽曲を表す受信信号の品質が大きく劣化することになろう。
【0005】
従って、異なるレートの情報を効率的に格納および分配すること、更に、ネットワークまたはチャネル状態が不十分である場合でも受信信号の許容可能な最低限の品質を効果的に維持することに対する必要性がある。
本発明によって、マルチレート符号化を実施し、例えばオーディオ情報のような情報を含む信号の多重サブレート表現を発生する。これらの表現は互いに異なっており、その情報に必要とされる配信レート以下のレートで配信することができる。
【0006】
例えば、上述のオン・デマンド式の音楽サービスを提供する際、「C表現」と呼ぶ、サブレート表現のうち少なくとも1つは、28.8kb/秒のサブレートで配信されるコア情報を含むことができる。「E1表現」および「E2表現」と呼ぶ他のサブレート表現は、各々、36kb/秒のサブレートで配信される付加強化情報を含むことができる。本発明によるマルチ・レート符号化の設計のため、この例では、C表現のみに基づいた信号の回復は、許容可能な最低限の28.8kb/秒の信号品質を提供し、E1表現またはE2表現のいずれかと組み合わせたC表現に基づいた信号の回復は、更に高い64kb/秒の信号品質を提供し、E1表現およびE2表現の双方と組み合わせたC表現に基づいた信号の回復は、最高の100kb/秒の信号品質を提供する。有利な点として、上述のオン・デマンド式の音楽サービスのサーバは、様々な接続速度および品質の要求に対処するために、そのメモリ内に、従来技術におけるような28.8kb/秒、64kb/秒および100kb/秒のバージョンの代わりに、各楽曲のサブレート表現、すなわち28.8kb/秒のC表現、36kb/秒のE1表現および36kb/秒のE2表現を格納すれば良い。これによって、メモリ空間を効果的に節約する。
【0007】
本発明の一態様によれば、サブレート表現をパケットの形態でクライアント端末に伝達する場合、各パケットは、表現のうち1つから得た少なくとも1つの情報コンテンツと、情報コンテンツが得られた表現を識別するインジケータとを含む。チャネルまたはネットワーク状態が不十分であるために伝送中にパケットの一部が失われたとしても、少なくともC表現情報を含むことが示された受信パケットに基づいて信号を回復して、許容可能な最低限の信号品質を維持する。
【0008】
【発明の実施の形態】
図1は、例えばオーディオ情報のような情報を伝達するための、本発明の原理を採用した構成100を示す。この例示的な実施形態において、構成100のサーバ105は、インターネット120を介して、クライアント端末に、オン・デマンド式の音楽サービスを提供する。かかるクライアント端末の1つを130の数字で示し、これはパーソナル・コンピュータ(PC)とすることができる。周知のように、インターネット120は、標準的な伝送制御プロトコル/インターネット・プロトコル(TCP/IP)に従ってパケット単位で情報を伝送するためのパケット交換ネットワークである。
【0009】
サーバ105との間で情報を伝達するために、クライアント端末130に、例えばNETSCAPE NAVIGATORまたはMICROSOFT EXPLORERブラウザのようなブラウザ・ソフトウエアを含む従来のソフトウエアをインストールする。サーバ105は、インターネット120上の所定のURLによって識別される。例えば、サーバ105によって提供されるオン・デマンド式の音楽サービスを要求するために、クライアント端末130内のモデム(図示せず)を用いて、最初にインターネット120との通信接続125を確立する。クライアント端末130のユーザが契約している電気通信設備に応じて、通信接続125は、様々な接続速度によって制限される場合がある。例えば、普通の従来の電話サービス(POTS)の接続は、通常、約28.8kb/秒の接続速度を提供し、統合サービス・デジタル網(ISDN)の接続は、通常、約64kb/秒の接続速度を提供し、デュアルISDN接続は、通常、約100kb/秒の接続速度を提供する。
【0010】
通信接続125の確立後、従来の方法で、クライアント端末130に、その識別のためのIPアドレスを割り当てる。クライアント130のユーザは、次いで、サーバ105を識別する所定のURLでオン・デマンド式の音楽サービスにアクセスし、サービスから選択した楽曲を要求することができる。かかる要求には、クライアント端末130を識別するIPアドレスおよびその接続速度が含まれる。
【0011】
従来技術では、オン・デマンド式の音楽サービスの提供において、サーバは、当該サーバがサポートする様々な接続速度に対応した各楽曲のバージョンを格納する必要がある。楽曲のバージョンのオーディオ品質(歪み)は、対応する接続速度と共に向上(劣化)する。このため、従来技術のサーバが、3つの接続速度、例えば28.8kb/秒、64kb/秒、および100kb/秒をサポートする場合、このサーバはそれぞれの品質を有する利用可能な各楽曲の3つの異なるバージョンを格納する必要がある。しかしながら、このように楽曲を格納することは、非効率的であり、特に多数の楽曲を利用可能とすることが必要な場合、多くのメモリ空間を占めるので望ましくない。加えて、サービスをクライアント端末に配信する際、サーバは通常、パケットの形態のオーディオ情報を、インターネットを介して送出する。しかしながら、ネットワークまたはチャネル状態が不十分である恐れがあり、このためにパケットの一部が失われる場合、受信されたオーディオ情報の品質は大きく劣化しているであろう。
【0012】
本発明によって、メモリ空間を節約するために、サーバ105においてマルチレート・オーディオ符号化を実施し、各楽曲のサブレート表現を発生する。楽曲のサブレート表現の異なる組み合わせが、異なる接続速度、および楽曲のオーディオ品質に対応する。概して、クライアント端末に伝達するサブレート表現が増えると、端末において回復させる楽曲のオーディオ品質は向上し、むろん、端末に要求される接続速度は速くなる。例えば、この例示的な実施形態では、本発明に従って、サーバ105において3つのサブレート表現を用いて、各楽曲に対応させる。サブレート表現のうち1つは、楽曲に含まれるコア・オーディオ情報を表し、「C表現」と呼ばれる。他の2つのサブレート表現は、楽曲に含まれる第1および第2の付加強化オーディオ情報を表し、それぞれ「E1表現」および「E2表現」と呼ばれる。本発明に従ったマルチレート符号化の設計のため、C表現のみに基づいて回復したオーディオ信号は、実現可能であるものの、提供される楽曲のバージョンは、許容可能な最低限の品質を呈する。E1表現またはE2表現のいずれかと組み合わせたC表現に基づいて回復したオーディオ信号は、楽曲の比較的高品質のバージョンを提供する。E1表現およびE2表現の双方と組み合わせたC表現に基づいて回復したオーディオ信号は、楽曲の最も高い品質のバージョンを提供する。しかしながら、E1表現および/またはE2表現のみに基づいて回復したオーディオ信号は、実現不可能である。
【0013】
サーバ105において、本発明による組み込みオーディオ・コーダを用いて、通信のために例えば28.8kb/秒のビット・レートを必要とするC表現を発生する。E1表現は、例えば36kb/秒のビット・レートを必要とし、E2表現も、例えば36kb/秒のビット・レートを必要とする。これらのビット・レートの選択は、全ての表現を用いた場合に回復した楽曲バージョンの品質が、従来の非組み込みオーディオ・コーダによって発生する100kb/秒バージョンの品質に近くなるように行う。同様に、E1表現またはE2表現とのC表現の組み合わせに基づいて回復した楽曲バージョンの品質は、従来の非組み込みオーディオ・コーダによって発生した64kb/秒バージョンの品質に近い。明らかに、C表現のみに基づいて回復した楽曲バージョンの品質は、従来の非組み込みオーディオ・コーダによって発生した28.8kb/秒バージョンの品質と同じである。有利な点として、サーバ105は、異なる接続速度(例えば28.8kb/秒、64kb/秒、および100kb/秒)に対処するために、従来技術におけるような28.8kb/秒、64kb/秒および100kb/秒バージョンの代わりに、そのメモリ内に、各楽曲の28.8kb/秒のC表現、36kb/秒のE1表現および36kb/秒のE2表現を格納するだけで良い。これによって、メモリ空間の節約を図る。
【0014】
ここで、本発明によるマルチレート符号化を実施する上述の組み込みオーディオ・コーダについて説明する。図2に、サーバ105内のかかる組み込みオーディオ・コーダの1つを203で示す。オン・デマンド式の音楽サービスを提供する場合、組み込みオーディオ・コーダ203に、楽曲を表す信号アナログa(t)が供給される。かかるアナログ信号に応答して、コーダ203内のアナログ−デジタル(A/D)コンバータ205は、従来の方法でa(t)をデジタル化し、a(t)のPCMサンプルを提供する。これらのPCMサンプルを、フィルタバンク209および知覚モデル・プロセッサ211に供給する。フィルタバンク209は、サンプルを時間領域ブロックに分割し、各ブロックに変形離散コサイン変換(MDCT)を実行して、その周波数領域表現を与える。かかる周波数領域表現を、ローバス・フィルタ(LPF)213によって、この例では0ないし10kHz周波数範囲に帯域制限する。得られたMDCT係数を、量子化のためのコーダ帯に従って、量子化器215によってグループ化する。これらのコーダ帯は、人の聴覚系の周知のクリティカル・バンドを近似するが、この例では0ないし10kHz周波数範囲に制限されている。量子化器215は、同一の量子化器ステップサイズによって、所与のコーダ帯に対応してMDCT係数を量子化する。
【0015】
知覚モデル・プロセッサ211は、オーディオ信号サンプルを分析し、各コーダ帯毎に、適切な量子化レベル(すなわちステップサイズ)を決定する。この量子化レベルは、所与のコーダ帯内のオーディオ信号がノイズをどのくらい十分にマスクするかの評価に基づいて決定する。量子化器215は、量子化したMDCT係数を発生して無損失圧縮器219に適用する。無損失圧縮器219は、この例では、量子化係数に対して従来のハフマン圧縮プロセスを実行し、この結果、リード261上に上述のC表現が得られる。圧縮器219の出力は、レートループ・プロセッサ225を介して量子化器215にフィードバックされる。従来のように、レートループ・プロセッサ225は、量子化器215の出力を調節して、C表現のビット・レートがその目標レートに維持されることを保証する。この例では、目標レートは28.8kb/秒である。
【0016】
この例示的な実施形態では、コーダ203によってE1表現およびE2表現を発生し、例えば7ないし20kHz範囲のようなオーディオ信号の比較的高い周波数成分に関するスペクトル情報を含む楽曲の品質を向上させる。このため、減算器229によって、フィルタバンク209のMDCT出力から、量子化器215からの量子化MDCT係数を減算する。得られた差信号をデュプリケータ231によって複製し、次いで、バンドパス・フィルタ(BPF)223および233によって、それぞれ7ないし20kHz範囲に帯域制限する。量子化器243および253の各々は、濾波された差信号のコピーを受け取り、所定のステップサイズに従って受信信号を量子化する。
【0017】
量子化器243および253は、スカラー量子化器または多次元量子化器とすることができ、相補的な量子化器対から成るものとすることができる。相補的スカラー量子化器は、当技術分野では周知であり、例えば、V.Vaishampayanの、「Design of Multiple Description of Scalar Quantizers(スカラー量子化器の多重記述の設計)」、IEEE Transactions on Information Theory、Vol.39、No.3、1993年5月、pp.821−834に記載されている。一般に、相補的スカラー量子化器対は、それぞれ、以下の符号化関数f1およびf2によって規定することができる。
【0018】
【数1】
Figure 0004004707
ここで、Rは実軸を表し、m1=2S1およびm2=2S2であり、S1およびS2は、それぞれ量子化器243および253のビット・レートを表す。周知のように、f1およびf2に対する量子化値xiおよびyjの各々には、実軸上の範囲または区画[x,y)が関連付けられており、この範囲内の全ての値がxiまたはyjに量子化されるようにする。
【0019】
従来技術においては、相補的な関係を有するf1およびf2からのxiとyjとの間の相関関係を利用するために、反量子化器において、「中央復号」とも呼ばれる共同復号を(xi,yj)に実行して、得られる歪みまたは量子化エラーを最小に抑えるように、最適な復号値Zkを実現する。反量子化器において実行される中央復号関数_は、以下のように表すことができる。
【数2】
Figure 0004004707
なお、(xi,yj)が関連する区画間の重複に応じて、全ての(xi,yj)が有効な復号可能の組み合わせではないことを注記しておく。f1、f2および中央復号関数_に関連する平均歪みを、それぞれQ1、Q2およびQ−とし、更に、f1およびf2が同等である、すなわちS1=S2=Sであると仮定する。Q1<2-2SおよびQ2<2-2Sである場合、条件Q1およびQ2≦Qに合致するQ−を最小にすることによって、Q−の値は常に以下の限度よりも大きいことがわかる。Qは所定の歪み値である。
【数3】
Figure 0004004707
すなわち、相補的なスカラー量子化器を用いることによって、個々のスカラー量子化器のみを用いる場合に比べ、多くとも3dBの利得を提供する。
【0020】
【外1】
Figure 0004004707
この例示的な実施形態では、量子化器243および253は、本発明による相補的な多次元量子化器である。好ましくは、これらは、非均一の多次元格子量子化器である。
【0021】
本発明による相補的な非均一多次元格子量子化器を用いることの利点を更に認めるために、最初に、量子化のため2次元領域において方形格子を用いた従来技術の均一2次元格子量子化器について考える。図3Aは、X1およびX2軸によって規定され、360で示される、かかる2次元領域の1つを示す。この例の領域360は、方形格子を有し、Voronoi領域またはセル、例えばセル367および369を含む。その長さをΔで示し、Δは所定の値を示す。図3Aに示すように、これらのセルは、領域360全体を通して均一に分布し、各々は異なるコードによって識別される。周知のように、量子化プロセスにおいて、従来技術の量子化器は、入力サンプル点(x1、x2)に、このサンプル点が該当するセルを識別するコードを割り当てる。ここで、x1∈X1およびx2∈X2である。例えば、0≦x1<Δ、および0≦x2<Δを有するサンプル点には、各々、セル367を識別するコードを割り当てる。更に、Δ≦x1<2Δ、およびΔ≦x2<2Δを有するサンプル点には、各々、セル369を識別するコードを割り当てる。実際には、各コードの割り当ては、コードブックを参照することによって行う。
【0022】
上述の従来技術の量子化器は、Δ2に比例する平均歪みを呈し、このΔ2は2-2Sに比例する。多次元の場合、Sは、サンプル・レートによって乗算したビット/サンプル/次元の数を表す。
【0023】
先に述べたように、好適な実施形態では、量子化器243および253は、相補的な非均一多次元格子量子化器である。例えば、2次元の場合、量子化器243および253は、それぞれ2次元領域370および390において非均一の矩形格子を用いる。図3Bでは、領域360と同様、領域370がX1およびX2軸によって規定されている。しかしながら、領域360とは異なり、領域370が含むVoronoi領域またはセル、例えばセル367および369は、形状が異なり、従って領域370全体を通して非均一である。一例として、領域370内の矩形セルの垂直の境界線は、x1=0、0.5Δ、2.0Δ、2.5Δ、4.0Δ、...においてX1軸と交わり、連続する垂直の境界線間の分離距離は、0.5Δと1.5Δとが交互になっている。一方、領域370の矩形セルの水平の境界線は、x2=0、1.5Δ、2.0Δ、3.5Δ、4.0Δ、...においてX2軸と交わり、連続する水平の境界線間の分離距離は、1.5Δと0.5Δとが交互になっている。量子化プロセスにおいて、量子化器243は、入力サンプル点(x1、x2)に、このサンプル点が該当するセルを識別するコードを割り当てる。例えば、0≦x1<0.5Δ、0≦x2<1.5Δを有するサンプル点には、各々、セル377を識別するコードを割り当てる。更に、0.5Δ≦x1<2.0Δ、1.5Δ≦x2<2.0Δを有するサンプル点には、各々、セル379を識別するコードを割り当てる。
【0024】
量子化器243と相補的な量子化器253の領域390内の矩形格子を設計する簡単な方法は、領域370内の垂直および水平の境界線を、領域390内の水平および垂直の境界線としてそれぞれ採用することである。図3Cは、その結果得られた領域390を示し、例えばセル391および399のようなセルを含み、これらは形状が異なるため、領域390全体を通して非均一である。量子化プロセスにおいて、量子化器253は、入力サンプル点(x1、x2)に、このサンプル点が該当するセルを識別するコードを割り当てる。例えば、0≦x1<1.5Δ、0≦x2<0.5Δを有するサンプル点には、各々、セル397を識別するコードを割り当てる。更に、1.5Δ≦x1<2.0Δ、0.5Δ≦x2<2.0Δを有するサンプル点には、各々、セル399を識別するコードを割り当てる。
【0025】
量子化器243および253の各々の平均歪みは、1.25ε2-2Sに等しいことがわかる。ここで、εは、量子化器に対する入力信号の確率密度関数に依存する定数を表し、この例では、Sは36kb/秒に等しい。しかしながら、量子化器243および253が相補的な量子化器であるという事実から、反量子化器において、量子化器243および253からの量子化値に対して中央復号をそれぞれ実行可能である。2次元中央復号に関連して得られた平均歪みQ−は、0.25ε2-2S以下であることがわかる。すなわち、相補的な量子化器243および253は、2次元中央復号と共に実現した場合、スカラー量子化器に比べ、歪みにおいて6dBの改善を得る。
【0026】
上述の2次元の格子と同様にして、相補的な量子化器の3次元以上の同等の格子を得ることができる。しかしながら、3次元以上では、各相補的量子化器において、非均一、非矩形(または非超立方体)格子を用いると、より有利である。
【0027】
ここで図2に戻ると、量子化器243からの量子化信号は、無損失圧縮器245に供給され、無損失圧縮器245は、圧縮器219と同様、量子化信号にビット圧縮を実行して、リード263上にE1表現を得る。E1表現を、レートループ・プロセッサ247を介して量子化器243にフィードバックして、E1表現のビット・レートがその目標レートに維持されることを保証する。この例では、S1=36kb/秒である。
【0028】
同様に、量子化器253からの量子化信号は、無損失圧縮器255に供給され、無損失圧縮器255は量子化信号にビット圧縮を実行して、リード265上にE2表現を得る。E2表現を、レートループ・プロセッサ257を介して量子化器253にフィードバックして、E2表現のビット・レートがその目標レートに維持されることを保証する。この例ではS2=36kb/秒である。
【0029】
リード261、263および265は、記憶装置270まで延在する。リード261上のC表現をメモリ空間271に格納し、リード263上のE1表現をメモリ空間273に格納し、リード265上のE2表現をメモリ空間275に格納する。
【0030】
クライアント端末130からの、選択した楽曲を送信するための上述の要求に応答して、プロセッサ280は、所与の接続速度に応じて、パケタイザ285に、選択した楽曲の1つ以上の格納表現を含むパケット・ストリームを発生させる。ストリーム内の各パケットは、そのヘッダに、宛先アドレスとして、オン・デマンド式の音楽サービスを要求しているクライアント端末130のIPアドレスを含むので、端末130へと差し向けられる。
【0031】
具体的には、所与の接続速度が100kb/秒である場合、パケタイザ285は、メモリ空間271、273および275から、選択した楽曲のC表現、E1表現およびE2表現を検索し、検索した表現をTCP/IPフォーマットに従ってパケット化する。得られたパケット・ストリームを、プロセッサ280によって、インターネット120に送出する。
【0032】
図4は、かかるパケット・システムを示す。パケタイザ285によって発生したパケット411、413および415は、それぞれ、楽曲の第1の時間セグメントに対応するC表現、E1表現およびE2表現情報を含み、パケット421、423および425は、それぞれ、楽曲の第2の時間セグメントに対応するC表現、E1表現およびE2表現を含む、等である。クライアント端末130がパケットを受信した時にそれらの組み立てを容易にするため、各パケットのヘッダは同期情報を含む。具体的には、各パケット内の同期情報は一対のインデックスを含み、そのうち、シーケンス・インデックスは、パケットが対応する時間セグメントを示し、この後に、パケットが関連付けられている表現の1つを示す表現インデックスが続く。例えば、パケット411のヘッダ内のフィールド401は、インデックス対(1、0)を含み、シーケンス・インデックス「1」は、このパケットが第1の時間セグメントに対応することを示し、表現インデックス「0」は、このパケットがC表現に関連することを示す。同様に、パケット413のヘッダ内のフィールド403は、インデックス対(1、1)を含み、シーケンス・インデックス「1」は、このパケットが第1の時間セグメントに対応することを示し、表現インデックス「1」は、このパケットがE1表現に関連することを示す。パケット415のヘッダ内のフィールド405は、インデックス対(1、2)を含み、シーケンス・インデックス「1」は、このパケットが第1の時間セグメントに対応することを示し、表現インデックス「2」は、このパケットがE2表現に関連することを示す。
【0033】
同様に、パケット421、423および425の各々におけるシーケンス・インデックスは、値「2」を有し、これは、パケットが第2の時間セグメントに対応することを示す。更に、パケット421、423および425の表現インデックスは、値「0」、「1」、および「2」をそれぞれ有し、それらがC表現、E1表現およびE2表現とそれぞれ関連することを示す。
【0034】
クライアント端末130は、端末130にインストールされたソフトウエアおよび/またはハードウエアを用いて実現可能なルーチンに従って、サーバ105からのパケット・ストリームを処理する。図5は、かかるルーチンを500で示す。ステップ503において、端末130はサーバ105から、サーバ105によって端末130に与えられる異なる表現を識別するインデックスに関連した情報を受け取る。上述のように接続速度が100kb/秒であるこの例では、端末130に、表現インデックス「0」、「1」および「2」によってそれぞれ識別される楽曲のC表現、E表現およびE表現を与える。従って、図4のパケット・ストリームを受信すると、端末130は、時間セグメント毎にパケットを処理し、各時間セグメントi毎に各表現に関連した3つのパケットを受信することを予想する。ここで、1≦i≦Nであり、Nは楽曲が構成する時間セグメントの合計数である。この例示的な実施形態では、各時間セグメントは同一の所定の長さを有する。
【0035】
具体的には、ステップ507において、端末130は、各時間セグメントi毎に、所定の時間制限を設定する。この制限内で、当該時間セグメントに関連するあらゆるパケットを、処理のために受信する。ステップ511では、端末130は、各受信パケットのヘッダ内の上述のインデックス対を調べる。受信パケットのシーケンス・インデックス値および表現インデックス値に基づいて、端末130は、ステップ514において、時間制限が経過する前に、時間セグメントiの予想パケットの全てを受信したか否かを判定する。予想パケットを全て受信した場合、ルーチン500はステップ517に進み、ここで、端末130は、各パケットから表現情報コンテンツを抽出する。ステップ521において、端末130は、抽出した表現に、上述の組み込みオーディオ・コーダ203に対する逆関数を実行して、時間セグメントiに対応するa(t)を回復させる。具体的には、抽出した情報がそれぞれC表現情報、E1表現情報、E2表現情報を含むこの例では、それらの相関関係に基づいてE1表現情報およびE2表現情報に上述の中央復号を実行して、回復されたa(t)における平均歪みを最小に抑える。
【0036】
その他の場合、時間セグメントiの間に全ての予想パケットを受信する前に上述の時間制限が経過した場合、ステップ524において、端末130は、この時間セグメントの間に受信したいずれかのパケットがC表現情報を含むパケットを含むか否かを判定する。少なくともC表現情報を含むパケットを受信したと判定された場合、端末130は、時間セグメントiの間の受信パケット(複数の受信パケット)から表現情報コンテンツ(複数の表現情報コンテンツ)を抽出し、抽出した情報に基づいて、ステップ527に示すように、時間セグメントiに対応するa(t)を回復させる。その場合、オーディオ回復は、28.8kb/秒の品質に対応するC表現情報のみ、または、64kb/秒の品質に対応する、E1表現情報もしくはE2表現情報のいずれかと組み合わせたC表現情報に基づくものとすることができる。あるいは、C表現情報を含むパケットを受信しなかった場合、端末130は時間セグメントiの間の受信パケットを用いた回復を行わない。そのような回復は、実現不可能なa(t)を生じるからである。この場合、端末130は、ステップ531に示すように、時間セグメントiの間に周知のオーディオ隠蔽、例えば、隣接する時間セグメントにおけるオーディオ回復結果に基づいた補間を実行する。
【0037】
所与の接続速度が、上述の例の100kb/秒でなく64kb/秒または28.8kb/秒である場合、上述のプロセスに同様に従うが、64kb/秒接続速度の場合、C表現情報およびE1表現情報またはE2表現情報のみをサーバ105によってクライアント端末130に伝達し、28.8kb/秒接続速度の場合には、C表現情報のみを伝達する。
【0038】
前述の説明は、本発明の原理を例示するに過ぎない。従って、当業者は、本発明の原理を具現化し、その精神および範囲内にある多くの他の構成を考案することができる。
【0039】
例えば、ネットワーク状態が不十分であるためにパケットの損失が予想される場合には、例示的な実施形態のサーバ105は、同等のオーディオ情報量を含むパケット・ストリームを、異なる経路を介して同一のクライアント端末へとルーティングすることによって、パス・ダイバーシチを実現することができる。各ストリーム内の各パットは、回復すべきオーディオ信号の異なる時間セグメントに対応する。各時間セグメント毎に、クライアント端末は、当該時間セグメントに対応するストリームのうちいずれか1つからのパケットを用いて、オーディオ信号を回復させることができる。このため、パケットの損失があっても、端末が各時間セグメント毎に1つのこのようなパケットを受信する限り、回復信号の品質は維持される。例えば、64kb/秒でオーディオ信号を送出するためには、サーバ105は、クライアント端末に、C表現情報を含む第1のパケット・ストリーム、E1表現情報を含む第2のパケット・ストリーム、ならびに、相補的な量子化器243および253を用いるために、E1表現と同等なE2表現情報を含む第3のパケット・ストリームを送信することができる。第2および第3のストリームは、異なるネットワークを介してルーティングして、パス・ダイバーシチを達成することができる。
【0040】
同様に、サーバ105は、同等のオーディオ情報量を含むパケット・ストリームを、同一のネットワークを介して、所定の遅延を伴って次々と送信することによって、時間ダイバーシチを実現することができる。
【0041】
加えて、前述の開示に基づいて、当業者は、相補的な量子化器を用いて、例えばC1表現およびC2表現のような同等のC表現を発生させ、かかるC表現のパスおよび/または時間ダイバーシチを実現可能であることは明らかである。
【0042】
更に、上述のマルチレート符号化技法は、オーディオ情報だけでなく、テキスト、グラフィックス、ビデオ等に関する情報の伝達に適用可能である。
【0043】
更にまた、開示した実施形態では、本発明のマルチレート符号化技法を、例としてパケット交換通信システムに適用した。しかしながら、本発明の技法は、ハイブリッド・インバンド・オンチャネル(IBOC)システム、ハイブリッドIBOC FMシステム、衛星放送システム、インターネット無線システム、TV放送システム等を含む同報通信システムに、等しく適用可能である。
【0044】
最後に、本明細書中では、サーバ105は、別個の機能ブロックによって様々なサーバ機能を実行する形態で開示した。しかしながら、それらのブロックのいずれか1つ以上の機能、またはその機能の全てを、例えば1つ以上の適切にプログラムしたプロセッサによって実現する構成において、これらの機能のいずれか1つ以上を等しく十分に具現化することができる。
【図面の簡単な説明】
【図1】通信ネットワークを介してオーディオ情報を伝達するための、本発明の原理を採用した構成を示す。
【図2】図1の構成におけるサーバのブロック図である。
【図3A】均一多次元格子を示し、従来技術の量子化器はこれに基づいて量子化を行う。
【図3B】第1の非均一多次元格子を示し、図2のサーバ内の第1の相補的な量子化器はこれに基づいて量子化を行う。
【図3C】第2の非均一多次元格子を示し、図2のサーバ内の第2の相補的な量子化器はこれに基づいて量子化を行う。
【図4】図2のサーバによって発生するパケット・ストリームを示す。
【図5】図1の構成におけるクライアント端末がサーバからのパケットを処理するためのステップを示すフローチャートである。

Claims (10)

  1. 信号を処理するための装置であって、
    該信号の少なくとも第1および第2の表現を発生させるコーダからなり、該第1および第2の表現が互いに異なっているものであり、該装置はさらに、
    該第1および第2の表現のうち少なくとも1つを複数のパケットにパッケージ化するコントローラからなり、該パケットの各々は、少なくとも1つのインジケータと、該第1および第2の表現のうち1つから得られる情報コンテンツとを含み、そして該インジケータは該情報コンテンツが得られた表現を識別しており、
    前記1以上の表現が所与のクライアント端末への配信のために該複数のパケットへパッケージ化される態様は、該複数のパケットをクライアント端末へ配信することができる接続に関連した接続速度に少なくとも部分的に基づいていることを特徴とする装置。
  2. 請求項1に記載の装置において、該複数のパケットが、パケットの少なくとも第1および第2のシーケンスを含み、該第1のシーケンスの各パケット内の該インジケータは該第1の表現を識別し、そして該第2のシーケンスの各パケット内の該インジケータは該第2の表現を識別することを特徴とする装置。
  3. 請求項2に記載の装置において、該信号を時間セグメント毎に処理し、各時間セグメントに、該第1のシーケンス内の異なるパケットおよび該第2のシーケンス内の別の異なるパケットが関連していることを特徴とする装置。
  4. 請求項1に記載の装置において、該信号が複数の周波数成分からなり、該第1の表現が該周波数成分の第1のサブセットから得られ、該第2の表現が該周波数成分の第2のサブセットから得られることを特徴とする装置。
  5. 請求項に記載の装置において、該周波数成分の該第1のサブセットが該周波数成分の該第2のサブセットとは異なり、該第1の表現は該信号の記述を与え、該第2の表現は該記述に対する付加強化を与えることを特徴とする装置。
  6. 信号の少なくとも第1および第2の表現を提供する装置であって、該第1の表現が該第2の表現とは異なっており、該装置が、
    第1の多次元格子に従って該信号の少なくとも部分を量子化し、該第1の表現を発生させる第1の量子化器と、
    第2の異なる多次元格子に従って該信号の少なくとも該部分を量子化し、該第2の表現を発生させる第2の量子化器からなり、該第1および第2の量子化器が互いに対して相補的であることを特徴とする装置。
  7. 信号を回復させる装置であって、
    複数のパケットを受信するインタフェースからなり、該パケットの各々は、インジケータと、該信号の複数の表現のうち1つから得られる情報コンテンツとを含み、該インジケータは該情報コンテンツが得られた該表現を識別し、そして該複数の表現が互いに異なるものであり、前記1以上の表現が所与のクライアント端末への配信のために該複数のパケットへパッケージ化される態様は、該複数のパケットをクライアント端末へ配信することができる接続に関連した接続速度に少なくとも部分的に基づいており、該装置はさらに、
    該クライアント端末に関連した、該受信パケットに応答して該信号を回復させるためのプロセッサとからなることを特徴とする装置。
  8. 信号を処理する方法であって、該方法は、
    該信号の少なくとも第1および第2の表現を発生させる段階からなり、該第1および第2の表現が互いに異なっているものであり、該方法はさらに、
    該第1および第2の表現のうち少なくとも1つを複数のパケットにパッケージ化する段階からなり、該パケットの各々が、少なくとも1つのインジケータと、該第1および第2の表現のうち1つから得られる情報コンテンツとを含み、該インジケータは該情報コンテンツが得られた表現を識別しており、前記1以上の表現が所与のクライアント端末への配信のために該複数のパケットへパッケージ化される態様は、該複数のパケットをクライアント端末へ配信することができる接続に関連した接続速度に少なくとも部分的に基づいていることを特徴とする方法。
  9. 信号の少なくとも第1および第2の表現を提供する装置において用いる方法であって、該第1の表現が該第2の表現とは異なっており、該装置は第1の量子化器および第2の量子化器とを含み、そして該第1の量子化器は該第2の量子化器は互いに対して相補的であるものであり、該方法はさらに、
    該第1の量子化器を用いて第1の多次元格子に従って該信号の少なくとも部分を量子化し、該第1の表現を発生させる段階と、
    該第2の量子化器を用いて第2の異なる多次元格子に従って該信号の少なくとも該部分を量子化し、該第2の表現を発生させる段階とからなることを特徴とする方法。
  10. 信号を回復する方法であって、該方法は、
    複数のパケットを受信するた段階からなり、該パケットの各々が、インジケータと、該信号の複数の表現のうち1つから得られる情報コンテンツとを含み、該インジケータは該情報コンテンツが得られた該表現を識別し、そして該複数の表現が互いに異なり、前記1以上の表現が所与のクライアント端末への配信のために該複数のパケットへパッケージ化される態様は、該複数のパケットをクライアント端末へ配信することができる接続に関連した接続速度に少なくとも部分的に基づいており、該方法はさらに、
    該受信パケットに応答して該信号を回復させる段階とからなることを特徴とする方法。
JP2000090014A 1999-03-29 2000-03-29 情報を含む信号のマルチレート符号化のための技法 Expired - Fee Related JP4004707B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/280785 1999-03-29
US09/280,785 US6366888B1 (en) 1999-03-29 1999-03-29 Technique for multi-rate coding of a signal containing information

Publications (2)

Publication Number Publication Date
JP2000311000A JP2000311000A (ja) 2000-11-07
JP4004707B2 true JP4004707B2 (ja) 2007-11-07

Family

ID=23074644

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000090014A Expired - Fee Related JP4004707B2 (ja) 1999-03-29 2000-03-29 情報を含む信号のマルチレート符号化のための技法

Country Status (5)

Country Link
US (2) US6366888B1 (ja)
EP (2) EP1049074B1 (ja)
JP (1) JP4004707B2 (ja)
CA (1) CA2300495C (ja)
DE (1) DE60045135D1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6556666B1 (en) * 1998-05-05 2003-04-29 Siemens Information & Communication Networks, Inc. Notification system for multimedia messaging systems
US6366888B1 (en) * 1999-03-29 2002-04-02 Lucent Technologies Inc. Technique for multi-rate coding of a signal containing information
US6930983B2 (en) * 2000-03-15 2005-08-16 Texas Instruments Incorporated Integrated circuits, systems, apparatus, packets and processes utilizing path diversity for media over packet applications
US7606164B2 (en) * 1999-12-14 2009-10-20 Texas Instruments Incorporated Process of increasing source rate on acceptable side of threshold
JP3507743B2 (ja) * 1999-12-22 2004-03-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 圧縮オーディオデータへの電子透かし方法およびそのシステム
GB2367219A (en) * 2000-09-20 2002-03-27 Vintage Global Streaming of media file data over a dynamically variable bandwidth channel
EP1215663A1 (en) 2000-12-15 2002-06-19 BRITISH TELECOMMUNICATIONS public limited company Encoding audio signals
US8776153B2 (en) * 2001-04-25 2014-07-08 At&T Intellectual Property I, Lp Method and system for transferring content to a networked unit
US20030009578A1 (en) * 2001-07-03 2003-01-09 Apostolopoulos John G. Method and system for delivering streaming media to fixed clients or mobile clients with multiple description bitstreams
US20080030623A1 (en) * 2001-07-19 2008-02-07 Kumar Ramaswamy Robust reception of digital broadcast transmission
US20030236674A1 (en) * 2002-06-19 2003-12-25 Henry Raymond C. Methods and systems for compression of stored audio
GB2392807A (en) * 2002-09-06 2004-03-10 Sony Uk Ltd Processing digital data
US7810124B2 (en) * 2003-01-28 2010-10-05 Thomson Licensing Robust mode staggercasting fast channel change
US8027381B2 (en) * 2003-01-28 2011-09-27 Thomson Licensing Robust mode staggercasting user controlled switching modes
EP1588548B1 (en) * 2003-01-28 2010-10-13 Thomson Licensing Robust mode staggercasting
US7398207B2 (en) 2003-08-25 2008-07-08 Time Warner Interactive Video Group, Inc. Methods and systems for determining audio loudness levels in programming
US7818444B2 (en) 2004-04-30 2010-10-19 Move Networks, Inc. Apparatus, system, and method for multi-bitrate content streaming
EP1839297B1 (en) 2005-01-11 2018-11-14 Koninklijke Philips N.V. Scalable encoding/decoding of audio signals
JP4725127B2 (ja) * 2005-02-16 2011-07-13 ソニー株式会社 復号装置および方法、記録媒体、並びにプログラム
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
BRPI0815735A2 (pt) * 2007-08-28 2019-09-24 Thomson Licensing difusão alternada sem retardo durante a troca entre canais.
US20100321208A1 (en) * 2009-06-23 2010-12-23 Craig Stephen Etchegoyen System and Method for Emergency Communications
KR101786050B1 (ko) * 2009-11-13 2017-10-16 삼성전자 주식회사 데이터 전송 방법 및 장치
WO2013113351A1 (en) * 2012-01-30 2013-08-08 Nokia Siemens Networks Oy Processing a signal in station apparatus
US8595590B1 (en) 2012-12-03 2013-11-26 Digital PowerRadio, LLC Systems and methods for encoding and decoding of check-irregular non-systematic IRA codes
US8948272B2 (en) 2012-12-03 2015-02-03 Digital PowerRadio, LLC Joint source-channel decoding with source sequence augmentation
US9191256B2 (en) 2012-12-03 2015-11-17 Digital PowerRadio, LLC Systems and methods for advanced iterative decoding and channel estimation of concatenated coding systems

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
US6047112A (en) * 1992-06-30 2000-04-04 Discovision Associates Technique for initiating processing of a data stream of encoded video information
TW272341B (ja) * 1993-07-16 1996-03-11 Sony Co Ltd
US5881104A (en) * 1996-03-25 1999-03-09 Sony Corporation Voice messaging system having user-selectable data compression modes
US6154499A (en) * 1996-10-21 2000-11-28 Comsat Corporation Communication systems using nested coder and compatible channel coding
US6366888B1 (en) * 1999-03-29 2002-04-02 Lucent Technologies Inc. Technique for multi-rate coding of a signal containing information
US6430401B1 (en) * 1999-03-29 2002-08-06 Lucent Technologies Inc. Technique for effectively communicating multiple digital representations of a signal
US6246345B1 (en) * 1999-04-16 2001-06-12 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding

Also Published As

Publication number Publication date
EP1575033B1 (en) 2010-10-20
JP2000311000A (ja) 2000-11-07
DE60045135D1 (de) 2010-12-02
EP1575033A1 (en) 2005-09-14
US6366888B1 (en) 2002-04-02
US20020091531A1 (en) 2002-07-11
CA2300495A1 (en) 2000-09-29
EP1049074A1 (en) 2000-11-02
CA2300495C (en) 2005-01-11
US6920422B2 (en) 2005-07-19
EP1049074B1 (en) 2014-06-18

Similar Documents

Publication Publication Date Title
JP4004707B2 (ja) 情報を含む信号のマルチレート符号化のための技法
KR101356480B1 (ko) 신호 처리 방법 및 장치
KR100261253B1 (ko) 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US7668723B2 (en) Scalable lossless audio codec and authoring tool
US9251797B2 (en) Preserving matrix surround information in encoded audio/video system and method
EP1949693B1 (en) Method and apparatus for processing/transmitting bit-stream, and method and apparatus for receiving/processing bit-stream
JPH047616B2 (ja)
CN102158783A (zh) 通过变换插值进行音频分组丢失隐藏
JPH1188463A (ja) データブロックの送信方法
EP1499023B1 (en) Data processing system, data processing method, data processing device, and data processing program
EP2228791B1 (en) Scalable lossless audio codec and authoring tool
US20020188745A1 (en) Stacked stream for providing content to multiple types of client devices
EP1854218A1 (en) Lossless encoding of information with guaranteed maximum bitrate
JPS63110830A (ja) 帯域分割符号化復号化装置
KR100923301B1 (ko) 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
EP1016231A1 (en) Fast synthesis sub-band filtering method for digital signal decoding
JPH0773585A (ja) データ圧縮符号化方式及びその符号化装置及び復号化装置

Legal Events

Date Code Title Description
A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20040108

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040114

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040330

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040614

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070822

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100831

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110831

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110831

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120831

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130831

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees