JPH10512423A - 音声信号をコード化、操作及びデコード化する方法及び装置 - Google Patents

音声信号をコード化、操作及びデコード化する方法及び装置

Info

Publication number
JPH10512423A
JPH10512423A JP9516296A JP51629697A JPH10512423A JP H10512423 A JPH10512423 A JP H10512423A JP 9516296 A JP9516296 A JP 9516296A JP 51629697 A JP51629697 A JP 51629697A JP H10512423 A JPH10512423 A JP H10512423A
Authority
JP
Japan
Prior art keywords
coding
signal
information
coded
bit rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9516296A
Other languages
English (en)
Other versions
JP3168012B2 (ja
Inventor
セラーリオ,ルカ
フエスタ,ミケーレ
ミユラー,イオルク,マーチン
セレーノ,ダニエーレ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Publication of JPH10512423A publication Critical patent/JPH10512423A/ja
Application granted granted Critical
Publication of JP3168012B2 publication Critical patent/JP3168012B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/04Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
    • H04B14/046Systems or methods for reducing noise or bandwidth
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

(57)【要約】 本方法及び装置により、特定の信号内容に依存することなく音声信号のコード化、操作及びデコード化が可能になる。エンコーダー(AC)はオブジェクト向きコード化を行い、可変のビットレート及びバンド幅を有し且つ各オブジェクトに対して1基本層と1以上のエンハンス層から成るコード化信号を発生する。エンコーダー(AC)は、専用アルゴリズム及び標準化された任意のアルゴリズム両方に従って動作し、コード化されるべきオブジェクトに依存して最も有利なアルゴリズムを選択できる。デコーダー(AD)に向かう伝送経路に沿ったビットストリーム操作装置により、コード化信号のビットレート又はバンド幅のスケーリングが、又は個々のオブジェクトに作用することでコード化信号のパラメータを変えることが可能となる。

Description

【発明の詳細な説明】 音声信号をコード化、操作及びデコード化する方法及び装置 本発明は、デジタルコード化された音声信号を処理及び伝送するためのシステ ムに係り、特に、特定の信号内容(例えばスピーチ信号、ミュージック信号、雑 音など)に依存することなく音声信号(すなわち20Hzから20kHzまでの バンドの信号)をコード化、操作及びデコード化するための方法及び装置に関す る。 これらの信号は総称音声信号とも称され、これらの信号のコード化−デコード 化は総称コード化及びデコード化とも称される。 限定するものではないが、好ましくは、この方法及び装置は音声−映像(マル チメディア)信号の音声成分をコード化、操作及びデコード化するのに適用され る。 音声−映像が通信、コンピューター及びTV/フィルム産業に拡大して適用さ れつつあることは知られている。従って、このような拡大適用から生じる新たな 期待や要求を考慮した音声−映像コード化方法が研究されつつある。特に、新し い方法では対話、高圧縮及び/又は広いアクセスが可能でなければならず、さら に、急速に発展する技術を利用するために、本方法は高度な柔軟性と拡張性を備 えておかねばならない。 内容ベースの対話性は、音声−映像シーン(scene)においてユーザーが有意味 な対象(オブジェクト)と対話及び操作する能力を含む。現在は、対話はコンピ ューターグラフィックス、すなわち合成内容に限定される。これに対して新しい 音声−映像アプリケーションは、通常又はハイブリッドの自然/合成の音声−映 像対象ともデマンド対話することが期待されている。記憶装置及び伝送バンドを 効率的に使用するのに高い圧縮が要求され、圧縮効率の改善は高品質、低ビット レートのアプリケーションを可能にするには重要である。広いアクセス性とは、 音声−映像データが記憶及び伝送メディアの広範囲に亘って利用できることを意 味し、移動通信の急速な発展の観点からみて、アプリケーションへのアクセスは ワイヤレスネットワークを介して利用できるべきであり、このことはエラーを起 こしやすい環境でかつ低ビットレートでの有効な動作において必要であることを 意味する。 音声成分の処理に関する限りでは、許容される値の組内でコード化パラメータ ーのみを変えることにより、ビットレート、遅延、品質、バンド、チャンネルエ ラー頑強性などのようなエンコーダーの主要特性を変える装備が、柔軟性の要求 の中に含まれる。このような柔軟性により、異なる要求を伴う種々雑多な用途に おいて総称コーダー−デコーダーの使用が可能となる。総称コーダー−デコーダ ーが利用可能になると、将来のデジタルシステムでは異なるソースから発生され た音声データの変換が容易になり、ネットワークインターフェースが簡単になり 、異なる規格間のトランスコード化における品質低下を抑える。このことは、将 来のユニバーサル・モバイル・テレコミニュケーション・システム(UMTS) たる異なる(移動又は固定)ネットワーク間での音声データの変換が増大するこ とを考慮すると、非常に重要となる。ユーザーの特定の要求をサービスが満たす ことができるように、又は、設備及びサービス提供者がシステム条件に依存せず にサービスを最適化できるように、総称コーダーはコーダー−デコーダーパラメ ーターを変更できるべきでもある。さらに、コーダーは音声データの変換の前に 構成フェーズのアプリケーションをサポートすべきである。このようなフェーズ では、コーダー−デコーダーはユーザー及びシステムにより決められたサービス 要求に依存して構成される。 そのような種類の総称コーダーは当該技術においては知られていない。「埋込 コード化」として一般に知られている幾つかのコード化技術により、エンコーダ ー特性を変えることなくビットレートを下げられる。換言すれば、エンコーダー は固定アルゴリズムに従って動作し、コード化された信号は、情報の一部が喪失 できる又は伝送経路に沿って抑制できるように構成される。なお、少なくとも本 質的な情報が受け取られると、たとえ品質が或程度劣化しても、デコーダーは信 号をデコードできる。例として、埋込ADPCM(Adaptive Differential Pulse Code Modulation)コード化がITU−T標準G.726に開示されており、埋 込CELP(Coder Excited Linear Prediction)コード化がUS−A−5353 373に開示されている。両者とも、非常に制限された数の低減ステップのみ可 能であって、バンド幅への介入はできず、明らかに異なるコード化技術を組み込 むことは出来ない。 これに対し、本発明が提供することを目的とする処理方法及び装置においては 、コード化側では埋込コード化が行われ、少なくとも「コアー(core)」情報が受 け取られるとデコード化が依然として可能であり、また、ビットレート及びバン ド幅の両方において実際の「スカラビリティ(scalability)」(「スカラビリテ ィ」は、ほぼ連続した方法にてビットレート又はバンド幅を非常に多くに微細ス テップだけ低下する可能性を意味する)をコーダー出力において及び伝送経路に 沿って可能にし、異なる信号に対して異なるコード化技術を使用可能にし、コー ド化パラメーターの操作を可能にする。 上記目的は、添付請求の範囲第1乃至30項に開示された方法、及び請求の範 囲第31乃至57項に開示された装置により達成される。 特に、本発明の方法及び装置はオブジェクト向きパラダイムに基づいている。 すなわち、総称音声入力信号は基本音声オブジェクトの結合として考えられ、基 本オブジェクトはマクロオブジェクトにグループ化でき、該マクロオブジェクト は他の情報(例えばビデオ情報)にリンクでき且つ独立に操作できる。コード化 されているオブジェクトのタイプに依存して、最適なコード化技術、及びシステ ム条件と矛盾しない最適なビットレート及び/又はバンド幅が選択できる。コー ダーからデコーダーへの伝送経路に沿って、個々のマクロオブジェクトについて の又は単に個々のオブジェクトについてのビットストリームの操作が可能であり 、それにより異なるシステム条件に対処してユーザーがシーン(scene)などと相 互作用できるようにすることが可能である。 本発明は好適実施態様についての以下の説明からよりよく理解されるであろう し、この実施態様は限定的でない例として与えられたものであり、添付図面に示 されている。 図1は本発明による装置の略ブロック図であり、 図2はエンコーダーのブロック図であり、 図3はエンコーダー内のコード化装置からビットストリーム構成装置への接続 を示す詳細ブロック図であり、 図4はビットストリームの構成を示し、 図5はデコーダーのブロック図である。 本発明による装置を説明する前に、音声信号に適用されるオブジェクト向きコ ード化について考察をする。オブジェクト向きコード化技術は、顔、椅子、背景 などを「オブジェクト」として認識しやすいこと故にビデオコード化において既 に研究されてきている。このように、オブジェクト向きコード化の一般原理は既 知であり、文献において広く開示されているので、ここで開示する必要はないで あろう(例えば、「アプリケーションによるオブジェクト向き設計(Object-orie nted design with applications)」、The Benjamin/Cummings Publishing Compa ny Inc.、Redwood City、米国、1991年)。この技術は、「オブジェクト」 がそんなに明白でない音声コード化の分野ではそれほど利用されていない。総称 音声信号は、一般には異なる持続時間である後続の時間インターバル(フレーム )の連結として考えられる。これらのフレームの一つを音声「シーン(scene)」 と仮定できる。1つのフレームにおいて、幾つかの音声信号があり、それらは分 離、連結又はスーパーインポーズさえ可能である。典型的な例では、幾つかの異 なる話し手、異なる家、事務所又は交通の雑音、背景の快いミュージック、幾つ かの信号音などが含まれ得る。異なる種類の信号は異なるクラスとして考えるこ とができ、音声信号のローカル特性をより良く利用すべくこれらのクラスはさら にサブクラスに分割でき、とりわけ以下の事項を達成する。 − 最良の再生品質で最高の圧縮比。 − 各個別信号を分離及び変更する最高の柔軟性。 オブジェクト向きパラダイムの用語を用いれば、クラスのことを以後「抽象ク ラス(abstract classes)」とも称し、サブクラスのことを「具体クラス(concret e classes)」とも称する。具体クラスを特定するパラメータの組が「オブジェク ト」を構成する。 特に、オブジェクト向きアプローチを取ることの理由は、以下の幾つかの基本 的特徴に基づいている。 − 音声エンコーダーサブシステムにおいて変化を促進すべく音声コード化用の 共通フレームワークを作り且つ新しいモジュールを作る可能性。 − 各クラスに対する特定モデルの使用に基づいたコード化技術の最適化の可能 性。 − 音声オブジェクトを独立に操作する可能性。 最後の考察は、音声サービスと共に新しい機能性、特に対話に関する機能性を 考慮する場合には特に興味深い。これらは例えば、所与のメッセージの早プレイ バックする可能性、又は一人の話者のレベルを上げて他の人を背後に置く可能性 などを含み得る。 可能な分類の概略は次の通りである。 − トークスパート(talkspurt):このクラスは、人々が話すときに作り出され る信号を含む。すなわち、音声コード化のための主要な抽象クラスを表すことが できるが、それのみを表すのではない。 − サイレンス(silence):このクラスは、それ自身が沈黙した単一のオブジェ クトのみを含むことができる。すなわち、幾つかの他の音声信号と共に音声信号 を本質的に再生でき、伝送のためにかなりの量のビットを節約できる。 − ノイズ(noise):このクラスは、バックグラウンドノイズと称され且つ人間 によって発生されたものではない全ての信号を含む。一般にこれらの信号は少量 の情報しか伝えず、それらを表すには非常に粗っぽいモデルが使用できる。 − ミュージック(music):これは1つの非常に広い抽象クラスから成るか、又 は所与の楽器ソースに特別に当てられた幾つかのクラスから成り得る。 − トーン(tones):このクラスは純粋な正弦波信号を占める。このクラスに属 する単一オブジェクトは、それらの適当な組合せと共に、例えば伝送ネットワー クで遭遇する全ての信号音声を表すことができる。 具体クラスに関しては、まずトークスパートについて一つの可能性は、単一具 体クラスをサウンド又は音素の可能な各タイプと(又は2以上のサウンドの可能 な各シーケンスとでさえ)関連付けられる。このアイデアから、カスケード状の 音声学的認識器及び音声合成器として音声コーダー−デコーダーが実現できる。 このように、非常に多くの異なる具体クラスが必要となり、一般にそれらは言語 に依存する。さらに、トークスパートの音声学的分類は非常に難しい。より簡単 なアプローチとしては、より小さい組の具体クラスを定めることであり、それら の各々が類似サウンドの組に対応するようにする。しかしながら、ここに記載の 好適実施態様では、幾つかの音響特性に従う音声の特定セグメントをモデル化す るようにした具体クラスが導入される。この場合には、トークスパートの分類は 音声学的分類に直接関係しないが、具体クラスの組は非常に小さい。この目的の ために、有声及び無声音セグメントへのトークスパートの周知の分類、及び共鳴 音及び非共鳴音の作成への有声音セグメントの分類を用いることができる。特に 、次の具体クラスが考えられる。 − 着手(onset):共鳴有声音セグメントの最初の部分 − 定常状態(steady-state):共鳴有声音セグメントの中間部分 − 衰退(decay):共鳴有声音セグメントの最終部分 − 周期的(periodic):非共鳴音セグメント − 非周期的(aperiodic):無声音セグメント これらのクラスは短いポーズをも含み、これらポーズは例えば破裂音における 音の活性セグメントの一部であることが予想される。 ノイズの場合には、具体クラスは定常状態又は一時ノイズにより表すことがで き、ミュージックの場合には、具体クラスは異なる種類の楽器又は合成音により 作られた音により表すことができ、またもし単一の抽象クラスが考慮されている ならば、音の異なるフェーズ(アタック、衰退・・・)により表される。 個々の具体クラス(すなわちオブジェクト)のパラメータの組は転送される。 本発明では、1つのソース(又は音声−映像伝送の場合にはビデオのような他の 情報との1リンク)に関係した基本オブジェクトがマクロオブジェクトにグルー プ化でき、これらマクロオブジェクトは独立に操作できる。 別のアプローチは、一つの特定ソース信号を抽象クラス(例えばスピーチ信号 及びミュージック信号)として考えることである。このことは幾つかの共通具体 クラス(例えばサイレンス)を有することを意味し、その結果、同じモデルが1 より多いクラスにおいて採用される。このことはまた幾つかの場合においてトー クスパートとミュージックを分離するサイレンス期間のように、トークスパート とミュージックを区別するのに利用できる情報は無く、特定信号に対する任意の クラス特定を行わなければならないことを意味する。しかしながら、以降の必要 なときには提案した第1の分類法が参照される。 図1に示されるように本発明による装置は以下のものにより概略示される。 − 総称音声信号の複数のソースAS1...ASn(ここで「総称」とは上述 のように人間により知覚できる信号、すなわち0から約20kHzまでのバンド の信号を意味する。)。 − 音声エンコーダーAC。これは特定の入力音声信号に合ったオブジェクト向 き埋込コード化を行い、伝送経路1(伝送ライン、ラジオチャンネル・・・)に 送られ且つ好都合に組織化されたビットストリーム内に個々のオブジェクトを導 入する。 − クラス−サブクラス認識器CR。これはコード化されるべき音声信号の抽象 クラスと具体クラスを特定し、分類の結果を接続2を介して音声エンコーダーA Cに供給し、それによりエンコーダーは最適なソースモデル(すなわち最適アル ゴリズム)を適用できる。 − 伝送経路に沿って配置された1以上のビットストリーム操作装置BMU。こ の装置は、エンコーダーACにより作られたビットストリーム又は先行の操作装 置BMUから来るビットストリームを受け取り、ユーザーやシステムの要求に対 処すべくビットストリームレベルで個々のマクロオブジェクトを操作する。ここ では簡単のため一つの操作装置のみ示す。 − 可変レート制御装置VRCU。これはエンコーダーからの出力にてビットレ ートを決め、エンコーダーACの出力ビットストリームの編成及び/又は接続3 により示されているように装置BMU内でのビットストリーム操作を制御する。 このことは、それぞれ接続4、5を介してユーザー装置US及び/又はシステム 管理装置SYにより供給されるユーザーはシステム要求に関する情報を用いるこ とにより行われる。 − 音声デコーダーAD。 用途に依存してソースAS1...ASnはユーザー装置USの一部とさえで きることに留意せよ。 エンコーダーACは、特定の具体クラスを表し且つコード化信号を放出するの に用いられる最適パラメーターをエンコードしなければならない。このコード化 信号の放出は、特定の音声シーン内容及び/又は考慮している特定のサブクラス に依存した可変ビットレートにて行われるか、又は固定ビットレートで行われる 。固定ビットレートは予め決められ得るし、又はVRCUにより特定できる。上 述のように、エンコーダーACは埋込コード化を行う。既知のように、このこと は出力ビットレート及び関連の品質に対して幾つかの可能な出力層が与えれるこ とを意味する。低(基本)層、複数の中間層及びトータル層が特定できる。基本 層は最小の情報を含み、これは以降において「コア情報(core information)」と 称し、出力信号をデコードするのに必要である。トータル層は伝送され得る情報 の全体を含み、コード化信号の最大ビットレート、最高品質及び最大バンド幅を 生じる。中間層は基本層からトータル層への連続ステップによりコード化信号の ビットレート及び品質を向上させる。各ステップで導入される情報を、「エンハ ンス情報」と称する。デコード化側にて又は伝送経路に沿って、1以上の前記ス テップに対応したビットストリームの部分が抽出できる。ここに記載した例では 、最大ビットレートは64kbit/sと仮定され、音声信号の全バンド(20 kHz)に対応する。スピーチやミュージックに対する基本層は4kHzバンド 幅を有し、約6kbit/sのビットレート(ミュージックに対する実際のビッ トレート、及びスピーチに対する平均レート)に対応できる。中間層は各々が1 .5−2kbit/sのステップに対応できる。 重要な特徴は、規格化された任意の音声コード化アルゴリズムを含めて異なる アルゴリズムに従ってエンコーダーACが動作できることである。現存する規格 が用いられるならば、作られるビットストリームはコア層を形成し、もしチャン ネル容量がより高いビットレート又はより広いバンド幅を可能にするならば、本 発明はコード化信号の更新を行う。デコード化側では、基本層のみを用いること により標準デコード化アルゴリズムとの協同操作性がなお保証される。しかし、 チャンネル容量全体が使用されるならば、再生信号の対応する更新が得られる。 ACの構造は図2に関して後ほど詳細に説明される。 クラス/サブクラス認識器CRは最適認識器とすることができ、シーン上にど のオブジェクトがスーパーインポーズされているかを特定し、クラスに依存した 最良の方法により(すなわち最適モデルを用いて)扱える異なる信号を与える。 このことによりシステムが非常に柔軟になる。というのは、この場合には、受信 器が再生したいオブジェクトを受信器が決めることができ、かつそれらをどのよ うに混成するかをさえ決めることができるからである。しかしながら、好ましく はより簡単な解決策が採用でき、これは今日の技術で実行でき、所与の音声シー ンにおいてCRは最も可能性の高いものとして一度に1つのクラスを特定し、よ って、音声シーンを満たす特定信号に用いられるべき1つの特定モデルを割り当 てる。さらに、ソース(例えばスピーチ/ミュージック)の性質に関する幾つか の情報が、接続6を介してユーザーにより与えられ、各特定ソースに対するオブ ジェクト認識手順を簡単化するのに用いることができる。 一般的には、認識器CRは信号処理装置であり、これは、信号レベルを分析す ることによりトークスパート(又は一般に活性信号)、サイレンス及びノイズを 区別し(すなわちスピーチの場合の所謂音声活性検出器の機能に対応した仕事を 行う);信号のスペクトル分析を行うことによりスピーチ、ミュージック(又は 異なるミュージック楽器)及びトーンを認識し;スピーチの場合に着手、定常状 態及び衰退を識別し且つ周期的セグメントと非周期的セグメントを識別すべき有 声/無声分類を行うことによりトークスパートの具体クラスを認識する。スペク トル情報及び予測利得の分析により、周期的又は非周期的無声信号の認識が可能 となり、着手、定常状態及び衰退間の区別が、スペクトル情報に従って行われ得 るか又は最初のセグメントを着手とし最後のセグメントを衰退として単にラベリ ングすることにより行われる。 ビットストリーム操作装置BMUは提案したアーキテクチャーのうちの重要要 素の一つであり、そのビットストリームレベルにて動作することにより非常に種 々の機能が実現できる。装置BMUが存在するお陰で達成できる主要な結果の一 つは、エンコーダーの構成を変えること無く、サービスのランタイム品質を変更 する可能性である。このランタイム品質はビットレートに厳密に相関する。装置 BMUの主要なタスクを以下に示す。 − 特定チャンネル容量に適合させるため、又はユーザー要求に合わせるために 、出力ビットストリームのデータレートを低減すること(スカラビリティ)。 − そのビットストリームで動作することにより、任意のマクロ−オブジェクト 、又は特定オブジェクトの固有パラメーターを変更すること。このことにより、 例えば異なる音声オブジェクトのレベル、バンド幅又は品質を変更でき、又はト ーン特性又は韻律素特性までも変えられる(多重コンカレントオブジェクト操作 )。 後ほどBMUの動作についてより詳細に説明する。 上記した可変レート制御装置VRCUは、エンコーダーACから出力ビットレ ートを制御する主要タスクを有する。別法として又は追加として、ビットレート 制御はBMUを介しても実現できる。このために、情報VRCUはユーザー装置 USから受信し、システム管理装置SYは、ユーザーが望むサービスの品質、及 びシステムがその時に与えることができるサービスの品質を一般に表すことが出 来る。移動通信管理に用いられる傾向にある可変レート制御装置の実施態様は、 欧州特許出願EP−A−0627827に記載されている。その例では、ユーザ ー装置及びシステム管理装置SYにより与えられる情報は、ソースビットレート 、ソースにより放出される信号に関する冗長性、及びチャンネルのビットレート に関係する。当業者ならば、上記特許出願に開示された原理を異なる種類の音声 信号伝送に適用するのに問題はない。 ここで図2を参照すると、明瞭に説明するためにクラス認識器CRが再度示さ れている。ライン7−1...7−nを介してソースAS1...ASnから来 るデジタル信号は、各々がNサンプル(例えば256)から成るフレームに編成 されており、マルチプレクサーMXUにより受信され、例えば1ソース当たり1 フレームが一度に下流に送られる。これらの信号は、CRで該信号を適当に分析 できるべく入力サンプリング周波数fs0(接続7A)に関する情報と関連してお り、CRに該情報が送られる。マルチプレクサーMXUはアップサンプリング装 置のようにも動作し、入力サンプリング周波数fs0を内部サンプリング周波数fs1 に変換する。例えば、内部サンプリング周波数fs1は2のべき乗でfs0よりす ぐ上である(例えばfs0が16から32kHzでれば、fs1は32kHz。fs0 が32から48kHzの間にあれば、信号は64kHzまでアップサンプリング される。)。この適応の利点は、次に行うサブバンドへの分割が入力サンプリン グ周波数に依存しないことである。入力信号サンプリング周波数が8、16又は 32kHzのときにはアップサンプリングは出来ない。 幾つかの特定用途では(例えば音声編集、多話者用途、ビデオオブジェクトと リンクした音声オブジェクト・・・)、ソース識別をコード化するビットグルー プが、ビットストリーム構成装置BCUにより出力ストリーム内に導入される。 BCUは後ほど説明する。もしマクロオブジェクトの集合がそこで実行されるな ら、上記識別に関する情報は接続8を介してMXUから、又はCRからBCUに 与えられる。しかしながら、以下の説明では各ソースは独立にエンコードされる ものと仮定する。 マルチプレクサーMXUから出て行く音声信号のフレームs(n)は第1フィ ルターバンクFB1に送られ、低バンド1(n)及び高バンドh(n)に入力信 号が分解され、それぞれ接続9、10に送られる。例えば、狭バンド又は広バン ドスピーチ圧縮法のどちらが望まれるかに依存して、低バンド1(n)は0から 4kHz又は8kHzのどちらかまでのレンジのスピーチバンドから成り得る。 記載されたエンコーダーの基本的な実施態様では、ユーザーは信号内容について の幾つかの情報をクラス認識器に与えて、クラス/サブクラス認識が低及び高バ ンドの信号に対して別々に実行できることが仮定される。このことは明らかに認 識器の構造を簡単にする。 低バンド信号1(n)は線形予測分析装置LPAに送られ、該装置LPAにお いて短期及び長期予測係数が計算される。これら係数は接続11を介してビット ストリーム構成装置BCUに、及び実際のコード化アルゴリズムを実行する装置 LCC、LEC(後に説明)に送られる。LPAは分類結果に依存して利用可能 又は利用不可とされ得る。線形予測技術は、バンド0−4kHz又は0−8kH zのスピーチ信号に適用されるとき本質的に効率的になるが、線形依存性は或ミ ュージック信号(本質的に低周波数)においても存在し且つこれらの予測器を用 いることにより除去できる。線形予測分析は、当該技術において知られているい ずれの方法によっても実行できる。 線形予測分析の結果として得られる残差信号r(n)は別のフィルターバンク FB2に送られ、該フィルターバンクFB2は、クラス/サブクラス情報に従っ て音声信号をさらに分解しサブバンドの第1グループr1(n)...rM(n) を発生する。利用可能なビットレートに依存して、全てのサブバンド又はその部 分集合のみが量子化プロセスで考慮される。この量子化プロセスは後ほど説明す る。 類似のフィルターバンクFB3は、これもクラス/サブクラス情報に従って高 バンド信号h(n)を分解し、サブバンドh1(n)...hk(n)の第2グル ープを発生する。 分解のタイプ(間隔の等しいサブバンドへの分解又は臨界周波数バンドに適応 した分解)が構成できる。さらに、フィルターは、所定の(一定又は一定でない )バンド幅のサブバンドをサンプリング周波数に依存することなく発生するよう に構成可能である。基本的な実施態様では、20kHzバンドは、各々1kHz バンド幅の20個のサブバンドに再分割される。最初の4つのサブバンドが低バ ンドを形成する。 有利には、フィルターバンクFB2、FB3から出て行くフレームは、ブロッ クSF1...SF2により図示された夫々の装置(バッファー)においてサブ フレームにさらに再分割される。サブフレームの長さ、したがってコード化遅延 は、ユーザー及びアプリケーションの要求に依存して選択可能である。Nサンプ ルから成る1フレームをN/Lサンプルから成るLサブフレームに再分割するこ とは、時間領域において信号をさらに分解することに対応し、スピーチコード化 技術では通常の操作であり、詳しく説明する必要はないであろう。最初にサブバ ンドに再分割し次にサブフレームに再分割することで、音声信号は、時間軸上で N/Lサンプルに対応し且つ周波数軸上でF kバンド幅(フィルターバンク構 成に依存)に対応した「時間−周波数スロット」に分解される。 サブバンドr1(n)...rM(n)のサブフレームは、コード化装置LCC の第1組に送られ、該装置LCCは、各サブバンドに対して1つが割り当てられ 、低バンド信号のコアー情報を発生する。コアー情報は、接続12を介してビッ トストリーム構成装置BCUに送られる。LCC内の各装置は複数のコード化ア ルゴリズムにより動作でき、適当なアルゴリズムは、例えばユーザー及び/又は システム要求、及び/又は分類の結果に依存して選択できる。既に存在する国 際規格により定められた如何なるコード化アルゴリズムでも使用可能である。も し4(又は8)kHzバンド幅で動作し且つ線形予測分析にも対処する標準コー ド化アルゴリズムが用いられるならば、装置LPAとフィルターバンクFB2は 作動されない。低バンド信号は一般にスピーチ信号であり最も標準化されたスピ ーチコーダーはバンド幅4kHz(時々8kHz)の信号に動作することを考慮 すると、フィルターバンクFB2でさえ配置でき、好ましくはLCCの下流に配 置される。このことは、標準コード化アルゴリズムを用いた総称コーダーの相互 操作性をより容易にする。この場合にはもちろんLCCは単一の装置から成る。 有利には、スピーチコード化に採用されるアルゴリズムは、分析による合成技 術となる。 低バンド信号のコアーコード化のための専用コーダーは、2つのイノベーショ ンコードブックを用いた多重レートCELPコーダーとすることができる。この コーダーでは、現在のスピーチセグメントを表すのにより適したパラメータの組 が、分類の結果により決まり、可能なコード化レートの部分集合が選択される。 そして、合成による分析ループでは、所望の品質を達成するのに要求される最小 レートが、ローカルで合成された信号に幾つかのオブジェクト手段を用いること により決められる。最小ビットレート(〜0.25kbit/s)は例えばバッ クグランドノイズ(抽象クラス「ノイズ」)のみの伝送に対応し、最大ビットレ ート(約11kbit/s)は短期及び長期パラメータの伝送及び両方のイノベ ーションコードブック(抽象クラス「トークスパート」;具体クラス「周期的」 )からの寄与の伝送に対応する。中間ビットレートは、ノイズ及び短期パラメー タ、短期及び長期パラメータ、短期パラメータ及び1イノベーション寄与等を伝 送することにより得られる。多重レートCELPコーダーにおいて出力ビットレ ートが信号分類に依存して選択されることは当該技術においては知られている。 低バンドミュージック信号の場合に適用できるコード化アルゴリズムは、ベク ター量子化に基づき得る。形状/利得ベクトル量子化器は、各時間一周波数スロ ットに適用されるか、又はそれらの組合せに適用される。量子化は各サブフレー ムにおいて2ステップで行われ、第1ステップでは形状が量子化され、第2ステ ップでは利得が量子化される。量子化は周波数領域又は時間領域のどちらかにお いて行われ得る。特定の時間一周波数スロットを量子化せず、量子化された周囲 のスロット(時間、周波数、又は時間−周波数において)を考慮して補間するこ とができる。ベクトル量子化は全く従来技術であるから特に説明は必要ないであ ろう。ベクトル量子化が(コーダーの所望の特徴である)複雑性スカラービリテ ィを容易にサポートし、伝送されるべきどんなパラメータも夫々のコードブック の部分集合のみにおいて検索され得ることに留意されたい。よって、コーダー− デコーダーの複雑性と音声の品質は容易に取り決められる。さらに、ベクトル量 子化はクラス/サブクラスのアプローチを容易にサポートし、特定のコードブッ ク表が各音声クラス/サブクラスに割り当てられ得る。 高バンドに属する信号のサブフレームはコード化装置HCCの第2組に送られ 、該コード化装置は高バンドのコアー情報を発生してその情報を接続13を介し てBCUに送る。コード化装置の組HCCも、夫々のサブバンドに対して好まし くはベクトル量子化に基づいた複数のコード化アルゴリズムに従って動作できる 。 明らかに、採用されたコアーアルゴリズムは、設定されたコールにてデコーダ ーと通信しなければならない。 このコード化は、例えば所謂「同時マスク効果」に基づいたモデルのような適 当な知覚モデルをも用いることができる。該効果は、弱い信号(特に量子化ノイ ズ)が近接周波数のより強い信号(特に音声信号中のトーン)により聞こえなく なる現象のことである。知覚モデルを使用すると、適当なマスク閾値を決めなけ ればならず、これは処理装置PMPにおいて個々のサブバンドから開始するか又 は高低バンドの音声信号のスペクトル分析により行われる。図示されているよう に、最初の場合にはPMPはフィルターバンクFB2、FB3の出力に接続され 、2番目の場合にはFB1の出力に接続される。知覚モデルに関する情報(一般 にはグローバルマスク閾値についての情報)はPMPによりコード化装置の組L CC、HCC及び接続14を介してビットストリーム構成装置BCUに送られる 。信号をサブバンドに分離するとき知覚モデルを考慮するならば、上記情報はF B2及びFB3にも供給され得る。 コード化信号内に挿入されるべきコアー情報は、利用可能ビットレートに依存 して幾つかのサブバンドのみから、信号及び/又は知覚モデルの性質への寄与を 含み得ることを指摘しておく。サブバンドがコアー情報に対して寄与しなければ ならないかの決定は、BCUにより行われる。よって、BCUとLCC、HCC 間の相互作用が行われる、簡単のため、図面にはコード化信号をBCUに伝える 接続12、13のみを示す。 コード化装置LCC及びHCCの後には、夫々第3及び第4の組のコード化装 置LEC、HECが続き、これらは同様に各サブバンドに対する1装置から成り 、コード化信号内に挿入されるべきエンハンス情報を発生する。有利には、第3 及び第4組内のコード化装置はベクトル量子化技術に従って動作し、例えばそれ らはLCC、HCC内の夫々のコアーコード化装置の出力にて量子化エラーをコ ード化する。エンハンス情報はLEC、HECから夫々接続15、16を介して BCUに送られる。LEC、HEC内の各装置は、予想されるビットレートの増 加に対するステップと同数のステージから成る。本発明の好適実施態様では、7 つのエンハンスステージまでが1サブバンドに適用できる。またエンハンスコー ド化については複数の異なるアルゴリズムが可能であり、最後に適用されるアル ゴリズムの組は構成フェーズにおいてシグナリングされる。そのようなモデルが 用いられるならば、所与のサブバンドに適用されるアルゴリズムのタイプは、知 覚モデルと共に具体クラスにも依存する。サブバンド内で使用されるコアーアル ゴリズムのタイプもまた考慮され得る。利用できるビットレート、信号の性質及 び/又は知覚モデルに依存して、BCUは、どのサブバンドがエンハンスされる べきか及びどのエンハンスステージが幾つ特定のサブバンドに割り当てられるべ きかを決める。よって、BCUとLEC、HEC間の相互作用もまた与えられる が、簡単のため、図面にはコード化信号をBCUに伝える接続15、16のみ示 す。 ビットストリーム操作装置が興味あるビットストリームの部分を抽出して操作 できるように、線形予測分析パラメータ、コード化信号、クラス/サブクラス情 報は所望ならばソース識別と共に、装置BCUによりマクロオブジェクト数、サ ブバンド数、サブバンドに対するエンハンスステージ数に関する適当なサービス 情報(オーバーヘッド)に関連付けられ、埋込ビットストリーム内に組み込まれ る。コアー及びエンハンス情報はビットパケット内に編成され、各パケットはサ ブバンド及びそのサブバンドに対するコード化ステージ(コアー又はエンハンス )に関連付けられる。装置BCUは本質的にマルチプレクサーと制御ロジックか ら成り、制御ロジックは、どのサブバンドがコアーコード化に対して考えられる か及びもしあれば幾つのエンハンスステージがそれらサブバンドの各々に適用さ れるべきかを決めるのに必要な操作を行う。 実際、前述の数値例を考慮すると、コード化ステージの全てを全サブバンドに 適用することは出来ないことは明らかである。このことは、現在予想される64 kbit/sよりもずっと大きなビットレートでの伝送ライン、高度に洗練され た分類案の適用、及びコード化装置により作られたビットレートを大きく低下で きる知覚モデルを必要とする。よって、少なくともコアーコード化が実行される サブバンド、及びこれら「活性」サブバンドに適用されるべきエンハンスステー ジ数のBCUによる選択について適当な戦略が考えられるべきである。適当な戦 略は以下の通りとできる。 第1ステップは、所望の出力ビットレートから始めて出力信号に対するバンド 幅を決めることである。例えば、所定の閾値ビットレートに割り当てられ得るバ ンド幅はアプリオリに設定され、2つの連続閾値間の間のビットレート値に対し ては出力バンド幅は線形補間により決められて最も近い整数値に丸められる。適 する関連バンド幅/閾値ビットレートは、16kbit/sまでのビットレート に対しては4kHz、24kbit/sのビットレートに対しては8kHz、6 4kbit/sのビットレートに対しては20kHzとできる。一旦バンド幅( よってサブバンド数)が決められると、バンド内の信号のエネルギーレベルが所 与の閾値を越えると仮定するなら、コアーコード化ステージが適用される。この 閾値は固定か又は知覚モデルに依存することもできる。もしビットレートがコア ーステージを全サブステージに適用することを不可とするならば、閾値は増加さ れて上記ステップが繰り返される。一般に、所望の全サブバンドにコアーステー ジを適用することは常に可能である。コアーステージを割り当てた後、ビットレ ートがエンハンスステージの挿入を許容しているか否かを調べる。その調査の初 期ステップとして、エンハンスステージの最大数が各サブバンドに対して割り当 て得る。割り当てられたビットレートが利用可能なビットレートを越えるならば 、幾つかのエンハンスステージが使用不可とされる。このために、各サブバンド において、前のステージに対して各ステージにより与えられる信号−ノイズ比の 増加が決められ、最小の増加を与えるステージが、それらが属するバンドに依存 せず、使用不可とされる。 信号−ノイズ比の増加に代えて、特定ステージをイネーブルするか否かの決定 は上述のように同時マスクモデルを利用できる。すなわち、この場合、マスク閾 値より低いノイズを有するエンハンスステージがまず使用不可とされ、それから マスク閾値を越えたマスク閾値がより小さいステージが使用不可とされる。 エンハンスコード化ステージを選択する両方の戦略は、各ステージにより与え られる品質向上の評価に実質的に基づいている。 もし微分信号−ノイズ比が用いられサブバンドへの分離が常にコアーコード化 前に行なわれると仮定するならば、サブバンドのコード化装置とビットストリー ム操作装置の間の接続は図3に示されるようにできる。ここで、ECa...E Cpはエンハンスコード化装置内でのコアーコード化装置及び異なるステージを それぞれ示し、これらはLCC、HCC及びLEC、HEC(図2)の組内の考 慮中のサブバンドに割り当てられる。BCL、BCMはそれぞれ制御ロジック及 びBCUのマルチプレクサーを示す。BCLはコアーコード化装置CCの入力信 号x(n)を受信し、その信号のエネルギーを計算し、もしサブバンドがコアー 情報に寄与しなければならないならばCC(接続17)をイネーブルする。エン ハンスコード化ステージの選択のため、第1エンハンスステージの入力にて減算 器SUaはコアーコード化装置CCの入力信号x(n)と該装置自身内で利用可 する。ここでxiはサブフレーム内での総称サンプルである。信号x(n)及び 量子化エラーeaはBCLに与えられ、BCLは通常の関係式Σ(xi)2/Σ( する。量子化エラーεaもまたコード化装置ECaに送られ、該コード化装置は 、適当なエンハンスコード化アルゴリズムをεaに適用し、再構成された量子化 情報ブロックを発生する。再構成された量子化エラーは、BCLに送られて第1 エンハンスステージの出力にて信号−ノイズ比が計算され、そのステージにより 与えられる増分ΔSNRが計算され、また、第2ステージの減算器SUbに送ら れて新しい量子化エラーεbが発生される。同じ編成が残りのステージにおいて も繰り返される。最後のステージのコード化装置ECpの出力では、量子化エラ ーの前回値εp+1が計算されてBCLに与えられる。考慮しているバンド及び他 のバンド(二重線矢19により全体として図示された接続を介して与えられる) の各ステージの後の信号−ノイズ比の増分ΔSNR故に、該バンドがエンハンス 情報に寄与しなければならないならば、BCLは1以上の線18a...18p 上に信号を送り出し、該信号は、対応するコード化装置ECa...ECpをイ ネーブルしてそのエンハンス情報ブロックを出力15a...15p(16a. ..16p)上に転送させる。接続17、18a...18pに存在する信号と 類似のイネーブル信号は、他のサブバンドのコード化装置に送られる。矢印19 は、他のバンドの装置に導く接続をも示す。さらなる接続20は、ビットストリ ームのオーバーヘッド内に挿入すべきサービス情報をBCLからBCMに送る。 BUMから経路1への情報の転送は、後に説明するように、異なる方法で行われ 得る。 BCUの出力でのビットストリーム編成は、複数のソースの場合、よって複数 のマクロオブジェクトの場合について図4に示される。ストリームはオーバーヘ ッドビットOVH0のグループを含み、これに続くのは第1、第2...フレー ムのマクロオブジェクトに関するビットストリームOB11...OB1x,O B21...である。上述のように、マクロオブジェクトは、特定のソースに関 する又はフレーム中の他の情報とのリンクに関する全コード化ビットを含む。オ ーバーヘッドビットOVH0は、いくつのマクロオブジェクトがビットストリー ム内に含まれるのかを識別し、入出力サンプリング周波数の情報をも含む。入力 サンプリング周波数は、オブジェクトをエンコードするとき用いられるサンプリ ング周波数である。出力サンプリング周波数は、受信器端にて使用されるべきサ ンプリング周波数である。ビットOVH0は接続セットアップでのみ送られねば ならないことに留意せよ。各マクロオブジェクトでは、OB11に対して示され ているように、オーバーヘッドビットOVH1の第1グループはオブジェクト分 類(抽象及び具体クラス)の情報を含む。オーバーヘッドビットOVH2の第2 グループは、実際に利用されているサブバンド(すなわち少なくともコアー情報 が伝送されるサブバンド)の数を示す。ビットOVH2に続くのは、コアービッ トストリームCBである。よって、OVH1、OVH2及びCBは共に基本層を 形成する。 コアービットの後、オーバーヘッドビットOVH3の第3グループは、各サブ バンドに適用されるエンハンスコード化ステージの数を示す。オーバーヘッドビ ットOVH3に続くのは、エンハンスビットEB1...EByである。 コアー及びエンハンスビットストリームCB、EB内では、ビットパケットは 異なる方法で配列され得る。特に、サブバンドによる配列又はランクによる配列 が可能である。コアー情報に対してはランクはエネルギーレベルとリンクされ、 エンハンス情報に対してはランクは、コード化アルゴリズムの適用を決めるため のステージにおいて評価される(例えば知覚モデルからの)パラメータとリンク される。もちろん二番目の解決策は、サブバンド識別についての情報をパケット 内に導入する必要ゆえにオーバーヘッドにおける増加をもたらす。 ビットストリーム操作装置BMU(図1)については、個々のマクロオブジェ クト又はオブジェクト内の幾つかのパラメータ(レベル、ピッチ...)の値を 変えることにより、又はビットレートをスケーリングすることにより、経路1に 沿って伝送されるビットストリームを操作できる。 スケーリングに関する限り、BMUの動作は、ビットストリーム構成装置BC Uにより採用されるビットパケット配列により影響される。 サブバンド配列が採用されるならば、ビットストリーム操作装置は、エンコー ダーACで用いられるアルゴリズムと同様のアルゴリズムを用いてコード化サブ バンド数を決め、考慮されるべきコアー情報の無いバンドに関係した全パケット を放棄する。このようにして得られたビットレートがなお要求されたビットレー トを越えるならば、さらなるステージが除去される。すなわち、放棄されるべき ステージが割り当てられた唯一のステージでないと仮定すると、最上位バンドか ら開始して各バンドに対して1パケットを放棄するという選択が可能である。ひ とたび全バンドが調べられた後は、コード化ステージがなお割り当てられている 最高バンドから再度開始して新しいサイクルが実行される。要求されるビットレ ートが得られるまで、又は全てのバンドに対してコアーステージのみが割り当て られるまで、該手順が続けられる。もしコアーステージのみの割り当てによって もビットレートが所望のビットレートを越えるならば、コアーステージも最上位 バンドから開始して除去される。 逆にランク配列が採用されるならば、除去は即刻である。上述のように、ラン ク配列はより大きなオーバーヘッドをもたらす。すなわち、コード化フェーズの 間所与のビットレートに対して割り当て出来るステージ数が低減される。なお、 ビットストリームを構築するためエンコーダーにて採用されるのと同じルールが 、ビットストリーム操作装置においてステージを放棄するのに採用できる。従っ て、その操作は品質の違いを生じさせない。 上記操作は単一マクロオブジェクトに関する。なおビットストリーム操作装置 BMU(図1)は、個々のオブジェクトのビットストリームに作用することによ り全てのコード化パラメータを変更できる。例えば、多重コンカレント音声マク ロオブジェクトが伝送されているとき、一般に関連データストリームは、伝えら れる実際の情報に依存して異なるビットレートを有し得る。一つの単純な操作特 徴は、各マクロオブジェクトのレベルを変更する可能性、又は1話者の音声のオ ブジェクト要素(ピッチ、スペクトルなど)を変更する可能性、1楽器のミュー ジックモデルを変更する可能性などである。別の可能性は、所与のビットレート (例えば最大ビットレート)での幾つかの基本ストリームから該所与のビットレ ートでの単一ストリームを作ることである。この操作は、ビットストリーム操作 装置において、各行がバンドに関連し各列がマクロオブジェクトに関連した2つ の表を作ることを必要とする。第1表は各バンド及び各マクロオブジェクトに割 り当てられたステージ数(又はビットストリームにより抽出された他の情報)を 含み、第2の表はそれぞれのエネルギーレベルを含む。ビットレート低減手順は 、サブバンド配列の場合に上記考えられたものと類似しているが、違いは、周波 数を減少させるためではなくエネルギーを増加させるためにサブバンドが調べら れることである。このようにして、支配的マクロオブジェクトはより大きなレー トを得て、全体の品質は、全マクロオブジェクトを同じビットレートに割り当て ることにより達成可能な品質よりも良くなる。 オブジェクト操作は個々のフレームに係わることができることにも留意せよ。 このことは例えばもし何らかの音声オブジェクトが一映像オブジェクトにリンク されるならば、複雑なオブジェクトの音声−映像ズームを有する可能性が存在す ることを意味する。 図5を参照すると、デコーダーが示されている。デコーダーの全てのブロック は、接続のセットアップにおいてコーダーの対応ブロックの構成についての情報 を受信し、相補的操作を正確に行う。構成情報は接続21を介して受信又はビッ トストリーム分解装置BDUにて受信する。該装置BDUはBCUに対して相補 的なタスクを有する。簡単のため、このような情報をデコーダーブロックに分配 する手段は図示されていない。受信装置BDUは、多くの場合BMUにより操作 されるストリームを、1で示された伝送経路から受信し、クラスを分離し、実際 のコード化信号から情報を識別し、これらの情報を接続22、23にそれぞれ与 える。コード化信号ストリームは低バンド及び高バンドストリームに分解され、 接続24、25を介して夫々のエンハンスデコーダーLED、HEDに送られる 。コーダーLEC、HECに類似のデコーダーLED、HEDは、各々が1サブ バンドに関連した一組の装置から成り、LEC、HEC内のステージと同数のス テージを含む。異なるサブバンドに対する個々のステージは、コーダー内の対応 ステージがイネーブルされたか否かに依存せずに作動される。このイネーブルは 、オーバーヘッドOVH1−OVH3(図4)に含まれる情報に基づいてBDU により制御される。各装置は、コード化側に適用されるコード化アルゴリズムと 相補的なデコード化アルゴリズムを実行する。個々のオブジェクトをデコード化 するために、デコーダーLED、HEDはまたクラス−サブクラス情報を必要と する。 エンハンスデコーダーは再構成量子化エラーELi(n)(i=1...M), Ehj(j=1...K)を夫々のコアーデコーダーLCD、HCDに送り、デコ は、クラス情報が用いられる。サブバンドの再構成信号は、FB2、FB3(図 残差信号の線形予測合成の後、元の信号のバンド全体が合成フィルターバンクF B6(FB1と相補的)により再構成される。該合成フィルターバンクFB6は を受信する。必要ならば、FB6から出てくる信号は、ダウンサンプリング装置 DSにおいてダウンサンプリングされ、ブロックUS’で略示されたユーザーに 出力装置OUを介して送られ、該装置OUは、ソース識別を再構成ストリームと 関連づけ、もし必要ならば異なるデコード化マクロオブジェクトを異なるユーザ ーに送る。ダウンサンプリングのため、所望の出力サンプリング周波数fosにつ いての情報がユーザーにより与えられる。 もし例えばビットストリームがエラーの起こりやすい環境で伝送されるならば 、音声オブジェクトに基づくアプローチは、音声デコーダーにおいてエラー隠蔽 技術を効率的にサポートすること、すなわち、特定のエラー隠蔽アルゴリズムが 各々の抽象/具体クラスの組合せに対して適用できることにも留意された。 上記説明は限定的でない例により単に与えられており、改変及び変更は本発明 の範囲を逸脱することなく可能であることは明白である。
【手続補正書】特許法第184条の8第1項 【提出日】1997年11月27日 【補正内容】 補正明細書 音声成分の処理に関する限りでは、許容される値の組内でコード化パラメータ ーのみを変えることにより、ビットレート、遅延、品質、バンド、チャンネルエ ラー頑強性などのようなエンコーダーの主要特性を変える装備が、柔軟性の要求 の中に含まれる。このような柔軟性により、異なる要求を伴う種々雑多な用途に おいて総称コーダー−デコーダーの使用が可能となる。総称コーダー−デコーダ ーが利用可能になると、将来のデジタルシステムでは異なるソースから発生され た音声データの変換が容易になり、ネットワークインターフェースが簡単になり 、異なる規格間のトランスコード化における品質低下を抑える。このことは、将 来のユニバーサル・モバイル・テレコミニュケーション・システム(UMTS) たる異なる(移動又は固定)ネットワーク間での音声データの変換が増大するこ とを考慮すると、非常に重要となる。ユーザーの特定の要求をサービスが満たす ことができるように、又は、設備及びサービス提供者がシステム条件に依存せず にサービスを最適化できるように、総称コーダーはコーダー−デコーダーパラメ ーターを変更できるべきでもある。さらに、コーダーは音声データの変換の前に 構成フェーズのアプリケーションをサポートすべきである。このようなフェーズ では、コーダー−デコーダーはユーザー及びシステムにより決められたサービス 要求に依存して構成される。 そのような種類の総称コーダーは当該技術においては知られていない。「埋込 コード化」として一般に知られている幾つかのコード化技術により、エンコーダ ー特性を変えることなくビットレートを下げられる。換言すれば、エンコーダー は固定アルゴリズムに従って動作し、コード化された信号は、情報の一部が喪失 できる又は伝送経路に沿って抑制できるように構成される。なお、少なくとも本 質的な情報が受け取られると、たとえ品質が或程度劣化しても、デコーダーは信 号をデコードできる。例として、埋込ADPCM(Adaptive Differential Pulse Code Modulation)コード化がITU−T標準G.726に開示されており、埋 込CELP(Coder Excited Linear Prediction)コード化がUS−A−5353 373に開示されている。両者とも、非常に制限された数のリダクションステッ プのみ可能であって、バンド幅への介入はできず、明らかに異なるコード化技術 を組み込むことは出来ない。 ドキュメント・グローブコム’90:IEEEグローバル・テレコミニュケー ションズ・コンファレンス&エキシビション、’通信:未来との接続’(Cat .No.90CH2827−4)、San Diego、CA、1990年12 月2−5日、ISBN 0−87942−632−2、ニューヨーク、NY、U SA、頁523−527、Vol.1、コンド他:「ATMネットワーク上での パケットスピーチに対する可変レート埋込ADPCMコード化法(Variable Rate Embedded ADPCM Coding Scheme for Packet Speech on ATM Networks)」に開示 された埋込コーダー(スピーチコード化のみのための)においては、 − 入力信号セグメントの特性がどうであれ、コアー情報(信号の最重要部分) 及びエンハンス情報をコード化するために1つのコード化アルゴリズム(ADP CM)のみが使用される。すなわち、許される唯一の柔軟性は、異なる信号部分 (サイレンス、有声セグメント、無声セグメントなど)に割り当てられたビット レートに関係し、いずれにしても、ビットレートステップの数が制限されること が予想され、 − スピーチ以外の音声信号をコード化するための規定は為されておらず、該ド キュメントにおいて他の信号に対する説明は全く取るに足らないものであり、 − 信号の性質及び/又はユーザーとシステムの要求に依存してコード化ビット ストリームのバンド幅及びビットレートに介入することは開示又は示唆されてお らず、コード化信号の操作の可能性についても開示又は示唆されてない。 EP−A−0206352が示すコード化装置では、たとえ個々の要素が異な る量子化特性を有していても、同じアルゴリズム(ADPCM)に従って動作で きる個々の要素に信号が送られる。よって、この場合にも、異なる音声信号に対 して、又はコアー/エンハンス情報に対して異なるコード化技術を選択する可能 性は無い。ドキュメントD2も、エンコード化されたビットストリームを操作す る可能性を開示又は示唆していない。 US−A−4464783に開示されたコード化装置では、前にコード化され たサンプルブロックに対して有為な差が存在するか否かに依存して、特定パラメ ータについての情報がコード化信号内に含まれるか又は含まれない。そのため、 より多くのビットが他の情報に割り当てられ得る。いずれにしても、固定レート 伝送が参照される。 従って、本発明の目的は、コード化側では埋込コード化が行われて、少なくと も「コアー」情報が受信されたと仮定するとデコード化はまだ可能であり、コー ダー出力及び伝送経路に沿ってビットレート及びバンド幅の両方において実際の スカラビリティを可能にし(「スカラビリティ」は、大抵連続的な方法で多くの 微細ステップにてビットレート又はバンド幅を減少させる可能性を意味する。) 、異なる信号に対して異なるコード化技術の使用を可能にし、そしてコード化パ ラメータの操作を可能にする方法及び装置を提供することである。 この課題は、新しい請求の範囲第1項及び第32項の主要部により解決される 。好ましい実施態様は、従属クレームの主題である。 特に、本発明の方法及び装置はオブジェクト向きパラダイムに基づいている。 すなわち、総称音声入力信号は基本音声オブジェクトの結合として考えられ、基 本オブジェクトはマクロオブジェクトにグループ化でき、該マクロオブジェクト は他の情報(例えばビデオ情報)にリンクでき且つ独立に操作できる。コード化 されているオブジェクトのタイプに依存して、最適なコード化技術、及びシステ ム条件と矛盾しない最適なビットレート及び/又はバンド幅が選択できる。コー ダーからデコーダーへの伝送経路に沿って、個々のマクロオブジェクトについて の又は単に個々のオブジェクトについてのビットストリームの操作が可能であり 、それにより異なるシステム条件に対処してユーザーがシーンなどと相互作用で きるようにすることが可能である。 補正請求の範囲 1 デジタル化音声信号を処理する方法であって、 (ア)コード化フェーズであって、処理されて所定数のサンプルから成る一連の フレームに編成されるべき信号が、独立にコード化され得る複数の周波数バンド に分離され、コード化信号は、前記周波数バンドの少なくとも選択されたもの内 の信号に関連した情報を含んで発生され、コード化は埋込コード化技術に従って 行われ、その結果、コード化信号は、基本層、トータル層及び複数の中間層を含 み、該基本層はデコード化に必要な最小量の情報(「コアー情報」)を含み且つ 最小ビットレートに対応し、該トータル層はコード化情報の全体を含み且つ最大 ビットレートに対応し、該中間層はそれぞれの情報ブロック(「エンハンス情報 」)によりコード化信号に寄与し且つ基本層からトータル層への連続ステップに よりコード化信号のビットレートを増加させ、該情報ブロックはコアー情報のみ により表され得ない夫々の信号部分をコード化し、基本層は第1コード化ステッ プにより発生され、エンハンス情報の各ブロックは夫々の第2コード化ステップ により発生される、上記コード化フェーズ、及び (イ)デコード化フェーズであって、コード化信号に含まれる異なる周波数バン ド内に関する情報が独立にデコード化され、両方のエンハンス情報ブロックとコ アー情報がデコード化されるべき周波数バンドに対して、コード化信号が第1デ コード化ステップの組及び第2デコード化ステップに伝送され、該第1デコード 化ステップ数はそのバンドに対して実行された第2コード化ステップの数と同じ であり、その各々において1エンハンス情報ブロックがデコード化され、該第2 デコード化ステップではコアー情報がデコード化され、一方、コアー情報のみが デコード化されるべき周波数バンドでは、コード化信号が第2デコード化ステッ プのみに伝送され;異なるバンドに関するデコード化信号は、再結合されて元の 信号のバンド幅特性に対応したバンド幅特性を有する再構成信号を作る、上記デ コード化フェーズ、 を少なくとも含み、 前記コード化フェーズでは、2ステージ分類が行われ、それにより所与のフレ ーム内でコード化されるべき各音声信号が、複数の抽象クラスからの一つ及び前 記1抽象クラスの複数の具体クラスからの一つに割り当てられ、具体クラスは、 信号部分の特性と関係しフレーム内に存在する基本音声オブジェクトを識別し、 抽象クラスは、音声信号の性質に関係し基本音声オブジェクトの結合から生じる マクロオブジェクトを識別し、 また、所与の音声オブジェクトに対する前記第1コード化ステップは、複数の 第1コード化アルゴリズムから選択された第1コード化アルゴリズムにより実行 され、その所与の音声オブジェクトに対する如何なる第2コード化ステップも、 複数の第2コード化アルゴリズムから選択されたそれぞれの第2コード化アルゴ リズムにより実行され、前記複数の第1及び第2コード化アルゴリズムそれぞれ からの選択は、少なくとも前記2つのステップ分類の結果に依存し;コード化フ ェーズは、各オブジェクトに対して、オブジェクトビットストリーム及びマクロ オブジェクトビットストリームを発生し、該オブジェクトビットストリームは、 そのフレーム内の音声信号と同じ具体クラスに関する全情報を含み、該マクロオ ブジェクトビットストリームは、同じフレームの異なるオブジェクトのビットス トリームを、抽象クラス又は異なる抽象クラスに結合し、そのビットレート及び バンド幅特性は、前記第1及び前記第2アルゴリズムに対して為された選択、及 びユーザー装置(US)からコード化デバイス(AC)に送られる構成情報、及 び/又は伝送システム(SY)からコード化デバイスに送られる制御情報に依存 し、 また、該方法は、コード化及びデコード化フェーズの間に、前記コード化フェ ーズにより発生されたビットストリーム、前記構成及び制御情報を操作するフェ ーズをさらに含み、該ビットストリームの操作は、コード化ビットストリームに 含まれた抽象及び具体クラスについての情報に依存してコード化ビットストリー ムをスケーリングする為であり、 また、前記デコード化フェーズでは、各第1デコード化ステップは、コード化 フェーズで選択された第2アルゴリズムと相補的なそれぞれのアルゴリズムによ り実行されてそのステップでデコード化されるべきエンハンス情報ブロックを発 生し、そして、第2デコード化ステップは、第1コード化ステップで選択された 第1アルゴリズムと相補的なアルゴリズムに従って実行され;前記第1及び第2 デコード化アルゴリズムの各々は、抽象及び具体クラスを備えた情報及び/又は セットアップフェーズで与えられた構成情報に従って、前記第2及び第1コード 化アルゴリズム夫々の一つと各々相補的な複数の第1及び第2デコード化アルゴ リズムから選択される、 ことを特徴とする上記デジタル化音声信号を処理する方法。 2 第1及び第2アルゴリズムは異なるバンドに対して独立に選択されることを 特徴とする請求の範囲第1項記載の方法。 3 第2コード化アルゴリズムは、第1コード化アルゴリズムの適用の結果とし て得られる量子化エラーをコード化することを特徴とする請求の範囲第1項又は 第2項記載の方法。 4 第1アルゴリズムは、少なくともより低い周波数バンドの組の信号に対する 線形予測分析コード化アルゴリズム、並びにより高い周波数バンドの信号及び線 形予測が用いられない信号に対する形状/利得ベクトル量子コード化アルゴリズ ムを含むことを特徴とする請求の範囲第1項乃至第3項のいずれか1項に記載の 方法。 5 第2アルゴリズムは形状/利得ベクトル量子コード化アルゴリズムを含むこ とを特徴とする請求の範囲第1項乃至第4項のいずれか1項に記載の方法。 6 第1及び第2アルゴリズムの選択は、ユーザー装置(US)からコード化デ バイス(AC)へ送られる構成情報及び/又は伝送システム(SY)からコード 化デバイスに送られる制御情報に依存して実行されることを特徴とする請求の範 囲第1項乃至第5項のいずれか1項に記載の方法。 7 コード化の前に各フレームは複数のサブフレームに分割され、前記サブフレ ームの長さは、コード化遅延の複数の可能な値を得られるように、複数の長さ値 から選択できることを特徴とする請求の範囲第1項乃至第6項のいずれか1項に 記載の方法。 8 前記周波数バンドは、コード化されるべき信号のサンプリング周波数とは独 立に所定のバンド幅を有することを特徴とする請求の範囲第1項乃至第7項のい ずれか1項に記載の方法。 9 コード化されるべき信号は8から64kHzまでの任意の入力サンプリング 周波数でサンプリングされ、コード化前に、それは入力サンプリング周波数より すぐ上の2のべき乗である内部サンプリング周波数までアップサンプリングされ 、また、アップサンプリングは8、16及び32kHzの入力サンプリング周波 数に対しては機能しないことを特徴とする請求の範囲第1項乃至第8項のいずれ か1項に記載の方法。 10 スピーチ信号処理に対してコード化フェーズは、 (A)周波数バンドの全体の組に対する第1コード化アルゴリズムとして、標準 とされるスピーチコード化アルゴリズムを選択するステップ、 (B)標準とされるアルゴリズムにスピーチ信号を伝送することにより発生され るコアー情報で基本層を構築するステップ、及び (C)標準とされるコード化信号に対して更新されたコード化信号を得るように 、前記中間層の一つ又はトータル層に対応するコード化信号を構築するステップ 、 を含み、また、デコード化フェーズは、 a)基本層のみをデコード化するステップ、又は b)デコード化アルゴリズムの可用性、及び/又はデコード化信号に対して得ら れるべき品質に依存して、コード化信号全体をデコード化するステップ、 を含むことを特徴とする請求の範囲第1項乃至第9項のいずれか1項に記載の方 法。 11 少なくとも第1コード化ステップに伝送されるべき周波数バンドの選択に 対して、第2コード化ステップも実行され、所与の周波数バンドに対する第2コ ード化ステップ数が、コード化信号に求められるバンド幅及びビットレートに依 存しユーザー装置(US)やシステム(SY)の要求に従って決められ、コード 化信号は、1フレームベース当たり1フレーム上に、コード化される信号のバン ド幅及びサンプリング周波数とは独立に利用されることを特徴とする請求の範囲 第1項乃至第10項のいずれか1項に記載の方法。 12 第1コード化ステップに伝送されるべき周波数バンドの選択は、 a)利用可能なビットレートについてコード化信号に割り当て可能な総バンド幅 を決める操作、 b)前記バンド幅に含まれる各バンドに関連するエネルギーを決め、前記エネル ギーをそれぞれの第1エネルギー閾値と比較する操作、 c)エネルギーが夫々の閾値を越える全てのバンドに対してコアー情報の挿入を イネーブルする操作、 により実行されることを特徴とする請求の範囲第1項乃至第11項のいずれか1 項に記載の方法。 13 閾値は定数閾値であることを特徴とする請求の範囲第12項記載の方法。 14 閾値は知覚モデルを用いて決められた閾値であることを特徴とする請求の 範囲第12項記載の方法。 15 前記第2コード化ステップが適用されるバンドの選択、及び所与のバンド に対する第2コード化ステップ数の決定は、 d)各バンドに対して第2コード化ステップ全てを適用する操作、 e)前回のステップに対する、又は同じバンド内での第1コード化ステップに対 する、各第2ステップにより与えられる信号品質の向上を決める操作、 f)最高の品質向上をもたらす第2コード化ステップにより与えられる、エンハ ンス情報ブロックのコード化信号内への挿入を、利用可能ビットレートが完全に 使用されるまでイネーブルする操作、 を含むことを特徴とする請求の範囲第1項乃至第14項のいずれか1項に記載の 方法。 16 品質向上の前記評価が知覚モデルを用いて行われることを特徴とする請求 の範囲第15項記載の方法。 17 前記音声信号がマルチメディア信号の音声成分であることを特徴とする請 求の範囲第1項乃至第16項のいずれか1項に記載の方法。 18 コード化されるべき音声信号は前記2ステージ分類に伝送され、所与のフ レーム内の信号が複数の抽象クラスからの1つ及び前記1抽象クラスの複数の具 体クラスからの1つに割り当てられ、該分類は、周波数バンド内への前記分離の ために制御パラメータとして用いられ、周波数バンドの前記選択に対して第1コ ード化アルゴリズム及び多くの場合第2コード化アルゴリズムが適用され、所与 の周波数バンドに対して第2コード化ステップ数が決められることを特徴とする 請求の範囲第1項乃至第17項のいずれか1項に記載の方法。 19 前記2ステージ分類が自動的に行われることを特徴とする請求の範囲第1 項乃至第18項のいずれか1項に記載の方法。 20 前記2ステージ分類が、ユーザー装置(US)から送られる情報により行 われることを特徴とする請求の範囲第1項乃至第18項のいずれか1項に記載の 方法。 21 前記オブジェクトビットストリームは、個々のコード化ステップにより作 られたビットパケットにより構成され、前記マクロオブジェクトビットストリー ム(OB11...OB21)は、オーバーヘッドビットの第1グループ(OV H1,OVH2)、コアー情報のパケット、及び第2コード化ステップが実行さ れたならばオーバーヘッドビットの第2グループ(OVH3)を含み、該オーバ ーヘッドビットの第1グループは、分類結果及び少なくとも第1コード化ステッ プに伝送される周波数バンドに関する情報を含み、該オーバーヘッドビットの第 2グループは、少なくとも第1コード化ステップに伝送された異なる周波数バン ドに対して実行されたコード化ステップ数及びエンハンス情報ブロックのパケッ トに関する情報を含み、また、フレーム内でコード化された異なるマクロオブジ ェクト(OB11...OB21)のビットストリームは順に伝送され、該伝送 の前に構成フェーズが行われ、該構成フェーズではオーバーヘッドビットの別の グループ(OVH0)が伝送され、該グループはデコーダー(AD)の構成に必 要なサービス情報全てを含むことを特徴とする請求の範囲第1項乃至第20項の いずれか1項に記載の方法。 22 マクロオブジェクトビットストリーム内のビットパケットはランクにより 配列され、該ランクは、パケットがコアー情報及び品質向上に属する場合、パケ ットがエンハンス情報に属する場合、異なるバンドのエネルギー値に関係するこ とを特徴とする請求の範囲第21項記載の方法。 23 さらにビットストリーム操作フェーズを含み、該フェーズは、階段状ビッ トレート及びコード化信号のバンド幅スケーリングのために、コーダー(AC) とデコーダー(AD)間の伝送経路(1)に沿って1又は複数の場所にて実行さ れ、各スケーリングステップは、1つのエンハンス情報ブロックの抑制、又はエ ンハンス情報ブロックがコード化信号に存在しない場合は周波数バンドのコアー 情報の抑制に対応することを特徴とする請求の範囲第1項乃至第22項のいずれ か1項に記載の方法。 24 前記ビットストリーム操作フェーズは、デコーダー(AD)の上流の1又 は複数の配置にて実行され、階段状のビットレート又はコード化信号のバンド幅 スケーリングを与え、各スケーリングステップは、1エンハンス情報ブロックの 抑制、又はコード化信号内にエンハンス情報ブロックが存在しないときは周波数 バンドのコアー情報の抑制に対応することを特徴とする請求の範囲第1項乃至第 23項のいずれか1項に記載の方法。 25 前記スケーリングが、 a1)フレームにおいて所望のビットレートに対する該又は各々のマクロオブジ ェクトに割り当て可能なバンド幅を決めるステップ、 b1)前記バンド幅を越える周波数バンドに関するビットパケットを除去するス テップ、 c1)残差ビットレートが所望のビットレートを越えるならば、所望のビットレ ートが達成されるか又はコアー情報のみが残されるまで、最高周波数を有するバ ンドから開始して、各バンドに対するエンハンス情報の1ブロックを除去し、必 要なら該除去は周期的に繰り返されるステップ、 d1)ステップc1)の終わりでの残差ビットレートがなお所望のビットレート を越えるならば、最高周波数バンドから開始して、1以上の周波数バンドのコア ーパケットを除去するステップ、 を含むことを特徴とする、請求の範囲第22項及び第23項に記載の方法。 26 前記スケーリングが、 a2)フレームにおいて所望のビットレートに対する該又は各々のマクロオブジ ェクトに割り当て可能な総バンド幅を決めるステップ、 b2)前記バンド幅を越える周波数バンドに関するビットパケットを除去するス テップ、 c2)残差ビットレートが所望のビットレートを越えるならば、所望のビットレ ートが達成されるか又はコアー情報のみが残されるまで、最低ランクを有するパ ケットから開始して、エンハンス情報の1パケットを一度に除去するステップ、 d2)ステップc2)の終わりでの残差ビットレートがなお所望のビットレート を越えるならば、最低ランクバンドから開始して、1以上の周波数バンドのコア ー情報を除去するステップ、 を含むことを特徴とする、請求の範囲第24項及び第25項に記載の方法。 27 前記ビットストリーム操作フェーズは、個々のマクロオブジェクトにおけ る所定のコード化パラメータの値を変えるステップを含むことを特徴とする請求 の範囲第24項乃至第26項のいずれか1項に記載の方法。 28 前記ビットストリーム操作フェーズは、異なるビットレート及び/又はバ ンド幅を異なるマクロオブジェクトに割り当てるように、複数のコンカレントマ クロオブジェクト上に同時に実行されることを特徴とする請求の範囲第24項乃 至第27項のいずれか1項に記載の方法。 29 前記ビットストリーム操作フェーズは、ビットレート全体が所定のビット レートを越える複数のコンカレントマクロオブジェクトからの寄与を含んで、所 定のビットレートにて単一ビットストリームを構築するステップを含むことを特 徴とする請求の範囲第28項記載の方法。 30 前記ビットストリーム操作フェーズは、個々のマクロオブジェクト上にレ ベル操作を実行するステップを含み、また、個々のマクロオブジェクトに割り当 てられた異なるビットレート及び/又はバンド幅はそのレベル操作を基にして選 択されることを特徴とする請求の範囲第28項又は第29項記載の方法。 31 前記ビットストリーム操作フェーズは個別に選択されたフレーム上で実行 されることを特徴とする請求の範囲第24項乃至第30項のいずれか1項に記載 の方法。 32 デジタル音声信号を処理する装置であって、 (ア)バンド幅特性の与えられたコード化されるべき音声信号のサンプルフレー ムを受信するよう構成されたエンコーダー(AC)であって、 コード化すべき信号を複数の周波数バンドに分離するフィルタリング手段(F B1,FB2,FB3)、 そのバンドの信号の埋込コード化のための各周波数バンドに関連したコード化 装置(LCC,HCC,LEC,HEC)であって、各バンドに対して第1コー ド化装置(LCC,HCC)及び第2コード化装置(LCC,HCC)の組を含 み、該第1コード化装置は、少なくとも周波数バンドの選択されたものに対して はイネーブルされ、それぞれのバンドに対するコアー情報を各フレームにて発生 し、該第2コード化装置は、そのバンドに対する一連のエンハンス情報ブロック を発生し、コアー情報は信号デコード化に必要な最小量の情報である、上記コー ド化装置(LCC,HCC,LEC,HEC)、及び 異なる周波数バンドのコード化信号を単一埋込コード化信号内に結合する手段 (BCU)であって、基本層、トータル層及び複数の中間層を含み、該基本層は 、前記選択された周波数バンドのコアー情報を含み且つ最小ビットレートに対応 し、トータル層は、コード化情報の全体を含み且つ最大ビットレートに対応し、 中間層は、それぞれのエンハンス情報ブロックによりコード化信号に寄与し且つ 基本層からトータル層への連続ステップによりコード化信号のビットレートを増 加させる、上記手段(BCU)、 を含む上記エンコーダー(AC)、並びに (イ)異なる周波数バンドのコード化信号を独立にデコード化するデコード化装 置(LED,HED,LCD,HCD)、及び異なる周波数バンドのデコード化 信号を再結合し且つ元の音声信号のバンド幅特性に対応するバンド幅特性を有す るデコード化信号を再構成する合成フィルター手段(FB4,FB5,FB6) から成るデコーダー(AD)であって、該デコード化装置(LED,HED,L CD,HCD)は、第1デコード化装置(LED,HED)の組及び第2デコー ド化装置(LCD,HCD)を含み、該第1デコード化装置(LED,HED) の組は、各周波数バンドに対して前記第2組のコード化装置(LEC,HEC) と1対1対応し、該第2デコード化装置(LCD,HCD)は、コアー情報をデ コード化する、上記デコード化装置(LED,HED,LCD,HCD)、 を含み、 複数の第1及び第2コード化アルゴリズムからそれぞれ選択された第1及び第 2コード化アルゴリズムを、コード化されている信号に適用するように、第1コ ード化装置(LCC,HCC)及び各第2コード化装置(LEC,HEC)が構 成可能であり、また、第2及び第1コード化装置(LEC,HEC,LCC,H CC)により適用される第2及び第1コード化アルゴリズムにそれぞれ相補的な 第1又は第2デコード化アルゴリズムを、デコード化されている信号に適用する ように、各第1デコード化装置(LED,HED)及び第2デコード化装置(L CD,HCD)が構成可能であり、 また、さらに、 (あ)コード化されるべき音声信号を2ステージ分類に伝送するための分類装置 (CR)であって、該2ステージ分類により、所与のフレーム内の信号は、複数 の抽象クラスからの一つ、及び前記1抽象クラスの複数の具体クラスからの一つ に割り当てられ、具体クラスは、信号部分の特性と関係し且つフレーム内に存在 する基本音声オブジェクトを識別し、抽象クラスは、音声信号の性質に関係し且 つ基本音声オブジェクトの結合から生じるマクロオブジェクトを識別し、該分類 装置(CR)は、フィルタリング手段(FB1...FB3)及び前記第1及び 第2コード化装置(LCC,HCC,LEC,HEC)に対して、周波数バンド 内への前記分離、選択された第1及び第2コード化装置(LCC,HCC,LE C,HEC)のイネーブル化、及び該又は各コード化装置による適当なコード化 アルゴリズムの選択のための制御パラメータとして分類に関する情報を与え、コ ード化ビットストリーム内への挿入のため前記結合手段(BCU)に対して分類 に関する情報を与える、上記分類装置(CR)、及び (い)少なくとも一つのビットストリーム操作装置(BMU)であって、デコー ダー(AD)の上流に位置し、個々のマクロオブジェクト及び/又はオブジェク トに関するコード化信号のビットレート又はバンド幅のスケーリングを行う上記 ビットストリーム操作装置(BMU)、 を含む、 ことを特徴とする上記デジタル音声信号を処理する装置。 33 前記エンコーダー(AC)は8から64kHzまでの任意の入力サンプリ ング周波数にてサンプリングされた信号を受信し、さらに入力サンプリング周波 数よりすぐ大きい2のべき乗である内部サンプリング周波数にて前記信号をアッ プサンプリングするための手段(MXU)を含み、前記アップサンプリング手段 (MXU)は8、16及び32kHzの入力サンプリング周波数に対して作動し ないことを特徴とする請求の範囲第32項記載の装置。 34 エンコーダー(AC)内の前記フィルター手段(FB1...FB3)は 、コード化されるべき信号のサンプリング周波数とは独立に所定のバンド幅の周 波数バンドを発生するように構成できることを特徴とする請求の範囲第32項又 は第33項記載の装置。 35 エンコーダー(AC)は、複数のサブフレーム内に各フレームを分割する ための手段(SF1,SF2)を含み、該サブフレームの持続時間はフレーム持 続時間の約数であり、そして、 フレームを分割するための手段(SF1,SF2)は、複数の持続時間値から 選択可能な持続時間のサブフレームを発生してコード化遅延の複数の可能な値を 得られるように構成可能であることを特徴とする請求の範囲第32項乃至第34 項のいずれか1項に記載の装置。 36 各バンドの第1及び第2コード化装置(LCC,HCC,LEC,HEC )は、その他のバンドのコード化装置とは独立に構成可能であることを特徴とす る請求の範囲第32項乃至第35項のいずれか1項に記載の装置。 37 線形予測分析コード化アルゴリズムを少なくともより低い周波数バンドの 組の信号に対して適用し、且つ、形状/利得ベクトル量子コード化アルゴリズム をより高い周波数バンドの信号及び線形予測が用いられない信号に対して適用す るように、第1コード化装置(LCC,HCC)が構成可能であることを特徴と する請求の範囲第32項乃至第36項のいずれか1項に記載の装置。 38 周波数バンドと関連する第2コード化装置(LEC,HEC)は、第1コ ード化アルゴリズムを同一周波数バンド内の信号に適用した結果得られる量子化 エラーをコード化することを特徴とする請求の範囲第32項乃至第37項のいず れか1項に記載の装置。 39 第2コード化装置(LEC,HEC)は、形状/利得ベクトル量子コード 化アルゴリズムを全ての周波数バンドに適用するように構成可能であることを特 徴とする請求の範囲第32項乃至第38項のいずれか1項に記載の装置。 40 第1及び第2コード化装置(LCC,HCC,LEC,HEC)は、コー ド化信号に求められるバンド幅及びビットレートに依存し、ユーザー(US)及 び伝送システム(SY)の要求に依存し、コード化されるべき信号のバンド幅及 びサンプリング周波数に依存せず、1フレームベース当たり1フレーム上にイネ ーブルされ且つ構成されることを特徴とする請求の範囲第32項乃至第39項の いずれか1項に記載の装置。 41 スピーチ信号処理において、 (ア)第1コード化装置(LCC)は、標準として定められたスピーチコード化 アルゴリズムを周波数バンドの全体の組に適用するように構成され、 (イ)標準として定められたアルゴリズムの適用により発生された情報を用いて 基本層を構築し、且つ、前記中間層の一つ又はトータル層に対応するコード化信 号を構築するように、前記結合手段(BCU)が構成され、標準として定められ たコード化信号に対して更新されたコード化信号を得、 また、デコード化装置(LED,HED,LCD,HCD)は、デコード化ア ルゴリズムの可用性及び/又はデコード化信号に対して達成されるべき品質に依 存して、基本層のみか又はコード化信号の全体をデコード化するように構成され る、 ことを特徴とする請求の範囲第32項乃至第40項のいずれか1項に記載の装置 。 42 前記第1及び第2コード化装置(LCC,HCC,LEC,HEC)のイ ネーブル化は前記結合手段(BCU)により制御されることを特徴とする請求の 範囲第32項乃至第41項のいずれか1項に記載の装置。 43 第1コード化装置(LCC,HCC)のイネーブル化のために、前記結合 手段(BCU)は、異なる周波数バンド内の信号のエネルギーを評価する手段( BCL)であって、エネルギーが所定の閾値を越えるバンドと関連する第1コー ド化装置(LCC,HCC)のみをイネーブルする該手段(BCL)を含むこと を特徴とする請求の範囲第32項乃至第43項のいずれか1項に記載の装置。 44 前記閾値は、処理装置(PMP)により知覚モデルを用いることで計算さ れることを特徴とする請求の範囲第43項記載の装置。 45 第2コード化装置(LEC,HEC)のイネーブル化のために、前記結合 手段(BCU)は、すぐ前の第2コード化装置(LEC,HEC)又は同じバン ドと関連する第1コード化装置(LCC,HCC)の出力での品質に対して、各 第2コード化装置(LEC,HEC)の出力でのコード化信号の品質の向上を評 価する手段(BCL)を含み、最高の品質向上を与える第2コード化装置のみが イネーブルされることを特徴とする請求の範囲第32項乃至第44項のいずれか 1項に記載の装置。 46 品質向上のための前記手段(BCL)は、前記処理装置(PMP)により 与えられる知覚モデルに関する情報を利用することを特徴とする請求の範囲第4 4項及び第45項に記載の装置。 47 個々のコード化装置(LCC,HCC,LEC,HEC)により作られビ ットのパケットであり、1フレーム内の単一音声信号に対する所与の具体クラス に関する全情報を含んだ前記ビットパケットをオブジェクトビットストリーム内 に結合し、且つ、前記フレーム内の前記音声信号の異なるオブジェクトのビット ストリームをマクロオブジェクトビットストリーム(OB11...OB21) 内に結合するように、前記結合手段(BCU)が構成され、 該マクロオブジェクトビットストリームは、分類結果及び少なくとも第1コー ド化装置(LCC,HCC)がイネーブルされる周波数バンドについての情報を 含んだオーバーヘッドビット(OVH1,OVH2)の第1グループ;コアー情 報のパケット;及び第2コード化装置(LEC,HEC)がイネーブル化されて いるならば、異なる周波数バンドに対してイネーブル化されたコード化装置数に 関する情報及びエンハンス情報ブロックのパケットを含んだオーバーヘッドビッ ト(OVH3)の第2グループから成り、 また、通信のセットアップフェーズでは、デコーダー(AD)を構成するのに 必要な全てのサービス情報をコーダー(AD)と同じ方法で伝送し、通信中は、 フレーム中にコード化された異なるマクロオブジェクトのビットストリームを順 に伝送するように、前記結合手段(BCU)が構成される、 ことを特徴とする請求の範囲第32項乃至第46項のいずれか1項に記載の装置 。 48 マクロオブジェクトビットストリーム(OB11...OB21)内のビ ットストリームを周波数バンドの順に最低周波数バンドから開始して伝送するよ うに、結合手段(BCU)が構成されることを特徴とする請求の範囲第47項記 載の装置。 49 マクロオブジェクトビットストリーム(OB11...OB21)内のビ ットパケットをランクの順に最高ランクのビットパケットから開始して伝送する ように、結合手段(BCU)が構成され、該ランクは、パケットがコアー情報に 属する場合には異なるバンドのエネルギー値に関係し、パケットがエンハンス情 報に属する場合には品質向上の実体に関係することを特徴とする請求の範囲第4 8項記載の装置。 50 前記操作装置(BMU)は、ビットレート又はバンド幅のステップ状スケ ーリングを実行するように構成され、これは、第2コード化装置(LEC,HE C)により与えられるパケットから開始して各スケーリングステップにてビット パケットを抑制すること、及び第2コード化装置(LEC,HEC)により与え られるパケットがビットストリーム内に存在しないときは第1コード化装置(L CC,HCC)により与えられるパケットで続けることにより行われることを特 徴とする請求の範囲第32項乃至第49項のいずれか1項に記載の装置。 51 前記ビットストリーム操作装置(BMU)は、個別に選択されたフレーム 内の個々のオブジェクト又はマクロオブジェクトのビットストリームを操作する ように構成されることを特徴とする請求の範囲第50項記載の装置。 52 前記スケーリングに対して、前記ビットストリーム操作装置(BMU)は 、 (ア)フレーム内にて所望のビットレートに対する該又は各々のマクロオブジェ クトに割り当て可能なバンド幅を決め、 (イ)前記バンド幅を越えて存在する周波数バンドに関するビットパケットを除 去し、 (ウ)所望のビットレートが達成されるか又はコアー情報のみが残されるまで、 保持されてきた周波数バンドの各々に対する第2コード化装置(LEC,HEC )により与えられる1つのビットパケットを、最高周波数のバンドから開始して 除去し、該除去は必要ならば周期的に繰り返され、 (エ)1以上の周波数バンドに対して第1コード化装置(LCC,HCC)によ り与えられるビットパケットを最高周波数バンドから開始して除去する、 ように構成されることを特徴とする請求の範囲第50項乃至第51項のいずれか 1項に記載の装置。 53 前記スケーリングに対して、前記ビットストリーム操作装置(BMU)は 、 (ア)フレーム内で所望のビットレートに対する該又は各々のマクロオブジェク トに割り当て可能なバンド幅を決め、 (イ)前記バンド幅を越えて存在する周波数バンドに関するビットパケットを除 去し、 (ウ)第2コード化装置(LEC,HEC)により与えられるビットパケットを 最低ランクのパケットから開始して除去し、 (エ)1以上の周波数バンドに対して第1コード化装置(LCC,HCC)によ り与えられるビットパケットを最低エネルギーバンドから開始して除去する、 ように構成されることを特徴とする請求の範囲第50項乃至第52項のいずれか 1項に記載の装置。 54 前記ビットストリーム操作装置(BMU)は、個々のマクロオブジェクト 内の所定のコード化パラメータの値を変えるように構成されることを特徴とする 請求の範囲第50項乃至第53項のいずれか1項に記載の装置。 55 全体のビットレートが所定のビットレートを越える複数のコンカレントマ クロオブジェクトからの寄与を含め、所定のビットレートにて単一ビットストリ ームを構築するように、前記ビットストリーム操作装置(BMU)が構成される ことを特徴とする請求の範囲第50項乃至第54項のいずれか1項に記載の装置 。 56 単一ビットストリームを構築する前に個々のマクロオブジェクトのレベル を操作し、且つ、操作されたレベルに基づいて個々のマクロオブジェクトの寄与 に対するビットレート及び/又はバンド幅を選択するように、前記ビットストリ ーム操作装置(BMU)が構成されることを特徴とする請求の範囲第55項記載 の装置。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 フエスタ,ミケーレ イタリー国 アイ−10137 トリノ、ヴイ ア・フイラデルフイア 128/1 (72)発明者 ミユラー,イオルク,マーチン ドイツ連邦共和国 デー−71409 シユヴ アイクハイム、レルヒエンシユトラーセ 18/1 (72)発明者 セレーノ,ダニエーレ イタリー国 アイ−10151 トリノ、ヴイ ア・イセルニア 7/エー

Claims (1)

  1. 【特許請求の範囲】 1 デジタル化音声信号を処理する方法であって、 (ア)コード化フェーズであって、処理されて所定数のサンプルから成る一連の フレームに編成されるべき信号が、独立にコード化され得る複数の周波数バンド に分離され、コード化信号は、前記周波数バンドの少なくとも選択されたもの内 の信号に関連した情報を含んで発生され、コード化は埋込コード化技術に従って 行われ、その結果、コード化信号は、基本層、トータル層及び複数の中間層を含 み、該基本層はデコード化に必要な最小量の情報(「コアー情報」)を含み且つ 最小ビットレートに対応し、該トータル層はコード化情報の全体を含み且つ最大 ビットレートに対応し、該中間層はそれぞれの情報ブロック(「エンハンス情報 」)によりコード化信号に寄与し且つ基本層からトータル層への連続ステップに よりコード化信号のビットレートを増加させる、上記コード化フェーズ、及び (イ)デコード化フェーズであって、コード化信号に含まれる周波数バンド内の 信号に関する情報が独立にデコード化され、異なるバンドに関するデコード化信 号が再結合されて元の信号のバンド幅特性に対応したバンド幅特性を有する再構 成信号を作る、上記デコード化フェーズ、 を少なくとも含み、 前記コード化フェーズにおいて各フレームでは、 (A)少なくとも前記選択された周波数バンドの信号は第1コード化ステップに 伝送され、該第1コード化ステップはコアー情報を発生し且つ複数の第1コード 化アルゴリズムから選択された第1コード化アルゴリズムにより実行され、そし て、上記信号は大抵の場合1つの又は複数の第2コード化ステップに伝送され、 各第2コード化ステップは、コアー情報のみによっては表せない信号部分をコー ド化してエンハンス情報の1ブロックを発生し、且つ複数の第2コード化アルゴ リズムから選択された第2コード化アルゴリズムにより実行され、 (B)複数のそれぞれの前記第1及び第2コード化アルゴリズムからの選択は、 2ステージ分類の結果に依存し、それにより所与のフレーム内の信号は複数の抽 象クラスのうちの一つ及び前記1抽象クラスの複数の具体クラスのうちの一つに 割り当てられ、 (C)複数のそれぞれの前記第1及び第2コード化アルゴリズムからの選択は、 ユーザー(US)からコード化デバイス(AC)に送られる構成情報に依存し、 (D)複数のそれぞれの前記第1及び第2コード化アルゴリズムからの選択は、 伝送システムからコード化デバイスの送られる制御情報に依存し、 また、前記デコード化フェーズにおいて各フレームでは、 (E)両方のエンハンス情報ブロックとコアー情報が存在する周波数バンドのコ ード化信号は、1組の第1デコード化ステップに伝送され、該ステップ数はその バンドに対して行われる第2コード化ステップの数と同じでありその各々におい て1エンハンス情報ブロックがデコード化され、そして上記コード化信号は、第 2デコード化ステップに伝送されてコアー情報がデコード化され、一方、コアー 情報のみが存在する周波数バンドのコード化信号は、第2デコード化ステップの みに伝送され、各第1デコード化ステップは、コード化フェーズで選択された第 2アルゴリズムと相補的な夫々のアルゴリズムにより実行されてそのステップで デコード化されるべきエンハンス情報ブロックを発生し、また、第2デコード化 ステップは第1コード化ステップで選択された第1アルゴリズムと相補的なアル ゴリズムに従って実行され、 (F)前記第1及び第2デコード化アルゴリズムの各々は、抽象及び具体クラス 分類を有する情報に従って、前記第2及び第1コード化アルゴリズムの一つと各 々が相補的な複数の第1及び第2デコード化アルゴリズムから選択され、 (G)前記第1及び第2デコード化アルゴリズムの各々は、セットアップフェー ズで与えられる構成情報に従って、前記第2及び第1コード化アルゴリズムの一 つと各々が相補的な複数の第1及び第2デコード化アルゴリズムから選択される 、 ことを特徴とする上記デジタル化音声信号を処理する方法。 2 第1及び第2アルゴリズムは異なるバンドに対して独立に選択されることを 特徴とする請求の範囲第1項記載の方法。 3 第2コード化アルゴリズムは、第1コード化アルゴリズムの適用の結果とし て得られる量子化エラーをコード化することを特徴とする請求の範囲第1項又は 第2項記載の方法。 4 第1アルゴリズムは、少なくともより低い周波数バンドの組の信号に対する 線形予測分析コード化アルゴリズム、並びにより高い周波数バンドの信号及び線 形予測が用いられない信号に対する形状/利得ベクトル量子コード化アルゴリズ ムを含むことを特徴とする請求の範囲第1項乃至第3項のいずれか1項に記載の 方法。 5 第2アルゴリズムは形状/利得ベクトル量子コード化アルゴリズムを含むこ とを特徴とする請求の範囲第1項乃至第4項のいずれか1項に記載の方法。 6 コード化信号のビットレートは複数のビットレートから選択可能であること を特徴とする請求の範囲第1項乃至第5項のいずれか1項に記載の方法。 7 コード化の前に各フレームは複数のサブフレームに分割され、前記サブフレ ームの長さは、コード化遅延の複数の可能な値を得られるように、複数の長さ値 から選択できることを特徴とする請求の範囲第1項乃至第6項のいずれか1項に 記載の方法。 8 前記周波数バンドは、コード化されるべき信号のサンプリング周波数とは独 立に所定のバンド幅を有することを特徴とする請求の範囲第1項乃至第7項のい ずれか1項に記載の方法。 9 コード化されるべき信号は8から64kHzまでの任意の入力サンプリング 周波数でサンプリングされ、コード化前に、それは入力サンプリング周波数より すぐ上の2のべき乗である内部サンプリング周波数までアップサンプリングされ 、また、アップサンプリングは8、16及び32kHzの入力サンプリング周波 数に対しては機能しないことを特徴とする請求の範囲第1項乃至第8項のいずれ か1項に記載の方法。 10 スピーチ信号処理に対してコード化フェーズは、 (A)周波数バンドの全体の組に対する第1コード化アルゴリズムとして、標準 とされるスピーチコード化アルゴリズムを選択するステップ、 (B)標準とされるアルゴリズムにスピーチ信号を伝送することにより発生され るコアー情報で基本層を構築するステップ、及び (C)標準とされるコード化信号に対して更新されたコード化信号を得るように 、前記中間層の一つ又はトータル層に対応するコード化信号を構築するステップ 、 を含み、また、デコード化フェーズは、 a)基本層のみをデコード化するステップ、又は b)デコード化アルゴリズムの可用性、及び/又はデコード化信号に対して得ら れるべき品質に依存して、コード化信号全体をデコード化するステップ、 を含むことを特徴とする請求の範囲第1項乃至第9項のいずれか1項に記載の方 法。 11 少なくとも第1コード化ステップに伝送されるべき周波数バンドの選択に 対して、第2コード化ステップも実行され、所与の周波数バンドに対する第2コ ード化ステップ数が、コード化信号に求められるバンド幅及びビットレートに依 存しユーザーやシステムの要求に従って決められ、コード化信号は、1フレーム ベース当たり1フレーム上に、コード化される信号のバンド幅及びサンプリング 周波数とは独立に利用されることを特徴とする請求の範囲第1項乃至第10項の いずれか1項に記載の方法。 12 第1コード化ステップに伝送されるべき周波数バンドの選択は、 a)利用可能なビットレートについてコード化信号に割り当て可能な総バンド幅 を決める操作、 b)前記バンド幅に含まれる各バンドに関連するエネルギーを決め、前記エネル ギーをそれぞれの第1エネルギー閾値と比較する操作、 c)エネルギーが夫々の閾値を越える全てのバンドに対してコアー情報の挿入を イネーブルする操作、 により実行されることを特徴とする請求の範囲第1項乃至第11項のいずれか1 項に記載の方法。 13 閾値は定数閾値であることを特徴とする請求の範囲第12項記載の方法。 14 閾値は知覚モデルを用いて決められた閾値であることを特徴とする請求の 範囲第12項記載の方法。 15 前記第2コード化ステップが適用されるバンドの選択、及び所与のバンド に対する第2コード化ステップ数の決定は、 d)各バンドに対して第2コード化ステップ全てを適用する操作、 e)前回のステップに対する、又は同じバンド内での第1コード化ステップに対 する、各第2ステップにより与えられる信号品質の向上を決める操作、 f)最高の品質向上をもたらす第2コード化ステップにより与えられる、エンハ ンス情報ブロックのコード化信号内への挿入を、利用可能ビットレートが完全に 使用されるまでイネーブルする操作、 を含むことを特徴とする請求の範囲第1項乃至第14項のいずれか1項に記載の 方法。 16 品質向上の前記評価が知覚モデルを用いて行われることを特徴とする請求 の範囲第15項記載の方法。 17 前記音声信号がマルチメディア信号の音声成分であることを特徴とする請 求の範囲第1項乃至第16項のいずれか1項に記載の方法。 18 コード化されるべき音声信号は前記2ステージ分類に伝送され、所与のフ レーム内の信号が複数の抽象クラスからの1つ及び前記1抽象クラスの複数の具 体クラスからの1つに割り当てられ、該分類は、周波数バンド内への前記分離の ために制御パラメータとして用いられ、周波数バンドの前記選択に対して第1コ ード化アルゴリズム及び多くの場合第2コード化アルゴリズムが適用され、所与 の周波数バンドに対して第2コード化ステップ数が決められることを特徴とする 請求の範囲第1項乃至第17項のいずれか1項に記載の方法。 19 さらにビットストリーム構成フェーズを含み、該フェーズでは各フレーム において及びコード化される各音声信号に対して、個々のコード化ステップによ り作られたビットのパケットが、オブジェクトビットストリーム内に共にグルー プ化され、該オブジェクトビットストリームは、そのフレーム内の該音声信号に 対する同じ具体クラスについての全情報を含み、また、前記フレーム内の前記音 声信号の異なるオブジェクトのビットストリームが、マクロオブジェクトビット ストリーム(OB11...OB21)内に共にグループ化され、 分類結果及び少なくとも第1コード化ステップに伝送される周波数バンドに関 する情報を含んだオーバーヘッドビットの第1グループ(OVH1,OVH2) ;コアー情報のパケット;及び第2コード化ステップが実行されたならば、少な くとも第1コード化ステップに伝送された異なる周波数バンドに対して実行され たコード化ステップ数、及びエンハンス情報ブロックのパケットに関する情報を 含んだオーバーヘッドビットの第2グループ(OVH3)を含み、 フレーム内でコード化された異なるマクロオブジェクトのビットストリーム( OB11...OB21)が順に伝送され、該伝送は構成フェーズにより進めら れ、該フェーズではオーバーヘッドビットの別のグループ(OVH0)が伝送さ れ、該グループはデコーダー(AD)の構成に必要な全てのサービス情報を含む 、 ことを特徴とする請求の範囲第1項乃至第18項のいずれか1項に記載の方法。 20 マクロオブジェクト内のビットパケットは周波数バンドにより配列される ことを特徴とする請求の範囲第19項記載の方法。 21 マクロオブジェクトビットストリーム内のビットパケットはランクにより 配列され、該ランクは、パケットがコアー情報及び品質向上に属する場合、パケ ットがエンハンス情報に属する場合、異なるバンドのエネルギー値に関係するこ とを特徴とする請求の範囲第19項記載の方法。 22 さらにビットストリーム操作フェーズを含み、該フェーズは、階段状ビッ トレート及びコード化信号のバンド幅スケーリングのために、コーダー(AC) とデコーダー(AD)間の伝送経路(1)に沿って1又は複数の場所にて実行さ れ、各スケーリングステップは、1つのエンハンス情報ブロックの抑制、又はエ ンハンス情報ブロックがコード化信号に存在しない場合は周波数バンドのコアー 情報の抑制に対応することを特徴とする請求の範囲第1項乃至第21項のいずれ か1項に記載の方法。 23 前記スケーリングが個々のオブジェクト又はマクロオブジェクトのビット ストリーム上で実行されることを特徴とする請求の範囲第22項記載の方法。 24 前記スケーリングが、 a1)フレームにおいて所望のビットレートに対する該又は各々のマクロオブジ ェクトに割り当て可能なバンド幅を決めるステップ、 b1)前記バンド幅を越える周波数バンドに関するビットパケットを除去するス テップ、 c1)残差ビットレートが所望のビットレートを越えるならば、所望のビットレ ートが達成されるか又はコアー情報のみが残されるまで、最高周波数を有するバ ンドから開始して、各バンドに対するエンハンス情報の1ブロックを除去し、必 要なら該除去は周期的に繰り返されるステップ、 d1)ステップc1)の終わりでの残差ビットレートがなお所望のビットレート を越えるならば、最高周波数バンドから開始して、1以上の周波数バンドのコア ーパケットを除去するステップ、 を含むことを特徴とする、請求の範囲第20項を参照するならば請求の範囲第2 2項及び第23項に記載の方法。 25 前記スケーリングが、 a2)フレームにおいて所望のビットレートに対する該又は各々のマクロオブジ ェクトに割り当て可能な総バンド幅を決めるステップ、 b2)前記バンド幅を越える周波数バンドに関するビットパケットを除去するス テップ、 c2)残差ビットレートが所望のビットレートを越えるならば、所望のビットレ ートが達成されるか又はコアー情報のみが残されるまで、最低ランクを有するパ ケットから開始して、エンハンス情報の1パケットを一度に除去するステップ、 d2)ステップc2)の終わりでの残差ビットレートがなお所望のビットレート を越えるならば、最低ランクバンドから開始して、1以上の周波数バンドのコア ー情報を除去するステップ、 を含むことを特徴とする、請求の範囲第21項を参照するならば請求の範囲第2 2項及び第23項に記載の方法。 26 前記ビットストリーム操作フェーズは、個々のマクロオブジェクトにおけ る所定のコード化パラメータの値を変えるステップを含むことを特徴とする請求 の範囲第22項乃至第25項のいずれか1項に記載の方法。 27 前記ビットストリーム操作フェーズは、異なるビットレート及び/又はバ ンド幅を異なるマクロオブジェクトに割り当てるように、複数のコンカレントマ クロオブジェクト上に同時に実行されることを特徴とする請求の範囲第22項乃 至第26項のいずれか1項に記載の方法。 28 前記ビットストリーム操作フェーズは、ビットレート全体が所定のビット レートを越える複数のコンカレントマクロオブジェクトからの寄与を含んで、所 定のビットレートにて単一ビットストリームを構築するステップを含むことを特 徴とする請求の範囲第27項記載の方法。 29 前記ビットストリーム操作フェーズは、個々のマクロオブジェクト上にレ ベル操作を実行するステップを含み、また、個々のマクロオブジェクトに割り当 てられた異なるビットレート及び/又はバンド幅はそのレベル操作を基にして選 択されることを特徴とする請求の範囲第27項又は第28項記載の方法。 30 前記ビットストリーム操作フェーズは個別に選択されたフレーム上で実行 されることを特徴とする請求の範囲第22項乃至第29項のいずれか1項に記載 の方法。 31 デジタル音声信号を処理する装置であって、 (ア)バンド幅特性の与えられたコード化されるべき音声信号のサンプルフレー ムを受信するよう構成されたエンコーダー(AC)であって、 コード化すべき信号を複数の周波数バンドに分離するフィルタリング手段(F B1,FB2,FB3)、 そのバンドの信号の埋込コード化のための各周波数バンドに関連したコード化 装置(LCC,HCC,LEC,HEC)、及び 異なる周波数バンドのコード化信号を単一埋込コード化信号内に結合する手段 (BCU)であって、基本層、トータル層及び複数の中間層を含み、該基本層は 、信号デコード化に必要な最小量の情報(「コアー情報」)を含み且つ最小ビッ トレートに対応し、トータル層は、コード化情報の全体を含み且つ最大ビットレ ートに対応し、中間層は、それぞれの情報ブロック(「エンハンス情報」)によ りコード化信号に寄与し且つ基本層からトータル層への連続ステップによりコー ド化信号のビットレートを増加させる、上記手段(BCU)、 を含む上記エンコーダー(AC)、並びに (イ)異なる周波数バンドのコード化信号を独立にデコード化するデコード化装 置(LED,HED,LCD,HCD)、及び異なる周波数バンドのデコード化 信号を再結合し且つ元の音声信号のバンド幅特性に対応するバンド幅特性を有す るデコード化信号を再構成する合成フィルター手段(FB4,FB5,FB6) から成るデコーダー(AD)、 を含み、 各バンドのコード化装置(LCC,HCC,LEC,HEC)は、第1コード 化装置(LCC,HCC)及び第2コード化装置の組(LCC,HCC)を含み 、該第1コード化装置は、周波数バンドの少なくとも選択されたものに対してイ ネーブルされ、そのバンドに対するコアー情報を各フレームにて発生し、該第2 コード化装置は、そのバンドに対する一連のエンハンス情報ブロックを発生し、 前記選択された周波数バンドに関連した第2コード化装置(LEC,HEC)の みがイネーブルされてそれぞれのエンハンス情報ブロックをコード化信号内に導 入し、第1コード化装置(LCC,HCC)及び各第2コード化装置(LEC, HEC)は、コード化されている信号に対して、複数の第1及び第2コード化ア ルゴリズムから選択されたそれぞれの第1又は第2コード化アルゴリズムを適用 すべく、構成でき、 また、各バンドのデコード化装置(LED,HED,LCD,HCD)は、1 組の第1デコード化装置(LED,HED)と第2デコード化装置(LCD,H CD)を含み、第1デコード化装置は前記第2組のコード化装置(LEC,HE C)と1対1対応し且つその各々はエンハンス情報ブロックをデコード化し、第 2デコード化装置は、コアー情報をデコード化し、各々の第1デコード化装置( LED,HED)及び第2デコード化装置(LCD,HCD)は、デコード化さ れている信号に、第2及び第1コード化装置(LEC,HEC,LCC,HCC )によりそれぞれ与えられる第2及び第1コード化アルゴリズムと相補的な第1 又は第2デコード化アルゴリズムをそれぞれ適用すべく、構成できる、 ことを特徴とする上記デジタル音声信号を処理する装置。 32 前記エンコーダー(AC)は8から64kHzまでの任意の入力サンプリ ング周波数にてサンプリングされた信号を受信し、さらに入力サンプリング周波 数よりすぐ大きい2のべき乗である内部サンプリング周波数にて前記信号をアッ プサンプリングするための手段(MXU)を含み、前記アップサンプリング手段 (MXU)は8、16及び32kHzの入力サンプリング周波数に対して作動し ないことを特徴とする請求の範囲第31項記載の装置。 33 エンコーダー(AC)内の前記フィルター手段(FB1...FB3)は 、コード化されるべき信号のサンプリング周波数とは独立に所定のバンド幅の周 波数バンドを発生するように構成できることを特徴とする請求の範囲第31項又 は第32項記載の装置。 34 エンコーダー(AC)は、複数のサブフレーム内に各フレームを分割する ための手段(SF1,SF2)を含み、該サブフレームの持続時間はフレーム持 続時間の約数であり、そして、 フレームを分割するための手段(SF1,SF2)は、複数の持続時間値から 選択可能な持続時間のサブフレームを発生してコード化遅延の複数の可能な値を 得られるように構成可能であることを特徴とする請求の範囲第31項乃至第33 項のいずれか1項に記載の装置。 35 各バンドの第1及び第2コード化装置(LCC,HCC,LEC,HEC )は、その他のバンドのコード化装置とは独立に構成可能であることを特徴とす る請求の範囲第31項乃至第34項のいずれか1項に記載の装置。 36 線形予測分析コード化アルゴリズムを少なくともより低い周波数バンドの 組の信号に対して適用し、且つ、形状/利得ベクトル量子コード化アルゴリズム をより高い周波数バンドの信号及び線形予測が用いられない信号に対して適用す るように、第1コード化装置(LCC,HCC)が構成可能であることを特徴と する請求の範囲第31項乃至第35項のいずれか1項に記載の装置。 37 周波数バンドと関連する第2コード化装置(LEC,HEC)は、第1コ ード化アルゴリズムを同一周波数バンド内の信号に適用した結果得られる量子化 エラーをコード化することを特徴とする請求の範囲第31項乃至第36項のいず れか1項に記載の装置。 38 第2コード化装置(LEC,HEC)は、形状/利得ベクトル量子コード 化アルゴリズムを全ての周波数バンドに適用するように構成可能であることを特 徴とする請求の範囲第31項乃至第37項のいずれか1項に記載の装置。 39 第1及び第2コード化装置(LCC,HCC,LEC,HEC)は、コー ド化信号に求められるバンド幅及びビットレートに依存し、ユーザー(US)及 び伝送システム(SY)の要求に依存し、コード化されるべき信号のバンド幅及 びサンプリング周波数に依存せず、1フレームベース当たり1フレーム上にイネ ーブルされ且つ構成されることを特徴とする請求の範囲第31項乃至第38項の いずれか1項に記載の装置。 40 スピーチ信号処理において、 (ア)第1コード化装置(LCC)は、標準として定められたスピーチコード化 アルゴリズムを周波数バンドの全体の組に適用するように構成され、 (イ)標準として定められたアルゴリズムの適用により発生された情報を用いて 基本層を構築し、且つ、前記中間層の一つ又はトータル層に対応するコード化信 号を構築するように、前記結合手段(BCU)が構成され、標準として定められ たコード化信号に対して更新されたコード化信号を得、 また、デコード化装置(LED,HED,LCD,HCD)は、デコード化ア ルゴリズムの可用性及び/又はデコード化信号に対して達成されるべき品質に依 存して、基本層のみか又はコード化信号の全体をデコード化するように構成され る、 ことを特徴とする請求の範囲第31項乃至第39項のいずれか1項に記載の装置 。 41 前記第1及び第2コード化装置(LCC,HCC,LEC,HEC)のイ ネーブル化は前記結合手段(BCU)により制御されることを特徴とする請求の 範囲第31項乃至第40項のいずれか1項に記載の装置。 42 前記結合手段(BCU)は、単一埋込コード化信号を発生するように構成 され、該単一組込コード化信号のビットレートは複数の異なるビットレートから 選択可能であることを特徴とする請求の範囲第31項乃至第41項のいずれか1 項に記載の装置。 43 第1コード化装置(LCC,HCC)のイネーブル化のために、前記結合 手段(BCU)は、異なる周波数バンド内の信号のエネルギーを評価する手段( BCL)であって、エネルギーが所定の閾値を越えるバンドと関連する第1コー ド化装置(LCC,HCC)のみをイネーブルする該手段(BCL)を含むこと を特徴とする請求の範囲第31項乃至第42項のいずれか1項に記載の装置。 44 前記閾値は、処理装置(PMP)により知覚モデルを用いることで計算さ れることを特徴とする請求の範囲第43項記載の装置。 45 第2コード化装置(LEC,HEC)のイネーブル化のために、前記結合 手段(BCU)は、すぐ前の第2コード化装置(LEC,HEC)又は同じバン ドと関連する第1コード化装置(LCC,HCC)の出力での品質に対して、各 第2コード化装置(LEC,HEC)の出力でのコード化信号の品質の向上を評 価する手段(BCL)を含み、最高の品質向上を与える第2コード化装置のみが イネーブルされることを特徴とする請求の範囲第31項乃至第44項のいずれか 1項に記載の装置。 46 品質向上のための前記手段(BCL)は、前記処理装置(PMP)により 与えられる知覚モデルに関する情報を利用することを特徴とする請求の範囲第4 4項及び第45項に記載の装置。 47 コード化されるべき音声信号を2ステージ分類に伝送するための分類装置 (CR)を含み、該2ステージ分類により、所与のフレーム内の信号が、複数の 抽象クラスからの一つ及び前記1抽象クラスの複数の具体クラスからの一つに割 り当てられ、該分類装置(CR)は、分類に関する情報をフィルター手段(FB 1...FB3)、前記第1及び第2コード化装置(LCC,HCC,LEC, HEC)及び前記結合手段(BCU)に、前記周波数バンドへの分離のため、第 1及び第2コード化装置(LCC,HCC,LEC,HEC)のイネーブル化の ため、及び各コード化装置による適当なコード化アルゴリズムの選択のための制 御パラメータとして与えることを特徴とする請求の範囲第31項乃至第46項の いずれか1項に記載の装置。 48 個々のコード化装置(LCC,HCC,LEC,HEC)により作られビ ットのパケットであり、1フレーム内の単一音声信号に対する所与の具体クラス に関する全情報を含んだ前記ビットパケットをオブジェクトビットストリーム内 に結合し、且つ、前記フレーム内の前記音声信号の異なるオブジェクトのビット ストリームをマクロオブジェクトビットストリーム(OB11...OB21) 内に結合するように、前記結合手段(BCU)が構成され、 該マクロオブジェクトビットストリームは、分類結果及び少なくとも第1コー ド化装置(LCC,HCC)がイネーブルされる周波数バンドについての情報を 含んだオーバーヘッドビット(OVH1,OVH2)の第1グループ;コアー情 報のパケット;及び第2コード化装置(LEC,HEC)がイネーブル化されて いるならば、異なる周波数バンドに対してイネーブル化されたコード化装置数に 関する情報及びエンハンス情報ブロックのパケットを含んだオーバーヘッドビッ ト(OVH3)の第2グループから成り、 また、通信のセットアップフェーズでは、デコーダー(AD)を構成するのに 必要な全てのサービス情報をコーダー(AD)と同じ方法で伝送し、通信中は、 フレーム中にコード化された異なるマクロオブジェクトのビットストリームを順 に伝送するように、前記結合手段(BCU)が構成される、 ことを特徴とする請求の範囲第31項乃至第47項のいずれか1項に記載の装置 。 49 マクロオブジェクトビットストリーム(OB11...OB21)内のビ ットストリームを周波数バンドの順に最低周波数バンドから開始して伝送するよ うに、結合手段(BCU)が構成されることを特徴とする請求の範囲第48項記 載の装置。 50 マクロオブジェクトビットストリーム(OB11...OB21)内のビ ットパケットをランクの順に最高ランクのビットパケットから開始して伝送する ように、結合手段(BCU)が構成され、該ランクは、パケットがコアー情報に 属する場合には異なるバンドのエネルギー値に関係し、パケットがエンハンス情 報に属する場合には品質向上の実体に関係することを特徴とする請求の範囲第4 8項記載の装置。 51 所定のパラメータ及び/又はコード化信号の階段状ビットレート及びバン ド幅スケーリングを変え、且つ、伝送経路(1)に沿ってコーダー(AC)とデ コーダー(AD)の間に配置された少なくとも一つのビットストリーム操作装置 (BMU)をさらに含み、 第2コード化装置(LEC,HEC)により与えられるパケットがビットスト リーム内に存在しないとき、第2コード化装置(LEC,HEC)により与えら れるパケットから開始し第1コード化装置(LCC,HCC)により与えられる パケットで続けて、各スケーリングステップにてビットパケットを抑制するよう に、前記操作装置(BMU)が構成されることを特徴とする請求の範囲第31項 乃至第50項のいずれか1項に記載の装置。 52 前記ビットストリーム操作装置(BMU)は、個々のオブジェクト又はマ クロオブジェクトのビットストリームを操作するように構成されることを特徴と する請求の範囲第51項記載の装置。 53 前記ビットストリーム操作装置(BMU)は、個別に選択されたフレーム 内の個々のオブジェクト又はマクロオブジェクトのビットストリームを操作する ように構成されることを特徴とする請求の範囲第51項又は第52項に記載の装 置。 54 前記スケーリングに対して、前記ビットストリーム操作装置(BMU)は 、 (ア)フレーム内にて所望のビットレートに対する該又は各々のマクロオブジェ クトに割り当て可能なバンド幅を決め、 (イ)前記バンド幅を越えて存在する周波数バンドに関するビットパケットを除 去し、 (ウ)所望のビットレートが達成されるか又はコアー情報のみが残されるまで、 保持されてきた周波数バンドの各々に対する第2コード化装置(LEC,HEC )により与えられる1つのビットパケットを、最高周波数のバンドから開始して 除去し、該除去は必要ならば周期的に繰り返され、 (エ)1以上の周波数バンドに対して第1コード化装置(LCC,HCC)によ り与えられるビットパケットを最高周波数バンドから開始して除去する、 ように構成されることを特徴とする請求の範囲第51項乃至第53項のいずれか 1項に記載の装置。 55 前記スケーリングに対して、前記ビットストリーム操作装置(BMU)は 、 (ア)フレーム内で所望のビットレートに対する該又は各々のマクロオブジェク トに割り当て可能なバンド幅を決め、 (イ)前記バンド幅を越えて存在する周波数バンドに関するビットパケットを除 去し、 (ウ)第2コード化装置(LEC,HEC)により与えられるビットパケットを 最低ランクのパケットから開始して除去し、 (エ)1以上の周波数バンドに対して第1コード化装置(LCC,HCC)によ り与えられるビットパケットを最低エネルギーバンドから開始して除去する、 ように構成されることを特徴とする請求の範囲第51項乃至第53項のいずれか 1項に記載の装置。 56 全体のビットレートが所定のビットレートを越える複数のコンカレントマ クロオブジェクトからの寄与を含め、所定のビットレートにて単一ビットストリ ームを構築するように、前記ビットストリーム操作装置(BMU)が構成される ことを特徴とする請求の範囲第51項乃至第55項のいずれか1項に記載の装置 。 57 単一ビットストリームを構築する前に個々のマクロオブジェクトのレベル を操作し、且つ、操作されたレベルに基づいて個々のマクロオブジェクトの寄与 に対するビットレート及び/又はバンド幅を選択するように、前記ビットストリ ーム操作装置(BMU)が構成されることを特徴とする請求の範囲第56項記載 の装置。
JP51629697A 1995-10-27 1996-10-25 音声信号をコード化、操作及びデコード化する方法及び装置 Expired - Fee Related JP3168012B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
IT95A000869 1995-10-27
IT95TO000869A IT1281001B1 (it) 1995-10-27 1995-10-27 Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
PCT/EP1996/004669 WO1997015983A1 (en) 1995-10-27 1996-10-25 Method of and apparatus for coding, manipulating and decoding audio signals

Publications (2)

Publication Number Publication Date
JPH10512423A true JPH10512423A (ja) 1998-11-24
JP3168012B2 JP3168012B2 (ja) 2001-05-21

Family

ID=11413922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP51629697A Expired - Fee Related JP3168012B2 (ja) 1995-10-27 1996-10-25 音声信号をコード化、操作及びデコード化する方法及び装置

Country Status (8)

Country Link
US (1) US6108626A (ja)
EP (1) EP0857375B1 (ja)
JP (1) JP3168012B2 (ja)
AT (1) ATE183346T1 (ja)
DE (1) DE69603743T2 (ja)
ES (1) ES2135931T3 (ja)
IT (1) IT1281001B1 (ja)
WO (1) WO1997015983A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003506763A (ja) * 1999-08-09 2003-02-18 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 高品質オーディオ用縮尺自在符号化方法
JP2013543600A (ja) * 2010-10-06 2013-12-05 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法
JP2015505991A (ja) * 2011-12-12 2015-02-26 モトローラ モビリティ エルエルシーMotorola Mobility Llc オーディオ符号化のための方法および装置

Families Citing this family (155)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9603582D0 (en) 1996-02-20 1996-04-17 Hewlett Packard Co Method of accessing service resource items that are for use in a telecommunications system
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
JP3329216B2 (ja) * 1997-01-27 2002-09-30 日本電気株式会社 音声符号化装置及び音声復号装置
US7024355B2 (en) 1997-01-27 2006-04-04 Nec Corporation Speech coder/decoder
KR100251453B1 (ko) * 1997-08-26 2000-04-15 윤종용 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크
US6049537A (en) * 1997-09-05 2000-04-11 Motorola, Inc. Method and system for controlling speech encoding in a communication system
DE19743662A1 (de) 1997-10-02 1999-04-08 Bosch Gmbh Robert Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms
DE19804581C2 (de) * 1998-02-05 2000-08-17 Siemens Ag Verfahren und Funk-Kommunikationssystem zur Übertragung von Sprachinformation
US6141639A (en) * 1998-06-05 2000-10-31 Conexant Systems, Inc. Method and apparatus for coding of signals containing speech and background noise
EP1021044A1 (en) * 1999-01-12 2000-07-19 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding or decoding audio or video frame data
EP1020998B1 (en) * 1999-01-12 2009-03-18 Thomson Licensing Method and apparatus for encoding audio frame data
US6661793B1 (en) 1999-01-19 2003-12-09 Vocaltec Communications Ltd. Method and apparatus for reconstructing media
US6842724B1 (en) * 1999-04-08 2005-01-11 Lucent Technologies Inc. Method and apparatus for reducing start-up delay in data packet-based network streaming applications
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US7315815B1 (en) 1999-09-22 2008-01-01 Microsoft Corporation LPC-harmonic vocoder with superframe structure
EP1269776B1 (en) 2000-03-27 2009-07-01 OpenCell Corp. System for distributing multi-protocol radio frequency signals
FI115329B (fi) * 2000-05-08 2005-04-15 Nokia Corp Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin
US6704545B1 (en) 2000-07-19 2004-03-09 Adc Telecommunications, Inc. Point-to-multipoint digital radio frequency transport
DE10063845A1 (de) * 2000-12-21 2002-06-27 Paraworld Ag Verfahren und Vorrichtung zur prioritätsgesteuerten Übertragung digitaler Informationen für audiovisuelle Wiedergabegeräte
SE0004838D0 (sv) * 2000-12-22 2000-12-22 Ericsson Telefon Ab L M Method and communication apparatus in a communication system
US6694293B2 (en) * 2001-02-13 2004-02-17 Mindspeed Technologies, Inc. Speech coding system with a music classifier
JP2004519741A (ja) * 2001-04-18 2004-07-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声の符号化
JP3636094B2 (ja) * 2001-05-07 2005-04-06 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US7272555B2 (en) * 2001-09-13 2007-09-18 Industrial Technology Research Institute Fine granularity scalability speech coding for multi-pulses CELP-based algorithm
JP4245288B2 (ja) * 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
US6785645B2 (en) 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
US6647366B2 (en) * 2001-12-28 2003-11-11 Microsoft Corporation Rate control strategies for speech and music coding
US6947886B2 (en) * 2002-02-21 2005-09-20 The Regents Of The University Of California Scalable compression of audio and other signals
US7184728B2 (en) 2002-02-25 2007-02-27 Adc Telecommunications, Inc. Distributed automatic gain control system
CN1266673C (zh) * 2002-03-12 2006-07-26 诺基亚有限公司 可伸缩音频编码的有效改进
ES2268340T3 (es) * 2002-04-22 2007-03-16 Koninklijke Philips Electronics N.V. Representacion de audio parametrico de multiples canales.
US6831901B2 (en) * 2002-05-31 2004-12-14 Opencell Corporation System and method for retransmission of data
DE10245107B4 (de) * 2002-09-27 2006-01-26 Siemens Ag Voice Activity Detection auf Basis von unüberwacht trainierten Clusterverfahren
KR100841096B1 (ko) * 2002-10-14 2008-06-25 리얼네트웍스아시아퍼시픽 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
US8958789B2 (en) 2002-12-03 2015-02-17 Adc Telecommunications, Inc. Distributed digital antenna system
US7707315B2 (en) * 2003-05-27 2010-04-27 Harris Corporation System and method for propagating data
GB2403634B (en) * 2003-06-30 2006-11-29 Nokia Corp An audio encoder
JP4000095B2 (ja) * 2003-07-30 2007-10-31 株式会社東芝 音声認識方法、装置及びプログラム
US20050091044A1 (en) * 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
US20050091041A1 (en) * 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
US8019449B2 (en) 2003-11-03 2011-09-13 At&T Intellectual Property Ii, Lp Systems, methods, and devices for processing audio signals
US7450570B1 (en) 2003-11-03 2008-11-11 At&T Intellectual Property Ii, L.P. System and method of providing a high-quality voice network architecture
US6906560B1 (en) 2004-01-20 2005-06-14 Harris Corporation Phase-continuous frequency synthesizer
KR100629997B1 (ko) * 2004-02-26 2006-09-27 엘지전자 주식회사 오디오 신호의 인코딩 방법
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
CN1985477B (zh) * 2004-05-13 2012-11-07 高通股份有限公司 用于分配信息到通信系统的信道的方法和设备
DE102004047032A1 (de) * 2004-09-28 2006-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Bezeichnen von verschiedenen Segmentklassen
DE102004047069A1 (de) * 2004-09-28 2006-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ändern einer Segmentierung eines Audiostücks
US7787854B2 (en) * 2005-02-01 2010-08-31 Adc Telecommunications, Inc. Scalable distributed radio network
WO2006126844A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US20070008939A1 (en) * 2005-06-10 2007-01-11 Adc Telecommunications, Inc. Providing wireless coverage into substantially closed environments
BRPI0612579A2 (pt) * 2005-06-17 2012-01-03 Matsushita Electric Ind Co Ltd pàs-filtro, decodificador e mÉtodo de pàs-filtraÇço
CN101263739B (zh) 2005-09-13 2012-06-20 Srs实验室有限公司 用于音频处理的系统和方法
ES2478004T3 (es) 2005-10-05 2014-07-18 Lg Electronics Inc. Método y aparato para decodificar una señal de audio
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
TWI329462B (en) 2006-01-19 2010-08-21 Lg Electronics Inc Method and apparatus for processing a media signal
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
JP5054035B2 (ja) 2006-02-07 2012-10-24 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
US7720240B2 (en) * 2006-04-03 2010-05-18 Srs Labs, Inc. Audio signal processing
US7805073B2 (en) 2006-04-28 2010-09-28 Adc Telecommunications, Inc. Systems and methods of optical path protection for distributed antenna systems
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8150065B2 (en) * 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US7844273B2 (en) * 2006-07-14 2010-11-30 Lgc Wireless, Inc. System for and method of for providing dedicated capacity in a cellular network
US7848770B2 (en) 2006-08-29 2010-12-07 Lgc Wireless, Inc. Distributed antenna communications system and methods of implementing thereof
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
RU2009116279A (ru) * 2006-09-29 2010-11-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. (KR) Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
WO2008039041A1 (en) 2006-09-29 2008-04-03 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US7817958B2 (en) 2006-12-22 2010-10-19 Lgc Wireless Inc. System for and method of providing remote coverage area for wireless communications
FR2911456B1 (fr) * 2007-01-11 2009-12-11 Medialive Procede et systeme de distribution securisee de donnees numeriques
US8583100B2 (en) 2007-01-25 2013-11-12 Adc Telecommunications, Inc. Distributed remote base station system
US8737454B2 (en) 2007-01-25 2014-05-27 Adc Telecommunications, Inc. Modular wireless communications platform
CA2645915C (en) 2007-02-14 2012-10-23 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
US8005050B2 (en) 2007-03-23 2011-08-23 Lgc Wireless, Inc. Localization of a mobile device in distributed antenna communications system
US20080240090A1 (en) * 2007-03-28 2008-10-02 Adc Dsl Systems, Inc. Programmable high speed crossbar switch
US20080236393A1 (en) * 2007-03-28 2008-10-02 Adc Dsl Systems, Inc. Filter assembly
US8010116B2 (en) 2007-06-26 2011-08-30 Lgc Wireless, Inc. Distributed antenna communications system
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
US8295494B2 (en) 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
US9112547B2 (en) 2007-08-31 2015-08-18 Adc Telecommunications, Inc. System for and method of configuring distributed antenna communications system
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
CN101889306A (zh) * 2007-10-15 2010-11-17 Lg电子株式会社 用于处理信号的方法和装置
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
TWI351683B (en) * 2008-01-16 2011-11-01 Mstar Semiconductor Inc Speech enhancement device and method for the same
CN101221766B (zh) * 2008-01-23 2011-01-05 清华大学 音频编码器切换的方法
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
JP5108960B2 (ja) * 2008-03-04 2012-12-26 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US7889103B2 (en) 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
US20090314154A1 (en) * 2008-06-20 2009-12-24 Microsoft Corporation Game data generation based on user provided song
US8310963B2 (en) * 2008-06-24 2012-11-13 Adc Telecommunications, Inc. System and method for synchronized time-division duplex signal switching
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US9390167B2 (en) 2010-07-29 2016-07-12 Soundhound, Inc. System and methods for continuous audio matching
US8140342B2 (en) 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8219408B2 (en) 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US9001811B2 (en) 2009-05-19 2015-04-07 Adc Telecommunications, Inc. Method of inserting CDMA beacon pilots in output of distributed remote antenna nodes
US8238538B2 (en) 2009-05-28 2012-08-07 Comcast Cable Communications, Llc Stateful home phone service
ES2793958T3 (es) * 2009-08-14 2020-11-17 Dts Llc Sistema para trasmitir adaptativamente objetos de audio
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8472579B2 (en) 2010-07-28 2013-06-25 Adc Telecommunications, Inc. Distributed digital reference clock
US9047371B2 (en) 2010-07-29 2015-06-02 Soundhound, Inc. System and method for matching a query against a broadcast stream
US8532242B2 (en) 2010-10-27 2013-09-10 Adc Telecommunications, Inc. Distributed antenna system with combination of both all digital transport and hybrid digital/analog transport
US8462683B2 (en) 2011-01-12 2013-06-11 Adc Telecommunications, Inc. Distinct transport path for MIMO transmissions in distributed antenna systems
WO2012122397A1 (en) 2011-03-09 2012-09-13 Srs Labs, Inc. System for dynamically creating and rendering audio objects
US9035163B1 (en) 2011-05-10 2015-05-19 Soundbound, Inc. System and method for targeting content based on identified audio and multimedia
NO2669468T3 (ja) * 2011-05-11 2018-06-02
US8693342B2 (en) 2011-10-28 2014-04-08 Adc Telecommunications, Inc. Distributed antenna system using time division duplexing scheme
US10957310B1 (en) 2012-07-23 2021-03-23 Soundhound, Inc. Integrated programming framework for speech and text understanding with meaning parsing
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9805725B2 (en) * 2012-12-21 2017-10-31 Dolby Laboratories Licensing Corporation Object clustering for rendering object-based audio content based on perceptual criteria
KR102161668B1 (ko) 2013-02-22 2020-10-05 콤스코프 테크놀로지스 엘엘씨 분산형 안테나 시스템으로부터 소싱된 기지국 네트워크 인터페이스를 위한 마스터 기준
US9178636B2 (en) 2013-02-22 2015-11-03 Adc Telecommunications, Inc. Universal remote radio head
WO2014165806A1 (en) 2013-04-05 2014-10-09 Dts Llc Layered audio coding and transmission
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
KR102230308B1 (ko) * 2013-09-17 2021-03-19 주식회사 윌러스표준기술연구소 멀티미디어 신호 처리 방법 및 장치
KR101782916B1 (ko) * 2013-09-17 2017-09-28 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US9787457B2 (en) 2013-10-07 2017-10-10 Commscope Technologies Llc Systems and methods for integrating asynchronous signals in distributed antenna system with direct digital interface to base station
MY181965A (en) 2013-10-18 2021-01-15 Fraunhofer Ges Forschung Coding of spectral coefficients of a spectrum of an audio signal
WO2015060654A1 (ko) 2013-10-22 2015-04-30 한국전자통신연구원 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치
US9507849B2 (en) 2013-11-28 2016-11-29 Soundhound, Inc. Method for combining a query and a communication command in a natural language computer system
WO2015099429A1 (ko) 2013-12-23 2015-07-02 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법, 이를 위한 파라메터화 장치 및 오디오 신호 처리 장치
US9292488B2 (en) 2014-02-01 2016-03-22 Soundhound, Inc. Method for embedding voice mail in a spoken utterance using a natural language processing computer system
WO2015126828A1 (en) 2014-02-18 2015-08-27 Commscope Technologiees Llc Selectively combining uplink signals in distributed antenna systems
US11295730B1 (en) 2014-02-27 2022-04-05 Soundhound, Inc. Using phonetic variants in a local context to improve natural language understanding
CN108600935B (zh) 2014-03-19 2020-11-03 韦勒斯标准与技术协会公司 音频信号处理方法和设备
CN106409300B (zh) * 2014-03-19 2019-12-24 华为技术有限公司 用于信号处理的方法和装置
KR101856127B1 (ko) 2014-04-02 2018-05-09 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US9564123B1 (en) 2014-05-12 2017-02-07 Soundhound, Inc. Method and system for building an integrated user profile
AU2015274498B2 (en) 2014-06-11 2019-09-19 Commscope Technologies Llc Bitrate efficient transport through distributed antenna systems
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
US10499269B2 (en) 2015-11-12 2019-12-03 Commscope Technologies Llc Systems and methods for assigning controlled nodes to channel interfaces of a controller
JP7019096B2 (ja) * 2018-08-30 2022-02-14 ドルビー・インターナショナル・アーベー 低ビットレート符号化オーディオの増強を制御する方法及び機器

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0064119B1 (fr) * 1981-04-30 1985-08-28 International Business Machines Corporation Perfectionnement aux procédés de codage de la voix et dispositif de mise en oeuvre du procédé perfectionné
CA1292071C (en) * 1985-06-28 1991-11-12 Tomohiko Taniguchi Coding transmission equipment for carrying out coding with adaptive quantization
US4980917A (en) * 1987-11-18 1990-12-25 Emerson & Stern Associates, Inc. Method and apparatus for determining articulatory parameters from speech data
IT1241358B (it) * 1990-12-20 1994-01-10 Sip Sistema di codifica del segnale vocale con sottocodice annidato
IT1270938B (it) * 1993-05-14 1997-05-16 Cselt Centro Studi Lab Telecom Procedimento per il controllo della trasmissione su uno stesso canale di flussi informativi a velocita' variabile in sistemi di comunicazione tra mezzi mobili, e sistema utilizzante tale procedimento
US5592588A (en) * 1994-05-10 1997-01-07 Apple Computer, Inc. Method and apparatus for object-oriented digital audio signal processing using a chain of sound objects

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003506763A (ja) * 1999-08-09 2003-02-18 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 高品質オーディオ用縮尺自在符号化方法
JP2013543600A (ja) * 2010-10-06 2013-12-05 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法
US9552822B2 (en) 2010-10-06 2017-01-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (USAC)
JP2015505991A (ja) * 2011-12-12 2015-02-26 モトローラ モビリティ エルエルシーMotorola Mobility Llc オーディオ符号化のための方法および装置

Also Published As

Publication number Publication date
ITTO950869A1 (it) 1997-04-28
WO1997015983A1 (en) 1997-05-01
US6108626A (en) 2000-08-22
ES2135931T3 (es) 1999-11-01
DE69603743T2 (de) 2000-06-08
EP0857375B1 (en) 1999-08-11
ITTO950869A0 (ja) 1995-10-27
IT1281001B1 (it) 1998-02-11
DE69603743D1 (de) 1999-09-16
JP3168012B2 (ja) 2001-05-21
ATE183346T1 (de) 1999-08-15
EP0857375A1 (en) 1998-08-12

Similar Documents

Publication Publication Date Title
JP3168012B2 (ja) 音声信号をコード化、操作及びデコード化する方法及び装置
KR101303145B1 (ko) 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더
AU2016325879B2 (en) Method and system for decoding left and right channels of a stereo sound signal
KR101290394B1 (ko) 다운믹스를 이용한 오디오 코딩
KR101139172B1 (ko) 스케일러블 음성 및 오디오 코덱들에서 양자화된 mdct 스펙트럼에 대한 코드북 인덱스들의 인코딩/디코딩을 위한 기술
JP6289613B2 (ja) オブジェクト特有時間/周波数分解能を使用する混合信号からのオーディオオブジェクト分離
KR20090117883A (ko) 부호화 장치, 복호 장치 및 그 방법
KR20090007396A (ko) 손실 인코딩된 데이터 스트림 및 무손실 확장 데이터 스트림을 이용하여 소스 신호를 무손실 인코딩하기 위한 방법 및 장치
JP2010170142A (ja) ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置
JP7285830B2 (ja) Celpコーデックにおいてサブフレーム間にビット配分を割り振るための方法およびデバイス
Taleb et al. G. 719: The first ITU-T standard for high-quality conversational fullband audio coding
KR20220137005A (ko) 다채널 사운드 코덱에 있어서 스테레오 코딩 모드들간의 스위칭
Herre et al. Perceptual audio coding of speech signals
JP2006345289A (ja) 中継装置および端末装置
JPH11352999A (ja) 音声圧縮符号化装置
Herre et al. 18. Perceptual Perceptual Audio Coding of Speech Signals

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090309

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090309

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100309

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100309

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110309

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120309

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees