JP3168012B2 - 音声信号をコード化、操作及びデコード化する方法及び装置 - Google Patents

音声信号をコード化、操作及びデコード化する方法及び装置

Info

Publication number
JP3168012B2
JP3168012B2 JP51629697A JP51629697A JP3168012B2 JP 3168012 B2 JP3168012 B2 JP 3168012B2 JP 51629697 A JP51629697 A JP 51629697A JP 51629697 A JP51629697 A JP 51629697A JP 3168012 B2 JP3168012 B2 JP 3168012B2
Authority
JP
Japan
Prior art keywords
coding
information
signal
coded
bit rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP51629697A
Other languages
English (en)
Other versions
JPH10512423A (ja
Inventor
セラーリオ,ルカ
フエスタ,ミケーレ
ミユラー,イオルク,マーチン
セレーノ,ダニエーレ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Publication of JPH10512423A publication Critical patent/JPH10512423A/ja
Application granted granted Critical
Publication of JP3168012B2 publication Critical patent/JP3168012B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/04Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
    • H04B14/046Systems or methods for reducing noise or bandwidth
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

【発明の詳細な説明】 本発明は、デジタルコード化された音声信号を処理及
び伝送するためのシステムに係り、特に、特定の信号内
容(例えばスピーチ信号、ミュジック信号、雑音など)
に依存することなく音声信号(すなわち20Hzから20kHz
までのバンドの信号)をコード化、操作及びデコード化
するための方法及び装置に関する。
これらの信号は総称音声信号とも称され、これらの信
号のコード化−デコード化は総称コード化及びデコード
化とも称される。
限定するものではないが、好ましくは、この方法及び
装置は音声−映像(マルチメディア)信号の音声成分を
コード化、操作及びデコード化するのに適用される。
音声−映像が通信、コンピューター及びTV/フィルム
産業に拡大して適用されつつあることは知られている。
従って、このような拡大適用から生じる新たな期待や要
求を考慮した音声−映像コード化方法が研究されつつあ
る。特に、新しい方法では対話、高圧縮及び/又は広い
アクセスが可能でなければならず、さらに、急速に発展
する技術を利用するために、本方法は高度な柔軟性と拡
張性を備えておかねばならない。
内容ベースの対話性は、音声−映像シーン(scene)
においてユーザーが有意味な対象(オブジェクト)と対
話及び操作する能力を含む。現在は、対話はコンピュー
ターグラフィックス、すなわち合成内容に限定される。
これに対して新しい音声−映像アプリケーションは、通
常又はハイブリッドの自然/合成の音声−映像対象とも
デマンド対話することが期待されている。記憶装置及び
伝送バンドを効率的に使用するのに高い圧縮が要求さ
れ、圧縮効率の改善は高品質、低ビットレートのアプリ
ケーションを可能にするには重要である。広いアクセス
性とは、音声−映像データが記憶及び伝送メディアの広
範囲に亘って利用できることを意味し、移動通信の急速
な発展の観点からみて、アプリケーションへのアクセス
はワイヤレスネットワークを介して利用できるべきであ
り、このことはエラーを起こしやすい環境でかつ低ビッ
トレートでの有効な動作において必要であることを意味
する。
音声成分の処理に関する限りでは、許容される値の組
内でコード化パラメーターのみを変えることにより、ビ
ットレート、遅延、品質、バンド、チャンネルエラー頑
強性などのようなエンコーダーの主要特性を変える装備
が、柔軟性の要求の中に含まれる。このような柔軟性に
より、異なる要求を伴う種々雑多な用途において総称コ
ーダー−デコーダーの使用が可能となる。総称コーダー
−デコーダーが利用可能になると、将来のデジタルシス
テムでは異なるソースから発生された音声データの変換
が容易になり、ネッノワークインターフェースが簡単に
なり、異なる規格間のトランスコード化における品質低
下を抑える。このことは、将来のユニバーサル・モバイ
ル・テレコミニュケーション・システム(UMTS)たる異
なる(移動又は固定)ネットワーク間での音声データの
変換が増大することを考慮すると、非常に重要となる。
ユーザーの特定の要求をサービスが満たすことができる
ように、又は、設備及びサービス提供者がシステム条件
に依存せずにサービスを最適化できるように、総称コー
ダーはコーダー−デコーダーパラメーターを変更できる
べきでもある。さらに、コーダーは音声データの変換の
前に構成フェーズのアプリケーションをサポートすべき
である。このようなフェーズでは、コーダー−デコーダ
ーはユーザー及びシステムにより決められたサービス要
求に依存して構成される。
そのような種類の総称コーダーは当該技術においては
知られていない。「埋込コード化」として一般に知られ
ている幾つかのコード化技術により、エンコーダー特性
を変えることなくビットレートを下げられる。換言すれ
ば、エンコーダーは固定アルゴリズムに従って動作し、
コード化された信号は、情報の一部が喪失できる又は伝
送経路に沿って抑制できるように構成される。なお、少
なくとも本質的な情報が受け取られると、たとえ品質が
或程度劣化しても、デコーダーは信号をデコードでき
る。例として、埋込ADPCM(Adaptive Differential pul
se Code Modulation)コード化がITU−T標準G.726に開
示されており、埋込CELP(Coder Excited Linear Predi
ction)コード化がUS−A−5353373に開示されている。
両者とも、非常に制限された数のリダクションステップ
のみ可能であって、バンド幅への介入はできず、明らか
に異なるコード化技術を組み込むことは出来ない。
ドキュメント・グローブコム'90:IEEEグローバル・テ
レコミニュケーションズ・コンファレンス&エキシビシ
ョン、’通信:未来との接続’(Cat.No.90CH2827−
4)、San Diego、CA、1990年12月2−5日、ISBN 0
−87942−632−2、ニューヨーク、NY、USA、頁523−52
7、Vol.1、コンド他:「ATMネットワーク上でのパケッ
トスピーチに対する可変レート埋込ADPCMコード化法(V
ariable Rate Embedded ADPCM Coding Scheme for Pack
et Speech on ATM Networks)」に開示された埋込コー
ダー(スピーチコード化のみのための)においては、 − 入力信号セグメントの特性がどうであれ、コアー情
報(信号の最重要部分)及びエンハンス情報をコード化
するために1つのコード化アルゴリズム(ADPCM)のみ
が使用される。すなわち、許される唯一の柔軟性は、異
なる信号部分(サイレンス、音声セグメント、無声セグ
メントなど)に割り当てられたビットレートに関係し、
いずれにしても、ビットレートステップの数が制限され
ることが予想され、 − スピーチ以外の音声信号をコード化するための規定
は為されておらず、該ドキュメントにおいて他の信号に
対する説明は全く取るに足らないものであり、 − 信号の性質及び/又はユーザーとシステムの要求に
依存してコード化ビットストリームのバンド幅及びビッ
トレートに介入することは開示又は示唆されておらず、
コード化信号の操作の可能性についても開示又は示唆さ
れてない。
EP−A−0206352が示すコード化装置では、たとえ個
々の要素が異なる量子化特性を有していても、同じアル
ゴリズム(ADPCM)に従って動作できる個々の要素に信
号が送られる。よって、この場合にも、異なる音声信号
に対して、又はコアー/エンナンス情報に対して異なる
コード化技術を選択する可能性は無い。ドキュメントD2
も、エンコード化されたビットストリームを操作する可
能性を開示又は示唆していない。
US−A−4464783に開示されたコード化装置では、前
にコード化されたサンプルブロックに対して有為な差が
存在するか否かに依存して、特定パラメータについての
情報がコード化信号内に含まれるか又は含まれない。そ
のため、より多くのビットが他の情報に割り当てられ得
る。いずれにしても、固定レート伝送が参照される。
従って、本発明の目的は、コード化側では埋込コード
化が行われて、少なくとも「コアー」情報が受信された
と仮定するとデコード化はまた可能であり、コーダー出
力及び伝送経路に沿ってビットレート及びバンド幅の両
方において実際のスカラビリティを可能にし(「スカラ
ビリティ」は、大抵連続的な方法で多くの微細ステップ
にてビットレート又はバンド幅を減少させる可能性を意
味する。)、異なる信号に対して異なるコード化技術の
使用を可能にし、そしてコード化パラメータの操作を可
能にする方法及び装置を提供することである。
この課題は、新しい請求の範囲第1項及び第32項の主
要部により解決される。好まし実施態様は、従属クレー
ムの主題である。
特に、本発明の方法及び装置はオブジェクト向きパラ
ダイムに基づいている。すなわち、総称音声入力信号は
基本音声オブジェクトの結合として考えられ、基本オブ
ジェクトはマクロオブジェクトにグループ化でき、該マ
クロオブジェクトは他の情報(例えばビデオ情報)にリ
ンクでき且つ独立に操作できる。コード化されているオ
ブジェクトのタイプに依存して、最適なコード化技術、
及びシステム条件と矛盾しない最適なビットレート及び
/又はバンド幅が選択できる。コーダーからテコーダー
への伝送経路に沿って、個々のマクロオブジェクトにつ
いての又は単に個々のオブジェクトについてのビットス
トリームの操作が可能であり、それにより異なるシステ
ム条件に対処してユーザーがシーンなどと相互作用でき
るようにすることが可能である。
本発明は好適実施態様についての以下の説明からより
よく理解されるであろうし、この実施態様は限定的でな
い例として与えられたものであり、添付図面に示されて
いる。
図1は本発明による装置の略ブロック図であり、 図2はエンコーダーのブロック図であり、 図3はエンコーダー内のコード化装置からビットスト
リーム構成装置への接続を示す詳細ブロック図であり、 図4はビットストリームの構成を示し、 図5はデコーダーのブロック図である。
本発明による装置を説明する前に、音声信号に適用さ
れるオブジェクト向きコード化について考察をする。オ
ブジェクト向きコード化技術は、顔、椅子、背景などを
「オブジェクト」として認識しやすいこと故にビデオコ
ード化において既に研究されてきている。このように、
オブジェクト向きコード化の一般原理は既知であり、文
献において広く開示されているので、ここで開示する必
要はないであろう(例えば、「アプリケーションによる
オブジェクト向き設計(Object−oriented design with
applications)」、The Benjamin/Cummings Publishin
g Company Inc.、Redwood City、米国、1991年)。この
技術は、「オブジェクト」がそんなに明白でない音声コ
ード化の分野ではそれほど利用されていない。総称音声
信号は、一般には異なる持続時間である後続の時間イン
ターバル(フレーム)の連結として考えられる。これら
のフレームの一つを音声「シーン(scene)」と仮定で
きる。1つのフレームにおいて、幾つかの音声信号があ
り、それらは分離、連結又はスーパーインポーズさえ可
能である。典型的な例では、幾つかの異なる話し手、異
なる家、事務所又は交通の雑音、背景の快いミュージッ
ク、幾つかの信号音などが含まれ得る。異なる種類の信
号は異なるクラスとして考えることができ、音声信号の
ローカル特性をより良く利用すべくこれらのクラスはさ
らにサブクラスに分割でき、とりわけ以下の事項を達成
する。
− 最良の再生品質で最高の圧縮比。
− 各個別信号を分離及び変更する最高の柔軟性。
オブジェクト向きパラダイムの用語を用いれば、クラ
スのことを以後「抽象クラス(abstract classes)」と
も称し、サブクラスのことを「具体クラス(concrete c
lasses)」とも称する。具体クラスを特定するパラメー
タの組が「オブジェクト」を構成する。
特に、オブジェクト向きアプローチを取ることの理由
は、以下の幾つかの基本的特徴に基づいている。
− 音声エンコーダーサブシステムにおいて変化を促進
すべく音声コード化用の共通フレームワークを作り且つ
新しいモジュールを作る可能性。
− 各クラムに対する特定モデルの使用に基づいたコー
ド化技術の最適化の可能性。
− 音声オブジェクトを独立に操作する可能性。
最後の考察は、音声サービスと共に新しい機能性、特
に対話に関する機能性を考慮する場合には特に興味深
い。これらは例えば、所与のメッセージの早プレイバッ
クする可能性、又は一人の話者のレベルを上げて他の人
を背後に置く可能性などを含み得る。
可能な分類の概略は次の通りである。
− トークスパート(talkspurt):このクラスは、人
々が話すときに作り出される信号を含む。すなわち、音
声コード化のための主要な抽象クラスを表すことができ
るが、それのみを表すのではない。
− サイレンス(silence):このクラスは、それ自身
が沈黙した単一のオブジェクトのみを含むことができ
る。すなわち、幾つかの他の音声信号と共に音声信号を
本質的に再生でき、伝送のためにかなりの量のビットを
節約できる。
− ノイズ(noise):このクラスは、バックグラウン
ドノイズと称され且つ人間によって発生されたものでは
ない全ての信号を含む。一般にこれらの信号は少量の情
報しか伝えず、それらを表すには非常に粗っぽいモデル
が使用できる。
− ミュージック(music):これは1つの非常に広い
抽象クラスから成るか、又は所与の楽器ソースに特別に
当てられた幾つかのクラスから成り得る。
− トーン(tones):このクラスは純粋な正弦波信号
を占める。このクラスに属する単一オブジェクトは、そ
れらの適当な組合せと共に、例えば伝送ネットワークで
遭遇する全ての信号音声を表すことができる。
具体クラスに関しては、まずトークスパートについて
一つの可能性は、単一具体クラスをサウンド又は音素の
可能な各タイプと(又は2以上のサウンドの可能な各シ
ーケンスとでさえ)関連付けられる。このアイデアか
ら、カスケード状の音声学的認識器及び音声合成器とし
て音声コーダー−デコーダーが実現できる。このよう
に、非常に多くの異なる具体クラスが必要となり、一般
にそれらは言語に依存する。さらに、トークスパートの
音声学的分類は非常に難しい。より簡単なアプローチと
しては、より小さい組の具体クラスを定めることであ
り、それらの各々が類似サウンドの組に対応するように
する。しかしながら、ここに記載の好適実施態様では、
幾つかの音響特性に従う音声の特定セグメントをモデル
化するようにした具体クラスが導入される。この場合に
は、トークスパートの分類は音声学的分類に直接関係し
ないが、具体クラスの組は非常に小さい。この目的のた
めに、有声及び無声音セグメントへのトークスパートの
周知の分類、及び共鳴音及び非共鳴音の作成への有声音
セグメントの分類を用いることができる。特に、次の具
体クラスが考えられる。
− 着手(onset):共鳴有声音セグメントの最初の部
分 − 定常状態(steady−state):共鳴有声音セグメン
トの中間部分 − 衰退(decay):共鳴有声音セグメントの最終部分 − 周期的(periodic):非共鳴音セグメント − 非周期的(aperiodic):無声音セグメント これらのクラスは短いボーズをも含み、これらポーズ
は例えば破裂者における音の活性セグメントの一部であ
ることが予想される。
ノイズの場合には、具体クラスは定常状態又は一時ノ
イズにより表すことができ、ミュージックの場合には、
具体クラスは異なる種類の楽器又は合成音により作られ
た音により表すことができ、またもし単一の抽象クラス
が考慮されているならば、音の異なるフェーズ(アタッ
ク、衰退・・・)により表される。
個々の具体クラス(すなわちオブジェクト)のパラメ
ータの組は転送される。本発明では、1つのソース(又
は音声−映像伝送の場合にはビデオのような他の情報と
の1リンク)に関係した基本オブジェクトがマクロオブ
ジェクトにグループ化でき、これらマクロオブジェクト
は独立に操作できる。
別のアプローチは、一つの特定ソース信号を抽象クラ
ス(例えばスピーチ信号及びミュージック信号)として
考えることである。このことは幾つかの共通具体クラス
(例えばサイレンス)を有することを意味し、その結
果、同じモデルが1より多いクラスにおいて採用され
る。このことはまた幾つかの場合においてトークスパー
トとミュージックを分離するサイレンス期間のように、
トークスパートとミュージックを区別するのに利用でき
る情報は無く、特定信号に対する任意のクラス特定を行
わなければならないことを意味する。しかしながら、以
降の必要なときには提案した第1の分類法が参照され
る。
図1に示されるように本発明による装置は以下のもの
により概略示される。
− 総称音声信号の複数のソースAS1...ASn(ここで
「総称」とは上述のように人間により知覚できる信号、
すなわち0から約20kHzまでのバンドの信号を意味す
る。)。
− 音声エンコーダーAC。これは特定の入力音声信号に
合ったオブジェクト向き埋込コード化を行い、伝送経路
1(伝送ライン、ラジオチャンネル・・・)に送られ且
つ好都合に組織化されたビットストリーム内に個々のオ
ブジェクトを導入する。
− クラス−サブクラス認識器CR。これはコード化され
るべき音声信号の抽象クラスと具体クラスを特定し、分
類の結果を接続2を介して音声エンコーダーACに供給
し、それによりエンコーダーは最適なソースモデル(す
なわち最適アルゴリズム)を適用できる。
− 伝送経路に沿って配置された1以上のビットストリ
ーム操作装置BMU。この装置は、エンコーダーACにより
作られたビットストリーム又は先行の操作装置BMUから
来るビットストリームを受け取り、ユーザーやシステム
の要求に対処すべくビットストリームレベルで個々のマ
クロオブジェクトを操作する。ここでは簡単のため一つ
の操作装置のみ示す。
− 可変レート制御装置VRCU。これはエンコーダーから
の出力にてビットレートを決め、エンコーダーACの出力
ビットストリームの編成及び/又は接続3により示され
ているように装置BMU内でのビットストリーム操作を制
御する。このことは、それぞれ接続4、5を介してユー
ザー装置US及び/又はシステム管理装置SYにより供給さ
れるユーザー又はシステム要求に関する情報を用いるこ
とにより行われる。
− 音声デコーダーAD。
用途に依存してソースAS1...ASnはユーザー装置USの
一部とさえできることに留意せよ。
エンコーダーACは、特定の具体クラスを表し且つコー
ド化信号を放出するのに用いられる最適パラメーターを
エンコードしなければならない。このコード化信号の放
出は、特定の音声シーン内容及び/又は考慮している特
定のサブクラスに依存した可変ビットレートにて行われ
るか、又は固定ビットレートで行われる。固定ビットレ
ートは予め決められ得るし、又はVRCUにより特定でき
る。上述のように、エンコーダーACは埋込コード化を行
う。既知のように、このことは出力ビットレート及び関
連の品質に対して幾つかの可能な出力層が与えれること
を意味する。低(基本)層、複数の中間層及びトータル
層が特定できる。基本層は最小の情報を含み、これは以
降において「コア情報(core information)」と称し、
出力信号をデコードするのに必要である。トータル層は
伝送され得る情報の全体を含み、コード化信号の最大ビ
ットレート、最高品質及び最大バンド幅を生じる。中間
層は基本層からトータル層への連続ステップによりコー
ド化信号のビットレート及び品質を向上させる。各ステ
ップで導入される情報を、「エンハンス情報」と称す
る。デコード化側にて又は伝送経路に沿って、1以上の
前記ステップに対応したビットストリームの部分が抽出
できる。ここに記載した例では、最大ビットレートは64
kbit/sと仮定され、音声信号の全バンド(20kHz)に対
応する。スピーチやミュージックに対する基本層は4kHz
バンド幅を有し、約6kbit/sのビットレート(ミュージ
ックに対する実際のビットレート、及びスピーチに対す
る平均レート)に対応できる。中間層は各々が1.5−2kb
it/sのステップに対応できる。
重要な特徴は、規格化された任意の音声コード化アル
ゴリズムを含めて異なるアルゴリズムに従ってエンコー
ダーACが動作できることである。現存する規格が用いら
れるならば、作られるビットストリームはコア層を形成
し、もしチャンネル容量がより高いビットレート又はよ
り広いバンド幅を可能にするならば、本発明はコード化
信号の更新を行う。デコード化側では、基本層のみを用
いることにより標準デコード化アルゴリズムとの協同操
作性がなお保証される。しかし、チャンネル容量全体が
使用されるならば、再生信号の対応する更新が得られ
る。
ACの構造は図2に関して後ほど詳細に説明される。
クラス/サブクラス認識器CRは最適認識器とすること
ができ、シーン上にどのオブジェクトがスーパーインポ
ーズされているかを特定し、クラスに依存した最良の方
法により(すなわち最適モデルを用いて)扱える異なる
信号を与える。このことによりシステムが非常に柔軟に
なる。というのは、この場合には、受信器が再生したい
オブジェクトを受信器が決めることができ、かつそれら
をどのように混成するかをさえ決めることができるから
である。しかしながら、好ましくはより簡単な解決策が
採用でき、これは今日の技術で実行でき、所与の音声シ
ーンにおいてCRは最も可能性の高いものとして一度に1
つのクラスを特定し、よって、音声シーンを満たす特定
信号に用いられるべき1つの特定モデルを割り当てる。
さらに、ソース(例えばスピーチ/ミュージック)の性
質に関する幾つかの情報が、接続6を介してユーザーに
より与えられ、各特定ソースに対するオブジェクト認識
手順を簡単化するのに用いることができる。
一般的には、認識器CRは信号処理装置であり、これ
は、信号レベルを分析することによりトークスパート
(又は一般に活性信号)、サイレンス及びノイズを区別
し(すなわちスピーチの場合の所謂音声活性検出器の機
能に対応した仕事を行う);信号のスペストル分析を行
うことによりスピーチ、ミュージック(又は異なるミュ
ージック楽器)及びトーンを認識し;スピーチの場合に
着手、定常状態及び衰退を識別し且つ周期的セグメント
と非周期的セグメントを識別すべき有声/無声分類を行
うことによりトークスパートの具体クラスを認識する。
スペクトル情報及び予測利得の分析により、周期的又は
非周期的無声信号の認識が可能となり、着手、定常状態
及び衰退間の区別が、スペクトル情報に従って行われ得
るか又は最初のセグメントを着手とし最後のセグメント
を衰退として単にラベリングすることにより行われる。
ビットストリーム操作装置BMUは提案したアーキテク
チャーのうちの重要要素の一つであり、そのビットスト
リームレベルにて動作することにより非常に種々の機能
が実現できる。装置BMUが存在するお陰で達成できる主
要な結果の一つは、エンコーダーの構成を変えること無
く、サービスのランタイム品質を変更する可能性であ
る。このランタイム品質はビットレートに厳密に相関す
る。装置BMUの主要なタスクを以下に示す。
− 特定チャンネル容量に適合させるため、又はユーザ
ー要求に合わせるために、出力ビットストリームのテー
タレートを低減すること(スカラビリティ)。
− そのビットストリームで動作することにより、任意
のマクロ−オブジェクト、又は特定オブジェクトの固有
パラメーターを変更すること。このことにより、例えば
異なる音声オブジェクトのレベル、バンド幅又は品質を
変更でき、又はトーン特性又は韻律素特性までも変えら
れる(多重コンカレントオブジェクト操作)。
後ほどBMUの動作についてより詳細に説明する。
上記した可変レート制御装置VRCUは、エンコーダーAC
から出力ビットレートを制御する主要タスクを有する。
別法として又は追加として、ビットレート制御はBMUを
介しても実現できる。このために、情報VRCUはユーザー
装置USから受信し、システム管理装置SYは、ユーザーが
望むサービスの品質、及びシステムがその時に与えるこ
とができるサービスの品質を一般に表すことが出来る。
移動通信管理に用いられる傾向にある可変レート制御装
置の実施態様は、欧州特許出願EP−A−0627827に記載
されている。その例では、ユーザー装置及びシステム管
理装置SYにより与えられる情報は、ソースビットレー
ト、ソースにより放出される信号に関する冗長性、及び
チャンネルのビットレートに関係する。当業者ならば、
上記特許出願に開示された原理を異なる種類の音声信号
伝送に適用するのに問題はない。
ここで図2を参照すると、明瞭に説明するためにクラ
ス認識器CRが再度示されている。ライン7−1...7−n
を介してソースAS1...ASnから来るデジタル信号は、各
々がNサンプル(例えば256)から成るフレームに編成
されており、マルチプレクサーMXUにより受信され、例
えば1ソース当たり1フレームが一度に下流に送られ
る。これらの信号は、CRで該信号を適当に分析できるべ
く入力サンプリング周波数fs0(接続7A)に関する情報
と関連しており、CRに該情報が送られる。マルチプレク
サーMXUはアップサンプリング装置のようにも動作し、
入力サンプリング周波数fs0を内部サンプリング周波数f
s1に変換する。例えば、内部サンプリング周波数fs1
2のべき乗でfs0よりすぐ上である(例えばfs0が16から
32kHzでれば、fs1は32kHz。fs0が32から48kHzの間にあ
れば、信号は64kHzまでアップサンプリングされ
る。)。この適応の利点は、次に行うサブバンドへの分
割が入力サンプリング周波数に依存しないことである。
入力信号サンプリング周波数が8、16又は32kHzのとき
にはアップサンプリングは出来ない。
幾つかの特定用途では(例えば音声編集、多話者用
途、ビデオオブジェクトとリンクした音声オブジェクト
・・・)、ソース識別をコード化するビットグループ
が、ビットクトリーム構成装置BCUにより出力ストリー
ム内に導入される。BCUは後ほど説明する。もしマクロ
オブジェクトの集合がそこで実行されるなら、上記識別
に関する情報は接続8を介してMXUから、又はCRからBCU
に与えられる。しかしながら、以下の説明では各ソース
は独立にエンコードされるものと仮定する。
マルチプレクサーMXUから出て行く音声信号のフレー
ムs(n)は第1フィルターバンクFB1に送られ、低バ
ンドl(n)及び高バンドh(n)に入力信号が分解さ
れ、それぞれ接続9、10に送られる。例えば、狭バンド
又は広バンドスピーチ圧縮法のどちらが望まれるかに依
存して、低バンドl(n)は0から4kHz又は8kHzのどち
らかまでのレンジのスピーチバンドから成り得る。記載
されたエンコーダーの基本的な実施態様では、ユーザー
は信号内容についての幾つかの情報をクラス認識器に与
えて、クラス/サブクラス認識が低及び高バンドの信号
に対して別々に実行できることが仮定される。このこと
は明らかに認識器の構造を簡単にする。
低バンド信号l(n)は線形予測分析装置LPAに送ら
れ、該装置LPAにおいて短期及び長期予測係数が計算さ
れる。これら係数は接続11を介してビットストリーム構
成装置BCUに、及び実際のコード化アルゴリズムを実行
する装置LCC、LEC(後に説明)に送られる。LPAは分類
結果に依存して利用可能又は利用不可とされ得る。線形
予測技術は、バンド0−4kHz又は0−8kHzのスピーチ信
号に適用されるとき本質的に効率的になるが、線形依存
性は或ミュージック信号(本質的に低周波数)において
も存在し且つこれらの予測器を用いることにより除去で
きる。線形予測分析は、当該技術において知られている
いずれの方法によっても実行できる。
線形予測分析の結果として得られる残差信号r(n)
は別のフィルターバンクFB2に送られ、該フィルターバ
ンクFB2は、クラス/サブクラス情報に従って音声信号
をさらに分解しサブバンドの第1グループr1(n)...r
M(n)を発生する。利用可能なビットレートに依存し
て、全てのサブバンド又はその部分集合のみが量子化プ
ロセスで考慮される。この量子化プロセスは後ほど説明
する。
類似のフィルターバンクFB3は、これもクラス/サブ
クラス情報に従って高バンド信号h(n)を分解し、サ
ブバンドh1(n)...hK(n)の第2グループを発生す
る。
分解のタイプ(間隔の等しいサブバンドへの分解又は
臨界周波数バンドに適応した分解)が構成できる。さら
に、フィルターは、所定の(一定又は一定でない)バン
ド幅のサブバンドをサンプリング周波数に依存すること
なく発生するように構成可能である。基本的な実施態様
では、20kHzバンドは、各々1kHzバンド幅の20個のサブ
バンドに再分割される。最初の4つのサブバンドが低バ
ンドを形成する。
有利には、フィルターバンクFB2、FB3から出て行くフ
レームは、ブロックSF1...SF2により図示された夫々の
装置(バッファー)においてサブフレームにさらに再分
割される。サブフレームの長さ、したがってコード化遅
延は、ユーザー及びアプリケーションの要求に依存して
選択可能である。Nサンプルから成る1フレームをN/L
サンプルから成るLサブフレームに再分割することは、
時間領域において信号をさらに分解することに対応し、
スピーチコード化技術では通常の操作であり、詳しく説
明する必要はないであろう。最初にサブバンドに再分割
し次にサブフレームに再分割することで、音声信号は、
時間軸上でN/Lサンプルに対応し且つ周波数軸上でF_kバ
ンド幅(フィルターバンク構成に依存)に対応した「時
間−周波数スロット」に分割される。
サブバンドr1(n)...rM(n)のサブフレームは、
コード化装置LCCの第1組に送られ、該装置LCCは、各サ
ブバンドに対して1つが割り当てられ、低バンド信号の
コアー情報を発生する。コアー情報は、接続12を介して
ビットストリーム構成装置BCUに送られる。LCC内の各装
置は複数のコード化アルゴリズムにより動作でき、適当
なアルゴリズムは、例えばユーザー及び/又はシステム
要求、及び/又は分類の結果に依存して選択できる。既
に存在する国際規格により定められた如何なるコード化
アルゴリズムでも使用可能である。もし4(又は8)kH
zバンド幅で動作し且つ線形予測分析にも対処する標準
コード化アルゴリズムが用いられるならば、装置LPAの
フィルターバンクFB2は作動されない。低バンド信号は
一般にスピーチ信号であり最も標準化されたスピーチコ
ーダーはバンド幅4kHz(時々8kHz)の信号に動作するこ
とを考慮すると、フィルターバンクFB2でさえ配置で
き、好ましくはLCCの下流に配置される。このことは、
標準コード化アルゴリズムを用いた総称コーダーの相互
操作性をより容易にする。この場合にはもちろんLCCは
単一の装置から成る。
有利には、スピーチコード化に採用されるアルゴリズ
ムは、分析による合成技術となる。
低バンド信号のコアーコード化のための専用コーダー
は、2つのイノベーションコードブックを用いた多重レ
ートCELPコーダーとすることができる。このコーダーで
は、現在のスピーチセグメントを表すのにより適したパ
ラメータの組が、分類の結果により決まり、可能なコー
ド化レートの部分集合が選択される。そして、合成によ
る分析ループでは、所望の品質を達成するのに要求され
る最小レートが、ローカルで合成された信号に幾つかの
オブジェクト手段を用いることにより決められる。最小
ビットレート(〜0.25kbit/s)は例えばバックグランド
ノイズ(抽象クラス「ノイズ」)のみの伝送に対応し、
最大ビットレート(約11kbit/s)は短期及び長期パラメ
ータの伝送及び両方のイノベーションコードブック(抽
象クラス「トークスパート」;具体クラス;「周期
的」)からの寄与の伝送に対応する。中間ビットレート
は、ノイズ及び短期パラメータ、短期及び長期パラメー
タ、短期パラメータ及び1イノベーション寄与等を伝送
することにより得られる。多重レートCELPコーダーにお
いて出力ビットレートが信号分類に依存して選択される
ことは当該技術においては知られている。
低バンドミュージック信号の場合に適用できるコード
化アルゴリズムは、ベクター量子化に基づき得る。形状
/利得ベクトル量子化器は、各時間−周波数スロットに
適用されるか、又はそれらの組合せに適用される。量子
化は各サブフレームにおいて2ステップで行われ、第1
ステップでは形状が量子化され、第2ステップでは利得
が量子化される。量子化は周波数領域又は時間領域のど
ちらかにおいて行われ得る。特定の時間−周波数スロッ
トを量子化せず、量子化された周囲のスロット(時間、
周波数、又は時間−周波数において)を考慮して補間す
ることができる。ベクトル量子化は全く従来技術である
から特に説明は必要ないであろう。ベクトル量子化が
(コーダーの所望の特徴である)複雑性スカラービリテ
ィを容易にサポートし、伝送されるべきどんなパラメー
タも夫々のコードブックの部分集合のみにおいて検索さ
れ得ることに留意されたい。よって、コーダー−デコー
ダーの複雑性と音声の品質は容易に取り決められる。さ
らに、ベクトル量子化はクラス/サブクラスのアプロー
チを容易にサポートし、特定のコードブック表が各音声
クラス/サブクラスに割り当てられ得る。
高バンドに属する信号のサブフレームはコード化装置
HCCの第2組に送られ、該コード化装置は高バンドのコ
アー情報を発生してその情報を接続13を介してBCUに送
る。コード化装置の組HCCも、夫々のサブバンドに対し
て好ましくはベクトル量子化に基づいた複数のコード化
アルゴリズムに従って動作できる。
明らかに、採用されたコアーアルゴリズムは、設定さ
れたコールにてデコーダーと通信しなければならない。
このコード化は、例えば所謂「同時マスク効果」に基
づいたモデルのような適当な知覚モデルをも用いること
ができる。該効果は、弱い信号(特に量子化ノイズ)が
近接周波数のより強い信号(特に音声信号中のトーン)
により聞こえなくなる現象のことである。知覚モデルを
使用すると、適当なマスク閾値を決めなければならず、
これは処理装置PMPにおいて個々のサブバンドから開始
するか又は高低バンドの音声信号のスペクトル分析によ
り行われる。前者の場合にはPMPはフィルターバンクFB
2、FB3の出力に接続され、後者の場合には図示されてい
るようにFB1の出力に接続される。知覚モデルに関する
情報(一般にはグローバルマスク閾値についての情報)
はPMPによりコード化装置の組LCC、HCC及び接続14を介
してビットストリーム構成装置BCUに送られる。信号を
サブバンドに分離するとき知覚モデルを考慮するなら
ば、上記情報はFB2及びFB3にも供給され得る。
コード化信号内に挿入されるべきコアー情報は、利用
可能ビットレートに依存して幾つかのサブバンドのみか
ら、信号及び/又は知覚モデルの性質への寄与を含み得
ることを指摘しておく。サブバンドがコアー情報に対し
て寄与しなければならないかの決定は、BCUにより行わ
れる。よって、BCUとLCC、HCC間の相互作用が行われ
る、簡単のため、図面にはコード化信号をBCUに伝える
接続12、13のみを示す。
コード化装置LCC及びHCCの後には、夫々第3及び第4
の組のコード化装置LEC、HECが続き、これらは同様に各
サブバンドに対する1装置から成り、コード化信号内に
挿入されるべきエンハンス情報を発生する。有利には、
第3及び第4組内のコード化装置はベクトル量子化技術
に従って動作し、例えばそれらはLCC、HCC内の夫々のコ
アーコード化装置の出力にて量子化エラーをコード化す
る。エンハンス情報はLEC、HECから夫々接続15、16を介
してBCUに送られる。LEC、HEC内の各装置は、予想され
るビットレートの増加に対するステップと同数のステー
ジから成る。本発明の好適実施態様では、7つのエンハ
ンスステージまでが1サブバンドに適用できる。またエ
ンハンスコード化については複数の異なるアルゴリズム
が可能であり、最後に適用されるアルゴリズムの組は構
成フェーズにおいてシグナリングされる。そのようなモ
デルが用いられるならば、所与のサブバンドに適用され
るアルゴリズムのタイプは、知覚モデルと共に具体クラ
スにも依存する。サブバンド内で使用されるコアーアル
ゴリズムのタイプもまた考慮され得る。利用できるビッ
トレート、信号の性質及び/又は知覚モデルに依存し
て、BCUは、どのサブバンドがエンハンスされるべきか
及びどのエンハンスステージが幾つ特定のサブバンドに
割り当てられるべきかを決める。よって、BCUとLEC、HE
C間の相互作用もまた与えられるが、簡単のため、図面
にはコード化信号をBCUに伝える接続15、16のみ示す。
ビットストリーム操作装置が興味あるビットストリー
ムの部分を抽出して操作できるように、線形予測分析パ
ラメータ、コード化信号、クラス/サブクラス情報は所
望ならばソース識別と共に、装置BCUによりマクロオブ
ジェクト数、サブバンド数、サブバンドに対するエンハ
ンスステージ数に関する適当なサービス情報(オーバー
ヘッド)に関連付けられ、埋込ビットストリーム内に組
み込まれる。コアー及びエンハンス情報はビットパケッ
ト内に編成され、各パケットはサブバンド及びそのサブ
バンドに対するコード化ステージ(コアー又はエンハン
ス)に関連付けられる。装置BCUは本質的にマルチプレ
クサーと制御ロジックから成り、制御ロジックは、どの
サブバンドがコアーコード化に対して考えられるか及び
もしあれば幾つのエンハンスステージがそれらサブバン
ドの各々に適用されるべきかを決めるのに必要な操作を
行う。
実際、前述の数値例を考慮すると、コード化ステージ
の全てを全サブバンドに適用することは出来ないことは
明らかである。このことは、現在予想される64kbit/sよ
りもずっと大きなビットレートでの伝送ライン、高度に
洗練された分類案の適用、及びコード化装置により作ら
れたビットレートを大きく低下できる知覚モデルを必要
とする。よって、少なくともコアーコード化が実行され
るサブバンド、及びこれら「活性」サブバンドに適用さ
れるべきエンハンスステージ数のBCUによる選択につい
て適当な戦略が考えられるべきである。適当な戦略は以
下の通りとできる。
第1ステップは、所望の出力ビットレートから始めて
出力信号に対するバンド幅を決めることである。例え
ば、所定の閾値ビットレートに割り当てられ得るバンド
幅はアプリオリに設定され、2つの連続閾値間の間のビ
ットレート値に対しては出力バンド幅は線形補間により
決められて最も近い整数値に丸められる。適する関連バ
ンド幅/閾値ビットレートは、16kbit/sまでのビットレ
ートに対しては4kHz、24kbit/sのビットレートに対して
は8kHz、64kbit/sのビットレートに対しては20kHzとで
きる。一旦バンド幅(よってサブバンド数)が決められ
ると、バンド内の信号のエネルギーレベルが所与の閾値
を越えると仮定するなら、コアーコード化ステージが適
用される。この閾値は固定か又は知覚モデルに依存する
こともできる。もしビットレートがコアーステージを全
サブステージに適用することを不可とするならば、閾値
は増加されて上記ステップが繰り返される。一般に、所
望の全サブバンドにコアーステージを適用することは常
に可能である。コアーステージを割り当てた後、ビット
レートがエンハンスステージの挿入を許容しているか否
かを調べる。その調査の初期ステップとして、エンハン
スステージの最大数が各サブバンドに対して割り当て得
る。割り当てられたビットレートが利用可能なビットレ
ートを越えるならば、幾つかのエンハンスステージが使
用不可とされる。このために、各サブバンドにおいて、
前のステージに対して各ステージにより与えられる信号
−ノイズ比の増加が決められ、最小の増加を与えるステ
ージが、それらが属するバンドに依存せず、使用不可と
される。
信号−ノイズ比の増加に代えて、特定ステージをイネ
ーブルするか否かの決定は上述のように同時マスクモデ
ルを利用できる。すなわち、この場合、マスク閾値より
低いノイズを有するエンハンスステージがまず使用不可
とされ、それからマスク閾値を越えたマスク閾値がより
小さいステージが使用不可とされる。
エンハンスコード化ステージを選択する両方の戦略
は、各ステージにより与えられる品質向上の評価に実質
的に基づいている。
もし微分信号−ノイズ比が用いられサブバンドへの分
離が常にコアーコード化前に行なわれると仮定するなら
ば、サブバンドのコード化装置とビットストリーム操作
装置の間の接続は図3に示されるようにできる。ここ
で、ECa...ECpはエンハンスコード化装置内でのコアー
コード化装置及び異なるステージをそれぞれ示し、これ
らはLCC、HCC及びLEC、HEC(図2)の組内の考慮中のサ
ブバンドに割り当てられる。BCL、BCMはそれぞれ制御ロ
ジック及びBCUのマルチプレクサーを示す。BCLはコアー
コード化装置CCの入力信号x(n)を受信し、その信号
のエネルギーを計算し、もしサブバンドがコアー情報に
寄与しなければならないならばCC(接続17)をイネーブ
ルする。エンハンスコード化ステージの選択のため、第
1エンハンスステージの入力にて減算器SUaはコアーコ
ード化装置CCの入力信号x(n)と該装置自身内で利用
可能な再構成信号を受信し、量子化エラーε(n)
=Σ(xi)を計算する。ここでxiはサブフレーム
内での総称サンプルである。信号x(n)及び量子化エ
ラーεはBCLに与えられ、BCLは通常の関係式Σ(xi
2/Σxiに従ってコアーコード化ステージの出
力にて信号−ノイズ比を計算する。量子化エラーε
またコード化装置ECaに送られ、該コード化装置は、適
当なエンハンスコード化アルゴリズムをεに適用し、
再構成された量子化エラー と共に接続15a(又は16a)上に第1ステージエンハンス
情報ブロックを発生する。再構成された量子化エラー
は、BCLに送られて(但し図3中の該当する配線は図示
せず)、第1エンハンスステージの出力にて信号−ノイ
ズ比が計算され、そのステージにより与えられる増分Δ
SNRが計算され、また、第2ステージの減算器SUbに送ら
れて新しい量子化エラーεが発生される。同じ編成が
残りのステージにおいても繰り返される。最後のステー
ジのコード化装置ECpの出力では、量子化エラーの前回
値εp+1が計算されてBCLに与えられる。考慮しているバ
ンド及び他のバンド(二重線矢19により全体として図示
された接続を介して与えられる)の各ステージの後の信
号−ノイズ比の増分ΔSNR故に、該バンドがエンハンス
情報に寄与しなければならないならば、BCLは1以上の
線18a...18p上に信号を送り出し、該信号は、対応する
コード化装置ECa...ECpをイネーブルしてそのエンハン
ス情報ブロックを出力15a...15p(16a...16p)上に転送
させる。接続17、18a...18pに存在する信号と類似のイ
ネーブル信号は、他のサブバンドのコード化装置に送ら
れる。矢印19は、他のバンドの装置に導く接続をも示
す。さらなる接続20は、ビットストリームのオーバーヘ
ッド内に挿入すべきサービス情報をBCLからBCMに送る。
BLMから経路1への情報の転送は、後に説明するよう
に、異なる方法で行われ得る。
BCUの出力でのビットストリーム編成は、複数のソー
スの場合、よって複数のマクロオブジェクトの場合につ
いて図4に示される。ストリームはオーバーヘッドビッ
トOVH0のグループを含み、これに続くのは第1、第2...
フレームのマクロオブジェクトに関するビットストリー
ムOB11...OB1x,OB21...である。上述のように、マクロ
オブジェクトは、特定のソースに関する又はフレーム中
の他の情報とのリンクに関する全コード化ビットを含
む。オーバーヘッドビットOVH0は、いくつかのマクロオ
ブジェクトがビットストリーム内に含まれるのかを識別
し、入出力サンプリング周波数の情報をも含む。入力サ
ンプリング周波数は、オブジェクトをエンコードすると
き用いられるサンプリング周波数である。出力サンプリ
ング周波数は、受信器端にて使用されるべきサンプリン
グ周波数である。ビットOVH0は接続セットアップでのみ
送られねばならないことに留意せよ。各マクロオブジェ
クトでは、OB11に対して示されているように、オーバー
ヘッドビットOVH1の第1グループはオブジェクト分類
(抽象及び具体クラス)の情報を含む。オーバーヘッド
ビットOVH2の第2グループは、実際に利用されているサ
ブバンド(すなわち少なくともコアー情報が伝送される
サブバンド)の数を示す。ビットOVH2に続くのは、コア
ービットストリームCBである。よって、OVH1、OVH2及び
CBは共に基本層を形成する。
コアービットの後、オーバーヘッドビットOVH3の第3
グループは、各サブバンドに適用されるエンハンスコー
ド化ステージの数を示す。オーバーヘッドビットOVH3に
続くのは、エンハンスビットEB1...ERyである。
コアー及びエンハンスビットストリームCB、EB内で
は、ビットパケットは異なる方法で配列され得る。特
に、サブバンドによる配列又はランクによる配列が可能
である。コアー情報に対してはランクはエネルギーレベ
ルとリンクされ、エンハンス情報に対してはランクは、
コード化アルゴリズムの適用を決めるためのステージに
おいて評価される(例えば知覚モデルからの)パラメー
タとリンクされる。もちろん二番目の解決策は、サブバ
ンド識別についての情報をパケット内に導入する必要ゆ
えにオーバーヘッドにおける増加をもたらす。
ビットストリーム操作装置BMU(図1)については、
個々のマクロオブジェクト又はオブジェクト内の幾つか
のパラメータ(レベル、ヒッチ...)の値を変えること
により、又はビットレートをスケーリングすることによ
り、経路1に沿って伝送されるビットストリームを操作
できる。
スケーリングに関する限り、BMUの動作は、ビットス
トリーム構成装置BCUにより採用されるビットパケット
配列により影響される。
サブバンド配列が採用されるならば、ビットストリー
ム操作装置は、エンコーダーACで用いられるアルゴリズ
ムと同様のアルゴリズムを用いてコード化サブバンド数
を決め、考慮されるべきコアー情報の無いバンドに関係
した全パケットを放棄する。このようにして得られたビ
ットレートがなお要求されたビットレートを越えるなら
ば、さらなるステージが除去される。すなわち、放棄さ
れるべきステージが割り当てられた唯一のステージでな
いと仮定すると、最上位バンドから開始して各バンドに
対して1パケットを放棄するという選択が可能である。
ひとたび全バンドが調べられた後は、コード化ステージ
がなお割り当てられている最高バンドから再度開始して
新しいサイクルが実行される。要求されるビットレート
が得られるまで、又は全てのバンドに対してコアーステ
ージのみが割り当てられるまで、該手順が続けられる。
もしコアーステージのみの割り当てによってもビットレ
ートが所望のビットレートを越えるならば、コアーステ
ージも最上位バンドから開始して除去される。
逆にランク配列が採用されるならば、除去は即刻であ
る。上述のように、ランク配列はより大きなオーバーヘ
ッドをもたらす。すなわち、コード化フェーズの間所与
のビットレートに対して割り当て出来るステージ数が低
減される。なお、ビットストリームを構築するためエン
コーダーにて採用されるのと同じルールが、ビットスト
リーム操作装置においてステージを放棄するのに採用で
きる。従って、その操作は品質の違いを生じさせない。
上記操作は単一マクロオブジェクトに関する。なおビ
ットストリーム操作装置BMU(図1)は、個々のオブジ
ェクトのビットストリームに作用することにより全ての
コード化パラメータを変更できる。例えば、多重コンカ
レント音声マクロオブジェクトが伝送されているとき、
一般に関連データストリームは、伝えられる実際の情報
に依存して異なるビットレートを有し得る。一つの単純
な操作特徴は、各マクロオブジェクトのレベルを変更す
る可能性、又は1話者の音声のオブジェクト要素(ヒッ
チ、スペクトルなど)を変更する可能性、1楽器のミュ
ージックモデルを変更する可能性などである。別の可能
性は、所与のビットレート(例えば最大ビットレート)
での幾つかの基本ストリームから該所与のビットレート
での単一ストリームを作ることである。この操作は、ビ
ットストリーム操作装置において、各行がバンドに関連
し各列がマクロオブジェクトに関連した2つの表を作る
ことを必要とする。第1表は各バンド及び各マクロオブ
ジェクトに割り当てられたステージ数(又はビットスト
リームにより抽出された他の情報)を含み、第2の表は
それぞれのエネルギーレベルを含む。ビットレート低減
手順は、サブバンド配列の場合に上記考えられたものと
類似しているが、違いは、周波数を減少させるためでは
なくエネルギーを増加させるためにサブバンドが調べら
れることである。このようにして、支配的マクロオブジ
ェクトはより大きなレートを得て、全体の品質は、全マ
クロオブジェクトを同じビットレートに割り当てること
により達成可能な品質よりも良くなる。
オブジェクト操作は個々のフレームに係わることがで
きることにも留意せよ。このことは例えばもし何らかの
音声オブジェクトが一映像オブジェクトにリンクされる
ならば、複雑なオブジェクトの音声−映像ズームを有す
る可能性が存在することを意味する。
図5を参照すると、デコーダーが示されている。デコ
ーダーの全てのブロックは、接続のセットアップにおい
てコーダーの対応ブロックの構成についての情報を受信
し、相補的操作を正確に行う。構成情報は接続21を介し
て受信又はビットストリーム分解装置BDUにて受信す
る。該装置BDUはBCUに対して相補的なタスクを有する。
簡単のため、このような情報をデコーダーブロックに分
配する手段は図示されていない。受信装置BDUは、多く
の場合BMUにより操作されるストリームを、1で示され
た伝送経路から受信し、クラスを分離し、実際のコード
化信号から情報を識別し、これらの情報を接続22、23に
それぞれ与える。コード化信号ストリームは低バンド及
び高バンドストリームに分解され、接続24、25を介して
夫々のエンハンスデコーダーLED、HEDに送られる。コー
ダーLEC、HECに類似のデコーダーLED、HEDは、各々が1
サブバンドに関連した一組の装置から成り、LEC、HEC内
のステージと同数のステージを含む。異なるサブバンド
に対する個々のステージは、コーダー内の対応ステージ
がイネーブルされたか否かに依存せずに作動される。こ
のイネーブルは、オーバーヘッドOVH1−OVH3(図4)に
含まれる情報に基づいてBDUにより制御される。各装置
は、コード化側に適用されるコード化アルゴリズムと相
補的なデコード化アルゴリズムを実行する。個々のオブ
ジェクトをデコード化するために、デコーダーLED、HED
はまたクラス−サブクラス情報を必要とする。
エンハンスデコーダーは再構成量子化エラーE
Li(n)(i=1...M),Ehj(j=1...K)を夫々のコア
ーデコーダーLCD、HCDに送り、デコーダーは、低バンド
のサブバンドに対する再構成残差信号(n)、及び
高バンドのサブバンドに対して再構成信号(n)を
与える。エンパンスについては、クラス情報が用いられ
る。サブバンドの再構成信号は、FB2、FB3(図2)とは
相補的な合成フィルターバンクFB4、FB5に送られ、残差
信号(n)及び高バンド信号(n)を再構成する。
線形予測合成装置LPSにおける残差信号の線形予測合成
の後、元の信号のバンド全体が合成フィルターバンクFB
6(FB1と相補的)により再構成される。該合成フィルタ
ーバンクFB6は、接続26、27を介してこれら2つのバン
ドの再構成信号(n)、(n)を受信する。必要な
らば、FB6から出てくる信号は、ダウンサンプリング装
置DSにおいてダウンサンプリングされ、ブロックUS′で
略示されたユーザーに出力装置OUを介して送られ、該装
置OUは、ソース識別を再構成ストリームと関連づけ、も
し必要ならば異なるデコード化マクロオブジェクトを異
なるユーザーに送る。ダウンサンプリングのため、所望
の出力サンプリング周波数fOSについての情報がユーザ
ーにより与えられる。
もし例えばビットストリームがエラーの起こりやすい
環境で伝送されるならば、音声オブジェクトに基づくア
プローチは、音声デコーダーにおいてエラー隠蔽技術を
効率的にサポートすること、すなわち、特定のエラー隠
蔽アルゴリズムが各々の抽象/具体クラスの組合せに対
して適用できることにも留意された。
上記説明は限定的でない例により単に与えられてお
り、改変及び変更は本発明の範囲を逸脱することなく可
能であることは明白である。
───────────────────────────────────────────────────── フロントページの続き (73)特許権者 999999999 ローベルト・ボツシユ・ゲゼルシヤフ ト・ミツト・ベシユレンクテル・ハフツ ング ドイツ連邦共和国 デー−70469 シユ トツトガルト、ヴエルナーシユトラーセ 1 (72)発明者 セラーリオ,ルカ イタリー国 アイ−10137 トリノ、ヴ イア・インデユーノ 2 (72)発明者 フエスタ,ミケーレ イタリー国 アイ−10137 トリノ、ヴ イア・フイラデルフイア 128/1 (72)発明者 ミユラー,イオルク,マーチン ドイツ連邦共和国 デー−71409 シユ ヴアイクハイム、レルヒエンシユトラー セ 18/1 (72)発明者 セレーノ,ダニエーレ イタリー国 アイ−10151 トリノ、ヴ イア・イセルニア 7/エー (56)参考文献 特開 昭57−183143(JP,A) Micheael H.;“OBJE CT−ORIENTED ANALYS IS SYNTHESIS CODIN G BASED ON MOVING TWO−DIMENSIONAL OB JECTS”Signal Proce ssing: IMAGE COMMU NICATION,Vol.3,No. 1(91.1.16受入)p.409−428 Kazuhiro K.,Masas hi O.;“VARIABLE RA TE EMBEDDED ADPCM CODING FOR PACKET SPEECH ON ATM NETW ORKS” 1990 IEEE GLOB ECOM,VOL.1(91.6.4受 入)p.523−527 「マルチメディア符号化の国際標 準」,丸善株式会社 発行 第4刷, (平成5.4.15)p.180−185 (58)調査した分野(Int.Cl.7,DB名) H04B 1/16 H03M 7/30 G10L 9/14 - 9/18

Claims (56)

    (57)【特許請求の範囲】
  1. 【請求項1】デジタル化音声信号を処理する方法であっ
    て、 少なくともコード化フェーズとデコード化フェーズを含
    み、 (ア)前記コード化フェーズでは、所定数のサンプルか
    ら成る一連のフレームに編成された処理されるべき信号
    を、独立にコード化し得る複数の周波数バンドに分離
    し、少なくとも前記周波数バンドから選択したバンド中
    の信号に関する情報を含めてコード化信号を発生させ、
    その際、該コード化は、コード化信号が基本層、トータ
    ル層及び複数の中間層から成るように埋込コード化技術
    により行ない、前記基本層は、デコード化に必要な最少
    量の情報(「コアー情報」)を含み且つ最小ビットレー
    トに対応し、前記トータル層は、コード化情報の全体を
    含み且つ最大ビットレートに対応し、前記中間層は、コ
    アー情報だけでは表すことができない夫々の信号部分を
    コード化する夫々の情報ブロック(「エンハンス情
    報」)によりコード化信号に寄与し、且つ、基本層から
    トータル層へ連続ステップによりコード化信号のビット
    レートを増加させ、前記基本層は、第1コード化ステッ
    プで発生させ、エンハンス情報の各ブロックは、夫々の
    第2コード化ステップで発生させ、そして (イ)前記デコード化フェーズでは、コード化信号に含
    まれる異なる周波数バンド内に関する情報を独立にデコ
    ード化し、その際、両方のエンハンス情報ブロックとコ
    アー情報がデコード化されるべき周波数バンドに対し
    て、コード化信号に1組の第1デコード化ステップ及び
    第2デコード化ステップを施し、該第1デコード化ステ
    ップの数はそのバンドに対して実行された第2コード化
    ステップの数と同じであり、各第1デコード化ステップ
    おいて1つのエンハンス情報ブロックをデコード化し、
    前記第2デコード化ステップではコアー情報をデコード
    化し、一方、コアー情報のみがデコード化されるべき周
    波数バンドに対しては、コード化信号に第2デコード化
    ステップのみを施し;また、該デコード化フェーズで
    は、異なるバンドに関するデコード化信号を再結合して
    元の信号のバンド幅特性に対応したバンド幅特性を有す
    る再構成信号を作る、 上記デジタル化音声信号を処理する方法において、 (i)前記コード化フェーズでは、2ステージ分類を行
    って、所与のフレーム中のコード化されるべき各音声信
    号を、複数の抽象クラスのうちの一つ及び前記一つの抽
    象クラスにおける複数の具体クラスのうちの一つに割り
    当て、ここで、前記具体クラスは、信号部分の特性と関
    係し且つフレーム中に存在する基本的な音声オブジェク
    トを識別し、前記抽象クラスは、音声信号の性質に関係
    し且つ基本的な音声オブジェクトの結合から得られるマ
    クロオブジェクトを識別すること、 (ii)複数の第1コード化アルゴリズムから選択した第
    1コード化アルゴリズムにより所与の音声オブジェクト
    に対して前記第1コード化ステップを実行し、複数の第
    2コード化アルゴリズムから選択した夫々の第2コード
    化アルゴリズムにより前記所与の音声オブジェクトに対
    して第2コード化ステップを実行し、その際、前記複数
    の第1及び第2コード化アルゴリズムそれぞれからの前
    記選択は、少なくとも前記2ステージ分類の結果に依存
    し;また、コード化フェーズでは、各オブジェクトに対
    して、オブジェクトビットストリーム及びマクロオブジ
    ェクトビットストリームを発生し、その際、前記オブジ
    ェクトビットストリームは、そのフレーム中の音声信号
    と同じ具体クラスに関する全情報を含み、前記マクロオ
    ブジェクトビットストリームは、同じ抽象クラス又は異
    なる抽象クラスにおける異なるオブジェクトのビットス
    トリームを結合し、そのビットレート及びバンド幅特性
    は、前記第1及び第2アルゴリズムに対して為された選
    択、及びユーザー装置(US)からコード化デバイス(A
    C)に送られる構成情報、及び/又は伝送システム(S
    Y)からコード化デバイスに送られる制御情報に依存す
    ること、 (iii)上記方法は、前記コード化フェーズとデコード
    化フェーズの間にて、前記コード化フェーズで発生させ
    たビットストリームを操作するフェーズをさらに含み、
    コード化ビットストリームに含まれる抽象及び具体クラ
    スに関する情報並びに前記構成及び制御情報に基づい
    て、コード化ビットストリームをスケーリングするこ
    と、及び (iv)前記デコード化フェーズでは、コード化フェーズ
    で選択した第2アルゴリズムに相補的な夫々のアルゴリ
    ズムにより各第1デコード化ステップを実行し、そのス
    テップでデコード化されるべきエンハンス情報ブロック
    を発生し、また、第1コード化ステップで選択した第1
    アルゴリズムに相補的なアルゴリズムにより第2デコー
    ド化ステップを実行し;その際、前記第1及び第2デコ
    ード化アルゴリズムの各々は、抽象及び具体クラスを備
    えた情報及び/又はセットアップフェーズで与えられた
    構成情報に基づいて、前記第2及び第1コード化アルゴ
    リズム夫々の一つと各々相補的な複数の第1及び第2デ
    コード化アルゴリズムから選択すること、 を特徴とする上記デジタル化音声信号を処理する方法。
  2. 【請求項2】第1及び第2アルゴリズムは異なるバンド
    に対して独立に選択されることを特徴とする請求の範囲
    第1項記載の方法。
  3. 【請求項3】第2コード化アルゴリズムは、第1コード
    化アルゴリズムの適用の結果として得られる量子化エラ
    ーをコード化することを特徴とする請求の範囲第1項又
    は第2項記載の方法。
  4. 【請求項4】第1アルゴリズムは、少なくともより低い
    周波数バンドの組の信号に対する線形予測分析コード化
    アルゴリズム、並びにより高い周波数バンドの信号及び
    線形予測が用いられない信号に対する形状/利得ベクト
    ル量子コード化アルゴリズムを含むことを特徴とする請
    求の範囲第1項乃至第3項のいずれか1項に記載の方
    法。
  5. 【請求項5】第2アルゴリズムは形状/利得ベクトル量
    子コード化アルゴリズムを含むことを特徴とする請求の
    範囲第1項乃至第4項のいずれか1項に記載の方法。
  6. 【請求項6】第1及び第2アルゴリズムの選択は、ユー
    ザー装置(US)からコード化デバイス(AC)へ送られる
    構成情報及び/又は伝送システム(SY)からコード化デ
    バイスに送られる制御情報に依存して実行されることを
    特徴とする請求の範囲第1項乃至第5項のいずれか1項
    に記載の方法。
  7. 【請求項7】コード化の前に各フレームは複数のサブフ
    レームに分割され、前記サブフレームの長さは、コード
    化の複数の遅延値が得られるように、複数の値の長さか
    ら選択できることを特徴とする請求の範囲第1項乃至第
    6項のいずれか1項に記載の方法。
  8. 【請求項8】前記周波数バンドは、コード化されるべき
    信号のサンプリング周波数とは独立に所定のバンド幅を
    有することを特徴とする請求の範囲第1項乃至第7項の
    いずれか1項に記載の方法。
  9. 【請求項9】コード化されるべき信号は8から64kHzま
    での任意の入力サンプリング周波数でサンプリングさ
    れ、コード化前に、それは入力サンプリング周波数より
    すぐ上の2のべき乗である内部サンプリング周波数まで
    アップサンプリングされ、また、アップサンプリングは
    8、16及び32kHzの入力サンプリング周波数に対しては
    機能しないことを特徴とする請求の範囲第1項乃至第8
    項のいずれか1項に記載の方法。
  10. 【請求項10】スピーチ信号処理のために、コード化フ
    ェーズは、 (A)周波数バンドの組全体に対して、標準とされるス
    ピーチコード化アルゴリズムを第1コード化アルゴリズ
    ムとして選択するステップ、 (B)標準とされるアルゴリズムをスピーチ信号に実行
    することにより発生されるコアー情報を有する基本層を
    構築するステップ、及び (C)標準とされるコード化信号に対して更新されたコ
    ード化信号を得るように、前記中間層の一つ又はトータ
    ル層に対応するコード化信号を構築するステップ、 を含み、また、デコード化フェーズは、 a)基本層のみをデコード化するステップ、又は b)デコード化アルゴリズムの可用性及び/又はデコー
    ド化信号に対して得られるべき品質に依存して、コード
    化信号全体をデコード化するステップ、 を含むことを特徴とする請求の範囲第1項乃至第9項の
    いずれか1項に記載の方法。
  11. 【請求項11】少なくとも第1コード化ステップを実行
    すべき周波数バンドの選択、第2コード化ステップをも
    実行すべきバンドの選択、及び所与の周波数バンドに対
    する第2コード化ステップの数が、コード化信号に求め
    られるバンド幅及びビットレートに基づき且つユーザー
    装置(US)及びシステム(SY)の要求に従って決めら
    れ、その際、コード化信号は、コード化される信号のバ
    ンド幅及びサンプリング周波数とは独立にフレームごと
    に利用されることを特徴とする請求の範囲第1項乃至第
    10項のいずれか1項に記載の方法。
  12. 【請求項12】第1コード化ステップを実行すべき周波
    数バンドの選択は、 a)利用可能なビットレートについてコード化信号に割
    り当て可能な総バンド幅を決める操作、 b)前記バンド幅に含まれる各バンドに関連するエネル
    ギーを決め、前記エネルギーをそれぞれの第1エネルギ
    ー閾値と比較する操作、 c)エネルギーが夫々の閾値を越える全てのバンドに対
    してコアー情報の挿入をイネーブルする操作、 により実行されることを特徴とする請求の範囲第1項乃
    至第11項のいずれか1項に記載の方法。
  13. 【請求項13】前記閾値は定数閾値であることを特徴と
    する請求の範囲第12項記載の方法。
  14. 【請求項14】前記閾値は知覚モデルを用いて決められ
    た閾値であることを特徴とする請求の範囲第12項記載の
    方法。
  15. 【請求項15】前記第2コード化ステップが適用される
    バンドの選択、及び所与のバンドに対する第2コード化
    ステップ数の決定は、 d)各バンドに対して第2コード化ステップ全てを適用
    する操作、 e)前回のステップに対する、又は同じバンド内での第
    1コード化ステップに対する、各第2ステップにより与
    えられる信号品質の向上を決める操作、 f)最高の品質向上をもたらす第2コード化ステップに
    より与えられるエンハンス情報ブロックをコード化信号
    に挿入することを、利用可能なビットレートが完全に使
    用されるまでイネーブルする操作、 を含むことを特徴とする請求の範囲第1項乃至第14項の
    いずれか1項に記載の方法。
  16. 【請求項16】品質向上の前記評価が知覚モデルを用い
    て行われることを特徴とする請求の範囲第15項記載の方
    法。
  17. 【請求項17】前記音声信号がマルチメディア信号の音
    声成分であることを特徴とする請求の範囲第1項乃至第
    16項のいずれか1項に記載の方法。
  18. 【請求項18】コード化されるべき音声信号に対し前記
    2ステージ分類が実行され、所与のフレーム内の信号が
    複数の抽象クラスのうちの一つ及び前記一つの抽象クラ
    スにおける複数の具体クラスのうちの一つに割り当てら
    れ、その際、前記分類は、周波数バンド内への前記分離
    のため、第1コード化アルゴリズム及び場合によっては
    第2コード化アルゴリズムが適用される周波数バンドの
    前記選択のため、及び所与の周波数バンドに対する第2
    コード化ステップの数の決定のための制御パラメータと
    して使用されることを特徴とする請求の範囲第1項乃至
    第17項のいずれか1項に記載の方法。
  19. 【請求項19】前記2ステージ分類が自動的に行われる
    ことを特徴とする請求の範囲第1項乃至第18項のいずれ
    か1項に記載の方法。
  20. 【請求項20】前記第2ステージ分類が、ユーザー装置
    (US)から送られる情報により行われることを特徴とす
    る請求の範囲第1項乃至第18項のいずれか1項に記載の
    方法。
  21. 【請求項21】前記オブジェクトビットストリームは、
    個々のコード化ステップにより作られたビットパケット
    により構成され、前記マクロオブジェクトビットストリ
    ーム(OB11...OB21)は、オーバーヘッドビットの第1
    グループ(OVH1,OVH2)、コアー情報のパケット、及び
    第2コード化ステップが実行されたならばオーバーヘッ
    ドビットの第2グループ(OVH3)を含み、該オーバーヘ
    ッドビットの第1グループは、分類結果及び少なくとも
    第1コード化ステップが実行された周波数バンドに関す
    る情報を含み、該オーバーヘッドビットの第2グループ
    は、少なくとも第1コード化ステップが実行された異な
    る周波数バンドに対して実行されたコード化ステップの
    数及びエンハンス情報ブロックのパケットに関する情報
    を含むこと、また、フレーム内でコード化された異なる
    マクロオブジェクトのビットストリーム(OB11...OB2
    1)が順に転送され、該転送の前に構成フェーズが行わ
    れ、該構成フェーズではオーバーヘッドビットの別のグ
    ループ(OVH0)が転送され、該グループはデコーダー
    (AD)の構成に必要なサービス情報全てを含むことを特
    徴とする請求の範囲第1項乃至第20項のいずれか1項に
    記載の方法。
  22. 【請求項22】マクロオブジェクトビットストリーム内
    のビットパケットはランクにより配列され、該ランク
    は、パケットがコアー情報に属する場合には異なるバン
    ドのエネルギー値に関係し、パケットがエンハンス情報
    に属する場合には品質の向上に関係することを特徴とす
    る請求の範囲第21項記載の方法。
  23. 【請求項23】さらにビットストリーム操作フェーズを
    含み、該フェーズは、コード化信号のビットレート及び
    バンド幅のステップ状のスケーリングのために、コーダ
    ー(AC)とデコーダー(AD)間の伝送経路(1)に沿っ
    て1又は複数の場所にて実行され、各スケーリングステ
    ップは、1つのエンハンス情報ブロックの抑制、又はエ
    ンハンス情報ブロックがコード化信号に存在しない場合
    は周波数バンドのコアー情報の抑制に対応することを特
    徴とする請求の範囲第1項乃至第22項のいずれか1項に
    記載の方法。
  24. 【請求項24】前記ビットストリーム操作フェーズは、
    デコーダー(AD)の上流の1又は複数の配置にて実行さ
    れ、コード化信号のビットレート又はバンド幅のステッ
    プ状のスケーリングを与え、各スケーリングステップ
    は、1エンハンス情報ブロックの抑制、又はコード化信
    号内にエンハンス情報ブロックが存在しないときは周波
    数バンドのコアー情報の抑制に対応することを特徴とす
    る請求の範囲第1項乃至第23項のいずれか1項に記載の
    方法。
  25. 【請求項25】前記スケーリングが、 a1)フレームにおいて所望のビットレートに対する該又
    は各々のマクロオブジェクトに割り当て可能なバンド幅
    を決めるステップ、 b1)前記バンド幅を越える周波数バンドに関するビット
    パケットを除去するステップ、 c1)残差ビットレートが所望のビットレートを越えるな
    らば、所望のビットレートが達成されるか又はコアー情
    報のみが残されるまで、最高周波数を有するバンドから
    開始して、各バンドに対するエンハンス情報の1ブロッ
    クを除去し、必要なら該除去は周期的に繰り返されるス
    テップ、 d1)ステップc1)の終わりでの残差ビットレートがなお
    所望のビットレートを越えるならば、最高周波数バンド
    から開始して、1以上の周波数バンドのコアーパケット
    を除去するステップ、 を含むことを特徴とする、請求の範囲第22項及び第23項
    に記載の方法。
  26. 【請求項26】前記スケーリングが、 a2)フレームにおいて所望のビットレートに対する該又
    は各々のマクロオブジェクトに割り当て可能な総バンド
    幅を決めるステップ、 b2)前記バンド幅を越える周波数バンドに関するビット
    パケットを除去するステップ、 c2)残差ビットレートが所望のビットレートを越えるな
    らば、所望のビットレートが達成されるか又はコアー情
    報のみが残されるまで、最低ランクを有するパケットか
    ら開始して、エンハンス情報の1パケットを一度に除去
    するステップ、 d2)ステップc2)の終わりでの残差ビットレートがなお
    所望のビットレートを越えるならば、最低ランクバンド
    から開始して、1以上の周波数バンドのコアー情報を除
    去するステップ、 を含むことを特徴とする、請求の範囲第24項及び第25項
    に記載の方法。
  27. 【請求項27】前記ビットストリーム操作フェーズは、
    個々のマクロオブジェクトにおける所定のコード化パラ
    メータの値を変えるステップを含むことを特徴とする請
    求の範囲第24項乃至第26項のいずれか1項に記載の方
    法。
  28. 【請求項28】前記ビットストリーム操作フェーズは、
    異なるビットレート及び/又はバンド幅を異なるマクロ
    オブジェクトに割り当てるように、複数のコンカレント
    マクロオブジェクト上に同時に実行されることを特徴と
    する請求の範囲第24項乃至第27項のいずれか1項に記載
    の方法。
  29. 【請求項29】前記ビットストリーム操作フェーズは、
    ビットレート全体が所定のビットレートを越える複数の
    コンカレントマクロオブジェクトからの寄与を含んで、
    所定のビットレートにて単一ビットストリームを構築す
    るステップを含むことを特徴とする請求の範囲第28項記
    載の方法。
  30. 【請求項30】前記ビットストリーム操作フェーズは、
    個々のアクロオブジェクト上にレベル操作を実行するス
    テップを含み、また、個々のマクロオブジェクトに割り
    当てられた異なるビットレート及び/又はバンド幅はそ
    のレベル操作を基にして選択されることを特徴とする請
    求の範囲第28項又は第29項記載の方法。
  31. 【請求項31】前記ビットストリーム操作フェーズは個
    別に選択されたフレーム上で実行されることを特徴とす
    る請求の範囲第24項乃至第30項のいずれか1項に記載の
    方法。
  32. 【請求項32】デジタル音声信号を処理する装置であっ
    て、 エンコーダー(AC)、デコーダー(AD)及び少なくとも
    1つのビットストリーム操作装置(BMU)を含み、 (ア)前記エンコーダー(AC)は、所与のバンド幅特性
    を有するコード化すべき音声信号のサンプルフレームを
    受信するよう構成され、フィルタリング手段(FB1,FB2,
    FB3)、コード化装置(LCC,HCC,LEC,HEC)及び結合手段
    (BCU)を含み、 前記フィルタリング手段(FB1,FB2,FB3)は、前記コー
    ド化すべき音声信号を複数の周波数バンドに分離し、 前記コード化手段(LCC,HCC,LEC,HEC)は、各々の周波
    数バンドに関連してそのバンドの信号の埋込コード化を
    行い、各バンドに対して第1コード化装置(LCC,HCC)
    と第2コード化装置(LEC,HEC)の組から成り、前記第
    1コード化装置(LCC,HCC)は、周波数バンドのうち少
    なくとも選択されたバンドに対してイネーブルされて夫
    々のバンドに対するコアー情報を各フレームにて発生
    し、前記第2コード化装置(LEC,HEC)は、そのバンド
    に対する一連のエンハンス情報ブロックを発生し、前記
    コアー情報は信号のデコード化に必要な最小量の情報で
    あり、 前記結合手段(BCU)は、異なる周波数バンドのコード
    化信号を単一の埋込コード化信号に結合し、前記埋込コ
    ード化信号は、基本層、トータル層及び複数の中間層か
    ら成り、前記基本層は、前記選択された周波数バンドの
    コアー情報を含み且つ最小ビットレートに対応し、前記
    トータル層は、コード化情報の全体を含み且つ最大ビッ
    トレートに対応し、前記中間層は、夫々のエンハンス情
    報ブロックによりコード化信号に寄与し且つ基本層から
    トータル層への連続ステップによりコード化信号のビッ
    トレートを増加させ、 (イ)前記デコーダー(AD)は、デコード化装置(LED,
    HED,LCD,HCD)及び合成フィルター手段(FB4,FB5,FB6)
    を含み、 前記デコード化装置(LED,HED,LCD,HCD)は、異なる周
    波数バンドのコード化信号を独立にデコード化し、各周
    波数バンドに対して1組の第1デコード化装置(LED,HE
    D)と第2デコード化装置(LCD,HCD)から成り、前記第
    1デコード化装置(LED,HED)は、前記第2コード化装
    置の組(LEC,HEC)と1対1に対応し、各々エンハンス
    情報ブロックをデコード化し、前記第2デコード化装置
    (LCD,HCD)は、コアー情報をデコード化し、 前記合成フィルター手段(FB4,FB5,FB6)は、異なる周
    波数バンドのデコード化信号を再結合し、元の音声信号
    のバンド幅特性に対応するバンド幅特性を有するデコー
    ド化信号を再構成し、 (ウ)前記ビットストリーム操作装置(BMU)は、前記
    デコーダー(AD)の上流に位置し、個々のマクロオブジ
    ェクト及び/又はオブジェクトに関するコード化信号の
    ビットレート又はバンド幅のスケーリングを行う、 上記デジタル音声信号を処理する装置において、 (i)第1コード化装置(LCC,HCC)及び各第2コード
    化装置(LEC,HEC)は、複数の第1及び第2コード化ア
    ルゴリズムから選択された第1及び第2コード化アルゴ
    リズムそれぞれをコード化される信号に適用するように
    構成可能であり、また、各第1デコード化装置(LEC,HE
    D)及び第2デコード化装置(LCD,HCD)は、第2及び第
    1コード化装置(LEC,HEC,LCC,HCC)によりそれぞれ適
    用される第2及び第1コード化アルゴリズムに対して夫
    々相補的な第1又は第2デコード化アルゴリズムをデコ
    ード化さる信号に適用するように構成可能であること、
    及び (ii)上記デジタル音声信号を処理する装置が、コード
    化されるべき音声信号を2ステージ分類するための分類
    装置(CR)をさらに含み、所与のフレーム中の信号は、
    前記2ステージ分類により複数の抽象クラスのうちの一
    つ、及び前記一つの抽象クラスにおける複数の具体クラ
    スのうちの一つに割り当てられ、前記具体クラスは、信
    号部分の特性に関係し且つフレーム中に存在する基本的
    な音声オブジェクトを識別し、前記抽象クラスは、音声
    信号の性質に関係し且つ基本的な音声オブジェクトの結
    合から得られるマクロオブジェクトを識別し、また、前
    記分類装置(CR)は、周波数バンド内への前記分離のた
    めの、選択された第1及び第2コード化装置(LCC,HCC,
    LEC,HEC)のイネーブル化のための、及び各コード化装
    置に適切なコード化アルゴリズムの選択のための制御パ
    ラメータとして分類に関する情報をフィルタリング手段
    (FB1...FB3)及び前記第1及び第2コード化装置(LC
    C,HCC,LEC,HEC)に与え、またコード化ビットストリー
    ムへの挿入のための制御パラメータとして分類に関する
    情報を前記結合手段(BCU)に与えること、 を特徴とする上記デジタル音声信号を処理する装置。
  33. 【請求項33】前記エンコーダー(AC)は8から64kHz
    までの任意の入力サンプリング周波数にてサンプリング
    された信号を受信し、さらに入力サンプリング周波数よ
    りすぐ大きい2のべき乗である内部サンプリング周波数
    にて前記信号をアップサンプリングするための手段(MX
    U)を含み、前記アップサンプリング手段(MXU)は8、
    16及び32kHzの入力サンプリング周波数に対して作動し
    ないことを特徴とする請求の範囲第32項記載の装置。
  34. 【請求項34】エンコーダー(AC)内の前記フィルター
    手段(FB1...FB3)は、コード化されるべき信号のサン
    プリング周波数とは独立に所定のバンド幅の周波数バン
    ドを発生するように構成できることを特徴とする請求の
    範囲第32項又は第33項記載の装置。
  35. 【請求項35】エンコーダー(AC)は、各フレームを複
    数のサブフレームに分割するための手段(SF1,SF2)を
    含み、該サブフレームの持続時間はフレーム持続時間の
    約数であり、そして、 フレームを分割するための手段(SF1,SF2)は、複数の
    持続時間値から選択可能な持続時間のサブフレームを発
    生してコード化遅延の複数の可能な値を得られるように
    構成可能であることを特徴とする請求の範囲第32項乃至
    第34項のいずれか1項に記載の装置。
  36. 【請求項36】各バンドの第1及び第2コード化装置
    (LCC,HCC,LEC,HEC)は、その他のバンドのコード化装
    置とは独立に構成可能であることを特徴とする請求の範
    囲第32項乃至第35項のいずれか1項に記載の装置。
  37. 【請求項37】第1コード化装置(LCC,HCC)は、線形
    予測分析コード化アルゴリズムを少なくともより低い周
    波数バンドの組の信号に対して適用し、且つ、形状/利
    得ベクトル量子コード化アルゴリズムをより高い周波数
    バンドの信号及び線形予測が用いられない信号に対して
    適用するように構成可能であることを特徴とする請求の
    範囲第32項乃至第36項のいずれか1項に記載の装置。
  38. 【請求項38】周波数バンドと関連する第2コード化装
    置(LEC,HEC)は、第1コード化アルゴリズムを同一周
    波数バンド内の信号に適用した結果得られる量子化エラ
    ーをコード化することを特徴とする請求の範囲第32項乃
    至第37項のいずれか1項に記載の装置。
  39. 【請求項39】第2コード化装置(LEC,HEC)は、形状
    /利得ベクトル量子コード化アルゴリズムを全ての周波
    数バンドに適用するように構成可能であることを特徴と
    する請求の範囲第32項乃至第38項のいずれか1項に記載
    の装置。
  40. 【請求項40】第1及び第2コード化装置(LCC,HCC,LE
    C,HEC)は、コード化信号に求められるバンド幅及びビ
    ットレートに依存し、ユーザー(US)及び伝送システム
    (SY)の要求に依存し、コード化されるべき信号のバン
    ド幅及びサンプリング周波数に依存せず、フレームごと
    にイネーブルされ且つ構成されることを特徴とする請求
    の範囲第32項乃至第39項のいずれか1項に記載の装置。
  41. 【請求項41】スピーチ信号処理において、 (ア)第1コード化装置(LCC)は、標準として定めら
    れたスピーチコード化アルゴリズムを周波数バンドの全
    体の組に適用するように構成され、 (イ)前記結合手段(BCU)は、標準として定められた
    アルゴリズムの適用により発生された情報を有する基本
    層を構築し且つ前記中間層の一つ又はトータル層に対応
    するコード化信号を構築するように構成され、それによ
    り標準として定められたコード化信号に対して更新され
    たコード化信号を得、 また、デコード化装置(LED,HED,LCD,HCD)は、デコー
    ド化アルゴリズムの可用性及び/又はデコード化信号に
    対して達成されるべき品質に依存して、基本層のみか又
    はコード化信号の全体をデコード化するように構成され
    る、 ことを特徴とする請求の範囲第32項乃至第40項のいずれ
    か1項に記載の装置。
  42. 【請求項42】前記第1及び第2コード化装置(LCC,HC
    C,LEC,HEC)のイネーブル化は前記結合手段(BCU)によ
    り制御されることを特徴とする請求の範囲第32項乃至第
    41項のいずれか1項に記載の装置。
  43. 【請求項43】第1コード化装置(LCC,HCC)のイネー
    ブル化のために、前記結合手段(BCU)は、異なる周波
    数バンド内の信号のエネルギーを評価する手段(BCL)
    であって、エネルギーが所定の閾値を越えるバンドと関
    連する第1コード化装置(LCC,HCC)のみをイネーブル
    する該手段(BCL)を含むことを特徴とする請求の範囲
    第32項乃至第43項のいずれか1項に記載の装置。
  44. 【請求項44】前記閾値は、処理装置(PMP)により知
    覚モデルを用いることで計算されることを特徴とする請
    求の範囲第43項記載の装置。
  45. 【請求項45】第2コード化装置(LEC,HEC)のイネー
    ブル化のために、前記結合手段(BCU)は、すぐ前の第
    2コード化装置(LEC,HEC)又は同じバンドと関連する
    第1コード化装置(LCC,HCC)の出力での品質に対し
    て、各第2コード化装置(LEC,HEC)の出力でのコード
    化信号の品質の向上を評価する手段(BCL)を含み、最
    高の品質向上を与える第2コード化装置のみがイネーブ
    ルされることを特徴とする請求の範囲第32項乃至第44項
    のいずれか1項に記載の装置。
  46. 【請求項46】品質向上のための前記手段(BCL)は、
    前記処理装置(PMP)により与えられる資格モデルに関
    する情報を利用することを特徴とする請求の範囲第44項
    及び第45項に記載の装置。
  47. 【請求項47】前記結合手段(BCU)は、個々のコード
    化装置(LCC,HCC,LEC,HEC)により作られ且つ1フレー
    ム内の単一音声信号に対する所与の具体クラスに関する
    全情報を含んだビットパケットをオブジェクトビットス
    トリームに結合し、且つ、前記フレーム内の前記音声信
    号の異なるオブジェクトのビットストリームをマクロオ
    ブジェクトビットストリーム(OB11...OB21)に結合す
    るように構成され、 該マクロオブジェクトビットストリームは、分類結果及
    び少なくとも第1コード化装置(LCC,HCC)がイネーブ
    ルされる周波数バンドについての情報を含んだオーバー
    ヘッドビットの第1グループ(OVH1,OVH2);コアー情
    報のパセット;及び第2コード化装置(LEC,HEC)がイ
    ネーブル化されているならば、異なる周波数バンドに対
    してイネーブル化されたコード化装置の数及びエンハン
    ス情報ブロックのパケットに関する情報を含んだオーバ
    ーヘッドビットの第2グループ(OVH3)から成り、 また、前記結合手段(BCU)は、通信のセットアップフ
    ェーズ中ではコーダー(AD)と同様にデコーダー(AD)
    を構成するのに必要な全てのサービス情報を転送し、且
    つ、通信中ではフレーム中にコード化された異なるマク
    ロオブジェクトのビットストリームを順に転送するよう
    に構成される、 ことを特徴とする請求の範囲第32項乃至第46項のいずれ
    か1項に記載の装置。
  48. 【請求項48】結合手段(BCU)は、マクロオブジェク
    トビットストリーム(OB11...OB21)内のビットストリ
    ームを周波数バンドの順に最低周波数バンドから開始し
    て伝送するように構成されることを特徴とする請求の範
    囲第47項記載の装置。
  49. 【請求項49】結合手段(BCU)は、マクロオブジェク
    トビットストリーム(OB11...OB21)内のビットパケッ
    トをランクの順に最高ランクのビットパケットから開始
    して伝送するように構成され、該ランクは、パケットが
    コアー情報に属する場合には異なるバンドのエネルギー
    値に関係し、パケットがエンハンス情報に属する場合に
    は品質向上の実体に関係することを特徴とする請求の範
    囲第48項記載の装置。
  50. 【請求項50】前記操作装置(BMU)は、ビットレート
    又はバンド幅のステップ状スケーリングを実行するよう
    に構成され、これは、第2コード化装置(LEC,HEC)に
    より与えられるパケットから開始して各スケーリングス
    テップにてビットパケットを抑制すること、及び第2コ
    ード化装置(LEC,HEC)により与えられるパケットがビ
    ットストリーム内に存在しないときは第1コード化装置
    (LCC,HCC)により与えられるパケットで続けることに
    より行われることを特徴とする請求の範囲第32項乃至第
    49項のいずれか1項に記載の装置。
  51. 【請求項51】前記ビットストリーム操作装置(BMU)
    は、個別に選択されたフレーム内の個々のオブジェクト
    又はマクロオブジェクトのビットストリームを操作する
    ように構成されることを特徴とする請求の範囲第50項記
    載の装置。
  52. 【請求項52】前記スケーリングのために、前記ビット
    ストリーム操作装置(BMU)は、 (ア)フレーム内にて所望のビットレートに対する該又
    は各々のマクロオブジェクトに割り当て可能なバンド幅
    を決め、 (イ)前記バンド幅を越えて存在する周波数バンドに関
    するビットパケットを除去し、 (ウ)所望のビットレートが達成されるか又はコアー情
    報のみが残されるまで、保持されてきた周波数バンドの
    各々に対する第2コード化装置(LEC,HEC)により与え
    られる1つのビットパケットを、最高周波数のバンドか
    ら開始して除去し、該除去は必要ならば周期的に繰り返
    し、 (エ)1以上の周波数バンドに対して第1コード化装置
    (LCC,HCC)により与えられるビットパケットを最高周
    波数バンドから開始して除去する、 ように構成されることを特徴とする請求の範囲第50項乃
    至第51項のいずれか1項に記載の装置。
  53. 【請求項53】前記スケーリングのために、前記ビット
    ストリーム操作装置(BMU)は、 (ア)フレーム内で所望のビットレートに対する該又は
    各々のマクロオブジェクトに割り当て可能なバンド幅を
    決め、 (イ)前記バンド幅を越えて存在する周波数バンドに関
    するビットパケットを除去し、 (ウ)第2コード化装置(LEC,HEC)により与えられる
    ビットパケットを最低ランクのパケットから開始して除
    去し、 (エ)1以上の周波数バンドに対して第1コード化装置
    (LCC,HCC)により与えられるビットパケットを最低エ
    ネルギーバンドから開始して除去する、 ように構成されることを特徴とする請求の範囲第50項乃
    至第52項のいずれか1項に記載の装置。
  54. 【請求項54】前記ビットストリーム操作装置(BMU)
    は、個々のマクロオブジェクト内の所定のコード化パラ
    メータの値を変えるように構成されることを特徴とする
    請求の範囲第50項乃至第53項のいずれか1項に記載の装
    置。
  55. 【請求項55】前記ビットストリーム操作装置(BMU)
    は、全体のビットレートが所定のビットレートを越える
    複数のコンカレントマクロオブジェクトからの寄与を含
    めて所定のビットレートにて単一ビットストリームを構
    築するように、構成されることを特徴とする請求の範囲
    第50項乃至第54項のいずれか1項に記載の装置。
  56. 【請求項56】前記ビットストリーム操作装置(BMU)
    は、単一ビットストリームを構築する前に個々のマクロ
    オブジェクトのレベルを操作し且つ操作されたレベルに
    基づいて個々のマクロオブジェクトの寄与に対するビッ
    トレート及び/又はバンド幅を選択するように、構成さ
    れることを特徴とする請求の範囲第55項記載の装置。
JP51629697A 1995-10-27 1996-10-25 音声信号をコード化、操作及びデコード化する方法及び装置 Expired - Fee Related JP3168012B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
IT95TO000869A IT1281001B1 (it) 1995-10-27 1995-10-27 Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
IT95A000869 1995-10-27
PCT/EP1996/004669 WO1997015983A1 (en) 1995-10-27 1996-10-25 Method of and apparatus for coding, manipulating and decoding audio signals

Publications (2)

Publication Number Publication Date
JPH10512423A JPH10512423A (ja) 1998-11-24
JP3168012B2 true JP3168012B2 (ja) 2001-05-21

Family

ID=11413922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP51629697A Expired - Fee Related JP3168012B2 (ja) 1995-10-27 1996-10-25 音声信号をコード化、操作及びデコード化する方法及び装置

Country Status (8)

Country Link
US (1) US6108626A (ja)
EP (1) EP0857375B1 (ja)
JP (1) JP3168012B2 (ja)
AT (1) ATE183346T1 (ja)
DE (1) DE69603743T2 (ja)
ES (1) ES2135931T3 (ja)
IT (1) IT1281001B1 (ja)
WO (1) WO1997015983A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170110738A (ko) * 2013-09-17 2017-10-11 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
KR20200115685A (ko) * 2013-09-17 2020-10-07 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치

Families Citing this family (155)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9603582D0 (en) 1996-02-20 1996-04-17 Hewlett Packard Co Method of accessing service resource items that are for use in a telecommunications system
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
JP3329216B2 (ja) * 1997-01-27 2002-09-30 日本電気株式会社 音声符号化装置及び音声復号装置
US7024355B2 (en) 1997-01-27 2006-04-04 Nec Corporation Speech coder/decoder
KR100251453B1 (ko) * 1997-08-26 2000-04-15 윤종용 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크
US6049537A (en) * 1997-09-05 2000-04-11 Motorola, Inc. Method and system for controlling speech encoding in a communication system
DE19743662A1 (de) 1997-10-02 1999-04-08 Bosch Gmbh Robert Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms
DE19804581C2 (de) * 1998-02-05 2000-08-17 Siemens Ag Verfahren und Funk-Kommunikationssystem zur Übertragung von Sprachinformation
US6141639A (en) * 1998-06-05 2000-10-31 Conexant Systems, Inc. Method and apparatus for coding of signals containing speech and background noise
EP1021044A1 (en) * 1999-01-12 2000-07-19 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding or decoding audio or video frame data
EP1020998B1 (en) * 1999-01-12 2009-03-18 Thomson Licensing Method and apparatus for encoding audio frame data
US6661793B1 (en) 1999-01-19 2003-12-09 Vocaltec Communications Ltd. Method and apparatus for reconstructing media
US6842724B1 (en) * 1999-04-08 2005-01-11 Lucent Technologies Inc. Method and apparatus for reducing start-up delay in data packet-based network streaming applications
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
US7315815B1 (en) * 1999-09-22 2008-01-01 Microsoft Corporation LPC-harmonic vocoder with superframe structure
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
CA2442597C (en) 2000-03-27 2011-11-01 Transcept Opencell, Inc. Multi-protocol distributed wireless system architecture
FI115329B (fi) * 2000-05-08 2005-04-15 Nokia Corp Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin
US6704545B1 (en) 2000-07-19 2004-03-09 Adc Telecommunications, Inc. Point-to-multipoint digital radio frequency transport
DE10063845A1 (de) * 2000-12-21 2002-06-27 Paraworld Ag Verfahren und Vorrichtung zur prioritätsgesteuerten Übertragung digitaler Informationen für audiovisuelle Wiedergabegeräte
SE0004838D0 (sv) * 2000-12-22 2000-12-22 Ericsson Telefon Ab L M Method and communication apparatus in a communication system
US6694293B2 (en) * 2001-02-13 2004-02-17 Mindspeed Technologies, Inc. Speech coding system with a music classifier
BR0204834A (pt) * 2001-04-18 2003-06-10 Koninkl Philips Electronics Nv Métodos de codificação de um sinal de áudio e de decodificação de uma corrente de áudio, codificador de áudio, aparelho de reprodução de áudio, sistema de áudio, corrente de áudio, e, meio de armazenamento
JP3636094B2 (ja) * 2001-05-07 2005-04-06 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US7272555B2 (en) * 2001-09-13 2007-09-18 Industrial Technology Research Institute Fine granularity scalability speech coding for multi-pulses CELP-based algorithm
JP4245288B2 (ja) * 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
US6785645B2 (en) 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
US6647366B2 (en) * 2001-12-28 2003-11-11 Microsoft Corporation Rate control strategies for speech and music coding
WO2003073741A2 (en) * 2002-02-21 2003-09-04 The Regents Of The University Of California Scalable compression of audio and other signals
US7184728B2 (en) 2002-02-25 2007-02-27 Adc Telecommunications, Inc. Distributed automatic gain control system
KR100711989B1 (ko) * 2002-03-12 2007-05-02 노키아 코포레이션 효율적으로 개선된 스케일러블 오디오 부호화
CN1647156B (zh) * 2002-04-22 2010-05-26 皇家飞利浦电子股份有限公司 参数编码方法、参数编码器、用于提供音频信号的设备、解码方法、解码器、用于提供解码后的多声道音频信号的设备
US6831901B2 (en) * 2002-05-31 2004-12-14 Opencell Corporation System and method for retransmission of data
DE10245107B4 (de) * 2002-09-27 2006-01-26 Siemens Ag Voice Activity Detection auf Basis von unüberwacht trainierten Clusterverfahren
KR100841096B1 (ko) * 2002-10-14 2008-06-25 리얼네트웍스아시아퍼시픽 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
US8958789B2 (en) 2002-12-03 2015-02-17 Adc Telecommunications, Inc. Distributed digital antenna system
US7707315B2 (en) * 2003-05-27 2010-04-27 Harris Corporation System and method for propagating data
GB2403634B (en) * 2003-06-30 2006-11-29 Nokia Corp An audio encoder
JP4000095B2 (ja) * 2003-07-30 2007-10-31 株式会社東芝 音声認識方法、装置及びプログラム
US20050091044A1 (en) * 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
US20050091041A1 (en) * 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
US8019449B2 (en) 2003-11-03 2011-09-13 At&T Intellectual Property Ii, Lp Systems, methods, and devices for processing audio signals
US7450570B1 (en) 2003-11-03 2008-11-11 At&T Intellectual Property Ii, L.P. System and method of providing a high-quality voice network architecture
US6906560B1 (en) 2004-01-20 2005-06-14 Harris Corporation Phase-continuous frequency synthesizer
KR100629997B1 (ko) * 2004-02-26 2006-09-27 엘지전자 주식회사 오디오 신호의 인코딩 방법
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
DE602005027837D1 (de) * 2004-05-13 2011-06-16 Qualcomm Inc Zustellung von informationen über einen kommunikationskanal
DE102004047032A1 (de) * 2004-09-28 2006-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Bezeichnen von verschiedenen Segmentklassen
DE102004047069A1 (de) 2004-09-28 2006-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ändern einer Segmentierung eines Audiostücks
US7787854B2 (en) * 2005-02-01 2010-08-31 Adc Telecommunications, Inc. Scalable distributed radio network
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1905002B1 (en) 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US20070008939A1 (en) * 2005-06-10 2007-01-11 Adc Telecommunications, Inc. Providing wireless coverage into substantially closed environments
BRPI0612579A2 (pt) * 2005-06-17 2012-01-03 Matsushita Electric Ind Co Ltd pàs-filtro, decodificador e mÉtodo de pàs-filtraÇço
CA2621175C (en) 2005-09-13 2015-12-22 Srs Labs, Inc. Systems and methods for audio processing
WO2007040363A1 (en) * 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
EP1974348B1 (en) 2006-01-19 2013-07-24 LG Electronics, Inc. Method and apparatus for processing a media signal
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
KR20080093024A (ko) 2006-02-07 2008-10-17 엘지전자 주식회사 부호화/복호화 장치 및 방법
EP2005787B1 (en) * 2006-04-03 2012-01-25 Srs Labs, Inc. Audio signal processing
US7805073B2 (en) 2006-04-28 2010-09-28 Adc Telecommunications, Inc. Systems and methods of optical path protection for distributed antenna systems
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8150065B2 (en) * 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US7844273B2 (en) * 2006-07-14 2010-11-30 Lgc Wireless, Inc. System for and method of for providing dedicated capacity in a cellular network
US7848770B2 (en) 2006-08-29 2010-12-07 Lgc Wireless, Inc. Distributed antenna communications system and methods of implementing thereof
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
MX2008012250A (es) 2006-09-29 2008-10-07 Lg Electronics Inc Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
RU2420026C2 (ru) * 2006-09-29 2011-05-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства для кодирования и декодирования аудиосигналов на основе объектов
US7817958B2 (en) 2006-12-22 2010-10-19 Lgc Wireless Inc. System for and method of providing remote coverage area for wireless communications
FR2911456B1 (fr) * 2007-01-11 2009-12-11 Medialive Procede et systeme de distribution securisee de donnees numeriques
US8583100B2 (en) 2007-01-25 2013-11-12 Adc Telecommunications, Inc. Distributed remote base station system
US8737454B2 (en) 2007-01-25 2014-05-27 Adc Telecommunications, Inc. Modular wireless communications platform
WO2008100100A1 (en) 2007-02-14 2008-08-21 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
US8005050B2 (en) 2007-03-23 2011-08-23 Lgc Wireless, Inc. Localization of a mobile device in distributed antenna communications system
US20080236393A1 (en) * 2007-03-28 2008-10-02 Adc Dsl Systems, Inc. Filter assembly
US20080240090A1 (en) * 2007-03-28 2008-10-02 Adc Dsl Systems, Inc. Programmable high speed crossbar switch
US8010116B2 (en) 2007-06-26 2011-08-30 Lgc Wireless, Inc. Distributed antenna communications system
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
US8295494B2 (en) 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
US9112547B2 (en) 2007-08-31 2015-08-18 Adc Telecommunications, Inc. System for and method of configuring distributed antenna communications system
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
EP2198424B1 (en) * 2007-10-15 2017-01-18 LG Electronics Inc. A method and an apparatus for processing a signal
US8209190B2 (en) 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
TWI351683B (en) * 2008-01-16 2011-11-01 Mstar Semiconductor Inc Speech enhancement device and method for the same
CN101221766B (zh) * 2008-01-23 2011-01-05 清华大学 音频编码器切换的方法
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
ES2464722T3 (es) * 2008-03-04 2014-06-03 Lg Electronics Inc. Método y aparato para procesar una señal de audio
US7889103B2 (en) 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8639519B2 (en) 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
US20090314154A1 (en) * 2008-06-20 2009-12-24 Microsoft Corporation Game data generation based on user provided song
US8310963B2 (en) * 2008-06-24 2012-11-13 Adc Telecommunications, Inc. System and method for synchronized time-division duplex signal switching
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US9390167B2 (en) 2010-07-29 2016-07-12 Soundhound, Inc. System and methods for continuous audio matching
US8219408B2 (en) 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8140342B2 (en) 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US9001811B2 (en) 2009-05-19 2015-04-07 Adc Telecommunications, Inc. Method of inserting CDMA beacon pilots in output of distributed remote antenna nodes
US8238538B2 (en) 2009-05-28 2012-08-07 Comcast Cable Communications, Llc Stateful home phone service
KR101805212B1 (ko) * 2009-08-14 2017-12-05 디티에스 엘엘씨 객체-지향 오디오 스트리밍 시스템
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8472579B2 (en) 2010-07-28 2013-06-25 Adc Telecommunications, Inc. Distributed digital reference clock
US9047371B2 (en) 2010-07-29 2015-06-02 Soundhound, Inc. System and method for matching a query against a broadcast stream
CA2813859C (en) 2010-10-06 2016-07-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac)
US8532242B2 (en) 2010-10-27 2013-09-10 Adc Telecommunications, Inc. Distributed antenna system with combination of both all digital transport and hybrid digital/analog transport
US8462683B2 (en) 2011-01-12 2013-06-11 Adc Telecommunications, Inc. Distinct transport path for MIMO transmissions in distributed antenna systems
WO2012122397A1 (en) 2011-03-09 2012-09-13 Srs Labs, Inc. System for dynamically creating and rendering audio objects
US9035163B1 (en) 2011-05-10 2015-05-19 Soundbound, Inc. System and method for targeting content based on identified audio and multimedia
NO2669468T3 (ja) * 2011-05-11 2018-06-02
US8693342B2 (en) 2011-10-28 2014-04-08 Adc Telecommunications, Inc. Distributed antenna system using time division duplexing scheme
US8666753B2 (en) * 2011-12-12 2014-03-04 Motorola Mobility Llc Apparatus and method for audio encoding
US10957310B1 (en) 2012-07-23 2021-03-23 Soundhound, Inc. Integrated programming framework for speech and text understanding with meaning parsing
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
WO2014099285A1 (en) * 2012-12-21 2014-06-26 Dolby Laboratories Licensing Corporation Object clustering for rendering object-based audio content based on perceptual criteria
CA2914104C (en) 2013-02-22 2022-12-13 Adc Telecommunications, Inc. Master reference for base station network interface sourced from distributed antenna system
KR102228617B1 (ko) 2013-02-22 2021-03-15 콤스코프 테크놀로지스 엘엘씨 범용 원격 라디오 헤드
US9558785B2 (en) 2013-04-05 2017-01-31 Dts, Inc. Layered audio coding and transmission
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9787457B2 (en) 2013-10-07 2017-10-10 Commscope Technologies Llc Systems and methods for integrating asynchronous signals in distributed antenna system with direct digital interface to base station
CN111009249B (zh) 2013-10-18 2021-06-04 弗劳恩霍夫应用研究促进协会 编码器/解码器、编码/解码方法和非瞬时性存储介质
US10580417B2 (en) 2013-10-22 2020-03-03 Industry-Academic Cooperation Foundation, Yonsei University Method and apparatus for binaural rendering audio signal using variable order filtering in frequency domain
US9507849B2 (en) 2013-11-28 2016-11-29 Soundhound, Inc. Method for combining a query and a communication command in a natural language computer system
EP4246513A3 (en) 2013-12-23 2023-12-13 Wilus Institute of Standards and Technology Inc. Audio signal processing method and parameterization device for same
US9292488B2 (en) 2014-02-01 2016-03-22 Soundhound, Inc. Method for embedding voice mail in a spoken utterance using a natural language processing computer system
EP3108627A4 (en) 2014-02-18 2017-10-11 CommScope Technologies LLC Selectively combining uplink signals in distributed antenna systems
US11295730B1 (en) 2014-02-27 2022-04-05 Soundhound, Inc. Using phonetic variants in a local context to improve natural language understanding
WO2015142073A1 (ko) 2014-03-19 2015-09-24 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
CN104934034B (zh) 2014-03-19 2016-11-16 华为技术有限公司 用于信号处理的方法和装置
US9860668B2 (en) 2014-04-02 2018-01-02 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and device
US9564123B1 (en) 2014-05-12 2017-02-07 Soundhound, Inc. Method and system for building an integrated user profile
CN106471754B (zh) 2014-06-11 2019-09-20 康普技术有限责任公司 通过分布式天线系统的比特率高效传输
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
US10499269B2 (en) 2015-11-12 2019-12-03 Commscope Technologies Llc Systems and methods for assigning controlled nodes to channel interfaces of a controller

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3171990D1 (en) * 1981-04-30 1985-10-03 Ibm Speech coding methods and apparatus for carrying out the method
CA1292071C (en) * 1985-06-28 1991-11-12 Tomohiko Taniguchi Coding transmission equipment for carrying out coding with adaptive quantization
US4980917A (en) * 1987-11-18 1990-12-25 Emerson & Stern Associates, Inc. Method and apparatus for determining articulatory parameters from speech data
IT1241358B (it) * 1990-12-20 1994-01-10 Sip Sistema di codifica del segnale vocale con sottocodice annidato
IT1270938B (it) * 1993-05-14 1997-05-16 Cselt Centro Studi Lab Telecom Procedimento per il controllo della trasmissione su uno stesso canale di flussi informativi a velocita' variabile in sistemi di comunicazione tra mezzi mobili, e sistema utilizzante tale procedimento
US5592588A (en) * 1994-05-10 1997-01-07 Apple Computer, Inc. Method and apparatus for object-oriented digital audio signal processing using a chain of sound objects

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
「マルチメディア符号化の国際標準」,丸善株式会社 発行 第4刷,(平成5.4.15)p.180−185
Kazuhiro K.,Masashi O.;"VARIABLE RATE EMBEDDED ADPCM CODING FOR PACKET SPEECH ON ATM NETWORKS" 1990 IEEE GLOBECOM,VOL.1(91.6.4受入)p.523−527
Micheael H.;"OBJECT−ORIENTED ANALYSIS SYNTHESIS CODING BASED ON MOVING TWO−DIMENSIONAL OBJECTS"Signal Processing: IMAGE COMMUNICATION,Vol.3,No.1(91.1.16受入)p.409−428

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170110738A (ko) * 2013-09-17 2017-10-11 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
KR20180004317A (ko) * 2013-09-17 2018-01-10 주식회사 윌러스표준기술연구소 멀티미디어 신호 처리 방법 및 장치
KR20180004316A (ko) * 2013-09-17 2018-01-10 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
KR102159990B1 (ko) * 2013-09-17 2020-09-25 주식회사 윌러스표준기술연구소 멀티미디어 신호 처리 방법 및 장치
KR20200115685A (ko) * 2013-09-17 2020-10-07 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
KR102163266B1 (ko) * 2013-09-17 2020-10-08 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
KR102215129B1 (ko) * 2013-09-17 2021-02-10 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
KR20210016651A (ko) * 2013-09-17 2021-02-16 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
KR102294100B1 (ko) 2013-09-17 2021-08-26 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
KR102317732B1 (ko) * 2013-09-17 2021-10-27 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치

Also Published As

Publication number Publication date
DE69603743T2 (de) 2000-06-08
ATE183346T1 (de) 1999-08-15
IT1281001B1 (it) 1998-02-11
US6108626A (en) 2000-08-22
ES2135931T3 (es) 1999-11-01
ITTO950869A0 (ja) 1995-10-27
DE69603743D1 (de) 1999-09-16
ITTO950869A1 (it) 1997-04-28
EP0857375B1 (en) 1999-08-11
EP0857375A1 (en) 1998-08-12
WO1997015983A1 (en) 1997-05-01
JPH10512423A (ja) 1998-11-24

Similar Documents

Publication Publication Date Title
JP3168012B2 (ja) 音声信号をコード化、操作及びデコード化する方法及び装置
AU2016325879B2 (en) Method and system for decoding left and right channels of a stereo sound signal
KR101303145B1 (ko) 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더
CA2327627C (en) Process for processing at least one coded binary audio flux organized into frames
EP1483759B1 (en) Scalable audio coding
US6502069B1 (en) Method and a device for coding audio signals and a method and a device for decoding a bit stream
JP5363488B2 (ja) マルチチャネル・オーディオのジョイント強化
JP5536674B2 (ja) 入力データストリームのミキシング及びそこからの出力データストリームの生成
US6356545B1 (en) Internet telephone system with dynamically varying codec
US6295009B1 (en) Audio signal encoding apparatus and method and decoding apparatus and method which eliminate bit allocation information from the encoded data stream to thereby enable reduction of encoding/decoding delay times without increasing the bit rate
KR100955627B1 (ko) 고속 래티스 백터 양자화
WO2004098105A1 (en) Support of a multichannel audio extension
US20080140393A1 (en) Speech coding apparatus and method
JP2010170142A (ja) ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置
WO2006000842A1 (en) Multichannel audio extension
JPWO2009144953A1 (ja) 符号化装置、復号装置およびこれらの方法
KR20090007396A (ko) 손실 인코딩된 데이터 스트림 및 무손실 확장 데이터 스트림을 이용하여 소스 신호를 무손실 인코딩하기 위한 방법 및 장치
JP2017062477A (ja) 方法、符号化器、復号化器、及び移動体機器
Kovesi et al. A scalable speech and audio coding scheme with continuous bitrate flexibility
Ehret et al. Audio coding technology of exac
USRE41370E1 (en) Adaptive transform coding system, adaptive transform decoding system and adaptive transform coding/decoding system
Yu et al. A scalable lossy to lossless audio coder for MPEG-4 lossless audio coding
JPH0335300A (ja) 音声符号・復号化伝送方式
JPH11352999A (ja) 音声圧縮符号化装置
Cellario et al. An object oriented generic audio coding architecture

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090309

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090309

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100309

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100309

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110309

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120309

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees