JP2001519552A - ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置 - Google Patents

ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置

Info

Publication number
JP2001519552A
JP2001519552A JP2000515343A JP2000515343A JP2001519552A JP 2001519552 A JP2001519552 A JP 2001519552A JP 2000515343 A JP2000515343 A JP 2000515343A JP 2000515343 A JP2000515343 A JP 2000515343A JP 2001519552 A JP2001519552 A JP 2001519552A
Authority
JP
Japan
Prior art keywords
core
data stream
audio data
enhancement
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000515343A
Other languages
English (en)
Inventor
ミュラー イェルク−マルティン
ヴェヒター ベルトラム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of JP2001519552A publication Critical patent/JP2001519552A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 本発明は、ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置に関する。本発明はデータ通信の分野に適用できる。本発明の課題は、多方面で用いることができ使用可能な伝送レートに関して高度なフレキシビリティをもつ方法および装置を提供することである。この課題は、コアコーデック(100)においてコアパラメータ(102)を求めてオーディオデータストリームを圧縮し、後置接続された少なくとも1つのエンハンスメント段(110)における符号化を改善するステップをもつ、ビットスケーラブルなオーディオデータストリームの生成方法において、エンハンスメント段(110)における改善がコアパラメータ(102)により制御される。

Description

【発明の詳細な説明】
【0001】 従来の技術 本発明は、ビットレートスケーラブルなオーディオデータストリームを生成す
る方法および装置に関する。本発明は、データ通信の分野たとえばオーディオデ
ータ通信の分野に適用可能である。
【0002】 データ通信の分野における周知の問題点は、伝送すべきデータ信号はデータ源
においては高いデータレートたとえば毎秒64kbitで使用できるが、伝送ま
たは処理のために使うことのできるデータチャネルは、伝送データをそれよりも
低いデータレートたとえば毎秒32kbitでしか伝送できないことである。こ
の場合、データをまずはじめに高いデータレートで復号し、ついでそれよりも低
いデータレートで新たに符号化しなければならない。これにより高度な機器技術
的および計算技術的な煩雑さが引き起こされる。その理由は殊に、最近のデータ
ネットワークではデータレートは一定ではなく可変であって、データネットワー
クの個々の負荷状況に合わせて整合されるからである。これに比べていっそう好
適であるのは、ビットレートスケーラブルなデータストリームを供給することで
あり、このデータストリームにおいて、そのつど伝送チャネルで使えるデータレ
ートに従って、利用可能なデータビットの一部分だけが伝送される。ビットレー
トスケーラブルなオーディオデータストリームを生成するためのそれ相応の方法
は目下、標準化作業の枠組みにおいて殊に、たとえばMPEG4(Moving Pictu
re Expert Group)の標準化の枠組みにおいて、世界規模で着手されている。殊 に、MPEG4標準化されて開発されたコーデックCODEC(COder/DECoder )によって、ビットレートスケーラビリティの機能を保証しなければならない。
【0003】 したがって本発明の課題は、ビットレートスケーラブルなオーディオデータス
トリームを生成する方法および装置において、多方面にわたり用いることができ
、利用可能な伝送レートが低くても良好な伝送品質が保証され、利用可能な伝送
データレートへの整合に関して僅かなコストで高度なフレキシビリティが得られ
るようにすることである。
【0004】 本発明によればこの課題は、独立請求項に記載の方法、装置ならびに用途によ
り解決される。従属請求項には本発明の格別な実施形態が示されている。
【0005】 上記の課題は、コアコーデック内でコアパラメータを求めることでオーディオ
入力データストリームを圧縮するステップと、後置接続された少なくとも1つの
エンハンスメント段において符号化を改善するステップをもつ方法において、エ
ンハンスメント段における改善をコアパラメータにより制御することにより解決
される。本発明による方法の場合、コアコーデックがコアユニットを成し、到来
する入力データストリームをたとえば2.4kbit/sまたは6kbit/s
の低いビットレートで符号化する。コアコーデックに続いて、任意の個数のいわ
ゆるエンハンスメント段または改善段(Verbesserungsstufe)が設けられており
、それらは用途に応じて1,2,3または4kbit/sのデータレートで符号
化する。この方法の利点は、任意の個数のエンハンスメント段を消去してもビッ
トストリームの他の部分に対し影響が及ぼされないことである。基本的な条件は
、利用可能な伝送システムが少なくともコアコーデックのビットレートを保証す
ることである。コアコーデックは到来するオーディオ信号をパラメータ化し、た
とえば音の高さ、有声音/無声音または音量などのパラメータを求める。たとえ
ばITU−T G.723.1(ITU, International Telecommunication Union )によるコアコーデックを用いることができる。本発明において有利であるのは
、コアコーデックにより求められたコアパラメータが、後置接続されたエンハン
スメント段を制御することである。それというのも、これによってエンハンスメ
ント段の効率を格段に高めることができるからである。
【0006】 本発明の1つの実施形態によればこの方法は、エンハンスメント段においてベ
クトル符号化を行い、コアパラメータがコードブックの選択を制御するように構
成されている。これが有利であるのは、周期的なオーディオ区間において非周期
的なオーディオ区間とは異なるコードブックをベクトル符号化のために用いるこ
とができる理由による。しかも信号エネルギー(音量)の符号化のために、コア
コーデックのエネルギーパラメータがそのまま用いられ、その結果、ビットレー
トが著しく節約されるようになる。コアパラメータはいずれにせよ受信機へ伝送
されるので、それを利用することができる。
【0007】 1つの実施形態によればこの方法は、オーディオ入力データストリームを変換
するステップと、コアコーデックにより生成された合成オーディオ信号を変換す
るステップと、変換された合成オーディオ信号を変換されたオーディオデータス
トリームと結合するステップをもつように構成されている。これにより有利には
僅かなコストかつ高い精度で、コアコーデックにより圧縮されたオーディオ信号
と元の信号との差が求められる。最も簡単な事例では、結合にあたり差分形成を
行うことができるが、たとえば改善された適合のためもとのスペクトルへコアス
ペクトルを整合させるなど、それよりも複雑な演算を含めることもできる。最後
に挙げた本発明の実施形態の場合、整合に用いられる結合パラメータを受信機へ
伝送する。
【0008】 本発明の1つの実施形態によればこの方法は以下のように構成されている。す
なわち、コアコーデックが入力信号を少なくとも2つのサブフレームに分割し、
変換としてコアコーデックのサブフレームと同期して実行される周波数変換を行
い、周波数変換によりサブフレームごとにそれぞれ1つのスペクトルベクトルを
生成する変換を行い、各スペクトルベクトルを2つのサブバンドに従い少なくと
も2つのサブベクトルに分割し、各エンハンスメント段はサブバンドのうちの1
つを改善する。ここで用いられる周波数変換およびサブバンドへの分割により得
られる利点とは、本発明による方法により、客観的な判定基準に従ってビットレ
ートスケーリングにおける高い効率が実現されるだけでなく、主観的な判定基準
たとえば人間の耳の音響心理的境界条件なども考慮されることである。どのサブ
バンドを改善するのかは、リソース割り当てユニットにより定められる。この決
定は既述のように、どの周波数帯域が主観的に重要であるのかを判定する心理音
響学的なモデルによって行うこともできるし、あるいはSN比の測定によって行
うこともできる。
【0009】 本発明の1つの格別な実施形態によればこの方法は、段ごとに改善されたサブ
バンドのパラメータセットとアドレスを伝送するように構成されている。割り当
てユニットはサブバンドをそれらの重要度の順序で改善するので、本発明のこの
実施形態によれば、改善されたビットがビットストリーム中においてそれらの重
要度の順序で格納される、という利点が得られる。各々の段にはアドレスが設け
られているので、受信機においてそれを問題なく高い信頼性をもって適正に対応
づけることができる。この場合、スケーリングはことのほか問題なく、いかなる
付加的なコストもかけることなく単にそれ相応の個数のエンハンスメント段を抑
圧するだけで可能となり、その際、最も重要ではない段から始まるように構成さ
れている。さらに有利であるのは、このスケーリングを伝送区間の任意のポイン
トにおいて行うことができることである。この場合、残されたビットストリーム
の付加的な変更は不要である。
【0010】 本発明の1つの格別な実施形態によればこの方法は、各サブバンドごとに、伝
送すべきビットストリームにおいて個々のサブバンドのためにいくつのエンハン
スメント段が相前後して存在するのかを記憶し、サブバンドの個々のエンハンス
メント段の相対的な意味内容を求めるための付加情報を記憶し、ビットストリー
ムと付加情報を伝送前にビットストリーム操作ユニットにおいてまとめるように
構成されている。
【0011】 本発明のさらに別の格別な実施形態によればこの方法は、受信した隣接サブバ
ンドから計算により、たとえば補間により、受信機側でサブバンドを生成するよ
うに構成されている。計算のために補間以外にも他の数学的手法が考慮され、た
とえば伝送されたデータストリームの特性を考慮した統計的手法などが考慮され
る。この場合、伝送障害または伝送中断に基づき受信機側に到来しなかったり適
時には到来しなかったサブバンドを再構成できる点で有利であるし、あるいはそ
れどころか、個々のサブバンドまたはデータパケットが伝送経路上で遅延したと
きに、サブバンドをあらかじめ計算できる点で有利である。
【0012】 本発明には、ビットレートスケーラブルなオーディオデータストリームのため
の装置も含まれており、これにはコアパラメータを求めることでオーディオ入力
データストリームを圧縮するコアコーデックと、このコアコーデックに後置接続
されたエンハンスメント段が設けられている。この場合、コアコーデックはエン
ハンスメント段と接続されており、コアパラメータによりエンハンスメント段が
制御されることを特徴としている。この種の装置はたとえば、既述の方法のうち
の1つを実施するとき、たとえばどのサブバンドを改善するのかを制御する割り
当て制御部を有するような方法を実施するとき、本発明に含まれる。本発明によ
る装置について、本発明による方法の説明の枠内で先に挙げた利点が相応にあて
はまる。
【0013】 さらに本発明には、エンハンスメント段における符号化の改善を制御するコア
コーデックのコアパラメータの使用法も含まれる。
【0014】 ここで殊に有利であるのは、入力信号のパラメータ化を表すものでありコアコ
ーデックにより求められ伝送されるコアパラメータを、エンハンスメント段制御
のために有効に使用することができ、それによりたとえば主観的な伝送品質がす
でに1番目のエンハンスメント段から著しく改善されることである。
【0015】 さらに本発明によれば、制御情報の格納されているデータ担体において、その
制御情報により、電子計算装置または既述の装置のうちの1つの装置内で先に述
べた方法の実行が制御されることを特徴としている。この場合、データ担体は任
意の形式で制御情報を格納することができ、たとえば機械的、光学的、磁気的ま
たは電子的な形態で格納することができる。殊に有利であるのは、そのようにし
て記憶された制御情報を軽便かつ容易に実装することができ、安価なコストで再
現可能であり、しかも僅かな手間で保守できることである。電子計算装置での制
御情報の実装は、従来の技術による手段で可能である。
【0016】 本発明の有利な利点、特徴ならびに詳細な点は、従属請求項ならびに以降の記
載に示されており、以下では図面を参照しながら複数の実施例について詳しく説
明する。なお、各請求項ならびに以下の説明で言及する特徴はそれ自体単独の構
成であってもよいし、あるいは任意な組み合わせにおいても本発明の本質をなす
ものである。次に、図面を参照しながら本発明を実施するやり方について詳しく
説明する。
【0017】 図1は、コアコーデックおよび2つのエンハンスメント段を備えた本発明によ
る装置を示す図である。
【0018】 図2は、コアコーデックの1つのフレームを4つのサブフレームに分割した様
子を示す図である。
【0019】 図3は、主観的な優先順位に応じたメモリフォーマットおよび伝送フォーマッ
トを示す図である。
【0020】 図4aは、アドレッシングによるオーバヘッドの少ない択一的なメモリフォー
マットおよび伝送フォーマットを示す図である。
【0021】 図4bは、図4aによる択一的なメモリフォーマットおよび伝送フォーマット
に対応するビット操作ユニットを示す図である。
【0022】 図1には、コアコーデック(Core-Codec)100と2つのエンハンスメント段
110,120を備えた本発明による装置が描かれている。入力信号130はま
ずはじめに、コアエンコーダ101により圧縮される。このコアエンコーダ10
1は任意のアルゴリズムで表現することができ、任意のサンプリングレートで動
作可能である。有利な実施形態の場合、標準化されたコーデックたとえば Codec
ITU-T が用いられる。コアエンコーダ101により形成されたビットストリー ムであるコアパラメータ102が格納される。次に、コアアルゴリズムを用いて
コアデコーダ103による復号が行われる。コアデコーダ103により形成され
た合成オーディオ信号104はもとの入力信号130と同様、算術演算部105
において処理される。この算術演算はたとえば高速フーリエ変換(FET)、M
DCT(Modified Discrete Cosine Transformation)、またはQMFフィルタ バンク(Filterbank)とすることができる。変換部105により合成オーディオ
信号104から、変換された合成オーディオ信号106が生じる。同じ変換部1
05により入力信号130からは、変換された入力信号107が生じる。入力信
号130、変換された入力信号107、および変換された合成オーディオ信号1
06は、割り当て制御部140へ供給される。さらに両方の信号106,107
は、演算部108により互いに結合される。最も簡単な事例の場合、この演算部
108は差分形成部(減算部)とすることができるが、これに複雑な演算を含ま
せることも可能でありたとえば、もとのスペクトルに対する整合を改善するため
にコアスペクトルの整合を行うこともでき、その場合には整合パラメータまたは
コントロールパラメータ109も伝送することになる。
【0023】 ついで結合信号111が、第1の改善段またはエンハンスメント段110へ供
給される。このエンハンスメント段110は、到来する信号111を符号化する
。符号化アルゴリズムとして、様々なオーディオ符号化方式が可能であり、有利
にはベクトル量子化やベクトル符号化が用いられる。コアコーデック100の結
果すなわちパラメータ102は、第1のエンハンスメント段110におけるこの
符号化区間113の制御およびコンフィグレーション112のために用いられる
。この措置により、エンハンスメント段110の効率が著しく改善される。この
場合、コアパラメータ102を使用することができ、それというのもこのパラメ
ータはいずれにせよ受信機へ伝送されるからである。図示の事例では、このコア
パラメータ102はコードブック選択を制御する。周期的なオーディオ区間にお
いて、非周期的なオーディオ区間とは異なるコードブックが用いられる。しかも
信号エネルギー(音量)の符号化のためにコアコーデック100のエネルギーパ
ラメータがそのまま用いられ、その結果、ビットレートが節約される。コードブ
ックはたとえばトレーニングされ最適化されており、どの音声区間においてオー
ディオ信号が目下存在しているのかに応じて選択され、たとえば有声の音列また
は無声の音列が存在するか否かに応じて選択される。受信機側において、到来す
る受信データを解釈することができる。
【0024】 第1のエンハンスメント段110はエンハンスメント1のパラメータ114を
形成し、これは格納されまたは受信機へ伝送される。復号部115により、やは
り復号され改善された信号116が生じる。信号116は、変換された合成オー
ディオ信号106とともに逆差分形成部117へ供給される。逆差分形成部11
7から生じた信号118も同様に、変換された入力信号107とともに第2のエ
ンハンスメント段120の入力側において結合部119へ導かれる。この場合、
伝送チャネルにおいて利用可能なビットレートを完全に使い切ってしまうまで、
複数のエンハンスメント段110,120が付け加えられる。その際、割り当て
制御部140は、エンハンスメント段110,120の符号化段113,121
を制御する。
【0025】 この実施例の場合、変換部105として周波数変換たとえばMDCTが実行さ
れる。この変換はコアコーデック100のサブフレームに同期して進行し、この
場合、タイプ ITU-T G.7231 のコアコーデックを対象とする。このコアコーデッ
クタイプは30msの期間のフレームを利用し、これはそれぞれ7.5msの期
間をもつ4つのサブフレームに分割されている。
【0026】 図2には、1つのフレームが4つのサブフレームに分割された様子が示されて
いる。この場合、各フレームごとに、主観的な判定基準に従って、たとえばBA
RKSCLAEによるグループ分けにより、複数のバンドないし帯域に分割され
ているスペクトル値をもつベクトルが形成される。図2によれば水平方向の時間
軸tに沿って、先行のフレームn−1の一部分と1つの完全なフレームn 20 0が示されている。フレームごとに4つの変換が実行され、それに応じて4つの
ベクトル210,220,230,240が生成される。各スペクトルベクトル
に対し、時間領域において7.5msの期間をもつ1つのサブフレームが対応す
る。各スペクトルベクトルは4つのサブバンドないしは部分帯域に分割される。
したがって、スペクトルベクトル210は4つのサブバンド211〜214を有
しており、スペクトルベクトル220は4つのサブバンド221〜224を有し
ており、スペクトルベクトル230は4つのサブバンド231〜234を有して
おり、さらにスペクトルベクトル240は4つのサブバンド241〜244を有
している。このようにフレーム200ごとに、合わせて16個のサブバンドが存
在する。この場合、符号化アルゴリズムの各エンハンスメント段において、これ
ら16個のサブバンドのうちの1つが改善される。その際、いずれのサブバンド
を改善するのかについては、割り当て制御部140により求められて決定される
。この決定を、どの周波数帯域が主観的に重要であるのかについて判定する心理
音響学的なモデルに基づいて行うことができるし、あるいはSN比の測定により
行うことができる。エンハンスメント段はパラメータセットを生成し、これは記
憶される。これらのパラメータに加えて、改善されたバンドのアドレスも格納さ
れる。改善されたサブバンドはその後の符号化に考慮され、改善プロセスが新た
に行われる。これに応じて、n番目のエンハンスメント段のビットが(n+1)
番目のエンハンスメント段よりも主観的に重要である、ということを前提とする
ことができる。また、複数のエンハンスメント段が同じサブバンドを改善するよ
うに構成することもできる。
【0027】 図3には、記憶されたまたは伝送されたビット列が示されている。このビット
列は、コアコーデック100から得られたコアパラメータ102で始まる。それ
に続き、改善されたサブバンドのアドレス213の後ろに第1のエンハンスメン
ト段のパラメータENH 1 114がおかれる。次に、第2の改善されたサブバ
ンドのアドレス232ならびにそれに属するエンハンスメントパラメータENH
2 が続く。ビットストリームの終端は、最後に改善されたサブバンドのアドレ
ス222ならびにそれに属するエンハンスメントパラメータENHKを成してい
る。コア、第1のエンハンスメント段、第2のエンハンスメント段等から最後の
エンハンスメント段まで続く順序で、ビットストリーム内にビットを配置するこ
とにより、ビットが自動的に主観的な重要度に応じて並べられる。各段にはアド
レス213,232,221が設けられているので、これを受信機において適正
に対応づけることができる。この場合、利用可能なビットレートに合わせたスケ
ーリングは問題がなく、エンハンスメント段の抑圧によるコストをかけることな
くそれを行うことができ、その際、一番重要でない最後の段ENH K から始ま
る。このスケーリングは、伝送区間の任意のポイントにおいて行うことができる
【0028】 個々のサブバンドを必ずしも符号化しなくてもよく、隣接するバンドからの予
測や補間によって簡単に計算したり近似したりすることができる。このようにす
ればいくつかのサブバンドを伝送しないでもよくなり、あるいは僅かな補間パラ
メータによって伝送するだけでよくなり、受信機においてそれらを隣接するサブ
バンドから形成できるようになる。図示の実施例によれば、サブバンド212お
よび232を隣接するサブバンドから補間することができる。その際、この補間
を、時間的に隣り合うサブバンドからも行えるし、スペクトル周波数範囲におい
て隣り合うサブバンドから行うこともできる。また、フレームごとに4回よりも
少ない回数で変換が実施される場合であっても、たとえば1回だけしか実施され
ない場合でも、既述の方法を適用することができる。改善部においてコアコーデ
ックと同じ個数のサブフレームを用いれば、必ず好適に実現されるようになる。
【0029】 図4aには、アドレッシングオーバヘッドの少ない択一的なメモリフォーマッ
トおよび伝送フォーマットが示されている。この種のメモリフォーマットは、た
とえばデータベースアクセスに適している。各サブバンド211,212,24
4ごとに、それらのためにいくつのエンハンスメント段N 211,N 212,
N 244がビット列内に設けられているかが格納され、ついですべてのエンハ ンスメント段2110,2120,2440が相前後して格納される。このよう
にすると、主観的な重要度に従うビットストリームの組織が失われる。しかしな
らがスケーリングにあたりまずはじめに、主観的に一番重要でないビットを抑圧
できるようにする目的で、各オーディオデータストリームごとに付加的なスケー
リング情報2000が格納され、これにはそのような主観的な重要性の情報が含
まれている。
【0030】 図4bには、図4aの択一的なメモリフォーマットおよび伝送フォーマットに
対応するビット操作ユニットが示されている。このビット操作ユニット410は
オーディオデータベース405から、オーディオデータストリーム400ならび
にスケーリング情報401を受け取る。まえもって定められたビットレート40
2に従いビット操作ユニット410において、利用可能なビットレートに到達す
るまでエンハンスメント段の個数が抑圧される。ビットストリーム内のサブ情報
たとえばサブバンドごとのエンハンスメント段の個数なども、段を除いた後には
当然ながら補正する必要がある。ついで、結果として生じたデータストリームが
伝送される。
【0031】 以下では、ビットレートスケーリングのための2つの主要な適用分野について
説明する。
【0032】 たとえば毎秒64kbitの最大ビットレートをもつオーディオソースが符号
化され格納されているオーディオデータベースへアクセスする場合、種々のビッ
トレートをもつ様々な伝送システムによりアクセスが行われる可能性がある。こ
のため送信前にビットレートを、適切なビットの抑圧または符号変換により伝送
システムの利用可能なビットレートに整合させる必要がある。この場合、スケー
リングされたビットレートに最適な品質が受信機において保証される。
【0033】 別の実例は可変ビットレートをもつ伝送システムでの伝送であり、たとえばい
わゆるATM(Asynchronous Transfer Modus)モードまたはたとえばインター ネットにおける伝送である。この種の適用事例の場合、交換ノードが過負荷また
はその他の影響で、連続的な伝送を保証するにはそのままではもはやオーディオ
データストリームを処理できない場合に、交換ノードにおける適切なビットの抑
圧によりビットレートを局所的に整合させることができる。
【図面の簡単な説明】
【図1】 コアコーデックおよび2つのエンハンスメント段を備えた本発明による装置を
示す図である。
【図2】 コアコーデックの1つのフレームを4つのサブフレームに分割した様子を示す
図である。
【図3】 主観的な優先順位に応じたメモリフォーマットおよび伝送フォーマットを示す
図である。
【図4a】 アドレッシングによるオーバヘッドの少ない択一的なメモリフォーマットおよ
び伝送フォーマットを示す図である。
【図4b】 図4aによる択一的なメモリフォーマットおよび伝送フォーマットに対応する
ビット操作ユニットを示す図である。
【手続補正書】特許協力条約第34条補正の翻訳文提出書
【提出日】平成12年3月31日(2000.3.31)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】請求項1
【補正方法】変更
【補正内容】
【請求項1】 ビットレートスケーラブルなオーディオデータストリームを
生成する方法において、 コアコーデック(100)内でコアパラメータ(102)を求めることにより
オーディオデータストリームを圧縮するステップと、 後置接続された少なくとも1つのエンハンスメント段(110)において符号
化を改善するステップが設けられており、 ここでオーディオデータストリーム(130)を周波数変換し(105)、コ
アコーデック(100)により生成された合成されたオーディオ信号(104)
も周波数変換し、 周波数変換され合成されたオーディオ信号(106)を周波数変換されたオー
ディオデータストリーム(107)と結合する(108)ことを特徴とする、 ビットレートスケーラブルなオーディオデータストリームを生成する方法。
【手続補正書】特許協力条約第34条補正の翻訳文提出書
【提出日】平成12年3月31日(2000.3.31)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0003
【補正方法】変更
【補正内容】
【0003】 WO 97 159 83A によれば、ビットレートスケーラブルなオーディオデータスト
リームを生成する方法が公知であり、これによればコアコーデック内においてコ
アパラメータを求めることでオーディオデータストリームが圧縮される。後置接
続されたエンハンスメント段において、符号化が改善される。各エンハンスメン
ト段はコアパラメータに依存して制御される。 本発明の課題は、ビットレートスケーラブルなオーディオデータストリームを
生成する方法および装置において、多方面にわたり用いることができ、利用可能
な伝送レートが低くても良好な伝送品質が保証され、利用可能な伝送データレー
トへの整合に関して僅かなコストで高度なフレキシビリティが得られるようにす
ることである。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0004
【補正方法】変更
【補正内容】
【0004】 本発明によればこの課題は、請求項1記載の特徴により解決される。従属請求
項には本発明の格別な実施形態が示されている。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0005
【補正方法】変更
【補正内容】
【0005】 上記の課題は、コアコーデック内でコアパラメータを求めることでオーディオ
入力データストリームを圧縮するステップと、後置接続された少なくとも1つの
エンハンスメント段において符号化を改善するステップをもつ方法において、エ
ンハンスメント段における改善をコアパラメータにより制御することにより解決
される。本発明による方法の場合、コアコーデックがコアユニットを成し、到来
する入力データストリームをたとえば2.4kbit/sまたは6kbit/s
の低いビットレートで符号化する。コアコーデックに続いて、任意の個数のいわ
ゆるエンハンスメント段または改善段(Verbesserungsstufe)が設けられており
、それらは用途に応じて1,2,3または4kbit/sのデータレートで符号
化する。この方法の利点は、任意の個数のエンハンスメント段を消去してもビッ
トストリームの他の部分に対し影響が及ぼされないことである。基本的な条件は
、利用可能な伝送システムが少なくともコアコーデックのビットレートを保証す
ることである。コアコーデックは到来するオーディオ信号をパラメータ化し、た
とえば音の高さ、有声音/無声音または音量などのパラメータを求める。たとえ
ばITU−T G.723.1(ITU, International Telecommunication Union )によるコアコーデックを用いることができる。本発明において有利であるのは
、コアコーデックにより求められたコアパラメータが、後置接続されたエンハン
スメント段を制御することである。それというのも、これによってエンハンスメ
ント段の効率を格段に高めることができるからである。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0006
【補正方法】変更
【補正内容】
【0006】 本発明の1つの実施形態によればこの方法は、エンハンスメント段においてベ
クトル符号化を行い、コアパラメータがコードブックの選択を制御するように構
成されている。これが有利であるのは、周期的なオーディオ区間において非周期
的なオーディオ区間とは異なるコードブックをベクトル符号化のために用いるこ
とができる理由による。しかも信号エネルギー(音量)の符号化のために、コア
コーデックのエネルギーパラメータがそのまま用いられ、その結果、ビットレー
トが著しく節約されるようになる。コアパラメータはいずれにせよ受信機へ伝送
されるので、それを利用することができる。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0007
【補正方法】変更
【補正内容】
【0007】 本発明による方法は、オーディオ入力データストリームを変換するステップと
、コアコーデックにより生成された合成オーディオ信号を変換するステップと、
変換された合成オーディオ信号を変換されたオーディオデータストリームと結合
するステップを有することを特徴としている。これにより有利には僅かなコスト
かつ高い精度で、コアコーデックにより圧縮されたオーディオ信号と元の信号と
の差が求められる。最も簡単な事例では、結合にあたり差分形成を行うことがで
きるが、たとえば改善された適合のためもとのスペクトルへコアスペクトルを整
合させるなど、それよりも複雑な演算を含めることもできる。最後に挙げた本発
明の実施形態の場合、整合に用いられる結合パラメータを受信機へ伝送する。

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 ビットレートスケーラブルなオーディオデータストリームを
    生成する方法であって、コアコーデック(100)内でコアパラメータ(102
    )を求めることによりオーディオデータストリームを圧縮するステップと、後置
    接続された少なくとも1つのエンハンスメント段(110)において符号化を改
    善するステップをもつ方法において、 エンハンスメント段(110)における改善をコアパラメータ(102)によ
    り制御することを特徴とする、 ビットレートスケーラブルなオーディオデータストリームを生成する方法。
  2. 【請求項2】 エンハンスメント段(102)内でベクトル符号化を行う、
    請求項1記載の方法。
  3. 【請求項3】 コアパラメータ(102)はコードブックの選択を制御する
    、請求項1または2記載の方法。
  4. 【請求項4】 オーディオデータストリーム(130)を変換するステップ
    (105)と、コアコーデック(100)により生成された合成オーディオ信号
    (104)を変換するステップ(105)と、変換された合成オーディオ信号(
    106)を変換されたオーディオデータストリーム(107)と結合するステッ
    プ(108)を有する、請求項1から3のいずれか1項記載の方法。
  5. 【請求項5】 結合パラメータを受信機へ伝送する、請求項4記載の方法。
  6. 【請求項6】 コアコーデック(100)は入力信号(130)を少なくと
    も2つのサブフレームに分割し、前記変換(105)は、コアコーデック(10
    0)のサブフレームに同期して実行される周波数変換である、請求項4または5
    記載の方法。
  7. 【請求項7】 前記周波数変換(105)によってサブフレームごとに、そ
    れぞれ1つのスペクトルベクトル(210,220,230,240)を生じさ
    せる変換を実行し、各スペクトルベクトル(210)は少なくとも2つのサブバ
    ンド(211〜214)に分割されていて、各エンハンスメント段(110,1
    20)はそれらのサブバンド(211〜214)の1つを改善する、請求項6記
    載の方法。
  8. 【請求項8】 エンハンスメント段(110)ごとに、改善されたサブバン
    ドのパラメータセット(ENH1)とアドレス(213)を伝送する、請求項7
    記載の方法。
  9. 【請求項9】 各サブバンドごとに、伝送すべきビットストリームにおいて
    個々のサブバンドのためにいくつのエンハンスメント段が相前後して存在するの
    かを記憶し(N211)、サブバンドの個々のエンハンスメント段の相対的な意
    味内容を求めるための付加情報(2000)を記憶し、ビットストリーム(40
    0)と付加情報(401)を伝送前にビットストリーム操作ユニット(410)
    においてまとめる、請求項7記載の方法。
  10. 【請求項10】 受信した隣接するサブバンドから計算により、たとえば補
    間により、サブバンドを受信機側で生成する、請求項7から9のいずれか1項記
    載の方法。
  11. 【請求項11】 コアパラメータ(102)を求めてオーディオデータスト
    リーム(130)を圧縮するコアコーデック(100)と、該コアコーデック(
    100)に後置接続された少なくとも1つのエンハンスメント段(110)が設
    けられている、ビットレートスケーラブルなオーディオデータストリームを生成
    する装置において、 コアコーデック(100)はエンハンスメント段(110)と接続されており
    、コアパラメータ(102)によりエンハンスメント段(110)が制御される
    ことを特徴とする、 ビットレートスケーラブルなオーディオデータストリームを生成する装置。
  12. 【請求項12】 請求項1から10のいずれか1項記載の方法を実行する、
    請求項11記載の装置。
  13. 【請求項13】 ビットレートスケーラブルなオーディオデータストリーム
    を生成する装置において、 請求項7から10のいずれか1項記載の方法を実行する装置と、どのサブバン
    ドが改善されるのかを制御する割り当て制御部(140)を有することを特徴と
    する、 ビットレートスケーラブルなオーディオデータストリームを生成する装置。
  14. 【請求項14】 エンハンスメント段(110)における符号化の改善を制
    御するためのコアコーデック(100)のコアパラメータ(102)の使用。
  15. 【請求項15】 制御情報が記憶されているデータ担体において、 該制御情報により、電子計算装置または請求項11から13のいずれか1項記
    載の装置における請求項1から10のいずれか1項記載の方法の実行が制御され
    ることを特徴とするデータ担体。
JP2000515343A 1997-10-02 1998-09-29 ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置 Pending JP2001519552A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE19743662.5 1997-10-02
DE19743662A DE19743662A1 (de) 1997-10-02 1997-10-02 Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms
PCT/DE1998/002877 WO1999018673A1 (de) 1997-10-02 1998-09-29 Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2010041499A Division JP2010170142A (ja) 1997-10-02 2010-02-26 ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置

Publications (1)

Publication Number Publication Date
JP2001519552A true JP2001519552A (ja) 2001-10-23

Family

ID=7844454

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2000515343A Pending JP2001519552A (ja) 1997-10-02 1998-09-29 ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置
JP2010041499A Withdrawn JP2010170142A (ja) 1997-10-02 2010-02-26 ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2010041499A Withdrawn JP2010170142A (ja) 1997-10-02 2010-02-26 ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置

Country Status (5)

Country Link
US (1) US6526384B1 (ja)
EP (1) EP1023777B1 (ja)
JP (2) JP2001519552A (ja)
DE (2) DE19743662A1 (ja)
WO (1) WO1999018673A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005037949A (ja) * 2003-07-16 2005-02-10 Samsung Electronics Co Ltd 広域音声信号の圧縮装置および復元装置ならびに圧縮方法および復元方法
US7191126B2 (en) 2001-09-03 2007-03-13 Mitsubishi Denki Kabushiki Kaisha Sound encoder and sound decoder performing multiplexing and demultiplexing on main codes in an order determined by auxiliary codes
JP2009513992A (ja) * 2003-06-25 2009-04-02 ドルビー スウェーデン アクチボラゲット オーディオ信号を符号化する装置と方法および符号化されたオーディオ信号を復号化する装置と方法
JP2013528832A (ja) * 2010-11-12 2013-07-11 ポリコム,インク. マルチポイント環境におけるスケーラブルオーディオ処理

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI106758B (fi) 1999-04-16 2001-03-30 Nokia Networks Oy Segmentointimekanismi lohkoenkooderia varten
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
DE10049571C1 (de) 2000-10-06 2002-06-13 Siemens Ag Verfahren und Anordnung zum Übertragen eines Vektors
JP3463752B2 (ja) 2001-07-25 2003-11-05 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法および音響復号化方法
KR100494555B1 (ko) * 2001-12-19 2005-06-10 한국전자통신연구원 광대역 음성신호의 전송방법 및 그 장치
KR100465318B1 (ko) * 2002-12-20 2005-01-13 학교법인연세대학교 광대역 음성신호의 송수신 장치 및 그 송수신 방법
GB2403634B (en) * 2003-06-30 2006-11-29 Nokia Corp An audio encoder
EP1881485A1 (en) * 2006-07-18 2008-01-23 Deutsche Thomson-Brandt Gmbh Audio bitstream data structure arrangement of a lossy encoded signal together with lossless encoded extension data for said signal
GB0822537D0 (en) * 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
JP5552988B2 (ja) * 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02143735A (ja) * 1988-11-25 1990-06-01 Victor Co Of Japan Ltd 音声多段符号化伝送方式
JPH066313A (ja) * 1992-06-24 1994-01-14 Nec Corp 量子化ビット数割当方法
JPH06291674A (ja) * 1991-06-06 1994-10-18 Matsushita Electric Ind Co Ltd 適応変換ベクトル量子化符号化法
JPH08263096A (ja) * 1995-03-24 1996-10-11 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法及び復号化方法
JPH0990998A (ja) * 1995-09-26 1997-04-04 Nippon Telegr & Teleph Corp <Ntt> 音響信号変換復号化方法
WO1997015983A1 (en) * 1995-10-27 1997-05-01 Cselt Centro Studi E Laboratori Telecomunicazioni S.P.A. Method of and apparatus for coding, manipulating and decoding audio signals

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0285902A3 (de) 1987-04-07 1990-10-10 Siemens Aktiengesellschaft Verfahren zur Datenreduktion digitaler Bildsequenzen
FI92272C (fi) * 1992-05-20 1994-10-10 Valtion Teknillinen Kuvansiirtojärjestelmän tiivistyskoodausmenetelmä
US6449596B1 (en) * 1996-02-08 2002-09-10 Matsushita Electric Industrial Co., Ltd. Wideband audio signal encoding apparatus that divides wide band audio data into a number of sub-bands of numbers of bits for quantization based on noise floor information
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02143735A (ja) * 1988-11-25 1990-06-01 Victor Co Of Japan Ltd 音声多段符号化伝送方式
JPH06291674A (ja) * 1991-06-06 1994-10-18 Matsushita Electric Ind Co Ltd 適応変換ベクトル量子化符号化法
JPH066313A (ja) * 1992-06-24 1994-01-14 Nec Corp 量子化ビット数割当方法
JPH08263096A (ja) * 1995-03-24 1996-10-11 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法及び復号化方法
JPH0990998A (ja) * 1995-09-26 1997-04-04 Nippon Telegr & Teleph Corp <Ntt> 音響信号変換復号化方法
WO1997015983A1 (en) * 1995-10-27 1997-05-01 Cselt Centro Studi E Laboratori Telecomunicazioni S.P.A. Method of and apparatus for coding, manipulating and decoding audio signals

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7191126B2 (en) 2001-09-03 2007-03-13 Mitsubishi Denki Kabushiki Kaisha Sound encoder and sound decoder performing multiplexing and demultiplexing on main codes in an order determined by auxiliary codes
US7756698B2 (en) 2001-09-03 2010-07-13 Mitsubishi Denki Kabushiki Kaisha Sound decoder and sound decoding method with demultiplexing order determination
US7756699B2 (en) 2001-09-03 2010-07-13 Mitsubishi Denki Kabushiki Kaisha Sound encoder and sound encoding method with multiplexing order determination
JP2009513992A (ja) * 2003-06-25 2009-04-02 ドルビー スウェーデン アクチボラゲット オーディオ信号を符号化する装置と方法および符号化されたオーディオ信号を復号化する装置と方法
JP2005037949A (ja) * 2003-07-16 2005-02-10 Samsung Electronics Co Ltd 広域音声信号の圧縮装置および復元装置ならびに圧縮方法および復元方法
JP4726445B2 (ja) * 2003-07-16 2011-07-20 三星電子株式会社 広域音声信号の圧縮装置および復元装置ならびに圧縮方法および復元方法
US8433565B2 (en) 2003-07-16 2013-04-30 Samsung Electronics Co., Ltd. Wide-band speech signal compression and decompression apparatus, and method thereof
US8831932B2 (en) 2010-07-01 2014-09-09 Polycom, Inc. Scalable audio in a multi-point environment
JP2013528832A (ja) * 2010-11-12 2013-07-11 ポリコム,インク. マルチポイント環境におけるスケーラブルオーディオ処理

Also Published As

Publication number Publication date
DE59807135D1 (de) 2003-03-13
JP2010170142A (ja) 2010-08-05
WO1999018673A1 (de) 1999-04-15
EP1023777A1 (de) 2000-08-02
EP1023777B1 (de) 2003-02-05
DE19743662A1 (de) 1999-04-08
US6526384B1 (en) 2003-02-25

Similar Documents

Publication Publication Date Title
JP2010170142A (ja) ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置
JP6887995B2 (ja) セカンダリチャンネルを符号化するためにプライマリチャンネルのコーディングパラメータを使用するステレオ音声信号を符号化するための方法およびシステム
KR101303145B1 (ko) 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더
CA2327627C (en) Process for processing at least one coded binary audio flux organized into frames
KR100469002B1 (ko) 오디오 코딩 방법 및 장치
US6108626A (en) Object oriented audio coding
KR101061404B1 (ko) 가변 레이트로 오디오를 인코딩 및 디코딩하는 방법
JP4142292B2 (ja) オーディオ信号の符号化効率を向上させる方法
RU2408089C9 (ru) Декодирование кодированных с предсказанием данных с использованием адаптации буфера
EP0582921A2 (en) Low-delay audio signal coder, using analysis-by-synthesis techniques
JP2001500344A (ja) タンデム型ボコーダの音質を改良する方法および装置
JPH02155313A (ja) 符号化方法
JP2010512550A (ja) 時間領域データストリームを表している符号化および復号化のための符号器、復号器およびその方法
US20080140393A1 (en) Speech coding apparatus and method
US8055499B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
EP1019907A2 (en) Speech coding
JPH08263098A (ja) 音響信号符号化方法、音響信号復号化方法
JPH0844392A (ja) 音響信号符号化復号方法
JP2002330075A (ja) サブバンドadpcm符号化方法、復号方法、サブバンドadpcm符号化装置、復号装置およびワイヤレスマイクロホン送信システム、受信システム
JP3144009B2 (ja) 音声符号復号化装置
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
WO2006009075A1 (ja) 音声符号化装置および音声符号化方法
US6012025A (en) Audio coding method and apparatus using backward adaptive prediction
JPH10260699A (ja) 音声符号化方法および装置
Taleb et al. G. 719: The first ITU-T standard for high-quality conversational fullband audio coding

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090130

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090427

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090508

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090529

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090605

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090626

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090826

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091124

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100401