JPH1084285A - 圧縮ディジタルオーディオ信号の減衰及び混合方法 - Google Patents

圧縮ディジタルオーディオ信号の減衰及び混合方法

Info

Publication number
JPH1084285A
JPH1084285A JP9073689A JP7368997A JPH1084285A JP H1084285 A JPH1084285 A JP H1084285A JP 9073689 A JP9073689 A JP 9073689A JP 7368997 A JP7368997 A JP 7368997A JP H1084285 A JPH1084285 A JP H1084285A
Authority
JP
Japan
Prior art keywords
scale factor
subband
value
data
values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9073689A
Other languages
English (en)
Inventor
Timothy John Everett
ジョン エヴァレット ティモシー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JPH1084285A publication Critical patent/JPH1084285A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

(57)【要約】 【課題】 圧縮ディジタルオーディオ信号の減衰及び混
合を容易にすることにある。 【解決手段】 MPEG及び類似の圧縮システムのオー
ディオ信号を圧縮解除することなく減衰及び混合する技
術である。データフレーム(F)内の各エントリは順に
配置されたスケールファクタ値のテーブルの各エントリ
を識別するスケールファクタインデックス(SF)を有
する。減衰技術(20)はスケールファクタインデック
スに値を加算することにより異なるスケールファクタ値
を参照させることにあり、この減衰は混合前に少なくと
も1つのチャネルに対し行うのが好ましい。混合技術
(32、34、36、38)は、各チャネルからのサブ
バンドデータグループをそれぞれのスケールファクタで
比較し、2つのグループ対するデータをスケーリング後
に加算する。加算結果がオーバフローする際の高速スケ
ーリングのために、1dB減衰に対応するスケールファ
クタテーブルの値間隔を使用するのが好ましい。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、オーディオ信号を
減衰及び混合する方法、及びこのような方法を実現する
装置に関するものであり、特にMPEG標準に従って圧
縮及び/又は符号化されたオーディオ信号を混合する方
法に関するものである。
【0002】
【従来の技術】ISO11172−3(MPEG1)及
びISO13818−3(MPEG2)に規定されてい
るMPEGオーディオ圧縮技術は、所定の周波数が他の
周波数より良好に聞こえるという人間の聴覚特性を利用
している。オーディオデータは最初に時間領域から周波
数領域に変換し、可聴周波数範囲をカバーする複数のサ
ブバンドに分割する。各サブバンドに対するサンプルデ
ータには、所定の瞬時に存在する周波数のみならず最近
存在した周波数にも関連するMPEGに規定された心理
聴覚モデルに基づいて、そのサンプルがどの程度良く聞
こえるかに依存する大きさの帯域幅が割り当てられる。
この場合、良く聞こえない周波数は圧縮が得られるよう
に低ビットレートで送出される。
【0003】MPEG、JPEG及びビデオ電話用の
H.261標準のような圧縮技術において認識される問
題は、符号化データを時間のかかる最初の復号化ステッ
プなしで処理することが困難である点にある。この分野
における既存の研究の多くは、例えば C.Smith and A.R
owe:"Algprothms for Manipulating Compressed Image
s", IEEE Computer Graphics and Applicatons, Sept.1
993, VOl.13(No.5),pp.34-42; Shih-Fu Chang and Davi
d G. Messershmitt: "Manipulation and Composing of
MC-DCT Compressed Video", IEEE Journal on Selected
Areas in Communicatons", Vol.13(No.1)Jan.1995, p
p.1-11; 及び国際特許出願WO94/21097(Changet al/Uive
rsity of California) に記載されているように、圧縮
ビデオデータの処理に集中している。これらに記載され
ている技術は特定のクラスの画像処理に使用する比較的
に複雑なアルゴリズムに基づくものであり、それらの使
用前に、例えば動き補償を除去するために、少なくとも
信号の部分的復号化を依然として必要とするものであ
る。
【0004】これらのアルゴリズムの幾つかはオーディ
オデータに適用しうるかもしれない旨示唆されている。
しかし、圧縮ビデオ及びオーディオストリーム(例えば
サウンドトラック付きフィルム)のビデオ成分の一般に
複雑な性質のために、これらのアルゴリズムを部分的に
復号化された圧縮ビデオに適用するのに要する時間は伝
統的な”力任せ”技術(即ち完全な復号化及び再符号
化)を付随オーディオに適用するのと同程度であった。
【0005】
【発明が解決しようとする課題】本発明の目的は、圧縮
データストリームを、純粋にオーディオアプリケーショ
ンのための速度で、及びマルチオーディオ信号アプリケ
ーション(ビデオと別でもビデオとの組合せでもかまわ
ない)のための効率で、信号処理する方法及び装置を提
供することにある。本発明の他の利点は、圧縮形態のオ
ーディオデータストリームの混合を容易にすることにあ
る。
【0006】
【課題を解決するための手段】本発明は、圧縮ディジタ
ルオーディオ信号に減衰を与えるために、ステップ状に
変化するL個の数値の系列を含み、次の各値がその前の
値から共通の関数により導出され、各別のスケールファ
クタインデックス値により一意的に識別されるL個のス
ケールファクタの第1テーブルが定められ、前記信号が
ディジタルデータの順次のフレーム形態をなし、各フレ
ームが少なくとも次のセクション:各別の周波数帯域幅
を表す1以上のサブバンドの各々に対する複数のサンプ
ル点の値を表すサブバンドデータ値;前記1以上のサブ
バンドの各々に割り当てられ、信号の圧縮解除時に当該
サブバンドに供給すべき各別の数値的スケーリングファ
クタを識別するスケールファクタインデックス値;を具
えている減衰方法において、前記スケールファクタイン
デックス値がL個の順次の整数値を具え、且つ当該方法
は、更に、各サブバンドに対し、所望の減衰を前記L個
の数値の系列のM個のステップとして識別するステップ
と、Mを当該サブバンドに割り当てられたスケールファ
クタインデックスに加算するステップとを具え、ここで
L及びMは整数であり、且つ1≦M<Lであることを特
徴とする。
【0007】MPEG及び類似の符号化信号用のスケー
ルファクタテーブル内のエントリの規則的なステップ状
数値系列を使用することにより、減衰は簡単な加算処理
になる。MPEGの場合には、スケールファクタテーブ
ル内のエントリの間隔は1dBに対応し、従って0.5
倍(3dBに相当する)の減衰はスケールファクタイン
デックス値に整数3を加算するだけでよい。
【0008】本発明は、更に、2以上の圧縮ディジタル
オーディオ信号を混合する方法を提供するものであり、
ステップ状に増大するL個の数値の系列を含み、次の各
値はその前の値から共通の関数により導出され、各別の
スケールファクタインデックス値により一意的に識別さ
れるL個のスケールファクタの第1テーブルが定めら
れ、前記信号がディジタルデータの順次のフレーム形態
をなし、各フレームが少なくとも次のセクション:各別
の周波数帯域幅を表す1つのサブバンド又は1以上のサ
ブバンドの各々に対する複数のサンプルポイント値を表
すサブバンドデータ値;少なくとも1つが前記1つのサ
ブバンド又は1以上のサブバンドの各々に割り当てら
れ、信号の圧縮解除時に当該サブバンドに供給されるべ
き各別の数値的スケーリングファクタを識別する複数の
スケールファクタインデックス値;を具えている混合方
法において、前記スケールファクタインデックス値がL
個の順次の整数値を具え、且つ当該方法は更に各信号か
らのそれぞれのサブバンドを混合するために、混合すべ
きサブバンドの各グループに対し、最大の又は大きい方
の関連するスケールファクタを有する第1サブバンドを
識別するステップと、小さい方の関連するスケールファ
クタを有するサブバンドのデータ値を第1サブバンドと
同一のスケールレンジにスケーリングするステップと、
それぞれのデータ値セットを加算するするステップとを
具えることを特徴とする。この混合方法は、上述の減衰
の後、即ち前記サブバンド対の少なくとも一つに対する
所望の減衰を前記L個の数値系列のM個のステップとし
て識別し、Mを前記サブバンドに割り当てられたスケー
ルファクタインデックスに加算した後に行うことができ
る(ここでL及びMは整数であり、且つ1≦M<Lであ
る)。
【0009】サブバンドデータ値のスケーリングは、2
つのサブバンドのスケールファクタインデックス値の差
と、当該データ値とによりインデックスされる2次元ル
ックアップテーブルを用いて行うのが好ましい。各別の
周波数帯域幅を表す複数のサブバンドをフレーム内に規
定し、各サブバンドに対するMの値(スケールファクタ
テーブルインデックス)を決定し、供給するのが好適で
ある。
【0010】また、大きいスケールファクタを有するサ
ブバンドの識別が所定のしきい値を越えるスケールファ
クタ間の差を示す場合には、小さいスケールファクタを
有するサブバンドはスケーリングしないで捨て、大きい
スケールファクタを有するサブバンドを出力させるのが
好ましい。更に、それぞれのセットのサブバンドデータ
値の加算に続いて、その結果が所定のビット数を越える
か否か決定する検査を行い、越える場合には前記結果に
対応するスケールファクタインデックスを所定の整数値
だけ増加させて前記結果をスケーリングするのが好まし
い。
【0011】
【発明の実施の形態】本発明の他の特徴及び利点が、M
PEG標準に従って圧縮されたオーディオ信号に関し図
面を参照して以下に記載する本発明の実施例の説明から
明らかになる。先に述べたように、MPEGオーディオ
圧縮技術は、ある周波数が他の周波数より良好に聞こえ
るという人間の聴覚特性を利用し、良く聞こえない周波
数は低ビットレートで送出して圧縮を得るものである。
MPEGは可聴周波数範囲をカバーする32個のまでの
サブバンドの使用を許し、各MPEGパケットは各サブ
バンドに対する36サンプルを含み、各サブバンドに対
するデータには各別の帯域幅が割り当てられる。
【0012】MPEGフレームは図1に示すように配列
されたデータからなり、このフレームの各セクションは
各別の整数ビットを含む。ヘッダHはビットレート、サ
ンプリング周波数、モノ/ステレオ情報等を記述する規
定の配列の32ビットからなる。ヘッダHは巡回冗長検
査(CRC)が付加されているか否か示す1ビット(フ
ラグ)も含み、付加を示す場合には、ヘッダセクション
の直後に16ビットのCRC値(図示せず)が後続す
る。
【0013】ヘッダHの次に(CRCがあればその次
に)、フレーム内にどのサブバンドが存在するかを識別
するとともに1サブバンドにつき何ビットが割り当てら
れるかを示すサブバンド割当て(SBA)セクションデ
ータが存在する。SBAセクションは整数のアレーであ
り(1サブバンドにつき1つ)、各整数は当該サブバン
ドに対するデータ値を表すテーブルに対するインデック
スである。数個のこのようなテーブルがMPEG標準に
規定されており、SBAセクションに対する長さ及びフ
ォーマットに関する選択はビットレート及びサンプリン
グ周波数(例えば44.1KHzでサンプリングされた
64Kビットストリーム)に依存する。MPEGは最大
27のアレーエントリ(即ち、可能な32サブバンドの
うちの27のみに対する)を指定しており、これらのア
レーエントリは異なるビット数が指定され、例えばエン
トリー0〜10は4ビット、エントリー11〜22は3
ビット、エントリー23〜26は2ビットが指定され
る。
【0014】SBAセクション内にゼロエントリーが存
在する場合には、これはサブバンドがフレーム内に存在
せず、このフレームに対するデータは他の全てのセクシ
ョンにおいてスキップされることを意味する。
【0015】前述したように、サブバンドデータは36
サンプル/サブバンドからなる。圧縮処理の一部分では
これらのサンプル値を連続的に12サンプルごとに3つ
のグループにわける。各グループを分析してその最大値
(絶対値)を検出し、次いでこの最大値を、6ビット整
数の形で、MPEGに規定されているスケールファクタ
テーブルから当該グループに対するスケールファクタを
選択するのに使用する。次に、これらのサンプル値を後
続の処理の前にこのスケールファクタにより除算する。
【0016】次に、各サブバンドに対し選択された3つ
のスケールファクタを検査して、これ以上の圧縮が可能
か検査し、例えば互いに1又は2dB以内の1対のスケ
ールファクタに対し大きい方の値を使用する。フレーム
セクションSFGD(スケールファクタグループデー
タ)は、この後者の圧縮についてのデータを、3つの異
なるスケールファクタを特定のサブバンドに対し伝送す
る必要があるのか、2つのスケールファクタを伝送する
必要があるのか(第1又は第2のスケールファクタは2
度使用する)、又は1つのスケールファクタを3つの値
のすべてに対し供給する必要があるのかを識別する2ビ
ット値のアレーの形態で含む。
【0017】フレームの次のセクションSFは前セクシ
ョン内のデータから取り出されるスケールファクタイン
デックスデータ、即ちスケールファクタテーブルをイン
デキシングする(索引する)6ビット整数を含む。スケ
ールファクタテーブルは63エントリのアレーを有し、
その第1エントリーは2.0000であり、次の各エン
トリは前値の約0.7937倍(1dBステップに等
価)の値である。最後のセクションSBDはサブバンド
データを可変長固定小数点値として含み、このSBDセ
クション内のデータから特定の符号化を得る。
【0018】
【実施例】本発明の技術は、MPEGストリームのよう
なストリームのスケールファクタ符号化に基づいて、ス
ケールファクタテーブルの特徴、即ち各テーブルエント
リーと前エントリーとの間の1dBステップに等価な固
定比率の関係を利用して上述の如きストリームを減衰又
は混合するものである。
【0019】我々は、1dBステップの減衰に制限する
ことにより、MPEGストリームの減衰をストリーム内
のスケールファクタインデックスへの簡単な数値加算に
より実現することができることを認識した。例えば、デ
ータフレームの0.5倍(3dBに等価)の減衰はこの
フレーム内のすべてのスケールファクタインデックスに
3を加算することにより得られる。加算の結果がオーバ
フローする(スケールファクタテーブルの62のインデ
ックス値を超過する)か否かを決定する検査を含めるの
が好ましい。アンダーフロー(負値)の場合には、この
サブバンドに対する割当て値を零に保持し、無視するこ
とができる。
【0020】この技術を、上述したMPEGフレーム系
列の形態の2以上のストリームの混合に拡張する場合に
ついて図2を参照して以下に説明する。図2は各別のソ
ースA及びBからの2つのオーディオストリームの各々
に対するデータフレームFを示す。各フレームはn個
(上述したように代表的には27個)のサブバンド行の
形態をなし、各サブバンド行は各12サンプルの3つの
グループp,q,rを含み、各サブバンド内の各グルー
プごとにそれぞれのスケールファクタインデックス値S
Fを含んでいる。
【0021】各別のソースからの2つのストリームを最
初に、上述した方法により、それぞれの制御信号LEV
ELにより決まる量だけ(減衰段20において)減衰す
る。減衰に続いて、混合すべきフレームを各別のバッフ
ァ22で別々にバッファし、各別のバッファからデータ
をマイクロプロセッサ30の制御の下でグループごとに
且つサブバンドごとに抽出する。このマイクロプロセッ
サは2以上のフレームの対応するグループを混合するよ
う作用する(混合すべき1対のグループを2つのフレー
ム内に線影を付して示す)。
【0022】サブバンドデータが両ストリーム内に存在
しない(又は一方のストリームにしか存在しない)ささ
いな場合が最初に処理される。両ストリームが現サブバ
ンドに対するデータを含む場合には、このサブバンドデ
ータを一時に1グループづつ処理し、最初の2つのグル
ープに対するスケールファクタインデックスの比較を比
較器32で始める。これらのインデックスが所定のプリ
プログラム値以上に相違する場合には、小さい方のイン
デックス(大きいスケールファクタ)を有するグループ
を出力し、他方のグループは捨てる。これは、このスト
リームのボリュームにより他方のストリームが聞こえな
くなるものと仮定されるためである。プリプログラム値
(例えば24としうる)は使用するデータサイズの最大
分解能に基づくものとするのが好ましい。前記差がこの
値より小さい場合には、2つのグループに対するデータ
を互いに加算する。
【0023】この加算は、最初に小さい方のスケールフ
ァクタインデックスを有するグループをベースグループ
として選択し、次いで他方のグループの12サブバンド
サンプルをこれらのサンプルが第1グループと同一のス
ケールレンジ内に入るように(スケーリング段34で)
スケーリングする。これは、2つのグループのスケール
ファクタインデックスの差と当該データ値とによりイン
デックスされる予め計算された2次元ルックアップテー
ブルにより行うのが好適である。第2グループのサブバ
ンドデータに対するこれらのスケーリングした値を(加
算器38で)第1グループサブバンドデータに直接加算
する。オーバフローが発生する場合には(オーバフロー
検出器40で検出される)、加算値を(バイナリデータ
の簡単なシフト42により)半分にするとともに、当該
グループのスケールファクタをこれに応じて調整する
(即ち2倍にする必要があり、これはスケールファクタ
インデックスから3を引くことにより簡単に達成され
る)。1つのグループが処理されたら、各値についてオ
ーバフローが発生したか検査し、次いでオーバフローが
発生しなかったすべての値に1位置のシフトを与えてこ
れらの値を適正にスケーリングする。
【0024】この技術の比較的簡単な実現を得るために
は、スケーリングされてないサブバンドデータをストリ
ーム入力処理の一部分として正規化する必要がある。こ
の正規化(サブバンドデータ値を共通長さに設定するこ
と)は、容易に理解されるように、クリッピング又は零
ビット詰め込みにより適切に達成することができる。し
かしこれは若干の品質低下を生ずるので、可能なら入力
データサイズ以下への正規化は避けるのが好ましい。ビ
ット長の正規化の選択はルックアップテーブルのサイズ
に効果を及ぼし、8ビットの長さの場合にはルックアッ
プテーブルのサイズはN*256になる(ここでNは加
算が依然として発生する最大スケールファクタ差(8ビ
ット値に対し24の領域)。16ビットの長さでは、ル
ックアップテーブルのサイズはN*64Kに増大し、比
較的低いメモリ容量を有する小形のマシンにおいて問題
となりうる。この問題は、もっと多数のビットが有意に
なり、従ってもっと大きなスケールファクタの差が依然
として認識されうるので、Nを大きくする必要があるこ
とによっても大きくなる。
【0025】これらの大きなビット長の問題に対処する
ために、再び0.5倍のスケーリングは3のスケールフ
ァクタ差に等しいことを利用する。例えば、16ビット
構成の場合には、入力値をD/3位置(ここでDはスケ
ールファクタ差)だけシフトさせ、その結果をD modul
o-3とともに小さいルックアップテーブルのインデッキ
シングに使用することにより除算を実現する。D modul
o-3は0、1又は2の何れかであり、0の場合にはルッ
クアップテーブルを必要としないので、16ビットに対
してはテーブルは2*64Kサイズになる。
【0026】この減衰及び混合方法はソフトウエアで完
全に又は部分的に実現することができ、例えばCPU3
0(図2)を走行させて種々のオーディオソースに関連
する機能を有するオンスクリーンディスプレイを発生さ
せることができる。このようなオンスクリーンディスプ
レイの例を図3〜5に示す。図3及び図4は6トラック
オーディオミキサのデモンストレーションアプリケーシ
ョンの異なる例を示す。6入力トラックは別々のMPE
Gオーディオストリームとして蓄積され、ユーザはワー
クステーションスクリーン上に表示されるボリュームコ
ントロールスライダ101−106をマウス又は類似の
ユーザ操作入力デバイスにより移動するカーソルで選択
し、ドラッグすることによりこれらのトラックをリアル
タイムで混合することができる。スライダ101−10
6の各々の現在の設定値が図2に示すそれぞれの減衰段
20へのLEVEL入力の値を決定する。
【0027】図4は図3のボリュームコントロール10
1−106に加えて他の機能を有する改良型ミキサ用の
スクリーンディスプレイコントロールパネルを示す。一
組の可動周波数トレース111−116を具え、1チャ
ネルにつき1つのトレースが当該チャネルの周波数スペ
クトルに対する周波数フィルタリングを示し、ハイレベ
ル水平線(112、115及び116に示す)は当該周
波数スペクトルに亘って何のフィルタ作用もなさないこ
とを示すが、111に示すトレースは低周波数を少し減
衰することを示す。これらのトレースが、同様にカーソ
ルにより操作され、フレームの全サブバンド内の全グル
ープに一定の減衰を与えるのか、所定のサブバンドにそ
れらがカバーする周波数帯域幅に依存して異なる減衰を
与えるのか決定する。
【0028】上述のトレース111−116は、チャネ
ルの出力を遅延期間後に入力に混合することにより形成
される残響ループの遅延長を制御する他のスライダ12
1−126がある。他のトレース131−136は入力
に戻され混合される出力信号の周波数スペクトル及びフ
ィルタリングを示す。他のグラフィックユーザインター
フェースを図5に示す。これは複数の同心円のグループ
からなるパターンを示す。各グループは蓄積オーディオ
トラック(MPEGオーディオ)と関連し、各トラック
は、ユーザがカーソルを関連するグループの中心(×で
示す)に位置させるか他の方法で該グループを指示する
ことにより再生される。カーソルを他のグループに移動
させると、このグループと関連するオーディオトラック
が聞こえ始め、動作状態において各グループの中心に対
するカーソルの相対位置により当該オーディオに与えら
れる相対的減衰明(又は当該オーディオの欠落)が決定
され、種々の全グループからのオーディオが上述のよう
に混合される。このような技術は、例えばバーチャル環
境内でも適用可能であり、このような環境においてはバ
ーチャルワールドの種々の特徴が関連するサウンドを有
し、これらの音を種々の特徴に対するユーザカーソルの
相対位置に依存して制御可能に再生又は減衰させること
ができる。
【0029】以上、オーディオストリームを減衰及び混
合する新技術、特にMPEG標準に従うオーディオスト
リームを減衰及び混合するのに好適な新技術を記載し
た。これまでは、データを混合前に圧縮解除する必要が
あり、CPUの要件又は蓄積媒体の帯域幅制限のために
同時に混合しうるストリーム数が制限される問題があっ
た。CPU利用分析ツールを使用すれば、上述のMPE
Gストリームの混合はソフトウエア合成段に比較して極
めて僅かなCPUパワーを使用することが確かめられ
る。
【0030】本発明は上述した実施例にのみ限定される
ものではなく、多くの変更や変形が可能である。例え
ば、オーディオ信号及びデータ処理装置及びその構成部
品の分野において既知の構成要件を上述した実施例の構
成要素の代わりに、又は加えて使用することもできる。
特許請求の範囲は構成要素の組合せとして記載されてい
るが、本発明で解決すべき技術的問題の一部又は全部を
解決する、しないにかかわらず、本明細書に開示された
新規な構成又は構成要素の組合せも本発明の範囲に含ま
れる。
【図面の簡単な説明】
【図1】MPEG−1標準に従うオーディオデータのフ
レームを模式的に示す。
【図2】2つのオーディオデータストリームを混合する
本発明方法の一実施例を示すブロック図である。
【図3】図2に示す方法とともに使用しうるオンスクリ
ーンコントロールパネルディスプレイの一例を示す。
【図4】図2に示す方法と関連して使用しうるオンスク
リーンコントロールパネルディスプレイの変形例を示
す。
【図5】本発明の制御機能とともに使用しうるスクリー
ンディスプレイの一例を示す。
【符号の説明】
20 減衰段 22 バッファ 30 CPU 32 比較器 34 スケーリング段 36 ルックアップテーブル 38 加算器 40 オーバフロー検出器 42 シフト手段 F データフレーム n サブバンド数 p,q,r グループ SF スケールファクタインデックス値

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 圧縮ディジタルオーディオ信号に減衰を
    与える方法であって、ステップ状に変化するL個の数値
    の系列を含み、次の各値がその前の値から共通の関数に
    より導出され、各別のスケールファクタインデックス値
    により一意的に識別されるL個のスケールファクタの第
    1テーブルが定められ、前記信号がディジタルデータの
    順次のフレーム形態をなし、各フレームが少なくとも次
    のセクション:各別の周波数帯域幅を表す1以上のサブ
    バンドの各々に対する複数のサンプル点の値を表すサブ
    バンドデータ値;前記1以上のサブバンドの各々に割り
    当てられ、信号の圧縮解除時に当該サブバンドに供給す
    べき各別の数値的スケーリングファクタを識別するスケ
    ールファクタインデックス値;を具えている減衰方法に
    おいて、 前記スケールファクタインデックス値がL個の順次の整
    数値を具え、且つ当該方法は、更に、各サブバンドに対
    し、所望の減衰を前記L個の数値の系列のM個のステッ
    プとして識別するステップと、 Mを当該サブバンドに割り当てられたスケールファクタ
    インデックスに加算するステップとを具え、ここでL及
    びMは整数であり、且つ1≦M<Lであることを特徴と
    する減衰方法。
  2. 【請求項2】 2以上の圧縮ディジタルオーディオ信号
    を混合する方法であって、ステップ状に増大するL個の
    数値の系列を含み、次の各値はその前の値から共通の関
    数により導出され、各別のスケールファクタインデック
    ス値により一意的に識別されるL個のスケールファクタ
    の第1テーブルが定められ、前記信号がディジタルデー
    タの順次のフレーム形態をなし、各フレームが少なくと
    も次のセクション:各別の周波数帯域幅を表す1以上の
    サブバンドの各々に対する複数のサンプルポイント値を
    表すサブバンドデータ値;前記1以上のサブバンドの各
    々に割り当てられ、信号の圧縮解除時に当該サブバンド
    に供給すべき各別の数値的スケーリングファクタを識別
    するスケールファクタインデックス値;を具えている混
    合方法において、 前記スケールファクタインデックス値がL個の順次の整
    数値を具え、且つ 当該方法は、更に、各信号からのそ
    れぞれのサブバンドを混合するために、混合すべきサブ
    バンドの各グループに対し、 最大又は大きい方の関連するスケールファクタを有する
    第1サブバンドを識別するステップと、 小さい方の関連するスケールファクタを有するサブバン
    ドのデータ値を第1サブバンドと同一のスケールレンジ
    にスケーリングするステップと、 それぞれのセットのデータ値を加算するステップとを具
    えることを特徴とする混合方法。
  3. 【請求項3】 初期化ステップとして、 前記サブバンド対の少なくとも一つのサブバンドに対す
    る所望の減衰を前記L個の数値系列のM個のステップと
    して識別するステップと、 Mを前記サブバンドに割り当てられたスケールファクタ
    インデックスに加算するステップとを具え、ここでL及
    びMは整数であり、且つ1≦M<Lであることを特徴と
    する請求項2記載の方法。
  4. 【請求項4】 前記サブバンドデータのスケーリングは
    2つのサブバンドのスケールファクタインデックス値の
    差と当該データ値とによりインデッキシングされる2次
    元ルックアップテーブルを用いて行うことを特徴とする
    請求項2記載の方法。
  5. 【請求項5】 各別の周波数帯域幅を表す複数のサブバ
    ンドがフレーム内に定められ、当該方法は各サブバンド
    に対するMのそれぞれの値を決定し供給することを特徴
    とする請求項1又は3記載の方法。
  6. 【請求項6】 大きい方の関連するスケールファクタを
    有するサブバンドを識別するステップが所定のしきい値
    を越えるスケールファクタ間の差を示す場合には、小さ
    い方のスケールファクタを有するサブバンドはスケーリ
    ングしないで捨て、大きい方のスケールファクタを有す
    るサブバンドを出力させることを特徴とする請求項2記
    載の方法。
  7. 【請求項7】 前記それぞれのセットのサブバンドデー
    タ値の加算に続いて、その結果が所定のビット数を越え
    るか否か決定する検査を行い、越える場合には前記結果
    に対応するスケールファクタインデックスを所定の整数
    値だけ増加させて前記結果をスケーリングすることを特
    徴とする請求項2記載の方法。
  8. 【請求項8】 前記L個のスケールファクタ値の各値は
    その前の値の一定の百分率値であることを特徴とする請
    求項1〜7の何れかに記載の方法。
  9. 【請求項9】 前記スケールファクタテーブルのステッ
    プ幅は1dB減衰に対応することを特徴とする請求項1
    〜8の何れかに記載の方法。
  10. 【請求項10】 前記入力信号はMPEGオーディオ標
    準に従うことを特徴とする請求項1〜9の何れかに記載
    の方法。
JP9073689A 1996-03-29 1997-03-26 圧縮ディジタルオーディオ信号の減衰及び混合方法 Pending JPH1084285A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB9606680.8A GB9606680D0 (en) 1996-03-29 1996-03-29 Compressed audio signal processing
GB9606680:8 1996-03-29

Publications (1)

Publication Number Publication Date
JPH1084285A true JPH1084285A (ja) 1998-03-31

Family

ID=10791299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9073689A Pending JPH1084285A (ja) 1996-03-29 1997-03-26 圧縮ディジタルオーディオ信号の減衰及び混合方法

Country Status (8)

Country Link
US (1) US5864816A (ja)
EP (1) EP0798869A3 (ja)
JP (1) JPH1084285A (ja)
KR (1) KR970068670A (ja)
CN (1) CN1164728A (ja)
GB (1) GB9606680D0 (ja)
SG (1) SG55293A1 (ja)
TW (1) TW361052B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003513325A (ja) * 1999-11-02 2003-04-08 デジタル・シアター・システムズ・インコーポレーテッド マルチチャネル・オーディオ環境において対話型オーディオを提供するシステムおよび方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7379961B2 (en) * 1997-04-30 2008-05-27 Computer Associates Think, Inc. Spatialized audio in a three-dimensional computer-based scene
JP3164038B2 (ja) 1997-11-05 2001-05-08 日本電気株式会社 音声帯域分割復号装置
US6446073B1 (en) * 1999-06-17 2002-09-03 Roxio, Inc. Methods for writing and reading compressed audio data
US7379962B1 (en) * 2000-01-19 2008-05-27 Computer Associates Think, Inc. Spatialized audio in a three-dimensional computer-based scene
US6725110B2 (en) 2000-05-26 2004-04-20 Yamaha Corporation Digital audio decoder
GB0103242D0 (en) * 2001-02-09 2001-03-28 Radioscape Ltd Method of analysing a compressed signal for the presence or absence of information content
EP1393301B1 (en) * 2001-05-11 2007-01-10 Koninklijke Philips Electronics N.V. Estimating signal power in compressed audio
US20050062843A1 (en) * 2003-09-22 2005-03-24 Bowers Richard D. Client-side audio mixing for conferencing
US8290782B2 (en) * 2008-07-24 2012-10-16 Dts, Inc. Compression of audio scale-factors by two-dimensional transformation
US8204744B2 (en) * 2008-12-01 2012-06-19 Research In Motion Limited Optimization of MP3 audio encoding by scale factors and global quantization step size
EP2695161B1 (en) 2011-04-08 2014-12-17 Dolby Laboratories Licensing Corporation Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams
US8428277B1 (en) * 2011-10-11 2013-04-23 Google Inc. Clipping protection in fixed-width audio mixing
TWI566239B (zh) * 2015-01-22 2017-01-11 宏碁股份有限公司 語音信號處理裝置及語音信號處理方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992012607A1 (en) * 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5408274A (en) * 1993-03-11 1995-04-18 The Regents Of The University Of California Method and apparatus for compositing compressed video data
DE69428939T2 (de) * 1993-06-22 2002-04-04 Deutsche Thomson-Brandt Gmbh Verfahren zur Erhaltung einer Mehrkanaldekodiermatrix
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
JPH07264144A (ja) * 1994-03-16 1995-10-13 Toshiba Corp 信号圧縮符号化装置および圧縮信号復号装置
JP3190204B2 (ja) * 1994-04-12 2001-07-23 ユナイテッド・モジュール・コーポレーション Mpeg規格の音声信号デコーダ
US5815634A (en) * 1994-09-30 1998-09-29 Cirrus Logic, Inc. Stream synchronization method and apparatus for MPEG playback system
GB9510093D0 (en) * 1995-05-18 1995-07-12 Philips Electronics Uk Ltd Interactive image manipulation

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003513325A (ja) * 1999-11-02 2003-04-08 デジタル・シアター・システムズ・インコーポレーテッド マルチチャネル・オーディオ環境において対話型オーディオを提供するシステムおよび方法
JP4787442B2 (ja) * 1999-11-02 2011-10-05 ディー・ティー・エス,インコーポレーテッド マルチチャネル・オーディオ環境において対話型オーディオを提供するシステムおよび方法

Also Published As

Publication number Publication date
SG55293A1 (en) 2001-05-22
GB9606680D0 (en) 1996-06-05
CN1164728A (zh) 1997-11-12
US5864816A (en) 1999-01-26
EP0798869A3 (en) 2000-11-22
TW361052B (en) 1999-06-11
KR970068670A (ko) 1997-10-13
EP0798869A2 (en) 1997-10-01

Similar Documents

Publication Publication Date Title
US6931370B1 (en) System and method for providing interactive audio in a multi-channel audio environment
US6128597A (en) Audio decoder with a reconfigurable downmixing/windowing pipeline and method therefor
KR100548891B1 (ko) 음성 부호화 장치 및 음성 부호화 방법
JPH1084285A (ja) 圧縮ディジタルオーディオ信号の減衰及び混合方法
US6122619A (en) Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
KR960012475B1 (ko) 디지탈 오디오 부호화장치의 채널별 비트 할당 장치
JPH10178350A (ja) 符号化音声データの符号化レート変換方法および装置
CN100536574C (zh) 一种快速播放多媒体信息的系统和方法
JP2024079768A (ja) 情報処理装置および方法、プログラム、並びに情報処理システム
US20240282321A1 (en) Multichannel audio encode and decode using directional metadata
KR20030085521A (ko) 디지털 음성 데이터의 부호화 방법 및 복호화 방법
JPH11202900A (ja) 音声データ圧縮方法及びそれを適用した音声データ圧縮システム
US7647221B2 (en) Audio level control for compressed audio
JP3466507B2 (ja) 音声符号化方式、音声符号化装置、及びデータ記録媒体
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
JPH1168576A (ja) データ伸張装置
US7739105B2 (en) System and method for processing audio frames
JP2002156998A (ja) オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置
CN1625239A (zh) 用于图形显示数字广播接收机中的音频成分的方法
TWI857414B (zh) 播放器裝置與訊號處理方法
JP2000293199A (ja) 音声符号化方法および記録再生装置
JP2001306097A (ja) 音声符号化方式及び装置、音声復号化方式及び装置、並びに記録媒体
JPH08237135A (ja) 符号化データ復号装置およびそれを用いた画像オーディオ多重化データ復号装置
JPH0677839A (ja) 圧縮音声伸張方法
JP2003249026A (ja) 再生装置および再生方法