JP2008020931A - デコーダの互換性を失わない確立済み低ビット・レートのオーディオ・コード化システムの音質の改善 - Google Patents

デコーダの互換性を失わない確立済み低ビット・レートのオーディオ・コード化システムの音質の改善 Download PDF

Info

Publication number
JP2008020931A
JP2008020931A JP2007236798A JP2007236798A JP2008020931A JP 2008020931 A JP2008020931 A JP 2008020931A JP 2007236798 A JP2007236798 A JP 2007236798A JP 2007236798 A JP2007236798 A JP 2007236798A JP 2008020931 A JP2008020931 A JP 2008020931A
Authority
JP
Japan
Prior art keywords
core
audio
extension
signal
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007236798A
Other languages
English (en)
Inventor
Yu-Li You
ユー,ユ−リ
William Paul Smith
スミス,ウィリアム・ポール
Zoran Fejzo
フェジゾ,ゾラン
Stephen Smyth
スマイス,スティーヴン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DTS Inc
Original Assignee
DTS Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DTS Inc filed Critical DTS Inc
Publication of JP2008020931A publication Critical patent/JP2008020931A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/04Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
    • H04B14/046Systems or methods for reducing noise or bandwidth
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • G11B20/1217Formatting, e.g. arrangement of data block or words on the record carriers on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】従来技術との互換性を保ち、サンプリング周波数範囲を拡張し、ノイズフロアを下げる多チャネルオーディオ圧縮技術を提供する。
【解決手段】高サンプリング周波数の多チャネルオーディオを、既存のサンプリング周波数までのコアオーディオと新技術のサンプリング周波数までの差信号とに分ける。コアオーディオは従来技術でエンコードし、エンコードしたコアビットストリームをそれらデコーダに適合させる。差信号は、サンプリング周波数を拡張し、コアオーディオ品質を改善する技術でコード化する。圧縮した差信号をコアビットストリームの拡張として付加する。第1世代デコーダは拡張データを無視するが、第2世代デコーダはデコードする。デコードされたコアと拡張のオーディオ信号の加算により、第2世代デコーダは、コアデコーダのみの使用の場合よりもオーディオ信号バンド幅を拡張し、信号対雑音比を改善する。
【選択図】図2

Description

本発明は、低ビット・レート・オーディオ・コード化システムに関し、より詳細には、デコーダの互換性(コンパチビリティ)を失うことなく、確立された低ビット・レートのオーディオ・コード化システムの音質を向上させる方法に関する。
多くの低ビット・レートのオーディオ・コード化システムが、現在、多種多様な消費者向けおよびプロフェッショナル用のオーディオ再生製品およびオーディオ再生サービスで使用されている。例えば、Dolby AC3(R)(Dolby(R)デジタル)オーディオ・コード化システムは、最高で640キロ・ビット/秒までのビット・レートを使用してLaser Disc(レーザ・ディスク)、NTSCコード化DVDビデオ、およびATVのためのステレオおよび5.1チャネル・オーディオ・サウンド・トラックをコード化するための世界的標準である。MPEG Iオーディオ・コード化標準およびMPEG IIオーディオ・コード化標準は、768キロ・ビット/秒までのビット・レートで、PALコード化されたDVDビデオ、欧州での地上デジタル無線放送、および米国での衛星放送のためのステレオおよびマルチチャネル・サウンド・トラックのコード化のために、広く使用されている。DTS(Digital Theater Systems(デジタル・シアター・システムズ))Coherent Acoustics(コヒーレント・アコースティック)オーディオ・コード化システムは、コンパクト・ディスク、DVDビデオ、およびレーザ・ディスクならびに1536キロ・ビット/秒までのビット・レートの、スタジオ品質の5.1チャネル・オーディオ・サウンド・トラックにしばしば使用されている。
これらのシステムが抱える大きな問題は、より高いPCMサンプリング周波数、PCMワード長、また、より高いシステム・ビット・レートに対応するようにそれらを容易にアップグレードできないという点で、それらの設計が柔軟性を欠いていることである。これは、音楽業界や映画業界が44.1kHzサンプリング周波数および16ビットワード長という古いコンパクト・ディスク・デジタル・オーディオ・フォーマットを捨て、96kHzサンプリング周波数および24ビット・ワード長という新しいDVDオーディオPCMマスタリング・フォーマットを採用するように移行するにつれ、今後、重要な問題となる。
この結果、AC−3、MPEG、およびDTSなどの既存のオーディオ・エンコード・システムを使用するオーディオ・デリバリ(delivery)は、このより高い信号忠実度の利点を消費者に渡すことができるように適応しなければならない。残念ながら、これらのデコーダ機能を実装するオーディオ・デコーダ処理チップ(DSP)の大きな取り付け済みベースが、既に既存の消費者ベース内に常駐している。これらのデコーダは、増加するサンプリング速度、ワード・サイズ、またはビット・レートに対応するように容易にアップグレードすることができない。従って、これらの媒体を介して商品を販売する音楽コンテンツおよび映画コンテンツのプロバイダは、古い標準に準拠するコード化オーディオ・ストリームを供給し続けるのを余儀なくされることになる。これは、将来、DVDオーディオ、ATV、衛星無線などのデリバリ媒体が、それぞれが異なる標準に準拠する複数のビット・ストリームを送り出すのを余儀なくされる可能性があることを意味する。例えば、1つのストリームは、既存の再生システムの所有者が標準オーディオ・トラックを受信してそれを再生することができるようにするために含められ、他方、第2のストリームも、新しい機器の所有者が96kHz/24ビットPCM形式を使用してコード化されたオーディオ・トラックを再生して本質的に高い忠実度を利用できるようにするために含められることになろう。
このデリバリの方法の抱える問題は、再生媒体の多くが、追加のオーディオ・ストリームを送るのに必要な追加の帯域幅またはチャネル容量を備える余裕がないことである。この追加のビット・ストリーム(例えば、96kHz/24ビットをサポートするもの)のビット・レートは、古いフォーマットをサポートするものに少なくとも等しいか、またはそれより高いことになる。従って、ビット・レートは、2つまたはそれより多くのオーディオ標準をサポートするためには、恐らく2倍またはそれより高くなる。
前述の問題を鑑みて、本発明は、複製オーディオ・データを送らなければならないことを回避しながらも、周波数範囲を拡張し、ノイズ・フロアを低下させ、従って、PCMサンプリング周波数、ワード長、およびコード化ビット・レートの変化により効率良く対応するコード化方法を提供する。
これは、従来のオーディオ・コード化アルゴリズムが「コア」オーディオ・コーダを構成して変更されないままである、「コア」プラス「拡張(エクステンション)」コード化方法を使用して実現される。より高いオーディオ周波数(より高いサンプリング速度の場合)またはより高いサンプル分解能(より長いワード長の場合)、あるいはその両方を表すのに必要なオーディオ・データが、「拡張」ストリームとして伝送される。これにより、オーディオ・コンテンツ・プロバイダは、消費者の機器ベース内に在る異なる型のデコーダと適合する単一のオーディオ・ビット・ストリームを含めることができる。コア・ストリームは、拡張データを無視する古いデコーダによってデコードされ、より新しいデコーダは、コア・データ・ストリームと拡張データ・ストリームの両方を使用して、より高い品質の音の再生をもたらす。
このシステムの重要な特徴は、拡張データが、再構築コア信号(エンコード/デコードされる、および/またはダウンサンプリング/アップサンプリングされる)を、元の「高忠実度」入力信号から減算することによって生成されることである。得られた差信号をエンコードして拡張ストリームが生成される。この技法を使用すると、コア信号や拡張信号へのフォールドバック・エイリアシングが回避される。従って、コア・オーディオの品質は、拡張ストリームを含めることによって影響を受けない。このシステムがその最も基本的なモードで動作するためには、コア・コーダの待ち時間、つまり遅延が知られているだけでよい。従って、この方法は、コーダの内部アルゴリズムまたはその実装形態の詳細の知識がなくても、どのオーディオ・コード化システムにもうまく適用することができる。ただし、このシステムは、コア信号の周波数範囲でコア・コーダに合うように拡張コーダが設計されている場合には、より効率的に動作させることができる。
本発明のこれらおよびその他の特徴および利点は、添付の図面と実施形態の下記の詳細な説明から、当分野の技術者には明白となる。
本発明は、高忠実度信号をコード化するための「コア」プラス「拡張」コード化方法を規定し、この方法により、オーディオ・コンテンツ・プロバイダは、消費者のベース内に在る異なる型のデコーダとコンパチブルの一つのオーディオ・ビット・ストリームを含めることができる。コア・ビット・ストリームは、拡張データを無視する古いデコーダによってデコードされることになり、他方、新しいデコーダは、コア・ストリームと拡張データ・ストリームとの両方を使用して高品質のサウンドの再生をもたらすことになる。この手法は、既存のデコーダを保つことを所望する既存の顧客のベースと、より高い忠実度の信号を再生できる新しいデコーダを購入することを所望する人々をともに満足させることになる。
既存のデコーダと次世代のエンコーダとの互換性を維持することになる様式で高忠実度オーディオをエンコードするための本来の概念は、1996年5月2日出願され、DTS,Inc.(DTS社)に譲渡されている、スミス(Smyth)その他によるシリアル番号第08/642254号の「A MULTI−CHANNEL PREDICTIVE SUBBAND AUDIO CODER USING PSYCHOACOUSTIC ADAPTIVE BIT ALLOCATION IN FREQUENCY,TIME AND OVER THE MULTIPLE CHANNELS(周波数、時間におけるおよび複数チャネルにわたる音響心理学適応ビット割り当てを用いるマルチチャネル予測サブバンド・オーディオ・コーダ)」によって紹介された。Smythその他のものの図4aおよび図4bに示されるとおり、オーディオ・スペクトルは、最初、256タップ2バンド・デシメーション・プレフィルタ・バンクを使用して分割されて、帯域(バンド)当り24kHzというオーディオ帯域幅をもたらす。ボトム・バンド(0〜24kHz)は、32の一様なバンドに分割されてエンコードされる。トップ・バンド(24〜48kHz)は、8つの一様なバンドに分割されてエンコードされる。
エンコーダの動作を反映するように設計された新しいデコーダは、トップ(上部)・バンドとボトム(低部)・バンドをともにデコードし、次に、256タップ2バンド補間フィルタバンクを使用して高忠実度オーディオ信号を再構築する。システムは、所望に応じて、48kHzバンド幅全体にわたって単位利得周波数応答を示す。
記載する高忠実度コード化技法に先立って存在していた古いデコーダは、ボトム・バンドだけをデコードして、ベースバンド・オーディオ信号を生成する。この意味で、このシステムは既存のデコーダとの互換性を維持するのである。ただし、本明細書の図1に示すとおり、2バンド・デシメーション・プレフィルタ・バンクの周波数応答6は、コアだけがデコードされる場合に24kHzあたりでエイリアシングの問題を生じさせる。ボトム・バンドおよびトップ・バンドの周波数応答8および10は、それぞれ、コア・プラス拡張コーダ(core plus extension coder)のための単位利得応答を提供するために、24kHzにおけるそのそれぞれの遷移領域内でクロスオーバする。ただし、コアだけのデコーダでは、24kHzを超えるボトム・バンド周波数応答8の部分が、エイリアシングされて下げられる。この結果、再構築されたベースバンド・オーディオ信号は、古いベースバンドだけのコーデック・システムでは見られなかった程度の破損を有することになる。従って、このコード化システムは、既存のデコーダとは「真の」互換性を維持しない。更に、この手法は、何れの追加のビットもトップ・バンドに割り振られるように制約するものであり、これは多くの場合において最適ではない。
一般化されたコア・プラス拡張フレームワーク
エンコードおよびデコードのための一般的プロセスを図2〜図7に示す。拡張ビット・ストリーム(図2)を作成するために、アナログ・オーディオ12が、信号のバンド制限をするアナログ・アンチエイリアシングLPF14に送り込まれる。バンド制限された信号は、離散/デジタル・オーディオ信号16になるようにサンプリングされる。LPF14に関する遮断周波数は、ナイキスト基準を満たすためには、サンプリング・レートの1/2よりも低くなければならない。例えば、拡張された96kHzサンプリング・レートに対して、48kHz遮断が適切である。
デジタル・オーディオ信号16がコア・エンコーダ18(AC3、MPEG、DTS等)に送り込まれ、特定のビット・レートでエンコードされる。オーディオ信号のサンプリング・レートおよびバンド幅は、いくつかの場合には、コア・エンコーダに整合するようにロー・パス・フィルタリングおよびダウンサンプリングを介して調整する必要がある。簡明にするため、図で示すオーディオ入力は、単一チャネルまたはマルチチャネルであると想定している。マルチチャネル入力の場合、減算および加算プロセスは、各チャネルごとに行われる。このコア・ビット・ストリーム20は、拡張データを生成するのに先立って、パッカ(packer)22に保持される。また、コア・ビット・ストリームも、既存の消費者向け再生機器内に在るデコーダと適合するコア・デコーダ24に送り込まれる。
次に、結果的な再構築されたコア・オーディオ信号26が、元の入力信号16の遅延したもの30から減算される(28)。遅延32は、デコードされたコア・オーディオ信号と入力オーディオ信号との正確な時間的整合が実現されるように、コア・エンコーダ/デコーダの待ち時間の遅延と整合するようにされる。この時点で、この差信号34は、より高い分解能またはより高い周波数の、コア・ビット・ストリーム20のコード化された信号にはない元の入力信号16内の成分を表す。次に、この差信号が、サブバンド(副帯域)・コード化または変換コード化などの標準コード化技法を適切に使用する拡張コーダ36によってエンコードされ、拡張ビット・ストリーム38を生成する。拡張ビット・ストリームおよびコア・ビット・ストリームは、時間的に整合され、多重化されて合成ストリーム40を形成する。あるいは、これらのストリームは、適用例に応じて、別個のストリームとして保持または伝送することが可能である。
周波数スペクトルを拡張してノイズ・フロアを低下させるプロセスの背後にある概念を図3aおよび図3bに示している。図3aは、96kHzのサンプリングされたオーディオ入力信号の周波数スペクトル42のスナップ・ショットを示している。このオーディオは、明らかに48kHzまでの周波数成分を含んでいる。図3bのトレース44は、デシメーションおよびコア・エンコードの後の信号のスペクトルを示している。オーディオ周波数は、フィルタリングされて24kHzを超えるものが除去され、またサンプリング速度は、コア・コーダに整合するようにデシメータによって48kHzまで低下されている。トレース46は、拡張エンコーダに入る前の差信号のスペクトルを示している。明らかに、拡張コーダは、コア・コーダによって表されないスペクトルの部分、即ち、24kHzあたりの遷移バンド48および24kHzから48kHzまでの高周波数拡張50に対して、そのデータ・リソースを集中することができる。更に、残りのコア信号52にビットを割り振り、コア帯域幅のノイズ・フロアを低下させることができる。下記の特別なケースは、拡張ビットが、(1)コア信号の分解能を拡張するため、(2)信号のコア分解能と高周波数内容の両方を拡張するため、および(3)高周波数内容だけを拡張するために割り振られる適用例を、研究する。これらのそれぞれに関して、コード化システムは、コア・エンコード・システムと関連する遅延だけが知られていればよい「ブラック・ボックス」手法で、または特定のコア・コード化アーキテクチャを利用する「オープン・ボックス」手法で、構成されることが可能である。
また、コアのみのデコーダとのバックワード・コンパチビリティを維持するために、コア・オーディオ・データ20および拡張オーディオ・データ38を搬送する単一の合成ビット・ストリーム40も、コア・プラス拡張の様式でフォーマットされる。そのようなビット・ストリームは、それぞれが2つのフィールド、コア・フィールド56および拡張フィールド58(図4参照)から成る一連の同期されたフレーム54である。コアだけのデコーダは、同期ワード(CORE_SYNC)61を検出し、コア・フィールド56のコア・ビット20をデコードしてコア・オーディオを生成し、次に、次のフレームの開始点にジャンプして次のフレームをデコードすることによって拡張フィールド58を無視する。ただし、拡張デコーダは、コア・ビットをデコードし、次に、拡張ビットに関する同期ワード(EXT_SYNC)60が存在するかどうかを検査することができる。存在しない場合、デコーダはコア・オーディオを出力して、次のフレームをデコードするために次のフレームの開始点へジャンプする。存在する場合は、デコーダは、拡張フィールド58の拡張ビット38をデコードして拡張オーディオを生成し、次に、それをコア・オーディオと組み合わせて高品質オーディオを生成する。コア・ビットは、そのバンド幅にわたり、再構築されたコア・オーディオ信号に対するノイズ・フロアを定義する。拡張ビットは、更に、コア帯域幅にわたってノイズ・フロアを洗練させ(低下させ)、オーディオ帯域幅の残りの部分に関するノイズ・フロアを定義する。
図5aおよび図5bに示すとおり、合成ビット・ストリーム40は、CD、デジタル・バーサタイル・ディスク(DVD)、または直接放送システムなどの伝送媒体上でエンコードされ、またはそれを介して放送される。図5aに示すとおり、単一の合成ビット・ストリーム40が、よく知られた技法を使用してCD、DVD、またはその他のデジタル記憶デバイスなどのポータブルの機械読み取り可能な記録媒体62に書き込まれる。図5bに示すとおり、合成ビット・ストリーム40は、搬送波64として実現され、次に、これが衛星、ケーブル、またはその他の遠隔通信システムを介して放送される。
コア・ビット・ストリームおよび拡張ビット・ストリームをデコードするため(図6)、アンパッカ(unpacker)66が合成ビット・ストリーム40をアンパックし、コア・ビット・ストリーム20および拡張ビット・ストリーム38をそのそれぞれのデコーダ68および70へ向けて送る。次に、デコーダ72が出力74を加算して高忠実度オーディオ信号76を再構築する。再生デバイスがその中に拡張デコーダを有さない場合(古い機器ではそうであるように)、拡張ビット・ストリームは単に無視され、コア・ビット・ストリームがデコードされてコア品質のオーディオ信号を生成する。デコードの例では、コア・デコーダおよび拡張デコーダの遅延は同じであると想定している。後に扱うように、この遅延の差は、デコーダまたはエンコーダに追加の遅延段を加えることによって対処することができる。
コア・プラス拡張コード化のトポロジの利点は図7に明らかに示され、図7では、複数トーン試験信号に応答するコアだけの周波数スペクトル78およびコア・プラス拡張の周波数スペクトル80をそれぞれ示しれている。この特定の適用例では、オーディオ・システムは、直流から24kHzまでのおよそ−100dBのノイズ・フロアを有するコアだけの再構築されたオーディオ信号を生成する。後に更に詳細に述べるように、このコアだけの応答は、古いシステムによって生成されたコアだけの信号よりもわずかばかり良好であれ得る。なぜなら、古いシステムで使用されるアナログ・アンチエイリアシング・フィルタと新しいコーダ内で使用されるデジタル・デシメーション・フィルタとでは違いがあるからである。これと比べて、オーディオ・システム(特別ケース番号2)は、コア信号のノイズ・フロアを約−160dBに低下させ、また約−60dBのノイズ・フロアで48kHzに信号バンド幅を拡張するコア・プラス拡張オーディオ信号を生成する。より高いノイズ・フロアは、耳の感度がそれほど良くない高い周波数では、より許容できることに留意されたい。
高分解能拡張フレームワーク
図8aおよび図8bは、コア・プロセスのコード化分解能だけを向上させる、即ち、出力オーディオ信号のバンド幅を拡張することなく、デコードされたオーディオ出力信号のコード化エラーを減少させるエンコードおよびデコード・プロセスを示している。既存のコード化スキーム(AC3、MPEG、DTS)のビット・レートは固定であるので、より高いコード化分解能が必要とされる場合、オーディオ信号をエンコードするのに全く異なる互換性のないコーダの使用が、通常、必要とされる。
現行のスキームでは、既存のコア・エンコーダ84を使用して、既存のデコーダのビット・レート制約(AC3の場合は640キロビット/秒となり、MPEGの場合は768キロビット/秒となり、DTSの場合は1536キロビット/秒となる)内で動作する可能な最高のコード化分解能を提供する。コード化分解能を更に高めるため、即ち、コード化エラーを減少させるために、コード化されたコア信号をデコードして(86)再構築コア信号を形成し、この再構築コア信号を入力信号から減算(88)する。この入力信号は、これらの信号の間で正確な時間的整合を実現するために遅延(90)させる。拡張エンコーダ82は、何らかの任意のコード化プロセスを使用して差信号をエンコードする。パッカ92は、前述のとおり、コア・ビットおよび拡張ビットを合成ビット・ストリームにパックする。この場合、サンプリング周波数およびオーディオ帯域幅のそれぞれは、拡張エンコーダ82およびコア・エンコーダ84の両方において同じである。高忠実度96kHz入力オーディオが提供される場合、それは、両方のコーダに整合するようにローパス・フィルタリングし、ダウンサンプリングしなければならないことに留意されたい。
図8bに示すとおり、信号をデコードするために、アンパッカ94は合成ビット・ストリームをアンパックし、コア・ビット・ストリームおよび拡張ビット・ストリームを別々のデコーダ・プロセス96および98へそれぞれ送り、それぞれの出力が一緒に加算される100。拡張デコーダが存在しない場合には、コア・デコーダの出力が直接に使用される。この例では、拡張ビット・ストリームは、出力オーディオ信号の信号対ノイズ比を向上させる機構とみなすことができる。つまり、拡張デコーダの出力を付加することにより、コード化ノイズ・フロアを低下させる。低下のレベルは、拡張ビット・ストリームに割り当てられるビット・レートに依存する。
図9は、拡張コーダに入る前の差信号の周波数スペクトル102のスナップ・ショットを示している。コア・コード化プロセスは、0kHzから24kHzのバンド幅にわたってノイズ・フロアを生じさせるコード化エラーを有する。24kHzちょうどでの大きな振幅エラーは、アンチエイリアシング・フィルタの遷移バンド幅に帰する。拡張コーダが、コード化エラーと遷移バンド幅エラーをともに減少させるために、その利用可能なビットを割り当てる。ほとんどの割り当てスキームは、全体の性能を最適化するため、遷移バンド幅などのような大きな誤差には多くのビットを割り振り、小さな誤差には少ないビットを割り振る。
図10に示すように、ノイズ・フロアは、コアだけの周波数応答78の場合の−100dBに対し、コア・プラス拡張応答104の場合の−160dBといったように、相当に下方にシフトされており、また1536ビット/秒というコア・ビット・レートを2048ビット/秒に増加させ、拡張コーダに追加のビットを割り振ることにより、遷移バンドにわたって拡張されている。これらのビット・レートは、既存のDTSエンコーダ・システムで使用することが可能なものの実施例に過ぎないことに留意されたい。−160dBのノイズ・フロアは、他の入手できるコーダによっては実現不可能であり、オーディオ忠実度の相当な改善を表すものである。
高周波数拡張フレームワーク
図11aおよび図11bは、コア・コード化システムによって表されない高周波数オーディオ情報を拡張ビット・ストリームが搬送するのを可能にするコード化フレームワークを記載している。この例では、デジタル・オーディオは、96kHz周期を有する24ビットPCMサンプルによって表される。デジタル・オーディオは、まず、整数遅延を有する線形位相FIRフィルタ106を使用してローパス・フィルタリングし、24kHzを超える信号成分を除去する。このデジタル・フィルタの遮断周波数は、既存のコアのみのオーディオ・コーダのアナログ・アンチエイリアシング・フィルタと同じであることに留意されたい。デジタル・フィルタは、アナログ・フィルタより狭い遷移バンドを示すので、このコアだけの信号は、既存のシステムにおけるコアだけの信号より、実際に少し良好である。
次に、このフィルタリングされた信号が、2でデシメート108され、実効48kHzのサンプリングされた信号をもたらす。ダウン・サンプリングされた信号が、コア・エンコーダ110に通常の様式で送られ、その結果的なビット・ストリームが、ビット・ストリームを少なくとも1フレームだけ遅延させるフレーム・バッファ111へ入れられる。次に、この遅延されたビット・ストリームがパッカ112へ入れられる。また、ダウン・サンプリングされた信号はコア・デコーダ114にも送られ、コード化エラーを有する48kHzのサンプリングされたデジタル・オーディオ・ストリームを再構築する。これを元の96kHzの入力オーディオ信号から減算できるようにするには、まず、2倍にアップサンプリングし116、次に、ローパス・フィルタリングして補間エイリアシングを除去しなければならない。この場合も、このフィルタリングは、整数サンプル遅延を有する線形位相FIR118を使用して適切に実施される。従って、この信号は、やおも、コア・ビット・ストリームに保持されるオーディオ情報だけを搬送している。即ち、この信号は、24kHzを超えるオーディオ周波数成分を全く含まない。次に、再構築されたコア信号が、入力信号122を遅延したもの(119)から減算(120)され、差信号を生じる。この差信号が遅延121を通過させられ、96kHzサンプリング・エンコーダ123を使用してエンコードされて拡張ビット・ストリームを生成する。
デコード・プロセスは、前述したものと同様である。図11bに示すように、アンパッカ124が、合成ビット・ストリームをアンパックして、コア・ビット・ストリームおよび拡張ビット・ストリームをそれぞれのデコーダ126および128へ送る。拡張デコーダが存在しない場合、再構築されたオーディオは直接に出力される(図では24ビット48kHzのPCM)。拡張デコーダがプレーヤに常駐している場合、デコードされたコア・オーディオは、96kHzまでアップサンプリングされ(130)、ローパス・フィルタリングされ(132)、拡張デコーダの出力と加算(134)される。
このプロセスの背後にある概念は、最初、一般的なコア・プラス拡張フレームワークに関連して図3aおよび図3bに示した。図3aは、96kHzサンプリングされたオーディオ入力信号の周波数スペクトルのスナップ・ショットを示している。このオーディオは、明らかに48kHzまでの周波数成分を含んでいる。図3bでは、トレース44は、デシメーションおよびコア・エンコードの後の信号のスペクトルを示している。オーディオ周波数は、フィルタリングされて24kHzを超えるものが除去されており、サンプリング速度は、コア・コーダが高いサンプリング周波数で動作できないため、デシメータによって48kHzに低下させられることになる。トレース46は、拡張エンコーダに入る前の差信号のスペクトルを示す。明らかに、コア・コーダによって表されないスペクトルの部分、即ち、24kHzと48kHzの間のスペクトルに対して、そのデータ・リソースを集中することができる。
拡張ビットの幾らかをコア領域に割り振り、また幾らかを高周波数スペクトルに割り振るビット割り当てスキームは、最初に図7に示した。示すとおり、この双方は、出力オーディオ信号のバンド幅を拡張し、0〜24kHzの領域でのノイズ・フロアを低下させる。この例は、拡張コーダに割り振る追加のビットが存在することを想定している。図12に示す代替の適用例は、ビットの総数を既存のレベルに固定したままで、それらのビットをコア領域と拡張領域の間で割り振る。明らかに、高周波数性能の向上136が、24kHzまでの変更のないコア・ノイズ・フロア78より高いノイズ・フロア138に対してトレードオフされる。別の手法では、コア領域のノイズ・フロアはそのままにしておき、任意の追加ビットを、より高い周波数スペクトルにだけ割り振ることができる。24kHzあたりの遷移バンドにおけるエラーは相当に大きいので、高周波数スペクトルは、好ましくは、遷移バンドを含むように定義される。
この最後のケースでは、コア・エンコーダによって提供されるノイズ・フロアが十分に良好である、または高周波数スペクトルにおける向上が、ノイズ・フロアを低下させることよりも重要である、と想定している。いずれの場合でも、拡張ビットのどれも、再構築されたコア信号と関連するコード化エラーを減少させるためには、割り振られない。このため、このコード化プロセスは、必要な計算の数と遅延とを共に低減するように単純化することができ、これは、デコーダに影響を与えることなく、オーディオ機器の費用および複雑さを低減することができる。
図13に示すように、これは、まず、整数遅延を有する線形位相FIRフィルタ140を使用してデジタル・オーディオをローパス・フィルタリングし、24kHzを超える信号成分を除去することによって実現することができる。次に、このフィルタリングされた信号が、2でデシメート142され、実効48kHzのサンプリングされた信号をもたらす。次に、ダウン・サンプリングされた信号は、通常の様式でコア・エンコーダ144に送られ、その結果としてのビット・ストリームがパッカ146に入れられる。次に、ダウン・サンプリングされた信号は、2でアップ・サンプリング148されて、ローパス・フィルタリング150され、再構築された信号上の補間エイリアシングが除去される。この場合も、このフィルタリングは、整数サンプル遅延を有する線形位相FIRを使用して実現される。従って、再構築された信号は、やはり、コア・ビット・ストリームに保持されるオーディオ情報だけを搬送する。即ち、この信号は、24kHzを超えるオーディオ周波数成分を全く含まないが、コード化エラーがない。次に、再構築された信号が、入力信号の遅延(154)されたバージョンから減算152されて差信号を生じ、この差信号が、遅延(157)され、96kHzサンプリング・エンコーダ158を使用してエンコードされて拡張ビット・ストリームを生成する。
このスキームと図11aのスキームとの違いは、コア・エンコーダとデコーダの連鎖が、差信号を生成するプロセスにおいてバイパスされることである。トレードオフは、コア・エンコーダのコード化エラーが差信号に反映されないため、コア・エンコーダによってカバーされる周波数バンドにおけるノイズ・フロアを改善できないことである。従って、拡張エンコーダは、デシメーションおよび補間フィルタの遷移バンドから離れた低いサブバンドにビットを割り振ってはならない。
フィルタの特性の問題
コアのエンコードに先立って信号をフィルタリングするデシメーション・アンチエイリアシング・ローパス・フィルタ(LPF)の目的は、コア・アルゴリズムによって通常は表すことができない信号を除去することである。言い換えれば、消費者向け機器内に在るデコーダは、これらの周波数を利用するようにプログラミングされていない。エイリアシング効果および音質の劣化の可能性を回避するために、このフィルタは、通常、遷移点の前で良くロールオフする。ただし、このフィルタの仕様、即ち、そのリップル、遷移バンド幅、および阻止帯減衰をユーザが調整して、必要な品質標準を得ることができる。
補間アンチエイリアシング・フィルタの目的は、単に、エイリアシングのレベルが全体の品質に干渉しないように、補間エイリアシングを効率的に減衰させるのを確実にすることである。このフィルタは、単に、デシメーション・アンチエイリアシング・フィルタの複製でよい。ただし、デシメーション・フィルタの複雑性は、コア信号の品質を確保するためには高くなる可能性が高い。結果として、エンコーダおよび/またはデコーダでの計算負荷を簡素化するために、補間フィルタのサイズを抑えるのが望ましい。
通常、補間フィルタのフィルタ特性は、エンコーダとデコーダの両方において同じに保つのが望ましい。これは、デコーダでの加算が、エンコーダでの差処理を正確に反転するように、遅延と応答が正確に整合されるのを確実にする。ときとして、デコーダ補間フィルタの計算的複雑性を低減するのが望ましい。これは、エンコーダとデコーダとの補間プロセスの間でわずかな不整合を生じさせることになるが、適切なフィルタ設計でこの差を小さくすることが可能である。重要な別の問題は、これらのフィルタの遅延である。遅延が異なる場合、拡張連鎖またはコア連鎖に遅延を追加することによって、それを補償しなければならない。この場合も目的は、拡張信号とコア信号が、加算に先立って、正確に時間的に整合していることを確実にすることである。
コーデックの実施態様
前述したコード化スキームでは、エンコーダ/デコーダは、コア・ビット・ストリームに関しても、また拡張ビット・ストリームに関しても任意である。即ち、エンコーダ/デコーダは、サブバンド・コード化、変換コード化などの任意の組合せであることが可能である。一般的なコア・プラス拡張の手法は、2つの別個の実施形態に分けることができる。第1の実施態様は、コア・コーデックのアルゴリズムおよび内部構造の知識を必要とせず、コード化遅延の知識だけが必要とされるブラックボックス手法である。ただし、コア・コード化の性質が知られており、拡張コーダがそれに適合するように設計される場合、拡張コード化は、あるケースでは、より効率的に行うことができる。
ブラックボックス・コーデック
ブラックボックス手法は、コア・エンコーダおよびコア・デコーダの遅延を除いての、コア・コーダ/デコーダ(コーデック)の内部構造の知識が無いことを前提とする。一般的なコア・プラス拡張の手法を説明するのに上記で用いたブロック図は、ブラックボックス手法も例示する。示すとおり、コアおよび拡張のエンコードおよびデコードのプロセスは完全に別々である。唯一の相互作用は、差信号を形成するとき、または出力信号を加算するときに生じ、これは完全にその時間領域において発生する。従って、コア・コーデックの内部構造の知識は全く必要なく、また拡張コーデックの選択がコア・コーデックに依存または制約されることもない。ただし、遅延を、(a)差信号を形成する前に、再構築されたコア信号と入力信号とが正確に時間的に整合するように、また(b)コア信号と差信号が、デコーダで加算される前に正確に時間的に整合しているように、選択しなければならない。図11aおよび図11bに示す現在好ましい手法は、デコーダの必要なメモリを最小限に抑えるために、遅延のすべてをエンコーダに入れることである。
入力信号と再構築コア信号とを時間的に整合させるために、入力信号は、
遅延入力=遅延デシメーションLPF+遅延コア・エンコーダ+遅延コア・デコーダ+遅延補間LPF
に等しい量だけ遅延される。
デコーダでコア信号と差信号とを時間的に整合するために、フレーム・バッファ遅延は、
遅延フレーム・バッファ=遅延差信号+遅延拡張エンコーダ+遅延拡張デコーダ
に等しく設定される。
図11aに示すエンコーダの抱える問題は過度のコード化遅延であり、これは、
コード化遅延=遅延デシメーションLPF+遅延コア・エンコーダ+遅延差信号+遅延拡張エンコーダ+遅延拡張デコーダ+遅延コア・デコーダ+遅延補間LPF
のようになる。
この遅延は、図13に示すスキームが使用され、補間LPFが適切に設計される場合、
コード化遅延=遅延デシメーションLPF+遅延コア・エンコーダ+遅延コア・デコーダ+遅延補間LPF
のように短縮することができる。
ブラックボックス拡張コーダ
ブラックボックス拡張エンコーダ160に適するコーデックの一例を図14および図15に示している。このコーデックは、実質的に、現在、市販されるすべての主なオーディオ・コード化システムによって使用されているフィルタ・バンク型コード化技術に基づいている。DTS Coherent Acoustics(DTSコヒーレント・アコースティックス)、MPEG I、およびMPEG IIはサブバンド・コード化を使用し、AC−3およびMPEG II AACは、変換コード化を配備している。従って、本明細書に呈示するコーデックの詳細は、後述するオープンボックス実装形態で使用される拡張コーデックの実装形態に容易に適合させることができる。
拡張エンコーダ160を図14(a)に示す。差信号は、フィルタ・バンク162によってN個のサブバンドに分割されデシメートされる。各サブバンド信号は、図15(a)に示すサブバンド・コーダ164を使用してコード化することができる。次に、各サブバンド・エンコーダからのサブバンド・ビットが、拡張ビットとしてパックされる166。
デコーダ168を図14(b)に示す。拡張ビットは、まず、各個別サブバンド・ビットにアンパックされる170。次に、アンパックされたサブバンド・ビットが、図15(b)に示すサブバンド・デコーダ172によってデコードされ、再構築されたサブバンド信号を生成する。最後に、再構築サブバンド信号に合成フィルタ・バンク174を適用することにより、差信号が再構築される。
各サブバンド・エンコーダ(図14(a))内で、サブバンド・サンプルがサブバンド分析ウインドウにグループ化される。そのようなウインドウのそれぞれの中のサブバンド・サンプルが、4つ一組の予測フィルタ係数を最適化するために使用され、次に、これらの係数が、ツリー・サーチVQ方法を使用して量子化される。このベクトル量子化された予測係数は、各分析ウインドウ内のサブバンド信号を予測するのに使用される。予測利得は、サブバンド・サンプルの分散と予測残差の分散の比として得られる。予測利得が、予測係数のVQアドレスを伝送することのオーバーヘッド、および予測残差の後の量子化に起因する予測利得の考えられ得る損失をカバーするのに十分なだけ大きい正の値である場合、その予測残差は量子化され転送される。そうでなければ、予測残差は放棄され、サブバンド・サンプルが量子化されて転送される。サブバンド分析ウインドウに関する適応型予測の使用は、圧縮されたビット・ストリーム内の「予測モード」フラグによって示される。このように、適応型の予測は、量子化エラーを低減することができるときはいつでも動的に活性化される。
サブバンド分析ウインドウに対して予測モードがオンになっている場合、スケール・ファクタが計算され、これは予測残差のRMS(根二乗平均)またはピーク振幅のどちらかである。予測残差は、このスケール・ファクタによって正規化される。サブバンド分析ウインドウに対して予測モードがオンになっていない場合、考えられ得る過渡の存在に関して、サブバンド・サンプルを分析する。過渡は、低い振幅の位相と高い振幅の位相との間の鋭い又は急速な遷移として定義される。そのようなウインドウに対して単一のスケール・ファクタが使用される場合、それは過渡に先行する低レベル・サンプルに対して大きすぎる可能性があり、場合によっては、低ビット・レート・モードでの前エコーを引き起こし得る。この問題を緩和するため、各分析ウインドウは、幾つかのサブウインドウに分割される。過渡の位置は、分析サブウインドウに関して分析ウインドウ内に位置し、また、2つのスケール・ファクタ、一方は過渡前のサブウインドウ用で他方は過渡後のサブウインドウ用、が計算される。次に、過渡が生じたサブウインドウの識別番号が、コード化されたビット・ストリームにパックされる。その後、各サブウインドウ内のサブバンド・サンプルが、そのそれぞれのスケール・ファクタによって正規化される。
スケール・ファクタは、ビット・レートに応じて、64レベル(2.2dBステップ)または128レベル(1.1dBステップ)の根自乗テーブルを使用して対数的に量子化される。これらのスケール・ファクタは、140dBという範囲でオーディオの動的トラッキングを可能にする。量子化テーブルの選択は、各分析ウインドウごとにビット・ストリームに組み込まれる。
サブバンド分析ウインドウのタイム・スパンに対してウォータ・フィリング・アルゴリズムを使用して、すべてのチャネルのすべてのサブバンドにわたってビット割り当てを行うことができる。高ビット・レート適用例に関しては、ウォータ・フィリング(water filling)・アルゴリズムがサブバンドのパワーに対して動作する。低ビット・レートの適用例に関しては、全チャネルに対して音響心理学分析を行い、サブバンドに関する信号対マスク比(SMR)を得て、次に、そのSMRをウォータ・フィリング・アルゴリズムへ送ることによって、主観的トランスペアレント・コード化を実現する。無損失または可変のビット・レートコード化モードでは、ビット割り当ては量子化ステップ・サイズによって決定され、これは、量子化ノイズが、ソースPCMサンプルのLSBの1/2などのような、何らかの所定のしきい値を下回ることを保証する。このようにして得られたビット割振りが、次に、ビット・ストリームに組み込まれる。
ビット割振りの後、サブバンド・サンプルまたは予測残差が量子化され、量子化インデックスがビット・ストリーム内にパックされる。
人間の聴覚システムは、約5kHzを超えると、空間イメージングの認知を行うのに、オーディオ信号の時間的微細構造よりも、オーディオ信号の時間的エンベロープの方に頼ることを、音響心理学の研究が示している。従って、非常に低いビット・レートのモードでは、選択した数のオーディオ・チャネルの高周波数サブバンドの加算したものだけをコード化することによって、全体の再構築忠実度を向上させることが可能である。デコードされると、個々のチャネルのこれらの高周波数サブバンドは、この加算信号をコピーし、そのそれぞれのスケール・ファクタによってスケーリングを行うことによって、再構築することができる。結合強度コード化が採用される場合、加算サブバンド・サンプルは、結合チャネルのうちの1つ(ソース・チャネル)において搬送され、他のすべてのチャネルは、このソース・チャネルに対するインデックスおよびそのそれぞれのスケール・ファクタだけを搬送する。
低ビット・レートの適用例では、ハフマン・コードなどのエントロピ・コード化を使用して、スケール・ファクタ、過渡の位置、ビット割振り、または量子化インデックスが更にコード化される。この場合、エントロピコード化の後に実際に使用されている総ビットは、固定ビット・レートの適用例に対して許容される最大ビットよりも相当に少なくなり得る。許容される最大ビットを十分に利用するため、反復手法が採用され、それにより、すべての未使用ビットが尽きるまで、未使用ビットが、最低のサブバンドから最高のサブバンドまで増分方式で割り振られる。
ブラックボックス・デコーダ・ハードウェアの実施態様
デュアルHSARC 21065L浮動点プロセッサで動作する5.1チャネル、96kHz、24ビットDTSデコーダの一実施態様を図16〜図20に示す。「コア」ブロックのすべての処理およびシリアル入力/出力データ・ストリームの処理は、プロセッサ#1(P#1)180で行われる。拡張デコードに必要な信号処理動作の大部分は、プロセッサ#2(P#2)182に入れられている。この構成により、96/24「高精細度」オーディオ・フォーマットに対して簡単なハードウェア・アップグレード・パスを考慮することが可能になる。特に、「コア」デコードのみに関しては、プロセッサ#1を使用するのが十分であり、このプロセッサは、外部ポート186を介して外部メモリ184とインターフェースし、また、SPDIF受信機188に接続し、出力シリアル・ポート192を介して3つのSPDIF送信器190a、190b、190cに接続する。96kHzの24ビットのDTSデコーダに対するアップグレードは、プロセッサ#2をクラスタ多重処理コンフィギュレーションにおいて外部メモリ・バス194に接続することによって行われる。SHARCのオンチップ・バス・アービトレーション・ロジックにより、両方のプロセッサが共通バスを共有することが可能となる。
デジタル・ストリームは、DVDプレーヤから、またはDVDプレーヤ内のDVDトランスポート機構から得ることができる。SPDIF受信機は、デジタル・ストリームを受信し、それを適切な形式に変換してSHARC P#1のRxシリアル・ポート195へ送り込むために必要である。着信デジタル・ストリームは、DMAを使用して、Rxシリアル・ポートからSHARC P#1の内部メモリのデータ・バッファに転送される。
図17のブロック図196は、着信データ・ストリームの流れを示している。左および右チャネル(L、R)、サラウンド左およびサラウンド右チャネル(SL、SR)、ならびに中心および低周波数効果チャネル(C、LFE)に対する6つのデコードされたPCMストリームが、3つの出力ストリームに多重化される。SHARC P#1の内部メモリ内のデータ・バッファから適切な送信シリアル・ポートへ出力ストリームを転送するのに、3つのTxシリアル・ポートDMAチャネルが使用される。シリアル・ポートは、任意の市販のSPDIF送信器またはDACにフィードを行うように構成することができる。
図18のブロック図198は、発信データ・ストリームの流れを示している。クラスタ多重処理コンフィギュレーションにより、各プロセッサは、両方のプロセッサの共有外部メモリおよび共有I/Oレジスタにアクセスすることができる。2つのプロセッサ間でのデータ交換は、共有外部メモリの二バッファを介して行われる。詳細には、現在のDTSフレームからの「コア」オーディオ・データの6つのチャネルが、P#1の外部ポートDMAチャネルを使用して、P#1の内部メモリから共有外部メモリのブロック(例えば、ブロックA)のバッファへ転送される。更に、現在のDTSフレームからの拡張サブバンド・サンプルの5つのチャネルもまた、P#1の内部メモリから共有外部メモリの同じブロックのその対応するバッファへ転送される。この場合も、この転送のためにP#1の外部ポートDMAチャネルが使用される。
図19のブロック図200に示すとおり、現在のDTSフレーム中に、前のDTSフレームからの「コア」データおよび拡張データが、共有外部メモリのブロックBのその対応するバッファから、P#2の内部メモリへ転送される。これらの転送のスケジューリング、およびメモリ・ブロック(A/B)の切り替えは、両方のプロセッサのI/Oレジスタの制御を通じてP#1によって行われる。同様に、前のDTSフレームからの96kHzのPCMオーディオの6つのチャネルが、P#1の外部ポートDMAチャネルを使用して、共有外部メモリのブロックDのバッファからP#1の内部メモリへ転送される。図20のブロック図201が、このデータ・ストリーム・フローを示している。これらの転送のスケジューリングおよびメモリ・ブロック(C/D)の切り替えは、この場合も、両方のプロセッサのI/Oレジスタの制御を通じてP#1によって行われる。
オープンボックス・コーデックI
オープンボックス実装形態は、コア・コーデックの内部構造の知識を必要とする。図21および図22に示すエンコーダの例は、フィルタ・バンク手法を用いるコード化技法を用いたコア・エンコーダに関するものである。これらの技法には、サブバンド・コード化(DTS Coherent Acoustics、MPEG I、およびMPEG II)、および変換コード化(Dolby AC−3およびMPEG II AAC)が含まれるが、これらに限定はされない。コア・コードの内部構造を知ることで、拡張コーデックは、コア帯域幅、例えば、0kHzから24kHz、にわたってのその応答が、コア・コーダのその応答と整合するように、選択され設計される。その結果として、差信号は、時間領域においてではなく、変換またはサブバンド領域において形成することができる。これは、遅延の量および計算の数を低減させる。
第1の例では、デジタル・オーディオが、96kHz周期の24ビットPCMサンプルによって表されている。このデジタル・オーディオは、まず、ローパス・フィルタリング202されてそのバンド幅が24kHzより低くされ、次に、2でデシメート204されて、実効48kHzのサンプリングされた信号をもたらす。次に、このダウン・サンプリングされた信号が、コア・エンコーダ206に送り込まれる。コア・エンコーダのNバンド・フィルタ・バンク208が、ダウン・サンプリングされた信号をN個のサブバンドに分解する。各サブバンドは、多数の適応予測、スカラーおよび/またはベクトル量子化、およびエントロピコード化の技法210を使用して、コード化することができる。最適の構成では、サブバンド・コード化技法は、コア・エンコーダで使用される技法と一致することになる。次に、結果としてのビット・ストリームが、パッカに入れられる。このビット・ストリームはコア・サブバンド・デコーダ212に送り込まれて、サブバンド差信号を生成するための拡張エンコーダによる後の使用のためのサブバンド・サンプルを再構築する。
96kHzのサンプリングされた入力PCM信号は遅延214され、次に、2バンド・フィルタ・バンク216に送り込まれて、2つの48kHzのサンプリングされたサブバンド信号を生成する。低部バンド信号は、コア・エンコーダによって使用されるものと同じNバンド・フィルタ・バンク218により、N個のサブバンド信号に分解される。これらの信号のそれぞれが、コア・エンコーダからの再構築されたそのそれぞれのサブバンド信号で減算220されて、サブバンド差信号を生成する。この差サブバンド信号がサブバンド・コーダ222によってコード化され、次に、パッカ224に入れられる。2バンド・フィルタ・バンクからの上部バンド信号が、Mバンド・フィルタ・バンク226へ送り込まれ、M個のサブバンド信号を生成する。次に、これらの信号がサブバンド・コーダ228によってコード化されてパッカへ入れられる。このサブバンド・コーダは、多数の適応予測、スカラーおよびベクトル量子化、および/またはエントロピ・コード化を含むことができる。拡張エンコーダ前の遅延は、以下の式、
遅延+遅延2バンド・フィルタ=遅延デシメーションLPF
によって与えられ、従って、再構築されたコア・サブバンド信号およびオーディオ・サブバンド信号は、加算接合部220で正確に時間的に整合される(図21a参照)。デコーダ(図21b)において、これらの信号は、加算接合部で自動的に整合される。Mバンド・フィルタ・バンクは、その遅延がNバンド・フィルタ・バンクの遅延と一致するように設計されなければならない。そうでなければ、追加の遅延を導入して、上部バンドのサブバンド信号が、低部バンドのサブバンド信号と同じだけ遅延されるようにしなければならない。
デコード・プロセスを図21bに示している。コア・ビット・ストリームがアンパックされ230、デコードされて232、N個のコア・サブバンド信号を生成する。拡張デコーダがプレーヤに存在しない場合、これらのコア・サブバンド信号が、Nバンド合成フィルタ・バンク234へ送り込まれ、コア・オーディオを生成する。存在する場合は、このステップはスキップされ、コア・サブバンド信号は、拡張デコーダ236へ送り込まれ、拡張ビット・ストリームからデコード240された差サブバンド信号と加算238される。次に、これらの加算されたサブバンド信号がNバンド合成フィルタ・バンク242へ送られ、低部バンド信号を生成する。上部バンド信号は、拡張ビット・ストリームをデコード244し、デコードされたMサブバンド信号をMバンド合成フィルタ・バンク246へ送り込むことによって形成される。最後に、上部バンド信号および低部バンド信号が2バンク合成フィルタ・バンク248へ送られ、96kHzのサンプリングされたオーディオ出力を生成する。
このオープンボックス手法の利点には、以下の低減されたコード化遅延、
エンコーディング遅延=遅延デシメーションLPF+遅延コア・エンコーダ
デコーディング遅延=遅延コア・デコーダ+遅延2バンド・フィルタ
およびデコードの複雑性、
デコーディングMIPS=MIPSコア・デコーダ+MIPSMバンド・フィルタ+MIPS2バンド・フィルタ
が含まれる。
Mバンド・フィルタ・バンクおよび2バンド・フィルタ・バンクに関するFIRフィルタ・タップの数が十分に小さくなるように選択された場合、Mバンド合成フィルタ・バンクおよび2バンド合成フィルタ・バンクに必要なMIPSは、48kHzで動作するNバンド合成フィルタ・バンクのMIPSよりも小さくすることが可能である。従って、96kHzのオーディオをデコードするための総MIPSは、48kHzのサンプリングされたオーディオを扱うコア・デコーダによって必要とされるMIPSの2倍よりも小さくなり得る。
オープンボックス・コーデックII
Mバンド・フィルタ・バンクが、好ましい実装形態IIのNバンド・フィルタ・バンクで置き換えられた場合、拡張コーデック内の3つのフィルタ・バンクを組み合わせて、Lバンド・フィルタ・バンクを形成することができる。ここでL=M+N(図22aおよび図22b)である。組み合わせたLバンド・フィルタ・バンクは、高速のアルゴリズムを使用してコサイン変調が実施される場合には、計算負荷をより少なくできる。
図22aは、オープンボックス実施態様IIのそれと基本的に同じであるが、拡張エンコーダ内の3つの分析フィルタ・バンクが、単一のLバンド分析フィルタ・バンク250によって置き換えられていることと、およびコア・エンコーダからの再構築サブバンド信号がLバンド・フィルタ・バンクの低部Nサブバンド信号から減算されて差サブバンド信号を生成するということとが、異なっている。これが可能なのは、96kHzサンプリング・レートで動作する拡張エンコーダのLバンド・フィルタ・バンクの低部のNサブバンドのそれぞれが、48kHzサンプリング・レートで動作するコア・エンコーダのNバンド・フィルタ・バンクのサブバンドと同じオーディオ・スペクトルをカバーするからである。このスキームが成功するためには、もちろん、Lバンド・フィルタ・バンクとNバンド・フィルタ・バンクとが異なるサンプリング周波数で動作するにもかかわらずこれらのフィルタ特性が互いに整合することが、必要不可欠である。
図22bに示すデコード手順は、図21bの手順とほとんど同じであるが、3つの合成フィルタ・バンクが、1つのLバンド合成フィルタ・バンク252で置き換えられていることと、コア・デコーダの再構築サブバンドが、Lバンド・フィルタ・バンクから出てくる対応する低部Nサブバンドに付加されることとが異なっている。
本発明のいくつかの例示的な実施形態を示し、説明してきたが、当分野の技術者は、多数の変形形態および代替の実施形態を思いつくであろう。例えば、ここで議論したサンプリング・レートは現在の標準に対応している。時の経過とともに、これらのサンプリング・レートは変わる可能性がある。そのような変形形態および代替の実施形態が企図され、それらは添付の特許請求の範囲に定義された本発明の趣旨および範囲を逸脱することなく作ることができる。
図1は、従来の手法でのコード化のためにベース周波数バンドと高周波数バンドを分離するのに使用された2バンド・デシメーション・フィルタバンクの周波数応答のグラフである。 図2は、本発明の一般化したコアおよび拡張フレームワークを具体化するエンコーダのブロック図である。 図3aおよび図3bは、それぞれ、入力オーディオ信号の周波数スペクトルと、コード化されたコア信号の周波数スペクトルと差信号のグラフである。 図4は、コアおよび拡張オーディオ・データの一フレームに関するビット・ストリーム・フォーマットを示す。 図5aは、デコーダへ一ビット・ストリームを送るための物理的媒体を示す。 図5bは、デコーダへ一ビット・ストリームを送るための放送システムを示す。 図6は、図2に示すコアおよび拡張コーダに適合するデコーダのブロック図である。 図7は、複数トーン試験信号のための再構築されたオーディオ信号の周波数スペクトルのグラフである。 図8aは、高分解能拡張フレームワークを具体化するエンコーダのブロック図である。 図8bは、高分解能拡張フレームワークを具体化するデコーダのブロック図である。 図9は、高分解能拡張フレームワークの差信号の周波数スペクトルのグラフである。 図10は、高分解能拡張フレームワークの複数トーン試験信号のための再構築されたオーディオ信号の周波数スペクトルのグラフである。 図11aは、高周波数拡張フレームワークを実現するエンコーダのブロック図である。 図11bは、高周波数拡張フレームワークを実現するデコーダのブロック図である。 図12は、固定ビット・レートの複数トーン試験信号のための再構築されたオーディオ信号の周波数スペクトルのグラフである。 図13は、代替の高周波数拡張フレームワークを実現するエンコーダのブロック図である。 図14aおよび図14bは、それぞれ、拡張エンコーダおよび拡張デコーダのブロック図である。 図15aおよび図15bは、サブバンド・エンコーダおよびサブバンド・デコーダのブロック図である。 図16は、ブラックボックス・ハードウェア・アーキテクチャのブロック図である。 図17は、第1のプロセッサのオンチップ・メモリに対するシリアル入力からのデータ・フローを示す。 図18は、シリアル・ポートに対する第1のプロセッサのオンチップ・メモリからのデータ・フローを示す。 図19は、第2のプロセッサのオンチップ・メモリに対する第1のプロセッサのオンチップ・メモリからのデータ・フローを示す。 図20は、第1のプロセッサのオンチップ・メモリに対する第2のプロセッサのオンチップ・メモリからのデータ・フローを示す。 図21aは、オープンボックス・エンコーダのブロック図である。 図21bは、オープンボックス・デコーダのブロック図である。 図22aは、別のオープンボックス・エンコーダのブロック図である。 図22bは、別のオープンボックス・デコーダのブロック図である。

Claims (8)

  1. マルチチャネル・オーディオ・エンコーダであって、各チャネルについて、
    アナログ・オーディオ信号を入力オーディオ帯域幅に帯域制限するアナログ・アンチエイリアシング・ロー・パス・フィルタと、
    一連のフレームのデジタル・オーディオ信号を生成するように、入力サンプリング・レートで、帯域制限された前記アナログ・オーディオ信号をサンプリングするサンプラと、
    コア・オーディオ帯域幅より上の信号成分を取り除き、且つ前記コア・オーディオ帯域幅より下の遷移帯域の信号成分を減衰させるように、前記デジタル・オーディオ信号をフィルタリングするデシメーション・ロー・パス・フィルタと、
    コア・サンプリング・レートでコア信号を抽出するように、フィルタリングされた前記信号をダウン・サンプリングするデシメータと、
    既知の遅延を除いて、マルチチャネル・オーディオ・デコーダのベースとバックワード・コンパチブルである未知の内部構造を有するコア・エンコーダであって、前記コア・オーディオ帯域幅へのフォールドバック・エイリアシングなしに、前記コア信号をコア・ビットへとコード化するコア・エンコーダと、
    マルチチャネル・オーディオ・デコーダのベースから選択され、前記コア・サンプリング・レートで、再構築されたコア信号を形成するように、前記コア・ビットをデコードするコア・デコーダと、
    少なくとも1フレームに対する前記コア・ビットを記憶するフレーム・バッファと、
    前記再構築されたコア信号を前記入力サンプリング・レートへアップサンプリングする補間器と、
    補間エイリアシングを取り除くために、アップサンプリングされた前記再構築されたコア信号をフィルタリングする補間ロー・パス・フィルタと、
    前記コア・エンコーダの前記既知の遅延と等しい量だけ前記デジタル・オーディオ信号を遅延させる第1遅延エレメントと、
    前記入力サンプリング・レートで差信号を形成するように、時間領域において、遅延された前記デジタル・オーディオ信号から、フィルタリングされた前記再構築されたコア信号を減算する加算ノードと、
    拡張エンコーダであって、
    前記入力サンプリング・レートで時間領域の前記差信号を、前記コア・オーディオ帯域幅にわたる複数であるN個の低部副帯域と、前記入力オーディオ帯域幅と前記コア・オーディオ帯域幅との間の差にわたる複数であるM個の上部副帯域とを含む副帯域に分解する、分析フィルタと、
    少なくとも前記遷移帯域において、再構築されたオーディオ信号の忠実度を向上させる低部拡張ビットを生成するように、少なくとも遷移帯域を含む前記N個の低部副帯域をコード化するN副帯域コーダと、
    前記コア・オーディオ帯域幅と前記入力オーディオ帯域幅との間において、再構築されたオーディオ信号の忠実度を向上させる上部拡張ビットを生成するように、前記M個の上部副帯域をコード化するM副帯域コーダと
    を含む拡張エンコーダと、
    前記コア・ビットのみをデコードするマルチチャネル・オーディオ・デコーダの前記ベースとバックワード・コンパチブルであり且つ前記コア・ビットおよび前記拡張ビットをデコードするマルチチャネル・デコーダとコンパチブルである、一連の同期されたマルチチャネル・オーディオ・フレームにおけるコア・プラス拡張フォーマットのビット・ストリームへと、前記コア・ビットおよび前記拡張ビットをパックするパッカと
    を備える、マルチチャネル・オーディオ・エンコーダ。
  2. それぞれのオーディオ・チャネルが入力サンプリング・レートでサンプリングされ且つ入力オーディオ帯域幅を有するものであり、ビット・ストリームから複数のオーディオ・チャネルを再構築するためのマルチチャネル・ブラックボックス・オーディオ・デコーダであって、
    マルチチャネル・オーディオ・デコーダのベースとバックワード・コンパチブルのコア・プラス拡張フレーム・フォーマットで一度に1つのフレームずつ前記ビット・ストリームを読み込んで記憶するアンパッカであって、前記フレームのそれぞれが、コア・ビットを有するコア・フィールドと、拡張同期ワードおよび拡張ビットを有する拡張フィールドとを含むものであり、前記コア・ビットを抽出し、前記同期ワードを検出して、前記拡張ビットを抽出して分離するアンパッカと、
    マルチチャネル・オーディオ・デコーダの前記ベースから選択されるコア・デコーダであって、前記コア・ビットのみをデコードして、コア・オーディオ帯域幅にわたってフォールドバック・エイリアシングなしに、コア・サンプリング・レートで、再構築されたコア信号を形成するコア・デコーダと、
    拡張デコーダであって、
    前記拡張ビットを、遷移帯域を含む前記コア・オーディオ帯域幅にわたるN個の低部拡張副帯域信号へとデコードするN拡張副帯域デコーダと、
    前記拡張ビットを、M個の上部拡張副帯域信号へとデコードするM拡張副帯域デコーダと、
    前記N個の低部拡張副帯域信号と前記M個の上部拡張副帯域信号とを、前記入力サンプリング・レートで、再構築された差信号へと合成する合成フィルタと
    を含む拡張デコーダと、
    前記再構築されたコア信号を前記入力サンプリング・レートにアップサンプリングする補間器と、
    アップサンプリングした前記再構築されたコア信号をフィルタリングして補間エイリアシングを減衰させるローパス・フィルタと、
    前記コア・オーディオ帯域幅の少なくとも遷移帯域内で前記再構築されたコア・オーディオ信号の忠実度を向上させ、信号の忠実度を前記入力オーディオ帯域幅へと拡げるように、前記再構築された差オーディオ信号を、時間領域において、前記入力サンプリング・レートで、前記再構築されたコア・オーディオ信号に加算する加算ノードと
    を備えるオーディオ・デコーダ。
  3. マルチチャネル・オーディオ・エンコーダであって、各チャネルについて、
    アナログ・オーディオ信号を入力オーディオ帯域幅に帯域制限するアナログ・アンチエイリアシング・ロー・パス・フィルタと、
    一連のフレームのデジタル・オーディオ信号を生成するように、入力サンプリング・レートで、帯域制限された前記アナログ・オーディオ信号をサンプリングするサンプラと、
    コア・オーディオ帯域幅より上の信号成分を取り除き、且つ前記コア・オーディオ帯域幅より下の遷移帯域の信号成分を減衰させるように、前記デジタル・オーディオ信号をフィルタリングするデシメーション・ロー・パス・フィルタと、
    コア・サンプリング・レートでコア信号を抽出するように、フィルタリングされた前記信号をダウン・サンプリングするデシメータと、
    マルチチャネル・オーディオ・デコーダのベースとバックワード・コンパチブルのコア・エンコーダであって、前記コア・サンプリング・レートで、前記デジタル・オーディオ信号を、前記コア・オーディオ帯域幅にわたるN個のコア副帯域の複数の副帯域信号へと分解する分析フィルタと、コア・ビットを生成するように、前記コア・オーディオ帯域幅へのフォールドバック・エイリアシングなしに、前記N個の副帯域信号をコード化するN副帯域コーダとを含む、コア・エンコーダと、
    拡張エンコーダであって、
    前記入力サンプリング・レートで、前記デジタル・オーディオ信号を、前記コア・オーディオ帯域幅にわたる複数であるN個の低部副帯域と、前記入力オーディオ帯域幅と前記コア・オーディオ帯域幅との間の差にわたる複数であるM個の上部副帯域との拡張副帯域信号へと分解する分析フィルタであって、前記コア・サンプリング・レートでの前記コア分析フィルタのフィルタ特性と、前記入力サンプリング・レートでの前記拡張分析フィルタのフィルタ特性とは、前記N個のコア副帯域にわたって整合する、分析フィルタと、
    マルチチャネル・オーディオ・デコーダの前記ベースとコンパチブルであり、N個の再構築されたコア副帯域信号を生成するように前記コア・ビットをデコードするNコア副帯域デコーダと、
    前記N個の再構築されたコア副帯域信号と前記N個の拡張副帯域信号とのそれぞれから、N個の差副帯域信号を形成するN加算ノードと、
    少なくとも前記遷移帯域において、再構築されたオーディオ信号の忠実度を向上させる低部拡張ビットを形成するように、前記N個の差副帯域信号をコード化するN副帯域コーダと、
    前記コア・オーディオ帯域幅と前記入力オーディオ帯域幅との間において、再構築されたオーディオ信号の忠実度を向上させる上部帯域拡張ビットを形成するように、前記M個の拡張副帯域信号をコード化するM副帯域コーダと
    を含む拡張エンコーダと、
    パッカであって、フォールドバック・エイリアシングなしにコア・オーディオ信号を再構築するために前記コア・ビットのみをデコードするマルチチャネル・オーディオ・デコーダの既存の前記ベースとバックワード・コンパチブルであり、且つ前記コア・オーディオ帯域幅内の少なくとも遷移帯域において忠実度を向上させ、前記入力オーディオ帯域幅にわたって前記再構築されたオーディオ信号の忠実度を拡げるように、オーディオ信号を再構築するために前記コア・ビットおよび前記拡張ビットをデコードするマルチチャネル・デコーダとコンパチブルである、一連の同期されたマルチチャネル・オーディオ・フレームにおけるコア・プラス拡張フォーマットのビット・ストリームへと、前記コア・ビットおよび前記低部拡張ビットおよび前記上部拡張ビットをパックするものであり、それぞれの前記フレームは、前記コア・ビットが直後に続くコア同期ワードを有するコア・フィールドと、前記低部拡張ビットおよび前記上部拡張ビットが直後に続く拡張同期ワードを有する拡張フィールドとを含むものである、パッカと
    を備える、マルチチャネル・オーディオ・エンコーダ。
  4. マルチチャネル・オーディオ・エンコーダであって、各チャネルについて、
    アナログ・オーディオ信号を入力オーディオ帯域幅に帯域制限するアナログ・アンチエイリアシング・ロー・パス・フィルタと、
    一連のフレームのデジタル・オーディオ信号を生成するように、入力サンプリング・レートで、帯域制限された前記アナログ・オーディオ信号をサンプリングするサンプラと、
    前記入力サンプリング・レートで前記デジタル・オーディオ信号を、コア・オーディオ帯域幅にわたる複数であるN個の低部副帯域と、前記入力オーディオ帯域幅と前記コア・オーディオ帯域幅との間の差にわたる複数であるM個の上部副帯域との副帯域信号に分解する分析フィルタと
    前記N個の副帯域信号をコード化してコア・ビットを生成するN個の副帯域コーダを含むコア・エンコーダと、
    前記コア・ビットをデコードして、コア・オーディオ帯域幅の少なくとも遷移帯域にわたる複数の再構築されたコア副帯域信号を生成する複数のコア副帯域デコーダと、
    前記複数の再構築されたコア副帯域信号および関連する複数の前記副帯域信号から、それぞれ、複数の差副帯域信号を形成する複数の加算ノードと、
    少なくとも前記遷移帯域における信号の忠実度を向上させる拡張ビットを生成するように前記複数の差副帯域信号をコード化する複数の副帯域コーダと、
    前記コア・オーディオ帯域幅をこえて前記入力オーディオ帯域幅にわたる信号の忠実度を向上させる拡張ビットを生成するように前記M個の副帯域信号をコード化するM副帯域コーダと、
    パッカであって、コア・サンプリング・レートで前記コア・オーディオ帯域幅にわたるオーディオ信号を再構築するために前記コア・ビットのみをデコードするマルチチャネル・オーディオ・デコーダの既存の前記ベースとバックワード・コンパチブルであり、且つ前記入力オーディオ帯域幅内での忠実度の向上を伴って前記入力サンプリング・レートでオーディオ信号を再構築するために前記コア・ビットおよび前記拡張ビットをデコードするマルチチャネル・デコーダとコンパチブルである、一連の同期されたマルチチャネル・オーディオ・フレームにおけるコア・プラス拡張フォーマットのビット・ストリームへと、前記コア・ビットおよび前記拡張ビットをパックするものであり、それぞれの前記フレームは、前記コア・ビットが直後に続くコア同期ワードを有するコア・フィールドと、前記拡張ビットが直後に続く拡張同期ワードを有する拡張フィールドとを含むものである、パッカと
    を備える、マルチチャネル・オーディオ・エンコーダ。
  5. 前記マルチチャネル・オーディオ・エンコーダであって、前記分析フィルタが、前記コア・サンプリング・レートでコア・オーディオ信号を、コア・オーディオ帯域幅にわたるN個のコア副帯域の複数の副帯域信号へと分解するコア分析フィルタと、前記入力サンプリング・レートで前記デジタル・オーディオ信号を、前記コア・オーディオ帯域幅にわたる複数であるN個の低部副帯域と、前記入力オーディオ帯域幅と前記コア・オーディオ帯域幅との間の差にわたる複数であるM個の上部副帯域との拡張副帯域信号へと分解する拡張分析フィルタとを備えるものであり、更に、
    コア・オーディオ帯域幅より上の信号成分を取り除き、且つ前記コア・オーディオ帯域幅より下の遷移帯域の信号成分を減衰させるように、前記デジタル・オーディオ信号をフィルタリングするデシメーション・ロー・パス・フィルタと、
    前記コア分析フィルタへ入力される前記コア・サンプリング・レートの前記コア信号を抽出するように、フィルタリングされた前記信号をダウン・サンプリングするデシメータと
    を備えるマルチチャネル・オーディオ・エンコーダ
  6. それぞれのオーディオ・チャネルが入力サンプリング・レートでサンプリングされ且つ入力オーディオ帯域幅を有するものであり、ビット・ストリームから複数のオーディオ・チャネルを再構築するためのマルチチャネル・オープンボックス・オーディオ・デコーダであって、
    マルチチャネル・オーディオ・デコーダのベースとバックワード・コンパチブルのコア・プラス拡張フレーム・フォーマットで一度に1つのフレームずつ前記ビット・ストリームを読み込んで記憶するアンパッカであって、前記フレームのそれぞれが、コア・ビットを有するコア・フィールドと、拡張同期ワードおよび拡張ビットを有する拡張フィールドとを含むものであり、前記コア・ビットを抽出し、前記同期ワードを検出して、前記拡張ビットを抽出して分離するアンパッカと、
    マルチチャネル・オーディオ・デコーダの前記ベースとコンパチブルであり、前記コア・ビットを、遷移帯域を含むコア・オーディオ帯域幅にわたるN個のコア副帯域信号へとデコードするNコア副帯域デコーダと、
    前記拡張ビットを、前記コア・オーディオ帯域幅にわたるN個の低部拡張副帯域信号へとデコードするN拡張副帯域デコーダと、
    前記拡張ビットを、前記入力オーディオ帯域幅へ拡がるM個の上部拡張副帯域信号へとデコードするM拡張副帯域デコーダと、
    N個の複合副帯域信号を形成するように前記N個のコア副帯域信号を対応する前記N個の拡張副帯域信号に加算するN加算ノードと、
    前記コア・オーディオ帯域幅の少なくとも前記遷移帯域内および前記入力オーディオ帯域幅にいたる前記拡張オーディオ帯域幅での忠実度の改善を伴って前記入力サンプリング・レートでマルチチャネル・オーディオ信号を再構築するように、前記N個の複合副帯域信号と前記M個の拡張副帯域信号とを合成するフィルタと
    を備えるオーディオ・デコーダ。
  7. マルチチャネル・オープンボックス・オーディオ・デコーダであって、
    一度に1つのフレームずつ前記ビット・ストリームを読み込んで記憶するアンパッカであって、各フレームのコア・フィールドからコア・ビットを抽出し、且つ、拡張ビットが検出された場合には前記拡張ビットを抽出して分離するアンパッカと、
    マルチチャネル・オーディオ・デコーダのベースとコンパチブルであり、前記コア・ビットを、コア・オーディオ帯域幅にわたるN個のコア副帯域信号へとデコードするNコア副帯域デコーダと、
    コア・サンプリング・レートでフォールドバック・エイリアシングなしにマルチチャネル・オーディオ信号を再構築するように前記N個のコア副帯域信号を合成するコア・フィルタと、
    前記拡張ビットを、前記コア・オーディオ帯域幅にわたるN個の低部拡張副帯域信号へとデコードするN拡張副帯域デコーダと、
    前記拡張ビットを、前記入力オーディオ帯域幅へ拡がるM個の上部拡張副帯域信号へとデコードするM拡張副帯域デコーダと、
    N個の複合副帯域信号を形成するように前記N個のコア副帯域信号を対応する前記N個の拡張副帯域信号に加算するN加算ノードと、
    前記コア・オーディオ帯域幅内および前記入力オーディオ帯域幅にいたる前記拡張オーディオ帯域幅での忠実度の改善を伴って前記入力サンプリング・レートでマルチチャネル・オーディオ信号を再構築するように、前記N個の複合副帯域信号と前記M個の拡張副帯域信号とを合成する拡張フィルタと
    を備えるオーディオ・デコーダ。
  8. 請求項7に記載のマルチチャネル・オープンボックス・オーディオ・デコーダであって、前記コア・サンプリング・レートでの前記コア・フィルタのフィルタ特性と、前記入力サンプリング・レートでの前記拡張フィルタのフィルタ特性とは、前記N個のコア副帯域にわたって整合する、オーディオ・デコーダ。
JP2007236798A 1999-06-21 2007-09-12 デコーダの互換性を失わない確立済み低ビット・レートのオーディオ・コード化システムの音質の改善 Pending JP2008020931A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09/337,405 US6226616B1 (en) 1999-06-21 1999-06-21 Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001505004A Division JP4204227B2 (ja) 1999-06-21 2000-06-19 マルチチャネル・オーディオ・エンコーダおよびマルチチャネル・オーディオ・デコーダ

Publications (1)

Publication Number Publication Date
JP2008020931A true JP2008020931A (ja) 2008-01-31

Family

ID=23320428

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2001505004A Expired - Lifetime JP4204227B2 (ja) 1999-06-21 2000-06-19 マルチチャネル・オーディオ・エンコーダおよびマルチチャネル・オーディオ・デコーダ
JP2007236798A Pending JP2008020931A (ja) 1999-06-21 2007-09-12 デコーダの互換性を失わない確立済み低ビット・レートのオーディオ・コード化システムの音質の改善

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2001505004A Expired - Lifetime JP4204227B2 (ja) 1999-06-21 2000-06-19 マルチチャネル・オーディオ・エンコーダおよびマルチチャネル・オーディオ・デコーダ

Country Status (9)

Country Link
US (1) US6226616B1 (ja)
EP (2) EP1204970B1 (ja)
JP (2) JP4204227B2 (ja)
KR (1) KR100606992B1 (ja)
CN (1) CN1154087C (ja)
AU (1) AU5745200A (ja)
HK (1) HK1043422A1 (ja)
TW (1) TW565826B (ja)
WO (1) WO2000079520A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018512100A (ja) * 2015-02-12 2018-05-10 ディーティーエス・インコーポレイテッドDTS,Inc. オーディオ処理のためのマルチレートシステム
CN108292506A (zh) * 2015-12-01 2018-07-17 Ati科技无限责任公司 使用视频信息的音频编码
JP2019536112A (ja) * 2016-11-08 2019-12-12 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. サイドゲインおよび残余ゲインを使用してマルチチャネル信号を符号化または復号するための装置および方法

Families Citing this family (163)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030195974A1 (en) * 1998-12-04 2003-10-16 Ronning Joel A. Apparatus and method for scheduling of search for updates or downloads of a file
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US7283965B1 (en) * 1999-06-30 2007-10-16 The Directv Group, Inc. Delivery and transmission of dolby digital AC-3 over television broadcast
WO2001033555A1 (en) * 1999-10-30 2001-05-10 Stmicroelectronics Asia Pacific Pte. Ltd. Method of encoding an audio signal using a quality value for bit allocation
US7584291B2 (en) * 2000-05-12 2009-09-01 Mosi Media, Llc System and method for limiting dead air time in internet streaming media delivery
WO2001093266A1 (en) * 2000-05-30 2001-12-06 Koninklijke Philips Electronics N.V. Coded information on cd audio
US7076053B1 (en) * 2001-01-12 2006-07-11 3Com Corporation System for the processing of audio data used for music on hold and paging in a private branch exchange
US7631088B2 (en) * 2001-02-27 2009-12-08 Jonathan Logan System and method for minimizing perceived dead air time in internet streaming media delivery
JP4008244B2 (ja) * 2001-03-02 2007-11-14 松下電器産業株式会社 符号化装置および復号化装置
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
GB0119569D0 (en) * 2001-08-13 2001-10-03 Radioscape Ltd Data hiding in digital audio broadcasting (DAB)
JP4245288B2 (ja) 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
BR0206395A (pt) * 2001-11-14 2004-02-10 Matsushita Electric Ind Co Ltd Dispositivo de codificação, dispositivo de decodificação e sistema dos mesmos
EP1701340B1 (en) 2001-11-14 2012-08-29 Panasonic Corporation Decoding device, method and program
JP4308229B2 (ja) * 2001-11-14 2009-08-05 パナソニック株式会社 符号化装置および復号化装置
US7469206B2 (en) 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
CN1639984B (zh) * 2002-03-08 2011-05-11 日本电信电话株式会社 数字信号编码方法、解码方法、编码设备、解码设备
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US20040125707A1 (en) * 2002-04-05 2004-07-01 Rodolfo Vargas Retrieving content of various types with a conversion device attachable to audio outputs of an audio CD player
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
TW573293B (en) * 2002-09-13 2004-01-21 Univ Nat Central Nonlinear operation method suitable for audio encoding/decoding and an applied hardware thereof
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7606330B2 (en) * 2002-09-27 2009-10-20 Broadcom Corporation Dual-rate single band communication system
US7272566B2 (en) * 2003-01-02 2007-09-18 Dolby Laboratories Licensing Corporation Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
EP1496500B1 (en) * 2003-07-09 2007-02-28 Samsung Electronics Co., Ltd. Bitrate scalable speech coding and decoding apparatus and method
CN1830148B (zh) * 2003-07-29 2010-11-24 松下电器产业株式会社 音频信号频带扩展装置
JP2005086486A (ja) * 2003-09-09 2005-03-31 Alpine Electronics Inc オーディオ装置およびオーディオ処理方法
JP4679049B2 (ja) 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DK1741093T3 (da) 2004-03-25 2011-09-12 Dts Inc Skalérbar, tabsfri audio-codec og authoringsværktøj
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
US8626494B2 (en) * 2004-04-30 2014-01-07 Auro Technologies Nv Data compression format
KR100636145B1 (ko) * 2004-06-04 2006-10-18 삼성전자주식회사 확장된 고해상도 오디오 신호 부호화 및 복호화 장치
NL1029156C2 (nl) * 2004-06-04 2006-07-25 Samsung Electronics Co Ltd Apparaat en werkwijze.
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
US10848118B2 (en) 2004-08-10 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US10158337B2 (en) 2004-08-10 2018-12-18 Bongiovi Acoustics Llc System and method for digital signal processing
US8284955B2 (en) 2006-02-07 2012-10-09 Bongiovi Acoustics Llc System and method for digital signal processing
US11431312B2 (en) 2004-08-10 2022-08-30 Bongiovi Acoustics Llc System and method for digital signal processing
TWI377564B (en) * 2004-08-17 2012-11-21 Panasonic Corp Information storage medium and multiplexing device
KR100825548B1 (ko) * 2004-08-17 2008-04-28 마쯔시다덴기산교 가부시키가이샤 정보 기록 매체, 데이터 분별 장치, 및 데이터 재생 장치
US8068722B2 (en) * 2004-10-07 2011-11-29 Panasonic Corporation Information storage medium, TS packet judgement apparatus, and data reproduction apparatus
KR20070070174A (ko) * 2004-10-13 2007-07-03 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치, 스케일러블 복호 장치 및스케일러블 부호화 방법
SE0402651D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
KR100617165B1 (ko) * 2004-11-19 2006-08-31 엘지전자 주식회사 워터마크 삽입/검출 기능을 갖는 오디오 부호화/복호화장치 및 방법
DE102004056447A1 (de) * 2004-11-23 2006-05-24 Siemens Ag Codierverfahren und Decodierverfahren, sowie Codiervorrichtung und Decodiervorrichtung
US7937272B2 (en) 2005-01-11 2011-05-03 Koninklijke Philips Electronics N.V. Scalable encoding/decoding of audio signals
JP2006243041A (ja) * 2005-02-28 2006-09-14 Yutaka Yamamoto 高域補間装置及び再生装置
JP2006243043A (ja) * 2005-02-28 2006-09-14 Sanyo Electric Co Ltd 高域補間装置及び再生装置
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US8086451B2 (en) * 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8311840B2 (en) * 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
JP4391450B2 (ja) * 2005-07-28 2009-12-24 シャープ株式会社 再生装置、コンテンツ記録媒体、再生装置の制御方法、制御プログラムおよび記録媒体
US7653533B2 (en) 2005-10-24 2010-01-26 Lg Electronics Inc. Removing time delays in signal paths
US7546237B2 (en) * 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
KR100953642B1 (ko) * 2006-01-19 2010-04-20 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US10701505B2 (en) 2006-02-07 2020-06-30 Bongiovi Acoustics Llc. System, method, and apparatus for generating and digitally processing a head related audio transfer function
KR100991795B1 (ko) * 2006-02-07 2010-11-04 엘지전자 주식회사 부호화/복호화 장치 및 방법
US10848867B2 (en) 2006-02-07 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
EP1852849A1 (en) 2006-05-05 2007-11-07 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8150065B2 (en) * 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8934641B2 (en) * 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
EP1881485A1 (en) * 2006-07-18 2008-01-23 Deutsche Thomson-Brandt Gmbh Audio bitstream data structure arrangement of a lossy encoded signal together with lossless encoded extension data for said signal
EP1883067A1 (en) * 2006-07-24 2008-01-30 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US8190441B2 (en) * 2006-09-11 2012-05-29 Apple Inc. Playback of compressed media files without quantization gaps
CN1920947B (zh) * 2006-09-15 2011-05-11 清华大学 用于低比特率音频编码的语音/音乐检测器
JP4325657B2 (ja) * 2006-10-02 2009-09-02 ソニー株式会社 光ディスク再生装置、信号処理方法、およびプログラム
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
US7912729B2 (en) 2007-02-23 2011-03-22 Qnx Software Systems Co. High-frequency bandwidth extension in the time domain
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
ES2526333T3 (es) * 2007-08-27 2015-01-09 Telefonaktiebolaget L M Ericsson (Publ) Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda
CN101388212B (zh) * 2007-09-15 2011-05-11 华为技术有限公司 基于噪声整形的语音编解码方法、编解码装置
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8239210B2 (en) * 2007-12-19 2012-08-07 Dts, Inc. Lossless multi-channel audio codec
US20090164223A1 (en) * 2007-12-19 2009-06-25 Dts, Inc. Lossless multi-channel audio codec
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
EP2232488B1 (en) * 2008-01-14 2011-07-13 Telefonaktiebolaget LM Ericsson (publ) Objective measurement of audio quality
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
CN101685637B (zh) * 2008-09-27 2012-07-25 华为技术有限公司 音频编码方法及装置和音频解码方法及装置
JP5031006B2 (ja) * 2009-09-04 2012-09-19 パナソニック株式会社 スケーラブル復号化装置及びスケーラブル復号化方法
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
CN101964188B (zh) 2010-04-09 2012-09-05 华为技术有限公司 语音信号编码、解码方法、装置及编解码系统
US9378754B1 (en) 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
WO2011156905A2 (en) * 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
CN102610231B (zh) * 2011-01-24 2013-10-09 华为技术有限公司 一种带宽扩展方法及装置
CN106409299B (zh) 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
GB201210373D0 (en) * 2012-06-12 2012-07-25 Meridian Audio Ltd Doubly compatible lossless audio sandwidth extension
MX347062B (es) 2013-01-29 2017-04-10 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, método para proveer una información de audio codificada, método para proveer una información de audio decodificada, programa de computación y representación codificada utilizando una ampliación de ancho de banda adaptada por la señal.
SG10201608643PA (en) * 2013-01-29 2016-12-29 Fraunhofer Ges Forschung Decoder for Generating a Frequency Enhanced Audio Signal, Method of Decoding, Encoder for Generating an Encoded Signal and Method of Encoding Using Compact Selection Side Information
CN105103225B (zh) 2013-04-05 2019-06-21 杜比国际公司 立体声音频编码器和解码器
US9883318B2 (en) 2013-06-12 2018-01-30 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
WO2015036348A1 (en) * 2013-09-12 2015-03-19 Dolby International Ab Time- alignment of qmf based processing data
US9397629B2 (en) * 2013-10-22 2016-07-19 Bongiovi Acoustics Llc System and method for digital signal processing
US9906858B2 (en) 2013-10-22 2018-02-27 Bongiovi Acoustics Llc System and method for digital signal processing
EP3063761B1 (en) * 2013-10-31 2017-11-22 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain
US20150170655A1 (en) * 2013-12-15 2015-06-18 Qualcomm Incorporated Systems and methods of blind bandwidth extension
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
CN104934034B (zh) * 2014-03-19 2016-11-16 华为技术有限公司 用于信号处理的方法和装置
GB2524333A (en) 2014-03-21 2015-09-23 Nokia Technologies Oy Audio signal payload
US10820883B2 (en) 2014-04-16 2020-11-03 Bongiovi Acoustics Llc Noise reduction assembly for auscultation of a body
US10639000B2 (en) 2014-04-16 2020-05-05 Bongiovi Acoustics Llc Device for wide-band auscultation
WO2016040885A1 (en) 2014-09-12 2016-03-17 Audience, Inc. Systems and methods for restoration of speech components
WO2016137365A1 (en) * 2015-02-24 2016-09-01 Telefonaktiebolaget Lm Ericsson (Publ) Radio network node and method performed therein
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10586553B2 (en) 2015-09-25 2020-03-10 Dolby Laboratories Licensing Corporation Processing high-definition audio data
WO2017140600A1 (en) * 2016-02-17 2017-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
WO2017164156A1 (ja) 2016-03-22 2017-09-28 ヤマハ株式会社 信号処理装置、音響信号の転送方法、及び、信号処理システム
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
DE102016220886B3 (de) * 2016-10-24 2018-03-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Interleaving für die Übertragung von Telegrammen mit variabler Subpaketanzahl und sukzessiver Decodierung
CN109801639B (zh) * 2017-11-16 2020-12-18 全景声科技南京有限公司 一种符合ac-3格式的全景声信号的编解码方法
WO2019200119A1 (en) 2018-04-11 2019-10-17 Bongiovi Acoustics Llc Audio enhanced hearing protection system
US11081116B2 (en) 2018-07-03 2021-08-03 Qualcomm Incorporated Embedding enhanced audio transports in backward compatible audio bitstreams
US20200013426A1 (en) * 2018-07-03 2020-01-09 Qualcomm Incorporated Synchronizing enhanced audio transports with backward compatible audio transports
US10911013B2 (en) 2018-07-05 2021-02-02 Comcast Cable Communications, Llc Dynamic audio normalization process
WO2020028833A1 (en) 2018-08-02 2020-02-06 Bongiovi Acoustics Llc System, method, and apparatus for generating and digitally processing a head related audio transfer function
WO2020146868A1 (en) * 2019-01-13 2020-07-16 Huawei Technologies Co., Ltd. High resolution audio coding
CN110085267B (zh) * 2019-04-23 2022-02-08 晶晨半导体(上海)股份有限公司 一种弥补器件差异的调节电路
CN113747304B (zh) * 2021-08-25 2024-04-26 深圳市爱特康科技有限公司 一种新型的低音回放方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003502704A (ja) * 1999-06-21 2003-01-21 デジタル・シアター・システムズ・インコーポレーテッド デコーダの互換性を失わない確立済み低ビット・レートのオーディオ・コード化システムの音質の改善

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4354057A (en) * 1980-04-08 1982-10-12 Bell Telephone Laboratories, Incorporated Predictive signal coding with partitioned quantization
USRE32124E (en) * 1980-04-08 1986-04-22 At&T Bell Laboratories Predictive signal coding with partitioned quantization
US4554670A (en) * 1982-04-14 1985-11-19 Nec Corporation System and method for ADPCM transmission of speech or like signals
US4860312A (en) * 1988-04-12 1989-08-22 Motorola, Inc. Quality improvement for a digitally transmitted information signal
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
EP1010307B1 (en) * 1997-08-29 2003-02-26 Bell Canada Digital transmission using subband coding
US5859641A (en) * 1997-10-10 1999-01-12 Intervoice Limited Partnership Automatic bandwidth allocation in multimedia scripting tools

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003502704A (ja) * 1999-06-21 2003-01-21 デジタル・シアター・システムズ・インコーポレーテッド デコーダの互換性を失わない確立済み低ビット・レートのオーディオ・コード化システムの音質の改善

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018512100A (ja) * 2015-02-12 2018-05-10 ディーティーエス・インコーポレイテッドDTS,Inc. オーディオ処理のためのマルチレートシステム
CN108292506A (zh) * 2015-12-01 2018-07-17 Ati科技无限责任公司 使用视频信息的音频编码
JP2019504340A (ja) * 2015-12-01 2019-02-14 エーティーアイ・テクノロジーズ・ユーエルシーAti Technologies Ulc ビデオ情報を用いたオーディオエンコーディング
JP2019536112A (ja) * 2016-11-08 2019-12-12 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. サイドゲインおよび残余ゲインを使用してマルチチャネル信号を符号化または復号するための装置および方法
JP2022003405A (ja) * 2016-11-08 2022-01-11 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. サイドゲインおよび残余ゲインを使用してマルチチャネル信号を符号化または復号するための装置および方法
JP7008716B2 (ja) 2016-11-08 2022-01-25 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. サイドゲインおよび残余ゲインを使用してマルチチャネル信号を符号化または復号するための装置および方法
US11450328B2 (en) 2016-11-08 2022-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain
US11488609B2 (en) 2016-11-08 2022-11-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation
JP7443307B2 (ja) 2016-11-08 2024-03-05 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. サイドゲインおよび残余ゲインを使用してマルチチャネル信号を符号化または復号するための装置および方法

Also Published As

Publication number Publication date
KR20020027364A (ko) 2002-04-13
EP1204970A4 (en) 2009-07-29
EP2228790A2 (en) 2010-09-15
EP2228790A3 (en) 2010-12-01
EP1204970A1 (en) 2002-05-15
US6226616B1 (en) 2001-05-01
EP1204970B1 (en) 2017-02-15
JP4204227B2 (ja) 2009-01-07
HK1043422A1 (zh) 2002-09-13
CN1154087C (zh) 2004-06-16
TW565826B (en) 2003-12-11
WO2000079520A1 (en) 2000-12-28
EP2228790B1 (en) 2013-03-06
JP2003502704A (ja) 2003-01-21
CN1357136A (zh) 2002-07-03
AU5745200A (en) 2001-01-09
KR100606992B1 (ko) 2006-07-31

Similar Documents

Publication Publication Date Title
JP4204227B2 (ja) マルチチャネル・オーディオ・エンコーダおよびマルチチャネル・オーディオ・デコーダ
WO2000079520A9 (en) Improving sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
JP4174072B2 (ja) 心理音響学的アダプティブ・ビット割り当てを用いたマルチ・チャネル予測サブバンド・コーダ
Noll MPEG digital audio coding
US6169973B1 (en) Encoding method and apparatus, decoding method and apparatus and recording medium
KR101612969B1 (ko) 임의 접근 위치(rap) 및 다중 예측 파라미터 세트(mpps) 능력을 구비한 적응형 세그먼트화를 이용하는 무손실 다채널 오디오 코덱
US6314391B1 (en) Information encoding method and apparatus, information decoding method and apparatus and information recording medium
US7110953B1 (en) Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
JP2923406B2 (ja) オーディオ信号処理方法
JP3498375B2 (ja) ディジタル・オーディオ信号記録装置
EP2859548B1 (en) Doubly compatible lossless audio bandwidth extension
KR100310216B1 (ko) 다중채널오디오신호를위한코딩장치또는방법
US5581654A (en) Method and apparatus for information encoding and decoding
US6353807B1 (en) Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium
WO1998046045A1 (fr) Procede et dispositif de codage, procede et dispositif de decodage et support d'enregistrement
WO1995034956A1 (fr) Procede et dispositif de codage de signal, procede et dispositif de decodage de signal, support d'enregistrement et dispositif de transmission de signaux
Sinha et al. The perceptual audio coder (PAC)
JPH1132399A (ja) 符号化方法及び装置、並びに記録媒体
Johnston et al. AT&T perceptual audio coding (PAC)
JP2963710B2 (ja) 電気的信号コード化のための方法と装置
JP4470304B2 (ja) 圧縮データ記録装置、記録方法、圧縮データ記録再生装置、記録再生方法および記録媒体
JP3325772B2 (ja) 帯域分割信号処理システム
JPH0863901A (ja) 信号記録方法及び装置、信号再生装置、並びに記録媒体
KR20000056661A (ko) 디지털 오디오 데이터의 역방향 디코딩 방법
JP2000036755A (ja) 符号変換方法及び装置、並びにプログラム供給媒体

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20081224

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20081224

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101101

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110201

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110204

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110224

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110502

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120402