JP2007531010A - スケーラブル可逆オーディオ・コーデック及びオーサリング・ツール - Google Patents

スケーラブル可逆オーディオ・コーデック及びオーサリング・ツール Download PDF

Info

Publication number
JP2007531010A
JP2007531010A JP2007505034A JP2007505034A JP2007531010A JP 2007531010 A JP2007531010 A JP 2007531010A JP 2007505034 A JP2007505034 A JP 2007505034A JP 2007505034 A JP2007505034 A JP 2007505034A JP 2007531010 A JP2007531010 A JP 2007531010A
Authority
JP
Japan
Prior art keywords
lsb
bit width
encoded
msb
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007505034A
Other languages
English (en)
Other versions
JP4997098B2 (ja
Inventor
フェジゾ,ゾラン
Original Assignee
ディー・ティー・エス,インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/911,067 external-priority patent/US7392195B2/en
Application filed by ディー・ティー・エス,インコーポレーテッド filed Critical ディー・ティー・エス,インコーポレーテッド
Publication of JP2007531010A publication Critical patent/JP2007531010A/ja
Application granted granted Critical
Publication of JP4997098B2 publication Critical patent/JP4997098B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2400/00Loudspeakers
    • H04R2400/11Aspects regarding the frame of loudspeaker transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/15Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereophonic System (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Toys (AREA)

Abstract

オーディオ・コーデックは、オーディオ・データを、スケーラブル・ビットストリームの一連の分析ウィンドウに可逆符号化する。これは、オーディオ・データをMSB部分とLSB部分に分け、それぞれを異なる可逆アルゴリズムで符号化することによって、適切に行われる。オーサリング・ツールは、それぞれのウィンドウについてバッファ・ペイロードと許容ペイロードとを比較し、非適合のウィンドウ中の可逆符号化オーディオ・データ、適切にはLSB部分、を選択的にスケーリングして、符号化ペイロード、従ってバッファ・ペイロードを低減させる。この手法は、元のオーディオ・データをフィルタする必要も、再符号化する必要もなく、また、可逆ビットストリームを乱すこともなく、媒体ビット・レート及びバッファ容量の制約を満たす。

Description

本願は、米国特許法第119条(e)に基づき、2004年3月25日に出願された「Backward Compatible Lossless Audio Codec」と題される米国特許仮出願第60/566183号の優先権の利益を主張するものであり、その内容全体を参照により組み込むものとする。
本発明は、可逆オーディオ・コーデックに関し、より詳細には、スケーラブル可逆オーディオ・コーデック及びオーサリング・ツールに関する。
多数の低ビット・レートの不可逆(lossy)オーディオ符号化方式が、広範囲の民生用及びプロ用のオーディオ再生製品及びサービスで現在使用されている。例えば、ドルビー(登録商標)AC3(ドルビー(登録商標)・デジタル)オーディオ符号化方式は、640キロビット/秒までのビット・レートを使用してのレーザ・ディスク、NTSC符号化DVDビデオ、及びATV用の、ステレオ及び5.1チャネル・オーディオ・サウンド・トラックを符号化するための世界標準である。MPEG I及びMPEG IIオーディオ符号化標準は、768キロビット/秒までのビット・レートで、PAL符号化DVDビデオ、ヨーロッパでの地上デジタル無線放送、及び米国での衛星放送を、ステレオ及びマルチチャネル・サウンド・トラック符号化するのに広く使用されている。DTS(デジタル・シアター・システム)コヒーレント・アコースティックス・オーディオ符号化方式は、コンパクト・ディスク、DVDビデオ、ヨーロッパでの衛星放送、及びレーザ・ディスク用に、1536キロビット/秒までのビット・レートでのスタジオ品質の5.1チャネル・オーディオ・サウンド・トラックに頻繁に使用される。
96kHzの帯域幅と24ビットの分解能を提供する改良型のコーデックが、米国特許第6226616号(デジタル・シアター・システムズ社に譲渡されている)に開示されている。その特許では、コアおよび拡張の方法を使用し、この方法では、従来のオーディオ符号化アルゴリズムが「コア」オーディオ符号器を構成し、変更されないままで残っている。より高いオーディオ周波数(より高いサンプリング・レートの場合)又はより高いサンプル分解能(より大きなワード長の場合)、或いはその両方を表現する必要のあるオーディオ・データは、「拡張」ストリームとして伝送される。これにより、オーディオ・コンテンツ・プロバイダは、民生用機器ベースに在る様々なタイプの復号器との互換性のある単一オーディオ・ビットストリームを含むことが可能になる。コアストリームは、拡張データを無視する旧型の復号器により復号され、一方、新型の復号器は、コア・データ・ストリーム及び拡張データ・ストリームの双方を用いて、より高い品質の音響再生を提供する。しかしながら、この従来技術の手法は、真の可逆の符号化や復号化を提供していない。米国特許第6226216号のシステムは、優れた品質のオーディオ再生を提供するが、「可逆(lossless、ロスレス)」性能は提供しない。
最近、多くの消費者が、こうしたいわゆる「可逆」コーデックに興味を示してきている。「可逆」コーデックは、いかなる情報も破棄せずにデータを圧縮するアルゴリズムを用いる。従って、それらは、「マスキング」などの心理音響効果を用いない。可逆コーデックは、ソース信号(デジタル化されたソース信号)と同一の復号信号を生成する。この実施には以下のような犠牲、すなわち、そのようなコーデックでは典型的に不可逆コーデックよりも多くの帯域幅を必要とし、データを圧縮する度合いが低い、という犠牲を伴う。
ディスク、CD、DVDなどにコンテンツがオーサリングされているとき、特に、ソース素材の相関が非常に低い場合や非常に大きなソース帯域幅を必要とする場合は、圧縮を欠くと問題が生じ得る。媒体の光学的特性により、すべてのコンテンツに対する超過できないピーク・ビット・レートが確立される。図1に示されているように、合計ビット・レートが媒体の限度を超えないように、ハード的しきい値10、例えば、DVDオーディオでは9.6Mbpsが、典型的にはオーディオに対して確立されている。
オーディオおよびその他のデータは、様々な媒体の制約を満たし且つ所与のフレームを復号するのに必要とされるすべてのデータがオーディオ復号器バッファ中に存在するようにさせるように、ディスク上にレイアウトされる。そのバッファは、フレーム間で激しく変動し得るフレーム間符号化ペイロード(ビット・レート)12を平滑化する効果を有しており、バッファ・ペイロード14、即ち、フレーム間符号化ペイロードのバッファ平均が生成する。所与のチャネルに対する可逆ビットストリームのバッファ・ペイロード14が、任意の点でしきい値を超えた場合、オーディオ入力ファイルは、それらの情報コンテンツを低減させるように変更される。それらのオーディオ・ファイルは、24ビットから22ビットへなどのように1又は複数のチャネルのビット深度を減らすことによって、又はチャネルの周波数帯域幅をローパスだけでフィルタすることによって、又は96kHzでのサンプリング時に40kHzを超える情報をフィルタするなどによりオーディオ帯域幅を減らすことによって、変更され得る。変更されたオーディオ入力ファイルは、ペイロード16がしきい値10を超えることのないように、再符号化される。このプロセスの一例が、SurCode MLPのOwner’s Manual(オーナーズ・マニュアル)の20〜23ページに記載されている。
これは、計算的且つ時間的に非常に非効率なプロセスである。更に、オーディオ符号器は可逆ではあるが、ユーザへ送達されるオーディオ・コンテンツの量が、ビットストリーム全体にわたって低減されてしまう。更に、削除される情報が少なすぎる場合は、変更プロセスが不正確となり、問題がやはり存在し得、情報が多く削除された場合は、オーディオ・データが不必要に破棄される。更に、オーサリング(authoring)・プロセスを、媒体の特定の光学的特性及び復号器のバッファ・サイズに適合させる必要が生じる。
本発明は、可逆ビットストリームを生成するオーディオ・コーデックと、オーディオ入力ファイルをフィルタする必要も再符号化する必要も可逆ビットストリームを乱す必要もなく、媒体やチャネルや復号器バッファや再生装置ビット・レートの制約を満たすようにビットを選択的に破棄するオーサリング・ツールとを提供する。
これは、一連の分析ウィンドウにおいてオーディオ・データをスケーラブル・ビットストリームへ可逆(ロスレス)に符号化し、各ウィンドウについてバッファ・ペイロードと許容ペイロードとを比較し、非適合のウィンドウ中の可逆符号化されたオーディオ・データを選択的にスケーリングして、符号化ペイロードを、従って、バッファ・ペイロードを低減させ、それにより損失をもたらすことによって達成される。
例示的な一実施形態では、オーディオ符号器は、オーディオ・データを最上位ビット(MSB)部分と最下位ビット(LSB)部分とに分離し、それぞれを異なる可逆アルゴリズムで符号化する。オーサリング・ツールは、MSB部分をビットストリームへ書き込み、適合するウィンドウ(conforming window)中のLSB部分をそのビットストリームに書き込み、の非適合のフレーム(non-conforming frame)の可逆LSB部分をスケーリングして適合させ、現不可逆(lossy)LSB部分をそのビットストリームに書き込む。オーディオ復号器は、MSS部分及びLSB部分を復号し、PCMオーディオ・データを再び組み立てる。
オーディオ符号器は、各オーディオ・サンプルをMSB部分とLSB部分とに分割し、MSB部分を第1の可逆アルゴリズムで符号化し、LSB部分を第2の可逆アルゴリズムで符号化し、符号化オーディオ・データをスケーラブル可逆ビットストリームにパックする。MSB部分とLSB部分との間の境界点は、分析ウィンドウ中のサンプルのエネルギ及び/又は最大振幅によって、適切に確立される。LSBビット幅はビットストリームにパックされる。LSB部分は、好ましくは、幾つか又はすべてのLSBが選択的に破棄され得るように、符号化される。周波数拡張は、MSB/LSBと共に同様に符号化されてもよく、また、LSBとしてすべて符号化されてもよい。
符号化データをディスク(媒体)上にレイアウトするために、オーサリング・ツールが使用される。初期レイアウトは、バッファ・ペイロードに対応する。このツールは、各分析ウィンドウごとにバッファ・ペイロードと許容ペイロードとを比較して、レイアウトの改変を必要とするかどうかを判定する。改変を必要としない場合、可逆ビットストリームの可逆MSB部分及びLSB部分のすべてが、ビットストリームに書き込まれ、ディスク上に記録される。改変を必要とする場合、オーサリング・ツールは、制約を満たすように可逆ビットストリームをスケーリングする。より具体的には、このツールは、適合するウィンドウのすべてに対して可逆MSB及びLSB部分を、また、非適合のウィンドウについてはヘッダおよび可逆MSB部分を、改変ビットストリームに書き込む。次に、優先順位ルールに基づいて、それぞれの非適合のウィンドウについて、オーサリング・ツールは、1又は複数のオーディオ・チャネルに対して分析ウィンドウ中の各オーディオ・サンプルから幾つのLSBを破棄するかを決定し、そのLSB部分を、それらの改変ビット幅をもつ改変ビットストリームに再パックする。これは、バッファ・ペイロードが許容ペイロードを超える分析ウィンドウに対してのみ、繰り返される。
復号器は、媒体又は伝送チャネルを介して、オーサリングされたビットストリームを受け取る。オーディオ・データはバッファへ送られ、このバッファは、オーサリングのためオーバフローすることはなく、そして、現在の分析ウィンドウに対するオーディオ・データを復号するために、十分なデータをDSPチップへ提供する。DSPチップは、ヘッダ情報を抽出し、オーディオ・データのMSB部分を抽出し、復号し、組み立てる。オーサリング中にLSBのすべてが破棄された場合、DSPチップは、MSBサンプルを元のビット幅のワードに変換し、そのPCMデータを出力する。そうでない場合は、DSPチップは、LSB部分を復号し、MSB及びLSBのサンプルを組み立て、組み立てられたサンプルを元のビット幅のワードに変換し、そのPCMデータを出力する。
本発明の上記その他の特徴及び利点は、添付の図面と併せて、以下の好ましい実施形態の詳細な説明から、当業者には明らかになるであろう。
本発明は、可逆オーディオ・コーデックと、オーディオ入力ファイルをフィルタする必要も、再符号化する必要も、また、可逆ビットストリームを乱す必要もなく、媒体や、チャネルや、復号器バッファや、再生装置のビット・レートの制約を満たすようにビットを選択的に破棄するためのオーサリング・ツールとを提供する。
図2に示されているように、オーディオ符号器20は、一連の分析ウィンドウ(analysis window)中のオーディオ・データを可逆符号化し、その符号化データ及びヘッダ情報をスケーラブル可逆ビットストリーム22にパックし、この可逆ビットストリームが、アーカイブ24に適切に記憶される。分析ウィンドウは典型的には符号化データのフレームであるが、本明細書で用いられるように、そのウィンドウは複数のフレームにわたってもよい。更に、分析ウィンドウは、フレーム内のデータの1又は複数のセグメント、セグメント内の1又は複数のチャネル・セット、各チャネル・セット内の1又は複数のチャネル、及び最後にはチャネル中の1又は複数の周波数拡張へと、精細化されてもよい。ビットストリームに対するスケーリングの判断は、非常に粗く(多数のフレーム)するようにしてもよいし、より精細化(1フレームごと1チャネル・セットごと1周波数拡張ごと)するようにしてもよい。
復号器のバッファ容量に従って、符号化データをディスク(媒体)上にレイアウトするために、オーサリング・ツール30が使用される。初期レイアウトは、バッファ・ペイロードに対応する。このツールは、それぞれの分析ウィンドウごとにバッファ・ペイロードと許容ペイロードとを比較して、レイアウトの改変を必要とするかどうかを判定する。許容ペイロードは、典型的には、媒体(DVDディスク)又は伝送チャネルによってサポートされるピーク・ビット・レートに応じて変わる。許容ペイロードは、固定でもよいし、また、グローバル最適化の一部であれば可変でもよい。オーサリング・ツールは、非適合のウィンドウ中の可逆符号化オーディオ・データを選択的にスケーリングして、符号化ペイロード、従って、バッファ・ペイロードを低減させる。そのスケーリング・プロセスでは、符号化データにある程度の損失を導入するが、非適合のウィンドウだけに限定され、適切には、それは各ウィンドウを適合させるのにちょうど十分なだけの量である。オーサリング・ツールは、可逆及び不可逆データ並びに改変されたヘッダ情報を、ビットストリーム32にパックする。ビットストリーム32は典型的には、媒体34上に記憶されたり、伝送チャネル36を介して伝送されて、シングル又はマルチチャネルPCM(パルス符号変調)オーディオ・ストリーム40を生成するオーディオ復号器38によって後に再生される。
図3及び図4に示される例示的な実施形態では、オーディオ符号器20は、各オーディオ・サンプルをMSB部分42とLSB部分44とに分割する(ステップ46)。オーディオ・データを分離する境界点48は、最初に、それぞれのオーディオ・サンプルごとの最小符号化レベルを確立する最小MSBビット幅(Min MSB)50を割り当てることによって、計算される。例えば、オーディオ・データのビット幅52が20ビットである場合、Min MSBは16ビットであり得る。その結果、最大LSBビット幅(Max LSB)54は、ビット幅52−Min MSB 50となる。符号器は、分析ウィンドウ中のオーディオ・データについて、費用関数(コスト関数)、例えば、LノルムやLノルムを計算する。コスト関数がしきい値を超える場合、符号器は、少なくとも1ビットで且つMax LSB以下のLSBビット幅56を計算する。コスト関数がしきい値を超えない場合、LSBビット幅56は、ゼロ・ビットに設定される。一般に、このMSB/LSB分割は、それぞれの分析ウィンドウごとに行われる。上述のように、これは典型的には、1又は複数のフレームである。この分割は、例えば、それぞれのデータ・セグメントや、チャネル・セットや、チャネルや、周波数拡張に対して、精細化され得る。より精細にすると、計算が増え、ビットストリーム中のオーバヘッドが増すという犠牲を払うが、符号化性能が向上する。
符号器は、MSB部分(ステップ58)及びLSB部分(ステップ60)を、異なる可逆アルゴリズムで可逆符号化する。MSB部分中のオーディオ・データは、典型的には、1チャネル内でもチャネル間でも、時間的に高度に相関している。従って、可逆アルゴリズムは、エントロピー符号化、固定予測、適応予測、及び結合チャネル無相関の技法を適切に使用して、MSB部分を効率的に符号化する。適切な可逆符号器が、2004年8月8日に出願された同時係属出願「Lossless Multi−Channel Audio Codec」、出願番号第10/911067号に記載されており、この出願をここに参照により組み込む。適切な可逆符号器には、MLP(DVDオーディオ)、Monkey’s Audio(コンピュータ用途)、Apple Lossless、Windows(登録商標) Media Pro Lossless、AudioPak、DVD、LTAC、MUSICcompress、OggSquish、Philips、Shorten、Sonarc、及びWAが含まれる。こうしたコーデックのうちの多くに関する検討が、Mat Hans、Ronald Schaferの「Lossless Compression of Digital Audio」、Hewlett Packard、1999年においてなされている。
逆に、LSB部分中のオーディオ・データは、高度に無相関であり、ノイズにより近い。従って、高度に複雑な圧縮技法は、大部分は効果がなく、処理リソースを消費するだけである。更に、ビットストリームを効率的にオーサリングするために、非常に低次の非常に単純な予測と、それに続く単純なエントロピー符号器とを使用する、非常に単純な可逆符号が非常に望ましい。実際、現在好ましいアルゴリズムでは、LSBビットをそのまま単に複製することによって、LSB部分を符号化する。これにより、LSB部分を復号する必要なく個々のLSBが破棄されることが可能になる。
符号器は、容易にアンパックされ復号され得るように、スケーラブル可逆ビットストリーム62に、符号化MSB部分と符号化LSB部分を別々にパックする(ステップ64)。通常のヘッダ情報に加えて、符号器は、LSBビット幅56もヘッダにパックする(ステップ66)。ヘッダはまた、LSBビット幅低減68用のスペースも含んでいるが、これは、符号化中は使用されない。このプロセスは、分割のために再計算されるそれぞれの分析ウィンドウ(フレーム(複数)や、フレーム(1)や、セグメントや、チャネル・セットや、周波数拡張)ごとに繰り返される。
図5、図6、及び図7に示されているように、オーサリング・ツール30は、ユーザが、媒体のピーク・ビット・レートの制約を満たすように、復号器のバッファ容量に従って、媒体上にオーディオ及びビデオ・ビットのストリームをレイアウトするときに最初のパスを作る(ステップ70)ことを可能にする。オーサリング・ツールは、分析ウィンドウ・ループを開始し(ステップ71)、バッファ・ペイロードを計算し(ステップ72)、分析ウィンドウ73についてバッファ・ペイロードと許容ペイロードとを比較して、可逆ビットストリームが制約を満たすためにスケーリングを必要とするかどうかを判定する(ステップ74)。許容ペイロードは、オーディオ復号器のバッファ容量と、媒体又はチャネルのピーク・ビット・レートとによって決定される。符号化ペイロードは、オーディオ・データのビット幅と、全てのデータ・セグメント75のサンプル数にヘッダ76を加えたものとによって決定される。許容ペイロードを超過しない場合、可逆符号化したMSB部分及びLSB部分は、改変ビットストリーム79中のデータ・セグメント75のMSB区域77及びLSB区域78にパックされる(ステップ80)。許容ペイロードを決して超過しない場合には、可逆ビットストリームは、媒体又はチャネルへ直接に転送される。
バッファ・ペイロードが許容ペイロードを超える場合、オーサリング・ツールは、ヘッダ及び可逆符号化MSB部分42を改変ビットストリーム79にパックする(ステップ81)。優先順位ルールに基づいて、オーサリング・ツールはLSBビット幅低減68の計算を行い、符号化ペイロード、従ってバッファ・ペイロードを最大で許容ペイロードまで低減させる(ステップ82)。可逆符号化中にLSB部分が単に複製されるものと仮定すると、オーサリング・ツールは、好ましくは、LSBビット幅低減を越えた次のLSBビットをディザリングするように、各LSB部分にディザを追加し、次にLSB部分を右にLSBビット幅低減の分だけシフトしてビットを破棄することによって、LSB部分をスケーリングする(ステップ84)。LSB部分が符号化された場合、それらは、復号され、ディザリングされ、シフトされ、再符号化される必要が生じる。このツールは、現時点の適合するウィンドウに対する現時点の不可逆符号化LSB部分を、改変LSBビット幅56及びLSBビット幅低減68及びディザ・パラメータと共にビットストリームにパックする(ステップ86)。
図6に示されているように、LSB部分44は、3のビット幅から1ビットの改変LSBビット幅56へとスケーリングされている。破棄された2つのLSB 88は、2ビットのLSBビット幅低減68に合致する。例示的な実施形態では、改変LSBビット幅56及びLSBビット幅低減68は、ヘッダで復号器へ伝送される。或いは、これらの何れかが省略されてもよく、元のLSBビット幅が伝送されてもよい。パラメータのうちの何れも、他の2つのパラメータによって一意に決定される。
スケーラブル可逆符号器及びオーサリング・ツールの利点は、図8で行われているように、図1でのオーサリングされたビットストリームに対してのバッファ・ペイロード90をかぶせることによって、最もよく示される。コンテンツを削除するためにオーディオ・ファイルを変更し、次に可逆符号器で単に再符号化する既知の手法を使用すると、バッファ・ペイロード14は、許容ペイロード10未満であるバッファ・ペイロード16へと下方に事実上シフトされている。ピーク・ペイロードが許容ペイロード未満であるようにさせるには、ビットストリーム全体にわたって相当な量のコンテンツが犠牲にされる。それに比べて、バッファ・ペイロード90は、バッファ・ペイロードが許容ペイロードを超える幾つかのウィンドウ(フレーム)中のものを除き、元の可逆的なバッファ・ペイロード14を複製する。これらの区域では、符号化ペイロード、従って、バッファ・ペイロードは、制約を満たすのにちょうど十分なだけ低減され、好ましくはそれ以上は低減されない。その結果、元のオーディオ・ファイルを変更又は再符号化する必要なく、ペイロード容量がより効率的に使用され、より多くのコンテンツがエンド・ユーザへ送達される。
図9、図10、及び図11に示されているように、オーディオ復号器38は、ディスク100を介して、オーサリングされたビットストリームを受け取る。そのビットストリームは一連の分析ウィンドウに分離され、それぞれが、ヘッダ情報及び符号化オーディオ・データを含む。大部分のウィンドウは、可逆符号化されたMSB部分及びLSB部分、元のLSBビット幅、及びゼロのLSBビット幅低減を含む。ディスク100のピーク・ビット・レート及びバッファ102の容量によって設定されるペイロードの制約を満たすために、幾つかのウィンドウは、可逆符号化されたMSB部分及び不可逆LSB部分、不可逆LSB部分の改変ビット幅、及びLSBビット幅低減を含む。
コントローラ104は、ディスク100上のビットストリームから符号化オーディオ・データを読み取る。パーサ106が、ビデオからオーディオ・データを分離し、オーディオ・データをオーディオ・バッファ102へ流すが、このオーディオ・バッファは、オーサリングのためオーバフローすることはない。このバッファは、現在の分析ウィンドウについてオーディオ・データを復号するために、十分なデータをDSPチップ108へ提供する。DSPチップは、改変LSBビット幅56と、LSBビット幅低減68と、幾つかの空のLSB 112とを含むヘッダ情報を、元のワード幅から抽出し(ステップ110)、オーディオ・データのMSB部分を、抽出し、復号し、組み立てる(ステップ114)。オーサリング中にすべてのLSBが破棄されたか、又は元のLSBビット幅が0であった場合(ステップ115)、DSPチップは、MSBサンプルを元のビット幅のワードに変換し、PCMデータを出力する(ステップ116)。そうでない場合、DSPチップは、可逆及び不可逆のLSB部分を復号し(ステップ118)、MSB及びLSBのサンプルを組み立て(ステップ120)、ヘッダ情報を使用して、組み立てられたサンプルを元のビット幅のワードに変換する(ステップ122)。
マルチチャネル・オーディオ・コーデック及びオーサリング・ツール
一連のフレームとして提示される符号化オーディオ・ビットストリーム用のオーディオ・コーデック及びオーサリング・ツールの例示的な実施形態が、図12〜図15に示されている。図12に示されているように、各フレーム200は、共通情報204およびLSBビット幅及びLSBビット幅低減を記憶する各チャネル・セットごとのサブヘッダ206を記憶するためのヘッダ202と、1又は複数のデータ・セグメント208とを含む。各データ・セグメントは、1又は複数のチャネル・セット210を含み、各チャネル・セットは、1又は複数のオーディオ・チャネル212を含む。各チャネルは、1又は複数の周波数拡張214を含み、少なくとも最低周波数拡張は、符号化MSB部分216及び符号化LSB部分218を含む。ビットストリームは、各フレームの各チャネル・セットの各チャネルごとに、異なるMSB及びLSBを分割する。高域周波数拡張は、同様に分割されてもよく、また、LSB部分としてすべて符号化されてもよい。
このビットストリームがオーサリングされる元であるスケーラブル可逆ビットストリームは、図13a及び13bに示されるように符号化される。符号器は、元のワードのビット幅(24ビット)、Min MSB(16ビット)、2乗されるL2のノルムに対するしきい値(Th)、及びそのノルムに対するスケール・ファクタ(SF)を設定する(ステップ220)。符号器は、フレーム・ループ(ステップ222)及びチャネル・セット・ループ(ステップ224)を開始する。オーディオ・データの実際の幅(20ビット)が元のワード幅未満であり得るので、符号器は、空のLSBの数(24−20=4)(現在のフレーム内のPCMサンプルにおける「0」のLSBの最小数)を計算し、その量だけすべてのサンプルを右シフトする(ステップ226)。データのビット幅は、元のビット幅(24)から空のLSB数(4)を減算したものである(ステップ228)。符号器は次に、LSB部分の一部として符号化されることを許される最大ビット数(Max LSB)を、Max(ビット幅−Min MSB,0)として決定する(ステップ230)。現在の例では、Max LSB=20−16=4ビットである。
オーディオ・データをMSB部分とLSB部分とに分割するための境界点を決定するために、符号器は、チャネル・ループ・インデックスを開始し(ステップ232)、Lノルムを、チャネル中のオーディオ・データの最大絶対振幅として計算し、2乗L2ノルムを、分析ウィンドウ中のオーディオ・データの2乗振幅(振幅の2乗)の合計として計算する(ステップ234)。符号器は、パラメータMax Ampを、log(L)以上の最小整数として設定し(ステップ236)、LSBビット幅をゼロに初期設定する(ステップ237)。Max AmpがMin MSBよりも大きい場合(ステップ238)、LSBビット幅は、Max AmpとMin MSBとの差に等しく設定される(ステップ240)。そうでない場合に、L2ノルムがしきい値を超える(振幅は小さいが差異が大きい)場合(ステップ242)、LSBビット幅は、Max Ampをスケール・ファクタ(典型的には1より大きい)で除算したものと等しく設定される(ステップ244)。双方の試験で偽の場合、LSBビット幅はゼロのままである。言い換えれば、最小符号化品質、例えば、Min MSBを維持するために、LSBは利用可能でない。符号器は、Max LSB値でLSBビット幅をクリップし(ステップ246)、その値をサブヘッダ・チャネル・セットにパックする(ステップ248)。
境界点、即ち、LSBビット幅が決定された後、符号器は、オーディオ・データをMSB部分とLSB部分とに分割する(ステップ250)。MSB部分は、適切なアルゴリズムを使用して可逆符号化され(ステップ252)、現在のフレームのチャネル・セットにおける特定のチャネル中の最低の周波数拡張にパックされる(ステップ254)。LSB部分は、適切なアルゴリズム、例えば、単純なビット複製を使用して可逆符号化され(ステップ256)、パックされる(ステップ258)。
このプロセスは、ビットストリーム中の各フレームごとに(ステップ264)、各チャネル・セットごとに(ステップ262)、各チャネルごとに(ステップ260)、繰り返される。更に、高い周波数の拡張に対して同じ手順が繰り返されてもよい。しかしながら、こうした拡張に含まれる情報は少ないので、Min MSBは、LSBとしてすべて符号化されるように、0に設定されてもよい。
あるオーディオ・コンテンツに対してスケーラブル可逆ビットストリームが符号化された後、オーサリング・ツールは、搬送媒体のピーク・ビット・レートの制約及びオーディオ復号器中のバッファの容量を満足させる、できる限り最良のビットストリームを、作成する。図14に示されているように、ユーザは、ビット・レート及びバッファ容量の制約に適合するように、媒体上に可逆ビットストリーム268をレイアウトしようと試みる(ステップ270)。成功した場合、可逆ビットストリーム268は、オーサリングされたビットストリーム272として書き出され、媒体に記憶される。そうでない場合、オーサリング・ツールは、フレーム・ループを開始し(ステップ274)、バッファ・ペイロード(バッファ平均フレーム間(buffered average frame-to-frame)ペイロード)と許容ペイロード(ピーク・ビット・レート)とを比較する(ステップ276)。現在のフレームが許容ペイロードに適合する場合、可逆符号化されたMSB部分及びLSB部分が、可逆ビットストリーム268から抽出され、オーサリングされたビットストリーム272に書き込まれ、そのフレームがインクリメント(増分)される。
オーサリング・ツールが、バッファ・ペイロードが許容ペイロードを超える非適合のフレームに遭遇した場合、このツールは、チャネル・セット中のすべてのLSB部分を破棄することによって実現され得る最大低減を計算し、それをバッファ・ペイロードから減算する(ステップ278)。なおも最小ペイロードが大きすぎる場合、このツールは、過剰のデータ量及びフレーム数を含むエラー・メッセージを表示する(ステップ280)。このケースでは、Min MSBが減らされるか、又は元のオーディオ・ファイルが変更され再符号化される。
そうでない場合、オーサリング・ツールは、指定のチャネル優先順位ルールに基づいて、現在のフレームの各チャネルに対してLSBビット幅低減を、以下のようにして計算する(ステップ282)。
ビット幅低減[nCh]<LSBビット幅[nCh]
ここで、nCh=0、...、AllChannels−1
バッファ・ペイロード[nFr]−Σ(ビット幅低減[nCh]*フレーム内のNumSamples)<許容ペイロード[nFr]
これらの値によるLSBビット幅の低減によって、フレームは許容ペイロードに適合するようになる。これは、最小量の損失が非適合のフレームにもたらされるが、それ以外には可逆の適合するフレームに影響を与えないで、行われる。
オーサリング・ツールは、各チャネルの符号化LSB部分(ビット複製符号化と仮定する)を、フレームの各LSB部分にディザを付加して次のビットをディザリングし、次いでLSBビット幅低減の分だけ右シフトすることによって、調整する(ステップ284)。ディザを付加することは必ずしも必要ではないが、量子化誤差を無相関化し且つ元のオーディオ信号からも無相関化するためには、非常に望ましい。このツールは、現時点の不可逆のスケーリングされたLSB部分(ステップ286)、各チャネルの改変LSBビット幅及びLSBビット幅低減(ステップ288)、並びに改変ストリーム・ナビゲーション点(ステップ290)を、オーサリングされたビットストリームにパックする。ディザが付加される場合、ディザ・パラメータがビットストリームにパックされる。次にこのプロセスは、終了する(ステップ294)まで、それぞれのフレームごとに繰り返される(ステップ292)。
図15a及び15bに示されているように、適切な復号器がビットストリームに同期し(ステップ300)、フレーム・ループを開始する(ステップ302)。復号器は、セグメント数、セグメント中のサンプル数、チャネル・セット数などを含むフレーム・ヘッダ情報を抽出し(ステップ304)、チャネル・セットごとにチャネル・セット中のチャネル数、空のLSB数、LSBビット幅、LSBビット幅低減を含むチャネル・セット・ヘッダ情報を抽出し(ステップ306)、各チャネル・セットごとにそれを記憶する(ステップ307)。
ヘッダ情報が利用可能となった後、復号器は、現在のフレームに対して、セグメント・ループ(ステップ308)及びチャネル・セット・ループ(ステップ310)を開始する。復号器は、MSB部分をアンパックし、復号し(ステップ312)、PCMサンプルを記憶する(ステップ314)。復号器は次いで、現在のチャネル・セットにおけるチャネル・ループを開始し(ステップ316)、符号化LSBデータを続ける。
改変LSBビット幅がゼロを超えない場合(ステップ318)、復号器は現在のセグメントにおいてサンプル・ループを開始し(ステップ320)、MSB部分に対するPCMサンプルを元のワード幅に変換し(ステップ322)、サンプル・ループが終了するまでこれを繰り返す(ステップ324)。
そうでない場合、復号器は、現在のセグメントでサンプル・ループを開始し(ステップ326)、LSB部分をアンパックし、復号し(ステップ328)、LSB部分をMSB部分に追加することによってPCMサンプルを組み立てる(ステップ330)。復号器は次いで、ヘッダからの空LSB、改変LSBビット幅、及びLSBビット幅低減の情報を使用して、PCMサンプルを元のワード幅に変換し(ステップ332)、サンプル・ループが終了するまでそのステップを繰り返す(ステップ334)。オーディオ・シーケンス全体を再構築するために、復号器は、各フレームで(ステップ340)、各チャネル・セットで(ステップ338)、各チャネルで(ステップ336)、これらのステップを繰り返す。
後方互換スケーラブル・オーディオ・コーデック
スケーラビリティの特性は、後方互換(バックワード・コンパチブル)の可逆符号器、ビットストリーム・フォーマット、及び復号器に組み込まれ得る。「不可逆(lossy)」コア符号ストリームは、伝送(又は記録)のために、オーディオ・データの可逆符号化MSB部分及びLSB部分と共にパックされる。拡張された可逆機能を用いて復号器で復号した後、不可逆と可逆とのMSBストリームが組み合わされ、LSBストリームが追加されて、可逆再構築信号を構築する。前の世代の復号器では、可逆のMSB及びLSBの拡張ストリームが無視され、コア「不可逆」ストリームが復号されて、コアストリームの帯域幅及び信号対雑音比の特性をもつ高品質のマルチチャネル・オーディオ信号を提供する。
図16aは、スケーラブル後方互換符号器400のシステム・レベルの図を示す。デジタル化オーディオ信号、適切にはMビットPCMオーディオ・サンプルが、入力402で提供される。好ましくは、デジタル化オーディオ信号は、改変された不可逆コア符号器404のものを超えるサンプリング・レート及び帯域幅を有する。一実施形態では、デジタル化オーディオ信号のサンプリング・レートは、96kHz(サンプリングされたオーディオの48kHzの帯域幅に相当する)である。入力オーディオはマルチチャネル信号でもよく、好ましくはそうであることも理解すべきであり、各チャネルは96kHzでサンプリングされる。以下の議論では、一つのチャネルの処理について集中して述べるが、多数のチャネルへの拡張は単純明快である。入力信号はノード406で複製され、並列の枝路で処理される。信号経路の第1の枝路では、改変された不可逆の広帯域の符号器404が、信号を符号化する。以下に詳述される改変コア符号器404は、符号化データ・ストリーム(コアストリーム408)を生成し、このコアストリームは、パッカ又はマルチプレクサ410へと運ばれる。また、コアストリーム408は、改変されたコアストリーム復号器412へも伝達され、このコアストリーム復号器は、出力として、改変された再構築されたコア信号414を生成する。この再構築コア信号414は、Nビットだけ右シフトされて(>>N 415)、そのN個のLSBが破棄される。
一方、並列経路中の入力デジタル化オーディオ信号402は、再構築オーディオ・ストリームに導入される遅延(改変符号化及び改変復号器による)と実質的に等しい補償遅延416を受け、遅延デジタル化オーディオ・ストリームを生成する。そのオーディオ・ストリームは、上述のように、MSB部分とLSB部分に分割される417。NビットLSB部分418が、パッカ410へ運ばれる。MSB部分と整合するようにシフトされたM−Nビット再構築コア信号414は、減算ノード420で、遅延デジタル化オーディオ・ストリーム419のMSB部分から減算される。(入力のうちの1つの極性を変更することにより、減算ノードの代わりに加算ノードを使用でき得ることに留意されたい。従って、この目的では、加算及び減算は実質的に等価となり得る。)
減算ノード420は、元の信号と再構築コア信号とのM−N MSBの間の差を表す差信号422を生成する。純粋に「可逆」符号化するためには、その差信号を、可逆符号化技法を用いて符号化し伝送する必要がある。従って、M−Nビット差信号422は、可逆符号器424で符号化され、この符号化M−Nビット信号426は、パッカ410でコアストリーム408とパックされ又は多重化されて、多重化された出力ビットストリーム428を生成する。可逆符号器の必要性に対応するために、可逆符号化では、可変ビット・レートの符号化可逆ストリーム418及び426を生成したことに留意されたい。次に、パックされたストリームに対して、オプションで、チャネル符号化を含めた更に複数層の符号化が行われ、次いで伝送されたり記録されたりする。この開示では、記録は、チャネルを介した伝送とみなされてもよいことに留意されたい。
コア符号器404は、「改変(modified)」と記述されているが、これは、拡張された帯域幅を扱うことのできる実施形態では、コア符号器は改変(変更)を必要とすることになるからである。符号器内の64帯域分析フィルタ・バンクが、その出力データの半分を破棄し、下位の32周波数帯域だけを符号化する。この破棄された情報は、何れにせよ信号スペクトルの上半分を再構築することができないであろう従来からの復号器には、重要ではない。残りの情報が、未改変の符号器により符号化されて、後方互換のコア出力ストリームを形成する。しかしながら、48kHzのサンプリング・レート以下で動作する別の実施形態では、コア符号器は、実質的に未改変のバージョンの従来のコア符号器でもよい。同様に、従来からの復号器のサンプリング・レートを超える動作では、コア復号器412は、後述のように改変される必要がある。従来のサンプリング・レート(例えば、48kHz以下)での動作では、コア復号器は、実質的に未改変のバージョンの従来のコア復号器又はそれと同等の物でよい。実施形態によっては、サンプリング・レートの選択は符号化時に行われてもよく、符号化及び復号のモジュールが、その時にソフトウェアによって所望されるように再構成されてもよい。
図16bに示されているように、復号の方法は、符号化の方法と相補的である。従来の復号器は、単にコアストリーム408を復号し、可逆MSB部分及びLSB部分を破棄することによって、不可逆コア・オーディオ信号を復号することができる。そのような従来の復号器において生成されるオーディオの品質は極めて良く、従来のオーディオと同等であり、単に可逆でないだけである。
次に図16bを参照すると、着信ビットストリーム(伝送チャネル又は記録媒体から復元)が、アンパッカ430でまずアンパックされ、このアンパッカは、可逆拡張データ・ストリーム418(LSB)及び426(MSB)からコアストリーム408を分離する。コアストリームは、改変コア復号器432によって復号され、この改変コア復号器は、再構築中に64帯域合成における上位32帯域に対して未伝送のサブバンド・サンプルをゼロにすることによって、コアストリームを再構築する。(標準コア符号化が実行された場合、このゼロ化は不要であることに留意されたい。)可逆MSB復号器434によって、MSB拡張フィールドが復号される。LSBデータは、ビット複製を使用して可逆符号化されたので、復号の必要はない。
コア及び可逆MSB拡張を並行して復号した後、補間されたコア再構築データが、Nビットだけ右シフトされ436、加算器438で加算することによって、データの可逆部分と組み合わされる。加算された出力は、Nビットだけ左シフトされて440、可逆MSB部分442を形成し、NビットLSB部分444と合わせて組み立てられて、元のオーディオ信号402の可逆の再構築された表現であるPCMデータ・ワード446を生成する。
その信号は、正確な入力信号から、復号された不可逆の再構築物を減算することによって、符号化されたので、再構築信号は、元のオーディオ・データが正確に再構築されたものを表す。従って、逆説的に、不可逆コーデックと可逆符号化信号との組合せは、純粋な可逆コーデックとして実際に機能するが、符号化データは従来の可逆復号器との互換性が維持されるという、追加の利点も有する。更に、ビットストリームは、媒体ビット・レートの制約及びバッファ容量に適合するように、LSBを選択的に破棄することによってスケーリングされることができる。
本発明の幾つかの例示的な実施形態が図示され、説明されているが、多くの変形形態及び代替実施形態が、当業者には想到されよう。そのような変形形態及び代替実施形態は、企図されており、添付の特許請求の範囲に定義される本発明の趣旨及び範囲から逸脱することなく実施され得る。
図1は、上述のように、可逆オーディオ・チャネルでのビット・レート及びペイロード対時間のグラフである。 図2は、本発明による可逆オーディオ・コーデック及びオーサリング・ツールのブロック図である。 図3は、オーディオ符号器の簡略化された流れ図である。 図4は、可逆ビットストリーム中のサンプルに対するMSB/LSB分割の図である。 図5は、オーサリング・ツールの簡略化された流れ図である。 図6は、オーサリングされたビットストリーム中のサンプルに対するMSB/LSB分割の図である。 図7は、MSB部分及びLSB部分及びヘッダ情報を含むビットストリームの図である。 図8は、可逆およびオーサリングされたビットストリームに対するペイロードのグラフである。 図9は、オーディオ復号器の簡単なブロック図である。 図10は、復号プロセスの流れ図である。 図11は、組み立てられたビットストリームの図である。 図12は、特定の実施形態でのビットストリーム・フォーマットを示す。 図13aおよび13bは、特定の実施形態での符号化を示す。 図13aおよび図13bは、特定の実施形態での符号化を示す。 図14は、特定の実施形態でのオーサリングを示す。 図15aおよび図15bは、特定の実施形態での復号を示す。 図15aおよび図15bは、特定の実施形態での復号を示す。 図16aは、不可逆コア符号器と後方互換であるスケーラブル可逆コーデック用の符号器のブロック図である。 図16bは、不可逆コア符号器と後方互換であるスケーラブル可逆コーデック用の復号器のブロック図である。

Claims (35)

  1. オーディオ・データを符号化およびオーサリングする方法であって、
    一連の分析ウィンドウにおける前記オーディオ・データを、スケーラブル・ビットストリームへと可逆符号化するステップと、
    それぞれのウィンドウについて、符号化された前記オーディオ・データに対するバッファ・ペイロードと許容ペイロードとを比較するステップと、
    非適合のウィンドウにおける可逆符号化された前記オーディオ・データをスケーリングして、前記ビットストリームに対する前記バッファ・ペイロードが前記許容ペイロードを超えないようにするものであり、このスケーリング動作は、それらのウィンドウにおける符号化された前記データに損失を導入させるものである、スケーリングするステップと
    を備える方法。
  2. 請求項1に記載の方法であって、前記オーディオ・データが、それぞれの分析ウィンドウごとに最上位ビット(MSB)部分及び最下位ビット(LSB)部分に分離され、異なる可逆アルゴリズムで符号化される、方法。
  3. 請求項2に記載の方法であって、前記オーディオ・データが、
    最小MSBビット幅(Min MSB)を割り当てるステップと、
    前記分析ウィンドウにおける前記オーディオ・データに対するコスト関数を計算するステップと、
    前記コスト関数がしきい値を超える場合に、前記Min MSBを満たす少なくとも1ビットのLSBビット幅を計算するステップと、
    前記コスト関数が前記しきい値を超えない場合に、前記LSBビット幅をゼロ・ビットになるように割り当てるステップと
    によって分離される、
    方法。
  4. 請求項3に記載の方法であって、
    最大LSBビット幅(Max LSB)を、前記オーディオ・データのビット幅からMin MSBを減算したものとして計算するステップと、
    ノルムを、前記分析ウィンドウにおける前記オーディオ・データの最大絶対振幅として計算するステップと、
    Max Ampを、−Lに等しい値をもつサンプルを表すために必要なビット数として計算するステップと、
    2乗されたL2ノルムを、前記分析ウィンドウにおける前記オーディオ・データの2乗された振幅の合計として計算するステップと、
    Max AmpがMin MSBを超えず、且つ前記L2ノルムがしきい値を超えない場合に、前記LSBビット幅をゼロ・ビットに設定するステップと、
    Max AmpがMin MSBを超えないが、前記L2ノルムが前記しきい値を超える場合に、前記LSBビット幅を、前記Max LSBビット幅をスケーリング・ファクタで除算した値に設定するステップと、
    Max Ampが前記Min MSBを超える場合に、前記LSBビット幅を、前記Max AmpからMin MSBを減算したものに設定するステップと
    を更に含む、方法。
  5. 請求項4に記載の方法であって、前記LSBビット幅が、前記Min MSB及び前記オーディオ・データのワード幅によって決定される最大LSBビット幅(Max LSB)に制限される、方法。
  6. 請求項2に記載の方法であって、LSBビット幅及び符号化された前記MSB部分及びLSB部分が、それぞれの分析ウィンドウごとにビットストリームへとパックされる、方法。
  7. 請求項2に記載の方法であって、前記MSB部分が、多数のオーディオ・チャネル間の無相関化及び各オーディオ・チャネル内の適応予測を含む可逆アルゴリズムで符号化される、方法。
  8. 請求項2に記載の方法であって、前記LSB部分が、PCMサンプルに対するビットを複製する可逆アルゴリズムで符号化される、方法。
  9. 請求項2に記載の方法であって、前記LSB部分が、低次の予測及びエントロピー符号化を使用する可逆アルゴリズムで符号化される、方法。
  10. 請求項2に記載の方法であって、前記分析ウィンドウはフレームであり、各フレームは、前記LSBビット幅及び1又は複数のセグメントを記憶するためのヘッダを含み、各セグメントは、1又は複数のチャネル・セットを含み、各チャネル・セットは、1又は複数のオーディオ・チャネルを含み、各チャネルは、1又は複数の周波数拡張を含み、前記最低の周波数拡張は、符号化MSB部分及びLSB部分を含む、方法。
  11. 請求項10に記載の方法であって、前記ビットストリームが、各フレームにおける各チャネル・セットにおける各チャネルについて異なるMSB及びLSB分割を有する、方法。
  12. 請求項11に記載の方法であって、高域の前記周波数拡張が、符号化LSB部分だけを含む、方法。
  13. 請求項2に記載の方法であって、前記ビットストリームが、
    すべての前記ウィンドウについて、可逆符号化された前記MSB部分を前記ビットストリームにパックするステップと、
    適合する前記ウィンドウにつして、可逆符号化された前記LSB部分を前記ビットストリームにパックするステップと、
    非適合のウィンドウについて、可逆符号化された前記LSB部分を、それらが適合するようにスケーリングするステップと、
    現時点の適合するウィンドウについて、現時点の不可逆符号化された前記LSB部分を前記ビットストリームにパックするステップと
    によってオーサリングされる、
    方法。
  14. 請求項13に記載の方法であって、前記LSB部分が、
    前記分析ウィンドウに対してLSBビット幅低減を計算するステップと、
    前記非適合のウィンドウの前記LSB部分を復号するステップと、
    前記LSBビット幅低減の数のLSBを破棄することにより、前記LSBビット幅低減の分だけ、前記LSB部分を低減させるステップと、
    改変された前記LSB部分を、前記可逆符号化アルゴリズムで符号化するステップと、
    符号化された前記LSB部分をパックするステップと、
    改変された前記LSBビット幅及び前記LSBビット幅低減を前記ビットストリームにパックするステップと
    によってスケーリングされる、
    方法。
  15. 請求項14に記載の方法であって、前記可逆符号化が単純なビット複製であり、前記LSB部分が、
    各LSB部分にディザを加えて、前記LSBビット幅低減を越えた次のLSBをディザリングするようにする、ステップと、
    前記LSB部分を、前記LSBビット幅の低減の分だけ右へシフトするステップと
    によって低減される、
    方法。
  16. 請求項14に記載の方法であって、前記LSBビット幅の低減は過不足のないものであり、前記バッファ・ペイロードが前記許容ペイロードを超えないようにするものである、方法。
  17. 請求項14に記載の方法であって、前記オーディオ・データが多数のチャネルを含み、前記LSBビット幅の低減が、チャネル優先順位ルールに従ってそれぞれのチャネルごとに計算される、方法。
  18. オーディオ・データに対してスケーラブルの可逆のビットストリームの符号化を行う方法であって、
    分析ウィンドウについて、オーディオ・データをMSB部分とLSB部分に分けるブレークポイントを決定するステップと、
    前記MSB部分を可逆符号化するステップと、
    前記LSB部分を可逆符号化するステップと、
    符号化された前記MSB部分及び前記LSB部分を可逆ビットストリームにパックするステップと、
    前記LSB部分のビット幅を前記可逆ビットストリームにパックするステップと
    を備える方法。
  19. 請求項18に記載の方法であって、前記ブレークポイントが、
    最小MSBビット幅(Min MSB)を割り当てるステップと、
    前記分析ウィンドウの前記オーディオ・データに対してコスト関数を計算するステップと、
    前記コスト関数がしきい値を超える場合に、前記Min MSBを満たす少なくとも1ビットのLSBビット幅を計算するステップと、
    前記コスト関数が前記しきい値を超えない場合に、前記LSBビット幅をゼロ・ビットになるように割り当てるステップと
    によって決定される、
    方法。
  20. 請求項18に記載の方法であって、前記LSB部分が、前記オーディオ・データのビットを複製する可逆アルゴリズムで符号化される、方法。
  21. 媒体上にオーディオ・ビットストリームをオーサリングする方法であって、
    a)復号器バッファのために媒体上にビットストリームからの前記符号化オーディオ・データをレイアウトするための方式を決定するステップであって、前記ビットストリームが一連の分析ウィンドウにおける可逆に符号化されたMSB部分及びLSB部分を含む、ステップと、
    b)次の分析ウィンドウに対しての前記符号化オーディオ・データに対するバッファ・ペイロードを計算するステップと、
    c)前記バッファ・ペイロードが分析ウィンドウに対して許容ペイロード内の場合は、可逆に符号化された前記MSB部分及び前記LSB部分を、改変されたビットストリームにパックするステップと、
    d)前記バッファ・ペイロードが分析ウィンドウに対して前記許容ペイロードを超える場合は、
    可逆に符号化された前記MSB部分を前記改変されたビットストリームにパックし、
    前記バッファ・ペイロードが前記許容ペイロード内となるように、可逆に符号化された前記LSB部分を不可逆に符号化されたLSB部分へとスケーリングし、
    不可逆に符号化された前記LSB部分を、そのスケーリング情報と共に前記改変されたビットストリームにパックするステップと、
    e)それぞれの分析ウィンドウごとにステップbからdを繰り返すステップと
    を備える方法。
  22. 請求項21に記載の方法であって、前記LSB部分が、
    前記分析ウィンドウについてLSBビット幅低減を計算するステップと、
    非適合の前記ウィンドウにおける前記LSB部分を復号するステップと、
    前記LSBビット幅低減の数のLSBを破棄することにより、前記LSBビット幅低減だけ、前記LSB部分を低減させるステップと、
    改変された前記LSB部分を前記の可逆符号化アルゴリズムで符号化するステップと、
    符号化された前記LSB部分をパックするステップと、
    改変された前記LSBビット幅及び前記LSBビット幅低減を前記ビットストリームにパックするステップと
    によってスケーリングされる、
    方法。
  23. 請求項22に記載の方法であって、前記の可逆符号化及び復号化が、単純なビット複製であり、前記LSB部分が、
    前記LSBビット幅低減を越えた次のLSBをディザリングするように、それぞれのLSB部分にディザを加えるステップと、
    前記LSB部分を、前記LSBビット幅低減分だけ右にシフトするステップと
    によって低減される、
    方法。
  24. 媒体上に記憶された符号化オーディオ・データの一連の分析ウィンドウに分離されたビットストリームを備える物品であって、それぞれの前記分析ウィンドウにおける前記オーディオ・データは、必要に応じて前記分析ウィンドウの前記バッファ・ペイロードを許容ペイロード以下に低減させることを除き、可逆符号化される、物品。
  25. 請求項24に記載の物品であって、幾つかの前記分析ウィンドウは、可逆に符号化されたMSB部分及びLSB部分を含み、残りの分析ウィンドウは、可逆に符号化されたMSB部分及び不可逆に符号化されたLSB部分を含む、物品。
  26. 請求項25に記載の物品であって、前記ビットストリームは、前記LSB部分の改変された前記ビット幅と、前記LSB部分の前記ビット幅低減とを含むヘッダ情報を含む、物品。
  27. 請求項26に記載の物品であって、前記LSB部分が、ビット複製を使用して可逆及び不可逆に符号化される、物品。
  28. 請求項27に記載の物品であって、前記LSB部分の前記ビット幅低減は、前記バッファ・ペイロードが前記許容ペイロードを超えないものとするように過不足のないものである、物品。
  29. オーディオ・ビットストリームを復号する方法であって、
    ビットストリームを一連の分析ウィンドウとして受け取るステップであって、前記分析ウィンドウは、LSBビット幅及びLSBビット幅低減を含むヘッダ情報と、可逆に符号化されたMSB部分および可逆に符号化されたLSB部分またはスケーリングされたLSB部分を含むオーディオ・データとを含み、それぞれの分析ウィンドウのバッファ・ペイロードが許容ペイロード内であるようにされている、ステップと、
    それぞれの分析ウィンドウごとに前記LSBビット幅及び前記LSBビット幅低減を抽出するステップと、
    前記可逆に符号化されたMSB部分を抽出し、それらをPCMオーディオ・データに復号するステップと、
    前記可逆に符号化されたLSB部分又は前記スケーリングされたLSB部分を抽出し、それらをPCMオーディオ・データに復号するステップと、
    それぞれのPCMオーディオ・サンプルについての前記MSB部分及び前記LSB部分を組み立てるステップと、
    前記LSBビット幅及び前記LSBビット幅低減を使用して、組み立てられた前記PCMオーディオ・データを元のビット幅のワードに変換するステップと、
    それぞれの分析ウィンドウについて前記PCMオーディオ・データを出力するステップと
    を備える方法。
  30. 請求項29に記載の方法であって、前記可逆に符号化されたLSB部分及び前記スケーリングされたLSB部分が、ビット複製によって復号される、方法。
  31. ビットストリームを受け取り、PCMオーディオ・データを出力するように構成される復号器チップであって、前記復号器チップは、
    前記ビットストリームのそれぞれの分析ウィンドウについてLSBビット幅及びLSBビット幅低減を抽出するステップと、
    可逆に符号化されたMSB部分を抽出し、それらをPCMオーディオ・データに復号するステップと、
    可逆に符号化されたLSB部分又はスケーリングされたLSB部分を抽出し、それらをPCMオーディオ・データに復号するステップと、
    それぞれのPCMオーディオ・サンプルについて前記MSB部分及び前記LSB部分を組み立てるステップと、
    前記LSBビット幅及び前記LSBビット幅低減を使用して、組み立てられた前記PCMオーディオ・データを元のビット幅のワードに変換するステップと、
    それぞれの分析ウィンドウについて前記PCMオーディオ・データを出力するステップと
    を実行するように構成される、復号器チップ。
  32. オーディオ復号器であって、
    媒体上のビットストリームから符号化オーディオ・データを読み取るためのコントローラと、
    前記符号化オーディオ・データの複数の分析ウィンドウをバッファするためのバッファと、
    連続する各分析ウィンドウについて前記符号化オーディオ・データを復号し、PCMオーディオ・データを出力するためのDSPチップであって、分析ウィンドウを復号するように構成され、前記分析ウィンドウは、LSBビット幅及びLSBビット幅低減を含むヘッダ情報と、可逆に符号化されたMSB部分および可逆に符号化されたLSB部分またはスケーリングされたLSB部分を含むオーディオ・データとを含むものであり、バッファされるペイロードは、前記媒体及び前記バッファの容量によりサポートされるピーク・ビット・レートによって決定される許容ペイロードを超えないものである、DSPチップと
    を備えるオーディオ復号器。
  33. 請求項32に記載のオーディオ復号器であって、前記DSPチップは、
    前記ビットストリームにおける各分析ウィンドウについて、前記LSBビット幅及び前記LSBビット幅低減を抽出するステップと、
    前記可逆に符号化されたMSB部分を抽出し、それらをPCMオーディオ・データに復号するステップと、
    前記可逆に符号化されたLSB部分又は前記スケーリングされたLSB部分を抽出し、それらをPCMオーディオ・データに復号するステップと、
    それぞれのPCMオーディオ・サンプルについて前記MSB部分及び前記LSB部分を組み立てるステップと、
    前記LSBビット幅及び前記LSBビット幅低減を使用して、組み立てられた前記PCMオーディオ・データを元のビット幅のワードに変換するステップと、
    それぞれの分析ウィンドウについて前記PCMオーディオ・データを出力するステップと
    を実行する、
    オーディオ復号器。
  34. 不可逆コア復号器と後方互換であるMビット・オーディオ・データに対してのスケーラブルの可逆のビットストリームの符号化を行う方法であって、
    前記Mビット・オーディオ・データを、不可逆のMビット・コアストリームに符号化するステップと、
    前記不可逆のMビット・コアストリームをビットストリームにパックするステップと、
    前記Mビット・コアストリームを、再構築されたコア信号に復号するステップと、
    前記Mビット・オーディオ・データを、M−NビットのMSB部分とNビットのLSB部分とに分けるステップと、
    前記NビットのLSB部分を前記ビットストリームにパックするステップと、
    前記再構築されたコア信号をNビットだけ右シフトして、それを前記MSB部分と整合させるステップと、
    前記MSB部分から前記再構築されたコア信号を減算して、M−Nビット残差信号を形成するステップと、
    前記残差信号を可逆符号化するステップと、
    符号化された前記残差信号を前記ビットストリームにパックするステップと、
    前記LSB部分のビット幅を前記可逆のビットストリームにパックするステップと
    を備える方法。
  35. 請求項34に記載の方法であって、右シフトする前記ステップの前にディザを前記再構築されたコア信号に加えるステップと、ディザ・パラメータを前記ビットストリームにパックするステップとを更に備える方法。
JP2007505034A 2004-03-25 2005-03-21 スケーラブル可逆オーディオ・コーデック及びオーサリング・ツール Active JP4997098B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US55618304P 2004-03-25 2004-03-25
US60/556,183 2004-03-25
US10/911,067 US7392195B2 (en) 2004-03-25 2004-08-04 Lossless multi-channel audio codec
US10/911,067 2004-08-04
US10/911,062 US7272567B2 (en) 2004-03-25 2004-08-04 Scalable lossless audio codec and authoring tool
US10/911,062 2004-08-04
PCT/US2005/009240 WO2005098822A2 (en) 2004-03-25 2005-03-21 Scalable lossless audio codec and authoring tool

Publications (2)

Publication Number Publication Date
JP2007531010A true JP2007531010A (ja) 2007-11-01
JP4997098B2 JP4997098B2 (ja) 2012-08-08

Family

ID=35125763

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007505034A Active JP4997098B2 (ja) 2004-03-25 2005-03-21 スケーラブル可逆オーディオ・コーデック及びオーサリング・ツール

Country Status (9)

Country Link
EP (6) EP2228792A3 (ja)
JP (1) JP4997098B2 (ja)
KR (4) KR101207110B1 (ja)
AT (2) ATE510279T1 (ja)
DK (2) DK1743326T3 (ja)
IL (3) IL178244A0 (ja)
PL (1) PL2228791T3 (ja)
TR (2) TR200606137T1 (ja)
WO (2) WO2005098822A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009536364A (ja) * 2006-05-05 2009-10-08 トムソン ライセンシング 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置
JP2012088502A (ja) * 2010-10-19 2012-05-10 Nippon Telegr & Teleph Corp <Ntt> 符号化装置、復号装置、符号化方法、復号方法及びそのプログラム
JP2015519615A (ja) * 2012-06-12 2015-07-09 メリディアン オーディオ リミテッド 二重の互換性を持つ損失のないオーディオ帯域幅拡張

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
ES2401817T3 (es) * 2008-01-31 2013-04-24 Agency For Science, Technology And Research Procedimiento y dispositivo de distribución/truncado de la velocidad de transmisión de bits para codificación de audio escalable
US8873671B2 (en) 2008-03-26 2014-10-28 Qualcomm Incorporated Method and system for LLR buffer reduction in a wireless communication modem
KR101641685B1 (ko) * 2010-03-29 2016-07-22 삼성전자주식회사 멀티채널 오디오의 다운믹스 방법 및 장치
KR101676477B1 (ko) 2010-07-21 2016-11-15 삼성전자주식회사 컨텍스트 기반의 무손실 부호화 장치 및 방법, 그리고 복호화 장치 및 방법
JP6100164B2 (ja) 2010-10-06 2017-03-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法
KR101153819B1 (ko) * 2010-12-14 2012-06-18 전자부품연구원 오디오 처리 장치 및 방법
WO2015164572A1 (en) 2014-04-25 2015-10-29 Dolby Laboratories Licensing Corporation Audio segmentation based on spatial metadata

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0830295A (ja) * 1994-07-20 1996-02-02 Sony Corp ディジタル・オーディオ信号記録・再生方法と装置
JPH10285048A (ja) * 1997-04-02 1998-10-23 Samsung Electron Co Ltd デジタルデータの符号化/復号化方法及び装置
JPH10285043A (ja) * 1997-04-02 1998-10-23 Samsung Electron Co Ltd ビット率の調節可能なオーディオ符号化/復号化方法及び装置
JPH10285042A (ja) * 1997-04-02 1998-10-23 Samsung Electron Co Ltd ビット率の調節可能なオーディオデータ符号化/復号化方法及び装置
JPH11317672A (ja) * 1997-11-20 1999-11-16 Samsung Electronics Co Ltd ビット率の調節可能なステレオオーディオ符号化/復号化方法及び装置
US20030179938A1 (en) * 2001-03-05 2003-09-25 Van Der Vleuten Renatus Josephus Device and method for compressing a signal
JP2004289837A (ja) * 2003-03-22 2004-10-14 Samsung Electronics Co Ltd デジタルデータの符号化/復号化方法および装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6226325B1 (en) * 1996-03-27 2001-05-01 Kabushiki Kaisha Toshiba Digital data processing system
KR100338801B1 (ko) * 1997-07-31 2002-08-21 삼성전자 주식회사 디지털데이터의부호화/복호화방법및장치
KR100251453B1 (ko) * 1997-08-26 2000-04-15 윤종용 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크
US6226608B1 (en) * 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
EP1054514B1 (en) * 1999-05-21 2007-09-26 Scientific-Atlanta Europe Method and apparatus for the compression and/or transport and/or decompression of a digital signal
US6370502B1 (en) 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US6226216B1 (en) 2000-01-21 2001-05-01 Intel Corporation Sectional column activated memory
GB2364843A (en) * 2000-07-14 2002-02-06 Sony Uk Ltd Data encoding based on data quantity and data quality
US6675148B2 (en) * 2001-01-05 2004-01-06 Digital Voice Systems, Inc. Lossless audio coder
WO2003077425A1 (fr) * 2002-03-08 2003-09-18 Nippon Telegraph And Telephone Corporation Procedes de codage et de decodage signaux numeriques, dispositifs de codage et de decodage, programme de codage et de decodage de signaux numeriques
US20030231799A1 (en) * 2002-06-14 2003-12-18 Craig Schmidt Lossless data compression using constraint propagation

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0830295A (ja) * 1994-07-20 1996-02-02 Sony Corp ディジタル・オーディオ信号記録・再生方法と装置
JPH10285048A (ja) * 1997-04-02 1998-10-23 Samsung Electron Co Ltd デジタルデータの符号化/復号化方法及び装置
JPH10285043A (ja) * 1997-04-02 1998-10-23 Samsung Electron Co Ltd ビット率の調節可能なオーディオ符号化/復号化方法及び装置
JPH10285042A (ja) * 1997-04-02 1998-10-23 Samsung Electron Co Ltd ビット率の調節可能なオーディオデータ符号化/復号化方法及び装置
JPH11317672A (ja) * 1997-11-20 1999-11-16 Samsung Electronics Co Ltd ビット率の調節可能なステレオオーディオ符号化/復号化方法及び装置
US20030179938A1 (en) * 2001-03-05 2003-09-25 Van Der Vleuten Renatus Josephus Device and method for compressing a signal
JP2004289837A (ja) * 2003-03-22 2004-10-14 Samsung Electronics Co Ltd デジタルデータの符号化/復号化方法および装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009536364A (ja) * 2006-05-05 2009-10-08 トムソン ライセンシング 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置
JP2012088502A (ja) * 2010-10-19 2012-05-10 Nippon Telegr & Teleph Corp <Ntt> 符号化装置、復号装置、符号化方法、復号方法及びそのプログラム
JP2015519615A (ja) * 2012-06-12 2015-07-09 メリディアン オーディオ リミテッド 二重の互換性を持つ損失のないオーディオ帯域幅拡張

Also Published As

Publication number Publication date
KR20070002065A (ko) 2007-01-04
KR101243412B1 (ko) 2013-03-13
JP4997098B2 (ja) 2012-08-08
TR200606137T1 (tr) 2007-01-22
EP2270775A2 (en) 2011-01-05
KR101149956B1 (ko) 2012-06-01
WO2005098823A3 (en) 2007-04-12
WO2005098823A2 (en) 2005-10-20
DK1743326T3 (da) 2011-08-22
EP2270774A3 (en) 2011-10-19
ATE511178T1 (de) 2011-06-15
TR200606136T1 (tr) 2007-04-24
WO2005098822A2 (en) 2005-10-20
PL2228791T3 (pl) 2015-10-30
ATE510279T1 (de) 2011-06-15
WO2005098822A3 (en) 2006-11-23
EP2228791B1 (en) 2015-05-06
IL178243A0 (en) 2006-12-31
KR20070020012A (ko) 2007-02-16
EP2228792A3 (en) 2010-11-17
DK1741093T3 (da) 2011-09-12
EP1741093A2 (en) 2007-01-10
KR20120003944A (ko) 2012-01-11
KR20120003943A (ko) 2012-01-11
EP2228791A2 (en) 2010-09-15
EP2270774B1 (en) 2016-07-27
EP2270775A3 (en) 2011-10-19
EP1741093B1 (en) 2011-05-25
KR101207110B1 (ko) 2012-12-03
KR101237559B1 (ko) 2013-02-26
IL200376A0 (en) 2011-07-31
EP2228792A2 (en) 2010-09-15
EP1743326A2 (en) 2007-01-17
EP1743326A4 (en) 2009-06-17
EP2270775B1 (en) 2016-01-06
EP2228791A3 (en) 2010-11-17
IL178244A0 (en) 2006-12-31
EP1743326B1 (en) 2011-05-18
EP1741093A4 (en) 2009-06-17
EP2270774A2 (en) 2011-01-05

Similar Documents

Publication Publication Date Title
US7668723B2 (en) Scalable lossless audio codec and authoring tool
JP4997098B2 (ja) スケーラブル可逆オーディオ・コーデック及びオーサリング・ツール
US8374858B2 (en) Scalable lossless audio codec and authoring tool
TWI474316B (zh) 使用具隨機存取點及多重預測參數集合能力的適應性分段技術之無損多聲道音訊編解碼器
KR100917464B1 (ko) 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
JP3964860B2 (ja) ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体
KR100300887B1 (ko) 디지털 오디오 데이터의 역방향 디코딩 방법
JP2003330497A (ja) オーディオ信号の符号化方法及び装置、符号化及び復号化システム、並びに符号化を実行するプログラム及び当該プログラムを記録した記録媒体
KR20050040441A (ko) 스케일러블 오디오 복/부호화 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071129

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20081224

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20081224

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110117

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110418

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110815

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111115

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120501

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120514

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4997098

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250