JP2007531010A - スケーラブル可逆オーディオ・コーデック及びオーサリング・ツール - Google Patents
スケーラブル可逆オーディオ・コーデック及びオーサリング・ツール Download PDFInfo
- Publication number
- JP2007531010A JP2007531010A JP2007505034A JP2007505034A JP2007531010A JP 2007531010 A JP2007531010 A JP 2007531010A JP 2007505034 A JP2007505034 A JP 2007505034A JP 2007505034 A JP2007505034 A JP 2007505034A JP 2007531010 A JP2007531010 A JP 2007531010A
- Authority
- JP
- Japan
- Prior art keywords
- lsb
- bit width
- encoded
- msb
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002441 reversible effect Effects 0.000 title description 15
- 238000000034 method Methods 0.000 claims description 52
- 230000009467 reduction Effects 0.000 claims description 44
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 230000002427 irreversible effect Effects 0.000 claims description 16
- 230000010076 replication Effects 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 claims description 2
- 238000012856 packing Methods 0.000 claims 17
- 230000002950 deficient Effects 0.000 claims 2
- 230000003139 buffering effect Effects 0.000 claims 1
- 238000005192 partition Methods 0.000 claims 1
- 230000005236 sound signal Effects 0.000 abstract description 12
- 238000005070 sampling Methods 0.000 abstract description 8
- 239000000284 extract Substances 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2400/00—Loudspeakers
- H04R2400/11—Aspects regarding the frame of loudspeaker transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/15—Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Stereophonic System (AREA)
- Electrophonic Musical Instruments (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Toys (AREA)
Abstract
Description
一連のフレームとして提示される符号化オーディオ・ビットストリーム用のオーディオ・コーデック及びオーサリング・ツールの例示的な実施形態が、図12〜図15に示されている。図12に示されているように、各フレーム200は、共通情報204およびLSBビット幅及びLSBビット幅低減を記憶する各チャネル・セットごとのサブヘッダ206を記憶するためのヘッダ202と、1又は複数のデータ・セグメント208とを含む。各データ・セグメントは、1又は複数のチャネル・セット210を含み、各チャネル・セットは、1又は複数のオーディオ・チャネル212を含む。各チャネルは、1又は複数の周波数拡張214を含み、少なくとも最低周波数拡張は、符号化MSB部分216及び符号化LSB部分218を含む。ビットストリームは、各フレームの各チャネル・セットの各チャネルごとに、異なるMSB及びLSBを分割する。高域周波数拡張は、同様に分割されてもよく、また、LSB部分としてすべて符号化されてもよい。
ここで、nCh=0、...、AllChannels−1
バッファ・ペイロード[nFr]−Σ(ビット幅低減[nCh]*フレーム内のNumSamples)<許容ペイロード[nFr]
スケーラビリティの特性は、後方互換(バックワード・コンパチブル)の可逆符号器、ビットストリーム・フォーマット、及び復号器に組み込まれ得る。「不可逆(lossy)」コア符号ストリームは、伝送(又は記録)のために、オーディオ・データの可逆符号化MSB部分及びLSB部分と共にパックされる。拡張された可逆機能を用いて復号器で復号した後、不可逆と可逆とのMSBストリームが組み合わされ、LSBストリームが追加されて、可逆再構築信号を構築する。前の世代の復号器では、可逆のMSB及びLSBの拡張ストリームが無視され、コア「不可逆」ストリームが復号されて、コアストリームの帯域幅及び信号対雑音比の特性をもつ高品質のマルチチャネル・オーディオ信号を提供する。
Claims (35)
- オーディオ・データを符号化およびオーサリングする方法であって、
一連の分析ウィンドウにおける前記オーディオ・データを、スケーラブル・ビットストリームへと可逆符号化するステップと、
それぞれのウィンドウについて、符号化された前記オーディオ・データに対するバッファ・ペイロードと許容ペイロードとを比較するステップと、
非適合のウィンドウにおける可逆符号化された前記オーディオ・データをスケーリングして、前記ビットストリームに対する前記バッファ・ペイロードが前記許容ペイロードを超えないようにするものであり、このスケーリング動作は、それらのウィンドウにおける符号化された前記データに損失を導入させるものである、スケーリングするステップと
を備える方法。 - 請求項1に記載の方法であって、前記オーディオ・データが、それぞれの分析ウィンドウごとに最上位ビット(MSB)部分及び最下位ビット(LSB)部分に分離され、異なる可逆アルゴリズムで符号化される、方法。
- 請求項2に記載の方法であって、前記オーディオ・データが、
最小MSBビット幅(Min MSB)を割り当てるステップと、
前記分析ウィンドウにおける前記オーディオ・データに対するコスト関数を計算するステップと、
前記コスト関数がしきい値を超える場合に、前記Min MSBを満たす少なくとも1ビットのLSBビット幅を計算するステップと、
前記コスト関数が前記しきい値を超えない場合に、前記LSBビット幅をゼロ・ビットになるように割り当てるステップと
によって分離される、
方法。 - 請求項3に記載の方法であって、
最大LSBビット幅(Max LSB)を、前記オーディオ・データのビット幅からMin MSBを減算したものとして計算するステップと、
L∞ノルムを、前記分析ウィンドウにおける前記オーディオ・データの最大絶対振幅として計算するステップと、
Max Ampを、−L∞に等しい値をもつサンプルを表すために必要なビット数として計算するステップと、
2乗されたL2ノルムを、前記分析ウィンドウにおける前記オーディオ・データの2乗された振幅の合計として計算するステップと、
Max AmpがMin MSBを超えず、且つ前記L2ノルムがしきい値を超えない場合に、前記LSBビット幅をゼロ・ビットに設定するステップと、
Max AmpがMin MSBを超えないが、前記L2ノルムが前記しきい値を超える場合に、前記LSBビット幅を、前記Max LSBビット幅をスケーリング・ファクタで除算した値に設定するステップと、
Max Ampが前記Min MSBを超える場合に、前記LSBビット幅を、前記Max AmpからMin MSBを減算したものに設定するステップと
を更に含む、方法。 - 請求項4に記載の方法であって、前記LSBビット幅が、前記Min MSB及び前記オーディオ・データのワード幅によって決定される最大LSBビット幅(Max LSB)に制限される、方法。
- 請求項2に記載の方法であって、LSBビット幅及び符号化された前記MSB部分及びLSB部分が、それぞれの分析ウィンドウごとにビットストリームへとパックされる、方法。
- 請求項2に記載の方法であって、前記MSB部分が、多数のオーディオ・チャネル間の無相関化及び各オーディオ・チャネル内の適応予測を含む可逆アルゴリズムで符号化される、方法。
- 請求項2に記載の方法であって、前記LSB部分が、PCMサンプルに対するビットを複製する可逆アルゴリズムで符号化される、方法。
- 請求項2に記載の方法であって、前記LSB部分が、低次の予測及びエントロピー符号化を使用する可逆アルゴリズムで符号化される、方法。
- 請求項2に記載の方法であって、前記分析ウィンドウはフレームであり、各フレームは、前記LSBビット幅及び1又は複数のセグメントを記憶するためのヘッダを含み、各セグメントは、1又は複数のチャネル・セットを含み、各チャネル・セットは、1又は複数のオーディオ・チャネルを含み、各チャネルは、1又は複数の周波数拡張を含み、前記最低の周波数拡張は、符号化MSB部分及びLSB部分を含む、方法。
- 請求項10に記載の方法であって、前記ビットストリームが、各フレームにおける各チャネル・セットにおける各チャネルについて異なるMSB及びLSB分割を有する、方法。
- 請求項11に記載の方法であって、高域の前記周波数拡張が、符号化LSB部分だけを含む、方法。
- 請求項2に記載の方法であって、前記ビットストリームが、
すべての前記ウィンドウについて、可逆符号化された前記MSB部分を前記ビットストリームにパックするステップと、
適合する前記ウィンドウにつして、可逆符号化された前記LSB部分を前記ビットストリームにパックするステップと、
非適合のウィンドウについて、可逆符号化された前記LSB部分を、それらが適合するようにスケーリングするステップと、
現時点の適合するウィンドウについて、現時点の不可逆符号化された前記LSB部分を前記ビットストリームにパックするステップと
によってオーサリングされる、
方法。 - 請求項13に記載の方法であって、前記LSB部分が、
前記分析ウィンドウに対してLSBビット幅低減を計算するステップと、
前記非適合のウィンドウの前記LSB部分を復号するステップと、
前記LSBビット幅低減の数のLSBを破棄することにより、前記LSBビット幅低減の分だけ、前記LSB部分を低減させるステップと、
改変された前記LSB部分を、前記可逆符号化アルゴリズムで符号化するステップと、
符号化された前記LSB部分をパックするステップと、
改変された前記LSBビット幅及び前記LSBビット幅低減を前記ビットストリームにパックするステップと
によってスケーリングされる、
方法。 - 請求項14に記載の方法であって、前記可逆符号化が単純なビット複製であり、前記LSB部分が、
各LSB部分にディザを加えて、前記LSBビット幅低減を越えた次のLSBをディザリングするようにする、ステップと、
前記LSB部分を、前記LSBビット幅の低減の分だけ右へシフトするステップと
によって低減される、
方法。 - 請求項14に記載の方法であって、前記LSBビット幅の低減は過不足のないものであり、前記バッファ・ペイロードが前記許容ペイロードを超えないようにするものである、方法。
- 請求項14に記載の方法であって、前記オーディオ・データが多数のチャネルを含み、前記LSBビット幅の低減が、チャネル優先順位ルールに従ってそれぞれのチャネルごとに計算される、方法。
- オーディオ・データに対してスケーラブルの可逆のビットストリームの符号化を行う方法であって、
分析ウィンドウについて、オーディオ・データをMSB部分とLSB部分に分けるブレークポイントを決定するステップと、
前記MSB部分を可逆符号化するステップと、
前記LSB部分を可逆符号化するステップと、
符号化された前記MSB部分及び前記LSB部分を可逆ビットストリームにパックするステップと、
前記LSB部分のビット幅を前記可逆ビットストリームにパックするステップと
を備える方法。 - 請求項18に記載の方法であって、前記ブレークポイントが、
最小MSBビット幅(Min MSB)を割り当てるステップと、
前記分析ウィンドウの前記オーディオ・データに対してコスト関数を計算するステップと、
前記コスト関数がしきい値を超える場合に、前記Min MSBを満たす少なくとも1ビットのLSBビット幅を計算するステップと、
前記コスト関数が前記しきい値を超えない場合に、前記LSBビット幅をゼロ・ビットになるように割り当てるステップと
によって決定される、
方法。 - 請求項18に記載の方法であって、前記LSB部分が、前記オーディオ・データのビットを複製する可逆アルゴリズムで符号化される、方法。
- 媒体上にオーディオ・ビットストリームをオーサリングする方法であって、
a)復号器バッファのために媒体上にビットストリームからの前記符号化オーディオ・データをレイアウトするための方式を決定するステップであって、前記ビットストリームが一連の分析ウィンドウにおける可逆に符号化されたMSB部分及びLSB部分を含む、ステップと、
b)次の分析ウィンドウに対しての前記符号化オーディオ・データに対するバッファ・ペイロードを計算するステップと、
c)前記バッファ・ペイロードが分析ウィンドウに対して許容ペイロード内の場合は、可逆に符号化された前記MSB部分及び前記LSB部分を、改変されたビットストリームにパックするステップと、
d)前記バッファ・ペイロードが分析ウィンドウに対して前記許容ペイロードを超える場合は、
可逆に符号化された前記MSB部分を前記改変されたビットストリームにパックし、
前記バッファ・ペイロードが前記許容ペイロード内となるように、可逆に符号化された前記LSB部分を不可逆に符号化されたLSB部分へとスケーリングし、
不可逆に符号化された前記LSB部分を、そのスケーリング情報と共に前記改変されたビットストリームにパックするステップと、
e)それぞれの分析ウィンドウごとにステップbからdを繰り返すステップと
を備える方法。 - 請求項21に記載の方法であって、前記LSB部分が、
前記分析ウィンドウについてLSBビット幅低減を計算するステップと、
非適合の前記ウィンドウにおける前記LSB部分を復号するステップと、
前記LSBビット幅低減の数のLSBを破棄することにより、前記LSBビット幅低減だけ、前記LSB部分を低減させるステップと、
改変された前記LSB部分を前記の可逆符号化アルゴリズムで符号化するステップと、
符号化された前記LSB部分をパックするステップと、
改変された前記LSBビット幅及び前記LSBビット幅低減を前記ビットストリームにパックするステップと
によってスケーリングされる、
方法。 - 請求項22に記載の方法であって、前記の可逆符号化及び復号化が、単純なビット複製であり、前記LSB部分が、
前記LSBビット幅低減を越えた次のLSBをディザリングするように、それぞれのLSB部分にディザを加えるステップと、
前記LSB部分を、前記LSBビット幅低減分だけ右にシフトするステップと
によって低減される、
方法。 - 媒体上に記憶された符号化オーディオ・データの一連の分析ウィンドウに分離されたビットストリームを備える物品であって、それぞれの前記分析ウィンドウにおける前記オーディオ・データは、必要に応じて前記分析ウィンドウの前記バッファ・ペイロードを許容ペイロード以下に低減させることを除き、可逆符号化される、物品。
- 請求項24に記載の物品であって、幾つかの前記分析ウィンドウは、可逆に符号化されたMSB部分及びLSB部分を含み、残りの分析ウィンドウは、可逆に符号化されたMSB部分及び不可逆に符号化されたLSB部分を含む、物品。
- 請求項25に記載の物品であって、前記ビットストリームは、前記LSB部分の改変された前記ビット幅と、前記LSB部分の前記ビット幅低減とを含むヘッダ情報を含む、物品。
- 請求項26に記載の物品であって、前記LSB部分が、ビット複製を使用して可逆及び不可逆に符号化される、物品。
- 請求項27に記載の物品であって、前記LSB部分の前記ビット幅低減は、前記バッファ・ペイロードが前記許容ペイロードを超えないものとするように過不足のないものである、物品。
- オーディオ・ビットストリームを復号する方法であって、
ビットストリームを一連の分析ウィンドウとして受け取るステップであって、前記分析ウィンドウは、LSBビット幅及びLSBビット幅低減を含むヘッダ情報と、可逆に符号化されたMSB部分および可逆に符号化されたLSB部分またはスケーリングされたLSB部分を含むオーディオ・データとを含み、それぞれの分析ウィンドウのバッファ・ペイロードが許容ペイロード内であるようにされている、ステップと、
それぞれの分析ウィンドウごとに前記LSBビット幅及び前記LSBビット幅低減を抽出するステップと、
前記可逆に符号化されたMSB部分を抽出し、それらをPCMオーディオ・データに復号するステップと、
前記可逆に符号化されたLSB部分又は前記スケーリングされたLSB部分を抽出し、それらをPCMオーディオ・データに復号するステップと、
それぞれのPCMオーディオ・サンプルについての前記MSB部分及び前記LSB部分を組み立てるステップと、
前記LSBビット幅及び前記LSBビット幅低減を使用して、組み立てられた前記PCMオーディオ・データを元のビット幅のワードに変換するステップと、
それぞれの分析ウィンドウについて前記PCMオーディオ・データを出力するステップと
を備える方法。 - 請求項29に記載の方法であって、前記可逆に符号化されたLSB部分及び前記スケーリングされたLSB部分が、ビット複製によって復号される、方法。
- ビットストリームを受け取り、PCMオーディオ・データを出力するように構成される復号器チップであって、前記復号器チップは、
前記ビットストリームのそれぞれの分析ウィンドウについてLSBビット幅及びLSBビット幅低減を抽出するステップと、
可逆に符号化されたMSB部分を抽出し、それらをPCMオーディオ・データに復号するステップと、
可逆に符号化されたLSB部分又はスケーリングされたLSB部分を抽出し、それらをPCMオーディオ・データに復号するステップと、
それぞれのPCMオーディオ・サンプルについて前記MSB部分及び前記LSB部分を組み立てるステップと、
前記LSBビット幅及び前記LSBビット幅低減を使用して、組み立てられた前記PCMオーディオ・データを元のビット幅のワードに変換するステップと、
それぞれの分析ウィンドウについて前記PCMオーディオ・データを出力するステップと
を実行するように構成される、復号器チップ。 - オーディオ復号器であって、
媒体上のビットストリームから符号化オーディオ・データを読み取るためのコントローラと、
前記符号化オーディオ・データの複数の分析ウィンドウをバッファするためのバッファと、
連続する各分析ウィンドウについて前記符号化オーディオ・データを復号し、PCMオーディオ・データを出力するためのDSPチップであって、分析ウィンドウを復号するように構成され、前記分析ウィンドウは、LSBビット幅及びLSBビット幅低減を含むヘッダ情報と、可逆に符号化されたMSB部分および可逆に符号化されたLSB部分またはスケーリングされたLSB部分を含むオーディオ・データとを含むものであり、バッファされるペイロードは、前記媒体及び前記バッファの容量によりサポートされるピーク・ビット・レートによって決定される許容ペイロードを超えないものである、DSPチップと
を備えるオーディオ復号器。 - 請求項32に記載のオーディオ復号器であって、前記DSPチップは、
前記ビットストリームにおける各分析ウィンドウについて、前記LSBビット幅及び前記LSBビット幅低減を抽出するステップと、
前記可逆に符号化されたMSB部分を抽出し、それらをPCMオーディオ・データに復号するステップと、
前記可逆に符号化されたLSB部分又は前記スケーリングされたLSB部分を抽出し、それらをPCMオーディオ・データに復号するステップと、
それぞれのPCMオーディオ・サンプルについて前記MSB部分及び前記LSB部分を組み立てるステップと、
前記LSBビット幅及び前記LSBビット幅低減を使用して、組み立てられた前記PCMオーディオ・データを元のビット幅のワードに変換するステップと、
それぞれの分析ウィンドウについて前記PCMオーディオ・データを出力するステップと
を実行する、
オーディオ復号器。 - 不可逆コア復号器と後方互換であるMビット・オーディオ・データに対してのスケーラブルの可逆のビットストリームの符号化を行う方法であって、
前記Mビット・オーディオ・データを、不可逆のMビット・コアストリームに符号化するステップと、
前記不可逆のMビット・コアストリームをビットストリームにパックするステップと、
前記Mビット・コアストリームを、再構築されたコア信号に復号するステップと、
前記Mビット・オーディオ・データを、M−NビットのMSB部分とNビットのLSB部分とに分けるステップと、
前記NビットのLSB部分を前記ビットストリームにパックするステップと、
前記再構築されたコア信号をNビットだけ右シフトして、それを前記MSB部分と整合させるステップと、
前記MSB部分から前記再構築されたコア信号を減算して、M−Nビット残差信号を形成するステップと、
前記残差信号を可逆符号化するステップと、
符号化された前記残差信号を前記ビットストリームにパックするステップと、
前記LSB部分のビット幅を前記可逆のビットストリームにパックするステップと
を備える方法。 - 請求項34に記載の方法であって、右シフトする前記ステップの前にディザを前記再構築されたコア信号に加えるステップと、ディザ・パラメータを前記ビットストリームにパックするステップとを更に備える方法。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US55618304P | 2004-03-25 | 2004-03-25 | |
US60/556,183 | 2004-03-25 | ||
US10/911,067 US7392195B2 (en) | 2004-03-25 | 2004-08-04 | Lossless multi-channel audio codec |
US10/911,067 | 2004-08-04 | ||
US10/911,062 US7272567B2 (en) | 2004-03-25 | 2004-08-04 | Scalable lossless audio codec and authoring tool |
US10/911,062 | 2004-08-04 | ||
PCT/US2005/009240 WO2005098822A2 (en) | 2004-03-25 | 2005-03-21 | Scalable lossless audio codec and authoring tool |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007531010A true JP2007531010A (ja) | 2007-11-01 |
JP4997098B2 JP4997098B2 (ja) | 2012-08-08 |
Family
ID=35125763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007505034A Active JP4997098B2 (ja) | 2004-03-25 | 2005-03-21 | スケーラブル可逆オーディオ・コーデック及びオーサリング・ツール |
Country Status (9)
Country | Link |
---|---|
EP (6) | EP2228792A3 (ja) |
JP (1) | JP4997098B2 (ja) |
KR (4) | KR101207110B1 (ja) |
AT (2) | ATE510279T1 (ja) |
DK (2) | DK1743326T3 (ja) |
IL (3) | IL178244A0 (ja) |
PL (1) | PL2228791T3 (ja) |
TR (2) | TR200606137T1 (ja) |
WO (2) | WO2005098822A2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009536364A (ja) * | 2006-05-05 | 2009-10-08 | トムソン ライセンシング | 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置 |
JP2012088502A (ja) * | 2010-10-19 | 2012-05-10 | Nippon Telegr & Teleph Corp <Ntt> | 符号化装置、復号装置、符号化方法、復号方法及びそのプログラム |
JP2015519615A (ja) * | 2012-06-12 | 2015-07-09 | メリディアン オーディオ リミテッド | 二重の互換性を持つ損失のないオーディオ帯域幅拡張 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7930184B2 (en) * | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
ES2401817T3 (es) * | 2008-01-31 | 2013-04-24 | Agency For Science, Technology And Research | Procedimiento y dispositivo de distribución/truncado de la velocidad de transmisión de bits para codificación de audio escalable |
US8873671B2 (en) | 2008-03-26 | 2014-10-28 | Qualcomm Incorporated | Method and system for LLR buffer reduction in a wireless communication modem |
KR101641685B1 (ko) * | 2010-03-29 | 2016-07-22 | 삼성전자주식회사 | 멀티채널 오디오의 다운믹스 방법 및 장치 |
KR101676477B1 (ko) | 2010-07-21 | 2016-11-15 | 삼성전자주식회사 | 컨텍스트 기반의 무손실 부호화 장치 및 방법, 그리고 복호화 장치 및 방법 |
JP6100164B2 (ja) | 2010-10-06 | 2017-03-22 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法 |
KR101153819B1 (ko) * | 2010-12-14 | 2012-06-18 | 전자부품연구원 | 오디오 처리 장치 및 방법 |
WO2015164572A1 (en) | 2014-04-25 | 2015-10-29 | Dolby Laboratories Licensing Corporation | Audio segmentation based on spatial metadata |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0830295A (ja) * | 1994-07-20 | 1996-02-02 | Sony Corp | ディジタル・オーディオ信号記録・再生方法と装置 |
JPH10285048A (ja) * | 1997-04-02 | 1998-10-23 | Samsung Electron Co Ltd | デジタルデータの符号化/復号化方法及び装置 |
JPH10285043A (ja) * | 1997-04-02 | 1998-10-23 | Samsung Electron Co Ltd | ビット率の調節可能なオーディオ符号化/復号化方法及び装置 |
JPH10285042A (ja) * | 1997-04-02 | 1998-10-23 | Samsung Electron Co Ltd | ビット率の調節可能なオーディオデータ符号化/復号化方法及び装置 |
JPH11317672A (ja) * | 1997-11-20 | 1999-11-16 | Samsung Electronics Co Ltd | ビット率の調節可能なステレオオーディオ符号化/復号化方法及び装置 |
US20030179938A1 (en) * | 2001-03-05 | 2003-09-25 | Van Der Vleuten Renatus Josephus | Device and method for compressing a signal |
JP2004289837A (ja) * | 2003-03-22 | 2004-10-14 | Samsung Electronics Co Ltd | デジタルデータの符号化/復号化方法および装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6226325B1 (en) * | 1996-03-27 | 2001-05-01 | Kabushiki Kaisha Toshiba | Digital data processing system |
KR100338801B1 (ko) * | 1997-07-31 | 2002-08-21 | 삼성전자 주식회사 | 디지털데이터의부호화/복호화방법및장치 |
KR100251453B1 (ko) * | 1997-08-26 | 2000-04-15 | 윤종용 | 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크 |
US6226608B1 (en) * | 1999-01-28 | 2001-05-01 | Dolby Laboratories Licensing Corporation | Data framing for adaptive-block-length coding system |
EP1054514B1 (en) * | 1999-05-21 | 2007-09-26 | Scientific-Atlanta Europe | Method and apparatus for the compression and/or transport and/or decompression of a digital signal |
US6370502B1 (en) | 1999-05-27 | 2002-04-09 | America Online, Inc. | Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec |
US6226616B1 (en) * | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
US6226216B1 (en) | 2000-01-21 | 2001-05-01 | Intel Corporation | Sectional column activated memory |
GB2364843A (en) * | 2000-07-14 | 2002-02-06 | Sony Uk Ltd | Data encoding based on data quantity and data quality |
US6675148B2 (en) * | 2001-01-05 | 2004-01-06 | Digital Voice Systems, Inc. | Lossless audio coder |
WO2003077425A1 (fr) * | 2002-03-08 | 2003-09-18 | Nippon Telegraph And Telephone Corporation | Procedes de codage et de decodage signaux numeriques, dispositifs de codage et de decodage, programme de codage et de decodage de signaux numeriques |
US20030231799A1 (en) * | 2002-06-14 | 2003-12-18 | Craig Schmidt | Lossless data compression using constraint propagation |
-
2005
- 2005-03-21 AT AT05731220T patent/ATE510279T1/de active
- 2005-03-21 EP EP10167973A patent/EP2228792A3/en not_active Ceased
- 2005-03-21 TR TR2006/06137T patent/TR200606137T1/xx unknown
- 2005-03-21 EP EP05731220A patent/EP1743326B1/en active Active
- 2005-03-21 EP EP05728310A patent/EP1741093B1/en active Active
- 2005-03-21 EP EP10187592.0A patent/EP2270775B1/en active Active
- 2005-03-21 DK DK05731220.9T patent/DK1743326T3/da active
- 2005-03-21 DK DK05728310.3T patent/DK1741093T3/da active
- 2005-03-21 EP EP20100167970 patent/EP2228791B1/en active Active
- 2005-03-21 WO PCT/US2005/009240 patent/WO2005098822A2/en active Application Filing
- 2005-03-21 KR KR1020117027614A patent/KR101207110B1/ko active IP Right Grant
- 2005-03-21 TR TR2006/06136T patent/TR200606136T1/xx unknown
- 2005-03-21 WO PCT/US2005/009275 patent/WO2005098823A2/en active Application Filing
- 2005-03-21 KR KR1020067021735A patent/KR101243412B1/ko active IP Right Grant
- 2005-03-21 AT AT05728310T patent/ATE511178T1/de active
- 2005-03-21 KR KR1020117027616A patent/KR101237559B1/ko active IP Right Grant
- 2005-03-21 KR KR1020067021953A patent/KR101149956B1/ko active IP Right Grant
- 2005-03-21 EP EP10187589.6A patent/EP2270774B1/en active Active
- 2005-03-21 JP JP2007505034A patent/JP4997098B2/ja active Active
- 2005-03-21 PL PL10167970T patent/PL2228791T3/pl unknown
-
2006
- 2006-09-21 IL IL178244A patent/IL178244A0/en active IP Right Grant
- 2006-09-21 IL IL178243A patent/IL178243A0/en active IP Right Grant
-
2009
- 2009-08-13 IL IL200376A patent/IL200376A0/en active IP Right Grant
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0830295A (ja) * | 1994-07-20 | 1996-02-02 | Sony Corp | ディジタル・オーディオ信号記録・再生方法と装置 |
JPH10285048A (ja) * | 1997-04-02 | 1998-10-23 | Samsung Electron Co Ltd | デジタルデータの符号化/復号化方法及び装置 |
JPH10285043A (ja) * | 1997-04-02 | 1998-10-23 | Samsung Electron Co Ltd | ビット率の調節可能なオーディオ符号化/復号化方法及び装置 |
JPH10285042A (ja) * | 1997-04-02 | 1998-10-23 | Samsung Electron Co Ltd | ビット率の調節可能なオーディオデータ符号化/復号化方法及び装置 |
JPH11317672A (ja) * | 1997-11-20 | 1999-11-16 | Samsung Electronics Co Ltd | ビット率の調節可能なステレオオーディオ符号化/復号化方法及び装置 |
US20030179938A1 (en) * | 2001-03-05 | 2003-09-25 | Van Der Vleuten Renatus Josephus | Device and method for compressing a signal |
JP2004289837A (ja) * | 2003-03-22 | 2004-10-14 | Samsung Electronics Co Ltd | デジタルデータの符号化/復号化方法および装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009536364A (ja) * | 2006-05-05 | 2009-10-08 | トムソン ライセンシング | 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置 |
JP2012088502A (ja) * | 2010-10-19 | 2012-05-10 | Nippon Telegr & Teleph Corp <Ntt> | 符号化装置、復号装置、符号化方法、復号方法及びそのプログラム |
JP2015519615A (ja) * | 2012-06-12 | 2015-07-09 | メリディアン オーディオ リミテッド | 二重の互換性を持つ損失のないオーディオ帯域幅拡張 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7668723B2 (en) | Scalable lossless audio codec and authoring tool | |
JP4997098B2 (ja) | スケーラブル可逆オーディオ・コーデック及びオーサリング・ツール | |
US8374858B2 (en) | Scalable lossless audio codec and authoring tool | |
TWI474316B (zh) | 使用具隨機存取點及多重預測參數集合能力的適應性分段技術之無損多聲道音訊編解碼器 | |
KR100917464B1 (ko) | 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 | |
JP3964860B2 (ja) | ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体 | |
KR100300887B1 (ko) | 디지털 오디오 데이터의 역방향 디코딩 방법 | |
JP2003330497A (ja) | オーディオ信号の符号化方法及び装置、符号化及び復号化システム、並びに符号化を実行するプログラム及び当該プログラムを記録した記録媒体 | |
KR20050040441A (ko) | 스케일러블 오디오 복/부호화 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071129 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20081224 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20081224 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110117 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110418 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110425 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110815 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111115 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120501 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120514 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4997098 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |