JP2009500691A - オーディオ信号の処理装置及び方法 - Google Patents
オーディオ信号の処理装置及び方法 Download PDFInfo
- Publication number
- JP2009500691A JP2009500691A JP2008521317A JP2008521317A JP2009500691A JP 2009500691 A JP2009500691 A JP 2009500691A JP 2008521317 A JP2008521317 A JP 2008521317A JP 2008521317 A JP2008521317 A JP 2008521317A JP 2009500691 A JP2009500691 A JP 2009500691A
- Authority
- JP
- Japan
- Prior art keywords
- block
- sub
- scheme
- blocks
- partition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 88
- 230000005236 sound signal Effects 0.000 title claims abstract description 49
- 238000012545 processing Methods 0.000 title claims abstract description 9
- 238000000638 solvent extraction Methods 0.000 claims abstract description 15
- 238000005192 partition Methods 0.000 claims description 58
- 241000209094 Oryza Species 0.000 claims description 42
- 235000007164 Oryza sativa Nutrition 0.000 claims description 42
- 235000009566 rice Nutrition 0.000 claims description 42
- 230000005540 biological transmission Effects 0.000 claims description 6
- 238000003672 processing method Methods 0.000 claims description 2
- 230000006835 compression Effects 0.000 description 22
- 238000007906 compression Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 20
- 230000000875 corresponding effect Effects 0.000 description 18
- 230000003044 adaptive effect Effects 0.000 description 9
- 230000001360 synchronised effect Effects 0.000 description 9
- 238000005070 sampling Methods 0.000 description 8
- 230000002596 correlated effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 241000282693 Cercopithecidae Species 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
【課題】オーディオ信号の処理装置及び方法を提供する。
【解決手段】一実施形態において、少なくとも一つのチャンネルを備えた少なくとも一つのオーディオデータが生成される。各チャンネルは、複数のブロックに分割される。サブブロック区画方案が選択され、ブロックが区画されるサブブロックの数が選択される。選択されたサブブロックの数は、選択されたサブブロック区画方案に対して利用可能なサブブロックの数から選択される。オーディオデータのブロックは、サブブロックの選択された数に応じてサブブロックに区画され、区画されたサブブロックは、選択されたエントロピー符号化方案に応じてコーディングされる。
【選択図】図1
【解決手段】一実施形態において、少なくとも一つのチャンネルを備えた少なくとも一つのオーディオデータが生成される。各チャンネルは、複数のブロックに分割される。サブブロック区画方案が選択され、ブロックが区画されるサブブロックの数が選択される。選択されたサブブロックの数は、選択されたサブブロック区画方案に対して利用可能なサブブロックの数から選択される。オーディオデータのブロックは、サブブロックの選択された数に応じてサブブロックに区画され、区画されたサブブロックは、選択されたエントロピー符号化方案に応じてコーディングされる。
【選択図】図1
Description
本発明はオーディオ信号を処理する方法に係り、特に、オーディオ信号をエンコーディングし且つデコーディングする方法及び装置に関する。
従来には、オーディオ信号の保存及び再生は異なる方式により行われていた。例えば、音楽及び音声は蓄音機技術(例えば、レコードプレーヤー)、磁気技術(例えば、カセットテープ)、及びデジタル技術(例えば、コンパクトディスク)により記録され且つ保存されていた。オーディオ保存技術の進歩に伴い、オーディオ信号の品質及び保存性を最適化させるために多くの問題点を克服する必要がある。
音楽信号のアーカイブ及び広帯域送信において、無損失再構成は、MP3またはAACなどのMPEG標準において定義された概念的なコーディングによる圧縮に際して、高効率よりもなお一層重要な特徴となっている。たとえ、DVDオーディオ及びスーパーCDオーディオが独自仕様の無損失圧縮スキームを含んでいるとしても、コンテンツ保有者及び放送業体に開放的で且つ一般的な圧縮スキームが求められるようになった。このような要求に応えて、新規な無損失コーディングスキームがMPEG−4オーディオ標準に対する拡張として考慮される。無損失オーディオコーディングは原信号の完全な再構成に起因する品質の損失なしにデジタルオーディオデータを圧縮可能にする。
本発明はオーディオ信号の処理方法に関する。
一実施形態において、少なくとも一つのチャンネルを備える少なくとも一つのオーディオデータが生成される。各チャンネルは複数のブロックに分割される。サブブロック区画スキームが選択され、ブロックの区画されるサブブロックの数が選択される。選択されたサブブロックの数は、選択されたサブブロック区画スキームに対して利用可能なサブブロックの数から選択される。オーディオデータのブロックは、サブブロックの選択された数に応じてサブブロックに区画され、区画されたサブブロックは、選択されたエントロピー符号化スキームに応じてコーディングされる。
一実施形態において、選択されたエントロピー符号化スキームは、ライスコードスキーム及びブロック・ギルバート・ムーア・コード(BGMC:Block Gilbert Moore Code)スキームのうちのいずれかである。
一実施形態において、本方法は、複数のパラメーターs(0)、s(1)、…s(N−1)を決めるステップと、複数のコードパラメーターにより定義された複数のエントロピーコードを用いてNサブブロックをエントロピー符号化するステップと、コードパラメーターを送信するステップと、をさらに含む。送信ステップは、第1のサブブロックのコードパラメーターを示すs(0)を直接的に送信するステップと、第1のサブブロックを後続するi番目のサブブロックのコードパラメーターを表現するi=1、…N−1、s(i)に対する差分s(i)−s(i−1)を送信するステップと、を含む。
他の実施形態は、少なくとも一つのフレームを備えるオーディオ信号を処理する方法に関する。フレームは、多数のブロックに分割される少なくとも一つのチャンネルを備える。本方法は、オーディオ信号に関する構成情報にコーディング情報を付加するステップを含む。コーディング情報は、オーディオ信号をエンコーディングするときに用いられるエントロピー符号化を示す。本方法は、構成情報に区画情報を付加するステップを含む。区画情報は、ブロックを区画するのに用いられるサブブロック区画スキームを示す。本方法は、少なくとも一つのブロックにサブブロック情報を付加するステップをさらに含む。サブブロック情報は、ブロックが区画されるサブブロックの数を示す。
一実施形態において、サブブロック内のビット数は可変する。例えば、サブブロック情報内のビット数は、サブブロック区画スキーム及びエントロピー符号化スキームに応じて可変する。
一実施形態において、エントロピー符号化スキームは、ライスコードスキーム及びBGMCスキームのうちのいずれかである。
他の実施形態において、エントロピー符号化スキームがライスコードスキームである場合、サブブロック区画スキームは、(i)無区画スキーム、及び(ii)無区画とブロックの4個のサブブロックへの区画との間の選択に提供される区画スキームのうちのいずれかである。
エントロピー符号化スキームがBMGCスキームである場合、一実施形態において、サブブロック区画スキームは、(i)無区画とブロックの4個のサブブロックへの区画との間の選択に提供される第1の区画スキームと、(ii)無区画と、ブロックの2個のサブブロックへの区画と、ブロックの4個のサブブロックへの区画と、ブロックの8個のサブブロックへの区画との間の選択に提供される第2の区画スキームのうちいずれか一つである。
さらに他の実施形態において、オーディオデータの少なくとも一つのブロック及び構成情報を含むオーディオ信号が受信される。区画情報は構成情報から読み出され、区画情報は、ブロックがサブブロックに分割されるサブブロック区画スキームを示す。サブブロック情報はオーディオデータのブロックから読み出され、サブブロック情報は、ブロックがサブブロック区画スキームに応じて区画されるサブブロックの数を示す。区画されたサブブロックは、サブブロックの数に基づいてデコーディングされる。
一実施形態において、本方法は、オーディオ信号に関する構成情報からコーディング情報を読み出すステップをさらに含む。ここで、コーディング情報は、オーディオ信号のエンコーディング時に用いられるエントロピー符号化スキームを示す。区画されたサブブロックは、サブブロックの数及びエントロピー符号化スキームに基づいてデコーディングされる。
以下、添付図面に基づき、本発明の好適な実施形態について説明する。なお、図中、同じ構成要素にはできる限り同じ符号を付してある。
本発明のさらなる理解を提供するために添付された図面は本発明の一部として一体化及び構成されて本発明の実施形態を例示し、説明とともに本発明の原理を説明するのに寄与する。
本発明を記述する前に、本発明において開示されたほとんどの用語は公知の汎用用語であるが、一部の用語は必要に応じて選択されて次の説明において用いられるところに留意すべきである。よって、出願人により定義された用語は本発明においてその意味に基づいて理解すべきものである。
無損失オーディオコーディング方法において、エンコーディングプロセスが情報の損失無しに完全な可逆性を有する必要があるため、エンコーダー及びデコーダーの両方の種々の構成要素は決定的な方式により実現できなければならない。
[コーデック構造]
図1は、本発明によるエンコーダー1の例示図である。
図1は、本発明によるエンコーダー1の例示図である。
区画部100は、入力オーディオデータをフレームに区画する。1フレーム内において、各チャンネルはさらなる処理のためにオーディオサンプルにサブ分割される。バッファ110は、区画部100により区画されたブロック及び/またはフレームサンプルを保存する。
係数推定部120は、各ブロックに対する最適な組の係数値を推定する。係数の数、すなわち、予測器の順序は適宜に選択可能である。係数推定部120は、デジタルオーディオデータのブロックに対してパーコール値の組を演算する。パーコール値は、予測係数を示すパーコールを示す。量子化部130は、パーコール値組を量子化する。
第1のエントロピー符号化部140は、パーコール値からオフセット値を差し引いてパーコール余り値を演算し、エントロピーパラメーターにより定義されたエントロピー符号化を用いてパーコール余り値をエンコーディングする。ここで、オフセット値及びエントロピーパラメーターは最適なテーブルから選択される。最適なテーブルは、デジタルオーディオデータのブロックのサンプリングレートに基づいて複数のテーブルから選択される。複数のテーブルは、送信用のデジタルオーディオデータの最適な圧縮のために、複数のサンプリング範囲のそれぞれに対して予め定義される。
係数変換部150は、量子化されたパーコール値を線形予測符号化(LPC:Linear Predictive Coding)係数に変換する。予測器160は、LPC係数を用いてバッファ110内に保存されている以前の原サンプルから現在の予測値を推定する。減算器170は、バッファ110に保存されているデジタルオーディオデータのオリジナル値を用いてデジタルオーディオデータのブロックの余り予測及び予測器160により推定された予測値の演算を行う。
第2のエントロピー符号化部180は、他のエントロピーコードを用いて余り予測をコーディングし、コードインデックスを生成する。選択されたコードのインデックスは、補助情報として送信される。第2のエントロピー符号化部180は、異なる複雑性を有する2つの代案的なコーディング技術のうちいずれか一方を用いて余り予測をコーディングする。一方のコーディング技術は公知のゴロム−ライスコーディング(以下、「ライスコーディング」と略す。)方法であり、他方のコーディング技術は公知のブロックギルバート−ムーアコード(以下、「BGMC」と略す。)方法である。ライスコードは複雑性は低いものの、効率的である。BGMC算術コーディングスキームは、ライスコードに比べてやや増加して複雑性を犠牲にして遥かに良好な圧縮を提供する。
最後に、マルチプレックス部190は、コーディングされた余り予測、コードインデックス、コーディングされたパーコール余り値、及び他の付加情報をマルチプレックスして圧縮されたビットストリームを形成する。また、エンコーダー1は、デコーディングされたデータを検証するためにデコーダーにおいて主として提供される巡回冗長検査(CRC:Cyclic Redundancy Check)チェックサムを提供する。エンコーダー側上において、CRCは圧縮されたデータが無損失にてデコーディング可能であることを保証するのに用いられる。
付加的なエンコーディングオプションは、フレキシブルブロックスイッチングスキーム、ランダムアクセス及びジョイントチャンネルコーディングを含む。エンコーダー1は、種々の圧縮レベルに異なる複雑度を与えるためにこれらのオプションを用いる。ジョイントチャンネルコーディングは、ステレオチャンネルまたはマルチチャンネル信号同士の従属性を活用するのに用いられる。これは、2つのチャンネル間の差分が原チャンネルにおいてより効率よくコーディング可能なセグメントにおけるこのような差分をコーディングして達成することができる。このようなエンコーディングオプションの詳細については、本発明による例示的なデコーダーの説明後に行う。
図2は、本発明によるデコーダー2の例示図である。特に、図2は、エンコーダーよりもやや複雑性の低い無損失オーディオ信号デコーダーを示し、その理由は、いかなる適用も行われないためである。
デマルチプレックス部200は、オーディオ信号を受信し、デジタルオーディオデータのブロックのコーディングされた余り予測、コードインデックス、コーディングされたパーコール余り値、及び他の付加情報をデマルチプレックスする。第1のエントロピー復号化部210は、エントロピーパラメーターにより定義されたエントロピーコードを用いてパーコール余り値をデコーディングし、デコーディングされたパーコール余り値にオフセット値を加えてパーコール値の組を演算する。ここで、オフセット値及びエントロピーパラメーターはデジタルオーディオデータのブロックのサンプルレートに基づいて複数のテーブルからデコーダーにより選択されたテーブルから選択される。第2のエントロピー復号化部220は、コードインデックスを用いてデマルチプレックスされたコーディングされた余り予測をデコーディングする。係数変換部230は、エントロピー復号化されたパーコール値をLPC係数に変換する。予測器240は、LPC係数を用いてデジタルオーディオデータのブロックの予測余りを推定する。加算器250は、デコーディングされた予測余りを推定された予測余りに加えてデジタルオーディオデータの原ブロックを取得する。アセンブリング部260は、デコーディングされたブロックデータをフレームデータにアセンブリングする。
この後、デコーダー2は、コーディングされた予測余り及びパーコール余り値をデコーディングし、パーコール余り値をLPC係数に変換し、逆予測フィルターを適用して無損失再構成信号を演算する。デコーダー2の計算量は、エンコーダー1により選択された予測順序による。ほとんどの場合、リアルタイムなデコーディングはローエンドシステムにおいてさえ行うことが可能である。図3は、本発明による複数のチャンネル(例えば、Mチャンネル)を含む圧縮オーディオ信号のビットストリーム構造の例示図である。ビットストリームは、複数のチャンネル(例えば、Mチャンネル)を含む少なくとも1枚のオーディオフレームから構成される。ビットストリーム構成シンタックス(テーブル6参照)の「チャンネル」フィールドは、チャンネル数を示す。各チャンネルは、後述するように、本発明によるブロックスイッチングスキームを用いて複数のブロックにサブ分割される。各サブ分割されたブロックは異なるサイズを有し、図1のエンコーディングによりコーディングデータを含む。例えば、サブ分割されたブロック内のコーディングデータは、コードインデックス、予測順序K、予測係数、及びコーディングされた余り値を含む。チャンネル対同士のジョイントコーディングが用いられる場合、ブロック区画は両チャンネルにおいて同じであり、ブロックはインタリーブ方式により保存される。ビットストリーム構成シンタックス(テーブル6)内の「js_stereo」フィールドは、ジョイントステレオ(チャンネル差分)がオンであるか、またはオフであるかを示し、フレーム_データシンタックス(テーブル7)内の「js_switch」フィールドは、ジョイントステレオ(チャンネル差分)が選択されているかどうかを示す。そうでなければ、各チャンネルに対するブロック区画は独立的である。
以下、添付図面に基づき、ブロックスイッチング、ランダムアクセス、区画、及び上述したエントロピー符号化オプションについてシンタックスを参考として詳述する。
[ブロックスイッチング]
本発明の一態様は、実際にコーディングスキームを用いる前に各チャンネルを複数のブロックにサブ分割することと関連する。以下、本発明によるブロック区画(または、サブ分割)方法は「ブロックスイッチング方法」として言及される。
本発明の一態様は、実際にコーディングスキームを用いる前に各チャンネルを複数のブロックにサブ分割することと関連する。以下、本発明によるブロック区画(または、サブ分割)方法は「ブロックスイッチング方法」として言及される。
[階層ブロックスイッチング]
図4は、本発明による階層ブロックスイッチング方法の概念の例示図である。例えば、図4は、1チャンネルを32ブロックに階層的にサブ分割する方法を示す。複数のチャンネルが単一のフレームに与えられるとき、各チャンネルは32個のブロックまでサブ分割(または、分割)可能であり、各チャンネルに対するサブ分割されたブロックは1フレームを構成する。このため、本発明によるブロックスイッチング方法は、図1に示す区画部100により行われる。さらに、上述したように、予測及びエントロピー符号化はサブ分割されたブロック単位で行われる。
図4は、本発明による階層ブロックスイッチング方法の概念の例示図である。例えば、図4は、1チャンネルを32ブロックに階層的にサブ分割する方法を示す。複数のチャンネルが単一のフレームに与えられるとき、各チャンネルは32個のブロックまでサブ分割(または、分割)可能であり、各チャンネルに対するサブ分割されたブロックは1フレームを構成する。このため、本発明によるブロックスイッチング方法は、図1に示す区画部100により行われる。さらに、上述したように、予測及びエントロピー符号化はサブ分割されたブロック単位で行われる。
一般に、従来のオーディオ無損失符号化(ALS:Audio Lossless Coding)は、比較的単純なブロックスイッチングメカニズムを含む。Nサンプルの各チャンネルは1つの完全長さのブロック(NB=N)または4個ブロックの長さNB=N/4(例えば、1:4スイッチング)を用いてエンコーディングされ、ここで、同じブロック分割がすべてのチャンネルに適用される。状況によっては、このようなスキームはいくらかの制限を有する。例えば、単に1:1または1:4スイッチングのみが可能であることがあり、他のスイッチング(例えば、1:2、1:8及びこれらの組み合わせ)の方がさらに有効である場合がある。また、従来のALSにおいて、スイッチングは他のチャンネルが他のスイッチングから利得を得るとしても、全てのチャンネルに対して同様に行われる(チャンネルが相関しない場合には特にあてはまる)。
このため、本発明の実施形態によるブロックスイッチング方法は比較的フレキシブルなブロックスイッチングスキームを提供し、1フレームの各チャンネルは複数のブロックに階層的にサブ分割される。例えば、図4は、32個のブロックに階層的にサブ分割可能な1チャンネルを示す。NB=N、N/2、N/4、N/8、N/16、及びN/32とのブロックの任意の組み合わせは、各ブロックが2重長さの上位ブロックのサブ分割から生じる限り、この実施形態によりチャンネル内において可能でありうる。例えば、図4に例示するように、N/4+N/4+N/2への分割は可能であるが、N/4+N/2+N/4への分割は不可である(例えば、図5(e)及び5に示すブロックスイッチング例は後述する)。換言すると、チャンネルは複数のブロックに分割されて、各ブロックがi=1、2、...pに対するN/(mi)のうちいずれかと同じ長さを有する。ここで、Nはチャンネルの長さ、mは2以上の整数、pはサブ分割階層のレベル数を示す。
このため、本発明の実施形態において、ビットストリームは、ブロックスイッチングレベルを示す情報と、ブロックスイッチング結果を示す情報と、を含む。ここで、ブロックスイッチングと関連する情報は、後述するように、デコーディングプロセスにおいて用いられるシンタックスに含まれる。
例えば、ブロックスイッチングプロセス後に生成された最大ブロックサイズがNB=N/32になるように設定が行われる。しかしながら、このような設定は、本発明の説明を簡略化するための例に過ぎない。このため、本発明による設定はこのような設定に制限されない。
特に、最大ブロックサイズがNB=N/32の場合、ブロックスイッチングプロセスが、レベル5ブロックスイッチングとして言及される5回に亘って階層的に行われる。代案的に、最大のブロックサイズがNB=N/16の場合、ブロックスイッチングプロセスが、レベル4ブロックスイッチングとして言及される4回に亘って階層的に行われる。同様に、最大のブロックサイズがNB=N/8の場合、ブロックスイッチングプロセスは、レベル3ブロックスイッチングとして言及される3回に亘って階層的に行われる。最大のブロックサイズがNB=N/4の場合、ブロックスイッチングプロセスは、レベル2ブロックスイッチングとして言及される2回に亘って階層的に行われる。最大のブロックサイズがNB=N/2の場合、ブロックスイッチングプロセスは、レベル1ブロックスイッチングとして言及される1回に亘って階層的に行われる。結局として、最大のブロックサイズがNB=Nの場合、階層的なブロックスイッチングプロセスは行われることなく、これは、レベル0ブロックスイッチングとして言及される。
本発明の実施形態において、ブロックスイッチングを示す情報は、第1のブロックスイッチング情報として言及される。例えば、第1のブロックスイッチング情報は、後述するプロセスにおいて説明されるように、テーブル6に示すシンタックス内の2ビット「block_switching」フィールドにより表現される。特に、「block_switching=00」はレベル0を、「block_switching=01」はレベル1から3のうち少なくともいずれか1つを、「block_switching=10」はレベル4を、そして「block_switching=11」はレベル5を示す。
また、上述したブロックスイッチングレベルによる、各階層的なレベルに対して行われたブロックスイッチングの結果を示す情報は、実施形態において第2のブロックスイッチング情報として言及される。以下、第2のブロックスイッチング情報は、テーブル7に示すシンタックス内の8ビット、16ビット及び32ビットのうち少なくともいずれか1つにより表現される。特に、「block_switching=01」の場合(レベル1から3のいずれかを示す場合)、「bs_info」は8ビットにより表現される。「block_switching=10」の場合(レベル4を示す場合)、「bs_info」は16ビットにより表現される。すなわち、ブロックスイッチング結果の4レベルまでは16ビットを用いて表現される。さらに、「block_switching=11」の場合(レベル5を示す場合)、「bs_info」は32ビットにより表現される。すなわち、ブロックスイッチング結果の5レベルまでは32ビットを用いて表現される。結局として、「block_switching=00」の場合(ブロックスイッチングが行われない旨を示す場合)、「bs_info」は送信されない。これは、1チャンネルが1ブロックを構成することを示す。
第2のブロックスイッチング情報に割り当てられたビットの総数は、第1のブロックスイッチング情報のレベル値に基づいて決まる。これは、最終的なビットレートを減らす結果を招く。第1のブロックスイッチング情報と第2のブロックスイッチング情報との間の関係は、以下のテーブル1に簡略に説明する。
以下、第2のブロックスイッチング情報bs_info内の各ビットを構成(または、マッピング)する方法の実施形態について説明する。
bs_infoフィールドは、上述した実施形態により4バイトまでを含む。レベル1から5に関するビットのマッピングは[(0)1223333 44444444 5555555555555555]でありうる。第1のビットは、独立/同期ブロックスイッチングのセクションにおいて詳述する独立的なまたは同期化ブロックスイッチングを示すように保有される。図5(a)から図5(f)は、レベル3ブロックスイッチングが行われるチャンネルに対する他のブロックスイッチング例を示す。このため、これらの例において、最大のブロック長はNB=N/8であり、bs_infoは1バイトからなる。最大のブロック長NB=Nから始まるとすれば、bs_infoはブロックがさらにサブ分割される場合に設定される。例えば、図5(a)においてはサブ分割がなくて、「bs_info」は(0)000 0000である。図5(b)において、フレームは((0)1...)にサブ分割され、長さN/2の第2のブロックは、((0)101...)をN/4長さの2つのブロックに分割して、「bs_info」は(0)1010 000)である。図5(c)において、フレームは((0)1...)にサブ分割され、N/2長さの第1のブロックだけが((0)110...)をN/4長さの2つのブロックに分割して、「bs_info」は(0)1100 0000となる。図5(d)において、フレームは((0)1...)にサブ分割され、N/2長さの第1及び第2のブロックが((0)111...)をN/4長さの2つのブロックにさらに分割し、長さN/4の第2のブロックだけが((0)11101...)を長さN/8の2つのブロックにさらに分割して、「bs_info」は(0)111 0100となる。
上述したように、図5(e)及び図5(f)の例は、図5(e)のN/2ブロックと図5(f)の第1のN/4ブロックが以前のレベルのブロックをサブ分割して取得できないために許容されないブロックスイッチングの場合を示す。
[独立/同期化ブロックスイッチング]
図6(a)から図6(c)は、本発明の実施形態によるブロックスイッチングの例示図である。
図6(a)から図6(c)は、本発明の実施形態によるブロックスイッチングの例示図である。
特に、図6(a)は、チャンネル1、2及び3に対してブロックスイッチングが行われない例を示す。図6(b)は、2つのチャンネル(チャンネル1及び2)が一つのチャンネル対を構成する例を示し、ブロックスイッチングは、チャンネル1及び2において同期的に行われる。インタリーブもまたこの例に適用される。図6(c)は、2つのチャンネル(チャンネル1及び2)が一つのチャンネル対を構成する例を示し、チャンネル1及び2のブロックスイッチングは独立して行われる。以下、チャンネル対は、2つの任意のオーディオチャンネルを指し示す。どのチャンネルがチャンネル対にグループ分けされるかの判断は、エンコーダーにより自動的に行われうるか、または、ユーザーによりマニュアルにて行われうる(例えば、L、Rチャンネル、Ls、Rsチャンネル)。
独立ブロックスイッチングに際し、たとえ、各チャンネルの長さが全てのチャンネルに対して同じであるとしても、ブロックスイッチングは各チャンネルに対して独立して行われることが可能である。すなわち、図6(c)に示すように、チャンネルはブロックに異なって分割される。チャンネル対の2つのチャンネルが互いに相関し、且つ、差分コーディングが用いられる場合、チャンネル対の両チャンネルは同期化されてブロックスイッチングされる。同期化ブロックスイッチングの際に、チャンネルは同じ方式によりブロックスイッチング(すなわち、ブロックに分割)される。図6(b)はこのような例を示し、ブロックがインタリーブされることをさらに示す。チャンネル対のうち2つのチャンネルが互いに相関していない場合に差分コーディングは利点がなく、これにより、チャンネルを同期的にブロックスイッチングする必要がない。むしろ、チャンネルを独立してスイッチングした方がさらに好適である。さらに、本発明の他の実施形態によれば、独立または同期化ブロックスイッチングの上述した方法は、3以上のチャンネル数を有するマルチチャンネル群に適用される。例えば、マルチチャンネル群の全てのチャンネルが互いに相関している場合、マルチチャンネル群の全てのチャンネルは同期的にスイッチングされる。一方、マルチチャンネル群の全てのチャンネルが互いに相関していない場合にマルチチャンネル群の各チャンネルは独立してスイッチングされる。
さらに、「bs_info」フィールドはブロックスイッチング結果を示す情報として用いられる。また、「bs_info」フィールドは、ブロックスイッチングがチャンネル対を構成する各チャンネルに対して独立してまたは同期化して行われるかどうかを示す情報として用いられる。この場合、上述したように、「bs_info」フィールド内の特定のビット(例えば、第1のビット)が用いられる。例えば、チャンネル対の2つのチャンネルが互いに独立している場合、「bs_info」フィールドの第1のビットは「1」に設定される。一方、チャンネル対の2つのチャンネルが互いに同期化される場合に「bs_info」フィールドの第1のビットは「0」に設定される。
以下、図6(a)から図6(c)について説明する。
図6(a)を参照すれば、いかなるチャンネルにおいてもブロックスイッチングが行われないため、関連する「bs_info」は生成されない。
図6(b)を参照すれば、チャンネル1及び2はチャンネル対を構成し、2つのチャンネルは互いに同期化され、ブロックスイッチングが同期的に行われる。例えば、図6(b)において、チャンネル1及び2の両方は長さN/4のブロックに分割され、同じbs_info「bs_info=(0)101 0000」を有する。このため、1つの「bs_info」は各チャンネル対に対して送信されて、ビットレートを減らすという結果を招く。さらに、チャンネル対が同期化されれば、チャンネル対内の各ブロックは互いにインタリーブされることが求められる。インタリーブは利点(または、利得)がある。例えば、チャンネル対内の1チャンネルのブロック(例えば、図6(b)のブロック1.2)は両チャンネル内の以前のブロック(例えば、図6(b)のブロック1.1及び2.1)に従属し、このため、これらの以前のブロックは現在ブロックに先行して利用可能なものである必要がある。
図6(c)を参照すれば、チャンネル1及び2はチャンネル対を構成する。しかしながら、この例において、ブロックスイッチングは独立して行われる。特に、チャンネル1はN/4までのサイズ(または、長さ)のブロックに分割され、「bs_info=(1)101 0000」のbs_infoを有する。チャンネル2はN/2までのサイズのブロックに分割され、「bs_info=(1)100 0000」のbs_infoを有する。図6(c)に示す例において、ブロックスイッチングは各チャンネル間に独立して行われ、このため、ブロック間のインタリーブプロセスは行われない。すなわち、ブロックが独立して行われたチャンネルにおいて、チャンネルデータは独立して配列される。
[ジョイントチャンネルコーディング]
また、ジョイントチャンネルコーディングはジョイントステレオとも呼ばれ、ステレオ信号の2チャンネル間またはマルチチャンネル信号の任意の2チャンネル間の従属性を活用するのに使用可能である。たとえ、2チャンネルx1(n)及びx2(n)を独立して処理することが容易であるとしても、チャンネル間の従属性を活用する単純な方法は、差分信号、x1(n)またはx2(n)の代わりにd(n)=x2(n)−x1(n)をエンコーディングすることである。
また、ジョイントチャンネルコーディングはジョイントステレオとも呼ばれ、ステレオ信号の2チャンネル間またはマルチチャンネル信号の任意の2チャンネル間の従属性を活用するのに使用可能である。たとえ、2チャンネルx1(n)及びx2(n)を独立して処理することが容易であるとしても、チャンネル間の従属性を活用する単純な方法は、差分信号、x1(n)またはx2(n)の代わりにd(n)=x2(n)−x1(n)をエンコーディングすることである。
各ブロックにおけるx1(n)、x2(n)及びd(n)間のスイッチングは、2つの信号が最も効率よくコーディング可能な個別信号の比較に従属して行われる。スイッチングされた差分コーディングによるこのような予測は、2つのチャンネルが互いに極めて類似している場合に利点がある。マルチチャンネルの場合、チャンネルは適宜なチャンネル対を割り当てるためにエンコーダーにより並替え可能である。
また、単純な差分コーディングに加えて、無損失オーディオコーデックは、マルチチャンネル信号の任意のチャンネル間のチャンネル間冗長を活用するさらに複雑なスキームを支援する。
[ランダムアクセス]
本発明はオーディオ無損失コーディングに関するものであり、ランダムアクセスに対応可能である。ランダムアクセスは、以前の部分のデコーディングに高いコストをかけることなくエンコーディングされたオーディオ信号の所定の部分を高速にてアクセスすることを示す。圧縮されたデータの検索、編集またはストリーミングを採用するアプリケーションに重要な特徴がある。ランダムアクセスを可能にするためには、ランダムアクセス部内において、エンコーダーが以前のフレームをデコーディングすることなくデコーディング可能なフレームを挿入する必要がある。挿入されたフレームは「ランダムアクセスフレーム」として言及される。このようなランダムアクセスフレームにおいて、以前のフレームからいかなるサンプルも予測に用いられない。
本発明はオーディオ無損失コーディングに関するものであり、ランダムアクセスに対応可能である。ランダムアクセスは、以前の部分のデコーディングに高いコストをかけることなくエンコーディングされたオーディオ信号の所定の部分を高速にてアクセスすることを示す。圧縮されたデータの検索、編集またはストリーミングを採用するアプリケーションに重要な特徴がある。ランダムアクセスを可能にするためには、ランダムアクセス部内において、エンコーダーが以前のフレームをデコーディングすることなくデコーディング可能なフレームを挿入する必要がある。挿入されたフレームは「ランダムアクセスフレーム」として言及される。このようなランダムアクセスフレームにおいて、以前のフレームからいかなるサンプルも予測に用いられない。
以下、本発明によるランダムアクセス用の情報について説明する。構成シンタックスを参照すれば(テーブル6参照)、ランダムアクセスと関連する情報は構成情報として送信される。例えば、「random_access」フィールドは、ランダムアクセスが許容されるかどうかを示す情報として用いられ、8ビットを用いて表現される。さらに、ランダムアクセスが許容される場合、8ビットの「random_access」フィールドは、ランダムアクセス部を構成するフレーム数を指定する。例えば、「random_access=0000 0000」の場合、ランダムアクセスには対応されない。すなわち、「random_access>0」の場合、ランダムアクセスに対応する。特に、「random_access=000 0001」の場合、これは、ランダムアクセス部を構成するフレーム数が1であることを示す。これは、ランダムアクセスが全てのフレーム部において許容されることを意味する。さらに、「random_access=1111 1111」の場合、これは、ランダムアクセス部を構成するフレーム数が255であることを示す。これにより、「random_access」情報は、現在のランダムアクセス部内のランダムアクセスフレームと次のランダムアクセス部内のランダムアクセスフレームとの距離に相当する。以下、この距離はフレーム数により表現される。
32ビットの「ra_unit_size」フィールドは、ビットストリーム内に含まれて送られる。ここで、「ra_unit_size」フィールドは、ランダムアクセスユニットをバイトで示し、これにより、現在のランダムアクセスフレームから次のランダムアクセスフレームまでの距離をバイトで表わす。「ra_unit_size」フィールドは、構成シンタックス(テーブル6)に含まれるか、あるいは、フレーム−データシンタックス(テーブル7)に含まれる。構成シンタックス(テーブル6)は、「ra_unit_size」情報のビットストリーム内における保存先を示す情報をさらに含む。この情報は、2ビットの「ra_flag」フィールドとして表現される。特に、例えば、「ra_flag=00」の場合、これは、「ra_unit_size」情報がビットストリームに保存されない旨を示す。「ra_flag=01」の場合、これは、「ra_unit_size」情報がビットストリーム内のフレームデータシンタックス(テーブル7)に保存されない旨を示す。さらに、「ra_flag=10の場合、「ra_unit_size」情報はビットストリーム内の構成シンタックス(テーブル6)に保存される。「ra_unit_size」情報が構成シンタックスに含まれる場合、これは、「ra_unit_size」情報が1回のみビットストリーム上において送信され、且つ、全てのランダムアクセス部に同様に適用されることを示す。「ra_unit_size」情報がフレーム−データシンタックスに含まれる場合、これは、現在のランダムアクセス部内のランダムアクセスフレームと次のランダムアクセス部内のランダムアクセスフレームとの距離を示す。このため、「ra_unit_size」情報は、この距離の可変に起因して、ビットストリーム内の各ランダムアクセスユニットに対して送られる。これにより、構成シンタックス(テーブル6)内の「random_access」フィールドは、第1の一般情報として言及される。また、「ra_flag」フィールドは、第2の一般情報として言及される。本発明のこのような態様において、オーディオ信号は構成情報及び複数のランダムアクセス部を含み、各ランダムアクセス部は1以上のオーディオデータフレームを含み、これらのうちいずれか一つはランダムアクセスフレームであり、構成情報は2つの隣り合うランダムアクセスフレーム間の距離をフレームにより表わす第1の一般情報を含み、第2の一般情報は各ランダムアクセス部に対するランダムアクセス部のサイズ情報が保存されることを示す。ランダムアクセス部のサイズ情報は、2つの隣り合うランダムアクセスフレーム間の距離をバイトで表わす。
選択的に、本発明のこのような態様において、オーディオ信号をデコーディングする方法は、構成情報及び複数のランダムアクセス部を備えるオーディオ信号を受信するが、各ランダムアクセス部は1以上のオーディオデータフレームを含み、これらのうちいずれかはランダムアクセスフレームであるステップと、2つの隣り合うランダムアクセスフレーム間を距離をフレームで表わす第1の一般情報を構成情報から読み取るステップと、各ランダムアクセス部に対するランダムアクセスサイズ情報が保存される旨を示す第2の一般情報を読み取るステップと、を含み、このようなランダムアクセス部のサイズ情報は、2つの隣り合うランダムアクセスフレーム間の距離をバイトで表わす。デコーダーはランダムアクセスユニットサイズ情報にアクセスし、この情報と第1及び第2の一般情報を用いてオーディオ信号内のオーディオデータのランダムアクセスを行う。デコーダーはランダムアクセスユニットサイズ情報にアクセスし、この情報と第1及び第2の一般情報を用いてオーディオ信号内のオーディオデータのランダムアクセスを行う。
[チャンネル構成]
図3に示すように、オーディオ信号は、本発明によるマルチチャンネル情報を含む。例えば、各チャンネルは、オーディオスピーカーの位置と一対一の対応関係でマッピングされる。構成シンタックス(テーブル6)は、16ビットの「chan_config_info」フィールド及び16ビットの「channel」フィールドとして表現されるチャンネル構成情報を含む。「chan_config_info」フィールドは、チャンネルをスピーカー位置にマッピングするための情報を含み、16ビットの「channel」フィールドは、チャンネルのトータル数を示す情報を含む。例えば、「channel」フィールドが「0」と同じ場合、これは、チャンネルがモノチャンネルに相当する旨を示す。「channel」フィールドが「1」と同じ場合、これは、チャンネルがステレオチャンネルのうちいずれかに相当する旨を示す。「channel」フィールドが「2」以上と同じ場合、これは、チャンネルがマルチチャンネルのうちいずれかに相当する旨を示す。
図3に示すように、オーディオ信号は、本発明によるマルチチャンネル情報を含む。例えば、各チャンネルは、オーディオスピーカーの位置と一対一の対応関係でマッピングされる。構成シンタックス(テーブル6)は、16ビットの「chan_config_info」フィールド及び16ビットの「channel」フィールドとして表現されるチャンネル構成情報を含む。「chan_config_info」フィールドは、チャンネルをスピーカー位置にマッピングするための情報を含み、16ビットの「channel」フィールドは、チャンネルのトータル数を示す情報を含む。例えば、「channel」フィールドが「0」と同じ場合、これは、チャンネルがモノチャンネルに相当する旨を示す。「channel」フィールドが「1」と同じ場合、これは、チャンネルがステレオチャンネルのうちいずれかに相当する旨を示す。「channel」フィールドが「2」以上と同じ場合、これは、チャンネルがマルチチャンネルのうちいずれかに相当する旨を示す。
テーブル2は「chan_config_info」フィールドを構成する各ビットとこれに対応する各チャンネルの例を示す。特に、対応するチャンネルが送信されたビットストリーム内に存在する場合、「chan_config_info」フィールド内の対応するビットは「1」に設定される。代案的に、対応するチャンネルが送信されたビットストリーム内に存在しない場合、「chan_config_info」フィールド内の対応するビットは「0」に設定される。また、本発明は、「chan_config_info」フィールドが構成シンタックス(テーブル6)内に存在するかどうかを示す情報を含む。この情報は、1ビットの「chan_config」フラグとして表現される。特に、「chan_config=0」は、「chan_config_info」フィールドが存在しない旨を示す。「chan_config=1」は、「chan_config_info」フィールドが存在する旨を示す。このため、「chan_config=0」の場合、これは、「chan_config_info」フィールドが構成シンタックス(テーブル6)内において新たに定義される旨を示す。
さらに、チャンネル構成において、相関するチャンネルがオーディオデータまたはオーディオ信号の構造に隣接しない。これにより、相関するチャンネルが隣接するようにチャンネルデータを再構成することが利点となる。チャンネルが再構成される方式は、構成情報(テーブル6)のchan_posフィールドにおいて示される。さらに、構成情報(テーブル6)は、chan_posフィールドのチャンネル再構成情報が存在するかどうかを示すchan_posフィールドを含む。
上述した種々のチャンネル情報に基づいて、デコーダーは、正確なチャンネルが正確なスピーカーに送られるようにオーディオ信号を処理する。
[フレーム長]
図3に示すように、オーディオ信号は、本発明により多数または多重のチャンネルを含む。このため、エンコーディングを行うとき、1フレームを構成するマルチチャンネルの数に関する情報及び各チャンネルに対するサンプルの数に関する情報はビットストリーム内に挿入されて送信される。構成シンタックス(テーブル6)を参照すれば、32ビットの「sample」フィールドは、各チャンネルを構成するオーディオデータサンプルのトータル数を示す情報として用いられる。さらに、16ビットの「frame_length」フィールドは、対応するフレーム内の各チャンネルに対するサンプルの数を示す情報として用いられる。
図3に示すように、オーディオ信号は、本発明により多数または多重のチャンネルを含む。このため、エンコーディングを行うとき、1フレームを構成するマルチチャンネルの数に関する情報及び各チャンネルに対するサンプルの数に関する情報はビットストリーム内に挿入されて送信される。構成シンタックス(テーブル6)を参照すれば、32ビットの「sample」フィールドは、各チャンネルを構成するオーディオデータサンプルのトータル数を示す情報として用いられる。さらに、16ビットの「frame_length」フィールドは、対応するフレーム内の各チャンネルに対するサンプルの数を示す情報として用いられる。
さらに、「frame_length」フィールドの16ビット値はエンコーダーにより用いられる値により決まり、ユーザー定義値と呼ばれる。すなわち、固定値の代わりに、ユーザー定義値はエンコーディングのプロセス時に任意に決まる。すなわち、固定された値の代わりに、ユーザー定義値は、エンコーディングプロセス時に任意に決まる。例えば、値は、エンコーディングプロセスのユーザーにより設定される。
このため、デコーディングプロセス中にビットストリームが図2に示すデマルチプレックス部200を介して受信されるとき、各チャンネルのフレーム数が先行して取得されることが必要である。この値は、後述するアルゴリズムにより取得される。
frames = samples / frame_length;
rest = samples % frame_length;
if (rest)
{
frames++;
frlen_last = rest;
}
else
frlen_last = frame_length;
rest = samples % frame_length;
if (rest)
{
frames++;
frlen_last = rest;
}
else
frlen_last = frame_length;
特に、各チャンネルに対するフレームのトータル数は、ビットストリームを介して送信された「sample」フィールドにより決まる各チャンネルに対するサンプルのトータル数を、「frame_length」フィールドにより決まる各チャンネルに対するフレーム内のサンプル数で割ることで演算される。例えば、「sample」フィールドにより決まったサンプルのトータル数が、「frame_length」フィールドにより決まる各フレーム内のサンプル数のちょうど倍数である場合、その倍数値がフレームのトータル数となる。しかしながら、「sample」フィールドにより決まったサンプルのトータル数が、「frame_length」フィールドにより決まったサンプル数のちょうど倍数ではない場合、且つ、余りが存在する場合、フレームのトータル数は倍数値以上に「1」ずつインクリメントする。さらに、最終フレームfrlen_lastのサンプル数は余りとして決まる。これは、最終フレームのサンプル数だけがそれ以前のフレームとは異なるという旨を示す。上述したように、エンコーダーとデコーダーとの間の標準化された規則を定義することにより、エンコーダーは、各チャンネルに対するサンプルのトータル数(「sample」フィールド)及び各チャンネルのフレーム内のサンプル数(「frame_length」フィールド)を自由に決めて送信することができる。さらに、デコーダーは、送信された情報に対する上述したアルゴリズムを用いて、デコーディングに用いられる各チャンネルに対するフレーム数を正確に決めることができる。
[線形予測]
本発明において、線形予測は無損失オーディオコーディングに適用される。図1に示す予測器160は少なくとも1以上のフィルター係数を含み、以前のサンプル値から現在のサンプル値を予測する。この後、第2のエントロピー符号化部180は、予測値とオリジナル値との間の差分に対応する余り値に対するエントロピー符号化を行う。また、予測器160に適用される各ブロックに対する予測係数値は、係数推定部120から最適値として選択される。さらに、予測係数値は、第1のエントロピー符号化部140によりエントロピー符号化される。第1のエントロピー符号化部及び第2のエントロピー符号化部180によりコーディングされたデータは、マルチプレックス部190によりビットストリームの一部として挿入されてから送信される。
本発明において、線形予測は無損失オーディオコーディングに適用される。図1に示す予測器160は少なくとも1以上のフィルター係数を含み、以前のサンプル値から現在のサンプル値を予測する。この後、第2のエントロピー符号化部180は、予測値とオリジナル値との間の差分に対応する余り値に対するエントロピー符号化を行う。また、予測器160に適用される各ブロックに対する予測係数値は、係数推定部120から最適値として選択される。さらに、予測係数値は、第1のエントロピー符号化部140によりエントロピー符号化される。第1のエントロピー符号化部及び第2のエントロピー符号化部180によりコーディングされたデータは、マルチプレックス部190によりビットストリームの一部として挿入されてから送信される。
以下、本発明により線形予測を行う方法について説明する。
[FIRフィルターによる予測]
線形予測は、音声及びオーディオ信号の処理のための多数のアプリケーションに用いられる。以下、予測器160の例示的な動作を有限インパルス応答(FIR:Finite Impulse Response)フィルターを元に説明する。しかしながら、この例が本発明の範囲を制限しないことは言うまでもない。
線形予測は、音声及びオーディオ信号の処理のための多数のアプリケーションに用いられる。以下、予測器160の例示的な動作を有限インパルス応答(FIR:Finite Impulse Response)フィルターを元に説明する。しかしながら、この例が本発明の範囲を制限しないことは言うまでもない。
時間離散信号x(n)は、以前のサンプルx(n−k)から大まかに予測可能である。予測は。下記式として与えられる。
Kは予測の順序である。予測サンプルが原サンプルに近づく場合、余りは以下の通りである。
これは、x(n)そのものよりも小さなバラツキを有し、その結果、e(n)はさらに効率よくエンコーディングされる。
入力サンプルのセグメントをフィルターリングする前にこのようなセグメントから予測係数を推定する手続きは、フォワード適応と呼ばれる。この場合、係数は送信される必要がある。一方、係数が以前に処理されたセグメントまたはサンプル、例えば、余りから推定される場合、バックワード適応が参考として行われる。バックワード適応の手続きは、係数を推定するのに必要なデータがデコーダーにも利用可能であるため、いかなる係数送信も不要であるという利点を有する。
約10の順序を有するフォワード適応型の予測方法は音声コーディングに汎用され、無損失オーディオコーディングにも採用可能である。ほとんどのフォワード適応型の無損失予測スキームの最大順序は、例えば、K=32のように遥かに小さい。例外として、スーパーオーディオCDに対する1ビット無損失コーデックがあり、これは、128までの予測順序を用いる。
一方、数百個の係数を有するバックワード適応型のFIRフィルターは、多くの領域、例えば、チャンネル等化及びエコー削除に一般的に用いられる。これらのシステムのほとんどは、また、無損失オーディオコーディングに提案されるLMSアルゴリズムまたはその変形に基づく。高次順を有するこのようなLMS基盤のコーディングスキームは、予測係数がサイド情報として送信される必要がないために作用可能であり、その数はデータレートに寄与しない。しかしながら、バックワード適応型のコーデックは、適応がエンコーダーとデコーダーの両方に行われる必要があるという欠点を有するため、デコーダーがフォワード適応型の場合よりも複雑になる。
[フォワード適応型予測]
以下、本発明の例示的な実施形態として、フォワード適応型予測について説明する。フォワード適応型線形予測において、最適な予測係数hk(余りの最小化されたバラツキの項)は、通常、自動相関方法または共分散を用いて係数推定部120により各ブロックに対して推定される。従来のレビンソン−ダービンアルゴリズムを用いる自動相関方法は、予測器順序を繰り返し適応するための簡単な手段を提供することができるというさらなる利点を有する。さらに、このアルゴリズムは、対応するパーコール係数も固有に計算する。
以下、本発明の例示的な実施形態として、フォワード適応型予測について説明する。フォワード適応型線形予測において、最適な予測係数hk(余りの最小化されたバラツキの項)は、通常、自動相関方法または共分散を用いて係数推定部120により各ブロックに対して推定される。従来のレビンソン−ダービンアルゴリズムを用いる自動相関方法は、予測器順序を繰り返し適応するための簡単な手段を提供することができるというさらなる利点を有する。さらに、このアルゴリズムは、対応するパーコール係数も固有に計算する。
フォワード適応型予測の他の態様は、適切な予測順序を決めることである。順序が増大するに伴い、予測エラーのバラツキは低減され、余りに対する小さなビットレートReをもたらす。一方、予測係数に対するビットレートRcは、送信される係数の数を増やす。このため、全体のビットレートを最小化する最適な順序を見つけることが課題となる。これは、予測係数Kに関する下記式を最小化して表現することができる。
予測が高次順になるにつれて単調増加することにより、ReはKに減少される。一方、Rcは、係数の増加数が送信される必要があるため、Kで単調増加する。
最適な順序の探索は、増加する順序で全ての予測器を繰り返し決める係数推定部120により効率よく行われうる。それぞれの順序において、予測係数の完全な組が演算される。さらに、対応する余りのバラツキσe 2が導出可能であり、余りに対する予測されたビットレートの推定を招く。係数に対するビットレートと共に、全体のビットレートは、それぞれの繰り返し、すなわち、各予測順序に対して決まりうる。最適な順序は、全体のビットレートがそれ以上減少されない個所において見つけられる。
たとえ、係数ビットレートが全体のビットレートに直接的な効果を有することが上述した数式から明らかであるとしても、また、Rcの遅い増加は、Rtotalの最小が高次順にシフトされるように許容し(ここで、Reは、もちろん小さい)、良好な圧縮をもたらす。その結果、予測係数の効率的で且つ正確な等化は、最大圧縮を達成する上で重要な役割を果たす。
[予測順序]
本発明において、線形予測に対する予測係数の数を決める予測順序Kが決まる。また、予測順序Kは、係数推定部120により決まる。以下、決まった予測順序に関する情報は、ビットストリームに含まれてから送信される。
本発明において、線形予測に対する予測係数の数を決める予測順序Kが決まる。また、予測順序Kは、係数推定部120により決まる。以下、決まった予測順序に関する情報は、ビットストリームに含まれてから送信される。
係数シンタックス(テーブル6)は、予測順序Kに関する情報を含む。例えば、1ビットから10ビットの「max_order」フィールドは、最大の順序値を示す情報に対応する。1ビットから10ビットの「max_order」フィールドの最高次値は、K=1023(例えば、10ビット)である。予測係数Kに関する他の情報として、構成シンタックス(テーブル6)は、各ブロックに対する最適な順序が存在するかどうかを示す1ビットの「adapt_order」フィールドを含む。例えば、「adapt_order=1」の場合、最適な順序は、各ブロックに対して与えられる必要がある。ブロック_データシンタックス(テーブル8)において、最適な順序は1ビットから10ビットの「opt_order」フィールドとして与えられる。さらに、「adapt_order=0」の場合、個別の最適な順序は各ブロックに対して与えられない。この場合、「max_order」フィールドは、全てのブロックに適用された最終順序となる。
最適な順序opt_orderは、max_orderフィールドの値と対応するブロックのサイズNBに基づいて決まる。特に、例えば、max_orderがKmax=10として決まり、且つ、「apapt_order=1」の場合、各ブロックに対するopt_orderが対応するブロックのサイズを考慮して決まる。一部の場合に、max_order(Kmax=10)よりも大きなopt_order値が可能である。
特に、本発明は、高次予測順序に関するものである。階層ブロックスイッチングが存在しないとき、この実施形態によれば、長いブロック長と短いブロック長(例えば、4096及び1024、または8192及び2048)との間には、4の要因が存在する。一方、階層ブロックスイッチングが実現される実施形態においては、このような要因は、(例えば、32まで)増加可能であり、より大きな範囲(例えば、高いサンプリングレートに対して16384から512へと減少、また、32768から1024へと減少)を可能にする。
階層ブロックスイッチングが実現される実施形態において、極めて長いブロックを上手に用いるためには、高い最大予測順序が採用可能である。最大順序は、Kmax=1023でありうる。この実施形態において、Kmaxは、ブロック長NBに限られる。例えば、Kmax<NB/8である(例えば、NB=2048に対してKmax=255である)。このため、Kmax=1023を用いる場合、少なくともNB=8192のブロック長を必要とする。この実施形態において、構成シンタックス(テーブル6)内の「max_order」フィールドは10ビットまでであり得、また、ブロックデータシンタックス(テーブル8)内の「opt_order」フィールドは10ビットまででありうる。特定のブロックのビットの実際数は、1ブロックに対して許容された最大順序に従属する。ブロックが短ければ、ローカル予測順序はグローバル予測順序よりも小さくなる。以下、ローカル予測順序は対応するブロック長NBを考慮して決まり、グローバル予測順序は構成シンタックスにおいて「max_order」Kmaxから決まる。例えば、Kmax=1023、または、NB=2048の場合、「opt_order」フィールドは255のローカル予測順序に起因して(10ビットの代わりに)8ビットとして決まる。
特に、opt_orderは、以下の式に基づいて決まる。
opt_order=min(グローバル予測順序、ローカル予測順序)
グローバル及びローカル予測順序は、
グローバル予測順序=ceil(log2(最大予測順序+1))、及び
ローカル予測順序=max(ceil(log2(nb>>3)−1))、1)
として決まる。
グローバル予測順序=ceil(log2(最大予測順序+1))、及び
ローカル予測順序=max(ceil(log2(nb>>3)−1))、1)
として決まる。
実施形態において、チャンネルからサブ分割されたブロックのデータサンプルは予測される。現在のブロックの第1のサンプルは、以前のブロックの最終的なKサンプルを用いて予測される。K値は、上述した式から導き出されたopt_orderから決まる。
現在のブロックがチャンネルの第1のブロックである場合、以前のブロックからいかなるサンプルも用いられない。この場合、漸進的な順序を有する予測が採用される。例えば、opt_order値が対応するブロックに対してK=5であるとすれば、ブロック内の第1のサンプルは予測を行うことができない。ブロックの第2のサンプルは、(K=1と同様に)予測を行うためにブロックの第1のサンプルを用い、ブロックの第3のサンプルは、(K=2と同様に)予測を行うためにブロックの第1及び第2のサンプルを用いる。このため、6番目のサンプルから始まってそれ以降のサンプルに対して、予測がK=5のopt_orderに応じて行われる。上述したように、予測順序は、K=1からK=5に漸増する。
上述した予測の漸進的な順序形態は、ランダムアクセスフレームにおいて用いられるときに極めて有利になる。ランダムアクセスフレームがランダムアクセス部の基準フレームに対応するため、ランダムアクセスフレームは、以前のフレームサンプルを用いて予測を行うことができない。すなわち、このような漸進的な予測技術は、ランダムアクセスフレームの開始時に適用可能である。
[予測係数の量子化]
上述した予測係数は、図1の量子化部130において量子化される。予測係数hkの直接的な量子化は、小さな量子化エラーが最適な予測フィルターの所定のスペクトル特徴から大きなバラツキをもたらすため、送信に極めて非効率的である。この理由から、予測係数の量子化は、係数推定部120により演算可能なパーコール(反射)係数rkに基づく。上述したように、例えば、係数推定部120は、従来のレビンソン−ダービンアルゴリズムを用いて処理される。
上述した予測係数は、図1の量子化部130において量子化される。予測係数hkの直接的な量子化は、小さな量子化エラーが最適な予測フィルターの所定のスペクトル特徴から大きなバラツキをもたらすため、送信に極めて非効率的である。この理由から、予測係数の量子化は、係数推定部120により演算可能なパーコール(反射)係数rkに基づく。上述したように、例えば、係数推定部120は、従来のレビンソン−ダービンアルゴリズムを用いて処理される。
第1の2つのパーコール係数(γ1及びγ2に対応する)は、下記式を用いて量子化される。
これに対し、余り係数は単純な7ビットの均一量子化器を用いて量子化される。
あらゆる場合に、最終的に量子化された値akは、範囲[−64、63]に限られる。
[エントロピー符号化]
図1に示すように、2通りの方式のエントロピー符号化が本発明に適用される。特に、第1のエントロピー符号化部140は、上述した予測係数をコーディングするのに用いられる。また、第2のエントロピー符号化部180は、上述したオーディオ原サンプル及びオーディオ余りサンプルをコーディングするのに用いられる。以下、2通りの方式のエントロピー符号化について説明する。
図1に示すように、2通りの方式のエントロピー符号化が本発明に適用される。特に、第1のエントロピー符号化部140は、上述した予測係数をコーディングするのに用いられる。また、第2のエントロピー符号化部180は、上述したオーディオ原サンプル及びオーディオ余りサンプルをコーディングするのに用いられる。以下、2通りの方式のエントロピー符号化について説明する。
[予測係数の第1のエントロピー符号化]
従来のライスコードは、本発明による第1のエントロピー符号化方法として用いられる。例えば、量子化された係数akの送信は、余り値を生成して行われる。
従来のライスコードは、本発明による第1のエントロピー符号化方法として用いられる。例えば、量子化された係数akの送信は、余り値を生成して行われる。
これは、例えば、ライスコード方法と同じ第1のエントロピー符号化部140を用いてエンコーディングされる。このようなプロセスにおいて用いられるライスコードの対応するオフセット及びパラメーターは、テーブル3、4、5に示す組のうちいずれかからグローバル的に選択される。テーブルシンタックス(すなわち、2ビットの「coef_table」)は、構成シンタックス(テーブル6)に現れる。「coef_table=11」の場合、これは、いかなるエントロピー符号化も適用されず、量子化された係数は7ビットのそれぞれに送信されることを示す。この場合、オフセットは[0、27]に限られる非署名値δk=ak+64を得るために、常に−64である。逆に、「coeff_table=00」の場合にテーブル3が選択され、「coeff_table=01」の場合にテーブル4が選択され、「coeff_table=10」の場合にテーブル5が選択される。
図2のデコーダーにおいて量子化された係数を受信するとき、第1のエントロピー復号化部220は、余り値δkがパーコール係数akの量子化されたインデックスを生成するためにオフセットと組み合せられるプロセスを用いて予測係数を再構成する:
この後、第1の2つの係数(γ1及びγ2)の再構成は、
このため、第1のエントロピー符号化に用いられるこれらのタイプの係数テーブルは、サンプリング周波数に応じて与えられる。例えば、サンプリング周波数は、48kHz、96kHz、192kHzに分割可能である。3つのテーブル3、4、5のそれぞれは、各サンプリング周波数に対して与えられる。
単一テーブルを用いる代わりに、3つの異なるテーブルのうちいずれかが全体ファイルのために選択可能である。テーブルは、サンプリングレートに応じて典型的に選択されなければならない。44.1kHzの材料において、本発明の出願人は、48kHzテーブルを用いることを推奨している。しかしながら、一般的に、テーブルは、他の基準により選択可能である。
[余りの第2のエントロピー符号化]
本発明は、後述するように、図1の第2のエントロピー符号化部180に適用されるコーディング方法の2つの異なるモードを含む。
本発明は、後述するように、図1の第2のエントロピー符号化部180に適用されるコーディング方法の2つの異なるモードを含む。
単純なモードにおいて、余り値e(n)は、ライスコードを用いてエントロピー符号化される。各ブロックにおいて、全ての値が同じライスコードを用いてコーディング可能であるか、あるいは、ブロックが4つの部分にさらに分割可能であり、これらのそれぞれは異なるライスコードによりエンコーディングされる。適用されたコードのインデックスは、図1に示すようにして送られる。所定組のデータに対する最適なライスコードを決める異なる方式が存在するため、後述する余剰及びコードワード生成の統計に従属する適切なコードをエンコーダーが選択することは、種々の採用可能なライスコーディング実現のうちいずれか一つである。
「ライスコードは、パラメーターs>0によって定義される。与えられた値sに対して、各コードワードはpビットのプレフィックスとsビットのサブコードからなる。プレフィックスは、p−1個の「1」ビットと、1つの「0」ビットを用いて表され、ここでpはコーディングされた値に依存する。信号値x及びs>0に対して、p−1は以下のように計算される(「÷」は下記の式で剰余が無い整数除算を表す)。」
s=0において、修正された数式を用いている。
s>0に対するサブコードは、次のようにしてi番目のサブブロックに対して計算される。
s=0においてはサブコード及びプレフィックスがなく、これにより、プレフィックス及びコードワードは等しくなる。
以下のテーブルA及びBは、s=4を有するライスコードに対する例を示す。テーブルCは、s=0を有する特定のライスコードを示す。
テーブルA:s=4を有するライスコード。xxxxビットは、4ビットサブコードs[i]を含む。
テーブルC:s=0を有する「特別」ライスコード、プレフィックス及びコードワードは同じである。
代案的に、エンコーダーは、BGMCモードを用いてより複雑で且つ効率よいコーディングスキームを用いることができる。BGMCモードにおいて、余りのエンコーディングは、2つのカテゴリに分配を分割して達成される。2通りの方式は、分布の中心領域、
に属する余りとその尻尾に属する余りを含む。尻尾内の余りは簡単に再中心合わせが行われ(すなわち、e(n)>emaxに対して、et(n)=e(n)−emaxが与えられる)、上述したようにライスコードを用いてエンコーディングされる。しかしながら、分布の中心において余りをエンコーディングするためには、BGMCは、先ず、LSB及びMSB成分に余りを分割した後、BGMCは、ブロックギルバート−ムーア(算術)コードを用いてMSBをエンコーディングする。最後に、BGMCは、直接的な固定長コードを用いてLSBを送信する。パラメーターemax及び直接的に送信されたLSBの数の全ては、やや複雑ではないコーディングを許容しながら、このようなスキームのコーディング効率性にのみ影響するように選択される。
本発明による構成シンタックス(テーブル6)及びブロック_データシンタックス(テーブル8)は、ライスコード及びBGMCコードのコーディングと関連する情報を含む。情報は新たに詳述される。
構成シンタックス(テーブル6)は、先ず、1ビットの「bgmc_mode」フィールドを含む。例えば、「bgmc_mode=0」はライスコードを示し、「bgmc_mode=1」はBGMCコードを示す。構成シンタックス(テーブル6)は、1ビットの「sb_part」フィールドを含む。「sb_part」フィールドは、1ブロックをサブブロックに区画し、区画されたサブブロックをコーディングする方法と関連する情報に相当する。以下、「sb_part」フィールドの意味は、「bgmc_mode」フィールドの値に応じて変わる。
例えば、「bgmc_mode=0」の場合、すなわち、ライスコードが適用される場合、「sb_part=0」は、ブロックがサブブロックに区画されない旨を示す。代案的に、「sb_part=1」は、ブロックが1:4サブブロック区画比にて区画される旨を示す。また、「bgmc_mode=1」の場合、すなわち、BGMCコードが適用される場合、「sb_part=0」は、1:4サブブロック区画比にてブロックが区画される旨を示す。代案的に、「sb_part=1」は、1:2:4:8サブブロック区画比にてブロックが区画される旨を示す。
構成シンタックス(テーブル6)に含まれている情報に対応する各ブロックに対するブロック_データシンタックス(テーブル8)は、0ビットから2ビットの可変「ec_sub」フィールドを含む。特に、「ec_sub」フィールドは、実際に対応するブロックに存在するサブブロックの数を示す。以下、「ec_sub」フィールドの意味は、構成シンタックス(テーブル6)内の「bgmc_mode+sb_part」フィールドの値に応じて変わる。
例えば、「bgmc_mode+sb_part=0」は、ライスコードがサブブロックを構成しない旨を示す。以下、「ec_sub」フィールドは、いかなる情報も含まれていない旨を示す0ビットフィールドである。
また、「bgmc_mode+sb_part=1」は、ライスコードまたはBGMCコードがブロックを1:4レートにてサブブロックに区画するのに用いられる旨を示す。以下、1ビットだけが「ec_sub」フィールドに割り当てられる。例えば、「ec_sub=0」は1サブブロック(すなわち、ブロックはサブブロックに区画されない)、「ec_sub=1」は4つのサブブロックが構成される旨を示す。
さらに、「bgmc_mode+sb_part=2」は、BGMCコードがブロックを1:2:4:8レートにてサブブロックに区画するのに用いられる旨を示す。以下、2ビットは「ec_sub」フィールドに割り当てられる。例えば、「ec_sub=00」は1サブブロック(すなわち、ブロックはサブブロックに区画されない)を示し、「ec_sub=01」は2サブブロックを示す。また、「ec_sub=10」は4個のサブブロックを、「ec_sub=11」は8個のサブブロックを示す。
上述したように、各ブロック内に定義されたサブブロックは、他のコーディング方法を用いて第2のエントロピー符号化部180によりコーディングされる。以下、ライスコードを用いる例について説明する。余り値の各ブロックにおいては、全ての値が同じライスコードを用いてエンコーディングされるか、または、構成シンタックス内の「sb_part」フィールドが設定される場合にブロックは4個のサブブロックに区画可能であり、これらのそれぞれのエンコーディングされたサブブロックは、異なるのライスコードを有する。後者の場合、ブロック_データシンタックス(テーブル8)内の「ec_sub」フィールドは、1または4個のブロックが用いられるかどうかを示す。代案的に選択されたエントロピーコードは、「2」のコードパラメーター値を有するBMGCコードである。
理解できるように、デコーダーは、bgmc_mode、sb_partandec_sub情報を読み出して受信されたオーディオ信号を処理し且つデコーディングする。例えば、Nサブブロックに区画されたオーディオデータのブロックを含むオーディオ信号が受信され、この情報は読み出される。この情報を用いて、複数のコードパラメーターs(0)、s(1)、…、s(N−1)のそれぞれが生成される。すなわち、コードパラメーターの生成は、オーディオ信号からs(0)を検出し、i=1、…N−1に対するオーディオ信号から差分s(i)−s(i−1)を検出し、検出された差分とs(0)を用いてi=1、…、N−1に対するs(i)を計算することを含む。Nサブブロックは、生成されたコードパラメーターにより定義されたエントロピーコードを用いてデコーディングされる。
第1のサブブロックのパラメーターs[i=1]が4ビット(解像度≦16ビット)または5ビット(解像度>16ビット)で直接的に送信されるとしても、次のパラメーターs[i>0]の差分(s[i]−s[i−1])が送信される。これらの差分は適切に選択されたライスコードを再度用いてさらにエンコーディングされる。この場合、差分に用いられるライスコードパラメーターは「0」の値を有する。
[シンタックス]
本発明の実施形態によれば、オーディオビットストリームに含まれている各種の情報のシンタックスは、下記のテーブルに示す。テーブル6は、オーディオ無損失コーディング用の構成シンタックスを示す。構成シンタックスはビットストリームに周期的に配置されたヘッダーを形成し、各フレームに対するヘッダーを形成する。テーブル7はフレーム−データシンタックスを示し、テーブル8はブロック−データシンタックスを示す。
本発明の実施形態によれば、オーディオビットストリームに含まれている各種の情報のシンタックスは、下記のテーブルに示す。テーブル6は、オーディオ無損失コーディング用の構成シンタックスを示す。構成シンタックスはビットストリームに周期的に配置されたヘッダーを形成し、各フレームに対するヘッダーを形成する。テーブル7はフレーム−データシンタックスを示し、テーブル8はブロック−データシンタックスを示す。
[圧縮結果]
次には、無損失オーディオコーデックが無損失オーディオ圧縮用の最も一般的なプログラムのうち2つ、すなわち、オープンソースコーデックFLAC及びMonkey’s Audio(MAC3.97)と比較される。以下、オープンソースコーデックFLACはフォワード適応型予測を用い、Monkey’s Audio(MAC3.97)は圧縮において現在の最先端のアルゴリズムとして用いられるバックワード適応型コーデックである。これらのコーデックは、最大圧縮(すなわち、フラック−8及びmac−c400)を与えるオプションで行われる。エンコーダーに対する結果は(K−60に限られる予測順序を有する)中間圧縮レベルと、最大圧縮レベル(K−1023)と、500msのランダムアクセスを有するこれらの両レベルに対して決まる。テストは、1024MBのメモリを有する1.7GHzペンティアム(登録商標)−Mシステム上において行われる。テストは、48、96及び192kHzのサンプリングレートを有する1Gのステレオ波形データと、16及び24ビットの解像度を含む。
次には、無損失オーディオコーデックが無損失オーディオ圧縮用の最も一般的なプログラムのうち2つ、すなわち、オープンソースコーデックFLAC及びMonkey’s Audio(MAC3.97)と比較される。以下、オープンソースコーデックFLACはフォワード適応型予測を用い、Monkey’s Audio(MAC3.97)は圧縮において現在の最先端のアルゴリズムとして用いられるバックワード適応型コーデックである。これらのコーデックは、最大圧縮(すなわち、フラック−8及びmac−c400)を与えるオプションで行われる。エンコーダーに対する結果は(K−60に限られる予測順序を有する)中間圧縮レベルと、最大圧縮レベル(K−1023)と、500msのランダムアクセスを有するこれらの両レベルに対して決まる。テストは、1024MBのメモリを有する1.7GHzペンティアム(登録商標)−Mシステム上において行われる。テストは、48、96及び192kHzのサンプリングレートを有する1Gのステレオ波形データと、16及び24ビットの解像度を含む。
[圧縮レート]
次には、圧縮レートが
により定義される。ここで、小さな値の方が良好な圧縮を示す。検査されたオーディオフォーマットに対する結果はテーブル9に示す(192khz材料がFLACコーデックにより支援される)。
次には、圧縮レートが
この結果は、最大レベルにおいてALSが全てのフォーマット、特に、高品位材料(すなわち、96kHz/24ビット以上)用のFLAC及びMonkey’s Audio(MAC3.97)の両方よりも低くなることを示す。中間レベルにおいてさえ、ALSは最上の全体圧縮を伝える。
[複雑性]
異なるコーデックの複雑性は、実際の実行、特に、エンコーダーの実行に極めて強く依存する。上述したように、本発明のオーディオ信号エンコーダーは継続して開発中である。このため、出願人は、その分析をエンコーダーに制限して、さらなる最適化無しに単純なCコードを実現する。圧縮されたデータは、現在、最上のエンコーダーの実現により生成される。異なる複雑度レベルでエンコーディングされる各種のオーディオフォーマットのリアルタイムなデコーディングに対する平均CPU負荷は、テーブル10に示す。最大複雑度においてさえ、デコーダーに対するCPU負荷は約20〜25%だけであり、ファイル基盤のデコーディングの方が少なくともリアルタイムよりも4−5倍速いことを意味することになる。
異なるコーデックの複雑性は、実際の実行、特に、エンコーダーの実行に極めて強く依存する。上述したように、本発明のオーディオ信号エンコーダーは継続して開発中である。このため、出願人は、その分析をエンコーダーに制限して、さらなる最適化無しに単純なCコードを実現する。圧縮されたデータは、現在、最上のエンコーダーの実現により生成される。異なる複雑度レベルでエンコーディングされる各種のオーディオフォーマットのリアルタイムなデコーディングに対する平均CPU負荷は、テーブル10に示す。最大複雑度においてさえ、デコーダーに対するCPU負荷は約20〜25%だけであり、ファイル基盤のデコーディングの方が少なくともリアルタイムよりも4−5倍速いことを意味することになる。
コーデックは、複雑度レベルの大きな範囲を与えるように設計される。最大レベルが最も遅いエンコーディング及びデコーディング速度を犠牲にして最も高い圧縮を達成するとしても、速い中間レベルだけが圧縮を劣化させるが、デコーディングは、最大レベル(すなわち、48kHz材料に対する約5%のCPU負荷)においてより複雑度が下がる。低い複雑度レベルを用いれば(すなわち、K−15、ライスコーディング)、中間レベルよりも1から1.5%だけ圧縮が劣化するが、デコーダー複雑度は3の因子に見合う分だけさらに低減する(すなわち、48kHz材料に対する2%未満の負荷)。このため、オーディオデータは極めて低い演算電力を有するハードウェア上においてさえデコーディング可能である。
エンコーダーの複雑度が高い最大順序及びさらに精巧なブロックスイッチングアルゴリズム(この実施形態による)により増大するとしても、デコーダーは、高い平均予測順序に影響されることがある。
上述した実施形態(例えば、階層ブロックスイッチング)及び利点は単なる例示的なものに過ぎず、特許請求の範囲を制限するものとして解釈されてはならない。上述した教示は当業者にとって自明なものであり、他の装置及び方法に作用可能である。多くの代案、修正及び変形が当業者にとって自明である。
当業者にとっては、本発明に対する種々の修正及び変更が本発明の範囲及び精神から逸脱することなく行われることは自明に理解できるであろう。例えば、本発明の態様及び実施形態は損失あるオーディオ信号コーデックと同じ他のオーディオ信号コーデックにも容易に適用可能である。よって、本発明は特許請求の範囲及びその均等物内に提供される本発明の修正及び変動をカバーする。
Claims (24)
- オーディオ信号エンコーディング方法であって、
それぞれが複数のブロックに分割される少なくとも一つのチャンネルを備える少なくとも一つのオーディオデータフレームを生成するステップと、
サブブロック区画方案を選択するステップと、
前記ブロックが区画されるサブブロックの数を選択するが、前記サブブロックの選択された数は前記選択されたサブブロック区画方案に利用可能なサブブロックの数から選択されるステップと、
前記選択されたサブブロックに応じてオーディオデータのブロックをサブブロックに区画するステップと、
選択されたエントロピー符号化スキームに応じて、前記区画されたサブブロックをコーディングするステップと、
を含む方法。 - 前記選択されたサブブロック区画スキームに利用可能なサブブロックの数は、1及び4である請求項1に記載の方法。
- 前記選択されたサブブロック区画スキームに利用可能なサブブロックの数は、1、2、4及び8である請求項1に記載の方法。
- 前記選択されたエントロピー符号化スキームは、ライスコード方案及びBGMC方案のうちいずれか一方である請求項1に記載の方法。
- 複数のコードパラメーターs(0)、s(1)、…s(N−1)を決めるステップと、
前記複数のコードパラメーターにより定義された複数のエントロピーコードを用いてNサブブロックをエントロピー符号化するステップと、
前記コードパラメーターを送信するステップと、
を含み、
前記送信ステップは、
第1のサブブロックの前記コードパラメーターを示すs(0)を直接的に送信するステップと、
前記第1のサブブロックに後続するi番目のサブブロックのコードパラメーターを表現するi=1、…N−1、s(i)に対する差分s(i)−s(i−1)を送信するステップと、
を含む請求項1に記載の方法。 - 前記送信ステップは、
送信前に選択されたエントロピーコードを用いて差分s(i)−s(i−1)をエンコーディングするステップを含む請求項5に記載の方法。 - 前記選択されたエントロピーコードは、0の値を有するコードパラメーターにより定義されたライスコードである請求項6に記載の方法。
- 前記選択されたエントロピーコードは、2の値を有するコードパラメーターにより定義されたBGMCコードである請求項6に記載の方法。
- 前記エントロピーコードはライスコードであり、前記コードパラメーターはライスコードパラメーターである請求項5に記載の方法。
- 前記エントロピーコードはBGMCコードであり、前記コードパラメーターはBGMCコードパラメーターである請求項5に記載の方法。
- オーディオ信号をエンコーディングする方法であって、
原オーディオ信号から予測信号を差し引いて余りデータのブロックを生成するステップと、
サブブロック区画スキームを選択するステップと、
前記ブロックが区画されるサブブロックの数を選択するが、前記選択されたサブブロックの数は前記選択されたサブブロック区画スキームに利用可能なサブブロックの数から選択されるステップと、
それぞれの区画されたサブブロックを異なるエントロピーコードをもってコーディングするステップと、
を含む方法。 - 多数のブロックに分割される少なくとも一つのチャンネルを備える少なくとも一つのフレームを備えたオーディオ信号を処理する方法であって、
前記オーディオ信号に関する構成情報にコーディング情報を付加するが、前記コーディング情報は前記オーディオ信号をエンコーディングするときに用いられるエントロピー符号化を示すステップと、
前記構成情報に、前記ブロックを区画するのに用いられるサブブロック区画スキームを示す区画情報を付加するステップと、
少なくとも一つのブロックに、前記ブロックが区画されるサブブロックの数を示すサブブロック情報を付加するステップと、
を含む方法。 - 前記サブブロック情報のビット数は可変する請求項12に記載の方法。
- 前記サブブロック情報のビット数は、前記サブブロック区画スキーム及び前記エントロピー符号化スキームに従属して可変する請求項13に記載の方法。
- 前記エントロピー符号化スキームは、ライスコードスキーム及びBGMCスキームのうちいずれか一方である請求項12に記載の方法。
- 前記エントロピー符号化スキームがライスコードスキームである場合、前記サブブロック区画スキームは、(i)無区画スキーム、及び(ii)無区画とブロックの4個のサブブロックへの区画との間の選択に提供される区画スキームのうちいずれか一方である請求項15に記載の方法。
- 前記エントロピーエンコーディングスキームはライスコードスキームであり、前記サブブロック情報は1ビットである請求項16に記載の方法。
- 前記エントロピー符号化スキームがBMGCスキームである場合、前記サブブロック区画スキームは、(i)無区画とブロックの4個のサブブロックへの区画との間の選択に提供される第1の区画スキームと、(ii)無区画と、ブロックの2個のサブブロックへの区画と、ブロックの4個のサブブロックへの区画と、ブロックの8個のサブブロックへの区画との間の選択に提供される第2の区画方案のうちいずれか一つである請求項15に記載の方法。
- 前記エントロピー符号化スキームがBMGCスキームであり、前記サブブロック区画スキームが第1の区画スキームである場合、前記サブブロック情報は1ビットである請求項18に記載の方法。
- 前記エントロピー符号化スキームがBMGCスキームであり、前記サブブロック区画スキームが第2の区画スキームである場合、前記サブブロック情報は2ビットである請求項18に記載の方法。
- オーディオ信号の処理方法であって、
前記オーディオデータのうち少なくとも一つのブロック及び構成情報を含むオーディオ信号を受信するステップと、
前記構成情報から、前記ブロックがサブブロックに分割されるサブブロック区画スキームを示す区画情報を読み出すステップと、
オーディオデータのブロックから、前記ブロックが前記サブブロック区画スキームに応じて区画されるサブブロックの数を示すサブブロック情報を読み出すステップと、
前記区画されたサブブロックを前記サブブロックの数に基づいてデコーディングするステップと、
を含む方法。 - 前記オーディオ信号に関する前記構成情報からコーディング情報を読み出すステップをさらに含み、
前記コーディング情報は、オーディオ信号のエンコーディング時に用いられるエントロピー符号化スキームを示し、
前記デコーディングステップは、前記区画されたサブブロックを前記サブブロックの数及び前記エントロピー符号化スキームに基づいてデコーディングする請求項21に記載の方法。 - 多数のブロックに分割される少なくとも一つのチャンネルを備える少なくとも一つのフレームを備えたオーディオ信号を処理する装置であって、
前記オーディオ信号に関する構成情報にコーディング情報を付加し、前記コーディング情報は、前記オーディオ信号をエンコーディングするときに用いられるエントロピー符号化を示すエンコーダーを備え、
前記エンコーダーは、前記構成情報に、前記ブロックを区画するのに用いられるサブブロック区画スキームを示す区画情報を付加し、
前記エンコーダーは、少なくとも一つのブロックに、前記ブロックが区画されるサブブロックの数を示すサブブロック情報を付加する装置。 - オーディオ信号の処理装置であって、
前記オーディオデータの1ブロック及び構成情報を含むオーディオ信号を受信するデコーダーを備え、
前記デコーダーは、前記構成情報から、前記ブロックがサブブロックに分割されるサブブロック区画スキームを示す区画情報を読み出し、
前記デコーダーは、前記オーディオデータのブロックから、前記ブロックが前記サブブロック区画スキームに応じて区画されるサブブロックの数を示すサブブロック情報を読み出し、
前記デコーダーは、前記区画されたサブブロックを前記サブブロックの数に基づいてデコーディングする装置。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US69755105P | 2005-07-11 | 2005-07-11 | |
PCT/KR2005/002291 WO2007011079A1 (en) | 2005-07-16 | 2005-07-16 | Apparatus and method of encoding and decoding audio signal |
PCT/KR2005/002292 WO2007011080A1 (en) | 2005-07-16 | 2005-07-16 | Apparatus and method of encoding and decoding audio signal |
PCT/KR2005/002290 WO2007011078A1 (en) | 2005-07-16 | 2005-07-16 | Apparatus and method of encoding and decoding audio signal |
PCT/KR2005/002307 WO2007011084A1 (en) | 2005-07-18 | 2005-07-18 | Apparatus and method of encoding and decoding audio signal |
PCT/KR2005/002308 WO2007011085A1 (en) | 2005-07-18 | 2005-07-18 | Apparatus and method of encoding and decoding audio signal |
PCT/KR2005/002306 WO2007011083A1 (en) | 2005-07-18 | 2005-07-18 | Apparatus and method of encoding and decoding audio signal |
US70057005P | 2005-07-19 | 2005-07-19 | |
PCT/KR2006/002689 WO2007008011A2 (en) | 2005-07-11 | 2006-07-10 | Apparatus and method of processing an audio signal |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009500691A true JP2009500691A (ja) | 2009-01-08 |
Family
ID=37637332
Family Applications (14)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008521315A Pending JP2009500690A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号の処理装置及び方法 |
JP2008521310A Pending JP2009500686A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号のエンコーディング及びデコーディング装置及び方法 |
JP2008521319A Pending JP2009500693A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号のエンコーディング及びデコーディング装置及び方法 |
JP2008521318A Pending JP2009500692A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号の処理装置及び方法 |
JP2008521314A Pending JP2009500689A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号の処理装置及び方法 |
JP2008521311A Pending JP2009500687A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号の処理装置及び方法 |
JP2008521309A Pending JP2009500685A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号のエンコーディング及びデコーディング装置及び方法 |
JP2008521313A Pending JP2009500688A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号の処理装置及び方法 |
JP2008521307A Pending JP2009500683A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号のエンコーディング及びデコーディング装置及び方法 |
JP2008521308A Pending JP2009500684A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号を処理する方法、オーディオ信号のエンコーディング及びデコーディング装置及び方法 |
JP2008521316A Pending JP2009510810A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号の処理装置及び方法 |
JP2008521306A Pending JP2009500682A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号のエンコーディング及びデコーディング装置及び方法 |
JP2008521317A Pending JP2009500691A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号の処理装置及び方法 |
JP2008521305A Pending JP2009500681A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号のエンコーディング及びデコーディング装置及び方法 |
Family Applications Before (12)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008521315A Pending JP2009500690A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号の処理装置及び方法 |
JP2008521310A Pending JP2009500686A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号のエンコーディング及びデコーディング装置及び方法 |
JP2008521319A Pending JP2009500693A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号のエンコーディング及びデコーディング装置及び方法 |
JP2008521318A Pending JP2009500692A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号の処理装置及び方法 |
JP2008521314A Pending JP2009500689A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号の処理装置及び方法 |
JP2008521311A Pending JP2009500687A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号の処理装置及び方法 |
JP2008521309A Pending JP2009500685A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号のエンコーディング及びデコーディング装置及び方法 |
JP2008521313A Pending JP2009500688A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号の処理装置及び方法 |
JP2008521307A Pending JP2009500683A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号のエンコーディング及びデコーディング装置及び方法 |
JP2008521308A Pending JP2009500684A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号を処理する方法、オーディオ信号のエンコーディング及びデコーディング装置及び方法 |
JP2008521316A Pending JP2009510810A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号の処理装置及び方法 |
JP2008521306A Pending JP2009500682A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号のエンコーディング及びデコーディング装置及び方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008521305A Pending JP2009500681A (ja) | 2005-07-11 | 2006-07-10 | オーディオ信号のエンコーディング及びデコーディング装置及び方法 |
Country Status (5)
Country | Link |
---|---|
US (36) | US7966190B2 (ja) |
EP (14) | EP1913579A4 (ja) |
JP (14) | JP2009500690A (ja) |
CN (14) | CN101238509A (ja) |
WO (14) | WO2007008011A2 (ja) |
Families Citing this family (78)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7182738B2 (en) | 2003-04-23 | 2007-02-27 | Marctec, Llc | Patient monitoring apparatus and method for orthosis and other devices |
WO2005083684A1 (en) * | 2004-02-19 | 2005-09-09 | Koninklijke Philips Electronics N.V. | Decoding scheme for variable block length signals |
US7930184B2 (en) * | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
CN101167124B (zh) * | 2005-04-28 | 2011-09-21 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
DE602006015461D1 (de) * | 2005-05-31 | 2010-08-26 | Panasonic Corp | Einrichtung und verfahren zur skalierbaren codierung |
US7966190B2 (en) * | 2005-07-11 | 2011-06-21 | Lg Electronics Inc. | Apparatus and method for processing an audio signal using linear prediction |
CN101297353B (zh) * | 2005-10-26 | 2013-03-13 | Lg电子株式会社 | 编码和解码多声道音频信号的方法及其装置 |
JP4193865B2 (ja) * | 2006-04-27 | 2008-12-10 | ソニー株式会社 | デジタル信号切換え装置及びその切換え方法 |
JP4769665B2 (ja) * | 2006-08-29 | 2011-09-07 | パナソニック株式会社 | 音楽再生装置および音楽再生端末 |
US9053753B2 (en) * | 2006-11-09 | 2015-06-09 | Broadcom Corporation | Method and system for a flexible multiplexer and mixer |
US20080114478A1 (en) * | 2006-11-09 | 2008-05-15 | David Wu | Method and System for Multi-Channel PCM Audio Grouping in Hardware |
US8521540B2 (en) * | 2007-08-17 | 2013-08-27 | Qualcomm Incorporated | Encoding and/or decoding digital signals using a permutation value |
KR101385956B1 (ko) * | 2007-08-31 | 2014-04-17 | 삼성전자주식회사 | 미디어 신호 인코딩/디코딩 방법 및 장치 |
JP2011507013A (ja) * | 2007-12-06 | 2011-03-03 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号処理方法及び装置 |
US8972247B2 (en) * | 2007-12-26 | 2015-03-03 | Marvell World Trade Ltd. | Selection of speech encoding scheme in wireless communication terminals |
RU2565009C2 (ru) | 2008-03-10 | 2015-10-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и метод для обработки аудио сигнала, содержащего переходный сигнал |
US20090268678A1 (en) * | 2008-04-24 | 2009-10-29 | Fujitsu Limited | Method and apparatus for automatic gain control in a mobile orthogonal frequency division multiple access (ofdma) network |
MX2011000379A (es) * | 2008-07-11 | 2011-02-25 | Ten Forschung Ev Fraunhofer | Codificador de audio y decodificador de audio. |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
WO2010073977A1 (ja) * | 2008-12-22 | 2010-07-01 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
WO2010084951A1 (ja) * | 2009-01-23 | 2010-07-29 | 日本電信電話株式会社 | パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体 |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
JP2012516462A (ja) * | 2009-01-28 | 2012-07-19 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオエンコーダ、オーディオデコーダ、符号化されたオーディオ情報、オーディオ信号を符号化および復号化する方法およびコンピュータ・プログラム |
CN101609680B (zh) * | 2009-06-01 | 2012-01-04 | 华为技术有限公司 | 压缩编码和解码的方法、编码器和解码器以及编码装置 |
CN102440008B (zh) * | 2009-06-01 | 2015-01-21 | 三菱电机株式会社 | 信号处理装置 |
US20100324913A1 (en) * | 2009-06-18 | 2010-12-23 | Jacek Piotr Stachurski | Method and System for Block Adaptive Fractional-Bit Per Sample Encoding |
TWI413110B (zh) * | 2009-10-06 | 2013-10-21 | Dolby Int Ab | 以選擇性通道解碼的有效多通道信號處理 |
US8207875B2 (en) | 2009-10-28 | 2012-06-26 | Motorola Mobility, Inc. | Encoder that optimizes bit allocation for information sub-parts |
CN102959872A (zh) * | 2010-07-05 | 2013-03-06 | 日本电信电话株式会社 | 编码方法、解码方法、装置、程序及记录介质 |
JP5337305B2 (ja) * | 2010-07-05 | 2013-11-06 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び記録媒体 |
CN103270553B (zh) | 2010-08-12 | 2015-08-12 | 弗兰霍菲尔运输应用研究公司 | 对正交镜像滤波器式音频编译码器的输出信号的重新取样 |
EP2625688B1 (en) * | 2010-10-06 | 2014-12-03 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac) |
US8842842B2 (en) * | 2011-02-01 | 2014-09-23 | Apple Inc. | Detection of audio channel configuration |
KR101854300B1 (ko) | 2011-03-18 | 2018-05-03 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 유연한 구성 기능을 갖는 오디오 인코더 및 디코더 |
CN102761735B (zh) * | 2011-04-25 | 2014-12-24 | 中国科学院微电子研究所 | 编码方法及装置、图像压缩方法及系统 |
CN102810314B (zh) * | 2011-06-02 | 2014-05-07 | 华为终端有限公司 | 音频编码方法及装置、音频解码方法及装置、编解码系统 |
CN102368385B (zh) * | 2011-09-07 | 2013-08-14 | 中科开元信息技术(北京)有限公司 | 后向块自适应Golomb-Rice编解码方法及装置 |
WO2013179084A1 (en) * | 2012-05-29 | 2013-12-05 | Nokia Corporation | Stereo audio signal encoder |
CN104641414A (zh) * | 2012-07-19 | 2015-05-20 | 诺基亚公司 | 立体声音频信号编码器 |
US10346784B1 (en) | 2012-07-27 | 2019-07-09 | Google Llc | Near-term delivery system performance simulation |
KR102049602B1 (ko) * | 2012-11-20 | 2019-11-27 | 한국전자통신연구원 | 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법 |
US10178489B2 (en) * | 2013-02-08 | 2019-01-08 | Qualcomm Incorporated | Signaling audio rendering information in a bitstream |
US9691406B2 (en) * | 2013-06-05 | 2017-06-27 | Dolby Laboratories Licensing Corporation | Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals |
EP2838086A1 (en) | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
EP2830054A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
EP2830332A3 (en) | 2013-07-22 | 2015-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration |
US10075266B2 (en) * | 2013-10-09 | 2018-09-11 | Qualcomm Incorporated | Data transmission scheme with unequal code block sizes |
EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
WO2015111569A1 (ja) * | 2014-01-24 | 2015-07-30 | 日本電信電話株式会社 | 線形予測分析装置、方法、プログラム及び記録媒体 |
PL3441970T3 (pl) * | 2014-01-24 | 2020-04-30 | Nippon Telegraph And Telephone Corporation | Urządzenie, sposób i program do analizy liniowo-predykcyjnej oraz nośnik zapisu |
CN104934034B (zh) | 2014-03-19 | 2016-11-16 | 华为技术有限公司 | 用于信号处理的方法和装置 |
WO2015200498A1 (en) * | 2014-06-24 | 2015-12-30 | Hotel Trader LLC | Reservation exchange server system |
KR20170051437A (ko) | 2014-08-07 | 2017-05-11 | 코히어런트 로직스, 인코포레이티드 | 멀티-파티션 라디오 프레임 |
MX2018006467A (es) * | 2014-08-07 | 2022-04-25 | One Media Llc | Configuracion dinamica de cuadro de datos de transporte fisico de multiplexion de division de frecuencia ortogonal flexible. |
CN105632503B (zh) * | 2014-10-28 | 2019-09-03 | 南宁富桂精密工业有限公司 | 信息隐藏方法及系统 |
CN104392725A (zh) * | 2014-12-02 | 2015-03-04 | 中科开元信息技术(北京)有限公司 | 多声道无损音频混合编解码方法及装置 |
CN106033671B (zh) * | 2015-03-09 | 2020-11-06 | 华为技术有限公司 | 确定声道间时间差参数的方法和装置 |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US10500739B2 (en) * | 2015-11-13 | 2019-12-10 | Ethicon Llc | Robotic surgical system |
CN106131550B (zh) * | 2016-07-25 | 2020-02-14 | 合一网络技术(北京)有限公司 | 播放多媒体文件的方法及装置 |
CN107221334B (zh) * | 2016-11-01 | 2020-12-29 | 武汉大学深圳研究院 | 一种音频带宽扩展的方法及扩展装置 |
EP3324407A1 (en) * | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic |
EP3324406A1 (en) | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a variable threshold |
EP3382700A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
CN109389987B (zh) | 2017-08-10 | 2022-05-10 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
CN114005455A (zh) | 2017-08-10 | 2022-02-01 | 华为技术有限公司 | 时域立体声编解码方法和相关产品 |
CN109859766B (zh) | 2017-11-30 | 2021-08-20 | 华为技术有限公司 | 音频编解码方法和相关产品 |
KR20210021968A (ko) | 2018-06-25 | 2021-03-02 | 소니 세미컨덕터 솔루션즈 가부시키가이샤 | 정보 처리 장치, 정보 처리 시스템, 프로그램 및 정보 처리 방법 |
JP7407110B2 (ja) * | 2018-07-03 | 2023-12-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置及び符号化方法 |
PH12019000380A1 (en) * | 2018-12-17 | 2020-09-28 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
WO2020164752A1 (en) | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transmitter processor, audio receiver processor and related methods and computer programs |
TW202102010A (zh) | 2019-05-24 | 2021-01-01 | 瑞典商赫爾桑茲股份有限公司 | 用於無損資料壓縮和解壓縮的方法、裝置、和電腦程式產品 |
US11271678B2 (en) * | 2020-01-21 | 2022-03-08 | Realtek Semiconductor Corp. | Encoding method, related transmitter apparatus and related receiver apparatus for wireless local area network |
CN111341330B (zh) * | 2020-02-10 | 2023-07-25 | 科大讯飞股份有限公司 | 音频编解码方法、存取方法及其相关设备及存储装置 |
US12058470B2 (en) | 2020-08-25 | 2024-08-06 | Nahum Nir | Video compression and streaming |
US11769478B1 (en) | 2021-07-15 | 2023-09-26 | Dialog Semiconductor B.V. | Digital signal processing system |
US11997317B2 (en) * | 2021-09-29 | 2024-05-28 | Tencent America LLC | Techniques for constraint flag signaling for range extension with persistent rice adaptation |
Family Cites Families (141)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US117044A (en) * | 1871-07-18 | Improvement in ladies work-stands | ||
US2006A (en) * | 1841-03-16 | Clamp for crimping leather | ||
US247035A (en) * | 1881-09-13 | Drill-chuck | ||
US149322A (en) * | 1874-04-07 | Improvement in parasol-handles | ||
US216262A (en) * | 1879-06-10 | Improvement in thill-coupling jacks | ||
US115051A (en) * | 1871-05-23 | Improvement in the manufacture of glucose sirups -and sugars | ||
US138157A (en) * | 1873-04-22 | Improvement in breech-loading fire-arms | ||
US37461A (en) * | 1863-01-20 | Improved car for carrying petroleum | ||
US63368A (en) * | 1867-04-02 | davids | ||
US152557A (en) * | 1874-06-30 | Improvement in devices for coiling wire | ||
US76333A (en) * | 1868-04-07 | To all whom it may concern | ||
US251330A (en) * | 1881-12-20 | Dust-collector for flour-mills | ||
US80829A (en) * | 1868-08-11 | Patkick lennox | ||
US254281A (en) * | 1882-02-28 | Corn-sheller | ||
US13405A (en) * | 1855-08-07 | Self-adjusting tongue-ihon | ||
US125933A (en) * | 1872-04-23 | Improvement in compounds for the cure of colic and botts in horses | ||
US75153A (en) * | 1868-03-03 | Egbert d | ||
US78687A (en) * | 1868-06-09 | Daniel e | ||
US4110571A (en) * | 1977-11-25 | 1978-08-29 | Jimmy's Radio & Television Corporation | Test unit for stereophonic speaker systems |
US4922537A (en) | 1987-06-02 | 1990-05-01 | Frederiksen & Shu Laboratories, Inc. | Method and apparatus employing audio frequency offset extraction and floating-point conversion for digitally encoding and decoding high-fidelity audio signals |
US5243686A (en) | 1988-12-09 | 1993-09-07 | Oki Electric Industry Co., Ltd. | Multi-stage linear predictive analysis method for feature extraction from acoustic signals |
FR2646978B1 (fr) | 1989-05-11 | 1991-08-23 | France Etat | Procede et installation a codage de signaux sonores |
NL9000338A (nl) | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
EP0405591B1 (en) | 1989-06-30 | 1997-10-01 | Nec Corporation | Varaible length block coding with changing characteristics of input samples |
JPH03224130A (ja) | 1990-01-30 | 1991-10-03 | Konica Corp | ディスク状磁気記録媒体 |
CN1062963C (zh) | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
US5283780A (en) | 1990-10-18 | 1994-02-01 | Stanford Telecommunications, Inc. | Digital audio broadcasting system |
US5165686A (en) * | 1990-12-18 | 1992-11-24 | Morgan Edward H | Wooden baseball bat |
US5583962A (en) | 1991-01-08 | 1996-12-10 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
US5751773A (en) | 1992-03-12 | 1998-05-12 | Ntp Incorporated | System for wireless serial transmission of encoded information |
US5495552A (en) * | 1992-04-20 | 1996-02-27 | Mitsubishi Denki Kabushiki Kaisha | Methods of efficiently recording an audio signal in semiconductor memory |
US5828784A (en) | 1992-07-13 | 1998-10-27 | Hitachi Denshi Kabushiki Kaisha | Data coding method and apparatus using a plurality of blocks of different length |
US6161122A (en) | 1992-12-10 | 2000-12-12 | Hawkes; Calvert T. | Method and apparatus for interactively providing information at multiple sites |
US5712955A (en) | 1993-06-30 | 1998-01-27 | Sony Corporation | Method and apparatus for encoding digital signal, method and apparatus for decoding digital signal, and recording medium for encoded signals |
JP3125543B2 (ja) | 1993-11-29 | 2001-01-22 | ソニー株式会社 | 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体 |
JP3175446B2 (ja) | 1993-11-29 | 2001-06-11 | ソニー株式会社 | 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体 |
DE4401227C2 (de) * | 1994-01-18 | 1999-03-18 | Ernst Peter Prof Dr M Strecker | In den Körper eines Patienten perkutan implantierbare Endoprothese |
JPH0831096A (ja) | 1994-07-12 | 1996-02-02 | Matsushita Electric Ind Co Ltd | オーディオデータ符号化記録装置及びオーディオデータ復号再生装置 |
US6549666B1 (en) | 1994-09-21 | 2003-04-15 | Ricoh Company, Ltd | Reversible embedded wavelet system implementation |
US5751903A (en) | 1994-12-19 | 1998-05-12 | Hughes Electronics | Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset |
DE69618684T2 (de) | 1995-02-16 | 2002-10-10 | Kabushiki Kaisha Toshiba, Kawasaki | Ausgabesteuerungssystem für umschaltbare Torkanäle |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JP3705305B2 (ja) * | 1996-05-16 | 2005-10-12 | カシオ計算機株式会社 | 音声記憶再生装置 |
JP3364825B2 (ja) | 1996-05-29 | 2003-01-08 | 三菱電機株式会社 | 音声符号化装置および音声符号化復号化装置 |
US6154549A (en) | 1996-06-18 | 2000-11-28 | Extreme Audio Reality, Inc. | Method and apparatus for providing sound in a spatial environment |
GB2318029B (en) | 1996-10-01 | 2000-11-08 | Nokia Mobile Phones Ltd | Audio coding method and apparatus |
IL125274A (en) * | 1996-11-11 | 2001-10-31 | Koninkl Philips Electronics Nv | Compression / recovery of data using an encoder / decoder |
TW447193B (en) | 1996-12-09 | 2001-07-21 | Matsushita Electric Ind Co Ltd | Signal processing device |
EP1359755B1 (en) | 1996-12-20 | 2005-11-09 | Koninklijke Philips Electronics N.V. | A coded information signal |
EP0880246A3 (en) * | 1997-05-15 | 1999-12-01 | Matsushita Electric Industrial Co., Ltd. | Compressed code decoding device and audio decoding device |
US6124895A (en) | 1997-10-17 | 2000-09-26 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment |
US6069947A (en) | 1997-12-16 | 2000-05-30 | Nortel Networks Corporation | Communication system architecture and operating protocol therefor |
JP3802219B2 (ja) * | 1998-02-18 | 2006-07-26 | 富士通株式会社 | 音声符号化装置 |
US6831914B1 (en) * | 1998-03-27 | 2004-12-14 | Verizon Services Corp. | Services control point selection in an advanced intelligent network |
WO1999053479A1 (en) | 1998-04-15 | 1999-10-21 | Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. | Fast frame optimisation in an audio encoder |
US6298900B1 (en) * | 1998-07-06 | 2001-10-09 | Ford Global Technologies, Inc. | Method of integrating wear plates into a spray formed rapid tool |
US6480822B2 (en) | 1998-08-24 | 2002-11-12 | Conexant Systems, Inc. | Low complexity random codebook structure |
CN1197254C (zh) | 1998-10-06 | 2005-04-13 | 松下电器产业株式会社 | 编码无损压缩方法及其装置和译码无损压缩方法及其装置 |
JP4610680B2 (ja) | 1998-11-02 | 2011-01-12 | ソニー株式会社 | 信号処理装置および方法、記録装置、再生装置、記録再生装置、ならびに、映像信号記録再生装置 |
US6816491B1 (en) | 1998-11-04 | 2004-11-09 | Hitachi, Ltd. | Multiplexed audio data decoding apparatus and receiver apparatus |
US6300888B1 (en) | 1998-12-14 | 2001-10-09 | Microsoft Corporation | Entrophy code mode switching for frequency-domain audio coding |
US6628714B1 (en) | 1998-12-18 | 2003-09-30 | Zenith Electronics Corporation | Down converting MPEG encoded high definition sequences to lower resolution with reduced memory in decoder loop |
US6276608B1 (en) * | 1998-12-29 | 2001-08-21 | Daimlerchrysler Ag | Data storage and communication system |
JP4482237B2 (ja) | 1999-01-07 | 2010-06-16 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 無損失エンコーダにおけるサイド情報の効率的な符号化 |
US6226608B1 (en) | 1999-01-28 | 2001-05-01 | Dolby Laboratories Licensing Corporation | Data framing for adaptive-block-length coding system |
US7051351B2 (en) * | 1999-03-08 | 2006-05-23 | Microsoft Corporation | System and method of inserting advertisements into an information retrieval system display |
US6658382B1 (en) | 1999-03-23 | 2003-12-02 | Nippon Telegraph And Telephone Corporation | Audio signal coding and decoding methods and apparatus and recording media with programs therefor |
EP1054575A3 (en) | 1999-05-17 | 2002-09-18 | Bose Corporation | Directional decoding |
US6691082B1 (en) | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
JP3762579B2 (ja) | 1999-08-05 | 2006-04-05 | 株式会社リコー | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
US6678332B1 (en) | 2000-01-04 | 2004-01-13 | Emc Corporation | Seamless splicing of encoded MPEG video and audio |
US7096481B1 (en) | 2000-01-04 | 2006-08-22 | Emc Corporation | Preparation of metadata for splicing of encoded MPEG video and audio |
US6810502B2 (en) | 2000-01-28 | 2004-10-26 | Conexant Systems, Inc. | Iteractive decoder employing multiple external code error checks to lower the error floor |
US6675748B2 (en) * | 2000-02-11 | 2004-01-13 | Westport Research Inc. | Method and apparatus for fuel injection into an internal combustion engine |
US7266501B2 (en) * | 2000-03-02 | 2007-09-04 | Akiba Electronics Institute Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
EP1272626A2 (en) * | 2000-03-21 | 2003-01-08 | Neugenesis Corporation | Methods for in vivo diversification of single genes |
US6448890B1 (en) * | 2000-05-01 | 2002-09-10 | Breed Automotive Technology, Inc. | Air bag system with biomechanical gray zones |
SE522261C2 (sv) | 2000-05-10 | 2004-01-27 | Global Ip Sound Ab | Kodning och avkodning av en digital signal |
WO2001097476A2 (en) | 2000-06-12 | 2001-12-20 | Time Domain Corporation | A method for specifying non-temporal pulse characteristics |
JP4538908B2 (ja) | 2000-06-14 | 2010-09-08 | ソニー株式会社 | データ変換装置及び方法 |
US6609947B1 (en) * | 2000-08-30 | 2003-08-26 | Micron Technology, Inc. | Planarizing machines and control systems for mechanical and/or chemical-mechanical planarization of micro electronic substrates |
US20020049586A1 (en) | 2000-09-11 | 2002-04-25 | Kousuke Nishio | Audio encoder, audio decoder, and broadcasting system |
US6775254B1 (en) | 2000-11-09 | 2004-08-10 | Qualcomm Incorporated | Method and apparatus for multiplexing high-speed packet data transmission with voice/data transmission |
SE0004163D0 (sv) | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
JP3639212B2 (ja) * | 2000-12-11 | 2005-04-20 | 株式会社オプトウエア | 光情報記録方法 |
US6675148B2 (en) | 2001-01-05 | 2004-01-06 | Digital Voice Systems, Inc. | Lossless audio coder |
WO2002056297A1 (en) | 2001-01-11 | 2002-07-18 | Sasken Communication Technologies Limited | Adaptive-block-length audio coder |
US6871043B2 (en) * | 2001-02-02 | 2005-03-22 | Ecollege.Com | Variable types of sensory interaction for an on-line educational system |
EP1391121B1 (en) * | 2001-03-23 | 2012-08-15 | Nokia Corporation | Variable length coding |
JP4867076B2 (ja) | 2001-03-28 | 2012-02-01 | 日本電気株式会社 | 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法 |
FI118067B (fi) | 2001-05-04 | 2007-06-15 | Nokia Corp | Menetelmä audiosignaalin pakkauksen purkamisessa, pakkauksen purkulaite, ja elektroniikkalaite |
JP3601473B2 (ja) | 2001-05-11 | 2004-12-15 | ヤマハ株式会社 | ディジタルオーディオ圧縮回路および伸長回路 |
EP1417842B1 (en) | 2001-08-03 | 2005-11-30 | Koninklijke Philips Electronics N.V. | Protection of streaming a/v data |
GB2379977B (en) * | 2001-09-25 | 2005-04-06 | Kidde Plc | High sensitivity particle detection |
US20030078687A1 (en) | 2001-10-15 | 2003-04-24 | Du Breuil Thomas Lemaigre | Method and system for automatically configuring an audio environment |
DE20117292U1 (de) * | 2001-10-22 | 2002-01-17 | Reitter & Schefenacker GmbH & Co. KG, 73730 Esslingen | Innenleuchte für Fahrzeuge, vorzugsweise für Kraftfahrzeuge |
EP1308931A1 (de) | 2001-10-23 | 2003-05-07 | Deutsche Thomson-Brandt Gmbh | Decodierung eines codierten digitalen Audio-Signals welches in Header enthaltende Rahmen angeordnet ist |
US7085401B2 (en) | 2001-10-31 | 2006-08-01 | Infowrap Systems Ltd. | Automatic object extraction |
SE521600C2 (sv) | 2001-12-04 | 2003-11-18 | Global Ip Sound Ab | Lågbittaktskodek |
US20030023042A1 (en) * | 2001-12-06 | 2003-01-30 | Genentech, Inc. | Secreted and transmembrane polypeptides and nucleic acids encoding the same |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US6690307B2 (en) | 2002-01-22 | 2004-02-10 | Nokia Corporation | Adaptive variable length coding of digital video |
EP1500086B1 (en) | 2002-04-10 | 2010-03-03 | Koninklijke Philips Electronics N.V. | Coding and decoding of multichannel audio signals |
KR100978018B1 (ko) | 2002-04-22 | 2010-08-25 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 공간 오디오의 파라메터적 표현 |
JP4163680B2 (ja) | 2002-04-26 | 2008-10-08 | ノキア コーポレイション | コードワードインデックスに対してパラメータ値のマッピングを行うための適応型方法およびシステム |
JP4296753B2 (ja) | 2002-05-20 | 2009-07-15 | ソニー株式会社 | 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体 |
US6691028B2 (en) * | 2002-06-07 | 2004-02-10 | Motorola, Inc. | Server-based navigation system and method of operating same |
US20040015259A1 (en) * | 2002-07-18 | 2004-01-22 | A-Po Tsai | NC machining program having easily selectable modes |
JP4055122B2 (ja) | 2002-07-24 | 2008-03-05 | 日本ビクター株式会社 | 音響信号符号化方法及び音響信号符号化装置 |
US6807732B2 (en) | 2002-07-24 | 2004-10-26 | Agilent Technologies, Inc. | Methods for modifying inner-layer circuit features of printed circuit boards |
JP2004072345A (ja) * | 2002-08-05 | 2004-03-04 | Pioneer Electronic Corp | 情報記録媒体、情報記録装置及び方法、情報再生装置及び方法、情報記録再生装置及び方法、コンピュータプログラム、並びにデータ構造 |
JP4022111B2 (ja) | 2002-08-23 | 2007-12-12 | 株式会社エヌ・ティ・ティ・ドコモ | 信号符号化装置及び信号符号化方法 |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
EP1550108A2 (en) | 2002-10-11 | 2005-07-06 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US20040076333A1 (en) | 2002-10-22 | 2004-04-22 | Huipin Zhang | Adaptive interpolation filter system for motion compensated predictive video coding |
EP1580895B1 (en) | 2002-11-21 | 2009-03-04 | Nippon Telegraph and Telephone Corporation | Digital signal processing method, processor thereof, program thereof, and recording medium containing the program |
EP1427252A1 (en) | 2002-12-02 | 2004-06-09 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for processing audio signals from a bitstream |
WO2004053919A2 (en) * | 2002-12-11 | 2004-06-24 | Koninklijke Philips Electronics N.V. | X-ray source for generating monochromatic x-rays |
US7440810B2 (en) | 2002-12-13 | 2008-10-21 | Dell Products L.P. | Multi-channel media applications support with channel-to-connector mapping |
DE60230436D1 (de) * | 2002-12-23 | 2009-01-29 | Alcatel Lucent | Überlastkontrolle in einem optischen Netzwerk mit Burstschaltung |
DE602004002390T2 (de) | 2003-02-11 | 2007-09-06 | Koninklijke Philips Electronics N.V. | Audiocodierung |
US20040177044A1 (en) * | 2003-03-03 | 2004-09-09 | General Instrument Corporation | Processing of copy control information for digital rights management |
US7792194B2 (en) * | 2003-04-10 | 2010-09-07 | Lefan Zhong | MPEG artifacts post-processed filtering architecture |
US7742926B2 (en) * | 2003-04-18 | 2010-06-22 | Realnetworks, Inc. | Digital audio signal compression method and apparatus |
HUP0301368A3 (en) | 2003-05-20 | 2005-09-28 | Amt Advanced Multimedia Techno | Method and equipment for compressing motion picture data |
US7383180B2 (en) | 2003-07-18 | 2008-06-03 | Microsoft Corporation | Constant bitrate media encoding techniques |
SE0302161D0 (sv) * | 2003-08-04 | 2003-08-01 | Akzo Nobel Nv | Process for the manufacture of a bitumen-aggregate mix suitable for road pavement |
US7640157B2 (en) | 2003-09-26 | 2009-12-29 | Ittiam Systems (P) Ltd. | Systems and methods for low bit rate audio coders |
WO2005039200A2 (en) * | 2003-10-13 | 2005-04-28 | Realnetworks, Inc. | Compact signal coding method and apparatus |
ATE452401T1 (de) | 2003-10-13 | 2010-01-15 | Koninkl Philips Electronics Nv | Audiocodierung |
KR20050044085A (ko) * | 2003-11-07 | 2005-05-12 | 삼성전자주식회사 | 집적회로 소자의 세정액 및 그 세정액을 이용한 세정방법 |
US7292902B2 (en) | 2003-11-12 | 2007-11-06 | Dolby Laboratories Licensing Corporation | Frame-based audio transmission/storage with overlap to facilitate smooth crossfading |
JP4765289B2 (ja) | 2003-12-10 | 2011-09-07 | ソニー株式会社 | 音響システムにおけるスピーカ装置の配置関係検出方法、音響システム、サーバ装置およびスピーカ装置 |
SE527670C2 (sv) | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
US7809579B2 (en) * | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
US7272567B2 (en) | 2004-03-25 | 2007-09-18 | Zoran Fejzo | Scalable lossless audio codec and authoring tool |
KR100773539B1 (ko) | 2004-07-14 | 2007-11-05 | 삼성전자주식회사 | 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 |
US7233174B2 (en) * | 2004-07-19 | 2007-06-19 | Texas Instruments Incorporated | Dual polarity, high input voltage swing comparator using MOS input transistors |
ATE521143T1 (de) | 2005-02-23 | 2011-09-15 | Ericsson Telefon Ab L M | Adaptive bitzuweisung für die mehrkanal- audiokodierung |
US7966190B2 (en) * | 2005-07-11 | 2011-06-21 | Lg Electronics Inc. | Apparatus and method for processing an audio signal using linear prediction |
US7299902B2 (en) * | 2005-10-21 | 2007-11-27 | Jim Thorpe | Wheel chock for tandem wheeled vehicles |
-
2006
- 2006-07-07 US US11/481,933 patent/US7966190B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,941 patent/US8050915B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,932 patent/US8032240B2/en active Active
- 2006-07-07 US US11/481,926 patent/US7949014B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,930 patent/US8032368B2/en active Active
- 2006-07-07 US US11/481,915 patent/US7996216B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,917 patent/US7991272B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,931 patent/US7411528B2/en active Active
- 2006-07-07 US US11/481,927 patent/US7835917B2/en active Active
- 2006-07-07 US US11/481,929 patent/US7991012B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,940 patent/US8180631B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,942 patent/US7830921B2/en active Active
- 2006-07-07 US US11/481,939 patent/US8121836B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,916 patent/US8108219B2/en not_active Expired - Fee Related
- 2006-07-10 WO PCT/KR2006/002689 patent/WO2007008011A2/en active Application Filing
- 2006-07-10 CN CNA200680028892XA patent/CN101238509A/zh active Pending
- 2006-07-10 JP JP2008521315A patent/JP2009500690A/ja active Pending
- 2006-07-10 WO PCT/KR2006/002690 patent/WO2007008012A2/en active Application Filing
- 2006-07-10 EP EP06757764A patent/EP1913579A4/en not_active Withdrawn
- 2006-07-10 EP EP06769219A patent/EP1913584A4/en not_active Withdrawn
- 2006-07-10 JP JP2008521310A patent/JP2009500686A/ja active Pending
- 2006-07-10 WO PCT/KR2006/002679 patent/WO2007008001A2/en active Application Filing
- 2006-07-10 EP EP06769220A patent/EP1913585A4/en not_active Withdrawn
- 2006-07-10 EP EP06769222A patent/EP1908058A4/en not_active Withdrawn
- 2006-07-10 CN CNA2006800294174A patent/CN101243489A/zh active Pending
- 2006-07-10 EP EP06769226A patent/EP1913588A4/en not_active Withdrawn
- 2006-07-10 EP EP06757768A patent/EP1913583A4/en not_active Withdrawn
- 2006-07-10 JP JP2008521319A patent/JP2009500693A/ja active Pending
- 2006-07-10 CN CNA2006800305499A patent/CN101243495A/zh active Pending
- 2006-07-10 WO PCT/KR2006/002683 patent/WO2007008005A1/en active Application Filing
- 2006-07-10 CN CNA2006800305412A patent/CN101243497A/zh active Pending
- 2006-07-10 WO PCT/KR2006/002681 patent/WO2007008003A2/en active Application Filing
- 2006-07-10 CN CNA2006800305111A patent/CN101243494A/zh active Pending
- 2006-07-10 EP EP06769227A patent/EP1911020A4/en not_active Withdrawn
- 2006-07-10 WO PCT/KR2006/002680 patent/WO2007008002A2/en active Application Filing
- 2006-07-10 CN CNA2006800304693A patent/CN101243492A/zh active Pending
- 2006-07-10 WO PCT/KR2006/002687 patent/WO2007008009A1/en active Application Filing
- 2006-07-10 CN CNA2006800251395A patent/CN101218629A/zh active Pending
- 2006-07-10 JP JP2008521318A patent/JP2009500692A/ja active Pending
- 2006-07-10 CN CN2006800252699A patent/CN101218630B/zh not_active Expired - Fee Related
- 2006-07-10 JP JP2008521314A patent/JP2009500689A/ja active Pending
- 2006-07-10 WO PCT/KR2006/002686 patent/WO2007008008A2/en active Application Filing
- 2006-07-10 JP JP2008521311A patent/JP2009500687A/ja active Pending
- 2006-07-10 WO PCT/KR2006/002688 patent/WO2007008010A1/en active Application Filing
- 2006-07-10 EP EP06769224A patent/EP1913794A4/en not_active Withdrawn
- 2006-07-10 WO PCT/KR2006/002677 patent/WO2007007999A2/en active Application Filing
- 2006-07-10 WO PCT/KR2006/002682 patent/WO2007008004A2/en active Application Filing
- 2006-07-10 CN CN2006800294070A patent/CN101243496B/zh not_active Expired - Fee Related
- 2006-07-10 EP EP06757767A patent/EP1913582A4/en not_active Withdrawn
- 2006-07-10 CN CN2006800251380A patent/CN101218628B/zh not_active Expired - Fee Related
- 2006-07-10 EP EP06757765A patent/EP1913580A4/en not_active Withdrawn
- 2006-07-10 WO PCT/KR2006/002678 patent/WO2007008000A2/en active Application Filing
- 2006-07-10 CN CNA2006800304797A patent/CN101243493A/zh active Pending
- 2006-07-10 EP EP06769218A patent/EP1913589A4/en not_active Withdrawn
- 2006-07-10 WO PCT/KR2006/002691 patent/WO2007008013A2/en active Application Filing
- 2006-07-10 EP EP06757766A patent/EP1913581A4/en not_active Withdrawn
- 2006-07-10 JP JP2008521309A patent/JP2009500685A/ja active Pending
- 2006-07-10 JP JP2008521313A patent/JP2009500688A/ja active Pending
- 2006-07-10 CN CNA2006800251376A patent/CN101218631A/zh active Pending
- 2006-07-10 WO PCT/KR2006/002685 patent/WO2007008007A1/en active Application Filing
- 2006-07-10 CN CNA200680024866XA patent/CN101218852A/zh active Pending
- 2006-07-10 JP JP2008521307A patent/JP2009500683A/ja active Pending
- 2006-07-10 JP JP2008521308A patent/JP2009500684A/ja active Pending
- 2006-07-10 CN CNA2006800289829A patent/CN101238510A/zh active Pending
- 2006-07-10 JP JP2008521316A patent/JP2009510810A/ja active Pending
- 2006-07-10 EP EP06769223A patent/EP1913587A4/en not_active Withdrawn
- 2006-07-10 JP JP2008521306A patent/JP2009500682A/ja active Pending
- 2006-07-10 JP JP2008521317A patent/JP2009500691A/ja active Pending
- 2006-07-10 JP JP2008521305A patent/JP2009500681A/ja active Pending
- 2006-07-10 EP EP06769225A patent/EP1911021A4/en not_active Withdrawn
-
2008
- 2008-09-18 US US12/232,526 patent/US8010372B2/en not_active Expired - Fee Related
- 2008-09-18 US US12/232,527 patent/US7962332B2/en not_active Expired - Fee Related
- 2008-09-19 US US12/232,590 patent/US8055507B2/en not_active Expired - Fee Related
- 2008-09-19 US US12/232,593 patent/US8326132B2/en active Active
- 2008-09-19 US US12/232,595 patent/US8417100B2/en not_active Expired - Fee Related
- 2008-09-19 US US12/232,591 patent/US8255227B2/en not_active Expired - Fee Related
- 2008-09-22 US US12/232,658 patent/US8510119B2/en not_active Expired - Fee Related
- 2008-09-22 US US12/232,659 patent/US8554568B2/en active Active
- 2008-09-22 US US12/232,662 patent/US8510120B2/en not_active Expired - Fee Related
- 2008-09-23 US US12/232,748 patent/US8155153B2/en not_active Expired - Fee Related
- 2008-09-23 US US12/232,741 patent/US8149877B2/en not_active Expired - Fee Related
- 2008-09-23 US US12/232,734 patent/US8155144B2/en not_active Expired - Fee Related
- 2008-09-23 US US12/232,740 patent/US8149876B2/en not_active Expired - Fee Related
- 2008-09-23 US US12/232,744 patent/US8032386B2/en active Active
- 2008-09-23 US US12/232,747 patent/US8149878B2/en not_active Expired - Fee Related
- 2008-09-23 US US12/232,739 patent/US8155152B2/en not_active Expired - Fee Related
- 2008-09-23 US US12/232,743 patent/US7987008B2/en not_active Expired - Fee Related
- 2008-09-24 US US12/232,781 patent/US7930177B2/en not_active Expired - Fee Related
- 2008-09-24 US US12/232,782 patent/US8046092B2/en active Active
- 2008-09-24 US US12/232,783 patent/US8275476B2/en not_active Expired - Fee Related
- 2008-09-24 US US12/232,784 patent/US7987009B2/en not_active Expired - Fee Related
- 2008-12-18 US US12/314,891 patent/US8065158B2/en not_active Expired - Fee Related
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009500691A (ja) | オーディオ信号の処理装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111101 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120410 |