JP4521170B2 - 純可逆的音声圧縮における技術革新 - Google Patents
純可逆的音声圧縮における技術革新 Download PDFInfo
- Publication number
- JP4521170B2 JP4521170B2 JP2003310669A JP2003310669A JP4521170B2 JP 4521170 B2 JP4521170 B2 JP 4521170B2 JP 2003310669 A JP2003310669 A JP 2003310669A JP 2003310669 A JP2003310669 A JP 2003310669A JP 4521170 B2 JP4521170 B2 JP 4521170B2
- Authority
- JP
- Japan
- Prior art keywords
- samples
- adaptive filter
- adaptive
- audio signal
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000007906 compression Methods 0.000 title claims abstract description 161
- 230000006835 compression Effects 0.000 title claims abstract description 160
- 238000000034 method Methods 0.000 claims abstract description 87
- 230000003044 adaptive effect Effects 0.000 claims abstract description 64
- 230000001052 transient effect Effects 0.000 claims abstract description 38
- 230000008569 process Effects 0.000 claims abstract description 36
- 230000006978 adaptation Effects 0.000 claims abstract 3
- 230000005236 sound signal Effects 0.000 claims description 65
- 230000002441 reversible effect Effects 0.000 claims description 60
- 238000012545 processing Methods 0.000 claims description 36
- 238000001514 detection method Methods 0.000 abstract description 12
- 230000002427 irreversible effect Effects 0.000 description 93
- 238000013139 quantization Methods 0.000 description 41
- 230000009471 action Effects 0.000 description 26
- 238000007493 shaping process Methods 0.000 description 16
- 230000007704 transition Effects 0.000 description 16
- 239000011159 matrix material Substances 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 239000000523 sample Substances 0.000 description 11
- 230000009466 transformation Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000008447 perception Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 239000000872 buffer Substances 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
図1は、統合された不可逆的可逆的音声圧縮のための音声処理が実施されることが可能な一般化された音声符号器(100)を示すブロック図である。符号器(100)は、符号化中、マルチチャネル音声データを処理する。図2は、説明する実施形態が実施されることが可能な一般化された音声復号器(200)を示すブロック図である。復号器(200)は、復号化中、マルチチャネル音声データを処理する。
一般化された音声符号器(100)は、セレクタ(108)、マルチチャネルプリプロセッサ(110)、パーティショナ(partitioner)/タイル構成器(tile Configurer)(120)、周波数変換器(130)、知覚モデラ(perception modeler)(140)、重み付け器(weighter)(142)、マルチチャネル変換器(150)、量子化器(160)、エントロピー符号器(170)、コントローラ(180)、混合/純可逆的符号器(172)、関連するエントロピー符号器(174)、およびビットストリームマルチプレクサ[「MUX」](190)とを含む。
図2を参照すると、一般化された音声符号器(200)は、ビットストリームデマルチプレクサ[「DEMUX」](210)と、1つまたは複数のエントロピー復号器(220)と、混合/純可逆的復号器(222)と、タイル構成復号器(230)と、逆マルチチャネル変換器(240)と、逆量子化器/重み付け器(250)と、逆周波数変換器(260)と、オーバーラッパー(overlapper)/加算器(270)と、マルチチャネルポストプロセッサ(280)とを含む。復号器(200)は、符号器(100)よりもいくぶん単純である。というのは、復号器(200)は、速度/品質制御のためのモジュール、または知覚モデル化のためのモジュールを含まないからである。
前述した一般化された音声符号器100(図1)および音声復号器200(図2)に組み込まれた統合された不可逆的可逆的圧縮のある実施形態は、入力音声信号のある部分を不可逆的圧縮で(例えば、構成要素130、140、160における知覚モデルに基づく量子化を伴う周波数変換ベースの符号化を使用して)符号化し、別の部分を可逆的圧縮を使用して(例えば、混合/純可逆的符号器172において)符号化することを選択的に行う。この手法は、高品質が所望される場合(または不可逆的圧縮が所望の品質に関して高い圧縮比を実現できない場合)により高い品質の音声を実現する可逆的圧縮と、適切な場合に品質の知覚される損失なしに高い圧縮を行うための不可逆的圧縮を統合する。また、これにより、単一の音声信号内において異なる品質レベルで音声を符号化することも可能になる。
統合された不可逆的可逆的音声圧縮のための前述した音声プロセッサ技術および音声処理技術は、他にも例はあるものの、とりわけ、コンピュータ、音声の記録、伝送、および受信を行う機器、ポータブル音楽プレーヤ、電話デバイス等を含め、デジタル音声信号処理が行われる様々なデバイスの任意のものにおいて実施することができる。音声プロセッサ技術および音声処理技術は、ハードウェア回路でも、また図14に示すような、コンピュータ内部または他のコンピューティング環境内部で実行される音声処理ソフトウェアでも実施することができる。
108 セレクタ
110 マルチチャネルプリプロセッサ
120 パーティショナ/タイル構成器
130 周波数変換器知覚
140 知覚モデラ
142 重み付け器
150 マルチチャネル変換器
160 量子化器
170 エントロピー符号器
172 混合/純可逆的符号器
174 エントロピー符号器
180 コントローラ
190 MUX
200 音声符号器
210 DEMUX
220 エントロピー復号器
222 混合/純可逆的復号器
230 タイル構成復号器
240 逆マルチチャネル変換器
250 逆量子化器/重み付け器
260 逆周波数変換器
270 オーバーラッパー(overlapper)/加算器
280 マルチチャネルポストプロセッサ
300〜304 LSF
310〜312 PLLF
320〜322 MLLF
1400 コンピューティング環境
1410 プロセッサ
1420 メモリ
1430 基本的構成
1440 ストレージ
1450 入力デバイス
1460 出力デバイス
1470 通信接続
1480 ソフトウェア
Claims (21)
- 音声信号の少なくとも一つの部分の可逆的圧縮のための方法であって、
前記音声信号の前記部分において現在、符号化されているサンプルに関して、適応フィルタを使用して1組の他のサンプルを処理して前記サンプルに関する値を予測するステップと、
現行の前記サンプルに関する予測剰余を生成するステップと、
前記適応フィルタのフィルタ係数を更新するステップと、
現行の前記サンプルが、前記音声信号の中のトランジェントのまわりに位置しているかどうかを検出するステップと、
前記検出するステップの結果に従って前記適応フィルタの係数を更新するステップの適応速度を変化させるステップと
を備えたことを特徴とする方法。 - 更新速度を変化させるステップが、現行の前記サンプルが前記音声信号のトランジェントのまわりに位置すると検出された箇所で、前記適応速度を高める
ことを特徴とする請求項1に記載の方法。 - マルチチャネル音声信号の少なくとも一つの部分の可逆的圧縮のための方法であって、
前記マルチチャネル音声信号の1組のサンプルを適応フィルタを使用して処理して、現在、符号化されている前記音声信号の現行のチャネルにおける現行のサンプルに関する値を予測するステップであって、前記1組のサンプルが、前記音声信号の他のチャネルにおけるサンプルを含むステップと、
前記適応フィルタの処理に基づいて現行の前記サンプルに関する予測剰余を生成するステップと、
前記適応フィルタのフィルタ係数を更新するステップと、
現行の前記サンプルが、前記音声信号の中のトランジェントのまわりに位置しているかどうかを検出するステップと、
前記検出するステップの結果に従って前記適応フィルタの係数を更新するステップの適応速度を変化させるステップと、
前記予測剰余に基づいて現行の前記サンプルの前記値を符号化し、これにより、前記音声信号のチャネル間の冗長性を低減するステップと
を備えたことを特徴とする方法。 - 前記適応フィルタは、最小平均2乗フィルタであることを特徴とする請求項3に記載の方法。
- 音声信号の少なくとも一つの部分の可逆的圧縮のための方法であって、
前記音声信号の前記部分における現在、符号化されているサンプルに関して、適応フィルタを使用して予測剰余を生成するステップと、
Golomb符号化を使用して前記予測剰余を符号化するステップと、
前記適応フィルタのフィルタ係数を更新するステップと、
現行の前記サンプルが、前記音声信号の中のトランジェントのまわりに位置しているかどうかを検出するステップと、
前記検出するステップの結果に従って前記適応フィルタの係数を更新するステップの適応速度を変化させるステップと
を備えたことを特徴とする方法。 - 前記Golomb符号化は、2の累乗に等しくない除数を有することを特徴とする請求項5に記載の方法。
- 前記除数は、3であることを特徴とする請求項5に記載の方法。
- 音声信号の少なくとも一つの部分の可逆的圧縮のための方法を行うようにコンピュータ上で実行可能なプログラムを有するコンピュータ読み取り可能な記録媒体であって、前記方法は、
前記音声信号の前記部分において現在、符号化されているサンプルに関して、適応フィルタを使用して1組の他のサンプルを処理して前記サンプルに関する値を予測するステップと、
現行の前記サンプルに関する予測剰余を生成するステップと、
前記適応フィルタのフィルタ係数を更新するステップと、
現行の前記サンプルが、前記音声信号の中のトランジェントのまわりに位置しているかどうかを検出するステップと、
前記検出するステップの結果に従って前記適応フィルタの係数を更新するステップの適応速度を変化させるステップと
を備えたことを特徴とするコンピュータ読み取り可能な記録媒体。 - 更新速度を変化させるステップが、現行の前記サンプルが前記音声信号のトランジェントのまわりに位置すると検出された箇所で前記適応速度を高めることを特徴とする請求項8に記載のコンピュータ読み取り可能な記録媒体。
- マルチチャネル音声信号の少なくとも一つの部分の可逆的圧縮のための方法を行うようにコンピュータ上で実行可能なプログラムを有するコンピュータ読み取り可能な記録媒体であって、前記方法は、
前記マルチチャネル音声信号の1組のサンプルを適応フィルタを使用して処理して、現在、符号化されている前記音声信号の現行のチャネルにおける現行のサンプルに関する値を予測するステップであって、前記1組のサンプルが、前記音声信号の他のチャネルにおけるサンプルを含むステップと、
前記適応フィルタの処理に基づいて現行の前記サンプルに関する予測剰余を生成するステップと、
前記適応フィルタのフィルタ係数を更新するステップと、
現行の前記サンプルが、前記音声信号の中のトランジェントのまわりに位置しているかどうかを検出するステップと、
前記検出するステップの結果に従って前記適応フィルタの係数を更新するステップの適応速度を変化させるステップと、
前記予測剰余に基づいて現行の前記サンプルの前記値を符号化し、これにより、前記音声信号のチャネル間の冗長性を低減するステップと
を備えたことを特徴とするコンピュータ読み取り可能な記録媒体。 - 前記適応フィルタは、最小平均2乗フィルタであることを特徴とする請求項10に記載のコンピュータ読み取り可能な記録媒体。
- 音声信号の少なくとも一つの部分の可逆的圧縮のための方法を行うようにコンピュータ上で実行可能なプログラムを有するコンピュータ読み取り可能な記録媒体であって、前記方法は、
前記音声信号の前記部分における現在、符号化されているサンプルに関して、適応フィルタを使用して予測剰余を生成するステップと、
Golomb符号化を使用して前記予測剰余を符号化するステップと、
前記適応フィルタのフィルタ係数を更新するステップと、
現行の前記サンプルが、前記音声信号の中のトランジェントのまわりに位置しているかどうかを検出するステップと、
前記検出するステップの結果に従って前記適応フィルタの係数を更新するステップの適応速度を変化させるステップと
を備えたことを特徴とするコンピュータ読み取り可能な記録媒体。 - 前記Golomb符号化は、2の累乗に等しくない除数を有することを特徴とする請求項12に記載のコンピュータ読み取り可能な記録媒体。
- 前記除数は、3であることを特徴とする請求項12に記載のコンピュータ読み取り可能な記録媒体。
- 音声信号の少なくとも一つの部分を可逆的に圧縮するための音声符号器であって、
前記音声信号の前記部分において現在、符号化されているサンプルに関して、1組の他のサンプルを処理して現行の前記サンプルに関する予測剰余を生成するように動作する適応フィルタであって、適応速度に従って前記1組の他のサンプルを前記処理することに基づいてフィルタ係数の更新をさらに行う適応フィルタと、
前記音声信号の中の現行の前記サンプルのまわりに位置するトランジェントが生じたことを検出するためのトランジェント検出器と、
前記トランジェント検出器に応答して前記適応フィルタの適応速度を変化させるための適応速度コントローラと
を備えたことを特徴とする符号器。 - 前記適応速度を変化させることは、前記トランジェント検出器によってトランジェントが検出された場合、前記適応速度を高めることを特徴とする請求項15に記載の音声符号器。
- マルチチャネル音声信号の少なくとも一つの部分の可逆的圧縮のためのマルチチャネル音声符号器であって、
前記マルチチャネル音声信号の1組のサンプルを適応フィルタを使用して処理して、前記音声信号の現行のチャネルにおける現在、符号化されている現行のサンプルに関する値を予測し、前記1組のサンプルが、前記音声信号の他のチャネルにおけるサンプルを含み、前記処理するステップに基づいて現行の前記サンプルに関する予測剰余を生成するための適応フィルタであって、適応速度に従って前記1組のサンプルを前記処理することに基づいてフィルタ係数の更新をさらに行う適応フィルタと、
前記予測剰余に基づいて現行の前記サンプルの前記値を符号化し、これにより、他のチャネルにおけるサンプルにもまた基づく前記適応フィルタの処理が、前記音声信号のチャネル間の冗長性を低減するためのエントロピー符号器と、
前記音声信号の中の現行の前記サンプルのまわりに位置するトランジェントが生じたことを検出するためのトランジェント検出器と、
前記トランジェント検出器に応答して前記適応フィルタの適応速度を変化させるための適応速度コントローラと
を備えたことを特徴とするマルチチャネル音声符号器。 - 前記適応フィルタは、最小平均2乗フィルタであることを特徴とする請求項17に記載のマルチチャネル音声符号器。
- 音声信号の少なくとも一つの部分の可逆的圧縮のための音声符号器であって、
前記音声信号の前記部分において現在、符号化されているサンプルに関する予測剰余を生成するための適応フィルタであって、フィルタ係数の更新をさらに行う適応フィルタと、
Golomb符号化を使用して前記予測剰余を符号化するためのGolomb符号器と、
前記音声信号の前記部分において現在、符号化されている前記サンプルのまわりに位置するトランジェントが生じたことを検出するためのトランジェント検出器と、
前記トランジェント検出器に応答して前記適応フィルタの適応速度を変化させるための適応速度コントローラと
を備えたことを特徴とする音声符号器。 - 前記Golomb符号化は、2の累乗に等しくない除数を有することを特徴とする請求項19に記載の音声符号器。
- 前記除数は、3であることを特徴とする請求項19に記載の音声符号器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US40843202P | 2002-09-04 | 2002-09-04 | |
US10/620,266 US7328150B2 (en) | 2002-09-04 | 2003-07-14 | Innovations in pure lossless audio compression |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004264814A JP2004264814A (ja) | 2004-09-24 |
JP4521170B2 true JP4521170B2 (ja) | 2010-08-11 |
Family
ID=31720748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003310669A Expired - Lifetime JP4521170B2 (ja) | 2002-09-04 | 2003-09-02 | 純可逆的音声圧縮における技術革新 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7328150B2 (ja) |
EP (1) | EP1396842B1 (ja) |
JP (1) | JP4521170B2 (ja) |
DE (1) | DE60326799D1 (ja) |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7016547B1 (en) | 2002-06-28 | 2006-03-21 | Microsoft Corporation | Adaptive entropy encoding/decoding for screen capture content |
DK1400954T3 (da) | 2002-09-04 | 2008-03-31 | Microsoft Corp | Entropi-kodning ved tilpasning af kodning mellem niveau- og runlængde/niveau-moduser |
US7536305B2 (en) * | 2002-09-04 | 2009-05-19 | Microsoft Corporation | Mixed lossless audio compression |
US7433824B2 (en) * | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
US7724827B2 (en) * | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
US7630282B2 (en) * | 2003-09-30 | 2009-12-08 | Victor Company Of Japan, Ltd. | Disk for audio data, reproduction apparatus, and method of recording/reproducing audio data |
US20050185541A1 (en) * | 2004-02-23 | 2005-08-25 | Darren Neuman | Method and system for memory usage in real-time audio systems |
KR100561869B1 (ko) * | 2004-03-10 | 2006-03-17 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
EP1759253A1 (en) * | 2004-06-22 | 2007-03-07 | Rabit Joint Venture Limited | Signal processing methods and apparatus |
US7930184B2 (en) * | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
US8744862B2 (en) * | 2006-08-18 | 2014-06-03 | Digital Rise Technology Co., Ltd. | Window selection based on transient detection and location to provide variable time resolution in processing frame-based data |
US7895034B2 (en) | 2004-09-17 | 2011-02-22 | Digital Rise Technology Co., Ltd. | Audio encoding system |
US7937271B2 (en) | 2004-09-17 | 2011-05-03 | Digital Rise Technology Co., Ltd. | Audio decoding using variable-length codebook application ranges |
US8171169B2 (en) * | 2005-03-14 | 2012-05-01 | Citrix Systems, Inc. | Method and apparatus for updating a graphical display in a distributed processing environment |
US7363225B2 (en) * | 2005-06-23 | 2008-04-22 | Microsoft Corporation | Compressing language models with Golomb coding |
US7684981B2 (en) * | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US7693709B2 (en) * | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
US8325188B1 (en) * | 2005-07-21 | 2012-12-04 | Cadence Design Systems, Inc. | Method and system for implementing a waveform viewer |
US7565018B2 (en) * | 2005-08-12 | 2009-07-21 | Microsoft Corporation | Adaptive coding and decoding of wide-range coefficients |
US8599925B2 (en) * | 2005-08-12 | 2013-12-03 | Microsoft Corporation | Efficient coding and decoding of transform blocks |
US7933337B2 (en) | 2005-08-12 | 2011-04-26 | Microsoft Corporation | Prediction of transform coefficients for image compression |
TWI276047B (en) * | 2005-12-15 | 2007-03-11 | Ind Tech Res Inst | An apparatus and method for lossless entropy coding of audio signal |
EP1852849A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
CN101578875A (zh) * | 2007-01-04 | 2009-11-11 | 英国电讯有限公司 | 利用迭代重新编码的视频信号编码 |
US8184710B2 (en) * | 2007-02-21 | 2012-05-22 | Microsoft Corporation | Adaptive truncation of transform coefficient data in a transform-based digital media codec |
US8086465B2 (en) * | 2007-03-20 | 2011-12-27 | Microsoft Corporation | Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms |
US7991622B2 (en) * | 2007-03-20 | 2011-08-02 | Microsoft Corporation | Audio compression and decompression using integer-reversible modulated lapped transforms |
US7774205B2 (en) | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
KR101403340B1 (ko) * | 2007-08-02 | 2014-06-09 | 삼성전자주식회사 | 변환 부호화 방법 및 장치 |
CN101790756B (zh) | 2007-08-27 | 2012-09-05 | 爱立信电话股份有限公司 | 瞬态检测器以及用于支持音频信号的编码的方法 |
US8300849B2 (en) * | 2007-11-06 | 2012-10-30 | Microsoft Corporation | Perceptually weighted digital audio level compression |
US7821957B2 (en) * | 2007-12-03 | 2010-10-26 | Avaya, Inc. | Acknowledgment of media waveforms between telecommunications endpoints |
EP2101503A1 (en) * | 2008-03-11 | 2009-09-16 | British Telecommunications Public Limited Company | Video coding |
US8386271B2 (en) | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
US8179974B2 (en) | 2008-05-02 | 2012-05-15 | Microsoft Corporation | Multi-level representation of reordered transform coefficients |
US8630848B2 (en) | 2008-05-30 | 2014-01-14 | Digital Rise Technology Co., Ltd. | Audio signal transient detection |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
WO2010003663A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding frames of sampled audio signals |
US8406307B2 (en) | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
EP2200319A1 (en) | 2008-12-10 | 2010-06-23 | BRITISH TELECOMMUNICATIONS public limited company | Multiplexed video streaming |
EP2219342A1 (en) | 2009-02-12 | 2010-08-18 | BRITISH TELECOMMUNICATIONS public limited company | Bandwidth allocation control in multiple video streaming |
CN101615911B (zh) * | 2009-05-12 | 2010-12-08 | 华为技术有限公司 | 一种编解码方法和装置 |
CN102667923B (zh) | 2009-10-20 | 2014-11-05 | 弗兰霍菲尔运输应用研究公司 | 音频编码器、音频解码器、用于将音频信息编码的方法、用于将音频信息解码的方法 |
CA2786944C (en) * | 2010-01-12 | 2016-03-15 | Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
US8880412B2 (en) * | 2011-12-13 | 2014-11-04 | Futurewei Technologies, Inc. | Method to select active channels in audio mixing for multi-party teleconferencing |
US9711150B2 (en) * | 2012-08-22 | 2017-07-18 | Electronics And Telecommunications Research Institute | Audio encoding apparatus and method, and audio decoding apparatus and method |
US9396732B2 (en) * | 2012-10-18 | 2016-07-19 | Google Inc. | Hierarchical deccorelation of multichannel audio |
CN111341303B (zh) * | 2018-12-19 | 2023-10-31 | 北京猎户星空科技有限公司 | 一种声学模型的训练方法及装置、语音识别方法及装置 |
CN114978189A (zh) * | 2021-02-27 | 2022-08-30 | 华为技术有限公司 | 一种数据编码方法以及相关设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11509388A (ja) * | 1995-07-20 | 1999-08-17 | ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング | 信号の、符号化の際の冗長度低減方法及び冗長度を低減された信号の復号化装置 |
JP2000232366A (ja) * | 1998-07-17 | 2000-08-22 | Fuji Photo Film Co Ltd | データ圧縮方法および装置並びに記録媒体 |
WO2001026095A1 (en) * | 1999-10-01 | 2001-04-12 | Coding Technologies Sweden Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
JP2002041097A (ja) * | 2000-06-02 | 2002-02-08 | Lucent Technol Inc | 符号化方法、復号化方法、符号化器、及び復号化器 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1991005411A1 (de) * | 1989-10-06 | 1991-04-18 | Telefunken Fernseh Und Rundfunk Gmbh | Verfahren zur übertragung eines signals |
US5881176A (en) * | 1994-09-21 | 1999-03-09 | Ricoh Corporation | Compression and decompression with wavelet style and binary style including quantization by device-dependent parser |
US6549666B1 (en) * | 1994-09-21 | 2003-04-15 | Ricoh Company, Ltd | Reversible embedded wavelet system implementation |
US6141446A (en) * | 1994-09-21 | 2000-10-31 | Ricoh Company, Ltd. | Compression and decompression system with reversible wavelets and lossy reconstruction |
US6757437B1 (en) * | 1994-09-21 | 2004-06-29 | Ricoh Co., Ltd. | Compression/decompression using reversible embedded wavelets |
US5884269A (en) * | 1995-04-17 | 1999-03-16 | Merging Technologies | Lossless compression/decompression of digital audio data |
US5999656A (en) * | 1997-01-17 | 1999-12-07 | Ricoh Co., Ltd. | Overlapped reversible transforms for unified lossless/lossy compression |
US6493338B1 (en) * | 1997-05-19 | 2002-12-10 | Airbiquity Inc. | Multichannel in-band signaling for data communications over digital wireless telecommunications networks |
US6121904A (en) * | 1998-03-12 | 2000-09-19 | Liquid Audio, Inc. | Lossless data compression with low complexity |
US6029126A (en) * | 1998-06-30 | 2000-02-22 | Microsoft Corporation | Scalable audio coder and decoder |
US6370502B1 (en) * | 1999-05-27 | 2002-04-09 | America Online, Inc. | Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec |
US6675148B2 (en) * | 2001-01-05 | 2004-01-06 | Digital Voice Systems, Inc. | Lossless audio coder |
US20030012431A1 (en) * | 2001-07-13 | 2003-01-16 | Irvine Ann C. | Hybrid lossy and lossless compression method and apparatus |
-
2003
- 2003-07-14 US US10/620,266 patent/US7328150B2/en active Active
- 2003-09-02 JP JP2003310669A patent/JP4521170B2/ja not_active Expired - Lifetime
- 2003-09-03 DE DE60326799T patent/DE60326799D1/de not_active Expired - Lifetime
- 2003-09-03 EP EP03020013A patent/EP1396842B1/en not_active Expired - Lifetime
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11509388A (ja) * | 1995-07-20 | 1999-08-17 | ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング | 信号の、符号化の際の冗長度低減方法及び冗長度を低減された信号の復号化装置 |
JP2000232366A (ja) * | 1998-07-17 | 2000-08-22 | Fuji Photo Film Co Ltd | データ圧縮方法および装置並びに記録媒体 |
WO2001026095A1 (en) * | 1999-10-01 | 2001-04-12 | Coding Technologies Sweden Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
JP2003529787A (ja) * | 1999-10-01 | 2003-10-07 | コーディング テクノロジーズ スウェーデン アクチボラゲット | 可変時間/周波数分解能および時間/周波数切り替えを使用する効率的なスペクトルエンベロープ符号化 |
JP2002041097A (ja) * | 2000-06-02 | 2002-02-08 | Lucent Technol Inc | 符号化方法、復号化方法、符号化器、及び復号化器 |
Also Published As
Publication number | Publication date |
---|---|
DE60326799D1 (de) | 2009-05-07 |
EP1396842A1 (en) | 2004-03-10 |
EP1396842B1 (en) | 2009-03-25 |
JP2004264814A (ja) | 2004-09-24 |
US7328150B2 (en) | 2008-02-05 |
US20040044534A1 (en) | 2004-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4521170B2 (ja) | 純可逆的音声圧縮における技術革新 | |
JP5688862B2 (ja) | 混合の可逆的音声圧縮 | |
JP4778196B2 (ja) | 統合化不可逆的可逆的音声圧縮 | |
EP1730725B1 (en) | Efficient coding of digital audio spectral data using spectral similarity | |
JP6144773B2 (ja) | 時間雑音/パッチ整形を用いる符号化オーディオ信号の符号化および復号化装置および方法 | |
RU2555221C2 (ru) | Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой | |
JP4676139B2 (ja) | マルチチャネルオーディオのエンコーディングおよびデコーディング | |
JP5400143B2 (ja) | オーバーラッピング変換の2つのブロック変換への因数分解 | |
JP6126006B2 (ja) | 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法 | |
US20100274555A1 (en) | Audio Coding Apparatus and Method Thereof | |
US20100250260A1 (en) | Encoder | |
JP2003195896A (ja) | オーディオ復号装置及びその復号方法並びに記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100422 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100518 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100524 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130528 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4521170 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130528 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |