JP2002041097A - 符号化方法、復号化方法、符号化器、及び復号化器 - Google Patents
符号化方法、復号化方法、符号化器、及び復号化器Info
- Publication number
- JP2002041097A JP2002041097A JP2001166326A JP2001166326A JP2002041097A JP 2002041097 A JP2002041097 A JP 2002041097A JP 2001166326 A JP2001166326 A JP 2001166326A JP 2001166326 A JP2001166326 A JP 2001166326A JP 2002041097 A JP2002041097 A JP 2002041097A
- Authority
- JP
- Japan
- Prior art keywords
- filter
- signal
- decoding
- encoding
- adaptive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000001228 spectrum Methods 0.000 claims abstract description 16
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 11
- 230000003595 spectral effect Effects 0.000 claims description 33
- 230000003044 adaptive effect Effects 0.000 claims description 31
- 238000013139 quantization Methods 0.000 claims description 26
- 230000004044 response Effects 0.000 claims description 12
- 230000005236 sound signal Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 10
- 230000006978 adaptation Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims 8
- 230000000007 visual effect Effects 0.000 claims 1
- 238000011045 prefiltration Methods 0.000 abstract description 29
- 230000009467 reduction Effects 0.000 abstract description 25
- 238000005070 sampling Methods 0.000 abstract description 9
- 230000008447 perception Effects 0.000 abstract description 5
- 230000002123 temporal effect Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 8
- 238000007493 shaping process Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241000723418 Carya Species 0.000 description 1
- 206010042602 Supraventricular extrasystoles Diseases 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
トル的及び時間的分解能のそれぞれを独立に選択するこ
とが可能な音声信号符号化方法及びその装置を実現する
ことが本発明の課題である。 【解決手段】 本発明に係る知覚音声コーダは、音響心
理モデル(不関連性低減)を冗長性低減から可能な限り
分離する。音声信号は、音響心理モデルによって制御さ
れたプレフィルタを用いてスペクトル的に成形される。
プレフィルタの出力サンプリング信号は、スペクトル全
体に亘る二乗平均誤差(MSE)を最小化するように量
子化されて符号化される。本知覚音声コーダは、固定さ
れた量子化器ステップサイズを利用する。なぜなら、ス
ペクトル成形が、量子化及び符号化の前にプレフィルタ
によって実行されるからである。よって、量子化器制御
付加情報がデコーダ宛に送出される必要が無く、送出さ
れるビット数が節約される。
Description
し、特に、会話及び音楽信号などの音声信号の知覚ベー
ス符号化に関する。
覚モデル及び信号処理技法を適用することによって、デ
ジタル音声データの蓄積あるいは伝送(もしくはその双
方)に必要となるビットレートを最小化することを試み
ている。知覚音声コーダ(PAC)は、例えば、D.Sinh
aらによる“知覚音声コーダ”(書名:デジタルオーデ
ィオ、節42、42−1から42−18(CRC Press、
1998年))という表題の文献に記載されている。こ
の文献は、本発明の参照文献である。チャネル誤差が存
在しない場合には、PACは、およそ128kbpsの
レートで、ステレオのコンパクトディスク(CD)とほ
ぼ同等の音声品質を実現する。96kbpsというより
低いレートでは、その結果得られる品質は、種々のオー
ディオ素材に関しては、依然としてCDオーディオのそ
れにかなり近い。
与えられたビットレートに対して知覚される歪みを最小
化することによって、音声信号を表現するために必要と
される情報量を低減する。知覚音声コーダは、まず、よ
りコンパクトな表現を実現する目的で時間−周波数変換
を適用し、スペクトル係数の量子化を行なう。図1は、
従来技術に係る知覚音声コーダ100の模式的なブロッ
ク図である。図1に示されているように、通常の知覚音
声コーダ100は、解析フィルタバンク110、知覚モ
デル120、量子化及び符号化ブロック130及びビッ
トストリームエンコーダ/マルチプレクサ140を有し
ている。
リング信号を、サブサンプリングされたスペクトル表現
に変換する。知覚モデル120は、信号のマスク閾値を
推定する。各スペクトル係数に関して、マスク閾値は、
知覚的にトランスペアレントな信号品質を依然として実
現する一方で音声信号に導入されてしまう最大符号化誤
差を与える。量子化及び符号化ブロック130は、マス
ク閾値推定に対応する制度に従って、プレフィルタ済み
出力サンプリング信号を量子化・符号化する。よって、
量子化雑音は、対応する送信信号によって隠される。最
後に、符号化済みプレフィルタ出力サンプリング信号及
び付加的な付随情報が、ビットストリームエンコーダ/
マルチプレクサ140によってビットストリームにパッ
キングされ、それがデコーダ宛に送出される。
200の模式的なブロック図である。図2に示されてい
るように、知覚音声デコーダは、ビットストリームデコ
ーダ/デマルチプレクサ210、復号化及び逆量子化ブ
ロック220及び合成フィルタバンク230を有してい
る。ビットストリームデコーダ/デマルチプレクサ21
0は、ビットストリームを解釈して復号化し、プレフィ
ルタ適用済みの出力サンプリング信号及び付随情報を実
現する。復号化及び逆量子化ブロック220は、量子化
されたプレフィルタ済み出力サンプルの符号化及び逆量
子化を実行する。合成フィルタバンク230は、プレフ
ィルタ済み出力サンプリング信号を時間軸に再び変換す
る。
される情報量は、二つの公知の技法、すなわち、不関連
性の低減及び冗長性除去、を用いて低減される。不関連
性低減技法は、復号化された場合に知覚的にリスナーに
とって関連のない部分の音声信号を除去しようと試み
る。この一般的な概念は、例えば、J.L.Hall及びJ.D.Jo
hnstonによる1994年8月23日に提出された“音声
信号の知覚符号化”という表題の米国特許第5,34
1,457号に記載されている。この文献は、本発明の
参照文献である。
ンプリングされたスペクトル表現に変換する目的で解析
フィルタバンク110によって実装されたほとんどの音
声変換符号化方式は、不関連性低減及び冗長性低減の双
方に関して単一スペクトル分解を利用している。冗長性
低減は、音響心理モデル120に含まれる知覚基準に従
った個々のスペクトル成分に関して、量子化及び符号化
ブロック130中の量子化器を動的に制御することによ
って実現される。このため、レシーバ200における逆
変換の後に、時間的及びスペクトル的に成形された量子
化誤差が発生する。図1及び図2に示されているよう
に、音響心理モデル120は、スペクトル成分に関して
量子化器130及びデコーダ200における対応する逆
量子化器220を制御する。よって、動的量子化器制御
情報が、量子化されたスペクトル成分に加えて、知覚音
声コーダ100によって送出される必要がある。
時間的に高い相関を有する音声信号に関しては、この逆
相関性によって、信号エネルギーが比較的少ない個数の
スペクトル成分に集中することになり、送出されるべき
情報量が低減される。適応ハフマン(Huffman)符号化
などの適切な符号化技法を適用することにより、非常に
効率的な信号表現が実現される。
おける一つの問題は、最適変換長の選択である。最適変
換長は、周波数分解能に直接関連している。比較的定常
的な信号に関しては、高い周波数分解能を有する長変換
が望ましく、この長変換によって量子化誤差スペクトル
の正確な成形が可能になり、高度の冗長性低減が実現さ
れる。しかしながら、音声信号における過渡成分に関し
ては、その高い時間分解能のために、短変換が利点を有
している。これは、量子化誤差における、復号化された
信号におけるエコーにつながる時間的広がりを回避する
ために主として必要となる。
に、従来技術に係る知覚音声コーダ100は、通常、不
関連性低減及び冗長性低減の双方に関して、単一のスペ
クトル分解を利用する。よって、冗長性低減及び不関連
性低減の双方に係るスペクトル的/時間的分解能は同一
でなければならない。高いスペクトル分解能が高度に冗
長性低減を実現するのに対し、その結果得られる長い変
換ウィンドウサイズのためにリバーブアーティファクト
が発生し、不関連性低減を損なう。それゆえ、冗長性低
減及び不関連性低減に関してスペクトル的及び時間的分
解能のそれぞれを独立に選択することが可能な音声信号
符号化方法及びその装置に関するニーズが存在する。さ
らに、会話及び音楽の双方の音響心理モデル(雑音成形
フィルタ)及び変換を用いた符号化のための方法及びそ
の装置に関するニーズも存在する。
話や音楽などの音声信号を符号化するための、冗長性低
減及び不関連性低減に関して相異なったスペクトル分解
能及び時間分解能を有する知覚音声コーダが記載されて
いる。本発明に係る知覚音声コーダは、音響心理モデル
(不関連性低減)を冗長性低減から可能な限り分離す
る。音声信号は、まず、音響心理モデルによって制御さ
れたプレフィルタを用いてスペクトル的に成形される。
プレフィルタの出力サンプリング信号は、スペクトル全
体に亘る二乗平均誤差(MSE)を最小化するように量
子化されて符号化される。
覚音声コーダは、固定された量子化器ステップサイズを
利用する。なぜなら、スペクトル成形が、量子化及び符
号化の前にプレフィルタによって実行されるからであ
る。よって、量子化器制御付加情報がデコーダ宛に送出
される必要が無く、よって、送出されるビット数が節約
される。
デコーダにおける対応するポストフィルタは、不関連性
低減に関して適切な周波数依存時間分解能及び空間分解
能をサポートする。周波数ワープ技法に基づくフィルタ
構造が、非線形周波数軸に基づくフィルタ設計を可能に
する。
て既知の技法を用いて、(音響心理モデルによって生成
されたものとしての)マスク済み閾値(masked thresho
ld)に適応させられる。この際、線形予測係数(LP
C)フィルタパラメータが、音声信号のスペクトル包絡
線をモデル化する目的で利用される。同様に、フィルタ
係数はデコーダ宛に効率的に送出され、ポストフィルタ
によって、例えばLSP(線スペクトル対)表現、時間
補間、あるいはベクトル量子化などの音声認識に係る公
知の技法を用いて利用される。
さらなる特徴及び利点は、以下の発明の実施の形態及び
添付図面を参照することによって得られる。
音声信号を通信するための、本発明に従った知覚音声コ
ーダ300及び対応する知覚音声デコーダ350を模式
的に示すブロック図である。本明細書において、本発明
は音声信号を用いるように例示されているが、当業者に
は明らかなように、人間の視覚の時間的、スペクトル
的、及び空間的感度などの他の信号の符号化に対しても
適用されうる。
ーダ300は、音響心理モデル(不関連性低減)を冗長
性低減から可能な限り分離する。よって、知覚音声コー
ダ300は、音響心理モデル315によって制御された
プレフィルタ310を用いて、音声信号のスペクトル成
形をまず実行する。
関しては、例えば、D.Sinhaらによる前掲の“知覚音声
コーダ”(書名:デジタルオーディオ、節42、42−
1から42−18(CRC Press、1998年))という
参考文献を参照。同様に、知覚音声デコーダ350にお
いては、音響心理モデル315によって制御されたポス
トフィルタ380がプレフィルタ310の影響を反転す
る。図3に示されているように、フィルタ制御情報は、
付随情報として、量子化されたサンプリング信号に加え
て送出される必要がある。
ンプリング信号は、段階320において量子化された符
号化される。以下に詳細に議論されるように、量子化器
/符号化器320によって実行される冗長性低減によ
り、スペクトル全体に亘る二乗平均誤差(MSE)が最
小化される。
先立ってスペクトル成形を実行するため、量子化器/符
号化器320は固定された量子化器ステップサイズを利
用することが可能である。よって、スペクトルの相異な
った領域に対する個々のスケーリングファクタなどの付
加的な量子化器制御情報は、知覚音声デコーダ350宛
に送出される必要がない。
が、量子化器/符号化器段階320においては用いられ
る。プレフィルタ済み信号に対して量子化器/符号化器
320による変換符号化方式が適用される場合には、二
乗平均誤差(MSE)基準の下に最大符号化利得を実現
することを目標として、スペクトル分解能及び時間分解
能が完全に最適化される。以下に議論されるように、知
覚雑音成形はポストフィルタ380によって実行され
る。
白色雑音であると仮定すると、デコーダ350の出力に
現われる雑音の時間的及びスペクトル的構造が、ポスト
フィルタ380の特性によって完全に決定される。量子
化器/符号化器段階320はが図1に示されている解析
フィルタバンク110のようなフィルタバンクを含みう
ることに留意されたい。同様に、復号化器/逆量子化器
段階360は、図2に示されている合成フィルタバンク
230などのフィルタバンクを含みうる。
ストフィルタ プレフィルタ310及びポストフィルタ380の一実施
例が、以下の“プレフィルタ及びポストフィルタの構
造”という表題の節においてさらに議論される。以下に
議論されているように、プレフィルタ310及びポスト
フィルタ380の構造が、適切な周波数依存性を有する
時間的及びスペクトル的分解能をサポートしていること
が有利である。それゆえ、非線形周波数軸に基づくフィ
ルタ設計を可能にする周波数ワープ技法を用いたフィル
タ構造が用いられる。
済み閾値が、適切な非線形(すなわち、ワープさせられ
た)周波数軸に以下のように変換される必要がある。一
般に、フィルタ係数gを得るための、結果として得られ
る手続きは次のようになる: ・音響心理モデルを適用することにより、周波数毎の強
度(密度)としてマスク済み閾値が与えられる ・以下に議論されている周波数ワープ技法に従った周波
数軸の非線形変換により、変換されたマスク済み閾値が
与えられる ・LPC解析/モデリング技法を適用することにより、
LPCフィルタ係数hが得られ、これが格子定数すなわ
ちLSPへの変換を用いて量子化及び符号化される ・図6に示されたワープ済みフィルタ構造を用いるため
には、LPCフィルタ係数hがフィルタ係数gに変換さ
れる必要がある
して公知の技法を用いて、(音響心理モデル315によ
って生成された)マスク済み閾値に適合させられる。そ
の際、線形予測係数(LPC)フィルタパラメータが、
音声信号のスペクトル包絡線をモデル化する目的で使用
される。
は、LPCフィルタパラメータは、通常、解析フィルタ
出力信号のスペクトル包絡線が最も平坦となるように生
成される。言い換えれば、LPC解析フィルタの振幅応
答が、入力スペクトル包絡線の逆に近似されることにな
る。入力スペクトルに係る元の包絡線は、LPC合成フ
ィルタによってデコーダ内で再構成される。それゆえ、
その振幅応答は、入力スペクトル包絡線に近似的に等し
くなる。
関しては、例えば、W.B.Kleijin及びK.K.Paliwalによる
“音声符号化への導入”(音声符号化及び合成、Elsevi
er社(アムステルダム、1995年))という表題の文
献を参照。この文献は本発明の参照文献である。
ィルタ380及びプレフィルタ310の振幅応答も、そ
れぞれ、マスク済み閾値及びその逆に対応していなけれ
ばならない。この同様性によって、既知のLPC解析技
法が、本明細書において修正された形で適用されうる。
詳細に述べれば、既知のLPC解析技法が、短期間スペ
クトルの代わりにマスク済み閾値を用いるように修正さ
れる。
ィルタ380に関して、スペクトル包絡線の形状が取り
扱われるのみならず、平均レベルもモデル内に含められ
るべきである。このことは、平均マスク済み閾値レベル
を表わすポストフィルタ380内の利得係数、及び、プ
レフィルタ310におけるその逆、によって実現されう
る。
SP(線スペクトル対)表現、時間補間、あるいはベク
トル量子化などの、音声符号化技法において公知の技法
を用いて効率的に送出されうる。この種の音声符号化技
法に係る詳細な議論に関しては、例えば、F.K.Soong及
びB.-H.Juangによる“線スペクトル対(LSP)及び音
声データ圧縮”(Proc. ICASSP(1984年))という
表題の論文を参照。この論文は本発明の参照論文であ
る。
標準的な音声符号化技法に対する一つの重要な利点は、
マスク済み閾値の形状への時間的及び空間的適応性にお
けるより大きな柔軟性である。それゆえ、人間の聴覚シ
ステムの性質が、フィルタ構造選択の際に考慮されなけ
ればならない。
関しては、例えば、M.R.Schroederらによる“人間の聴
覚のマスキング特性を利用した、デジタル音声符号化器
の最適化”(Journal of the Acoust. Soc. Am., 第6
6巻第1647−1652頁(1979年12月))と
いう表題の論文、及び、J.H.Hallによる“符号化応用の
ための音響心理物理学”(デジタル信号処理ハンドブッ
ク(V.Madisetti及びD.B.Williams編)、39−1;3
9−22、CRC Press、IEEE Press(1998年))と
いう表題の論文を参照。これらは、それぞれ、本発明の
参照論文である。
(マスカー)の始まりよりも前に開始される比較的短い
立ち上がり時間及びマスカーがオフになった後のより長
い減衰時間によって特徴付けられる。マスキング効果の
実際の程度はマスカーの周波数にも依存し、周波数が増
大するに連れて時間分解能が増大する。
済み閾値のスペクトル形状は、マスカーの周波数の周り
に、高周波数側に低周波数側よりもより大きく広がって
いるものとなる。高周波数側及び低周波数側のスロープ
の双方はマスカーの周波数に依存し、マスカーの周波数
が増大すると周波数分解能は低減する。しかしながら、
非線形“バーク(Bark)スケール(軸)”上では、マス
ク済み閾値の形状は殆ど周波数依存性を有さなくなる。
このバークスケール(軸)は、ゼロから20kHzまで
を24単位(Bark)でカバーする。
って近似されるべきである一方で、プレフィルタ310
及びポストフィルタ380の構造が周波数に依存した適
切な時間的及びスペクトル的分解能をサポートすること
は望ましい。それゆえ、前述されているように、以下に
記述される選択されたフィルタ構造は、非線形周波数軸
に係るフィルタ設計を可能にする周波数ワープ技法に基
づいている。
ーダ350におけるマスク済み閾値の形状及びエンコー
ダ300におけるその逆をモデリングしていなければな
らない。最も一般的な予測器(プレディクタ)は、エン
コーダ300において最小位相有限インパルス応答(F
IR)フィルタを用いており、結果としてデコーダにお
いてはIIRフィルタが用いられる。
及び対応するIIRプレディクタ450を例示してい
る。図4に示された構造は、時間的に変化させることが
非常に容易である。なぜなら、双方のフィルタの実際の
計数が等しく、それゆえ、同期して修正されうるからで
ある。
低域周波数側においてより詳細を与えるような機能を有
する表現が望ましい。周波数に係るこの種の不均等な分
解能を実現するためには、例えばH.W.Strubeによる“ワ
ープした周波数軸に関する線形予測”という表題の論文
(J. of the Acoust. Soc. Am., 第68巻第1071−
1076頁(1980年))に記載されている周波数ワ
ープ技法が有効に用いられうる。前記文献は本発明の参
照論文である。この技法は、与えられたフィルタ次数に
関して実現可能な近似精度の意味では非常に効率的であ
り、適応に関して必要とされる付随情報の量に密接に関
連している。
ローパス変換及びローパス−バンドパス変換のようなフ
ィルタ設計技法において公知の原理に基づいている。離
散時間システムにおいては、等価な変換は全ての遅延ユ
ニットを全通過で置換することによって実装されうる。
“クリティカルな帯域”スケール(軸)の非線形性を反
映する周波数軸が最も適切であろう。
聴覚のマスキング特性を利用した、デジタル音声符号化
器の最適化”(Journal of the Acoust. Soc. Am., 第
66巻第1647−1652頁(1979年12月))
という表題の論文、及び、U.K.Laineらによる“会話及
び音声処理におけるワープ線形予測(WLP)”という
表題の論文(IEEE Int. Conf. Acoustics, Speech, Sig
nal Processing, III-349〜III-352(1994年))を
参照。これらは、共に本発明の参照論文である。
タ500を用いることにより、充分な近似精度が実現さ
れる。しかしながら、一次全通過フィルタ500によっ
て図4のFIR400を直接置換することは、プレフィ
ルタ310に関してのみ可能である。一次全通過フィル
タ500はその入力から出力へという無遅延の直接経路
を有しているため、一次全通過フィルタ500による図
4のIIR450のフィードバック構造の置換により、
ゼロラグループが実現されてしまう。
る。エンコーダ及びデコーダにおけるフィルタ係数の同
期適用を可能にする目的で、双方のシステムが以下に記
述されているように修正されるべきである。
元の構造(図4)の遅延ユニットが、前掲のH.W.Strube
による論文に記述されているように、一次の全通過フィ
ルタ500フィードバック部分のみを含む一次IIRフ
ィルタによって置換される。図6は、本発明の一実施例
に従う、周波数ワープ特性を有するFIRフィルタ60
0及びIIRフィルタ650の模式的なブロック図であ
る。フィルタ600の係数は、全通過ユニットを有する
構造の場合と同一の周波数を実現するように修正される
必要がある。
用いて、元のLPCフィルタ係数から計算される:
より、周波数軸に関する以下のマッピングが実現され
る:
圧縮であるか(ν>1)あるいは伸長であるか(ν<
1)を表わす。ワープ係数aは、サンプリング周波数に
依存して選択されるべきである。例えば、32kHzの
場合には、プレフィルタ応用に関してはおよそ0.5と
いうワープ係数の値が良い選択である。
イルストレージ応用にかんしても有用であることに留意
されたい。音声ファイルストレージ応用においては、プ
レフィルタ310の出力信号は固定量子化器を用いて直
接量子化され、その結果得られる整数値は無損失符号化
技法を用いて符号化される。
対して高度に最適化された標準的なファイル圧縮技法を
構成しうる。このアプローチは、現在までのところ無損
失圧縮に関してのみ適していた技法の、知覚音声符号化
への適用可能性を開くものである。
もので,この技術分野の当業者であれば、本発明の種々
の変形例が考え得るが、それらはいずれも本発明の技術
的範囲に包含される。
長性低減及び不関連性低減に関して相異なったスペクト
ル分解能及び時間分解能を有する知覚音声コーダが提供
される。
記載した番号がある場合は本発明の一実施例の態様関係
を示すものであって、本発明の範囲を限定するものと解
釈してはならない。
ロック図。
従来技術に係る知覚音声デコーダの模式的なブロック
図。
知覚音声デコーダの模式的なブロック図。
Rプレディクタを示す図。
を示すFIRフィルタ及び対応するIIRフィルタを模
式的に示す図。
Claims (33)
- 【請求項1】 信号を符号化する方法において、 (A)音響心理モデルによって制御される適応フィルタ
を用いて前記信号を濾波する濾波ステップと、 前記適応フィルタは濾波済み出力信号を生成し、マスク
済み閾値の逆を近似する振幅応答を有し、 (B)前記フィルタ出力信号をフィルタ適応制御向け付
随情報と共に量子化して符号化する量子化及び符号化ス
テップとからなることを特徴とする符号化方法。 - 【請求項2】 前記(B)量子化及び符号化ステップ
は、冗長性低減に適した変換すなわち解析フィルタバン
クを用いることを特徴とする請求項1記載の符号化方
法。 - 【請求項3】 前記方法が、さらに、 (C)変換すなわち解析フィルタバンクから得られたス
ペクトル成分を量子化して符号化する量子化及び符号化
ステップを有しており、 前記(C)量子化及び符号化ステップは固定された量子
化器ステップサイズを利用することを特徴とする請求項
1に記載の符号化方法。 - 【請求項4】 前記(B)量子化及び符号化ステップ
は、前記信号中の平均二乗誤差(MSE)を低減するこ
とを特徴とする請求項1記載の符号化方法。 - 【請求項5】 前記適応フィルタのフィルタ適応に係る
フィルタ次数及び間隔は、不関連性低減に適するように
選択されることを特徴とする請求項1記載の符号化方
法。 - 【請求項6】 前記信号は音声信号であることを特徴と
する請求項1記載の符号化方法。 - 【請求項7】 前記信号は画像信号であり、前記適応フ
ィルタは、前記振幅応答が視覚閾値の逆を近似するよう
に制御されることを特徴とする請求項1記載の符号化方
法。 - 【請求項8】 前記方法は、さらに、 (D)前記符号化された信号をデコーダ宛に送出するス
テップを有することを特徴とする請求項1記載の符号化
方法。 - 【請求項9】 前記方法は、さらに、 (E)前記符号化された信号を蓄積媒体上に記録するス
テップを有することを特徴とする請求項1記載の符号化
方法。 - 【請求項10】 前記(B)ステップの符号化ステップ
はさらに、 (B1)適応ハフマン(Huffman)符号化技法を用いる
ステップを有することを特徴とする請求項1記載の符号
化方法。 - 【請求項11】 前記(A)濾波ステップは、非線型周
波数スケール(軸)を用いる周波数ワープ技法に基づい
ていることを特徴とする請求項1記載の符号化方法。 - 【請求項12】 前記フィルタ係数符号化段階は、LP
Cフィルタ係数の格子係数すなわち線スペクトル対への
変換を含むことを特徴とする請求項1記載の符号化方
法。 - 【請求項13】 信号を符号化する方法において、 (A)音響心理モデルによって制御される適応フィルタ
を用いて前記信号を濾波する濾波ステップと、 前記適応フィルタは濾波済み出力信号を生成し、マスク
済み閾値の逆を近似する振幅応答を有し、 (B)冗長性低減に適した複数個のサブバンドを用いて
前記フィルタ出力信号を変換する変換ステップと、 (C)前記サブバンド信号をフィルタ適応制御向けの付
随情報と共に量子化して符号化する量子化及び符号化ス
テップからなることを特徴とする符号化方法。 - 【請求項14】 前記(C)量子化及び符号化ステップ
は、冗長性低減に適した変換すなわち解析フィルタバン
クを用いることを特徴とする請求項13記載の符号化方
法。 - 【請求項15】 前記方法は、さらに、 (D)変換すなわち解析フィルタバンクから得られたス
ペクトル成分を量子化して符号化する量子化及び符号化
ステップを有しており、 前記(D)量子化及び符号化ステップは固定された量子
化器ステップサイズを利用することを特徴とする請求項
13記載の符号化方法。 - 【請求項16】 前記(C)量子化及び符号化ステップ
は、前記信号中の平均二乗誤差(MSE)を低減するこ
とを特徴とする請求項13記載の符号化方法。 - 【請求項17】 前記適応フィルタのフィルタ適応に係
るフィルタ次数及び間隔は、不関連性低減に適するよう
に選択されることを特徴とする請求項13記載の符号化
方法。 - 【請求項18】 前記(A)濾波ステップは、非線形周
波数スケール(軸)を用いる周波数ワープ技法に基づい
ていることを特徴とする請求項13記載の符号化方法。 - 【請求項19】 前記フィルタ係数符号化段階は、LP
Cフィルタ係数の格子係数すなわち線スペクトル対への
変換を含むことを特徴とする請求項13記載の符号化方
法。 - 【請求項20】 信号を復号化する方法において、 (A)前記信号を復号化して逆量子化する復号化及び逆
量子化ステップと、 (B)前記信号と共に送出されてきたフィルタ適応制御
向け付随情報を復号化する復号化ステップと、 (C)前記逆量子化された信号を前記復号化された付随
情報によって制御される適応フィルタによって濾波する
濾波ステップとからなり前記適応フィルタは濾波済み出
力信号を生成し、マスク済み閾値を近似する振幅応答を
有していることを特徴とする復号化方法。 - 【請求項21】 前記(A)復号化及び逆量子化ステッ
プは、冗長性低減に適した変換すなわち合成フィルタバ
ンクを利用することを特徴とする請求項20記載の復号
化方法。 - 【請求項22】 前記方法は、さらに、 (D)変換すなわち合成フィルタバンクから得られたス
ペクトル成分を復号化及び逆量子化する復号化及び逆量
子化ステップを有しており、 前記(D)復号化及び逆量子化ステップは固定された量
子化器ステップサイズを利用することを特徴とする請求
項20記載の復号化方法。 - 【請求項23】 前記適応フィルタのフィルタ適応に係
るフィルタ次数及び間隔は、不関連性低減に適するよう
に選択されることを特徴とする請求項20記載の復号化
方法。 - 【請求項24】 前記フィルタ係数復号化段階は、格子
係数すなわち線スペクトル対からLPCフィルタ係数へ
の変換を含むことを特徴とする請求項20記載の復号化
方法。 - 【請求項25】 複数個のサブバンド信号を用いて送出
された信号を復号化する方法において、 (A)前記送出されたサブバンド信号を復号化して逆量
子化する復号化及び逆量子化ステップと、 (B)前記信号と共に送出されたフィルタ適応制御向け
付随情報を復号化する復号化ステップと、 (C)前記サブバンドをフィルタ入力信号に変換する変
換ステップと、 (D)前記復号化された付随情報にによって制御される
適応フィルタによってフィルタ入力信号を濾波するステ
ップ濾波とからなり、 前記適応フィルタはフィルタ出力信号を生成し、マスク
済み閾値を近似する振幅応答を有していることを特徴と
する復号化方法。 - 【請求項26】 前記(A)復号化及び逆量子化ステッ
プは、冗長性低減に適した変換すなわち合成フィルタバ
ンクを利用することを特徴とする請求項25記載の復号
化方法。 - 【請求項27】 前記方法は、さらに、 (E)変換すなわち合成フィルタバンクから得られたス
ペクトル成分を復号化及び逆量子化する復号化及び逆量
子化ステップを有しており、 前記(E)復号化及び逆量子化ステップは固定された量
子化器ステップサイズを利用することを特徴とする請求
項25記載の復号化方法。 - 【請求項28】 前記適応フィルタのフィルタ適応に係
るフィルタ次数及び間隔は、不関連性低減に適するよう
に選択されることを特徴とする請求項25記載の復号化
方法。 - 【請求項29】 前記フィルタ係数復号化段階は、格子
係数すなわち線スペクトル対からLPCフィルタ係数へ
の変換を含むことを特徴とする請求項25記載の復号化
方法。 - 【請求項30】 信号を符号化する符号化器において、 (A)音響心理モデルによって制御される適応フィルタ
と、 前記適応フィルタはフィルタ出力信号を生成し、マスク
済み閾値の逆を近似する振幅応答を有し、 (B)前記フィルタ出力信号をフィルタ適応制御向け付
随情報と共に量子化して符号化する量子化器及び符号化
器とを有することを特徴とする符号化器。 - 【請求項31】 信号を符号化する符号化器において、 (A)音響心理モデルによって制御される適応フィルタ
と、 前記適応フィルタはフィルタ出力信号を生成し、マスク
済み閾値の逆を近似する振幅応答を有し、 (B)前記フィルタ出力信号を変換する、冗長性低減に
適した複数個のサブバンドと、 (C)前記サブバンド信号をフィルタ適応制御向け付随
情報と共に量子化して符号化する量子化器及び符号化器
とを有することを特徴とする符号化器。 - 【請求項32】 信号を復号化する復号化器において、 (A)前記信号を復号化して逆量子化し、かつ、前記信
号と共に送出されたフィルタ適応制御向け付随情報を復
号化する復号化器及び逆量子化器と、 (B)前記復号化された付随情報によって制御される適
応フィルタとからなり、 前記適応フィルタはフィルタ出力信号を生成し、マスク
済み閾値を近似する振幅応答を有していることを特徴と
する復号化器。 - 【請求項33】 複数個のサブバンド信号を用いて送出
された信号を復号化する復号化器において、 (A)前記送信されたサブバンド信号を復号化して逆量
子化し、かつ、前記信号と共に送出されたフィルタ適応
制御向け付随情報を復号化する復号化器及び逆量子化器
と、 (B)前記サブバンドをフィルタ入力信号に変換する手
段と、 (C)前記復号化された付随情報によって制御される適
応フィルタとからなり、 前記適応フィルタはフィルタ出力信号を生成し、マスク
済み閾値を近似する振幅応答を有していることを特徴と
する復号化器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/586,072 US7110953B1 (en) | 2000-06-02 | 2000-06-02 | Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction |
US09/586072 | 2000-06-02 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002041097A true JP2002041097A (ja) | 2002-02-08 |
JP2002041097A5 JP2002041097A5 (ja) | 2005-05-26 |
JP4567238B2 JP4567238B2 (ja) | 2010-10-20 |
Family
ID=24344191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001166326A Expired - Fee Related JP4567238B2 (ja) | 2000-06-02 | 2001-06-01 | 符号化方法、復号化方法、符号化器、及び復号化器 |
Country Status (4)
Country | Link |
---|---|
US (2) | US7110953B1 (ja) |
EP (1) | EP1160770B2 (ja) |
JP (1) | JP4567238B2 (ja) |
DE (1) | DE60110679T3 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002103685A1 (fr) * | 2001-06-15 | 2002-12-27 | Sony Corporation | Appareil et procede de codage, appareil et procede de decodage et programme |
KR100433984B1 (ko) * | 2002-03-05 | 2004-06-04 | 한국전자통신연구원 | 디지털 오디오 부호화/복호화 장치 및 방법 |
JP2004264814A (ja) * | 2002-09-04 | 2004-09-24 | Microsoft Corp | 純可逆的音声圧縮における技術革新 |
JPWO2005036527A1 (ja) * | 2003-10-07 | 2006-12-21 | 松下電器産業株式会社 | スペクトル包絡線符号化のための時間境界及び周波数分解能の決定方法 |
WO2008016098A1 (fr) * | 2006-08-04 | 2008-02-07 | Panasonic Corporation | dispositif de codage audio stéréo, dispositif de décodage audio stéréo et procédé de ceux-ci |
JP2008129541A (ja) * | 2006-11-24 | 2008-06-05 | Fujitsu Ltd | 復号化装置および復号化方法 |
JP2009541802A (ja) * | 2006-06-30 | 2009-11-26 | フラウンホーファーゲゼルシャフト・ツア・フェルデルング・デア・アンゲバンテン・フォルシュング・エー・ファウ | 動的可変ワーピング特性を有するオーディオエンコーダ、オーディオデコーダ及びオーディオプロセッサ |
US8108221B2 (en) | 2002-09-04 | 2012-01-31 | Microsoft Corporation | Mixed lossless audio compression |
US8386271B2 (en) | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
US8682652B2 (en) | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4050578B2 (ja) * | 2002-09-04 | 2008-02-20 | 株式会社リコー | 画像処理装置及び画像処理方法 |
US7650277B2 (en) * | 2003-01-23 | 2010-01-19 | Ittiam Systems (P) Ltd. | System, method, and apparatus for fast quantization in perceptual audio coders |
DE102004007191B3 (de) | 2004-02-13 | 2005-09-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
DE102004007184B3 (de) | 2004-02-13 | 2005-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Quantisieren eines Informationssignals |
DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
EP1578134A1 (en) | 2004-03-18 | 2005-09-21 | STMicroelectronics S.r.l. | Methods and systems for encoding/decoding signals, and computer program product therefor |
DE602004008214D1 (de) | 2004-03-18 | 2007-09-27 | St Microelectronics Srl | Verfahren und Vorrichtungen zur Kodierung/Dekodierung von Signalen, sowie Computerprogrammprodukt dafür |
US7587254B2 (en) * | 2004-04-23 | 2009-09-08 | Nokia Corporation | Dynamic range control and equalization of digital audio using warped processing |
US7787541B2 (en) * | 2005-10-05 | 2010-08-31 | Texas Instruments Incorporated | Dynamic pre-filter control with subjective noise detector for video compression |
EP1840875A1 (en) * | 2006-03-31 | 2007-10-03 | Sony Deutschland Gmbh | Signal coding and decoding with pre- and post-processing |
DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8290167B2 (en) | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US9015051B2 (en) * | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
US8908873B2 (en) * | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US20090006081A1 (en) * | 2007-06-27 | 2009-01-01 | Samsung Electronics Co., Ltd. | Method, medium and apparatus for encoding and/or decoding signal |
KR101413967B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
KR101441896B1 (ko) * | 2008-01-29 | 2014-09-23 | 삼성전자주식회사 | 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 |
WO2010028299A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
WO2010028301A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Spectrum harmonic/noise sharpness control |
WO2010028297A1 (en) | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Selective bandwidth extension |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
JP2012516462A (ja) * | 2009-01-28 | 2012-07-19 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオエンコーダ、オーディオデコーダ、符号化されたオーディオ情報、オーディオ信号を符号化および復号化する方法およびコンピュータ・プログラム |
US20100241423A1 (en) * | 2009-03-18 | 2010-09-23 | Stanley Wayne Jackson | System and method for frequency to phase balancing for timbre-accurate low bit rate audio encoding |
EP2525354B1 (en) * | 2010-01-13 | 2015-04-22 | Panasonic Intellectual Property Corporation of America | Encoding device and encoding method |
US8958510B1 (en) * | 2010-06-10 | 2015-02-17 | Fredric J. Harris | Selectable bandwidth filter |
US8532985B2 (en) | 2010-12-03 | 2013-09-10 | Microsoft Coporation | Warped spectral and fine estimate audio encoding |
US8781023B2 (en) * | 2011-11-01 | 2014-07-15 | At&T Intellectual Property I, L.P. | Method and apparatus for improving transmission of data on a bandwidth expanded channel |
US8774308B2 (en) | 2011-11-01 | 2014-07-08 | At&T Intellectual Property I, L.P. | Method and apparatus for improving transmission of data on a bandwidth mismatched channel |
US8831935B2 (en) * | 2012-06-20 | 2014-09-09 | Broadcom Corporation | Noise feedback coding for delta modulation and other codecs |
US9711156B2 (en) | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
CN105144288B (zh) * | 2013-04-05 | 2019-12-27 | 杜比国际公司 | 高级量化器 |
US9384746B2 (en) | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
CN113380270B (zh) * | 2021-05-07 | 2024-03-29 | 普联国际有限公司 | 一种音频音源分离方法、装置、存储介质及电子设备 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BE1000643A5 (fr) * | 1987-06-05 | 1989-02-28 | Belge Etat | Procede de codage de signaux d'image. |
US5341457A (en) * | 1988-12-30 | 1994-08-23 | At&T Bell Laboratories | Perceptual coding of audio signals |
EP0469835B1 (en) * | 1990-07-31 | 1998-09-30 | Canon Kabushiki Kaisha | Image processing apparatus and method |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
EP0559348A3 (en) * | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
US5623577A (en) * | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
CN1111959C (zh) * | 1993-11-09 | 2003-06-18 | 索尼公司 | 量化装置、量化方法、高效率编码装置、高效率编码方法、解码装置和高效率解码装置 |
US20010047256A1 (en) * | 1993-12-07 | 2001-11-29 | Katsuaki Tsurushima | Multi-format recording medium |
JP3024468B2 (ja) * | 1993-12-10 | 2000-03-21 | 日本電気株式会社 | 音声復号装置 |
CA2206129C (en) * | 1994-12-20 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for applying waveform prediction to subbands of a perceptual coding system |
JPH09101799A (ja) * | 1995-10-04 | 1997-04-15 | Sony Corp | 信号符号化方法及び装置 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5687191A (en) * | 1995-12-06 | 1997-11-11 | Solana Technology Development Corporation | Post-compression hidden data transport |
US6029126A (en) † | 1998-06-30 | 2000-02-22 | Microsoft Corporation | Scalable audio coder and decoder |
-
2000
- 2000-06-02 US US09/586,072 patent/US7110953B1/en not_active Expired - Lifetime
-
2001
- 2001-05-22 DE DE60110679.2T patent/DE60110679T3/de not_active Expired - Lifetime
- 2001-05-22 EP EP01304496.1A patent/EP1160770B2/en not_active Expired - Lifetime
- 2001-06-01 JP JP2001166326A patent/JP4567238B2/ja not_active Expired - Fee Related
-
2006
- 2006-02-15 US US11/355,296 patent/US20060147124A1/en not_active Abandoned
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7212973B2 (en) | 2001-06-15 | 2007-05-01 | Sony Corporation | Encoding method, encoding apparatus, decoding method, decoding apparatus and program |
WO2002103685A1 (fr) * | 2001-06-15 | 2002-12-27 | Sony Corporation | Appareil et procede de codage, appareil et procede de decodage et programme |
KR100433984B1 (ko) * | 2002-03-05 | 2004-06-04 | 한국전자통신연구원 | 디지털 오디오 부호화/복호화 장치 및 방법 |
JP4521170B2 (ja) * | 2002-09-04 | 2010-08-11 | マイクロソフト コーポレーション | 純可逆的音声圧縮における技術革新 |
JP2004264814A (ja) * | 2002-09-04 | 2004-09-24 | Microsoft Corp | 純可逆的音声圧縮における技術革新 |
US8630861B2 (en) | 2002-09-04 | 2014-01-14 | Microsoft Corporation | Mixed lossless audio compression |
US8108221B2 (en) | 2002-09-04 | 2012-01-31 | Microsoft Corporation | Mixed lossless audio compression |
JP4767687B2 (ja) * | 2003-10-07 | 2011-09-07 | パナソニック株式会社 | スペクトル包絡線符号化のための時間境界及び周波数分解能の決定方法 |
JPWO2005036527A1 (ja) * | 2003-10-07 | 2006-12-21 | 松下電器産業株式会社 | スペクトル包絡線符号化のための時間境界及び周波数分解能の決定方法 |
JP2009541802A (ja) * | 2006-06-30 | 2009-11-26 | フラウンホーファーゲゼルシャフト・ツア・フェルデルング・デア・アンゲバンテン・フォルシュング・エー・ファウ | 動的可変ワーピング特性を有するオーディオエンコーダ、オーディオデコーダ及びオーディオプロセッサ |
US8682652B2 (en) | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
WO2008016098A1 (fr) * | 2006-08-04 | 2008-02-07 | Panasonic Corporation | dispositif de codage audio stéréo, dispositif de décodage audio stéréo et procédé de ceux-ci |
JP2008129541A (ja) * | 2006-11-24 | 2008-06-05 | Fujitsu Ltd | 復号化装置および復号化方法 |
US8249882B2 (en) | 2006-11-24 | 2012-08-21 | Fujitsu Limited | Decoding apparatus and decoding method |
US8386271B2 (en) | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
Also Published As
Publication number | Publication date |
---|---|
EP1160770B1 (en) | 2005-05-11 |
US20060147124A1 (en) | 2006-07-06 |
EP1160770B2 (en) | 2018-04-11 |
US7110953B1 (en) | 2006-09-19 |
DE60110679T3 (de) | 2018-09-20 |
EP1160770A3 (en) | 2003-05-02 |
DE60110679D1 (de) | 2005-06-16 |
DE60110679T2 (de) | 2006-04-27 |
JP4567238B2 (ja) | 2010-10-20 |
EP1160770A2 (en) | 2001-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4567238B2 (ja) | 符号化方法、復号化方法、符号化器、及び復号化器 | |
JP3391686B2 (ja) | 符号化されたオーディオ信号を復号する方法及び装置 | |
JP4934427B2 (ja) | 音声信号復号化装置及び音声信号符号化装置 | |
JP3592473B2 (ja) | 周波数領域内のlpc予測による時間領域内での知覚ノイズ整形 | |
JP5048697B2 (ja) | 符号化装置、復号化装置、符号化方法、復号化方法、プログラムおよび記録媒体 | |
JP3577324B2 (ja) | オーディオ信号の符号化方法 | |
EP2041745B1 (en) | Adaptive encoding and decoding methods and apparatuses | |
Edler et al. | Audio coding using a psychoacoustic pre-and post-filter | |
KR100421160B1 (ko) | 낮은비트율의코딩을위한적응필터및필터링방법 | |
US20090204397A1 (en) | Linear predictive coding of an audio signal | |
JP2009536364A (ja) | 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置 | |
JP2002330075A (ja) | サブバンドadpcm符号化方法、復号方法、サブバンドadpcm符号化装置、復号装置およびワイヤレスマイクロホン送信システム、受信システム | |
JP2002041099A (ja) | マスク済み閾値表現方法、再構成方法、及びそのシステム | |
EP0772185A2 (en) | Speech decoding method and apparatus | |
JP4281131B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
US6678647B1 (en) | Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution | |
JPH04249300A (ja) | 音声符復号化方法及びその装置 | |
JPH0736484A (ja) | 音響信号符号化装置 | |
JPH0437999B2 (ja) | ||
Bhaskar | Adaptive predictive coding with transform domain quantization using block size adaptation and high-resolution spectral modeling | |
JPH0426119B2 (ja) | ||
Ning et al. | Wideband audio compression using a combined wavelet and WLPC representation | |
Herre et al. | 18. Perceptual Perceptual Audio Coding of Speech Signals | |
JPH0537393A (ja) | 音声符号化装置 | |
JPH0632031B2 (ja) | 音声符号化方法とその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040803 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040803 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070131 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070425 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080825 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100805 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130813 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |