JP6543640B2 - エンコーダ、デコーダ並びに符号化及び復号方法 - Google Patents
エンコーダ、デコーダ並びに符号化及び復号方法 Download PDFInfo
- Publication number
- JP6543640B2 JP6543640B2 JP2016557212A JP2016557212A JP6543640B2 JP 6543640 B2 JP6543640 B2 JP 6543640B2 JP 2016557212 A JP2016557212 A JP 2016557212A JP 2016557212 A JP2016557212 A JP 2016557212A JP 6543640 B2 JP6543640 B2 JP 6543640B2
- Authority
- JP
- Japan
- Prior art keywords
- residual signal
- matrix
- signal
- lpc
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 101
- 239000011159 matrix material Substances 0.000 claims description 129
- 230000005236 sound signal Effects 0.000 claims description 87
- 238000013139 quantization Methods 0.000 claims description 63
- 238000004422 calculation algorithm Methods 0.000 claims description 48
- 230000015572 biosynthetic process Effects 0.000 claims description 41
- 238000003786 synthesis reaction Methods 0.000 claims description 41
- 230000009466 transformation Effects 0.000 claims description 27
- 238000000354 decomposition reaction Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 18
- 230000003595 spectral effect Effects 0.000 claims description 17
- 230000007774 longterm Effects 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000002347 injection Methods 0.000 claims description 2
- 239000007924 injection Substances 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 58
- 238000013459 approach Methods 0.000 description 18
- 230000000875 corresponding effect Effects 0.000 description 13
- 239000000243 solution Substances 0.000 description 10
- 239000013598 vector Substances 0.000 description 9
- 238000005457 optimization Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000008198 composition by function Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000009828 non-uniform distribution Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012732 spatial analysis Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
を得ることができる。この変換は、先に論じたように、最適化問題であり、目的関数
が使用される。この場合は、この目的関数が、ACELPエンコーダ内で使用される目的関数等の、異なる符号化方法又は復号方法に使用される目的関数と比較すると複雑性がより低減されることが効果的である。
参照)へ結合される。2つのデータストリームDSLPC/DSDV及び
は、出力されるべきデータストリームDSを形成する。
を得るように構成されている。この量子化された変換残余信号
は、データストリームの一部
として出力される。データストリームDS全体は、DSLPC/DSDVと称するLPC部分、及び
と称する
部分を備えていることに留意されたい。
に関して実行されてもよい。この目的関数は、ACELPエンコーダの典型的な目的関数と比較すると複雑性が低減されており、その結果、符号化のパフォーマンスが効果的に向上する。このパフォーマンスの向上は、より高い分解能を有するオーディオ信号ASを符号化するために、又は必要なリソースを減らすために使用することができる。
は、符号化された信号であってもよく、符号化は、量子化及び符号化ステージ18によって実行されることは留意されるべきである。したがって、さらなる実施形態によれば、量子化及び符号化ステージ18は、算術符号化するように構成され得るエンコーダを備えていてもよい。量子化及び符号化ステージ18のエンコーダは、線形量子化ステップ(即ち、等距離)を用いても、対数等の可変量子化ステップを用いてもよい。あるいは、エンコーダは、別の(ロスレス)エントロピー符号化を実行するように構成されてもよく、コード長さは、特異入力信号ASの確率の関数として変化する。したがって、最適なコード長さを得るためには、入力信号の確率を、合成包絡線を基礎として、延てはLPC係数を基礎として検出することが1つの代替オプションであり得る。したがって、量子化符号化ステージは、LPCチャネル用の入力も有してもよい。
の複雑性低減を可能にする背景について論じる。先に述べたように、向上した符号化は、ファクトライザ14によって実行される行列因数分解のステップ140を基礎とする。ファクトライザ14は、行列、例えば線形予測係数LPC(LPCチャネル参照)により定義されるフィルタ合成関数Hの自己相関行列R又は共分散行列C、を因数分解する。この因数分解の結果、2つの因数分解された行列、例えば、特異LPC係数を含む原行列Hを表すバンデルモンド行列V及び対角行列Dが得られる。これに起因して、残余信号xのサンプルが脱相関される。よって、変換残余信号の直接量子化(ステップ180参照)が最適な量子化であって、これにより、計算複雑性は、ビットレートとはほぼ無関係ということになる。これに比較すると、ACELPコードブックを最適化する従来手法は、計算複雑性と、特に高いビットレートにおける精度とを均衡させなければならない。したがって、背景に関しては、実際には、従来のACELP手順から論じていく。
ここで、xは、標的残余であり、
は、量子化された残余であり、Hは、重み付け合成フィルタに対応するコンボリューション行列であり、かつγは、スケール利得係数である。最適な量子化
を求めるために、標準的な手法は、η(x,y)の導関数のゼロにおける、γ*で示されるγの最適値を求める。方程式(1)に、最適なγ*を代入すると、次式のような新たな目的関数が得られる。
ここで、H*は、関数Hによる合成の、変換された共役バージョンである。
R=V*DV (3)
ここで、V*は、変換共役バージョンのバンデルモンド行列Vである。共分散行列Cを用いる従来手法では、特異値分解C=USV等の他の因数分解を適用することができる。
であり、Dは、狭義正の成分を有する対角行列である。分解は、複雑性がO(N3)である任意の精度で計算することができる。直接分解は、典型的には、
の計算複雑性を有するが、ここでは、これを
まで減らすことができ、あるいは、近似因数分解で足りる場合、複雑性をO(N log N)まで減らすことができる。選択される分解に関しては、
y=D1/2Vx及び
のように定義してもよい。ここで、x=V-1D-1/2 yであり、式(2)への代入によって次式を得ることができる。
又は符号化された量子化変換残余信号
は、復号ステージ22へ提供される(
参照)。合成ステージ28は、デコーダ20の出力に配置され、オーディオ信号ASに類似するが全く同じではないオーディオ信号AS’を出力するように構成されている。
で参照される部分は、オーディオ信号AS’の詳細部分の合成を可能にする。第1のステップ220において、復号ステージ22は、入ってきた信号
を復号し、変換残余信号yを再トランスフォーマ26(ステップ260参照)へ出力する。
とDSLPCではなく、
と行列V及びD(即ち、DSDV)を備えていることを意味する。
、を共通のパケットDSにパケット化するように構成されるパッカを備えてもよい。逆もまた同様に、デコーダ20は、データストリームDSを2つのパック、DSLPC/DSDV及び
、に分割するように構成されるデパケッタイザを備えてもよい。
で計算することから、デジタル信号処理の最も重要なツールの1つとなっている。
の窓を使用する。実践により、離散フーリエ変換のパフォーマンスは、この場合不十分であることが分かっており、したがって、主流の音声コーデックのほとんどは、時間領域符号化を用いている。
T=V*ΛV (3z)
のように因数分解することができる。ここで、Λは、実数かつ狭義正の成分λkk>0を有する対角行列であり、指数級数Vは、全て単位円上にあって、νk=exp(iβk)である。この形式は、テプリッツ行列のカラテオドリのパラメータ化としても知られる。
yd=V-*x (4z)
但し、V-*はVの逆エルミート、を適用すれば、ydの自己相関行列は、次式のようになる。
x=V*yd (6z)
したがって、畳み込み領域又は変換領域における信号エネルギーを同等に評価することができ、
である。明らかに、逆変換は、次式の通りである。
x=V-1Λ-1/2yv (9z)
を明示的に評価する必要のないアルゴリズムを示す。即ち、y=Vxであり、かつxの要素がξkであれば、yの要素ηkは、次の再帰を用いて決定することができる。
値が大きければ数値的に不安定になる。したがって、経験的に、
のサイズが64までの行列による計算は、場合によって可能であるが、これを超えると、これらのアルゴリズムは、数値的不安定によって役に立たなくなる。実用解は、軸選択形ガウス消去に等しい、根vkのLejaによる順序付けである。Lejaによる順序付けの背後にある主たる考案は、根を、根vkとその前の根0...(k−1)との距離が最大化されるようにして再配列する、というものである。このような再配置により、アルゴリズムに現出する分母が最大化され、かつ中間変数の値が最小化され、よって、切り捨て誤差による寄与分も最小化される。Lejaによる順序付けの実装は単純であって、複雑性O(N2)及び記憶O(N)で達成することができる。
Ra=[1 1...1]T (11z)
を解くことにより求めることができる。ここで、aは、要素αkを有する。よって、v0=1であり、かつ残りの根v1...vNは、多項式
の根である。これが、ハンケル系、
の解法に等しいことは、容易に証明することができる。ここで、
である。よって、根vkは、
の根となる。
の根に一致する三重対角行列を返す。次には、O(N2)においてLRアルゴリズムを適用することにより、又は、O(N3)において標準非対称QRアルゴリズムによって、固有値を求めることができる。こうして求める根は、近似値であり、よって、単位円から僅かに外れる場合もある。よって、根の絶対値を1に正規化し、かつニュートン法による2又は3回の反復によって精緻化することが有益である。完全プロセスは、O(N2)の計算コストを有する。
Re=V*ΛVe=V*λ (13z)
を観察されたい。ここで、e=[1 0...0]Tであり、λは、Λの対角値を含むベクトルである。言い替えれば、
λ=V-*(Re) (14z)
を計算することにより、対角値λkkを求める。この逆は、先に論じた方法で計算することができ、よって、対角値は、複雑性O(N2)で得られる。
を定義することができ、これにより、対角化を次式によって評価することができる。
Claims (22)
- オーディオ信号(AS)をデータストリーム(DS)に符号化するためのエンコーダ(10)であって、
前記オーディオ信号(AS)のスペクトル包絡線又は前記オーディオ信号(AS)の基本周波数を記述する予測係数(LPC)を得るために前記オーディオ信号(AS)を分析し、かつ前記オーディオ信号(AS)の残余信号(x)を出力するために前記予測係数(LPC)に依存して前記オーディオ信号(AS)を分析フィルタ関数(H)にかけるように構成された線形予測子(12)と、
因数分解された行列(V、D)を得るために、前記予測係数(LPC)により定義される合成フィルタ関数(H)の自己相関又は共分散行列(R、C)上へ行列因数分解を適用するように構成されたファクトライザ(14)と、
変換された残余信号(y)を得るために、前記残余信号(x)を、前記因数分解された行列(V、D)を基礎として変換するように構成されたトランスフォーマ(16)と、
量子化された変換残余信号
を得るために、前記変換された残余信号(y)を量子化するように構成されているとともに、符号化された量子化変換残余信号
を得るために、前記予測係数(LPC)のための入力を有し、前記予測係数(LPC)に基づく確率を検出しながら前記量子化変換残余信号
をエントロピー符号化するように構成されている量子化及び符号化ステージ(18)と、を備えているエンコーダ(10)。 - 前記合成フィルタ関数(H)は、前記合成フィルタ関数(H)の重み付け値を有する行列(H)によって定義される請求項1に記載のエンコーダ(10)。
- 前記ファクトライザ(14)は、前記自己相関又は共分散行列(R、C)を、変換共役バージョンの前記合成フィルタ関数(H*)と正規バージョンの前記合成フィルタ関数(H)との積を基礎として計算する、請求項1又は2に記載のエンコーダ(10)。
- 前記ファクトライザ(14)は、前記自己相関又は共分散行列(R、C)を、公式C=V*DVを基礎として、又は公式R=V*DVを基礎として因数分解し、
Vはバンデルモンド行列であり、V*は変換共役バージョンの前記バンデルモンド行列であり、Dは狭義正の成分を有する対角行列である請求項1から3のいずれか一項に記載のエンコーダ(10)。 - 前記ファクトライザ(14)は、バンデルモンド因数分解を実行するように構成されている請求項4に記載のエンコーダ(10)。
- 前記ファクトライザ(14)は、固有値分解及び/又はコレスキー因数分解を実行するように構成されている請求項1から5のいずれか一項に記載のエンコーダ(10)。
- 前記トランスフォーマ(16)は、前記残余信号(x)を、公式y=D1/2Vxを基礎として、又は公式y=DVxを基礎として変換する請求項4又は5に記載のエンコーダ(10)。
- 前記残余信号(x)の前記変換は、前記残余信号(x)の時間領域から前記変換残余信号(y)の周波数様領域への変換である請求項1から9のいずれか一項に記載のエンコーダ(10)。
- 前記コーダにより実行される前記符号化は、算術コーディングを含むグループから実行される請求項11に記載のエンコーダ(10)。
- 前記予測子(12)は、線形予測子及び/又は長期予測子を含む請求項1から13のいずれか一項に記載のエンコーダ(10)。
- オーディオ信号(AS)をデータストリーム(DS)に符号化するための方法(100)であって、
前記オーディオ信号(AS)の前記スペクトル包絡線又は前記オーディオ信号(AS)の基本周波数を記述する予測係数(LPC)を得るために前記オーディオ信号(AS)を分析し、かつ前記オーディオ信号(AS)の残余信号(x)を出力するために前記予測係数(LPC)に依存して前記オーディオ信号(AS)を分析フィルタ関数(H)にかけるステップ(120)と、
因数分解された行列(V、D)を得るために、前記予測係数(LPC)により定義される合成フィルタ関数(H)の自己相関又は共分散行列(R、C)上へ行列因数分解を適用するステップ(140)と、
変換された残余信号(y)を得るために、前記残余信号(x)を、前記因数分解された行列(V、D)を基礎として変換するステップ(160)と、
量子化された変換残余信号
を得るために、前記変換された残余信号(y)を量子化しかつ符号化するとともに、符号化された量子化変換残余信号
を得るために、前記予測係数(LPC)に基づく確率を検出しながら前記予測信号を用いて前記量子化変換残余信号をエントロピー符号化するステップ(180)と、を含む方法(100)。 - 離散フーリエ変換、離散コサイン変換、修正離散コサイン変換又は信号処理アルゴリズムにおける別の変換に代える請求項15に記載の方法(100)の使用。
- データストリーム(DS)をオーディオ信号(AS’)に復号するためのデコーダ(20)であって、
前記オーディオ信号(AS)のスペクトル包絡線又は前記オーディオ信号(AS)の基本周波数を記述する予測係数(LPC)に基づく確率を検出しながら、エントロピー復号化を用いて、入ってきた符号化された量子化変換残余信号
を基礎として、変換残余信号(y)を出力するように構成された復号ステージ(22)と、
前記予測係数(LPC)により定義される合成フィルタ関数(H)の自己相関又は共分散行列(R、C)の行列因数分解の結果を表す因数分解された行列(V、D)を基礎として、前記変換残余信号(y)から残余信号(x)を再変換するように構成された再トランスフォーマ(26)と、
前記オーディオ信号(AS’)を、前記残余信号(x)を基礎とし、前記予測係数(LPC)により定義される前記合成フィルタ関数(H)を用いて合成するように構成された合成ステージ(28)と、を備えているデコーダ(20)。 - 前記デコーダ(20)は、因数分解された行列(V、D)を得るために、入ってきた(inbound)予測係数(LPC)により定義される前記合成フィルタ関数(H)の前記自己相関又は共分散行列(R、C)上に前記行列因数分解を適用するように構成されているファクトライザ(24)を備えている請求項17に記載のデコーダ(20)。
- 前記デコーダ(20)は、入ってきた因数分解された行列(V、D)を基礎として、前記予測係数(LPC)を逸脱させる(deviate)ように構成される予測係数生成器を備えている請求項17に記載のデコーダ(20)。
- 前記復号ステージ(22)は、入ってきたコーディング規則及び/又はコーディングパラメータから逸脱される既知の規則及び/又は符号化パラメータを基礎として、前記復号を実行する請求項17から19のいずれか一項に記載のデコーダ(20)。
- データストリーム(DS)をオーディオ信号(AS’)に復号するための方法(200)であって、
前記オーディオ信号(AS)のスペクトル包絡線又は前記オーディオ信号(AS)の基本周波数を記述する予測係数(LPC)に基づく確率を検出しながら、エントロピー復号化を用いて、入ってきた符号化された量子化変換残余信号
を基礎として、変換残余信号(y)を出力するステップ(220)と、
予測係数(LPC)により定義される合成フィルタ関数(H)の自己相関又は共分散行列(R、C)上に行列因数分解を適用するとともに、因数分解された行列(V、D)を得るために、前記オーディオ信号(AS)のスペクトル包絡線又は前記オーディオ信号(AS)の基本周波数を記述するステップ(240)と、
前記因数分解された行列(V、D)を基礎として、前記再変換された残余信号(y)から残余信号(x)を再変換するステップ(260)と、
前記オーディオ信号(AS’)を、前記残余信号(x)を基礎とし、前記予測係数(LPC)により定義される前記合成フィルタ関数(H)を用いて合成するステップ(280)と、を含む方法(200)。 - コンピュータ上で実行されると、請求項15に記載の方法(100、200)又は請求項21に記載の方法を実行するためのプログラムコードを有するコンピュータプログラムを格納しているコンピュータ読取り可能デジタル記憶媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14159811.0 | 2014-03-14 | ||
EP14159811 | 2014-03-14 | ||
EP14182047.2 | 2014-08-22 | ||
EP14182047.2A EP2919232A1 (en) | 2014-03-14 | 2014-08-22 | Encoder, decoder and method for encoding and decoding |
PCT/EP2015/054396 WO2015135797A1 (en) | 2014-03-14 | 2015-03-03 | Encoder, decoder and method for encoding and decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017516125A JP2017516125A (ja) | 2017-06-15 |
JP6543640B2 true JP6543640B2 (ja) | 2019-07-10 |
Family
ID=50280219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016557212A Active JP6543640B2 (ja) | 2014-03-14 | 2015-03-03 | エンコーダ、デコーダ並びに符号化及び復号方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US10586548B2 (ja) |
EP (2) | EP2919232A1 (ja) |
JP (1) | JP6543640B2 (ja) |
KR (1) | KR101885193B1 (ja) |
CN (1) | CN106415716B (ja) |
BR (1) | BR112016020841B1 (ja) |
CA (1) | CA2942586C (ja) |
MX (1) | MX363348B (ja) |
RU (1) | RU2662407C2 (ja) |
WO (1) | WO2015135797A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX347921B (es) * | 2012-10-05 | 2017-05-17 | Fraunhofer Ges Forschung | Un aparato para la codificacion de una señal de voz que emplea prediccion lineal excitada por codigos algebraico en el dominio de autocorrelacion. |
US10860683B2 (en) | 2012-10-25 | 2020-12-08 | The Research Foundation For The State University Of New York | Pattern change discovery between high dimensional data sets |
EP3185587B1 (en) | 2015-12-23 | 2019-04-24 | GN Hearing A/S | Hearing device with suppression of sound impulses |
US10236989B2 (en) * | 2016-10-10 | 2019-03-19 | Nec Corporation | Data transport using pairwise optimized multi-dimensional constellation with clustering |
EP3610481B1 (en) * | 2017-04-10 | 2022-03-16 | Nokia Technologies Oy | Audio coding |
WO2018201113A1 (en) * | 2017-04-28 | 2018-11-01 | Dts, Inc. | Audio coder window and transform implementations |
GB201718341D0 (en) * | 2017-11-06 | 2017-12-20 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
CN107947903A (zh) * | 2017-12-06 | 2018-04-20 | 南京理工大学 | 基于飞行自组网的wvefc快速编码方法 |
US11532316B2 (en) * | 2017-12-19 | 2022-12-20 | Dolby International Ab | Methods and apparatus systems for unified speech and audio decoding improvements |
CN110324622B (zh) * | 2018-03-28 | 2022-09-23 | 腾讯科技(深圳)有限公司 | 一种视频编码码率控制方法、装置、设备及存储介质 |
CN109036452A (zh) * | 2018-09-05 | 2018-12-18 | 北京邮电大学 | 一种语音信息处理方法、装置、电子设备及存储介质 |
CN113168838A (zh) | 2018-11-02 | 2021-07-23 | 杜比国际公司 | 音频编码器及音频解码器 |
US11764940B2 (en) | 2019-01-10 | 2023-09-19 | Duality Technologies, Inc. | Secure search of secret data in a semi-trusted environment using homomorphic encryption |
US20220159250A1 (en) * | 2019-03-20 | 2022-05-19 | V-Nova International Limited | Residual filtering in signal enhancement coding |
CN110840452B (zh) * | 2019-12-10 | 2024-08-27 | 广西师范大学 | 一种脑电波信号的滤波装置及方法 |
CN112289327B (zh) * | 2020-10-29 | 2024-06-14 | 北京百瑞互联技术股份有限公司 | 一种lc3音频编码器后置残差优化方法、装置和介质 |
CN114913863B (zh) * | 2021-02-09 | 2024-10-18 | 同响科技股份有限公司 | 数字音信数据编码方法 |
CN113406385B (zh) * | 2021-06-17 | 2022-01-21 | 哈尔滨工业大学 | 一种基于时域空间的周期信号基频确定方法 |
CN116309446B (zh) * | 2023-03-14 | 2024-05-07 | 浙江固驰电子有限公司 | 用于工业控制领域的功率模块制造方法及系统 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US5293448A (en) * | 1989-10-02 | 1994-03-08 | Nippon Telegraph And Telephone Corporation | Speech analysis-synthesis method and apparatus therefor |
FR2729245B1 (fr) * | 1995-01-06 | 1997-04-11 | Lamblin Claude | Procede de codage de parole a prediction lineaire et excitation par codes algebriques |
JP3246715B2 (ja) * | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
GB9915842D0 (en) * | 1999-07-06 | 1999-09-08 | Btg Int Ltd | Methods and apparatus for analysing a signal |
JP4506039B2 (ja) * | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
US7065486B1 (en) * | 2002-04-11 | 2006-06-20 | Mindspeed Technologies, Inc. | Linear prediction based noise suppression |
US7292647B1 (en) * | 2002-04-22 | 2007-11-06 | Regents Of The University Of Minnesota | Wireless communication system having linear encoder |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
FR2863422A1 (fr) * | 2003-12-04 | 2005-06-10 | France Telecom | Procede d'emission multi-antennes d'un signal precode lineairement,procede de reception, signal et dispositifs correspondants |
JP4480135B2 (ja) * | 2004-03-29 | 2010-06-16 | 株式会社コルグ | オーディオ信号圧縮方法 |
US7742536B2 (en) * | 2004-11-09 | 2010-06-22 | Eth Zurich Eth Transfer | Method for calculating functions of the channel matrices in linear MIMO-OFDM data transmission |
EP1818911B1 (en) * | 2004-12-27 | 2012-02-08 | Panasonic Corporation | Sound coding device and sound coding method |
CN101743586B (zh) * | 2007-06-11 | 2012-10-17 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、编码方法、解码器、解码方法 |
CN101609680B (zh) | 2009-06-01 | 2012-01-04 | 华为技术有限公司 | 压缩编码和解码的方法、编码器和解码器以及编码装置 |
US9536534B2 (en) * | 2011-04-20 | 2017-01-03 | Panasonic Intellectual Property Corporation Of America | Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof |
US9173025B2 (en) * | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
CA2877161C (en) * | 2012-06-28 | 2020-01-21 | Tom Backstrom | Linear prediction based audio coding using improved probability distribution estimation |
MX347921B (es) * | 2012-10-05 | 2017-05-17 | Fraunhofer Ges Forschung | Un aparato para la codificacion de una señal de voz que emplea prediccion lineal excitada por codigos algebraico en el dominio de autocorrelacion. |
-
2014
- 2014-08-22 EP EP14182047.2A patent/EP2919232A1/en not_active Withdrawn
-
2015
- 2015-03-03 WO PCT/EP2015/054396 patent/WO2015135797A1/en active Application Filing
- 2015-03-03 CA CA2942586A patent/CA2942586C/en active Active
- 2015-03-03 MX MX2016011692A patent/MX363348B/es unknown
- 2015-03-03 RU RU2016140233A patent/RU2662407C2/ru active
- 2015-03-03 EP EP15707636.5A patent/EP3117430A1/en not_active Withdrawn
- 2015-03-03 JP JP2016557212A patent/JP6543640B2/ja active Active
- 2015-03-03 CN CN201580014310.1A patent/CN106415716B/zh active Active
- 2015-03-03 BR BR112016020841-2A patent/BR112016020841B1/pt active IP Right Grant
- 2015-03-03 KR KR1020167025084A patent/KR101885193B1/ko active IP Right Grant
-
2016
- 2016-09-06 US US15/256,996 patent/US10586548B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
RU2016140233A (ru) | 2018-04-16 |
CA2942586A1 (en) | 2015-09-17 |
EP3117430A1 (en) | 2017-01-18 |
WO2015135797A1 (en) | 2015-09-17 |
US10586548B2 (en) | 2020-03-10 |
KR101885193B1 (ko) | 2018-08-03 |
MX2016011692A (es) | 2017-01-06 |
BR112016020841B1 (pt) | 2023-02-23 |
CA2942586C (en) | 2021-11-09 |
KR20160122212A (ko) | 2016-10-21 |
MX363348B (es) | 2019-03-20 |
JP2017516125A (ja) | 2017-06-15 |
RU2662407C2 (ru) | 2018-07-25 |
BR112016020841A2 (ja) | 2017-08-15 |
US20160372128A1 (en) | 2016-12-22 |
CN106415716A (zh) | 2017-02-15 |
EP2919232A1 (en) | 2015-09-16 |
CN106415716B (zh) | 2020-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6543640B2 (ja) | エンコーダ、デコーダ並びに符号化及び復号方法 | |
US12002481B2 (en) | Apparatus for encoding a speech signal employing ACELP in the autocorrelation domain | |
CN106068534B (zh) | 用于信息编码的概念 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171006 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171024 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181002 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20181219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190528 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190617 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6543640 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |