JP2005316130A - 音声符号化装置および音声符号化方法 - Google Patents
音声符号化装置および音声符号化方法 Download PDFInfo
- Publication number
- JP2005316130A JP2005316130A JP2004133956A JP2004133956A JP2005316130A JP 2005316130 A JP2005316130 A JP 2005316130A JP 2004133956 A JP2004133956 A JP 2004133956A JP 2004133956 A JP2004133956 A JP 2004133956A JP 2005316130 A JP2005316130 A JP 2005316130A
- Authority
- JP
- Japan
- Prior art keywords
- adaptive
- signal
- value
- prediction
- prediction error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】 この発明は、ADPCM方式の音声符号化装置における適用予測器の演算量を低減でき、かつ量子化誤差も従来の簡略手法に比べて低下させることができる音声符号化装置を提供することを目的とする。
【解決手段】 適応予測器を備えているADPCM方式の音声符号化装置において、適応予測器が全極型モデルで構成されており、適応予測器は全極型モデルの係数を学習同定法に基づいて求める係数更新手段を備えていることを特徴とする。
【選択図】 図1
【解決手段】 適応予測器を備えているADPCM方式の音声符号化装置において、適応予測器が全極型モデルで構成されており、適応予測器は全極型モデルの係数を学習同定法に基づいて求める係数更新手段を備えていることを特徴とする。
【選択図】 図1
Description
この発明は、音声符号化装置および音声符号化方法に関し、特に適応差分パルス符号変調(ADPCM:Adaptive Differential Pulse Code Modulation)方式の音声符号化装置および音声符号化方法の改良に関する。
音声の波形は統計的に強い相関をもっているので、その符号化にはその性質をうまく利用する方が効率がよい。その代表的な方法に適応差分パルス符号変調(ADPCM) 方式がある。
ADPCM方式の適応予測のために線形予測を用い、予測信号ye (n)を、次式(1)に基づいて求める方法が知られている。
ye (n)=a1 ・x(n−1)+a2 ・x(n−2)+…+aP ・x(n−P)
−b1 ・y(n−1)+b2 ・y(n−2)+…+bP ・y(n−P)
…(1)
−b1 ・y(n−1)+b2 ・y(n−2)+…+bP ・y(n−P)
…(1)
上記式(1)において、ai 、bi は線形予測係数を表し、x(n−i)は過去の入力信号を表し、y(n−i)は過去の出力信号を示している。
しかしながら、線形予測係数ai ,bi を求めるためには多くの演算が必要であり、適応予測器を回路で構成する場合には規模が大きくなるという問題がある。
そこで、ai =0,b1 =−1,b2 〜bP =0(P≠1)とし、演算を簡略する方法(簡略手法)もあるが、この簡略手法では、規格化周波数が高い信号に対して量子化誤差が増大するという問題がある。
特許公報第3143406号
この発明は、適用予測器の演算量を低減でき、かつ量子化誤差も従来の簡略手法に比べて低下させることができる音声符号化装置および音声符号化方法を提供することを目的とする。
この発明による音声符号化装置は、適応予測器を備えているADPCM方式の音声符号化装置において、適応予測器が全極型モデルで構成されており、適応予測器は全極型モデルの係数を学習同定法に基づいて求める係数更新手段を備えていることを特徴とする。
この発明による音声符号化方法は、適応予測器を備えているADPCM方式の音声符号化方法において、適応予測器として全極型モデルを用い、かつ全極型モデルの係数を学習同定法に基づいて求めることを特徴とする。
この発明によれば、適用予測器の演算量を低減でき、かつ量子化誤差も従来の簡略手法に比べて低下させることができるようになる。
以下、図面を参照して、この発明の実施例について説明する。
〔1〕ADPCM符号化装置およびADPCM復号化装置の概略構成の説明
図1は、ADPCM符号化装置101およびADPCM復号化装置102の概略構成を示している。なお、以下の説明において用いられるnは、整数である。
図1は、ADPCM符号化装置101およびADPCM復号化装置102の概略構成を示している。なお、以下の説明において用いられるnは、整数である。
〔1−2〕ADPCM符号化装置101について説明
まず、ADPCM符号化装置101について説明する。
まず、ADPCM符号化装置101について説明する。
このADPCM符号化装置101は、第1記憶手段113を備えている。第1記憶手段113には、表1に示されているような変換テーブルが記憶されている。表1は、符号L(n)が4ビットである場合の例を示している。
この変換テーブルは、第2の予測誤差信号dm(n)の範囲が記憶された第1欄、第1欄の第2の予測誤差信号dm(n)の範囲に対応する符号L(n)が記憶された第2欄、第2欄の符号L(n)に対応する逆量子化値q(n)が記憶された第3欄および第2欄の符号L(n)に対応する単位量子化幅T(n+1)の算出式が記憶された第4欄からなる。なお、単位量子化幅は実質的な量子化幅を決定するための値であり、実質的な量子化幅そのものではない。
第1加算器111は、ADPCM符号化装置101に入力された信号x(n)と、適応予測信号f(n)との差分(以下、第1の予測誤差信号d(n)という)を、次式(2)に基づいて求める。
d(n)=x(n)−f(n) …(2)
信号発生器119は、第1の予測誤差信号d(n)と第1量子化幅更新器118で得られた単位量子化幅T(n)とに基づいて、補正信号a(n)を発生する。つまり、信号発生器119は、次式(3)に基づいて、補正信号a(n)を発生する。
d(n)≧0の場合: a(n)=T(n)/2
d(n)<0の場合: a(n)=−T(n)/2 …(3)
d(n)<0の場合: a(n)=−T(n)/2 …(3)
第2加算器112は、第1の予測誤差信号d(n)と信号発生器119で得られた補正信号a(n)とに基づいて、第2の予測誤差信号dm(n)を求める。つまり、第2加算器112は、次式(4)に基づいて、第2の予測誤差信号dm(n)を求める。
dm(n)=d(n)+a(n) …(4)
したがって、第2の予測誤差信号dm(n)は、次式(5)で表される。
d(n)≧0の場合: dm(n)=d(n)+T(n)/2
d(n)<0の場合: dm(n)=d(n)−T(n)/2 …(5)
d(n)<0の場合: dm(n)=d(n)−T(n)/2 …(5)
第1適応量子化器114は、第2加算器112で求められた第2の予測誤差信号dm(n)と上記変換テーブルとに基づいて、符号L(n)を求める。つまり、変換テーブルの第2欄の各符号L(n)のうち、第2の予測誤差信号dm(n)に対応する符号L(n)が第1記憶手段113から読み出されて第1適応量子化器114から出力される。得られた符号L(n)はメモリ103に送られる。
第1適応逆量子化器115は、第1適応量子化器114で求められた符号L(n)と変換テーブルとに基づいて、逆量子化値q(n)を求める。つまり、変換テーブルの第3欄の各逆量子化値q(n)のうち、第1適応量子化器114で求められた符号L(n)に対応する逆量子化値q(n)が第1記憶手段113から読み出されて第1適応逆量子化器115から出力される。
第1量子化幅更新器118は、第1適応量子化器114で求められた符号L(n)と今回の単位量子化幅T(n)と変換テーブルとに基づいて、次回の量子化幅T(n+1)を求める。つまり、変換テーブルの第4欄の各単位量子化幅算出式のうちの、第1適応量子化器114で求められた符号L(n)に対応する単位量子化幅算出式に基づいて、次回の単位量子化幅T(n+1)が求められる。
第3加算器116は、今回の音声信号サンプリング値x(n)に対する適応予測信号f(n)と逆量子化値q(n)とに基づいて、再生信号b(n)を求める。つまり、第3加算器116は、次式(6)に基づいて、再生信号b(n)を求める。
b(n)=f(n)+q(n) …(6)
第1適応予測器117は、適用予測として全極型モデル(AR(Auto Regressive) モデル) を用いて、次の音声信号サンプリング値x(n+1)に対する予測信号f(n+1)を求める。なお、全極モデルの係数は学習同定法により求められる。以下、第1適応予測器117の処理内容について詳しく説明する。
全極型モデルの一般式は、次式(7)で表される。
上記式(7)において、y(n)は系の出力である。e(n)は予測誤差である。 hi(n)は係数である。
上記式(8)において、記号”||・||”はベクトルのユークリッドノルム(要素の二乗和の平方根)を表している。また、αはステップゲインである。
P=2として、第1適応予測器117に適用した場合について説明する。第1適応予測器117は、係数h1(n)およびh2(n)を更新するための係数更新部117aと、予測信号f(n)を算出するための適応予測部117bとから構成されている。
係数更新部117aには、第1適応逆量子化器115によって求められた逆量子化値q(n)と、第3加算器116によって求められた再生信号b(n)とが入力される。適応予測部117bには、第3加算器116によって求められた再生信号b(n)と、係数更新部117aによって求められた係数h1(n)およびh2(n)とが入力される。
係数更新部117aは、次式(9)に基づいて、係数h1(n)およびh2(n)を更新する。係数h1(n)およびh2(n)の初期値としては、たとえば、h1(n)=2k,h2(n)=−kに設定される。係数h1(n)およびh2(n)の初期値として、0を設定してもよい。
適応予測部117bは、次式(10)に基づいて、予測値f(n)を算出する。
〔1−3〕ADPCM復号化装置102について説明
次に、ADPCM復号化装置102について説明する。
次に、ADPCM復号化装置102について説明する。
このADPCM復号化装置102は、第2記憶手段121を備えている。第2記憶手段121には、上記第1記憶手段113に記憶されている変換テーブルと同じ内容(表1参照)の変換テーブルが記憶されている。
第2適応逆量子化器122は、メモリ103から得られた符号L’(n)と変換テーブルとに基づいて、逆量子化値q’(n)を求める。つまり、変換テーブルの第3欄の各逆量子化値q(n)のうち、メモリ103から得られた符号L’(n)が該当する第2欄の符号L(n)に対応する逆量子化値q’(n)が第2記憶手段121から読み出されて第2適応逆量子化器122から出力される。
なお、ADPCM符号化装置101で求めたL(n)が、正しくADPCM復号化装置102に伝送されれば、即ちL(n)=L’(n)の場合には、ADPCM復号化装置102側で用いられているq’(n),f’(n),T’(n)およびb’(n)は、それぞれADPCM符号化装置101側で用いられているq(n),f(n),T(n)およびb(n)の値と等しくなる。
第2量子化幅更新器123は、メモリ103から得られた符号L’(n)と今回の単位量子化幅T’(n)と変換テーブルとに基づいて、次回の単位量子化幅T’(n+1)を求める。つまり、変換テーブルの第4欄の各単位量子化幅算出式のうちの、メモリ103から得られた符号L’(n)に対応する単位量子化幅算出式に基づいて、次回の単位量子化幅T’(n+1)が求められる。
第4加算器124は、第2適応逆量子化器122で求められた逆量子化値q’(n)と第2適応予測器125で得られた予測信号f’(n)とに基づいて、再生信号b’(n)を求める。つまり、第4加算器124は、次式(11)に基づいて、再生信号b’(n)を求める。求められた再生信号b’(n)は、ADPCM復号化装置102から出力される。
b’(n)=f’(n)+q’(n) …(11)
第2適応予測125は、第1適応予測器117と同様に、適用予測として全極型モデルを用いて、次の予測信号f’(n+1)を求め、得られた予測信号f’(n+1)を第4加算器124に送る。なお、全極モデルの係数は学習同定法により求められる。以下、第2適応予測器125の処理内容について詳しく説明する。
第2適応予測器125は、係数h1’(n)およびh2’(n)を更新するための係数更新部125aと、予測信号f’(n)を算出するための適応予測部125bとから構成されている。
係数更新部125aには、第2適応逆量子化器122によって求められた逆量子化値q’(n)と、第4加算器124によって求められた再生信号b’(n)とが入力される。適応予測部125bには、第4加算器124によって求められた再生信号b’(n)と、係数更新部125aによって求められた係数h1’(n)およびh2’(n)とが入力される。
係数更新部125aは、次式(12)に基づいて、係数h1’(n)およびh2’(n)を更新する。係数h1’(n)およびh2’(n)の初期値としては、たとえば、kを予め定められた定数とすると、h1’(n)=2k,h2’(n)=−kに設定される。係数h1’(n)およびh2’(n)の初期値として、0を設定してもよい。
適応予測部125bは、次式(13)に基づいて、予測値f’(n)を算出する。
図2は、上記ADPCM符号化装置101の動作手順を示している。
まず、入力信号x(n)から予測信号f(n)が減算されることにより、第1の予測誤差信号d(n)が求められる(ステップ21)。
次に第1の予測誤差信号d(n)が、0以上であるか、0より小さいかが判別される(ステップ22)。第1の予測誤差信号d(n)が、0以上である場合には、第1の予測誤差信号d(n)に単位量子化幅T(n)の1/2が加算されることにより、第2の予測誤差信号dm(n)が求められる(ステップ23)。
第1の予測誤差信号d(n)が、0より小さい場合には、第1の予測誤差信号d(n)に単位量子化幅T(n)の1/2が減算されることにより、第2の予測誤差信号dm(n)が求められる(ステップ24)。
ステップ23またはステップ24によって第2の予測誤差信号dm(n)が求められると、変換テーブルに基づいて、符号化および逆量子化が行われる(ステップ25)。つまり、符号L(n)および逆量子化値q(n)が求められる。
次に変換テーブルに基づいて、単位量子化幅T(n)が更新される(ステップ26)。次に、今回の音声信号サンプリング値x(n)に対する適応予測信号f(n)と逆量子化値q(n)と、上記式(6)とに基づいて、再生信号b(n)が求められる(ステップ27)。そして、上記数式(9),(10)に基づいて、次の音声信号サンプリング値x(n+1)に対する予測信号f(n+1)が求められる(ステップ28)。
図3は、上記ADPCM復号化装置102の動作手順を示している。
まず、メモリ103から符号L’(n)が読み出され、変換テーブルに基づいて逆量子化値q’(n)が求められる(ステップ31)。次に、逆量子化値q’(n)と第2適応予測器125で得られた予測信号f’(n)とに基づいて、再生信号b’(n)が求められる(ステップ32)。
まず、メモリ103から符号L’(n)が読み出され、変換テーブルに基づいて逆量子化値q’(n)が求められる(ステップ31)。次に、逆量子化値q’(n)と第2適応予測器125で得られた予測信号f’(n)とに基づいて、再生信号b’(n)が求められる(ステップ32)。
この後、上記式(12),(13)に基づいて、次の予測信号f’(n+1)が求められる(ステップ33)。
そして、変換テーブルに基づいて、次の符号L’(n+1)に対して用いられる単位量子化幅T’(n+1)が求められる(ステップ34)。
図4は符号L(n)が4ビットである場合におけるADPCM符号化装置101の第1適応逆量子化器115によって得られる逆量子化値q(n)と第1の予測誤差信号d(n)との関係を示している。Tは、ある時点において第1量子化幅更新器118によって決定された単位量子化幅を示している。
第1の予測誤差信号d(n)の範囲A〜Bを、A,Bで示す際に、その範囲に境界Aを含む場合には”[A”と表し、境界Aを含まない場合には、”(A”と表すことにする。同様に、その範囲に境界Bを含む場合には”B]”と表し、境界Bを含まない場合には、”B)”と表すことにする。
逆量子化値q(n)は、第1の予測誤差信号d(n)の値が(−0.5T,0.5T)の範囲にあるときは0となり、第1の予測誤差信号d(n)の値が[0.5T,1.5T)の範囲にあるときはTとなり、第1の予測誤差信号d(n)の値が[1.5T,2.5T)の範囲にあるときは2Tとなり、第1の予測誤差信号d(n)の値が[2.5T,3.5T)の範囲にあるときは3Tとなる。
また、逆量子化値q(n)は、第1の予測誤差信号d(n)の値が[3.5T,5.5T)の範囲にあるときは4.5となり、第1の予測誤差信号d(n)の値が[5.5T,7.5T)の範囲にあるときは6.5Tとなる。また、逆量子化値q(n)は、第1の予測誤差信号d(n)の値が[7.5T,10.5T)の範囲にあるときは9Tとなり、第1の予測誤差信号d(n)の値が[10.5T,∞]の範囲にあるときは12Tとなる。 さらに、逆量子化値q(n)は、第1の予測誤差信号d(n)の値が(−1.5T,−0.5T]の範囲にあるときは−Tとなり、第1の予測誤差信号d(n)の値が(−2.5T,−1.5T)の範囲にあるときは−2Tとなり、第1の予測誤差信号d(n)の値が(−3.5T,−2.5T]の範囲にあるときは−3Tとなり、第1の予測誤差信号d(n)の値が(−4.5T,−3.5T]の範囲にあるときは−4Tとなる。
また、逆量子化値q(n)は、第1の予測誤差信号d(n)の値が(−6.5T,−4.5T]の範囲にあるときは−5.5Tとなり、第1の予測誤差信号d(n)の値が(−8.5T,−6.5T)の範囲にあるときは−7.5Tとなる。また、逆量子化値q(n)は、第1の予測誤差信号d(n)の値が(−11.5T,−8.5T]の範囲にあるときは−10Tとなり、第1の予測誤差信号d(n)の値が[−∞,−11.5T]の範囲にあるときは−13Tとなる。
101 ADPCM符号化装置
102 ADPCM復号化装置
103 メモリ
111,112,116,124 加算器
113,121 記憶手段
114 第1適応量子化器
115,122 適応逆量子化器
117,125 適応予測器
117a,125a 係数更新部
117b,125b 適応予測部
118,123 量子化幅更新器
119 信号発生器
102 ADPCM復号化装置
103 メモリ
111,112,116,124 加算器
113,121 記憶手段
114 第1適応量子化器
115,122 適応逆量子化器
117,125 適応予測器
117a,125a 係数更新部
117b,125b 適応予測部
118,123 量子化幅更新器
119 信号発生器
Claims (2)
- 適応予測器を備えているADPCM方式の音声符号化装置において、適応予測器が全極型モデルで構成されており、適応予測器は全極型モデルの係数を学習同定法に基づいて求める係数更新手段を備えていることを特徴とする音声符号化装置。
- 適応予測器を備えているADPCM方式の音声符号化方法において、適応予測器として全極型モデルを用い、かつ全極型モデルの係数を学習同定法に基づいて求めることを特徴とする音声符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004133956A JP2005316130A (ja) | 2004-04-28 | 2004-04-28 | 音声符号化装置および音声符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004133956A JP2005316130A (ja) | 2004-04-28 | 2004-04-28 | 音声符号化装置および音声符号化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005316130A true JP2005316130A (ja) | 2005-11-10 |
Family
ID=35443643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004133956A Pending JP2005316130A (ja) | 2004-04-28 | 2004-04-28 | 音声符号化装置および音声符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005316130A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102821076A (zh) * | 2012-06-29 | 2012-12-12 | 天地融科技股份有限公司 | 音频通信调制方式自适应的方法、系统、装置、电子签名工具 |
JP2016024447A (ja) * | 2014-07-24 | 2016-02-08 | 株式会社タムラ製作所 | 音符号化システム |
-
2004
- 2004-04-28 JP JP2004133956A patent/JP2005316130A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102821076A (zh) * | 2012-06-29 | 2012-12-12 | 天地融科技股份有限公司 | 音频通信调制方式自适应的方法、系统、装置、电子签名工具 |
JP2016024447A (ja) * | 2014-07-24 | 2016-02-08 | 株式会社タムラ製作所 | 音符号化システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2004526213A (ja) | 音声コーデックにおける線スペクトル周波数ベクトル量子化のための方法およびシステム | |
JPH0863196A (ja) | ポストフィルタ | |
US20120239389A1 (en) | Audio signal processing method and device | |
JP3143956B2 (ja) | 音声パラメータ符号化方式 | |
JPH0736118B2 (ja) | セルプを使用した音声圧縮装置 | |
RU2005137320A (ru) | Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи | |
KR101350285B1 (ko) | 신호를 부호화 및 복호화하는 방법, 장치 및 시스템 | |
JP3628268B2 (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
KR100421648B1 (ko) | 음성코딩을 위한 적응성 표준 | |
US6330531B1 (en) | Comb codebook structure | |
JP4231987B2 (ja) | 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体 | |
CN110503964B (zh) | 编码方法、编码装置以及记录介质 | |
US20130268268A1 (en) | Encoding of an improvement stage in a hierarchical encoder | |
JPH11184498A (ja) | 音声符号化/復号化方法 | |
WO1998037636A1 (fr) | Procede de codage de signaux vocaux | |
CN107710324A (zh) | 音频编码器和用于对音频信号进行编码的方法 | |
JP2005316130A (ja) | 音声符号化装置および音声符号化方法 | |
JP3905706B2 (ja) | 音声符号化装置、音声処理装置及び音声処理方法 | |
WO2004112256A1 (ja) | 音声符号化装置 | |
JP5361565B2 (ja) | 符号化方法、復号方法、符号化器、復号器およびプログラム | |
JP3095340B2 (ja) | 音声復号化装置 | |
US8160890B2 (en) | Audio signal coding method and decoding method | |
JP3089967B2 (ja) | 音声符号化装置 | |
JP3102017B2 (ja) | 音声符号化方法 | |
JP3194930B2 (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080317 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080401 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080724 |