JP4293005B2 - 音声音楽信号の符号化装置および復号装置 - Google Patents
音声音楽信号の符号化装置および復号装置 Download PDFInfo
- Publication number
- JP4293005B2 JP4293005B2 JP2004027981A JP2004027981A JP4293005B2 JP 4293005 B2 JP4293005 B2 JP 4293005B2 JP 2004027981 A JP2004027981 A JP 2004027981A JP 2004027981 A JP2004027981 A JP 2004027981A JP 4293005 B2 JP4293005 B2 JP 4293005B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- linear prediction
- prediction coefficient
- circuit
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
ommunications, pp.101-102, 1997)(非特許文献2)を参照できる。
みづけ差分ベクトルを得る。そして前記第1の重みづけ差分ベクトルを第1の最小化回路150へ出力する。
Code excited linear prediction:High quality speech at very low bit rates(Proc. ICASSP, pp.937-940, 1985 ) Multi-band CELP Coding of Speech and Music(IEEE Workshop on Speech Coding for Telecommunications, pp.101-102, 1997
具体的には、第1の帯域に対応する励振信号により前記線形予測合成フィルタを駆動することで第1の再生信号を生成する手段(図1の110、160、120、130)と、入力信号と前記第1の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成する手段(図1の180、230)と、前記残差信号における第2の帯域に対応する成分を直交変換後に符号化する手段(図1の240、250、260)とを有する。
1から第Nn−1の再生信号を生成し、前記第1から第Nの再生信号を加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、第Nの帯域に対応する励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することより第Nの再生信号を生成する手段(図23の1055)と、第1から第N−1の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第1から第N−1の再生信号を生成する手段(図23の1051、1054)と、前記第1から第Nの再生信号を加算することで復号音声音楽を生成する手段(図23の1821、1822)とを有する。
(作用)
本発明では、入力信号の低域に対応する帯域特性を有する励振信号により入力信号から求めた線形予測合成フィルタを駆動することで第1の再生信号を生成し、前記入力信号と前記第1の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号の高域成分を、直交変換に基づく符号化方式を用いて符号化する。すなわち、高周波数域に属する帯域における、音声とは異なる性質を有する信号に対しては、CELPに代わり、直交変換に基づく符号化を行う。前記直交変換に基づく符号化は、音声と異なる性質を有する信号に対する符号化性能がCELPに比べて高い。このため、前記入力信号の高域成分に対する符号化性能が改善される。その結果、音声音楽信号を全帯域にわたって良好に符号化することが可能となる。
入力ベクトルは、x(n),n=0,…,L−1と表される。ただし、Lは、ベクトル長である。また、入力信号はFs0[Hz]からFe0[Hz]に帯域制限される。例えば、サンプリング周波数を16[kHz]として、Fs0=50[Hz]、Fe0=7000[Hz]とする。
報通信学会論文誌A,Vol.J77-A, No.3, pp.303-312, 1994 )(文献4)を参照できる。
ただし、Fs0≦Fs2≦Fe2≦Fe0である。ここでは、第1の帯域と第2の帯域が重ならない、すなわち、Fe1≦Fs2とする。例えば、Fs2=4000[Hz]、Fe2=7000[Hz]である。帯域選択回路250は、前記Nsbv 個のサブベクトルを直交変換係数量子化回路260へ出力する。
1および前記量子化ゲインg0 [k]の決定については、以下の方法を用いることもできる。ノルムD0 は、
なるc0 [j](n),n=0,…,L−1,j=0,…,Nc,0 −1を求めることと等価である。そこで、(式3)の第2項が最大となるc0 [j](n),n=0,…,L−1,j=jopt を求めた後、このc0 [j](n),n=0,…,L−1,j=jopt について(式1)が最小となるg0 [k],k=kopt を求める。ここで、c0 [j] (n),n=0,…,L−1,j=jopt としては、(式3)の第2項の値が大きいものから順に複数個の候補を選んでおき、その各々に対して(式1)が最小となるg0 [k],k=kopt を求め、それらの中からノルムD0 が最小となるc0 [j](n),n=0,…,L−1,j=jopt とg0 [k],k=kopt を最終的に選択することもできる。サブベクトル
号化回路1003は図7と等価である。符号出力回路2901は、線形予測係数計算回路170から出力されるインデックスを入力し、第1の符号化回路1001から出力されるインデックスを入力し、第2の符号化回路1002から出力されるインデックスを入力し、第3の符号化回路1003から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。
は、図9に示すブロック図で表すことができる。ここで、第1の符号化回路1001から第N−1の符号化回路1004は図6と等価であり、第Nの符号化回路1005は図7と等価である。符号出力回路2902は、線形予測係数計算回路170から出力されるインデックスを入力し、第1の符号化回路1001から第N−1の符号化回路1004の各々より出力されるインデックスを入力し、第Nの符号化回路1005から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。
第2の線形予測係数計算回路771、第3の線形予測係数計算回路772、線形予測逆フィルタ730、符号出力回路790について説明する。
し、第3のLSPを得る。次に、前記第1のLSPと前記第3のLSPとを加算し、第2のLSPを得る。線形予測逆フィルタ730は、前記第2のLSPを線形予測係数に変換し、第2の量子化線形予測係数を得、前記第2の量子化線形予測係数が設定された逆フィルタを、前記第1の差分ベクトルにより駆動することで、第1の残差ベクトルを得る。そして前記第1の残差ベクトルを直交変換回路240へ出力する。
格納されたテーブルを備えている。第1のゲイン回路160は、符号入力回路410から出力されるインデックスと第1の音源生成回路110から出力される第1の音源ベクトルとを入力し、前記インデックスに対応する第1のゲインを前記テーブルより読み出し、前記第1のゲインと前記第1の音源ベクトルとを乗算し、第2の音源ベクトルを生成し、生成した前記第2の音源ベクトルを第1の帯域通過フィルタ120へ出力する。
前記Nsbv 個の量子化サブベクトル
回路1052へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第1の復号回路1061および第2の復号回路1052へ出力する。
460へ出力される。
20,40 出力端子
110 第1の音源生成回路
111 第2の音源生成回路
160 第1のゲイン回路
161 第2のゲイン回路
120 第1の帯域通過フィルタ
121 第2の帯域通過フィルタ
182,184 加算器
180 第1の差分器
181 第2の差分器
183 第3の差分器
170 線形予測係数計算回路
770 第1の線形予測係数計算回路
771 第2の線形予測係数計算回路
772 第3の線形予測係数計算回路
130 線形予測合成フィルタ
131 線形予測合成フィルタ
132 第1の線形予測合成フィルタ
831 第2の線形予測合成フィルタ
140 重みづけフィルタ
141 重みづけフィルタ
150,550 第1の最小化回路
151 第2の最小化回路
230,730 線形予測逆フィルタ
240 直交変換回路
250 帯域選択回路
260 直交変換係数量子化回路
440 直交逆変換回路
460 直交変換係数逆量子化回路
190,290,590,790 符号出力回路
310,410,610,810 符号入力回路
780 ダウンサンプル回路
781 アップサンプル回路
510 記憶回路
112 ピッチ信号生成回路
162 第3のゲイン回路
1101 テーブル
1102 スイッチ
1103 入力端子
1104 出力端子
2650,2651 入力端子
2610,2611 テーブル
2620,2621 ゲイン回路
2630,2631 最小化回路
2640,2641 差分器
2660 インデックス出力回路
2670 出力端子
1001,1011 第1の符号化回路
1002,1012 第2の符号化回路
1003 第3の符号化回路
1004,1014 第N−1の符号化回路
1005 第Nの符号化回路
2901,2902,2903,2904,2905 符号出力回路
1801,1802 差分器
4610,4611 テーブル
4620,4621 ゲイン回路
4630 インデックス入力回路
4640 全帯域ベクトル生成回路
4650 入力端子
4660 出力端子
1051,1061 第1の復号回路
1052,1062 第2の復号回路
1053 第3の復号回路
1054,1064 第N−1の復号回路
1055 第Nの復号回路
4101,4102,4103,4104,4105 符号入力回路
1821,1822 加算器
Claims (6)
- 第1のサンプリング周波数でサンプリングされた第1の入力信号を受け、
前記第1の入力信号を第2のサンプリング周波数にダウンサンプリングして第2の入力信号を生成し、
前記第2の入力信号から第2のサンプリング周波数の第1の線形予測係数を求め、
前記第1の線形予測係数が設定された合成フィルタを駆動して前記第2の入力信号に対応する第1の再生信号を生成するための前記第2のサンプリング周波数の第1の励振信号を求め、
前記第1の再生信号を前記第1のサンプリング周波数にアップサンプリングすることにより第2の再生信号を生成し、
前記第1の入力信号から求めた線形予測係数に対応する周波数領域パラメータと前記第1の線形予測係数を第1のサンプリング周波数にサンプリング周波数変換して得られる第2の線形予測係数に対応する周波数領域パラメータとの差分から第3の線形予測係数を求め、
前記第2の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとの和から第4の線形予測係数を求め、
前記第1の入力信号と前記第2の再生信号との差分信号により前記第4の線形予測係数が設定された逆フィルタを駆動することで残差信号を生成し、
前記残差信号を直交変換し、
前記直交変換された残差信号の少なくとも一部の帯域に対応する成分と前記第1の線形予測係数と前記第3の線形予測係数と前記励振信号とを出力することを特徴とする音声音楽信号符号化装置。 - 第1のサンプリング周波数でサンプリングされた前記第1の入力信号を第2のサンプリング周波数にダウンサンプリングして生成された第2の入力信号から求められる第2のサンプリング周波数の第1の線形予測係数と、前記第1の線形予測係数が設定された合成フィルタを駆動して前記第2の入力信号に対応する第1の再生信号を生成するために求められた前記第2のサンプリング周波数の第1の励振信号と、前記第1の入力信号から求められた線形予測係数に対応する周波数領域パラメータと前記第1の線形予測係数を第1のサンプリング周波数にサンプリング周波数変換して得られる第2の線形予測係数に対応する周波数領域パラメータとの差分から求められた第3の線形予測係数と、前記第1の再生信号を前記第1のサンプリング周波数にアップサンプリングすることにより生成された第2の再生信号と前記前記第1の入力信号との差分信号により前記第2の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとの和から求められた第4の線形予測係数が設定された逆フィルタを駆動することで生成された前記残差信号を直交変換して得られる直交変換後残差信号の少なくとも一部の帯域に対応する成分とを含む信号を受け、
前記第1の励振信号により第1の線形予測合成フィルタを駆動して得られる信号を前記第1のサンプリング周波数にアップサンプリングして第1の再生信号を生成し、
直交変換後残差信号の少なくとも一部の帯域に対応する成分を直交逆変換することにより第1のサンプリング周波数の第2の励振信号を生成し、
前記第1の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとを加算して得られる信号が設定された第2の線形予測合成フィルタを前記第2の励振信号により駆動することで第2の再生信号を生成し、
前記第1の再生信号と前記第2の再生信号とを加算することで音声音楽信号を生成することを特徴とする音声音楽信号復号装置。 - 直交変換された残差信号の少なくとも一部の帯域に対応する成分と第2のサンプリング周波数の第1の線形予測係数と第1のサンプリング周波数の第3の線形予測係数と第2のサンプリング周波数の第1の励振信号とを含む信号を受け、
前記第1の励振信号により第1の線形予測合成フィルタを駆動して得られる信号を前記第1のサンプリング周波数にアップサンプリングして第1の再生信号を生成し、
直交変換後残差信号の少なくとも一部の帯域に対応する成分を直交逆変換することにより第1のサンプリング周波数の第2の励振信号を生成し、
前記第1の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとを加算して得られる信号が設定された第2の線形予測合成フィルタを前記第2の励振信号により駆動することで第2の再生信号を生成し、
前記第1の再生信号と前記第2の再生信号とを加算することで音声音楽信号を生成することを特徴とする音声音楽信号復号装置。 - 第1のサンプリング周波数でサンプリングされた第1の入力信号を受け、
前記第1の入力信号を第2のサンプリング周波数にダウンサンプリングして第2の入力信号を生成し、
前記第2の入力信号から第2のサンプリング周波数の第1の線形予測係数を求め、
前記第1の線形予測係数が設定された合成フィルタを駆動して前記第2の入力信号に対応する第1の再生信号を生成するための前記第2のサンプリング周波数の第1の励振信号を求め、
前記第1の再生信号を前記第1のサンプリング周波数にアップサンプリングすることにより第2の再生信号を生成し、
前記第1の入力信号から求めた線形予測係数に対応する周波数領域パラメータと前記第1の線形予測係数を第1のサンプリング周波数にサンプリング周波数変換して得られる第2の線形予測係数に対応する周波数領域パラメータとの差分から第3の線形予測係数を求め、
前記第2の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとの和から第4の線形予測係数を求め、
前記第1の入力信号と前記第2の再生信号との差分信号により前記第4の線形予測係数が設定された逆フィルタを駆動することで残差信号を生成し、
前記残差信号を直交変換し、
前記直交変換された残差信号の少なくとも一部の帯域に対応する成分と前記第1の線形予測係数と前記第3の線形予測係数と前記励振信号とを出力することを特徴とする音声音楽信号符号化方法。 - 第1のサンプリング周波数でサンプリングされた前記第1の入力信号を第2のサンプリング周波数にダウンサンプリングして生成された第2の入力信号から求められる第2のサンプリング周波数の第1の線形予測係数と、前記第1の線形予測係数が設定された合成フィルタを駆動して前記第2の入力信号に対応する第1の再生信号を生成するために求められた前記第2のサンプリング周波数の第1の励振信号と、前記第1の入力信号から求められた線形予測係数に対応する周波数領域パラメータと前記第1の線形予測係数を第1のサンプリング周波数にサンプリング周波数変換して得られる第2の線形予測係数に対応する周波数領域パラメータとの差分から求められた第3の線形予測係数と、前記第1の再生信号を前記第1のサンプリング周波数にアップサンプリングすることにより生成された第2の再生信号と前記前記第1の入力信号との差分信号により前記第2の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとの和から求められた第4の線形予測係数が設定された逆フィルタを駆動することで生成された前記残差信号を直交変換して得られる直交変換後残差信号の少なくとも一部の帯域に対応する成分とを含む信号を受け、
前記第1の励振信号により第1の線形予測合成フィルタを駆動して得られる信号を前記第1のサンプリング周波数にアップサンプリングして第1の再生信号を生成し、
直交変換後残差信号の少なくとも一部の帯域に対応する成分を直交逆変換することにより第1のサンプリング周波数の第2の励振信号を生成し、
前記第1の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとを加算して得られる信号が設定された第2の線形予測合成フィルタを前記第2の励振信号により駆動することで第2の再生信号を生成し、
前記第1の再生信号と前記第2の再生信号とを加算することで音声音楽信号を生成することを特徴とする音声音楽信号復号方法。 - 直交変換された残差信号の少なくとも一部の帯域に対応する成分と第2のサンプリング周波数の第1の線形予測係数と第1のサンプリング周波数の第3の線形予測係数と第2のサンプリング周波数の第1の励振信号とを含む信号を受け、
前記第1の励振信号により第1の線形予測合成フィルタを駆動して得られる信号を前記第1のサンプリング周波数にアップサンプリングして第1の再生信号を生成し、
直交変換後残差信号の少なくとも一部の帯域に対応する成分を直交逆変換することにより第1のサンプリング周波数の第2の励振信号を生成し、
前記第1の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとを加算して得られる信号が設定された第2の線形予測合成フィルタを前記第2の励振信号により駆動することで第2の再生信号を生成し、
前記第1の再生信号と前記第2の再生信号とを加算することで音声音楽信号を生成することを特徴とする音声音楽信号復号方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004027981A JP4293005B2 (ja) | 2004-02-04 | 2004-02-04 | 音声音楽信号の符号化装置および復号装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004027981A JP4293005B2 (ja) | 2004-02-04 | 2004-02-04 | 音声音楽信号の符号化装置および復号装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16657398A Division JP3541680B2 (ja) | 1998-06-15 | 1998-06-15 | 音声音楽信号の符号化装置および復号装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004177982A JP2004177982A (ja) | 2004-06-24 |
JP4293005B2 true JP4293005B2 (ja) | 2009-07-08 |
Family
ID=32709481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004027981A Expired - Fee Related JP4293005B2 (ja) | 2004-02-04 | 2004-02-04 | 音声音楽信号の符号化装置および復号装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4293005B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1852849A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
-
2004
- 2004-02-04 JP JP2004027981A patent/JP4293005B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004177982A (ja) | 2004-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3199020B2 (ja) | 音声音楽信号の符号化装置および復号装置 | |
JP3134817B2 (ja) | 音声符号化復号装置 | |
JP3541680B2 (ja) | 音声音楽信号の符号化装置および復号装置 | |
CN113223540B (zh) | 在声音信号编码器和解码器中使用的方法、设备和存储器 | |
US7805314B2 (en) | Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data | |
WO1990013112A1 (en) | Voice encoder | |
JP2010244078A (ja) | スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法 | |
JPH08123495A (ja) | 広帯域音声復元装置 | |
US20040111257A1 (en) | Transcoding apparatus and method between CELP-based codecs using bandwidth extension | |
JP3582589B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP2003150200A (ja) | 符号変換方法及び装置とプログラム並びに記憶媒体 | |
JP3147807B2 (ja) | 信号符号化装置 | |
JP4293005B2 (ja) | 音声音楽信号の符号化装置および復号装置 | |
JP3268750B2 (ja) | 音声合成方法及びシステム | |
JPH09127987A (ja) | 信号符号化方法及び装置 | |
KR100682966B1 (ko) | 주파수 크기데이터 양자화/역양자화 방법 및 장치와 이를이용한 오디오 부호화/복호화 방법 및 장치 | |
JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
EP1717796B1 (en) | Method for converting code and code conversion apparatus therefor | |
WO2000003385A1 (fr) | Codeur/decodeur vocal | |
JPH04301900A (ja) | 音声符号化装置 | |
JP2615862B2 (ja) | 音声符号化復号化方法とその装置 | |
JP3773509B2 (ja) | 広帯域音声復元装置及び広帯域音声復元方法 | |
Kao | Thesis Report | |
JPH01293400A (ja) | 音声符号化復号化方法並びに音声符号化装置及び音声復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20050316 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050518 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20070118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080331 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20080606 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080902 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090317 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090330 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120417 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120417 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130417 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130417 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140417 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |