JP4734286B2 - 音声符号化装置 - Google Patents
音声符号化装置 Download PDFInfo
- Publication number
- JP4734286B2 JP4734286B2 JP2007121223A JP2007121223A JP4734286B2 JP 4734286 B2 JP4734286 B2 JP 4734286B2 JP 2007121223 A JP2007121223 A JP 2007121223A JP 2007121223 A JP2007121223 A JP 2007121223A JP 4734286 B2 JP4734286 B2 JP 4734286B2
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- adaptive
- search
- speech
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
ここで、
En:n番のゲインコードベクトルを用いたときの符号化歪み
Xi:聴感重み付け音声
Ai:聴感重み付けLPC合成済み適応音源
Si:聴感重み付けLPC合成済み確率的音源
gn:コードベクトルの要素(適応音源側のゲイン)
hn:コードベクトルの要素(確率的音源側のゲイン)
n :コードベクトルの番号
i :音源データのインデクス
I :サブフレーム長(入力音声の符号化単位)
M.R.Schroeder "High Quality Speech at Low Bit Rates" Proc.ICASSP'85 pp.937-940
図1は、本発明の実施の形態1,2に係る音声符号化装置を備えた無線通信装置の構成を示すブロック図である。
予め、量子化対象ベクトルの代表的サンプル(コードベクトル)が複数格納されたベクトル符号帳1094を作成しておく。各ベクトルは、ACゲイン、SCゲインの対数値に対応する値、及びSCの予測係数の調整係数の3つの要素からなる。
ここで、
Gan,Gsn:復号化ゲイン
En:n番のゲインコードベクトルを用いたときの符号化歪み
Xi:聴感重み付け音声
Ai:聴感重み付けLPC合成済み適応音源
Si:聴感重み付けLPC合成済み確率的音源
n :コードベクトルの番号
i :音源ベクトルのインデクス
I :サブフレーム長(入力音声の符号化単位)
Dxx,Dxa,Dxs,Daa,Das,Dss:合成音間の相関値、パワ
Xi:聴感重み付け音声
Ai:聴感重み付けLPC合成済み適応音源
Si:聴感重み付けLPC合成済み確率的音源
n :コードベクトルの番号
i :音源ベクトルのインデクス
I :サブフレーム長(入力音声の符号化単位)
ここで、
Pra:予測値(ACゲイン)
Prs:予測値(SCゲイン)
Psc:予測値(予測係数)
αm:予測係数(ACゲイン、固定値)
βm:予測係数(SCゲイン、固定値)
Sam:状態(過去のコードベクトルの要素、ACゲイン)
Ssm:状態(過去のコードベクトルの要素、SCゲイン)
Scm:状態(過去のコードベクトルの要素、SC予測係数調整係数)
m:予測インデクス
M:予測次数
ここで、
En:n番のゲインコードベクトルを用いたときの符号化歪み
Dxx,Dxa,Dxs,Daa,Das,Dss:合成音間の相関値、パワ
Gan,Gsn:復号化ゲイン
Pra:予測値(ACゲイン)
Prs:予測値(SCゲイン)
Pac:予測係数の和(固定値)
Psc:予測係数の和(上記式4で算出)
Can,Csn,Ccn:コードベクトル、Ccnは予測係数調整係数であるがここでは使用しない
n:コードベクトルの番号
なお、実際にはDxxはコードベクトルの番号nに依存しないので、その加算を省略することができる。
音声符号化装置において、上述したように、ゲイン演算部では、音源作成部から得られた適応符号帳、確率的符号帳の全ての音源について合成音と入力音声との間の比較を行う。このとき、演算量の都合上、通常は2つの音源(適応符号帳と確率的符号帳)はオープンループに探索される。以下、図2を参照して説明する。
2)第1サブフレームの確率的符号帳の符号を決定
3)パラメータ符号化部109でゲインを符号化し、復号化ゲインで第1サブフレームの音源を作成し、適応符号帳103を更新する。
4)第2サブフレームの適応符号帳の符号を決定
5)第2サブフレームの確率的符号帳の符号を決定
6)パラメータ符号化部109でゲインを符号化し、復号化ゲインで第2サブフレームの音源を作成し、適応符号帳103を更新する。
2)もし(Vp×Vp×C<VV×Cpp)又は(Vp<0)ならば4)へ。それ以外なら3)へ。
3)VV=Vp×Vp、C=Cpp、P1=Pとして4)へ
4)P=P+1とする。この時P>Pmaxであれば終了、それ以外の場合には2)へ。
2)もし(V1p1×V1p1/C1p1p1+V2p×V2p/C2pp<Cmax)または(V2p<0)ならば4)へ。それ以外なら3)へ。
3)Cmax=V1p1×V1p1/C1p1p1+V2p×V2p/C2pp、Q2=pとして4)へ
4)p=p+1として2)へ。ただし、この時p>P1+Thであれば5)へ。
6)もし(V1p×V1p/C1pp+V2p2×V2p2/C2p2p2<Cmax)又は(V1p<0)ならば8)へ。それ以外は7)へ。
7)Cmax=V1p×V1p/C1pp+V2p2×V2p2/C2p2p2、Q1=p、Q2=P2として8)へ。
8)p=p+1として6)へ。ただし、この時p>P2+Thであれば9)へ。
9)終了。
103,303 適応符号帳
104,304 確率的符号帳
105,305 音源作成部
106,306 聴感重みLPC合成部
107,307 聴感重み付け部
108,308 ゲイン演算部
109,309 パラメータ符号化部
310 ピッチ分析部
311 探索範囲設定部
1091 パラメータ計算部
1092 符号化歪計算部
1093 比較部
1094 ベクトル符号帳
1095 予測係数格納部
1096 復号化ベクトル格納部
Claims (3)
- 1つのフレームを複数のサブフレームに分解して符号化を行うCELP型音声符号化装置であって、
適応符号帳及び確率的符号帳に格納された適応音源及び確率的音源に対して、入力音声から求めたLPC係数を用いてフィルタリングすることにより、合成音を得るLPC合成手段と、
前記適応音源及び前記確率的音源のゲインを求めるゲイン演算手段と、
前記入力音声と前記合成音との間の符号化歪みを用いて求められた適応音源及び確率的音源、並びに前記ゲインのベクトル量子化を行うパラメータ符号化手段と、
フレームの最初のサブフレームの適応符号帳探索を行う前に、前記複数のサブフレームに対して前記入力音声の自己相関係数とパワ成分とを求め、前記自己相関係数と前記パワ成分とを用いて最もピッチ周期に近似する値を代表ピッチ周期として算出するピッチ分析手段と、
前記自己相関係数、前記パワ成分及び前記代表ピッチ周期を用いて、ラグの探索範囲の中心となる仮ピッチを求め、前記仮ピッチの前後の指定の範囲を前記複数のサブフレームのラグの探索範囲として設定する探索範囲設定手段と、
を備え、
前記適応符号帳探索は、
前記ラグの探索範囲に対して行われる、
音声符号化装置。 - 前記探索範囲設定手段は、
前記仮ピッチに対してラグが短い側の候補が、ラグが長い側の候補よりも少なくなるように、前記仮ピッチの前後の指定の範囲を設定する、
請求項1記載の音声符号化装置。 - 1つのフレームを複数のサブフレームに分解して符号化を行うCELP型の音声符号化プログラム;過去に合成した音源信号が格納された適応符号帳;複数の音源ベクトルを格納した確率的符号帳;を格納した、コンピュータにより読み取り可能な記録媒体であって、
前記音声符号化プログラムは、
フレームの最初のサブフレームの適応符号帳探索を行う前に、前記複数のサブフレームに対して前記入力音声の自己相関係数とパワ成分とを求め、前記自己相関係数と前記パワ成分とを用いて最もピッチ周期に近似する値を代表ピッチ周期として算出する手順と、
前記自己相関係数、前記パワ成分及び前記代表ピッチ周期を用いて、ラグの探索範囲の中心となる仮ピッチを求め、前記仮ピッチの前後の指定の範囲を前記複数のサブフレームのラグの探索範囲として設定する手順と、
前記ラグの探索範囲に対して前記適応符号帳探索を行う手順と、
前記適応符号帳探索により求めた適応音源及び前記確率的符号帳に格納された確率的音源に対して、入力音声から求めたLPC係数を用いてフィルタリングすることにより、合成音を得る手順と、
前記適応音源及び前記確率的音源のゲインを求める手順と、
前記入力音声と前記合成音との間の符号化歪みを用いて求められた適応音源及び確率的音源、並びに前記ゲインのベクトル量子化を行う手順と、
を含む、
記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007121223A JP4734286B2 (ja) | 1999-08-23 | 2007-05-01 | 音声符号化装置 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1999235050 | 1999-08-23 | ||
JP23505099 | 1999-08-23 | ||
JP1999248363 | 1999-09-02 | ||
JP24836399 | 1999-09-02 | ||
JP2007121223A JP4734286B2 (ja) | 1999-08-23 | 2007-05-01 | 音声符号化装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000252349A Division JP4034929B2 (ja) | 1999-08-23 | 2000-08-23 | 音声符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007279754A JP2007279754A (ja) | 2007-10-25 |
JP4734286B2 true JP4734286B2 (ja) | 2011-07-27 |
Family
ID=38681178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007121223A Expired - Fee Related JP4734286B2 (ja) | 1999-08-23 | 2007-05-01 | 音声符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4734286B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466672B (en) | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466670B (en) | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466671B (en) | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
US8452606B2 (en) | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03123113A (ja) * | 1989-10-05 | 1991-05-24 | Fujitsu Ltd | ピッチ周期探索方式 |
JPH06130996A (ja) * | 1992-10-16 | 1994-05-13 | Oki Electric Ind Co Ltd | コード励振線形予測符号化装置及び復号化装置 |
JPH07271393A (ja) * | 1994-03-28 | 1995-10-20 | Sony Corp | オーディオピッチ抽出装置及びオーディオ処理装置 |
JPH1055199A (ja) * | 1996-05-25 | 1998-02-24 | Samsung Electron Co Ltd | 音声符号化並びに復号化方法及びその装置 |
JPH10240295A (ja) * | 1997-03-03 | 1998-09-11 | Oki Electric Ind Co Ltd | 音声合成方法及び音声合成装置 |
JPH113098A (ja) * | 1997-06-12 | 1999-01-06 | Toshiba Corp | 音声符号化方法および装置 |
-
2007
- 2007-05-01 JP JP2007121223A patent/JP4734286B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03123113A (ja) * | 1989-10-05 | 1991-05-24 | Fujitsu Ltd | ピッチ周期探索方式 |
JPH06130996A (ja) * | 1992-10-16 | 1994-05-13 | Oki Electric Ind Co Ltd | コード励振線形予測符号化装置及び復号化装置 |
JPH07271393A (ja) * | 1994-03-28 | 1995-10-20 | Sony Corp | オーディオピッチ抽出装置及びオーディオ処理装置 |
JPH1055199A (ja) * | 1996-05-25 | 1998-02-24 | Samsung Electron Co Ltd | 音声符号化並びに復号化方法及びその装置 |
JPH10240295A (ja) * | 1997-03-03 | 1998-09-11 | Oki Electric Ind Co Ltd | 音声合成方法及び音声合成装置 |
JPH113098A (ja) * | 1997-06-12 | 1999-01-06 | Toshiba Corp | 音声符号化方法および装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2007279754A (ja) | 2007-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7383176B2 (en) | Apparatus and method for speech coding | |
JP4870313B2 (ja) | 可変レート音声符号器におけるフレーム消去補償方法 | |
JP4734286B2 (ja) | 音声符号化装置 | |
EP3537438A1 (en) | Quantizing method, and quantizing apparatus | |
US7693711B2 (en) | Speech signal decoding method and apparatus | |
WO2001052241A1 (en) | Multi-mode voice encoding device and decoding device | |
JPH09127991A (ja) | 音声符号化方法及び装置、音声復号化方法及び装置 | |
JP3955179B2 (ja) | 音声符号化装置、音声復号化装置、およびこれらの方法 | |
EP1619666A1 (en) | Speech decoder, speech decoding method, program, recording medium | |
EP1187337B1 (en) | Speech coding processor and speech coding method | |
JP4034929B2 (ja) | 音声符号化装置 | |
WO2003001172A1 (en) | Method and device for coding speech in analysis-by-synthesis speech coders | |
JP3175667B2 (ja) | ベクトル量子化法 | |
JP3700310B2 (ja) | ベクトル量子化装置及びベクトル量子化方法 | |
CA2513842C (en) | Apparatus and method for speech coding | |
JP2000089797A (ja) | 音声符号化装置 | |
JPH0786952A (ja) | 音声の予測符号化方法 | |
JPH06195098A (ja) | 音声符号化方法 | |
JPH07334195A (ja) | サブフレーム長可変音声符号化装置 | |
JPH1020895A (ja) | 音声符号化装置および記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100927 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110405 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110425 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140428 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4734286 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |