JP5241509B2 - 適応音源ベクトル量子化装置、適応音源ベクトル逆量子化装置、およびこれらの方法 - Google Patents
適応音源ベクトル量子化装置、適応音源ベクトル逆量子化装置、およびこれらの方法 Download PDFInfo
- Publication number
- JP5241509B2 JP5241509B2 JP2008549377A JP2008549377A JP5241509B2 JP 5241509 B2 JP5241509 B2 JP 5241509B2 JP 2008549377 A JP2008549377 A JP 2008549377A JP 2008549377 A JP2008549377 A JP 2008549377A JP 5241509 B2 JP5241509 B2 JP 5241509B2
- Authority
- JP
- Japan
- Prior art keywords
- adaptive excitation
- excitation vector
- vector
- length
- pitch period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000013598 vector Substances 0.000 title claims description 183
- 230000003044 adaptive effect Effects 0.000 title claims description 155
- 230000005284 excitation Effects 0.000 title claims description 154
- 238000013139 quantization Methods 0.000 title claims description 77
- 238000000034 method Methods 0.000 title claims description 19
- 239000011159 matrix material Substances 0.000 claims description 61
- 230000004044 response Effects 0.000 claims description 52
- 238000011156 evaluation Methods 0.000 claims description 49
- 238000004364 calculation method Methods 0.000 claims description 23
- 230000015572 biosynthetic process Effects 0.000 claims description 13
- 238000003786 synthesis reaction Methods 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 8
- 238000005520 cutting process Methods 0.000 claims description 2
- 239000011295 pitch Substances 0.000 description 79
- 238000004891 communication Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000008649 adaptation response Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
Description
M.R.Schroeder、B.S.Atal著、「IEEE proc. ICASSP」、1985、「Code Excited Linear Prediction: High Quality Speech at Low Bit Rate」、p.937−940 "ITU-T Recommendation G.729", ITU-T, 1996/3, pp.17-19
化精度が劣化してしまうという問題が生じる。例えば、適応音源符号帳に割り振られる情報量が8ビットである場合、探索するピッチ周期として256通りの候補が存在するが、この8ビットの情報量を2つのサブフレームに均等に配分する場合、1つのサブフレームにおいて4ビットの情報量を用いてピッチ周期探索を行うこととなる。従って、各サブフレームにおいて探索するピッチ周期の候補は16通りとなり、ピッチ周期を表現するバリエーションが乏しくなる。一方、CELP音声符号化装置において、適応音源ベクトル量子化以外の処理はサブフレーム単位で行い、フレーム単位の処理は適応音源ベクトル量子化処理に限定すれば、適応音源ベクトル量子化による計算量の増加は容認できる程度に収まる。
図1は、本発明の一実施の形態に係る適応音源ベクトル量子化装置100の主要な構成を示すブロック図である。
Pairs)パラメータなどを用いる。
ッチ周期インデックスIDXを用いて駆動音源を更新する。
)に示すように、評価尺度算出部107は、探索用インパルス応答行列生成部105で生成された探索用インパルス応答行列H_newと、探索用適応音源ベクトル生成部103で生成された探索用適応音源ベクトルP(T_int)とを畳み込んで得られる再生ベクトルと、探索用ターゲットベクトル生成部106で生成された探索用ターゲットベクトルとの二乗誤差を評価尺度として求める。なお、評価尺度算出部107において評価尺度Dist(T_int)を算出する際は、下記の式(6)中の探索用インパルス応答行列H_newの代わりに、探索用インパルス応答行列H_newと、CELP音声符号化装置に含まれる聴覚重み付けフィルタのインパルス応答行列Wとを乗算して得られる行列H’_new(=H_new×W)を用いることが一般的である。ただし、以下の説明では、H_newとH’_newを区別せずH_newと記載することとする。
t(T_int)を求める場合を例にとって説明したが、本発明はこれに限定されず、評価尺度算出部107は、m≦r<nを満たす定数rを予め設定し、探索用ターゲットベクトルXのr次までの要素、探索用適応音源ベクトルP(T_int)のr次までの要素、探索用インパルス応答行列H_newのr×rまでの要素を抜き出して定数rの長さを持つ探索用ターゲットベクトルXおよび探索用適応音源ベクトルP(T_int)、r×r行列である探索用インパルス応答行列H_newを新たに構成し、評価尺度Dist(T_int)を求めても良い。
で実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
Claims (5)
- n長のフレームを複数のm長のサブフレームに分割して線形予測分析を行い(n、mは整数、nはmの整数倍)、m長の線形予測残差ベクトルおよび線形予測係数を生成するCELP音声符号化に用いられる適応音源ベクトル量子化装置であって、
適応音源符号帳の中から、n長の適応音源ベクトルを切り出す適応音源ベクトル生成手段と、
前記複数のサブフレームの前記線形予測残差ベクトルを加算してn長のターゲットベクトルを構成するターゲットベクトル構成手段と、
前記各サブフレームの前記線形予測係数を用いてm×m行列のインパルス応答行列を生成する合成フィルタと、
前記複数のm×m行列のインパルス応答行列を用いて、n×n行列のインパルス応答行列を構成するインパルス応答行列構成手段と、
前記n長の適応音源ベクトルと、前記n長のターゲットベクトルと、前記n×n行列のインパルス応答行列とを用いて、ピッチ周期の各候補に対し、適応音源ベクトル量子化の評価尺度を算出する評価尺度算出手段と、
前記ピッチ周期の各候補に対応する評価尺度を比較し、前記評価尺度を最大とするピッチ周期を量子化結果として求める評価尺度比較手段と、
を具備する適応音源ベクトル量子化装置。 - 請求項1記載の適応音源ベクトル量子化装置を具備するCELP音声符号化装置。
- 請求項2記載のCELP音声符号化装置から出力された符号化情報を復号するCELP音声復号に用いられる適応音源ベクトル逆量子化装置であって、
前記CELP音声符号化装置において前記フレーム単位の適応音源ベクトル量子化を行い得られた、前記ピッチ周期を記憶する記憶手段と、
前記適応音源符号帳と、
前記各サブフレームにおいて、前記ピッチ周期を切り出し位置として用い、前記適応音源符号帳の中から前記CELP音声符号化装置で用いたサブフレーム長であるm長の適応音源ベクトルを切り出す適応音源ベクトル生成手段と、
を具備する適応音源ベクトル逆量子化装置。 - 請求項3記載の適応音源ベクトル逆量子化装置を具備するCELP音声復号装置。
- n長のフレームを複数のm長のサブフレームに分割して線形予測分析を行い(n、mは整数、nはmの整数倍)、m長の線形予測残差ベクトルおよび線形予測係数を生成するCELP音声符号化に用いられる適応音源ベクトル量子化方法であって、
適応音源符号帳の中から、n長の適応音源ベクトルを切り出すステップと、
前記複数のサブフレームの前記線形予測残差ベクトルを加算してn長のターゲットベクトルを構成するステップと、
前記各サブフレームの前記線形予測係数を用いてm×m行列のインパルス応答行列を生成するステップと、
前記複数のm×m行列のインパルス応答行列を用いて、n×n行列のインパルス応答行列を構成するステップと、
前記n長の適応音源ベクトルと、前記n長のターゲットベクトルと、前記n×n行列のインパルス応答行列とを用いて、ピッチ周期の各候補に対し、適応音源ベクトル量子化の評価尺度を算出するステップと、
前記ピッチ周期の各候補に対応する評価尺度を比較し、前記評価尺度を最大とするピッチ周期を量子化結果として求めるステップと、
を有する適応音源ベクトル量子化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008549377A JP5241509B2 (ja) | 2006-12-15 | 2007-12-14 | 適応音源ベクトル量子化装置、適応音源ベクトル逆量子化装置、およびこれらの方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006338342 | 2006-12-15 | ||
JP2006338342 | 2006-12-15 | ||
PCT/JP2007/074136 WO2008072735A1 (ja) | 2006-12-15 | 2007-12-14 | 適応音源ベクトル量子化装置、適応音源ベクトル逆量子化装置、およびこれらの方法 |
JP2008549377A JP5241509B2 (ja) | 2006-12-15 | 2007-12-14 | 適応音源ベクトル量子化装置、適応音源ベクトル逆量子化装置、およびこれらの方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008072735A1 JPWO2008072735A1 (ja) | 2010-04-02 |
JP5241509B2 true JP5241509B2 (ja) | 2013-07-17 |
Family
ID=39511748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008549377A Expired - Fee Related JP5241509B2 (ja) | 2006-12-15 | 2007-12-14 | 適応音源ベクトル量子化装置、適応音源ベクトル逆量子化装置、およびこれらの方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8200483B2 (ja) |
EP (1) | EP2101319B1 (ja) |
JP (1) | JP5241509B2 (ja) |
WO (1) | WO2008072735A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5230444B2 (ja) * | 2006-12-15 | 2013-07-10 | パナソニック株式会社 | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 |
US8521519B2 (en) * | 2007-03-02 | 2013-08-27 | Panasonic Corporation | Adaptive audio signal source vector quantization device and adaptive audio signal source vector quantization method that search for pitch period based on variable resolution |
WO2009049671A1 (en) * | 2007-10-16 | 2009-04-23 | Nokia Corporation | Scalable coding with partial eror protection |
EP3288029A1 (en) * | 2008-01-16 | 2018-02-28 | III Holdings 12, LLC | Vector quantizer, vector inverse quantizer, and methods therefor |
US9245529B2 (en) * | 2009-06-18 | 2016-01-26 | Texas Instruments Incorporated | Adaptive encoding of a digital signal with one or more missing values |
US8924203B2 (en) | 2011-10-28 | 2014-12-30 | Electronics And Telecommunications Research Institute | Apparatus and method for coding signal in a communication system |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08248995A (ja) * | 1995-03-13 | 1996-09-27 | Nippon Telegr & Teleph Corp <Ntt> | 音声符号化方法 |
JPH10242867A (ja) * | 1997-02-25 | 1998-09-11 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号符号化方法 |
JP2005091749A (ja) * | 2003-09-17 | 2005-04-07 | Matsushita Electric Ind Co Ltd | 音源信号符号化装置、及び音源信号符号化方法 |
JP2006338342A (ja) * | 2005-06-02 | 2006-12-14 | Nippon Telegr & Teleph Corp <Ntt> | 単語ベクトル生成装置、単語ベクトル生成方法およびプログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
US5717824A (en) * | 1992-08-07 | 1998-02-10 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear predictor with multiple codebook searches |
JP2746039B2 (ja) * | 1993-01-22 | 1998-04-28 | 日本電気株式会社 | 音声符号化方式 |
CA2154911C (en) * | 1994-08-02 | 2001-01-02 | Kazunori Ozawa | Speech coding device |
DE69712538T2 (de) | 1996-11-07 | 2002-08-29 | Matsushita Electric Ind Co Ltd | Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs |
US5995927A (en) * | 1997-03-14 | 1999-11-30 | Lucent Technologies Inc. | Method for performing stochastic matching for use in speaker verification |
US6330531B1 (en) * | 1998-08-24 | 2001-12-11 | Conexant Systems, Inc. | Comb codebook structure |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
JP3583945B2 (ja) | 1999-04-15 | 2004-11-04 | 日本電信電話株式会社 | 音声符号化方法 |
EP1052622B1 (en) * | 1999-05-11 | 2007-07-11 | Nippon Telegraph and Telephone Corporation | Selection of a synthesis filter for CELP type wideband audio coding |
CN1296888C (zh) * | 1999-08-23 | 2007-01-24 | 松下电器产业株式会社 | 音频编码装置以及音频编码方法 |
US6584437B2 (en) * | 2001-06-11 | 2003-06-24 | Nokia Mobile Phones Ltd. | Method and apparatus for coding successive pitch periods in speech signal |
FI118704B (fi) * | 2003-10-07 | 2008-02-15 | Nokia Corp | Menetelmä ja laite lähdekoodauksen tekemiseksi |
JP4463526B2 (ja) * | 2003-10-24 | 2010-05-19 | 株式会社ユニバーサルエンターテインメント | 声紋認証システム |
JP5230444B2 (ja) * | 2006-12-15 | 2013-07-10 | パナソニック株式会社 | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 |
-
2007
- 2007-12-14 JP JP2008549377A patent/JP5241509B2/ja not_active Expired - Fee Related
- 2007-12-14 WO PCT/JP2007/074136 patent/WO2008072735A1/ja active Application Filing
- 2007-12-14 EP EP07850640.9A patent/EP2101319B1/en not_active Not-in-force
- 2007-12-14 US US12/518,944 patent/US8200483B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08248995A (ja) * | 1995-03-13 | 1996-09-27 | Nippon Telegr & Teleph Corp <Ntt> | 音声符号化方法 |
JPH10242867A (ja) * | 1997-02-25 | 1998-09-11 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号符号化方法 |
JP2005091749A (ja) * | 2003-09-17 | 2005-04-07 | Matsushita Electric Ind Co Ltd | 音源信号符号化装置、及び音源信号符号化方法 |
JP2006338342A (ja) * | 2005-06-02 | 2006-12-14 | Nippon Telegr & Teleph Corp <Ntt> | 単語ベクトル生成装置、単語ベクトル生成方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
EP2101319B1 (en) | 2015-09-16 |
JPWO2008072735A1 (ja) | 2010-04-02 |
US20100082337A1 (en) | 2010-04-01 |
EP2101319A1 (en) | 2009-09-16 |
EP2101319A4 (en) | 2011-09-07 |
US8200483B2 (en) | 2012-06-12 |
WO2008072735A1 (ja) | 2008-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5511372B2 (ja) | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 | |
JP5230444B2 (ja) | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 | |
JP5596341B2 (ja) | 音声符号化装置および音声符号化方法 | |
JPWO2008155919A1 (ja) | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 | |
JP5241509B2 (ja) | 適応音源ベクトル量子化装置、適応音源ベクトル逆量子化装置、およびこれらの方法 | |
JPWO2008047795A1 (ja) | ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法 | |
JPWO2009090875A1 (ja) | ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法 | |
JPH04344699A (ja) | 音声符号化・復号化方法 | |
JPH0519795A (ja) | 音声の励振信号符号化・復号化方法 | |
JPH113098A (ja) | 音声符号化方法および装置 | |
JP3153075B2 (ja) | 音声符号化装置 | |
JPH06131000A (ja) | 基本周期符号化装置 | |
JPH08185199A (ja) | 音声符号化装置 | |
JP3024467B2 (ja) | 音声符号化装置 | |
JP3230380B2 (ja) | 音声符号化装置 | |
JPH0511799A (ja) | 音声符号化方式 | |
JP3284874B2 (ja) | 音声符号化装置 | |
JP3101376B2 (ja) | 音声符号化方式 | |
JPH10207495A (ja) | 音声情報処理装置 | |
JPH10124091A (ja) | 音声符号化装置および情報記憶媒体 | |
JP2000347699A (ja) | 拡散音源ベクトル生成装置及び拡散音源ベクトル生成方法 | |
JP2000347700A (ja) | Celp型音声復号化装置及びcelp型音声復号化方法 | |
JP2000330596A (ja) | 拡散音源ベクトル生成装置及び拡散音源ベクトル生成方法 | |
JP2000338999A (ja) | Celp型音声符号化装置及びcelp型音声符号化方法 | |
JP2000330595A (ja) | 拡散音源ベクトル生成装置及び拡散音源ベクトル生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130402 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160412 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5241509 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |