JP2691921B2 - 音声符号化法 - Google Patents

音声符号化法

Info

Publication number
JP2691921B2
JP2691921B2 JP63298589A JP29858988A JP2691921B2 JP 2691921 B2 JP2691921 B2 JP 2691921B2 JP 63298589 A JP63298589 A JP 63298589A JP 29858988 A JP29858988 A JP 29858988A JP 2691921 B2 JP2691921 B2 JP 2691921B2
Authority
JP
Japan
Prior art keywords
quantization
prediction
code
gain
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63298589A
Other languages
English (en)
Other versions
JPH02144598A (ja
Inventor
一則 間野
健弘 守谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63298589A priority Critical patent/JP2691921B2/ja
Publication of JPH02144598A publication Critical patent/JPH02144598A/ja
Application granted granted Critical
Publication of JP2691921B2 publication Critical patent/JP2691921B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は、音声波形符号化法のうち9600bit/s以下
の量子化歪最小化規準に基づく低ビットレート音声波形
符号化法に関するものである。
「従来の技術」 音声符号化のうち、従来の9600bit/s以下の量子化歪
最小化基準による低ビットレート波形符号化法の技術の
一つとして、M.R.Schroeder、B.S.Atalによる文献(文
献1)、“Code-excited linear prediction(CELP):h
igh-quality speechat very low bit rate",IEEE Proc.
of International Conf.Acoust.,Speech & Signal Pro
cess.,pp.937-940(1985)、において示されている符号
駆動型線形予測符号化(CELP符号化)が知られている。
このCELP符号化は音声信号を一定時間区間毎に、近接予
測とピッチ予測からなる予測フィルタパラメータと、そ
の予測残差に対応する雑音系列のベクトル量子化符号と
そのゲインとによって表現する符号化である。しかし、
この方法は、第5図のフローチャートに示すように、分
析区間単位での処理方式であり、各区間において均一に
固定された大きさ(ビット数)のベクトル量子化符号帳
で、その区間内での量子化歪が最小となる符号化を行な
う手法であり、複数区間にわたる量子化歪の最小化を保
証するものではない。従って、無音部に相当する区間や
予測誤差の小さい区間では、符号帳の均一ビット割当で
は不必要に多くの情報量を伝送しなくてはならず、逆に
予測誤差の大きい区間では割当ビット数が少ないので十
分な符号化性能を得ることはできない。
一方、時間軸方向の不均一のビット割当を行なう方法
として、J.J.Dubnowski and R.E.Crochiereによる文献
(文献2)、“Veriable Rate Coding of Speech",The
Bell System Technical Journal,vol.58,No.3,pp.577-6
00,March(1976)では、主情報の波形のパワーに応じて
各波形の量子化ビット数を変化させるADPCMへの適用に
ついて言及している。しかし、この場合、ビット割当情
報のための補助情報が必要となるので、同じビットレー
トで実現を図ることが難しい。
この発明の目的は、新たな補助情報を必要とせずに従
来できなかった時間軸方向の複数区間での平均ビットレ
ート一定のもとで全体の量子化歪を小さくするという問
題を解決した低ビットレート音声符号化法を提供するこ
とにある。
「課題を解決するための手段」 請求項1の発明は、音声信号を線形予測分析し、一定
区間ごとに、近接予測、または、近接予測とピッチ予測
からなる予測フィルタパラメータと、予測残差を示すベ
クトル量子化符号と、そのゲインとによって表現する音
声符号化法において、 連続する複数個の区間ごとに、その各区間で上記予測
フィルタパラメータの量子化符号と、予測残差パワーの
第1段めのゲイン量子化符号とをそれぞれ求め、 その後、上記第1段めのゲイン量子化符号から得られ
た上記連続する複数個の区間での推定予測残差パワー系
列に基づいて、その各区間の量子化歪の総和が小さくな
るように各区間でのベクトル量子化符号帳のビット数を
適応的に割当て、 次に上記各区間ごとに、その区間に割り当てられた符
号帳ビット数で、波形歪量が小となる予測残差のベクト
ル量子化符号と予測残差パワーの第2段めのゲイン量子
化符号との最適組合せを求め、 その第2段めのゲイン量子化符号は当該第1段めのゲ
イン量子化符号の残差パワー内の量子化値を示すことを
特徴とする。
請求項2の発明は、請求項1記載の音声符号化法にお
いて、上記ベクトル量子化符号と、第2段めのゲイン量
子化符号の組合せを求める際において、最適組合せを各
区間での量子化歪最小化によって一意に決定せずに、そ
の少なくとも1区間以降への影響も考慮して、複数区間
での累積量子化歪が最小となる符号の組を各区間へのビ
ット割当情報を考慮しながら決定することを特徴とす
る。
「実施例」 〔実施例1〕 ここでは、符号駆動型線形予測符号化を基本として、
この発明の具体的な符号帳適応ビット割当による音声符
号化法を説明する。第1図に、この発明による実施例1
の音声符号化のフローチャートを示す。
第1図において、2−1で区間数がiが0に設定さ
れ、2−2で区間数iが+1され、2−3で1区間分の
音声を読み込み、2−4で近接予測、または近接予測と
ピッチ予測からなる線形予測分析を行い、2−5で予測
フィルタの符号化を行いそれを出力する。次に、2−6
で線形予測分析の結果を用いて得られる予測残差波形の
パワー系列を求める。この2−2から2−6の手順をあ
らかじめ定めたN個の複数区間について繰り返す。
2−8においてN区間において求められた残差パワー
系列に基づき、第1段めの量子化ゲインをそれぞれ決定
する。すなわち、ゲインと残差パワーとは相関があるの
で、第2図に示すように、残差パワーによって大きく2
ビット(31〜34の4段階)に分類し、これを、第1段め
の量子化ゲインとし、第1図の2−9で出力する。そし
て、2−10において、残差パワーと等価な第1段のゲイ
ンのパワー系列から、残差の符号帳ビット数と量子化歪
の関係を示すレート歪関数により、各区間の量子化歪の
N区間での総和が小さくなるように符号帳の適応ビット
割当を行なう。
次に2−11で区間数iを0とし、2−12で区間数iを
+1し、2−13で、各区間ごとに2−10で得た符号帳ビ
ットに従って、N個の区間で、波形歪最小となる残差の
ベクトル量子化符号と第2段のゲイン量子化符号との最
適組合せを求め、2−14で出力する。この第2段めのゲ
イン量子化は、第2図の31〜34の対応する残差パワー領
域内に設定された黒四角で示した各2ビット(4個)の
ゲインパワーの1つを選択し、さらに、ゲインの±の符
号として1ビットを決定する。
この発明において、第1段のゲイン量子化を2ビット
程度の大分類とすることにより、実際の音声符号過程で
は、多くの隣接区間で等しい量子化ゲインが続くので、
情報量を節約するために、第1段のゲイン量子化の更新
周期を2区間毎にしても符号化性能劣化は殆どない。従
って、従来法と同じか、またはそれ以下のゲインの情報
量で、この発明では符号帳のビット割当情報も包含する
ことができ、全体の符号化性能を向上させることができ
る。
〔実施例2〕 実施例1では、第1図2−13の残差のベクトル量子
化、第2段のゲイン量子化過程において、最適な符号を
一区間で一意に決定するが、実施例2では第3図4−13
に示すように、各区間では量子化歪の小さい符号の組合
わせ候補を複数個残し、4−14において連続するL区間
における累積量子化歪を最小とするようなベクトル量子
化符号と第2段の量子化ゲインを求めることにより、一
区間で求めた組合せ符号よりも全体の符号化性能を向上
させることができる。さらに、第1段の量子化ゲインか
ら得られる符号帳ビット割当情報を用いて、4−14にお
ける累積量子化歪の符号化の性能に殆ど関与しないよう
な低ビットレート符号帳となる無音部分や、十分に予測
が行なわれて残差パワーの小さい部分では、累積歪を求
めることによって最適符号組合せ選択の処理量を少なく
するといった制御が可能となる。
「発明の効果」 第4図に、〔実施例1〕及び〔実施例2〕に述べたこ
の発明による符号帳の適応ビット割当実験を行なった結
果を示す。使用音声は、女声1名発声の短文章であり、
標本化周波数は8〔kHz〕、線形予測分析の予測フィル
タ更新周期は20〔ms〕、予測残差の更新周期すなわち1
区間長は5〔ms〕である。横軸がビット割当を行なう区
間数Nであり、縦軸がSNR(bB)である。第4図におい
て、点線50が符号帳を固定ビットとした従来の符号駆動
型線形予測符号化(CELP符号化)の場合であり、線51が
2段階量子化をせずに、1段階での符号帳ビット割当で
決定したゲインのみで符号化した場合の適応ビット割当
による符号化、線52がこの発明のうち〔実施例1〕に述
べた2段階量子化による符号帳ビット割当による符号
化、線53がこの発明のうち2段階量子化によるビット割
当と累積量子化歪最小化を組み合わせた場合で、1区間
で残す量子化符号の符号候補数を8、量子化歪の累積区
間Lを2としている。
ここで、ゲインの2段階量子化をしていない線50と51
の場合が全体の音声符号化に必要な情報量は4.8kbit/
s、2段階量子化をしている線52と53の場合が4.7kbit/s
の音声符号化器となっており、いずれの場合も、予測フ
ィルタの量子化条件と符号帳の平均ビット数は等しく、
各区間での符号帳の割当ビット数とゲインの量子化に割
り当てられるビット数のみが異なっている。符号帳ビッ
ト数は平均9ビットであり、適応ビット割当は最小4ビ
ット、最大14ビットの範囲で行なう。
まず、ビット割当の区間数N=1、すなわち、均一ビ
ット割当の場合に、線50の従来の符号化と線51、線52を
比較すると、2段階ゲイン量子化を行なわない線51で
は、残差パワーから一意に決定されたゲインだけで符号
帳ベクトルとの最適組合せを求めなくてはならないの
で、線50と比較してSNR性能が悪い。これに対して、線5
2のようにこの発明によるゲイン2段階量子化を行なう
ことにより従来の符号化と比較して同等以上の性能であ
ることがわかる。
線51は、区間数を大きくしてビット割当をしても、従
来法の線50を越えて性能向上することはできない。しか
し、線52に示すようにこの発明による符号帳ビット割当
を適用することにより、均一ビット割当である区間数N
=1の場合と比較して、N=256の場合、1.7(dB)のSN
R性能向上が得られる。
さらに、線53、すなわちこの発明の実施例2の2段ゲ
イン量子化によるビット割当と複数区間での累積量子化
歪規準による最適符号決定手法は、線52よりも平均2
(dB)程度の性能向上が得られることがわかる。
以上説明したように、符号駆動型線形予測符号化にお
いて、ゲインを2段階量子化し、時間軸方向の複数区間
での符号帳ビット割当を施すこと、および、同手法にお
いて符号の決定過程を累積波形歪によって決定する機構
をもたせることによって、低ビットレートでの音声符号
化の性能を向上させる利点がある。
【図面の簡単な説明】
第1図はこの発明によるゲインの2段階量子化による符
号帳の適応ビット割当音声符号化のフローチャート、第
2図はゲインの2段階量子化の図、第3図はこの発明に
よるゲインの2段階量子化による符号帳の適応ビット割
当および累積量子化歪の最小化による音声符号化のフロ
ーチャート、第4図は適応ビット割当のための区間数N
に対する符号化性能図、第5図は従来の符号駆動型線形
予測符号化のフローチャートである。 50…従来の符号駆動型線形予測符号化(CELP符号化)、
51…2段階量子化をしない場合のビット割当符号化、52
…この発明(2段階量子化によるビット割当)、53…こ
の発明(2段階量子化によるビット割当+累積量子化歪
最小化)。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】音声信号を線形予測分析し、一定区間ごと
    に、近接予測、または、近接予測とピッチ予測からなる
    予測フィルタパラメータと、予測残差を示すベクトル量
    子化符号と、そのゲインとによって表現する音声符号化
    法において、 連続する複数個の区間ごとに、その各区間で上記予測フ
    ィルタパラメータの量子化符号と、予測残差パワーの第
    1段めのゲイン量子化符号とをそれぞれ求め、 その後、上記第1段めのゲイン量子化符号から得られた
    上記連続する複数個の区間での推定予測残差パワー系列
    に基づいて、その各区間の量子化歪の総和が小さくなる
    ように各区間でのベクトル量子化符号帳のビット数を適
    応的に割当て、 次に上記各区間ごとに、その区間に割り当てられた符号
    帳ビット数で、波形歪量が小となる予測残差のベクトル
    量子化符号と予測残差パワーの第2段めのゲイン量子化
    符号との最適組合せを求め、 その第2段めのゲイン量子化符号は当該第1段めのゲイ
    ン量子化符号の残差パワー内の量子化値を示すことを特
    徴とする音声符号化法。
  2. 【請求項2】請求項1記載の音声符号化法において、上
    記ベクトル量子化符号と、第2段めのゲイン量子化符号
    の組合せを求める際において、最適組合せを各区間での
    量子化歪最小化によって一意に決定せずに、その少なく
    とも1区間以降への影響も考慮して、複数区間での累積
    量子化歪が最小となる符号の組を各区間へのビット割当
    情報を考慮しながら決定することを特徴とする音声符号
    化法。
JP63298589A 1988-11-25 1988-11-25 音声符号化法 Expired - Fee Related JP2691921B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63298589A JP2691921B2 (ja) 1988-11-25 1988-11-25 音声符号化法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63298589A JP2691921B2 (ja) 1988-11-25 1988-11-25 音声符号化法

Publications (2)

Publication Number Publication Date
JPH02144598A JPH02144598A (ja) 1990-06-04
JP2691921B2 true JP2691921B2 (ja) 1997-12-17

Family

ID=17861696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63298589A Expired - Fee Related JP2691921B2 (ja) 1988-11-25 1988-11-25 音声符号化法

Country Status (1)

Country Link
JP (1) JP2691921B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2897940B2 (ja) * 1991-07-22 1999-05-31 日本電信電話株式会社 音声の線形予測パラメータ符号化方法
JP3099852B2 (ja) * 1993-01-07 2000-10-16 日本電信電話株式会社 励振信号の利得量子化方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60125900A (ja) * 1983-12-12 1985-07-05 日本電気株式会社 予測残差信号量子化器
JPS6291024A (ja) * 1985-10-16 1987-04-25 Fujitsu Ltd 符号化伝送装置
JPS62209948A (ja) * 1986-03-11 1987-09-16 Kokusai Electric Co Ltd デ−タ圧縮伝送方法
JPH0738115B2 (ja) * 1986-05-27 1995-04-26 日本電気株式会社 音声分析合成装置

Also Published As

Publication number Publication date
JPH02144598A (ja) 1990-06-04

Similar Documents

Publication Publication Date Title
US5751903A (en) Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
US6202046B1 (en) Background noise/speech classification method
US6345248B1 (en) Low bit-rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
US6345246B1 (en) Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
US7693711B2 (en) Speech signal decoding method and apparatus
Eriksson et al. Interframe LSF quantization for noisy channels
JPH08263099A (ja) 符号化装置
US8712763B2 (en) Method for encoding signal, and method for decoding signal
US6910009B1 (en) Speech signal decoding method and apparatus, speech signal encoding/decoding method and apparatus, and program product therefor
KR20040042903A (ko) 일반화된 분석에 의한 합성 스피치 코딩 방법 및 그방법을 구현하는 코더
Eriksson et al. Exploiting interframe correlation in spectral quantization: a study of different memory VQ schemes
JP3266372B2 (ja) 音声情報符号化方法およびその装置
US5819224A (en) Split matrix quantization
JP4550176B2 (ja) 音声符号化方法
Ohmuro et al. Coding of LSP parameters using interframe moving average prediction and multi-stage vector quantization
JP2691921B2 (ja) 音声符号化法
Ozawa et al. MP‐CELP speech coding based on multipulse vector quantization and fast search
Kroon et al. Experimental evaluation of different approaches to the multi-pulse coder
JP2538450B2 (ja) 音声の励振信号符号化・復号化方法
Taniguchi et al. Multimode coding: application to CELP
JP2736157B2 (ja) 符号化装置
EP0694907A2 (en) Speech coder
JPH06131000A (ja) 基本周期符号化装置
JP3026461B2 (ja) 音声のピッチ予測符号化法
Bae et al. On a new predictor for the waveform coding of speech signal by using the dual autocorrelation and the sigma-delta technique

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees