JP3130673B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP3130673B2
JP3130673B2 JP04238853A JP23885392A JP3130673B2 JP 3130673 B2 JP3130673 B2 JP 3130673B2 JP 04238853 A JP04238853 A JP 04238853A JP 23885392 A JP23885392 A JP 23885392A JP 3130673 B2 JP3130673 B2 JP 3130673B2
Authority
JP
Japan
Prior art keywords
data
vector
quantization
correction
fixed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04238853A
Other languages
English (en)
Other versions
JPH0669809A (ja
Inventor
正 米崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP04238853A priority Critical patent/JP3130673B2/ja
Publication of JPH0669809A publication Critical patent/JPH0669809A/ja
Application granted granted Critical
Publication of JP3130673B2 publication Critical patent/JP3130673B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、高能率音声圧縮が必要
なデジタル電話やデジタル録音機に使用する音声符号化
装置に関し、特に、低ビット・レートの音声符号化を可
能にしたものである。
【0002】
【従来の技術】音声の符号化においては、周波数や記憶
媒体の有効利用を図るために、音声信号をできるだけ少
ないビット数で符号化することが求められる。
【0003】MBE(Multi-Band Excitation)方式を用
いた音声符号化装置は、低ビット・レートで音声符号化
を行なうことができる装置として有望視されている。M
BE方式は、入力音声を基本周波数に従って複数の帯域
に分割し、各帯域毎に、有声/無声を判定し、スペクト
ル振幅を量子化するもので、このMBE方式を用いた音
声符号化装置は、図7に示すように、入力音声を分析す
る音声分析部10と、基本周波数に関する量子化データを
出力する基本周波数量子化部20と、各帯域が有声か無声
かを判定してその結果を量子化データにする有声/無声
判定量子化部30と、各帯域のスペクトル振幅を量子化す
るスペクトル振幅量子化部40と、各量子化部の出力を多
重化する多重化部50とによって構成されており、音声が
ほぼ定常と考えられる20ms程度を1フレームとし
て、入力音声の符号化を行なっている。
【0004】この内、量子化に際して、最もビット数を
要するのは、スペクトル振幅量子化部40である。
【0005】従来のMBE方式音声符号化装置のスペク
トル振幅量子化部40は、図8に示すように、入力された
スペクトルを複数(n)の帯域に分割するスペクトル振
幅帯域分割器41と、信号を直交変換する離散コサイン変
換(DCT)器42と、DCT係数から、各帯域毎のスペ
クトル振幅値の平均を表わす係数である直流(DC)成
分を抽出する係数弁別器43と、各係数弁別器43の抽出し
たn個の成分を要素とする1つのn次ベクトルを合成す
るベクトル合成器44と、ベクトル合成器44の出力するベ
クトルを量子化するベクトル量子化器45と、各DCT係
数の誤差を量子化するスカラー量子化器46とを備えてい
る。
【0006】このスペクトル振幅量子化部に入力したス
ペクトル振幅は、まず、スペクトル振幅分割器41でn個
の帯域に分割され、分割されたスペクトル振幅は、帯域
毎にDCT器42で離散コサイン変換(DCT)される。
ここで得られたDCT係数は周波数スペクトル情報を表
わしているが、このDCT係数は、係数弁別器43におい
て、各帯域毎のスペクトル振幅値の平均を表わす係数
と、それ以外の係数に弁別され、前者は、ベクトル合成
器44でn次元のベクトルとして合成された後、ベクトル
量子化器45でベクトル量子化される。一方、後者は、各
係数毎にスカラー量子化器46でスカラー量子化され、誤
差を表わす値として出力される。
【0007】
【発明が解決しようとする課題】しかし、従来のMBE
方式音声符号化装置では、各帯域のDC成分について
は、効率的な、低ビット・レートの量子化法であるベク
トル量子化を適用しているが、各係数を直接ベクトル量
子化することは行なわれていない。これは、MBE方式
音声符号化装置では、スペクトル振幅値を表わすデータ
数が、入力した音声の基本周波数に依存して、フレーム
毎に変わるため、ベクトルの次元が定まらず、ベクトル
量子化の直接適用ができないからである。したがって、
従来のMBE方式音声符号化装置は、基本的にはスカラ
ー量子化を行なっていると見ることができ、量子化の効
率を高める上で改善すべき余地を残している。
【0008】本発明は、このような従来の問題点を解決
するものであり、ベクトル量子化を直接適用できるよう
に構成することによって、低ビット・レートによる符号
化を可能にしたMBE方式の音声符号化装置を提供する
ことを目的としている。
【0009】
【課題を解決するための手段】そこで、本発明では、M
BE方式の音声符号化装置において、スペクトル振幅値
の入力データから固定次元のデータを周波数軸方向に対
して補間する補間手段と、補間した固定次元のデータに
基づいてベクトル量子化を行なうベクトル量子化手段
と、ベクトル量子化に伴う量子化誤差を補正する補正手
段と、この補正における補正量をスカラー量子化するス
カラー量子化手段とを設けている。
【0010】また、ベクトル量子化手段に供給するデー
タを作成するため、前フレームにおける固定次元のデー
タに基づいて現フレームの固定次元のデータを予測する
予測手段と、予測データと補間手段の出力するデータと
の差分を算出する差分手段とを設け、差分手段の出力デ
ータをベクトル量子化手段に供給するように構成してい
る。
【0011】さらに、補正手段に供給するデータを作成
するため、ベクトル量子化されたベクトルの要素と予測
手段の出力する予測データとを加算する加算手段と、加
算手段の出力するデータに基づいてスペクトル振幅値を
復号する第2の補間手段とを設け、補正手段において、
第2の補間手段の出力データとスペクトル振幅値の入力
データとの誤差が最小になるように補正を行なわせてい
る。
【0012】
【作用】この音声符号化装置では、スペクトル振幅値の
入力データから、補間によって、固定次元化したスペク
トル振幅値データを作成している。このようにデータを
固定次元化したことにより、データのベクトル量子化が
可能になる。
【0013】また、固定次元化によって、フレーム間の
相関が利用できることになり、予測値との差分を取る方
式が適用できる。
【0014】さらに、量子化誤差の補正に当たっては、
量子化したデータからスペクトル振幅値を復号し、この
復号した値とスペクトル振幅値の実際の入力データとの
間の誤差が最小になるように補正を行なうが、この場合
にも、区間毎に1つの代表点を補正するだけで済ませる
ことができる。
【0015】
【実施例】本発明の実施例におけるMBE方式の音声符
号化装置は、スペクトル振幅量子化部として、図1に示
すように、入力したスペクトル振幅値から固定次元のス
ペクトル振幅値を補間する第1補間器1と、前フレーム
のスペクトル振幅値より現フレームのスペクトル振幅値
を予測する予測器2と、補間した振幅値と予測値との誤
差を求める差分器3と、出力された差分を要素とするベ
クトルを量子化するベクトル量子化器4とを備え、ま
た、ベクトル量子化に伴う誤差量を符号化する構成とし
て、量子化されたベクトルと予測値とを加算して固定次
元のスペクトル振幅値を算出する加算器5と、算出した
スペクトル振幅値からスペクトル振幅を復号する第2補
間器6と、この復号したスペクトル振幅と実際に入力し
たスペクトル振幅値との間の誤差が最小になるように固
定次元のスペクトル振幅値の1つを補正する補正器7
と、補正器7により得られる補正量をスカラー量子化す
るスカラー量子化器8とを備えている。
【0016】このスペクトル振幅量子化部の動作を、図
2〜図6を用いて説明する。
【0017】入力したスペクトル振幅値のN1点のデー
タを図2では黒丸で表示している。第1補間器1では、
このN1点のデータを基に、与えられたデータ点(点線
上の点)を通るN2点のスペクトル振幅値(白丸)を補
間する。この白丸のスペクトル振幅値が固定次元のデー
タとなる。
【0018】予測器2では、得られた固定次元のスペク
トル振幅値から次フレームにおける振幅値を予測する。
【0019】一方、差分器3では、固定次元における各
スペクトル振幅値と前フレームから得られた予測値との
差分を求め、ベクトル量子化器4では、この固定次元の
差分を要素とするベクトルを量子化する。
【0020】加算器5では、この量子化されたベクトル
の要素と予測振幅値とを加算して、固定次元におけるス
ペクトル振幅値を算出する。この量子化により得られた
スペクトル振幅値は、図3において△で示すように、ベ
クトル量子化に伴う量子化誤差を含んでいる。
【0021】この量子化誤差の補正データを作成するた
めに、まず、加算器5から出力された、量子化により得
られたスペクトル振幅値データを用いて、元のスペクト
ル振幅値を復号する。そのために、図4に示すように、
幾つかのデータを含む複数の補間区間を設定し、第2補
間器6を用いてデータ間の値を埋めるための補間を行な
う。この補間によって得られた補間曲線は図5に示され
ている。なお、図5において、黒丸は入力したスペクト
ル振幅値を、また、白丸は量子化により得られたスペク
トル振幅値のデータを示している。
【0022】次に、図6に図示するように、各補間区間
において、補間によって得られたスペクトル振幅と入力
したスペクトル振幅(黒丸)との誤差が最小になるよう
に、量子化により得られたスペクトル振幅値(白丸)の
1つを補正器7を用いて補正する。
【0023】図6では、補正したスペクトル振幅値を四
角によって表示している。図から明らかなように、量子
化により得られた点の1つを補正するだけで補間曲線を
入力データに近づけることができる。量子化により得ら
れた点の全ては、固定次元化され、図6における横軸方
向の位置が固定されているため、量子化誤差の補正情報
としては、補正した1点の補正量を知らせるだけで足り
る。
【0024】この補正器7で行われた補正の補正量は、
スカラー量子化器8によりスカラー量子化され、出力さ
れる。
【0025】このように、実施例の装置では、スペクト
ル振幅を固定次元化しているため、スペクトル振幅値に
対して直接ベクトル量子化することができる。また、フ
レーム間の相関を利用することが可能になり、差分を用
いて符号化の効率を上げることができる。さらに、量子
化誤差の補正に際しては、区間内の1点を補正するだけ
で済ませることができる。これらは、いずれも音声符号
化における低ビット・レート化に大きく貢献している。
【0026】
【発明の効果】以上の実施例の説明から明らかなよう
に、本発明の音声符号化装置は、低ビット・レートで音
声符号化を行なうことができる。また、量子化誤差を適
切に補正することができるため、高精度の音声符号化が
可能である。
【図面の簡単な説明】
【図1】本発明の音声符号化装置における一実施例の構
成を示すブロック図、
【図2】実施例の装置における第1補間器の補間動作を
説明する図、
【図3】実施例の装置において生ずる量子化誤差を説明
する図、
【図4】実施例の装置において補間区間を分割する動作
を説明する図、
【図5】実施例の装置における第2補間器の補間動作を
説明する図、
【図6】実施例の装置における補正器の補正動作を説明
する図、
【図7】従来のMBE方式音声符号化装置の構成を示す
ブロック図、
【図8】従来の前記装置のスペクトル振幅量子化部の構
成を示すブロック図である。
【符号の説明】
1 第1補間器 2 予測器 3 差分器 4、45 ベクトル量子化器 5 加算器 6 第2補間器 7 補正器 8、46 スカラー量子化器 10 音声分析部 20 基本周波数量子化部 30 有声/無声判定量子化部 40 スペクトル振幅量子化部 41 スペクトル振幅帯域分割器 42 離散コサイン変換器 43 係数弁別器 44 ベクトル合成器 50 多重化部

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音声を基本周波数に従って複数の帯
    域に分割し、各帯域毎に有声/無声を判定し、スペクト
    ル振幅を量子化するMBE(Multi-Band Excitation)
    式の音声符号化装置において、 スペクトル振幅値の入力データから固定次元のデータを
    周波数軸方向に対して補間する補間手段と、前記固定次
    元のデータに基づいてベクトル量子化を行なうベクトル
    量子化手段と、前記ベクトル量子化に伴う量子化誤差を
    補正する補正手段と、前記補正における補正量をスカラ
    ー量子化するスカラー量子化手段とを備えることを特徴
    とする音声符号化装置。
  2. 【請求項2】 前記ベクトル量子化手段に供給するデー
    タを作成するため、前フレームにおける固定次元のデー
    タに基づいて現フレームの固定次元のデータを予測する
    予測手段と、予測した前記データと前記補間手段の出力
    するデータとの差分を算出する差分手段とを設け、前記
    差分手段の出力データを前記ベクトル量子化手段に供給
    することを特徴とする請求項1に記載の音声符号化装
    置。
  3. 【請求項3】 前記補正手段に供給するデータを作成す
    るため、前記ベクトル量子化されたベクトルの要素と前
    記予測手段の出力する予測データとを加算する加算手段
    と、該加算手段の出力するデータに基づいてスペクトル
    振幅値を復号する第2の補間手段とを設け、前記補正手
    段において、前記第2の補間手段の出力データとスペク
    トル振幅値の入力データとの誤差が最小になるように前
    記補正を行なうことを特徴とする請求項1または2に記
    載の音声符号化装置。
JP04238853A 1992-08-17 1992-08-17 音声符号化装置 Expired - Fee Related JP3130673B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04238853A JP3130673B2 (ja) 1992-08-17 1992-08-17 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04238853A JP3130673B2 (ja) 1992-08-17 1992-08-17 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH0669809A JPH0669809A (ja) 1994-03-11
JP3130673B2 true JP3130673B2 (ja) 2001-01-31

Family

ID=17036239

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04238853A Expired - Fee Related JP3130673B2 (ja) 1992-08-17 1992-08-17 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3130673B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4744991B2 (ja) * 2005-09-06 2011-08-10 株式会社ディーアンドエムホールディングス オーディオ信号出力装置

Also Published As

Publication number Publication date
JPH0669809A (ja) 1994-03-11

Similar Documents

Publication Publication Date Title
JP4731775B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
US6721700B1 (en) Audio coding method and apparatus
US8311815B2 (en) Method, apparatus, and program for encoding digital signal, and method, apparatus, and program for decoding digital signal
JP4101957B2 (ja) 音声パラメータの合同量子化
US5214741A (en) Variable bit rate coding system
EP0734014A1 (en) Coding apparatus
JP2004526213A (ja) 音声コーデックにおける線スペクトル周波数ベクトル量子化のための方法およびシステム
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
JP2007504503A (ja) 低ビットレートオーディオ符号化
JP2004289196A (ja) ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
KR100416363B1 (ko) 선형 예측 분석 대 합성 엔코딩 방법 및 엔코더
JP3130673B2 (ja) 音声符号化装置
KR20000064913A (ko) 저ㄴ송 시스템, 수신기, 및 재구성된 음성 신호 유도 방법
JP3435310B2 (ja) 音声符号化方法および装置
JPH08129400A (ja) 音声符号化方式
JP4195598B2 (ja) 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム
JP2905155B2 (ja) 音声符号化装置
JP3715417B2 (ja) 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0612097A (ja) 音声の予測符号化方法および装置
JP3028885B2 (ja) ベクトル量子化装置
JPH11352999A (ja) 音声圧縮符号化装置
JPH09185395A (ja) 音声符号化装置及び音声復号化装置
JPH08137494A (ja) 音響信号符号化装置、音響信号復号装置および音響信号処理装置
JPH11133999A (ja) 音声符号化・復号化装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees