JPH04243300A - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JPH04243300A
JPH04243300A JP3004185A JP418591A JPH04243300A JP H04243300 A JPH04243300 A JP H04243300A JP 3004185 A JP3004185 A JP 3004185A JP 418591 A JP418591 A JP 418591A JP H04243300 A JPH04243300 A JP H04243300A
Authority
JP
Japan
Prior art keywords
function
gain
spectral
outputs
calculation circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3004185A
Other languages
English (en)
Inventor
Eisuke Hanada
英輔 花田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3004185A priority Critical patent/JPH04243300A/ja
Publication of JPH04243300A publication Critical patent/JPH04243300A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声信号を低いビットレ
ートで効率的に符号化、復号化するための音声符号化復
号化方式に関する。
【0002】
【従来の技術】音声信号を低いビットレート、例えば1
6Kb/s程度以下で伝送する方式としては、マルチパ
ルス符号化法などが知られている。これらは音源信号を
複数個のパルスの組合せ(マルチパルス)で表し、声道
の特徴をデジタルフィルタで表し、音源パルスの情報と
フィルタの係数を、一定時間区間(フレーム)毎に求め
て伝送している。この方法の詳細については、例えばア
ラセキ、オザワ、オノ、オチアイ氏による“Multi
−pulse  Excited  SpeechCo
der  Based  on  Maximum  
Crosscorrelation  Search 
 Algorithm”,(GLOBECOM83,I
EEE  Global  Telecommunic
ation,講演番号23.3,1983)(文献1)
に記載されている。この方法では、声道情報と音源信号
を分離してそれぞれ表現すること、および音源信号を表
現する手段として複数のパルス列の組合せ(マルチパル
ス)を用いることにより、復号後に良好な音声信号を出
力することができる。
【0003】
【発明が解決しようとする課題】しかしながら、この従
来法ではビットレートが充分に高く音源パルスの数が充
分なときは音質が良好であったが、ビットレートを下げ
て行くと音質が低下するという問題点があった。
【0004】この問題点を改善するために、伝送する音
源パルス数を削減する方法として、マルチパルス音源の
ピッチ毎の準周期性(ピッチ相関)を利用したピッチ予
測マルチパルス法が提案されている。この方法の詳細は
、例えば、特願昭58−139022号明細書(文献2
)に詳しいのでここでは説明を省略する。しかし、削減
が可能なパルス数には限界がある。
【0005】一方、伝送すべきスペクトルパラメータは
、1フレームに対して分析次数個存在する。スペクトル
パラメータを量子化する方法としては、衆知の方法であ
るスカラー量子化、または効率よく量子化する方法とし
て衆知の方法であるベクトル量子化を用いることが多い
。ベクトル量子化については、例えばアール・エム・グ
レイ氏による“ベクトル・クォンタイゼイション・フォ
ー・スピーチ・コーディング・アンド・リコグニション
”(アメリカ音響学会誌80、Q1,1986.文献3
)(R.M.Gray,“Vector  quant
izationfor  speech  codin
g  and  recognition”(J.Ac
oust.Soc.America,vol.80,S
uppl.1,Q1,1986))に詳しいのでここで
は説明を省略する。
【0006】さらに、予め定められた個数の関数を用い
てスペクトルパラメータを効率よく表現する手法として
、テンポラルデコンポジションと呼ばれる手法がある。 テンポラルデコンポジションについては、例えばビー・
エス・アタール氏による“エフィシェント・コーディン
グ・オブ・エルピーシー・パラメターズ・バイ・テンポ
ラル・デコンポジション”(アイ・シー・エー・エス・
エス・ピー83、講演番号2.6  1983、文献4
)(B.S.Atal,“EFFICIENTCODI
NG  OF  LPC  PAREMETERS  
BY  TEMPORALDECOMPOSITION
”(ICAASP  83,2.6  pp.81−8
4,1983)に詳しいのでここでは説明を省略する。
【0007】しかし、スカラー量子化を用いた場合は、
伝送するべき情報が多くなり、このままでビットレート
を下げて行くと顕著にも音質が劣化するという問題点が
ある。また、ベクトル量子化を用いた場合にも、伝送効
率はよくなるものの、最適なベクトルを求めるための計
算量が非常に多く、また再生された音質も低下するとい
う問題点があった。さらに、前記文献4にみられるよう
なテンポラルデコンポジションについても、最適な関数
を求めるための計算量が非常に多いうえ計算方法が複雑
であり、実用に供するのは困難であった。
【0008】本発明の目的は、ビットレートが高いとこ
ろでも、下げていっても従来よりも良好な音声を再生す
ることが可能で、少ない演算量で実現可能な音声符号化
方式を提供することにある。
【0009】
【課題を解決するための手段】本発明による音声符号化
方式は、離散的な音声信号を入力し、予め定められた時
間長のフレーム毎にスペクトル包絡を表すスペクトルパ
ラメータと音源信号を抽出し、前記スペクトルパラメー
タと前記音源信号を量子化して組み合わせて伝送する音
声符号化方式において、予め複数個の両端が予め定めら
れた長さにわたって滑らかに減衰している関数を有し、
前記関数の中から前記関数の前記フレーム長と同じ長さ
の中心部分の自己相関と前記関数の前記フレーム長と同
じ長さの中心部分と前記入力信号から抽出されたスペク
トルパラメータとの相互相関を用いて最適なものを選択
して、前記フレームの境界から前後にそれぞれ予め定め
た時間長にわたって前記選択した関数を重ね合わせつつ
前記スペクトルパラメータを量子化するスペクトルパラ
メータ量子化手段を有する。
【0010】
【作用】本発明は、前記文献2のピッチ予測マルチパル
ス符号化法において、少ない伝送情報量で、音声信号を
従来法より効率的に表現するために、伝送するべきスペ
クトルパラメータを予め定められた複数個の関数の中か
ら、前記入力された信号を最適に表現するものを少ない
計算量で選択して表す。
【0011】本発明の作用を図2を用いて説明する。図
2はスペクトルパラメータを予め定められた個数の関数
を用いて表現するための量子化器のブロック図である。
【0012】図2において入力端子300からは量子化
すべきスペクトルパラメータの時系列yi (n)が入
力される。コードブック250には予め定められた複数
個の関数Φk (n)がコードとして納められている。 最適なコード及びゲインを計算するために自己相関計算
回路252はコードの自己相関を、相互相関計算回路2
51はコードと入力信号との相互相関を計算する。自己
相関計算回路252の出力と相互相関計算回路251の
出力を用いてゲイン計算回路260は選択されたコード
にかけるべき最適なゲインを計算する。誤差計算回路2
65は選択されたコードにゲインをかけ、入力信号との
誤差を計算し、選択したコードのインデクス及び最適な
ゲイン、及び誤差を出力する。コードブック選択回路2
70は各コードブックに対する誤差計算回路265の出
力を保持し、全てのコードブックに対して求めた誤差の
内最小となる最適なコードのインデクス及び最適なコー
ドに対応する最適なゲインを出力する。
【0013】以下、本発明の作用を式を用いて説明する
。入力音声から算出された複数個のスペクトルパラメー
タの時系列のうち、i番目のもの(以下、これをi次の
パラメータ時系列と呼ぶ。)をyi (n)とする。前
記i次のパラメータ時系列yi (n)を表現するため
に用いる関数をΦで表し、そのうちk番目のものをΦk
 (n)で表す。これを用いると、次の式(1)が成り
立つ。
【0014】
【0015】ここでyi (n)はΦk (n)を用い
てyi (n)を近似した時系列を表し、aikは、i
次のパラメータ時系列における、Φk (n)にかかる
ゲインである。従って、最適な近似を行なうためには最
適なΦk (n)及びaikを見つければよい。従来例
では、前記文献4に示されている様な誤差尺度を用いて
最適な関数を算出している。さらに文献4においては、
算出された関数と計算されたゲインを再度交互的に修正
して誤差を小さくしている。これに対し、本発明におい
ては、次の式(2)で表す誤差Eを考える。
【0016】
【0017】(2)式は、分析次数の個数だけ存在する
パラメータ時系列のうちi次のパラメータ時系列に対す
る関数Φk (n)及びゲインaikを用いた場合の入
力信号yi (n)との誤差を示す式である。ここでn
1 は関数Φk (n)を用いて表現しようとするパラ
メータ時系列区間(フレーム)の始端を表し、n2 は
表現しようとするフレーム区間の終端を表す。
【0018】(2)式をaikについて最小化すると、
aikは(3)式によって求められる。
【0019】
【0020】このとき、誤差Eは次の形となるので、

0021】
【0022】Eを最小化するΦk (n)は、(4)式
第2項を最大化する、即ちaikを最大化するように選
択すればよい。なお、関数Φk (n)は、種々の多項
式関数を用いてもよいし、音声信号中から学習によって
求めてもよい。
【0023】なお、本発明においては関数Φk (n)
の長さは関数Φk (n)を用いて表現しようとするフ
レーム長よりも予め定められた長さだけ長く作成されて
おり、かつその両端は滑らかに0になってゆく形となっ
ている。このような形を取る関数Φk (n)の一例を
図3に示す。関数Φk (n)を図3に示したような形
にすることによって関数Φk (n)と関数Φk (n
)に対して時間的に続いている関数Φk (n+1)の
間に不連続が発生しない。これら関数の両端部分の傾斜
は直線的なものであっても良いし、例えば衆知のハミン
グ窓を用いた形としてもよい。これらの窓を表す式につ
いては、例えば斎藤、中田両氏による「音声情報処理の
基礎」(オーム社、昭和56年、文献5)第2章に詳し
いのでここでは説明を略す。
【0024】以上示したような方法を用いることによっ
て、文献4における方法に対して大幅に計算量を削減し
た上、誤差を良好に小さく保つことが可能である。
【0025】
【実施例】図1は、本発明の一実施例を示すブロック構
成図である。図1において、入力端子500から離散的
な音声信号を入力する。時間分割回路510は入力され
た音声信号を時間的に一様なフレーム毎(例えば100
msec.毎)に分割する。ピッチパラメータ計算回路
515はピッチの微細構造を表わすピッチパラメータを
計算する。計算方法は文献2に示されているような方法
を用いる。量子化器516は求められたピッチパラメー
タを量子化する。逆量子化器518は、量子化した結果
を用いて逆量子化して出力する。
【0026】スペクトルパラメータ計算回路520では
分割した区間の音声信号のスペクトルを表すスペクトル
パラメータを、衆知のLPC分析法によって求める。求
められたスペクトルパラメータに対しては、コードブッ
ク521の中に予め定められた個数用意されたコードを
用いて作用の項において説明したような方法を用いてゲ
イン計算回路522において各コードに対して最適なゲ
インを計算する。コードブック選択回路525は、各コ
ードブックに対するゲイン計算回路522の出力である
誤差の内最小であるものを選択し、選択されたコードの
インデクスと最適なゲインを出力する。逆量子化器53
0は、コードブック選択回路525の出力である選択さ
れたコードのインデクスと最適なゲインを用いて逆量子
化して出力する。
【0027】重み付け回路540は、逆量子化されたス
ペクトルパラメータを用いて分割された音声信号に重み
付けを行う。重み付けの方法は、昭59−272435
号明細書(文献6)の重み付け回路200を参照するこ
とができる。インパルス応答計算回路550は、逆量子
化されたピッチパラメータと逆量子化されたスペクトル
パラメータを用いてインパルス応答を計算する。具体的
な方法は文献2を参照できる。自己相関計算回路560
はインパルス応答の自己相関を計算し音源パルス計算回
路580へ出力する。自己相関の計算法は文献2の自己
相関関数計算回路180を参照することができる。相互
相関計算回路570は重み付けられた信号とインパルス
応答との相互相関を計算して音源パルス計算回路580
へ出力する。具体的な方法は文献2を参照できる。
【0028】音源パルス計算回路580では、マルチパ
ルスをピッチ予測により、予め定められた個数だけ求め
る。マルチパルス列の計算方法については、文献2の音
源パルス計算回路210を参照することができる。量子
化器590は音源マルチパルス列を量子化して符号を出
力する。
【0029】量子化器590の出力であるマルチパルス
列を量子化した符号、量子化器516の出力であるピッ
チパラメータを量子化した符号、さらにコードブック選
択回路525の出力である選択されたコードのインデク
スと最適なゲインを表す符号は、それぞれマルチプレク
サ630の入力となる。マルチプレクサ630は以上の
各符号を組み合わせて出力する。
【0030】以上述べた構成は本発明の一構成に過ぎず
、種々の変形も可能である。
【0031】マルチパルスの計算方法としては、文献1
に示した方法の他に、種々の衆知な方法を用いることが
できる。
【0032】また、スペクトルパラメータとしては、他
の衆知なパラメータ(線スペクトル対、ケプストラム、
メルケプストラム、対数断面積比等)を用いることもで
きる。
【0033】さらに、コードブック521に納められて
いる関数の両端部分の傾斜は直線的なものであっても良
いし、例えば衆知のハミング窓を用いた形としてもよい
。これらの窓を表す式については、文献5第2章に詳し
いのでここでは説明を略す。
【0034】
【発明の効果】本発明によれば、スペクトルパラメータ
を予め定められた複数個の関数を用いてかつフレームの
境界付近に於て重ね合わせを用いて表すことで、従来法
に比べ非常に少ない計算量で、かつ従来法に比べ少ない
伝送情報量で音声信号を良好に表すことができるという
大きな効果がある。
【図面の簡単な説明】
【図1】本発明による音声符号化方式の一実施例を示す
ブロック構成図である。
【図2】本発明の作用を示すブロック図である。
【図3】本発明においてスペクトルパラメータを表す関
数Φk (n)の一例を示す図である。
【符号の説明】
250    コードブック 251    相互相関計算回路 252    自己相関計算回路 260    ゲイン計算回路 265    誤差計算回路 270    コードブック選択回路 500    入力端子 510    時間分割回路 515    ピッチパラメータ計算回路520   
 スペクトルパラメータ計算回路516,590   
 量子化器 518,530    逆量子化器 521    コードブック 522    ゲイン計算回路 525    コードブック選択回路 540    重み付け回路 550    インパルス応答計算回路560    
自己相関計算回路 570    相互相関計算回路 580    音源パルス計算回路 630    マルチプレクサ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  離散的な音声信号を入力し、予め定め
    られた時間長のフレーム毎にスペクトル包絡を表すスペ
    クトルパラメータと音源信号を抽出し、前記スペクトル
    パラメータと前記音源信号を量子化して組み合わせて伝
    送する音声符号化方式において、予め複数個の両端が予
    め定められた長さにわたって滑らかに減衰している関数
    を有し、前記関数の中から前記関数の前記フレーム長と
    同じ長さの中心部分の自己相関と前記関数の前記フレー
    ム長と同じ長さの中心部分と前記入力信号から抽出され
    たスペクトルパラメータとの相互相関を用いて最適な関
    数を選択して、前記フレームの境界から前後にそれぞれ
    予め定めた時間長にわたって前記選択した関数を重ね合
    わせつつ前記スペクトルパラメータを量子化するスペク
    トルパラメータ量子化手段を有することを特徴とする音
    声符号化方式。
JP3004185A 1991-01-18 1991-01-18 音声符号化方式 Pending JPH04243300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3004185A JPH04243300A (ja) 1991-01-18 1991-01-18 音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3004185A JPH04243300A (ja) 1991-01-18 1991-01-18 音声符号化方式

Publications (1)

Publication Number Publication Date
JPH04243300A true JPH04243300A (ja) 1992-08-31

Family

ID=11577650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3004185A Pending JPH04243300A (ja) 1991-01-18 1991-01-18 音声符号化方式

Country Status (1)

Country Link
JP (1) JPH04243300A (ja)

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
US6594626B2 (en) Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook
JP3196595B2 (ja) 音声符号化装置
US5027405A (en) Communication system capable of improving a speech quality by a pair of pulse producing units
JP3357795B2 (ja) 音声符号化方法および装置
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP3266178B2 (ja) 音声符号化装置
JPH0944195A (ja) 音声符号化装置
EP0871158A2 (en) System for speech coding using a multipulse excitation
JPH0854898A (ja) 音声符号化装置
JP3185748B2 (ja) 信号符号化装置
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JPH08234795A (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3089967B2 (ja) 音声符号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JPH04243300A (ja) 音声符号化方式
JP2946528B2 (ja) 音声符号化復号化方法及びその装置
JP3192051B2 (ja) 音声符号化装置
JP3024467B2 (ja) 音声符号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP2658794B2 (ja) 音声符号化方式
JP3035960B2 (ja) 音声符号化復号化方法及びその装置
JP2615862B2 (ja) 音声符号化復号化方法とその装置