JPH1055198A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH1055198A
JPH1055198A JP8227758A JP22775896A JPH1055198A JP H1055198 A JPH1055198 A JP H1055198A JP 8227758 A JP8227758 A JP 8227758A JP 22775896 A JP22775896 A JP 22775896A JP H1055198 A JPH1055198 A JP H1055198A
Authority
JP
Japan
Prior art keywords
delay
code
correlation
residual
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8227758A
Other languages
English (en)
Inventor
Keiichi Funaki
慶一 舟木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP8227758A priority Critical patent/JPH1055198A/ja
Publication of JPH1055198A publication Critical patent/JPH1055198A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】8〜4kb/s程度の音声符号化方式におい
て、長期予測におけるピッチトラッキングの効率を下げ
ず、演算量を低減し、低クロックでも良好な符号化音を
実現する音声符号化方式の提供。 【解決手段】長期予測において、滑らかに変化するピッ
チパタンを推定するために、クローズドループ処理を用
いて、各サブフレームにおける相互相関値、自己相関値
を算出し、1フレームにわたり、各サブフレームの相関
値を用いて滑らかなピッチパスを求める。自己相関の算
出にあたり、Kleijn法を用いて逐次的に算出すること
により、性能を落とさずに、演算量を10MOPS以上
低減する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を低いビ
ットレート、例えば8〜4kb/s程度で高品質に符号
化するためのCELP(Code-Excited Linear Predicti
on)方式による音声符号化方式に関し、特に、長期予測
部を低演算量で高精度に推定する音声符号化方式に関す
る。
【0002】
【従来の技術】近年、無線を媒介にして自動車電話やコ
ードレス電話のディジタル化が急がれている。無線では
使用できる周波数帯域が少ないため、音声信号を低ビッ
トレートで符号化する方式の開発は重要である。
【0003】音声信号を8〜4kb/s程度の低いビッ
トレートで符号化する方式としては、例えば、アメリカ
のアタルらによるアイキャスプ プロシーディング記載
のコードエキサイテッド リニア プレディクション:
ハイ クオリティ スピーチアト ロウ ビット レー
ツ(M. Schroeder and B. S. Atal, “Code-exci
ted linear prediction:High quality speech at low
bit rates”, ICASSP Proc., pp.937-940, 198
5.)と題した論文(以後「文献1」という)等に記載さ
れているCELP(Code Excited Linear Predicti
on)が知られている。
【0004】この方法においては、送信側では次の手順
で符号化処理が行われる。
【0005】先ずフレーム毎(例えば20ms)に音声
信号から音声の周波数特性を表す短期予測符号を抽出す
る(短期予測)。次に、フレームをさらに小区間のサブ
フレーム(例えば5ms)に分割する。サブフレーム毎
に、予め用意された音声のピッチ相関を表す遅延符号の
組と過去の音源信号からなる適応コードブックを用い
て、最適な遅延符号を次の手順で決定する(長期予
測)。
【0006】遅延符号を、予め用意された分、変化(試
行)させ、各遅延符号に対する遅延値、すなわちピッチ
周期だけ、過去の音源信号を遅延させることにより、適
応コードベクトルを抽出する。
【0007】抽出された適応コードベクトルを用いて合
成信号を生成し、音声信号との誤差電力(評価尺度)を
算出する。
【0008】算出された距離が最小になる最適遅延符号
と、最適遅延符号に対応する適応コードベクトルとその
ゲインを決定する(適応コードブック探索)。
【0009】次に、予め用意された種類の音源の量子化
符号である雑音信号(音源コードブック)から抽出した
音源コードベクトルによる合成信号と、長期予測の残差
信号との距離が最小になる音源コードベクトルとゲイン
を決定する(音源探索)。
【0010】決定された適応コードベクトルならびに音
源コードベクトルの種類を表すインデクスと、各々の音
源信号のゲイン、ならびにスペクトルパラメータの種類
を表すインデックスをマルチプレクスして伝送する。
【0011】従来のCELP方式のブロック図を図5に
示す。図5を参照して、符号化処理側は、入力端子10
0から入力された音声信号を記憶するバッファ110、
音声のスペクトルパラメータであるLPC係数を抽出す
る音声分析回路120、LPC係数を量子化するパラメ
ータ量子化回路130、音声信号に対し聴感重み付けを
行う重み付け回路140、適応コードブック150、ピ
ッチ相関を表す遅延符号(適応コードベクトル)を探索
する長期予測回路160−1、音源コードブック17
0、音源コードブックから最適な音源の量子化符号(音
源コードベクトル)を決定する音源探索回路180、ゲ
インコードブック190、符号化列を組み合わせて出力
するマルチプレクサ210と、を備えている。また、復
号化処理は、符号化されたコードを符号系列にデコード
する回路であるデマルチプレクサ210、適応コードブ
ック150、音源コードブック170、ゲインコードブ
ック190、及び合成フィルタ230を備えている。
【0012】具体的な適応コードベクトルの遅延符号の
探索法は次の手順で行われる。
【0013】先ず、入力された音声信号x[n]に対し
聴感上の重み付け、過去の影響信号の減算を行った信号
z[n]を算出する。
【0014】次に、短期予測で求められ、量子化、逆量
子化されたスペクトルパラメータで構成される合成フィ
ルタHを遅延符号dに対応する適応コードベクトルed
[n]で駆動して合成信号H・ed[n]を算出する。
【0015】z[n]とH・ed[n]の誤差電力(評
価尺度)である、次式(1)のEdが最小になる遅延符
号dを求める。
【0016】
【数1】
【0017】ここで、Nsはサブフレーム長を、Hは合
成フィルタを実現する行列を、gdは適応コードベクト
ルedのゲインを表す。実際には上式(1)は、次式
(2)のように展開される。
【0018】
【数2】
【0019】上式(2)の分子Cdは相互相関、分母Gd
は自己相関であり、それぞれ次式(3)、(4)で算出
される。
【0020】
【数3】
【0021】ここで、ed[n]は、過去のフレームに
おける符号化処理により求められた音源信号を遅延符号
dに相当する遅延値分遅延させたベクトルである。
【0022】以上のように、フィルタリング処理を用い
て最適な遅延符号を求める長期予測の方法をクローズド
ループ処理による適応コードブック探索と呼ぶ。
【0023】CELP系の音声符号化方式の場合、音質
は長期予測の予測精度に依存する。長期予測の予測精度
を上げる手段としては、遅延符号を整数点から小数点に
拡張する小数点遅延化が一般的に行われている。これ
は、例えば、アメリカのクルーンらによるアイキャスプ
プロシーディング記載のピッチ プレディクターズウ
ィズ ハイ テンポラル レゾルーション(P. Croon
et.at., “Pitch Predictors With High Tempora
l Resolution”, ICASSP Proc., pp.661-664,
1990.)(以下「文献2」という)が参照される。
【0024】小数点遅延化により音質がかなり向上する
が、各々のサブフレーム内での最適化であるため、複数
のサブフレームにわたる遅延値の変化、すなわち、ピッ
チパスは必ずしもスムーズにはならず、度々、大きなギ
ャップが生じる。そして、ピッチパスにおけるギャップ
は、符号化音において不連続音や波形の揺らぎを引き起
こし、音質劣化の原因になっている。
【0025】そこで、各サブフレーム毎に、音声信号そ
のものの整合であるオープンループ処理で遅延符号の候
補を求め、フレーム全体で遅延値(ピッチ)が滑らかに
変化するようにピッチ変化経路(ピッチパス)を求める
方法が提案されている。この方法は、例えば、アメリカ
のガーソンらによる、アイトリプルイー ジャーナル記
載のテクニックス フォー インプルービング ザ パ
フォーマンス オブセルプ タイプ スピーチ コーダ
ーズ(I. A. Gerson and M. A. Jasiuk, “Tech
niques for Improving the Performance of CELP
−Type Speech Coders”, IEEE Journal on S
elected Areas)(以下「文献3」という)で参照でき
る。
【0026】この方法は、次式(5)、(6)で表され
る、聴感重み付け信号xとその遅延ベクトルxdの相関
を用いて、ピッチパスを求めている。しかし、遅延ベク
トルと現ベクトル(聴感重み付け信号)のスペクトル成
分は異なるため、この方法における整合はピッチ成分の
みの整合にはならず、ピッチ誤推定の発生原因になって
いる。
【0027】
【数4】
【0028】上式(5)において、<a,b>は、ベク
トルaとベクトルbとの内積を示している。
【0029】そこで、遅延ベクトルと現ベクトルのスペ
クトル成分を一致させ、ピッチ推定精度を向上させる方
法として、クローズドループ処理によるピッチパス推定
法が提案されている。この方法は、例えば特許願6−3
23454号、または舟木らによる平成7年春季日本音
響学会講演論文集記載の“4kb/s CELPにおけ
るclosed-loopピッチトラッキングを用いた適応コード
ブック探索法”、I-pp.239-240, 1995. で参照できる
(以下「文献4」という)。
【0030】この方法では、長期予測におけるピッチパ
ス推定を、次式(7)のように、過去の残差信号を遅延
させて得られる遅延残差ベクトルrdに対し、短期予測
符号により決定される合成フィルタHでフィルタリング
するクローズドループ処理により算出される、評価尺度
または相関値を用いて行う。
【0031】すなわち、上記文献1に提案されている従
来法における、上式(1)に代えて、次式(7)で示さ
れる距離または相関を用いて、複数のサブフレームにわ
たるピッチパスを求める。
【0032】
【数5】
【0033】ここで、r[n]は、現サブフレームの残
差信号、rd[n]は、r[n]をd遅延させた遅延残
差信号ベクトル、Hは合成フィルタ、gはゲイン、di
は、遅延符号dに相当する遅延値をそれぞれ表してい
る。
【0034】上式(7)は、次式(9)のようにベクト
ル表現できる。
【0035】
【数6】
【0036】上式(9)より、この方式では、スペクト
ル成分(HT・H)は、各試行遅延dに対して独立にな
る。なお、HTはマトリクスHの転置を表わす。
【0037】また、(r−g・rd)は、スペクトルの
影響が低減されたピッチ重み付け成分の差になるため、
従来のオープンループ処理の音声信号と遅延音声ベクト
ルの整合に比べ、より精密な整合になる。したがって、
従来のオープンループ処理によるピッチパス推定より、
誤りの少ないピッチパスの推定が実現できる。さらに、
残差信号を用いて、上式(7)の距離を用いることによ
り、上式(1)のような過去の音源を用いる距離では実
現が不可能であった、上記文献3に示されるような、複
数サブフレームにわたるピッチパス推定が実現可能にな
る。
【0038】クローズドループピッチパス推定の手順に
ついて、図6を用いて説明する。
【0039】先ず、逆フィルタを用いて残差信号を算出
する(逆フィルタ回路、ステップ300)。
【0040】遅延符号を整数遅延分(例えば16から9
6)試行させ(ステップ310)、試行させた各遅延符
号dに対し、過去の残差信号が蓄積されている残差コー
ドブック420より、遅延符号dに相当する遅延残差ベ
クトルrdを生成する(ステップ320)。
【0041】次に、遅延残差ベクトルrdを用いて、フ
ィルタリング処理により合成信号H・rdを生成する
(ステップ330)。
【0042】符号化サブフレームの聴感重み付け信号x
を用いて、相互相関値<x,H・rd>(ステップ35
0−1)と、自己相関値<H・rd,H・rd>を算出す
る(ステップ340)。
【0043】ステップ300からステップ350−1ま
での処理を、1フレーム内の全サブフレームに対して行
い、各サブフレームで算出された距離E=<x,H・r
d2/<H・rd,H・rd>、または相関を用いて、滑
らかに変化するピッチパスを求める(ステップ36
0)。
【0044】ピッチパスの求め方は、上記文献3で示さ
れているように、相関上で多相フィルタを掛け、小数点
遅延上でピッチパスを探索する。
【0045】求められたピッチパスにしたがって、過去
の符号化結果である過去の音源信号(適応コードブック
150)を用いる。従来のクロックドループ処理による
適応コードブック探索を最後に行い、各サブフレーム毎
の最適遅延符号を求める(ステップ370)。
【0046】この方法により、推定される遅延符号で表
される遅延値(ピッチ)の変化が滑らかになるため音質
が向上する。
【0047】しかし、フィルタリングを用いる方法では
演算量が極めて多くなるため、一般的には、自己相関算
出には、次式(10)で示される自己相関近似法、相互
相関算出には、次式(11)で表される逆方向フィルタ
リングが用いられている。この近似法を用いた従来のク
ローズドループピッチパス推定を、図7に示す。
【0048】自己相関近似法については、例えば、アメ
リカのトランスコ、アタルによるアイキャスプ プロシ
ーディング記載のエフィシエント プロセジャーズ フ
ォーファインディング ジ オプチマム イノベーショ
ン イン ストキャステック コーダーズ(Efficient
Procedures For Finding The Optimum Innovati
on In Stocastic Coders, I. M. Trancoso, B.
S. Atal Proc.ICASSP, 2375-2378, 1986.)
(以下「文献5」という)等が参照される。
【0049】逆方向フィルタリングについては、例え
ば、カナダのアドールらによる、アイキャスプ プロシ
ーディング記載のファースト セルプ コーディング
ベースド オン アルジェブリック コーズ(J. P.
Adoul, et.al., “Fast CELP coding based on a
lgebraic codes”, Proc. ICASSP, pp.1957-196
0, 1987.)(以下「文献6」という)等が参照できる。
【0050】
【数7】
【0051】なお、HTのTは転置を表す。
【0052】ここで、RH[i]は、合成フィルタリン
グHのインパルス応答のi次の自己相関関数、R
r d[i]は遅延dの遅延予測残差ベクトルrdのi次の
自己相関関数を表す。NimはHのインパルス応答長を表
し、一般的にNim=21程度とされている。
【0053】
【発明が解決しようとする課題】上記文献4に示されて
いるクローズドループ処理による探索は、自己相関近似
法を用いても、遅延ベクトルrdが遅延符号d毎に変化
するため、Rr d[i]()i=0,1,2,…,Nim
の算出に多大な演算量を要する、という問題点を有して
いる。この場合、Nimの次数を下げることにより、演算
量は低減されるが、性能は落ちる。
【0054】したがって、本発明は、上記事情に鑑みて
なされたものであって、その目的は、長期予測におい
て、低演算量で、より滑らかなピッチパスを高精度に推
定し、低ビットレートでも良好な音質を得るようにした
音声符号化方式を提供することにある。
【0055】
【課題を解決するための手段】前記目的を達成するた
め、本発明に係る音声符号化装置は、音声信号の一定区
間毎に前記音声信号の周波数特性を表す短期予測符号を
決定する音声分析部と、前記短期予測符号から合成フィ
ルタのインパルス応答を計算するインパルス応答算出部
と、前記短期予測符号を用いて前記音声信号から残差信
号を算出する逆フィルタ部と、過去の音声区間における
前記残差信号を蓄積する残差コードブックと、前記音声
信号のピッチ相関を表す整数の遅延符号を試行させる遅
延符号試行部と、前記残差コードブックを用いて、前記
遅延符号に対応する遅延残差ベクトルを生成する遅延残
差ベクトル生成部と、前記インパルス応答で前記遅延残
差ベクトルをフィルタリングして得られる合成信号の自
己相関を逐次的に算出する自己相関算出部と、前記音声
信号と前記インパルス応答とのフィルタリング信号と前
記遅延残差ベクトルとの相互相関を算出する相互相関算
出部と、前記自己相関と前記相互相関を用いて、一定期
間内で前記遅延符号の値が滑らかに変化するように小数
点の遅延符号を求めるピッチパス推定部、から構成され
る。
【0056】また、本発明に係る音声符号化装置は、音
声信号の一定区間毎に前記音声信号の周波数特性を表す
短期予測符号を決定する音声分析部と、前記短期予測符
号から合成フィルタのインパルス応答を計算するインパ
ルス応答算出部と、前記短期予測符号を用いて前記音声
信号から残差信号を算出する逆フィルタ部と、過去の音
声区間における前記残差信号を蓄積する残差コードブッ
クと、前記音声信号のピッチ相関を表す整数の遅延符号
を試行させる遅延符号試行部と、前記残差コードブック
を用いて、前記遅延符号に対応する遅延残差ベクトルを
生成する遅延残差ベクトル生成部と、前記インパルス応
答で前記遅延残差ベクトルをフィルタリングして得られ
る合成信号の自己相関を逐次的に算出する自己相関算出
部と、前記音声信号と前記インパルス応答とのフィルタ
リング信号と前記遅延残差ベクトルとの相互相関を算出
する相互相関算出部と、前記自己相関と前記相互相関を
用いて、一定期間内で前記遅延符号の値が滑らかに変化
するように小数点の遅延符号を求めるピッチパス推定部
と、前記ピッチパス推定部で求められた遅延符号をもと
に、過去の音源信号により最適な遅延符号を決定する適
応コードブック探索部と、前記音声信号の音源を求めて
量子化する音源量子化部と、から構成される。
【0057】本発明の原理を以下に説明する。
【0058】自己相関を算出する手段として、Kleijn
のFAST逐次アルゴリズムが知られている。これは、
例えば、アメリカのクレインによるスピーチ コミュニ
ケーション記載のアン エフィシエント ストキャスチ
カリー エクサイテッド リニア プレディクティブ
コーディング アルゴリズム フォー ハイ クオリテ
ィ ロー ビット レート トランスミッション オブ
スピーチ(W. B.Kleijn, et.al.,“An Efficien
t Stochastically Excited Linear Predictive Co
ding Algorithm For High Quality Low Bit Rat
e Transmission Of Speech”, Speech Communicat
ion 7, pp.305-316, 1988.)(以下、文献「7」)が
参照できる。
【0059】この方法は、自己相関の初期値を算出後、
次の遅延の自己相関の算出を式(12)により2・Nim
+5回の積和で逐次的に実現できる方法である。
【0060】
【数8】
【0061】ここで、Iは単位行列、In、Sは次式の
ような行列を表す。
【0062】
【数9】
【0063】しかし、Kleijn法は、音源に繰り返しあ
る従来の過去の符号化音源を用いる場合や、小数点遅延
に適用すると、演算量低減の効果が小さくなる。
【0064】そこで、本発明においては、過去の音源に
残差を用いることにより、繰り返しを無くし、整数遅延
で自己相関を算出し、相関上で小数点遅延化することに
より、Klejin法の適用を可能としたものである。
【0065】
【発明の実施の形態】本発明の実施の形態について説明
する。本発明に係る音声符号化装置は、その好ましい実
施の形態において、ピッチ相関を表す遅延符号(適応コ
ードベクトル)を探索する回路である長期予測回路は、
音声信号の一定区間毎に音声信号の周波数特性を表す短
期予測符号から合成フィルタのインパルス応答を計算す
るインパルス応答算出手段(図2の380)と、この短
期予測符号を用いて音声信号から残差信号を算出する逆
フィルタ手段(図2の300)と、過去の音声区間にお
ける前記残差信号を蓄積する残差コードブック(図2の
420)と、音声信号のピッチ相関を表す整数の遅延符
号を試行させる遅延符号試行手段(図2の310)と、
残差コードブック(図2の420)を用いて、遅延符号
に対応する遅延残差ベクトルを生成する遅延残差ベクト
ル生成手段(図2の320)と、インパルス応答で遅延
残差ベクトルをフィルタリングして得られる合成信号の
自己相関を逐次的に算出する自己相関算出手段(図2の
410)と、音声信号とインパルス応答とのフィルタリ
ング信号と前記遅延残差ベクトルとの相互相関を算出す
る相互相関算出手段(図2の350−2)と、自己相関
と相互相関を用いて、一定期間内で前記遅延符号の値が
滑らかに変化するように小数点の遅延符号を求めるピッ
チパス推定手段(図2の360)と、を備えている。
【0066】また、本発明は、その好ましい実施の形態
において、短期予測符号から合成フィルタのインパルス
応答を計算するインパルス応答算出手段(図3の38
0)と、短期予測符号を用いて音声信号から残差信号を
算出する逆フィルタ手段(図3の300)と、過去の音
声区間における前記残差信号を蓄積する残差コードブッ
ク(図3の420)と、音声信号のピッチ相関を表す整
数の遅延符号を試行させる遅延符号試行手段(図3の3
10)と、残差コードブックを用いて、前記遅延符号に
対応する遅延残差ベクトルを生成する遅延残差ベクトル
生成手段(図3の320)と、インパルス応答で遅延残
差ベクトルをフィルタリングして得られる合成信号の自
己相関を逐次的に算出する自己相関算出手段(図3の4
10)と、音声信号とインパルス応答とのフィルタリン
グ信号と前記遅延残差ベクトルとの相互相関を算出する
相互相関算出手段(図3の350−2)と、自己相関と
前記相互相関を用いて、一定期間内で前記遅延符号の値
が滑らかに変化するように小数点の遅延符号を求めるピ
ッチパス推定手段(図3の360)と、ピッチパス推定
手段で求められた遅延符号をもとに、過去の音源信号に
より最適な遅延符号を決定する適応コードブック探索手
段(図3の370)と、を備えている。
【0067】
【実施例】本発明の実施例について図面を参照して以下
に説明する。
【0068】
【実施例1】図1は、本発明の第1の実施例の構成を示
す図である。図1(a)は符号化処理、(b)は復号化
処理を表す。
【0069】図2は、図1の長期予測回路160−2を
詳細に示す図である。
【0070】最初に各構成モジュールを説明する。
【0071】入力端子100は、音声入力端子である。
バッファ110は、音声信号を記憶する回路である。音
声分析回路120は、音声のスペクトルパラメータであ
るLPC係数を抽出する回路である。
【0072】パラメータ量子化回路130は、LPC係
数を量子化する回路である。重み付け回路140は音声
信号に対し聴感重み付けを行う回路である。
【0073】適応コードブック150は、適応コードベ
クトルが蓄えられているコードブックである。
【0074】長期予測回路160−2は、ピッチ相関を
表す遅延符号(適応コードベクトル)を探索する回路で
ある。
【0075】音源コードブック170は、音源コードベ
クトルが蓄えられているコードブックである。
【0076】音源探索回路180は、音源コードブック
から最適な音源の量子化符号(音源コードベクトル)を
決定する回路である。
【0077】ゲインコードブック190は、適応コード
ベクトルのゲイン項と音源コードベクトルのゲイン項を
表すパラメータが蓄積されているコードブックである。
【0078】ゲイン探索回路200は、適応コードベク
トルの量子化ゲインと音源コードブックの量子化ゲイン
をゲインコードブックから決定する回路である。
【0079】マルチプレクサ210は、符号化列を組み
合わせて出力する回路である。
【0080】デマルチプレクサ220は、符号化された
コードを符号系列にデコードする回路である。
【0081】合成フィルタ230は、生成された音源と
音声合成フィルタより音声信号を再生する回路である。
出力端子240は音声出力端子である。
【0082】図2を参照して、逆フィルタ回路300
は、現サブフレームの聴感重み付け回路の出力である聴
感重み付け信号ベクトルxを短期予測符号で決定される
逆フィルタに通し、残差信号を生成する。
【0083】インパルス応答算出回路380は、合成フ
ィルタHのインパルス応答を算出する。
【0084】逆方向フィルタリング回路390は、HT
・xを算出する。
【0085】遅延試行回路310は、整数値の遅延符号
を符号の存在範囲分(例えば16から96)変化させ
る。
【0086】残差コードブック420は、過去の残差信
号が蓄えられているコードブックである。
【0087】遅延ベクトル生成回路320は、残差コー
ドブックから遅延符号dに対応する整数遅延値に相当す
る遅延ベクトルrdを生成する。
【0088】Kleijn法による自己相関算出回路410
は、上式(12)に従い、逐次的に自己相関Gdを算出
する回路である。
【0089】相互相関算出回路350−2は、上式(1
1)の第2項により相互相関を算出する回路である。
【0090】ピッチパス推定回路360は、算出された
自己相関、相互相関を用いて、ピッチが滑らかに変化す
るピッチパスを推定する回路である。
【0091】本実施例の処理の流れを説明する。
【0092】図1(a)を参照して、まず符号化処理で
は、入力ポート100より、音声信号が入力されバッフ
ァ110に保存される。バッファ110に蓄えられた一
定サンプルの音声信号を用いて音声分析回路120で短
期予測分析され、音声信号のスペクトル特性を表すLP
C係数を算出する。LPC分析により求められたスペク
トルパラメータはパラメータ量子化回路130で量子化
され、LPC係数の量子化符号がマルチプレクサ210
に送られると共に、逆量子化され以後の符号化処理に用
いられる。
【0093】バッファ110に蓄えられた音声信号は、
量子化/逆量子化されたLPC係数を用いて重み付け回
路140で聴感上の重み付けがされ、以降のコードブッ
ク探索に用いられる。
【0094】適応コードブック150、音源コードブッ
ク170、ゲインコードブック190でコードブック探
索が行なわれる。
【0095】まず、最初に長期予測回路160−2で長
期予測を行い、ピッチ相関を表す最適遅延符号を決定
し、その符号(遅延符号)をマルチプレクサ210に転
送するとともに、適応コードベクトルの生成を行なう。
【0096】次に、求められた適応コードベクトルの影
響を減算後、音源探索回路180で音源コードブック探
索を行い、音源の量子化符号を決定し、音源コードベク
トルを生成すると共に、音源の量子化符号をマルチプレ
クサ210に転送する。適応コードベクトルと音源コー
ドベクトルが求められた後、ゲイン探索回路200で2
つの音源のゲインを算出し、その符号をマルチプレクサ
210に転送する。マルチプレクサ210では、各コー
ドを組み合わせて伝送コードに変換し、出力する。
【0097】図1(b)を参照して、復号化処理では、
デマルチプレクサで、入力された伝送符号を各符号に分
解する。LPC係数を表す符号よりフィルタ係数をデコ
ードし、合成フィルタ230に転送する。
【0098】遅延符号より適応コードブック150を用
いて適応コードベクトルを生成する。
【0099】音源の量子化符号より音源コードブック1
70を用いて音源コードベクトルを生成する。
【0100】ゲインコードより適応コードベクトルと音
源コードベクトルのゲインを算出し、各音源にゲイン項
を掛け合わせて合成フィルタ230の入力信号を生成す
る。
【0101】最後に入力信号を用いて合成フィルタ23
0で音声信号の合成を行なう。
【0102】次に、本実施例における長期予測部を、図
2を用いて説明する。図2は、図1の160−2の長期
予測回路の処理を詳細に示している。
【0103】まず、逆フィルタ回路300で、現サブフ
レームの聴感重み付け信号ベクトルxの逆フィルタ信号
になる残差信号を求める。
【0104】次に、インパルス応答算出回路380で合
成フィルタHのインパルス応答を算出する。
【0105】次に、逆方向フィルタリング回路390
で、逆方向フィルタリング信号HT・xを算出する。
【0106】遅延試行回路310で整数値を取る遅延符
号を試行させ、各遅延符号毎に、遅延ベクトル生成回路
320、Kleijn法による自己相関算出回路41
0、相互相関算出回路350−2の演算処理を行う。
【0107】遅延ベクトル生成回路320で、遅延試行
回路310で設定された遅延符号dに対応する遅延残差
ベクトルrdを求める。rdは上式(8)にしたがって求
める。
【0108】次に、自己相関算出回路410で、自己相
関、 Gd=<H・rd、H・rd> を上式(12)に従い、Kleijn法により逐次的に求め
る。
【0109】次に、相互相関算出回路350−2で、相
互相関Cdを上式(11)の第2項により求める。
【0110】上記遅延ベクトル生成回路320、自己相
関算出回路410、相互相関算出回路350−2の処理
を1フレーム中の全サブフレームに対し行う。
【0111】遅延試行回路310による処理ループで算
出された、各サブフレームの各整数遅延符号に対応する
相関を用いて、ピッチパス推定回路360で、ピッチを
表す遅延値が滑らかに変化するピッチパスを求める。ピ
ッチパスの推定法としては、上記文献3等に記載される
従来の方法を用いる。
【0112】この方法では先ず、全整数点遅延の距離ま
たは相関値を補間または多相フィルタリングし、小数点
遅延の距離または相関値を求める。多相フィルタリング
については、上記文献2記載の方法が用いられる。
【0113】次に、整数点遅延で、最も予測効率の高か
ったサブフレームとして決定し、最適サブフレームで、
M個(Mは例えば6個)の候補を評価尺度D(Cd 2/G
d)相関)により求める。
【0114】求められた最適サブフレームのM個の候補
に対し、1つ前および1つ後のサブフレームで、遅延の
変化が一定範囲内に収まるように拘束された遅延値の範
囲内で最も評価尺度D(Cd 2/Gd)が大きくなる遅延
符号を求める。
【0115】この手順で1フレーム内にわたるM本のピ
ッチパスを求める。M本のピッチパスの中で、全サブフ
レームの評価尺度D(Cd 2/Gd)の総和が最も大きく
なるバスを最適ピッチパスとして決定し、最適ピッチパ
スにおける、各サブフレームの遅延符号を最適遅延符号
に決定する。
【0116】
【実施例2】図1及び図3を参照して、本発明の第2の
実施例を説明する。本実施例において、全体の構成は前
記実施例1と同様、図1に示す構成とされる。
【0117】図3は、本実施例において、図1の長期予
測回路160−2の構成を示す図である。
【0118】最初に各構成モジュールを説明する。
【0119】適応コードブック探索回路370は、各サ
ブフレーム毎にピッチパス推定回路で決定されたピッチ
パスに対応する遅延符号の近傍符号のみを用いて、適応
コードブック探索を従来のクローズドループ処理で行う
回路である。その他の部分は前記第1の実施例と同じで
ある。
【0120】第2の実施例の処理の流れを説明する。ま
ず図1を参照して、符号化処理(a)では、入力ポート
100より、音声信号が入力されバッファ110に保存
される。バッファ110に蓄えられた一定サンプルの音
声信号を用いて音声分析回路120で短期予測分析さ
れ、音声信号のスペクトル特性を表すLPC係数を算出
する。LPC分析により求められたスペクトルパラメー
タは、パラメータ量子化回路130で量子化され、LP
C係数の量子化符号がマルチプレクサ210に送られる
と共に、逆量子化され以後の符号化処理に用いられる。
【0121】バッファ110に蓄えられた音声信号は、
量子化/逆量子化されたLPC係数を用いて重み付け回
路140で聴感上の重み付けが為され、以降のコードブ
ック探索に用いられる。
【0122】適応コードブック150、音源コードブッ
ク170、及びゲインコードブック190でコードブッ
ク探索が行なわれる。
【0123】まず、最初に長期予測回路160−2で長
期予測を行い、ピッチ相関を表す最適遅延符号を決定
し、その符号(遅延符号)をマルチプレクサ210に転
送するとともに、適応コードベクトルの生成を行なう。
【0124】次に、求められた適応コードベクトルの影
響を減算後、音源探索回路180で音源コードブック探
索を行い、音源の量子化符号を決定し、音源コードベク
トルを生成すると共に、音源の量子化符号をマルチプレ
クサ210に転送する。
【0125】適応コードベクトルと音源コードベクトル
が求められた後、ゲイン探索回路200で2つの音源の
ゲインを算出し、その符号をマルチプレクサ210に転
送する。マルチプレクサ210では、各コードを組み合
わせて伝送コードに変換し、出力する。
【0126】図1を参照して、復号化処理(b)では、
デマルチプレクサ220で、入力された伝送符号を各符
号に分解する。LPC係数を表す符号よりフィルタ係数
をデコードし、合成フィルタ230に転送する。遅延符
号より適応コードブック150を用いて適応コードベク
トルを生成する。音源の量子化符号より音源コードブッ
ク170を用いて音源コードベクトルを生成する。
【0127】ゲインコードより適応コードベクトルと音
源コードベクトルのゲインを算出し、各音源にゲイン項
を掛け合わせて合成フィルタ230の入力信号を生成す
る。最後に、入力信号を用いて合成フィルタ230で音
声信号の合成を行なう。
【0128】次に、第2の実施例における長期予測部
を、図3を参照して説明する。図3は、本実施例に係る
長期予測回路160−2の処理を詳細に示したものであ
る。
【0129】まず、逆フィルタ回路300で現サブフレ
ームの聴感重み付け信号ベクトルxの逆フィルタ信号に
なる残差信号を求める。
【0130】インパルス応答算出回路380で、合成フ
ィルタHのインパルス応答を算出する。
【0131】逆方向フィルタリング回路390で、逆方
向フィルタリング信号HT・xを算出する。
【0132】遅延試行回路310で、整数値を取る遅延
符号を試行させ、各遅延符号毎に320、410、35
0−2の処理を行う。
【0133】遅延ベクトル生成回路320で、遅延試行
回路310で設定された遅延符号dに対応する遅延残差
ベクトルrdを求める。rdは上式(8)にしたがって求
める。
【0134】次に、自己相関算出回路410で、自己相
関 Gd=<H・rd、H・rd> を上式(12)に従い、Kleijn法により逐次的に求め
る。
【0135】次に、相互相関算出回路350−2で、相
互相関Cdを上式(11)の第2項により求める。
【0136】そして、遅延ベクトル生成回路320、自
己相関算出回路410、相互相関算出回路350−2の
処理を1フレーム中の全サブフレームに対して行う。
【0137】遅延試行回路310による処理ループで算
出された、各サブフレームの各整数遅延符号に対応する
相関を用いて、ピッチパス推定回路360で、ピッチを
表す遅延値が滑らかに変化するピッチパスを求める。な
おピッチパスの推定法については、上記文献3に記載さ
れる従来の方法を用いる。
【0138】この方法では先ず、全整数点遅延の距離ま
たは相関値を補間または多相フィルタリングし、小数点
遅延の距離または相関値を求める。多相フィルタリング
については上記文献2の方法を用いる。
【0139】次に、整数点遅延で、最も予測効率の高か
ったサブフレームとして決定し、最適サブフレームで、
M個(Mは例えば6個)の候補を評価尺度D=Cd 2/G
dにより求める。
【0140】求められた最適サブフレームのM個の候補
に対し、1つ前および1つ後のサブフレームで、遅延の
変化が一定範囲内に収まるように拘束された遅延値の範
囲内で、最も評価尺度Dが大きくなる遅延符号を求め
る。
【0141】この手順で1フレーム内にわたるM本のピ
ッチパスを求める。M本のピッチパスの中で、全サブフ
レームの評価尺度Dの総和が最も大きくなるバスを最適
ピッチパスとして決定する。
【0142】最後に、各サブフレーム毎に適応コードブ
ック探索回路370で、推定された最適ピッチパスにお
ける、各サブフレームの遅延符号の近傍のみを用いて、
過去の音源信号である適応コードブック150を用いて
最適遅延を決定する。
【0143】本発明の実施例によれば、クローズドルー
プピッチパス推定の自己相関算出法において、Kleijn
の逐次アルゴリズムを適用するために、音源に繰り返し
のない残差を用い、整数点遅延に限定することにより、
従来の、Nim=21とした自己相関近似法に比べて、図
5に示すような作用効果が得られた。Kleijn法は、近
似解でなく等価解であるため、演算量が約11MOPS
(Mega Operation PerSecond)に低減しても、性能は同
じである。これにより、低演算量で性能の高いピッチ推
定が実現できる。
【0144】なお、上記実施例では、聴感重み付け信号
xを用いて説明したが、音声信号でも、音声信号のピッ
チ強調信号でも同様な効果が得られる。
【0145】また、上記実施例では、ピッチバスをM個
求めた後で、1個に絞り、クローズドループ適応コード
ブック探索を行う方法を用いたが、M個のパス全てを用
いてクローズドループ適応コードブック探索を行って
も、同様の効果が得られる。
【0146】また、上記実施例では、1フレームでピッ
チパスを求めていたが、複数のフレームでピッチパスを
求めても同様の効果が得られる。
【0147】また、上記実施例では、最適遅延符号を1
個に絞っているが、複数候補求めて、次のステップ(音
源探索やゲイン探索)で本選択を行っても、以後のコー
ドブック探索で同時最適探索を行っても同様の効果が得
られる。
【0148】さらに、上記実施例では、音源探索に音源
コードブック探索を用いたが、マルチパルスや残差の波
形符号化のような音源信号の量子化法を用いても同様の
効果が得られる。
【0149】さらにまた、上記実施例では、音源コード
ブックを具体的に規定していないが、雑音コードブック
でも、ベクトル量子化(VQ)アルゴリズムにより学習
された学習コードブックでも同様の効果が得られる。前
者は上記文献1が参照できる。また、後者については、
特願平2−22955号や特願平2−22956号等を
参照できる。
【0150】また、上記実施例では、音声分析回路にL
PC分析を用いて説明を行ったが、スペクトルパラメー
タを抽出するBURG法等の他の分析法においても同様
の効果が得られる。
【0151】また、上記実施例では、LPC係数を用い
て説明したが、PARCOR係数やLSP係数のような
他のスペクトルパラメータでも同様な効果が得られるこ
とは明白である。また、上記実施例では音源コードブッ
ク探索回路を1段構成にしたが、多段構成にしても同様
の効果が得られることも明白である。
【0152】このように、本発明は、上記実施例にのみ
限定されるものでなく、本発明の原理に準ずる各種形態
・変形を含むことは勿論である。
【0153】
【発明の効果】以上説明したように、本発明によれば、
クローズドループピッチパス推定の自己相関算出法にお
いて、Kleijnの逐次アルゴリズムを適用するために、
音源に繰り返しのない残差を用い、整数点遅延に限定す
ることにより、従来のNim=21の自己相関近似法に比
べて、図5に示される効果が得られた。Kleijn法は近
似解でなく等価解であるため、演算量が約11MOPS
低減しても、性能は同じである。このように、本発明に
よれば、低演算量で性能の高いピッチ推定が実現できる
という効果を奏する。
【図面の簡単な説明】
【図1】本発明の実施例の音声符号化処理システムの全
体の構成を示す図であり、(a)は符号化処理を、
(b)は復号化処理を示している。
【図2】本発明の一実施例の長期予測回路の構成を示す
図である。
【図3】本発明の別の実施例の長期予測回路の構成を示
す図である。
【図4】本発明の実施例の作用効果の一例を示す図であ
る。
【図5】従来の音声符号化処理システムの全体構成を示
す図である。(a)は符号化処理を、(b)は復号化処
理を表す。
【図6】ピッチパス推定をフィルタリング処理で行う長
期予測の従来方式の構成を示す図である。
【図7】ピッチパス推定を自己相関近似、逆方法フィル
タリングで行う長期予測の従来方式の構成を示す図であ
る。
【符号の説明】
100 音声入力ポート 110 バッファ 120 音声分析回路 130 パラメータ量子化回路 140 重み付け回路 150 適応コードブック 160−1、160−2 長期予測回路 170 音源コードブック 180 音源探索回路 190 ゲインコードブック 200 ゲイン探索回路 210 マルチプレクサ 220 デマルチプレクサ 230 合成フィルタ 240 音声出力端子 300 逆フィルタ回路 310 遅延試行回路 320 遅延ベクトル生成回路 330 フィルタリング回路 340 自己相関算出回路 350−1、350−2 相互相関算出回路 360 ピッチパス推定回路 370 適応コードブック探索回路 380 インパルス応答算出回路 390 逆方向フィルタリング回路 400 自己相関近似法による自己相関算出回路 410 Kleijn法による自己相関算出回路 420 残差コードブック

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】音声信号の一定区間毎に前記音声信号の周
    波数特性を表す短期予測符号を決定する音声分析部手段
    と、 前記短期予測符号から合成フィルタのインパルス応答を
    計算するインパルス応答算出手段と、 前記短期予測符号を用いて前記音声信号から残差信号を
    算出する逆フィルタ手段と、 過去の音声区間における前記残差信号を蓄積する残差コ
    ードブックと、 前記音声信号のピッチ相関を表す整数の遅延符号を試行
    させる遅延符号試行手段と、 前記残差コードブックを用いて、前記遅延符号に対応す
    る遅延残差ベクトルを生成する遅延残差ベクトル生成手
    段と、 前記インパルス応答で前記遅延残差ベクトルをフィルタ
    リングして得られる合成信号の自己相関を逐次的に算出
    する自己相関算出手段と、 前記音声信号と前記インパルス応答とのフィルタリング
    信号と前記遅延残差ベクトルとの相互相関を算出する相
    互相関算出手段と、 前記自己相関と前記相互相関とを用いて、一定期間内で
    前記遅延符号の値が滑らかに変化するように小数点の遅
    延符号を求めるピッチパス推定手段と、 を有することを特徴とする音声符号化装置。
  2. 【請求項2】音声信号の一定区間毎に前記音声信号の周
    波数特性を表す短期予測符号を決定する音声分析部と、 前記短期予測符号から合成フィルタのインパルス応答を
    計算するインパルス応答算出手段と、 前記短期予測符号を用いて前記音声信号から残差信号を
    算出する逆フィルタ手段と、 過去の音声区間における前記残差信号を蓄積する残差コ
    ードブックと、 前記音声信号のピッチ相関を表す整数の遅延符号を試行
    させる遅延符号試行手段と、 前記残差コードブックを用いて、前記遅延符号に対応す
    る遅延残差ベクトルを生成する遅延残差ベクトル生成手
    段と、 前記インパルス応答で前記遅延残差ベクトルをフィルタ
    リングして得られる合成信号の自己相関を逐次的に算出
    する自己相関算出手段と、 前記音声信号と前記インパルス応答とのフィルタリング
    信号と前記遅延残差ベクトルとの相互相関を算出する相
    互相関算出手段と、 前記自己相関と前記相互相関とを用いて、一定期間内で
    前記遅延符号の値が滑らかに変化するように小数点の遅
    延符号を求めるピッチパス推定手段と、 前記ピッチパス推定手段で求められた遅延符号をもと
    に、過去の音源信号により最適な遅延符号を決定する適
    応コードブック探索手段と、 前記音声信号の音源を求めて量子化する音源量子化手段
    と、 を有することを特徴とする音声符号化装置。
JP8227758A 1996-08-09 1996-08-09 音声符号化装置 Pending JPH1055198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8227758A JPH1055198A (ja) 1996-08-09 1996-08-09 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8227758A JPH1055198A (ja) 1996-08-09 1996-08-09 音声符号化装置

Publications (1)

Publication Number Publication Date
JPH1055198A true JPH1055198A (ja) 1998-02-24

Family

ID=16865924

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8227758A Pending JPH1055198A (ja) 1996-08-09 1996-08-09 音声符号化装置

Country Status (1)

Country Link
JP (1) JPH1055198A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6856955B1 (en) 1998-07-13 2005-02-15 Nec Corporation Voice encoding/decoding device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6856955B1 (en) 1998-07-13 2005-02-15 Nec Corporation Voice encoding/decoding device

Similar Documents

Publication Publication Date Title
JP2776050B2 (ja) 音声符号化方式
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JP3254687B2 (ja) 音声符号化方式
JPH09281998A (ja) 音声符号化装置
JPH0990995A (ja) 音声符号化装置
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JP3087591B2 (ja) 音声符号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP2002140099A (ja) 音声復号化装置
JP3308764B2 (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3249144B2 (ja) 音声符号化装置
JPH0830299A (ja) 音声符号化装置
JPH1055198A (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JPH07168596A (ja) 音声符号化装置
JP3194930B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JPH08320700A (ja) 音声符号化装置
JP3024467B2 (ja) 音声符号化装置
JP3471542B2 (ja) 音声符号化装置
JP2000029499A (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3230380B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000704