JPH06102900A - 音声符号化方式および音声復号化方式 - Google Patents

音声符号化方式および音声復号化方式

Info

Publication number
JPH06102900A
JPH06102900A JP4249308A JP24930892A JPH06102900A JP H06102900 A JPH06102900 A JP H06102900A JP 4249308 A JP4249308 A JP 4249308A JP 24930892 A JP24930892 A JP 24930892A JP H06102900 A JPH06102900 A JP H06102900A
Authority
JP
Japan
Prior art keywords
frame
waveform
vector
quantization
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4249308A
Other languages
English (en)
Inventor
Yoshiaki Tanaka
良紀 田中
Tomohiko Taniguchi
智彦 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4249308A priority Critical patent/JPH06102900A/ja
Publication of JPH06102900A publication Critical patent/JPH06102900A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明は、入力音声信号に対して線形予測分
析を行ないその予測誤差信号をベクトル量子化して伝送
する音声符号化方式に関し、コード駆動線形予測符号化
方式において、フレーム長を長くした場合の特性劣化を
防止できるようにすることを目的とする。 【構成】 入力音声信号のピッチ周期がベクトル量子化
を行なうフレーム長より短い場合は、当該フレームの最
近の1ピッチ区間のみベクトル量子化を行なって伝送
し、フレームの残りの部分の波形はこの量子化波形と前
フレームにおける量子化波形との間の補間により求める
一方、ピッチ周期がベクトル量子化を行なうフレーム長
より長い場合は、フレーム単位でベクトル量子化を行な
い、補間は行なわないように構成する。

Description

【発明の詳細な説明】
【0001】(目次) 産業上の利用分野 従来の技術(図9,図10) 発明が解決しようとする課題 課題を解決するための手段(図1,図2) 作用(図1,図2) 実施例(図3〜図8) 発明の効果
【0002】
【産業上の利用分野】本発明は、入力音声信号に対して
線形予測分析を行ないその予測誤差信号をベクトル量子
化して伝送する音声符号化方式及びこの音声符号化方式
で符号化されて伝送されてきたものについて逆量子化を
行なう音声復号化方式に関する。近年、企業内通信シス
テム、ディジタル移動無線システム、音声蓄積システム
などにおいて、音声信号を高能率に圧縮を行なう音声符
号化方式及びこの音声符号化方式で符号化されたものを
復号化する音声復号化方式が要求されている。
【0003】
【従来の技術】従来より、音声の予測符号化方式では、
フレーム毎に線型予測分析により抽出されたパラメータ
(予測係数)と、この予測係数を係数とする予測合成フ
ィルタを駆動するための駆動信号のパラメータを多重化
して伝送する。そして、復号側で、この駆動信号を予測
合成フィルタに通すことにより音声を再生する。
【0004】なお、この符号化方式で使用される線形予
測合成フィルタは人間の声道部分をモデル化したもので
あり、駆動信号は声帯振動や乱気流など、声道部に入力
される音源信号に相当するものである。また、音源信号
情報の効率的伝送のために、駆動ベクトルをベクトル量
子化して、そのインデックスを伝送するコード駆動線形
予測符号化方式(CELP)や、駆動ベクトルを有限個
のパルス列でモデル化し、最適なパルス位置、及びパル
ス振幅を伝送するマルチパルス駆動符号化方式(MP
C)等いくつかの方式がある。
【0005】ところで、図9は従来のCELP符号器を
示すブロック図であるが、この図9に示すCELP符号
器は、適応コードブック101,固定コードブック10
2,ピッチゲイン付与部103,コードゲイン付与部1
04,加算部105,短期予測合成フィルタ106,誤
差演算部107,聴覚重み付けフィルタ108,電力計
算部109,誤差電力最小化部110,線型予測分析部
111,予測係数量子化部112,多重化部113等を
そなえて構成されている。
【0006】ここで、適応コードブック101はコード
毎にピッチベクトルを記憶しているもので、固定コード
ブック102はコード毎にコードベクトルを記憶してい
るものである。ピッチゲイン付与部103は、適応コー
ドブック101からのベクトルPN (n)についてピッ
チゲインb(n)を掛け合わせるもので、コードゲイン
付与部104は、固定コードブック101からのベクト
ルCN (n)についてコードゲインg(n)を掛け合わ
せるものである。また、加算部105はピッチゲイン付
与部103とコードゲイン付与部104からの出力を加
算するものである。なお、Nはフレーム番号である。
又、添字はベクトルの次元を表す。
【0007】短期予測合成フィルタ106は、人間の声
道部分をモデル化したフィルタで、加算部105で加算
された駆動信号UN (n)と予測係数量子化部112か
らの短期予測係数とを受けて、合成音声を出力するもの
である。誤差演算部107は、短期予測合成フィルタ1
06からの合成音声と入力音声との誤差を演算するもの
である。
【0008】聴覚重み付けフィルタ108は、誤差信号
について聴感上の重み付けフィルタリングを施すもの
で、電力計算部109は聴覚重み付けフィルタ108の
出力から誤差電力を計算するもので、誤差電力最小化部
110は電力計算部109で演算された誤差信号電力が
最小となる各コードブックのインデックスを決定するも
のである。
【0009】さらに、線型予測分析部111は入力音声
について線型予測分析を行なうもので、予測係数量子化
部112は線型予測分析部111からの出力から予測係
数を量子化するものである。なお、多重化部113は、
適応コードブックインデックス,固定コードブックイン
デックス,ピッチゲイン量子化インデックス,コードゲ
インインデックス,予測係数量子化インデックスを多重
化して復号器側へ伝送するものである。
【0010】上述の構成により、このCELP符号器で
は、Nサンプルの長さの量子化フレーム毎に、適応コー
ドブック101と固定コードブック102のそれぞれに
ついて、短期予測合成フィルタ106により合成したベ
クトルと、入力音声ベクトルとの誤差ベクトルを誤差演
算部107で求め、その誤差信号電力が最小となるベク
トルをそれぞれ一つずつ決定する(PN (n)およびC
N (n)参照)。この時、誤差信号に対し、図9に示す
ように、聴覚重み付けフィルタ108によって、聴感上
の重み付けフィルタリングが施される。このようにし
て、決定した最適ベクトルのインデックスと、そのとき
の最適ゲインの値及び予測係数の各パラメータを多重化
部113で多重化して伝送する。
【0011】また、図10はCELP復号器を示すブロ
ック図であるが、この図10に示すCELP復号器は、
適応コードブック201,固定コードブック202,ピ
ッチゲイン付与部203,コードゲイン付与部204,
加算部205,短期予測合成フィルタ206,分離/逆
量子化部207等をそなえて構成されている。ここで、
適応コードブック201,固定コードブック202,ピ
ッチゲイン付与部203,コードゲイン付与部204,
加算部205,短期予測合成フィルタ206は、それぞ
れ符号器における適応コードブック101,固定コード
ブック102,ピッチゲイン付与部103,加算部10
5,短期予測合成フィルタ106と同様の構成を有する
ものである。
【0012】また、分離/逆量子化部207は、伝送路
を介して受信した多重化データから適応コードブックイ
ンデックス,固定コードブックインデックス,ピッチゲ
イン量子化インデックス,コードゲインインデックス,
予測係数量子化インデックスを分離し、更には逆量子化
して、適応コードブックインデックス,固定コードブッ
クインデックス,ピッチゲイン,コードゲイン,予測係
数を取り出すもので、適応コードブックインデックスは
適応コードブック201の検索の為に使用され、固定コ
ードブックインデックスは固定コードブック202の検
索の為に使用され、ピッチゲインはピッチゲイン付与部
203にて使用され、コードゲインはコードゲイン付与
部204にて使用され、予測係数は短期予測合成フィル
タ206で合成音声を得る際に使用される。
【0013】上述の構成により、このCELP復号器で
は、各コードブック201,202中の受信されたイン
デックスに対応するベクトルを、逆量子化して求めた各
ゲインの値により重み付け合成して駆動ベクトルU
N (n)を生成し、これを短期予測合成フィルタ206
に通すことにより、音声を再生するようになっている。
ところで、別の符号化方式としては、20〜30ms程
度の長いフレームを用い、フレーム内の予測残差信号の
中の代表的な1ピッチパルス波形(Prototype
waveform)をベクトル量子化して伝送し、フ
レームの残り部分の波形はこの量子化ピッチパルス波形
と前フレームの量子化ピッチパルス波形との間の補間に
より求められる方法がある。これは、PWI(Prot
otype Waveform Interpolat
ion)法と呼ばれている方法である。なお、これにつ
いては、「W.B.Kleijn,“Continuo
us Representations in Lin
ear Predictive Coding,“Pr
oc.ICASSP,pp.201−204,Mar.
1991.」という参考文献がある。
【0014】
【発明が解決しようとする課題】ところで、音声の符号
化において、ある特定の符号化アルゴリズムを用いて、
より低ビットレート化を実現するための方法としては、
おおまかに言って2通りある。一つは個々の符号化パラ
メータの量子化ビット数を少なくする方法であり、この
場合、量子化ビット数を少なくするにつれてパラメータ
の量子化が粗くなるために、量子化雑音が増大する。
【0015】もう一つの方法はパラメータの更新周期を
長くする方法である。この場合は、更新周期を長くする
にしたがってパラメータの時間的変化に追従する事が困
難になるため、符号化品質が劣化する。特に、CELP
において音源のベクトル量子化を行なうフレーム長を長
くすることは、ベクトル量子化の次元を長くすることで
あり、この次元の増加に見合った大きなサイズのコード
ブックを実現上用いることができない場合には、量子化
特性の劣化を招く。
【0016】更に、CELPでは有声音におけるピッチ
の周期性を、ピッチ周期に相当する遅延分だけ遅れた過
去の量子化残差信号を繰り返し用いることにより、生成
しているが、この方法では、量子化フレーム長が長いと
ピッチパルス波形の時間変化に追従できなくなるため、
有声音の品質が大きく劣化する。一方、PWI法では、
フレーム毎に一つのピッチ波形をベクトル量子化して伝
送する必要があるが、ピッチ周期は長い場合で約20m
s程度あり、これは8KHzサンプリングの場合では、
約160サンプル程度となる。この様な長いピッチ波形
をベクトル量子化する場合、非常に大きなコードブック
を用いないと、十分な量子化特性が得られない。したが
って、メモリ量や演算量が膨大なものになるという課題
がある。
【0017】本発明は、このような課題に鑑み創案され
たもので、CELPにおいて、フレーム長を長くした場
合の特性劣化を防ぐことができるようにした、音声符号
化方式および音声復号化方式を提供することを目的とす
る。
【0018】
【課題を解決するための手段】図1は第1の発明(音声
符号化方式)の原理ブロック図で、この図1において、
1はピッチ分析部で、このピッチ分析部1は入力音声の
ピッチ周期τを分析するものである。2はコードブック
で、このコードブック2はコード毎にコードベクトルを
記憶しているものであり、4はコードゲイン付与部で、
このコードゲイン付与部4は、コードブック2からのベ
クトルCτ(n)についてコードゲインg(n)を掛け
合わせるものである。
【0019】6は短期予測合成フィルタで、この短期予
測合成フィルタ6は、人間の声道部分をモデル化したフ
ィルタで、駆動信号UN (n)と短期予測係数とに基づ
いて合成音声を出力するものである。7は誤差演算部
で、この誤差演算部7は、短期予測合成フィルタ6から
の合成音声と入力音声との誤差を演算するものである。
【0020】8は聴覚重み付けフィルタ、9は電力計算
部、10は誤差電力最小化部で、まず、聴覚重み付けフ
ィルタ8は、誤差信号について聴感上の重み付けフィル
タリングを施すもので、電力計算部9は聴覚重み付けフ
ィルタ8の出力から誤差電力を計算するもので、誤差電
力最小化部10は電力計算部9で演算された誤差信号電
力が最小となるものを決定するものである。
【0021】さらに、11は線型予測分析部、12は予
測係数量子化部であり、線型予測分析部11は、入力音
声について線型予測分析を行なうもので、予測係数量子
化部12は線型予測分析部11からの出力から予測係数
を量子化するものである。14は1フレーム遅延部で、
この1フレーム遅延部14はコードゲイン付与部4から
の出力Uτ(n)を1フレーム分だけ遅らせるものであ
る。
【0022】15は巡回シフト部で、この巡回シフト部
15は、周期をピッチ周期τとする巡回シフトによっ
て、量子化波形と前フレームにおける量子化波形間の相
関が最大となる位相に、1フレーム遅延部14からの1
フレーム遅延出力Uτ(n−1)をシフトするものであ
る。なお、この巡回シフト部15の出力をU′τ(n−
1)とする。
【0023】16は波形補間部で、この波形補間部16
は、駆動信号UN (n)を量子化波形Uτ(n)と前フ
レームにおける量子化波形U′τ(n−1)との間の補
間により求めるものである。図2は第2の発明(音声復
号化方式)の原理ブロック図で、この図2において、2
2はコードブック、24はコードゲイン付与部、26は
短期予測合成フィルタで、コードブック22,コードゲ
イン付与部24,短期予測合成フィルタ26は、それぞ
れ符号器(図1参照)におけるコードブック2,コード
ゲイン付与部4,短期予測合成フィルタ6と同様の構成
を有するものである。
【0024】また、28は1フレーム遅延部で、この1
フレーム遅延部28はコードゲイン付与部24からの出
力Uτ(n)を1フレーム分だけ遅らせるもので、符号
器(図1参照)における1フレーム遅延部14に対応す
る。29は巡回シフト部で、この巡回シフト部29は、
周期をピッチ周期τとする巡回シフトによって、量子化
波形と前フレームにおける量子化波形間の相関が最大と
なる位相に、1フレーム遅延部28からの1フレーム遅
延出力Uτ(n−1)をシフトするもので、符号器(図
1参照)における巡回シフト部15に対応する。なお、
この巡回シフト部29の出力もU′τ(n−1)であ
る。
【0025】30は波形補間部で、この波形補間部30
は、駆動信号UN (n)を量子化波形Uτ(n)と前フ
レームにおける量子化波形U′τ(n−1)との間の補
間により求めるもので、符号器(図1参照)における波
形補間部16に対応する。
【0026】
【作用】上述の図1に示す本発明の音声符号化方式で
は、入力音声信号に対して線形予測分析を行ない、その
予測誤差信号をベクトル量子化して伝送することが行な
われるが、このとき、入力音声信号のピッチ周期がベク
トル量子化を行なうフレーム長より短い場合は、当該フ
レームの最近の1ピッチ区間のみベクトル量子化を行な
って伝送し、フレームの残りの部分の波形はこの量子化
波形と前フレームにおける量子化波形との間の補間によ
り求める。
【0027】一方、ピッチ周期がベクトル量子化を行な
うフレーム長より長い場合は、フレーム単位でベクトル
量子化を行ない、補間は行なわない。なお、量子化波形
と前フレームにおける量子化波形との間の補間を行なう
前に、周期をピッチ周期とする巡回シフトによって、両
波形間の相関が最大となる位相にシフトしておく。
【0028】また、入力音声信号に対し有声/無声の判
定を行ない、有声音フレームについては、入力音声信号
のピッチ周期がベクトル量子化を行なうフレーム長より
短い場合は、当該フレームの最近の1ピッチ区間のみベ
クトル量子化を行なって伝送し、フレームの残りの部分
の波形はこの量子化波形と前フレームにおける量子化波
形との間の補間により求める一方、ピッチ周期がベクト
ル量子化を行なうフレーム長より長い場合は、フレーム
単位でベクトル量子化を行ない、補間は行なわず、無声
音フレームの場合は、常にフレーム単位のベクトル量子
化を行なうようにしてもよい。
【0029】すなわち、本音声符号化方式では、ピッチ
周期τが量子化フレーム長Nより短い場合は、N次元の
入力ベクトルのうち最近の1ピッチ周期波形ベクトルに
対してベクトル量子化を行なう。そして、この量子化に
おいて選択されたτ次元コードベクトルCτ(n)、そ
のときの最適ゲインg(n)から、τ次元駆動ベクトル
Uτ(n)(=g(n)Cτ(n))が求められ、更に
このUτ(n)と前フレームの量子化ピッチ波形Uτ
(n−1)とを用いて両者の間の波形を補間により求
め、N次元駆動ベクトルUN (n)を作成するが、この
時、Uτ(n)とUτ(n−1)は位相が合っていない
ので、補間を行なう前に、Uτ(n−1)を、周期をτ
とする巡回シフトにより、Uτ(n)との相関が最大と
なる位相へシフトしておく。すなわち、これをU′τ
(n−1)とすると、実際の補間はUτ(n)とU′τ
(n−1)との間で行なうのである。
【0030】さらに、図2に示す本発明の音声復号化方
式では、入力音声信号に対して線形予測分析を行ない、
その予測誤差信号をベクトル量子化して伝送されてきた
ものについて、逆量子化を行なって、音声復号化を実行
するが、図1に示す符号器側で、入力音声信号のピッチ
周期がベクトル量子化を行なうフレーム長より短い場合
は、当該フレームの最近の1ピッチ区間のみベクトル量
子化を行なって伝送し、フレームの残りの部分の波形は
この量子化波形と前フレームにおける量子化波形との間
の補間により求める一方、ピッチ周期がベクトル量子化
を行なうフレーム長より長い場合は、フレーム単位でベ
クトル量子化を行ない、補間は行なわないようにして符
号化されることにより、図2に示す復号器に伝送されて
きたものについて、次のような復号化処理が施される。
【0031】すなわち、受信したピッチ周期がベクトル
量子化を行なうフレーム長より短い場合は、受信したベ
クトル量子化インデックスを用いて逆量子化を行なって
1ピッチ区間の量子化ベクトルを求め、フレームの残り
部分の波形はこの量子化波形と前フレームにおける量子
化波形との間の補間により求める一方、ピッチ周期がベ
クトル量子化を行なうフレーム長より長い場合は、フレ
ーム単位の復号を行ない、補間は行なわない。
【0032】なお、この場合も、量子化波形と前フレー
ムにおける量子化波形との間の補間を行なう前に、周期
をピッチ周期とする巡回シフトによって、両波形間の相
関が最大となる位相にシフトしておく。また、受信した
有声/無声の判定結果により、有声音フレームについて
は、受信したピッチ周期がベクトル量子化を行なうフレ
ーム長より短い場合は、受信したベクトル量子化インデ
ックスを用いて逆量子化を行なって1ピッチ区間の量子
化ベクトルを求め、フレームの残り部分の波形はこの量
子化波形と前フレームにおける量子化波形との間の補間
により求める一方、ピッチ周期がベクトル量子化を行な
うフレーム長より長い場合は、フレーム単位の復号を行
ない、補間は行なわず、無声音フレームの場合は、常に
フレーム単位の復号を行なう。
【0033】
【実施例】以下、図面を参照して本発明の実施例を説明
する。図3は本発明の一実施例としてのCELP符号器
を示すブロック図であるが、この図3に示すCELP符
号器は、適応コードブック101,固定コードブック1
02,ピッチゲイン付与部103,コードゲイン付与部
104,加算部105,短期予測合成フィルタ106,
誤差演算部107,聴覚重み付けフィルタ108,電力
計算部109,誤差電力最小化部110,線型予測分析
部111,予測係数量子化部112,多重化部113,
1フレーム遅延部114,巡回シフト部115,波形補
間部116等をそなえて構成されている。
【0034】ここで、適応コードブック101はコード
毎にピッチベクトルを記憶しているもので、固定コード
ブック102はコード毎にコードベクトルを記憶してい
るものであり、ピッチゲイン付与部103は、適応コー
ドブック101からのベクトルPτ(n)についてピッ
チゲインb(n)を掛け合わせるもので、コードゲイン
付与部104は、固定コードブック101からのベクト
ルCτ(n)についてコードゲインg(n)を掛け合わ
せるものである。また、加算部105はピッチゲイン付
与部103とコードゲイン付与部104からの出力を加
算するものである。さらに、短期予測合成フィルタ10
6は、人間の声道部分うモデル化したフィルタで、駆動
信号UN (n)と予測係数量子化部112からの短期予
測係数とを受けて、合成音声を出力するものであり、誤
差演算部107は、短期予測合成フィルタ106からの
合成音声と入力音声との誤差を演算するものである。
【0035】また、聴覚重み付けフィルタ108は、誤
差信号について聴感上の重み付けフィルタリングを施す
もので、電力計算部109は聴覚重み付けフィルタ10
8の出力から誤差電力を計算するもので、誤差電力最小
化部110は電力計算部109で演算された誤差信号電
力が最小となる各コードブックのインデックスを決定す
るものである。
【0036】なお、線型予測分析部111は入力音声に
ついて線型予測分析を行なうもので、予測係数量子化部
112は線型予測分析部111からの出力から予測係数
を量子化するものである。また、多重化部113は、適
応コードインデックス,固定コードインデックス,ピッ
チゲイン量子化インデックス,コードゲインインデック
ス,予測係数量子化インデックスを多重化して復号器側
へ伝送するものである。
【0037】そして、上記の適応コードブック101,
固定コードブック102,ピッチゲイン付与部103,
コードゲイン付与部104,加算部105,短期予測合
成フィルタ106,誤差演算部107,聴覚重み付けフ
ィルタ108,電力計算部109,誤差電力最小化部1
10,線型予測分析部111,予測係数量子化部11
2,多重化部113については、従来のCELP符号器
にも同様のものが設けられている。
【0038】ところで、1フレーム遅延部114はコー
ドゲイン付与部104からの出力Uτ(n)を1フレー
ム分だけ遅らせるものであり、巡回シフト部115は、
周期をピッチ周期τとする巡回シフトによって、量子化
波形と前フレームにおける量子化波形間の相関が最大と
なる位相に、1フレーム遅延部114からの1フレーム
遅延出力Uτ(n−1)をシフトするものである。な
お、この巡回シフト部15の出力をU′τ(n−1)と
する。
【0039】波形補間部16は、駆動信号UN (n)を
量子化波形Uτ(n)と前フレームにおける量子化波形
U′τ(n−1)との間の補間により求めるものであ
る。このような構成により、図3に示す本符号器での処
理は次のようになる。 (1)適応コードブックの探索(図5参照) 適応コードブック101の内容は通常のCELPで行な
われているように、ピッチ周期τが探索フレーム長Nよ
り短い場合(τ<Nの場合)は、1ピッチ区間を繰り返
すことによりN次元ベクトルを生成しておく。ピッチ周
期τの探索は例えば8KHzサンプリングの場合、サン
プル数を単位として20≦τ≦147の範囲で行なう。
そして、この場合(τ<Nの場合)は、τ次元適応コー
ドベクトルPτ(n)を予測合成フィルタ106を通し
たベクトルAPτ(n)と最近の1ピッチ周期入力波形
Xτ(n)(τ次元)との間で評価関数(誤差電力)の
計算を行ない、これを最小とする最適ピッチ周期τをも
とめる。但し、Xτ(n)とPτ(n)は位相が合って
いないので、評価を行なう前に、Pτ(n)を、周期を
τとする巡回シフトにより、Xτ(n)との相関が最大
となる位相へシフトした波形P′τ(n)を求めてお
く。すなわち、実際の評価関数計算はXτ(n)とA
P′τ(n)との間で行なう。
【0040】また、τ≧Nの場合は、通常のCELPの
場合と同様に、N次元適応コードベクトルPN (n)を
予測合成フィルタを通したベクトルAPN (n)とフレ
ーム入力波形XN (n)(N次元)との間で評価関数
(誤差電力)の計算を行ない、これを最小とする最適ピ
ッチ周期τをもとめる。 (2)固定コードブックの探索(図6参照) 固定コードブック102の探索も適応コードブック10
1の探索の場合と同様にして、τ<Nの場合はピッチに
同期して行なう。また、コードブックはN次元コードブ
ックをτ次元で打ち切ったものを使用する。τ次元固定
コードベクトルCτ(n)を予測合成フィルタ106を
通したベクトルACτ(n)と最近の1ピッチ周期入力
波形Xτ(n)から(1)で決定した適応コードベクト
ルを差し引いたベクトルYτ(n)との間で評価関数
(誤差電力)の計算を行ない、これを最小とする最適ピ
ッチ周期τをもとめる。ここで、 Yτ(n)=Xτ(n)−b(n)AP′τ(n) (1) また、探索において選択されたτ次元コードベクトルを
Cτ(n)とすると、τ次元駆動ベクトルUτ(n)は
次のようになる。 Uτ(n)=b(n)P′τ(n)+g(n)Cτ(n) (2) なお、τ≧Nの場合は、通常のCELPの場合と同様
に、N次元固定コードベクトルCN (n)を予測合成フ
ィルタを通したベクトルACN (n)と以下に示すYN
(n)(N次元)との間で評価関数(誤差電力)の計算
を行ない、これを最小とする最適ピッチ周期τをもとめ
る。すなわち、 YN (n)=XN (n)−b(n)APN (n) (3) また、探索において選択されたN次元コードベクトルを
N とすると、N次元駆動ベクトルは次のようになる。
すなわち、 UN (n)=b(n)PN (n)+g(n)CN (n) (4) (3)波形の補間(図7参照) τ<Nの場合は、Uτ(n)と前フレームの量子化ピッ
チ波形Uτ(n−1)を用いて両者の間の波形を補間に
よりもとめ、N次元駆動ベクトルUN (n)を作成す
る。この時も、Uτ(n)とUτ(n−1)は位相が合
っていないので、補間を行なう前にUτ(n−1)を、
周期をτとする巡回シフトにより、Uτ(n)との相関
が最大となる位相へシフトしておく。すなわち、これを
U′τ(n−1)とすると、実際の補間はUτ(n)と
U′τ(n−1)との間で行なう。τ≧Nの場合は、補
間の必要が無いため、補間は行なわない。
【0041】このように本方式では、ピッチ周期が量子
化を行なうフレーム長より短い場合に限り、ベクトル量
子化を最新の1ピッチ区間に限定して行ない、途中の駆
動信号はこの1ピッチ区間の量子化波形と前フレームの
量子化ピッチ波形との間の補間により作成して、τ次元
ピッチ波形のベクトル量子化を行ない、又τがτ≧Nの
場合は、N次元のフレーム単位のベクトル量子化を行な
うことにより、ベクトル量子化の次元をN以下に抑えて
いるため、ピッチ周期が長くなった場合の次元の増大に
よるベクトル量子化効率の低下を防止できるのである。
また、このτ<Nの場合には、ベクトル量子化の対象と
ならなかったフレームの残りの部分を前フレームの量子
化ピッチ波形との間の補間により求めるため、ピッチ波
形のゆるやかな時間的変化に対応できる。
【0042】また、ピッチ周期が量子化を行なうフレー
ム長より長い場合は、通常のCELPと同じようにフレ
ーム単位で量子化を行なうが、このようにピッチ周期が
長い場合に、これより短いフレーム毎にベクトル量子化
を行ない、1ピッチ波形を複数フレームに分けて量子化
を行なうことにより、ピッチ波形の量子化特性が向上す
る。
【0043】図4は本発明を用いたCELP復号器の実
施例を示す図であるが、このCELP復号器は、図4に
示すように、適応コードブック201,固定コードブッ
ク202,ピッチゲイン付与部203,コードゲイン付
与部204,加算部205,短期予測合成フィルタ20
6,分離/逆量子化部207,1フレーム遅延部20
8,巡回シフト部209,波形補間部210等をそなえ
て構成されている。
【0044】ここで、適応コードブック201,固定コ
ードブック202,ピッチゲイン付与部203,コード
ゲイン付与部204,加算部205,短期予測合成フィ
ルタ206,1フレーム遅延部208,巡回シフト部2
09,波形補間部210は、それぞれ符号器における適
応コードブック101,固定コードブック102,ピッ
チゲイン付与部103,加算部105,短期予測合成フ
ィルタ106,1フレーム遅延部114,巡回シフト部
115,波形補間部116と同様の機能・構成を有する
ものである。
【0045】なお、分離/逆量子化部207は、伝送路
を介して受信した多重化データから適応コードブックイ
ンデックス,固定コードブックインデックス,ピッチゲ
イン量子化インデックス,コードゲインインデックス,
予測係数量子化インデックスを分離し、更には逆量子化
して、適応コードブックインデックス,固定コードブッ
クインデックス,ピッチゲイン,コードゲイン,予測係
数を取り出すもので、適応コードブックインデックスは
適応コードブック201の検索の為に使用され、固定コ
ードブックインデックスは固定コードブック202の検
索の為に使用され、ピッチゲインはピッチゲイン付与部
203にて使用され、コードゲインはコードゲイン付与
部204にて使用され、予測係数は短期予測合成フィル
タ206で合成音声を得る際に使用される。
【0046】このような構成により、図4に示す本復号
器での処理は次のようになる。 (1)ピッチ波形の生成 τ<Nの場合は、受信した各コードブックのインデック
スおよびゲインの量子化コードより逆量子化を行なっ
て、τ次元適応コードベクトルPτ(n)、τ次元固定
コードベクトルCτ(n)、適応コードゲインb
(n)、固定コードゲインg(n)を求め、τ次元駆動
ベクトルを次式により作成する。 Uτ(n)=b(n)P′τ(n)+g(n)Cτ(n) (5) 但し、P′τ(n)は図8に示す様に、Pτ(n)をτ
を周期として繰り返してつなげて作ったN次元ベクトル
の、次元の高い方のサンプルからなるベクトルである。
【0047】一方、τ≧Nの場合は、受信した各コード
ブックのインデックスおよびゲインの量子化コードより
逆量子化を行なって、N次元適応コードベクトルP
N (n)、N次元固定コードベクトルCN (n)、適応
コードゲインb(n)、固定コードゲインg(n)を求
め、N次元駆動ベクトルを次式により作成する。 UN (n)=b(n)PN (n)+g(n)CN (n) (6) (2)波形の補間によるN次元駆動ベクトルの作成 Uτ(n)と前フレームの量子化ピッチ波形Uτ(n−
1)を用いて両者の間の波形を補間によりもとめ、N次
元駆動ベクトルUN (n)を作成する。この時、Uτ
(n)とUτ(n−1)は位相が合っていないので、補
間を行なう前にUτ(n−1)を、周期をτとする巡回
シフトにより、Uτ(n)との相関が最大となる位相へ
シフトしておく。すなわち、これをU′τ(n−1)と
すると、実際の補間はUτ(n)とU′τ(n−1)と
の間で行なう。補間により得られたN次元駆動ベクトル
N (n)を短期予測合成フィルタ206に通すことに
より、音声信号を再生する。
【0048】また、τ≧Nの場合は、補間の必要が無い
ため、補間は行なわない。このように、復号側におい
て、符号側に対応した処理を施すことにより、合成音声
を正確に再現できるのである。なお、本方法はピッチの
周期性を有する有声音部で有効となる技術であるため、
符号器において入力音声に対し有声/無声判定を行な
い、有声音のフレームに対してのみ本符号化方式を用い
るようにしてもよい。さらに、このように符号器におい
て入力音声に対し有声/無声判定を行ない、有声音のフ
レームに対してのみ本方法を用いる場合は、受信した有
声/無声の判定結果により、有声音フレームについて
は、受信したピッチ周期がベクトル量子化を行なうフレ
ーム長より短い場合は、本復号化方式を採用し、無声音
フレームの場合は、常にフレーム単位の復号を行なう。
【0049】
【発明の効果】以上詳述したように、本発明によれば、
符号器側で、入力音声信号のピッチ周期がベクトル量子
化を行なうフレーム長より短い場合は、当該フレームの
最近の1ピッチ区間のみベクトル量子化を行なって伝送
し、フレームの残りの部分の波形はこの量子化波形と前
フレームにおける量子化波形との間の補間により求める
一方、ピッチ周期がベクトル量子化を行なうフレーム長
より長い場合は、フレーム単位でベクトル量子化を行な
い、補間は行なわなず、復号器側で、受信したピッチ周
期がベクトル量子化を行なうフレーム長より短い場合
は、受信したベクトル量子化インデックスを用いて逆量
子化を行なって1ピッチ区間の量子化ベクトルを求め、
フレームの残り部分の波形はこの量子化波形と前フレー
ムにおける量子化波形との間の補間により求める一方、
ピッチ周期がベクトル量子化を行なうフレーム長より長
い場合は、フレーム単位の復号を行ない、補間は行なわ
ないようにしているので、ベクトル量子化の次元をフレ
ーム長以下に抑えることができ、これにより、次元の増
大によるベクトル量子化効率の低下を防止できるほか、
ピッチ波形のゆるやかな時間的変化にも十分に対応でき
る利点がある。
【0050】また、量子化波形と前フレームにおける量
子化波形との間の補間を行なう前に、周期をピッチ周期
とする巡回シフトによって、両波形間の相関が最大とな
る位相にシフトしておくので、正確な補間処理を実行で
きるという利点がある。さらに、符号器側では、入力音
声信号に対し有声/無声の判定を行ない、有声音フレー
ムについては、信号のピッチ周期がベクトル量子化を行
なうフレーム長より短い場合は、当該フレームの最近の
1ピッチ区間のみベクトル量子化を行なって伝送し、フ
レームの残りの部分の波形はこの量子化波形と前フレー
ムにおける量子化波形との間の補間により求める一方、
ピッチ周期がベクトル量子化を行なうフレーム長より長
い場合は、フレーム単位でベクトル量子化を行ない、補
間は行なわず、無声音フレームの場合は、常にフレーム
単位のベクトル量子化を行なう一方、復号器側では、受
信した有声/無声の判定結果により、有声音フレームに
ついては、受信したピッチ周期がベクトル量子化を行な
うフレーム長より短い場合は、受信したベクトル量子化
インデックスを用いて逆量子化を行なって1ピッチ区間
の量子化ベクトルを求め、フレームの残り部分の波形は
この量子化波形と前フレームにおける量子化波形との間
の補間により求める一方、ピッチ周期がベクトル量子化
を行なうフレーム長より長い場合は、フレーム単位の復
号を行ない、補間は行なわず、無声音フレームの場合
は、常にフレーム単位の復号を行なうことにより、効果
的な音声符号化および音声復号化を実現できる利点があ
る。
【図面の簡単な説明】
【図1】第1の発明の原理ブロック図である。
【図2】第2の発明の原理ブロック図である。
【図3】本発明の一実施例としてのCELP符号器のブ
ロック図である。
【図4】本発明の一実施例としてのCELP復号器のブ
ロック図である。
【図5】本発明の一実施例の作用を説明する図である。
【図6】本発明の一実施例の作用を説明する図である。
【図7】本発明の一実施例の作用を説明する図である。
【図8】本発明の一実施例の作用を説明する図である。
【図9】従来のCELP符号器のブロック図である。
【図10】従来のCELP復号器のブロック図である。
【符号の説明】
1 ピッチ分析部 2 コードブック 4 コードゲイン付与部 6 短期予測合成フィルタ 7 誤差演算部 8 聴覚重み付けフィルタ 9 電力計算部 10 誤差電力最小化部 11 線型予測分析部 12 予測係数量子化部 14 1フレーム遅延部 15 巡回シフト部 16 波形補間部 22 コードブック 24 コードゲイン付与部 26 短期予測合成フィルタ 28 1フレーム遅延部 29 巡回シフト部 30 波形補間部 101 適応コードブック 102 固定コードブック 103 ピッチゲイン付与部 104 コードゲイン付与部 105 加算部 106 短期予測合成フィルタ 107 誤差演算部 108 聴覚重み付けフィルタ 109 電力計算部 110 誤差電力最小化部 111 線型予測分析部 112 予測係数量子化部 113 多重化部 114 1フレーム遅延部 115 巡回シフト部 116 波形補間部 201 適応コードブック 202 固定コードブック 203 ピッチゲイン付与部 204 コードゲイン付与部 205 加算部 206 短期予測合成フィルタ 207 分離/逆量子化部 208 1フレーム遅延部 209 巡回シフト部 210 波形補間部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 入力音声信号に対して線形予測分析を行
    ない、その予測誤差信号をベクトル量子化して伝送する
    音声符号化方式において、 該入力音声信号のピッチ周期がベクトル量子化を行なう
    フレーム長より短い場合は、当該フレームの最近の1ピ
    ッチ区間のみベクトル量子化を行なって伝送し、フレー
    ムの残りの部分の波形はこの量子化波形と前フレームに
    おける量子化波形との間の補間により求める一方、 該ピッチ周期がベクトル量子化を行なうフレーム長より
    長い場合は、フレーム単位でベクトル量子化を行ない、
    補間は行なわないことを特徴とする、音声符号化方式。
  2. 【請求項2】 量子化波形と前フレームにおける量子化
    波形との間の補間を行なう前に、周期をピッチ周期とす
    る巡回シフトによって、両波形間の相関が最大となる位
    相にシフトしておくことを特徴とする請求項1記載の音
    声符号化方式。
  3. 【請求項3】 入力音声信号に対し有声/無声の判定を
    行ない、有声音フレームについては、該入力音声信号の
    ピッチ周期がベクトル量子化を行なうフレーム長より短
    い場合は、当該フレームの最近の1ピッチ区間のみベク
    トル量子化を行なって伝送し、フレームの残りの部分の
    波形はこの量子化波形と前フレームにおける量子化波形
    との間の補間により求める一方、ピッチ周期がベクトル
    量子化を行なうフレーム長より長い場合は、フレーム単
    位でベクトル量子化を行ない、補間は行なわず、 無声音フレームの場合は、常にフレーム単位のベクトル
    量子化を行なうことを特徴とする請求項1または請求項
    2に記載の音声符号化方式。
  4. 【請求項4】 入力音声信号に対して線形予測分析を行
    ない、その予測誤差信号をベクトル量子化して伝送され
    てきたものについて、逆量子化を行なう音声復号化方式
    において、 符号器側で、該入力音声信号のピッチ周期がベクトル量
    子化を行なうフレーム長より短い場合は、当該フレーム
    の最近の1ピッチ区間のみベクトル量子化を行なって伝
    送し、フレームの残りの部分の波形はこの量子化波形と
    前フレームにおける量子化波形との間の補間により求め
    る一方、ピッチ周期がベクトル量子化を行なうフレーム
    長より長い場合は、フレーム単位でベクトル量子化を行
    ない、補間は行なわないようにして符号化されることに
    より、復号器に伝送されてきたものについて、 受信したピッチ周期がベクトル量子化を行なうフレーム
    長より短い場合は、受信したベクトル量子化インデック
    スを用いて逆量子化を行なって1ピッチ区間の量子化ベ
    クトルを求め、フレームの残り部分の波形はこの量子化
    波形と前フレームにおける量子化波形との間の補間によ
    り求める一方、 該ピッチ周期がベクトル量子化を行なうフレーム長より
    長い場合は、フレーム単位の復号を行ない、補間は行な
    わないことを特徴とする、音声復号化方式。
  5. 【請求項5】 量子化波形と前フレームにおける量子化
    波形との間の補間を行なう前に、周期をピッチ周期とす
    る巡回シフトによって、両波形間の相関が最大となる位
    相にシフトしておくことを特徴とする請求項4記載の音
    声復号化方式。
  6. 【請求項6】 受信した有声/無声の判定結果により、 有声音フレームについては、受信したピッチ周期がベク
    トル量子化を行なうフレーム長より短い場合は、受信し
    たベクトル量子化インデックスを用いて逆量子化を行な
    って1ピッチ区間の量子化ベクトルを求め、フレームの
    残り部分の波形はこの量子化波形と前フレームにおける
    量子化波形との間の補間により求める一方、該ピッチ周
    期がベクトル量子化を行なうフレーム長より長い場合
    は、フレーム単位の復号を行ない、補間は行なわず、 無声音フレームの場合は、常にフレーム単位の復号を行
    なうことを特徴とする請求項4記載の音声復号化方式。
JP4249308A 1992-09-18 1992-09-18 音声符号化方式および音声復号化方式 Withdrawn JPH06102900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4249308A JPH06102900A (ja) 1992-09-18 1992-09-18 音声符号化方式および音声復号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4249308A JPH06102900A (ja) 1992-09-18 1992-09-18 音声符号化方式および音声復号化方式

Publications (1)

Publication Number Publication Date
JPH06102900A true JPH06102900A (ja) 1994-04-15

Family

ID=17191059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4249308A Withdrawn JPH06102900A (ja) 1992-09-18 1992-09-18 音声符号化方式および音声復号化方式

Country Status (1)

Country Link
JP (1) JPH06102900A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0689195A3 (en) * 1994-06-21 1997-10-15 Nec Corp Method and device for coding an excitation signal
WO2004097796A1 (ja) * 2003-04-30 2004-11-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置及びこれらの方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0689195A3 (en) * 1994-06-21 1997-10-15 Nec Corp Method and device for coding an excitation signal
WO2004097796A1 (ja) * 2003-04-30 2004-11-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置及びこれらの方法

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
KR100873836B1 (ko) Celp 트랜스코딩
CA2271410C (en) Speech coding apparatus and speech decoding apparatus
JP2002202799A (ja) 音声符号変換装置
JP2011123506A (ja) 可変レートスピーチ符号化
US5027405A (en) Communication system capable of improving a speech quality by a pair of pulse producing units
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP2003150200A (ja) 符号変換方法及び装置とプログラム並びに記憶媒体
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JPS6238500A (ja) 高能率音声符号化方式とその装置
JPH06102900A (ja) 音声符号化方式および音声復号化方式
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP3299099B2 (ja) 音声符号化装置
JPH113098A (ja) 音声符号化方法および装置
JPH0258100A (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP3232701B2 (ja) 音声符号化方法
JPH0519796A (ja) 音声の励振信号符号化・復号化方法
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JPH028900A (ja) 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置
JP3192051B2 (ja) 音声符号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3515216B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19991130