JP4063911B2 - 音声符号化装置 - Google Patents

音声符号化装置 Download PDF

Info

Publication number
JP4063911B2
JP4063911B2 JP03672697A JP3672697A JP4063911B2 JP 4063911 B2 JP4063911 B2 JP 4063911B2 JP 03672697 A JP03672697 A JP 03672697A JP 3672697 A JP3672697 A JP 3672697A JP 4063911 B2 JP4063911 B2 JP 4063911B2
Authority
JP
Japan
Prior art keywords
pulse
pitch
search
vector
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP03672697A
Other languages
English (en)
Other versions
JPH1097294A (ja
Inventor
原 宏 幸 江
井 利 幸 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP03672697A priority Critical patent/JP4063911B2/ja
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to AU37085/97A priority patent/AU3708597A/en
Priority to CNB971913501A priority patent/CN1163870C/zh
Priority to PCT/JP1997/002703 priority patent/WO1998006091A1/ja
Priority to DE69737012T priority patent/DE69737012T2/de
Priority to EP05008176A priority patent/EP1553564A3/en
Priority to EP97933895A priority patent/EP0858069B1/en
Priority to US09/051,137 priority patent/US6226604B1/en
Publication of JPH1097294A publication Critical patent/JPH1097294A/ja
Priority to US09/729,420 priority patent/US6421638B2/en
Priority to US09/729,229 priority patent/US6687666B2/en
Priority to US09/729,419 priority patent/US6549885B2/en
Application granted granted Critical
Publication of JP4063911B2 publication Critical patent/JP4063911B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声信号をコード化して伝送する移動通信システム等におけるCELP(Code Excited Linear Predicion)型音声符号化装置に関するものである。
【0002】
【従来の技術】
CELP型音声符号化装置は、音声をある一定のフレーム長に区切り、各フレーム毎に音声の線形予測を行い、フレーム毎の線形予測による予測残差(励起信号)を既知の波形からなる適応符号ベクトルと雑音符号ベクトルを用いて符号化するものである。適応符号ベクトルと雑音符号ベクトルは、図31に示すように、それぞれ適応符号帳1および雑音符号帳2に格納された適応符号ベクトルと雑音符号ベクトルをそのまま使用する場合と、図32に示すように、適応符号帳1からの適応符号ベクトルと、雑音符号帳2からの雑音符号ベクトルを適応符号帳1のピッチ同期Lに同期させた雑音符号ベクトルを用いる場合とがある。図32は特開平5−19795号公報および特開平5−19796号公報に開示されているCELP型音声符号化装置における雑音音源ベクトル生成部の構成である。図32において、適応符号帳1から適応符号ベクトルが選択されるとともに、ピッチ周期Lが出力され、雑音符号帳2から選択された雑音符号ベクトルが、周期化器3によりピッチ周期Lを用いて周期化される。周期化は、雑音符号ベクトルを先頭からピッチ周期分切り出し、それをサブフレーム長に達するまで複数回繰り返して接続することによって行われる。
【0003】
【発明が解決しようとする課題】
しかしながら、上記従来の雑音符号ベクトルをピッチ周期化するCELP型音声符号化装置では、適応符号ベクトル成分を取り除いた後に残留するピッチ周期成分を、雑音符号ベクトルをピッチ周期で周期化することによって取り除いているため、1ピッチ波形内に存在する位相情報、すなわちどこにピッチパルスのピークが存在するかという情報を積極的に用いることがなく、音声品質の向上を図る上で限界があった。
【0004】
本発明は、このような従来の問題を解決するものであり、音声品質を一段と向上させることのできる音声符号化装置を提供することを目的とする。
【0005】
【課題を解決するための手段】
上記目的を達成するために、本発明は、適応符号ベクトルのピッチピークの位置とピッチ周期を用いてパルス位置の探索範囲を限定することにより、パルスの位置を表すビット数が少ない場合でも、音質劣化を少なくしながら探索範囲を狭めるようにしたものである。
【0009】
本発明はまた、ピッチ周期の値によってパルス音源のパルス本数を変化させることにより、音質向上を図るようにしたものである。
【0015】
本発明はまた、ピッチピーク位置からの相対位置で音源パルス探索を行うCELP型音声符号化装置において、サブフレームの先頭側から順番にパルス位置のインデックスを付けるようにすることによって、あるフレームにおいて発生した伝送路誤りの影響が後続の伝送路誤りのないフレームに伝播することを防ぐようにしたものである。
【0016】
本発明はまた、ピッチピーク位置からの相対位置で音源パルス探索を行うCELP型音声符号化装置において、サブフレームの先頭側から順番にパルス位置のインデックスを付けるとともに、同じインデックの異なるパルスにおいてもサブフレームの先頭側から順番にパルス番号を付けるようにすることによって、あるフレームにおいて発生した伝送路誤りの影響が後続の伝送路誤りのないフレームに伝播することを防ぐようにしたものである。
【0017】
本発明はまた、ピッチピーク位置からの相対位置で音源パルス探索を行うCELP型音声符号化装置において、パルス探索位置の全てを相対位置で表すのではなく、ピッチピーク近傍の一部のみを相対位置で表現し、残りの部分は予め定められた固定位置にすることにより、あるフレームにおいて発生した伝送路誤りの影響が後続の伝送路誤りのないフレームに伝播することを防ぐようにしたものである。
【0021】
【発明の実施の形態】
本発明の請求項1に記載の発明は、振幅1のパルスの組み合わせによって表されるパルス音源を雑音符号帳に用いるCELP型音声符号化装置において、前記パルスの探索位置を、適応符号ベクトルのピッチ周期と、適応符号ベクトルとピッチ周期とから求められるピッチピーク位置と、によって決定する音源生成部を備え、前記音源生成部が、適応符号ベクトルのピッチピーク位置近傍は密に、それ以外の部分は疎になるように前記パルスの探索位置を決定する音声符号化装置である。
【0026】
本発明の請求項2に記載の発明は、前記音源生成部が、適応符号ベクトルの最初のピッチピーク位置近傍は密に、それ以外の部分は疎になるように前記パルスの探索置を決定する、請求項1記載の音声符号化装置である
【0027】
本発明の請求項3記載の発明は、ピッチ周期によってパルス位置の探索範囲を切り替える請求項1または請求項2記載の音声符号化装置である
【0028】
本発明の請求項4記載の発明は、適応符号ベクトルに複数のピッチピークが存在する場合に、少なくとも2つのピッチピークの位置が探索範囲に含まれるようにパルス位置の探索範囲を限定する請求項3記載の音声符号化装置である
【0052】
本発明の請求項記載の発明は、パルス探索位置の一部をピッチピーク位置によって決定し、その他のパルス探索位置はピッチピーク位置に関係なく予め定められた固定位置とすることにより伝送路誤りの影響の伝播を抑える、請求項1から請求項のいずれかに記載の音声符号化装置である
【0061】
以下、本発明の実施の形態における音声符号化装置の音源生成部について、図1から図10を用いて説明する。
【0062】
(実施の形態1)
図1は本発明の第1の実施の形態を示し、適応符号ベクトルのピッチピーク位置に対応する雑音符号ベクトルの振幅を強調する音声符号化装置の音源生成部を示す。図1において、11は適応符号ベクトルをピッチピーク位置検出器12に出力する適応符号帳、12は適応符号帳11から出力された適応符号ベクトルを入力として、ピッチピーク位置を振幅強調窓生成器13に出力するピッチピーク位置算出器、13はピッチピーク位置算出器12から出力されたピッチピーク位置を入力として、振幅強調窓を振幅強調窓掛け器16に出力する振幅強調窓生成器、14は雑音符号ベクトルを格納し、周期化器15へ出力する雑音符号帳、15は雑音符号帳14から出力された雑音符号ベクトルとピッチ周期Lを入力として、雑音符号ベクトルをピッチ周期化して振幅強調窓掛け器16に出力する周期化器、16は振幅強調窓生成器13から出力された振幅強調窓と周期化器15から出力された雑音符号ベクトルを入力とし、雑音符号ベクトルに振幅強調窓を乗じて、最終的な雑音符号ベクトルを出力する振幅強調窓掛け器である。
【0063】
以上のように構成されたCELP型音声符号化装置の音源生成部の動作について図1を用いて説明する。ピッチピーク位置算出器12は、入力された適応符号ベクトルを用いて適応符号ベクトル内に存在するピッチパルスの位置を決定する。ピッチパルスの位置は、ピッチ周期で並べたインパルス列と適応符号ベクトルとの正規化相互相関を最大化することによって行うことができる。また、ピッチ周期で並べたインパルス列を合成フィルタに通したものと、適応符号ベクトルを合成フィルタに通したもとの誤差を最小化することによっても可能である。
【0064】
振幅強調窓生成器13は、ピッチピーク位置算出器12によって決定されたピッチパルス位置に基づいて振幅強調窓を生成する。振幅強調窓としては、種々なものを用いることが可能であるが、例えば、ピッチパルス位置を中心とする三角窓が窓長の制御が容易な点において有利である。
【0065】
図2は振幅強調窓生成器13から出力される振幅強調窓の形状と適応符号ベクトルの形状の対応を示す。図中破線の位置がピッチピーク位置算出器12によって決定されたピッチパルス位置である。
【0066】
周期化器15は、雑音符号帳14から出力された雑音符号ベクトルをピッチ周期化する。ピッチ周期化は、雑音符号ベクトルをピッチ周期で周期化するもので、雑音符号帳の格納ベクトルを先頭からピッチ周期Lの分だけ切り出し、それをサブフレーム長に達するまで複数回繰り返して接続することによって行われる。ただし、ピッチ周期化が行われるのは、ピッチ周期がサブフレーム長以下の場合のみである。
【0067】
振幅強調窓掛け器16は、周期化器15から出力された雑音符号ベクトルに振幅強調窓生成器13から出力された振幅強調窓を乗ずる。
【0068】
このように、上記第1の実施の形態によれば、1ピッチ波形内に存在する位相情報を利用して、音質向上を図ることができる。
【0069】
なお、図1では、雑音符号ベクトルの周期化を行うCELP型音声符号化装置の音源部分について説明したが、図11に示すような雑音符号帳に格納された雑音符号ベクトルをそのまま使用する一般的なCELP型音声符号化装置の音源部分に対しても実施は可能であり、その例を図3に示す。図3において、21は適応符号帳、22はピーチピーク位置算出器、23は振幅強調窓生成器、24は雑音符号帳、25は振幅強調窓掛け器であり、雑音音源をピッチ同期に同期させないことだけが図1の音源生成部と異なる。
【0070】
(実施の形態2)
図4は本発明の第2の実施の形態を示し、音声信号の有声部の立ち上がり部分に対してパルス列音源と雑音音源を組み合わせた音源を適用する構成を有するCELP型音声符号化装置に対して、パルス列音源のパルス位置に対応する雑音符号ベクトルの振幅を強調する音声符号化装置の音源生成部を示している。図4において、31は振幅強調窓生成器32および加算器33に出力されて、ピッチパルスの位置に置かれたピッチ周期Lの間隔で並べられたインパルス列からなるパルス列音源、32はパルス列のパルス位置に対応する位置の雑音符号ベクトル振幅を強調するための振幅強調窓を生成して、乗算器35に出力する振幅強調窓生成器、33はパルス列音源と乗算器35から出力された振幅強調窓掛け後の雑音符号ベクトルを加算して、励振ベクトルとして出力する加算器、34は雑音符号ベクトルで表現され、乗算器35へ出力される雑音音源、35は雑音音源34から出力された雑音音源ベクトルに対して振幅強調窓生成器32から出力された振幅強調窓を乗ずる乗算器である。
【0071】
以上のように構成された音源生成部について、図4を用いてその動作を説明する。パルス列音源31は、ピッチ周期Lと初期位相Pによってパルスの位置と間隔が決定されているパルス列であり、ピッチ周期Lおよび初期位相Pは音源生成部の外部で別途計算される。なお、パルス列音源は、インパルスを並べたものでも良いが、サンプリング点とサンプリング点の間に存在するのインパルスを表現できる方が性能がよい。同様に初期位相(最初のパルスの位置)も、サンプリング点とサンプリング点の間を表現できる分数精度で表す方が性能が良くなるが、この情報に割り当てることが可能なビット数が十分でない場合は、整数精度でも良い性能が得られ、位置決定のための探索も容易である。
【0072】
振幅強調窓生成器32は、パルス列音源ベクトルのパルスの位置に対応する位置の雑音音源ベクトルの振幅を強調するための窓であり、第1の実施の形態で説明した振幅強調窓と同様のものである。パルスの位置を中心とする三角窓などを用いることができる。
【0073】
加算器33は、パルス列音源ベクトル31と振幅強調窓が乗算器35によって乗ぜられた雑音音源ベクトル34とを加算して、励振音源ベクトルとして出力する。
【0074】
なお、図4には示されていないが、加算器33に入力される前にパルス列音源ベクトルおよび雑音音源ベクトルのそれぞれに適切な利得を乗ずる構成にすると、より表現性の高い音源生成部となる。ただし、その場合、利得情報を別途伝送する必要が生ずる。また、パルス列音源ベクトルと雑音音源ベクトルの利得を固定する場合は、パルス列音源ベクトルが雑音音源ベクトルに埋もれてしまわないように、パルス列音源ベクトルのパワーと雑音音源ベクトルのパワーが等しくなるように調整するなどの利得調整は必要である。
【0075】
このように、上記第2の実施の形態によれば、雑音音源ベクトルの振幅をピッチ周期に同期して強調することによって、音質向上を図ることができる。
【0076】
(実施の形態3)
図5は本発明の第3の実施の形態を示し、CELP型音声符号化装置において、適応符号ベクトルのピッチピーク近傍のみに限定した雑音符号ベクトルを用いた音声符号化装置の音源生成部を示す。
【0077】
図5において、41は適応符号ベクトルを出力する適応符号帳、42は適応符号帳41から出力された適応符号ベクトルとピッチ周期Lを入力として、ピッチピークの位置(位相情報)を雑音符号ベクトル生成器44に出力する位相探索器、43はピッチピークの近傍のみにベクトル長を限定した雑音符号ベクトルを格納し、ピッチパルス位置近傍の雑音符号ベクトルを雑音符号ベクトル生成器44に出力するピッチパルス位置近傍限定型雑音符号帳、44はピッチパルス位置近傍限定型雑音符号帳43から出力された雑音符号ベクトルと位相探索器42から出力された位相情報とピッチ周期Lを入力として、雑音符号ベクトルを周期化器45に出力する雑音符号ベクトル生成器、45は雑音符号ベクトル生成器44から出力された雑音符号ベクトルとピッチ周期Lを入力として、最終的な雑音符号ベクトルを出力する周期化器である。
【0078】
以上のように構成された音声符号化装置の音源生成部について、図5を用いてその動作を説明する。位相探索器42は、適応符号帳41から出力された適応符号ベクトルを用いて、適応符号ベクトル内に存在するピッチパルスの位置(位相)を決定する。ピッチパルスの位置は、ピッチ周期で並べたインパルス列と適応符号ベクトルとの正規化相互相関を最大化することによって行うことができる。また、ピッチ周期で並べたインパルス列を合成フィルタに通したものと、適応符号ベクトルを合成フィルタに通したもとの誤差を最小化することによって、より精度良く求めることも可能である。
【0079】
ピッチパルス位置近傍限定型雑音符号帳43は、適応符号ベクトルのピッチピーク近傍に適用するための雑音符号ベクトルを格納しており、ベクトル長は、ピッチ周期やフレーム(サブフレーム)長によらず固定長である。ピッチピーク近傍の範囲としては、ピッチピークを中心として前後等しい長さとしてもよいが、ピッチピークの後の範囲を前よりも長く取る方が、音質劣化が少ない。例えば、近傍の範囲を5msecとした場合、ピッチピークの前後を2.5msecずつ取るよりも、ピッチピークの前を0.625msec、ピッチピークの後ろを4.375msecの様にした方が良い。また、ベクトル長としては、サブフレーム長が10msecの場合で、5msec程度であればベクトル長を10msec以上にした場合とほぼ同等の音質を実現できる。
【0080】
雑音符号ベクトル生成器44は、ピッチパルス位置限定型雑音符号帳43から出力された雑音符号ベクトルを、位相探索器42によって決定されたピッチパルスの位置に配置する。
【0081】
図6および図7はピッチパルス位置限定型雑音符号帳43から出力された雑音符号ベクトルを、雑音符号ベクトル生成器44によってピッチパルス位置に対応する位置に配置する方法を図解したものである。基本的には、図6(a)に示すように、ピッチパルス位置の近傍にピッチパルス位置限定雑音符号ベクトルを配置する。図6において、ピッチ周期化範囲と示されている部分(斜線部)は、周期化部45においてピッチ周期化する場合に対象となる部分である。図6(a)のような場合、雑音符号ベクトル生成器44においてピッチ周期化を行う必要はないが、図6(b)に示すような場合には、ピッチパルスの位置がサブフレーム境界の近くにあるため、ピッチパルス位置限定型雑音符号帳43から出力された雑音符号ベクトルの前半部(サブフレーム境界より前の部分)を周期化部45において周期化することができないので(周期化部45においては、サブフレーム境界からピッチ周期長だけ切り出したベクトルをピッチ周期で繰り返し並べる。)、雑音符号ベクトル生成器44において予めピッチ周期化するように動作させる。また、サブフレーム境界の直前にピッチパルス位置がある場合、サブフレームの先頭からピッチ周期だけ切り出して周期化すると、ピッチパルス位置近傍限定ベクトルの後半部分が適切にピッチ周期化されないため、図7(a)に示すように、雑音ベクトル生成器44は時間軸の負の方向にもピッチ周期化するように動作する。ただし、ピッチパルス位置がサブフレーム先頭からピッチ周期長の間に存在しない場合はこの周期化は必要ない。このようにピッチ周期化部45に先立ってピッチ周期化を行なっておくことにより、ピッチ位置近傍限定ベクトルの全ての部分を有効に用いたピッチ周期化がピッチ周期化部45で行われるようにしている。なお、ピッチ周期がピッチパルス位置近傍に限定したベクトル長より短い場合は、限定ベクトルの中からピッチ周期長だけ切り出してピッチ周期化を行う。この場合、切り出し方はいろいろ考えられるが、ピッチパルス位置が切り出したベクトルに含まれるように切り出す。例えば、ピッチパルス位置から4分の1ピッチ周期前の点から1ピッチ周期分を切り出すというように、ピッチパルス位置とピッチ周期を用いて切り出し開始点を決定する。
【0082】
図7(b)はピッチ周期が限定ベクトル長より短い場合の、雑音符号ベクトルの切り出し方法の一例を示す。この場合、ピッチパルス位置近傍限定雑音符号ベクトルの先頭からピッチ周期長を切り出すようにしている。このようにすると切り出し開始点を毎回算出する必要がなくなる。すなわち、上記したようにピッチパルス位置から4分の1ピッチ周期前の点から1ピッチ周期分を切り出す場合、ピッチ周期が変数であるため、4分の1ピッチ周期を毎回計算する必要があるが、ピッチパルス位置近傍限定雑音符号ベクトルの先頭位置は固定値であるため、この計算が不要となる。ただし、ピッチパルス位置近傍限定雑音符号ベクトルの先頭からピッチ周期長だけ切り出したベクトルに、ピッチパルス位置に対応する部分が含まれない場合は、ピッチパルス位置に対応する部分が含まれるように切り出しを開始する位置をずらす必要がある。
【0083】
周期化器45は、雑音符号ベクトル生成器44から出力された雑音符号ベクトルをピッチ周期化する。ピッチ周期化は、雑音符号ベクトルをピッチ周期で周期化するもので、雑音符号ベクトルを先頭からピッチ周期Lの分だけ切り出し、それをサブフレーム長に達するまで複数回繰り返して接続することによって行われる。ただし、ピッチ周期化が行われるのは、ピッチ周期がサブフレーム長以下の場合のみである。なお、分数精度のピッチ周期の場合は、分数精度の点を補間によって算出して得られるベクトルを接続する。
【0084】
このように、上記第3の実施の形態によれば、適応符号ベクトルのピッチピーク近傍のみに限定した雑音符号ベクトルを用いることにより、雑音符号ベクトルに割り当てられるビット数が少ない場合でも、音質劣化を少なくでき、ピッチパルス近傍に残差パワーが集中するような有声部で音質向上を図ることができる。
【0085】
(実施の形態4)
図8は本発明の第4の実施の形態を示し、パルス位置の探索範囲を適応符号ベクトルのピッチ周期およびピッチピーク位置によって決定する音声符号化装置の音源生成部を示す。図8において、51は過去の励振音源ベクトルを保存し、選択された適応符号ベクトルをピッチピーク位置算出器52およびピッチゲイン乗算器55に出力する適応符号帳、52は適応符号帳51から出力された適応符号ベクトルとピッチ周期Lを入力としてピッチピーク位置を算出し、探索範囲算出器53に出力するピッチピーク位置算出器、53はピッチピーク位置算出器52から出力されたピッチピーク位置とピッチ周期Lを入力としてパルス音源を探索する範囲を算出し、パルス音源探索器54へ出力する探索範囲算出器、54は探索範囲算出器53から出力された探索範囲と、ピッチ周期Lを入力としてパルス音源を探索し、パルス音源ベクトルをパルス音源ゲイン乗算器56に出力するパルス音源探索器、55は適応符号帳から出力された適応符号ベクトルにピッチゲインを乗じて加算器57に出力する乗算器、56はパルス音源探索器から出力されたパルス音源ベクトルにパルス音源ゲインを乗じて加算器57に出力する乗算器、57は乗算器55からの出力と乗算器56からの出力を入力とし、加算して、励振音源ベクトルとして出力する加算器である。
【0086】
以上のように構成された、音源生成部の動作について、図8を用いて説明する。図8において、適応符号帳51は、音源生成部の外部で予め算出されるピッチ周期Lだけ過去にさかのぼった点から、適応符号ベクトルをサブフレーム長だけ切り出して、適応符号ベクトルとして出力する。ピッチ周期Lがサブフレーム長に満たない場合は、切り出したピッチ周期Lのベクトルを、サブフレーム長に達するまで繰り返して接続したものを適応符号ベクトルとして出力する。
【0087】
ピッチピーク位置算出器52は、適応符号帳51から出力された適応符号ベクトルを用いて適応符号ベクトル内に存在するピッチパルスの位置を決定する。ピッチパルスの位置は、ピッチ周期で並べたインパルス列と適応符号ベクトルとの正規化相互相関を最大化することによって行うことができる。また、ピッチ周期で並べたインパルス列を合成フィルタに通したものと、適応符号ベクトルを合成フィルタに通したもとの誤差を最小化することによって、より精度良く求めることも可能である。
【0088】
探索範囲算出器53は、入力されたピッチピーク位置およびピッチ周期Lを用いて、パルス音源を探索する範囲を算出する。すなわち、ピッチピークの位置情報から1ピッチ波形の中でも聴覚的に重要な範囲を算出し、その範囲を探索範囲として決定する。探索範囲算出器53によって決定される具体的な探索範囲を図9および図10に示す。図9(a)においては、ピッチピーク位置から5サンプル前の位置から始めて32サンプルの範囲を探索範囲として決定する場合を示している。有声部においては、予めピッチ周期で並べたインパルス列をパルス音源として用いるようにすれば、2番目のパルスの探索範囲の同じ位置にパルスを立てられ、効率的に音源を表現できる。図9(b)は、ピッチ周期が図9(a)の時よりも長くなった場合に決定される探索範囲の一例を示している。ピッチ周期が長い場合、図9(a)のようにピッチパルス近傍を集中的に探索するようにすると、1ピッチ波形に対する相対的な探索範囲が狭くなり、表現できる周波数帯域が狭まるなどして、特定の帯域の周波数成分の表現性が悪くなる場合がある。このような場合は、図9(b)に示すように、ピッチ周期に応じて探索範囲を広げる代わりに、全てのサンプル点を探索せずに1つおきあるいは2つおきのサンプル点を探索する部分を設けることで、探索する位置の数を増やさずに、特定の帯域の周波数成分の表現性が悪くなることを回避することができる。
【0089】
また、図10にはピッチパルス位置近傍は密に、それ以外の部分は疎に、パルス位置探索範囲を限定する方法を示している。この限定方法は、パルスが立てられる確率が高い位置がピッチパルス近傍に集中する統計的結果に基づいている。パルス位置探索範囲を限定しない場合、有声部においてはピッチパルス近傍にパルスが立てられる確率がその他の部分に立てられる確率に比べて高くなる。ただし、その他の部分にパルスが立てられる確率が無視できるほど小さくなるわけではない。図10に示すパルス位置探索範囲限定方法は、図9(b)に示す方法において、パルスが立てられる確率分布に基づいて探索範囲限定を行う一例と言える。なお、図9(a)において、ピッチ周期が短く、最初のパルスの探索範囲が2番目のパルスの探索範囲と重なるような場合は、2番目のパルスの探索範囲に重ならないように、最初のパルスの探索範囲を狭める代わりにパルス数を増やすという方法と、2番目のパルスの探索範囲に重なった探索範囲に決定する方法(図9(a)と同じ探索範囲決定方法)とがある。
【0090】
パルス位置探索器54は、探索範囲算出器53で決定された探索範囲(位置)にパルス音源を立てて、合成音声が入力音声と最も近くなる位置を出力する。特に、サブフレーム長が複数のピッチパルスを含むような長さでかつ有声定常部においては、ピッチ周期間隔で並べたインパルス列をパルス音源としてインパルス列の1本目のパルス位置を探索範囲の中から決定するのが効率的である。パルスの立て方としては種々考えられ、定数本例えば4本のパルスを探索範囲、例えば32箇所の位置のどこかに立てる場合、32箇所を4つに分けて1本のパルスを割り当てられた8箇所の中の1箇所に決定するように全ての組み合わせ(8×8×8×8通り)を探索する方法や、32箇所の中から4箇所を選びだす組み合わせ全てについて探索する方法などがある。なお、振幅1のインパルスの組み合わせの他に、複数本例えば2本のパルスを組み合わせたパルス対の組み合わせや、振幅の異なるインパルスの組み合わせによるパルスの立て方も可能である。
【0091】
乗算器55および56で乗ずる利得は、適応符号帳51から出力された適応符号ベクトルとパルス位置探索器54から出力されたパルス音源ベクトルとを用いて音声合成を行って、入力音声との誤差が最小となるようにそれぞれのベクトルに対して決定された値である。ここで、適応符号ベクトルに乗ずる利得をピッチゲイン、パルス音源ベクトルに乗ずる利得をパルス音源ゲインとすると、乗算器55は、適応符号ベクトルにピッチゲインを乗じて、加算器57に出力する。乗算器56は、パルス音源ベクトルにパルス音源ゲインを乗じて、加算器57に出力する。
【0092】
加算器57は、乗算器55から出力された最適利得乗算後の適応符号ベクトルと、乗算器56から出力された最適利得乗算後のパルス音源ベクトルとを加算して、励振音源ベクトルとして出力する。
【0093】
このように、上記第4の実施の形態によれば、パルスに割り当てられるビット数が少ない場合でも、音質劣化を少なくできる。
【0094】
(実施の形態5)
図11(a)は本発明の第5の実施の形態を示し、パルス位置の探索位置を適応符号ベクトルのピッチ周期およびピッチピーク位置によって決定する音源生成部のパルス探索位置決定部を示し、図8における探索範囲算出器53をさらに細かく示したものである。図11(a)において、61は、ピッチ周期Lを入力として、パルス探索位置決定器62にパルス探索位置パターンを出力する、パルス探索位置パターン選択器であり、62は、パルス探索位置パターン選択器61からパルス探索位置パターンを、ピッチピーク位置算出器52からピッチピーク位置を、それぞれ入力し、探索範囲(パルス探索位置)をパルス位置探索器54に出力する、パルス探索位置決定器である。
【0095】
以上のように構成された、音源生成部の探索範囲算出器53の動作について、図11(a)、(b)、(c)を用いて説明する。パルス探索位置パターン選択器61は、複数種類のパルス探索位置パターンをあらかじめ持っており(このパルス探索位置パターンは、パルス探索を行うサンプル点の位置の集合から成り、ピッチピーク位置を0とする相対位置でサンプル点を表現している)、ピッチ分析によって得られたピッチ周期Lを用いて、どのパルス探索位置パターンを使用するかを決定し、パルス探索位置パターンをパルス探索位置決定器62に出力する。
【0096】
図11(b)、(c)は、パルス探索位置パターン選択器61が、予め持っているパルス探索位置パターンの一例を示したものである。図中の目盛りはサンプル点の位置を示しており、矢印がつけられたサンプル点がパルス探索位置である(矢印が付いていない部分は探索しない)。目盛りの数値は適応符号ベクトルから求められるピッチピーク位置を0とした相対位置を表す数値である。また、図11(b)、(c)では、1サブフレーム80サンプルの場合を示している。図11(b)ではピッチ周期Lが長い(たとえば45サンプル以上)の場合の探索位置パターンを示しており、図11(c)ではピッチ周期Lが短い(たとえば44サンプル未満)の場合の探索位置パターンを示している。ピッチ周期Lが短い場合はサブフレーム全体の探索をしないこととなるが、ピッチ周期化処理を行うことによって、サブフレーム全体にパルスを立てることが可能となる。ピッチ周期化は、下記式(1)を用いることによって容易に行うことができる(ITU-T STUDY GROUP15 - CONTRIBUTION 152, "G.729-CODING OF SPEECH AT 8 KBIT/S USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION(CS-ACELP )", COM 15-152-E July 1995)。
code(i)=code(i)+β×code(i−L)...(1)
式(1)において、code()はパルス音源ベクトルを表し、iはサンプル番号(図11の例では、0〜79)を表す。また、βは周期化の強さを示す利得値で、周期性が強い場合は大きく周期性が弱い場合は小さくする(一般的には0〜1.0の値を用いる)。図11(c)では(−4)〜48サンプルの範囲(53サンプルの範囲)でパルス探索を行うこととなる。このため、ピッチ周期Lが53(または54)未満の場合に図11(c)の探索範囲パターンを用いることも可能である。しかし、ピッチ周期Lが45サンプル程度未満の場合にすることによって、2つのピッチピーク位置を探索範囲内に含むことができ、1周期目のピッチパルス波形と2周期目のピッチパルス波形が変化する場合や、求められたピッチピーク位置が実際のピッチピーク位置よりも1周期前の位置として誤検出された場合に対応することができる。
【0097】
パルス探索位置決定器62は、パルス探索位置パターン選択器から出力されたパルス探索位置パターンを用いて現サブフレームにおけるパルス探索位置を決定し、パルス位置探索器54に出力する。パルス探索位置パターン選択器62から出力されるパルス探索位置パターンは、ピッチピーク位置を0とする相対位置で表現されているため、そのままではパルス探索に用いることができない。このため、サブフレームの先頭を0とする絶対位置に変換してパルス位置探索器54に出力する。
【0098】
(実施の形態6)
図12は本発明の第6の実施の形態を示し、パルス位置の探索位置を適応符号ベクトルのピッチ周期およびピッチピーク位置によって決定するとともに、パルス音源に使用するパルス数を切り替える構成を有する音声符号化装置の音源生成部を示す。図12において、71は、適応符号ベクトルをピッチピーク位置算出器72と乗算器76に出力する、適応符号帳、72は、ピッチ分析あるいは適応符号帳探索によって外部で求められたピッチ周期Lと適応符号帳から出力された適応符号ベクトルを入力とし、ピッチピーク位置を探索位置算出器74に出力する、ピッチピーク位置算出器、73はピッチ分析あるいは適応符号帳探索によって外部で求められたピッチ周期Lを入力として、パルス数を探索位置算出器74に出力するパルス数決定器、74はピッチ分析あるいは適応符号帳探索によって外部で求められたピッチ周期Lとパルス数決定器73から出力されたパルス数とピッチピーク位置算出器72から出力されたピッチピーク位置を入力とし、パルスの探索位置をパルス位置探索器75に出力する探索位置算出器、75はピッチ分析あるいは適応符号帳探索によって外部で求められたピッチ周期Lと探索位置算出器74から出力されたパルス探索位置を入力とし、パルス音源に用いるパルスを立てる位置の組み合わせを決定してその組み合わせによって生成されるパルス音源ベクトルを乗算器77に出力するパルス位置探索器、76は、適応符号帳から出力された適応符号ベクトルを入力とし、適応符号ベクトル利得を乗じて加算器78に出力する乗算器、77は、パルス位置探索器から出力されたパルス音源ベクトルを入力とし、パルス音源ベクトル利得を乗じて加算器78に出力する乗算器、78は乗算器76および77から出力されたベクトルを入力とし、ベクトル加算をおこなって音源ベクトルとして出力する加算器である。
【0099】
以上のように構成されたCELP型音声符号化装置の音源生成部の動作について、図12を参照しながら説明する。適応符号帳71から出力された適応符号ベクトルは乗算器76に出力され、適応符号ベクトル利得が乗算されて加算器78に出力される。ピッチピーク位置算出器72は適応符号ベクトルからピッチピークを検出し、その位置を探索位置算出器74に出力する。ピッチピーク位置の検出(算出)は、ピッチ周期Lで並べたインパルス列ベクトルと適応符号ベクトルの内積を最大化することによって行うことができる。また、ピッチ周期Lで並べたインパルス列ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルと適応符号ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルの内積を最大化することによって、より精度良くピッチピーク位置の検出を行うことも可能である。
【0100】
パルス数決定器73はピッチ周期Lの値に基づいて、パルス音源に使用するパルスの本数を決定して、探索位置算出器74に出力する。パルス数とピッチ周期の関係は予め学習的あるいは統計的に定められており、たとえばピッチ周期が45サンプル以下の場合は5本、45サンプルを超えて80サンプル未満の場合は4本、80サンプル以上の場合は3本、というようにピッチ周期の値の範囲によってそれぞれのパルス本数が定められている。ピッチ周期が短い場合はピッチ周期化処理を用いることによってパルス探索範囲を1〜2ピッチ周期に限定できるので、位置情報を減らす代わりにパルス数を増やすことができる。また、波形的にもピッチ周期が短い女声とピッチ周期の長い男声では、波形の特徴が異なり、それぞれに適したパルス数が存在する。一般的には、男声の方がパルス性が強いためパルス数よりもパルス位置が重要となる傾向があり、女声ではパルス性が弱い為パルス数を増やしてパワーの集中を避けた方が良くなる傾向がある。これらのことから、ピッチ周期が長い場合はパルス数を少なく、ピッチ周期が短い場合はある程度パルス数を多くすることが有効となる。さらに、連続するサブフレーム間のパルス本数の変化やピッチ周期Lの変化などを考慮に入れてパルス数を決定すると、連続するサブフレーム間の不連続性緩和や有声部の立ち上がり部の品質向上を図ることができる。具体的には、連続するサブフレームで、ピッチ周期Lから決定されたパルス数が5本から3本に減少したときは、パルス数の減少にヒステリシスを持たせて、5本から急に3本に減らすのではなく4本にすることによってサブフレーム間でパルス数が大きく変化することを避けるようにする、あるいは、連続するサブフレーム間でピッチ周期Lが大きく異なる場合は、有声部の立ち上がりである可能性が大きいので、パルス数を減らしてパルス位置の精度を向上させた方が音声品質が向上するため、前サブフレームのピッチ周期Lと現サブフレームのピッチ周期Lが大きく異なる場合は現サブフレームのピッチ周期Lの値に関わらずパルス数を3本とする、等という手法によってパルス数の決定を行うとより音声品質の向上を図ることが可能である。なお、これらの手法を用いる場合には、ピッチ分析における倍ピッチ誤りや半ピッチ誤り等の影響を受けやすくなるので、これらの影響を緩和するパルス数決定法(たとえば、半ピッチや倍ピッチの可能性を考慮に入れてピッチ周期の連続性を判定するなど)を取り入れたり、ピッチ分析の精度をでき得る限り上げると、より効果的である。
【0101】
探索位置算出器74は、ピッチピーク位置とパルス本数をもとにして、パルス探索を行う位置を決定する。パルスの探索位置はピッチピーク付近は密に、それ以外の部分は疎になるように配分される(全てのサンプル点を探索するだけの十分なビット配分がないときに有効である)。すなわち、ピッチピーク位置近傍は全てのサンプル点がパルス位置探索の対象となるが、ピッチピーク位置から離れた部分は2サンプル毎や3サンプル毎というようにパルス位置探索の間隔を広くする(たとえば、図11(b)、(c)のように探索位置を決定する)。また、パルス数が多いときは1本あたりのパルスに配分されるビット数は少なくなるため、疎になる部分の間隔がパルス数が少ない場合より広くなる(パルス位置の精度が荒くなる)。なお、ピッチ周期が短い場合は、実施の形態5に示したように、サブフレーム内の最初のピッチピークから1ピッチ周期強の範囲のみに探索範囲を限定すると、より音声品質を向上することが可能である。
【0102】
パルス位置探索器75は、探索位置算出器74で決定された探索位置に基づいてパルスを立てる位置の最適な組み合わせを決定する。パルス探索の方法は「 ITU-T STUDY GROUP15 - CONTRIBUTION 152, "G.729-CODING OF SPEECH AT 8 KBIT/S USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION (CS-ACELP)", COM 15-152-E July 1995 」に示されているように、たとえばパルス数が4本の場合は式(2)を最大化するようにi0からi3の組み合わせを決定する。
Figure 0004063911
ここで、dn(i)(i=0〜79:サブフレーム長80サンプルの場合)はパルス音源成分のターゲットベクトルx‘(i)を合成フィルタのインパルス応答でバックワードフィルタリングしたもので、rr(i,i)は、式(3)のようにインパルス応答の自己相関行列である。また、i0、i1、i2、i3が取り得る位置の範囲は探索位置算出器74で求められたものである。具体的にはパルス数が4本の場合、図13(a)〜(d)のようになる(図中矢印をつけた部分が取り得る位置、なお、目盛りの数値はピッチピーク位置を0とした相対値である)。
【数1】
Figure 0004063911
...(3)
【0103】
パルス位置探索器75によって、最適パルス位置の組み合わせた決定されると、その組み合わせによって生成されるパルス音源ベクトルが乗算器77に出力され、パルス符号ベクトル利得が乗算され、加算器78に出力される。
【0104】
加算器78は適応符号ベクトル成分とパルス音源ベクトル成分の加算を行い、励振音源ベクトルとして出力する。
【0105】
(実施の形態7)
図14は、本発明の第7の発明の実施の形態を示し、パルス探索前にパルスの振幅を決定する構成を有する、CELP型音声符号化装置の音源生成部を示している。図14において、81は過去の励振音源信号のバッファから構成され、適応符号ベクトルをピッチピーク位置算出器82と乗算器88に出力する適応符号帳、82はピッチ分析あるいは適応符号帳探索によって外部で求められたピッチ周期Lと適応符号帳81から出力された適応符号ベクトルを入力とし、ピッチピーク位置を探索位置算出器84とパルス振幅算出器87に出力するピッチピーク位置算出器、83はピッチ分析あるいは適応符号帳探索によって外部で求められたピッチ周期Lを入力として、パルス数を探索位置算出器84に出力するパルス数決定器、84はピッチ分析あるいは適応符号帳探索によって外部で求められたピッチ周期Lとパルス数決定器83から出力されたパルス数とピッチピーク位置算出器82から出力されたピッチピーク位置を入力とし、パルスの探索位置をパルス位置探索器85に出力する探索位置算出器、85はピッチ分析あるいは適応符号帳探索によって外部で求められたピッチ周期Lと探索位置算出器84から出力されたパルス探索位置とパルス振幅算出器87から出力されたパルス振幅を入力とし、パルス音源に用いるパルスを立てる位置の組み合わせを決定してその組み合わせによって生成されるパルス音源ベクトルを乗算器89に出力するパルス位置探索器、86は外部のLPC分析およびLPC量子化器によって決定された線形予測フィルタによって得られる予測残差信号から、乗算器88から出力された(利得乗算後の)適応符号ベクトルを減算し、差分信号をパルス振幅算出器87に出力する加算器、87は加算器86から出力された差分信号を入力とし、パルス振幅情報をパルス位置探索器85に出力するパルス振幅算出器、88は適応符号帳81から出力された適応符号ベクトルを入力として適応符号ベクトル利得を乗算し、加算器90および86に出力する乗算器、89は、パルス位置探索器85から出力されたパルス音源ベクトルを入力としてパルス音源ベクトル利得を乗算し、加算器90に出力する乗算器、90は乗算器88および89から出力されたベクトルの加算をおこない、励振音源ベクトルとして出力する加算器である。
【0106】
以上のように構成されたCELP型音声符号化装置の音源生成部について、図14を用いてその動作を説明する。適応符号帳81から出力された適応符号ベクトルは乗算器88に出力され、適応符号ベクトル利得が乗算されて加算器90および86に出力される。
【0107】
ピッチピーク位置算出器82は適応符号ベクトルからピッチピークを検出し、その位置を探索位置算出器84およびパルス振幅算出器87に出力する。ピッチピーク位置の検出(算出)は、ピッチ周期Lで並べたインパルス列ベクトルと適応符号ベクトルの内積を最大化することによって行うことができる。また、ピッチ周期Lで並べたインパルス列ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルと適応符号ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルの内積を最大化することによって、より精度良くピッチピーク位置の検出を行うことも可能である。
【0108】
パルス数決定器83は、ピッチ周期Lの値に基づいて、パルス音源に使用するパルスの本数を決定して、探索位置算出器84に出力する。パルス数とピッチ周期の関係は予め学習的あるいは統計的に定められており、たとえばピッチ周期が45サンプル以下の場合は5本、45サンプルを超えて80サンプル未満の場合は4本、80サンプル以上の場合は3本、というようにピッチ周期の値の範囲によってそれぞれのパルス本数が定められている。さらに、連続するサブフレーム間のパルス本数の変化やピッチ周期Lの変化などを考慮に入れてパルス数を決定すると、連続するサブフレーム間の不連続性緩和や有声部の立ち上がり部の品質向上を図ることができる。具体的には、連続するサブフレームで、ピッチ周期Lから決定されたパルス数が5本から3本に減少したときは、パルス数の減少にヒステリシスを持たせて、5本から急に3本に減らすのではなく4本にすることによってサブフレーム間でパルス数が大きく変化することを避けるようにする、あるいは、連続するサブフレーム間でピッチ周期Lが大きく異なる場合は、有声部の立ち上がりである可能性が大きいので、パルス数を減らしてパルス位置の精度を向上させた方が音声品質が向上するため、前サブフレームのピッチ周期Lと現サブフレームのピッチ周期Lが大きく異なる場合は現サブフレームのピッチ周期Lの値に関わらずパルス数を3本とする、等という手法によってパルス数の決定を行うとより音声品質の向上を図ることが可能である。なお、これらの手法を用いる場合には、ピッチ分析における倍ピッチ誤りや半ピッチ誤り等の影響を受けやすくなるので、これらの影響を緩和するパルス数決定法(たとえば、半ピッチや倍ピッチの可能性を考慮に入れてピッチ周期の連続性を判定するなど)を取り入れたり、ピッチ分析の精度をでき得る限り上げると、より効果的である。
【0109】
探索位置算出器84は、ピッチピーク位置とパルス本数をもとにして、パルス探索を行う位置を決定する。パルスの探索位置はピッチピーク付近は密に、それ以外の部分は疎になるように配分される(全てのサンプル点を探索するだけの十分なビット配分がないときに有効である)。すなわち、ピッチピーク位置近傍は全てのサンプル点がパルス位置探索の対象となるが、ピッチピーク位置から離れた部分は2サンプル毎や3サンプル毎というようにパルス位置探索の間隔を広くする(たとえば、図11(b)、(c)のように探索位置を決定する)。また、パルス数が多いときは1本あたりのパルスに配分されるビット数は少なくなるため、疎になる部分の間隔がパルス数が少ない場合より広くなる(パルス位置の精度が荒くなる)。なお、ピッチ周期が短い場合は実施の形態5に示したように、サブフレーム内の最初のピッチピークから1ピッチ周期強の範囲のみに探索範囲を限定すると、より音声品質を向上することが可能である。
【0110】
パルス位置探索器85は、探索位置算出器84で決定された探索位置と後述のパルス振幅算出器87で決定されたパルス振幅情報に基づいてパルスを立てる位置の最適な組み合わせを決定する。パルス探索の方法は「 ITU-T STUDY GROUP15 - CONTRIBUTION 152,"G.729-CODING OF SPEECH AT 8 KBIT/S USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION (CS-ACELP)", COM 15-152-E July 1995」に示されているように、たとえばパルス数が4本の場合は、式(4)を最大化するようにi0からi3の組み合わせを決定する。
Figure 0004063911
ここで、dn(i)(i=0〜79:サブフレーム長80サンプルの場合)はパルス音源成分のターゲットベクトルに合成フィルタのインパルス応答を畳み込んだもので、rr(i,i)は式(3)のようにインパルス応答の自己相関行列である。また、i0、i1、i2、i3が取り得る位置の範囲は探索位置算出器84で求められたものである。具体的にはパルス数が4本の場合、図13(a)〜(d)のようになる(図中矢印をつけた部分が取りうる位置、なお、目盛りの数値はピッチピーク位置を0とした相対値である)。また、a0、a1、a2、a3はパルス振幅算出器87で求められたパルス振幅である。
【0111】
パルス位置探索器85によって、最適パルス位置の組み合わせた決定されると、その組み合わせによって生成されるパルス音源ベクトルが乗算器89に出力され、パルス符号ベクトル利得が乗算され、加算器90に出力される。
【0112】
加算器86は、外部で行われるLPC分析によって得られる線形予測残差信号(予測残差ベクトル)から適応符号ベクトル成分(適応符号ベクトルに適応符号ベクトル利得を乗算したもの)を減算し、差分信号をパルス振幅算出器87に出力する。なお、CELP型音声符号化装置の音源部においては、一般的には適応符号ベクトル利得と雑音符号ベクトル(本発明ではパルス音源ベクトルに相当)利得は、適応符号帳探索と雑音符号帳探索(本発明ではパルス位置探索に相当)の双方が終わった後に決定されるため、適応部号ベクトルに適応符号ベクトル利得を乗算したベクトルを、パルス位置探索以前に得ることはできない。このため、加算器86で減算に使用する適応符号ベクトル成分は、適応符号帳探索時に式(5)から求められる適応符号ベクトル利得(最終的な最適適応符号ベクトル利得ではない)を適応符号ベクトルに乗算したものである。
【数2】
Figure 0004063911
...(5)
ここで、x(n)はいわゆるターゲットベクトルで、ここでは聴覚重みづけした入力信号から現サブフレームのLPC合成フィルタの零入力応答を除去したものである。また、y(n)は合成音声信号のうち、適応符号ベクトルによって生成される成分で、ここでは適応符号ベクトルに、現サブフレームのLPC合成フィルタと聴覚重みづけフィルタを縦続接続したフィルタのインパルス応答を、畳み込んだものである。
【0113】
パルス振幅算出器87は、ピッチピーク位置算出器82によって求められたピッチピーク位置を用いて、加算器86から出力された差分信号をピッチピーク位置近傍とそれ以外の部分に分割し、それぞれの部分のパワーの平均値またはそれぞれの部分に含まれる各サンプル点における信号振幅の絶対値の平均値を求め、それぞれの振幅をピッチピーク位置近傍のパルス振幅およびそれ以外の部分のパルス振幅としてパルス位置探索器85に出力する。パルス位置探索器85では、ピッチパルス近傍のパルスとそれ以外の部分のパルスとで異なる振幅を用いて式(4)の評価を行い、パルス位置探索を行う。パルス位置探索で決定されたパルス位置とその位置のパルスに割り当てられたパルス振幅によって表現される、パルス音源ベクトルがパルス位置探索器85から出力される。
【0114】
加算器90は適応符号ベクトル成分とパルス音源ベクトル成分の加算を行い、励振音源ベクトルとして出力する。
【0115】
(実施の形態8)
図15は、本発明の第8の発明の実施の形態を示し、ピッチ周期の連続性の判定結果に基づいてパルス探索に用いる探索位置を切り替える構成を有する、CELP型音声符号化装置の音源生成部を示している。図15において、91は適応符号ベクトルをピッチピーク位置算出器92と乗算器99に出力する適応符号帳、92は適応符号帳91から出力された適応符号ベクトルとピッチ周期Lを入力として、適応符号ベクトル内のピッチピーク位置を探索位置算出器94に出力するピッチピーク位置算出器、93はピッチ周期Lを入力として、パルス音源のパルス数を探索位置算出器94に出力するパルス数決定器、94は、ピッチ周期Lとピッチピーク位置算出器92から出力されたピッチピーク位置とパルス数決定器93から出力されたパルス数を入力として、パルスの探索位置をスイッチ98を介してパルス位置探索器97に出力する探索位置算出器、95は、現サブフレームのピッチ周期Lを入力とし、1サブフレーム分遅延させて判定器96に出力する遅延器、96は現サブフレームのピッチ周期Lと遅延器95から出力された前サブフレームのピッチ周期を入力として、ピッチ周期の連続性の判定結果をスイッチ98に出力する判定器、97はスイッチ98を介して探索位置算出器94から入力されるパルスの探索位置またはスイッチ98を介して入力される固定探索位置と、スイッチ98を介して入力されるピッチ周期Lをそれぞれ入力とし、入力された探索位置とピッチ周期Lを用いてパルス位置の探索を行い、パルス音源ベクトルを乗算器100に出力するパルス位置探索器、98は判定器96から入力される判定結果に基づいて切り替わる連動する2系統のスイッチで、一方の系統のスイッチは、パルスの探索位置を探索位置算出器94によって算出された探索位置と予め定められている固定探索位置との切り替えに用いられ、もう一方の系統のスイッチは、ピッチ周期Lをパルス位置探索器97に入力するかしないかのON/OFFに用いられる。99は適応符号帳91から出力された適応符号ベクトルを入力とし、適応符号ベクトル利得を乗じて加算器101に出力する乗算器、100はパルス位置探索器97から出力されたパルス音源ベクトルを入力とし、パルス音源ベクトル利得を乗じて加算器101に出力する乗算器、101は乗算器99および100から入力されたベクトルの加算を行い、励振音源ベクトルとして出力する加算器である。
【0116】
以上の様に構成された、CELP型音声符号化装置の音源生成部について、図15を用いてその動作を説明する。適応符号帳91は、過去の励振音源のバッファにより構成され、外部のピッチ分析または適応符号帳探索手段によって求められたピッチ周期またはピッチラグに基づいて励振音源のバッファから該当する部分を取り出し、適応符号ベクトルとしてピッチピーク位置算出器92および乗算器99に出力する。適応符号帳91から乗算器99に出力された適応符号ベクトルは、適応符号ベクトル利得が乗算されて加算器101に出力される。
【0117】
ピッチピーク位置算出器92は、適応符号ベクトルからピッチピークを検出し、その位置を探索位置算出器94に出力する。ピッチピーク位置の検出(算出)は、ピッチ周期Lで並べたインパルス列ベクトルと適応符号ベクトルの内積を最大化することによって行うことができる。また、ピッチ周期Lで並べたインパルス列ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルと適応符号ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルの内積を最大化することによって、より精度良くピッチピーク位置の検出を行うことも可能である。
【0118】
パルス数決定器93はピッチ周期Lの値に基づいて、パルス音源に使用するパルスの本数を決定して、探索位置算出器94に出力する。パルス数とピッチ周期の関係は予め学習的あるいは統計的に定められており、たとえばピッチ周期が45サンプル以下の場合は5本、45サンプルを超えて80サンプル未満の場合は4本、80サンプル以上の場合は3本、というようにピッチ周期の値の範囲によってそれぞれのパルス本数が定められている。
【0119】
探索位置算出器94は、ピッチピーク位置とパルス本数をもとにして、パルス探索を行う位置を決定する。パルスの探索位置はピッチピーク付近は密に、それ以外の部分は疎になるように配分される(全てのサンプル点を探索するだけの十分なビット配分がないときに有効である)。すなわち、ピッチピーク位置近傍は全てのサンプル点がパルス位置探索の対象となるが、ピッチピーク位置から離れた部分は2サンプル毎や3サンプル毎というようにパルス位置探索の間隔を広くする(たとえば、図11(b)、(c)のように探索位置を決定する)。また、パルス数が多いときは1本あたりのパルスに配分されるビット数は少なくなるため、疎になる部分の間隔がパルス数が少ない場合より広くなる(パルス位置の精度が荒くなる)。なお、ピッチ周期が短い場合は実施の形態5に示したように、サブフレーム内の最初のピッチピークから1ピッチ周期強の範囲のみに探索範囲を限定すると、より音声品質を向上することが可能である。
【0120】
パルス位置探索器97は、探索位置算出器94で決定された探索位置または予め決められている固定探索位置とピッチ周期Lに基づいてパルスを立てる位置の最適な組み合わせを決定する。パルス探索の方法は「 ITU-T STUDY GROUP15 - CONTRIBUTION 152,"G.729-CODING OF SPEECH AT 8 KBIT/S USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION (CS-ACELP)", COM 15-152-E July 1995」に示されているように、たとえばパルス数が4本の場合は式(2)を最大化するようにi0からi3の組み合わせを決定する。
【0121】
スイッチ98の切り替えは、判定器96の判定結果に基づいて行われる。判定器96は、現サブフレームのピッチ周期Lと遅延器95から入力された直前のサブフレームにおけるピッチ周期を用いて、ピッチ周期が連続しているか否かを判定する。具体的には、現サブフレームのピッチ周期の値と直前のサブフレームのピッチ周期の値の差が予め定められたあるいは計算により求められた閾値以下の場合に、ピッチ周期が連続していると判定する。ピッチ周期が連続であると判定された場合、現サブフレームは有声・有声定常部であるとみなし、スイッチ98は探索位置算出器94とパルス位置探索器97を接続し、ピッチ周期Lをパルス位置探索器97に入力する(スイッチ98の一方の系統は探索位置算出器94に切り替えられ、もう一方の系統はON状態となってピッチ周期Lをパルス位置探索器97に入力する)。ピッチ周期が連続でない(現サブフレームのピッチ周期と直前のサブフレームのピッチ周期の差が閾値を超えてい)と判定された場合、現サブフレームは有声・有声定常部でない(無声部・有声立ち上がり部である)とみなし、スイッチ98は予め定められている固定探索位置をパルス探索器97に入力し、ピッチ周期Lはパルス位置探索器に入力しない(スイッチ98の一方の系統は固定探索位置に切り替えられ、もう一方の系統はOFF状態となってピッチ周期Lはパルス位置探索器97に入力されない)。
【0122】
パルス位置探索器97によって、最適パルス位置の組み合わせた決定されると、その組み合わせによって生成されるパルス音源ベクトルが乗算器100に出力され、パルス符号ベクトル利得が乗算され、加算器101に出力される。
【0123】
加算器101は適応符号ベクトル成分とパルス音源ベクトル成分の加算を行い、励振音源ベクトルとして出力する。
【0124】
なお、図16に示した表は図15の固定探索位置の内容の一例を示している。図16(b)は、図13に示した探索位置と同様に1パルスあたり8個所の位置を割り当てた場合に、サブフレーム全体に均等に探索位置が散らばるように探索位置を固定したものである(ピッチピーク近傍を密に、その他の部分を疎に、というのではなく、全体的に均等な密度にしている)。また、図16(a)は、4パルスのうち2パルスに割り当てる探索位置を4個所ずつに減らす代わりに、探索位置の種類を4種類にして、サブフレーム内の全てのサンプル点がどれかの探索位置グループに含まれる様にしたものである(パルス位置を表現する為のビット数は(a)も(b)も図13も全て同じ)。このようにすると、図16(b)のように、全く探索されない位置がなくなる為、同一のビット数でも一般的に図16(a)の方が性能が良くなる。
【0125】
なお、本実施例では、パルス数決定器93を有するパルス数可変型の音声符号化装置の音源生成部を示したが、パルス数決定器93を持たないパルス数固定型のものにおいても、ピッチ周期の連続性を用いたパルス探索位置切り替えは有効である。また、本実施例では、ピッチ周期の連続性を直前のサブフレームと現在のサブフレームのピッチ周期のみから判定しているが、さらに過去のサブフレームのピッチ周期を利用することによって判定確度を向上させることも可能である。
【0126】
(実施の形態9)
図17は、本発明の第9の発明の実施の形態を示し、ピッチゲイン(適応符号ベクトル利得)の量子化が2段量子化構成になっており、初段のターゲットが適応符号帳探索直後に算出されるピッチゲインであり、この初段の量子化ピッチゲインに基づいてパルス探索に用いる探索位置を切り替える構成を有する、CELP型音声符号化装置の音源生成部を示している。図17において、111は、適応符号ベクトルをピッチピーク位置算出器112とピッチゲイン算出器116と乗算器123に出力する適応符号帳、112は、適応符号帳111から出力された適応符号ベクトルとピッチ周期Lを入力として、適応符号ベクトル内のピッチピーク位置を探索位置算出器114に出力するピッチピーク位置算出器、113はピッチ周期Lを入力として、パルス音源のパルス数を探索位置算出器114に出力するパルス数決定器、114はピッチ周期Lとピッチピーク位置算出器112から出力されたピッチピーク位置とパルス数決定器113から出力されたパルス数を入力として、パルスの探索位置をスイッチ115を介してパルス位置探索器119に出力する探索位置算出器、115は判定器118から入力される判定結果に基づいて切り替わる連動する2系統のスイッチで、一方の系統のスイッチはパルスの探索位置を探索位置算出器114によって算出された探索位置と予め定められている固定探索位置との切り替えに用いられ、もう一方の系統のスイッチは、ピッチ周期Lをパルス位置探索器119に入力するかしないかのON/OFFに用いられる。116は適応符号帳111から出力された適応符号ベクトルと現フレームのターゲットベクトルとインパルス応答を入力とし、ピッチゲインを量子化器117に出力するピッチゲイン算出器、117はピッチゲイン算出器116から出力されるピッチゲインを量子化して、判定器118と加算器120および122に出力する量子化器、118は量子化器117から出力された初段量子化ピッチゲインを入力として、ピッチ周期性の判定結果をスイッチ115に出力する判定器、119はスイッチ115を介して探索位置算出器114から入力されるパルスの探索位置またはスイッチ115を介して入力される固定探索位置と、スイッチ115を介して入力されるピッチ周期Lをそれぞれ入力とし、入力された探索位置とピッチ周期Lを用いてパルス位置の探索を行い、パルス音源ベクトルを乗算器124に出力するパルス位置探索器、120は量子化器117から出力された初段量子化ピッチゲインと差分量子化器121から出力された差分量子化ピッチゲインとを入力として、加算結果を最適量子化ピッチゲイン(適応符号ベクトル利得)として乗算器123に出力する加算器、121は加算器122から出力された差分値を入力とし、その量子化値を加算器120に出力する差分量子化器、122は適応符号ベクトルとパルス音源ベクトルが決定された後に外部で算出される最適ピッチゲイン(適応符号ベクトル利得)と量子化器117から出力された初段量子化ピッチゲイン(適応符号ベクトル利得)とを入力とし、これらの差分を差分量子化器121に出力する加算器、123は適応符号帳111から出力された適応符号ベクトルを入力とし、加算器120から出力された量子化ピッチゲイン(適応符号ベクトル利得)を乗じて加算器125に出力する乗算器、124はパルス位置探索器119から出力されたパルス音源ベクトルを入力とし、パルス音源ベクトル利得を乗じて加算器125に出力する乗算器、125は乗算器123および124から入力されたベクトルの加算を行い、励振音源ベクトルとして出力する加算器である。
【0127】
以上のように構成された音声符号化装置の音源生成部について、図17を用いてその動作を説明する。適応符号帳111は、過去の励振音源のバッファにより構成され、外部のピッチ分析または適応符号帳探索手段によって求められたピッチ周期またはピッチラグに基づいて励振音源のバッファから該当する部分を取り出し、適応符号ベクトルとしてピッチピーク位置算出器112およびピッチゲイン算出器116および乗算器123に出力する。適応符号帳111から乗算器123に出力された適応符号ベクトルは、加算器120から出力される量子化ピッチゲイン(適応符号ベクトル利得)が乗算されて加算器125に出力される。
【0128】
ピッチピーク位置算出器112は、適応符号ベクトルからピッチピークを検出し、その位置を探索位置算出器114に出力する。ピッチピーク位置の検出(算出)は、ピッチ周期Lで並べたインパルス列ベクトルと適応符号ベクトルの内積を最大化することによって行うことができる。また、ピッチ周期Lで並べたインパルス列ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルと適応符号ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルの内積を最大化することによって、より精度良くピッチピーク位置の検出を行うことも可能である。
【0129】
パルス数決定器113はピッチ周期Lの値に基づいて、パルス音源に使用するパルスの本数を決定して、探索位置算出器114に出力する。パルス数とピッチ周期の関係は予め学習的あるいは統計的に定められており、たとえばピッチ周期が45サンプル以下の場合は5本、45サンプルを超えて80サンプル未満の場合は4本、80サンプル以上の場合は3本、というようにピッチ周期の値の範囲によってそれぞれのパルス本数が定められている。
【0130】
探索位置算出器114は、ピッチピーク位置とパルス本数をもとにして、パルス探索を行う位置を決定する。パルスの探索位置はピッチピーク付近は密に、それ以外の部分は疎になるように配分される(全てのサンプル点を探索するだけの十分なビット配分がないときに有効である)。すなわち、ピッチピーク位置近傍は全てのサンプル点がパルス位置探索の対象となるが、ピッチピーク位置から離れた部分は2サンプル毎や3サンプル毎というようにパルス位置探索の間隔を広くする(たとえば、図11(b)、(c)のように探索位置を決定する)。また、パルス数が多いときは1本あたりのパルスに配分されるビット数は少なくなるため、疎になる部分の間隔がパルス数が少ない場合より広くなる(パルス位置の精度が荒くなる)。なお、ピッチ周期が短い場合は、実施の形態5に示したように、サブフレーム内の最初のピッチピークから1ピッチ周期強の範囲のみに探索範囲を限定すると、より音声品質を向上することが可能である。
【0131】
パルス位置探索器119は、探索位置算出器114で決定された探索位置または予め決められている固定探索位置とピッチ周期Lに基づいてパルスを立てる位置の最適な組み合わせを決定する。パルス探索の方法は「 ITU-T STUDY GROUP15 - CONTRIBUTION 152,"G.729-CODING OF SPEECH AT 8 KBIT/S USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION (CS-ACELP)", COM 15-152-E July 1995」に示されているように、たとえばパルス数が4本の場合は、式(2)を最大化するようにi0からi3の組み合わせを決定する。
【0132】
スイッチ115の切り替えは、判定器118の判定結果に基づいて行われる。判定器118は、量子化器117から出力された初段量子化ピッチゲインを用いて、現サブフレームがピッチ周期性の強いサブフレームか否かを判定する。具体的には、初段量子化ピッチゲインが予め定められたあるいは計算により求められた範囲内にある場合に、ピッチ周期性が強いと判定する。ピッチ周期性が強いと判定された場合、現サブフレームは有声・有声定常部であるとみなし、スイッチ115は探索位置算出器114とパルス位置探索器119を接続し、ピッチ周期Lをパルス位置探索器に入力する(スイッチ115の一方の系統は探索位置算出器114に切り替えられ、もう一方の系統はON状態となってピッチ周期Lをパルス位置探索器119に入力する)。ピッチ周期が連続でない(現サブフレームのピッチ周期と直前のサブフレームのピッチ周期の差が閾値を超えてい)と判定された場合、現サブフレームは有声・有声定常部でない(無声部・有声立ち上がり部である)とみなし、スイッチ115は予め定められている固定探索位置をパルス探索器119に入力し、ピッチ周期Lはパルス位置探索器に入力しない(スイッチ115の一方の系統は固定探索位置に切り替えられ、もう一方の系統はOFF状態となってピッチ周期Lはパルス位置探索器119に入力されない)。
【0133】
パルス位置探索器119によって、最適パルス位置の組み合わせた決定されると、その組み合わせによって生成されるパルス音源ベクトルが乗算器124に出力され、パルス符号ベクトル利得が乗算され、加算器125に出力される。
【0134】
ピッチゲイン算出器116は、現サブフレームの量子化LPC合成フィルタと聴覚重みづけフィルタを縦続接続したフィルタのインパルス応答とターゲットベクトルと適応符号帳から出力された適応符号ベクトルとを用いて、式(5)によってピッチゲイン(適応符号ベクトル利得)を算出する。算出されたピッチゲインは量子化器117で量子化され、ピッチ周期性の強さを判定する判定器118と加算器120および122に出力される。加算器122では、音源符号帳探索(適応符号帳探索と雑音符号帳探索(本実施例ではパルス位置探索))が全て終了した後に算出される最適量子化ピッチゲインと、量子化器117から出力される(初段)量子化ピッチゲインとの差分を計算し、差分量子化器121に出力する。差分量子化器121で量子化された差分値は、加算器120によって、量子化器117から出力される初段量子化ピッチゲインと加算されて、最適量子化ピッチゲインとして乗算器123に出力される。
【0135】
乗算器123は、適応符号帳111から出力された適応符号ベクトルに最適量子化ピッチゲインを乗じて、加算器125に出力する。
【0136】
加算器125は、適応符号ベクトル成分とパルス音源ベクトル成分の加算を行い、励振音源ベクトルとして出力する。
【0137】
なお、本実施例では、判定器118の入力として、現サブフレームの初段量子化ピッチゲインを用いたが、一般的なゲイン量子化を用いた場合(本実施例に示したような多段量子化を用いない場合)には、直前のサブフレームの量子化ピッチゲイン(適応符号ベクトル利得)を判定器118の入力とすることも可能である。また、本実施例では、パルス数決定器を有するパルス数可変型の音声符号化装置の音源生成部を示したが、パルス数決定器を持たないパルス数固定型のものにおいても、ピッチゲインの値を用いて周期性の強さを判定してパルス探索位置切り替えを行うことは有効である。
【0138】
(実施の形態10)
図18は本発明の第10の実施の形態を示し、連続するサブフレーム間の音源信号波形の位相の連続性を利用して、バックワードで雑音符号帳に対する位相適応処理の切り替えを行う音声符号化装置の音源生成部を示す。図18において、1801は適応符号ベクトルをピッチピーク位置算出器1802と乗算器1810に出力する適応符号帳、1802は適応符号帳1801から出力された適応符号ベクトルとピッチ周期Lとを入力として、適応符号ベクトル内のピッチピーク位置を遅延器1803と判定器1806と探索位置算出器1807とに出力するピッチピーク位置算出器、1803はピッチピーク位置算出器1802から出力されたピッチピーク位置を入力として、1サブフレーム分遅延させてピッチピーク位置予測器1805に出力する遅延器、1804はピッチ周期Lを入力として、1サブフレーム分遅延させてピッチピーク位置予測器1805に出力する遅延器、1805は遅延器1803から出力された直前のサブフレームにおけるピッチピーク位置と遅延器1804から出力された直前のサブフレームにおけるピッチ周期と現在のサブフレームにおけるピッチ周期Lとを入力として、予測ピッチピーク位置を判定器1806に出力するピッチピーク位置予測器、1806はピッチピーク位置算出器1802から出力されたピッチピーク位置とピッチピーク位置予測器1805から出力された予測ピッチピーク位置とを入力として、直前のサブフレームと現在のサブフレームで位相の連続性があるかどうかを判定し、判定結果をスイッチ1808に出力する判定器、1807はピッチピーク位置算出器1802から出力されたピッチピーク位置とピッチ周期Lとを入力として、音源パルスの探索位置をスイッチ1808を介してパルス位置探索器1809に出力する探索位置算出器、1808は判定器1806から出力された判定結果に基づいて切り替わるスイッチで、探索位置算出器から出力された探索位置と予め定められている固定探索位置との切り替えに用いられる。1809はスイッチ1808を介して探索位置算出器1807から入力される音源パルスの探索位置またはスイッチ1808を介して入力される固定探索位置と、ピッチ周期Lをそれぞれ入力とし、入力された音源パルス探索位置とピッチ周期Lを用いて音源パルスの位置を探索し、パルス音源ベクトルを乗算器1812に出力するパルス位置探索器、1810は適応符号帳1801から出力された適応符号ベクトルを入力として量子化適応符号ベクトル利得を乗じて加算器1811に出力する乗算器、1812はパルス位置探索器1809から出力されるパルス音源ベクトルを入力として量子化パルス音源ベクトル利得を乗じて加算器1811に出力する乗算器、1811は乗算器1810および1812から出力されたベクトルをそれぞれ入力とし、入力されたベクトルの加算を行い、励振音源ベクトルとして出力する加算器である。
【0139】
以上のように構成された音声符号化装置の音源生成部について、図18を用いてその動作を説明する。適応符号帳1801は、過去の励振音源のバッファにより構成され、外部のピッチ分析または適応符号帳探索手段によって求められたピッチ周期またはピッチラグに基づいて励振音源のバッファから該当する部分を取り出し、適応符号ベクトルとしてピッチピーク位置算出器1802および乗算器1810に出力する。適応符号帳1801から乗算器1810に出力された適応符号ベクトルは、外部のゲイン量子化器によって量子化された量子化適応符号ベクトル利得が乗算されて加算器1811に出力される。
【0140】
ピッチピーク位置算出器1802は、適応符号ベクトルからピッチピークを検出し、その位置を遅延器1803と判定器1806と探索位置算出器1807のそれぞれに出力する。ピッチピーク位置の検出(算出)は、ピッチ周期Lで並べたインパルス列ベクトルと適応符号ベクトルの正規化相互相関関数を最大化することによって行うことができる。また、ピッチ周期Lで並べたインパルス列ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルと、適応符号ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルとの正規化相互相関関数を最大化することによって、より精度良くピッチピーク位置の検出を行うことも可能である。さらに、検出されたピッチピーク位置を含む1ピッチ周期波形の中から振幅値最大となる位置をピッチピークとする後処理を加えれば、1ピッチ周期波形内のセカンドピークを誤検出することを回避することも可能である。
【0141】
遅延器1803は、ピッチピーク位置算出器1802で算出されたピッチピーク位置を1サブフレーム分だけ遅延させてピッチピーク位置予測器1805に出力する。即ち、ピッチピーク位置予測器1805には直前のサブフレームにおけるピッチピーク位置が遅延器1803から入力される。遅延器1804は、ピッチ周期Lを1サブフレーム分だけ遅延させてピッチピーク位置算出器1805に出力する。即ち、ピッチピーク位置予測器1805には直前のサブフレームにおけるピッチ周期が遅延器1804から入力される。
【0142】
ピッチピーク位置予測器1805は、遅延器1803から入力される直前のサブフレームにおけるピッチピーク位置と、遅延器1804から入力される直前のサブフレームにおけるピッチ周期と、現在のサブフレームにおけるピッチ周期Lを入力として、現在のサブフレームにおけるピッチピーク位置を予測し、予測ピッチピーク位置を判定器1806に出力する。予測ピッチピーク位置は(6)式によって求められる(図19参照)。
Φ(N)=Φ(N−1)+n×T(N−1)+T(N)−L,
n=INT((L−Φ(N−1))/T(N−1))...(6)
【0143】
上式において、Φ(k)は第k番目のサブフレームにおける最初のピッチピーク位置をそのサブフレームの先頭を0として表したものであり、T(k)は第k番目のサブフレームにおける音源(音声)信号のピッチ周期であり、Lはサブフレーム長である。また、nは第k番目のサブフレームにおける最初のピッチピーク位置(Φ(k))から第k番目のサブフレームの最後のまでの間にいくつのピッチ周期長が含まれるか(小数点以下切り捨て)を示す整数値である。(k=0,1,2,…)
【0144】
判定器1806は、ピッチピーク位置算出器1802から出力されたピッチピーク位置とピッチピーク位置予測器1805から出力された予測ピッチピーク位置とを入力とし、ピッチピーク位置が予測ピッチピーク位置と大きくかけ離れていない場合は位相が連続していると判定し、ピッチピーク位置が予測ピッチピーク位置と大きく異なる場合は位相が連続していないと判定する。そして、判定結果をスイッチ1808に出力する。なお、ピッチピーク位置を予測ピッチピーク位置と比較する際、ピッチピーク位置または予測ピッチピーク位置がサブフレーム境界付近に存在する場合は、1ピッチ周期後の位置がピッチピーク位置である可能性も考慮して、ピッチピーク位置と予測ピッチピーク位置の比較を行って位相の連続性の判定を行う。
【0145】
探索位置算出器1807は、ピッチピーク位置を基準として音源パルスの探索位置を決定し、探索位置をスイッチ1808を介してパルス位置探索器1809に出力する。探索位置の決定法としては、例えば実施の形態6や実施の形態8に示したようにピッチピーク近傍は密にそれ以外の部分は疎に探索位置が分布するように決定される。なお、実施の形態6や実施の形態8に示したようにピッチ周期情報を用いて音源パルス数を変化させたり、音源パルスの探索範囲を限定したりすることを適用することも有効である。
【0146】
スイッチ1808は、判定器1806の判定結果に基づいて位相適応型の音源パルス探索を行うか、固定位置による音源パルス探索(または一般の雑音符号帳探索)を行うかを切り替えるものである。即ち、判定器1806の判定結果が、「位相の連続性あり」の場合は探索位置算出器1807とパルス位置探索器1809を接続して、探索位置算出器1807によって算出された音源パルス探索位置をパルス位置探索器1809に入力させる(つまり、位相適応型の音源パルス探索を行わせる)。反対に、判定器1806の判定結果が、「位相の連続性なし」の場合は固定探索位置をパルス位置探索器1809に入力させるように切り替わる(一般の雑音符号帳探索と切り替える場合は別途雑音符号帳探索器を備える構成とし、パルス位置探索器1809と切り替えて用いる構成にする)。
【0147】
パルス位置探索器1809は、探索位置算出器1807で決定された音源パルス探索位置または予め決められている固定探索位置と、別途入力されるピッチ周期Lを用いて、音源パルスを立てる位置の最適な組み合わせを決定する。パルス探索の方法は「ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), March 1996 」に示されているように、例えばパルス数が4本の場合は実施の形態6で示した式(2)を最大化するようにi0からi3の組み合わせを決定する。なお、この時の各音源パルスの極性は、雑音符号帳成分のターゲットベクトル、即ち聴覚重みづけされた入力音声から聴覚重みづけ合成フィルタの零入力応答信号と適応符号帳成分の信号を減じた信号ベクトル、の各位置における極性と等しくなるようにパルス位置探索を行う前に予め決定している。また、ピッチ周期がサブフレーム長より短い場合には実施の形態5にも示したようにピッチ周期化フィルタをかけることによって、音源パルスをインパルスではなくピッチ周期のパルス列になるようにしている。このようなピッチ周期化処理を行う場合は聴覚重みづけ合成フィルタのインパルス応答ベクトルにピッチ周期化フィルタを予めかけておけば、ピッチ周期化を行わない場合と同様にして式(2)の最大化によって音源パルスの探索を行うことができる。このようにして決定された各音源パルスの位置に、決定された各音源パルスの極性にしたがってパルスを立て、ピッチ周期Lを用いてピッチ周期化フィルタをかければ、パルス音源ベクトルが生成される。生成されたパルス音源ベクトルは乗算器1812に出力される。パルス位置探索器1809から乗算器1812に出力されたパルス音源ベクトルは、外部のゲイン量子化器によって量子化された量子化パルス音源ベクトル利得が乗算されて加算器1811に出力される。
【0148】
加算器1811は、乗算器1810から出力された適応符号ベクトル成分と、乗算器1812から出力されたパルス音源ベクトル成分とのベクトル加算を行い、励振音源ベクトルとして出力する。
【0149】
なお、本発明による音声符号化装置においては、有声定常部以外の部分では、固定探索位置が選択され続ける状態が生じ易いので、伝送路誤りの影響が伝播している場合にはリセットをかける効果を得ることもできる。(ピッチピーク位置を0とする相対位置でパルス位置を表現する場合は、一度伝送路誤りが生じて符号器側と復号器側の適応符号帳の内容が大きく異なってしまうと、後続のフレームにおいて伝送路誤りがなくてもピッチピーク位置が符号器側と復号器側で一致しなくなり続ける現象が発生することがあり、誤りの影響を長く引きずることになる。)
【0150】
また、パルスの立て方としては、定数本例えば4本のパルスを探索範囲、例えば32箇所の位置のどこかに立てる場合においては、前述のように32箇所を4つに分けて1本のパルスを割り当てられた8箇所の中の1箇所に決定するように全ての組み合わせ(8×8×8×8通り)を探索する方法の他に、32箇所の中から4箇所を選びだす組み合わせ全てについて探索する方法などがある。なお、振幅1のインパルスの組み合わせの他に、複数本例えば2本のパルスを組み合わせたパルス対の組み合わせや、振幅の異なるインパルスの組み合わせによるパルスの立て方も可能である。
【0151】
(実施の形態11)
図20は本発明の第11の実施の形態を示し、適応符号ベクトルの形状に強いパルス性が存在するか否かで、位相適応処理を行うか行わないかの切り替えを行うCELP型音声符号化装置の音源生成部を示している。図20において、2001は適応符号ベクトルをピッチピーク位置算出器2002とパルス性判定器2003と乗算器2007に出力する適応符号帳、2002は適応符号帳2001から出力された適応符号ベクトルとピッチ周期Lとを入力として、適応符号ベクトル内のピッチピーク位置をパルス性判定器2003と探索位置算出器2004とに出力するピッチピーク位置算出器、2003は適応符号帳2001から出力された適応符号ベクトルとピッチピーク位置算出器2002から出力されたピッチピーク位置と外部から入力するピッチ周期Lを入力として、適応符号ベクトルによいパルス性が存在するか否かを判定し、判定結果をスイッチ2005に出力するパルス性判定器、2004は外部から入力するピッチ周期Lとピッチピーク位置算出器2002から出力されるピッチピーク位置を入力として、音源パルスの探索位置をスイッチ2005を介してパルス位置探索器2006に出力する探索位置算出器、2005はパルス性判定器2003から出力された判定結果に基づいて切り替わるスイッチで、探索位置算出器2004から出力された探索位置と予め定められている固定探索位置との切り替えに用いられる。2006はスイッチ2005を介して探索位置算出器2004から入力される音源パルスの探索位置またはスイッチ2005を介して入力される固定探索位置と外部から入力されるピッチ周期Lをそれぞれ入力とし、入力された音源パルス探索位置とピッチ周期Lを用いて音源パルスの位置を探索し、パルス音源ベクトルを乗算器2009に出力するパルス位置探索器、2007は適応符号帳2001から出力された適応符号ベクトルを入力として量子化適応符号ベクトル利得を乗じて加算器2008に出力する乗算器、2009はパルス位置探索器2006から出力されるパルス音源ベクトルを入力として量子化パルス音源ベクトル利得を乗じて加算器2008に出力する乗算器、2008は乗算器2007および2009から出力されたベクトルをそれぞれ入力とし、入力されたベクトルの加算を行い、励振音源ベクトルとして出力する加算器である。
【0152】
以上のように構成された音声符号化装置の音源生成部について、図20を用いてその動作を説明する。適応符号帳2001は、過去の励振音源のバッファにより構成され、外部のピッチ分析または適応符号帳探索手段によって求められたピッチ周期またはピッチラグに基づいて励振音源のバッファから該当する部分を取り出し、適応符号ベクトルとしてピッチピーク位置算出器2002およびパルス性判定器2003および乗算器2007に出力する。適応符号帳2001から乗算器2007に出力された適応符号ベクトルは、外部のゲイン量子化器によって量子化された量子化適応符号ベクトル利得が乗算されて加算器2008に出力される。
【0153】
ピッチピーク位置算出器2002は、適応符号ベクトルからピッチピークを検出し、その位置をパルス性判定器2003と探索位置算出器2004のそれぞれに出力する。ピッチピーク位置の検出(算出)は、ピッチ周期Lで並べたインパルス列ベクトルと適応符号ベクトルの正規化相互相関関数を最大化することによって行うことができる。また、ピッチ周期Lで並べたインパルス列ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルと、適応符号ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルとの正規化相互相関関数を最大化することによって、より精度良くピッチピーク位置の検出を行うことも可能である。さらに、検出されたピッチピーク位置を含む1ピッチ周期波形の中から振幅値最大となる位置をピッチピークとする後処理を加えれば、1ピッチ周期波形内のセカンドピークを誤検出することを回避することも可能である。
【0154】
パルス性判定器2003は、ピッチピーク位置算出器2002で算出されたピッチピーク位置付近に適応符号ベクトルの信号パワーが集中しているかどうかを判定し、信号パワーの集中がある場合は「パルス性あり」の判定結果をスイッチ2005に出力、信号パワーの集中が見られない場合は「パルス性なし」の判定結果をスイッチ2005に出力する。信号パワーが集中しているかどうかを調べる手法としては、例えば以下のような方法が考えられる。まず、ピッチピーク位置を含む1ピッチ周期長の適応符号ベクトルを切り出し、切り出した信号全体のパワーを算出しこれをPW0とする。次に、ピッチピーク位置の近傍の2分の1から3分の1ピッチ長の適応符号ベクトルを切り出し、この切り出した信号パワーを算出しこれをPW1とする。PW1/PW0の値が所定の値(例えば0.5から0.6程度)以上である場合は、ピッチピーク近傍に信号パワーが集中しているので、パルス性が高いを判定することができる。また、別の判定方法としては、ピッチピーク位置に最初のインパルスが立つピッチ周期間隔で並べたインパルス列ベクトルで適応符号ベクトルを近似した場合の、インパルス列ベクトルと適応符号ベクトルのとの誤差を用いた判定方法がある。さらに、ピッチ周期Lで並べたインパルス列ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルと、適応符号ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルとの正規化相互相関関数を最大化することによってピッチピーク位置を求めた場合には、ピッチ周期Lで並べたインパルス列ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルと、適応符号ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルとの誤差を用いた判定方法がある。これらベクトル間の誤差を評価する手段としては、式(7)に示すような予測ゲインや式(8)に示すような正規化相互相関関数などをを利用する。式(7)および(8)において、x(n)は適応符号ベクトルまたは適応符号ベクトルに合成フィルタのインパルス応答を畳み込んだベクトル、y(n)はインパルス列ベクトルまたはインパルス列ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルである。どちらの式においても値が例えば0.3〜0.4以上あれば、ある程度強いパルス性が適応符号ベクトルに存在していると判定できる。
【数3】
Figure 0004063911
...(7)
【数4】
Figure 0004063911
...(8)
【0155】
探索位置算出器2004は、ピッチピーク位置を基準として音源パルスの探索位置を決定し、探索位置をスイッチ2005を介してパルス位置探索器2006に出力する。探索位置の決定法としては、例えば実施の形態6や実施の形態8に示したようにピッチピーク近傍は密にそれ以外の部分は疎に探索位置が分布するように決定される。なお、実施の形態6や実施の形態8に示したようにピッチ周期情報を用いて音源パルス数を変化させたり、音源パルスの探索範囲を限定したりすることを適用することも有効である。
【0156】
スイッチ2005は、パルス性判定器2003の判定結果に基づいて位相適応型の音源パルス探索を行うか、固定位置による音源パルス探索を行うかを切り替えるものである。即ち、パルス性判定器2003の判定結果が、「パルス性あり」の場合は探索位置算出器2004とパルス位置探索器2006を接続して、探索位置算出器2004によって算出された音源パルス探索位置をパルス位置探索器2006に入力させる(つまり、位相適応型の音源パルス探索を行わせる)。反対に、パルス性判定器2003の判定結果が、「パルス性なし」の場合は固定探索位置をパルス位置探索器2006に入力させるように切り替わる。
【0157】
パルス位置探索器2006は、探索位置算出器2004で決定された音源パルス探索位置または予め決められている固定探索位置と、別途入力されるピッチ周期Lを用いて、音源パルスを立てる位置の最適な組み合わせを決定する。パルス探索の方法は「ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), March 1996 」に示されているように、例えばパルス数が4本の場合は実施の形態6で示した式(2)を最大化するようにi0からi3の組み合わせを決定する。なお、この時の各音源パルスの極性は、雑音符号帳成分のターゲットベクトル、即ち聴覚重みづけされた入力音声から聴覚重みづけ合成フィルタの零入力応答信号と適応符号帳成分の信号を減じた信号ベクトル、の各位置における極性と等しくなるようにパルス位置探索を行う前に予め決定している。また、ピッチ周期がサブフレーム長より短い場合には実施の形態5にも示したようにピッチ周期化フィルタをかけることによって、音源パルスをインパルスではなくピッチ周期のパルス列になるようにしている。このようなピッチ周期化処理を行う場合は、聴覚重みづけ合成フィルタのインパルス応答ベクトルにピッチ周期化フィルタを予めかけておけば、ピッチ周期化を行わない場合と同様にして式(2)の最大化によって音源パルスの探索を行うことができる。このようにして決定された各音源パルスの位置に、決定された各音源パルスの極性にしたがってパルスを立て、ピッチ周期Lを用いてピッチ周期化フィルタをかければ、パルス音源ベクトルが生成される。生成されたパルス音源ベクトルは乗算器2009に出力される。パルス位置探索器2006から乗算器2009に出力されたパルス音源ベクトルは、外部のゲイン量子化器によって量子化された量子化パルス音源ベクトル利得が乗算されて加算器2008に出力される。
【0158】
加算器2008は、乗算器2007から出力された適応符号ベクトル成分と、乗算器2009から出力されたパルス音源ベクトル成分とのベクトル加算を行い、励振音源ベクトルとして出力する。
【0159】
なお、本発明による音声符号化装置においては、有声定常部以外の部分では、固定探索位置が選択され続ける状態が生じ易いので、伝送路誤りの影響が伝播している場合にはリセットをかける効果を得ることもできる。(ピッチピーク位置を0とする相対位置でパルス位置を表現する場合は、一度伝送路誤りが生じて符号器側と復号器側の適応符号帳の内容が大きく異なってしまうと、後続のフレームにおいて伝送路誤りがなくてもピッチピーク位置が符号器側と復号器側で一致しなくなり続ける現象が発生することがあり、誤りの影響を長く引きずることになる。)
【0160】
なお、パルスの立て方としては、定数本例えば4本のパルスを探索範囲、例えば32箇所の位置のどこかに立てる場合においては、前述のように32箇所を4つに分けて1本のパルスを割り当てられた8箇所の中の1箇所に決定するように全ての組み合わせ(8×8×8×8通り)を探索する方法の他に、32箇所の中から4箇所を選びだす組み合わせ全てについて探索する方法などがある。なお、振幅1のインパルスの組み合わせの他に、複数本例えば2本のパルスを組み合わせたパルス対の組み合わせや、振幅の異なるインパルスの組み合わせによるパルスの立て方も可能である。
【0161】
(実施の形態12)
図21は本発明の第12の実施の形態を示し、パルス探索位置のインデックスを付け替えるインデックス更新手段を備え、パルス位置の探索範囲を適応符号ベクトルのピッチ周期およびピッチピーク位置によって決定するCELP型音声符号化装置の符号器側の音源生成部を示す。より具体的には、ピッチピーク位置からの相対位置で音源パルス探索を行うCELP型音声符号化装置において、サブフレームの先頭側から順番にパルス位置のインデックスを付けるようにすることによって、あるフレームにおいて発生した伝送路誤りの影響が後続の伝送路誤りのないフレームに伝播することを防ぐようにした音源生成部を示す。
【0162】
図21において、2101は過去の励振音源ベクトルを保存し、選択された適応符号ベクトルをピッチピーク位置算出器2102およびピッチゲイン乗算器2106に出力する適応符号帳、2102は適応符号帳2101から出力された適応符号ベクトルとピッチ周期Lを入力としてピッチピーク位置を算出し、探索位置算出器2103に出力するピッチピーク位置算出器、2103はピッチピーク位置算出器2102から出力されたピッチピーク位置とピッチ周期Lを入力としてパルス音源を探索する範囲を算出し、インデックス更新手段2104へ出力する探索位置算出器、2104は探索位置算出器2103から出力された、各音源パルスの各位置のインデックスを付け替えてパルス位置探索器2105に出力するインデックス更新手段、2105はインデックス更新手段2104から出力された探索位置(パルス位置を表すインデックスが付け直されている)と、音源生成部の外部で別途算出されたピッチ周期Lとを入力としてパルス音源を探索し、パルス音源ベクトルをパルス音源ゲイン乗算器2107に出力し、符号化出力としてパルス音源ベクトルを表すインデックスを音源生成部の外部に出力するパルス位置探索器、2106は適応符号帳2101から出力された適応符号ベクトルに適応符号ベクトル利得を乗じて加算器2108に出力する乗算器、2107はパルス位置探索器2105から出力されたパルス音源ベクトルにパルス音源ベクトル利得を乗じて加算器2108に出力する乗算器、2108は乗算器2106からの出力と乗算器2107からの出力を入力とし、ベクトル加算して励振音源ベクトルとして出力する加算器である。
【0163】
以上のように構成された、音源生成部の動作について、図21および図22を用いて説明する。図21において、適応符号帳2101は、音源生成部の外部で予め算出されるピッチ周期Lだけ過去に溯った点から、適応符号ベクトルをサブフレーム長だけ切り出して、適応符号ベクトルとして出力する。ピッチ周期Lがサブフレーム長に満たない場合は、切り出したピッチ周期Lのベクトルを、サブフレーム長に達するまで繰り返して接続したものを適応符号ベクトルとして出力する。
【0164】
ピッチピーク位置算出器2102は、適応符号帳2101から出力された適応符号ベクトルを用いて適応符号ベクトル内に存在するピッチピークの位置を決定する。ピッチピークの位置は、ピッチ周期で並べたインパルス列と適応符号ベクトルとの正規化相互相関を最大化することによって行うことができる。また、ピッチ周期で並べたインパルス列を合成フィルタに通したものと、適応符号ベクトルを合成フィルタに通したもとの誤差を最小化することによって、より精度良く求めることも可能である。
【0165】
探索位置算出器2103は、ピッチピーク位置を基準として音源パルスの探索位置を決定し、インデックス更新手段2104に出力する。探索位置の決定法としては、例えば実施の形態5や実施の形態6に示したようにピッチピーク近傍は密にそれ以外の部分は疎に探索位置が分布するように決定される。なお、実施の形態6や実施の形態8に示したようにピッチ周期情報を用いて音源パルス数を変化させたり、音源パルスの探索範囲を限定したりすることを適用することも有効である。探索位置算出器2103によって決定される具体的な探索位置の例は図10、図11(b)、図11(c)、図13に示している。例えば図10においては、ピッチパルス位置近傍は密に、それ以外の部分は疎に、パルス位置探索範囲を限定する方法を具体的に示している。この限定方法は、パルスが立てられる確率が高い位置がピッチパルス近傍に集中する統計的結果に基づいている。パルス位置探索範囲を限定しない場合、有声部においてはピッチパルス近傍にパルスが立てられる確率がその他の部分に立てられる確率に比べて高くなる。なお、探索位置算出器で算出されるのは、ピッチピーク位置からの相対位置を用いた、音源パルスの探索位置であり、この時点では、ピッチピーク位置を0とする相対位置の数値が小さいものから順にインデックスが付けられている(図22参照。なお図22ではパルス数を4本とした場合の図13(a)に対応する場合を示している。)。
【0166】
インデックス更新手段2104は、ピッチピーク位置からの相対位置が小さいものから順番にインデックスが付けられている(図22の相対位置)音源パルス探索位置を、サブフレームの先頭を0とする絶対位置に変換した後に絶対位置が小さいものから順番にインデックスを付け直して(図22の絶対位置)、パルス位置探索器2105へ出力する。このようにすることによって、伝送路誤りが生じるなどして符号器側と復号器側とで算出されるピッチピーク位置が異なった場合において、パルス位置のずれを小さくすることができる。
【0167】
パルス位置探索器2105は、インデックス更新手段2104によって各探索位置を示すインデックの付け直しが行われた音源パルス探索位置と、別途入力されるピッチ周期Lを用いて、音源パルスを立てる位置の最適な組み合わせを決定する。パルス探索の方法は「ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), March 1996 」に示されているように、例えばパルス数が4本の場合は実施の形態6で示した式(2)を最大化するようにi0からi3の組み合わせを決定する。なお、この時の各音源パルスの極性は、雑音符号帳成分のターゲットベクトル、即ち聴覚重みづけされた入力音声から聴覚重みづけ合成フィルタの零入力応答信号と適応符号帳成分の信号を減じた信号ベクトル、の各位置における極性と等しくなるようにパルス位置探索を行う前に予め決定すれば探索のための演算量を大幅に軽減できる。また、ピッチ周期がサブフレーム長より短い場合には実施の形態5にも示したようにピッチ周期化フィルタをかけることによって、音源パルスをインパルスではなくピッチ周期のパルス列になるようにしている。このようなピッチ周期化処理を行う場合は、聴覚重みづけ合成フィルタのインパルス応答ベクトルにピッチ周期化フィルタを予めかけておけば、ピッチ周期化を行わない場合と同様にして式(2)の最大化によって音源パルスの探索を行うことができる。このようにして決定された各音源パルスの位置に、決定された各音源パルスの極性にしたがってパルスを立て、ピッチ周期Lを用いてピッチ周期化フィルタをかければ、パルス音源ベクトルが生成される。生成されたパルス音源ベクトルは乗算器2107に出力される。パルス位置探索器2105から乗算器2107に出力されたパルス音源ベクトルは、外部のゲイン量子化器によって量子化された量子化パルス音源ベクトル利得が乗算されて加算器2108に出力される。なお、パルス位置探索器2105においては、パルス音源ベクトルとともにパルス音源ベクトルを表す各音源パルスの極性およびインデックス情報が別途音源生成部の外部に出力される。この音源パルスの極性およびインデックス情報は符号化器や多重化器などを通って伝送路へ出力されるデータ系列に変換されて伝送路へ送り出される。
【0168】
加算器2108は、乗算器2106から出力された適応符号ベクトル成分と、乗算器2107から出力されたパルス音源ベクトル成分とのベクトル加算を行い、励振音源ベクトルとして出力する。
【0169】
なお、本実施の形態に基づくインデックスの割り当て方法は、音源の位置情報が相対的な値で表現される全ての場合に適用することが可能であり、インデックスの割り当てかたのみの違いであるので、性能に全く影響を及ぼさずに伝送路誤りの伝播を抑える効果を得ることができる。
【0170】
なお、復号器側にも符号器側と同様のインデックス更新手段を備える。また、パルスの立て方としては、定数本例えば4本のパルスを探索範囲、例えば32箇所の位置のどこかに立てる場合においては、前述のように32箇所を4つに分けて1本のパルスを割り当てられた8箇所の中の1箇所に決定するように全ての組み合わせ(8×8×8×8通り)を探索する方法の他に、32箇所の中から4箇所を選びだす組み合わせ全てについて探索する方法などがある。なお、振幅1のインパルスの組み合わせの他に、複数本例えば2本のパルスを組み合わせたパルス対の組み合わせや、振幅の異なるインパルスの組み合わせによるパルスの立て方も可能である。
【0171】
(実施の形態13)
図23は本発明の第13の実施の形態を示し、パルス探索位置のインデックスおよびパルス番号の割り当てを行うパルス番号およびインデックスの更新手段を備えた、パルス位置の探索範囲を適応符号ベクトルのピッチ周期およびピッチピーク位置によって決定するCELP型音声符号化装置の符号器側の音源生成部を示す。より具体的には、ピッチピーク位置からの相対位置で音源パルス探索を行うCELP型音声符号化装置において、サブフレームの先頭側から順番にパルス位置のインデックスを付けるとともに、同じインデックス番号である異なる番号のパルスに対しては、サブフレームの先頭側から順番にパルスの番号を付ける、即ち同じインデックス番号の場合パルスの番号が若いほどサブフレームの先頭側になるように各パルスの番号を決めるようにすることによって、あるフレームにおいて発生した伝送路誤りの影響が後続の伝送路誤りのないフレームに伝播することを防ぐようにした音源生成部を示す。
【0172】
図23において、2301は過去の励振音源ベクトルを保存し、選択された適応符号ベクトルをピッチピーク位置算出器2302およびピッチゲイン乗算器2306に出力する適応符号帳、2302は適応符号帳2301から出力された適応符号ベクトルとピッチ周期Lを入力としてピッチピーク位置を算出し、探索位置算出器2303に出力するピッチピーク位置算出器、2303はピッチピーク位置算出器2302から出力されたピッチピーク位置とピッチ周期Lを入力としてパルス音源を探索する範囲を算出し、パルス番号およびインデックスの更新手段2304へ出力する探索位置算出器、2304は探索位置算出器2303から出力された、各音源パルスの番号と各音源パルスの各位置のインデックスを付け替えてパルス位置探索器2305に出力するパルス番号およびインデックスの更新手段、2305はパルス番号およびインデックスの更新手段2304から出力された探索位置(パルスの番号とパルス位置を表すインデックスが付け直されている)と、音源生成部の外部で別途算出されたピッチ周期Lとを入力としてパルス音源を探索し、パルス音源ベクトルをパルス音源ゲイン乗算器2307に出力し、符号化出力としてパルス音源ベクトルを表すインデックスを音源生成部の外部に出力するパルス位置探索器、2306は適応符号帳2301から出力された適応符号ベクトルに適応符号ベクトル利得を乗じて加算器2308に出力する乗算器、2307はパルス位置探索器2305から出力されたパルス音源ベクトルにパルス音源ベクトル利得を乗じて加算器2308に出力する乗算器、2308は乗算器2306からの出力と乗算器2307からの出力を入力とし、ベクトル加算して励振音源ベクトルとして出力する加算器である。
【0173】
以上のように構成された、音源生成部の動作について、図23および図24を用いて説明する。図23において、適応符号帳2301は、音源生成部の外部で予め算出されるピッチ周期Lだけ過去に溯った点から、適応符号ベクトルをサブフレーム長だけ切り出して、適応符号ベクトルとして出力する。ピッチ周期Lがサブフレーム長に満たない場合は、切り出したピッチ周期Lのベクトルを、サブフレーム長に達するまで繰り返して接続したものを適応符号ベクトルとして出力する。
【0174】
ピッチピーク位置算出器2302は、適応符号帳2301から出力された適応符号ベクトルを用いて適応符号ベクトル内に存在するピッチピークの位置を決定する。ピッチピークの位置は、ピッチ周期で並べたインパルス列と適応符号ベクトルとの正規化相互相関を最大化することによって行うことができる。また、ピッチ周期で並べたインパルス列を合成フィルタに通したものと、適応符号ベクトルを合成フィルタに通したもとの誤差を最小化することによって、より精度良く求めることも可能である。
【0175】
探索位置算出器2303は、ピッチピーク位置を基準として音源パルスの探索位置を決定し、パルス番号およびインデックスの更新手段2304に出力する。探索位置の決定法としては、例えば実施の形態6や実施の形態8に示したようにピッチピーク近傍は密にそれ以外の部分は疎に探索位置が分布するように決定される。なお、実施の形態6や実施の形態8に示したようにピッチ周期情報を用いて音源パルス数を変化させたり、音源パルスの探索範囲を限定したりすることを適用することも有効である。探索位置算出器2303によって決定される具体的な探索位置の例は図10、図11(b)、図11(c)、図13に示している。例えば図10においては、ピッチパルス位置近傍は密に、それ以外の部分は疎に、パルス位置探索範囲を限定する方法を具体的に示している。この限定方法は、パルスが立てられる確率が高い位置がピッチパルス近傍に集中する統計的結果に基づいている。パルス位置探索範囲を限定しない場合、有声部においてはピッチパルス近傍にパルスが立てられる確率がその他の部分に立てられる確率に比べて高くなる。なお、探索位置算出器で算出されるのは、ピッチピーク位置からの相対位置を用いた、音源パルスの探索位置であり、この時点では、ピッチピーク位置を0とする相対位置の数値が小さいものから順にパルス番号およびインデックスがつけられている(図24(b)参照)。なお図24では、パルス数を4本とした場合の図11(b)、図13に対応する場合を示している。図24(a)はパルス数を4本とした場合に探索位置算出器2103によって決定される音源パルス探索位置を示しており、矢印の長短、上向き下向は4種類の各音源パルス探索位置を示している。また、図24(a)の相対位置はピッチピーク位置を0として−4から+75の数値で各サンプル点が表されており、−4より前の点はサブフレーム境界より後ろにはみ出す点を折り返すことにより+の数値で表現している。
【0176】
パルス番号およびインデックスの更新手段2304は、ピッチピーク位置からの相対位置が小さいものから順番にインデックスがつけられている(図24(b))音源パルス探索位置を、サブフレームの先頭を0とする絶対位置に変換した後に絶対位置が小さいものから順番にパルス番号およびインデックスを付け直して(図24(c))、パルス位置探索器2305へ出力する。このようにすることによって、伝送路誤りが生じるなどして符号器側と復号器側とで算出されるピッチピーク位置が異なった場合において、パルス位置のずれを小さくすることができる。
【0177】
パルス位置探索器2305は、パルス番号およびインデックスの更新手段2304によって各探索位置を示すインデックの付け直しが行われた音源パルス探索位置と、別途入力されるピッチ周期Lを用いて、音源パルスを立てる位置の最適な組み合わせを決定する。パルス探索の方法は「ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), March 1996」に示されているように、例えばパルス数が4本の場合は実施の形態6で示した式(2)を最大化するようにi0からi3の組み合わせを決定する。なお、この時の各音源パルスの極性は、雑音符号帳成分のターゲットベクトル、即ち聴覚重みづけされた入力音声から聴覚重みづけ合成フィルタの零入力応答信号と適応符号帳成分の信号を減じた信号ベクトル、の各位置における極性と等しくなるようにパルス位置探索を行う前に予め決定すれば探索のための演算量を大幅に軽減できる。また、ピッチ周期がサブフレーム長より短い場合には実施の形態5にも示したようにピッチ周期化フィルタをかけることによって、音源パルスをインパルスではなくピッチ周期のパルス列になるようにしている。このようなピッチ周期化処理を行う場合は、聴覚重みづけ合成フィルタのインパルス応答ベクトルにピッチ周期化フィルタを予めかけておけば、ピッチ周期化を行わない場合と同様にして式(2)の最大化によって音源パルスの探索を行うことができる。このようにして決定された各音源パルスの位置に、決定された各音源パルスの極性にしたがってパルスを立て、ピッチ周期Lを用いてピッチ周期化フィルタをかければ、パルス音源ベクトルが生成される。生成されたパルス音源ベクトルは乗算器2307に出力される。パルス位置探索器2305から乗算器2307に出力されたパルス音源ベクトルは、外部のゲイン量子化器によって量子化された量子化パルス音源ベクトル利得が乗算されて加算器2308に出力される。なお、パルス位置探索器2305においては、パルス音源ベクトルとともにパルス音源ベクトルを表す各音源パルスの極性およびインデックス情報が別途音源生成部の外部に出力される。この音源パルスの極性およびインデックス情報は符号化器や多重化器などを通って伝送路へ出力されるデータ系列に変換されて伝送路へ送り出される。
【0178】
加算器2308は、乗算器2306から出力された適応符号ベクトル成分と、乗算器2307から出力されたパルス音源ベクトル成分とのベクトル加算を行い、励振音源ベクトルとして出力する。
【0179】
なお、本実施の形態に基づくインデックスの割り当て方法は、音源の位置情報が相対的な値で表現される全ての場合に適用することが可能であり、パルス番号とインデックスの割り当てかたのみの違いであるので、性能に影響を及ぼさずに伝送路誤りの伝播を抑える効果を得ることができる。また、固定探索位置のパルス音源との切り替え使用を行えば、さらに伝送路誤りの影響の伝播を抑えることも可能である。
【0180】
なお、復号器側も同様のパルス番号およびインデックスの更新手段2304を備える。また、パルスの立て方としては、定数本例えば4本のパルスを探索範囲、例えば32箇所の位置のどこかに立てる場合においては、前述のように32箇所を4つに分けて1本のパルスを割り当てられた8箇所の中の1箇所に決定するように全ての組み合わせ(8×8×8×8通り)を探索する方法の他に、32箇所の中から4箇所を選びだす組み合わせ全てについて探索する方法などがある。なお、振幅1のインパルスの組み合わせの他に、複数本例えば2本のパルスを組み合わせたパルス対の組み合わせや、振幅の異なるインパルスの組み合わせによるパルスの立て方も可能である。
【0181】
(実施の形態14)
図25は本発明の第14の実施の形態を示し、固定探索位置と位相適応型探索位置との両者によって生成される音源パルス探索位置を用いてパルス探索を行うCELP型音声符号化装置の音源生成部を示す。
【0182】
図25において、2501は過去の励振音源ベクトルを保存し、選択された適応符号ベクトルをピッチピーク位置算出器2502およびピッチゲイン乗算器2506に出力する適応符号帳、2502は適応符号帳2501から出力された適応符号ベクトルと外部から入力されるピッチ周期Lを入力としてピッチピーク位置を算出し、探索位置算出器2503に出力するピッチピーク位置算出器、2503はピッチピーク位置算出器2502から出力されたピッチピーク位置と外部から入力されるピッチ周期Lを入力としてパルス音源を探索する位置を算出し、加算器2504へ出力する探索位置算出器、2504は探索位置算出器2503から出力された、ピッチピーク位置を0とする相対位置で表される探索位置と固定位置で探索される探索位置とを合わせて(数値加算をするものではなく、2種類の探索位置の集合の和を求める)パルス位置探索器2505に出力する加算器、2505は加算器2504から出力された探索位置と、音源生成部の外部で別途算出されたピッチ周期Lとを入力としてパルス音源を探索し、パルス音源ベクトルをパルス音源ゲイン乗算器2507に出力するパルス位置探索器、2506は適応符号帳2501から出力された適応符号ベクトルに適応符号ベクトル利得を乗じて加算器2508に出力する乗算器、2507はパルス位置探索器2505から出力されたパルス音源ベクトルにパルス音源ベクトル利得を乗じて加算器2508に出力する乗算器、2508は乗算器2506からの出力と乗算器2507からの出力を入力とし、ベクトル加算して励振音源ベクトルとして出力する加算器である。
【0183】
以上のように構成された、音源生成部の動作について、図25および図26を用いて説明する。図25において、適応符号帳2501は、音源生成部の外部で予め算出されるピッチ周期Lだけ過去に溯った点から、適応符号ベクトルをサブフレーム長だけ切り出して、適応符号ベクトルとして出力する。ピッチ周期Lがサブフレーム長に満たない場合は、切り出したピッチ周期Lのベクトルを、サブフレーム長に達するまで繰り返して接続したものを適応符号ベクトルとして出力する。
【0184】
ピッチピーク位置算出器2502は、適応符号帳2501から出力された適応符号ベクトルを用いて適応符号ベクトル内に存在するピッチピークの位置を決定する。ピッチピークの位置は、ピッチ周期で並べたインパルス列と適応符号ベクトルとの正規化相互相関を最大化することによって行うことができる。また、ピッチ周期で並べたインパルス列を合成フィルタに通したものと、適応符号ベクトルを合成フィルタに通したもとの誤差を最小化する(正規化相互相関関数を最大化する)ことによって、より精度良く求めることも可能である。
【0185】
探索位置算出器2503は、ピッチピーク位置を基準として音源パルスの探索位置を決定し、加算器2504に出力する。探索位置の決定法としては、例えば図26に示すようにピッチピーク近傍の固定探索位置と重ならない点を出力するような決定法を用いる。なお、実施の形態6や実施の形態8に示したようにピッチ周期情報を用いて音源パルス数を変化させたり、音源パルスの探索範囲を限定したりすることを適用する場合も同様である。探索位置算出器2503によって決定される具体的な探索位置の例は図26(b)、(c)に示している。図26においては固定探索位置を奇数サンプル点に設定し(図26(a))、ピッチピーク近傍の偶数サンプル点に探索位置算出器2503が探索位置を設定する様子(図26(b)、(c))を示している。図26(b)はピッチピーク位置が偶数サンプル点にある(ピッチピーク位置が固定探索位置に含まれない)場合を、図26(c)はピッチピーク位置が奇数サンプル点にある(ピッチピーク位置が固定探索位置に含まれる)場合を、それぞれ示している。図26(b)、(c)の比較から分かるように、ピッチピーク位置の場所によって若干探索位置(ピッチピーク位置を0とする相対位置)が異なる。
【0186】
加算器2504は、探索位置算出器2503から出力された音源パルス探索位置の集合(図26(b)、(c))と予め定められている固定探索位置の集合(図26(a))との和集合(図26(d))を求めて、パルス位置探索器2505へ出力する。このようにすることによってピッチピーク位置近傍は密に、それ以外の部分は疎に、音源パルスの探索位置を限定している。この限定方法は、パルスが立てられる確率が高い位置がピッチパルス近傍に集中する統計的結果に基づいている。パルス位置探索範囲を限定しない場合、有声部においてはピッチパルス近傍にパルスが立てられる確率がその他の部分に立てられる確率に比べて高くなる。なお、伝送路誤り等の影響で復号器側におけるピッチピーク位置の算出が誤った場合、探索位置算出器2503で算出される音源パルスの探索位置が符号器側と復号器側で異なってしまうが、パルス位置探索器2505に入力される音源パルス探索位置の一部は固定探索位置になっているので、符号器側と復号器側のパルス位置が異なってしまう確率を低くすることができ、伝送路誤りの影響を緩和することができる。
【0187】
パルス位置探索器2505は、加算器2504から出力された音源パルス探索位置と、別途入力されるピッチ周期Lを用いて、音源パルスを立てる位置の最適な組み合わせを決定する。パルス探索の方法は「ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS- ACELP), March 1996」に示されているように、例えばパルス数が4本の場合は実施の形態6で示した式(2)を最大化するようにi0からi3の組み合わせを決定する。なお、この時の各音源パルスの極性は、雑音符号帳成分のターゲットベクトル、即ち聴覚重みづけされた入力音声から聴覚重みづけ合成フィルタの零入力応答信号と適応符号帳成分の信号を減じた信号ベクトル、の各位置における極性と等しくなるようにパルス位置探索を行う前に予め決定すれば探索のための演算量を大幅に軽減できる。また、ピッチ周期がサブフレーム長より短い場合には実施の形態5にも示したようにピッチ周期化フィルタをかけることによって、音源パルスをインパルスではなくピッチ周期のパルス列になるようにしている。このようなピッチ周期化処理を行う場合は、聴覚重みづけ合成フィルタのインパルス応答ベクトルにピッチ周期化フィルタを予めかけておけば、ピッチ周期化を行わない場合と同様にして式(2)の最大化によって音源パルスの探索を行うことができる。このようにして決定された各音源パルスの位置に、決定された各音源パルスの極性にしたがってパルスを立て、ピッチ周期Lを用いてピッチ周期化フィルタをかければ、パルス音源ベクトルが生成される。生成されたパルス音源ベクトルは乗算器2507に出力される。パルス位置探索器2505から乗算器2507に出力されたパルス音源ベクトルは、外部のゲイン量子化器によって量子化された量子化パルス音源ベクトル利得が乗算されて加算器2508に出力される。なお図25では省略しているが、パルス位置探索器2505においては、パルス音源ベクトルとともにパルス音源ベクトルを表す各音源パルスの極性およびインデックス情報が別途音源生成部の外部に出力される。この音源パルスの極性およびインデックス情報は符号化器や多重化器などを通って伝送路へ出力されるデータ系列に変換されて伝送路へ送り出される。
【0188】
加算器2508は、乗算器2506から出力された適応符号ベクトル成分と、乗算器2507から出力されたパルス音源ベクトル成分とのベクトル加算を行い、励振音源ベクトルとして出力する。
【0189】
なお、固定探索位置のパルス音源との切り替え使用を行えば、さらに伝送路誤りの影響の伝播を抑えることも可能である。
【0190】
また、パルスの立て方としては、定数本例えば4本のパルスを探索範囲、例えば32箇所の位置のどこかに立てる場合においては、前述のように32箇所を4つに分けて1本のパルスを割り当てられた8箇所の中の1箇所に決定するように全ての組み合わせ(8×8×8×8通り)を探索する方法の他に、32箇所の中から4箇所を選びだす組み合わせ全てについて探索する方法などがある。なお、振幅1のインパルスの組み合わせの他に、複数本例えば2本のパルスを組み合わせたパルス対の組み合わせや、振幅の異なるインパルスの組み合わせによるパルスの立て方も可能である。
【0191】
(実施の形態15)
図27は本発明の第15の実施の形態を示し、ピッチピーク位置補正器を備えた実施の形態5記載のCELP型音声符号化装置の音源生成部を示している。
【0192】
図27において、2701は過去の励振音源ベクトルを保存し、選択された適応符号ベクトルをピッチピーク位置算出器2702およびピッチピーク位置補正器2703およびピッチゲイン乗算器2706に出力する適応符号帳、2702は適応符号帳2701から出力された適応符号ベクトルと外部から入力されるピッチ周期Lを入力としてピッチピーク位置を算出し、ピッチピーク位置補正器2703に出力するピッチピーク位置算出器、2703は適応符号帳2701から出力される適応符号ベクトルとピッチピーク位置算出器2702から出力されたピッチピーク位置と外部から入力されるピッチ周期Lを入力としてピッチピーク位置を補正し、探索位置算出器2704へ出力するピッチピーク位置補正器、2704はピッチピーク位置補正器2703から出力されたピッチピーク位置と別途入力されるピッチ周期Lとを入力として、音源パルスの探索位置をパルス位置探索器2705に出力する探索位置算出器、2705は探索位置算出器2704から出力された探索位置と、音源生成部の外部で別途算出されたピッチ周期Lとを入力としてパルス音源を探索し、パルス音源ベクトルをパルス音源ゲイン乗算器2707に出力するパルス位置探索器、2706は適応符号帳2701から出力された適応符号ベクトルに適応符号ベクトル利得を乗じて加算器2708に出力する乗算器、2707はパルス位置探索器2705から出力されたパルス音源ベクトルにパルス音源ベクトル利得を乗じて加算器2708に出力する乗算器、2708は乗算器2706からの出力と乗算器2707からの出力を入力とし、ベクトル加算して励振音源ベクトルとして出力する加算器である。
【0193】
以上のように構成された、音源生成部の動作について、図27および図28を用いて説明する。図27において、適応符号帳2701は、音源生成部の外部で予め算出されるピッチ周期Lだけ過去に溯った点から、適応符号ベクトルをサブフレーム長だけ切り出して、適応符号ベクトルとして出力する。ピッチ周期Lがサブフレーム長に満たない場合は、切り出したピッチ周期Lのベクトルを、サブフレーム長に達するまで繰り返して接続したものを適応符号ベクトルとして出力する。
【0194】
ピッチピーク位置算出器2702は、適応符号帳2701から出力された適応符号ベクトルを用いて適応符号ベクトル内に存在するピッチピークの位置を決定する。ピッチピークの位置は、ピッチ周期で並べたインパルス列と適応符号ベクトルとの正規化相互相関を最大化することによって行うことができる。また、ピッチ周期で並べたインパルス列を合成フィルタに通したものと、適応符号ベクトルを合成フィルタに通したもとの誤差を最小化する(正規化相互相関関数を最大化する)ことによって、より精度良く求めることも可能である。
【0195】
ピッチピーク位置補正器2703は、適応符号帳2701から出力された適応符号ベクトルから、ピッチピーク位置算出器2702によって算出されたピッチピーク位置の点を含む1ピッチ周期長Lの長さをもつベクトルを切り出し、この切り出した波形の中から振幅値が最大となる点を探し出して探索位置算出器2704に出力する。なお、この処理はピッチ周期Lがサブフレーム長よりも短い場合についてのみ行われる。ピッチ周期Lがサブフレーム長より長い場合はピッチピーク位置算出器2702が出力したピッチピーク位置をそのままパルス位置探索器2705に出力する。ピッチピーク位置算出器2702から出力されるピッチピーク位置は、1サブフレーム長が1ピッチ周期程度の長さに相当する場合、1ピッチ波形内の2番目に振幅が高い場所になっている可能性がある(図28(a)、(b):ピッチピークは1サブフレーム内に1個所しか存在しないが、1ピッチ周期波形内で2番目に大きい振幅値を有する点(セカンドピーク)が1サブフレーム内に2個所存在するために、セカンドピークをピッチピークと誤検出してしまう)。このため、ピッチピーク位置補正器2703により、ピッチピーク位置算出器2702から出力されたピッチピーク位置から1ピッチ周期長以内により大きい振幅値を有する点が存在しないかチェックし、ピッチピーク位置算出器2702から出力されたピッチピーク位置付近の点の振幅値より大きい振幅値を有する点が存在する場合は、その大きい振幅値を有する点の方をピッチピーク位置とする。例えば図28(c)においてセカンドピークをピッチピーク位置算出器2702が出力した場合は、このセカンドピークから1ピッチ周期分の適応符号ベクトル(図28(c)の太線部)の中で振幅が最大となる位置をピッチピークとする。
【0196】
探索位置算出器2704は、ピッチピーク位置補正器2703から出力されたピッチピーク位置を基準として音源パルスの探索位置を決定し、パルス位置探索器2705に出力する。探索位置の決定法としては、実施の形態5または実施の形態6または実施の形態14などのように、ピッチピーク位置近傍は密に、それ以外の部分は疎に、音源パルスの探索位置を限定する方法がある。この限定方法は、パルスが立てられる確率が高い位置がピッチパルス近傍に集中する統計的結果に基づいている。パルス位置探索範囲を限定しない場合、有声部においてはピッチパルス近傍にパルスが立てられる確率がその他の部分に立てられる確率に比べて高くなることを利用するものである。
【0197】
パルス位置探索器2705は、探索位置算出器2704から出力された音源パルス探索位置と、別途入力されるピッチ周期Lを用いて、音源パルスを立てる位置の最適な組み合わせを決定する。パルス探索の方法は「ITU-T Recommendation G.729: Coding of Speechat 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), March 1996」に示されているように、例えばパルス数が4本の場合は実施の形態6で示した式(2)を最大化するようにi0からi3の組み合わせを決定する。なお、この時の各音源パルスの極性は、雑音符号帳成分のターゲットベクトル、即ち聴覚重みづけされた入力音声から聴覚重みづけ合成フィルタの零入力応答信号と適応符号帳成分の信号を減じた信号ベクトル、の各位置における極性と等しくなるようにパルス位置探索を行う前に予め決定すれば探索のための演算量を大幅に軽減できる。また、ピッチ周期がサブフレーム長より短い場合には実施の形態5にも示したようにピッチ周期化フィルタをかけることによって、音源パルスをインパルスではなくピッチ周期のパルス列になるようにしている。このようなピッチ周期化処理を行う場合は、聴覚重みづけ合成フィルタのインパルス応答ベクトルにピッチ周期化フィルタを予めかけておけば、ピッチ周期化を行わない場合と同様にして式(2)の最大化によって音源パルスの探索を行うことができる。このようにして決定された各音源パルスの位置に、決定された各音源パルスの極性に従ってパルスを立て、ピッチ周期Lを用いてピッチ周期化フィルタをかければ、パルス音源ベクトルが生成される。生成されたパルス音源ベクトルは乗算器2707に出力される。パルス位置探索器2705から乗算器2707に出力されたパルス音源ベクトルは、外部のゲイン量子化器によって量子化された量子化パルス音源ベクトル利得が乗算されて加算器2708に出力される。なお図27では省略しているが、符号器のパルス位置探索器2705においては、パルス音源ベクトルとともにパルス音源ベクトルを表す各音源パルスの極性およびインデックス情報が別途音源生成部の外部に出力される。この音源パルスの極性およびインデックス情報は符号化器や多重化器などを通って伝送路へ出力されるデータ系列に変換されて伝送路へ送り出される。
【0198】
加算器2708は、乗算器2706から出力された適応符号ベクトル成分と、乗算器2707から出力されたパルス音源ベクトル成分とのベクトル加算を行い、励振音源ベクトルとして出力する。
【0199】
なお、本実施の形態おいて、実施の形態12または実施の形態13または実施の形態14のようにインデックス更新手段またはパルス番号およびインデックスの更新手段または固定探索位置と位相適応探索位置の併用を取り入れれば、伝送路誤りの影響を緩和することができる。また、固定探索位置のパルス音源との切り替え使用を行えば、さらに伝送路誤りの影響の伝播を抑えることも可能である。
【0200】
また、本発明のピッチピーク位置補正器は、実施の形態3から実施の形態11までのいずれの音声符号化装置にも適用することが可能である。
【0201】
なお、パルスの立て方としては、定数本例えば4本のパルスを探索範囲、例えば32箇所の位置のどこかに立てる場合においては、前述のように32箇所を4つに分けて1本のパルスを割り当てられた8箇所の中の1箇所に決定するように全ての組み合わせ(8×8×8×8通り)を探索する方法の他に、32箇所の中から4箇所を選びだす組み合わせ全てについて探索する方法などがある。なお、振幅1のインパルスの組み合わせの他に、複数本例えば2本のパルスを組み合わせたパルス対の組み合わせや、振幅の異なるインパルスの組み合わせによるパルスの立て方も可能である。
【0202】
(実施の形態16)
図29は本発明の第16の実施の形態を示し、連続するサブフレーム間の音源信号波形の位相の連続性を利用して、ピッチピーク位置の存在範囲をピッチピーク位置算出前に予め限定するCELP型音声符号化装置の音源生成部を示す。図29において、2901は適応符号ベクトルをピッチピーク位置算出器2902と乗算器2908に出力する適応符号帳、2902は適応符号帳2901から出力された適応符号ベクトルと音声生成部の外部から入力されるピッチ周期Lとピッチピーク探索範囲限定器2903から出力されるピッチピーク探索範囲を入力として、適応符号ベクトル内のピッチピーク位置を算出して遅延器2904と探索位置算出器2906とに出力するピッチピーク位置算出器、2903は遅延器2904から出力された直前のサブフレームにおけるピッチピーク位置と遅延器2905から出力された直前のサブフレームにおけるピッチ周期と音源生成部の外部から入力される現在のサブフレームにおけるピッチ周期Lとを入力として、現在のサブフレームにおけるピッチピーク位置を予測し、予測したピッチピーク位置に基づいてピッチピーク位置を探索する範囲を限定して、その範囲をピッチピーク位置算出器2902に出力するピッチピーク探索範囲限定器、遅延器2904はピッチピーク位置算出器から出力されたピッチピーク位置を入力として、1サブフレーム分遅延させてピッチピーク探索範囲限定器2903に出力する遅延器、2905は音声生成部の外部から入力されるピッチ周期Lを入力として、1サブフレーム分遅延させてピッチピーク探索範囲限定器2903に出力する遅延器、2906はピッチピーク位置算出器2902から出力されたピッチピーク位置と音源生成部の外部から入力されるピッチ周期Lとを入力として、音源パルスの探索位置をパルス位置探索器2907に出力する探索位置算出器、2907は探索位置算出器2906から入力される音源パルスの探索位置と音源生成部の外部から入力されるピッチ周期Lとを入力とし、入力された音源パルス探索位置とピッチ周期Lを用いて音源パルスの位置を探索し、パルス音源ベクトルを乗算器2909に出力するパルス位置探索器、2908は適応符号帳から出力された適応符号ベクトルを入力として量子化適応符号ベクトル利得を乗じて加算器2910に出力する乗算器、2909はパルス位置探索器2907から出力されるパルス音源ベクトルを入力として量子化パルス音源ベクトル利得を乗じて加算器2910に出力する乗算器、2910は乗算器2908および2909から出力されたベクトルをそれぞれ入力とし、入力されたベクトルの加算を行い、励振音源ベクトルとして出力する加算器である。
【0203】
以上のように構成された音声符号化装置の音源生成部について、図29を用いてその動作を説明する。適応符号帳2901は、過去の励振音源のバッファにより構成され、外部のピッチ分析または適応符号帳探索手段によって求められたピッチ周期またはピッチラグに基づいて励振音源のバッファから該当する部分を取り出し、適応符号ベクトルとしてピッチピーク位置算出器2902および乗算器2908に出力する。適応符号帳2901から乗算器2908に出力された適応符号ベクトルは、外部のゲイン量子化器によって量子化された量子化適応符号ベクトル利得が乗算されて加算器2910に出力される。
【0204】
ピッチピーク位置算出器2902は、適応符号ベクトルからピッチピークを検出し、その位置を遅延器2904と探索位置算出器2906のそれぞれに出力する。ピッチピーク位置の検出(算出)は、ピッチ周期Lで並べたインパルス列ベクトルと適応符号ベクトルの正規化相互相関関数を最大化することによって行うことができる。また、ピッチ周期Lで並べたインパルス列ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルと、適応符号ベクトルに合成フィルタのインパルス応答を畳み込んだベクトルとの正規化相互相関関数を最大化することによって、より精度良くピッチピーク位置の検出を行うことも可能である。さらに、検出されたピッチピーク位置を含む1ピッチ周期波形の中から振幅値最大となる位置をピッチピークとする後処理を加えれば、1ピッチ周期波形内のセカンドピークを誤検出することを回避することも可能である。
【0205】
遅延器2904は、ピッチピーク位置算出器2902で算出されたピッチピーク位置を1サブフレーム分だけ遅延させてピッチピーク探索範囲限定器2903に出力する。即ち、ピッチピーク探索範囲限定器2903には直前のサブフレームにおけるピッチピーク位置が遅延器2904から入力される。遅延器2905は、音源生成部の外部から入力されるピッチ周期Lを1サブフレーム分だけ遅延させてピッチピーク探索範囲限定器2903に出力する。即ち、ピッチピーク探索範囲限定器2903には直前のサブフレームにおけるピッチ周期が遅延器2905から入力される。
【0206】
ピッチピーク探索範囲限定器2903は、まず始めに遅延器2905から入力される直前のサブフレームにおけるピッチ周期と現在のサブフレームにおけるピッチ周期の比較を行い、現在のサブフレームが有声(定常)部であるかどうかの判定を行う。具体的には、直前のサブフレームにおけるピッチ周期と現在のサブフレームにおけるピッチ周期との差が小さい場合(例えば±5サンプル以内のとき)に有声(定常)部であると判定する。なお、遅延器を増やして数サブフレーム前までのピッチ周期を用いて有声判定を行うこともできる。有声(定常)部であると判定されると、ピッチピーク探索範囲限定器2903は、遅延器2904から入力される直前のサブフレームにおけるピッチピーク位置と、遅延器2905から入力される直前のサブフレームにおけるピッチ周期と、現在のサブフレームにおけるピッチ周期Lを入力として、現在のサブフレームにおけるピッチピーク位置を予測し、その予測位置の前後(例えば10サンプル)をピッチピーク位置の探索を行う範囲とする。なお、予測したピッチピーク位置がサブフレーム先頭付近にある場合は、1ピッチ周期後ろの付近も探索範囲に加え、予測したピッチピーク位置がサブフレームの先頭から1ピッチ周期後ろの位置の付近にある場合は、サブフレーム先頭付近も探索範囲に加える。なお、有声(定常)部でないと判定された場合は、ピッチピーク探索範囲の限定は行わずに、サブフレーム全体をピッチピーク探索範囲とする。このようにしてピッチピーク探索範囲限定器2903で求められたピッチピーク探索範囲は、ピッチピーク位置算出器2902に出力される。なお、音声符号化処理を開始した時点(最初のサブフレーム)においては、過去に入力された(直前のサブフレームにおける)ピッチ周期Lが存在しないため、適当な定数(例えばピッチ周期の最大値や最小値あるいは0など有り得ないピッチ周期)を遅延器2905が出力するようにしておく。遅延器2904についても同様である。なお、予測ピッチピーク位置は実施の形態10に示される(6)式によって求められる(図19参照)。
【0207】
探索位置算出器2906は、ピッチピーク位置を基準として音源パルスの探索位置を決定し、探索位置をパルス位置探索器2907に出力する。探索位置の決定法としては、例えば実施の形態6や実施の形態8に示したようにピッチピーク近傍は密にそれ以外の部分は疎に探索位置が分布するように決定される。なお、実施の形態6や実施の形態8に示したようにピッチ周期情報を用いて音源パルス数を変化させたり、音源パルスの探索範囲を限定したりすることを適用することも有効である。また、実施の形態12から実施の形態14のいずれかに示したように探索位置を決定すれば、伝送路誤りの影響を緩和することも可能である。
【0208】
パルス位置探索器2907は、探索位置算出器2906で決定された音源パルス探索位置または予め決められている固定探索位置と、別途入力されるピッチ周期Lを用いて、音源パルスを立てる位置の最適な組み合わせを決定する。パルス探索の方法は「ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), March 1996 」に示されているように、例えばパルス数が4本の場合は実施の形態6で示した式(2)を最大化するようにi0からi3の組み合わせを決定する。なお、この時の各音源パルスの極性は、雑音符号帳成分のターゲットベクトル、即ち聴覚重みづけされた入力音声から聴覚重みづけ合成フィルタの零入力応答信号と適応符号帳成分の信号を減じた信号ベクトル、の各位置における極性と等しくなるようにパルス位置探索を行う前に予め決定している。また、ピッチ周期がサブフレーム長より短い場合には実施の形態5にも示したようにピッチ周期化フィルタをかけることによって、音源パルスをインパルスではなくピッチ周期のパルス列になるようにしている。このようなピッチ周期化処理を行う場合は、聴覚重みづけ合成フィルタのインパルス応答ベクトルにピッチ周期化フィルタを予めかけておけば、ピッチ周期化を行わない場合と同様にして式(2)の最大化によって音源パルスの探索を行うことができる。このようにして決定された各音源パルスの位置に、決定された各音源パルスの極性にしたがってパルスを立て、ピッチ周期Lを用いてピッチ周期化フィルタをかければ、パルス音源ベクトルが生成される。生成されたパルス音源ベクトルは乗算器2909に出力される。パルス位置探索器2907から乗算器2909に出力されたパルス音源ベクトルは、外部のゲイン量子化器によって量子化された量子化パルス音源ベクトル利得が乗算されて加算器2910に出力される。
【0209】
加算器2910は、乗算器2908から出力された適応符号ベクトル成分と、乗算器2909から出力されたパルス音源ベクトル成分とのベクトル加算を行い、励振音源ベクトルとして出力する。
【0210】
なお、パルスの立て方としては、定数本例えば4本のパルスを探索範囲、例えば32箇所の位置のどこかに立てる場合においては、前述のように32箇所を4つに分けて1本のパルスを割り当てられた8箇所の中の1箇所に決定するように全ての組み合わせ(8×8×8×8通り)を探索する方法の他に、32箇所の中から4箇所を選びだす組み合わせ全てについて探索する方法などがある。なお、振幅1のインパルスの組み合わせの他に、複数本例えば2本のパルスを組み合わせたパルス対の組み合わせや、振幅の異なるインパルスの組み合わせによるパルスの立て方も可能である。
【0211】
(実施の形態17)
図30は本発明の第17の実施の形態を示し、パルス本数が少なくて各パルスに割り当てられている位置情報が十分である固定探索位置を用いたパルス探索器と、パルス本数が多くて各パルスに割り当てられている位置情報が必ずしも十分でない音源パルス探索位置を用いたパルス探索器と、これら複数のパルス探索器から出力されたパルス音源ベクトルの中から最適なパルス音源ベクトルを選択する選択器とを備えたCELP型音声符号化装置の音源生成部を示している。
【0212】
図30において、3001は過去の励振音源ベクトルを保存し、選択された適応符号ベクトルをピッチピーク位置算出器3002およびピッチゲイン乗算器3007に出力する適応符号帳、3002は適応符号帳3001から出力された適応符号ベクトルと外部から入力されるピッチ周期Lを入力としてピッチピーク位置を算出し、探索位置算出器3003に出力するピッチピーク位置算出器、3003はピッチピーク位置算出器3002から出力されたピッチピーク位置と音源生成部の外部から入力されるピッチ周期Lとを入力として、音源パルスの探索位置をパルス位置探索器3004に出力する探索位置算出器、3004は探索位置算出器3003から出力された探索位置と、音源生成部の外部で別途算出されたピッチ周期Lとを入力としてパルス音源を探索し、パルス音源ベクトル1を選択器3005に出力するパルス位置探索器、8005はパルス位置探索器3004から出力されるパルス音源ベクトル1とパルス位置探索器3006から出力されるパルス音源ベクトル2とを入力とし、最適であるパルス音源ベクトルを選択して乗算器3008に出力する選択器、3006は予め定められた固定探索位置と音源生成部の外部から入力されるピッチ周期Lとを入力としてパルス音源を探索し、パルス音源ベクトル2として選択器3005へ出力するパルス位置探索器、3007は適応符号帳3001から出力された適応符号ベクトルに適応符号ベクトル利得を乗じて加算器3009に出力する乗算器、3008は選択器3005から出力されたパルス音源ベクトルにパルス音源ベクトル利得を乗じて加算器3009に出力する乗算器、3009は乗算器3007からの出力と乗算器3008からの出力を入力とし、ベクトル加算して励振音源ベクトルとして出力する加算器である。
【0213】
以上のように構成された、音源生成部の動作について、図30を用いて説明する。図30において、適応符号帳3001は、音源生成部の外部で予め算出されるピッチ周期Lだけ過去に溯った点から、適応符号ベクトルをサブフレーム長だけ切り出して、適応符号ベクトルとして出力する。ピッチ周期Lがサブフレーム長に満たない場合は、切り出したピッチ周期Lのベクトルを、サブフレーム長に達するまで繰り返して接続したものを適応符号ベクトルとして出力する。
【0214】
ピッチピーク位置算出器3002は、適応符号帳3001から出力された適応符号ベクトルを用いて適応符号ベクトル内に存在するピッチピークの位置を決定する。ピッチピークの位置は、ピッチ周期で並べたインパルス列と適応符号ベクトルとの正規化相互相関を最大化することによって行うことができる。また、ピッチ周期で並べたインパルス列を合成フィルタに通したものと、適応符号ベクトルを合成フィルタに通したもとの誤差を最小化する(正規化相互相関関数を最大化する)ことによって、より精度良く求めることも可能である。なお、実施の形態15に示したようなピッチピーク補正器を備えるとピッチピーク位置の算出誤りを減らすことができる。
【0215】
探索位置算出器3003は、ピッチピーク位置算出器3002から出力されたピッチピーク位置を基準として音源パルスの探索位置を決定し、パルス位置探索器3004に出力する。探索位置の決定法としては、実施の形態5または実施の形態6または実施の形態14などのように、ピッチピーク位置近傍は密に、それ以外の部分は疎に、音源パルスの探索位置を限定する方法がある。この限定方法は、パルスが立てられる確率が高い位置がピッチパルス近傍に集中する統計的結果に基づいている。パルス位置探索範囲を限定しない場合、有声部においてはピッチパルス近傍にパルスが立てられる確率がその他の部分に立てられる確率に比べて高くなることを利用するものである。なお、実施の形態12から実施の形態14のいずれかに示すような音源パルス探索位置の決定法を用いれば、伝送路誤りの影響を緩和することも可能である。
【0216】
パルス位置探索器3004は、探索位置算出器3003から出力された音源パルス探索位置と、別途入力されるピッチ周期Lを用いて、音源パルスを立てる位置の最適な組み合わせを決定する。パルス探索の方法は「ITU-T Recommendation G.729: Coding of Speechat 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP), March 1996」に示されているように、例えばパルス数が4本の場合は実施の形態6で示した式(2)を最大化するようにi0からi3の組み合わせを決定する。なお、この時の各音源パルスの極性は、雑音符号帳成分のターゲットベクトル、即ち聴覚重みづけされた入力音声から聴覚重みづけ合成フィルタの零入力応答信号と適応符号帳成分の信号を減じた信号ベクトル、の各位置における極性と等しくなるようにパルス位置探索を行う前に予め決定すれば探索のための演算量を大幅に軽減できる。また、ピッチ周期がサブフレーム長より短い場合には実施の形態5にも示したようにピッチ周期化フィルタをかけることによって、音源パルスをインパルスではなくピッチ周期のパルス列になるようにしている。このようなピッチ周期化処理を行う場合は、聴覚重みづけ合成フィルタのインパルス応答ベクトルにピッチ周期化フィルタを予めかけておけば、ピッチ周期化を行わない場合と同様にして式(2)の最大化によって音源パルスの探索を行うことができる。このようにして決定された各音源パルスの位置に、決定された各音源パルスの極性に従ってパルスを立て、ピッチ周期Lを用いてピッチ周期化フィルタをかければ、パルス音源ベクトルが生成される。生成されたパルス音源ベクトルはパルス音源ベクトル1として選択器3005に出力される。なお、パルス位置探索器3004に用いられる音源パルス探索位置は、音源パルス数を多くしているので各音源パルスに割り振られる位置情報は必ずしも十分でないものである。すなわち、パルス位置探索器3004を使用するモードは、パルス数は多いが各パルスの位置を必ずしも厳密に表すことはできないモードである。このような各パルスの位置情報が不足している場合は、探索位置算出器3003で行われるようなパルス探索位置の決定法を用いることの効果を得ることができる。
【0217】
パルス位置探索器3006は、予め定められた固定探索位置と音源生成部の外部から別途入力されるピッチ周期Lを用いて、音源パルスを立てる位置の最適な組み合わせを決定する。パルス探索の方法は「ITU-T Recommendation G.729: Coding of Speech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP),March 1996」に示されているように、例えばパルス数が4本の場合は実施の形態6で示した式(2)を最大化するようにi0からi3の組み合わせを決定する。なお、この時の各音源パルスの極性は、雑音符号帳成分のターゲットベクトル、即ち聴覚重みづけされた入力音声から聴覚重みづけ合成フィルタの零入力応答信号と適応符号帳成分の信号を減じた信号ベクトル、の各位置における極性と等しくなるようにパルス位置探索を行う前に予め決定すれば探索のための演算量を大幅に軽減できる。また、ピッチ周期がサブフレーム長より短い場合には実施の形態5にも示したようにピッチ周期化フィルタをかけることによって、音源パルスをインパルスではなくピッチ周期のパルス列になるようにしている。このようなピッチ周期化処理を行う場合は聴覚重みづけ合成フィルタのインパルス応答ベクトルにピッチ周期化フィルタを予めかけておけば、ピッチ周期化を行わない場合と同様にして式(2)の最大化によって音源パルスの探索を行うことができる。このようにして決定された各音源パルスの位置に、決定された各音源パルスの極性にしたがってパルスを立て、ピッチ周期Lを用いてピッチ周期化フィルタをかければ、パルス音源ベクトルが生成される。生成されたパルス音源ベクトルは、パルス音源ベクトル2として選択器3005に出力される。ここで、パルス位置探索器3006に入力される固定探索位置は、各音源パルスに割り当てられる位置情報が十分になるように(具体的にはサブフレーム内の全ての点がこの固定探索位置のパターンに含まれるように)音源パルスの数を絞り込んだものでなければならない。パルス数を減らして、その分パルスを立てる位置を正確に表せるようにすることによって、有声立ち上がり部分などにおける合成音声品質を向上することが可能となる。また、このような位置情報が十分であるモードを設けることによって、位置情報が不足するモードのみを使用した場合に生じる劣化を回避することも可能となる。
【0218】
なお、図30においてはパルス位置探索器は2種類の場合を示しているが、3種類以上に増やして入力信号の特徴に応じた切り替えを行うことも可能である。また、パルス位置探索器3004に入力する音源パルス探索位置を、探索位置算出器3003から出力されたものの代わりに、予め定められている固定探索位置とする構成であっても、各パルスに割り当てられる位置情報が十分である少ないパルス数のモードを備える構成は、有声立ち上がり部分などにおける合成音声品質を向上する効果や位置情報が不足するモードのみを使用した場合に生じる合成音声品質の劣化を回避する効果が得られる。しかし、探索位置算出器3003によって決定される音源パルス探索位置を用いてパルス位置探索器3004がパルス位置探索を行う方が、ピッチピーク付近に音源パルスが立てられやすい特徴を有する有声部分においては、パルス数の多いモードの利用効率を上げることができる。
【0219】
選択器3005は、パルス位置探索器3004から出力されたパルス音源ベクトル1とパルス位置探索器3006から出力されたパルス音源ベクトル2とを比較し、合成音声の歪みが小さくなる方を最適パルス音源ベクトルとして乗算器3008に出力する。選択器3005から乗算器3008に出力されたパルス音源ベクトルは、外部のゲイン量子化器によって量子化された量子化パルス音源ベクトル利得が乗算されて加算器3009に出力される。なお図30では省略しているが、符号器のパルス位置探索器3004および3006においては、パルス音源ベクトル1、2とともに各パルス音源ベクトルを表す各音源パルスの極性およびインデックス情報が別途選択器3005に出力される。さらに選択器3005は、パルス音源ベクトル1と2のどちらを選択したかという情報と、選択したパルス音源ベクトルを表す、各パルスの極性およびインデックスが音源生成部の外部に出力される。この選択情報および音源パルスの極性およびインデックス情報は、符号化器や多重化器などを通って伝送路へ出力されるデータ系列に変換されて伝送路へ送り出される。
【0220】
加算器3009は、乗算器3007から出力された適応符号ベクトル成分と、乗算器3008から出力されたパルス音源ベクトル成分とのベクトル加算を行い、励振音源ベクトルとして出力する。
【0221】
なお、本実施の形態において、実施の形態12または実施の形態13または実施の形態14のようにインデックス更新手段またはパルス番号およびインデックスの更新手段または固定探索位置と位相適応探索位置の併用をパルス位置探索器3004の前段に備えれば、探索位置算出器3003を用いることに起因する伝送路誤りの影響を受けやすいという性質を低くすることができる。
【0222】
また、パルスの立て方としては、定数本例えば4本のパルスを探索範囲、例えば32箇所の位置のどこかに立てる場合においては、前述のように32箇所を4つに分けて1本のパルスを割り当てられた8箇所の中の1箇所に決定するように全ての組み合わせ(8×8×8×8通り)を探索する方法の他に、32箇所の中から4箇所を選びだす組み合わせ全てについて探索する方法などがある。なお、振幅1のインパルスの組み合わせの他に、複数本例えば2本のパルスを組み合わせたパルス対の組み合わせや、振幅の異なるインパルスの組み合わせによるパルスの立て方も可能である。
【0223】
なお、パルス数が少なくパルス位置情報が十分であるモードにおいては、パルス位置情報が不足しない範囲内において、パルス位置情報の一部を雑音コードベクトルを表すインデックスに割り当てることにより、有声立ち上がり部のみならず無声子音部や雑音的な入力信号に対する性能向上を図ることも可能である。
【0224】
また、上記実施の形態1から17に示した音声符号化装置の機能は、磁気ディスク、光磁気ディスク、ICカード、ROM、RAM等の記録媒体にプログラムとして記録することができる。よって、この記録媒体をコンピュータで読み取ることにより、音声符号化装置の機能を実現することができる。
【0225】
【発明の効果】
本発明は、上記実施の形態から明らかなように、適応符号ベクトルのピッチピーク位置に対応する雑音符号ベクトルの振幅を強調するための振幅強調窓を雑音符号ベクトルに乗ずるようにしたので、1ピッチ波形内に存在する位相情報を利用して、音質向上を図ることができる。
【0226】
本発明はまた、適応符号ベクトルのピッチピーク近傍のみに限定した雑音符号ベクトルを用いるようにしたので、雑音符号ベクトルに割り当てられるビット数が少ない場合でも、音質劣化を少なくでき、ピッチピーク近傍にパワーが集中する有声部の音声品質の向上を図ることができる。
【0227】
本発明はまた、適応符号ベクトルのピッチピーク位置とピッチ周期に基づいてパルス位置の探索範囲を決定するようにしたので、1ピッチ波形内でピッチ周期に応じたパルス位置探索を行うことができ、パルス位置に割り当てられるビット数が少ない場合でも、音声品質の劣化を抑えることができる。
【0228】
本発明はまた、パルス探索の範囲を1ピッチ周期強の長さに限定することにより、ピッチ周期性のある音源信号を効率的に表現できる。また、探索範囲内に2つのピッチピークを含む為、1つめのピッチピークと2つめのピッチピークの形が異なる場合や、1つめのピッチピークの位置を誤って検出した場合への対応が可能である。
【0229】
本発明はまた、入力音声信号のピッチ周期に応じて適応的にパルス数を変化させる構成を有するので、パルス数の切り替えのために新たな情報を必要とせずに音声品質の向上を図ることができる。
【0230】
本発明はまた、パルス位置探索の前にピッチピーク近傍とそれ以外の部分のパルス振幅を決定するため、1ピッチ波形の形状を効率的に表現することができる。
【0231】
本発明はまた、ピッチ周期の連続性を用いてパルスの探索位置を切り替えることによって、有声の立ち上がり部・無声部と有声定常部・有声部のそれぞれに適したパルス音源探索を行うことができるので、音声品質の向上を図ることができる。
【0232】
本発明はまた、現サブフレームのピッチゲイン(適応符号ベクトル利得)を、適応符号帳探索直後に求めたピッチゲインを用いて初段量子化を行い、音源探索の最後に求められた最適ピッチゲインと初段量子化ピッチゲインの差分を2段目で量子化することによって、適応符号帳と固定符号帳(雑音符号帳)の和で駆動音源ベクトルを生成するCELP型音声符号化装置においては、固定符号帳(雑音符号帳)探索前に得られる情報を量子化して伝送するため、独立したモード情報を付加せずに固定符号帳(雑音符号帳)の切り替え等を行うことが可能となり、効率的に音声情報を符号化することが可能となる。
【0233】
本発明はまた、過去に符号化したピッチ周期の連続性あるいは過去に符号化したピッチゲインの大きさ(あるいは連続性)に基づいて現在のサブフレームの音声信号のピッチ周期性を判定し、パルス音源の探索位置を切り替えるため、ピッチ周期性が高いところと低いところの判定に新たな情報を付加することなく、それぞれの部分に適したパルス音源探索を行うことができるようになるので、同一情報量下での音声品質の向上を図ることができる。
【0234】
本発明はまた、直前のサブフレームにおけるピッチピーク位置と直前のサブフレームにおけるピッチ周期と現在のサブフレームにおけるピッチ周期を用いることにより、バックワードで現在のサブフレームにおけるピッチピーク位置を予測でき、この予測ピッチピーク位置を用いて位相適応処理を行うか否かを切り替えるため、切り替え情報の新たな伝送なしに位相適応処理の切り替えを行うことができ、同一情報量下での音声品質の向上を図ることができる。なお、位相適応処理を行わないモードにおいては、固定符号帳を使用すれば良く、無音部等において固定符号帳が使用され続ける様な状態が生じることにより、位相適応型音源に対する誤りの伝播をリセットする効果も得ることができる。
【0235】
本発明はまた、適応符号ベクトルのピッチピーク近傍への信号パワー集中度を用いて位相適応を行うか否かを切り替えるため、切り替え情報の新たな伝送無しに位相適応処理の切り替えを行うことができ、同一情報量下での音声品質の向上を図ることができる。なお、位相適応処理を行わないモードにおいては、固定符号帳を使用すれば良く、無音部等において固定符号帳が使用され続ける様な状態が生じることにより、位相適応型音源に対する誤りの伝播をリセットする効果も得ることができる。
【0236】
本発明はまた、ピッチピーク位置を0とする相対位置で音源パルスの位置を表現するCELP型音声符号化装置において、音源パルスの各位置を表すインデックスをサブフレーム先頭から順番に並ぶように付けることにより、伝送路誤りの影響等によってピッチピーク位置を誤ってしまった場合において、音源パルス位置のずれが非常に大きくならないようにすることができる。
【0237】
本発明はまた、ピッチピーク位置を0とする相対位置で音源パルスの位置を表現するCELP型音声符号化装置において、音源パルスの各位置を表すインデックスをサブフレーム先頭から順番に並ぶように付けるとともに、同じインデックス番号で表される別々のパルスに付ける番号もサブフレームの先頭から順番になるように定義することにより、伝送路誤りの影響等によってピッチピーク位置を誤ってしまった場合において、音源パルス位置のずれが小さくなるようにすることができる。
【0238】
本発明はまた、ピッチピーク位置を0とする相対位置で音源パルスの位置を表現するCELP型音声符号化装置において、音源パルスの探索位置の全てを相対位置で表現するのではなく、一部分のみを相対位置で表現して残りの探索位置は予め定められた固定位置にすることにより、伝送路誤りの影響等によってピッチピーク位置を誤ってしまった場合において、音源パルスの位置がずれてしまう確率を減らすことにより、伝送路誤りの影響が長く伝播することを防ぐことができる。
【0239】
本発明はまた、1ピッチ波形内のピーク位置をピッチピーク位置として探し出すため、サブフレーム長とピッチ周期とが一致しないことに起因するセカンドピークをピッチピークとしてしまう誤検出を防ぐことができる。
【0240】
本発明はまた、連続する有声定常部においては、直前のサブフレームにおけるピッチピークの位置と直前のサブフレームにおけるピッチ周期と現在のサブフレームにおけるピッチ周期の情報を用いて現在のピッチピーク位置の存在範囲を限定し、その範囲内でピッチピーク位置を探索する構成とすることにより、現在のサブフレームの信号のみを用いてピッチピーク位置を探索したときに生じる、1ピッチ波形内のセカンドピークをピッチピークとする誤検出を防ぐことができる。
【0241】
本発明はまた、パルス音源を雑音符号帳に適用したCELP型音声符号化装置において、音源パルス数が少ない代わりに各音源パルスの位置情報が十分なモードと、各音源パルスの位置情報が粗い代わりに音源パルス数が多いモードとの双方を有する雑音符号帳構成としたので、有声立ち上がり部分の音声品質の向上と音源パルス数が多いモードの有効利用との双方を実現できるものである。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態におけるCELP音声符号化装置の音源生成部の構成を示すブロック図
【図2】本発明の第1の実施の形態における振幅強調窓の形状と適応符号ベクトルおよびピッチパルス位置の関係を表す模式図
【図3】本発明の第1の実施の形態の変形例におけるCELP音声符号化装置の音源生成部の構成を示すブロック図
【図4】本発明の第2の実施の形態におけるCELP音声符号化装置の音源生成部の構成を示すブロック図
【図5】本発明の第3の実施の形態におけるCELP音声符号化装置の音源生成部の構成を示すブロック図
【図6】本発明の第3の実施の形態におけるパルス位置近傍限定ベクトルの配置の様子を示す模式図
【図7】本発明の第3の実施の形態におけるパルス位置近傍限定ベクトルの配置の様子を示す模式図(続き)
【図8】本発明の第4の実施の形態におけるCELP音声符号化装置の音源生成部の構成を示すブロック図
【図9】本発明の第4の実施の形態におけるパルス音源探索範囲を示す模式図
【図10】本発明の第4の実施の形態におけるパルス音源探索範囲を示す模式図(続き)
【図11】(a)本発明の第5の実施の形態における探索位置算出器の構成を示すブロック図
(b)、(c)パルス探索位置パターンの一例を示す模式図
【図12】本発明の第6の実施の形態におけるCELP型音声符号化装置の音源生成部の構成を示すブロック図
【図13】(a)〜(d)本発明の第6の実施の形態における探索位置算出器で算出されるパルス探索位置の一例を示す模式図
【図14】本発明の第7の実施の形態におけるCELP型音声符号化装置の音源生成部の構成を示すブロック図
【図15】本発明の第8の実施の形態におけるCELP型音声符号化装置の音源生成部の構成を示すブロック図
【図16】(a)、(b)本発明の第8の実施の形態に用いられる固定探索位置パターンの一例を示す一覧図
【図17】本発明の第9の実施の形態におけるCELP型音声符号化装置の音源生成部の構成を示すブロック図
【図18】本発明の第10の実施の形態におけるCELP型音声符号化装置の音源生成部の構成を示すブロック図
【図19】本発明の第10の実施の形態のピッチピーク位置予測器における予測原理を表す模式図
【図20】本発明の第11の実施の形態におけるCELP型音声符号化装置の音源生成部の構成を示すブロック図
【図21】本発明の第12の実施の形態におけるCELP型音声符号化装置の音源生成部の構成を示すブロック図
【図22】本発明の第12の実施の形態における探索位置算出器が出力するある音源パルスの探索位置パターンと、インデックス更新手段を備えない場合の各位置に対応するインデックスと、インデックス更新手段を備えた場合の各位置に対応するインデックスをそれぞれ示す模式図
【図23】本発明の第13の実施の形態におけるCELP型音声符号化装置の音源生成部の構成を示すブロック図
【図24】(a)本発明の第13の実施の形態における探索位置算出器が出力する音源パルス探索位置のパターンおよび各位置に対応する相対位置と絶対位置の対応を示す模式図
(b)本発明の第13の実施の形態におけるパルス番号およびインデックスの更新手段を備えない場合に、各音源パルスに割り当てられるパルス番号およびインデックスを示す模式図
(c)本発明の第13の実施の形態におけるパルス番号およびインデックスの更新手段を備えた場合に、各音源パルスに割り当てられるパルス番号およびインデックスを示す模式図
【図25】本発明の第14の実施の形態におけるCELP型音声符号化装置の音源生成部の構成を示すブロック図
【図26】(a)本発明の第14の実施の形態で用いられる固定探索位置パターンの一例を表す模式図
(b)、(c)本発明の第14の実施の形態で用いられる探索位置算出器で生成される音源パルス探索位置のパターンの一例を示す模式図
(d)本発明の第14の実施の形態のパルス位置探索器において用いられる音源パルス探索位置のパターンの一例を示す模式図
【図27】本発明の第15の実施の形態におけるCELP型音声符号化装置の音源生成部の構成を示すブロック図
【図28】(a)、(b)ピッチピーク算出器においてピッチピークとセカンドピークを誤る適応符号ベクトル波形の一例を示す模式図
(c)ピッチピーク位置補正器においてピッチピーク位置を探索する範囲を図示した適応符号ベクトル波形の一例を示す模式図
【図29】本発明の第16の実施の形態におけるCELP型音声符号化装置の音源生成部の構成を示すブロック図
【図30】本発明の第17の実施の形態におけるCELP型音声符号化装置の音源生成部の構成を示すブロック図
【図31】従来の一般的なCELP音声符号化装置の音源生成部の構成を示すブロック図
【図32】従来の雑音音源のピッチ周期化部を有するCELP音声符号化装置の音源生成部の構成を示すブロック図
【符号の説明】
11 適応符号帳
12 ピッチピーク位置算出器
13 振幅強調窓生成器
14 雑音符号帳
15 周期化器
16 振幅強調窓掛け器
21 適応符号帳
22 ピッチピーク位置算出器
23 振幅強調窓生成器
24 雑音符号帳
25 振幅強調窓掛け器
31 パルス列音源
32 振幅強調窓生成器
33 加算器
34 雑音音源
35 乗算器
41 適応符号帳
42 位相探索器
43 ピッチパルス位置近傍限定型雑音符号帳
44 雑音ベクトル生成器
45 周期化器
51 適応符号帳
52 ピッチピーク位置算出器
53 探索範囲算出器
54 パルス位置探索器
55 ピッチゲイン乗算器
56 パルス音源ゲイン乗算器
57 加算器
61 パルス探索位置パターン選択器
62 パルス探索位置決定器
71 適応符号帳
72 ピッチピーク位置算出器
73 パルス数決定器
74 探索位置算出器
75 パルス位置探索器
76 乗算器
77 乗算器
78 加算器
81 適応符号帳
82 ピッチピーク位置算出器
83 パルス数決定器
84 探索位置算出器
85 パルス位置探索器
86 加算器
87 パルス振幅算出器
88 乗算器
89 乗算器
90 加算器
91 適応符号帳
92 ピッチピーク位置算出器
93 パルス数決定器
94 探索位置算出器
95 遅延器
96 判定器
97 パルス位置探索器
98 スイッチ
99 乗算器
100 乗算器
101 加算器
111 適応符号帳
112 ピッチピーク位置算出器
113 パルス数決定器
114 探索位置算出器
115 スイッチ
116 ピッチゲイン算出器
117 量子化器
118 判定器
119 パルス位置探索器
120 加算器
121 差分量子化器
122 加算器
123 乗算器
124 乗算器
125 加算器
1801 適応符号帳
1802 ピッチピーク位置算出器
1803 遅延器
1804 遅延器
1805 ピッチピーク位置予測器
1806 判定器
1807 探索位置算出器
1808 スイッチ
1809 パルス位置探索器
1810 乗算器
1811 加算器
1812 乗算器
2001 適応符号帳
2002 ピッチピーク位置算出器
2003 パルス性判定器
2004 探索位置算出器
2005 スイッチ
2006 パルス位置探索器
2007 乗算器
2008 加算器
2009 乗算器
2101 適応符号帳
2102 ピッチピーク位置算出器
2103 探索位置算出器
2104 インデックス更新手段
2105 パルス位置探索器
2106 乗算器
2107 乗算器
2108 加算器
2301 適応符号帳
2302 ピッチピーク位置算出器
2303 探索位置算出器
2304 パルス番号およびインデックスの更新手段
2305 パルス位置探索器
2306 乗算器
2307 乗算器
2308 加算器
2501 適応符号帳
2502 ピッチピーク位置算出器
2503 探索位置算出器
2504 加算器
2505 パルス位置探索器
2506 乗算器
2507 乗算器
2508 加算器
2701 適応符号帳
2702 ピッチピーク位置算出器
2703 ピッチピーク位置補正器
2704 探索位置算出器
2705 パルス位置探索器
2706 乗算器
2707 乗算器
2708 加算器
2901 適応符号帳
2902 ピッチピーク位置算出器
2903 ピッチピーク探索範囲限定器
2904 遅延器
2905 遅延器
2906 探索位置算出器
2907 パルス位置探索器
2908 乗算器
2909 乗算器
2910 加算器
3001 適応符号帳
3002 ピッチピーク位置算出器
3003 探索位置算出器
3004 パルス位置探索器
3005 選択器
3006 パルス位置探索器
3007 乗算器
3008 乗算器
3009 加算器

Claims (4)

  1. 振幅1のパルスの組み合わせによって表されるパルス音源を雑音符号帳に用いるCELP型音声符号化装置において、
    前記パルスの探索位置を、
    適応符号ベクトルのピッチ周期と、
    適応符号ベクトルとピッチ周期とから求められるピッチピーク位置と、によって決定する音源生成部を備え、
    前記音源生成部が、適応符号ベクトルのピッチピーク位置近傍は密に、それ以外の部分は疎になるように前記パルスの探索位置を決定する、音声符号化装置。
  2. ピッチ周期によってパルス位置の探索範囲を切り替える請求項1記載の音声符号化装置。
  3. 適応符号ベクトルに複数のピッチピークが存在する場合に、少なくとも2つのピッチピークの位置が探索範囲に含まれるようにパルス位置の探索範囲を限定する請求項記載の音声符号化装置。
  4. パルス探索位置の一部をピッチピーク位置によって決定し、その他のパルス探索位置はピッチピーク位置に関係なく予め定められた固定位置とすることにより伝送路誤りの影響の伝播を抑える、請求項1から請求項のいずれかに記載の音声符号化装置。
JP03672697A 1996-02-21 1997-02-20 音声符号化装置 Expired - Lifetime JP4063911B2 (ja)

Priority Applications (11)

Application Number Priority Date Filing Date Title
JP03672697A JP4063911B2 (ja) 1996-02-21 1997-02-20 音声符号化装置
US09/051,137 US6226604B1 (en) 1996-08-02 1997-08-04 Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus
PCT/JP1997/002703 WO1998006091A1 (fr) 1996-08-02 1997-08-04 Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications
DE69737012T DE69737012T2 (de) 1996-08-02 1997-08-04 Sprachkodierer, sprachdekodierer und aufzeichnungsmedium dafür
EP05008176A EP1553564A3 (en) 1996-08-02 1997-08-04 Voice encoding device, voice decoding device, recording medium for recording program for realizing voice encoding /decoding and mobile communication device
EP97933895A EP0858069B1 (en) 1996-08-02 1997-08-04 Voice encoder, voice decoder and recording medium thereof
AU37085/97A AU3708597A (en) 1996-08-02 1997-08-04 Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus
CNB971913501A CN1163870C (zh) 1996-08-02 1997-08-04 声音编码装置和方法,声音译码装置,以及声音译码方法
US09/729,420 US6421638B2 (en) 1996-08-02 2000-12-05 Voice encoding device, voice decoding device, recording medium for recording program for realizing voice encoding/decoding and mobile communication device
US09/729,229 US6687666B2 (en) 1996-08-02 2000-12-05 Voice encoding device, voice decoding device, recording medium for recording program for realizing voice encoding/decoding and mobile communication device
US09/729,419 US6549885B2 (en) 1996-08-02 2000-12-05 Celp type voice encoding device and celp type voice encoding method

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP3322696 1996-02-21
JP8-204439 1996-08-02
JP8-33226 1996-08-02
JP20443996 1996-08-02
JP03672697A JP4063911B2 (ja) 1996-02-21 1997-02-20 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH1097294A JPH1097294A (ja) 1998-04-14
JP4063911B2 true JP4063911B2 (ja) 2008-03-19

Family

ID=27288002

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03672697A Expired - Lifetime JP4063911B2 (ja) 1996-02-21 1997-02-20 音声符号化装置

Country Status (1)

Country Link
JP (1) JP4063911B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1052620B1 (en) 1997-12-24 2004-07-21 Mitsubishi Denki Kabushiki Kaisha Sound encoding method and sound decoding method, and sound encoding device and sound decoding device
KR100409167B1 (ko) * 1998-09-11 2003-12-12 모토로라 인코포레이티드 정보 신호를 부호화하는 방법 및 장치
JP4008607B2 (ja) 1999-01-22 2007-11-14 株式会社東芝 音声符号化/復号化方法
US6728669B1 (en) * 2000-08-07 2004-04-27 Lucent Technologies Inc. Relative pulse position in celp vocoding
JP4666485B2 (ja) * 2005-08-18 2011-04-06 Kddi株式会社 音声信号のセグメント境界整合方式
JP4660496B2 (ja) * 2007-02-23 2011-03-30 三菱電機株式会社 音声符号化装置及び音声符号化方法
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
JP4907677B2 (ja) * 2009-01-29 2012-04-04 三菱電機株式会社 音声符号化装置及び音声符号化方法
US8990094B2 (en) * 2010-09-13 2015-03-24 Qualcomm Incorporated Coding and decoding a transient frame
US9082416B2 (en) * 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
US8862465B2 (en) * 2010-09-17 2014-10-14 Qualcomm Incorporated Determining pitch cycle energy and scaling an excitation signal

Also Published As

Publication number Publication date
JPH1097294A (ja) 1998-04-14

Similar Documents

Publication Publication Date Title
WO1998006091A1 (fr) Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications
US5787391A (en) Speech coding by code-edited linear prediction
US5778334A (en) Speech coders with speech-mode dependent pitch lag code allocation patterns minimizing pitch predictive distortion
JP3196595B2 (ja) 音声符号化装置
EP1008982B1 (en) Voice encoder, voice decoder, voice encoder/decoder, voice encoding method, voice decoding method and voice encoding/decoding method
USRE43190E1 (en) Speech coding apparatus and speech decoding apparatus
EP0926660A2 (en) Speech encoding/decoding method
JP4063911B2 (ja) 音声符号化装置
US5704002A (en) Process and device for minimizing an error in a speech signal using a residue signal and a synthesized excitation signal
CA2130877C (en) Speech pitch coding system
US5719993A (en) Long term predictor
JP3435310B2 (ja) 音声符号化方法および装置
JPH06131000A (ja) 基本周期符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3954716B2 (ja) 音源信号符号化装置、音源信号復号化装置及びそれらの方法、並びに記録媒体
JP3874851B2 (ja) 音声符号化装置
JPH09134196A (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JPH02160300A (ja) 音声符号化方式
JPH08194499A (ja) 音声符号化装置
USRE43209E1 (en) Speech coding apparatus and speech decoding apparatus
JP2001100799A (ja) 音声符号化装置、音声符号化方法および音声符号化アルゴリズムを記録したコンピュータ読み取り可能な記録媒体
JPH0284700A (ja) 音声符号化復号化装置
JPH10207495A (ja) 音声情報処理装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071226

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120111

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130111

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130111

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140111

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term