JPH0612098A

JPH0612098A - 音声符号化装置

Info

Publication number: JPH0612098A
Application number: JP4348880A
Authority: JP
Inventors: Mitsuo Fujimoto; 光男藤本
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 1992-03-16
Filing date: 1992-12-28
Publication date: 1994-01-21
Also published as: KR930020156A; KR100275429B1; US5488704A

Abstract

(57)【要約】【構成】本発明はＣＥＬＰ等の音声符号化装置であっ
て、駆動音源生成処理に於て、有声音声の場合、ピッチ
周期に対応したパルスパターン信号と最新の過去の所定
時間に記憶された駆動音源信号と雑音信号との三者をそ
れぞれに所定のゲインを乗じて加算してなる有声駆動音
源を生成し、無声音声の場合、最新の過去の所定時間に
記憶された駆動音源信号と雑音信号との二者をそれぞれ
に所定のゲインを乗じて加算してなる無声駆動音源を生
成するものである。【効果】本発明の音声符号化装置によれば、符号化す
る音声が有声か無声かの情報に基づいて、その駆動音源
の生成処理を変更するものであるので、特に、準周期的
なピッチパルスを低ビットで有効に検出することができ
ると共に、有声音声駆動音源信号生成処理に於ける計算
量の軽減がはかれ、全体のビットレートの低減を図りな
がら、再生音声の音質向上が可能になる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、音声信号を圧縮して符
号化する音声符号化装置に関する。

【０００２】

【従来の技術】近年、音声信号を圧縮して符号化する音
声符号化技術の研究が盛んに行われており、移動体通信
を初めとする通信分野や音声蓄積分野において、低ビッ
トレートの音声符号化装置が急速に実用化されつつあ
る。

【０００３】現在、実用化されている低ビットレートの
音声符号化方式には８ｋｂｐｓ程度のＣＥＬＰ方式
（“CODE−EXCITED LINEAR PREDICTION（CELP）：HIGH
−QUALITYSPEECH AT VERY LOW BIT RATES”Proc.ICASSP
pp937-940(1985)）があり、更にモトローラ社が開発し
たＶＳＥＬＰ（VECTOR SUM EXCITED LINEAR PREDICTIO
N）方式の改良が試みられている。

【０００４】このＣＥＬＰ方式を採用する音声符号化装
置は、基本的に以下のステップに従って実現される。即
ち、所定の駆動音源信号を生成する駆動音源生成処理ステ
ップ、駆動音源生成処理ステップにて生成された駆動音源信
号に基づいて音声信号を合成出力する音声合成処理ステ
ップ、及び音声合成処理ステップにて合成された合成音声信号と
入力された音声信号とを比較して最も誤差が少ない時の
駆動音源信号に対応するコードを選択出力するコード出
力処理ステップ、である。

【０００５】しかしながら、４ｋｂｐｓ以下の低ビット
レート音声符号化方式になると、このようなＣＥＬＰ、
ＶＳＥＬＰ方式では十分な音声品質が得られていないの
が実情であった。この原因は、上述のステップにおけ
る有声音における準周期的なピッチパルスの再現が不十
分になるため、音質が劣化するものと考えられている。

【０００６】

【発明が解決しようとする課題】本発明は、上述の点に
鑑みなされたものであり、準周期的なピッチパルスの再
現を十分実現できる低ビットレートの音声符号化装置を
提供することを目的とする。

【０００７】

【課題を解決するための手段】本発明の第１の音声符号
化装置は、入力音声信号から音声のピッチ周期を抽出す
るピッチ抽出処理部と、該入力音声信号の有声、又は無
声を判定する有声／無声判定処理部と、上記ピッチ抽出
処理部で得られるピッチ周期情報、及び有声／無声判定
処理部にて判定された判定結果情報に基づいて駆動音源
信号を選択的に生成する駆動音源生成部と、該音源生成
処理部にて生成された駆動音源信号に基づいて音声信号
を合成出力する音声合成処理部と、該音声合成処理部に
て合成された合成音声信号と入力された音声信号とを比
較して最も誤差が少ない時の駆動音源信号に対応するコ
ードを選択出力するコード出力処理部と、からなる音声
符号化装置に於て、有声音声の場合、上記駆動音源生成
部では、ピッチ周期に対応したパルスパターン信号と最
新の過去の所定時間に記憶された駆動音源信号と雑音信
号との３者のそれぞれに所定のゲインを乗じて混合して
なる有声駆動音源を使用し、一方無声音声の場合、上記
駆動音源生成部では、最新の過去の所定時間に記憶され
た駆動音源信号と雑音信号との２者のそれぞれに所定の
ゲインを乗じて混合してなる無声駆動音源を使用するも
のである。

【０００８】また、本発明の第２の音声符号化装置は、
入力された音声の音声信号を符号化すると共に、該音声
信号のＬＰＣパラメータを算出する分析部と、上記音声
信号のピッチ周期を抽出する位相等化処理部と、該位相
等化処理部にて抽出されたピッチ周期、及び上記ＬＰＣ
パラメータに基づいて合成有声音声信号を生成する有声
音声駆動音源生成部と、上記音声信号、及び上記ＬＰＣ
パラメータに基づいて合成無声音声信号を生成する無声
音声駆動音源生成部と、上記有声音声駆動音源生成部、
及び無声音声駆動音源生成部によって生成された合成有
声音声信号、及び合成無声音声信号と上記音声信号とを
夫々比較する比較器と、該比較器による比較結果に基づ
いて、合成有声音声信号、又は合成無声音声信号のどち
らか一方の音声信号を選択する選択部と、該選択部によ
って選択された音声信号、及び上記分析部にて分析され
たＬＰＣパラメータを多重出力する多重化部と、を具備
する音声符号化装置に於て、上記選択部は、上記合成有
声音声信号、及び合成無声音声信号と上記音声信号とを
夫々比較し、上記音声信号との誤差が小さい合成音声信
号を選択するものである。

【０００９】

【作用】

(１)入力音声信号から音声のピッチ周期を抽出し、該ピ
ッチ周期に基づいて、入力音声信号の有声、又は無声の
判定を行い、上記ピッチ周期の抽出処理で得られるピッ
チ周期情報、及び有声／無声判定処理の判定結果情報に
基づいて駆動音源信号を選択的に生成し、上記有声／無
声の判定結果が有声の場合、ピッチ周期に対応したパル
スパターン信号と最新の過去の所定時間に記憶された駆
動音源信号と雑音信号との３者のそれぞれに所定のゲイ
ンを乗じた後、加算してなる第１の駆動音源を生成し、
一方有声／無声の判定結果が無声の場合、最新の過去の
所定時間に記憶された駆動音源信号と雑音信号との２者
のそれぞれに所定のゲインを乗じて加算してなる第２の
駆動音源を生成する。

【００１０】この後、上記第１の駆動音源、又は第２の
駆動音源からなる信号に基づいて音声信号を合成出力
し、この合成音声信号と入力された音声信号とを比較し
て最も誤差が少ない時の駆動音源信号に対応するコー
ド、及び有声／無声の判定結果を選択出力する。

【００１１】(２)入力音声信号から音声のピッチ周期を
抽出し、該ピッチ周期に基づいて駆動音源信号を生成
し、上記ピッチ周期に対応したパルスパターン信号と最
新の過去の所定時間に記憶された駆動音源信号と雑音信
号との３者のそれぞれに所定のゲインを乗じた後、加算
してなる第１の駆動音源を生成すると共に、最新の過去
の所定時間に記憶された駆動音源信号と雑音信号との２
者のそれぞれに所定のゲインを乗じて加算してなる第２
の駆動音源を生成する。

【００１２】この後、上記第１の駆動音源、並びに第２
の駆動音源からなる信号に基づいて音声信号を夫々合成
出力し、これらの合成音声信号と入力された音声信号と
を比較して最も誤差が少ない時の駆動音源信号に対応す
るコード、及び有声／無声の判定結果を選択出力する。

【００１３】

【実施例】

［第１の実施例］本発明の第１の実施例の音声符号化装
置の処理ステップの一例を以下に列挙する。

【００１４】ステップ１［ピッチ抽出処理］：入力音声
信号から音声のピッチ周期を抽出、ステップ２［有声／無声判定処理］：入力音声信号の有
声、又は無声を判定、ステップ３［駆動音源生成処理］：上記ピッチ抽出処理
で得られるピッチ周期情報、及び有声／無声判定処理に
て判定された判定結果情報に基づいて駆動音源信号を選
択的に生成し、有声／無声の判定結果が有声の場合、ピ
ッチ周期に対応したパルスパターン信号と最新の過去の
所定時間に記憶された駆動音源信号と雑音信号との３者
のそれぞれに所定のゲインを乗じた後、加算してなる第
１の駆動音源を生成し、又は有声／無声の判定結果が無
声の場合、最新の過去の所定時間に記憶された駆動音源
信号と雑音信号との２者のそれぞれに所定のゲインを乗
じて加算してなる第２の駆動音源を生成、ステップ４［音声合成処理］：該駆動音源生成処理にて
生成された第１の駆動音源、又は第２の駆動音源からな
る信号に基づいて音声信号を合成出力、ステップ５［符号化出力処理］：該音声合成処理にて合
成された合成音声信号と入力された音声信号とを比較し
て最も誤差が少ない時の駆動音源信号に対応するコー
ド、及び有声／無声の判定結果を選択出力。

【００１５】図１は本発明の第１の実施例の音声符号化
装置の概略構成図の一例を示す。

【００１６】同図に於て、１はマイクロフォン等から入
力された音声をディジタルの音声信号に変換する音声入
力部、２は入力音声の音声信号を線形予測（ＬＰＣ）分
析してＬＰＣパラメータを求めるＬＰＣ分析部、３は入
力音声と同じ音声信号を合成するための線形予測型の合
成フィルタ機能と逆のフィルタ機能を備えた逆フィルタ
であり、この逆フィルタ３は上記ＬＰＣ分析部２で得ら
れるＬＰＣパラメータに基づいて逆フィルタ特性が制御
され、入力された音声の予測残差信号を出力する。

【００１７】４は上記逆フィルタ３から得られる音声の
予測残差信号に対して位相等化処理を施す位相等化処理
部であり、この位相等化処理部４は音声信号を効率よく
符号化できるように、その音声信号のエネルギが集中す
る位置に疑似的にパルス列を設定することによって、予
測残差信号の位相を近似的に零にし、これらのパルス列
のピッチパルス位置信号、及び位相等化音声残差信号を
出力する。

【００１８】５は逆フィルタ３から得られる予測残差信
号に基づいて音声のピッチ周期を算出するピッチ周期算
出機能と、逆フィルタ３から得られる予測残差信号に基
づいて音声の有声、又は無声を判定する有声／無声判定
回路機能を備えた有声／無声判定部、６は位相等化処理
部４から得られる位相等化処理された位相等化音声残差
信号を駆動音源として合成音声信号を得る第１重み付け
合成フィルタ、７は位相等化処理部４の位相等化処理に
よって得られたピッチパルス位置に立てられたインパル
スに基づいて有声音声駆動音源を生成する有声音声駆動
音源生成部、８は主として雑音成分に基づいて、無声音
声駆動音源を生成する無声音声駆動音源生成部、９はＬ
ＰＣ分析部２から出力されるＬＰＣパラメータ、並びに
有声音声駆動音源生成部７にて生成された有声音声駆動
音源、又は無声音声駆動音源生成部８にて生成された無
声音声駆動音源に基づいて、有声合成音声、又は無声合
成音声を生成する第２重み付け合成フィルタ、１０ａは
第１重み付け合成フィルタ６から出力される合成音声信
号と第２重み付け合成フィルタ９から出力される有声合
成音声信号、又は無声合成音声信号との差分をとる第１
差分器、１１ａは有声音声駆動音源生成部７にて符号化
された有声音声駆動音源、又は無声音声駆動音源生成部
８にて符号化された無声音声駆動音源を多重化出力する
多重化部である。

【００１９】尚、ここで述べる位相等化処理部４は、日
本音響学会講演論文集（昭和６０年９月〜１０月）の論
文「位相等化音声の符号化におけるピッチ周期の利用」
に論じられているように、ピッチパルス位置を周期モデ
ルを利用して能率よく符号化するのに適している。位相
等化処理部４のインパルス応答は、ｆ（ｍ）＝ｅ（ｔ ₀
−ｍ）となり、この場合のｅ（ｍ）は予測残差サンプル
である。基準時点ｔ₀、すなわちピッチパルス位置は、
位相等化残差のピーク位置により逐次的に決定される。

【００２０】ただし、ピーク探索範囲を直前のピッチパ
ルス位置からピッチ周期だけ離れた位置の前後数サンプ
ルに限定している。

【００２１】次に、図２は、第１の実施例の有声音声駆
動音源生成部７を、また図３は無声音声駆動音源生成部
８の概略構成を示したものである。

【００２２】有声音声の符号化に寄与する有声音声駆動
音源生成部７は、主としてパルスパターン生成部７ａ、
有声音用適応コードブック７ｂ、有声音用雑音コードブ
ック７ｃ、及び有声音用符号選択制御部７ｈからなり、
パルスパターン生成部７ａ、有声音用適応コードブック
７ｂ、及び有声音用雑音コードブック７ｃの３出力のそ
れぞれに所定のゲインを乗じた後、それらを加算して有
声音声駆動音源を生成している。

【００２３】パルスパターン生成部７ａは、位相等化処
理部４から出力されたピッチパルス位置信号に基づい
て、ピッチパルスを生成する。有声音用適応コードブッ
ク７ｂは、最新の過去の駆動音源データ、即ち後述する
第１加算器７ｇによって加算された出力データを所定時
間分記憶するバッファメモリの一種である。

【００２４】有声音用雑音コードブック７ｃは予め決め
られた複数個の雑音データを記憶する機能を有する。

【００２５】有声音用符号選択制御部７ｈは、第１差分
器１０ａの差分値、具体的には二乗誤差値が最も小さく
なるように、有声音用適応コードブック７ｂの遅延量
Ｌ、有声音用雑音コードブック７ｃのインデックスＩ、
及びゲインδ、β、γの値を変更調整し、第１差分器１
０ａの差分値が最も小さくなったときの遅延量Ｌ、イン
デックスＩ、及びゲインδ、β、γ、並びにピッチパル
ス位置信号を符号化データとして、多重化部１１ａに出
力する機能を有する。

【００２６】ここで、遅延量Ｌとは、過去の駆動音源デ
ータを有効に活用するために、有声音用適応コードブッ
ク７ｂに格納されている最新の過去の駆動音源データを
時間的にずらせた場合の時間的な長さをいい、インデッ
クスＩとは、有声音用雑音コードブック７ｃに格納され
ている複数個の雑音データを選択する際の指標を示し、
また、ゲインδ、β、γとは、ピッチパルスの振幅、有
声音用適応コードブック７ｂに格納されている過去の駆
動音源データの示す波形の振幅、及び有声音用雑音コー
ドブック７ｃに格納されている雑音データの示す波形の
振幅の巾を夫々変更調整する利得である。

【００２７】一方、図３に示す無声音声の符号化に寄与
する無声音声駆動音源生成部８は、主として無声音用適
応コードブック８ａ、無声音用雑音コードブック８ｂ、
及び無声音用符号選択制御部８ｆからなり、無声音用適
応コードブック８ａ、及び無声音用雑音コードブック８
ｂの２出力のそれぞれに所定のゲインを乗じた後、それ
らを加算して無声音声駆動音源を生成している。

【００２８】無声音用適応コードブック８ａは、最新の
過去の駆動音源データ、即ち後述する第２加算器８ｅに
よって加算された出力データを所定時間分記憶するバッ
ファメモリの一種である。

【００２９】無声音用符号選択制御部８ｆは、第１差分
器１０ａの差分値、具体的には二乗誤差値が最も小さく
なるように、無声音用適応コードブック８ａの遅延量
Ｌ’、無声音用雑音コードブック８ｂのインデックス
Ｉ’、及びゲインβ’、γ’の値を変更調整し、第１差
分器１０ａの差分値が最も小さくなったときの遅延量
Ｌ’、インデックスＩ’、及びゲインβ’、γ’を符号
化データとして、多重化部１１ａに出力する機能を有す
る。

【００３０】尚、無声音声の場合には、切換手段Ｓｗ１
により、無声音声駆動音源生成部８が選択されるので、
通常のＣＥＬＰと全く同様の構成となる。

【００３１】第２重み付け合成フィルタ９は、有声音声
駆動音源生成部７（図２参照）、或るいは無声音声駆動
音源生成部８（図３参照）からの出力を受けて音声信号
を合成する機能を有し、第１差分器１０ａは、第１重み
付け合成フィルタ６にて合成された合成音声信号と、第
２重み付け合成フィルタ９にて合成された合成音声信号
とを比較する第１差分器である。而して、第１重み付け
合成フィルタ６にて合成された合成音声信号に対して最
も類似した第２重み付け合成フィルタ９の合成音声信号
が二乗誤差最小化の手法で特定され、このときの信号が
駆動音源信号となる。

【００３２】多重化部１１ａは、二乗誤差最小化の手法
によって特定された駆動音源信号の、無声音用適応コー
ドブック８ａの遅延量Ｌ’、無声音用雑音コードブック
８ｂのインデックスＩ’、及びゲインβ’、γ’の値、
又は有声音用適応コードブック７ｂの遅延量Ｌ、インデ
ックスＩ、及びゲインδ、β、γを符号化データとし
て、多重化出力する。

【００３３】ここで、遅延量Ｌ’とは、過去の駆動音源
データを有効に活用するために、無声音用適応コードブ
ック８ａに格納されている最新の過去の駆動音源データ
を時間的にずらせた場合の時間的な長さをいい、インデ
ックスＩ’とは、雑音コードブック８ｂに格納されてい
る複数個の雑音データを選択する際の指標を示し、ま
た、ゲインβ’、γ’とは、無声音用適応コードブック
８ａに格納されている過去の駆動音源データの示す波形
の振幅、及び無声音用雑音コードブック８ｂに格納され
ている雑音データの示す波形の振幅の巾を夫々変更調整
する利得である。

【００３４】ここで述べる有声音用適応コードブック７
ｂ，無声音用適応コードブック８ａ、並びに有声音用雑
音コードブック７ｃ、及び無声音用雑音コードブック８
ｂは従来のＣＥＬＰ音声符号化方式で用いられるものと
基本的に同じものであるが、ここでは両コードブック部
を有声用と無声用に分担配置し、使い分けるように成し
た点で異なり、更に、有声音用側にはパルスパターン生
成部７ａが追加装備されている。

【００３５】図４は、図１乃至図３に示す音声符号化装
置にて符号化された多重化データを再生復号化する音声
復号化装置の概略構成図である。

【００３６】図４に示す有声音声駆動音源再生部２１
は、図２に示す有声音声駆動音源生成部７と、また無声
音声駆動音源再生部２２は、図３に示す無声音声駆動音
源生成部８と全く同一機能を有するものであるが、唯一
異なる点は、有声音用符号選択制御部７ｈ、有声音用符
号選択制御部８ｆの構成を持たない点である。

【００３７】図４において、２０は音声符号化装置の多
重化部１１ａから出力された多重化データを受信する多
重分離部、２３は音声符号化装置から出力されたＬＰＣ
パラメータに基づいてフィルタ特性が設定される合成フ
ィルタ、２４は該合成フィルタ２３の音声合成出力を波
形整形するポストフィルタである。

【００３８】上述の構成を具備する音声符号化装置にお
いて入力された音声を符号化した後、図４に示す音声復
号化装置において復号化することによって音声を再生す
るまでの動作を以下に説明する。

【００３９】まず、図１において、音声入力部１に音声
が入力されると、その音声入力部１にて変換された音声
信号は、ＬＰＣ分析部２、及び逆フィルタ３に夫々出力
される。

【００４０】ＬＰＣ分析部２では、ＬＰＣ分析法に基づ
いて、ＬＰＣパラメータが求められ、このパラメータは
逆フィルタ３、第１重み付け合成フィルタ６、第２重み
付け合成フィルタ９、及び多重化部１１ａに夫々出力さ
れる。

【００４１】逆フィルタ３では、ＬＰＣ分析部２にて分
析されたＬＰＣパラメータに基づいて、入力された音声
の予測残差信号を求め、この予測残差信号を位相等化処
理部４、及び有声／無声判定部５に出力する。

【００４２】位相等化処理部４に逆フィルタ３から予測
残差信号が入力されると、その音声信号のエネルギが集
中する個所に疑似的にピッチパルス列が設定され、これ
によって、上記音声信号は位相等化変換され、この音声
信号の位相等化音声残差信号は第１重み付け合成フィル
タ６に出力されると共に、パルス列の位置を表すピッチ
パルス位置信号は有声音声駆動音源生成部７に出力され
る。

【００４３】一方、有声／無声判定部５は入力された予
測残差信号に基づいて、音声入力部１に入力された音声
が有声であると判定した場合には、図２の切換手段Ｓｗ
１は有声音声駆動音源生成部７側に、又は音声入力部１
に入力された音声が無声であると判定した場合には、切
換手段Ｓｗ１は無声音声駆動音源生成部８側に切り換え
られる。

【００４４】今、切換手段Ｓｗ１が有声音声駆動音源生
成部７側に切り換わっている場合、図２に示すように有
声音声駆動音源生成部７において、位相等化処理部４か
ら出力されたピッチパルス位置信号に基づいて、パルス
パターン生成部７ａはパルスパターンを生成し、そのパ
ターンを第１乗算器７ｄに出力する。第１乗算器７ｄ
は、有声音用符号選択制御部７ｈによって選択されたゲ
インδを上記パルスパターンに乗じ、振幅を変更調整す
る。

【００４５】また、有声音用雑音コードブック７ｃで
は、有声音用符号選択制御部７ｈによって選択されたイ
ンデックスＩに格納された雑音データが読み出され、第
３乗算器７ｆは、有声音用符号選択制御部７ｈによって
選択されたゲインγを上記雑音データに乗じる。

【００４６】これによって、第１加算器７ｇは、第１乗
算器７ｄ、第１乗算器７ｆの出力データを加算し、この
出力データは最新の過去の駆動音源信号データとなり、
有声音用適応コードブック７ｂにフィードバックされ記
憶されると共に、第２重み付け合成フィルタ９に出力さ
れる。

【００４７】因みに、有声音用適応コードブック７ｂは
初期状態（リセットされた状態）では全く駆動音源デー
タを記憶しておらず、このフィードバックされた時点か
ら有声音用適応コードブック７ｂには最新の過去の駆動
音源データが順次格納されていくことになる。

【００４８】第２重み付け合成フィルタ９では、第１加
算器７ｇにて加算された駆動音源データ、及びＬＰＣ分
析部２から出力されたＬＰＣパラメータに基づいて、合
成有声音声信号が生成され、第１差分器１０ａに出力さ
れる。第１差分器１０ａでは、第１重み付け合成フィル
タ６から出力される合成音声信号と第２重み付け合成フ
ィルタ９にて生成された合成有声音声信号との差分をと
り、有声音用符号選択制御部７ｈは、その差分値が最も
小さくなるまで、遅延量Ｌ、インデックスＩ、及びゲイ
ンδ、β、γを繰り返して選択する。これに従って、有
声音用適応コードブック７ｂでは、遅延量Ｌに基づいて
遅延された最新の過去の駆動音源データが第２乗算器７
ｅに出力され、ゲインβが乗ぜられる。また、有声音用
雑音コードブック７ｃでは、インデックスＩに基づいて
選択された雑音データが第３乗算器７ｆに出力され、ゲ
インγが乗ぜられる。一方、第１乗算器７ｄでは、パル
スパターン生成部７ａにて生成されたパルスパターンに
ゲインδを乗じる。

【００４９】この結果、第１加算器７ｇは、第１乗算器
７ｄ、第２乗算器７ｅ、及び第３乗算器７ｆの出力デー
タを加算し、この出力データは最新の過去の駆動音源信
号となり、有声音用適応コードブック７ｂに再びフィー
ドバックされ記憶される。

【００５０】而して、有声音用符号選択制御部７ｈは、
最終的に決定された、有声音声適応コードブック７ｂの
遅延量Ｌ、有声音用雑音コードブック７ｃのインデック
スＩ、及びゲインδ、β、γ、並びにピッチパルス位置
信号を符号化して、多重化部１１ａに出力する。

【００５１】以上が、切換手段Ｓｗ１が有声音声駆動音
源生成部７側に切り換わったときの有声音声駆動音源生
成部７の処理手順であるが、次に切換手段Ｓｗ１が無声
音声駆動音源生成部８側に切り換わったときの無声音声
駆動音源生成部８の処理手順を説明する。

【００５２】今、切換手段Ｓｗ１が無声音声駆動音源生
成部８側に切り換わっている場合、図３に示すように無
声音声駆動音源生成部８の無声音用雑音コードブック８
ｂでは、無声音用符号選択制御部８ｆによって選択され
たインデックスＩ’に格納された雑音データが読み出さ
れ、第５乗算器８ｄは、無声音用符号選択制御部８ｆに
よって選択されたゲインγ’を上記雑音データに乗じ
る。

【００５３】これによって、第２加算器８ｅは、第５乗
算器８ｄの出力データを最新の過去の駆動音源データと
して、無声音用適応コードブック８ａにフィードバック
され記憶されると共に、第２重み付け合成フィルタ９に
出力される。

【００５４】因みに、無声音用適応コードブック８ａは
初期状態（リセットされた状態）では全く駆動音源デー
タを記憶しておらず、この時点から無声音用適応コード
ブック８ａには最新の過去の駆動音源データが順次格納
されていくことになる。

【００５５】一方、第２重み付け合成フィルタ９は、第
２加算器８ｅにて加算された駆動音源データ、及びＬＰ
Ｃ分析部２から出力されたＬＰＣパラメータに基づい
て、合成無声音声信号が生成され、第１差分器１０ａに
出力される。第１差分器１０ａは、第１重み付け合成フ
ィルタ６から出力される合成音声信号と第２重み付け合
成フィルタ９にて生成された合成無声音声信号との差分
をとり、無声音用符号選択制御部８ｆは、この差分値に
応じて、この差分値が最も小さくなるまで、遅延量
Ｌ’、インデックスＩ’、及びゲインβ’、γ’を繰り
返して選択する。これに従って、無声音用適応コードブ
ック８ａでは、遅延量Ｌ’に基づいて遅延された最新の
過去の駆動音源データが第４乗算器８ｃに出力され、ゲ
インβ’が乗ぜられる。また、無声音用雑音コードブッ
ク８ｂでは、インデックスＩ’に基づいて選択された雑
音データが第２乗算器８ｅに出力され、ゲインγ’が乗
ぜられる。

【００５６】この結果、第２加算器８ｅは、第４乗算器
８ｃ、及び第５乗算器８ｄの出力データを加算し、この
出力データは最新の過去の駆動音源信号となり、無声音
用適応コードブック８ａに再びフィードバックされ記憶
される。

【００５７】而して、無声音用符号選択制御部８ｆは、
最終的に決定された、無声音声適応コードブック８ａの
遅延量Ｌ’、無声音用雑音コードブック８ｂのインデッ
クスＩ’、及びゲインβ’、γ’を符号化して、多重化
部１１ａに出力する。

【００５８】このようにして、多重化部１１ａは、有声
音声駆動音源生成部７から出力された遅延量Ｌ、インデ
ックスＩ、ゲインδ、β、γ、及びピッチパルス位置信
号からなる符号化データ、又は無声音声駆動音源生成部
８から出力された遅延量Ｌ’、インデックスＩ’、及び
ゲインβ’、γ’からなる符号化データと共に、ＬＰＣ
分析部２から入力されたＬＰＣパラメータを多重化デー
タとして、後述する音声復号化装置の多重分離部２０に
出力する。

【００５９】ところで、多重化部１１ａから出力された
多重化データを復号する際の復号方式を図４を参照し乍
ら説明する。

【００６０】多重分離部２０に多重化部１１ａから多重
化データが入力されると、その多重分離部２０はその多
重化データに有声音声であるとの判定データが含まれて
いれば、有声／無声判定データ送信路を介して、切換手
段Ｓｗ２を有声音声駆動音源再生部２１側に切り換える
指令を行う。

【００６１】因みに、初期状態（リセットされた状態）
においては、有声音用雑音コードブック２１ｃ、及び無
声音用雑音コードブック２２ｂには予め有声音用雑音コ
ードブック７ｃ、及び無声音用雑音コードブック８ｂと
同一の雑音データが格納されているが、有声音用適応コ
ードブック２１ｂ、及び無声音用適応コードブック２２
ａには何の駆動音源データも格納されていない。

【００６２】この状態から、まず有声音声駆動音源再生
部２１で有声音声を復号化する処理を以下に説明する。

【００６３】多重化データが多重分離部２０に入力され
ると、多重化データの各々のピッチパルス位置信号、遅
延量Ｌ、インデックスＩが、夫々パルスパターン生成部
２１ａ、有声音用適応コードブック２１ｂ、及び有声音
用雑音コードブック２１ｃに入力されると共に、ゲイン
δ、β、γが、夫々第６乗算器２１ｄ、第７乗算器２１
ｅ、第８乗算器２１ｆに入力される。

【００６４】パルスパターン生成部２１ａはピッチパル
ス位置信号に基づいて、パルスパターンを生成し、その
パターンを第６乗算器２１ｄに出力し、この第６乗算器
２１ｄは、多重化データのゲインδをパルスパターンに
乗じ、振幅を変更調整する。

【００６５】これと共に、有声音用雑音コードブック２
１ｃはインデックスＩに基づいて、雑音データを第８乗
算器２１ｆに出力し、この第８乗算器２１ｆは、多重化
データのゲインγを雑音データに乗じ、振幅を変更調整
する。第３加算器２１ｇは、第６乗算器２１ｄ、及び第
８乗算器２１ｆの出力データを加算する。この出力デー
タは切換手段Ｓｗ２が有声音声駆動音源再生部２１に切
り換わっている場合には、有声音用適応コードブック２
１ｂに書き替えられ乍ら記憶されていく。

【００６６】従って、有声音声駆動音源再生部２１は、
最終的に多重化データに対応した復号化データを合成フ
ィルタ２３に出力し、この合成フィルタ２３では、ＬＰ
Ｃパラメータに基づいて再生された後、ポストフィルタ
２４にて波形整形され、図示しないスピーカ等に出力さ
れる。

【００６７】次に、切換手段Ｓｗ２が無声音声駆動音源
再生部２２側に切り換わっている場合に、その無声音声
駆動音源再生部２２で無声音声を復号化する処理を以下
に説明する。

【００６８】多重化データが多重分離部２０に入力され
ると、多重化データの各々の遅延量Ｌ’、インデックス
Ｉ’が、夫々無声音用適応コードブック２２ａ、及び無
声音用雑音コードブック２２ｂに入力されると共に、ゲ
インβ’、γ’が、夫々第９乗算器２２ｃ、第１０乗算
器２２ｄに入力される。

【００６９】無声音用雑音コードブック２２ｂはインデ
ックスＩ’に基づいて、雑音データを第１０乗算器２２
ｄに出力し、この第１０乗算器２２ｄは、多重化データ
のゲインγ’を雑音データに乗じ、振幅を変更調整す
る。第１１加算器２２ｅは、第１０乗算器２２ｄの出力
データを最新の過去の駆動音源データとして、無声音用
適応コードブック２２ａにフィードバックされ、無声音
用適応コードブック２２ａに書き替えられ乍ら記憶され
ていく。

【００７０】従って、無声音声駆動音源再生部２２で
は、最終的に決定された多重化データに対応した復号化
データが合成フィルタ２３に出力され、この合成フィル
タ２３は、ＬＰＣパラメータに基づいて再生された後、
ポストフィルタ２４にて波形整形され、図示しないスピ
ーカ等に出力される。

【００７１】ここで、図１の音声符号化装置にて用いら
れる情報のビット配分としては、表１に示す通りであ
り、

【００７２】

【表１】

【００７３】これらの情報が図４の音声復号化装置に伝
達されて、音声を復号再生するのである。

【００７４】図５は第１の実施例における各処理ステッ
プ時の信号波形を示す。同図(ａ)は原音声、同図（ｂ）
は予測残差、同図（ｃ）は位相等化残差、同図（ｄ）は
位相等化音声、同図（ｅ）は駆動音源、同図（ｆ）は復
号音声を示している。

【００７５】図５（ｃ）によれば、位相等化処理部４で
の位相等化処理により、予測残差のパワーがピッチパル
スに集中していることが分かる。

【００７６】以上の構成の本発明の第１の実施例に係る
装置に於ける必須の情報であるピッチ周期は、駆動音源
の先行するパルス位置からピッチ周期だけ離れた位置近
傍（例えば、８ＫＨｚサンプリングの場合、±３サンプ
ル分）で、図５（ｂ）の残差信号の信幅値が所定の値よ
り大きくなる後続するパルス位置を選択する。この場
合、±３サンプル、計７サンプルの残差信号の内、第２
番目に大きいなサンプルの値が最大サンプルの値の５０
％以下になる時、そのピーク性が顕著であるので、その
最大サンプル位置をピッチパルス位置として決定する。
しかし、第２番目に大きいサンプルの値が最大サンプル
の値の５０％以下にならない時、そのピーク性が顕著で
あるとは認められないので、この７サンプルに該当する
図５（ｃ）の位相等化残差の７サンプルの内、最大の値
を示すピークのサンプル位置を後続のピッチパルス位置
として決定する。これによって、先後両パルス間隔がピ
ッチ周期となるのである。

【００７７】ここで、有声音声駆動音源生成部７で使用
される有声音用適応コードブック７ｂ、及び無声音声駆
動音源生成部８で使用される無声音用適応コードブック
８ａは、例えば、８ＫＨｚサンプリングの場合、最新の
過去の１４６サンプルを逐次記憶しているシフトレジス
タ形式のメモリであるが、特に有声音用適応コードブッ
ク７ｂの場合は、駆動音源の先行するピッチパルス位置
からピッチ周期だけ離れた位置近傍（例えば、８ＫＨｚ
サンプリングの場合、±３サンプル分）の７種類の時間
範囲に対する駆動音源信号列の内のあるものが選択的に
使用される。これに比べて、無声の場合には、従来のＣ
ＥＬＰ同様に無声音用適応コードブック８ａの２０サン
プル〜１４６サンプルに亘る１２７種類の駆動音源信号
列の中から選択しなければならない。

【００７８】次に、本発明の音声符号化方式をシミュレ
ーションにより評価する。

【００７９】コンピュータシミュレーションにより本方
式の評価を行なう時のシミュレーションの条件は、サン
プリング周期：８ｋＨｚ、フレーム長：４０ｍｓｅｃ．
サブフレーム長：８ｍｓｅｃ．及びビットレート：４ｋ
ｂｐｓであり、そのビット配分は前述の配分とする。

【００８０】このような条件下で、短期予測係数とし
て、ＬＳＰ係数を求め、サブフレーム毎に補間した後、
ＬＰＣ係数に変換して利用している。なお、ＬＳＰ係数
は、３段の多段ベクトル量子化を行なっている。また、
駆動ベクトルのゲインは、有声音の場合、位相等化パル
ス音源も含めて、サブフレーム毎に全駆動ベクトルゲイ
ンをまとめてベクトル量子化している。また、有声音時
の有声音用適応コードブック７ｂの探索範囲は、ピッチ
周期付近に限定した。この場合の駆動音源波形は図５
（ｅ）に示され、復号音声波形は図５（ｆ）に示されて
いるように、位相等化パルス音源の採用により、準周期
的なピッチパルスを良く再現していることが分かる。

【００８１】客観評価として、日本語短文男女各４文章
について、位相等化音声を基準とした時のセグメンタル
ＳＮＲを求めた結果、男性の声では９．７５ｄＢ、女性
の声では９．６９ｄＢ、平均９．６３ｄＢとなった。こ
のような復号音声を試聴したところ、ピッチが良く再現
されており自然性の高い復号音声が得られた。［第２の実施例］本発明の第２の実施例を図６乃至図８
に基づいて説明する。

【００８２】尚、第１の実施例と構成が同一の場合には
同一番号を付し、その説明を省略する。

【００８３】第２の実施例が第１の実施例と大きく異な
る点は、逆フィルタ３によって処理された予測残差信号
に基づいて音声の有声と無声を判定する有声／無声判定
部５を省くことによって、音声符号化装置の構成を第１
の実施例のそれより簡略化したことである。

【００８４】本発明の第２の実施例の音声符号化装置の
処理ステップの一例を以下に列挙する。ステップ１［ピッチ抽出処理］：入力音声信号から音声
のピッチ周期を抽出、ステップ２［駆動音源生成処理］：上記ピッチ抽出処理
で得られるピッチ周期情報に基づいて駆動音源信号を生
成し、そのピッチ周期に対応したパルスパターン信号と
最新の過去の所定時間に記憶された駆動音源信号と雑音
信号との３者のそれぞれに所定のゲインを乗じた後、加
算してなる第１の駆動音源を生成すると共に、最新の過
去の所定時間に記憶された駆動音源信号と雑音信号との
２者のそれぞれに所定のゲインを乗じて加算してなる第
２の駆動音源を生成、ステップ３［音声合成処理］：該駆動音源生成処理にて
生成された第１の駆動音源、並びに第２の駆動音源から
なる信号に基づいて音声信号を夫々合成出力、ステップ４［符号化出力処理］：該音声合成処理にて合
成された合成音声信号と入力された音声信号とを比較し
て最も誤差が少ない時の駆動音源信号に対応するコード
及び有声／無声の判定結果を選択出力。

【００８５】図６は、第２の実施例に係る音声符号化装
置全体の概略構成図である。

【００８６】１２は第２差分器１０ｂ、及び第３差分器
１０ｃから出力された差分値を比較し、その比較結果を
出力する比較器、１３は有声音声駆動音源生成部７０か
ら出力される合成有声音声信号、及び無声音声駆動音源
生成部８０から出力される合成無声音声信号のうち、比
較器１２から出力された差分値に基づいて、どちらか一
方の音声信号を選択する選択部、１１ｂは選択部１３に
て選択された合成有声音声信号、又は合成無声音声信
号、並びにＬＰＣ分析部２にて変換されたＬＰＣパラメ
ータに基づいて、多重化出力する多重化部であり、これ
によって、多重化部１１ｂは音声入力部１に入力された
音声を符号化することができる。

【００８７】次に、図７は有声音声駆動音源生成部７０
の概略構成図を示したものである。

【００８８】図７の有声音声駆動音源生成部７０の構成
は、基本的に図２に示す有声音声駆動音源生成部７の構
成と同一であるが、その有声音声駆動音源生成部７０が
有声音声駆動音源生成部７と異なる点は、(１)ＬＰＣ分
析部２から出力されるＬＰＣパラメータ、及び第１加算
器７ｇにて生成された駆動音源信号に基づいて合成有声
音声信号を合成する第４重み付け合成フィルタ７１、
(２)位相等化処理部４から出力される位相等化音声残差
信号と第４合成フィルタ７１から出力される合成有声音
声信号との差分をとり、その差分値を出力する第４差分
器７２、及び(３)第４差分器７２から出力される差分値
に基づいて、有声音用適応コードブック７ｂに格納され
ている駆動音源データの遅延量Ｌ、有声音用雑音コード
ブック７ｃに格納されている雑音データのインデックス
Ｉ、更には第１乗算器７ｄのゲインδ、第２乗算器７ｅ
のゲインβ、及び第３乗算器７ｆのゲインγを調整変更
する有声音用符号選択制御部７ｈ、を付加したことであ
る。

【００８９】更に、図８は無声音声駆動音源生成部８０
の概略構成図を示したものである。

【００９０】図８の無声音声駆動音源生成部８０の構成
は、基本的に図３に示す無声音声駆動音源生成部８の構
成と同一であるが、その無声音声駆動音源生成部８０が
無声音声駆動音源生成部８と異なる点は、(１)ＬＰＣ分
析部２から出力されるＬＰＣパラメータ、及び第２加算
器８ｅにて生成された駆動音源信号に基づいて合成無声
音声信号を合成する第５重み付け合成フィルタ８１、
(２)音声入力部１から出力される音声信号と第５重み付
け合成フィルタ８１から出力される合成無声音声信号と
の差分をとり、その差分値を出力する第３差分器８２、
及び(３)第５差分器８２から出力される差分値に基づい
て、無声音用適応コードブック８ｂに格納されている駆
動音源データの遅延量Ｌ’、無声音用雑音コードブック
７ｃに格納されている雑音データのインデックスＩ’、
更には第４乗算器８ｃのゲインδ’、及び第５乗算器８
ｄのゲインγ’を調整変更する無声音用符号選択制御部
８ｆ、を付加したことである。

【００９１】上述の構成を具備する音声符号化装置にお
いて、入力された音声を符号化するまでの動作を以下に
詳述する。

【００９２】まず、音声入力部１に音声が入力される
と、その音声入力部１にて変換された音声信号は、ＬＰ
Ｃ分析部２、逆フィルタ３、無声音声駆動音源生成部８
０、第２差分器１０ｂ、及び第３差分器１０ｃに夫々出
力される。

【００９３】ＬＰＣ分析部２では、ＬＰＣ分析法に基づ
いて、ＬＰＣパラメータが求められ、このパラメータは
逆フィルタ３、有声音声駆動音源生成部７０、無声音声
駆動音源生成部８０、及び多重化部１１ｂに出力され
る。

【００９４】逆フィルタ３では、ＬＰＣ分析部２にて分
析されたＬＰＣパラメータに基づいて、入力された音声
の予測残差信号を求める。

【００９５】一方、位相等化処理部４に逆フィルタ３か
ら予測残差信号が出力されると、第１の実施例と同様
に、その予測残差信号のエネルギが集中する個所に疑似
的にピッチパルス列が設定され、これによって、上記予
測残差信号が位相等化変換された位相等化音声残差信
号、及びパルス列の位置を表すピッチパルス位置信号が
有声音声駆動音源生成部７０に出力される。

【００９６】図７に示す有声音声駆動音源生成部７０で
は、位相等化処理部４から出力されたピッチパルス位置
信号に基づいて、パルスパターン生成部７ａはパルスパ
ターンを生成し、その第１パターンを乗算器７ｄに出力
する。第１乗算器７ｄは、有声音用符号選択制御部７ｈ
によって選択されたゲインδを上記パルスパターンに乗
じ、振幅を変更調整する。

【００９７】また、有声音用雑音コードブック７ｃで
は、有声音用符号選択制御部７ｈによって選択されたイ
ンデックスＩに格納された雑音データが読み出され、第
３乗算器７ｆは、有声音用符号選択制御部７ｈによって
選択されたゲインγを上記雑音データに乗じる。

【００９８】第１加算器７ｇは、第１乗算器７ｄ、第３
乗算器７ｆの出力データを加算し、この出力データは最
新の過去の駆動音源データとなり、有声音用適応コード
ブック７ｂにフィードバックされ記憶されると共に、第
４重み付け合成フィルタ７１に出力される。

【００９９】因みに、有声音用適応コードブック７ｂは
初期状態（リセットされた状態）では全く駆動音源デー
タを記憶しておらず、このフィードバックされた時点か
ら有声音用適応コードブック７ｂには最新の過去の駆動
音源データが順次格納されていくことになる。

【０１００】一方、第４重み付け合成フィルタ７１は、
第１加算器７ｇにて加算された駆動音源データ、及びＬ
ＰＣ分析部２から出力されたＬＰＣパラメータに基づい
て、合成有声音声信号が生成され、第４差分器７２に出
力される。第４差分器７２は、位相等化処理部４から出
力される位相等化音声残差信号と第４重み付け合成フィ
ルタ７１にて生成された合成有声音声信号との差分をと
り、有声音用符号選択制御部７ｈは、その差分値が最も
小さくなるまで、遅延量Ｌ、インデックスＩ、及びゲイ
ンδ、β、γを適宜選択する。これによって、有声音用
適応コードブック７ｂでは、遅延量Ｌに基づいて遅延さ
れた最新の過去の駆動音源データが第２乗算器７ｅに出
力され、ゲインβが乗ぜられ、また、有声音用雑音コー
ドブック７ｃでは、インデックスＩに基づいて選択され
た雑音データが第３乗算器７ｆに出力され、ゲインγが
乗ぜられ、更に第１乗算器７ｄでは、パルスパターン生
成部７ａにて生成されたパルスパターンにゲインδが乗
ぜられる。

【０１０１】この後、第１加算器７ｇは、第１乗算器７
ｄ、第２乗算器７ｅ、及び第３乗算器７ｆの出力データ
を加算し、この出力データは最新の過去の駆動音源デー
タとなり、有声音用適応コードブック７ｂに再びフィー
ドバックされ記憶されると共に、第４重み付け合成フィ
ルタ７１に出力される。この第４重み付け合成フィルタ
７１で生成された合成有声音声信号は第４差分器７２に
出力される。

【０１０２】今、仮に第４差分器７２での差分値が最も
小さくなった場合、有声音用符号選択制御部７ｈは遅延
量Ｌ、インデックスＩ、及びゲインδ、β、γを選択す
ることを中止し、これによって最終的に決定されたピッ
チパルス位置信号、遅延量Ｌ、インデックスＩ、及びゲ
インδ、β、γは第２差分器１０ｂに出力される。而し
て、この第２差分器１０ｂは、音声入力部１から出力さ
れる音声信号と第４重み付け合成フィルタ７１から出力
される合成有声音声信号との差分をとり、この差分値は
比較器１２に出力される。

【０１０３】一方、図８に示す無声音声駆動音源生成部
８０における無声音用雑音コードブック８ｂでは、無声
音用符号選択制御部８ｆによって選択されたインデック
スＩ’に格納された雑音データが読み出され、第５乗算
器８ｄは、無声音用符号選択制御部８ｆによって選択さ
れたゲインγ’を上記雑音データに乗じる。

【０１０４】第２加算器８ｅは、最初第５乗算器８ｄの
出力データを最新の過去の駆動音源データとし、この駆
動音源データは無声音用適応コードブック８ａにフィー
ドバックされ記憶されると共に、第５重み付け合成フィ
ルタ８１に出力される。

【０１０５】因みに、無声音用適応コードブック８ａは
初期状態（リセットされた状態）では全く駆動音源デー
タを記憶しておらず、このフィードバックされた時点か
ら無声音用適応コードブック８ａには最新の過去の駆動
音源データが順次格納されていくことになる。

【０１０６】第５重み付け合成フィルタ８１では、第２
加算器８ｅにて加算された駆動音源信号、及びＬＰＣ分
析部２から出力されたＬＰＣパラメータに基づいて、合
成無声音声信号が生成され、第５差分器８２に出力され
る。第５差分器８２は、音声入力部１から出力される音
声信号と第５重み付け合成フィルタ８１にて生成された
合成無声音声信号との差分をとり、無声音用符号選択制
御部８ｆは、その差分値が最も小さくなるまで、遅延量
Ｌ’、インデックスＩ’、及びゲインβ’、γ’を選択
する。これによって、無声音用適応コードブック８ａで
は、遅延量Ｌ’に基づいて遅延された最新の過去の駆動
音源データが乗算器８ｃに出力され、ゲインβ’が乗ぜ
られる。また、無声音用雑音コードブック８ｂでは、イ
ンデックスＩ’に基づいて選択された雑音データが乗算
器８ｄに出力され、ゲインγ’が乗ぜられる。

【０１０７】この後、第２加算器８ｅは、第４乗算器８
ｃ、第５乗算器８ｄの出力データを加算し、この出力デ
ータは最新の過去の駆動音源データとして、無声音用適
応コードブック８ａに再びフィードバックされ記憶され
ると共に、第５重み付け合成フィルタ８１に出力され
る。この第５重み付け合成フィルタ８１で生成された合
成無声音声信号は第５差分器８２に出力される。

【０１０８】今、仮に第５差分器８２での差分値が最も
小さくなった場合には、無声音用符号選択制御部８ｆは
遅延量Ｌ’、インデックスＩ’、及びゲインβ’、γ’
の選択することを中止し、これによって最終的に決定さ
れた遅延量Ｌ’、インデックスＩ’、及びゲインβ’、
γ’は第３差分器１０ｃに出力される。而して、この第
２差分器１０ｃは、音声入力部１から出力された音声信
号と第５重み付け合成フィルタ８１から出力された合成
無声音声信号との差分をとり、この差分値を比較器１２
に出力する。

【０１０９】斯くして、有声音声駆動音源生成部７０、
無声音声駆動音源生成部８０にて夫々合成有声音声信
号、合成無声音声信号が生成され、比較器１２は、第２
差分器１０ｂ、及び第３差分器１０ｃの夫々の差分値を
比較して、差分値の小さい音声信号を選択する選択信号
を選択部１３に出力する。

【０１１０】例えば、いま合成有声音声信号の差分値
が、合成無声音声信号のそれより小さかったとすると、
比較器１２は有声音声駆動音源生成部７０に対して、有
声音用適応コードブック７ｂに記憶されている駆動音源
データを無声音声駆動音源生成部８０の無声音用適応コ
ードブック８ａに複製するよう指令する。これによっ
て、有声音用適応コードブック７ｂ、無声音用適応コー
ドブック８ａには同一内容の駆動音源データが常に格納
されていることになる。

【０１１１】これに対して、合成無声音声信号の差分値
が、合成有声音声信号のそれより小さかったとすると、
比較器１２は無声音声駆動音源生成部８０に対して、無
声音用適応コードブック８ａに記憶されている駆動音源
データを有声音声駆動音源生成部７０の有声音用適応コ
ードブック７ｂに複製するよう指令する。これによっ
て、無声音用適応コードブック８ａ、有声音用適応コー
ドブック７ｂには同一内容の駆動音源データが常に格納
されていることになる。

【０１１２】これら適応コードブックに格納されている
内容を他方の適応コードブックに複製する理由は第１の
実施例と同じであるので、ここでは割愛する。

【０１１３】選択部１３には、有声音声駆動音源生成部
７０、無声音声駆動音源生成部８０から合成有声音声信
号、及び合成無声音声信号が夫々出力され、選択部１３
は比較器１２から出力される合成有声音声信号、又は合
成無声音声信号のどちらの信号を選択するかを示す選択
信号を受けて、選択された合成有声音声信号、又は合成
無声音声信号、及びその選択信号を符号化して、多重化
部１１ｂに出力する。

【０１１４】多重化部１１ｂは、選択部１３から出力さ
れる符号化データ、及びＬＰＣ分析部２から出力される
ＬＰＣパラメータを多重化出力する。

【０１１５】その多重化データは、有線、無線の通信路
を介して伝送されたり、或るいはメモリ、フロッピディ
スク等の記憶装置に記憶される。

【０１１６】また、その多重化データは、第１の実施例
の図４に示す音声復号化装置に出力されて音声再生され
ることが可能であり、この場合、その復号化方式は第１
の実施例に示した復号方式と全く同一であるので、ここ
ではその説明を割愛する。

【０１１７】因みに、図６の音声符号化装置にて用いら
れる情報のビット配分としては、表２に示す通りであ
り、

【０１１８】

【表２】

【０１１９】これらの情報が図４の音声復号化装置に伝
達されて、音声を復号再生するのである。

【０１２０】

【発明の効果】本発明の第１の音声符号化装置によれ
ば、符号化の対象となる音声が有声音か無声音かを予測
残差信号に基づいて駆動音源の生成処理部を選択するこ
とができる。特に、準周期的なピッチパルスを低ビット
で有効に検出することができ、この結果、有声音声駆動
音源信号生成処理に於ける計算量の軽減が図れ、しかも
全体のビットレートの低減を実現しながら、再生音声の
音質向上が可能になる。

【０１２１】本発明の第２の音声符号化装置によれば、
入力された音声を符号化出力する場合に、予測残差信号
に基づいて、その音声の種類、即ち有声音、又は無声音
の区別を行うのではなく、有声音声駆動音源生成部にて
疑似的なピッチパルスを設定することによって合成有声
音声信号を生成し、また無声音用符号化部にて上記音声
に基づいて合成無声音声信号を生成し、これらの音声信
号のうち、比較器は入力された音声に最も類似する音声
信号を選択するので、低ビットレートであっても、効率
よく符号化を行うことができる。

【図面の簡単な説明】

【図１】本発明の第１の実施例に係る音声符号化装置全
体の概略構成図

【図２】本発明の第１の実施例に係る有声音声駆動音源
生成部７の構成図

【図３】本発明の第１の実施例に係る無声音声駆動音源
生成部８の構成図

【図４】本発明の第１の実施例に係る音声復号化装置の
構成図

【図５】本発明の第１の実施例に係る音声符号化装置に
おいて処理される信号波形図

【図６】本発明の第２の実施例に係る音声符号化装置全
体の概略構成図

【図７】本発明の第２の実施例に係る有声音用駆動音源
生成部７０の構成図

【図８】本発明の第２の実施例に係る無声音用駆動音源
生成部８０の構成図

【符号の説明】

１音声入力部２ＬＰＣ分析部３逆フィルタ４位相等化処理部６第１重み付け合成フィルタ７、７０有声音声駆動音源生成部８、８０無声音声駆動音源生成部７ａパルスパターン生成部７ｂ有声音用適応コードブック７ｃ有声音用雑音コードブック８ａ無声音用適応コードブック８ｂ無声音用雑音コードブック９第２重み付け合成フィルタ１２比較器１３選択部１１ａ多重化部２０多重分離部

─────────────────────────────────────────────────────

【手続補正書】

【提出日】平成５年３月３１日

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】全文

【補正方法】変更

【補正内容】

【書類名】明細書

【発明の名称】音声符号化装置

【特許請求の範囲】

【発明の詳細な説明】

【０００１】

【０００２】

【０００６】

【０００７】

【課題を解決するための手段】本発明の第１の音声符号
化装置は、入力音声信号から音声のピッチ周期を抽出す
るピッチ抽出処理部と、該入力音声信号の有声、又は無
声を判定する有声／無声判定処理部と、上記ピッチ抽出
処理部で得られるピッチ周期情報、及び有声／無声判定
処理部にて判定された判定結果情報に基づいて駆動音源
信号を選択的に生成する駆動音源生成部と、該駆動音源
生成部にて生成された駆動音源信号に基づいて音声信号
を合成出力する音声合成処理部と、該音声合成処理部に
て合成された合成音声信号と入力された音声信号とを比
較して最も誤差が少ない時の駆動音源信号に対応するコ
ードを選択出力するコード出力処理部と、からなる音声
符号化装置に於て、有声音声の場合、上記駆動音源生成
部では、ピッチ周期に対応したパルスパターン信号と最
新の過去の所定時間に記憶された駆動音源信号と雑音信
号との３者のそれぞれに所定のゲインを乗じて混合して
なる有声駆動音源を使用し、一方無声音声の場合、上記
駆動音源生成部では、最新の過去の所定時間に記憶され
た駆動音源信号と雑音信号との２者のそれぞれに所定の
ゲインを乗じて混合してなる無声駆動音源を使用するも
のである。

【０００８】また、本発明の第２の音声符号化装置は、
入力された音声の音声信号のＬＰＣパラメータを算出す
る分析部と、上記音声信号のピッチ周期を抽出するピッ
チ抽出処理部と、該ピッチ抽出処理部にて抽出されたピ
ッチ周期、及び上記ＬＰＣパラメータに基づいて合成有
声音声信号を生成する合成有声音声信号生成部と、上記
音声信号、及び上記ＬＰＣパラメータに基づいて合成無
声音声信号を生成する合成無声音声信号生成部と、上記
合成有声音声信号生成部、及び合成無声音声信号生成部
によって生成された合成有声音声信号、及び合成無声音
声信号と上記音声信号とを夫々比較する比較器と、該比
較器による比較結果に基づいて、合成有声音声信号、又
は合成無声音声信号のどちらか一方の音声信号を選択す
る選択部と、該選択部によって選択された選択信号、及
び上記分析部にて分析されたＬＰＣパラメータを多重出
力する多重化部と、を具備する音声符号化装置に於て、
上記選択部は、上記合成有声音声信号、及び合成無声音
声信号と上記音声信号とを夫々比較し、上記音声信号と
の誤差が小さい合成音声信号を選択するものである。

【０００９】

【作用】 (１)入力音声信号から音声のピッチ周期を抽出し、該ピ
ッチ周期に基づいて、入力音声信号の有声、又は無声の
判定を行い、上記ピッチ周期の抽出処理で得られるピッ
チ周期情報、及び有声／無声判定処理の判定結果情報に
基づいて駆動音源信号を選択的に生成し、上記有声／無
声の判定結果が有声の場合、ピッチ周期に対応したパル
スパターン信号と最新の過去の所定時間に記憶された駆
動音源信号と雑音信号との３者のそれぞれに所定のゲイ
ンを乗じた後、加算してなる第１の駆動音源を生成し、
又は有声／無声の判定結果が無声の場合、最新の過去の
所定時間に記憶された駆動音源信号と雑音信号との２者
のそれぞれに所定のゲインを乗じて加算してなる第２の
駆動音源を生成する。

【００１３】

【実施例】［第１の実施例］本発明の第１の実施例の音声符号化装
置の処理ステップの一例を以下に列挙する。

【００３０】ここで、遅延量Ｌ’とは、過去の駆動音源
データを有効に活用するために、無声音用適応コードブ
ック８ａに格納されている最新の過去の駆動音源データ
を時間的にずらせた場合の時間的な長さをいい、インデ
ックスＩ’とは、雑音コードブック８ｂに格納されてい
る複数個の雑音データを選択する際の指標を示し、また
ゲインβ’、γ’とは、無声音用適応コードブック８ａ
に格納されている過去の駆動音源データの示す波形の振
幅、及び無声音用雑音コードブック８ｂに格納されてい
る雑音データの示す波形の振幅の巾を夫々変更調整する
利得である。

【００３１】尚、無声音声の場合には、切換手段Ｓｗ１
により、無声音声駆動音源生成部８が選択されるので、
通常のＣＥＬＰと全く同様の構成となる。

【００３２】第２重み付け合成フィルタ９は、有声音声
駆動音源生成部７（図２参照）、或るいは無声音声駆動
音源生成部８（図３参照）からの出力を受けて音声信号
を合成する機能を有し、第１差分器１０ａは、第１重み
付け合成フィルタ６にて合成された合成音声信号と、第
２重み付け合成フィルタ９にて合成された合成音声信号
とを比較する第１差分器である。而して、第１重み付け
合成フィルタ６にて合成された合成音声信号に対して最
も類似した第２重み付け合成フィルタ９の合成音声信号
が二乗誤差最小化の手法で特定され、このときの信号が
駆動音源信号となる。

【００３３】多重化部１１ａは、ＬＰＣパラメータ、有
声／無声判定データ、並びに二乗誤差最小化の手法によ
って特定された駆動音源信号の、無声音用適応コードブ
ック８ａの遅延量Ｌ’、無声音用雑音コードブック８ｂ
のインデックスＩ’、及びゲインβ’、γ’の値、又は
有声音用適応コードブック７ｂの遅延量Ｌ、インデック
スＩ、ゲインδ、β、γ、及びピッチパルス位置を符号
化データとして、多重化出力する。

【００３６】図４に示す有声音声駆動音源再生部２１
は、図２に示す有声音声駆動音源生成部７と、また無声
音声駆動音源再生部２２は、図３に示す無声音声駆動音
源生成部８と全く同一機能を有するものであるが、唯一
異なる点は、有声音用符号選択制御部７ｈ、無声音用符
号選択制御部８ｆの構成を持たない点である。

【００４５】有声音用適応コードブック７ｂでは、有声
音用符号選択制御部７ｈにより選択された遅延量Ｌに基
づいて過去の駆動音源信号データが読み出され、一方第
２乗算器７ｅは、有声音用符号選択制御部７ｈによって
選択されたゲインβを上記過去の駆動音源信号データに
乗じる。

【００４６】また、有声音用雑音コードブック７ｃで
は、有声音用符号選択制御部７ｈによって選択されたイ
ンデックスＩに格納された雑音データが読み出され、一
方第３乗算器７ｆは、有声音用符号選択制御部７ｈによ
って選択されたゲインγを上記雑音データに乗じる。

【００４７】これによって、第１加算器７ｇは、第１乗
算器７ｄ、第２乗算器７ｅ、及び第３乗算器７ｆの出力
データを加算し、この出力データは最新の過去の駆動音
源信号データとなり、有声音用適応コードブック７ｂに
フィードバックされ記憶されると共に、第２重み付け合
成フィルタ９に出力される。

【００４８】因みに、有声音用適応コードブック７ｂは
初期状態（リセットされた状態）では全く駆動音源デー
タを記憶しておらず、このフィードバックされた時点か
ら有声音用適応コードブック７ｂには最新の過去の駆動
音源データが順次格納されていくことになる。

【００４９】第２重み付け合成フィルタ９では、第１加
算器７ｇにて加算された駆動音源データ、及びＬＰＣ分
析部２から出力されたＬＰＣパラメータに基づいて、合
成有声音声信号が生成され、第１差分器１０ａに出力さ
れる。第１差分器１０ａでは、第１重み付け合成フィル
タ６から出力される合成音声信号と第２重み付け合成フ
ィルタ９にて生成された合成有声音声信号との差分をと
り、有声音用符号選択制御部７ｈは、その差分値が最も
小さくなるまで、遅延量Ｌ、インデックスＩ、及びゲイ
ンδ、β、γを繰り返して選択する。これに従って、有
声音用適応コードブック７ｂでは、遅延量Ｌに基づいて
遅延された最新の過去の駆動音源データが第２乗算器７
ｅに出力され、ゲインβが乗ぜられる。また、有声音用
雑音コードブック７ｃでは、インデックスＩに基づいて
選択された雑音データが第３乗算器７ｆに出力され、ゲ
インγが乗ぜられる。一方、第１乗算器７ｄでは、パル
スパターン生成部７ａにて生成されたパルスパターンに
ゲインδを乗じる。

【００５０】この結果、第１加算器７ｇは、第１乗算器
７ｄ、第２乗算器７ｅ、及び第３乗算器７ｆの出力デー
タを加算し、この出力データは最新の過去の駆動音源信
号となり、有声音用適応コードブック７ｂに再びフィー
ドバックされ記憶される。

【００５１】而して、有声音用符号選択制御部７ｈは、
最終的に決定された、有声音声適応コードブック７ｂの
遅延量Ｌ、有声音用雑音コードブック７ｃのインデック
スＩ、及びゲインδ、β、γ、並びにピッチパルス位置
信号を符号化して、多重化部１１ａに出力する。

【００５２】以上が、切換手段Ｓｗ１が有声音声駆動音
源生成部７側に切り換わったときの有声音声駆動音源生
成部７の処理手順であるが、次に切換手段Ｓｗ１が無声
音声駆動音源生成部８側に切り換わったときの無声音声
駆動音源生成部８の処理手順を説明する。

【００５３】今、切換手段Ｓｗ１が無声音声駆動音源生
成部８側に切り換わっている場合、図３に示すように無
声音声駆動音源生成部８の無声音用適応コードブック８
ａでは、無声音用符号選択制御部８ｆにより選択された
遅延量Ｌ’に基づいて過去の駆動音源信号データが読み
出され、一方第４乗算器８ｃは、無声音用符号選択制御
部８ｆによって選択されたゲインβ’を上記過去の駆動
音源信号データに乗じる。

【００５４】また、無声音声駆動音源生成部８の無声音
用雑音コードブック８ｂでは、無声音用符号選択制御部
８ｆによって選択されたインデックスＩ’に格納された
雑音データが読み出され、第５乗算器８ｄは、無声音用
符号選択制御部８ｆによって選択されたゲインγ’を上
記雑音データに乗じる。

【００５５】これによって、第２加算器８ｅは、第４乗
算器８ｃ、及び第５乗算器８ｄの出力データを加算し、
最新の過去の駆動音源データとして、無声音用適応コー
ドブック８ａにフィードバックされ記憶されると共に、
第２重み付け合成フィルタ９に出力される。

【００５６】因みに、無声音用適応コードブック８ａは
初期状態（リセットされた状態）では全く駆動音源デー
タを記憶しておらず、この時点から無声音用適応コード
ブック８ａには最新の過去の駆動音源データが順次格納
されていくことになる。

【００５７】一方、第２重み付け合成フィルタ９は、第
２加算器８ｅにて加算された駆動音源データ、及びＬＰ
Ｃ分析部２から出力されたＬＰＣパラメータに基づい
て、合成無声音声信号が生成され、第１差分器１０ａに
出力される。第１差分器１０ａは、第１重み付け合成フ
ィルタ６から出力される合成音声信号と第２重み付け合
成フィルタ９にて生成された合成無声音声信号との差分
をとり、無声音用符号選択制御部８ｆは、この差分値に
応じて、この差分値が最も小さくなるまで、遅延量
Ｌ’、インデックスＩ’、及びゲインβ’、γ’を繰り
返して選択する。これに従って、無声音用適応コードブ
ック８ａでは、遅延量Ｌ’に基づいて遅延された最新の
過去の駆動音源データが第４乗算器８ｃに出力され、ゲ
インβ’が乗ぜられる。また、無声音用雑音コードブッ
ク８ｂでは、インデックスＩ’に基づいて選択された雑
音データが第２乗算器８ｅに出力され、ゲインγ’が乗
ぜられる。

【００５８】この結果、第２加算器８ｅは、第４乗算器
８ｃ、及び第５乗算器８ｄの出力データを加算し、この
出力データは最新の過去の駆動音源信号となり、無声音
用適応コードブック８ａに再びフィードバックされ記憶
される。

【００５９】而して、無声音用符号選択制御部８ｆは、
最終的に決定された、無声音声適応コードブック８ａの
遅延量Ｌ’、無声音用雑音コードブック８ｂのインデッ
クスＩ’、及びゲインβ’、γ’を符号化して、多重化
部１１ａに出力する。

【００６０】このようにして、多重化部１１ａは、有声
音声駆動音源生成部７から出力された遅延量Ｌ、インデ
ックスＩ、ゲインδ、β、γ、及びピッチパルス位置信
号からなる符号化データ、又は無声音声駆動音源生成部
８から出力された遅延量Ｌ’、インデックスＩ’、及び
ゲインβ’、γ’からなる符号化データと共に、ＬＰＣ
分析部２から入力されたＬＰＣパラメータを多重化デー
タとして、後述する音声復号化装置の多重分離部２０に
出力する。

【００６１】ところで、多重化部１１ａから出力された
多重化データを復号する際の復号方式を図４を参照し乍
ら説明する。

【００６２】多重分離部２０に多重化部１１ａから多重
化データが入力されると、その多重分離部２０はその多
重化データに有声音声であるとの判定データが含まれて
いれば、有声／無声判定データ送信路を介して、切換手
段Ｓｗ２を有声音声駆動音源再生部２１側に切り換える
指令を行う。

【００６３】因みに、初期状態（リセットされた状態）
においては、有声音用雑音コードブック２１ｃ、及び無
声音用雑音コードブック２２ｂには予め有声音用雑音コ
ードブック７ｃ、及び無声音用雑音コードブック８ｂと
同一の雑音データが格納されているが、有声音用適応コ
ードブック２１ｂ、及び無声音用適応コードブック２２
ａには何の駆動音源データも格納されていない。

【００６４】この状態から、まず有声音声駆動音源再生
部２１で有声音声を復号化する処理を以下に説明する。

【００６５】多重化データが多重分離部２０に入力され
ると、多重化データの各々のピッチパルス位置信号、遅
延量Ｌ、インデックスＩが、夫々パルスパターン生成部
２１ａ、有声音用適応コードブック２１ｂ、及び有声音
用雑音コードブック２１ｃに入力されると共に、ゲイン
δ、β、γが、夫々第６乗算器２１ｄ、第７乗算器２１
ｅ、第８乗算器２１ｆに入力される。

【００６６】パルスパターン生成部２１ａはピッチパル
ス位置信号に基づいて、パルスパターンを生成し、その
パターンを第６乗算器２１ｄに出力し、この第６乗算器
２１ｄは、多重化データのゲインδをパルスパターンに
乗じ、振幅を変更調整する。

【００６７】また、有声音用適応コードブック２１ｂで
は、遅延量Ｌに基づいて過去の駆動音源信号データが出
力され、第７乗算器２１ｅは、ゲインβを上記過去の駆
動音源信号データに乗じる。

【００６８】これと共に、有声音用雑音コードブック２
１ｃではインデックスＩに基づいて、雑音データが第８
乗算器２１ｆに出力され、この第８乗算器２１ｆは、多
重化データのゲインγを雑音データに乗じ、振幅を変更
調整する。第３加算器２１ｇは、第６乗算器２１ｄ、第
７乗算器２１ｅ、及び第８乗算器２１ｆの出力データを
加算する。この出力データは有声音用適応コードブック
２１ｂにフィードバックされ書き替えられ乍ら記憶され
ていく。

【００６９】従って、有声音声駆動音源再生部２１は、
最終的に多重化データに対応した復号化データを合成フ
ィルタ２３に出力し、この合成フィルタ２３では、ＬＰ
Ｃパラメータに基づいて再生された後、ポストフィルタ
２４にて波形整形され、図示しないスピーカ等に出力さ
れる。

【００７０】次に、切換手段Ｓｗ２が無声音声駆動音源
再生部２２側に切り換わっている場合に、その無声音声
駆動音源再生部２２で無声音声を復号化する処理を以下
に説明する。

【００７１】多重化データが多重分離部２０に入力され
ると、多重化データの各々の遅延量Ｌ’、インデックス
Ｉ’が、夫々無声音用適応コードブック２２ａ、及び無
声音用雑音コードブック２２ｂに入力されると共に、ゲ
インβ’、γ’が、夫々第９乗算器２２ｃ、第１０乗算
器２２ｄに入力される。

【００７２】また、無声音用適応コードブック２２ａで
は、遅延量Ｌ’に基づいて過去の駆動音源信号データが
出力され、第９乗算器２２ｃは、ゲインβ’を上記過去
の駆動音源信号データに乗じる。

【００７３】無声音用雑音コードブック２２ｂではイン
デックスＩ’に基づいて、雑音データが第１０乗算器２
２ｄに出力され、この第１０乗算器２２ｄは、多重化デ
ータのゲインγ’を雑音データに乗じ、振幅を変更調整
する。第１１加算器２２ｅは、第９乗算器２２ｃ、及び
第１０乗算器２２ｄの出力データを加算し、最新の過去
の駆動音源データとして、無声音用適応コードブック２
２ａにフィードバックされ、無声音用適応コードブック
２２ａに書き替えられ乍ら記憶されていく。

【００７４】従って、無声音声駆動音源再生部２２で
は、最終的に決定された多重化データに対応した復号化
データが合成フィルタ２３に出力され、この合成フィル
タ２３は、ＬＰＣパラメータに基づいて再生された後、
ポストフィルタ２４にて波形整形され、図示しないスピ
ーカ等に出力される。

【００７５】ここで、図１の音声符号化装置にて用いら
れる情報のビット配分としては、表１に示す通りであ
り、

【００７６】

【表１】

【００７７】これらの情報が図４の音声復号化装置に伝
達されて、音声を復号再生するのである。

【００７８】図５は第１の実施例における各処理ステッ
プ時の信号波形を示す。同図(ａ)は原音声、同図（ｂ）
は予測残差、同図（ｃ）は位相等化残差、同図（ｄ）は
位相等化音声、同図（ｅ）は駆動音源、同図（ｆ）は復
号音声を示している。

【００７９】図５（ｃ）によれば、位相等化処理部４で
の位相等化処理により、予測残差のパワーがピッチパル
スに集中していることが分かる。

【００８０】以上の構成の本発明の第１の実施例に係る
装置に於ける必須の情報であるピッチ周期は、駆動音源
の先行するパルス位置からピッチ周期だけ離れた位置近
傍（例えば、８ＫＨｚサンプリングの場合、±３サンプ
ル分）で、図５（ｂ）の残差信号の信幅値が所定の値よ
り大きくなる後続するパルス位置を選択する。この場
合、±３サンプル、計７サンプルの残差信号の内、第２
番目に大きいサンプルの値が最大サンプルの値の５０％
以下になる時、そのピーク性が顕著であるので、その最
大サンプル位置をピッチパルス位置として決定する。し
かし、第２番目に大きいサンプルの値が最大サンプルの
値の５０％以下にならない時、そのピーク性が顕著であ
るとは認められないので、この７サンプルに該当する図
５（ｃ）の位相等化残差の７サンプルの内、最大の値を
示すピークのサンプル位置を後続のピッチパルス位置と
して決定する。これによって、先後両パルス間隔がピッ
チ周期となるのである。

【００８１】ここで、有声音声駆動音源生成部７で使用
される有声音用適応コードブック７ｂ、及び無声音声駆
動音源生成部８で使用される無声音用適応コードブック
８ａは、例えば、８ＫＨｚサンプリングの場合、最新の
過去の１４６サンプルを逐次記憶しているシフトレジス
タ形式のメモリであるが、特に有声音用適応コードブッ
ク７ｂの場合は、ピッチ周期の近傍（例えば、８ＫＨｚ
サンプリングの場合、±３サンプル分）の７種類の時間
範囲に対する駆動音源信号列の内のあるものが選択的に
使用される。これに比べて、無声の場合には、従来のＣ
ＥＬＰ同様に無声音用適応コードブック８ａの２０サン
プル〜１４６サンプルに亘る１２７種類の駆動音源信号
列の中から選択しなければならない。

【００８２】次に、本発明の音声符号化方式をシミュレ
ーションにより評価する。コンピュータシミュレーショ
ンにより本方式の評価を行なう時のシミュレーションの
条件は、サンプリング周期：８ｋＨｚ、フレーム長：４
０ｍｓｅｃ．サブフレーム長：８ｍｓｅｃ．及びビット
レート：４ｋｂｐｓであり、そのビット配分は前述の配
分とする。

【００８３】このような条件下で、短期予測係数とし
て、ＬＳＰ係数を求め、サブフレーム毎に補間した後、
ＬＰＣ係数に変換して利用している。なお、ＬＳＰ係数
は、３段の多段ベクトル量子化を行なっている。また、
駆動ベクトルのゲインは、有声音の場合、位相等化パル
ス音源も含めて、サブフレーム毎に全駆動ベクトルゲイ
ンをまとめてベクトル量子化している。また、有声音時
の有声音用適応コードブック７ｂの探索範囲は、ピッチ
周期付近に限定した。この場合の駆動音源波形は図５
（ｅ）に示され、復号音声波形は図５（ｆ）に示されて
いるように、位相等化パルス音源の採用により、準周期
的なピッチパルスを良く再現していることが分かる。

【００８４】客観評価として、日本語短文男女各４文章
について、位相等化音声を基準とした時のセグメンタル
ＳＮＲを求めた結果、男性の声では９．５７ｄＢ、女性
の声では９．６９ｄＢ、平均９．６３ｄＢとなった。こ
のような復号音声を試聴したところ、ピッチが良く再現
されており自然性の高い復号音声が得られた。［第２の実施例］本発明の第２の実施例を図６乃至図８
に基づいて説明する。

【００８５】尚、第１の実施例と構成が同一の場合には
同一番号を付し、その説明を省略する。

【００８６】第２の実施例が第１の実施例と大きく異な
る点は、逆フィルタ３によって処理された予測残差信号
に基づいて音声の有声と無声を判定する有声／無声判定
部５を省くことによって、音声符号化装置の構成を第１
の実施例のそれより簡略化したことである。

【００８７】本発明の第２の実施例の音声符号化装置の
処理ステップの一例を以下に列挙する。

【００８８】ステップ１［ピッチ抽出処理］：入力音声
信号から音声のピッチ周期を抽出、ステップ２［駆動音源生成処理］：上記ピッチ抽出処理
で得られるピッチ周期情報に基づいて駆動音源信号を生
成し、そのピッチ周期に対応したパルスパターン信号と
最新の過去の所定時間に記憶された駆動音源信号と雑音
信号との３者のそれぞれに所定のゲインを乗じた後、加
算してなる第１の駆動音源を生成すると共に、最新の過
去の所定時間に記憶された駆動音源信号と雑音信号との
２者のそれぞれに所定のゲインを乗じて加算してなる第
２の駆動音源を生成、ステップ３［音声合成処理］：該駆動音源生成処理にて
生成された第１の駆動音源、並びに第２の駆動音源から
なる信号に基づいて音声信号を夫々合成出力、ステップ４［符号化出力処理］：該音声合成処理にて合
成された合成音声信号と入力された音声信号とを比較し
て最も誤差が少ない時の駆動音源信号に対応するコード
及び有声／無声の判定結果を選択出力。

【００８９】図６は、第２の実施例に係る音声符号化装
置全体の概略構成図である。

【００９０】１２は第２差分器１０ｂ、及び第３差分器
１０ｃから出力された差分値を比較し、その比較結果を
出力する比較器、１３は合成有声音声信号生成部７０か
ら出力される合成有声音声信号、及び合成無声音声信号
生成部８０から出力される合成無声音声信号のうち、比
較器１２から出力された差分値に基づいて、どちらか一
方の音声信号を選択する選択部、１１ｂは選択部１３に
て選択された合成有声音声信号、又は合成無声音声信
号、並びにＬＰＣ分析部２にて変換されたＬＰＣパラメ
ータに基づいて、多重化出力する多重化部であり、これ
によって、多重化部１１ｂは音声入力部１に入力された
音声を符号化することができる。

【００９１】次に、図７は合成有声音声信号生成部７０
の概略構成図を示したものである。

【００９２】図７の合成有声音声信号生成部７０の構成
は、基本的に図２に示す有声音声駆動音源生成部７の構
成と同一であるが、その合成有声音声信号生成部７０が
有声音声駆動音源生成部７と異なる点は、(１)ＬＰＣ分
析部２から出力されるＬＰＣパラメータ、及び第１加算
器７ｇにて生成された駆動音源信号に基づいて合成有声
音声信号を合成する第４重み付け合成フィルタ７１、及
び(２)位相等化処理部４から出力される位相等化音声残
差信号と第４合成フィルタ７１から出力される合成有声
音声信号との差分をとり、その差分値を出力する第４差
分器７２、を付加したことである。

【００９３】更に、図８は合成無声音声信号生成部８０
の概略構成図を示したものである。

【００９４】図８の合成無声音声信号生成部８０の構成
は、基本的に図３に示す無声音声駆動音源生成部８の構
成と同一であるが、その合成無声音声信号生成部８０が
無声音声駆動音源生成部８と異なる点は、(１)ＬＰＣ分
析部２から出力されるＬＰＣパラメータ、及び第２加算
器８ｅにて生成された駆動音源信号に基づいて合成無声
音声信号を合成する第５重み付け合成フィルタ８１、及
び(２)音声入力部１から出力される音声信号と第５重み
付け合成フィルタ８１から出力される合成無声音声信号
との差分をとり、その差分値を出力する第３差分器８
２、を付加したことである。

【００９５】上述の構成を具備する音声符号化装置にお
いて、入力された音声を符号化するまでの動作を以下に
詳述する。

【００９６】まず、音声入力部１に音声が入力される
と、その音声入力部１にて変換された音声信号は、ＬＰ
Ｃ分析部２、逆フィルタ３、合成無声音声信号生成部８
０、第２差分器１０ｂ、及び第３差分器１０ｃに夫々出
力される。

【００９７】ＬＰＣ分析部２では、ＬＰＣ分析法に基づ
いて、ＬＰＣパラメータが求められ、このパラメータは
逆フィルタ３、合成有声音声信号生成部７０、合成無声
音声信号生成部８０、及び多重化部１１ｂに出力され
る。

【００９８】逆フィルタ３では、ＬＰＣ分析部２にて分
析されたＬＰＣパラメータに基づいて、入力された音声
の予測残差信号を求める。

【００９９】一方、位相等化処理部４に逆フィルタ３か
ら予測残差信号が出力されると、第１の実施例と同様
に、その予測残差信号のエネルギが集中する個所に疑似
的にピッチパルス列が設定され、これによって、上記予
測残差信号が位相等化変換された位相等化音声残差信
号、及びパルス列の位置を表すピッチパルス位置信号が
合成有声音声信号生成部７０に出力される。

【０１００】図７に示す合成有声音声信号生成部７０で
は、位相等化処理部４から出力されたピッチパルス位置
信号に基づいて、パルスパターン生成部７ａはパルスパ
ターンを生成し、そのパルスパターンを第１乗算器７ｄ
に出力する。第１乗算器７ｄは、有声音用符号選択制御
部７ｈによって選択されたゲインδを上記パルスパター
ンに乗じ、振幅を変更調整する。

【０１０１】また、有声音用適応コードブック７ｂで
は、遅延量Ｌに基づいて過去の駆動音源信号データが出
力され、第２乗算器７ｅは、ゲインβを上記過去の駆動
音源信号データに乗じる。

【０１０２】また、有声音用雑音コードブック７ｃで
は、有声音用符号選択制御部７ｈによって選択されたイ
ンデックスＩに格納された雑音データが読み出され、第
３乗算器７ｆは、有声音用符号選択制御部７ｈによって
選択されたゲインγを上記雑音データに乗じる。

【０１０３】第１加算器７ｇは、第１乗算器７ｄ、第２
乗算器７ｅ、及び第３乗算器７ｆの出力データを加算
し、この出力データは最新の過去の駆動音源データとな
り、有声音用適応コードブック７ｂにフィードバックさ
れ記憶されると共に、第４重み付け合成フィルタ７１に
出力される。

【０１０４】因みに、有声音用適応コードブック７ｂは
初期状態（リセットされた状態）では全く駆動音源デー
タを記憶しておらず、このフィードバックされた時点か
ら有声音用適応コードブック７ｂには最新の過去の駆動
音源データが順次格納されていくことになる。

【０１０５】一方、第４重み付け合成フィルタ７１は、
第１加算器７ｇにて加算された駆動音源データ、及びＬ
ＰＣ分析部２から出力されたＬＰＣパラメータに基づい
て、合成有声音声信号が生成され、第４差分器７２に出
力される。第４差分器７２は、位相等化処理部４から出
力される位相等化音声残差信号と第４重み付け合成フィ
ルタ７１にて生成された合成有声音声信号との差分をと
り、有声音用符号選択制御部７ｈは、その差分値が最も
小さくなるまで、遅延量Ｌ、インデックスＩ、及びゲイ
ンδ、β、γを適宜選択する。これによって、有声音用
適応コードブック７ｂでは、遅延量Ｌに基づいて遅延さ
れた最新の過去の駆動音源データが第２乗算器７ｅに出
力され、ゲインβが乗ぜられ、また、有声音用雑音コー
ドブック７ｃでは、インデックスＩに基づいて選択され
た雑音データが第３乗算器７ｆに出力され、ゲインγが
乗ぜられ、更に第１乗算器７ｄでは、パルスパターン生
成部７ａにて生成されたパルスパターンにゲインδが乗
ぜられる。

【０１０６】この後、第１加算器７ｇは、第１乗算器７
ｄ、第２乗算器７ｅ、及び第３乗算器７ｆの出力データ
を加算し、この出力データは最新の過去の駆動音源デー
タとなり、有声音用適応コードブック７ｂに再びフィー
ドバックされ記憶されると共に、第４重み付け合成フィ
ルタ７１に出力される。この第４重み付け合成フィルタ
７１で生成された合成有声音声信号は第４差分器７２に
出力される。

【０１０７】今、仮に第４差分器７２での差分値が最も
小さくなった場合、有声音用符号選択制御部７ｈは遅延
量Ｌ、インデックスＩ、及びゲインδ、β、γを選択す
ることを中止し、これによって最終的に決定されたピッ
チパルス位置信号、遅延量Ｌ、インデックスＩ、及びゲ
インδ、β、γは第２差分器１０ｂに出力される。而し
て、この第２差分器１０ｂは、音声入力部１から出力さ
れる音声信号と第４重み付け合成フィルタ７１から出力
される合成有声音声信号との差分をとり、この差分値は
比較器１２に出力される。

【０１０８】一方、図８に示す合成無声音声信号生成部
８０における無声音用適応コードブック８ａでは、遅延
量Ｌ’に基づいて過去の駆動音源信号データが読み出さ
れ、一方第４乗算器８ｃは、ゲインβ’を上記過去の駆
動音源信号データに乗じる。

【０１０９】また、無声音用雑音コードブック８ｂで
は、無声音用符号選択制御部８ｆによって選択されたイ
ンデックスＩ’に格納された雑音データが読み出され、
第５乗算器８ｄは、無声音用符号選択制御部８ｆによっ
て選択されたゲインγ’を上記雑音データに乗じる。

【０１１０】第２加算器８ｅは、最初第５乗算器８ｄの
出力データを最新の過去の駆動音源データとし、この駆
動音源データは無声音用適応コードブック８ａにフィー
ドバックされ記憶されると共に、第５重み付け合成フィ
ルタ８１に出力される。

【０１１１】因みに、無声音用適応コードブック８ａは
初期状態（リセットされた状態）では全く駆動音源デー
タを記憶しておらず、このフィードバックされた時点か
ら無声音用適応コードブック８ａには最新の過去の駆動
音源データが順次格納されていくことになる。

【０１１２】第５重み付け合成フィルタ８１では、第２
加算器８ｅにて加算された駆動音源信号、及びＬＰＣ分
析部２から出力されたＬＰＣパラメータに基づいて、合
成無声音声信号が生成され、第５差分器８２に出力され
る。第５差分器８２は、音声入力部１から出力される音
声信号と第５重み付け合成フィルタ８１にて生成された
合成無声音声信号との差分をとり、無声音用符号選択制
御部８ｆは、その差分値が最も小さくなるまで、遅延量
Ｌ’、インデックスＩ’、及びゲインβ’、γ’を選択
する。これによって、無声音用適応コードブック８ａで
は、遅延量Ｌ’に基づいて遅延された最新の過去の駆動
音源データが乗算器８ｃに出力され、ゲインβ’が乗ぜ
られる。また、無声音用雑音コードブック８ｂでは、イ
ンデックスＩ’に基づいて選択された雑音データが乗算
器８ｄに出力され、ゲインγ’が乗ぜられる。

【０１１３】この後、第２加算器８ｅは、第４乗算器８
ｃ、第５乗算器８ｄの出力データを加算し、この出力デ
ータは最新の過去の駆動音源データとして、無声音用適
応コードブック８ａに再びフィードバックされ記憶され
ると共に、第５重み付け合成フィルタ８１に出力され
る。この第５重み付け合成フィルタ８１で生成された合
成無声音声信号は第５差分器８２に出力される。

【０１１４】今、仮に第５差分器８２での差分値が最も
小さくなった場合には、無声音用符号選択制御部８ｆは
遅延量Ｌ’、インデックスＩ’、及びゲインβ’、γ’
の選択することを中止し、これによって最終的に決定さ
れた遅延量Ｌ’、インデックスＩ’、及びゲインβ’、
γ’は第３差分器１０ｃに出力される。而して、この第
２差分器１０ｃは、音声入力部１から出力された音声信
号と第５重み付け合成フィルタ８１から出力された合成
無声音声信号との差分をとり、この差分値を比較器１２
に出力する。

【０１１５】斯くして、合成有声音声信号生成部７０、
合成無声音声信号生成部８０にて夫々合成有声音声信
号、合成無声音声信号が生成され、比較器１２は、第２
差分器１０ｂ、及び第３差分器１０ｃの夫々の差分値を
比較して、差分値の小さい音声信号を選択する選択信号
を選択部１３に出力する。

【０１１６】例えば、いま合成有声音声信号の差分値
が、合成無声音声信号のそれより小さかったとすると、
比較器１２は合成有声音声信号生成部７０に対して、有
声音用適応コードブック７ｂに記憶されている駆動音源
データを合成無声音声信号生成部８０の無声音用適応コ
ードブック８ａに複製するよう指令する。これによっ
て、有声音用適応コードブック７ｂ、無声音用適応コー
ドブック８ａには同一内容の駆動音源データが常に格納
されていることになる。

【０１１７】これに対して、合成無声音声信号の差分値
が、合成有声音声信号のそれより小さかったとすると、
比較器１２は合成無声音声信号生成部８０に対して、無
声音用適応コードブック８ａに記憶されている駆動音源
データを合成有声音声信号生成部７０の有声音用適応コ
ードブック７ｂに複製するよう指令する。これによっ
て、無声音用適応コードブック８ａ、有声音用適応コー
ドブック７ｂには同一内容の駆動音源データが常に格納
されていることになる。

【０１１８】これら適応コードブックに格納されている
内容を他方の適応コードブックに複製する理由は第１の
実施例と同じであるので、ここでは割愛する。

【０１１９】選択部１３には、合成有声音声信号生成部
７０、合成無声音声信号生成部８０からピッチパルス位
置、遅延量Ｌ、インデックスＩ、ゲインδ、β、γ、及
び遅延量Ｌ’、インデックスＩ’、ゲインβ’、γ’が
夫々出力され、選択部１３は比較器１２から出力される
選択信号を受けて、選択されたピッチパルス位置、遅延
量Ｌ、インデックスＩ、ゲインδ、β、γ、又は遅延量
Ｌ’、インデックスＩ’、ゲインβ’、γ’、及びその
選択信号を符号化して、多重化部１１ｂに出力する。

【０１２０】多重化部１１ｂは、選択部１３から出力さ
れる符号化データ、及びＬＰＣ分析部２から出力される
ＬＰＣパラメータを多重化出力する。

【０１２１】その多重化データは、有線、無線の通信路
を介して伝送されたり、或るいはメモリ、フロッピディ
スク等の記憶装置に記憶される。

【０１２２】また、その多重化データは、第１の実施例
の図４に示す音声復号化装置に出力されて音声再生され
ることが可能であり、この場合、その復号化方式は第１
の実施例に示した復号方式と全く同一であるので、ここ
ではその説明を割愛する。

【０１２３】ここで、図６の音声符号化装置にて用いら
れる情報のビット配分としては、表２に示す通りであ
り、

【０１２４】

【表２】

【０１２５】これらの情報が図４の音声復号化装置に伝
達されて、音声を復号再生するのである。

【０１２６】

【０１２７】本発明の第２の音声符号化装置によれば、
入力された音声を符号化出力する場合に、予測残差信号
に基づいて、その音声の種類、即ち有声音、又は無声音
の区別を行うのではなく、合成有声音声信号生成部にて
疑似的なピッチパルスを設定することによって合成有声
音声信号を生成し、また合成無声音用信号生成部にて上
記音声に基づいて合成無声音声信号を生成し、これらの
音声信号のうち、比較器は入力された音声に最も類似す
る音声信号を選択するので、低ビットレートであって
も、効率よく符号化を行うことができる。

【図面の簡単な説明】

【図７】本発明の第２の実施例に係る合成有声音声信号
生成部７０の構成図

【図８】本発明の第２の実施例に係る合成無声音声信号
生成部８０の構成図

【符号の説明】１音声入力部２ＬＰＣ分析部３逆フィルタ４位相等化処理部６第１重み付け合成フィルタ７有声音声駆動音源生成部８無声音声駆動音源生成部７０合成有声音声信号生成部８０合成無声音声信号生成部７ａパルスパターン生成部７ｂ有声音用適応コードブック７ｃ有声音用雑音コードブック８ａ無声音用適応コードブック８ｂ無声音用雑音コードブック９第２重み付け合成フィルタ１２比較器１３選択部１１ａ多重化部２０多重分離部

【手続補正２】

【補正対象書類名】図面

【補正対象項目名】図６

【補正方法】変更

【補正内容】

【図６】

Claims

【特許請求の範囲】

【請求項１】入力音声信号から音声のピッチ周期を抽
出するピッチ抽出処理部と、該入力音声信号の有声、又
は無声を判定する有声／無声判定処理部と、上記ピッチ
抽出処理部で得られるピッチ周期情報、及び有声／無声
判定処理部にて判定された判定結果情報に基づいて駆動
音源信号を選択的に生成する駆動音源生成部と、該音源
生成処理部にて生成された駆動音源信号に基づいて音声
信号を合成出力する音声合成処理部と、該音声合成処理
部にて合成された合成音声信号と入力された音声信号と
を比較して最も誤差が少ない時の駆動音源信号に対応す
るコードを選択出力するコード出力処理部と、からなる
音声符号化装置に於て、有声音声の場合、上記駆動音源生成部では、ピッチ周期
に対応したパルスパターン信号と最新の過去の所定時間
に記憶された駆動音源信号と雑音信号との３者のそれぞ
れに所定のゲインを乗じて混合してなる有声駆動音源を
使用し、無声音声の場合、上記駆動音源生成部では、最新の過去
の所定時間に記憶された駆動音源信号と雑音信号との２
者のそれぞれに所定のゲインを乗じて混合してなる無声
駆動音源を使用することを特徴とした音声符号化装置。
【請求項２】有声音声の場合の最新の過去の所定時間
に記憶された駆動音源信号には、この駆動音源信号に対
応するパルスパターン信号成分が除外されていることを
特徴とした請求項１記載の音声符号化装置。
【請求項３】駆動音源の先行するピッチパルス位置か
らピッチ周期だけ離れた位置近傍で、残差信号の振幅値
が所定の値より大きくなる後続するピッチパルス位置を
選択し、該選択が不可能の場合には位相等化残差のピー
ク位置を後のピッチパルス位置として、これら先後両パ
ルス間隔をピッチ周期として抽出することを特徴とした
請求項１記載の音声符号化装置。
【請求項４】上記駆動音源生成部で使用される最新の
過去の所定時間に記憶された駆動音源信号は、有声音用
適応コードブックに収納されており、有声音声の場合、
ピッチ周期近傍の適数種類の時間範囲に対してのみ駆動
音源信号が選択的に使用されることを特徴とした請求項
１記載の音声符号化装置。
【請求項５】入力された音声の音声信号を符号化する
と共に、該音声信号のＬＰＣパラメータを算出する分析
部と、上記音声信号のピッチ周期を抽出する位相等化処
理部と、該位相等化処理部にて抽出されたピッチ周期、
及び上記ＬＰＣパラメータに基づいて合成有声音声信号
を生成する有声音声駆動音源生成部と、上記音声信号、
及び上記ＬＰＣパラメータに基づいて合成無声音声信号
を生成する無声音声駆動音源生成部と、上記有声音声駆
動音源生成部、及び無声音声駆動音源生成部によって生
成された合成有声音声信号、及び合成無声音声信号と上
記音声信号とを夫々比較する比較器と、該比較器による
比較結果に基づいて、合成有声音声信号、又は合成無声
音声信号のどちらか一方の音声信号を選択する選択部
と、該選択部によって選択された音声信号、及び上記分
析部にて分析されたＬＰＣパラメータを多重化出力する
多重化部と、を具備する音声符号化装置に於て、上記選択部は、上記合成有声音声信号、及び合成無声音
声信号と上記音声信号とを夫々比較し、上記音声信号と
の誤差が小さい合成音声信号を選択することを特徴とし
た音声符号化装置。
【請求項６】上記有声音声駆動音源生成部は、上記ピ
ッチ周期に基づいてパルスパターンを生成するパルスパ
ターン生成部、最新の過去の有声音用駆動音源データを
収納している有声音用適応コードブック、雑音データを
記憶している有声音用雑音コードブック、並びに上記パ
ルスパターン生成部、有声音用適応コードブック、及び
有声音用雑音コードブックの出力データに基づいて合成
有声音声信号を生成する合成フィルタからなり、上記合
成有声音声信号は、上記適応コードブック、及び雑音コ
ードブックの出力データを加算することにより生成され
ることを特徴とした請求項５記載の音声符号化装置。
【請求項７】上記無声音声駆動音源生成部は、最新の
過去の無声音用駆動音源データを記憶している無声音用
適応コードブック、雑音データを記憶している無声音用
雑音コードブック、並びに上記無声音用適応コードブッ
ク、及び無声音用雑音コードブックの出力データに基づ
いて合成無声音声信号を生成する合成フィルタからな
り、上記合成無声音声信号は、上記無声音用適応コード
ブック、及び無声音用雑音コードブックの出力データを
加算することにより生成されることを特徴とした請求項
５記載の音声符号化装置。
【請求項８】上記有声音声駆動音源生成部にて合成さ
れた合成有声音声信号が、上記選択部によって選択され
た場合には、上記有声音用適応コードブックに記憶され
ている有声音用駆動音源データが、上記無声音用適応コ
ードブックに複製され、一方、上記無声音声駆動音源生
成部にて合成された合成無声音声信号が、上記選択部に
よって選択された場合には、上記無声音用適応コードブ
ックに記憶されている無声音用駆動音源データが、上記
有声音用適応コードブックに複製されることを特徴とし
た請求項６、又は７記載の音声符号化装置。