JPH0612098A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH0612098A
JPH0612098A JP4348880A JP34888092A JPH0612098A JP H0612098 A JPH0612098 A JP H0612098A JP 4348880 A JP4348880 A JP 4348880A JP 34888092 A JP34888092 A JP 34888092A JP H0612098 A JPH0612098 A JP H0612098A
Authority
JP
Japan
Prior art keywords
voice
signal
voiced
unvoiced
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4348880A
Other languages
English (en)
Inventor
Mitsuo Fujimoto
光男 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP4348880A priority Critical patent/JPH0612098A/ja
Priority to US08/031,808 priority patent/US5488704A/en
Priority to KR1019930003868A priority patent/KR100275429B1/ko
Publication of JPH0612098A publication Critical patent/JPH0612098A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Abstract

(57)【要約】 【構成】 本発明はCELP等の音声符号化装置であっ
て、駆動音源生成処理に於て、有声音声の場合、ピッチ
周期に対応したパルスパターン信号と最新の過去の所定
時間に記憶された駆動音源信号と雑音信号との三者をそ
れぞれに所定のゲインを乗じて加算してなる有声駆動音
源を生成し、無声音声の場合、最新の過去の所定時間に
記憶された駆動音源信号と雑音信号との二者をそれぞれ
に所定のゲインを乗じて加算してなる無声駆動音源を生
成するものである。 【効果】 本発明の音声符号化装置によれば、符号化す
る音声が有声か無声かの情報に基づいて、その駆動音源
の生成処理を変更するものであるので、特に、準周期的
なピッチパルスを低ビットで有効に検出することができ
ると共に、有声音声駆動音源信号生成処理に於ける計算
量の軽減がはかれ、全体のビットレートの低減を図りな
がら、再生音声の音質向上が可能になる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号を圧縮して符
号化する音声符号化装置に関する。
【0002】
【従来の技術】近年、音声信号を圧縮して符号化する音
声符号化技術の研究が盛んに行われており、移動体通信
を初めとする通信分野や音声蓄積分野において、低ビッ
トレートの音声符号化装置が急速に実用化されつつあ
る。
【0003】現在、実用化されている低ビットレートの
音声符号化方式には8kbps程度のCELP方式
(“CODE−EXCITED LINEAR PREDICTION(CELP):HIGH
−QUALITYSPEECH AT VERY LOW BIT RATES”Proc.ICASSP
pp937-940(1985))があり、更にモトローラ社が開発し
たVSELP(VECTOR SUM EXCITED LINEAR PREDICTIO
N)方式の改良が試みられている。
【0004】このCELP方式を採用する音声符号化装
置は、基本的に以下のステップに従って実現される。即
ち、 所定の駆動音源信号を生成する駆動音源生成処理ステ
ップ、 駆動音源生成処理ステップにて生成された駆動音源信
号に基づいて音声信号を合成出力する音声合成処理ステ
ップ、及び 音声合成処理ステップにて合成された合成音声信号と
入力された音声信号とを比較して最も誤差が少ない時の
駆動音源信号に対応するコードを選択出力するコード出
力処理ステップ、である。
【0005】しかしながら、4kbps以下の低ビット
レート音声符号化方式になると、このようなCELP、
VSELP方式では十分な音声品質が得られていないの
が実情であった。この原因は、上述のステップにおけ
る有声音における準周期的なピッチパルスの再現が不十
分になるため、音質が劣化するものと考えられている。
【0006】
【発明が解決しようとする課題】本発明は、上述の点に
鑑みなされたものであり、準周期的なピッチパルスの再
現を十分実現できる低ビットレートの音声符号化装置を
提供することを目的とする。
【0007】
【課題を解決するための手段】本発明の第1の音声符号
化装置は、入力音声信号から音声のピッチ周期を抽出す
るピッチ抽出処理部と、該入力音声信号の有声、又は無
声を判定する有声/無声判定処理部と、上記ピッチ抽出
処理部で得られるピッチ周期情報、及び有声/無声判定
処理部にて判定された判定結果情報に基づいて駆動音源
信号を選択的に生成する駆動音源生成部と、該音源生成
処理部にて生成された駆動音源信号に基づいて音声信号
を合成出力する音声合成処理部と、該音声合成処理部に
て合成された合成音声信号と入力された音声信号とを比
較して最も誤差が少ない時の駆動音源信号に対応するコ
ードを選択出力するコード出力処理部と、からなる音声
符号化装置に於て、有声音声の場合、上記駆動音源生成
部では、ピッチ周期に対応したパルスパターン信号と最
新の過去の所定時間に記憶された駆動音源信号と雑音信
号との3者のそれぞれに所定のゲインを乗じて混合して
なる有声駆動音源を使用し、一方無声音声の場合、上記
駆動音源生成部では、最新の過去の所定時間に記憶され
た駆動音源信号と雑音信号との2者のそれぞれに所定の
ゲインを乗じて混合してなる無声駆動音源を使用するも
のである。
【0008】また、本発明の第2の音声符号化装置は、
入力された音声の音声信号を符号化すると共に、該音声
信号のLPCパラメータを算出する分析部と、上記音声
信号のピッチ周期を抽出する位相等化処理部と、該位相
等化処理部にて抽出されたピッチ周期、及び上記LPC
パラメータに基づいて合成有声音声信号を生成する有声
音声駆動音源生成部と、上記音声信号、及び上記LPC
パラメータに基づいて合成無声音声信号を生成する無声
音声駆動音源生成部と、上記有声音声駆動音源生成部、
及び無声音声駆動音源生成部によって生成された合成有
声音声信号、及び合成無声音声信号と上記音声信号とを
夫々比較する比較器と、該比較器による比較結果に基づ
いて、合成有声音声信号、又は合成無声音声信号のどち
らか一方の音声信号を選択する選択部と、該選択部によ
って選択された音声信号、及び上記分析部にて分析され
たLPCパラメータを多重出力する多重化部と、を具備
する音声符号化装置に於て、上記選択部は、上記合成有
声音声信号、及び合成無声音声信号と上記音声信号とを
夫々比較し、上記音声信号との誤差が小さい合成音声信
号を選択するものである。
【0009】
【作用】
(1)入力音声信号から音声のピッチ周期を抽出し、該ピ
ッチ周期に基づいて、入力音声信号の有声、又は無声の
判定を行い、上記ピッチ周期の抽出処理で得られるピッ
チ周期情報、及び有声/無声判定処理の判定結果情報に
基づいて駆動音源信号を選択的に生成し、上記有声/無
声の判定結果が有声の場合、ピッチ周期に対応したパル
スパターン信号と最新の過去の所定時間に記憶された駆
動音源信号と雑音信号との3者のそれぞれに所定のゲイ
ンを乗じた後、加算してなる第1の駆動音源を生成し、
一方有声/無声の判定結果が無声の場合、最新の過去の
所定時間に記憶された駆動音源信号と雑音信号との2者
のそれぞれに所定のゲインを乗じて加算してなる第2の
駆動音源を生成する。
【0010】この後、上記第1の駆動音源、又は第2の
駆動音源からなる信号に基づいて音声信号を合成出力
し、この合成音声信号と入力された音声信号とを比較し
て最も誤差が少ない時の駆動音源信号に対応するコー
ド、及び有声/無声の判定結果を選択出力する。
【0011】(2)入力音声信号から音声のピッチ周期を
抽出し、該ピッチ周期に基づいて駆動音源信号を生成
し、上記ピッチ周期に対応したパルスパターン信号と最
新の過去の所定時間に記憶された駆動音源信号と雑音信
号との3者のそれぞれに所定のゲインを乗じた後、加算
してなる第1の駆動音源を生成すると共に、最新の過去
の所定時間に記憶された駆動音源信号と雑音信号との2
者のそれぞれに所定のゲインを乗じて加算してなる第2
の駆動音源を生成する。
【0012】この後、上記第1の駆動音源、並びに第2
の駆動音源からなる信号に基づいて音声信号を夫々合成
出力し、これらの合成音声信号と入力された音声信号と
を比較して最も誤差が少ない時の駆動音源信号に対応す
るコード、及び有声/無声の判定結果を選択出力する。
【0013】
【実施例】
[第1の実施例]本発明の第1の実施例の音声符号化装
置の処理ステップの一例を以下に列挙する。
【0014】ステップ1[ピッチ抽出処理]:入力音声
信号から音声のピッチ周期を抽出、 ステップ2[有声/無声判定処理]:入力音声信号の有
声、又は無声を判定、 ステップ3[駆動音源生成処理]:上記ピッチ抽出処理
で得られるピッチ周期情報、及び有声/無声判定処理に
て判定された判定結果情報に基づいて駆動音源信号を選
択的に生成し、有声/無声の判定結果が有声の場合、ピ
ッチ周期に対応したパルスパターン信号と最新の過去の
所定時間に記憶された駆動音源信号と雑音信号との3者
のそれぞれに所定のゲインを乗じた後、加算してなる第
1の駆動音源を生成し、又は有声/無声の判定結果が無
声の場合、最新の過去の所定時間に記憶された駆動音源
信号と雑音信号との2者のそれぞれに所定のゲインを乗
じて加算してなる第2の駆動音源を生成、 ステップ4[音声合成処理]:該駆動音源生成処理にて
生成された第1の駆動音源、又は第2の駆動音源からな
る信号に基づいて音声信号を合成出力、 ステップ5[符号化出力処理]:該音声合成処理にて合
成された合成音声信号と入力された音声信号とを比較し
て最も誤差が少ない時の駆動音源信号に対応するコー
ド、及び有声/無声の判定結果を選択出力。
【0015】図1は本発明の第1の実施例の音声符号化
装置の概略構成図の一例を示す。
【0016】同図に於て、1はマイクロフォン等から入
力された音声をディジタルの音声信号に変換する音声入
力部、2は入力音声の音声信号を線形予測(LPC)分
析してLPCパラメータを求めるLPC分析部、3は入
力音声と同じ音声信号を合成するための線形予測型の合
成フィルタ機能と逆のフィルタ機能を備えた逆フィルタ
であり、この逆フィルタ3は上記LPC分析部2で得ら
れるLPCパラメータに基づいて逆フィルタ特性が制御
され、入力された音声の予測残差信号を出力する。
【0017】4は上記逆フィルタ3から得られる音声の
予測残差信号に対して位相等化処理を施す位相等化処理
部であり、この位相等化処理部4は音声信号を効率よく
符号化できるように、その音声信号のエネルギが集中す
る位置に疑似的にパルス列を設定することによって、予
測残差信号の位相を近似的に零にし、これらのパルス列
のピッチパルス位置信号、及び位相等化音声残差信号を
出力する。
【0018】5は逆フィルタ3から得られる予測残差信
号に基づいて音声のピッチ周期を算出するピッチ周期算
出機能と、逆フィルタ3から得られる予測残差信号に基
づいて音声の有声、又は無声を判定する有声/無声判定
回路機能を備えた有声/無声判定部、6は位相等化処理
部4から得られる位相等化処理された位相等化音声残差
信号を駆動音源として合成音声信号を得る第1重み付け
合成フィルタ、7は位相等化処理部4の位相等化処理に
よって得られたピッチパルス位置に立てられたインパル
スに基づいて有声音声駆動音源を生成する有声音声駆動
音源生成部、8は主として雑音成分に基づいて、無声音
声駆動音源を生成する無声音声駆動音源生成部、9はL
PC分析部2から出力されるLPCパラメータ、並びに
有声音声駆動音源生成部7にて生成された有声音声駆動
音源、又は無声音声駆動音源生成部8にて生成された無
声音声駆動音源に基づいて、有声合成音声、又は無声合
成音声を生成する第2重み付け合成フィルタ、10aは
第1重み付け合成フィルタ6から出力される合成音声信
号と第2重み付け合成フィルタ9から出力される有声合
成音声信号、又は無声合成音声信号との差分をとる第1
差分器、11aは有声音声駆動音源生成部7にて符号化
された有声音声駆動音源、又は無声音声駆動音源生成部
8にて符号化された無声音声駆動音源を多重化出力する
多重化部である。
【0019】尚、ここで述べる位相等化処理部4は、日
本音響学会講演論文集(昭和60年9月〜10月)の論
文「位相等化音声の符号化におけるピッチ周期の利用」
に論じられているように、ピッチパルス位置を周期モデ
ルを利用して能率よく符号化するのに適している。位相
等化処理部4のインパルス応答は、f(m)=e(t 0
−m)となり、この場合のe(m)は予測残差サンプル
である。基準時点t0、すなわちピッチパルス位置は、
位相等化残差のピーク位置により逐次的に決定される。
【0020】ただし、ピーク探索範囲を直前のピッチパ
ルス位置からピッチ周期だけ離れた位置の前後数サンプ
ルに限定している。
【0021】次に、図2は、第1の実施例の有声音声駆
動音源生成部7を、また図3は無声音声駆動音源生成部
8の概略構成を示したものである。
【0022】有声音声の符号化に寄与する有声音声駆動
音源生成部7は、主としてパルスパターン生成部7a、
有声音用適応コードブック7b、有声音用雑音コードブ
ック7c、及び有声音用符号選択制御部7hからなり、
パルスパターン生成部7a、有声音用適応コードブック
7b、及び有声音用雑音コードブック7cの3出力のそ
れぞれに所定のゲインを乗じた後、それらを加算して有
声音声駆動音源を生成している。
【0023】パルスパターン生成部7aは、位相等化処
理部4から出力されたピッチパルス位置信号に基づい
て、ピッチパルスを生成する。有声音用適応コードブッ
ク7bは、最新の過去の駆動音源データ、即ち後述する
第1加算器7gによって加算された出力データを所定時
間分記憶するバッファメモリの一種である。
【0024】有声音用雑音コードブック7cは予め決め
られた複数個の雑音データを記憶する機能を有する。
【0025】有声音用符号選択制御部7hは、第1差分
器10aの差分値、具体的には二乗誤差値が最も小さく
なるように、有声音用適応コードブック7bの遅延量
L、有声音用雑音コードブック7cのインデックスI、
及びゲインδ、β、γの値を変更調整し、第1差分器1
0aの差分値が最も小さくなったときの遅延量L、イン
デックスI、及びゲインδ、β、γ、並びにピッチパル
ス位置信号を符号化データとして、多重化部11aに出
力する機能を有する。
【0026】ここで、遅延量Lとは、過去の駆動音源デ
ータを有効に活用するために、有声音用適応コードブッ
ク7bに格納されている最新の過去の駆動音源データを
時間的にずらせた場合の時間的な長さをいい、インデッ
クスIとは、有声音用雑音コードブック7cに格納され
ている複数個の雑音データを選択する際の指標を示し、
また、ゲインδ、β、γとは、ピッチパルスの振幅、有
声音用適応コードブック7bに格納されている過去の駆
動音源データの示す波形の振幅、及び有声音用雑音コー
ドブック7cに格納されている雑音データの示す波形の
振幅の巾を夫々変更調整する利得である。
【0027】一方、図3に示す無声音声の符号化に寄与
する無声音声駆動音源生成部8は、主として無声音用適
応コードブック8a、無声音用雑音コードブック8b、
及び無声音用符号選択制御部8fからなり、無声音用適
応コードブック8a、及び無声音用雑音コードブック8
bの2出力のそれぞれに所定のゲインを乗じた後、それ
らを加算して無声音声駆動音源を生成している。
【0028】無声音用適応コードブック8aは、最新の
過去の駆動音源データ、即ち後述する第2加算器8eに
よって加算された出力データを所定時間分記憶するバッ
ファメモリの一種である。
【0029】無声音用符号選択制御部8fは、第1差分
器10aの差分値、具体的には二乗誤差値が最も小さく
なるように、無声音用適応コードブック8aの遅延量
L’、無声音用雑音コードブック8bのインデックス
I’、及びゲインβ’、γ’の値を変更調整し、第1差
分器10aの差分値が最も小さくなったときの遅延量
L’、インデックスI’、及びゲインβ’、γ’を符号
化データとして、多重化部11aに出力する機能を有す
る。
【0030】尚、無声音声の場合には、切換手段Sw1
により、無声音声駆動音源生成部8が選択されるので、
通常のCELPと全く同様の構成となる。
【0031】第2重み付け合成フィルタ9は、有声音声
駆動音源生成部7(図2参照)、或るいは無声音声駆動
音源生成部8(図3参照)からの出力を受けて音声信号
を合成する機能を有し、第1差分器10aは、第1重み
付け合成フィルタ6にて合成された合成音声信号と、第
2重み付け合成フィルタ9にて合成された合成音声信号
とを比較する第1差分器である。而して、第1重み付け
合成フィルタ6にて合成された合成音声信号に対して最
も類似した第2重み付け合成フィルタ9の合成音声信号
が二乗誤差最小化の手法で特定され、このときの信号が
駆動音源信号となる。
【0032】多重化部11aは、二乗誤差最小化の手法
によって特定された駆動音源信号の、無声音用適応コー
ドブック8aの遅延量L’、無声音用雑音コードブック
8bのインデックスI’、及びゲインβ’、γ’の値、
又は有声音用適応コードブック7bの遅延量L、インデ
ックスI、及びゲインδ、β、γを符号化データとし
て、多重化出力する。
【0033】ここで、遅延量L’とは、過去の駆動音源
データを有効に活用するために、無声音用適応コードブ
ック8aに格納されている最新の過去の駆動音源データ
を時間的にずらせた場合の時間的な長さをいい、インデ
ックスI’とは、雑音コードブック8bに格納されてい
る複数個の雑音データを選択する際の指標を示し、ま
た、ゲインβ’、γ’とは、無声音用適応コードブック
8aに格納されている過去の駆動音源データの示す波形
の振幅、及び無声音用雑音コードブック8bに格納され
ている雑音データの示す波形の振幅の巾を夫々変更調整
する利得である。
【0034】ここで述べる有声音用適応コードブック7
b,無声音用適応コードブック8a、並びに有声音用雑
音コードブック7c、及び無声音用雑音コードブック8
bは従来のCELP音声符号化方式で用いられるものと
基本的に同じものであるが、ここでは両コードブック部
を有声用と無声用に分担配置し、使い分けるように成し
た点で異なり、更に、有声音用側にはパルスパターン生
成部7aが追加装備されている。
【0035】図4は、図1乃至図3に示す音声符号化装
置にて符号化された多重化データを再生復号化する音声
復号化装置の概略構成図である。
【0036】図4に示す有声音声駆動音源再生部21
は、図2に示す有声音声駆動音源生成部7と、また無声
音声駆動音源再生部22は、図3に示す無声音声駆動音
源生成部8と全く同一機能を有するものであるが、唯一
異なる点は、有声音用符号選択制御部7h、有声音用符
号選択制御部8fの構成を持たない点である。
【0037】図4において、20は音声符号化装置の多
重化部11aから出力された多重化データを受信する多
重分離部、23は音声符号化装置から出力されたLPC
パラメータに基づいてフィルタ特性が設定される合成フ
ィルタ、24は該合成フィルタ23の音声合成出力を波
形整形するポストフィルタである。
【0038】上述の構成を具備する音声符号化装置にお
いて入力された音声を符号化した後、図4に示す音声復
号化装置において復号化することによって音声を再生す
るまでの動作を以下に説明する。
【0039】まず、図1において、音声入力部1に音声
が入力されると、その音声入力部1にて変換された音声
信号は、LPC分析部2、及び逆フィルタ3に夫々出力
される。
【0040】LPC分析部2では、LPC分析法に基づ
いて、LPCパラメータが求められ、このパラメータは
逆フィルタ3、第1重み付け合成フィルタ6、第2重み
付け合成フィルタ9、及び多重化部11aに夫々出力さ
れる。
【0041】逆フィルタ3では、LPC分析部2にて分
析されたLPCパラメータに基づいて、入力された音声
の予測残差信号を求め、この予測残差信号を位相等化処
理部4、及び有声/無声判定部5に出力する。
【0042】位相等化処理部4に逆フィルタ3から予測
残差信号が入力されると、その音声信号のエネルギが集
中する個所に疑似的にピッチパルス列が設定され、これ
によって、上記音声信号は位相等化変換され、この音声
信号の位相等化音声残差信号は第1重み付け合成フィル
タ6に出力されると共に、パルス列の位置を表すピッチ
パルス位置信号は有声音声駆動音源生成部7に出力され
る。
【0043】一方、有声/無声判定部5は入力された予
測残差信号に基づいて、音声入力部1に入力された音声
が有声であると判定した場合には、図2の切換手段Sw
1は有声音声駆動音源生成部7側に、又は音声入力部1
に入力された音声が無声であると判定した場合には、切
換手段Sw1は無声音声駆動音源生成部8側に切り換え
られる。
【0044】今、切換手段Sw1が有声音声駆動音源生
成部7側に切り換わっている場合、図2に示すように有
声音声駆動音源生成部7において、位相等化処理部4か
ら出力されたピッチパルス位置信号に基づいて、パルス
パターン生成部7aはパルスパターンを生成し、そのパ
ターンを第1乗算器7dに出力する。第1乗算器7d
は、有声音用符号選択制御部7hによって選択されたゲ
インδを上記パルスパターンに乗じ、振幅を変更調整す
る。
【0045】また、有声音用雑音コードブック7cで
は、有声音用符号選択制御部7hによって選択されたイ
ンデックスIに格納された雑音データが読み出され、第
3乗算器7fは、有声音用符号選択制御部7hによって
選択されたゲインγを上記雑音データに乗じる。
【0046】これによって、第1加算器7gは、第1乗
算器7d、第1乗算器7fの出力データを加算し、この
出力データは最新の過去の駆動音源信号データとなり、
有声音用適応コードブック7bにフィードバックされ記
憶されると共に、第2重み付け合成フィルタ9に出力さ
れる。
【0047】因みに、有声音用適応コードブック7bは
初期状態(リセットされた状態)では全く駆動音源デー
タを記憶しておらず、このフィードバックされた時点か
ら有声音用適応コードブック7bには最新の過去の駆動
音源データが順次格納されていくことになる。
【0048】第2重み付け合成フィルタ9では、第1加
算器7gにて加算された駆動音源データ、及びLPC分
析部2から出力されたLPCパラメータに基づいて、合
成有声音声信号が生成され、第1差分器10aに出力さ
れる。第1差分器10aでは、第1重み付け合成フィル
タ6から出力される合成音声信号と第2重み付け合成フ
ィルタ9にて生成された合成有声音声信号との差分をと
り、有声音用符号選択制御部7hは、その差分値が最も
小さくなるまで、遅延量L、インデックスI、及びゲイ
ンδ、β、γを繰り返して選択する。これに従って、有
声音用適応コードブック7bでは、遅延量Lに基づいて
遅延された最新の過去の駆動音源データが第2乗算器7
eに出力され、ゲインβが乗ぜられる。また、有声音用
雑音コードブック7cでは、インデックスIに基づいて
選択された雑音データが第3乗算器7fに出力され、ゲ
インγが乗ぜられる。一方、第1乗算器7dでは、パル
スパターン生成部7aにて生成されたパルスパターンに
ゲインδを乗じる。
【0049】この結果、第1加算器7gは、第1乗算器
7d、第2乗算器7e、及び第3乗算器7fの出力デー
タを加算し、この出力データは最新の過去の駆動音源信
号となり、有声音用適応コードブック7bに再びフィー
ドバックされ記憶される。
【0050】而して、有声音用符号選択制御部7hは、
最終的に決定された、有声音声適応コードブック7bの
遅延量L、有声音用雑音コードブック7cのインデック
スI、及びゲインδ、β、γ、並びにピッチパルス位置
信号を符号化して、多重化部11aに出力する。
【0051】以上が、切換手段Sw1が有声音声駆動音
源生成部7側に切り換わったときの有声音声駆動音源生
成部7の処理手順であるが、次に切換手段Sw1が無声
音声駆動音源生成部8側に切り換わったときの無声音声
駆動音源生成部8の処理手順を説明する。
【0052】今、切換手段Sw1が無声音声駆動音源生
成部8側に切り換わっている場合、図3に示すように無
声音声駆動音源生成部8の無声音用雑音コードブック8
bでは、無声音用符号選択制御部8fによって選択され
たインデックスI’に格納された雑音データが読み出さ
れ、第5乗算器8dは、無声音用符号選択制御部8fに
よって選択されたゲインγ’を上記雑音データに乗じ
る。
【0053】これによって、第2加算器8eは、第5乗
算器8dの出力データを最新の過去の駆動音源データと
して、無声音用適応コードブック8aにフィードバック
され記憶されると共に、第2重み付け合成フィルタ9に
出力される。
【0054】因みに、無声音用適応コードブック8aは
初期状態(リセットされた状態)では全く駆動音源デー
タを記憶しておらず、この時点から無声音用適応コード
ブック8aには最新の過去の駆動音源データが順次格納
されていくことになる。
【0055】一方、第2重み付け合成フィルタ9は、第
2加算器8eにて加算された駆動音源データ、及びLP
C分析部2から出力されたLPCパラメータに基づい
て、合成無声音声信号が生成され、第1差分器10aに
出力される。第1差分器10aは、第1重み付け合成フ
ィルタ6から出力される合成音声信号と第2重み付け合
成フィルタ9にて生成された合成無声音声信号との差分
をとり、無声音用符号選択制御部8fは、この差分値に
応じて、この差分値が最も小さくなるまで、遅延量
L’、インデックスI’、及びゲインβ’、γ’を繰り
返して選択する。これに従って、無声音用適応コードブ
ック8aでは、遅延量L’に基づいて遅延された最新の
過去の駆動音源データが第4乗算器8cに出力され、ゲ
インβ’が乗ぜられる。また、無声音用雑音コードブッ
ク8bでは、インデックスI’に基づいて選択された雑
音データが第2乗算器8eに出力され、ゲインγ’が乗
ぜられる。
【0056】この結果、第2加算器8eは、第4乗算器
8c、及び第5乗算器8dの出力データを加算し、この
出力データは最新の過去の駆動音源信号となり、無声音
用適応コードブック8aに再びフィードバックされ記憶
される。
【0057】而して、無声音用符号選択制御部8fは、
最終的に決定された、無声音声適応コードブック8aの
遅延量L’、無声音用雑音コードブック8bのインデッ
クスI’、及びゲインβ’、γ’を符号化して、多重化
部11aに出力する。
【0058】このようにして、多重化部11aは、有声
音声駆動音源生成部7から出力された遅延量L、インデ
ックスI、ゲインδ、β、γ、及びピッチパルス位置信
号からなる符号化データ、又は無声音声駆動音源生成部
8から出力された遅延量L’、インデックスI’、及び
ゲインβ’、γ’からなる符号化データと共に、LPC
分析部2から入力されたLPCパラメータを多重化デー
タとして、後述する音声復号化装置の多重分離部20に
出力する。
【0059】ところで、多重化部11aから出力された
多重化データを復号する際の復号方式を図4を参照し乍
ら説明する。
【0060】多重分離部20に多重化部11aから多重
化データが入力されると、その多重分離部20はその多
重化データに有声音声であるとの判定データが含まれて
いれば、有声/無声判定データ送信路を介して、切換手
段Sw2を有声音声駆動音源再生部21側に切り換える
指令を行う。
【0061】因みに、初期状態(リセットされた状態)
においては、有声音用雑音コードブック21c、及び無
声音用雑音コードブック22bには予め有声音用雑音コ
ードブック7c、及び無声音用雑音コードブック8bと
同一の雑音データが格納されているが、有声音用適応コ
ードブック21b、及び無声音用適応コードブック22
aには何の駆動音源データも格納されていない。
【0062】この状態から、まず有声音声駆動音源再生
部21で有声音声を復号化する処理を以下に説明する。
【0063】多重化データが多重分離部20に入力され
ると、多重化データの各々のピッチパルス位置信号、遅
延量L、インデックスIが、夫々パルスパターン生成部
21a、有声音用適応コードブック21b、及び有声音
用雑音コードブック21cに入力されると共に、ゲイン
δ、β、γが、夫々第6乗算器21d、第7乗算器21
e、第8乗算器21fに入力される。
【0064】パルスパターン生成部21aはピッチパル
ス位置信号に基づいて、パルスパターンを生成し、その
パターンを第6乗算器21dに出力し、この第6乗算器
21dは、多重化データのゲインδをパルスパターンに
乗じ、振幅を変更調整する。
【0065】これと共に、有声音用雑音コードブック2
1cはインデックスIに基づいて、雑音データを第8乗
算器21fに出力し、この第8乗算器21fは、多重化
データのゲインγを雑音データに乗じ、振幅を変更調整
する。第3加算器21gは、第6乗算器21d、及び第
8乗算器21fの出力データを加算する。この出力デー
タは切換手段Sw2が有声音声駆動音源再生部21に切
り換わっている場合には、有声音用適応コードブック2
1bに書き替えられ乍ら記憶されていく。
【0066】従って、有声音声駆動音源再生部21は、
最終的に多重化データに対応した復号化データを合成フ
ィルタ23に出力し、この合成フィルタ23では、LP
Cパラメータに基づいて再生された後、ポストフィルタ
24にて波形整形され、図示しないスピーカ等に出力さ
れる。
【0067】次に、切換手段Sw2が無声音声駆動音源
再生部22側に切り換わっている場合に、その無声音声
駆動音源再生部22で無声音声を復号化する処理を以下
に説明する。
【0068】多重化データが多重分離部20に入力され
ると、多重化データの各々の遅延量L’、インデックス
I’が、夫々無声音用適応コードブック22a、及び無
声音用雑音コードブック22bに入力されると共に、ゲ
インβ’、γ’が、夫々第9乗算器22c、第10乗算
器22dに入力される。
【0069】無声音用雑音コードブック22bはインデ
ックスI’に基づいて、雑音データを第10乗算器22
dに出力し、この第10乗算器22dは、多重化データ
のゲインγ’を雑音データに乗じ、振幅を変更調整す
る。第11加算器22eは、第10乗算器22dの出力
データを最新の過去の駆動音源データとして、無声音用
適応コードブック22aにフィードバックされ、無声音
用適応コードブック22aに書き替えられ乍ら記憶され
ていく。
【0070】従って、無声音声駆動音源再生部22で
は、最終的に決定された多重化データに対応した復号化
データが合成フィルタ23に出力され、この合成フィル
タ23は、LPCパラメータに基づいて再生された後、
ポストフィルタ24にて波形整形され、図示しないスピ
ーカ等に出力される。
【0071】ここで、図1の音声符号化装置にて用いら
れる情報のビット配分としては、表1に示す通りであ
り、
【0072】
【表1】
【0073】これらの情報が図4の音声復号化装置に伝
達されて、音声を復号再生するのである。
【0074】図5は第1の実施例における各処理ステッ
プ時の信号波形を示す。同図(a)は原音声、同図(b)
は予測残差、同図(c)は位相等化残差、同図(d)は
位相等化音声、同図(e)は駆動音源、同図(f)は復
号音声を示している。
【0075】図5(c)によれば、位相等化処理部4で
の位相等化処理により、予測残差のパワーがピッチパル
スに集中していることが分かる。
【0076】以上の構成の本発明の第1の実施例に係る
装置に於ける必須の情報であるピッチ周期は、駆動音源
の先行するパルス位置からピッチ周期だけ離れた位置近
傍(例えば、8KHzサンプリングの場合、±3サンプ
ル分)で、図5(b)の残差信号の信幅値が所定の値よ
り大きくなる後続するパルス位置を選択する。この場
合、±3サンプル、計7サンプルの残差信号の内、第2
番目に大きいなサンプルの値が最大サンプルの値の50
%以下になる時、そのピーク性が顕著であるので、その
最大サンプル位置をピッチパルス位置として決定する。
しかし、第2番目に大きいサンプルの値が最大サンプル
の値の50%以下にならない時、そのピーク性が顕著で
あるとは認められないので、この7サンプルに該当する
図5(c)の位相等化残差の7サンプルの内、最大の値
を示すピークのサンプル位置を後続のピッチパルス位置
として決定する。これによって、先後両パルス間隔がピ
ッチ周期となるのである。
【0077】ここで、有声音声駆動音源生成部7で使用
される有声音用適応コードブック7b、及び無声音声駆
動音源生成部8で使用される無声音用適応コードブック
8aは、例えば、8KHzサンプリングの場合、最新の
過去の146サンプルを逐次記憶しているシフトレジス
タ形式のメモリであるが、特に有声音用適応コードブッ
ク7bの場合は、駆動音源の先行するピッチパルス位置
からピッチ周期だけ離れた位置近傍(例えば、8KHz
サンプリングの場合、±3サンプル分)の7種類の時間
範囲に対する駆動音源信号列の内のあるものが選択的に
使用される。これに比べて、無声の場合には、従来のC
ELP同様に無声音用適応コードブック8aの20サン
プル〜146サンプルに亘る127種類の駆動音源信号
列の中から選択しなければならない。
【0078】次に、本発明の音声符号化方式をシミュレ
ーションにより評価する。
【0079】コンピュータシミュレーションにより本方
式の評価を行なう時のシミュレーションの条件は、サン
プリング周期:8kHz、フレーム長:40msec.
サブフレーム長:8msec.及びビットレート:4k
bpsであり、そのビット配分は前述の配分とする。
【0080】このような条件下で、短期予測係数とし
て、LSP係数を求め、サブフレーム毎に補間した後、
LPC係数に変換して利用している。なお、LSP係数
は、3段の多段ベクトル量子化を行なっている。また、
駆動ベクトルのゲインは、有声音の場合、位相等化パル
ス音源も含めて、サブフレーム毎に全駆動ベクトルゲイ
ンをまとめてベクトル量子化している。また、有声音時
の有声音用適応コードブック7bの探索範囲は、ピッチ
周期付近に限定した。この場合の駆動音源波形は図5
(e)に示され、復号音声波形は図5(f)に示されて
いるように、位相等化パルス音源の採用により、準周期
的なピッチパルスを良く再現していることが分かる。
【0081】客観評価として、日本語短文男女各4文章
について、位相等化音声を基準とした時のセグメンタル
SNRを求めた結果、男性の声では9.75dB、女性
の声では9.69dB、平均9.63dBとなった。こ
のような復号音声を試聴したところ、ピッチが良く再現
されており自然性の高い復号音声が得られた。 [第2の実施例]本発明の第2の実施例を図6乃至図8
に基づいて説明する。
【0082】尚、第1の実施例と構成が同一の場合には
同一番号を付し、その説明を省略する。
【0083】第2の実施例が第1の実施例と大きく異な
る点は、逆フィルタ3によって処理された予測残差信号
に基づいて音声の有声と無声を判定する有声/無声判定
部5を省くことによって、音声符号化装置の構成を第1
の実施例のそれより簡略化したことである。
【0084】本発明の第2の実施例の音声符号化装置の
処理ステップの一例を以下に列挙する。 ステップ1[ピッチ抽出処理]:入力音声信号から音声
のピッチ周期を抽出、 ステップ2[駆動音源生成処理]:上記ピッチ抽出処理
で得られるピッチ周期情報に基づいて駆動音源信号を生
成し、そのピッチ周期に対応したパルスパターン信号と
最新の過去の所定時間に記憶された駆動音源信号と雑音
信号との3者のそれぞれに所定のゲインを乗じた後、加
算してなる第1の駆動音源を生成すると共に、最新の過
去の所定時間に記憶された駆動音源信号と雑音信号との
2者のそれぞれに所定のゲインを乗じて加算してなる第
2の駆動音源を生成、 ステップ3[音声合成処理]:該駆動音源生成処理にて
生成された第1の駆動音源、並びに第2の駆動音源から
なる信号に基づいて音声信号を夫々合成出力、 ステップ4[符号化出力処理]:該音声合成処理にて合
成された合成音声信号と入力された音声信号とを比較し
て最も誤差が少ない時の駆動音源信号に対応するコード
及び有声/無声の判定結果を選択出力。
【0085】図6は、第2の実施例に係る音声符号化装
置全体の概略構成図である。
【0086】12は第2差分器10b、及び第3差分器
10cから出力された差分値を比較し、その比較結果を
出力する比較器、13は有声音声駆動音源生成部70か
ら出力される合成有声音声信号、及び無声音声駆動音源
生成部80から出力される合成無声音声信号のうち、比
較器12から出力された差分値に基づいて、どちらか一
方の音声信号を選択する選択部、11bは選択部13に
て選択された合成有声音声信号、又は合成無声音声信
号、並びにLPC分析部2にて変換されたLPCパラメ
ータに基づいて、多重化出力する多重化部であり、これ
によって、多重化部11bは音声入力部1に入力された
音声を符号化することができる。
【0087】次に、図7は有声音声駆動音源生成部70
の概略構成図を示したものである。
【0088】図7の有声音声駆動音源生成部70の構成
は、基本的に図2に示す有声音声駆動音源生成部7の構
成と同一であるが、その有声音声駆動音源生成部70が
有声音声駆動音源生成部7と異なる点は、(1)LPC分
析部2から出力されるLPCパラメータ、及び第1加算
器7gにて生成された駆動音源信号に基づいて合成有声
音声信号を合成する第4重み付け合成フィルタ71、
(2)位相等化処理部4から出力される位相等化音声残差
信号と第4合成フィルタ71から出力される合成有声音
声信号との差分をとり、その差分値を出力する第4差分
器72、及び(3)第4差分器72から出力される差分値
に基づいて、有声音用適応コードブック7bに格納され
ている駆動音源データの遅延量L、有声音用雑音コード
ブック7cに格納されている雑音データのインデックス
I、更には第1乗算器7dのゲインδ、第2乗算器7e
のゲインβ、及び第3乗算器7fのゲインγを調整変更
する有声音用符号選択制御部7h、を付加したことであ
る。
【0089】更に、図8は無声音声駆動音源生成部80
の概略構成図を示したものである。
【0090】図8の無声音声駆動音源生成部80の構成
は、基本的に図3に示す無声音声駆動音源生成部8の構
成と同一であるが、その無声音声駆動音源生成部80が
無声音声駆動音源生成部8と異なる点は、(1)LPC分
析部2から出力されるLPCパラメータ、及び第2加算
器8eにて生成された駆動音源信号に基づいて合成無声
音声信号を合成する第5重み付け合成フィルタ81、
(2)音声入力部1から出力される音声信号と第5重み付
け合成フィルタ81から出力される合成無声音声信号と
の差分をとり、その差分値を出力する第3差分器82、
及び(3)第5差分器82から出力される差分値に基づい
て、無声音用適応コードブック8bに格納されている駆
動音源データの遅延量L’、無声音用雑音コードブック
7cに格納されている雑音データのインデックスI’、
更には第4乗算器8cのゲインδ’、及び第5乗算器8
dのゲインγ’を調整変更する無声音用符号選択制御部
8f、を付加したことである。
【0091】上述の構成を具備する音声符号化装置にお
いて、入力された音声を符号化するまでの動作を以下に
詳述する。
【0092】まず、音声入力部1に音声が入力される
と、その音声入力部1にて変換された音声信号は、LP
C分析部2、逆フィルタ3、無声音声駆動音源生成部8
0、第2差分器10b、及び第3差分器10cに夫々出
力される。
【0093】LPC分析部2では、LPC分析法に基づ
いて、LPCパラメータが求められ、このパラメータは
逆フィルタ3、有声音声駆動音源生成部70、無声音声
駆動音源生成部80、及び多重化部11bに出力され
る。
【0094】逆フィルタ3では、LPC分析部2にて分
析されたLPCパラメータに基づいて、入力された音声
の予測残差信号を求める。
【0095】一方、位相等化処理部4に逆フィルタ3か
ら予測残差信号が出力されると、第1の実施例と同様
に、その予測残差信号のエネルギが集中する個所に疑似
的にピッチパルス列が設定され、これによって、上記予
測残差信号が位相等化変換された位相等化音声残差信
号、及びパルス列の位置を表すピッチパルス位置信号が
有声音声駆動音源生成部70に出力される。
【0096】図7に示す有声音声駆動音源生成部70で
は、位相等化処理部4から出力されたピッチパルス位置
信号に基づいて、パルスパターン生成部7aはパルスパ
ターンを生成し、その第1パターンを乗算器7dに出力
する。第1乗算器7dは、有声音用符号選択制御部7h
によって選択されたゲインδを上記パルスパターンに乗
じ、振幅を変更調整する。
【0097】また、有声音用雑音コードブック7cで
は、有声音用符号選択制御部7hによって選択されたイ
ンデックスIに格納された雑音データが読み出され、第
3乗算器7fは、有声音用符号選択制御部7hによって
選択されたゲインγを上記雑音データに乗じる。
【0098】第1加算器7gは、第1乗算器7d、第3
乗算器7fの出力データを加算し、この出力データは最
新の過去の駆動音源データとなり、有声音用適応コード
ブック7bにフィードバックされ記憶されると共に、第
4重み付け合成フィルタ71に出力される。
【0099】因みに、有声音用適応コードブック7bは
初期状態(リセットされた状態)では全く駆動音源デー
タを記憶しておらず、このフィードバックされた時点か
ら有声音用適応コードブック7bには最新の過去の駆動
音源データが順次格納されていくことになる。
【0100】一方、第4重み付け合成フィルタ71は、
第1加算器7gにて加算された駆動音源データ、及びL
PC分析部2から出力されたLPCパラメータに基づい
て、合成有声音声信号が生成され、第4差分器72に出
力される。第4差分器72は、位相等化処理部4から出
力される位相等化音声残差信号と第4重み付け合成フィ
ルタ71にて生成された合成有声音声信号との差分をと
り、有声音用符号選択制御部7hは、その差分値が最も
小さくなるまで、遅延量L、インデックスI、及びゲイ
ンδ、β、γを適宜選択する。これによって、有声音用
適応コードブック7bでは、遅延量Lに基づいて遅延さ
れた最新の過去の駆動音源データが第2乗算器7eに出
力され、ゲインβが乗ぜられ、また、有声音用雑音コー
ドブック7cでは、インデックスIに基づいて選択され
た雑音データが第3乗算器7fに出力され、ゲインγが
乗ぜられ、更に第1乗算器7dでは、パルスパターン生
成部7aにて生成されたパルスパターンにゲインδが乗
ぜられる。
【0101】この後、第1加算器7gは、第1乗算器7
d、第2乗算器7e、及び第3乗算器7fの出力データ
を加算し、この出力データは最新の過去の駆動音源デー
タとなり、有声音用適応コードブック7bに再びフィー
ドバックされ記憶されると共に、第4重み付け合成フィ
ルタ71に出力される。この第4重み付け合成フィルタ
71で生成された合成有声音声信号は第4差分器72に
出力される。
【0102】今、仮に第4差分器72での差分値が最も
小さくなった場合、有声音用符号選択制御部7hは遅延
量L、インデックスI、及びゲインδ、β、γを選択す
ることを中止し、これによって最終的に決定されたピッ
チパルス位置信号、遅延量L、インデックスI、及びゲ
インδ、β、γは第2差分器10bに出力される。而し
て、この第2差分器10bは、音声入力部1から出力さ
れる音声信号と第4重み付け合成フィルタ71から出力
される合成有声音声信号との差分をとり、この差分値は
比較器12に出力される。
【0103】一方、図8に示す無声音声駆動音源生成部
80における無声音用雑音コードブック8bでは、無声
音用符号選択制御部8fによって選択されたインデック
スI’に格納された雑音データが読み出され、第5乗算
器8dは、無声音用符号選択制御部8fによって選択さ
れたゲインγ’を上記雑音データに乗じる。
【0104】第2加算器8eは、最初第5乗算器8dの
出力データを最新の過去の駆動音源データとし、この駆
動音源データは無声音用適応コードブック8aにフィー
ドバックされ記憶されると共に、第5重み付け合成フィ
ルタ81に出力される。
【0105】因みに、無声音用適応コードブック8aは
初期状態(リセットされた状態)では全く駆動音源デー
タを記憶しておらず、このフィードバックされた時点か
ら無声音用適応コードブック8aには最新の過去の駆動
音源データが順次格納されていくことになる。
【0106】第5重み付け合成フィルタ81では、第2
加算器8eにて加算された駆動音源信号、及びLPC分
析部2から出力されたLPCパラメータに基づいて、合
成無声音声信号が生成され、第5差分器82に出力され
る。第5差分器82は、音声入力部1から出力される音
声信号と第5重み付け合成フィルタ81にて生成された
合成無声音声信号との差分をとり、無声音用符号選択制
御部8fは、その差分値が最も小さくなるまで、遅延量
L’、インデックスI’、及びゲインβ’、γ’を選択
する。これによって、無声音用適応コードブック8aで
は、遅延量L’に基づいて遅延された最新の過去の駆動
音源データが乗算器8cに出力され、ゲインβ’が乗ぜ
られる。また、無声音用雑音コードブック8bでは、イ
ンデックスI’に基づいて選択された雑音データが乗算
器8dに出力され、ゲインγ’が乗ぜられる。
【0107】この後、第2加算器8eは、第4乗算器8
c、第5乗算器8dの出力データを加算し、この出力デ
ータは最新の過去の駆動音源データとして、無声音用適
応コードブック8aに再びフィードバックされ記憶され
ると共に、第5重み付け合成フィルタ81に出力され
る。この第5重み付け合成フィルタ81で生成された合
成無声音声信号は第5差分器82に出力される。
【0108】今、仮に第5差分器82での差分値が最も
小さくなった場合には、無声音用符号選択制御部8fは
遅延量L’、インデックスI’、及びゲインβ’、γ’
の選択することを中止し、これによって最終的に決定さ
れた遅延量L’、インデックスI’、及びゲインβ’、
γ’は第3差分器10cに出力される。而して、この第
2差分器10cは、音声入力部1から出力された音声信
号と第5重み付け合成フィルタ81から出力された合成
無声音声信号との差分をとり、この差分値を比較器12
に出力する。
【0109】斯くして、有声音声駆動音源生成部70、
無声音声駆動音源生成部80にて夫々合成有声音声信
号、合成無声音声信号が生成され、比較器12は、第2
差分器10b、及び第3差分器10cの夫々の差分値を
比較して、差分値の小さい音声信号を選択する選択信号
を選択部13に出力する。
【0110】例えば、いま合成有声音声信号の差分値
が、合成無声音声信号のそれより小さかったとすると、
比較器12は有声音声駆動音源生成部70に対して、有
声音用適応コードブック7bに記憶されている駆動音源
データを無声音声駆動音源生成部80の無声音用適応コ
ードブック8aに複製するよう指令する。これによっ
て、有声音用適応コードブック7b、無声音用適応コー
ドブック8aには同一内容の駆動音源データが常に格納
されていることになる。
【0111】これに対して、合成無声音声信号の差分値
が、合成有声音声信号のそれより小さかったとすると、
比較器12は無声音声駆動音源生成部80に対して、無
声音用適応コードブック8aに記憶されている駆動音源
データを有声音声駆動音源生成部70の有声音用適応コ
ードブック7bに複製するよう指令する。これによっ
て、無声音用適応コードブック8a、有声音用適応コー
ドブック7bには同一内容の駆動音源データが常に格納
されていることになる。
【0112】これら適応コードブックに格納されている
内容を他方の適応コードブックに複製する理由は第1の
実施例と同じであるので、ここでは割愛する。
【0113】選択部13には、有声音声駆動音源生成部
70、無声音声駆動音源生成部80から合成有声音声信
号、及び合成無声音声信号が夫々出力され、選択部13
は比較器12から出力される合成有声音声信号、又は合
成無声音声信号のどちらの信号を選択するかを示す選択
信号を受けて、選択された合成有声音声信号、又は合成
無声音声信号、及びその選択信号を符号化して、多重化
部11bに出力する。
【0114】多重化部11bは、選択部13から出力さ
れる符号化データ、及びLPC分析部2から出力される
LPCパラメータを多重化出力する。
【0115】その多重化データは、有線、無線の通信路
を介して伝送されたり、或るいはメモリ、フロッピディ
スク等の記憶装置に記憶される。
【0116】また、その多重化データは、第1の実施例
の図4に示す音声復号化装置に出力されて音声再生され
ることが可能であり、この場合、その復号化方式は第1
の実施例に示した復号方式と全く同一であるので、ここ
ではその説明を割愛する。
【0117】因みに、図6の音声符号化装置にて用いら
れる情報のビット配分としては、表2に示す通りであ
り、
【0118】
【表2】
【0119】これらの情報が図4の音声復号化装置に伝
達されて、音声を復号再生するのである。
【0120】
【発明の効果】本発明の第1の音声符号化装置によれ
ば、符号化の対象となる音声が有声音か無声音かを予測
残差信号に基づいて駆動音源の生成処理部を選択するこ
とができる。特に、準周期的なピッチパルスを低ビット
で有効に検出することができ、この結果、有声音声駆動
音源信号生成処理に於ける計算量の軽減が図れ、しかも
全体のビットレートの低減を実現しながら、再生音声の
音質向上が可能になる。
【0121】本発明の第2の音声符号化装置によれば、
入力された音声を符号化出力する場合に、予測残差信号
に基づいて、その音声の種類、即ち有声音、又は無声音
の区別を行うのではなく、有声音声駆動音源生成部にて
疑似的なピッチパルスを設定することによって合成有声
音声信号を生成し、また無声音用符号化部にて上記音声
に基づいて合成無声音声信号を生成し、これらの音声信
号のうち、比較器は入力された音声に最も類似する音声
信号を選択するので、低ビットレートであっても、効率
よく符号化を行うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例に係る音声符号化装置全
体の概略構成図
【図2】本発明の第1の実施例に係る有声音声駆動音源
生成部7の構成図
【図3】本発明の第1の実施例に係る無声音声駆動音源
生成部8の構成図
【図4】本発明の第1の実施例に係る音声復号化装置の
構成図
【図5】本発明の第1の実施例に係る音声符号化装置に
おいて処理される信号波形図
【図6】本発明の第2の実施例に係る音声符号化装置全
体の概略構成図
【図7】本発明の第2の実施例に係る有声音用駆動音源
生成部70の構成図
【図8】本発明の第2の実施例に係る無声音用駆動音源
生成部80の構成図
【符号の説明】
1 音声入力部 2 LPC分析部 3 逆フィルタ 4 位相等化処理部 6 第1重み付け合成フィルタ 7、70 有声音声駆動音源生成部 8、80 無声音声駆動音源生成部 7a パルスパターン生成部 7b 有声音用適応コードブック 7c 有声音用雑音コードブック 8a 無声音用適応コードブック 8b 無声音用雑音コードブック 9 第2重み付け合成フィルタ 12 比較器 13 選択部 11a 多重化部 20 多重分離部
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成5年3月31日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】全文
【補正方法】変更
【補正内容】
【書類名】 明細書
【発明の名称】 音声符号化装置
【特許請求の範囲】
【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号を圧縮して符
号化する音声符号化装置に関する。
【0002】
【従来の技術】近年、音声信号を圧縮して符号化する音
声符号化技術の研究が盛んに行われており、移動体通信
を初めとする通信分野や音声蓄積分野において、低ビッ
トレートの音声符号化装置が急速に実用化されつつあ
る。
【0003】現在、実用化されている低ビットレートの
音声符号化方式には8kbps程度のCELP方式
(“CODE−EXCITED LINEAR PREDICTION(CELP):HIGH
−QUALITYSPEECH AT VERY LOW BIT RATES”Proc.ICASSP
pp937-940(1985))があり、更にモトローラ社が開発し
たVSELP(VECTOR SUM EXCITED LINEAR PREDICTIO
N)方式の改良が試みられている。
【0004】このCELP方式を採用する音声符号化装
置は、基本的に以下のステップに従って実現される。即
ち、 所定の駆動音源信号を生成する駆動音源生成処理ステ
ップ、 駆動音源生成処理ステップにて生成された駆動音源信
号に基づいて音声信号を合成出力する音声合成処理ステ
ップ、及び 音声合成処理ステップにて合成された合成音声信号と
入力された音声信号とを比較して最も誤差が少ない時の
駆動音源信号に対応するコードを選択出力するコード出
力処理ステップ、である。
【0005】しかしながら、4kbps以下の低ビット
レート音声符号化方式になると、このようなCELP、
VSELP方式では十分な音声品質が得られていないの
が実情であった。この原因は、上述のステップにおけ
る有声音における準周期的なピッチパルスの再現が不十
分になるため、音質が劣化するものと考えられている。
【0006】
【発明が解決しようとする課題】本発明は、上述の点に
鑑みなされたものであり、準周期的なピッチパルスの再
現を十分実現できる低ビットレートの音声符号化装置を
提供することを目的とする。
【0007】
【課題を解決するための手段】本発明の第1の音声符号
化装置は、入力音声信号から音声のピッチ周期を抽出す
るピッチ抽出処理部と、該入力音声信号の有声、又は無
声を判定する有声/無声判定処理部と、上記ピッチ抽出
処理部で得られるピッチ周期情報、及び有声/無声判定
処理部にて判定された判定結果情報に基づいて駆動音源
信号を選択的に生成する駆動音源生成部と、該駆動音源
生成部にて生成された駆動音源信号に基づいて音声信号
を合成出力する音声合成処理部と、該音声合成処理部に
て合成された合成音声信号と入力された音声信号とを比
較して最も誤差が少ない時の駆動音源信号に対応するコ
ードを選択出力するコード出力処理部と、からなる音声
符号化装置に於て、有声音声の場合、上記駆動音源生成
部では、ピッチ周期に対応したパルスパターン信号と最
新の過去の所定時間に記憶された駆動音源信号と雑音信
号との3者のそれぞれに所定のゲインを乗じて混合して
なる有声駆動音源を使用し、一方無声音声の場合、上記
駆動音源生成部では、最新の過去の所定時間に記憶され
た駆動音源信号と雑音信号との2者のそれぞれに所定の
ゲインを乗じて混合してなる無声駆動音源を使用するも
のである。
【0008】また、本発明の第2の音声符号化装置は、
入力された音声の音声信号のLPCパラメータを算出す
る分析部と、上記音声信号のピッチ周期を抽出するピッ
チ抽出処理部と、該ピッチ抽出処理部にて抽出されたピ
ッチ周期、及び上記LPCパラメータに基づいて合成有
声音声信号を生成する合成有声音声信号生成部と、上記
音声信号、及び上記LPCパラメータに基づいて合成無
声音声信号を生成する合成無声音声信号生成部と、上記
合成有声音声信号生成部、及び合成無声音声信号生成部
によって生成された合成有声音声信号、及び合成無声音
声信号と上記音声信号とを夫々比較する比較器と、該比
較器による比較結果に基づいて、合成有声音声信号、又
は合成無声音声信号のどちらか一方の音声信号を選択す
る選択部と、該選択部によって選択された選択信号、及
び上記分析部にて分析されたLPCパラメータを多重出
力する多重化部と、を具備する音声符号化装置に於て、
上記選択部は、上記合成有声音声信号、及び合成無声音
声信号と上記音声信号とを夫々比較し、上記音声信号と
の誤差が小さい合成音声信号を選択するものである。
【0009】
【作用】 (1)入力音声信号から音声のピッチ周期を抽出し、該ピ
ッチ周期に基づいて、入力音声信号の有声、又は無声の
判定を行い、上記ピッチ周期の抽出処理で得られるピッ
チ周期情報、及び有声/無声判定処理の判定結果情報に
基づいて駆動音源信号を選択的に生成し、上記有声/無
声の判定結果が有声の場合、ピッチ周期に対応したパル
スパターン信号と最新の過去の所定時間に記憶された駆
動音源信号と雑音信号との3者のそれぞれに所定のゲイ
ンを乗じた後、加算してなる第1の駆動音源を生成し、
又は有声/無声の判定結果が無声の場合、最新の過去の
所定時間に記憶された駆動音源信号と雑音信号との2者
のそれぞれに所定のゲインを乗じて加算してなる第2の
駆動音源を生成する。
【0010】この後、上記第1の駆動音源、又は第2の
駆動音源からなる信号に基づいて音声信号を合成出力
し、この合成音声信号と入力された音声信号とを比較し
て最も誤差が少ない時の駆動音源信号に対応するコー
ド、及び有声/無声の判定結果を選択出力する。
【0011】(2)入力音声信号から音声のピッチ周期を
抽出し、該ピッチ周期に基づいて駆動音源信号を生成
し、上記ピッチ周期に対応したパルスパターン信号と最
新の過去の所定時間に記憶された駆動音源信号と雑音信
号との3者のそれぞれに所定のゲインを乗じた後、加算
してなる第1の駆動音源を生成すると共に、最新の過去
の所定時間に記憶された駆動音源信号と雑音信号との2
者のそれぞれに所定のゲインを乗じて加算してなる第2
の駆動音源を生成する。
【0012】この後、上記第1の駆動音源、並びに第2
の駆動音源からなる信号に基づいて音声信号を夫々合成
出力し、これらの合成音声信号と入力された音声信号と
を比較して最も誤差が少ない時の駆動音源信号に対応す
るコード、及び有声/無声の判定結果を選択出力する。
【0013】
【実施例】 [第1の実施例]本発明の第1の実施例の音声符号化装
置の処理ステップの一例を以下に列挙する。
【0014】ステップ1[ピッチ抽出処理]:入力音声
信号から音声のピッチ周期を抽出、 ステップ2[有声/無声判定処理]:入力音声信号の有
声、又は無声を判定、 ステップ3[駆動音源生成処理]:上記ピッチ抽出処理
で得られるピッチ周期情報、及び有声/無声判定処理に
て判定された判定結果情報に基づいて駆動音源信号を選
択的に生成し、有声/無声の判定結果が有声の場合、ピ
ッチ周期に対応したパルスパターン信号と最新の過去の
所定時間に記憶された駆動音源信号と雑音信号との3者
のそれぞれに所定のゲインを乗じた後、加算してなる第
1の駆動音源を生成し、又は有声/無声の判定結果が無
声の場合、最新の過去の所定時間に記憶された駆動音源
信号と雑音信号との2者のそれぞれに所定のゲインを乗
じて加算してなる第2の駆動音源を生成、 ステップ4[音声合成処理]:該駆動音源生成処理にて
生成された第1の駆動音源、又は第2の駆動音源からな
る信号に基づいて音声信号を合成出力、 ステップ5[符号化出力処理]:該音声合成処理にて合
成された合成音声信号と入力された音声信号とを比較し
て最も誤差が少ない時の駆動音源信号に対応するコー
ド、及び有声/無声の判定結果を選択出力。
【0015】図1は本発明の第1の実施例の音声符号化
装置の概略構成図の一例を示す。
【0016】同図に於て、1はマイクロフォン等から入
力された音声をディジタルの音声信号に変換する音声入
力部、2は入力音声の音声信号を線形予測(LPC)分
析してLPCパラメータを求めるLPC分析部、3は入
力音声と同じ音声信号を合成するための線形予測型の合
成フィルタ機能と逆のフィルタ機能を備えた逆フィルタ
であり、この逆フィルタ3は上記LPC分析部2で得ら
れるLPCパラメータに基づいて逆フィルタ特性が制御
され、入力された音声の予測残差信号を出力する。
【0017】4は上記逆フィルタ3から得られる音声の
予測残差信号に対して位相等化処理を施す位相等化処理
部であり、この位相等化処理部4は音声信号を効率よく
符号化できるように、その音声信号のエネルギが集中す
る位置に疑似的にパルス列を設定することによって、予
測残差信号の位相を近似的に零にし、これらのパルス列
のピッチパルス位置信号、及び位相等化音声残差信号を
出力する。
【0018】5は逆フィルタ3から得られる予測残差信
号に基づいて音声のピッチ周期を算出するピッチ周期算
出機能と、逆フィルタ3から得られる予測残差信号に基
づいて音声の有声、又は無声を判定する有声/無声判定
回路機能を備えた有声/無声判定部、6は位相等化処理
部4から得られる位相等化処理された位相等化音声残差
信号を駆動音源として合成音声信号を得る第1重み付け
合成フィルタ、7は位相等化処理部4の位相等化処理に
よって得られたピッチパルス位置に立てられたインパル
スに基づいて有声音声駆動音源を生成する有声音声駆動
音源生成部、8は主として雑音成分に基づいて、無声音
声駆動音源を生成する無声音声駆動音源生成部、9はL
PC分析部2から出力されるLPCパラメータ、並びに
有声音声駆動音源生成部7にて生成された有声音声駆動
音源、又は無声音声駆動音源生成部8にて生成された無
声音声駆動音源に基づいて、有声合成音声、又は無声合
成音声を生成する第2重み付け合成フィルタ、10aは
第1重み付け合成フィルタ6から出力される合成音声信
号と第2重み付け合成フィルタ9から出力される有声合
成音声信号、又は無声合成音声信号との差分をとる第1
差分器、11aは有声音声駆動音源生成部7にて符号化
された有声音声駆動音源、又は無声音声駆動音源生成部
8にて符号化された無声音声駆動音源を多重化出力する
多重化部である。
【0019】尚、ここで述べる位相等化処理部4は、日
本音響学会講演論文集(昭和60年9月〜10月)の論
文「位相等化音声の符号化におけるピッチ周期の利用」
に論じられているように、ピッチパルス位置を周期モデ
ルを利用して能率よく符号化するのに適している。位相
等化処理部4のインパルス応答は、f(m)=e(t 0
−m)となり、この場合のe(m)は予測残差サンプル
である。基準時点t0、すなわちピッチパルス位置は、
位相等化残差のピーク位置により逐次的に決定される。
【0020】ただし、ピーク探索範囲を直前のピッチパ
ルス位置からピッチ周期だけ離れた位置の前後数サンプ
ルに限定している。
【0021】次に、図2は、第1の実施例の有声音声駆
動音源生成部7を、また図3は無声音声駆動音源生成部
8の概略構成を示したものである。
【0022】有声音声の符号化に寄与する有声音声駆動
音源生成部7は、主としてパルスパターン生成部7a、
有声音用適応コードブック7b、有声音用雑音コードブ
ック7c、及び有声音用符号選択制御部7hからなり、
パルスパターン生成部7a、有声音用適応コードブック
7b、及び有声音用雑音コードブック7cの3出力のそ
れぞれに所定のゲインを乗じた後、それらを加算して有
声音声駆動音源を生成している。
【0023】パルスパターン生成部7aは、位相等化処
理部4から出力されたピッチパルス位置信号に基づい
て、ピッチパルスを生成する。有声音用適応コードブッ
ク7bは、最新の過去の駆動音源データ、即ち後述する
第1加算器7gによって加算された出力データを所定時
間分記憶するバッファメモリの一種である。
【0024】有声音用雑音コードブック7cは予め決め
られた複数個の雑音データを記憶する機能を有する。
【0025】有声音用符号選択制御部7hは、第1差分
器10aの差分値、具体的には二乗誤差値が最も小さく
なるように、有声音用適応コードブック7bの遅延量
L、有声音用雑音コードブック7cのインデックスI、
及びゲインδ、β、γの値を変更調整し、第1差分器1
0aの差分値が最も小さくなったときの遅延量L、イン
デックスI、及びゲインδ、β、γ、並びにピッチパル
ス位置信号を符号化データとして、多重化部11aに出
力する機能を有する。
【0026】ここで、遅延量Lとは、過去の駆動音源デ
ータを有効に活用するために、有声音用適応コードブッ
ク7bに格納されている最新の過去の駆動音源データを
時間的にずらせた場合の時間的な長さをいい、インデッ
クスIとは、有声音用雑音コードブック7cに格納され
ている複数個の雑音データを選択する際の指標を示し、
また、ゲインδ、β、γとは、ピッチパルスの振幅、有
声音用適応コードブック7bに格納されている過去の駆
動音源データの示す波形の振幅、及び有声音用雑音コー
ドブック7cに格納されている雑音データの示す波形の
振幅の巾を夫々変更調整する利得である。
【0027】一方、図3に示す無声音声の符号化に寄与
する無声音声駆動音源生成部8は、主として無声音用適
応コードブック8a、無声音用雑音コードブック8b、
及び無声音用符号選択制御部8fからなり、無声音用適
応コードブック8a、及び無声音用雑音コードブック8
bの2出力のそれぞれに所定のゲインを乗じた後、それ
らを加算して無声音声駆動音源を生成している。
【0028】無声音用適応コードブック8aは、最新の
過去の駆動音源データ、即ち後述する第2加算器8eに
よって加算された出力データを所定時間分記憶するバッ
ファメモリの一種である。
【0029】無声音用符号選択制御部8fは、第1差分
器10aの差分値、具体的には二乗誤差値が最も小さく
なるように、無声音用適応コードブック8aの遅延量
L’、無声音用雑音コードブック8bのインデックス
I’、及びゲインβ’、γ’の値を変更調整し、第1差
分器10aの差分値が最も小さくなったときの遅延量
L’、インデックスI’、及びゲインβ’、γ’を符号
化データとして、多重化部11aに出力する機能を有す
る。
【0030】ここで、遅延量L’とは、過去の駆動音源
データを有効に活用するために、無声音用適応コードブ
ック8aに格納されている最新の過去の駆動音源データ
を時間的にずらせた場合の時間的な長さをいい、インデ
ックスI’とは、雑音コードブック8bに格納されてい
る複数個の雑音データを選択する際の指標を示し、また
ゲインβ’、γ’とは、無声音用適応コードブック8a
に格納されている過去の駆動音源データの示す波形の振
幅、及び無声音用雑音コードブック8bに格納されてい
る雑音データの示す波形の振幅の巾を夫々変更調整する
利得である。
【0031】尚、無声音声の場合には、切換手段Sw1
により、無声音声駆動音源生成部8が選択されるので、
通常のCELPと全く同様の構成となる。
【0032】第2重み付け合成フィルタ9は、有声音声
駆動音源生成部7(図2参照)、或るいは無声音声駆動
音源生成部8(図3参照)からの出力を受けて音声信号
を合成する機能を有し、第1差分器10aは、第1重み
付け合成フィルタ6にて合成された合成音声信号と、第
2重み付け合成フィルタ9にて合成された合成音声信号
とを比較する第1差分器である。而して、第1重み付け
合成フィルタ6にて合成された合成音声信号に対して最
も類似した第2重み付け合成フィルタ9の合成音声信号
が二乗誤差最小化の手法で特定され、このときの信号が
駆動音源信号となる。
【0033】多重化部11aは、LPCパラメータ、有
声/無声判定データ、並びに二乗誤差最小化の手法によ
って特定された駆動音源信号の、無声音用適応コードブ
ック8aの遅延量L’、無声音用雑音コードブック8b
のインデックスI’、及びゲインβ’、γ’の値、又は
有声音用適応コードブック7bの遅延量L、インデック
スI、ゲインδ、β、γ、及びピッチパルス位置を符号
化データとして、多重化出力する。
【0034】ここで述べる有声音用適応コードブック7
b,無声音用適応コードブック8a、並びに有声音用雑
音コードブック7c、及び無声音用雑音コードブック8
bは従来のCELP音声符号化方式で用いられるものと
基本的に同じものであるが、ここでは両コードブック部
を有声用と無声用に分担配置し、使い分けるように成し
た点で異なり、更に、有声音用側にはパルスパターン生
成部7aが追加装備されている。
【0035】図4は、図1乃至図3に示す音声符号化装
置にて符号化された多重化データを再生復号化する音声
復号化装置の概略構成図である。
【0036】図4に示す有声音声駆動音源再生部21
は、図2に示す有声音声駆動音源生成部7と、また無声
音声駆動音源再生部22は、図3に示す無声音声駆動音
源生成部8と全く同一機能を有するものであるが、唯一
異なる点は、有声音用符号選択制御部7h、無声音用符
号選択制御部8fの構成を持たない点である。
【0037】図4において、20は音声符号化装置の多
重化部11aから出力された多重化データを受信する多
重分離部、23は音声符号化装置から出力されたLPC
パラメータに基づいてフィルタ特性が設定される合成フ
ィルタ、24は該合成フィルタ23の音声合成出力を波
形整形するポストフィルタである。
【0038】上述の構成を具備する音声符号化装置にお
いて入力された音声を符号化した後、図4に示す音声復
号化装置において復号化することによって音声を再生す
るまでの動作を以下に説明する。
【0039】まず、図1において、音声入力部1に音声
が入力されると、その音声入力部1にて変換された音声
信号は、LPC分析部2、及び逆フィルタ3に夫々出力
される。
【0040】LPC分析部2では、LPC分析法に基づ
いて、LPCパラメータが求められ、このパラメータは
逆フィルタ3、第1重み付け合成フィルタ6、第2重み
付け合成フィルタ9、及び多重化部11aに夫々出力さ
れる。
【0041】逆フィルタ3では、LPC分析部2にて分
析されたLPCパラメータに基づいて、入力された音声
の予測残差信号を求め、この予測残差信号を位相等化処
理部4、及び有声/無声判定部5に出力する。
【0042】位相等化処理部4に逆フィルタ3から予測
残差信号が入力されると、その音声信号のエネルギが集
中する個所に疑似的にピッチパルス列が設定され、これ
によって、上記音声信号は位相等化変換され、この音声
信号の位相等化音声残差信号は第1重み付け合成フィル
タ6に出力されると共に、パルス列の位置を表すピッチ
パルス位置信号は有声音声駆動音源生成部7に出力され
る。
【0043】一方、有声/無声判定部5は入力された予
測残差信号に基づいて、音声入力部1に入力された音声
が有声であると判定した場合には、図2の切換手段Sw
1は有声音声駆動音源生成部7側に、又は音声入力部1
に入力された音声が無声であると判定した場合には、切
換手段Sw1は無声音声駆動音源生成部8側に切り換え
られる。
【0044】今、切換手段Sw1が有声音声駆動音源生
成部7側に切り換わっている場合、図2に示すように有
声音声駆動音源生成部7において、位相等化処理部4か
ら出力されたピッチパルス位置信号に基づいて、パルス
パターン生成部7aはパルスパターンを生成し、そのパ
ターンを第1乗算器7dに出力する。第1乗算器7d
は、有声音用符号選択制御部7hによって選択されたゲ
インδを上記パルスパターンに乗じ、振幅を変更調整す
る。
【0045】有声音用適応コードブック7bでは、有声
音用符号選択制御部7hにより選択された遅延量Lに基
づいて過去の駆動音源信号データが読み出され、一方第
2乗算器7eは、有声音用符号選択制御部7hによって
選択されたゲインβを上記過去の駆動音源信号データに
乗じる。
【0046】また、有声音用雑音コードブック7cで
は、有声音用符号選択制御部7hによって選択されたイ
ンデックスIに格納された雑音データが読み出され、
第3乗算器7fは、有声音用符号選択制御部7hによ
って選択されたゲインγを上記雑音データに乗じる。
【0047】これによって、第1加算器7gは、第1乗
算器7d、第2乗算器7e、及び第3乗算器7fの出力
データを加算し、この出力データは最新の過去の駆動音
源信号データとなり、有声音用適応コードブック7bに
フィードバックされ記憶されると共に、第2重み付け合
成フィルタ9に出力される。
【0048】因みに、有声音用適応コードブック7bは
初期状態(リセットされた状態)では全く駆動音源デー
タを記憶しておらず、このフィードバックされた時点か
ら有声音用適応コードブック7bには最新の過去の駆動
音源データが順次格納されていくことになる。
【0049】第2重み付け合成フィルタ9では、第1加
算器7gにて加算された駆動音源データ、及びLPC分
析部2から出力されたLPCパラメータに基づいて、合
成有声音声信号が生成され、第1差分器10aに出力さ
れる。第1差分器10aでは、第1重み付け合成フィル
タ6から出力される合成音声信号と第2重み付け合成フ
ィルタ9にて生成された合成有声音声信号との差分をと
り、有声音用符号選択制御部7hは、その差分値が最も
小さくなるまで、遅延量L、インデックスI、及びゲイ
ンδ、β、γを繰り返して選択する。これに従って、有
声音用適応コードブック7bでは、遅延量Lに基づいて
遅延された最新の過去の駆動音源データが第2乗算器7
eに出力され、ゲインβが乗ぜられる。また、有声音用
雑音コードブック7cでは、インデックスIに基づいて
選択された雑音データが第3乗算器7fに出力され、ゲ
インγが乗ぜられる。一方、第1乗算器7dでは、パル
スパターン生成部7aにて生成されたパルスパターンに
ゲインδを乗じる。
【0050】この結果、第1加算器7gは、第1乗算器
7d、第2乗算器7e、及び第3乗算器7fの出力デー
タを加算し、この出力データは最新の過去の駆動音源信
号となり、有声音用適応コードブック7bに再びフィー
ドバックされ記憶される。
【0051】而して、有声音用符号選択制御部7hは、
最終的に決定された、有声音声適応コードブック7bの
遅延量L、有声音用雑音コードブック7cのインデック
スI、及びゲインδ、β、γ、並びにピッチパルス位置
信号を符号化して、多重化部11aに出力する。
【0052】以上が、切換手段Sw1が有声音声駆動音
源生成部7側に切り換わったときの有声音声駆動音源生
成部7の処理手順であるが、次に切換手段Sw1が無声
音声駆動音源生成部8側に切り換わったときの無声音声
駆動音源生成部8の処理手順を説明する。
【0053】今、切換手段Sw1が無声音声駆動音源生
成部8側に切り換わっている場合、図3に示すように
声音声駆動音源生成部8の無声音用適応コードブック8
aでは、無声音用符号選択制御部8fにより選択された
遅延量L’に基づいて過去の駆動音源信号データが読み
出され、一方第4乗算器8cは、無声音用符号選択制御
部8fによって選択されたゲインβ’を上記過去の駆動
音源信号データに乗じる。
【0054】また、無声音声駆動音源生成部8の無声音
用雑音コードブック8bでは、無声音用符号選択制御部
8fによって選択されたインデックスI’に格納された
雑音データが読み出され、第5乗算器8dは、無声音用
符号選択制御部8fによって選択されたゲインγ’を上
記雑音データに乗じる。
【0055】これによって、第2加算器8eは、第4乗
算器8c、及び第5乗算器8dの出力データを加算し、
最新の過去の駆動音源データとして、無声音用適応コー
ドブック8aにフィードバックされ記憶されると共に、
第2重み付け合成フィルタ9に出力される。
【0056】因みに、無声音用適応コードブック8aは
初期状態(リセットされた状態)では全く駆動音源デー
タを記憶しておらず、この時点から無声音用適応コード
ブック8aには最新の過去の駆動音源データが順次格納
されていくことになる。
【0057】一方、第2重み付け合成フィルタ9は、第
2加算器8eにて加算された駆動音源データ、及びLP
C分析部2から出力されたLPCパラメータに基づい
て、合成無声音声信号が生成され、第1差分器10aに
出力される。第1差分器10aは、第1重み付け合成フ
ィルタ6から出力される合成音声信号と第2重み付け合
成フィルタ9にて生成された合成無声音声信号との差分
をとり、無声音用符号選択制御部8fは、この差分値に
応じて、この差分値が最も小さくなるまで、遅延量
L’、インデックスI’、及びゲインβ’、γ’を繰り
返して選択する。これに従って、無声音用適応コードブ
ック8aでは、遅延量L’に基づいて遅延された最新の
過去の駆動音源データが第4乗算器8cに出力され、ゲ
インβ’が乗ぜられる。また、無声音用雑音コードブッ
ク8bでは、インデックスI’に基づいて選択された雑
音データが第2乗算器8eに出力され、ゲインγ’が乗
ぜられる。
【0058】この結果、第2加算器8eは、第4乗算器
8c、及び第5乗算器8dの出力データを加算し、この
出力データは最新の過去の駆動音源信号となり、無声音
用適応コードブック8aに再びフィードバックされ記憶
される。
【0059】而して、無声音用符号選択制御部8fは、
最終的に決定された、無声音声適応コードブック8aの
遅延量L’、無声音用雑音コードブック8bのインデッ
クスI’、及びゲインβ’、γ’を符号化して、多重化
部11aに出力する。
【0060】このようにして、多重化部11aは、有声
音声駆動音源生成部7から出力された遅延量L、インデ
ックスI、ゲインδ、β、γ、及びピッチパルス位置信
号からなる符号化データ、又は無声音声駆動音源生成部
8から出力された遅延量L’、インデックスI’、及び
ゲインβ’、γ’からなる符号化データと共に、LPC
分析部2から入力されたLPCパラメータを多重化デー
タとして、後述する音声復号化装置の多重分離部20に
出力する。
【0061】ところで、多重化部11aから出力された
多重化データを復号する際の復号方式を図4を参照し乍
ら説明する。
【0062】多重分離部20に多重化部11aから多重
化データが入力されると、その多重分離部20はその多
重化データに有声音声であるとの判定データが含まれて
いれば、有声/無声判定データ送信路を介して、切換手
段Sw2を有声音声駆動音源再生部21側に切り換える
指令を行う。
【0063】因みに、初期状態(リセットされた状態)
においては、有声音用雑音コードブック21c、及び無
声音用雑音コードブック22bには予め有声音用雑音コ
ードブック7c、及び無声音用雑音コードブック8bと
同一の雑音データが格納されているが、有声音用適応コ
ードブック21b、及び無声音用適応コードブック22
aには何の駆動音源データも格納されていない。
【0064】この状態から、まず有声音声駆動音源再生
部21で有声音声を復号化する処理を以下に説明する。
【0065】多重化データが多重分離部20に入力され
ると、多重化データの各々のピッチパルス位置信号、遅
延量L、インデックスIが、夫々パルスパターン生成部
21a、有声音用適応コードブック21b、及び有声音
用雑音コードブック21cに入力されると共に、ゲイン
δ、β、γが、夫々第6乗算器21d、第7乗算器21
e、第8乗算器21fに入力される。
【0066】パルスパターン生成部21aはピッチパル
ス位置信号に基づいて、パルスパターンを生成し、その
パターンを第6乗算器21dに出力し、この第6乗算器
21dは、多重化データのゲインδをパルスパターンに
乗じ、振幅を変更調整する。
【0067】また、有声音用適応コードブック21bで
は、遅延量Lに基づいて過去の駆動音源信号データが出
力され、第7乗算器21eは、ゲインβを上記過去の駆
動音源信号データに乗じる。
【0068】これと共に、有声音用雑音コードブック2
1cではインデックスIに基づいて、雑音データ第8
乗算器21fに出力され、この第8乗算器21fは、多
重化データのゲインγを雑音データに乗じ、振幅を変更
調整する。第3加算器21gは、第6乗算器21d、第
7乗算器21e、及び第8乗算器21fの出力データを
加算する。この出力データは有声音用適応コードブック
21bにフィードバックされ書き替えられ乍ら記憶され
ていく。
【0069】従って、有声音声駆動音源再生部21は、
最終的に多重化データに対応した復号化データを合成フ
ィルタ23に出力し、この合成フィルタ23では、LP
Cパラメータに基づいて再生された後、ポストフィルタ
24にて波形整形され、図示しないスピーカ等に出力さ
れる。
【0070】次に、切換手段Sw2が無声音声駆動音源
再生部22側に切り換わっている場合に、その無声音声
駆動音源再生部22で無声音声を復号化する処理を以下
に説明する。
【0071】多重化データが多重分離部20に入力され
ると、多重化データの各々の遅延量L’、インデックス
I’が、夫々無声音用適応コードブック22a、及び無
声音用雑音コードブック22bに入力されると共に、ゲ
インβ’、γ’が、夫々第9乗算器22c、第10乗算
器22dに入力される。
【0072】また、無声音用適応コードブック22aで
は、遅延量L’に基づいて過去の駆動音源信号データが
出力され、第9乗算器22cは、ゲインβ’を上記過去
の駆動音源信号データに乗じる。
【0073】無声音用雑音コードブック22bではイン
デックスI’に基づいて、雑音データ第10乗算器2
2dに出力され、この第10乗算器22dは、多重化デ
ータのゲインγ’を雑音データに乗じ、振幅を変更調整
する。第11加算器22eは、第9乗算器22c、及び
第10乗算器22dの出力データを加算し、最新の過去
の駆動音源データとして、無声音用適応コードブック2
2aにフィードバックされ、無声音用適応コードブック
22aに書き替えられ乍ら記憶されていく。
【0074】従って、無声音声駆動音源再生部22で
は、最終的に決定された多重化データに対応した復号化
データが合成フィルタ23に出力され、この合成フィル
タ23は、LPCパラメータに基づいて再生された後、
ポストフィルタ24にて波形整形され、図示しないスピ
ーカ等に出力される。
【0075】ここで、図1の音声符号化装置にて用いら
れる情報のビット配分としては、表1に示す通りであ
り、
【0076】
【表1】
【0077】これらの情報が図4の音声復号化装置に伝
達されて、音声を復号再生するのである。
【0078】図5は第1の実施例における各処理ステッ
プ時の信号波形を示す。同図(a)は原音声、同図(b)
は予測残差、同図(c)は位相等化残差、同図(d)は
位相等化音声、同図(e)は駆動音源、同図(f)は復
号音声を示している。
【0079】図5(c)によれば、位相等化処理部4で
の位相等化処理により、予測残差のパワーがピッチパル
スに集中していることが分かる。
【0080】以上の構成の本発明の第1の実施例に係る
装置に於ける必須の情報であるピッチ周期は、駆動音源
の先行するパルス位置からピッチ周期だけ離れた位置近
傍(例えば、8KHzサンプリングの場合、±3サンプ
ル分)で、図5(b)の残差信号の信幅値が所定の値よ
り大きくなる後続するパルス位置を選択する。この場
合、±3サンプル、計7サンプルの残差信号の内、第2
番目に大きいサンプルの値が最大サンプルの値の50%
以下になる時、そのピーク性が顕著であるので、その最
大サンプル位置をピッチパルス位置として決定する。し
かし、第2番目に大きいサンプルの値が最大サンプルの
値の50%以下にならない時、そのピーク性が顕著であ
るとは認められないので、この7サンプルに該当する図
5(c)の位相等化残差の7サンプルの内、最大の値を
示すピークのサンプル位置を後続のピッチパルス位置と
して決定する。これによって、先後両パルス間隔がピッ
チ周期となるのである。
【0081】ここで、有声音声駆動音源生成部7で使用
される有声音用適応コードブック7b、及び無声音声駆
動音源生成部8で使用される無声音用適応コードブック
8aは、例えば、8KHzサンプリングの場合、最新の
過去の146サンプルを逐次記憶しているシフトレジス
タ形式のメモリであるが、特に有声音用適応コードブッ
ク7bの場合は、ピッチ周期の近傍(例えば、8KHz
サンプリングの場合、±3サンプル分)の7種類の時間
範囲に対する駆動音源信号列の内のあるものが選択的に
使用される。これに比べて、無声の場合には、従来のC
ELP同様に無声音用適応コードブック8aの20サン
プル〜146サンプルに亘る127種類の駆動音源信号
列の中から選択しなければならない。
【0082】次に、本発明の音声符号化方式をシミュレ
ーションにより評価する。コンピュータシミュレーショ
ンにより本方式の評価を行なう時のシミュレーションの
条件は、サンプリング周期:8kHz、フレーム長:4
0msec.サブフレーム長:8msec.及びビット
レート:4kbpsであり、そのビット配分は前述の配
分とする。
【0083】このような条件下で、短期予測係数とし
て、LSP係数を求め、サブフレーム毎に補間した後、
LPC係数に変換して利用している。なお、LSP係数
は、3段の多段ベクトル量子化を行なっている。また、
駆動ベクトルのゲインは、有声音の場合、位相等化パル
ス音源も含めて、サブフレーム毎に全駆動ベクトルゲイ
ンをまとめてベクトル量子化している。また、有声音時
の有声音用適応コードブック7bの探索範囲は、ピッチ
周期付近に限定した。この場合の駆動音源波形は図5
(e)に示され、復号音声波形は図5(f)に示されて
いるように、位相等化パルス音源の採用により、準周期
的なピッチパルスを良く再現していることが分かる。
【0084】客観評価として、日本語短文男女各4文章
について、位相等化音声を基準とした時のセグメンタル
SNRを求めた結果、男性の声では9.57dB、女性
の声では9.69dB、平均9.63dBとなった。こ
のような復号音声を試聴したところ、ピッチが良く再現
されており自然性の高い復号音声が得られた。 [第2の実施例]本発明の第2の実施例を図6乃至図8
に基づいて説明する。
【0085】尚、第1の実施例と構成が同一の場合には
同一番号を付し、その説明を省略する。
【0086】第2の実施例が第1の実施例と大きく異な
る点は、逆フィルタ3によって処理された予測残差信号
に基づいて音声の有声と無声を判定する有声/無声判定
部5を省くことによって、音声符号化装置の構成を第1
の実施例のそれより簡略化したことである。
【0087】本発明の第2の実施例の音声符号化装置の
処理ステップの一例を以下に列挙する。
【0088】ステップ1[ピッチ抽出処理]:入力音声
信号から音声のピッチ周期を抽出、 ステップ2[駆動音源生成処理]:上記ピッチ抽出処理
で得られるピッチ周期情報に基づいて駆動音源信号を生
成し、そのピッチ周期に対応したパルスパターン信号と
最新の過去の所定時間に記憶された駆動音源信号と雑音
信号との3者のそれぞれに所定のゲインを乗じた後、加
算してなる第1の駆動音源を生成すると共に、最新の過
去の所定時間に記憶された駆動音源信号と雑音信号との
2者のそれぞれに所定のゲインを乗じて加算してなる第
2の駆動音源を生成、 ステップ3[音声合成処理]:該駆動音源生成処理にて
生成された第1の駆動音源、並びに第2の駆動音源から
なる信号に基づいて音声信号を夫々合成出力、 ステップ4[符号化出力処理]:該音声合成処理にて合
成された合成音声信号と入力された音声信号とを比較し
て最も誤差が少ない時の駆動音源信号に対応するコード
及び有声/無声の判定結果を選択出力。
【0089】図6は、第2の実施例に係る音声符号化装
置全体の概略構成図である。
【0090】12は第2差分器10b、及び第3差分器
10cから出力された差分値を比較し、その比較結果を
出力する比較器、13は合成有声音声信号生成部70
ら出力される合成有声音声信号、及び合成無声音声信号
生成部80から出力される合成無声音声信号のうち、比
較器12から出力された差分値に基づいて、どちらか一
方の音声信号を選択する選択部、11bは選択部13に
て選択された合成有声音声信号、又は合成無声音声信
号、並びにLPC分析部2にて変換されたLPCパラメ
ータに基づいて、多重化出力する多重化部であり、これ
によって、多重化部11bは音声入力部1に入力された
音声を符号化することができる。
【0091】次に、図7は合成有声音声信号生成部70
の概略構成図を示したものである。
【0092】図7の合成有声音声信号生成部70の構成
は、基本的に図2に示す有声音声駆動音源生成部7の構
成と同一であるが、その合成有声音声信号生成部70
有声音声駆動音源生成部7と異なる点は、(1)LPC分
析部2から出力されるLPCパラメータ、及び第1加算
器7gにて生成された駆動音源信号に基づいて合成有声
音声信号を合成する第4重み付け合成フィルタ71、
(2)位相等化処理部4から出力される位相等化音声残
差信号と第4合成フィルタ71から出力される合成有声
音声信号との差分をとり、その差分値を出力する第4差
分器72、を付加したことである。
【0093】更に、図8は合成無声音声信号生成部80
の概略構成図を示したものである。
【0094】図8の合成無声音声信号生成部80の構成
は、基本的に図3に示す無声音声駆動音源生成部8の構
成と同一であるが、その合成無声音声信号生成部80
無声音声駆動音源生成部8と異なる点は、(1)LPC分
析部2から出力されるLPCパラメータ、及び第2加算
器8eにて生成された駆動音源信号に基づいて合成無声
音声信号を合成する第5重み付け合成フィルタ81、
(2)音声入力部1から出力される音声信号と第5重み
付け合成フィルタ81から出力される合成無声音声信号
との差分をとり、その差分値を出力する第3差分器8
、を付加したことである。
【0095】上述の構成を具備する音声符号化装置にお
いて、入力された音声を符号化するまでの動作を以下に
詳述する。
【0096】まず、音声入力部1に音声が入力される
と、その音声入力部1にて変換された音声信号は、LP
C分析部2、逆フィルタ3、合成無声音声信号生成部8
、第2差分器10b、及び第3差分器10cに夫々出
力される。
【0097】LPC分析部2では、LPC分析法に基づ
いて、LPCパラメータが求められ、このパラメータは
逆フィルタ3、合成有声音声信号生成部70、合成無声
音声信号生成部80、及び多重化部11bに出力され
る。
【0098】逆フィルタ3では、LPC分析部2にて分
析されたLPCパラメータに基づいて、入力された音声
の予測残差信号を求める。
【0099】一方、位相等化処理部4に逆フィルタ3か
ら予測残差信号が出力されると、第1の実施例と同様
に、その予測残差信号のエネルギが集中する個所に疑似
的にピッチパルス列が設定され、これによって、上記予
測残差信号が位相等化変換された位相等化音声残差信
号、及びパルス列の位置を表すピッチパルス位置信号が
合成有声音声信号生成部70に出力される。
【0100】図7に示す合成有声音声信号生成部70
は、位相等化処理部4から出力されたピッチパルス位置
信号に基づいて、パルスパターン生成部7aはパルスパ
ターンを生成し、そのパルスパターンを第1乗算器7d
に出力する。第1乗算器7dは、有声音用符号選択制御
部7hによって選択されたゲインδを上記パルスパター
ンに乗じ、振幅を変更調整する。
【0101】また、有声音用適応コードブック7bで
は、遅延量Lに基づいて過去の駆動音源信号データが出
力され、第2乗算器7eは、ゲインβを上記過去の駆動
音源信号データに乗じる。
【0102】また、有声音用雑音コードブック7cで
は、有声音用符号選択制御部7hによって選択されたイ
ンデックスIに格納された雑音データが読み出され、第
3乗算器7fは、有声音用符号選択制御部7hによって
選択されたゲインγを上記雑音データに乗じる。
【0103】第1加算器7gは、第1乗算器7d、第2
乗算器7e、及び第3乗算器7fの出力データを加算
し、この出力データは最新の過去の駆動音源データとな
り、有声音用適応コードブック7bにフィードバックさ
れ記憶されると共に、第4重み付け合成フィルタ71に
出力される。
【0104】因みに、有声音用適応コードブック7bは
初期状態(リセットされた状態)では全く駆動音源デー
タを記憶しておらず、このフィードバックされた時点か
ら有声音用適応コードブック7bには最新の過去の駆動
音源データが順次格納されていくことになる。
【0105】一方、第4重み付け合成フィルタ71は、
第1加算器7gにて加算された駆動音源データ、及びL
PC分析部2から出力されたLPCパラメータに基づい
て、合成有声音声信号が生成され、第4差分器72に出
力される。第4差分器72は、位相等化処理部4から出
力される位相等化音声残差信号と第4重み付け合成フィ
ルタ71にて生成された合成有声音声信号との差分をと
り、有声音用符号選択制御部7hは、その差分値が最も
小さくなるまで、遅延量L、インデックスI、及びゲイ
ンδ、β、γを適宜選択する。これによって、有声音用
適応コードブック7bでは、遅延量Lに基づいて遅延さ
れた最新の過去の駆動音源データが第2乗算器7eに出
力され、ゲインβが乗ぜられ、また、有声音用雑音コー
ドブック7cでは、インデックスIに基づいて選択され
た雑音データが第3乗算器7fに出力され、ゲインγが
乗ぜられ、更に第1乗算器7dでは、パルスパターン生
成部7aにて生成されたパルスパターンにゲインδが乗
ぜられる。
【0106】この後、第1加算器7gは、第1乗算器7
d、第2乗算器7e、及び第3乗算器7fの出力データ
を加算し、この出力データは最新の過去の駆動音源デー
タとなり、有声音用適応コードブック7bに再びフィー
ドバックされ記憶されると共に、第4重み付け合成フィ
ルタ71に出力される。この第4重み付け合成フィルタ
71で生成された合成有声音声信号は第4差分器72に
出力される。
【0107】今、仮に第4差分器72での差分値が最も
小さくなった場合、有声音用符号選択制御部7hは遅延
量L、インデックスI、及びゲインδ、β、γを選択す
ることを中止し、これによって最終的に決定されたピッ
チパルス位置信号、遅延量L、インデックスI、及びゲ
インδ、β、γは第2差分器10bに出力される。而し
て、この第2差分器10bは、音声入力部1から出力さ
れる音声信号と第4重み付け合成フィルタ71から出力
される合成有声音声信号との差分をとり、この差分値は
比較器12に出力される。
【0108】一方、図8に示す合成無声音声信号生成部
80における無声音用適応コードブック8aでは、遅延
量L’に基づいて過去の駆動音源信号データが読み出さ
れ、一方第4乗算器8cは、ゲインβ’を上記過去の駆
動音源信号データに乗じる。
【0109】また、無声音用雑音コードブック8bで
は、無声音用符号選択制御部8fによって選択されたイ
ンデックスI’に格納された雑音データが読み出され、
第5乗算器8dは、無声音用符号選択制御部8fによっ
て選択されたゲインγ’を上記雑音データに乗じる。
【0110】第2加算器8eは、最初第5乗算器8dの
出力データを最新の過去の駆動音源データとし、この駆
動音源データは無声音用適応コードブック8aにフィー
ドバックされ記憶されると共に、第5重み付け合成フィ
ルタ81に出力される。
【0111】因みに、無声音用適応コードブック8aは
初期状態(リセットされた状態)では全く駆動音源デー
タを記憶しておらず、このフィードバックされた時点か
ら無声音用適応コードブック8aには最新の過去の駆動
音源データが順次格納されていくことになる。
【0112】第5重み付け合成フィルタ81では、第2
加算器8eにて加算された駆動音源信号、及びLPC分
析部2から出力されたLPCパラメータに基づいて、合
成無声音声信号が生成され、第5差分器82に出力され
る。第5差分器82は、音声入力部1から出力される音
声信号と第5重み付け合成フィルタ81にて生成された
合成無声音声信号との差分をとり、無声音用符号選択制
御部8fは、その差分値が最も小さくなるまで、遅延量
L’、インデックスI’、及びゲインβ’、γ’を選択
する。これによって、無声音用適応コードブック8aで
は、遅延量L’に基づいて遅延された最新の過去の駆動
音源データが乗算器8cに出力され、ゲインβ’が乗ぜ
られる。また、無声音用雑音コードブック8bでは、イ
ンデックスI’に基づいて選択された雑音データが乗算
器8dに出力され、ゲインγ’が乗ぜられる。
【0113】この後、第2加算器8eは、第4乗算器8
c、第5乗算器8dの出力データを加算し、この出力デ
ータは最新の過去の駆動音源データとして、無声音用適
応コードブック8aに再びフィードバックされ記憶され
ると共に、第5重み付け合成フィルタ81に出力され
る。この第5重み付け合成フィルタ81で生成された合
成無声音声信号は第5差分器82に出力される。
【0114】今、仮に第5差分器82での差分値が最も
小さくなった場合には、無声音用符号選択制御部8fは
遅延量L’、インデックスI’、及びゲインβ’、γ’
の選択することを中止し、これによって最終的に決定さ
れた遅延量L’、インデックスI’、及びゲインβ’、
γ’は第3差分器10cに出力される。而して、この第
2差分器10cは、音声入力部1から出力された音声信
号と第5重み付け合成フィルタ81から出力された合成
無声音声信号との差分をとり、この差分値を比較器12
に出力する。
【0115】斯くして、合成有声音声信号生成部70、
合成無声音声信号生成部80にて夫々合成有声音声信
号、合成無声音声信号が生成され、比較器12は、第2
差分器10b、及び第3差分器10cの夫々の差分値を
比較して、差分値の小さい音声信号を選択する選択信号
を選択部13に出力する。
【0116】例えば、いま合成有声音声信号の差分値
が、合成無声音声信号のそれより小さかったとすると、
比較器12は合成有声音声信号生成部70に対して、有
声音用適応コードブック7bに記憶されている駆動音源
データを合成無声音声信号生成部80の無声音用適応コ
ードブック8aに複製するよう指令する。これによっ
て、有声音用適応コードブック7b、無声音用適応コー
ドブック8aには同一内容の駆動音源データが常に格納
されていることになる。
【0117】これに対して、合成無声音声信号の差分値
が、合成有声音声信号のそれより小さかったとすると、
比較器12は合成無声音声信号生成部80に対して、無
声音用適応コードブック8aに記憶されている駆動音源
データを合成有声音声信号生成部70の有声音用適応コ
ードブック7bに複製するよう指令する。これによっ
て、無声音用適応コードブック8a、有声音用適応コー
ドブック7bには同一内容の駆動音源データが常に格納
されていることになる。
【0118】これら適応コードブックに格納されている
内容を他方の適応コードブックに複製する理由は第1の
実施例と同じであるので、ここでは割愛する。
【0119】選択部13には、合成有声音声信号生成部
70、合成無声音声信号生成部80からピッチパルス位
置、遅延量L、インデックスI、ゲインδ、β、γ、及
び遅延量L’、インデックスI’、ゲインβ’、γ’
夫々出力され、選択部13は比較器12から出力され
択信号を受けて、選択されたピッチパルス位置、遅延
量L、インデックスI、ゲインδ、β、γ、又は遅延量
L’、インデックスI’、ゲインβ’、γ’、及びその
選択信号を符号化して、多重化部11bに出力する。
【0120】多重化部11bは、選択部13から出力さ
れる符号化データ、及びLPC分析部2から出力される
LPCパラメータを多重化出力する。
【0121】その多重化データは、有線、無線の通信路
を介して伝送されたり、或るいはメモリ、フロッピディ
スク等の記憶装置に記憶される。
【0122】また、その多重化データは、第1の実施例
の図4に示す音声復号化装置に出力されて音声再生され
ることが可能であり、この場合、その復号化方式は第1
の実施例に示した復号方式と全く同一であるので、ここ
ではその説明を割愛する。
【0123】ここで、図6の音声符号化装置にて用いら
れる情報のビット配分としては、表2に示す通りであ
り、
【0124】
【表2】
【0125】これらの情報が図4の音声復号化装置に伝
達されて、音声を復号再生するのである。
【0126】
【発明の効果】本発明の第1の音声符号化装置によれ
ば、符号化の対象となる音声が有声音か無声音かを予測
残差信号に基づいて駆動音源の生成処理部を選択するこ
とができる。特に、準周期的なピッチパルスを低ビット
で有効に検出することができ、この結果、有声音声駆動
音源信号生成処理に於ける計算量の軽減が図れ、しかも
全体のビットレートの低減を実現しながら、再生音声の
音質向上が可能になる。
【0127】本発明の第2の音声符号化装置によれば、
入力された音声を符号化出力する場合に、予測残差信号
に基づいて、その音声の種類、即ち有声音、又は無声音
の区別を行うのではなく、合成有声音声信号生成部にて
疑似的なピッチパルスを設定することによって合成有声
音声信号を生成し、また合成無声音用信号生成部にて上
記音声に基づいて合成無声音声信号を生成し、これらの
音声信号のうち、比較器は入力された音声に最も類似す
る音声信号を選択するので、低ビットレートであって
も、効率よく符号化を行うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例に係る音声符号化装置全
体の概略構成図
【図2】本発明の第1の実施例に係る有声音声駆動音源
生成部7の構成図
【図3】本発明の第1の実施例に係る無声音声駆動音源
生成部8の構成図
【図4】本発明の第1の実施例に係る音声復号化装置の
構成図
【図5】本発明の第1の実施例に係る音声符号化装置に
おいて処理される信号波形図
【図6】本発明の第2の実施例に係る音声符号化装置全
体の概略構成図
【図7】本発明の第2の実施例に係る合成有声音声信号
生成部70の構成図
【図8】本発明の第2の実施例に係る合成無声音声信号
生成部80の構成図
【符号の説明】 1 音声入力部 2 LPC分析部 3 逆フィルタ 4 位相等化処理部 6 第1重み付け合成フィルタ 7 有声音声駆動音源生成部 8 無声音声駆動音源生成部 70 合成有声音声信号生成部 80 合成無声音声信号生成部 7a パルスパターン生成部 7b 有声音用適応コードブック 7c 有声音用雑音コードブック 8a 無声音用適応コードブック 8b 無声音用雑音コードブック 9 第2重み付け合成フィルタ 12 比較器 13 選択部 11a 多重化部 20 多重分離部
【手続補正2】
【補正対象書類名】図面
【補正対象項目名】図6
【補正方法】変更
【補正内容】
【図6】

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 入力音声信号から音声のピッチ周期を抽
    出するピッチ抽出処理部と、該入力音声信号の有声、又
    は無声を判定する有声/無声判定処理部と、上記ピッチ
    抽出処理部で得られるピッチ周期情報、及び有声/無声
    判定処理部にて判定された判定結果情報に基づいて駆動
    音源信号を選択的に生成する駆動音源生成部と、該音源
    生成処理部にて生成された駆動音源信号に基づいて音声
    信号を合成出力する音声合成処理部と、該音声合成処理
    部にて合成された合成音声信号と入力された音声信号と
    を比較して最も誤差が少ない時の駆動音源信号に対応す
    るコードを選択出力するコード出力処理部と、からなる
    音声符号化装置に於て、 有声音声の場合、上記駆動音源生成部では、ピッチ周期
    に対応したパルスパターン信号と最新の過去の所定時間
    に記憶された駆動音源信号と雑音信号との3者のそれぞ
    れに所定のゲインを乗じて混合してなる有声駆動音源を
    使用し、 無声音声の場合、上記駆動音源生成部では、最新の過去
    の所定時間に記憶された駆動音源信号と雑音信号との2
    者のそれぞれに所定のゲインを乗じて混合してなる無声
    駆動音源を使用することを特徴とした音声符号化装置。
  2. 【請求項2】 有声音声の場合の最新の過去の所定時間
    に記憶された駆動音源信号には、この駆動音源信号に対
    応するパルスパターン信号成分が除外されていることを
    特徴とした請求項1記載の音声符号化装置。
  3. 【請求項3】 駆動音源の先行するピッチパルス位置か
    らピッチ周期だけ離れた位置近傍で、残差信号の振幅値
    が所定の値より大きくなる後続するピッチパルス位置を
    選択し、該選択が不可能の場合には位相等化残差のピー
    ク位置を後のピッチパルス位置として、これら先後両パ
    ルス間隔をピッチ周期として抽出することを特徴とした
    請求項1記載の音声符号化装置。
  4. 【請求項4】 上記駆動音源生成部で使用される最新の
    過去の所定時間に記憶された駆動音源信号は、有声音用
    適応コードブックに収納されており、有声音声の場合、
    ピッチ周期近傍の適数種類の時間範囲に対してのみ駆動
    音源信号が選択的に使用されることを特徴とした請求項
    1記載の音声符号化装置。
  5. 【請求項5】 入力された音声の音声信号を符号化する
    と共に、該音声信号のLPCパラメータを算出する分析
    部と、上記音声信号のピッチ周期を抽出する位相等化処
    理部と、該位相等化処理部にて抽出されたピッチ周期、
    及び上記LPCパラメータに基づいて合成有声音声信号
    を生成する有声音声駆動音源生成部と、上記音声信号、
    及び上記LPCパラメータに基づいて合成無声音声信号
    を生成する無声音声駆動音源生成部と、上記有声音声駆
    動音源生成部、及び無声音声駆動音源生成部によって生
    成された合成有声音声信号、及び合成無声音声信号と上
    記音声信号とを夫々比較する比較器と、該比較器による
    比較結果に基づいて、合成有声音声信号、又は合成無声
    音声信号のどちらか一方の音声信号を選択する選択部
    と、該選択部によって選択された音声信号、及び上記分
    析部にて分析されたLPCパラメータを多重化出力する
    多重化部と、を具備する音声符号化装置に於て、 上記選択部は、上記合成有声音声信号、及び合成無声音
    声信号と上記音声信号とを夫々比較し、上記音声信号と
    の誤差が小さい合成音声信号を選択することを特徴とし
    た音声符号化装置。
  6. 【請求項6】 上記有声音声駆動音源生成部は、上記ピ
    ッチ周期に基づいてパルスパターンを生成するパルスパ
    ターン生成部、最新の過去の有声音用駆動音源データを
    収納している有声音用適応コードブック、雑音データを
    記憶している有声音用雑音コードブック、並びに上記パ
    ルスパターン生成部、有声音用適応コードブック、及び
    有声音用雑音コードブックの出力データに基づいて合成
    有声音声信号を生成する合成フィルタからなり、上記合
    成有声音声信号は、上記適応コードブック、及び雑音コ
    ードブックの出力データを加算することにより生成され
    ることを特徴とした請求項5記載の音声符号化装置。
  7. 【請求項7】 上記無声音声駆動音源生成部は、最新の
    過去の無声音用駆動音源データを記憶している無声音用
    適応コードブック、雑音データを記憶している無声音用
    雑音コードブック、並びに上記無声音用適応コードブッ
    ク、及び無声音用雑音コードブックの出力データに基づ
    いて合成無声音声信号を生成する合成フィルタからな
    り、上記合成無声音声信号は、上記無声音用適応コード
    ブック、及び無声音用雑音コードブックの出力データを
    加算することにより生成されることを特徴とした請求項
    5記載の音声符号化装置。
  8. 【請求項8】 上記有声音声駆動音源生成部にて合成さ
    れた合成有声音声信号が、上記選択部によって選択され
    た場合には、上記有声音用適応コードブックに記憶され
    ている有声音用駆動音源データが、上記無声音用適応コ
    ードブックに複製され、一方、上記無声音声駆動音源生
    成部にて合成された合成無声音声信号が、上記選択部に
    よって選択された場合には、上記無声音用適応コードブ
    ックに記憶されている無声音用駆動音源データが、上記
    有声音用適応コードブックに複製されることを特徴とし
    た請求項6、又は7記載の音声符号化装置。
JP4348880A 1992-03-16 1992-12-28 音声符号化装置 Pending JPH0612098A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP4348880A JPH0612098A (ja) 1992-03-16 1992-12-28 音声符号化装置
US08/031,808 US5488704A (en) 1992-03-16 1993-03-15 Speech codec
KR1019930003868A KR100275429B1 (ko) 1992-03-16 1993-03-15 음성 부호화 장치

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP4-58078 1992-03-16
JP5807892 1992-03-16
JP4348880A JPH0612098A (ja) 1992-03-16 1992-12-28 音声符号化装置

Publications (1)

Publication Number Publication Date
JPH0612098A true JPH0612098A (ja) 1994-01-21

Family

ID=26399156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4348880A Pending JPH0612098A (ja) 1992-03-16 1992-12-28 音声符号化装置

Country Status (3)

Country Link
US (1) US5488704A (ja)
JP (1) JPH0612098A (ja)
KR (1) KR100275429B1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944195A (ja) * 1995-07-27 1997-02-14 Nec Corp 音声符号化装置
WO2000054258A1 (fr) * 1999-03-05 2000-09-14 Matsushita Electric Industrial Co., Ltd. Generateur de vecteurs de source sonore, et codeur/decodeur vocal
JP2013088522A (ja) * 2011-10-14 2013-05-13 Nippon Telegr & Teleph Corp <Ntt> 声道スペクトル抽出装置、声道スペクトル抽出方法及びプログラム

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3557662B2 (ja) * 1994-08-30 2004-08-25 ソニー株式会社 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
US5761633A (en) * 1994-08-30 1998-06-02 Samsung Electronics Co., Ltd. Method of encoding and decoding speech signals
AU696092B2 (en) * 1995-01-12 1998-09-03 Digital Voice Systems, Inc. Estimation of excitation parameters
SE506379C3 (sv) * 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
US5642464A (en) * 1995-05-03 1997-06-24 Northern Telecom Limited Methods and apparatus for noise conditioning in digital speech compression systems using linear predictive coding
US5864797A (en) * 1995-05-30 1999-01-26 Sanyo Electric Co., Ltd. Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors
KR100389895B1 (ko) * 1996-05-25 2003-11-28 삼성전자주식회사 음성 부호화 및 복호화방법 및 그 장치
US5771299A (en) * 1996-06-20 1998-06-23 Audiologic, Inc. Spectral transposition of a digital audio signal
JP4040126B2 (ja) * 1996-09-20 2008-01-30 ソニー株式会社 音声復号化方法および装置
JPH10105195A (ja) * 1996-09-27 1998-04-24 Sony Corp ピッチ検出方法、音声信号符号化方法および装置
DE69721595T2 (de) * 1996-11-07 2003-11-27 Matsushita Electric Ind Co Ltd Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs
JP3235526B2 (ja) * 1997-08-08 2001-12-04 日本電気株式会社 音声圧縮伸長方法及びその装置
JP3166697B2 (ja) * 1998-01-14 2001-05-14 日本電気株式会社 音声符号化・復号装置及びシステム
JP4661074B2 (ja) * 2004-04-07 2011-03-30 ソニー株式会社 情報処理システム、情報処理方法、並びにロボット装置
US7240252B1 (en) * 2004-06-30 2007-07-03 Sprint Spectrum L.P. Pulse interference testing in a CDMA communication system
JP5245622B2 (ja) * 2008-07-31 2013-07-24 富士通株式会社 ノイズ検出装置及びノイズ検出方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944195A (ja) * 1995-07-27 1997-02-14 Nec Corp 音声符号化装置
US6006178A (en) * 1995-07-27 1999-12-21 Nec Corporation Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits
WO2000054258A1 (fr) * 1999-03-05 2000-09-14 Matsushita Electric Industrial Co., Ltd. Generateur de vecteurs de source sonore, et codeur/decodeur vocal
US6928406B1 (en) 1999-03-05 2005-08-09 Matsushita Electric Industrial Co., Ltd. Excitation vector generating apparatus and speech coding/decoding apparatus
JP2013088522A (ja) * 2011-10-14 2013-05-13 Nippon Telegr & Teleph Corp <Ntt> 声道スペクトル抽出装置、声道スペクトル抽出方法及びプログラム

Also Published As

Publication number Publication date
KR930020156A (ko) 1993-10-19
KR100275429B1 (ko) 2000-12-15
US5488704A (en) 1996-01-30

Similar Documents

Publication Publication Date Title
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JP3134817B2 (ja) 音声符号化復号装置
JPH0612098A (ja) 音声符号化装置
JPH11327597A (ja) 音声符号化装置及び音声復号化装置
JP3746067B2 (ja) 音声復号化方法及び音声復号化装置
US6768978B2 (en) Speech coding/decoding method and apparatus
CA2218118C (en) Variable rate speech coding method and decoding method
JPH09160596A (ja) 音声符号化装置
JP2658816B2 (ja) 音声のピッチ符号化装置
JP3329216B2 (ja) 音声符号化装置及び音声復号装置
JP3199142B2 (ja) 音声の励振信号符号化方法および装置
JP3510643B2 (ja) 音声信号のピッチ周期処理方法
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JP2943983B1 (ja) 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳
JPH11259098A (ja) 音声符号化/復号化方法
JP3292227B2 (ja) 符号励振線形予測音声符号化方法及びその復号化方法
JP3845316B2 (ja) 音声符号化装置及び音声復号装置
JP2008090311A (ja) 音声符号化方法
JP4179232B2 (ja) 音声符号化装置及び音声復号装置
JP2000029499A (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3274451B2 (ja) 適応ポストフィルタ及び適応ポストフィルタリング方法
JP3563400B2 (ja) 音声復号化装置及び音声復号化方法
JP3071800B2 (ja) 適応ポストフィルタ
JP2817196B2 (ja) 音声符号化方式