JPH0675598A - 音声符号化方法及び音声合成方法 - Google Patents

音声符号化方法及び音声合成方法

Info

Publication number
JPH0675598A
JPH0675598A JP4229772A JP22977292A JPH0675598A JP H0675598 A JPH0675598 A JP H0675598A JP 4229772 A JP4229772 A JP 4229772A JP 22977292 A JP22977292 A JP 22977292A JP H0675598 A JPH0675598 A JP H0675598A
Authority
JP
Japan
Prior art keywords
pulse
sound source
speech
level
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4229772A
Other languages
English (en)
Inventor
Osamu Watanabe
治 渡辺
Seiji Sasaki
誠司 佐々木
Hiroki Goto
裕樹 後藤
Masayasu Miyake
正泰 三宅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kokusai Electric Corp
Original Assignee
Kokusai Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Electric Corp filed Critical Kokusai Electric Corp
Priority to JP4229772A priority Critical patent/JPH0675598A/ja
Publication of JPH0675598A publication Critical patent/JPH0675598A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 誤り2倍の周期のピッチを検出した場合にお
いてもレベルの変動・音量の劣化を最小におさえたい。 【構成】 線形予測係数、音源パルスレベル、ピッチ周
期をそれぞれフィルタ12、計算部15、14で抽出し
てこれを出力するのが従来の音声符号化法であるが、本
発明では、ピッチ周期の中間点にもう1個の音源パルス
が得られるような、第2パルスレベル発生部30を設け
た。この第2パルスレベルを併せた4つのパラメータで
音声信号を表現する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音源パルスの生成を行
う音声符号化方法及び音声合成方法に関する。
【0002】
【従来の技術】分析・合成による音声符号化システムに
は、線形予測分析法を採用する例が多い。図2には、こ
の線形予測分析法のもとでの音声符号化装置を示し、図
3には図2の音声符号化装置から送られる音声符号を復
号として音声合成を行う音声合成装置を示す。図2で、
音声入力は、フレーム化処理部12で、適当に定めた周
期(これを1フレームと云う)単位に区分される。線形
予測分析部12では、自己相関関数等を用いて過去の音
声信号から線形予測に使う線形予測係数aiをオンライ
ンで算出する。線形予測逆フィルタ13は、フレーム単
位の音声信号と線形予測係数aiとの積和を行い残差信
号を生成する。残差信号からピッチ周期計算部14は、
ピッチ周期τを求め、音源パルスレベル計算部15は音
源パルスレベル(振幅)Aを求める。以上の3つのパラ
メータ(線形予測係数ai、ピッチ周期τ、レベルA)
は、それぞれオンラインで算出され、図3の合成装置に
送られる。
【0003】図3の合成装置では、ピッチ周期τとレベ
ルAをパルス発生部111が取り込み、ピッチ周期に対
応するパルスを発生する。線形予測合成フィルタ112
は、パルス発生部111のパルスと線形予測係数ai
を入力として合成音声を求める。
【0004】以上の図1、図の線形予測分析を使用する
音声分析・合成を用いた音声符号・合成装置は演算処理
を主体にその機能が実現されることにより、DSP(デ
ィジタル信号処理素子)を主要演算処理のための素子と
して回路が実現される。その場合、取り扱われる量は標
本化された量子化された標本値である。
【0005】図2に示したように、音声符号回路に入力
される標本化・量子化された音声信号はフレーム処理部
11で適当な長さのフレーム長に区切られる。この値は
音声信号が持つスペクトルの変化が概略定常と見なされ
る時間間隔として20〜30msecが選ばれる。又電
話等の用途に使用する品質に十分な音声信号が持つ周波
数帯域幅は300Hz〜3KHzで十分であることが知
られている。従って音声信号を標本化する周波数は8K
Hzが標準に使用される。
【0006】図2の線形予測分析部12では標本化・量
子化された音声信号をディジタル信号処理による線形予
測を施すことにより音声信号の線形予測分析係数とピッ
チ周期情報とを得る。ここで得られた線形予測係数を利
用して逆フィルタ13は、分析するフレームの音声信号
を処理することで線形予測残差信号が得られる。ピッチ
周期計算部14では、線形予測残差信号からピッチ周期
が得、音源パルスレベル計算部15では音源パルスレベ
ルを得る。
【0007】以上の処理で求められた線形予測係数、ピ
ッチ周期、及び音源パルスレベルは音声信号を記述する
パラメータとして符号化されたものであり、受信側即ち
音声合成を実行する図3の音声復号回路に送出される。
受信側ではこれらのパラメータを分離し、ピッチ周期で
音源に相当するパルス系列を生成し、線形予測係数をも
とにして構成される音声合成フィルタ112に入力する
ことで、そのフィルタ出力には合成音声が得られる。
【0008】
【発明が解決しようとする課題】従来の合成音声は合成
フィルタを駆動するパルスをピッチ周期に1個だけを使
用していた。このような場合の不具合としては、分析側
でピッチ周期を誤って検出し、2倍の周期のものが検出
されると、音声の信号レベルが1/2になり、音声のレ
ベルがピッチの検出により変動するということがあっ
た。これを図4を利用して説明する。図4に音声波形2
1とその波形から抽出されるピッチ周期に基づくパルス
22を示す。このパルス発生器11の出力である。線形
予測フィルタ12はピッチ周期内の波形の特徴を記述す
るものである。従って、線形予測合成フィルタ112
に、抽出されたピッチ周期のパルス列23で駆動するこ
とにより音声波形を合成することができる。
【0009】この場合ピッチ周期を抽出する過程におい
て、ピッチ周期検出を誤り真値の2倍の値が検出される
ことがある。図4では抽出すべきピッチ222、224
(点線で示してある)が検出されず、その部分では真値
の2倍の周期のピッチが抽出された図を示す。即ち、ピ
ッチ間隔221と223の値がピッチ周期計算部14で
検出されその値がパルス発生器111に入力される。パ
ルス発生器111は入力されてきたピッチ間隔のパルス
列231、233、235を出力する。この値に対して
線形予測フィルタ13で抽出されたスペクトル特性は波
形211を線形予測合成フィルタ112で付与し、出力
波形231、243、245を得る。この場合の合成音
声出力は本来の1/2になる。このような現象が発生す
ると聴感上不快感を与える。
【0010】本発明の目的は、誤り2倍の周期のピッチ
を検出した場合においてもレベルの変動・音量の劣化を
最小におさえることが可能な音声符号化方法及び音声合
成方法を提供するものである。
【0011】
【課題を解決するための手段及び作用】本発明は、音声
信号からパラメータ(線形予測係数、音源パルスレベ
ル、ピッチ周期)を抽出し、このパラメータを、音声信
号に代わって、音声信号を示す符号として出力する音声
符号化方法において、上記ピッチ周期で定まる相隣り合
う音源パルスの中間位置に1つ又は2つ以上の音源パル
スを得るような、第2パルスレベルを、上記ピッチ周期
及び音源パルスレベルを利用して作成し、この第2パル
スレベルを含めた4つのパラメータを、音声信号に代わ
って、音声信号を示す符号として出力する(請求項
1)。
【0012】更に本発明は、上記音源パルスレベルは閉
ループで求め、第2パルスレベルは音源パルスレベルと
ピッチ周期とで合成した合成音声波形を遅延させて求め
る(請求項2)。
【0013】更に本発明は、上記4つのパラメータを受
け取り音声符号を復号する(請求項3)。
【0014】
【実施例】図1は、本発明の音声符号化装置の実施例図
である。本実施例は、図2の回路に、第2パルスレベル
と発生部30を設けた点が特徴である。この発生部30
は、検出されたピッチ間隔の中間に第2のパルスを発生
させるための、第2パルスレベルBを生成する。
【0015】発生部30は、ピッチ切り出し部35、ピ
ッチ音源パルス発生部36、線形予測合成フィルタ3
7、減算処理部39、遅延回路310、レベル制御部3
11、減算処理部313、最小化判定部314より成
る。
【0016】本実施例では、先ず、フレーム化処理部1
1でフレーム区分された音声信号は線形予測分析フィル
タ12により分析されて、伝送パラメータとして線形予
測係数を出力すると同時に残差信号を出力する。この残
差信号からピッチ周期の計算部14を行い、又、閉ルー
プにより、音源パルスレベルの計算部15を行う。図5
にこの閉ループの計算部15の構成を示す。図5で減算
処理部150では、音声入力と線形予測合成フィルタ1
53出力との差分をとり、最小化判定部151を介して
音源パルスレベルAを得る。最小化判定部151ではピ
ッチ音源パルス発生部152を介して合成フィルタ15
3に閉ループ入力を行う。以上の処理は、図2と同じで
ある。
【0017】次に、第2パルス発生部30の動作を説明
する。ピッチ音源パルス発生部36は、検出されたピッ
チ周期と、音源パルスレベルを基にしてピッチ音源パル
スを発生する。線形予測合成フィルタ37はピッチ音源
パルスを入力とし、線形予測係数を利用して合成音声を
出力する。合成音声は2ピッチ分だけ発生させるように
しておく。次に検出されたピッチ周期を基にピッチ切り
出し部35で2周期分のピッチ信号の切り出し処理を行
い、減算処理部39ではその信号と線形予測合成フィル
タ37の出力とを減算処理する。この処理は、合成音声
が入力音声に近いほどその出力は小さいものになる。
【0018】また、線形予測合成フィルタ37の出力で
ある合成音声は遅延回路310によりピッチ周期計算部
14により計算されたピッチ周期の1/2の場所まで遅
延させられる。遅延させられた合成音声はレベル制御回
路311により出力レベルを制御されて、減算処理部3
13に入力される。減算処理部313では遅延されレベ
ル制御された合成音声と減算処理部39の出力信号とが
減算され、最小化判定部314に入力される。最小化判
定部314は遅延されレベル制御された合成音声のレベ
ルを制御し、減算処理部313の出力が最小となるレベ
ルを判定出力とする。以上のようにして第2パルスのレ
ベルが計算される。このことから明らかなようにピッチ
周期を誤って計算した場合、即ち図3の波形24のよう
な場合においても第1の音源ピッチ231により合成さ
れた合成音声波形241と入力音声波形211、212
とを減算処理することにより、波形212がその出力と
し得られる。この信号と合成音声241をピッチ周期1
/2だけ遅延した波形242の部分に出現する波形とを
比較することにより第2の音源ピッチ信号232のレベ
ルを計算することができる。尚、エラー発生しない場合
は第2パルスは、波形を近似する方向に働き、又その必
要がない場合は第2パルスレベルは自動的に0となる。
即ち、ピッチ周期が正しく計算された場合は、波形誤差
最小化処理を行っているため、第2パルスのレベルが自
動的にほぼ0に等しくなり問題はない。
【0019】このようにして得られたそれぞれのパラメ
ータは符号化されて図6の合成装置に伝送される。ここ
で、図6の合成装置は、図3の回路に対して、第2パル
スレベル合成部40を設けたことが特徴である。第2パ
ルスレベル合成部40は、遅延回路44、レベル制御部
45、加算処理部46より成る。
【0020】図6の実施例は、図1で作成した4つのパ
ラメータ(線形予測係数ai、ピッチ周期τ、音源パル
スレベルA、第2パルスレベルB)を受信する。ピッチ
周期τと音源パルスレベルAによりパルス発生部111
が駆動されて第1の音源パルスが出力される。これは線
形予測係数aiを基にしてつくられるフィルタである線
形予測合成フィルタ112の入力となり、合成音声が出
力される。以上が従来の音声合成部の系統であるが、本
発明によりさらに、合成音声の一部は遅延回路44に入
力されピッチ周期の1/2だけ遅延される。これは遅延
回路310と同じ時間である。遅延回路44出力はレベ
ル制御部45で第2パルスレベルに相当する振幅の制
御、これは最小判定部314で検出されたレベルBを受
け遅延される前の合成された音声と加算処理部46で加
算処理され最終的な合成音声出力となる。
【0021】ここでの説明は第1のパルスに対して第2
のパルスを設ける方式を記述したが、本方式は第2のパ
ルス以外にも第3、第4とパルスを増した場合にも適用
できることは容易にわかる。ここでは音声分析・合成と
して線形予測を用いた方式を利用して説明したが、必ず
しも線形予測分析合成系だけに限定されるものではな
い。例えばチャネルボコーダ方式においても線形予測分
析フィルタ12を分析バンドパスフィルタ群、線形予測
合成フィルタ37を合成バンドパスフィルタ群におきか
えることにより本発明の方法が適用できる。
【0022】
【発明の効果】本発明によれば、分析合成を利用した音
声合成部において、合成音声を生成する場合の音源パル
スを従来の単独の音源パルスの他に第2のパルス及びそ
れ以上のパルスを設けて合成音声を生成することによ
り、品質の高い合成音声を生成する。
【図面の簡単な説明】
【図1】本発明の音声符号化装置の実施例図である。
【図2】従来の音声符号化装置を示す図である。
【図3】従来の音声合成装置を示す図である。
【図4】従来例の動作タイムチャートである。
【図5】音源パルスレベル計算部15の実施例図であ
る。
【図6】本発明の音声合成装置を示す図である。
【符号の説明】
11 フレーム化処理部 12 線形予測分析フィルタ 14 ピッチ周期計算部 15 音源パルスレベル計算部 30 第2パルスレベル発生部 36 ピッチ音源パルス発生部 37 線形予測合成フィルタ 39 減算処理部 40 第2パルスレベル合成部 44 遅延回路 45 レベル制御部 46 加算処理部 111 パルス発生部 112 線形予測合成フィルタ 310 遅延回路 311 レベル制御部 313 減算処理部 314 最小化判定部
フロントページの続き (72)発明者 三宅 正泰 東京都港区虎ノ門二丁目3番13号 国際電 気株式会社内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 音声信号からパラメータ(線形予測係
    数、音源パルスレベル、ピッチ周期)を抽出し、このパ
    ラメータを、音声信号に代わって、音声信号を示す符号
    として出力する音声符号化方法において、上記ピッチ周
    期で定まる相隣り合う音源パルスの中間位置に1つ又は
    2つ以上の音源パルスを得るような、第2パルスレベル
    を、上記ピッチ周期及び音源パルスレベルを利用して作
    成し、この第2パルスレベルを含めた4つのパラメータ
    を、音声信号に代わって、音声信号を示す符号として出
    力する音声符号化方法。
  2. 【請求項2】 上記音源パルスレベルは閉ループで求
    め、第2パルスレベルは音源パルスレベルとピッチ周期
    とで合成した合成音声波形を遅延させて求めることとし
    た請求項1の音声符号化方法。
  3. 【請求項3】 請求項1又は2の符号化方法で出力され
    た4つのパラメータを受け取り音声符号を復号する音声
    合成方法。
JP4229772A 1992-08-28 1992-08-28 音声符号化方法及び音声合成方法 Pending JPH0675598A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4229772A JPH0675598A (ja) 1992-08-28 1992-08-28 音声符号化方法及び音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4229772A JPH0675598A (ja) 1992-08-28 1992-08-28 音声符号化方法及び音声合成方法

Publications (1)

Publication Number Publication Date
JPH0675598A true JPH0675598A (ja) 1994-03-18

Family

ID=16897438

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4229772A Pending JPH0675598A (ja) 1992-08-28 1992-08-28 音声符号化方法及び音声合成方法

Country Status (1)

Country Link
JP (1) JPH0675598A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6351490B1 (en) 1998-01-14 2002-02-26 Nec Corporation Voice coding apparatus, voice decoding apparatus, and voice coding and decoding system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6351490B1 (en) 1998-01-14 2002-02-26 Nec Corporation Voice coding apparatus, voice decoding apparatus, and voice coding and decoding system

Similar Documents

Publication Publication Date Title
US4852169A (en) Method for enhancing the quality of coded speech
KR101023460B1 (ko) 신호 처리 방법, 처리 장치 및 음성 디코더
JPS5912186B2 (ja) 雑音の影響を減少した予測音声信号符号化
JP2707564B2 (ja) 音声符号化方式
EP0747879B1 (en) Voice signal coding system
JP2903533B2 (ja) 音声符号化方式
JPH07129195A (ja) 音声復号化装置
US6061648A (en) Speech coding apparatus and speech decoding apparatus
US4845753A (en) Pitch detecting device
JPH0675598A (ja) 音声符号化方法及び音声合成方法
JPH07168597A (ja) 音声装置の周期性を強化する方法
JP2747956B2 (ja) 音声復号装置
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JPS6134697B2 (ja)
JP2615991B2 (ja) 線形予測型音声分析合成装置
JPH05224698A (ja) ピッチサイクル波形を平滑化する方法及び装置
JPS61262800A (ja) 音声符号化方式
JPH05165497A (ja) コード励振線形予測符号化器及び復号化器
JPH01261700A (ja) 音声符号化方式
JP2898641B2 (ja) 音声符号化装置
JPH0122640B2 (ja)
JP2853126B2 (ja) マルチパルス符号化装置
JP2560486B2 (ja) マルチパルス符号化装置
JPH10232698A (ja) 話速変換装置
JPH07261796A (ja) 音声符号化復号化装置