JP2650355B2 - 音声分析合成装置 - Google Patents

音声分析合成装置

Info

Publication number
JP2650355B2
JP2650355B2 JP63237102A JP23710288A JP2650355B2 JP 2650355 B2 JP2650355 B2 JP 2650355B2 JP 63237102 A JP63237102 A JP 63237102A JP 23710288 A JP23710288 A JP 23710288A JP 2650355 B2 JP2650355 B2 JP 2650355B2
Authority
JP
Japan
Prior art keywords
waveform
sound source
circuit
frame
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63237102A
Other languages
English (en)
Other versions
JPH0284699A (ja
Inventor
裕久 田崎
邦男 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP63237102A priority Critical patent/JP2650355B2/ja
Publication of JPH0284699A publication Critical patent/JPH0284699A/ja
Application granted granted Critical
Publication of JP2650355B2 publication Critical patent/JP2650355B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声分析合成装置に関するものである。
〔従来の技術〕
音声の分析合成により音声情報の圧縮を行う方法とし
て、分析側で入力音声波形の周波数スペクトラム包絡形
状を表す特徴パラメータ(以降包絡パラメータと呼ぶ)
とピッチ周期を抽出し、合成側において前記包絡パラメ
ータとピッチ周期を用いて合成音声波形を生成する方式
(ボコーダと呼ばれている)が知られている。このボコ
ーダ方式では、分析部において有声/無声判別を行い、
有声音と判別した場合にはさらにピッチ抽出を行う。そ
して合成部において、前記有声/無声判別結果が有声音
である場合にはピッチ周期で繰り返すインパルス列、無
声音である場合には白色雑音を駆動音源として、包絡パ
ラメータを用いた合成フィルタを駆動することで合成音
声を得る。この方式は、比較的少ない伝送情報量で実用
上十分な明瞭性を持つ合成音声が得られる利点があるも
のの、入力音声に比べ個人性、自然性の欠落した貧弱な
音質であり、しばしば長時間の聴取に耐えないブザー音
を伴う欠点を持つ。
従来この音質改善法としては、例えば下記資料(1)
に示されるようなインパルス列等価音源を用いた有声音
源の改良法がある。
「高品質音声合成のためのインパルス列等価音源」 電子通信学会論文誌(1985−11) Vol.J68−A No.11 ……(1) 有声音区間の予測残差信号は分析フレーム長全体とし
てはその周波数スペクトルはほぼ平坦であるが、ピッチ
周期長以下の極短時間の周波数スペクトルは高域強調区
間と低域強調区間がピッチ周期毎に繰り返す構造を持
つ。資料(1)の方式においては、分析フレーム全体の
周波数スペクトラムの平坦性を保ちつつ、極短時間の周
波数スペクトルにピッチ周期毎に繰り返す変動を与えた
有声音源(インパルス列等価音源と呼ぶ)を生成し、こ
れを用いることで合成音声の音質に大きく寄与する有声
音区間の品質を改善するというものであった。
第3図はこの資料(1)に示された従来の方式を表す
ブロック図である。まず音声波形が音声波形入力端子3
を介して分析部1内の包絡パラメータ抽出回路4と有声
/無声判別回路5とピッチ抽出回路6にそれぞれ入力さ
れる。包絡パラメータ抽出回路4は前記音声波形より包
絡パラメータの算出を行い、そのパラメータを包絡パラ
メータ伝送路15を介して合成部2内の合成フィルタ回路
22に伝送する。有声/無声判別回路5は前記音声波形が
有声音区間であるか否かを判別し、判別結果をピッチ抽
出回路6に出力し、さらに有声/無声判別結果伝送路16
を介して合成部2内の音源切換回路21へ出力する。ピッ
チ抽出回路6は前記有声/無声判別結果が有声音区間で
ある場合に音声波形からピッチ周期分析を行い、抽出さ
れたピッチデータをピッチデータ伝送路17を介して合成
部2内のインパルス列等価音源生成回路24に出力する。
合成部2内のインパルス列等価音源生成回路24は予め与
えられる1ピッチ周期長のインパルス列等価音源を前記
ピッチ周期毎に繰り返し生成し音源切換回路21に出力す
る。無声音源生成回路20は白色雑音の生成を行い音源切
換回路21に出力する。音源切換回路21は前記有声/無声
判別結果が有声音である場合にインパルス列等価音源を
選択し、有声音以外の場合には白色雑音を選択し、選択
した音源波形を合成フィルタ回路22に出力する。そして
合成フィルタ回路22は、分析部1内の包絡パラメータ抽
出回路4より入力された包絡パラメータ及び前記音源波
形を用いて合成波形を生成し合成波形出力端子23より出
力するというものである。
〔発明が解決しようとする課題〕
以上説明したインパルス列等価音源を用いる従来の音
声分析合成装置では、合成音のブザー音的音質の若干の
低減効果が得られるが、本来、話者、音韻により変化す
る音源を固定音源で表しているため、個人性、自然性の
回復はほとんどなく、十分な音質改善は得られないとい
う課題があった。
本発明の目的は、予測残差波形に含まれる音源情報を
比較的少ない情報量で伝送し、ボコーダ方式特有のブザ
ー音的で、個人性、自然性の欠落した音質を改善するこ
とにある。
〔課題を解決するための手段〕
本発明に係る音声分析合成装置では、一定長の分析フ
レーム毎に該当フレームが有声音区間であると判定され
た場合にそのフレームの予測残差波形から1ピッチ周期
長の代表音源波形を切り出す代表音源抽出回路と、有限
個の音源ベクトルを記憶する符号帳メモリと、この音源
ベクトルの中から前記代表音源抽出回路で抽出された代
表音源に最も等価な音源ベクトルを最適音源ベクトルと
して選択する音源選択回路を備え、合成部において前記
最適音源ベクトルを用いて当該分析フレームの内の音源
波形を生成する音源生成回路と、この音源生成回路で生
成された音源波形により合成波形を生成する合成フィル
タを備えるように構成したものである。
〔作用〕
この発明における代表音源生成回路は有声音声の一定
長の分析フレーム内の予測残差波形からピッチ周期長の
代表音源波形を切り出し、音源選択回路は当該フレーム
の包絡パラメータを用いてこの代表音源から合成される
合成波形と最も波形歪が小さい合成波形を得る最適音源
ベクトルを符号帳メモリ内の音源ベクトル群より選択
し、音源生成回路はこの最適音源ベクトルを当該分析フ
レーム内でピッチ周期毎に並べることで音源波形を生成
する。
予測残差信号により合成フィルタ回路を駆動すること
で入力音声信号が再生されることから、この予測残差信
号を効率よく伝送することができればより入力音声信号
に近い合成音が得られることは明らかである。ボコーダ
の音質に大きく影響する有声音区間における予測残差波
形を視ると、概形が良く似た波形がピッチ周期で繰り返
す構造を持っており、1分析フレーム内において一つの
ピッチ長残差信号のみを切り出して伝送し、合成部では
これをピッチ周期毎とに並べることで音源波形を生成す
ることにすれば、この予測残差信号に含まれる冗長度を
大幅に削減して伝送することができる。さらに予め用意
した符号長ベクトル内から切り出して予測残差信号に対
する最適音源ベクトルを選択する方式を用いることによ
り、1分折フレーム当り数ビットの伝送情報量の付加に
より効率よくこの音源情報の伝送が実現できる。
〔発明の実施例〕
以下、この発明の一実施例を第1図及び第2図につい
て説明する。図において、7は逆フィルタ回路、8は代
表音源抽出回路、9及び18は符号帳メモリ、10、11及び
22は合成フィルタ回路、12は波形歪算出回路、13は比較
回路、14は音源ベクトル番号伝送路、19は1フレーム長
音源生成回路である。1〜6、15〜17、20〜23は従来例
と同じであるので説明を省略する。2aは予測残差波形、
2bは代表音源波形、2cは選択音源ベクトル、2dは1フレ
ーム長音源波形である。
分析部1内の逆フィルタ回路7は、包絡パラメータ抽
出回路4によって抽出された包絡パラメータを用いて、
入力端子3を介して入力された音声波形に逆フィルタ処
理を行い、得られた予測残差波形2aを代表音源抽出回路
8に出力する。代表音源抽出回路8は、有声/無声判別
回路5が有声音区間であると判別した場合に前記予測残
差波形2aから1ピッチ周期長の残差波形を代表音源波形
2bとして切り出し、得られた代表音源波形2bを合成フィ
ルタ回路10に出力する。切り出し処理の方法としては例
えば残差波形中振幅最大の部分の直前のゼロ交差点から
1ピッチ周期長の波形の切り出しを行う。予測残差波形
の中から振幅の大きな部分が先頭部近傍にくるように切
り出すことで、記憶しておく音源ベクトルとして振幅の
大きな部分が先頭部近傍にあるものだけにすることがで
き、音源ベクトル群の数を少なくできる。分析部1内の
符号帳メモリ9は、記憶している有限個の音源ベクトル
を順次合成フィルタ回路11に出力する。前記合成フィル
タ回路10及び11は、各々入力された音源ベクトルと上記
包絡パラメータを用いて合成波形を生成し、その合成波
形を波形歪算出回路12に出力する。波形歪算出回路12
は、代表音源波形2aを用いて得られた合成波形と符号帳
メモリ9に記憶されていた各音源ベクトルを用いて得ら
れた合成波形の間の波形歪を算出し、その結果を比較回
路13に出力する。比較回路13は前記波形歪を比較し、最
小の波形歪を与えた音源ベクトルの番号を音源ベクトル
番号伝送路14を介して合成部2内の符号帳メモリ18に出
力する。符号帳メモリ18は入力された音源ベクトル番号
により指定された選択音源ベクトル2cを1フレーム長音
源生成回路19に出力する。1フレーム長音源生成回路19
は前記選択音源ベクトル2cを、ピッチデータ伝送路17を
介して入力されたピッチ周期間隔で並べ立てることで1
フレーム長音源波形2dを生成し、これを音源切換回路21
に出力する。音源切換回路21は有声/無声判別結果伝送
路16を介して入力された有声/無声判別結果が有声音で
ある場合に前記1フレーム長音源波形2dを選択し、有声
音以外の場合には白色雑音を選択し、選択した音源波形
を合成フィルタ回路22に出力する。そして合成フィルタ
回路22は、分析部1内の包絡パラメータ抽出回路4より
入力された包絡パラメータ及び前記音源波形を用いて合
成波形を生成し合成波形出力端子23より出力する。
上記符号帳メモリ9内の有限個の音源ベクトルは、多
くの入力音声信号より上記分析部2内の代表音源抽出回
路8を用いて抽出した代表音源波形の集合中から所望の
個数だけ選択して予め用意する。その選択の方法として
は、例えば有声音区間の平均的なスペクトル包絡形状を
持つ合成フィルタ回路を構成し、この合成フィルタ回路
を前記代表音源波形の集合で駆動して得られる合成波形
における歪を最小にする基準のクラスタリング手法を用
いることができる。
〔他の実施例の説明、他の用途への転用例の説明〕
上記実施例では、各演算処理を回路内で実現する例に
ついて述べたが、これを信号処理プロセッサ等の汎用演
算装置によるソフトウエア処理により実現してもよい。
また、音源選択法として合成フィルタ出力波形における
歪を最小にする音源を選択する方式を述べたが、これを
包絡パラメータ及び音源波形をDFT等の周波数スペクト
ルで表しその周波数軸上における歪を最小にするように
選択する方式とすることもできる。
〔発明の効果〕
以上のように、この発明によれば、比較的少ない伝送
情報量により効率よく品質のよい合成音を合成できる有
声音音源情報の伝送が可能であり、インパルス列等等価
音源等の従来の固定音源を用いた装置で問題であったボ
コーダの合成音的な音が改善されたより自然で個人性豊
かな合成音が得られる。
【図面の簡単な説明】
第1図はこの発明の1実施例による音声分析合成装置を
示すブロック図、第2図はその実施例における代表音源
波形抽出と1フレーム長音源波形生成の様子を示す模式
図、第3図は従来の音声分析合成装置を示すブロック図
である。 図において1は分析部、2は合成部、3は音声波形入力
端子、4は包絡パラメータ抽出回路、5は有声/無声判
別回路、6はピッチ抽出回路、7は逆フィルタ回路、8
は代表音源抽出回路、9及び18は符号帳メモリ、10、11
及び22は合成フィルタ回路、12は波形歪算出回路、13は
比較回路、14は音源ベクトル番号伝送路、15は包絡パラ
メータ伝送路、16は有声/無声判別結果伝送路、17はピ
ッチデータ伝送路、19は1フレーム長音源生成回路、20
は無声音源生成回路、21は音源切換回路、23は合成波形
出力端子、24はインパルス列等価音源生成回路である。
2aは予測残差波形、2bは代表音源波形、2cは選択音源ベ
クトル、2dは1フレーム長音源波形である。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】音声波形の情報量圧縮を行う音声分析合成
    装置において、分析部に、入力音声波形を一定長の分析
    フレーム単位に上記入力音声波形のスペクトル包絡パラ
    メータを用いて逆フィルタリングし、上記分析フレーム
    の予測残差波形を求める逆フィルタ回路と、当該逆フィ
    ルタ回路で求められた上記予測残差波形から、当該予測
    残差波形の持つ1ピッチ周期長分を切り出し当該分析フ
    レームの代表音源波形とする代表音源抽出回路と、有限
    個の音源ベクトルを記憶する符号帳メモリと、上記代表
    音源抽出回路で切り出された代表音源波形に対して、上
    記スペクトル包絡パラメータを用いた合成処理を行う第
    1の合成回路と、上記符号帳メモリ内の上記音源ベクト
    ルに対して、上記スペクトル包絡パラメータを用いた合
    成処理を行う第2の合成回路と、上記第1及び第2の合
    成回路の合成結果の歪みを最小化するように上記符号帳
    メモリ内から最適な上記音源ベクトルを選択する音源選
    択回路とを備え、合成部に、上記分析部で求められた上
    記最適な音源ベクトルを上記分析フレーム内でピッチ周
    期毎に繰り返し並べ、上記分析フレームの音源波形を生
    成する1フレーム長音源生成回路と、当該1フレーム長
    音源生成回路で生成された上記音源波形を駆動源として
    上記スペクトル包絡パラメータを用いて合成波形を求め
    る合成フィルタ回路とを備えることを特徴とする音声分
    析合成装置。
JP63237102A 1988-09-21 1988-09-21 音声分析合成装置 Expired - Fee Related JP2650355B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63237102A JP2650355B2 (ja) 1988-09-21 1988-09-21 音声分析合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63237102A JP2650355B2 (ja) 1988-09-21 1988-09-21 音声分析合成装置

Publications (2)

Publication Number Publication Date
JPH0284699A JPH0284699A (ja) 1990-03-26
JP2650355B2 true JP2650355B2 (ja) 1997-09-03

Family

ID=17010443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63237102A Expired - Fee Related JP2650355B2 (ja) 1988-09-21 1988-09-21 音声分析合成装置

Country Status (1)

Country Link
JP (1) JP2650355B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06250694A (ja) * 1993-02-25 1994-09-09 Idou Tsushin Syst Kaihatsu Kk 音声符号化復号化装置
US6456964B2 (en) * 1998-12-21 2002-09-24 Qualcomm, Incorporated Encoding of periodic speech using prototype waveforms

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2508002B2 (ja) * 1986-06-24 1996-06-19 日本電気株式会社 音声符号化方法とその装置
JPS6337724A (ja) * 1986-07-31 1988-02-18 Fujitsu Ltd 符号化伝送装置

Also Published As

Publication number Publication date
JPH0284699A (ja) 1990-03-26

Similar Documents

Publication Publication Date Title
KR100427753B1 (ko) 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치
KR100615480B1 (ko) 음성 대역 확장 장치 및 음성 대역 확장 방법
JPH10307599A (ja) スプラインを使用する波形補間音声コーディング
JPH07248794A (ja) 音声信号処理方法
US4985923A (en) High efficiency voice coding system
US5812966A (en) Pitch searching time reducing method for code excited linear prediction vocoder using line spectral pair
JP2650355B2 (ja) 音声分析合成装置
JP3841596B2 (ja) 音素データの生成方法及び音声合成装置
JP2841797B2 (ja) 音声分析・合成装置
JP2003157100A (ja) 音声通信方法及び装置、並びに音声通信プログラム
JP2931059B2 (ja) 音声合成方式およびこれに用いる装置
JP3303580B2 (ja) 音声符号化装置
JP4433668B2 (ja) 帯域拡張装置及び方法
JP4438280B2 (ja) トランスコーダ及び符号変換方法
JP3510168B2 (ja) 音声符号化方法及び音声復号化方法
JP3515216B2 (ja) 音声符号化装置
JP2000298500A (ja) 音声符号化方法
JP3515215B2 (ja) 音声符号化装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP2001083996A (ja) 音声信号復号方法及び音声信号符号化復号方法
JP2000099094A (ja) 時系列信号処理装置
JP2001154683A (ja) 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体
JPH0235997B2 (ja)
JPWO2003042648A1 (ja) 音声符号化装置、音声復号化装置、音声符号化方法および音声復号化方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees