JP2588963B2 - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP2588963B2
JP2588963B2 JP1052871A JP5287189A JP2588963B2 JP 2588963 B2 JP2588963 B2 JP 2588963B2 JP 1052871 A JP1052871 A JP 1052871A JP 5287189 A JP5287189 A JP 5287189A JP 2588963 B2 JP2588963 B2 JP 2588963B2
Authority
JP
Japan
Prior art keywords
residual signal
circuit
speech
spectrum
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1052871A
Other languages
English (en)
Other versions
JPH02232700A (ja
Inventor
憲三 伊藤
大和 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP1052871A priority Critical patent/JP2588963B2/ja
Publication of JPH02232700A publication Critical patent/JPH02232700A/ja
Application granted granted Critical
Publication of JP2588963B2 publication Critical patent/JP2588963B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、音声信号の基本周期を任意に変更する必
要のある音声合成装置において、合成音声の品質劣化を
最小にするように基本周期を自由に変化できる音声合成
装置に関するものである。
〔従来の技術〕
線形予測分析で得られる残差信号を駆動音源信号とす
る残差駆動型音声分析合成技術を用いて、この種の装置
を実現するためには、基本周期に同期した残差信号の切
り出しを行う必要がある。従来、この残差信号の切り出
し処理は、残差信号のピーク近傍から1基本周期に相当
する区間の信号を適当に切り出すことにより行われてい
た。
〔発明が解決しようとする課題〕
しかし、このようにして切り出した残差信号を用いて
音声の基本周期を変更した場合、必ずしも切り出し位置
と切り出し窓長が最適になっているとは限らず、合成音
声の品質が大きく劣化する場合があった(例えば特公昭
59−014752号公報、音声合成方式参照)。
この発明の目的は、前述したような従来技術で行って
いた残差信号の切り出しを合成時のスペクトル歪が最少
となるように繰り返し演算によって実現し、基本周期変
更時に生ずる合成音声の品質劣化を軽減する音声合成装
置を提供するものである。
〔課題を解決するための手段〕
この発明にかかる音声合成装置は、音声の線形予測分
析を行って入力音声のスペクトル包絡情報と残差信号を
抽出する線形予測分析回路と、抽出された残差信号波形
のピークを検出する残差信号ピーク検出回路と、検出さ
れたピークを基準点として残差信号を切り出す残差信号
切り出し回路と、その切り出された残差信号を用いて基
本周期が所定の周期に変更された音源信号を生成する基
本周期変更回路と、その音源信号を用いて音声を合成す
る音声合成回路と、もとの入力音声と合成音声のスペク
トル歪を計算するスペクトル歪計算回路と、基本周期を
変更した場合に生ずる合成時のスペクトル包絡歪を最小
にするように残差信号を切り出す位置と窓長を制御する
残差信号切り出し制御回路とからなる。
〔作用〕
この発明においては、残差信号のピークを検出し、そ
のピークを基準点として残差信号を切り出し、これを所
定の周期になるように並べかえして音源信号を作り、こ
の音源信号とスペクトル包絡情報とから音声合成し、も
との入力音声と合成音声のスペクトル歪が最小になるよ
うに残差信号の切り出しを制御する。
〔実施例〕
第1図はこの発明の一実施例の構成を示すブロック図
である。第2図に残差信号波形の切り出し窓と切り出し
位置の関係を示す。
第1図において、1は音声入力端子、2は線形予測分
析回路で、入力された音声信号のスペクトル包絡特性と
残差信号を抽出する。3は残差信号ピーク検出回路で、
残差信号のピーク位置を決定するものである。4は残差
信号切り出し回路で、切り出し窓と切り出し位置を切り
出す。5は残差信号切り出し制御回路、6は基本周期変
更回路で、基本周期Tmに従って並べかえを行う。7は音
声合成回路で、合成音を作成する。8はスペクトル歪計
算回路、9は合成音出力端子である。
第1図の実施例の動作は次のようである。音声信号は
線型予測分析回路2によって音声のスペクトル包絡情報
と残差信号を抽出する。残差信号の一部分を第2図に示
す。10,11,12……はピークを示し、CWは切り出し窓、Cp
は切り出し位置を示す。次にピーク位置検出回路3によ
って得られた残差信号のピーク10,11,12……の位置を決
定する。残差信号切り出し回路4では残差信号を、ピー
ク位置を中心に第2図に示すような切り出し窓Cwと切り
出し位置Cpにより切り出し、基本周期変更回路6によっ
て新たな基本周期Tmに従って並べかえる。音声合成回路
7では、この新しい残差信号系列と線形予測分析回路2
で抽出されたスペクトル包絡情報を用いて合成音を得
る。次にこの基本周期Tmを変更した合成音と入力音声信
号のスペクトル分析を行い、両者のスペクトル包絡歪を
スペクトル歪計算回路8で計算する。そして第1図に示
すように、残差信号の切り出しからスペクトル歪の計算
までの過程を、切り出し窓Cwと切り出し位置Cpを変化し
て順次繰り返し、スペクトル歪が最も小さい条件の合成
音を最終出力とする。このとき、最適な切り出し位置Cp
と窓長をもった駆動音源信号が得られる。スペクトル包
絡歪は、例えば人間の聴覚特性と比較的対応が良いとさ
れている。LPCケプストラム距離尺度などが使える。
なお、この装置の音声合成回路7とスペクトル歪計算
回路8に波形修正回路を付加することによって、切り出
し窓Cwと切り出し位置Cpの決定だけではなく、出力合成
音声のスペクトル包絡特性をさらに入力音声のスペクト
ル包絡特性に近づけることも可能であり、この時には、
さらに高品質の合成音が期待できる。
第3図に、この発明の効果を調べるために行った実験
結果の一例を示す。
この例は、本装置を用いて単語のアクセント型を変更
した合成音声の品質を主観評価法の1つであるオピニオ
ン試験法によって調べた結果である(ケース1)。単語
のアクセント型は、例えば「賞品」を「商品」に変更す
る。比較のために残差信号の切り出しを固定にし、常に
ピークの位置から1周期分を切り出す方法(ケース2)
によって同様なアクセント型の変更を行った場合の結果
を並べて示した。縦軸は平均オピニオン値(MOS)が等
しくなる時は信号対振幅相関雑音比(MOS等価Q値)を
示す。したがって、この値が大きくなるほど合成音の品
質が良いことを示している。同実験結果からケース1の
合成音はケース2に比較するとQ値で薬9dBの向上が認
められ、この発明の効果が大きいことを示している。
この発明は、合成音の品質を劣化することなく音声の
基本周期を変更できる利点があるため、イントネーショ
ンや音声を自由に制御できる高品質音声合成系への適用
が可能である。
〔発明の効果〕
この発明は以上説明したように、残差信号の切り出し
を、合成時のスペクトル歪が最小となるように繰り返し
演算によって行うので、基本周期変更時に生ずる合成音
声の品質劣化を著しく軽減できる利点がある。
【図面の簡単な説明】
第1図はこの発明の一実施例を示す構成図、第2図は残
差信号波形の切り出し窓と切り出し位置の関係を説明す
るための図、第3図はこの発明の効果を調べるために行
った主観評価実験結果の一例を示す図である。 図中、1は音声入力端子、2は線形予測分析回路、3は
残差信号ピーク検出回路、4は残差信号切り出し回路、
5は残差信号切り出し制御回路、6は基本周期変更回
路、7は音声合成回路、8はスペクトル歪計算回路、9
は合成音出力端子、10〜12は残差信号のピーク、Cpは切
り出し位置、CWは切り出し窓である。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】音声の線形予測分析を行って入力音声のス
    ペクトル包絡情報と残差信号を抽出する線形予測分析回
    路と、抽出された残差信号波形のピークを検出する残差
    信号ピーク検出回路と、検出されたピークを基準点とし
    て残差信号を切り出す残差信号切り出し回路と、その切
    り出された残差信号を用いて基本周期が所定の周期に変
    更された音源信号を生成する基本周期変更回路と、その
    音源信号を用いて音声を合成する音声合成回路と、もと
    の入力音声と合成音声のスペクトル歪を計算するスペク
    トル歪計算回路と、基本周期を変更した場合に生ずる合
    成時のスペクトル包絡歪を最小にするように残差信号を
    切り出す位置と窓長を制御する残差信号切り出し制御回
    路とを具備することを特徴とする音声合成装置。
JP1052871A 1989-03-07 1989-03-07 音声合成装置 Expired - Lifetime JP2588963B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1052871A JP2588963B2 (ja) 1989-03-07 1989-03-07 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1052871A JP2588963B2 (ja) 1989-03-07 1989-03-07 音声合成装置

Publications (2)

Publication Number Publication Date
JPH02232700A JPH02232700A (ja) 1990-09-14
JP2588963B2 true JP2588963B2 (ja) 1997-03-12

Family

ID=12926942

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1052871A Expired - Lifetime JP2588963B2 (ja) 1989-03-07 1989-03-07 音声合成装置

Country Status (1)

Country Link
JP (1) JP2588963B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69737012T2 (de) * 1996-08-02 2007-06-06 Matsushita Electric Industrial Co., Ltd., Kadoma Sprachkodierer, sprachdekodierer und aufzeichnungsmedium dafür
JP4757130B2 (ja) * 2006-07-20 2011-08-24 富士通株式会社 ピッチ変換方法及び装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56129000A (en) * 1980-03-14 1981-10-08 Hitachi Ltd Wind hanging calculator
JPS5888798A (ja) * 1981-11-20 1983-05-26 松下電器産業株式会社 音声合成方式
JPS60123900A (ja) * 1983-12-09 1985-07-02 株式会社日立製作所 法則音声合成装置

Also Published As

Publication number Publication date
JPH02232700A (ja) 1990-09-14

Similar Documents

Publication Publication Date Title
EP1380029B1 (en) Time-scale modification of signals applying techniques specific to determined signal types
US6044341A (en) Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice
Ainsworth Intrinsic and extrinsic factors in vowel judgments
Childers et al. Voice conversion: Factors responsible for quality
JPH06266390A (ja) 波形編集型音声合成装置
US20080215344A1 (en) Method and apparatus for expanding bandwidth of voice signal
JPH06230800A (ja) 音声データ圧縮及び再生の方法及び装置
US5452398A (en) Speech analysis method and device for suppyling data to synthesize speech with diminished spectral distortion at the time of pitch change
JP2588963B2 (ja) 音声合成装置
JP2001513225A (ja) 伸長オーディオ信号からの周期性の除去
JP2007025042A (ja) 音声合成装置および音声合成プログラム
JP2841797B2 (ja) 音声分析・合成装置
Hasan et al. An approach to voice conversion using feature statistical mapping
JP3197975B2 (ja) ピッチ制御方法及び装置
JPH08110796A (ja) 音声強調方法および装置
JP2650355B2 (ja) 音声分析合成装置
US11302300B2 (en) Method and apparatus for forced duration in neural speech synthesis
JPS5925237B2 (ja) 音声分析合成方式の音声区間判定方法
JP2654643B2 (ja) 音声分析方法
JP3515216B2 (ja) 音声符号化装置
JP3346200B2 (ja) 音声認識装置
JP3515215B2 (ja) 音声符号化装置
KR100359988B1 (ko) 실시간 화속 변환 장치
JP3263136B2 (ja) 信号のピッチ同期位置抽出方式及び信号合成方式
JP2002372982A (ja) 音響信号分析方法及び装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071205

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081205

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091205

Year of fee payment: 13

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091205

Year of fee payment: 13