JPH02232700A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH02232700A
JPH02232700A JP1052871A JP5287189A JPH02232700A JP H02232700 A JPH02232700 A JP H02232700A JP 1052871 A JP1052871 A JP 1052871A JP 5287189 A JP5287189 A JP 5287189A JP H02232700 A JPH02232700 A JP H02232700A
Authority
JP
Japan
Prior art keywords
circuit
residual signal
voice
signal
fundamental period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1052871A
Other languages
English (en)
Other versions
JP2588963B2 (ja
Inventor
Kenzo Ito
憲三 伊藤
Yamato Sato
大和 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP1052871A priority Critical patent/JP2588963B2/ja
Publication of JPH02232700A publication Critical patent/JPH02232700A/ja
Application granted granted Critical
Publication of JP2588963B2 publication Critical patent/JP2588963B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、音声信号の基本周期を任意に変更する必要
のある音声合成装置において、合成音声の品質劣化を最
小にするように基本周期を自由に変化できる音声合成装
置に関するものである.(従来の技術) 線形予測分析で得られる残差信号を駆動音源信号とする
残差駆動型音声分析合成技術を用いて、この種の装置を
実現するためには、基本周期に同期した残差信号の切り
出しを行う必要がある。従来、この残差信号の切り出し
処理は、残差信号のピーク近傍から1基本周期に相当す
る区間の信号を適当に切り出すことにより行われていた
.(発明が解決しようとする課題) しかし、このようにして切り出した残差信号を用いて音
声の基本周期を変更した場合、必ずしも切り出し位置と
切り出し窓長が最適になっているとは限らず、合成音声
の品質が大きぐ劣化する場合があった(例えば特公昭5
9−014752号公報、音声合成方式参照). この発明の目的は、前述したような従来技術で行ってい
た残差信号の切り出しを合成時のスペクトル歪が最少と
なるように繰り返し演算によって実現し、基本周期変更
時に生ずる合成音声の品質劣化を軽減する音声合成装置
を提供するものである. (課題を解決するための手段) この発明にかかる音声合成装置は、音声の線形予測分析
を行って入力音声のスペクトル包結情報と残差信号を抽
出する線形予測分析回路と、抽出された残差信号波形の
ピークを検出する残差信号ピーク検出回路と、検出され
たピークを基準点として残差信号を切り出す残差信号切
り出し回路と、その切り出された残差信号を用いて基本
周期が所定の周期に変更された音源信号を生成する基本
周期変更回路と、その音源信号を用いて音声を合成する
音声合成回路と、もとの入力音声と合成音声のスペクト
ル歪を計算するスペクトル歪計算回路と、基本周期を変
更した場合に生ずる合成時のスペクトル包絡歪を最小に
するように残差信号を切り出す位置と窓長を制御する残
差信号切り出し制御回路とからなる。
〔作用} この発明においては、残差信号のピークを検出し、そのピークを基準点として残差信号を切り出し、これを所定の周期になるように並べかえして音源信号を作り、この音源信号とスペクトル包絡情報とから音声合成し、もとの入力音声と合成音声のスペクトル歪が最小になるように残差信号の切り出しを制御する. (実施例〕
第1図はこの発明の一実施例の構成を示すブロック図で
ある.第2図に残差信号波形の切り出し窓と切り出し位
置の関係を示す。
第1図において、1は音声入力端子、2は線形予測分析
回路で、入力された音声信号のスペクトル包絡特性と残
差信号を抽出する.3は残差信号ピーク検出回路で、残
差信号のピーク位置を決定するものである.4は残差信
号切り出し回路で、切り出し窓と切り出し位置を切り出
す.5は残差信号切り出し制御回路、6は基本周期変更
回路で、基本周期Tmに従って並べかえを行う.7は音
声合成回路で、合成音を作成する.8はスペクトル歪計
算回路、9は合成音出力端子である。
第1図の実施例の動作は次のようである.音声信号は線
形予測分析回路2にょクて音声のスペクトル包絡情報と
残差信号を抽出する。残差信号の一部分を第2図に示す
.10.11.12・・・・・・はビークを示し、CW
は切り出し窓.cpは切り出し位置を示す.次にピーク
位置検出回路3によって得られた残差信号のピーク10
.11.12・・・・・・の位置を決定する.残差信号
切り出し回路4では残差信号を、ピーク位置を中心に第
2図に示すような切り出し窓Cwと切り出し位置Cpに
より切り出し、基本周期変更回路6によって新たな基本
周期Tmに従って並べかえる。音声合成回路7では、こ
の新しい残差信号系列と線形予測分析回路2で抽出され
たスペクトル包絡情報を用いて合成音を得る.次にこの
基本周期Tmを変更した合成音と入力音声信号のスペク
トル分析を行い、両者のスペクトル包絡歪をスペクトル
歪計算回路8で計算する。そして第1図に示すように、
残差信号の切り出しからスペクトル歪の計算までの過程
を、切り出し窓Cwと切り出し位置Cpを変化して順次
繰り返し、スペクトル歪が最も小さい条件の合成音を最
終出力とする。このとき、最適な切り出し位置Cpと窓
長をもった駆動音源信号が得られる.スペクトル包絡歪
は、例えば人間の聴覚特性と比較的対応が良いとされて
いる、LPCケブストラム距離尺度などが使える。
なお、この装置の音声合成回路7とスペクトル歪計算回
路8に波形修正回路を付加することによって、切り出し
窓Cwと切り出し位置Cpの決定だけではなく、出力合
成音声のスペクトル包絡特性をさらに入力音声のスペク
トル包絡特性に近づけることも可能であり、この時には
、さらに高品質の合成音が期待できる. ′s3図に、この発明の効果を調べるために行った実験
結果の一例を示す。
この例は、本装置を用いて単語のアクセント型を変更し
た合成音声の品質を主観評価法の1つであるオピニオン
試験法によって調べた結果である(ケース1).単語の
アクセント型は、例えば「賞品」を「商品」に変更する
。比較のために残差信号の切り出しを固定にし、常にピ
ークの位置から1周期分を切り出す方法(ケース2)に
よって同様なアクセント型の変更を行った場合の結果を
並べて示した.縦軸は平均オビニ才ン値(MOS)が等
しくなる時は信号対振幅相関雑音比(MOS等価Q値)
を示す.したがって、この値が大きくなるほど合成音の
品質が良いことを示している。同実験桔果からケース1
の合成音はケース2に比較するとQ値で約9dBの向上
が認められ、この発明の効果が大きいことを示している
この発明は、合成音の品質を劣化することなく音声の基
本周期を変更できる利点があるため、イントネーション
や声質を自由に制御できる高品質音声合成系への適用が
可能である. (発明の効果) この発明は以上説明したように、残差信号の切り出しを
、合成時のスペクトル歪が最小となるように繰り返し演
算によって行うので、基本周期変更時に生ずる合成音声
の品質劣化を著しく軽減できる利点がある.
【図面の簡単な説明】
第1図はこの発明の一実施例を示す構成図、第2図は残
差信号波形の切り出し窓と切り出し位置の関係を説明す
るための図、第3図はこの発明の効果を調べるために行
った主観評価実験結果の一例を示す図である. 図中、1は音声入力端子、2は線形予測分析回路、3は
残差信号ピーク検出回路、4は残差信号切り出し回路、
5は残差信号切り出し制御回路、6は基本周期変更回路
、7は音声合成回路、8はスペクトル歪計算回路、9は
合成音出力端子、10〜12は残差信号のピーク、Cp
は切り出し位置、CWは切り出し窓である. 第2図 第1図 第3図

Claims (1)

    【特許請求の範囲】
  1.  音声の線形予測分析を行つて入力音声のスペクトル包
    絡情報と残差信号を抽出する線形予測分析回路と、抽出
    された残差信号波形のピークを検出する残差信号ピーク
    検出回路と、検出されたピークを基準点として残差信号
    を切り出す残差信号切り出し回路と、その切り出された
    残差信号を用いて基本周期が所定の周期に変更された音
    源信号を生成する基本周期変更回路と、その音源信号を
    用いて音声を合成する音声合成回路と、もとの入力音声
    と合成音声のスペクトル歪を計算するスペクトル歪計算
    回路と、基本周期を変更した場合に生ずる合成時のスペ
    クトル包絡歪を最小にするように残差信号を切り出す位
    置と窓長を制御する残差信号切り出し制御回路とを具備
    することを特徴とする音声合成装置。
JP1052871A 1989-03-07 1989-03-07 音声合成装置 Expired - Lifetime JP2588963B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1052871A JP2588963B2 (ja) 1989-03-07 1989-03-07 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1052871A JP2588963B2 (ja) 1989-03-07 1989-03-07 音声合成装置

Publications (2)

Publication Number Publication Date
JPH02232700A true JPH02232700A (ja) 1990-09-14
JP2588963B2 JP2588963B2 (ja) 1997-03-12

Family

ID=12926942

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1052871A Expired - Lifetime JP2588963B2 (ja) 1989-03-07 1989-03-07 音声合成装置

Country Status (1)

Country Link
JP (1) JP2588963B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998006091A1 (fr) * 1996-08-02 1998-02-12 Matsushita Electric Industrial Co., Ltd. Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications
JP2008026565A (ja) * 2006-07-20 2008-02-07 Fujitsu Ltd ピッチ変換方法及び装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56129000A (en) * 1980-03-14 1981-10-08 Hitachi Ltd Wind hanging calculator
JPS5888798A (ja) * 1981-11-20 1983-05-26 松下電器産業株式会社 音声合成方式
JPS60123900A (ja) * 1983-12-09 1985-07-02 株式会社日立製作所 法則音声合成装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56129000A (en) * 1980-03-14 1981-10-08 Hitachi Ltd Wind hanging calculator
JPS5888798A (ja) * 1981-11-20 1983-05-26 松下電器産業株式会社 音声合成方式
JPS60123900A (ja) * 1983-12-09 1985-07-02 株式会社日立製作所 法則音声合成装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998006091A1 (fr) * 1996-08-02 1998-02-12 Matsushita Electric Industrial Co., Ltd. Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications
US6226604B1 (en) 1996-08-02 2001-05-01 Matsushita Electric Industrial Co., Ltd. Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus
US6421638B2 (en) 1996-08-02 2002-07-16 Matsushita Electric Industrial Co., Ltd. Voice encoding device, voice decoding device, recording medium for recording program for realizing voice encoding/decoding and mobile communication device
US6549885B2 (en) 1996-08-02 2003-04-15 Matsushita Electric Industrial Co., Ltd. Celp type voice encoding device and celp type voice encoding method
US6687666B2 (en) 1996-08-02 2004-02-03 Matsushita Electric Industrial Co., Ltd. Voice encoding device, voice decoding device, recording medium for recording program for realizing voice encoding/decoding and mobile communication device
JP2008026565A (ja) * 2006-07-20 2008-02-07 Fujitsu Ltd ピッチ変換方法及び装置
JP4757130B2 (ja) * 2006-07-20 2011-08-24 富士通株式会社 ピッチ変換方法及び装置

Also Published As

Publication number Publication date
JP2588963B2 (ja) 1997-03-12

Similar Documents

Publication Publication Date Title
EP1380029B1 (en) Time-scale modification of signals applying techniques specific to determined signal types
EP1829424B1 (en) Temporal envelope shaping of decorrelated signals
US8612237B2 (en) Method and apparatus for determining audio spatial quality
AU2006233504A1 (en) Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
JP2001100773A5 (ja)
US20080215344A1 (en) Method and apparatus for expanding bandwidth of voice signal
CA2222582A1 (en) Speech synthesizer having an acoustic element database
EP1426926B1 (en) Apparatus and method for changing the playback rate of recorded speech
KR20050086762A (ko) 정현파 오디오 코딩
JPH0431898A (ja) 音声雑音分離装置
SE470577B (sv) Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
US5452398A (en) Speech analysis method and device for suppyling data to synthesize speech with diminished spectral distortion at the time of pitch change
JPH02232700A (ja) 音声合成装置
US4845753A (en) Pitch detecting device
CA2026640C (en) Speech analysis-synthesis method and apparatus therefor
JP2841797B2 (ja) 音声分析・合成装置
JPS5925237B2 (ja) 音声分析合成方式の音声区間判定方法
JP2650355B2 (ja) 音声分析合成装置
RU2400831C1 (ru) Способ выделения сегментов квазистационарности при анализе речевого сигнала в вокодерах с линейным предсказанием
KR100359988B1 (ko) 실시간 화속 변환 장치
JPH0235994B2 (ja)
US20040234078A1 (en) Method for automatically testing output audio signals
JP2003316380A (ja) 会話を含む音の信号処理を行う前の段階の処理におけるノイズリダクションシステム
JPS5925238B2 (ja) 音声分析合成方式の音声区間判定方法
JP3263136B2 (ja) 信号のピッチ同期位置抽出方式及び信号合成方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071205

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081205

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091205

Year of fee payment: 13

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091205

Year of fee payment: 13