JPS59204098A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPS59204098A
JPS59204098A JP7961883A JP7961883A JPS59204098A JP S59204098 A JPS59204098 A JP S59204098A JP 7961883 A JP7961883 A JP 7961883A JP 7961883 A JP7961883 A JP 7961883A JP S59204098 A JPS59204098 A JP S59204098A
Authority
JP
Japan
Prior art keywords
synthesis
band
speech
sound source
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7961883A
Other languages
English (en)
Inventor
佐藤大和
板倉文忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP7961883A priority Critical patent/JPS59204098A/ja
Publication of JPS59204098A publication Critical patent/JPS59204098A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Reciprocating, Oscillating Or Vibrating Motors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は合成単位音声を線形予測分析して得られる線
形予測パラメータを、合成しようとする任意音声に応じ
て用いて音声合成を行う音声合成装置に関するものであ
る。
く背 景〉 任意の音声を合成する手法は、合成単位の結合、音調パ
タンの生成、音韻時間長の設定などが一定の「規則」に
基づいてなされることから、「規則による合成Jとも呼
゛ばれる。「規則による合成Jは、また十分満足のゆく
品質レベルに達していない。
その用4由の一つはアクセント、イントネーション、リ
ズムなどいわゆる韻律上の規則が不十分であって、人間
が発声する韻律の自然性に及ばないということもあるが
、音声合成装置が人間の肉声に近いものを実現しえない
という問題点があった。
その後者の問題を解決するために、音韻の複合形式を合
成単位として用いるとともに、音諒の生成に関して、従
来のように有声音ではパルス状波形、無声音では白雑音
を使用するのではなり、線形予測分析で得られる残差信
号から切り出した駆動音源波形要素を用いることにより
、品質が改善できることが明らかになってきた。
更に合成音の品質を向上させる方法として、音声の周波
数帯域゛を広げることが考えられる。例えはO〜3KH
zとO〜6 K 1−1zとの帯域の音声を比較すると
、子音の周波数成分は高域にまで広がっているため、広
帯域音声の方が明瞭性、音質ともに優れていることは明
らかである。しかし、広帯域信号を分析して合成単位を
いったん作成してし1うと、従来技術ではその帯域の音
声しか合成できないという欠点があった。音声合成の使
用目的によっては、合成単位の情報量はできるだけ少な
くして経済化を図ることが要求される場合もあれば、高
い音声品質を要求しない場合もある。しかし、従来の格
外・合成装置においてはその要求に応じて全く独立した
音声合成装置が構成されていた。
〈発明の目的〉 この発明は前記の問題を解決する手段を提供するもので
あり、音声の広帯域化によって高い品質の合成音が得ら
れるとともに、必要に応じて狭帯域の音声を簡単に選択
することができる音声合成装置を得ることを目的とする
〈実施例〉 以下、図面を用いてこの発明の実施例を詳細に説明する
第1図において、入力端子1より、合成すべき音声の文
字系列、句読点、アクセント、イントネーション記号等
が入力されると、合成情報作成部2はその入力された文
字系列を読み(官能)の系列でいったん表現したあと、
合成単位名(子音−母音−子音、子音−母音など)の系
列に変換する。
また、合成規則パラメータ・メモリ3を参照しつつ、ア
クセント、イントネーション記号などに基づいて、合成
すべき音声の基本周波数の時間ノくタン、音節の振幅、
各母音・子音の継続時間の情報を生成し、音声合成制御
部4に転送する。合成規則パラメータ・メモリ3には単
語のアクセント型に対応する基本周波数バタンやアクセ
ントの大きさと基本周波数の関係、イントネーション型
を定めるパラメータテンポと時間軸伸縮率との関係、そ
の他音声の「規則による合成」に必要な音声の種々の性
質をパラメータの形式で表現されたものが蓄積されてい
る。
音声合成Mii制御部4は音声低域信号合成部5と音声
高域信号合成部6とに合成単位名、基本周期、音源振幅
、フレーム長(合成サンプル数)を供給しつつ音声合成
を制御する。音声低域信号合成部5及び音声高域信号合
成部6は、例えばそれぞれ、 0〜4Kl(z及び4〜
8 K +−1z帯の音声信号を合成し、これら音声信
号を加算器7で加え合せ、0〜8K[(z帯の音声信号
を得て音声波形バッフアメ、ET IJ 8に書き込む
。音声波形バッフアノモリ8は二面のタフルバソファ構
成とされ、メモリ8への書き込みと読み取りを面切り替
え制御で行いつ\その読み取られた音声信号をDA変換
器9で連続的な音声波形として端子10に出力する。
第2図は音声低域信号合成部5の実施例を示す。
音声高域信号合成部6もハードウェアとしては侶声低域
信号合成部5と同一構成である。
合成単位となる音声は、あらかじめ複数の周波数帯域(
この実施例の場合は2帯域)に分割し、各帯域信号を低
域信号に変換したのち、各帯域毎に線形予測分析し、P
ARCOR係数やLSPパラメータなどのスペクトルパ
ラメータを抽出するとともに、合成単位の無音部、摩擦
部、破裂部、母音過渡部、母音定常部などを定めたセグ
メントデータとともに各帯域毎の合成単位スペクトルパ
ラメータメモリ11に蓄積しておく。捷だ同時に線形予
測分析で得られる残差信号に関して、有声音については
母音過渡部、母音定常部、子音部などの音声セグメント
毎に、代表的な1ピッチ残差悄号を切り出し、無声音区
間については残差信号そのものを取シ出すことを各帯域
毎に行って、合成単位駆動音源要素メモリ12に蓄積す
る。
鳴声合成に際して音声合成制御部4から転送された合成
単位名、基本周期、音源振幅に基づき、読出制御回路1
3を介して当該合成単位の駆動音源要素をメモリ12か
ら読み出し、駆動音源生成部14において音源振幅情報
に基づき音源要素の振幅調整を行い、また基本周期に基
づき音源要紫のくり返し連続波形を生成し、駆動音源メ
モリ15に書き込む。
また一方、当該合成単位のスペクトルパラメータを読出
制御回路16を介してメモリ11から取出し、いったん
スペクトルパラメータバッファメモリ17に書き込む。
平滑化回路18は稙オ[]演算を行う回路であって、前
記バッファメモリ17中のスペクトルパラメータに関し
て以下のような重みづき平均処理による平滑化を行う。
f+A 搏0□−’F−t Wt−fPf イ旦し、  Σ  Wj エ I 一−t Pfニスベクトルパラメータ Wl:重み係数 この重み係数の包絡は中心部が最大となるガウス波形、
三角波などの波形であシ、音声合成単位のパラメータ間
の過渡(急変)が平滑化される。この平滑化されたスペ
クトルパラメータの時21列(は17+z−ムτにスペ
クトルパラメータレジスタ19に書き込まれる。
音声合成テイジタルフィルタ2oは、駆動音源メモリ1
5の音源波形が駆動信号として入力され、スペクトルパ
ラメータレジスタ19のバラタ−りによってフィルタ特
性が制御されて音声波形を合成する。合成の際、■フレ
ームのサンプル数(〕v −、t、 長)がレジスタ2
1に書き込まれており、Iサンプルの音声を合成する毎
にフレームカウンタ22を1進め、そのカウンタ22の
内容を比較器23によってレジスタ21の内容とが比較
され、■フレーム分の合成の完了が’Ah 超されると
、音声合成制御部4は新たに1フレ一ム分のスペクトル
パラメータをレジスタ19に転送するとともに、音源バ
ッファメモリ15も更新し、次のフレームの合成に入る
このようにして合成された音声波形は、周波数笈侯器2
4によってもとの帯域の信号に変換されて出力される。
周波数変換の手法に関しては、例えば特願昭54−04
2858号“適応予測符号化方式″明細誓に詳細に記述
されている。
第11ノ]において、広帯域音声信号を合成する心安の
ある」場合は音声低域信号合成部5と音声高域信号合成
部6を用いるが、低域信号のみの合成品ケjで良い場合
には、高域信号合成部6を使用しないか、面域1.ゴ号
合成都6を装置に実装しなければ良い、。
一′1′たこの元明例では合成単位の音声イを号を低域
と高域との2 ;1iiH域に分割して、それぞれのス
ペクトルパラメータと、駆動音源波形要素を用いる手法
を述へ/こが、帯域をより多く分割して神々の品′質の
合成−)3声を選択j」」能にすることは、全く同一手
法の拡張で聞単にできるととは謁゛うまでもない。
」、た駆動1名源としては線形予測分析で得られる残1
:′−(il−シl包・1)Ji“])シて用いる場合
に限らず、パルス状波形と自信1ン°)とのボli合せ
を用いてもよい、この場合−11・駆動−呂諒要系メモ
リ12の代りに指示されたピンチ族Jυ]のパルスを発
生ずる手段と、白雑音発生器とを設け、これらの出力の
レベルか制御されて駆動i3諒18号として駆動君源メ
七り15へ6己・:意すればよい。、 く効 果〉 以上説明したように、この発明によれば合成音声の広帯
域化による品質向上が図れるばかりでなく、音声合成の
適用領域によって必要な音声帯域を選択できるため、柔
軟性ある任意音声合成装置を構成できる利点がある。例
えば音声高域信号合成部6をカード化しておき、工場出
荷時に、高品質が要求きれる音声合成装置については晋
声尚域信号合成部6のカードを差込んで出荷するように
する。このようにして音声高域信号合成部6以外は、低
品質音声合成装置、高品質音声合成装置とも共通となり
、それだけ安価に生産できる。
【図面の簡単な説明】
第1図はこの発明の一実施例を示すブロック図、第2図
は音声合成部の実施例を示すブロック図である。 l二人力端子、2:合成情報作成部、3:合成規則パラ
メータメモリ、4:音声合成制御部、5:音声低域信号
合成部、6:音声高域信号合成部、7:加算器、8:音
声波形バッファメモリ、9:DA変換器、1o:出力端
子、11:合成単位スベク)・ルパラノークメモリ、1
2:合成単位、駆動1に源要素ノモ’) 、1.3 :
 Hn出制御回路、14:;駆動音諒生成151S、】
5:1駆動音源ノモ!J、16:新出ili制御回路、
J7:スペクトルパラノータハソフアメモリ、18:平
滑化回路、19ニスベクトルパラメータレジスタ、20
:γ3声合J&テイジタルフィルタ、21:フレームJ
〈レジスタ、22:フレーム長カウンク、23:比較器
、24:J閏波数変換器。 生テ許出願人  1」本電信亀話公社

Claims (1)

    【特許請求の範囲】
  1. (1)音声合成のための合成単位音声を複数の周波数帯
    域に分割し、それぞれの帯域信号の線形予測分析によっ
    て得られる線形予測パラメータを蓄積する蓄積手段と、
    上記分割された周波数帯域に対応した駆動信号を発生す
    る駆動音源手段と、合成すべき音声信号に応じて合成単
    位の線形予測パラメータを上記蓄積手段から読み出し、
    それら読み出された線形予測パラメータを結合して各帯
    域毎の線形予測パラメータ時系列を生成する手段と、上
    記駆動音源手段から各帯域ごとの、駆動音源波形を生成
    する手段と、その各弗域の駆動音源波形及び上記各帯域
    毎の線形予測パラメータ時系列より各帯域の音声波形を
    それぞれ合成する手段と、その合成した各帯域の音声波
    形を統合する手段とから構成される音声合成装置3゜
JP7961883A 1983-05-07 1983-05-07 音声合成装置 Pending JPS59204098A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7961883A JPS59204098A (ja) 1983-05-07 1983-05-07 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7961883A JPS59204098A (ja) 1983-05-07 1983-05-07 音声合成装置

Publications (1)

Publication Number Publication Date
JPS59204098A true JPS59204098A (ja) 1984-11-19

Family

ID=13695043

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7961883A Pending JPS59204098A (ja) 1983-05-07 1983-05-07 音声合成装置

Country Status (1)

Country Link
JP (1) JPS59204098A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0363698A (ja) * 1989-08-02 1991-03-19 Sumitomo Electric Ind Ltd 音声合成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0363698A (ja) * 1989-08-02 1991-03-19 Sumitomo Electric Ind Ltd 音声合成装置

Similar Documents

Publication Publication Date Title
US5524172A (en) Processing device for speech synthesis by addition of overlapping wave forms
Macon et al. A singing voice synthesis system based on sinusoidal modeling
US7249021B2 (en) Simultaneous plural-voice text-to-speech synthesizer
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
KR101016978B1 (ko) 소리 신호 합성 방법, 컴퓨터 판독가능 저장 매체 및 컴퓨터 시스템
JP4510631B2 (ja) 音声波形の連結を用いる音声合成
JPS59204098A (ja) 音声合成装置
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JPS58168097A (ja) 音声合成装置
JPS5880699A (ja) 音声合成方式
JPH09179576A (ja) 音声合成方法
JP3310217B2 (ja) 音声合成方法とその装置
JPS5915996A (ja) 音声合成装置
JPS58129500A (ja) 歌声合成装置
JP3515268B2 (ja) 音声合成装置
JPS60153099A (ja) 規則型音声合成装置
JP2002244693A (ja) 音声合成装置および音声合成方法
JPH06175675A (ja) 音声合成装置の継続時間長制御方法
JP2004206144A (ja) 基本周波数パタン生成方法、及びプログラム記録媒体
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JPH0553595A (ja) 音声合成装置
JPH01187000A (ja) 音声合成装置
Macon et al. E. Bryan George** School of Electrical and Computer Engineering, Georgia Institute of Technology, Atlanta, GA 30332-0250
JPS63210899A (ja) 音声合成装置
JPS63285596A (ja) 音声合成における発話速度変更方式