JPH0833744B2

JPH0833744B2 - 音声合成装置

Info

Publication number: JPH0833744B2
Application number: JP61002481A
Authority: JP
Inventors: 典正野村
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1986-01-09
Filing date: 1986-01-09
Publication date: 1996-03-29
Anticipated expiration: 2011-03-29
Also published as: GB2185370B; KR870007477A; KR900009170B1; US4862504A; GB2185370A; JPS62160495A; GB8631052D0

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は滑らかさのある合成音声を効果的に生成し得
る音声合成装置に関する。

〔発明の技術的背景とその問題点〕

マン・マシン・インターフェースの重要な役割を担う
技術として音声の合成出力がある。

この合成音声は、従来より専ら、予め録音されている
音声を編集処理して作成されている。しかしこの録音編
集方式は、品質の高い合成音声を得ることができる反
面、合成出力可能な単語やフレーズの種類とその数に限
りがあると云う問題がある。

そこで任意の入力文字列を解析してその音韻情報と韻
律情報とを求め、これらの情報から予め定められた規則
に基いて合成音声を生成する手法が開発されている。こ
の手法は規則合成方式と称され、任意の単語やフレーズ
の合成音声を比較的簡単に生成し得ると云う利点があ
る。

然し乍ら、その合成音声の品質が前述した録音編集方
式に比較して悪いと云う問題がある。例えば、了解度の
点ではかなり高い品質の合成音声を生成することができ
るが、その滑らかさに難点がある為、聞取り難いと云う
問題があった。

〔発明の目的〕

本発明はこのような事情を考慮してなされたもので、
その目的とするところは、規則合成される音声の滑らか
さの向上を図り、その聞取り易さの向上を図ることので
きる音声合成装置を提供することにある。

〔発明の概要〕

本発明は、入力文字列を解析して求められる音韻記号
列から音声パラメータ列を生成するに際し、音声合成の
単位となる音声素片が置かれている環境、例えば音声素
片としての音節の直前に存在する母音の種類に応じて、
その音節に対する音節パラメータを求め、この音節パラ
メータを結合して上記音声パラメータ列を求めて規則合
成に供するようにしたものである。

具体的には音節に対する音節パラメータを、その音節
の直前に存在する母音の種別毎に予めそれぞれ求めてお
き、音韻記号列中の音節に対する音節パラメータを求め
るとき、その音節の直前に存在する母音に応じて上記複
数の音節パラメータの中の１つを選択するようにしたも
のである。

〔発明の効果〕

かくして本発明によれば、音声素片、例えば音節の繋
がりに応じた音声パラメータ列が生成されるので、規則
合成される音声の滑らかさの向上を図り得る。しかも、
合成音声の了解度の低下を招くことなく、その滑らかさ
を確保することが可能となる。これ故、自然性の高い、
高品質な合成音声を簡易に生成することができる等の実
用上多大なる効果が奏せられる。

〔発明の実施例〕

以下、図面を参照して本発明の一実施例につき説明す
る。

第１図は実施例方式を適用して構成される音声合成装
置の要部概略構成図である。

音声合成に供される単語またはフレーズは、それを表
現する文字列として入力される。文字列解析装置１はこ
の入力文字列を解析し、入力文字列に対応する音韻記号
列および韻律記号列をそれぞれ生成している。

音声パラメータ列生成装置２は上記音韻記号列を入力
し、音声合成の単位となる音声素片についてパラメータ
ファイル3a,3b,3c,3dを参照してその音声素片パラメー
タを求め、これらの音声素片パラメータを結合して音声
の声道特性を表現する音声パラメータ列を生成してい
る。尚、上記音声素片パラメータの結合は、通常直線補
間法が用いられる。

具体的には、例えば音声素片を音節とした場合、音韻
記号列から検出され音節毎にパラメータファイル3a,3b,
3c,3dを参照して音節パラメータを求め、これらの音節
パラメータを結合して音声パラメータ列を生成してい
る。

一方、韻律パラメータ列生成装置４は、上記韻律記号
列に従ってその韻律パラメータ列を生成している。

音声合成器５は、このようにして生成された音声パラ
メータ列と韻律パラメータ列とに従って、所定の音声合
成規則を適用して前記入力文字列に対応した合成音声を
生成し、これを出力している。

ここで、前記パラメータファイル3a,3b,3c,3dを参照
した音声パラメータ列生成装置２による音声パラメータ
列の生成について更に詳しく説明する。

今、音声合成の単位である音声素片が、子音（Ｃ）と
母音（Ｖ）との組合せからなる音節（CV）として定義さ
れるものとする。この場合、文字列解析装置１で求めら
れた音韻記号列は、音節単位に分解することができる。

例えば『適確；てきかく』なる文字列を入力した場
合、第２図に示すようにその音韻記号列は［tekikaku］
として求められる。

但し、/t/ ,/k/は子音の音韻記号であり、/e/,/i/,/
a/,/u/は母音の音韻記号である。

しかしてこの音韻記号列を音節単位に分割すると、音
節の区切りを［・］として［te・ki・ka・ku］なる４つの音節を得ることが可能となる。従来の一般的
な音声規則合成にあっては、このような各音節毎にその
音節パラメータを求め、これらの音節パラメータを結合
して音声パラメータ列を求めていた。

これに対して本方式に係る音声パラメータ列生成装置
２では、音声素片（音節）が置かれている環境を考慮し
てその音声パラメータ列を生成するようにしている。即
ち、上述した如く求められた各音節に対して、各音節の
直前に存在する母音を配慮してその音節パラメータを求
めるようにしている。具体的には、音節の直前に存在す
る母音の種類に応じて、その音節パラメータを求めるよ
うにしている。

そこで本装置では、各音節の直前に存在する母音の種
類に応じて４つのパラメータファイル3a,3b,3c,3dを準
備し、音節の直前に存在する母音の種別に応じた音節パ
ラメータを得るようにしている。

ここで第１のパラメータファイル3aは、音節の直前に
母音が存在しない場合、つまり語頭を為す音節に対する
音節パラメータを格納している。また第２のパラメータ
ファイル3bは、直前の母音が/a/,/o/,/u/の場合に用い
る音節パラメータを格納したものである。また第３のパ
ラメータファイル3cはその直前母音が/i/の場合、更に
第４のパラメータファイル3dはその直前母音が/e/の場
合の音節パラメータをそれぞれ格納している。

尚、５つの母音毎にそれぞれパラメータファイルを準
備することも勿論可能であるが、ここではその声道近似
特性から、口の横方向への拡がりを伴う母音/i/,/e/に
ついてのみ独立なパラメータファイルを準備し、母音/a
/,/o/,/u/についてはこれをひとまとめにしたパラメー
タファイルとしている。

この工夫によって、音節パラメータを記憶する為の回
路規模の不本意な増大が抑えられている。

尚、語頭用のパラメータファイル3aは、例えば単音節
単位に発生された自然音声を分析し、その分析結果をパ
ラメータ化して作成される。

つぎに直前母音が/i/であるときのパラメータファイ
ル3cは、直前母音が/i/となる２音節の自然音声を分析
し、その第２音節目のパラメータのみを切出して作成さ
れる。具体的には、例えば『池；いけ』等の自然音声を
分析し、［ike］なる音韻列中の第２音節/ke/の部分の
分析結果を抽出し、これをパラメータ化して直前母音が
/i/であるときのパラメータファイル3cが作成される。

直前母音が/e/である音節のパラメータも同様にして
作成され、前述したパラメータファイル3dが作成され
る。

更に直前母音が/a/,/o/,/u/の場合に用いる音節パラ
メータは、例えば直前母音が/a/となる２音節の自然音
声について分析し、その第２音節のみを切出して上述し
た例と同様にして作成すれば良い。この場合、直前母音
が/o/または/u/となる２音節の自然音声を分析し、そこ
から第２音節のみを切出す作業を省くことができる。

尚、直前母音が/o/となる２音節の自然音声を分析
し、その第２音節のみを切出して直前母音が/a/,/o/,/u
/の場合に用いる音節パラメータを作成する場合には、
直前母音が/a/または/u/となる２音節の自然音声を分析
し、そこから第２音節のみを切出す作業を行う必要はな
い。

しかして音声パラメータ列生成装置２は、前記音韻記
号列の各音節について、その直前に存在する母音の種別
を判定し、その判定結果に応じて該音節に対する音節パ
ラメータを求めるべきパラメータファイルを選択してい
る。そして各音節毎に選択されたパラメータファイルか
ら、その音節に対する音節パラメータを求め、それらの
音節パラメータを結合して音声パラメータ列を生成して
いる。

例えば前述した［te・ki・ka・ku］なる音韻列の音声
パラメータ列を求める場合には、先ず第１番目の音節
［te］について、語頭用のパラメータファイル3aを参照
してその音節パラメータを求める。

次に第２番目の音節［ki］については、その直前の第
１音節の母音が/e/であることから、パラメータファイ
ル3dを参照してその音節パラメータを求める。同様にし
て第３音節［ka］については、その直前の母音が/i/で
あることから、パラメータファイル3cを参照してその音
節パラメータを求め、更に第４音節［ku］については、
その直前の母音が/a/であることから、パラメータファ
イル3bを参照してその音節パラメータを求める。

このようにしてその直前母音に応じて４つのパラメー
タファイル3a,3b,3c,3dから選択的に求められる音節パ
ラメータを順次補間結合することにより、前記［te・ki
・ka・ku］なる音韻列の音声パラメータ列が求められ
る。

かくしてこのようにして音声パラメータ列を生成する
本装置によれば、音声素片である音節に対してそれぞれ
求められる音節パラメータが、その直前の音節の母音に
よる変化の影響を考慮したものとなる為、これに基いて
規則合成される音声は自然性の高い非常に滑らかなもの
となる。しかも規則合成の利点を反映した了解度の高い
ものとなる。従って、音声了解度が高く、自然性の良好
な聞取り易い合成音声を効果的に得ることが可能とな
る。

また上述したように直前母音に応じたパラメータファ
イルを準備し、これをその直前母音に応じて選択的に用
いれば良いので、そのパラメータ列の生成を始めとする
音声合成処理が簡単である等の効果も奏せられる。

尚、本発明は上述した実施例に限定さるものではな
い。ここでは規則合成の単位となる音声素片を音節とし
て説明したが、音素を音声素片とする場合にも同様に適
用することが可能である。その他、本発明はその要旨を
逸脱しない範囲で種々変形して実施することができる。

【図面の簡単な説明】

第１図は本発明の一実施例方式を適用した音声合成装置
の概略構成図、第２図は実施例装置における音声パラメ
ータ列の生成過程を模式的に示す図である。１……文字列解析装置、２……音声パラメータ列生成装
置、3a,3b,3c,3d……パラメータファイル、４……韻律
パラメータ列生成装置、５……音声合成器。

Claims

【特許請求の範囲】

【請求項１】入力文字列を解析してその音韻記号列と韻
律情報とを求める文字列解析手段と、音節の直前に母音が存在しない語頭をなす音節パラメー
タを格納した語頭用のファイル及び音節の直前に存在す
る母音の種類に応じて分類された音節パラメータを格納
したファイルからなり、上記音節パラメータが子音
（Ｃ）と母音（Ｖ）との組み合わせ（CV）のみによって
定義されたパラメータファイルと、上記文字列解析手段によって求められた音韻記号列に対
し、各音節の直前に存在する母音の有無及び母音の種類
に応じて上記パラメータファイルを参照して音声パラメ
ータ列を生成する音声パラメータ列生成手段と、上記文字列解析手段によって求められた前記韻律情報に
基づいて韻律パラメータ列を生成する韻律パラメータ列
生成手段と、上記音声パラメータ列生成手段により生成された音声パ
ラメータ列と上記韻律パラメータ列生成手段によって生
成された韻律パラメータ列とに従って音声を規則合成す
る音声合成手段とを具備したことを特徴とする音声合成
装置。