JP2880507B2 - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JP2880507B2
JP2880507B2 JP63036204A JP3620488A JP2880507B2 JP 2880507 B2 JP2880507 B2 JP 2880507B2 JP 63036204 A JP63036204 A JP 63036204A JP 3620488 A JP3620488 A JP 3620488A JP 2880507 B2 JP2880507 B2 JP 2880507B2
Authority
JP
Japan
Prior art keywords
speech
phoneme
unit
sequence
synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63036204A
Other languages
English (en)
Other versions
JPH01209500A (ja
Inventor
芳典 匂坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK
Original Assignee
EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK filed Critical EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK
Priority to JP63036204A priority Critical patent/JP2880507B2/ja
Publication of JPH01209500A publication Critical patent/JPH01209500A/ja
Application granted granted Critical
Publication of JP2880507B2 publication Critical patent/JP2880507B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は、音声の合成方式に関するもので、特に、
音声単位の編集、結合および変型によって音声合成を行
なう方式に関するものである。
[従来の技術] 現在使われている音声合成方式では、内容の異なった
音声を出力するために、音素、音節、単語および文節と
いった音声単位を予め蓄えておき、それらの変型や結合
により音声を合成する方式を採用している。通常、これ
らの音声単位は、予め定められた使用箇所に依存して数
個用意されるか、あるいは、音韻論的な単位に合わせて
1個用意される。しかし、自然な出力音声を得るために
は、出力したい内容の可変度に応じて、複数個の音声単
位が必要であることが指摘されてきた。
そのため、母音・子音・母音(VCV)、子音・母音・
子音(CVC)および2音節連鎖(CVCV)など、長い音声
単位を用いることにより隣接する音韻による影響を取入
れた合成方式や、基本周波数(ピッチ)を多段階に分け
て発生した複数の音声単位を用いる合成方式などが考案
されてきている。
[発明が解決しようとする課題] これらの合成方式では、用意されている音声単位の候
補数が少ないので、出力したい音声内容に対応した音韻
系列信号が与えられた後、音声単位の選択をするため
に、画一的でかつ局所的な基準が用いられている。した
がって、合成された音声の品質は低いものとなってい
る。品質の高い音声の合成を行なうためには、多くの音
声単位数を準備することが必要である。しかし、単に音
声単位を増やして種々の音韻構造を持つ多種類の音声単
位を音声単位集合として用意しても、従来のこれらの合
成方式を用いたのでは、多くの音声単位の中から合理的
かつ効率良く適切な音声単位を選出することができない
という課題がある。
この発明は、上記のような課題を解決するためになさ
れたもので、多くの音声単位を含む音声単位集合の中か
ら、与えられた選択基準を満たす評価関数に基づき、合
理的でかつ効率良く音声単位系列を選択することのでき
る音声合成方式を提供することを目的とする。
[課題を解決するための手段] この発明に係る音声合成方法は、合成されるべき音声
を音韻で表現した入力音韻系列に基づいて音声を合成す
る方法であって、複数の音韻が連なってなる複数の音韻
連接系列を含むファイルを準備し、入力音韻系列を分割
することにより複数の部分音韻系列を生成し、ファイル
から部分音韻系列の各々と同一部分を全部または一部に
含む音韻連接系列を選出し、その選出された音韻連接系
列の中から、少なくとも音声を合成するために決定され
るべき音声単位間の連続性が高くなるように、音声を合
成するために使用されるべき音韻連接系列を決定し、そ
の決定された音韻連接系列に含まれる上記同一部分を音
声単位と決定し、その決定された音声単位に基づいて音
声を合成するものである。
[作用] この発明に係る音声合成方法によれば、入力音韻系列
が任意に分割されることにより複数の部分音韻系列が生
成され、その部分音韻系列の各々と同一部分を含む音韻
連接系列が選出され、その選出された音韻連接系列の中
から音声を合成するために使用されるべき音韻連接系列
が決定される。この音韻連接系列の決定基準としては、
音声単位間の連続性を優先する他、子音から母音への遷
移箇所の連続性を優先したり、長い音韻連接系列を優先
したり、あるいは有声音の連続箇所の連続性を優先した
りするものである。続いて、上記決定された音韻連接系
列に含まれる上記同一部分が音声単位と決定され、その
決定された音声単位に基づいて音声が合成される。
[発明の実施例] 以下、この発明の実施例を図面を用いて詳細に説明す
る。
第1図は、この発明による音声合成方式を示すブロッ
ク図である。
第1図を参照して、入力端子1には、出力したい音声
内容に対応した音韻系列記号信号ならびにアクセントお
よび息継ぎ位置などの韻律制御信号が入力される。入力
された音韻系列記号信号は入力音韻系列処理部2に与え
られ、入力音韻系列処理部2は入力された音韻系列記号
を適当に分割した部分音韻系列を生成する。合成単位エ
ントリファイル4は、音声の合成に必要な種々の音声合
成単位情報(複数の音韻が連なってなる音韻連接系列)
を予め蓄えておくためのものである。合成単位ラティス
生成部3は、入力音韻系列処理部2から出力される部分
音韻系列の中から、合成単位として予め蓄えられて存在
するものを、合成単位エントリファイル4を検索するこ
とによって見い出し、合成に用いられる可能性のある音
声合成単位候補のすべてをラティスの形式で列挙して音
声テンプレート決定部5に与える。
音声テンプレートファイル7は、音声として出力する
のに必要な情報が蓄えられている。音声テンプレート決
定部5は、合成単位ラティス生成部3で得られた合成単
位ラティスを用い、使用可能な音声テンプレートの組合
わせのうちから、予め定められた選択基準に基づき最適
なものを決定し、決定された音声テンプレートについて
音声テンプレートファイル7から音声として出力するの
に必要な情報を得る。この決定方法は、選択基準を選ぶ
ことによって自由に制御することが可能であり、たとえ
ば、合成に要求される音声テンプレートへの条件、すな
わち、合成単位ラティス生成部3で得られた合成単位ラ
ティスが持つ出力音韻環境や、韻律制御信号を受けて韻
律制御モジュール6が出力する出力韻律パラメータ値と
音声テンプレートファイル7に存在する合成用テンプレ
ートの持つ条件(抽出音韻環境および韻律パラメータ
値)との整合性や、さらに、音声テンプレート間の接続
容易性などをもとに決定する方法である。
テンプレート結合部8は、音声テンプレート決定部5
によって決定されたテンプレートを、韻律制御モジュー
ル6によって与えられる値によって伸縮し、テンプレー
ト間の変形および結合処理を行ない、音声合成パラメー
タ系列を音声合成器9に出力する。音声合成器9は、テ
ンプレート結合部8で得られた音声合成パラメータ系列
によって駆動され、出力端子10に合成された音声波形を
出力する。
第2図は、この発明の実施例に用いられる合成単位エ
ントリファイルの一例を示す図である。
この合成単位エントリンファイルは、国語辞典内の重
要語5240単語の音声を音声テンプレートとして持つ場合
に生成した合成単位エントリファイルの一部を示してい
る。このファイルは音声の合成単位を検索する効率を高
めるために、各合成単位が構成音韻数ごとに階層化さ
れ、木構造を持つ辞書形式に整理されている。第2図は
第1ないし第4階層の一部を示したものであり、各合成
単位エントリごとに、音韻系列名A、その合成単位テン
プレート総数B、テンプレートを含む単語の格納位置
(始点C1、終点C2)、一階層下の(すなわち右に1音韻
長い)音声単位エントリの総数D、およびそれらの格納
位置(始点E1、終点E2)を示す値が蓄えられている。こ
れから、たとえば、合成単位エントリ/a/は全部で3523
テンプレート存在し、それらを含む単語はテンプレート
ファイル中の単語リストの35124番地から75691番地に格
納されており、また、/a/を先行音韻として持つ2音韻
連接エントリ/aN/、/aa/、…/aZ/は全部で37個存在し、
それらは本エントリファイル中の756番地から1936番地
に格納されていることがわかる。
第3図は、この発明の実施例における合成ラティスの
作成の様子を示す図である。
第3図では、第2図で示された合成単位エントリファ
イルを用いて、入力音韻系列記号の「花が咲き出した」
/hanagasakidashita/を入力した場合に作成された合成
単位ラティスの一部が示されている。この例では、最初
にエントリファイルの検索により/h/から始まる単位エ
ントリ(部分音韻系列)として最長の/hana/が見い出さ
れ、その検索過程でより短い/h/、/ha/および/han/の単
位エントリが見い出され、第3図に示したようなエント
リファイル内の情報を読出すことができる。この結果、
たとえば/hana/は10個のテンプレート(音韻連接系列)
を持ち、それらは、/hana/(「花」)、/hana/
(「鼻」)、…/hanayaka/(「華やか」)などの単語音
声サンプルに含まれていることがわかる。
第4図は、この発明の実施例におけるある選択基準を
仮定した場合の合成単位ラティスから選択された音声単
位とそのテンプレートが含まれる単語音声を示す図であ
る。
第4図では、第3図で示した入力例について、(1)
子音から母音への遷移箇所の連続性優先、(2)有声音
連続箇所の連続性優先、(3)長単位優先、(4)単位
間の連続性重視などの音声テンプレートを決定するため
の4つの基準が仮定されている。図に示されるように、
最初の/hana/は単語音声サンプル/hanabanashii/(「華
々しい」)の語頭から得られ、/ga/、/sa/,/kida/およ
び/shita/は、それぞれ、/nagasa/(「長さ」)、/mura
saki/(「紫」)、/hikidashi/(「引出し」)および/a
shita/(「明日」)から得られる。これらの基準によ
る選択の具体的実現方法としては、たとえば、Yoshinor
i Sagisaka、Hirokazu Sato等により1986年4月に発表
された“Word Identification Method for Japanese Te
xt−to−Speach Conversion System"と題された論文(P
roc.of ICASSP 86 2411頁−2414頁)に示されるよう
な、各選択基準の優先度に応じた選択のコスト付けを行
なうことにより、従来、言語処理における形態素同定法
に見られる選択手法等が適用できる。
また、この発明による音声合成方式における音声合成
単位の選択方法は、上記で説明したような4つの基準に
限られるものではなく、選択基準間の優先度が明確に規
定できるものであれば、基準内容、基準個数などによら
ず適用可能である。
以上得られた音声テンプレートの影響パラメータ系列
は、さらに韻律制御モジュール6から与えられる音韻時
間長、振幅および基本周波数などの出力韻律パラメータ
値に基づいて、変形が加えられ、結合され、音声合成器
8に送られ、合成された音声波形が出力端子10を介して
出力される。
以上の説明から明らかなように、この発明の一実施例
による音声合成方式は、合成用単位の抽出環境情報を格
納した合成単位エントリファイルの使用により、多数個
の音声単位列の中から効率良く所望の音声単位列を選択
できる利点を有するとともに、選択基準の変更に対して
も柔軟に対処できるため、使用する現在の音声合成技術
およびそれらの進展に対し、容易に適用できる利点を有
する。
また、複数個の任意の長さの音韻連接単位からなる音
声単位集合を用いた音声合成を可能とするため、音声単
位の結合部で生ずる接続歪および音声単位の抽出環境と
使用環境の相違に起因する歪による音声品質の劣化に対
して、柔軟に対処することが可能なため、良好な音質品
質を持つ音声の合成が期待できる。
[発明の効果] 以上のように、この発明によれば、複数の音韻が連な
ってなる複数の音韻連接系列を含むファイルを準備し、
入力音韻系列を分割することにより複数の部分音韻系列
を生成し、その部分音韻系列の各々と同一部分を含む音
韻連接系列をファイルから選出し、その選出された音韻
連接系列の中から音声を合成するために使用されるべき
音韻連接系列を決定し、その決定された音韻連接系列に
含まれる上記同一部分を音声単位と決定するようにした
ので、使用されるべき音声単位を決定するのにファイル
から選出さた音韻連接系列を参照することができ、効率
よく使用されるべき音声単位を決定することができる。
【図面の簡単な説明】
第1図は、この発明による音声合成方式を示すブロック
図である。第2図は、この発明の実施例に用いられる合
成単位エントリファイルの一例を示す図である。第3図
は、この発明の実施例における合成ラティスの作成の様
子を示す図である。第4図は、この発明の実施例におけ
る合成単位ラティスから選択された音声単位とそのテン
プレートが含まれる単語音声を示す図である。 図において、1は入力端子、2は入力音韻系列処理部、
3は合成単位ラティス生成部、4は合成単位エントリフ
ァイル、5は音声テンプレート決定部、6は音韻制御モ
ジュール、7は音声テンプレートファイル、8はテンプ
レート結合部、9は音声合成器、10は出力端子、Aは音
韻系列名、Bは合成単位テンプレート総数、C1およびC2
はテンプレートを含む単語の格納位置の始点および終
点、Dは一階層下の音声単位エントリの総数、E1および
E2は一階層下の音声単位エントリの格納位置の始点およ
び終点である。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 3/00,5/00 - 5/04 G06F 15/20

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】合成されるべき音声を音韻で表現した入力
    音韻系列に基づいて前記音声を合成する音声合成方法で
    あって、 複数の音韻が連なってなる複数の音韻連接系列を含むフ
    ァイルを準備し、 前記入力音韻系列を分割することにより複数の部分音韻
    系列を生成し、 前記ファイルから前記部分音韻系列の各々と同一部分を
    全部または一部に含む音韻連接系列を選出し、 前記選出された音韻連接系列の中から、少なくとも前記
    音声を合成するために決定されるべき音声単位間の連続
    性が高くなるように、前記音声を合成するために使用さ
    れるべき音韻連接系列を決定し、 前記決定された音韻連接系列に含まれる前記同一部分を
    音声単位と決定し、 前記決定された音声単位に基づいて前記音声を合成す
    る、音声合成方法。
JP63036204A 1988-02-17 1988-02-17 音声合成方法 Expired - Lifetime JP2880507B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63036204A JP2880507B2 (ja) 1988-02-17 1988-02-17 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63036204A JP2880507B2 (ja) 1988-02-17 1988-02-17 音声合成方法

Publications (2)

Publication Number Publication Date
JPH01209500A JPH01209500A (ja) 1989-08-23
JP2880507B2 true JP2880507B2 (ja) 1999-04-12

Family

ID=12463211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63036204A Expired - Lifetime JP2880507B2 (ja) 1988-02-17 1988-02-17 音声合成方法

Country Status (1)

Country Link
JP (1) JP2880507B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001100776A (ja) 1999-09-30 2001-04-13 Arcadia:Kk 音声合成装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6132167A (ja) * 1984-07-23 1986-02-14 Ricoh Co Ltd カナ漢字変換処理装置

Also Published As

Publication number Publication date
JPH01209500A (ja) 1989-08-23

Similar Documents

Publication Publication Date Title
US4862504A (en) Speech synthesis system of rule-synthesis type
US8224645B2 (en) Method and system for preselection of suitable units for concatenative speech
US6035272A (en) Method and apparatus for synthesizing speech
Rashid et al. Text normalization and diphone preparation for bangla speech synthesis
JP2761552B2 (ja) 音声合成方法
JP2880507B2 (ja) 音声合成方法
Chettri et al. Nepali text to speech synthesis system using esnola method of concatenation
JPH08335096A (ja) テキスト音声合成装置
van Rijnsoever A multilingual text-to-speech system
JP3109778B2 (ja) 音声規則合成装置
JPH07319497A (ja) 音声合成装置
US6847932B1 (en) Speech synthesis device handling phoneme units of extended CV
JP2894447B2 (ja) 複合音声単位を用いた音声合成装置
Furtado et al. Synthesis of unlimited speech in Indian languages using formant-based rules
Carlson et al. A text-to-speech system based on a phonetically oriented programming
JPH037995A (ja) 歌音声合成データの作成装置
JP2577372B2 (ja) 音声合成装置および方法
Zervas et al. A Greek TTS based on Non uniform unit concatenation and the utilization of Festival architecture
JP2675883B2 (ja) 音声合成方式
JP3318290B2 (ja) 音声合成方法および装置
JPH07160290A (ja) 音声合成方式
JPH06167989A (ja) 音声合成装置
JPS58168096A (ja) 複数言語音声合成装置
JPH07160291A (ja) 音声合成方式
JPH06138894A (ja) 音声合成装置及び音声合成方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090129

Year of fee payment: 10