JPH01209500A - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JPH01209500A
JPH01209500A JP63036204A JP3620488A JPH01209500A JP H01209500 A JPH01209500 A JP H01209500A JP 63036204 A JP63036204 A JP 63036204A JP 3620488 A JP3620488 A JP 3620488A JP H01209500 A JPH01209500 A JP H01209500A
Authority
JP
Japan
Prior art keywords
speech
synthesis
unit
units
phoneme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63036204A
Other languages
English (en)
Other versions
JP2880507B2 (ja
Inventor
Yoshinori Kosaka
芳典 匂坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
A T R JIDO HONYAKU DENWA KENKYUSHO KK
Original Assignee
A T R JIDO HONYAKU DENWA KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by A T R JIDO HONYAKU DENWA KENKYUSHO KK filed Critical A T R JIDO HONYAKU DENWA KENKYUSHO KK
Priority to JP63036204A priority Critical patent/JP2880507B2/ja
Publication of JPH01209500A publication Critical patent/JPH01209500A/ja
Application granted granted Critical
Publication of JP2880507B2 publication Critical patent/JP2880507B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は、音声の合成方式に関するもので、特に、音
声単位の編集、結合および変型によって音声合成を行な
う方式に関するものである。
[従来の技術] 現在側われている音声合成方式では、内容の異なった音
声を出力するために、音素、音節、単語および文節とい
った音声単位を予め蓄えておき、それらの変型や結合に
より音声を合成する方式を採用している。通常、これら
の音声単位は、予め定められた使用箇所に依存して数個
用意されるか、あるいは、音韻論的な単位に合わせて1
個用意される。しかし、自然な出力音声を得るためには
、出力したい内容の可変度に応じて、複数個の音声単位
が必要であることが指摘されてきた。
そのため、母音・子音・母音(VCV) 、子音・母音
・子音(CVC)および2音節連鎖(CVCv)など、
長い音声単位を用いることにより隣接する音韻による影
響を取入れた合成方式や、基本周波数(ピッチ)を多段
階に分けて発生した複数の音声単位を用いる合成方式な
どが考案されてきている。
[発明が解決しようとする課題] これらの合成方式では、用意されている音声単位の候補
数が少ないので、出力したい音声内容に対応した音韻系
列記号が与えられた後、音声単位の選択をするために、
画一的でかつ局所的な基準が用いられている。したがっ
て、合成された音声の品質は低いものとなっている。品
質の高い音声の合成を行なうためには、多くの音声単位
数を準備することが必要である。しかし、単に音声単位
を増やして種々の音韻構造を持つ多種類の音声単位を音
声単位集合として用意しても、従来のこれらの合成方式
を用いたのでは、多くの音声単位の中から合理的かつ効
率良く適切な音声単位を選出することができないという
課題がある。
この発明は、上記のような課題を解決するためになされ
たもので、多くの音声単位を含む音声単位集合の中から
、与えられた選択基準を満たす評価関数に基づき、合理
的でかつ効率良く音声単位系列を選択することのできる
音声合成方式を提供することを目的とする。
[課題を解決するための手段] この発明に係る音声合成方式は、予め任意の長さの音韻
連接単位からなる音声単位集合を準備しておき、入力さ
れた音部系列記号信号について音声単位集合の中から使
用する可能性のあるすべての音声単位候補群を選出し、
選出されたすべての音声単位候補群の中から所定の基準
に基づいて使用すべき音声単位を決定するものである。
【作用コ この発明における音声合成方式は、音声単位集合の中か
ら入力された音韻系列記号信号について使用する可能性
のあるすべての音声単位候補群を予め整理して蓄えてお
くので、そこから効率良く、使用すべき音声単位を決定
することができる。
[発明の実施例コ 以下、この発明の実施例を図面を用いて詳細に説明する
第1図は、この発明による音声合成方式を示すブロック
図である。
第1図を参照して、入力端子1には、出力したい音声内
容に対応した音韻系列記号信号ならびにアクセントおよ
び息継ぎ位置などの韻律制御信号が入力される。入力さ
れた音韻系列記号信号は入力音韻系列処理部2に与えら
れ、入力音韻系列処理部2は入力された音韻系列記号を
適当に分割した部分音韻系列を生成する。合成単位エン
トリファイル4は、音声の合成に必要な種々の音声合成
単位情報を予め蓄えておくためのものである。合成単位
ラティス生成部3は、入力音韻系列処理部2から出力さ
れる部分音韻系列の中から、合成単位として予め蓄えら
れて存在するものを、合成単位エントリファイル4を検
索することによって見い出し、合成に用いられる可能性
のある音声合成単位候補のすべてをラティスの形式で列
挙して音声テンプレート決定部5に与える。
音声テンプレートファイル7は、音声として出力するの
に必要な情報が蓄えられている。音声テンプレート決定
部5は、合成単位ラティス生成部3で得られた合成単位
ラティスを用い、使用可能な音声テンプレートの組合わ
せのうちから、予め定められた選択基準に基づき最適な
ものを決定し、決定された音声テンプレートについて音
声テンプレートファイル7から音声として出力するのに
必要な情報を得る。この決定方法は、選択基準を選ぶこ
とによって自由に制御することが可能であり、たとえば
、合成に要求される音声テンプレートへの条件、すなわ
ち、合成単位ラティス生成部3で得られた合成単位ラテ
ィスが持つ出力音韻環境や、韻律制御信号を受けて韻律
制御モジュール6が出力する出力韻律パラメータ値と音
声テンプレートファイル7に存在する合成用テンプレー
トの持つ条件(抽出音部環境および韻律パラメータ値)
との整合性や、さらに、音声テンプレート間の接続容易
性などをもとに決定する方法である。
テンプレート結合部8は、音声テンプレート決定部5に
よって決定されたテンプレートを、韻律制御モジュール
6によって与えられる値によって伸縮し、テンプレート
間の変形および結合処理を行ない、音声合成パラメータ
系列を音声合成器9に出力する。音声合成器9は、テン
プレート結合部8で得られた音声合成パラメータ系列に
よって駆動され、出力端子10に合成された音声波形を
出力する。
第2図は、この発明の実施例に用いられる合成単位エン
トリファイルの一例を示す図である。
この合成単位エントリファイルは、国語辞典内の重要語
5240単語の音声を音声テンプレートとして持つ場合
に生成した合成単位エントリファイルの一部を示してい
る。このファイルは音声の合成単位を検索する効率を高
めるために、各合成単位が構成音韻数ごとに階層化され
、木構造を持つ辞書形式に整理されている。第2図は第
1ないし第4階層の一部を示したものであり、各合成単
位エントリごとに、音韻系列名A1その合成単位テンプ
レート総数81テンプレートを含む単語の格納位置(始
点C1、終点C2)、一階層下の(すなわち右に1音韻
長い)音声単位エントリの総数D1およびそれらの格納
位置(始点E1、終点E2)を示す値が蓄えられている
。これから、たとえば、合成単位エントリ/a/は全部
で3523テンプレート存在し、それらを含む単語はテ
ンプレートファイル中の単語リストの35124番地か
ら75691番地に格納されており、また、/a/を先
行音韻として持つ2音韻連接エントリ/ a N /、
/aa/、−/aZ/は全部で37個存在し、それらは
本エントリファイル中の756番地から1936936
番地されていることがわかる。
第3図は、この発明の実施例における合成ラティスの作
成の様子を示す図である。
第3図では、第2図で示された合成単位エントリファイ
ルを用いて、入力音韻系列記号の「花が咲き出したJ 
/hanagasakidashita/を入力した場
合に作成された合成単位ラティスの一部が示されている
。この例では、最初にエントリファイルの検索により/
h/から始まる単位エントリとして最長の/ h a 
n a /が見い出され、その検索過程でより短い/h
/、/ h a /および/ h a n /の単位エ
ントリが見い出され、第3図に示したようなエントリフ
ァイル内の情報を読出すことができる。この結果、たと
えば/hana/は10個のテンプレートを持ち、それ
らは、/hana/(r花J ) 、/hana/ (
「鼻J ) 、−/hanayaka/ (r華やか」
)などの単語音声サンプルに含まれていることがわかる
第4図は、この発明の実施例におけるある選択基準を仮
定した場合の合成単位ラティスから選択された音声単位
とそのテンプレートが含まれる単語音声を示す図である
第4図では、第3図で示した入力例について、(1)子
音から母音への遷移箇所の連続性優先、(2)有声音連
続箇所の連続性優先、(3)長単位優先、(4)単位間
の連続性重視などの音声テンプレートを決定するための
4つの基準が仮定されている。図に示されるように、最
初の/ h a na/は単語音声サンプル/ h a
 n a b a n a s hii/(r華々しい
」)の語頭から得られ、/ga/、/s a/、 /k
 i da/および/ s h i ta/は、それぞ
れ、/nagasa/(r長さ」)dashi/(r引
出し」)および/ a s h i ta/(「明日」
)から得られる。これらの基準による選択の具体的実現
方法としては、たとえば、Yoshinori  Sa
gisaka、Hirokazu  5ato等により
1986年4月に発表された“Word  Ident
ification  Method  for  J
apanese  Text−to−3peach  
Conversion  System” と題された
論文(Proc、   of  ICASSP  86
 2411頁−2414頁)に示されるような、各選択
基準の優先度に応じた選択のコスト付けを行なうことに
より、従来、言語処理における形態素同定法に見られる
選択手法等が適用できる。
また、この発明による音声合成方式における音声合成単
位の選択方法は、上記で説明したような4つの基準に限
られるものではなく、選択基準間の優先度が明確に規定
できるものであれば、基準内容、基準個数などによらず
適用可能である。
以上で得られた音声テンプレートの影響パラメ−タ系列
は、さらに韻律制御モジュール6から与えられる音韻時
間長、振幅および基本周波数などの出力韻律パラメータ
値に基づいて、変形が加えられ、結合され、音声合成器
8に送られ、合成された音声波形が出力端子10を介し
て出力される。
以上の説明から明らかなように、この発明の一実施例に
よる音声合成方式は、合成用単位の抽出環境情報を格納
した合成単位エントリファイルの使用により、多数個の
音声単位列の中から効率良く所望の音声単位列を選択で
きる利点を有するとともに、選択基準の変更に対しても
柔軟に対処できるため、使用する現在の音声合成技術お
よびそれらの進展に対し、容易に適用できる利点を有す
る。
また、複数個の任意の長さの音韻連接単位からなる音声
単位集合を用いた音声合成を可能とするため、音声単位
の結合部で生ずる接続歪および音声単位の抽出環境と使
用環境の相違に起因する歪による音声品質の劣化に対し
て、柔軟に対処することが可能なため、良好な音声品質
を持つ音声の合成が期待できる。
[発明の効果] 以上のように、この発明によれば、予め任意の長さの音
韻連接単位からなる音声単位集合を準備し、入力された
音韻系列記号信号について音声単位集合の中から使用す
る可能性のあるすべての音声単位候補群を予め整理して
蓄え、その音声単位候補群の中から所定の基準に基づき
使用すべき音声単位を決定するようにしたので、使用す
べき音声単位を決定するのに、予め蓄えられた音声単位
候補群を参照することができ、効率良く使用すべき音声
単位を決定することができる。
【図面の簡単な説明】
第1図は、この発明による音声合成方式を示すブロック
図である。第2図は、この発明の実施例に用いられる合
成単位エントリファイルの一例を示す図である。第3図
は、この発明の実施例における合成ラティスの作成の様
子を示す図である。 第4図は、この発明の実施例における合成単位ラティス
から選択された音声単位とそのテンプレートが含まれる
単語音声を示す図である。 図において、1は入力端子、2は入力音韻系列処理部、
3は合成単位ラティス生成部、4は合成単位エントリフ
ァイル、5は音声テンプレート決定部、6は韻律制御モ
ジュール、7は音声テンプレートファイル、8はテンプ
レート結合部、9は音声合成器、10は出力端子、Aは
音韻系列名、Bは合成単位テンプレート総数、C1およ
びC2はテンプレートを含む単語の格納位置の始点およ
び終点、Dは一階層下の音声単位エントリの総数、El
およびE2は一階層下の音声単位エントリの格納位置の
始点および終点である。 特許出願人 株式会社エイ・ティ・アール第1図 第3図 )z7U?ei J、i ifj人職9asakida
shitaバー”OX し””J第4図

Claims (1)

  1. 【特許請求の範囲】  出力したい音声内容に対応した音韻系列記号信号と韻
    律制御信号とから任意の語彙の音声合成を行なう方式、
    および既発声音声の編集により音声合成を行なう方式で
    あって、 予め任意の長さの音韻連接単位からなる音声単位集合を
    準備し、 前記音韻系列記号信号を受けて、前記音声単位集合から
    音声合成に使用する可能性のあるすべての音声単位候補
    群を選出し、 前記すべての音声単位候補群の中から所定の基準に基づ
    いて使用すべき音声単位を決定する、音声合成方式。
JP63036204A 1988-02-17 1988-02-17 音声合成方法 Expired - Lifetime JP2880507B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63036204A JP2880507B2 (ja) 1988-02-17 1988-02-17 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63036204A JP2880507B2 (ja) 1988-02-17 1988-02-17 音声合成方法

Publications (2)

Publication Number Publication Date
JPH01209500A true JPH01209500A (ja) 1989-08-23
JP2880507B2 JP2880507B2 (ja) 1999-04-12

Family

ID=12463211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63036204A Expired - Lifetime JP2880507B2 (ja) 1988-02-17 1988-02-17 音声合成方法

Country Status (1)

Country Link
JP (1) JP2880507B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6847932B1 (en) 1999-09-30 2005-01-25 Arcadia, Inc. Speech synthesis device handling phoneme units of extended CV

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6132167A (ja) * 1984-07-23 1986-02-14 Ricoh Co Ltd カナ漢字変換処理装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6132167A (ja) * 1984-07-23 1986-02-14 Ricoh Co Ltd カナ漢字変換処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6847932B1 (en) 1999-09-30 2005-01-25 Arcadia, Inc. Speech synthesis device handling phoneme units of extended CV

Also Published As

Publication number Publication date
JP2880507B2 (ja) 1999-04-12

Similar Documents

Publication Publication Date Title
US6094633A (en) Grapheme to phoneme module for synthesizing speech alternately using pairs of four related data bases
US5905972A (en) Prosodic databases holding fundamental frequency templates for use in speech synthesis
US8566099B2 (en) Tabulating triphone sequences by 5-phoneme contexts for speech synthesis
US6505158B1 (en) Synthesis-based pre-selection of suitable units for concatenative speech
EP1138038B1 (en) Speech synthesis using concatenation of speech waveforms
US8775185B2 (en) Speech samples library for text-to-speech and methods and apparatus for generating and using same
US6035272A (en) Method and apparatus for synthesizing speech
JPH10171484A (ja) 音声合成方法および装置
US7069216B2 (en) Corpus-based prosody translation system
JPH0887297A (ja) 音声合成システム
JPH08335096A (ja) テキスト音声合成装置
US6847932B1 (en) Speech synthesis device handling phoneme units of extended CV
Breen et al. A phonologically motivated method of selecting non-uniform units
van Rijnsoever A multilingual text-to-speech system
JPH01209500A (ja) 音声合成方法
EP1589524B1 (en) Method and device for speech synthesis
JP2894447B2 (ja) 複合音声単位を用いた音声合成装置
JPH06318094A (ja) 音声規則合成装置
JP3378448B2 (ja) 音声素片選択方法,音声合成装置,及び命令記憶媒体
JP3279261B2 (ja) 定型文コーパス作成装置、方法及び記録媒体
JP2002049386A (ja) テキスト音声合成装置、テキスト音声合成方法及びその方法を記録した記録媒体
EP1640968A1 (en) Method and device for speech synthesis
Lyudovyk et al. Unit Selection Speech Synthesis Using Phonetic-Prosodic Description of Speech Databases
JPH07160290A (ja) 音声合成方式
Heggtveit et al. Intonation Modelling with a Lexicon of Natural F0 Contours

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090129

Year of fee payment: 10