JP2856731B2 - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP2856731B2
JP2856731B2 JP61159946A JP15994686A JP2856731B2 JP 2856731 B2 JP2856731 B2 JP 2856731B2 JP 61159946 A JP61159946 A JP 61159946A JP 15994686 A JP15994686 A JP 15994686A JP 2856731 B2 JP2856731 B2 JP 2856731B2
Authority
JP
Japan
Prior art keywords
information
prosody
phoneme
symbol string
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61159946A
Other languages
English (en)
Other versions
JPS6315297A (ja
Inventor
義幸 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61159946A priority Critical patent/JP2856731B2/ja
Publication of JPS6315297A publication Critical patent/JPS6315297A/ja
Application granted granted Critical
Publication of JP2856731B2 publication Critical patent/JP2856731B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、音声規則合成技術を用いて記号列から合成
音声に変換する音声合成装置に関する。 (従来の技術) 一般に音声規則合成技術を用いて記号列から合成音声
に変換する音声合成装置において、変換の対象とされる
単語や文章が確実に音声として認識されるためには、合
成音声に韻律的特徴が含まれていること重要な要素とさ
れている。 従来からこのような合成音声に韻律的特徴を付与する
方式として、記号列に音韻情報と韻律情報とを含めて入
力しこれらを合成させるもの、音韻情報のみを入力しこ
の音韻情報に基づいてアクセント辞書等から韻律情報を
推定させるもの等がある。 (発明が解決しようとする問題点) ところで上記した前者の方式においては、単語や文章
の韻律的特徴を所望とするものにさせることができ、自
然で滑かな合成音声を得ることが可能であるが、音韻情
報の他に韻律情報を入力しなければならないため、非常
に労力を要する。 一方、後者の方式においては、音韻情報から韻律情報
を推定させるための膨大なメモリ量のアクセント辞書等
が必要とされる。したがって全ての単語や文章について
の韻律情報を推定することは不可能であるため、従来か
ら例えば人名、住所、企業名等の固有名詞等の特定の単
語や文章のみ韻律情報を推定するものとしている。とこ
ろがこの場合において、他の単語や文章が入力されたと
き、韻律的特徴が含まれていない合成音声となり、誤っ
た意味に認識されることがある。 本発明は上記した事情に鑑みて創案されたもので、全
ての単語や文章について容易に韻律的特徴が付加され、
自然音声に近く了解度の高い合成音声を得ることのでき
る音声合成装置を提供することを目的としている。 [発明の構成] (問題点を解決するための手段) すなわち本発明の音声合成装置は、韻律情報を記憶す
る記憶手段と、韻律情報が付与されていない音韻情報の
記号列および韻律情報が付与された音韻情報の記号列が
入力される入力手段と、この入力手段により入力された
記号列が韻律情報が付与された音韻情報であるか否かを
判定する判定手段と、この判定手段により韻律情報が付
与されていない音韻情報の記号列と判定された場合、前
記記憶手段より当該音韻情報に対応する韻律情報を生成
する生成手段と、韻律情報が付与された音韻情報の記号
列については付与された韻律情報を用いて音声合成を行
い、韻律情報が付与されていない音韻情報の記号列につ
いては前記生成された韻律情報を用いて音声合成を行う
手段とを備えている。 (作用) 本発明の音声合成装置において、入力手段に入力され
た記号列が音韻情報のみからなるものであるとき、判定
手段でこのことが判定され、選択手段がこの音韻情報に
応じた記憶手段に記憶された韻律情報を選択している。
このため、全ての単語や文章について容易に韻律的特徴
が付加され、自然音声に近く了解度の高い合成音声を得
ることができる。 (実施例) 以下、本発明の実施例の詳細を図面に基づいて説明す
る。 第1図は本発明の一実施例の音声合成装置を示す構成
図である。 同図において、符号1は単語や文章の文字列である音
韻情報の記号列またはこれにアクセント型、ポーズ長あ
るいは接続情報(以下「アクセント型等」と呼ぶ。)を
表わす記号が加えられたすなわち音韻情報と韻律情報と
からなる記号列が入力される記号列入力部、2は記号列
入力部1に入力された記号列に基づいてこの記号列が音
韻情報のみからなるものであるか、記号列に韻律情報が
含まれているものであるかを判定する入力モード判定部
である。この入力モード判定部2は、記号列が音韻情報
のみからなるものである場合にはこの記号列を自動アク
セント型発生モードと判定し自動アクセント型発生部A
側に出力する。また記号列に韻律情報が含まれている場
合にはこの記号列をアクセント型設定モードと判定しア
クセント型設定部B側に出力する。 上記自動アクセント型発生部A側には、照合部3とア
クセント辞書4とが配置され、記号列に応じた音韻情報
および韻律情報が照合部3によりアクセント辞書4から
読み出される。上記照合部3の出力側には、アクセント
検定部6と音韻系列検定部7とが配置されている。アク
セント検定部6は、照合部3から韻律情報を入力し検定
を行ない、韻律系列を生成し出力する。音韻系列検定部
7は、音韻情報を入力しこの音韻情報に基づいて音韻の
鼻音化および無声化の有無の検定を行ない、音韻系列を
生成し出力する。 一方、上記アクセント型設定部B側は、韻律情報検定
部5および上記した音韻系列検定部7に接続されてい
る。すなわちアクセント型設定部B側においても音韻情
報は音韻系列検定部7に入力され上記と同様に音韻の鼻
音化および無声化の有無の検定が行なわれ、音韻系列が
生成され出力される。韻律情報検定部5は、入力モード
判定部2から出力される韻律情報から韻律系列を生成し
出力する。 またこれら自動アクセント型発生部A側とアクセント
型設定部B側との後段には合成パラメータ生成部8が配
置されている。この合成パラメータ生成部8は、アクセ
ント検定部6および韻律情報検定部5から韻律系列を入
力しこの韻律系列に基づいて韻律パラメータ列を生成す
るとともに、音韻系列検定部7から音韻系列を入力しこ
の音韻系列に基づいた音素をこの合成パラメータ生成部
8に接続された音声素片ファイル9から取出し、音韻パ
ラメータ列を生成する。 さらに合成パラメータ生成部8の出力側には音声合成
部10が配置され、この音声合成部10により音韻パラメー
タ列および韻律パラメータ列とが合成され合成音声が出
力される。 以下、この装置に第2図(A)に示す「アカイハナ^
ガ/、^サイテイル」の記号列が入力された場合の動作
を説明する。 なお、「^」はアクセント核が前の文字に存在するこ
とを示す。但し「^」の前に文字列がない場合には、先
頭のこの「^」を有する単語が平板型のアクセント型で
あるとする(平板型のアクセント型を0とする。)。ま
た「、」はポーズ長を示し、「/」は単語と単語の間の
区切りすなわち1アクセント句を示す。但し「//」の場
合には単語と単語とを接続せず切離すことを示す。 そして第2図(A)に示した「アカイハナ^ガ/、^
サイテイル」の記号列が記号列入力部1に入力され、こ
の記号列が入力モード判定部2により文字列のみすなわ
ち音韻情報のみからなるものであるか文字列の他にアク
セント型等の記号すなわち韻律情報が含まれているもの
であるかが判定される。この場合、記号列に韻律情報が
含まれているため、アクセント型設定モードと判定され
アクセント型設定部B側に出力される。そして音韻系列
検定部7においては音韻系列「アカイハナガ」と「サイ
テイル」とをそれぞれ「akaihanafa」と「saiteiru」に
変換する一方、韻律情報検定部5では「アカイハナガ」
の単語はアクセント型「5」、ポーズ長「10」、接続情
報「1」、「サイテイル」の単語はアクセント型
「0」、ポーズ長「0」、接続情報「0」と検定する。
上記ポーズ長「10」は単語と単語との間のポーズが100m
s、接続情報「1」は単語と単語とを接続し、接続情報
「0」は単語と単語とを接続しないか、または後続する
単語がない場合を示している。 一方、第2図(B)に示すように「カブシキガイシャ
トウシ 」の記号列が記号列入力部1に入力された場
合、この記号列には「^」、「、」、「/」の記号すな
わち韻律情報が含まれていないため、入力モード判定部
2により文字列のみすなわち音韻情報のみからなるもの
であると判定される。すなわちこの記号列を自動アクセ
ント型発生モードと判定し自動アクセント型発生部A側
に出力する。そして自動アクセント型発生部Aにおける
照合部3において、上記「カブシキガイシャトウシ の
記号列とアクセント辞書4の内容とが照合される。この
アクセント辞書4は、例えば第3図に示すような内容と
されている。すなわちこの場合、「カブシキガイシャ」
の単語および「トウシ 」の単語にそれぞれ対応する音
韻情報および韻律情報が読み出される。そして音韻情報
は音韻系列検定部7により、第2図(B)に示すよう
に、「カブシキガイシャ」および「トウシ 」からそれ
ぞれ「kabusvikifaisja」および「tosi ]の音韻系列
が得られる。一方、韻律情報はアクセント検定部6に入
力され、第2図(B)に示すように、「カブシキガイシ
ャ」の単語は、アクセント型「5」、ポーズ長「0」お
よび接続情報「1」、「トウシ 」の単語は、アクセン
ト型「0」、ポーズ長「0」および接続情報「0」と検
定される。 以上のようにして得られた音韻系列および韻律系列
は、合成パラメータ生成部8に入力され、音韻パラメー
タ列および韻律パラメータ列に変換され、音声合成部10
から合成音声が出力される。 しかしてこの実施例によれば、アクセント辞書4に登
録されていない単語や文章であっても、入力モード判定
部2の切換によりアクセント型設定モードと判定しアク
セント型設定部B側に出力させ、このアクセント型設定
部Bにより韻律情報を生成している。このため、韻律的
特徴が付加されていない合成音声が出力されることがな
くなり、誤った意味に認識されることはなくなる。 [発明の効果] 以上説明したように本発明の音声合成装置によれば、
全ての単語や文章について容易に韻律的特性が付加さ
れ、自然音声にほぼ類似し了解度の高い合成音声を得る
ことができる。
【図面の簡単な説明】 第1図は本発明の一実施例の音声合成装置を示す構成
図、第2図はこの実施例における入力記号列に対する韻
律情報と音韻系列を示す図、第3図はアクセント辞書の
内容を示す図である。 2……入力モード判定部 3……照合部 4……アクセント辞書 5……韻律情報検定部 6……アクセント検定部 7……音韻系列検定部 8……合成パラメータ生成部

Claims (1)

  1. (57)【特許請求の範囲】 1.韻律情報を記憶する記憶手段と、 韻律情報が付与されていない音韻情報の記号列および韻
    律情報が付与された音韻情報の記号列が入力される入力
    手段と、 この入力手段により入力された記号列が韻律情報が付与
    された音韻情報であるか否かを判定する判定手段と、 この判定手段により韻律情報が付与されていない音韻情
    報の記号列と判定された場合、前記記憶手段より当該音
    韻情報に対応する音韻情報を生成する生成手段と、 韻律情報が付与された音韻情報の記号列については付与
    された韻律情報を用いて音声合成を行い、韻律情報が付
    与されていない音韻情報の記号列については前記生成さ
    れた韻律情報を用いて音声合成を行う手段と を具備することを特徴とする音声合成装置。
JP61159946A 1986-07-08 1986-07-08 音声合成装置 Expired - Lifetime JP2856731B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61159946A JP2856731B2 (ja) 1986-07-08 1986-07-08 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61159946A JP2856731B2 (ja) 1986-07-08 1986-07-08 音声合成装置

Publications (2)

Publication Number Publication Date
JPS6315297A JPS6315297A (ja) 1988-01-22
JP2856731B2 true JP2856731B2 (ja) 1999-02-10

Family

ID=15704608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61159946A Expired - Lifetime JP2856731B2 (ja) 1986-07-08 1986-07-08 音声合成装置

Country Status (1)

Country Link
JP (1) JP2856731B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2728440B2 (ja) * 1988-07-20 1998-03-18 富士通株式会社 音声出力装置
JP3180764B2 (ja) 1998-06-05 2001-06-25 日本電気株式会社 音声合成装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56153400A (en) * 1980-04-30 1981-11-27 Nippon Telegraph & Telephone Voice responding device
JPS6024596A (ja) * 1983-07-21 1985-02-07 富士通株式会社 音声合成装置

Also Published As

Publication number Publication date
JPS6315297A (ja) 1988-01-22

Similar Documents

Publication Publication Date Title
CN111566655B (zh) 多种语言文本语音合成方法
US8566099B2 (en) Tabulating triphone sequences by 5-phoneme contexts for speech synthesis
US7292980B1 (en) Graphical user interface and method for modifying pronunciations in text-to-speech and speech recognition systems
WO2005034082A1 (en) Method for synthesizing speech
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
JP2856731B2 (ja) 音声合成装置
JPH08335096A (ja) テキスト音声合成装置
JP3589972B2 (ja) 音声合成装置
JP3626398B2 (ja) テキスト音声合成装置、テキスト音声合成方法及びその方法を記録した記録媒体
EP1589524B1 (en) Method and device for speech synthesis
US20240153486A1 (en) Operation method of speech synthesis system
Barros et al. HMM-based european Portuguese TTS system.
JP3397406B2 (ja) 音声合成装置及び音声合成方法
Breuer et al. Set-up of a Unit-Selection Synthesis with a Prominent Voice.
EP1640968A1 (en) Method and device for speech synthesis
JPH0562356B2 (ja)
Leonardo et al. A general approach to TTS reading of mixed-language texts
JP2003108170A (ja) 音声合成学習方法および音声合成学習装置
JP2839492B2 (ja) 音声合成装置および方法
JPH1097290A (ja) 音声合成装置
JP2009098292A (ja) 音声記号列生成方法、音声合成方法及び音声合成装置
Alam Kotha: the first to speech synthesis for Bangla language
Brinckmann The" Kiel Corpus of Read Speech" as a Resource for Prosody Prediction in Speech Synthesis
Campbell A call for generic-use large-scale single-speaker speech corpora and an example of their application in concatenative speech synthesis
KUMAR A STUDY ON MULTI-LINGUAL AND CROSS-LINGUAL SPEECH SYNTHESIS FOR INDIAN LANGAUGES

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term