JP2856731B2

JP2856731B2 - 音声合成装置

Info

Publication number: JP2856731B2
Application number: JP61159946A
Authority: JP
Inventors: 義幸原
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1986-07-08
Filing date: 1986-07-08
Publication date: 1999-02-10
Anticipated expiration: 2014-02-10
Also published as: JPS6315297A

Description

【発明の詳細な説明】［発明の目的］（産業上の利用分野）本発明は、音声規則合成技術を用いて記号列から合成
音声に変換する音声合成装置に関する。（従来の技術）一般に音声規則合成技術を用いて記号列から合成音声
に変換する音声合成装置において、変換の対象とされる
単語や文章が確実に音声として認識されるためには、合
成音声に韻律的特徴が含まれていること重要な要素とさ
れている。従来からこのような合成音声に韻律的特徴を付与する
方式として、記号列に音韻情報と韻律情報とを含めて入
力しこれらを合成させるもの、音韻情報のみを入力しこ
の音韻情報に基づいてアクセント辞書等から韻律情報を
推定させるもの等がある。（発明が解決しようとする問題点）ところで上記した前者の方式においては、単語や文章
の韻律的特徴を所望とするものにさせることができ、自
然で滑かな合成音声を得ることが可能であるが、音韻情
報の他に韻律情報を入力しなければならないため、非常
に労力を要する。一方、後者の方式においては、音韻情報から韻律情報
を推定させるための膨大なメモリ量のアクセント辞書等
が必要とされる。したがって全ての単語や文章について
の韻律情報を推定することは不可能であるため、従来か
ら例えば人名、住所、企業名等の固有名詞等の特定の単
語や文章のみ韻律情報を推定するものとしている。とこ
ろがこの場合において、他の単語や文章が入力されたと
き、韻律的特徴が含まれていない合成音声となり、誤っ
た意味に認識されることがある。本発明は上記した事情に鑑みて創案されたもので、全
ての単語や文章について容易に韻律的特徴が付加され、
自然音声に近く了解度の高い合成音声を得ることのでき
る音声合成装置を提供することを目的としている。［発明の構成］（問題点を解決するための手段）すなわち本発明の音声合成装置は、韻律情報を記憶す
る記憶手段と、韻律情報が付与されていない音韻情報の
記号列および韻律情報が付与された音韻情報の記号列が
入力される入力手段と、この入力手段により入力された
記号列が韻律情報が付与された音韻情報であるか否かを
判定する判定手段と、この判定手段により韻律情報が付
与されていない音韻情報の記号列と判定された場合、前
記記憶手段より当該音韻情報に対応する韻律情報を生成
する生成手段と、韻律情報が付与された音韻情報の記号
列については付与された韻律情報を用いて音声合成を行
い、韻律情報が付与されていない音韻情報の記号列につ
いては前記生成された韻律情報を用いて音声合成を行う
手段とを備えている。（作用）本発明の音声合成装置において、入力手段に入力され
た記号列が音韻情報のみからなるものであるとき、判定
手段でこのことが判定され、選択手段がこの音韻情報に
応じた記憶手段に記憶された韻律情報を選択している。
このため、全ての単語や文章について容易に韻律的特徴
が付加され、自然音声に近く了解度の高い合成音声を得
ることができる。（実施例）以下、本発明の実施例の詳細を図面に基づいて説明す
る。第１図は本発明の一実施例の音声合成装置を示す構成
図である。同図において、符号１は単語や文章の文字列である音
韻情報の記号列またはこれにアクセント型、ポーズ長あ
るいは接続情報（以下「アクセント型等」と呼ぶ。）を
表わす記号が加えられたすなわち音韻情報と韻律情報と
からなる記号列が入力される記号列入力部、２は記号列
入力部１に入力された記号列に基づいてこの記号列が音
韻情報のみからなるものであるか、記号列に韻律情報が
含まれているものであるかを判定する入力モード判定部
である。この入力モード判定部２は、記号列が音韻情報
のみからなるものである場合にはこの記号列を自動アク
セント型発生モードと判定し自動アクセント型発生部Ａ
側に出力する。また記号列に韻律情報が含まれている場
合にはこの記号列をアクセント型設定モードと判定しア
クセント型設定部Ｂ側に出力する。上記自動アクセント型発生部Ａ側には、照合部３とア
クセント辞書４とが配置され、記号列に応じた音韻情報
および韻律情報が照合部３によりアクセント辞書４から
読み出される。上記照合部３の出力側には、アクセント
検定部６と音韻系列検定部７とが配置されている。アク
セント検定部６は、照合部３から韻律情報を入力し検定
を行ない、韻律系列を生成し出力する。音韻系列検定部
７は、音韻情報を入力しこの音韻情報に基づいて音韻の
鼻音化および無声化の有無の検定を行ない、音韻系列を
生成し出力する。一方、上記アクセント型設定部Ｂ側は、韻律情報検定
部５および上記した音韻系列検定部７に接続されてい
る。すなわちアクセント型設定部Ｂ側においても音韻情
報は音韻系列検定部７に入力され上記と同様に音韻の鼻
音化および無声化の有無の検定が行なわれ、音韻系列が
生成され出力される。韻律情報検定部５は、入力モード
判定部２から出力される韻律情報から韻律系列を生成し
出力する。またこれら自動アクセント型発生部Ａ側とアクセント
型設定部Ｂ側との後段には合成パラメータ生成部８が配
置されている。この合成パラメータ生成部８は、アクセ
ント検定部６および韻律情報検定部５から韻律系列を入
力しこの韻律系列に基づいて韻律パラメータ列を生成す
るとともに、音韻系列検定部７から音韻系列を入力しこ
の音韻系列に基づいた音素をこの合成パラメータ生成部
８に接続された音声素片ファイル９から取出し、音韻パ
ラメータ列を生成する。さらに合成パラメータ生成部８の出力側には音声合成
部10が配置され、この音声合成部10により音韻パラメー
タ列および韻律パラメータ列とが合成され合成音声が出
力される。以下、この装置に第２図（Ａ）に示す「アカイハナ＾
ガ／、＾サイテイル」の記号列が入力された場合の動作
を説明する。なお、「＾」はアクセント核が前の文字に存在するこ
とを示す。但し「＾」の前に文字列がない場合には、先
頭のこの「＾」を有する単語が平板型のアクセント型で
あるとする（平板型のアクセント型を０とする。）。ま
た「、」はポーズ長を示し、「／」は単語と単語の間の
区切りすなわち１アクセント句を示す。但し「//」の場
合には単語と単語とを接続せず切離すことを示す。そして第２図（Ａ）に示した「アカイハナ＾ガ／、＾
サイテイル」の記号列が記号列入力部１に入力され、こ
の記号列が入力モード判定部２により文字列のみすなわ
ち音韻情報のみからなるものであるか文字列の他にアク
セント型等の記号すなわち韻律情報が含まれているもの
であるかが判定される。この場合、記号列に韻律情報が
含まれているため、アクセント型設定モードと判定され
アクセント型設定部Ｂ側に出力される。そして音韻系列
検定部７においては音韻系列「アカイハナガ」と「サイ
テイル」とをそれぞれ「akaihanafa」と「saiteiru」に
変換する一方、韻律情報検定部５では「アカイハナガ」
の単語はアクセント型「５」、ポーズ長「10」、接続情
報「１」、「サイテイル」の単語はアクセント型
「０」、ポーズ長「０」、接続情報「０」と検定する。
上記ポーズ長「10」は単語と単語との間のポーズが100m
s、接続情報「１」は単語と単語とを接続し、接続情報
「０」は単語と単語とを接続しないか、または後続する
単語がない場合を示している。一方、第２図（Ｂ）に示すように「カブシキガイシャ
トウシ」の記号列が記号列入力部１に入力された場
合、この記号列には「＾」、「、」、「／」の記号すな
わち韻律情報が含まれていないため、入力モード判定部
２により文字列のみすなわち音韻情報のみからなるもの
であると判定される。すなわちこの記号列を自動アクセ
ント型発生モードと判定し自動アクセント型発生部Ａ側
に出力する。そして自動アクセント型発生部Ａにおける
照合部３において、上記「カブシキガイシャトウシの
記号列とアクセント辞書４の内容とが照合される。この
アクセント辞書４は、例えば第３図に示すような内容と
されている。すなわちこの場合、「カブシキガイシャ」
の単語および「トウシ」の単語にそれぞれ対応する音
韻情報および韻律情報が読み出される。そして音韻情報
は音韻系列検定部７により、第２図（Ｂ）に示すよう
に、「カブシキガイシャ」および「トウシ」からそれ
ぞれ「kabusvikifaisja」および「tosi ］の音韻系列
が得られる。一方、韻律情報はアクセント検定部６に入
力され、第２図（Ｂ）に示すように、「カブシキガイシ
ャ」の単語は、アクセント型「５」、ポーズ長「０」お
よび接続情報「１」、「トウシ」の単語は、アクセン
ト型「０」、ポーズ長「０」および接続情報「０」と検
定される。以上のようにして得られた音韻系列および韻律系列
は、合成パラメータ生成部８に入力され、音韻パラメー
タ列および韻律パラメータ列に変換され、音声合成部10
から合成音声が出力される。しかしてこの実施例によれば、アクセント辞書４に登
録されていない単語や文章であっても、入力モード判定
部２の切換によりアクセント型設定モードと判定しアク
セント型設定部Ｂ側に出力させ、このアクセント型設定
部Ｂにより韻律情報を生成している。このため、韻律的
特徴が付加されていない合成音声が出力されることがな
くなり、誤った意味に認識されることはなくなる。［発明の効果］以上説明したように本発明の音声合成装置によれば、
全ての単語や文章について容易に韻律的特性が付加さ
れ、自然音声にほぼ類似し了解度の高い合成音声を得る
ことができる。

【図面の簡単な説明】第１図は本発明の一実施例の音声合成装置を示す構成
図、第２図はこの実施例における入力記号列に対する韻
律情報と音韻系列を示す図、第３図はアクセント辞書の
内容を示す図である。２……入力モード判定部３……照合部４……アクセント辞書５……韻律情報検定部６……アクセント検定部７……音韻系列検定部８……合成パラメータ生成部

Claims

(57)【特許請求の範囲】１．韻律情報を記憶する記憶手段と、韻律情報が付与されていない音韻情報の記号列および韻
律情報が付与された音韻情報の記号列が入力される入力
手段と、この入力手段により入力された記号列が韻律情報が付与
された音韻情報であるか否かを判定する判定手段と、この判定手段により韻律情報が付与されていない音韻情
報の記号列と判定された場合、前記記憶手段より当該音
韻情報に対応する音韻情報を生成する生成手段と、韻律情報が付与された音韻情報の記号列については付与
された韻律情報を用いて音声合成を行い、韻律情報が付
与されていない音韻情報の記号列については前記生成さ
れた韻律情報を用いて音声合成を行う手段とを具備することを特徴とする音声合成装置。