JPH01209500A

JPH01209500A - 音声合成方法

Info

Publication number: JPH01209500A
Application number: JP63036204A
Authority: JP
Inventors: Yoshinori Kosaka; 芳典匂坂
Original assignee: A T R JIDO HONYAKU DENWA KENKYUSHO KK
Current assignee: A T R JIDO HONYAKU DENWA KENKYUSHO KK
Priority date: 1988-02-17
Filing date: 1988-02-17
Publication date: 1989-08-23
Anticipated expiration: 2014-04-12
Also published as: JP2880507B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］この発明は、音声の合成方式に関するもので、特に、音
声単位の編集、結合および変型によって音声合成を行な
う方式に関するものである。

［従来の技術］現在側われている音声合成方式では、内容の異なった音
声を出力するために、音素、音節、単語および文節とい
った音声単位を予め蓄えておき、それらの変型や結合に
より音声を合成する方式を採用している。通常、これら
の音声単位は、予め定められた使用箇所に依存して数個
用意されるか、あるいは、音韻論的な単位に合わせて１
個用意される。しかし、自然な出力音声を得るためには
、出力したい内容の可変度に応じて、複数個の音声単位
が必要であることが指摘されてきた。

そのため、母音・子音・母音（ＶＣＶ）　、子音・母音
・子音（ＣＶＣ）および２音節連鎖（ＣＶＣｖ）など、
長い音声単位を用いることにより隣接する音韻による影
響を取入れた合成方式や、基本周波数（ピッチ）を多段
階に分けて発生した複数の音声単位を用いる合成方式な
どが考案されてきている。

［発明が解決しようとする課題］これらの合成方式では、用意されている音声単位の候補
数が少ないので、出力したい音声内容に対応した音韻系
列記号が与えられた後、音声単位の選択をするために、
画一的でかつ局所的な基準が用いられている。したがっ
て、合成された音声の品質は低いものとなっている。品
質の高い音声の合成を行なうためには、多くの音声単位
数を準備することが必要である。しかし、単に音声単位
を増やして種々の音韻構造を持つ多種類の音声単位を音
声単位集合として用意しても、従来のこれらの合成方式
を用いたのでは、多くの音声単位の中から合理的かつ効
率良く適切な音声単位を選出することができないという
課題がある。

この発明は、上記のような課題を解決するためになされ
たもので、多くの音声単位を含む音声単位集合の中から
、与えられた選択基準を満たす評価関数に基づき、合理
的でかつ効率良く音声単位系列を選択することのできる
音声合成方式を提供することを目的とする。

［課題を解決するための手段］この発明に係る音声合成方式は、予め任意の長さの音韻
連接単位からなる音声単位集合を準備しておき、入力さ
れた音部系列記号信号について音声単位集合の中から使
用する可能性のあるすべての音声単位候補群を選出し、
選出されたすべての音声単位候補群の中から所定の基準
に基づいて使用すべき音声単位を決定するものである。

【作用コこの発明における音声合成方式は、音声単位集合の中か
ら入力された音韻系列記号信号について使用する可能性
のあるすべての音声単位候補群を予め整理して蓄えてお
くので、そこから効率良く、使用すべき音声単位を決定
することができる。

［発明の実施例コ以下、この発明の実施例を図面を用いて詳細に説明する
。

第１図は、この発明による音声合成方式を示すブロック
図である。

第１図を参照して、入力端子１には、出力したい音声内
容に対応した音韻系列記号信号ならびにアクセントおよ
び息継ぎ位置などの韻律制御信号が入力される。入力さ
れた音韻系列記号信号は入力音韻系列処理部２に与えら
れ、入力音韻系列処理部２は入力された音韻系列記号を
適当に分割した部分音韻系列を生成する。合成単位エン
トリファイル４は、音声の合成に必要な種々の音声合成
単位情報を予め蓄えておくためのものである。合成単位
ラティス生成部３は、入力音韻系列処理部２から出力さ
れる部分音韻系列の中から、合成単位として予め蓄えら
れて存在するものを、合成単位エントリファイル４を検
索することによって見い出し、合成に用いられる可能性
のある音声合成単位候補のすべてをラティスの形式で列
挙して音声テンプレート決定部５に与える。

音声テンプレートファイル７は、音声として出力するの
に必要な情報が蓄えられている。音声テンプレート決定
部５は、合成単位ラティス生成部３で得られた合成単位
ラティスを用い、使用可能な音声テンプレートの組合わ
せのうちから、予め定められた選択基準に基づき最適な
ものを決定し、決定された音声テンプレートについて音
声テンプレートファイル７から音声として出力するのに
必要な情報を得る。この決定方法は、選択基準を選ぶこ
とによって自由に制御することが可能であり、たとえば
、合成に要求される音声テンプレートへの条件、すなわ
ち、合成単位ラティス生成部３で得られた合成単位ラテ
ィスが持つ出力音韻環境や、韻律制御信号を受けて韻律
制御モジュール６が出力する出力韻律パラメータ値と音
声テンプレートファイル７に存在する合成用テンプレー
トの持つ条件（抽出音部環境および韻律パラメータ値）
との整合性や、さらに、音声テンプレート間の接続容易
性などをもとに決定する方法である。

テンプレート結合部８は、音声テンプレート決定部５に
よって決定されたテンプレートを、韻律制御モジュール
６によって与えられる値によって伸縮し、テンプレート
間の変形および結合処理を行ない、音声合成パラメータ
系列を音声合成器９に出力する。音声合成器９は、テン
プレート結合部８で得られた音声合成パラメータ系列に
よって駆動され、出力端子１０に合成された音声波形を
出力する。

第２図は、この発明の実施例に用いられる合成単位エン
トリファイルの一例を示す図である。

この合成単位エントリファイルは、国語辞典内の重要語
５２４０単語の音声を音声テンプレートとして持つ場合
に生成した合成単位エントリファイルの一部を示してい
る。このファイルは音声の合成単位を検索する効率を高
めるために、各合成単位が構成音韻数ごとに階層化され
、木構造を持つ辞書形式に整理されている。第２図は第
１ないし第４階層の一部を示したものであり、各合成単
位エントリごとに、音韻系列名Ａ１その合成単位テンプ
レート総数８１テンプレートを含む単語の格納位置（始
点Ｃ１、終点Ｃ２）、一階層下の（すなわち右に１音韻
長い）音声単位エントリの総数Ｄ１およびそれらの格納
位置（始点Ｅ１、終点Ｅ２）を示す値が蓄えられている
。これから、たとえば、合成単位エントリ／ａ／は全部
で３５２３テンプレート存在し、それらを含む単語はテ
ンプレートファイル中の単語リストの３５１２４番地か
ら７５６９１番地に格納されており、また、／ａ／を先
行音韻として持つ２音韻連接エントリ／　ａ　Ｎ　／、
／ａａ／、−／ａＺ／は全部で３７個存在し、それらは
本エントリファイル中の７５６番地から１９３６９３６
番地されていることがわかる。

第３図は、この発明の実施例における合成ラティスの作
成の様子を示す図である。

第３図では、第２図で示された合成単位エントリファイ
ルを用いて、入力音韻系列記号の「花が咲き出したＪ　
／ｈａｎａｇａｓａｋｉｄａｓｈｉｔａ／を入力した場
合に作成された合成単位ラティスの一部が示されている
。この例では、最初にエントリファイルの検索により／
ｈ／から始まる単位エントリとして最長の／　ｈ　ａ　
ｎ　ａ　／が見い出され、その検索過程でより短い／ｈ
／、／　ｈ　ａ　／および／　ｈ　ａ　ｎ　／の単位エ
ントリが見い出され、第３図に示したようなエントリフ
ァイル内の情報を読出すことができる。この結果、たと
えば／ｈａｎａ／は１０個のテンプレートを持ち、それ
らは、／ｈａｎａ／（ｒ花Ｊ　）　、／ｈａｎａ／　（
「鼻Ｊ　）　、−／ｈａｎａｙａｋａ／　（ｒ華やか」
）などの単語音声サンプルに含まれていることがわかる
。

第４図は、この発明の実施例におけるある選択基準を仮
定した場合の合成単位ラティスから選択された音声単位
とそのテンプレートが含まれる単語音声を示す図である
。

第４図では、第３図で示した入力例について、（１）子
音から母音への遷移箇所の連続性優先、（２）有声音連
続箇所の連続性優先、（３）長単位優先、（４）単位間
の連続性重視などの音声テンプレートを決定するための
４つの基準が仮定されている。図に示されるように、最
初の／　ｈ　ａ　ｎａ／は単語音声サンプル／　ｈ　ａ
　ｎ　ａ　ｂ　ａ　ｎ　ａ　ｓ　ｈｉｉ／（ｒ華々しい
」）の語頭から得られ、／ｇａ／、／ｓ　ａ／、　／ｋ
　ｉ　ｄａ／および／　ｓ　ｈ　ｉ　ｔａ／は、それぞ
れ、／ｎａｇａｓａ／（ｒ長さ」）ｄａｓｈｉ／（ｒ引
出し」）および／　ａ　ｓ　ｈ　ｉ　ｔａ／（「明日」
）から得られる。これらの基準による選択の具体的実現
方法としては、たとえば、Ｙｏｓｈｉｎｏｒｉ　　Ｓａ
ｇｉｓａｋａ、Ｈｉｒｏｋａｚｕ　　５ａｔｏ等により
１９８６年４月に発表された“Ｗｏｒｄ　　Ｉｄｅｎｔ
ｉｆｉｃａｔｉｏｎ　　Ｍｅｔｈｏｄ　　ｆｏｒ　　Ｊ
ａｐａｎｅｓｅ　　Ｔｅｘｔ−ｔｏ−３ｐｅａｃｈ　　
Ｃｏｎｖｅｒｓｉｏｎ　　Ｓｙｓｔｅｍ”　と題された
論文（Ｐｒｏｃ、　　　ｏｆ　　ＩＣＡＳＳＰ　　８６
　２４１１頁−２４１４頁）に示されるような、各選択
基準の優先度に応じた選択のコスト付けを行なうことに
より、従来、言語処理における形態素同定法に見られる
選択手法等が適用できる。

また、この発明による音声合成方式における音声合成単
位の選択方法は、上記で説明したような４つの基準に限
られるものではなく、選択基準間の優先度が明確に規定
できるものであれば、基準内容、基準個数などによらず
適用可能である。

以上で得られた音声テンプレートの影響パラメ−タ系列
は、さらに韻律制御モジュール６から与えられる音韻時
間長、振幅および基本周波数などの出力韻律パラメータ
値に基づいて、変形が加えられ、結合され、音声合成器
８に送られ、合成された音声波形が出力端子１０を介し
て出力される。

以上の説明から明らかなように、この発明の一実施例に
よる音声合成方式は、合成用単位の抽出環境情報を格納
した合成単位エントリファイルの使用により、多数個の
音声単位列の中から効率良く所望の音声単位列を選択で
きる利点を有するとともに、選択基準の変更に対しても
柔軟に対処できるため、使用する現在の音声合成技術お
よびそれらの進展に対し、容易に適用できる利点を有す
る。

また、複数個の任意の長さの音韻連接単位からなる音声
単位集合を用いた音声合成を可能とするため、音声単位
の結合部で生ずる接続歪および音声単位の抽出環境と使
用環境の相違に起因する歪による音声品質の劣化に対し
て、柔軟に対処することが可能なため、良好な音声品質
を持つ音声の合成が期待できる。

［発明の効果］以上のように、この発明によれば、予め任意の長さの音
韻連接単位からなる音声単位集合を準備し、入力された
音韻系列記号信号について音声単位集合の中から使用す
る可能性のあるすべての音声単位候補群を予め整理して
蓄え、その音声単位候補群の中から所定の基準に基づき
使用すべき音声単位を決定するようにしたので、使用す
べき音声単位を決定するのに、予め蓄えられた音声単位
候補群を参照することができ、効率良く使用すべき音声
単位を決定することができる。

【図面の簡単な説明】

第１図は、この発明による音声合成方式を示すブロック
図である。第２図は、この発明の実施例に用いられる合
成単位エントリファイルの一例を示す図である。第３図
は、この発明の実施例における合成ラティスの作成の様
子を示す図である。第４図は、この発明の実施例における合成単位ラティス
から選択された音声単位とそのテンプレートが含まれる
単語音声を示す図である。図において、１は入力端子、２は入力音韻系列処理部、
３は合成単位ラティス生成部、４は合成単位エントリフ
ァイル、５は音声テンプレート決定部、６は韻律制御モ
ジュール、７は音声テンプレートファイル、８はテンプ
レート結合部、９は音声合成器、１０は出力端子、Ａは
音韻系列名、Ｂは合成単位テンプレート総数、Ｃ１およ
びＣ２はテンプレートを含む単語の格納位置の始点およ
び終点、Ｄは一階層下の音声単位エントリの総数、Ｅｌ
およびＥ２は一階層下の音声単位エントリの格納位置の
始点および終点である。特許出願人　株式会社エイ・ティ・アール第１図第３図）ｚ７Ｕ？ｅｉ　Ｊ、ｉ　ｉｆｊ人職９ａｓａｋｉｄａ
ｓｈｉｔａバー”ＯＸ　し””Ｊ第４図

Claims

【特許請求の範囲】　出力したい音声内容に対応した音韻系列記号信号と韻
律制御信号とから任意の語彙の音声合成を行なう方式、
および既発声音声の編集により音声合成を行なう方式で
あって、予め任意の長さの音韻連接単位からなる音声単位集合を
準備し、前記音韻系列記号信号を受けて、前記音声単位集合から
音声合成に使用する可能性のあるすべての音声単位候補
群を選出し、前記すべての音声単位候補群の中から所定の基準に基づ
いて使用すべき音声単位を決定する、音声合成方式。