JPH0990971A - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JPH0990971A
JPH0990971A JP7245686A JP24568695A JPH0990971A JP H0990971 A JPH0990971 A JP H0990971A JP 7245686 A JP7245686 A JP 7245686A JP 24568695 A JP24568695 A JP 24568695A JP H0990971 A JPH0990971 A JP H0990971A
Authority
JP
Japan
Prior art keywords
phrase
sentence
mora
tempo
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7245686A
Other languages
English (en)
Inventor
Takao Koyama
貴夫 小山
Ayanori Yoshitani
文徳 吉谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP7245686A priority Critical patent/JPH0990971A/ja
Publication of JPH0990971A publication Critical patent/JPH0990971A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 文あるいはフレーズ毎に、自然音声から得ら
れる普遍的な傾向に基づいて発声テンポを設定する音声
合成方法を提供する。 【解決手段】 予め自然発声音声の継続時間長と各文の
モーラ数との関係、最終フレーズ以外の継続時間長と各
フレーズのモーラ数との関係、及び最終フレーズのフレ
ーズの継続時間長と当該フレーズのモーラ数との関係を
求めておく。音声合成時には、合成対象文をテキスト解
析してローマ字列に変換した後(S101),文中モー
ラ数及びフレーズ内モーラ数を抽出する(S102,S
103)。そして抽出した各モーラ数と上記各関係とか
ら当該文の発声テンポ及びフレーズ発声テンポとを決定
(設定)し(S104,S105)、これら発声テンポ
を韻律制御パラメータの一つとして規則音声合成を行
う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声合成技術に係
り、特に、韻律制御パラメータとして発声テンポを設定
する過程を含む音声合成方法に関する。
【0002】
【従来の技術】韻律を考慮して自然音声に近づけた歯切
れの良い音声を合成するための従来技術として、例えば
特開平3−2797号公報に記載された「音声合成装置
の抑揚制御方式」(以下、従来例1)、及び特開平3−
139699号公報に記載された「音声編集合成器」
(以下、従来例2)がある。
【0003】従来例1は、入力文の文頭から文末までの
傾向を近似したイントネーション(抑揚)データを生成
し、このイントネーションデータの文末近くの下げ率を
高くする(ピッチ周波数の変化を大きく下げる)こと
で、人の自然発声の抑揚に近い合成音声を得ることを特
徴とするものであり、従来例2は、韻律語の記憶時にピ
ッチ(周波数)についてはアクセント成分のみを記憶し
ておき、文章合成時にその文章に対応したフレーズ成分
を生産するとともに、該フレーズ成分にアクセント成分
を重畳することによりピッチパターンを生成する。これ
により記憶容量の削減を図るとともに、文全体としての
抑揚が自然となるようなピッチパターンを容易に生成で
きるようにしたことを特徴とするものである。
【0004】
【発明が解決しようとする課題】一般に規則合成音声に
おいては、ピッチ(周波数)を変えたり、上記各従来例
1及び従来例2のようにイントネーションを変えること
で、合成対象文に対応する合成音声を自然音声に近づけ
ることができる。ところが、発話者による自然発声の場
面では、例えば「こんにちわ」と「こ・ん・に・ち・
わ」のように、同一ピッチ、同一イントネーションであ
っても、発声テンポ(単位時間当たりの継続時間長:発
声速度)によって文やフレーズの調子が変わる場合があ
る。また、自然音声の発声の場面において、一般に長め
の文やフレーズの場合は発声テンポが速くなり、短めの
場合は発声テンポが遅くなる傾向がみられる。
【0005】この発声テンポについて、従来は、文の長
さ、あるいは文を構成するフレーズの長さ等の要素に拘
わらず、利用者が設定した一定の発声テンポで音声合成
を行っている。つまり、従来は、予め固定的あるいは段
階的に定めた発声テンポで一意に規則音声合成を行って
おり、文の長さやフレーズの長さに応じて発声テンポを
随時変化させるという観点がなかった。そのため、文や
フレーズによっては、それが表出する調子を的確に表現
できないばかりでなく、文が連続する場合にも発声テン
ポが一本調子となって、合成対象文が全体的に減り張り
のないものになってしまう問題があった。
【0006】本発明の課題は、かかる問題点を解消し、
合成対象文あるいはそれを構成するフレーズ毎に、自然
発声音声から得られる普遍的な傾向に基づいて発声テン
ポを随時設定し、合成音声の自然性を高めることができ
る音声合成方法を提供することにある。
【0007】
【課題を解決するための手段】上記課題を解決する第1
発明の音声合成方法は、複数文の自然発声音声の継続時
間長と各文のモーラ(音の時間的なまとまりの単位、以
下同じ)数との関係を定量化して両者の関係を代表する
第1の関係式を導出する段階と、合成対象文の文字列か
らモーラ数を抽出する段階と、抽出したモーラ数と前記
第1の関係式とに基づいて前記合成対象文の発声テンポ
を決定する段階と、決定した発声テンポを韻律制御パラ
メータの一つとして規則音声合成を行う段階と、を含む
ことを特徴とする。
【0008】また、第2発明の音声合成方法は、複数文
の自然発声音声の継続時間長と各文のモーラ数との関係
を代表する第1の関係式、各文を構成する最終フレーズ
以外の継続時間長と各フレーズのモーラ数との関係を代
表する第2の関係式、及び各文を構成する最終フレーズ
の継続時間長と当該フレーズのモーラ数との関係を代表
する第3の関係式を導出する段階と、合成対象文の文字
列をフレーズ毎に切り分ける段階と、前記合成対象文の
モーラ数及び切り分けたフレーズ毎のモーラ数を抽出す
る段階と、前記合成対象文のモーラ数と前記第1の関係
式に基づいて当該文の発声テンポを決定する段階と、各
フレーズのモーラ数、前記第2及び第3の関係式、及び
前記文の発声テンポに基づいてフレーズ毎の発声テンポ
を決定する段階と、決定したフレーズ毎の発声テンポを
韻律制御パラメータの一つとして規則音声合成を行う段
階と、を含むことを特徴とする。
【0009】なお、この場合の発声テンポは、例えば単
位時間に発声されるモーラ数で表されるものである。
【0010】上記各段階を含む第1,第2発明の音声合
成方法では、合成対象文の長さや各文を構成するフレー
ズの長さに応じて韻律制御パラメータが生成(設定更
新)され、これにより合成される音声の発声テンポが随
時変化する。すなわち、文継続時間長あるいはフレーズ
継続時間長とモーラ数との普遍的な関係が規則音声合成
に随時反映され、合成対象文に減り張りが付与される。
第2発明の音声合成方法では、さらに各文の最終フレー
ズについては他のフレーズよりも発声テンポが速くな
る、という傾向が反映されるので、より自然性の高い合
成音声が得られる。
【0011】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を詳細に説明する。本発明では、入力文字列の
句点で区切られる単位を文とし、文内の読点で区切られ
た区間をフレーズとする。そして、複数の自然発声音声
の文継続時間長及びフレーズ継続時間長を解析するとと
もに、文継続時間長と各文のモーラ数との関係、及びフ
レーズ継続時間長とフレーズ内のモーラ数との関係を各
々代表する関係式を求め、これら関係を所定のファイル
内に記憶しておく。
【0012】文継続時間長の解析に際しては、読点にお
けるポーズの継続時間長(無音区間)を差し引いた値を
求める。また、文のモーラ数のバリエーションを十分に
用意する。ここで求められたモーラ数と文継続時間長の
関係データ群を図1に示す。これら関係データ群の普遍
的な傾向を例えば線形回帰手法により分析して文中モー
ラ数Sと文継続時間長SDとの関係を定量化するととも
に、その傾向を第1の関係式で代表させる。この関係式
は、線形回帰の定義から下記(1)式で表すことができ
る。 SD=Ks×S+Cs・・・(1) 但し、Ks,Csは、線形回帰分析によって得られる、
係数または定数である。
【0013】また、モーラ数Sと文継続時間長SDの関
係と同様、フレーズのモーラ数Pのバリエーションを十
分に用意し、図2のような関係データ群を得る。これら
関係データ群の普遍的な傾向を線形回帰手法により分析
してフレーズ内モーラ数Pとフレーズ継続時間長PDと
の関係を定量化するとともに、その傾向を関係式で代表
させる。その際、文中の最終フレーズと最終フレーズ以
外のものとを峻別し、各々の傾向を代表する二種類の関
係式を別々に求める。最終フレーズのみを特別扱いする
のは、最終フレーズがそれ以外のフレーズに比べて発声
テンポが相対的に速いという傾向を規則合成に反映させ
るためである。
【0014】最終フレーズ以外の継続時間長PD1と各
フレーズ内モーラ数Pとの関係を代表する第2の関係
式、最終フレーズの継続時間長PD2と当該フレーズ内
モーラ数Pとの関係を代表する第3の関係式は、各々下
記(2)式及び(3)式で表される。 PD1=Kp1×P+Cp1・・・(2) PD2=Kp2×P+Cp2・・・(3) 但し、Kp1、Kp2、Cp1、Cp2は、線形回帰分
析によって得られる、係数または定数である。
【0015】次に、合成対象文の一例である「爆音が、
銀世界の高原に広がる。」に対応する合成音声を得る場
合の具体的な処理手順を図3及び図4を参照して説明す
る。図3は、本実施形態による発声テンポの設定手順説
明図であり、図4は、上記入力文字列ないしフレーズと
モーラ数との関係説明図である。
【0016】図3を参照すると、本実施形態では、入力
された上記文字列をテキスト解析してローマ字列に変換
する(S101)。このとき、入力文字列をフレーズ長
に切り分ける処理も同時に行う。つまり、図4に示すよ
うに、「爆音が(bakuoNga)」と「銀世界の高
原に広がる(giNsekainokoogeNnih
irogaru)」の2つのフレーズに切り分ける。
【0017】次に、変換したローマ字列における文中モ
ーラ数Sを抽出する、文中モーラ数解析を実行する(S
102)。文中モーラ数Sは、母音及び撥音及び促音を
抽出することで抽出可能である。上記ローマ字列の場合
の文中モーラ数Sは「20個」である。同様の処理をフ
レーズ単位で行う、フレーズ内モーラ数解析を実行する
(S103)。具体的には、「爆音が」のフレーズに対
するモーラ数P1(5モーラ)と、「銀世界の高原に広
がる。」のフレーズに対するモーラ数P2(15モー
ラ)とを抽出する。
【0018】次に、文中モーラ数解析(S102)の実
行結果と、予め求めてあるモーラ数と文継続時間長との
関係を表す一次式((1)式)より、上記文の絶対的な
継続時間長DSを求める。本発明では、発声テンポを1
秒間に発声されるモーラ数で表現するものとする。よっ
て、上記文の発声テンポSTは、下記(4)式より求め
ることができる。 ST=S/DS・・・(4)
【0019】次に、各フレーズ内モーラ数P1,P2、
予め求めてあるフレーズ内モーラ数とフレーズの継続時
間長との関係を代表する第2及び第3の関係式((2)
式,(3)式)、及び上記(4)式で求めた文の発声テ
ンポSTを用いて、各フレーズのフレーズ発声テンポP
T1,PT2を計算する、フレーズ発声テンポ設定処理
を実行する(S105)。フレーズ発声テンポは、「爆
音が」のフレーズの傾向と「銀世界の高原に広がる。」
のフレーズの傾向とを各々峻別して設定する。各フレー
ズの発声テンポPT1,PT2は、上記各関係式から算
出される絶対的なフレーズ継続時間長を各々DP1,D
P2としたとき、下記(5)式及び(6)式により求め
ることができる。 PT1=(P1/DP1+ST)/2・・・(5) PT2=(P2/DP2+ST)/2・・・(6)
【0020】上述のように各フレーズ毎に求めた発声テ
ンポを韻律制御パラメータの一つとして設定し、公知の
手法を用いて規則音声合成を行う。これにより、5モー
ラから成る「爆音が」のフレーズと15モーラから成る
「銀世界の高原に広がる。」のフレーズとが異なる韻律
制御パラメータで音声合成され、従来より減り張りのあ
る、自然発声音声に近い合成音声が得られる。
【0021】なお、以上は、好適な例として、文発声テ
ンポ設定(S104)によりマクロ的な韻律制御を行っ
た後に、フレーズ発声テンポ設定(S105)によりミ
クロ的な韻律制御を行う場合について説明したが、短文
のみから成る文章についての規則音声合成の場合や、処
理の高速化を重視する場合は、文発声テンポ設定(S1
04)のみを実行してフレーズ発声テンポ設定(S10
5)を省略しても良い。
【0022】
【発明の効果】以上の説明から明らかなように、本発明
によれば、発声テンポが一定である従来の規則音声合成
と異なり、文の長さやフレーズの長さに応じて発声テン
ポが随時変化する効果があり、規則に基づく合成音声に
減り張りを与えて自然性を高めることが可能となる。
【図面の簡単な説明】
【図1】文中モーラ数Sと文継続時間長SDとの関係を
示すグラフ。
【図2】フレーズ内モーラ数Pとフレーズ継続時間長P
Dとの関係を示すグラフ。
【図3】本発明の一実施形態による発声テンポの設定手
順を示すフローチャート。
【図4】本実施形態における文とフレーズとの関係を示
す説明図。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 複数文の自然発声音声の継続時間長と各
    文のモーラ数との関係を定量化して両者の関係を代表す
    る第1の関係式を導出する段階と、 合成対象文の文字列からモーラ数を抽出する段階と、 抽出したモーラ数と前記第1の関係式とに基づいて前記
    合成対象文の発声テンポを決定する段階と、 決定した発声テンポを韻律制御パラメータの一つとして
    規則音声合成を行う段階と、を含むことを特徴とする音
    声合成方法。
  2. 【請求項2】 複数文の自然発声音声の継続時間長と各
    文のモーラ数との関係を代表する第1の関係式、各文を
    構成する最終フレーズ以外の継続時間長と各フレーズの
    モーラ数との関係を代表する第2の関係式、及び各文を
    構成する最終フレーズのフレーズの継続時間長と当該フ
    レーズのモーラ数との関係を代表する第3の関係式を導
    出する段階と、 合成対象文の文字列をフレーズ毎に切り分ける段階と、 前記合成対象文のモーラ数及び切り分けたフレーズ毎の
    モーラ数を抽出する段階と、 前記合成対象文のモーラ数と前記第1の関係式に基づい
    て当該文の発声テンポを決定する段階と、 各フレーズのモーラ数、前記第2及び第3の関係式、及
    び前記文の発声テンポに基づいてフレーズ毎の発声テン
    ポを決定する段階と、 決定したフレーズ毎の発声テンポを韻律制御パラメータ
    の一つとして規則音声合成を行う段階と、を含むことを
    特徴とする音声合成方法。
  3. 【請求項3】 前記発声テンポは、単位時間に発声され
    るモーラ数であることを特徴とする請求項1又は2記載
    の音声合成方法。
JP7245686A 1995-09-25 1995-09-25 音声合成方法 Pending JPH0990971A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7245686A JPH0990971A (ja) 1995-09-25 1995-09-25 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7245686A JPH0990971A (ja) 1995-09-25 1995-09-25 音声合成方法

Publications (1)

Publication Number Publication Date
JPH0990971A true JPH0990971A (ja) 1997-04-04

Family

ID=17137313

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7245686A Pending JPH0990971A (ja) 1995-09-25 1995-09-25 音声合成方法

Country Status (1)

Country Link
JP (1) JPH0990971A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132179A (ja) * 1998-10-27 2000-05-12 Nippon Telegr & Teleph Corp <Ntt> 録音音声データベース話速均一化方法及び装置及び話速均一化プログラムを格納した記憶媒体
US6339006B1 (en) 1999-06-30 2002-01-15 Hyundai Electronics Ind. Co., Ltd. Flash EEPROM cell and method of manufacturing the same
JP2006098695A (ja) * 2004-09-29 2006-04-13 Clarion Co Ltd 音声合成装置、制御方法、制御プログラム及び記録媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132179A (ja) * 1998-10-27 2000-05-12 Nippon Telegr & Teleph Corp <Ntt> 録音音声データベース話速均一化方法及び装置及び話速均一化プログラムを格納した記憶媒体
US6339006B1 (en) 1999-06-30 2002-01-15 Hyundai Electronics Ind. Co., Ltd. Flash EEPROM cell and method of manufacturing the same
JP2006098695A (ja) * 2004-09-29 2006-04-13 Clarion Co Ltd 音声合成装置、制御方法、制御プログラム及び記録媒体
JP4684609B2 (ja) * 2004-09-29 2011-05-18 クラリオン株式会社 音声合成装置、制御方法、制御プログラム及び記録媒体

Similar Documents

Publication Publication Date Title
EP2838082B1 (en) Voice analysis method and device, and medium storing voice analysis program
US7016841B2 (en) Singing voice synthesizing apparatus, singing voice synthesizing method, and program for realizing singing voice synthesizing method
WO2005109399A1 (ja) 音声合成装置および方法
JP4406440B2 (ja) 音声合成装置、音声合成方法及びプログラム
JPH10153998A (ja) 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置
JP2009047957A (ja) ピッチパターン生成方法及びその装置
Angelini et al. Singing synthesis: with a little help from my attention
JPH0632020B2 (ja) 音声合成方法および装置
JPH0772900A (ja) 音声合成の感情付与方法
JP2009133890A (ja) 音声合成装置及びその方法
JP5874639B2 (ja) 音声合成装置、音声合成方法及び音声合成プログラム
JPH0990971A (ja) 音声合成方法
JPH0580791A (ja) 音声規則合成装置および方法
JP5275470B2 (ja) 音声合成装置およびプログラム
JPS5972494A (ja) 規則合成方式
JPH037995A (ja) 歌音声合成データの作成装置
JPH11352997A (ja) 音声合成装置およびその制御方法
JP3292218B2 (ja) 音声メッセージ作成装置
Harhare et al. Analysis of Acoustic Correlates of Marathi Prosodic Features for Human-Machine Interaction
JPH056191A (ja) 音声合成装置
JP2755478B2 (ja) テキスト音声合成装置
JPH04149500A (ja) テキスト音声合成装置
JPH10301599A (ja) 音声合成装置
CN113409762A (zh) 情感语音合成方法、装置、设备及存储介质
JPH0756599B2 (ja) 音声フアイル作成方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term