JP2003308084A - 音声合成方法および音声合成装置 - Google Patents

音声合成方法および音声合成装置

Info

Publication number
JP2003308084A
JP2003308084A JP2002112202A JP2002112202A JP2003308084A JP 2003308084 A JP2003308084 A JP 2003308084A JP 2002112202 A JP2002112202 A JP 2002112202A JP 2002112202 A JP2002112202 A JP 2002112202A JP 2003308084 A JP2003308084 A JP 2003308084A
Authority
JP
Japan
Prior art keywords
prosody
reading
dictionary
pattern
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002112202A
Other languages
English (en)
Inventor
Akira Mochizuki
亮 望月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2002112202A priority Critical patent/JP2003308084A/ja
Publication of JP2003308084A publication Critical patent/JP2003308084A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 入力されたテキストを自然な発声で読み上げ
ることができる音声合成方法および音声合成装置を提供
すること。 【解決手段】 予め設定された韻律パタンが格納された
韻律辞書106と、予め設定された読みの韻律パタンが
格納された個別韻律辞書109と、所望の読みと一致す
る読みを個別韻律辞書109内で検索する一致読み検索
手段111と、所望の読みおよび読み出された韻律辞書
106の韻律パタンに基づいて韻律情報を生成する第1
の韻律情報生成手段112と、所望の読みおよび個別韻
律辞書109の韻律パタンに基づいて韻律情報を生成す
る第2の韻律情報生成手段113とを備え、所望の読み
が個別韻律辞書109にあるときは、第2の韻律情報生
成手段113により生成された韻律情報に基づいて音声
を合成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声合成方法およ
び音声合成装置に関し、さらに詳しくは、入力されたテ
キストを音声読み上げする音声合成方法および音声合成
装置に関する。
【0002】
【従来の技術】従来、入力されたテキストを音声読み上
げする音声合成装置としては、図9に示すようなものが
知られている。図9に示された従来の音声合成装置は、
テキストを入力するテキスト入力手段1と、テキストの
読みを生成するテキスト読み生成手段2と、読みに韻律
記号を付加する韻律記号付加手段3と、韻律記号が付加
された読みを予め設定された規則で区切る読み区切り手
段4と、予め設定された韻律パタンを韻律辞書6に格納
する韻律辞書格納手段5と、韻律辞書6から韻律パタン
を読み出す韻律辞書読出手段7と、区切られた読みおよ
び前記読み出された韻律辞書6の韻律パタンに基づいて
区切り毎に韻律情報を生成する韻律情報生成手段8と、
生成された区切り毎の韻律情報を接続する韻律情報接続
手段9と、接続された韻律情報に基づいて音声合成の波
形を生成する音声合成波形生成手段10と、音声波形辞
書11とで構成されている。
【0003】次に、従来の音声合成装置の動作について
説明する。まず、テキスト入力手段1にテキストが入力
され、このテキストは、テキスト読み生成手段2によっ
て読みが生成される。次いで、韻律記号付加手段3によ
って、読みに韻律記号が付加される。次いで、読み区切
り手段4によって、韻律記号が付加された読みが予め設
定された規則で区切られる。次いで、韻律情報生成手段
7によって、韻律辞書6に格納された韻律パタンに基づ
いて区切られた読みの韻律情報が生成される。ここで、
韻律辞書6には、韻律辞書格納手段4によって予め設定
された規則で生成された韻律パタンが格納されている。
また、この韻律辞書6に格納された韻律パタンは、韻律
辞書読出手段7によって読み出される。次いで、韻律情
報接続手段9によって、区切られた読みの韻律情報が接
続される。次いで、音声合成波形生成手段10によっ
て、接続された韻律情報および音声波形辞書11に基づ
いて音声合成の波形が生成され、合成音声が出力され
る。
【0004】以上のように、従来の音声合成装置でも、
入力されたテキストを音声読み上げすることができた。
【0005】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の音声合成装置では、規則で生成された韻律パ
タンに基づいて韻律を生成するので、合成された音声の
韻律が不自然になるという問題があった。
【0006】本発明は、このような問題を解決するため
になされたものであり、入力されたテキストを自然な発
声で読み上げることができる音声合成方法および音声合
成装置を提供するものである。
【0007】
【課題を解決するための手段】本発明の音声合成方法
は、テキストを入力するテキスト入力工程と、前記テキ
ストの読みを生成するテキスト読み生成工程と、前記テ
キスト読み生成工程で生成された読みに韻律記号を付加
する韻律記号付加工程と、前記韻律記号付加工程で韻律
記号が付加された読みを予め設定された規則で区切る読
み区切り工程と、予め設定された読みの韻律パタンを複
数の韻律辞書に格納する韻律辞書格納工程と、前記複数
の韻律辞書から韻律パタンを読み出す韻律辞書読出工程
と、前記読み区切り工程で区切られた読みと一致する読
みを前記複数の韻律辞書内で検索する一致読み検索工程
と、前記区切られた読みおよび前記韻律辞書読出工程で
読み出された韻律辞書の韻律パタンに基づいて前記区切
り毎に韻律情報を生成する韻律情報生成工程と、前記韻
律情報生成工程で生成された前記区切り毎の韻律情報を
接続する韻律情報接続工程と、前記韻律情報接続工程で
接続された韻律情報に基づいて音声合成の波形を生成す
る音声合成波形生成工程とを含み、前記音声合成波形生
成工程において、前記複数の韻律辞書で検索された韻律
パタンに基づいて音声合成の波形を生成させることを特
徴としている。この構成により、複数の韻律辞書に格納
された韻律パタンに基づいて韻律情報が生成されるの
で、極めて自然な合成音声を生成することができる。
【0008】また、本発明の音声合成方法は、テキスト
を入力するテキスト入力工程と、前記テキストの読みを
生成するテキスト読み生成工程と、前記テキスト読み生
成工程で生成された読みに韻律記号を付加する韻律記号
付加工程と、前記韻律記号付加工程で韻律記号が付加さ
れた読みを予め設定された規則で区切る読み区切り工程
と、予め設定された韻律パタンを韻律辞書に格納する韻
律辞書格納工程と、前記韻律辞書から韻律パタンを読み
出す韻律辞書読出工程と、予め設定された読みの韻律パ
タンを個別韻律辞書に格納する個別韻律辞書格納工程
と、前記個別韻律辞書から韻律パタンを読み出す個別韻
律辞書読出工程と、前記読み区切り工程で区切られた読
みと一致する読みを前記個別韻律辞書内で検索する一致
読み検索工程と、前記区切られた読みおよび前記韻律辞
書読出工程で読み出された韻律辞書の韻律パタンに基づ
いて前記区切り毎に韻律情報を生成する第1の韻律情報
生成工程と、前記区切られた読みおよび前記個別韻律辞
書読出工程で読み出された個別韻律辞書の韻律パタンに
基づいて前記区切り毎に韻律情報を生成する第2の韻律
情報生成工程と、前記一致読み検索工程における検索結
果に基づいて前記第1の韻律情報生成工程および前記第
2の韻律情報生成工程の何れかを選択する韻律情報選択
工程と、前記韻律情報選択工程で選択された何れかの韻
律情報生成工程で生成された前記区切り毎の韻律情報を
接続する韻律情報接続工程と、前記韻律情報接続工程で
接続された韻律情報に基づいて音声合成の波形を生成す
る音声合成波形生成工程とを含み、前記一致読み検索工
程において、前記区切られた読みと一致する読みが前記
個別韻律辞書で検索されたときには、前記音声合成波形
生成工程において、前記第2の韻律情報生成工程で生成
された韻律情報に基づいて音声合成の波形を生成させる
ことを特徴としている。この構成により、前記一致読み
検索工程において、前記区切られた読みと一致する読み
が前記個別韻律辞書で見つけ出されたときには、前記音
声合成波形生成工程において、前記第2の韻律情報生成
工程で生成された韻律情報に基づいて音声合成の波形が
生成されるので、極めて自然な合成音声を生成すること
ができる。
【0009】また、本発明の音声合成方法は、前記個別
韻律辞書が、基本周波数パタン、振幅パタンおよび継続
時間長パタンの何れかのパタンを1つ以上含んでいる。
この構成により、前記第2の韻律情報生成工程におい
て、基本周波数パタン、振幅パタンおよび継続時間長パ
タンの何れかのパタンを1つ以上含む前記個別韻律辞書
に基づいて音声合成の波形が生成されるので、極めて自
然な合成音声を生成することができる。
【0010】また、本発明の音声合成方法は、前記個別
韻律辞書が、予め設定された単語、句、節および文章の
読みの韻律パタンを含んでいる。この構成により、前記
第2の韻律情報生成工程において、予め設定された単
語、句、節および文章の読みの韻律パタンを含む前記個
別韻律辞書に基づいて音声合成の波形が生成されるの
で、極めて自然な合成音声を生成することができる。
【0011】また、本発明の音声合成方法は、テキスト
を入力するテキスト入力工程と、前記テキストの読みを
生成するテキスト読み生成工程と、前記テキスト読み生
成工程で生成された読みに韻律記号を付加する韻律記号
付加工程と、前記韻律記号付加工程で韻律記号が付加さ
れた読みを予め設定された規則で区切る読み区切り工程
と、予め設定された韻律パタンを韻律辞書に格納する韻
律辞書格納工程と、前記韻律辞書から韻律パタンを読み
出す韻律辞書読出工程と、自然音声から韻律パタンを生
成する自然音声韻律パタン生成工程と、前記韻律辞書読
出工程において読み出された韻律パタンと前記自然音声
から生成された韻律パタンとの差分を韻律パタン差分辞
書に格納する韻律パタン差分辞書格納工程と、前記韻律
パタン差分辞書から韻律パタン差分を読み出す韻律パタ
ン差分辞書読出工程と、前記読み区切り工程で区切られ
た読みと一致する読みを前記韻律パタン差分辞書内で検
索する一致読み検索工程と、前記区切られた読みおよび
前記韻律辞書読出工程で韻律辞書から読み出された韻律
パタンに基づいて前記区切り毎に韻律情報を生成する第
1の韻律情報生成工程と、前記韻律パタンに前記韻律パ
タン差分辞書読出工程において読み出された韻律パタン
差分を前記区切り毎に加算する韻律パタン加算工程と、
前記加算された韻律パタンに基づいて前記区切り毎に韻
律情報を生成する第2の韻律情報生成工程と、前記一致
読み検索工程における検索結果に基づいて前記第1の韻
律情報生成工程および前記第2の韻律情報生成工程の何
れかを選択する韻律情報選択工程と、前記韻律情報選択
工程で選択された何れかの韻律情報生成工程で生成され
た前記区切り毎の韻律情報を接続する韻律情報接続工程
と、前記韻律情報接続工程で接続された韻律情報に基づ
いて音声合成の波形を生成する音声合成波形生成工程と
を含み、前記一致読み検索工程において、前記区切られ
た読みと一致する読みが前記個別韻律辞書で検索された
ときには、前記音声合成波形生成工程において、前記第
2の韻律情報生成工程で生成された韻律情報に基づいて
音声合成の波形を生成させることを特徴としている。こ
の構成により、前記一致読み検索工程において、前記区
切られた読みと一致する読みが前記個別韻律辞書で検索
されたときには、前記音声合成波形生成工程において、
前記第2の韻律情報生成工程で生成された韻律情報に基
づいて音声合成の波形が生成されるので、極めて自然な
合成音声を生成することができる。
【0012】本発明の音声合成装置は、テキストを入力
するテキスト入力手段と、前記テキストの読みを生成す
るテキスト読み生成手段と、前記テキスト読み生成手段
で生成された読みに韻律記号を付加する韻律記号付加手
段と、前記韻律記号付加手段で韻律記号が付加された読
みを予め設定された規則で区切る読み区切り手段と、予
め設定された読みの韻律パタンを複数の韻律辞書に格納
する韻律辞書格納手段と、前記複数の韻律辞書から韻律
パタンを読み出す韻律辞書読出手段と、前記読み区切り
手段で区切られた読みと一致する読みを前記複数の韻律
辞書内で検索する一致読み検索手段と、前記区切られた
読みおよび前記韻律辞書読出手段で読み出された韻律辞
書の韻律パタンに基づいて前記区切り毎に韻律情報を生
成する韻律情報生成手段と、前記韻律情報生成手段で生
成された前記区切り毎の韻律情報を接続する韻律情報接
続手段と、前記韻律情報接続手段で接続された韻律情報
に基づいて音声合成の波形を生成する音声合成波形生成
手段とを備え、前記音声合成波形生成手段が、前記複数
の韻律辞書で検索された韻律パタンに基づいて音声合成
の波形を生成することを特徴としている。この構成によ
り、複数の韻律辞書に格納された韻律パタンに基づいて
韻律情報が生成されるので、極めて自然な合成音声を生
成することができる。
【0013】また、本発明の音声合成装置は、テキスト
を入力するテキスト入力手段と、前記テキストの読みを
生成するテキスト読み生成手段と、前記テキスト読み生
成手段で生成された読みに韻律記号を付加する韻律記号
付加手段と、前記韻律記号付加手段で韻律記号が付加さ
れた読みを予め設定された規則で区切る読み区切り手段
と、予め設定された韻律パタンを韻律辞書に格納する韻
律辞書格納手段と、前記韻律辞書から韻律パタンを読み
出す韻律辞書読出手段と、予め設定された読みの韻律パ
タンを個別韻律辞書に格納する個別韻律辞書格納手段
と、前記個別韻律辞書から韻律パタンを読み出す個別韻
律辞書読出手段と、前記読み区切り手段で区切られた読
みと一致する読みを前記個別韻律辞書内で検索する一致
読み検索手段と、前記区切られた読みおよび前記韻律辞
書読出手段で読み出された韻律辞書の韻律パタンに基づ
いて前記区切り毎に韻律情報を生成する第1の韻律情報
生成手段と、前記区切られた読みおよび前記個別韻律辞
書読出手段で読み出された個別韻律辞書の韻律パタンに
基づいて前記区切り毎に韻律情報を生成する第2の韻律
情報生成手段と、前記一致読み検索手段の検索結果に基
づいて前記第1の韻律情報生成手段および前記第2の韻
律情報生成手段の何れかを選択する韻律情報選択手段
と、前記韻律情報選択手段で選択された何れかの韻律情
報生成手段で生成された前記区切り毎の韻律情報を接続
する韻律情報接続手段と、前記韻律情報接続手段で接続
された韻律情報に基づいて音声合成の波形を生成する音
声合成波形生成手段とを備え、前記一致読み検索手段
が、前記区切られた読みと一致する読みを前記個別韻律
辞書で検索したときには、前記音声合成波形生成手段
が、前記第2の韻律情報生成手段で生成された韻律情報
に基づいて音声合成の波形を生成するようにしたことを
特徴としている。この構成により、前記一致読み検索手
段が、前記区切られた読みと一致する読みを前記個別韻
律辞書で見つけ出したときには、前記音声合成波形生成
手段が、前記第2の韻律情報生成手段で生成された韻律
情報に基づいて音声合成の波形を生成するので、極めて
自然な合成音声を生成することができる。
【0014】また、本発明の音声合成装置は、テキスト
を入力するテキスト入力手段と、前記テキストの読みを
生成するテキスト読み生成手段と、前記テキスト読み生
成手段で生成された読みに韻律記号を付加する韻律記号
付加手段と、前記韻律記号付加手段で韻律記号が付加さ
れた読みを予め設定された規則で区切る読み区切り手段
と、予め設定された韻律パタンを韻律辞書に格納する韻
律辞書格納手段と、前記韻律辞書から韻律パタンを読み
出す韻律辞書読出手段と、自然音声から韻律パタンを生
成する自然音声韻律パタン生成手段と、前記韻律辞書読
出手段が読み出した韻律パタンと前記自然音声から生成
された韻律パタンとの差分を韻律パタン差分辞書に格納
する韻律パタン差分辞書格納手段と、前記韻律パタン差
分辞書から韻律パタン差分を読み出す韻律パタン差分辞
書読出手段と、前記読み区切り手段で区切られた読みと
一致する読みを前記韻律パタン差分辞書内で検索する一
致読み検索手段と、前記区切られた読みおよび前記韻律
辞書読出手段で韻律辞書から読み出された韻律パタンに
基づいて前記区切り毎に韻律情報を生成する第1の韻律
情報生成手段と、前記韻律パタンに前記韻律パタン差分
辞書読出手段が読み出した韻律パタン差分を前記区切り
毎に加算する韻律パタン加算手段と、前記加算された韻
律パタンに基づいて前記区切り毎に韻律情報を生成する
第2の韻律情報生成手段と、前記一致読み検索手段の検
索結果に基づいて前記第1の韻律情報生成手段および前
記第2の韻律情報生成手段の何れかを選択する韻律情報
選択手段と、前記韻律情報選択手段で選択された何れか
の韻律情報生成手段で生成された前記区切り毎の韻律情
報を接続する韻律情報接続手段と、前記韻律情報接続手
段で接続された韻律情報に基づいて音声合成の波形を生
成する音声合成波形生成手段とを備え、前記一致読み検
索手段が、前記区切られた読みと一致する読みを前記個
別韻律辞書で検索したときには、前記音声合成波形生成
手段が、前記第2の韻律情報生成手段で生成された韻律
情報に基づいて音声合成の波形を生成するようにしたこ
とを特徴としている。この構成により、前記一致読み検
索手段が、前記区切られた読みと一致する読みを前記個
別韻律辞書で見つけ出したときには、前記音声合成波形
生成手段が、前記第2の韻律情報生成手段で生成された
韻律情報に基づいて音声合成の波形を生成するので、極
めて自然な合成音声を生成することができる。
【0015】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照して説明する。
【0016】(第1の実施の形態)図1は、本発明の第
1の実施の形態の音声合成装置のブロック図である。図
1に示すように、本実施の形態の音声合成装置は、テキ
ストを入力するテキスト入力手段101と、テキストの
読みを生成するテキスト読み生成手段102と、読みに
韻律記号を付加する韻律記号付加手段103と、韻律記
号が付加された読みを予め設定された規則で区切る読み
区切り手段104と、予め設定された韻律パタンを韻律
辞書106に格納する韻律辞書格納手段105と、韻律
辞書106から韻律パタンを読み出す韻律辞書読出手段
107と、予め設定された読みの韻律パタンを個別韻律
辞書109に格納する個別韻律辞書格納手段108と、
個別韻律辞書109から韻律パタンを読み出す個別韻律
辞書読出手段110と、区切られた読みと一致する読み
を個別韻律辞書109内で検索する一致読み検索手段1
11と、区切られた読みおよび読み出された韻律辞書1
06の韻律パタンに基づいて区切り毎に韻律情報を生成
する第1の韻律情報生成手段112と、区切られた読み
および読み出された個別韻律辞書109の韻律パタンに
基づいて区切り毎に韻律情報を生成する第2の韻律情報
生成手段113と、一致読み検索手段111の検索結果
に基づいて第1の韻律情報生成手段112および第2の
韻律情報生成手段113の何れかを選択する韻律情報選
択手段114と、選択された何れかの韻律情報生成手段
で生成された区切り毎の韻律情報を接続する韻律情報接
続手段115と、接続された韻律情報に基づいて音声合
成の波形を生成する音声合成波形生成手段116と、音
声波形を格納した音声波形辞書117とを備えている。
ここで、前述の韻律辞書106に格納された韻律パタン
の具体的な例を挙げれば、規則に基づいて音声を合成す
るのに最低限必要なアクセント型の基本周波数パタンが
格納されている。また、前述の個別韻律辞書109に格
納された韻律パタンの具体的な例を挙げれば、予め設定
した任意の読みおよび音声を合成する頻度の高い単語、
句、節、文章等に関する自然な韻律パタンが格納されて
いる。この個別韻律辞書109に格納された韻律パタン
は、基本周波数パタン、振幅パタンおよび継続時間長パ
タンの何れかのパタンを1つ以上含んでいる。ここで基
本周波数パタン、振幅パタンおよび継続時間長パタン
は、それぞれ声の高さ、声の大きさおよび発声の速度を
決定するものである。
【0017】次に、本実施の形態の音声合成装置の動作
について、図1から図3までを参照して説明する。図2
は、本実施の形態の音声合成工程のフローチャートであ
る。また、図3は、前述の韻律辞書106および個別韻
律辞書109による韻律情報の生成工程の説明図であ
る。
【0018】図2に示すように、テキスト入力手段10
1により、テキストが入力される(ステップS20
1)。次いで、テキスト読み生成手段102により、入
力されたテキストの読みが生成される(ステップS20
2)。次いで、韻律記号付加手段103により、読みに
韻律記号が付加される(ステップS203)。ここで、
読みおよび韻律記号について、「300メートル先、佐
江戸交差点を、左方向です」という文章を例に挙げて説
明する。この文章の読みは、「サンビャクメートルサキ
サエドコーサテンヲヒダリホーコーデス」である。次い
で、アクセントの位置を記号「’」、アクセント句境界
を記号「/」およびポーズ挿入位置を記号「,」で表す
と、前述の読みは、「サンビャクメ’ートル/サキ,サ
エドコーサ’テンヲ,ヒダリホ’ーコーデス」という文
字情報で表される。前述のアクセントの位置の記
号「’」、アクセント句境界の記号「/」およびポーズ
挿入位置の記号等を韻律記号という。なお、前述の文字
情報は、中間言語とも呼ばれ、韻律パタンを規則によっ
て生成するために必要な情報が付加された文字情報を表
したものである。
【0019】次いで、読み区切り手段104により、前
述の文字情報が予め設定された規則で区切られる(ステ
ップS204)。例えば、前述の文字情報「サンビャク
メ’ートル/サキ,サエドコーサ’テンヲ,ヒダリホ’
ーコーデス」をポーズ挿入位置「,」で区切った場合
は、「サンビャクメ’ートル/サキ」、「サエドコー
サ’テンヲ」および「ヒダリホ’ーコーデス」の3つの
文字情報が得られる。次いで、個別韻律辞書読出手段1
10により、予め設定された読みの韻律パタンが個別韻
律辞書109から読み出される(ステップS205)。
この個別韻律辞書109については後述する。次いで,
一致読み検索手段111により、前述の区切られた読み
と一致する読みが個別韻律辞書109にあるか否かが区
切り毎に検索される(ステップS206)。前述の区切
られた読みと一致する読みが個別韻律辞書109にある
場合は、ステップS207に進み第2の韻律が生成さ
れ、前述の区切られた読みと一致する読みが個別韻律辞
書109にない場合は、韻律辞書読出手段107によ
り、韻律辞書106に格納された韻律パタンが読み出さ
れ(ステップS208)、次いで、第1の韻律情報生成
手段112により、区切られた読みおよび読み出された
韻律辞書106の韻律パタンに基づいて区切り毎に合成
音声のイントネーションやリズムを表現するのに必要な
韻律情報が規則によって生成される(ステップS20
9)。
【0020】一方、前述のステップS206において、
区切られた読みと一致した読みが個別韻律辞書109に
ある場合は、第2の韻律情報生成手段113により、区
切られた読みおよび読み出された個別韻律辞書109の
韻律パタンに基づいて区切り毎に韻律情報が生成される
(ステップS207)。
【0021】ここで、韻律パタンの生成について、前述
の「300メートル先、佐江戸交差点を、左方向です」
というテキスト文を例に挙げて、図3を参照して説明す
る。図3においては、韻律パタンの1つである文の抑揚
を表現する基本周波数パタンの生成を例に挙げており、
この基本周波数パタンの生成では、まず区切り毎の最大
基本周波数を推定し、続いてこの最大値基本周波数を基
準に基本周波数パタンを配置する方法を用いている。こ
こで基本周波数パタンは、モーラ毎に1点の基本周波数
を持った点ピッチパタンとする。ここで、モーラとは
「拍」をいい、仮名文字単位に相当するものである。例
えば、「左」は、「ひ」、「だ」および「り」の3個の
モーラで表される。
【0022】図3において、3つの区切り「300メー
トル先」、「佐江戸交差点を」および「左方向です」の
最大基本周波数は、それぞれ最大基本周波数321、最
大基本周波数322および最大基本周波数323で表し
ている。この各区切りの最大基本周波数321から最大
基本周波数323までを推定するには数量化I類を用い
る方法がある。数量化I類とは、複数のカテゴリー変数
から一つの数量変数を予測するモデルを作成する手法で
あり、例えば、日本音響学会論文誌49巻10号の「音
節区分化モデルに基づく基本周波数の2階層制御方式」
などが用いられる。この最大基本周波数321から最大
基本周波数323までを基準に、韻律辞書読出手段10
7が、区切られた読みの抑揚を表す基本周波数パタンを
韻律辞書106から読み出して配置する。なお、例示し
た前述の数量化I類を用いる方法に代えて最大基本周波
数を推定する他の方法を用いてもよい。また、継続時間
長パタンおよび振幅パタンについても、前述の基本周波
数パタンと同様に韻律辞書106から読み出して生成す
ることができる。
【0023】次に、前述の区切られた読みと同じ読みが
前述の個別韻律辞書109にある場合を説明する。この
個別韻律辞書109に格納されている基本周波数パタン
は、例えば、図3に示す基本周波数パタン311から基
本周波数パタン314までのパタンのように、予め最大
基本周波数で正規化されている。例として「300メー
トル先、佐江戸交差点を、左方向です」という文の基本
周波数パタンを生成する際に、「300メートル先」と
「左方向です」という区切られた読みに対応する基本周
波数パタンが個別韻律辞書109に格納されていたとす
る。この場合、「300メートル先」と「左方向です」
の2つの読みに関しては、個別韻律辞書読出手段110
により、個別韻律辞書109に格納されている韻律パタ
ンが読み出され、韻律情報が生成される。一方、個別韻
律辞書109に存在しない「佐江戸交差点を」の読みの
み、韻律辞書106に格納されている汎用的な基本周波
数パタンにより韻律情報が規則により生成される。
【0024】なお、前述のように、一致読み検索手段1
11が検索した結果、所望の読みの韻律パタンが個別韻
律辞書109にある場合は韻律情報選択手段114が第
2の韻律情報生成手段113を選択し韻律情報が生成さ
れる。一方、一致読み検索手段111が検索した結果、
所望の読みの韻律パタンが個別韻律辞書109にない場
合は韻律情報選択手段114が第1の韻律情報生成手段
112を選択し韻律情報が生成される。
【0025】次いで、韻律情報接続手段115により、
前述の生成された区切り毎の韻律情報が接続される(ス
テップS210)。次いで、音声合成波形生成手段11
6により、接続された韻律情報および音声波形辞書11
7に基づいて音声合成の波形が生成される(ステップS
211)。ここで、音声合成の波形を生成する単位は、
音素、音節、母音と子音と母音の連鎖等の単位が使用さ
れる。また、音声波形は韻律パタンに基づいて、基本周
波数、継続時間長および振幅の変換が行なわれる。この
韻律パタンからの変換には、例えば、波形重畳方式が用
いられる。次いで、次の読みの区切りがあるか否かを判
定する(ステップS212)。次の読みの区切りがある
場合はステップS205に戻り、次の読みの区切りがな
い場合は音声合成工程を終了する。なお、前述のステッ
プS210とステップS211の順序を入れ替えて、音
声合成波形を生成した後、合成された音声波形を接続す
るようにしてもよい。
【0026】以上のように、本実施の形態の音声合成装
置によれば、韻律情報を生成する際に、規則で生成され
た韻律パタンが格納された韻律辞書または音声を合成す
る頻度の高い読みが格納された個別韻律辞書を、読みの
区切り毎に選択できる構成にしたので、所望の読みが個
別韻律辞書にあるときは、韻律辞書に格納された韻律パ
タンに代えて個別韻律辞書に格納された韻律パタンに基
づいて韻律情報を生成することにより、極めて自然な合
成音声を生成することができる。
【0027】(第2の実施の形態)図4は、本発明の第
2の実施の形態の音声合成装置のブロック図である。図
4に示すように、本実施の形態の音声合成装置は、テキ
ストを入力するテキスト入力手段101と、テキストの
読みを生成するテキスト読み生成手段102と、読みに
韻律記号を付加する韻律記号付加手段103と、韻律記
号が付加された読みを予め設定された規則で区切る読み
区切り手段104と、予め設定された韻律パタンを韻律
辞書106に格納する韻律辞書格納手段105と、韻律
辞書106から韻律パタンを読み出す韻律辞書読出手段
107と、自然音声から韻律パタンを生成する自然音声
韻律パタン生成手段401と、韻律辞書読出手段107
が読み出した韻律パタンと自然音声から生成された韻律
パタンとの差分を韻律パタン差分辞書403に格納する
韻律パタン差分辞書格納手段402と、韻律パタン差分
辞書403から韻律パタン差分を読み出す韻律パタン差
分辞書読出手段404と、区切られた読みと一致する読
みを韻律パタン差分辞書403内で検索する一致読み検
索手段405と、区切られた読みおよび読み出された韻
律辞書106の韻律パタンに基づいて区切り毎に韻律情
報を生成する第1の韻律情報生成手段112と、韻律辞
書106から読み出された韻律パタンに韻律パタン差分
辞書読出手段404が読み出した韻律パタン差分を区切
り毎に加算する韻律パタン加算手段406と、加算され
た韻律パタンに基づいて区切り毎に韻律情報を生成する
第2の韻律情報生成手段407と、一致読み検索手段4
05の検索結果に基づいて第1の韻律情報生成手段11
2および第2の韻律情報生成手段407の何れかを選択
する韻律情報選択手段408と、選択された何れかの韻
律情報生成手段で生成された区切り毎の韻律情報を接続
する韻律情報接続手段115と、接続された韻律情報に
基づいて音声合成の波形を生成する音声合成波形生成手
段116と、音声波形を格納した音声波形辞書117と
を備えている。ここで、前述の韻律辞書106に格納さ
れた韻律パタンの具体的な例を挙げれば、規則に基づい
て音声を合成するのに最低限必要なアクセント型の基本
周波数パタンが格納されている。また、前述の韻律パタ
ン差分辞書403に格納された韻律パタンの具体的な例
を挙げれば、予め設定した任意の読みおよび音声を合成
する頻度の高い単語、句、節、文章等に関する自然な韻
律パタンと前述の韻律辞書106に格納された韻律パタ
ンとの差分の韻律パタンが格納されている。この韻律パ
タン差分辞書403に格納された差分の韻律パタンは、
差分の基本周波数パタン、差分の振幅パタンおよび差分
の継続時間長パタンの何れかのパタンを1つ以上含んで
いる。ここで基本周波数パタン、振幅パタンおよび継続
時間長パタンは、それぞれ声の高さ、声の大きさおよび
発声の速度を決定するものである。
【0028】次に、本実施の形態の音声合成装置の動作
について、図4から図8までを参照して説明する。図5
は、本実施の形態の韻律パタン差分辞書403の生成工
程のフローチャートである。また、図6は、本実施の形
態の韻律パタン差分辞書403の生成工程の説明図であ
る。また、図7は、本実施の形態の音声合成工程のフロ
ーチャートである。また、図8は、本実施の形態の音声
合成工程の説明図である。
【0029】まず、本実施の形態の音声合成で使用する
韻律パタン差分辞書403の生成工程を図5により説明
する。図5に示すように、入力された前述の中間言語に
基づいて韻律パタンが規則により生成される(ステップ
S501)。次いで。入力された自然音声に基づいて自
然音声韻律パタンが生成される(ステップS502)。
ここで、自然音声とは、予め設定された話者が発声した
音声をいう。次いで、ステップS501において生成さ
れた韻律パタンとステップS502において生成された
自然音声韻律パタンとが比較され(ステップS50
3)、その差分の韻律パタンが韻律パタン差分辞書40
3に格納される。
【0030】次に、前述の韻律パタン差分を韻律パタン
差分辞書403に格納する工程について、基本周波数パ
タンを例に挙げて図6を参照して説明する。図6に示す
基本周波数パタン601は、前述の自然音声を分析して
得た基本周波数パタンである。一方、基本周波数パタン
602は、前述の規則により生成された基本周波数パタ
ンである。基本周波数パタン601と基本周波数パタン
602との差分の基本周波数パタンは、図6に示す基本
周波数パタン603のようになる。この差分基本周波数
パタン603が前述の韻律パタン差分辞書403に格納
される。
【0031】次に、本実施の形態の音声合成装置の動作
を図7に示すフローチャートを参照して説明する。図7
に示すように、テキスト入力手段101により、テキス
トが入力される(ステップS201)。次いで、テキス
ト読み生成手段102により、入力されたテキストの読
みが生成される(ステップS202)。次いで、韻律記
号付加手段103により、読みに韻律記号が付加される
(ステップS203)。ここで、読みおよび韻律記号に
ついて、「300メートル先、佐江戸交差点を、左方向
です」という文章を例に挙げて説明する。この文章の読
みは、「サンビャクメートルサキサエドコーサテンヲヒ
ダリホーコーデス」である。次いで、アクセントの位置
を記号「’」、アクセント句境界を記号「/」およびポ
ーズ挿入位置を記号「,」で表すと、前述の読みは、
「サンビャクメ’ートル/サキ,サエドコーサ’テン
ヲ,ヒダリホ’ーコーデス」という文字情報で表され
る。前述のアクセントの位置の記号「’」、アクセント
句境界の記号「/」およびポーズ挿入位置の記号等を韻
律記号という。なお、前述の文字情報は、中間言語とも
呼ばれ、韻律パタンを規則によって生成するために必要
な情報が付加された文字情報を表したものである。
【0032】次いで、読み区切り手段104により、前
述の文字情報が予め設定された規則で区切られる(ステ
ップS204)。例えば、前述の文字情報「サンビャク
メ’ートル/サキ,サエドコーサ’テンヲ,ヒダリホ’
ーコーデス」をポーズ挿入位置「,」で区切った場合
は、「サンビャクメ’ートル/サキ」、「サエドコー
サ’テンヲ」および「ヒダリホ’ーコーデス」の3つの
文字情報が得られる。次いで、韻律パタン差分辞書読出
手段404により、前述の差分韻律パタンが韻律パタン
差分辞書403から読み出される(ステップS70
1)。次いで,一致読み検索手段405により、前述の
区切られた読みと一致する読みが韻律パタン差分辞書4
03にあるか否かが区切り毎に検索される(ステップS
702)。前述の区切られた読みと一致する読みが韻律
パタン差分辞書403にある場合は、ステップS703
に進み韻律辞書106から韻律パタンが読み出され、前
述の区切られた読みと一致する読みが韻律パタン差分辞
書403にない場合は、韻律辞書読出手段107によ
り、韻律辞書106に格納された韻律パタンが読み出さ
れ(ステップS208)、次いで、第1の韻律情報生成
手段112により、区切られた読みおよび読み出された
韻律辞書106の韻律パタンに基づいて区切り毎に合成
音声のイントネーションやリズムを表現するのに必要な
韻律情報が規則によって生成される(ステップS20
9)。
【0033】一方、前述のステップS702において、
区切られた読みと一致した読みが韻律パタン差分辞書4
03にある場合は、まず、韻律辞書読出手段107によ
り、韻律辞書106から韻律パタンが読み出され(ステ
ップS703)、次いで、韻律パタン加算手段406に
より、韻律辞書106から読み出された韻律パタンに韻
律パタン差分辞書403から読み出された差分韻律パタ
ンが区切り毎に加算され(ステップS704)、次い
で、第2の韻律情報生成手段407により、この加算さ
れた韻律パタンに基づいて区切り毎に韻律情報が生成さ
れる(ステップS705)。
【0034】ここで、韻律パタンの生成について、前述
の「300メートル先、佐江戸交差点を、左方向です」
という文章を例に挙げて、図8を参照して説明する。図
8においては、韻律パタンの1つである文の抑揚を表現
する基本周波数パタンの生成を例に挙げている。図8に
おいて、3つの区切り「300メートル先」、「佐江戸
交差点を」および「左方向です」の最大基本周波数パタ
ンは、まず、前述の第1の韻律情報生成手段112によ
り生成される。次いで、前述の一致読み検索手段405
が、「300メートル先」と「左方向です」という区切
られた読みに対応する基本周波数パタンを韻律パタン差
分辞書403で見つけ出したとする。この場合、「30
0メートル先」と「左方向です」の2つの読みに関して
は、韻律パタン差分辞書読出手段404により、韻律パ
タン差分辞書403に格納されている韻律パタン差分が
読み出される。次いで、韻律パタン加算手段406によ
り、韻律辞書106から読み出された韻律パタンに韻律
パタン差分辞書403から読み出された差分韻律パタン
が区切り毎に加算され、図8に示すように、「300メ
ートル先」と「左方向です」の2つの読みに対応して基
本周波数パタン801および基本周波数パタン803が
生成される。また、「佐江戸交差点を」の読みは、前述
のように韻律パタン差分辞書403には存在しないの
で、第1の韻律情報生成手段112により基本周波数パ
タン802が生成される。
【0035】なお、前述のように、本実施の形態では、
一致読み検索手段405が検索した結果、所望の読みの
韻律パタンが韻律パタン差分辞書403にある場合は韻
律情報選択手段408が第2の韻律情報生成手段407
を選択し韻律情報が生成される。一方、一致読み検索手
段405が検索した結果、所望の読みの韻律パタンが韻
律パタン差分辞書403にない場合は韻律情報選択手段
408が第1の韻律情報生成手段112を選択し韻律情
報が生成される。
【0036】次いで、韻律情報接続手段409により、
前述の生成された区切り毎の韻律情報が接続される(ス
テップS706)。次いで、音声合成波形生成手段41
0により、接続された韻律情報および音声波形辞書11
7に基づいて音声合成の波形が生成される(ステップS
707)。ここで、音声合成の波形を生成する単位は、
音素、音節、母音と子音と母音の連鎖等の単位が使用さ
れる。また、音声波形は韻律パタンに基づいて、基本周
波数、継続時間長および振幅の変換が行なわれる。この
韻律パタンからの変換には、例えば、波形重畳方式が用
いられる。次いで、次の読みの区切りがあるか否かを判
定する(ステップS212)。次の読みの区切りがある
場合はステップS701に戻り、次の読みの区切りがな
い場合は音声合成工程を終了する。なお、前述のステッ
プS706とステップS707の順序を入れ替えて、音
声合成波形を生成した後、合成された音声波形を接続す
るようにしてもよい。
【0037】以上のように、本実施の形態の音声合成装
置によれば、韻律情報を生成する際に、自然音声と規則
によって生成された韻律パタンとの差分の韻律パタンを
格納した韻律パタン差分辞書に基づいて、読みの区切り
毎に、韻律情報を生成するように構成にしたので、所望
の読みが韻律パタン差分辞書にあるときは、韻律辞書に
格納された韻律パタンにこの差分韻律パタンを加算して
韻律情報を生成することにより、極めて自然な合成音声
を生成することができる。また、自然音声と規則によっ
て生成された韻律パタンとの差分の韻律パタンは、自然
発生のみにより生成された韻律パタンよりも情報量が極
めて少ないので、韻律パタンを記憶するときの記憶容量
を小さくすることができる。
【0038】
【発明の効果】以上説明したように、本発明によれば、
韻律情報を生成する際に、規則で生成された韻律パタン
が格納された韻律辞書または音声を合成する頻度の高い
読みが格納された個別韻律辞書を、読みの区切り毎に選
択できる構成にしたので、所望の読みが個別韻律辞書に
あるときは、韻律辞書に格納された韻律パタンに代えて
個別韻律辞書に格納された韻律パタンに基づいて韻律情
報を生成することにより、極めて自然な合成音声を生成
することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態における音声合成装
置のブロック図
【図2】本発明の第1の実施の形態における音声合成工
程のフローチャート
【図3】本発明の第1の実施の形態における韻律辞書1
06および個別韻律辞書109による韻律情報の生成工
程の説明図
【図4】本発明の第2の実施の形態における音声合成装
置のブロック図
【図5】本発明の第2の実施の形態の韻律パタン差分辞
書の生成工程のフローチャート
【図6】本発明の第2の実施の形態における韻律パタン
差分辞書の説明図
【図7】本発明の第2の実施の形態の音声合成工程のフ
ローチャート
【図8】本発明の第2の実施の形態における音声合成の
説明図
【図9】従来の音声合成装置のブロック図
【符号の説明】
1 テキスト入力手段 2 テキスト読み生成手段 3 韻律記号付加手段 4 読み区切り手段 5 韻律辞書格納手段 6 韻律辞書 7 韻律辞書読出手段 8 韻律情報生成手段 9 韻律情報接続手段 10 音声合成波形生成手段 11 音声波形辞書 101 テキスト入力手段 102 テキスト読み生成手段 103 韻律記号付加手段 104 読み区切り手段 105 韻律辞書格納手段 106 韻律辞書 107 韻律辞書読出手段 108 個別韻律辞書格納手段 109 個別韻律辞書 110 個別韻律辞書読出手段 111 一致読み検索手段 112 第1の韻律情報生成手段 113 第2の韻律情報生成手段 114 韻律情報選択手段 115 韻律情報接続手段 116 音声合成波形生成手段 117 音声波形辞書 311、312、313、314 個別韻律辞書109
に格納されている正規化された基本周波数パタン 321、322、323 韻律辞書106に格納されて
いる基本周波数パタン 401 自然音声韻律パタン生成手段 402 韻律パタン差分辞書格納手段 403 韻律パタン差分辞書 404 韻律パタン差分辞書読出手段 405 一致読み検索手段 406 韻律パタン加算手段 407 第2の韻律情報生成手段 408 韻律情報選択手段 601 自然音声を分析して生成された基本周波数パタ
ン 602 規則により生成された基本周波数パタン 603 基本周波数パタン601と基本周波数パタン6
02との差分の基本周波数パタン 801、803 差分韻律パタンが加算された基本周波
数パタン 802 韻律辞書により生成された基本周波数パタン

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 テキストを入力するテキスト入力工程
    と、前記テキストの読みを生成するテキスト読み生成工
    程と、前記テキスト読み生成工程で生成された読みに韻
    律記号を付加する韻律記号付加工程と、前記韻律記号付
    加工程で韻律記号が付加された読みを予め設定された規
    則で区切る読み区切り工程と、予め設定された読みの韻
    律パタンを複数の韻律辞書に格納する韻律辞書格納工程
    と、前記複数の韻律辞書から韻律パタンを読み出す韻律
    辞書読出工程と、前記読み区切り工程で区切られた読み
    と一致する読みを前記複数の韻律辞書内で検索する一致
    読み検索工程と、前記区切られた読みおよび前記韻律辞
    書読出工程で読み出された韻律辞書の韻律パタンに基づ
    いて前記区切り毎に韻律情報を生成する韻律情報生成工
    程と、前記韻律情報生成工程で生成された前記区切り毎
    の韻律情報を接続する韻律情報接続工程と、前記韻律情
    報接続工程で接続された韻律情報に基づいて音声合成の
    波形を生成する音声合成波形生成工程とを含み、前記音
    声合成波形生成工程において、前記複数の韻律辞書で検
    索された韻律パタンに基づいて音声合成の波形を生成さ
    せることを特徴とする音声合成方法。
  2. 【請求項2】 テキストを入力するテキスト入力工程
    と、前記テキストの読みを生成するテキスト読み生成工
    程と、前記テキスト読み生成工程で生成された読みに韻
    律記号を付加する韻律記号付加工程と、前記韻律記号付
    加工程で韻律符号が付加された読みを予め設定された規
    則で区切る読み区切り工程と、予め設定された韻律パタ
    ンを韻律辞書に格納する韻律辞書格納工程と、前記韻律
    辞書から韻律パタンを読み出す韻律辞書読出工程と、予
    め設定された読みの韻律パタンを個別韻律辞書に格納す
    る個別韻律辞書格納工程と、前記個別韻律辞書から韻律
    パタンを読み出す個別韻律辞書読出工程と、前記読み区
    切り工程で区切られた読みと一致する読みを前記個別韻
    律辞書内で検索する一致読み検索工程と、前記区切られ
    た読みおよび前記韻律辞書読出工程で読み出された韻律
    辞書の韻律パタンに基づいて前記区切り毎に韻律情報を
    生成する第1の韻律情報生成工程と、前記区切られた読
    みおよび前記個別韻律辞書読出工程で読み出された個別
    韻律辞書の韻律パタンに基づいて前記区切り毎に韻律情
    報を生成する第2の韻律情報生成工程と、前記一致読み
    検索工程における検索結果に基づいて前記第1の韻律情
    報生成工程および前記第2の韻律情報生成工程の何れか
    を選択する韻律情報選択工程と、前記韻律情報選択工程
    で選択された何れかの韻律情報生成工程で生成された前
    記区切り毎の韻律情報を接続する韻律情報接続工程と、
    前記韻律情報接続工程で接続された韻律情報に基づいて
    音声合成の波形を生成する音声合成波形生成工程とを含
    み、前記一致読み検索工程において、前記区切られた読
    みと一致する読みが前記個別韻律辞書で検索されたとき
    には、前記音声合成波形生成工程において、前記第2の
    韻律情報生成工程で生成された韻律情報に基づいて音声
    合成の波形を生成させることを特徴とする音声合成方
    法。
  3. 【請求項3】 前記個別韻律辞書が、基本周波数パタ
    ン、振幅パタンおよび継続時間長パタンの何れかのパタ
    ンを1つ以上含むことを特徴とする請求項2に記載の音
    声合成方法。
  4. 【請求項4】 前記個別韻律辞書が、予め設定された単
    語、句、節および文章の読みの韻律パタンを含むことを
    特徴とする請求項2に記載の音声合成方法。
  5. 【請求項5】 テキストを入力するテキスト入力工程
    と、前記テキストの読みを生成するテキスト読み生成工
    程と、前記テキスト読み生成工程で生成された読みに韻
    律記号を付加する韻律記号付加工程と、前記韻律記号付
    加工程で韻律記号が付加された読みを予め設定された規
    則で区切る読み区切り工程と、予め設定された韻律パタ
    ンを韻律辞書に格納する韻律辞書格納工程と、前記韻律
    辞書から韻律パタンを読み出す韻律辞書読出工程と、自
    然音声から韻律パタンを生成する自然音声韻律パタン生
    成工程と、前記韻律辞書読出工程において読み出された
    韻律パタンと前記自然音声から生成された韻律パタンと
    の差分を韻律パタン差分辞書に格納する韻律パタン差分
    辞書格納工程と、前記韻律パタン差分辞書から韻律パタ
    ン差分を読み出す韻律パタン差分辞書読出工程と、前記
    読み区切り工程で区切られた読みと一致する読みを前記
    韻律パタン差分辞書内で検索する一致読み検索工程と、
    前記区切られた読みおよび前記韻律辞書読出工程で韻律
    辞書から読み出された韻律パタンに基づいて前記区切り
    毎に韻律情報を生成する第1の韻律情報生成工程と、前
    記韻律パタンに前記韻律パタン差分辞書読出工程におい
    て読み出された韻律パタン差分を前記区切り毎に加算す
    る韻律パタン加算工程と、前記加算された韻律パタンに
    基づいて前記区切り毎に韻律情報を生成する第2の韻律
    情報生成工程と、前記一致読み検索工程における検索結
    果に基づいて前記第1の韻律情報生成工程および前記第
    2の韻律情報生成工程の何れかを選択する韻律情報選択
    工程と、前記韻律情報接続工程で選択された何れかの韻
    律情報生成工程で生成された前記区切り毎の韻律情報を
    接続する韻律情報接続工程と、前記韻律情報接続工程で
    接続された韻律情報に基づいて音声合成の波形を生成す
    る音声合成波形生成工程とを含み、前記一致読み検索工
    程において、前記区切られた読みと一致する読みが前記
    個別韻律辞書で検索されたときには、前記音声合成波形
    生成工程において、前記第2の韻律情報生成工程で生成
    された韻律情報に基づいて音声合成の波形を生成させる
    ことを特徴とする音声合成方法。
  6. 【請求項6】 テキストを入力するテキスト入力手段
    と、前記テキストの読みを生成するテキスト読み生成手
    段と、前記テキスト読み生成手段で生成された読みに韻
    律記号を付加する韻律記号付加手段と、前記韻律記号付
    加手段で韻律記号が付加された読みを予め設定された規
    則で区切る読み区切り手段と、予め設定された読みの韻
    律パタンを複数の韻律辞書に格納する韻律辞書格納手段
    と、前記複数の韻律辞書から韻律パタンを読み出す韻律
    辞書読出手段と、前記読み区切り手段で区切られた読み
    と一致する読みを前記複数の韻律辞書内で検索する一致
    読み検索手段と、前記区切られた読みおよび前記韻律辞
    書読出手段で読み出された韻律辞書の韻律パタンに基づ
    いて前記区切り毎に韻律情報を生成する韻律情報生成手
    段と、前記韻律情報生成手段で生成された前記区切り毎
    の韻律情報を接続する韻律情報接続手段と、前記韻律情
    報接続手段で接続された韻律情報に基づいて音声合成の
    波形を生成する音声合成波形生成手段とを備え、前記音
    声合成波形生成手段が、前記複数の韻律辞書で検索され
    た韻律パタンに基づいて音声合成の波形を生成するよう
    にしたことを特徴とする音声合成装置。
  7. 【請求項7】 テキストを入力するテキスト入力手段
    と、前記テキストの読みを生成するテキスト読み生成手
    段と、前記テキスト読み生成手段で生成された読みに韻
    律記号を付加する韻律記号付加手段と、前記韻律記号付
    加手段で韻律記号が付加された読みを予め設定された規
    則で区切る読み区切り手段と、予め設定された韻律パタ
    ンを韻律辞書に格納する韻律辞書格納手段と、前記韻律
    辞書から韻律パタンを読み出す韻律辞書読出手段と、予
    め設定された読みの韻律パタンを個別韻律辞書に格納す
    る個別韻律辞書格納手段と、前記個別韻律辞書から韻律
    パタンを読み出す個別韻律辞書読出手段と、前記読み区
    切り手段で区切られた読みと一致する読みを前記個別韻
    律辞書内で検索する一致読み検索手段と、前記区切られ
    た読みおよび前記韻律辞書読出手段で読み出された韻律
    辞書の韻律パタンに基づいて前記区切り毎に韻律情報を
    生成する第1の韻律情報生成手段と、前記区切られた読
    みおよび前記個別韻律辞書読出手段で読み出された個別
    韻律辞書の韻律パタンに基づいて前記区切り毎に韻律情
    報を生成する第2の韻律情報生成手段と、前記一致読み
    検索手段の検索結果に基づいて前記第1の韻律情報生成
    手段および前記第2の韻律情報生成手段の何れかを選択
    する韻律情報選択手段と、前記韻律情報選択手段で選択
    された何れかの韻律情報生成手段で生成された前記区切
    り毎の韻律情報を接続する韻律情報接続手段と、前記韻
    律情報接続手段で接続された韻律情報に基づいて音声合
    成の波形を生成する音声合成波形生成手段とを備え、前
    記一致読み検索手段が、前記区切られた読みと一致する
    読みを前記個別韻律辞書で検索したときには、前記音声
    合成波形生成手段が、前記第2の韻律情報生成手段で生
    成された韻律情報に基づいて音声合成の波形を生成する
    ようにしたことを特徴とする音声合成装置。
  8. 【請求項8】 テキストを入力するテキスト入力手段
    と、前記テキストの読みを生成するテキスト読み生成手
    段と、前記テキスト読み生成手段で生成された読みに韻
    律記号を付加する韻律記号付加手段と、前記韻律記号付
    加手段で韻律記号が付加された読みを予め設定された規
    則で区切る読み区切り手段と、予め設定された韻律パタ
    ンを韻律辞書に格納する韻律辞書格納手段と、前記韻律
    辞書から韻律パタンを読み出す韻律辞書読出手段と、自
    然音声から韻律パタンを生成する自然音声韻律パタン生
    成手段と、前記韻律辞書読出手段が読み出した韻律パタ
    ンと前記自然音声から生成された韻律パタンとの差分を
    韻律パタン差分辞書に格納する韻律パタン差分辞書格納
    手段と、前記韻律パタン差分辞書から韻律パタン差分を
    読み出す韻律パタン差分辞書読出手段と、前記読み区切
    り手段で区切られた読みと一致する読みを前記韻律パタ
    ン差分辞書内で検索する一致読み検索手段と、前記区切
    られた読みおよび前記韻律辞書読出手段で韻律辞書から
    読み出された韻律パタンに基づいて前記区切り毎に韻律
    情報を生成する第1の韻律情報生成手段と、前記韻律パ
    タンに前記韻律パタン差分辞書読出手段が読み出した韻
    律パタン差分を前記区切り毎に加算する韻律パタン加算
    手段と、前記加算された韻律パタンに基づいて前記区切
    り毎に韻律情報を生成する第2の韻律情報生成手段と、
    前記一致読み検索手段の検索結果に基づいて前記第1の
    韻律情報生成手段および前記第2の韻律情報生成手段の
    何れかを選択する韻律情報選択手段と、前記韻律情報選
    択手段で選択された何れかの韻律情報生成手段で生成さ
    れた前記区切り毎の韻律情報を接続する韻律情報接続手
    段と、前記韻律情報接続手段で接続された韻律情報に基
    づいて音声合成の波形を生成する音声合成波形生成手段
    とを備え、前記一致読み検索手段が、前記区切られた読
    みと一致する読みを前記個別韻律辞書で検索したときに
    は、前記音声合成波形生成手段が、前記第2の韻律情報
    生成手段で生成された韻律情報に基づいて音声合成の波
    形を生成するようにしたことを特徴とする音声合成装
    置。
JP2002112202A 2002-04-15 2002-04-15 音声合成方法および音声合成装置 Pending JP2003308084A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002112202A JP2003308084A (ja) 2002-04-15 2002-04-15 音声合成方法および音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002112202A JP2003308084A (ja) 2002-04-15 2002-04-15 音声合成方法および音声合成装置

Publications (1)

Publication Number Publication Date
JP2003308084A true JP2003308084A (ja) 2003-10-31

Family

ID=29394778

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002112202A Pending JP2003308084A (ja) 2002-04-15 2002-04-15 音声合成方法および音声合成装置

Country Status (1)

Country Link
JP (1) JP2003308084A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008046636A (ja) * 2006-08-14 2008-02-28 Pentax Corp アクセント句マッチング事前選択を用いた日本語音声合成方法及びシステム
JP2009048008A (ja) * 2007-08-21 2009-03-05 Fujitsu Ltd 音声合成装置、音声合成方法及びコンピュータプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008046636A (ja) * 2006-08-14 2008-02-28 Pentax Corp アクセント句マッチング事前選択を用いた日本語音声合成方法及びシステム
JP2009048008A (ja) * 2007-08-21 2009-03-05 Fujitsu Ltd 音声合成装置、音声合成方法及びコンピュータプログラム

Similar Documents

Publication Publication Date Title
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
US7454343B2 (en) Speech synthesizer, speech synthesizing method, and program
JP3587048B2 (ja) 韻律制御方法及び音声合成装置
JPH10116089A (ja) 音声合成用の基本周波数テンプレートを収容する韻律データベース
US7069216B2 (en) Corpus-based prosody translation system
JP5198046B2 (ja) 音声処理装置及びそのプログラム
JPH1039895A (ja) 音声合成方法および装置
JPWO2016103652A1 (ja) 音声処理装置、音声処理方法、およびプログラム
KR0146549B1 (ko) 한국어 텍스트/음성 변환 방법
JP4829605B2 (ja) 音声合成装置および音声合成プログラム
Chen et al. A Mandarin Text-to-Speech System
JP2003308084A (ja) 音声合成方法および音声合成装置
JPH037995A (ja) 歌音声合成データの作成装置
JPH06318094A (ja) 音声規則合成装置
JPH0962286A (ja) 音声合成装置および音声合成方法
JPH11338498A (ja) 音声合成装置
Narupiyakul et al. A stochastic knowledge-based Thai text-to-speech system
JP2000056788A (ja) 音声合成装置の韻律制御方法
JP2003005776A (ja) 音声合成装置
JP3437472B2 (ja) 音声合成方法とその装置
Kaur et al. BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE
Khalifa et al. SMaTalk: Standard malay text to speech talk system
JPS62119591A (ja) 文章読上げ装置
JPH06167989A (ja) 音声合成装置