JP2002297172A - 音声合成方法、および音声合成装置 - Google Patents

音声合成方法、および音声合成装置

Info

Publication number
JP2002297172A
JP2002297172A JP2001102449A JP2001102449A JP2002297172A JP 2002297172 A JP2002297172 A JP 2002297172A JP 2001102449 A JP2001102449 A JP 2001102449A JP 2001102449 A JP2001102449 A JP 2001102449A JP 2002297172 A JP2002297172 A JP 2002297172A
Authority
JP
Japan
Prior art keywords
vowel
speech
vowels
text information
unvoiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001102449A
Other languages
English (en)
Inventor
Makoto Hashimoto
誠 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2001102449A priority Critical patent/JP2002297172A/ja
Publication of JP2002297172A publication Critical patent/JP2002297172A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 通常文章は母音無声化を行い、人名や地名な
どの固有名詞の部分は母音の無声化を行わずに一音一音
明確に発音させるようにした方が、情報伝達の観点から
見れば効果的である場合には、母音を無声化するか非無
声化するかについて固定的に設定することが好ましくな
いない場合がある。 【解決手段】 テキスト情報を解析するテキスト情報解
析処理と、あらかじめ音声素片を記憶した音声データベ
ースから前記テキスト情報解析処理の結果に基づいて適
切な音声素片を取り出して接続することにより合成音声
を生成する音声合成方法において、特定箇所の母音の無
声化と非無声化との切り替えを行う母音無声化設定処理
を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力されたテキス
トに対する音声素片を接続することによって、合成音声
を生成する音声合成方法、および音声合成装置に関す
る。特に、無声化する可能性のある母音を合成して発生
するときに、この母音を無性化して発生するか否かの選
択を入力テキストの特定箇所に対して設定することので
きる音声合成方法に関する。
【0002】
【従来の技術】従来から、入力されたテキストに対する
音声素片を接続することによって、合成音声を生成する
音声合成方法、および音声合成装置が提案され、実現さ
れている。
【0003】日本語においては、特に共通語において
は、自然に発声したときに、母音を声帯を振動させず息
だけで発音する現象がみられ、これを母音の無声化とい
う。このような母音の無声化には、以下のような一般的
な法則がある。このような法則については、例えば「N
HK編、日本語発音アクセント辞典」などに記述されて
いる。
【0004】(法則1)「キ、ク、シ、ス、チ、ツ、
ヒ、フ、ピ、プ、シュ」などのモーラが「カ、サ、タ、
ハ、パ」などの各行のモーラの直前にきたとき例えば、
「確かめる=タシカメル」の「シ」の母音が無性化す
る。
【0005】(法則2)「キ、ク、シ、ス、チ、ツ、
ピ、プ、シュ」などのモーラが、息の切れ目の直前にき
て、そのモーラのアクセントが低いとき、例えば、「有
ります=アリマス」の「ス」の母音が無性化する。この
ようなテキストを音声に変換するテキスト音声変換にお
いては、母音の無声化現象を考慮することが合成音声を
聞きやすくする上で重要となる。そこで、従来は母音の
無声化規則を導入して、入力テキストの解析結果に対し
て、その規則に一致した母音を無声化させる処理を施し
ていた。また、無声化/非無声化の切り替え手段を設
け、無声化対象となる母音をすべて無声化させるか、あ
るいはすべて無声化させないかの選択を行っていた。
【0006】
【発明が解決しようとする課題】しかしながら、テキス
トから合成音声を生成するテキスト音声変換において、
前述のような母音の無声化処理を用いる場合、文中に、
通常発声のように母音を無声化させたい単語と例えば固
有名詞などの一音一音明確に発音させたい単語が存在し
た場合がある。このような場合には、単語毎に、上述の
ような切り替え手段により、無声化/非無声化を切り替
える必要があるが、無音化の可能性のある母音毎にこの
切り替え処理を行うのは、煩雑な作業を招く不都合がっ
た。また、通常文章は母音無声化を行い、人名や地名な
どの固有名詞の部分は母音の無声化を行わずに一音一音
明確に発音させるようにした方が、情報伝達の観点から
見れば効果的である場合もあり、一概に、無声化/非無
声化の何れかに設定しておくことが好ましいとは云えな
いのである。
【0007】
【課題を解決するための手段】本発明の音声合成方法
は、テキスト情報を解析するテキスト情報解析処理と、
あらかじめ音声素片を記憶した音声データベースから前
記テキスト情報解析処理の結果に基づいて適切な音声素
片を取り出して接続することにより合成音声を生成する
音声合成方法において、特定箇所の母音の無声化/非無
声化の切り替えを行う母音無声化設定処理を行うもので
ある。
【0008】また、前記特定箇所は、前記テキスト情報
中に挿入された母音無声化指定記号または母音非無声化
指定記号により特定される。
【0009】さらに、前記特定箇所は、音素列、位置情
報、無声化する可能性のある母音が含まれる部分の言語
情報、無声化する可能性のある母音が含まれる文の位
置、無声化する可能性のある母音が含まれる文節の位
置、無声化する可能性のある母音が含まれる単語の位
置、無声化する可能性のある母音が含まれるモーラの位
置、無声化する可能性のある母音が含まれる音節の位
置、無声化する可能性のある母音が含まれるポーズで挟
まれた区間の位置、無声化する可能性のある母音が含ま
れるアクセント句の位置、或いは無声化する可能性のあ
る母音が含まれる呼気段落の位置である。
【0010】本発明の音声合成装置は、テキスト情報を
解析するテキスト情報解析手段と、あらかじめ音声素片
を記憶しておく音声データベースと、前記テキスト情報
解析手段の結果に基づいて前記音声データベースから適
切な音声素片を取り出して接続することにより合成音声
を生成する音声合成手段とを備えた音声合成装置におい
て、特定箇所の母音の無声化と非無声化の切り替えを行
う母音無声化設定手段を設けたものである。
【0011】
【発明の実施の形態】図1に本発明の音声合成装置の構
成を示す。
【0012】同図の音声合成装置は、漢字かな混じり文
章の入力に対応する音声合成処理を行うものであり、本
発明の特徴とする母音の無声化と非無声化との切り替え
処理のための構成を備えている。
【0013】同図の音声合成装置において、テキスト解
析部1は、テキスト情報1aの入力を受け、そのテキスト
情報1aの解析を行う。母音無声化設定部2は、あらか
じめ特定箇所に対する母音無声化/非無声化の規則の設
定が行われる。母音無声化処理部3は、テキスト解析部
1によって解析された結果に対して、母音無声化設定部
2に設定されている規則に従って、無声化させる母音を
決定する。音素・韻律決定部4は、母音無声化処理部3
で決定された無声化母音の音素記号を無声化母音の音素
記号に変換して入力テキストの音素記号列を整形し、テ
キスト解析部1で決定されたアクセントやポーズなどの
情報に基づいた韻律情報、例えば、基本周波数、パワ
ー、音素継続時間長を定める。音声データベース5は、
音素記号に対応する音声信号が全ての音素記号(以下、
音声素片と称する)とに対して格納されている。音声合
成部6は、音素・韻律決定部4から得られる音素記号列
に合致するように、音声データベース5から適切な音声
素片を選択し接続すると共に、音素・韻律決定部4から
上記音素記号列と共に得られる韻律情報に基づいて、接
続された音声素片からなる一まとまりの音声に韻律が付
与され、合成音声が生成され、出力される。次に、母音
の無声化規則を設定し、かつ、特定箇所のみ非無声化の
設定を行った場合の動作例を、図2のフローチャートを
用いて説明する。まず、ステップ10により、テキスト
が入力されたことを検知すると、ステップ11のテキス
ト解析に移る。ステップ11では、漢字の読み付与、ア
クセント決定、ポーズ情報決定、音素記号列生成などが
行われる。漢字かな混じり文を入力とする場合、テキス
ト解析ステップでは、通常、見出しや読み、品詞などの
言語的情報を記述した言語辞書を参照する。ステップ1
2にて、ステップ11の出力における母音無声化の可能
性のある部分があるか否かを検索する。母音無声化対象
が存在する場合はステップ13に進み、特定箇所の母音
非無声化規則が設定されているか否かを判定する。ここ
で、設定されていればステップ15に進む。設定がなけ
ればステップ14に進み、通常の母音無声化処理(対象
母音音素記号を無声化母音の音素記号へ変換する処理)
を行ってステップ17に進む。一方、ステップ15にお
いて、抽出された母音無声化対象箇所と、特定箇所の母
音非無声化規則を比較し、規則に該当する対象箇所が存
在するか否かをチェックする。存在する場合はステップ
16に進み、該当箇所以外の母音を無声化母音の音素記
号に変換する。存在しなかった場合は、すべての母音無
声化対象箇所の母音を無声化母音の音素記号に変換す
る。ステップ17では、母音無声化処理に対応した入力
テキストの音素記号列の更新による音素情報の決定と、
ステップ11の結果に基づいた韻律情報(特に、基本周
波数、音素継続時間長、パワー)の決定を行う。ステッ
プ18では、音声データベース5から、音素情報と韻律
情報に基づいて、最適な音声素片を選択し、ステップ1
9にて各音声素片の接続と韻律情報に基づいた韻律制御
を行い、ステップ20で合成音声を生成する。これによ
り、特定箇所に対する母音の無声化あるいは非無声化の
設定を行うことが可能となり、単語などによって母音の
無声化/非無声化を切り替えたい場合が生じても柔軟に
対応できるため、所望の合成音声を生成することができ
る。次に、事例を挙げて動作説明をする。入力されたテ
キストが「国際会議の担当は山下です。」の場合、前述
した母音無声化の法則1と2が設定され、特定箇所の母
音非無声化規則として「固有名詞は無声化させない」を
設定した場合について以下に説明する。まず、テキスト
解析部1によって漢字の読みやアクセントなどの情報が
決定され、「こ↑くさいか↓いぎのた↑んとーわ↓△や
↑ま↓したです」といった中間情報が生成される。この
情報において、「↑」は音高が上がるアクセントを示
し、「↓」は音高が下がるアクセントを示し、「△」は
息継ぎなどの短いポーズを示している。さらに、この情
報において、“「やました」が人名である固有名詞”を
示す品詞情報、以下のような音素記号列が決定される。
【0014】「kokusaikaiginotaNtoowa△yamashita de
su」この音素記号列は、理解を助けるために英文字で記
述され、英大文字が無音化された母音の音素を示してい
る。次に、(法則1)と(法則2)から、「こくさい」
の「く」、「やました」の「し」、「です」の「す」の
3箇所が母音無声化対象として抽出される。母音無声化
処理部3は、母音無声化設定部2により設定された特定
箇所の母音非無声化規則(この場合の規則の内容は「固
有名詞は無声化させない」)とテキスト解析部1での解
析結果の内の母音無声化対象(「く」、「し」、「す」
の各母音)とを比較することにより、この場合、固有名
詞である「やました」の「し」のみが設定内容に合致す
ると判定される。従って、テキスト解析で生成された音
素記号列は以下のとおりに変換される。 「kokUsaikaiginotaNtoowa△yamashita desU」この音素
情報と、テキスト解析部1で得られた中間情報・品詞情
報に基づいた各音素、あるいは短時間毎の韻律情報(主
に、基本周波数、パワー、音素継続時間長)が決められ
たあと、音素情報と韻律情報に基づいて、音声データベ
ース2からの最適音声素片の選択と音声素片の接続・韻
律制御処理等が行われ、所望の合成音声が生成される。
なお、本実施例では、音素情報に変換した後に母音無声
化/非無声化の切り替え処理を行っているが、音素情報
に変換する前に行って、無声化母音に対する記号を付与
するようにすることもできるのはいうまでもない。な
お、以上の実施例においては、母音無声化設定部2にお
いて、母音無声化設定処理により、無声化と非無声化の
切り替えを行う対象箇所としては、音素列、位置情報な
どに基づいて、たとえば以下の位置に定められる。 (1)無声化する可能性のある母音が含まれる部分の言
語情報、(2)無声化する可能性のある母音が含まれる
文の位置、(3)無声化する可能性のある母音が含まれ
る文節の位置、(4)無声化する可能性のある母音が含
まれる単語の位置、(4)無声化する可能性のある母音
が含まれるモーラの位置、(4)無声化する可能性のあ
る母音が含まれる音節の位置、(5)無声化する可能性
のある母音が含まれるポーズで挟まれた区間の位置、
(6)無声化する可能性のある母音が含まれるアクセン
ト句の位置、(7)無声化する可能性のある母音が含ま
れる呼気段落の位置
【0015】
【発明の効果】以上の説明から明らかなように、本発明
によれば、音声合成処理の際の柔軟な母音の無声化と非
無声化との処理が可能となり、入力テキスト中に、通常
の母音無声化処理で発音させたい部分と、一音一音明確
に発音させたい部分が混在するような場合でも、所望の
合成音声を生成することができる効果を奏する。
【図面の簡単な説明】
【図1】本発明の音声合成装置の構成を示すブロック図
である。
【図2】本発明の音声合成方法のフローチャートを示す
図である。
【符号の説明】
1a…テキスト 1 …テキスト解析部 2 …母音無声化設定部 3 …母音無声化処理部 4 …音素・韻律決定部 5 …音声データベース 6 …音声合成部 6a …合成音声

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 テキスト情報を解析するテキスト情報解
    析処理と、あらかじめ音声素片を記憶した音声データベ
    ースから前記テキスト情報解析処理の結果に基づいて適
    切な音声素片を取り出して接続することにより合成音声
    を生成する音声合成方法において、特定箇所の母音の無
    声化と非無声化との切り替えを行う母音無声化設定処理
    を行うことを特徴とする音声合成方法。
  2. 【請求項2】 前記特定箇所は、前記テキスト情報中に
    挿入された母音無声化指定記号または母音非無声化指定
    記号により特定されることを特徴とする請求項1の音声
    合成方法。
  3. 【請求項3】 前記特定箇所は、音素列、位置情報、無
    声化する可能性のある母音が含まれる部分の言語情報、
    無声化する可能性のある母音が含まれる文の位置、無声
    化する可能性のある母音が含まれる文節の位置、無声化
    する可能性のある母音が含まれる単語の位置、無声化す
    る可能性のある母音が含まれるモーラの位置、無声化す
    る可能性のある母音が含まれる音節の位置、無声化する
    可能性のある母音が含まれるポーズで挟まれた区間の位
    置、無声化する可能性のある母音が含まれるアクセント
    句の位置、或いは無声化する可能性のある母音が含まれ
    る呼気段落の位置であることを特徴とする請求項1に記
    載の音声合成方法。
  4. 【請求項4】 テキスト情報を解析するテキスト情報解
    析手段と、あらかじめ音声素片を記憶しておく音声デー
    タベースと、前記テキスト情報解析手段の結果に基づい
    て前記音声データベースから適切な音声素片を取り出し
    て接続することにより合成音声を生成する音声合成手段
    とを備えた音声合成装置において、特定箇所の母音の無
    声化と非無声化の切り替えを行う母音無声化設定手段を
    設けることを特徴とする音声合成装置。
JP2001102449A 2001-03-30 2001-03-30 音声合成方法、および音声合成装置 Pending JP2002297172A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001102449A JP2002297172A (ja) 2001-03-30 2001-03-30 音声合成方法、および音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001102449A JP2002297172A (ja) 2001-03-30 2001-03-30 音声合成方法、および音声合成装置

Publications (1)

Publication Number Publication Date
JP2002297172A true JP2002297172A (ja) 2002-10-11

Family

ID=18955645

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001102449A Pending JP2002297172A (ja) 2001-03-30 2001-03-30 音声合成方法、および音声合成装置

Country Status (1)

Country Link
JP (1) JP2002297172A (ja)

Similar Documents

Publication Publication Date Title
US5758320A (en) Method and apparatus for text-to-voice audio output with accent control and improved phrase control
JPH1039895A (ja) 音声合成方法および装置
JP5198046B2 (ja) 音声処理装置及びそのプログラム
JP4704254B2 (ja) 読み修正装置
JPH05165486A (ja) テキスト音声変換装置
Badino et al. Language independent phoneme mapping for foreign TTS
Stöber et al. Speech synthesis using multilevel selection and concatenation of units from large speech corpora
Lobanov et al. Language-and speaker specific implementation of intonation contours in multilingual TTS synthesis
JPH08335096A (ja) テキスト音声合成装置
van Rijnsoever A multilingual text-to-speech system
JP2002297172A (ja) 音声合成方法、および音声合成装置
Kaur et al. BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE
JP2703253B2 (ja) 音声合成装置
JP3034554B2 (ja) 日本語文章読上げ装置及び方法
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JPH0229797A (ja) テキスト音声変換装置
JPH0634175B2 (ja) 文章読上げ装置
JP2938466B2 (ja) テキスト音声合成システム
Leonardo et al. A general approach to TTS reading of mixed-language texts
JP2001343987A (ja) 音声合成方法、および音声合成装置
JPH08160983A (ja) 音声合成装置
Evans et al. An approach to producing new languages for talking applications for use by blind people
IMRAN ADMAS UNIVERSITY SCHOOL OF POST GRADUATE STUDIES DEPARTMENT OF COMPUTER SCIENCE
JP2888847B2 (ja) 文章読み上げ装置とその方法及び言語処理装置とその方法
JPH06168265A (ja) 言語処理装置および音声合成装置