JPH1115495A

JPH1115495A - 音声合成装置

Info

Publication number: JPH1115495A
Application number: JP9181768A
Authority: JP
Inventors: Shuji Kubota; 修司久保田
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1997-06-23
Filing date: 1997-06-23
Publication date: 1999-01-22
Anticipated expiration: 2017-06-23
Also published as: JP3578598B2

Abstract

(57)【要約】【課題】少ない処理量で、騒音下での合成音声の聞き
取り易さを著しく向上させることの可能な音声合成装置
を提供する。【解決手段】規則音声合成部４は、音素データ蓄積部
３から取り出される音素データが子音音素データである
とき、該子音に対し、騒音解析手段６によって算出され
た周囲騒音のパワーレベルに応じたパワー制御を行なっ
て発音信号に変換し、また、規則音声合成部４は、騒音
解析手段６によって算出された周囲騒音のパワーレベル
が閾値αを越えるときには母音の無音化処理がなされな
いように、母音無声化に対する制御を行なう。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、文字情報もしくは
発音記号列等のテキスト情報を音声に変換して出力する
音声合成装置に関する。

【０００２】

【従来の技術】近年、騒音下で合成音声を聞き取りやす
くするための種々の技術が提案されている。

【０００３】例えば、特開昭６１−１４５６３３号や特
開平２−２３８４９４号には、周囲騒音のパワーレベル
に応じて合成音声の振幅を変化させる技術が示されてい
る。

【０００４】また、例えば特開平２−２９３９００号に
は、周囲騒音のパワーレベルに応じて、ピッチ周波数を
変化させる技術が示されている。

【０００５】また、特開平２−２９３９００号には、騒
音を周波数解析し、その周波数特性に適したフィルタを
算出して、騒音に対してそのフィルタによりフィルタ処
理を行なって音声合成出力する技術が示されている。

【０００６】

【発明が解決しようとする課題】しかしながら、特開昭
６１−１４５６３３号や特開平２−２３８４９４号の技
術は、単に周囲騒音のレベルに従って合成音声の出力パ
ワーレベルを上げているだけである。

【０００７】また、特開平２−２９３９００号の技術で
は騒音レベルに応じて、ピッチを一定間隔で高域に上げ
ていくというもので、ピッチ周波数は高い周波数の方向
にしか移動しない。また、騒音周波数の分析を行なって
いないので、ピッチ周波数を移動させることで、騒音に
含まれる周波数成分と同調し、逆にマスキング効果(２
つ以上の音が同時に存在するとき、一方が他方の存在に
より聞こえなくなる現象)によって聞き取りにくくなる
可能性がある。

【０００８】また、特開平２−２９３９００号の技術で
は、騒音の周波数特性を利用して、その特性をもつフィ
ルタに合成音声を通すことでＳ／Ｎ比を上げようとして
いるが、基本的に、上述したようなマスキング効果を取
り去るものではない。また、フィルタ設計やフィルタ処
理を必要とするので、システム規模が大きくなってしま
うという問題もある。

【０００９】このように、騒音下で合成音声を聞き取り
易くするための種々の技術が提案されているものの、従
来では、騒音レベルに応じて合成音声の出力レベルを全
体的に大きくするように制御するだけで、騒音下で特に
聞き取りにくくなる子音や母音の無声化に着目して制御
するような処理は行なっていない。また、従来では、騒
音に含まれる周波数成分が合成音のピッチ周波数やフォ
ルマント周波数と重なっているかを判断していないた
め、マスキング効果を回避するようにはなっていない。
すなわち、従来の技術では、騒音下での合成音声の聞き
取り易さを著しく向上させるには限界があった。

【００１０】本発明は、少ない処理量で、騒音下での合
成音声の聞き取り易さを著しく向上させることの可能な
音声合成装置を提供することを目的としている。

【００１１】

【課題を解決するための手段】上記目的を達成するため
に、請求項１記載の発明は、テキスト情報を入力するテ
キスト入力部と、入力されたテキストに対して形態素解
析処理並びに音韻・韻律付与処理を行なって発音記号を
生成するテキスト解析部と、音素データが蓄積されてい
る音素データ蓄積部と、テキスト解析部で生成された発
音記号に従い、音素データ蓄積部から音素データを引き
出し、ピッチ間隔に音素データを重畳することで発音信
号に変換する規則音声合成部と、変換した発音信号を音
声として出力する音声出力部と、周囲騒音を取り込んで
解析し、周囲騒音のパワーレベルを算出する騒音解析手
段とを有し、規則音声合成部は、音素データ蓄積部から
取り出される音素データが子音音素データであるとき、
該子音に対し、騒音解析手段によって算出された周囲騒
音のパワーレベルに応じたパワー制御を行なって発音信
号に変換するようになっていることを特徴としている。

【００１２】また、請求項２記載の発明は、テキスト情
報を入力するテキスト入力部と、入力されたテキストに
対して形態素解析処理並びに音韻・韻律付与処理を行な
って発音記号を生成するテキスト解析部と、音素データ
が蓄積されている音素データ蓄積部と、テキスト解析部
で生成された発音記号に従い、音素データ蓄積部から音
素データを引き出し、ピッチ間隔に音素データを重畳す
ることで発音信号に変換する規則音声合成部と、変換し
た発音信号を音声として出力する音声出力部と、周囲騒
音を取り込んで解析し、周囲騒音のパワーレベルを算出
する騒音解析手段とを有し、規則音声合成部は、騒音解
析手段によって算出された周囲騒音のパワーレベルが閾
値αを越えるときには母音の無音化処理がなされないよ
うに、母音無声化に対する制御を行なうようになってい
ることを特徴としている。

【００１３】また、請求項３記載の発明は、テキスト情
報を入力するテキスト入力部と、入力されたテキストに
対して形態素解析処理並びに音韻・韻律付与処理を行な
って発音記号を生成するテキスト解析部と、音素データ
が蓄積されている音素データ蓄積部と、テキスト解析部
で生成された発音記号に従い、音素データ蓄積部から音
素データを引き出し、ピッチ間隔に音素データを重畳す
ることで発音信号に変換する規則音声合成部と、変換し
た発音信号を音声として出力する音声出力部と、周囲騒
音を取り込んで解析し、周囲騒音のパワーレベルを算出
するとともに、周囲騒音の周波数分布を算出する騒音解
析手段とを有し、規則音声合成部は、騒音解析手段によ
って周囲騒音のパワーレベルと周囲騒音の周波数分布が
算出されるとき、ピッチ周波数と周波数が重なる騒音が
存在しその周波数での騒音パワーレベルが閾値βを越え
る場合には、ピッチ周波数を移動させる制御を行なうよ
うになっていることを特徴としている。

【００１４】また、請求項４記載の発明は、テキスト情
報を入力するテキスト入力部と、入力されたテキストに
対して形態素解析処理並びに音韻・韻律付与処理を行な
って発音記号を生成するテキスト解析部と、音素データ
が蓄積されている音素データ蓄積部と、テキスト解析部
で生成された発音記号に従い、音素データ蓄積部から音
素データを引き出し、ピッチ間隔に音素データを重畳す
ることで発音信号に変換する規則音声合成部と、変換し
た発音信号を音声として出力する音声出力部と、周囲騒
音を取り込んで解析し、周囲騒音のパワーレベルを算出
するとともに、周囲騒音の周波数分布を算出する騒音解
析手段とを有し、規則音声合成部は、騒音解析手段によ
って周囲騒音のパワーレベルと周囲騒音の周波数分布が
算出されるとき、フォルマント周波数と周波数が重なる
騒音が存在しその周波数での騒音パワーレベルが閾値γ
を越える場合には、音声出力サンプリング周波数を移動
させる制御を行なうようになっていることを特徴として
いる。

【００１５】

【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。図１は本発明に係る音声合成装置の
構成例を示す図である。図１を参照すると、この音声合
成装置は、文字情報もしくは発音記号列等のテキスト情
報を入力するテキスト入力部１と、入力されたテキスト
に対して形態素解析処理並びに音韻・韻律付与処理を行
なって発音記号を生成するテキスト解析部２と、音素デ
ータが蓄積されている音素データ蓄積部(音素データベ
ース)３と、テキスト解析部２で生成された発音記号を
音素データ蓄積部(音素データベース)３に蓄積されてい
る音素データに基づいて発音信号に変換する規則音声合
成部４と、変換した発音信号を音声として出力する音声
出力部５と、周囲騒音(雑音)を取り込んで解析する騒音
解析手段６とを有している。

【００１６】ここで、テキスト解析部２は、形態素解析
処理部１１と、音韻・韻律付与処理部１２とを備え、形
態素解析処理部１１は、例えば標準単語辞書１４を参照
して(辞書引きして)形態素解析処理を行なうようになっ
ている。

【００１７】また、規則音声合成部４は、テキスト解析
部２で生成された発音記号に従い、音素データ蓄積部３
から音素データを引き出し、ピッチ間隔に音素データを
重畳することで、発音信号に変換するようになってい
る。

【００１８】また、騒音解析手段６は、周囲騒音を取り
込む周囲騒音取込部７と、周囲騒音取込部７で取り込ん
だ周囲騒音を解析する周囲騒音解析部８とを有してお
り、周囲騒音解析部８は、取り込んだ周囲騒音を解析し
て、騒音のパワー(パワーレベル)や騒音の周波数分布を
求めるようになっている。なお、周波数分布の解析に
は、ＦＦＴやフィルタバンクを用いることができる。

【００１９】そして、本発明の第１の実施形態において
は、規則音声合成部４は、音素データ蓄積部３から取り
出される音素データが子音音素データであるとき、該子
音に対し、騒音解析手段６によって算出された周囲騒音
のパワーレベルに応じたパワー制御を行なって発音信号
に変換するようになっている。

【００２０】また、本発明の第２の実施形態において
は、規則音声合成部４は、騒音解析手段６によって算出
された周囲騒音のパワーレベルが閾値αを越えるときに
は母音の無音化処理がなされないように、母音無声化に
対する制御を行なうようになっている。

【００２１】また、本発明の第３の実施形態において
は、規則音声合成部４は、周囲騒音解析手段６によって
周囲騒音のパワーレベルと周囲騒音の周波数分布が算出
されるとき、ピッチ周波数と周波数が重なる騒音が存在
しその周波数での騒音パワーレベルが閾値βを越えた場
合には、ピッチ周波数を前後に移動させる制御を行なう
ようになっている。

【００２２】また、本発明の第４の実施形態において
は、規則音声合成部４は、騒音解析手段６によって周囲
騒音のパワーレベルと周囲騒音の周波数分布が算出され
るとき、フォルマント周波数と周波数が重なる騒音が存
在しその周波数での騒音パワーレベルが閾値γを越える
場合には、音声出力サンプリング周波数を前後に移動さ
せる制御を行なうようになっている。

【００２３】次に、このような構成の音声合成装置の処
理動作を説明する。通常、テキスト入力部１でテキスト
が入力されると、入力されたテキストは、テキスト解析
部２で形態素解析処理，音韻・韻律制御処理が行なわれ
て発音記号列に変換され、その後、テキスト解析部２か
ら出力された発音記号列は、規則音声合成部４に入力
し、規則音声合成部４において規則音声合成処理がなさ
れ、音声波形データに変換される。このようにして発音
記号列に基づき変換された音声波形データは音声出力部
５に入力し、音声出力部５から音声として出力される。

【００２４】より具体的に、テキスト解析部２では、形
態素解析処理時に単語辞書１４の辞書引きを行なってテ
キストを発音記号列に変換する。その後、規則音声合成
部４は、テキスト解析部２から出力された発音記号列に
従い、音素データベース３から音素データ(発音記号列
に対応した音素データ)を取り出し、取り出した各音素
データを時系列でピッチ間隔に重畳することで(波形重
畳方式で)、発音信号(音声波形データ)に変換する。こ
のようにして規則音声合成部４で変換された発音信号
(音声波形データ)は音声出力部５に入力し、音声出力部
５から音声として出力される。

【００２５】このような規則音声合成処理において、本
発明では、さらに、周囲騒音取込部７で周囲騒音を取り
込み、取り込んだ周囲騒音を周囲騒音解析部８で解析
し、騒音パワーレベル，周波数分布のパラメータを生成
する。

【００２６】この場合、本発明の第１の実施形態では、
規則音声合成部４は、周囲騒音解析部８で解析された騒
音パワーレベルに従って、破裂音や摩擦音など騒音下で
聞き取りにくくなる子音のパワーを制御する。すなわ
ち、テキスト解析部２から出力された発音記号列に従
い、音素データベース３から音素データを取り出して発
音信号に変換する際、取り出した音素データが子音音素
データである場合、規則音声合成部４は、この子音のパ
ワー(利得)を騒音パワーレベルに従って制御する。具体
的に、子音パワーの制御は、例えば騒音パワーレベルに
比例するように子音のパワー(利得)を決定し、音素デー
タベース３から取り出した子音音素波形に、決定した利
得を施した後(乗じた後)、波形重畳を行なうことによっ
てなされる。

【００２７】このように、周囲騒音解析部８で解析され
た騒音パワーレベルに従って子音のパワーを制御するこ
とで、騒音下で特に聞き取りにくくなる子音について
も、子音が騒音のパワーレベルに応じた大きなパワーで
発音出力されることで、騒音下でも子音を聞き易くな
る。

【００２８】また、本発明の第２の実施形態では、規則
音声合成部４は、騒音パワーレベルが閾値αを越えるか
を判断し、騒音パワーレベルが閾値αを越えた場合に
は、無声化音韻の無声化処理がなされないように制御す
る。すなわち、通常の日本語音声合成処理では、よりな
めらかに発声させるために自動的に無声化させる音韻
(“し”，“き”，“く”など)が存在するが、騒音パワ
ーレベルが所定の閾値αを越えたときには、無声化音韻
の無声化処理を強制的に禁止する処理を行なうことによ
り、騒音下でも母音がはっきりと発声され、より聞き取
りやすい合成音声になる。なお、上記閾値αは、例え
ば、母音を無声化したときに合成音声を聞き取りにくく
させる騒音パワーレベルに設定される。

【００２９】また、本発明の第３の実施形態では、規則
音声合成部４は、騒音の周波数分布のパラメータから、
ピッチ周波数と重なっている騒音が存在する場合、その
周波数での騒音パワーレベルが閾値βを越えているかを
判断し、越えているときには、ピッチ周波数が変更でき
る範囲内で、ピッチ周波数を前後に移動(シフト)させ
る。より具体的に、騒音パワーレベルが低い周波数帯に
ピッチ周波数を移動(シフト)させる。なお、上記閾値β
は、例えば、合成音声の出力レベルに従って、Ｓ／Ｎ比
から決定される。

【００３０】このように、第３の実施形態では、騒音の
周波数分布のパラメータから、ピッチ周波数と重なって
いる騒音が存在する場合、その周波数での騒音パワーレ
ベルが閾値βを越えているかを判断し、越えているとき
には、ピッチ周波数が変更できる範囲内で、ピッチ周波
数を前後に移動(シフト)させることにより、マスキング
効果が回避され、より聞き取りやすい合成音声になる。

【００３１】また、本発明の第４の実施形態では、規則
音声合成部４は、騒音の周波数分布のパラメータから、
フォルマント周波数と重なっている騒音が存在する場
合、その周波数での騒音パワーレベルが閾値γを越えて
いるかを判断し、越えているときは、音声出力サンプリ
ング周波数が変更できる範囲内で、音声出力サンプリン
グ周波数を前後に移動(シフト)させる。より具体的に、
騒音パワーレベルが低い周波数帯に音声出力サンプリン
グ周波数を前後に移動(シフト)させる。

【００３２】すなわち、波形重畳方式で規則音声合成を
行なう場合には、音素波形データを使用するので声道特
性が音素毎に固定になっているため、パラメータ方式の
音声合成方式と異なり、フォルマント周波数の位置を変
更することはできない。そのため、第４の実施形態で
は、サンプリング周波数を移動させる(変更する)こと
で、相対的にフォルマント周波数を前後に移動させる。

【００３３】この場合、フォルマント周波数は音素(母
音)毎にあらかじめ決定されているので、各音素データ
毎にフォルマント情報(周波数位置，利得)をパラメータ
として保持させておく。また、上記閾値γは、例えば、
合成音声の出力レベルとフォルマント情報に従って、Ｓ
／Ｎ比から決定される。

【００３４】このように、第４の実施形態では、騒音の
周波数分布のパラメータから、フォルマント周波数と重
なっている騒音が存在する場合、その周波数での騒音パ
ワーレベルが閾値γを越えているかを判断し、越えてい
るときは、音声出力サンプリング周波数が変更できる範
囲内で、音声出力サンプリング周波数を前後に移動(シ
フト)させることにより(より具体的に、騒音パワーレベ
ルが低い周波数帯に音声出力サンプリング周波数を前後
に移動(シフト)させることにより)、マスキング効果が
回避され、より聞き取りやすい合成音声になる。

【００３５】なお、上述の説明では、第１，第２，第
３，第４の実施形態をそれぞれ個別に説明したが、第
１，第２，第３，第４の実施形態を任意に組み合せて用
いることもできる。例えば、第１，第２，第３，第４の
全ての実施形態を組み合せて、規則音声合成部４内に、
子音のパワーを制御する機能，母音の無声化処理を行な
わないように制御する機能，ピッチ周波数を移動させる
(変更する)機能，音声出力サンプリング周波数を前後に
移動(変更する)機能を設けることもできる。

【００３６】また、上述の例では、規則音声合成部４内
に、子音のパワーを制御する機能，母音の無声化処理を
行なわないように制御する機能，ピッチ周波数を移動さ
せる(変更する)機能，音声出力サンプリング周波数を前
後に移動(変更する)機能を設けているが、これらを規則
音声合成部４の外部に設けることも可能である。すなわ
ち、例えば図２に示すように、子音のパワーを制御する
子音パワー制御部１５，母音の無声化処理を行なわない
ように制御する母音無声化判断処理部１６，ピッチ周波
数を移動させる(変更する)ピッチ変更部１７，音声出力
サンプリング周波数を前後に移動(変更する)サンプリン
グ変更部１８をそれぞれ設けることもできる。

【００３７】図３は図１あるいは図２の音声合成装置の
ハードウェア構成例を示す図である。図３を参照する
と、この音声合成装置は、例えばパーソナルコンピュー
タ等で実現され、全体を制御するＣＰＵ５１と、ＣＰＵ
５１の制御プログラム等が記憶されているＲＯＭ５２
と、ＣＰＵ５１のワークエリア等として使用されるＲＡ
Ｍ５３と、テキストを入力するテキスト入力部１と、音
声出力部(例えば、スピーカ)５と、周囲騒音を取り込む
周囲騒音取込部(例えば、マイク)７とを有している。

【００３８】ここで、ＲＡＭ５３には、単語辞書１４や
音素データベース３などを設定することができる。ま
た、ＣＰＵ５１は、テキスト解析部２，規則音声合成部
４，周囲騒音取込部８などの機能を有している。

【００３９】なお、ＣＰＵ５１におけるこのようなテキ
スト解析部２，規則音声合成部４，周囲騒音取込部８等
としての機能は、例えばソフトウェアパッケージ(具体
的には、ＣＤ−ＲＯＭ等の情報記録媒体)の形で提供す
ることができ、このため、図３の例では、情報記録媒体
６０がセットさせるとき、これを駆動する媒体駆動装置
６１が設けられている。

【００４０】換言すれば、本発明の音声合成装置は、汎
用の計算機システムにＣＤ−ＲＯＭ等の情報記録媒体に
記録されたプログラムを読み込ませて、この汎用計算機
システムのマイクロプロセッサに本発明の音声合成処理
を実行させる装置構成においても実施することが可能で
ある。この場合、本発明の音声合成処理を実行するため
のプログラム(すなわち、ハードウェアシステムで用い
られるプログラム)は、媒体に記録された状態で提供さ
れる。プログラムなどが記録される情報記録媒体として
は、ＣＤ−ＲＯＭに限られるものではなく、ＲＯＭ，Ｒ
ＡＭ，フレキシブルディスク，メモリカード等が用いら
れても良い。媒体に記録されたプログラムは、ハードウ
ェアシステムに組み込まれている記憶装置、例えばハー
ドディスク装置にインストールされることにより、この
プログラムを実行して、本発明の音声合成装置の機能を
実現することができる。

【００４１】また、本発明の音声合成処理を実現するた
めのプログラムは、媒体の形で提供されるのみならず、
通信によって(例えばサーバによって)提供されるもので
あっても良い。

【００４２】

【発明の効果】以上に説明したように、請求項１記載の
発明によれば、規則音声合成部は、音素データ蓄積部か
ら取り出される音素データが子音音素データであると
き、該子音に対し、騒音解析手段によって算出された周
囲騒音のパワーレベルに応じたパワー制御を行なって発
音信号に変換するようになっているので、騒音下で特に
聞き取りにくくなる子音についても、子音が大きなパワ
ーで発音出力されることで、騒音下でも子音を聞き易く
なる。

【００４３】また、請求項２記載の発明によれば、規則
音声合成部は、騒音解析手段によって算出された周囲騒
音のパワーレベルが閾値αを越えるときには母音の無音
化処理がなされないように、母音無声化に対する制御を
行なうようになっているので、騒音下でも母音がはっき
りと発声され、より聞き取りやすい合成音声になる。

【００４４】また、請求項３記載の発明によれば、規則
音声合成部は、騒音解析手段によって周囲騒音のパワー
レベルと周囲騒音の周波数分布が算出されるとき、ピッ
チ周波数と周波数が重なる騒音が存在しその周波数での
騒音パワーレベルが閾値βを越える場合には、ピッチ周
波数を移動させる制御を行なうようになっているので、
マスキング効果が回避され、より聞き取りやすい合成音
声になる。

【００４５】また、請求項４記載の発明によれば、規則
音声合成部は、騒音解析手段によって周囲騒音のパワー
レベルと周囲騒音の周波数分布が算出されるとき、フォ
ルマント周波数と周波数が重なる騒音が存在しその周波
数での騒音パワーレベルが閾値γを越える場合には、音
声出力サンプリング周波数を移動させる制御を行なうよ
うになっているので、マスキング効果が回避され、より
聞き取りやすい合成音声になる。

【００４６】このように、請求項１乃至請求項４記載の
発明によれば、車載騒音などの騒音下でも、音声合成パ
ラメータを自動的に制御することにより、より聞き取り
やすい合成音声を得ることができる。

【図面の簡単な説明】

【図１】本発明に係る音声合成装置の構成例を示す図で
ある。

【図２】図１の音声合成装置の変形例を示す図である。

【図３】図１あるいは図２の音声合成装置のハードウェ
ア構成例を示す図である。

【符号の説明】

１テキスト入力部２テキスト解析部３音素データ蓄積部４規則音声合成部５音声出力部６騒音解析手段７周囲騒音取込部８周囲騒音解析部１１形態素解析処理部１２音韻・韻律付与処理部１４標準単語辞書１５子音パワー制御部１６母音無声化判断処理部１７ピッチ変更部１８サンプリング変更部５１ＣＰＵ５２ＲＯＭ５３ＲＡＭ６０情報記憶媒体６１媒体駆動装置

Claims

【特許請求の範囲】

【請求項１】テキスト情報を入力するテキスト入力部
と、入力されたテキストに対して形態素解析処理並びに
音韻・韻律付与処理を行なって発音記号を生成するテキ
スト解析部と、音素データが蓄積されている音素データ
蓄積部と、テキスト解析部で生成された発音記号に従
い、音素データ蓄積部から音素データを引き出し、ピッ
チ間隔に音素データを重畳することで発音信号に変換す
る規則音声合成部と、変換した発音信号を音声として出
力する音声出力部と、周囲騒音を取り込んで解析し、周
囲騒音のパワーレベルを算出する騒音解析手段とを有
し、前記規則音声合成部は、前記音素データ蓄積部から
取り出される音素データが子音音素データであるとき、
該子音に対し、前記騒音解析手段によって算出された周
囲騒音のパワーレベルに応じたパワー制御を行なって発
音信号に変換するようになっていることを特徴とする音
声合成装置。
【請求項２】テキスト情報を入力するテキスト入力部
と、入力されたテキストに対して形態素解析処理並びに
音韻・韻律付与処理を行なって発音記号を生成するテキ
スト解析部と、音素データが蓄積されている音素データ
蓄積部と、テキスト解析部で生成された発音記号に従
い、音素データ蓄積部から音素データを引き出し、ピッ
チ間隔に音素データを重畳することで発音信号に変換す
る規則音声合成部と、変換した発音信号を音声として出
力する音声出力部と、周囲騒音を取り込んで解析し、周
囲騒音のパワーレベルを算出する騒音解析手段とを有
し、前記規則音声合成部は、前記騒音解析手段によって
算出された周囲騒音のパワーレベルが閾値αを越えると
きには母音の無音化処理がなされないように、母音無声
化に対する制御を行なうようになっていることを特徴と
する音声合成装置。
【請求項３】テキスト情報を入力するテキスト入力部
と、入力されたテキストに対して形態素解析処理並びに
音韻・韻律付与処理を行なって発音記号を生成するテキ
スト解析部と、音素データが蓄積されている音素データ
蓄積部と、テキスト解析部で生成された発音記号に従
い、音素データ蓄積部から音素データを引き出し、ピッ
チ間隔に音素データを重畳することで発音信号に変換す
る規則音声合成部と、変換した発音信号を音声として出
力する音声出力部と、周囲騒音を取り込んで解析し、周
囲騒音のパワーレベルを算出するとともに、周囲騒音の
周波数分布を算出する騒音解析手段とを有し、前記規則
音声合成部は、前記騒音解析手段によって周囲騒音のパ
ワーレベルと周囲騒音の周波数分布が算出されるとき、
ピッチ周波数と周波数が重なる騒音が存在しその周波数
での騒音パワーレベルが閾値βを越える場合には、ピッ
チ周波数を移動させる制御を行なうようになっているこ
とを特徴とする音声合成装置。
【請求項４】テキスト情報を入力するテキスト入力部
と、入力されたテキストに対して形態素解析処理並びに
音韻・韻律付与処理を行なって発音記号を生成するテキ
スト解析部と、音素データが蓄積されている音素データ
蓄積部と、テキスト解析部で生成された発音記号に従
い、音素データ蓄積部から音素データを引き出し、ピッ
チ間隔に音素データを重畳することで発音信号に変換す
る規則音声合成部と、変換した発音信号を音声として出
力する音声出力部と、周囲騒音を取り込んで解析し、周
囲騒音のパワーレベルを算出するとともに、周囲騒音の
周波数分布を算出する騒音解析手段とを有し、前記規則
音声合成部は、前記騒音解析手段によって周囲騒音のパ
ワーレベルと周囲騒音の周波数分布が算出されるとき、
フォルマント周波数と周波数が重なる騒音が存在しその
周波数での騒音パワーレベルが閾値γを越える場合に
は、音声出力サンプリング周波数を移動させる制御を行
なうようになっていることを特徴とする音声合成装置。