JPH1115495A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH1115495A
JPH1115495A JP9181768A JP18176897A JPH1115495A JP H1115495 A JPH1115495 A JP H1115495A JP 9181768 A JP9181768 A JP 9181768A JP 18176897 A JP18176897 A JP 18176897A JP H1115495 A JPH1115495 A JP H1115495A
Authority
JP
Japan
Prior art keywords
noise
phoneme data
unit
ambient noise
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9181768A
Other languages
English (en)
Other versions
JP3578598B2 (ja
Inventor
Shuji Kubota
修司 久保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP18176897A priority Critical patent/JP3578598B2/ja
Publication of JPH1115495A publication Critical patent/JPH1115495A/ja
Application granted granted Critical
Publication of JP3578598B2 publication Critical patent/JP3578598B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 少ない処理量で、騒音下での合成音声の聞き
取り易さを著しく向上させることの可能な音声合成装置
を提供する。 【解決手段】 規則音声合成部4は、音素データ蓄積部
3から取り出される音素データが子音音素データである
とき、該子音に対し、騒音解析手段6によって算出され
た周囲騒音のパワーレベルに応じたパワー制御を行なっ
て発音信号に変換し、また、規則音声合成部4は、騒音
解析手段6によって算出された周囲騒音のパワーレベル
が閾値αを越えるときには母音の無音化処理がなされな
いように、母音無声化に対する制御を行なう。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字情報もしくは
発音記号列等のテキスト情報を音声に変換して出力する
音声合成装置に関する。
【0002】
【従来の技術】近年、騒音下で合成音声を聞き取りやす
くするための種々の技術が提案されている。
【0003】例えば、特開昭61−145633号や特
開平2−238494号には、周囲騒音のパワーレベル
に応じて合成音声の振幅を変化させる技術が示されてい
る。
【0004】また、例えば特開平2−293900号に
は、周囲騒音のパワーレベルに応じて、ピッチ周波数を
変化させる技術が示されている。
【0005】また、特開平2−293900号には、騒
音を周波数解析し、その周波数特性に適したフィルタを
算出して、騒音に対してそのフィルタによりフィルタ処
理を行なって音声合成出力する技術が示されている。
【0006】
【発明が解決しようとする課題】しかしながら、特開昭
61−145633号や特開平2−238494号の技
術は、単に周囲騒音のレベルに従って合成音声の出力パ
ワーレベルを上げているだけである。
【0007】また、特開平2−293900号の技術で
は騒音レベルに応じて、ピッチを一定間隔で高域に上げ
ていくというもので、ピッチ周波数は高い周波数の方向
にしか移動しない。また、騒音周波数の分析を行なって
いないので、ピッチ周波数を移動させることで、騒音に
含まれる周波数成分と同調し、逆にマスキング効果(2
つ以上の音が同時に存在するとき、一方が他方の存在に
より聞こえなくなる現象)によって聞き取りにくくなる
可能性がある。
【0008】また、特開平2−293900号の技術で
は、騒音の周波数特性を利用して、その特性をもつフィ
ルタに合成音声を通すことでS/N比を上げようとして
いるが、基本的に、上述したようなマスキング効果を取
り去るものではない。また、フィルタ設計やフィルタ処
理を必要とするので、システム規模が大きくなってしま
うという問題もある。
【0009】このように、騒音下で合成音声を聞き取り
易くするための種々の技術が提案されているものの、従
来では、騒音レベルに応じて合成音声の出力レベルを全
体的に大きくするように制御するだけで、騒音下で特に
聞き取りにくくなる子音や母音の無声化に着目して制御
するような処理は行なっていない。また、従来では、騒
音に含まれる周波数成分が合成音のピッチ周波数やフォ
ルマント周波数と重なっているかを判断していないた
め、マスキング効果を回避するようにはなっていない。
すなわち、従来の技術では、騒音下での合成音声の聞き
取り易さを著しく向上させるには限界があった。
【0010】本発明は、少ない処理量で、騒音下での合
成音声の聞き取り易さを著しく向上させることの可能な
音声合成装置を提供することを目的としている。
【0011】
【課題を解決するための手段】上記目的を達成するため
に、請求項1記載の発明は、テキスト情報を入力するテ
キスト入力部と、入力されたテキストに対して形態素解
析処理並びに音韻・韻律付与処理を行なって発音記号を
生成するテキスト解析部と、音素データが蓄積されてい
る音素データ蓄積部と、テキスト解析部で生成された発
音記号に従い、音素データ蓄積部から音素データを引き
出し、ピッチ間隔に音素データを重畳することで発音信
号に変換する規則音声合成部と、変換した発音信号を音
声として出力する音声出力部と、周囲騒音を取り込んで
解析し、周囲騒音のパワーレベルを算出する騒音解析手
段とを有し、規則音声合成部は、音素データ蓄積部から
取り出される音素データが子音音素データであるとき、
該子音に対し、騒音解析手段によって算出された周囲騒
音のパワーレベルに応じたパワー制御を行なって発音信
号に変換するようになっていることを特徴としている。
【0012】また、請求項2記載の発明は、テキスト情
報を入力するテキスト入力部と、入力されたテキストに
対して形態素解析処理並びに音韻・韻律付与処理を行な
って発音記号を生成するテキスト解析部と、音素データ
が蓄積されている音素データ蓄積部と、テキスト解析部
で生成された発音記号に従い、音素データ蓄積部から音
素データを引き出し、ピッチ間隔に音素データを重畳す
ることで発音信号に変換する規則音声合成部と、変換し
た発音信号を音声として出力する音声出力部と、周囲騒
音を取り込んで解析し、周囲騒音のパワーレベルを算出
する騒音解析手段とを有し、規則音声合成部は、騒音解
析手段によって算出された周囲騒音のパワーレベルが閾
値αを越えるときには母音の無音化処理がなされないよ
うに、母音無声化に対する制御を行なうようになってい
ることを特徴としている。
【0013】また、請求項3記載の発明は、テキスト情
報を入力するテキスト入力部と、入力されたテキストに
対して形態素解析処理並びに音韻・韻律付与処理を行な
って発音記号を生成するテキスト解析部と、音素データ
が蓄積されている音素データ蓄積部と、テキスト解析部
で生成された発音記号に従い、音素データ蓄積部から音
素データを引き出し、ピッチ間隔に音素データを重畳す
ることで発音信号に変換する規則音声合成部と、変換し
た発音信号を音声として出力する音声出力部と、周囲騒
音を取り込んで解析し、周囲騒音のパワーレベルを算出
するとともに、周囲騒音の周波数分布を算出する騒音解
析手段とを有し、規則音声合成部は、騒音解析手段によ
って周囲騒音のパワーレベルと周囲騒音の周波数分布が
算出されるとき、ピッチ周波数と周波数が重なる騒音が
存在しその周波数での騒音パワーレベルが閾値βを越え
る場合には、ピッチ周波数を移動させる制御を行なうよ
うになっていることを特徴としている。
【0014】また、請求項4記載の発明は、テキスト情
報を入力するテキスト入力部と、入力されたテキストに
対して形態素解析処理並びに音韻・韻律付与処理を行な
って発音記号を生成するテキスト解析部と、音素データ
が蓄積されている音素データ蓄積部と、テキスト解析部
で生成された発音記号に従い、音素データ蓄積部から音
素データを引き出し、ピッチ間隔に音素データを重畳す
ることで発音信号に変換する規則音声合成部と、変換し
た発音信号を音声として出力する音声出力部と、周囲騒
音を取り込んで解析し、周囲騒音のパワーレベルを算出
するとともに、周囲騒音の周波数分布を算出する騒音解
析手段とを有し、規則音声合成部は、騒音解析手段によ
って周囲騒音のパワーレベルと周囲騒音の周波数分布が
算出されるとき、フォルマント周波数と周波数が重なる
騒音が存在しその周波数での騒音パワーレベルが閾値γ
を越える場合には、音声出力サンプリング周波数を移動
させる制御を行なうようになっていることを特徴として
いる。
【0015】
【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。図1は本発明に係る音声合成装置の
構成例を示す図である。図1を参照すると、この音声合
成装置は、文字情報もしくは発音記号列等のテキスト情
報を入力するテキスト入力部1と、入力されたテキスト
に対して形態素解析処理並びに音韻・韻律付与処理を行
なって発音記号を生成するテキスト解析部2と、音素デ
ータが蓄積されている音素データ蓄積部(音素データベ
ース)3と、テキスト解析部2で生成された発音記号を
音素データ蓄積部(音素データベース)3に蓄積されてい
る音素データに基づいて発音信号に変換する規則音声合
成部4と、変換した発音信号を音声として出力する音声
出力部5と、周囲騒音(雑音)を取り込んで解析する騒音
解析手段6とを有している。
【0016】ここで、テキスト解析部2は、形態素解析
処理部11と、音韻・韻律付与処理部12とを備え、形
態素解析処理部11は、例えば標準単語辞書14を参照
して(辞書引きして)形態素解析処理を行なうようになっ
ている。
【0017】また、規則音声合成部4は、テキスト解析
部2で生成された発音記号に従い、音素データ蓄積部3
から音素データを引き出し、ピッチ間隔に音素データを
重畳することで、発音信号に変換するようになってい
る。
【0018】また、騒音解析手段6は、周囲騒音を取り
込む周囲騒音取込部7と、周囲騒音取込部7で取り込ん
だ周囲騒音を解析する周囲騒音解析部8とを有してお
り、周囲騒音解析部8は、取り込んだ周囲騒音を解析し
て、騒音のパワー(パワーレベル)や騒音の周波数分布を
求めるようになっている。なお、周波数分布の解析に
は、FFTやフィルタバンクを用いることができる。
【0019】そして、本発明の第1の実施形態において
は、規則音声合成部4は、音素データ蓄積部3から取り
出される音素データが子音音素データであるとき、該子
音に対し、騒音解析手段6によって算出された周囲騒音
のパワーレベルに応じたパワー制御を行なって発音信号
に変換するようになっている。
【0020】また、本発明の第2の実施形態において
は、規則音声合成部4は、騒音解析手段6によって算出
された周囲騒音のパワーレベルが閾値αを越えるときに
は母音の無音化処理がなされないように、母音無声化に
対する制御を行なうようになっている。
【0021】また、本発明の第3の実施形態において
は、規則音声合成部4は、周囲騒音解析手段6によって
周囲騒音のパワーレベルと周囲騒音の周波数分布が算出
されるとき、ピッチ周波数と周波数が重なる騒音が存在
しその周波数での騒音パワーレベルが閾値βを越えた場
合には、ピッチ周波数を前後に移動させる制御を行なう
ようになっている。
【0022】また、本発明の第4の実施形態において
は、規則音声合成部4は、騒音解析手段6によって周囲
騒音のパワーレベルと周囲騒音の周波数分布が算出され
るとき、フォルマント周波数と周波数が重なる騒音が存
在しその周波数での騒音パワーレベルが閾値γを越える
場合には、音声出力サンプリング周波数を前後に移動さ
せる制御を行なうようになっている。
【0023】次に、このような構成の音声合成装置の処
理動作を説明する。通常、テキスト入力部1でテキスト
が入力されると、入力されたテキストは、テキスト解析
部2で形態素解析処理,音韻・韻律制御処理が行なわれ
て発音記号列に変換され、その後、テキスト解析部2か
ら出力された発音記号列は、規則音声合成部4に入力
し、規則音声合成部4において規則音声合成処理がなさ
れ、音声波形データに変換される。このようにして発音
記号列に基づき変換された音声波形データは音声出力部
5に入力し、音声出力部5から音声として出力される。
【0024】より具体的に、テキスト解析部2では、形
態素解析処理時に単語辞書14の辞書引きを行なってテ
キストを発音記号列に変換する。その後、規則音声合成
部4は、テキスト解析部2から出力された発音記号列に
従い、音素データベース3から音素データ(発音記号列
に対応した音素データ)を取り出し、取り出した各音素
データを時系列でピッチ間隔に重畳することで(波形重
畳方式で)、発音信号(音声波形データ)に変換する。こ
のようにして規則音声合成部4で変換された発音信号
(音声波形データ)は音声出力部5に入力し、音声出力部
5から音声として出力される。
【0025】このような規則音声合成処理において、本
発明では、さらに、周囲騒音取込部7で周囲騒音を取り
込み、取り込んだ周囲騒音を周囲騒音解析部8で解析
し、騒音パワーレベル,周波数分布のパラメータを生成
する。
【0026】この場合、本発明の第1の実施形態では、
規則音声合成部4は、周囲騒音解析部8で解析された騒
音パワーレベルに従って、破裂音や摩擦音など騒音下で
聞き取りにくくなる子音のパワーを制御する。すなわ
ち、テキスト解析部2から出力された発音記号列に従
い、音素データベース3から音素データを取り出して発
音信号に変換する際、取り出した音素データが子音音素
データである場合、規則音声合成部4は、この子音のパ
ワー(利得)を騒音パワーレベルに従って制御する。具体
的に、子音パワーの制御は、例えば騒音パワーレベルに
比例するように子音のパワー(利得)を決定し、音素デー
タベース3から取り出した子音音素波形に、決定した利
得を施した後(乗じた後)、波形重畳を行なうことによっ
てなされる。
【0027】このように、周囲騒音解析部8で解析され
た騒音パワーレベルに従って子音のパワーを制御するこ
とで、騒音下で特に聞き取りにくくなる子音について
も、子音が騒音のパワーレベルに応じた大きなパワーで
発音出力されることで、騒音下でも子音を聞き易くな
る。
【0028】また、本発明の第2の実施形態では、規則
音声合成部4は、騒音パワーレベルが閾値αを越えるか
を判断し、騒音パワーレベルが閾値αを越えた場合に
は、無声化音韻の無声化処理がなされないように制御す
る。すなわち、通常の日本語音声合成処理では、よりな
めらかに発声させるために自動的に無声化させる音韻
(“し”,“き”,“く”など)が存在するが、騒音パワ
ーレベルが所定の閾値αを越えたときには、無声化音韻
の無声化処理を強制的に禁止する処理を行なうことによ
り、騒音下でも母音がはっきりと発声され、より聞き取
りやすい合成音声になる。なお、上記閾値αは、例え
ば、母音を無声化したときに合成音声を聞き取りにくく
させる騒音パワーレベルに設定される。
【0029】また、本発明の第3の実施形態では、規則
音声合成部4は、騒音の周波数分布のパラメータから、
ピッチ周波数と重なっている騒音が存在する場合、その
周波数での騒音パワーレベルが閾値βを越えているかを
判断し、越えているときには、ピッチ周波数が変更でき
る範囲内で、ピッチ周波数を前後に移動(シフト)させ
る。より具体的に、騒音パワーレベルが低い周波数帯に
ピッチ周波数を移動(シフト)させる。なお、上記閾値β
は、例えば、合成音声の出力レベルに従って、S/N比
から決定される。
【0030】このように、第3の実施形態では、騒音の
周波数分布のパラメータから、ピッチ周波数と重なって
いる騒音が存在する場合、その周波数での騒音パワーレ
ベルが閾値βを越えているかを判断し、越えているとき
には、ピッチ周波数が変更できる範囲内で、ピッチ周波
数を前後に移動(シフト)させることにより、マスキング
効果が回避され、より聞き取りやすい合成音声になる。
【0031】また、本発明の第4の実施形態では、規則
音声合成部4は、騒音の周波数分布のパラメータから、
フォルマント周波数と重なっている騒音が存在する場
合、その周波数での騒音パワーレベルが閾値γを越えて
いるかを判断し、越えているときは、音声出力サンプリ
ング周波数が変更できる範囲内で、音声出力サンプリン
グ周波数を前後に移動(シフト)させる。より具体的に、
騒音パワーレベルが低い周波数帯に音声出力サンプリン
グ周波数を前後に移動(シフト)させる。
【0032】すなわち、波形重畳方式で規則音声合成を
行なう場合には、音素波形データを使用するので声道特
性が音素毎に固定になっているため、パラメータ方式の
音声合成方式と異なり、フォルマント周波数の位置を変
更することはできない。そのため、第4の実施形態で
は、サンプリング周波数を移動させる(変更する)こと
で、相対的にフォルマント周波数を前後に移動させる。
【0033】この場合、フォルマント周波数は音素(母
音)毎にあらかじめ決定されているので、各音素データ
毎にフォルマント情報(周波数位置,利得)をパラメータ
として保持させておく。また、上記閾値γは、例えば、
合成音声の出力レベルとフォルマント情報に従って、S
/N比から決定される。
【0034】このように、第4の実施形態では、騒音の
周波数分布のパラメータから、フォルマント周波数と重
なっている騒音が存在する場合、その周波数での騒音パ
ワーレベルが閾値γを越えているかを判断し、越えてい
るときは、音声出力サンプリング周波数が変更できる範
囲内で、音声出力サンプリング周波数を前後に移動(シ
フト)させることにより(より具体的に、騒音パワーレベ
ルが低い周波数帯に音声出力サンプリング周波数を前後
に移動(シフト)させることにより)、マスキング効果が
回避され、より聞き取りやすい合成音声になる。
【0035】なお、上述の説明では、第1,第2,第
3,第4の実施形態をそれぞれ個別に説明したが、第
1,第2,第3,第4の実施形態を任意に組み合せて用
いることもできる。例えば、第1,第2,第3,第4の
全ての実施形態を組み合せて、規則音声合成部4内に、
子音のパワーを制御する機能,母音の無声化処理を行な
わないように制御する機能,ピッチ周波数を移動させる
(変更する)機能,音声出力サンプリング周波数を前後に
移動(変更する)機能を設けることもできる。
【0036】また、上述の例では、規則音声合成部4内
に、子音のパワーを制御する機能,母音の無声化処理を
行なわないように制御する機能,ピッチ周波数を移動さ
せる(変更する)機能,音声出力サンプリング周波数を前
後に移動(変更する)機能を設けているが、これらを規則
音声合成部4の外部に設けることも可能である。すなわ
ち、例えば図2に示すように、子音のパワーを制御する
子音パワー制御部15,母音の無声化処理を行なわない
ように制御する母音無声化判断処理部16,ピッチ周波
数を移動させる(変更する)ピッチ変更部17,音声出力
サンプリング周波数を前後に移動(変更する)サンプリン
グ変更部18をそれぞれ設けることもできる。
【0037】図3は図1あるいは図2の音声合成装置の
ハードウェア構成例を示す図である。図3を参照する
と、この音声合成装置は、例えばパーソナルコンピュー
タ等で実現され、全体を制御するCPU51と、CPU
51の制御プログラム等が記憶されているROM52
と、CPU51のワークエリア等として使用されるRA
M53と、テキストを入力するテキスト入力部1と、音
声出力部(例えば、スピーカ)5と、周囲騒音を取り込む
周囲騒音取込部(例えば、マイク)7とを有している。
【0038】ここで、RAM53には、単語辞書14や
音素データベース3などを設定することができる。ま
た、CPU51は、テキスト解析部2,規則音声合成部
4,周囲騒音取込部8などの機能を有している。
【0039】なお、CPU51におけるこのようなテキ
スト解析部2,規則音声合成部4,周囲騒音取込部8等
としての機能は、例えばソフトウェアパッケージ(具体
的には、CD−ROM等の情報記録媒体)の形で提供す
ることができ、このため、図3の例では、情報記録媒体
60がセットさせるとき、これを駆動する媒体駆動装置
61が設けられている。
【0040】換言すれば、本発明の音声合成装置は、汎
用の計算機システムにCD−ROM等の情報記録媒体に
記録されたプログラムを読み込ませて、この汎用計算機
システムのマイクロプロセッサに本発明の音声合成処理
を実行させる装置構成においても実施することが可能で
ある。この場合、本発明の音声合成処理を実行するため
のプログラム(すなわち、ハードウェアシステムで用い
られるプログラム)は、媒体に記録された状態で提供さ
れる。プログラムなどが記録される情報記録媒体として
は、CD−ROMに限られるものではなく、ROM,R
AM,フレキシブルディスク,メモリカード等が用いら
れても良い。媒体に記録されたプログラムは、ハードウ
ェアシステムに組み込まれている記憶装置、例えばハー
ドディスク装置にインストールされることにより、この
プログラムを実行して、本発明の音声合成装置の機能を
実現することができる。
【0041】また、本発明の音声合成処理を実現するた
めのプログラムは、媒体の形で提供されるのみならず、
通信によって(例えばサーバによって)提供されるもので
あっても良い。
【0042】
【発明の効果】以上に説明したように、請求項1記載の
発明によれば、規則音声合成部は、音素データ蓄積部か
ら取り出される音素データが子音音素データであると
き、該子音に対し、騒音解析手段によって算出された周
囲騒音のパワーレベルに応じたパワー制御を行なって発
音信号に変換するようになっているので、騒音下で特に
聞き取りにくくなる子音についても、子音が大きなパワ
ーで発音出力されることで、騒音下でも子音を聞き易く
なる。
【0043】また、請求項2記載の発明によれば、規則
音声合成部は、騒音解析手段によって算出された周囲騒
音のパワーレベルが閾値αを越えるときには母音の無音
化処理がなされないように、母音無声化に対する制御を
行なうようになっているので、騒音下でも母音がはっき
りと発声され、より聞き取りやすい合成音声になる。
【0044】また、請求項3記載の発明によれば、規則
音声合成部は、騒音解析手段によって周囲騒音のパワー
レベルと周囲騒音の周波数分布が算出されるとき、ピッ
チ周波数と周波数が重なる騒音が存在しその周波数での
騒音パワーレベルが閾値βを越える場合には、ピッチ周
波数を移動させる制御を行なうようになっているので、
マスキング効果が回避され、より聞き取りやすい合成音
声になる。
【0045】また、請求項4記載の発明によれば、規則
音声合成部は、騒音解析手段によって周囲騒音のパワー
レベルと周囲騒音の周波数分布が算出されるとき、フォ
ルマント周波数と周波数が重なる騒音が存在しその周波
数での騒音パワーレベルが閾値γを越える場合には、音
声出力サンプリング周波数を移動させる制御を行なうよ
うになっているので、マスキング効果が回避され、より
聞き取りやすい合成音声になる。
【0046】このように、請求項1乃至請求項4記載の
発明によれば、車載騒音などの騒音下でも、音声合成パ
ラメータを自動的に制御することにより、より聞き取り
やすい合成音声を得ることができる。
【図面の簡単な説明】
【図1】本発明に係る音声合成装置の構成例を示す図で
ある。
【図2】図1の音声合成装置の変形例を示す図である。
【図3】図1あるいは図2の音声合成装置のハードウェ
ア構成例を示す図である。
【符号の説明】
1 テキスト入力部 2 テキスト解析部 3 音素データ蓄積部 4 規則音声合成部 5 音声出力部 6 騒音解析手段 7 周囲騒音取込部 8 周囲騒音解析部 11 形態素解析処理部 12 音韻・韻律付与処理部 14 標準単語辞書 15 子音パワー制御部 16 母音無声化判断処理部 17 ピッチ変更部 18 サンプリング変更部 51 CPU 52 ROM 53 RAM 60 情報記憶媒体 61 媒体駆動装置

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 テキスト情報を入力するテキスト入力部
    と、入力されたテキストに対して形態素解析処理並びに
    音韻・韻律付与処理を行なって発音記号を生成するテキ
    スト解析部と、音素データが蓄積されている音素データ
    蓄積部と、テキスト解析部で生成された発音記号に従
    い、音素データ蓄積部から音素データを引き出し、ピッ
    チ間隔に音素データを重畳することで発音信号に変換す
    る規則音声合成部と、変換した発音信号を音声として出
    力する音声出力部と、周囲騒音を取り込んで解析し、周
    囲騒音のパワーレベルを算出する騒音解析手段とを有
    し、前記規則音声合成部は、前記音素データ蓄積部から
    取り出される音素データが子音音素データであるとき、
    該子音に対し、前記騒音解析手段によって算出された周
    囲騒音のパワーレベルに応じたパワー制御を行なって発
    音信号に変換するようになっていることを特徴とする音
    声合成装置。
  2. 【請求項2】 テキスト情報を入力するテキスト入力部
    と、入力されたテキストに対して形態素解析処理並びに
    音韻・韻律付与処理を行なって発音記号を生成するテキ
    スト解析部と、音素データが蓄積されている音素データ
    蓄積部と、テキスト解析部で生成された発音記号に従
    い、音素データ蓄積部から音素データを引き出し、ピッ
    チ間隔に音素データを重畳することで発音信号に変換す
    る規則音声合成部と、変換した発音信号を音声として出
    力する音声出力部と、周囲騒音を取り込んで解析し、周
    囲騒音のパワーレベルを算出する騒音解析手段とを有
    し、前記規則音声合成部は、前記騒音解析手段によって
    算出された周囲騒音のパワーレベルが閾値αを越えると
    きには母音の無音化処理がなされないように、母音無声
    化に対する制御を行なうようになっていることを特徴と
    する音声合成装置。
  3. 【請求項3】 テキスト情報を入力するテキスト入力部
    と、入力されたテキストに対して形態素解析処理並びに
    音韻・韻律付与処理を行なって発音記号を生成するテキ
    スト解析部と、音素データが蓄積されている音素データ
    蓄積部と、テキスト解析部で生成された発音記号に従
    い、音素データ蓄積部から音素データを引き出し、ピッ
    チ間隔に音素データを重畳することで発音信号に変換す
    る規則音声合成部と、変換した発音信号を音声として出
    力する音声出力部と、周囲騒音を取り込んで解析し、周
    囲騒音のパワーレベルを算出するとともに、周囲騒音の
    周波数分布を算出する騒音解析手段とを有し、前記規則
    音声合成部は、前記騒音解析手段によって周囲騒音のパ
    ワーレベルと周囲騒音の周波数分布が算出されるとき、
    ピッチ周波数と周波数が重なる騒音が存在しその周波数
    での騒音パワーレベルが閾値βを越える場合には、ピッ
    チ周波数を移動させる制御を行なうようになっているこ
    とを特徴とする音声合成装置。
  4. 【請求項4】 テキスト情報を入力するテキスト入力部
    と、入力されたテキストに対して形態素解析処理並びに
    音韻・韻律付与処理を行なって発音記号を生成するテキ
    スト解析部と、音素データが蓄積されている音素データ
    蓄積部と、テキスト解析部で生成された発音記号に従
    い、音素データ蓄積部から音素データを引き出し、ピッ
    チ間隔に音素データを重畳することで発音信号に変換す
    る規則音声合成部と、変換した発音信号を音声として出
    力する音声出力部と、周囲騒音を取り込んで解析し、周
    囲騒音のパワーレベルを算出するとともに、周囲騒音の
    周波数分布を算出する騒音解析手段とを有し、前記規則
    音声合成部は、前記騒音解析手段によって周囲騒音のパ
    ワーレベルと周囲騒音の周波数分布が算出されるとき、
    フォルマント周波数と周波数が重なる騒音が存在しその
    周波数での騒音パワーレベルが閾値γを越える場合に
    は、音声出力サンプリング周波数を移動させる制御を行
    なうようになっていることを特徴とする音声合成装置。
JP18176897A 1997-06-23 1997-06-23 音声合成装置 Expired - Fee Related JP3578598B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18176897A JP3578598B2 (ja) 1997-06-23 1997-06-23 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18176897A JP3578598B2 (ja) 1997-06-23 1997-06-23 音声合成装置

Publications (2)

Publication Number Publication Date
JPH1115495A true JPH1115495A (ja) 1999-01-22
JP3578598B2 JP3578598B2 (ja) 2004-10-20

Family

ID=16106555

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18176897A Expired - Fee Related JP3578598B2 (ja) 1997-06-23 1997-06-23 音声合成装置

Country Status (1)

Country Link
JP (1) JP3578598B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7274819B2 (en) 2001-05-31 2007-09-25 Canon Kabushiki Kaisha Pattern recognition apparatus using parallel operation
US8209180B2 (en) 2006-02-08 2012-06-26 Nec Corporation Speech synthesizing device, speech synthesizing method, and program
US20190362734A1 (en) * 2018-05-28 2019-11-28 Unlimiter Mfa Co., Ltd. Method for detecting ambient noise to change the playing voice frequency and sound playing device thereof
CN110570875A (zh) * 2018-06-05 2019-12-13 塞舌尔商元鼎音讯股份有限公司 检测环境噪音以改变播放语音频率的方法及声音播放装置
CN110648686A (zh) * 2018-06-27 2020-01-03 塞舌尔商元鼎音讯股份有限公司 调整语音频率的方法及其声音播放装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02210497A (ja) * 1989-02-10 1990-08-21 Ricoh Co Ltd 音声合成装置
JPH086596A (ja) * 1994-06-21 1996-01-12 Mitsubishi Electric Corp 音声強調装置
JPH0863188A (ja) * 1994-08-18 1996-03-08 Nec Corp 音声合成装置
JPH1083193A (ja) * 1996-09-09 1998-03-31 Matsushita Electric Ind Co Ltd 音声合成装置および音声素片作成方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02210497A (ja) * 1989-02-10 1990-08-21 Ricoh Co Ltd 音声合成装置
JPH086596A (ja) * 1994-06-21 1996-01-12 Mitsubishi Electric Corp 音声強調装置
JPH0863188A (ja) * 1994-08-18 1996-03-08 Nec Corp 音声合成装置
JPH1083193A (ja) * 1996-09-09 1998-03-31 Matsushita Electric Ind Co Ltd 音声合成装置および音声素片作成方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7274819B2 (en) 2001-05-31 2007-09-25 Canon Kabushiki Kaisha Pattern recognition apparatus using parallel operation
US8209180B2 (en) 2006-02-08 2012-06-26 Nec Corporation Speech synthesizing device, speech synthesizing method, and program
US20190362734A1 (en) * 2018-05-28 2019-11-28 Unlimiter Mfa Co., Ltd. Method for detecting ambient noise to change the playing voice frequency and sound playing device thereof
US11367457B2 (en) * 2018-05-28 2022-06-21 Pixart Imaging Inc. Method for detecting ambient noise to change the playing voice frequency and sound playing device thereof
CN110570875A (zh) * 2018-06-05 2019-12-13 塞舌尔商元鼎音讯股份有限公司 检测环境噪音以改变播放语音频率的方法及声音播放装置
CN110648686A (zh) * 2018-06-27 2020-01-03 塞舌尔商元鼎音讯股份有限公司 调整语音频率的方法及其声音播放装置

Also Published As

Publication number Publication date
JP3578598B2 (ja) 2004-10-20

Similar Documents

Publication Publication Date Title
US5828994A (en) Non-uniform time scale modification of recorded audio
Zhang et al. Analysis and classification of speech mode: whispered through shouted.
JP4264841B2 (ja) 音声認識装置および音声認識方法、並びに、プログラム
JP2000305582A (ja) 音声合成装置
JP2000206982A (ja) 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体
JP2009251199A (ja) 音声合成装置、方法及びプログラム
JP5301037B2 (ja) 音声認識装置
JP3578598B2 (ja) 音声合成装置
JPH05307395A (ja) 音声合成装置
JP2001034284A (ja) 音声合成方法及び装置、並びに文音声変換プログラムを記録した記録媒体
JP3588929B2 (ja) 音声認識装置
El Haddad et al. Towards a speech synthesis system with controllable amusement levels
JP4313724B2 (ja) 音声再生速度調節方法、音声再生速度調節プログラム、およびこれを格納した記録媒体
JPH11282494A (ja) 音声合成装置および記憶媒体
Datta et al. Epoch Synchronous Overlap Add (ESOLA)
KR101095867B1 (ko) 음성합성장치 및 방법
Datta et al. Time Domain Representation of Speech Sounds
JP3410387B2 (ja) 音声素片作成装置、音声合成装置、音声素片作成方法、音声合成方法及び記録媒体
JPH02293900A (ja) 音声合成装置
Rouf et al. Madurese Speech Synthesis using HMM
Dzibela et al. Hidden-Markov-Model Based Speech Enhancement
JP2004004952A (ja) 音声合成装置および音声合成方法
JP2005037423A (ja) 音声出力装置
JPH0756591A (ja) 音声合成装置、音声合成方法及び記録媒体
Hieronymus Phonetics: The key to high quality speech recognition and synthesis

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040713

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees