JPH06161490A - 音声合成装置の韻律処理方式 - Google Patents
音声合成装置の韻律処理方式Info
- Publication number
- JPH06161490A JPH06161490A JP4309116A JP30911692A JPH06161490A JP H06161490 A JPH06161490 A JP H06161490A JP 4309116 A JP4309116 A JP 4309116A JP 30911692 A JP30911692 A JP 30911692A JP H06161490 A JPH06161490 A JP H06161490A
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- pattern
- accent
- duration
- continuance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【目的】 合成音の自然性を高める。
【構成】 入力文について、ホストコンピュータ1は音
素列データと各音素の多段階のアクセント及び継続時間
長変化量を発生し、韻律処理部3は音素列データについ
て3段階以上の多段階のアクセント量によるピッチパタ
ーンを生成し、このパターンにより音素列データの多段
階のエネルギーパターンを生成し、音素列の各音素の継
続時間を継続時間変化量で調節した多段階の継続時間長
を求め、ピッチパターンとエネルギーパターン及び継続
時間長のパラメータ等から合成処理部4において合成音
を得る。
素列データと各音素の多段階のアクセント及び継続時間
長変化量を発生し、韻律処理部3は音素列データについ
て3段階以上の多段階のアクセント量によるピッチパタ
ーンを生成し、このパターンにより音素列データの多段
階のエネルギーパターンを生成し、音素列の各音素の継
続時間を継続時間変化量で調節した多段階の継続時間長
を求め、ピッチパターンとエネルギーパターン及び継続
時間長のパラメータ等から合成処理部4において合成音
を得る。
Description
【0001】
【産業上の利用分野】本発明は、規則合成方式の音声合
成装置において、ホストコンピュータ等から入力された
文字コードを韻律パラメータに変換する韻律処理方式に
関する。
成装置において、ホストコンピュータ等から入力された
文字コードを韻律パラメータに変換する韻律処理方式に
関する。
【0002】
【従来の技術】規則合成方式の音声合成装置は、入力文
字列を構文解析や形態素解析によって単語・文節に区切
ると共にイントネーションやアクセントを決定し、単語
や文節を音節や音素にまで分解し、音節又は音素単位の
音源波及び調整フィルタのパラメータを求め、音源波に
対する調音フィルタの応答出力として合成音声を得る。
字列を構文解析や形態素解析によって単語・文節に区切
ると共にイントネーションやアクセントを決定し、単語
や文節を音節や音素にまで分解し、音節又は音素単位の
音源波及び調整フィルタのパラメータを求め、音源波に
対する調音フィルタの応答出力として合成音声を得る。
【0003】韻律処理にはイントネーションやアクセン
トや生成するピッチパターンによって音節や音素単位の
ピッチ周波数(基本周波数)を調節したピッチパターン
パラメータ生成と、各音の強さを調節するエネルギーパ
ターンパラメータ生成と、各音の長さを調節する継続時
間長パラメータ生成などを行う。
トや生成するピッチパターンによって音節や音素単位の
ピッチ周波数(基本周波数)を調節したピッチパターン
パラメータ生成と、各音の強さを調節するエネルギーパ
ターンパラメータ生成と、各音の長さを調節する継続時
間長パラメータ生成などを行う。
【0004】図2は従来の規則音声合成方式による韻律
処理方式を示す。ホストコンピュータ1等から与えられ
る漢字かな混じり文に対し、日本語処理部2により構文
解析や形態素解析によってイントネーションを含むアク
セント決定と音素列データの生成をする。
処理方式を示す。ホストコンピュータ1等から与えられ
る漢字かな混じり文に対し、日本語処理部2により構文
解析や形態素解析によってイントネーションを含むアク
セント決定と音素列データの生成をする。
【0005】韻律処理部3は音素列データの各音素につ
いてアクセントデータからピッチ周波数を決定するピッ
チパターン生成部3Aと、各音素についてその基本エネ
ルギーデータをピッチパターンパラメータから決定する
エネルギーパターン生成部3Bと、各音素についてその
継続時間長を決定する時間長算出部3Cとを備える。
いてアクセントデータからピッチ周波数を決定するピッ
チパターン生成部3Aと、各音素についてその基本エネ
ルギーデータをピッチパターンパラメータから決定する
エネルギーパターン生成部3Bと、各音素についてその
継続時間長を決定する時間長算出部3Cとを備える。
【0006】合成処理部4は韻律処理結果としての各パ
ラメータから調音フィルター等を介して合成音信号を
得、音声出力装置5から合成音声を得る。
ラメータから調音フィルター等を介して合成音信号を
得、音声出力装置5から合成音声を得る。
【0007】
【発明が解決しようとする課題】従来の方式において、
入力文に対してアクセント変化パターンは高/低の2段
階で与えられる。また音素継続時間長は音韻環境や文節
区切り内モーラ素子によって決められ、発声速度変更の
ため入力文全体の時間長を一律に変化させる。
入力文に対してアクセント変化パターンは高/低の2段
階で与えられる。また音素継続時間長は音韻環境や文節
区切り内モーラ素子によって決められ、発声速度変更の
ため入力文全体の時間長を一律に変化させる。
【0008】ここで、人の発声になる肉声の韻律パター
ンはアクセント変化パターンについては連続的に変化す
るもので、2段階のアクセント変化では粗すぎて音声品
質の向上が望めない。
ンはアクセント変化パターンについては連続的に変化す
るもので、2段階のアクセント変化では粗すぎて音声品
質の向上が望めない。
【0009】また、音素継続時間長については分脈から
各語の持つ意味、感情によって変化するもので、一律の
時間長調節では音声品質を低下させる。
各語の持つ意味、感情によって変化するもので、一律の
時間長調節では音声品質を低下させる。
【0010】本発明の目的は、合成音の自然性を高める
韻律処理方式を提供することにある。
韻律処理方式を提供することにある。
【0011】
【課題を解決するための手段】本発明は、前記課題の解
決を図るため、規則合成方式による音声合成装置におい
て、入力文から音素列データを求めると共に各音素毎に
多段階のアクセント量及び継続時間長変化量を求める手
段と、前記音素列データとアクセント量データからピッ
チパターンを生成すると共に該ピッチパターンと音素列
データからエネルギーパターンを生成し、前記音素列デ
ータの各音素の継続時間長を前記継続時間長変化量に従
って修正する韻律処理手段とを備え、前記韻律処理手段
により生成された各パターンをパラメータとして音声信
号を合成することを特徴とする。
決を図るため、規則合成方式による音声合成装置におい
て、入力文から音素列データを求めると共に各音素毎に
多段階のアクセント量及び継続時間長変化量を求める手
段と、前記音素列データとアクセント量データからピッ
チパターンを生成すると共に該ピッチパターンと音素列
データからエネルギーパターンを生成し、前記音素列デ
ータの各音素の継続時間長を前記継続時間長変化量に従
って修正する韻律処理手段とを備え、前記韻律処理手段
により生成された各パターンをパラメータとして音声信
号を合成することを特徴とする。
【0012】
【作用】アクセント及び継続時間長を3段階以上の多段
階とすることにより、音素列のピッチパターン、エネル
ギーパターン及び継続時間を多段階にして肉声パターン
に近づけた各パラメータを得る。
階とすることにより、音素列のピッチパターン、エネル
ギーパターン及び継続時間を多段階にして肉声パターン
に近づけた各パラメータを得る。
【0013】
【実施例】図1は、本発明の一実施例を示す韻律処理方
式である。ホストコンピュータ1は、入力文の日本語処
理によって各音素についての音素記号とアクセント量と
継続時間長変化量を韻律処理部3に与える。
式である。ホストコンピュータ1は、入力文の日本語処
理によって各音素についての音素記号とアクセント量と
継続時間長変化量を韻律処理部3に与える。
【0014】このうち、アクセント量は3段階以上の多
段階にしたアクセント変化パターンとし、継続時間長変
化量は各音素が持つ一般時間長に対して3段階以上の多
段階の変化量とされる。
段階にしたアクセント変化パターンとし、継続時間長変
化量は各音素が持つ一般時間長に対して3段階以上の多
段階の変化量とされる。
【0015】これら入力データから、ピッチパターン生
成部3Aでは多段階のアクセント量を使った多段階のピ
ッチパターンを生成し、エネルギーパターン生成部3B
においても多段階のピッチパターンを作用させて各音素
の多段階のエネルギーパターンを生成する。また、継続
時間長算出部3Cにより求めた音素毎の継続時間長は多
段階の継続時間長変化量を使って修正部3Dにより音素
毎の継続時間長が多段階に調節される。
成部3Aでは多段階のアクセント量を使った多段階のピ
ッチパターンを生成し、エネルギーパターン生成部3B
においても多段階のピッチパターンを作用させて各音素
の多段階のエネルギーパターンを生成する。また、継続
時間長算出部3Cにより求めた音素毎の継続時間長は多
段階の継続時間長変化量を使って修正部3Dにより音素
毎の継続時間長が多段階に調節される。
【0016】従って、ピッチパターンとエネルギーパタ
ーン及び継続時間は夫々が多段階に調節され、アクセン
トについては連続的に変化する肉声のアクセントパター
ンに近づけたアクセントパラメータを求めることがで
き、同時にエネルギーパターンも肉声に近づけたエネル
ギー変化のパラメータを得ることができる。また、継続
時間についてもモーラ毎の時間長の設定を多段階にし、
分脈(前後のモーラ)に応じて適切でかつ細かい時間長
にした継続時間パラメータを得ることができる。
ーン及び継続時間は夫々が多段階に調節され、アクセン
トについては連続的に変化する肉声のアクセントパター
ンに近づけたアクセントパラメータを求めることがで
き、同時にエネルギーパターンも肉声に近づけたエネル
ギー変化のパラメータを得ることができる。また、継続
時間についてもモーラ毎の時間長の設定を多段階にし、
分脈(前後のモーラ)に応じて適切でかつ細かい時間長
にした継続時間パラメータを得ることができる。
【0017】なお、本実施例ではホストコンピュータ1
は音素列と多段階アクセント、継続時間長データを発生
するもののため、一般の文章処理ではこれらデータの生
成のための処理量が増大し、また韻律処理部3の処理量
も増大するが、特開平4−125696号公報に開示さ
れるように入力文をある程度限定できるものでは処理量
の増大は比較的少なくなり、充分な応答性を得ることが
できる。
は音素列と多段階アクセント、継続時間長データを発生
するもののため、一般の文章処理ではこれらデータの生
成のための処理量が増大し、また韻律処理部3の処理量
も増大するが、特開平4−125696号公報に開示さ
れるように入力文をある程度限定できるものでは処理量
の増大は比較的少なくなり、充分な応答性を得ることが
できる。
【0018】
【発明の効果】以上のとおり、本発明によれば、各音素
についてアクセント及び継続時間を多段階にした韻律処
理を行うようにしたため、音素列のピッチパターン、エ
ネルギーパターン及び継続時間を多段階にした韻律処理
にして肉声のパターンに近づけた韻律処理を得て肉声に
近づけた高品質の合成音を得ることができる。
についてアクセント及び継続時間を多段階にした韻律処
理を行うようにしたため、音素列のピッチパターン、エ
ネルギーパターン及び継続時間を多段階にした韻律処理
にして肉声のパターンに近づけた韻律処理を得て肉声に
近づけた高品質の合成音を得ることができる。
【図1】本発明の一実施例を示す構成図。
【図2】従来の構成図。
1…ホストコンピュータ 3…韻律処理部 4…合成処理部
Claims (1)
- 【請求項1】 規則合成方式による音声合成装置におい
て、 入力文から音素列データを求めると共に各音素毎に多段
階のアクセント量及び継続時間長変化量を求める手段
と、 前記音素列データとアクセント量データからピッチパタ
ーンを生成すると共に該ピッチパターンと音素列データ
からエネルギーパターンを生成し、前記音素列データの
各音素の継続時間長を前記継続時間長変化量に従って修
正する韻律処理手段とを備え、 前記韻律処理手段により生成された各パターンをパラメ
ータとして音声信号を合成することを特徴とする音声合
成装置の韻律処理方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4309116A JPH06161490A (ja) | 1992-11-19 | 1992-11-19 | 音声合成装置の韻律処理方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4309116A JPH06161490A (ja) | 1992-11-19 | 1992-11-19 | 音声合成装置の韻律処理方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06161490A true JPH06161490A (ja) | 1994-06-07 |
Family
ID=17989086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4309116A Pending JPH06161490A (ja) | 1992-11-19 | 1992-11-19 | 音声合成装置の韻律処理方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06161490A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6405169B1 (en) | 1998-06-05 | 2002-06-11 | Nec Corporation | Speech synthesis apparatus |
KR100387232B1 (ko) * | 1996-10-31 | 2003-07-22 | 삼성전자주식회사 | 한국어운율생성장치및방법 |
-
1992
- 1992-11-19 JP JP4309116A patent/JPH06161490A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100387232B1 (ko) * | 1996-10-31 | 2003-07-22 | 삼성전자주식회사 | 한국어운율생성장치및방법 |
US6405169B1 (en) | 1998-06-05 | 2002-06-11 | Nec Corporation | Speech synthesis apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2000163088A (ja) | 音声合成方法および装置 | |
JPH0887296A (ja) | 音声合成装置 | |
JP3437064B2 (ja) | 音声合成装置 | |
JPH06161490A (ja) | 音声合成装置の韻律処理方式 | |
JP2003140678A (ja) | 合成音声の音質調整方法と音声合成装置 | |
JP3113101B2 (ja) | 音声合成装置 | |
JP2596416B2 (ja) | 文・音声変換装置 | |
JPH0580791A (ja) | 音声規則合成装置および方法 | |
JP3265654B2 (ja) | 音声合成装置の継続時間長処理方式 | |
JP2703253B2 (ja) | 音声合成装置 | |
JPH06161493A (ja) | 音声合成装置の長音処理方式 | |
JP3368948B2 (ja) | 音声規則合成装置 | |
JP2573586B2 (ja) | 規則型音声合成装置 | |
JP2755478B2 (ja) | テキスト音声合成装置 | |
JPH01321496A (ja) | 音声合成装置 | |
JP2995814B2 (ja) | 音声合成方法 | |
JP3218639B2 (ja) | 規則音声合成装置におけるエネルギ制御方法 | |
JPH06175675A (ja) | 音声合成装置の継続時間長制御方法 | |
JPH06250685A (ja) | 音声合成方式および規則合成装置 | |
JPH0553595A (ja) | 音声合成装置 | |
KR100429978B1 (ko) | 음성합성시스템의음질저하방지장치 | |
JP2573585B2 (ja) | 音声スペクトルパタン生成装置 | |
JP2573587B2 (ja) | ピッチパタン生成装置 | |
JPH07129188A (ja) | 音声合成装置 | |
JPH04214600A (ja) | 音声合成方法 |