JP3265654B2 - 音声合成装置の継続時間長処理方式 - Google Patents
音声合成装置の継続時間長処理方式Info
- Publication number
- JP3265654B2 JP3265654B2 JP30741092A JP30741092A JP3265654B2 JP 3265654 B2 JP3265654 B2 JP 3265654B2 JP 30741092 A JP30741092 A JP 30741092A JP 30741092 A JP30741092 A JP 30741092A JP 3265654 B2 JP3265654 B2 JP 3265654B2
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- duration
- pattern
- string data
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
【0001】
【産業上の利用分野】本発明は、規則合成方式の音声合
成装置において、ホストコンピュータ等から入力された
文字コードを韻律パラメータに変換する韻律処理のうち
音素継続時間長処理方式に関する。
成装置において、ホストコンピュータ等から入力された
文字コードを韻律パラメータに変換する韻律処理のうち
音素継続時間長処理方式に関する。
【0002】
【従来の技術】規則合成方式の音声合成装置は、入力文
字列を構文解析や形態素解析によって単語・文節に区切
ると共にイントネーションやアクセントを決定し、単語
や文節を音節や音素にまで分解し、音節又は音素単位の
音源波に対する調音フィルタのパラメータを求め、音源
波に対する調音フィルタの応答出力として合成音声を得
る。
字列を構文解析や形態素解析によって単語・文節に区切
ると共にイントネーションやアクセントを決定し、単語
や文節を音節や音素にまで分解し、音節又は音素単位の
音源波に対する調音フィルタのパラメータを求め、音源
波に対する調音フィルタの応答出力として合成音声を得
る。
【0003】韻律処理にはイントネーションやアクセン
トや生成するピッチパターンによって音節や音素単位の
ピッチ周波数(基本周波数)を調節したピッチパターン
パラメータ生成と、各音の強さを調節するエネルギーパ
ターンパラメータ生成と、各音の長さを調節する継続時
間長パラメータ生成などを行う。
トや生成するピッチパターンによって音節や音素単位の
ピッチ周波数(基本周波数)を調節したピッチパターン
パラメータ生成と、各音の強さを調節するエネルギーパ
ターンパラメータ生成と、各音の長さを調節する継続時
間長パラメータ生成などを行う。
【0004】図2は従来の規則音声合成方式による韻律
処理方式を示す。ホストコンピュータ1等から与えられ
る漢字かな混じり文に対し、日本語処理部2により構文
解析や形態素解析によってイントネーションを含むアク
セント決定と音素列データの生成をする。
処理方式を示す。ホストコンピュータ1等から与えられ
る漢字かな混じり文に対し、日本語処理部2により構文
解析や形態素解析によってイントネーションを含むアク
セント決定と音素列データの生成をする。
【0005】韻律処理部3は音素列データの各音素につ
いてアクセントデータからピッチ周波数を決定するピッ
チパターン生成部3Aと、各音素についてその基本エネ
ルギーデータをピッチパターンパラメータから決定する
エネルギーパターン生成部3Bと、各音素についてその
継続時間長を決定する時間長算出部3Cとを備える。
いてアクセントデータからピッチ周波数を決定するピッ
チパターン生成部3Aと、各音素についてその基本エネ
ルギーデータをピッチパターンパラメータから決定する
エネルギーパターン生成部3Bと、各音素についてその
継続時間長を決定する時間長算出部3Cとを備える。
【0006】合成処理部4は韻律処理結果としての各パ
ラメータから調音フィルター等を介して合成音信号を
得、音声出力装置5から合成音声を得る。
ラメータから調音フィルター等を介して合成音信号を
得、音声出力装置5から合成音声を得る。
【0007】
【発明が解決しようとする課題】従来の方式において、
音素継続時間長は音韻環境や文節区切り内モーラ数によ
って決められ、発生速度変更のため人力文全体の時間長
を一律に変化させる。
音素継続時間長は音韻環境や文節区切り内モーラ数によ
って決められ、発生速度変更のため人力文全体の時間長
を一律に変化させる。
【0008】しかし、人の発生になる肉声の韻律パター
ンは、声の高さ・大きさ・長さに局所的な強調や抑制が
表れるもので、このうち長さについて着目すると従来方
式の一律の時間調節では音声品質を低下させる。
ンは、声の高さ・大きさ・長さに局所的な強調や抑制が
表れるもので、このうち長さについて着目すると従来方
式の一律の時間調節では音声品質を低下させる。
【0009】継続時間長の局所的な変化は、テキスト入
力形の規則合成装置で用いられている。また、従来の日
本語処理方式では規則化のための研究が進められている
が、実用には至っていない。
力形の規則合成装置で用いられている。また、従来の日
本語処理方式では規則化のための研究が進められている
が、実用には至っていない。
【0010】本発明の目的は、音素継続時間長に局所的
な強調・抑制を得て自然性の高い合成音を得る継続時間
長処理方式を提供することにある。
な強調・抑制を得て自然性の高い合成音を得る継続時間
長処理方式を提供することにある。
【0011】
【課題を解決するための手段】本発明は、前記課題の解
決を図るため、規則合成方式による音声合成装置におい
て、入力文から音素別データと各音素のアクセント量デ
ータ及び継続時間長変化量を求める手段と、前記音素列
データとアクセント量データからピッチパターンを生成
すると共に該ピッチパターンと音素列データからエネル
ギーパターンを生成し、前記音素継続時間長変化量nと
該変化量の最大値N及び各音素によって決められた定素
子Aonsoから次式
決を図るため、規則合成方式による音声合成装置におい
て、入力文から音素別データと各音素のアクセント量デ
ータ及び継続時間長変化量を求める手段と、前記音素列
データとアクセント量データからピッチパターンを生成
すると共に該ピッチパターンと音素列データからエネル
ギーパターンを生成し、前記音素継続時間長変化量nと
該変化量の最大値N及び各音素によって決められた定素
子Aonsoから次式
【0012】
【数2】L2=Aonso×(n−N/2) に従って補正値L2を求め、この補正値L2を前記音素
列データの各音素に決められた継続時間長算出値L1に
加算補正して継続時間長パターンを生成する韻律処理手
段とを備え、前記韻律処理手段により生成された各パタ
ーンをパラメータとして音声信号を合成することを特徴
とする
列データの各音素に決められた継続時間長算出値L1に
加算補正して継続時間長パターンを生成する韻律処理手
段とを備え、前記韻律処理手段により生成された各パタ
ーンをパラメータとして音声信号を合成することを特徴
とする
【0013】
【作用】音素に予め決められた一般の継続時間を継続時
間変化量で補正することにより局所的に強調・抑制した
合成音が得られるようにする。
間変化量で補正することにより局所的に強調・抑制した
合成音が得られるようにする。
【0014】
【実施例】図1は本発明の一実施例を示す韻律処理方式
である。日本語処理部2はアクセントと音素列データの
ほかに各音素についての継続時間長変化量nを発生す
る。継続時間長変化量nは各音素が持つ一般時間長に対
して多段階の変化量とされ、日本語処理での分脈等から
決定される。
である。日本語処理部2はアクセントと音素列データの
ほかに各音素についての継続時間長変化量nを発生す
る。継続時間長変化量nは各音素が持つ一般時間長に対
して多段階の変化量とされ、日本語処理での分脈等から
決定される。
【0015】韻律処理部3には補正値算出部3Dと補正
部3Eが増設される。補正値算出部3Dは、各音素につ
いて継続時間長変化量nにより補正長L2を下記式
部3Eが増設される。補正値算出部3Dは、各音素につ
いて継続時間長変化量nにより補正長L2を下記式
【0016】
【数3】L2=Aonso×(n−N/2)……(1) 但し、Aonso;当該音素によって決まる定数 N;変化量nの最大値 によって求める。
【0017】この(1)式から、入力された変化量nが
最大値Nの中間値N/2より大きい場合は正の補正値L
2、逆に小さい場合は負の補正値L2を得る。
最大値Nの中間値N/2より大きい場合は正の補正値L
2、逆に小さい場合は負の補正値L2を得る。
【0018】補正部3Eは、継続時間長算出部3Cで求
める各音素の一般時間長(局所的な強調や抑制のない時
間長)L1と補正値算出部3Dからの補正値±L2を加
算した音素継続時間時間長L3を求める。
める各音素の一般時間長(局所的な強調や抑制のない時
間長)L1と補正値算出部3Dからの補正値±L2を加
算した音素継続時間時間長L3を求める。
【0019】
【数4】L3=L1±L2……(2) 補正部3Eで求めた継続時間長L3は、ピッチパターン
パラメータ、エネルギパターンパラメータと共に継続時
間長パラメータとして合成処理部4に与えられる。
パラメータ、エネルギパターンパラメータと共に継続時
間長パラメータとして合成処理部4に与えられる。
【0020】本実施例によれば、音素継続時間長は、音
素に定める一律の継続時間長L1が補正値L2によって
補正され、変化量nが最大値Nの中間値より大きい場合
には当該モーラを構成する音素継続時間長を長くし、逆
に中間値より小さければ短くする。
素に定める一律の継続時間長L1が補正値L2によって
補正され、変化量nが最大値Nの中間値より大きい場合
には当該モーラを構成する音素継続時間長を長くし、逆
に中間値より小さければ短くする。
【0021】これにより、局所的に強調や抑制が施され
た音素継続時間長L3を得て局所的に強調や抑制がなさ
れた合成音声を得ることができる。
た音素継続時間長L3を得て局所的に強調や抑制がなさ
れた合成音声を得ることができる。
【0022】なお、音素継続時間長nはホストコンピュ
ータ1から求めることもできる。
ータ1から求めることもできる。
【0023】
【発明の効果】以上のとおり、本発明によれば、音素の
継続時間長を音素列の変化量nに従って補正して継続時
間長パラメータを求めるようにしたため、継続時間から
局所的な強調や抑制を得て自然性の高い合成音声を得る
ことができる。
継続時間長を音素列の変化量nに従って補正して継続時
間長パラメータを求めるようにしたため、継続時間から
局所的な強調や抑制を得て自然性の高い合成音声を得る
ことができる。
【図1】本発明の一実施例を示す構成図。
【図2】従来の構成図。
2…日本語処理部 3…韻律処理部 4…合成処理部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭61−84699(JP,A) 特開 昭61−118798(JP,A) 特開 昭62−284397(JP,A) 特開 平3−161800(JP,A) 特開 平4−58296(JP,A) 特開 平4−125696(JP,A) 特開 平4−170600(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 13/00 - 13/08
Claims (1)
- 【請求項1】 規則合成方式による音声合成装置におい
て、 入力文から音素列データと各音素のアクセント量データ
及び継続時間長変化量を求める手段と、 前記音素列データとアクセント量データからピッチパタ
ーンを生成すると共に該ピッチパターンと音素列データ
からエネルギーパターンを生成し、前記音素継続時間長
変化量nと該変化量の最大値N及び各音素によって決め
られた定素子Aonsoから次式 【数1】L2=Aonso×(n−N/2) に従って補正値L2を求め、この補正値L2を前記音素
列データの各音素に決められた継続時間長算出値L1に
加算補正して継続時間長パターンを生成する韻律処理手
段とを備え、前記韻律処理手段により生成された各パタ
ーンをパラメータとして音声信号を合成することを特徴
とする音声合成装置の継続時間長処理方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30741092A JP3265654B2 (ja) | 1992-11-18 | 1992-11-18 | 音声合成装置の継続時間長処理方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30741092A JP3265654B2 (ja) | 1992-11-18 | 1992-11-18 | 音声合成装置の継続時間長処理方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06161491A JPH06161491A (ja) | 1994-06-07 |
JP3265654B2 true JP3265654B2 (ja) | 2002-03-11 |
Family
ID=17968725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP30741092A Expired - Fee Related JP3265654B2 (ja) | 1992-11-18 | 1992-11-18 | 音声合成装置の継続時間長処理方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3265654B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030083903A (ko) * | 2002-04-23 | 2003-11-01 | 엘지전자 주식회사 | 텍스트/음성변환을 위한 음소 경계 조정방법 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1996042079A1 (en) * | 1995-06-13 | 1996-12-27 | British Telecommunications Public Limited Company | Speech synthesis |
-
1992
- 1992-11-18 JP JP30741092A patent/JP3265654B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030083903A (ko) * | 2002-04-23 | 2003-11-01 | 엘지전자 주식회사 | 텍스트/음성변환을 위한 음소 경계 조정방법 |
Also Published As
Publication number | Publication date |
---|---|
JPH06161491A (ja) | 1994-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6366884B1 (en) | Method and apparatus for improved duration modeling of phonemes | |
JPH0632020B2 (ja) | 音声合成方法および装置 | |
JP3265654B2 (ja) | 音声合成装置の継続時間長処理方式 | |
JPH04199098A (ja) | 規則音声合成装置 | |
JP2740510B2 (ja) | テキスト音声合成方式 | |
JPH06161490A (ja) | 音声合成装置の韻律処理方式 | |
JP3113101B2 (ja) | 音声合成装置 | |
JP3186263B2 (ja) | 音声合成装置のアクセント処理方式 | |
JPH05134691A (ja) | 音声合成方法および装置 | |
JP2703253B2 (ja) | 音声合成装置 | |
JP2725381B2 (ja) | 音声合成装置の抑揚制御方式 | |
JP3031691B2 (ja) | 音声規則合成装置 | |
JP3614874B2 (ja) | 音声合成装置及び方法 | |
JP3397406B2 (ja) | 音声合成装置及び音声合成方法 | |
JP3303428B2 (ja) | 音声合成装置のアクセント成分基本テーブルの作成方法 | |
JP3235747B2 (ja) | 音声合成装置及び音声合成方法 | |
JP3077981B2 (ja) | 基本周波数パタン生成装置 | |
JP2995774B2 (ja) | 音声合成方式 | |
JPH06161493A (ja) | 音声合成装置の長音処理方式 | |
JPH02236600A (ja) | 合成音声情緒付与回路 | |
JP2573587B2 (ja) | ピッチパタン生成装置 | |
JPH06308999A (ja) | 音声合成装置 | |
JP2961819B2 (ja) | 音声合成装置の抑揚制御方法 | |
Yaohua et al. | The study of prosodic adjustment in Chinese speech synthesis | |
JPH07129188A (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |