JPH06161493A - 音声合成装置の長音処理方式 - Google Patents

音声合成装置の長音処理方式

Info

Publication number
JPH06161493A
JPH06161493A JP4309118A JP30911892A JPH06161493A JP H06161493 A JPH06161493 A JP H06161493A JP 4309118 A JP4309118 A JP 4309118A JP 30911892 A JP30911892 A JP 30911892A JP H06161493 A JPH06161493 A JP H06161493A
Authority
JP
Japan
Prior art keywords
phoneme
long
data
long sound
duration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4309118A
Other languages
English (en)
Inventor
Kazuya Hasegawa
和也 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP4309118A priority Critical patent/JPH06161493A/ja
Publication of JPH06161493A publication Critical patent/JPH06161493A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 長音を含む入力文に対して自然性を高めた合
成音声を得る。 【構成】 入力文について、日本語処理部2は長音も1
つの音素とした音素列データと各音素の多段階アクセン
ト量及び多段階継続時間長変化量データを求め、各音素
のピッチパターンデータファイル3A2には長音も含め
た個別のピッチパターンデータを用意して非長音と区別
した長音のピッチパターンを生成処理部3A1で生成
し、継続時間長についても時間長データファイル3C2
に長音のデータを用意し、変化量データに従って音素定
数テーブルファイル3C3による継続時間の補正に非長
音と区別した補正をし、これにより非長音と区別した長
音に対する合成音声を得る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、規則合成方式の音声合
成装置において、ホストコンピュータ等から入力された
文字コードを韻律パラメータに変換する韻律処理のうち
長音処理方式に関する。
【0002】
【従来の技術】規則合成方式の音声合成装置は、入力文
字列を構文解析や形態素解析によって単語・文節に区切
ると共にイントネーションやアクセントを決定し、単語
や文節を音節や音素にまで分解し、音節又は音素単位の
音源波及び調音フィルタのパラメータを求め、音源波に
対する調音フィルタの応答出力として合成音声を得る。
【0003】韻律処理にはイントネーションやアクセン
トや生成するピッチパターンによって音節や音素単位の
ピッチ周波数(基本周波数)を調節したピッチパターン
パラメータ生成と、各音の強さを調節するエネルギーパ
ターンパラメータ生成と、各音の強さを調節する継続時
間長パラメータ生成などを行う。
【0004】図2は従来の規則音声合成方式による韻律
処理方式を示す。ホイストコンピュータ1等から与えら
れる漢字かな混じり文に対し、日本語処理部2により構
文解析や形態素解析によってイントネーションを含むア
クセント決定と音素列データの生成をする。
【0005】韻律処理部3は音素列データの各音素につ
いてアクセントデータからピッチ周波数を決定するピッ
チパターン生成部3Aと、各音素についてその基本エネ
ルギーデータをピッチパターンパラメータから決定する
エネルギーパターン生成部3Bと、各音素についてその
継続時間長を決定する時間長算出部3Cとを備える。
【0006】合成処理部4は韻律処理結果としての各パ
ラメータから調音フィルタ等を介して合成音信号を得、
音声出力装置5から合成音声を得る。
【0007】
【発明が解決しようとする課題】従来の方式において、
入力文に対してアクセント変化パターンは高/低の2段
階で与えられる。また音素継続時間長は音韻環境や文節
区切り内モーラ数によって決められ、発声速度変更のた
め入力文全体の時間長を一律に変化させる。
【0008】ここで、人の発声になる肉声の韻律パター
ンはアクセント変化パターンについては連続的に変化す
るもので、2段階のアクセント変化では粗すぎて音声品
質の向上が望めない。この点については多段階のアクセ
ントパターンを与える方式を本願出願人は既に提案して
いる。
【0009】この多段階アクセント方式も含めて、長音
と非長音に対するアクセント変化部分は一律に与えられ
るものであった。
【0010】しかしながら、アクセント即ち音素に与え
られるピッチパターンはアクセント変化をする部分では
人が発声した長音には変化量最大点が母音重心部よりも
前方にあるのに対し、非長音では母音重心部付近にある
という違いがあり、従来方式では合成音に不自然性が表
れる。
【0011】同様に、音素継続時間長については、長音
では局所的な強調や抑制をした場合に非長音の変化幅に
比べて大きく変化し、例えば母音部変化幅>有声子音部
変化幅>無声子音部変化幅の関係が見られる。
【0012】本発明の目的は、長音を含む入力文に対し
て自然性を高めた合成音声を得る長音処理方式を提供す
ることにある。
【0013】
【課題を解決するための手段】本発明は、前記課題の解
決を図るため、規則合成方式による音声合成装置におい
て、入力文から長音も1つの音素とした音素列データと
各音素の多段階アクセント量データ及び多段階継続時間
長変化量を求める手段と、前記音素列データとアクセン
ト量データから長音も含めたピッチパターンを生成する
手段と、前記音素列データと継続時間長変化量から長音
も含めた音素継続時間長を算出する手段とを備え、前記
ピッチパターンと音素継続時間長及び音素のエネルギー
パターンをパラメータとして音声信号を合成することを
特徴とする。
【0014】
【作用】音素列データには長音も1つの音素として生成
し、この長音に対応づけてピッチパターンデータ及び継
続時間長変化量補正分データを用意しておき、長音に対
するピッチパターン及び継続時間を非長音とは区別して
生成する。
【0015】
【実施例】図1は本発明の一実施例を示す韻律処理方式
である。日本語処理部2は、アクセントとして多段階
(3以上)のアクセントパターンと音素列データ及び各
音素についての多段階の音素継続時間長変化量を発生す
る。このとき、長音も1つの音素データとして処理す
る。
【0016】ピッチパターン生成処理部3A1とピッチ
パターンデータファイル3A2からなるピッチパターン
生成部は、ファイル3A2に各音素のアクセント基本デ
ータを有し、このデータを当該音素とその前後(先行音
素,後続音素)との関係及び多段階アクセントに従って
ピッチパターンを調節する。
【0017】この調節に際し、ピッチパターンデータフ
ァイル3A2には人の音声のピッチパターン分析に従っ
たデータが保存されるが、このデータには非長音と区別
した長音も含めたデータが追加される。そして、日本語
処理部2から与えられる音素には長音と非長音を含めた
多段階アクセントコードが与えられ、このコードによっ
て生成されるピッチパターンデータも長音と非長音が区
別されたものにされる。
【0018】例えば、長音を2つ含む「東京」の例では
音素列は「’ト’’ー’’キョ’’ー’」の4つで与え
られ、それに対するアクセントパターンには5段階の場
合には「2443」が与えられる。
【0019】次に、音素継続時間長算出処理部3C1
時間長データファイル3C2及び音素定数テーブル3C3
からなる時間長算出部は、当該音素の時間長データを基
本継続時間長とし、日本語処理部から与えられる音素継
続時間長変化量と人の音声の継続時間長を統計処理した
音素定数データを使って基本継続時間長を補正するが、
音素定数テーブルファイル3C3のデータには長音も含
めたデータが追加され、長音と非長音が区別された継続
時間長補正がなされる。
【0020】このとき、日本語処理部2からの多段階の
音素継続時間長変化量がコードとして音素列データと共
に与えられ、例えば前述の「東京」の例では変化量コー
ド「2334」が与えられる。
【0021】従って、長音を含む入力文に対する韻律処
理には長音専用のピッチパターン及び音素継続時間長補
正量によって非長音と区別したパラメータを得ることが
でき、長音が入力されたときに人の音声に近づけたピッ
チパターン及び継続時間長にして自然性の高い合成音声
を得ることができる。
【0022】
【発明の効果】以上のとおり、本発明によれば、長音を
1つの音素としてそのピッチパターン及び継続時間長を
非長音と区別して生成するようにしたため、以下の効果
がある。
【0023】(1)長音が入力された場合、より自然な
ピッチパターンが生成できる。
【0024】(2)長音が入力された場合、より精密に
音素継続時間長の局所的な強調や抑制が実現できる。
【0025】(3)以上より、長音が入力された場合、
自然な合成音声が得られる。
【図面の簡単な説明】
【図1】本発明の一実施例を示す構成図。
【図2】従来の構成図。
【符号の説明】
2…日本語処理部 3…韻律処理部 4…合成処理部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 規則合成方式による音声合成装置におい
    て、 入力文から長音も1つの音素とした音素列データと各音
    素の多段階アクセント量データ及び多段階継続時間長変
    化量を求める手段と、 前記音素列データとアクセント量データから長音も含め
    たピッチパターンを生成する手段と、 前記音素列データと継続時間長変化量から長音も含めた
    音素継続時間長を算出する手段とを備え、 前記ピッチパターンと音素継続時間長及び音素のエネル
    ギーパターンをパラメータとして音声信号を合成するこ
    とを特徴とする音声合成装置の長音処理方式。
JP4309118A 1992-11-19 1992-11-19 音声合成装置の長音処理方式 Pending JPH06161493A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4309118A JPH06161493A (ja) 1992-11-19 1992-11-19 音声合成装置の長音処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4309118A JPH06161493A (ja) 1992-11-19 1992-11-19 音声合成装置の長音処理方式

Publications (1)

Publication Number Publication Date
JPH06161493A true JPH06161493A (ja) 1994-06-07

Family

ID=17989109

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4309118A Pending JPH06161493A (ja) 1992-11-19 1992-11-19 音声合成装置の長音処理方式

Country Status (1)

Country Link
JP (1) JPH06161493A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7185140B2 (en) 2002-12-25 2007-02-27 Spansion, Llc Method for storing in nonvolatile memory and storage unit

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7185140B2 (en) 2002-12-25 2007-02-27 Spansion, Llc Method for storing in nonvolatile memory and storage unit

Similar Documents

Publication Publication Date Title
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JPH06161493A (ja) 音声合成装置の長音処理方式
JP2596416B2 (ja) 文・音声変換装置
JP3113101B2 (ja) 音声合成装置
JP3233036B2 (ja) 歌唱音合成装置
JPH0580791A (ja) 音声規則合成装置および方法
JPH06161490A (ja) 音声合成装置の韻律処理方式
JP2703253B2 (ja) 音声合成装置
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JP3265654B2 (ja) 音声合成装置の継続時間長処理方式
JP2848604B2 (ja) 音声合成装置
JP3078073B2 (ja) 基本周波数パタン生成方法
JPH01321496A (ja) 音声合成装置
JP3465326B2 (ja) 音声合成装置
JP2573586B2 (ja) 規則型音声合成装置
JP2725381B2 (ja) 音声合成装置の抑揚制御方式
JPH056191A (ja) 音声合成装置
JPH04149500A (ja) テキスト音声合成装置
JPH0553595A (ja) 音声合成装置
JP3722136B2 (ja) 音声合成装置
JPH01112297A (ja) 音声合成装置
Maeda Vocal-tract acoustics and speech synthesis
JPH06138894A (ja) 音声合成装置及び音声合成方法
JPH07129188A (ja) 音声合成装置
JPH0727392B2 (ja) 音声合成装置