JP2995814B2 - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JP2995814B2
JP2995814B2 JP2198448A JP19844890A JP2995814B2 JP 2995814 B2 JP2995814 B2 JP 2995814B2 JP 2198448 A JP2198448 A JP 2198448A JP 19844890 A JP19844890 A JP 19844890A JP 2995814 B2 JP2995814 B2 JP 2995814B2
Authority
JP
Japan
Prior art keywords
phoneme
pattern
energy
energy pattern
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2198448A
Other languages
English (en)
Other versions
JPH0483298A (ja
Inventor
喜正 沢田
清 石田
和也 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Original Assignee
Meidensha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp filed Critical Meidensha Corp
Priority to JP2198448A priority Critical patent/JP2995814B2/ja
Publication of JPH0483298A publication Critical patent/JPH0483298A/ja
Application granted granted Critical
Publication of JP2995814B2 publication Critical patent/JP2995814B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 A.産業上の利用分野 この発明は、日本文テキストから音声を合成する装置
に係わり、特に音声のエネルギパターンを生成する音声
合成装置に関する。
B.発明の概要 この発明は、日本語文を解析して音声のエネルギパタ
ーン等を生成し、音声を合成する装置において、 複数のエネルギ目標値からなる音韻エネルギパターン
を使用し、さらに当該音韻だけでなく先行音韻および後
続音韻も考慮したものとすることにより、 自然性の高いエネルギパターンを生成できるようにし
たものである。
C.従来の技術 規則音声合成は、任意の単語,文章等を漢字かな混じ
りのテキストより音声として合成する手法である。
第2図は、一般的な音声合成装置の概要を示す。ま
ず、テキスト入力部1に入力されたテキストを、日本語
処理部2により音素記号列に変換する。
次に、この音素記号列から、韻律パターン(継続時間
長パターン・ピッチパターン・エネルギパターン)を生
成する。
すなわち、継続時間長パターン生成部3により、継続
時間長パターンデータベース4を参照し、音声の継続時
間を示す継続時間長パターンを生成する。
同様に、ピッチパターン生成部5により、ピッチパタ
ーンデータベース6を参照し、音声の高さを示すピッチ
パターンを生成する。
また同様に、エネルギパターン生成部7により、エネ
ルギパターンデータベース8を参照し、音声の強さを示
すエネルギパターンを生成する。
このようにして得られた各音韻パターンに基づいて、
音声合成部9により、音声データベース10を参照し、音
声波形を合成する。なお11は、合成音声を出力する音声
出力部である。
従来は、エネルギパターンを生成するにあたって、エ
ネルギパターンを音節(子音+母音)単位で把握・処理
していた。
つまり、標準となるエネルギパターン(エネルギ目標
値)を音節単位であらかじめ設定し、エネルギパターン
データベース8に格納しておき、このエネルギパターン
に基づいて音節ごとに目標値を求めることによりエネル
ギパターンを生成していた。
D.発明が解決しようとする課題 しかしながら上記した従来の技術では、エネルギパタ
ーンとして1音節につき1目標値しか決定できないの
で、細かな制御ができなかった。
また、人間の発音する音声波形パターンは、一つの音
韻についてみると、その音韻だけで決定されるのではな
く、その前後の音韻の影響を受けて大きく変化してい
る。
さらに、その音韻のピッチや継続時間長の影響も受け
て変化している。たとえば、異なる継続時間長の音声を
同一のエネルギデータで制御すると、継続時間長が長い
場合は、エネルギの立ち上がりがなだらかになり過ぎて
間延びして聞こえ、継続時間長が短い場合は、エネルギ
の立ち上がりが急峻になり過ぎて異音に聞こえてしま
う。
ところが従来の技術では、各音節に付された固定値を
もってエネルギパターンを決定しているため、前後の音
韻やその音韻のピッチ・継続時間長の影響を考慮するこ
とができなかった。
これらの問題により、合成音声の自然性、特にエネル
ギパターンの自然性が劣化していた。
この発明は、このような事情に鑑み、エネルギパター
ンの生成手段を改善し、合成音声の自然性を向上させる
ことを目的とする。
E.課題を解決するための手段および作用 この発明は、上記の目的を達成するために、日本語処
理手段(2)、継続時間長生成手段(3、4)、ピッチ
パターン生成手段(5、6)、エネルギパターンデータ
ベース(8)、エネルギパターン生成手段(7)、音声
合成手段(9、10)を備える音声合成装置であって、 日本語処理手段(2)は、入力文字列を解析して音韻
列に変換出力し、 継続時間長生成手段(3、4)は、入力される音韻列
から音韻毎の継続時間長を出力し、 ピッチパターン生成手段(5、6)は、入力される音
韻列から音韻毎のピッチパターンを出力し、 エネルギパターンデータベース(8)は、先行音韻と
後続音韻に対応づけて当該音韻のエネルギパターンを記
憶し、 エネルギパターン生成手段(7)は、入力される音韻
列からエネルギパターンデータベース(8)を参照して
音韻毎のエネルギパターンを出力し、 音声合成手段(9、10)は、入力される音韻毎の継続
時間長、ピッチパターン、エネルギパターンに基づいて
合成音声を生成することを特徴とするものである。
F.実施例 以下、この発明の実施例を説明する。
第1図の実施例では、第2図に示す規則音声合成装置
において、音素単位でエネルギパターンを設定してい
る。
次の表は、エネルギパターンの構成例を示す。
この表の1行目を説明すると、音素「A」について、
先行音素がなく(当該音素「A」が立ち上がり部である
場合)、後続音素が「A」であるとき、そのエネルギパ
ターンは「0−10−70−80−100−100」となることを示
す。
この実施例では、各音素について、6点ないし4点の
目標値をもって音声波形に対して近似することによりエ
ネルギパターンを生成している。音素が母音である場
合、6点の目標値E[0]〜E[5]をとり、音素が子
音である場合、4点の目標値E[0]〜E[3]をとっ
ている。
この表の例えば1行目および2行目を比較すれば判る
ように、同一の音素「A」の場合でも、後続音素が
「A」か「I」かでエネルギパターンが異なる。
それゆえ、先行音素,当該音素および後続音素の一連
の音素に対応付けて、人間の発音した音声波形からエネ
ルギパターンを抽出し、エネルギパターンデータベース
8を作成することとしている。
エネルギパターンを抽出する際は、アクセントやピッ
チなど、エネルギに影響を与える要因をできる限り排除
することにより、自然性の精度の高いパターンを得るこ
とができる。そして、音声合成の際のエネルギパターン
生成にあたっては、入力文字列から上記の一連の音素を
識別し、その一連の音素に対応付けられたエネルギパタ
ーンを読み出すことになる。
第1図は、この実施例による音声合成の一例を示す。
テキスト入力部1に入力されたテキストが「今日の天
気は晴れです」であるとすると、日本語処理部2により
この文の発音を示す解析データが生成される。この解析
データに基づいて、エネルギパターン生成部7は、母音
については6点の目標値、子音については4点の目標値
をもつ音韻エネルギパターンを合成してエネルギパター
ンを生成する。
G.発明の効果 以上説明したように、この発明によれば、各音韻のエ
ネルギパターンを、当該音韻だけでなく先行音韻および
後続音韻に対応付けて記憶することにより、先行音韻や
後続音韻によるエネルギ変化を考慮した音声合成が可能
となる。
【図面の簡単な説明】
第1図は実施例による音声合成を示す説明図、第2図は
規則音声合成装置の一般的な構成を示すブロック図であ
る。 2……日本語処理部、3……継続時間長パターン生成
部、4……継続時間長パターンデータベース、5……ピ
ッチパターン生成部、6……ピッチパターンデータベー
ス。7……エネルギパターン生成部、8……エネルギパ
ターンデータベース、9……音声合成部、10……音声デ
ータベース、11……音声出力部。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 5/02 G10L 5/04 G10L 3/00

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】日本語処理手段(2)、継続時間長生成手
    段(3、4)、ピッチパターン生成手段(5、6)、エ
    ネルギパターンデータベース(8)、エネルギパターン
    生成手段(7)、音声合成手段(9、10)を備える音声
    合成装置であって、 日本語処理手段(2)は、入力文字列を解析して音韻列
    に変換出力し、 継続時間長生成手段(3、4)は、入力される音韻列か
    ら音韻毎の継続時間長を出力し、 ピッチパターン生成手段(5、6)は、入力される音韻
    列から音韻毎のピッチパターンを出力し、 エネルギパターンデータベース(8)は、先行音韻と後
    続音韻に対応づけて当該音韻のエネルギパターンを記憶
    し、 エネルギパターン生成手段(7)は、入力される音韻列
    からエネルギパターンデータベース(8)を参照して音
    韻毎のエネルギパターンを出力し、 音声合成手段(9、10)は、入力される音韻毎の継続時
    間長、ピッチパターン、エネルギパターンに基づいて合
    成音声を生成することを特徴とする音声合成装置。
JP2198448A 1990-07-26 1990-07-26 音声合成方法 Expired - Lifetime JP2995814B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2198448A JP2995814B2 (ja) 1990-07-26 1990-07-26 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2198448A JP2995814B2 (ja) 1990-07-26 1990-07-26 音声合成方法

Publications (2)

Publication Number Publication Date
JPH0483298A JPH0483298A (ja) 1992-03-17
JP2995814B2 true JP2995814B2 (ja) 1999-12-27

Family

ID=16391268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2198448A Expired - Lifetime JP2995814B2 (ja) 1990-07-26 1990-07-26 音声合成方法

Country Status (1)

Country Link
JP (1) JP2995814B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003079962A (ja) * 2001-09-11 2003-03-18 Microjenics Inc まぶた動作装置

Also Published As

Publication number Publication date
JPH0483298A (ja) 1992-03-17

Similar Documents

Publication Publication Date Title
JP3720136B2 (ja) ピッチ輪郭を決定するためのシステムおよび方法
JP3361066B2 (ja) 音声合成方法および装置
US6829581B2 (en) Method for prosody generation by unit selection from an imitation speech database
JPH0887296A (ja) 音声合成装置
JP2995814B2 (ja) 音声合成方法
van Rijnsoever A multilingual text-to-speech system
JPH10510065A (ja) 多言語テキスト音声合成のための二連音を生成及び利用する方法及びデバイス
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JPH05224688A (ja) テキスト音声合成装置
JP3308875B2 (ja) 音声合成方法および装置
JP2848604B2 (ja) 音声合成装置
JP2001100777A (ja) 音声合成方法及び装置
Suh et al. Toshiba English text-to-speech synthesizer (TESS)
JPH09146576A (ja) 原文対音声の人工的神経回路網にもとづく韻律の合成装置
Akintola et al. Machine to Man Communication in Yorùbá Language
JP3267659B2 (ja) 日本語音声合成方法
Khudoyberdiev The Algorithms of Tajik Speech Synthesis by Syllable
JPH09292897A (ja) 音声合成装置
Kuo et al. An NN-based approach to prosody generation for English word spelling in English-Chinese bilingual TTS
JPH08160983A (ja) 音声合成装置
JPH04250498A (ja) 音声合成装置
JPS60216394A (ja) 音声合成方式
JPH08160990A (ja) 音声合成装置
Thomas Automatic generation of French speech
JPH0518120B2 (ja)