JPH01321497A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH01321497A
JPH01321497A JP63157541A JP15754188A JPH01321497A JP H01321497 A JPH01321497 A JP H01321497A JP 63157541 A JP63157541 A JP 63157541A JP 15754188 A JP15754188 A JP 15754188A JP H01321497 A JPH01321497 A JP H01321497A
Authority
JP
Japan
Prior art keywords
tone component
word
control point
tone
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63157541A
Other languages
English (en)
Other versions
JP3023957B2 (ja
Inventor
Nobuyoshi Umiki
延佳 海木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP63157541A priority Critical patent/JP3023957B2/ja
Publication of JPH01321497A publication Critical patent/JPH01321497A/ja
Application granted granted Critical
Publication of JP3023957B2 publication Critical patent/JP3023957B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は、規則合成音声を生成する音声合成装置に関
する。
〈従来の技術〉 従来、音声の規則合成において、出力される合成音声の
自然性に大きく左右する単語または文節のアクセントを
簡単な規則によって生成し、自然性のある合成音声のア
クセントパターンを実現するモデルとして点ピッデモデ
ルがある。この点ピッチモデルにおける単語あるいは文
節のアクセントパターンの生成は、母音の重心点におけ
るピッチ周波数(基本周波数)を求めて、この母音の重
心点におけるピッチ周波数を線で結ぶことによって近似
的に生成される。
〈発明が解決しようとする課題〉 自然発声による音声のピッチ周波数のパターン(ピッチ
パターン)を観察すると、一般に頭高の単語(アクセン
ト型カ月型の単語)あるいは頭高の文節(アクセント型
がl型の文節)の孤立発声におけるピッチパターンにお
いては、lモーラ目と2モーラ目の境が最もピッチ周波
数が高くなっている。
しかしながら、上記従来の音声合成装置における点ピッ
チモデルにおいては、母音の重心点におけるピッチ周波
数を求め、この母音の重心点のピッチ周波数を線で結ぶ
ことによって近似的にアクセントパターンを生成してい
るので、単語あるいは文節におけるピッチ周波数の最大
値は常に母音の重心点になる。したがって、上述のよう
にlモーラ目と2モーラ目の境において最もピッチ周波
数が高くなる頭高の単語あるいは頭高の文節の孤立発生
の場合には、自然音声のピッチパターンに対応したアク
セントパターンが得られないという問題がある。
そこで、この発明の目的は、1モーラ目と2モーラ目の
境において最もピッチ周波数が高くなるような頭高の単
語あるいは頭高の文節の孤立発声の場合にも、自然音声
のピッチパターンに忠実なモデルによってアクセントパ
ターンを生成することができる音声合成装置を提供する
ことにある。
〈課題を解決するための手段〉 上記目的を達成するため、この発明は、単語分割処理部
で入力された文字列から単語を分割し、この分割された
各単語に基づいて韻律パラメータ生成部で合成単位のパ
ラメータの生成を行い、このパラメータに従って音声パ
ラメータ生成部で上記合成単位を補間・結合して音声合
成用パラメータを生成し、この音声合成用のパラメータ
に従って音声合成部で合成音声波形を出力する音声合成
装置において、上記韻律パラメータ生成部は、人力され
た1文章の単語あるいは文節のアクセントから単語ある
いは文節におけるピッチ周波数の経時変化を表す語調成
分を生成する語調成分生成手段と、上記語調成分生成手
段によって生成された語調成分が無音部分の直後に続く
頭高の語調成分であるか否かを判別する語調成分判別手
段と、上記語調成分判別手段によって無音部分の直後に
続く頭高の語調成分であると判別された単語あるいは文
節の語調成分を1モーラ目と2モーラ目との略境界にお
ける制御点でのピッチ周波数が最大になるように再設定
する語調成分再設定手段を備えたことを特徴としている
〈作用〉 文章を表す文字列が人力されると、単語分割処理部で上
記文字列から単語が分割され、この分割された単語に基
づいて韻律パラメータ生成部で合成単位のパラメータの
生成が行われる。そうすると、このパラメータに従って
音声パラメータ生成部で上記合成単位が補間・結合され
て音声合成用パラメータが生成され、この音声合成用パ
ラメータに従って音声合成部で合成音声波形が生成され
て出力される。その際に、上記韻律パラメータ生成部に
おいて、上記合成単位のパラメータの一つであるピッチ
パターンを生成する際に用いられる語調成分が次のよう
にして設定される。
すなわち、入力された1文章の単語あるいは文節のアク
セントから、上記語R成分が語調成分生成手段によって
生成され、上記語調成分生成手段によって生成された語
調成分が無音部分の直後に続く頭高の語調成分であるか
否かが語調成分判別手段によって判別される。その結果
、無音部分の直後に続く頭高の語調成分であると判別さ
れた単語あるいは文節の語調成分が、lモーラ目と2モ
ーラ目との略境界における制御点でのピッチ周波数が最
大になるように語調成分再設定手段によって再設定され
る。
したがって、無音部分の直後に続く頭高の単語あるいは
無音部分の直後に続く頭高の文節の語調成分が、常にl
モーラ目と2モーラ目との略境界における制御点でのピ
ッチ周波数が最大になるように設定される。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1図はこの発明の一実施例である音声合成装置のブロ
ック図である。
人力部+01から単語分割処理部+02に日本語かな混
じり文が入力されると、この単語分割処理部+02によ
って次のような単語分割処理が行われる。すなわち、日
本語辞書103およびユーザー辞書104を参照して、
従来から行われている最長一致法や文のなかの文節数が
最小になるように単語を選択する文節最小法を用いて、
文がアクセントを付与した単語に分割される。そして、
この分割された単語は単語読みアクセント処理部!06
に出力される。その結果、上述の単語分割処理部+02
において分割された単語が、日本語辞書103およびユ
ーザー辞書104の格納内容とマツチングして分割され
た単語であれば、同じ文字でありながら違う読みとアク
セントで発声される単語を区別する同形単語選択処理が
単語読みアクセント処理部106で行なわれ、処理され
た単語は韻律処理部112に出力される。ここで、ユー
ザー辞書編集部!05は上記ユーザー辞書104に新し
く単語の読みとアクセントを追加したり、変換したり、
削除したりするものである。
一方、単語分割処理部+02において分割された単語が
日本語辞書103とマツチングしなかった未知単語の場
合には次のように処理される。すなわち、未知単語のう
ち漢字未知語は未知単語読み処理部107で、漢字1文
字毎の読みを格納した漢字辞書108を参照して一旦読
みに変換されて未知単語アクセント処理部109に出力
される。
また、平板名1片仮名の未知語はその平仮名および片仮
名を読みとしてそのまま未知単語アクセント処理部+0
9に出力される。そして、未知単語アクセント処理部+
09で、所定のルールを用いて読みからアクセントを生
成する処理が行われ、アクセントを付与された未知単語
は上記韻律処理部112に出力される。
そうすると、上記単語読みアクセント処理部106また
は未知単語アクセント処理部109から出力された各単
語のアクセントから、単語が連鎖した際の文節のアクセ
ントやポーズの設定が上記韻律処理部112によって行
われる。
続いて韻律パラメータ生成部113で、上記文節に対応
した合成用単位に対する継続時間長、ピッチパターン、
パワーパターンのパラメータの生成が行われる。その際
に、自然発声による音声のアクセントパターンに対応し
たピッチパターンが後に詳述するようにして生成される
そして、音声パラメータ生成wJ114で、人力された
各単語の読みに対応する合成単位が合成用単位の音声デ
ータ辞1115を参照して検索され、その合成単位間を
補間し、さらに、上記韻律パラメータ生成部113から
入力される上記合成単位の継続時間長、ピッチパターン
、パワーパターンに従って結合して、最終的な音声合成
用パラメータ時系列が得られる。
音声合成部116は、上記音声パラメータ生成部114
から人力される音声合成用パラメータに基づいて、実際
の合成音声波形を生成して出力部117に出力する。
次に、上記韻律パラメータ生成部113によって行われ
るピッチパターン生成処理について、第2図のフローチ
ャートに従って詳細に述べる。
まず、上記韻律処理部112から、単語が連鎖した際の
文節のアクセント、呼気段落のアクセントおよびポーズ
が入力されて、ビ・ノチパターン生成処理がスタートさ
れる。
ステップS1で、人力されたI文章における呼気段落の
アクセントから話調成分(呼気段落におけるピッチ周波
数の経時変化)が生成される。また、上記入力された1
文章における文節(単語)のアクセントから語調成分(
文節または単語におけるピッチ周波数の経時変化)が通
常の生成方法によって生成される。
以下、得られた上記1文章の語調成分の総てについて、
下記の処理が実行される。
ステップS2で、上記ステップS1において生成された
語調成分の前にポーズがあるか否かが判別される。その
結果ポーズがあればその語調成分に基づく文節(単語)
は孤立発生されたとしてステップS3に進む。また、そ
うでなければ上記ステップS1において生成された語調
成分を再設定する必要がないのでステップS6に進む。
ステップS3で、上記ステップSlにおいて生成された
語調成分に対応した文節(単語)のアクセント型は1型
(すなわち、頭高の文節あるいは頭高の単語)であるか
否かが判別される。その結果l型であれば上記ステップ
S1において生成された語調成分を再設定するためにス
テップS4に進む。
また、そうでなければ上記語調成分を再設定する必要が
ないのでステップS6に進む。
ステップS4で、現文節(単語)のアクセント型は1型
であるから、上記ステップSlにおいて生成された語調
成分を、アクセント型が1型である文節(単語)の自然
発声時のピンチパターンにより近くなるように再設定さ
れる。
つまり、アクセント型が1型の文節(単語)の場合は、
上述のようにステップS1において通常の生成方法によ
って生成された語調成分のピッチ周波数が最大値になる
点は第4図に示すように母音の重心点である。そのため
、自然発声による音声のピッチパターンに対応したアク
セントパターンが得られず自然な合成音声が得られない
。そこで、語調成分を次のように設定し直すのである。
すなわち、第3図に示すように、lモーラ目の制御点(
語調成分を設定する際にピッチ周波数が設定される各モ
ーラ毎の代表点)を、Iモーラ目の開始点(制御点CI
)およびlモーラ目と2モーラ目との略境界(制御点C
2)に二つ再設定する。
次に、制御点C2のピッチ周波数を制御点C1のピッチ
周波数よりも高い値に設定する。また、制御点C2のピ
ッチ周波数を他のモーラにおけろ制御点のピッチ周波数
よりも高く設定する。
ステップS5で、上記ステップS4において再設定され
た1モーラ目の制御点C1および制御点C2に基づいて
、2モーラ目以降の制御点ら含めた各制御点間が補間さ
れて、語調成分が再設定される。
このように、アクセント型が1型の文節の場合、第4図
に示すような従来の方法によって生成された語調成分を
、第3図に示すようなピッチ周波数の最大値がlモーラ
目と2モーラ目との略境界の制御点C2にある語調成分
に再設定することによって、より自然発声による音声の
ピッチパターンに近い語調成分が得られるのである。
ステップS6で、上記ステップS1において生成された
1文章の語調成分の総に対する処理が完了したか否かが
判別される。その結果終了していればステップS7に進
み、そうでなければステップS2に戻り次の語調成分に
対する処理に入る。
ステッ°プS7で、上記ステップS1において生成され
た話調成分上に、上記ステップS1において生成された
語調成分と上記ステップS2からステップS6まての処
理によって再設定された語調成分とを重畳して1文章の
ピッチパターンが生成される。
このようにして生成された1文章のピッチパターンは上
記音声パラメータ生成部114に出力されて、ピッチパ
ターン生成処理が終了する。
上述のように、この発明の音声合成装置によれば、無音
部の直後に続(頭高の文節(単語)すなわちアクセント
型が1型の文節(単語)の語調成分は、ピッチ周波数の
最大値が1モーラ目と2モーラ目との略境界になるよう
に設定でき、自然発声に応じたピッチパターンを生成し
、自然な合成音声を出力できる。
ここで、第3図における3モーラ目以降の語調成分は直
線で省略して表示しである。
〈発明の効果〉 以上より明らかなように、この発明の音声合成装置は、
単語分割処理部、韻律パラメータ生成部。
音声パラメータ生成部および音声合成部ををして、上記
韻律パラメータ生成部は、語調成分生成手段によって生
成された単語あるいは文節のH成分が無音部分の直後に
続く頭高の語調成分であるか否かを語調成分判別手段で
判別し、無音部分の直後に続く頭高の語調成分であると
判別された単語あるいは文節のM?酸成分、lモーラ目
と2モーラ目との略境界における制御点でのピンチ周波
数が最大になるように語調成分再設定手段によって再設
定するようにしたので、無音部分の直後に続く頭高の単
語あるいは文節の語調成分は、lモーラ目と2モーラ目
との略境界における制御点でのピッチ周波数が最大にな
るように設定される。
したがって、この発明によれば、より自然発声による音
声のピッチパターンに即したピッチパターンを生成し、
より自然な合成音声を出力することができる。
【図面の簡単な説明】
第1図はこの発明の一実施例の音声合成装置のブロック
図、第2図は第1図の韻律パラメータ生成部によって実
行されるピッチパラメータ生成処理のフローチャート、
第3図は再設定されたアクセント型が1型の語調成分の
一例を示す図、第4図は従来例によって設定されたアク
セント型が1型の語調成分の図である。 101・・・入力部、  102・・・単語分割処理部
、103・・・日本語辞書、104・・・ユーザー辞書
、105・・・ユーザー辞書編集部、 106・・・単語読みアクセント処理部、107・・・
未知単語読み処理部、108・・・英字辞書、109・
・・未知単語アクセント処理部、+12・・・韻律処理
部、 +13・・・韻律パラメータ生成部、 +14・・・音声パラメータ生成部、 115・・・合成用単位の音声データ辞書、+16・・
・音声合成部、    117・・・出力部。 特許出願人  シャープ株式会社

Claims (1)

    【特許請求の範囲】
  1. (1)単語分割処理部で入力された文字列から単語を分
    割し、この分割された各単語に基づいて韻律パラメータ
    生成部で合成単位のパラメータの生成を行い、このパラ
    メータに従って音声パラメータ生成部で上記合成単位を
    補間・結合して音声合成用パラメータを生成し、この音
    声合成用のパラメータに従って音声合成部で合成音声波
    形を出力する音声合成装置において、 上記韻律パラメータ生成部は、入力された1文章の単語
    あるいは文節のアクセントから単語あるいは文節におけ
    るピッチ周波数の経時変化を表す語調成分を生成する語
    調成分生成手段と、上記語調成分生成手段によって生成
    された語調成分が無音部分の直後に続く頭高の語調成分
    であるか否かを判別する語調成分判別手段と、上記語調
    成分判別手段によって無音部分の直後に続く頭高の語調
    成分であると判別された単語あるいは文節の語調成分を
    1モーラ目と2モーラ目との略境界における制御点での
    ピッチ周波数が最大になるように再設定する語調成分再
    設定手段を備えたことを特徴とする音声合成装置。
JP63157541A 1988-06-23 1988-06-23 音声合成装置 Expired - Lifetime JP3023957B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63157541A JP3023957B2 (ja) 1988-06-23 1988-06-23 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63157541A JP3023957B2 (ja) 1988-06-23 1988-06-23 音声合成装置

Publications (2)

Publication Number Publication Date
JPH01321497A true JPH01321497A (ja) 1989-12-27
JP3023957B2 JP3023957B2 (ja) 2000-03-21

Family

ID=15651935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63157541A Expired - Lifetime JP3023957B2 (ja) 1988-06-23 1988-06-23 音声合成装置

Country Status (1)

Country Link
JP (1) JP3023957B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09212167A (ja) * 1996-02-02 1997-08-15 Kawai Musical Instr Mfg Co Ltd 電子鍵盤楽器のスピーカボックス

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09212167A (ja) * 1996-02-02 1997-08-15 Kawai Musical Instr Mfg Co Ltd 電子鍵盤楽器のスピーカボックス

Also Published As

Publication number Publication date
JP3023957B2 (ja) 2000-03-21

Similar Documents

Publication Publication Date Title
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JPH08335096A (ja) テキスト音声合成装置
JPH01321497A (ja) 音声合成装置
JP2596416B2 (ja) 文・音声変換装置
JP2894447B2 (ja) 複合音声単位を用いた音声合成装置
JP3113101B2 (ja) 音声合成装置
JPH05281984A (ja) 音声合成方法および装置
JP2573586B2 (ja) 規則型音声合成装置
JPH05224688A (ja) テキスト音声合成装置
JP2703253B2 (ja) 音声合成装置
JPH037995A (ja) 歌音声合成データの作成装置
JP2577372B2 (ja) 音声合成装置および方法
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JP3314106B2 (ja) 音声規則合成装置
JP3034911B2 (ja) テキスト音声合成装置
JP2578876B2 (ja) 文章読み上げ装置
JP3310217B2 (ja) 音声合成方法とその装置
JPH01321496A (ja) 音声合成装置
JP2573587B2 (ja) ピッチパタン生成装置
JPH0518120B2 (ja)
JPH08328578A (ja) テキスト音声合成装置
JPH06138894A (ja) 音声合成装置及び音声合成方法
JP3313310B2 (ja) 音声合成装置及び合成方法
JPH02129700A (ja) 音声合成装置
JPH0363696A (ja) テキスト音声合成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080121

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090121

Year of fee payment: 9

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090121

Year of fee payment: 9