JP3023957B2 - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP3023957B2
JP3023957B2 JP63157541A JP15754188A JP3023957B2 JP 3023957 B2 JP3023957 B2 JP 3023957B2 JP 63157541 A JP63157541 A JP 63157541A JP 15754188 A JP15754188 A JP 15754188A JP 3023957 B2 JP3023957 B2 JP 3023957B2
Authority
JP
Japan
Prior art keywords
word
accent
phrase
pitch
prosody
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63157541A
Other languages
English (en)
Other versions
JPH01321497A (ja
Inventor
延佳 海木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP63157541A priority Critical patent/JP3023957B2/ja
Publication of JPH01321497A publication Critical patent/JPH01321497A/ja
Application granted granted Critical
Publication of JP3023957B2 publication Critical patent/JP3023957B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 <産業上の利用分野> この発明は、規則合成音声を生成する音声合成装置に
関する。
<従来の技術> 従来、音声の規則合成において、出力される合成音声
の自然性に大きく左右する単語または文節のアクセント
を簡単な規則によって生成し、自然性のある合成音声の
アクセントパタンを実現するモデルとして点ピッチモデ
ルがある。この点ピッチモデルにおける単語あるいは文
節ののアクセントパタンの生成は、母音の重心点におけ
るピッチ周波数(基本周波数)を求めて、この母音の重
心点におけるピッチ周波数を線で結ぶことによって近似
的に生成される。
<発明が解決しようとする課題> 自然発声による音声のピッチ周波数のパタン(ピッチ
パタン)を観察すると、一般に頭高の単語(アクセント
型が1型の単語)あるいは頭高の文節(アクセント型が
1型の文節)の孤立発声におけるピッチパタンにおいて
は、1モーラ目と2モーラ目の境が最もピッチ周波数が
高くなっている。
しかしながら、上記従来の音声合成装置における点ピ
ッチモデルにおいては、母音の重心点におけるピッチ周
波数を求め、この母音の重心点のピッチ周波数を線で結
ぶことによって近似的にアクセントパタンを生成してい
るので、単語あるいは文節におけるピッチ周波数の最大
値は常に母音の重心点になる。したがって、上述のよう
に1モータ目と2モーラ目の境において最もピッチ周波
数が高くなる頭高の単語あるいは頭高の文節の孤立発生
の場合には、自然音声のピッチパタンに対応したアクセ
ントパタンが得られないという問題がある。
そこで、この発明の目的は、1モータ目と2モーラ目
の境において最もピッチ周波数が高くなるような頭高の
単語あるいは頭高の文節が孤立発声の場合にも、自然音
声のピッチパタンに忠実なモデルによってアクセントパ
タンを生成することができる音声合成装置を提供するこ
とにある。
<課題を解決するための手段> 上記目的を達成するため、請求項1に係る発明の音声
合成装置は、単語分割処理部,韻律処理部,韻律パラメ
ータ生成部,音声パラメータ生成部,音声合成部を備え
る音声合成装置において、単語分割処理部は,入力され
る文字列をアクセントが付与された単語に分割し、韻律
処理部は,単語が連鎖した際の文節のアクセントおよび
ポーズを設定し、韻律パラメータ生成部は,ピッチパタ
ンを含む韻律パラメータを生成すると共に,該ピッチパ
タンを第1−3の処理に基づいて生成し、第1の処理
は,単語または文節のアクセントに基づいて単語または
文節のピッチパタンを生成し、第2の処理は,ピッチパ
タンが,ポーズに続き,かつ,アクセント型が1型であ
るか否かを判断し、第3の処理は,ポーズに続き,か
つ,アクセント型が1型のピッチパタンにおけるピッチ
周波数の最大値を1モーラ目と2モーラ目の略境界の位
置になるよう再設定し、音声パラメータ生成部は,韻律
パラメータに基づいて音声合成用パラメータを生成し、
音声合成部は,音声合成用パラメータにしたがって合成
音声波形を出力することを特徴としている。
<作用> 文字列が入力されると、単語分割処理部で上記文字列
からアクセントが付与された単語が分割され、この分割
された単語に基づいて韻律パラメータ生成部で単語また
は文節に関するピッチパタンを含む韻律パラメータの生
成が行われる。そうすると、この韻律パラメータに基づ
いて音声パラメータ生成物で音声合成用パラメータが生
成され、この音声合成用パラメータに従って音声合成部
で合成音声波形が生成されて出力される。
その際に、韻律処理部によって、上記単語分割処理部
で分割された単語が連鎖した際の文節のアクセントおよ
びポーズが設定される。そして、上記韻律パラメータ生
成部において、上記韻律パラメータの一つであるピッチ
パタンが次の第1−3の処理に基づいて生成される。
すなわち、先ず第1の処理では、上記単語または文節
のアクセントに基づいて、単語または文節におけるピッ
チパタンが生成される。次に第2の処理では、上記生成
されたピッチパタンが上記ポーズに続き、且つ、アクセ
ント型が1型のピッチパタンであるか否かが判別され
る。次に第3の処理では、上記ポーズに続き且つアクセ
ント型が1型のピッチパタンにおけるピッチ周波数の最
大値を1モーラ目と2モーラ目との各境界の位置になる
ように再設定される。
したがって、上記ポーズに続き且つアクセント型が1
型のピッチパタンが、常に1モーラ目と2モーラ目との
略境界においてピッチ周波数が最大になるように設定さ
れる。
<実施例> 以下、この発明の図示の実施例により詳細に説明す
る。
第1図はこの発明の一実施例である音声合成装置のブ
ロック図である。
入力部101から単語分割処理部102に日本語かな混じり
文が入力されると、この単語分割処理部102によって次
のような単語分割処理が行われる。すなわち、日本語辞
書103およびユーザー辞書104を参照して、従来から行わ
れている最長一致法や文のなかの文節数が最小になるよ
うに単語を選択する文節最小法を用いて、文がアクセン
トを付与した単語に分割される。そして、この分割され
た単語は単語読みアクセント処理部106に出力される。
その結果、上述の単語分割処理部102において分割され
た単語が、日本語辞書103およびユーザー辞書104の格納
内容とマッチングして分割された単語であれば、同じ文
字でありながら違う読みとアクセントで発声される単語
を区別する同形単語選択処理が単語読みアクセント処理
部106で行なわれ、処理された単語は韻律処理部112に出
力される。ここで、ユーザー辞書編集部105は上記ユー
ザー辞書104に新しく単語の読みとアクセントを追加し
たり、変換したり、削除したりするものである。
一方、単語分割処理部102において分割された単語が
日本語辞書103とマッチングしなかった未知単語の場合
には次のように処理される。すなわち、未知単語のうち
漢字未知語は未知単語読み処理部107で、漢字1文字毎
の読みを格納した漢字辞書108を参照して一旦読みに変
換されて未知単語アクセント処理部109に出力される。
また、平仮名,片仮名の未知語はその平仮名および片仮
名を読みとしてそのまま未知単語アクセント処理部109
に出力される。そして、未知単語アクセント処理部109
で、所定のルールを用いて読みからアクセントを生成す
る処理が行われ、アクセントを付与された未知単語は上
記韻律処理部112に出力される。
そうすると、上記単語読みアクセント処理部106また
は未知単語アクセント処理部109から出力された各単語
のアクセントから、単語が連鎖した際の文節のアクセン
トやポーズの設定が上記韻律処理部112によって行われ
る。
続いて韻律パラメータ生成部113で、上記文節に対応
した合成用単位に対する継続時間長,ピッチパタン,パ
ワーパタンのパラメータの生成が行われる。その際に、
自然発声による音声のアクセントパタンに対応したピッ
チパタンが後に詳述するようにして生成される。
そしで、音声パラメータ生成部114で、入力された各
単語の読みに対応する合成単位が合成用単位の音声デー
タ辞書115を参照して検索され、その合成単位間を補間
し、さらに、上記韻律パラメータ生成部113から入力さ
れる上記合成単位の継続時間長,ピッチパタン,パワー
パタンに従って結合して、最終的な音声合成用パラメー
タ時系列が得られる。
音声合成部116は、上記音声パラメータ生成部114から
入力される音声合成用パラメータに基づいて、実際の合
成音声波形を生成して出力部117に出力する。
次に、上記韻律パラメータ生成部113によって行われ
るピッチパタン生成処理について、第2図のフローチャ
ートに従って詳細に述べる。
まず、上記韻律処理部112から、単語が連鎖した際の
文節のアクセント,呼気段落のアクセントおよびポーズ
が入力されて、ピッチパタン生成処理がスタートされ
る。
ステップS1で、入力された1文章における呼気段落の
アクセントから話調成分(呼気段落におけるピッチ周波
数の経時変化)が生成される。また、上記入力された1
文章における文節(単語)のアクセントから語調成分
(文節または単語におけるピッチ周波数の経時変化)が
通常の生成方法によって生成される。
以下、得られた上記1文章の語調成分の総てについ
て、下記の処理が実行される。
ステップS2では、上記ステップS1において生成された
語調成分の前にポーズがあるか否かが判別がされる。そ
の結果ポーズがあればその語調成分に基づく文節(単
語)は孤立発生されたとしてステップS3に進む。また、
そうでなければ上記ステップS1において生成された語調
成分を再設定する必要がないのでステップS6に進む。
ステップS3では、上記ステップS1において生成された
語調成分に対応した文節(単語)のアクセント型は1型
(すなわち、頭高の文節あるいは頭高の単語)であるか
否かが判別される。その結果1型であれば上記ステップ
S1において生成された語調成分を再設定するためにステ
ップS4に進む。また、そうでなければ上記語調成分を再
設定する必要がないのでステップS6に進む。
ステップS4で、現文節(単語)のアクセント型は1型
であるから、上記ステップS1において生成された語調成
分を、アクセント型が1型である文節(単語)の自然発
声時のピッチパタンにより近くなるように再設定され
る。
つまり、アクセント型が1型の文節(単語)の場合
は、上述のようにステップS1において通常の生成方法に
よって生成された単語成分のピッチ周波数が最大値にな
る点は第4図に示すように母音の重心点である。そのた
め、自然発声による音声のピッチパタンに対応したアク
セントパタンが得られず自然な合成音声が得られない。
そこで、語調成分を次のように設定し直すのである。
すなわち、第3図に示すように、1モーラ目の制御点
(語調成分を設定する際にピッチ周波数が設定される各
モータ毎の代表点)を、1モーラ目の開始点(制御点C
1)および1モーラ目と2モーラ目との略境界(制御点C
2)に二つ再設定する。次に、制御点C2のピッチ周波数
を制御点C1のピッチ周波数よりも高い値に設定する。ま
た、制御点C2のピッチ周波数を他のモータにおける制御
点のピッチ周波数よりも高く設定する。
ステップS5で、上記ステップS4において再設定された
1モーラ目の制御点C1および制御点C2に基づいて、2モ
ーラ目以降の制御点も含めた各制御点間が補間されて、
語調成分が再設定される。
このように、アクセント型が1型の文節の場合、第4
図に示すような従来の方法によって生成された語調成分
を、第3図に示すようなピッチ周波数の最大値が1モー
ラ目と2モーラ目との略境界の制御点C2にある語調成分
に再設定することによって、より自然発声による音声の
ピッチパタンに近い語調成分が得られるのである。
ステップS6で、上記ステップS1において生成された1
文章の語調成分の総に対する処理が完了したか否かが判
別される。その結果終了していればステップS7に進み、
そうでなければステップS2に戻り次の語調成分に対する
処理に入る。
ステップS7では、上記ステップS1において生成された
話調成分上に、上記ステップS1において生成された語調
成分と上記ステップS2からステップS6までの処理によっ
て再設定された語調成分とを重畳して1文章のピッチパ
タンが生成される。
このようにして生成された1文章のピッチパタンは上
記音声パラメータ生成部114に出力されて、ピッチパタ
ン生成処理が終了する。
上述のように、この発明の音声合成装置によれば、無
音部の直後に続く頭高の文節(単語)すなわちアクセン
ト型が1型の文節(単語)の語調成分は、ピッチ周波数
の最大値が1モーラ目と2モーラ目との略境界になるよ
うに設定でき、自然発声に応じたピッチパタンを生成
し、自然な合成音声を出力できる。
ここで、第3図における3モーラ目以降の語調成分は
直線で省略して表示してある。
<発明の効果> 以上より明らかなように、請求項1に係る発明の音声
合成装置は、単語分割処理部,韻律処理部,韻律パラメ
ータ生成部,音声パラメータ生成部および音声合成部を
有して、上記韻律処理部は上記単語分割処理部で分割さ
れた単語が連鎖した際の文節のアクセントおよびポーズ
を設定し、上記韻律パラメータ生成部は、第1の処理に
よって単語または文節のピッチパタンを生成し、第2の
処理によって上記ピッチパタンがポーズに続き且つアク
セント型が1型であるか否かを判別し、第3の処理によ
って上記ポーズに続き且つアクセント型が1型のピッチ
パタンにおけるピッチ周波数の最大値を1モーラ目と2
モーラ目との略境界の位置になるように再設定するの
で、上記ポーズに続き且つアクセント型が1型のピッチ
パタンを、その最大ピッチ周波数の位置が1モーラ目と
2モーラ目との略境界の位置になるように設定できる。
したがって、この発明によれば、より自然発声による
音声のピッチパタンに即したピッチパタンを生成し、よ
り自然な合成音声を出力することができる。
【図面の簡単な説明】
第1図はこの発明の一実施例の音声合成装置のブロック
図、第2図は第1図の韻律パラメータ生成部によって実
行されるピッチパラメータ生成処理のフローチャート、
第3図は再設定されたアクセント型が1型の語調成分の
一例を示す図、第4図は従来例によって設定されたアク
セント型が1型の語調成分の図である。 101……入力部、102……単語分割処理部、 103……日本語辞書、104……ユーザー辞書、 105……ユーザー辞書編集部、 106……単語読みアクセント処理部、 107……未知単語読み処理部、108……漢字辞書、 109……未知単語アクセント処理部、 112……韻律処理部、 113……韻律パラメータ生成部、 114……音声パラメータ生成部、 115……合成用単位の音声データ辞書、 116……音声合成部、117……出力部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】単語分割処理部、韻律処理部、韻律パラメ
    ータ生成部、音声パラメータ生成部、音声合成部を備え
    る音声合成装置において、 単語分割処理部は、入力される文字列をアクセントが付
    与された単語に分割し、 韻律処理部は、単語が連鎖した際の文節のアクセントお
    よびポーズを設定し、 韻律パラメータ生成部は、ピッチパタンを含む韻律パラ
    メータを生成すると共に、該ピッチパタンを第1−3の
    処理に基づいて生成し、 第1の処理は、単語または文節のアクセントに基づいて
    単語または文節のピッチパタンを生成し、 第2の処理は、ピッチパタンが、ポーズに続き、かつ、
    アクセント型が1型であるか否かを判断し、 第3の処理は、ポーズに続き、かつ、アクセント型が1
    型のピッチパタンにおけるピッチ周波数の最大値を1モ
    ーラ目と2モーラ目の略境界の位置になるよう再設定
    し、 音声パラメータ生成部は、韻律パラメータに基づいて音
    声合成用パラメータを生成し、 音声合成部は、音声合成用パラメータにしたがって合成
    音声波形を出力する 音声合成装置。
JP63157541A 1988-06-23 1988-06-23 音声合成装置 Expired - Lifetime JP3023957B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63157541A JP3023957B2 (ja) 1988-06-23 1988-06-23 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63157541A JP3023957B2 (ja) 1988-06-23 1988-06-23 音声合成装置

Publications (2)

Publication Number Publication Date
JPH01321497A JPH01321497A (ja) 1989-12-27
JP3023957B2 true JP3023957B2 (ja) 2000-03-21

Family

ID=15651935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63157541A Expired - Lifetime JP3023957B2 (ja) 1988-06-23 1988-06-23 音声合成装置

Country Status (1)

Country Link
JP (1) JP3023957B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3397965B2 (ja) * 1996-02-02 2003-04-21 株式会社河合楽器製作所 電子鍵盤楽器のスピーカボックス

Also Published As

Publication number Publication date
JPH01321497A (ja) 1989-12-27

Similar Documents

Publication Publication Date Title
US5220629A (en) Speech synthesis apparatus and method
JPH086592A (ja) 音声合成方法及び装置
JP2623586B2 (ja) 音声合成におけるピッチ制御方式
JP3023957B2 (ja) 音声合成装置
JP2001242882A (ja) 音声合成方法及び音声合成装置
JP3437064B2 (ja) 音声合成装置
JPH06318094A (ja) 音声規則合成装置
JP2573586B2 (ja) 規則型音声合成装置
JPH05281984A (ja) 音声合成方法および装置
JP3314106B2 (ja) 音声規則合成装置
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JP3034911B2 (ja) テキスト音声合成装置
JP2573587B2 (ja) ピッチパタン生成装置
JP3314116B2 (ja) 音声規則合成装置
JPH0588690A (ja) 音声基本周波数パターン生成装置
JP3284634B2 (ja) 規則音声合成装置
JP3313310B2 (ja) 音声合成装置及び合成方法
JP2001236086A (ja) テキスト音声合成出力機能を有するゲーム装置
JPH02129700A (ja) 音声合成装置
JPH06149283A (ja) 音声合成装置
JPH0562356B2 (ja)
JP2578876B2 (ja) 文章読み上げ装置
JPH06167989A (ja) 音声合成装置
JP2507374B2 (ja) 音声合成装置
JPH08328578A (ja) テキスト音声合成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080121

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090121

Year of fee payment: 9

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090121

Year of fee payment: 9