JP3088211B2 - 基本周波数パタン生成装置 - Google Patents

基本周波数パタン生成装置

Info

Publication number
JP3088211B2
JP3088211B2 JP05027817A JP2781793A JP3088211B2 JP 3088211 B2 JP3088211 B2 JP 3088211B2 JP 05027817 A JP05027817 A JP 05027817A JP 2781793 A JP2781793 A JP 2781793A JP 3088211 B2 JP3088211 B2 JP 3088211B2
Authority
JP
Japan
Prior art keywords
frequency pattern
unit
fundamental frequency
degree
utterance speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05027817A
Other languages
English (en)
Other versions
JPH06242791A (ja
Inventor
隆 矢頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP05027817A priority Critical patent/JP3088211B2/ja
Publication of JPH06242791A publication Critical patent/JPH06242791A/ja
Application granted granted Critical
Publication of JP3088211B2 publication Critical patent/JP3088211B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された文字情報を
音声に変換して出力する音声合成装置において、入力さ
れた文字情報の音声合成処理に使う基本周波数パタンを
生成する基本周波数パタン生成装置に関するものであ
る。
【0002】
【従来の技術】文字情報を入力としてそれを音声に変換
して出力する音声合成装置は、従来の録音・再生型の音
声合成装置と比較すると、出力語彙数の制限が無いとい
う長所があり、今後、従来の録音・再生型の音声合成装
置に代わって種々の分野での応用が期待されている。
【0003】図2は、文字情報を入力とした音声合成装
置の従来例を示したもので、図中の符号200は文字情
報入力部、201はテキスト解析部、202は単語辞
書、203は合成パラメータ生成部、204は音声素片
辞書、205は音声合成部、SPはスピーカである。
【0004】前記文字情報入力部200は、漢字かな混
じりのテキストデータの入力を受け付けてテキスト解析
部201に送出する。前記テキスト解析部201では、
文字情報入力部200から入力されたテキストデータに
対して、前記単語辞書202に登録されている情報を参
照しながら、音韻・韻律記号列を生成する。ここに、音
韻・韻律記号列とは、入力されたテキストデータの表す
文字列の読み,アクセント,イントネーション等を中間
言語による文字列として記述したものである。前記単語
辞書202には、各単語の読みや、アクセントなどが登
録されている。前記合成パラメータ生成部203では、
音韻・韻律記号列に基づいて、音声素片の種類(音の種
類)、音韻継続時間(音の長さ)、ポーズ(息継ぎ区
間)の長さ,基本周波数(声の高さ)パタンといった合
成パラメータを生成する。
【0005】前記音声素片は接続して合成波形をつくる
ための音声の基本単位であり、音の種類に応じて様々な
ものが前記音声素片辞書204に蓄積されている。ま
た、前記音声合成部205では、前記合成パラメータ生
成部203において生成された合成パラメータに基づい
て合成波形を生成する。そして、音声合成部205で生
成された合成波形が、スピーカSによって合成音とし
て出力される。
【0006】ところで、文字情報を音声合成して出力す
る場合には、適切な基本周波数パターンを生成すること
ができるか否かが、自然な合成音声を得る上で重要な要
素の一つとなる。文の基本周波数パターンは、文頭から
文末に向かって緩やかに下降(イントネーションに対
応)するフレーズ成分と、局所的な起伏(アクセント)
に対応するアクセント成分の和として表す方法が一般的
である。
【0007】前述した従来の音声合成装置では、文節間
の結合度をテキストデータの構文解析によって求め、こ
の文節間結合度からフレーズ成分を決定している。
【0008】図3は、文節間結合度の大きさと基本周波
数パターンとの関係を示したものである。この図3で
は、結合度の弱い順に、ケース1からケース5までの5
つの基本周波数パターンを示している。
【0009】図中のケース1は、隣接する二つの文節間
の結合度が最も弱い場合のもので、文節間にポーズが入
り、それぞれの文節が独立したフレーズ成分P1 ,P2
を持ち、その結果、それぞれの文節に対する周波数パタ
ーンf1 ,f2 がポーズ長に相当した間隔Sを空けて並
ぶ構成となる(図中のa1 ,a2 は、それぞれの文節の
アクセント成分である)。文節間結合度が強くなるにつ
れて、ポーズ長は短くなり、また、フレーズ成分の大き
さも次第に小さくなる(ケース2,3の場合)。そし
て、さらに文節間結合度が強くなると、両文節のアクセ
ント成分a1 ,a2 が1本のフレーズ成分P12上に乗っ
たパタンとなり(ケース4の場合)、最も結合度の強い
ケース5では二つの文節の基本周波数パタンが結合して
一つの文節の場合と同様な形態の基本周波数パタンf12
となる。
【0010】
【発明が解決しようとする課題】ところで、この種の音
声合成方式では、合成音をユーザの好みの調子にした
り、あるいは利用目的に合わせた音にするために、通
常、声質(男性音/女性音),声の高さ,発声速度など
を、それぞれ数種類の中から選択切替する機能が装備さ
れることが多い。今、これらの中の発声速度の切替につ
いて、前述の基本周波数パタンの生成に対する影響を考
える。
【0011】従来の音声合成方式では、入力された文字
列に対して如何なる基本周波数パタンを生成すべきか
は、単語のアクセント型や文構造(隣接する文節間の結
合度)を解析することにより決定しており、発声速度の
影響は考慮していない。
【0012】しかしながら、文の基本周波数パタンは、
前述のアクセント型や文構造だけでなく発声速度によっ
ても大きな影響を受け、発声速度の切替を許容した場合
には、発声速度を考慮しないで基本周波数パタンを生成
する従来の方式では、発声速度の切替によって、合成音
が極めて不自然になる場合が生じる。
【0013】例えば、音声合成装置に装備されている発
声速度調節機能を利用して発声速度を標準的な読み上げ
速度に対して遅くした場合には、一つのフレーズ成分で
表現される呼気段落が長くなり過ぎたり、また、反対に
標準速度よりも速くした場合には、呼気段落が短くなり
過ぎたりする不都合が生じ、その結果、適切な基本周波
数パタンの生成が損なわれ、起伏の過少や過多による極
めて不自然な合成音となる虞があった。
【0014】本発明は、前記事情に鑑みてなされたもの
で、音声合成装置において発声速度の切替が指示された
場合でも、発声速度に応じた適切な基本周波数パタンを
生成することができ、自然な合成音の生成という音声合
成における重要課題が発声速度の変更によって損なわれ
ることのない基本周波数パタン生成装置を提供すること
を目的とする。
【0015】
【課題を解決するための手段】本発明に係る基本周波数
パタン生成装置は、入力された文字情報に対して構文解
析処理を実施して入力された文字情報中の隣接した文節
間の結合度を求める構文解析部と、呼気段落のフレーズ
成分を隣接する文節間の結合度の強さに応じて決定する
基本周波数パタン生成部とを備えて、入力された文字情
報の音声合成処理に使う基本周波数パタンを生成するも
ので、新規な構成として、結合度補正部を備えている。
【0016】ここに、前記結合度補正部は、指定された
発生速度レベルに応じて前記構文解析部において求めた
結合度を補正して、補正した結合度を前記基本周波数パ
タン生成部に渡すものである。
【0017】
【作用】本発明に係る基本周波数パタン生成装置は、構
文解析部において求めた文節間の結合度は、指定された
発声速度レベルに応じて結合度補正部において補正して
から基本周波数パタン生成部に渡して、発声速度レベル
に応じて補正した結合度によって呼気段落のフレーズ成
分を決定する。
【0018】したがって、音声合成装置において発声速
度の切替が指示された場合でも、発声速度に応じた適切
な基本周波数パタンを生成することができ、自然な合成
音の生成という音声合成における重要課題が発声速度の
変更によって損なわれることを防止することが可能にな
る。
【0019】
【実施例】図1は、本発明に係る基本周波数パタン生成
装置の一実施例を示したものである。この基本周波数パ
タン生成装置は、文字情報を入力としてそれを音声に変
換して出力する音声合成装置に使用されて、入力された
文字情報に対する基本周波数パタンを生成までの処理を
実現するもので、図示のように、文字情報入力部100
と、単語辞書101と、単語分割部102と、構文解析
部103と、結合度補正部104と、基本周波数パタン
生成部105とを具備した構成とされている。
【0020】前記文字情報入力部100は、漢字かな混
じりのテキストデータの入力を受け付けて前記単語分割
部102に送出する。
【0021】前記単語辞書101には、単語の読み、ア
クセント型、品詞、意味情報などが記述されている。
【0022】前記単語分割部102は、前記単語辞書1
01の単語情報に基づいて、前記文字情報入力部100
から送出されてきたテキストデータを、最長一致法等の
公知の手法により単語単位に分割し、この分割処理を実
行すると同時に、分割した各単語に対するアクセント型
や意味情報等の諸情報を単語辞書101から得る。そし
て、さらに、単語分割部102は、分割後の単語を対象
として、自立語と付属語、あるいは付属語と付属語を結
合して文節を形成する文節生成処理を実行し、その処理
結果を次の構文解析部103に送る。
【0023】前記構文解析部103は、前記単語分割部
102から送られてきた文節データに対して、文節間の
接続関係や係受け関係を解析して隣接する文節間の結合
度を決定する。この構文解析部103で決定された文節
間結合度は、標準的な発声速度を想定して決定されたも
のであり、結合度補正部104に送られる。
【0024】前記結合度補正部104は、音声合成装置
に装備された発声速度選択部等から指定された発生速度
レベルに応じて、前記構文解析部103において決定さ
れた結合度を補正して、補正した結合度を前記基本周波
数パタン生成部105に渡す。この結合度補正部104
では、図4に示す補正テーブル10を使って結合度の補
正を行う。この結合度補正テーブル10は、各発声速度
レベル毎に結合度補正値を設定したものである。補正テ
ーブル10において結合度補正値として設定されている
値はシフト量で、発声速度選択部等から指定された発声
速度レベルに対する結合度補正値を該テーブル10から
読出し、その結合度補正値を前記構文解析部103で決
定された結合度に加算することで、結合度の補正処理が
完了する。
【0025】なお、この一実施例では、発声速度レベル
は、0(最も遅い)〜7(最も速い)までの8段階とし
ている。そして、結合度補正値は、発声速度レベル3の
標準速度に対するものをシフト量0に決め、各レベル毎
に−1〜+2までのシフト量を定めている。
【0026】前記基本周波数パタン生成部105では、
呼気段落のフレーズ成分を前記結合度補正部104から
受けた文節間結合度の強さに応じて決定し、決定したフ
レーズ成分と単語のアクセント型に基づくアクセント成
分との和によって基本周波数パタンを生成する。この基
本周波数パタン生成部105の生成した基本周波数パタ
ンは、別に装備されたパラメータ生成部において生成さ
れる他のパラメータ(音声素片の種類や、音韻継続時間
やポーズの長さ等)とともに図示略の音声合成部に送ら
れて合成波形の生成となる。
【0027】なお、補足説明すると、前記基本周波数パ
タン生成部105では、次の(1)式によって基本周波
数パタンF0(t) を算出している。
【0028】 ln F0 ( t) = ln Fmin +Ap ・GP (t−T0 ) +Aa ・{ Ga (t−T1 ) −Ga (t−T2 )} …(1) ここに、Fmin は基底周波数、Ap はフレーズ指令の大
きさ、Aa はアクセント指令の大きさ、T0 はフレーズ
指令の開始時点、T1 およびT2 はそれぞれアクセント
指令の開始時点と終了時点である。
【0029】また、Gp (t) およびGa (t) は、次の
(2)式および(3)式によって表される。 Gp (t) =αt・exp(−αt) …(2) Ga (t) = Min[1−(1+βt)・exp(−βt) ,θ] …(3) (2)式におけるαはフレーズ成分の時定数、(3)式
におけるβはアクセント成分の時定数であり、また、θ
はアクセント成分の上限値である。
【0030】基本周波数パタン生成部105では、前述
の(1)式におけるフレーズ指令の大きさは、図5に示
した対応表20によって決定する。この対応表20は文
節間結合度に応じて適切なフレーズ指令の大きさを定め
たもので、文節間結合度が大きくなるほど、フレーズ指
令の大きさが小さくなるように設定されており、この対
応表の関係によって、図3に示した結合度と基本周波数
パタンとの相関現象が表現される。
【0031】以上の一実施例の基本周波数パタン生成装
置は、構文解析部103において求めた文節間の結合度
は、指定された発声速度レベルに応じて結合度補正部1
04において補正してから基本周波数パタン生成部10
5に渡して、発声速度レベルに応じて補正した結合度に
よって呼気段落のフレーズ成分を決定する。
【0032】したがって、例えば、発声速度が遅い時に
は結合度が標準発声速度時よりも弱まるように負の補正
を実施し、逆に、発声速度が速い時には結合度が標準発
声速度時よりも強まるように正の補正を実施して、「ゆ
っくり発声した時には少ない文節毎に区切りをつけてフ
レーズ成分の立て直しを入れながら話すのに対し、速く
発声した時にはある程度まとまった文節を一気に発声し
てしまう」といった自然音声の性質により近い形状の基
本周波数パタンを生成することが可能になり、音声合成
装置において発声速度の切替が指示された場合でも、発
声速度に応じた適切な基本周波数パタンを生成すること
ができ、自然な合成音の生成という音声合成における重
要課題が発声速度の変更によって損なわれることを防止
することが可能になる。
【0033】
【発明の効果】以上の説明から明らかなように、本発明
に係る基本周波数パタン生成装置は、構文解析部におい
て求めた文節間の結合度は、指定された発声速度レベル
に応じて結合度補正部において補正してから基本周波数
パタン生成部に渡して、発声速度レベルに応じて補正し
た結合度によって呼気段落のフレーズ成分を決定する。
したがって、音声合成装置において発声速度の切替が指
示された場合でも、発声速度に応じた適切な基本周波数
パタンを生成することができ、自然な合成音の生成とい
う音声合成における重要課題が発声速度の変更によって
損なわれることを防止することが可能になる。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図であ
る。
【図2】従来の音声合成装置の説明図である。
【図3】文節間結合度と基本周波数パタンとの相関図で
ある。
【図4】本発明の一実施例で使用する補正テーブルの説
明図である。
【図5】本発明の一実施例で使用する対応表の説明図で
ある。
【符号の説明】
10 補正テーブル 20 対応表 100 文字情報入力部 101 単語辞書 102 単語分割部 103 構文解析部 104 結合度補正部 105 基本周波数パタン生成部
フロントページの続き (56)参考文献 特開 平3−127098(JP,A) 特開 平2−115898(JP,A) 特開 平6−67684(JP,A) 特開 平1−126695(JP,A) 特開 平4−270394(JP,A) 特開 平4−51099(JP,A) 実開 平6−28899(JP,U) (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された文字情報に対して構文解析処
    理を実施して入力された文字情報中の隣接した文節間の
    結合度を求める構文解析部と、呼気段落のフレーズ成分
    を隣接する文節間の結合度の強さに応じて決定する基本
    周波数パタン生成部とを備えて、 入力された文字情報の音声合成処理に使う基本周波数パ
    タンを生成する基本周波数パタン生成装置であって、 指定された発生速度レベルに応じて前記構文解析部にお
    いて求めた結合度を補正して、補正した結合度を前記基
    本周波数パタン生成部に渡す結合度補正部を装備したこ
    とを特徴とする基本周波数パタン生成装置。
JP05027817A 1993-02-17 1993-02-17 基本周波数パタン生成装置 Expired - Fee Related JP3088211B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05027817A JP3088211B2 (ja) 1993-02-17 1993-02-17 基本周波数パタン生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05027817A JP3088211B2 (ja) 1993-02-17 1993-02-17 基本周波数パタン生成装置

Publications (2)

Publication Number Publication Date
JPH06242791A JPH06242791A (ja) 1994-09-02
JP3088211B2 true JP3088211B2 (ja) 2000-09-18

Family

ID=12231520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05027817A Expired - Fee Related JP3088211B2 (ja) 1993-02-17 1993-02-17 基本周波数パタン生成装置

Country Status (1)

Country Link
JP (1) JP3088211B2 (ja)

Also Published As

Publication number Publication date
JPH06242791A (ja) 1994-09-02

Similar Documents

Publication Publication Date Title
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
US6470316B1 (en) Speech synthesis apparatus having prosody generator with user-set speech-rate- or adjusted phoneme-duration-dependent selective vowel devoicing
JPH1138989A (ja) 音声合成装置及び方法
JP3088211B2 (ja) 基本周波数パタン生成装置
JPH08335096A (ja) テキスト音声合成装置
JP3006240B2 (ja) 音声合成方法および装置
JPH0580791A (ja) 音声規則合成装置および方法
JP3060276B2 (ja) 音声合成装置
JP2703253B2 (ja) 音声合成装置
JP3575919B2 (ja) テキスト音声変換装置
JP3113101B2 (ja) 音声合成装置
JP3357796B2 (ja) 音声合成装置及び同装置における韻律情報生成方法
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JP2577372B2 (ja) 音声合成装置および方法
JP2785628B2 (ja) ピッチパタン生成装置
JP2900454B2 (ja) 音声合成装置の音節データ作成方式
JP3862300B2 (ja) 音声合成に用いる情報の処理方法および装置
JP3292218B2 (ja) 音声メッセージ作成装置
JP2003005774A (ja) 音声合成装置
JPH06214585A (ja) 音声合成装置
JPH01321496A (ja) 音声合成装置
JPH08171394A (ja) 音声合成装置
JPH04199421A (ja) 文書読上げ装置
JP2573587B2 (ja) ピッチパタン生成装置
JPH0876782A (ja) 音声合成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080714

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080714

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090714

Year of fee payment: 9

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090714

Year of fee payment: 9

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees