JP3060422B2 - 音声規則合成装置 - Google Patents

音声規則合成装置

Info

Publication number
JP3060422B2
JP3060422B2 JP4214234A JP21423492A JP3060422B2 JP 3060422 B2 JP3060422 B2 JP 3060422B2 JP 4214234 A JP4214234 A JP 4214234A JP 21423492 A JP21423492 A JP 21423492A JP 3060422 B2 JP3060422 B2 JP 3060422B2
Authority
JP
Japan
Prior art keywords
pause
length
setting
speech
pose
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4214234A
Other languages
English (en)
Other versions
JPH0659695A (ja
Inventor
延佳 海木
芳典 匂坂
Original Assignee
株式会社エイ・ティ・アール自動翻訳電話研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社エイ・ティ・アール自動翻訳電話研究所 filed Critical 株式会社エイ・ティ・アール自動翻訳電話研究所
Priority to JP4214234A priority Critical patent/JP3060422B2/ja
Publication of JPH0659695A publication Critical patent/JPH0659695A/ja
Application granted granted Critical
Publication of JP3060422B2 publication Critical patent/JP3060422B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は音声規則合成装置に関
し、より人間の声に近い自然な音声合成音を出力するた
めにポーズを生成できるような音声規則合成装置に関す
る。
【0002】
【従来の技術】規則による音声合成装置において、より
人間の声に近い自然な合成音声を出力するために、韻律
に関するパラメータ(基本周波数,振幅,音韻継続時間
長,ポーズ)を適切に制御する必要がある。
【0003】そのうち、ポーズを制御する方法として
は、以下に述べる文献に記載されたものがある。
【0004】H.Fujisaki and T.Ohmura : “Characteri
stics of durations of pause andspeech segments in
connected speech ”Annual Report, Engineering Rese
arch Institute, Univ. of Tokyo, 30, pp.69-74 (197
1). 箱田、佐藤:“文音合成における音調規則”、信学論D
Vol.J63-D No.9 pp.715-722 (1980-9) 鈴木、斎藤:“文構造に応じたポーズ長の制御”音講論
集 2-7-15 (1989-10) 岩田、小沢、三留、渡辺:“残差制御型合成方式を用い
た日本語テキスト音声合成システム”、音講論集 3-P-1
8 (1989-10) 北野、原、松井:“ポーズ生起の解析およびその規則
化”、音講論集 1-4-15(1990-3)
【0005】
【発明が解決しようとする課題】上述の文献に記載され
た検討では、データ収集の手間などの問題から、一話者
のポーズ挿入特性を規則化する方法が取られている。し
かし、ポーズの挿入には自由度があり、規則化を図る上
では複数のポーズ挿入可能性を調べることが望ましいと
思われる。実際、一話者の分析では、句境界の深さとポ
ーズ長そのものの直接的な対応が取られたため、その対
応が必ずしも一致していないと思われる箇所も多く見ら
れる。このため、ポーズ挿入規則についても句構造だけ
でなく、句長や息つぎなどを考慮したヒューリスティッ
クな規則が用いられていた。
【0006】それゆえに、この発明の主たる目的は、よ
り人間の声に近い自然な合成音声を出力できるようなポ
ーズを生成し得る音声規則合成装置を提供することであ
る。
【0007】
【課題を解決するための手段】この発明は音韻継続時間
長,基本周波数,ポーズなどの合成音声の情報を入力
て任意の音声を出力する音声規則合成装置において、ポ
ーズ設定規則を保有するポーズ設定規則辞書と、入力さ
れた合成音声の情報に応じて、ポーズ設定規則辞書に保
有しているポーズ設定規則に従って、先行句が後続句に
直接かかる句境界にポーズを設定し、このポーズに対
応するポーズ時間長を設定した後、そのポーズ時間
ポーズグループの平均ポーズ長とを加算して推定ポーズ
長を設定するポーズ設定手段を備えて構成される。
【0008】より好ましくは、ポーズ設定手段は句境界
のポーズ生成に関して、2種類以上の平均ポーズを設
定する。
【0009】
【0010】さらに、ポーズ設定手段は1モーラ
数倍になるように平均ポーズ長を設定した後、推定ポー
ズ長に影響を与える各種要因によって推定ポーズ長を
正して設定する。
【0011】さらに、ポーズ設定手段は、1モーラ
3モーラの2種類のポーズを設定する。
【0012】さらに、ポーズ設定手段は、それぞれのポ
ーズについて、別々にポーズ時間長を設定する。
【0013】
【0014】
【作用】この発明に係る音声規則合成装置は、入力され
た合成音声の情報に応じて、ポーズ設定規則辞書に保有
しているポーズ設定規則に従って、先行句が後続句に直
接係る句境界にポーズを設定し、ポーズの種類ごとにポ
ーズ長の基準値を設定した後、その長さを補正して1モ
ーラの長さの整数倍になるようにポーズ長を設定するこ
とにより、より人間の声に近い自然な音声構成音を出力
することができる。
【0015】
【実施例】図1はこの発明の一実施例の概略ブロック図
である。図1を参照して、入力部101から出力したい
合成音声の情報が韻律パラメータ生成部102に入力さ
れる。韻律パラメータ生成部102に入力される合成音
声の情報は、音韻,韻律および言語である。これらの情
報により、韻律パラメータ生成部102は、韻律規則辞
書(韻律パラメータ辞書)103を用いて韻律パラメー
タ(音韻継続時間,基本周波数およびパワー)を設定す
る。さらに、音声パラメータ生成部104は音声パラメ
ータ接続規則辞書(音声パラメータ辞書)105を用い
て、合成音声を生成するために、音声パラメータ接続規
則辞書105内の合成素片基本単位(たとえば音節,音
素)を音声パラメータ接続規則辞書105内の音声パラ
メータ接続規則に従って、接続,圧縮および伸張などの
加工を施し、音声パラメータを生成する。音声パラメー
タ生成部104で生成された音声パラメータは音声合成
部106に与えられて合成音声が構成され、出力部10
7によって合成音声が出力される。
【0016】図2は図1に示した韻律パラメータ生成部
102と韻律規則辞書のより詳細なブロック図である。
図2において、韻律パラメータ生成部102はポーズ設
定部201とポーズ長設定部202と音韻継続長設定部
203と基本周波数設定部204とパワー設定部205
とを含む。また、それぞれの設定部に対応して、韻律規
則辞書103はポーズ設定規則辞書210,音韻継続長
設定規則辞書211,基本周波数設定規則辞書212,
パワー設定規則辞書213の5つの辞書から成立ってい
る。従来のポーズ設定部が保有するポーズ設定規則で
は、入力部101によって解析された句構造情報のう
ち、先行句が後続句に直接かかる句境界のときには、ポ
ーズを設定しない規則を保有していた。しかし、この実
施例におけるポーズ設定部201は、ポーズ設定規則辞
書210に保有されるポーズ設定規則に従って、先行句
が後続句に直接かかる句境界のときにもポーズを設定す
る。さらに、先行句が後続句に直接かかる句境界のとき
には、入力部101によって息つぎをすると解析された
場合(入力文に読点がある場合)を除き、1つの種類の
ポーズを設定する。
【0017】ポーズ長設定部202は、ポーズ設定部2
01によって設定されたポーズ挿入の有無,ポーズが挿
入される場合のポーズの種類の情報を入力とし、ポーズ
を挿入しない場合を除き、ポーズの種類毎にポーズ長の
基準値を設定した後、その長さを補正することによって
ポーズ長を設定する。ポーズ設定規則辞書210には、
それぞれのポーズに対応したポーズ長とポーズ長を補正
するための規則が保有されている。
【0018】音韻継続長設定部203は音韻継続長設定
規則辞書211に従って音韻継続長を設定し、基本周波
数設定部204は基本周波数設定規則辞書212に従っ
て基本周波数を設定し、パワー設定部205はパワー設
定規則辞書213に従ってパワーを設定する。
【0019】図3はこの発明の一実施例の動作を説明す
るためのフロー図である。次に、図1〜図3を参照し
て、この発明の一実施例の動作について説明する。韻律
パラメータ生成部102のポーズ設定部201は、入力
部101から入力された合成音声の情報に応じて、句境
界の先行句が後続に直接かかるか、すなわち、先行句が
後続句に直接かかる句境界であるか否かを判別する
とえば、「赤い家」という文節の内、「赤い」は次の句
の「家」を直接修飾するので、図3のステップ(図示で
はSPと略称する)SP1において、先行句が後続句に
直接かかる句境界であることを判別し、ステップSP2
において次に読点があるか否かを判別する。前述のごと
く「赤い家」では読点がないので、ステップSP3にお
いて1モーラ長処理を行なうすなわち、ポーズ長設定
部202はポーズ設定部201によって設定されたポー
ズ挿入の有無、ポーズが挿入される場合の処理の情報を
入力とし、ポーズを挿入しない場合を除き、ポーズの種
類毎に、ポーズ長の基準値を設定した後、その長さを補
正することによってポーズ長を設定する。ポーズ設定規
則辞書210には、それぞれのポーズに対応したポーズ
長とポーズ長を補正するための規則が保有されている。
【0020】この規則を実現するために次に示すような
ポーズ長設定規則をポーズ長設定規則辞書210が保持
し、ポーズ長設定部202によってポーズ長が算出され
る。
【0021】まず、入力されたポーズの種類を分類す
る。分類されたポーズ長を次式に従って推定する。 推定ポーズ長=ポーズグループの平均ポーズ長+境界直
前の句が直接修飾する句数が影響を与えるポーズ時間長
+境界直前の句が受ける修飾句数が影響を与えるポーズ
時間長+並列句の有無が影響を与えるポーズ時間長+読
点の有無が影響を与えるポーズ時間長+境界直前の句が
属する品詞が影響を与えるポーズ時間長+境界直前の句
が属する活用が影響を与えるポーズ時間長+境界直後の
句が属する品詞が影響を与えるポーズ時間長 前述の1モーラ長処理においては、上述の推定ポーズ長
に従ってポーズ長を算出する。ただし、ポーズグループ
の平均ポーズ長を1モーラ長とする。
【0022】次に、たとえば、「テレビゲームやパソコ
ンで、ゲームをして遊ぶ」という文節について説明す
る。この文節の句境界は「テレビゲームやパソコン
で、」「ゲームをして」「遊ぶ」に区切られ、「遊ぶ」
という句に対して「テレビゲームやパソコンで、」が先
々行句となり、「ゲームをして」が先行句となる。「テ
レビゲームやパソコンで」という先々行句に対して「ゲ
ームをして」という先行句は直接かからないことをステ
ップSP1で判別し、ステップSP4において「テレビ
ゲームやパソコンで」と言う先々行句が「遊ぶ」にかか
ことを判別する。すなわち、句境界の先々行句が先行
句に直接かかる句構造となる。ステップSP5において
読点があるか否かを判別し、先々行句に読点があること
を判別し、ステップSP6において3モーラ長処理を行
なう。すなわち、前述の式に従ってポーズ長を推定し、
その推定ポーズ長に従ってポーズ長を算出する。
【0023】もし、ステップSP5で読点がないことを
判別すると、ステップSP8でモーラ長の判別処理を行
ない、1モーラ長であればステップSP3で1モーラ
処理を行ない、3モーラ長であればステップSP6で
モーラ処理を行なう。これは、一般に、日本語はモー
ラタイミングに基づく言語であると言われており、等間
隔のリズムで音が発語されていると言われている。ポー
ズにおいても同様にモーラを単位とした等間隔でリズム
をとっていると考えられる。この場合、話者および発話
スピードによって異なるが、句境界の性質によってポー
ズのなりやすさはほぼ決っている。すなわち、句境界の
性質によって(1)ポーズが挿入されない,(2)短ポ
ーズ,(3)長ポーズの3つが決まるが、話者および
話スピードによって、(1)(2)(2)(3)
のしきい値が異なる。このため、あいまいな領域がかな
りあり、実際にポーズを決定するためには、このしきい
値を決定し、これらを分ける必要がある。そこで、前述
のステップSP5において句境界の先々行句が先行句に
直接かかる句構造でないことを判別すると、ステップS
P7において読点の有無を判別し、読点がなければステ
ップSP3で1モーラ長処理を行ない、読点があれば
テップSP8においてモーラ長の判別処理を行なう。そ
して、1モーラ長であることを判別したときにはステッ
プSP3で1モーラ長処理を行ない、3モーラ長である
ことを判別したときにはステップSP6で3モーラ長処
理を行なう。3モーラ長処理においても、上述の推定ポ
ーズ長に従ってポーズ長を算出する。ただし、ポーズグ
ループの平均ポーズ長を3モーラとする。
【0024】
【発明の効果】以上のように、この発明によれば、入力
された合成音声の情報に応じて、ポーズ設定規則辞書に
保有しているポーズ設定規則に従って、先行句が後続句
に直接係る句境界にポーズを設定し、ポーズの種類ごと
にポーズ長の基準値を設定した後、その長さを補正して
1モーラの長さの整数倍になるようにポーズ長を設定す
るようにしたので、より人間が発声する自然の音声に近
いポーズを生成することができ、自然の音声に近い規則
合成音声を生成することができる。
【図面の簡単な説明】
【図1】この発明の一実施例の概略ブロック図である。
【図2】図1に示した韻律パラメータ生成部の具体的な
ブロック図である。
【図3】この発明の一実施例の具体的な動作を説明する
ためのフロー図である。
【符号の説明】
101 入力部 102 韻律パラメータ生成部 103 韻律規則辞書 104 音声パラメータ生成部 105 音声パラメータ接続規則辞書 106 音声合成部 107 出力部 201 ポーズ設定部 202 ポーズ長設定部 203 音韻継続長設定部 204 基本周波数設定部 205 パワー設定部 210 ポーズ設定規則辞書 211 音韻継続長設定規則辞書 212 基本周波数設定規則辞書 213 パワー設定規則辞書
───────────────────────────────────────────────────── フロントページの続き (72)発明者 匂坂 芳典 京都府相楽郡精華町大字乾谷小字三平谷 5番地 株式会社エイ・ティ・アール自 動翻訳電話研究所内 (56)参考文献 特開 昭63−231398(JP,A)

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 音韻継続時間長,基本周波数,ポーズな
    どの合成音声の情報を入力して任意の音声を出力する音
    声規則合成装置において、 ポーズ設定規則を保有するポーズ設定規則辞書、および
    入力された合成音声の情報に応じて、前記ポーズ設定規
    則辞書に保有しているポーズ設定規則に従って、先行句
    が後続句に直接係る句境界にポーズを設定し、この
    ーズに対応するポーズ時間長を設定した後、そのポーズ
    時間長とポーズグループの平均ポーズ長とを加算して推
    ポーズ長を設定するポーズ設定手段を備えた、音声規
    則合成装置。
  2. 【請求項2】 前記ポーズ設定手段は、前記句境界のポ
    ーズ生成に関して、2種類以上の平均ポーズを設定す
    ることを特徴とする、請求項1の音声規則合成装置。
  3. 【請求項3】 前記ポーズ設定手段は、1モーラの整
    数倍になるように平均ポーズ長を設定した後、推定ポー
    ズ長に影響を与える各種要因によって推定ポーズ長を
    正して設定することを特徴とする、請求項2の音声規則
    合成装置。
  4. 【請求項4】 前記ポーズ設定手段は、1モーラと3
    モーラの2種類のポーズを設定することを特徴とす
    る、請求項1ないし3のいずれかの音声規則合成装置。
  5. 【請求項5】 前記ポーズ設定手段は、それぞれのポー
    ズについて、別々にポーズ時間長を設定することを特徴
    とする、請求項2の音声規則合成装置。
JP4214234A 1992-08-11 1992-08-11 音声規則合成装置 Expired - Lifetime JP3060422B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4214234A JP3060422B2 (ja) 1992-08-11 1992-08-11 音声規則合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4214234A JP3060422B2 (ja) 1992-08-11 1992-08-11 音声規則合成装置

Publications (2)

Publication Number Publication Date
JPH0659695A JPH0659695A (ja) 1994-03-04
JP3060422B2 true JP3060422B2 (ja) 2000-07-10

Family

ID=16652412

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4214234A Expired - Lifetime JP3060422B2 (ja) 1992-08-11 1992-08-11 音声規則合成装置

Country Status (1)

Country Link
JP (1) JP3060422B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1320482C (zh) * 2003-09-29 2007-06-06 摩托罗拉公司 标识文本串中的自然语音停顿的方法
JP6009403B2 (ja) * 2013-05-10 2016-10-19 日本電信電話株式会社 ポーズ付与装置とその方法とプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63231398A (ja) * 1987-03-19 1988-09-27 株式会社リコー ポ−ズ長制御方式

Also Published As

Publication number Publication date
JPH0659695A (ja) 1994-03-04

Similar Documents

Publication Publication Date Title
JP3854713B2 (ja) 音声合成方法および装置および記憶媒体
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
US5790978A (en) System and method for determining pitch contours
JP2008545995A (ja) ハイブリッド音声合成装置、方法および用途
JP4632384B2 (ja) 音声情報処理装置及びその方法と記憶媒体
JP2009139677A (ja) 音声処理装置及びそのプログラム
US6832192B2 (en) Speech synthesizing method and apparatus
JP3060422B2 (ja) 音声規則合成装置
WO2023116243A1 (zh) 数据转换方法及计算机存储介质
JP3006240B2 (ja) 音声合成方法および装置
JP2004021207A (ja) 音素認識方法、音素認識装置および音素認識プログラム
JPH07200554A (ja) 文章読み上げ装置
JP3963141B2 (ja) 歌唱合成装置、歌唱合成用プログラム及び歌唱合成用プログラムを記録したコンピュータで読み取り可能な記録媒体
JP2785628B2 (ja) ピッチパタン生成装置
JP4287664B2 (ja) 音声合成装置
JP2004198456A (ja) 音響モデル学習装置
JP3088211B2 (ja) 基本周波数パタン生成装置
JP2536896B2 (ja) 音声合成装置
JP2900454B2 (ja) 音声合成装置の音節データ作成方式
JPS63262696A (ja) 日本語文・音声変換装置
JP3862300B2 (ja) 音声合成に用いる情報の処理方法および装置
JPH08328578A (ja) テキスト音声合成装置
JPS62113264A (ja) 音声文書作成装置
CN116013246A (zh) 说唱音乐自动生成方法及系统
JPH06250685A (ja) 音声合成方式および規則合成装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19970916