JPH09160582A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH09160582A
JPH09160582A JP7318095A JP31809595A JPH09160582A JP H09160582 A JPH09160582 A JP H09160582A JP 7318095 A JP7318095 A JP 7318095A JP 31809595 A JP31809595 A JP 31809595A JP H09160582 A JPH09160582 A JP H09160582A
Authority
JP
Japan
Prior art keywords
paragraph
processing unit
reproduction
voice
start time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7318095A
Other languages
English (en)
Inventor
Katsuhiro Kawamata
克広 川又
Kenji Mizuguchi
健二 水口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP7318095A priority Critical patent/JPH09160582A/ja
Publication of JPH09160582A publication Critical patent/JPH09160582A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 文字列から音声を合成する音声合成装置にお
いて、合成した音声が自然な表現に聞こえるようにす
る。 【解決手段】 単語同定機構10は、文字列から単語を
切り出して、読みとなるかな文字列を特定する。段落判
定部101は音声合成対象の文字列中の段落を判定する
処理を行う。韻律特定機構11は、文字列に対して韻律
を特定する。その際、強調効果処理部111は、段落と
判定された部分の開始時点に、合成する音声を強調する
ための効果を加える。音声合成機構12は、音声を合成
して出力する。ここで出力される合成音声は、段落部分
の開始時点で、強く読む、ゆっくり読む、息継ぎを入れ
るというように強調がされるので、文章の区切りが明確
となり、人間が文章を読み上げる場合と同様な自然な表
現とすることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字列から音声を
合成する音声合成装置に関するものである。
【0002】
【従来の技術】従来の、文字列を解析して、文字列の音
声を合成する音声合成装置においては、文字列における
単語又は一文ごとに、アクセント型の決定ルールに従っ
て合成する音声の韻律を決定していた。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の方法による韻律の決定のみでは、人間が文章を読み
上げるような自然な表現には聞こえない。これは、文字
列中の段落開始部分の読み方の相違に起因する。すなわ
ち、人間が文章を読み上げる場合は、読み上げる文章に
段落があると、段落後の文章の読みを開始する前に、息
継ぎを入れたり、段落の開始部分を強めに読んだり、ゆ
っくり読んだりするというように、メリハリを付けた読
み方をする。これに対し、上記の従来の方法では、単語
又は一文ごとの韻律の決定のみであるので、読み上げら
れる文章の区切りがどこにあるのかを把握することが困
難である。
【0004】本発明は、文字列から音声を合成する音声
合成装置において、合成した音声が自然な表現に聞こえ
るようにすることを目的とするものである。
【0005】
【課題を解決するための手段】本発明は、上記目的を達
成するため、単語同定機構、韻律特定機構及び、音声合
成機構を具備し、文字列を解析して該文字列の音声を合
成する音声合成装置において、単語同定機構が、文字列
中の段落を判定する段落判定部を具備し、韻律特定機構
が、段落判定部が段落と判定した部分の開始時点に、音
声を強調する効果を加える強調効果処理部を具備するも
のとする。
【0006】ここで、単語同定機構は、かな漢字文字列
で記述される音声合成対象の文字列から単語を切り出し
て、それらの単語の読みとなるかな文字列を特定する。
これに合わせて、段落判定部は音声合成対象の文字列中
の段落を判定する処理を行う。韻律特定機構は、音声合
成対象の文字列に対して、発声される音声合成文字列の
韻律を特定する。その際、強調効果処理部は、単語同定
機構において段落と判定された部分の開始時点に、合成
する音声を強調するための効果を加える処理を実行す
る。
【0007】音声合成機構は、単語同定機構の特定した
単語とかな文字列及び段落を元に、韻律特定機構で付加
されたイントネーション情報、アクセント情報及び、強
調効果情報を含むかな文字列に対して、音声を合成して
出力する処理を行う。上記処理により出力される合成音
声は、段落部分の開始時点で強調がされているので、文
章の区切りが明確となり、人間が文章を読み上げる場合
と同様な自然な表現とすることができる。
【0008】本発明においては、強調効果処理部が付加
する強調効果として、段落の開始時点の音量を変更、特
に音量を大きくすることができる。この場合、読み上げ
る文章に段落があると、段落の開始部分を強めに読むと
いうように、メリハリを付けた読み方となる。これによ
り、自然な読み方の音声合成が得られる。また、本発明
においては、強調効果処理部が付加する強調効果とし
て、段落の開始時点の再生速度を変更、特に遅くするこ
とができる。この場合、読み上げる文章に段落がある
と、段落の開始部分をゆっくり読むというように、メリ
ハリを付けた読み方となる。これにより、自然な読み方
の音声合成が得られる。
【0009】さらに、本発明においては、強調効果処理
部が付加する強調効果として、段落の開始時点の再生開
始時間を遅延することができる。この場合、読み上げる
文章に段落があると、段落後の文章の読みを開始する前
に息継ぎを入れるというように、メリハリを付けた読み
方となる。これにより、自然な読み方の音声合成が得ら
れる。
【0010】また、音量変更処理、再生速度変更処理、
再生開始遅延処理は、それぞれ単独に用いることも、2
つ又は3つを組み合わせて使用することも可能である。
【0011】
【発明の実施の形態】以下、本発明の実施の形態につい
て図を用いて説明する。図1は、音声合成装置の構成を
示すブロック図である。図において、1は音声合成装置
で、単語同定機構10、韻律特定機構11、音声合成機
構12から構成される。
【0012】単語同定機構10は、前処理部100、段
落判定部101、単語同定部102、言語辞書103か
ら構成される。前処理部100は、かな漢字文字列で記
述された文字列が入力されると、この文字列から単語を
切り出す。言語辞書103は、単語とその読みのかな文
字列との対応関係を管理する。単語同定部102は、言
語辞書103を参照しつつ、前処理部100の切り出し
た単語を単位にして処理を行うことで、文字列の読みの
かな文字列を特定する。段落判定部101は、音声合成
対象の文字列から段落部分を抽出する。
【0013】韻律特定機構11は、韻律特定部110と
強調効果処理部111から構成される。強調効果処理部
111は、音量変更処理部112、再生速度変更処理部
113、再生開始遅延処理部114から構成される。な
お、音量変更処理部112、再生速度変更処理部11
3、再生開始遅延処理部114は、それぞれ単独に用い
ることも、2つ又は3つを組み合わせて用いることもで
きる。
【0014】音声合成機構12は、韻律処理部120、
合成辞書121、音声合成部122とから構成される。
韻律処理部120は、単語同定機構10の特定した単語
とかな文字列及び段落を元に、韻律特定機構11で付加
されたイントネーション情報、アクセント情報及び、強
調効果情報を含むかな文字列に対して、合成音声の韻律
を処理する。合成辞書121は、合成音声との対応関係
を管理する。音声合成部122は、合成辞書121を参
照しつつ音声を合成する。
【0015】なお、上記図1の装置を構成する各部分
は、強調効果処理部111を除いて、公知のものを使用
することができる。したがって、各部分の詳細な説明は
省略する。次に、図1の音声合成装置の動作について説
明する。単語同定機構10は、かな漢字文字列で記述さ
れる音声合成対象の文字列から単語を切り出して、それ
らの単語の読みとなるかな文字列を特定し、合わせて音
声合成対象の文字列中の段落を判定する処理を行う。
【0016】韻律特定機構11は、韻律特定部110に
より、音声合成対象の文字列に対して、発声される音声
合成文字列の韻律を特定する。強調効果処理部111
は、単語同定機構10において段落と判定された部分の
開始時点において、合成する音声を強調するための効果
を特定して、韻律特定部110の処理結果に効果情報を
加える。韻律特定機構11の処理の詳細については、後
述する。
【0017】音声合成部122は、かな文字列の音声を
合成して出力する処理を行う。図2のフローチャートを
用いて、韻律特定機構11の処理を説明する。ステップ
ST1では、韻律特定部110により、通常の、合成音
声のかな文字列に付加するイントネーション情報を特定
していく韻律特定処理を実行する。ステップST2で
は、当該かな文字列が段落と特定されたか否かを判定す
る。ここで、段落と特定されていなければ、そのまま、
当該かな文字列に対する処理を終了するが、段落と特定
された場合は、ステップST3へ進む。
【0018】ステップST3では、当該文字列に対し
て、段落の開始時点を強調する処理を行い、合成音声を
強調するための情報を付加して、当該文字列に対する韻
律特定処理を終了する。この処理により、文字列は、段
落の開始時点で強調されることとなる。これにより、自
然な表現が得られる。
【0019】以下、強調する効果の具体例について説明
する。なお、以下の処理において、ステップST1及び
ステップST2については、図2と同一であるので、ス
テップST3についてのみ説明をする。図3は、段落の
開始時点において合成音声の音量を変更する例である。
この例では、図1の強調効果処理部111には、音量変
更処理部112のみが設けられる。
【0020】図3のステップST3では、出力するかな
文字列に対して、段落の開始時点における合成音声の音
量が大きくなるように音量情報を付加する。なお、合成
音声の音量を大きくするに当たっては、段落の開始以前
の音量と比べて著しく異ならないように、かつ、段落の
開始時点の音量から段落の開始以前の音量へと、音量を
徐々に落としていくようにし、段落の終了までには段落
の開始以前の音量に戻るように制御する。
【0021】この処理により、文字列は、段落の開始時
点で強く読まれることとなる。これにより、自然な表現
が得られる。図4は、段落の開始時点において合成音声
の再生速度を変更する例である。この例では、図1の強
調効果処理部111には、再生速度変更処理部113の
みが設けられる。
【0022】図4のステップST3では、出力するかな
文字列に対して、段落の開始時点における合成音声の再
生速度を遅くなるように再生速度情報を付加する。な
お、合成音声の再生速度を遅くするに当たっては、段落
の開始以前の再生速度と比べて著しく異ならないよう
に、かつ、段落の開始時点の再生速度から段落の開始以
前の再生速度へと、再生速度を徐々に速くしていくよう
にし、段落の終了までには段落の開始以前の再生速度に
戻るように制御する。
【0023】この処理により、文字列は、段落の開始時
点で、ゆっくりと読み上げられることとなる。これによ
り、自然な表現が得られる。図5は、段落の開始時点に
おいて合成音声の再生開始を遅延させる例である。この
例では、図1の強調効果処理部111には、再生開始遅
延処理部114のみが設けられる。
【0024】図5のステップSTでは、出力するかな文
字列に対して、段落の開始時点における合成音声の再生
開始時間を送らせるように、再生開始の遅延情報を付加
する。なお、合成音声の再生開始時間を遅らせるに当た
っては、段落の開始時点の前のポーズ情報に重ねてポー
ズ情報を付加するか、又は段落の開始時点に無音の情報
を付加する。
【0025】この処理により、文字列は、段落の開始時
点で、間をあけて読み上げられることとなる。これによ
り、自然な表現が得られる。図6〜図9は、前述の図3
〜5の例を組み合わせた例である。図6のステップST
3は、図3の音量変更と、図4の再生速度変更を組み合
わせた例である。この例では、図1の強調効果処理部1
11には、音量変更処理部112と再生速度変更処理ブ
ロック113が設けられる。
【0026】図7のステップST3は、図3の音量変更
と、図5の再生開始遅延を組み合わせた例である。この
例では、図1の強調効果処理部111には、音量変更処
理部112と再生開始遅延処理部114が設けられる。
図8のステップST3は、図4の再生速度変更と、図5
の再生開始遅延を組み合わせた例である。この例では、
図1の強調効果処理部111には、再生速度変更処理ブ
ロック113と再生開始遅延処理部114が設けられ
る。
【0027】さらに、図9のステップST3は、図3の
音量変更と、図4の再生速度変更と、図5の再生開始遅
延を組み合わせた例である。この例では、図1の強調効
果処理部111には、図示したとおり、音量変更処理部
112、再生速度変更処理ブロック113、再生開始遅
延処理部114が設けられる。これらのように、2つ以
上の強調効果を組み合わせることにより、段落部分を更
に強調することが可能となる。
【0028】
【発明の効果】本発明によれば、文字列から音声を合成
する音声合成装置において、文章中の段落を引き立たせ
て自然な表現に聞こえるように、音声を合成することが
できる。
【図面の簡単な説明】
【図1】本発明の音声合成装置の実施形態の構成を示す
ブロック図。
【図2】図1の装置における処理フローを示すフローチ
ャート(その1)。
【図3】図1の装置における処理フローを示すフローチ
ャート(その2)。
【図4】図1の装置における処理フローを示すフローチ
ャート(その3)。
【図5】図1の装置における処理フローを示すフローチ
ャート(その4)。
【図6】図1の装置における処理フローを示すフローチ
ャート(その5)。
【図7】図1の装置における処理フローを示すフローチ
ャート(その6)。
【図8】図1の装置における処理フローを示すフローチ
ャート(その7)。
【図9】図1の装置における処理フローを示すフローチ
ャート(その8)。
【図10】従来の音声合成装置の構成を示すブロック
図。
【符号の説明】
1…音声合成装置 10…単語同定機構 100…前処理部 101…段落判定部 102…単語同定部 103…言語辞書 11…韻律特定機構 110…韻律特定部 111…強調効果処理部 112…音量変更処理部 113…再生速度変更処理部 114…再生開始遅延処理部 12…音声合成機構 120…韻律処理部 121…合成辞書 122…音声合成部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 単語同定機構、韻律特定機構及び、音声
    合成機構を具備し、入力された文字列を解析して、該文
    字列の音声を合成する音声合成装置において、前記単語
    同定機構が、前記文字列中の段落を判定する段落判定部
    を具備し、前記韻律特定機構が、前記段落判定部が段落
    と判定した部分の開始時点に、音声を強調する効果を加
    える強調効果処理部を具備することを特徴とする音声合
    成装置。
  2. 【請求項2】 前記強調効果処理部が、前記段落の開始
    時点の音量を変更することにより強調を行う音量変更処
    理部を具備することを特徴とする請求項1記載の音声合
    成装置。
  3. 【請求項3】 前記強調効果処理部が、前記段落の開始
    時点の再生速度を変更することにより強調を行う再生速
    度変更処理部を具備することを特徴とする請求項1記載
    の音声合成装置。
  4. 【請求項4】 前記強調効果処理部が、前記段落の開始
    時点の再生開始時間を遅延させることにより強調を行う
    再生開始遅延処理部を具備することを特徴とする請求項
    1記載の音声合成装置。
  5. 【請求項5】 前記再生開始遅延処理部が、前記段落の
    開始時点の前のポーズ情報に重ねてポーズ情報を付加す
    ることにより、前記段落部分の再生開始時間を遅延させ
    ることを特徴とする請求項4記載の音声合成装置。
  6. 【請求項6】 前記再生開始遅延処理部が、前記段落の
    開始時点に無音の情報を付加することにより、再生開始
    時間を遅延させることを特徴とする請求項4記載の音声
    合成装置。
  7. 【請求項7】 前記強調効果処理部が、前記段落の開始
    時点の音量を変更することにより強調を行う音量変更処
    理部と、前記段落の開始時点の再生速度を変更すること
    により強調を行う再生速度変更処理部とを具備すること
    を特徴とする請求項1記載の音声合成装置。
  8. 【請求項8】 前記強調効果処理部が、前記段落の開始
    時点の音量を変更することにより強調を行う音量変更処
    理部と、前記段落の開始時点の再生開始時間を遅延させ
    ることにより強調を行う再生開始遅延処理部を具備する
    ことを特徴とする請求項1記載の音声合成装置。
  9. 【請求項9】 前記強調効果処理部が、前記段落の開始
    時点の再生速度を変更することにより強調を行う再生速
    度変更処理部と、前記段落の開始時点の再生開始時間を
    遅延させることにより強調を行う再生開始遅延処理部を
    具備することを特徴とする請求項1記載の音声合成装
    置。
  10. 【請求項10】 前記強調効果処理部が、前記段落の開
    始時点の音量を変更することにより強調を行う音量変更
    処理部と、前記段落の開始時点の再生速度を変更するこ
    とにより強調を行う再生速度変更処理部と、前記段落の
    開始時点の再生開始時間を遅延させることにより強調を
    行う再生開始遅延処理部を具備することを特徴とする請
    求項1記載の音声合成装置。
JP7318095A 1995-12-06 1995-12-06 音声合成装置 Withdrawn JPH09160582A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7318095A JPH09160582A (ja) 1995-12-06 1995-12-06 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7318095A JPH09160582A (ja) 1995-12-06 1995-12-06 音声合成装置

Publications (1)

Publication Number Publication Date
JPH09160582A true JPH09160582A (ja) 1997-06-20

Family

ID=18095436

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7318095A Withdrawn JPH09160582A (ja) 1995-12-06 1995-12-06 音声合成装置

Country Status (1)

Country Link
JP (1) JPH09160582A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001324992A (ja) * 2000-05-15 2001-11-22 Fujitsu Ten Ltd 音声合成装置、及び音声データ記憶媒体
JP2007157284A (ja) * 2005-12-07 2007-06-21 Xanavi Informatics Corp 音声データ再生方法およびプログラム
US7487093B2 (en) 2002-04-02 2009-02-03 Canon Kabushiki Kaisha Text structure for voice synthesis, voice synthesis method, voice synthesis apparatus, and computer program thereof
US8135592B2 (en) 2006-03-31 2012-03-13 Fujitsu Limited Speech synthesizer

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001324992A (ja) * 2000-05-15 2001-11-22 Fujitsu Ten Ltd 音声合成装置、及び音声データ記憶媒体
US7487093B2 (en) 2002-04-02 2009-02-03 Canon Kabushiki Kaisha Text structure for voice synthesis, voice synthesis method, voice synthesis apparatus, and computer program thereof
JP2007157284A (ja) * 2005-12-07 2007-06-21 Xanavi Informatics Corp 音声データ再生方法およびプログラム
US8135592B2 (en) 2006-03-31 2012-03-13 Fujitsu Limited Speech synthesizer

Similar Documents

Publication Publication Date Title
Pitrelli et al. The IBM expressive text-to-speech synthesis system for American English
JPH0833744B2 (ja) 音声合成装置
US7010489B1 (en) Method for guiding text-to-speech output timing using speech recognition markers
JP2000206982A (ja) 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体
JP3587048B2 (ja) 韻律制御方法及び音声合成装置
JPH1138989A (ja) 音声合成装置及び方法
Stöber et al. Speech synthesis using multilevel selection and concatenation of units from large speech corpora
JP3518898B2 (ja) 音声合成装置
JPH09160582A (ja) 音声合成装置
JP3006240B2 (ja) 音声合成方法および装置
JP2001034284A (ja) 音声合成方法及び装置、並びに文音声変換プログラムを記録した記録媒体
JPH0580791A (ja) 音声規則合成装置および方法
JP4260071B2 (ja) 音声合成方法、音声合成プログラム及び音声合成装置
JP3357796B2 (ja) 音声合成装置及び同装置における韻律情報生成方法
JPH064090A (ja) テキスト音声変換方法および装置
JP2809769B2 (ja) 音声合成装置
JP2577372B2 (ja) 音声合成装置および方法
JPH11296193A (ja) 音声合成装置
JPS62284398A (ja) 文・音声変換装置
JP3088211B2 (ja) 基本周波数パタン生成装置
JPH0990971A (ja) 音声合成方法
JPH06138894A (ja) 音声合成装置及び音声合成方法
JPH0756591A (ja) 音声合成装置、音声合成方法及び記録媒体
JPH01216399A (ja) 音声合成装置
JPH0679235B2 (ja) 音声合成装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030304