JPH09160582A

JPH09160582A - 音声合成装置

Info

Publication number: JPH09160582A
Application number: JP7318095A
Authority: JP
Inventors: Katsuhiro Kawamata; 克広川又; Kenji Mizuguchi; 健二水口
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1995-12-06
Filing date: 1995-12-06
Publication date: 1997-06-20

Abstract

(57)【要約】【課題】文字列から音声を合成する音声合成装置にお
いて、合成した音声が自然な表現に聞こえるようにす
る。【解決手段】単語同定機構１０は、文字列から単語を
切り出して、読みとなるかな文字列を特定する。段落判
定部１０１は音声合成対象の文字列中の段落を判定する
処理を行う。韻律特定機構１１は、文字列に対して韻律
を特定する。その際、強調効果処理部１１１は、段落と
判定された部分の開始時点に、合成する音声を強調する
ための効果を加える。音声合成機構１２は、音声を合成
して出力する。ここで出力される合成音声は、段落部分
の開始時点で、強く読む、ゆっくり読む、息継ぎを入れ
るというように強調がされるので、文章の区切りが明確
となり、人間が文章を読み上げる場合と同様な自然な表
現とすることができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、文字列から音声を
合成する音声合成装置に関するものである。

【０００２】

【従来の技術】従来の、文字列を解析して、文字列の音
声を合成する音声合成装置においては、文字列における
単語又は一文ごとに、アクセント型の決定ルールに従っ
て合成する音声の韻律を決定していた。

【０００３】

【発明が解決しようとする課題】しかしながら、上記従
来の方法による韻律の決定のみでは、人間が文章を読み
上げるような自然な表現には聞こえない。これは、文字
列中の段落開始部分の読み方の相違に起因する。すなわ
ち、人間が文章を読み上げる場合は、読み上げる文章に
段落があると、段落後の文章の読みを開始する前に、息
継ぎを入れたり、段落の開始部分を強めに読んだり、ゆ
っくり読んだりするというように、メリハリを付けた読
み方をする。これに対し、上記の従来の方法では、単語
又は一文ごとの韻律の決定のみであるので、読み上げら
れる文章の区切りがどこにあるのかを把握することが困
難である。

【０００４】本発明は、文字列から音声を合成する音声
合成装置において、合成した音声が自然な表現に聞こえ
るようにすることを目的とするものである。

【０００５】

【課題を解決するための手段】本発明は、上記目的を達
成するため、単語同定機構、韻律特定機構及び、音声合
成機構を具備し、文字列を解析して該文字列の音声を合
成する音声合成装置において、単語同定機構が、文字列
中の段落を判定する段落判定部を具備し、韻律特定機構
が、段落判定部が段落と判定した部分の開始時点に、音
声を強調する効果を加える強調効果処理部を具備するも
のとする。

【０００６】ここで、単語同定機構は、かな漢字文字列
で記述される音声合成対象の文字列から単語を切り出し
て、それらの単語の読みとなるかな文字列を特定する。
これに合わせて、段落判定部は音声合成対象の文字列中
の段落を判定する処理を行う。韻律特定機構は、音声合
成対象の文字列に対して、発声される音声合成文字列の
韻律を特定する。その際、強調効果処理部は、単語同定
機構において段落と判定された部分の開始時点に、合成
する音声を強調するための効果を加える処理を実行す
る。

【０００７】音声合成機構は、単語同定機構の特定した
単語とかな文字列及び段落を元に、韻律特定機構で付加
されたイントネーション情報、アクセント情報及び、強
調効果情報を含むかな文字列に対して、音声を合成して
出力する処理を行う。上記処理により出力される合成音
声は、段落部分の開始時点で強調がされているので、文
章の区切りが明確となり、人間が文章を読み上げる場合
と同様な自然な表現とすることができる。

【０００８】本発明においては、強調効果処理部が付加
する強調効果として、段落の開始時点の音量を変更、特
に音量を大きくすることができる。この場合、読み上げ
る文章に段落があると、段落の開始部分を強めに読むと
いうように、メリハリを付けた読み方となる。これによ
り、自然な読み方の音声合成が得られる。また、本発明
においては、強調効果処理部が付加する強調効果とし
て、段落の開始時点の再生速度を変更、特に遅くするこ
とができる。この場合、読み上げる文章に段落がある
と、段落の開始部分をゆっくり読むというように、メリ
ハリを付けた読み方となる。これにより、自然な読み方
の音声合成が得られる。

【０００９】さらに、本発明においては、強調効果処理
部が付加する強調効果として、段落の開始時点の再生開
始時間を遅延することができる。この場合、読み上げる
文章に段落があると、段落後の文章の読みを開始する前
に息継ぎを入れるというように、メリハリを付けた読み
方となる。これにより、自然な読み方の音声合成が得ら
れる。

【００１０】また、音量変更処理、再生速度変更処理、
再生開始遅延処理は、それぞれ単独に用いることも、２
つ又は３つを組み合わせて使用することも可能である。

【００１１】

【発明の実施の形態】以下、本発明の実施の形態につい
て図を用いて説明する。図１は、音声合成装置の構成を
示すブロック図である。図において、１は音声合成装置
で、単語同定機構１０、韻律特定機構１１、音声合成機
構１２から構成される。

【００１２】単語同定機構１０は、前処理部１００、段
落判定部１０１、単語同定部１０２、言語辞書１０３か
ら構成される。前処理部１００は、かな漢字文字列で記
述された文字列が入力されると、この文字列から単語を
切り出す。言語辞書１０３は、単語とその読みのかな文
字列との対応関係を管理する。単語同定部１０２は、言
語辞書１０３を参照しつつ、前処理部１００の切り出し
た単語を単位にして処理を行うことで、文字列の読みの
かな文字列を特定する。段落判定部１０１は、音声合成
対象の文字列から段落部分を抽出する。

【００１３】韻律特定機構１１は、韻律特定部１１０と
強調効果処理部１１１から構成される。強調効果処理部
１１１は、音量変更処理部１１２、再生速度変更処理部
１１３、再生開始遅延処理部１１４から構成される。な
お、音量変更処理部１１２、再生速度変更処理部１１
３、再生開始遅延処理部１１４は、それぞれ単独に用い
ることも、２つ又は３つを組み合わせて用いることもで
きる。

【００１４】音声合成機構１２は、韻律処理部１２０、
合成辞書１２１、音声合成部１２２とから構成される。
韻律処理部１２０は、単語同定機構１０の特定した単語
とかな文字列及び段落を元に、韻律特定機構１１で付加
されたイントネーション情報、アクセント情報及び、強
調効果情報を含むかな文字列に対して、合成音声の韻律
を処理する。合成辞書１２１は、合成音声との対応関係
を管理する。音声合成部１２２は、合成辞書１２１を参
照しつつ音声を合成する。

【００１５】なお、上記図１の装置を構成する各部分
は、強調効果処理部１１１を除いて、公知のものを使用
することができる。したがって、各部分の詳細な説明は
省略する。次に、図１の音声合成装置の動作について説
明する。単語同定機構１０は、かな漢字文字列で記述さ
れる音声合成対象の文字列から単語を切り出して、それ
らの単語の読みとなるかな文字列を特定し、合わせて音
声合成対象の文字列中の段落を判定する処理を行う。

【００１６】韻律特定機構１１は、韻律特定部１１０に
より、音声合成対象の文字列に対して、発声される音声
合成文字列の韻律を特定する。強調効果処理部１１１
は、単語同定機構１０において段落と判定された部分の
開始時点において、合成する音声を強調するための効果
を特定して、韻律特定部１１０の処理結果に効果情報を
加える。韻律特定機構１１の処理の詳細については、後
述する。

【００１７】音声合成部１２２は、かな文字列の音声を
合成して出力する処理を行う。図２のフローチャートを
用いて、韻律特定機構１１の処理を説明する。ステップ
ＳＴ１では、韻律特定部１１０により、通常の、合成音
声のかな文字列に付加するイントネーション情報を特定
していく韻律特定処理を実行する。ステップＳＴ２で
は、当該かな文字列が段落と特定されたか否かを判定す
る。ここで、段落と特定されていなければ、そのまま、
当該かな文字列に対する処理を終了するが、段落と特定
された場合は、ステップＳＴ３へ進む。

【００１８】ステップＳＴ３では、当該文字列に対し
て、段落の開始時点を強調する処理を行い、合成音声を
強調するための情報を付加して、当該文字列に対する韻
律特定処理を終了する。この処理により、文字列は、段
落の開始時点で強調されることとなる。これにより、自
然な表現が得られる。

【００１９】以下、強調する効果の具体例について説明
する。なお、以下の処理において、ステップＳＴ１及び
ステップＳＴ２については、図２と同一であるので、ス
テップＳＴ３についてのみ説明をする。図３は、段落の
開始時点において合成音声の音量を変更する例である。
この例では、図１の強調効果処理部１１１には、音量変
更処理部１１２のみが設けられる。

【００２０】図３のステップＳＴ３では、出力するかな
文字列に対して、段落の開始時点における合成音声の音
量が大きくなるように音量情報を付加する。なお、合成
音声の音量を大きくするに当たっては、段落の開始以前
の音量と比べて著しく異ならないように、かつ、段落の
開始時点の音量から段落の開始以前の音量へと、音量を
徐々に落としていくようにし、段落の終了までには段落
の開始以前の音量に戻るように制御する。

【００２１】この処理により、文字列は、段落の開始時
点で強く読まれることとなる。これにより、自然な表現
が得られる。図４は、段落の開始時点において合成音声
の再生速度を変更する例である。この例では、図１の強
調効果処理部１１１には、再生速度変更処理部１１３の
みが設けられる。

【００２２】図４のステップＳＴ３では、出力するかな
文字列に対して、段落の開始時点における合成音声の再
生速度を遅くなるように再生速度情報を付加する。な
お、合成音声の再生速度を遅くするに当たっては、段落
の開始以前の再生速度と比べて著しく異ならないよう
に、かつ、段落の開始時点の再生速度から段落の開始以
前の再生速度へと、再生速度を徐々に速くしていくよう
にし、段落の終了までには段落の開始以前の再生速度に
戻るように制御する。

【００２３】この処理により、文字列は、段落の開始時
点で、ゆっくりと読み上げられることとなる。これによ
り、自然な表現が得られる。図５は、段落の開始時点に
おいて合成音声の再生開始を遅延させる例である。この
例では、図１の強調効果処理部１１１には、再生開始遅
延処理部１１４のみが設けられる。

【００２４】図５のステップＳＴでは、出力するかな文
字列に対して、段落の開始時点における合成音声の再生
開始時間を送らせるように、再生開始の遅延情報を付加
する。なお、合成音声の再生開始時間を遅らせるに当た
っては、段落の開始時点の前のポーズ情報に重ねてポー
ズ情報を付加するか、又は段落の開始時点に無音の情報
を付加する。

【００２５】この処理により、文字列は、段落の開始時
点で、間をあけて読み上げられることとなる。これによ
り、自然な表現が得られる。図６〜図９は、前述の図３
〜５の例を組み合わせた例である。図６のステップＳＴ
３は、図３の音量変更と、図４の再生速度変更を組み合
わせた例である。この例では、図１の強調効果処理部１
１１には、音量変更処理部１１２と再生速度変更処理ブ
ロック１１３が設けられる。

【００２６】図７のステップＳＴ３は、図３の音量変更
と、図５の再生開始遅延を組み合わせた例である。この
例では、図１の強調効果処理部１１１には、音量変更処
理部１１２と再生開始遅延処理部１１４が設けられる。
図８のステップＳＴ３は、図４の再生速度変更と、図５
の再生開始遅延を組み合わせた例である。この例では、
図１の強調効果処理部１１１には、再生速度変更処理ブ
ロック１１３と再生開始遅延処理部１１４が設けられ
る。

【００２７】さらに、図９のステップＳＴ３は、図３の
音量変更と、図４の再生速度変更と、図５の再生開始遅
延を組み合わせた例である。この例では、図１の強調効
果処理部１１１には、図示したとおり、音量変更処理部
１１２、再生速度変更処理ブロック１１３、再生開始遅
延処理部１１４が設けられる。これらのように、２つ以
上の強調効果を組み合わせることにより、段落部分を更
に強調することが可能となる。

【００２８】

【発明の効果】本発明によれば、文字列から音声を合成
する音声合成装置において、文章中の段落を引き立たせ
て自然な表現に聞こえるように、音声を合成することが
できる。

【図面の簡単な説明】

【図１】本発明の音声合成装置の実施形態の構成を示す
ブロック図。

【図２】図１の装置における処理フローを示すフローチ
ャート（その１）。

【図３】図１の装置における処理フローを示すフローチ
ャート（その２）。

【図４】図１の装置における処理フローを示すフローチ
ャート（その３）。

【図５】図１の装置における処理フローを示すフローチ
ャート（その４）。

【図６】図１の装置における処理フローを示すフローチ
ャート（その５）。

【図７】図１の装置における処理フローを示すフローチ
ャート（その６）。

【図８】図１の装置における処理フローを示すフローチ
ャート（その７）。

【図９】図１の装置における処理フローを示すフローチ
ャート（その８）。

【図１０】従来の音声合成装置の構成を示すブロック
図。

【符号の説明】

１…音声合成装置１０…単語同定機構１００…前処理部１０１…段落判定部１０２…単語同定部１０３…言語辞書１１…韻律特定機構１１０…韻律特定部１１１…強調効果処理部１１２…音量変更処理部１１３…再生速度変更処理部１１４…再生開始遅延処理部１２…音声合成機構１２０…韻律処理部１２１…合成辞書１２２…音声合成部

Claims

【特許請求の範囲】

【請求項１】単語同定機構、韻律特定機構及び、音声
合成機構を具備し、入力された文字列を解析して、該文
字列の音声を合成する音声合成装置において、前記単語
同定機構が、前記文字列中の段落を判定する段落判定部
を具備し、前記韻律特定機構が、前記段落判定部が段落
と判定した部分の開始時点に、音声を強調する効果を加
える強調効果処理部を具備することを特徴とする音声合
成装置。
【請求項２】前記強調効果処理部が、前記段落の開始
時点の音量を変更することにより強調を行う音量変更処
理部を具備することを特徴とする請求項１記載の音声合
成装置。
【請求項３】前記強調効果処理部が、前記段落の開始
時点の再生速度を変更することにより強調を行う再生速
度変更処理部を具備することを特徴とする請求項１記載
の音声合成装置。
【請求項４】前記強調効果処理部が、前記段落の開始
時点の再生開始時間を遅延させることにより強調を行う
再生開始遅延処理部を具備することを特徴とする請求項
１記載の音声合成装置。
【請求項５】前記再生開始遅延処理部が、前記段落の
開始時点の前のポーズ情報に重ねてポーズ情報を付加す
ることにより、前記段落部分の再生開始時間を遅延させ
ることを特徴とする請求項４記載の音声合成装置。
【請求項６】前記再生開始遅延処理部が、前記段落の
開始時点に無音の情報を付加することにより、再生開始
時間を遅延させることを特徴とする請求項４記載の音声
合成装置。
【請求項７】前記強調効果処理部が、前記段落の開始
時点の音量を変更することにより強調を行う音量変更処
理部と、前記段落の開始時点の再生速度を変更すること
により強調を行う再生速度変更処理部とを具備すること
を特徴とする請求項１記載の音声合成装置。
【請求項８】前記強調効果処理部が、前記段落の開始
時点の音量を変更することにより強調を行う音量変更処
理部と、前記段落の開始時点の再生開始時間を遅延させ
ることにより強調を行う再生開始遅延処理部を具備する
ことを特徴とする請求項１記載の音声合成装置。
【請求項９】前記強調効果処理部が、前記段落の開始
時点の再生速度を変更することにより強調を行う再生速
度変更処理部と、前記段落の開始時点の再生開始時間を
遅延させることにより強調を行う再生開始遅延処理部を
具備することを特徴とする請求項１記載の音声合成装
置。
【請求項１０】前記強調効果処理部が、前記段落の開
始時点の音量を変更することにより強調を行う音量変更
処理部と、前記段落の開始時点の再生速度を変更するこ
とにより強調を行う再生速度変更処理部と、前記段落の
開始時点の再生開始時間を遅延させることにより強調を
行う再生開始遅延処理部を具備することを特徴とする請
求項１記載の音声合成装置。