JPH05100692A

JPH05100692A - 音声合成装置

Info

Publication number: JPH05100692A
Application number: JP3129071A
Authority: JP
Inventors: Takashi Yato; 隆矢頭
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1991-05-31
Filing date: 1991-05-31
Publication date: 1993-04-23

Abstract

(57)【要約】【目的】使用者による個々の音声制御パラメータの設
定を不要とし、種々の発話スタイルを容易に実現する。【構成】文字情報を入力して音声を合成する音声合成
装置であって、明朗、落胆等の感情を表す発話モードを
指定する発話モード指定部１７と、発話モードに応じて
予め設定した発声速度、抑揚の大きさ等の情報のレベル
の組合せを記憶する音声制御パラメータ記憶部１８と、
この記憶部１８から前記発話モードに応じた組合せを読
み出し、各レベルを一括して設定する音声制御レベル設
定部１６とを備え、前記指定部１７で任意の発話モード
を指定し、この指定に対応する発声速度等のレベルの組
み合わせを前記記憶部１８から読出し、前記設定部１６
で各レベルを一括して設定し、明朗、落胆等の感情を表
す合成音声を生成する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は文字列情報を入力し、そ
れを音声に変換して出力する音声合成装置に関する。

【０００２】

【従来の技術】音声合成装置は、文字列情報を入力し、
それを音声に変換して出力するもので、出力語彙の制限
がないことから録音・再生型の音声合成に代わる技術と
して種々の利用分野での応用が期待できる。

【０００３】従来、この種の音声合成装置としては、図
２に示すようなものがある。図中の１００は文字情報入
力部で、入力テキストとして外部から入力する漢字かな
混じり文の文字情報をテキスト解析部１０１に出力す
る。テキスト解析部１０１は、文字情報入力部１００よ
り入力した文字情報から音韻・韻律記号列を生成する。
ここで、音韻・韻律記号列とは、入力文の読み、アクセ
ント、イントネーション等を文字列として記述したもの
（中間言語）である。

【０００４】１０２は単語の読みとアクセントが登録さ
れた発音辞書で、テキスト解析部１０１はこの発音辞書
１０２を参照しながら音韻・韻律記号列を生成する。

【０００５】１０３は合成パラメータ生成部で、音声素
片等を蓄積するＲＯＭ等から構成された音声素片メモリ
１０４を参照しながら、テキスト解析部１０１からの音
韻・韻律記号列に基づき、音声素片（音の種類）、音韻
継続時間（音の長さ）、基本周波数（声の高さ）等の各
パターンからなる合成パラメータを生成する。ここで、
音声素片とは、接続して合成波形を作るための音声の基
本単位で、音の種類等に応じて様々なものがある。

【０００６】１０５は音声合成部で、合成パラメータ生
成部１０３で生成した合成パラメータに基づいて合成波
形が生成され、スピーカ１０６を通して合成音声が出力
される。

【０００７】一方、この種の音声合成装置の多くは、合
成音声をユーザーの好みの音色にするための機能として
発声速度、発声強度、声の高さ、抑揚の大きさ等（以下
「音声制御パラメータ」という）を、それぞれ数段階の
レベルの中から逐一選択して設定できるようになってい
る。この音声制御パラメータのレベルの指定は、入力テ
キスト中に使用者によって逐一定められた特殊文字コー
ド（例えば、図３に示すレベル指定特殊コード）を挿入
することによって行う。

【０００８】挿入された音声制御パラメータのレベル設
定用特殊文字コードは、音声制御レベル設定部（図示せ
ず）によって解読され、各制御パラメータのレベル設定
がなされる。

【０００９】なお、音声制御パラメータのレベルを様々
に調整すると、模擬的に多様な発話スタイルが実現でき
る。例えば、発声速度を遅く、発声強度を弱く、声の高
さをやや低く、抑揚の変化を小さくすると、暗く沈んだ
感じの合成音声となり、これらを逆にすれば、明るく弾
んだ感じの合成音声となる。

【００１０】

【発明が解決しようとする課題】しかし、上述した構成
の音声合成装置では、発声速度、発声強度、音の高さ等
を調整して「明朗」、「落胆」、「怒り」等の情緒表現
をしようとした場合、音声制御コードによって逐一、速
度、強度、高さ、抑揚等のレベルを指定しなければなら
ず、操作が非常に繁雑である。しかも、種々の情緒表現
に対して各音声制御パラメータをどのようなレベルに設
定すればよいかは、実際に各種のレベルに設定した経験
によってしかなしえず、一般ユーザーでは容易に設定す
ることはできないという問題点がある。

【００１１】本発明は、以上の問題点を考慮してなされ
たものであり、簡便な操作で発声内容または使用者の意
図する情緒表現をもって合成音声を生成できる音声合成
装置を提供することを目的とする。

【００１２】

【課題を解決するための手段】係る課題を解決するため
に本発明は、文字情報を入力することにより音声を合成
する音声合成装置に関する。係る音声合成装置におい
て、「明朗」、「落胆」、「怒り」等の感情を表す発話
モードを指定する発話モード指定手段と、前記発話モー
ドに応じて予め設定した発声速度、発声強度、声の高
さ、抑揚の大きさ等のレベルの組み合わせを記憶する記
憶手段と、この記憶手段から前記発話モードに応じた組
み合わせを読み出し、各レベルを一括して設定するレベ
ル設定手段とを備えたことを特徴とする。

【００１３】

【作用】発話モード指定手段によって任意の発話モード
を指定し、この指定に対応する発声速度等のレベルの組
み合わせを記憶手段から読出し、レベル設定手段によっ
て各レベルを一括して設定し、「明朗」、「落胆」、
「怒り」等の感情を表す合成音声を容易に生成する。

【００１４】

【実施例】以下、本発明の実施例を図１、図４及び図５
を参照しながら詳述する。

【００１５】まず、本発明の第１実施例を図１及び図４
に基づいて説明する。図１は第１実施例による音声合成
装置を示すブロック図、図４は音声制御パターンの一例
を示す説明図である。

【００１６】この音声合成装置は、文字情報入力部１
０、テキスト解析部１１、発音辞書１２、合成パラメー
タ生成部１３、音声素片メモリ１４、音声合成部１５、
スピーカ１９を有する点で従来の音声合成装置と同様で
あるが、さらに本実施例の音声合成装置では、レベル設
定手段としての音声制御レベル設定部１６、発話モード
指定手段としての発話モード指定部１７及び記憶手段と
しての音声制御パラメータ記憶部１８を有している。

【００１７】音声制御パラメータ記憶部１８は、図４に
示すように、複数のモードから構成され、各モード毎に
発声速度、発声強度、声の高さ、抑揚の大きさ等の音声
制御パラメータのレベルが設定され記憶されている。音
声制御パラメータのレベルは、「明朗」、「落胆」、
「怒り」等の情緒表現に応じてそれぞれ設定される。例
えば、モード１は通常朗読調に、モード２は明朗快活調
に、モード３は悲哀落胆調にそれぞれ設定される。この
他、微妙な感情表現に合せて各種のモードが設定され、
各種の感情を表現するのに最も適した音声制御パラメー
タのレベルの組み合わせが、予め記録されている。

【００１８】発話モード指定部１７は使用者の意図する
情緒表現を指示するためのもので、指示された情緒表現
に対応した特定の発話モードを音声制御レベル設定部１
６に出力する。音声制御レベル設定部１６は入力された
発話モードに基づき、音声制御パラメータ記憶部１８か
ら対応するモードを読出し、音声制御パラメータのレベ
ルを一括して設定する。

【００１９】本実施例の音声合成装置は以上のように構
成されるが、次にその動作について説明する。

【００２０】まず、入力テキストから音声を合成するの
に先立って、音声合成時の発話モードを指定する。具体
的には、発話モード指定部１７において、複数のモード
の中から、使用者が意図する情緒表現を示す１つの発話
モードを選択して入力する。音声制御レベル設定部１６
は、発話モード指定部１７から入力された発話モードに
対応する音声制御パラメータ記憶部１８内の音声制御パ
ラメータの組み合わせ、即ちレベル１，２，３等のうち
の１つを読出し、音声制御パラメータのレベルを一括し
て設定する。

【００２１】一方、文字情報入力部１０から音声合成部
１５間での処理は前述した従来の音声合成装置と同様
で、文字情報入力部１０より入力された漢字かな混じり
文は、発音辞書１２を参照しながらテキスト解析部１１
で解析され、音韻・韻律記号列に変換される。文字情報
入力部１０からの入力テキストは同時に音声制御レベル
設定部１６にも入力される。音声制御レベル設定部１６
では、入力テキスト中に挿入された特殊コードを判別
し、この特殊コードによって指定された個別の制御パラ
メータのレベルを設定する。

【００２２】合成パラメータ生成部１３においては、音
韻・韻律記号列及び設定された各種の音声制御パラメー
タに基づき、音声素片、音韻継続時間、基本周波数パタ
ーン等の合成パラメータを生成する。音声合成部１５で
は、合成パラメータ及び音声制御レベル設定部１６から
の制御パラメータに基づいて合成波形が生成され、スピ
ーカ１９から使用者の意図する感情のこもった合成音声
が出力される。

【００２３】次に、本発明の第２実施例を図５に基づい
て説明する。

【００２４】前記第１実施例では発話モード指定手段と
して使用者が個別に発話モードを指定する発話モード指
定部１７を設けたが、本実施例では発話モード指定手段
として、発話モードを入力テキスト中に特殊コードとし
て埋め込む方式を採用する。なお、本実施例の音声合成
装置の全体構成は、第１実施例とほぼ同様であり、文字
情報入力部２０、テキスト解析部２１、発音辞書２２、
合成パラメータ生成部２３、音声素片メモリ２４、音声
合成部２５、音声制御レベル設定部２６、音声制御パラ
メータ記憶部２８、スピーカ２９を有している。さら
に、本実施例では従来の発話モード指定部１７の代わり
に発話モード指定手段として発話モード判別部２７を備
えている。この発話モード判別部２７は、入力テキスト
に埋め込んだ特殊コードを解読し、発話コードを判別す
る。

【００２５】発話モードを指定する場合は、まず、発話
モード指定のために予め定めた特殊コード（例えば、
「Ｍ１」，「Ｍ２」等）を入力テキスト中に埋め込む。
この発話モード指定のための特殊コードを埋め込んだ入
力テキストを文字情報入力部２０から発話モード判別部
２７に入力し、この発話モード判別部２７で特殊コード
が解読される。解読された特殊コードは発話モードコー
ドとして音声制御レベル設定部２６に送られ、これ以降
は前記第１実施例と同様の処理がなされる。

【００２６】

【発明の効果】以上、詳述したように、本発明によれ
ば、「明朗」、「落胆」、「怒り」等の感情を表す発話
モードを指定する発話モード指定手段と、前記発話モー
ドに応じて予め設定した発声速度、発声強度、声の高
さ、抑揚の大きさ等のレベルの組み合わせを記憶する記
憶手段と、この記憶手段から前記発話モードに応じた組
み合わせを読み出し、各レベルを一括して設定するレベ
ル設定手段とを備え、使用者は発話モード指定手段によ
って任意の発話モードを指定し、この指定に対応する発
声速度等のレベルの組み合わせを記憶手段から読出し、
レベル設定手段によって各レベルを一括して設定し、
「明朗」、「落胆」、「怒り」等の感情を表す合成音声
を生成するようにしたので、使用者が個々の音声制御パ
ラメータの値を逐一設定する必要がなくなり、種々の発
話スタイルを容易に実現することができるようになる。

【図面の簡単な説明】

【図１】本発明の第１実施例による音声合成装置を示す
ブロック図である。

【図２】従来の音声合成装置を示すブロック図である。

【図３】音声制御パラメータのレベル指定のための特殊
文字コードを示す図表である。

【図４】音声制御パターンの一例を示す説明図である。

【図５】本発明の第２実施例による音声合成装置を示す
ブロック図である。

【符号の説明】１０文字情報入力部１１テキスト解析部１２発音辞書１３合成パラメータ生成部１４音声素片メモリ１５音声合成部１６音声制御レベル設定部１７発話モード指定部１８音声制御パラメータ記憶部１９スピーカ

Claims

【特許請求の範囲】

【請求項１】文字情報を入力することにより音声を合
成する音声合成装置において、「明朗」、「落胆」、「怒り」等の感情を表す発話モー
ドを指定する発話モード指定手段と、前記発話モードに応じて予め設定した発声速度、発声強
度、声の高さ、抑揚の大きさ等のレベルの組み合わせを
記憶する記憶手段と、この記憶手段から前記発話モードに応じた組み合わせを
読み出し、各レベルを一括して設定するレベル設定手段
とを備えたことを特徴とする音声合成装置。