JPH05100692A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH05100692A
JPH05100692A JP3129071A JP12907191A JPH05100692A JP H05100692 A JPH05100692 A JP H05100692A JP 3129071 A JP3129071 A JP 3129071A JP 12907191 A JP12907191 A JP 12907191A JP H05100692 A JPH05100692 A JP H05100692A
Authority
JP
Japan
Prior art keywords
voice
utterance
mode
unit
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3129071A
Other languages
English (en)
Inventor
Takashi Yato
隆 矢頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3129071A priority Critical patent/JPH05100692A/ja
Publication of JPH05100692A publication Critical patent/JPH05100692A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 使用者による個々の音声制御パラメータの設
定を不要とし、種々の発話スタイルを容易に実現する。 【構成】 文字情報を入力して音声を合成する音声合成
装置であって、明朗、落胆等の感情を表す発話モードを
指定する発話モード指定部17と、発話モードに応じて
予め設定した発声速度、抑揚の大きさ等の情報のレベル
の組合せを記憶する音声制御パラメータ記憶部18と、
この記憶部18から前記発話モードに応じた組合せを読
み出し、各レベルを一括して設定する音声制御レベル設
定部16とを備え、前記指定部17で任意の発話モード
を指定し、この指定に対応する発声速度等のレベルの組
み合わせを前記記憶部18から読出し、前記設定部16
で各レベルを一括して設定し、明朗、落胆等の感情を表
す合成音声を生成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字列情報を入力し、そ
れを音声に変換して出力する音声合成装置に関する。
【0002】
【従来の技術】音声合成装置は、文字列情報を入力し、
それを音声に変換して出力するもので、出力語彙の制限
がないことから録音・再生型の音声合成に代わる技術と
して種々の利用分野での応用が期待できる。
【0003】従来、この種の音声合成装置としては、図
2に示すようなものがある。図中の100は文字情報入
力部で、入力テキストとして外部から入力する漢字かな
混じり文の文字情報をテキスト解析部101に出力す
る。テキスト解析部101は、文字情報入力部100よ
り入力した文字情報から音韻・韻律記号列を生成する。
ここで、音韻・韻律記号列とは、入力文の読み、アクセ
ント、イントネーション等を文字列として記述したもの
(中間言語)である。
【0004】102は単語の読みとアクセントが登録さ
れた発音辞書で、テキスト解析部101はこの発音辞書
102を参照しながら音韻・韻律記号列を生成する。
【0005】103は合成パラメータ生成部で、音声素
片等を蓄積するROM等から構成された音声素片メモリ
104を参照しながら、テキスト解析部101からの音
韻・韻律記号列に基づき、音声素片(音の種類)、音韻
継続時間(音の長さ)、基本周波数(声の高さ)等の各
パターンからなる合成パラメータを生成する。ここで、
音声素片とは、接続して合成波形を作るための音声の基
本単位で、音の種類等に応じて様々なものがある。
【0006】105は音声合成部で、合成パラメータ生
成部103で生成した合成パラメータに基づいて合成波
形が生成され、スピーカ106を通して合成音声が出力
される。
【0007】一方、この種の音声合成装置の多くは、合
成音声をユーザーの好みの音色にするための機能として
発声速度、発声強度、声の高さ、抑揚の大きさ等(以下
「音声制御パラメータ」という)を、それぞれ数段階の
レベルの中から逐一選択して設定できるようになってい
る。この音声制御パラメータのレベルの指定は、入力テ
キスト中に使用者によって逐一定められた特殊文字コー
ド(例えば、図3に示すレベル指定特殊コード)を挿入
することによって行う。
【0008】挿入された音声制御パラメータのレベル設
定用特殊文字コードは、音声制御レベル設定部(図示せ
ず)によって解読され、各制御パラメータのレベル設定
がなされる。
【0009】なお、音声制御パラメータのレベルを様々
に調整すると、模擬的に多様な発話スタイルが実現でき
る。例えば、発声速度を遅く、発声強度を弱く、声の高
さをやや低く、抑揚の変化を小さくすると、暗く沈んだ
感じの合成音声となり、これらを逆にすれば、明るく弾
んだ感じの合成音声となる。
【0010】
【発明が解決しようとする課題】しかし、上述した構成
の音声合成装置では、発声速度、発声強度、音の高さ等
を調整して「明朗」、「落胆」、「怒り」等の情緒表現
をしようとした場合、音声制御コードによって逐一、速
度、強度、高さ、抑揚等のレベルを指定しなければなら
ず、操作が非常に繁雑である。しかも、種々の情緒表現
に対して各音声制御パラメータをどのようなレベルに設
定すればよいかは、実際に各種のレベルに設定した経験
によってしかなしえず、一般ユーザーでは容易に設定す
ることはできないという問題点がある。
【0011】本発明は、以上の問題点を考慮してなされ
たものであり、簡便な操作で発声内容または使用者の意
図する情緒表現をもって合成音声を生成できる音声合成
装置を提供することを目的とする。
【0012】
【課題を解決するための手段】係る課題を解決するため
に本発明は、文字情報を入力することにより音声を合成
する音声合成装置に関する。係る音声合成装置におい
て、「明朗」、「落胆」、「怒り」等の感情を表す発話
モードを指定する発話モード指定手段と、前記発話モー
ドに応じて予め設定した発声速度、発声強度、声の高
さ、抑揚の大きさ等のレベルの組み合わせを記憶する記
憶手段と、この記憶手段から前記発話モードに応じた組
み合わせを読み出し、各レベルを一括して設定するレベ
ル設定手段とを備えたことを特徴とする。
【0013】
【作用】発話モード指定手段によって任意の発話モード
を指定し、この指定に対応する発声速度等のレベルの組
み合わせを記憶手段から読出し、レベル設定手段によっ
て各レベルを一括して設定し、「明朗」、「落胆」、
「怒り」等の感情を表す合成音声を容易に生成する。
【0014】
【実施例】以下、本発明の実施例を図1、図4及び図5
を参照しながら詳述する。
【0015】まず、本発明の第1実施例を図1及び図4
に基づいて説明する。図1は第1実施例による音声合成
装置を示すブロック図、図4は音声制御パターンの一例
を示す説明図である。
【0016】この音声合成装置は、文字情報入力部1
0、テキスト解析部11、発音辞書12、合成パラメー
タ生成部13、音声素片メモリ14、音声合成部15、
スピーカ19を有する点で従来の音声合成装置と同様で
あるが、さらに本実施例の音声合成装置では、レベル設
定手段としての音声制御レベル設定部16、発話モード
指定手段としての発話モード指定部17及び記憶手段と
しての音声制御パラメータ記憶部18を有している。
【0017】音声制御パラメータ記憶部18は、図4に
示すように、複数のモードから構成され、各モード毎に
発声速度、発声強度、声の高さ、抑揚の大きさ等の音声
制御パラメータのレベルが設定され記憶されている。音
声制御パラメータのレベルは、「明朗」、「落胆」、
「怒り」等の情緒表現に応じてそれぞれ設定される。例
えば、モード1は通常朗読調に、モード2は明朗快活調
に、モード3は悲哀落胆調にそれぞれ設定される。この
他、微妙な感情表現に合せて各種のモードが設定され、
各種の感情を表現するのに最も適した音声制御パラメー
タのレベルの組み合わせが、予め記録されている。
【0018】発話モード指定部17は使用者の意図する
情緒表現を指示するためのもので、指示された情緒表現
に対応した特定の発話モードを音声制御レベル設定部1
6に出力する。音声制御レベル設定部16は入力された
発話モードに基づき、音声制御パラメータ記憶部18か
ら対応するモードを読出し、音声制御パラメータのレベ
ルを一括して設定する。
【0019】本実施例の音声合成装置は以上のように構
成されるが、次にその動作について説明する。
【0020】まず、入力テキストから音声を合成するの
に先立って、音声合成時の発話モードを指定する。具体
的には、発話モード指定部17において、複数のモード
の中から、使用者が意図する情緒表現を示す1つの発話
モードを選択して入力する。音声制御レベル設定部16
は、発話モード指定部17から入力された発話モードに
対応する音声制御パラメータ記憶部18内の音声制御パ
ラメータの組み合わせ、即ちレベル1,2,3等のうち
の1つを読出し、音声制御パラメータのレベルを一括し
て設定する。
【0021】一方、文字情報入力部10から音声合成部
15間での処理は前述した従来の音声合成装置と同様
で、文字情報入力部10より入力された漢字かな混じり
文は、発音辞書12を参照しながらテキスト解析部11
で解析され、音韻・韻律記号列に変換される。文字情報
入力部10からの入力テキストは同時に音声制御レベル
設定部16にも入力される。音声制御レベル設定部16
では、入力テキスト中に挿入された特殊コードを判別
し、この特殊コードによって指定された個別の制御パラ
メータのレベルを設定する。
【0022】合成パラメータ生成部13においては、音
韻・韻律記号列及び設定された各種の音声制御パラメー
タに基づき、音声素片、音韻継続時間、基本周波数パタ
ーン等の合成パラメータを生成する。音声合成部15で
は、合成パラメータ及び音声制御レベル設定部16から
の制御パラメータに基づいて合成波形が生成され、スピ
ーカ19から使用者の意図する感情のこもった合成音声
が出力される。
【0023】次に、本発明の第2実施例を図5に基づい
て説明する。
【0024】前記第1実施例では発話モード指定手段と
して使用者が個別に発話モードを指定する発話モード指
定部17を設けたが、本実施例では発話モード指定手段
として、発話モードを入力テキスト中に特殊コードとし
て埋め込む方式を採用する。なお、本実施例の音声合成
装置の全体構成は、第1実施例とほぼ同様であり、文字
情報入力部20、テキスト解析部21、発音辞書22、
合成パラメータ生成部23、音声素片メモリ24、音声
合成部25、音声制御レベル設定部26、音声制御パラ
メータ記憶部28、スピーカ29を有している。さら
に、本実施例では従来の発話モード指定部17の代わり
に発話モード指定手段として発話モード判別部27を備
えている。この発話モード判別部27は、入力テキスト
に埋め込んだ特殊コードを解読し、発話コードを判別す
る。
【0025】発話モードを指定する場合は、まず、発話
モード指定のために予め定めた特殊コード(例えば、
「M1」,「M2」等)を入力テキスト中に埋め込む。
この発話モード指定のための特殊コードを埋め込んだ入
力テキストを文字情報入力部20から発話モード判別部
27に入力し、この発話モード判別部27で特殊コード
が解読される。解読された特殊コードは発話モードコー
ドとして音声制御レベル設定部26に送られ、これ以降
は前記第1実施例と同様の処理がなされる。
【0026】
【発明の効果】以上、詳述したように、本発明によれ
ば、「明朗」、「落胆」、「怒り」等の感情を表す発話
モードを指定する発話モード指定手段と、前記発話モー
ドに応じて予め設定した発声速度、発声強度、声の高
さ、抑揚の大きさ等のレベルの組み合わせを記憶する記
憶手段と、この記憶手段から前記発話モードに応じた組
み合わせを読み出し、各レベルを一括して設定するレベ
ル設定手段とを備え、使用者は発話モード指定手段によ
って任意の発話モードを指定し、この指定に対応する発
声速度等のレベルの組み合わせを記憶手段から読出し、
レベル設定手段によって各レベルを一括して設定し、
「明朗」、「落胆」、「怒り」等の感情を表す合成音声
を生成するようにしたので、使用者が個々の音声制御パ
ラメータの値を逐一設定する必要がなくなり、種々の発
話スタイルを容易に実現することができるようになる。
【図面の簡単な説明】
【図1】本発明の第1実施例による音声合成装置を示す
ブロック図である。
【図2】従来の音声合成装置を示すブロック図である。
【図3】音声制御パラメータのレベル指定のための特殊
文字コードを示す図表である。
【図4】音声制御パターンの一例を示す説明図である。
【図5】本発明の第2実施例による音声合成装置を示す
ブロック図である。
【符号の説明】 10 文字情報入力部 11 テキスト解析部 12 発音辞書 13 合成パラメータ生成部 14 音声素片メモリ 15 音声合成部 16 音声制御レベル設定部 17 発話モード指定部 18 音声制御パラメータ記憶部 19 スピーカ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文字情報を入力することにより音声を合
    成する音声合成装置において、 「明朗」、「落胆」、「怒り」等の感情を表す発話モー
    ドを指定する発話モード指定手段と、 前記発話モードに応じて予め設定した発声速度、発声強
    度、声の高さ、抑揚の大きさ等のレベルの組み合わせを
    記憶する記憶手段と、 この記憶手段から前記発話モードに応じた組み合わせを
    読み出し、各レベルを一括して設定するレベル設定手段
    とを備えたことを特徴とする音声合成装置。
JP3129071A 1991-05-31 1991-05-31 音声合成装置 Pending JPH05100692A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3129071A JPH05100692A (ja) 1991-05-31 1991-05-31 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3129071A JPH05100692A (ja) 1991-05-31 1991-05-31 音声合成装置

Publications (1)

Publication Number Publication Date
JPH05100692A true JPH05100692A (ja) 1993-04-23

Family

ID=15000366

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3129071A Pending JPH05100692A (ja) 1991-05-31 1991-05-31 音声合成装置

Country Status (1)

Country Link
JP (1) JPH05100692A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980065482A (ko) * 1997-01-10 1998-10-15 김광호 스피킹 스타일을 변경하는 음성 합성 방법
WO2002073594A1 (fr) * 2001-03-09 2002-09-19 Sony Corporation Dispositif de synthese vocale
JP2003233388A (ja) * 2002-02-07 2003-08-22 Sharp Corp 音声合成装置および音声合成方法、並びに、プログラム記録媒体
JP2008185911A (ja) * 2007-01-31 2008-08-14 Arcadia:Kk 音声合成装置
US8340956B2 (en) 2006-05-26 2012-12-25 Nec Corporation Information provision system, information provision method, information provision program, and information provision program recording medium
US8626489B2 (en) 2009-08-19 2014-01-07 Samsung Electronics Co., Ltd. Method and apparatus for processing data
JP2020154178A (ja) * 2019-03-20 2020-09-24 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980065482A (ko) * 1997-01-10 1998-10-15 김광호 스피킹 스타일을 변경하는 음성 합성 방법
WO2002073594A1 (fr) * 2001-03-09 2002-09-19 Sony Corporation Dispositif de synthese vocale
JP2003233388A (ja) * 2002-02-07 2003-08-22 Sharp Corp 音声合成装置および音声合成方法、並びに、プログラム記録媒体
US8340956B2 (en) 2006-05-26 2012-12-25 Nec Corporation Information provision system, information provision method, information provision program, and information provision program recording medium
JP2008185911A (ja) * 2007-01-31 2008-08-14 Arcadia:Kk 音声合成装置
US8626489B2 (en) 2009-08-19 2014-01-07 Samsung Electronics Co., Ltd. Method and apparatus for processing data
JP2020154178A (ja) * 2019-03-20 2020-09-24 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム

Similar Documents

Publication Publication Date Title
US5860064A (en) Method and apparatus for automatic generation of vocal emotion in a synthetic text-to-speech system
US5704007A (en) Utilization of multiple voice sources in a speech synthesizer
US7979274B2 (en) Method and system for preventing speech comprehension by interactive voice response systems
US5930755A (en) Utilization of a recorded sound sample as a voice source in a speech synthesizer
US6212501B1 (en) Speech synthesis apparatus and method
JPH05113795A (ja) 音声合成装置
JPH05100692A (ja) 音声合成装置
JP4277697B2 (ja) 歌声生成装置、そのプログラム並びに歌声生成機能を有する携帯通信端末
JPH0887297A (ja) 音声合成システム
JPH08335096A (ja) テキスト音声合成装置
JPH09330019A (ja) 発声訓練装置
JP4260071B2 (ja) 音声合成方法、音声合成プログラム及び音声合成装置
JPH05224688A (ja) テキスト音声合成装置
JP2703253B2 (ja) 音声合成装置
KR20040015605A (ko) 가상노래 합성장치 및 방법
Thakur et al. Study of various kinds of speech synthesizer technologies and expression for expressive text to speech conversion system
Muralishankar et al. Human touch to Tamil speech synthesizer
JPH01321496A (ja) 音声合成装置
JP2910587B2 (ja) 音声合成装置
JPH0313999A (ja) 音声合成装置
JPH06250685A (ja) 音声合成方式および規則合成装置
JPH01112297A (ja) 音声合成装置
JPH09292897A (ja) 音声合成装置
Hu et al. Integrating coding techniques into LP-based Mandarin text-to-speech synthesis
JP2001166787A (ja) 音声合成装置および自然言語処理方法