JP2001242881A - 音声合成方法及び装置 - Google Patents

音声合成方法及び装置

Info

Publication number
JP2001242881A
JP2001242881A JP2000052857A JP2000052857A JP2001242881A JP 2001242881 A JP2001242881 A JP 2001242881A JP 2000052857 A JP2000052857 A JP 2000052857A JP 2000052857 A JP2000052857 A JP 2000052857A JP 2001242881 A JP2001242881 A JP 2001242881A
Authority
JP
Japan
Prior art keywords
parameter
speech synthesis
template
information
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000052857A
Other languages
English (en)
Other versions
JP3578961B2 (ja
Inventor
Tasuku Shinozaki
翼 篠崎
Masanobu Abe
匡伸 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000052857A priority Critical patent/JP3578961B2/ja
Publication of JP2001242881A publication Critical patent/JP2001242881A/ja
Application granted granted Critical
Publication of JP3578961B2 publication Critical patent/JP3578961B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 感情表現など多様な表情をもった自然で滑ら
かな音声を合成できる音声合成方法及び装置を提供す
る。 【解決手段】 応答テンプレートセット10から応答テ
ンプレート11を選択し、該応答テンプレート11の記
述及び入力装置11からの入力情報に基づき合成パラメ
ータ生成装置5及び音声セット選択装置6で音声合成用
パラメータを作成し、該音声合成用パラメータを前記応
答テンプレートの記述に基づき結合し、結合した音声合
成用パラメータに基づき合成音声生成装置8で音声を生
成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、人−システムのイ
ンタフェース(マン・マシン・インタフェース)などに
用いられる音声合成方法及び装置に関する。
【0002】
【従来の技術】音声による応答は、電話による応答装置
や金融機関のCD(現金自動支払装置),ATM(現金
自動預入支払装置),各種自動販売機,電卓,音声を使
ったおもちゃ,コンピュータ,音声対話システム,自動
受付システム,CAI(コンピュータ支援教育)システ
ムといった幅広い領域で利用されている。ここで用いら
れている音声としては、予め録音した自然音声、予め録
音した音声をつなぎ合わせた音声(録音編集合成音
声),日本語文章を規則に従って変換した音声(規則合
成音声),音韻記号とF0(基本周波数)・継続時間・
パワーといった韻律パラメータを操作して合成した音声
(パラメータ合成音声),波形編集合成音声などが挙げ
られる。
【0003】
【発明が解決しようとする課題】従来の技術では、上記
各種システムにおいて該システムを利用する人間(ユー
ザ)に対して上述した合成音声による応答を行ってい
た。ここで、応答音声を生成する場合、例えば予め作成
したパラメータ合成音声と規則合成音声(例えば任意性
の高い名前や事柄等をテキスト等から合成した音声)を
組み合わせて使用する場合には、パラメータ合成音声と
規則合成音声のつなぎ目で不自然さが目立つ等、システ
ムの応答として自然で滑らかな音声応答を行うことが困
難であった。また、不自然さを避けるために応答音声の
全てを予め用意すると、人名など場合によってはその組
み合わせの余りの多さが問題になったり、逆に、全てを
規則合成音声によってテキスト等から生成すると、機械
的とか単調な応答になってしまう点が問題となってい
た。
【0004】このため、従来の合成音声による音声応答
方法や装置では、応答音声の接続が自然で滑らかである
多様な応答音声をシステムに対して返すことができなか
った。したがって、ユーザに対して機械的であるとか単
調な印象・違和感を与えるため、システムを使う気にさ
せるとか、使って楽しいといったいわゆるユーザフレン
ドリネスをユーザに与えることが困難であった。
【0005】本発明は、上記事情に鑑みてなされたもの
であり、その目的とするところは、感情表現など多様な
表情をもった自然で滑らかな音声を合成できる音声合成
方法及び装置を提供することにある。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、請求項1の発明では、音声合成用パラメータを作成
するパラメータ作成手段と、音声合成用パラメータに基
づき音声を合成する音声合成手段とを備え、前記パラメ
ータ作成手段により作成した音声合成用パラメータに基
づき音声を合成する音声合成方法において、前記パラメ
ータ作成手段において音声合成用パラメータの作成に用
いるパラメータ作成情報及び作成された音声合成用パラ
メータの加工に用いるパラメータ加工情報を含む音声合
成テンプレートを予め記憶手段に複数記憶し、該記憶手
段から音声合成テンプレートを選択し、選択した音声合
成テンプレートのパラメータ作成情報に基づき前記パラ
メータ作成手段により音声合成用パラメータを作成し、
選択した音声合成テンプレートのパラメータ加工情報に
基づき、前記パラメータ作成手段で作成した音声合成用
パラメータを加工し、加工した音声合成用パラメータに
基づき前記音声合成手段により音声を合成することを特
徴とするものを提案する。
【0007】本発明によれば、音声合成テンプレートを
選択することにより、選択した音声合成テンプレートの
パラメータ作成情報に基づき音声合成用パラメータが作
成され、さらに該音声合成テンプレートのパラメータ加
工情報に基づき音声合成用パラメータが加工される。そ
して、加工された音声合成用パラメータに基づき音声が
合成される。これにより、予め音声合成テンプレートの
パラメータ作成情報及びパラメータ加工情報を予め作成
しておけば、パラメータ作成手段により作成された音声
合成用パラメータに対して、例えば滑らかな音声となる
ような種々の加工を行うことができる。また、特にパラ
メータ作成手段として従来の種々の方式を用いることが
できるので容易且つ簡便な構造で多様な音声合成を行う
ことができる。
【0008】また、請求項2の発明では、請求項1記載
の音声合成方法において、前記パラメータ作成手段を複
数設けるとともに、選択した音声合成テンプレートのパ
ラメータ加工情報に基づき前記複数のパラメータ作成手
段によりそれぞれ作成された複数の音声合成用パラメー
タを結合することを特徴とするものを提案する。
【0009】本発明によれば、音声合成テンプレートの
パラメータ作成情報に基づき、複数のパラメータ作成手
段によりそれぞれ音声合成用パラメータが作成され、音
声合成テンプレートのパラメータ加工情報に基づき、こ
の複数の音声合成用パラメータが結合される。したがっ
て、このパラメータ加工情報を複数の音声合成用パラメ
ータが滑らかで自然に結合されるように記述すれば、異
なるパラメータ作成手段で作成された音声合成用パラメ
ータが滑らかで自然に結合される。これにより、滑らか
で自然な音声を合成することができる。
【0010】さらに、請求項3の発明では、請求項2記
載の音声合成方法において、前記複数のパラメータ作成
手段のうち少なくとも一つはパラメータ作成情報に含ま
れるテキストに基づき音声合成用パラメータを作成する
ようにし、前記音声合成テンプレートのパラメータ作成
情報にテキストを置換するための置換情報を含ませ、選
択した音声合成テンプレートのパラメータ作成情報に前
記置換情報が含まれている場合には、該置換情報に基づ
き入力手段から入力されたテキストでパラメータ作成情
報の一部を置換し、前記パラメータ作成手段は置換した
パラメータ作成情報に基づき音声合成用パラメータを作
成することを特徴とするものを提案する。
【0011】本発明によれば、入力したテキストに基づ
き音声合成用パラメータが作成されるとともに、該音声
合成用パラメータと他のパラメータ作成手段により作成
された音声合成用パラメータとをパラメータ加工情報に
基づき結合される。これにより、任意のテキストを含む
文章を自然で滑らかな音声に合成することができる。
【0012】さらに、請求項4の発明では、音声合成用
パラメータに基づき音声を合成する音声合成手段を備え
た音声合成装置において、音声合成用パラメータの作成
に用いるパラメータ作成情報及び作成された音声合成用
パラメータの加工に用いるパラメータ加工情報を含む音
声合成テンプレートを予め複数記憶した記憶手段と、記
憶手段から音声合成テンプレートを選択するテンプレー
ト選択手段と、テンプレート選択手段により選択された
音声合成テンプレートのパラメータ作成情報に基づき音
声合成用パラメータを作成するパラメータ作成手段と、
テンプレート選択手段により選択された音声合成テンプ
レートのパラメータ加工情報に基づき、前記パラメータ
作成手段により作成された音声合成用パラメータを加工
するパラメータ加工手段とを備え、前記音声合成手段
は、パラメータ加工手段により加工された音声合成用パ
ラメータに基づき音声を合成することを特徴とするもの
を提案する。
【0013】さらに、請求項5の発明では、請求項4記
載の音声合成装置において、前記パラメータ作成手段を
複数備えるとともに、前記パラメータ加工手段は、前記
テンプレート選択手段により選択された音声合成テンプ
レートのパラメータ加工情報に基づき前記複数のパラメ
ータ作成手段によりそれぞれ作成された複数の音声合成
用パラメータを結合することを特徴とするものを提案す
る。
【0014】さらに、請求項6の発明では、請求項5記
載の音声合成装置において、前記記憶手段に記憶されて
いる音声合成テンプレートのパラメータ作成情報はその
一部をテキストで置換するための置換情報を含み、テキ
ストを入力する入力手段と、前記テンプレート選択手段
により選択された音声合成テンプレートのパラメータ作
成情報に前記置換情報が含まれている場合には、該置換
情報に基づき入力手段から入力されたテキストでパラメ
ータ作成情報の一部を置換する置換手段とを備え、前記
複数のパラメータ作成手段のうち少なくとも一つは、前
記置換手段により置換されたパラメータ作成情報に基づ
き音声合成用パラメータを作成することを特徴とするも
のを提案する。
【0015】これら、請求項4乃至6の発明に係る音声
合成装置によれば、上記請求項1乃至3に記載した音声
合成方法を実現することができる。
【0016】
【発明の実施の形態】本発明の一実施の形態に係る音声
合成方法及び装置について図面を参照して説明する。本
実施の形態では本発明の音声合成方法及び装置を外部か
らの入力に対して音声で応答を行う音声応答装置に適用
した例を示す。図1は音声応答装置の構成図である。
【0017】図1において、1は音声応答装置への入力
装置であり、例えばキーボード,マウス・タッチパネル
等のポインティングデバイス,他の装置とのインタフェ
ースデバイス等である。入力装置1では、音声応答装置
への入力情報から、使用する応答テンプレートの選択基
準となるテンプレート情報と、応答テンプレート中のキ
ーワードを置換するためのテキストやファイル名等を出
力する。
【0018】図1において、2は応答テンプレート選択
装置である。この応答テンプレート選択装置2は、入力
装置1からのテンプレート情報に基づいて、複数の応答
テンプレートセット10から使用する応答テンプレート
セットを選択し、さらに選択した応答テンプレートセッ
ト10の中から指定された応答テンプレート11を決定
する。ここで、応答テンプレートセット10は、例えば
「挨拶」,「質問」,「謝罪」のように応答のカテゴリ
ー別にセットを構成し、例えば応答テンプレートセット
10が「謝罪」であれば、「ごめんなさい。」,「ごめ
んね。」,「ごめーん。」のように応答テンプレートセ
ット10毎に複数の応答テンプレート11を用意してい
る。これにより、同じ内容の応答(同じカテゴリーの内
容)でも多様な応答をすることができる。
【0019】図1において、3はキーワード置換装置で
あり、応答テンプレート選択装置2の出力である選択さ
れた応答テンプレート11中のキーワード部分を、入力
装置1からの出力であるキーワード置換用のテキストや
ファイル名等に置換する。例えば応答テンプレート11
に「KeyWD_NAMEちゃん、こんばんは。」と記
述している場合、入力装置1からの「KeyWD_NA
ME=”翼”」という置換情報に基づきキーワードの置
換を行い、応答テンプレート11を「翼ちゃん、こんば
んは。」と書き換える。このように、応答テンプレート
11中にキーワードを記述し置換することで固定的な応
答ではなく多様で柔軟な応答を返すことができる。
【0020】図1において、4は応答テンプレート解釈
装置である。この応答テンプレート解釈装置4は、キー
ワード置換装置3の出力に基づいて応答テンプレート1
1中に記述された処理内容をテンプレートの先頭から解
釈し、応答音声を生成するための処理を制御する。
【0021】図1において、5は合成パラメータ生成装
置である。この合成パラメータ生成装置5は、応答テン
プレート解釈装置4から出力されたキーワード置換済み
の応答テンプレート11の記述に基づいて、応答テンプ
レート11中のテキスト及びアクセント記号付きテキス
トを解析し、応答テンプレート11中の合成コントロー
ル情報の記述にしたがって、音声を合成するのに必要な
音声合成用パラメータの一つである韻律情報と音韻記号
を付加した合成パラメータを生成する。
【0022】図1において、6は音声セット選択装置で
ある。この音声セット選択装置6は応答テンプレート1
1中の音声データのファイル名に該当する部分を音声デ
ータセット13から取得する。音声データセット12
は、例えば波形データや合成パラメータ等の音声合成に
必要な音声合成用パラメータが格納されたファイル群で
構成される。
【0023】図1において、7は合成パラメータ結合装
置である。この合成パラメータ結合装置7は、合成パラ
メータ生成装置5と音声セット選択装置6から出力され
た各種音声合成用パラメータ及びテンプレート解釈装置
4の出力であるコントロール情報に基づいて、各々の合
成パラメータ及び波形データを自動的に編集・結合等の
加工を行う。
【0024】図1において、8は合成音声生成装置であ
る。この合成音声生成装置8は、合成パラメータ結合装
置7によって1つにまとめられた音声合成用パラメータ
である合成パラメータ及び波形データに基づいて合成音
声を生成する。合成音声生成装置8で生成された音声
は、出力装置9により出力される。
【0025】図2は応答テンプレート11の記述例であ
る。図2の例では、「やあこんにちは、つばさちゃん、
元気だった?」という応答音声を生成するための応答テ
ンプレートである。応答テンプレート11には合成する
ためのテキストやアクセント記号付きのテキスト及び合
成パラメータや波形データの入ったファイル名等(デー
タ)のパラメータ作成情報が、それらの結合方法及び音
声を合成する際に指定する音声合成のパラメータ等の指
定記述(コントロール情報)とともに記述されている。
すなわち、応答テンプレート11には、合成パラメータ
生成装置5及び音声セット選択装置6で音声合成用パラ
メータの作成に必要なパラメータ作成情報と、合成パラ
メータ生成装置5及び音声セット選択装置6の各出力を
加工(滑らかな結合等)するのに必要な加工情報が記述
されている。図2では、応答テンプレートは、括弧内に
記述されたコントロール情報(パラメータ加工情報)
と、これに続くデータ(パラメータ作成情報)の列で記
述されている。なお、図2において、「#」はコメント
を表す記号であり該記号以降の文章に機能的な意味はな
い。
【0026】図2の具体例では、「こんにちは」、「ち
ゃん」、「だった?」といった予め作成された合成パラ
メータが格納されたファイル(それぞれファイル名:Fi
rst.Pac,Second.Pac,Third.Pac)が用意されており、
「やあ」、「つばさ」というテキストと「ゲンキ[/0
1]」というアクセント記号付きテキストと組み合わせる
ことで音声応答を生成する。この例では、まず「やあ」
について語尾の母音を450msに伸ばすと同時に最後
のピッチを標準より25Hz低くする。次に、First.Pa
c(「こんにちは」)を「やあこんにちは」と一つの単
語のように合成するためにFirst.Pacのパラメータを修
正する。次いで、「やあこんにちは」と音の高さに歪み
が生じないように、「つばさ」の平均ピッチと語全体の
ピッチの傾を修正し語尾の後のポーズ長を0msにす
る。さらに、「やあこんにちは、つばさ」とSecond.Pac
(「ちゃん」)を一つの単語のように合成するためにSe
cond.Pacの合成パラメータを修正する。同様に第1モー
ラにアクセント核のある「ゲンキ[/01]」とThird.Pac
(「だった」)を一つの単語のように合成するためにTh
ird.Pacの合成パラメータを修正し、結合することで応
答音声「やあこんにちは、つばさちゃん、元気だった
?」を生成する。このように応答テンプレート11にそ
れぞれのデータの結合順序と結合方法等(コントロール
情報)を細かく記述することで、応答音声の自然で滑ら
かな接続を実現できる。
【0027】図3乃至図6は結合方法等のコントロール
情報の一例を示したものである。コントロール情報には
主に接頭と語尾、語全体についての指示がある。また、
それぞれに、音の高さを決めるピッチと音の大きさを決
めるパワー、発話の早さを決める話速についての指示が
ある。そして、これら指定した値の効果をどのように及
ぼすかを定義した形状を指定する(図4参照)。この例
では、リニアに効果を及ぼすType1と最後に急激に効果
を及ぼすType2、最初に急激に効果を及ぼすType3の3つ
の形状を示している。また、語頭の前及び語尾の後のポ
ーズ長や2つ以上のデータを1つの語句として結合する
ためのコントロール情報、男声や女声などの話者、デフ
ォルトの話速等の合成エンジンへの合成パラメータ等が
ある。
【0028】図6で示したコントロール情報の例を簡単
に説明すると、E1のコントロール情報は、語頭のピッチ
をデータの全体長の30%の位置で急激に立ち上げ30
0Hzにする。E2のコントロール情報は、語尾のピッチ
をデータの全体長の20%の位置からリニアに徐々に下
げてデフォルトのピッチより15Hz低くする。E3のコ
ントロール情報はコントロール情報は語尾から数えて2
モーラ目からピッチに急減な変化を与え語尾のピッチを
220Hzにする。E4のコントロール情報は語尾から数
えて最初の母音のピッチに急激な変化を与え語尾のピッ
チを220Hzにする。
【0029】次に、この音声応答装置を用いたシステム
について図7を参照して説明する。ここでは、しりとり
システムを例にとって具体的に説明する。まず、しりと
りシステムについて説明する。しりとりシステムは、ユ
ーザとシステムとがしりとりを行うシステムである。ユ
ーザは、まず自分の名前を入力し、「乗り物」や「食べ
物」といったしりとりのカテゴリーを選択する。システ
ムはユーザが入力したしりとりの単語を、システムが持
っている辞書から検索し答えを返す。このようにしてシ
ステムとユーザがしりとりを行う。
【0030】このシステムでは、入力装置1による入力
される情報は、キーボードから入力されたユーザの文字
列,しりとりシステムの辞書から検索された単語,ユー
ザの名前,しりとりのカテゴリーである。
【0031】応答テンプレート選択装置2は、「出たし
の言葉が違う」「辞書にない単語である」「前に使った
単語である」といったしりとりシステムからの出力イベ
ントに応じて、イベント毎に用意した応答テンプレート
セットから応答テンプレートセット10を選択する。図
7にイベント「出だしの言葉が違う」用の応答テンプレ
ートセット10の例を示す。図7には3つの応答テンプ
レート11a〜11cが記述されている。なお、図7に
おいて「REM」はコメント表す記号であり該記号以降の
文章に機能的な意味はない。
【0032】このしりとりシステムでは、3つの応答テ
ンプレート11a〜11cの中から1つをランダムに選
択して応答を返す。ここでは、応答テンプレート11c
を例にとって説明する。
【0033】応答テンプレート11cでは、11_4.Pac
(「なんですと?」)の合成パラメータに続けて、「%
U」で示されたキーワードをユーザが入力した単語「ラ
イト」に置換し、単語「ライト」の語尾「ト」の母音の
継続時間を200msに変更し、ピッチを現在の値から
相対的に200Hz上昇させる。次に「%e」で示され
たキーワードをユーザが入力した単語「ライト」の語尾
の1モーラ「ト」で置換し、合成エンジンへのデフォル
ト話速を16に設定し、合成パラメータを得た後に
「ト」の母音の継続時間長を300msに変更すること
で「トー」にする。このとき「トー」の後のポーズを0
msにする。これを3回行う。そして、13_11_1.Pac
(「あれ?あれあれ?と思ったけど、出だしが違う
よ。」)と単純に結合した後、「%E」で示されたキー
ワードを、システムが前回出力した単語の最後の1モー
ラである「ナ」で置換し、6_2_2.Pac(「で始まるは
ずだよ。もう一回考え直し。」)と接続する。応答テン
プレートの処理は、キーワード置換装置3,テンプレー
ト解釈装置4,合成パラメータ生成装置5,音声セット
選択装置6,合成パラメータ結合装置7,そして合成音
声生成装置8でそれぞれ行われ、応答音声「なんですと
?ライト?トートートー、あれ?あれあれ?と思ったけ
ど、出だしが違うよ。ナで始まるはずだよ。もう一回考
え直し。」が生成される。
【0034】このように、予め韻律を調整して感情表現
などを行った合成音声を部品とした音声セットを構築し
ておき、応答テンプレートセットで用いることで、多様
な応答が行える。そして、応答テンプレートに合成パラ
メータのファイル名やテキスト、アクセント記号付きテ
キスト等の個々のデータの接続方法を細かく記述するこ
とで、それぞれの接続が自然で滑らかな応答音声を生成
できる。また、応答テンプレート中にキーワードを記述
した後で応答音声を生成するときに前記テキスト等で置
換することにより、応答音声の一部を任意に変えること
ができ任意の応答を生成できる。これにより、システム
に対して、機械的であるとか単調な印象や接続の不自然
さによる違和感といったもの与えるような音声を提供す
ることがない。したがって、ユーザに対して、システム
を使って楽しいとか、システムを使う気になるといっ
た、いわゆるユーザフレンドリなインタフェースを提供
することができる。
【0035】
【発明の効果】以上詳述したように、本発明によれば、
音声合成テンプレートを選択することにより、選択した
音声合成テンプレートのパラメータ作成情報に基づき音
声合成用パラメータが作成され、さらに該音声合成テン
プレートのパラメータ加工情報に基づき音声合成用パラ
メータが加工される。そして、加工された音声合成用パ
ラメータに基づき音声が合成される。これにより、予め
音声合成テンプレートのパラメータ作成情報及びパラメ
ータ加工情報を予め作成しておけば、パラメータ作成手
段により作成された音声合成用パラメータに対して、例
えば自然で滑らかな音声となるような種々の加工を行う
ことができる。また、特にパラメータ作成手段として従
来の種々の方式を用いることができるので容易且つ簡便
な構造で感情表現など多様な表情をもった音声合成を行
うことができる。
【図面の簡単な説明】
【図1】音声応答装置の構成図
【図2】応答テンプレートの例を説明する図
【図3】コントロール情報の例を説明する図
【図4】コントロール情報における形状指定の例を説明
する図
【図5】コントロール情報における各項目の例を説明す
る図
【図6】コントロール情報の例を説明する図
【図7】しりとりシステムにおける応答テンプレートセ
ットの例を説明する図
【符号の説明】
1…入力装置、2…応答テンプレート選択装置、3…キ
ーワード置換装置、4…応答テンプレート解釈装置、5
…合成パラメータ生成装置、6…音声セット選択装置、
7…合成パラメータ結合装置、8…合成音声生成装置、
9…出力装置、10…応答テンプレートセット、11…
応答テンプレート、12…音声データセット

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 音声合成用パラメータを作成するパラメ
    ータ作成手段と、音声合成用パラメータに基づき音声を
    合成する音声合成手段とを備え、前記パラメータ作成手
    段により作成した音声合成用パラメータに基づき音声を
    合成する音声合成方法において、 前記パラメータ作成手段において音声合成用パラメータ
    の作成に用いるパラメータ作成情報及び作成された音声
    合成用パラメータの加工に用いるパラメータ加工情報を
    含む音声合成テンプレートを予め記憶手段に複数記憶
    し、 該記憶手段から音声合成テンプレートを選択し、 選択した音声合成テンプレートのパラメータ作成情報に
    基づき前記パラメータ作成手段により音声合成用パラメ
    ータを作成し、 選択した音声合成テンプレートのパラメータ加工情報に
    基づき、前記パラメータ作成手段で作成した音声合成用
    パラメータを加工し、 加工した音声合成用パラメータに基づき前記音声合成手
    段により音声を合成することを特徴とする音声合成方
    法。
  2. 【請求項2】 前記パラメータ作成手段を複数設けると
    ともに、選択した音声合成テンプレートのパラメータ加
    工情報に基づき前記複数のパラメータ作成手段によりそ
    れぞれ作成された複数の音声合成用パラメータを結合す
    ることを特徴とする請求項1記載の音声合成方法。
  3. 【請求項3】 前記複数のパラメータ作成手段のうち少
    なくとも一つはパラメータ作成情報に含まれるテキスト
    に基づき音声合成用パラメータを作成するようにし、 前記音声合成テンプレートのパラメータ作成情報にテキ
    ストを置換するための置換情報を含ませ、 選択した音声合成テンプレートのパラメータ作成情報に
    前記置換情報が含まれている場合には、該置換情報に基
    づき入力手段から入力されたテキストでパラメータ作成
    情報の一部を置換し、 前記パラメータ作成手段は置換したパラメータ作成情報
    に基づき音声合成用パラメータを作成することを特徴と
    する請求項2記載の音声合成方法。
  4. 【請求項4】 音声合成用パラメータに基づき音声を合
    成する音声合成手段を備えた音声合成装置において、 音声合成用パラメータの作成に用いるパラメータ作成情
    報及び作成された音声合成用パラメータの加工に用いる
    パラメータ加工情報を含む音声合成テンプレートを予め
    複数記憶した記憶手段と、 記憶手段から音声合成テンプレートを選択するテンプレ
    ート選択手段と、 テンプレート選択手段により選択された音声合成テンプ
    レートのパラメータ作成情報に基づき音声合成用パラメ
    ータを作成するパラメータ作成手段と、 テンプレート選択手段により選択された音声合成テンプ
    レートのパラメータ加工情報に基づき、前記パラメータ
    作成手段により作成された音声合成用パラメータを加工
    するパラメータ加工手段とを備え、 前記音声合成手段は、パラメータ加工手段により加工さ
    れた音声合成用パラメータに基づき音声を合成すること
    を特徴とする音声合成装置。
  5. 【請求項5】 前記パラメータ作成手段を複数備えると
    ともに、 前記パラメータ加工手段は、前記テンプレート選択手段
    により選択された音声合成テンプレートのパラメータ加
    工情報に基づき前記複数のパラメータ作成手段によりそ
    れぞれ作成された複数の音声合成用パラメータを結合す
    ることを特徴とする請求項4記載の音声合成装置。
  6. 【請求項6】 前記記憶手段に記憶されている音声合成
    テンプレートのパラメータ作成情報はその一部をテキス
    トで置換するための置換情報を含み、 テキストを入力する入力手段と、 前記テンプレート選択手段により選択された音声合成テ
    ンプレートのパラメータ作成情報に前記置換情報が含ま
    れている場合には、該置換情報に基づき入力手段から入
    力されたテキストでパラメータ作成情報の一部を置換す
    る置換手段とを備え、 前記複数のパラメータ作成手段のうち少なくとも一つ
    は、前記置換手段により置換されたパラメータ作成情報
    に基づき音声合成用パラメータを作成することを特徴と
    する請求項5記載の音声合成装置。
JP2000052857A 2000-02-29 2000-02-29 音声合成方法及び装置 Expired - Fee Related JP3578961B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000052857A JP3578961B2 (ja) 2000-02-29 2000-02-29 音声合成方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000052857A JP3578961B2 (ja) 2000-02-29 2000-02-29 音声合成方法及び装置

Publications (2)

Publication Number Publication Date
JP2001242881A true JP2001242881A (ja) 2001-09-07
JP3578961B2 JP3578961B2 (ja) 2004-10-20

Family

ID=18574310

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000052857A Expired - Fee Related JP3578961B2 (ja) 2000-02-29 2000-02-29 音声合成方法及び装置

Country Status (1)

Country Link
JP (1) JP3578961B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100454387C (zh) * 2004-01-20 2009-01-21 联想(北京)有限公司 一种语音拨号的语音合成方法和系统
US7640164B2 (en) 2002-07-04 2009-12-29 Denso Corporation System for performing interactive dialog
WO2014192959A1 (ja) * 2013-05-31 2014-12-04 ヤマハ株式会社 音声合成を用いて発言に応答する技術
JP2015087740A (ja) * 2013-05-31 2015-05-07 ヤマハ株式会社 音声合成装置およびプログラム
WO2016063879A1 (ja) * 2014-10-20 2016-04-28 ヤマハ株式会社 音声合成装置および方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7640164B2 (en) 2002-07-04 2009-12-29 Denso Corporation System for performing interactive dialog
CN100454387C (zh) * 2004-01-20 2009-01-21 联想(北京)有限公司 一种语音拨号的语音合成方法和系统
WO2014192959A1 (ja) * 2013-05-31 2014-12-04 ヤマハ株式会社 音声合成を用いて発言に応答する技術
JP2015087740A (ja) * 2013-05-31 2015-05-07 ヤマハ株式会社 音声合成装置およびプログラム
CN105247609A (zh) * 2013-05-31 2016-01-13 雅马哈株式会社 利用言语合成对话语进行响应的技术
US9685152B2 (en) 2013-05-31 2017-06-20 Yamaha Corporation Technology for responding to remarks using speech synthesis
US10490181B2 (en) 2013-05-31 2019-11-26 Yamaha Corporation Technology for responding to remarks using speech synthesis
WO2016063879A1 (ja) * 2014-10-20 2016-04-28 ヤマハ株式会社 音声合成装置および方法
US10217452B2 (en) 2014-10-20 2019-02-26 Yamaha Corporation Speech synthesis device and method
US10789937B2 (en) 2014-10-20 2020-09-29 Yamaha Corporation Speech synthesis device and method

Also Published As

Publication number Publication date
JP3578961B2 (ja) 2004-10-20

Similar Documents

Publication Publication Date Title
US6226614B1 (en) Method and apparatus for editing/creating synthetic speech message and recording medium with the method recorded thereon
US7966185B2 (en) Application of emotion-based intonation and prosody to speech in text-to-speech systems
US8498867B2 (en) Systems and methods for selection and use of multiple characters for document narration
JP5895740B2 (ja) 歌唱合成を行うための装置およびプログラム
JP2005516262A (ja) 音声合成
JP3616250B2 (ja) 合成音声メッセージ作成方法、その装置及びその方法を記録した記録媒体
WO2007138944A1 (ja) 情報付与システム、情報付与方法、情報付与プログラム及び情報付与プログラム記録媒体
WO2005093713A1 (ja) 音声合成装置
JP2007183421A (ja) 音声合成装置
JPH1138989A (ja) 音声合成装置及び方法
JP2006227589A (ja) 音声合成装置および音声合成方法
JP3578961B2 (ja) 音声合成方法及び装置
AU769036B2 (en) Device and method for digital voice processing
JP4409279B2 (ja) 音声合成装置及び音声合成プログラム
JP2005215888A (ja) テキスト文の表示装置
JP2009157220A (ja) 音声編集合成システム、音声編集合成プログラム及び音声編集合成方法
Gahlawat et al. Integrating human emotions with spatial speech using optimized selection of acoustic phonetic units
JPH0549998B2 (ja)
JP3282151B2 (ja) 音声制御方式
JP2006349787A (ja) 音声合成方法および装置
JP2894447B2 (ja) 複合音声単位を用いた音声合成装置
JP3785892B2 (ja) 音声合成装置及び記録媒体
JP2577372B2 (ja) 音声合成装置および方法
KR20230099934A (ko) 복수의 화자음성을 이용한 음성 변환 장치 및 그 방법
Mamatov et al. Formation of a Speech Database in the Karakalpak Language for Speech Synthesis Systems

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040714

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080723

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080723

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090723

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090723

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100723

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100723

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110723

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120723

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees