JPH08171395A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH08171395A
JPH08171395A JP6315236A JP31523694A JPH08171395A JP H08171395 A JPH08171395 A JP H08171395A JP 6315236 A JP6315236 A JP 6315236A JP 31523694 A JP31523694 A JP 31523694A JP H08171395 A JPH08171395 A JP H08171395A
Authority
JP
Japan
Prior art keywords
control
parameter
conversion unit
speech
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6315236A
Other languages
English (en)
Inventor
Ikutoshi Mizumoto
郁俊 水本
Hiroshi Hamada
洋 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP6315236A priority Critical patent/JPH08171395A/ja
Publication of JPH08171395A publication Critical patent/JPH08171395A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 発話速度が変化しても聞き取り易い合成音声
を出力する音声合成装置を提供する。 【構成】 テキストメモリ2、発話速度の制御レベルを
指定する入力デバイス1、テキスト−音声変換部3、制
御レベル−制御量変換部4、制御量−時間係数変換部
5、制御量−抑揚係数変換部6、制御量−ポーズ長変換
部7、時間係数−時間制御値変換部8、抑揚係数−抑揚
制御値変換部9、ポーズ長−ポーズ制御値変換部10、
音声パラメータに対して時間係数−時間制御値変換部
8、抑揚係数−抑揚制御値変換部9、ポーズ長−ポーズ
制御値変換部10により求められたパラメータを結合処
理する結合処理部11、音声信号を合成出力処理する音
声合成部12を具備する音声合成装置。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声合成装置に関
し、特に、出力音声の発話速度を人間の感覚的な言葉を
発話速度の制御レベルの指定に使用して制御し、発話速
度に対応する抑揚および文節間ポーズ長を有する聞き取
り易い音声を合成出力する音声合成装置に関する。
【0002】
【従来の技術】近年において、音声処理技術、言語処理
技術、マイクロプロセッサその他の高速演算処理半導体
技術が進歩したことにより、音声の分析合成技術、音声
の帯域圧縮技術、文字情報を入力することにより音声を
合成出力するテキスト音声合成装置が実用の域に達し
た。例えば、電話その他の双方向通信装置を介して注文
受付、情報提供、データベース検索サービスにおけるガ
イダンス出力、データ・情報提供に音声合成技術が利用
されている。
【0003】音声合成方法は、予め蓄えられた音声を必
要に応じて編集出力する録音編集再生方法と、入力され
た文字列に対してその読みを自動的に付与して音声を合
成出力する規則によるテキスト音声合成方法とに分類す
ることができる。音声合成については、従来、出力音声
の品質を如何にして向上するかという点に重点を置いて
研究開発がなされてきた。ところが、音声合成技術がよ
り一般化するにつれて、音声合成の技術に充分精通して
いるとは言えない利用者が音声合成装置を使用する場合
であっても、音声合成装置の発話速度を容易に制御する
ことができると共に、自然で聞き取り易い音声を合成出
力することができる音声合成装置が必要とされるに到っ
た。また、利用者個人の聴力に対応する各自の聴き易い
速度の合成音声を出力する音声合成装置を開発すること
も要請されている。
【0004】
【発明が解決しようとする課題】ところで、従来の音声
合成装置の出力する合成音声の発話速度の制御は、殆ど
がコマンドにより指定をするものに限られており、音声
合成の技術に充分に精通しているとは言えない利用者に
は、発話速度の制御を容易に実施することができるもの
ではなかった。そして、発話速度を変化させることに対
応して抑揚を規定する基本周波数を変化させることをせ
ず、また、文節間のポーズ長を変化させることもしない
ものであるので、発話速度に適合した基本周波数および
ポーズ長を与えるには、発話速度を指定入力することと
は別に、基本周波数の設定、および個々の文節の前後に
ポーズを入力することをも必要とされた。
【0005】音声によるメッセージを聞く場合、発話速
度が[普通]であって差し支えない聞き手と、[ゆっく
り]であることを要望する聞き手の両者が存在する。こ
の発明は、この様な[普通に話す]、[ゆっくり話す]
という人間の感覚的な言葉を発話速度の制御レベルを設
定する表現として使用することにより、音声合成の技術
に充分に精通しているとは言えない利用者に依っても、
発話速度を聞き手に適合する発話速度に容易に制御する
と共に、変化した発話速度に対応して抑揚を規定する基
本周波数を自動的に設定し、併せて発話速度の変化に対
応するポーズ長を文節間に自動的に入力することによ
り、自然で聞き取り易い音声を合成出力する音声合成装
置を提供するものである。
【0006】
【課題を解決するための手段】文字情報から音声を合成
して出力する音声合成装置において、発話速度の制御レ
ベルを指定する発話速度指定部を具備し、出力音声の時
間長を発話速度指定部の指定に対応して制御する時間長
制御部を具備し、出力音声の抑揚を規定する基本周波数
を発話速度指定部の指定に対応して制御する抑揚制御部
を具備し、出力音声の文節間に挿入するポーズ長を発話
速度指定部の指定に対応して制御するポーズ長制御部を
具備する音声合成装置を構成した。
【0007】そして、文字情報を入力蓄積しておくテキ
ストメモリ2を具備し、テキストメモリ2に蓄積される
文字列情報を表示画面に表示し、これについて発話速度
の制御レベルを指定する入力デバイス1を具備し、テキ
ストメモリ2から読み出される文字列情報に読みを付与
すると共に基本となる音声の単位に分解結合し、文字列
に対応する音声パラメータを生成するテキスト−音声変
換部3を具備し、入力デバイス1により指定入力された
制御レベルを制御量である数値に変換する制御レベル−
制御量変換部4を具備し、制御レベル−制御量変換部4
より出力される制御量に対応する発話時間の物理的な変
換値である時間係数パラメータを求める制御量−時間係
数変換部5を具備し、制御レベル−制御量変換部4より
出力される制御量に対応する抑揚の物理的な変換値であ
る抑揚係数パラメータを求める制御量−抑揚係数変換部
6を具備し、制御レベル−制御量変換部4より出力され
る制御量に対応するポーズの物理的な変換値であるポー
ズ長パラメータを求める制御量−ポーズ長変換部7を具
備し、制御量−時間係数変換部5において変換された時
間係数パラメータを使用して音声パラメータの発話時間
を変化させる時間制御パラメータを求める時間係数−時
間制御値変換部8を具備し、制御量−抑揚係数変換部6
において変換された抑揚係数パラメータを使用して音声
パラメータの抑揚を規定する基本周波数を変化させる抑
揚制御パラメータを求める抑揚係数−抑揚制御値変換部
9を具備し、制御量−ポーズ長変換部7において変換さ
れたポーズ長パラメータを使用して音声パラメータの各
文節間のポーズ長を変化させるポーズ制御パラメータを
求めるポーズ長−ポーズ制御値変換部10を具備し、テ
キスト−音声変換部3から読み出される音声パラメータ
に対して、時間係数−時間制御値変換部8、抑揚係数−
抑揚制御値変換部9、ポーズ長−ポーズ制御値変換部1
0により求められた各種制御パラメータを結合処理する
制御パラメータ結合処理部11を具備し、制御パラメー
タ結合部11から入力される制御音声パラメータに基づ
いて音声信号を合成出力処理する音声合成部12を具備
する音声合成装置を構成した。
【0008】また、音声合成装置において、発話速度指
定部は制御レベルの指定が人間の感覚的な言葉に依るも
のである音声合成装置を構成した。
【0009】
【実施例】この発明の実施例を図1を参照して説明す
る。1は合成音声の発話速度の制御レベルを指定する入
力デバイスである。2は文字情報を予め入力蓄積してお
くテキストメモリである。入力デバイス1は、テキスト
メモリ2に蓄積されているテキスト文章を表示画面に表
示し、利用者は画面に表示されるテキスト文章に対する
発話速度の制御レベルをマウス、キーボードその他の入
力装置を使用して指定し、発話速度の制御レベルを設定
する。ここで、発話速度の制御レベルを表現する言葉と
して、[普通に話す]、[ゆっくり話す]という様な人
間の感覚的な言葉を使用し、これにより発話速度の制御
レベルを指定することにより、音声合成の専門的知識或
は専門用語に精通していない利用者であっても、容易に
適切な制御レベルの指定をすることができる。
【0010】3はテキスト−音声変換部であり、テキス
トメモリ2から読み出される文字列情報に読みを付与す
ると共に基本となる音声の単位に分解結合し、当該文字
列に対応する音声パラメータを生成する。テキスト−音
声変換方法としては、慣用されているCOC法を使用す
ることができる(COC法に関しては、例えば箱田、広
川、水野、中嶌「COC法を用いたテキスト合成ボード
の試作」電子情報通信学会、音声研究会資料、SP90
−55(1990)参照)。なお、後で発話速度制御処
理を行う必要があるところから、音声合成部としては、
速度、基本周波数、ポーズを制御することを要件として
含むLPC、或はLSPの如きものを採用すると好適で
ある。
【0011】ここで、COC法を採用するテキスト音声
合成における音声パラメータの一例を示す。 [テキスト文] 「こちらは、テレホンサービスの受付係です。」 [音声パラメータ] ¥Sn¥Vnn¥Dnnコチラハ[,00]テレホンサ
ービスノ[/06]ウケツケガカリデス[.05] 以上について解説する。
【0012】 ¥Sn :発話速度(n=1:低速〜8:高速)……デフォルト値=5 ¥Vnn:音量(nn=01:小〜16:大)………デフォルト値=08 ¥Dnn:抑揚(nn=01:小〜16:大)………デフォルト値=08 []内記号:文節セパレータ(本記号は文節間の結合度
を示す記号であり、この記号により各文節間のポーズ長
が設定される。) “*”=強結合 ( 0ms) “/”=弱結合 ( 0ms) “%”“ ”=短ポーズ( 350ms) “、”“,”=中ポーズ( 700ms) “。”“.”=長ポーズ(1000ms) []内数字:前文節のアクセント位置(例えば、第三文
節は“05”で5文字目の“ガ”がアクセントの位置と
なる。) 発話速度パラメータにより出力される合成音声の速さを
変化させ、音量パラメータにより出力される合成音声の
パワーを変化させ、抑揚パラメータにより出力される合
成音声の基本周波数のダイナミックレンジを変化させる
ことができる。なお、各パラメータの値を制御すること
により合成音声を変化させることができるが、パラメー
タの値を制御するのではなくして直接物理量を制御する
様にすることもできる。
【0013】4は制御レベル−制御量変換部であり、入
力デバイス1に入力された制御レベルを制御量である数
値に変換する。入力デバイス1に入力された感覚的な制
御レベル指定情報に対応する制御信号は、制御レベル−
制御量変換部4において数値により表現された制御量に
変換される。この制御量としては、例えば制御レベルを
3段階に分け、[普通]の制御レベルを1に、[ややゆ
っくり]の制御レベルを0に、[ゆっくり]の制御レベ
ルを−1に対応させ、これらの数値1、0、−1を制御
量として使用する。或は、図2を参照するに、制御レベ
ルを5段階に分け、[普通]の制御レベルを1に、[ゆ
っくり]の制御レベルを5に、さらに[普通]と[ゆっ
くり]の間に3段階の制御レベルを設け、中間を[やや
ゆっくり]としてこの制御レベルを3に対応させた数値
を使用する。更に、図3を参照するに、制御レベルを7
段階に分け、[普通]の制御レベルを1に、[ゆっく
り]の制御レベルを7に、[普通]と[ゆっくり]の間
に5段階の制御レベルを設け、中間を[ややゆっくり]
としてこの制御レベルを4に対応させた数値を使用する
ことができる。図2および図3において、21および3
1は入力デバイス1の表示器の表示画面を示す。22お
よび32は表示されるテキスト内容を表示する表示部で
あり、23および33は制御スイッチであり、24およ
び34はレベルを設定するスライドボリュームであり、
25および35は制御レベルを示す。利用者は、表示部
22或は表示部32に表示される文字列について、制御
スイッチ23或は制御スイッチ33をONに設定してか
ら、マウス、キーボードその他の入力操作装置を操作す
ることによりスライドボリューム24或はスライドボリ
ューム34を駆動し、制御レベルを入力設定する。スラ
イドボリューム24およびスライドボリューム34の下
部には、そのスライド方向に沿って[普通]・[ややゆ
っくり]・[ゆっくり]という様な人間の感覚的な言葉
を発話速度の制御レベルを表現する言葉として表示して
いる。この表示を参照しながら制御レベルを入力設定す
る。
【0014】5は制御量−時間係数変換部であり、制御
レベル−制御量変換部4より出力される制御量に対応す
る発話時間における物理的な変換値である時間係数パラ
メータを求める。時間係数パラメータを求める方法とし
ては、図4に示されるが如き制御量と時間係数パラメー
タとの間の対応を示す変換テーブルを準備しておき、入
力された制御量である数値に対応する時間係数パラメー
タを求める方法を採用することができる。図4は制御量
と時間係数パラメータの対応をグラフ化して表現した変
換テーブルを示す。41は制御レベルを5段階に分けた
変換テーブルである。制御レベルが[普通]の場合は制
御量が1であり、時間係数1が求められ、[ややゆっく
り]の場合は制御量が3であり、時間係数0.6が求め
られる。同様に、42は制御レベルを7段階に分けた変
換テーブルである。制御レベルが[普通]の場合は制御
量が1であり、時間係数1が求められ、[ややゆっく
り]の場合は制御量が4であり、時間係数0.6が求め
られる。
【0015】次に、発話速度の変化に対応する抑揚を規
定する基本周波数の制御について説明する。6は制御量
−抑揚係数変換部であり、制御レベル−制御量変換部4
より出力される制御量に対応する抑揚における物理的な
変換値である抑揚係数パラメータを求める。抑揚係数パ
ラメータを求める方法としては、時間係数パラメータを
求める場合と同様に、図5に示されるが如き制御量と抑
揚係数パラメータとの間の対応を示す変換テーブルを準
備しておき、入力される制御量に対応する抑揚係数パラ
メータを求める方法を採用することができる。図5は制
御量と抑揚係数の対応をグラフ化して表現した変換テー
ブルを示す。51は制御レベルを5段階に分けた変換テ
ーブルであり、制御量を物理的な抑揚値である基本周波
数に変換する係数を求める。制御レベルが[普通]の場
合は制御量が1であり、抑揚係数0.875が求めら
れ、[ややゆっくり]の場合は制御量が3であり、抑揚
係数0.75が求められる。同様に、52は制御レベル
を7段階に分けた変換テーブルであり、制御量を物理的
な抑揚値である基本周波数に変換する係数を求める。制
御レベルが[普通]の場合は制御量が1であり、抑揚係
数0.875が求められ、[ややゆっくり]の場合は制
御量が4であり、抑揚係数0.75が求められる。
【0016】更に、7は制御量−ポーズ長変換部であ
り、制御レベル−制御量変換部4より出力される制御量
に対応するポーズにおける物理的な変換値であるポーズ
長パラメータを求める。ポーズ長パラメータを求める方
法としては、時間係数パラメータを求める場合と同様
に、図6および図7に示されるが如き制御量とポーズ長
パラメータとの間の対応を示す変換テーブルを準備して
おき、入力される制御量に対応するポーズ長パラメータ
を求める方法を採用することができる。図6は制御量と
ポーズ長パラメータの対応をグラフ化して表現した変換
テーブルであり、制御レベルを5段階に分けて制御量か
ら各文節間の物理的なポーズ長を求める変換テーブルで
ある。ポーズの位置、長さは文節間の結合の度合により
求められる。制御レベルが[ややゆっくり]の場合は制
御量は3であり、強結合の場合は変換テーブル61を参
照して160ミリ秒のポーズ長が求められ、弱結合の場
合は変換テーブル62を参照して250ミリ秒のポーズ
長が求められ、短ポーズの場合は変換テーブル63を参
照して380ミリ秒のポーズ長が求められ、中ポーズの
場合は変換テーブル64を参照して180ミリ秒のポー
ズ長が求められ、長ポーズの場合は変換テーブル65を
参照して290ミリ秒のポーズ長が求められる。
【0017】図7は制御量とポーズ長パラメータの対応
をグラフ化して表現した変換テーブルであり、制御レベ
ルを7段階に分けて制御量から各文節間の物理的なポー
ズ長を求める変換テーブルである。同様にして、制御量
から各文節間の物理的なポーズ長を求めることができ
る。制御レベルが[ゆっくり]の場合は制御量が7であ
り、強結合の場合は変換テーブル66を参照して300
ミリ秒のポーズ長が求められ、弱結合の場合は変換テー
ブル67を参照して340ミリ秒のポーズ長が求めら
れ、短ポーズの場合は変換テーブル68を参照して53
0ミリ秒のポーズ長が求められ、中ポーズの場合は変換
テーブル69を参照して280ミリ秒のポーズ長が求め
られ、長ポーズの場合は変換テーブル70を参照して4
10ミリ秒のポーズ長が求められる。なお、図8は制御
レベルおよび制御量と、各種物理パラメータとの間の対
応を示す一覧表である。71は制御レベルを5段階に分
けた場合の一覧表であり、72は制御レベルを7段階に
分けた場合の一覧表である。
【0018】8は時間係数−時間制御値変換部であり、
制御量−時間係数変換部5において変換された時間係数
パラメータを使用してテキスト−音声変換部3において
求められた音声パラメータの発話時間を変化させる時間
制御パラメータを求める。時間制御パラメータは現実の
制御値である。この時間係数−時間制御値変換部8はテ
キスト−音声変換部3から読み出された音声パラメータ
の発話速度のデフォルト値に対して、制御量−時間係数
変換部5において変換された時間係数パラメータを乗じ
ることにより、制御値である時間制御パラメータを求め
る。
【0019】時間制御パラメータ=発話速度のデフォル
ト値×時間係数パラメータ 具体例:「ややゆっくり」の場合 3=デフォルト値:5×時間係数:0.6 9は抑揚係数−抑揚制御値変換部であり、制御量−抑揚
係数変換部6において変換された抑揚係数パラメータを
使用して音声パラメータの抑揚を規定する基本周波数を
変化させる抑揚制御パラメータを求める。抑揚係数−抑
揚制御値変換部9は、テキスト−音声変換部3から読み
出される音声パラメータの抑揚のデフォルト値に対し
て、制御量−抑揚係数変換部5において変換された抑揚
係数パラメータを乗じることにより、制御値である抑揚
制御パラメータを求める。
【0020】抑揚制御パラメータ=抑揚のデフォルト値
×抑揚係数パラメータ 具体例:「ややゆっくり」の場合 6=デフォルト値:8×抑揚係数パラメータ:0.75 10はポーズ長−ポーズ制御値変換部であり、制御量−
ポーズ長変換部7において変換されたポーズ長パラメー
タを使用して、音声パラメータの各文節間のポーズ長を
変化させるポーズ制御パラメータを求める。ポーズ長−
ポーズ制御値変換部10は、テキスト−音声変換部3に
おいて変換された音声パラメータに示される通り各文節
間に既に付与されている文節セパレータに対して、制御
量−ポーズ長変換部7により求めた各ポーズ長パラメー
タを加算することにより、制御値であるポーズ制御パラ
メータが求められる。
【0021】 ポーズ制御パラメータ=文節セパレータ+ポーズ長パラメータ 具体例:「ややゆっくり」の場合(単位:ミリ秒) 強結合: 160=文節セパレータ:0+ポーズ長:160 弱結合: 250=文節セパレータ:0+ポーズ長:250 短ポーズ: 730=文節セパレータ:350+ポーズ長:380 中ポーズ: 880=文節セパレータ:700+ポーズ長:180 長ポーズ:1290=文節セパレータ:1000+ポーズ長:290 11は制御パラメータ結合処理部であり、テキスト−音
声変換部3から読み出された音声パラメータに対して、
時間係数−時間制御値変換部8、抑揚係数−抑揚制御値
変換部9、ポーズ長−ポーズ制御値変換部10により求
められた各種制御パラメータを結合処理する。制御パラ
メータ結合部11においては、テキスト−音声変換部3
から読み出された音声パラメータの制御変更されるべき
部分を、時間係数−時間制御値変換部8により求められ
た時間制御パラメータ、抑揚係数−抑揚制御値変換部9
により求められた抑揚制御パラメータおよびポーズ長−
ポーズ制御値変換部10により求められたポーズ制御パ
ラメータに置換挿入して制御音声パラメータを形成し、
これを12により示される音声合成部に出力する。パラ
メータ結合部11における各種制御パラメータの結合処
理は合成音声のフレーム周期を変換する手法、その他の
手法を採用して実施することができる(詳細は、特願平
3−180812参照)。音声合成部12は、制御パラ
メータ結合部11から入力される制御音声パラメータに
基づいて音声信号を合成出力処理する。13は出力デバ
イスであり、音声合成部12の出力するディジタルの音
声信号をアナログ信号に変換し、スピーカその他の電気
音響変換装置により利用者により指定された区間につい
て感覚量により指定された発話速度制御処理の施された
合成音声を出力する。
【0022】なお、発話速度の制御レベルの入力操作
は、入力操作装置として上述したマウス、キーボードの
他にジョイスティックを使用して実施することもでき
る。更に、NCUを組み込んで、電話機によりプッシュ
回線におけるPB信号を利用して発話速度の制御レベル
の遠隔入力操作をすることができる。
【0023】
【発明の効果】以上の通りであって、この発明の音声合
成装置は、出力する音声の発話速度の制御レベルの指定
に人間の感覚的な言葉を使用するので、音声合成の技術
に充分には精通していない利用者であっても容易に発話
速度の制御をすることができると共に、変化した発話速
度に対応する抑揚を規定する基本周波数を自動的に設定
し、文節間に変化した発話速度に対応する適正なポーズ
長を自動的に入力して、発話速度が変化しても自然で聞
き取り易い音声を合成出力することができる。従って、
誰にも容易に聞き手に適合する発話速度の制御をするこ
とができる。
【図面の簡単な説明】
【図1】音声合成装置の実施例を説明するブロック図。
【図2】制御レベルを5段階に分けた場合の入力画面を
示す図。
【図3】制御レベルを7段階に分けた場合の入力画面を
示す図。
【図4】制御量と発話時間長に変換する係数との間の対
応を示すグラフであり、(a)は制御レベルを5段階に
分けた場合を示し、(b)は制御レベルを7段階に分け
た場合を示す。
【図5】制御量と抑揚の係数との間の対応を示すグラフ
であり、(a)は制御レベルを5段階に分けた場合を示
し、(b)は制御レベルを7段階に分けた場合を示す。
【図6】制御量と文節間のポーズ長との間の対応を示す
グラフであり、制御レベルを5段階に分けた場合を示
す。
【図7】制御量と文節間のポーズ長との間の対応を示す
グラフであり、制御レベルを7段階に分けた場合を示
す。
【図8】制御レベルおよび制御量と各種物理パラメータ
との間の対応を示す図であり、(a)は制御レベルを5
段階に分けた場合を示し、(b)は制御レベルを7段階
に分けた場合を示す。
【符号の説明】
1 入力デバイス 2 テキストメモリ 3 テキスト−音声変換部 4 制御レベル−制御量変換部 5 制御量−時間係数変換部 6 制御量−抑揚係数変換部 7 制御量−ポーズ長変換部 8 時間係数−時間制御値変換部 9 抑揚係数−抑揚制御値変換部 10 ポーズ長−ポーズ制御値変換部 11 制御パラメータ結合部 12 音声合成部 13 出力デバイス

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文字情報から音声を合成して出力する音
    声合成装置において、 発話速度の制御レベルを指定する発話速度指定部を具備
    し、 出力音声の時間長を発話速度指定部の指定に対応して制
    御する時間長制御部を具備し、 出力音声の抑揚を規定する基本周波数を発話速度指定部
    の指定に対応して制御する抑揚制御部を具備し、 出力音声の文節間に挿入するポーズ長を発話速度指定部
    の指定に対応して制御するポーズ長制御部を具備する、 ことを特徴とする音声合成装置。
  2. 【請求項2】 文字情報を入力蓄積しておくテキストメ
    モリ2を具備し、 テキストメモリ2に蓄積される文字列情報を表示画面に
    表示し、これについて発話速度の制御レベルを指定する
    入力デバイス1を具備し、 テキストメモリ2から読み出される文字列情報に読みを
    付与すると共に基本となる音声の単位に分解結合し、文
    字列に対応する音声パラメータを生成するテキスト−音
    声変換部3を具備し、 入力デバイス1により指定入力された制御レベルを制御
    量である数値に変換する制御レベル−制御量変換部4を
    具備し、 制御レベル−制御量変換部4より出力される制御量に対
    応する発話時間の物理的な変換値である時間係数パラメ
    ータを求める制御量−時間係数変換部5を具備し、 制御レベル−制御量変換部4より出力される制御量に対
    応する抑揚の物理的な変換値である抑揚係数パラメータ
    を求める制御量−抑揚係数変換部6を具備し、 制御レベル−制御量変換部4より出力される制御量に対
    応するポーズの物理的な変換値であるポーズ長パラメー
    タを求める制御量−ポーズ長変換部7を具備し、 制御量−時間係数変換部5において変換された時間係数
    パラメータを使用して音声パラメータの発話時間を変化
    させる時間制御パラメータを求める時間係数−時間制御
    値変換部8を具備し、 制御量−抑揚係数変換部6において変換された抑揚係数
    パラメータを使用して音声パラメータの抑揚を規定する
    基本周波数を変化させる抑揚制御パラメータを求める抑
    揚係数−抑揚制御値変換部9を具備し、 制御量−ポーズ長変換部7において変換されたポーズ長
    パラメータを使用して音声パラメータの各文節間のポー
    ズ長を変化させるポーズ制御パラメータを求めるポーズ
    長−ポーズ制御値変換部10を具備し、 テキスト−音声変換部3から読み出される音声パラメー
    タに対して、時間係数−時間制御値変換部8、抑揚係数
    −抑揚制御値変換部9、ポーズ長−ポーズ制御値変換部
    10により求められた各種制御パラメータを結合処理す
    る制御パラメータ結合処理部11を具備し、 制御パラメータ結合部11から入力される制御音声パラ
    メータに基づいて音声信号を合成出力処理する音声合成
    部12を具備する、 ことを特徴とする音声合成装置。
  3. 【請求項3】 請求項1および請求項2の何れかに記載
    される音声合成装置において、発話速度指定部は制御レ
    ベルの指定が人間の感覚的な言葉に依るものであること
    を特徴とする音声合成装置。
JP6315236A 1994-12-19 1994-12-19 音声合成装置 Pending JPH08171395A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6315236A JPH08171395A (ja) 1994-12-19 1994-12-19 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6315236A JPH08171395A (ja) 1994-12-19 1994-12-19 音声合成装置

Publications (1)

Publication Number Publication Date
JPH08171395A true JPH08171395A (ja) 1996-07-02

Family

ID=18063024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6315236A Pending JPH08171395A (ja) 1994-12-19 1994-12-19 音声合成装置

Country Status (1)

Country Link
JP (1) JPH08171395A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5983181A (en) * 1997-04-14 1999-11-09 Justsystem Corp. Method and apparatus for reading-out/collating a table document, and computer-readable recording medium with program making computer execute method stored therein
JP2012037726A (ja) * 2010-08-06 2012-02-23 Nippon Hoso Kyokai <Nhk> 音声合成装置およびコンピュータプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5983181A (en) * 1997-04-14 1999-11-09 Justsystem Corp. Method and apparatus for reading-out/collating a table document, and computer-readable recording medium with program making computer execute method stored therein
JP2012037726A (ja) * 2010-08-06 2012-02-23 Nippon Hoso Kyokai <Nhk> 音声合成装置およびコンピュータプログラム

Similar Documents

Publication Publication Date Title
JP5029167B2 (ja) 音声読み上げのための装置、プログラム及び方法
JP2014501941A (ja) クライアント端末機を用いた音楽コンテンツ製作システム
JPH0632020B2 (ja) 音声合成方法および装置
JP2005070430A (ja) 音声出力装置および方法
JP3518898B2 (ja) 音声合成装置
AU769036B2 (en) Device and method for digital voice processing
JP3617603B2 (ja) 音声情報の符号化方法及びその生成方法
JPH08171395A (ja) 音声合成装置
JPH0419799A (ja) 音声合成装置
JPH0549998B2 (ja)
JPH05224689A (ja) 音声合成装置
JP3282151B2 (ja) 音声制御方式
JPH07200554A (ja) 文章読み上げ装置
JPH1115488A (ja) 合成音声評価・合成装置
JP2809769B2 (ja) 音声合成装置
JP2007256815A (ja) 音声再生装置、音声再生方法、音声再生プログラム
JP2001242881A (ja) 音声合成方法及び装置
JPH05173587A (ja) 音声合成装置
JP2577372B2 (ja) 音声合成装置および方法
JP2003122384A (ja) 携帯端末装置
JP2005156946A (ja) 楽曲再生装置、音声再生装置、楽曲及び音声を再生する方法及びそのプログラム
JP2006017819A (ja) 音声合成方法、音声合成プログラム及び音声合成装置
JPH08328575A (ja) 音声合成装置
JP3133347B2 (ja) 韻律制御装置
JPS62215299A (ja) 文章読み上げ装置