JP2770747B2 - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP2770747B2
JP2770747B2 JP6216644A JP21664494A JP2770747B2 JP 2770747 B2 JP2770747 B2 JP 2770747B2 JP 6216644 A JP6216644 A JP 6216644A JP 21664494 A JP21664494 A JP 21664494A JP 2770747 B2 JP2770747 B2 JP 2770747B2
Authority
JP
Japan
Prior art keywords
voice
utterance
item
request
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP6216644A
Other languages
English (en)
Other versions
JPH0863188A (ja
Inventor
玲史 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP6216644A priority Critical patent/JP2770747B2/ja
Priority to US08/515,107 priority patent/US5857170A/en
Publication of JPH0863188A publication Critical patent/JPH0863188A/ja
Application granted granted Critical
Publication of JP2770747B2 publication Critical patent/JP2770747B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の発声条件設定要
求を受け付ける音声合成装置に関し、特に、発声条件の
一部または全部について、特定の条件を指定すること無
く、発声要求することができる音声合成装置に関する。
【0002】
【従来の技術】音声合成装置においては、従来より、声
質パラメータを変更することにより複数の声質により発
声できるものが知られている(特開平4−175046
号、特開平4−175049号等)。ここで声質とは、
性別、年齢、個人差、声の高さ(平均ピッチ周波数)、
ピッチ変化量、発話速度、アクセント強度などの総称を
いう。
【0003】このような音声合成装置の中でも、特に、
マルチタスク環境やネットワーク環境で動作するなど、
複数の発声条件設定要求を受け付ける音声合成装置とし
て、高橋他による論文「パソコン向け音声合成ソフトウ
ェア」(情報処理学会第47回全国大会予稿集、Vo
l.2、pp.377〜378)に記載されたものなど
が知られている。
【0004】
【発明が解決しようとする課題】上記従来の音声合成装
置では、発声する声質の条件を、発声要求を行う側がす
べて指定する必要があった。
【0005】しかしながら、音声合成の目的によって、
必ずしも発声条件のすべてについて厳格に設定する必要
がない場合もある。たとえば、新聞記事を音声合成によ
って出力する場合を考えると、発声条件のうち発話速度
は重要であるが、その他の条件(たとえば性別、年齢
等)はどうでもよい場合がある。従来の装置において
は、そのような場合であっても、声質条件のすべてにつ
いて一々条件を設定してやる必要があった。
【0006】本発明の第1の目的は、発声要求を行う場
合、声質条件をすべて指定しなくてもよい音声合成装置
を提供することにある。
【0007】また、従来の複数の発声条件を受け付ける
音声合成装置においては、複数の発声要求があったと
き、各々の発声要求における発声条件が類似するかどう
について、何らチェックしていない。そのため、幾つか
の発声要求が同じ、または聴感上非常に類似した声質を
要求する場合が生じる可能性がある。その際、合成音声
の受聴者は、どの発声要求による音声であるかの判別が
しづらく、混乱が生じやすいという欠点があった。
【0008】そこで、本発明の第2の目的は、予め既知
でない複数の発声要求に対して、なるべく受聴者を混乱
させない割付けを自動的に行って発声する音声合成装置
を提供することにある。
【0009】
【課題を解決するための手段】上記課題を解決するた
め、本発明においては、声質を変えて音声を発声させる
ことができる音声合成部と、音声合成部の発声可能な声
質の条件を記憶した合成器特性記憶部と、制御部とによ
り、音声合成装置を構成した。そして、制御部は、複数
の声質項目から成る発声要求を受けるとともに、声質項
目について条件が指定されていない項目を有する発声要
求を受け付け、条件指定のない項目については合成器特
性記憶部に記憶された声質条件を参照して所定の方法で
条件設定し、音声合成部に声質について指令を与えるよ
うにした。
【0010】また、本発明においては、発声要求ごとに
発声状況を記録する発声記録部と、発声要求の声質のう
ち条件指定のない項目の値と、前記発声記録部に記録さ
れた発声要求の声質のうちの該当項目の値との距離を算
出する声質間距離算出部と加えるように構成した。そし
て、制御部は、声質間距離算出部で求められた声質間距
離が大きくなるように条件指定のない項目の値を決定す
るようにした。
【0011】
【作用】本発明においては、条件指定のない音声要求を
受けた場合、制御部は、合成器特性記憶部に記憶された
声質条件を参照して声質条件を決定し、決定された発声
条件に基づいて発声が行われる。
【0012】また、本発明においては、声質間距離算出
部において声質間距離が算出され、この声質間距離が大
きくなるよう声質条件が決定されるので、複数の発声要
求があっても相互に混同しないような発声を行わせるこ
とができる。
【0013】
【実施例】
(実施例1)本発明による音声合成装置の実施例1の構
成を図1に示す。この実施例の音声合成装置は、複数の
発声要求ID=1,2,...,nを受け付ける制御部
31と、複数の声質を切替えて発声させることができる
音声合成部52と、音声合成部52の出力信号に基づい
て音声を発声させるスピーカ53と、音声合成部52の
発声できる声質の条件等の特性を記憶する合成器特性記
憶部としての合成器特性表43とを備えている。制御部
31はたとえばCPU等で構成され、合成器特性表43
はROM等で構成される。
【0014】図2は、合成器特性表43の内容を示す。
すなわち、音声合成部52の声質は、図2に示すよう
に、話者番号としては男女それぞれ3種類(1〜3,4
〜6)、年齢は5歳から50歳まで7種類、平均ピッチ
周波数は50Hzから200Hzまで6種類、アクセン
ト強度は3種類、話者速度は3種類の中から選択するこ
とができる。
【0015】次に図3に示す発声要求(ID=1)があ
った場合について実施例の動作を説明する。図3の発声
要求において話者番号(項目1)、年齢(項目2)、話
者速度(項目3)について条件が指定されず「任意」と
なっている(これらの項目を以下適宜「任意」項目と呼
ぶ)。
【0016】制御部31は、「任意」項目について、合
成器特性表43から取り得る値を一つづつ選択して図3
の表の「実現条件」の欄に示すように決定し、音声合成
部52へ送り、スピーカ53から合成音声を出力する。
【0017】合成器特性表43から選択する方法として
は、ランダムに選択してもよいし、先験的なルールを制
御部31に記憶しておき、そのルールに従って選択する
ようにしてもよい。先験的なルールとしては、たとえ
ば、話者番号(項目1)および平均ピッチ周波数(項目
3)が「任意」である場合に、女声に対しては高めのピ
ッチを選択するという具合である。
【0018】なお、発声条件設定要求は、一連の発声す
べきテキストを示す幾つかの発声指示に先立って条件の
みを要求してもよいし、また発声指示の度に要求を付加
してもよい。
【0019】以上のようにすれば、声質項目のうち、特
に指定する必要のないものについては、「任意」とする
ことにより、発声要求の条件設定が簡単かつ迅速にでき
るようになる。
【0020】(実施例2)本発明による音声合成装置の
第2の実施例の構成を図4に示す。図4において、実施
例1と同じ構成要素については同じ参照番号を付して示
している。本実施例においては、実施例1の構成に加え
て、声質間距離算出部44および発声記録部としての発
声記録テーブル45を設置した。
【0021】発声記録テーブル45は、各発声要求ごと
に声質条件を記録するもので、たとえばRAM等で構成
される。また、声質間距離算出部44は、後述するよう
に、これから実行しようとする発声要求の声質のうち
「任意」とされた項目の値と、発声記録テーブル45に
記録された発声要求の声質のうちの該当項目の値との距
離を算出する。
【0022】次に図5に基づいて実施例2の動作を説明
する。まず、発声要求(ID=1)が入力されると(ス
テップF1)、その発声要求が記録テーブル45に記録
されているかどうかチェックする(F2)。いま記録テ
ーブル45の内容は図6に示す通りであるとし、発声要
求(ID=1)は図3の通りであるとする。この場合
は、ステップF2(図5)において、発声記録テーブル
45に記録があるから、次に発声要求が記録と矛盾する
かどうかチェックする(ステップF3)。上記例の場
合、発声要求ID=1の話者番号(項目1)、年齢(項
目2)、話者速度(項目3)は「任意」となっており
(図3)、一方、記録テーブル45の該当部分(ID=
1)は、それぞれ、「3」、「17」、「遅」となって
いるが、両者は矛盾しないから、ステップF4へ進み、
制御部31は記録テーブル45の内容(ID=1の部
分)を音声合成部52へ送り、音声合成が実行される
(ステップF5)。
【0023】ここで、発声要求の声質項目のうち「任
意」が含まれていない場合でも、それが記録テーブル4
5の記録内容と矛盾しない限り、上と同じ動作となる
(ステップF1〜F5)。たとえば発声要求(ID=
1)が図7に示す通りである場合、「任意」項目は含ま
れていないが、各項目が記録テーブル45の記録と一致
する(矛盾しない)ので、テーブル45通りの条件で発
声が行われる。
【0024】次にステップF2において発声要求が記録
テーブル45にエントリされていない場合の動作につい
て説明する。たとえば、図8に示す発声要求(ID=
3)が入力された場合(項目3,4が「任意」)、まず
「任意」項目について内容を決定する(ステップF
6)。このとき記録テーブル45にエントリされている
他の発声要求と混同しないように項目の値を決定するよ
うにする。その手順を以下に説明する。
【0025】まず、声質間距離算出部44は、入力され
た発声要求のうち「任意」項目について、合成器特性表
43(図2)を参照して音声合成部52が取り得る全て
の値と、記録テーブルにエントリされている発声要求の
該当項目の値との距離を求める。
【0026】このとき、話者番号(項目1)、アクセン
ト強度(項目4)、発話速度(項目5)についての距離
は、たとえば図9(a)(b)(c)のテーブルに示す
ように予め数値を定めておくことができる。
【0027】また、年齢(項目2)については下式1に
より距離を求めることができる。 d2(o1,o2)=(o1−o22/50 (式1) ここでo1,o2は年齢(単位は歳)、d2は年齢o1,o
2間の距離を表わす。
【0028】平均ピッチ周波数(項目3)については下
式2により距離を求める。 d3(p1,p2)=|p1−p2|/30 (式2) ここでp1,p2は平均ピッチ周波数(単位はHz)、d
3は平均ピッチ周波数p1,p2間の距離を表わす。
【0029】もちろん、声質間距離算出部44は、音声
合成部52の特性や処理量に応じて、すべてをテーブル
ルックアップ処理にすることや、また評価関数のみによ
り構成することもできる。特に、音声合成部52の発声
できる声質の数が少ない場合は、テーブルルックアップ
が効果的である。
【0030】さて、図8の例に戻って、ここでは「任
意」項目が、平均ピッチ周波数とアクセント強度であ
り、これらについて、それぞれ(式2)および図9
(b)のテーブルに基づいてと距離を求めると、それぞ
れ図10および図11の通りである。項目iについて取
り得る値をv(i)とすると、図10は平均ピッチ周波
数(項目3)について音声合成部52が取り得る値v
(3)の各々について、各発声要求のピッチ項目の値と
の距離を求め、取り得る値v(3)ごとに積算して積算
距離を求める(図10の表の最下欄「積算距離」参
照)。そして、その積算距離が最も大きいピッチ周波数
(つまり200Hz)を実現値vfixとして決定する。
すなわち、図10に示すように、実現値vfix(3)=
200Hzである。
【0031】同様に図11のアクセント強度(項目4)
についても積算距離の最も大きい強度(つまり「強」)
を実現値vfixとして決定する。図11において実現値
vfix(4)=「強」である。
【0032】以上のようにして「任意」項目の内容を決
定したら、記録テーブル45を更新して(ステップF
7)、記録テーブルの内容を音声合成部52へ送り(ス
テップF4)、音声合成を実行する(ステップF5)。
更新された記録テーブルは図12に示す通りであって、
発声要求(ID=3)が追加され、「任意」項目の値も
決定されている。
【0033】ステップF6における「任意」項目の決定
方法を再度説明すると以下のとおりである。すなわち、
制御部31は発声要求に「任意」の項目があれば、その
項目について最も受聴者が混同しづらい実現値Vfix
(下式3)を選択し、音声合成部52に送り、スピーカ
53より合成音声を出力する。 Vfix=[vfix(1),vfix(2),vfix(3),..,vfix(n)](式3) ここでvfix(i)は各項目の実現値、nは項目数である。
【0034】Vfixの選択は以下のように行う。すなわ
ち、要求条件の項目iの条件が「任意」である場合、合
成器特性表43より取り得る値v(i)のすべてについ
て、発声記録テーブル45に登録されている各発声要求
の該当項目との間の距離の積算値を声質間距離算出部4
4により項目iごとに求めて、それが最大となる時の値
をその項目の実現値vfix(i)とする(図10、図1
1)。なお、項目の内容が指定されている場合は、その
内容と最も近い値を合成器特性表43より選び、項目の
実現値vfix(i)とする。
【0035】以上のように、実施例2の発明によれば、
声質について設定条件を「任意」とすることができるの
はもちろんのこと、「任意」項目については、記録テー
ブルを利用して他の音声要求と距離の離れた値を選択す
ることにより、他の音声と最も混同しにくい音声を実現
することができる。また記録テーブルを用いているか
ら、同じ発声要求元で同じ要求条件による発声について
は同じ声質が保証される。
【0036】なお、図13に示すように、制御部31に
FIFOメモリ32を前置し、FIFOメモリ32は、
発声要求を一旦内部に蓄え、制御部31は動作が終了す
るごとに次の発声要求をFIFOメモリ32から取り出
すこともできる。これにより、音声合成器52または制
御部31がそれぞれ同時に発生した複数の発声要求に対
して動作できない場合においても、順に正しい動作を行
うことができる。更にこの場合、FIFOメモリに発声
要求またはその要求内容に対する優先度処理を加え、優
先度の高い発声要求、または優先度の高い要求内容に対
しては、他の要求を飛び越して先に制御部31に送るよ
うにしてもよい。
【0037】(実施例3)次に本発明の第3の実施例を
図14に示す。実施例3の構成は図4の実施例2の構成
に、積算距離記録テーブル42および警告部51を加え
たものである。積算距離記録テーブル42の一例を図1
5に示す。
【0038】この実施例の動作は、図5のフローチャー
トに示すものと基本的に同じであるが、制御部31は、
ステップF6において「任意」項目の値を決定した後
に、決定した各項目の実現値と、既に発声記録テーブル
45に記録された他の発声要求の対応する項目の値との
距離の積算値を求め、積算距離記録テーブル42(図1
5の右端の「積算距離」の欄)に記録される。
【0039】制御部31は積算距離の中から次式4によ
って最小積算距離Dminを求める。 Dmin=min(P)ΣDi[vfix(i),wp(i)] (式4) ここでDi[*.*]は声質間距離算出部44が算出し
た項目間距離、wp(i)は発声記録テーブル45に記録さ
れている発声要求ID=pの項目iの値である。ΣDi
は項目iについてi=1からnまでの和(積算距離)を
表わし、min(P)は積算距離ΣDiを各発声要求ID=
pごとに比較したときの最小値を表わしている。図15
の例では積算距離「5.1」が最小積算距離Dminであ
る。
【0040】最小積算距離Dminは、音声合成装置がこ
れから発声しようとしている音声と、これまでに発声さ
れた音声(記録テーブル45に記録されている)のうち
最も距離の近い(似ている)音声との距離を示してい
る。つまり最小積算距離Dminが小さいと他の要求元の
音声と混同しやすくなることを意味している。
【0041】そこでに、制御部31は、最小積算距離D
minを予め設定したしきい値と比較し、最小距離Dminが
しきい値よりも小さい場合、警告部51により、受聴者
に警告を発する。その後に、発声条件を音声合成52に
送って発声させる。この警告は、ブザー等で受聴者に注
意を促してもよい。また、音声合成部52を駆動して、
次に発声する発声要求元などを特定するメッセージと共
に音声で警告してもよい。
【0042】以上のような警告を発することにより、受
聴者に注意を促して、発声する音声が他と近い音声にな
った場合であっても、混同を防止することができる。
【0043】なお、最小積算距離Dminを求めるため
に、(式4)のような単純和ではなく、互いの項目が直
交しているとみなしてユークリッド距離(式5)を用い
ることもできる。 Dmin=min(P)(ΣDi[vfix(i),wp(i)]21/2 (式5)
【0044】(実施例4)次に実施例4について説明す
る。実施例3においては、最小積算距離Dminを予め設
定したしきい値と比較し、最小積算距離Dminがしきい
値よりも小さい場合、受聴者に警告を発するようにした
が、本実施例においては、最小積算距離Dminと予め設
定しておいたしきい値とを比較し、最小積算距離Dmin
がしきい値よりも大きい場合は、発声条件を音声合成部
52に送って発声させるが、最小積算距離Dminがしき
い値よりも小さい場合は、発声を行わないようにした。
そして、発声要求元には発声できなかった旨を通知し、
発声要求元は、自分の要求した発声条件が不適切であっ
たことを知る。発声できた旨を発声要求元に通知するこ
ともできる。この場合、発声要求元が次の処理を音声合
成装置に依頼するタイミングを計るのにも役立つ。ま
た、発声を行えなかった場合、要求条件は満たさない
が、現在発声することのできる声質を発声要求元に提示
し、要求条件を変更するように要求してもよい。
【0045】(実施例5)本実施例においては、音声合
成部52に対して、発声できる声質の条件、範囲、条件
間の拘束条件などが与えられた場合について言及する。
音声合成部52の制約条件としては、たとえば話者4は
20歳以上の発声を禁止するとか、男声と女声とで平均
ピッチ周波数の取り得る範囲が異なるとか、話者1は年
齢としては25歳の発声が一番自然であるので話者1と
25歳とをペアにする拘束条件を与える等々である。こ
れらの制約条件は合成器特性表43に記録される。
【0046】本実施例のその他の構成要素は上記実施例
2〜4と同様である。
【0047】本実施例においては、(式3)のようにV
fixの各項目の実現値vfix(i)を求める代りに、次式6
のように合成器特性表43より要求条件Vの取り得る値
の組合せすべてについて考える。 V={v(1),v(2),v(3),...,v(n)} (式6)
【0048】上記組合せVについて、発声記録テーブル
45に登録されている発声要求の該当項目との間の距離
の積算値を下式7に基づいて声質間距離算出部44によ
って求める。 d(V)=min(P)ΣDi[v(i),wp(i)] (式7) ここで記号min(P),ΣDiは(式4)の場合と同様の
意味である。
【0049】そして、積算距離d(V)が最大となるよ
うな組合せVを求め、これを最小積算距離Dminとする
(式8)。 Dmin=max(V)d(V) (式8)
【0050】このときの組合せVを実現値Vfixとする
(式9)。 Vfix=argmax(V)d(V) (式9)
【0051】以上のような方法によれば、取り得る発声
の条件間に制限がある安価な音声合成部を用いることが
可能となる。また、上述したように、例えば話者番号4
では20歳以上の発声ができない場合や、男声と女声と
で平均ピッチ周波数の取り得る範囲を変える場合など、
Vの取り得る値がv(i)の直交空間全てを満たしてい
ない場合にも適用することができる。さらに、先に挙げ
た例で言えば、例えば、話者1はパラメータを変更する
ことにより15歳から40歳までの発声ができるが、元
の音声データである25歳としての発声が一番自然であ
る場合、話者1と25歳とをペアにする拘束条件を声質
間距離算出部44にも反映させておくことにより、より
自然な発声を行うことができる。
【0052】(実施例6)本発明による音声合成装置の
第6の実施例のブロック図を図16に示す。上記実施例
と同じ構成部分には同じ参照番号を付して示してある。
この実施例においては、制御部31は実際に発声する条
件を選択した後、それを音声合成部52へ送ると同時
に、発声要求元へ実際に発声した条件を送る。これによ
り、発声要求元は自分の使用している声質を知り、次回
からの要求でその値を用いることにより音声合成装置の
計算の負担を軽減したり、声質によって表示内容を変え
るなどの操作が可能となる。
【0053】(実施例7)本発明の実施例7の構成図を
図17に示す。本実施例においては上記実施例2〜6の
構成に加えタイマ41を設けた。タイマ41は定期的に
制御部31に割り込み動作を行い、発声記録テーブル4
5から予め設定された一定期間より以前に更新されたエ
ントリを破棄させる。これにより、以前に用いられてそ
れ以来使われていない発声条件によって、新たな発声条
件に不当な制約がつくことを防止できる。
【0054】また、定期的に割り込みをかける代りに、
タイマ41を制御部31が複数の設定を行うことのでき
るタイマとし、特定の発声要求に対しては次回の通知時
刻と通知番号を設定し、通知された番号の発声要求のエ
ントリを発声記録テーブル45から破棄することによっ
て、制御部の割り込みにおける負荷を軽減してもよい。
【0055】
【発明の効果】本発明を用いることにより、複数の声質
で発声可能な、複数の発声条件設定要求を受け付ける音
声合成装置において、発声要求として全ての条件を指定
しなくても、ある条件を「任意」としておくことができ
る。また、各発声要求が同一または似た声質で発声を行
うことによる、受聴者の混乱を防ぐことができる。
【図面の簡単な説明】
【図1】本発明による音声合成装置の実施例1を示すブ
ロック図である。
【図2】図1の実施例に用いた合成器特性表の内容を示
す図である。
【図3】図1の実施例に用いた発声要求および実際に選
択された発声条件の実現値を表わす図である。
【図4】本発明による音声合成装置の第2実施例を示す
ブロック図である。
【図5】実施例2の動作を説明するフローチャートであ
る。
【図6】実施例2において発声記録テーブル45の内容
を表わす図である。
【図7】実施例2において「任意」項目のない発声要求
(ID=1)を表わす図である。
【図8】実施例2において発声記録テーブル45にエン
トリのない発声要求(ID=3)を示す図である。
【図9】実施例2において話者番号間距離、アクセント
強度間距離、発話速度間距離をを定めるテーブルであ
る。
【図10】実施例2において発声要求(ID=3)の
「任意」項目である平均ピッチ周波数の実現値vfix(3)
を求める方法を説明する図である。
【図11】実施例2において発声要求(ID=3)の
「任意」項目であるアクセント強度の実現値vfix(4)を
求める方法を説明する図である。
【図12】実施例2において発声要求(ID=3)が新
たに記録された発声記録テーブル45を示す図である。
【図13】実施例2において入力部にFIFOメモリを
用いた例を示すブロック図である。
【図14】本発明による音声合成装置の実施例3を示す
ブロック図である。
【図15】実施例3における積算距離記録テーブル42
を示す図である。
【図16】本発明による音声合成装置の実施例6を示す
ブロック図である。
【図17】本発明による音声合成装置の実施例7を示す
ブロック図である。
【符号の説明】
31 制御部 32 FIFOメモリ 41 タイマ 42 積算距離記録テーブル 43 合成器特性表 44 声質間距離算出部 45 発声記録テーブル 51 警告部 52 音声合成部 53 スピーカ

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 声質を変えて音声を発声させることがで
    きる音声合成部と、前記音声合成部の発声可能な声質の
    条件を記憶した合成器特性記憶部と、制御部とを備え、
    前記制御部は、複数の声質項目から成る発声要求を受け
    るとともに、声質項目について条件が指定されていない
    項目を有する発声要求を受け付け、前記条件指定のない
    項目については前記合成器特性記憶部に記憶された声質
    条件を参照して所定の方法で声質条件を設定し、前記音
    声合成部に声質について指令を与え、さらに、発声要求
    ごとに発声状況を記録する発声記録部と、前記条件指定
    のない項目の値と前記発声記録部に記録された発声要求
    の声質のうちの該当項目の値との距離を算出する声質間
    距離算出部とを設け、前記制御部は、前記声質間距離算
    出部で求められた声質間距離が大きくなるように前記条
    件指定のない項目の値を決定する音声合成装置。
  2. 【請求項2】 前記声質間距離を、前記発声記録部に記
    録された発声要求ごとに積算した積算距離を求め、この
    積算距離のうち最小の積算距離が所定のしきい値より小
    さいときは警告を発する請求項1に記載の音声合成装
    置。
  3. 【請求項3】 前記声質間距離を、前記発声記録部に記
    録された発声要求ごとに積算した積算距離を求め、この
    積算距離のうち最小の積算距離が所定のしきい値より小
    さいときは発声を行わない請求項1に記載の音声合成装
    置。
  4. 【請求項4】 前記発声記録部内のデータが前記発声記
    録部内に記録されている時間を測定するタイマを設け、
    古くなったデータの破棄を行う請求項1ないし3のいず
    れか1項に記載の音声合成装置。
  5. 【請求項5】 前記制御部は、要求された発声条件が受
    理されたかどうか、または実際にどのような条件で発声
    されたかを、発声要求元に通知する請求項1ないし4の
    いずれか1項に記載の音声合成装置。
JP6216644A 1994-08-18 1994-08-18 音声合成装置 Expired - Fee Related JP2770747B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP6216644A JP2770747B2 (ja) 1994-08-18 1994-08-18 音声合成装置
US08/515,107 US5857170A (en) 1994-08-18 1995-08-14 Control of speaker recognition characteristics of a multiple speaker speech synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6216644A JP2770747B2 (ja) 1994-08-18 1994-08-18 音声合成装置

Publications (2)

Publication Number Publication Date
JPH0863188A JPH0863188A (ja) 1996-03-08
JP2770747B2 true JP2770747B2 (ja) 1998-07-02

Family

ID=16691673

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6216644A Expired - Fee Related JP2770747B2 (ja) 1994-08-18 1994-08-18 音声合成装置

Country Status (2)

Country Link
US (1) US5857170A (ja)
JP (1) JP2770747B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240384B1 (en) 1995-12-04 2001-05-29 Kabushiki Kaisha Toshiba Speech synthesis method
JPH10177396A (ja) * 1996-12-18 1998-06-30 Brother Ind Ltd 音声合成装置及び発音訓練装置
JP3578598B2 (ja) * 1997-06-23 2004-10-20 株式会社リコー 音声合成装置
JP3287281B2 (ja) 1997-07-31 2002-06-04 トヨタ自動車株式会社 メッセージ処理装置
JP4055249B2 (ja) * 1998-05-30 2008-03-05 ブラザー工業株式会社 情報処理装置および記憶媒体
US6173250B1 (en) * 1998-06-03 2001-01-09 At&T Corporation Apparatus and method for speech-text-transmit communication over data networks
US6446040B1 (en) 1998-06-17 2002-09-03 Yahoo! Inc. Intelligent text-to-speech synthesis
JP2000352991A (ja) * 1999-06-14 2000-12-19 Nippon Telegr & Teleph Corp <Ntt> スペクトル補正機能つき音声合成器
JP2001034282A (ja) * 1999-07-21 2001-02-09 Konami Co Ltd 音声合成方法、音声合成のための辞書構築方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体
WO2005109399A1 (ja) * 2004-05-11 2005-11-17 Matsushita Electric Industrial Co., Ltd. 音声合成装置および方法
JP4871119B2 (ja) * 2006-12-27 2012-02-08 日本電信電話株式会社 音声合成方法、音声合成装置、プログラム、記録媒体
JP2009265278A (ja) * 2008-04-23 2009-11-12 Konica Minolta Business Technologies Inc 音声出力管理システムおよび音声出力装置
US8571849B2 (en) * 2008-09-30 2013-10-29 At&T Intellectual Property I, L.P. System and method for enriching spoken language translation with prosodic information
JP6359327B2 (ja) * 2014-04-25 2018-07-18 シャープ株式会社 情報処理装置および制御プログラム
CN104681023A (zh) * 2015-02-15 2015-06-03 联想(北京)有限公司 一种信息处理方法及电子设备
JP2018155774A (ja) * 2017-03-15 2018-10-04 株式会社東芝 音声合成装置、音声合成方法およびプログラム
US10586537B2 (en) * 2017-11-30 2020-03-10 International Business Machines Corporation Filtering directive invoking vocal utterances

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1987004293A1 (en) * 1986-01-03 1987-07-16 Motorola, Inc. Method and apparatus for synthesizing speech without voicing or pitch information
US5029214A (en) * 1986-08-11 1991-07-02 Hollander James F Electronic speech control apparatus and methods
JPH04175049A (ja) * 1990-11-08 1992-06-23 Toshiba Corp 音声応答装置
JPH04175046A (ja) * 1990-11-08 1992-06-23 Toshiba Corp 音声応答装置
JPH05113795A (ja) * 1991-05-31 1993-05-07 Oki Electric Ind Co Ltd 音声合成装置

Also Published As

Publication number Publication date
JPH0863188A (ja) 1996-03-08
US5857170A (en) 1999-01-05

Similar Documents

Publication Publication Date Title
JP2770747B2 (ja) 音声合成装置
US20040122666A1 (en) Method and apparatus for displaying speech recognition results
US20090254349A1 (en) Speech synthesizer
JP2020505652A5 (ja)
EP3065130B1 (en) Voice synthesis
JP2003150187A (ja) スムージングフィルタを用いた音声合成システム及びその方法並びにスムージングフィルタ特性制御装置及びその方法
US10872597B2 (en) Speech synthesis dictionary delivery device, speech synthesis system, and program storage medium
JPH10257596A (ja) 話速変換方法およびその装置
US9711123B2 (en) Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program recorded thereon
US10453478B2 (en) Sound quality determination device, method for the sound quality determination and recording medium
JP4664194B2 (ja) 声質制御装置および方法およびプログラム記憶媒体
JP2000075878A (ja) 音声合成装置およびその方法ならびに記憶媒体
CN113545781A (zh) 虚拟现实促眠的方法及装置
US20150120303A1 (en) Sentence set generating device, sentence set generating method, and computer program product
JP2001272991A (ja) 音声対話方法及び音声対話装置
JP4953767B2 (ja) 音声生成装置
JPWO2003025787A1 (ja) 文章生成装置及び生成方法
KR101813704B1 (ko) 사용자 음색 분석 장치 및 음색 분석 방법
JP6644141B2 (ja) 応答装置および応答装置の制御方法、制御プログラム
JP2003271171A (ja) 音声合成方法、音声合成装置および音声合成プログラム
JP6044490B2 (ja) 情報処理装置、話速データ生成方法、及びプログラム
JP2018072368A (ja) 音響解析方法および音響解析装置
JP5275470B2 (ja) 音声合成装置およびプログラム
JP2009288456A (ja) テキスト音声合成装置、方法及びプログラム
JP2004118004A (ja) 音声合成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080417

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090417

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100417

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees