JPH11109992A - 音声素片データベースの作成方法、音声合成方法、音声素片データベース、音声素片データベース作成装置および音声合成装置 - Google Patents

音声素片データベースの作成方法、音声合成方法、音声素片データベース、音声素片データベース作成装置および音声合成装置

Info

Publication number
JPH11109992A
JPH11109992A JP9269650A JP26965097A JPH11109992A JP H11109992 A JPH11109992 A JP H11109992A JP 9269650 A JP9269650 A JP 9269650A JP 26965097 A JP26965097 A JP 26965097A JP H11109992 A JPH11109992 A JP H11109992A
Authority
JP
Japan
Prior art keywords
unit
speech
data
characteristic frequency
phoneme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9269650A
Other languages
English (en)
Inventor
Kenichi Hirayama
健一 平山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP9269650A priority Critical patent/JPH11109992A/ja
Publication of JPH11109992A publication Critical patent/JPH11109992A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 合成波形重畳方式に基づいて所望の声質の合
成音声を得るための方法および装置の実現を図る。 【解決手段】 スペクトル包絡記憶部10は、各音素の
スペクトル包絡が記録されたメモリ装置である。話者特
徴周波数記憶部12は、所定の話者の識別に対して有効
な各母音の特徴周波数値が記録されるメモリ装置であ
る。フィルタ部14は、スペクトル包絡記憶部に記録さ
れているスペクトル包絡を読み出して、読み出した母音
のスペクトル包絡に対応する特徴周波数値を話者特徴周
波数記憶部から読み出し、読み出したスペクトル包絡の
前記特徴周波数値に対応する強度を所定量だけ増加させ
る手段である。逆フーリエ変換部16は、フィルタ部か
ら出力されるスペクトル包絡に逆フーリエ変換を施して
音声素片データを作成する手段である。音声素片データ
記憶部18は、逆フーリエ変換部から出力される音声素
片データを記録するためのメモリ装置である。上述の特
徴周波数の抽出は、ツノダテストにより行うのが好適で
ある。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、所望の声質の合
成音声を作成する方法に関する。
【0002】
【従来の技術】テキスト音声合成技術の発展に伴い、音
声合成の応用分野が飛躍的に拡大している。最近では、
ユーザの好みの合成音を作成するための技術開発が盛ん
に行われている。テキスト音声合成は、例えば波形編集
方式により行える。この波形編集方式によれば、比較的
高品質の合成音が得られる。
【0003】この波形編集方式では、1ピッチ相当の音
声素片データを音声波形の最小単位として用いている。
従って、各音素に対応する音声素片データをデータベー
スとして作成しておく必要がある。従来の音声素片デー
タベース作成方法には、主として、自然波形重畳方式お
よび合成波形重畳方式の2方式がある。自然波形重畳方
式では、音声波形に1ピッチ相当の窓関数を積算するこ
とにより、音声素片を直接切り出す。合成波形重畳方式
では、スペクトル分析によって音声波形に変形処理を加
えた後、再び波形に戻すことにより所望の音声素片を得
ている。一般的には、合成波形重畳方式に比べて自然波
形重畳方式の方が明瞭性および肉声感という点で優れて
いる。
【0004】
【発明が解決しようとする課題】しかしながら、日本語
の話し言葉に含まれる音韻は3万個程度もあるので、自
然波形重畳方式では音声素片データベースの作成時に発
声者に強いる負担が大きい。また、音声波形から音声素
片を切り出すときなどに多大な処理を必要とする。よっ
て、音声素片データベースの作成を効率的に行うために
は、比較的処理量が少なくて済む合成波形重畳方式の方
が好適である。
【0005】従って、従来より、合成波形重畳方式に基
づいて所望の声質の合成音声を得るための音声素片デー
タベースを作成する方法の出現が望まれていた。
【0006】
【課題を解決するための手段】そこで、この発明の音声
素片データベースの作成方法によれば、所定の話者の音
声帯域の中から自他識別に対して有効な特徴周波数を各
母音ごとに抽出する第1ステップと、各母音のスペクト
ル包絡の、母音に対応した特徴周波数における強度をそ
れぞれ所定量だけ増加させる第2ステップと、各母音の
スペクトル包絡を含む全ての音素のスペクトル包絡に対
してそれぞれ逆フーリエ変換を施し、音声素片データを
得る第3ステップと、音声素片データの各々をメモリ装
置に記録して音声素片データベースを完成させる第4ス
テップとを含むことを特徴とする。
【0007】人は、無意識のうちに正確に自分の音声を
識別する機構を具えている。この自他識別機構は、他の
既存の音声識別機構とは異なったメカニズムであること
が知られている(文献「右脳と左脳」、角田忠信著、小
学館ライブラリ、1992年発行)。この自他識別機構
では、自分の音声の特徴的な帯域の音の有無によって自
分の声であるか他人の声であるかが識別される。この帯
域内の周波数成分は特徴周波数と呼ばれている(上記文
献pp.165−175参照)。この特徴周波数は各母
音を特徴付けるホルマント周波数とは一致しない。
【0008】また、この自他識別機構によれば、無意識
のレベルで発声者の声を認識することが可能である。つ
まり、自分の声との類似度から、他人の声を識別するこ
とができると考えられる。従って、所望の声質の発声者
の自他識別機構を刺激する特徴周波数の純音が分かれ
ば、その純音を音声素片データに付加することにより、
ユーザにとって所望の音声として認識されることが期待
できる。
【0009】従って、先ず、所望の発声者の音声の特徴
周波数を抽出する。次に、個人的情報を含まない母音の
スペクトル包絡の特徴周波数成分を強調する。続いて、
強調処理を施したスペクトル包絡に対して逆フーリエ変
換を施すことによって、音声素片データが得られる。得
られた音声素片データは読み出し自在の状態で記録媒体
に記録して、音声素片データベースを完成させる。
【0010】よって、所望の音声が出力可能である音声
素片データベースを比較的簡単に作成できる。このよう
に、母音のスペクトル包絡の特徴周波数成分を強調する
だけで済むから、発声者の負担量や発声音声収集時間な
どが大幅に減少する。
【0011】尚、上述した方法では、母音のスペクトル
包絡だけに強調処理を施している。これは、母音の方が
子音よりも声質の個人性が現れやすいと考えられるため
である。しかしながら、次に説明するように、子音に対
して強調処理を施してもよい。
【0012】すなわち、この発明の音声素片データベー
スの作成方法によれば、所定の話者の音声帯域の中から
自他識別に対して有効な特徴周波数を抽出する第1ステ
ップと、各音素のスペクトル包絡の、全ての特徴周波数
における強度をそれぞれ所定量だけ増加させる第2ステ
ップと、各音素のスペクトル包絡に対してそれぞれ逆フ
ーリエ変換を施し、音声素片データを得る第3ステップ
と、音声素片データの各々をメモリ装置に記録して音声
素片データベースを完成させる第4ステップとを含むこ
とを特徴とする。
【0013】よって、この場合には、子音のスペクトル
包絡の特徴周波数成分も強調される。従って、上述した
第1番目の方法に比べると、母音と子音との選別作業を
行わなくて済むから、処理量および処理時間が低減す
る。また、各母音および各子音のスペクトル包絡の、各
母音に対して抽出したすべての特徴周波数における強度
を強調させるので、母音に対応した特徴周波数の選別も
不要である。従って、コストの軽減が図れる。
【0014】この発明の音声素片データベースの作成方
法において、好ましくは、特徴周波数の抽出をツノダテ
ストにより行うのが良い。
【0015】ツノダテストとは、被験者の電鍵打叩操作
に及ぼすDAF(Delayed AuditoryFeedback )効果を
指標とする検査方法である(上記文献参照)。このテス
トにおいては、片方の耳に指の打叩と一致した同期音を
聞かせ、反対側の耳には電鍵の打叩を妨害する音を同期
音より0.2秒遅らせて与えて、両耳間の競合状態を起
こす。そして、打叩動作に乱れが生じたときの音を抽出
することによって音の優位性を測る。このテストを、自
己の母音を同期音とし、他者の母音を妨害音として実施
すると、自己の母音が優位になる。そして、自己の母音
をフィルタで濾過して、自己が他者に勝る特徴的な帯域
を絞り込むと特徴周波数が得られる。
【0016】次に、この発明の音声合成方法によれば、
所定の話者の音声帯域の中から自他識別に対して有効な
特徴周波数を各母音ごとに抽出する第1ステップと、各
母音のスペクトル包絡の、母音に対応した特徴周波数に
おける強度をそれぞれ所定量だけ増加させる第2ステッ
プと、各母音のスペクトル包絡を含む全ての音素のスペ
クトル包絡に対してそれぞれ逆フーリエ変換を施し、音
声素片データを得る第3ステップと、音声素片データの
各々をメモリ装置に記録して音声素片データベースを完
成させる第4ステップと、音韻韻律規則に基づいて、音
声素片データベースに格納されている音声素片データの
格納場所と、その音声素片データの音韻継続時間、ピッ
チおよび強さとを決定する第5ステップと、前記決定に
基づいて、音声素片データベースに格納されている音声
素片データを読み出して合成を行い、音声波形データを
作成する第6ステップと、この音声波形データに基づい
て合成音声を出力させる第7ステップとを含むことを特
徴とする。
【0017】このように、第1ステップから第4ステッ
プでは、上述した第1番目の音声素片データベースの作
成方法に従って音声素片データベースが作成される。続
く第5ステップから第7ステップでは、作成した音声素
片データベースを用いて、音声素片データの読み出しお
よび合成が行われる。このようにして、所定の合成音声
が得られる。
【0018】上述の音韻韻律規則とは、音韻の組み合わ
せ、イントネーション、アクセント、ストレス、ポー
ズ、継続時間などの情報である。テキスト音声合成で
は、入力したテキストの音韻韻律規則を抽出して、この
音韻韻律規則に基づいて音声素片データの接続順、継続
時間、ピッチおよび強さが決定される。そして、この決
定した情報に基づいて音声素片データの読み出しおよび
合成(変形処理)が行われる。
【0019】また、この発明の音声合成方法によれば、
所定の話者の音声帯域の中から自他識別に対して有効な
特徴周波数を抽出する第1ステップと、各音素のスペク
トル包絡の、全ての特徴周波数における強度をそれぞれ
所定量だけ増加させる第2ステップと、各音素のスペク
トル包絡に対してそれぞれ逆フーリエ変換を施し、音声
素片データを得る第3ステップと、音声素片データの各
々をメモリ装置に記録して音声素片データベースを完成
させる第4ステップと、音韻韻律規則に基づいて、音声
素片データベースに格納されている音声素片データの格
納場所と、その音声素片データの音韻継続時間、ピッチ
および強さとを決定する第5ステップと、前記決定に基
づいて、音声素片データベースに格納されている音声素
片データを読み出して合成を行い、音声波形データを作
成する第6ステップと、この音声波形データに基づいて
合成音声を出力させる第7ステップとを含むことを特徴
とする。
【0020】このように、第1ステップから第4ステッ
プでは、上述した第2番目の音声素片データベースの作
成方法に従って音声素片データベースが作成される。続
く第5ステップから第7ステップでは、作成した音声素
片データベースを用いて、音声素片データの読み出しお
よび合成が行われる。このようにして、所定の合成音声
が得られる。
【0021】この発明の音声素片データベースによれ
ば、各音素の音声波形が音声素片データとして記録され
た音声素片データベースであって、母音に対応した前記
音声素片データの、所定の話者の識別に対して有効な特
徴周波数成分の強度が所定量だけ強められていることを
特徴とする。
【0022】このような音声素片データベースは、所定
の声質の合成音声を作成するために好適である。また、
この音声素片データベースを利用して、音声合成装置を
構成すると好適である。
【0023】すなわち、この発明の音声合成装置によれ
ば、上述の音声素片データベースを格納した音声素片デ
ータ記憶部と、テキストデータを入力するためのデータ
入力部と、単語辞書を参照して、テキストデータに対応
する音韻韻律情報を出力する文章解析部と、音韻韻律情
報に基づいて、音声素片データ記憶部に記録されている
音声素片データの格納場所、音韻の継続時間、ピッチお
よび発声強度の情報を含む合成パラメータを作成する合
成パラメータ生成部と、合成パラメータに基づいて、音
声素片データの音声素片データ記憶部からの読み出し、
およびこれら読み出した音声素片データの合成を順次に
行い、音声波形データを生成する素片データ合成部と、
音声波形データに基づいて合成音声を出力する音声合成
出力部とを具えることを特徴とする。
【0024】このように構成してあるので、入力したテ
キストデータ通りに合成音声を出力させることができ
る。しかも、上述した音声波形データベースを利用して
いるので、所望の声質の合成音声を出力させることがで
きる。
【0025】尚、上述の音声素片データベースを作成す
るためには、次に説明する音声素片データベース作成装
置を用いるのが好適である。
【0026】すなわち、この発明の音声素片データベー
ス作成装置によれば、各音素のスペクトル包絡が記録さ
れるスペクトル包絡記憶部と、所定の話者の識別に対し
て有効な各母音の特徴周波数値が記録される話者特徴周
波数記憶部と、スペクトル包絡記憶部に記録されている
スペクトル包絡を読み出して、読み出した母音のスペク
トル包絡に対応する特徴周波数値を話者特徴周波数記憶
部から読み出し、読み出したスペクトル包絡の特徴周波
数値に対応する強度を所定量だけ増加させるフィルタ部
と、フィルタ部から出力されるスペクトル包絡に逆フー
リエ変換を施して音声素片データを作成する逆フーリエ
変換部と、逆フーリエ変換部から出力される音声素片デ
ータを記録するための音声素片データ記憶部とを具える
ことを特徴とする。
【0027】このような装置を用いると、比較的少ない
処理量で合成音声を作成することができる。また、上述
の話者特徴周波数記憶部には、複数人の話者の特徴周波
数値を記録するように構成してもよい。そして、所望の
話者を選択可能として、その選択した話者の特徴周波数
値がフィルタ部に読み出されるように構成するとよい。
この場合には、所望の話者の音声素片データベースを利
用するとき、そのつど音声素片データベースを作成して
音声素片データ記憶部に記憶させる。従って、音声素片
データ記憶部の容量を、一人分の話者に相当する容量で
済ますことができる。
【0028】また、この発明の音声素片データベース作
成装置によれば、各音素のスペクトル包絡が記録される
スペクトル包絡記憶部と、所定の話者の識別に対して有
効な各母音の特徴周波数値が記録される話者特徴周波数
記憶部と、スペクトル包絡記憶部に記録されているスペ
クトル包絡と話者特徴周波数記憶部に記録されている全
ての特徴周波数値とを読み出して、読み出したスペクト
ル包絡の全ての特徴周波数値に対応する強度を所定量だ
け増加させるフィルタ部と、フィルタ部から出力される
スペクトル包絡に逆フーリエ変換を施して音声素片デー
タを作成する逆フーリエ変換部と、逆フーリエ変換部か
ら出力される音声素片データを記録するための音声素片
データ記憶部とを具えることを特徴とする。
【0029】このような構成の音声素片データベース作
成装置は、上述の音声素片データベース作成装置に比べ
て、さらに、短時間で作成処理をこなすことができる。
【0030】次に、以上説明した音声素片データベース
作成装置を構成成分として音声合成装置を構成すると好
適である。
【0031】すなわち、この発明の音声合成装置によれ
ば、各音素のスペクトル包絡が記録されるスペクトル包
絡記憶部と、所定の話者の識別に対して有効な各母音の
特徴周波数値が記録される話者特徴周波数記憶部と、ス
ペクトル包絡記憶部に記録されているスペクトル包絡を
読み出して、読み出した母音のスペクトル包絡に対応す
る特徴周波数値を話者特徴周波数記憶部から読み出し、
読み出したスペクトル包絡の特徴周波数値に対応する強
度を所定量だけ増加させるフィルタ部と、フィルタ部か
ら出力されるスペクトル包絡に逆フーリエ変換を施して
音声素片データを作成する逆フーリエ変換部と、逆フー
リエ変換部から出力される音声素片データを記録するた
めの音声素片データ記憶部と、テキストデータを入力す
るためのデータ入力部と、単語辞書を参照して、テキス
トデータに対応する音韻韻律情報を出力する文章解析部
と、音韻韻律情報に基づいて、音声素片データ記憶部に
記録されている音声素片データの格納場所、音韻の継続
時間、ピッチおよび発声強度の情報を含む合成パラメー
タを作成する合成パラメータ生成部と、合成パラメータ
に基づいて、音声素片データの音声素片データ記憶部か
らの読み出し、およびこれら読み出した音声素片データ
の合成を順次に行い、音声波形データを生成する素片デ
ータ合成部と、音声波形データに基づいて合成音声を出
力する音声合成出力部とを具えることを特徴とする。
【0032】このように、上述した音声素片データベー
ス作成装置を具えているので、所定の話者の選択が可能
となり、その選択した話者の音声で所定のテキストを朗
読させることができる。
【0033】また、この発明の音声合成装置によれば、
各音素のスペクトル包絡が記録されるスペクトル包絡記
憶部と、所定の話者の識別に対して有効な各母音の特徴
周波数値が記録される話者特徴周波数記憶部と、スペク
トル包絡記憶部に記録されているスペクトル包絡と話者
特徴周波数記憶部に記録されている全ての特徴周波数値
とを読み出して、読み出したスペクトル包絡の全ての特
徴周波数値に対応する強度を所定量だけ増加させるフィ
ルタ部と、フィルタ部から出力されるスペクトル包絡に
逆フーリエ変換を施して音声素片データを作成する逆フ
ーリエ変換部と、逆フーリエ変換部から出力される音声
素片データを記録するための音声素片データ記憶部と、
テキストデータを入力するためのデータ入力部と、単語
辞書を参照して、テキストデータに対応する音韻韻律情
報を出力する文章解析部と、音韻韻律情報に基づいて、
音声素片データ記憶部に記録されている音声素片データ
の格納場所、音韻の継続時間、ピッチおよび発声強度の
情報を含む合成パラメータを作成する合成パラメータ生
成部と、合成パラメータに基づいて、音声素片データの
音声素片データ記憶部からの読み出し、およびこれら読
み出した音声素片データの合成を順次に行い、音声波形
データを生成する素片データ合成部と、音声波形データ
に基づいて合成音声を出力する音声合成出力部とを具え
ることを特徴とする。
【0034】従って、さらに処理速度の速い音声合成装
置が構成できる。
【0035】
【発明の実施の形態】以下、図を参照して、この発明の
実施の形態につき説明する。尚、図は、この発明が理解
できる程度に、構成、配置関係および接続関係が概略的
に示されているに過ぎない。また、以下に記載する数値
等の条件は単なる一例に過ぎない。従って、この発明
は、この実施の形態に何ら限定されることがない。
【0036】[第1の実施の形態]第1の実施の形態で
は、音声素片データベース作成装置の第1構成について
説明する。図1は、音声素片データベース作成装置の第
1構成を示すブロック図である。音声素片データベース
作成装置36は、スペクトル包絡記憶部10と、話者特
徴周波数記憶部12と、フィルタ部14と、逆フーリエ
変換部16と、音声素片データ記憶部18とを具えてい
る。
【0037】スペクトル包絡記憶部10は、各音素のス
ペクトル包絡が記録されるメモリ装置である。ここに格
納されるスペクトル包絡は、個人的情報を含まない一般
的なスペクトル包絡である。つまり、このスペクトル包
絡には、個人の音声として認識されるような情報が含ま
れていない。フィルタ部14は、このスペクトル包絡記
憶部10から各音素ごとにスペクトル包絡を読み出して
ゆく。
【0038】話者特徴周波数記憶部12は、所定の話者
の識別に対して有効な各母音の特徴周波数値が記録され
たメモリ装置である。この実施の形態では、この特徴周
波数値をツノダテストにより抽出している。このため、
予め所望の声質を有した話者にツノダテストを受けても
らう。この結果、無意識のうちに正確に自己の声と他者
の声との識別を可能とする特徴周波数が各母音ごとに決
定される。上記文献によれば、各母音に対してそれぞれ
2つの特徴周波数が抽出される。抽出された特徴周波数
の値は、話者特徴周波数記憶部12の母音に対応した記
憶領域にそれぞれ格納される。
【0039】図2は、話者特徴周波数記憶部12の記憶
内容を示す表である。図2に示すように、話者特徴周波
数記憶部12には、特徴周波数値が母音に対応付けされ
て記録されている。例えば、母音/あ/に対応して、特
徴周波数値f1(例えばf1=460Hz)およびf2
(例えばf2=1900Hz)が記録されている。ま
た、例えば、母音/い/に対応して、特徴周波数値f1
(例えばf1=480Hz)およびf2(f2=170
0Hz)が記録されている。また、話者特徴周波数記憶
部12には、複数人の話者の特徴周波数値を記録してお
いてもよい。この場合には、図2に示すように各特徴周
波数値を話者番号(発声者No.)ごとに対応付けて記
録しておく。
【0040】フィルタ部14は、スペクトル包絡記憶部
10に記録されているスペクトル包絡を読み出して、読
み出した母音のスペクトル包絡に対応する特徴周波数値
を話者特徴周波数記憶部12から読み出す。そして、フ
ィルタ部14は、読み出したスペクトル包絡の特徴周波
数値に対応する強度を所定量だけ増加させる。このた
め、この構成例のフィルタ部14は、入力側切り替え部
20、フィルタ要素群24および出力側切り替え部22
を具えている。このフィルタ要素群24は、各母音/あ
/、/い/、/う/、/え/および/お/に対応した5
つのフィルタ要素26a〜26eを具えている。上述の
入力側切り替え部20は、スペクトル包絡記憶部10か
ら読み出されたスペクトル包絡が母音に相当する場合、
このスペクトル包絡を、これらフィルタ要素群24を構
成するいずれか1つのフィルタ要素に入力させる。
【0041】一方、話者特徴周波数記憶部12から読み
出された特徴周波数値は、母音に対応したフィルタ要素
26a〜26eに入力される。この入力は、スペクトル
包絡の読み出しの前にまとめて行ってもよいし、あるい
は、スペクトル包絡の読み出しごとに随時行ってもよ
い。従って、例えば、母音/あ/に対して抽出された特
徴周波数値は、母音/あ/に対応したフィルタ要素26
aに入力される。この結果、フィルタ要素26aは、入
力されるスペクトル包絡の母音/あ/の特徴周波数値に
対応する強度を、所定量だけ増加させる機能を有するよ
うになる。その他、母音/い/〜/お/に対応するフィ
ルタ要素26b〜26eについても同様である。
【0042】また、母音ではなく、子音のスペクトル包
絡は、フィルタ要素群24には入力されず、出力側切り
替え部22に直接送られる。よって、この構成例では、
このフィルタ部14において、子音のスペクトル包絡に
対しては強度の強調処理が施されない。
【0043】従って、スペクトル包絡記憶部10から読
み出されたスペクトル包絡は、先ず、入力側切り替え部
20のスイッチング動作によって母音と子音とに選別さ
れる。このとき、読み出されたスペクトル包絡が母音の
場合には、そのスペクトル包絡がその母音に対応したフ
ィルタ要素26a〜26eに入力されるように、入力側
切り替え部20がスイッチングを行う。そして、フィル
タ要素により所定の周波数値における強度が強調された
スペクトル包絡は、出力側切り替え部22に伝送され
る。出力側切り替え部22は、入力されるスペクトル包
絡が逆フーリエ変換部16に入力されるようにスイッチ
ングを行う。
【0044】尚、上述したように、話者特徴周波数記憶
部12に複数人の話者の特徴周波数値が記録されている
場合には、所定の話者を選択して、その選択した話者の
特徴周波数値がフィルタ部14に入力されるように構成
しておくのが良い。
【0045】次に、逆フーリエ変換部16は、フィルタ
部14から出力されるスペクトル包絡に逆フーリエ変換
を施して音声素片データを作成する装置である。フィル
タ部14から出力されるスペクトル包絡には、この逆フ
ーリエ変換部16によって逆フーリエ変換が施される。
この結果、音素単位の1ピッチ相当の音声波形が音声素
片データとして得られる。
【0046】図3は、この構成例の音声素片データベー
ス作成装置の動作説明に供する図であり、特にフィルタ
部14の動作の説明に供するグラフである。図3の上側
から順次に、母音のスペクトル包絡の波形の一例(図3
(A))と、フィルタ要素の透過周波数特性および強度
強調処理を施された母音のスペクトル包絡の波形(図3
(B))と、逆フーリエ変換部16から出力された音声
素片データの一例(図3(C))とをそれぞれ示してあ
る。図3(A)および(B)に示す各グラフの横軸には
周波数を取り、縦軸には強度を取って示してある。ま
た、図3(C)に示すグラフの横軸には時間を取り、縦
軸には強度を取って示してある。
【0047】上述したように、フィルタ部14では、図
3(A)に示す波形の母音のスペクトル包絡(曲線a)
が入力されると、このスペクトル包絡をその母音に対応
した所定のフィルタ要素に送り出す。この例では、その
送られた先のフィルタ要素が図3(B)に示される透過
周波数特性(曲線b)を有している。図3(B)の上側
グラフに示すように、このフィルタ要素は、周波数f1
およびf2におけるスペクトル包絡の強度を強調するよ
うに設定されている。これら周波数f1およびf2は、
読み込まれたスペクトル包絡の特徴周波数に対応してい
る。よって、図3(B)の下側グラフに示すように、こ
のフィルタ要素から出力されたスペクトル包絡(曲線
c)では、上述のf1およびf2の周波数における強度
が強調されている。続いて、この強調処理が施されたス
ペクトル包絡は逆フーリエ変換部16に出力される。そ
こで、このスペクトル包絡は逆フーリエ変換を施され
て、例えば図3(C)に示す波形の音声素片データ(曲
線d)に変換される。
【0048】そして、逆フーリエ変換部16から出力さ
れた音声素片データは、音声素片データ記憶部18に格
納される。この結果、音声素片データ記憶部18には、
各音素に対応した音声素片データが読み出し自在の状態
で記録されて、音声素片データベースが完成する。この
音声素片データ記憶部18の出力端子は、例えば後述す
る音声合成装置に接続されて利用に供される。
【0049】以上説明したように、この構成例の音声素
片データベース作成装置36によれば、所望の声質の音
声素片データベースを作成することが可能である。しか
も、フィルタ処理を施すだけでよいから、処理量の低減
および処理時間の短縮が図れる。
【0050】[第2の実施の形態]次に、この実施の形
態では、音声素片データベース作成装置の第2構成につ
いて説明する。この第2構成の音声素片データベース作
成装置は、基本的に第1構成と同様の構成である。第1
構成と第2構成とは、フィルタ部14の構成が異なって
いるだけである。
【0051】図4は、音声素片データベース作成装置の
第2構成を示すブロック図である。この構成例の音声素
片データベース作成装置38は、第1構成と同様に、ス
ペクトル包絡記憶部10、話者特徴周波数記憶部12、
逆フーリエ変換部16および音声素片データ記憶部18
を具えている。そして、音声素片データベース作成装置
38は、第1構成と構成の異なるフィルタ部14aを具
えている。このフィルタ部14aは、スペクトル包絡記
憶部10に記録されているスペクトル包絡と話者特徴周
波数記憶部12に記録されている全ての特徴周波数値と
を読み出すように構成されている。そして、読み出した
スペクトル包絡の全ての特徴周波数値に対応する強度を
所定量だけ増加させる。
【0052】図5は、フィルタ部14aの透過周波数特
性を示すグラフである。横軸に周波数を取ってあり、縦
軸に透過音声波形の強度を取ってある。曲線aで示すよ
うに、フィルタ部14aは、各母音/あ/〜/お/に対
して抽出された特徴周波数における音声(スペクトル包
絡)の強度を強調する。この実施の形態例では、母音の
各々に対して2つの特徴周波数値が抽出されているの
で、図5に示す透過周波数特性aには合計10個のピー
クが存在する。このように、このフィルタ部14aは、
第1構成のフィルタ部14とは異なり、母音と子音との
選別および母音の選別を行わない。従って、フィルタ部
14aから出力されるスペクトル包絡は母音および子音
に関わらず、図5に示すピーク位置の周波数における強
度が全て強調される。
【0053】従って、この構成例のフィルタ部14a
は、入力側切り替え部20や出力側切り替え部22など
の選別手段を有していない。従って、処理時間の短縮お
よびフィルタ部の構成の簡略化が図れるので、コストの
低減が実現される。
【0054】[第3の実施の形態]次に、この実施の形
態では、音声合成装置の第1構成につき説明する。図6
は、音声合成装置の構成を示すブロック図である。この
構成例の音声合成装置は、音声素片データ記憶部18、
データ入力部40、文章解析部42、単語辞書記憶部4
4、合成パラメータ生成部46、素片データ合成部48
および音声合成出力部50を具えている。上述の音声素
片データ記憶部18は、図1を参照して説明したもので
ある。つまり、第1および第2の実施の形態で説明した
音声素片データベース作成装置によって、この音声素片
データ記憶部18には音声素片データベースが記録され
ている。従って、この音声素片データベースは、各音素
の音声波形が音声素片データとして記録されたものであ
って、母音に対応した音声素片データの、所定の話者の
識別に対して有効な特徴周波数成分の強度が所定量だけ
強められている。
【0055】以下、各構成成分につき順次に説明する。
まず、データ入力部40は、例えばRS−232Cなど
の通信ポート(外部インターフェース)やフロッピーデ
ィスクドライブやキーボードなどのデータ入力手段であ
る。このデータ入力部40によりテキストデータの入力
が行われる。データ入力部40により入力されたテキス
トデータは内部バッファなどの記憶手段に一時保存さ
れ、ある単位例えば文章や文節ごとに文章解析部42に
送られる。
【0056】文章解析部42は、単語辞書を参照して、
データ入力部40から送られるテキストデータに対応す
る音韻韻律情報を出力する装置である。この構成例で
は、単語辞書が単語辞書記憶部44に記憶されており、
文章解析部42はこの単語辞書記憶部44から随時デー
タを送ってもらって上述の音韻韻律情報を生成する。こ
のように、文章解析部42では、単語辞書とテキストデ
ータとを照合しながら、アクセント、イントネーショ
ン、ポーズなどの情報を文字列として記述した音韻韻律
情報(音韻韻律記号)を作成する。そして、この音韻韻
律情報を合成パラメータ生成部46に送る。
【0057】合成パラメータ生成部46は、送られる音
韻韻律情報に基づいて、音声素片データ記憶部18に記
録されている音声素片データの格納場所、音韻の継続時
間、ピッチ(声の高さ)および発声強度の情報を含む合
成パラメータを作成する。そして、合成パラメータ生成
部46は、この作成した合成パラメータを素片データ合
成部48に出力する。
【0058】素片データ合成部48は、送られた合成パ
ラメータに基づいて、音声素片データの音声素片データ
記憶部18からの読み出し、およびこれら読み出した音
声素片データの合成を順次に行い、音声波形データを生
成する装置である。このように、素片データ合成部48
は、合成パラメータに基づいて、音声素片データを読み
込みながら、音声波形データを作成する。そして、素片
データ合成部48は、この作成した音声波形データを音
声合成出力部50に送る。
【0059】音声合成出力部50は、音声波形データに
基づいて合成音声を出力する装置である。この構成例の
音声合成出力部50は、D/A変換器52、アナログ部
54およびスピーカ56を具えている。従って、音声合
成出力部50に送られた音声波形データは、先ず、D/
A変換器52に入力してアナログ電気信号に変換され
る。次に、このアナログ電気信号は、アナログ部54に
送られる。アナログ部54は、ローパスフィルタ58お
よびアンプ60を具えている。このアナログ部54で
は、入力されたアナログ電気信号の不要な低周波数成分
をローパスフィルタ58によって抑制する。そして、ア
ンプ60によって信号の強度を増強させてスピーカ56
に送り出す。この結果、スピーカ56からは、所望の声
質の合成音声が出力される。
【0060】従って、この構成例の音声合成装置によっ
て、所望の声質の合成音声を出力させることが可能であ
る。第1および第2の実施の形態で説明したように、音
声素片データベースの作成が比較的容易であるから、発
声者にかかる負担の量や発声音声の収集時間などが小さ
くて済む。
【0061】[第4の実施の形態]次に、この実施の形
態では、音声合成装置の第2構成につき説明する。この
第2構成の音声合成装置は、第1および第2の実施の形
態で説明した音声素片データベース作成装置を構成成分
として具えている。従って、この構成例の音声合成装置
は、所望の話者の声質でテキストを読ませたいときなど
に利用できる。すなわち、随時に音声素片データベース
の作成を行って、所望の合成音声を出力させることが可
能である。
【0062】図7は、この音声合成装置の第2構成を示
すブロック図である。この音声合成装置は、データ入力
部40、文章解析部42、単語辞書記憶部44、合成パ
ラメータ生成部46、素片データ合成部48、音声合成
出力部50および音声素片データベース作成装置36
(または38)を具えている。そして、音声素片データ
ベース作成装置36(38)を構成する音声素片データ
記憶部18の出力端子が素片データ合成部48に接続さ
れている。
【0063】従って、この構成例の音声合成装置では、
先ず、テキストデータを朗読させる話者の選択を行う。
話者特徴周波数記憶部12には、所定の複数人の話者の
特徴周波数値が記録されている。ユーザは、これら話者
の中から所望の話者を選択することができる。続いて、
選択された話者の特徴周波数値がフィルタ部14(また
は14a)に送られて、そこで上述した所定の強度強調
処理が施される。この結果、音声素片データが作成さ
れ、音声素片データ記憶部18には所望の音声素片デー
タベースが形成される。そして、音声素片データベース
が完成した後は、第3の実施の形態で説明したように、
データ入力部40によりテキストデータを入力させれば
よい。
【0064】このように、この音声合成装置では、音声
素片データベースの書き換えが容易である。このような
構成ではない場合、例えば、音声素片データベースがR
OM(リードオンリーメモリ)などで提供されている場
合には、ROMを変更するための手数料がかかってしま
う。また、音声素片データベースが書き換え可能な記録
媒体に記録されている場合であっても、ダウンロードな
どの通信費などを必要とする。これに対して、この実施
の形態で説明した音声合成装置では、音声素片データベ
ースを書き換える際には、話者特徴周波数記憶部12の
内容を変更するだけでよい。あるいは、上述したよう
に、予めこの話者特徴周波数記憶部12に複数人の話者
の特徴周波数値を記録しておけばこの必要もない。従っ
て、この音声合成装置によればコストの低減が図れる。
【0065】尚、上述した構成では、話者特徴周波数記
憶部12に記憶させる容量が少なくて済むから、この話
者特徴周波数記憶部12を例えば磁気カードやICカー
ドなどで構成することができる。従って、非常に低コス
トで好みの声質に対応可能な音声合成システムの構築が
可能となる。
【0066】
【発明の効果】この発明の音声素片データベースの作成
方法によれば、人の自他識別機構を利用することによ
り、所望の音声が出力可能である音声素片データベース
を比較的簡単に作成できる。この方法では、母音のスペ
クトル包絡の特徴周波数成分を強調するだけで済むか
ら、発声者の負担量や発声音声収集時間などが大幅に減
少する。
【0067】また、この発明の音声合成装置によれば、
入力したテキストデータ通りに所望の声質の合成音声を
出力させることができる。そして、この発明の装置を用
いると、比較的少ない処理量で合成音声を作成すること
ができる。従って、コストの低減が図れる。
【図面の簡単な説明】
【図1】音声素片データベース作成装置の第1構成を示
す図である。
【図2】話者特徴周波数記憶部の記憶内容を示す図であ
る。
【図3】音声素片データベース作成装置の動作説明に供
する図である。
【図4】音声素片データベース作成装置の第2構成を示
す図である。
【図5】フィルタ部の透過周波数特性を示す図である。
【図6】音声合成装置の第1構成を示す図である。
【図7】音声合成装置の第2構成を示す図である。
【符号の説明】
10:スペクトル包絡記憶部 12:話者特徴周波数記憶部 14、14a:フィルタ部 16:逆フーリエ変換部 18:音声素片データ記憶部 20:入力側切り替え部 22:出力側切り替え部 24:フィルタ要素群 26a〜26e:フィルタ要素 36、38:音声素片データベース作成装置 40:データ入力部 42:文章解析部 44:単語辞書記憶部 46:合成パラメータ生成部 48:素片データ合成部 50:音声合成出力部 52:D/A変換器 54:アナログ部 56:スピーカ 58:ローパスフィルタ 60:アンプ

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 所定の話者の音声帯域の中から自他識別
    に対して有効な特徴周波数を各母音ごとに抽出する第1
    ステップと、 各母音のスペクトル包絡の、母音に対応した前記特徴周
    波数における強度をそれぞれ所定量だけ増加させる第2
    ステップと、 前記各母音のスペクトル包絡を含む全ての音素のスペク
    トル包絡に対してそれぞれ逆フーリエ変換を施し、音声
    素片データを得る第3ステップと、 前記音声素片データの各々をメモリ装置に記録して音声
    素片データベースを完成させる第4ステップとを含むこ
    とを特徴とする音声素片データベースの作成方法。
  2. 【請求項2】 所定の話者の音声帯域の中から自他識別
    に対して有効な特徴周波数を抽出する第1ステップと、 各音素のスペクトル包絡の、全ての前記特徴周波数にお
    ける強度をそれぞれ所定量だけ増加させる第2ステップ
    と、 前記各音素のスペクトル包絡に対してそれぞれ逆フーリ
    エ変換を施し、音声素片データを得る第3ステップと、 前記音声素片データの各々をメモリ装置に記録して音声
    素片データベースを完成させる第4ステップとを含むこ
    とを特徴とする音声素片データベースの作成方法。
  3. 【請求項3】 請求項1または請求項2に記載の音声素
    片データベースの作成方法において、 前記特徴周波数の抽出をツノダテストにより行うことを
    特徴とする音声素片データベースの作成方法。
  4. 【請求項4】 所定の話者の音声帯域の中から自他識別
    に対して有効な特徴周波数を各母音ごとに抽出する第1
    ステップと、 各母音のスペクトル包絡の、母音に対応した前記特徴周
    波数における強度をそれぞれ所定量だけ増加させる第2
    ステップと、 前記各母音のスペクトル包絡を含む全ての音素のスペク
    トル包絡に対してそれぞれ逆フーリエ変換を施し、音声
    素片データを得る第3ステップと、 前記音声素片データの各々をメモリ装置に記録して音声
    素片データベースを完成させる第4ステップと、 音韻韻律規則に基づいて、前記音声素片データベースに
    格納されている音声素片データの格納場所と、その音声
    素片データの音韻継続時間、ピッチおよび強さとを決定
    する第5ステップと、 前記決定に基づいて、前記音声素片データベースに格納
    されている音声素片データを読み出して合成を行い、音
    声波形データを作成する第6ステップと、 該音声波形データに基づいて合成音声を出力させる第7
    ステップとを含むことを特徴とする音声合成方法。
  5. 【請求項5】 所定の話者の音声帯域の中から自他識別
    に対して有効な特徴周波数を抽出する第1ステップと、 各音素のスペクトル包絡の、全ての前記特徴周波数にお
    ける強度をそれぞれ所定量だけ増加させる第2ステップ
    と、 前記各音素のスペクトル包絡に対してそれぞれ逆フーリ
    エ変換を施し、音声素片データを得る第3ステップと、 前記音声素片データの各々をメモリ装置に記録して音声
    素片データベースを完成させる第4ステップと、 音韻韻律規則に基づいて、前記音声素片データベースに
    格納されている音声素片データの格納場所と、その音声
    素片データの音韻継続時間、ピッチおよび強さとを決定
    する第5ステップと、 前記決定に基づいて、前記音声素片データベースに格納
    されている音声素片データを読み出して合成を行い、音
    声波形データを作成する第6ステップと、 該音声波形データに基づいて合成音声を出力させる第7
    ステップとを含むことを特徴とする音声合成方法。
  6. 【請求項6】 各音素の音声波形が音声素片データとし
    て記録された音声素片データベースであって、 母音に対応した前記音声素片データの、所定の話者の識
    別に対して有効な特徴周波数成分の強度が所定量だけ強
    められていることを特徴とする音声素片データベース。
  7. 【請求項7】 各音素のスペクトル包絡が記録されるス
    ペクトル包絡記憶部と、 所定の話者の識別に対して有効な各母音の特徴周波数値
    が記録される話者特徴周波数記憶部と、 前記スペクトル包絡記憶部に記録されているスペクトル
    包絡を読み出して、読み出した母音のスペクトル包絡に
    対応する特徴周波数値を前記話者特徴周波数記憶部から
    読み出し、前記読み出したスペクトル包絡の前記特徴周
    波数値に対応する強度を所定量だけ増加させるフィルタ
    部と、 前記フィルタ部から出力されるスペクトル包絡に逆フー
    リエ変換を施して音声素片データを作成する逆フーリエ
    変換部と、 前記逆フーリエ変換部から出力される音声素片データを
    記録するための音声素片データ記憶部とを具えることを
    特徴とする音声素片データベース作成装置。
  8. 【請求項8】 各音素のスペクトル包絡が記録されるス
    ペクトル包絡記憶部と、 所定の話者の識別に対して有効な各母音の特徴周波数値
    が記録される話者特徴周波数記憶部と、 前記スペクトル包絡記憶部に記録されているスペクトル
    包絡と前記話者特徴周波数記憶部に記録されている全て
    の特徴周波数値とを読み出して、前記読み出したスペク
    トル包絡の前記全ての特徴周波数値に対応する強度を所
    定量だけ増加させるフィルタ部と、 前記フィルタ部から出力されるスペクトル包絡に逆フー
    リエ変換を施して音声素片データを作成する逆フーリエ
    変換部と、 前記逆フーリエ変換部から出力される音声素片データを
    記録するための音声素片データ記憶部とを具えることを
    特徴とする音声素片データベース作成装置。
  9. 【請求項9】 請求項6に記載の音声素片データベース
    を格納した音声素片データ記憶部と、 テキストデータを入力するためのデータ入力部と、 単語辞書を参照して、前記テキストデータに対応する音
    韻韻律情報を出力する文章解析部と、 前記音韻韻律情報に基づいて、前記音声素片データ記憶
    部に記録されている音声素片データの格納場所、音韻の
    継続時間、ピッチおよび発声強度の情報を含む合成パラ
    メータを作成する合成パラメータ生成部と、 前記合成パラメータに基づいて、前記音声素片データの
    前記音声素片データ記憶部からの読み出し、およびこれ
    ら読み出した音声素片データの合成を順次に行い、音声
    波形データを生成する素片データ合成部と、 前記音声波形データに基づいて合成音声を出力する音声
    合成出力部とを具えることを特徴とする音声合成装置。
  10. 【請求項10】 各音素のスペクトル包絡が記録される
    スペクトル包絡記憶部と、 所定の話者の識別に対して有効な各母音の特徴周波数値
    が記録される話者特徴周波数記憶部と、 前記スペクトル包絡記憶部に記録されているスペクトル
    包絡を読み出して、読み出した母音のスペクトル包絡に
    対応する特徴周波数値を前記話者特徴周波数記憶部から
    読み出し、前記読み出したスペクトル包絡の前記特徴周
    波数値に対応する強度を所定量だけ増加させるフィルタ
    部と、 前記フィルタ部から出力されるスペクトル包絡に逆フー
    リエ変換を施して音声素片データを作成する逆フーリエ
    変換部と、 前記逆フーリエ変換部から出力される音声素片データを
    記録するための音声素片データ記憶部と、 テキストデータを入力するためのデータ入力部と、 単語辞書を参照して、前記テキストデータに対応する音
    韻韻律情報を出力する文章解析部と、 前記音韻韻律情報に基づいて、前記音声素片データ記憶
    部に記録されている音声素片データの格納場所、音韻の
    継続時間、ピッチおよび発声強度の情報を含む合成パラ
    メータを作成する合成パラメータ生成部と、 前記合成パラメータに基づいて、前記音声素片データの
    前記音声素片データ記憶部からの読み出し、およびこれ
    ら読み出した音声素片データの合成を順次に行い、音声
    波形データを生成する素片データ合成部と、 前記音声波形データに基づいて合成音声を出力する音声
    合成出力部とを具えることを特徴とする音声合成装置。
  11. 【請求項11】 各音素のスペクトル包絡が記録される
    スペクトル包絡記憶部と、 所定の話者の識別に対して有効な各母音の特徴周波数値
    が記録される話者特徴周波数記憶部と、 前記スペクトル包絡記憶部に記録されているスペクトル
    包絡と前記話者特徴周波数記憶部に記録されている全て
    の特徴周波数値とを読み出して、前記読み出したスペク
    トル包絡の前記全ての特徴周波数値に対応する強度を所
    定量だけ増加させるフィルタ部と、 前記フィルタ部から出力されるスペクトル包絡に逆フー
    リエ変換を施して音声素片データを作成する逆フーリエ
    変換部と、 前記逆フーリエ変換部から出力される音声素片データを
    記録するための音声素片データ記憶部と、 テキストデータを入力するためのデータ入力部と、 単語辞書を参照して、前記テキストデータに対応する音
    韻韻律情報を出力する文章解析部と、 前記音韻韻律情報に基づいて、前記音声素片データ記憶
    部に記録されている音声素片データの格納場所、音韻の
    継続時間、ピッチおよび発声強度の情報を含む合成パラ
    メータを作成する合成パラメータ生成部と、 前記合成パラメータに基づいて、前記音声素片データの
    前記音声素片データ記憶部からの読み出し、およびこれ
    ら読み出した音声素片データの合成を順次に行い、音声
    波形データを生成する素片データ合成部と、 前記音声波形データに基づいて合成音声を出力する音声
    合成出力部とを具えることを特徴とする音声合成装置。
JP9269650A 1997-10-02 1997-10-02 音声素片データベースの作成方法、音声合成方法、音声素片データベース、音声素片データベース作成装置および音声合成装置 Withdrawn JPH11109992A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9269650A JPH11109992A (ja) 1997-10-02 1997-10-02 音声素片データベースの作成方法、音声合成方法、音声素片データベース、音声素片データベース作成装置および音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9269650A JPH11109992A (ja) 1997-10-02 1997-10-02 音声素片データベースの作成方法、音声合成方法、音声素片データベース、音声素片データベース作成装置および音声合成装置

Publications (1)

Publication Number Publication Date
JPH11109992A true JPH11109992A (ja) 1999-04-23

Family

ID=17475313

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9269650A Withdrawn JPH11109992A (ja) 1997-10-02 1997-10-02 音声素片データベースの作成方法、音声合成方法、音声素片データベース、音声素片データベース作成装置および音声合成装置

Country Status (1)

Country Link
JP (1) JPH11109992A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002358092A (ja) * 2001-06-01 2002-12-13 Sony Corp 音声合成システム
KR100451539B1 (ko) * 2002-09-23 2004-10-06 에스엘투 주식회사 유닛 접합식 tts 음성 합성 방법
US7546241B2 (en) 2002-06-05 2009-06-09 Canon Kabushiki Kaisha Speech synthesis method and apparatus, and dictionary generation method and apparatus
JP2014232245A (ja) * 2013-05-30 2014-12-11 日本電信電話株式会社 音声明瞭化装置、方法及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002358092A (ja) * 2001-06-01 2002-12-13 Sony Corp 音声合成システム
US7546241B2 (en) 2002-06-05 2009-06-09 Canon Kabushiki Kaisha Speech synthesis method and apparatus, and dictionary generation method and apparatus
KR100451539B1 (ko) * 2002-09-23 2004-10-06 에스엘투 주식회사 유닛 접합식 tts 음성 합성 방법
JP2014232245A (ja) * 2013-05-30 2014-12-11 日本電信電話株式会社 音声明瞭化装置、方法及びプログラム

Similar Documents

Publication Publication Date Title
Isewon et al. Design and implementation of text to speech conversion for visually impaired people
JP3078205B2 (ja) 波形の連結及び部分的重複化による音声合成方法
US7739113B2 (en) Voice synthesizer, voice synthesizing method, and computer program
US20190130894A1 (en) Text-based insertion and replacement in audio narration
US20040073427A1 (en) Speech synthesis apparatus and method
US8775185B2 (en) Speech samples library for text-to-speech and methods and apparatus for generating and using same
MXPA06003431A (es) Metodo para sintetizar voz.
JP5148026B1 (ja) 音声合成装置および音声合成方法
US6212501B1 (en) Speech synthesis apparatus and method
JP3673471B2 (ja) テキスト音声合成装置およびプログラム記録媒体
JP2002258885A (ja) テキスト音声合成装置およびプログラム記録媒体
US20110046957A1 (en) System and method for speech synthesis using frequency splicing
JP6330069B2 (ja) 統計的パラメトリック音声合成のためのマルチストリームスペクトル表現
JP2001034280A (ja) 電子メール受信装置および電子メールシステム
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JPH11109992A (ja) 音声素片データベースの作成方法、音声合成方法、音声素片データベース、音声素片データベース作成装置および音声合成装置
JPH0887297A (ja) 音声合成システム
JPH08335096A (ja) テキスト音声合成装置
JP6578544B1 (ja) 音声処理装置、および音声処理方法
JP2008058379A (ja) 音声合成システム及びフィルタ装置
JP3626398B2 (ja) テキスト音声合成装置、テキスト音声合成方法及びその方法を記録した記録媒体
JP2001034284A (ja) 音声合成方法及び装置、並びに文音声変換プログラムを記録した記録媒体
JPH09179576A (ja) 音声合成方法
JP3081300B2 (ja) 残差駆動型音声合成装置
JP2013195928A (ja) 音声素片切出装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20041207