JP2001154683A - 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体 - Google Patents

音声合成装置とその方法及び音声合成プログラムを記録した記録媒体

Info

Publication number
JP2001154683A
JP2001154683A JP33901099A JP33901099A JP2001154683A JP 2001154683 A JP2001154683 A JP 2001154683A JP 33901099 A JP33901099 A JP 33901099A JP 33901099 A JP33901099 A JP 33901099A JP 2001154683 A JP2001154683 A JP 2001154683A
Authority
JP
Japan
Prior art keywords
speech
information
feature vector
codebook
phoneme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP33901099A
Other languages
English (en)
Other versions
JP3554513B2 (ja
Inventor
Tomokazu Morio
智一 森尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP33901099A priority Critical patent/JP3554513B2/ja
Publication of JP2001154683A publication Critical patent/JP2001154683A/ja
Application granted granted Critical
Publication of JP3554513B2 publication Critical patent/JP3554513B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 従来のテキスト情報からの音声合成装置にお
いて、高音質な音声を出力するためには、音声素片デー
タベースに多くの情報を保持する必要があった。本発明
は、音声特徴ベクトルを効率的に圧縮表現し、音声素片
データベースの容量を大幅に削減することを目的とす
る。 【解決手段】 上記課題を解決するために、文字列を入
力し、読み情報に変換するテキスト解析器と、前記テキ
スト解析器から読み情報を入力し、韻律情報を生成する
韻律生成器と、前記読み情報を入力し、音声素片データ
ベースの中から音声素片情報を選択出力する音声素片選
択器と、前記韻律情報と前記音声素片情報を入力し、合
成音声を作成する音声合成器を備える、音声合成装置
が、前記音声素片データベースは読み情報から決定され
る選択基準情報と、基準ごとの音声特徴ベクトルのイン
デックスを有し、前記音声合成器は、前記選択基準情報
から使用する符号帳を選択する基準別ベクトル符号帳
と、前記インデックスから音声特徴ベクトルを選択する
音声特徴ベクトル選択器を備えることを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、テキストから音声
を生成する音声合成装置に関する。
【0002】
【従来の技術】図5は一般的な音声合成装置の構成例を
示している。図5に示す音声合成装置は、入力端子(1
01)、テキスト解析器(102)、韻律生成器(10
3)、音声素片選択器(104)、音声素片データベー
ス(105)、音声合成器(506)、音声出力端子
(107)で構成される。
【0003】従来の音声合成器(506)は、線形予測
手法に基づくパラメータ合成方式を用いた音声合成器の
例である。音声合成器は、パルス発生器(201)、雑
音発生器(202)、音源切り替え器(203)、増幅
器(204)、合成フィルタ(205)、出力端子(2
06)、逆量子化器(501)、パラメータ量子化テー
ブル(502)で構成される。
【0004】以下、図5を用い、従来の音声合成装置の
動作を説明する。テキスト解析器(102)は、単語や
文章などのテキスト情報(例:「左」)を入力し、読み
の情報を(例:hidari)出力する。
【0005】韻律生成器(103)は、読み情報(例:
hidari)を入力し、韻律情報(声の高さ、大き
さ、継続時間長)を生成する。声の高さは母音のピッチ
周波数で決定され,例の場合で説明すると、時間順に
i,a,iの母音におけるピッチ周波数を決定する。声
の大きさや発声速度は、各音素毎(例:h,i,d,
a,r,i)に振幅情報、継続時間長が決定される。
【0006】音声素片選択器(104)は、音声素片デ
ータベース(105)を参照し、読み情報(例:hid
ari)に基づき音声素片を選択する。音声合成単位と
しては、子音+母音(CV:Consonant,Vo
wel)の音韻単位(例:ka,gu)や、高音質化を
目的に音韻過渡部の特徴量を保持した母音+子音+母音
(VCV)単位(例:aki,ito)などが広く使わ
れている。
【0007】例えば、特開昭60−208799号公報
には、パラメータ合成方式を用いた合成システムで、音
韻を単位としてデータを保持する方法が記述されてい
る。このシステムでは、音声の声道情報(線形予測係
数)を、音韻の種類別に1セット(例えば、hiでは子
音部hと母音部iの線形予測係数)のデータを音韻メモ
リーに蓄えている。
【0008】以降の説明では、VCV単位を用いる手法
を説明する。音声素片データベース(105)は、自然
音声データからVCVの単位で適切に切り出した音声デ
ータを分析し、合成に必要な情報を保持する。日本語の
場合VCV素片数は1000個程度あり、各素片の時間
長は正規化して保持しても異なっていても良い。
【0009】音声信号は、予め定められた長さ(フレー
ム)毎に分析される。VCV別に保持する情報として
は、VCVの音素境界位置情報(seg1,seg2,
seg3=VCVのフレーム数)、及びフレーム毎の有
声/無声の時系列情報(uv[1],uv
[2],...,uv[seg3])、フレーム毎の振
幅時系列情報(pow[1],pow[2],...,
pow[seg3])、そしてフレーム毎の線形予測係
数ベクトルの時系列情報(a[1],a
[2],...,a[seg3])を保持している。こ
こで線形予測係数ベクトル(a[k],k=1...s
eg3)は、10次程度の線形予測係数や線スペクトル
対パラメータなどが用いられる。
【0010】上記例(h,i,d,a,r,i)で音声
素片選択器(104)の動作を説明すると、選択される
VCV素片は、*hi,ida,ari,i**が選択
され音声素片情報として出力する。ここで記号*は無音
を表す。VCVを単位とする合成方式では、このように
母音で隣接素片を接続する。
【0011】最後に、音声合成器(506)は、韻律情
報と音声素片情報を入力し、音声素片のデータを韻律情
報に従って声の高さや大きさ、発声速度を制御しながら
合成音を作成し出力する。
【0012】音源切り替え器(203)は、音声素片情
報の有声/無声情報に基づき、有声の場合はパルス音源
を、無声の場合は雑音音源を選択するよう音源を切り替
える。有声音の場合、パスル発生器(201)は、韻律
情報の声の高さ(ピッチ周波数)を基に、適切な時間間
隔でパルス列を生成する。無声音の場合、雑音発生器
(202)で白色雑音を生成する。増幅器(204)
は、韻律情報の声の大きさ(振幅情報)を基に、音源信
号の振幅を適切に増幅する。パラメータ合成方式を用い
る音声合成装置では一般に、線形予測係数を適切に量子
化してから、音声素片データベース(105)に保存し
ている。音声合成器においては、この音声素片情報中の
線形予測係数パラメータを、パラメータ量子化テーブル
(502)を用いて、逆量子化器(501)で適切にデ
コードした後、合成フィルタ(205)に送る。合成フ
ィルタ(205)は、デコードした線形予測係数をフィ
ルタ係数に設定し、増幅された音源信号をフィルタリン
グ処理し音声波形として出力する。
【0013】上記説明では、パラメータ合成方式の音声
合成器を説明したが、音声合成器として波形編集方式
(例えば、特開昭60−21098号公報)を用いても
良い。以下に波形編集方式の音声合成器を説明する。
【0014】図6を用いて、波形編集方式を用いた音声
合成器の動作を説明する。この場合、音声素片データベ
ース(105)には、線形予測係数ベクトルの代わり
に、音声波形データを保持する。波形の保持方法として
は、有声区間のデータに対してピッチ周波数や時間長の
変更制御が行いやすいように、波形に零位相化や最小位
相化処理を施す手法が広く使われている。
【0015】読み情報から決定された音声素片情報に基
づき、合成に必要な音声波形データを音声素片データベ
ース(105)から取り出す。増幅器(601)は、韻
律情報の声の大きさ(振幅情報)を基に、音声波形の振
幅を適切に増幅する。波形重畳器(602)は、音声素
片が有声の場合、韻律情報の声の高さ(ピッチ周波数)
の情報を基に、増幅された音声波形を適切な時間間隔で
配置し窓掛け加算し出力する。音声素片が無声の場合
は、増幅された音声波形を出力端子(603)からその
まま出力する。
【0016】
【発明が解決しようとする課題】特開昭60−2087
99号公報で例示したようなシステムでは、音韻に応じ
て1セットの線形予測係数しか保持しておらず、自然音
声信号に含まれるスペクトルの時間的変化が表現でき
ず、音質が不十分である問題があった。この問題を解決
するために分析フレーム毎にスペクトル情報を保持する
手法が一般的である。
【0017】そこで従来の音声合成装置は、高音質の合
成を得る目的に、音声素片データベースに多くの情報を
保持している。例えば合成単位にVCV素片を用いると
約1000種類の素片数が必要で、一つの素片の時間長
は、例えば平均200ms程度の情報量を保持してい
る。1フレーム5msとすると40フレームになる。
【0018】ここで、波形編集方式の合成方式の場合、
波形データを音声素片データベースに保持するゆえ、デ
ータ容量が数MByteにもなるという問題があった。
パラメータ合成方式を用いた場合には、音声素片データ
ベースに線形予測係数ベクトルの時系列を保持する。例
えば、1フレームあたりの線形予測係数ベクトルのデー
タを40ビットで量子化し表現した場合、線形予測係数
の情報量だけでもデータ容量が200KByte程度必
要になる。
【0019】音声圧縮の分野では、線形予測係数ベクト
ルを、移動平均予測とベクトル量子化の手法を用いて情
報量を削減する手法がある(日本音響学会講演論文集、
平成4年10月 2−5−12)。しかしながらこの場合
でも、1フレーム当たりの線形予測係数ベクトルの情報
量は20ビット程度必要で、まだ情報量が多いという問
題があった。
【0020】
【課題を解決するための手段】本発明の音声合成装置
は、文字列を入力し、読み情報に変換するテキスト解析
器と、読み情報を入力し、声の高さや大きさや発声速度
の韻律情報を生成する韻律生成器と、読み情報を入力
し、音声素片データベースの中から音声素片情報を選択
出力する音声素片選択器と、韻律情報と音声素片情報を
入力し、合成音声を作成する音声合成器を備える、音声
合成装置において、上記音声素片データベースは読み情
報から決定される選択基準情報と、基準ごとの音声特徴
ベクトルのインデックスを有し、上記音声合成器は、選
択基準情報から使用する符号帳を選択する基準別ベクト
ル符号帳と、上記インデックスから音声特徴ベクトルを
選択する音声特徴ベクトル選択器を備えることを特徴と
する。
【0021】また、前記基準別ベクトル符号帳は、選択
基準別に1つあるいは複数の音声特徴ベクトルを保有し
ていることを特徴とする。
【0022】さらに、前記選択信号は音素情報であり、
前記基準別符号帳は音素毎符号帳であることを特徴とす
る。
【0023】あるいは、前記選択信号は、前記選択基準
信号は読み情報から決定された音素情報と音素カテゴリ
ー表とに基づいてカテゴリー選択器で選択されたカテゴ
リー情報であり、前記基準毎符号帳は、音素カテゴリー
別符号帳であることを特徴とする。
【0024】また、前記音声合成装置において、音声特
徴ベクトルとして、線形予測係数を用いることを特徴と
する。
【0025】あるいは、前記音声合成装置において、音
声特徴ベクトルとして、音声波形を用いることを特徴と
する。
【0026】また、文字列を入力し、読み情報に変換す
るテキスト解析手段と、前記テキスト解析手段から読み
情報を入力し、韻律情報を生成する韻律生成手段と、前
記読み情報を入力し、音声素片データベースの中から音
声素片情報を選択出力する音声素片選択手段と、前記韻
律情報と前記音声素片情報を入力し、合成音声を作成す
る音声合成手段を備える、音声合成方法は、前記音声素
片データベースは読み情報から決定される選択基準情報
と、基準ごとの音声特徴ベクトルのインデックスを有
し、前記音声合成手段は、前記選択基準情報から使用す
る符号帳を選択する基準別ベクトル符号帳と、前記イン
デックスから音声特徴ベクトルを選択する音声特徴ベク
トル選択手段を備えることを特徴とする。
【0027】また、文字列を入力し、読み情報に変換す
るテキスト解析機能と、前記テキスト解析機能から読み
情報を入力し、韻律情報を生成する韻律生成機能と、前
記読み情報を入力し、音声素片データベースの中から音
声素片情報を選択出力する音声素片選択機能と、前記韻
律情報と前記音声素片情報を入力し、合成音声を作成す
る音声合成機能を備える、音声合成機能を行う記録媒体
は、前記音声素片データベースは読み情報から決定され
る選択基準情報と、基準ごとの音声特徴ベクトルのイン
デックスを有し、前記音声合成機能は、前記選択基準情
報から使用する符号帳を選択する基準別ベクトル符号帳
と、前記インデックスから音声特徴ベクトルを選択する
音声特徴ベクトル選択機能を備えることを特徴とする。
【0028】
【発明の実施の形態】図1に、本発明の音声合成装置の
全体概略構成を示す。概略構成は従来例と同じである。
本発明が従来技術とは異なるのは、音声合成器(10
6)の内部構成と、音声素片データベース(105)に
音声特徴ベクトルを圧縮して保持する点が異なる。
【0029】図2は、音声合成器106の部分を抽出し
示したものである。図9は、図1と図2を合わせた本発
明のテキスト音声合成装置全体の構成例を示す。以下、
図1及び図2を用いて、本発明の音声合成器の一実施例
を示す。従来技術の説明で示した図5と同じ構成要素に
は同じ番号を付与している。従来技術と異なる構成要素
は、音声素片選択器(104)の出力情報から決定され
る選択基準情報を入力し、複数の中から使用するベクト
ル符号帳を選択する基準別ベクトル符号帳(208)
と、音声素片選択器(104)の出力情報から決定され
るインデックスと基準別ベクトル符号帳(208)を入
力し、音声特徴ベクトルを選択する音声特徴ベクトル選
択器(207)の二つである。
【0030】選択基準としては、例えば音素情報や、音
素カテゴリー情報、或いは音素をその音響的特徴(有
声、無声、摩擦性など)で分類した基準が用いられる。
また音声特徴ベクトルとしては、例えば線形予測係数
や、音声波形、或いはホルマント周波数と帯域幅など、
音声の特徴を表現するデータが用いられる。
【0031】説明の便宜上、選択基準として音素情報を
用い、音声特徴ベクトルとして線形予測係数を用いる例
を最初に説明する。図3に、選択基準として音素情報を
用いた音声合成器の実施例を示す。従来例と本願との違
いは、ベクトル符号帳(301)の構造にある。音素別
ベクトル符号帳(301)は、音素情報を選択基準と
し、音素別に音声特徴ベクトルの符号帳を保持してい
る。例えば、a,i,uのような母音や、p、t、sの
ような子音などの音素別にベクトル符号帳を備えてい
る。ここで音声特徴ベクトルは線形予測係数を用い、具
体的には線形予測係数から算出される線スペクトル対や
ケプストラム係数を用いる。
【0032】ここで、音素別に線形予測係数のベクトル
符号帳を設けると、同一音素の中ではスペクトル形状が
似たものが集められる。音素別に64種類の符号帳を作
成した場合の例を図7に示す。上段左側からa,i,u
の音素、下段左側からs,m,gの音素に対して、64
種類の符号帳のうち最初の5つの音声特徴ベクトルをパ
ワースペクトル表現して示したものである。子音sのパ
ワースペクトルは、非常にバリエーションが大きいが、
他の音素ではパワースペクトルが似た形状のものになっ
ていることが分かる。音素別に特徴ベクトルをベクトル
量子化することで、効率的に特徴ベクトルを表現できる
ことが分かる。
【0033】音声合成装置全体構成は図1の構成から成
っているが、音声素片データベース(105)の内容が
従来とは異なる。従来技術で説明したように、パラメー
タ合成方式を用いる従来技術では線形予測係数ベクトル
の時系列情報を保持していたのに対して、本発明の手法
では、音声素片に対応した音素別ベクトル符号帳のイン
デックスの時系列を保持する。この様子を模式的に表現
したものを図8に示す。この例では音声素片データベー
ス(105)の中から、VCV素片として例として「i
to」が選択された時の状況を示している。ここでid
xは、スペクトル情報をベクトル量子化した符号帳中の
符号語を指し示すindexを本実施例では示してい
る。フレーム番号1からseg1−1の間は、音素別ベ
クトル符号帳(301)の音素iの符号帳が選択され、
idx[1]からidx[seg1−1]のデータによ
って、iのベクトル符号帳の該当するインデックスの音
声特徴ベクトルが音声特徴ベクトル選択器(207)か
ら出力される。同様にフレーム番号seg1からseg
2−1の間は、音素別ベクトル符号帳(301)の音素
tの符号帳が、フレーム番号seg2からseg3の間
は、音素別ベクトル符号帳(301)の音素oの符号帳
が選択され、同様な処理が実行される。
【0034】一般の音声圧縮とは異なりテキスト音声合
成では、発声文字列の情報があるので、音声の特徴ベク
トルの情報を圧縮記録する際、このように音素情報を得
た上で、音素別にベクトル量子化することで、スペクト
ル情報に偏りがあることが利用でき、効率良く情報圧縮
できる。
【0035】ここで従来法とデータ量を比較する。高音
質の合成音を得るためには、例えば10次の線形予測係
数を量子化表現するには、スカラー量子化では40ビッ
ト程度、ベクトル量子化でも20ビット以上必要であっ
たが、本実施例のように音素別に線形予測係数をベクト
ル量子化すると、先に例示したようにスペクトル形状と
して非常に似た形状のデータになるので、比較的少ない
情報で表現できる。音質の簡易主観評価実験によると、
音素別に6ビット(64種類のスペクトルパターン)程
度の情報量でも良好な音質が得られ、大幅な情報圧縮が
実現できる。ここで音素別のベクトル量子化の符号帳サ
イズは音素別に異なっていても良い。音声特徴ベクトル
が抽出され、合成フィルタ(205)に設定された以降
の動作は、従来例と同じである。
【0036】次に、音素カテゴリー毎ベクトル符号帳を
用いた場合の実施例について説明する。上述した音素情
報に基づく音声合成装置では、音素別のベクトル符号帳
を保持する必要があった。先に例示したように、例えば
音素別に64パターンの音声特徴ベクトルを保持し、音
素の数を32とし、1パターン当たり40ビットで表現
した場合、音素別ベクトル符号帳のデータ量は約10K
Byte必要であった。
【0037】音響的に似た音素は特徴ベクトルも似てお
り、音素別に持つより音響的に似た音素カテゴリー別に
符号帳を持つことで、ベクトル符号帳の容量を削減でき
る。
【0038】これを実現するための構成を図4に示す。
図4の構成では、各音素がどのカテゴリーに属するかを
示した音素カテゴリー表(402)を備えており、入力
音素はこのカテゴリー表を参照して、カテゴリー選択器
(403)でカテゴリー選択される。音声特徴ベクトル
のベクトル符号帳は、音素カテゴリー別ベクトル符号帳
(401)に音素カテゴリー別に保持されており、選択
されたカテゴリー情報に基づいて、どの符号帳を使用す
るか選択される。例えば入力音素がdであった場合、音
素dはカテゴリーは2番に属しているので、音素カテゴ
リー別ベクトル符号帳は第2種類符号帳を使用する。
【0039】音声特徴量の類似している音素カテゴリー
を適切に構成することで、音声特徴ベクトルを効率良く
保持することができ、音質劣化を小さく抑えて、音素別
のベクトル符号帳よりも符号帳を保持するためのメモリ
ー量を削減することができる。以降の動作は、図3の実
施例と同じであるので省略する。
【0040】これまでの説明では、音声特徴ベクトルは
線形予測係数を用いた、パラメータ合成方式の音声合成
装置を説明したが、波形重畳方式に基づく音声合成器を
用いることもできる。この場合の音声特徴ベクトルは音
声波形を用いる。特に零位相化処理や最小位相化処理を
施し、振幅を正規化することによって、波形歪み尺度に
基づいて波形のベクトル符号帳を構成することができ
る。なお、上記全ての装置はコンピュータなどの処理装
置を用いて実現することができる。
【0041】
【発明の効果】本発明で示した選択基準(例えば音素)
別のベクトル符号帳を用いることで、音声特徴ベクトル
を効率的に圧縮表現することができ、音声素片データベ
ースの容量を大幅に削減することができる。
【図面の簡単な説明】
【図1】テキスト音声合成装置全体の構成例を説明する
図である。
【図2】本発明の音声合成器の構成例を説明する図であ
る。
【図3】本発明の音声合成器の構成例を説明する図であ
る。
【図4】本発明の音声合成器の構成例を説明する図であ
る。
【図5】従来技術音声合成器の構成例を説明する図であ
る。
【図6】従来技術の波形重畳方式の合成器の動作を説明
する図である。
【図7】音声素片データベース内のデータ例を説明する
図である。
【図8】音素別の音声特徴ベクトル符号帳の例を説明す
る図である。
【図9】本発明のテキスト音声合成装置全体の構成例を
説明する図である。
【符号の説明】
101 入力端子 102 テキスト解析器 103 韻律生成器 104 音声素片選択器 105 音声素片データベース 106 音声合成器 107 出力端子 201 パルス発生器 202 雑音発生器 203 音源切り替え器 204 増幅器 205 合成フィルタ 206 出力端子 207 音声特徴ベクトル選択器 208 基準別ベクトル符号帳 301 音素別ベクトル符号帳 401 音素カテゴリー別ベクトル符号帳 402 音素カテゴリー表 403 カテゴリー選択器 501 逆量子化器 502 パラメータ量子化テーブル 506 音声合成器 601 増幅器 602 波形重畳器 603 出力端子

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 文字列を入力し、読み情報に変換するテ
    キスト解析器と、 前記テキスト解析器から読み情報を入力し、韻律情報を
    生成する韻律生成器と、 前記読み情報を入力し、音声素片データベースの中から
    音声素片情報を選択出力する音声素片選択器と、 前記韻律情報と前記音声素片情報を入力し、合成音声を
    作成する音声合成器を備える、音声合成装置であって、 前記音声素片データベースは読み情報から決定される選
    択基準情報と、基準ごとの音声特徴ベクトルのインデッ
    クスを有し、 前記音声合成器は、前記選択基準情報から使用する符号
    帳を選択する基準別ベクトル符号帳と、前記インデック
    スから音声特徴ベクトルを選択する音声特徴ベクトル選
    択器を備えることを特徴とする音声合成装置。
  2. 【請求項2】 前記基準別ベクトル符号帳は、選択基準
    別に1つあるいは複数の音声特徴ベクトルを保有してい
    ることを特徴とする請求項1に記載の音声合成装置。
  3. 【請求項3】 前記選択信号は音素情報であり、前記基
    準別符号帳は音素毎符号帳であることを特徴とする請求
    項1又は2に記載の音声合成装置。
  4. 【請求項4】 前記選択信号は、前記選択基準信号は読
    み情報から決定された音素情報と音素カテゴリー表とに
    基づいてカテゴリー選択器で選択されたカテゴリー情報
    であり、前記基準毎符号帳は、音素カテゴリー別符号帳
    であることを特徴とする請求項1又は2に記載の音声合
    成装置。
  5. 【請求項5】 前記音声合成装置において、音声特徴ベ
    クトルとして、線形予測係数を用いることを特徴とする
    請求項1乃至4のいずれかに記載の音声合成装置。
  6. 【請求項6】 前記音声合成装置において、音声特徴ベ
    クトルとして、音声波形を用いることを特徴とする請求
    項1乃至4のいずれかに記載の音声合成装置。
  7. 【請求項7】 文字列を入力し、読み情報に変換するテ
    キスト解析手段と、 前記テキスト解析手段から読み情報を入力し、韻律情報
    を生成する韻律生成手段と、 前記読み情報を入力し、音声素片データベースの中から
    音声素片情報を選択出力する音声素片選択手段と、 前記韻律情報と前記音声素片情報を入力し、合成音声を
    作成する音声合成手段を備える、音声合成方法であっ
    て、 前記音声素片データベースは読み情報から決定される選
    択基準情報と、基準ごとの音声特徴ベクトルのインデッ
    クスを有し、 前記音声合成手段は、前記選択基準情報から使用する符
    号帳を選択する基準別ベクトル符号帳と、前記インデッ
    クスから音声特徴ベクトルを選択する音声特徴ベクトル
    選択手段を備えることを特徴とする音声合成方法。
  8. 【請求項8】 文字列を入力し、読み情報に変換するテ
    キスト解析機能と、 前記テキスト解析機能から読み情報を入力し、韻律情報
    を生成する韻律生成機能と、 前記読み情報を入力し、音声素片データベースの中から
    音声素片情報を選択出力する音声素片選択機能と、 前記韻律情報と前記音声素片情報を入力し、合成音声を
    作成する音声合成機能を備える、音声合成機能を行う記
    録媒体であって、 前記音声素片データベースは読み情報から決定される選
    択基準情報と、基準ごとの音声特徴ベクトルのインデッ
    クスを有し、 前記音声合成機能は、前記選択基準情報から使用する符
    号帳を選択する基準別ベクトル符号帳と、前記インデッ
    クスから音声特徴ベクトルを選択する音声特徴ベクトル
    選択機能を備えることを特徴とする音声合成プログラム
    を記録した記録媒体。
JP33901099A 1999-11-30 1999-11-30 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体 Expired - Fee Related JP3554513B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33901099A JP3554513B2 (ja) 1999-11-30 1999-11-30 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33901099A JP3554513B2 (ja) 1999-11-30 1999-11-30 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2001154683A true JP2001154683A (ja) 2001-06-08
JP3554513B2 JP3554513B2 (ja) 2004-08-18

Family

ID=18323427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33901099A Expired - Fee Related JP3554513B2 (ja) 1999-11-30 1999-11-30 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3554513B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089187B2 (en) 2001-09-27 2006-08-08 Nec Corporation Voice synthesizing system, segment generation apparatus for generating segments for voice synthesis, voice synthesizing method and storage medium storing program therefor
CN110534089A (zh) * 2019-07-10 2019-12-03 西安交通大学 一种基于音素和韵律结构的中文语音合成方法
CN111724765A (zh) * 2020-06-30 2020-09-29 上海优扬新媒信息技术有限公司 一种文本转语音的方法、装置及计算机设备
CN112951204A (zh) * 2021-03-29 2021-06-11 北京大米科技有限公司 语音合成方法和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089187B2 (en) 2001-09-27 2006-08-08 Nec Corporation Voice synthesizing system, segment generation apparatus for generating segments for voice synthesis, voice synthesizing method and storage medium storing program therefor
CN110534089A (zh) * 2019-07-10 2019-12-03 西安交通大学 一种基于音素和韵律结构的中文语音合成方法
CN110534089B (zh) * 2019-07-10 2022-04-22 西安交通大学 一种基于音素和韵律结构的中文语音合成方法
CN111724765A (zh) * 2020-06-30 2020-09-29 上海优扬新媒信息技术有限公司 一种文本转语音的方法、装置及计算机设备
CN112951204A (zh) * 2021-03-29 2021-06-11 北京大米科技有限公司 语音合成方法和装置

Also Published As

Publication number Publication date
JP3554513B2 (ja) 2004-08-18

Similar Documents

Publication Publication Date Title
US5153913A (en) Generating speech from digitally stored coarticulated speech segments
KR940002854B1 (ko) 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치
US20040073428A1 (en) Apparatus, methods, and programming for speech synthesis via bit manipulations of compressed database
JPS60102697A (ja) 記述メッセージコードと音声メッセージコードを結合する音声符号化方法
GB2392592A (en) Speech synthesis
US20070011009A1 (en) Supporting a concatenative text-to-speech synthesis
WO2002043052A1 (en) Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
JPH0573100A (ja) 音声合成方法及びその装置
Rabiner et al. Computer synthesis of speech by concatenation of formant-coded words
JP3554513B2 (ja) 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JP5376643B2 (ja) 音声合成装置、方法およびプログラム
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP3081300B2 (ja) 残差駆動型音声合成装置
WO2023182291A1 (ja) 音声合成装置、音声合成方法及びプログラム
Dong-jian Two stage concatenation speech synthesis for embedded devices
JP2003066983A (ja) 音声合成装置および音声合成方法、並びに、プログラム記録媒体
JPS5914752B2 (ja) 音声合成方式
JPS6187199A (ja) 音声分析合成装置
JPH09258796A (ja) 音声合成方法
JPH0836397A (ja) 音声合成装置
JPS61259300A (ja) 音声合成方式
JPH10105200A (ja) 音声符号化/復号化方法
JPS61118798A (ja) 音声合成装置
JPH05297899A (ja) 音声分析合成方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040507

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080514

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110514

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120514

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120514

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140514

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees