JP2003066983A - 音声合成装置および音声合成方法、並びに、プログラム記録媒体 - Google Patents

音声合成装置および音声合成方法、並びに、プログラム記録媒体

Info

Publication number
JP2003066983A
JP2003066983A JP2001261323A JP2001261323A JP2003066983A JP 2003066983 A JP2003066983 A JP 2003066983A JP 2001261323 A JP2001261323 A JP 2001261323A JP 2001261323 A JP2001261323 A JP 2001261323A JP 2003066983 A JP2003066983 A JP 2003066983A
Authority
JP
Japan
Prior art keywords
speech
voice
codebook
information
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001261323A
Other languages
English (en)
Other versions
JP2003066983A5 (ja
Inventor
Tomokazu Morio
智一 森尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2001261323A priority Critical patent/JP2003066983A/ja
Publication of JP2003066983A publication Critical patent/JP2003066983A/ja
Publication of JP2003066983A5 publication Critical patent/JP2003066983A5/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声素片データの容量増加を抑えて複数声質
の合成音声を得る。 【解決手段】 音声素片データベース37は、音素別ベ
クトル符号帳40と音素別ベクトル符号帳41とに共通
に設けられている。切換器39は、外部からの声質指定
に応じて両音素別ベクトル符号帳40,41の何れかに
切り換える。音声素片選択器34は、音声素片データベ
ース37を参照すると共に音声特徴ベクトル選択器38
を制御して、上記切り換えられた音素別ベクトル符号帳
において音声素片VCVの音素列に基づいて符号帳を順
次選択し、音声素片データベース37から得られたイン
デックスに基づいて該当する音声特徴ベクトルを読み出
して、音声合成器35に送出する。こうして、音素別ベ
クトル符号帳のみを複数所有することによって、複数声
質に拡張する際の音声素片データ量の増加を小さく抑え
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、テキストから音
声を生成する音声合成装置および音声合成方法、並び
に、音声合成処理プログラムを記録したプログラム記録
媒体に関する。
【0002】
【従来の技術】テキストから音声を生成する音声合成装
置の一般的な構成を図7に示す。この音声合成装置は、
入力端子1,テキスト解析器2,韻律生成器3,音声素片
選択器4,音声素片データベース5,音声合成器6および
音声出力端子7で概略構成されている。
【0003】上記テキスト解析器2は、単語や文章等の
テキスト情報(例えば「左」)が入力されると、読み情報
(例えば「hidari」)を韻律生成器3および音声素片
選択器4に出力する。韻律生成器3は、上記読み情報を
入力して、韻律情報(声の高さ,声の大きさ,継続時間長)
を生成して音声合成器6に出力する。ここで、声の高さ
は母音(V:Vowel)のピッチ(基本周期)で決定され、例
えば「hidari」の場合には、時間順に母音「i」,
「a」,「i」のピッチを決定することになる。また、声の
大きさや発声速度は、各音素(例えば「h,i,d,a,r,
i」)毎に振幅情報および継続時間長で決定される。
【0004】上記音声素片選択器4は、上記音声素片デ
ータベース5を参照し、上記読み情報に基づいて音声合
成単位である音声素片を選択する。上記音声素片として
は、子音(C:Consonant)+母音(=CV)の音韻単位(例
えば「ka,gu」)や、高音質化を目的として音韻過渡部
の特徴量を保持した母音+子音+母音(=VCV)単位
(例えば「aki,ito」)等が広く使用されている。
【0005】最後に、上記音声合成器6は、上記韻律生
成器3で生成された韻律情報と音声素片選択器4で選択
された音声素片の情報とに基づいて音声信号を生成し、
音声出力端子7から出力する。尚、図7に示す音声合成
装置は、1種類の音声素片データベース5のみを有して
いるため、音質は基本的に1種類である。
【0006】図8は、複数の音声素片データベースを備
える音声合成装置のブロック図である。入力端子11,
テキスト解析器12,韻律生成器13,音声素片選択器1
4,音声合成器18および音声出力端子19は、図7に
おける入力端子1,テキスト解析器2,韻律生成器3,音
声素片選択器4,音声合成器6および音声出力端子7と
同じである。
【0007】本音声合成装置は、2つの音声素片データ
ベース15および音声素片データベース16を有してお
り、例えば音声素片データベース15には男性の音声
(男声)の音声素片が格納され、音声素片データベース1
6には女性の音声(女声)の音声素片が格納されている。
そして、切換器17によって、外部からの声質指定に応
じて何れか一方の音声素片データベースが選択的に音声
素片選択器14に接続されるようになっている。尚、音
声素片データベースの数は3個以上であっても一向に差
し支えない。
【0008】しかしながら、図7および図8に示す音声
合成装置においては、音声素片データベース5,15,1
6のデータ容量が一般に大きいという問題がある。そこ
で、音声素片データベースのデータ容量を圧縮削減した
音声合成装置が提案されている(特開2001‐154
683号広報)。図9は、この音声合成装置のブロック
図を示す。入力端子21,テキスト解析器22,韻律生成
器23,音声合成器28および音声出力端子29は、図
7における入力端子1,テキスト解析器2,韻律生成器
3,音声合成器6および音声出力端子7と同じである。
【0009】本音声合成装置では、自然音声データを分
析して得られた音声特徴スペクトルをベクトル量子化し
て、音声を分類する際の基準とテンプレートとの対応を
示す基準別ベクトル符号帳27を得ると共に、この基準
別ベクトル符号帳へのインデックスを音声素片データベ
ース25に格納している。そして、音声素片選択器24
は、音声特徴ベクトル選択器26を制御して基準別ベク
トル符号帳27をアクセスするようにしている。以下、
説明の便宜上、基準別ベクトル符号帳27の基準を音素
とする。したがって、基準別ベクトル符号帳27は、音
素別ベクトル符号帳である。
【0010】図10は、上記音声素片データベース25
に格納されたデータ構造の一例を示す。ここで、音声素
片データベース25には、自然音声データからVCVの
単位で適切に切り出された音声データを分析し、合成に
必要な情報の形式に変換したものを格納している。日本
語の場合、VCV素片数は約800個存在する。VCV
毎に格納する情報としては、VCVの音素境界位置情報
(seg1,seg2,seg3:VCVのフレーム数)、フレーム毎の
声帯振動の有無を表す有声/無声情報(uv[1],uv[2],
…,uv[seg3])、各フレーム毎の音の大きさを表す振幅情
報(pow[1],pow[2],…,pow[seg3])、及び、各フレー
ム毎の音声特微量(音素別ベクトル符号帳27)ヘのイン
デックス(idx[1],idx[2],…,idx[seg3])である。尚、
[x]は、各情報およびインデックスのフレーム番号を示
す。
【0011】音声データを一括してベクトル量子化する
と、音声特微量のバリエーションが非常に大きく、効率
良くベクトル量子化することが困難である。したがっ
て、ベクトル量子化に多くの情報量が必要になってしま
い、音声特徴量へのインデックスに必要な情報量も大き
くなってしまう。しかしながら、本実施の形態において
は、基準別ベクトル符号帳27の基準に音素を用いると
共に、特徴量としてスペクトルを表現するパラメータを
用いている。このように、音素を限定するとスペクトル
形状が比較的似通ったパラメータが集まるので、スペク
トルパラメータを効率的にベクトル量子化することがで
き、インデックスに必要な情報量を小さく抑えることが
できるのである。
【0012】図9において、上記音声素片選択器24に
よって音声素片VCVとして例えば「ito」を選択する
場合には、以下のように動作する。すなわち、音声素片
選択器24は、音声素片データベース25を参照して、
対象音声素片「ito」に関する有声/無声情報(uv[1],u
v[2],…,uv[seg3])と、振幅情報(pow[1],pow[2],…,
pow[seg3])と、インデックス(idx[1],idx[2],…,idx
[seg3])を得る。そして、得られたインデックス(idx
[1],idx[2],…,idx[seg3])と対象音声素片の音素列(/
i/,/t/,/o/)とを音声特徴ベクトル選択器26に送出
する。
【0013】そうすると、上記音声特徴ベクトル選択器
26は、先ず、音素/i/に従って、符号[i]と音声特微
量ベクトルとが対応付けられた/i/符号帳27bを切り
換え選択する。そして、次に、/i/符号帳27bの中か
ら、上記インデックスidx[1],idx[2],…,idx[seg1−
1]に従って、第1,2,…,(seg1−1)フレームの音声特
微量ベクトルを順次読み出して音声素片選択器24に送
出する。以下、上述の動作を繰り返して、/t/符号帳に
おける第seg1,…,(seg2−1)フレームの音声特微量ベク
トルを順次読み出し、/o/符号帳における第seg2,…,se
g3フレームの音声特微量ベクトルを順次読み出して音声
素片選択器24に送出するのである。
【0014】上記音声合成器28は、上記音声素片選択
器24からの有声/無声情報uvに基づいて、有音の場合
には韻律生成器23からの「高さ」および音声素片選択器
24からの振幅情報powに応じた時間間隔および波高の
パルス列を生成する一方、無音の場合には白色雑音を生
成する。そして、これらの音源信号の振幅を韻律生成器
23からの「大きさ」に応じた振幅に増幅し、この増幅さ
れた音源信号に対して音声素片選択器24からの音声特
微量ベクトルのパラメータに基づいてフィルタリング処
理を行って音声波形を生成するのである。
【0015】
【発明が解決しようとする課題】しかしながら、上記従
来の音声合成装置には、以下のような問題がある。すな
わち、図7に示す音声合成装置の音声素片データベース
5は、音質の良い合成音声を得るために一般にデータサ
イズが大きい。さらに、図8に示す音声合成装置では、
複数の音声素片データベース15,16を有しているた
め、複数化すると共に比例的に容量が大きくなり、コス
トが高くなると言う問題がある。
【0016】また、図9に示す音声合成装置において
は、音声特徴スペクトルのベクトル量子化によって音声
素片データベースのデータ容量の圧縮削減を図ってい
る。しかしながら、複数の異なる声質を実現するために
は、音声素片データベース25,音声特徴ベクトル選択
器26および音素別ベクトル符号帳27を、そのまま複
数組み設ける必要があるために、全体としてデータ容量
が増加するという問題がある。
【0017】そこで、この発明の目的は、音声合成に必
要な処理量の増加がなく音声素片データの容量増加を抑
えて複数の声質の合成音声を得ることができる音声合成
装置および音声合成方法、並びに、音声合成処理プログ
ラムを記録したプログラム記録媒体を提供することにあ
る。
【0018】
【課題を解決するための手段】上記目的を達成するた
め、第1の発明は、文字列を読み情報に変換するテキス
ト解析手段と,上記読み情報に基づいて韻律情報を生成
する韻律生成手段と,音声を分類する際の基準毎に音声
特徴量を格納した基準別ベクトル符号帳と,音声素片と
この音声素片に該当する各基準毎の上記基準別ベクトル
符号帳へのインデックスとが格納された音声素片データ
ベースと,上記読み情報に基づいて上記音声素片データ
ベースおよび基準別ベクトル符号帳を参照して音声素片
情報を選択する音声素片選択手段と,上記韻律情報およ
び音声素片情報に基づいて合成音声を生成する音声合成
手段を有する音声合成装置において、上記基準別ベクト
ル符号帳は,予め決められたカテゴリに属する基準の符
号帳と上記カテゴリに属さない基準の符号帳とから成
り、上記カテゴリに属する基準の符号帳は複数組み設け
られており、声質指定に基づいて上記複数組の上記カテ
ゴリに属する基準の符号帳から1組を切り換え選択する
切換手段を備えたことを特徴としている。
【0019】上記構成によれば、音素や調音方式等の音
声を分類する際の基準を、声質に影響を及ぼすカテゴリ
に属する基準と属さない基準とに分け、上記カテゴリに
属する基準の符号帳が声質数に応じて複数組設けられる
一方、上記カテゴリに属さない基準(声質に影響を及ぼ
さない基準)の符号帳は1組設けられる。そして、声質
指定に基づいて切換手段によって上記カテゴリに属する
基準の符号帳が1組切り換え選択され、音声素片選択手
段によって、上記読み情報に基づいて、上記選択された
上記カテゴリに属する基準の符号帳と1組の上記カテゴ
リに属さない基準の符号帳とで成る基準別ベクトル符号
帳および上記音声素片データベースが参照されて音声素
片情報が選択される。
【0020】このように、上記カテゴリに属する基準の
符号帳のみが複数組設けられることによって、複数の声
質による音声合成を実現するに際して、上記音声素片デ
ータベースおよび基準別ベクトル符号帳のデータ容量の
増加が抑制される。
【0021】また、1実施例では、上記第1の発明の音
声合成装置において、上記基準は音素であり、上記予め
決められたカテゴリは母音である。
【0022】この実施例によれば、スペクトルパラメー
タを効率的にベクトル量子化できる音素が上記基準とし
て用いられて、上記基準別ベクトル符号帳へのインデッ
クスに必要な情報量が小さく抑えられる。さらに、音素
別ベクトル符号帳を複数組設けるカテゴリとして音声の
個人特性に寄与する母音を与えることによって、複数の
声質を得る場合に母音符号帳のみを複数組設ければよ
い。したがって、複数の声質による音声合成を実現する
に際して、上記音声素片データベースおよび基準別ベク
トル符号帳のデータ容量の増加がより抑制される。
【0023】また、第2の発明は、文字列を読み情報に
変換するテキスト解析手段と,上記読み情報に基づいて
韻律情報を生成する韻律生成手段と,音声を分類する際
の基準毎に音声特徴量を格納した基準別ベクトル符号帳
と,音声素片とこの音声素片に該当する各基準毎の上記
基準別ベクトル符号帳へのインデックスとが格納された
音声素片データベースと,上記読み情報に基づいて上記
音声素片データベースおよび基準別ベクトル符号帳を参
照して音声素片情報を選択する音声素片選択手段と,上
記韻律情報および音声素片情報に基づいて合成音声を生
成する音声合成手段を有する音声合成装置において、上
記基準別ベクトル符号帳は複数組み設けられており、声
質指定に基づいて上記複数組の基準別ベクトル符号帳か
ら1組を切り換え選択する切換手段を備えていることを
特徴としている。
【0024】上記構成によれば、音素や調音方式等の音
声を分類する際の基準毎に音声特徴量が格納された基準
別ベクトル符号帳が声質数に応じて複数組設けられる。
そして、声質指定に基づいて切換手段によって上記基準
別ベクトル符号帳が1組切り換え選択され、音声素片選
択手段によって、上記読み情報に基づいて、上記選択さ
れた基準別ベクトル符号帳および上記音声素片データベ
ースが参照されて音声素片情報が選択される。
【0025】このように、上記基準別ベクトル符号帳の
みが複数組み設けられることによって、複数の声質によ
る音声合成を実現するに際して、上記音声素片データベ
ースおよび基準別ベクトル符号帳の夫々を複数組設ける
場合に比して、上記音声素片データベースおよび基準別
ベクトル符号帳のデータ容量の増加が抑制される。
【0026】また、1実施例では、上記第2の発明の音
声合成装置において、上記基準は音素である。
【0027】この実施例によれば、スペクトルパラメー
タを効率的にベクトル量子化できる音素が上記基準とし
て用いられて、上記基準別ベクトル符号帳へのインデッ
クスに必要な情報量が小さく抑えられる。したがって、
複数の声質による音声合成を実現するに際して、上記音
声素片データベースのデータ容量の増加がより抑制され
る。
【0028】また、1実施例では、上記第1の発明およ
び第2の発明の音声合成装置において、上記基準別ベク
トル符号帳に格納された音声特徴量は音声のスペクトル
形状を表すパラメータである。
【0029】この実施例によれば、効率的にベクトル量
子化できるスペクトルパラメータを音声特徴量とするこ
とによって、音声の波形データを音声特徴量とする場合
に比して、上記音声素片データベースおよび基準別ベク
トル符号帳のデータ容量の増加が抑制される。
【0030】また、1実施例では、上記第1の発明およ
び第2の発明の音声合成装置において、上記基準別ベク
トル符号帳に格納された音声特徴量は音声の波形データ
である。
【0031】この実施例によれば、処理量が少なく情報
量の多い音声の波形データを音声特徴量とすることによ
って、スペクトルパラメータを音声特徴量とする場合に
比して、音質の良い合成音声が少ない情報量で得られ
る。
【0032】また、第3の発明は、テキスト解析手段に
よって文字列を読み情報に変換し,韻律生成手段によっ
て上記読み情報に基づいて韻律情報を生成し,音声を分
類する際の基準毎に音声特徴量を格納した基準別ベクト
ル符号帳を複数組作成し,音声素片とこの音声素片に該
当する各基準毎の上記基準別ベクトル符号帳へのインデ
ックスとを音声素片データベースに格納し,音声素片選
択手段によって上記読み情報に基づいて上記音声素片デ
ータベースおよび基準別ベクトル符号帳を参照して音声
素片情報を選択し,音声合成手段によって上記韻律情報
および音声素片情報に基づいて合成音声を生成する音声
合成方法であって、声質指定に基づいて上記複数組の基
準別ベクトル符号帳から1組の基準別ベクトル符号帳を
切り換え選択する切換手段を有して,上記切換手段を声
質指定に基づいて制御することによって,上記指定され
た声質の音声特徴量を含む音声素片情報を用いて合成音
声を生成することを特徴としている。
【0033】上記構成によれば、声質指定に基づいて、
切換手段によって上記複数組の基準別ベクトル符号帳か
ら1組が切り換え選択され、音声素片選択手段によっ
て、上記読み情報に基づいて上記選択された基準別ベク
トル符号帳および上記音声素片データベースが参照され
て、上記指定された声質の音声特徴量を含む音声素片情
報が選択される。
【0034】このように、上記基準別ベクトル符号帳の
みが複数組み設けられることによって、複数の声質によ
る音声合成を実現するに際して、上記音声素片データベ
ースおよび基準別ベクトル符号帳の夫々を複数組設ける
場合に比して、上記音声素片データベースおよび基準別
ベクトル符号帳のデータ容量の増加が抑制される。
【0035】また、第4の発明のプログラム記録媒体
は、コンピュータを、上記第1の発明あるいは第2の発
明におけるテキスト解析手段,韻律生成手段,音声素片選
択手段,音声合成手段および切換手段として機能させる
音声合成処理プログラムが記録されたことを特徴として
いる。
【0036】上記構成によれば、上記第1の発明あるい
は第2の発明と同様に、複数の声質による音声合成を実
現するに際して、上記音声素片データベースおよび基準
別ベクトル符号帳のデータ容量の増加が抑制される。
【0037】
【発明の実施の形態】以下、この発明を図示の実施の形
態により詳細に説明する。 <第1実施の形態>図1は、本実施の形態の合成音声装
置におけるブロック図である。本実施の形態における音
声合成装置は、図9に示す音声合成装置における音素別
ベクトル符号帳を複数有し、切換器で何れかの音素別ベ
クトル符号帳を切り換え選択するものである。
【0038】すなわち、テキスト解析器32は、テキス
ト情報が入力端子31から入力されると、入力テキスト
情報に基づく読み情報を韻律生成器33および音声素片
選択器34に出力する。韻律生成器33は、上記読み情
報に基づいて韻律情報(声の高さ,声の大きさ,継続時間
長)を生成して音声合成器35に出力する。音声素片選
択器34は、音声素片データベース37を参照して、後
に詳述するようにして音声合成単位である音声素片VC
Vの情報を得、音声合成器35に出力する。
【0039】最後に、音声合成器35は、上記音声素片
選択器34からのVCVの有声/無声情報uv及び振幅情
報powに基づいて、有音の場合には韻律生成器33から
の「高さ」に応じた時間間隔のパルス列を生成する一方、
無音の場合には白色雑音を生成する。そして、これらの
音源信号の振幅を韻律生成器33からの「大きさ」に応じ
た振幅に増幅し、この増幅された音源信号に対して音声
素片選択器34からの音声特微ベクトルに基づいてフィ
ルタリング処理を行って音声波形を生成する。こうして
生成された音声波形は、音声出力端子36から出力され
る。
【0040】上記音声素片データベース37は、図9に
示す音声合成装置における音声素片データベース25と
同じ構成を有している。つまり、VCVの音素境界位置
情報(seg1,seg2,seg3:VCVのフレーム数)、フレーム
毎の声帯振動の有無を表す有声/無声情報(uv[1],uv
[2],…,uv[seg3])、各フレーム毎の音の大きさを表す
振幅情報(pow[1],pow[2],…,pow[seg3])、及び、各
フレーム毎の音声特微量(音素別ベクトル符号帳)ヘのイ
ンデックス(idx[1],idx[2],…,idx[seg3])が格納され
ている。
【0041】本実施の形態においては、音素別ベクトル
符号帳40と音素別ベクトル符号帳41との2個の音素
別ベクトル符号帳を有している。そして、例えば、音素
別ベクトル符号帳40には、男声の音声特徴ベクトルに
関する/a/符号帳40a,/i/符号帳40b,…,/N/符号
帳40cを格納している。同様に、音素別ベクトル符号
帳41には、女声の音声特徴ベクトルに関する/a/符号
帳41a,/i/符号帳41b,…,/N/符号帳41cを格納し
ている。こうして、異なる声質の音素別ベクトル符号帳
を予め用意しておくのである。ここで、音素別ベクトル
符号帳の数は3以上であっても差し支えない。そして、
切換器39によって、外部からの声質指定に応じて、音
素別ベクトル符号帳40と音素別ベクトル符号帳41と
の何れかを切り換え選択するのである。
【0042】上記音声素片選択器34は、図9に示す音
声合成装置における音声素片選択器24の場合と同様
に、音声素片データベース37から音声素片VCVの有
声/無声情報uv,振幅情報powおよびインデックスidxを得
て、インデックスidxと上記VCVの音素列とを音声特
徴ベクトル選択器38に送出する。
【0043】音声特徴ベクトル選択器38は、図9に示
す音声合成装置における音声特徴ベクトル選択器26の
場合と同様に、音声素片選択器34からのVCVの音素
列に基づいて、切換器39によって選択された音素別ベ
クトル符号帳から音素符号帳を選択する。そして、この
選択された音素符号帳から、音声素片選択器34からの
インデックスidxに基づいて該当する音声特徴ベクトル
を読み出して、音声素片選択器34に送出するのであ
る。
【0044】このように、本実施の形態においては、上
記音声素片データベース37は共通に使用し、基準別ベ
クトル符号帳(図1では音素別ベクトル符号帳)のみを複
数所有すれば良いので、複数声質に拡張する際のデータ
量の増加を小さく抑えることができるのである。以下、
音声素片データベース37および音素別ベクトル符号帳
40,41のデータ容量に付いて検討してみる。
【0045】図9に示す音声合成装置における音声素片
データベース25のデータ容量は、VCVの種類を80
0、VCVの最大フレーム数を64とし、有声/無声情
報uvと振幅情報powとインデックスidxとを合わせて1フ
レーム当たり2Byteで表現するとすると、約100K
Byteとなる。また、音素別ベクトル符号帳27のデー
タ容量は、音素毎に64パターンの音声特徴ベクトルを
格納し、音素数を32とし、音声特徴量としてスペクト
ルパラメータを1パターン当たり40ビットで表現する
とすると、約10KByteとなる。したがって、音声素
片データベース25と音素別ベクトル符号帳27との総
データ容量は、約110KByteとなるのである。
【0046】これに対して、本実施の形態における音声
合成装置は、図9に示す音声合成装置における音素別ベ
クトル符号帳27と同じデータ容量の音素別ベクトル符
号帳を2個有している。したがって、音声素片データベ
ース37と音素別ベクトル符号帳40,41との総デー
タ容量は、約120KByteとなる。すなわち、図9に
示す音声合成装置における総データ容量約110KByt
eに対して、僅かに約10KByteのデータ容量の増加で
音質バリエーションを2つに増加させることできるので
ある。
【0047】一方、上述したように、図9に示す音声合
成装置における音声素片データベース25と音素別ベク
トル符号帳27とを単純に2組み設けた場合には、音声
素片データベースと音素別ベクトル符号帳との総データ
容量は約220KByteとなり、大幅な記憶容量の増加
となるのである。
【0048】本実施の形態のごとく、複数の音素別ベク
トル符号帳40,41を作成する方法としては、例えば
基本の音素別ベクトル符号帳40に音素符号帳40a,4
0b,…,40c毎に格納された音声特微量に対して―括変
換処理を行うことによって、声質が変換された音素別ベ
クトル符号帳41を作成する方法が考えられる。その場
合における上記一括変換処理としては、周波数スペクト
ルにおけるホルマント周波数位置を周波数シフトして移
動する一括変換処理がある。例えば男声の周波数スペク
トルを高い周波数方向に周波数シフトして、擬似的に女
声による周波数スペクトルを作成するのである。
【0049】図2に、第1の周波数スペクトルにおける
ホルマント周波数位置を周波数シフトして第2の周波数
スペクトルを得る一括変換処理方法の一例を示す。ま
た、図3に、上記一括変換処理結果の具体例を示す。図
2において、変換器42は、音素別ベクトル符号帳40
における/a/符号帳40a,/i/符号帳40b,…,/N/符
号帳40cの周波数スペクトルを順次周波数軸変換し
て、音素別ベクトル符号帳41における各/a/符号帳4
1a,/i/符号帳41b,…,/N/符号帳41cの周波数スペ
クトルを得るのである。
【0050】その場合における上記変換器42の周波数
軸変換特性は、図3(b)に示す通りである。図3(b)にお
ける横軸は入力音声スペクトルの周波数軸であり、縦軸
は出力音声スペクトルの周波数軸である。直線bは、入
力周波数と出力周波数が同一であり、無変換の関数を表
す。直線aは、入力周波数よりも出力周波数が高周波数
側へ移動する関数を表す。直線aによる周波数軸変換に
よれば、図3(a)に示す入力スペクトル43は、図3(c)
に示す出力スペクトル44のように、高い周波数軸へ移
動した音声スペクトルが生成される。逆に、直線cは、
入力周波数よりも出力周波数が低周波数側へ移動する関
数を表す。直線cによる周波数軸変換によれば、図3
(c)に示す出力スペクトル45のように、低い周波数軸
へ移動した音声スペクトルが生成されるのである。
【0051】尚、図2における変換器42は、上記音素
別ベクトル符号帳40における総ての音素符号帳の周波
数スペクトルを一括して周波数軸変換するのであるが、
図4に示す変換器46のように、各音素毎に異なった変
換器46a,46b,…,46cを備えていても良い。そし
て、総ての音素符号帳を一括して変換処理するのではな
く、音素毎に対応する変換器46a,46b,…,46cによ
って変換処理を行うのである。
【0052】また、図2および図4に示す変換器42,
46は、総ての音素符号帳に対して変換処理を行ってい
る。ところが、一般に母音のホルマント周波数位置に音
声の個人性の情報が含まれていると言われており、この
知見に基づいて音素別ベクトル符号帳40における母音
の音素符号帳のみに対して周波数軸変換の処理を行うこ
とによっても、音素別ベクトル符号帳41を作成するこ
とができる。
【0053】この場合には、図5に示すように、変換器
51に、各母音毎に異なった変換器51a,51b,…,5
1cを備える。そして、音素別ベクトル符号帳40にお
ける母音符号帳47の各母音毎の符号帳に対して変換器
51の対応する変換器によって変換処理を行い、音素別
ベクトル符号帳41の母音符号帳49を得るのである。
さらに、音素別ベクトル符号帳41の子音符号帳50
は、音素別ベクトル符号帳40の子音符号帳48をその
ままコピーするのである。
【0054】尚、上記変換器42,46,51による周波
数軸変換処理は、図1におけるテキスト解析器32,韻
律生成器33,音声素片選択器34および音声合成器3
5が有する演算処理機能を利用して、音声合成処理時に
実行することも可能であるが、演算能力の低い音声合成
装置の場合には処理量が問題となる。その場合には、予
め周波数軸変換処理を行って変換した音素別ベクトル符
号帳を作成しておけば、処理量の増加を抑えて、複数の
声質を有する音声合成を実現することができるのであ
る。
【0055】<第2実施の形態>図5に示す音素別ベク
トル符号帳の作成方法においては、音素別ベクトル符号
帳41の子音符号帳50は、音素別ベクトル符号帳40
の子音符号帳48をそのままコピーして、母音符号帳4
9と子音符号帳50とが揃った音素別ベクトル符号帳4
1を作成している。しかしながら、音素別ベクトル符号
帳41の子音符号帳50は、音素別ベクトル符号帳40
の子音符号帳48と全く同じであるから、子音符号帳4
8のコピーを省略して、音素別ベクトル符号帳41の子
音符号帳50として音素別ベクトル符号帳40の子音符
号帳48を利用することも可能である。こうすれば、音
素別ベクトル符号帳のデータ容量をさらに削減できるの
である。
【0056】図6は、本実施の形態の音声合成装置にお
ける音素別ベクトル符号帳の部分のブロック図である。
尚、図6では省略しているが、本実施の形態において
も、上記第1実施の形態における入力端子31,テキス
ト解析器32,韻律生成器33,音声素片選択器34,音
声合成器35,出力端子36,音声素片データベース3
7,音声特徴ベクトル選択器38および切換器39と同
じ入力端子,テキスト解析器,韻律生成器,音声素片選択
器,音声合成器,出力端子,音声素片データベース,音声特
徴ベクトル選択器および切換器61を有している。
【0057】本実施の形態においては、上記音素別ベク
トル符号帳を単純に複数備えるのではなく、あるカテゴ
リの音素に関する音素符号帳は複数組備えるが、その他
のカテゴリの音素に関する音素符号帳は1組のみを備え
るのである。例えば、複数話者の音素符号帳を格納する
場合に、音声の個人性に寄与するのは特に母音の音声デ
ータであるという知見に基づいて、母音の音素符号帳の
みを各話者毎に複数組み持ち、その他の子音符号帳は1
組持ち、複数話者で共有するのである。
【0058】すなわち、図6に示すように、第1話者の
音素別ベクトル符号帳62は、母音符号帳64と子音符
号帳65とから構成される。また、第2話者の音素別ベ
クトル符号帳63は、母音符号帳66と子音符号帳65
とから構成される。そして、第2話者の音素別ベクトル
符号帳63における母音符号帳66は、例えば、第1話
者の音素別ベクトル符号帳62における母音符号帳64
を、図5に示す変換器51によって周波数軸変換を行う
ことによって得る。また、子音符号帳65は、音素別ベ
クトル符号帳62と音素別ベクトル符号帳63とで共有
するのである。
【0059】上記構成の音声合成装置は次のように動作
する。上記切換器61に対して外部からの声質指定があ
ると、切換器61によって、上記声質指定に応じて、音
素別ベクトル符号帳62と音素別ベクトル符号帳63と
の何れかが切り換え選択される。そして、上記音声特徴
ベクトル選択器によって、図9に示す音声合成装置にお
ける音声特徴ベクトル選択器26の場合と同様に、音声
素片VCVの音素列に基づいて、切換器61によって選
択された例えば音素別ベクトル符号帳63の母音符号帳
66と子音符号帳65とから音素符号帳が選択される。
そして、この選択された音素符号帳から、上記音声素片
選択器によって上記音声素片データベースから得られた
インデックスidxに基づいて該当する音声特徴ベクトル
が読み出されて、音声素片選択器に送出されるのであ
る。
【0060】本実施の形態の音声合成装置における音声
素片データベースのデータ容量は、上記第1実施の形態
の場合と同様とすれば約100KByteである。また、
音素別ベクトル符号帳62のデータ容量は、上記第1実
施の形態の場合と同様とすれば約10KByteである。
また、音素別ベクトル符号帳62の音素数が「32」であ
るのに対して、母音符号帳66の母音符号帳66の音素
数は「5」であるから、母音符号帳66のデータ容量は、
約10KByte×5/32=約1.6KByteである。した
がって、上記音声素片データベースおよび音素別ベクト
ル符号帳の合計データ容量は約111.6KByteであ
り、上記第1実施の形態の場合の約120KByteより
もデータ容量を削減できる。
【0061】すなわち、本実施の形態によれば、上記音
声素片データベースおよび音素別ベクトル符号帳の合計
データ容量の増加を尚一層抑制して、複数の声質に拡張
することができるのである。
【0062】上記各実施の形態においては、上記基準別
ベクトル符号帳の基準を音素として説明したが、音素の
他に例えば音韻カテゴリで分類しても差し支えない。ま
た、音響的特徴が類似している摩擦音,破裂音,鼻音等の
調音形式で分類しても良い。
【0063】また、上記音素別ベクトル符号帳に符号帳
別に格納する音声特徴ベクトルは、特開2001‐15
4683号公報と同様に、スペクトル形状を表すパラメ
ータ(例えば線形予測係数)で格納しても良い。あるい
は、音声合成装置の演算量を小さく抑える目的で、波形
データの形式で保持しても良い。その場合には、波形デ
ータを1ピッチ分格納し、音声合成処理する際にピッチ
の間隔でピッチ波形を重畳合成する方式が広く利用され
ている。何れの形式で音素別ベクトル符号帳に格納する
かは、データサイズと処理量の兼ね合いで設定すればよ
い。
【0064】尚、上記各実施の形態における音声合成装
置による音声合成方法は、テキスト解析器32によって
文字列を読み情報に変換し、韻律生成器33によって上
記読み情報に基づいて韻律情報を生成し、声質指定に基
づいて切換器39,61によって音素別ベクトル符号帳
40,41の何れかをを切り換え選択し、音声素片選択
器34によって上記読み情報に基づいて音声素片データ
ベース37および上記選択された基準別ベクトル符号帳
を参照して音声素片情報を選択し、音声合成器35によ
って上記韻律情報および音声素片情報に基づいて合成音
声を生成することによって行われる。
【0065】ところで、上記各実施の形態における上記
テキスト解析器32,韻律生成器33,音声素片選択器3
4,音声合成器35,音声特徴ベクトル選択器38および
切換器39,61としての機能は、プログラム記録媒体
に記録された音声合成処理プログラムによって実現され
る。上記各実施の形態における上記プログラム記録媒体
は、ROM(リード・オンリ・メモリ)でなるプログラムメ
ディアである。あるいは、外部補助記憶装置に装着され
て読み出されるプログラムメディアであってもよい。
尚、何れの場合においても、上記プログラムメディアか
ら音声合成処理プログラムを読み出すプログラム読み出
し手段は、上記プログラムメディアに直接アクセスして
読み出す構成を有していてもよいし、RAM(ランダム・
アクセス・メモリ)に設けられたプログラム記憶エリア
(図示せず)にダウンロードし、上記プログラム記憶エリ
アにアクセスして読み出す構成を有していてもよい。
尚、上記プログラムメディアから上記RAMのプログラ
ム記憶エリアにダウンロードするためのダウンロードプ
ログラムは、予め、本体装置に格納されているものとす
る。
【0066】ここで、上記プログラムメディアとは、本
体側と分離可能に構成され、磁気テープやカセットテー
プ等のテープ系、フロッピー(登録商標)ディスク,ハ
ードディスク等の磁気ディスクやCD(コンパクトディ
スク)‐ROM,MO(光磁気)ディスク,MD(ミニディス
ク),DVD(ディジタルビデオディスク)等の光ディスク
のディスク系、IC(集積回路)カードや光カード等のカ
ード系、マスクROM,EPROM(紫外線消去型RO
M),EEPROM(電気的消去型ROM),フラッシュR
OM等の半導体メモリ系を含めた、固定的にプログラム
を坦持する媒体である。
【0067】また、上記各実施の形態における音声合成
装置は、モデムを備えてインターネットを含む通信ネッ
トワークと接続可能な構成を有している場合には、上記
プログラムメディアは、通信ネットワークからのダウン
ロード等によって流動的にプログラムを坦持する媒体で
あっても差し支えない。尚、その場合における上記通信
ネットワークからダウンロードするためのダウンロード
プログラムは、予め本体装置に格納されているものとす
る。あるいは、別の記録媒体からインストールされるも
のとする。
【0068】尚、上記記録媒体に記録されるものはプロ
グラムのみに限定されるものではなく、データも記録す
ることが可能である。
【0069】
【発明の効果】以上より明らかなように、第1の発明の
音声合成装置は、音声を分類する際の基準毎に音声特徴
量を格納した基準別ベクトル符号帳と、音声素片とこの
音声素片に該当する各基準毎の上記基準別ベクトル符号
帳へのインデックスとが格納された音声素片データベー
スを有して、上記基準別ベクトル符号帳を予め決められ
たカテゴリに属する基準の符号帳と上記カテゴリに属さ
ない基準の符号帳とで成し、上記カテゴリに属する基準
の符号帳を複数組み設けて、切換手段によって、声質指
定に基づいて上記複数組の上記カテゴリに属する基準の
符号帳から1組を切り換え選択するので、上記カテゴリ
を声質に影響を及ぼすようなカテゴリに設定すれば、上
記カテゴリに属する基準の符号帳のみを複数組設けるこ
とによって複数の声質による音声合成を実現できる。
【0070】したがって、複数の声質による音声合成を
行うに際して、上記音声素片データベース及び基準別ベ
クトル符号帳のデータ容量の増加を抑制することができ
る。
【0071】また、1実施例の音声合成装置は、スペク
トルパラメータを効率的にベクトル量子化できる音素を
上記基準として用いるので、上記基準別ベクトル符号帳
へのインデックスに必要な情報量を小さく抑えることが
できる。さらに、上記予め決められたカテゴリを音声の
個人特性に寄与する母音とするので、母音符号帳のみを
複数組設ける一方、子音符号帳は1組設けるだけで、複
数の声質を得ることができる。したがって、複数の声質
による音声合成を実現するに際して、上記音声素片デー
タベースおよび基準別ベクトル符号帳のデータ容量の増
加をより抑制することができる。
【0072】また、第2の発明の音声合成装置は、音声
を分類する際の基準毎に音声特徴量を格納した複数組の
基準別ベクトル符号帳と、音声素片とこの音声素片に該
当する各基準毎の上記基準別ベクトル符号帳へのインデ
ックスとが格納された音声素片データベースを有し、切
換手段によって、声質指定に基づいて上記複数組の基準
別ベクトル符号帳から1組を切り換え選択するので、複
数の声質による音声合成を行うに際して、上記音声素片
データベースおよび基準別ベクトル符号帳の夫々を複数
組設ける場合に比して、上記音声素片データベースおよ
び基準別ベクトル符号帳のデータ容量の増加を抑制する
ことができる。
【0073】また、1実施例の音声合成装置は、スペク
トルパラメータを効率的にベクトル量子化できる音素を
上記基準として用いるので、上記基準別ベクトル符号帳
へのインデックスに必要な情報量を小さく抑えることが
できる。
【0074】また、1実施例の音声合成装置は、上記基
準別ベクトル符号帳に格納された音声特徴量は、効率的
なベクトル量子化が可能な音声のスペクトル形状を表す
パラメータであるので、音声の波形データを音声特徴量
とする場合に比して、上記音声素片データベースおよび
基準別ベクトル符号帳のデータ容量の増加を抑制するこ
とができる。
【0075】また、1実施例の音声合成装置は、上記基
準別ベクトル符号帳に格納された音声特徴量は、処理量
が少なく情報量が多い音声の波形データであるので、ス
ペクトルパラメータを音声特徴量とする場合に比して、
音質の良い合成音声を少ない情報量で得ることができ
る。
【0076】また、第3の発明の音声合成方法は、音声
を分類する際の基準毎に音声特徴量を格納した基準別ベ
クトル符号帳を複数組作成し、音声素片とこの音声素片
に該当する各基準毎の上記基準別ベクトル符号帳へのイ
ンデックスとを音声素片データベースに格納し、切換手
段によって、声質指定に基づいて上記複数組の基準別ベ
クトル符号帳から1組を切り換え選択するので、上記指
定された声質の音声特徴量を含む音声素片情報を用いて
合成音声を生成することができる。
【0077】すなわち、上記基準別ベクトル符号帳のみ
を複数組み設けることによって、複数の声質による音声
合成を実現するに際して、上記音声素片データベースお
よび基準別ベクトル符号帳の夫々を複数組設ける場合に
比して、上記音声素片データベースおよび基準別ベクト
ル符号帳のデータ容量の増加を抑制できる。
【0078】また、第4の発明のプログラム記録媒体
は、コンピュータを、上記第1の発明あるいは第2の発
明におけるテキスト解析手段,韻律生成手段,音声素片選
択手段,音声合成手段および切換手段として機能させる
音声合成処理プログラムを記録しているので、上記第1
の発明あるいは第2の発明と同様に、複数の声質による
音声合成を実現するに際して、上記音声素片データベー
スおよび基準別ベクトル符号帳のデータ容量の増加を抑
制できる。
【図面の簡単な説明】
【図1】 この発明の合成音声装置におけるブロック図
である。
【図2】 第1の周波数スペクトルを周波数シフトして
第2の周波数スペクトルを得る一括変換処理方法の説明
図である。
【図3】 図2における一括変換処理結果の具体例を示
す図である。
【図4】 図2とは異なる変換処理方法の説明図であ
る。
【図5】 図2および図4とは異なる変換処理方法の説
明図である。
【図6】 図1とは異なる音声合成装置における音素別
ベクトル符号帳の部分のブロック図である。
【図7】 テキストから音声を生成する音声合成装置の
一般的な構成を示す図である。
【図8】 複数の音声素片データベースを備える音声合
成装置のブロック図である。
【図9】 音声素片データベースのデータ容量を圧縮削
減した音声合成装置のブロック図である。
【図10】 図9における音声素片データベースのデー
タ構造の一例を示す図である。
【符号の説明】
31…入力端子、 32…テキスト解析器、 33…韻律生成器、 34…音声素片選択器、 35…音声合成器、 36…音声出力端子、 37…音声素片データベース、 38…音声特徴ベクトル選択器、 39,61…切換器、 40,41,62,63…音素別ベクトル符号帳、 42,46,51…変換器、 47,49,64,66…母音符号帳、 48,50,65…子音符号帳。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 文字列を読み情報に変換するテキスト解
    析手段と、上記読み情報に基づいて韻律情報を生成する
    韻律生成手段と、音声を分類する際の基準毎に音声特徴
    量を格納した基準別ベクトル符号帳と、音声素片とこの
    音声素片に該当する各基準毎の上記基準別ベクトル符号
    帳へのインデックスとが格納された音声素片データベー
    スと、上記読み情報に基づいて上記音声素片データベー
    ス及び基準別ベクトル符号帳を参照して音声素片情報を
    選択する音声素片選択手段と、上記韻律情報および音声
    素片情報に基づいて合成音声を生成する音声合成手段を
    有する音声合成装置において、 上記基準別ベクトル符号帳は、予め決められたカテゴリ
    に属する基準の符号帳と、上記カテゴリに属さない基準
    の符号帳とから成り、 上記カテゴリに属する基準の符号帳は複数組み設けられ
    ており、 声質指定に基づいて上記複数組の上記カテゴリに属する
    基準の符号帳から1組を切り換え選択する切換手段を備
    えたことを特徴とする音声合成装置。
  2. 【請求項2】 請求項1に記載の音声合成装置におい
    て、 上記基準は音素であり、上記予め決められたカテゴリは
    母音であることを特徴とする音声合成装置。
  3. 【請求項3】 文字列を読み情報に変換するテキスト解
    析手段と、上記読み情報に基づいて韻律情報を生成する
    韻律生成手段と、音声を分類する際の基準毎に音声特徴
    量を格納した基準別ベクトル符号帳と、音声素片とこの
    音声素片に該当する各基準毎の上記基準別ベクトル符号
    帳へのインデックスとが格納された音声素片データベー
    スと、上記読み情報に基づいて上記音声素片データベー
    ス及び基準別ベクトル符号帳を参照して音声素片情報を
    選択する音声素片選択手段と、上記韻律情報および音声
    素片情報に基づいて合成音声を生成する音声合成手段を
    有する音声合成装置において、 上記基準別ベクトル符号帳は複数組み設けられており、 声質指定に基づいて上記複数組の基準別ベクトル符号帳
    から1組を切り換え選択する切換手段を備えたことを特
    徴とする音声合成装置。
  4. 【請求項4】 請求項3に記載の音声合成装置におい
    て、 上記基準は音素であることを特徴とする音声合成装置。
  5. 【請求項5】 請求項1乃至請求項4の何れか一つに記
    載の音声合成装置において、 上記基準別ベクトル符号帳に格納された音声特徴量は、
    音声のスペクトル形状を表すパラメータであることを特
    徴とする音声合成装置。
  6. 【請求項6】 請求項1乃至請求項4の何れか一つに記
    載の音声合成装置において、 上記基準別ベクトル符号帳に格納された音声特徴量は、
    音声の波形データであることを特徴とする音声合成装
    置。
  7. 【請求項7】 テキスト解析手段によって文字列を読み
    情報に変換し、韻律生成手段によって上記読み情報に基
    づいて韻律情報を生成し、音声を分類する際の基準毎に
    音声特徴量を格納した基準別ベクトル符号帳を複数組作
    成し、音声素片とこの音声素片に該当する各基準毎の上
    記基準別ベクトル符号帳へのインデックスとを音声素片
    データベースに格納し、音声素片選択手段によって上記
    読み情報に基づいて上記音声素片データベースおよび基
    準別ベクトル符号帳を参照して音声素片情報を選択し、
    音声合成手段によって上記韻律情報および音声素片情報
    に基づいて合成音声を生成する音声合成方法であって、 声質指定に基づいて上記複数組の基準別ベクトル符号帳
    から1組の基準別ベクトル符号帳を切り換え選択する切
    換手段を有して、上記切換手段を声質指定に基づいて制
    御することによって、上記指定された声質の音声特徴量
    を含む音声素片情報を用いて合成音声を生成することを
    特徴とする音声合成方法。
  8. 【請求項8】 コンピュータを、 請求項1あるいは請求項3に記載のテキスト解析手段,
    韻律生成手段,音声素片選択手段,音声合成手段および切
    換手段として機能させる音声合成処理プログラムが記録
    されたことを特徴とするコンピュータ読出し可能なプロ
    グラム記録媒体。
JP2001261323A 2001-08-30 2001-08-30 音声合成装置および音声合成方法、並びに、プログラム記録媒体 Pending JP2003066983A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001261323A JP2003066983A (ja) 2001-08-30 2001-08-30 音声合成装置および音声合成方法、並びに、プログラム記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001261323A JP2003066983A (ja) 2001-08-30 2001-08-30 音声合成装置および音声合成方法、並びに、プログラム記録媒体

Publications (2)

Publication Number Publication Date
JP2003066983A true JP2003066983A (ja) 2003-03-05
JP2003066983A5 JP2003066983A5 (ja) 2006-07-27

Family

ID=19088390

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001261323A Pending JP2003066983A (ja) 2001-08-30 2001-08-30 音声合成装置および音声合成方法、並びに、プログラム記録媒体

Country Status (1)

Country Link
JP (1) JP2003066983A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010116549A1 (ja) * 2009-03-30 2010-10-14 株式会社東芝 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法
JP2011237602A (ja) * 2010-05-11 2011-11-24 Dainippon Printing Co Ltd 符号化音声データの音高変換装置
JP2012185356A (ja) * 2011-03-07 2012-09-27 Yamaha Corp 音声合成装置
CN112562635A (zh) * 2020-12-03 2021-03-26 云知声智能科技股份有限公司 解决语音合成中拼接处产生脉冲信号的方法、装置及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010116549A1 (ja) * 2009-03-30 2010-10-14 株式会社東芝 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法
JP2011237602A (ja) * 2010-05-11 2011-11-24 Dainippon Printing Co Ltd 符号化音声データの音高変換装置
JP2012185356A (ja) * 2011-03-07 2012-09-27 Yamaha Corp 音声合成装置
CN112562635A (zh) * 2020-12-03 2021-03-26 云知声智能科技股份有限公司 解决语音合成中拼接处产生脉冲信号的方法、装置及系统
CN112562635B (zh) * 2020-12-03 2024-04-09 云知声智能科技股份有限公司 解决语音合成中拼接处产生脉冲信号的方法、装置及系统

Similar Documents

Publication Publication Date Title
US7010488B2 (en) System and method for compressing concatenative acoustic inventories for speech synthesis
JP3408477B2 (ja) フィルタパラメータとソース領域において独立にクロスフェードを行う半音節結合型のフォルマントベースのスピーチシンセサイザ
JP3563772B2 (ja) 音声合成方法及び装置並びに音声合成制御方法及び装置
EP0059880A2 (en) Text-to-speech synthesis system
JPH031200A (ja) 規則型音声合成装置
WO2002043052A1 (en) Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
US4542524A (en) Model and filter circuit for modeling an acoustic sound channel, uses of the model, and speech synthesizer applying the model
JP2002202789A (ja) テキスト音声合成装置およびプログラム記録媒体
JP2001034280A (ja) 電子メール受信装置および電子メールシステム
JP3841596B2 (ja) 音素データの生成方法及び音声合成装置
JP2003066983A (ja) 音声合成装置および音声合成方法、並びに、プログラム記録媒体
JP4408596B2 (ja) 音声合成装置、声質変換装置、音声合成方法、声質変換方法、音声合成処理プログラム、声質変換処理プログラム、および、プログラム記録媒体
JP5376643B2 (ja) 音声合成装置、方法およびプログラム
JPH09319391A (ja) 音声合成方法
JP3515406B2 (ja) 音声合成方法及び装置
JP3554513B2 (ja) 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体
JPH09179576A (ja) 音声合成方法
JPH05127697A (ja) ホルマントの線形転移区間の分割による音声の合成方法
JP2987089B2 (ja) 音声素片作成方法および音声合成方法とその装置
JPS5880699A (ja) 音声合成方式
JP2001117576A (ja) 音声合成方法
JPH11109992A (ja) 音声素片データベースの作成方法、音声合成方法、音声素片データベース、音声素片データベース作成装置および音声合成装置
JP3515268B2 (ja) 音声合成装置
JP2004206144A (ja) 基本周波数パタン生成方法、及びプログラム記録媒体
Sassi et al. A text-to-speech system for Arabic using neural networks

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060613

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060613

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090512

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091006