JP3233544B2 - Vcv連鎖波形を接続する音声合成方法およびその装置 - Google Patents

Vcv連鎖波形を接続する音声合成方法およびその装置

Info

Publication number
JP3233544B2
JP3233544B2 JP04042295A JP4042295A JP3233544B2 JP 3233544 B2 JP3233544 B2 JP 3233544B2 JP 04042295 A JP04042295 A JP 04042295A JP 4042295 A JP4042295 A JP 4042295A JP 3233544 B2 JP3233544 B2 JP 3233544B2
Authority
JP
Japan
Prior art keywords
vcv
chain
waveform
waveforms
connection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04042295A
Other languages
English (en)
Other versions
JPH08234793A (ja
Inventor
居 康 彦 新
輪 利 光 蓑
月 亮 望
多 ▲高▼ 本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP04042295A priority Critical patent/JP3233544B2/ja
Publication of JPH08234793A publication Critical patent/JPH08234793A/ja
Application granted granted Critical
Publication of JP3233544B2 publication Critical patent/JP3233544B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自然音声データベース
を利用して音声を合成する際に、少ない音声データベー
スから高品質の音声を合成することのできるVCV(母
音−子音−母音)連鎖波形を接続する音声合成方法およ
びその装置に関するものである。
【0002】
【従来の技術】従来、音声の合成は、大量の自然音声デ
ータベースから種々の音韻連鎖波形を接続して音声を合
成するものであった。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の音声合成技術では、データベースの構築に多大の労
力を要し、また、音声合成の際に音韻連鎖波形の検索に
多くの時間がかかるという実用上の問題があった。
【0004】本発明は、上記従来の問題を解決するもの
であり、少ない音声データベースから効率的に高品質の
音声を合成する音声合成方法およびその装置を提供する
ことを目的とする。
【0005】
【課題を解決するための手段】本発明は、上記目的を達
成するために、自然音声データベースに登録されている
音声データから合成に必要なVCV連鎖波形の候補を切
り出し、切り出したVCV連鎖波形から最適な接続組み
合わせを決定し、その組み合わせの各VCV連鎖波形の
有声音部分をピッチ波形列に分解し、分解したその組み
合わせのVCV連鎖波形を順次ピッチパターンに沿って
再配列することによって全てのVCV連鎖波形を接続
し、接続されたVCV連鎖波形同士の接続点でパワーを
整合し、接続によって得られた音声の韻律を微調整する
ようにしたものである。
【0006】
【作用】本発明は、自然音声データベースに含まれるV
CV連鎖波形に着目し、それらを接続して音声を合成す
るようにしたものであり、短時間で必要な波形を検索す
ることができる。また、種々の音韻連鎖波形を接続する
従来の合成方法では、大容量の音声データベースを必要
とし、そのデータベースを特定することも困難であった
が、本発明では、VCV連鎖波形に着目しているので、
必要なデータベースの容量が小さく、その特定も容易で
あるため、データベースを容易に構築することができ
る。さらに、VCV連鎖波形の有声部分をピッチ波形列
に分解し、それらを順次ピッチパターンに沿って再配列
することによって全てのVCV連鎖波形を接続合成し、
その接続点でのパワーの整合および得られた音声の韻律
の微調整を行なうので、極めて自然で明瞭な音声を合成
することができる。
【0007】
【実施例】以下、本発明の一実施例における音声合成装
置について図面を参照しながら説明する。図1におい
て、1は文字列分割処理部、2は候補検索部、3は波形
選択部、4は波形分解部、5は波形統合部、6はパワー
整合部、7は韻律修正部である。また10は文字入力端
子、11はピッチパターン入力端子、12は合成音声出
力端子である。さらに21はテキストデータベース、3
1は自然音声データベースである。
【0008】以上のように構成された本実施例の音声合
成装置について、以下その動作を説明する。テキストデ
ータベース21は、自然音声データベース31の内容を
文字表示したものであり、文字列をキーとして、その文
字列に対応する音声波形が読み出されるように構成され
ている。また、自然音声データベース31には、母音の
定常区間を示すマーカーを付加しておき、文字列をキー
としてその文字列に対応する音声波形を読み出すとき
に、先行母音の定常部開始マークから後続母音の定常部
終了マークまでが読み出せるようになっている。
【0009】合成すべき音声の文字列を文字入力端子1
0から入力し、その文字列を文字列分割処理部1でVC
V単位に分割して、合成に必要なVCV連鎖波形の種類
を特定する。例えば、単語音声「横浜市」を合成する場
合、文字入力端子10から“yokohamasi”と入力する
と、文字列分割処理部1で“ yo oko oha ama ashi”の
ように分割する。
【0010】候補検索部2は、テキストデータベース2
1から、文字列分割処理部1で分割されたVCV文字列
がどのテキストの何番目のVCV単位と一致するかを検
索して、合成に使用できるVCV連鎖波形の候補を特定
し、接続順にVCVラティスを構成する。図2は“ yok
ohamashi”を合成する場合を例として、必要なVCV連
鎖波形が含まれているテキストの一覧を示している。図
2において、(Tm,Vn)はVCV連鎖波形のインデック
スであり、Tmはテキスト番号、VnはVCV番号を示して
いる。また、図3は図2のインデックス(Tm,Vn)を用
いてVCVラティスを構成した例を示す。
【0011】波形選択部3は、VCVラティスの全ての
組み合わせについて、自然音声データベース31から読
み出したVCV連鎖波形同士の接続箇所でのスペクトル
歪みが最小となる組み合わせを選択する。このとき、同
じテキストから切り出されたVCV連鎖波形、接続順番
と同じ順番またはそれに近い順番にあるVCV連鎖波形
を優先して処理するようにしている。図3の例では、 yo は (T1,V1) oko は (T1,V2) oha は (T4,V3) ama は (T2,V3) ashi は (T1,V5) の組み合わせを優先して、スペクトル歪みを計算する。
スペクトル歪みは、接続母音同士の定常区間で計算し、
スペクトル歪みが最小となる位置で接続する。接続位置
でのスペクトル歪みが全て一定値以下となるとき、その
VCV連鎖波形の組み合わせを採用する。また、スペク
トル歪みが一定値以下とならない場合のみ、他の組み合
わせも含めて最善の組み合わせを選定するようにしてい
る。
【0012】波形分解部4は、選択されたVCV連鎖波
形のうち、実際の合成に使用する部分すなわち先行母音
の接続位置から後続母音の接続位置までの波形につい
て、有声部分のピッチ波形に分解する。すなわち、有声
部分の音声波形についてインパルス駆動点を推定し、こ
の点を中心とする窓関数を掛けてピッチ波形を抽出して
いる。窓関数としては、ピッチ間隔の3倍の窓幅を持つ
ブラックマンハリス窓を用いている。
【0013】波形統合部5は、波形分解部4で分解され
たVCV連鎖波形を、ピッチパターン入力端子11から
入力したピッチパターンに沿って順次再配置する。この
とき、ピッチ波形の再配置間隔が元の配置間隔よりも短
くなる場合は、ピッチ波形を重複配置し、長くなる場合
は、間引きをして時間長を調整する。パワー整合部6
は、VCV連鎖波形間のパワーを整合させるためのもの
であり、接続されたVCV連鎖波形同士の接続位置の前
後において、パワーの大きい方のVCV連鎖波形のパワ
ーに小さい方のパワーを整合させるようにしている。韻
律修正部7は、接続によって得られた音声の韻律に不自
然な箇所が生じた際に、その音声のパワー包絡、ピッチ
周期および音律継続時間長を微調整して、合成音声出力
端子12から出力する。
【0014】以上のように、本実施例によれば、自然音
声データベース31のVCV連鎖波形に着目し、これら
を接続して音声を合成するようにしたので、合成に必要
なデータベースの容量が小さくて済み、したがって容易
にデータベースを構築することができる。例えば、VC
Vバランス単語音声データベースを使用すれば、500
〜1500単語のデータベースでよい。
【0015】また、本実施例によれば、VCV連鎖波形
のみを対象とすればよいので、従来の種々の音韻連鎖波
形を用いる場合に比べ、より短時間で目的の音韻連鎖波
形を検索することができる。また、合成に使用するVC
V連鎖波形を選定する際に、同一テキスト中のVCV連
鎖波形、同一位置のVCV連鎖波形を優先的に処理する
ので、効率的に必要なVCV連鎖波形を選定することが
できる。
【0016】さらに、本実施例によれば、VCV連鎖波
形の有声部分をピッチ波形に分解し、それらをピッチパ
ターンに沿って再配置して全てのVCV連鎖波形を接続
合成するようにしたので、極めて自然で明瞭な音声を合
成することができる。
【0017】
【発明の効果】本発明は、上記実施例から明らかなよう
に、自然音声データベースに含まれるVCV連鎖波形に
着目し、それらを接続して音声を合成するようにしたも
のであり、短時間で必要な波形を検索することができ
る。また、種々の音韻連鎖波形を接続する従来の合成方
法では、大容量の音声データベースを必要とし、そのデ
ータベースを特定することも困難であったが、本発明で
は、VCV連鎖波形に着目しているので、必要なデータ
ベースの容量が小さく、その特定も容易であるため、デ
ータベースを容易に構築することができる。さらに、V
CV連鎖波形の有声部分をピッチ波形列に分解し、それ
らを順次ピッチパターンに沿って再配列することによっ
て全てのVCV連鎖波形を接続合成し、その接続点での
パワーの整合および得られた音声の韻律の微調整を行な
うので、極めて自然で明瞭な音声を合成することができ
る。
【0018】本発明はまた、合成に必要なVCV連鎖波
形の最適な接続組み合わせを決定する際に、同一テキス
トに含まれるVCV連鎖波形同士の組み合わせ、および
接続順番に近い位置にあったVCV連鎖波形を優先処理
するようにしたので、少ない音声データベースから効率
的に高品質の音声を合成することができる。
【図面の簡単な説明】
【図1】本発明の一実施例における音声合成装置の構成
を示す概略ブロック図
【図2】同装置における合成に必要なVCV連鎖波形が
含まれているテキストの一例を示す一覧図
【図3】同装置におけるVCVラティスの一例を示す一
覧図
【符号の説明】
1 文字列分解処理部 2 候補検索部 3 波形選択部 4 波形分解部 5 波形統合部 6 パワー整合部 7 韻律修正部 10 文字入力端子 11 ピッチパターン入力端子 12 合成音声出力端子 21 テキストデータベース 31 自然音声データベース
フロントページの続き (72)発明者 本 多 ▲高▼ 神奈川県川崎市多摩区東三田1丁目1番 1号 明治大学理工学部内 (56)参考文献 特開 平6−318094(JP,A) 特開 平3−203798(JP,A) 特開 平3−10300(JP,A) 特開 平3−119394(JP,A) 特開 平1−284898(JP,A) 特開 平5−73092(JP,A) 特開 平1−209500(JP,A) 特開 昭63−264800(JP,A) 特開 平7−181995(JP,A) 特開 平7−92997(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 13/06 G10L 13/08

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 自然音声データベースに登録されている
    音声データから合成に必要なVCV連鎖波形の候補を切
    り出し、切り出したVCV連鎖波形から最適な接続組み
    合わせを決定し、その組み合わせの各VCV連鎖波形の
    有声音部分をピッチ波形列に分解し、分解したその組み
    合わせのVCV連鎖波形を順次ピッチパターンに沿って
    再配列することによって全てのVCV連鎖波形を接続
    し、接続されたVCV連鎖波形同士の接続点でパワーを
    整合し、接続によって得られた音声の韻律を微調整する
    ようにしたVCV連鎖波形を接続する音声合成方法。
  2. 【請求項2】 合成に必要なVCV連鎖波形の最適な接
    続組み合わせを決定する際に、同一テキストに含まれる
    VCV連鎖波形同士の組み合わせ、および接続順番に近
    い位置にあったVCV連鎖波形を優先的に処理するよう
    にした請求項1記載のVCV連鎖波形を接続する音声合
    成方法。
  3. 【請求項3】 合成すべき音声の文字列をVCV単位に
    分割して合成に必要なVCV連鎖波形の種類を特定する
    文字列分割処理部と、分割されたVCV文字列がどのテ
    キストデータベースの何番目のVCV単位と一致するか
    を検索して、合成に使用できるVCV連鎖波形の候補を
    特定して接続順にVCVラティスを構成する候補検索部
    と、VCVラティスの全ての組み合わせについて、自然
    音声データベースから読み出したVCV連鎖波形同士の
    接続箇所でのスペクトル歪みが最小となる組み合わせを
    選択する波形選択部と、選択されたVCV連鎖波形のう
    ち、実際の合成に使用する部分の波形について有声部分
    をピッチ波形に分解する波形分解部と、分解されたVC
    V連鎖波形をピッチパターンに沿って順次再配置する波
    形統合部と、接続されたVCV連鎖波形同士の接続位置
    の前後においてパワーの大きい方のVCV連鎖波形のパ
    ワーに小さい方のパワーを整合させるパワー整合部と、
    接続によって得られた音声の韻律におけるパワー包絡、
    ピッチ周期および音韻継続時間長を微調整する韻律修正
    部とを備えたVCV連鎖波形を接続する音声合成装置。
JP04042295A 1995-02-28 1995-02-28 Vcv連鎖波形を接続する音声合成方法およびその装置 Expired - Fee Related JP3233544B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04042295A JP3233544B2 (ja) 1995-02-28 1995-02-28 Vcv連鎖波形を接続する音声合成方法およびその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04042295A JP3233544B2 (ja) 1995-02-28 1995-02-28 Vcv連鎖波形を接続する音声合成方法およびその装置

Publications (2)

Publication Number Publication Date
JPH08234793A JPH08234793A (ja) 1996-09-13
JP3233544B2 true JP3233544B2 (ja) 2001-11-26

Family

ID=12580227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04042295A Expired - Fee Related JP3233544B2 (ja) 1995-02-28 1995-02-28 Vcv連鎖波形を接続する音声合成方法およびその装置

Country Status (1)

Country Link
JP (1) JP3233544B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3242331B2 (ja) * 1996-09-20 2001-12-25 松下電器産業株式会社 Vcv波形接続音声のピッチ変換方法及び音声合成装置
JP3349905B2 (ja) * 1996-12-10 2002-11-25 松下電器産業株式会社 音声合成方法および装置
JP3706112B2 (ja) * 2003-03-12 2005-10-12 独立行政法人科学技術振興機構 音声合成装置及びコンピュータプログラム
JP4574333B2 (ja) * 2004-11-17 2010-11-04 株式会社ケンウッド 音声合成装置、音声合成方法及びプログラム

Also Published As

Publication number Publication date
JPH08234793A (ja) 1996-09-13

Similar Documents

Publication Publication Date Title
CA2351842C (en) Synthesis-based pre-selection of suitable units for concatenative speech
JP3349905B2 (ja) 音声合成方法および装置
US5740320A (en) Text-to-speech synthesis by concatenation using or modifying clustered phoneme waveforms on basis of cluster parameter centroids
EP1168299B1 (en) Method and system for preselection of suitable units for concatenative speech
US20050216267A1 (en) Method and system for computer-aided speech synthesis
JPH05181491A (ja) 音声合成装置
US6477495B1 (en) Speech synthesis system and prosodic control method in the speech synthesis system
EP0942409B1 (en) Phoneme-based speech synthesis
JPH1039895A (ja) 音声合成方法および装置
US6496801B1 (en) Speech synthesis employing concatenated prosodic and acoustic templates for phrases of multiple words
US5633984A (en) Method and apparatus for speech processing
EP0831459B1 (en) Method of changing a pitch of a VCV phoneme-chain waveform and apparatus of synthesizing a sound from a series of VCV phoneme-chain waveforms
JP3233544B2 (ja) Vcv連鎖波形を接続する音声合成方法およびその装置
JP3371761B2 (ja) 氏名読み音声合成装置
JPH07319497A (ja) 音声合成装置
JP3109778B2 (ja) 音声規則合成装置
US20030018473A1 (en) Speech synthesizer and telephone set
US6847932B1 (en) Speech synthesis device handling phoneme units of extended CV
US20060178873A1 (en) Method of synthesis for a steady sound signal
JP3626398B2 (ja) テキスト音声合成装置、テキスト音声合成方法及びその方法を記録した記録媒体
JP2004354644A (ja) 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体
JPH05281984A (ja) 音声合成方法および装置
JPH08129398A (ja) テキスト解析装置
JP2002358091A (ja) 音声合成方法および音声合成装置
JP3302874B2 (ja) 音声合成方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080921

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees