JPH08234793A - Vcv連鎖波形を接続する音声合成方法およびその装置 - Google Patents

Vcv連鎖波形を接続する音声合成方法およびその装置

Info

Publication number
JPH08234793A
JPH08234793A JP7040422A JP4042295A JPH08234793A JP H08234793 A JPH08234793 A JP H08234793A JP 7040422 A JP7040422 A JP 7040422A JP 4042295 A JP4042295 A JP 4042295A JP H08234793 A JPH08234793 A JP H08234793A
Authority
JP
Japan
Prior art keywords
vcv
chain
waveform
waveforms
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7040422A
Other languages
English (en)
Other versions
JP3233544B2 (ja
Inventor
Yasuhiko Arai
居 康 彦 新
Toshimitsu Minowa
輪 利 光 蓑
Akira Mochizuki
月 亮 望
Takashi Honda
多 ▲高▼ 本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP04042295A priority Critical patent/JP3233544B2/ja
Publication of JPH08234793A publication Critical patent/JPH08234793A/ja
Application granted granted Critical
Publication of JP3233544B2 publication Critical patent/JP3233544B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 少ない音声データベースから効率的に高品質
の音声を合成する。 【構成】 文字列分割処理部1で分割された文字列が、
自然音声データベース31の内容を文字表示したテキス
トデータベース21のどこにあるかを、候補検索部2が
検索して合成に必要なVCV連鎖波形の候補を切り出
し、波形選択部3がその切り出したVCV連鎖波形から
最適な接続組み合わせを決定し、波形分解部4がその組
み合わせの各VCV連鎖波形の有声音部分をピッチ波形
列に分解し、波形統合部5がその分解した組み合わせの
VCV連鎖波形を順次ピッチパターンに沿って再配列し
て全てのVCV連鎖波形を接続し、パワー整合部6が接
続されたVCV連鎖波形同士の接続点でパワーを整合
し、韻律修正部7が接続によって得られた音声の韻律を
微調整する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自然音声データベース
を利用して音声を合成する際に、少ない音声データベー
スから高品質の音声を合成することのできるVCV(母
音−子音−母音)連鎖波形を接続する音声合成方法およ
びその装置に関するものである。
【0002】
【従来の技術】従来、音声の合成は、大量の自然音声デ
ータベースから種々の音韻連鎖波形を接続して音声を合
成するものであった。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の音声合成技術では、データベースの構築に多大の労
力を要し、また、音声合成の際に音韻連鎖波形の検索に
多くの時間がかかるという実用上の問題があった。
【0004】本発明は、上記従来の問題を解決するもの
であり、少ない音声データベースから効率的に高品質の
音声を合成する音声合成方法およびその装置を提供する
ことを目的とする。
【0005】
【課題を解決するための手段】本発明は、上記目的を達
成するために、自然音声データベースに登録されている
音声データから合成に必要なVCV連鎖波形の候補を切
り出し、切り出したVCV連鎖波形から最適な接続組み
合わせを決定し、その組み合わせの各VCV連鎖波形の
有声音部分をピッチ波形列に分解し、分解したその組み
合わせのVCV連鎖波形を順次ピッチパターンに沿って
再配列することによって全てのVCV連鎖波形を接続
し、接続されたVCV連鎖波形同士の接続点でパワーを
整合し、接続によって得られた音声の韻律を微調整する
ようにしたものである。
【0006】
【作用】本発明は、自然音声データベースに含まれるV
CV連鎖波形に着目し、それらを接続して音声を合成す
るようにしたものであり、短時間で必要な波形を検索す
ることができる。また、種々の音韻連鎖波形を接続する
従来の合成方法では、大容量の音声データベースを必要
とし、そのデータベースを特定することも困難であった
が、本発明では、VCV連鎖波形に着目しているので、
必要なデータベースの容量が小さく、その特定も容易で
あるため、データベースを容易に構築することができ
る。さらに、VCV連鎖波形の有声部分をピッチ波形列
に分解し、それらを順次ピッチパターンに沿って再配列
することによって全てのVCV連鎖波形を接続合成し、
その接続点でのパワーの整合および得られた音声の韻律
の微調整を行なうので、極めて自然で明瞭な音声を合成
することができる。
【0007】
【実施例】以下、本発明の一実施例における音声合成装
置について図面を参照しながら説明する。図1におい
て、1は文字列分割処理部、2は候補検索部、3は波形
選択部、4は波形分解部、5は波形統合部、6はパワー
整合部、7は韻律修正部である。また10は文字入力端
子、11はピッチパターン入力端子、12は合成音声出
力端子である。さらに21はテキストデータベース、3
1は自然音声データベースである。
【0008】以上のように構成された本実施例の音声合
成装置について、以下その動作を説明する。テキストデ
ータベース21は、自然音声データベース31の内容を
文字表示したものであり、文字列をキーとして、その文
字列に対応する音声波形が読み出されるように構成され
ている。また、自然音声データベース31には、母音の
定常区間を示すマーカーを付加しておき、文字列をキー
としてその文字列に対応する音声波形を読み出すとき
に、先行母音の定常部開始マークから後続母音の定常部
終了マークまでが読み出せるようになっている。
【0009】合成すべき音声の文字列を文字入力端子1
0から入力し、その文字列を文字列分割処理部1でVC
V単位に分割して、合成に必要なVCV連鎖波形の種類
を特定する。例えば、単語音声「横浜市」を合成する場
合、文字入力端子10から“yokohamasi”と入力する
と、文字列分割処理部1で“ yo oko oha ama ashi”の
ように分割する。
【0010】候補検索部2は、テキストデータベース2
1から、文字列分割処理部1で分割されたVCV文字列
がどのテキストの何番目のVCV単位と一致するかを検
索して、合成に使用できるVCV連鎖波形の候補を特定
し、接続順にVCVラティスを構成する。図2は“ yok
ohamashi”を合成する場合を例として、必要なVCV連
鎖波形が含まれているテキストの一覧を示している。図
2において、(Tm,Vn)はVCV連鎖波形のインデック
スであり、Tmはテキスト番号、VnはVCV番号を示して
いる。また、図3は図2のインデックス(Tm,Vn)を用
いてVCVラティスを構成した例を示す。
【0011】波形選択部3は、VCVラティスの全ての
組み合わせについて、自然音声データベース31から読
み出したVCV連鎖波形同士の接続箇所でのスペクトル
歪みが最小となる組み合わせを選択する。このとき、同
じテキストから切り出されたVCV連鎖波形、接続順番
と同じ順番またはそれに近い順番にあるVCV連鎖波形
を優先して処理するようにしている。図3の例では、 yo は (T1,V1) oko は (T1,V2) oha は (T4,V3) ama は (T2,V3) ashi は (T1,V5) の組み合わせを優先して、スペクトル歪みを計算する。
スペクトル歪みは、接続母音同士の定常区間で計算し、
スペクトル歪みが最小となる位置で接続する。接続位置
でのスペクトル歪みが全て一定値以下となるとき、その
VCV連鎖波形の組み合わせを採用する。また、スペク
トル歪みが一定値以下とならない場合のみ、他の組み合
わせも含めて最善の組み合わせを選定するようにしてい
る。
【0012】波形分解部4は、選択されたVCV連鎖波
形のうち、実際の合成に使用する部分すなわち先行母音
の接続位置から後続母音の接続位置までの波形につい
て、有声部分のピッチ波形に分解する。すなわち、有声
部分の音声波形についてインパルス駆動点を推定し、こ
の点を中心とする窓関数を掛けてピッチ波形を抽出して
いる。窓関数としては、ピッチ間隔の3倍の窓幅を持つ
ブラックマンハリス窓を用いている。
【0013】波形統合部5は、波形分解部4で分解され
たVCV連鎖波形を、ピッチパターン入力端子11から
入力したピッチパターンに沿って順次再配置する。この
とき、ピッチ波形の再配置間隔が元の配置間隔よりも短
くなる場合は、ピッチ波形を重複配置し、長くなる場合
は、間引きをして時間長を調整する。パワー整合部6
は、VCV連鎖波形間のパワーを整合させるためのもの
であり、接続されたVCV連鎖波形同士の接続位置の前
後において、パワーの大きい方のVCV連鎖波形のパワ
ーに小さい方のパワーを整合させるようにしている。韻
律修正部7は、接続によって得られた音声の韻律に不自
然な箇所が生じた際に、その音声のパワー包絡、ピッチ
周期および音律継続時間長を微調整して、合成音声出力
端子12から出力する。
【0014】以上のように、本実施例によれば、自然音
声データベース31のVCV連鎖波形に着目し、これら
を接続して音声を合成するようにしたので、合成に必要
なデータベースの容量が小さくて済み、したがって容易
にデータベースを構築することができる。例えば、VC
Vバランス単語音声データベースを使用すれば、500
〜1500単語のデータベースでよい。
【0015】また、本実施例によれば、VCV連鎖波形
のみを対象とすればよいので、従来の種々の音韻連鎖波
形を用いる場合に比べ、より短時間で目的の音韻連鎖波
形を検索することができる。また、合成に使用するVC
V連鎖波形を選定する際に、同一テキスト中のVCV連
鎖波形、同一位置のVCV連鎖波形を優先的に処理する
ので、効率的に必要なVCV連鎖波形を選定することが
できる。
【0016】さらに、本実施例によれば、VCV連鎖波
形の有声部分をピッチ波形に分解し、それらをピッチパ
ターンに沿って再配置して全てのVCV連鎖波形を接続
合成するようにしたので、極めて自然で明瞭な音声を合
成することができる。
【0017】
【発明の効果】本発明は、上記実施例から明らかなよう
に、自然音声データベースに含まれるVCV連鎖波形に
着目し、それらを接続して音声を合成するようにしたも
のであり、短時間で必要な波形を検索することができ
る。また、種々の音韻連鎖波形を接続する従来の合成方
法では、大容量の音声データベースを必要とし、そのデ
ータベースを特定することも困難であったが、本発明で
は、VCV連鎖波形に着目しているので、必要なデータ
ベースの容量が小さく、その特定も容易であるため、デ
ータベースを容易に構築することができる。さらに、V
CV連鎖波形の有声部分をピッチ波形列に分解し、それ
らを順次ピッチパターンに沿って再配列することによっ
て全てのVCV連鎖波形を接続合成し、その接続点での
パワーの整合および得られた音声の韻律の微調整を行な
うので、極めて自然で明瞭な音声を合成することができ
る。
【0018】本発明はまた、合成に必要なVCV連鎖波
形の最適な接続組み合わせを決定する際に、同一テキス
トに含まれるVCV連鎖波形同士の組み合わせ、および
接続順番に近い位置にあったVCV連鎖波形を優先処理
するようにしたので、少ない音声データベースから効率
的に高品質の音声を合成することができる。
【図面の簡単な説明】
【図1】本発明の一実施例における音声合成装置の構成
を示す概略ブロック図
【図2】同装置における合成に必要なVCV連鎖波形が
含まれているテキストの一例を示す一覧図
【図3】同装置におけるVCVラティスの一例を示す一
覧図
【符号の説明】
1 文字列分解処理部 2 候補検索部 3 波形選択部 4 波形分解部 5 波形統合部 6 パワー整合部 7 韻律修正部 10 文字入力端子 11 ピッチパターン入力端子 12 合成音声出力端子 21 テキストデータベース 31 自然音声データベース
───────────────────────────────────────────────────── フロントページの続き (72)発明者 本 多 ▲高▼ 神奈川県川崎市多摩区東三田1丁目1番1 号 明治大学理工学部内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 自然音声データベースに登録されている
    音声データから合成に必要なVCV連鎖波形の候補を切
    り出し、切り出したVCV連鎖波形から最適な接続組み
    合わせを決定し、その組み合わせの各VCV連鎖波形の
    有声音部分をピッチ波形列に分解し、分解したその組み
    合わせのVCV連鎖波形を順次ピッチパターンに沿って
    再配列することによって全てのVCV連鎖波形を接続
    し、接続されたVCV連鎖波形同士の接続点でパワーを
    整合し、接続によって得られた音声の韻律を微調整する
    ようにしたVCV連鎖波形を接続する音声合成方法。
  2. 【請求項2】 合成に必要なVCV連鎖波形の最適な接
    続組み合わせを決定する際に、同一テキストに含まれる
    VCV連鎖波形同士の組み合わせ、および接続順番に近
    い位置にあったVCV連鎖波形を優先的に処理するよう
    にした請求項1記載のVCV連鎖波形を接続する音声合
    成方法。
  3. 【請求項3】 合成すべき音声の文字列をVCV単位に
    分割して合成に必要なVCV連鎖波形の種類を特定する
    文字列分割処理部と、分割されたVCV文字列がどのテ
    キストデータベースの何番目のVCV単位と一致するか
    を検索して、合成に使用できるVCV連鎖波形の候補を
    特定して接続順にVCVラティスを構成する候補検索部
    と、VCVラティスの全ての組み合わせについて、自然
    音声データベースから読み出したVCV連鎖波形同士の
    接続箇所でのスペクトル歪みが最小となる組み合わせを
    選択する波形選択部と、選択されたVCV連鎖波形のう
    ち、実際の合成に使用する部分の波形について有声部分
    をピッチ波形に分解する波形分解部と、分解されたVC
    V連鎖波形をピッチパターンに沿って順次再配置する波
    形統合部と、接続されたVCV連鎖波形同士の接続位置
    の前後においてパワーの大きい方のVCV連鎖波形のパ
    ワーに小さい方のパワーを整合させるパワー整合部と、
    接続によって得られた音声の韻律におけるパワー包絡、
    ピッチ周期および音韻継続時間長を微調整する韻律修正
    部とを備えたVCV連鎖波形を接続する音声合成装置。
JP04042295A 1995-02-28 1995-02-28 Vcv連鎖波形を接続する音声合成方法およびその装置 Expired - Fee Related JP3233544B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04042295A JP3233544B2 (ja) 1995-02-28 1995-02-28 Vcv連鎖波形を接続する音声合成方法およびその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04042295A JP3233544B2 (ja) 1995-02-28 1995-02-28 Vcv連鎖波形を接続する音声合成方法およびその装置

Publications (2)

Publication Number Publication Date
JPH08234793A true JPH08234793A (ja) 1996-09-13
JP3233544B2 JP3233544B2 (ja) 2001-11-26

Family

ID=12580227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04042295A Expired - Fee Related JP3233544B2 (ja) 1995-02-28 1995-02-28 Vcv連鎖波形を接続する音声合成方法およびその装置

Country Status (1)

Country Link
JP (1) JP3233544B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0831459A2 (en) * 1996-09-20 1998-03-25 Matsushita Electric Industrial Co., Ltd. Method of changing a pitch of a VCV phoneme-chain waveform and apparatus of synthesizing a sound from a series of VCV phoneme-chain waveforms
EP0848372A2 (en) * 1996-12-10 1998-06-17 Matsushita Electric Industrial Co., Ltd. Speech synthesizing system and redundancy-reduced waveform database therefor
JP2004279436A (ja) * 2003-03-12 2004-10-07 Japan Science & Technology Agency 音声合成装置及びコンピュータプログラム
JP2006145691A (ja) * 2004-11-17 2006-06-08 Kenwood Corp 音声合成装置、音片記憶装置、音片記憶装置製造装置、音声合成方法、音片記憶装置製造方法及びプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0831459A2 (en) * 1996-09-20 1998-03-25 Matsushita Electric Industrial Co., Ltd. Method of changing a pitch of a VCV phoneme-chain waveform and apparatus of synthesizing a sound from a series of VCV phoneme-chain waveforms
EP0831459A3 (en) * 1996-09-20 1998-11-18 Matsushita Electric Industrial Co., Ltd. Method of changing a pitch of a VCV phoneme-chain waveform and apparatus of synthesizing a sound from a series of VCV phoneme-chain waveforms
US5950152A (en) * 1996-09-20 1999-09-07 Matsushita Electric Industrial Co., Ltd. Method of changing a pitch of a VCV phoneme-chain waveform and apparatus of synthesizing a sound from a series of VCV phoneme-chain waveforms
EP0848372A2 (en) * 1996-12-10 1998-06-17 Matsushita Electric Industrial Co., Ltd. Speech synthesizing system and redundancy-reduced waveform database therefor
EP0848372A3 (en) * 1996-12-10 1999-02-17 Matsushita Electric Industrial Co., Ltd. Speech synthesizing system and redundancy-reduced waveform database therefor
US6125346A (en) * 1996-12-10 2000-09-26 Matsushita Electric Industrial Co., Ltd Speech synthesizing system and redundancy-reduced waveform database therefor
JP2004279436A (ja) * 2003-03-12 2004-10-07 Japan Science & Technology Agency 音声合成装置及びコンピュータプログラム
JP2006145691A (ja) * 2004-11-17 2006-06-08 Kenwood Corp 音声合成装置、音片記憶装置、音片記憶装置製造装置、音声合成方法、音片記憶装置製造方法及びプログラム
JP4574333B2 (ja) * 2004-11-17 2010-11-04 株式会社ケンウッド 音声合成装置、音声合成方法及びプログラム

Also Published As

Publication number Publication date
JP3233544B2 (ja) 2001-11-26

Similar Documents

Publication Publication Date Title
CA2351842C (en) Synthesis-based pre-selection of suitable units for concatenative speech
JP3349905B2 (ja) 音声合成方法および装置
JP3587048B2 (ja) 韻律制御方法及び音声合成装置
JPH1039895A (ja) 音声合成方法および装置
US6496801B1 (en) Speech synthesis employing concatenated prosodic and acoustic templates for phrases of multiple words
JPH08234793A (ja) Vcv連鎖波形を接続する音声合成方法およびその装置
JPH0887297A (ja) 音声合成システム
JPH07319497A (ja) 音声合成装置
JP4170819B2 (ja) 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体
JP3626398B2 (ja) テキスト音声合成装置、テキスト音声合成方法及びその方法を記録した記録媒体
KR970002706A (ko) 한국어 텍스트/음성 변환 방법
Pitrelli et al. Expressive speech synthesis using American English ToBI: questions and contrastive emphasis
JPH06318094A (ja) 音声規則合成装置
JP2001100776A (ja) 音声合成装置
JP3378448B2 (ja) 音声素片選択方法,音声合成装置,及び命令記憶媒体
JP3310217B2 (ja) 音声合成方法とその装置
JP3302874B2 (ja) 音声合成方式
JPH0863187A (ja) 音声合成装置
JP2002358091A (ja) 音声合成方法および音声合成装置
JPH11231899A (ja) 音声・動画像合成装置及び音声・動画像データベース
JP2001117577A (ja) 音声合成装置
Heggtveit et al. Intonation Modelling with a Lexicon of Natural F0 Contours
JPH0573092A (ja) 音声合成方式
JPH1097290A (ja) 音声合成装置
JPH0756589A (ja) 音声合成方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080921

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees