JPH06266390A - 波形編集型音声合成装置 - Google Patents

波形編集型音声合成装置

Info

Publication number
JPH06266390A
JPH06266390A JP5049321A JP4932193A JPH06266390A JP H06266390 A JPH06266390 A JP H06266390A JP 5049321 A JP5049321 A JP 5049321A JP 4932193 A JP4932193 A JP 4932193A JP H06266390 A JPH06266390 A JP H06266390A
Authority
JP
Japan
Prior art keywords
waveform
voice
speech
information
waveform information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5049321A
Other languages
English (en)
Other versions
JP2782147B2 (ja
Inventor
Kenzo Ito
憲三 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5049321A priority Critical patent/JP2782147B2/ja
Publication of JPH06266390A publication Critical patent/JPH06266390A/ja
Priority to US08/852,705 priority patent/US5740320A/en
Application granted granted Critical
Publication of JP2782147B2 publication Critical patent/JP2782147B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【目的】 滑らかで肉声に近い合成音声を得る。 【構成】 音声単位の集合を、音声信号の周波数スペク
トルを特徴パラメータとしてクラスタリングし、その各
グループの重心に最も近い音声波形を音声データベース
13から選出したものと、その各重心でのスペクトル
(基準スペクトル)と、その各音声波形のピッチマーク
とを組として波形情報記憶装置17に記憶しておき、入
力テキストを音韻系列とし、その各音韻と対応する音声
波形、基準スペクトル、ピッチマークを波形情報記憶装
置17から選出し、その波形情報を、そのスペクトルが
基準スペクトルに近づくようにスペクトル特性変更回路
36でスペクトル変更し、その変更された波形を波形合
成回路23へ供給して従来と同様にピッチ、パワーを継
続長を制御して音声合成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は規則によって任意の音
声語を合成する装置に適用され、波形情報を用いて音声
を合成する波形編集型音声合成装置に関する。
【0002】
【従来の技術】種々の音声単位をあらかじめ蓄積してお
き、それらを接続して連続音声を合成する方式におい
て、肉声に近い高品質の合成音声を生成するためには、
その基本となる音声分析合成方式や、音声単位の選択方
法および種々の音響パラメータの制御規則が重要とな
る。
【0003】従来、音声信号の分析合成方法には、音声
の音響的特徴パラメータの操作性に優れた線形予測分析
(LPC分析)を基本とする、PARCOR方式(特願
54−128366)やLSP方式(特許 第1226
588)などがよく用いられていた。しかし、これらの
方式は、情報量の圧縮を主な目的とするために、駆動音
源信号を単純なパルス発生器と雑音発生器で実現してい
た。その結果、得られる分析合成音が肉声とかなりかけ
離れたものになる場合があった。
【0004】そこで、この駆動音源信号を波形歪最少基
準によって符号化する高能率音声符号化復号化方式が提
案されているが、この方式は、元の音声信号波形と復号
化された信号波形の間の波形歪を最少にすることによっ
て実現しているため、基本周期や音声単位の時間長など
種々の音声特徴量を自由に制御できない。このため、こ
れらの高能率音声符号化方式をそのまま音声の規則合成
装置に適用することが出来ない欠点がある。
【0005】一方、音声単位を波形情報としてそのまま
蓄積しておき、それを必要に応じて取り出し、接続して
目的の連続音声を合成する、いわゆる波形編集型音声合
成方式がある。図5に規則合成法の一種である従来の波
形編集型の音声合成装置を示す。規則合成装置は分析部
11と合成部12とからなり、分析部11では音声デー
タベース13に音韻ラベリングされた多量の音声データ
が蓄積されてあり、この音声データを周波数分析部14
で周波数分析して音声の周波数スペクトル特性を得る。
この周波数スペクトル分析には例えば公知のLPC分析
法を利用するとよい。この音声の周波数スペクトル特性
データをクラスタリング回路15で統計処理して各音韻
の代表スペクトル(基準スペクトル)と基準点(セント
ロイド)とを得る。この場合音韻環境を考慮したCOC
(Context Orientoted Class
aring)クラスタリング手法が有効である。つまり
例えば音声データ中の「akai」中の同一音韻「a」
について、1番目の「a」は単語の最初に現われかつ後
の音韻が「k」である音韻環境の「a」の波形(音声単
位)を選択して統計的処理を行い、2番目の「a」につ
いては前後の音韻が「k」「i」の音韻環境の「a」の
波形を選択して統計的処理を行う。
【0006】各音韻環境を考慮した各音韻のスペクトル
特性空間のセントロイドに最も近い音声単位の波形情報
を、候補音声単位選択回路16で音声データベース13
の音声データ中から選択して波形情報記憶装置17に蓄
積する。合成部12においては、入力端子18から与え
られた合成テキストをテキスト解析回路19で解析して
音韻系列を得、またこの音韻系列をもとにピッチパタン
(音声基本周期)や音声単位継続時間長、および音声パ
ワーを韻律情報設定回路21で設定する。例えば入力テ
キスト「赤い家が……」が入力されると、音韻系列「a
kai iega……」を得、ピッチパタンとして例え
ば図6Aに示すように各音韻ごとのピッチ周波数と音韻
間でのピッチ周波数の連続性とを考慮したパタンを得、
かつその各音韻に対する音韻継続時間Tsを得、また図
6Bに示すように各音韻ごとのパワーと音韻間でのその
連続性を考慮したパタンを出力する。
【0007】テキスト解析回路19で得られた音韻系列
から、合成に用いる音声単位を合成単位選択回路22で
決定し、その決定した音声単位の音声波形情報を波形情
報記憶装置17から選択する。つまり前記例の「aka
i」の2番目の「a」の場合は前後の音韻が「k」
「i」の音韻環境をもつ「a」の音声波形情報を選択す
る。この選択された音声波形情報を波形合成回路23
で、韻律情報設定回路21から与えられたピッチパタン
の各基本周期に同期させ、かつ与えられた音韻継続時間
の長さとし、また与えられた大きさのパワーとして順次
波形重畳して合成音声を得て出力端子24に出力する。
例えば図6A,Bと対応して図6Cに示す合成音声波形
を得る。
【0008】
【発明が解決しようとする課題】この波形編集型音声合
成装置によれば前述した音声分析合成方式と比較して蓄
積すべき情報量は増加するものの、合成音声の品質はよ
り肉声に近くなる。しかしこのような波形編集型合成方
式では、波形情報のみをそのまま用いると滑らかな合成
音声が得られない場合が生じ、結果的に合成音声の品質
に劣化をきたすことが多く、音声単位の接続点でなんら
かの補間処理(特願平3−44928)や、上述したよ
うな音韻環境を考慮した音声単位生成法(特開平1−7
8300)が必要であった。従って、さらに合成音声の
品質を向上するためには音声の特徴量として音声単位の
周波数スペクトル特性を積極的に変更し、音声単位の周
波数スペクトル特性が連続的に滑らかになるように接続
する必要がある。しかし、音声信号波形に対し、その周
波数スペクトル特性に変更を加えることは非常に難し
い。従来、音声の周波数スペクトルを積極的に変形した
り、修正する方法は色々と試みられているが、処理を行
うことによって処理後の品質が劣化したり雑音が重畳す
る傾向にあった。その中で、音声波形を周波数領域で変
更する方法(都木他、信学技報、SP87−111(1
988−01))が提案されており、品質の良い処理音
声が得られている。しかし、この方法は、基本周期の変
更処理を行う場合や音韻長制御処理に複雑な波形処理が
必要であり、また、変更量が大きい場合には処理品質が
劣化する欠点がある。
【0009】
【課題を解決するための手段】請求項1の発明によれば
波形編集型音声合成装置において、波形情報記憶装置に
はクラスタリングで得られた対応する音声単位の音声波
形情報の他に、その音声波形情報ごとにこれを選択する
基準となった基準スペクトルもそれぞれ記憶され、その
波形情報記憶装置から音声波形情報が選出される際に対
応する基準スペクトルも選出され、その選出された音声
波形情報及び基準スペクトルについて前者のスペクトル
が後者のスペクトルに近づくようにスペクトル特性変更
手段により変更され、そのスペクトル変更された音声波
形情報が波形合成手段へ供給される。
【0010】請求項2の発明によれば、請求項1の発明
においてスペクトル変更された音声波形情報が波形情報
記憶装置に予め記憶され、これより選出された音声波形
情報が波形合成手段へ供給される。請求項3の発明によ
れば波形情報記憶装置には、各音声波形情報ごとにその
音声波形の音声基本周期(ピッチ周期)に関する情報も
記憶されてあり、音声波形情報の選出時に、韻律情報中
の音声基本周期に近い基本周期に関する情報をもつもの
が選出される。
【0011】
【作用】図2Aに一例として、音声単位の集合を音声信
号の周波数スペクトルを特徴パラメータにしてクラスタ
リングした結果の概念図を示す。同図でクラスタリング
によって得られた音声単位のグループ26のセントロイ
ド(重心)27はこのグループの平均的な周波数スペク
トル特性を有している。しかし、セントロイド27の点
における周波数スペクトル特性を有する音声信号波形
は、実存しないものである。そこで、セントロイド27
に最も周波数スペクトル特性が近い音声単位28がその
グループ26を代表する音声波形情報として用いられ
る。このため合成音声波形の周波数スペクトルの軌跡は
例えば図2Bに示すように、スペクトル特徴空間aから
b,…dへと移動する際に破線29で示すようになり、
グループ化されたセントロイドの周波数スペクトル(基
準スペクトル)を通るものでなく、正しくグループを代
表していないため、一つの音声単位波形から次の音声単
位波形への移動が滑らかに行われず、それだけ不自然な
ものとなる。
【0012】しかし、この発明では各音声単位グループ
26のセントロイド26の基準スペクトルに、その最も
近い音声信号波形(従来の波形情報)のスペクトルが近
ずくように音声信号波形を変更しているため、そのグル
ープを正しく代表するものとなっており、従って図2B
の実線31に示すようにこの発明で処理された合成音声
波形の周波数スペクトル特性の軌跡はスペクトル特徴空
間aからスペクトル特徴空間bおよびcを通ってスペク
トル特徴空間dへ滑らかに移動する。従って、このよう
に処理された音声波形を接続することによって滑らかで
自然な合成音声が期待できる。
【0013】なお、前述したように、従来技術における
スペクトル特性の変形処理では、変更量が大きいと処理
品質に劣化をきたしていた。そこでこの発明では、変更
量が大きい場合には、この処理を目的の周波数スペクト
ル特性へ除々に変更していくようにして品質を劣化させ
ることを防止し、更に、あらかじめ音声波形情報に付与
した基本周期に関する情報を利用してその基本周期に同
期してスペクトル変更を行うことにより処理は格段に簡
略化され、得られる合成音声の品質もピッチ周期の誤抽
出などによる劣化は無いようにすることも可能である。
【0014】
【実施例】図1にこの発明の実施例を示し、図5と対応
する部分に同一符号を付けてある。この発明ではクラス
タリング回路15でクラスタリング処理され、その各グ
ループ代表である基準スペクトルも波形情報記憶装置1
7に記憶される。またこの実施例では候補音声単位選択
回路16で音声データベース13の中から選択された候
補音声単位波形の音声基本周期に関する情報がピッチマ
ーク付与回路34で取出される。音声基本周期に関する
情報は例えば音声基本周期の基準位置を示すマーク、い
わゆるピッチマークであり、図3に示すような音声波形
の場合、その隣接大ピークの間隔が基本周期Tpであ
り、音声波形の各大ピークの時間的位置を示すマーク
(情報)Mpが基本周期マーク(ピッチマーク)であ
る。波形情報記憶装置17へは従来と同様に各候補音声
信号(音声単位)の波形情報が記憶される他にこの例で
は前述したように、その各波形情報と対応する基準スペ
クトル特性Htとピッチマーク情報とを蓄積する。
【0015】合成過程において、合成単位選択回路22
で選択された各音声単位の波形情報はそれに該当する音
声単位の基準スペクトル特性を用いてこれにその音声波
形情報のスペクトル特性が近づくようにスペクトル特性
変更回路36で変更する。この音声波形情報を波形合成
回路23へ供給する。スペクトル特性変更回路36の処
理概要を図4に示す。合成単位選択回路22で選択され
た各音声信号波形情報と、それと対をなす基準スペクト
ル特性Htおよびピッチマーク情報が入力されると共
に、スペクトル歪のしきい値Thを入力し、スペクトル
特性変更量dtと変更繰り返し回数Nとを次式で計算す
る(S0)。
【0016】即ち音声波形情報が線形予測分析され(S
1 )、得られるLPC係数を〔α〔i〕,i=1,p〕
とすれば、1回の変更量dt〔i〕は(1)式で求めら
れ、変更繰り返し回数Nは(2)式で表わされる。 dt(i)=〔αt(i)−α0 (i)〕/N (i=1…p) (1) N=〔Σ{Ct(i)−C0 (i)}2 〕/Th (2) Σはi=1からpまで、Dt=N・dt(i) ここで、αt(i)とα0 (i)はそれぞれ基準スペク
トル特性と選択された音声単位波形情報とから求められ
る線形予測係数、Ct(i)とC0 (i)はそれぞれ基
準スペクトルと選択された音声波形情報のLPCケプス
トラム係数、pは予測次数を表わす。しきい値Thは総
量的特性で決まる値であり、大き過ぎると歪が大とな
る。Nが1より大かがチェックされ(S2 )、N=1の
条件であれば基準スペクトル特性HtをSt=Htとし
(S3 )、N>1の条件であればSt=Ht+dtとす
る(S4 )。
【0017】一方、音声信号波形情報はピッチマーク情
報を用いて、音声基本周期に同期して切り出し(S5
I=1とした後(S6 )、切り出した波形情報を高速フ
ーリエ変換(FFT)で周波数分析して周波数スペクト
ルF0 を得る(S7 )。この時、(3)式で示すような
窓関数W(i)を音声信号波形に乗じて切り出す。 W(i)=0.5−0.5cos (2πi/L) (i=0 …L) (3) ここで、Lは合成すべき音声の基本周期をTpとした
時、L=2Tpで与えられる。この窓関数は、周波数分
析の精度向上と波形合成回路23で基本周期波形重畳の
際に波形歪を軽減する作用がある。スペクトル特性変更
処理ステップS8 では、前述したF0 と、音声信号波形
情報のスペクトル包絡特性H0 およびスペクトル包絡特
性Stとを用いて新しい周波数スペクトル特性Fnを
(4)式で得る。
【0018】 Fn=F0 *{St/H0 } (4) ここで、FnおよびF0 で示される周波数スペクトル
は、その絶対値を表わし、位相情報は元の信号の値を用
いる。得られたFnは逆フーリエ変換(IFTT)で信
号波形に再生される(S9 )。このスペクトル変更処理
は繰り返しカウンタIがNに等しくなるまで、St=S
t+dtとして繰り返す。つまりI>Nでなければ(S
10)、Stにdtを加えてStとして(S11)、またス
テップS9 で逆フーリエ変換された再生波形情報はステ
ップS1 に戻されてそのスペクトル包絡特性H0 が求め
られると共に、ステップS7 にも戻されて周波数スペク
トルF 0 が求められ、これらは新たなH0 とF0 とステ
ップS11のStとからステップS8 でスペクトル変更処
理がなされる。ステップS10でIがNを越えると、ステ
ップS9 て得られた再生波形情報が出力される
(S12)。
【0019】なお、スペクトル変更量dtと繰り返し回
数Nは、分析過程の段階で前もって計算し、波形情報記
憶装置17へ蓄積しておき、合成過程での演算処理量を
軽減することも可能であるが、装置化する場合の記憶装
置の容量や演算処理能力との兼ね合いとなる。上述にお
いて、波形情報記憶装置17に、候補音声単位選択回路
16で選択された音声波形を記憶することなく、その各
選択された音声波形について図4に示したスペクトル変
更処理を施して、対応基準スペクトルをもつ音声波形に
変更し、つまりクラスタリングの各グループのセントロ
イドにおける基準スペクトルをもつ音声波形として波形
情報記憶装置17に記憶しておけば、合成部12におけ
る演算処理量を少くすることができる。
【0020】また波形情報記憶装置17にピッチマーク
情報をも記憶しておくことにより、前述したようにスペ
クトル特性変更回路36で音声波形をピッチ周期で切り
出すことにより、より正しくスペクトル特性変更を行う
ことができるが、合成単位選択回路22で波形情報を選
択する際に、韻律情報設定回路21からの合成音声のピ
ッチ周期に近い波形情報を選択することにより合成音声
の品質を更に高めることができる。つまり同一音韻環境
の音声単位波形情報でも、そのピッチ周期が大きく異な
るものについてはその代表的なものをいくつか記憶して
おき、この中からピッチ周期が近いものを選択する。
【0021】
【発明の効果】以上で説明したように、この発明によれ
ば音声合成装置において、クラスタリングした音声単位
の波形情報をそれぞれ、そのセントロイドの基準スペク
トルに近ずけるようにスペクトル変更するため滑らかで
肉声に近い合成音声を比較的簡単な処理で実現できる。
【図面の簡単な説明】
【図1】請求項1の発明の実施例を示すブロック図。
【図2】Aはクラスタリング結果の一例を示す概念図、
Bは合成音声のスペクトル特性の軌跡を説明する図であ
る。
【図3】ピッチマークを説明する図。
【図4】スペクトル特性変更処理を説明するフローチャ
ート。
【図5】従来の波形編集型音声合成装置を示すブロック
図。
【図6】合成ピッチパタン、パワーパタン、合成音声波
形の各例を示す図。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力テキストを分析して音韻系列と韻律
    情報とを得、その音韻系列の各音韻により、波形情報記
    憶装置からクラスタリングで得られた対応する音声単位
    の音声波形情報を選出し、その音声波形情報に対し波形
    合成手段で上記韻律情報に基づく制御を行って、音声波
    形情報単位ごとに接続して連続音声を生成する波形編集
    型音声合成装置において、 上記波形情報記憶装置には各音声波形情報ごとに、これ
    を選択する基準となった基準スペクトルもそれぞれ記憶
    されてあり、 上記波形情報記憶装置から音声波形情報が選出される時
    に対応する上記基準スペクトルも選出され、 これら選出された音声波形情報及び基準スペクトルにつ
    いて前者のスペクトルが後者のスペクトルに近づくよう
    にスペクトル特性変更手段により変更され、そのスペク
    トル変更された音声波形情報が上記波形合成手段へ供給
    される、 ことを特徴とする波形編集型音声合成装置。
  2. 【請求項2】 入力テキストを分析して音韻系列と韻律
    情報とを得、その音韻系列の各音韻により、波形情報記
    憶装置からクラスタリングで得られた対応する音声単位
    の音声波形情報を選出し、その音声波形情報に対し波形
    合成手段で上記韻律情報に基づく制御を行って、音声波
    形情報単位ごとに接続して連続音声を生成する波形編集
    型音声合成装置において、 上記波形情報記憶装置に記憶されている各音声波形情報
    は、上記クラスタリングで求めた音声単位の音声波形情
    報のスペクトルを、その音声波形情報を選択する基準と
    なった基準スペクトルに近づけるようにスペクトル変更
    した音声波形情報であることを特徴とする波形編集型音
    声合成装置。
  3. 【請求項3】 上記波形情報記憶装置には、その各音声
    波形情報ごとにその音声波形の音声基本周期に関する情
    報も記憶されており、上記音声波形情報の選出時に上記
    韻律情報中の音声基本周期に近い上記基本周期に関する
    情報をもつものが選出されることを特徴とする請求項1
    又は2記載の波形編集型音声合成装置。
JP5049321A 1993-03-10 1993-03-10 波形編集型音声合成装置 Expired - Fee Related JP2782147B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP5049321A JP2782147B2 (ja) 1993-03-10 1993-03-10 波形編集型音声合成装置
US08/852,705 US5740320A (en) 1993-03-10 1997-05-07 Text-to-speech synthesis by concatenation using or modifying clustered phoneme waveforms on basis of cluster parameter centroids

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5049321A JP2782147B2 (ja) 1993-03-10 1993-03-10 波形編集型音声合成装置

Publications (2)

Publication Number Publication Date
JPH06266390A true JPH06266390A (ja) 1994-09-22
JP2782147B2 JP2782147B2 (ja) 1998-07-30

Family

ID=12827714

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5049321A Expired - Fee Related JP2782147B2 (ja) 1993-03-10 1993-03-10 波形編集型音声合成装置

Country Status (2)

Country Link
US (1) US5740320A (ja)
JP (1) JP2782147B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010237323A (ja) * 2009-03-30 2010-10-21 Toshiba Corp 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240384B1 (en) 1995-12-04 2001-05-29 Kabushiki Kaisha Toshiba Speech synthesis method
US6081781A (en) * 1996-09-11 2000-06-27 Nippon Telegragh And Telephone Corporation Method and apparatus for speech synthesis and program recorded medium
US6490562B1 (en) 1997-04-09 2002-12-03 Matsushita Electric Industrial Co., Ltd. Method and system for analyzing voices
JPH1138989A (ja) * 1997-07-14 1999-02-12 Toshiba Corp 音声合成装置及び方法
JP3667950B2 (ja) * 1997-09-16 2005-07-06 株式会社東芝 ピッチパターン生成方法
JP3644263B2 (ja) * 1998-07-31 2005-04-27 ヤマハ株式会社 波形形成装置及び方法
JP2000075878A (ja) * 1998-08-31 2000-03-14 Canon Inc 音声合成装置およびその方法ならびに記憶媒体
US7369994B1 (en) 1999-04-30 2008-05-06 At&T Corp. Methods and apparatus for rapid acoustic unit selection from a large speech corpus
US6725190B1 (en) * 1999-11-02 2004-04-20 International Business Machines Corporation Method and system for speech reconstruction from speech recognition features, pitch and voicing with resampled basis functions providing reconstruction of the spectral envelope
JP2001265375A (ja) * 2000-03-17 2001-09-28 Oki Electric Ind Co Ltd 規則音声合成装置
DE60127274T2 (de) * 2000-09-15 2007-12-20 Lernout & Hauspie Speech Products N.V. Schnelle wellenformsynchronisation für die verkettung und zeitskalenmodifikation von sprachsignalen
AU2002212992A1 (en) * 2000-09-29 2002-04-08 Lernout And Hauspie Speech Products N.V. Corpus-based prosody translation system
GB0113581D0 (en) * 2001-06-04 2001-07-25 Hewlett Packard Co Speech synthesis apparatus
CN1234109C (zh) * 2001-08-22 2005-12-28 国际商业机器公司 语调生成方法、语音合成装置、语音合成方法及语音服务器
JP2003108178A (ja) * 2001-09-27 2003-04-11 Nec Corp 音声合成装置及び音声合成用素片作成装置
US7010488B2 (en) * 2002-05-09 2006-03-07 Oregon Health & Science University System and method for compressing concatenative acoustic inventories for speech synthesis
US20040030555A1 (en) * 2002-08-12 2004-02-12 Oregon Health & Science University System and method for concatenating acoustic contours for speech synthesis
WO2004109659A1 (ja) * 2003-06-05 2004-12-16 Kabushiki Kaisha Kenwood 音声合成装置、音声合成方法及びプログラム
US7487092B2 (en) * 2003-10-17 2009-02-03 International Business Machines Corporation Interactive debugging and tuning method for CTTS voice building
CN1674092B (zh) * 2004-03-26 2010-06-09 松下电器产业株式会社 连续数字识别的声韵母跨词建模、解码方法及系统
US7869999B2 (en) * 2004-08-11 2011-01-11 Nuance Communications, Inc. Systems and methods for selecting from multiple phonectic transcriptions for text-to-speech synthesis
JP4328698B2 (ja) * 2004-09-15 2009-09-09 キヤノン株式会社 素片セット作成方法および装置
US20060161433A1 (en) * 2004-10-28 2006-07-20 Voice Signal Technologies, Inc. Codec-dependent unit selection for mobile devices
US20060136210A1 (en) * 2004-12-16 2006-06-22 Sony Corporation System and method for tying variance vectors for speech recognition
JP4586615B2 (ja) * 2005-04-11 2010-11-24 沖電気工業株式会社 音声合成装置,音声合成方法およびコンピュータプログラム
US9245526B2 (en) * 2006-04-25 2016-01-26 General Motors Llc Dynamic clustering of nametags in an automated speech recognition system
JP4241762B2 (ja) 2006-05-18 2009-03-18 株式会社東芝 音声合成装置、その方法、及びプログラム
FR2901433A1 (fr) * 2006-05-19 2007-11-23 France Telecom Conversion entre representations en domaines de sous-bandes pour des bancs de filtres variant dans le temps
JP2008058667A (ja) * 2006-08-31 2008-03-13 Sony Corp 信号処理装置および方法、記録媒体、並びにプログラム
JP4878538B2 (ja) * 2006-10-24 2012-02-15 株式会社日立製作所 音声合成装置
JP5025550B2 (ja) * 2008-04-01 2012-09-12 株式会社東芝 音声処理装置、音声処理方法及びプログラム
US8798998B2 (en) * 2010-04-05 2014-08-05 Microsoft Corporation Pre-saved data compression for TTS concatenation cost
CN110164437B (zh) * 2012-03-02 2021-04-16 腾讯科技(深圳)有限公司 一种即时通信的语音识别方法和终端
US8751236B1 (en) * 2013-10-23 2014-06-10 Google Inc. Devices and methods for speech unit reduction in text-to-speech synthesis systems
US10083682B2 (en) * 2015-10-06 2018-09-25 Yamaha Corporation Content data generating device, content data generating method, sound signal generating device and sound signal generating method
WO2018129558A1 (en) 2017-01-09 2018-07-12 Media Overkill, LLC Multi-source switched sequence oscillator waveform compositing system
US10347238B2 (en) * 2017-10-27 2019-07-09 Adobe Inc. Text-based insertion and replacement in audio narration
US10770063B2 (en) 2018-04-13 2020-09-08 Adobe Inc. Real-time speaker-dependent neural vocoder
US11978431B1 (en) * 2021-05-21 2024-05-07 Amazon Technologies, Inc. Synthetic speech processing by representing text by phonemes exhibiting predicted volume and pitch using neural networks

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5331323B2 (ja) * 1972-11-13 1978-09-01
JPS5681900A (en) * 1979-12-10 1981-07-04 Nippon Electric Co Voice synthesizer
FR2636163B1 (fr) * 1988-09-02 1991-07-05 Hamon Christian Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde
JPH031200A (ja) * 1989-05-29 1991-01-07 Nec Corp 規則型音声合成装置
US5490234A (en) * 1993-01-21 1996-02-06 Apple Computer, Inc. Waveform blending technique for text-to-speech system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010237323A (ja) * 2009-03-30 2010-10-21 Toshiba Corp 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法

Also Published As

Publication number Publication date
US5740320A (en) 1998-04-14
JP2782147B2 (ja) 1998-07-30

Similar Documents

Publication Publication Date Title
JP2782147B2 (ja) 波形編集型音声合成装置
JP3078205B2 (ja) 波形の連結及び部分的重複化による音声合成方法
JP3563772B2 (ja) 音声合成方法及び装置並びに音声合成制御方法及び装置
JPH10171484A (ja) 音声合成方法および装置
JPS63285598A (ja) 音素接続形パラメ−タ規則合成方式
GB2392592A (en) Speech synthesis
JPH031200A (ja) 規則型音声合成装置
US6950798B1 (en) Employing speech models in concatenative speech synthesis
Bonada et al. Sample-based singing voice synthesizer by spectral concatenation
US5890118A (en) Interpolating between representative frame waveforms of a prediction error signal for speech synthesis
JP2001282278A (ja) 音声情報処理装置及びその方法と記憶媒体
AU724355B2 (en) Waveform synthesis
JPH09512645A (ja) マルチパルス分析音声処理システムおよび方法
US6125344A (en) Pitch modification method by glottal closure interval extrapolation
JP3576800B2 (ja) 音声分析方法、及びプログラム記録媒体
JP2003108178A (ja) 音声合成装置及び音声合成用素片作成装置
JP3281266B2 (ja) 音声合成方法及び装置
JP2600384B2 (ja) 音声合成方法
JP3109778B2 (ja) 音声規則合成装置
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
WO2004027753A1 (en) Method of synthesis for a steady sound signal
JP4454780B2 (ja) 音声情報処理装置とその方法と記憶媒体
JP3059751B2 (ja) 残差駆動型音声合成装置
JPH0772897A (ja) 音声合成方法および装置
JP3733964B2 (ja) 分析結果を用いた音源波形合成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090522

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090522

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100522

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees