JPH10171484A - 音声合成方法および装置 - Google Patents

音声合成方法および装置

Info

Publication number
JPH10171484A
JPH10171484A JP8329845A JP32984596A JPH10171484A JP H10171484 A JPH10171484 A JP H10171484A JP 8329845 A JP8329845 A JP 8329845A JP 32984596 A JP32984596 A JP 32984596A JP H10171484 A JPH10171484 A JP H10171484A
Authority
JP
Japan
Prior art keywords
pitch
waveform
speech
pitch waveform
waveforms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8329845A
Other languages
English (en)
Other versions
JP3349905B2 (ja
Inventor
Hirofumi Nishimura
村 洋 文 西
Toshimitsu Minowa
輪 利 光 簑
Yasuhiko Arai
居 康 彦 新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP32984596A priority Critical patent/JP3349905B2/ja
Priority to DE69718284T priority patent/DE69718284T2/de
Priority to ES97117604T priority patent/ES2190500T3/es
Priority to EP97117604A priority patent/EP0848372B1/en
Priority to CA002219056A priority patent/CA2219056C/en
Priority to US08/985,899 priority patent/US6125346A/en
Priority to CN97114182A priority patent/CN1190236A/zh
Publication of JPH10171484A publication Critical patent/JPH10171484A/ja
Application granted granted Critical
Publication of JP3349905B2 publication Critical patent/JP3349905B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • G10L13/07Concatenation rules

Abstract

(57)【要約】 (修正有) 【課題】 波形重畳による音声合成方法においては、合
成単位を大きな単位、例えばCVからVCVというよう
にすると、合成音声の品質は向上するが、合成単位とな
る音声片の数が増えるため、波形データベースが膨大に
なる。 【解決の手段】 VCVの合成単位102、105、1
06について、すべての音声片の有声区間を110〜1
19、120〜129のようなピッチ波形に分解し、似
通ったピッチ波形ごとにグループ分けを行い、グループ
毎に代表となる1つのピッチ波形だけをデータベースに
蓄積し、音声片間でピッチ波形を共有することにより、
波形データベースの容量を小さくする。また、無声音波
形についても音韻ごとにグループ分けを行い、似通った
波形を音声片間で共有することにより、波形データベー
スの容量を小さくする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声合成方法およ
びその装置に関し、特に入力されたテキストデータを音
声に変換する音声合成方法およびその装置に関する。
【0002】
【従来の技術】従来、音声片を接続して音声を合成する
音声合成方法においては、特開平7−40422号公報
に記載されているように、合成単位とする音声片ごとに
波形データを蓄積し、合成する際は、選ばれた音声片の
データのみで音声を合成していた。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
音声合成方法では、音声片が異なると、全く別のものと
してデータベース化しているので、音声片の間で非常に
似通った波形データがデータベースに蓄積されており、
データベースが冗長になっていた。また、データベース
規模の増大を抑えるために、限られた音声片を用いて無
理に変形して音声を合成すると、合成音声の音質劣化を
招くと言う問題があった。
【0004】本発明は、このような従来の問題を解決す
るものであり、波形データベースの冗長性を取り除き、
波形データベースを縮小するとともに、波形データベー
スをより有効に利用して、合成音声の品質を向上させる
ことのできる音声合成方法およびその装置を提供するこ
とを目的とする。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、ピッチ波形を最小単位としてピッチ波形
データベースを構成し、このピッチ波形を組み合わせて
CV、CV/VC、VCV、CV/VCVのような合成
単位となる音声片を構成できるようにしたものであり、
これにより、音声片が異なってもピッチ波形を共有する
ことができるため、波形データベースを縮小するとがで
き、さらに音声片の加工を行う場合に、他の音声片のピ
ッチ波形も有効に利用することができるため、合成音声
の品質を改善することができる。
【0006】
【発明の実施の形態】本発明の請求項1に記載の発明
は、CV、CV/VC、VCV、CV/VCVのような
音声片を変形、接続して音声を合成する波形重畳方式の
音声合成方法において、合成単位として利用する音声片
の原音声波形すべてから予めピッチ波形を切り出し、こ
のピッチ波形全体に対し、似通った波形毎にいくつかの
グループ分けを行い、それぞれのグループを1つのピッ
チ波形で代表させ、これらの代表ピッチ波形を使って音
声を合成するようにしたものであり、波形データベース
の冗長を取り除き、効率のよいデータベースを構築する
ことができるという作用を有する。
【0007】請求項2に記載の発明は、合成しようとす
る音声の読みを入力する手段と、その読みの入力からC
V、CV/VC、VCV、CV/VCVといった合成単
位の音声片を選択し、韻律を計算する手段と、計算した
韻律に従って、ピッチ波形および無声音波形をどのよう
に組み合わせたら合成単位となる音声片が構成できるか
を示したテーブルを参照してピッチ波形を選択する手段
と、選択されたピッチ波形をピッチ波形データベースお
よび無声音波形データベースから引き出して韻律情報に
従って音声片を合成する手段と、合成された音声片を接
続して音声を合成する手段と、合成された音声を出力す
る手段とを備えた音声合成装置であり、ピッチ波形デー
タベースの冗長を取り除き、効率のよいデータベースを
構築することができるので、データ記憶装置の容量を小
さくすることができるという作用を有する。
【0008】請求項3に記載の発明は、請求項1に記載
の音声合成方法において、ピッチ波形のスペクトルパラ
メータを基準として、類似性を判断してグループ分けを
行うようにしたものであり、音声片を録音する際の音韻
カテゴリー(例えば、VCV音声片の“aka”の
“a”の部分)などで分類した場合には、それ以上の細
かな分類はできないが、ピッチ波形のスペクトルパラメ
ータを基準にして分類を行えば、1つの音韻の中のスペ
クトル変動や、音韻が別の音韻に遷移する部分なども、
一定の物理量で正確に分類できるという作用を有する。
【0009】請求項4に記載の発明は、請求項1に記載
の音声合成方法において、グループ分けされたピッチ波
形の中から、ピッチ波形のパワーが最大のものをそのグ
ループを代表するピッチ波形とするようにしたものであ
り、ピッチ波形データベースのS/Nを改善することに
より、合成音声のS/Nを改善し、品質を向上すること
ができるという作用を有する。
【0010】請求項5に記載の発明は、請求項1に記載
の音声合成方法において、グループ分けされたピッチ波
形の中から代表するピッチ波形を選択する際に、全ての
グループの代表ピッチ波形の位相特性が似通ったものと
なるように選択するようにしたものであり、合成単位と
なる音声片を接続する際に、音声片の位相特性が似たも
のになるので、位相特性が似ていない音声片同士を接続
する場合に生じる音質の劣化を抑制することができると
いう作用を有する。
【0011】請求項6に記載の発明は、請求項1記載の
音声合成方法において、スペクトルパラメータなどを基
準として似通った波形毎にいくつかのグループ分けを行
い、さらにそれぞれのグループの中でピッチ波形の長さ
を基準としてサブグループを作成し、サブグループの中
で代表して1つのピッチ波形だけをデータベースに格納
し、音声片のピッチ変更を行う場合には、合成しようと
するピッチ周期に見合ったサブグループの代表ピッチ波
形を利用するようにしたものであり、合成単位にする音
声片のピッチ変更をする際に、もとのピッチ波形よりも
適切なものを選択することができるので、ピッチ変更の
際に生じる品質の劣化を抑えることができるという作用
を有する。
【0012】請求項7に記載の発明は、ピッチ波形デー
タベースが、ピッチ波形が周波数パワースペクトルのよ
うな音韻を区別できる基準でグループ分けされ、さらに
そのグループがピッチ波形の長さを基準としてサブグル
ープ分けされ、サブグループの中で代表して1つのピッ
チ波形だけが格納されており、音声片を合成する際に、
合成しようとする音声片のピッチ周期に見合った1つの
代表ピッチ波形をサブグループから抽出することを特徴
とする請求項2に記載の音声合成装置であり、合成しよ
うとする音声の音韻条件を満たし、さらにピッチ周期が
適当なピッチ波形を非常に効率よく選択することができ
るので、従来の音声片を接続する方式の合成方法とほと
んど同じ計算量で品質の高い音声を合成することができ
るという作用を有する。
【0013】請求項8に記載の発明は、請求項7に記載
の音声合成装置において、無声音部分についても同じ音
韻カテゴリーで無声音波形を共有するするようにしたも
のであり、無声音波形データベースの容量を小さくする
ことにより、波形データベースの容量を小さくすること
ができるという作用を有する。
【0014】以下、本発明の実施の形態について、図1
から図12を用いて説明する。 (実施の形態1)まず、本発明の請求項1に記載の発明
について、具体的に説明する。図1は「いぬ」と「いわ
し」という単語をVCVを合成単位として規則合成する
様子を示している。この図において102、105、1
06がVCVの合成単位である。101、104は語頭
用、103、107は語尾用の合成単位である。今まで
のCV、VCV、CV/VC、CV/VCVなどを合成
単位とする波形重畳方式の合成方法では、それぞれの合
成単位となる音声片ごとに波形データを蓄積し、その音
声片にのみ、その波形データを利用していた。つまり、
102の[inu]で使用される波形データは[in
u]という音声片が必要な時にのみ利用され、他の音声
片に利用されることはなかった。
【0015】このとき、音声片の波形データをピッチ波
形程度にまで分割すると、多くのピッチ波形において、
他の音声片に含まれるピッチ波形の中から非常に似通っ
たものを探しだすことができる。図1では、102の
「inu」と105 の「iwa」を、それぞれピッチ
波形110〜119と120〜129にまで分割し、そ
れぞれの音声片のはじめのピッチ波形が非常に似通った
場合を示している。このとき、ピッチ波形111と12
0を別々の波形データとして蓄積するのではなく、どち
らか1つのピッチ波形を代表ピッチ波形とし、ピッチ波
形ID(波形データベースの中から代表ピッチ波形を識
別するための記号)を付与して、波形データベースに蓄
積し、VCVやCV/VCVなどの合成単位としては、
これらの代表ピッチ波形のピッチ波形IDを記録してお
くことにより、ピッチ波形の共有化を行うことができ
る。当然、1つの音声片の中で似通ったピッチ波形があ
れば、これらも1つの代表ピッチ波形を波形データに蓄
積する。
【0016】このように、本実施の形態1によれば、ピ
ッチ波形を共有化することにより、波形データベースを
飛躍的に縮小することが可能となる。
【0017】(実施の形態2)次に、本発明の請求項2
に記載の発明について、具体的に説明する。図2は請求
項2に記載の音声合成装置を示すブロックの構成図であ
る。図2において、201は読み入力手段、202は韻
律計算手段、203はピッチ波形選択手段、204は音
声片合成手段、205は音声片接続手段、206は合成
音声出力手段、207はピッチ波形ポインタテーブル、
208はピッチ波形データベース、209は無声音波形
データベースである。
【0018】読み入力手段201では漢字仮名交じりの
文章や、発音表記などの情報が入力される。その入力に
対して、必要な音声片の種別、ピッチパターン、継続時
間長、パワーパターンなどの韻律をどのようにするのか
を韻律計算手段202で計算する。この計算された韻律
情報に従ってピッチ波形選択手段203が、ピッチ波形
ポインタテーブル207を参照して計算された音韻継続
時間長とパワーを持つ音声片を構成するのに必要なピッ
チ波形を選択する。音声片合成手段204では、この選
択されたピッチ波形をピッチ波形データベース208か
ら引き出し、無声区間では従来通り、無声音波形データ
ベース209から無声音波形データを引き出して、韻律
情報に従って音声片を合成する。この合成された音声片
を音声片接続手段205で接続し、合成音声を作成し、
合成音声出力手段206で合成音声を出力する。
【0019】図3にピッチ波形ポインタテーブル207
の構成を示す。このピッチ波形ポインタテーブル207
には、音声片毎にその音声片を構成するピッチ波形のI
Dが記載されている。ピッチ波形が共有される場合に
は、その共有される音声片の欄にも同じピッチ波形ID
が記載されることになる。また、ピッチ波形ポインタテ
ーブル207には、ピッチ波形選択時に必要となる音声
片のラベリング情報も同時に記載しておく。図3は最も
簡単な例であり、先行する母音部分のピッチ波形の数
と、子音部分のピッチ波形の数と、後続する母音部分の
ピッチ波形の数を記載したものである。
【0020】(実施の形態3)次に、本発明の請求項3
に記載の発明について、具体的に説明する。音声片を、
似通った波形毎に分類しようとするとき、例えば、VC
V音声片の“aka”の“a”や“k”の部分という分
類を行うと、音韻ごとに分類することはできるが、それ
以上の細かな分類はできない。例えば、VCV音声片の
“ama”などでは、“a”から“m”に遷移する部分
では同じ“a”に分類されていても、先頭の部分は単独
発声の“a”に似たスペクトルをしているが、後部では
“m”の影響を大きく受けた“a”のスペクトルにな
る。そこで、音声片を適当に細かく分割し、これをパワ
ースペクトルやLPCケプストラムなどのスペクトルパ
ラメータを求め、これを基準にして分類を行えば、さら
に細かく、正確な分類が可能になる。ここでは、パワー
スペクトル包絡を基準にして分類を行う場合を説明す
る。
【0021】一般にパワースペクトル包絡を求めるに
は、図4(a)に示す計算が必要である。まず同期波形
401に対して、402でフーリエ変換を行い、403
でその対数パワースペクトル(図5の501)を求め、
さらに404でフーリエ変換、405でリフタリング、
406でフーリエ逆変換を行い、スペクトル包絡407
(図5の502)を求める。しかし、分析する対象がピ
ッチ波形の場合には、図4(b)に示すように、ピッチ
波形411に対して、412でフーリエ変換を行い、4
13で対数パワーを求めれば、そのスペクトル包絡41
4が求められる。このことに着目し、音声波形を従来行
われてきたように数十ミリ秒程度の分析窓長で分析する
のではなく、ピッチ波形に切り出してからパワースペク
トル包絡を計算する。そして、このパワースペクトル包
絡を分類尺度として音韻を分類すれば、少ない計算量で
正確な分類が行える。
【0022】(実施の形態4)次に、本発明の請求項4
に記載の発明について、具体的に説明する。図6に代表
するピッチ波形の選択方法の様子を示す。601、60
2、603、604は合成単位となる音声片を示してい
る。この図では語尾に使用される音声片604につい
て、その代表ピッチ波形選択の様子が示されている。音
声片604の後半部分から切り出されたピッチ波形は、
比較的パワースペクトルが似通っていると判断されるも
のどうしを集めてグループ610と620に分類され
る。そして、グループ620から代表して1つのピッチ
波形をデータベースに登録する際に、もし、振幅の小さ
いピッチ波形625のような波形を選択してしまうと、
振幅の大きいピッチ波形621などに代用する際にS/
Nが低下してしまう。そこで、それぞれのピッチ波形の
最大振幅をグループ内で比較し、最も大きいピッチ波形
を代表ピッチ波形とする。例えば、グループ610では
611を代表ピッチ波形として選択し、グループ620
では621を代表ピッチ波形として選択する。これによ
り、データベース全体のS/Nを改善することが可能に
なる。当然、グループの中には他の音声片のピッチ波形
も存在するので、録音の際にS/Nの低い音声片があっ
ても、他の音声片から抽出されたS/Nの高いピッチ波
形で代用される部分があるので、本来よりもS/Nの高
いデータベースを構成することができる。
【0023】(実施の形態5)次に、本発明の請求項5
に記載の発明について、具体的に説明する。図7はグル
ープ分けされたピッチ波形から代表ピッチ波形を選択す
る方法を示している。図7において、710、720、
730、740、750は音韻により分類されたグルー
プを示している。このグループの中から代表するピッチ
波形を選択する際、グループを越えて位相特性が似通っ
た波形を選択する。この図では正の方向の最大振幅が、
切り出されたピッチ波形の中でなるべく中央にあるもの
を選択している。すなわち、グループ710では、ピッ
チ波形711〜714のうち714、グループ720で
は、ピッチ波形721〜724のうち722、グループ
730では、ピッチ波形731〜734のうち733、
グループ740では、ピッチ波形741〜744のうち
743、グループ750では、ピッチ波形751〜75
4のうち751が、それぞれ代表ピッチ波形として選択
される。当然ことながら、それぞれのピッチ波形の位相
特性をフーリエ変換などで分析し、さらに厳密に選択す
ることも可能である。
【0024】このようにして代表ピッチ波形を選択する
ことにより、それぞれ別々の音声片からピッチ波形をか
き集めてきても、位相特性が似通ったピッチ波形が隣合
うことになるので、位相特性が異なることによる音質の
劣化を防ぐことができ、品質が向上する。
【0025】(実施の形態6)次に、本発明の請求項6
に記載の発明について、具体的に説明する。図8はピッ
チ波形データベース810(図2の208)の構造を示
している。音韻別グループ820、830、840、…
は、パワースペクトルなどの音韻によって分類したグル
ープである。これらのグループからただ1つの代表ピッ
チ波形を決定するのではなく、さらに、ピッチ波形のピ
ッチ周期長によってサブグループ821〜829、83
1〜834、841・・・に分類する。そして、これら
サブグループの中から代表して1つのピッチ波形をデー
タベースに蓄積する。
【0026】音声片を合成する際には、合成しようとす
るピッチパターンに合わせてピッチ波形の間隔を変更す
る必要がある。このときに、その音声片から切り出した
ピッチ波形またはこのピッチ波形に似通った他の音声片
から切り出したピッチ波形を利用して音声片を合成する
よりも、合成するピッチ周期に見合ったピッチ波形を利
用した方が、ピッチ変更による品質の劣化を抑制するこ
とができる。そこで、まず音韻を合わせるために音韻別
グループを決定し、その中のサブグループの中で合成す
るピッチ周期に見合った代表ピッチ波形を利用して音声
片を合成する。これにより、ピッチ変更する際の品質の
劣化を抑制することができる。
【0027】(実施の形態7)次に、本発明の請求項7
に記載の発明について、具体的に説明する。図9は請求
項7に記載の音声合成装置の構成を示すブロック図であ
る。図9において、901は読み入力手段、902は韻
律計算手段、903はピッチ波形選択手段、904は音
声片合成手段、905は音声片接続手段、906は合成
音声出力手段、907はピッチ波形ポインタテーブル、
908は無声音波形データベース、909はピッチ波形
データベースである。ピッチ波形データベース909
は、音韻別データベース910、920... からなり、
各音韻別データベースは、ピッチ周期別データベース9
11〜919、921、922... のようなサブグルー
プに分類されている。
【0028】読み入力手段901では漢字仮名交じりの
文章や、発音表記などの情報が入力される。その入力に
対して、必要な音声片の種別、ピッチパターン、継続時
間長、パワーパターンなどの韻律をどのようにするのか
韻律計算手段902で計算する。この計算された韻律情
報に従ってピッチ波形選択手段903が、ピッチ波形ポ
インタテーブル907を参照して音声片を構成するのに
必要なピッチ波形を選択する。その際、音韻により音韻
別データベースを決定し、合成するピッチ周期によりそ
の中のサブグループを決定する。音声片合成手段904
では、この選択されたピッチ波形をデータベース909
から引き出し、無声区間では従来通り、無声音波形デー
タベース908から無声音波形データを引き出して、韻
律情報に従い音声片を合成する。この合成された音声片
を音声片接続手段905で接続し、合成音声を作成し、
合成音声出力手段906で合成音声を出力する。
【0029】図10にピッチ波形ポインタテーブル90
7の構成を示す。ピッチ波形ポインタテーブルは音声片
毎にそれぞれ存在し、ここではVCV「いぬ」の場合を
示している。ここで、[i100]や[n100]は、
ピッチ波形IDである。網掛けされた部分のピッチ波形
IDは、元々この音声片から切り出されたピッチ波形ま
たはそのピッチ波形に似通った他の音声片から切り出さ
れたピッチ波形のIDである。したがって、この表にお
いてピッチ波形IDの縦方向の欄に必ず1つ存在する。
しかし、それ以外の欄には、該当するピッチ波形が存在
する保証はないので、空欄になる可能性がある。このよ
うな、空欄のピッチ波形IDが参照される場合には、最
も近くの欄に記載されているピッチ波形IDを参照すれ
ばよい。また、ピッチ波形ポインタテーブル907に
は、ピッチ波形選択時に必要となる音声片のラベリング
情報も同時に記載しておく。図10は最も簡単な例であ
り、先行する母音部分のピッチ波形の数と、子音部分の
ピッチ波形の数と、後続する母音部分のピッチ波形の数
を記載したものである。
【0030】(実施の形態8)次に、本発明の請求項8
に記載の発明について、具体的に説明する。VCVなど
を合成単位とする場合に、音声片ごとに波形データを構
成すると、似通った無声音が多く波形データベースに蓄
積されるため、波形データベースが冗長になる。そこ
で、この無声音波形データを音声片間で共有することに
より、波形データベースの縮小が行える。図11は別々
の音声片で無声音波形を共有する概念図である。ここで
は、VCVを合成単位として音声片「aka」1102
と音声片「ika」1105の破裂部分の「k」を共有
している。
【0031】図12はこの音声合成装置の構成図であ
る。図12において、1201は読み入力手段、120
2は韻律計算手段、1203はピッチ波形選択手段、1
204は音声片合成手段、1205は音声片接続手段、
1206は合成音声出力手段、1207はピッチ波形ポ
インタテーブルである。1208は音韻別無声音波形デ
ータベースであり、無声音波形データベース1291〜
1299からなる。1209はピッチ波形データベース
であり、音韻別データベース1210、1220・・・
からなり、各音韻別データベースは、ピッチ周期別デー
タベース1211〜1219、1221、1222・・
・のようなサブグループに分類されている。
【0032】この装置においはて、無声音波形がいくつ
かのグループ1291〜1299に分類されている点が
大きな特徴である。従来の無声音波形データベースの構
築方法は、予めデータベースに蓄積する音声片ごとに録
音し、それをそのままあるいは圧縮を行ってデータベー
スに蓄積していたが、本装置では、録音はそれぞれの合
成単位とする音声片ごとに録音し、その録音された音声
片から無声音波形を切り出し、似通った波形ごとに分類
してグループ毎に代表となる1つの無声音波形だけをデ
ータベースに蓄積する点が従来の装置と大きく異なる。
【0033】
【発明の効果】以上のように本発明によれば、合成単位
とするすべての音声片の有声区間をピッチ波形に分解
し、似通ったピッチ波形ごとにグループ分けを行い、グ
ループ毎に代表となる1つのピッチ波形だけをデータベ
ースに蓄積し、音声片間でピッチ波形を共有することに
より、データベースを削減し、有声音の部分ではピッチ
変換も音質を落とさずに行うことができるという有利な
効果が得られる。
【図面の簡単な説明】
【図1】本発明の実施の形態1における音声合成方法の
概念図
【図2】本発明の実施の形態2における音声合成装置の
構成を示すブロック図
【図3】実施の形態2におけるピッチ波形ポインタテー
ブルの構成を示す模式図
【図4】本発明の実施の形態3におけるパワースペクト
ル包絡を求めるためのフロー図
【図5】実施の形態3における対数パワースペクトルの
周波数特性図
【図6】本発明の実施の形態4におけるピッチ波形選択
方法の概念図
【図7】本発明の実施の形態5におけるピッチ波形選択
方法の概念図
【図8】本発明の実施の形態6におけるピッチ波形デー
タベースの構造を示す模式図
【図9】本発明の実施の形態7における音声合成装置の
構成を示すブロック図
【図10】実施の形態7におけるピッチ波形ポインタテ
ーブルの構成を示す模式図
【図11】本発明の実施の形態8における無声音波形を
共有する場合の概念図
【図12】実施の形態8における音声合成装置の構成を
示すブロック図
【符号の説明】
201、901、1201 読み入力手段 202、902、1202 韻律計算手段 203、903、1203 ピッチ波形選択手段 204、904、1204 音声片合成手段 205、905、1205 音声片接続手段 206、906、1206 合成音声出力手段 207、907、1207 ピッチ波形ポインタテーブ
ル 208、909、1209 ピッチ波形データベース 209、908、1291、1299 無声音波形デー
タベース 910、920 音韻別データベース 911、912、919、921、922 ピッチ周期
別データベース 1208 音韻別無声音波形データベース

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 CV、CV/VC、VCV、CV/VC
    Vのような音声片を変形、接続して音声を合成する波形
    重畳方式の音声合成方法において、合成単位として利用
    する音声片の原音声波形すべてから予めピッチ波形を切
    り出し、このピッチ波形全体に対し、似通った波形毎に
    いくつかのグループ分けを行い、それぞれのグループを
    1つのピッチ波形で代表させ、これらの代表ピッチ波形
    を使って音声を合成する音声合成方法。
  2. 【請求項2】 合成しようとする音声の読みを入力する
    手段と、その読みの入力からCV、CV/VC、VC
    V、CV/VCVといった合成単位の音声片を選択し、
    韻律を計算する手段と、計算した韻律に従って、ピッチ
    波形および無声音波形をどのように組み合わせたら合成
    単位となる音声片が構成できるかを示したテーブルを参
    照してピッチ波形を選択する手段と、選択されたピッチ
    波形をピッチ波形データベースおよび無声音波形データ
    ベースから引き出して韻律情報に従って音声片を合成す
    る手段と、合成された音声片を接続して音声を合成する
    手段と、合成された音声を出力する手段とを備えた音声
    合成装置。
  3. 【請求項3】 ピッチ波形のスペクトルパラメータを基
    準として、類似性を判断してグループ分けを行う請求項
    1に記載の音声合成方法。
  4. 【請求項4】 グループ分けされたピッチ波形の中か
    ら、ピッチ波形のパワーが最大のものをそのグループを
    代表するピッチ波形とする請求項1に記載の音声合成方
    法。
  5. 【請求項5】 グループ分けされたピッチ波形の中から
    代表するピッチ波形を選択する際に、全てのグループの
    代表ピッチ波形の位相特性が似通ったものとなるように
    選択する請求項1に記載の音声合成方法。
  6. 【請求項6】 スペクトルパラメータなどを基準として
    似通った波形毎にいくつかのグループ分けを行い、さら
    にそれぞれのグループの中でピッチ波形の長さを基準と
    してサブグループを作成し、サブグループの中で代表し
    て1つのピッチ波形だけをデータベースに格納し、音声
    片のピッチ変更を行う場合には、合成しようとするピッ
    チ周期に見合ったサブグループの代表ピッチ波形を利用
    する請求項1記載の音声合成方法。
  7. 【請求項7】 ピッチ波形データベースが、ピッチ波形
    が周波数パワースペクトルのような音韻を区別できる基
    準でグループ分けされ、さらにそのグループがピッチ波
    形の長さを基準としてサブグループ分けされ、サブグル
    ープの中で代表して1つのピッチ波形だけが格納されて
    おり、音声片を合成する際に、合成しようとする音声片
    のピッチ周期に見合った1つの代表ピッチ波形をサブグ
    ループから抽出することを特徴とする請求項2に記載の
    音声合成装置。
  8. 【請求項8】 無声音部分についても同じ音韻カテゴリ
    ーで無声音波形を共有することを特徴とする請求項7に
    記載の音声合成装置。
JP32984596A 1996-12-10 1996-12-10 音声合成方法および装置 Expired - Fee Related JP3349905B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP32984596A JP3349905B2 (ja) 1996-12-10 1996-12-10 音声合成方法および装置
ES97117604T ES2190500T3 (es) 1996-12-10 1997-10-10 Sistema de sintesis de la palabra y base de datos de formas de ondas de redundancia reducida.
EP97117604A EP0848372B1 (en) 1996-12-10 1997-10-10 Speech synthesizing system and redundancy-reduced waveform database therefor
DE69718284T DE69718284T2 (de) 1996-12-10 1997-10-10 Sprachsynthesesystem und Wellenform-Datenbank mit verringerter Redundanz
CA002219056A CA2219056C (en) 1996-12-10 1997-10-23 Speech synthesizing system and redundancy-reduced waveform database therefor
US08/985,899 US6125346A (en) 1996-12-10 1997-12-05 Speech synthesizing system and redundancy-reduced waveform database therefor
CN97114182A CN1190236A (zh) 1996-12-10 1997-12-10 语音合成系统及其减少冗余的波形数据库

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32984596A JP3349905B2 (ja) 1996-12-10 1996-12-10 音声合成方法および装置

Publications (2)

Publication Number Publication Date
JPH10171484A true JPH10171484A (ja) 1998-06-26
JP3349905B2 JP3349905B2 (ja) 2002-11-25

Family

ID=18225884

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32984596A Expired - Fee Related JP3349905B2 (ja) 1996-12-10 1996-12-10 音声合成方法および装置

Country Status (7)

Country Link
US (1) US6125346A (ja)
EP (1) EP0848372B1 (ja)
JP (1) JP3349905B2 (ja)
CN (1) CN1190236A (ja)
CA (1) CA2219056C (ja)
DE (1) DE69718284T2 (ja)
ES (1) ES2190500T3 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002091475A (ja) * 2000-09-18 2002-03-27 Matsushita Electric Ind Co Ltd 音声合成方法
US6993484B1 (en) 1998-08-31 2006-01-31 Canon Kabushiki Kaisha Speech synthesizing method and apparatus
JP2006189554A (ja) * 2005-01-05 2006-07-20 Mitsubishi Electric Corp テキスト音声合成方法及びその装置、並びにテキスト音声合成プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
US7089187B2 (en) 2001-09-27 2006-08-08 Nec Corporation Voice synthesizing system, segment generation apparatus for generating segments for voice synthesis, voice synthesizing method and storage medium storing program therefor
JP2006243473A (ja) * 2005-03-04 2006-09-14 Sharp Corp 音声素片生成装置

Families Citing this family (136)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321226B1 (en) 1998-06-30 2001-11-20 Microsoft Corporation Flexible keyboard searching
JP3644263B2 (ja) * 1998-07-31 2005-04-27 ヤマハ株式会社 波形形成装置及び方法
EP1501075B1 (en) * 1998-11-13 2009-04-15 Lernout & Hauspie Speech Products N.V. Speech synthesis using concatenation of speech waveforms
US6208968B1 (en) * 1998-12-16 2001-03-27 Compaq Computer Corporation Computer method and apparatus for text-to-speech synthesizer dictionary reduction
US7369994B1 (en) 1999-04-30 2008-05-06 At&T Corp. Methods and apparatus for rapid acoustic unit selection from a large speech corpus
JP3841596B2 (ja) * 1999-09-08 2006-11-01 パイオニア株式会社 音素データの生成方法及び音声合成装置
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
JP4067762B2 (ja) * 2000-12-28 2008-03-26 ヤマハ株式会社 歌唱合成装置
JP3838039B2 (ja) * 2001-03-09 2006-10-25 ヤマハ株式会社 音声合成装置
US7233899B2 (en) * 2001-03-12 2007-06-19 Fain Vitaliy S Speech recognition system using normalized voiced segment spectrogram analysis
DE07003891T1 (de) 2001-08-31 2007-11-08 Kabushiki Kaisha Kenwood, Hachiouji Vorrichtung und Verfahren zur Erzeugung von Tonhöhenwellensignalen und Vorrichtung sowie Verfahren zum Komprimieren, Erweitern und Synthetisieren von Sprachsignalen unter Verwendung dieser Tonhöhenwellensignale
US6681208B2 (en) 2001-09-25 2004-01-20 Motorola, Inc. Text-to-speech native coding in a communication system
JP4407305B2 (ja) * 2003-02-17 2010-02-03 株式会社ケンウッド ピッチ波形信号分割装置、音声信号圧縮装置、音声合成装置、ピッチ波形信号分割方法、音声信号圧縮方法、音声合成方法、記録媒体及びプログラム
JP4080989B2 (ja) * 2003-11-28 2008-04-23 株式会社東芝 音声合成方法、音声合成装置および音声合成プログラム
WO2006050238A1 (en) * 2004-10-28 2006-05-11 Voice Signal Technologies, Inc. Codec-dependent unit selection for mobile devices
JP4207902B2 (ja) * 2005-02-02 2009-01-14 ヤマハ株式会社 音声合成装置およびプログラム
JP4551803B2 (ja) * 2005-03-29 2010-09-29 株式会社東芝 音声合成装置及びそのプログラム
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US8224647B2 (en) * 2005-10-03 2012-07-17 Nuance Communications, Inc. Text-to-speech user's voice cooperative server for instant messaging clients
US8036894B2 (en) * 2006-02-16 2011-10-11 Apple Inc. Multi-unit approach to text-to-speech synthesis
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8027837B2 (en) * 2006-09-15 2011-09-27 Apple Inc. Using non-speech sounds during text-to-speech synthesis
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
CN101510424B (zh) * 2009-03-12 2012-07-04 孟智平 基于语音基元的语音编码与合成方法及系统
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
JP5320363B2 (ja) * 2010-03-26 2013-10-23 株式会社東芝 音声編集方法、装置及び音声合成方法
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US10199051B2 (en) 2013-02-07 2019-02-05 Apple Inc. Voice trigger for a digital assistant
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
CN105027197B (zh) 2013-03-15 2018-12-14 苹果公司 训练至少部分语音命令系统
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101809808B1 (ko) 2013-06-13 2017-12-15 애플 인크. 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법
DE112014003653B4 (de) 2013-08-06 2024-04-18 Apple Inc. Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
EP3480811A1 (en) 2014-05-30 2019-05-08 Apple Inc. Multi-command single utterance input method
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
JP6678828B1 (ja) * 2018-08-03 2020-04-08 三菱電機株式会社 データ解析装置、システム、方法、及びプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2761552B2 (ja) * 1988-05-11 1998-06-04 日本電信電話株式会社 音声合成方法
US5454062A (en) * 1991-03-27 1995-09-26 Audio Navigation Systems, Inc. Method for recognizing spoken words
EP0515709A1 (en) * 1991-05-27 1992-12-02 International Business Machines Corporation Method and apparatus for segmental unit representation in text-to-speech synthesis
US5283833A (en) * 1991-09-19 1994-02-01 At&T Bell Laboratories Method and apparatus for speech processing using morphology and rhyming
JPH06250691A (ja) * 1993-02-25 1994-09-09 N T T Data Tsushin Kk 音声合成装置
JPH07319497A (ja) * 1994-05-23 1995-12-08 N T T Data Tsushin Kk 音声合成装置
JP3548230B2 (ja) * 1994-05-30 2004-07-28 キヤノン株式会社 音声合成方法及び装置
JP3085631B2 (ja) * 1994-10-19 2000-09-11 日本アイ・ビー・エム株式会社 音声合成方法及びシステム
US5864812A (en) * 1994-12-06 1999-01-26 Matsushita Electric Industrial Co., Ltd. Speech synthesizing method and apparatus for combining natural speech segments and synthesized speech segments
JP3233544B2 (ja) * 1995-02-28 2001-11-26 松下電器産業株式会社 Vcv連鎖波形を接続する音声合成方法およびその装置
US5751907A (en) * 1995-08-16 1998-05-12 Lucent Technologies Inc. Speech synthesizer having an acoustic element database

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6993484B1 (en) 1998-08-31 2006-01-31 Canon Kabushiki Kaisha Speech synthesizing method and apparatus
JP2002091475A (ja) * 2000-09-18 2002-03-27 Matsushita Electric Ind Co Ltd 音声合成方法
US7089187B2 (en) 2001-09-27 2006-08-08 Nec Corporation Voice synthesizing system, segment generation apparatus for generating segments for voice synthesis, voice synthesizing method and storage medium storing program therefor
JP2006189554A (ja) * 2005-01-05 2006-07-20 Mitsubishi Electric Corp テキスト音声合成方法及びその装置、並びにテキスト音声合成プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006243473A (ja) * 2005-03-04 2006-09-14 Sharp Corp 音声素片生成装置
JP4526979B2 (ja) * 2005-03-04 2010-08-18 シャープ株式会社 音声素片生成装置

Also Published As

Publication number Publication date
US6125346A (en) 2000-09-26
ES2190500T3 (es) 2003-08-01
EP0848372B1 (en) 2003-01-08
CA2219056A1 (en) 1998-06-10
CN1190236A (zh) 1998-08-12
EP0848372A3 (en) 1999-02-17
CA2219056C (en) 2002-04-23
EP0848372A2 (en) 1998-06-17
DE69718284D1 (de) 2003-02-13
DE69718284T2 (de) 2003-08-28
JP3349905B2 (ja) 2002-11-25

Similar Documents

Publication Publication Date Title
JP3349905B2 (ja) 音声合成方法および装置
USRE39336E1 (en) Formant-based speech synthesizer employing demi-syllable concatenation with independent cross fade in the filter parameter and source domains
US8423367B2 (en) Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method
US7454343B2 (en) Speech synthesizer, speech synthesizing method, and program
JPH06266390A (ja) 波形編集型音声合成装置
JP4406440B2 (ja) 音声合成装置、音声合成方法及びプログラム
JPH1039895A (ja) 音声合成方法および装置
JP2000509157A (ja) 音響要素・データベースを有する音声合成装置
Bettayeb et al. Speech synthesis system for the holy quran recitation.
US7089187B2 (en) Voice synthesizing system, segment generation apparatus for generating segments for voice synthesis, voice synthesizing method and storage medium storing program therefor
JP3346671B2 (ja) 音声素片選択方法および音声合成装置
EP2062252B1 (en) Speech synthesis
JP4829605B2 (ja) 音声合成装置および音声合成プログラム
JP3109778B2 (ja) 音声規則合成装置
Cadic et al. Towards Optimal TTS Corpora.
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JP2004354644A (ja) 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体
Tanaka et al. A Japanese text-to-speech system based on multi-form units with consideration of frequency distribution in Japanese.
JP3853923B2 (ja) 音声合成装置
JPH08234793A (ja) Vcv連鎖波形を接続する音声合成方法およびその装置
JP3378448B2 (ja) 音声素片選択方法,音声合成装置,及び命令記憶媒体
JPH0863187A (ja) 音声合成装置
JP3302874B2 (ja) 音声合成方式
Anilkumar et al. Building of Indian Accent Telugu and English Language TTS Voice Model Using Festival Framework
JP4839058B2 (ja) 音声合成装置および音声合成プログラム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080913

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080913

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090913

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090913

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100913

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110913

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120913

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130913

Year of fee payment: 11

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees