JP2577372B2 - 音声合成装置および方法 - Google Patents

音声合成装置および方法

Info

Publication number
JP2577372B2
JP2577372B2 JP62040923A JP4092387A JP2577372B2 JP 2577372 B2 JP2577372 B2 JP 2577372B2 JP 62040923 A JP62040923 A JP 62040923A JP 4092387 A JP4092387 A JP 4092387A JP 2577372 B2 JP2577372 B2 JP 2577372B2
Authority
JP
Japan
Prior art keywords
syllable
parameter
parameters
speech
crossover
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62040923A
Other languages
English (en)
Other versions
JPS63208098A (ja
Inventor
成利 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP62040923A priority Critical patent/JP2577372B2/ja
Publication of JPS63208098A publication Critical patent/JPS63208098A/ja
Application granted granted Critical
Publication of JP2577372B2 publication Critical patent/JP2577372B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Reciprocating, Oscillating Or Vibrating Motors (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は滑らかさのある合成音声を効果的に生成する
ことのできる音声合成装置および方法に関する。
(従来の技術) マン・マシン・インターフェースの重要な役割を担う
技術の1つに、音声の合成出力がある。
従来より種々の音声合成の手法が提唱されており、そ
の1つに規則合成がある。この規則合成は、任意の入力
文字列を解析してその音韻情報と韻律情報とを求め、こ
れらの情報に従って予め定められた規則に基き、上記入
力文字列が示す音声を合成出力するものである。この規
則合成によれば、任意の単語やフレーズの合成音声を容
易に生成し得ると云う効果が奏せられる。
ところがこの規則合成によって生成された合成音声
は、従来より一般的に用いられている録音編集方式によ
り生成された合成音声に比較して、その品質が悪いと云
う問題がある。即ち、規則合成された音声は、了解度の
点ではかなり高品質ではあるが、その滑らかさの点で難
点がある。この結果、一般的には聞取り難いと云う不具
合がある。
(発明が解決しようとする問題点) このように従来の規則合成方式にあっては、生成され
た合成音声の滑らかさの点で難点があり、その改善が強
く望まれている。
本発明はこのような事情を考慮してなされたもので、
その目的とするところは、規則合成される音声の滑らか
さの向上を図り、聞取り易さの向上を図った合成音声を
容易に生成することのできる音声合成装置および方法を
提供することにある。
[発明の構成] (問題点を解決するための手段) 本発明は、入力文字列を解析して求められる音韻記号
列から音声パラメータ列を生成する際に用いられる音声
素片ファイルとして、 CV音節パラメータを格納したCV音節パラメータ・フ
ァイルと、 CV音節パラメータの結合時に該CV音節パラメータ間
に挿入されるわたりパラメータを格納したわたりパラメ
ータ・ファイルとを準備し、 前記音韻記号列の各音韻記号の直前母音とそのCV音節
の種類に従って、音声素片パファイルからCV音節パラメ
ータ(音声素片パラメータ)とそのCV音節パラメータの
結合部に挿入するわたりパラメータとを求め、求めたCV
音節パラメータをパワー成分と声道特性成分とに分離し
てそれぞれ補間結合することで、音声パラメータ列を求
めるようにしたものである。
つまりパワー成分についてはCV音節パラメータ間を直
接的に補間結合すると共に、声道特性成分についてはCV
音節パラメータ間にわたりパラメータを挿入して補間結
合するようにしたことを特徴とするものである。
(作用) 本発明によれば、入力文字列を解析して求められる音
韻記号列の各音韻記号の直前母音とそのCV音節の種類に
従ってCV音節パラメータ(音声素片パメータ)とわたり
パラメータとが選択される。そして選択されたCV音節パ
ラメータがパワー成分と声道特性成分とに分離され、パ
ワー成分については選択されたCV音節パラメータ間の補
間結合が行われ、声道特性成分については選択されたCV
音節パラメータ間に選択されたわたりパラメータを挿入
して補間結合が行われる。
具体的には音声素片パラメータがケプストラム・パラ
メータで与えられる場合には、その音声パワー成分であ
る(c0)についてはCV音節パラメータ間で補間結合を行
い、声道特性成分(c1〜cm)については上記CV音節パラ
メータ間にわたりパラメータを挿入して補間結合が行わ
れる。
この結果、音韻記号列に対応したCV音節パラメータが
その直前母音とそのCV音節の種類に応じたわたり部分の
音声素片を挿入しながら、且つパワー成分と声道特性成
分とに分離されてそれぞれ補間結合されて音声パラメー
タ列が生成されるので、そのCV音節パラメータのつなが
りが非常に滑らかになる。これ故、この音声パラメータ
列に基いて規則合成される音声は非常に滑らかなものと
なり、自然性が高く聞取り易い合成音声を生成出力する
ことが可能となる。
(実施例) 以下、図面を参照して本発明の一実施例につき説明す
る。
第1図は実施例装置の概略構成図であり、1は入力文
字列を解析してその音韻記号列と韻律情報とを求める文
字列解析部である。この文字列解析部1にてえ求められ
た音韻記号列は音声パラメータ列生成装置2に入力さ
れ、音声素片ファイル3を参照して音声パアメータ列に
変換生成される。
尚、音声素片ファイル3は、後述するようにCV音節パ
ラメータ・ファイル3a,わたりパラメータ・ファイル3b
によって構成される。
前記音声パラメータ列生成装置2は入力される音韻記
号列からそのCV音節を判定し、上記音声素片ファイル3
から音声合成の単位となる音声素片パラメータを選択的
に求めるCV音節判定部2aと、音声素片ファイル3から求
めらる音声素片パラメータをパワー成分と声道特性成分
とに分離する成分分離部2bと、分離された成分毎に上記
音声素片パラメータを補間結合する補間結合部2cとを具
備して構成される。そして補間結合された上記音声素片
パラメータの系列から、前記入力文字列に対応する音声
の声道特性を近似表現する前記音声パラメータ列を生成
するものとなっている。
一方、前記文字列解析部1で求められた韻律情報は韻
律パラメータ列生成装置4に与えられ、韻律パラメータ
列に変換生成される。音声合成器5はこのようにして求
められた上記音声パラメータ列と韻律パラメータ列とに
従い、所定の合成規則に基いて前記入力文字列に対応し
た合成音声を生成出力するものである。
ここでパラメータ・ファイルを構成する音声素片ファ
イル3について説明する。
音声素片ファイル3は、前述したようにCV音節パラメ
ータ・ファイル3aと、わたりパラメータ・ファイル3bと
を具備して構成される。
CV音節パラメータ・ファイル3aは、自然発声された音
声の音節データを切出し、これを分析して求められる音
声素片を格納したものである。例えば入力単語音声とし
て『ひまわり』が与えられた場合、これを4つの音節デ
ータ『ひ』『ま』『わ』『り』としてそれぞれ切出し、
これらをそれぞれ分析して/hi/,/ma/,/wa/,/ri/なる4
つの音声素片(CV音節)を求める。このようにして求め
られるCV音節素片がCV音節パラメータ・ファイル3aに格
納される。
尚、このCV音節パラメータ・ファイル3aには、語頭で
用いられる母音音節(V音節)音声素片も格納される。
一方、わたりパラメータファイル3bにはVCV音節(V1C
2V2)を発声させた自然音声から、その音節素片V1からC
3へと遷移するわたり部分の情報(素片)が抽出されて
格納される。例えば『える』と発声された音声を分析す
ると、そのCV音節素片/e/と/ru/とのつながり部分に音
声の遷移部分が生じる。このようなわたり部分(遷移部
分)の情報が、例えば/e−ru/なる音声素片として抽出
され、わたりパラメータファイル3bに格納される。同様
にして『いま』と発声された自然音声から/i/から/m/ま
での遷移部分の情報を抽出してわたりパラメータファイ
ル3bに格納される。つまりCV音節の結合部分の情報が該
CV音節間のわたり部分の音声素片として前記わたりパラ
メータファイル3bに格納される。
前記音声パラメータ列生成装置2のCV音声判定部2aは
このような音声素片ファイル3から、音韻記号列に対応
した音声素片を選択的に抽出するものとなっている。
即ち、音声パラメータ列生成装置2は文字列解析装置
1にて求められた音韻記号列に基き、各音韻記号の直前
の母音とそのCV音節の種類に従って前述した音声素片を
選択的に抽出している。具体的には、音韻記号列をなす
各音韻記号に対応した音節パラメータを求めるに際し、
その音韻記号が母音であるか否かを判定し、母音である
場合には、該母音が独立に存在する語頭であるか、或い
は他の異なる母音の続いて現われるものであるかを判定
している。
そしてこの判定の結果、語頭の出現する母音(V音
節)、および子音と母音とが結合した通常の音韻(CV音
節)については前記CV音節パラメータ・ファイル3aから
そのCV音節パラメータをそれそれ抽出する。同時にこれ
らの抽出された各CV音節パラメータの結合部に挿入する
為のわたりパラメータをそのCV音節パラメータの種類に
応じて前記わたりパラメータ・ファイル3bから抽出して
いる。
そしてこのようにして上記各パラメータ・ファイル3
a,3bからそれぞれ選択的に抽出した音声素片(音節パラ
メータ)を前記成分分離部2bにてパワー成分と声道特性
成分とに分離している。このパワー成分と声道特性成分
は、例えば音声素片パラメータがケプストラム・パラメ
ータで与えられる場合、パワー成分は(c0)、声道特性
成分は(c1〜cm)となる。
前記補間結合部2cはこのようにして分離された成分毎
に前記CV音節パラメータ間に適宜わたりパラメータを挿
入して補間結合して音声パラメータ列を生成している。
即ち、第2図に示すようにパワー成分については選択さ
れたCV音節パラメータ間を直接補間結合し、声道特性成
分については上記CV音節パラメータ間にそのCV音節のつ
ながりで示されるわたりパラメータを挿入し、これらの
パラメータ間を補間結合している。
具体的には単語音声『ひま』に対応する音声パラメー
タ列を生成する場合には、第2図に示すようにそのCV音
節パラメータ/hi/,/ma/を前記CV音節パラメータ・ファ
イル3aから求めると共に、上記CV音節間のわたり部分の
わたりパラメータ/i−ma/を前記わたりパラメータ・フ
ァイル3bからそれぞれ求める。
そしてそのパワー成分(c0)については上記CV音節パ
ラメータ/hi/,/ma/を直接的に結合、つまりCV音節パラ
メータ/hi/の最終フレームとCV音節パラメータ/ma/の先
頭フレームとを補間結合する。また声道特性成分(c1
cm)については上記CV音節パラメータ/hi/,/ma/間にわ
たりパラメータ/i−ma/を挿入し、これらのパラメータ
間を補間結合する。つまりCV音節パラメータ/hi/の最終
フレームとわたりパラメータ/i−ma/の先頭フレームと
を補間結合し、わたりパラメータ/i−ma/の最終フレー
ムとCV音節パラメータ/ma/の先頭フレームとを補間結合
する。
このような補間結合にって前記単語音声『ひま』に対
応する音声パラメータ列が生成される。
第3図は入力文字列として『ひまわり』が与えられた
ときの音声パラメータ列生成装置2の作用例を示すもの
である。
しかして入力文字列『ひまわり』が与えられた場合に
は、その音韻記号列〔hi・ma・wa・ri〕について前記CV
音節パラメータ3aから/hi/,/ma/,/wa/,/ri/なるCV音節
パラメータがそれぞれ求められる。そしてこれらの音節
パラメータに対するわたり部分のパラメータが前記わた
りパラメータ・ファイル3bから/i−ma/,/a−wa/,/a−ri
/として求められる。そしてこれらの各音節パラメータ
間がそれぞれ内挿処理されて前記入力文字列『ひまわ
り』に対応した音声パラメータ列が求められることにな
る。
かくしてこのような音声パラメータ列生成装置2を備
えた本装置によれは、音声素片である音節についてそれ
ぞれ求められる音節パラメータが、そのパワー成分と声
道特性成分とに分離される。そしてパワー成分について
は上記音節パラメータのつながりとして滑らかに補間結
合され、また声道特性成分については各音節の直前の音
節の母音に応じて、その母音との結合による変化の情
報、つまりわたり部分のパラメータを介して滑らかに補
間結合されることになる。従ってこのようにして求めら
れた音声パラメータ列の各パラメータは滑らかな変化を
伴って結合されたものとなる。
この結果、声道特性についてはCV音節パラメータがわ
たりパラメータを介して滑らかに結合されることにな
り、パワー成分についてはわたりパラメータの影響を受
けることなく結合されることになる。これ故、その音節
パワー成分が不自然に変化することがなくなり、パワー
成分と声道特性成分とが共に直前母音による変化やその
環境変化に応じて滑らかに結合された音声パラメータ列
が生成されることになる。
かくしてこのような音声パラメータ列に従って規則合
成される合成音声は、音声素片が滑らかにつながった自
然性の高い滑らかなものとなり、非常に聞取り易いもの
となる。故に、了解度が高く、滑らかで自然性の高い音
声を効果的に規則合成することが可能となる。
尚、本発明は上述した実施例に限定されるものではな
い。例えば音節パラメータ間の内挿処理法については、
従来より種々提唱されている手法を適宜用いれば良いも
のである。また単語音声のみならず、所定のフレーズの
音声を規則合成するこも可能である。要するに本発明は
その要旨を逸脱しない範囲で種々変形して実施すること
ができる。
[発明の効果] 以上説明したように本発明によれば、音声素片パラメ
ータをパワー成分と声道特性成分とに分離してそれぞれ
補間結合するので、音声の環境に応じた滑らかで自然性
の高い合成音声を効果的に規則合成することができる。
この結果、合成音声の聞取り易さの向上を図って、例え
ばマン・マシン・インターフェースとして実用上多大な
る効果を奏し得る。
【図面の簡単な説明】
図は本発明の一実施例を示すもので、第1図は実施例装
置の概略構成図、第2図は音声素片パラメータのパワー
成分と声道特性成分に対するそれぞれの補間結合を説明
する為の図、第3図は音声パラメータ列の生成列を示す
図である。 1……文字列解析部、2……音声パラメータ生成装置、
2a……CV音節判定部、2b……成分分離部、2c……補間結
合部、3……音声素片ファイル、3a……CV音節パラメー
タ・ファイル、3b……わたりパラメータ・ファイル、4
……韻律パラメータ列生成装置、5……音声合成器。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力文字列を解析して音韻記号列と韻律情
    報とを求める手段と、 CV音節パラメータを格納したCV音節パラメータ・ファイ
    ル、およびCV音節パラメータの結合時に当該CV音節パラ
    メータ間に挿入されるわたりパラメータを格納したわた
    りパラメータ・ファイルからなる音声素片ファイルを参
    照して前記音韻記号列の各音韻記号の直前母音とそのCV
    音節の種類に従ってCV音節パラメータとそのCV音節パラ
    メータの結合部に挿入するわたりパラメータとを選択
    し、前記選択したCV音節パラメータをパワー成分と声道
    特性成分とに分離して、パワー成分については前記選択
    したCV音節パラメータ間を直線補間結合する一方、声道
    特性成分については前記選択したCV音節パラメータ間に
    前記選択したわたりパラメータを挿入して補間結合する
    ことで、音声パラメータ列を生成する手段と、 前記韻律情報に従って韻律パラメータ列を生成する手段
    と、 前記音声パラメータ列と韻律パラメータ列とに従って音
    声を規則合成する手段とを具備したことを特徴とする音
    声合成装置。
  2. 【請求項2】入力文字列を解析して音韻記号列と韻律情
    報とを求めた後、 CV音節パラメータを格納したCV音節パラメータ・ファイ
    ル、およびCV音節パラメータの結合時に当該CV音節パラ
    メータ間に挿入されるわたりパラメータを格納したわた
    りパラメータ・ファイルからなる音声素片ファイルを参
    照して前記音韻記号列の各音韻記号の直前母音とそのCV
    音節の種類に従ってCV音節パラメータとそのCV音節パラ
    メータの結合部に挿入するわたりパラメータとを選択
    し、 前記選択したCV音節パラメータをパワー成分と声道特性
    成分とに分離した後、パワー成分については前記選択し
    たCV音韻パラメータ間を直接補間結合する一方、声道特
    性成分については前記選択したCV音韻パラメータ間に前
    記選択したわたりパラメータを挿入して補間結合するこ
    とで、音声パラメータ列を生成し、 前記生成した音声パラメータ列と前記韻律情報を従って
    生成される韻律パラメータ列とに従って音声を規則合成
    することを特徴とする音声合成方法。
JP62040923A 1987-02-24 1987-02-24 音声合成装置および方法 Expired - Lifetime JP2577372B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62040923A JP2577372B2 (ja) 1987-02-24 1987-02-24 音声合成装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62040923A JP2577372B2 (ja) 1987-02-24 1987-02-24 音声合成装置および方法

Publications (2)

Publication Number Publication Date
JPS63208098A JPS63208098A (ja) 1988-08-29
JP2577372B2 true JP2577372B2 (ja) 1997-01-29

Family

ID=12594019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62040923A Expired - Lifetime JP2577372B2 (ja) 1987-02-24 1987-02-24 音声合成装置および方法

Country Status (1)

Country Link
JP (1) JP2577372B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4138016A1 (de) * 1991-11-19 1993-05-27 Philips Patentverwaltung Einrichtung zur erzeugung einer ansageinformation
JP4639527B2 (ja) * 2001-05-24 2011-02-23 日本電気株式会社 音声合成装置および音声合成方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5868099A (ja) * 1981-10-19 1983-04-22 富士通株式会社 音声合成装置
JPS5972494A (ja) * 1982-10-19 1984-04-24 株式会社東芝 規則合成方式
JPS61279898A (ja) * 1985-06-06 1986-12-10 株式会社リコー 音声合成方式

Also Published As

Publication number Publication date
JPS63208098A (ja) 1988-08-29

Similar Documents

Publication Publication Date Title
JPH0833744B2 (ja) 音声合成装置
JPH031200A (ja) 規則型音声合成装置
JPH10153998A (ja) 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置
US6212501B1 (en) Speech synthesis apparatus and method
AU769036B2 (en) Device and method for digital voice processing
JP2577372B2 (ja) 音声合成装置および方法
JPH08335096A (ja) テキスト音声合成装置
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JP4409279B2 (ja) 音声合成装置及び音声合成プログラム
JP3060276B2 (ja) 音声合成装置
JPH0642158B2 (ja) 音声合成装置
JP2894447B2 (ja) 複合音声単位を用いた音声合成装置
JP2008058379A (ja) 音声合成システム及びフィルタ装置
JPS5972494A (ja) 規則合成方式
JPH09179576A (ja) 音声合成方法
JP2703253B2 (ja) 音声合成装置
Suchato et al. Digital storytelling book generator with customizable synthetic voice styles
JP2987089B2 (ja) 音声素片作成方法および音声合成方法とその装置
JP2573586B2 (ja) 規則型音声合成装置
JP2586040B2 (ja) 音声編集合成装置
JP3292218B2 (ja) 音声メッセージ作成装置
JP2844588B2 (ja) 波形編集型音声合成装置
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JPH0836397A (ja) 音声合成装置
JP2573587B2 (ja) ピッチパタン生成装置