JPH0756599B2 - 音声フアイル作成方法 - Google Patents

音声フアイル作成方法

Info

Publication number
JPH0756599B2
JPH0756599B2 JP61126807A JP12680786A JPH0756599B2 JP H0756599 B2 JPH0756599 B2 JP H0756599B2 JP 61126807 A JP61126807 A JP 61126807A JP 12680786 A JP12680786 A JP 12680786A JP H0756599 B2 JPH0756599 B2 JP H0756599B2
Authority
JP
Japan
Prior art keywords
voice
synthesis
length
vowel
syllable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61126807A
Other languages
English (en)
Other versions
JPS62283399A (ja
Inventor
隆 矢頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP61126807A priority Critical patent/JPH0756599B2/ja
Publication of JPS62283399A publication Critical patent/JPS62283399A/ja
Publication of JPH0756599B2 publication Critical patent/JPH0756599B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Navigation (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、文字列や韻律記号などを入力として、任意
の音声を合成する「規則による音声合成」における音声
ファイルの作成方法に関するものである。
(従来の技術) 近年、音声合成の分野では文字列(文字系列とも称す
る)を入力として任意の単語もしくは文章を音声として
出力する規則合成の研究が盛んである。この種の合成方
式では音声データとして単語より小さい音声単位、例え
ば日本語の規則合成の場合にはCV(子音+母音)、VCV
(母音+子音+母音)、CVC(子音+母音+子音)など
の音声単位を必要なだけ用意しておき、これら音声単位
を出力要求に応じて編集し、連続音声として出力するこ
とが行なわれている。
この発明の説明に先立ち、第6図〜第8図を参照して従
来の規則による音声合成につき説明する。尚、流れ図に
おいてステップをSで表わす。
第6図は一般的な規則合成の処理の基本的な流れを示す
流れ図である。入力文字系列が読み取られると(S1)、
読み取られた文字系列に対しては辞書情報などを利用し
た構文解析が行なわれ(S2)、音韻系列への変換(S3)
と共に、これら音韻に対応するアクセント、区切り、イ
ントネーション記号などが与えられる(S4)。この過程
(S3、S4)で、文字の読み方、単語や文章を読む場合の
抑揚や区切りの位置の情報が提供される。次にこれらの
情報に基づいて、ピッチ(声の高さ)、振幅(声の強
さ)、継続時間(音韻の長さ)などの韻律パラメータ
と、音韻系列に対応する音声データを生成する。これら
合成に必要な音声データは全て規則によって生成され
(S5)、最終的には合成器に必要なデータ形式となって
音声合成器に送出され、合成音声が得られる(S6)。
このような規則合成において自然な音声を合成するため
に極めて重要な事項として、音声合成方式、音声単位の
結合規則、音調(ピッチ)規則などと並んで音韻継続時
間の制御規則がある。この音韻継続時間を設定する場
合、各音韻特有の基本長を基準にして、単語内での音節
単位の位置、単語を構成する音節数及び音節の種類、ア
クセント、イントネーション、テンポ、構文の区切れな
どといった様々な要素に基づいてこの音韻継続時間を調
整する。実際に使用されている規則には、上述したよう
な様々な要素を加味した複雑なものから、ごく限られた
要素のみを考慮した簡単なものもある。
以下、代表的かつ簡単な従来の継続時間制御規則の例を
述べる。一般に日本語は音節もしくは拍に関して等時的
リズムを有する性質がある。今、第7図に示すように一
例としてCV(子音+母音)を音声単位として考えたとき
(図中、Cは子音部及ぶVは母音部である)、この規則
によれば、等時点リズムの性質を利用して音節(この場
合にはC+Vの長さ)内に位置する基準点(タイミング
点)r1,r2,r3の間隔が一定になるように各音節の長さの
調整を行なう(第7図)。
次に、このように設定された一音節の継続時間を実際の
合成においてどのようにして実現するかについて述べ
る。設定された時間長は当然のことながら合成のために
予め用意されている音声単位の長さとは異なる場合が多
いため、何らかの方法によって音韻の長さを伸縮させる
必要がある。以下、説明を容易にするため、音声単位と
して日本語規則合成で最もよく用いられるCV音節を考え
る。
従来よく用いられている音節長調整方法は、子音部の長
さは変えずに母音部のみの伸縮で対処する方法である。
この方法が採られる理由は、前後の音韻環境の違いによ
る音節長の変化が母音部の長さの変動に主として起因し
ていることにある。この場合、母音部の伸縮は母音定常
部の後端を打ち切ったり、引き伸ばしたりすることによ
って行ない(第8図)、過渡部すなわち立ち上がり部分
の伸縮は行なわない。なぜなら、CVを単位とする合成で
は、少なくとも音声単位内では原音声の音韻性(スペク
トルの時間的流れ)をそのまま保存することにより、合
成音の音質を確保することを特徴としており、音声単位
区間内のある部を引き伸ばしたり、削除したりすること
は望ましいからである。
やや高度な継続時間規則では子音部も音韻環境に応じて
その長さを変える方式も見られるが、定常区間が明確に
存在する子音以外では前記の理由により伸縮は難しい。
従って、子音部や母音の立ち上がり部分では音韻性の確
保のため出来る限り、このような伸縮は行なわず、原音
声の音韻的特徴を保存することが望ましい。このため、
これらの部分では予め用意しておく音声単位における継
続時間がそのまま合成に使用されることになる。従っ
て、CV音節ファイルの作成に当っては、いかに合成時の
状況に合った長さの音声素片を作成するかが非常に重要
になってくる。
そこで、次に規則合成における音声ファイルの作成につ
いて述べる。原音声からのCV音節の抽出の方法として
は、CV音節を単独で発声したものをほぼそのままCV素片
として用いる方法や、単語もしくは文章中からCV音節を
取り出す方法などがある。
CVもしくはVCVなど短い発声では個々の音節を明瞭に発
声することが出来るので、そこから抽出したCV素片を用
いて合成すると、やはり明瞭性の高い合成音を得ること
が出来る。一方、単語もしくは文章など連続音声から抽
出したCV素片は、音韻継続時間の点では、より実際に近
い長さの素片であるが、これらCV素片は前後の音韻の調
音結合の影響を強く受けるため、よほど合成時の音韻環
境を原音声の環境と一致させない限りこれらCV素片を用
いて自然は合成音を得るのは難しい。
このような状況から、従来の規則合成では、合成音の明
瞭性やファイル作成の容易さ等の点から、CV単独もしく
はVCVなど比較的短い発声の原音声に基づいてCVファイ
ルを作成する場合が多い。
(発明が解決しようとする問題点) しかしながら、CV音節単独もしくは、それに近いような
短い音節の発声においては、どうしても発声速度が遅く
なるため、連続音声を合成するための音声素片としては
子音部や母音立ち上がり部分の長さが不適当なものとな
る。先に、前後の音韻環境の違いにより母音部分の長さ
が変化して音節長が変化すると述べたが、連続音声中の
音節の長さと単独発声の音節の長さとでは、子音部や母
音立ち上がり部でもかなりの時間的隔たりが生じる。
従って、CV音節を用いて、母音部のみで音節長の調整を
行なうと、得られた合成音声は自然さが損なわれるばか
りか極端な場合、母音定常部の殆どが欠落してしまい、
明瞭度も失われてしまう。
このような問題点は、原音声における子音部や、母音立
ち上がり部の長さをそのまま合成に利用していることに
起因しており、従って発声のバラツキや発声条件の変化
など種々の変動要因のある中から適当な長さのCV素片を
得ることには所詮無理がある。
この発明の目的は、これらの問題点を除去し、容易な継
続時間制御によって自然な合成音を得ることが出来る音
声ファイルの作成方法を提供することにある。
(問題点を解決するための手段) この目的の達成を図るため、この発明の音声ファイル作
成方法においては、先ず、原音声分析時に原音声を子音
部、過渡部及び母音定常部の区間に分割する。次に、こ
れらの各々の区間において適当な分析フレーム周期(音
声の特徴を順次抽出していく時間的間隔)を設定する。
この場合、この分析フレーム周期は、合成時のフレーム
周期(音声の特徴パラメータを更新する時間周期)とは
必ずしも一致しないものであり、このように設定された
分析フレーム周期を用いて前述の各々の区間を分析する
ことによって音韻継続時間の伸縮を行なう。この音韻継
続時間の伸縮によって、合成時より前に、予め、各音
節、特に子音部や母音立ち上がり部の長さを合成時に必
要とされる値に、設定しておく。
このようなフレーム周期の伸縮は合成時に行なうことも
可能であるが、合成器自身にフレーム長可変機構をそな
えることは回路規模が増加し、さらに音節の種類によっ
て、又は音節内の各部分によって伸縮の割合が一定では
ないため、その各々に対して適正なフレーム周期を与え
ることは、いたずらに制御規則の複雑化を招くことにな
る。
(作用) このように、この発明ではこのような種々の状況を考慮
したフレーム伸縮を分析時に予め行なっておき、合成時
にはある一定のフレーム周期を用いる方法を採用してい
る。
従って、合成時に発声速度に適正な長さを持った音声素
片が得られると共に、音韻性を劣化させるような音韻継
続時間の制御を行なうことなく、合成音の品質向上が図
れる。
又、この発明によれば子音部と母音立ち上がり部の時間
長のみを制御し、母音定常部の時間長制御を必要としな
いので、音韻継続時間の設定規則が容易となる。
(実施例) 以下、図面を参照してこの発明の規則合成における音声
ファイル作成方法の実施例につき説明する。
各音節の子音部とか母音部の立ち上がり部(過渡部)と
かの各部分の長さを適正化するためには、合成時の状況
に合った標準的な長さを定めておく必要がある。そのた
め、音声ファイル作成に先立って標準時間長テーブルを
作成する。このテーブル作成においては、合成時の発声
速度に適した音韻継続時間すなわち単語合成であれば単
語、文章合成であれば文章音声の中でなるべく種々の音
韻環境での各音節各部の長さを測定し、その平均値を第
2図の如くテーブル化しておく。ここでは分析処理を容
易にするため、標準時間長テーブルの中の値は合成のフ
レーム長で表わすものとする。
この第2図に記載したように、例えば「イ」の場合であ
ると子音長「0」及び母音立ち上がり部長「4」であ
り、「ビョ」の場合には子音長「2」及び母音立ち上が
り部長「7」の如くである。
第1図はこの発明による音声ファイル作成手順の大まか
な流れを示す流れ図である。以下、この流れ図に沿って
説明する。
初めに話者によって発声された音声を8KHzで標本化した
ものを原音声データとして取り込む(S11)。次に、原
音声データからCV区間の切り出しを行なう(S12)。次
に切り出されたCV音節に対し、CV音節内部を第3図に示
すように子音部、過渡部及び母音定常部に区分けする
(S13)。第3図において(t1−t2)区間は子音部を、
(t2−t3)区間は過渡部である母音立ち上がり部を、
(t3−t4)区間は母音定常部をそれぞれ表わす。これら
の分割点の決定は視察によって定める。次に、各部の時
間長(t1−t2)、(t2−t3)及び(t3−t4)をそれぞれ
算出する(S14)。このように分割された区間におい
て、母音定常部を除く子音部と母音立ち上がり部に対し
て、標準時間長テーブル10を参照しながら、分析フレー
ム周期をそれぞれ決定する。各部の分析フレーム周期は
以下の如く算出して決定する(S15)。
FC=(t2−t1)/LC FT=(t3−t2)/LT FC ;子音部の分析フレーム周期 FT ;母音立ち上がり部の分析フレーム周期 LC ;標準時間長テーブルにおける当該音節子音 部のフレーム数 LT ;標準時間長テーブルにおける当該音節母音 立ち上がり部のフレーム数 母音定常部に関しては発声速度の影響による音韻性の変
化があまりないため、この実施例では合成時と同じ分析
フレーム周期に設定する。しかし、所要に応じ合成時と
異なる分析フレーム周期を設定することも出来る。
以上のように設定された分析フレーム周期にて各部分の
分析を行ない、分析フレーム周期毎に分析を行なうこと
により音声パラメータ(合成器における合成方式に応じ
たパラメータ例えばPARCOR係数、LSPパラメータ、LPC係
数など)の抽出を行ない(S16)、その結果を音節毎にC
V音節ファイル12に格納する(S17)。
第4図にこのようにして作成された音声ファイルを用い
た合成音と原音声との時間関係を示す。図示の例は原音
声の発声か又は連続音声を合成するためのCV素片として
は発声がゆっくりでCV素片が非常に長くなる例を示した
もので、原音声分析時の分析フレーム周期を合成時の分
析フレーム周期より長くとることによって合成時におけ
る継続時間を適正化したものである。
例えば、原音声データでの子音部の音韻継続時間が200m
sであるとし、かつ合成時の分析フレーム周期が10msで
あるとする。この場合、例えば音声ファイル作成時の分
析フレーム周期を40msとすると、合成時の10msの分析フ
レーム周期が1つの音韻パラメータ用として用いられる
ので、合成時に40/10=4すなわち4つの音韻パラメー
タで合成され音声が出力される。
第5図はこの発明の実施例を実行するための装置の一構
成例を示すブロック図を示す。第4図において14は音声
を入力する入力端子、16はローパスフィルタ、18はA/D
変換器、20はセグメンテーション部、22はグラフィック
ディスプレイ装置、24はセグメンテーションテーブル、
26は分析フレーム周期決定部、10は前述した標準時間長
テーブル、28は音声パラメータ分析部、12は前述した音
声素片用の音声ファイルである。以下、動作を説明す
る。
まず、入力端子14より原音声データを入力し、ローパス
フィルタ16によって不要な高域成分を取り除いた後、A/
D変換器18によってディジタル化する。セグメンテーシ
ョン部20ではA/D変換器18からのディジタル化音声デー
タからCV音節の切り出しを行なった後、このCV音節をグ
ラフィックディスプレイ装置22に表示し、これを視察に
よって第3図に示したようにCV音節内の区分分けを行な
う。ここで決定された分割点はセグメンテーションテー
ブル24に格納される。分析フレーム周期決定部26ではセ
グメンテーションテーブル24及び標準時間長テーブル10
の情報をもとに分割されたCV音節内の各部における分析
フレーム周期を決定する。
このように決定された分析フレーム周期を用いて分析部
28ではセグメンテーション部20からの音声データを分析
し、音声素片パラメータを作成し、その結果を音声ファ
イル12に格納する。
上述した実施例では、この発明をCV音節につき説明した
が、これに限定されるものではなく、VCV音節、CVC音
節、その他の音節にもこの発明を適用出来ることが明ら
かである。
(発明の効果) 上述した説明から明らかなように、この発明によれば原
音声の発声速度の如何んにかかわらず、適正な長さを持
った音声素片が得られ、規則合成時に音韻性を劣化させ
るような継続時間制御をする必要がなく合成音の品質が
向上する。又、子音部や母音立ち上がり部分では合成時
に時間長を制御する必要がなくなるため、継続時間の設
定規則が容易になる。
【図面の簡単な説明】
第1図はこの発明の音声ファイル作成方法の説明に供す
る音声ファイル作成手順を示す流れ図、 第2図はこの発明の説明に供する標準時間長テーブルを
示す図、 第3図はこの発明の説明に供するCV音節内の分割の方法
を説明するための図、 第4図はこの発明の説明に供する原音声と合成音の時間
関係の一例を示す図、 第5図はこの発明を実行するための音声作成ファイル装
置の一構成例を示すブロック図、 第6図は従来及びこの発明の説明に供する法則合成の基
本的流れ図、 第7図は従来の音節の長さの調整方法を説明するための
説明図、 第8図は従来の音節長の伸縮を説明するための説明図で
ある。 10…標準時間長テーブル 12…音声ファイル、14…入力端子 16…ローパスフィルタ 18…A/D変換器 20…セグメンテーション部 22…グラフィックディスプレイ装置 24…セグメンテーションテーブル 26…分析フレーム周期決定部 28…音声パラメータ分析部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】文字列又は音韻記号などを入力として任意
    の音声を合成する規則音声合成に用いる音声ファイルを
    作成するに当り、 原音声分析時に原音声を子音部、過渡部及び母音定常部
    の区間に分割し、 これら各々の区間において適当な分析フレーム周期をそ
    れぞれ設定し、 これら分析フレーム周期を用いて各々の前記区間を分析
    することによって原音声における音韻継続時間を伸縮す
    ることによって、該音韻継続時間を合成時の発声速度に
    適した長さに、合成時より前に、予め設定しておく ことを特徴とする音声ファイル作成方法。
  2. 【請求項2】分析フレーム周期の設定は、種々の音韻環
    境での各音節における子音部、過渡部及び母音定常部の
    各区間のそれぞれの長さ平均値が格納された標準時間長
    テーブルを参照して行なうことを特徴とする特許請求の
    範囲第1項に記載の音声ファイル作成方法。
JP61126807A 1986-05-31 1986-05-31 音声フアイル作成方法 Expired - Lifetime JPH0756599B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61126807A JPH0756599B2 (ja) 1986-05-31 1986-05-31 音声フアイル作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61126807A JPH0756599B2 (ja) 1986-05-31 1986-05-31 音声フアイル作成方法

Publications (2)

Publication Number Publication Date
JPS62283399A JPS62283399A (ja) 1987-12-09
JPH0756599B2 true JPH0756599B2 (ja) 1995-06-14

Family

ID=14944444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61126807A Expired - Lifetime JPH0756599B2 (ja) 1986-05-31 1986-05-31 音声フアイル作成方法

Country Status (1)

Country Link
JP (1) JPH0756599B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63223697A (ja) * 1987-03-12 1988-09-19 富士通株式会社 音声規則合成用パラメ−タの作成方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56129000A (en) * 1980-03-14 1981-10-08 Hitachi Ltd Wind hanging calculator
JPS5730899A (en) * 1980-08-01 1982-02-19 Fujitsu Ltd Frame synchronization control system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56129000A (en) * 1980-03-14 1981-10-08 Hitachi Ltd Wind hanging calculator
JPS5730899A (en) * 1980-08-01 1982-02-19 Fujitsu Ltd Frame synchronization control system

Also Published As

Publication number Publication date
JPS62283399A (ja) 1987-12-09

Similar Documents

Publication Publication Date Title
JPH0833744B2 (ja) 音声合成装置
JPH1039895A (ja) 音声合成方法および装置
JPH0632020B2 (ja) 音声合成方法および装置
JP2761552B2 (ja) 音声合成方法
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
JPS5972494A (ja) 規則合成方式
JPH0580791A (ja) 音声規則合成装置および方法
JPH0756599B2 (ja) 音声フアイル作成方法
JPH06318094A (ja) 音声規則合成装置
JPH1165597A (ja) 音声合成装置、音声合成及びcg合成出力装置、ならびに対話装置
JP2001034284A (ja) 音声合成方法及び装置、並びに文音声変換プログラムを記録した記録媒体
JP3113101B2 (ja) 音声合成装置
JPH11249676A (ja) 音声合成装置
JP3235747B2 (ja) 音声合成装置及び音声合成方法
JP3310217B2 (ja) 音声合成方法とその装置
JP2746880B2 (ja) 複合語分割方法
JPH056191A (ja) 音声合成装置
JPH0990971A (ja) 音声合成方法
JPH10301599A (ja) 音声合成装置
JP3292218B2 (ja) 音声メッセージ作成装置
JPH11352997A (ja) 音声合成装置およびその制御方法
JPH06214585A (ja) 音声合成装置
JPH01321496A (ja) 音声合成装置
JPH0756589A (ja) 音声合成方法
JPS63208098A (ja) 音声合成装置および方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term