JPS62283399A - 音声フアイル作成方法 - Google Patents

音声フアイル作成方法

Info

Publication number
JPS62283399A
JPS62283399A JP61126807A JP12680786A JPS62283399A JP S62283399 A JPS62283399 A JP S62283399A JP 61126807 A JP61126807 A JP 61126807A JP 12680786 A JP12680786 A JP 12680786A JP S62283399 A JPS62283399 A JP S62283399A
Authority
JP
Japan
Prior art keywords
length
speech
synthesis
voice
frame period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61126807A
Other languages
English (en)
Other versions
JPH0756599B2 (ja
Inventor
隆 矢頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP61126807A priority Critical patent/JPH0756599B2/ja
Publication of JPS62283399A publication Critical patent/JPS62283399A/ja
Publication of JPH0756599B2 publication Critical patent/JPH0756599B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Navigation (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 (産業上の利用分野) この発明は、文字列や韻律記号などを人力として、任意
の音声を合成する「規則による音声合成」における音声
ファイルの作成方法に関するものである。
(従来の技術) 近年、音声合成の分野では文字列(文字系列とも祢ずろ
)を人力として仔5αの単語もしくは文aをrf声とし
て出力する規則合成の研究か盛ノνである。この種の合
成方式では音声データどしてip−語より小ざい音声四
位、例えば日本語の規則合成の場合にはCV (F斤+
)i)g−) 、 VCV (+U音+fEf + n
]Ef) 、 CVC(−fg+h’を音+−i”4 
) ナト(7)音声旧位を必要なだけ用意しておき、こ
れらa声11j位を出力要求に応じて編集し、連続音声
として出力することが行なわわている。
この発明の説明に先立ち、第6図〜第8図を参ij<i
 シて従来の規則による音声合成につき説明する。尚、
流わ図においてステ・・・ブをSて表わす。
第6図は一般的な規則合成の処理の基本的なdf。
れを示す流i図である。入力文字系列か読み取られると
(S t ) 、読み取られた文字系列に対しては辞古
情報などを111用した構文解析か行なわわ(S2)、
Mafi系++Iヘノi換(s 3 ) と共ニ、こ、
hら音韻に対応するアクセント、区切り、イントネーシ
′三号ン記号なと゛か11−えられる(S4)。この過
程(S3、S4)で、文字の読み方、jli語や文■を
読む場合の抑揚や区切りの位置の情報か提供される。次
にこiらの情報に基づいて、ピッチ(7fjの高さ)、
振幅(声の強さ)、継続時間(音韻の長さ)なとの韻律
パラメータと、音韻系列に々1応オる音声データを生成
する。これら合成に必要なrY声データは全て規則によ
って生成さ打(S5)、9終的には合成器に8蟹なデー
タ形式となってa声合成器に通出され、合成音パ1か社
!られる(S6)。
このような規則合成において自然な音声を合成すテCた
めに極めて重要な゛拝項として、音声合成な式、音声1
11位の結合規則、?”Y謁1(ピッチ)規則な、′ビ
、ピ並んで音量継続時間の1制制御則がある。この音韻
継続時間を設定−「る場合、各r)韻特有の基本長を基
準にして、単語内での音節ili位の位置、単語を構成
するa筒数及び音節の種類、アクセント、イントネーシ
ョン、テンポ、構文の区切わなどといった様々な′要素
に基ついてこの音韻継続時間を調整する。実際に使用ざ
引1ている規則には、ト述したような様々な要素を加味
した複雑なものから、ごく限られた要素のみを考慮した
簡単なものもある。
以下、代表的かつ簡単な従来の継続時間制御規則の例を
述へる。 般に日本語は音節もしくは拍に関して等時的
リズムを41する性質かある。今、第7図に示すように
一例としてCV(F音+QJ音)を汗7’i tP−位
として考えたとき(図中、Cは子音部及び■はRy音部
である)、この規則によれば、等時点リズムの性質を利
用して音節(この場合にはC+Vの長さ)内に位置する
基準点くタイミング点)「1、2、r、の間隔か一定に
なるように各音節の長さの、Jl!1整を行なう(第7
図)。
次に、このように設定された一音節の継続時間を実際の
合成においてとのようにして実現するかについて述へる
。設定された時間長は当然のことなから合成のためにf
め用意されている音声?F位の長さとは異なる場合か多
いため、何らかの方法によ−)て汗韻の長さを伸縮させ
る必要かある。以上説明を8枯にするため、rS声l1
i−位とし、てEl木JΔ規則合成で最もよく用いられ
る( y 3節を考えるっ 従来よく用いら4ている音節長、21整方法は、子音部
の長さは変えずに母音部のみの伸縮で対処する方法であ
る。この方法が採られる理由は、+iff ?&の音−
前環境の違いによる音節長の変化が母音部の長さの変動
に上として起因していることにある。
この場合、母音部の伸縮はm音定常部の後端を打ち切っ
たり、引き伸ばしたりすることによって行ない(第8図
)、過渡晶子なわち互も「かりぶ−分の伸縮は行なわな
い。なぜなら、CVを栄位とする合成では、少なくとも
a声中位内ては原音声のr?韻性(スペクトルの時間的
流れ)をそのまま保存することにより、合成音の音質を
確保1j−ることを特徴としており、音声単位区間内の
ある都を引き伸ばしたり、削除したりすることは望まし
くないからである。
やや高度な継続時間規則ではr−片部もa前環境に応じ
てその長さを変える方式も見られるが、定常区間か明確
に存在するY′斤以外では前記の理由により伸縮は難し
い。
従って、子音部やR1音のケちトかり部分でほぼ1’l
ij性の確保のため出来る限り、このような伸縮は行な
わず、原音声の音韻的特徴を保存することか望ましい。
このため、これらの部分ではr・め川、0しておく1′
f声1i1−位における継続時間かそのまま合成に使用
されることになる。従って、CV音節ファイルの作成に
当っては、いかに合成時の状況に合った長さの音声素片
を作成するかが非常に組接になってくる。
そこで、次に規則合成における1:1声フアイルの作成
について述へる。原音声からのCv音節の抽出のノコ法
としては、c v ;H節を単独で発声したものをほぼ
そのままCv素片として用いる方法や、13語も1ツく
は文は中からCV&節を取り出す方法などかある。
CVもしくはVCvなと短い発声では個々の音節を明瞭
に発声することが出来るので、そこから抽出したCV素
片を用いて合成すると、やはり明瞭性の高い今成跨を1
.することが出来る。一方、単語もしくは交信などの連
続肝声から抽出したCV素片は、音韻継続時間の点では
、より実際に近い長さの素片であるが、こわらCv素片
は面接の音1損の調行結合の!七響を強く受けるため、
よほど合成時の音韻環境を原g声の環境と一致させない
限りこれらCV素片を用いて自然な合成音を得るのは難
しい。
このような状況から、従来の規則合成では、合成音の明
瞭性やファイル作成の容易さ等の点から、c v +l
i独もしくはVCVなと比較的短い発声のD:’、 ’
jX声に騙ついてC■ファイルを作成する場合か多い。
(発明か解決しようとする問題点) しかしなから、CV g節i+j、独もしくは、それに
近いような短い音節の発声においては、どう1ツても発
声速度か遅くなるため、連続音声を合成するための音声
素ハとしては子音部やf’J K uちトかり部分の長
さか不適当なものとなる。先に、面接の音韻環境の違い
により母音部分の長さが変化して8筒長が変化すると述
へたか、連続音声中の8節の長さと中独発声のg節の長
さとでは、48部や母音qちトかり部でもかなりの時間
的隔たりが生じる。
従って、CV¥f節を用いて、1号音部のみで音筒長の
調整を行なうと、得られた合成音声は自然さか損なわわ
るばかりか極端な場合、Yすa定常部の殆どか欠落して
しまい、明瞭度も失わわてしまう。
このような問題点は、原音声における子音部や、RJ音
−i7. ′F)、hかり部の長さをそのまま合成に率
!1用していることに起因しており、従って発声のバラ
ツキや発声条件の変化など種々の変動要因のあろ巾から
適当な長さのCV素片を得ることには所詮無理かある。
この発明の目的は、これらの問題点を除去し、容易な継
続時間uj御によって自然な合成音を得ることか出来る
音声ファイルの作成方法を提供することにある。
(問題−;、i、を解決するためのB段)この[」的の
達成を図るため、この発明の音声ファイル作成77法に
おいては、先ず、原音声分析時に、卯a声を48部、過
渡部及び11音定常部の区間に分割する。次に、こわら
の各々の区間において適当な分析フレーム周期(音声の
特徴を順次抽出していく時間的間隔)を設定する。この
場合、この分析フレーム周期は、合成時のフレーム周期
(音声の特徴パラメータを更新する時間周期〉とは必ず
しも 致しないものであり、このように設定された分析
フレーム周期を用いて前述の各々の区間を分析すること
によって音韻継続時間の伸縮を行なう。この音韻継続時
間の伸縮によってY・め各;[1節、特に1′−音部や
B)音)γちにかり部の長さを11成時に必要とされる
値に設定しておく。
このようなフレーム周期の伸縮は合成時に行なうことも
n1能であるか、合成器自身にフレーム長町変機構をそ
なえることは回路規模か増加し、さらにと9節の種類に
よって、又はγイ節内の各部分によって伸縮の割合が 
定ではないため、その外々に灯して通iLなフレーム周
期を与えることは、いたずらにル(I御規則の複雑化を
招くことになる。
(作用) このように、この発明ではこのよ゛)な桶々の状況を考
慮したフレーム伸縮を分析時にtめ行なっておき、合成
時にはある一定のフレーム周期を用いる方法を採用して
いる。
従って1合成時に発声速度に適正な長さを持った音声素
片が得らiると共に、音韻性を劣化させてなる音韻継続
時間の一制御を行なうことなく、合成音の品質四トが図
わる。
又、この発明によれば子音部と母音9.ちトがり部の時
間長のみを制御し、R11音定常の時間長制御を必要と
しないので、音韻継続時間の設定規則が8髪Jとなる。
(実施例) 以ド、図面を参照してこの発明の規則合成における音声
ファイル作成方法の実施例につき説明する。
各音節のf−g一部とか母g部の立ちトかり部(過渡部
)とかの各部分の長さを適正化するためには、合成時の
状況に合った標準的な長さを定めておく必′捻かある1
、そのため、音声ファイル作成に先立って標準時間長テ
ーブルを作成する。このテーブル作成においては、合成
時の発声速度に適した音韻継続時間すなわち単3.7部
合成であれば中詰、文O合成であれば文RfH,声の中
でなるべく種々のFf韻環境での各に節芥部の長さを測
定し、その平均的値を第2図の如くテーブル化しておく
。ここでは分析処理を容易にするため、標準時間長テー
ブルの中の値は合成のフレーム長で表わすものとする。
この第2図に記載したように、例えば「イ」の場合であ
るとr−音長「0」及び母音立ち上がり部長「4」であ
り、「ビョ」の場合にはf−音長「2J及び母&!γち
上かり部長「7」の如くである。
第1図はこの発明による音声ファイル作成ト順の大まか
な流れを示す流れ図である。以ド、この流れ図に沿って
説明する。
初めに話者によって発声ざわたl(声を8KH7で標本
化したものを原音声データとして取り込む(Sl+)。
次に、原音声データからCv区間の切り出しを行なう(
512)。次に切り出さねたC■音節に対し、Cv音節
内部を第3図に示すように′r−音部、過鵡部及び母音
定常部に区分けする(S13)。第3図において(1+
 −1,+ )区間はf−音部を、(+2−+3)区間
は過渡部である母音立ち七かり部を、(+3−+4 )
区間はf:) if定定常分それぞれ表ね4−3これら
の分割点の決定は視察によって定める。次に、各部の時
間長(t+     t  2  )  、  (+2
  −t)   )  El、び (t 、  −+4
)f−それぞれ算出する(5口)。このように分割され
た区間において、母高定常部を除くT−音部と母音立ち
北かり部に対して、標準時間長テーブル10を参照しな
がら、分析フレーム周期をそれぞれ決定する。各部の分
析フレーム周期は以Fの如く算出して決定する( S 
+5)。
Fc = (+2−t+ )/Lc F工=(11□I−+2)/L工 F c  + f’ pf部の分析フレーム周期FT 
、1号音yγちトがり部の分析フレーム周期Lc ;標
準時間長テーブルにおける当1該音節f−9部のフレー
ム数 しT:標準時間長テーブルにおける当該音節母音ケちヒ
かり部のフレーム数 n上音定常部に関しては発声速度の影響による訝韻性の
変化かあまりないため、この実り’ts例では合成時と
同し分析フレーム周j■1に設定する。しかし、所要に
応し合成時と異なる分析フレーム周期を設定1−ること
も出来る。
以にのように設定された分析フレーム周期にて各部分の
分析を行ない5分析フレーム周期毎に分析を行なうこと
によりrt声パラメータ(合成器における合成方式に応
じたパラメータ例えばPARCOR係数、LSPパラメ
ータ、LPG係数なと)の抽出を行ない(S16)、そ
の結果をj′1節11FにCV音節ファイル12に格納
する(S17)。
第4図にこのようにして作成されたg声ファイルを用い
た合成rfと原音声との時間関係を示す。
図示の例は原?<Fkの発声か又は連続1゛冑jlを合
成するためのCv素片としては発ノitかゆっく0でC
v素片が非常に長くなる例を示したものて、原ど−ji
I分析時の分析フレーム周期を合成時の分析フレーム周
+111より長くとることによって合成時における繕続
時間をJgロニ化したものである。
例えば、j皇rイ声データでのrUf部のこ’j l’
lff継続11.?間が200m5であるとし、かつ合
成時の分析フレーム周期かtom sであるとする。こ
の場合、例えば音声ファイル作成時の分析フレーム周1
ullを40m sとすると、合成時のlom sの分
析フレーム周期が1つのg Kパラメータ用として用い
られるので、合成時に40/1o=4すなわち4つの音
韻パラメータで合成され音声か出力される。
第5図はこの発明の実施例を実行するための装置の一構
数例を示すブロック図を示す。第4図において14は音
声を人力する入力端f−116はローパスフィルタ、I
8はA/D変換器、20はセグメンテーション部、22
はグラフィックディスプレイ装置、24はセグメンテー
ションテーブル、2F+は分析フレーム周期決定部、l
Oは前述した標準時間長テーブル、28は音声パラメー
タ分析部、12は前述した音声素片用の音声ファイルで
ある。以F、動作を説明−4−る。
まず、入力Q T−I Aより原音声データを人力し、
ローパスフィルタ16によって不要な高域成分を取り除
いた後、A/D変換器18によってディジタル化する。
セグメンテーション部20ではA/D変換器18からの
ディジタル化音声データからCV音節の切り出しを行な
った後、このCv音節をグラフィックディスプレイ装置
22に表示し、二わを視察によって第3図に示したよう
にCv跨計部の区分分けを行なう。ここで決定された分
割点はセグメンテーションテーブル24に格納される。
分析フレーム周期決定部26ではセグメンテーションテ
ーブル24及び標準時間長デープルlOの情報をもとに
分割さiたCV音節内の各部における分析フLノーム周
朋を決定する。
このように決定された分析フレーム周期を用いて分析部
28ではセグメンテーション部20からの音声データを
分析し、音声素片パラメータを作成し、その結果を音声
ファイルI2に格納−)−る。
卜述した実施例では、この発明をCV音簡に1)き説明
したが、これに限定されるものではなく、vcvg節、
CvC&節、その他の筒部にもこの発明を通用出来るこ
とか明らかである。
(発明の効果) 上述した説明から明らかなように、この発明によれば原
音声の発声速度の如何んにかかわらず。
適正な長さを持った音声素片か得られ、規則合成時に音
韻性を劣化させるような継続時間制御をする必要がなく
合成音の品質が向トする。又、f音部や母音ケち七かり
部分では合成時に時間長をあまり制御する必要かなくな
るため、継続時間の設定規則か容易になる。
【図面の簡単な説明】
第1図はこの発明の音声ファイル作成方法の説明に供す
るg声ファイル作成f順を示す流れ図、第2図はこの発
明の説明に供する標準時間長テーブルを示す図、 第3図はこの発明の説明に供するCV音節内の分割の方
法を説明するための図、 第4図はこの発明の説明に供する原音声と合成音の時間
関係の一例を示す図、 第5図はこの発明を実行するための音声作成ファぞル装
置の一構数例を示すブロック図。 第6図は従来及びこの発明の説明に供する法則合成の基
本的流れ図、 第7図は従来の計部の長さの調整力法を説明するための
説明図、 第8図は従来の音筒長の伸縮を説明1−るだめの説明図
である。 10・・・標準時間長テーブル 12・・・r1声ファイル、   14・・・人力端子
−16・・・ローパスフィルタ 18・・・A/D変換器 20・・・セグメンテーション部 22・・・クラフィックディスプレイ装置24・・・セ
グメンテーションテーブル26・・・分析フレーム周期
決定部 28・・・rS声パラメータ分析部。 特許出願人    沖電気IJ株式会社樽 !−1I、
M表ラーフ・し 七〉フ7・1ル・:−〆に、キ・・執こ几れ2第り図 Aシー1 5草 瞬 Pa5 長 デデ″ −フ″ ノ
L。 第2図 I?1−

Claims (2)

    【特許請求の範囲】
  1. (1)文字列又は音韻記号などを入力として任意の音声
    を合成する規則音声合成に用いる音声ファイルを作成す
    るに当り、 原音声分析時に原音声を子音部、過渡部及び母音定常部
    の区間に分割し、 これらの各々の区間において適当な分析フレーム周期を
    それぞれ設定し、 これら分析フレーム周期を用いて各々の前記区間を分析
    することによって原音声における音韻継続時間を伸縮す
    ることによって該音韻継続時間を合成時の発声速度に適
    した長さに予め設定しておくことを特徴とする音声ファ
    イル作成方法。
  2. (2)分析フレーム周期の設定は、種々の音韻環境での
    各音節における子音部、過渡部及び母音定常部の各区間
    のそれぞれの長さ平均値が格納された標準時間長テーブ
    ルを参照して行なうことを特徴とする特許請求の範囲第
    1項に記載の音声ファイル作成方法。
JP61126807A 1986-05-31 1986-05-31 音声フアイル作成方法 Expired - Lifetime JPH0756599B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61126807A JPH0756599B2 (ja) 1986-05-31 1986-05-31 音声フアイル作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61126807A JPH0756599B2 (ja) 1986-05-31 1986-05-31 音声フアイル作成方法

Publications (2)

Publication Number Publication Date
JPS62283399A true JPS62283399A (ja) 1987-12-09
JPH0756599B2 JPH0756599B2 (ja) 1995-06-14

Family

ID=14944444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61126807A Expired - Lifetime JPH0756599B2 (ja) 1986-05-31 1986-05-31 音声フアイル作成方法

Country Status (1)

Country Link
JP (1) JPH0756599B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63223697A (ja) * 1987-03-12 1988-09-19 富士通株式会社 音声規則合成用パラメ−タの作成方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56129000A (en) * 1980-03-14 1981-10-08 Hitachi Ltd Wind hanging calculator
JPS5730899A (en) * 1980-08-01 1982-02-19 Fujitsu Ltd Frame synchronization control system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56129000A (en) * 1980-03-14 1981-10-08 Hitachi Ltd Wind hanging calculator
JPS5730899A (en) * 1980-08-01 1982-02-19 Fujitsu Ltd Frame synchronization control system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63223697A (ja) * 1987-03-12 1988-09-19 富士通株式会社 音声規則合成用パラメ−タの作成方法

Also Published As

Publication number Publication date
JPH0756599B2 (ja) 1995-06-14

Similar Documents

Publication Publication Date Title
JPS62160495A (ja) 音声合成装置
JP3587048B2 (ja) 韻律制御方法及び音声合成装置
JPH0632020B2 (ja) 音声合成方法および装置
US6424937B1 (en) Fundamental frequency pattern generator, method and program
JP2761552B2 (ja) 音声合成方法
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JP3109778B2 (ja) 音声規則合成装置
JPS62283399A (ja) 音声フアイル作成方法
JPS5972494A (ja) 規則合成方式
JP3235747B2 (ja) 音声合成装置及び音声合成方法
JP3622990B2 (ja) 音声合成装置及び方法
JP3614874B2 (ja) 音声合成装置及び方法
JP3113101B2 (ja) 音声合成装置
JPH11249676A (ja) 音声合成装置
JPH05134691A (ja) 音声合成方法および装置
JP3310217B2 (ja) 音声合成方法とその装置
JPH06250685A (ja) 音声合成方式および規則合成装置
JPH0836397A (ja) 音声合成装置
JPS63208098A (ja) 音声合成装置および方法
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JP3088211B2 (ja) 基本周波数パタン生成装置
JPH0756589A (ja) 音声合成方法
JPH02238497A (ja) 音声合成方法
JPH08160990A (ja) 音声合成装置
JPH06161490A (ja) 音声合成装置の韻律処理方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term