JPS62283399A - 音声フアイル作成方法 - Google Patents
音声フアイル作成方法Info
- Publication number
- JPS62283399A JPS62283399A JP61126807A JP12680786A JPS62283399A JP S62283399 A JPS62283399 A JP S62283399A JP 61126807 A JP61126807 A JP 61126807A JP 12680786 A JP12680786 A JP 12680786A JP S62283399 A JPS62283399 A JP S62283399A
- Authority
- JP
- Japan
- Prior art keywords
- length
- speech
- synthesis
- voice
- frame period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 claims description 38
- 238000003786 synthesis reaction Methods 0.000 claims description 38
- 238000000034 method Methods 0.000 claims description 14
- 230000001052 transient effect Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 9
- 230000011218 segmentation Effects 0.000 description 8
- 230000008602 contraction Effects 0.000 description 7
- 239000012634 fragment Substances 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000033764 rhythmic process Effects 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 101100313164 Caenorhabditis elegans sea-1 gene Proteins 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 241000238557 Decapoda Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 101100276984 Mus musculus Ccdc88c gene Proteins 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Navigation (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Electrically Operated Instructional Devices (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
3、発明の詳細な説明
(産業上の利用分野)
この発明は、文字列や韻律記号などを人力として、任意
の音声を合成する「規則による音声合成」における音声
ファイルの作成方法に関するものである。
の音声を合成する「規則による音声合成」における音声
ファイルの作成方法に関するものである。
(従来の技術)
近年、音声合成の分野では文字列(文字系列とも祢ずろ
)を人力として仔5αの単語もしくは文aをrf声とし
て出力する規則合成の研究か盛ノνである。この種の合
成方式では音声データどしてip−語より小ざい音声四
位、例えば日本語の規則合成の場合にはCV (F斤+
)i)g−) 、 VCV (+U音+fEf + n
]Ef) 、 CVC(−fg+h’を音+−i”4
) ナト(7)音声旧位を必要なだけ用意しておき、こ
れらa声11j位を出力要求に応じて編集し、連続音声
として出力することが行なわわている。
)を人力として仔5αの単語もしくは文aをrf声とし
て出力する規則合成の研究か盛ノνである。この種の合
成方式では音声データどしてip−語より小ざい音声四
位、例えば日本語の規則合成の場合にはCV (F斤+
)i)g−) 、 VCV (+U音+fEf + n
]Ef) 、 CVC(−fg+h’を音+−i”4
) ナト(7)音声旧位を必要なだけ用意しておき、こ
れらa声11j位を出力要求に応じて編集し、連続音声
として出力することが行なわわている。
この発明の説明に先立ち、第6図〜第8図を参ij<i
シて従来の規則による音声合成につき説明する。尚、
流わ図においてステ・・・ブをSて表わす。
シて従来の規則による音声合成につき説明する。尚、
流わ図においてステ・・・ブをSて表わす。
第6図は一般的な規則合成の処理の基本的なdf。
れを示す流i図である。入力文字系列か読み取られると
(S t ) 、読み取られた文字系列に対しては辞古
情報などを111用した構文解析か行なわわ(S2)、
Mafi系++Iヘノi換(s 3 ) と共ニ、こ、
hら音韻に対応するアクセント、区切り、イントネーシ
′三号ン記号なと゛か11−えられる(S4)。この過
程(S3、S4)で、文字の読み方、jli語や文■を
読む場合の抑揚や区切りの位置の情報か提供される。次
にこiらの情報に基づいて、ピッチ(7fjの高さ)、
振幅(声の強さ)、継続時間(音韻の長さ)なとの韻律
パラメータと、音韻系列に々1応オる音声データを生成
する。これら合成に必要なrY声データは全て規則によ
って生成さ打(S5)、9終的には合成器に8蟹なデー
タ形式となってa声合成器に通出され、合成音パ1か社
!られる(S6)。
(S t ) 、読み取られた文字系列に対しては辞古
情報などを111用した構文解析か行なわわ(S2)、
Mafi系++Iヘノi換(s 3 ) と共ニ、こ、
hら音韻に対応するアクセント、区切り、イントネーシ
′三号ン記号なと゛か11−えられる(S4)。この過
程(S3、S4)で、文字の読み方、jli語や文■を
読む場合の抑揚や区切りの位置の情報か提供される。次
にこiらの情報に基づいて、ピッチ(7fjの高さ)、
振幅(声の強さ)、継続時間(音韻の長さ)なとの韻律
パラメータと、音韻系列に々1応オる音声データを生成
する。これら合成に必要なrY声データは全て規則によ
って生成さ打(S5)、9終的には合成器に8蟹なデー
タ形式となってa声合成器に通出され、合成音パ1か社
!られる(S6)。
このような規則合成において自然な音声を合成すテCた
めに極めて重要な゛拝項として、音声合成な式、音声1
11位の結合規則、?”Y謁1(ピッチ)規則な、′ビ
、ピ並んで音量継続時間の1制制御則がある。この音韻
継続時間を設定−「る場合、各r)韻特有の基本長を基
準にして、単語内での音節ili位の位置、単語を構成
するa筒数及び音節の種類、アクセント、イントネーシ
ョン、テンポ、構文の区切わなどといった様々な′要素
に基ついてこの音韻継続時間を調整する。実際に使用ざ
引1ている規則には、ト述したような様々な要素を加味
した複雑なものから、ごく限られた要素のみを考慮した
簡単なものもある。
めに極めて重要な゛拝項として、音声合成な式、音声1
11位の結合規則、?”Y謁1(ピッチ)規則な、′ビ
、ピ並んで音量継続時間の1制制御則がある。この音韻
継続時間を設定−「る場合、各r)韻特有の基本長を基
準にして、単語内での音節ili位の位置、単語を構成
するa筒数及び音節の種類、アクセント、イントネーシ
ョン、テンポ、構文の区切わなどといった様々な′要素
に基ついてこの音韻継続時間を調整する。実際に使用ざ
引1ている規則には、ト述したような様々な要素を加味
した複雑なものから、ごく限られた要素のみを考慮した
簡単なものもある。
以下、代表的かつ簡単な従来の継続時間制御規則の例を
述へる。 般に日本語は音節もしくは拍に関して等時的
リズムを41する性質かある。今、第7図に示すように
一例としてCV(F音+QJ音)を汗7’i tP−位
として考えたとき(図中、Cは子音部及び■はRy音部
である)、この規則によれば、等時点リズムの性質を利
用して音節(この場合にはC+Vの長さ)内に位置する
基準点くタイミング点)「1、2、r、の間隔か一定に
なるように各音節の長さの、Jl!1整を行なう(第7
図)。
述へる。 般に日本語は音節もしくは拍に関して等時的
リズムを41する性質かある。今、第7図に示すように
一例としてCV(F音+QJ音)を汗7’i tP−位
として考えたとき(図中、Cは子音部及び■はRy音部
である)、この規則によれば、等時点リズムの性質を利
用して音節(この場合にはC+Vの長さ)内に位置する
基準点くタイミング点)「1、2、r、の間隔か一定に
なるように各音節の長さの、Jl!1整を行なう(第7
図)。
次に、このように設定された一音節の継続時間を実際の
合成においてとのようにして実現するかについて述へる
。設定された時間長は当然のことなから合成のためにf
め用意されている音声?F位の長さとは異なる場合か多
いため、何らかの方法によ−)て汗韻の長さを伸縮させ
る必要かある。以上説明を8枯にするため、rS声l1
i−位とし、てEl木JΔ規則合成で最もよく用いられ
る( y 3節を考えるっ 従来よく用いら4ている音節長、21整方法は、子音部
の長さは変えずに母音部のみの伸縮で対処する方法であ
る。この方法が採られる理由は、+iff ?&の音−
前環境の違いによる音節長の変化が母音部の長さの変動
に上として起因していることにある。
合成においてとのようにして実現するかについて述へる
。設定された時間長は当然のことなから合成のためにf
め用意されている音声?F位の長さとは異なる場合か多
いため、何らかの方法によ−)て汗韻の長さを伸縮させ
る必要かある。以上説明を8枯にするため、rS声l1
i−位とし、てEl木JΔ規則合成で最もよく用いられ
る( y 3節を考えるっ 従来よく用いら4ている音節長、21整方法は、子音部
の長さは変えずに母音部のみの伸縮で対処する方法であ
る。この方法が採られる理由は、+iff ?&の音−
前環境の違いによる音節長の変化が母音部の長さの変動
に上として起因していることにある。
この場合、母音部の伸縮はm音定常部の後端を打ち切っ
たり、引き伸ばしたりすることによって行ない(第8図
)、過渡晶子なわち互も「かりぶ−分の伸縮は行なわな
い。なぜなら、CVを栄位とする合成では、少なくとも
a声中位内ては原音声のr?韻性(スペクトルの時間的
流れ)をそのまま保存することにより、合成音の音質を
確保1j−ることを特徴としており、音声単位区間内の
ある都を引き伸ばしたり、削除したりすることは望まし
くないからである。
たり、引き伸ばしたりすることによって行ない(第8図
)、過渡晶子なわち互も「かりぶ−分の伸縮は行なわな
い。なぜなら、CVを栄位とする合成では、少なくとも
a声中位内ては原音声のr?韻性(スペクトルの時間的
流れ)をそのまま保存することにより、合成音の音質を
確保1j−ることを特徴としており、音声単位区間内の
ある都を引き伸ばしたり、削除したりすることは望まし
くないからである。
やや高度な継続時間規則ではr−片部もa前環境に応じ
てその長さを変える方式も見られるが、定常区間か明確
に存在するY′斤以外では前記の理由により伸縮は難し
い。
てその長さを変える方式も見られるが、定常区間か明確
に存在するY′斤以外では前記の理由により伸縮は難し
い。
従って、子音部やR1音のケちトかり部分でほぼ1’l
ij性の確保のため出来る限り、このような伸縮は行な
わず、原音声の音韻的特徴を保存することか望ましい。
ij性の確保のため出来る限り、このような伸縮は行な
わず、原音声の音韻的特徴を保存することか望ましい。
このため、これらの部分ではr・め川、0しておく1′
f声1i1−位における継続時間かそのまま合成に使用
されることになる。従って、CV音節ファイルの作成に
当っては、いかに合成時の状況に合った長さの音声素片
を作成するかが非常に組接になってくる。
f声1i1−位における継続時間かそのまま合成に使用
されることになる。従って、CV音節ファイルの作成に
当っては、いかに合成時の状況に合った長さの音声素片
を作成するかが非常に組接になってくる。
そこで、次に規則合成における1:1声フアイルの作成
について述へる。原音声からのCv音節の抽出のノコ法
としては、c v ;H節を単独で発声したものをほぼ
そのままCv素片として用いる方法や、13語も1ツく
は文は中からCV&節を取り出す方法などかある。
について述へる。原音声からのCv音節の抽出のノコ法
としては、c v ;H節を単独で発声したものをほぼ
そのままCv素片として用いる方法や、13語も1ツく
は文は中からCV&節を取り出す方法などかある。
CVもしくはVCvなと短い発声では個々の音節を明瞭
に発声することが出来るので、そこから抽出したCV素
片を用いて合成すると、やはり明瞭性の高い今成跨を1
.することが出来る。一方、単語もしくは交信などの連
続肝声から抽出したCV素片は、音韻継続時間の点では
、より実際に近い長さの素片であるが、こわらCv素片
は面接の音1損の調行結合の!七響を強く受けるため、
よほど合成時の音韻環境を原g声の環境と一致させない
限りこれらCV素片を用いて自然な合成音を得るのは難
しい。
に発声することが出来るので、そこから抽出したCV素
片を用いて合成すると、やはり明瞭性の高い今成跨を1
.することが出来る。一方、単語もしくは交信などの連
続肝声から抽出したCV素片は、音韻継続時間の点では
、より実際に近い長さの素片であるが、こわらCv素片
は面接の音1損の調行結合の!七響を強く受けるため、
よほど合成時の音韻環境を原g声の環境と一致させない
限りこれらCV素片を用いて自然な合成音を得るのは難
しい。
このような状況から、従来の規則合成では、合成音の明
瞭性やファイル作成の容易さ等の点から、c v +l
i独もしくはVCVなと比較的短い発声のD:’、 ’
jX声に騙ついてC■ファイルを作成する場合か多い。
瞭性やファイル作成の容易さ等の点から、c v +l
i独もしくはVCVなと比較的短い発声のD:’、 ’
jX声に騙ついてC■ファイルを作成する場合か多い。
(発明か解決しようとする問題点)
しかしなから、CV g節i+j、独もしくは、それに
近いような短い音節の発声においては、どう1ツても発
声速度か遅くなるため、連続音声を合成するための音声
素ハとしては子音部やf’J K uちトかり部分の長
さか不適当なものとなる。先に、面接の音韻環境の違い
により母音部分の長さが変化して8筒長が変化すると述
へたか、連続音声中の8節の長さと中独発声のg節の長
さとでは、48部や母音qちトかり部でもかなりの時間
的隔たりが生じる。
近いような短い音節の発声においては、どう1ツても発
声速度か遅くなるため、連続音声を合成するための音声
素ハとしては子音部やf’J K uちトかり部分の長
さか不適当なものとなる。先に、面接の音韻環境の違い
により母音部分の長さが変化して8筒長が変化すると述
へたか、連続音声中の8節の長さと中独発声のg節の長
さとでは、48部や母音qちトかり部でもかなりの時間
的隔たりが生じる。
従って、CV¥f節を用いて、1号音部のみで音筒長の
調整を行なうと、得られた合成音声は自然さか損なわわ
るばかりか極端な場合、Yすa定常部の殆どか欠落して
しまい、明瞭度も失わわてしまう。
調整を行なうと、得られた合成音声は自然さか損なわわ
るばかりか極端な場合、Yすa定常部の殆どか欠落して
しまい、明瞭度も失わわてしまう。
このような問題点は、原音声における子音部や、RJ音
−i7. ′F)、hかり部の長さをそのまま合成に率
!1用していることに起因しており、従って発声のバラ
ツキや発声条件の変化など種々の変動要因のあろ巾から
適当な長さのCV素片を得ることには所詮無理かある。
−i7. ′F)、hかり部の長さをそのまま合成に率
!1用していることに起因しており、従って発声のバラ
ツキや発声条件の変化など種々の変動要因のあろ巾から
適当な長さのCV素片を得ることには所詮無理かある。
この発明の目的は、これらの問題点を除去し、容易な継
続時間uj御によって自然な合成音を得ることか出来る
音声ファイルの作成方法を提供することにある。
続時間uj御によって自然な合成音を得ることか出来る
音声ファイルの作成方法を提供することにある。
(問題−;、i、を解決するためのB段)この[」的の
達成を図るため、この発明の音声ファイル作成77法に
おいては、先ず、原音声分析時に、卯a声を48部、過
渡部及び11音定常部の区間に分割する。次に、こわら
の各々の区間において適当な分析フレーム周期(音声の
特徴を順次抽出していく時間的間隔)を設定する。この
場合、この分析フレーム周期は、合成時のフレーム周期
(音声の特徴パラメータを更新する時間周期〉とは必ず
しも 致しないものであり、このように設定された分析
フレーム周期を用いて前述の各々の区間を分析すること
によって音韻継続時間の伸縮を行なう。この音韻継続時
間の伸縮によってY・め各;[1節、特に1′−音部や
B)音)γちにかり部の長さを11成時に必要とされる
値に設定しておく。
達成を図るため、この発明の音声ファイル作成77法に
おいては、先ず、原音声分析時に、卯a声を48部、過
渡部及び11音定常部の区間に分割する。次に、こわら
の各々の区間において適当な分析フレーム周期(音声の
特徴を順次抽出していく時間的間隔)を設定する。この
場合、この分析フレーム周期は、合成時のフレーム周期
(音声の特徴パラメータを更新する時間周期〉とは必ず
しも 致しないものであり、このように設定された分析
フレーム周期を用いて前述の各々の区間を分析すること
によって音韻継続時間の伸縮を行なう。この音韻継続時
間の伸縮によってY・め各;[1節、特に1′−音部や
B)音)γちにかり部の長さを11成時に必要とされる
値に設定しておく。
このようなフレーム周期の伸縮は合成時に行なうことも
n1能であるか、合成器自身にフレーム長町変機構をそ
なえることは回路規模か増加し、さらにと9節の種類に
よって、又はγイ節内の各部分によって伸縮の割合が
定ではないため、その外々に灯して通iLなフレーム周
期を与えることは、いたずらにル(I御規則の複雑化を
招くことになる。
n1能であるか、合成器自身にフレーム長町変機構をそ
なえることは回路規模か増加し、さらにと9節の種類に
よって、又はγイ節内の各部分によって伸縮の割合が
定ではないため、その外々に灯して通iLなフレーム周
期を与えることは、いたずらにル(I御規則の複雑化を
招くことになる。
(作用)
このように、この発明ではこのよ゛)な桶々の状況を考
慮したフレーム伸縮を分析時にtめ行なっておき、合成
時にはある一定のフレーム周期を用いる方法を採用して
いる。
慮したフレーム伸縮を分析時にtめ行なっておき、合成
時にはある一定のフレーム周期を用いる方法を採用して
いる。
従って1合成時に発声速度に適正な長さを持った音声素
片が得らiると共に、音韻性を劣化させてなる音韻継続
時間の一制御を行なうことなく、合成音の品質四トが図
わる。
片が得らiると共に、音韻性を劣化させてなる音韻継続
時間の一制御を行なうことなく、合成音の品質四トが図
わる。
又、この発明によれば子音部と母音9.ちトがり部の時
間長のみを制御し、R11音定常の時間長制御を必要と
しないので、音韻継続時間の設定規則が8髪Jとなる。
間長のみを制御し、R11音定常の時間長制御を必要と
しないので、音韻継続時間の設定規則が8髪Jとなる。
(実施例)
以ド、図面を参照してこの発明の規則合成における音声
ファイル作成方法の実施例につき説明する。
ファイル作成方法の実施例につき説明する。
各音節のf−g一部とか母g部の立ちトかり部(過渡部
)とかの各部分の長さを適正化するためには、合成時の
状況に合った標準的な長さを定めておく必′捻かある1
、そのため、音声ファイル作成に先立って標準時間長テ
ーブルを作成する。このテーブル作成においては、合成
時の発声速度に適した音韻継続時間すなわち単3.7部
合成であれば中詰、文O合成であれば文RfH,声の中
でなるべく種々のFf韻環境での各に節芥部の長さを測
定し、その平均的値を第2図の如くテーブル化しておく
。ここでは分析処理を容易にするため、標準時間長テー
ブルの中の値は合成のフレーム長で表わすものとする。
)とかの各部分の長さを適正化するためには、合成時の
状況に合った標準的な長さを定めておく必′捻かある1
、そのため、音声ファイル作成に先立って標準時間長テ
ーブルを作成する。このテーブル作成においては、合成
時の発声速度に適した音韻継続時間すなわち単3.7部
合成であれば中詰、文O合成であれば文RfH,声の中
でなるべく種々のFf韻環境での各に節芥部の長さを測
定し、その平均的値を第2図の如くテーブル化しておく
。ここでは分析処理を容易にするため、標準時間長テー
ブルの中の値は合成のフレーム長で表わすものとする。
この第2図に記載したように、例えば「イ」の場合であ
るとr−音長「0」及び母音立ち上がり部長「4」であ
り、「ビョ」の場合にはf−音長「2J及び母&!γち
上かり部長「7」の如くである。
るとr−音長「0」及び母音立ち上がり部長「4」であ
り、「ビョ」の場合にはf−音長「2J及び母&!γち
上かり部長「7」の如くである。
第1図はこの発明による音声ファイル作成ト順の大まか
な流れを示す流れ図である。以ド、この流れ図に沿って
説明する。
な流れを示す流れ図である。以ド、この流れ図に沿って
説明する。
初めに話者によって発声ざわたl(声を8KH7で標本
化したものを原音声データとして取り込む(Sl+)。
化したものを原音声データとして取り込む(Sl+)。
次に、原音声データからCv区間の切り出しを行なう(
512)。次に切り出さねたC■音節に対し、Cv音節
内部を第3図に示すように′r−音部、過鵡部及び母音
定常部に区分けする(S13)。第3図において(1+
−1,+ )区間はf−音部を、(+2−+3)区間
は過渡部である母音立ち七かり部を、(+3−+4 )
区間はf:) if定定常分それぞれ表ね4−3これら
の分割点の決定は視察によって定める。次に、各部の時
間長(t+ t 2 ) 、 (+2
−t) ) El、び (t 、 −+4
)f−それぞれ算出する(5口)。このように分割され
た区間において、母高定常部を除くT−音部と母音立ち
北かり部に対して、標準時間長テーブル10を参照しな
がら、分析フレーム周期をそれぞれ決定する。各部の分
析フレーム周期は以Fの如く算出して決定する( S
+5)。
512)。次に切り出さねたC■音節に対し、Cv音節
内部を第3図に示すように′r−音部、過鵡部及び母音
定常部に区分けする(S13)。第3図において(1+
−1,+ )区間はf−音部を、(+2−+3)区間
は過渡部である母音立ち七かり部を、(+3−+4 )
区間はf:) if定定常分それぞれ表ね4−3これら
の分割点の決定は視察によって定める。次に、各部の時
間長(t+ t 2 ) 、 (+2
−t) ) El、び (t 、 −+4
)f−それぞれ算出する(5口)。このように分割され
た区間において、母高定常部を除くT−音部と母音立ち
北かり部に対して、標準時間長テーブル10を参照しな
がら、分析フレーム周期をそれぞれ決定する。各部の分
析フレーム周期は以Fの如く算出して決定する( S
+5)。
Fc = (+2−t+ )/Lc
F工=(11□I−+2)/L工
F c + f’ pf部の分析フレーム周期FT
、1号音yγちトがり部の分析フレーム周期Lc ;標
準時間長テーブルにおける当1該音節f−9部のフレー
ム数 しT:標準時間長テーブルにおける当該音節母音ケちヒ
かり部のフレーム数 n上音定常部に関しては発声速度の影響による訝韻性の
変化かあまりないため、この実り’ts例では合成時と
同し分析フレーム周j■1に設定する。しかし、所要に
応し合成時と異なる分析フレーム周期を設定1−ること
も出来る。
、1号音yγちトがり部の分析フレーム周期Lc ;標
準時間長テーブルにおける当1該音節f−9部のフレー
ム数 しT:標準時間長テーブルにおける当該音節母音ケちヒ
かり部のフレーム数 n上音定常部に関しては発声速度の影響による訝韻性の
変化かあまりないため、この実り’ts例では合成時と
同し分析フレーム周j■1に設定する。しかし、所要に
応し合成時と異なる分析フレーム周期を設定1−ること
も出来る。
以にのように設定された分析フレーム周期にて各部分の
分析を行ない5分析フレーム周期毎に分析を行なうこと
によりrt声パラメータ(合成器における合成方式に応
じたパラメータ例えばPARCOR係数、LSPパラメ
ータ、LPG係数なと)の抽出を行ない(S16)、そ
の結果をj′1節11FにCV音節ファイル12に格納
する(S17)。
分析を行ない5分析フレーム周期毎に分析を行なうこと
によりrt声パラメータ(合成器における合成方式に応
じたパラメータ例えばPARCOR係数、LSPパラメ
ータ、LPG係数なと)の抽出を行ない(S16)、そ
の結果をj′1節11FにCV音節ファイル12に格納
する(S17)。
第4図にこのようにして作成されたg声ファイルを用い
た合成rfと原音声との時間関係を示す。
た合成rfと原音声との時間関係を示す。
図示の例は原?<Fkの発声か又は連続1゛冑jlを合
成するためのCv素片としては発ノitかゆっく0でC
v素片が非常に長くなる例を示したものて、原ど−ji
I分析時の分析フレーム周期を合成時の分析フレーム周
+111より長くとることによって合成時における繕続
時間をJgロニ化したものである。
成するためのCv素片としては発ノitかゆっく0でC
v素片が非常に長くなる例を示したものて、原ど−ji
I分析時の分析フレーム周期を合成時の分析フレーム周
+111より長くとることによって合成時における繕続
時間をJgロニ化したものである。
例えば、j皇rイ声データでのrUf部のこ’j l’
lff継続11.?間が200m5であるとし、かつ合
成時の分析フレーム周期かtom sであるとする。こ
の場合、例えば音声ファイル作成時の分析フレーム周1
ullを40m sとすると、合成時のlom sの分
析フレーム周期が1つのg Kパラメータ用として用い
られるので、合成時に40/1o=4すなわち4つの音
韻パラメータで合成され音声か出力される。
lff継続11.?間が200m5であるとし、かつ合
成時の分析フレーム周期かtom sであるとする。こ
の場合、例えば音声ファイル作成時の分析フレーム周1
ullを40m sとすると、合成時のlom sの分
析フレーム周期が1つのg Kパラメータ用として用い
られるので、合成時に40/1o=4すなわち4つの音
韻パラメータで合成され音声か出力される。
第5図はこの発明の実施例を実行するための装置の一構
数例を示すブロック図を示す。第4図において14は音
声を人力する入力端f−116はローパスフィルタ、I
8はA/D変換器、20はセグメンテーション部、22
はグラフィックディスプレイ装置、24はセグメンテー
ションテーブル、2F+は分析フレーム周期決定部、l
Oは前述した標準時間長テーブル、28は音声パラメー
タ分析部、12は前述した音声素片用の音声ファイルで
ある。以F、動作を説明−4−る。
数例を示すブロック図を示す。第4図において14は音
声を人力する入力端f−116はローパスフィルタ、I
8はA/D変換器、20はセグメンテーション部、22
はグラフィックディスプレイ装置、24はセグメンテー
ションテーブル、2F+は分析フレーム周期決定部、l
Oは前述した標準時間長テーブル、28は音声パラメー
タ分析部、12は前述した音声素片用の音声ファイルで
ある。以F、動作を説明−4−る。
まず、入力Q T−I Aより原音声データを人力し、
ローパスフィルタ16によって不要な高域成分を取り除
いた後、A/D変換器18によってディジタル化する。
ローパスフィルタ16によって不要な高域成分を取り除
いた後、A/D変換器18によってディジタル化する。
セグメンテーション部20ではA/D変換器18からの
ディジタル化音声データからCV音節の切り出しを行な
った後、このCv音節をグラフィックディスプレイ装置
22に表示し、二わを視察によって第3図に示したよう
にCv跨計部の区分分けを行なう。ここで決定された分
割点はセグメンテーションテーブル24に格納される。
ディジタル化音声データからCV音節の切り出しを行な
った後、このCv音節をグラフィックディスプレイ装置
22に表示し、二わを視察によって第3図に示したよう
にCv跨計部の区分分けを行なう。ここで決定された分
割点はセグメンテーションテーブル24に格納される。
分析フレーム周期決定部26ではセグメンテーションテ
ーブル24及び標準時間長デープルlOの情報をもとに
分割さiたCV音節内の各部における分析フLノーム周
朋を決定する。
ーブル24及び標準時間長デープルlOの情報をもとに
分割さiたCV音節内の各部における分析フLノーム周
朋を決定する。
このように決定された分析フレーム周期を用いて分析部
28ではセグメンテーション部20からの音声データを
分析し、音声素片パラメータを作成し、その結果を音声
ファイルI2に格納−)−る。
28ではセグメンテーション部20からの音声データを
分析し、音声素片パラメータを作成し、その結果を音声
ファイルI2に格納−)−る。
卜述した実施例では、この発明をCV音簡に1)き説明
したが、これに限定されるものではなく、vcvg節、
CvC&節、その他の筒部にもこの発明を通用出来るこ
とか明らかである。
したが、これに限定されるものではなく、vcvg節、
CvC&節、その他の筒部にもこの発明を通用出来るこ
とか明らかである。
(発明の効果)
上述した説明から明らかなように、この発明によれば原
音声の発声速度の如何んにかかわらず。
音声の発声速度の如何んにかかわらず。
適正な長さを持った音声素片か得られ、規則合成時に音
韻性を劣化させるような継続時間制御をする必要がなく
合成音の品質が向トする。又、f音部や母音ケち七かり
部分では合成時に時間長をあまり制御する必要かなくな
るため、継続時間の設定規則か容易になる。
韻性を劣化させるような継続時間制御をする必要がなく
合成音の品質が向トする。又、f音部や母音ケち七かり
部分では合成時に時間長をあまり制御する必要かなくな
るため、継続時間の設定規則か容易になる。
第1図はこの発明の音声ファイル作成方法の説明に供す
るg声ファイル作成f順を示す流れ図、第2図はこの発
明の説明に供する標準時間長テーブルを示す図、 第3図はこの発明の説明に供するCV音節内の分割の方
法を説明するための図、 第4図はこの発明の説明に供する原音声と合成音の時間
関係の一例を示す図、 第5図はこの発明を実行するための音声作成ファぞル装
置の一構数例を示すブロック図。 第6図は従来及びこの発明の説明に供する法則合成の基
本的流れ図、 第7図は従来の計部の長さの調整力法を説明するための
説明図、 第8図は従来の音筒長の伸縮を説明1−るだめの説明図
である。 10・・・標準時間長テーブル 12・・・r1声ファイル、 14・・・人力端子
−16・・・ローパスフィルタ 18・・・A/D変換器 20・・・セグメンテーション部 22・・・クラフィックディスプレイ装置24・・・セ
グメンテーションテーブル26・・・分析フレーム周期
決定部 28・・・rS声パラメータ分析部。 特許出願人 沖電気IJ株式会社樽 !−1I、
M表ラーフ・し 七〉フ7・1ル・:−〆に、キ・・執こ几れ2第り図 Aシー1 5草 瞬 Pa5 長 デデ″ −フ″ ノ
L。 第2図 I?1−
るg声ファイル作成f順を示す流れ図、第2図はこの発
明の説明に供する標準時間長テーブルを示す図、 第3図はこの発明の説明に供するCV音節内の分割の方
法を説明するための図、 第4図はこの発明の説明に供する原音声と合成音の時間
関係の一例を示す図、 第5図はこの発明を実行するための音声作成ファぞル装
置の一構数例を示すブロック図。 第6図は従来及びこの発明の説明に供する法則合成の基
本的流れ図、 第7図は従来の計部の長さの調整力法を説明するための
説明図、 第8図は従来の音筒長の伸縮を説明1−るだめの説明図
である。 10・・・標準時間長テーブル 12・・・r1声ファイル、 14・・・人力端子
−16・・・ローパスフィルタ 18・・・A/D変換器 20・・・セグメンテーション部 22・・・クラフィックディスプレイ装置24・・・セ
グメンテーションテーブル26・・・分析フレーム周期
決定部 28・・・rS声パラメータ分析部。 特許出願人 沖電気IJ株式会社樽 !−1I、
M表ラーフ・し 七〉フ7・1ル・:−〆に、キ・・執こ几れ2第り図 Aシー1 5草 瞬 Pa5 長 デデ″ −フ″ ノ
L。 第2図 I?1−
Claims (2)
- (1)文字列又は音韻記号などを入力として任意の音声
を合成する規則音声合成に用いる音声ファイルを作成す
るに当り、 原音声分析時に原音声を子音部、過渡部及び母音定常部
の区間に分割し、 これらの各々の区間において適当な分析フレーム周期を
それぞれ設定し、 これら分析フレーム周期を用いて各々の前記区間を分析
することによって原音声における音韻継続時間を伸縮す
ることによって該音韻継続時間を合成時の発声速度に適
した長さに予め設定しておくことを特徴とする音声ファ
イル作成方法。 - (2)分析フレーム周期の設定は、種々の音韻環境での
各音節における子音部、過渡部及び母音定常部の各区間
のそれぞれの長さ平均値が格納された標準時間長テーブ
ルを参照して行なうことを特徴とする特許請求の範囲第
1項に記載の音声ファイル作成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61126807A JPH0756599B2 (ja) | 1986-05-31 | 1986-05-31 | 音声フアイル作成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61126807A JPH0756599B2 (ja) | 1986-05-31 | 1986-05-31 | 音声フアイル作成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62283399A true JPS62283399A (ja) | 1987-12-09 |
JPH0756599B2 JPH0756599B2 (ja) | 1995-06-14 |
Family
ID=14944444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61126807A Expired - Lifetime JPH0756599B2 (ja) | 1986-05-31 | 1986-05-31 | 音声フアイル作成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0756599B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63223697A (ja) * | 1987-03-12 | 1988-09-19 | 富士通株式会社 | 音声規則合成用パラメ−タの作成方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56129000A (en) * | 1980-03-14 | 1981-10-08 | Hitachi Ltd | Wind hanging calculator |
JPS5730899A (en) * | 1980-08-01 | 1982-02-19 | Fujitsu Ltd | Frame synchronization control system |
-
1986
- 1986-05-31 JP JP61126807A patent/JPH0756599B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56129000A (en) * | 1980-03-14 | 1981-10-08 | Hitachi Ltd | Wind hanging calculator |
JPS5730899A (en) * | 1980-08-01 | 1982-02-19 | Fujitsu Ltd | Frame synchronization control system |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63223697A (ja) * | 1987-03-12 | 1988-09-19 | 富士通株式会社 | 音声規則合成用パラメ−タの作成方法 |
Also Published As
Publication number | Publication date |
---|---|
JPH0756599B2 (ja) | 1995-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS62160495A (ja) | 音声合成装置 | |
JP3587048B2 (ja) | 韻律制御方法及び音声合成装置 | |
JPH0632020B2 (ja) | 音声合成方法および装置 | |
US6424937B1 (en) | Fundamental frequency pattern generator, method and program | |
JP2761552B2 (ja) | 音声合成方法 | |
US6829577B1 (en) | Generating non-stationary additive noise for addition to synthesized speech | |
JP3109778B2 (ja) | 音声規則合成装置 | |
JPS62283399A (ja) | 音声フアイル作成方法 | |
JPS5972494A (ja) | 規則合成方式 | |
JP3235747B2 (ja) | 音声合成装置及び音声合成方法 | |
JP3622990B2 (ja) | 音声合成装置及び方法 | |
JP3614874B2 (ja) | 音声合成装置及び方法 | |
JP3113101B2 (ja) | 音声合成装置 | |
JPH11249676A (ja) | 音声合成装置 | |
JPH05134691A (ja) | 音声合成方法および装置 | |
JP3310217B2 (ja) | 音声合成方法とその装置 | |
JPH06250685A (ja) | 音声合成方式および規則合成装置 | |
JPH0836397A (ja) | 音声合成装置 | |
JPS63208098A (ja) | 音声合成装置および方法 | |
JP2573585B2 (ja) | 音声スペクトルパタン生成装置 | |
JP3088211B2 (ja) | 基本周波数パタン生成装置 | |
JPH0756589A (ja) | 音声合成方法 | |
JPH02238497A (ja) | 音声合成方法 | |
JPH08160990A (ja) | 音声合成装置 | |
JPH06161490A (ja) | 音声合成装置の韻律処理方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |