JPS63110500A - 音声時間長デ−タ生成装置 - Google Patents
音声時間長デ−タ生成装置Info
- Publication number
- JPS63110500A JPS63110500A JP25749186A JP25749186A JPS63110500A JP S63110500 A JPS63110500 A JP S63110500A JP 25749186 A JP25749186 A JP 25749186A JP 25749186 A JP25749186 A JP 25749186A JP S63110500 A JPS63110500 A JP S63110500A
- Authority
- JP
- Japan
- Prior art keywords
- time length
- speech
- information
- value
- signal line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006835 compression Effects 0.000 description 10
- 238000007906 compression Methods 0.000 description 10
- 238000000034 method Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000033764 rhythmic process Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 230000001020 rhythmical effect Effects 0.000 description 1
Landscapes
- Selective Calling Equipment (AREA)
- Electric Clocks (AREA)
- Traffic Control Systems (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、文字列などの音声を表す情報から規則により
音声を合成する際に、音素などの合成の単位となる音声
の時間長データを生成する装置に関するものである。
音声を合成する際に、音素などの合成の単位となる音声
の時間長データを生成する装置に関するものである。
(従来の技術)
任意の文章や単語の読み等を表す文字列から音声を合成
するいわゆる音声の規則合成においては、音声合成すべ
き文章などの音素系列や、単語のアクセント等にもとづ
いて、音素などの合成の単位となる音声の時間長データ
を決定することが、自然なリズムの合成音声を生成する
なめに重要である。
するいわゆる音声の規則合成においては、音声合成すべ
き文章などの音素系列や、単語のアクセント等にもとづ
いて、音素などの合成の単位となる音声の時間長データ
を決定することが、自然なリズムの合成音声を生成する
なめに重要である。
このような例は、三位と伏木田による日本音響学会音声
研究会資料585−31(1985゜7)、「ホルマン
ト、cv−vc型規則合成」に示されている。これは、
音声合成規則として、時間長規則、ピッチ規則、ポーズ
規則、パラメータ編集規則などがあり、あらかじめ自然
音声を分析して得られたCv−VC(Cは子音Vは母音
を表す)を単位とするホルマントパラメータを編集し、
それをホルマント型音声合成器に与えることで任意の音
声を合成するものである。
研究会資料585−31(1985゜7)、「ホルマン
ト、cv−vc型規則合成」に示されている。これは、
音声合成規則として、時間長規則、ピッチ規則、ポーズ
規則、パラメータ編集規則などがあり、あらかじめ自然
音声を分析して得られたCv−VC(Cは子音Vは母音
を表す)を単位とするホルマントパラメータを編集し、
それをホルマント型音声合成器に与えることで任意の音
声を合成するものである。
これらの諸規則の内、時間長規則は、音素系列、単語の
長さ、文章中の単語の位置、アクセントの位置などに基
づいて単位音声中の音素の時間長を決定する規則である
。即ちまず、あらかじめ用意された各音素の時間長既定
値のデータをテーブルから読みだし、続いて単語の長さ
や位置、アクセントの位置によって決まる時間長の圧縮
率を求め、その値に基づいて時間長既定値を圧縮して時
間長を決定するものである。
長さ、文章中の単語の位置、アクセントの位置などに基
づいて単位音声中の音素の時間長を決定する規則である
。即ちまず、あらかじめ用意された各音素の時間長既定
値のデータをテーブルから読みだし、続いて単語の長さ
や位置、アクセントの位置によって決まる時間長の圧縮
率を求め、その値に基づいて時間長既定値を圧縮して時
間長を決定するものである。
他にも時間長を決定するいくつかの方法が知られている
が、それらの例に共通するのは、入力の音声情報に対し
て条件の適合する諸規則に従って時間長データの値を決
定し、それに基づいて音声を合成することである。
が、それらの例に共通するのは、入力の音声情報に対し
て条件の適合する諸規則に従って時間長データの値を決
定し、それに基づいて音声を合成することである。
(発明が解決しようとする問題点)
しかしながら、このような従来の音声時間長データ生成
装置においては、同一の文章あるいは単語などは、常に
同一の規則が適用されるため、常に同じように発音され
ることになる。そのため、従来の音声時間長データ生成
装置によって生成された時間長データに基づく合成音声
は機械的で不自然な印象をうけ、長時間聞くと疲れると
いっな問題があった。
装置においては、同一の文章あるいは単語などは、常に
同一の規則が適用されるため、常に同じように発音され
ることになる。そのため、従来の音声時間長データ生成
装置によって生成された時間長データに基づく合成音声
は機械的で不自然な印象をうけ、長時間聞くと疲れると
いっな問題があった。
単語や単文が長文の一部として現れる場合には、前後関
係が異なるならば、規則によっては少し異なって合成さ
れる場合もある。しかし、単語などが句読点によって区
切られm独で現れ、規則がその前後を考慮しないような
場合にはいつも同じ様に合成されることになる。
係が異なるならば、規則によっては少し異なって合成さ
れる場合もある。しかし、単語などが句読点によって区
切られm独で現れ、規則がその前後を考慮しないような
場合にはいつも同じ様に合成されることになる。
このような状況は、テキストが長くなればなるほど発生
する可能性が高くなり、不自然さが目立つことになる。
する可能性が高くなり、不自然さが目立つことになる。
本発明の目的は、従来の音声時間長データ生成装置に若
干の回路を追加した程度の筒中な構成で、より自然な音
声を合成し得る音声時間長データ生成装置を提供するこ
とにある。
干の回路を追加した程度の筒中な構成で、より自然な音
声を合成し得る音声時間長データ生成装置を提供するこ
とにある。
(問題点を解決するための手段)
前述の問題点を解決するために本発明が提供する手段は
、音素系列、アクセント情報、構文情報などの音声情報
に基づいて音声時間長データの値を決定する手段を有す
る音声時間長データ生成装置であって、ランダムデータ
を発生ずる手段と、そのランダムデータの値に応じて前
記の音声時間長データの値を変化させる手段とを更に有
することを特徴とする。
、音素系列、アクセント情報、構文情報などの音声情報
に基づいて音声時間長データの値を決定する手段を有す
る音声時間長データ生成装置であって、ランダムデータ
を発生ずる手段と、そのランダムデータの値に応じて前
記の音声時間長データの値を変化させる手段とを更に有
することを特徴とする。
(作用)
本発明は、音素系列、アクセント情報、構文情報などの
音声情報に基づいて、従来と同様に音声の時間長の値を
決定し、それをランタムに変化させて音声を合成するこ
とにより、機械的な合成音声の発生を避けようとするも
のである。これは、実際に人間が同一の文章などを音読
する場合には、韻律やリズムなどは発声の度に確率的に
揺らぐという性質があり、それを実現することで自然性
を向上させようとするものである。そのために、ランダ
ムデータを発生する手段によって生成されたランダムデ
ータに応じて、音声時間長の値を変化させる手段により
、従来と同様に決定された音声時間長の値を変化させる
のである。
音声情報に基づいて、従来と同様に音声の時間長の値を
決定し、それをランタムに変化させて音声を合成するこ
とにより、機械的な合成音声の発生を避けようとするも
のである。これは、実際に人間が同一の文章などを音読
する場合には、韻律やリズムなどは発声の度に確率的に
揺らぐという性質があり、それを実現することで自然性
を向上させようとするものである。そのために、ランダ
ムデータを発生する手段によって生成されたランダムデ
ータに応じて、音声時間長の値を変化させる手段により
、従来と同様に決定された音声時間長の値を変化させる
のである。
このとき、あらかじめ実際に人間が発声した音声を分析
して、音声時間長の値の統計的な分布を調べておき、そ
の分布にもとづいて音声時間長の値の変化させる量を決
定することで、より自然なリズムの合成音が得られる。
して、音声時間長の値の統計的な分布を調べておき、そ
の分布にもとづいて音声時間長の値の変化させる量を決
定することで、より自然なリズムの合成音が得られる。
ランダムデータを発生ずる手段としては、従来から合同
法によるものやM系列によるもの等が知られており、い
ずれの方法に基づくものでも利用可能である。
法によるものやM系列によるもの等が知られており、い
ずれの方法に基づくものでも利用可能である。
(実施例)
次に、図面を用いて本発明の詳細な説明する。
第1図は、本発明の一実施例のブロック図である。図に
おいて、101は制御回路、102は時間長既定値メモ
リ、103は圧縮率算出回路、104は時間長圧縮器、
105は乱数発生回路、106は加算器である。
おいて、101は制御回路、102は時間長既定値メモ
リ、103は圧縮率算出回路、104は時間長圧縮器、
105は乱数発生回路、106は加算器である。
時間長既定値メモリ 102には、各音素の時間長の既
定値が記憶されており、信号線113を介して制御回路
101から送られる音素情報に対応する時間長既定値が
信号線115を介して時間長圧縮器104に送られる。
定値が記憶されており、信号線113を介して制御回路
101から送られる音素情報に対応する時間長既定値が
信号線115を介して時間長圧縮器104に送られる。
圧縮率算出回路103は、信号線114を介して制御回
路101から送られる単語の長さ、文章中の単語の位置
、アクセントの位置などの情報(以下、これらを構文情
報と呼ぶ)に基づいて時間長の圧縮率を算出し、信号線
116を介して時間長圧縮器104に送る。
路101から送られる単語の長さ、文章中の単語の位置
、アクセントの位置などの情報(以下、これらを構文情
報と呼ぶ)に基づいて時間長の圧縮率を算出し、信号線
116を介して時間長圧縮器104に送る。
時間長圧縮器104は、制御回路から送られる指示に従
って、時間長既定値メモリ 102から送られる時間長
既定値を圧縮率算出図j@103から送られる圧縮率に
基づいて圧縮して決定した時間長を信号線118へと送
出する。
って、時間長既定値メモリ 102から送られる時間長
既定値を圧縮率算出図j@103から送られる圧縮率に
基づいて圧縮して決定した時間長を信号線118へと送
出する。
乱数発生回1ii105では、音声時間長の値の統計的
な分布の範囲内の値をとる乱数が、信号線119を介し
て制御口F!@101から送られる指示に従って発生さ
れる、信号線120を介して加算器106に送られる。
な分布の範囲内の値をとる乱数が、信号線119を介し
て制御口F!@101から送られる指示に従って発生さ
れる、信号線120を介して加算器106に送られる。
制御回路101は、信号線111から入力される音素情
報を信号線113を介して時間長既定値メモリ102に
送り時間長既定値を出力させ、構文情報を信号線114
を介して圧縮率算出回路103に送り圧縮率を算出させ
る。更に、信号線117を介して時間長圧縮器104に
指示を送り、圧縮した時間長を算出させる。また、乱数
発生回路105に指示を送り乱数を発生させる。
報を信号線113を介して時間長既定値メモリ102に
送り時間長既定値を出力させ、構文情報を信号線114
を介して圧縮率算出回路103に送り圧縮率を算出させ
る。更に、信号線117を介して時間長圧縮器104に
指示を送り、圧縮した時間長を算出させる。また、乱数
発生回路105に指示を送り乱数を発生させる。
加算器106では、時間長圧縮器104で決定された時
間長に対し乱数発生回路105で生成された乱数が加算
され最終的な時間長データとして信号線112から出力
される。
間長に対し乱数発生回路105で生成された乱数が加算
され最終的な時間長データとして信号線112から出力
される。
(発明の効果)
以上説明したように、本発明によれば、合成しようとす
る音声情報に同一の表現が繰り返し現れても、音声の時
間長データの値がその都度微妙に異なった値がとられる
ため、自然な合成音が得られるという効果がある。
る音声情報に同一の表現が繰り返し現れても、音声の時
間長データの値がその都度微妙に異なった値がとられる
ため、自然な合成音が得られるという効果がある。
第1図は、本発明の一実施例のブロック図である。
図において、101は制御回路、102は時間長既定値
メモリ、103は圧縮率算出回路、104は時間長圧縮
器、105は乱数発生回路、106は加算器である。
メモリ、103は圧縮率算出回路、104は時間長圧縮
器、105は乱数発生回路、106は加算器である。
Claims (1)
- 音素系列、アクセント情報、構文情報などの音声情報に
基づいて音声時間長データの値を決定する手段を有する
音声時間長データ生成装置において、ランダムデータを
発生する手段と、そのランダムデータの値に応じて前記
の音声時間長データの値を変化させる手段とを更に有す
ることを特徴とする音声時間長データ生成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25749186A JPS63110500A (ja) | 1986-10-29 | 1986-10-29 | 音声時間長デ−タ生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25749186A JPS63110500A (ja) | 1986-10-29 | 1986-10-29 | 音声時間長デ−タ生成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63110500A true JPS63110500A (ja) | 1988-05-14 |
Family
ID=17307025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP25749186A Pending JPS63110500A (ja) | 1986-10-29 | 1986-10-29 | 音声時間長デ−タ生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63110500A (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5660499A (en) * | 1979-10-22 | 1981-05-25 | Casio Computer Co Ltd | Audible sounddsource circuit for voice synthesizer |
JPS59123889A (ja) * | 1982-12-29 | 1984-07-17 | 富士通株式会社 | 音声編集合成処理方式 |
JPS61122700A (ja) * | 1984-11-19 | 1986-06-10 | 富士通株式会社 | 合成音声発声速度制御方式 |
-
1986
- 1986-10-29 JP JP25749186A patent/JPS63110500A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5660499A (en) * | 1979-10-22 | 1981-05-25 | Casio Computer Co Ltd | Audible sounddsource circuit for voice synthesizer |
JPS59123889A (ja) * | 1982-12-29 | 1984-07-17 | 富士通株式会社 | 音声編集合成処理方式 |
JPS61122700A (ja) * | 1984-11-19 | 1986-06-10 | 富士通株式会社 | 合成音声発声速度制御方式 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001034283A (ja) | 音声合成方法、音声合成装置及び音声合成プログラムを記録したコンピュータ読み取り可能な媒体 | |
JPS62160495A (ja) | 音声合成装置 | |
JPS62231998A (ja) | 音声合成方法および装置 | |
CA2343071A1 (en) | Device and method for digital voice processing | |
JPS63110500A (ja) | 音声時間長デ−タ生成装置 | |
JP2573586B2 (ja) | 規則型音声合成装置 | |
JP2894447B2 (ja) | 複合音声単位を用いた音声合成装置 | |
JP2642617B2 (ja) | 音声合成装置 | |
JPH05224688A (ja) | テキスト音声合成装置 | |
JP2573587B2 (ja) | ピッチパタン生成装置 | |
JP2573585B2 (ja) | 音声スペクトルパタン生成装置 | |
JP2577372B2 (ja) | 音声合成装置および方法 | |
JP2536896B2 (ja) | 音声合成装置 | |
JPH03160500A (ja) | 音声合成装置 | |
JP2844588B2 (ja) | 波形編集型音声合成装置 | |
JP2586040B2 (ja) | 音声編集合成装置 | |
JP3284634B2 (ja) | 規則音声合成装置 | |
JPH06250685A (ja) | 音声合成方式および規則合成装置 | |
JPH0553595A (ja) | 音声合成装置 | |
JPS63262699A (ja) | 音声分析,合成装置 | |
JPH01118200A (ja) | 音声合成方式 | |
JP2001166787A (ja) | 音声合成装置および自然言語処理方法 | |
JPH037994A (ja) | 歌音声合成データの作成装置 | |
JPH04243299A (ja) | 音声出力装置 | |
JPH01274199A (ja) | ピッチパタン生成装置 |