JPS63231398A - ポ−ズ長制御方式 - Google Patents
ポ−ズ長制御方式Info
- Publication number
- JPS63231398A JPS63231398A JP62065184A JP6518487A JPS63231398A JP S63231398 A JPS63231398 A JP S63231398A JP 62065184 A JP62065184 A JP 62065184A JP 6518487 A JP6518487 A JP 6518487A JP S63231398 A JPS63231398 A JP S63231398A
- Authority
- JP
- Japan
- Prior art keywords
- pause
- prediction model
- pause length
- length
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000002789 length control Methods 0.000 title claims description 7
- 238000000034 method Methods 0.000 claims description 9
- 238000003780 insertion Methods 0.000 claims description 6
- 230000037431 insertion Effects 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 238000003786 synthesis reaction Methods 0.000 claims description 5
- 238000000611 regression analysis Methods 0.000 claims description 4
- 238000007619 statistical method Methods 0.000 claims description 4
- 238000011002 quantification Methods 0.000 claims description 3
- 241001417093 Moridae Species 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 1
- JHIVVAPYMSGYDF-UHFFFAOYSA-N cyclohexanone Chemical compound O=C1CCCCC1 JHIVVAPYMSGYDF-UHFFFAOYSA-N 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
致生公互
本発明は、規則音声合成のポーズ長制御方式に関する。
因米蔓生
音声合成において自然な韻律を付加するために、ピッチ
、振幅、音韻時間長、ポーズ長等を制御する韻律制御規
則が不可欠である。これらのうちポーズ長制御について
は、句読点や係受けの深さなどに対応した数種類のポー
ズ長を、予め経験的に設定しておき、その内の1つを選
択して用いる方法が提゛案されている。この様な方法で
は、種々のポーズ挿入位置において、様々な条件に対す
るポーズ長の微妙な変化を再現することは難かしい。
、振幅、音韻時間長、ポーズ長等を制御する韻律制御規
則が不可欠である。これらのうちポーズ長制御について
は、句読点や係受けの深さなどに対応した数種類のポー
ズ長を、予め経験的に設定しておき、その内の1つを選
択して用いる方法が提゛案されている。この様な方法で
は、種々のポーズ挿入位置において、様々な条件に対す
るポーズ長の微妙な変化を再現することは難かしい。
月−一二向
本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声の規則合成において、韻律の自然性を高める
ように合成音声のポーズ長を制御することを目的として
なされたものである。
特に、音声の規則合成において、韻律の自然性を高める
ように合成音声のポーズ長を制御することを目的として
なされたものである。
且−一腹
本発明は、上記目的を達成するために、予め用意した音
声素片のパラメータ系列を入力文字列に従って読み出し
、結合規則によって接続し、韻律規則によって韻律を付
加する音声規則合成装置において、指定されたポーズ挿
入位置における種々のパラメータを多変量統計解析的に
処理して最適な制御値を得ることを特徴としたものであ
る。以下、本発明の実施例に基づいて説明する。
声素片のパラメータ系列を入力文字列に従って読み出し
、結合規則によって接続し、韻律規則によって韻律を付
加する音声規則合成装置において、指定されたポーズ挿
入位置における種々のパラメータを多変量統計解析的に
処理して最適な制御値を得ることを特徴としたものであ
る。以下、本発明の実施例に基づいて説明する。
本発明は、自然なポーズ長を制御するために、ポーズ長
に影響を与えると考えられる種々のパラメータを同時に
扱い、多変量統計解析的処理によってパラメータ全体と
して最適な予測値を得る制御モデルを作り、これによっ
て制御するものである。
に影響を与えると考えられる種々のパラメータを同時に
扱い、多変量統計解析的処理によってパラメータ全体と
して最適な予測値を得る制御モデルを作り、これによっ
て制御するものである。
第1図は、本発明の一実施例を説明するための要部構成
図で、この実施例は、ポーズ長に影響を与えると考えら
れる。定性的パラメータ(ポーズ直前の品詞あるいは句
読点などの記号の種類。
図で、この実施例は、ポーズ長に影響を与えると考えら
れる。定性的パラメータ(ポーズ直前の品詞あるいは句
読点などの記号の種類。
ポーズ前後の係受けの種類と深さ、ポーズ間のモーラ数
等)を用いて数量化1類を行うことによって実測値との
2乗誤差を最小にする予測モデルを作り、この予測モデ
ルによって制御するようにしたものである。第1図にお
いて、δ(、、)。
等)を用いて数量化1類を行うことによって実測値との
2乗誤差を最小にする予測モデルを作り、この予測モデ
ルによって制御するようにしたものである。第1図にお
いて、δ(、、)。
δ(,2)、・・・δ(1n)は定性的パラメータ、P
は実測値、alll a1□、・・・amnは演算回路
、1は加算回路、2は減算回路、Pは予測値、Eは誤差
で、実際に発声された文音声中のポーズ長を外的基準に
とり、そのポーズ位置における各種の定性パラメータを
要因アイテムに取り、数量化I類分析を行うことによっ
て制御モデルを設定する。これは、i番目のポーズ挿入
位置におけるポーズ長の予測値をP、、実測値をp、と
するときに、次の(1)、(2)式を満たすようなaj
t値を求めることである。
は実測値、alll a1□、・・・amnは演算回路
、1は加算回路、2は減算回路、Pは予測値、Eは誤差
で、実際に発声された文音声中のポーズ長を外的基準に
とり、そのポーズ位置における各種の定性パラメータを
要因アイテムに取り、数量化I類分析を行うことによっ
て制御モデルを設定する。これは、i番目のポーズ挿入
位置におけるポーズ長の予測値をP、、実測値をp、と
するときに、次の(1)、(2)式を満たすようなaj
t値を求めることである。
P、=ΣΣajk81(jk) −−(1)Σ(P−
−p−)”→最小・・・(2)1 ま ただし、δL (jk)はi番目のポーズ挿入位置が要
因アイテムjのカテゴリーkに反応するときに1゜そう
でない時に0をとる関数とする。要因アイテムとしては
、ポーズ直前の品詞あるいは句読点などの記号の種類、
ポーズ前後の係受けの種類と深さ、ポーズ間のモーラ数
などが考えられる。このように構成されたモデル((1
)式)によって、求めるべきポーズ挿入位置でのδ−(
jk)を入力としてその位置におけるポーズ長子測値を
求めることができる。
−p−)”→最小・・・(2)1 ま ただし、δL (jk)はi番目のポーズ挿入位置が要
因アイテムjのカテゴリーkに反応するときに1゜そう
でない時に0をとる関数とする。要因アイテムとしては
、ポーズ直前の品詞あるいは句読点などの記号の種類、
ポーズ前後の係受けの種類と深さ、ポーズ間のモーラ数
などが考えられる。このように構成されたモデル((1
)式)によって、求めるべきポーズ挿入位置でのδ−(
jk)を入力としてその位置におけるポーズ長子測値を
求めることができる。
第2図は、本発明の他の実施例を説明するための要部構
成図で、この実施例は、ポーズ長に影響を与えると考え
られる。定量的パラメータ(発語スピード、ポーズ間モ
ーラ数、ポーズ直前単語の係受は先との距離等)を用い
て線形重回帰分析を行うことによって実測値との2乗誤
差を最小にする予測モデルを作り、これによって制御す
るようにしたものである。第2図において、X、、 X
、。
成図で、この実施例は、ポーズ長に影響を与えると考え
られる。定量的パラメータ(発語スピード、ポーズ間モ
ーラ数、ポーズ直前単語の係受は先との距離等)を用い
て線形重回帰分析を行うことによって実測値との2乗誤
差を最小にする予測モデルを作り、これによって制御す
るようにしたものである。第2図において、X、、 X
、。
・・・Xnは定量的パラメータ、b工0.b1□・・・
b+mnは演算回路、1は加算回路、2は減算回路、p
は実測値、Pは予測値、Eは誤差で、この実施例は、実
際に発声された文音声中のポーズ長を目的変数にとり、
そのポーズ位置における各種の定量的パラメータを説明
変数にとり、線形重回帰分析を行うことによって制御モ
デルを設定する。これは、i番目のポーズ挿入位置にお
けるj番目の説明変数の値をX2.、ポーズ長の予測値
をPi、実測値をIJ p、とするときに、次の(3)、(4)式を満たすす、
の値を求めることである。
b+mnは演算回路、1は加算回路、2は減算回路、p
は実測値、Pは予測値、Eは誤差で、この実施例は、実
際に発声された文音声中のポーズ長を目的変数にとり、
そのポーズ位置における各種の定量的パラメータを説明
変数にとり、線形重回帰分析を行うことによって制御モ
デルを設定する。これは、i番目のポーズ挿入位置にお
けるj番目の説明変数の値をX2.、ポーズ長の予測値
をPi、実測値をIJ p、とするときに、次の(3)、(4)式を満たすす、
の値を求めることである。
P、=Σb、x、、 ・・・・・・(3)l
J IJ Σ(P−−p、)”→最小・・・・・・(4)説明変数
としては、発話スピード、ポーズ間モーラ数、ポーズ直
前単語の係受は先との距離などが考えられる。このよう
にして構成されたモデル((3)式)によって、求める
べきポーズ挿入位置での説明変数x9.を入力としてそ
の点におけるポーJ ズ長子測値を求めることができる。また、(1)式と(
3)式を組み合わせた(5)式をモデルとして、定性的
ハラメータと定量的パラメータの両方を用いてポーズ長
を予測することも可能である。
J IJ Σ(P−−p、)”→最小・・・・・・(4)説明変数
としては、発話スピード、ポーズ間モーラ数、ポーズ直
前単語の係受は先との距離などが考えられる。このよう
にして構成されたモデル((3)式)によって、求める
べきポーズ挿入位置での説明変数x9.を入力としてそ
の点におけるポーJ ズ長子測値を求めることができる。また、(1)式と(
3)式を組み合わせた(5)式をモデルとして、定性的
ハラメータと定量的パラメータの両方を用いてポーズ長
を予測することも可能である。
P、=ΣΣajkδ1(jk)+Σb jx ij−・
−(5)夏−一来 以上の説明から明らかなように、本発明によると、多変
量統計解析法(数量化I類、線形重回帰分析)を用いて
、自然性の高いポーズ長制御が実現できる。
−(5)夏−一来 以上の説明から明らかなように、本発明によると、多変
量統計解析法(数量化I類、線形重回帰分析)を用いて
、自然性の高いポーズ長制御が実現できる。
第1図及び第2図は、それぞれ本発明の詳細な説明する
ための要部構成図である。 a□□〜anon、・・・bt1〜bmn・・・演算回
路、1・・・加算回路、2・・・減算回路。 第1図 第2図
ための要部構成図である。 a□□〜anon、・・・bt1〜bmn・・・演算回
路、1・・・加算回路、2・・・減算回路。 第1図 第2図
Claims (3)
- (1)、予め用意した音声素片のパラメータ系列を入力
文字列に従って読み出し、結合規則によって接続し、韻
律規則によって韻律を付加する音声規則合成装置におい
て、指定されたポーズ挿入位置における種々のパラメー
タを多変量統計解析的に処理して最適な制御値を得るこ
とを特徴とするポーズ長制御方式。 - (2)、ポーズ長に影響を与えると考えられる定性的パ
ラメータを用いて数量化 I 類を行うことによって実測
値との2乗誤差を最小にする予測モデルを作り、この予
測モデルによって制御することを特徴とする特許請求の
範囲第(1)項に記載のポーズ長制御方式。 - (3)、ポーズ長に影響を与えると考えられる定量的パ
ラメータを用いて線形重回帰分析を行うことによって実
測値との2乗誤差を最小にする予測モデルを作り、この
予測モデルによって制御することを特徴とする特許請求
の範囲第(1)項に記載のポーズ長制御方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62065184A JPS63231398A (ja) | 1987-03-19 | 1987-03-19 | ポ−ズ長制御方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62065184A JPS63231398A (ja) | 1987-03-19 | 1987-03-19 | ポ−ズ長制御方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63231398A true JPS63231398A (ja) | 1988-09-27 |
Family
ID=13279577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62065184A Pending JPS63231398A (ja) | 1987-03-19 | 1987-03-19 | ポ−ズ長制御方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63231398A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0659695A (ja) * | 1992-08-11 | 1994-03-04 | A T R Jido Honyaku Denwa Kenkyusho:Kk | 音声規則合成装置 |
JP2007011042A (ja) * | 2005-06-30 | 2007-01-18 | Mitsubishi Electric Corp | 韻律生成装置及び音声合成装置 |
-
1987
- 1987-03-19 JP JP62065184A patent/JPS63231398A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0659695A (ja) * | 1992-08-11 | 1994-03-04 | A T R Jido Honyaku Denwa Kenkyusho:Kk | 音声規則合成装置 |
JP2007011042A (ja) * | 2005-06-30 | 2007-01-18 | Mitsubishi Electric Corp | 韻律生成装置及び音声合成装置 |
JP4684770B2 (ja) * | 2005-06-30 | 2011-05-18 | 三菱電機株式会社 | 韻律生成装置及び音声合成装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cash et al. | Experimental design research | |
US9431027B2 (en) | Synchronized gesture and speech production for humanoid robots using random numbers | |
DE60212121D1 (de) | Erzeugung von prozessverwandten daten | |
CN111145719B (zh) | 将中英混合及语气标签化的数据标注方法及装置 | |
CN105654939A (zh) | 一种基于音向量文本特征的语音合成方法 | |
CN112599113A (zh) | 方言语音合成方法、装置、电子设备和可读存储介质 | |
CN101887719A (zh) | 语音合成方法、系统及具有语音合成功能的移动终端设备 | |
CN108829777A (zh) | 一种聊天机器人的问题答复方法及装置 | |
JPS63231398A (ja) | ポ−ズ長制御方式 | |
Quick | Composing with kulitta | |
CN108922505B (zh) | 信息处理方法及装置 | |
KR100754430B1 (ko) | 음성 기반 자동 립싱크 애니메이션 장치와 방법 및 기록매체 | |
Dean | Atmospheric corrosion of metals | |
Vekkot et al. | Vocal emotion conversion using WSOLA and linear prediction | |
CN112820266B (zh) | 一种基于跳跃编码器的并行端到端语音合成方法 | |
CN113113047A (zh) | 一种音频处理的方法、装置、可读存储介质和电子设备 | |
JP4232254B2 (ja) | 音声合成装置、規則音声合成方法及び記憶媒体 | |
Ramli et al. | Rule-based storytelling text-to-speech (TTS) synthesis | |
ATE527596T1 (de) | Erhalten von konfigurationsdaten für ein datenverarbeitungsgerät | |
JPH02281298A (ja) | ピッチパタン生成処理方法 | |
CN113096223A (zh) | 图像生成方法、存储介质和电子设备 | |
Zhang et al. | Research on the Mongolian Speech Synthesis Model Based on Transformer and WaveRNN | |
JPS6346497A (ja) | 音声合成方式 | |
SU588496A1 (ru) | Способ имитации дефектов типа расслоений в полимерных покрыти х | |
Fosler-Lussier | On reversing the generation process in Optimality Theory |