JPS63231398A - ポ−ズ長制御方式 - Google Patents

ポ−ズ長制御方式

Info

Publication number
JPS63231398A
JPS63231398A JP62065184A JP6518487A JPS63231398A JP S63231398 A JPS63231398 A JP S63231398A JP 62065184 A JP62065184 A JP 62065184A JP 6518487 A JP6518487 A JP 6518487A JP S63231398 A JPS63231398 A JP S63231398A
Authority
JP
Japan
Prior art keywords
pause
prediction model
pause length
length
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62065184A
Other languages
English (en)
Inventor
哲也 酒寄
佐々部 昭一
博雄 北川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP62065184A priority Critical patent/JPS63231398A/ja
Publication of JPS63231398A publication Critical patent/JPS63231398A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 致生公互 本発明は、規則音声合成のポーズ長制御方式に関する。
因米蔓生 音声合成において自然な韻律を付加するために、ピッチ
、振幅、音韻時間長、ポーズ長等を制御する韻律制御規
則が不可欠である。これらのうちポーズ長制御について
は、句読点や係受けの深さなどに対応した数種類のポー
ズ長を、予め経験的に設定しておき、その内の1つを選
択して用いる方法が提゛案されている。この様な方法で
は、種々のポーズ挿入位置において、様々な条件に対す
るポーズ長の微妙な変化を再現することは難かしい。
月−一二向 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声の規則合成において、韻律の自然性を高める
ように合成音声のポーズ長を制御することを目的として
なされたものである。
且−一腹 本発明は、上記目的を達成するために、予め用意した音
声素片のパラメータ系列を入力文字列に従って読み出し
、結合規則によって接続し、韻律規則によって韻律を付
加する音声規則合成装置において、指定されたポーズ挿
入位置における種々のパラメータを多変量統計解析的に
処理して最適な制御値を得ることを特徴としたものであ
る。以下、本発明の実施例に基づいて説明する。
本発明は、自然なポーズ長を制御するために、ポーズ長
に影響を与えると考えられる種々のパラメータを同時に
扱い、多変量統計解析的処理によってパラメータ全体と
して最適な予測値を得る制御モデルを作り、これによっ
て制御するものである。
第1図は、本発明の一実施例を説明するための要部構成
図で、この実施例は、ポーズ長に影響を与えると考えら
れる。定性的パラメータ(ポーズ直前の品詞あるいは句
読点などの記号の種類。
ポーズ前後の係受けの種類と深さ、ポーズ間のモーラ数
等)を用いて数量化1類を行うことによって実測値との
2乗誤差を最小にする予測モデルを作り、この予測モデ
ルによって制御するようにしたものである。第1図にお
いて、δ(、、)。
δ(,2)、・・・δ(1n)は定性的パラメータ、P
は実測値、alll a1□、・・・amnは演算回路
、1は加算回路、2は減算回路、Pは予測値、Eは誤差
で、実際に発声された文音声中のポーズ長を外的基準に
とり、そのポーズ位置における各種の定性パラメータを
要因アイテムに取り、数量化I類分析を行うことによっ
て制御モデルを設定する。これは、i番目のポーズ挿入
位置におけるポーズ長の予測値をP、、実測値をp、と
するときに、次の(1)、(2)式を満たすようなaj
t値を求めることである。
P、=ΣΣajk81(jk)  −−(1)Σ(P−
−p−)”→最小・・・(2)1     ま ただし、δL (jk)はi番目のポーズ挿入位置が要
因アイテムjのカテゴリーkに反応するときに1゜そう
でない時に0をとる関数とする。要因アイテムとしては
、ポーズ直前の品詞あるいは句読点などの記号の種類、
ポーズ前後の係受けの種類と深さ、ポーズ間のモーラ数
などが考えられる。このように構成されたモデル((1
)式)によって、求めるべきポーズ挿入位置でのδ−(
jk)を入力としてその位置におけるポーズ長子測値を
求めることができる。
第2図は、本発明の他の実施例を説明するための要部構
成図で、この実施例は、ポーズ長に影響を与えると考え
られる。定量的パラメータ(発語スピード、ポーズ間モ
ーラ数、ポーズ直前単語の係受は先との距離等)を用い
て線形重回帰分析を行うことによって実測値との2乗誤
差を最小にする予測モデルを作り、これによって制御す
るようにしたものである。第2図において、X、、 X
、。
・・・Xnは定量的パラメータ、b工0.b1□・・・
b+mnは演算回路、1は加算回路、2は減算回路、p
は実測値、Pは予測値、Eは誤差で、この実施例は、実
際に発声された文音声中のポーズ長を目的変数にとり、
そのポーズ位置における各種の定量的パラメータを説明
変数にとり、線形重回帰分析を行うことによって制御モ
デルを設定する。これは、i番目のポーズ挿入位置にお
けるj番目の説明変数の値をX2.、ポーズ長の予測値
をPi、実測値をIJ p、とするときに、次の(3)、(4)式を満たすす、
の値を求めることである。
P、=Σb、x、、    ・・・・・・(3)l  
     J  IJ Σ(P−−p、)”→最小・・・・・・(4)説明変数
としては、発話スピード、ポーズ間モーラ数、ポーズ直
前単語の係受は先との距離などが考えられる。このよう
にして構成されたモデル((3)式)によって、求める
べきポーズ挿入位置での説明変数x9.を入力としてそ
の点におけるポーJ ズ長子測値を求めることができる。また、(1)式と(
3)式を組み合わせた(5)式をモデルとして、定性的
ハラメータと定量的パラメータの両方を用いてポーズ長
を予測することも可能である。
P、=ΣΣajkδ1(jk)+Σb jx ij−・
−(5)夏−一来 以上の説明から明らかなように、本発明によると、多変
量統計解析法(数量化I類、線形重回帰分析)を用いて
、自然性の高いポーズ長制御が実現できる。
【図面の簡単な説明】
第1図及び第2図は、それぞれ本発明の詳細な説明する
ための要部構成図である。 a□□〜anon、・・・bt1〜bmn・・・演算回
路、1・・・加算回路、2・・・減算回路。 第1図 第2図

Claims (3)

    【特許請求の範囲】
  1. (1)、予め用意した音声素片のパラメータ系列を入力
    文字列に従って読み出し、結合規則によって接続し、韻
    律規則によって韻律を付加する音声規則合成装置におい
    て、指定されたポーズ挿入位置における種々のパラメー
    タを多変量統計解析的に処理して最適な制御値を得るこ
    とを特徴とするポーズ長制御方式。
  2. (2)、ポーズ長に影響を与えると考えられる定性的パ
    ラメータを用いて数量化 I 類を行うことによって実測
    値との2乗誤差を最小にする予測モデルを作り、この予
    測モデルによって制御することを特徴とする特許請求の
    範囲第(1)項に記載のポーズ長制御方式。
  3. (3)、ポーズ長に影響を与えると考えられる定量的パ
    ラメータを用いて線形重回帰分析を行うことによって実
    測値との2乗誤差を最小にする予測モデルを作り、この
    予測モデルによって制御することを特徴とする特許請求
    の範囲第(1)項に記載のポーズ長制御方式。
JP62065184A 1987-03-19 1987-03-19 ポ−ズ長制御方式 Pending JPS63231398A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62065184A JPS63231398A (ja) 1987-03-19 1987-03-19 ポ−ズ長制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62065184A JPS63231398A (ja) 1987-03-19 1987-03-19 ポ−ズ長制御方式

Publications (1)

Publication Number Publication Date
JPS63231398A true JPS63231398A (ja) 1988-09-27

Family

ID=13279577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62065184A Pending JPS63231398A (ja) 1987-03-19 1987-03-19 ポ−ズ長制御方式

Country Status (1)

Country Link
JP (1) JPS63231398A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0659695A (ja) * 1992-08-11 1994-03-04 A T R Jido Honyaku Denwa Kenkyusho:Kk 音声規則合成装置
JP2007011042A (ja) * 2005-06-30 2007-01-18 Mitsubishi Electric Corp 韻律生成装置及び音声合成装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0659695A (ja) * 1992-08-11 1994-03-04 A T R Jido Honyaku Denwa Kenkyusho:Kk 音声規則合成装置
JP2007011042A (ja) * 2005-06-30 2007-01-18 Mitsubishi Electric Corp 韻律生成装置及び音声合成装置
JP4684770B2 (ja) * 2005-06-30 2011-05-18 三菱電機株式会社 韻律生成装置及び音声合成装置

Similar Documents

Publication Publication Date Title
Cash et al. Experimental design research
US9431027B2 (en) Synchronized gesture and speech production for humanoid robots using random numbers
DE60212121D1 (de) Erzeugung von prozessverwandten daten
CN111145719B (zh) 将中英混合及语气标签化的数据标注方法及装置
CN105654939A (zh) 一种基于音向量文本特征的语音合成方法
CN112599113A (zh) 方言语音合成方法、装置、电子设备和可读存储介质
CN101887719A (zh) 语音合成方法、系统及具有语音合成功能的移动终端设备
CN108829777A (zh) 一种聊天机器人的问题答复方法及装置
JPS63231398A (ja) ポ−ズ長制御方式
Quick Composing with kulitta
CN108922505B (zh) 信息处理方法及装置
KR100754430B1 (ko) 음성 기반 자동 립싱크 애니메이션 장치와 방법 및 기록매체
Dean Atmospheric corrosion of metals
Vekkot et al. Vocal emotion conversion using WSOLA and linear prediction
CN112820266B (zh) 一种基于跳跃编码器的并行端到端语音合成方法
CN113113047A (zh) 一种音频处理的方法、装置、可读存储介质和电子设备
JP4232254B2 (ja) 音声合成装置、規則音声合成方法及び記憶媒体
Ramli et al. Rule-based storytelling text-to-speech (TTS) synthesis
ATE527596T1 (de) Erhalten von konfigurationsdaten für ein datenverarbeitungsgerät
JPH02281298A (ja) ピッチパタン生成処理方法
CN113096223A (zh) 图像生成方法、存储介质和电子设备
Zhang et al. Research on the Mongolian Speech Synthesis Model Based on Transformer and WaveRNN
JPS6346497A (ja) 音声合成方式
SU588496A1 (ru) Способ имитации дефектов типа расслоений в полимерных покрыти х
Fosler-Lussier On reversing the generation process in Optimality Theory