JPS63231398A

JPS63231398A - ポ−ズ長制御方式

Info

Publication number: JPS63231398A
Application number: JP62065184A
Authority: JP
Inventors: 哲也酒寄; 佐々部　昭一; 博雄北川
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1987-03-19
Filing date: 1987-03-19
Publication date: 1988-09-27

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】致生公互本発明は、規則音声合成のポーズ長制御方式に関する。

因米蔓生音声合成において自然な韻律を付加するために、ピッチ
、振幅、音韻時間長、ポーズ長等を制御する韻律制御規
則が不可欠である。これらのうちポーズ長制御について
は、句読点や係受けの深さなどに対応した数種類のポー
ズ長を、予め経験的に設定しておき、その内の１つを選
択して用いる方法が提゛案されている。この様な方法で
は、種々のポーズ挿入位置において、様々な条件に対す
るポーズ長の微妙な変化を再現することは難かしい。

月−一二向本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声の規則合成において、韻律の自然性を高める
ように合成音声のポーズ長を制御することを目的として
なされたものである。

且−一腹本発明は、上記目的を達成するために、予め用意した音
声素片のパラメータ系列を入力文字列に従って読み出し
、結合規則によって接続し、韻律規則によって韻律を付
加する音声規則合成装置において、指定されたポーズ挿
入位置における種々のパラメータを多変量統計解析的に
処理して最適な制御値を得ることを特徴としたものであ
る。以下、本発明の実施例に基づいて説明する。

本発明は、自然なポーズ長を制御するために、ポーズ長
に影響を与えると考えられる種々のパラメータを同時に
扱い、多変量統計解析的処理によってパラメータ全体と
して最適な予測値を得る制御モデルを作り、これによっ
て制御するものである。

第１図は、本発明の一実施例を説明するための要部構成
図で、この実施例は、ポーズ長に影響を与えると考えら
れる。定性的パラメータ（ポーズ直前の品詞あるいは句
読点などの記号の種類。

ポーズ前後の係受けの種類と深さ、ポーズ間のモーラ数
等）を用いて数量化１類を行うことによって実測値との
２乗誤差を最小にする予測モデルを作り、この予測モデ
ルによって制御するようにしたものである。第１図にお
いて、δ（、、）。

δ（，２）、・・・δ（１ｎ）は定性的パラメータ、Ｐ
は実測値、ａｌｌｌ　ａ１□、・・・ａｍｎは演算回路
、１は加算回路、２は減算回路、Ｐは予測値、Ｅは誤差
で、実際に発声された文音声中のポーズ長を外的基準に
とり、そのポーズ位置における各種の定性パラメータを
要因アイテムに取り、数量化Ｉ類分析を行うことによっ
て制御モデルを設定する。これは、ｉ番目のポーズ挿入
位置におけるポーズ長の予測値をＰ、、実測値をｐ、と
するときに、次の（１）、（２）式を満たすようなａｊ
ｔ値を求めることである。

Ｐ、＝ΣΣａｊｋ８１（ｊｋ）　　−−（１）Σ（Ｐ−
−ｐ−）”→最小・・・（２）１　　　　　まただし、δＬ　（ｊｋ）はｉ番目のポーズ挿入位置が要
因アイテムｊのカテゴリーｋに反応するときに１゜そう
でない時に０をとる関数とする。要因アイテムとしては
、ポーズ直前の品詞あるいは句読点などの記号の種類、
ポーズ前後の係受けの種類と深さ、ポーズ間のモーラ数
などが考えられる。このように構成されたモデル（（１
）式）によって、求めるべきポーズ挿入位置でのδ−（
ｊｋ）を入力としてその位置におけるポーズ長子測値を
求めることができる。

第２図は、本発明の他の実施例を説明するための要部構
成図で、この実施例は、ポーズ長に影響を与えると考え
られる。定量的パラメータ（発語スピード、ポーズ間モ
ーラ数、ポーズ直前単語の係受は先との距離等）を用い
て線形重回帰分析を行うことによって実測値との２乗誤
差を最小にする予測モデルを作り、これによって制御す
るようにしたものである。第２図において、Ｘ、、　Ｘ
、。

・・・Ｘｎは定量的パラメータ、ｂ工０．ｂ１□・・・
ｂ＋ｍｎは演算回路、１は加算回路、２は減算回路、ｐ
は実測値、Ｐは予測値、Ｅは誤差で、この実施例は、実
際に発声された文音声中のポーズ長を目的変数にとり、
そのポーズ位置における各種の定量的パラメータを説明
変数にとり、線形重回帰分析を行うことによって制御モ
デルを設定する。これは、ｉ番目のポーズ挿入位置にお
けるｊ番目の説明変数の値をＸ２．、ポーズ長の予測値
をＰｉ、実測値をＩＪｐ、とするときに、次の（３）、（４）式を満たすす、
の値を求めることである。

Ｐ、＝Σｂ、ｘ、、　　　　・・・・・・（３）ｌ　　
　　　　　Ｊ　　ＩＪ Σ（Ｐ−−ｐ、）”→最小・・・・・・（４）説明変数
としては、発話スピード、ポーズ間モーラ数、ポーズ直
前単語の係受は先との距離などが考えられる。このよう
にして構成されたモデル（（３）式）によって、求める
べきポーズ挿入位置での説明変数ｘ９．を入力としてそ
の点におけるポーＪズ長子測値を求めることができる。また、（１）式と（
３）式を組み合わせた（５）式をモデルとして、定性的
ハラメータと定量的パラメータの両方を用いてポーズ長
を予測することも可能である。

Ｐ、＝ΣΣａｊｋδ１（ｊｋ）＋Σｂ　ｊｘ　ｉｊ−・
−（５）夏−一来以上の説明から明らかなように、本発明によると、多変
量統計解析法（数量化Ｉ類、線形重回帰分析）を用いて
、自然性の高いポーズ長制御が実現できる。

【図面の簡単な説明】

第１図及び第２図は、それぞれ本発明の詳細な説明する
ための要部構成図である。ａ□□〜ａｎｏｎ、・・・ｂｔ１〜ｂｍｎ・・・演算回
路、１・・・加算回路、２・・・減算回路。第１図第２図

Claims

【特許請求の範囲】

（１）、予め用意した音声素片のパラメータ系列を入力
文字列に従って読み出し、結合規則によって接続し、韻
律規則によって韻律を付加する音声規則合成装置におい
て、指定されたポーズ挿入位置における種々のパラメー
タを多変量統計解析的に処理して最適な制御値を得るこ
とを特徴とするポーズ長制御方式。
（２）、ポーズ長に影響を与えると考えられる定性的パ
ラメータを用いて数量化 I 類を行うことによって実測
値との２乗誤差を最小にする予測モデルを作り、この予
測モデルによって制御することを特徴とする特許請求の
範囲第（１）項に記載のポーズ長制御方式。
（３）、ポーズ長に影響を与えると考えられる定量的パ
ラメータを用いて線形重回帰分析を行うことによって実
測値との２乗誤差を最小にする予測モデルを作り、この
予測モデルによって制御することを特徴とする特許請求
の範囲第（１）項に記載のポーズ長制御方式。