JP2573587B2 - ピッチパタン生成装置 - Google Patents

ピッチパタン生成装置

Info

Publication number
JP2573587B2
JP2573587B2 JP61257490A JP25749086A JP2573587B2 JP 2573587 B2 JP2573587 B2 JP 2573587B2 JP 61257490 A JP61257490 A JP 61257490A JP 25749086 A JP25749086 A JP 25749086A JP 2573587 B2 JP2573587 B2 JP 2573587B2
Authority
JP
Japan
Prior art keywords
pitch
value
signal line
pattern
sent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP61257490A
Other languages
English (en)
Other versions
JPS63110499A (ja
Inventor
幸夫 三留
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP61257490A priority Critical patent/JP2573587B2/ja
Publication of JPS63110499A publication Critical patent/JPS63110499A/ja
Application granted granted Critical
Publication of JP2573587B2 publication Critical patent/JP2573587B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)
  • Vending Machines For Individual Products (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字列などの音声を表す情報から規則によ
り音声を合成する際のピッチパタン、即ち音声の基本周
波数の時間変化パタンを生成する装置に関する。
(従来の技術) 任意の文字や単語の読み等を表す文字列から音声を合
成するいわゆる音声の規則合成においては、音声合成す
べき文章などの構造や、単語のアクセント等にもとづい
て、ピッチパタン、即ち音声の基本周波数の時間変化パ
タンを生成することが、自然な合成音声を生成するため
に重要である。
このような音声の規則合成におけるピッチパタンの生
成の例は、三留と伏木田による日本音響学界音声研究会
資料S85−31(1985.7)、「ホルマント、CV−VC型規則
合成」に示されている。この音声の規則合成は、音声合
成規則として、時間長規則、ピッチ規則、ポーズ規則、
パラメータ編集規則などがあり、あらかじめ自然音声を
分析して得られたCV−VC(Cは子音Vは母音を表す)を
単位とするホルマントパラメータを編集し、それをホル
マント型音声合成器に与えることで任意の音声を合成す
るものである。
この中でピッチ規則は、呼気段落の長さ或は文節の長
さやアクセント更に音素の時間長などの音声情報に基づ
いて、各CV−VCの始端および呼気段落の終端でのピッチ
周波数の値を決め、それらを直線補間することにより音
声合成フレーム毎のピッチを決定する規則である。ここ
で、各CV−VCの始端および呼気段落の終端でのピッチ周
波数の値を決める際には、まず、呼気段落の始端から終
端へ向けて直線的に下降する呼気段落成分を生成し、そ
れに文節(アクセント節)の成分を重畳する。この文節
の成分は、始端から第一の音節の終端に向けて上昇し、
アクセントのないものはそのまま一定値を続け、アクセ
ントのあるものはアクセント核から下降するものであ
る。
一方、ピッチパタンを生成する第二の従来例として
は、広瀬、藤崎、大田による、音響学会講演論文集(19
79.6)2−2−2に示された「日本語文音声の基本周波
数パタンの分析と特徴抽出」がある。これは、文節(ア
クセント節)と呼気段落の二つのピッチパタンを、それ
ぞれ2次の線形フィルタにステップ入力を加えたときの
出力として生成し、それらの和として文音声のピッチパ
タンを生成するものである。
何れの例も、日本語ばかりでなく他の言語の音声、例
えば英語などにも応用することができる。
これらの例に共通するのは、入力の音声情報に基づい
て各種のパラメータ、例えば第一の例では呼気段落の始
端や終端ピッチ周波数あるいは文節成分のピッチ変化の
振幅、第二の例では線形フィルタの時間数やステップ入
力の振幅や継続時間などの値を決定し、それから音声合
成フレーム毎のピッチパタンを合成することである。
(発明が解決しようとする問題点) しかしながら、このような従来のピッチパタン生成装
置においては、同一の文章あるいは単語、更には、構文
が同一の文章や音節数やアクセントが同一の単語など
は、常に同一の規則が適用されるため、常に同じように
発音されることになる。そのため、従来のピッチパタン
生成装置によって生成されたピッチパタンを用いた合成
音声は機械的で不自然な印象をうけ、長時間聞くと疲れ
るといった問題があった。
単語や単文が長文の一部として現れる場合には、前後
関係が異なるならば、規則によっては少し異なって合成
される場合もある。しかし、単語などが句読点によって
区切られ単独で現れ、規則がその前後を考慮しないよう
な場合にはいつも同じ様に合成されることになる。
このような状況は、テキストが長くなればなるほど発
生する可能性が高くなり、不自然さが目立つことにな
る。
本発明の目的は、従来のピッチパタン生成装置に若干
の回路を追加した程度の簡単な構成で、より自然な音声
を合成し得るピッチパタン生成装置を提供することにあ
る。
(問題点を解決するための手段) 前述の問題点を解決するために本発明は、入力された
音声情報に基づいて単語や文などの言語表現のピッチパ
タンを生成するためのパラメータの値を決定する手段
と、そのパラメータの値からピッチパタンを生成する手
段とを有するピッチパタン生成装置において、ランダム
データを発生する手段と、そのランダムデータの値に応
じて前記のパラメータの値を変化させる手段とを更に有
することを特徴とする。
(作用) 本発明は、ピッチパタンを生成するためのパラメータ
の値を従来と同様に決定し、その値をランダムに変化さ
せてピッチパタンを生成することにより、機械的な合成
音声の発生を避けようとするものである。これは、実際
に人間が同一の文章などを音読する場合には、韻律など
は発生の度に確率的に揺らぐという性質があり、それを
実現することで自然性を向上させようとするものであ
る。そのために、ランダムデータを発生する手段によっ
て生成されたランダムデータに応じて、パラメータ値を
変化させる手段により、従来と同様に決定されたピッチ
パタンを生成するためのパラメータ値を変化させ、それ
からピッチパタンを生成するのである。
このとき、あらかじめ実際に人間が発声した音声を分
析しピッチ抽出して、パラメータの値の統計的な分布を
調べておき、その分布にもとづいてパラメータ値の変化
させる量を決定する。
ランダムデータを発生する手段としては、従来から合
同法によるものやM系列によるもの等が知られており、
いずれの方法に基づくものでも利用可能である。
(実施例) 次に、図面を参照して本発明の実施例を説明する。
第1図は、本発明の一実施例のブロック図である。図
において、101は制御回路、102はピッチパラメータ値生
成回路、103はデータ補完回路、104はデータ分布値メモ
リ、105は乱数発生回路、106は乗算器、107は加算器で
ある。
ピッチパラメータ値生成回路102は、前述の第一の従
来例におけるものと同様に、制御回路101から信号線113
を介して送られる音素系列に基づいて、ピッチパラメー
タ値、即ち呼気段落の始端や終端のピッチ周波数あるい
は文節成分のピッチ変化の振幅等の値を生成し、信号線
120に送出する。
データ補間回路103も、第一の従来例におけるものと
同様に、信号線116から送られる時間長データに基づい
て、信号線121から入力されるピッチパラメータ値か決
定した各CV−VCの始端および呼気段落の終端でのピッチ
周波数の値の間を補間しピッチパタンを生成する。
データ分布値メモリ104には、各ピッチパラメータ値
の分布する最大値が記憶されていて、制御回路101から
信号線114を介して送られる指示に従って、その分布の
最大値を信号線117へと送り出す。
乱数発声回路105では、制御回路101から信号線115を
介して送られる指示に従って、絶対値が1以下の正負の
乱数が発声され信号線118へと送り出される。
乗算器106では、データ分布値メモリ104から送られる
データの分布の最大値に、乱数発生回路105から送られ
る乱数が乗じられ、その積が信号線119を介して加算器1
07へと送られる。
加算器107では、ピッチパラメータ値生成回路102から
送られるピッチパラメータ値と、乗算器106から送られ
るデータ分布値と乱数の積が加え合わされて新たなピッ
チパラメータ値として信号線121を介してデータ補間回
路103に送られる。
制御回路101は、信号線111から音素系列と時間長デー
タが入力されると、音素系列を信号線113を介してピッ
チパラメータ値生成回路102に送りピッチパラメータ値
を発生させ、時間長データを信号線116を介してデータ
補間回路103に送る。更に、信号線114を介してデータ分
布値メモリ104に指示を送りデータの分布の最大値を発
生させ、信号線115を介して乱数発生回路105に指示を送
り乱数を発生させる。
こうして、ピッチパラメータ値生成回路102で生成さ
れたピッチパラメータ値に、データ分布値メモリ104で
生成されたデータの分布の最大値と乱数発生回路105で
生成された乱数の積が加算され、その新たなピッチパラ
メータ値と時間長データに基づいてピッチパタンが生成
され、信号線112から出力される。
第2図は、本発明の第二の実施例のブロック図であ
る。図において、201は制御回路、202は時定数−ステッ
プパラメータ値生成回路、203は文節パタン用フィル
タ、204は呼気段落パタン用フィルタ、205は加算器、20
6はデータ分布値メモリ、207は乱数発生回路、208は乗
算器、209は加算器である。
時定数−ステップパラメータ値生成回路202は、前述
の第二の従来例と同様に、入力の音声情報に基づいて、
文節パタン用フィルタ203と呼気段落パタン用フィルタ2
04の時定数やステップパラメータ即ちステップ入力の振
幅や継続時間などの値を決定し、信号線214へと送り出
す。
文節パタン用フィルタ203は、信号線221を介して与え
られる係数値を用いて信号線220から入力されるステッ
プ信号をフィルタリングして文節のピッチパタンを生成
し信号線223へと送り出す。
呼気段落パタン用フィルタ204は、信号線218を介して
与えられる係数値を用いて信号線219から入力されるス
テップ信号をフィルタリングして呼気段落のピッチパタ
ンを生成し信号線222へと送り出す。
加算器205では、文節パタン用フィルタ203から送られ
る文節のピッチパタンと、呼気段落パタン用フィルタ20
4から送られる呼気段落のピッチパタンとが加え合わさ
れて文章のピッチパタンが生成される。
これら、時定数−ステップパラメータ値生成回路20
2、文節パタン用フィルタ203、呼気段落パタン用フィル
タ204、加算器205は、第二の従来例と同様に動作するも
のである。
データ分布値メモリ206には、二つのフィルタ203と20
4のための時定数と、ステップパラメータの分布の最大
値が記憶されており、信号線217を介して制御回路201か
ら送られる指示に従って各パラメータの分布の最大値が
信号線225へと送られる。
乱数発生回路207では、制御回路201から信号線216を
介して送られる指示に従って、絶対値が1以下の正負の
乱数が発生され信号線224へと送り出される。
乗算器208では、データ分布値メモリ206から送られる
データの分布の最大値に、乱数発生回路207から送られ
る乱数が乗じられ、その積が信号線226を介して加算器2
09へと送られる。
加算器209では、時定数−ステップパラメータ値生成
回路202で生成された時定数やステップパラメータの値
と乗算器208から送られる各パラメータの分布値と乱数
の積が加え合わされて新たな時定数やステップパラメー
タ値として信号線215を介して制御回路201に送られる。
制御回路201は、信号線211から入力される音声情報を
信号線213を介して時定数−ステップパラメータ値生成
回路202に送り、時定数とステップパラメータの値を決
定させる。また、データ分布値メモリ206と乱数発生回
路207に指示を送り、加算器209から送られる新たな時定
数とステップパラメータ値に基づいて、二つのフィルタ
203と204のためのフィルタの係数と入力ステップ信号を
生成し、二つのフィルタに送る。
このようにして、文章のピッチパタンが生成され信号
線212から出力される。
(発明の効果) 以上説明したように、本発明によれば、合成しようと
する音声情報に同一の表現が繰り返し現れても、各種の
音声合成パラメータの値がその都度微妙に異なった値が
とられるため、明瞭性が損なわれることなく自然な合成
音が得られるという効果がある。
【図面の簡単な説明】
第1図および第2図は本発明の第一および第二の実施例
をそれぞれ示すブロック図である。 図において、101は制御回路、102はピッチパラメータ値
生成回路、103はデータ補間回路、104はデータ分布値メ
モリ、105は乱数発生回路、106は乗算器、107は加算
器、201は制御回路、202は時定数−ステップパラメータ
値生成回路、203は文節パタン用フィルタ、204は呼気段
落パタン用フィルタ、205は加算器、206はデータ分布値
メモリ、207は乱数発生回路、208は乗算器、209は加算
器である。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された音声情報に基づいて単語や文な
    どの言語表現のピッチパタンを生成するためのパラメー
    タの値を決定する手段と、そのパラメータの値からピッ
    チパタンを生成する手段とを有しピッチパタン生成装置
    において、 ランダムデータを発生する手段と、そのランダムデータ
    の値に応じて前記のパラメータの値を変化させる手段と
    を更に有することを特徴とするピッチパタン生成装置。
JP61257490A 1986-10-29 1986-10-29 ピッチパタン生成装置 Expired - Fee Related JP2573587B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61257490A JP2573587B2 (ja) 1986-10-29 1986-10-29 ピッチパタン生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61257490A JP2573587B2 (ja) 1986-10-29 1986-10-29 ピッチパタン生成装置

Publications (2)

Publication Number Publication Date
JPS63110499A JPS63110499A (ja) 1988-05-14
JP2573587B2 true JP2573587B2 (ja) 1997-01-22

Family

ID=17307014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61257490A Expired - Fee Related JP2573587B2 (ja) 1986-10-29 1986-10-29 ピッチパタン生成装置

Country Status (1)

Country Link
JP (1) JP2573587B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5660499A (en) * 1979-10-22 1981-05-25 Casio Computer Co Ltd Audible sounddsource circuit for voice synthesizer

Also Published As

Publication number Publication date
JPS63110499A (ja) 1988-05-14

Similar Documents

Publication Publication Date Title
JPH0833744B2 (ja) 音声合成装置
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JP2001242882A (ja) 音声合成方法及び音声合成装置
CA2343071A1 (en) Device and method for digital voice processing
JP3437064B2 (ja) 音声合成装置
JP2573587B2 (ja) ピッチパタン生成装置
JPS5972494A (ja) 規則合成方式
JP3344487B2 (ja) 音声基本周波数パターン生成装置
JPH0580791A (ja) 音声規則合成装置および方法
JP3394281B2 (ja) 音声合成方式および規則合成装置
JP2573586B2 (ja) 規則型音声合成装置
JP2001100777A (ja) 音声合成方法及び装置
JP2703253B2 (ja) 音声合成装置
JP2577372B2 (ja) 音声合成装置および方法
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JP2785628B2 (ja) ピッチパタン生成装置
JP3862300B2 (ja) 音声合成に用いる情報の処理方法および装置
JPH06149283A (ja) 音声合成装置
JPH07129188A (ja) 音声合成装置
JPS63174100A (ja) 音声規則合成方式
JPS63212995A (ja) 音声合成装置
JPH06138894A (ja) 音声合成装置及び音声合成方法
JPS63110500A (ja) 音声時間長デ−タ生成装置
JPS6364098A (ja) 音声合成方式
JPH07311588A (ja) テキスト音声合成装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees