JPH04238396A - 音声合成用音声持続期間処理装置 - Google Patents

音声合成用音声持続期間処理装置

Info

Publication number
JPH04238396A
JPH04238396A JP3006171A JP617191A JPH04238396A JP H04238396 A JPH04238396 A JP H04238396A JP 3006171 A JP3006171 A JP 3006171A JP 617191 A JP617191 A JP 617191A JP H04238396 A JPH04238396 A JP H04238396A
Authority
JP
Japan
Prior art keywords
phoneme
register
voice
duration
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3006171A
Other languages
English (en)
Inventor
Defua Rin
リン・デファ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3006171A priority Critical patent/JPH04238396A/ja
Publication of JPH04238396A publication Critical patent/JPH04238396A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声合成における音声持
続期間の処理に際し、よりよい品質の音声を獲得する音
声持続期間を求める音声合成用音声持続期間処理装置に
関するものである。
【0002】
【従来の技術】中国語の場合、中国語の音声合成システ
ムでは、採用された合成単位は一般的に2種類に分けら
れる。 (1)408個の単音節。 (2)58個の音韻。(21個の声母、37個の韻母を
含む。声母は子音であって、韻母は母音である。)合成
単位として408個の単音節を採用するのかあるいは音
韻を採用するのかはどちらも結構であるが、各合成単位
の音声持続期間が各々の音調と文に占める各種位置にお
ける各々の値を適当に決定することは音声合成の自然度
に対して大きな影響を与える。従来の中国語の音声合成
用音声持続期間処理装置は、例えば「一套基於共振峰合
成技術的中文文句翻語音系統」(1987年台湾大学マ
スタ−論文)に示されている。図7はこの従来の音声持
続期間処理装置を示すブロック図である。図7に、1は
キ−ボ−ドからピンイン文を入力するピンイン文入力部
である。例えば、“ming2ming2mai3mi
an4mei2mai3mi3”というピンイン文を入
力する。10は入力部1から入力されたピンイン文によ
り、各単音節の音声持続期間を決める単音節音声持続期
間決定部である。単音節毎に対してその持続期間を予め
に同じように400msに設定する。30は若干の単音
節の音声持続期間に関するル−ルを応用して前記の単音
節音声持続期間決定部10によって設定された単音節の
音声持続期間を修正する音声持続期間処理部である。図
7に、11は入力部1から入力されたピンイン文と、音
声持続期間処理部30によって処理された単音節の音声
持続期間のデ−タを記憶する記憶部である。この音声持
続期間処理部30における流れ図は図8、図9、図10
に示される。これらの図によって下記のようなことがわ
かる。該当単音節が第1声であれば、音声持続期間を3
0ms減し、第2声であれば、20ms減す。第3声で
あれば、増すことも減すこともしない、第4声であれば
、音声持続期間を40ms、軽声であれば、音声持続期
間を120ms減す。もし、該当単音節に声母の部分が
なかったら、40msの音声持続期間を減し、
【0003】
【外1】
【0004】、
【0005】
【外2】
【0006】、
【0007】
【外3】
【0008】、
【0009】
【外4】
【0010】であれば、10ms減す。
【0011】
【外5】
【0012】、
【0013】
【外6】
【0014】、
【0015】
【外7】
【0016】、
【0017】
【外8】
【0018】であれば、10ms、
【0019】
【外9】
【0020】であれば、15ms、
【0021】
【外10】
【0022】、
【0023】
【外11】
【0024】であれば、20ms、
【0025】
【外12】
【0026】、
【0027】
【外13】
【0028】、
【0029】
【外14】
【0030】、
【0031】
【外15】
【0032】であれば、30ms増す。そのほかの声母
ならば増すことも減すこともしない。該当単音節が文の
終わりのところにあれば、そして終わりのくぎり符号が
コンマあるいはコロンであるならば、20msの音声持
続期間を増し、読点、ダッシュであれば、10msの音
声持続期間を増す。セミコロン、句点であれば、40m
sの音声持続期間を増す。そのほか、該当単音節がフレ
−ズにあり、そしてフレ−ズの単音節の数は2であれば
、その音声持続期間は前記に述べたル−ルによって処理
された後の長度に  0.94をかけるのである。単音
節の数が3であれば、その音声持続期間は前記に述べた
ル−ルによって処理された後の長度に0.92を、単音
節の数が4であれば、その音声持続期間は前記に述べた
ル−ルによって処理された後の長度に0.90をかける
のである。図7に、50は音声持続期間処理部30によ
って得られたピンイン文の音声持続期間を出力するピン
イン文音声持続期間出力部である。
【0033】“ming2ming2mai3mian
4mei2mai3mi3(明明買麺没買米) ”とい
う文の場合、前に述べた従来の音声持続期間処理装置で
の計算によって得られた音声合成の各単音節の音声持続
期間は“370、 370、390、350、370、
390、430(ms)”である。しかし、前記の例文
をソナグラフで計り得た自然音声の各単音節の音声持続
期間は“270、290、340、320、280、 
300、330(ms)”である。 それで、自然音声と従来例の処理装置から得られた音声
持続期間は大きな相違がある。従来の音声持続期間処理
処置により生じられた音声持続期間のデ−タは正確では
ないことがわかる。
【0034】
【発明が解決しようとする課題】前記の従来の音声持続
期間処理では、合成単位が単音節である中国語音声合成
システムだけに適用できるが、合成単位が音韻である中
国語音声合成システムには応用できない。そのうえ、自
然音声を解析せずに、各単音節の長さは予めに400m
sに仮定されて、それから、若干のル−ルの修正によっ
て得られた音声持続期間はあまり正確ではないし、合成
音声の品質が低い。
【0035】本発明はかかる点に鑑み、従来より正確な
音声合成の音声持続期間を生成できる音声合成用音声持
続期間処理装置を提供することを目的とする。
【0036】
【課題を解決するための手段】前記の問題点を解消する
ために、本発明は、自然音声を構成する各音韻の音声持
続期間について、各々の音調及び該当音韻が文に占める
位置によって各々の値を格納する音声持続期間デ−タ記
憶部と、入力されたピンイン記号、音調記号により構成
された任意の長さのピンイン文が音調記号によって音節
を検出し、該当音調記号を記憶する音調検出部と、前記
入力された任意の長さのピンイン文の各音節における各
音韻及びその音韻が文に占める位置を検出する音韻検出
部と、前記検出された音調と各音韻とその音韻が文に占
める位置を検索インデクスとして前記の音声持続期間デ
−タ記憶部における各該当音韻の音声持続期間デ−タを
取り出す音声持続期間検出部とを備えたことを特徴とす
る音声合成用音声持続期間処理装置である。
【0037】
【作用】本発明は前記の構成により、キ−ボ−ドから入
力されたピンイン文における各音韻の各々の音調と該当
音韻が文に占める位置などの情報によって音声持続期間
デ−タ記憶部を検索して、各音韻の音声持続期間を獲得
する。本発明は、合成単位が単音節である中国語音声合
成システムにも合成単位が音韻である中国語音声合成シ
ステムにも適用できる。そのうえ、自然的な中国語音声
の音声持続期間を生成できる。
【0038】
【実施例】図1は、本発明の一実施例における中国語音
声合成用音声持続期間処理装置を示すシステムブロック
図である。図1に示す本実施例の装置は、図7に示した
従来の装置と同じ構成部分には同一番号を付してその動
作の説明は前記の図7に示す動作の説明と同じので、詳
細な説明を省略する。図1において、12から20まで
は音声持続期間を処理する時に必要に使われる各種レジ
スタである。そのうち、12、13はそれぞれ一音節の
中にある音韻の代表符号を記憶するiレジスタとi1レ
ジスタである。14は音調を表わす数字を記憶するjレ
ジスタである。15は文における一音韻の位置の代表符
号を記憶するkレジスタである。16は入力されたピン
イン文における文字ポインタを記憶するcレジスタであ
る。17はsレジスタに格納する文字列の文字ポインタ
を記憶するc1レジスタで、18は単音節に声母の部分
があるかどうかを判断するのを記憶するc2レジスタで
ある。19は単音節文字列を記憶するsレジスタ、20
は一音節の音声持続期間を記憶するdレジスタである。 22はピンイン文入力部1から入力されたピンイン文に
対して音調記号で音節を検出して該当音調記号をjレジ
スタに記憶する音調検出部である。23は前記ピンイン
文に対して検出された音節の各音韻とその音韻が文にお
ける位置を検出する音韻検出部である。25は前記音韻
検出部での必要なデ−タを記憶する音節音韻対照記憶部
であり、この詳しい内容は図4のように示している。図
4によって、単音節“a”の単音節の代表符号は1で(
1番目の位置に該当単音節を置く)、声母の代表符号は
0で(声母の代表符号が0であることは該当単音節に声
母の部分がないのを示す)、韻母の代表符号は22であ
ることがわかる。同様に、単音節“ba”の単音節の代
表符号は2で、声母の代表符号は1で、韻母の代表符号
は22とする。そのため、全部で408組の単音節、4
08組の単音節の代表符号、408組の音韻の代表符号
がある。図1において、24は音調検出部22によって
検出された音調と音韻検出部23によって検出された各
音韻とその音韻が文に占める位置を検索インデクスとし
て、音声持続期間デ−タ記憶部26から各音韻の音声持
続期間デ−タを取り出し、そして、一音節の音声持続期
間を計算することができる音声持続期間検出部である。 26は音韻音声持続期間デ−タを記憶する音声持続期間
デ−タ記憶部(DS,Duration Storag
e)であり、この詳細な内容を図5に示す。図5におい
て、音声持続期間デ−タ記憶部に記憶する音声持続期間
デ−タは(1)音韻部分(iレジスタによって音韻の代
表符号を記憶する) (2)音調部分(jレジスタによって音調の数字を記憶
する) (3)文に占める位置部分(kレジスタによって位置の
代表符号を記憶する)の3つの分によって検索される。 即ち、各音韻の音声持続期間はDS(i、j、k)で表
わすことができる。該当音声持続期間デ−タ記憶部に記
憶する音声持続期間デ−タは、数多くの自然音声を分析
することにより、各種音調と文に占める各種位置におけ
る各音韻の平均的な音声持続期間を統計してから得られ
たものである。該当音声持続期間デ−タ記憶部に58個
の音韻(21個声母と37個韻母を含む)に関する各々
の音調における値と該当音韻が文に占める各種位置にお
ける値のデ−タは記憶されている。図6はC言語で図5
における音声持続期間デ−タ記憶部を実現するものであ
る。
【0039】本発明の音声合成用音声持続期間処理装置
において、は合成単位が音韻である中国語音声合成シス
テムに応用する処理流れ図を図2、図3に示す。図2、
図3において、先ず、キ−ボ−ドから文字を入力する。 そして、該当文字が改行キ−であるかどうかを判断する
。さもなければ、キ−インした文字を記憶部の入力文字
列に記憶し、続いて次の文字を改行キ−までキ−インし
ていく。改行キ−であったら、続いて音調検出をする。 cレジスタとc1レジスタの初期値が1に設定されて、
記憶部に記憶する第c文字を読取して、ファイルの終わ
りであるかどうかを判断する。さもなければ、音調を表
わす数字ではないかどうかを判断する。さもなげれば、
読入した文字をsレジスタにおける第c1個の位置に記
憶し、cレジスタとc1レジスタの値に1ずつを足し、
続いて記憶部に記憶する第c文字を読取する。音調を表
わす数字であれば、jレジスタで該当音調を表わす数字
を記憶する。iレジスタの値が1に設定されて、sレジ
スタに記憶する単音節が音節音韻対照記憶部における第
i個の位置に記憶されているか、どうかを判断する。さ
もなければ、iレジスタに記憶する値に1を足し、続い
てsレジスタに記憶する単音節が音節音韻対照記憶部に
おける第i位置に記憶されているかどうかを判断する。 sレジスタに記憶する単音節が音節音韻対照記憶部にお
ける第i位置に記憶された単音節にマッチまで。音節音
韻対照記憶部における第i位置に記憶する韻母の代表記
号と声母の代表符号をそれぞれi1レジスタとiレジス
タに記憶し、dレジスタを0にリセットする。単音節に
声母の部分があるかどうかを判断する。もし、あれば、
c2レジスタの値が2に設定され、もし、なかったら、
c2レジスタの値が1に設定される。それから、i1レ
ジスタの値をiレジスタに記憶する。iレジスタに記憶
する値の代表音韻が文に占める位置はどこかを判断する
。文の始めならば、kレジスタの値が1に設定され、文
の中ならば、kレジスタの値が2に設定される。さもな
ければ、kレジスタの値が3に設定される。続いて次の
ような音声持続期間を検出する。iレジスタ(音韻の代
表符号を記憶する)とjレジスタ(音調を表わす数字を
記憶する)とkレジスタ(位置の代表符号を記憶する)
の値によって音声持続期間デ−タ記憶部から取り出した
該当音韻の音声持続期間はDS(i、j、k)で、d=
d+DS(i、j、k)である。c2レジスタの値が2
であるかどうかを判断する。そうであれば、c2レジス
タでの値から1を引き、i1レジスタに記憶する値をi
レジスタにトランスファ−して、続いてiレジスタに記
憶する値の代表音韻が文に占める位置はどこかを判断す
る。さもなければ、dレジスタに記憶する値を記憶部に
記憶し、cレジスタでの値に1を足し、c1レジスタで
の値を1にリセット、続いて記憶部の入力文字列に記憶
する第c文字を読取して、そして処理プロセスをくりか
えす。ファイルが終わるまで続く。 処理されたピンイン文の音声持続期間を出力した後、該
当ピンイン文の音声持続期間の処理を終わらせる。
【0040】例えば、“ming2ming2mai3
mian4mei2mai3mi3”(明明買麺没買米
)という例文は本発明における音声持続期間装置により
、次の過程により処理される。先ず、キ−ボ−ドによっ
て該当ピンイン文をキ−インして記憶部の入力文字列に
記憶する。cレジスタとc1レジスタに記憶する値を1
に設定して、記憶部の入力文字列に記憶する第c(現在
値は1)個の文字mを読取する。 該当文字はファイルの終わりでも音調を表わす数字でも
ない。それで、文字mをsレジスタの第c1(現在値は
1)位置に記憶し、cレジスタとc1レジスタに記憶す
る値にそれぞれ1を足す。そして記憶部の入力文字列に
記憶する第c(現在値は2)個の文字iを読取して、文
字iをsレジスタの第c1(現在値は2)位置に記憶す
る。このままの順序によって記憶部の入力文字列に記憶
する第3個、第4個の文字nとgをそれぞれsレジスタ
における第3個、第4個の位置に記憶する。記憶部の入
力文字列に記憶する第5文字2(cレジスタに記憶する
値は5)を読込む時、文字2は音調を表わす数字である
ので、文字2をjレジスタに記憶し、iレジスタに記憶
する値が1に設定される。そして、sレジスタに現在、
記憶する単音節mingを音節音韻対照記憶部における
第i位置に記憶することをチェックする。さもなければ
、iレジスタに記憶する値に1を足す。このような動作
はiレジスタに記憶する値が211(音節音韻対照記憶
部における第211位置に記憶する単音節はming)
になるまで続く。音節音韻対照記憶部における第211
個の位置に記憶する声母の代表符号3、韻母の代表符号
33をそれぞれiレジスタとi1レジスタに記憶する。 音声持続期間レジスタdを0にリセットする。iレジス
タに記憶する値は現在0ではないので(現在値は3)、
処理する単音節mingに声母の部分があるのを示す。 それで、c2レジスタの値が2に設定される。現在、i
レジスタに記憶する音韻の代表符号3の音韻mは文の始
めにあるので、kレジスタの値が1に設定される。iレ
ジスタ(音韻の代表符号3を記憶)、jレジスタ(音調
を表わす数字2を記憶)、kレジスタ(位置の代表符号
1を記憶)における値によって音声持続期間デ−タ記憶
部から取り出した該当音韻の音声持続期間DS(3、2
、1)は  60ms、d=d+60ms。c2レジス
タに現在記憶する値は2であるので、c2レジスタに記
憶する値に1を引き、i1レジスタに記憶する値(音韻
の代表符号33である。)をiレジスタに記憶する。現
在、iレジスタに記憶する音韻の代表符号33の音韻i
ngは文の中にあるので、kレジスタに記憶する値が2
に設定される。iレジスタ(音韻の代表符号33を記憶
)、jレジスタ(音調の数字2を記憶)、kレジスタ(
位置の代表符号2を記憶)における値によって、音声持
続期間デ−タ記憶部から取り出した該当音韻の音声持続
期間DS(33、2、2)は220ms、d=d+22
0。それで、得られた第1単音節ming2の音声持続
期間は280ms。音声持続期間レジスタdに記憶する
値(280ms)を記憶部に記憶する。現在、c2レジ
スタに記憶する値は1であるために、cレジスタに記憶
する値に1を足し(現在値は6)、c1レジスタでの値
を1にリセット、記憶部に記憶する第c文字mを読取し
続ける。この順序によって各音韻の音声持続期間を処理
し、ファイルの終わるまで続ける。計算した後得られた
合成音声の各単音節の音声持続期間は次のようである。 “ 280、290、290、330、290、290
、350(ms)”この発明は上記実施例に限定される
ことなく、その要旨を変更しない限り、適当に変更して
実施することができる。例えば、本発明、音声持続期間
処理装置における中国語音声合成システムの合成単位は
単音節であってもよい。このためには、音声持続期間デ
−タ記憶部に記憶するものを単音節の音声持続期間に入
れ替え、図1に示す音韻検出部における音韻検出を省略
することにより実現できる。
【0041】
【発明の効果】本発明によれば、従来より正確な音声合
成の音声持続期間を生成できる。そのうえ、本発明は合
成単位が単音節である音声合成システムにも合成単位が
音韻である音声合成システムにも適用できる。
【図面の簡単な説明】
【図1】本発明における一実施例の中国語音声合成用音
声持続期間処理装置を示すシステムブロック図である。
【図2】本発明における一実施例の中国語音声合成用音
声持続期間処理装置を処理する流れ図である。
【図3】本発明における一実施例の中国語音声合成用音
声持続期間処理装置を処理する図2の続きの流れ図であ
る。
【図4】本発明における一実施例の中国語音声合成用音
声持続期間処理装置を処理する流れ図である。本発明音
声持続期間処理装置における音韻検出部の音節音韻対照
表を示す図である。
【図5】本発明音声持続期間処理装置における音声持続
期間デ−タ記憶部を示す構造図である。
【図6】C言語で実現された音声持続期間デ−タ記憶部
の一例を示す図である。
【図7】従来の音声持続期間処理装置のシステムブロッ
ク図である。
【図8】従来の音声持続期間処理装置における音声持続
期間処理部を処理する流れ図である。
【図9】従来の音声持続期間処理装置における音声持続
期間処理部を処理する図8の続きの流れ図である。
【図10】従来の音声持続期間処理装置における音声持
続期間処理部を処理する図9の続きの流れ図である。
【符号の説明】
1  ピンイン入力部 11  記憶部 12  iレジスタ 13  i1レジスタ 14  jレジスタ 15  kレジスタ 16  cレジスタ 17  c1レジスタ 18  c2レジスタ 19  sレジスタ 20  dレジスタ 22  音調検出部 23  音韻検出部 24  音声持続期間検出部 25  音節音韻対照記憶部 26  音声持続期間データ記憶部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】自然音声を構成する各音韻の音声持続期間
    について、各々の音調及び該当音韻が文に占める位置に
    よって各々の値を格納する音声持続期間デ−タ記憶部と
    、入力されたピンイン記号、音調記号により構成された
    任意の長さのピンイン文が音調記号によって音節を検出
    し、該当音調記号を記憶する音調検出部と、前記入力さ
    れた任意の長さのピンイン文の各音節における各音韻及
    びその音韻が文に占める位置を検出する音韻検出部と、
    前記検出された音調と各音韻とその音韻が文に占める位
    置を検索インデクスとして前記の音声持続期間デ−タ記
    憶部における各該当音韻の音声持続期間デ−タを取り出
    す音声持続期間検出部とを備えたことを特徴とする音声
    合成用音声持続期間処理装置。
JP3006171A 1991-01-23 1991-01-23 音声合成用音声持続期間処理装置 Pending JPH04238396A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3006171A JPH04238396A (ja) 1991-01-23 1991-01-23 音声合成用音声持続期間処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3006171A JPH04238396A (ja) 1991-01-23 1991-01-23 音声合成用音声持続期間処理装置

Publications (1)

Publication Number Publication Date
JPH04238396A true JPH04238396A (ja) 1992-08-26

Family

ID=11631103

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3006171A Pending JPH04238396A (ja) 1991-01-23 1991-01-23 音声合成用音声持続期間処理装置

Country Status (1)

Country Link
JP (1) JPH04238396A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005208652A (ja) * 2004-01-21 2005-08-04 Microsoft Corp 声調言語用分節声調モデリング
CN106157948A (zh) * 2015-04-22 2016-11-23 科大讯飞股份有限公司 一种基频建模方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005208652A (ja) * 2004-01-21 2005-08-04 Microsoft Corp 声調言語用分節声調モデリング
CN106157948A (zh) * 2015-04-22 2016-11-23 科大讯飞股份有限公司 一种基频建模方法及系统
CN106157948B (zh) * 2015-04-22 2019-10-18 科大讯飞股份有限公司 一种基频建模方法及系统

Similar Documents

Publication Publication Date Title
KR900009170B1 (ko) 규칙합성형 음성합성시스템
US5787230A (en) System and method of intelligent Mandarin speech input for Chinese computers
US5949961A (en) Word syllabification in speech synthesis system
US7107216B2 (en) Grapheme-phoneme conversion of a word which is not contained as a whole in a pronunciation lexicon
US3704345A (en) Conversion of printed text into synthetic speech
US8015011B2 (en) Generating objectively evaluated sufficiently natural synthetic speech from text by using selective paraphrases
WO1994007238A1 (en) Method and apparatus for speech synthesis
EP1668628A1 (en) Method for synthesizing speech
JPH086591A (ja) 音声出力装置
JPH04238396A (ja) 音声合成用音声持続期間処理装置
CN115148225A (zh) 语调评分方法、语调评分系统、计算设备及存储介质
JPH07262191A (ja) 単語分割方法、および音声合成装置
JP3201329B2 (ja) 音声合成装置
Hendessi et al. A speech synthesizer for Persian text using a neural network with a smooth ergodic HMM
JPH07110807A (ja) 文書読み上げ装置
JP6631186B2 (ja) 音声作成装置、方法、及びプログラム、音声データベース作成装置
WO2023047623A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JPH0962286A (ja) 音声合成装置および音声合成方法
JPH06119144A (ja) 文書読み上げ装置
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JP2003005776A (ja) 音声合成装置
Kaur et al. BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE
Kato et al. Multilingualization of speech processing
JP3234371B2 (ja) 音声合成用音声持続時間処理方法及びその装置
JPS62119591A (ja) 文章読上げ装置