JP3314106B2 - 音声規則合成装置 - Google Patents

音声規則合成装置

Info

Publication number
JP3314106B2
JP3314106B2 JP18982593A JP18982593A JP3314106B2 JP 3314106 B2 JP3314106 B2 JP 3314106B2 JP 18982593 A JP18982593 A JP 18982593A JP 18982593 A JP18982593 A JP 18982593A JP 3314106 B2 JP3314106 B2 JP 3314106B2
Authority
JP
Japan
Prior art keywords
speech
information
word
phrase
prosody
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP18982593A
Other languages
English (en)
Other versions
JPH0744186A (ja
Inventor
治 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP18982593A priority Critical patent/JP3314106B2/ja
Publication of JPH0744186A publication Critical patent/JPH0744186A/ja
Application granted granted Critical
Publication of JP3314106B2 publication Critical patent/JP3314106B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】任意の入力語について合成音声を
生成する、音声規則合成装置に関する。
【0002】
【従来の技術】一般に音声合成装置における韻律の制御
は、生成される合成音声の自然性に大きな影響を与え
る。
【0003】従来の韻律制御法として、文節間の係受関
係、句読点、文節のモーラ数、文章の位置情報等のテキ
スト情報と自然音声のフレーズ成分、ポーズの大きさ、
音韻継続長等の韻律情報との関係を定式化するための線
形モデルによる韻律制御方法が知られている。
【0004】
【発明が解決しようとする課題】しかし、上述の韻律制
御方法は、各要因がそれぞれ独立にかつ相加的に韻律に
影響していることが前提となっているが、実際には各要
因の相互作用の影響も強く、結果的に合成音声に不自然
さが伴っていた。
【0005】本発明の目的は上述の点を解決し、自然発
声に近い韻律を持つ任意文の音声合成を可能にすること
にある。
【0006】
【課題を解決するための手段】この発明の上述の目的
は、任意の入力文について合成音声を生成する音声規則
合成装置において、連続して発生された自然音声から抽
出した文のフレーズ成分情報、ポーズ長情報、および文
節の継続長情報を、当該文を構成する文節のモーラ数情
報および各文節の先頭の単語と末尾の単語の品詞情報の
組合せに対応させて格納する韻律制御用メモリを備え、
任意の入力文を構成する各文節のモーラ数情報および上
記各文節の先頭の単語と末尾の単語の品詞情報の組合せ
と一致もしくは類似するものが上記韻律制御用メモリに
存在するとき、上記韻律制御用メモリから上記一致もし
くは類似するものに対応するフレーズ成分情報、ポーズ
長情報、および文節の継続長情報を得ることによって、
韻律制御を行なうことを特徴とする音声規則合成装置
よって達成される。
【0007】た、上記任意の入力文を各単語に分割す
る単語分割処理部と、少なくとも品詞情報を格納する日
本語辞書用メモリとをさらに備え、上記単語分割処理部
は上記日本語辞書用メモリを参照して任意の入力文を各
単語に分割することを特徴とする音声規則合成装置を提
供する。これによれば、日本語辞書用メモリで参照した
各単語の品詞情報を韻律制御用メモリにおいても利用で
きるため、全体の処理を軽減することが可能である。
【0008】
【作用】分割手段が入力された文を特定の方法により各
単語に分割し、設定手段が単語分割処理部で分割された
各単語に対してアクセントの型および読みを設定し、韻
律制御手段が単語列の品詞およびモーラ数の組合せに基
づいて韻律制御メモリを参照し、その組合せに対応した
韻律情報を用いて韻律を制御し、パラメータ生成手段が
単語読みアクセント処理部により与えられた各単語の読
みに対応する合成単位を検索して音声パラメータの時系
列を出力する。
【0009】
【実施例】以下、この発明を図示の実施例により詳細に
説明する。
【0010】図1は本発明の構成を概略的に示したブロ
ック図である。図1の音声規則合成装置は、入力部1
0、制御部11、音声合成部12、出力部13、日本語
辞書用メモリ14、韻律制御用メモリ15、音声データ
辞書用メモリ16により構成されている。なお、入力部
10、制御部11、音声合成部12、日本語辞書用メモ
リ14、韻律制御用メモリ15及び音声データ辞書用メ
モリ16は、バス17を介して互いに接続される。ま
た、制御部11は、プログラムされたコンピュータで主
として構成されており、後述するごとく、入力部10か
ら入力させたデータから日本語辞書用メモリ14、韻律
制御用メモリ15および音声データ辞書用メモリ16を
用いて音声パラメータを生成する。
【0011】次に図1の制御部11の詳細な構成を図2
に示す。図2に示すように、制御部11は、入力部10
および日本語辞書用メモリ14に接続された分割手段と
しての単語分割処理21、単語分割処理部21に接続さ
れた設定手段としての単語読みアクセント処理部22を
含む文字列解析部20、文字列解析部20及び韻、文字
列解析部20及び韻律制御用メモリ15に接続された韻
律制御手段としての韻律処理部23、韻律処理部23及
び合成用単位の音声データ辞書用メモリ16に接続され
たパラメータ生成手段としての音声パラメータ生成部2
4により構成される。
【0012】以下、上述の構成部分の動作を説明する。
【0013】まず、入力部10は漢字仮名交じり文を入
力して、単語分割処理部21に出力する。単語分割処理
部21は、入力部10から出力された漢字仮名交じり文
を、日本語辞書用メモリ14を参照して最長一致法また
は文中の文節数が最小となるように単語を選択する文節
最小法等を用いて各単語に分割する。ここで、日本語辞
書用メモリ14には、単語毎に品詞、読み、モーラ数及
びアクセントがあらかじめ格納される。
【0014】単語分割処理部21で分割された単語は、
単語読みアクセント処理部22により単語毎にアクセン
トの型及び読みが設定されて韻律処理部23に出力され
る。
【0015】韻律処理部23は、単語読みアクセント処
理部22で得られた各単語のアクセントの型から、単語
が連鎖した際の文節のアクセントの設定を特定の方法に
より行い、後述する方法によりピッチパタン、ポーズ長
および単語毎の継続長の設定を行なって韻律を制御す
る。
【0016】音声パラメータ生成部24は、合成用単位
の音声データ辞書メモリ16を参照して各単語の読みに
対応する合成単位を検索し、最終的に音声合成用の音声
パラメータの時系列を音声合成部12を介して出力部1
3から出力する。
【0017】また、韻律制御用メモリ15には、連続し
て発声された自然音声から抽出した文のフレーズ成分、
ポーズ長および単語毎の継続長等の韻律情報が、当該文
を構成する単語のモーラ数情報および品詞情報の組合せ
に対応させて格納される。フレーズ成分とはピッチパタ
ンを近似するなめらかな曲線で、フレーズ成分に各単語
のアクセント成分を重畳することによりピッチパタンが
作成される。
【0018】図3は、韻律制御用メモリに格納する韻律
情報の例を示す図で、(a)はフレーズ成分の時系列、
(b)はフレーズ指令、(c)は単語単位の品詞情報、
(d)は文節単位の品詞情報である。例えば、「次の電
車は天理行きです。」という文の自然音声を韻律制御メ
モリに格納する場合、図3(a)(c)に示すようにフ
レーズ成分とポーズ長および各単語の継続長を抽出し、
分割された単語の品詞およびモーラ数に対応させてメモ
リに格納する。この例ではフレーズ成分の時系列をメモ
リに格納しているが、図3(b)に示すように藤崎モデ
ル(日本音響学会誌27、445−453(1971)
で用いるフレーズ指令の大きさと位置で記憶しても良
い。
【0019】次に、上記の韻律処理部23におけるピッ
チパタン、ポーズ長および単語毎の継続長の設定の方法
について述べる。まず、韻律制御部23に入力された単
語列の品詞及びモーラ数の組合せに基づいて韻律制御用
メモリを参照し、同一もしくは類似する組合せがあれ
ば、その組合せに対応したフレーズ成分とポーズ長およ
び単語の継続長をメモリから読み出す。もし組合せがな
い場合は従来通り規則によってフレーズ成分とポーズ長
および単語の継続長を算出する。ここでいう類似する組
合せとは、例えば品詞の並びは一致するがモーラ数が一
部異なる場合とか、助詞の種類が一部異なる場合などで
ある。次に算出したフレーズ成分にアクセント型に応じ
たアクセント成分を重畳することにより、ピッチパタン
を算出する。以上の処理でピッチパタン、ポーズ長およ
び単語毎の継続長を設定する。
【0020】なお、本実施例では文字列解析部20を設
けているが、あらかじめテキスト解析を行い、その解析
情報を本装置への入力にした場合は、上記文字列解析部
20を省略できる。
【0021】上述した方式の場合、文節間の文法に基づ
いた系受関係、句読点、文節のモーラ数、文章の位置情
報等のテキスト情報と自然音声の韻律情報とが1対1に
対応するので、従来の線形モデルによる定式化に比べて
きわめて自然発声に近い韻律が算出出来る。
【0022】次に、ハード構成の制約に合わせてメモリ
を減らす方式を次に提案する。まず、韻律制御用メモリ
15には、連続して発声された自然音声から抽出した文
のフレーズ成分情報を、当該文を構成する文節のモーラ
数情報および品詞情報の組合せに対応させて格納する。
この場合、各文節を構成する先頭の単語の品詞と末尾の
単語の品詞のみを品詞情報として格納する。上述した
「次の電車は天理行きです。」の場合の例を図3(d)
に示す。そして、合成する際は、入力文に対して文節毎
にモーラ数と文節を構成する先頭と末尾の品詞を算出し
その組合せに基づいて韻律制御用メモリを参照し、同一
の組合せがあれば、その組合せに対応したフレーズ成分
とポーズ長をメモリから読み出す。
【0023】このようにモーラ情報と品詞情報を文節単
位にすることによりメモリを減らすことが出来る。
【0024】
【発明の効果】以上より明らかなように、この発明の音
声規則合成装置は、連続して発生された自然音声から抽
出した文のフレーズ成分情報ポーズ長情報、および単
語の継続長情報を、当該文を構成する単語のモーラ数情
報および品詞情報の組合せに対応させて格納する韻律制
御用メモリを備え、任意の入力文を構成する各単語の
ーラ数情報および品詞情報の組合せと一致もしくは類似
するものが上記韻律制御用メモリに存在するとき、上記
韻律制御用メモリからフレーズ成分情報、ポーズ長
報、および単語の継続長情報を得ることによって、自然
音声に極めて近い韻律制御を行なうことが出来る。
【図面の簡単な説明】
【図1】本発明の音声規則合成装置の一実施例の回路構
成を示すブロック図である。
【図2】図1中の制御部の詳細な構成を示すブロック図
である。
【図3】韻律制御用メモリに格納する韻律情報の例を示
す図である。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 13/00 - 13/08

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 任意の入力文について合成音声を生成す
    る音声規則合成装置において、 連続して発生された自然音声から抽出した文のフレーズ
    成分情報、ポーズ長情報、および文節の継続長情報を、
    当該文を構成する文節のモーラ数情報および各文節の先
    頭の単語と末尾の単語の品詞情報の組合せに対応させて
    格納する韻律制御用メモリを備え、 任意の入力文を構成する各文節のモーラ数情報および
    記各文節の先頭の単語と末尾の単語の品詞情報の組合せ
    と一致もしくは類似するものが上記韻律制御用メモリに
    存在するとき、 上記韻律制御用メモリから上記一致もしくは類似するも
    のに対応するフレーズ成分情報、ポーズ長情報、および
    文節の継続長情報を得ることによって、韻律制御を行な
    うことを特徴とする音声規則合成装置。
  2. 【請求項2】 上記任意の入力文を各単語に分割する単
    語分割処理部と、少なくとも品詞情報を格納する日本語
    辞書用メモリとをさらに備え、上記単語分割処理部は上
    記日本語辞書用メモリを参照して任意の入力文を各単語
    に分割することを特徴とする請求項1に記載の音声規則
    合成装置。
JP18982593A 1993-07-30 1993-07-30 音声規則合成装置 Expired - Fee Related JP3314106B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18982593A JP3314106B2 (ja) 1993-07-30 1993-07-30 音声規則合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18982593A JP3314106B2 (ja) 1993-07-30 1993-07-30 音声規則合成装置

Publications (2)

Publication Number Publication Date
JPH0744186A JPH0744186A (ja) 1995-02-14
JP3314106B2 true JP3314106B2 (ja) 2002-08-12

Family

ID=16247844

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18982593A Expired - Fee Related JP3314106B2 (ja) 1993-07-30 1993-07-30 音声規則合成装置

Country Status (1)

Country Link
JP (1) JP3314106B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030068778A (ko) * 2002-02-18 2003-08-25 삼성전기주식회사 음성 합성 출력 장치

Also Published As

Publication number Publication date
JPH0744186A (ja) 1995-02-14

Similar Documents

Publication Publication Date Title
US6477495B1 (en) Speech synthesis system and prosodic control method in the speech synthesis system
JP2002258885A (ja) テキスト音声合成装置およびプログラム記録媒体
JP3314106B2 (ja) 音声規則合成装置
JPH0887297A (ja) 音声合成システム
van Rijnsoever A multilingual text-to-speech system
JPH08335096A (ja) テキスト音声合成装置
JP3060276B2 (ja) 音声合成装置
JP3314116B2 (ja) 音声規則合成装置
JP2976811B2 (ja) テキストからの人体動作音声生成システム
JPH037995A (ja) 歌音声合成データの作成装置
JP3034911B2 (ja) テキスト音声合成装置
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JP2000056788A (ja) 音声合成装置の韻律制御方法
JPH09292897A (ja) 音声合成装置
JP3023957B2 (ja) 音声合成装置
JPH08160983A (ja) 音声合成装置
JP2995814B2 (ja) 音声合成方法
JPH06149283A (ja) 音声合成装置
JPH0562356B2 (ja)
JP2000172286A (ja) 中国語音声合成のための同時調音処理装置
JPH08328578A (ja) テキスト音声合成装置
JPH037994A (ja) 歌音声合成データの作成装置
JP2675883B2 (ja) 音声合成方式
JPH08211896A (ja) 音声合成編集方式および装置
JPH08160990A (ja) 音声合成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080531

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090531

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees