JP2001166787A - 音声合成装置および自然言語処理方法 - Google Patents

音声合成装置および自然言語処理方法

Info

Publication number
JP2001166787A
JP2001166787A JP34495999A JP34495999A JP2001166787A JP 2001166787 A JP2001166787 A JP 2001166787A JP 34495999 A JP34495999 A JP 34495999A JP 34495999 A JP34495999 A JP 34495999A JP 2001166787 A JP2001166787 A JP 2001166787A
Authority
JP
Japan
Prior art keywords
prosody
text
rule
information
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP34495999A
Other languages
English (en)
Inventor
Yumiko Kato
弓子 加藤
Katsuyoshi Yamagami
勝義 山上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP34495999A priority Critical patent/JP2001166787A/ja
Publication of JP2001166787A publication Critical patent/JP2001166787A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 書き言葉のテキストを話し言葉の表現に
置き換えて話し言葉らしい韻律で読み上げ、かつ、話し
言葉韻律にあわせて規則韻律を調整することで、話し言
葉として自然にテキストを読み上げることができる音声
合成装置を提供すること。 【解決手段】 テキスト変換部140において、入力テ
キスト中で、テキスト変換規則テーブル130に登録さ
れているテキスト変換規則の書き言葉のパターンに照合
する部分を、規則に指定された話し言葉へと変換する。
韻律情報制御部190においては、話し言葉へ変換され
た部分に対して、話し言葉のために特別に用意した韻律
情報を付与する一方、変換部以外の韻律を変換部へ自然
につながるように設定されたパラメータを用いて規則に
従って生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された任意の
テキストの読み上げ音声を合成するテキスト音声合成装
置、および、テキスト音声合成装置において書き言葉を
話し言葉に変換して読み上げるための自然言語処理方法
に関する。
【0002】
【従来の技術】従来の音声合成装置は、日本語テキスト
を単純に分割し、発音記号列に変換し韻律情報を生成し
てその韻律にしたがって波形を生成していた。しかし、
テキスト情報は読まれることを前提とした書き言葉で記
述されている場合がほとんどであり、発音しにくい、あ
るいは、聞き取りにくい単語、複合語、フレーズを含ん
でいることがあり、そのまま読み上げた場合には、合成
音声の了解性を損なっていた。
【0003】この点に着目し、入力テキストの難意語や
紛らわしい同音異義語を平易な単語に置き換える機能を
有したテキスト音声合成装置(特開平3−35296)
や、聞いてわかりやすく自然な音声にするため、テキス
トの表現を話し言葉に適した形式に変換して音声合成す
るという音声合成技術が提案されている。
【0004】
【発明が解決しようとする課題】しかしながら、話し言
葉の文末や区切れ、意味の切れ目等では、自然音声では
基本周波数、音声強度、話速や音韻時間長が複雑に調節
されており、規則に基づく音声合成方式では自然な音声
を生成することは、なかなか困難である。
【0005】すなわち、話し言葉特有の表現に見られる
韻律パタンは複雑であり規則音声合成で再現することは
困難である。そのため書き言葉のテキストを話し言葉に
変換して音声を合成しても、自然性、了解性は改善され
ないばかりか、低下する場合も想定される。
【0006】実際、ラジオなどのニュースを読み上げる
アナウンサーは、書き言葉から話し言葉へと修正された
原稿を、話し言葉特有の表現をそれぞれの表現に適した
イントネーションで読み上げることで、意味のまとま
り、区切れを明確にし、内容をわかりやすく正確に伝え
る。したがって、仮に、書き言葉を話し言葉に変換し、
その部分だけを自然な音声(例えば、アナウンサー特有
のイントネーション)で読み上げても、その部分に連接
する(連続する)部分が機械的な音声であって自然に滑
らかに続いていないならば、かえって、読み上げの調子
が途中で唐突に変化して、かえって、聴取者に違和感を
与えることになる。
【0007】本発明は、このような不都合を解消するた
めになされたものであり、自然で了解性の高い音声でテ
キストの読み上げを行うことができる音声合成装置およ
び自然言語処理方法を提供することを目的とする。
【0008】
【課題を解決するための手段】本発明では、書き言葉を
話し言葉に変換して自然韻律(例えば、話し手であるア
ナウンサー特有の自然なイントネーション)で読み上げ
るのみならず、その変換部分に連接する部分について
も、読み上げを調節するパラメータを調節して、変換部
分にできるだけ自然につながるように規則合成する。
【0009】変換部分以外の部分についてパラメータを
調整する方法としては、変換部分の言葉に連続させるの
にふさわしいパラメータをあらかじめ一つだけ決めてお
く方法や、文章の長さに応じて、複数の候補の中から一
つを選択する方法や、最もふさわしい韻律を目標値とし
て与え、その目標値になるようにパラメータをリアルタ
イムで計算する方法などがある。
【0010】
【発明の実施の形態】本発明の音声合成装置の一つの態
様では、書き言葉の表現を話し言葉特有の表現に変換
し、その変換部に対応する話し言葉特有の韻律情報コー
ドを付与し、またその話し言葉特有の韻律に接続するた
めの韻律制御パラメータコードを付与し、それらのコー
ドより変換部には話し言葉特有の自然な韻律情報を適用
し、変換部以外には変換部の話し言葉特有の韻律に自然
に接続する韻律情報を生成するためのパラメータをコー
ドに対応して適用し、規則に従って韻律情報を生成して
両者を統合し、その韻律に基づいて音声を合成する。
【0011】また、本発明の音声合成装置の他の態様で
は、書き言葉の表現を話し言葉特有の表現に変換し、そ
の変換部部に対応する話し言葉特有の韻律情報コードを
付与し、またその話し言葉特有の韻律に接続するための
韻律制御パラメータを、例えば、読み上げしようとする
文書の長さに応じて付与し、変換部には話し言葉特有の
韻律情報コードに対応する話し言葉特有の自然な韻律情
報を適用し、変換部以外には話し言葉特有の韻律に接続
するための韻律制御パラメータを用いて、変換部の話し
言葉特有の韻律に自然に接続する韻律情報を規則に従っ
て生成して両者を統合し、その韻律に基づいて音声を合
成する。
【0012】また、本発明の音声合成装置の他の態様で
は、書き言葉の表現を話し言葉特有の表現に変換し、そ
の変換部部に対応する話し言葉特有の韻律情報コードを
付与し、またその話し言葉特有の韻律に接続する部分の
韻律情報を変換部以外の韻律を生成する際の目標値とし
て付与し、変換部には話し言葉特有の韻律情報コードに
対応する話し言葉特有の自然な韻律情報を適用し、変換
部以外には変換部との接続部で韻律情報の目標値を実現
するようなパラメータを設定しそのパラメータを用いて
韻律情報を規則に従って生成して両者を統合し、その韻
律に基づいて音声を合成する。
【0013】これらにより、書き言葉で書かれた入力テ
キストを話し言葉の表現に置き換えて話し言葉らしい韻
律で読み上げると共に、話し言葉特有でない表現の部分
との接続を自然にすることが可能であり、全体としてま
とまりのある自然な合成音声を提供することができる。
【0014】以下、本発明の実施の形態について、図面
を参照して具体的に説明する。
【0015】(実施の形態1)図1は、本発明の実施の
形態1における音声合成装置の構成を示すブロック図で
ある。
【0016】本実施の形態では、テキスト変換規則テー
ブルに自然音声韻律パターンコードおよび規則合成用韻
律用パラメータコードを記憶させておき、テキスト変換
の際に、変換部分の自然韻律パタンのみならず、変換部
分以外の、変換部分に連なる部分のパラメータもコード
により指定してしまうものである。
【0017】図1に示すように、本実施の形態の音声合
成装置は、テキスト入力部110と、入力された日本語
テキストを解析する言語処理部120と、書き言葉と話
し言葉の変換規則および変換部の韻律情報コードおよび
規則合成のパラメータコードを記録したテキスト変換規
則テーブル130と、テキスト変換規則テーブル130
を参照して、書き言葉を話し言葉に変換するテキスト変
換部140(機能ブロックとして置換手段141と、コ
ード付与手段142をもつ)と、を有する。
【0018】さらに、この音声合成装置は、規則合成の
パラメータコードに対応する基本周波数制御パラメータ
Pt、音声強度制御パラメータPw、話速制御パラメータS
r、のセットを記録している韻律パラメータテーブル1
50と、韻律パラメータテーブル150を参照して、あ
らかじめ定められた規則により変換部以外の韻律情報を
生成する規則韻律生成部160と、自然韻律パタンコー
ドと基本周波数パタン、音声強度パタン、音韻時間長パ
タンを記録した自然韻律情報テーブル170と、自然韻
律情報テーブル170を参照して変換部の韻律情報を生
成する自然韻律制御部180と、規則韻律生成部160
から出力される変換部以外の韻律情報と自然韻律制御部
180から出力される変換部の韻律情報とを統合する韻
律制御部190と、音声波形生成部200と、電気音響
機器210と、を有する。
【0019】なお、音声波形生成部200は、韻律制御
部190から出力される韻律情報と発音記号列とに基づ
き音声波形を生成する。
【0020】次に、音声合成装置の動作を説明する。
【0021】テキスト入力部110は、処理するべきテ
キストデータを受け付け、言語処理部120は、入力さ
れたテキストデータを形態素解析して、品詞などの言語
情報を付与した単語列に分割する。
【0022】テキスト変換部140は、言語処理部12
0の出力である単語列を走査して、テキスト変換規則テ
ーブル130の変換前の単語列パターンに照合する部分
を、変換後の単語列に置き換えて、その部分の単語列に
は自然韻律情報識別コードを付与し、一方、変換を行わ
ない部分に対しては規則合成用韻律パラメータコードを
付与する。テキスト変換規則テーブル130には、入力
テキストの単語列と照合すべきテキスト変換規則が複数
登録されている。テキスト変換規則テーブル130の内
容の一例を図2に示す。
【0023】例えば、「…の開設を検討するという。」
というテキストが入力された場合を想定する。この場
合、「という。」は「ということです。」に変換され、
韻律情報識別コード「0001」が付与される。また、
この変換された部分に連なる「開設を検討する」という
部分に対しては、規則合成用韻律パラメータコード「0
001」が付与される。この規則合成用韻律パラメータ
コードは、変換された部分に最も自然につながる合成音
声を出力するべく、規則韻律のパラメータの組を指定す
るものである。このパラメータコードは、表現が書き言
葉から話し言葉に変換される部分に対応させて、予め選
択されているものである。
【0024】図3に、テキスト変換部140による変換
の前後のテキストデータの例を示す。図中、参照符号4
01で示される部分が変換前単語列であり、参照符号4
02で示される部分が、変換後の、変換部分に連接する
部分の単語列であり、参照符号403で示される部分
が、変換部分の単語列である。
【0025】図3の下側に示されるような単語列が、テ
キスト変換部140から出力され、韻律制御部190に
入力される。韻律制御部190は、入力された単語列の
うち、変換部に相当する部分を自然韻律制御部180に
与え、変換部以外の部分の単語列を規則韻律生成部16
0に与える。そして、規則韻律生成部160から出力さ
れる変換部以外の部分に対応する韻律情報と、自然韻律
制御部180から出力される変換部の韻律情報を統合す
る。
【0026】規則韻律生成部160は、上述のテキスト
変換部140から出力される単語列に付与された言語情
報と規則合成用韻律パラメータコードに基づき、韻律パ
ラメータテーブル150を参照して、基本周波数制御パ
ラメータPt0001、音声強度制御パラメータPw000
1、話速制御パラメータSr0001、を選択し、テキス
ト変換部140で変換されなかった部分の韻律情報をあ
らかじめ定められた規則にしたがって生成する。なお、
規則韻律生成部160は、例えば、藤崎モデルなどの規
則化された韻律制御モデルによってピッチなどの韻律情
報を生成する。
【0027】一方、自然韻律制御部180は、変換され
た部分に付与された自然韻律情報識別コードで指定され
る韻律情報を、韻律情報テーブル170から取り出し、
テキスト変換部140で変換された部分の韻律情報を生
成する。自然韻律情報テーブル170には、話し言葉の
定型部分の韻律情報を登録しておく。この韻律情報は、
例えば、実際に話し言葉を読み上げた音声を録音し、音
声信号を分析して得られた韻律情報である。
【0028】上述したように、規則韻律生成部160か
ら出力される変換部以外の部分に対応する韻律情報と、
自然韻律制御部180から出力される変換部の韻律情報
は、韻律制御部190で統合され、音声波形生成部20
0に送られる。
【0029】音声波形生成部200では、韻律制御部1
90で生成された韻律情報に従って音声波形を合成し、
続いて、電気音響変換器210は、音声波形を音声に変
換して出力する。
【0030】以上の動作をまとめると、図4に示すよう
になる。すなわち、書き言葉を話し言葉に変換する(ス
テップ220)。このとき、自然韻律情報識別コードと
規則合成用のパラメータコードが付与される。
【0031】次に、規則合成のパラメータコードに対応
する一組のパラメータ(Pt,Pw,Sr)を用いて、
変換部分以外の部分について、規則韻律情報を生成する
(ステップ221)と共に、基本周波数パターン,音声
強度パターン,音韻時間長パターンを用いて、変換部分
について、自然韻律情報を生成する(ステップ22
2)。
【0032】以上のように、本実施の形態の音声合成装
置によれば入力テキストの中で話し言葉に変換すべき部
分を、テキスト変換規則によって変換し、変換された部
分について実際の音声信号の分析により得られる自然性
の高い韻律情報を用いて音声合成を行い、変換部以外の
韻律を自然韻律に合わせたパラメータで生成することに
より、話し言葉特有の韻律を再現することができ、か
つ、規則合成と自然韻律が自然につながる合成音声を提
供することができる。
【0033】(実施の形態2)図5は、実施の形態2に
おける音声合成装置の構成を示すブロック図である。
【0034】本実施の形態の音声合成装置の構成は、前
掲の実施の形態のものとほぼ同じである。但し、図3に
おいては、テキスト変換規則テーブル131,テキスト
変換部143,規則韻律生成部161を使用すると共
に、図1の韻律パラメータテーブル150を使用しない
点において、異なる。
【0035】本実施の形態では、テキストの長さに応じ
て、規則韻律用のパラメータの組を適応的に変化させ
る。テキストの長さを規定する単位としては、ここで
は、モーラ数を用いる。例えば、「博覧会の開設を検討
するという」という短いテキストを音読する場合と、
「もし、各国の首脳の合意が締結された場合には、博覧
会の開設を検討するという」という長いテキストを音読
する場合とでは、韻律が異なるのが通常である。例え
ば、長いテキストの場合、文頭から文末にいくにしたが
って、話速は増大し、一番最後にやや速度を落として終
了する、というような速度の変化がみられるし、文章の
つなぎ目等で、声の調子が変化することもある。
【0036】これらのことを考慮し、テキストの文章の
長さに応じて、規則韻律のパラメータを適応的に変化さ
せ(具体的には、複数の候補の中から最も適したものを
選択する)、実施の形態1よりも、さらに自然な音声合
成を行なうものである。
【0037】以下、本実施の形態の音声合成装置の動作
を説明する。
【0038】テキスト入力部110は、処理するべきテ
キストデータを受け付け、言語処理部120は、入力さ
れたテキストデータを形態素解析して、品詞などの言語
情報を付与した単語列に分割する。
【0039】テキスト変換部143は、言語処理部12
0の出力である単語列を走査して、テキスト変換規則テ
ーブル131の変換前の単語列パターンに照合する部分
を、変換後の単語列に置き換えて、その部分の単語列に
自然韻律情報識別コードを付与すると共に、変換を行わ
ない部分に対してそのモーラ数に応じて規則合成用韻律
パラメータである基本周波数制御パラメータPt、音声強
度制御パラメータPw、話速制御パラメータSr、リズムパ
ラメータRt、を付与する。
【0040】図6に示すように「開設を検討するとい
う。」というテキストが入力された場合、「という。」
は「ということです。」に変換され、自然韻律情報識別
コード「0001」が付与される。一方、「開設を検討
する」はモーラ数が11であり、これに応じて規則合成
用韻律パラメータPt131、Pt132・・・Rt131、Rt132が付
与される。 規則韻律生成部161は、テキスト変換部
143から出力される単語列に付与された言語情報と規
則合成用韻律パラメータに基づいて、テキスト変換部1
43で変換されなかった部分の韻律情報をあらかじめ定
められた規則にしたがって生成し、自然韻律制御部18
0は、変換された部分に付与された自然韻律情報識別コ
ードで指定される韻律情報を、自然韻律情報テーブル1
70から取り出してテキスト変換部143で変換された
部分の韻律情報を生成する。
【0041】韻律制御部190は、規則韻律生成部16
1から出力される変換部以外に対応する韻律情報と、自
然韻律制御部180から出力される変換部の韻律情報を
統合する。音声波形生成部200は、韻律制御部190
で生成された韻律情報に従って音声波形を合成し、電気
音響変換器は音声波形を音声に変換して出力する。
【0042】以上の動作をまとめると、図7に示すよう
になる。すなわち、まず、単語列の変換と、自然韻律コ
ードの付与および、モーラ数に応じた規則合成の韻律パ
ラメータの付与を行なう(ステップ230)。
【0043】次に、規則合成の韻律パラメータに基づい
て、規則韻律情報を生成すると共に(ステップ23
1)、自然韻律情報識別コードで指定される自然韻律情
報を生成する(ステップ232)。そして、各情報を統
合し(ステップ233)、音声の合成を行なう(ステッ
プ234)。
【0044】以上のように、本実施の形態の音声合成装
置によれば入力テキストの中で話し言葉に変換すべき部
分を、テキスト変換規則によって変換し、変換された部
分について実際の音声信号の分析により得られる自然性
の高い韻律情報を用いて音声合成を行い、変換部以外の
韻律を、入力テキストの長さ等に応じて適宜選択して、
自然韻律に合わせたパラメータで生成することにより、
話し言葉特有の韻律を再現することができ、規則合成と
自然韻律が、より自然につながる合成音声を提供するこ
とができる。
【0045】(実施の形態3)図8は、本発明における
音声合成装置の構成を示すブロック図である。
【0046】全体構成は、前掲の実施の形態とほぼ同じ
であるが、本実施の形態では、8においては、テキスト
変換規則テーブル132と、テキスト変換部144と、
規則韻律生成部161(規則韻律用パラメータ計算部3
60および韻律情報生成部460を含む)と、を使用す
る点で異なる。
【0047】本実施の形態の特徴は、変換を行なった部
分に、変換を行なわない部分が最も自然につながるよう
にするべく、変換を行なわない部分の接続部分における
最も好ましい韻律情報を目標値として付与し、この目標
値の韻律情報を生成するためのパラメータ値をリアルタ
イムで計算することである。
【0048】以下、本実施の形態の音声合成装置の動作
を説明する。
【0049】テキスト入力部110は、処理するべきテ
キストデータを受け付け、言語処理部120は、入力さ
れたテキストデータを形態素解析して、品詞などの言語
情報を付与した単語列に分割する。
【0050】テキスト変換部140は、言語処理部12
0の出力である単語列を走査して、テキスト変換規則テ
ーブル132の変換前の単語列パターンに照合する部分
を、変換後の単語列に置き換えて、その部分の単語列に
自然韻律情報識別コードを付与し、変換を行わない部分
に対して変換部との接続部分の韻律情報である規則合成
韻律目標値を付与する。
【0051】図9に示すように、「開設を検討するとい
う。」というテキストが入力された場合、「という。」
は「ということです。」に変換され、韻律情報識別コー
ド「0001」が付与される。「開設を検討する」に対
しては規則合成韻律目標値として図9のような、基本周
波数、パワー、話速の情報が付与される。
【0052】規則韻律生成部161では、まず規則韻律
用パラメータ計算部360で、テキスト変換部140c
から出力される単語列に付与された言語情報から変換部
以外のモーラ数やアクセント句数、呼気段落の構成等を
判断し、変換部との接続部の韻律がテキスト変換部14
4から出力される規則合成韻律目標値になるよう規則韻
律用のパラメータを設定する。
【0053】韻律情報生成部460は、規則韻律用パラ
メータ計算部360から出力されるパラメータと、単語
列に付与された言語情報から変換部以外の韻律情報をあ
らかじめ定められた規則にしたがって生成する。
【0054】自然韻律制御部180は、変換された部分
に付与された自然韻律情報識別コードで指定される韻律
情報を韻律情報テーブル170から取り出してテキスト
変換部144で変換された部分の韻律情報を生成する。
【0055】韻律制御部190は、韻律情報生成部46
0から出力される変換部以外に対応する韻律情報と、自
然韻律制御部180から出力される変換部の韻律情報を
統合する。
【0056】音声波形生成部200は、韻律制御部19
0で生成された韻律情報に従って音声波形を合成する。
電気音響変換器210は、音声波形を音声に変換して出
力する。
【0057】以上の動作をまとめると、図10のように
なる。
【0058】すなわち、単語列の変換,自然韻律情報識
別コードの付与および規則合成韻律目標値を付与する
(ステップ240)。次に、変換部との接続部分の周波
数,話速,パワー等が目標値と一致するように、パラメ
ータを計算,出力し、規則韻律情報と自然韻律情報を生
成する(ステップ241)。そして、各情報を統合し
(ステップ242)、音声合成を行なう(ステップ24
3)。
【0059】以上のように、本実施の形態の音声合成装
置によれば入力テキストの中で話し言葉に変換すべき部
分を、テキスト変換規則によって変換し、変換された部
分について実際の音声信号の分析により得られる自然性
の高い韻律情報を用いて音声合成を行い、変換部と変換
部以外の接続部の韻律目標値にあわせて規則韻律を生成
することにより、話し言葉特有の韻律を再現することが
でき、規則合成と自然韻律が、最も自然につながる合成
音声を提供することができる。
【0060】以上説明したように、本発明は、自然韻律
情報と、適応的なパラメータ制御で生成される規則韻律
情報(適応型規則韻律情報)とを組み合わせて、自然な
音声合成を行なうものである。これにより、図11に示
すように、パワーやピッチが適切に調節され、表現が変
換された部分(B)と、それに連接する部分(A)と
を、自然につなげることができる。
【0061】なお、上述した構成の音声合成装置は、例
えば、図12に示すようなコンピュータシステム上に構
築されるものである。このコンピュータシステムは、本
体部601と、キーボード602と、ディスプレイ60
3と、入力装置(マウス)604と、を含む、音声出力
が可能なシステムである。テキスト変換規則テーブルや
韻律情報テーブル等は、本体部601にセットされるC
D−ROM607内,本体部601が内蔵するディスク
(メモリ)606内,あるいは、回線608で接続され
た他のシステムのディスク605内に格納される。
【0062】以上、本発明について3つの実施の形態を
用いて説明したが、本発明は、これに限定されるもので
はなく、種々、変形,応用が可能である。例えば、規則
韻律生成は、藤崎モデルによるとしたが、それ以外のモ
デルに基づく規則であってもよい。
【0063】また、実施の形態の説明では、規則韻律生
成のパラメータは、基本周波数パラメータ、音声強度パ
ラメータ、話速パラメータとしたが、これにリズムパラ
メータを加えた4種類のパラメータのうち1つ以上を含
むものであればよい。同じく、規則韻律生成のパラメー
タは基本周波数、音声強度、話速についてそれぞれ1つ
ないしは2つのパラメータとして説明したが、それ以上
の数のパラメータを指定してもよい。
【0064】また、実施の形態1では、テキスト変換を
行わない部分の規則韻律用パラメータは合成音声を生成
しようとするテキストの長さとは無関係に設定したが、
実施の形態2のように合成音性を生成しようとするテキ
ストの長さに応じて規則韻律用パラメータを設定しても
よい。
【0065】また、実施の形態2において、テキスト変
換を行わない部分の規則韻律用パラメータは合成音声を
生成しようとするテキストのモーラ数に応じて設定する
としたが、アクセント句数、文字数、単語数、文節数等
他の単位を用いてもよく、さらに、これらの単位を複数
組み合わせて設定してもよい。
【0066】また、実施の形態3において、規則合成韻
律目標値は接続部の基本周波数、接続音韻最大パワー、
接続部話速として説明したが、これ以外の韻律情報を含
めてもよく、韻律情報を1つ以上含むものであればよ
い。
【0067】
【発明の効果】以上説明したように本発明によれば、書
き言葉で書かれた入力テキストを話し言葉の表現に置き
換えて話し言葉らしい韻律で読み上げ、かつ話し言葉特
有でない表現の部分との接続を自然にすることが可能で
あり、全体としてまとまりのある自然な合成音声を提供
することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1にかかる音声合成装置の
ブロック図
【図2】本発明の実施の形態1のテキスト変換規則の内
容の例を示す図
【図3】表現変換の前後の、単語列および付与される情
報の例を示す図
【図4】実施の形態1にかかる音声合成装置の基本的な
動作手順を示すフロー図
【図5】本発明の実施の形態2にかかる音声合成装置の
ブロック図
【図6】本発明の実施の形態2のテキスト変換規則の内
容の例を示す図
【図7】実施の形態2にかかる音声合成装置の基本的な
動作手順を示すフロー図
【図8】本発明の実施の形態3にかかる音声合成装置の
ブロック図
【図9】実施の形態3にかかるテキスト変換規則の内容
の例を示す図
【図10】実施の形態3にかかる音声合成装置の基本的
な動作手順を示すフロー図
【図11】本発明の音声合成装置を用いた韻律生成の例
を示す図
【図12】本発明を実施するためのコンピュータシステ
ムの一例を示す図
【符号の説明】
110 テキスト入力部 120 言語処理部 130 テキスト変換規則テーブル 140 テキスト変換部 141 表現置換部 142 コード付与部 150 韻律パラメータテーブル 160 規則韻律生成部 170 韻律情報テーブル 180 自然韻律制御部 190 韻律制御部 200 音声波形生成部 210 電気音響変換器

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 入力テキストの表現を音声化に適した表
    現に変換する表現変換手段と、入力テキスト中の前記表
    現変換手段によって変換された部分について、話し言葉
    用の韻律情報を生成する自然韻律制御手段と、前記表現
    が変換された部分に連接する、表現が変換されない部分
    の韻律を調整するためのパラメータの値を適応的に決定
    することによって、前記表現が変換されない部分につい
    ての韻律情報を生成する規則韻律生成手段と、を有する
    ことを特徴とする、音声合成装置。
  2. 【請求項2】 前記規則韻律生成手段は、前記表現が変
    換された部分に連接する、表現が変換されない部分が、
    前記表現が変換された部分に自然につながるように、予
    め定められているパラメータ値を選択する、複数のパラ
    メータ値の中から適切なものを選択する、あるいは、韻
    律目標値になるように所定の計算をする、のいずれかの
    手法を用いて、前記パラメータの値を決定することを特
    徴とする請求項1記載の音声合成装置。
  3. 【請求項3】 日本語の入力テキストを単語列に分割
    し、単語列の各単語に対して読み、品詞などの言語情報
    を付与する言語処理手段と、 変換前テキストパターンと、変換後テキストと、前記変
    換後テキストを読み上げるための韻律情報を指定する韻
    律情報識別コード、および変換部以外のテキストを読み
    上げるための韻律情報を生成する際の1つ以上のパラメ
    ータを指定する規則韻律パラメータ識別コードを1組と
    するテキスト変換規則が登録されているテキスト変換規
    則テーブルと、 前記言語処理手段から出力される単語列と、前記テキス
    ト変換規則テーブルを照合して、照合した部分をテキス
    ト変換規則に従って書きかえるテキスト変換手段と、 前記テキスト変換規則の規則韻律パラメータ識別コード
    で特定される1つ以上の規則韻律パラメータが登録され
    ている規則韻律パラメータテーブルと、 前記テキスト変換手段から出力される単語列に付与され
    た言語情報から発音系列を生成し、前記テキスト変換規
    則の規則韻律パラメータコードで指定される1つ以上の
    規則韻律パラメータを規則韻律パラメータテーブルから
    取り出し、そのパラメータを用いて、あらかじめ定めら
    れた規則に従って前記発音系列に対応する韻律情報を生
    成する規則韻律生成手段と、 前記テキスト変換規則の韻律情報識別コードで特定され
    る韻律情報が登録されている韻律情報テーブルと、 前記テキスト変換手段で前記テキスト変換規則によって
    書き換えられた部分に対して、前記テキスト変換規則の
    韻律情報識別コードで指定される韻律情報を韻律情報テ
    ーブルから取り出す自然韻律制御手段と、 前記規則韻律生成手段および前記自然韻律制御手段から
    生成された各韻律情報を統合することで、入力テキスト
    全体の韻律情報を生成する韻律制御手段と、 前記韻律情報制御手段で生成された韻律情報に従って音
    声波形を合成する音声波形生成手段と、を有することを
    特徴とする音声合成装置。
  4. 【請求項4】 日本語の入力テキストを単語列に分割
    し、単語列の各単語に対して読み、品詞などの言語情報
    を付与する言語処理手段と、 変換前テキストパターン
    と、変換後テキストと、前記変換後テキストを読み上げ
    るための韻律情報を指定する韻律情報識別コード、およ
    び変換部以外のテキストを読み上げるための韻律情報を
    生成する際の1つ以上の規則韻律制御パラメータを1組
    とするテキスト変換規則が登録されている、テキスト変
    換規則テーブルと、 前記言語処理手段から出力される単語列と、前記テキス
    ト変換規則テーブルを照合して、照合した部分をテキス
    ト変換規則に従って書きかえるテキスト変換手段と、 前記テキスト変換手段から出力される単語列に付与され
    た言語情報から発音系列を生成し、前記テキスト変換手
    段から出力される規則韻律制御パラメータを用いてあら
    かじめ定められた規則に従って前記発音系列に対応する
    韻律情報を生成する規則韻律生成手段と、 前記テキスト変換規則の韻律情報識別コードで特定され
    る韻律情報が登録されている韻律情報テーブルと、 前記テキスト変換手段で前記テキスト変換規則によって
    書きかえられた部分に対して、前記テキスト変換規則の
    韻律情報識別コードで指定される韻律情報を韻律情報テ
    ーブルから取り出す自然韻律制御手段と、 前記規則韻律生成手段と前記自然韻律制御手段から生成
    された韻律情報と統合することで、入力テキスト全体の
    韻律情報を生成する韻律制御手段と、 前記韻律情報制
    御手段で生成された韻律情報に従って音声波形を合成す
    る音声波形生成手段と、を有することを特徴とする音声
    合成装置。
  5. 【請求項5】 前記規則韻律パラメータテーブルあるい
    は前記テキスト変換規則テーブルは、前記規則韻律生成
    手段で韻律情報を生成する、前記テキスト変換がなされ
    なかった部分のテキストの長さに応じて使い分けがなさ
    れる規則韻律制御パラメータを、複数保持していること
    を特徴とする請求項3または請求項4記載の音声合成装
    置。
  6. 【請求項6】 前記規則韻律生成手段で韻律情報を生成
    する変換部以外のテキストの長さはモーラ数によって判
    断するものとする請求項5記載の音声合成装置。
  7. 【請求項7】 前記規則韻律生成手段で韻律情報を生成
    する、前記テキスト変換がなされなかった部分のテキス
    トの長さは、アクセント句数によって判断することを特
    徴とする請求項5記載の音声合成装置。
  8. 【請求項8】 日本語の入力テキストを単語列に分割
    し、単語列の各単語に対して読み、品詞などの言語情報
    を付与する言語処理手段と、 変換前テキストパターン
    と、変換後テキストと、前記変換後テキストを読み上げ
    るための韻律情報を指定する韻律情報識別コード、およ
    び変換部と変換部以外との接続部分での韻律情報である
    1つ以上の規則韻律目標値を1組とするテキスト変換規
    則が登録されているテキスト変換規則テーブルと、 前記言語処理手段から出力される単語列と、前記テキス
    ト変換規則テーブルを照合して、照合した部分をテキス
    ト変換規則に従って書きかえるテキスト変換手段と、 前記テキスト変換手段から出力される単語列に付与され
    た言語情報から発音系列を生成し、その発音系列のうち
    テキスト変換部との接続部分が前記テキスト変換手段か
    ら出力される規則韻律目標値となるよう規則韻律パラメ
    ータを決定する規則韻律パラメータ計算手段と、 前記発音系列に従ってあらかじめ定められた規則に従っ
    て韻律情報を生成する規則韻律生成手段と、 前記テキスト変換規則の韻律情報識別コードで特定され
    る韻律情報が登録されている韻律情報テーブルと、 前記テキスト変換手段で前記テキスト変換規則によって
    書きかえられた部分に対して、前記テキスト変換規則の
    韻律情報識別コードで指定される韻律情報を韻律情報テ
    ーブルから取り出す自然韻律制御手段と、 前記規則韻律生成手段と前記自然韻律制御手段から生成
    された韻律情報と統合することで、入力テキスト全体の
    韻律情報を生成する韻律制御手段と、前記韻律情報制御
    手段で生成された韻律情報に従って音声波形を合成する
    音声波形生成手段と、を有することを特徴とする音声合
    成装置。
  9. 【請求項9】 前記テキスト変換規則テーブルに登録さ
    れているテキスト変換規則において、変換前テキストパ
    ターンを書き言葉の表現パターンとし、変換後テキスト
    を話し言葉の表現とし、韻律情報識別コードを話し言葉
    の韻律情報を指定するコードとすることを特徴とする、
    請求項3,請求項5または請求項8のいずれかに記載の
    音声合成装置。
  10. 【請求項10】 前記韻律情報テーブルは、話し言葉特
    有の表現を読み上げるための韻律情報を保持することを
    特徴とする、請求項3,請求項4または請求項8のいず
    れかに記載の音声合成装置。
  11. 【請求項11】 前記韻律情報は、基本周波数、強さ、
    話速、音韻時間長の情報のうち1つ以上を含むものであ
    ることを特徴とする、請求項3,請求項4または請求項
    8のいずれかに記載の音声合成装置。
  12. 【請求項12】 入力テキストを形態素解析して品詞な
    どの言語情報を付与した単語列に分解するステップと、 前記単語列の中の、テキスト変換規則テーブルに登録さ
    れている単語列パターンに合致するものを話し言葉の単
    語列に置き換えるステップと、 その置き換えられた単語列に対して、自然韻律情報を生
    成するステップと、前記置き換えられた単語列に連な
    る、置換がなされない部分の韻律を調整するためのパラ
    メータの値を適応的に決定することによって、前記置換
    がなされない部分についての規則韻律情報を生成するス
    テップと、 前記自然韻律情報および規則韻律情報に基づいて、前記
    入力テキストのイントネーションを生成することを特徴
    とする自然言語処理方法。
  13. 【請求項13】 前記パラメータの適応的決定は、単語
    列の置き換えがなされなかった部分が、前記単語列の置
    き換えがなされた部分に自然につながるように、予め定
    められているパラメータ値を選択する、複数のパラメー
    タ値の中から適切なものを選択する、あるいは、入力さ
    れたテキストの言語情報に基づいて所定の計算をする、
    のいずれかの手法を用いて行なわれることを特徴とする
    請求項12記載の自然言語処理方法。
JP34495999A 1999-12-03 1999-12-03 音声合成装置および自然言語処理方法 Pending JP2001166787A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34495999A JP2001166787A (ja) 1999-12-03 1999-12-03 音声合成装置および自然言語処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34495999A JP2001166787A (ja) 1999-12-03 1999-12-03 音声合成装置および自然言語処理方法

Publications (1)

Publication Number Publication Date
JP2001166787A true JP2001166787A (ja) 2001-06-22

Family

ID=18373321

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34495999A Pending JP2001166787A (ja) 1999-12-03 1999-12-03 音声合成装置および自然言語処理方法

Country Status (1)

Country Link
JP (1) JP2001166787A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003271172A (ja) * 2002-03-15 2003-09-25 Sony Corp 音声合成方法、音声合成装置、プログラム及び記録媒体、並びにロボット装置
JP2006084666A (ja) * 2004-09-15 2006-03-30 Nippon Hoso Kyokai <Nhk> 韻律生成装置及び韻律生成プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003271172A (ja) * 2002-03-15 2003-09-25 Sony Corp 音声合成方法、音声合成装置、プログラム及び記録媒体、並びにロボット装置
JP2006084666A (ja) * 2004-09-15 2006-03-30 Nippon Hoso Kyokai <Nhk> 韻律生成装置及び韻律生成プログラム
JP4542400B2 (ja) * 2004-09-15 2010-09-15 日本放送協会 韻律生成装置及び韻律生成プログラム

Similar Documents

Publication Publication Date Title
US7565291B2 (en) Synthesis-based pre-selection of suitable units for concatenative speech
US6212501B1 (en) Speech synthesis apparatus and method
Onaolapo et al. A simplified overview of text-to-speech synthesis
JP3576848B2 (ja) 音声合成法方法、装置、および音声合成プログラムを記録した記録媒体
JPH08335096A (ja) テキスト音声合成装置
JP2001166787A (ja) 音声合成装置および自然言語処理方法
JP2008058379A (ja) 音声合成システム及びフィルタ装置
JPH07200554A (ja) 文章読み上げ装置
JPH0580791A (ja) 音声規則合成装置および方法
JP2536169B2 (ja) 規則型音声合成装置
JP2642617B2 (ja) 音声合成装置
JP3575919B2 (ja) テキスト音声変換装置
WO2023182291A1 (ja) 音声合成装置、音声合成方法及びプログラム
JP4056647B2 (ja) 波形接続型音声合成装置および方法
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JP2703253B2 (ja) 音声合成装置
JPH11161297A (ja) 音声合成方法及び装置
JP2573586B2 (ja) 規則型音声合成装置
Butler et al. Articulatory constraints on vocal tract area functions and their acoustic implications
May et al. Speech synthesis using allophones
Juergen Text-to-Speech (TTS) Synthesis
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JP2000322075A (ja) 音声合成装置および自然言語処理方法
Sorace The dialogue terminal
Goudie et al. Implementation of a prosody scheme in a constructive synthesis environment