JP2002149180A - 音声合成装置および音声合成方法 - Google Patents
音声合成装置および音声合成方法Info
- Publication number
- JP2002149180A JP2002149180A JP2000349066A JP2000349066A JP2002149180A JP 2002149180 A JP2002149180 A JP 2002149180A JP 2000349066 A JP2000349066 A JP 2000349066A JP 2000349066 A JP2000349066 A JP 2000349066A JP 2002149180 A JP2002149180 A JP 2002149180A
- Authority
- JP
- Japan
- Prior art keywords
- syntax
- prosody
- information
- pattern
- linguistic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
やすい表現、かつ、わかりやすいイントネーションで読
み上げること。 【解決手段】 言語解析部102において、言語解析を
行ない単語の意味ラベルを付与する。書き言葉から話し
言葉へのテキスト変換を行った後、構文パターン照合部
106にて、意味ラベルの配列に基づいて構文解析を行
ない、文章の意味的関連性を検出し、構文識別情報を付
与する。韻律生成部108にて、基本的な韻律を生成し
た後、韻律制御部109において、構文識別情報と対応
付けられた韻律制御情報を韻律制御データベース110
から検索し、韻律パラメータの調整を行う。これによ
り、構文の形に着目したバランスのとれたイントネーシ
ョンをもつ合成音声を生成する。
Description
トの読み上げ音声を合成する音声合成装置および書き言
葉を話し言葉に変換して読み上げるための音声合成方法
(自然言語処理方法)に関する。
読み上げの対象となるテキストは、読まれることを前提
として書かれた書き言葉の表現で記述されている場合が
多い。書き言葉の表現にはそのまま読み上げると理解し
にくいものがあるので、書き言葉の表現を、読み上げに
適した話し言葉の表現に変換してから読み上げるという
音声合成の方式が提案されている。
平易な単語に置き換えてから読み上げる機能を有したテ
キスト音声合成装置(例えば、特開平3−35296号
公報)が提案されている。
トネーションも調整して、読み上げ音声の了解性を高め
ようとする試みもある。
葉の自然音声では、文節の区切れや意味の切れ目等にお
いて、音の高低,音声強度や音韻時間長などが微妙に調
整されており、規則に基づく音声合成方式のみで自然な
音声を生成することは、なかなか困難である。
上げる場合には、文の意味、あるいは、内容を反映した
読み方をすることが望ましい。
は文節自体の意味と、文の構造、すなわち、単語を含む
各文節同士の互いの関係によって表現される。訓練され
たアナウンサー等は、イントネーションをうまく使い分
けることで、文の構造を分かりやすくするなどのテクニ
ックを有している。
て、例えば、「〜するようです」などの定型的で1つの
文節、あるいはアクセント句に関して話し言葉らしいイ
ントネーション(あるいは韻律)を付与することに成功
したとしても、変換後の話し言葉の表現が複数の文節に
渡る場合(意味の係り結びが複数の文節に渡って生じる
場合)では、文節間のイントネーションのバランスが考
慮されない。よって、文の構造を反映した読み上げ音声
を生成できないという、さらなる不都合が問題となる。
基づいてなされたものであり、上述した従来の書き言葉
から話し言葉への変換機能を有する音声合成装置の不都
合を解消し、わかりやすい表現、かつ、自然なイントネ
ーションでテキストを音声出力することができる新規な
音声合成装置と音声合成方法(自然言語処理方法)を提
供することを目的とする。
特定の言いまわし”に対して置換やイントネーションの
制御を行うという従来の手法に加えて、文書の構文を解
析し、複数の文節に渡る意味の関連性を検出し、その検
出結果に基づく韻律パラメータの調整(基本韻律の微調
整)を行うことで、読み上げる文章の内容を、分かりや
すくするものである。
入力テキストを言語解析して単語列に分解し、各単語の
意味情報を含む言語情報を付与し、前記言語情報が付与
された単語列を、文節を単位としてグループ化して、言
語解析結果として出力する言語解析手段と、この言語解
析手段から出力される、言語処理結果の文節列につき、
前記意味情報の配列パターンに基づいて構文構造を解析
し、構文解析の結果を示す構文識別情報を付与して出力
する構文解析手段と、構文識別情報に対応する韻律制御
情報を用いて、構文構造を反映した韻律情報の制御を行
う韻律制御手段と、韻律制御手段によって生成された韻
律情報にしたがって、音声波形を合成する波形合成手段
と、を有する。
御手段の組み合わせにおいて、テキストの構文構造に応
じた韻律制御を行うことができるので、複数の文節にわ
たる表現の変換に対しても構文的な関係を反映し、バラ
ンスの良い韻律制御が可能である。
し言葉の表現に変換し、かつ、変換後のテキストの構文
構造を反映して読み上げることができるので、テキスト
の内容をわかりやすい音声で、正確に伝えることが可能
である。
すい表現に変換され、構文の構造に対応した韻律制御を
行うので、文の内容がわかりやすいイントネーションで
読み上げることが可能である。
報を利用することにより、同義の単語、表現に対して変
換規則を1つにまとめることが可能になり、効率的に変
換規則を記述可能である、という副次的な効果も得るこ
とができる。
て図面を参照して説明する。
合成装置の構成を表すブロック図である。
力部である。
に分割し、表記、読み、アクセント、品詞、意味情報
(意味ラベル)などを含む言語情報を付与し、単語列を
文節単位にグループ化した言語解析結果を出力する言語
解析部である。参照符号103は、言語解析部102が
単語に付与する言語情報を記述した言語解析用辞書であ
る。
単位、あるいは、文節単位での置換を行うテキスト変換
規則を格納するテキスト変換規則テーブルである。テキ
スト変換規則は、例えば、言語解析結果の変換すべき部
分に関する単語単位、あるいは、文節単位での、表記、
読み、品詞、意味情報などを含む言語情報のパターン
と、パターンに該当する部分の変換後の単語単位、ある
いは、文節単位での言語情報の列として記述される。
ブル105に格納されるテキスト変換規則と言語解析結
果の照合を行い、照合部分の置換を行う。
情報パターンから、書き言葉に対応する話し言葉の言語
情報列として記述することにより、書き言葉から話し言
葉へ変換して読み上げることが可能となる。また、言語
情報パターンにおいて、単語、あるいは、文節の意味情
報を指定することで、1つのテキスト変換規則で同義の
表現に適用可能であるように効率的にテキスト変換規則
を記述することが可能である。
能な、言語情報のパターンとして記述された構文パター
ン(および、構文パターンに対応する韻律制御情報)を
格納する構文パターンデータベースである。
律情報データベース107に格納されている構文パター
ンと言語解析結果を照合して、照合部分に言語解析結果
の構文構造を一意に決定する構文識別情報を設定する構
文パターン照合部である。
位に付与された読み、アクセント、品詞、文節のグルー
プなどの言語情報から、アクセント句単位で音韻情報お
よび韻律パラメータ(基本韻律)を生成する韻律生成部
である。
ース107に格納されている各構文パターンにより与え
られる構文識別情報と対応した韻律制御情報を格納する
韻律制御データベースである。
成された1文の韻律パラメータの系列に対して、韻律制
御データベース110の構文識別情報と対応する韻律制
御情報を用いて韻律パラメータの調整を行う韻律制御部
である。
成された音韻系列、および、韻律制御部で調整された韻
律パラメータに従って、音声波形を合成する波形合成部
である。参照符号112は、波形合成部111が必要と
する音声素片を格納した音声素片データベースである。
ーブル105および変換処理部104は、テキスト変換
手段115(図1中、太い点線で囲んで示される)の構
成要素である。
文パターンデータベース107は、構文解析手段116
(図1中、太い点線で囲んで示される)の構成要素であ
る。また、韻律制御部109および韻律制御データベー
ス110は、韻律制御手段(韻律パラメータを微調整す
るための手段)117の構成要素である。
合成装置の特徴的な動作が、図3に示される。
ストを言語解析する(ステップ301)。このとき、各
単語の意味ラベル(意味情報)も併せて付与する。例え
ば、「A」の「B」の「C」という構文パターンである
場合に、「A」は”地域”を意味する名詞であり、
「B」は”動作の主体”を意味する名詞であり、「C」
は”グループの種別”を意味する名詞であることを示す
意味ラベル(意味情報)を、「A」,「B」,「C」の
各々について付与する。
て、テキスト変換規則テーブル105を参照して登録さ
れているパターンに一致するものがテキスト中に存在す
るかを検出し、一致したパターンを書き言葉のパターン
に置き換え、テキスト変換を行う(ステップ302)。
これにより、書き言葉が話し言葉に変換される。
うテキストが入力された場合、「という。」は「という
ことです。」に変換される。
理にあたり、言語解析部102にて付与された意味ラベ
ルを考慮した、パターン検索を行うことにより、同義の
単語や表現に対して変換規則を1つにまとめることが可
能になり、効率的に変換規則を記述可能である、という
効果が得られる点である。
の予定。」とは、同じ意味の表現であり、共に、「開設
の予定です」という話し言葉に変換するのが望ましい。
単語のパターンだけに基づいてテキスト変換を行おうと
すると、各パターン毎に変換規則を設定しておく必要が
ある。
見れば、両者は同じであり、この意味の配列のパターン
に基づいて変換規則を記述しておけば、変換規則を共通
化することができる。つまり、言語解析の結果として付
与される意味ラベルを活用することで、テキスト変換を
効率化することができる。
パターンデータベース107を参照して、構文パターン
を解析する(図3のステップ303)。
は、ステップ302を経てテキスト変換された部分およ
び、テキスト変換されない部分の双方を対象として実施
される。また、構文パターンの照合は、「意味ラベルの
並び方(配置)」が、構文パターンデータベース107
に登録されているパターンと一致するか否かを検出する
ことで行う。そして、登録されている構文パターンと一
致した部分に、構文識別情報(例えば、”ID1”とい
う識別情)が付与される。
(音の高低)等の基本的な韻律を生成する(ステップ3
04)。この基本的な韻律の生成は、言語解析部102
により解析された情報を利用して行う。
照合部106において付与された構文識別情報(例え
ば、上述の”ID1”という識別情報)に従って韻律パ
ラメータを調整(微調整)する(ステップ305)。
味の関係を考慮した、バランスのとれた韻律形成が可能
となる。
の調整は、構文識別情報(例えば”ID1”)をインデ
ックスとして韻律制御データベース110を検索し、こ
の”ID1”に対応する韻律制御情報を読み出すことに
より行われる。つまり、構文パターンデータベース10
7と韻律制御データベース110との間に、構文パター
ン識別情報に基づく対応関係を構築しておくことで、韻
律制御パラメータの調整を、きわめて簡単に行うことが
できる。
文パターンに”ID1”という構文識別情報が付与され
ているとすると、この構文パターンについては、例え
ば、「Aの」という部分のピッチパターンと、「Bの」
という部分のピッチパターンとの相互の連続性が断ち切
られるように韻律制御パラメータを調整し、「Bの」と
いう部分のピッチパターンと、「C」という部分のピッ
チパターンとの相互の連続性が確保されるように韻律制
御パラメータを調整するのであり、このようなパラメー
タの微調整を行うための情報が、”ID1”というイン
デックスの下で韻律制御データベースに登録されてい
る、ということである。
各文節のピッチパターンのダイナミックレンジの上限値
および下限値、および、その上限値および下限値の時間
に対する変化率の少なくとも一つを含むものであり、こ
れらを調整することにより、構文の意味を考慮した、バ
ランスのとれた韻律を生成することが可能となる。
素片を接続し、韻律パラメータに従って波形を合成する
(ステップ306)。
的(効率的)なプロセスにより、入力テキストの書き言
葉の表現を話し言葉の表現に変換し、かつ、文の構造を
分かりやすく表現する読み上げることが可能となる。
に示すようなコンピュータシステム上に構築されるもの
である。
1と、キーボード202と、ディスプレイ203と、入
力装置(マウス)204と、スピーカ208と、を含むテ
キスト入力と音声出力が可能なシステムである。
換規則テーブル105、構文パターン韻律制御データベ
ース107、音声素片データベース111は、本体部2
01にセットされるCD−ROM209内、本体部20
1が内蔵するディスク(メモリ)205内、あるいは、回
線207で接続された他のシステムのディスク206内
に格納される。
規則の具体例および構文パターンの具体例を用いて、テ
キスト変換処理や韻律制御処理の内容を詳細に説明す
る。
のテキスト変換規則の一例を示す図である。
変換規則を構成している。参照符号402が変換すべき
単語列の言語情報のパターン部分であり、テキスト変換
規則401の例では、品詞が‘名詞’である単語が3つ
連続するパターンを表す。
2に照合した部分を置き換える単語列を指定する。
は、それぞれ、言語情報パターン402の‘[名詞],[名
詞],[名詞]’の3つの言語情報パターンとそれぞれ照合
した部分の言語情報を、[$1],[$2],[$3]の場所にコピー
することを示す。
「銀行」、「券」という3つの名詞からなる単語列は、テ
キスト変換規則401によって、「日本の銀行の券」と
いう単語列に置き換えられる。
ーンデータベース107の構文パターンの1例を示す図
である。
(b)の参照符号502はそれぞれ、1つの構文パター
ンを示している。
は、単語列の言語情報のパターンである。‘[Region],
[Agent],[Group]’は、それぞれ、意味情報を表す。言
語解析結果の単語列の言語情報がもつ意味情報が、言語
情報パターン501Aに記述された意味情報と一致する
場合に、構文パターンと言語解析結果が照合する。ま
た、参照符号501Bは、構文識別情報である。
は、構文の構造として、文節‘[Region][の]’が文節
‘[Group]’に係り、文節‘[Agent][の]’が文節‘[Gro
up]’に係る。この関係を図5の中では、曲線の矢印に
よって表している。
文パターンのもう1つの例である。言語情報パターン5
02Aに照合する単語列は、構文の構造として、文節
‘[Object][の]’が文節‘[Action][の]’に係り、文節
‘[Action][の]’が文節‘[Action]’に係る。
情報パターン501Aと502Aは、同じパターンであ
るが、単語の意味情報を考慮すれば,それぞれの構文パ
ターンに照合する単語列は、構文構造が異なる。よっ
て、それぞれの表現を読み上げる際には、構文構造の違
いが分かるようにイントネーションを使い分けて読み上
げるのが望ましい。
結果が、‘[全国:ニホン:名詞:Region][の:ノ:助詞:*]
[ユーザ:ユーザ:名詞:Agent][の:ノ:助詞:*][会:カイ:
品詞:Group]’だとすると、構文パターン501と照合
するので、この単語列に対しては構文識別情報501B
が付与される。
結果が、‘[情報:ジョーホー:名詞:Object][の:ノ:助
詞:*][公開:コーカイ:サ変名詞:Action][の:ノ:助詞:*]
[制度化:セードカ:サ変名詞:Action]’だとすると、構
文パターン502と照合するので、この単語列に対して
は構文識別情報502Bが付与される。
解析結果に対して、図7は、「情報の公開の制度化を」
の言語解析結果に対して、それぞれの構文構造に応じて
韻律パラメータが調整される様子を示す図である。な
お、ここでは、調整される韻律パラメータとしてピッチ
パターンだけを図中に示してある。
が、構文パターン501と合致するので、構文識別情報
としてID-1が与えられる。
み、アクセントなどからアクセント句ごとにピッチパタ
ーン602が生成される。韻律制御部109は、構文識
別情報ID_1に対応する韻律パラメータの制御情報を韻律
制御データベース110取得し、ピッチパターン602
を調整する。
ては,例えば、ピッチ変化の最大値と最小値、および、
それらの値の時間に対する変化率がある。つまり、これ
らを調整すれば、読み上げ音声の韻律を変化させること
ができる。ピッチパターン602は、韻律制御情報にし
たがって、図6の下側に示されるようなピッチパターン
(音声の高低のパターン)603のように変形される。
ッチパターン603の上下に記載されている点線の直線
A(A1,A2),B(B1,B2)が、ピッチ(音声
の高低)の最大値と最小値を規定している。つまり、点
線の直線Aと直線Bに挟まれた領域がピッチの変動可能
幅(ダイナミックレンジ)となる。上限値Aと下限値B
の値を、一つのアクセント句(文節)と次のアクセント
句(文節)とで異ならせたり、あるいは、所定の値に設
定することで、調整後のピッチパターンの相対的な位置
を異ならせたり、あるいは、なめらかに連続させたりす
ることが可能となる。
する変化率)は、音声の高低の変化の割合を示してお
り、この傾きにより、イントネーションの微調整を行え
る。
ント句(文節)と、「ユーザーの」というアクセント句
(文節)間のピッチパターンは、不連続性が強調される
ように調整されている(A1とA2,B1とB2は不連
続となるように調整されている)。
(文節)と「会は、」というアクセント句(文節)との
間は、なめらかに連続するピッチパターンとなるように
調整されている(ピッチの上限値を示す値A2,下限値
を示す値B2はともに連続しており、それらの時間に対
する変化率も、ほぼ一定で変化しない)。こうすること
で、「全国の、」と「ユーザーの」との間では、意味的
な不連続が明らかになり、「全国の」と「会」,および
「ユーザーの」と「会」との意味的結合が明らかにな
る。つまり、構文の意味にもとづく、複数の文節に渡る
バランスのとれた韻律制御が可能となる。
り、構文識別情報ID-2に対応した韻律制御情報により調
整されたピッチパターン703が得られる。
セント句(文節)と、「公開の」というアクセント句
(文節)との間で、また、「公開の」というアクセント
句(文節)と「制度化を」というアクセント句(文節)
との間で、共に、ピッチの上限値の変化を示す直線(A
1),下限値の変化を示す直線(B1)は、なめらかに
連続している。つまり、ピッチが連続するように、A
1,B1の値と、その時間に対する変化率の2つの韻律
パラメータを微調整する。
「制度化を」という各アクセント句(文節)間の意味的
な連続性を考慮した、適正な韻律形成が可能となる。
つの名詞が助詞の‘の’ではさまれた形式の単語列であ
るが、各名詞の意味関係から、言語解析結果601と言
語会席結果701の構文構造が異なっており、その違い
をピッチパターンの違いとして表現することが可能であ
る。よって、内容を正確にわかりやすく伝える合成音声
を提供することができる。以上、図6,図7を用いて韻
律パラメータの調整処理について説明した。
では、言語解析に基づいて付与された意味ラベルの配列
に着目して構文パターンを解析し、音律と基本韻律を生
成し、さらに、韻律パラメータを調整して、文章の意味
に着目したバランスを考慮した韻律を形成する。
パラメータの調整処理における判断の具体的な内容につ
いてまとめておく。
〜の判断を行う。 A,B,Cをそれぞれ名詞とした場合、「A」の
「B」の「C」、という構文パターンが存在するかを判
定する。 上記判断ステップで、該当する構文パターンがテキス
ト中に存在する場合、「A」は”地域”を意味する名詞
であり、「B」は”動作の主体”を意味する名詞であ
り、「C」は”グループの種別”を意味する名詞である
かを判定する。 上記の判断の結果、該当するテキストの構文パター
ンが存在する場合には、構文識別情報”ID1”を付与
する。 上記の判断ステップで、該当するパターンがテキス
ト中に存在しない場合には、次に、「A」は"動作の対
象(目的語)”を意味する名詞であり、「B」は”動
作”を意味する名詞であり、同じく「c」も”動作”を
意味する名詞であるかを判定する。 上記の判断の結果、該当するテキストの構文パター
ンが存在する場合には、構文識別情報”ID2”を付与
する。
ては、以下のおよびの判断を実施する。 構文識別情報”ID1”が付与された構文パターンに
ついては、「Aの」という部分のピッチパターンと、
「Bの」という部分のピッチパターンとの相互の連続性
が断ち切られるように前記韻律制御パラメータを調整
し、「Bの」という部分のピッチパターンと、「C」と
いう部分のピッチパターンとの相互の連続性が確保され
るように前記韻律制御パラメータを調整する。 構文識別情報”ID2”が付与された構文パターンに
ついては、「Aの」という部分のピッチパターンと、
「Bの」という部分のピッチパターンとの相互の連続性
が確保されるように前記韻律制御パラメータを調整し、
さらに、「Bの」という部分のピッチパターンと、
「C」という部分のピッチパターンとの相互の連続性が
確保されるように前記韻律制御パラメータを調整する。
より正確に伝わる合成音声が実現される。
き言葉で書かれた入力テキストを話し言葉の表現に置き
換え、さらに、文の構文を反映して読み上げることで、
文の内容がわかりやすくより正確に伝わる合成音声を実
現することができる。
成を示すブロック図
の一例を示す図
要な動作を説明するためのフロー図
キスト変換規則の一例を示す図
置の構文パターンデータベースの内容の一例を示す図 (b)本発明の実施の形態にかかる音声合成装置の構文
パターンデータベースの内容の他の例を示す図
構文に応じた韻律制御処理の一例を説明するための図
構文に応じた韻律制御処理の他の例を説明するための図
Claims (14)
- 【請求項1】 入力テキストを言語解析して単語列に分
解し、各単語の意味情報を含む言語情報を付与し、前記
言語情報が付与された単語列を、文節を単位としてグル
ープ化して、言語解析結果として出力する言語解析手段
と、 この言語解析手段から出力される、前記言語処理結果の
文節列につき、前記意味情報の配列パターンに基づいて
構文構造を解析し、構文解析の結果を示す構文識別情報
を付与して出力する構文解析手段と、 前記構文識別情報に対応する韻律制御情報を用いて、構
文構造を反映した韻律情報の制御を行う韻律制御手段
と、 前記韻律制御手段によって生成された韻律情報にしたが
って、音声波形を合成する波形合成手段と、 を有することを特徴とする音声合成装置。 - 【請求項2】 請求項1において、 前記韻律制御手段は、一つの文節の表現が、その文節に
続く次の文節の表現に意味的につながる場合には、前記
一つの文節のピッチパターンと前記次の文節のピッチパ
ターンとの連続性の確保を重視した韻律情報を生成し、
一方、前記一つの文節の表現が、その文節に続く次の文
節の表現に意味的につながらない場合には、前記一つの
文節のピッチパターンと前記次の文節のピッチパターン
の不連続性を強調するような韻律情報を生成することを
特徴とする音声合成装置。 - 【請求項3】 請求項1まはた請求項2において、 前記韻律制御情報は、韻律を調整するためのパラメータ
として、各文節のピッチパターンのダイナミックレンジ
の上限値および下限値、および、その上限値および下限
値の時間に対する変化率、を具備することを特徴とする
音声合成装置。 - 【請求項4】 入力テキストを言語解析して単語列に分
解し、各単語の意味情報を含む言語情報を付与し、前記
言語情報が付与された単語列を、文節を単位としてグル
ープ化して、言語解析結果として出力する言語解析手段
と、 前記言語解析結果について、書き言葉から話し言葉への
変換を施すテキスト変換手段と、 前記テキスト変換手段により変換された部分を含む前記
言語解析結果の文節列について、前記意味情報の配列パ
ターンに基づいて構文構造を解析し、構文解析の結果を
示す構文識別情報を付与して出力する構文解析手段と、 前記言語解析結果に含まれる前記言語情報に基づいて、
音韻情報および韻律パラメータを含む韻律情報を生成し
て出力する韻律生成手段と、 前記韻律生成手段の出力に対して、前記構文識別情報に
対応する韻律制御情報を用いた、構文構造を反映した韻
律情報の生成処理を実行し、前記韻律パラメータの調整
を行う韻律制御手段と、 前記韻律制御手段によって調整された前記韻律パラメー
タを含む前記韻律情報にしたがって、音声波形を合成す
る波形合成手段と、 を有することを特徴とする音声合成装置。 - 【請求項5】 請求項4において、 前記テキスト変換手段は、 前記言語解析結果と照合可能であり、単語毎の表記,読
み,品詞,意味情報などを含む単語単位の、あるいは文
節単位の言語情報パターンと、 前記言語情報パターンに対応する変換後の単語単位の、
あるいは文節単位の言語情報列と、を変換規則の1単位
として保持している、テキスト変換規則テーブルと、 このテキスト変換規則テーブルの変換規則と、入力され
た言語解析結果とを照合し、一致した部分については、
前記変換規則に指定される変換後の言語情報列に置換す
る変換処理部と、を具備することを特徴とする音声合成
装置。 - 【請求項6】 請求項4または請求項5において、 前記構文解析手段は、 前記言語解析結果と照合可能であり、単語毎の表記,読
み,品詞,意味情報などを含む単語単位の、あるいは、
文節単位の言語情報パターンとして表現された構文パタ
ーンを保持する構文データベースと、 前記構文データベースを参照し、入力された言語解析結
果と前記構文パターンとを照合する構文照合部と、を具
備することを特徴とする音声合成装置。 - 【請求項7】 請求項6において、 前記構文照合部は、言語解析結果と構文パターンの単語
単位、あるいは文節単位で、意味情報の配列パターンを
照合し、一致した配列パターンがあれば、その一致した
部分について、その構文構造を一意に決定する構文識別
情報を付与することを特徴とする音声合成装置。 - 【請求項8】 請求項4において、 前記韻律生成手段は、 前記構文解析手段により構文識別情報を付与された言語
解析結果に含まれる言語情報に基づいて、読みに応じた
音韻列,ピッチ,パワー,音韻持続時間,ポーズ長,話
速変化の少なくともいずれかを対象とする韻律パラメー
タを含む基本的な韻律情報を生成する機能を具備し、 また、前記韻律制御手段は、 文節間の韻律パラメータを相対的に調整するための韻律
制御情報を保持する韻律制御情報データベースと、 前記韻律生成部で生成された文節ごとの韻律情報を、前
記韻律制御情報データベースの韻律制御情報に従って、
修正する韻律制御部と、を具備することを特徴とする音
声合成装置。 - 【請求項9】 請求項8において、 前記韻律制御情報データベースは、前記構文データベー
スの構文パターンにより一意に与えられる前記構文識別
情報に対応付けられた韻律制御情報を保持することを特
徴とする音声合成装置。 - 【請求項10】 請求項4に記載の音声合成装置におけ
る、前記テキスト変換手段で用いられるテキスト変換規
則と、前記構文解析手段で用いられる構文データベース
と、前記韻律制御手段で用いられる韻律制御情報データ
ベースと、を有することを特徴とする記録媒体。 - 【請求項11】 入力テキストについて言語解析を行な
い、言語解析結果とテキスト変換規則とを照合し、照合
部分の置換を行い、置換部分を含む言語処理解析結果と
構文データベースの構文パターンデータとの照合を行っ
て、照合部分に対して構文識別情報を付与し、構文識別
情報と対応付けられた韻律制御情報により、韻律パラメ
ータの調整を行うことにより、構文間の韻律バランスを
考慮した合成音を生成する音声合成方法。 - 【請求項12】 入力テキストについて言語解析を行っ
て、意味情報を含む言語情報を付与した言語解析結果を
出力する第1のステップと、 前記言語解析結果と所定のテキスト変換規則とを照合
し、一致した部分の置換を行うテキスト変換を行う第2
のステップと、 前記テキスト変換による置換部分を含む前記言語処理解
析結果における前記意味情報の配列パターンと、構文デ
ータベースに登録されている構文パターンデータとの照
合を行って、意味情報の配列パターンが一致した部分に
対して構文識別情報を付与して出力する第3のステップ
と、 前記言語解析結果に含まれる前記言語情報に基づいて、
音韻情報および韻律パラメータを含む韻律情報を生成し
て出力する第4のステップと、 前記構文識別情報と対応付けられた韻律制御情報によ
り、前記韻律パラメータの調整を行うことにより、構文
間の韻律バランスを考慮した合成音を生成する第5のス
テップと、を含むことを特徴とする音声合成方法。 - 【請求項13】 請求項12において、 前記第3のステップにおける、前記言語処理解析結果に
おける前記意味情報の配列パターンと、構文データベー
スに登録されている構文パターンデータとを照合するス
テップは、さらに、下記の判断ステップ〜を含み、 かつ、前記第5のステップにおける、対応付けられた韻
律制御情報により、前記韻律パラメータの調整を行うス
テップは、さらに、下記の判断ステップおよびを含
むことを特徴とする音声合成方法。 (第3のステップにおける判断ステップ) A,B,Cをそれぞれ名詞とした場合、「A」の
「B」の「C」、という構文パターンが存在するかを判
定する。 上記判断ステップで、該当する構文パターンがテキス
ト中に存在する場合、「A」は”地域”を意味する名詞
であり、「B」は”動作の主体”を意味する名詞であ
り、「C」は”グループの種別”を意味する名詞である
かを判定する。 上記の判断の結果、該当するテキストの構文パター
ンが存在する場合には、構文識別情報”ID1”を付与
する。 上記の判断ステップで、該当するパターンがテキス
ト中に存在しない場合には、次に、「A」は"動作の対
象(目的語)”を意味する名詞であり、「B」は”動
作”を意味する名詞であり、同じく「c」も”動作”を
意味する名詞であるかを判定する。 上記の判断の結果、該当するテキストの構文パター
ンが存在する場合には、構文識別情報”ID2”を付与
する。 (第5のステップにおける判断ステップ) 構文識別情報”ID1”が付与された構文パターンに
ついては、「Aの」という部分のピッチパターンと、
「Bの」という部分のピッチパターンとの相互の連続性
が断ち切られるように前記韻律制御パラメータを調整
し、「Bの」という部分のピッチパターンと、「C」と
いう部分のピッチパターンとの相互の連続性が確保され
るように前記韻律制御パラメータを調整する。 構文識別情報”ID2”が付与された構文パターンに
ついては、「Aの」という部分のピッチパターンと、
「Bの」という部分のピッチパターンとの相互の連続性
が確保されるように前記韻律制御パラメータを調整し、
さらに、「Bの」という部分のピッチパターンと、
「C」という部分のピッチパターンとの相互の連続性が
確保されるように前記韻律制御パラメータを調整する。 - 【請求項14】 請求項13において、 前記韻律制御パラメータは、各文節のピッチパターンの
ダイナミックレンジの上限値および下限値、および、そ
の上限値および下限値の時間に対する変化率の少なくと
も一つを含むことを特徴とする音声合成方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2000349066A JP4636673B2 (ja) | 2000-11-16 | 2000-11-16 | 音声合成装置および音声合成方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2000349066A JP4636673B2 (ja) | 2000-11-16 | 2000-11-16 | 音声合成装置および音声合成方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2002149180A true JP2002149180A (ja) | 2002-05-24 |
| JP4636673B2 JP4636673B2 (ja) | 2011-02-23 |
Family
ID=18822536
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2000349066A Expired - Lifetime JP4636673B2 (ja) | 2000-11-16 | 2000-11-16 | 音声合成装置および音声合成方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4636673B2 (ja) |
Cited By (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100644814B1 (ko) | 2005-11-08 | 2006-11-14 | 한국전자통신연구원 | 발화 스타일 조절을 위한 운율모델 생성 방법 및 이를이용한 대화체 음성합성 장치 및 방법 |
| KR100806287B1 (ko) * | 2006-08-01 | 2008-02-22 | 한국전자통신연구원 | 문말 억양 예측 방법 및 이를 기반으로 하는 음성합성 방법및 시스템 |
| KR100807307B1 (ko) | 2006-07-10 | 2008-02-28 | 한국전자통신연구원 | 대화형 음성 인터페이스 시스템 및 그 응답 방법 |
| US7467026B2 (en) | 2003-09-22 | 2008-12-16 | Honda Motor Co. Ltd. | Autonomously moving robot management system |
| WO2009107441A1 (ja) * | 2008-02-27 | 2009-09-03 | 日本電気株式会社 | 音声合成装置、テキスト生成装置およびその方法並びにプログラム |
| JP2014044289A (ja) * | 2012-08-27 | 2014-03-13 | Animo:Kk | テキスト整形プログラム、方法及び装置 |
| JP2016516247A (ja) * | 2013-03-15 | 2016-06-02 | ザ ダン アンド ブラッドストリート コーポレーションThe Dun And Bradstreet Corporation | 翻字、翻訳、書記素洞察のキュレーション及び統合による多言語ビジネスの印の向上 |
| JP2016186709A (ja) * | 2015-03-27 | 2016-10-27 | 株式会社ナカヨ | 文書作成支援装置、プログラムおよび文書作成支援方法 |
| CN111754977A (zh) * | 2020-06-16 | 2020-10-09 | 普强信息技术(北京)有限公司 | 一种基于互联网的语音实时合成系统 |
| CN112185339A (zh) * | 2020-09-30 | 2021-01-05 | 深圳供电局有限公司 | 一种用于供电智能客户的语音合成处理方法及系统 |
| CN118588056A (zh) * | 2024-08-05 | 2024-09-03 | 南京硅基智能科技有限公司 | 基于句法图构建的文本到语音生成方法、装置及电子设备 |
Citations (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02281298A (ja) * | 1989-04-21 | 1990-11-16 | Nippon Telegr & Teleph Corp <Ntt> | ピッチパタン生成処理方法 |
| JPH0335296A (ja) * | 1989-06-30 | 1991-02-15 | Sharp Corp | テキスト音声合成装置 |
| JPH03214197A (ja) * | 1990-01-18 | 1991-09-19 | Ricoh Co Ltd | 音声合成装置 |
| JPH05134691A (ja) * | 1991-10-31 | 1993-05-28 | Internatl Business Mach Corp <Ibm> | 音声合成方法および装置 |
| JPH06236197A (ja) * | 1992-07-30 | 1994-08-23 | Ricoh Co Ltd | ピッチパターン生成装置 |
| JPH07191687A (ja) * | 1993-12-27 | 1995-07-28 | Toshiba Corp | 自然言語処理装置及びその方法 |
| JPH07244495A (ja) * | 1994-03-04 | 1995-09-19 | Nippon Telegr & Teleph Corp <Ntt> | テキスト音声合成方法およびこの方法を実施する装置 |
| JPH1083192A (ja) * | 1996-09-06 | 1998-03-31 | Toshiba Corp | 音声合成装置及び同装置における韻律情報生成方法 |
| JPH10228471A (ja) * | 1996-12-10 | 1998-08-25 | Fujitsu Ltd | 音声合成システム,音声用テキスト生成システム及び記録媒体 |
| JPH11202884A (ja) * | 1997-05-21 | 1999-07-30 | Nippon Telegr & Teleph Corp <Ntt> | 合成音声メッセージ編集作成方法、その装置及びその方法を記録した記録媒体 |
| JP2000172289A (ja) * | 1998-12-02 | 2000-06-23 | Matsushita Electric Ind Co Ltd | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 |
-
2000
- 2000-11-16 JP JP2000349066A patent/JP4636673B2/ja not_active Expired - Lifetime
Patent Citations (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02281298A (ja) * | 1989-04-21 | 1990-11-16 | Nippon Telegr & Teleph Corp <Ntt> | ピッチパタン生成処理方法 |
| JPH0335296A (ja) * | 1989-06-30 | 1991-02-15 | Sharp Corp | テキスト音声合成装置 |
| JPH03214197A (ja) * | 1990-01-18 | 1991-09-19 | Ricoh Co Ltd | 音声合成装置 |
| JPH05134691A (ja) * | 1991-10-31 | 1993-05-28 | Internatl Business Mach Corp <Ibm> | 音声合成方法および装置 |
| JPH06236197A (ja) * | 1992-07-30 | 1994-08-23 | Ricoh Co Ltd | ピッチパターン生成装置 |
| JPH07191687A (ja) * | 1993-12-27 | 1995-07-28 | Toshiba Corp | 自然言語処理装置及びその方法 |
| JPH07244495A (ja) * | 1994-03-04 | 1995-09-19 | Nippon Telegr & Teleph Corp <Ntt> | テキスト音声合成方法およびこの方法を実施する装置 |
| JPH1083192A (ja) * | 1996-09-06 | 1998-03-31 | Toshiba Corp | 音声合成装置及び同装置における韻律情報生成方法 |
| JPH10228471A (ja) * | 1996-12-10 | 1998-08-25 | Fujitsu Ltd | 音声合成システム,音声用テキスト生成システム及び記録媒体 |
| JPH11202884A (ja) * | 1997-05-21 | 1999-07-30 | Nippon Telegr & Teleph Corp <Ntt> | 合成音声メッセージ編集作成方法、その装置及びその方法を記録した記録媒体 |
| JP2000172289A (ja) * | 1998-12-02 | 2000-06-23 | Matsushita Electric Ind Co Ltd | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 |
Cited By (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7467026B2 (en) | 2003-09-22 | 2008-12-16 | Honda Motor Co. Ltd. | Autonomously moving robot management system |
| KR100644814B1 (ko) | 2005-11-08 | 2006-11-14 | 한국전자통신연구원 | 발화 스타일 조절을 위한 운율모델 생성 방법 및 이를이용한 대화체 음성합성 장치 및 방법 |
| KR100807307B1 (ko) | 2006-07-10 | 2008-02-28 | 한국전자통신연구원 | 대화형 음성 인터페이스 시스템 및 그 응답 방법 |
| KR100806287B1 (ko) * | 2006-08-01 | 2008-02-22 | 한국전자통신연구원 | 문말 억양 예측 방법 및 이를 기반으로 하는 음성합성 방법및 시스템 |
| WO2009107441A1 (ja) * | 2008-02-27 | 2009-09-03 | 日本電気株式会社 | 音声合成装置、テキスト生成装置およびその方法並びにプログラム |
| JPWO2009107441A1 (ja) * | 2008-02-27 | 2011-06-30 | 日本電気株式会社 | 音声合成装置、テキスト生成装置およびその方法並びにプログラム |
| JP2014044289A (ja) * | 2012-08-27 | 2014-03-13 | Animo:Kk | テキスト整形プログラム、方法及び装置 |
| JP2016516247A (ja) * | 2013-03-15 | 2016-06-02 | ザ ダン アンド ブラッドストリート コーポレーションThe Dun And Bradstreet Corporation | 翻字、翻訳、書記素洞察のキュレーション及び統合による多言語ビジネスの印の向上 |
| KR101797125B1 (ko) | 2013-03-15 | 2017-11-13 | 더 던 앤드 브래드스트리트 코포레이션 | 다국어 사업 표시 큐레이션 및 음역 합성 |
| JP2016186709A (ja) * | 2015-03-27 | 2016-10-27 | 株式会社ナカヨ | 文書作成支援装置、プログラムおよび文書作成支援方法 |
| CN111754977A (zh) * | 2020-06-16 | 2020-10-09 | 普强信息技术(北京)有限公司 | 一种基于互联网的语音实时合成系统 |
| CN112185339A (zh) * | 2020-09-30 | 2021-01-05 | 深圳供电局有限公司 | 一种用于供电智能客户的语音合成处理方法及系统 |
| CN118588056A (zh) * | 2024-08-05 | 2024-09-03 | 南京硅基智能科技有限公司 | 基于句法图构建的文本到语音生成方法、装置及电子设备 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4636673B2 (ja) | 2011-02-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7496498B2 (en) | Front-end architecture for a multi-lingual text-to-speech system | |
| US6751592B1 (en) | Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically | |
| JP4536323B2 (ja) | 音声−音声生成システムおよび方法 | |
| US6823309B1 (en) | Speech synthesizing system and method for modifying prosody based on match to database | |
| US8626510B2 (en) | Speech synthesizing device, computer program product, and method | |
| Macchi | Issues in text-to-speech synthesis | |
| JP2002530703A (ja) | 音声波形の連結を用いる音声合成 | |
| JP2008243043A (ja) | 音声翻訳装置、方法およびプログラム | |
| Choi et al. | Finding intonational boundaries using acoustic cues related to the voice source | |
| JP4636673B2 (ja) | 音声合成装置および音声合成方法 | |
| Samuel Manoharan | A novel text-to-speech synthesis system using syllable-based HMM for Tamil language | |
| Stöber et al. | Speech synthesis using multilevel selection and concatenation of units from large speech corpora | |
| NithyaKalyani et al. | Speech summarization for tamil language | |
| JP3706758B2 (ja) | 自然言語処理方法,自然言語処理用記録媒体および音声合成装置 | |
| JP2010117528A (ja) | 声質変化判定装置、声質変化判定方法、声質変化判定プログラム | |
| US20050187772A1 (en) | Systems and methods for synthesizing speech using discourse function level prosodic features | |
| JP2006293026A (ja) | 音声合成装置,音声合成方法およびコンピュータプログラム | |
| Veilleux | Computational models of the prosody/syntax mapping for spoken language systems | |
| JP2021148942A (ja) | 声質変換システムおよび声質変換方法 | |
| JP3576066B2 (ja) | 音声合成システム、および音声合成方法 | |
| JPH08335096A (ja) | テキスト音声合成装置 | |
| Tsirulnik et al. | Singing voice database | |
| Gujarathi et al. | Gaussian filter-based speech segmentation algorithm for Gujarati language | |
| Breuer et al. | Set-up of a Unit-Selection Synthesis with a Prominent Voice. | |
| JP2001350490A (ja) | テキスト音声変換装置及び方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071114 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100517 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100601 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100730 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101102 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101122 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131203 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4636673 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| EXPY | Cancellation because of completion of term |