JP2000322075A - 音声合成装置および自然言語処理方法 - Google Patents

音声合成装置および自然言語処理方法

Info

Publication number
JP2000322075A
JP2000322075A JP11134255A JP13425599A JP2000322075A JP 2000322075 A JP2000322075 A JP 2000322075A JP 11134255 A JP11134255 A JP 11134255A JP 13425599 A JP13425599 A JP 13425599A JP 2000322075 A JP2000322075 A JP 2000322075A
Authority
JP
Japan
Prior art keywords
information
expression
prosody information
text
prosody
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11134255A
Other languages
English (en)
Inventor
Katsuyoshi Yamagami
勝義 山上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11134255A priority Critical patent/JP2000322075A/ja
Publication of JP2000322075A publication Critical patent/JP2000322075A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 書き言葉のテキストを話し言葉の表現に
置き換え、かつ話し言葉らしいイントネーションで読み
上げること。 【解決手段】 テキスト変換部103は入力テキストを
テキスト変換規則テーブル104と照合して、該当する
単語列を話し言葉の表現に変換する。このとき、変換さ
れた部分の韻律情報を指定するコード情報も付加してお
く。そして、韻律情報制御部105において、話し言葉
へ変換された部分に対して、話し言葉のために特別に用
意した韻律情報を付与し、音声波形合成部103,音声
出力部109を経て、話し言葉らしいイントネーション
による読み上げ合成音声を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された任意の
テキストの読み上げ音声を合成するテキスト音声合成装
置、および、テキスト音声合成装置において書き言葉を
話し言葉に変換して読み上げる自然言語処理方法に関す
るものである。
【0002】
【従来の技術】テキストを音声化して提供する手段とし
てテキスト音声合成技術が開発され、最近ではパソコン
で動作するテキスト読み上げソフトウェア、ワードプロ
セッサのテキスト読み上げ機能などの形で実用化が進ん
でいる。
【0003】通常、テキスト情報は読まれることを前提
とした書き言葉で記述されている場合がほとんどであ
る。書き言葉のテキストは、発音しにくい、あるいは、
聞き取りにくい単語、複合語、フレーズを含んでいるこ
とがあり、このことは、読み上げ音声(合成音声)の了
解性を損なう一因となる。
【0004】この点に着目し、入力テキストの難意語や
紛らわしい同音異義語を平易な単語に置き換える機能を
有したテキスト音声合成装置が提案されている(例え
ば、特開平3−35296号公報記載の技術。以下、方
式1と呼ぶ)。
【0005】また、文末によく見られる体言止め、「で
ある調」などの書き言葉特有の表現は、話し言葉で普通
に用いられる「です、ます調」などの表現に置き換える
ことが望ましく、そのような観点から、テキストの表現
を話し言葉に適した形式に変換して音声合成するという
音声合成技術も提案されている(以下、方式2と呼
ぶ)。
【0006】
【発明が解決しようとする課題】書き言葉を話し言葉に
変換するという行為は、本来、文字情報としてあらわさ
れた内容を音声として理解できるよう表現を変換し、そ
れに適した読み方で読み上げるというところまでを含ん
でいる。
【0007】実際、ラジオなどのニュースを読み上げる
アナウンサーは、書き言葉から話し言葉へと修正された
原稿を、話し言葉特有の表現をそれぞれの表現に適した
イントネーションで読み上げることで、意味のまとま
り、区切れを明確にし、内容をわかりやすく正解に伝え
ることを行っている。
【0008】しかしながら、前述の方式1および方式2
の両方式とも、テキストレベルでの変換処理にとどまっ
ており、変換されて話し言葉になった表現に対して、話
し言葉らしい読み方がなされないという不都合を有すも
のである。
【0009】例えば,「〜によりますと、」などの意味
の区切れの部分を読み上げる場合、アナウンサーは言い
終わりの付近で、ピッチ、パワーを急激に下げるなどし
て意味の区切れを聞き手に伝えようとする。従来例で
は、このような、話し言葉特有の言いまわしを読み上げ
る韻律の制御がなされないため、意味の区切り、まとま
りがわかりにくい合成音となるという不都合を有する。
【0010】また、テキストの自然なイントネーション
(韻律)による読み上げは、先に述べたように、アナウ
ンサーのようなその道の専門家の技能によるところも大
きく、このために規則的な処理になじまず、自然な音声
合成を実現する上で障害となる。
【0011】本発明は、このような検討に基づいてなさ
れたものであり、上述した従来の書き言葉から話し言葉
への変換機能を有する音声合成装置の不都合を解消し、
自然なイントネーションでテキストを音声出力すること
ができる新規な音声合成装置と自然言語処理方法を提供
することを目的とする。
【0012】
【課題を解決するための手段】本発明は、書き言葉の表
現を話し言葉の表現に変換した後、話し言葉特有の表現
部分に対して、専用の韻律制御部をもってイントネーシ
ョンを生成し、話し言葉らしい読み上げ音声を提供でき
るようにしたものである。
【0013】これにより、従来例のようにテキストの書
き言葉から話し言葉への字面上のみの変換にとどまら
ず、変換された話し言葉部分を読み上げるのに最適な韻
律情報を用いて音声合成を行うので、アナウンサーが通
常行うような分かりやすさを意図したイントネーション
の使い分けを再現することが可能であり、結果として入
力テキストの内容を分かりやすく、正確に伝えることが
可能な音声合成装置を提供できる。
【0014】
【発明の実施の形態】本発明の音声合成装置の第1の態
様では、入力テキストの表現を音声化に適した表現に変
換する表現変換手段と、入力テキスト中の前記表現変換
手段によって変換された部分について、話し言葉専用の
韻律情報を生成する韻律情報制御手段と、を有する構成
とした。
【0015】表現の変換のみならず、その変換された部
分について、話し言葉専用のイントネーションを生成す
るため、自然なテキスト音声読み上げが可能となる。
【0016】また、本発明の音声合成装置の第2の態様
では、入力テキストの表現を音声化に適した表現に変換
する表現変換手段と、入力テキスト中の前記表現変換手
段によって変換された部分についての韻律情報と、前記
表現が変換された部分に連接する、表現が変換されない
部分についての韻律情報とを統合する韻律情報制御手段
と、前記統合された韻律情報に基づいて、前記表現が変
換された部分および前記表現が変換されない部分につい
ての音声波形を合成する音声波形合成手段と、を有する
構成とした。
【0017】話し言葉特有の部分と、この部分に連接す
る、話し言葉特有の部分ではない部分の双方についての
韻律情報を統合して、その情報に基づいてイントネーシ
ョンの制御を行なうので、表現を変換した部分の前後で
イントネーションの不連続が発生せず、自然な音声読み
上げを実現できる。
【0018】また、本発明の音声合成装置の第3の態様
では、第2の態様において、前記表現が変換された部分
についての前記韻律情報は、実際の音声信号の分析に基
づいて得られるものである。
【0019】話し言葉特有の部分のイントネーション
は、モデルを用いた画一的な規則化になじまないので、
実測に基づいてあらかじめ韻律情報を取得しておくもの
であり、これにより、話し言葉らしい自然なイントネー
ションによる音声読み上げが可能となる。
【0020】また、本発明の音声合成装置の第4の態様
は、日本語の入力テキストを単語列に分割し、単語列の
各単語に対して読み、品詞などの言語情報を付与する言
語処理手段と、書き言葉を話し言葉に変換するために用
いられる表現パターンに関する情報と、変換後の表現を
話し言葉らしいイントネーションで音声化するために用
いられる韻律情報を指定する韻律情報識別コードと、を
含むテキスト変換規則が登録されているテキスト変換規
則テーブルと、前記言語処理手段から出力される単語列
を前記テキスト変換規則テーブルと照合し、該当する部
分の表現を前記テキスト変換規則に従って変換すると共
に、その変換された部分についての前記韻律情報識別コ
ードを付与するテキスト変換手段と、前記テキスト変換
手段から出力される単語列に付与された前記言語情報に
基づき音声波形を生成するのに必要な発音系列、ピッ
チ、パワーなどの韻律情報を、規則化されたアルゴリズ
ムによって生成する規則型韻律生成手段と、前記テキス
ト変換規則の前記韻律情報識別コードで特定される韻律
情報が登録されている韻律情報テーブルと、前記テキス
ト変換手段において付与された前記韻律情報識別コード
で特定される韻律情報を前記韻律情報テーブルから取り
出し、前記規則型韻律生成部から生成された韻律情報と
統合して、入力テキスト全体の韻律情報を生成する韻律
情報制御手段と、この韻律情報制御手段で生成された韻
律情報に従って音声波形を合成する音声波形合成手段
と、を有する構成とした。
【0021】変換規則を用いた表現の変換の際に、韻律
情報識別コードを併せて付与しておき、イントネーショ
ン情報を生成するにあたって、表現が変換された部分に
ついては、先に付与されている韻律情報識別コードが示
す韻律情報を採用するものである。表現を変換した際
に、その部分の韻律情報識別コードも付与してあるの
で、イントネーションの生成が簡素化される。
【0022】また、本発明の音声合成装置の第5の態様
では、前記テキスト変換規則テーブルに登録されている
前記テキスト変換規則を、変換前のテキストパターン
と、変換後のテキストと、この変換後のテキストを音声
化するための韻律情報を指定する韻律情報識別コードを
1組として成り立つ構成とした。
【0023】テキスト変換規則の構成を工夫することに
より、韻律情報識別コードの付加も簡単に行なうことが
できる。
【0024】また、本発明の音声合成装置の第6の態様
では、前記韻律情報は、音声化の対象となる文章の、一
つの意味のまとまり又は区切れとなる部分に関する、話
し言葉特有のイントネーションの情報である。
【0025】これにより、息の継ぎ目や文の切れ目とい
った、話し言葉では重要な部分の単語列を、自然なイン
トネーションで音声化できるようになる。
【0026】また、本発明の自然言語処理用記録媒体の
一態様は、書き言葉を話し言葉に変換するために用いら
れる表現パターンに関する情報と、変換後の表現を話し
言葉らしいイントネーションで音声化するために用いら
れる韻律情報を指定する韻律情報識別コードと、を含む
テキスト変換規則が登録されているテキスト変換規則テ
ーブルと、前記テキスト変換規則の前記韻律情報識別コ
ードで特定される韻律情報が登録されている韻律情報テ
ーブルと、を有している。
【0027】新規な自然言語処理用の規則化されたデー
タ(テーブル)が記録された、コンピュータが読み取り
可能な記録媒体が得られる。
【0028】本発明の自然言語処理方法の第1の態様
は、入力テキストを形態素解析して品詞などの言語情報
を付与した単語列に分割し、前記単語列の中の、テキス
ト変換規則テーブルに登録されている単語列パターンに
合致するものを話し言葉の単語列に置き換え、その置き
換えられた単語列に対して、話し言葉専用の韻律情報に
基づいてイントネーションを生成する。
【0029】話し言葉専用の韻律情報によるイントネー
ションの生成が行われるため、自然な音声読み上げが実
現される。
【0030】また、本発明の自然言語処理方法の第2の
態様では、入力テキストの表現を音声化に適した表現に
変換するために使用されるテキスト変換規則と、表現が
変換された部分を音声化する際のイントネーションを示
す韻律情報が登録されている韻律情報テーブルとを予め
用意するステップと、前記テキスト変換規則に従って、
入力テキストの表現を音声化に適した表現に変換すると
共に、前記韻律情報テーブルに登録されている特定の韻
律情報を特定するための情報を、前記変換された表現を
示すデータに付加するステップと、前記韻律情報を特定
するための情報に基づいて前記韻律情報テーブルを検索
して、入力テキスト中の表現が変換された部分について
の韻律情報を取得すると共に、その取得された韻律情報
を、前記表現が変換された部分に連接する、表現が変換
されない部分についての韻律情報と統合するステップ
と、統合された韻律情報に従って、前記表現が変換され
た部分および前記表現が変換されない部分についての音
声波形を合成する。
【0031】入力テキスト中で、テキスト変換規則に照
合する部分を変換し、書き言葉のテキストから話し言葉
のテキストを得て、さらに、話し言葉へと変換された部
分に対して付与された韻律情報識別コードにより指定さ
れる韻律情報を韻律情報テーブルから取り出し、話し言
葉に適した韻律情報を生成して、自然な音声読み上げを
実現するものである。
【0032】また、本発明の自然言語処理方法の第3の
態様では、第2の態様において、前記入力テキスト中の
表現が変換された部分についての韻律情報は、実際の音
声信号の分析に基づいて得られる情報であり、前記表現
が変換されない部分についての韻律情報は、規則型の韻
律生成により得られる情報である。
【0033】規則型の韻律生成と、実測(実際の音声分
析)に基づく韻律の生成とを併用することにより、テキ
ストの自然な音声読み上げが可能となる。
【0034】次に、本発明の実施の形態について図面を
参照して、具体的に説明する。
【0035】図1は、本発明の実施の形態にかかる音声
合成装置の主要な構成を示すブロック図である。
【0036】図1の音声合成装置は、話し言葉へと変換
すべき書き言葉の表現を、変換前のテキストのパター
ン、変換後の話し言葉テキスト、話し言葉を読み上げる
韻律情報を指定する韻律情報識別コードからなるテキス
ト変換規則として、テキスト変換規則テーブル104に
記述しておき、さらに、話し言葉の読み上げ専用の韻律
情報を用意し韻律情報テーブル107に登録しておき、
入力テキスト中で、テキスト変換規則に合致する部分を
テキスト変換部103で変換し、書き言葉のテキストか
ら話し言葉のテキストを得て、さらに、韻律情報制御部
105において、話し言葉へと変換された部分に対して
付与された韻律情報識別コードにより指定される韻律情
報を韻律情報テーブルから取り出し、話し言葉に適した
韻律情報を生成するものである。
【0037】図示されるように、音声合成装置は、テキ
スト入力部101と、言語処理部102と、テキスト変
換部103と、テキスト変換規則テーブル104と、韻
律制御部105と、規則型韻律制御部106と、韻律情
報テーブル107と、音声波形合成部108と、音声出
力部109と、を具備する。
【0038】テキスト入力部101は、処理するべきテ
キストデータを受け付ける。言語処理部102は、入力
されたテキストデータを形態素解析して、品詞などの言
語情報を付与した単語列に分割する。
【0039】テキスト変換部103は、機能ブロックと
して、単語列の置き換えを行なう置換部110と、韻律
情報識別コード付与部111とを有する。置換部110
は、言語処理部102の出力である単語列を走査(検
索)して、テキスト変換規則テーブルの変換前の単語列
パターンに合致する部分を変換後の単語列に置き換え、
韻律情報識別コード付与部111が、置換された部分の
単語列に韻律情報識別コードを付与する。
【0040】ここで、テキスト変換規則テーブル104
の登録データ中に韻律情報識別コードを予め組み込んで
おけば、基本的には、韻律情報識別コード付与部111
は不要である。
【0041】テキスト変換規則テーブル104には、入
力テキストの単語列と照合すべきテキスト変換規則が複
数登録されている。
【0042】韻律情報制御部105は、テキスト変換部
103から出力される単語列に付与された言語情報を基
に、テキスト変換部103で変換されなかった部分の韻
律情報を規則型韻律生成部106で生成し、テキスト変
換部103で変換された部分の韻律情報は、変換された
部分に付与された韻律情報識別コードで指定される韻律
情報を韻律情報テーブル107から取り出して、それぞ
れの韻律情報を統合する。
【0043】規則型韻律生成部106は、例えば藤崎モ
デルなどの規則化された韻律制御モデルによってピッチ
などの韻律情報を生成する。
【0044】韻律情報テーブル107には、例えば、定
型の話し言葉のフレーズ部分の韻律情報を登録してお
く。この韻律情報として、実際に話し言葉を読み上げた
音声を録音し、音声信号を分析して得られるものを採用
することで自然発声にかなり近い韻律情報を得ることが
できる。
【0045】音声波形合成部108は、韻律情報制御部
105で生成された韻律情報に従って音声波形を合成
し、音声出力部109よりその音声信号を出力する。
【0046】かかる構成において、入力テキストの中で
話し言葉に変換すべき部分を、テキスト変換規則によっ
て変換し、変換された部分について実際の音声信号の分
析により得られる自然性の高い韻律情報を用いて音声合
成を行うことにより、話し言葉特有のイントネーション
を再現することができ、意味のまとまり、区切れが分か
りやすい合成音声を提供することができる。
【0047】このような音声合成装置は、例えば、図7
に示すようなコンピュータシステム上に構築されるもの
である。このコンピュータシステムは、本体部601
と、キーボード602と、ディスプレイ603と、入力
装置(マウス)604と、を含む音声出力可能なシステ
ムである。図1のテキスト変換規則テーブル104や韻
律情報テーブル107は、本体部601にセットされる
CD−ROM607内,本体部601が内蔵するディス
ク(メモリ)606内,あるいは回線608で接続され
た他のシステムのディスク605内に格納される。
【0048】なお、図1のテキスト入力部101は、図
7のシステムにおける本体部601や入力装置604に
該当する。
【0049】図1の音声合成装置の特徴的な動作をまと
めると、図2のようになる。すなわち、テキスト変換規
則テーブル104を用いて単語列の置換を行なう際に、
その置換が行われる部分の韻律情報識別コードも付与す
る(ステップ120)。これにより、後のイントネーシ
ョンの生成処理が簡素化される。
【0050】次に、テキスト変換されなかった部分の
韻律情報を規則型韻律生成部106で生成し、テキス
ト変換された部分について、韻律情報識別コードで指定
される韻律情報を、韻律情報テーブル107から取り出
し、各韻律情報を統合する(ステップ121)。
【0051】次に、統合された韻律情報に基づき、一つ
の音声波形合成部108で音声合成を行なう(ステップ
122)。これにより、表現の変換部分の前後でイント
ネーションの不連続が発生しない。
【0052】以下、テキスト変換規則テーブルの規則の
具体例と、それを用いたテキスト変換および音声合成処
理の具体例について、図3〜図6を用いて説明する。
【0053】図3は、言語処理部102が出力する処理
結果の1例を示す図である。
【0054】すなわち、入力テキスト「明日,解散の予
定。」は単語列「明日」、「、(読点)」、「解散」、
「の」、「予定」、「。(句点)」に分割される。それ
ぞれの単語には,読みの情報、品詞情報が付与されてお
り、単語列202では1つの単語を「(表記 読み 品
詞)」で表現している。
【0055】図4は、テキスト変換規則テーブルに登録
されているテキスト変換規則の1例を示す図である。
【0056】1つのテキスト変換規則は,変換前単語列
パターン、変換後単語列、韻律情報識別コードの3つか
らなる。
【0057】変換前単語列パターンは、入力テキストの
言語処理結果である単語列でテキスト変換を行う範囲を
指定するもので、ここに記述したパターンに照合する部
分がテキスト変換の対象になる。
【0058】単語列パターンの1つの単位は「(表記
読み 品詞)」としてあらわされる。表記、読み、品詞
が、それぞれ任意であることを指定することも可能と
し、「?」を記述することとする。たとえば,テキスト
変換規則301の変換前単語列パターンの最初の単語パ
ターンは、サ変名詞であれば表記、読みは任意の単語で
よいことをあらわしている。
【0059】変換後単語列は、変換前単語列パターンと
照合した部分を置き換えるべき単語列を指定する。テキ
スト変換規則301の変換後単語列の「(1)」は、変
換前単語列パターンの「(? ? サ変名詞)」と照合
した部分と置き換えられることを示す。テキスト変換規
則301の韻律情報識別コードは、韻律情報テーブル1
07に登録されている韻律情報を識別するコードであ
る。変換後単語列の「<…>」で囲まれた部分に対し
て、韻律情報識別コードで指定される韻律情報を適用
し、それ以外の部分には規則型韻律生成部106で与え
られる韻律情報を適用する。
【0060】図5は、テキスト変換部103が図4のテ
キスト変換規則301に従って、テキスト変換を行った
様子を示す。
【0061】変換前単語列401の部分がテキスト変換
規則301に合致し、変換後単語列402に置き換わ
る。「<…>」でくくられた部分の韻律情報識別コード
は、<CODE=3 …>という形で、後の韻律情報制
御部に渡される。
【0062】韻律情報制御部105は、テキスト変換部
103からの出力の単語列を受け取って、「<…>」で
囲まれていない部分に関しては、規則型韻律生成部10
6で韻律情報を生成する。「<…>」で囲まれている部
分に関しては、その部分に付与された韻律情報識別コー
ドに従って、韻律情報テーブル107から韻律情報を取
り出す。そして、それぞれの韻律情報を接続して1文単
位の韻律情報を生成する。
【0063】図6は、韻律情報制御部105で生成され
た韻律情報の1例を示す図である。ここでは、韻律情報
としてパワーとピッチの概略をあらわす例を示してい
る。
【0064】「アス カイサンスル」という部分(期間
A)は、規則型韻律生成部106により生成されてお
り、例えば、ピッチ情報は藤崎モデルを使って生成する
ことができる。パワーに関しては規則化することも可能
であるがここでは一定のパワー情報が与えられていると
する。
【0065】一方、「ヨテーデス」という部分(期間
B)に対しては、韻律情報テーブル107から韻律情報
識別コードが「3」である韻律情報が与えられている。
例えばアナウンサーが「〜する予定です。」と発話した
音声を分析することで、パワー情報、ピッチ情報を抽出
するなどの方法で、自然音声にかなり近い韻律情報を与
えることができる。「〜によりますと、」というような
話し言葉特有の微妙なイントネーションが必要な箇所に
おいても、韻律情報識別コードにしたがって、韻律情報
を簡単に生成することが可能である。
【0066】音声波形合成部108では、韻律情報制御
部105で生成された韻律情報に従って音声波形を合成
する。音声波形の合成方法としては、フォルマン方式、
波形重畳方式などが利用可能であり、いずれの方式でも
よい。
【0067】本実施の形態の構成の特徴は、韻律情報は
2種類の方法で生成されるが、韻律情報が統合されてお
り、かつ、音声波形の合成部が同一なので、異なる韻律
情報のつなぎ目で音声波形としての不連続が発生しない
ことである。
【0068】音声出力部では109は、音声波形合成部
108により合成された音声波形を出力する。
【0069】以上説明したように、本実施例の音声合成
装置によれば、話し言葉に特有な文末、あるいは、句末
の定型表現部分に関して韻律情報を作成し、韻律情報テ
ーブル107に登録しておき、一方、表現の変換の際に
韻律情報をコードにより指定しておき、イントネーショ
ンの生成時にそのコードを参照してテーブルを検索して
韻律情報を得ることにより、規則化され、簡素化された
手順にしたがって、自然なイントネーションによる音声
読み上げを実現できる。
【0070】すなわち、アナウンサーが読み上げの時に
用いるような、意味のまとまり、区切れを示すイントネ
ーション上の特徴を再現することができる。従って、テ
キストのみの変換を行う音声合成装置にくらべ、より分
かりやすい合成音声を提供することが可能である。
【0071】なお、本実施の形態では、テキスト変換規
則テーブルに韻律情報の識別コードを予め組み込んでい
るが、必ずしもこれに限定されるものではなく、書き言
葉から話し言葉への変換とは別の処理により、韻律情報
の識別コードを付与することもできる。
【0072】
【発明の効果】以上説明したように本発明によれば、書
き言葉で書かれた入力テキストを話し言葉の表現に置き
換え、かつ、話し言葉らしいイントネーションで読み上
げることが可能であり、誰にでも分かりやすい、自然な
音声合成を実現することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態にかかる音声合成装置のブ
ロック図
【図2】本発明の実施の形態にかかる音声合成装置の主
要な動作を説明するためのフロー図
【図3】本発明の実施の形態にかかる音声合成装置の言
語処理部の処理結果の例を示す図
【図4】本発明の実施の形態にかかる音声合成装置のテ
キスト変換規則の内容の例を示す図
【図5】本発明の実施例にかかる音声合成装置のテキス
ト変換部での変換処理の例を示す図
【図6】本発明の実施の形態にかかる音声合成装置の韻
律情報制御部の韻律生成の例を示す図
【図7】本発明を実施するためのコンピュータシステム
の一例を示す図
【符号の説明】
101 テキスト入力部 102 言語処理部 103 テキスト変換部 104 テキスト変換規則テーブル 105 韻律情報制御部 106 規則型韻律生成部 107 韻律情報テーブル 108 音声波形合成部 109 音声出力部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 入力テキストの表現を音声化に適した表
    現に変換する表現変換手段と、入力テキスト中の前記表
    現変換手段によって変換された部分について、話し言葉
    専用の韻律情報を生成する韻律情報制御手段と、を有す
    ることを特徴とする音声合成装置。
  2. 【請求項2】 入力テキストの表現を音声化に適した表
    現に変換する表現変換手段と、 入力テキスト中の前記表現変換手段によって変換された
    部分についての韻律情報と、前記表現が変換された部分
    に連接する、表現が変換されない部分についての韻律情
    報とを統合する韻律情報制御手段と、 前記統合された韻律情報に基づいて、前記表現が変換さ
    れた部分および前記表現が変換されない部分についての
    音声波形を合成する音声波形合成手段と、を有する音声
    合成装置。
  3. 【請求項3】 前記表現が変換された部分についての前
    記韻律情報は、実際の音声信号の分析に基づいて得られ
    る情報であることを特徴とする請求項2記載の音声合成
    装置。
  4. 【請求項4】 日本語の入力テキストを単語列に分割
    し、単語列の各単語に対して読み、品詞などの言語情報
    を付与する言語処理手段と、 書き言葉を話し言葉に変換するために用いられる表現パ
    ターンに関する情報と、変換後の表現を話し言葉らしい
    イントネーションで音声化するために用いられる韻律情
    報を指定する韻律情報識別コードと、を含むテキスト変
    換規則が登録されているテキスト変換規則テーブルと、 前記言語処理手段から出力される単語列を前記テキスト
    変換規則テーブルと照合し、該当する部分の表現を前記
    テキスト変換規則に従って変換すると共に、その変換さ
    れた部分についての前記韻律情報識別コードを付与する
    テキスト変換手段と、 前記テキスト変換手段から出力される単語列に付与され
    た前記言語情報に基づき音声波形を生成するのに必要な
    発音系列、ピッチ、パワーなどの韻律情報を、規則化さ
    れたアルゴリズムによって生成する規則型韻律生成手段
    と、 前記テキスト変換規則の前記韻律情報識別コードで特定
    される韻律情報が登録されている韻律情報テーブルと、 前記テキスト変換手段において付与された前記韻律情報
    識別コードで特定される韻律情報を前記韻律情報テーブ
    ルから取り出し、前記規則型韻律生成部から生成された
    韻律情報と統合して、入力テキスト全体の韻律情報を生
    成する韻律情報制御手段と、 この韻律情報制御手段で生成された韻律情報に従って音
    声波形を合成する音声波形合成手段と、を有することを
    特徴とする音声合成装置。
  5. 【請求項5】 前記テキスト変換規則テーブルに登録さ
    れている前記テキスト変換規則は、変換前のテキストパ
    ターンと、変換後のテキストと、この変換後のテキスト
    を音声化するための韻律情報を指定する韻律情報識別コ
    ードを1組として成り立っていることを特徴とする請求
    項4記載の音声合成装置。
  6. 【請求項6】 前記韻律情報は、音声化の対象となる文
    章の、一つの意味のまとまり又は区切れとなる部分に関
    する、話し言葉特有のイントネーションの情報であるこ
    とを特徴とする請求項4または請求項5記載の音声合成
    装置。
  7. 【請求項7】 書き言葉を話し言葉に変換するために用
    いられる表現パターンに関する情報と、変換後の表現を
    話し言葉らしいイントネーションで音声化するために用
    いられる韻律情報を指定する韻律情報識別コードと、を
    含むテキスト変換規則が登録されているテキスト変換規
    則テーブルと、 前記テキスト変換規則の前記韻律情報識別コードで特定
    される韻律情報が登録されている韻律情報テーブルと、
    を有することを特徴とする自然言語処理用記録媒体。
  8. 【請求項8】 入力テキストを形態素解析して品詞など
    の言語情報を付与した単語列に分割し、前記単語列の中
    の、テキスト変換規則テーブルに登録されている単語列
    パターンに合致するものを話し言葉の単語列に置き換
    え、その置き換えられた単語列に対して、話し言葉専用
    の韻律情報に基づいてイントネーションを生成すること
    を特徴とする自然言語処理方法。
  9. 【請求項9】 入力テキストの表現を音声化に適した表
    現に変換するために使用されるテキスト変換規則と、表
    現が変換された部分を音声化する際のイントネーション
    を示す韻律情報が登録されている韻律情報テーブルとを
    予め用意するステップと、 前記テキスト変換規則に従って、入力テキストの表現を
    音声化に適した表現に変換すると共に、前記韻律情報テ
    ーブルに登録されている特定の韻律情報を特定するため
    の情報を、前記変換された表現を示すデータに付加する
    ステップと、 前記韻律情報を特定するための情報に基づいて前記韻律
    情報テーブルを検索して、入力テキスト中の表現が変換
    された部分についての韻律情報を取得すると共に、その
    取得された韻律情報を、前記表現が変換された部分に連
    接する、表現が変換されない部分についての韻律情報と
    統合するステップと、 統合された韻律情報に従って、前記表現が変換された部
    分および前記表現が変換されない部分についての音声波
    形を合成することを特徴とする自然言語処理方法。
  10. 【請求項10】 前記入力テキスト中の表現が変換され
    た部分についての韻律情報は、実際の音声信号の分析に
    基づいて得られる情報であり、前記表現が変換されない
    部分についての韻律情報は、規則型の韻律生成により得
    られる情報であることを特徴とする請求項9記載の自然
    言語処理方法。
JP11134255A 1999-05-14 1999-05-14 音声合成装置および自然言語処理方法 Pending JP2000322075A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11134255A JP2000322075A (ja) 1999-05-14 1999-05-14 音声合成装置および自然言語処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11134255A JP2000322075A (ja) 1999-05-14 1999-05-14 音声合成装置および自然言語処理方法

Publications (1)

Publication Number Publication Date
JP2000322075A true JP2000322075A (ja) 2000-11-24

Family

ID=15124033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11134255A Pending JP2000322075A (ja) 1999-05-14 1999-05-14 音声合成装置および自然言語処理方法

Country Status (1)

Country Link
JP (1) JP2000322075A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009107441A1 (ja) * 2008-02-27 2009-09-03 日本電気株式会社 音声合成装置、テキスト生成装置およびその方法並びにプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009107441A1 (ja) * 2008-02-27 2009-09-03 日本電気株式会社 音声合成装置、テキスト生成装置およびその方法並びにプログラム
JPWO2009107441A1 (ja) * 2008-02-27 2011-06-30 日本電気株式会社 音声合成装置、テキスト生成装置およびその方法並びにプログラム

Similar Documents

Publication Publication Date Title
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
US7233901B2 (en) Synthesis-based pre-selection of suitable units for concatenative speech
US8219398B2 (en) Computerized speech synthesizer for synthesizing speech from text
JP2003295882A (ja) 音声合成用テキスト構造、音声合成方法、音声合成装置及びそのコンピュータ・プログラム
JP5198046B2 (ja) 音声処理装置及びそのプログラム
JPH1138989A (ja) 音声合成装置及び方法
US20090281808A1 (en) Voice data creation system, program, semiconductor integrated circuit device, and method for producing semiconductor integrated circuit device
JP3576848B2 (ja) 音声合成法方法、装置、および音声合成プログラムを記録した記録媒体
JP2002149180A (ja) 音声合成装置および音声合成方法
Aida–Zade et al. The main principles of text-to-speech synthesis system
JP3706758B2 (ja) 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
JPH08335096A (ja) テキスト音声合成装置
JPH0887297A (ja) 音声合成システム
JP4409279B2 (ja) 音声合成装置及び音声合成プログラム
JP3060276B2 (ja) 音声合成装置
JP2000322075A (ja) 音声合成装置および自然言語処理方法
JP2536169B2 (ja) 規則型音声合成装置
JPH06318094A (ja) 音声規則合成装置
JP3034554B2 (ja) 日本語文章読上げ装置及び方法
JPH05134691A (ja) 音声合成方法および装置
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JPH11231899A (ja) 音声・動画像合成装置及び音声・動画像データベース
JP2001249678A (ja) 音声出力装置,音声出力方法および音声出力のためのプログラム記録媒体
JP2001166787A (ja) 音声合成装置および自然言語処理方法
JPH0229797A (ja) テキスト音声変換装置