JPH04350699A - テキスト音声合成装置 - Google Patents
テキスト音声合成装置Info
- Publication number
- JPH04350699A JPH04350699A JP3123917A JP12391791A JPH04350699A JP H04350699 A JPH04350699 A JP H04350699A JP 3123917 A JP3123917 A JP 3123917A JP 12391791 A JP12391791 A JP 12391791A JP H04350699 A JPH04350699 A JP H04350699A
- Authority
- JP
- Japan
- Prior art keywords
- word
- speech
- phrase
- phoneme
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002194 synthesizing effect Effects 0.000 title claims abstract description 5
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 38
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 38
- 238000001514 detection method Methods 0.000 claims abstract description 10
- 230000014509 gene expression Effects 0.000 abstract description 11
- 230000033764 rhythmic process Effects 0.000 abstract 7
- 238000010586 diagram Methods 0.000 description 4
- 230000002996 emotional effect Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 3
- 235000016496 Panda oleosa Nutrition 0.000 description 2
- 240000000220 Panda oleosa Species 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は、任意の文字記号列から
形成された入力文章を音声に変換するテキスト音声合成
装置に関する。
形成された入力文章を音声に変換するテキスト音声合成
装置に関する。
【0002】
【従来の技術】従来のテキスト音声合成装置は、文字記
号列からなる文章を合成音声に変換するときに、入力さ
れた任意の文字記号列に正しい読み、アクセント及びイ
ントネーションの情報を付加して音声合成用パラメータ
を生成し、生成された音声合成用パラメータに基づいて
音声を合成して出力するように構成されている。
号列からなる文章を合成音声に変換するときに、入力さ
れた任意の文字記号列に正しい読み、アクセント及びイ
ントネーションの情報を付加して音声合成用パラメータ
を生成し、生成された音声合成用パラメータに基づいて
音声を合成して出力するように構成されている。
【0003】図5に上述した従来のテキスト音声合成装
置の構成を示す。
置の構成を示す。
【0004】図5において、文字記号列入力部31は、
文字記号列(例えば日本語漢字かな混じり文)を入力し
て文字記号列解析部32に出力する。
文字記号列(例えば日本語漢字かな混じり文)を入力し
て文字記号列解析部32に出力する。
【0005】文字記号列解析部32は、辞書(単語辞書
、漢字辞書、記号辞書等)33を用いて形態素解析を行
い入力された文字記号列の単語を同定すると共に、辞書
33から同定した単語の読み等の音韻情報、アクセント
位置、品詞等の文法情報を同時に得る。
、漢字辞書、記号辞書等)33を用いて形態素解析を行
い入力された文字記号列の単語を同定すると共に、辞書
33から同定した単語の読み等の音韻情報、アクセント
位置、品詞等の文法情報を同時に得る。
【0006】合成音声パラメータ生成部34は、韻律を
制御するために、文字記号列解析部32において同定さ
れた各単語のアクセント位置及び構文構造から、単語が
連鎖したときの文節、呼気段階のアクセントまたはポー
ズの設定を行う。更に、合成音声パラメータ生成部34
は、発生音声に対応した合成単位に対する継続時間、ピ
ッチパターン、パワーパターン及び音韻特徴パラメータ
(偏自己相関係数、線スペクトル対、ホルマント等)の
パラメータ時系列を得る。
制御するために、文字記号列解析部32において同定さ
れた各単語のアクセント位置及び構文構造から、単語が
連鎖したときの文節、呼気段階のアクセントまたはポー
ズの設定を行う。更に、合成音声パラメータ生成部34
は、発生音声に対応した合成単位に対する継続時間、ピ
ッチパターン、パワーパターン及び音韻特徴パラメータ
(偏自己相関係数、線スペクトル対、ホルマント等)の
パラメータ時系列を得る。
【0007】音声合成部35は、上記音声合成用のパラ
メータ時系列に基づいて実際の合成音声波形を生成し、
合成音声出力部36は、音声合成部35で生成された合
成音声波形を出力するように構成されている。
メータ時系列に基づいて実際の合成音声波形を生成し、
合成音声出力部36は、音声合成部35で生成された合
成音声波形を出力するように構成されている。
【0008】
【発明が解決しようとする課題】しかしながら、上記従
来のテキスト音声合成装置では、単にアクセント位置ま
たは文法情報に基づいて、入力された任意の文字記号列
を合成音声に変換するので、感情表現などに特有の「抑
揚」を表現できないという問題点がある。
来のテキスト音声合成装置では、単にアクセント位置ま
たは文法情報に基づいて、入力された任意の文字記号列
を合成音声に変換するので、感情表現などに特有の「抑
揚」を表現できないという問題点がある。
【0009】本発明は、上記従来のテキスト音声合成装
置における問題点に鑑み、感情表現などに特有な抑揚を
表現可能な音声合成装置を提供する。
置における問題点に鑑み、感情表現などに特有な抑揚を
表現可能な音声合成装置を提供する。
【0010】
【課題を解決するための手段】本発明は、入力された文
字列を言語解析して所定の情報を生成する解析手段と、
文字記号列中の特定の単語及び単語列を検出する語句検
出手段と、所定の情報に基づいて音声合成パラメータを
生成する音声パラメ−タ生成手段と、特定語句に対応す
る所定の情報を格納する語句情報辞書と、語句情報辞書
に格納された所定の情報に基づいて特定語句の音声を合
成する音声合成手段とを備えているテキスト音声合成装
置によって達成される。
字列を言語解析して所定の情報を生成する解析手段と、
文字記号列中の特定の単語及び単語列を検出する語句検
出手段と、所定の情報に基づいて音声合成パラメータを
生成する音声パラメ−タ生成手段と、特定語句に対応す
る所定の情報を格納する語句情報辞書と、語句情報辞書
に格納された所定の情報に基づいて特定語句の音声を合
成する音声合成手段とを備えているテキスト音声合成装
置によって達成される。
【0011】
【作用】解析手段は入力された文字列を言語解析して所
定の情報を生成し、語句検出手段は文字記号列中の特定
の単語及び単語列を検出し、音声パラメ−タ生成手段は
所定の情報に基づいて音声合成パラメータを生成し、語
句情報辞書は特定語句に対応する所定の情報を格納し、
音声合成手段は、語句情報辞書に格納された所定の情報
に基づいて特定語句の音声を合成する。
定の情報を生成し、語句検出手段は文字記号列中の特定
の単語及び単語列を検出し、音声パラメ−タ生成手段は
所定の情報に基づいて音声合成パラメータを生成し、語
句情報辞書は特定語句に対応する所定の情報を格納し、
音声合成手段は、語句情報辞書に格納された所定の情報
に基づいて特定語句の音声を合成する。
【0012】
【実施例】以下、図面を参照して本発明のテキスト音声
合成装置における実施例を詳述する。
合成装置における実施例を詳述する。
【0013】図1は、本発明のテキスト音声合成装置に
おける一実施例の構成を示す。
おける一実施例の構成を示す。
【0014】図1のテキスト音声合成装置は、文字記号
列入力部11、解析手段である文字記号列解析部12、
辞書13、語句検出手段である特定語句検出部14、語
句情報辞書である特定語句音韻・韻律辞書15、音声パ
ラメ−タ生成手段である音声パラメ−タ生成部16、音
声合成手段である音声合成部17及び合成音声出力部1
8によって構成されている。
列入力部11、解析手段である文字記号列解析部12、
辞書13、語句検出手段である特定語句検出部14、語
句情報辞書である特定語句音韻・韻律辞書15、音声パ
ラメ−タ生成手段である音声パラメ−タ生成部16、音
声合成手段である音声合成部17及び合成音声出力部1
8によって構成されている。
【0015】次に、上述の各構成部分の動作を説明する
。
。
【0016】文字記号列入力部11は、文字記号列(例
えば日本語漢字かな交じり文)を入力して文字記号列解
析部12に送り出す。
えば日本語漢字かな交じり文)を入力して文字記号列解
析部12に送り出す。
【0017】文字記号列解析部12は、辞書13を用い
て入力された文字記号列の形態素、構文及び意味の解析
等を行う。
て入力された文字記号列の形態素、構文及び意味の解析
等を行う。
【0018】特定語句検出部14は、後述する特定語句
音韻・韻律辞書15を参照して、文字記号列解析部12
による解析結果の中で、条件に適合する特定の単語また
は単語列が含まれているかどうか検出し、含まれている
場合にはその特定語句の部分を語句コードに置き換える
。
音韻・韻律辞書15を参照して、文字記号列解析部12
による解析結果の中で、条件に適合する特定の単語また
は単語列が含まれているかどうか検出し、含まれている
場合にはその特定語句の部分を語句コードに置き換える
。
【0019】音声パラメータ生成部16は、韻律を制御
するために、上記文字記号列解析部12で同定された各
単語のアクセントまたは構文構造により、単語が連鎖し
た際の文節、呼気段落のアクセントまたはポーズの設定
を行う。
するために、上記文字記号列解析部12で同定された各
単語のアクセントまたは構文構造により、単語が連鎖し
た際の文節、呼気段落のアクセントまたはポーズの設定
を行う。
【0020】ここで、上記特定語句検出部14で、置き
換えられた特定語句の存在を示す語句コードがあれば、
特定語句音韻・韻律辞書15でその語句に対する所定の
情報である音韻・韻律情報を検索する。そして、検索さ
れた音韻・韻律情報を用いる。
換えられた特定語句の存在を示す語句コードがあれば、
特定語句音韻・韻律辞書15でその語句に対する所定の
情報である音韻・韻律情報を検索する。そして、検索さ
れた音韻・韻律情報を用いる。
【0021】更に、発声音声に対応した合成単位に対す
る継続時間、ピッチパターン、パワーパターン及び音韻
特徴パラメータ(偏自己相関係数、線スペクトル対、ホ
ルマント等)のパラメータ時系列を得る。
る継続時間、ピッチパターン、パワーパターン及び音韻
特徴パラメータ(偏自己相関係数、線スペクトル対、ホ
ルマント等)のパラメータ時系列を得る。
【0022】音声合成部17は、上記音声合成用のパラ
メータ時系列に基づいて実際の合成音声波形を生成し、
合成音声出力部18は、音声合成部17で生成された合
成音声波形を出力する。
メータ時系列に基づいて実際の合成音声波形を生成し、
合成音声出力部18は、音声合成部17で生成された合
成音声波形を出力する。
【0023】図2に、上述した特定語句音韻・韻律辞書
15の構成を示す。
15の構成を示す。
【0024】以下、図2を参照して特定語句音韻・韻律
辞書15を説明する。
辞書15を説明する。
【0025】特定語句音韻・韻律辞書15の中の見出し
番号は、文字記号列解析部12で解析された結果として
得られる単語番号であり、単語の品詞・意味等が一意に
認識されていることを意味する。
番号は、文字記号列解析部12で解析された結果として
得られる単語番号であり、単語の品詞・意味等が一意に
認識されていることを意味する。
【0026】所定の情報である音韻・韻律情報は、見出
しを発声する時の音韻・韻律に関する情報であり、アク
セントの位置の他に、フレーズ(抑揚)の大きさ、アク
セントの大きさなどが相対的な値として記入されている
。
しを発声する時の音韻・韻律に関する情報であり、アク
セントの位置の他に、フレーズ(抑揚)の大きさ、アク
セントの大きさなどが相対的な値として記入されている
。
【0027】条件の欄は、マッチングのときに見出し以
外に付帯的に要求される条件が記されており、必要に応
じて利用できるように構成されている。
外に付帯的に要求される条件が記されており、必要に応
じて利用できるように構成されている。
【0028】次に、図3のフロ−チャ−トを参照して図
1のテキスト音声合成装置の動作、特に、文字記号列入
力部11〜音声パラメ−タ生成部16による動作を説明
する。
1のテキスト音声合成装置の動作、特に、文字記号列入
力部11〜音声パラメ−タ生成部16による動作を説明
する。
【0029】まず、日本語文字列が入力され(ステップ
S1)、入力された日本語文字列の各単語を辞書を用い
て形態素解析して同定する(ステップS2)。
S1)、入力された日本語文字列の各単語を辞書を用い
て形態素解析して同定する(ステップS2)。
【0030】ここでは、日本語文字列がどのような単語
で構成されているかを辞書と照合することにより候補を
抽出し、その抽出された候補の中で、頻度情報や活用語
尾、付属語の接続可能性などを考慮して文字列の構成単
語を一意に決定する(これは従来の形態素解析と同様の
方法である)。また、一意に決定した単語の辞書番号、
品詞等の文法情報やアクセントを得る。
で構成されているかを辞書と照合することにより候補を
抽出し、その抽出された候補の中で、頻度情報や活用語
尾、付属語の接続可能性などを考慮して文字列の構成単
語を一意に決定する(これは従来の形態素解析と同様の
方法である)。また、一意に決定した単語の辞書番号、
品詞等の文法情報やアクセントを得る。
【0031】上記同定された単語列が特定の語句を形成
しているかどうか、即ち、同定された単語列が特定語句
音韻・韻律辞書に存在するか否か、を辞書番号に基づい
て判別し(ステップS3)、同定された単語列が特定語
句音韻・韻律辞書に存在する場合(YESの場合)には
、その部分の単語列を特定語句であることを示す語句コ
−ドに置き換える(ステップS4)。
しているかどうか、即ち、同定された単語列が特定語句
音韻・韻律辞書に存在するか否か、を辞書番号に基づい
て判別し(ステップS3)、同定された単語列が特定語
句音韻・韻律辞書に存在する場合(YESの場合)には
、その部分の単語列を特定語句であることを示す語句コ
−ドに置き換える(ステップS4)。
【0032】他方、上記ステップS3でNOの場合には
、韻律を制御するために辞書から検索された各単語のア
クセントや構文構造から、単語が連鎖したときの文節、
呼気段落のアクセントまたはポ−ズの設定を、アクセン
ト付与規則、ポ−ズ付与規則を用いて行って(ステップ
S5)、後述するステップS7に進む。
、韻律を制御するために辞書から検索された各単語のア
クセントや構文構造から、単語が連鎖したときの文節、
呼気段落のアクセントまたはポ−ズの設定を、アクセン
ト付与規則、ポ−ズ付与規則を用いて行って(ステップ
S5)、後述するステップS7に進む。
【0033】上記ステップS4で語句コ−ドに置き換っ
ている場合には、アクセントやポ−ズの情報が格納され
ている特定語句音韻・韻律辞書を検索してアクセントや
ポ−ズを設定し(ステップS6)、更に、発声音声に対
応した合成単位に対する継続時間、ピッチパタ−ン、パ
ワ−パタ−ン及び音韻特徴パラメ−タ(偏自己相関係数
、線スペクトル対、ホルマント等)の時系列を得る(ス
テップS7)。
ている場合には、アクセントやポ−ズの情報が格納され
ている特定語句音韻・韻律辞書を検索してアクセントや
ポ−ズを設定し(ステップS6)、更に、発声音声に対
応した合成単位に対する継続時間、ピッチパタ−ン、パ
ワ−パタ−ン及び音韻特徴パラメ−タ(偏自己相関係数
、線スペクトル対、ホルマント等)の時系列を得る(ス
テップS7)。
【0034】従って、本発明のテキスト音声合成装置に
よると、入力日本語文字列の中に特定の語句が入ってい
る場合、その語句に対応するあらかじめ用意された音韻
・韻律情報を用いて音声合成ができ、感情表現等の特殊
な韻律操作が可能となる。
よると、入力日本語文字列の中に特定の語句が入ってい
る場合、その語句に対応するあらかじめ用意された音韻
・韻律情報を用いて音声合成ができ、感情表現等の特殊
な韻律操作が可能となる。
【0035】図4に、本実施例のテキスト音声合成装置
による出力例を示す。
による出力例を示す。
【0036】図に示すように、「こら、何をしている」
を入力した場合、「kora(こら) 1.12.9
,naniositeiru(何をしている)1.10
.6」が出力される。
を入力した場合、「kora(こら) 1.12.9
,naniositeiru(何をしている)1.10
.6」が出力される。
【0037】ここで、kora及びnaniosite
iruの後にそれぞれ示されている数字について説明す
る。
iruの後にそれぞれ示されている数字について説明す
る。
【0038】koraの後に示されている数字1.12
.9のうち、最初の数字1 はアクセント位置、2番目
の数字12はフレ−ズの大きさ、3番目の数字9 はア
クセントの大きさをそれぞれ表している。また、nan
iositeiruの後に示されている数字も同様であ
る。その結果、出力例に示すように各数字を大きくする
ことが可能なので、従来のテキスト音声合成装置と比較
して感情的な表現をより明確に表すことができる。
.9のうち、最初の数字1 はアクセント位置、2番目
の数字12はフレ−ズの大きさ、3番目の数字9 はア
クセントの大きさをそれぞれ表している。また、nan
iositeiruの後に示されている数字も同様であ
る。その結果、出力例に示すように各数字を大きくする
ことが可能なので、従来のテキスト音声合成装置と比較
して感情的な表現をより明確に表すことができる。
【0039】
【発明の効果】本発明のテキスト音声合成装置によれば
、入力された文字列を言語解析して所定の情報を生成す
る解析手段と、文字記号列中の特定の単語及び単語列を
検出する語句検出手段と、所定の情報に基づいて音声合
成パラメータを生成する音声パラメ−タ生成手段と、特
定語句に対応する所定の情報を格納する語句情報辞書と
、語句情報辞書に格納された所定の情報に基づいて特定
語句の音声を合成する音声合成手段とを備えているので
感情表現などの特殊な抑揚を表わすことができる。
、入力された文字列を言語解析して所定の情報を生成す
る解析手段と、文字記号列中の特定の単語及び単語列を
検出する語句検出手段と、所定の情報に基づいて音声合
成パラメータを生成する音声パラメ−タ生成手段と、特
定語句に対応する所定の情報を格納する語句情報辞書と
、語句情報辞書に格納された所定の情報に基づいて特定
語句の音声を合成する音声合成手段とを備えているので
感情表現などの特殊な抑揚を表わすことができる。
【図面の簡単な説明】
【図1】本発明のテキスト音声合成装置における一実施
例の構成を示すブロック図である。
例の構成を示すブロック図である。
【図2】図1の特定語句音韻・韻律辞書の構成を示す図
である。
である。
【図3】図1のテキスト音声合成装置の動作を説明する
ためのフロ−チャ−トである。
ためのフロ−チャ−トである。
【図4】図1のテキスト音声合成装置による出力例を説
明するための図である。
明するための図である。
【図5】従来のテキスト音声合成装置の一構成を示すブ
ロック図である。
ロック図である。
11 文字記号列入力部
12 文字記号列解析部
13 辞書
14 特定語句検出部
15 特定語句音韻・韻律辞書
16 合成音声パラメータ生成部
17 音声合成部
18 合成音声出力部
Claims (1)
- 【請求項1】 入力された文字列を言語解析して所定
の情報を生成する解析手段と、前記文字記号列中の特定
の単語及び単語列を検出する語句検出手段と、前記所定
の情報に基づいて音声合成パラメータを生成する音声パ
ラメ−タ生成手段と、前記特定語句に対応する前記所定
の情報を格納する語句情報辞書と、前記語句情報辞書に
格納された前記所定の情報に基づいて前記特定語句の音
声を合成する音声合成手段とを備えていることを特徴と
するテキスト音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3123917A JPH04350699A (ja) | 1991-05-28 | 1991-05-28 | テキスト音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3123917A JPH04350699A (ja) | 1991-05-28 | 1991-05-28 | テキスト音声合成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04350699A true JPH04350699A (ja) | 1992-12-04 |
Family
ID=14872546
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3123917A Pending JPH04350699A (ja) | 1991-05-28 | 1991-05-28 | テキスト音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04350699A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19980065482A (ko) * | 1997-01-10 | 1998-10-15 | 김광호 | 스피킹 스타일을 변경하는 음성 합성 방법 |
KR100522889B1 (ko) * | 1999-07-21 | 2005-10-19 | 코나미 가부시키가이샤 | 음성합성방법,음성합성장치 및 음성합성 프로그램을 기록한 컴퓨터판독 가능한 매체 |
JP2007241052A (ja) * | 2006-03-10 | 2007-09-20 | Advanced Telecommunication Research Institute International | 音声情報処理装置、およびプログラム |
-
1991
- 1991-05-28 JP JP3123917A patent/JPH04350699A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19980065482A (ko) * | 1997-01-10 | 1998-10-15 | 김광호 | 스피킹 스타일을 변경하는 음성 합성 방법 |
KR100522889B1 (ko) * | 1999-07-21 | 2005-10-19 | 코나미 가부시키가이샤 | 음성합성방법,음성합성장치 및 음성합성 프로그램을 기록한 컴퓨터판독 가능한 매체 |
JP2007241052A (ja) * | 2006-03-10 | 2007-09-20 | Advanced Telecommunication Research Institute International | 音声情報処理装置、およびプログラム |
JP4716116B2 (ja) * | 2006-03-10 | 2011-07-06 | 株式会社国際電気通信基礎技術研究所 | 音声情報処理装置、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6751592B1 (en) | Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically | |
JP3587048B2 (ja) | 韻律制御方法及び音声合成装置 | |
JPH086591A (ja) | 音声出力装置 | |
Kayte et al. | Di-phone-based concatenative speech synthesis systems for marathi language | |
JPH0887297A (ja) | 音声合成システム | |
KR0146549B1 (ko) | 한국어 텍스트/음성 변환 방법 | |
JPH04350699A (ja) | テキスト音声合成装置 | |
KR20000063774A (ko) | 음성합성을 이용하여 문자를 음성으로 변환하는 방법 및 그 단말기 | |
Sen et al. | Indian accent text-to-speech system for web browsing | |
Repe et al. | Prosody model for marathi language TTS synthesis with unit search and selection speech database | |
Kaur et al. | BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE | |
JPH11338498A (ja) | 音声合成装置 | |
KR0173340B1 (ko) | 텍스트/음성변환기에서 억양패턴 정규화와 신경망 학습을 이용한 억양 생성 방법 | |
JPH037995A (ja) | 歌音声合成データの作成装置 | |
JPH0229797A (ja) | テキスト音声変換装置 | |
JP3522005B2 (ja) | 音声合成装置 | |
JP2737122B2 (ja) | 音声辞書作成装置 | |
JPH08160983A (ja) | 音声合成装置 | |
KR100611894B1 (ko) | 음성 인식기의 단어 모델 생성 방법 | |
JPH096378A (ja) | テキスト音声変換装置 | |
IMRAN | ADMAS UNIVERSITY SCHOOL OF POST GRADUATE STUDIES DEPARTMENT OF COMPUTER SCIENCE | |
KR100608643B1 (ko) | 음성 합성 시스템의 억양 모델링 장치 및 방법 | |
JPH09146576A (ja) | 原文対音声の人工的神経回路網にもとづく韻律の合成装置 | |
Lefevre | A diphone speech synthesis approach applicable to different languages | |
JPH05298364A (ja) | 発音記号生成方式 |