JPH11327871A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH11327871A
JPH11327871A JP10127185A JP12718598A JPH11327871A JP H11327871 A JPH11327871 A JP H11327871A JP 10127185 A JP10127185 A JP 10127185A JP 12718598 A JP12718598 A JP 12718598A JP H11327871 A JPH11327871 A JP H11327871A
Authority
JP
Japan
Prior art keywords
language processing
output
language
unit
unknown word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10127185A
Other languages
English (en)
Inventor
Kazuhide Oiko
和秀 老子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP10127185A priority Critical patent/JPH11327871A/ja
Publication of JPH11327871A publication Critical patent/JPH11327871A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 専門辞書が複数必要な様々な入力文章に対し
ても、音声合成の処理速度を低下させることなく、正確
に読み上げるようにする。 【解決手段】 複数の言語処理手段3A〜3Nを基本辞
書の他に1つ以上の専門辞書を含む複数の言語辞書4A
〜4Nをそれぞれ分担させるとともに並列して動作させ
て、言語処理選択手段5により、言語処理手段3A〜3
Nの各出力結果を判別して1つの言語処理手段3A〜3
Nの出力を選択する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された日本語
漢字カナ混じり文から音声を合成して出力する音声合成
装置に関する。音声合成装置を利用して読み上げとする
文章は様々で、使用される環境によっては、入力される
文章に専門用語が多く含まれ、一般に使用される単語と
傾向が異なることがある。現在は、これらの文章を正し
く読み上げるために、専門用語の辞書を使用したり、ユ
ーザが編集できるユーザ辞書などを使用するなどして対
応している。
【0002】このような専門辞書が複数必要な様々な入
力文章に対しても音声合成の処理速度を低下させること
なく、正確に読み上げることが必要である。
【0003】
【従来の技術】従来の音声合成装置としては、例えば、
図20に示すようなものがある。図20において、10
1はワードプロセッサなどの入力部であり、入力部10
1から日本語の漢字カナ混じり文を入力する。言語処理
部102は、単一の基本辞書103を使用して入力した
漢字カナ混じり文を形態素解析などを行って表音文字列
に変換する。規則合成部104は、言語処理部102が
出力する表音文字列を音声素片105を参照して音声波
形に変換してスピーカ106に出力する。スピーカ10
6は入力する音声波形から合成音声を出力する。
【0004】また、他の従来例としては、図21に示す
ように、一つの言語処理部102で複数の言語辞書、例
えば基本辞書103の他に専門用語辞書107や、ユー
ザ辞書108などを用いて言語処理を行っていた。
【0005】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の音声合成装置にあっては、音声合成装置を利
用して読み上げとする文章は様々で、使用される環境に
よっては、入力される文章に専門用語が多く含まれ、一
般に使用される単語と傾向が異なることがあり、これら
の文章を正しく読み上げるために、専門用語の辞書を使
用したり、ユーザが編集できるユーザ辞書などを使用す
るなどして対応している。専門用語辞書やユーザ辞書
は、一般に専門用語やユーザが登録した単語以外の単語
は登録されていないため、基本的な単語を持つ基本辞書
と併用する形で利用される。入力される文章の傾向が不
定な場合、正しく読み上げるために複数の専門辞書(例
えば地名辞書や医学用語辞書など)が必要となる。この
ため、入力される日本語文字列を表音文字列に変換する
言語処理部は、複数の言語辞書を参照することになり、
巨大な辞書を多数持った場合などには、言語辞書検索だ
けでも多くの処理時間が必要となり、言語処理部の処理
速度が著しく低下するという問題があった。
【0006】本発明は、このような従来の問題に鑑みて
なされたものであって、偏った単語で構成される文章が
入力された場合でも、言語処理の処理速度を落とすこと
なく、正確に読み上げることができる音声合成装置を提
供することを目的とする。
【0007】
【課題を解決するための手段】この目的を達成するため
に、本発明は、図1のように構成する。請求項1の発明
は、入力する日本語の文章を言語処理して表音文字列と
し、表音文字列を音声波形に変換して合成音声を出力す
る音声合成装置において、基本辞書の他に1つ以上の専
門辞書を含む複数の言語辞書4A〜4Nをそれぞれ分担
するとともに並列して動作する複数の言語処理手段3A
〜3Nと、該言語処理手段3A〜3Nの各出力結果を判
別して1つの言語処理手段3A〜3Nの出力を選択する
言語処理選択手段5と、を備える。
【0008】請求項2の発明は、請求項1記載の音声合
成装置において、前記言語処理選択手段5は、前記各言
語処理手段3A〜3Nの処理の出力順を判別して処理出
力が最も早い言語処理手段3A〜3Nの出力を選択す
る。請求項3の発明は、請求項1記載の音声合成装置に
おいて、前記各言語処理手段3A〜3Nに、形態素解析
において単語間結合の強さを算出する単語間結合算出手
段を設け、前記言語処理選択手段5は、前記単語間結合
算出手段の算出結果を判別して単語間の結合が最も強い
形態素解析結果の言語処理手段の出力を選択する。
【0009】請求項4の発明は、請求項1記載の音声合
成装置において、前記各言語処理手段3A〜3Nに、形
態素解析において未知語率を算出する未知語率算出手段
を設け、前記言語処理選択手段5は、前記未知語率算出
手段の算出結果を判別して、未知語率が最も低い形態素
解析結果の言語処理手段の出力を選択する。
【0010】請求項5の発明は、請求項1記載の音声合
成装置において、前記各言語処理手段3A〜3Nに、形
態素解析において単語間結合の強さを算出する単語間結
合算出手段と、形態素解析において未知語率を算出する
未知語率算出手段と、を設け、前記言語処理選択手段5
は、処理の出力順、単語間結合の強さ、および未知語率
の各選択要因に比重を設定して、点数化し、総合点の最
も高かった言語処理手段3A〜3Nの出力を選択する。
【0011】このような構成を備えた本発明によれば、
複数の言語処理手段3A〜3Nを基本辞書の他に1つ以
上の専門辞書を含む複数の言語辞書4A〜4Nをそれぞ
れ分担させるとともに並列して動作させて、言語処理手
段3A〜3Nの各出力結果を判別して1つの言語処理手
段3A〜3Nの出力を選択するので、すなわち、各言語
処理手段3A〜3Nの処理の出力順を判別して処理出力
が最も早い言語処理手段3A〜3Nの出力を選択するか
または単語間結合算出手段の算出結果を判別して単語間
の結合が最も形態素解析結果の言語処理手段3A〜3N
の出力を選択するかまたは未知語率算出手段の算出結果
を判別して、未知語率が最も低い形態素解析結果の言語
処理手段3A〜3Nの出力を選択するかまたは処理の出
力順、単語間結合の強さ、および未知語率の各選択要因
に比重を設定して、点数化し、総合点の最も高かった言
語処理手段3A〜3Nの出力を選択するので、専門辞書
が複数必要な様々な入力文章に対して、音声合成の処理
速度を低下させることなく、正確に読み上げることがで
きる。また、単一の言語処理部を使用する場合に比べて
処理速度を向上させることができる。
【0012】
【発明の実施の形態】図2は本発明の第1の実施形態を
示すブロック図である。図2において、1は入力部であ
り、入力部1は、例えばワードプロセッサなどからな
り、日本語の漢字カナ混じり文を入力する。入力部1に
対して複数の言語処理タスク部2A〜2Nが並列に設け
られる。言語処理タスク部2A〜2Nは、並列して動作
する言語処理手段としての言語処理部3A〜3Nと、言
語処理部3A〜3Nが分担して用いる言語辞書4A〜4
Nにより構成される。言語処理部3A〜3Nは、入力す
る日本語漢字カナ混じり文をそれぞれ分担する言語辞書
4A〜4Nを用いて表音文字列に変換する。
【0013】言語辞書4A〜4Nの構成例を図3に示
す。言語辞書4Aは、例えば、図3(A)に示すよう
に、基本辞書、単漢字辞書、ユーザ辞書、地名辞書、人
名辞書などにより構成される。言語辞書4Bは、例えば
図3(B)に示すように、基本辞書、単漢字辞書、医学
用語辞書、薬学用語辞書などにより構成される。言語辞
書4Nは、例えば図3(C)に示すように、基本辞書、
単漢字辞書、経済用語辞書、経営用語辞書などにより構
成される。
【0014】専門用語辞書やユーザ辞書は、一般に専門
用語やユーザが登録した単語以外の単語は登録されてい
ないため基本的な単語をもつ基本辞書、単漢字辞書と併
用する形で利用される。入力される日本語漢字カナ混じ
り文の使用単語の傾向が不定な場合、正しく読み上げる
ために、複数の専門用語辞書(例えば、地名辞書、人名
辞書、医学用語辞書、薬学用語辞書、経済用語辞書、経
営用語辞書など)が必要となり、複数の言語辞書4A〜
4Nを使用する。これらの言語辞書4A〜4Nを分担し
て使用する言語処理部3A〜3Nを並列して動作させる
ようにしている。
【0015】図2において、各言語処理部3A〜3Nの
出力側には言語処理選択手段としての言語処理選択部5
が設けられる。言語処理選択部5は、図4に示すよう
に、出力順判別手段としての出力順判別部6と選択手段
としての選択部7より構成される。出力順判別部6は、
各言語処理部3A〜3Nの処理出力順を判別する。すな
わち、出力順判別部は、処理が最も早かった言語処理部
3A〜3Nを判別する。選択部7は、出力順判別結果に
より処理が最も早かった言語処理部3A〜3Nの出力を
選択する。
【0016】言語処理選択部5で選択されて出力された
表音文字列は、規則合成部8に入力する。規則合成部8
は、音声素片9を参照して音素や音節などの音声要素を
連続して音声波形を合成し、スピーカからなる出力部1
0に音声波形を送る。出力部10は、入力する音声波形
から合成音声を出力する。図5は各言語処理部3A〜3
Nの構成例を示す図である。
【0017】図5において、各言語処理部3A〜3N
は、前処理部11、形態素解析部12、後処理部13、
および構成解析処理部14により構成されている。前処
理部11は、形態素解析の前に前処理とし
て「。」「、」「?」「!」を用いて解析単位を抽出
し、また、数字の区切り記号「,」の削除を行う。形態
素解析部12は、抽出された解析単位の入力文字列を形
態素解析するもので、言語辞書4A〜4Nを照合して、
可能性のある全ての単語・形態素を抽出して、形態素ラ
ティス(単語ラティス)を作成し、その後種々の規範を
適用して最適の単語・形態素列を探索する。この場合、
形態素ラティス(単語ラティス)を作成するとき、未知
語を抽出する。単語ラティスを作成した後に単語の接続
関係を求め、評価値を最大とする単語を選択し、全ての
可能な単語の組み合わせのうち、評価関数が最大となる
単語列を最適解として選択する。
【0018】図6に形態素解析の例を示す。「ナシを食
べた。」を解析単位として抽出し、言語辞書4A〜4N
を参照して、形態素(単語)を抽出する。「ナ」は1
個、「シ」は1個、「を」は2個、「食」は5個、
「べ」は3個、「た」は4個の形態素ラティスを作成す
る。接続線a,b,c,d,eなどで示す形態素の接続
関係を求め、評価値を最大とする形態素を選択し、最上
段の形態素列を最適解とする。図6の例では、「ナ」
「シ」が未知語、「を」は格助詞、「食」は動詞語幹ハ
行下一段、「べ」は動詞活用語尾ハ行下一段、「た」は
助動詞終止形が選択される。
【0019】図5に戻って、後処理部13は、形態素解
析が終った後にいくつかの後処理を行うもので、字句解
析処理、数詞処理、カタカナ文字未知語、英字未知語な
どの処理、転成名詞処理、連語処理を行う。構文解析処
理部14は、文節間の係受け処理を行う。普通の文章か
ら、自然なプロソディを持つ合成音声を得るためには、
人間の無意識的な「文構造を理解した上での息継ぎ」を
まねる必要がある。このため、日本語の文法性質に着目
した構文解析法が開発されている。
【0020】正確な構文解析をするためには、文章の意
味解析を必要とする。ここでは、意味解析まではせず、
隣接する文節の文法属性のみに着目することによって構
文解析を行っている。すなわち、指示解析処理部14
は、単語同定結果から文節境界を定め、文節の種類を定
めて、文節間の関係を求める。
【0021】図7は本発明の第1の実施形態の動作を説
明するフローチャートである。図7において、まず、ス
テップS1で入力部1より日本語漢字カナ混じり文を入
力する。次に、ステップS2で入力部1より入力した日
本語漢字カナ混じり文を複数の言語処理部3A〜3Nで
並列して処理し、表音文字列に変換して出力する。この
場合、言語処理部3Aは、図3(A)に示す言語辞書4
Aを用いて言語処理を行い、言語処理部3Bは、図3
(B)に示す言語辞書4Bを用いて言語処理を行い、言
語処理部3Nは図3(C)に示す言語辞書4Nを用いて
言語処理を行う。すなわち、各言語処理部3A〜3N
は、基本辞書、単漢字辞書に加えて1つ以上の内容の異
なる専門用語辞書を用いて言語処理を行う。
【0022】各言語処理部3A〜3Nにおいては、図5
に示すように、前処理部11で解析単位を抽出し、形態
素解析部12で形態素解析を行う。図6に示すように、
入力部1から例えば「ナシを食べた。」という日本語漢
字カナ混じり文が入力した場合には、前処理部11で
「ナシを食べた。」を解析単位として抽出し、形態素解
析部12で各言語辞書4A〜4Nを参照して、すべての
形態素(単語)を抽出し、形態素ラティスを作成する。
図6においては、「ナ」「シ」は1個、「を」は2個、
「食」は5個、「べ」は3個、「た」は4個の形態素ラ
ティスが作成される。a,b,c,d,eなどで示すよ
うな形態素間の接続関係を求め、各接続関係の評価値を
最大とする形態素を選択する。
【0023】こうして、図6の最上段の未知語の
「ナ」、未知語の「シ」、格助詞の「を」、動詞語幹ハ
行下一段の「食」、動詞活用語尾ハ行下一段の「べ」、
助動詞終止形の「た」が最適解として選択される。形態
素解析が行われた後に字句解析処理、数詞処理、未知語
処理などの後処理が行われる。後処理が終了すると、文
節境界を定め、文節の種類を定めて、文節間の関係を求
める構文解析処理が行われる。こうして、複数の言語処
理部3A〜3Nを並列に動作させて、入力した日本語漢
字カナ混じり文をそれぞれ表音文字列に変換する。
【0024】次に、ステップS3で各言語処理部3A〜
3Nが出力する処理出力順を出力順判別部6で判別す
る。すなわち、複数の言語処理部3A〜3Nを並列動作
させて処理させた処理結果が最も早く得られた言語処理
部3A〜3Nを判別する。次に、ステップS4で処理結
合が最も早く得られた言語処理部3A〜3Nの出力を選
択して、表音文字列を出力する。
【0025】次に、ステップS5で規則合成部8により
音声素片9を参照して選択した音声文字列を規則合成し
て音声波形に変換する。次に、ステップS6で出力部1
0のスピーカから合成音声を出力する。このように、入
力する漢字カナ混じり文を複数の言語処理部3A〜3N
で並列して処理し、処理結果が最も早いものを選択する
ため、専門辞書が複数必要な種々な入力文章に対して、
音声合成の処理速度を低下させることなく、正確に読み
上げることができる。また、単一の言語処理部を使用す
る場合に比べて処理速度を向上させることができる。
【0026】図8は本発明の第2の実施形態に係る言語
処理部を示す図である。図8において、形態素解析部1
2内には単語間結合算出手段としての単語間結合算出部
12Aが設けられている。その他の構成は、図5と同様
になっている。単語間結合算出部12Aは、単語間の結
び付きの強さを数値化したものを単語間で加算して合計
値を算出する。
【0027】例えば、図9に示すように、未知語「ナ」
と未知語「シ」の結び付きは「3」、未知語「シ」と格
助詞「を」との結び付きは「3」、未知語「シ」と未知
語「を」との結び付きは「4」、格助詞「を」と動詞語
幹ワ行五段の「食」との結び付きは「5」のように数値
が与えられている。最上段の単語列の算出値は、「3+
3+3+3+3+3=18」であり、他の単語列に比べ
て算出値は小さく、単語間の結び付きが最も強い。各言
語処理部3A〜3Nは入力する日本語漢字カナ混じり文
を並列に処理して、形態素解析結果として単語間結び付
きの強さを算出して出力する。
【0028】図10は言語処理選択部5Aの構成例を示
す図である。図10において、言語処理選択部5Aは、
単語間結合判別手段としての単語間結合判別部6Aと選
択手段としての選択部7により構成されている。単語間
結合判別部6Aは単語間結合算出部12Aで算出した算
出値から単語間の結び付きが最も強い形態解析結果を出
力した言語処理部3A〜3Nを判別する。選択部7は、
単語間結合判別部6Aの判別結果により単語間の結び付
きが最も強い形態素解析結果の言語処理部3A〜3Nの
出力を選択する。
【0029】図11は本発明の第2の実施形態の動作を
説明するフローチャートである。図11において、図7
のステップS2およびステップS3の代りにステップS
2AおよびステップS3Aが設けられ、その他のステッ
プS1,4〜6は同様になっている。ステップS2Aで
は、複数の言語処理部3A〜3Nを並列して動作させ、
形態素解析結果を出力するとき、単語間の結び付きの強
さを単語間で加算し、合計値を算出してそれぞれ出力す
る。ステップS3Aでは、単語間の結び付きが最も強い
形態素解析結果を出力した言語処理部3A〜3Nを判別
する。ステップS4で判別結果に基づいて単語間の結び
付きが最も強い言語処理部3A〜3Nの出力を選択し、
表音文字列として出力する。
【0030】本実施形態においても、専門辞書が複数必
要な種々な入力文章に対して、音声合成の処理速度を低
下させることなく、正確に読み上げることができる。ま
た、単一の言語処理部を使用する場合に比べて処理速度
を向上させることができる。図12は本発明の第3の実
施形態に係る言語処理部を示す図である。図12におい
て、形態素解析部12に未知語率算出手段としての未知
語率算出部12Bが設けられている。その他の構成は図
5と同様になっている。未知語率算出部12Bは、文章
を構成する単語(形態素)の未知語率を算出する。
【0031】未知語率算出部12Bは、図13に示すよ
うに、形態素解析の結果、選択された単語列(形態素
列)に未知語として抽出された単語(形態素)がいくつ
存在するかによって未知語率を求める。図13におい
て、「ナ」と「シ」は未知語であり、「を」、「食」、
「べ」、「た」、「。」は既知語である。したがって、
未知語率は(2/7)×100=28%となる。
【0032】図14は言語処理選択部5Bの構成例を示
す図である。図14において、言語処理選択部5Bは、
未知語率判別手段としての未知語率判別部6Bと選択手
段としての選択部7により構成されている。未知語率判
別部6Bは、形態素解析部12の未知語率算出部12B
で算出した各言語処理部3A〜3Nの未知語率を判別す
る。すなわち、未知語率の最も低い言語処理部3A〜3
Nを判別する。選択部7は、未知語率判別部6Bの判別
結果により未知語率が最も低い言語処理部3A〜3Nの
出力を選択して表音文字列を出力する。
【0033】図15は本発明の第3の実施形態の動作を
説明するフローチャートである。図15において、図7
のステップS2およびステップS3の代りにステップS
2BおよびステップS3Bが設けられている。他のステ
ップS1,4〜6は図7と同様になっている。ステップ
S2Bでは複数の言語処理部3A〜3Nを入力する文章
について並列して処理させ、形態素解析の結果として未
知語率を算出して出力する。
【0034】ステップS3Bでは形態素解析の結果とし
て各言語処理部3A〜3Nから出力される未知語率から
単語の未知語率が最も低かった言語処理部3A〜3Nを
判別し、ステップS4で未知語率が最も低かった言語処
理部3A〜3Nの出力を選択して表音文字列を出力す
る。本実施形態においても、専門辞書が複数必要な様々
な入力文章に対して、音声合成の処理速度を低下させる
ことなく、正確に読み上げることができる。また、単一
の言語処理部を使用する場合に比べて処理速度を向上さ
せることができる。
【0035】図16は本発明の第4の実施形態に係る言
語処理を示す図である。図16において、図5の形態素
解析部12に単語間結合算出手段としての単語間結合算
出部12Aおよび未知語率算出手段としての未知語率算
出部12Bが設けられている。その他の構成は図5と同
様になっている。単語間結合算出部12Aは、単語間の
結び付きの強さを算出する。例えば、図17に示すよう
に、単語間結合算出部12Aは、単語間の結び付きの強
さを示す数値を加算して合計値を出力する。
【0036】最上段の単語列(形態素列)の場合には、
「3+3+3+3+3+3=18」となる。また、例え
ば最上段の単語列に対して、「を」を未知語とした単語
列の場合は、「3+4+3+3+3+3=19」とな
る。合計して得られた算出値が最も小さい最上段の単語
列が単語間の結び付きが最も強いことを示す。未知語率
算出部12Bは、形態素解析の結果、選択された単語列
に未知語として抽出された単語がいくつあるかによって
未知語率を求める。図17において、最上段の単語列の
場合には、未知語率は(2/7)×100=28%とな
り、最上段の単語列に対して「を」を未知語とした単語
列の場合には、未知語率は(3/7)×100=43%
となる。
【0037】図18は言語処理選択部5Cの構成例を示
す図である。図18において、言語処理選択部5Cは、
出力順判別手段としての出力順判別部6、単語間結合判
別手段としての単語間結合判別部6A、未知語率判別手
段としての未知語率判別部6B、比重設定手段としての
比重設定部6C、および選択手段としての選択部7によ
り構成される。
【0038】出力順判別部6は、各言語処理部3A〜3
Nの処理出力の出力順を判別する。単語間結合判別部6
Aは各言語処理部3A〜3Nの単語間の結び付きの強さ
を判別する。未知語率判別部6Bは各言語処理部3A〜
3Nの単語の未知語率を判別する。比重設定部6Cは、
これらの3つの選択要因に比重を設定し、点数化して出
力する。選択部7は、比重を設定して点数化された総合
点が最も高かった言語処理部3A〜3Nの出力を選択す
る。
【0039】図19は本発明の第4の実施形態の動作を
説明するフローチャートである。図19において、図7
のステップS2およびステップS3の代りにステップS
2CおよびステップS3Cを設けた。その他のステップ
S1,4〜6は図7と同様である。ステップS2Cで
は、複数の言語処理部3A〜3Nを入力する日本語漢字
カナ混じり文について並列して処理させ、形態素解析の
結果として単語間の結び付きの強さを算出して出力する
とともに、単語の未知語率を算出して出力する。
【0040】ステップS3Cでは、各言語処理部3A〜
3Nの処理出力の出力順、単語間の結び付きの強さ、単
語の未知語率を判別し、これらの選択要因に比重を設定
して数値化し、総合点を出力する。ステップS4で総合
点が最も高かった言語処理部3A〜3Nの出力を選択し
て、表音文字列を出力する。本実施形態においても、専
門辞書が複数必要な様々な入力文章に対して、音声合成
の処理速度を低下させることなく、正確に読み上げるこ
とができる。また、単一の言語処理部を使用する場合に
比べて処理速度を向上させることができる。
【0041】
【発明の効果】以上説明してきたように、本発明によれ
ば、複数の言語処理手段を基本辞書の他に1つ以上の専
門辞書を含む複数の言語辞書をそれぞれ分担させるとと
もに並列して動作させて、言語処理手段の各出力結果を
判別して1つの言語処理手段の出力を選択するため、す
なわち、各言語処理手段の処理の出力順を判別して処理
出力が最も早い言語処理手段の出力を選択するかまたは
単語間結合算出手段の算出結果を判別して単語間の結合
が最も強い形態素解析結果の言語処理手段の出力を選択
するかまたは未知語率算出手段の算出結果を判別して、
未知語率が最も低い形態素解析結果の言語処理手段の出
力を選択するかまたは処理の出力順、単語間結合の強
さ、および未知語率の各選択要因に比重を設定して、点
数化し、総合点の最も高かった言語処理手段の出力を選
択するため、専門辞書が複数必要な様々な入力文章に対
して、音声合成の処理速度を低下させることなく、正確
に読み上げることができる。また、単一の言語処理部を
使用する場合に比べて処理速度を向上させることができ
る。
【図面の簡単な説明】
【図1】本発明の原理説明図
【図2】本発明の第1の実施形態を示すブロック図
【図3】言語辞書の構成例を示す図
【図4】言語処理選択部の構成例を示す図
【図5】言語処理部の構成例を示す図
【図6】形態素解析の例を示す図
【図7】第1の実施形態の動作を説明するフローチャー
【図8】本発明の第2の実施形態に係る言語処理部を示
す図
【図9】単語間結合の強さの説明図
【図10】第2の実施形態の言語処理選択部を示す図
【図11】第2の実施形態の動作を説明するフローチャ
ート
【図12】本発明の第3の実施形態に係る言語処理部を
示す図
【図13】未知語率の説明図
【図14】第3の実施形態の言語処理選択部を示す図
【図15】第3の実施形態の動作を説明するフローチャ
ート
【図16】本発明の第4の実施形態に係る言語処理部を
示す図
【図17】単語間結合の強さおよび未知語率の説明図
【図18】第4の実施形態の言語処理選択部を示す図
【図19】第4の実施形態の動作を説明するフローチャ
ート
【図20】従来例を示す図
【図21】他の従来例を示す図
【符号の説明】
1:入力部 2A〜2N:言語処理タスク部 3A〜3N:言語処理部(言語処理手段) 4A〜4N:言語辞書 5,5A,5B,5C:言語処理選択部(言語処理選択
手段) 6:出力順判別部 6A:単語間結合判別部 6B:未知語率判別部 6C:比重設定部 7:選択部 8:規則合成部 9:音声素片 10:出力部 11:前処理部 12:形態素解析部 12A:単語間結合算出部(単語間結合算出手段) 12B:未知語率算出部(未知語率算出手段) 13:後処理部 14:構文解析処理部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】入力する日本語の文章を言語処理して表音
    文字列とし、表音文字列を音声波形に変換して合成音声
    を出力する音声合成装置において、 基本辞書の他に1つ以上の専門辞書を含む複数の言語辞
    書をそれぞれ分担するとともに並列して動作する複数の
    言語処理手段と、 該言語処理手段の各出力結果を判別して1つの言語処理
    手段の出力を選択する言語処理選択手段と、を備えたこ
    とを特徴とする音声合成装置。
  2. 【請求項2】請求項1記載の音声合成装置において、 前記言語処理選択手段は、前記各言語処理手段の処理の
    出力順を判別して処理出力が最も早い言語処理手段の出
    力を選択することを特徴とする音声合成装置。
  3. 【請求項3】請求項1記載の音声合成装置において、 前記各言語処理手段に、形態素解析において単語間結合
    の強さを算出する単語間結合算出手段を設け、前記言語
    処理選択手段は、前記単語間結合算出手段の算出結果を
    判別して単語間の結合が最も強い形態素解析結果の言語
    処理手段の出力を選択することを特徴とする音声合成装
    置。
  4. 【請求項4】請求項1記載の音声合成装置において、 前記各言語処理手段に、形態素解析において未知語率を
    算出する未知語率算出手段を設け、 前記言語処理選択手段は、前記未知語率算出手段の算出
    結果を判別して、未知語率が最も低い形態素解析結果の
    言語処理手段の出力を選択することを特徴とする音声合
    成装置。
  5. 【請求項5】請求項1記載の音声合成装置において、 前記各言語処理手段に、形態素解析において単語間結合
    の強さを算出する単語間結合算出手段と、 形態素解析において未知語率を算出する未知語率算出手
    段と、を設け、 前記言語処理選択手段は、処理の出力順、単語間結合の
    強さ、および未知語率の各選択要因に比重を設定して、
    点数化し、総合点の最も高かった言語処理手段の出力を
    選択することを特徴とする音声合成装置。
JP10127185A 1998-05-11 1998-05-11 音声合成装置 Withdrawn JPH11327871A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10127185A JPH11327871A (ja) 1998-05-11 1998-05-11 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10127185A JPH11327871A (ja) 1998-05-11 1998-05-11 音声合成装置

Publications (1)

Publication Number Publication Date
JPH11327871A true JPH11327871A (ja) 1999-11-30

Family

ID=14953793

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10127185A Withdrawn JPH11327871A (ja) 1998-05-11 1998-05-11 音声合成装置

Country Status (1)

Country Link
JP (1) JPH11327871A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011133658A (ja) * 2009-12-24 2011-07-07 Fujitsu Ltd 音声合成装置、音声合成方法、及び音声合成プログラム
CN111373391A (zh) * 2017-11-29 2020-07-03 三菱电机株式会社 语言处理装置、语言处理系统和语言处理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011133658A (ja) * 2009-12-24 2011-07-07 Fujitsu Ltd 音声合成装置、音声合成方法、及び音声合成プログラム
CN111373391A (zh) * 2017-11-29 2020-07-03 三菱电机株式会社 语言处理装置、语言处理系统和语言处理方法
CN111373391B (zh) * 2017-11-29 2023-10-20 三菱电机株式会社 语言处理装置、语言处理系统和语言处理方法

Similar Documents

Publication Publication Date Title
EP0262938B1 (en) Language translation system
KR100853173B1 (ko) 통계적 자동 번역 방식에 기반한 음성 자동 통역 시스템 및그에 적용되는 번역 처리 방법 및 그 훈련방법
JP4811557B2 (ja) 音声再生装置及び発話支援装置
JP2005339347A (ja) 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム
JPH11327871A (ja) 音声合成装置
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
El-Imam et al. Rules and algorithms for phonetic transcription of standard Malay
JP3366253B2 (ja) 音声合成装置
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JPH06186994A (ja) 音声認識装置
JPH11338863A (ja) 未知名詞および表記ゆれカタカナ語自動収集・認定装置、ならびにそのための処理手順を記録した記録媒体
Salama et al. Building a POS-Annotated Corpus For Egyptian Children
JP3324910B2 (ja) 日本語解析装置
KR0180650B1 (ko) 음성합성기의 한국어 문장분석방법
JP2667553B2 (ja) 音声合成装置
JP2003005776A (ja) 音声合成装置
JP2801601B2 (ja) テキスト音声合成装置
JP3084864B2 (ja) 文章入力装置
Chanod et al. Methods and techniques of processing
JPH11224250A (ja) 辞書装置
JP2004326584A (ja) 対訳固有表現抽出装置及び方法、対訳固有表現抽出プログラム
JP3048793B2 (ja) 文字変換装置
JPH09281993A (ja) 発音記号生成装置
JP2001184345A (ja) 言語処理装置
JPS62262178A (ja) 言語解析装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050802