JP2003302993A - 音声合成装置、音声合成方法、プログラム、記憶媒体 - Google Patents

音声合成装置、音声合成方法、プログラム、記憶媒体

Info

Publication number
JP2003302993A
JP2003302993A JP2002108058A JP2002108058A JP2003302993A JP 2003302993 A JP2003302993 A JP 2003302993A JP 2002108058 A JP2002108058 A JP 2002108058A JP 2002108058 A JP2002108058 A JP 2002108058A JP 2003302993 A JP2003302993 A JP 2003302993A
Authority
JP
Japan
Prior art keywords
word
analysis
sentence
phrase
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002108058A
Other languages
English (en)
Inventor
Kazue Kaneko
和恵 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002108058A priority Critical patent/JP2003302993A/ja
Publication of JP2003302993A publication Critical patent/JP2003302993A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 ユーザに対して分かり易い文章のデータに基
づいた合成音声を提供すること。 【解決手段】 文章入力部101により切り出された一
文に対して解析処理部102は各語の同定を行い、読み
方やアクセントを付けるなどの処理を行う。そして重複
検出部103は、同音異義語を検出する。そして解析対
象の一文中に、すでに同音異義語を重複検出部103が
検出した場合、置換処理部104はこの同音異義語の同
義語を同義語辞書(データベース109)から検索し、
この同音異義語を見つけた同義語に置換する。そして一
文に対する上記処理が終了した場合、波形生成部105
は解析した読みやアクセントから音声波形のデータを素
片辞書(データベース110)を参照することで生成
し、生成した音声波形のデータを音声出力部106によ
り音声として出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文章のデータを合
成音声として出力する音声合成装置、音声合成方法、プ
ログラム、記憶媒体に関するものである。
【0002】
【従来の技術】従来の文章読み上げ方式において、同音
異義語などの辞書を利用して一つの音に意味の複数ある
語を検出し、それぞれの意味に対応する別の音の語に言
換える処理を行なうことが提案されている。
【0003】
【発明が解決しようとする課題】従来方法では、あらか
じめ登録されている同音異義語などはすべて言換えの対
象となるため、元の文章自体が大きく変わってしまう可
能性がある。通常の文章では、同音異義語であっても前
後の文脈から理解可能であることが多く、すべて言換え
てはかえってもとの文章を損なう可能性もある。
【0004】しかし、文脈で理解可能な語でも、同一文
章中の近い個所に同じ音で別の意味の語が出現した場
合、前の語と同じ意味に解釈し、その後で意味の矛盾が
起こり、聞いているユーザが混乱することがある。
【0005】本発明は以上の問題に鑑みなされたもので
あり、ユーザに対して分かり易い文章のデータに基づい
た合成音声を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明の目的を達成する
ために、例えば本発明の音声合成装置は以下の構成を備
える。
【0007】すなわち、文章のデータを合成音声として
出力する音声合成装置であって、同義語の集合である同
義語辞書を格納する格納手段と、入力した文章に形態素
解析を行い、各形態素に対して読み方とアクセントをつ
ける解析手段と、前記解析手段による解析結果におい
て、第1の語句と第2の語句とが読み方が同じで意味が
異なる場合、前記第1の語句の同義語を前記格納手段か
ら検索する検索手段と、前記第1の語句を前記検索手段
により検索した前記第1の語句の同義語に置き換える置
き換え手段とを備え、前記置き換え手段により置き換え
ることで生成される、前記文章の読み方、アクセントに
基づいた合成音声を生成、出力することを特徴とする。
【0008】本発明の目的を達成するために、例えば本
発明の音声合成装置は以下の構成を備える。
【0009】すなわち、文章のデータを合成音声として
出力する音声合成装置であって、語に対する語義を記述
した語義辞書を格納手段と、入力した文章に形態素解析
を行い、各形態素に対して読み方とアクセントをつける
解析手段と、前記解析手段により解析された各語におい
て、第1の語句と第2の語句とが読み方が同じで意味が
異なる場合、前記第1の語句の語義を前記格納手段から
検索する検索手段と、前記第1の語句に前記検索手段に
より検索した語義を付加する付加手段とを備え、前記付
加手段により付加されることで生成される、前記文章の
読み方、アクセントに基づいた合成音声を生成、出力す
ることを特徴とする。
【0010】本発明の目的を達成するために、例えば本
発明の音声合成方法は以下の構成を備える。
【0011】すなわち、文章のデータを合成音声として
出力する音声合成方法であって、同義語の集合である同
義語辞書を格納手段に格納しておき、入力した文章に形
態素解析を行い、各形態素に対して読み方とアクセント
をつける解析工程と、前記解析工程での解析結果におい
て、第1の語句と第2の語句とが読み方が同じで意味が
異なる場合、前記第1の語句の同義語を前記格納手段か
ら検索する検索工程と、前記第1の語句を前記検索工程
で検索した前記第1の語句の同義語に置き換える置き換
え工程とを備え、前記置き換え工程で置き換えることで
生成される、前記文章の読み方、アクセントに基づいた
合成音声を生成、出力することを特徴とする。
【0012】本発明の目的を達成するために、例えば本
発明の音声合成方法は以下の構成を備える。
【0013】すなわち、文章のデータを合成音声として
出力する音声合成方法であって、語に対する語義を記述
した語義辞書を格納手段に格納しておき、入力した文章
に形態素解析を行い、各形態素に対して読み方とアクセ
ントをつける解析工程と、前記解析工程で解析された各
語において、第1の語句と第2の語句とが読み方が同じ
で意味が異なる場合、前記第1の語句の語義を前記格納
手段から検索する検索工程と、前記第1の語句に前記検
索工程で検索した語義を付加する付加工程とを備え、前
記付加工程で付加されることで生成される、前記文章の
読み方、アクセントに基づいた合成音声を生成、出力す
ることを特徴とする。
【0014】
【発明の実施の形態】以下添付図面を参照して、本発明
を好適な実施形態に従って詳細に説明する。
【0015】[第1の実施形態]図1は本実施形態にお
ける音声合成装置の機能構成を示すブロック図である。
101は解析すべき文章を入力する文章入力部、102は文を
解析して語を同定し、読みやアクセントをつける解析処
理部、103は異なる語で重複する音の並びを検出する重
複検出部、104は同義語を検索して語を置き換える置換
処理部、105は読みやアクセントから音声波形を生成す
る波形生成部、106は合成音声を出力する音声出力部、1
07は文を解析するための解析用辞書を格納するデータベ
ース、108は読み上げた文章の解析履歴を格納するデー
タベース、109は語の置換候補を収録する同義語辞書を
格納するデータベース、110は音声合成のための素片辞
書を格納するデータベースである。
【0016】上記構成を備える本実施形態の音声合成装
置は、入力された電子データとしてのファイルに含まれ
る文章を一文毎に解析し、同音異義語を同義語に置き換
える処理を行う。図8に本実施形態の音声合成装置が行
う処理のフローチャートを示す。
【0017】文章入力部101は文章の電子データを入
力し(ステップS801)、入力した文章から順次一文
を切り出す処理を行う(ステップS802)。文章入力
部101は切り出す文章が残っているか否かの判断を行
い(ステップS803)、残っていれば処理はステップ
S804に移行する。文章入力部101により切り出さ
れた一文に対して解析処理部102は解析用辞書(デー
タベース107に格納されている)を参照して解析処理
(形態素解析処理)を行う(ステップS804)。具体
的には、各語の同定を行い、読み方やアクセントを付け
るなどの処理を行う。そして重複検出部103は、解析
した一文の解析結果とこれまでの解析履歴(データベー
ス108に格納する)とを比較し、重複する音の並びで
語句の異なるもの(同音異義語)を検出する。データベ
ース108については詳細は後述する。
【0018】語の同定は語義まで同定するものとし、表
記が同じでも前後の繋がりで異なる意味の認定が行なえ
るものについては、同音異義語として検出する。例えば
「いった」という言葉の場合、「学校へいった」ならば
「行った」の意味として、「うれしいといった」ならば
「言った」の意味として同じ音の並びで異なるものがあ
る。
【0019】解析対象の一文中に、すでに同じ音の並び
で異なる意味のものが使われている部分を重複検出部1
03が検出した場合(ステップS805)、処理はステ
ップS806に移行し、置換処理部104は重複検出部
103が検出した部分の同義語を同義語辞書(データベ
ース109に格納されている)から検索する(ステップ
S806)。図10に同音異義語のある文章とその読み
の例を示す。同図において「新婦」と「神父」とは同じ
読みではあるが(下線部分)、夫々の語は異なる意味を
有する。
【0020】図8に戻って、重複検出部103が検出し
た部分の同義語を、置換処理部104が同義語辞書を検
索することで見つけた場合(ステップS807)、処理
はステップS808に移行する。そして置換処理部10
4は重複検出部103が検出した部分を見つけた同義語
に置換する(ステップS808)。図11に同義語辞書
の例を示す。同図の辞書の各行は同義語のまとまりを示
しており、各行内の単語は夫々同義語である。図10に
示した例では、「新婦」と「神父」とが異なる意味を有
するが、同じ読みの語である。しかし、図11の辞書を
参照することで、例えば「神父」を同義語「司祭」に置
換することで、異なる読みの語に置換することができ
る。図12に、図10に示した文章において、「神父」
を同義語「司祭」に置換した結果の読みを示す。これに
より、文脈を変えることなく、一文中で同じ読みの語を
排除することができる。なお、同義語辞書には語句や読
み方、アクセントの情報を関連づけて蓄積しておき、置
換は読みやアクセントのレベルで行なう。
【0021】そして一文に対する上記処理が終了した場
合(ステップS809)、すなわち、ステップS804
における解析処理で重複部分がなかったと重複抽出部1
03が判断した場合、処理はステップS809に移行
し、上記解析結果、すなわち、解析した語句や読み、ア
クセントをデータベース108に解析履歴として蓄積
(登録)する(ステップS809)。そして波形生成部
105は解析した読みやアクセントから音声波形のデー
タを素片辞書(データベース110に格納されている)
を参照することで生成し(ステップS810)、生成し
た音声波形のデータを音声出力部106により音声とし
て出力する(ステップS811)。
【0022】以上の処理により、音声として出力すべき
文章を一文毎に解析し、重複する語(同音異義語)を過
去の解析履歴を参照することで、過去の語と異なる同義
語に置換する。これにより、文脈を乱すことなく、重複
する語を排除することができるので、この音声を聞くユ
ーザに混乱を与えない。
【0023】[第2の実施形態]第1の実施形態では重
複する語を同義語で置換する音声合成装置について説明
したが、本実施形態では重複する語に語義を付与する音
声合成装置について説明する。図3に本実施形態におけ
る音声合成装置の機能構成を示す。301は解析すべき
文章を入力する文章入力部、302は文を解析して語を
同定し、読みやアクセントをつける解析処理部、303
は異なる語で重複する音の並びを検出する重複検出部、
304は重複検出部103で検出された部分に対応する
語義をデータベース309内に格納された語義辞書から
検索して付与する語義付与部、305は読みやアクセン
トから音声波形を生成する波形生成部、306は合成音
声を出力する音声出力部、307は文を解析するための
解析用辞書を格納するデータベース、308は読み上げ
た文章の解析履歴を格納するデータベース、309は語
義の辞書を格納するデータベース、310は音声合成の
ための素片辞書を格納するデータベースである。
【0024】本実施形態における音声合成装置が行う処
理は基本的には図8に示したフローチャートに従うが、
下記の部分が異なる。
【0025】すなわち、ステップS806において語義
付与部304はデータベース309に格納された語義辞
書を検索し、重複検出部303が検出した部分の語義を
語義辞書から検索する。そして、重複検出部303が検
出した部分の語義を語義辞書から見つけた場合、処理は
ステップS808に移行し、語義付与部304は見つけ
た語義を解析対象の一文に付与する。この場合も語義の
語句や読み方、アクセント情報まで辞書に蓄積しておい
て、読みやアクセントのレベルで語義を付与する。
【0026】図13に語義辞書の例を示す。例えば「神
父」の語に対する語義は「カソリックの司祭。」とな
る。語義を付与する際には、単純に語義を入れるだけで
なく単語+語義+「のことです。」+単語というように
挿入したことがわかるような文に変形してもよい。図1
4に語義を付与した結果の例を示す。そして、1つの語
義文の付与を行うと処理はステップS805に戻り、重
複個所がないかどうかのチェックを繰り返す。
【0027】[第3の実施形態]図2に本実施形態にお
ける音声合成装置の機能構成を示す。201は解析すべ
き文章を入力する文章入力部、202は文を解析して語
を同定し、読みやアクセントをつける解析処理部、20
3は異なる語で重複する音の並びを検出する重複検出
部、204は同義語を検索して語を置き換える置換処理
部、205は読みやアクセントから音声波形を生成する
波形生成部、206は合成音声を出力する音声出力部、
207は文を解析するための解析用辞書を格納するデー
タベース、208は解析処理部202により解析され
た、入力したファイルに含まれる全部の文章の解析結果
を格納するデータベース、209は各同義語に対してそ
の使用頻度情報を付加した辞書(本実施形態ではこれを
同義語辞書と呼ぶ)を格納するデータベース、310は
音声合成のための素片辞書を格納するデータベースであ
る。
【0028】上記構成を備える本実施形態の音声合成装
置は、入力された電子データとしてのファイルに含まれ
る文章をすべて解析した後に、重複した同音異義語を同
義語に置き換える処理を行う。図9に本実施形態の音声
合成装置が行う処理のフローチャートを示す。
【0029】文章入力部201は文章の電子データを入
力し(ステップS901)、入力したすべての文章に対
して解析処理部202は解析用辞書(データベース20
7に格納されている)を参照して解析処理を行う(ステ
ップS902)。具体的には、各語を同定し、読みやア
クセントを付与する。ステップS902における解析方
法としては、一文ごとに切り出して解析してもかまわな
いし、文章をすべて一度に解析してもかまわない。解析
処理部202による解析結果はすべてデータベース20
8に格納される(ステップS903)。
【0030】次に重複検出部203はデータベース20
8内に格納された解析結果を参照し、ステップS902
における解析結果において重複する音の並びで語句の異
なるもの(同音異義語)を検索する。この検索処理につ
いては検索対象が一文ではなく、全体の文章とする以外
は第1の実施形態と同じものとする。
【0031】解析対象の文章中に、すでに同じ音の並び
で異なる意味のものが使われている部分を重複検出部2
03が検出した場合(ステップS904)、処理はステ
ップS905に移行する。ステップS905では、重複
した語のうち、どちらかを同義語に置換する処理を行う
が、まず、どちらの語を同義語に置換するかの選択処理
を行う。本実施形態では上記の通り同義語辞書に含まれ
る各語に頻度情報を付与しておく。そして置換する語と
して、使用頻度の高いものを採用するなどの判断基準を
設ける。例えば図10の例では「新婦」と「神父」の重
複があるが、「神父」の同義語「司祭」の使用頻度が
「新婦」の同義語「花嫁」の使用頻度よりも低い場合、
「新婦」を「花嫁」と置換する。図15にこの例におけ
る置換した結果の読みを示す。よって、置換する語と共
にその同義語を、各語の同義語の使用頻度を参照するこ
とで決定する。
【0032】そして置換すべき箇所がある場合には(ス
テップS906)、処理はステップS907に移行し、
置換処理部204は選択した語をこの語の同義語で置換
する。なお、同義語辞書には語句や読み、アクセントの
情報を関連づけて蓄積しておき、置換は読みやアクセン
トのレベルで行なう。
【0033】そして上記処理が終了した場合(ステップ
S904)、処理はステップS908に移行し、波形生
成部205は解析した読みやアクセントから音声波形の
データを素片辞書(データベース210に格納されてい
る)を参照することで生成し(ステップS908)、生
成した音声波形のデータを音声出力部206により音声
として出力する(ステップS909)。なお、文章すべ
てについての波形を生成するとデータ量が大きくなるの
で、文や句の単位で切り、波形生成と音声合成の処理を
繰り返すようにしてもよい。
【0034】[第4の実施形態]図4に本実施形態にお
ける音声合成装置の機能構成を示す。401は解析すべ
き文章を入力する文章入力部、402は文を解析して語
を同定し、読みやアクセントをつける解析処理部、40
3は異なる語で重複する音の並びを検出する重複検出
部、404は重複検出部403で検出された部分に対応
する語義をデータベース409内に格納された語義辞書
から検索して付与する語義付与部、405は読みやアク
セントから音声波形を生成する波形生成部、406は合
成音声を出力する音声出力部、407は文を解析するた
めの解析用辞書を格納するデータベース、408は解析
処理部402により解析された、入力したファイルに含
まれる全部の文章の解析結果を格納するデータベース、
409は語義とその使用頻度を付加した辞書を格納する
データベース、410は音声合成のための素片辞書を格
納するデータベースである。
【0035】上記構成を備える本実施形態の音声合成装
置は、入力された電子データとしてのファイルに含まれ
る文章をすべて一度に解析し、重複した同音異義語に語
義を付与する処理を行う。本実施形態の音声合成装置が
行う処理のフローチャートは基本的には図9に示したも
のと同じであるが、以下の点で異なる。
【0036】つまり、ステップS905において語義付
与部404が重複する語のうちどちらの語に語義を付与
するかを選択するが、この処理は語義付与部404が夫
々重複する語の語義をデータベース409から検索し、
ステップS907において夫々の語義の頻度情報を参照
し、より低い使用頻度の語義を(この語義に対応する語
に)付与する。付与する方法としては第2の実施形態で
説明したように行う。
【0037】[第5の実施形態]本実施形態の音声合成
装置は第1,3の実施形態と同様に、重複する語を同義
語に置換するが、入力した文章を一文毎に解析し、解析
した文章毎に置換処理を行うか、もしくは全部の文章を
解析した後に、置換処理を行うかが選択可能な構成を備
える。
【0038】図5に本実施形態における音声合成装置の
機能構成を示す。501は一文毎に文章を解析するか、
一度に全部の文章を解析するかを示す外部からの入力を
受け、この入力に基づいて後述の502乃至507を制
御する処理単位判定部、502は解析対象の電子データ
としての文章を入力する文章入力部、503は文章を解
析して語を同定し、読みやアクセントをつける解析処理
部、504は異なる語で重複する音の並びを検出する重
複検出部、505は同義語を検索して語を置き換える置
換処理部、506は読みやアクセントから音声波形を生
成する波形生成部、507は合成音声を出力する音声出
力部、508は文を解析するための解析用辞書を格納す
るデータベース、509は読み上げた文章の履歴もしく
は文章すべての解析結果を格納するデータベース、51
0は語の置換候補を収録する同義語辞書を格納するデー
タベース、511は音声合成のための素片辞書を格納す
るデータベースである。
【0039】一文毎に文章を解析する場合、処理単位判
定部501はこの旨の指示信号を502乃至507の各
部に送信する。これにより、502乃至507の各部は
第1の実施形態と同様の処理を行う。一方、全部の文章
を解析した後に置換処理を行う場合、処理単位判定部5
01はこの旨の指示信号を502乃至507の各部に送
信する。これにより、502乃至507の各部は第3の
実施形態と同様の処理を行う。
【0040】[第6の実施形態]本実施形態の音声合成
装置は第2,4の実施形態と同様に、重複する語に対し
て語義を付与するが、入力した文章を一文毎に解析し、
解析した文章毎に語義の付与処理を行うか、もしくは全
部の文章を解析した後に、語義の付与処理を行うかが選
択可能な構成を備える。
【0041】図6に本実施形態における音声合成装置の
機能構成を示す。601は一文毎に文章を解析するか、
一度に全部の文章を解析するかを示す外部からの入力を
受け、この入力に基づいて後述の602乃至607を制
御する処理単位判定部、602は解析対象の電子データ
としての文章を入力する文章入力部、603は文章を解
析して語を同定し、読みやアクセントをつける解析処理
部、604は異なる語で重複する音の並びを検出する重
複検出部、605は重複検出部604で検出された部分
に対応する語義をデータベース610内に格納された語
義辞書から検索して付与する語義付与部、606は読み
やアクセントから音声波形を生成する波形生成部、60
7は合成音声を出力する音声出力部、608は文を解析
するための解析用辞書を格納するデータベース、609
は読み上げた文章の履歴もしくは文章すべての解析結果
を格納するデータベース、610は語義の辞書を格納す
るデータベース、611は音声合成のための素片辞書を
格納するデータベースである。
【0042】一文毎に文章を解析する場合、処理単位判
定部601はこの旨の指示信号を602乃至607の各
部に送信する。これにより、602乃至607の各部は
第2の実施形態と同様の処理を行う。一方、全部の文章
を解析した後に語義の付与処理を行う場合、処理単位判
定部601はこの旨の指示信号を602乃至607の各
部に送信する。これにより、602乃至607の各部は
第4の実施形態と同様の処理を行う。
【0043】[第7の実施形態]本実施形態における音
声合成装置の機能構成を図7に示す。701は、解析す
べき文章を入力する文章入力部、702は文を解析して
語を同定し、読みやアクセントをつける解析処理部、7
03は異なる語で重複する音の並びを検出する重複検出
部、704は同義語を検索して語を置き換える置換処理
部、705は読みやアクセントから音声波形を生成する
波形生成部、706は合成音声を出力する音声出力部、
707は文を解析するための解析用辞書を格納するデー
タベース、708は文章すべての解析結果を格納するデ
ータベース、709は語の置換候補を収録する同義語辞
書を格納するデータベース、710は対をなす語を収録
する対義語辞書を格納するデータベース、711は音声
合成のための素片辞書を格納するデータベースである。
【0044】本実施形態の音声合成装置は、同義語辞書
のほかに対義語辞書を用意し、置換対象になった語に対
義語がある場合は、その対義語も文章中(一文毎に処理
を行う場合には以降、文章中を一文中と読み替える)に
現れるかチェックし、文章中にある場合は、置換した後
の語の対義語に入れ替える。図16に対義語辞書の例を
示す。図10の例で、「新婦」を「花嫁」に置換した場
合、対義後辞書に「新婦」が登録されているか検索す
る。この場合登録されているので、「新婦」の対義語
「新郎」について文章中にあらわれているか調べ、文章
中の「新郎」を、「花嫁」の対義語「花婿」に置換す
る。図17にその置換例を示す。
【0045】対になる表現の語がある場合、一方だけ置
換すると不自然な文章になる場合がある。これを防ぐた
めに対義語辞書を使用する。例えば「パパとママがけん
かすることも、ままある」とう文を「パパとお母さんが
けんかすることも、ままある」と置き換えると不自然
で、「パパとママ」という対に対して「お父さんとお母
さん」という対で言い換えて「お父さんとお母さんがけ
んかすることも、ままある」といした方が自然である。
【0046】なお、本実施形態における処理のフローチ
ャートは図8,9に示したフローチャートに以下の処理
を追加したフローチャートとなる。つまり、図8におい
てステップS808の次に(図9ではステップS907
の次に)、ステップS808で(ステップS907で)
置換対象となった語句の対義語(以下、第1の対義語)
及び置換された語句の対義語(以下、第2の対義語)が
上記対義語辞書に収録されているか否かをチェックし、
収録されている場合には第1の対義語が文章中に現れる
か否かを更にチェックする。そして、現れていた場合に
は第1の対義語を第2の対義語に置換する。
【0047】[第8の実施形態]上記実施形態では、置
換した語や付与した語義文について、前後と同じ状態で
読み上げをするが、置換や付与部分については、音量や
スピードを変えて、その差異が分かるようにしてもよ
い。
【0048】また、置換した語や付与した語義文につい
て、前後と同じ状態で読み上げをするが、置換や付与部
分については、音声合成の素片辞書の話者を変えて、そ
の差異が分かるようにしてもよい。
【0049】また、語義辞書に読みやアクセントの情報
は付与せず、語義文を付与するときに解析し、読みやア
クセントの情報を付与するようにしてもよい。
【0050】同義辞書に読みやアクセントの情報は付与
せず、文の中で置き換えを行い、再び解析処理を行い、
重複チェックを繰り返すようにしてもよい。この時無限
ループに陥らないように、置換回数を限定するなどの手
段を設ける。
【0051】また、処理単位を一文ごとにするか文章全
体でするかの判定に、文章の長さを計測し、長い文は一
文ごとに処理するという処理単位判断部を用意して、処
理単位を切り替えられるようにしてもよい。
【0052】処理単位を一文ごとにするか文章全体です
るかは、処理単位判断部がユーザに問い合わせて選択さ
せるようにして、処理単位を切り替えられるようにして
もよい。
【0053】音の重複単位が複合語や句の場合は、その
構成要素について同義語辞書を検索して置換を行なうよ
うにしてもよい。例えば、「汚職事件」と「お食事券」
はどちらも「オショクジケン」という音が付与される
が、同義語辞書に登録されていない場合、構成要素「汚
職」を同義語辞書で検索し「背任」という同義語を取り
出し、「背任事件」と置換する。これにより、あらかじ
め想定されていない音の重複にも対処可能となる。
【0054】重複を調べる単位を文章とせず、一定の長
さの文章に限定し、重複検出範囲を進めながら処理する
ようにしてもよい。例えば、文章といっても小説などの
長い文章では、ずっと前に読んだ音が影響を及ぼすこと
はない。文字の数もしくは音の数で限定してもよいし、
読み上げの合成音声のスピードから一定時間の長さにな
る音の数を計算して、重複検出範囲を求めてもよい。
【0055】上記実施形態では、もとの文章を変換する
のではなく、読み上げ時に読み上げ用の読みやアクセン
トのレベルで置き換えているが、読み上げている文章を
吹き出しや字幕として表示する場合には、もとの文章を
表示するのではなく、同義語を置き換えたり語義文を付
与した後の文章を表示するようにしてもよい。
【0056】[他の実施形態]本発明の目的は、前述し
た実施形態の機能を実現するソフトウェアのプログラム
コードを記録した記憶媒体(または記録媒体)を、シス
テムあるいは装置に供給し、そのシステムあるいは装置
のコンピュータ(またはCPUやMPU)が記憶媒体に格納さ
れたプログラムコードを読み出し実行することによって
も、達成されることは言うまでもない。この場合、記憶
媒体から読み出されたプログラムコード自体が前述した
実施形態の機能を実現することになり、そのプログラム
コードを記憶した記憶媒体は本発明を構成することにな
る。また、コンピュータが読み出したプログラムコード
を実行することにより、前述した実施形態の機能が実現
されるだけでなく、そのプログラムコードの指示に基づ
き、コンピュータ上で稼働しているオペレーティングシ
ステム(OS)などが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
【0057】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0058】
【発明の効果】以上の説明により、本発明によって、ユ
ーザに対して分かり易い文章のデータに基づいた合成音
声を提供することができる。より具体的には、同一文章
中に、同じ音の並びで意味の異なる語句が出現したと
き、どちらかの語を同義語で言換えるか、もしくは語義
文を付与するかして、同じ意味に誤解してしまう可能性
を防ぐ。これによって、合成音声による読み上げ文を聞
く時、ユーザが聞き取りやすくなるという効果が得られ
る。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における音声合成装置
の機能構成を示すブロック図である。
【図2】本発明の第3の実施形態における音声合成装置
の機能構成を示すブロック図である。
【図3】本発明の第2の実施形態における音声合成装置
の機能構成を示すブロック図である。
【図4】本発明の第4の実施形態における音声合成装置
の機能構成を示すブロック図である。
【図5】本発明の第5の実施形態における音声合成装置
の機能構成を示すブロック図である。
【図6】本発明の第6の実施形態における音声合成装置
の機能構成を示すブロック図である。
【図7】本発明の第7の実施形態における音声合成装置
の機能構成を示すブロック図である。
【図8】本発明の第1の実施形態における音声合成装置
が行う処理のフローチャートである。
【図9】本発明の第3の実施形態における音声合成装置
が行う処理のフローチャートである。
【図10】同音異義語のある文章とその読みの例を示す図
である。
【図11】同義語辞書の例を示す図である。
【図12】図10に示した文章において、「神父」を同義
語「司祭」に置換した結果の読みを示す図である。
【図13】語義辞書の例を示す図である。
【図14】語義を付与した結果の例を示す図である。
【図15】本発明の第3の実施形態における図10に示し
た例を置換した結果の読みを示す図である。
【図16】対義語辞書の例を示す図である。
【図17】図16に示した対義語辞書を用いた置換の結果
の例を示す図である。

Claims (27)

    【特許請求の範囲】
  1. 【請求項1】 文章のデータを合成音声として出力する
    音声合成装置であって、 同義語の集合である同義語辞書を格納する格納手段と、 入力した文章に形態素解析を行い、各形態素に対して読
    み方とアクセントをつける解析手段と、 前記解析手段による解析結果において、第1の語句と第
    2の語句とが読み方が同じで意味が異なる場合、前記第
    1の語句の同義語を前記格納手段から検索する検索手段
    と、 前記第1の語句を前記検索手段により検索した前記第1
    の語句の同義語に置き換える置き換え手段とを備え、 前記置き換え手段により置き換えることで生成される、
    前記文章の読み方、アクセントに基づいた合成音声を生
    成、出力することを特徴とする音声合成装置。
  2. 【請求項2】 更に、前記解析手段による解析結果を格
    納する解析結果格納手段を備えることを特徴とする請求
    項1に記載の音声合成装置。
  3. 【請求項3】 前記解析手段は入力された文章を一文毎
    に解析し、 前記検索手段は、前記解析手段により解析された一文と
    前記解析結果格納手段に格納された解析履歴とを比較
    し、前記第1の語句と前記第2の語句とを検索すること
    を特徴とする請求項2に記載の音声合成装置。
  4. 【請求項4】 前記解析手段は入力された文章に含まれ
    るすべての文章を解析し、更にすべての解析結果を前記
    解析結果格納手段に格納し、 前記検索手段は、前記解析結果格納手段に格納された解
    析結果を参照し、前記第1の語句と前記第2の語句とを
    検索することを特徴とする請求項2に記載の音声合成装
    置。
  5. 【請求項5】 前記格納手段は、語の使用頻度情報も含
    む同義語辞書を格納し、 第1の語句の同義語の使用頻度は前記第2の語句の同義
    語の使用頻度よりも高いことを特徴とする請求項1乃至
    4のいずれか1項に記載の音声合成装置。
  6. 【請求項6】 前記置き換え手段は、より高い使用頻度
    の同義語に対応する語を当該同義語に置き換えることを
    特徴とする請求項5に記載の音声合成装置。
  7. 【請求項7】 前記同義語辞書には、各語句の読み方や
    アクセントの情報が関連して蓄積されていることを特徴
    とする請求項1乃至6のいずれか1項に記載の音声合成
    装置。
  8. 【請求項8】 更に、対をなす語句を収録する対義語辞
    書を格納する対義語辞書格納手段を備え、 前記検索手段は更に、前記第1の語句の対義語及び前記
    第1の語句の同義語の対義語を前記対義語辞書格納手段
    から検索し、 前記置き換え手段は更に、前記検索手段により検索され
    た前記第1の語句の対義語を前記第1の語句の同義語の
    対義語に置き換えることを特徴とする請求項1乃至7の
    いずれか1項に記載の音声合成装置。
  9. 【請求項9】 文章のデータを合成音声として出力する
    音声合成装置であって、 語に対する語義を記述した語義辞書を格納手段と、 入力した文章に形態素解析を行い、各形態素に対して読
    み方とアクセントをつける解析手段と、 前記解析手段により解析された各語において、第1の語
    句と第2の語句とが読み方が同じで意味が異なる場合、
    前記第1の語句の語義を前記格納手段から検索する検索
    手段と、 前記第1の語句に前記検索手段により検索した語義を付
    加する付加手段とを備え、 前記付加手段により付加されることで生成される、前記
    文章の読み方、アクセントに基づいた合成音声を生成、
    出力することを特徴とする音声合成装置。
  10. 【請求項10】 更に、前記解析手段による解析結果を
    格納する解析結果格納手段を備えることを特徴とする請
    求項9に記載の音声合成装置。
  11. 【請求項11】 前記解析手段は入力された文章を一文
    毎に解析し、 前記検索手段は、前記解析手段により解析された一文と
    前記解析結果格納手段に格納された解析履歴とを比較
    し、前記第1の語句と前記第2の語句とを検索すること
    を特徴とする請求項10に記載の音声合成装置。
  12. 【請求項12】 前記解析手段は入力された文章に含ま
    れるすべての文章を解析し、更にすべての解析結果を前
    記解析結果格納手段に格納し、 前記検索手段は、前記解析結果格納手段に格納された解
    析結果を参照し、前記第1の語句と前記第2の語句とを
    検索することを特徴とする請求項10に記載の音声合成
    装置。
  13. 【請求項13】 前記格納手段は、語の使用頻度情報も
    含む語義辞書を格納し、 第1の語句の語義の使用頻度は前記第2の語句の語義の
    使用頻度よりも低いことを特徴とする請求項9乃至12
    のいずれか1項に記載の音声合成装置。
  14. 【請求項14】 前記付加手段は、より使用頻度の低い
    語義の語に対して語義を付加することを特徴とする請求
    項13に記載の音声合成装置。
  15. 【請求項15】 前記語義辞書には、各語義の読み方や
    アクセントの情報が関連して蓄積されていることを特徴
    とする請求項9乃至14のいずれか1項に記載の音声合
    成装置。
  16. 【請求項16】 文章のデータを合成音声として出力す
    る音声合成方法であって、 同義語の集合である同義語辞書を格納手段に格納する格
    納工程と、 入力した文章に形態素解析を行い、各形態素に対して読
    み方とアクセントをつける解析工程と、 前記解析工程での解析結果において、第1の語句と第2
    の語句とが読み方が同じで意味が異なる場合、前記第1
    の語句の同義語を前記格納手段から検索する検索工程
    と、 前記第1の語句を前記検索工程で検索した前記第1の語
    句の同義語に置き換える置き換え工程とを備え、 前記置き換え工程で置き換えることで生成される、前記
    文章の読み方、アクセントに基づいた合成音声を生成、
    出力することを特徴とする音声合成方法。
  17. 【請求項17】 更に、前記解析工程での解析結果を解
    析結果格納手段に格納する解析結果格納工程を備えるこ
    とを特徴とする請求項16に記載の音声合成方法。
  18. 【請求項18】 前記解析工程では入力された文章を一
    文毎に解析し、 前記検索工程では、前記解析工程で解析された一文と前
    記解析結果格納手段に格納された解析履歴とを比較し、
    前記第1の語句と前記第2の語句とを検索することを特
    徴とする請求項17に記載の音声合成方法。
  19. 【請求項19】 前記解析工程では入力された文章に含
    まれるすべての文章を解析し、更にすべての解析結果を
    前記解析結果格納手段に格納し、 前記検索工程では、前記解析結果格納手段に格納された
    解析結果を参照し、前記第1の語句と前記第2の語句と
    を検索することを特徴とする請求項17に記載の音声合
    成方法。
  20. 【請求項20】 更に、対をなす語句を収録する対義語
    辞書を対義語辞書格納手段に格納する対義語辞書格納工
    程を備え、 前記検索工程では更に、前記第1の語句の対義語及び前
    記第1の語句の同義語の対義語を前記対義語辞書格納手
    段から検索し、 前記置き換え工程では更に、前記検索工程で検索された
    前記第1の語句の対義語を前記第1の語句の同義語の対
    義語に置き換えることを特徴とする請求項16乃至19
    のいずれか1項に記載の音声合成方法。
  21. 【請求項21】 文章のデータを合成音声として出力す
    る音声合成方法であって、 語に対する語義を記述した語義辞書を格納手段に格納す
    る格納工程と、 入力した文章に形態素解析を行い、各形態素に対して読
    み方とアクセントをつける解析工程と、 前記解析工程で解析された各語において、第1の語句と
    第2の語句とが読み方が同じで意味が異なる場合、前記
    第1の語句の語義を前記格納手段から検索する検索工程
    と、 前記第1の語句に前記検索工程で検索した語義を付加す
    る付加工程とを備え、 前記付加工程で付加されることで生成される、前記文章
    の読み方、アクセントに基づいた合成音声を生成、出力
    することを特徴とする音声合成方法。
  22. 【請求項22】 更に、前記解析工程での解析結果を解
    析結果格納手段に格納する解析結果格納工程を備えるこ
    とを特徴とする請求項21に記載の音声合成方法。
  23. 【請求項23】 前記解析工程では入力された文章を一
    文毎に解析し、 前記検索工程では、前記解析工程で解析された一文と前
    記解析結果格納手段に格納された解析履歴とを比較し、
    前記第1の語句と前記第2の語句とを検索することを特
    徴とする請求項22に記載の音声合成方法。
  24. 【請求項24】 前記解析工程では入力された文章に含
    まれるすべての文章を解析し、更にすべての解析結果を
    前記解析結果格納手段に格納し、 前記検索工程では、前記解析結果格納手段に格納された
    解析結果を参照し、前記第1の語句と前記第2の語句と
    を検索することを特徴とする請求項22に記載の音声合
    成方法。
  25. 【請求項25】 情報処理装置に読み込ませることで、
    情報処理装置を請求項1乃至15のいずれか1項に記載
    の音声合成装置として機能させることを特徴とするプロ
    グラム。
  26. 【請求項26】 情報処理装置に読み込ませることで、
    当該情報処理装置に請求項16乃至24のいずれか1項
    に記載の音声合成方法を実行させることを特徴とするプ
    ログラム。
  27. 【請求項27】 請求項25または26に記載のプログ
    ラムを格納し、コンピュータが読みとり可能な記憶媒
    体。
JP2002108058A 2002-04-10 2002-04-10 音声合成装置、音声合成方法、プログラム、記憶媒体 Withdrawn JP2003302993A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002108058A JP2003302993A (ja) 2002-04-10 2002-04-10 音声合成装置、音声合成方法、プログラム、記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002108058A JP2003302993A (ja) 2002-04-10 2002-04-10 音声合成装置、音声合成方法、プログラム、記憶媒体

Publications (1)

Publication Number Publication Date
JP2003302993A true JP2003302993A (ja) 2003-10-24

Family

ID=29391932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002108058A Withdrawn JP2003302993A (ja) 2002-04-10 2002-04-10 音声合成装置、音声合成方法、プログラム、記憶媒体

Country Status (1)

Country Link
JP (1) JP2003302993A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006227425A (ja) * 2005-02-18 2006-08-31 National Institute Of Information & Communication Technology 音声再生装置及び発話支援装置
WO2008056590A1 (fr) * 2006-11-08 2008-05-15 Nec Corporation Dispositif de synthèse texte-parole, programme et procédé de synthèse texte-parole
WO2015159363A1 (ja) * 2014-04-15 2015-10-22 三菱電機株式会社 情報提供装置および情報提供方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006227425A (ja) * 2005-02-18 2006-08-31 National Institute Of Information & Communication Technology 音声再生装置及び発話支援装置
WO2008056590A1 (fr) * 2006-11-08 2008-05-15 Nec Corporation Dispositif de synthèse texte-parole, programme et procédé de synthèse texte-parole
WO2015159363A1 (ja) * 2014-04-15 2015-10-22 三菱電機株式会社 情報提供装置および情報提供方法
JP5976255B2 (ja) * 2014-04-15 2016-08-23 三菱電機株式会社 情報提供装置および情報提供方法
US9734818B2 (en) 2014-04-15 2017-08-15 Mitsubishi Electric Corporation Information providing device and information providing method
DE112014006591B4 (de) 2014-04-15 2018-06-14 Mitsubishi Electric Corporation Informationsbereitstellungsvorrichtung und Informationsbereitstellungsverfahren

Similar Documents

Publication Publication Date Title
US8027837B2 (en) Using non-speech sounds during text-to-speech synthesis
US8036894B2 (en) Multi-unit approach to text-to-speech synthesis
US8825486B2 (en) Method and apparatus for generating synthetic speech with contrastive stress
US8626510B2 (en) Speech synthesizing device, computer program product, and method
US8914291B2 (en) Method and apparatus for generating synthetic speech with contrastive stress
JP2006313176A (ja) 音声合成装置
JP2003302993A (ja) 音声合成装置、音声合成方法、プログラム、記憶媒体
JP2013061591A (ja) 音声合成装置、音声合成方法およびプログラム
JP4751299B2 (ja) 読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置
JP3371761B2 (ja) 氏名読み音声合成装置
JPH06282290A (ja) 自然言語処理装置およびその方法
JP2000172289A (ja) 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
JP4794429B2 (ja) 読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置
JPH0962286A (ja) 音声合成装置および音声合成方法
JP2753255B2 (ja) 音声による対話型情報検索装置
Hendessi et al. A speech synthesizer for Persian text using a neural network with a smooth ergodic HMM
Pakrashi et al. Analysis-By-Synthesis Modeling of Bengali Intonation
Mahar et al. WordNet based Sindhi text to speech synthesis system
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JPS62119591A (ja) 文章読上げ装置
JPH08194494A (ja) 文解析方法および装置
KR100959494B1 (ko) 미등록어 합성 기능을 이용한 음성합성기 및 그 방법
JP2001249678A (ja) 音声出力装置,音声出力方法および音声出力のためのプログラム記録媒体
JP2003308084A (ja) 音声合成方法および音声合成装置
JPH09185629A (ja) 機械翻訳方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050705