JPH10171485A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH10171485A
JPH10171485A JP8331817A JP33181796A JPH10171485A JP H10171485 A JPH10171485 A JP H10171485A JP 8331817 A JP8331817 A JP 8331817A JP 33181796 A JP33181796 A JP 33181796A JP H10171485 A JPH10171485 A JP H10171485A
Authority
JP
Japan
Prior art keywords
analysis result
information
rule
input text
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8331817A
Other languages
English (en)
Inventor
Katsuyoshi Yamagami
勝義 山上
Kenji Matsui
謙二 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP8331817A priority Critical patent/JPH10171485A/ja
Publication of JPH10171485A publication Critical patent/JPH10171485A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 テキスト情報を利用者ごとにわかりやすい音
声で提示する音声合成装置を提供する。 【解決手段】 構文解析部101から出力された構文解
析結果に対して、構文解析結果変更手段105が、語義
テーブル102を参照して単語から語義文への置き換え
を行い、また、説明文テーブル103を参照して構文解
析結果の曖昧な部分の説明文を挿入し、重要部パターン
テーブル104を参照して重要部分を特定して複製・挿
入し、それら結果を基に音響パラメータの制御コマンド
を挿入し、韻律情報生成部106が韻律情報、音響パラ
メータを生成し、音響処理部107が音声出力する。さ
らに、利用者識別部108で利用者を識別し、利用者に
応じて構文解析結果変更部105での構文解析結果の変
更処理内容を制御する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はテキストデータを音
声に変換して出力する音声合成装置に関する。
【0002】
【従来の技術】近年、パソコン通信やインターネットな
ど一般家庭から利用可能な通信ネットワークの普及が著
しい。それにともなって、提供されるデータの種類・量
も増え続けており、比較的容易に目的とする情報をネッ
トワークを通じて得ることが可能になっている。たとえ
ば、大規模な新聞データベースにアクセスして記事のテ
キストを家庭の端末で閲覧することが可能である。ま
た、CD−ROMなどの記憶媒体を通じてテキスト情報
を得ることも可能である。このように、一般家庭でまと
まった量の電子化されたテキスト情報を閲覧する機会が
増えている。
【0003】端末においてテキスト情報を提示するイン
タフェースとしては、端末の画面上にテキスト情報を表
示するものが一般的であるが、テキストは一様の属性を
持った状態で表示され、テキストデータに表示パラメー
タが付加されている場合はそのパラメータに沿った文字
修飾を伴うが、それは固定的なものであった。
【0004】テキスト情報提供の別のインタフェースと
して、テキストを音声に変換して提示するものがある
が、音声によるインタフェースはユーザへの負担も軽
く、画面に視覚を奪われることがないので、まとまった
量のテキスト情報を得る方法としてはより望ましい。さ
らに、目の不自由な高齢者や視覚障害者といったユーザ
の場合は、画面上のテキストを目で読むことはできない
ので、点字、あるいは、音声による提示に頼らざるを得
ないが、やはり音声による提示がユーザへの負担という
観点からより望ましい方法である。このように、一般家
庭でのテキスト情報の閲覧手段としての、テキストを音
声に変換する音声合成処理機能を持つ音声合成装置の必
要性が非常に高まっている。
【0005】図11は、従来の一般的な音声合成装置の
構成を示す図である。図11において、1101は、構
文解析手段であり、入力テキストに対し形態素解析、構
文解析を行い、単語列に分割して読みを決定し、構文構
造を決定する。1102は、韻律情報生成手段であり、
構文解析手段1101から出力される構文解析結果に基
づいて、発音、アクセント、ポーズなどの韻律に関する
パラメータを生成する。1103は、音響処理手段であ
り、韻律情報生成手段1102が生成した、韻律情報に
従って実際の音声信号を合成する。
【0006】
【発明が解決しようとする課題】このような音声合成装
置によってテキストを音声合成する場合、入力テキスト
中に含まれる意味の難解な単語、同音異義語が複数ある
単語、あるいは、発音の聞き取りにくい単語の部分の理
解が困難であるという問題があった。これに対して、音
声合成時に平易な意味の単語、同音異義語と識別可能な
別の単語、聞き取りやすく同様な意味の単語に置き換え
ることで了解性を高める方式がある(例えば、特開平3
−35296号公報参照)。しかしながら、単語の置き
換えのためのテーブルを用意する必要があり、新たに作
成するコストがかかるという課題があった。
【0007】一方、入力テキスト中の情報として重要な
部分、例えば電話番号や住所などが含まれる部分を従来
の音声合成装置ではテキスト中の他の部分と区別するこ
となく音声に変換するため、聞き手にとって重要である
部分と重要ではない部分との区別がつきにくいという課
題があった。
【0008】また、入力テキストを構文解析した際に、
単語の読みが複数ある、あるいは、漢字を含む未知語で
あるために読みが一意に決定できない場合がある。実
際、人名、地名などの固有名詞の読みは、人間が読む場
合でも一意に決定できないことがある。従来の音声合成
装置では、読みが一意に決定できない場合、複数の読み
の中から無作為に一つを選んで音声に変換するため、読
み上げられた読みが確定的であるという誤解を聞き手に
与えてしまうという課題があった。
【0009】さらに、家庭内の情報端末の出力手段とし
て音声合成装置を使用する場合、聞き手の年齢によって
言語理解能力が異なる。そのため、あるテキストを読み
上げる場合、大人なら十分理解できる文でも子供には理
解が難しい場合や、反対に子供には適度で平易な文が大
人にとっては冗長であるといったことが考えられる。し
かしながら、従来の音声合成装置では、聞き手の言語理
解能力に応じた言語表現でテキストを読み上げることが
できないといった課題があった。本発明は、これらの課
題を鑑み、テキスト情報を聞き手ごとにわかりやすい音
声で提示する音声合成装置を提供することを目的とする
ものである。
【0010】
【課題を解決するための手段】上記目的を達成するため
に、本発明による音声合成装置は、入力テキストの構文
解析を行い、単語の読み、構文構造を含む構文解析結果
を出力する構文解析手段と、単語とその意味の説明文か
らなる語義を保持する語義保持手段と、入力テキストの
特定の部分を識別するための部分特定規則を保持する部
分特定規則保持手段と、入力テキスト中に挿入する文テ
ンプレートを保持する文テンプレート保持手段と、前記
構文解析結果にもとづいて、前記語義情報と前記部分特
定規則と前記文テンプレート情報とを用いて入力テキス
ト文の構文解析結果を変更する構文解析結果変更手段
と、前記構文解析結果に基づいて、発音およびアクセン
トを含む韻律情報と話速および音量を含む音響パラメー
タとを生成する韻律情報生成手段と、前記韻律情報生成
手段からの韻律情報に基づいて音声信号を合成する音響
処理手段とを備える。
【0011】かかる構成により、入力されたテキスト
は、構文解析手段により形態素解析処理、構文解析処理
がされ、さらに構文解析結果変更手段より前記構文解析
結果が構文構造のレベルで変更され、韻律情報生成手段
により前記構文解析結果をもとに発音、アクセント、ポ
ーズや話速、音量、ピッチ、声質などの音響パラメータ
を含む韻律情報が生成され、音響処理手段により前記韻
律情報に従って音声信号を合成することができる。
【0012】次に前記音声合成装置において、前記部分
特定規則が、意味が難解であるもの、発音が聞き取りに
くいテキストを特定する規則を備え、前記構文解析結果
変更手段が、前記部分特定規則を用いて特定した入力テ
キストの単語に対して、前記語義保持手段が保持してい
る語義から対応する語義の説明文に置換する機能を備え
ることが好ましい。
【0013】かかる構成により、構文解析結果変更手段
は、受け取った構文解析結果と語義保持手段に登録され
ている単語を照合し、照合した単語については、構文解
析結果の中の該当する難解な単語、発音が聞きづらい単
語の部分をその語義を説明する文の構文構造に置き換え
ることができる。
【0014】さらに、前記音声合成装置において、前記
構文解析結果変更手段が、前記部分特定規則により特定
した入力テキストの部分を複数回繰り返し出力する変更
を行なう機能を備えることが好ましい。
【0015】かかる構成により、前記部分特定規則保持
手段がテキストの重要部を特定し、構文解析結果変更手
段がかかる部分を複製し追加することで、重要な部分を
繰り返して音声出力することが可能になるので、利用者
が重要部分と重要ではない部分の区別を容易に判断する
ことができる。
【0016】さらに、前記音声合成装置において、前記
部分特定規則が、構文解析結果の中でテキストの読みま
たは意味が一意に決定できない曖昧さがある箇所を特定
する規則を備え、前記構文解析結果変更手段が、前記部
分特定規則により特定した入力テキストの部分に対し
て、前記文テンプレート保持手段が保持している文テン
プレートをもとに生成した複数の解釈の可能性を示唆す
るテキスト情報を付加する機能を備えることが好まし
い。
【0017】かかる構成により、単語の読みを一意に決
定できず、複数の読みの可能性が含まれている部分、あ
るいは、漢字からなる未知語であったため単漢字の読み
をつなげて読みを与えている部分に対して、そうした曖
昧性を示唆する文、例えば、「○○、あるいは、×
×」、「おそらく△△であろうが」などの文の構文構造
を挿入することによって、利用者が誤解することを避け
ることができる。さらに、韻律情報生成手段が生成する
音響パラメータを変化させることにより曖昧な部分を際
立たせることができる。
【0018】さらに、前記音声合成装置において、前記
構文解析結果変更手段が、前記部分特定規則により特定
した入力テキストの部分に、音響パラメータを変化させ
る情報を付加する機能を備え、前記韻律情報生成手段
が、前記特定部分については前記音響パラメータ変更情
報に基づいて話速または音量の音響パラメータを変化さ
せて音声出力する機能を備えることが好ましい。
【0019】かかる構成により、音響パラメータ変更情
報に基づき、特定部分の話速を遅くする、音量を大きく
する、ピッチを上げる、声質を変化させるなどができ、
聞き手が特定部分とその他の部分を容易に区別すること
が可能である。
【0020】さらに、前記音声合成装置において、利用
者を識別する利用者識別手段を有し、前記利用者識別手
段が聞き手の年齢や好みをもとにあらかじめ定められた
利用者情報を備え、前記構文解析結果変更手段が、前記
指定された利用者情報に基づいて構文解析結果の変更基
準を選択する機能を備えることが好ましい。
【0021】かかる構成により、聞き手を識別し、その
特定した個人についてあらかじめ設定、登録した言語理
解能力のタイプを構文解析結果変更手段に出力し、構文
解析結果変更手段は、その言語理解能力のタイプに応じ
て、上記の構文解析結果の変更の処理を制御でき、個人
の言語理解能力に合わせた冗長過ぎず理解しやすい音声
でテキストの内容を提示することができる。
【0022】
【実施の形態】
(実施形態1)本発明の実施形態1を図面にもとづいて
説明する。
【0023】図1は、本実施形態の音声合成出力機能を
持った音声合成装置の構成図である。101は、構文解
析部であり、入力テキストに対して形態素解析を行い、
単語列に分割し、構文解析を行うことによって、単語列
を文節列にまとめあげる。図2は、構文解析部101に
よる処理の一例を示す図である。201は入力テキスト
であり、形態素解析処理を行った後には、単語の品詞、
読み、アクセントが決定される。202は形態素解析後
の単語列であり、単語の表記と読みだけを示す。この例
では「文子」の読みが「ふみこ」と「あやこ」の2種類
あるため、読みの部分で’/’で区切って両者を示して
いる。203は、構文解析結果であり、文節ごとにまと
めた形に変換されている。
【0024】102は、語義テーブルであり、難解や単
語、あるいは、聞き取りにくい単語とその語義文を保持
する。図3は、語義テーブル102の内容の一例を示す
図である。
【0025】103は、説明文テーブルであり、構文解
析結果の読みの曖昧な部分に挿入する文のテンプレート
を保持する。図4は、説明文テーブルに保持される説明
文のテンプレートの一例を示す図である。各説明文は、
それが用いられる状況によってタイプ分けされており、
どのタイプの説明文が用いられるかは構文解析結果変更
部105が指定する。例えば、読みが複数ある場合は、
図4のテンプレートに記されている「読み2」の部分に
候補となる読みのデータを挿入する。
【0026】104は、重要部パターンテーブルであ
り、入力テキストの構文解析結果の中で、情報として重
要である部分を特定する構文の文パターンと、その文パ
ターンに合致したテキストに対して制御データを付加し
た処理内容を保持する。図5は、重要部パターンテーブ
ルに保持される内容の一例を示す図である。各文パター
ンは、構文解析結果の単語列と照合可能なデータ形式で
ある。文パターンと入力テキストの構文解析結果との照
合が成功した場合は、構文解析結果変更手段105によ
り、制御データを付加したテキストデータが得られる。
本実施形態では、得られるテキストデータには、<音量
大><話速遅>、<音量元><話速元>などの韻律情報
生成部106が解釈する音響パラメータを制御するため
のコマンド文字列が付加される。
【0027】105は、構文解析結果変更部であり、構
文解析部101から受け取った入力テキストの構文解析
結果に対して、語義テーブル102に登録されている単
語に対して語義の説明文を付加または置き換える処理、
読みが曖昧な部分を説明文テーブル103に保持されて
いる文テンプレートを用いて生成したテキストデータを
付加または置き換える処理、重要部パターンテーブル1
04に保持されている重要部の構文パターンと構文解析
結果を照合し、パターンと照合に成功した部分につい
て、その文パターンに対応する文テンプレートを付加ま
たは置き換える処理によって、入力テキストデータを変
更する処理を行う。
【0028】106は韻律情報生成部であり、構文解析
結果変更部105で変更の処理を行った構文解析結果か
ら韻律情報、音響パラメータを生成する。韻律情報生成
部106は、構文解析結果変更部105が出力する構文
解析結果に次の一対の音響パラメータを制御するコマン
ドが含まれている場合を一例として挙げると、 <話速遅>・・・<話速元> <話速遅>は以下続く「・・・」の話速を遅くするコマ
ンド、<話速元>は話速を元に戻すコマンドで、「・・
・」部分だけがゆっくりと出力される。
【0029】<音量大>・・・<音量元> <音量大>は以下続く「・・・」の音量を大きくするコ
マンド、<音量元>は音量を元に戻すコマンドで、「・
・・」部分だけが大きな音量で出力される。
【0030】107は、音響処理部であり、韻律情報生
成部106からの韻律情報、音響パラメータに従って音
声信号を合成する。
【0031】108は、利用者識別部であり、本実施形
態においては、利用者が自分を特定する信号を出力可能
なリモコン発信部108aと、リモコン発信部108a
の信号を受信するリモコン受信部108bと、リモコン
108bからの個人を特定する情報から、あらかじめ設
定した利用者の言語理解能力のタイプを決定する個人特
定部108cから構成している。利用者識別部108
は、利用者の言語理解能力タイプを構文解析結果変更部
105へ送る。
【0032】次に、以上の構成からなる本実施形態の音
声合成出力機能を持った音声合成装置の動作を動作例を
示すことにより説明する。
【0033】図6は、本実施形態の第1の動作例を示す
図である。図6において、入力テキスト601の構文解
析部101による解析結果が構文解析結果602であ
る。構文解析結果変更部105では、この構文解析結果
602と語義テーブル102に登録されている単語との
照合を行う。図3に示した語義テーブルの一例におい
て、登録されている単語301aの「((退却す
る))」が構文解析結果602の下線部分と照合するの
で、構文解析結果変更部105は、構文解析結果602
の下線部分を語義301bと置き換えることによって、
「((負けて))((その)(場)(から))((退
く))」という平易な表現に変更された構文解析結果6
03を得る。これに基づいて、韻律情報生成部106、
音響処理部107が音声を合成する。この一連の動作に
よって、「退却する」という、子供に対しては難解であ
り、他の同音異義語とまぎらわしく聞き取りにくい部分
が、「負けてその場から退く」に置き換わることによっ
て、平易かつ了解性の高い音声で入力テキストの内容を
伝えることができる。
【0034】図7は、本実施形態の第2の動作例を示す
図である。図7において、入力テキスト701の構文解
析部101による解析結果が構文解析結果702であ
る。構文解析結果変更部105は、この構文解析結果7
02の下線を付した部分に複数読みがあるので、説明文
テーブル103を参照する。説明文のタイプが「読みが
複数(401a)」の説明文テンプレートは、401b
であるので、構文解析結果変更部105は、説明文テン
プレート401bの、「(読み2)」の部分を、第2の
読みである「(文子/あやこ)」に置き換えて構文解析
結果702を構文解析結果703のように変更する。こ
れは、説明文テンプレート401bを、構文解析結果7
02の後に挿入した形になる。これ以後の、音声の合成
処理については、第1の動作例と同様である。この一連
の動作から、読みが一意に決定できなかった部分に対し
て、読み方が一意ではないことを示唆する説明文を挿入
することによって、読み方が一意に決定できない部分を
含む入力テキストの音声読み上げの際に、聞き手の誤解
を避けることができる。
【0035】図8は、本実施形態の第3の動作例を示す
図である。図8において、入力テキスト801の構文解
析結果の構文解析部101による解析結果が構文解析結
果802である。構文解析結果変更部105は、この構
文解析結果802と重要部パターンテーブル104に保
持されている文パターンとの照合を行う。構文解析結果
802は、図5の重要部パターンテーブルの文パターン
501aと照合する。文パターン501aの「(単語列
1)」には、構文解析結果802の下線部が対応するの
で、構文解析結果変更部105は、変更文テンプレート
の「(単語列1)」をその対応部分に置き換えて、構文
解析結果803を出力する。これは、構文解析結果80
2の下線部を置き換えた形になっている。これ以後の音
声の合成処理については、第1の動作例と同様である
が、繰り返し部分について、音量を音量を大きく、か
つ、話速を遅くするというコマンド文字列が挿入されて
いるので、韻律情報生成部106は音響パラメータをコ
マンド文字列の指示通りに変化させる。この一連の動作
から、入力テキスト中の情報として重要な部分について
は、繰り返して読み上げる、かつ、繰り返し部分につい
て音量、話速を変化させることによって、聞き手の注意
を向けることができ入力テキストの内容を確実に伝える
ことができる。
【0036】なお、入力テキストの重要部の部分特定規
則は上記の文パターンテーブルを用意するほか、テキス
ト中の数字、人物名、時間、場所、固有名詞、主語、動
詞などの属性から必要に応じて属性を指定して重要部を
特定する方法でもよい。
【0037】次に、本実施形態の第4の動作例について
説明する。利用者識別部108は、リモコン発信部10
8aからの信号により利用者個人を識別し、各利用者に
対してあらかじめ割り当てた「子供」、「大人」、「高
齢者」という3つの言語理解能力タイプのうち、リモコ
ンから信号を発した個人に対応する言語理解能力タイプ
を構文解析結果変更部105へ出力する。構文解析結果
変更部105はそれぞれの言語理解能力タイプに応じて
構文解析結果の変更を制御する。
【0038】図9は、構文解析結果変更部105が、各
言語理解能力タイプに対する動作の制御パターンの表で
ある。例えば言語理解能力タイプが子供の場合は、第1
の動作例において説明したように、構文解析部105
は、難意語をその語義で置き換える処理をおこなうが、
言語理解能力タイプが大人、あるいは高齢者の場合は語
義の置き換えを行わない。また、言語理解能力タイプが
高齢者の場合は、重要部の繰り返しの部分について音量
を大きくし、話速を遅くするコマンド文字列を挿入する
が、言語理解能力タイプが大人、あるいは子供の場合は
挿入しない。
【0039】図10は、3つの言語理解能力タイプそれ
ぞれに対して、同じ入力テキストがどのように音声で提
示されるかを説明する図である。入力テキスト1001
に対し、言語理解能力タイプが子供の場合、構文解析結
果変更部105は、難意語の置き換え処理、重要部の繰
り返し処理が行うが、音響パラメータを制御するコマン
ド文字列は挿入しないので、通常の音量、話速で音声1
002が出力される。言語理解能力タイプが大人の場合
は、構文解析結果変更部105は難意語の置き換え処理
を行わず、重要部の繰り返し部分についても音響パラメ
ータの制御コマンド文字列を挿入しないので、やはり通
常の音量、話速で音声1003が出力される。言語理解
能力タイプが高齢者の場合、構文解析結果変更部105
は、難意語の置き換えは行わないが、重要部の繰り返し
部分について音響パラメータの制御コマンドを挿入する
ので、繰り返し部分についてだけ大きい音量、遅い話速
で音声1004が出力される。音声1004の下線が繰
り返し部分である。このように、難解な単語を平易な表
現に置き換えて出力することで、子供の言語理解能力で
理解可能な音声提示ができる。また、子供にくらべて言
語理解能力の高い大人に対しては、冗長性がなく、かつ
重要な部分を容易に識別できる音声提示ができる。さら
に言語理解能力は大人と同じであるが、聴覚能力が大人
にくらべて弱い高齢者に対しては、繰り返し部分につい
て音量を大きくし、話速を遅くすることによって重要な
部分をより確実に識別できる音声提示が可能である。
【0040】
【発明の効果】以上のように本発明の音声合成装置によ
れば、語義の置き換えの辞書を作るのにあまりコストを
かけずに、テキスト中の難しい単語、聞き取りにくい、
あるいは、同音語が複数存在する語を、平易な表現、ま
た、識別性の高い表現を用いた音声で提示することがで
きる。また、テキスト中の読みが複数ある、未知語など
読みの不確実な部分について、聞き手に曖昧性があるこ
と伝えることができ、誤解を与えないという特徴を有す
る。また、テキストの重要な部分について音量、話速な
どを変化させて繰り返して確実に伝えることができる。
さらに、聞き手の言語理解能力、聴覚能力に応じて了解
性が高く、簡潔な音声でテキストの内容を提示できる。
【図面の簡単な説明】
【図1】本発明の実施形態1に係る音声合成装置の構成
【図2】構文解析部による構文解析処理の例を示す図
【図3】語義テーブルの内容の一例を示す図
【図4】説明文テーブルの内容の一例を示す図
【図5】重要部パターンテーブルの内容の一例を示す図
【図6】実施形態1における第1の動作例を示す図
【図7】実施形態1における第2の動作例を示す図
【図8】実施形態1における第3の動作例を示す図
【図9】実施形態1における利用者識別部が決定する言
語理解タイプの例を示す図
【図10】実施形態1における第4の動作例を示す図
【図11】従来の音声合成装置の構成を示す図
【符号の説明】
101 構文解析部 102 語義テーブル 103 説明文テーブル 104 重要部パターンテーブル 105 構文解析結果変更部 106 韻律情報生成部 107 音響処理部 108 利用者識別部 108a リモコン発信部 108b リモコン受信部 108c 個人特定部 1101 構文解析手段 1102 韻律情報生成手段 1103 音響処理手段

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 入力テキストの構文解析を行い、単語の
    読み、構文構造を含む構文解析結果を出力する構文解析
    手段と、単語とその意味の説明文からなる語義を保持す
    る語義保持手段と、入力テキストの特定の部分を識別す
    るための部分特定規則を保持する部分特定規則保持手段
    と、入力テキスト中に挿入する文テンプレートを保持す
    る文テンプレート保持手段と、前記構文解析結果にもと
    づいて、前記語義情報と前記部分特定規則と前記文テン
    プレート情報とを用いて入力テキスト文の構文解析結果
    を変更する構文解析結果変更手段と、前記構文解析結果
    に基づいて、発音およびアクセントを含む韻律情報と話
    速および音量を含む音響パラメータとを生成する韻律情
    報生成手段と、前記韻律情報生成手段からの韻律情報に
    基づいて音声信号を合成する音響処理手段とを備えるこ
    とを特徴とする音声合成装置。
  2. 【請求項2】 前記部分特定規則が、意味が難解である
    テキスト部分または発音が聞き取りにくいテキスト部分
    を特定する規則を備え、前記構文解析結果変更手段が、
    前記部分特定規則を用いて特定した入力テキストの単語
    に対して、前記語義保持手段が保持している語義から対
    応する語義の説明文に置換する機能を備えた請求項1に
    記載の音声合成装置。
  3. 【請求項3】 前記構文解析結果変更手段が、前記部分
    特定規則により特定した入力テキストの部分を複数回繰
    り返し出力する変更を行なう機能を備えた請求項1に記
    載の音声合成装置。
  4. 【請求項4】 前記部分特定規則が、構文解析結果の中
    でテキストの読みまたは意味が一意に決定できない曖昧
    さがある箇所を特定する規則を備え、前記構文解析結果
    変更手段が、前記部分特定規則により特定した入力テキ
    ストの部分に対して、前記文テンプレート保持手段が保
    持している文テンプレートをもとに生成した複数の解釈
    の可能性を示唆するテキスト情報を付加する機能を備え
    た請求項1に記載の音声合成装置。
  5. 【請求項5】 前記構文解析結果変更手段が、前記部分
    特定規則により特定した入力テキストの部分に、音響パ
    ラメータを変化させる情報を付加する機能を備え、前記
    韻律情報生成手段が、前記特定部分については前記音響
    パラメータ変更情報に基づいて話速または音量の音響パ
    ラメータを変化させて音声出力する機能を備えた請求項
    1に記載の音声合成装置。
  6. 【請求項6】 利用者を識別する利用者識別手段を有
    し、前記利用者識別手段が聞き手の年齢や好みをもとに
    あらかじめ定められた利用者情報を備え、前記構文解析
    結果変更手段が、前記指定された利用者情報に基づいて
    構文解析結果の変更基準を選択する機能を備えた請求項
    1に記載の音声合成装置。
JP8331817A 1996-12-12 1996-12-12 音声合成装置 Pending JPH10171485A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8331817A JPH10171485A (ja) 1996-12-12 1996-12-12 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8331817A JPH10171485A (ja) 1996-12-12 1996-12-12 音声合成装置

Publications (1)

Publication Number Publication Date
JPH10171485A true JPH10171485A (ja) 1998-06-26

Family

ID=18247984

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8331817A Pending JPH10171485A (ja) 1996-12-12 1996-12-12 音声合成装置

Country Status (1)

Country Link
JP (1) JPH10171485A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172289A (ja) * 1998-12-02 2000-06-23 Matsushita Electric Ind Co Ltd 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
US6845358B2 (en) * 2001-01-05 2005-01-18 Matsushita Electric Industrial Co., Ltd. Prosody template matching for text-to-speech systems
JP2005208421A (ja) * 2004-01-23 2005-08-04 Aisin Aw Co Ltd 文章読み上げシステム及び方法
JP2005250010A (ja) * 2004-03-03 2005-09-15 Denso It Laboratory Inc 音声データ出力装置及び音声データ出力制御装置並びに音声データ出力制御システム
US7353175B2 (en) 2002-03-07 2008-04-01 Canon Kabushiki Kaisha Apparatus, method, and program for speech synthesis with capability of providing word meaning immediately upon request by a user
WO2008062529A1 (fr) * 2006-11-24 2008-05-29 Fujitsu Limited Dispositif de lecture de phrase, procédé de commande de dispositif de lecture de phrase et programme de commande du dispositif de lecture de phrase
JP2010175717A (ja) * 2009-01-28 2010-08-12 Mitsubishi Electric Corp 音声合成装置
JP2017032996A (ja) * 2015-08-05 2017-02-09 富士通株式会社 適応的な電子的リーディング支援の提供

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172289A (ja) * 1998-12-02 2000-06-23 Matsushita Electric Ind Co Ltd 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
US6845358B2 (en) * 2001-01-05 2005-01-18 Matsushita Electric Industrial Co., Ltd. Prosody template matching for text-to-speech systems
US7353175B2 (en) 2002-03-07 2008-04-01 Canon Kabushiki Kaisha Apparatus, method, and program for speech synthesis with capability of providing word meaning immediately upon request by a user
JP2005208421A (ja) * 2004-01-23 2005-08-04 Aisin Aw Co Ltd 文章読み上げシステム及び方法
JP4539097B2 (ja) * 2004-01-23 2010-09-08 アイシン・エィ・ダブリュ株式会社 文章読み上げシステム及び方法
JP2005250010A (ja) * 2004-03-03 2005-09-15 Denso It Laboratory Inc 音声データ出力装置及び音声データ出力制御装置並びに音声データ出力制御システム
WO2008062529A1 (fr) * 2006-11-24 2008-05-29 Fujitsu Limited Dispositif de lecture de phrase, procédé de commande de dispositif de lecture de phrase et programme de commande du dispositif de lecture de phrase
US8315873B2 (en) 2006-11-24 2012-11-20 Fujitsu Limited Sentence reading aloud apparatus, control method for controlling the same, and control program for controlling the same
JP2010175717A (ja) * 2009-01-28 2010-08-12 Mitsubishi Electric Corp 音声合成装置
JP2017032996A (ja) * 2015-08-05 2017-02-09 富士通株式会社 適応的な電子的リーディング支援の提供

Similar Documents

Publication Publication Date Title
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
US6879957B1 (en) Method for producing a speech rendition of text from diphone sounds
US6823309B1 (en) Speech synthesizing system and method for modifying prosody based on match to database
JP4745036B2 (ja) 音声翻訳装置および音声翻訳方法
WO2006008871A1 (ja) 音声合成装置
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
JPH0335296A (ja) テキスト音声合成装置
JP2009139677A (ja) 音声処理装置及びそのプログラム
JP3270356B2 (ja) 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体
JPH10171485A (ja) 音声合成装置
JP2007264284A (ja) 感情付加装置、感情付加方法及び感情付加プログラム
AU769036B2 (en) Device and method for digital voice processing
Mertens et al. FONILEX manual
KR100279741B1 (ko) 하이퍼텍스트 마크업 언어 요소를 이용한 텍스트/음성변환기의동작 제어방법
JP2002132282A (ja) 電子テキスト読み上げ装置
JPH08335096A (ja) テキスト音声合成装置
JP4409279B2 (ja) 音声合成装置及び音声合成プログラム
Sen et al. Indian accent text-to-speech system for web browsing
JP3366253B2 (ja) 音声合成装置
Pavešić et al. Homer II—man–machine interface to internet for blind and visually impaired people
WO2023047623A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
KR0173340B1 (ko) 텍스트/음성변환기에서 억양패턴 정규화와 신경망 학습을 이용한 억양 생성 방법
Kaur et al. BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE
JPH054676B2 (ja)
Tatham et al. Speech synthesis in dialogue systems

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040614

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041013