JP2003150182A - 音声合成装置、音声合成装置の制御方法、音声合成制御プログラム及び記録媒体 - Google Patents

音声合成装置、音声合成装置の制御方法、音声合成制御プログラム及び記録媒体

Info

Publication number
JP2003150182A
JP2003150182A JP2001347980A JP2001347980A JP2003150182A JP 2003150182 A JP2003150182 A JP 2003150182A JP 2001347980 A JP2001347980 A JP 2001347980A JP 2001347980 A JP2001347980 A JP 2001347980A JP 2003150182 A JP2003150182 A JP 2003150182A
Authority
JP
Japan
Prior art keywords
sentence
reading
voice
document
speech synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001347980A
Other languages
English (en)
Inventor
Masashi Aiiso
政司 相磯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2001347980A priority Critical patent/JP2003150182A/ja
Publication of JP2003150182A publication Critical patent/JP2003150182A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 表示装置の無いような環境においても、文書
内容を容易に把握でき、文書中の所望の部分を容易に指
定して音声読み上げを行わせる。 【解決手段】 外部からの指示に基づいて原文あるいは
要約文(または翻訳文)のいずれか一方を読み上げ対象
文として選択し、読み上げ対象文における読み上げ位置
および対応する非読み上げ対象文内の読み上げ相当位置
を相互に入れ替え可能に制御して、読み上げ位置に基づ
いて読み上げ対象文の音声読み上げを行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声合成装置、音
声合成装置の制御方法、音声合成制御プログラム及び記
録媒体に関する。
【0002】
【従来の技術】従来よりテキストデータを音声合成を行
って音声により読み上げる音声読み上げ装置が知られて
いる。このような音声読み上げ装置において、文書の中
の一部分を読み上げる場合に、文書を表示装置に表示し
て、ユーザが読み上げ対象とする部分を選択し指定すれ
ば、当該ユーザの興味のある(あるいは当該ユーザの望
む)部分のみの読み上げを行わせることが可能であっ
た。
【0003】ところで、ユーザが視覚障害者であるよう
な場合や、電話機などの表示装置の無いような環境にお
いて通信回線を介して接続されている音声読み上げ装置
を用いて読み上げを行わせる場合には、上述したような
手順を採ることは困難であった。そこで、このように表
示装置の無い環境で文書のうち、所望の部分を読み上げ
させるための技術として、例えば、特開2000−99
072に記載された技術においては、文書を読み上げる
に先立って、当該読み上げ対象の文書の概要または要約
を提示(音声読み上げ)することによって、聞き手はこ
れをもとにこの文書に対する音声読み上げを聞くか否か
を判断する。
【0004】これによって当該ユーザにとって全く興味
の無い(望まない)文書の読み上げを聞くことを避ける
ようにすることとなっていた。また、特開平11−16
7398には、文章を複数の部分に区切り、それぞれの
部分の内容を把握させるための文字情報を作成して読み
上げることにより、スキップキー等の操作をせずに、内
容を短時間で把握することができる技術が開示されてい
る。
【0005】
【発明が解決しようとする課題】上記特開2000−9
9072に記載された技術によれば、読み上げ対象の文
書の概要または要約を提示させることにより、全く興味
のない文書については、読み上げ対象から除くことがで
きる。しかしながら、ユーザが読み上げを行わせたい文
書であっても、興味の対象である部分が一部分である場
合もある。このような場合でも特開2000−9907
2に記載された技術によれば、実際に興味の対象である
部分に至るまで音声読み上げを聞き続けなければなら
ず、手間が煩わしいという問題点があった。
【0006】上記特開平11−167398記載の技術
においては、文章の複数の部分についてその内容を把握
するために文字情報を作成しているが、一定の条件で抽
出された代表分野、キーワード、自動で生成した要約文
などによって実際の内容を把握することは困難であり、
やはり原文の音声読み上げを行わせることがより確実で
あり、全てを短時間の内容にまとめてしまうのでは、内
容を把握するのが困難になるという問題点があった。そ
こで、本発明の目的は、表示装置の無いような環境にお
いても、文書内容を容易に把握でき、文書中の所望の部
分を容易に指定して音声読み上げを行わせることが可能
な音声合成装置、音声合成装置の制御方法、音声合成制
御プログラム及び記録媒体を提供することにある。
【0007】
【課題を解決するための手段】上記課題を解決するた
め、外部からの指示に基づいて第1の文あるいは前記第
1の文に対応づけて生成された第2の文のいずれか一方
を読み上げ対象文として選択する読み上げ文書選択部
と、前記選択に基づいて、前記読み上げ対象文における
読み上げ位置および対応する非読み上げ対象文内の読み
上げ相当位置を相互に入れ替え可能に制御する読み上げ
位置制御部と、前記読み上げ位置に基づいて前記読み上
げ対象文の音声読み上げを行う音声読み上げ部と、を備
えたことを特徴としている。上記構成によれば、読み上
げ文書選択部は、外部からの指示に基づいて第1の文あ
るいは前記第1の文に対応づけて生成された第2の文の
いずれか一方を読み上げ対象文として選択する。読み上
げ位置制御部は、読み上げ文書選択部による選択に基づ
いて、読み上げ対象文における読み上げ位置および対応
する非読み上げ対象文内の読み上げ相当位置を相互に入
れ替え可能に制御する。そして音声読み上げ部は、読み
上げ位置に基づいて読み上げ対象文の音声読み上げを行
うこととなる。
【0008】この場合において、前記第2の文は前記第
1の文の要約文であるようにしてもよい。また、前記第
2の文は前記第1の文の翻訳文であるようにしてもよ
い。さらに文書の内容を解析して複数の前記第1の文と
する文書分割部と、前記第1の文に対応する前記第2の
文を生成する対応文書生成部と、を備えるようにしても
よい。さらにまた、前記対応文書生成部は、前記第1の
文を要約した文を前記第2の文として生成するようにし
てもよい。
【0009】また、前記対応文書生成部は、一つの前記
第1の文に対し、要約率の異なる複数の前記第2の文を
生成するようにしてもよい。さらに前記外部からの指示
は、所望の要約率の前記第2の文書の指定を含むように
してもよい。さらにまた、前記対応文書生成部は、前記
第1の文を翻訳した文を前記第2の文として生成するよ
うにしてもよい。
【0010】また、外部からの指示に基づいて第1の文
あるいは前記第1の文に対応づけて生成された第2の文
のいずれか一方を読み上げ対象文として選択する読み上
げ文書選択過程と、前記選択に基づいて、前記読み上げ
対象文における読み上げ位置および対応する非読み上げ
対象文内の読み上げ相当位置を相互に入れ替え可能に制
御する読み上げ位置制御過程と、前記読み上げ位置に基
づいて前記読み上げ対象文の音声読み上げを行う音声読
み上げ過程と、を備えたことを特徴としている。この場
合において、文書の内容を解析して複数の前記第1の文
とする文書分割過程と、前記第1の文に対応する前記第
2の文を生成する対応文書生成過程と、を備えるように
してもよい。
【0011】また、前記対応文書生成過程は、前記第1
の文を要約した文を前記第2の文として生成するように
してもよい。さらに、前記対応文書生成過程は、前記第
1の文を翻訳した文を前記第2の文として生成するよう
にしてもよい。また、コンピュータを音声合成装置とし
て機能させるための音声合成制御プログラムであって、
外部からの指示に基づいて第1の文あるいは前記第1の
文に対応づけて生成された第2の文のいずれか一方を読
み上げ対象文として選択させ、前記選択に基づいて、前
記読み上げ対象文における読み上げ位置および対応する
非読み上げ対象文内の読み上げ相当位置を相互に入れ替
え可能に制御させ、前記読み上げ位置に基づいて前記読
み上げ対象文の音声読み上げを行わせる、ことを特徴と
している。
【0012】この場合において、文書の内容を解析して
複数の前記第1の文とさせ、前記第1の文に対応する前
記第2の文を生成させるようにしてもよい。また、前記
第1の文を要約した文を前記第2の文として生成させる
ようにしてもよい。さらに、前記第1の文を翻訳した文
を前記第2の文として生成させるようにしてもよい。ま
た、上記各音声合成制御プログラムを記録媒体に記録す
るようにしてもよい。
【0013】
【発明の実施の形態】次に本発明の好適な実施の形態に
ついて図面を参照して説明する。 [1]第1実施形態 [1.1]第1実施形態の構成 図1は実施形態の音声合成システムの概要構成ブロック
図である。以下の説明においては、ユーザが携帯電話端
末を介して、音声合成装置に文書読み上げを行わせる場
合を例として説明する。音声合成システム10は、大別
すると、携帯電話端末11と、無線基地局12と、一般
公衆ネットワーク網13と、音声合成装置14と、を備
えている。携帯電話端末11は、無線基地局12および
一般公衆ネットワーク網13を介して文書読み上げ装置
14に接続するための無線通信機能および各種操作端末
として機能する。無線基地局12は、携帯電話端末11
と一般公衆ネットワーク網13との間の通信制御を行
う。一般公衆ネットワーク網13は、一般公衆回線網お
よびインターネットを含んでいる。音声合成装置14
は、携帯電話端末11を介したユーザの指示に基づいて
指定された文書あるいは文書の一部について音声合成に
より音声読み上げを行う。ここで、音声合成装置14に
ついて詳細に説明する。
【0014】[1.2]音声合成装置の概要構成 図2は音声合成装置14の装置概要構成図である。音声
合成装置14は、一般的なコンピュータシステムと同様
の構成をとっており、大別すると、音声合成装置本体2
1、データ入力部22、ディスプレイ部23、外部記憶
装置24および通信インタフェース部25を備えてい
る。 [1.2.1]音声合成装置本体の概要構成 図3は音声合成装置本体の概要構成ブロック図である。
音声合成装置本体21は、MPU31、ROM32、R
AM33および外部記憶装置34を備えて構成されてい
る。MPU31は、RAM33の記憶領域をワークエリ
アとしつつROM32に格納された制御プログラムおよ
び外部記憶装置24に格納された文書読み上げアプリケ
ーションプログラム(音声読み上げ制御プログラムとし
て機能)に基づいて当該音声合成装置本体21を制御す
る。ROM32は、制御プログラムなどの各種不揮発性
データを格納している。RAM33は、MPU31のワ
ーキングエリアとして用いられ、アプリケーションプロ
グラムおよび各種データを一時的に格納する。
【0015】外部記憶装置34は、ハードディスクなど
で構成され、後述するカテゴリ定義データベース、読み
上げ設定定義データベース、形態素解析用辞書、音韻辞
書、波形辞書などの各種データベースや、文書読み上げ
アプリケーションプログラム等を格納している。そして
これらの、MPU31、ROM32、RAM33および
外部記憶装置34はバス25を介して相互に接続されて
いる。データ入力部22は、キーボード、マウス、タブ
レットなどを備え、文書データを含む各種データを入力
する。ディスプレイ部23は、音声合成装置本体21の
制御下で各種データを表示する。外部記憶装置24は、
通信インターフェース部25は、LAN、アナログ電
話回線ネットワーク、ISDN回線、ADSLなどのデ
ジタル電話回線ネットワーク、光ファイバ回線ネットワ
ークなど各種ネットワークとの間のインターフェース機
能を提供するとともに、文書読み上げ装置本体11から
出力される音声データに基づいて実際の音声出力を行う
音声出力装置としての機能をするなどの各種出力処理を
行う。
【0016】[1.3]音声合成装置の機能 図4は音声合成装置の機能ブロック図である。音声合成
装置14は、機能的に見ると、大別して、ユーザ入力部
41、文書選択部42、文書分割部43、対応文書生成
部44、読み上げ文書選択部45、読み上げ位置制御部
46、モード切替制御部47、言語処理部48、音響処
理部49および音声出力部50を備えている。ユーザ入
力部41は、ユーザインターフェースを実現する機能部
分である。文書選択部42は、ユーザ入力部41を介し
て入力されたユーザの所望する文書のデータを選択する
機能を有している。文書分割部43は、選択された文書
を形態素解析、意味解析あるいは構文解析を用いてそれ
ぞれがひとかたまりの意味を有する複数の文(分割文)
に分割する機能を有している。
【0017】対応文書生成部44は、分割文のそれぞれ
に対する要約文を対応文として生成する機能を有してい
る。読み上げ文書選択部45は、モード制御切替部47
の制御の下で、実際に読み上げるべき分割文あるいは対
応文を選択する機能を有している。読み上げ位置制御部
46は、読み上げ文書選択部45により選択された文内
の実際に読み上げるべき位置を管理し、制御する機能を
有している。モード切替制御部47は、ユーザ入力部4
1を介して入力されるユーザの指示に基づいて読み上げ
文書選択部45に文を選択させ、あるいは、読み上げ位
置制御部46に読み上げ位置を制御させる。言語処理部
48および音響処理部49は、音声合成部51として機
能し、文書選択部45により選択され、読み上げ位置制
御部46により制御されている読み上げ位置に対応する
音素に基づいて音声合成を行う。音声出力部50は、音
声合成部51の音声合成結果をスピーカあるいは通信イ
ンタフェース部25を介して接続された携帯電話端末1
1上で再生する機能を有している。
【0018】[1.4]音声合成システムの動作 次に音声合成システム10の動作について図5の処理フ
ローチャートを参照して説明する。音声合成装置14の
データ入力部22は、ユーザ入力部41として機能し、
処理対象の文書についてのユーザの指示を受け付ける。
この結果、音声合成装置本体21は、文書選択部42と
して機能し、読み上げ対象の文書を外部記憶装置24内
の図示しないデータベースあるいはデータ入力部22を
介して取得する(ステップS1)。次に音声合成装置本
体21は、デフォルトの要約率の設定を行う(ステップ
S2)。例えば、要約率60[%]とすると、原文が1
00語の文章である場合に、60語程度の文章とするこ
とをいう。したがって、以下の説明においては、要約率
100[%]とは、要約を行わない原文をいうものとす
る。
【0019】次に音声合成装置本体21は、読み上げ対
象の文書を複数の分割文に分割する処理を行う(ステッ
プS3)。具体的には、形態素解析、意味解析、構文解
析などを行って、意味的に一つの固まりとなる文章、あ
るいは、文章構成上一つの固まりとなる文章を分割文と
して生成することとなる。次に音声合成装置本体21
は、要約率が100[%]か否か、すなわち、要約率に
相当する要約文を作成する必要があるか否かを判別する
(ステップS4)。ステップS4の判別において、要約
文の作成が必要である場合には(ステップS4;要約率
<100[%])、音声合成装置本体21は、分割文か
ら要約文を作成し(ステップS5)、当該要約文を読み
上げ対象文章として処理をステップS6に移行する。こ
の場合において、要約文の作成手法としては、形態素解
析の結果を利用して、各文章から重要語(例えば、TF
IDF値の高い語)を抽出し、当該重要語が多く含まれ
ている文をつなぎ合わせて要約文とする。
【0020】ステップS4の判別において要約文の作成
が不要である場合には(ステップS4;要約率=100
[%])、音声合成装置本体21は、取得した文章を読
み上げ対象文章として、読み上げ対象文章の音韻処理を
行う(ステップS6)。次に音声合成装置本体21は、
読み上げ対象文章の韻律処理を行う(ステップS7)。
次にユーザにより、要約率設定変更(例えば、要約率6
0[%]から50[%]に変更)する操作入力がなされ
たか否かを判別する(ステップS8)。ステップS8の
判別においてユーザによる操作入力がなされた場合には
(ステップS8;あり)、入力状態を判別する(ステッ
プS13)。そして音声合成装置本体21は、入力状態
に基づいた要約率設定の変更を行い(ステップS1
4)、処理をステップS4に移行し同様の処理を繰り返
すこととなる。
【0021】この結果、これ以降新たな要約率で要約文
が生成されることとなる。ステップS8の判別におい
て、ユーザによる操作入力がなされなかった場合には
(ステップS8;なし)、音声合成装置本体21は、読
み上げ対象文章における次の音素(初期状態において
は、最初の音素)を読み出し(ステップS9)、読み出
した音素に対応する波形処理を行って読み上げを行う
(ステップS10)。続いて当該読み上げ対象文章に次
の音素があるか否かを判別する(ステップS11)。ス
テップS11の判別において、当該読み上げ対象文章に
次の音素がある場合には(ステップS11;あり)、処
理をステップS8に移行し、同様の処理を繰り返すこと
となる。この結果、読み上げ対象文章が順次読み上げら
れることとなる。
【0022】ステップS11の判別において、当該読み
上げ対象文章に次の音素がない場合には(ステップS1
1;なし)、音声合成装置本体21は、既に読み上げ対
象の文(分割文)の読み上げは完了していると判別し、
処理をステップS12に移行する。次に音声合成装置本
体21は、次の分割文があるか否かを判別する(ステッ
プS12)。ステップS12の判別において、次の分割
文がある場合には(ステップS12;あり)、処理を再
びステップS4に移行し、同様の処理を繰り返して、分
割文から対応する要約文を生成して、音声読み上げを行
うこととなる。
【0023】[1.5]具体的な読み上げ処理 次に具体的な読み上げ処理を説明する。図6に示すよう
な、階層化された見出しと本文からなる構造化文書にお
いて、見出し語とに要約して読み上げる方法を説明す
る。本実施形態の音声合成システム10は、携帯電話端
末11において、キーまたは音声によるコマンドによっ
てユーザが制御することが可能となっている。この読み
上げ処理でユーザが用いるコマンドとしては、最も単純
には、ユーザが指定した文書を分割して複数の分割文と
し、各分割文の要約を読み上げさせるための「読み上げ
開始コマンド」と、指定された分割文(第1の文;非要
約状態の原文)あるいは、当該分割文に対応する要約文
(第2の文)のいずれかを選択して読み上げさせるため
の「読み上げモード切替コマンド」との二つが挙げられ
る。以下、説明の簡略化のため、これらの二つのコマン
ドを利用して読み上げを行わせる場合の方法について説
明する。
【0024】読み上げ対象文書D1は、大別すると見出
しT1に対応する文章および見出しT2に対応する文章
の2系統の文章を備えている。音声合成システム10に
おいては、ユーザが携帯電話端末11を介して、読み上
げ対象文書D1を読み上げさせるべく「読み上げ開始コ
マンド」を音声合成装置14に対して送出する。これに
より音声合成システム10の音声合成装置14は、読み
上げ対象文書D1を要約に最適な単位となる文のまとま
りに分割して、分割文を生成する。本具体例において
は、本文に付帯する見出しを検出し、それぞれ見出しに
対応する複数の分割文(見出しT1の本文、見出しT
1.1の本文、見出しT1.2.1の本文、見出しT
1.2.2の本文、見出しT2の本文、見出しT2.1
の本文、見出しT2.2.1の本文)を抽出し、生成す
る。
【0025】次に音声合成装置14は、この分割された
文の要約文を作成する。内容による要約の方法として
は、例えば、「奥村学、難波英嗣、テキスト自動要約に
関する研究動向、自然言語処理vol.6,N0.6(199
9)」などにまとめられている方法を用いればよい。な
お、文書の分割方法は、構造文書であれば、見出し毎に
分割するのが容易でわかりやすい。これらの技術を元に
要約した結果が例えば、図7に示すようになったとす
る。ところで、音声合成装置14における読み上げモー
ドとしては、要約文読み上げモードと原文読み上げモー
ドの2種類の読み上げモードがある。そして、例えば、
デフォルトの状態においては、要約文読み上げモードが
設定され、要約文が順に読み上げられるように設定され
ているものとする。携帯電話端末装置11のユーザが要
約文読み上げモードにおいて、「読み上げモード切替コ
マンド」を音声合成装置14に送ると、現在読み上げら
れている要約文の要約元となった部分に相当する原文が
読み上げられる。
【0026】例えば、図7中、部分C1の文が読み上げ
られている間に原文を読み上げさせるべく、「読み上げ
モード切替コマンド」を送ると、要約文読み上げモード
から原文読み上げモードに移行する。そして、部分C1
に対応する原文の部分C2から読み上げが続けられる。
逆に原文読み上げモードにおいて、原文の部分C3が読
み上げられている最中に「読み上げモード切替コマン
ド」を送ると、要約文読み上げモードに移行し、対応す
る要約文C4が読み上げられることとなる。以上の説明
のように、読み飛ばしたい部分は、要約文を読み上げさ
せ、興味のある部分については原文を読み上げさせるこ
とで、表示装置の無いような環境においても、文章全体
の把握と、興味の対象部分の読み上げとを迅速かつ容易
に行わせることができる。
【0027】[2]実施形態の変形例 [2.1]第1変形例 以上の説明においては、要約文と原文との間で読み上げ
を切り換えていたが、翻訳文と原文との間で読み上げを
切り換えるように構成することも可能である。より具体
的には、原文が英語文、翻訳文が日本語文である場合に
ついて説明する。まず、読み上げに先立って、原文の英
語文を翻訳アプリケーションを用いて自動的に日本語文
の翻訳文とする。この場合に、原文と対応する翻訳文と
は、対応付けがなされているものとする。ユーザにより
指定がなされていない初期状態においては、原文である
英語文が読み上げられることとなる。
【0028】その後、英語文が読み上げられている状態
で、ユーザにより読み上げモード切替コマンド(言語切
替コマンドとして機能)が入力されると、自動翻訳され
た日本語文(翻訳文)が読み上げられることとなる。ま
た、日本語文(翻訳文)が読み上げられている状態で、
ユーザにより再び読み上げモード切替コマンド(言語切
替コマンドとして機能)が入力されると、原文である英
語文が読み上げられることとなる。この場合において、
さらに日本語文に対して要約文を生成し、 英語文(原文)←→日本語文(翻訳文)←→日本語文
(翻訳文の要約文) というように、三者の間で相互に読み上げを切り換える
ようにすることも可能である。さらに英語文においても
要約文を生成すれば、四者間で相互に読み上げを切り換
えるようにすることも可能である。
【0029】[2.2]第2変形例 以上の説明においては、要約文(あるいは翻訳文)と原
文とを区別して読み上げるものとはしていなかったが、
例えば、要約文(あるいは翻訳文)は女声で読み上げ、
原文は男声で読み上げるようにすれば、要約文と原文と
を明確に区別することができる。
【0030】[2.3]第3変形例 以上の説明においては、見出し−本文形式の文書を例と
して説明したが、タイトル、表、箇条書きなど様々な構
造を持つようなHTMLなどの一般の構造化文書に対し
ても同様に適用が可能である。
【0031】[2.4]第4変形例 以上の説明においては、文書分割機能(文書分割部4
3)および対応文生成機能(対応文書生成部44)の機
能を音声合成システムに持たせていたが、これらの機能
は予め人手により行っておくようにしてもよい。
【0032】[2.5]第5変形例 以上の説明においては、コンピュータシステムを文書読
み上げ装置として機能させるためのプログラムを外部記
憶装置に予め格納してRAM等に展開して実施する場合
について説明したが、これらのプログラムを光ディスク
などのリムーバブル記録媒体に記録して、インストール
するようにしたり、ネットワークを介してダウンロード
し、インストールするように構成することも可能であ
る。ダウンロードを行う場合には、実行のたびにダウン
ロードするようにすることも可能である。
【0033】[3]実施形態の効果 以上の説明のように本実施形態によれば、要約文と原文
との間で読み上げ切替を行う場合には、原文の全てを読
み上げさせて聞く必要が無く、短時間で文書の概要を把
握することができる。また、要約文も原文を分割するこ
とにより複数生成するので、興味のある部分を探し出し
たい場合でも容易に探し出すことができる。換言すれ
ば、じっくり読みたい箇所と手早く読み流したい場所を
表示装置の無いような環境においても自在に選んで読ま
せることができる。
【0034】一方、翻訳文と原文との間で読み上げ切替
を行う場合には、自動翻訳の翻訳精度があまり高くない
場合であっても、対応する原文との間で聞き比べること
が容易にでき、内容把握を容易に行える。
【0035】
【発明の効果】本発明によれば、第2の文(要約文ある
いは翻訳文)と第1の文(原文)との間で読み上げ切替
を行う場合には、原文の全てを読み上げさせて聞く必要
が無く、短時間で文書の概要を把握することができる。
また、第2の文(要約文あるいは翻訳文)も第1の文
(原文)を分割することにより複数分割文として生成す
るので、興味のある部分を探し出したい場合でも容易に
探し出すことができる。換言すれば、じっくり読みたい
箇所と手早く読み流したい場所を表示装置の無いような
環境においても自在に選んで読ませることができる。ま
た、第2の文を翻訳文とし、第1の文である原文との間
で読み上げ切替を行う場合には、自動翻訳の翻訳精度が
あまり高くない場合であっても、対応する原文との間で
聞き比べることが容易にでき、内容把握を容易に行え
る。
【図面の簡単な説明】
【図1】実施形態の音声合成システムの概要構成ブロッ
ク図である。
【図2】音声合成装置の概要構成ブロック図である。
【図3】音声合成装置本体の概要構成ブロック図であ
る。
【図4】音声合成システムの機能構成ブロック図であ
る。
【図5】音声合成システムの動作処理フローチャートで
ある。
【図6】原文(第1の文)の具体的説明図である。
【図7】要約文(第2の文)の具体的説明図である。
【符号の説明】
10……音声合成システム 11……携帯電話端末 12……無線基地局 13……一般公衆ネットワーク網 14……音声合成装置 21……音声合成装置本体 22……データ入力部 23……ディスプレイ部 24……外部記憶装置 25……通信インタフェース部 41……ユーザ入力部 42……文書選択部 43……文書分割部 44……対応文書生成部 45……読み上げ文書選択部 46……読み上げ位置制御部 47……モード切替制御部 48……言語処理部 49……音響処理部 50……音声出力部

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 外部からの指示に基づいて第1の文ある
    いは前記第1の文に対応づけて生成された第2の文のい
    ずれか一方を読み上げ対象文として選択する読み上げ文
    書選択部と、 前記選択に基づいて、前記読み上げ対象文における読み
    上げ位置および対応する非読み上げ対象文内の読み上げ
    相当位置を相互に入れ替え可能に制御する読み上げ位置
    制御部と、 前記読み上げ位置に基づいて前記読み上げ対象文の音声
    読み上げを行う音声読み上げ部と、 を備えたことを特徴とする音声合成装置。
  2. 【請求項2】 請求項1記載の音声合成装置において、 前記第2の文は前記第1の文の要約文であることを特徴
    とする音声合成装置。
  3. 【請求項3】 請求項1記載の音声合成装置において、 前記第2の文は前記第1の文の翻訳文であることを特徴
    とする音声合成装置。
  4. 【請求項4】 請求項1記載の音声合成装置において、 文書の内容を解析して複数の前記第1の文とする文書分
    割部と、 前記第1の文に対応する前記第2の文を生成する対応文
    書生成部と、 を備えたことを特徴とする音声合成装置。
  5. 【請求項5】 請求項4記載の音声合成装置において、 前記対応文書生成部は、前記第1の文を要約した文を前
    記第2の文として生成することを特徴とする音声合成装
    置。
  6. 【請求項6】 請求項5記載の音声合成装置において、 前記対応文書生成部は、一つの前記第1の文に対し、要
    約率の異なる複数の前記第2の文を生成することを特徴
    とする音声合成装置。
  7. 【請求項7】 請求項6記載の音声合成装置において、 前記外部からの指示は、所望の要約率の前記第2の文書
    の指定を含むことを特徴とする音声合成装置。
  8. 【請求項8】 請求項4記載の音声合成装置において、 前記対応文書生成部は、前記第1の文を翻訳した文を前
    記第2の文として生成することを特徴とする音声合成装
    置。
  9. 【請求項9】 外部からの指示に基づいて第1の文ある
    いは前記第1の文に対応づけて生成された第2の文のい
    ずれか一方を読み上げ対象文として選択する読み上げ文
    書選択過程と、 前記選択に基づいて、前記読み上げ対象文における読み
    上げ位置および対応する非読み上げ対象文内の読み上げ
    相当位置を相互に入れ替え可能に制御する読み上げ位置
    制御過程と、 前記読み上げ位置に基づいて前記読み上げ対象文の音声
    読み上げを行う音声読み上げ過程と、 を備えたことを特徴とする音声合成装置の制御方法。
  10. 【請求項10】 請求項9記載の音声合成装置の制御方
    法において、 文書の内容を解析して複数の前記第1の文とする文書分
    割過程と、 前記第1の文に対応する前記第2の文を生成する対応文
    書生成過程と、 を備えたことを特徴とする音声合成装置の制御方法。
  11. 【請求項11】 請求項10記載の音声合成装置の制御
    方法において、 前記対応文書生成過程は、前記第1の文を要約した文を
    前記第2の文として生成することを特徴とする音声合成
    装置の制御方法。
  12. 【請求項12】 請求項10記載の音声合成装置の制御
    方法において、 前記対応文書生成過程は、前記第1の文を翻訳した文を
    前記第2の文として生成することを特徴とする音声合成
    装置の制御方法。
  13. 【請求項13】 コンピュータを音声合成装置として機
    能させるための音声合成制御プログラムであって、 外部からの指示に基づいて第1の文あるいは前記第1の
    文に対応づけて生成された第2の文のいずれか一方を読
    み上げ対象文として選択させ、 前記選択に基づいて、前記読み上げ対象文における読み
    上げ位置および対応する非読み上げ対象文内の読み上げ
    相当位置を相互に入れ替え可能に制御させ、 前記読み上げ位置に基づいて前記読み上げ対象文の音声
    読み上げを行わせる、ことを特徴とする音声合成制御プ
    ログラム。
  14. 【請求項14】 請求項13記載の音声合成制御プログ
    ラムにおいて、 文書の内容を解析して複数の前記第1の文とさせ、 前記第1の文に対応する前記第2の文を生成させる、 ことを特徴とする音声合成制御プログラム。
  15. 【請求項15】 請求項14記載の音声合成制御プログ
    ラムにおいて、 前記第1の文を要約した文を前記第2の文として生成さ
    せることを特徴とする音声合成制御プログラム。
  16. 【請求項16】 請求項14記載の音声合成制御プログ
    ラムにおいて、 前記第1の文を翻訳した文を前記第2の文として生成さ
    せることを特徴とする音声合成制御プログラム。
  17. 【請求項17】 請求項13ないし請求項16のいずれ
    かに記載の音声合成制御プログラムを記録したことを特
    徴とする記録媒体。
JP2001347980A 2001-11-13 2001-11-13 音声合成装置、音声合成装置の制御方法、音声合成制御プログラム及び記録媒体 Pending JP2003150182A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001347980A JP2003150182A (ja) 2001-11-13 2001-11-13 音声合成装置、音声合成装置の制御方法、音声合成制御プログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001347980A JP2003150182A (ja) 2001-11-13 2001-11-13 音声合成装置、音声合成装置の制御方法、音声合成制御プログラム及び記録媒体

Publications (1)

Publication Number Publication Date
JP2003150182A true JP2003150182A (ja) 2003-05-23

Family

ID=19160881

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001347980A Pending JP2003150182A (ja) 2001-11-13 2001-11-13 音声合成装置、音声合成装置の制御方法、音声合成制御プログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP2003150182A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006330133A (ja) * 2005-05-24 2006-12-07 Alpine Electronics Inc コンテンツ提供装置
JP2021006896A (ja) * 2019-06-27 2021-01-21 ネイバー コーポレーションNAVER Corporation スマートリーディング機器およびその制御方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006330133A (ja) * 2005-05-24 2006-12-07 Alpine Electronics Inc コンテンツ提供装置
JP2021006896A (ja) * 2019-06-27 2021-01-21 ネイバー コーポレーションNAVER Corporation スマートリーディング機器およびその制御方法

Similar Documents

Publication Publication Date Title
US7062437B2 (en) Audio renderings for expressing non-audio nuances
US6181351B1 (en) Synchronizing the moveable mouths of animated characters with recorded speech
JP3142803B2 (ja) テキストを音声に変換するシンセサイザ
JP2006323806A (ja) テキストを音声に変換するシステムおよび方法
DE60020773T2 (de) Graphische Benutzeroberfläche und Verfahren zur Änderung von Aussprachen in Sprachsynthese und -Erkennungssystemen
US20120303361A1 (en) Method and Apparatus for Sculpting Synthesized Speech
EP1490861A1 (en) Text structure for voice synthesis, voice synthesis method, voice synthesis apparatus, and computer program thereof
JPH10274997A (ja) 文書読み上げ装置
JP2001014306A (ja) 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体
WO1999060474A1 (fr) Dispositif de lecture a haute voix, procede de commande de lecture a haute voix et support d'enregistrement
JP2013072957A (ja) 文書読み上げ支援装置、方法及びプログラム
GB2444539A (en) Altering text attributes in a text-to-speech converter to change the output speech characteristics
US20090281808A1 (en) Voice data creation system, program, semiconductor integrated circuit device, and method for producing semiconductor integrated circuit device
JP3279684B2 (ja) 音声インタフェース・ビルダ・システム
JP3270356B2 (ja) 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体
JP3340581B2 (ja) テキスト読み上げ装置及びウインドウシステム
JP2001272990A (ja) 対話記録編集装置
JP4311710B2 (ja) 音声合成制御装置
JP2003150182A (ja) 音声合成装置、音声合成装置の制御方法、音声合成制御プログラム及び記録媒体
JPH08272388A (ja) 音声合成装置及びその方法
JP2002268664A (ja) 音声変換装置及びプログラム
JP2003271532A (ja) コミュニケーションシステム、当該システムのデータ転送方法、当該システムのサーバ、当該システムのための処理プログラム、および、記録媒体
JP2005181840A (ja) 音声合成装置及び音声合成プログラム
JP2003044072A (ja) 音声読み上げ設定装置、音声読み上げ装置、音声読み上げ設定方法、音声読み上げ設定プログラム及び記録媒体
JP7048141B1 (ja) プログラム、ファイル生成方法、情報処理装置、及び情報処理システム