JP2001005476A - プレゼンテーション装置 - Google Patents

プレゼンテーション装置

Info

Publication number
JP2001005476A
JP2001005476A JP11175315A JP17531599A JP2001005476A JP 2001005476 A JP2001005476 A JP 2001005476A JP 11175315 A JP11175315 A JP 11175315A JP 17531599 A JP17531599 A JP 17531599A JP 2001005476 A JP2001005476 A JP 2001005476A
Authority
JP
Japan
Prior art keywords
data
text
voice
reading
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11175315A
Other languages
English (en)
Inventor
Takahisa Mori
卓久 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11175315A priority Critical patent/JP2001005476A/ja
Publication of JP2001005476A publication Critical patent/JP2001005476A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】 【課題】 画像の切り替えと同期して、音声合成でテキ
ストデータの読み上げを自動的に行うプレゼンテーショ
ン装置を提供する。 【解決手段】 言語処理部107は、テキストデータ記
憶部106内のテキストデータを順次読み出し、対応す
る画像への切り替えを表示制御部104に指示すると共
に、当該データの言語解析を行ってその内容を音声情報
に変換し、音声合成部110に順次出力する。表示制御
部104は、上記指示に従って画像データ記憶部102
内の画像データを順次読み出し、画像表示部103に出
力する。画像表示部103は、画像データを画面上に表
示する。音声データ記憶部108には、合成音声を出力
するのに必要な波形データ等が格納されている。音声合
成部110は、入力する音声情報に基づいて必要な波形
データを音声データ記憶部108から読み出し、順次音
声出力部109に出力する。音声出力部109は、波形
データに従って合成音声を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、プレゼンテーショ
ン装置に関し、より特定的には、テキストデータをコン
ピュータによって解析し、テキストの内容を合成音声と
して出力する音声合成装置をナレーションとして使用す
るプレゼンテーション装置に関する。
【0002】
【従来の技術】近年、コンピュータを用いた言語解析技
術と音声合成技術の進歩により、テキストデータをコン
ピュータに入力して解析し、このテキストの内容を人間
の音声で読み上げる装置が数多く実現されている。ま
た、単一の音質で発声するだけでなく、例えば、特開平
8−272388号公報に記載の「音声合成装置及びそ
の方法」のように、男性の声と女性の声とを切り替え
て、複数の音質でテキストを読み上げることも可能にな
っている。
【0003】ところで、従来、講演会や会議などにおい
て、予め用意された原稿の内容を予め定められた発表時
間内で読むために、発表者は事前に何度も原稿を読み上
げて原稿の量を調整し、試行錯誤を重ねて原稿を仕上げ
ていた。また、どうしても原稿の内容を増減できない場
合は、発表時に話す速度を調整することにより、時間内
に発表が終了するようにしていた。
【0004】このように、原稿が完成するまでに多くの
試行錯誤が必要な上、同じ人間でも、常に同じ速度で話
すには練習・熟練が必要であった。さらに、原稿の作成
者と発表者が異なる場合は、原稿増減についてやりとり
を重ねる必要があり、原稿完成までに多大な労力を必要
としていた。
【0005】そこで、上記問題点を解決するために、特
開平8−328577号公報に記載の「音声合成装置及
び読み上げ時間演算装置」では、与えられたテキストデ
ータを標準的な速度で合成音声により読み上げた場合の
読み上げ所要時間を算出し、この所要時間と設定された
所望の読み上げ時間とを比較することにより、設定時間
およびテキスト分量に合わせた速度の合成音声でテキス
トを読み上げることを可能にして、原稿作成の際の作業
負担を軽減している。
【0006】
【発明が解決しようとする課題】一方、近年、講演会や
会議などにおいて、コンピュータを用いて表示装置に画
像を表示し、この画像を次々と切り替えながら、プレゼ
ンテーション(発表)を行う方法が広く用いられてい
る。しかし、このような画像表示を伴うプレゼンテーシ
ョンにおいては、音声による説明と対応する画像の切り
替えとを同期させないと、表示内容と説明内容とがずれ
てしまう。
【0007】上述した特開平8−328577号公報に
記載の「音声合成装置及び読み上げ時間演算装置」を用
いて、画像表示を伴うプレゼンテーションを行う場合、
音声合成装置のテキスト読み上げに合わせて逐一手作業
で画像を順次切り替えるか、予め定めたテキストの読み
上げ所要時間に合わせて画像ごとに切り替え時間を設定
するか、または、逆に画像の切り替え時間に合わせてテ
キストの読み上げ時間を設定して、双方の同期をとらな
ければならない。このため、一度、これらの画像切り替
え時間を設定した後で原稿の長さに変更が生じると、画
像切り替え時間を再度設定しなければならない等の問題
点があった。
【0008】それ故、本発明の目的は、音声合成装置を
用いて画像表示を伴うプレゼンテーションを行うにあた
り、定められた時間内に発表を終了するための事前発表
練習を不要とし、説明に対応する画像切り替え操作を発
表者に課すことなく自動的にプレゼンテーションを行う
プレゼンテーション装置を提供することである。
【0009】
【課題を解決するための手段および発明の効果】第1の
発明は、テキストデータに基づいて生成される合成音声
の出力と、当該テキストデータに対応する画像データの
表示とを、自動的に行うプレゼンテーション装置であっ
て、画像データを入力する画像入力手段と、画像入力手
段が入力した画像データを、複数記憶する画像データ記
憶手段と、言語処理手段の指示に従って、画像データ記
憶手段から対応する画像データを順次読み出して出力す
る表示制御手段と、表示制御手段が出力する画像データ
を画像表示する画像表示手段と、テキストデータを入力
するテキスト入力手段と、テキスト入力手段が入力した
テキストデータを、対応する画像データを指示する画像
指示情報と共に、複数記憶するテキストデータ記憶手段
と、テキストデータ記憶手段から、予め定めた順序に従
ってテキストデータを順次読み出し、当該読み出したテ
キストデータの画像指示情報を、画像切り替えタイミン
グに同期して表示制御手段に出力すると共に、当該読み
出したテキストデータを解析して音声情報を生成する言
語処理手段と、音声を合成するための音声波形データを
複数記憶する音声データ記憶手段と、言語処理手段が生
成した音声情報に基づいて、音声データ記憶手段から対
応する音声波形データを順次読み出して出力する音声合
成手段と、音声合成手段が出力する音声波形データを、
合成音声として順次出力する音声出力手段とを備える。
【0010】上記のように、第1の発明によれば、テキ
ストデータを言語処理手段でそれぞれ解析し、音声出力
手段での各テキストの読み上げに同期して、対応する画
像データを順次切り替えて、画像表示手段に表示する。
これにより、発表者に対し、発表時において必要な手動
操作を課すことがなくなるだけでなく、発表者が居なく
ても自動的にプレゼンテーションを行うことが可能とな
る。
【0011】第2の発明は、第1の発明に従属する発明
であって、テキストデータの読み上げを開始してから終
了するまでの所要時間(以下、必要読み上げ時間とい
う)を設定する読み上げ時間設定手段をさらに備え、言
語処理手段は、読み出したテキストデータを所定の速度
で読み上げたときの読み上げ所要時間(以下、標準読み
上げ時間という)を算出して必要読み上げ時間と比較
し、実際の読み上げに要する時間が、必要読み上げ時間
と一致するように、読み上げ速度を調整した音声情報を
生成することを特徴とする。
【0012】上記のように、第2の発明によれば、テキ
ストごとに読み上げ時間設定手段に予め設定された必要
読み上げ時間と言語処理手段で解析する標準読み上げ時
間とを比較し、第1の発明において、テキストの読み上
げが必要読み上げ時間に合わせて完了するように、読み
上げ速度を調整した音声情報をそれぞれ生成する。これ
により、第1の発明の効果に加えさらに、読み上げ時間
設定手段に予め設定する時間でテキストの読み上げを確
実に完了することができ、テキストデータの量に左右さ
れず、所望の時間でプレゼンテーションを行うことがで
きる。従って、原稿のテキストデータ作成を簡易にする
ことが可能となる。
【0013】第3の発明は、第2の発明に従属する発明
であって、言語処理手段は、比較の結果、標準読み上げ
時間が必要読み上げ時間より短い場合は、読み上げ速度
の調整を行わずに音声情報を生成することを特徴とす
る。
【0014】上記のように、第3の発明によれば、第2
の発明において、必要読み上げ時間が標準読み上げ時間
よりも長い場合は、読み上げ速度の調整を行わない。こ
れにより、必要読み上げ時間の遵守よりも、出力する合
成音声の聞き易さを重視することができる。
【0015】第4の発明は、N種類のテキストデータ
(Nは、2以上の整数)に基づいて生成されるN種類の
合成音声の出力と、当該テキストデータに対応する画像
データの表示とを、自動的に行うプレゼンテーション装
置であって、画像データを入力する画像入力手段と、画
像入力手段が入力した画像データを、複数記憶する画像
データ記憶手段と、音声出力同期手段の指示に従って、
画像データ記憶手段から対応する画像データを順次読み
出して出力する表示制御手段と、表示制御手段が出力す
る画像データを画像表示する画像表示手段と、N種類の
テキストデータを入力するテキスト入力手段と、テキス
ト入力手段が入力したN種類のテキストデータを、対応
する画像データを指示する画像指示情報と共に、各種類
ごとにそれぞれ複数記憶するN個のテキストデータ記憶
手段と、音声出力同期手段の指示に従って、N個のテキ
ストデータ記憶手段から、予め定めた順序に従ってそれ
ぞれのテキストデータを並行して順次読み出し、当該読
み出したテキストデータを解析して音声情報をそれぞれ
生成するN個の言語処理手段と、N個の言語処理手段が
それぞれ生成した音声情報の出力がすべて完了した時点
で、N個の言語処理手段に対し次の処理の開始を指示す
ると共に、当該指示に同期して、予め定められた順序に
従って、次の画像に関する画像指示情報を表示制御手段
に出力する音声出力同期手段と、音声を合成するための
異なる音声波形データをそれぞれ複数記憶するN個の音
声データ記憶手段と、N個の言語処理手段が生成した音
声情報にそれぞれ基づいて、N個の音声データ記憶手段
から対応する音声波形データを順次読み出してそれぞれ
出力するN個の音声合成手段と、N個の音声合成手段が
出力する音声波形データを、合成音声としてそれぞれ順
次出力するN個の音声出力手段とを備える。
【0016】上記のように、第4の発明によれば、画像
データ記憶手段に記憶されている画像データの各々に対
し、複数のテキストデータを有しており、この複数のテ
キストデータを各言語処理手段でそれぞれ解析し、各音
声出力手段での各テキストの同時読み上げに同期して、
対応する画像データを順次切り替えて、画像表示手段に
表示する。これにより、発表者に対し、発表時において
必要な手動操作を課すことがなくなるだけでなく、発表
者が居なくても自動的にプレゼンテーションを行うこと
が可能となると共に、1つの画像データを表示しなが
ら、複数の言語で同時にプレゼンテーションを行うこと
ができる。
【0017】第5の発明は、第4の発明に従属する発明
であって、音声出力同期手段には、N種類のテキストデ
ータの必要読み上げ時間が各々予め設定されており、N
個の言語処理手段は、それぞれ、並行して読み出された
N個のテキストデータの各標準読み上げ時間を算出して
必要読み上げ時間と比較し、実際の読み上げに要する時
間が、必要読み上げ時間と一致するように、読み上げ速
度を調整した音声情報を生成することを特徴とする。
【0018】上記のように、第5の発明によれば、各テ
キストごとに読み上げ時間設定手段に予め設定された必
要読み上げ時間と言語処理手段で解析する標準読み上げ
時間とをそれぞれ比較し、第4の発明において、各テキ
ストの読み上げが必要読み上げ時間に合わせて完了する
ように、読み上げ速度を調整した音声情報をそれぞれ生
成する。これにより、第4の発明の効果に加えさらに、
読み上げ時間設定手段に予め設定する時間で各テキスト
の読み上げを確実に完了することができ、各テキストデ
ータの量に左右されず、所望の時間でプレゼンテーショ
ンを行うことができる。従って、原稿のテキストデータ
作成を簡易にすることが可能となる。
【0019】第6の発明は、第5の発明に従属する発明
であって、N個の言語処理手段は、それぞれ、比較の結
果、標準読み上げ時間が必要読み上げ時間より短い場合
は、読み上げ速度の調整を行わずに音声情報を生成する
ことを特徴とする。
【0020】上記のように、第6の発明によれば、第5
の発明において、必要読み上げ時間が標準読み上げ時間
よりも長い場合は、読み上げ速度の調整を行わない。こ
れにより、必要読み上げ時間の遵守よりも、出力する合
成音声の聞き易さを重視することができる。
【0021】第7の発明は、第1〜第6の発明に従属す
る発明であって、テキストデータに、テキストの所定の
箇所で読み上げを一定時間停止するための読み上げ停止
情報が付加されている場合、言語処理手段は、テキスト
データの解析によって読み上げ停止情報を検出し、所定
の箇所でテキストの読み上げを一定時間だけ停止する情
報を含んだ音声情報を生成することを特徴とする。
【0022】上記のように、第7の発明によれば、第1
〜第6の発明において、テキストデータに付加される読
み上げ停止情報に従って、所定の箇所でテキストの読み
上げを一定時間だけ停止する。これにより、テキストを
連続的に読み上げるだけでなく、必要に応じて一定時間
読み上げを停止することができ、より自然なテキスト読
み上げが可能となる。
【0023】第8の発明は、第1〜第7の発明に従属す
る発明であって、音声データ記憶手段には、複数の音質
の音声波形データがさらに記憶されており、テキストデ
ータに、テキストの所定の箇所で音声の音質を変更する
音質変更情報が付加されている場合、言語処理手段は、
テキストデータの解析によって音質変更情報を検出し、
所定の箇所で音質変更を指示する情報を含んだ音声情報
を生成し、音声合成手段は、音声情報に含まれる音質変
更を指示する情報に基づいて、所定の箇所で音声データ
記憶手段から読み出す音声波形データを選択的に切り替
えることを特徴とする。
【0024】上記のように、第8の発明によれば、第1
〜第7の発明において、テキストデータに付加される音
質変更情報に従って、所定の箇所で音質の変更を行う。
これにより、1種類の声質だけでなく複数種類の声質で
のテキスト読み上げを行うことができ、例えば、二人で
会話をしながら行う形式のプレゼンテーション等が可能
となる。
【0025】第9の発明は、第1〜第8の発明に従属す
る発明であって、音声データ記憶手段には、効果音を合
成するための効果音波形データがさらに記憶されてお
り、テキストデータに、テキストの所定の箇所で予め定
められた効果音を発するための効果音情報が付加されて
いる場合、言語処理手段は、テキストデータの解析によ
って効果音情報を検出し、所定の箇所で指定された効果
音を発する指示の情報を含んだ音声情報を生成し、音声
合成手段は、音声情報に含まれる効果音を発する指示の
情報に基づいて、所定の箇所で音声データ記憶手段から
対応する効果音波形データを読み出して出力することを
特徴とする。
【0026】上記のように、第9の発明によれば、第1
〜第8の発明において、テキストデータに付加される効
果音情報に従って、所定の箇所で効果音を発する。これ
により、テキストを読み上げる際、所定の場所で効果音
を鳴らすことができ、プレゼンテーションの効果を高め
ることができる。
【0027】第10の発明は、テキストデータに基づい
て生成される合成音声の出力と、当該テキストデータに
対応する画像データの表示とを、自動的に行うプレゼン
テーション方法であって、画像データを入力して複数記
憶するステップと、テキストデータを入力して複数記憶
するステップと、音声を合成するための音声波形データ
を予め複数記憶するステップと、記憶した複数のテキス
トデータから、予め定めた順序に従ってテキストデータ
を順次読み出すステップと、記憶した複数の画像データ
から、読み出したテキストデータに対応する画像データ
を、当該テキストデータに同期して順次読み出して出力
するステップと、読み出したテキストデータを解析して
音声情報を生成するステップと、音声情報に基づいて、
記憶した複数の音声波形データから、対応する音声波形
データを順次読み出して出力するステップと、出力する
画像データを画像表示するステップと、出力する音声波
形データを合成音声として順次出力するステップとを備
える。
【0028】上記のように、第10の発明によれば、テ
キストデータをそれぞれ解析し、各テキストの読み上げ
に同期して、対応する画像データを順次切り替えて表示
する。これにより、発表者に対し、発表時において必要
な手動操作を課すことがなくなるだけでなく、発表者が
居なくても自動的にプレゼンテーションを行うことが可
能となる。
【0029】第11の発明は、テキストデータに基づい
て生成される合成音声の出力と、当該テキストデータに
対応する画像データの表示とを、自動的に行うプレゼン
テーション方法を、コンピュータ装置において実行させ
るためのプログラムを記録した媒体であって、画像デー
タを入力して複数記憶するステップと、テキストデータ
を入力して複数記憶するステップと、音声を合成するた
めの音声波形データを予め複数記憶するステップと、記
憶した複数のテキストデータから、予め定めた順序に従
ってテキストデータを順次読み出すステップと、記憶し
た複数の画像データから、読み出したテキストデータに
対応する画像データを、当該テキストデータに同期して
順次読み出して出力するステップと、読み出したテキス
トデータを解析して音声情報を生成するステップと、音
声情報に基づいて、記憶した複数の音声波形データか
ら、対応する音声波形データを順次読み出して出力する
ステップと、出力する画像データを画像表示するステッ
プと、出力する音声波形データを合成音声として順次出
力するステップとを含む動作環境を、コンピュータ装置
上において実現するためのプログラムを記録している。
【0030】上記のように、第11の発明は、第10の
発明のプレゼンテーション方法を実行するためのプログ
ラムを記録した記録媒体である。これは、既存の装置に
対し、第10の発明のプレゼンテーション方法を、ソフ
トウエアの形態で供給することに対応させたものであ
る。
【0031】
【発明の実施の形態】以下、本発明の各実施形態につい
て、図面を参照して順に説明する。 (第1の実施形態)図1は、本発明の第1の実施形態に
係るプレゼンテーション装置の構成を示すブロック図で
ある。図1において、第1の実施形態に係るプレゼンテ
ーション装置は、画像入力部101と、画像データ記憶
部102と、画像表示部103と、表示制御部104
と、テキスト入力部105と、テキストデータ記憶部1
06と、言語処理部107と、音声データ記憶部108
と、音声出力部109と、音声合成部110とを備え
る。
【0032】まず、図1を参照して、第1の実施形態に
係るプレゼンテーション装置の各構成を説明する。画像
入力部101は、静止画(イメージ)データ、動画(ビ
デオ)データ、グラフィック(テキストを含むベクトル
グラフィック)データ、または画面を構成するグラフィ
ックデータの一部もしくはすべてを予め定められたスケ
ジュールに従って移動させるグラフィックアニメーショ
ンデータ等を入力し、画像データとして生成・編集して
画像データ記憶部102に出力する。この画像入力部1
01としては、例えば、入力するデータが静止画データ
であればイメージスキャナ、動画データであればビデオ
キャプチャ装置、グラフィックデータであればグラフィ
ックデータを作成するためのグラフィック作成ツール、
グラフィックアニメーションデータであればグラフィッ
クアニメーションを作成するためのアニメーション作成
ツール等が相当する。なお、画像入力部101は、上述
したように入力するデータから画像データを直接生成・
編集するのではなく、フロッピーディスクドライブ等の
ファイル入力装置を用い、別の編集装置で作成済みの画
像データをファイルとして読み込むようにしてもよい。
この画像入力部101が出力する画像データとしては、
静止画,動画,グラフィック,グラフィックアニメーシ
ョン等、画像ごとに異なる種類の画像にしてもよいし、
さらには、1つの画像データの中にこれらを混在させて
含んでいるものであってもよい。
【0033】画像データ記憶部102は、画像入力部1
01から出力される画像データを記憶する。表示制御部
104は、言語処理部107の指示(後述する)に従っ
て、画像データ記憶部102から対応する画像データを
順次読み出し、画像表示部103に出力する。画像表示
部103は、画像データを画面上に表示するディスプレ
イ装置であって、例えば、CRTやプロジェクター等で
ある。
【0034】テキスト入力部105は、例えば、キーボ
ード装置等であり、テキストデータを入力してテキスト
データ記憶部106に出力する。なお、テキスト入力部
105は、フロッピーディスクドライブ等のファイル入
力装置を用い、別の編集装置で作成済みのテキストデー
タをファイルとして読み込むようにしてもよい。テキス
トデータ記憶部106は、テキスト入力部105から出
力されるテキストデータを記憶する。ここで、テキスト
データ記憶部106は、プレゼンテーションの場面構成
に合わせてテキストデータを複数のブロック(以下、テ
キストブロックと呼ぶ)に分割し、各テキストブロック
を順序付けて、すなわち、画像データと対応させて記憶
および管理する。
【0035】言語処理部107は、テキストデータ記憶
部106に記憶されているテキストブロックを順次読み
出す。そして、言語処理部107は、読み出したテキス
トブロックがどの画像データに対応するかを、表示制御
部104に指示する。さらに、言語処理部107は、読
み出したテキストブロックの言語解析を行って、このテ
キストブロックのテキスト内容を発音記号などの音声情
報に変換し、音声合成部110に順次出力する。なお、
第1の実施形態では、言語処理部107は、日本語のテ
キストデータを解析するものとして以下説明を行う。
【0036】音声データ記憶部108には、合成音声を
出力するのに必要な音声(例えば、日本語の発音に必要
な男性の声や女性の声)の波形データや、(識別番号で
区別される)効果音の波形データ等が格納されている。
音声合成部110は、言語処理部107が順次出力する
音声情報に基づいて、その音声を発音するのに必要な波
形データを、音声データ記憶部108からそれぞれ読み
出し、これらを順次音声出力部109に出力する。音声
出力部109は、例えば、スピーカ装置等であって、音
声合成部110が出力する波形データに従って、合成音
声を出力する。
【0037】次に、上記構成による第1の実施形態に係
るプレゼンテーション装置が行う動作(プレゼンテーシ
ョン方法)を、図2および図3をさらに参照して、具体
例を挙げて説明する。図2は、プレゼンテーションに用
いる画像と、各画像が表示されたときに読み上げられる
テキストブロックの一例を示す図である。図2におい
て、テキストブロックTB21〜TB23は、それぞれ
画像SC21〜SC23が表示されたときに読み上げら
れるテキストブロック単位のテキストデータである。ま
た、図2のテキストブロックTB21の中にある“<S
OUND 15>”は、効果音情報であり、この効果音
情報がある箇所で識別番号“15”の効果音を鳴らすこ
とを表している。また、図2のテキストブロックTB2
2の中にある“<PAUSE 5>”および“<PAU
SE 10>”は、読み上げ停止情報であり、それぞれ
テキストの読み上げを5秒および10秒間停止する(無
音状態にする)ことを表している。さらに、図2のテキ
ストブロックTB23の中にある“<FEMALE>”
および“<MALE>”は、音質変更情報であり、以降
のテキストをそれぞれ女性の声および男性の声で出力す
ることを表している。なお、以下の説明においては、初
期状態として男性の声の波形データを用いて合成音声を
出力している。図3は、図1の言語処理部107が出力
する音声情報の一例を示す図である。
【0038】まず、プレゼンテーションの準備として、
画像SC21〜SC23に対応する画像データが、画像
入力部101を介して、画像データ記憶部102にそれ
ぞれ記憶されている。また、テキストブロックTB21
〜TB23が、テキスト入力部105を介して、TB2
1,TB22,TB23の順にテキストデータ記憶部1
06にそれぞれ記憶されている。
【0039】プレゼンテーションを開始すると、言語処
理部107は、最初のテキストブロックTB21をテキ
ストデータ記憶部106から読み出して、表示制御部1
04に対し、テキストブロックTB21に対応する画像
SC21を画面表示するように画像データ切り替えの指
示を行う。この指示を受けて、表示制御部104は、画
像データ記憶部102から最初の画像SC21に関する
画像データを読み出して、画像表示部103に出力す
る。これにより、画像表示部103に画像SC21が表
示される。
【0040】次に、言語処理部107は、テキストブロ
ックTB21のデータ「営業部営業3課の○○でござい
ます。これより、2000年の…」を解析し、図3
(a)に示すような音声情報「eigyoobu,ei
gyoosanka…」に変換して、音声合成部110
に出力する。なお、図3において、各々の1マスは、1
つの音節データになっており、「,」は読み上げ中に間
をおくことを表している。具体的には、「,」によって
予め定められた時間だけ、音声合成部110の出力が停
止し、音声出力部109からの出力が無音になる。そし
て、音声合成部110は、言語処理部107が出力する
音声情報に従って、図3(a)に示す各音節の発音に必
要な男性の音声の波形データ(この例においては、初期
状態で男性の声を発音するようにしているため)を、音
声データ記憶部108から逐次読み出し、音声出力部1
09に出力する。これにより、音声出力部109から、
男性の声でテキストブロックTB21の「営業部営業3
課…」の内容を読み上げた合成音声が出力される。
【0041】続けてデータ解析を進めて行き、テキスト
ブロックTB21中に付加されている効果音情報“<S
OUND 15>”を検出すると、言語処理部107
は、通常の音声情報の代わりに図3(b)に示すような
特殊な音声情報「#S15」を、音声合成部110に出
力する。図3(b)において、「#S」はこれが効果音
出力を指示する特殊な音声情報であることを表し、「1
5」は効果音の識別番号を表している。そして、音声合
成部110は、この特殊な音声情報に対し、音声データ
記憶部108から識別番号“15”に対応する効果音の
波形データを読み出し、これを音声出力部109に出力
する。これにより、音声出力部109から、識別番号
“15”の効果音が出力される(鳴らされる)。この効
果音の出力が終わると、言語処理部107は、引き続き
以降のテキストブロックTB21のデータ解析を行う。
【0042】このようにして、テキストブロックTB2
1すべてのデータ解析、すなわち、すべての内容の読み
上げが終了すると、言語処理部107は、次のテキスト
ブロックTB22をテキストデータ記憶部106から読
み出して、表示制御部104に対し、テキストブロック
TB22に対応する画像SC22を画面表示するように
画像データ切り替えの指示を行う。この指示を受けて、
表示制御部104は、画像データ記憶部102から次の
画像SC22に関する画像データを読み出して、画像表
示部103に出力する。これにより、画像表示部103
に画像SC22が表示される。
【0043】次に、言語処理部107は、テキストブロ
ックTB22のデータを解析する。ここで、上述したテ
キストブロックTB21の処理では、言語処理部107
は、テキストブロックTB21のデータを解析し、即座
に音声情報を音声合成部110に出力したので、画像S
C21が画像表示部103に表示されると、すぐにテキ
ストブロックTB21の読み上げ音声が音声出力部10
9から出力された。これに対し、テキストブロックTB
22の先頭には、読み上げ停止情報“<PAUSE 5
>”が存在するので、言語処理部107は、上述したテ
キストブロックTB21の処理の場合とは異なり、まず
無音を表す音声情報を出力し、この後5秒間待ってから
通常の音声情報を音声合成部110に出力し始める。従
って、画像表示部103に画像SC22が表示された
後、5秒経ってから以降のデータ「まず、最初に199
9年度の…」の読み上げ音声が音声出力部109から出
力される。
【0044】なお、この例のテキストブロックTB22
には、先頭だけでなく途中にも読み上げ停止情報“<P
AUSE 10>”が含まれているので、「…以上が販
売の実績です。」の読み上げが終わった後、10秒間音
声の出力が停止して無音状態となり、その後「これに対
して、利益は…」の読み上げが再開する。なお、テキス
トブロックTB22の読み上げについても、テキストブ
ロックTB21と同様、男性の声で発音される。
【0045】このようにして、テキストブロックTB2
2すべてのデータ解析、すなわち、すべての内容の読み
上げが終了すると、言語処理部107は、次のテキスト
ブロックTB23をテキストデータ記憶部106から読
み出して、表示制御部104に対し、テキストブロック
TB23に対応する画像SC23を画面表示するように
画像データ切り替えの指示を行う。この指示を受けて、
表示制御部104は、画像データ記憶部102から次の
画像SC23に関する画像データを読み出して、画像表
示部103に出力する。これにより、画像表示部103
に画像SC23が表示される。
【0046】次に、言語処理部107は、テキストブロ
ックTB23のデータを解析する。ここで、上述したテ
キストブロックTB21,TB22の処理では、特に音
質の指定がなかったので、音声合成部110は、初期状
態のまま男性の声で音声を合成していた。これに対し、
テキストブロックTB23の先頭には、音質変更情報
“<FEMALE>”が存在するので、言語処理部10
7は、まず図3(c)に示すような女性の声への音質変
更の音声情報「#F」を、音声合成部110に出力す
る。次に、言語処理部107は、テキストブロックTB
23のデータ「次に、2000年度の目標について…」
を解析し、図3(c)に示すような音声情報「tsug
ini,nisennendono…」に変換して、音
質変更の音声情報「#F」に続いて音声合成部110に
出力する。そして、音声合成部110は、まず言語処理
部107が出力する音質変更の音声情報「#F」に従っ
て、音声データ記憶部108から読み出す波形データの
対象を、女性の声の発音に必要な音声の波形データに変
更する。そして、音声合成部110は、図3(c)に示
す各音節の発音に必要な女性の声の波形データを、音声
データ記憶部108から逐次読み出し、音声出力部10
9に出力する。なお、音声合成部110は、この音質変
更の指示内容を、次の新たな音質変更の指示があるまで
維持する。これにより、データ「次に、2000年度の
目標について…」以降は、音声出力部109から、女性
の声でテキストブロックTB23の内容を読み上げた合
成音声が出力される。
【0047】同様に、言語処理部107は、テキストブ
ロックTB23に存在する音質変更情報“<MALE
>”に従って、まず図3(d)に示すような男性の声へ
の音質変更の音声情報「#M」を、続いて音声情報「t
suzukimasite…」を、音声合成部110に
出力する。そして、音声合成部110は、まず言語処理
部107が出力する音質変更の音声情報「#M」に従っ
て、音声データ記憶部108から読み出す波形データの
対象を、男性の声の発音に必要な音声の波形データに再
変更する。そして、音声合成部110は、図3(d)に
示す各音節の発音に必要な男性の声の波形データを、音
声データ記憶部108から逐次読み出し、音声出力部1
09に出力する。これにより、データ「続きまして…」
以降は、音声出力部109から、男性の声でテキストブ
ロックTB23の内容を読み上げた合成音声が出力され
る。
【0048】以上のように、本発明の第1の実施形態に
係るプレゼンテーション装置によれば、テキストブロッ
クのデータを言語処理部107でそれぞれ解析し、音声
出力部109での各テキストの読み上げに同期して、対
応する画像データを順次切り替えて、画像表示部103
に表示する。これにより、発表者に対し、発表時におい
て必要な手動操作を課すことがなくなるだけでなく、発
表者が居なくても自動的にプレゼンテーションを行うこ
とが可能となる。また、テキストデータに効果音情報を
付加することで、テキストを読み上げる際、所定の場所
で効果音を鳴らすことができ、プレゼンテーションの効
果を高めることができる。また、テキストデータに読み
上げ停止情報を付加することで、テキストを連続的に読
み上げるだけでなく、必要に応じて一定時間読み上げを
停止することができ、より自然なテキスト読み上げが可
能となる。さらに、テキストデータに音質変更情報を付
加することで、1種類の声質だけでなく複数種類の声質
でのテキスト読み上げを行うことができ、例えば、二人
で会話をしながら行う形式のプレゼンテーション等が可
能となる。
【0049】なお、上記第1の実施形態では、言語処理
部107が出力する音声情報として、ローマ字で表現し
た情報を一例に挙げて説明したが、これ以外にも発音記
号や同等の情報を符号化した情報であってもよい。ま
た、上記第1の実施形態では、読み上げ停止情報や音質
変更情報を、テキストブロックのテキストの途中に埋め
込んだ場合を一例に挙げて説明したが、これ以外にも、
例えば、埋め込むべき場所を指したポインタ情報と共
に、テキストの先頭や末尾に一括して記述したり、別フ
ァイルに格納する等してもよい。また、上記第1の実施
形態で述べた効果音情報、読み上げ停止情報および音質
変更情報等は、1つのテキストブロックの中で混在して
もよく、またそれぞれ複数あっても構わない。さらに、
上記第1の実施形態では、音質の種類が、男性の声と女
性の声との2種類である場合を一例に挙げて説明した
が、これ以外にも、例えば、高い声と低い声等というよ
うに複数の男性の声または複数の女性の声の波形データ
を音声データ記憶部108に記憶しておき、それらを適
宜切り替えて使用してもよい。なお、この場合、音質変
更情報の種類が音質の種類の数だけ必要になることは、
言うまでもない。
【0050】(第2の実施形態)図4は、本発明の第2
の実施形態に係るプレゼンテーション装置の構成を示す
ブロック図である。図4において、第2の実施形態に係
るプレゼンテーション装置は、画像入力部101と、画
像データ記憶部102と、画像表示部103と、表示制
御部104と、テキスト入力部105と、テキストデー
タ記憶部106と、言語処理部407と、音声データ記
憶部108と、音声出力部109と、音声合成部110
と、読み上げ時間設定部411とを備える。
【0051】図4に示すように、第2の実施形態に係る
プレゼンテーション装置は、上記第1の実施形態に係る
プレゼンテーション装置の言語処理部107を言語処理
部407に代え、さらに読み上げ時間設定部411を加
えた構成である。なお、第2の実施形態に係るプレゼン
テーション装置の他の構成は、上記第1の実施形態に係
るプレゼンテーション装置と同様であるため、当該他の
構成部分については同一の参照番号を付して説明を省略
する。
【0052】まず、図4を参照して、第2の実施形態に
係るプレゼンテーション装置の構成を、上記第1の実施
形態に係るプレゼンテーション装置と異なる構成を中心
に説明する。読み上げ時間設定部411は、テキストデ
ータ記憶部106に記憶されている各テキストブロック
に関し、テキストブロックごとに予め設定された必要な
テキスト読み上げの所要時間(以下、必要読み上げ時間
という)を記憶する。
【0053】言語処理部407は、音声情報を音声合成
部110に出力する前に、テキストデータ記憶部106
から読み出したテキストブロック全体の解析を行い、テ
キストブロックごとに、標準速度でテキストの読み上げ
を行った際のテキスト読み上げの所要時間(以下、標準
読み上げ時間という)を算出する。そして、言語処理部
407は、算出した標準読み上げ時間と読み上げ時間設
定部411に記憶されている必要読み上げ時間とを、テ
キストブロックごとに比較する。なお、テキストブロッ
クのデータ中に、上記第1の実施形態で述べた読み上げ
停止情報や効果音情報が付加されている場合には、言語
処理部407は、テキストブロック全体の標準読み上げ
時間を算出する際に、その読み上げ停止時間や効果音情
報の再生時間の合計を標準読み上げ時間に加えることを
行う。
【0054】そして、言語処理部407は、音声合成部
110への音声情報の出力速度を、必要読み上げ時間が
標準読み上げ時間より短ければ標準速度より速く、必要
読み上げ時間が標準読み上げ時間より長ければ標準速度
より遅くして、読み上げ時間設定部411に予め設定さ
れている必要読み上げ時間に合わせてテキストの読み上
げが完了するように制御する。なお、読み上げ時間設定
部411に必要読み上げ時間が予め設定されていないテ
キストブロックに関しては、言語処理部407は、音声
合成部110に対して標準速度で音声情報を出力する。
【0055】次に、上記構成による第2の実施形態に係
るプレゼンテーション装置が行う動作(プレゼンテーシ
ョン方法)を、図5および図6をさらに参照して、具体
例を挙げて説明する。図5は、プレゼンテーションに用
いる画像と、各画像が表示されたときに読み上げられる
テキストブロックの一例を示す図である。図5におい
て、テキストブロックTB51〜TB53は、それぞれ
画像SC51〜SC53が表示されたときに読み上げら
れるテキストブロック単位のテキストデータである。図
6は、図4の読み上げ時間設定部411に予め設定され
ている各テキストブロックごとの必要読み上げ時間の一
例を示す図である。図6においては、テキストブロック
TB51を「168秒」で、テキストブロックTB53
を「243秒」で読み上げるように設定されており、テ
キストブロックTB52については、何も設定されてい
ない。なお、図6における欄外のカッコ書きで示す数値
は、言語処理部407が解析した各テキストブロックT
B51〜TB53についての標準読み上げ時間をそれぞ
れ示している。
【0056】まず、プレゼンテーションの準備として、
上記第1の実施形態と同様に、画像SC51〜SC53
に対応する画像データが、画像入力部101を介して、
画像データ記憶部102にそれぞれ記憶されている。ま
た、テキストブロックTB51〜TB53が、テキスト
入力部105を介して、TB51,TB52,TB53
の順にテキストデータ記憶部106にそれぞれ記憶され
ている。また、読み上げ時間設定部411には、図6に
示す各必要読み上げ時間が予め設定されている。
【0057】プレゼンテーションを開始すると、言語処
理部407は、最初のテキストブロックTB51をテキ
ストデータ記憶部106から読み出して、表示制御部1
04に対し、テキストブロックTB51に対応する画像
SC51を画面表示するように画像データ切り替えの指
示を行う。この指示を受けて、表示制御部104は、画
像データ記憶部102から最初の画像SC51に関する
画像データを読み出して、画像表示部103に出力す
る。これにより、画像表示部103に画像SC51が表
示される。
【0058】次に、言語処理部407は、テキストブロ
ックTB51全体のデータを解析して、標準読み上げ時
間(図6の例では「160秒」)を算出し、読み上げ時
間設定部411に設定されているテキストブロックTB
51の必要読み上げ時間と比較する。図6に示すよう
に、テキストブロックTB51の必要読み上げ時間は
「168秒」であり、標準読み上げ時間「160秒」に
比べて5%長いので、言語処理部407は、音声合成部
110に対する音声情報の出力速度を5%遅くする処理
を行う。そして、音声情報の出力速度を決定した後、言
語処理部407は、上記第1の実施形態で述べた言語処
理部107と同様にデータ解析を行い、得た音声情報を
音声合成部110に順次出力する。これにより、テキス
トブロックTB51についてのテキスト読み上げは、読
み上げ時間設定部411に設定された「168秒」で完
了するように行われる。
【0059】このようにして、テキストブロックTB5
1すべてのデータ解析、すなわち、すべての内容の読み
上げが終了すると、言語処理部407は、次のテキスト
ブロックTB52をテキストデータ記憶部106から読
み出して、表示制御部104に対し、テキストブロック
TB52に対応する画像SC52を画面表示するように
画像データ切り替えの指示を行う。この指示を受けて、
表示制御部104は、画像データ記憶部102から次の
画像SC52に関する画像データを読み出して、画像表
示部103に出力する。これにより、画像表示部103
に画像SC52が表示される。
【0060】次に、言語処理部407は、テキストブロ
ックTB52全体のデータを解析する。ここで、図6に
示すように、読み上げ時間設定部411にはテキストブ
ロックTB52についての必要読み上げ時間が設定され
ていないので、言語処理部407は、テキストブロック
TB52のテキストデータについては、データ解析して
得た音声情報を標準速度で音声合成部110に出力す
る。これにより、テキストブロックTB52についての
テキスト読み上げは、標準読み上げ時間の「260秒」
で完了するように行われる。
【0061】このようにして、テキストブロックTB5
2すべてのデータ解析、すなわち、すべての内容の読み
上げが終了すると、言語処理部407は、次のテキスト
ブロックTB53をテキストデータ記憶部106から読
み出して、表示制御部104に対し、テキストブロック
TB53に対応する画像SC53を画面表示するように
画像データ切り替えの指示を行う。この指示を受けて、
表示制御部104は、画像データ記憶部102から次の
画像SC53に関する画像データを読み出して、画像表
示部103に出力する。これにより、画像表示部103
に画像SC53が表示される。
【0062】次に、言語処理部407は、テキストブロ
ックTB53全体のデータを解析して、標準読み上げ時
間(図6の例では「270秒」)を算出し、読み上げ時
間設定部411に設定されているテキストブロックTB
53の必要読み上げ時間と比較する。図6に示すよう
に、テキストブロックTB53の必要読み上げ時間は
「243秒」であり、標準読み上げ時間「270秒」に
比べて10%短いので、言語処理部407は、音声合成
部110に対する音声情報の出力速度を10%速くする
処理を行う。そして、音声情報の出力速度を決定した
後、言語処理部407は、上記第1の実施形態で述べた
言語処理部107と同様にデータ解析を行い、得た音声
情報を音声合成部110に順次出力する。これにより、
テキストブロックTB53についてのテキスト読み上げ
は、読み上げ時間設定部411に設定された「243
秒」で完了するように行われる。
【0063】以上のように、本発明の第2の実施形態に
係るプレゼンテーション装置によれば、上記第1の実施
形態で述べた処理に加え、テキストブロックごとに、読
み上げ時間設定部411に予め設定された必要読み上げ
時間と言語処理部407で解析する標準読み上げ時間と
を比較し、テキストの読み上げが必要読み上げ時間に合
わせて完了するように、音声合成部110への音声情報
の出力速度をそれぞれ変化させる。これにより、上記第
1の実施形態の効果に加えさらに、読み上げ時間設定部
411に予め設定する時間でテキストの読み上げを確実
に完了することができ、テキストデータの量に左右され
ず、所望の時間でプレゼンテーションを行うことができ
る。従って、原稿のテキストデータ作成を簡易にするこ
とが可能となる。
【0064】なお、上記第2の実施形態において、言語
処理部407は、必要読み上げ時間の方が標準読み上げ
時間より長い場合、必要読み上げ時間に合わせてテキス
トの読み上げが完了するように、音声合成部110への
音声情報の出力速度を変化させる制御を行うように記載
したが、この制御以外にも、出力速度は標準速度のまま
で、テキスト読み上げが終了してから必要読み上げ時間
に達するまでの時間を無音にする制御を行ってもよい。
また、言語処理部407は、必要読み上げ時間に合わせ
てテキストの読み上げが必ず完了するように、音声合成
部110への音声情報の出力速度を変化させる制御を行
うように記載したが、予め出力速度の上限または下限の
しきい値を設定すると共に、必要読み上げ時間を設定す
る際に前もって該当するテキストブロックの標準読み上
げ時間を算出し、必要読み上げ時間と標準読み上げ時間
とを比較して、比較結果がこのしきい値を越える場合に
は、必要読み上げ時間の設定を受け付けないようにして
もよい。例えば、速度変化を20%まで許容するように
設定した場合、標準読み上げ時間が「120秒」である
テキストブロックに対しては、「96秒」より短い時間
または「144秒」より長い必要読み上げ時間を設定で
きないようにしてもよい。さらに、言語処理部407
は、必要読み上げ時間に合わせてテキストの読み上げが
完了するように、音声合成部110への音声情報の出力
速度を変化させる制御を行うように記載したが、この制
御以外にも、無音部分を適宜挿入することによって、結
果的に読み上げ時間が長くなるように制御したり、逆
に、音声を聞き取りやすくするために挿入されている無
音部分(間の部分)を削除または短くすることによっ
て、結果的に読み上げ時間が短くなるように制御しても
よい。
【0065】(第3の実施形態)図7は、本発明の第3
の実施形態に係るプレゼンテーション装置の構成を示す
ブロック図である。図7において、第3の実施形態に係
るプレゼンテーション装置は、画像入力部101と、画
像データ記憶部102と、画像表示部103と、表示制
御部714と、テキスト入力部705と、音声出力同期
部712と、日本語テキストデータ記憶部716と、日
本語言語処理部717と、日本語音声データ記憶部71
8と、日本語音声出力部719と、日本語音声合成部7
20と、英語テキストデータ記憶部726と、英語言語
処理部727と、英語音声データ記憶部728と、英語
音声出力部729と、英語音声合成部730とを備え
る。
【0066】なお、第3の実施形態に係るプレゼンテー
ション装置における画像入力部101、画像データ記憶
部102および画像表示部103は、それぞれ上記第1
の実施形態に係るプレゼンテーション装置の各構成と同
様であるため、同一の参照番号を付している。以下、こ
れらの構成については、説明を省略する。
【0067】まず、図7を参照して、第3の実施形態に
係るプレゼンテーション装置の構成を、上記第1の実施
形態に係るプレゼンテーション装置と異なる構成を中心
に説明する。表示制御部714は、音声出力同期部71
2の指示(後述する)に従って、画像データ記憶部10
2から対応する画像データを順次読み出し、画像表示部
103に出力する。
【0068】テキスト入力部705は、例えば、キーボ
ード装置等であり、日本語および英語のテキストデータ
を入力して、日本語テキストデータ記憶部716および
英語テキストデータ記憶部726に出力する。なお、テ
キスト入力部705は、フロッピーディスクドライブ等
のファイル入力装置を用い、別の編集装置で作成済みの
テキストデータをファイルとして読み込むようにしても
よい。日本語テキストデータ記憶部716は、テキスト
入力部705から出力される日本語テキストデータを記
憶する。ここで、日本語テキストデータ記憶部716
は、プレゼンテーションの場面構成に合わせて日本語テ
キストデータを複数のテキストブロックに分割し、各テ
キストブロックを順序付けて、すなわち、画像データと
対応させて記憶および管理する。英語テキストデータ記
憶部726は、テキスト入力部705から出力される英
語テキストデータを記憶する。ここで、英語テキストデ
ータ記憶部726は、プレゼンテーションの場面構成に
合わせて英語テキストデータを複数のテキストブロック
に分割し、各テキストブロックを順序付けて、すなわ
ち、画像データと対応させて記憶および管理する。
【0069】日本語言語処理部717は、日本語テキス
トデータ記憶部716に記憶されているテキストブロッ
クを順次読み出し、読み出したテキストブロックの日本
語の言語解析を行って、このテキストブロックのテキス
トの内容を発音記号などの音声情報に変換し、日本語音
声合成部720に順次出力する。また、日本語言語処理
部717は、1つのテキストブロックの読み上げが終了
すると、音声出力同期部712にその旨を通知する。日
本語音声データ記憶部718には、日本語の合成音声を
出力するのに必要な音声(例えば、日本語の発音に必要
な男性の声や女性の声)の波形データや、(識別番号で
区別される)効果音の波形データ等が格納されている。
日本語音声合成部720は、日本語言語処理部717が
順次出力する音声情報に基づいて、その音声を発音する
のに必要な波形データを、日本語音声データ記憶部71
8からそれぞれ読み出し、これらを順次日本語音声出力
部719に出力する。日本語音声出力部719は、例え
ば、ヘッドホンやイヤホン等であって、日本語音声合成
部720が出力する波形データに従って、日本語の合成
音声を出力する。なお、日本語音声出力部719が出力
する日本語の合成音声は、後述する英語音声出力部72
9が出力する英語の合成音声とは、別個独立に出力され
る。
【0070】同様に、英語言語処理部727は、英語テ
キストデータ記憶部726に記憶されているテキストブ
ロックを順次読み出し、読み出したテキストブロックの
英語の言語解析を行って、このテキストブロックのテキ
ストの内容を発音記号などの音声情報に変換し、英語音
声合成部730に順次出力する。また、英語言語処理部
727は、1つのテキストブロックの読み上げが終了す
ると、音声出力同期部712にその旨を通知する。英語
音声データ記憶部728には、英語の合成音声を出力す
るのに必要な音声(例えば、英語の発音に必要な男性の
声や女性の声)の波形データや、(識別番号で区別され
る)効果音の波形データ等が格納されている。英語音声
合成部730は、英語言語処理部727が順次出力する
音声情報に基づいて、その音声を発音するのに必要な波
形データを、英語音声データ記憶部728からそれぞれ
読み出し、これを順次英語音声出力部729に出力す
る。英語音声出力部729は、例えば、ヘッドホンや、
イヤホン等であって、英語音声合成部730が出力する
波形データに従って、英語の合成音声を出力する。な
お、英語音声出力部729が出力する英語の合成音声
は、上述した日本語音声出力部719が出力する日本語
の合成音声とは、別個独立に出力される。
【0071】音声出力同期部712は、日本語言語処理
部717および英語言語処理部727が出力するテキス
トブロック読み上げの終了通知を待つ。そして、音声出
力同期部712は、日本語言語処理部717および英語
言語処理部727の双方からテキストブロック読み上げ
の終了通知を受け取った時点で、表示制御部714に対
し次の画像データを表示するように指示すると共に、日
本語言語処理部717および英語言語処理部727に、
それぞれ次のテキストブロックの解析処理を開始するよ
うに指示する。
【0072】次に、上記構成による第3の実施形態に係
るプレゼンテーション装置が行う動作(プレゼンテーシ
ョン方法)を、図8をさらに参照して、具体例を挙げて
説明する。図8は、プレゼンテーションに用いる画像
と、各画像が表示されたときに読み上げられるテキスト
ブロックの一例を示す図である。図8において、日本語
テキストブロックJTB81〜JTB83は、それぞれ
画像SC81〜SC83が表示されたときに読み上げら
れるテキストブロック単位の日本語テキストデータであ
り、英語テキストブロックETB81〜ETB83は、
それぞれ画像SC81〜SC83が表示されたときに読
み上げられるテキストブロック単位の英語テキストデー
タである。
【0073】まず、プレゼンテーションの準備として、
画像SC81〜SC83に対応する画像データが、画像
入力部101を介して、画像データ記憶部102にそれ
ぞれ記憶されている。また、日本語テキストブロックJ
TB81〜JTB83が、テキスト入力部705を介し
て、JTB81,JTB82,JTB83の順に日本語
テキストデータ記憶部716に、英語テキストブロック
ETB81〜ETB83が、テキスト入力部705を介
して、ETB81,ETB82,ETB83の順に英語
テキストデータ記憶部726に、それぞれ記憶されてい
る。
【0074】プレゼンテーションを開始すると、音声出
力同期部712は、表示制御部714に対し、日本語テ
キストブロックJTB81および英語テキストブロック
ETB81に対応する画像SC81を画面表示するよう
に画像データ切り替えの指示を行う。この指示を受け
て、表示制御部714は、画像データ記憶部102から
最初の画像SC81に関する画像データを読み出して、
画像表示部103に出力する。これにより、画像表示部
103に画像SC81が表示される。続いて、音声出力
同期部712は、日本語言語処理部717および英語言
語処理部727に、言語解析処理の開始を指示する。
【0075】上記音声出力同期部712の指示に従っ
て、日本語言語処理部717は、日本語テキストデータ
記憶部716から最初の日本語テキストブロックJTB
81を読み出し、言語解析を行って、日本語テキストブ
ロックJTB81のテキストを読み上げるための音声情
報を日本語音声合成部720に出力する。そして、日本
語音声合成部720は、この音声情報に基づいて、日本
語音声データ記憶部718から合成音声を出力するのに
必要な日本語音声の波形データを読み出して、逐次日本
語音声出力部719に出力する。一方、英語言語処理部
727は、日本語言語処理部717と同時に、音声出力
同期部712が出力する指示に従って、英語テキストデ
ータ記憶部726から最初の英語テキストブロックET
B81を読み出し、言語解析を行って、英語テキストブ
ロックETB81のテキストを読み上げるための音声情
報を英語音声合成部730に出力する。そして、英語音
声合成部730は、この音声情報に基づいて、英語音声
データ記憶部728から合成音声を出力するのに必要な
英語音声の波形データを読み出して、逐次英語音声出力
部729に出力する。
【0076】このようにして、日本語音声出力部719
から、日本語テキストブロックJTB81の内容を読み
上げた合成音声が出力されるのと同時に、英語音声出力
部729からは、英語テキストブロックETB81の内
容を読み上げた合成音声が出力される。
【0077】日本語言語処理部717は、日本語テキス
トブロックJTB81の解析処理が終了すると、音声出
力同期部712に処理終了の旨を通知し、解析処理を停
止する。同様に、英語言語処理部727も、英語テキス
トブロックETB81の解析処理が終了すると、音声出
力同期部712に処理終了の旨を通知し、解析処理を停
止する。音声出力同期部712は、日本語言語処理部7
17および英語言語処理部727からの処理終了通知を
待ち、双方から処理終了通知を受け取った時点で、表示
制御部714に対し、次の画像SC82を画面表示する
ように指示すると共に、日本語言語処理部717および
英語言語処理部727に、それぞれ次の日本語テキスト
ブロックJTB82および英語テキストブロックETB
82の解析処理を開始するよう指示する。表示制御部7
14は、この指示を受けて、画像データ記憶部102か
ら次の画像SC82に関する画像データを読み出して、
画像表示部103に出力する。これにより、画像表示部
103に画像SC82が表示される。
【0078】以降、上述した動作を繰り返すことによ
り、画像表示部103に画像SC82が表示されている
間には、日本語テキストブロックJTB82および英語
テキストブロックETB82の読み上げ音声が、画像表
示部103に画像SC83が表示されている間には、日
本語テキストブロックJTB83および英語テキストブ
ロックETB83の読み上げ音声が、日本語音声出力部
719および英語音声出力部729からそれぞれ同時に
出力される。
【0079】以上のように、本発明の第3の実施形態に
係るプレゼンテーション装置によれば、画像データ記憶
部102に記憶されている画像データの各々に対し、日
本語と英語の2種類のテキストデータを有し、上記第1
の実施形態で述べた処理を双方のテキストデータに関し
て行って、1つの画像データの表示において2種類の合
成音声を同時に出力する。これにより、上記第1の実施
形態の効果に加えさらに、1つの画像データを表示しな
がら、日英2カ国語で同時にプレゼンテーションを行う
ことができる。
【0080】(第4の実施形態)図9は、本発明の第4
の実施形態に係るプレゼンテーション装置の構成を示す
ブロック図である。図9において、第4の実施形態に係
るプレゼンテーション装置は、画像入力部101と、画
像データ記憶部102と、画像表示部103と、表示制
御部714と、テキスト入力部705と、読み上げ時間
設定部911と、日本語テキストデータ記憶部716
と、日本語言語処理部917と、日本語音声データ記憶
部718と、日本語音声出力部719と、日本語音声合
成部720と、英語テキストデータ記憶部726と、英
語言語処理部927と、英語音声データ記憶部728
と、英語音声出力部729と、英語音声合成部730と
を備える。
【0081】図9に示すように、第4の実施形態に係る
プレゼンテーション装置は、上記第3の実施形態に係る
プレゼンテーション装置の日本語言語処理部717、英
語言語処理部727および音声出力同期部712を、日
本語言語処理部917、英語言語処理部927および読
み上げ時間設定部911にそれぞれ代えた構成である。
なお、第4の実施形態に係るプレゼンテーション装置の
他の構成は、上記第3の実施形態に係るプレゼンテーシ
ョン装置と同様であるため、当該他の構成部分について
は同一の参照番号を付して説明を省略する。
【0082】まず、図9を参照して、第4の実施形態に
係るプレゼンテーション装置の構成を、上記第3の実施
形態に係るプレゼンテーション装置と異なる構成を中心
に説明する。読み上げ時間設定部911は、日本語テキ
ストデータ記憶部716および英語テキストデータ記憶
部726に記憶されている各日本語テキストブロックお
よび各英語テキストブロックに関し、テキストブロック
ごとに予め設定された必要読み上げ時間を記憶する。た
だし、この必要読み上げ時間は、同じ画像データに対応
する日本語テキストブロックと英語テキストブロックの
各データについては、常に同じ値が設定される。
【0083】日本語言語処理部917は、まず、音声情
報を日本語音声合成部720に出力する前に、日本語テ
キストデータ記憶部716から読み出した日本語テキス
トブロック全体の解析を行い、日本語テキストブロック
ごとに標準読み上げ時間を算出する。次に、日本語言語
処理部917は、算出した標準読み上げ時間と読み上げ
時間設定部911に記憶されている必要読み上げ時間と
を、日本語テキストブロックごとに比較する。そして、
日本語言語処理部917は、日本語音声合成部720へ
の音声情報の出力速度を、必要読み上げ時間が標準読み
上げ時間より短ければ標準速度より速く、必要読み上げ
時間が標準読み上げ時間より長ければ標準速度より遅く
して、読み上げ時間設定部911に予め設定されている
必要読み上げ時間に合わせてテキストの読み上げが完了
するように制御する。
【0084】同様に、英語言語処理部927は、まず、
音声情報を英語音声合成部730に出力する前に、英語
テキストデータ記憶部726から読み出した英語テキス
トブロック全体の解析を行い、英語テキストブロックご
とに標準読み上げ時間を算出する。次に、英語言語処理
部927は、算出した標準読み上げ時間と読み上げ時間
設定部911に記憶されている必要読み上げ時間とを、
英語テキストブロックごとに比較する。そして、英語言
語処理部927は、英語音声合成部730への音声情報
の出力速度を、必要読み上げ時間が標準読み上げ時間よ
り短ければ標準速度より速く、必要読み上げ時間が標準
読み上げ時間より長ければ標準速度より遅くして、読み
上げ時間設定部911に予め設定されている必要読み上
げ時間に合わせてテキストの読み上げが完了するように
制御する。
【0085】これによって、1つの画像データに対応す
る日本語テキストブロックと英語テキストブロックの読
み上げが同時に終了し、読み上げ時間設定部911は、
表示制御部714に次の画像の表示を指示するととも
に、日本語言語処理部917および英語言語処理部92
7に、それぞれ次のテキストブロックの処理を開始する
よう指示する。
【0086】次に、上記構成による第4の実施形態に係
るプレゼンテーション装置が行う動作(プレゼンテーシ
ョン方法)を、上記図8をさらに参照して、具体例を挙
げて説明する。なお、読み上げ時間設定部911に予め
設定されている日本語テキストブロックJTB81およ
び英語テキストブロックETB81の必要読み上げ時間
を、t1とする。
【0087】プレゼンテーションを開始すると、読み上
げ時間設定部911は、表示制御部714に対し、日本
語テキストブロックJTB81および英語テキストブロ
ックETB81に対応する画像SC81を画面表示する
ように画像データ切り替えの指示を行う。この指示を受
けて、表示制御部714は、画像データ記憶部102か
ら最初の画像SC81に関する画像データを読み出し
て、画像表示部103に出力する。これにより、画像表
示部103に画像SC81が表示される。続いて、読み
上げ時間設定部911は、日本語言語処理部917およ
び英語言語処理部927に、言語解析処理の開始をそれ
ぞれ指示する。
【0088】上記読み上げ時間設定部911の指示に従
って、日本語言語処理部917は、日本語テキストデー
タ記憶部716から最初の日本語テキストブロックJT
B81を読み出し、日本語テキストブロックJTB81
全体のデータを解析して標準読み上げ時間を算出し、読
み上げ時間設定部911に設定されている必要読み上げ
時間t1と比較する。この比較の結果、日本語言語処理
部917は、日本語音声合成部720への音声情報の出
力速度を、標準読み上げ時間より必要読み上げ時間t1
の方が短ければ標準速度より速くし、標準読み上げ時間
より必要読み上げ時間t1の方が長ければ標準速度より
遅くする。そして、音声情報の出力速度を決定した後、
日本語言語処理部917は、上記第3の実施形態で述べ
た日本語言語処理部717と同様にデータ解析を行い、
得た音声情報を日本語音声合成部720に順次出力す
る。これにより、日本語テキストブロックJTB81に
ついてのテキスト読み上げは、読み上げ時間設定部91
1に設定された必要読み上げ時間t1で完了するように
行われる。
【0089】同様に、上記読み上げ時間設定部911の
指示に従って、英語言語処理部927は、英語テキスト
データ記憶部726から最初の英語テキストブロックE
TB81を読み出し、英語テキストブロックETB81
全体のデータを解析して標準読み上げ時間を算出し、読
み上げ時間設定部911に設定されている必要読み上げ
時間t1と比較する。この比較の結果、英語言語処理部
927は、英語音声合成部730への音声情報の出力速
度を、標準読み上げ時間より必要読み上げ時間t1の方
が短ければ標準速度より速くし、標準読み上げ時間より
必要読み上げ時間t1の方が長ければ標準速度より遅く
する。そして、音声情報の出力速度を決定した後、英語
言語処理部927は、上記第3の実施形態で述べた英語
言語処理部727と同様にデータ解析を行い、得た音声
情報を英語音声合成部730に順次出力する。これによ
り、英語テキストブロックETB81についてのテキス
ト読み上げは、読み上げ時間設定部911に設定された
必要読み上げ時間t1で完了するように行われる。
【0090】このようにして、日本語音声出力部719
から、日本語テキストブロックJTB81の内容を読み
上げた合成音声が出力されるのと同時に、英語音声出力
部729からは、英語テキストブロックETB81の内
容を読み上げた合成音声が出力され、これら双方のテキ
スト読み上げ音声出力は、読み上げ時間設定部911に
予め設定された必要読み上げ時間t1経過後に同時に終
了する。
【0091】そして、読み上げ時間設定部911は、日
本語テキストブロックJTB81および英語テキストブ
ロックETB81の読み上げ音声出力がそれぞれ終了す
ると、表示制御部714に対し、次の画像SC82を画
面表示するように指示すると共に、日本語言語処理部9
17および英語言語処理部927に、それぞれ次の日本
語テキストブロックJTB82および英語テキストブロ
ックETB82の解析処理を開始するよう指示する。表
示制御部714は、この指示を受けて、画像データ記憶
部102から次の画像SC82に関する画像データを読
み出して、画像表示部103に出力する。これにより、
画像表示部103に画像SC82が表示される。
【0092】以降、上述した動作を繰り返すことによ
り、画像表示部103に1つの画像データを表示するご
とに、当該画像データに対応付けられた日本語テキスト
データと英語テキストデータとを音声合成により同時
に、かつ、同一所要時間(必要読み上げ時間)で読み上
げる。
【0093】以上のように、本発明の第4の実施形態に
係るプレゼンテーション装置によれば、上記第3の実施
形態で述べた処理に加え、日本語テキストブロックおよ
び英語テキストブロックごとに、読み上げ時間設定部9
11に予め設定された必要読み上げ時間と日本語言語処
理部917および英語言語処理部927で解析する標準
読み上げ時間とをそれぞれ比較し、各々のテキスト読み
上げが必要読み上げ時間に合わせて完了するように、日
本語音声合成部720および英語音声合成部730への
音声情報の出力速度をそれぞれ変化させる。これによ
り、上記第3の実施形態の効果に加えさらに、読み上げ
時間設定部911に予め設定する時間で日本語および英
語のテキストの読み上げを確実に完了することができ、
複数言語で同時にプレゼンテーションを行う場合でも、
各テキストデータの量に左右されず、所望の時間でプレ
ゼンテーションを行うことができる。
【0094】なお、本発明の第1〜第4の実施形態にお
いて、画像データ記憶部102に記憶されるグラフィッ
クアニメーションを構成するグラフィックとは、いわゆ
るベクトル図形だけでなく、テキストやイメージデータ
でもよく、例えば、箇条書きの各項目のテキストを移動
させながら表示させるようなものも含んでいる。また、
本発明の第1〜第4の実施形態においては、画像表示部
103および音声出力部109(日本語音声出力部71
9、英語音声出力部729)の構成として、ディスプレ
イ装置やスピーカ装置等を用いた場合を挙げて説明した
が、これ以外にも、例えば、VTR装置または同等の記
録装置を用い、出力する画像信号や音声信号を記録する
ようにしてもよい。さらに、本発明の第1〜第4の実施
形態における言語処理部107(日本語言語処理部71
7,917、英語言語処理部727,927)は、各テ
キストブロックの言語解析を行いながら、順次音声情報
を出力してもよいし、テキストブロック全体の言語解析
をすべて終了してから、まとめて音声情報を出力するよ
うにしてもよい。
【0095】また、本発明の第1〜第4の実施形態にお
いて、テキストデータ記憶部106(日本語テキストデ
ータ記憶部716、英語テキストデータ記憶部726)
に記憶されているすべてまたは一部のテキストブロック
について、予め言語解析を済ませて前もって出力すべき
音声情報を記憶しておくようにしてもよい。さらに、本
発明の第2および第4の実施形態における言語処理部1
07(日本語言語処理部717,917、英語言語処理
部727,927)は、テキストデータ記憶部106
(日本語テキストデータ記憶部716、英語テキストデ
ータ記憶部726)に記憶されているすべてまたは一部
のテキストブロックについて、予め標準読み上げ時間を
算出して記憶しておくようにしてもよい。
【0096】また、本発明の第3および第4の実施形態
では、日本語と英語の各々について言語処理部,音声デ
ータ記憶部,音声合成部の各構成をそれぞれ設け、日本
語と英語の2カ国語を同時に読み上げる場合を一例に挙
げて説明したが、これ以外の言語に対する当該各構成を
設けることにより、日本語および英語以外の言語にも対
応することができる。また、上記各構成を3組以上設け
ることにより、同時に3種類以上の言語でプレゼンテー
ションすることも可能である。さらに、設ける上記各構
成が、すべて異なる言語に対応したものである必要はな
く、例えば、2つの言語処理部および2つの音声合成部
をそれぞれ設け、一方の音声出力部からは大人用の説明
を出力し、他方の音声出力部からは子供用の説明を出力
するなどしてもよい。
【0097】なお、典型的なハードウェア環境では、上
記第1〜第4の実施形態に係るプレゼンテーション装置
が実現する各機能は、所定のプログラムデータが格納さ
れた記憶装置(ROM,RAM,ハードディスク等)と
CPU(セントラル・プロセッシング・ユニット)とに
よって実現される。この場合、各プログラムデータは、
CD−ROMやフロッピーディスク等の記録媒体を介し
て導入されてもよい。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係るプレゼンテーシ
ョン装置の構成を示すブロック図である。
【図2】本発明の第1の実施形態に係るプレゼンテーシ
ョン装置で用いるプレゼンテーションデータの一例を示
す図である。
【図3】図1の言語処理部107が出力する音声情報の
一例を示す図である。
【図4】本発明の第2の実施形態に係るプレゼンテーシ
ョン装置の構成を示すブロック図である。
【図5】本発明の第2の実施形態に係るプレゼンテーシ
ョン装置で用いるプレゼンテーションデータの一例を示
す図である。
【図6】図4の読み上げ時間設定部411に予め設定さ
れている各テキストブロックごとの必要読み上げ時間の
一例を示す図である。
【図7】本発明の第3の実施形態に係るプレゼンテーシ
ョン装置の構成を示すブロック図である。
【図8】本発明の第3の実施形態に係るプレゼンテーシ
ョン装置で用いるプレゼンテーションデータの一例を示
す図である。
【図9】本発明の第4の実施形態に係るプレゼンテーシ
ョン装置の構成を示すブロック図である。
【符号の説明】
101…画像入力部 102…画像データ記憶部 103…画像表示部 104,714…表示制御部 105,705…テキスト入力部 106,716,726…テキストデータ記憶部 107,407,717,727,917,927…言
語処理部 108,718,728…音声データ記憶部 109,719,729…音声出力部 110,720,730…音声合成部 411,911…読み上げ時間設定部 712…音声出力同期部 SC21〜SC23,SC51〜SC53,SC81〜
SC83…画像 TB21〜TB23,TB51〜TB53,JTB81
〜JTB83,ETB81〜ETB83…テキストブロ
ック

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 テキストデータに基づいて生成される合
    成音声の出力と、当該テキストデータに対応する画像デ
    ータの表示とを、自動的に行うプレゼンテーション装置
    であって、 前記画像データを入力する画像入力手段と、 前記画像入力手段が入力した前記画像データを、複数記
    憶する画像データ記憶手段と、 言語処理手段の指示に従って、前記画像データ記憶手段
    から対応する前記画像データを順次読み出して出力する
    表示制御手段と、 前記表示制御手段が出力する前記画像データを画像表示
    する画像表示手段と、 前記テキストデータを入力するテキスト入力手段と、 前記テキスト入力手段が入力した前記テキストデータ
    を、対応する前記画像データを指示する画像指示情報と
    共に、複数記憶するテキストデータ記憶手段と、 前記テキストデータ記憶手段から、予め定めた順序に従
    って前記テキストデータを順次読み出し、当該読み出し
    たテキストデータの前記画像指示情報を、画像切り替え
    タイミングに同期して前記表示制御手段に出力すると共
    に、当該読み出したテキストデータを解析して音声情報
    を生成する前記言語処理手段と、 音声を合成するための音声波形データを複数記憶する音
    声データ記憶手段と、 前記言語処理手段が生成した前記音声情報に基づいて、
    前記音声データ記憶手段から対応する前記音声波形デー
    タを順次読み出して出力する音声合成手段と、 前記音声合成手段が出力する前記音声波形データを、合
    成音声として順次出力する音声出力手段とを備える、プ
    レゼンテーション装置。
  2. 【請求項2】 前記テキストデータの読み上げを開始し
    てから終了するまでの所要時間(以下、必要読み上げ時
    間という)を設定する読み上げ時間設定手段をさらに備
    え、 前記言語処理手段は、前記読み出したテキストデータを
    所定の速度で読み上げたときの読み上げ所要時間(以
    下、標準読み上げ時間という)を算出して前記必要読み
    上げ時間と比較し、実際の読み上げに要する時間が、前
    記必要読み上げ時間と一致するように、読み上げ速度を
    調整した前記音声情報を生成することを特徴とする、請
    求項1に記載のプレゼンテーション装置。
  3. 【請求項3】 前記言語処理手段は、比較の結果、前記
    標準読み上げ時間が前記必要読み上げ時間より短い場合
    は、読み上げ速度の調整を行わずに前記音声情報を生成
    することを特徴とする、請求項2に記載のプレゼンテー
    ション装置。
  4. 【請求項4】 N種類のテキストデータ(Nは、2以上
    の整数)に基づいて生成されるN種類の合成音声の出力
    と、当該テキストデータに対応する画像データの表示と
    を、自動的に行うプレゼンテーション装置であって、 前記画像データを入力する画像入力手段と、 前記画像入力手段が入力した前記画像データを、複数記
    憶する画像データ記憶手段と、 音声出力同期手段の指示に従って、前記画像データ記憶
    手段から対応する前記画像データを順次読み出して出力
    する表示制御手段と、 前記表示制御手段が出力する前記画像データを画像表示
    する画像表示手段と、 N種類の前記テキストデータを入力するテキスト入力手
    段と、 前記テキスト入力手段が入力したN種類の前記テキスト
    データを、対応する前記画像データを指示する画像指示
    情報と共に、各種類ごとにそれぞれ複数記憶するN個の
    テキストデータ記憶手段と、 前記音声出力同期手段の指示に従って、前記N個のテキ
    ストデータ記憶手段から、予め定めた順序に従ってそれ
    ぞれの前記テキストデータを並行して順次読み出し、当
    該読み出したテキストデータを解析して音声情報をそれ
    ぞれ生成するN個の言語処理手段と、 前記N個の言語処理手段がそれぞれ生成した前記音声情
    報の出力がすべて完了した時点で、前記N個の言語処理
    手段に対し次の処理の開始を指示すると共に、当該指示
    に同期して、予め定められた順序に従って、次の画像に
    関する前記画像指示情報を前記表示制御手段に出力する
    前記音声出力同期手段と、 音声を合成するための異なる音声波形データをそれぞれ
    複数記憶するN個の音声データ記憶手段と、 前記N個の言語処理手段が生成した前記音声情報にそれ
    ぞれ基づいて、前記N個の音声データ記憶手段から対応
    する前記音声波形データを順次読み出してそれぞれ出力
    するN個の音声合成手段と、 前記N個の音声合成手段が出力する前記音声波形データ
    を、合成音声としてそれぞれ順次出力するN個の音声出
    力手段とを備える、プレゼンテーション装置。
  5. 【請求項5】 前記音声出力同期手段には、前記N種類
    のテキストデータの読み上げを開始してから終了するま
    での所要時間(以下、必要読み上げ時間という)が各々
    予め設定されており、 前記N個の言語処理手段は、それぞれ、前記並行して読
    み出されたN個のテキストデータを各々所定の速度で読
    み上げたときの読み上げ所要時間(以下、標準読み上げ
    時間という)を算出して前記必要読み上げ時間と比較
    し、実際の読み上げに要する時間が、前記必要読み上げ
    時間と一致するように、読み上げ速度を調整した前記音
    声情報を生成することを特徴とする、請求項4に記載の
    プレゼンテーション装置。
  6. 【請求項6】 前記N個の言語処理手段は、それぞれ、
    比較の結果、前記標準読み上げ時間が前記必要読み上げ
    時間より短い場合は、読み上げ速度の調整を行わずに前
    記音声情報を生成することを特徴とする、請求項5に記
    載のプレゼンテーション装置。
  7. 【請求項7】 前記テキストデータに、テキストの所定
    の箇所で読み上げを一定時間停止するための読み上げ停
    止情報が付加されている場合、 前記言語処理手段は、前記テキストデータの解析によっ
    て前記読み上げ停止情報を検出し、所定の箇所でテキス
    トの読み上げを一定時間だけ停止する情報を含んだ前記
    音声情報を生成することを特徴とする、請求項1〜6の
    いずれかに記載のプレゼンテーション装置。
  8. 【請求項8】 前記音声データ記憶手段には、複数の音
    質の前記音声波形データがさらに記憶されており、 前記テキストデータに、テキストの所定の箇所で音声の
    音質を変更する音質変更情報が付加されている場合、 前記言語処理手段は、前記テキストデータの解析によっ
    て前記音質変更情報を検出し、所定の箇所で音質変更を
    指示する情報を含んだ前記音声情報を生成し、 前記音声合成手段は、前記音声情報に含まれる前記音質
    変更を指示する情報に基づいて、所定の箇所で前記音声
    データ記憶手段から読み出す前記音声波形データを選択
    的に切り替えることを特徴とする、請求項1〜7のいず
    れかに記載のプレゼンテーション装置。
  9. 【請求項9】 前記音声データ記憶手段には、効果音を
    合成するための効果音波形データがさらに記憶されてお
    り、 前記テキストデータに、テキストの所定の箇所で予め定
    められた効果音を発するための効果音情報が付加されて
    いる場合、 前記言語処理手段は、前記テキストデータの解析によっ
    て前記効果音情報を検出し、所定の箇所で指定された効
    果音を発する指示の情報を含んだ前記音声情報を生成
    し、 前記音声合成手段は、前記音声情報に含まれる前記効果
    音を発する指示の情報に基づいて、所定の箇所で前記音
    声データ記憶手段から対応する前記効果音波形データを
    読み出して出力することを特徴とする、請求項1〜8の
    いずれかに記載のプレゼンテーション装置。
  10. 【請求項10】 テキストデータに基づいて生成される
    合成音声の出力と、当該テキストデータに対応する画像
    データの表示とを、自動的に行うプレゼンテーション方
    法であって、 前記画像データを入力して複数記憶するステップと、 前記テキストデータを入力して複数記憶するステップ
    と、 音声を合成するための音声波形データを予め複数記憶す
    るステップと、 記憶した複数の前記テキストデータから、予め定めた順
    序に従って前記テキストデータを順次読み出すステップ
    と、 記憶した複数の前記画像データから、前記読み出したテ
    キストデータに対応する前記画像データを、当該テキス
    トデータに同期して順次読み出して出力するステップ
    と、 前記読み出したテキストデータを解析して音声情報を生
    成するステップと、 前記音声情報に基づいて、記憶した複数の前記音声波形
    データから、対応する前記音声波形データを順次読み出
    して出力するステップと、 出力する前記画像データを画像表示するステップと、 出力する前記音声波形データを合成音声として順次出力
    するステップとを備える、プレゼンテーション方法。
  11. 【請求項11】 テキストデータに基づいて生成される
    合成音声の出力と、当該テキストデータに対応する画像
    データの表示とを、自動的に行うプレゼンテーション方
    法を、コンピュータ装置において実行させるためのプロ
    グラムを記録した媒体であって、 前記画像データを入力して複数記憶するステップと、 前記テキストデータを入力して複数記憶するステップ
    と、 音声を合成するための音声波形データを予め複数記憶す
    るステップと、 記憶した複数の前記テキストデータから、予め定めた順
    序に従って前記テキストデータを順次読み出すステップ
    と、 記憶した複数の前記画像データから、前記読み出したテ
    キストデータに対応する前記画像データを、当該テキス
    トデータに同期して順次読み出して出力するステップ
    と、 前記読み出したテキストデータを解析して音声情報を生
    成するステップと、 前記音声情報に基づいて、記憶した複数の前記音声波形
    データから、対応する前記音声波形データを順次読み出
    して出力するステップと、 出力する前記画像データを画像表示するステップと、 出力する前記音声波形データを合成音声として順次出力
    するステップとを含む動作環境を、前記コンピュータ装
    置上において実現するためのプログラムを記録した記録
    媒体。
JP11175315A 1999-06-22 1999-06-22 プレゼンテーション装置 Pending JP2001005476A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11175315A JP2001005476A (ja) 1999-06-22 1999-06-22 プレゼンテーション装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11175315A JP2001005476A (ja) 1999-06-22 1999-06-22 プレゼンテーション装置

Publications (1)

Publication Number Publication Date
JP2001005476A true JP2001005476A (ja) 2001-01-12

Family

ID=15993954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11175315A Pending JP2001005476A (ja) 1999-06-22 1999-06-22 プレゼンテーション装置

Country Status (1)

Country Link
JP (1) JP2001005476A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002318593A (ja) * 2001-04-20 2002-10-31 Sony Corp 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体
WO2004097800A1 (ja) * 2003-05-02 2004-11-11 Konami Corporation 音声再生プログラム、音声再生方法及び音声再生装置
JP2006337432A (ja) * 2005-05-31 2006-12-14 Kenwood Corp 複数のキャラクタによる音声案内を行う音声合成装置、そのプログラム及びこのプログラムが記録された情報記録媒体
JP2008035227A (ja) * 2006-07-28 2008-02-14 Daiichikosho Co Ltd 静止画像表示切替システム
WO2018179209A1 (ja) * 2017-03-30 2018-10-04 三菱電機株式会社 電子機器、音声制御方法、およびプログラム
JP2020046842A (ja) * 2018-09-18 2020-03-26 富士ゼロックス株式会社 情報処理装置およびプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002318593A (ja) * 2001-04-20 2002-10-31 Sony Corp 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体
WO2004097800A1 (ja) * 2003-05-02 2004-11-11 Konami Corporation 音声再生プログラム、音声再生方法及び音声再生装置
JP2006337432A (ja) * 2005-05-31 2006-12-14 Kenwood Corp 複数のキャラクタによる音声案内を行う音声合成装置、そのプログラム及びこのプログラムが記録された情報記録媒体
JP2008035227A (ja) * 2006-07-28 2008-02-14 Daiichikosho Co Ltd 静止画像表示切替システム
JP4679462B2 (ja) * 2006-07-28 2011-04-27 株式会社第一興商 静止画像表示切替システム
WO2018179209A1 (ja) * 2017-03-30 2018-10-04 三菱電機株式会社 電子機器、音声制御方法、およびプログラム
JP6486582B2 (ja) * 2017-03-30 2019-03-20 三菱電機株式会社 電子機器、音声制御方法、およびプログラム
JPWO2018179209A1 (ja) * 2017-03-30 2019-04-11 三菱電機株式会社 電子機器、音声制御方法、およびプログラム
JP2020046842A (ja) * 2018-09-18 2020-03-26 富士ゼロックス株式会社 情報処理装置およびプログラム
JP7215033B2 (ja) 2018-09-18 2023-01-31 富士フイルムビジネスイノベーション株式会社 情報処理装置およびプログラム

Similar Documents

Publication Publication Date Title
US9478219B2 (en) Audio synchronization for document narration with user-selected playback
US5657426A (en) Method and apparatus for producing audio-visual synthetic speech
US8359202B2 (en) Character models for document narration
US5630017A (en) Advanced tools for speech synchronized animation
US6181351B1 (en) Synchronizing the moveable mouths of animated characters with recorded speech
KR101492816B1 (ko) 애니메이션 립싱크 자동화 장치 및 방법
JPH10153998A (ja) 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置
US20160027431A1 (en) Systems and methods for multiple voice document narration
US20130144625A1 (en) Systems and methods document narration
JP6665446B2 (ja) 情報処理装置、プログラム及び音声合成方法
KR20070020252A (ko) 메시지를 수정하기 위한 방법 및 시스템
US7613613B2 (en) Method and system for converting text to lip-synchronized speech in real time
JP5137031B2 (ja) 台詞音声作成装置、発話音声収録装置、及びコンピュータプログラム
JP2003307997A (ja) 語学教育システム、音声データ処理装置、音声データ処理方法、音声データ処理プログラム、及び記憶媒体
JPH08339198A (ja) プレゼンテーション装置
JP2007295218A (ja) ノンリニア編集装置およびそのプログラム
JP2001005476A (ja) プレゼンテーション装置
JPH0756494A (ja) 発音訓練装置
JP2982697B2 (ja) テロップ表示装置
JP3507767B2 (ja) マルチメディアコンテンツ再生システム及びマルチメディアコンテンツ再生方法
JP4052561B2 (ja) 映像付帯音声データ記録方法、映像付帯音声データ記録装置および映像付帯音声データ記録プログラム
KR20100115003A (ko) 텍스트데이터 기반의 얼굴 애니메이션 출력방법 및 그 시스템
JP2008210500A (ja) データ編集装置及びデータ編集プログラム
JPH05282371A (ja) マルチメディア再生システム
JP2006284645A (ja) 音声再生装置およびその再生プログラムならびにその再生方法