JP2003044070A - 音声合成制御方法及び情報処理装置 - Google Patents

音声合成制御方法及び情報処理装置

Info

Publication number
JP2003044070A
JP2003044070A JP2001230780A JP2001230780A JP2003044070A JP 2003044070 A JP2003044070 A JP 2003044070A JP 2001230780 A JP2001230780 A JP 2001230780A JP 2001230780 A JP2001230780 A JP 2001230780A JP 2003044070 A JP2003044070 A JP 2003044070A
Authority
JP
Japan
Prior art keywords
voice synthesis
data
information
voice
setting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001230780A
Other languages
English (en)
Inventor
Kotaro Fukui
孝太郎 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001230780A priority Critical patent/JP2003044070A/ja
Publication of JP2003044070A publication Critical patent/JP2003044070A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 Web情報に含まれるテキストデータの必要
部分を読み上げるのに、範囲設定などの余計な操作伴っ
ており、操作が煩雑となっている。 【解決手段】 利用者は読み上げ対象となる内容をWe
bブラウザソフトでのウインドウ画面に表示させ、音声
合成を開始する操作を行うだけで、簡単にWeb情報の
必要な部分のみを読み上げ対象とすることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、読み上げ対象とな
るデータを音声合成するための方法及びその機能を有し
た情報処理装置に関する。
【0002】
【従来の技術】現在、パーソナルコンピュータ、PDA
(パーソナル・デジタル・アシスタント)、携帯電話な
どの情報処理装置には通信機能を有しており、インター
ネットに接続してネットワーク上に散在する各種情報を
閲覧したり、電子メールによる情報交換が盛んに行われ
ている。インターネット上の情報を閲覧するには、ブラ
ウザソフトが必要であり、例えば、マイクロソフト社の
インターネットエクスプローラなどがある。このブラウ
ザソフトは、HTML(Hyper-Text Markup Language)形
式で記述された情報を解析して、各種制御タグに基づき
変化に富んだ情報を情報処理装置利用者に提供するもの
である。
【0003】ブラウザソフトによって情報処理装置のL
CD画面上に表示された情報を読むことは、大変な作業
である。一方で、テキストデータを音声で読み上げる音
声合成ソフトウェアが存在する。この音声合成ソフトウ
ェアをWebブラウザソフトと連動させて、Web情報
を読み上げる製品も出てきているが、これらの製品では
単にWeb情報として取り出した全ての情報を読み上げ
るものであって、部分的に必要な情報だけを読み上げる
機能を有していなかった。
【0004】Web情報の必要な部分を読み取る技術と
して、特開2000−339132に示されたものが
る。この公報に記載された内容は、HTML形式で表現
されたWeb情報について、予め読み上げ対象としてデ
ータベースに登録してあるタグを単位として、読み上げ
開始の指示の後に、読み上げたい部分をリモコンの矢印
キーを操作して範囲を選択し、その選択範囲を音声合成
するものである。
【0005】
【発明が解決しようとする課題】上記に示した公報に記
載された技術では、Web情報の中から部分的に読み上
げることは可能である。しかしながら、主体的な操作は
Webブラウザを通しての処理であり、利用者はまずW
eb画面を通して一通りの内容を見て注目した箇所にフ
ォーカスして詳細内容を見たりすることが多い。上記公
報に示された技術では、注目した箇所(読み上げたい部
分)をWeb画面上でフォーカスした後に、さらに読み
上げる範囲を選択するための動作が必要になり、読み上
げるまでの操作に手間がかかり、煩雑な操作手順がある
という問題点があった。
【0006】本発明の目的は、Web情報を読み上げる
際に、より少ない操作で必要な部分を読み上げることが
可能な音声合成制御方法及び情報処理装置を提供するこ
とにある。
【0007】
【課題を解決するための手段】本発明は、上記に示した
課題を解決するために音声出力する読み上げ対象となる
文書データのうち、該文書データを表示するウインドウ
エリア内に含まれるテキストデータを取り出し、該取り
出したテキストデータについて音声合成処理を行うこと
を特徴とする音声合成制御方法である。
【0008】また、音声出力する読み上げ対象となる文
書データを記憶する文書データ記憶手段と、文書データ
を所定のウインドウサイズで表示する文書データ表示手
段と、該文書データ表示手段により表示されたウインド
ウエリア内の文書データを読み上げ対象として音声合成
する音声合成手段とを具備することを特徴とした情報処
理装置である。
【0009】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を説明する。
【0010】図1は、情報処理装置における音声合成制
御処理に関するブロック図である。入力部10は、キー
ボードやポインティングデバイス等の各種情報を入力す
るためのもの。制御部11は、音声合成制御処理全般の
制御を行うものである。設定情報記憶部12は、読み上
げに関する設定情報を記憶する。表示内容取得部13
は、前記設定情報に基づき読み上げ対象となる表示画面
に表示されたWeb画面中の読み上げ対象となる情報
(テキストデータ)を取得するためのもの。音声合成部
14は、前記表示内容取得部13で取得した情報を所定
の音声合成処理を行い音声データ(Waveデータ)を
生成する。音声出力部17は、前記音声合成部14で生
成された音声データを出力するもので、スピーカで構成
される。通信部15は、モデム等で構成されダイヤルア
ップ等で外部のネットワークと接続するために用いら
れ、Web情報や電子メール等をやりとりするためのも
のである。出力部16は、情報処理装置に備えられた表
示装置でありLCD(液晶ディスプレイ)やCRT等で
構成され、各種情報を表示するためのものである。
【0011】図2は、Web情報の概要を説明するため
の図である。ブラウザソフトを立ち上げて、通信部15
を介してネットワークに接続し、所定のアドレスを指定
すると、該アドレスで指定される場所に格納されたHT
ML文書を情報処理装置にダウンロードし図示しない記
憶部に保存される。ブラウザソフトは、この保存された
HTML文書に含まれる制御タグに従って、出力部16
の表示画面上にWeb情報を表示する。ブラウザソフト
を用いて画面表示されたWeb情報が図2に示されたも
のとなる。Web情報表示画面20は、適宜情報処理装
置利用者が指定したサイズのウインドウ上に表示され
る。Web情報の内容量が多い場合には、開いたウイン
ドウだけでは表示しきれないので、水平方向及び垂直方
向に表示内容をスクロールして見たい部分を表示させる
ことになる。
【0012】Web情報表示画面20は、Web情報の
タイトルを示すタイトルエリア21、Web情報のアド
レスを示すアドレスエリア22、さらにWeb情報本体
部分であるWeb情報エリア23から構成されている。
なお、この図では、ブラウザソフトの操作に関するアイ
コン等は省略している。Web情報エリアには、各種制
御タグによって文字修飾や文字配置が制御されたテキス
トデータや、画像データ25、さらに他のアドレスで示
されるWeb情報へのリンク24も表示される。画像デ
ータ25には、画像を説明するためのチップヘルプ、代
替テキストと呼ばれる説明情報(テキストデータ)が付
加されている。
【0013】図3は、利用者がウインドウサイズを調整
して、Web情報の一部を表示させた状態を示す図であ
る。利用者が指定したウインドウは、太線26で示され
る部分であり、点線部分はウインドウ表示されていない
部分である。本発明では、この太線26で指定された範
囲に含まれる情報に対して適宜、必要な部分を読み上げ
るものである。
【0014】図4は、音声合成処理用の起動画面の例を
示すものである。音声合成起動画面31は、読み上げ早
送りボタン32、読み上げ開始ボタン33、読み上げ中
断ボタン34、読み上げ中止ボタン35及びメニュータ
ブ36から構成されている。利用者は、読み上げたい部
分にウインドウ内のWeb情報の表示内容を調整して、
その後、音声合成起動画面31の読み上げ開始ボタンを
押すだけで、表示されたWeb情報の必要部分の読み上
げを行うことになる。
【0015】図5は、読み上げに関する各種設定を行う
設定画面の例を示すものである。図5に示す設定画面4
0は、前記図4の音声合成起動画面31のメニュータブ
から選択することによって表示されるものである。これ
ら読み上げ時の設定項目41乃至45については、利用
者が入力部10を介して必要項目の先頭にある四角をチ
ェックすることで設定することができる。チェックした
設定内容で登録する場合には、OKボタン45を押し、
設定処理を解除したい場合はキャンセルボタン46を押
す。ここで設定された内容は、設定情報記憶部12に記
憶される。
【0016】設定画面で設定できる読み上げに関する項
目としては、次の5つが用意されている。「表示されて
いる部分のみ読み上げる」を示す項目41は、該項目が
チェック状態であれば例えば図3に示す太線26の範囲
(Web情報の一部)が読み上げ対象とされ、非チェッ
ク状態であればWeb情報全体が読み上げ対象となる。
「リンクのみ読み上げる」を示す項目42は、項目41
で設定される読み上げ範囲について、該項目がチェック
状態であればリンクが指定されている部分のみ読み上げ
対象とし、非チェック状態であればリンクを含めたWe
b情報が読み上げ対象となる。
【0017】「タイトルを読み上げる」を示す項目43
は、該項目がチェック状態であればウインドウ内にWe
b情報表示画面20のタイトルエリア21を含めていな
い範囲を指定していてもタイトルを読み上げ対象とし、
非チェック状態であればタイトルエリア21が指定範囲
に含まれない場合にはタイトルを読み上げ対象としな
い。
【0018】「URLを読み上げる」を示す項目44
は、該項目がチェック状態であればウインドウ内にWe
b情報表示画面20のURL(アドレス情報)エリア2
2を含めていない範囲を指定していてもアドレスを読み
上げ対象とし、非チェック状態であればURLエリア2
2が指定範囲に含まれない場合にはアドレスを読み上げ
対象としない。
【0019】「画像の説明を読み上げる」を示す項目4
5は、項目41で設定される読み上げ範囲について、該
項目がチェック状態であれば画像データに付加された説
明情報を読み上げ対象とし、非チェック状態であれば画
像データに付加された説明情報は読み上げ対象としな
い。
【0020】続いて、図6のフローチャートを用いて本
発明の音声合成制御処理の流れを説明する。制御部11
は、音声合成起動画面31の読み上げ開始ボタン33が
操作されたかを監視し、開始ボタン33が入力部10を
介して操作されたと判断すると本フローチャートに示す
音声合成制御処理を行う。制御部11内の図示しない記
憶エリアでダウンロードしたWeb情報全体のデータが
管理されている。開始ボタン33が操作された場合、現
在表示されているWeb情報表示画面20のうち実際の
ウインドウで表示されている部分(図3の太線26の部
分)を特定し、前記図示しない記憶エリアに記憶された
Web情報全体から、該ウインドウ内に含まれたWeb
情報を取得する。現在、マイクロソフト社製のMSAA
(マイクロ・ソフト・アクティブ・アクセサビリティ)
というソフトウェアモジュールを用いると、アクティブ
なウインドウ領域内のテキスト情報が取得できる。
【0021】続いて、制御部11は、設定画面40を用
いて設定された内容が設定情報記憶部12に記憶されて
いるか確認(ステップS12)して、設定内容が記憶さ
れていればステップS13に処理は進み、記憶されてい
なければステップS14に処理は進む。設定内容が記憶
されている場合には、表示内容取得部13により、その
記憶された設定内容に従い読み上げ対象となるテキスト
データを求める(ステップS13)。また、特に設定内
容が記憶されていない場合には、表示内容取得部13に
より、Web情報全体を読み上げ対象として、そこに含
まれるテキストデータを求める(ステップS14)。
【0022】このようにして、表示内容取得部13で求
められた読み上げ対象となるテキストデータは、音声合
成部14へ転送される(ステップS15)。音声合成部
14では、転送されたテキストデータを解析して音声デ
ータを生成し、生成された音声データは音声出力部17
を介して出力される(ステップS16)。
【0023】続いて、読み上げ処理の具体的な内容につ
いて、いくつか例をあげて説明する。ここで、図3に示
されるようにウインドウ領域に表示されるWeb情報は
太線26で囲まれた部分とする。1番目の例として、図
5の設定画面で「表示されている部分のみ読み上げる」
の項目41がチェック状態で読み上げ処理が行われた場
合について説明する。このような設定の場合、画像の説
明部分は読み上げ対象とせず、リンクを含めた他のテキ
スト部分が読み上げ対象となる。読み上げ対象となるテ
キストデータは、次の通りとなる。「■製品情報」「ご
覧になりたい製品を選んでクリックして下さい。」「◆
パソコン」「◇ノートブックタイプ」「NT−FXi
i」「NT−XX」の6つのテキストデータが読み上げ
対象となる。
【0024】2番目の例として、図5の設定画面で1番
目の例のような項目41がチェック状態で、さらに「画
像の説明を読み上げる」の項目45がチェックされた状
態で読み上げ処理が行われた場合について説明する。こ
の場合は1番目の例に加えて、画像データ25aに付加
された説明情報として「ノートPC」が記録されている
とする。この場合の読み上げ対象となるテキストデータ
は、次の通りとなる。「■製品情報」「ご覧になりたい
製品を選んでクリックして下さい。」「◆パソコン」
「◇ノートブックタイプ」「NT−FXii」「NT−
XX」「ノートPC」の7つのテキストデータが読み上
げ対象となる。
【0025】HTML形式で記述されたWeb情報は、
ブラウザソフト以外でもHTML形式に対応したアプリ
ケーションソフトウェアであれば表示可能であり、この
場合も他のアプリケーションソフトウェアで操作したウ
インドウ画面に表示させた内容だけを音声合成すること
も可能である。
【0026】上記の通り説明したように、利用者は読み
上げ対象となる内容をWebブラウザソフトでのウイン
ドウ画面に表示させ、音声合成を開始する操作を行うだ
けで、簡単にWeb情報の必要な部分のみを読み上げ対
象とすることができる。
【0027】
【発明の効果】Web情報を読み上げる際に、より少な
い操作で必要な部分を読み上げることが可能なとなる。
【図面の簡単な説明】
【図1】 本発明の構成を示すブロック図。
【図2】 Web情報表示画面の一例を示す図。
【図3】 Web情報表示画面の一部ウインドウ領域を
表示する一例を示す図。
【図4】 音声合成起動画面の一例を示す図。
【図5】 設定画面の一例を示す図。
【図6】 音声合成制御処理の流れを示すフローチャー
ト。
【符号の説明】
10 入力部 11 制御部 12 設定情報記憶部 13 表示内容取得部 14 音声合成部 15 通信部 16 出力部 17 音声出力部 20 Web情報表示画面 31 音声合成起動画面 40 設定画面

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 音声出力する読み上げ対象となる文書デ
    ータのうち、該文書データを表示するウインドウエリア
    内に含まれるテキストデータを取り出し、 該取り出したテキストデータについて音声合成処理を行
    うことを特徴とする音声合成制御方法。
  2. 【請求項2】 読み上げ対象部分を設定するための設定
    項目を含む設定画面を表示し、 表示された設定項目に基づいて設定された内容を記憶
    し、 前記音声合成処理を行う際に、前記記憶された設定内容
    に従って読み上げ対象を特定するようにしたことを特徴
    とする請求項1記載の音声合成制御方法。
  3. 【請求項3】 前記設定項目として、画像データに付加
    された説明情報であるテキストデータの読み上げ要否の
    対象とし、前記音声合成処理を行う際に前記画像データ
    に付加された説明情報であるテキストデータを読み上げ
    対象とする旨の設定がされた場合に、該説明情報である
    テキストデータを音声合成処理することを特徴とする請
    求項2記載の音声合成制御方法。
  4. 【請求項4】 音声出力する読み上げ対象となる文書デ
    ータを記憶する文書データ記憶手段と、 文書データを所定のウインドウサイズで表示する文書デ
    ータ表示手段と、 該文書データ表示手段により表示されたウインドウエリ
    ア内の文書データを読み上げ対象として音声合成する音
    声合成手段とを具備することを特徴とした情報処理装
    置。
  5. 【請求項5】 読み上げ対象部分を設定するための設定
    項目を含む設定画面を表示する表示手段と、 該表示された設定項目に基づいて設定された内容を記憶
    する記憶手段とを有し、 前記音声合成処理を行う際に、前記記憶された設定内容
    に従って読み上げ対象を特定するようにしたことを特徴
    とする請求項4記載の情報処理装置。
  6. 【請求項6】 前記設定項目として、画像データに付加
    された説明情報であるテキストデータの読み上げ要否の
    対象とし、前記音声合成処理を行う際に前記画像データ
    に付加された説明情報であるテキストデータを読み上げ
    対象とする旨の設定がされた場合に、該説明情報である
    テキストデータを音声合成処理することを特徴とする請
    求項5記載の情報処理装置。
JP2001230780A 2001-07-31 2001-07-31 音声合成制御方法及び情報処理装置 Pending JP2003044070A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001230780A JP2003044070A (ja) 2001-07-31 2001-07-31 音声合成制御方法及び情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001230780A JP2003044070A (ja) 2001-07-31 2001-07-31 音声合成制御方法及び情報処理装置

Publications (1)

Publication Number Publication Date
JP2003044070A true JP2003044070A (ja) 2003-02-14

Family

ID=19062927

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001230780A Pending JP2003044070A (ja) 2001-07-31 2001-07-31 音声合成制御方法及び情報処理装置

Country Status (1)

Country Link
JP (1) JP2003044070A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003052370A1 (en) * 2001-12-14 2003-06-26 Canon Kabushiki Kaisha Information processing apparatus and method, and program
JP2007067595A (ja) * 2005-08-30 2007-03-15 Hitachi Ltd 番組情報の通知方法
WO2013061718A1 (ja) * 2011-10-28 2013-05-02 日立公共システムエンジニアリング株式会社 音声合成情報付きのテキストデータ提供装置及びテキストデータ提供方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003052370A1 (en) * 2001-12-14 2003-06-26 Canon Kabushiki Kaisha Information processing apparatus and method, and program
JP2007067595A (ja) * 2005-08-30 2007-03-15 Hitachi Ltd 番組情報の通知方法
WO2013061718A1 (ja) * 2011-10-28 2013-05-02 日立公共システムエンジニアリング株式会社 音声合成情報付きのテキストデータ提供装置及びテキストデータ提供方法
JP2013097033A (ja) * 2011-10-28 2013-05-20 Hitachi Government & Public Corporation System Engineering Ltd 音声合成情報付きのテキストデータ提供装置及びテキストデータ提供方法

Similar Documents

Publication Publication Date Title
AU2004218693B2 (en) Sequential multimodal input
US6791529B2 (en) UI with graphics-assisted voice control system
JP5259050B2 (ja) 音声合成機能付き文字情報表示装置、およびその音声合成方法、並びに音声合成プログラム
US20080160974A1 (en) Transferring task completion to another device
JP4743686B2 (ja) 携帯端末装置、およびその音声読み上げ方法、並びに音声読み上げプログラム
WO2009156589A1 (en) Text input
US6732078B1 (en) Audio control method and audio controlled device
KR20090111826A (ko) 문서 내 링크들을 표시하기 위한 방법 및 시스템
US20070101366A1 (en) Method for analyzing information and executing function corresponding to analyzed information in portable terminal
GB2387927A (en) User interface control apparatus
JP4796131B2 (ja) 筆記による及び/又は可聴音によるユーザ指示に応える、電子デバイス内のデータ管理のための、方法、電子デバイス、及びコンピュータ読み取り可能な記録媒体
JP2002268788A (ja) ウェブ文書のクローズアップ機能を備えた情報通信システムとこれを用いたウェブ文書のクローズアップ方法及びその方法を記録した記録媒体
JP2002304340A (ja) データ処理装置及びデータ処理方法
JP2003044070A (ja) 音声合成制御方法及び情報処理装置
JP2010268159A (ja) 携帯入力方法、携帯端末システム、サーバ、携帯端末、およびプログラム
JP2002202935A (ja) サーバ装置
US20100318696A1 (en) Input for keyboards in devices
US20050119888A1 (en) Information processing apparatus and method, and program
KR20050027892A (ko) 휴대용 전자 장치 및 휴대용 전자 장치의 제어 방법
WO2007094536A1 (en) Method and apparatus of retrieving for mobile terminal
KR20030044668A (ko) 무선 마크업 언어 번역기를 이용한 이동통신 단말기의사용자 인터페이스 방법
US20080177715A1 (en) method and apparatus for providing extensible document access to assistive technology providers
KR20040101320A (ko) 미디어 시스템상에 정보 항목 표현 방법
JP2003108424A (ja) 情報表示装置、情報表示プログラム
JP2006155433A (ja) 文字入力言語変換表示システム及びその方法並びにそれを用いた通信端末及びプログラム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050414

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051111

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20051111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090106

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090804