JP2000099307A - 文書読み上げ装置 - Google Patents

文書読み上げ装置

Info

Publication number
JP2000099307A
JP2000099307A JP10262896A JP26289698A JP2000099307A JP 2000099307 A JP2000099307 A JP 2000099307A JP 10262896 A JP10262896 A JP 10262896A JP 26289698 A JP26289698 A JP 26289698A JP 2000099307 A JP2000099307 A JP 2000099307A
Authority
JP
Japan
Prior art keywords
document
information
voice
screen
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10262896A
Other languages
English (en)
Inventor
Takashi Osawa
隆 大澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP10262896A priority Critical patent/JP2000099307A/ja
Publication of JP2000099307A publication Critical patent/JP2000099307A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Stereophonic System (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 画面上に表示される文書を音声に変換して読
み上げる文書読み上げ装置において、ユーザの指示して
いる位置の周辺の文書情報を音声に基づいて把握できる
ようにする。 【解決手段】 文書解析部6は、制御部1から指示され
た文書のデータを文書情報部2から読み出して、検索項
目として所定のタグの付いたテキストやキーワードを抽
出し、その抽出した情報を文書中の位置情報とともに文
書情報記録部2に記録する。音声情報配置部7は、文書
解析部6で抽出された文書と、指示入力部5で指示され
た位置との位置関係が聴空間上で判断できるようにす
る。音声変換部8は、聴空間上に配置された文書のテキ
スト情報を音声に変換する。音声再生部9は、種々の音
源を合成し、変換された音声を配置した通りに定位感を
持たせて再生する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は画面上に表示される
文書を音声に変換して読み上げる文書読み上げ装置に関
し、特に定位感を持たせた音声を出力する文書読み上げ
装置に関する。
【0002】
【従来の技術】従来、商品化されている文書読み上げシ
ステムは、カーソルやポインタを用いて、読み上げ対象
となる文書や読み上げの基点を指定し、その上でキーボ
ードやマウスを用いて、読み上げ命令を実行させる方法
を用いている。例えば、代表的な例であるIBM (インタ
ーナショナル・ビジネス・マシーンズ・コーポレイショ
ン)社のスクリーンリーダ/2(商標)では、ポインタ
で文書中の任意の箇所を指定し、所定のキーを押すと、
ポインタの右に位置する単語を聴取することができる。
この所定のキーを押しつづけると、一度に1単語ずつ、
行全体を聴取することが可能となる。このようにポイン
タは、所望の箇所の文を読み上げたり、見つけたりする
ために用いられる。
【0003】また、文書読み上げに関する技術として
は、特開平8−263260号公報の「テキスト読み上
げ方法」がある。この発明では、音声を定位感をもって
再生するための音声処理技術を用いた読み上げ方法を示
している。すなわち、この発明は、読み上げ対象となる
文書を指定し、その読み上げを実行すると、現在読み上
げている文字の文書全体に対する相対位置を、聴空間上
で認識できるように、読み上げ音声やそれに対応するサ
ウンドを定位させるものである。
【0004】また、別の発明として、特開平7−135
81号公報の「音声への空間情報提供方法およびシステ
ム」がある。この発明では、音声合成に定位感を与える
ための方法、およびシステムを提案している。
【0005】
【発明が解決しようとする課題】前述のスクリーンリー
ダ/2では、ユーザが予め再生したいテキスト情報の位
置を知っている場合には、ユーザはその位置にカーソル
やポインタを動かし、所定のキー操作等を行うことで所
望のテキストの音声を再生することができる。しかし、
ユーザが予め再生したい情報の位置を知らない場合に
は、適当な位置にカーソルやポインタを移動させ、読み
上げ命令を実行することになる。そして、所望の情報を
発見できるまで、カーソルやポインタを試行錯誤で動か
す必要があり、所望の情報を効率的に探索することは難
しいと考えられる。
【0006】仮に、情報の配置に規則性、例えば情報が
カテゴリ毎に空間上にまとまって位置づけられていた
り、時間的な法則性に基づいて配置されている場合、あ
るいは、大まかな情報の位置が分かっている場合、所望
の情報そのものでなくともその周辺情報が提示されれ
ば、所望の情報を探索する際における大きなヒントとな
りうる。
【0007】しかし、スクリーンリーダ/2では、カー
ソル位置に存在するテキストの音声情報しか再生されな
い。そのため、複数の箇所の情報を再生するには、指示
と再生命令を逐一繰り返す必要があり、ユーザに操作の
負担を強いる。また、そのような負担に加えて、情報の
内容と位置の関係を把握するためには、自分のカーソル
の動かし方を思い出すか、カーソルの位置を音声で聞き
ながら頭の中で整理・把握しなくてはならないという負
担もある。
【0008】一方、特開平8−263260号公報のテ
キスト読み上げ方法では、指示されたテキストの文書中
の位置が音声を聞きながら、明示的に音声、文字で表現
されなくとも理解できる。しかし、文書中の局所的な範
囲で、カーソルを動かして情報探索した場合、聴空間上
の特定の範囲に情報が定位するため、探索の過程で得ら
れた情報の位置関係が理解しづらいという問題も生じ
る。
【0009】また、特開平7−13581公報の音声へ
の空間情報提供方法およびシステムでは、音声に定位感
を与えることができるが、あくまでもシステム側から一
方的にユーザに提供するものであり、ユーザの状態を考
慮した処理はなされていなかった。
【0010】本発明はこのような点に鑑みてなされたも
のであり、ユーザの指示している位置の周辺の文書情報
を音声に基づいて把握することのできる文書読み上げ装
置を提供することを目的とする。
【0011】
【課題を解決するための手段】本発明では上記課題を解
決するために、画面上に表示される文書を音声に変換し
て読み上げる文書読み上げ装置において、前記画面上に
前記文書およびそれに係わる情報を表示する表示手段
と、前記画面上で任意の位置を指示する指示手段と、各
文書のテキスト情報や、予め設定された検索項目の表示
位置などの情報を記録する文書情報記録手段と、前記指
示された位置の周辺に存在する複数の検索項目を選択す
る検索項目選択手段と、前記選択された検索項目と前記
指定された位置との位置関係が聴空間上で判断できるよ
うにそれぞれを音声情報として前記聴空間上に配置する
音声情報配置手段と、前記配置された検索項目の内容を
音声に変換する音声変換手段と、前記変換された音声を
前記配置した通りに定位感を持たせて再生する音声再生
手段と、前記再生された音声を出力する音声出力手段
と、を有することを特徴とする文書読み上げ装置が提供
される。
【0012】このような文書読み上げ装置では、表示手
段により画面上に文書の検索項目が表示されている状態
で、ユーザが指示手段により画面上で任意の位置を指定
すると、検索項目選択手段が、文書情報記録手段から、
指示された位置の周辺に存在する複数の検索項目を選択
し、配置手段が、その選択された検索項目と指定された
位置との位置関係が聴空間上で判断できるようにそれぞ
れを音声情報として聴空間上に配置する。
【0013】音声変換手段は、配置された検索項目の内
容を音声に変換する。音声再生手段は、変換された音声
を配置した通りに定位感を持たせて再生し、この再生さ
れた音声を音声出力手段が出力する。
【0014】これにより、ユーザは、現在指定している
位置の周辺にどのような検索項目がどこに存在している
のかを音声で知ることができる。よって、指定位置を変
えていけば、音を頼りに目的の文書情報を検索すること
ができる。
【0015】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。図1は本形態の文書読み上げ装置
の機能構成を示すブロック図である。ここで示す機能に
おいて、制御部1、文書解析部6、音声情報配置部7、
音声変換部8、および音声再生部9は、ソフトウェアに
よって実現される機能である。まず、制御部1は、文書
読み上げ装置全体の管理を行うものであり、必要に応じ
て各機能感のデータのやりとりを行う。
【0016】文書情報記録部2は、ハードディスクなど
の記憶装置であり、読み上げの対象となる文書のテキス
ト、文書ID、文書名、タグ情報などの文書情報が格納
されている。また、文書情報記録部2には、文書選択時
に表示されるアイコンや、文書中に配されている見出し
などの検索項目の表示位置のデータも格納される。な
お、表示位置のデータは、現在の表示状態に応じて随時
変更される。
【0017】入力部3は、キーボードなどの入力装置で
ある。表示部4はモニタであり、読み上げ処理の操作画
面が表示される。なお、通常のモニタの他に、タッチパ
ネル式の表示装置を用いることもできる。指示入力部5
としては、マウスなどが用いられる。指示入力部5によ
って、読み上げる文書の選択や、その文書中の任意の位
置の指示が行われる。
【0018】文書解析部6は、制御部1から指示された
文書のデータを文書情報記録部2から読み出して、検索
項目として所定のタグの付いたテキストやキーワードを
抽出し、さらにその抽出した情報を文書中の位置情報と
ともに制御部1を介して文書情報記録部2に記録する。
新たに記録されたデータは、後述する音声出力の時に利
用される。
【0019】音声情報配置部7は、文書解析部6で抽出
された文書と、指示入力部5で指示された位置との位置
関係が聴空間上で判断できるように、それぞれを音声情
報として聴空間上に配置する。音声変換部8は、聴空間
上に配置された文書のテキスト情報を音声に変換する。
この音声変換部8には、市販の音声変換技術を用いるこ
とができる。任意のテキストを音声に変換する技術は、
1960年代後半あたりから活発に研究が行われ、現在
では、日本語、英語に対応した商品も数多くある。変換
技術には様々な手法が開発されているが、ほとんどの手
法を本形態に適用することができる。
【0020】音声再生部9は、音源記録部10に記録さ
れた種々の音源を合成し、変換された音声を配置した通
りに定位感を持たせて再生する。この再生された音声を
音声出力部11が出力する。ここで、音源記録部10
は、ハードディスクなどの記録装置である。また、音声
出力部11としては、スピーカやヘッドホンなどが用い
られる。
【0021】次に、本形態のより具体的な構成を説明す
る。図2は本形態の文書読み上げ装置の全体構成を示す
図である。文書読み上げ装置としては、パーソナルコン
ピュータ20を使用する。パーソナルコンピュータ20
のモニタ21では、読み上げ対象の文書が表示される。
パーソナルコンピュータ20の本体内部には、ハードデ
ィスクやメモリなどの記憶装置が設けられている。ハー
ドディスクには、各文書のテキストや他の関連で、文書
読み上げ処理のソフトウェアなどが格納されている。
【0022】各種データの入力は、キーボード22で行
われる。マウス23は、主に、文書の選択のためのアイ
コンの指示や、ウィンドウで開かれた文書中の任意の位
置を指定するのに使用される。ヘッドホン24には、例
えば市販のヘッドホンが使用される。ただし、聴空間に
定位感を与えることのできるものでれば、他の装置を使
用することができる。
【0023】次に、このパーソナルコンピュータ20を
使用しての具体的な文書読み上げ操作について説明す
る。図3は文書読み上げ画面の初期画面の一例を示す図
である。文書読み上げ画面30の初期画面では、読み上
げるための対象となる文書の各アイコン31〜35が表
示される。ユーザは、検索項目であるアイコン31〜3
5のいずれかを選択する際、マウスカーソル36を画面
上で移動させる。このとき、目的とする文書のアイコン
がすぐに見つかれば、そのアイコンにマウスカーソル3
6を移動し、クリックすることにより、簡単に文書選択
を行うことができる。
【0024】一方、アイコンの数が多かったり、アイコ
ンに付加されている文書名が読みにくいなどの場合に
は、ユーザは、キー入力などによって探索モードを選択
指定する。そして、おおよその見当でマウスカーソル3
6を画面上の任意の位置に置く。すると、マウスカーソ
ル36の近辺にあるアイコンが選択され、その文書名が
順番に読み上げられ、図2で示したヘッドホン24から
出力される。
【0025】図4は聴空間に配置するための検索項目の
選択方法の一例を示す図である。この方法では、マウス
カーソル36の位置から所定の半径r1内に存在する検
索項目(アイコン)を調べる。例えば、図のように7個
の検索項目R1〜R7があるとき、半径r1内に存在す
る検索項目はR1,R2,R3なので、これらを聴空間
に配置する選択項目として選択する。
【0026】図5は聴空間に配置するための検索項目の
選択方法の他の例を示す図である。この方法では、マウ
スカーソル36から近い順に予め決められた数の検索項
目を選択する。例えば3個の検索項目を選択することが
決められているとすると、7個の検索項目R1〜R7の
うち、マウスカーソル36から近い距離(D1,D2,
D3)にある3個の検索項目R1,R2,R3を選択す
る。
【0027】図4および図5のいずれの方法でアイコン
選択するかは、ユーザ側で選択設定することができる。
図4または図5の方法で選択されたアイコンの文書名
は、音声で読み上げられ、マウスカーソル36を聴空間
の中心として、その中心に対するそれぞれの聴空間上の
位置からヘッドホン24で聞くことができる。
【0028】図6は音声情報の聴空間への配置方法を説
明する図である。ここでは、マウスカーソル36の位置
する点P36を原点とするx−y座標を設定し、この座
標系における各アイコン32,33,35の位置P3
2,P33,P35を計算する。そして、モニタ21上
のマウスカーソル36の位置から所定の距離L1にある
点P0を想定し、この点P0と各アイコンの位置P3
2,P33,P35との距離の関係を相似的に一定倍の
大きさに拡大し、位置P32,P33,P35を聴空間
上に配置する。ただし、人間の聴覚特性などを考慮し
て、多少非線形的に拡大してもよい。
【0029】図7は聴空間上に配置された情報をユーザ
側で聞き取る場合のイメージを示す図である。ユーザの
ヘッドホン24からは、ユーザの位置(図6の点P0)
を原点として、図6の方法で配置された点P0を中心と
するP32,P33,P35の位置から、各アイコンの
文書名が音声出力される。この音声出力は、ユーザに対
して最も近いアイコンから順に行う方法と、対象となっ
ているすべてのアイコンを同時に出力する方法とがあ
る。これらの具体的な処理方法については後述する。
【0030】なお、ここでは、ユーザから見た聴空間の
正面を、図6の点P0から垂直にモニタ21の画面を見
たときの方向と一致させた。こうすることにより、モニ
タ21の画面上での配置方向と、ヘッドホン24で確認
できる配置方向とを一致させることができるので、聴空
間上でのマウスカーソル36で指示した位置に対するア
イコンの配置が容易に把握できる。
【0031】音声を聞くことによって目的のアイコンの
位置を確認したユーザは、聴空間で感じられる方向と同
じ方向にマウスカーソル36を移動させることにより、
目的のアイコンにマウスカーソル36を近づけることが
できる。また、マウスカーソル36が移動すると、制御
側では、新たにマウスカーソル36が移動した位置に基
づいてアイコンを選択し、上述同様の音声配置を行い、
音声出力する。したがって、ユーザは、目的のアイコン
にたどり着くまで、何回も位置を確認することができ
る。なお、マウスカーソル36が停止している場合に
は、同じ音声情報を繰り返し出力する。
【0032】こうして、目的のアイコンにマウスカーソ
ル36を位置決めすることができたらば、ユーザは、マ
ウス23のボタンをクリックして選択することにより、
その文書を画面上で開くことができる。
【0033】図8は文書選択後の文書読み上げ画面30
の状態を示す図である。ここでは、例えばアイコン35
の文書が選択されたものとする。すると、図に示すよう
に、アイコン35がウィンドウ351に切り替わり、そ
こに文書の内容が表示される。
【0034】図9はウィンドウ351内の文書の具体例
を示す図である。ここでは、文書として「特許明細書」
が選択された例を示す。なお、図では、アイコン31な
どの表示は省略した。ウィンドウ351によって文書が
表示されている場合でも、ユーザは、アイコン表示と同
様に、探索モードを指定して、読み上げを行わせたい部
分を探索することができる。
【0035】これを行うため、制御側では、予め、検索
項目である標題部分のテキストにタグを付してある。図
9の例では、すみつきかっこで囲まれた文字、すなわ
ち、「発明の名称」、「特許請求の範囲」、「産業上の
利用分野」、「従来技術」などにタグが付されている。
アイコンのクリックにより文書が選択されると、制御側
では、その文書内でタグの付されているテキストを抽出
し、抽出したデータを文書情報のデータとして記憶す
る。
【0036】図10は記憶装置内の文書情報のデータ例
を示す図であり、(A)はメインの文書情報の例を示す
図、(B)はタグ情報の例を示す図、(C)は現在開い
ている文書の具体的な情報の例を示す図である。まず文
書情報としては、図(A)に示すように、文書ID、文
書名、画面上でのアイコンの表示位置、記憶領域上の記
録箇所、タグ情報の格納場所がある。これらのうち表示
位置については、ユーザによってアイコンの移動操作が
なされたり、画面がスクロールされたりする度に随時変
更される。
【0037】各文書のタグ情報としては、図(B)に示
すように、タグの付された探索項目のテキスト部分のデ
ータと、それらの文書中における位置データとがある。
ここで示されている位置は、そのテキストの先頭文字の
位置である。
【0038】また、現在画面上で開かれている文書の情
報としては、図(C)に示すように、文書ID、文書を
表示しているウィンドウの表示位置、ウィンドウのサイ
ズ、表示している部分の文書中における位置がある。こ
こで、ウィンドウの表示位置は、ウィンドウの左上角の
位置を示す。
【0039】図9に戻り、ユーザが探索モードを指定し
た状態で、ウィンドウ351内の任意の位置にマウスカ
ーソル36を置くと、上述のアイコン31〜35の例と
同様に、図4または図5で示した方法によりマウスカー
ソル36の近辺にある探索項目が選択され、聴空間上で
定位感を持つようにヘッドホン24から音声出力され
る。具体的には、マウスカーソル36と距離の近い検索
項目のテキスト「特許請求の範囲」が最初に、次いで
「産業上の利用分野」、「発明の名称」、「従来技術」
という順にそれぞれ聴空間上で定位を持つようにヘッド
ホン24から音声出力される。
【0040】また、マウスカーソル36が移動すると、
制御側では、新たにマウスカーソル36が移動した位置
に基づいて検索項目を選択し、上述同様の音声配置を行
い、音声出力する。したがって、ユーザは、目的の検索
項目にたどり着くまで、何回も位置を確認することがで
きる。なお、マウスカーソル36が停止している場合に
は、同じ音声情報を繰り返し出力する。
【0041】希望する場所にマウスカーソル36を移動
することができたら、ユーザは、キー操作などによっ
て、文書読み上げ指令を行う。これにより、その項目の
文書が実際に読み上げられる。
【0042】次に、探索モードにおける音声出力の具体
的な方法について説明する。音声信号を再生する際に
は、制御側では、記憶装置に設けたバッファに、図11
に示すように、文書ID、空間上で定位させる位置、お
よび音声信号を一対にして格納する。さらに、これらの
音声信号V1,V2,V3などを、定位感を持った音声
信号に変換する。この際には、従来から知られている頭
部伝達関数を用いることができる。
【0043】ところで、聴空間に定位感を持って配置さ
れた音声信号を再生、出力する場合には、前述したよう
にマウスカーソル36に近いものから順に出力する方法
(以下、逐次再生と呼ぶ)と、選択されたすべての検索
項目を同時に出力する方法(以下、並列再生と呼ぶ)と
がある。まず、並列再生について説明する。
【0044】図12は並列再生方法の概念を示す図であ
る。まず、例えば、3つの音声信号V1,V2,V3を
並列再生する場合、これらは合成され、1つの音声信号
V10として、時刻t0に同時に再生、出力される。た
だし、当然、各信号V1,V2,V3は、聴空間上では
それぞれ異なる定位感で出力される。再生途中にマウス
カーソル36が移動しなければ、再生時間の最も長い音
声信号V2が終了した時点で音声信号V10の再生が終
了する。さらにマウスカーソル36が移動しなければ、
音声信号V10は繰り返し再生される。
【0045】一方、再生途中(時刻t1)でマウスカー
ソル36が移動されると、その移動後の位置に応じて新
たに検索項目が変更されるので、再生する音声信号も変
更される。ここでは、音声信号V1,V2については変
更なく、音声信号V3に変わって新たにV1,V2より
も長い音声信号V4が加えられたものとする。また、こ
のV1,V2,V4の合成後の音声信号をV11とす
る。
【0046】音声信号V11は、マウスカーソル36の
動かされた時刻t1(多少の遅れもある)から、信号の
先頭からt1だけ進んだ位置から再生される。こうする
ことにより、音声信号V1,V2については定位感の変
化した状態で内容を連続して再生でき、その一方で新た
な音声信号V4も再生できる。なお、並列再生の場合
は、すべての音声信号を詳細に聞き取ることは困難であ
る。しかし、目的のアイコンや見出しなどがカーソル指
定した位置の近辺にあるかどうかに関しては、素早く簡
単に判断できるという利点がある。
【0047】次に、逐次再生方法について説明する。図
13は逐次再生方法の概念を示す図である。まず、3つ
の音声信号V1,V2,V3を逐次再生する場合には、
時刻t0から、マウスカーソル36に最も近い検索項目
の音声信号V1から順に、定位感を持って再生、出力さ
れる。再生途中でマウスカーソル36が移動しなけれ
ば、最後の音声信号V3の出力が終了した時点で、再び
音声信号V1に戻って再生が繰り返される。
【0048】一方、再生途中の時刻t1でマウスカーソ
ル36が移動されると、その移動後の位置に応じて新た
に検索項目が変更されるので、再生する音声信号も変更
される。ここでは、音声信号V1,V2については変更
なく、音声信号V3に代わって新たに音声信号V4が加
えられたものとする。この場合には、再生途中であった
音声信号V2が存在するので、再生が中断された位置
(時刻t1)から再び再生を行い、音声信号V4の最後
まで再生、出力する。
【0049】一方、マウスカーソル36が移動したとき
に再生途中であった音声信号V2が、移動後に選択され
なかった場合には、図14に示すように、最初の音声信
号V1の先頭に戻って、再生を行う。なお、図14では
音声信号V1に変更がない例を示したが、V1も変更さ
れた場合には、新たに選択された音声信号のうちマウス
カーソル36に最も近いものから順に再生、出力すれば
よい。
【0050】なお、並列再生方法、逐次再生方法の何れ
の場合でも、探索モードが解除されない限り、音声の再
生は繰り返し行われる。次に、上記のような処理を実行
するためのパーソナルコンピュータ20側のソフトウェ
ア処理の手順について説明する。
【0051】図15は本形態の文書読み上げ処理におけ
る探索モードを実行するための制御側の処理手順を示す
フローチャートである。 〔S1〕探索モードが解除されたか否かを判断し、解除
されればステップS11に進み、解除されなければステ
ップS2に進む。 〔S2〕マウスカーソル36の現在の座標位置を検知す
る。 〔S3〕マウスカーソル36の座標が移動したか否かを
判断し、移動すればステップS4に進み、移動しなけれ
ばステップS1に戻る。 〔S4〕マウスカーソル36がウィンドウ内にあるか否
かを判断し、あればステップS5に進み、なければステ
ップS7に進む。 〔S5〕マウスカーソル36の付近に位置するタグ付き
テキストを検出する。 〔S6〕検出されたタグ付きテキストを聴空間上に配置
する。 〔S7〕マウスカーソル36の付近に位置するアイコン
を検出する。 〔S8〕検出されたアイコンの文書名を聴空間上に配置
する。 〔S9〕配置されたテキストまたは文書名を音声変換す
る。 〔S10〕音声変換されたデータをそれぞれ聴空間上で
定位するように再生し、ヘッドホンから出力する。 〔S11〕探索モードを解除する。
【0052】図16は図15のステップS5の具体的な
処理手順を示すフローチャートである。 〔S21〕記憶装置内の文書情報から、表示文書中のタ
グ付きのテキストの表示座標などのデータを抽出する。 〔S22〕抽出されたテキストについて、マウスカーソ
ル36で指示された座標との距離を計算する。 〔S23〕ステップS22における計算結果に基づい
て、所定のルール、すなわち、図4または図5で示した
方法を用いて、マウスカーソル36に近接するテキスト
を選択する。
【0053】図17は図15のステップS7の具体的な
処理手順を示すフローチャートである。 〔S31〕記憶装置内の文書情報から、表示中のアイコ
ンの表示座標などのデータを抽出する。 〔S32〕抽出されたアイコンについて、マウスカーソ
ル36で指示された座標との距離を計算する。 〔S33〕ステップS32における計算結果に基づい
て、所定のルール、すなわち、図4または図5で示した
方法を用いて、マウスカーソル36に近接するアイコン
を選択する。
【0054】以上説明したように、本形態では、文書選
択用のアイコンや、文書中の標題などの検索項目につい
て、マウスカーソル36の付近に存在する検索項目を聴
空間上で定位感を持たせて音声出力するようにしたの
で、ユーザは、現在指定している位置の周辺にどのよう
な検索項目がどこに存在しているのかを音声で知ること
ができる。よって、指定位置を変えていけば、音を頼り
に目的の文書情報を検索することができる。
【0055】なお、本形態では、テキストの位置を参照
する際、画面上の表示位置を用いたが、この他に、例え
ば文書をクラスタリングした際に文書に付与されるベク
トル情報などを用いてもよい。
【0056】また、本形態では、探索モードのときにマ
ウスカーソル36によって位置を指示するようにした
が、モニタ21にタッチパネル式のモニタを用いて、そ
のタッチパネルで入力するようにしてもよい。これによ
り、画面表示を確認しながら探索できるので、情報空間
全体を把握しながら指示をすることができる。
【0057】さらに、本形態では、マウスカーソル36
に近接する検索項目を、図4や図5の方法を用いて探索
するようにしたが、これらの方法に、「スポーツ」や
「映画」などといった情報の属性などを検索条件に加え
るようにすれば、ユーザの希望する項目をより的確に探
索することができる。
【0058】
【発明の効果】以上説明したように本発明では、画面上
に文書の検索項目が表示されている状態で、ユーザが画
面上で任意の位置を指定すると、指示された位置の周辺
に存在する複数の検索項目を選択し、その選択された検
索項目と指定された位置との位置関係が聴空間上で判断
できるようにそれぞれ定位感を持たせて音声で再生、出
力するようにしたので、ユーザは、現在指定している位
置の周辺にどのような検索項目がどこに存在しているの
かを音声で知ることができる。
【0059】よって、指定位置を変えていけば、音を頼
りに目的の文書情報を検索することができる。
【図面の簡単な説明】
【図1】 本形態の文書読み上げ装置の機能構成を示す
ブロック図である。
【図2】 本形態の文書読み上げ装置の全体構成を示す
図である。
【図3】 文書読み上げ画面の初期画面の一例を示す図
である。
【図4】 聴空間に配置するための検索項目の選択方法
の一例を示す図である。
【図5】 聴空間に配置するための検索項目の選択方法
の他の例を示す図である。
【図6】 音声情報の聴空間への配置方法を説明する図
である。
【図7】 聴空間上に配置された情報をユーザ側で聞き
取る場合のイメージを示す図である。
【図8】 文書選択後の文書読み上げ画面の状態を示す
図である。
【図9】 ウィンドウ内の文書の具体例を示す図であ
る。
【図10】 記憶装置内の文書情報のデータ例を示す図
であり、(A)はメインの文書情報の例を示す図、
(B)はタグ情報の例を示す図、(C)は現在開いてい
る文書の具体的な情報の例を示す図である。
【図11】 バッファに格納された音声信号に関するデ
ータの例を示す図である。
【図12】 並列再生方法の概念を示す図である。
【図13】 逐次再生方法の概念を示す図である。
【図14】 逐次再生方法の他のパターンを示す図であ
る。
【図15】 本形態の文書読み上げ処理における探索モ
ードを実行するための制御側の処理手順を示すフローチ
ャートである。
【図16】 図15のステップS5の具体的な処理手順
を示すフローチャートである。
【図17】 図15のステップS7の具体的な処理手順
を示すフローチャートである。
【符号の説明】
1 制御部 2 文書情報記録部 3 入力部 4 表示部 5 指示入力部 6 文書解析部 7 音声情報配置部 8 音声変換部 9 音声再生部 10 音源記録部 11 音声出力部 20 パーソナルコンピュータ 21 モニタ 22 キーボード 23 マウス 24 ヘッドホン 30 文書読み上げ画面 31〜35 アイコン 36 マウスカーソル

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 画面上に表示される文書を音声に変換し
    て読み上げる文書読み上げ装置において、 前記画面上に前記文書およびそれに係わる情報を表示す
    る表示手段と、 前記画面上で任意の位置を指示する指示手段と、 各文書のテキスト情報や、予め設定された検索項目の表
    示位置などの情報を記録する文書情報記録手段と、 前記指示された位置の周辺に存在する複数の検索項目を
    選択する検索項目選択手段と、 前記選択された検索項目と前記指定された位置との位置
    関係が聴空間上で判断できるようにそれぞれを音声情報
    として前記聴空間上に配置する音声情報配置手段と、 前記配置された検索項目の内容を音声に変換する音声変
    換手段と、 前記変換された音声を前記配置した通りに定位感を持た
    せて再生する音声再生手段と、 前記再生された音声を出力する音声出力手段と、 を有することを特徴とする文書読み上げ装置。
JP10262896A 1998-09-17 1998-09-17 文書読み上げ装置 Pending JP2000099307A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10262896A JP2000099307A (ja) 1998-09-17 1998-09-17 文書読み上げ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10262896A JP2000099307A (ja) 1998-09-17 1998-09-17 文書読み上げ装置

Publications (1)

Publication Number Publication Date
JP2000099307A true JP2000099307A (ja) 2000-04-07

Family

ID=17382130

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10262896A Pending JP2000099307A (ja) 1998-09-17 1998-09-17 文書読み上げ装置

Country Status (1)

Country Link
JP (1) JP2000099307A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020055398A (ko) * 2000-12-28 2002-07-08 가시오 가즈오 전자 서적 송출장치, 전자 서적 장치 및 기록매체
KR20020074816A (ko) * 2001-03-22 2002-10-04 솔칩테크놀로지(주) 휴대용 다기능 전자책 및 그 제어방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020055398A (ko) * 2000-12-28 2002-07-08 가시오 가즈오 전자 서적 송출장치, 전자 서적 장치 및 기록매체
KR20020074816A (ko) * 2001-03-22 2002-10-04 솔칩테크놀로지(주) 휴대용 다기능 전자책 및 그 제어방법

Similar Documents

Publication Publication Date Title
EP0596823B1 (en) Method and system for accessing associated data sets in a multimedia environment in a data processing system
Arons Hyperspeech: Navigating in speech-only hypermedia
JP4225567B2 (ja) 時間ベース情報の空間アクセス方法
KR0138003B1 (ko) 시각 장애가 있는 컴퓨터 사용자가 표시된 객체를 그래픽에 의해 선택할 수 있도록 해주는 방법 및 시스템
JPH07200230A (ja) オブジェクト指向ユーザ・インターフェイス内にマルチメディア表現を統合する方法及びシステム
JP2003307997A (ja) 語学教育システム、音声データ処理装置、音声データ処理方法、音声データ処理プログラム、及び記憶媒体
JPH0973461A (ja) 音声による文章情報再生装置
JP3340581B2 (ja) テキスト読み上げ装置及びウインドウシステム
JP2000231475A (ja) マルチメディア情報閲覧システムにおける音声読み上げ方法
JP6095553B2 (ja) 情報表示装置、方法及びプログラム
Chen et al. AudioBrowser: a mobile browsable information access for the visually impaired
JPH11259501A (ja) 発言構造検出表示装置
JP2000099307A (ja) 文書読み上げ装置
JP2003091344A (ja) 情報処理装置および情報処理方法、記録媒体、データ構造、並びにプログラム
JPH08255466A (ja) オーディオデータ記録および/または再生方法およびその装置
JP3409999B2 (ja) データ編集装置及びデータ編集方法
JP2006189799A (ja) 選択可能な音声パターンの音声入力方法及び装置
JP2005326811A (ja) 音声合成装置および音声合成方法
JP2005148727A (ja) 学習支援装置
JP4433532B2 (ja) 文書処理装置、文書処理方法、記録媒体
KR100473163B1 (ko) 멀티미디어 컨텐츠가 저장된 기록 매체 및 그 재생을 위한장치와 방법
JP2953730B2 (ja) 情報機器
Lorho et al. Structured menu presentation using spatial sound separation
JP2753324B2 (ja) 情報処理システム
JP2010073205A (ja) 文書処理装置、文書処理方法、記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040608

A131 Notification of reasons for refusal

Effective date: 20050426

Free format text: JAPANESE INTERMEDIATE CODE: A131

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050802

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050815

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090902

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100902

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 6

Free format text: PAYMENT UNTIL: 20110902

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 7

Free format text: PAYMENT UNTIL: 20120902

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130902

Year of fee payment: 8

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350