JP2001027997A - 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体 - Google Patents

電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体

Info

Publication number
JP2001027997A
JP2001027997A JP19948199A JP19948199A JP2001027997A JP 2001027997 A JP2001027997 A JP 2001027997A JP 19948199 A JP19948199 A JP 19948199A JP 19948199 A JP19948199 A JP 19948199A JP 2001027997 A JP2001027997 A JP 2001027997A
Authority
JP
Japan
Prior art keywords
electronic document
phrase
sentence
document processing
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP19948199A
Other languages
English (en)
Inventor
Katashi Nagao
確 長尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP19948199A priority Critical patent/JP2001027997A/ja
Publication of JP2001027997A publication Critical patent/JP2001027997A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 優れた操作性のもとに、電子文書の形態の任
意の文書を読み上げるとともに、文書のテロップを作成
して表示する。 【解決手段】 文書処理装置は、ユーザインターフェー
ス用ウィンドウ170を表示部に表示する。ユーザイン
ターフェース用ウィンドウ170は、現在読み上げてい
る文の先頭、前の文の先頭、次の文の先頭、現在読み上
げている段落の先頭、前の段落の先頭、次の段落の先
頭、現在読み上げている句の先頭、前の句の先頭、次の
句の先頭にそれぞれジャンプさせるためのジャンプAボ
タン174、ジャンプBボタン175、ジャンプCボタ
ン176、ジャンプAボタン177、ジャンプBボタン
178、ジャンプCボタン179、ジャンプAボタン1
80、ジャンプBボタン181、ジャンプCボタン18
2とを有する。文書処理装置は、これらの各種ボタンを
操作し、読み上げ又はテロップ表示の際の頭出しを行
う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電子文書を処理す
る電子文書処理方法及び電子文書処理装置並びに電子文
書処理プログラムが記録された記録媒体に関する。
【0002】
【従来の技術】従来、インターネットにおいて、ウィン
ドウ形式でハイパーテキスト型情報を提供するアプリケ
ーションサービスとしてWWW(World Wide Web)が提
供されている。
【0003】WWWは、文書の作成、公開又は共有化の
文書処理を実行し、新しいスタイルの文書の在り方を示
したシステムである。しかし、文書の実際上の利用の観
点からは、文書の内容に基づいた文書の分類や要約とい
った、WWWを越える高度な文書処理が求められてい
る。このような高度な文書処理には、文書の内容の機械
的な処理が不可欠である。
【0004】しかしながら、文書の内容の機械的な処理
は、以下のような理由から依然として困難である。すな
わち、第1には、ハイパーテキストを記述する言語であ
るHTML(Hyper Text Markup Language)は、文書の
表現については規定するが、文書の内容についてはほと
んど規定しないためである。第2には、文書間に構成さ
れたハイパーテキストのネットワークは、文書の読者に
とって文書の内容を理解するために必ずしも利用しやす
いものではないためである。第3には、一般に文書の著
作者は、読者の便宜を念頭に置かずに著作するが、文書
の読者の便宜が著作者の便宜と調整されることはないた
めである。
【0005】このように、WWWは、新しい文書の在り
方を示したシステムであるが、文書を機械的に処理しな
いために、高度な文書処理を行うことができなかった。
換言すると、高度な文書処理を実行するためには、文書
を機械的に処理することが必要となる。
【0006】そこで、文書の機械的な処理を目標とし
て、文書の機械的な処理を支援するシステムが自然言語
研究の成果に基づいて開発されている。自然言語研究に
よる文書処理として、文書の著作者等による文書の内部
構造についての属性情報、いわゆるタグの付与を前提と
した、文書に付与されたタグを利用する機械的な文書処
理が提案されている。
【0007】
【発明が解決しようとする課題】ところで、近年のコン
ピュータの普及やネットワーク化の進展にともない、文
書処理の高機能化が求められており、そのなかでも、文
書を音声合成して読み上げる機能が求められている。
【0008】音声合成は、本来、音声の分析結果や人間
の音声の生成機構の模擬に基づいて機械的に音声を生成
するものであり、個々の言語の要素又は音素をディジタ
ル制御のもとに組み立てるものである。
【0009】しかしながら、音声合成においては、任意
の文書を読み上げる際に、文書の切れ目等を考慮して読
み上げることはできず、自然な読み上げを行うことはで
きなかった。また、音声合成においては、言語に応じ
て、使用する音声合成エンジンをユーザが適宜選択する
必要があった。さらに、音声合成においては、例えば専
門用語や難訓語といった読み誤りを生じやすい語を正確
に読み上げる精度は、使用する辞書に依存するものであ
った。
【0010】また、文書を音声合成して読み上げるだけ
では、ユーザが文書の内容を把握することが困難な場合
があった。そこで、文書を音声合成して読み上げるとと
もに、文書を表示することが考えられるが、文書の読み
上げと表示とを精度よく対応付けるものはなかった。
【0011】対象とする文書をユーザにわかりやすく表
示する機能を有する機器としては、例えば、ページ単位
で書かれた文書を表示するものがある。このような機器
においては、ユーザがページを切り換えるボタン等を操
作することによって、表示部にページ単位で文書を表示
させ、黙読することができる。
【0012】また、文書を表示する方法としては、いわ
ゆるテロップを作成して表示することが考えられる。テ
ロップは、一般に、対象とする文書を例えば字幕のよう
に一次元的な表示部上に流れるように移動表示したもの
である。
【0013】このようなテロップを表示する機器におい
ては、ユーザがページ切り換えのための操作等を行う必
要がなく、文書を黙読することができる。
【0014】しかしながら、このようなテロップにおい
ては、任意の文書を表示する際に、文書の切れ目等を考
慮しておらず、ユーザが文書を読むスピードに合わせて
文書が移動表示されていないことから、ユーザが文書の
内容を把握するのに困難をともなうことがあった。
【0015】本発明は、このような実情に鑑みてなされ
たものであり、任意の文書を音声合成により高精度で且
つ違和感がなく読み上げることができ、利便性に優れた
操作性を有する電子文書処理方法及び電子文書処理装
置、並びに電子文書処理プログラムが記録された記録媒
体を提供することを目的とする。
【0016】また、本発明は、任意の文書のテロップを
高精度に作成し、作成したテロップをユーザの把握が容
易となるように表示することができ、利便性に優れた操
作性を有する電子文書処理方法及び電子文書処理装置、
並びに電子文書処理プログラムが記録された記録媒体を
提供することを目的とする。
【0017】
【課題を解決するための手段】上述した目的を達成する
本発明にかかる電子文書処理方法は、電子文書を処理す
る電子文書処理方法において、複数の要素が階層化され
た木構造である内部構造を有し、木構造における階層を
示すタグ情報が付与されている電子文書を、タグ情報に
基づいて読み上げる文書読み上げ工程を備え、文書読み
上げ工程では、タグ情報に基づいて、階層毎に電子文書
の階層の先頭に頭出しして電子文書を読み上げることを
特徴としている。
【0018】このような本発明にかかる電子文書処理方
法は、複数の要素が階層化された木構造である内部構造
を有し、木構造における階層を示すタグ情報が付与され
ている電子文書を、タグ情報に基づいて読み上げる際
に、タグ情報に基づいて、階層毎に電子文書の階層の先
頭に頭出しする。
【0019】また、上述した目的を達成する本発明にか
かる電子文書処理方法は、電子文書を処理する電子文書
処理方法において、複数の要素が階層化された木構造で
ある内部構造を有し、木構造における階層を示すタグ情
報が付与されている電子文書の一部を表示領域に切り換
え表示又は移動表示する表示制御工程を備え、表示制御
工程では、タグ情報に基づいて、階層毎に電子文書の階
層の先頭に頭出しして電子文書の一部を表示領域に切り
換え表示又は移動表示することを特徴としている。
【0020】このような本発明にかかる電子文書処理方
法は、複数の要素が階層化された木構造である内部構造
を有し、木構造における階層を示すタグ情報が付与され
ている電子文書の一部を表示領域に切り換え表示又は移
動表示する際に、タグ情報に基づいて、階層毎に電子文
書の階層の先頭に頭出しする。
【0021】さらに、上述した目的を達成する本発明に
かかる電子文書処理装置は、電子文書を処理する電子文
書処理装置において、複数の要素が階層化された木構造
である内部構造を有し、木構造における階層を示すタグ
情報が付与されている電子文書を、タグ情報に基づいて
読み上げる文書読み上げ手段と、タグ情報に基づいて、
文書読み上げ手段に、階層毎に電子文書の階層の先頭に
頭出しさせて電子文書を読み上げさせる頭出し手段とを
備えることを特徴としている。
【0022】このような本発明にかかる電子文書処理装
置は、複数の要素が階層化された木構造である内部構造
を有し、木構造における階層を示すタグ情報が付与され
ている電子文書を、タグ情報に基づいて文書読み上げ手
段により読み上げる際に、頭出し手段がタグ情報に基づ
いて、文書読み上げ手段に、階層毎に電子文書の階層の
先頭に頭出しさせる。
【0023】さらにまた、上述した目的を達成する本発
明にかかる電子文書処理装置は、電子文書を処理する電
子文書処理装置において、複数の要素が階層化された木
構造である内部構造を有し、木構造における階層を示す
タグ情報が付与されている電子文書の一部を表示領域に
切り換え表示又は移動表示する表示制御手段と、タグ情
報に基づいて、表示制御手段に、階層毎に電子文書の階
層の先頭に頭出しさせて電子文書の一部を表示領域に切
り換え表示又は移動表示させる頭出し手段とを備えるこ
とを特徴としている。
【0024】このような本発明にかかる電子文書処理装
置は、複数の要素が階層化された木構造である内部構造
を有し、木構造における階層を示すタグ情報が付与され
ている電子文書の一部を表示制御手段により表示領域に
切り換え表示又は移動表示する際に、頭出し手段がタグ
情報に基づいて、表示制御手段に、階層毎に電子文書の
階層の先頭に頭出しさせる。
【0025】また、上述した目的を達成する本発明にか
かる電子文書処理プログラムが記録された記録媒体は、
電子文書を処理するコンピュータ制御可能な電子文書処
理プログラムが記録された記録媒体において、電子文書
処理プログラムは、複数の要素が階層化された木構造で
ある内部構造を有し、木構造における階層を示すタグ情
報が付与されている電子文書を、タグ情報に基づいて読
み上げる文書読み上げ工程を備え、文書読み上げ工程で
は、タグ情報に基づいて、階層毎に電子文書の階層の先
頭に頭出しして電子文書を読み上げることを特徴として
いる。
【0026】このような本発明にかかる電子文書処理プ
ログラムが記録された記録媒体は、複数の要素が階層化
された木構造である内部構造を有し、木構造における階
層を示すタグ情報が付与されている電子文書を、タグ情
報に基づいて読み上げる際に、タグ情報に基づいて、階
層毎に電子文書の階層の先頭に頭出しする電子文書処理
プログラムを提供する。
【0027】さらに、上述した目的を達成する本発明に
かかる電子文書処理プログラムが記録された記録媒体
は、電子文書を処理するコンピュータ制御可能な電子文
書処理プログラムが記録された記録媒体において、電子
文書処理プログラムは、複数の要素が階層化された木構
造である内部構造を有し、木構造における階層を示すタ
グ情報が付与されている電子文書の一部を表示領域に切
り換え表示又は移動表示する表示制御工程を備え、表示
制御工程では、タグ情報に基づいて、階層毎に電子文書
の階層の先頭に頭出しして電子文書の一部を表示領域に
切り換え表示又は移動表示することを特徴としている。
【0028】このような本発明にかかる電子文書処理プ
ログラムが記録された記録媒体は、複数の要素が階層化
された木構造である内部構造を有し、木構造における階
層を示すタグ情報が付与されている電子文書の一部を表
示領域に切り換え表示又は移動表示する際に、タグ情報
に基づいて、階層毎に電子文書の階層の先頭に頭出しす
る電子文書処理プログラムを提供する。
【0029】
【発明の実施の形態】以下、本発明を適用した具体的な
実施の形態について図面を参照しながら詳細に説明す
る。
【0030】本発明の実施の形態として示す文書処理装
置は、与えられた電子文書やその電子文書から作成した
要約文を音声合成エンジンにより音声合成して読み上げ
るとともに、電子文書や要約文のテロップを作成して表
示する機能を有するものである。以下では、文書処理装
置による文書又は要約文の読み上げについて先に説明
し、その後テロップの作成について説明する。なお、以
下の説明では、電子文書を単に文書と記すものとする。
【0031】文書処理装置は、図1に示すように、制御
部11及びインターフェース12を有する本体10と、
ユーザにより入力された情報を本体10に供給する入力
部20と、外部からの信号を受信して本体10に供給す
る受信部21と、サーバ24と本体10との間の通信処
理を行う通信部22と、本体10から出力される情報を
音声として出力する音声出力部30と、本体10から出
力される情報を表示する表示部31と、記録媒体33に
対して情報を記録及び/又は再生する記録/再生部32
と、ハードディスクドライブ(Hard Disk Drive;HD
D)34とを備える。
【0032】本体10は、制御部11と、インターフェ
ース12とを有し、この文書処理装置の主要な部分を構
成する。
【0033】制御部11は、この文書処理装置における
処理を実行するCPU(Central Processing Unit)1
3と、揮発性のメモリであるRAM(Random Access Me
mory)14と、不揮発性のメモリであるROM(Read O
nly Memory)15とを有する。
【0034】CPU13は、例えばROM15やハード
ディスクに記録されているプログラムにしたがって、プ
ログラムを実行するための制御を行う。RAM14に
は、CPU13が各種処理を実行する上で必要なプログ
ラムやデータが必要に応じて一時的に格納される。
【0035】インターフェース12は、入力部20、受
信部21、通信部22、表示部31、記録/再生部32
及びハードディスクドライブ34に接続される。インタ
ーフェース12は、制御部11の制御のもとに、入力部
20、受信部21及び通信部22を介して供給されるデ
ータの入力、表示部31へのデータの出力、記録/再生
部32に対するデータの入出力について、データを入出
力するタイミングを調整し、データの形式を変換する。
【0036】入力部20は、この文書処理装置に対する
ユーザの入力を受ける部分である。この入力部20は、
例えばキーボードやマウスにより構成される。ユーザ
は、この入力部20を用いることで、例えば、キーボー
ドによりキーワードを入力したり、マウスにより表示部
31に表示される文書のエレメントを選択して入力する
ことができる。なお、エレメントとは、文書を構成する
要素であって、例えば文書、文及び語を含むものであ
る。
【0037】受信部21は、この文書処理装置に対し
て、外部から例えば通信回線を介して送信されるデータ
を受信する。この受信部21は、電子文書である複数の
文書やこれらの文書を処理するための電子文書処理プロ
グラムを受信する。受信部21により受信されたデータ
は、本体10に供給される。
【0038】通信部22は、例えばモデムやターミナル
アダプタ等により構成され、電話回線を介してインター
ネット23に接続される。インターネット23には、文
書等のデータを格納したサーバ24が接続されており、
通信部22は、インターネット23を介してサーバ24
にアクセスし、このサーバ24からデータを受信するこ
とができる。この通信部22により受信されたデータ
は、本体10に供給される。
【0039】音声出力部30は、例えば、スピーカによ
り構成され、音声合成エンジン等により音声合成されて
得られる電気的な音声信号やその他の各種音声信号をイ
ンターフェース12を介して入力し、音声に変換して出
力する。
【0040】表示部31は、文字情報や画像情報をイン
ターフェース12を介して入力し、表示する。この表示
部31は、例えば陰極線管(Cathode Ray Tube;CR
T)や液晶表示装置(Liquid Crystal Display;LC
D)により構成され、例えば単数又は複数のウィンドウ
を表示し、このウィンドウ上に文字や図形等を表示す
る。
【0041】記録/再生部32は、制御部11の制御の
もとに、例えば、フロッピーディスク、光ディスク、光
磁気ディスクといった着脱可能な記録媒体33に対して
データの記録及び/又は再生を行う。また、記録媒体3
3には、文書を処理するための電子文書処理プログラム
や処理対象とする文書が記録されている。
【0042】ハードディスクドライブ34は、大容量の
磁気記録媒体であるハードディスクに対してデータの記
録及び/又は再生を行う。
【0043】このような文書処理装置は、以下のように
して所望の文書を受信し、表示部31に表示する。
【0044】文書処理装置においては、まずユーザが入
力部20を操作してインターネット23を介して通信を
行うためのプログラムを起動し、サーバ24(サーチエ
ンジン)のURL(Uniform Resource Locator)を入力
すると、制御部11は、通信部22を制御し、サーバ2
4にアクセスする。
【0045】これに応じて、サーバ24は、インターネ
ット23を介して、文書処理装置の通信部22に検索画
面のデータを出力する。文書処理装置においてCPU1
3は、このデータをインターフェース12を介して表示
部31に出力し、表示させる。
【0046】文書処理装置においては、ユーザが入力部
20を用いてこの検索画面上でキーワード等を入力して
検索を指令すると、通信部22からインターネット23
を介して、サーチエンジンとしてのサーバ24に対して
検索命令が送信される。
【0047】サーバ24は、検索命令を受信すると、こ
の検索命令を実行し、得られた検索結果をインターネッ
ト23を介して通信部22に送信する。文書処理装置に
おいて制御部11は、通信部22を制御し、サーバ24
から送信される検索結果を受信させ、その一部を表示部
31に表示させる。
【0048】具体的には、ユーザが入力部20を用いて
例えば「TCP」というキーワードを入力して検索を指
令した場合には、文書処理装置には、サーバ24から
「TCP」のキーワードを含む各種情報が送信され、表
示部31には以下のような文書が表示される。
【0049】「TCP/IP(Transmission Control Protocol
/Internet Protocol)の歴史は、北米の、いや世界のコ
ンピュータネットワークの歴史であるといっても過言で
はない。そしてそのTCP/IPの歴史は、ARPANETを抜きに
して語ることはできない。ARPANETは正式名称をAdvance
d Research Project Agency Network(高等研究計画局
ネットワーク)といい、アメリカ国防省のDOD(Departme
nt of Defence)の国防高等研究計画局(DARPA:Defence A
dvanced Research Project Agency)がスポンサーとなっ
て構築されてきた、実験および研究用のパケット交換ネ
ットワークである。1969年北米西海岸の4個所の大学、
研究機関のホストコンピュータを50kbpsの回線で結んだ
きわめて小規模なネットワークからARPANETは出発し
た。
【0050】当時は1945年に世界初のコンピュータであ
るENIACがペンシルバニア大学で開発され、1964年には
じめてICを理論素子として実装し、第3世代のコンピュ
ータの歴史を形成したメインフレームの汎用コンピュー
タシリーズが開発され、やっとコンピュータが産声をあ
げたばかりあった。この時代背景を考えると、将来のコ
ンピュータ通信の最盛を見越したこのようなプロジェク
トは、まさに米国ならではのものであったといえるだろ
う。」
【0051】この文書は、その内部構造を後述するタグ
付けによる属性情報によって記述されている。文書処理
装置における文書処理は、文書に付与されたタグを参照
して行われる。この実施の形態においては、文書の構造
を示す統語論的タグとともに、多言語間で文書の機械的
な内容理解を可能にするような意味的・語用論的タグを
文書に付与している。
【0052】統語論的タグ付けとしては、文書のツリー
状の内部構造を記述するタグ付けがある。すなわち、本
実施の形態においては、図2に示すように、このタグ付
けによる内部構造、文書、文、語彙エレメント等の各エ
レメント、通常リンク、参照・被参照リンク等が、タグ
として予め文書に付与されている。同図中において、白
丸“○”は、語彙、セグメント、文といった文書の要
素、すなわちエレメントであり、最下位の白丸“○”
は、文書における最小レベルの語に対応する語彙エレメ
ントである。また、実線は、語、句、節、文等の文書の
エレメント間のつながりを示す通常リンク(normal lin
k)である。破線は、参照・被参照による係り受け関係
を示す参照リンク(reference link)である。文書の内
部構造は、上位から下位への順序で、文書(documen
t)、サブディビジョン(subdivision)、段落(paragr
aph)、文(sentence )、サブセンテンシャルセグメン
ト(subsentential segment )、・・・、語彙エレメン
トから構成される。これらのうち、サブディビジョンと
段落は、オプションである。
【0053】一方、意味論・語用論的なタグ付けとして
は、係り受け、例えば代名詞の指示対象等を示す統語構
造(syntactic structure)に関するタグ付けや多義語
の意味のように意味(semantic)の情報を記述するもの
がある。本実施の形態におけるタグ付けは、HTML
(Hyper Text Markup Language)と同様なXML(eXte
nsible Markup Language)の形式によるものである。
【0054】ここで、タグ付けされた文書の内部構造の
一例を以下に示すが、文書へのタグ付けは、この方法に
限定されるものではない。また、以下では、英語と日本
語の文書の例を示すが、タグ付けによる内部構造の記述
は、他の言語にも同様に適用可能であることを断ってお
く。
【0055】例えば、“Time flies like an arrow.”
という文については、<文><名詞句 語義=“Time
0”>time</名詞句><動詞句><動詞 語義=“fly
1”>flies</動詞><形容動詞句><形容動詞 語義
=“like0”>like</形容動詞><名詞句>an<名詞
語義=“arrow0”>arrow</名詞></名詞句><
/形容動詞句></動詞句>.</文>というようにタ
グ付けすることができる。
【0056】ここで、<文>、<名詞>、<名詞句>、
<動詞>、<動詞句>、<形容動詞>、<形容動詞句>
は、それぞれ、文、名詞、名詞句、動詞、動詞句、形容
詞を含む前置詞句又は後置詞句/形容詞句、形容詞句/
形容動詞句のような文の統語構造を表している。タグ
は、エレメントの先端の直前及び終端の直後に対応して
配置される。エレメントの終端の直後に配置されるタグ
は、記号“/”によりエレメントの終端であることを示
している。エレメントは、統語的構成素、すなわち、
句、節及び文を示す。なお、語義(word sense)=“ti
me0”は、語“time”の有する複数の意味、すなわち、
複数の語義のうちの第0番目の意味であることを指して
いる。具体的には、“time”には、名詞と動詞がある
が、ここでは“time”が名詞であることを示している。
この例示の他にも、例えば、語“オレンジ”は、少なく
とも植物の名前、色、果物の意味があるが、これらも語
義によって区別することができる。
【0057】このような文書を用いる文書処理装置にお
いては、図3に示すように、表示部31のウィンドウ1
01に統語構造を表示することができる。ウィンドウ1
01においては、右半面103に語彙エレメントが表示
されるとともに、左半面102に文の内部構造が表示さ
れる。このウィンドウ101においては、日本語で記述
された文書のみならず、英語等の任意の言語で記述され
た文書についても、統語構造を表示することができる。
【0058】具体的には、このウィンドウ101の右半
面103には、ここでは、タグ付けされた次に示すよう
な文書「A氏のB会が終わったC市で、一部の大衆紙と
一般紙がその写真報道を自主規制する方針を紙面で明ら
かにした。」の一部が表示されている。この文書のタグ
付けの例を次に示す。
【0059】<文書><文><形容動詞句 関係=“場
所”><名詞句><形容動詞句 場所=“C市”><形
容動詞句 関係=“主語”><名詞句 識別子=“B
会”><形容動詞句関係=“所有”><人名 識別子=
“A氏”>A氏</人名>の</形容動詞句><組織名
識別子=“B会”>B会</組織名></名詞句>が
</形容動詞句>終わった</形容動詞句><地名 識
別子=“C市”>C市</地名></名詞句>で、</
形容動詞句><形容動詞句 関係=“主語”><名詞句
識別子=“新聞” 統語=“並列”><名詞句><形
容動詞句>一部の</形容動詞句>大衆紙</名詞句>
と<名詞>一般紙</名詞></名詞句>が</形容動
詞句><形容動詞句 関係=“目的語”><形容動詞句
関係=“内容” 主語=“新聞”><形容動詞句 関
係=“目的語”><名詞句><形容動詞句><名詞 共
参照=“B会”>そ</名詞>の</形容動詞句>写真
報道</名詞句>を</形容動詞句>自主規制する</
形容動詞句>方針を</形容動詞句><形容動詞句 関
係=“位置”>紙面で</形容動詞句>明らかにした。
</文></文書>
【0060】この文書においては、「一部の大衆紙と一
般紙」は、統語=“並列”というタグにより並列である
ことが表されている。並列の定義は、係り受け関係を共
有するということである。特に何も指定がない場合に
は、例えば、<名詞句 関係=“x”><名詞>A</
名詞><名詞>B</名詞></名詞句>は、AがBに
依存関係があることを表す。
【0061】また、関係=“x”は、関係属性を表す。
この関係属性は、統語、意味、修辞についての相互関係
を記述する。主語、目的語、間接目的語のような文法機
能、動作主、被動作主、受益者等のような主題役割、及
び理由、結果等のような修辞関係は、この関係属性によ
り記述される。関係属性は、関係=***という形で表さ
れる。本実施の形態においては、主語、目的語、間接目
的語のような比較的容易な文法機能について関係属性を
記述する。
【0062】また、この文書においては、例えば、“A
氏”、“B会”、“C市”のような固有名詞について、
地名、人名、組織名等のタグにより属性が記述される。
これらの地名、人名、組織名等のタグが付与される語
は、固有名詞である。
【0063】文書処理装置は、このようにタグ付けされ
た文書を受信することができる。文書処理装置は、CP
U13によりROM15やハードディスクに記録されて
いる電子文書処理プログラムのうちの音声読み上げプロ
グラムを起動すると、図4に示すような一連の工程を経
ることによって、文書の読み上げを行う。まず、ここで
は、簡略化した各工程の説明を行い、その後、具体的な
文書例を用いて、各工程の説明を詳細に行う。
【0064】まず、文書処理装置は、同図に示すよう
に、ステップS1において、タグ付けされた文書を受信
する。なお、この文書には、後述するように、音声合成
を行うために必要なタグが付与されているものとする。
また、文書処理装置は、タグ付けされた文書を受信し、
その文書に音声合成を行うために必要なタグを新たに付
与して文書を作成することもできる。さらに、文書処理
装置は、タグ付けされていない文書を受信し、その文書
に音声合成を行うために必要なタグを含めたタグ付けを
行い、タグファイルを作成してもよい。以下では、この
ようにして受信又は作成されて用意されたタグ付けされ
た文書をタグファイルと記す。
【0065】続いて、文書処理装置は、ステップS2に
おいて、CPU13の制御のもとに、タグファイルに基
づいて音声読み上げ用ファイルを生成する。この音声読
み上げ用ファイルは、後述するように、タグファイル中
のタグから、読み上げのための属性情報を導出し、この
属性情報を埋め込むことにより生成される。
【0066】続いて、文書処理装置は、ステップS3に
おいて、CPU13の制御のもとに、音声読み上げ用フ
ァイルを用いて、音声合成エンジンに適した処理を行
う。なお、この音声合成エンジンは、ハードウェアで構
成してもよいし、ソフトウェアで実現するようにしても
よい。音声合成エンジンをソフトウェアで実現する場合
には、そのアプリケーションプログラムは、文書処理装
置のROM15やハードディスク等に予め記憶されてい
る。
【0067】そして、文書処理装置は、ステップS4に
おいて、ユーザが後述するユーザインターフェースを用
いて行う操作に応じて処理を行う。
【0068】文書処理装置は、このような処理を行うこ
とによって、与えられた文書を音声合成して読み上げる
ことができる。これらの各工程について、以下詳細に説
明する。
【0069】まず、ステップS1におけるタグ付けされ
た文書の受信又は作成について説明する。文書処理装置
は、例えば上述したように、先に図1に示したサーバ2
4にアクセスし、キーワード等に基づいて検索された結
果としての文書を受信する。また、文書処理装置は、タ
グ付けされた文書を受信し、その文書に音声合成を行う
ために必要なタグを新たに付与して文書を作成する。さ
らに、文書処理装置は、タグ付けされていない文書を受
信し、その文書に音声合成を行うために必要なタグを含
めたタグ付けを行い、タグファイルを作成することもで
きる。
【0070】ここでは、図5又は図6に示すような日本
語又は英語による文書にタグ付けがなされたタグファイ
ルを受信又は作成したものとする。すなわち、図5に示
すタグファイルの元の文書は、次のような日本語の文書
である。
【0071】「[素敵にエイジング]/8ガン転移、抑
えられる!?がんはこの十数年、わが国の死因第一位を
占めている。その死亡率は年齢が進むとともに増加傾向
にある。高齢者の健康を考えるとき、がんの問題を避け
て通れない。
【0072】がんを特徴づけるのは、細胞増殖と転移で
ある。人間の細胞には、自動車でいえばアクセルに当た
り、がんをどんどん増殖する「がん遺伝子」と、ブレー
キ役の「がん抑制遺伝子」がある。
【0073】双方のバランスが取れていれば問題はな
い。正常な調節機能が失われ、細胞内でブレーキが利か
ない変異が起こると、がんの増殖が始まる。高齢者の場
合、長い年月の間にこの変異が蓄積し、がん化の条件を
備えた細胞の割合が増え、がん多発につながるわけだ。
【0074】ところで、もう一つの特徴、転移という性
質がなければ、がんはそれほど恐れる必要はない。切除
するだけで、完治が可能になるからである。転移を抑制
することの重要性がここにある。
【0075】この転移、がん細胞が増えるだけでは発生
しない。がん細胞が細胞と細胞の間にある蛋白(たんぱ
く)質などを溶かし、自分の進む道をつくって、血管や
リンパ管に入り込む。循環しながら新たな“住み家”を
探して潜り込む、といった複雑な動きをすることが、近
年解明されつつある。」文書処理装置は、この日本語の
文書を受信した場合には、図5に示すように、表示部3
1に表示されるウィンドウ110に文書を表示する。ウ
ィンドウ110は、文書の名称が表示される文書名表示
部111、キーワードが入力されるキーワード入力部1
12、後述するように文書の要約文を作成するための実
行ボタンである要約作成実行ボタン113及び音声読み
上げを実行するための実行ボタンである読み上げ実行ボ
タン114等が表示される表示領域120と、文書が表
示される表示領域130とに区分されている。表示領域
130の右端には、スクロールバー131と、このスク
ロールバー131を上下に動かすためのボタン132,
133が設けられており、ユーザが例えば入力部20の
マウス等を用いて、スクロールバー131を上下に直接
動かしたり、ボタン132,133を押してスクロール
バー131を上下に動かすことによって、表示領域13
0に表示される表示内容を縦方向にスクロールすること
ができる。
【0076】一方、図6に示すタグファイルの元の文書
は、次のような英語の文書である。
【0077】「During its centennial year, The Wall
Street Journal will report events of the past cen
tury that stand as milestones of American business
history. THREE COMPUTERS THAT CHANGED the face of
personal computing were launched in 1977. That ye
ar the Apple II, Commodore Pet and Tandy TRS came
to market. The computers were crude by today's sta
ndards. Apple II owners, for example, had to use t
heir television sets as screens and storeddata on
audiocassettes.」 文書処理装置は、この英語の文書を受信した場合には、
図6に示すように、表示部31に表示されるウィンドウ
140に文書を表示する。ウィンドウ140は、ウィン
ドウ110と同様に、文書の名称が表示される文書名表
示部141、キーワードが入力されるキーワード入力部
142、文書の要約文を作成するための実行ボタンであ
る要約作成実行ボタン143及び音声読み上げを実行す
るための実行ボタンである読み上げ実行ボタン144等
が表示される表示領域150と、文書が表示される表示
領域160とに区分されている。表示領域160の右端
には、スクロールバー161と、このスクロールバー1
61を上下に動かすためのボタン162,163が設け
られており、ユーザが例えば入力部20のマウス等を用
いて、スクロールバー161を上下に直接動かしたり、
ボタン162,163を押してスクロールバー161を
上下に動かすことによって、表示領域160に表示され
る表示内容を縦方向にスクロールすることができる。
【0078】図5又は図6に示す日本語又は英語の文書
は、それぞれ、図7又は図8に示すようなタグファイル
として構成されている。
【0079】ここで、図7に示すタグファイルは、同図
(A)に見出しの部分である「[素敵にエイジング]/
8ガン転移、抑えられる!?」を抜粋したものを示し、
同図(B)に最後の段落である「この転移、がん細胞が
増えるだけでは発生しない。がん細胞が細胞と細胞の間
にある蛋白質などを溶かし、自分の進む道をつくって、
血管やリンパ管に入り込む。循環しながら新たな“住み
家”を探して潜り込む、といった複雑な動きをすること
が、近年解明されつつある。」を抜粋したものを示し、
残りの段落については省略したものである。この場合、
実際のタグファイルは、見出し部分から最後の段落まで
が1つのファイルとして構成されている。
【0080】同図(A)に示す見出し部分において<見
出し>は、この部分が見出しであることを示している。
また、同図(B)に示す最後の段落には、関係属性が
“条件”や“手段”であることを示すタグ等が付与され
ている。さらに、同図(B)に示す最後の段落には、上
述した音声合成を行うために必要なタグの例が示されて
いる。
【0081】まず、音声合成を行うために必要なタグと
しては、「蛋白(たんぱく)」のように、元の文書に読
み仮名を示す情報が与えられているときに付与されるも
のがある。すなわち、この場合では、「たんぱくたんぱ
く」と重複して読み上げてしまうことを防ぐために、発
音=“null”という読み属性情報が記述されており、
「(たんぱく)」の部分の読み上げを禁止するタグが付
与されている。また、このタグには、特殊な機能を有す
るものであることを示す情報が示されている。
【0082】また、音声合成を行うために必要なタグと
しては、「リンパ管」のような専門用語や「住み家」の
ように、誤った読み上げを行う可能性のある難訓部分に
付与されるものがある。すなわち、この場合では、「り
んぱくだ」や「すみいえ」と読み上げてしまうことを防
ぐために、それぞれ、発音=“りんぱかん”、発音=
“すみか”という読み仮名を示す読み属性情報が記述さ
れている。
【0083】一方、図8に示すタグファイルには、補文
であることを示すタグや、複数の文が1つの文として連
続して構成されていることを示すタグが付与されてい
る。また、このタグファイルにおける音声合成を行うた
めに必要なタグとしては、「II」というローマ数字に対
して、発音=“two”という読み属性情報が記述されて
いる。これは、「II」を「トゥ(two)」と読み上げさ
せたい場合に、「セカンド(second)」と読み上げてし
まうことを防ぐために記述されているものである。
【0084】また、例えば文書内に引用文が含まれてい
る場合、このようなタグファイルには、図示しないが、
その文が引用文であることを示すタグが付与される。さ
らに、タグファイルには、例えば文書内に疑問文がある
場合、図示しないが、その文が疑問文であることを示す
タグが付与される。
【0085】文書処理装置は、先に図4に示したステッ
プS1において、このように音声合成を行うために必要
なタグが付与された文書を受信又は作成する。
【0086】つぎに、ステップS2における音声読み上
げ用ファイルの生成について説明する。文書処理装置
は、タグファイル中のタグから、読み上げのための属性
情報を導出し、この属性情報を埋め込むことによって、
音声読み上げ用ファイルを生成する。
【0087】具体的には、文書処理装置は、文書の段
落、文及び句の開始位置を示すタグを見つけ出し、これ
らのタグに対応して読み上げのための属性情報を埋め込
む。また、文書処理装置は、後述するように、文書の要
約文を作成した場合には、その要約文に含まれる部分の
開始位置を文書から見つけ出し、読み上げの際に音量を
増大させる属性情報を埋め込み、要約文に含まれる部分
であることを強調することもできる。
【0088】文書処理装置は、先に図7又は図8に示し
たタグファイルから図9又は図10に示すような音声読
み上げ用ファイルを生成する。なお、図9(A)に示す
音声読み上げ用ファイルは、先に図7(A)に示した見
出しの部分の抜粋に対応するものであり、同図(B)に
示す音声読み上げ用ファイルは、先に図8(B)に示し
た最後の段落の抜粋に対応するものである。実際の音声
読み上げ用ファイルは、見出し部分から最後の段落まで
が1つのファイルとして構成されていることは勿論であ
る。
【0089】図9(A)に示す音声読み上げ用ファイル
には、文書の開始位置に対応してCom=Lang=***という属
性情報が埋め込まれている。この属性情報は、文書を記
述している言語を示す。ここでは、Com=Lang=JPNという
属性情報であり、文書を記述している言語が日本語であ
ることを示している。文書処理装置においては、この属
性情報を参照することで、文書毎に言語に応じた適切な
音声合成エンジンを選択することができる。
【0090】また、同図(A)及び同図(B)に示す音
声読み上げ用ファイルには、Com=begin_p、Com=begin_s
及びCom=begin_phという属性情報が埋め込まれている。
これらの属性情報は、それぞれ、文書の段落、文及び句
の開始位置を示す。文書処理装置は、上述したタグファ
イル中のタグに基づいて、これらの段落、文及び句のう
ちの少なくとも2つの開始位置を検出する。音声読み上
げ用ファイルにおいて、例えば上述したタグファイル中
の<形容動詞句><名詞句>のように、同じレベルの統
語構造を表すタグが連続して現れる部分に対しては、そ
れぞれに対応する数のCom=begin_phが埋め込まれずに、
まとめられて1つのCom=begin_phが埋め込まれる。
【0091】さらに、音声読み上げ用ファイルには、Co
m=begin_p、Com=begin_s及びCom=begin_phに対応して、
それぞれ、Pau=500、Pau=100及びPau=50という属性情報
が埋め込まれている。これらの属性情報は、それぞれ、
読み上げの際に500ミリ秒、100ミリ秒及び50ミ
リ秒の休止期間を設けることを示す。すなわち、文書処
理装置は、文書の段落、文及び句の開始位置において、
それぞれ、500ミリ秒、100ミリ秒及び50ミリ秒
の休止期間を設けて文書を音声合成エンジンにより読み
上げる。なお、これらの属性情報は、Com=begin_p、Com
=begin_s及びCom=begin_phに対応して埋め込まれる。そ
のため、例えばタグファイル中の<形容動詞句><名詞
句>のように、同じレベルの統語構造を表すタグが連続
して現れる部分は、1つの句として捉えられ、それぞれ
に対応する数のPau=50が埋め込まれずに、まとめられて
1つのPau=50が埋め込まれる。また、例えばタグファイ
ル中の<段落><文><名詞句>のように、異なるレベ
ルの統語構造を表すタグが連続して現れる部分について
は、それぞれに対応するPau=***が埋め込まれる。その
ため、文書処理装置は、このような部分を読み上げる際
には、例えば文書の段落、文及び句のそれぞれの休止期
間を加算して得られる650ミリ秒の休止期間を設けて
読み上げる。このように、文書処理装置は、例えば、段
落、文及び句の順序で長さが短くなるように、段落、文
及び句に対応した休止期間を設けることで、段落、文及
び句の切れ目を考慮した違和感のない読み上げを行うこ
とができる。なお、この休止期間は、文書の段落、文及
び句の開始位置において、それぞれ、500ミリ秒、1
00ミリ秒及び50ミリ秒である必要はなく、適宜変更
することができる。
【0092】さらにまた、同図(B)に示す音声読み上
げ用ファイルにおいては、タグファイル中で記述されて
いる発音=“null”という読み属性情報に対応して、
「(たんぱく)」が除かれているとともに、発音=“り
んぱかん”、発音=“すみか”という読み属性情報に対
応して、「リンパ管」、「住み家」が、それぞれ、「り
んぱかん」、「すみか」に置換されている。文書処理装
置は、このような読み属性情報を埋め込むことで、音声
合成エンジンが参照する辞書の不備による読み誤りをす
ることがない。
【0093】また、音声読み上げ用ファイルには、文書
内に含まれた引用文であることを示すタグに基づいて、
この引用文のみを別の音声合成エンジンを用いるように
指定するための属性情報が埋め込まれてもよい。
【0094】さらに、音声読み上げ用ファイルには、疑
問文であることを示すタグに基づいて、その文の語尾の
イントネーションを上げるための属性情報が埋め込まれ
てもよい。
【0095】さらにまた、音声読み上げ用ファイルに
は、必要に応じて、いわゆる「である調」の文体を「で
すます調」の文体に変換するための属性情報を埋め込む
こともできる。なお、この場合、文書処理装置は、この
ような属性情報を音声読み上げ用ファイルに埋め込むの
ではなく、「である調」の文体を「ですます調」の文体
に変換して音声読み上げ用ファイルを生成するようにし
てもよい。
【0096】一方、図10に示す音声読み上げ用ファイ
ルには、文書の開始位置に対応してCom=Lang=ENGという
属性情報が埋め込まれており、文書を記述している言語
が英語であることを示している。
【0097】また、音声読み上げ用ファイルには、Com=
Vol=***という属性情報が埋め込まれている。この属性
情報は、読み上げの際の音量を示す。例えば、Com=Vol=
0は、文書処理装置のデフォルトの音量で読み上げるこ
とを示している。また、Com=Vol=80は、デフォルトの音
量を80%増量した音量で読み上げることを示してい
る。任意のCom=Vol=***は、次のCom=Vol=***まで有効で
ある。
【0098】さらに、音声読み上げ用ファイルにおいて
は、タグファイル中で記述されている発音=“two”と
いう読み属性情報に対応して、「II」が「two」に置換
されている。
【0099】文書処理装置は、図11に示す一連の工程
を経ることによって、このような音声読み上げ用ファイ
ルを生成する。
【0100】まず、文書処理装置は、同図に示すよう
に、ステップS11において、CPU13によって、受
信又は作成したタグファイルを解析する。ここで、文書
処理装置は、文書を記述している言語を判別するととも
に、文書の段落、文及び句の開始位置や、読み属性情報
をタグに基づいて探し出す。
【0101】続いて、文書処理装置は、ステップS12
において、CPU13によって、文書を記述している言
語に応じて文書の開始位置にCom=Lang=***を埋め込む。
【0102】続いて、文書処理装置は、ステップS13
において、CPU13によって、文書の段落、文及び句
の開始位置を音声読み上げ用ファイルにおける属性情報
に置換する。すなわち、文書処理装置は、タグファイル
中の<段落>、<文>及び<***句>を、それぞれ、
Com=begin_p、Com=begin_s及びCom=begin_phに置換す
る。
【0103】続いて、文書処理装置は、ステップS14
において、CPU13によって、同じレベルの統語構造
が表れて同じCom=begin_***が重複しているものを、1
つのCom=begin_***にまとめる。
【0104】続いて、文書処理装置は、ステップS15
において、CPU13によって、Com=begin_***に対応
してPau=***を埋め込む。すなわち、文書処理装置は、C
om=begin_pの直前にPau=500を埋め込み、Com=begin_sの
直前にPau=100を埋め込み、Com=begin_phの直前にPau=5
0を埋め込む。
【0105】そして、文書処理装置は、ステップS16
において、CPU13によって、読み属性情報に基づい
て、正しい読みに置換する。すなわち、文書処理装置
は、発音=“null”という読み属性情報に基づいて、
「(たんぱく)」を除去するとともに、発音=“りんぱ
かん”、発音=“すみか”という読み属性情報に基づい
て、「リンパ管」、「住み家」を、それぞれ、「りんぱ
かん」、「すみか」に置換する。
【0106】文書処理装置は、先に図4に示したステッ
プS2において、図11に示す処理を行うことによっ
て、音声読み上げ用ファイルを自動的に生成する。文書
処理装置は、生成した音声読み上げ用ファイルをRAM
14に記憶させる。
【0107】つぎに、図4中ステップS3における音声
読み上げ用ファイルを用いた処理について説明する。文
書処理装置は、音声読み上げ用ファイルを用いて、RO
M15やハードディスク等に予め記憶されている音声合
成エンジンに適した処理をCPU13の制御のもとに行
う。
【0108】具体的には、文書処理装置は、音声読み上
げ用ファイルに埋め込まれているCom=Lang=***という属
性情報に基づいて、使用する音声合成エンジンを選択す
る。音声合成エンジンは、言語や男声/女声等の種類に
応じて識別子が付されており、その情報が例えば初期設
定ファイルとしてハードディスクに記録されている。文
書処理装置は、初期設定ファイルを参照し、言語に対応
した識別子の音声合成エンジンを選択する。
【0109】また、文書処理装置は、音声読み上げ用フ
ァイルに埋め込まれているCom=begin_***を音声合成エ
ンジンに適した形式に変換する。例えば、文書処理装置
は、Com=begin_pをMark=100のように100番台の番号
でマーク付けし、Com=begin_sをMark=1000のように10
00番台の番号でマーク付けし、Com=begin_phをMark=1
0000のように10000番台の番号でマーク付けする。
【0110】さらに、音声読み上げ用ファイルにおいて
は、音量の属性情報がVol=***のようにデフォルトの音
量に対する増量分の百分率で表されていることから、文
書処理装置は、この属性情報に基づいて、百分率の情報
を絶対値の情報に変換して求める。
【0111】このようにして音声読み上げ用ファイルを
変換して得た共有ファイルFLは、後述するように、テ
ロップを作成する際にも用いられる。
【0112】文書処理装置は、先に図4に示したステッ
プS3において、このような音声読み上げ用ファイルを
用いた処理を行うことによって、音声読み上げ用ファイ
ルを音声合成エンジンが文書を読み上げることが可能な
形式に変換する。
【0113】つぎに、図4中ステップS4におけるユー
ザインターフェースを用いた操作について説明する。文
書処理装置は、ユーザが例えば入力部20のマウス等を
操作して先に図5又は図6に示した読み上げ実行ボタン
114又は読み上げ実行ボタン144を押すことによっ
て、音声合成エンジンを起動する。そして、文書処理装
置は、図12に示すようなユーザインターフェース用ウ
ィンドウ170を表示部31に表示する。
【0114】ユーザインターフェース用ウィンドウ17
0は、同図に示すように、文書を読み上げさせるための
再生ボタン171と、読み上げを停止させるための停止
ボタン172と、読み上げを一時停止させるための一時
停止ボタン173とを有する。
【0115】また、ユーザインターフェース用ウィンド
ウ170は、文単位で頭出しさせるボタン、すなわち、
現在読み上げている文の先頭にジャンプさせるためのジ
ャンプAボタン174と、現在読み上げている文の前の
文の先頭にジャンプさせるためのジャンプBボタン17
5と、現在読み上げている文の次の文の先頭にジャンプ
させるためのジャンプCボタン176とを有する。さら
に、ユーザインターフェース用ウィンドウ170は、段
落単位で頭出しさせるボタン、すなわち、現在読み上げ
ている段落の先頭にジャンプさせるためのジャンプAボ
タン177と、現在読み上げている段落の前の段落の先
頭にジャンプさせるためのジャンプBボタン178と、
現在読み上げている段落の次の段落の先頭にジャンプさ
せるためのジャンプCボタン179とを有する。さらに
また、ユーザインターフェース用ウィンドウ170は、
句単位で頭出しさせるボタン、すなわち、現在読み上げ
ている句の先頭にジャンプさせるためのジャンプAボタ
ン180と、現在読み上げている句の前の句の先頭にジ
ャンプさせるためのジャンプBボタン181と、現在読
み上げている句の次の句の先頭にジャンプさせるための
ジャンプCボタン182とを有する。
【0116】また、ユーザインターフェース用ウィンド
ウ170は、読み上げる対象を全文とするか、後述する
ように作成した要約文とするかを選択するための選択ス
イッチ183,184を有する。さらに、ユーザインタ
ーフェース用ウィンドウ170は、後述するように作成
したテロップを表示するテロップ表示領域185と、選
択された音声合成エンジンに応じた読み手の模擬絵を表
示する読み手表示領域186とを有する。
【0117】なお、ユーザインターフェース用ウィンド
ウ170は、ここでは図示しないが、例えば、音量を増
減させるためのボタンや読み上げの速さを増減させるた
めのボタン、男声/女声等の声を変化させるためのボタ
ン等を有していてもよい。また、読み手表示領域186
に表示される読み手の模擬絵は、音声合成エンジンによ
る読み上げ動作にともない口等を動かすようにしてもよ
い。
【0118】文書処理装置は、ユーザがこれらの各種ボ
タン/スイッチを例えば入力部20のマウス等を操作し
て押す/選択することによって、音声合成エンジンによ
る読み上げ動作を行う。例えば、文書処理装置は、ユー
ザが再生ボタン171を押すことによって、文書の読み
上げを開始し、読み上げの途中でユーザがジャンプAボ
タン174を押すことによって、現在読み上げている文
の開始位置にジャンプして再び読み上げる。また、文書
処理装置は、図4中ステップS3において行ったマーク
付けによって、読み上げの際にこのようなマーク単位で
のジャンプをすることができる。すなわち、文書処理装
置は、ユーザが例えば入出力部20のマウス等を用いて
ジャンプBボタン178やジャンプCボタン179を押
した場合には、例えばMark=100のように、100番台の
番号である段落の開始位置を示すマークのみを識別して
ジャンプする。同様に、文書処理装置は、ユーザが例え
ば入出力部20のマウス等を用いてジャンプBボタン1
75又はジャンプCボタン176、ジャンプBボタン1
81又はジャンプCボタン182をそれぞれ押した場合
には、それぞれ、Mark=1000、Mark=10000のように、1
000番台、10000番台の番号である文、句の開始
位置を示すマークのみを識別してジャンプする。このよ
うに、文書処理装置は、読み上げの際に段落、文及び句
単位での頭出しを行うことによって、例えば文書中でユ
ーザが所望の部分を繰り返し再生させたいといった要求
に応えることができる。
【0119】文書処理装置は、ステップS4において、
ユーザがこのようなユーザインターフェースを用いた操
作を行うことによって、音声合成エンジンにより文書を
読み上げる。読み上げた情報は、音声出力部30から出
力される。
【0120】このようにして、文書処理装置は、所望の
文書を音声合成エンジンにより違和感なく読み上げるこ
とができる。また、文書処理装置は、ユーザインターフ
ェース用ウィンドウ170をユーザが操作することによ
って、段落、文及び句の単位での頭出しができ、利便性
に優れた操作性をユーザに提供することができる。
【0121】つぎに、文書の要約文を作成した際の読み
上げ処理について説明する。まず、ここでは、タグ付け
された文書を要約して要約文を作成する処理について図
13乃至図20を参照して説明する。
【0122】文書処理装置においては、文書の要約を作
成する場合には、その文書が表示部31に表示されてい
る状態で、ユーザが入力部20を操作し、自動要約作成
モードを実行するように指令する。すなわち、文書処理
装置は、CPU13の制御のもとに、ハードディスクド
ライブ34を駆動して、ハードディスクに記憶されてい
る電子文書処理プログラムのうちの自動要約文作成プロ
グラムを起動する。文書処理装置は、CPU13により
表示部31を制御して、図13に示すような自動要約文
作成プログラム用の初期画面を表示させる。ここでは、
表示部31に表示されるウィンドウ190は、文書の名
称が表示される文書名表示部191、キーワードが入力
されるキーワード入力部192、文書の要約文を作成す
るための実行ボタンである要約作成実行ボタン193等
が表示される表示領域200と、文書が表示される表示
領域210と、文書の要約文が表示される表示領域22
0とに区分されている。
【0123】表示領域200の文書名表示部191に
は、表示領域210に表示される文書の文書名等が表示
される。また、キーワード入力部192には、例えば入
力部20のキーボード等を用いて文書の要約文を作成す
るためのキーワードが入力される。要約作成実行ボタン
193は、例えば入力部20のマウス等を用いて押され
ることによって、表示領域210に表示されている文書
の要約作成処理を実行開始するための実行ボタンであ
る。
【0124】表示領域210には、文書が表示される。
表示領域210の右端には、スクロールバー211と、
このスクロールバー211を上下に動かすためのボタン
212,213が設けられており、ユーザが例えば入力
部20のマウス等を用いて、スクロールバー211を上
下に直接動かしたり、ボタン212,213を押してス
クロールバー211を上下に動かすことによって、表示
領域210に表示される表示内容を縦方向にスクロール
することができる。ユーザは、入力部20を操作するこ
とによって、表示領域210に表示されている文書の一
部を選択して要約させることもでき、文書全体を要約さ
せることもできる。
【0125】表示領域220には、要約文が表示され
る。同図においては、要約文がまだ作成されていない状
態であるため、この表示領域220には、何も表示され
ていない。ユーザは、入力部20を操作することによっ
て、表示領域220の表示範囲(大きさ)を変更するこ
とができる。具体的には、ユーザは、同図に示す表示領
域220の表示範囲(大きさ)を、例えば図14に示す
ように拡大することができる。
【0126】文書処理装置は、ユーザが例えば入力部2
0のマウス等を用いて、要約作成実行ボタン193を押
してオン状態とすると、CPU13の制御のもとに、図
15に示す処理を実行して要約文の作成を開始する。
【0127】文書から要約文を作成する処理は、文書の
内部構造に関するタグ付けに基づいて実行される。文書
処理装置においては、先に図14に示したように、ウィ
ンドウ190の表示領域220の大きさを変更すること
ができる。文書処理装置は、CPU13の制御のもと
に、新たにウィンドウ190が表示部31に描画される
か、又は、表示領域220の大きさが変更された後、要
約作成実行ボタン193が操作されたときには、表示領
域220に適合するように、ウィンドウ190の表示領
域210に少なくともその一部が表示されている文書か
ら、要約文を作成する処理を実行する。
【0128】まず、文書処理装置は、図15に示すよう
に、ステップS21において、CPU13の制御のもと
に、活性拡散と呼ばれる処理を行う。本実施の形態にお
いては、活性拡散により得られた中心活性値を重要度と
して採用することによって、文書の要約を行う。すなわ
ち、内部構造に関するタグ付けがされた文書において
は、活性拡散を行うことによって、各エレメントに対し
て、内部構造に関するタグ付けに応じた中心活性値を付
与することができる。
【0129】ここで、活性拡散は、中心活性値の高いエ
レメントと関わりのあるエレメントにも高い中心活性値
を与えるような処理である。すなわち、活性拡散は、照
応(anaphora;共参照(coreference))表現されたエ
レメントとその先行詞との間で中心活性値が等しくな
り、それ以外では各中心活性値が同じ値に収束してい
く。この中心活性値は、文書の内部構造に関するタグ付
けに応じて決定されるため、内部構造を考慮した文書の
分析に利用することができる。
【0130】文書処理装置は、図16に示す一連の工程
を経ることによって、活性拡散を実行する。
【0131】まず、文書処理装置は、同図に示すよう
に、ステップS41において、CPU13の制御のもと
に、各エレメントの初期化を行う。文書処理装置は、語
彙エレメントを除いた全てのエレメントと語彙エレメン
トとに対して中心活性値の初期値を割り当てる。例え
ば、文書処理装置は、中心活性値の初期値として、語彙
エレメントを除いた全てのエレメントに対しては“1”
を、語彙エレメントに対しては“0”を割り当てる。ま
た、文書処理装置は、各エレメントの中心活性値の初期
値に均一ではない値を予め割り当てることによって、活
性拡散の結果得られた中心活性値に、初期値の偏りを反
映させることができる。例えば、文書処理装置は、ユー
ザが関心を有するエレメントに対しては、中心活性値の
初期値を高く設定することによって、ユーザの関心を反
映した中心活性値を得ることができる。
【0132】エレメント間で参照・被参照による係り受
けの関係にあるリンクである参照・被参照リンクと、そ
れ以外のリンクである通常リンクとに関しては、エレメ
ントを連結するリンクの端点の端点活性値を“0”に設
定する。文書処理装置は、このようにして付与した端点
活性値の初期値を例えばRAM14に記憶させる。
【0133】ここで、エレメントとエレメントの連結構
造の一例を図17に示す。同図においては、文書を構成
するエレメントとリンクの構造の一部として、エレメン
トEi及びエレメントEjが示されている。エレメントE
iとエレメントEjとは、それぞれ、中心活性値ei,ej
を有し、リンクLijにて接続されている。リンクLij
エレメントEiに接続する端点は、Tijであり、エレメ
ントEjに接続する端点は、Tjiである。エレメントEi
は、リンクLijにより接続されるエレメントEjの他
に、リンクLik,Lil及びLimにより図示しないエレメ
ントEk,El及びEmにそれぞれ接続している。エレメ
ントEjは、リンクLjiにより接続されるエレメントEi
の他に、リンクLjp,Ljq及びLjrにより図示しないエ
レメントEp,Eq及びErにそれぞれ接続している。
【0134】続いて、文書処理装置は、図16中ステッ
プS42において、CPU13の制御のもとに、文書を
構成するエレメントEiを計数するカウンタの初期化を
行う。すなわち、文書処理装置は、エレメントを計数す
るカウンタのカウンタ値iを“1”に設定する。このこ
とにより、カウンタは、第1番目のエレメントE1を参
照していることになる。
【0135】続いて、文書処理装置は、ステップS43
において、CPU13の制御のもとに、カウンタが参照
するエレメントについて、新たな中心活性値を計算する
リンク処理を実行する。このリンク処理については、さ
らに後述する。
【0136】続いて、文書処理装置は、ステップS44
において、CPU13の制御のもとに、文書中の全ての
エレメントについて新たな中心活性値の計算が完了した
か否かを判断する。
【0137】ここで、文書処理装置は、文書中の全ての
エレメントについて新たな中心活性値の計算が完了した
ことを判断した場合には、ステップS45へと処理を移
行し、一方、文書中の全てのエレメントについて新たな
中心活性値の計算が完了していないことを判断した場合
には、ステップS47へと処理を移行する。
【0138】具体的には、文書処理装置は、CPU13
の制御のもとに、カウンタのカウンタ値iが、文書が含
むエレメントの総数に達したか否かを判断する。そし
て、文書処理装置は、カウンタのカウンタ値iが、文書
が含むエレメントの総数に達したことを判断した場合に
は、全てのエレメントが計算済みであるものとして、ス
テップS45へと処理を移行する。一方、文書処理装置
は、カウンタのカウンタ値iが、文書が含むエレメント
の総数に達していないことを判断した場合には、全ての
エレメントについて計算が終了していないものとしてス
テップS47へと処理を移行する。
【0139】文書処理装置は、カウンタのカウンタ値i
が、文書が含むエレメントの総数に達していないことを
判断した場合には、ステップS47において、CPU1
3の制御のもとに、カウンタのカウント値iを“1”だ
けインクリメントさせ、カウンタのカウント値を“i+
1”とする。このことにより、カウンタは、i+1番目
のエレメント、すなわち次のエレメントを参照する。そ
して、文書処理装置は、ステップS43へと処理を移行
し、端点活性値の計算及びこれに続く一連の行程が、次
のi+1番目のエレメントについて実行される。
【0140】また、文書処理装置は、カウンタのカウン
タ値iが、文書が含むエレメントの総数に達したことを
判断した場合には、ステップS45において、CPU1
3の制御のもとに、文書に含まれる全てのエレメントの
中心活性値の変化分、すなわち新たに計算された中心活
性値の元の中心活性値に対する変化分について平均値を
計算する。
【0141】文書処理装置は、CPU13の制御のもと
に、例えばRAM14に記憶された元の中心活性値と新
たに計算した中心活性値を、文書に含まれる全てのエレ
メントについて読み出す。文書処理装置は、新たに計算
した中心活性値の元の中心活性値に対するそれぞれの変
化分の総和を文書に含まれるエレメントの総数で除する
ことにより、全てのエレメントの中心活性値の変化分の
平均値を計算する。文書処理装置は、このように計算し
た全てのエレメントの中心活性値の変化分の平均値を、
例えばRAM14に記憶させる。
【0142】そして、文書処理装置は、ステップS46
において、CPU13の制御のもとに、ステップS45
で計算した全てのエレメントの中心活性値の変化分の平
均値が、予め設定された閾値以内であるか否かを判断す
る。そして、文書処理装置は、この変化分が閾値以内で
あると判断した場合には、この一連の行程を終了する。
一方、文書処理装置は、変化分が閾値以内でないと判断
した場合には、ステップS42へと処理を移行し、カウ
ンタのカウント値iを“1”に設定して文書のエレメン
トの中心活性値を計算する一連の行程を再び実行する。
文書処理装置においては、これらのステップS42乃至
ステップS46のループが繰り返される毎に、変化分
は、徐々に減少する。
【0143】文書処理装置は、このようにして活性拡散
を行うことができる。つぎに、この活性拡散を行うため
にステップS43において実行されるリンク処理につい
て図18を参照して説明する。なお、同図に示すフロー
チャートは、1つのエレメントEiに対する処理を示し
たものであるが、この処理は、全てのエレメントに対し
て行われるものである。
【0144】まず、文書処理装置は、同図に示すよう
に、ステップS51において、CPU13の制御のもと
に、文書を構成する1つのエレメントEiと一端が接続
されたリンクを計数するカウンタの初期化を行う。すな
わち、文書処理装置は、リンクを計数するカウンタのカ
ウント値jを“1”に設定する。このカウンタは、エレ
メントEiと接続された第1番目のリンクLijを参照す
ることになる。
【0145】続いて、文書処理装置は、ステップS52
において、CPU13の制御のもとに、エレメントEi
とEjを接続するリンクLijについて、関係属性のタグ
を参照することによって、そのリンクLijが通常リンク
であるか否かを判断する。文書処理装置は、リンクLij
が、語に対応する語彙エレメント、文に対応する文エレ
メント、段落に対応する段落エレメント等の間の関係を
示す通常リンクと、参照・被参照による係り受けの関係
を示す参照リンクのいずれであるかを判断する。文書処
理装置は、リンクLijが通常リンクであると判断した場
合には、ステップS53へと処理を移行し、リンクLij
が参照リンクであると判断した場合には、ステップS5
4へと処理を移行する。
【0146】文書処理装置は、リンクLijが通常リンク
であると判断した場合には、ステップS53において、
エレメントEiの通常リンクLijに接続された端点Tij
の新たな端点活性値を計算する処理を行う。
【0147】このステップS53では、ステップS52
における判別により、リンクLijが通常リンクであるこ
とが明らかになっている。エレメントEiの通常リンク
ijに接続される端点Tijの新たな端点活性値tijは、
エレメントEjの端点活性値のうち、リンクLij以外の
リンクに接続する全ての端点Tjp,Tjq,Tjrの端点活
性値tjp、tjq,tjrと、エレメントEiがリンクLij
により接続されるエレメントEjの中心活性値ejとを加
算し、この加算で得た値を文書に含まれるエレメントの
総数で除することにより求められる。
【0148】文書処理装置は、CPU13の制御のもと
に、例えばRAM14から必要な端点活性値及び中心活
性値を読み出す。文書処理装置は、読み出された端点活
性値及び中心活性値について、上述のようにその通常リ
ンクと接続された端点の新たな端点活性値を計算する。
そして、文書処理装置は、このように計算した新たな端
点活性値を、例えばRAM14に記憶させる。
【0149】一方、文書処理装置は、リンクLijが通常
リンクでないと判断した場合には、ステップS54にお
いて、エレメントEiの参照リンクに接続された端点T
ijの端点活性値を計算する処理を行う。
【0150】このステップS54では、ステップS52
における判別により、リンクLijが参照リンクであるこ
とが明らかになっている。エレメントEiの参照リンク
ijに接続される端点Tijの端点活性値tijは、エレメ
ントEjの端点活性値のうち、リンクLijを除いたリン
クに接続される全ての端点Tjp,Tjq,tjrの端点活性
値tjp,tjq,tjrと、エレメントEiがリンクLij
より接続されるエレメントEjの中心活性値ejとを加算
することにより求められる。
【0151】文書処理装置は、CPU13の制御のもと
に、例えばRAM14に記憶された端点活性値及び中心
活性値から、必要な端点活性値及び中心活性値を読み出
す。文書処理装置は、読み出された端点活性値及び中心
活性値を用いて、上述のように参照リンクと接続された
新たな端点活性値を計算する。そして、文書処理装置
は、このように計算した端点活性値を、例えばRAM1
4に記憶させる。
【0152】これらのステップS53における通常リン
クの処理及びステップS54における参照リンクの処理
は、ステップS52からステップS55に至り、ステッ
プS57を介してステップS52に戻るループに示すよ
うに、カウント値iにより参照されているエレメントE
iに接続される全てのリンクLijに対して実行される。
なお、ステップS57では、エレメントEiに接続され
るリンクを計数するカウント値jをインクリメントして
いる。
【0153】文書処理装置は、これらのステップS53
又はステップS54の処理を行った後、ステップS55
において、CPU13の制御のもとに、エレメントEi
に接続される全てのリンクについて端点活性値が計算さ
れたか否かを判別する。そして、文書処理装置は、全て
のリンクについて端点活性値が計算されていると判断し
た場合には、ステップS56の処理へと移行し、全ての
リンクについて端点活性値が計算されていないと判断し
た場合には、ステップS57へと処理を移行する。
【0154】ここで、文書処理装置は、全てのリンクに
ついて端点活性値が計算されていると判断した場合に
は、ステップS56において、CPU13の制御のもと
に、エレメントEiの中心活性値eiの更新を実行する。
【0155】エレメントEiの中心活性値eiの新たな
値、すなわち更新値は、エレメントEiの現在の中心活
性値eiと、エレメントEiの全ての端点の新たな端点活
性値との和であるei’=ei+Σtj’をとることによ
り求められる。ここで、プライム“’”は、新たな値と
いう意味である。このように、新たな中心活性値は、そ
のエレメントの元の中心活性値に、そのエレメントの端
点の新たな端点活性値の総和に加えることにより得られ
る。
【0156】文書処理装置は、CPU13の制御のもと
に、例えばRAM14に記憶された端点活性値及び中心
活性値から必要な端点活性値を読み出す。文書処理装置
は、上述したような計算を実行し、そのエレメントEi
の中心活性値eiを算出する。そして、文書処理装置
は、計算した新たな中心活性値eiを例えばRAM14
に記憶させる。
【0157】このようにして、文書処理装置は、文書中
の各エレメントについて、新たな中心活性値を計算す
る。そして、文書処理装置は、このようにして図15中
ステップS21における活性拡散を実行する。
【0158】続いて、文書処理装置は、図15中ステッ
プS22において、CPU13の制御のもとに、先に図
13に示した表示部31に表示されているウィンドウ1
90の表示領域220の大きさ、すなわちこの表示領域
220に表示可能な最大文字数をWsと設定する。ま
た、文書処理装置は、CPU13の制御のもとに、要約
Sを初期化して初期値S0=””と設定する。これは、
要約に何も文字列が存在していないことを示す。文書処
理装置は、このように設定した、表示領域220に表示
可能な最大文字数Ws及び要約Sの初期値S0を、例えば
RAM14に記憶させる。
【0159】続いて、文書処理装置は、ステップS23
において、CPU13の制御のもとに、要約文の骨格の
順次での作成をカウントするカウンタのカウント値iを
“1”に設定する。すなわち、文書処理装置は、カウン
ト値について、i=1と設定する。文書処理装置は、こ
のように設定したカウント値iを例えばRAM14に記
憶させる。
【0160】続いて、文書処理装置は、ステップS24
において、CPU13の制御のもとに、カウンタのカウ
ント値iについて、要約作成対照の文章からi番目に平
均中心活性値の高い文の骨格を抽出する。ここで、平均
中心活性値とは、1つの文を構成する各エレメントの中
心活性値を平均したものである。文書処理装置は、例え
ばRAM14に記憶させた要約Si-1を読み出し、この
要約Si-1に対して抽出した文の骨格の文字列を加え
て、要約Siとする。そして、文書処理装置は、このよ
うにして得た要約Siを、例えばRAM14に記憶させ
る。同時に、文書処理装置は、文の骨格に含まれないエ
レメントの中心活性値順のリストliを作成し、このリ
ストliを例えばRAM14に記憶させる。
【0161】すなわち、このステップS24において
は、文書処理装置は、CPU13の制御のもとに、活性
拡散の結果を用いて、平均中心活性値の大きい順に文を
選択し、選択された文の骨格を抽出する。文の骨格は、
文から抽出した必須エレメントにより構成される。必須
エレメントになり得るものは、エレメントの主辞(hea
d)と、主語(subject)、目的語(object)、間接目的
語(indirect object)、所有者(posessor)、原因(c
ause)、条件(condition)又は比較(comparison)の
関係属性を有するエレメントと、等位構造とされた関連
するエレメントが必須エレメントのときには、その等位
構造に直接含まれるエレメントとである。文書処理装置
は、文の必須エレメントをつなげて文の骨格を生成し、
要約に加える。
【0162】続いて、文書処理装置は、ステップS25
において、CPU13の制御のもとに、要約Siの長
さ、すなわち文字数がウィンドウ190の表示領域22
0の最大文字数Wsよりも多いか否かを判断する。
【0163】ここで、文書処理装置は、要約Siの文字
数が最大文字数Wsよりも多いと判断した場合には、ス
テップS30において、CPU13の制御のもとに、要
約Si- 1を最終的な要約文として設定し、一連の処理を
終了する。なお、この場合には、要約Si=S0=“”を
出力するため、要約文は、表示領域220に表示されな
いことになる。
【0164】一方、文書処理装置は、要約Siの文字数
が最大文字数Wsよりも多くないと判断した場合には、
ステップS26の処理へと移行し、CPU13の制御の
もとに、i+1番目に平均中心活性値が高い文の中心活
性値と、ステップS24で作成したリストliのエレメ
ントの中で最も中心活性値が高いエレメントの中心活性
値とを比較する。そして、文書処理装置は、i+1番目
に平均中心活性値が高い文の中心活性値が、リストli
のエレメントの中で最も中心活性値が高いエレメントの
中心活性値よりも高いと判断した場合には、ステップS
28へと処理を移行する。一方、文書処理装置は、i+
1番目に平均中心活性値が高い文の中心活性値が、リス
トliのエレメントの中で最も中心活性値が高いエレメ
ントの中心活性値よりも高くないと判断した場合には、
ステップS27へと処理を移行する。
【0165】文書処理装置は、i+1番目に平均中心活
性値が高い文の中心活性値が、リストliのエレメント
の中で最も中心活性値が高いエレメントの中心活性値よ
りも高くないと判断した場合には、ステップS27にお
いて、CPU13の制御のもとに、カウンタのカウント
値iを“1”だけインクリメントさせ、ステップS24
へと処理を戻す。
【0166】また、文書処理装置は、i+1番目に平均
中心活性値が高い文の中心活性値が、リストliのエレ
メントの中で最も中心活性値が高いエレメントの中心活
性値よりも高いと判断した場合には、ステップS28に
おいて、CPU13の制御のもとに、リストliエレメ
ントの中で最も中心活性値の高いエレメントeを要約S
iに加えてSSiを生成し、さらに、エレメントeをリス
トliから削除する。そして、文書処理装置は、このよ
うにして生成した要約SSiを例えばRAM14に記憶
させる。
【0167】続いて、文書処理装置は、ステップS29
において、CPU13の制御のもとに、要約SSiの文
字数がウィンドウ190の表示領域220の最大文字数
sよりも多いか否かを判別する。文書処理装置は、要
約SSiの文字数が最大文字数Wsよりも多くないと判別
した場合には、ステップS26からの処理を繰り返す。
一方、文書処理装置は、要約SSiの文字数が最大文字
数Wsよりも多いと判別した場合には、ステップS31
において、CPU13の制御のもとに、要約Siを最終
的な要約文として設定し、表示領域220に表示して一
連の処理を終了する。このようにして、文書処理装置
は、最大文字数Wsよりも多くならないように要約文を
生成する。
【0168】文書処理装置は、このような一連の処理を
行うことによって、タグ付けされた文書を要約して要約
文を作成することができる。文書処理装置は、例えば図
13に示した文書を要約した場合には、図19に示すよ
うな要約文を作成し、表示範囲の表示領域220に表示
する。
【0169】すなわち、文書処理装置は、「TCP/IPの歴
史はARPANETを抜きにして語ることはできない。ARPANET
は1969年北米西海岸の4個所の大学、研究機関のホスト
コンピュータを50kbpsの回線で結んだ小規模なネットワ
ークからARPANETは出発した。当時は1964年にメインフ
レームの汎用コンピュータシリーズが開発された。この
時代背景を考えると、将来のコンピュータ通信の最盛を
見越したこのようなプロジェクトは、まさに米国ならで
はのものであったといえるだろう。」という要約文を作
成し、表示領域220に表示する。
【0170】文書処理装置においては、ユーザは、文書
の全文章を一読する代わりに、この要約文を読むこと
で、文章の概要を理解し、この文章が所望する情報であ
るか否かを判定することができる。
【0171】なお、文書処理装置においては、文書中の
エレメントに対して重要度を付与する方法としては、必
ずしも上述したような活性拡散を用いる必要はなく、例
えば、Zechnerが提案するように、単語にtf*idf法で重
み付けし、文書中に出現する単語の重みの総和を文書の
重要度とする方法でもよい。この方法の詳細は、“K.Ze
chner, Fast generation of abstracts from general d
omain text corporaby extracting relevant sentence
s, In Proc. of the 16th International Conference o
n Computational Linguistics, pp.986-989, 1996”に
説明されている。また、重要度の付与方法は、これらの
方法以外のものを利用することもできる。さらに、表示
領域200のキーワード入力部192にキーワードを入
力することによって、そのキーワードに基づいた重要度
の設定を行うこともできる。
【0172】さて、文書処理装置は、先に図14に示し
たように、表示部31に表示されるウィンドウ190の
表示領域220の表示範囲を拡大することができるが、
作成した要約文が表示領域220に表示されている状態
において、表示領域220の表示範囲を変更すると、そ
の表示範囲に応じて、要約文の情報量を変更することが
できる。
【0173】この場合、文書処理装置は、CPU13の
制御のもとに、ユーザが入力部20を操作することに対
応して、表示部31に表示されたウィンドウ190の表
示領域220の表示範囲が変更されるまで待機する。そ
して、文書処理装置は、表示領域220の表示範囲が変
更されると、CPU13の制御のもとに、先に図15に
示した一連の処理と同様の処理を行い、表示領域220
の表示範囲に対応した要約文を作成する。
【0174】文書処理装置は、このようにして、表示領
域220の表示範囲に応じた要約文を新たに作成するこ
とができる。例えば、文書処理装置は、ユーザが入力部
20のマウスをドラッグ操作することにより表示領域2
20の表示範囲を拡大すると、より詳細な要約文を新た
に作成し、図20に示すように、新たな要約文をウィン
ドウ190の表示領域220に表示する。
【0175】すなわち、文書処理装置は、「TCP/IPの歴
史はARPANETを抜きにして語ることはできない。ARPANET
はアメリカ国防省DODの国防高等研究計画局がスポンサ
ーとなって構築されてきた、実験および研究用のパケッ
ト交換ネットワークである。1969年北米西海岸の4個所
の大学、研究機関のホストコンピュータを50kbpsの回線
で結んだきわめて小規模なネットワークからARPANETは
出発した。当時は1945年に世界初のコンピュータである
ENIACがペンシルバニア大学で開発され、1964年にはじ
めてICを理論素子として実装したメインフレームの汎用
コンピュータシリーズが開発され、やっとコンピュータ
が産声をあげたばかりあった。この時代背景を考える
と、将来のコンピュータ通信の最盛を見越したこのよう
なプロジェクトは、まさに米国ならではのものであった
といえるだろう。」という要約文を作成し、表示領域2
20に表示する。
【0176】このように、文書処理装置においては、表
示された要約文が簡略すぎて文書の概略を把握すること
ができない場合、ユーザは、表示領域220の表示範囲
を拡大することで、より多くの情報量を有するより詳細
な要約文を参照することができる。
【0177】文書処理装置は、このようにして文書の要
約文を作成する際に、CPU13によりROM15やハ
ードディスクに記録されている電子文書処理プログラム
のうちの音声読み上げプログラムを起動すると、図21
に示すような一連の工程を経ることによって、文書又は
要約文の読み上げを行うことができる。なおここでは、
先に図6に示した文書を例として挙げて説明する。
【0178】まず、文書処理装置は、同図に示すよう
に、ステップS61において、タグ付けされた文書を受
信する。なお、この文書は、上述したように、音声合成
を行うために必要なタグが付与されており、図8に示す
タグファイルとして構成されている。また、文書処理装
置は、タグ付けされた文書を受信し、その文書に音声合
成を行うために必要なタグを新たに付与して文書を作成
することもできる。さらに、文書処理装置は、タグ付け
されていない文書を受信し、その文書に音声合成を行う
ために必要なタグを含めたタグ付けを行い、タグファイ
ルを作成してもよい。なお、この工程は、図4中ステッ
プS1に対応するものである。
【0179】続いて、文書処理装置は、ステップS62
において、CPU13の制御のもとに、上述した方法に
より文書の要約文を作成する。ここで、要約文の元とな
る文書は、ステップS61に示すようにタグ付けがなさ
れていることから、作成した要約文にも、文書に対応す
るタグが付与されている。
【0180】続いて、文書処理装置は、ステップS63
において、CPU13の制御のもとに、タグファイルに
基づいて文書の全内容についての音声読み上げ用ファイ
ルを生成する。この音声読み上げ用ファイルは、タグフ
ァイル中のタグから、読み上げのための属性情報を導出
し、この属性情報を埋め込むことにより生成される。
【0181】この際、音声読み上げ用ファイルには、上
述したように、Com=Vol=***という読み上げの際の音量
を示す属性情報が埋め込まれる。ここで、文書処理装置
は、文書の全内容のうち、ステップS62にて作成した
要約文に含まれる部分の開始位置について、エレメント
単位でCom=Vol=80という属性情報を埋め込むとともに、
それ以外の部分の開始位置については、Com=Vol=0とい
う属性情報を埋め込む。すなわち、文書処理装置は、要
約文に含まれる部分については、デフォルトの音量を8
0%増量した音量で読み上げる。なお、音量は、デフォ
ルトの音量を80%増量したものである必要はなく、適
宜変更することができる。このように、文書処理装置
は、要約文に含まれる部分を読み上げの際にも強調する
ことができ、ユーザの注意を喚起することができる。な
お、この工程は、図4中ステップS2に対応するもので
ある。
【0182】続いて、文書処理装置は、ステップS64
において、CPU13の制御のもとに、音声読み上げ用
ファイルを用いて、ROM15やハードディスク等に予
め記憶されている音声合成エンジンに適した処理を行
う。なお、この工程は、図4中ステップS3に対応する
ものである。
【0183】そして、文書処理装置は、ステップS65
において、ユーザが上述したユーザインターフェースを
用いて行う操作に応じて処理を行う。なお、この工程
は、図4中ステップS4に対応するものである。文書処
理装置は、例えばユーザが入力部20のマウス等を用い
て、先に図12に示したユーザインターフェース用ウィ
ンドウ170の選択スイッチ184を選択することによ
って、ステップS62にて作成した要約文を読み上げ対
象とすることができる。この場合、文書処理装置は、例
えばユーザが入力部20のマウス等を用いて、再生ボタ
ン171を押すことによって、要約文の読み上げを開始
することができる。また、文書処理装置は、例えばユー
ザが入力部20のマウス等を用いて、選択スイッチ18
3を選択し、再生ボタン171を押した場合には、上述
したように文書の読み上げを開始する。この際、文書処
理装置は、ステップS63にて音声読み上げ用ファイル
に埋め込んだ属性情報に基づいて、段落、文及び句の開
始位置において互いに異なる休止期間を設けるととも
に、要約文に含まれる部分については音量を増大させて
読み上げを行う。
【0184】文書処理装置は、このような処理を行うこ
とによって、与えられた文書や作成した要約文を読み上
げることができる。また、文書処理装置は、与えられた
文書を読み上げる際に、作成した要約文に応じて読み上
げ方を変化させることもできる。
【0185】さて、文書処理装置は、上述した表示部3
1に表示されるユーザインターフェース用ウィンドウ1
70のテロップ表示領域185に、文書又は要約文の読
み上げに連動して文書又は要約文のテロップを切り換え
表示又は移動表示することができる。すなわち、文書処
理装置は、音声合成エンジンによる読み上げスピード
が、ユーザが読み上げるスピードとほぼ同じものと考
え、テロップをテロップ表示領域185上に常時一定の
スピードで流して表示するのではなく、音声合成エンジ
ンによる読み上げに要する所要時間に相当する読み上げ
相当所要時間に応じて、テロップ表示領域185に表示
するテロップを順次切り換え又は移動させて表示する。
以下、このテロップを作成して表示するまでの処理につ
いて説明する。
【0186】文書処理装置においては、図22に示すよ
うに、文書又は要約文を読み上げる音声合成エンジン2
50と、テロップを作成するテロップ作成エンジン26
0とにより、テロップ表示領域185に、読み上げに連
動してテロップを切り換え表示又は移動表示する。な
お、音声合成エンジン250はもとより、テロップ作成
エンジン260は、ハードウェアで構成してもよいし、
ソフトウェアで実現するようにしてもよい。音声合成エ
ンジン250及びテロップ作成エンジン260をソフト
ウェアで実現する場合には、そのアプリケーションプロ
グラムは、文書処理装置のROM15やハードディスク
等に予め記憶されているものとする。また、音声合成エ
ンジン250及びテロップ作成エンジン260は、CP
U13の制御のもとに動作する。
【0187】文書処理装置においては、ユーザが例えば
入力部20のキーボードを用いて上述したユーザインタ
ーフェース用ウィンドウ170を操作することによっ
て、音声合成エンジン250による読み上げスピードを
設定することができる。ここでは、読み上げスピード
は、音声合成エンジン250により1秒間に読み上げら
れる文字数で表すものとする。文書処理装置は、設定さ
れた読み上げスピードの値をRAM14に記憶させる。
【0188】また、文書処理装置においては、このよう
にして音声合成エンジン250による読み上げスピード
を設定するとともに、先に図4に示したように、タグフ
ァイルを音声読み上げ用ファイルに変換し、この音声読
み上げ用ファイルに例えばMark=***といったマーク等を
付与して上述した音声合成エンジン250に適した形式
の共有ファイルFLを生成し、RAM14等に記憶させ
る。この共有ファイルFLは、テロップ作成エンジン2
60からもアクセス可能な形式であり、テロップ作成エ
ンジン260が情報を読み出し及び/又は書き込むこと
が可能な形式である。
【0189】このような文書処理装置においては、音声
合成エンジン250は、ユーザが例えば入力部20のマ
ウスを用いて上述したユーザインターフェース用ウィン
ドウ170の再生ボタン171を押した場合には、例え
ばMark=10000からMark=10001までのように、句単位で読
み上げ処理を行い、音声出力部30に出力する。また、
文書処理装置においては、テロップ作成エンジン260
は、音声合成エンジン250の動作に応じてテロップを
作成し、作成したテロップを表示部31に出力する。
【0190】具体的には、文書処理装置においては、図
23に示すように、ステップS71において、ユーザが
例えば入力部20のマウスを用いて再生ボタン171を
押した場合には、コントローラ270は、音声合成エン
ジン250に対して、読み上げスピードの設定値と、読
み上げを開始する旨の読み上げ開始制御信号とを供給す
る。ここで、コントローラ270は、音声合成エンジン
250とテロップ作成エンジン260とを制御するもの
であり、ハードウェアで構成してもよいし、ソフトウェ
アで実現するようにしてもよい。
【0191】続いて、ステップS72において、音声合
成エンジン250は、共有ファイルFLにアクセスし、
1つの句を構成するマーク情報等の各種情報及び文字列
を読み出す。
【0192】続いて、ステップS73において、音声合
成エンジン250は、入力した情報及び文字列を識別及
び/又は解析して音声出力部30に出力すべき音声信号
を生成するとともに、句の開始位置及び終了位置を示す
2つのマーク情報を含み且つこれらのマークのタイミン
グを示すマーク位置制御信号をテロップ作成エンジン2
60に供給する。ここでは、音声合成エンジン250
は、Mark=n-1及びMark=nの情報及びこれらのマークのタ
イミングを示すマーク位置制御信号をテロップ作成エン
ジン260に供給するものとする。
【0193】続いて、ステップS74において、テロッ
プ作成エンジン260は、音声合成エンジン250から
供給されたマーク位置制御信号に基づいて、文字列がテ
ロップ表示領域185におさまるか否かを判別する。す
なわち、テロップ作成エンジン260は、Mark=n-1から
Mark=nまでの文字列の文字数を計数し、文字列がテロッ
プ表示領域185におさまるか否かを判別する。
【0194】ここで、文字列がテロップ表示領域185
におさまらないと判別した場合には、テロップ作成エン
ジン260は、ステップS76において、共有ファイル
FLに対して後述する加工処理を行った後、処理をステ
ップS75へと移行する。
【0195】一方、文字列がテロップ表示領域185に
おさまると判別した場合には、テロップ作成エンジン2
60は、ステップS75において、音声合成エンジン2
50から供給されたマーク位置制御信号に基づいて、句
の開始位置を示すMark=n-1から句の終了位置を示すMark
=nまでの文字列をテロップとして作成し、テロップの表
示を開始する旨を示す表示開始制御信号を音声合成エン
ジン250に供給するとともに、テロップの表示を開始
する。なお、テロップ作成エンジン260は、ステップ
S76において、共有ファイルFLに対して加工処理を
行った場合には、共有ファイルFLの加工処理が終了し
た旨を示す加工終了制御信号を表示開始制御信号ととも
に音声合成エンジン250に供給する。
【0196】続いて、図24に示すように、ステップS
77において、音声合成エンジン250は、テロップ作
成エンジン260から供給された加工終了制御信号及び
/又は表示開始制御信号に基づいて、句の読み上げを開
始するとともに、共有ファイルFLにアクセスして次の
句を構成するマーク情報等の各種情報及び文字列を読み
出す。
【0197】続いて、ステップS78において、音声合
成エンジン250は、入力した情報及び文字列を識別及
び/又は解析して音声出力部30に出力すべき音声信号
を生成するとともに、句の開始位置及び終了位置を示す
2つのマーク情報、すなわちここでは、Mark=n及びMark
=n+1の情報を含み且つこれらのマークのタイミングを示
すマーク位置制御信号をテロップ作成エンジン260に
供給する。
【0198】続いて、ステップS79において、テロッ
プ作成エンジン260は、音声合成エンジン250から
供給されたマーク位置制御信号に基づいて、Mark=nから
Mark=n+1までの文字列の文字数を計数し、文字列がテロ
ップ表示領域185におさまるか否かを判別する。
【0199】ここで、文字列がテロップ表示領域185
におさまらないと判別した場合には、テロップ作成エン
ジン260は、ステップS81において、ステップS7
6と同様に加工処理を行った後、処理をステップS80
へと移行する。
【0200】一方、文字列がテロップ表示領域185に
おさまると判別した場合には、テロップ作成エンジン2
60は、ステップS80において、音声合成エンジン2
50から供給されたマーク位置制御信号に基づいて、句
の開始位置を示すMark=nから句の終了位置を示すMark=n
+1までの文字列をテロップとして作成する。
【0201】続いて、ステップS82において、テロッ
プ作成エンジン260は、音声合成エンジン250によ
る前の句、すなわちここでは、Mark=n-1からMark=nまで
の文字列の読み上げ相当所要時間が経過するまで(読み
上げが終了するまで)待機する。
【0202】続いて、Mark=n-1からMark=nまでの文字列
の読み上げ相当所要時間が経過すると(読み上げが終了
すると)、テロップ作成エンジン260は、ステップS
83において、テロップの表示を開始する旨を示す表示
開始制御信号を音声合成エンジン250に供給し、Mark
=n以降の文字列をテロップとして表示開始する。すなわ
ち、テロップ作成エンジン260は、Mark=nに対応する
文字をテロップ表示領域185の先頭に位置させるよう
に、Mark=n以降の文字列に切り換え表示したり、或い
は、Mark=n以降の文字列を移動表示してMark=nに対応す
る文字をテロップ表示領域185の先頭に位置させる。
なお、テロップ作成エンジン260は、ステップS81
において、共有ファイルFLに対して加工処理を行った
場合には、共有ファイルFLの加工処理が終了した旨を
示す加工終了制御信号を表示開始制御信号とともに音声
合成エンジン250に供給する。
【0203】そして、ステップS84において、音声合
成エンジン250は、次の句があるか否かを判別する。
【0204】ここで、次の句がないと判別した場合に
は、音声合成エンジン250は、ステップS85におい
て、テロップ作成エンジン260から供給された加工終
了制御信号及び/又は表示開始制御信号に基づいて、句
の読み上げを開始する。そして、文書処理装置において
は、音声合成エンジン250による読み上げ及びテロッ
プ作成エンジン260によるテロップ表示を全て完了
し、一連の処理を終了する。
【0205】一方、次の句があると判別した場合には、
文書処理装置においては、ステップS77へと処理を再
び移行し、ステップS77以降の処理を繰り返す。
【0206】このように動作する文書処理装置におい
て、テロップ表示領域185に表示される具体的なテロ
ップ内容を説明するために、図25を参照して説明す
る。ここでは、“abcdefghijk・・・”の各
アルファベット文字が単語等の1つの要素を表して文書
又は要約文が構成されているものとし、“abcdef
g”の句頭及び句尾にそれぞれMark=n-1、Mark=nが付与
されており、1つの句を構成しているものとして説明す
る。
【0207】文書処理装置は、同図(A)に示すよう
に、テロップ表示領域185に“abcdefghij
klmnop”をテロップとして表示している場合、Ma
rk=n-1からMark=nまでの文字列である“abcdef
g”を音声合成エンジン250により読み上げる。そし
て、文書処理装置は、音声合成エンジン250による読
み上げがMark=nに達すると、すなわち、“abcdef
g”の読み上げ相当所要時間が経過すると、同図(B)
に示すように、テロップ作成エンジン260によりMark
=nを先頭とした“hijklmnopqr・・・”に切
り換え表示又は移動表示するとともに、音声合成エンジ
ン250によりMark=nからMark=n+1までの文字列である
“hijklmnopqr”を読み上げる。
【0208】文書処理装置は、このようにして音声合成
エンジン250とテロップ作成エンジン260との同期
をとり、テロップを上述したテロップ表示領域185に
間欠的に移動させて表示することができる。
【0209】また、文書処理装置においては、ユーザが
例えば入力部20のマウスを用いて上述したユーザイン
ターフェース用ウィンドウ170の各種ボタン/スイッ
チを押した/選択した場合には、読み上げの場合と同様
に、押されたボタンに応じてテロップ表示領域185に
表示されるテロップの表示の変更や動作を行う。
【0210】例えば、ユーザが例えば入力部20のマウ
スを用いてユーザインターフェース用ウィンドウ170
のジャンプAボタン174を押した場合には、文書処理
装置は、テロップ表示領域185にそれまで表示してい
た文の先頭から再びテロップを表示する。また、ユーザ
が例えば入力部20のマウスを用いてジャンプBボタン
175又はジャンプCボタン176を押した場合には、
それぞれ、文書処理装置は、テロップ表示領域185に
それまで表示していた文の前の文の先頭又は次の文の先
頭にジャンプして、テロップを再び表示する。
【0211】同様に、ユーザが例えば入力部20のマウ
スを用いてジャンプAボタン177を押した場合には、
文書処理装置は、テロップ表示領域185にそれまで表
示していた段落の先頭から再びテロップを表示する。さ
らに、ユーザが例えば入力部20のマウスを用いてジャ
ンプBボタン178又はジャンプCボタン179を押し
た場合には、それぞれ、文書処理装置は、テロップ表示
領域185にそれまで表示していた段落の前の段落の先
頭又は次の段落の先頭にジャンプして、テロップを再び
表示する。
【0212】さらにまた、ユーザが例えば入力部20の
マウスを用いてジャンプAボタン180を押した場合に
は、文書処理装置は、テロップ表示領域185にそれま
で表示していた句の先頭から再びテロップを表示する。
また、ユーザが例えば入力部20のマウスを用いてジャ
ンプBボタン181又はジャンプCボタン182を押し
た場合には、それぞれ、文書処理装置は、テロップ表示
領域185にそれまで表示していた句の前の句の先頭又
は次の句の先頭にジャンプして、テロップを再び表示す
る。
【0213】さらに、例えば、ユーザが例えば入力部2
0のマウスを用いて停止ボタン172を押した場合に
は、文書処理装置は、テロップ表示領域185に対する
テロップの切り換え表示又は移動表示を停止する。
【0214】文書処理装置は、このようにユーザインタ
ーフェース用ウィンドウ170をユーザが操作すること
によって、テロップ表示領域185に表示するテロップ
の段落、文及び句の単位での頭出しができ、利便性に優
れた操作性をユーザに提供することができる。
【0215】つぎに、図23中ステップS76及び図2
4中ステップS81に示した加工処理について説明す
る。この加工処理の具体例を説明するために、ここで
は、図26(A)又は図27(A)に示すように、1つ
の句を構成するMark=n-1からMark=nまでの文字列である
“abcdefghijklmnopqr”の全てが、
テロップ表示領域185におさまらない場合を考える。
【0216】このような場合、次の句をテロップ表示領
域185に表示するために、上述したように切り換え表
示すると、テロップ表示領域185におさまらない部分
である“qr”は、全く表示されないことになる。
【0217】そこで、文書処理装置においては、1つの
句がテロップ表示領域185におさまらない場合には、
この句を以下に示す2つの方法により加工する。
【0218】第1の方法としては、図26(B)に示す
ように、Mark=n-1からMark=nまでの文字列である“ab
cdefghijklmnopqr”の間に新たにMark
=n'を付与するものがある。この場合、文書処理装置
は、先に図23及び図24に示した一連の処理にしたが
って、以下のようにしてMark=n'を付与する。なおここ
では、テロップ表示領域185の表示内容例として図2
6を参照し、図24中ステップS78からステップS8
4を経てステップS77からの処理を繰り返すループ処
理について説明する。
【0219】まず、音声合成エンジン250は、図24
に示すように、ステップS78において、先に図22に
示した共有ファイルFLにアクセスして読み出したMa
rk=n−1及びMark=nを含む情報と、これらの
マーク間の文字列である“abcdefghijklm
nopqr”を識別及び/又は解析して音声出力部30
に出力すべき音声信号を生成するとともに、Mark=n-1及
びMark=nの情報を含み且つこれらのマークのタイミング
を示すマーク位置制御信号をテロップ作成エンジン26
0に供給する。
【0220】続いて、テロップ作成エンジン260は、
ステップS79において、音声合成エンジン250から
供給されたマーク位置制御信号に基づいて、Mark=n-1か
らMark=nまでの文字列である“abcdefghijk
lmnopqr”の文字数を計数し、文字列“abcd
efghijklmnopqr”がテロップ表示領域1
85におさまるか否かを判別する。
【0221】続いて、文字列“abcdefghijk
lmnopqr”がテロップ表示領域185におさまら
ないと判別したものとすると、テロップ作成エンジン2
60は、ステップS81において、共有ファイルFLに
アクセスし、例えば単語等の少なくとも句よりも小さい
単位の区切れ位置にMark=n'を付与する。
【0222】そして、テロップ作成エンジン260は、
ステップS80において、Mark=n-1及びMark=n'の情報
を含み且つこれらのマークのタイミングを示すマーク位
置制御信号に基づいて、Mark=n-1からMark=n'までの文
字列をテロップとして作成する。
【0223】続いて、テロップ作成エンジン260は、
ステップS82において、音声合成エンジン250によ
る前の句、すなわちここでは、図示しないMark=n-2から
Mark=n-1までの文字列の読み上げ相当所要時間が経過す
るまで(読み上げが終了するまで)待機する。
【0224】そして、図示しないMark=n-2からMark=n-1
までの文字列の読み上げ相当所要時間が経過すると(読
み上げが終了すると)、テロップ作成エンジン260
は、ステップS83において、共有ファイルFLの加工
処理が終了した旨を示す加工終了制御信号及びテロップ
の表示を開始する旨を示す表示開始制御信号を音声合成
エンジン250に供給するとともに、図26(B)に示
すように、Mark=n-1以降の文字列をテロップとして表示
開始する。
【0225】続いて、音声合成エンジン250は、ステ
ップS84において、次の句があるか否かを判別する。
【0226】ここで、次の句があると判別したものとす
ると、音声合成エンジン250は、ステップS77にお
いて、テロップ作成エンジン260から供給された加工
終了制御信号及び表示開始制御信号に基づいて、Mark=n
-1からMark=n'までの文字列である“abcdefgh
ijklm”の読み上げを開始するとともに、共有ファ
イルFLにアクセスしてMark=n'からMark=n+1までの文
字列である“nopqr”を構成する情報及び文字列を
読み出す。
【0227】続いて、音声合成エンジン250は、ステ
ップS78において、共有ファイルFLにアクセスして
読み出したMark=n'及びMark=n+1を含む情報と、これら
のマーク間の文字列である“nopqr”を識別及び/
又は解析して音声出力部30に出力すべき音声信号を生
成するとともに、Mark=n'及びMark=n+1の情報を含み且
つこれらのマークのタイミングを示すマーク位置制御信
号をテロップ作成エンジン260に供給する。
【0228】続いて、テロップ作成エンジン260は、
ステップS79において、音声合成エンジン250から
供給されたマーク位置制御信号に基づいて、Mark=n'か
らMark=n+1までの文字列である“nopqr”の文字数
を計数し、文字列“nopqr”がテロップ表示領域1
85におさまるか否かを判別し、文字列“nopqr”
がテロップ表示領域185におさまると判別したものと
すると、テロップ作成エンジン260は、ステップS8
0において、音声合成エンジン250から供給されたマ
ーク位置制御信号に基づいて、Mark=n'からMark=n+1ま
での文字列をテロップとして作成する。
【0229】続いて、テロップ作成エンジン260は、
ステップS82において、音声合成エンジン250によ
る前の句、すなわちここでは、Mark=n-1からMark=n'ま
での文字列“abcdefghijklm”の読み上げ
相当所要時間が経過するまで(読み上げが終了するま
で)待機し、読み上げ相当所要時間が経過すると、(読
み上げが終了すると)、ステップS83において、テロ
ップの表示を開始する旨を示す表示開始制御信号を音声
合成エンジン250に供給する。そして、テロップ作成
エンジン260は、図26(C)に示すように、Mark=
n'以降の文字列をテロップとして表示開始する。すなわ
ち、テロップ作成エンジン260は、Mark=n'に対応す
る文字をテロップ表示領域185の先頭に位置させるよ
うに、Mark=n'以降の文字列に切り換え表示したり、或
いは、Mark=n'以降の文字列を移動表示してMark=n'に対
応する文字をテロップ表示領域185の先頭に位置させ
る。
【0230】文書処理装置は、このように少なくとも句
よりも小さい単位の区切れ位置に新たなマークを付与し
て1つの句を分割して、テロップ表示領域185に表示
されるテロップが少なくとも2つ以上のマーク間の文字
列を含むように加工することによって、読み上げる全て
の文字列をテロップ表示領域185にテロップとして表
示することができる。
【0231】一方、第2の方法としては、図27(B)
に示すように、Mark=n-1からMark=nまでの文字列である
“abcdefghijklmnopqr”の任意の要
素を省略するものがある。この場合も、文書処理装置
は、先に図23及び図24に示した一連の処理にしたが
って、以下のようにして任意の要素を省略する。なおこ
こでは、テロップ表示領域185の表示内容例として図
27を参照するとともに、図24中ステップS78から
ステップS84を経てステップS77からの処理を繰り
返すループ処理について説明する。
【0232】まず、音声合成エンジン250は、図24
に示すように、ステップS78において、共有ファイル
FLにアクセスして読み出したMark=n-1及びMark=nを含
む情報と、これらのマーク間の文字列である“abcd
efghijklmnopqr”を識別及び/又は解析
して音声出力部30に出力すべき音声信号を生成すると
ともに、Mark=n-1及びMark=nの情報を含み且つこれらの
マークのタイミングを示すマーク位置制御信号をテロッ
プ作成エンジン260に供給する。
【0233】続いて、テロップ作成エンジン260は、
ステップS79において、音声合成エンジン250から
供給されたマーク位置制御信号に基づいて、Mark=n-1か
らMark=nまでの文字列である“abcdefghijk
lmnopqr”の文字数を計数し、文字列“abcd
efghijklmnopqr”がテロップ表示領域1
85におさまるか否かを判別する。
【0234】続いて、文字列“abcdefghijk
lmnopqr”がテロップ表示領域185におさまら
ないと判別したものとすると、テロップ作成エンジン2
60は、ステップS81において、共有ファイルFLに
アクセスし、文字列“abcdefghijklmno
pqr”を体言止めの表現に変換したり、接続詞及び/
又は助詞等を構成する省略可能な要素を除去し、Mark=n
-1以降の文字列をテロップとして作成する。ここでは、
文字列“abcdefghijklmnopqr”のう
ち、2つの要素“i”及び“r”を省略するものとす
る。
【0235】そして、テロップ作成エンジン260は、
ステップS80において、Mark=n-1及びMark=nの情報を
含み且つこれらのマークのタイミングを示すマーク位置
制御信号に基づいて、加工して得られたMark=n-1からMa
rk=nまでの新たな文字列をテロップとして作成する。
【0236】続いて、テロップ作成エンジン260は、
ステップS82において、音声合成エンジン250によ
る前の句、すなわちここでは、図示しないMark=n-2から
Mark=n-1までの文字列の読み上げ相当所要時間が経過す
るまで(読み上げが終了するまで)待機する。
【0237】そして、図示しないMark=n-2からMark=n-1
までの文字列の読み上げ相当所要時間が経過すると(読
み上げが終了すると)、テロップ作成エンジン260
は、ステップS83において、共有ファイルFLの加工
処理が終了した旨を示す加工終了制御信号及びテロップ
の表示を開始する旨を示す表示開始制御信号を音声合成
エンジン250に供給するとともに、図27(B)に示
すように、加工して得られたMark=n-1以降の新たな文字
列をテロップとして表示開始する。
【0238】続いて、音声合成エンジン250は、ステ
ップS84において、次の句があるか否かを判別する。
【0239】ここで、次の句があると判別したものとす
ると、音声合成エンジン250は、ステップS77にお
いて、テロップ作成エンジン260から供給された加工
終了制御信号及び表示開始制御信号に基づいて、加工し
て得られたMark=n-1からMark=nまでの新たな文字列であ
る“abcdefghjklmnopq”の読み上げを
開始するとともに、共有ファイルFLにアクセスしてMa
rk=nから図示しないMark=n+1までの文字列である“st
uvwxyz・・・”を構成する情報及び文字列を読み
出す。
【0240】続いて、音声合成エンジン250は、ステ
ップS78において、共有ファイルFLにアクセスして
読み出したMark=n及び図示しないMark=n+1を含む情報
と、これらのマーク間の文字列である“stuvwxy
z・・・”を識別及び/又は解析して音声出力部30に
出力すべき音声信号を生成するとともに、Mark=n及び図
示しないMark=n+1の情報を含み且つこれらのマークのタ
イミングを示すマーク位置制御信号をテロップ作成エン
ジン260に供給する。
【0241】続いて、テロップ作成エンジン260は、
ステップS79において、音声合成エンジン250から
供給されたマーク位置制御信号に基づいて、Mark=nから
図示しないMark=n+1までの文字列である“stuvwx
yz・・・”の文字数を計数し、文字列“stuvwx
yz・・・”がテロップ表示領域185におさまるか否
かを判別し、文字列“stuvwxyz・・・”がテロ
ップ表示領域185におさまると判別したものとする
と、テロップ作成エンジン260は、ステップS80に
おいて、音声合成エンジン250から供給されたマーク
位置制御信号に基づいて、Mark=nから図示しないMark=n
+1までの文字列をテロップとして作成する。
【0242】続いて、テロップ作成エンジン260は、
ステップS82において、音声合成エンジン250によ
る前の句、すなわちここでは、加工して得られたMark=n
-1からMark=nまでの新たな文字列“abcdefghj
klmnopq”の読み上げ相当所要時間が経過するま
で(読み上げが終了するまで)待機し、読み上げ相当所
要時間が経過すると、(読み上げが終了すると)、ステ
ップS83において、テロップの表示を開始する旨を示
す表示開始制御信号を音声合成エンジン250に供給す
る。そして、テロップ作成エンジン260は、図27
(C)に示すように、Mark=n以降の文字列をテロップと
して表示開始する。すなわち、テロップ作成エンジン2
60は、Mark=nに対応する文字をテロップ表示領域18
5の先頭に位置させるように、Mark=n以降の文字列に切
り換え表示したり、或いは、Mark=n以降の文字列を移動
表示してMark=nに対応する文字をテロップ表示領域18
5の先頭に位置させる。
【0243】文書処理装置は、このように対象とする句
を体言止めの表現に変換したり、接続詞及び/又は助詞
等を構成する省略可能な要素を除去して、句を構成する
要素のうちの任意の要素を省略し、テロップ表示領域1
85に表示されるテロップが少なくとも2つ以上のマー
ク間の文字列を含むように加工することによって、読み
上げる全ての文字列をテロップ表示領域185にテロッ
プとして表示することができる。
【0244】なお、文書処理装置は、共有ファイルFL
にアクセスし、対象とする句を体言止めの表現に実際に
変換したり、接続詞及び/又は助詞等を構成する省略可
能な要素を除去して、句を構成する要素のうちの任意の
要素を省略するようにしてもよいが、共有ファイルFL
に対して、体言止めの表現に変換して表示する旨を示す
タグや、除去して表示する要素を示すタグを付与するよ
うにしてもよい。
【0245】以上説明したように、文書処理装置は、任
意の文書やその文書から作成した要約文を適切な音声合
成エンジンを用いて高精度に読み上げることができる
上、ユーザがユーザインターフェース用ウィンドウ17
0を操作することによって、文書の読み上げの際の頭出
しを段落、文及び句の単位で行うことができ、利便性に
優れた操作性をユーザに提供することができる。
【0246】また、文書処理装置は、任意の文書やその
文書から作成した要約文のテロップを高精度に作成し、
このテロップをユーザの把握が容易となるようにテロッ
プ表示領域185に表示することができる。特に、文書
処理装置は、音声合成エンジン250とテロップ作成エ
ンジン260とを連動させて動作させることによって、
与えられた文書や作成した要約文のテロップを高精度に
作成し、作成したテロップをユーザの把握が容易となる
ように切り換え表示又は移動表示することができる。さ
らに、文書処理装置は、ユーザインターフェース用ウィ
ンドウ170をユーザが操作することによって、テロッ
プ表示領域185に表示するテロップの段落、文及び句
の単位での頭出しができ、利便性に優れた操作性をユー
ザに提供することができる。
【0247】このような文書処理装置は、文書を音声合
成して読み上げるとともに、文書をテロップとして表示
する機能を有する携帯可能ないわゆるビューア機器に適
用することができる。
【0248】なお、本発明は、上述した実施の形態に限
定されるものではなく、例えば、文書や音声読み上げ用
ファイルへのタグ付けが上述のものに限定されるもので
はないことは勿論である。例えば、本発明においては、
少なくとも段落、文及び句の開始位置を示すタグ情報が
付与されていればよい。
【0249】また、上述した実施の形態においては、テ
ロップをテロップ表示領域185に表示する際に、必ず
しも音声合成エンジン250により実際に読み上げる必
要はない。すなわち、文書処理装置は、音声出力部30
から出力される音声のレベルが“0”であっても、読み
上げ相当所要時間に応じて、テロップ作成エンジン26
0によりテロップを作成し、このテロップをテロップ表
示領域185に切り換え表示又は移動表示することがで
きる。
【0250】さらに、上述した実施の形態においては、
テロップ作成エンジン260によって、対象とする句を
構成する全ての要素がテロップ表示領域185におさま
るか否かを判別し、おさまらない場合に加工処理を行う
ように説明したが、例えば音声合成エンジン250とい
ったテロップ作成エンジン260以外の機能部によっ
て、これらの判別や加工処理を行うようにしてもよい。
【0251】さらにまた、上述した実施の形態において
は、実時間で、テロップ作成エンジン260によって、
対象とする句を構成する全ての要素がテロップ表示領域
185におさまるか否かを判別し、おさまらない場合に
加工処理を行うように説明したが、本発明は、これに限
定されるものではない。すなわち、文書処理装置におい
ては、上述したように、音声読み上げ用ファイルから共
有ファイルFLを生成する際に、全ての句について、各
句を構成する全ての要素がテロップ表示領域185にお
さまるか否かを判別し、おさまらない句に対して予め加
工処理を施し、共有ファイルFLを生成するようにして
もよい。
【0252】また、上述した実施の形態において対象と
する句を構成する全ての要素がテロップ表示領域185
におさまらない場合に行う加工処理としては、少なくと
も句よりも小さい単位の位置に新たなMark=***を付与し
て1つの句を分割する方法と、1つの句を構成する任意
の要素を省略する方法とを組み合わせるようにしてもよ
い。
【0253】さらに、上述した実施の形態においては、
コントローラ270が音声合成エンジン250に対し
て、読み上げスピードの設定値と、読み上げを開始する
旨の読み上げ開始制御信号とを供給するものとして説明
したが、図22中破線部に示すように、コントローラ2
70がテロップ作成エンジン260に対して、読み上げ
スピードの設定値(テロップの表示スピード)と、テロ
ップの作成を開始する旨のテロップ作成開始制御信号と
を供給するようにしてもよい。
【0254】さらにまた、上述した実施の形態において
は、音声合成エンジン250による読み上げと、テロッ
プ作成エンジン260によるテロップの作成・表示とを
連動させる必要はない。
【0255】また、上述した実施の形態においては、通
信部22に外部から電話回線を介して文書が送信される
ものとして説明したが、本発明は、これに限定されるも
のではない。例えば、衛星等を介して文書が送信される
場合にも適用できる他、記録/再生部32において記録
媒体33から読み出されたり、ROM15に予め文書が
記録されていてもよい。
【0256】さらに、上述した実施の形態においては、
受信又は作成したタグファイルから音声読み上げ用ファ
イルを生成するものとしたが、このような音声読み上げ
用ファイルを生成せずに、タグファイルに基づいて直接
読み上げるようにしてもよい。
【0257】この場合、文書処理装置は、タグファイル
を受信又は作成した後、音声合成エンジンを用い、タグ
ファイルに付与されている段落、文及び句を示すタグに
基づいて、段落、文及び句を識別し、これらの段落、文
及び句の開始位置に所定の休止期間を設けて読み上げ
る。タグファイルには、上述したように、読み上げを禁
止するための属性情報や、読み仮名又は発音を示す属性
情報が付与されており、文書処理装置は、読み上げが禁
止されている部分を除去するとともに、正確な読み又は
発音に置換して読み上げを行う。また、文書処理装置
は、読み上げの途中で、ユーザが上述したユーザインタ
ーフェースを操作することによって、タグファイルに付
与されている段落、文及び句を示すタグに基づいて、段
落、文及び句の単位で読み上げの際の頭出しを行うこと
もできる。
【0258】このようにすることによって、文書処理装
置は、音声読み上げ用ファイルを生成することなく、タ
グファイルに基づいて文書を直接読み上げることができ
る。この場合にも、文書処理装置は、タグファイルに基
づいてテロップを作成することができることはいうまで
もない。
【0259】また、本発明においては、記録媒体33と
して、上述した電子文書処理プログラムが書き込まれた
ディスク状記録媒体やテープ状記録媒体等を提供するこ
とも容易に実現できる。
【0260】さらに、上述した実施の形態においては、
表示部31に表示される種々のウィンドウを操作するデ
バイスとして入力部20のマウスを例示したが、本発明
がこれに限定されるものではないことはいうまでもな
い。例えば、このようなデバイスとしては、タブレット
やライトペン等も利用することができる。
【0261】さらにまた、上述した実施の形態において
は、日本語及び英語の文書を例示したが、本発明がいか
なる言語にも適用可能であることは勿論である。
【0262】このように、本発明は、その趣旨を逸脱し
ない範囲で適宜変更が可能であることはいうまでもな
い。
【0263】
【発明の効果】以上詳細に説明したように、本発明にか
かる電子文書処理方法は、複数の要素が階層化された木
構造である内部構造を有し、木構造における階層を示す
タグ情報が付与されている電子文書を、タグ情報に基づ
いて読み上げる文書読み上げ工程を備え、文書読み上げ
工程では、タグ情報に基づいて、階層毎に電子文書の階
層の先頭に頭出しして電子文書を読み上げる。
【0264】したがって、本発明にかかる電子文書処理
方法は、複数の要素が階層化された木構造である内部構
造を有し、木構造における階層を示すタグ情報が付与さ
れている電子文書を、タグ情報に基づいて読み上げる際
に、タグ情報に基づいて、階層毎に電子文書の階層の先
頭に頭出しすることによって、任意の電子文書を音声合
成により高精度で且つ違和感がなく読み上げることを可
能とするとともに、優れた操作性を提供することを可能
とする。
【0265】また、本発明にかかる電子文書処理方法
は、複数の要素が階層化された木構造である内部構造を
有し、木構造における階層を示すタグ情報が付与されて
いる電子文書の一部を表示領域に切り換え表示又は移動
表示する表示制御工程を備え、表示制御工程では、タグ
情報に基づいて、階層毎に電子文書の階層の先頭に頭出
しして電子文書の一部を表示領域に切り換え表示又は移
動表示する。
【0266】したがって、本発明にかかる電子文書処理
方法は、複数の要素が階層化された木構造である内部構
造を有し、木構造における階層を示すタグ情報が付与さ
れている電子文書の一部を表示領域に切り換え表示又は
移動表示する際に、タグ情報に基づいて、階層毎に電子
文書の階層の先頭に頭出しすることによって、任意の電
子文書のテロップを高精度に作成し、作成したテロップ
をユーザの把握が容易となるように表示することを可能
とするとともに、優れた操作性を提供することを可能と
する。
【0267】さらに、本発明にかかる電子文書処理装置
は、複数の要素が階層化された木構造である内部構造を
有し、木構造における階層を示すタグ情報が付与されて
いる電子文書を、タグ情報に基づいて読み上げる文書読
み上げ手段と、タグ情報に基づいて、文書読み上げ手段
に、階層毎に電子文書の階層の先頭に頭出しさせて電子
文書を読み上げさせる頭出し手段とを備える。
【0268】したがって、本発明にかかる電子文書処理
装置は、複数の要素が階層化された木構造である内部構
造を有し、木構造における階層を示すタグ情報が付与さ
れている電子文書を、タグ情報に基づいて文書読み上げ
手段により読み上げる際に、頭出し手段がタグ情報に基
づいて、文書読み上げ手段に、階層毎に電子文書の階層
の先頭に頭出しさせることによって、任意の電子文書を
音声合成により高精度で且つ違和感がなく読み上げるこ
とができ、利便性に優れた操作性を提供することができ
る。
【0269】さらにまた、本発明にかかる電子文書処理
装置は、複数の要素が階層化された木構造である内部構
造を有し、木構造における階層を示すタグ情報が付与さ
れている電子文書の一部を表示領域に切り換え表示又は
移動表示する表示制御手段と、タグ情報に基づいて、表
示制御手段に、階層毎に電子文書の階層の先頭に頭出し
させて電子文書の一部を表示領域に切り換え表示又は移
動表示させる頭出し手段とを備える。
【0270】したがって、本発明にかかる電子文書処理
装置は、複数の要素が階層化された木構造である内部構
造を有し、木構造における階層を示すタグ情報が付与さ
れている電子文書の一部を表示制御手段により表示領域
に切り換え表示又は移動表示する際に、頭出し手段がタ
グ情報に基づいて、表示制御手段に、階層毎に電子文書
の階層の先頭に頭出しさせることによって、任意の電子
文書のテロップを高精度に作成し、作成したテロップを
ユーザの把握が容易となるように表示することができ、
優れた操作性を提供することができる。
【0271】また、本発明にかかる電子文書処理プログ
ラムが記録された記録媒体における電子文書処理プログ
ラムは、複数の要素が階層化された木構造である内部構
造を有し、木構造における階層を示すタグ情報が付与さ
れている電子文書を、タグ情報に基づいて読み上げる文
書読み上げ工程を備え、文書読み上げ工程では、タグ情
報に基づいて、階層毎に電子文書の階層の先頭に頭出し
して電子文書を読み上げる。
【0272】したがって、本発明にかかる電子文書処理
プログラムが記録された記録媒体は、複数の要素が階層
化された木構造である内部構造を有し、木構造における
階層を示すタグ情報が付与されている電子文書を、タグ
情報に基づいて読み上げる際に、タグ情報に基づいて、
階層毎に電子文書の階層の先頭に頭出しする電子文書処
理プログラムを提供することができる。そのため、この
電子文書処理プログラムが提供された装置は、任意の電
子文書を音声合成により高精度で且つ違和感がなく読み
上げることが可能となるとともに、優れた操作性を提供
することが可能となる。
【0273】さらに、本発明にかかる電子文書処理プロ
グラムが記録された記録媒体における電子文書処理プロ
グラムは、複数の要素が階層化された木構造である内部
構造を有し、木構造における階層を示すタグ情報が付与
されている電子文書の一部を表示領域に切り換え表示又
は移動表示する表示制御工程を備え、表示制御工程で
は、タグ情報に基づいて、階層毎に電子文書の階層の先
頭に頭出しして電子文書の一部を表示領域に切り換え表
示又は移動表示する。
【0274】したがって、本発明にかかる電子文書処理
プログラムが記録された記録媒体は、複数の要素が階層
化された木構造である内部構造を有し、木構造における
階層を示すタグ情報が付与されている電子文書の一部を
表示領域に切り換え表示又は移動表示する際に、タグ情
報に基づいて、階層毎に電子文書の階層の先頭に頭出し
する電子文書処理プログラムを提供することができる。
そのため、この電子文書処理プログラムが提供された装
置は、任意の電子文書のテロップを高精度に作成し、作
成したテロップをユーザの把握が容易となるように表示
することが可能となるとともに、優れた操作性を提供す
ることが可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態として示す文書処理装置の
構成を説明するブロック図である。
【図2】文書の内部構造を示す図である。
【図3】表示部の表示内容を説明する図であって、文書
の内部構造をタグにより表示したウィンドウを示す図で
ある。
【図4】文書の読み上げを行う際の一連の処理を説明す
るフローチャートである。
【図5】受信又は作成した日本語の文書の一例を示す図
であって、文書を表示したウィンドウを示す図である。
【図6】受信又は作成した英語の文書の一例を示す図で
あって、文書を表示したウィンドウを示す図である。
【図7】図5に示すタグ付けされた日本語の文書である
タグファイルを示す図である。
【図8】図6に示すタグ付けされた英語の文書であるタ
グファイルを示す図である。
【図9】図7に示すタグファイルから生成した音声読み
上げ用ファイルを示す図である。
【図10】図8に示すタグファイルから生成した音声読
み上げ用ファイルを示す図である。
【図11】音声読み上げ用ファイルを生成する際の一連
の処理を説明するフローチャートである。
【図12】ユーザインターフェース用ウィンドウを示す
図である。
【図13】文書を表示したウィンドウを示す図である。
【図14】文書を表示したウィンドウを示す図であっ
て、要約文を表示する表示領域が図13に示す表示領域
よりも拡大された様子を示す図である。
【図15】要約文を作成する際の一連の処理を説明する
フローチャートである。
【図16】活性拡散を行う際の一連の処理を説明するフ
ローチャートである。
【図17】活性拡散の処理を説明するためのエレメント
の連結構造を示す図である。
【図18】活性拡散のリンク処理を行う際の一連の処理
を説明するフローチャートである。
【図19】文書とその要約文を表示したウィンドウを示
す図である。
【図20】文書とその要約文を表示したウィンドウを示
す図であって、図14に示すウィンドウに要約文を表示
した様子を示す図である。
【図21】要約文を作成して文書の読み上げを行う際の
一連の処理を説明するフローチャートである。
【図22】音声合成エンジンとテロップ作成エンジンと
を連動させてテロップを作成する際の処理を説明する図
である。
【図23】テロップを作成して表示する際の一連の処理
を説明するフローチャートであって、対象とする文書に
対する処理を開始してから最初の句のテロップを表示す
るまでの処理を説明する図である。
【図24】テロップを作成して表示する際の一連の処理
を説明するフローチャートであって、図23に示す処理
を経て最初の句の読み上げを開始してからの処理を説明
する図である。
【図25】テロップ表示領域に表示される表示内容を説
明する図である。
【図26】テロップ表示領域に表示される表示内容を説
明する図であって、新たなマークを付与して句を分割し
た際のテロップ表示領域に表示される表示内容を説明す
る図である。
【図27】テロップ表示領域に表示される表示内容を説
明する図であって、任意の要素を省略した際のテロップ
表示領域に表示される表示内容を説明する図である。
【符号の説明】
10 本体、 11 制御部、 12 インターフェー
ス、 13 CPU、14 RAM、 15 ROM、
20 入力部、 21 受信部、 22通信部、 3
0 音声出力部、 31 表示部、 32 記録/再生
部、 33記録媒体、 34 HDD、 185 テロ
ップ表示領域、 250 音声合成エンジン、 260
テロップ作成エンジン
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B009 QA05 QA09 QA11 RB02 RB14 RD03 SA03 SA14 TB01 TB13 VA02 5E501 AC34 BA05 CA03 CA04 CA08 CB02 CB09 CC17 EA05 EB05 FA03 FA06 FA13 FA32 FB32

Claims (126)

    【特許請求の範囲】
  1. 【請求項1】 電子文書を処理する電子文書処理方法に
    おいて、 複数の要素が階層化された木構造である内部構造を有
    し、上記木構造における階層を示すタグ情報が付与され
    ている上記電子文書を、上記タグ情報に基づいて読み上
    げる文書読み上げ工程を備え、 上記文書読み上げ工程では、上記タグ情報に基づいて、
    上記階層毎に上記電子文書の階層の先頭に頭出しして上
    記電子文書を読み上げることを特徴とする電子文書処理
    方法。
  2. 【請求項2】 上記文書読み上げ工程では、上記タグ情
    報に基づいて、上記電子文書を構成する複数の要素のう
    ち、現在読み上げている要素が属する階層の先頭に頭出
    しすることを特徴とする請求項1記載の電子文書処理方
    法。
  3. 【請求項3】 上記文書読み上げ工程では、上記タグ情
    報に基づいて、上記電子文書を構成する複数の要素のう
    ち、現在読み上げている要素と同種の統語構造を有する
    要素であり且つ上記現在読み上げている要素の前の要素
    が属する階層の先頭に頭出しすることを特徴とする請求
    項1記載の電子文書処理方法。
  4. 【請求項4】 上記文書読み上げ工程では、上記タグ情
    報に基づいて、上記電子文書を構成する複数の要素のう
    ち、現在読み上げている要素と同種の統語構造を有する
    要素であり且つ上記現在読み上げている要素の次の要素
    が属する階層の先頭に頭出しすることを特徴とする請求
    項1記載の電子文書処理方法。
  5. 【請求項5】 上記電子文書には、上記階層として少な
    くとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記文書読み上げ工程では、上記段落、文及び句を示す
    タグ情報に基づいて、段落、文及び句の単位で、現在読
    み上げている段落、文又は句の先頭に頭出しすることを
    特徴とする請求項2記載の電子文書処理方法。
  6. 【請求項6】 上記電子文書には、上記階層として少な
    くとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記文書読み上げ工程では、上記段落、文及び句を示す
    タグ情報に基づいて、段落、文及び句の単位で、現在読
    み上げている段落、文又は句の前の段落、文又は句の先
    頭に頭出しすることを特徴とする請求項3記載の電子文
    書処理方法。
  7. 【請求項7】 上記電子文書には、上記階層として少な
    くとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記文書読み上げ工程では、上記段落、文及び句を示す
    タグ情報に基づいて、段落、文及び句の単位で、現在読
    み上げている段落、文又は句の次の段落、文又は句の先
    頭に頭出しすることを特徴とする請求項4記載の電子文
    書処理方法。
  8. 【請求項8】 上記タグ情報は、上記電子文書に予め付
    与されていることを特徴とする請求項1記載の電子文書
    処理方法。
  9. 【請求項9】 上記電子文書には、上記階層として少な
    くとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記文書読み上げ工程では、これらの段落、文及び句を
    示すタグ情報に基づいて、上記電子文書を構成する段
    落、文及び句を識別することを特徴とする請求項1記載
    の電子文書処理方法。
  10. 【請求項10】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記文書読み上げ工程では、これらの段落、文及び句を
    示すタグ情報に基づいて、上記段落、文及び句の開始位
    置に休止期間を設けて読み上げることを特徴とする請求
    項1記載の電子文書処理方法。
  11. 【請求項11】 上記電子文書には、音声合成を行うた
    めに必要なタグ情報が付与されていることを特徴とする
    請求項1記載の電子文書処理方法。
  12. 【請求項12】 上記音声合成を行うために必要なタグ
    情報は、読み上げを禁止するための属性情報を含むこと
    を特徴とする請求項11記載の電子文書処理方法。
  13. 【請求項13】 上記音声合成を行うために必要なタグ
    情報は、読み仮名又は発音を示す属性情報を含むことを
    特徴とする請求項11記載の電子文書処理方法。
  14. 【請求項14】 上記電子文書に基づいて、音声合成し
    て読み上げるための音声読み上げ用ファイルを生成する
    音声読み上げ用ファイル生成工程を備え、 上記文書読み上げ工程では、上記音声読み上げ用ファイ
    ル生成工程にて生成された上記音声読み上げ用ファイル
    に基づいて、上記電子文書を読み上げることを特徴とす
    る請求項1記載の電子文書処理方法。
  15. 【請求項15】 上記音声読み上げ用ファイル生成工程
    では、上記電子文書を記述する言語を示す属性情報を付
    与して上記音声読み上げ用ファイルを生成することを特
    徴とする請求項14記載の電子文書処理方法。
  16. 【請求項16】 上記音声読み上げ用ファイル生成工程
    では、上記電子文書を構成する複数の要素のうち、段
    落、文及び句の開始位置を示す属性情報を付与して上記
    音声読み上げ用ファイルを生成することを特徴とする請
    求項14記載の電子文書処理方法。
  17. 【請求項17】 上記音声読み上げ用ファイル生成工程
    では、上記段落、文及び句の開始位置を示す属性情報の
    うち、同種の統語構造を表す属性情報が連続して重複さ
    れる場合には、これらの属性情報を単一にまとめること
    を特徴とする請求項16記載の電子文書処理方法。
  18. 【請求項18】 上記音声読み上げ用ファイル生成工程
    では、上記段落、文及び句の開始位置を示す属性情報に
    対応して休止期間を設けることを示す属性情報を付与し
    て上記音声読み上げ用ファイルを生成することを特徴と
    する請求項16記載の電子文書処理方法。
  19. 【請求項19】 上記音声読み上げ用ファイル生成工程
    では、読み上げが禁止されている部分を除去して上記音
    声読み上げ用ファイルを生成することを特徴とする請求
    項14記載の電子文書処理方法。
  20. 【請求項20】 上記音声読み上げ用ファイル生成工程
    では、正確な読み又は発音に置換して上記音声読み上げ
    用ファイルを生成することを特徴とする請求項14記載
    の電子文書処理方法。
  21. 【請求項21】 上記音声読み上げ用ファイル生成工程
    では、読み上げの音量を示す属性情報を付与して上記音
    声読み上げ用ファイルを生成することを特徴とする請求
    項14記載の電子文書処理方法。
  22. 【請求項22】 電子文書を処理する電子文書処理方法
    において、 複数の要素が階層化された木構造である内部構造を有
    し、上記木構造における階層を示すタグ情報が付与され
    ている上記電子文書の一部を表示領域に切り換え表示又
    は移動表示する表示制御工程を備え、 上記表示制御工程では、上記タグ情報に基づいて、上記
    階層毎に上記電子文書の階層の先頭に頭出しして上記電
    子文書の一部を上記表示領域に切り換え表示又は移動表
    示することを特徴とする電子文書処理方法。
  23. 【請求項23】 上記表示制御工程では、上記タグ情報
    に基づいて、上記電子文書を構成する複数の要素のう
    ち、上記表示領域に現在切り換え表示又は移動表示して
    いる要素が属する階層の先頭に頭出しすることを特徴と
    する請求項22記載の電子文書処理方法。
  24. 【請求項24】 上記表示制御工程では、上記タグ情報
    に基づいて、上記電子文書を構成する複数の要素のう
    ち、上記表示領域に現在切り換え表示又は移動表示して
    いる要素と同種の統語構造を有する要素であり且つ上記
    現在切り換え表示又は移動表示している要素の前の要素
    が属する階層の先頭に頭出しすることを特徴とする請求
    項22記載の電子文書処理方法。
  25. 【請求項25】 上記表示制御工程では、上記タグ情報
    に基づいて、上記電子文書を構成する複数の要素のう
    ち、上記表示領域に現在切り換え表示又は移動表示して
    いる要素と同種の統語構造を有する要素であり且つ上記
    現在切り換え表示又は移動表示している要素の次の要素
    が属する階層の先頭に頭出しすることを特徴とする請求
    項22記載の電子文書処理方法。
  26. 【請求項26】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記表示制御工程では、上記段落、文及び句を示すタグ
    情報に基づいて、段落、文及び句の単位で、上記表示領
    域に現在切り換え表示又は移動表示している段落、文又
    は句の先頭に頭出しすることを特徴とする請求項23記
    載の電子文書処理方法。
  27. 【請求項27】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記表示制御工程では、上記段落、文及び句を示すタグ
    情報に基づいて、段落、文及び句の単位で、上記表示領
    域に現在切り換え表示又は移動表示している段落、文又
    は句の前の段落、文又は句の先頭に頭出しすることを特
    徴とする請求項24記載の電子文書処理方法。
  28. 【請求項28】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記表示制御工程では、上記段落、文及び句を示すタグ
    情報に基づいて、段落、文及び句の単位で、上記表示領
    域に現在切り換え表示又は移動表示している段落、文又
    は句の次の段落、文又は句の先頭に頭出しすることを特
    徴とする請求項25記載の電子文書処理方法。
  29. 【請求項29】 上記タグ情報は、上記電子文書に予め
    付与されていることを特徴とする請求項22記載の電子
    文書処理方法。
  30. 【請求項30】 上記電子文書を上記タグ情報に基づい
    て読み上げる文書読み上げ工程を備え、 上記表示制御工程では、上記電子文書の読み上げに連動
    して上記電子文書の一部を上記表示領域に切り換え表示
    又は移動表示することを特徴とする請求項22記載の電
    子文書処理方法。
  31. 【請求項31】 上記表示制御工程では、上記電子文書
    の読み上げに連動して上記電子文書の一部を上記表示領
    域に間欠的に切り換え表示又は移動表示することを特徴
    とする請求項30記載の電子文書処理方法。
  32. 【請求項32】 上記電子文書を任意のまとまり毎に区
    切るための識別子を上記電子文書に付与する識別子付与
    工程を備え、 上記表示制御工程では、上記識別子付与工程にて付与さ
    れた任意の識別子から次の識別子までの範囲を読み上げ
    る所要時間に相当する読み上げ相当所要時間に応じて、
    上記電子文書の上記表示領域への表示形態を制御するこ
    とを特徴とする請求項30記載の電子文書処理方法。
  33. 【請求項33】 上記電子文書のうち上記任意の識別子
    以降の範囲を上記表示領域に表示しているときに、上記
    読み上げ相当所要時間が経過すると、上記電子文書のう
    ち上記次の識別子に対応する部分を上記表示領域の先頭
    とするように、上記電子文書を上記表示領域に切り換え
    表示又は移動表示することを特徴とする請求項32記載
    の電子文書処理方法。
  34. 【請求項34】 上記識別子付与工程では、上記電子文
    書を構成する要素のうち、少なくとも句の単位で上記識
    別子を上記電子文書に付与することを特徴とする請求項
    32記載の電子文書処理方法。
  35. 【請求項35】 上記電子文書のうち上記任意の識別子
    から上記次の識別子までの範囲が、上記表示領域におさ
    まらない場合には、上記電子文書を構成する要素のう
    ち、少なくとも句よりも小さい単位で上記任意の識別子
    から上記次の識別子の間に新たな識別子を上記電子文書
    に付与して上記電子文書を分割する分割工程を備えるこ
    とを特徴とする請求項34記載の電子文書処理方法。
  36. 【請求項36】 上記電子文書のうち上記任意の識別子
    から上記次の識別子までの範囲が、上記表示領域におさ
    まらない場合には、上記任意の識別子から上記次の識別
    子までの範囲を構成する上記電子文書の任意の要素を省
    略する省略工程を備えることを特徴とする請求項34記
    載の電子文書処理方法。
  37. 【請求項37】 上記省略工程では、上記電子文書のう
    ち上記任意の識別子から上記次の識別子までの範囲を体
    言止めにして省略することを特徴とする請求項36記載
    の電子文書処理方法。
  38. 【請求項38】 上記任意の識別子から上記次の識別子
    までの範囲を構成する上記電子文書の任意の要素は、接
    続詞及び/又は助詞を含むことを特徴とする請求項36
    記載の電子文書処理方法。
  39. 【請求項39】 上記電子文書のうち上記任意の識別子
    から上記次の識別子までの範囲が、上記表示領域におさ
    まらない場合には、上記電子文書を構成する要素のう
    ち、少なくとも句よりも小さい単位で上記任意の識別子
    から上記次の識別子の間に新たな識別子を上記電子文書
    に付与して上記電子文書を分割するとともに、上記任意
    の識別子から上記次の識別子までの範囲を構成する上記
    電子文書の任意の要素を省略する分割省略工程を備える
    ことを特徴とする請求項34記載の電子文書処理方法。
  40. 【請求項40】 上記電子文書に基づいて、音声合成し
    て読み上げるための音声読み上げ用ファイルを生成する
    音声読み上げ用ファイル生成工程を備え、 上記文書読み上げ工程では、上記音声読み上げ用ファイ
    ル生成工程にて生成された上記音声読み上げ用ファイル
    に基づいて、上記電子文書を読み上げることを特徴とす
    る請求項30記載の電子文書処理方法。
  41. 【請求項41】 上記電子文書には、上記階層として少
    なくとも句を示すタグ情報が付与されていることを特徴
    とする請求項22記載の電子文書処理方法。
  42. 【請求項42】 上記電子文書には、音声合成を行うた
    めに必要なタグ情報が付与されていることを特徴とする
    請求項22記載の電子文書処理方法。
  43. 【請求項43】 電子文書を処理する電子文書処理装置
    において、 複数の要素が階層化された木構造である内部構造を有
    し、上記木構造における階層を示すタグ情報が付与され
    ている上記電子文書を、上記タグ情報に基づいて読み上
    げる文書読み上げ手段と、 上記タグ情報に基づいて、上記文書読み上げ手段に、上
    記階層毎に上記電子文書の階層の先頭に頭出しさせて上
    記電子文書を読み上げさせる頭出し手段とを備えること
    を特徴とする電子文書処理装置。
  44. 【請求項44】 上記頭出し手段は、上記文書読み上げ
    手段に、上記タグ情報に基づいて、上記電子文書を構成
    する複数の要素のうち、現在読み上げている要素が属す
    る階層の先頭に頭出しさせることを特徴とする請求項4
    3記載の電子文書処理装置。
  45. 【請求項45】 上記頭出し手段は、上記文書読み上げ
    手段に、上記タグ情報に基づいて、上記電子文書を構成
    する複数の要素のうち、現在読み上げている要素と同種
    の統語構造を有する要素であり且つ上記現在読み上げて
    いる要素の前の要素が属する階層の先頭に頭出しさせる
    ことを特徴とする請求項43記載の電子文書処理装置。
  46. 【請求項46】 上記頭出し手段は、上記文書読み上げ
    手段に、上記タグ情報に基づいて、上記電子文書を構成
    する複数の要素のうち、現在読み上げている要素と同種
    の統語構造を有する要素であり且つ上記現在読み上げて
    いる要素の次の要素が属する階層の先頭に頭出しさせる
    ことを特徴とする請求項43記載の電子文書処理装置。
  47. 【請求項47】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記頭出し手段は、上記文書読み上げ手段に、上記段
    落、文及び句を示すタグ情報に基づいて、段落、文及び
    句の単位で、現在読み上げている段落、文又は句の先頭
    に頭出しさせることを特徴とする請求項44記載の電子
    文書処理装置。
  48. 【請求項48】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記頭出し手段は、上記文書読み上げ手段に、上記段
    落、文及び句を示すタグ情報に基づいて、段落、文及び
    句の単位で、現在読み上げている段落、文又は句の前の
    段落、文又は句の先頭に頭出しさせることを特徴とする
    請求項45記載の電子文書処理装置。
  49. 【請求項49】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記頭出し手段は、上記文書読み上げ手段に、上記段
    落、文及び句を示すタグ情報に基づいて、段落、文及び
    句の単位で、現在読み上げている段落、文又は句の次の
    段落、文又は句の先頭に頭出しさせることを特徴とする
    請求項46記載の電子文書処理装置。
  50. 【請求項50】 上記タグ情報は、上記電子文書に予め
    付与されていることを特徴とする請求項43記載の電子
    文書処理装置。
  51. 【請求項51】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記文書読み上げ手段は、これらの段落、文及び句を示
    すタグ情報に基づいて、上記電子文書を構成する段落、
    文及び句を識別することを特徴とする請求項43記載の
    電子文書処理装置。
  52. 【請求項52】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記文書読み上げ手段は、これらの段落、文及び句を示
    すタグ情報に基づいて、上記段落、文及び句の開始位置
    に休止期間を設けて読み上げることを特徴とする請求項
    43記載の電子文書処理装置。
  53. 【請求項53】 上記電子文書には、音声合成を行うた
    めに必要なタグ情報が付与されていることを特徴とする
    請求項43記載の電子文書処理装置。
  54. 【請求項54】 上記音声合成を行うために必要なタグ
    情報は、読み上げを禁止するための属性情報を含むこと
    を特徴とする請求項53記載の電子文書処理装置。
  55. 【請求項55】 上記音声合成を行うために必要なタグ
    情報は、読み仮名又は発音を示す属性情報を含むことを
    特徴とする請求項53記載の電子文書処理装置。
  56. 【請求項56】 上記電子文書に基づいて、音声合成し
    て読み上げるための音声読み上げ用ファイルを生成する
    音声読み上げ用ファイル生成手段を備え、 上記文書読み上げ手段は、上記音声読み上げ用ファイル
    生成手段により生成された上記音声読み上げ用ファイル
    に基づいて、上記電子文書を読み上げることを特徴とす
    る請求項43記載の電子文書処理装置。
  57. 【請求項57】 上記音声読み上げ用ファイル生成手段
    は、上記電子文書を記述する言語を示す属性情報を付与
    して上記音声読み上げ用ファイルを生成することを特徴
    とする請求項56記載の電子文書処理装置。
  58. 【請求項58】 上記音声読み上げ用ファイル生成手段
    は、上記電子文書を構成する複数の要素のうち、段落、
    文及び句の開始位置を示す属性情報を付与して上記音声
    読み上げ用ファイルを生成することを特徴とする請求項
    56記載の電子文書処理装置。
  59. 【請求項59】 上記音声読み上げ用ファイル生成手段
    は、上記段落、文及び句の開始位置を示す属性情報のう
    ち、同種の統語構造を表す属性情報が連続して重複され
    る場合には、これらの属性情報を単一にまとめることを
    特徴とする請求項58記載の電子文書処理装置。
  60. 【請求項60】 上記音声読み上げ用ファイル生成手段
    は、上記段落、文及び句の開始位置を示す属性情報に対
    応して休止期間を設けることを示す属性情報を付与して
    上記音声読み上げ用ファイルを生成することを特徴とす
    る請求項58記載の電子文書処理装置。
  61. 【請求項61】 上記音声読み上げ用ファイル生成手段
    は、読み上げが禁止されている部分を除去して上記音声
    読み上げ用ファイルを生成することを特徴とする請求項
    56記載の電子文書処理装置。
  62. 【請求項62】 上記音声読み上げ用ファイル生成手段
    は、正確な読み又は発音に置換して上記音声読み上げ用
    ファイルを生成することを特徴とする請求項56記載の
    電子文書処理装置。
  63. 【請求項63】 上記音声読み上げ用ファイル生成手段
    は、読み上げの音量を示す属性情報を付与して上記音声
    読み上げ用ファイルを生成することを特徴とする請求項
    56記載の電子文書処理装置。
  64. 【請求項64】 電子文書を処理する電子文書処理装置
    において、 複数の要素が階層化された木構造である内部構造を有
    し、上記木構造における階層を示すタグ情報が付与され
    ている上記電子文書の一部を表示領域に切り換え表示又
    は移動表示する表示制御手段と、 上記タグ情報に基づいて、上記表示制御手段に、上記階
    層毎に上記電子文書の階層の先頭に頭出しさせて上記電
    子文書の一部を上記表示領域に切り換え表示又は移動表
    示させる頭出し手段とを備えることを特徴とする電子文
    書処理装置。
  65. 【請求項65】 上記頭出し手段は、上記表示制御手段
    に、上記タグ情報に基づいて、上記電子文書を構成する
    複数の要素のうち、上記表示領域に現在切り換え表示又
    は移動表示している要素が属する階層の先頭に頭出しさ
    せることを特徴とする請求項64記載の電子文書処理装
    置。
  66. 【請求項66】 上記頭出し手段は、上記表示制御手段
    に、上記タグ情報に基づいて、上記電子文書を構成する
    複数の要素のうち、上記表示領域に現在切り換え表示又
    は移動表示している要素と同種の統語構造を有する要素
    であり且つ上記現在切り換え表示又は移動表示している
    要素の前の要素が属する階層の先頭に頭出しさせること
    を特徴とする請求項64記載の電子文書処理装置。
  67. 【請求項67】 上記頭出し手段は、上記表示制御手段
    に、上記タグ情報に基づいて、上記電子文書を構成する
    複数の要素のうち、上記表示領域に現在切り換え表示又
    は移動表示している要素と同種の統語構造を有する要素
    であり且つ上記現在切り換え表示又は移動表示している
    要素の次の要素が属する階層の先頭に頭出しさせること
    を特徴とする請求項64記載の電子文書処理装置。
  68. 【請求項68】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記頭出し手段は、上記表示制御手段に、上記段落、文
    及び句を示すタグ情報に基づいて、段落、文及び句の単
    位で、上記表示領域に現在切り換え表示又は移動表示し
    ている段落、文又は句の先頭に頭出しさせることを特徴
    とする請求項65記載の電子文書処理装置。
  69. 【請求項69】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記頭出し手段は、上記表示制御手段に、上記段落、文
    及び句を示すタグ情報に基づいて、段落、文及び句の単
    位で、上記表示領域に現在切り換え表示又は移動表示し
    ている段落、文又は句の前の段落、文又は句の先頭に頭
    出しさせることを特徴とする請求項66記載の電子文書
    処理装置。
  70. 【請求項70】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記頭出し手段は、上記表示制御手段に、上記段落、文
    及び句を示すタグ情報に基づいて、段落、文及び句の単
    位で、上記表示領域に現在切り換え表示又は移動表示し
    ている段落、文又は句の次の段落、文又は句の先頭に頭
    出しさせることを特徴とする請求項67記載の電子文書
    処理装置。
  71. 【請求項71】 上記タグ情報は、上記電子文書に予め
    付与されていることを特徴とする請求項64記載の電子
    文書処理装置。
  72. 【請求項72】 上記電子文書を上記タグ情報に基づい
    て読み上げる文書読み上げ手段を備え、 上記表示制御手段は、上記電子文書の読み上げに連動し
    て上記電子文書の一部を上記表示領域に切り換え表示又
    は移動表示することを特徴とする請求項64記載の電子
    文書処理装置。
  73. 【請求項73】 上記表示制御手段は、上記電子文書の
    読み上げに連動して上記電子文書の一部を上記表示領域
    に間欠的に切り換え表示又は移動表示することを特徴と
    する請求項72記載の電子文書処理装置。
  74. 【請求項74】 上記電子文書を任意のまとまり毎に区
    切るための識別子を上記電子文書に付与する識別子付与
    手段を備え、 上記表示制御手段は、上記識別子付与手段により付与さ
    れた任意の識別子から次の識別子までの範囲を読み上げ
    る所要時間に相当する読み上げ相当所要時間に応じて、
    上記電子文書の上記表示領域への表示形態を制御するこ
    とを特徴とする請求項72記載の電子文書処理装置。
  75. 【請求項75】 上記電子文書のうち上記任意の識別子
    以降の範囲を上記表示領域に表示しているときに、上記
    読み上げ相当所要時間が経過すると、上記電子文書のう
    ち上記次の識別子に対応する部分を上記表示領域の先頭
    とするように、上記電子文書を上記表示領域に切り換え
    表示又は移動表示することを特徴とする請求項74記載
    の電子文書処理装置。
  76. 【請求項76】 上記識別子付与手段は、上記電子文書
    を構成する要素のうち、少なくとも句の単位で上記識別
    子を上記電子文書に付与することを特徴とする請求項7
    4記載の電子文書処理装置。
  77. 【請求項77】 上記電子文書のうち上記任意の識別子
    から上記次の識別子までの範囲が、上記表示領域におさ
    まらない場合には、上記電子文書を構成する要素のう
    ち、少なくとも句よりも小さい単位で上記任意の識別子
    から上記次の識別子の間に新たな識別子を上記電子文書
    に付与して上記電子文書を分割する分割手段を備えるこ
    とを特徴とする請求項76記載の電子文書処理装置。
  78. 【請求項78】 上記電子文書のうち上記任意の識別子
    から上記次の識別子までの範囲が、上記表示領域におさ
    まらない場合には、上記任意の識別子から上記次の識別
    子までの範囲を構成する上記電子文書の任意の要素を省
    略する省略手段を備えることを特徴とする請求項76記
    載の電子文書処理装置。
  79. 【請求項79】 上記省略手段は、上記電子文書のうち
    上記任意の識別子から上記次の識別子までの範囲を体言
    止めにして省略することを特徴とする請求項78記載の
    電子文書処理装置。
  80. 【請求項80】 上記任意の識別子から上記次の識別子
    までの範囲を構成する上記電子文書の任意の要素は、接
    続詞及び/又は助詞を含むことを特徴とする請求項78
    記載の電子文書処理装置。
  81. 【請求項81】 上記電子文書のうち上記任意の識別子
    から上記次の識別子までの範囲が、上記表示領域におさ
    まらない場合には、上記電子文書を構成する要素のう
    ち、少なくとも句よりも小さい単位で上記任意の識別子
    から上記次の識別子の間に新たな識別子を上記電子文書
    に付与して上記電子文書を分割するとともに、上記任意
    の識別子から上記次の識別子までの範囲を構成する上記
    電子文書の任意の要素を省略する分割省略手段を備える
    ことを特徴とする請求項76記載の電子文書処理装置。
  82. 【請求項82】 上記電子文書に基づいて、音声合成し
    て読み上げるための音声読み上げ用ファイルを生成する
    音声読み上げ用ファイル生成手段を備え、 上記文書読み上げ手段は、上記音声読み上げ用ファイル
    生成手段により生成された上記音声読み上げ用ファイル
    に基づいて、上記電子文書を読み上げることを特徴とす
    る請求項72記載の電子文書処理装置。
  83. 【請求項83】 上記電子文書には、上記階層として少
    なくとも句を示すタグ情報が付与されていることを特徴
    とする請求項64記載の電子文書処理装置。
  84. 【請求項84】 上記電子文書には、音声合成を行うた
    めに必要なタグ情報が付与されていることを特徴とする
    請求項64記載の電子文書処理装置。
  85. 【請求項85】 電子文書を処理するコンピュータ制御
    可能な電子文書処理プログラムが記録された記録媒体に
    おいて、 上記電子文書処理プログラムは、複数の要素が階層化さ
    れた木構造である内部構造を有し、上記木構造における
    階層を示すタグ情報が付与されている上記電子文書を、
    上記タグ情報に基づいて読み上げる文書読み上げ工程を
    備え、 上記文書読み上げ工程では、上記タグ情報に基づいて、
    上記階層毎に上記電子文書の階層の先頭に頭出しして上
    記電子文書を読み上げることを特徴とする電子文書処理
    プログラムが記録された記録媒体。
  86. 【請求項86】 上記文書読み上げ工程では、上記タグ
    情報に基づいて、上記電子文書を構成する複数の要素の
    うち、現在読み上げている要素が属する階層の先頭に頭
    出しすることを特徴とする請求項85記載の電子文書処
    理プログラムが記録された記録媒体。
  87. 【請求項87】 上記文書読み上げ工程では、上記タグ
    情報に基づいて、上記電子文書を構成する複数の要素の
    うち、現在読み上げている要素と同種の統語構造を有す
    る要素であり且つ上記現在読み上げている要素の前の要
    素が属する階層の先頭に頭出しすることを特徴とする請
    求項85記載の電子文書処理プログラムが記録された記
    録媒体。
  88. 【請求項88】 上記文書読み上げ工程では、上記タグ
    情報に基づいて、上記電子文書を構成する複数の要素の
    うち、現在読み上げている要素と同種の統語構造を有す
    る要素であり且つ上記現在読み上げている要素の次の要
    素が属する階層の先頭に頭出しすることを特徴とする請
    求項85記載の電子文書処理プログラムが記録された記
    録媒体。
  89. 【請求項89】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記文書読み上げ工程では、上記段落、文及び句を示す
    タグ情報に基づいて、段落、文及び句の単位で、現在読
    み上げている段落、文又は句の先頭に頭出しすることを
    特徴とする請求項86記載の電子文書処理プログラムが
    記録された記録媒体。
  90. 【請求項90】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記文書読み上げ工程では、上記段落、文及び句を示す
    タグ情報に基づいて、段落、文及び句の単位で、現在読
    み上げている段落、文又は句の前の段落、文又は句の先
    頭に頭出しすることを特徴とする請求項87記載の電子
    文書処理プログラムが記録された記録媒体。
  91. 【請求項91】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記文書読み上げ工程では、上記段落、文及び句を示す
    タグ情報に基づいて、段落、文及び句の単位で、現在読
    み上げている段落、文又は句の次の段落、文又は句の先
    頭に頭出しすることを特徴とする請求項88記載の電子
    文書処理プログラムが記録された記録媒体。
  92. 【請求項92】 上記タグ情報は、上記電子文書に予め
    付与されていることを特徴とする請求項85記載の電子
    文書処理プログラムが記録された記録媒体。
  93. 【請求項93】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記文書読み上げ工程では、これらの段落、文及び句を
    示すタグ情報に基づいて、上記電子文書を構成する段
    落、文及び句を識別することを特徴とする請求項85記
    載の電子文書処理プログラムが記録された記録媒体。
  94. 【請求項94】 上記電子文書には、上記階層として少
    なくとも段落、文及び句を示すタグ情報が付与されてお
    り、 上記文書読み上げ工程では、これらの段落、文及び句を
    示すタグ情報に基づいて、上記段落、文及び句の開始位
    置に休止期間を設けて読み上げることを特徴とする請求
    項85記載の電子文書処理プログラムが記録された記録
    媒体。
  95. 【請求項95】 上記電子文書には、音声合成を行うた
    めに必要なタグ情報が付与されていることを特徴とする
    請求項85記載の電子文書処理プログラムが記録された
    記録媒体。
  96. 【請求項96】 上記音声合成を行うために必要なタグ
    情報は、読み上げを禁止するための属性情報を含むこと
    を特徴とする請求項95記載の電子文書処理プログラム
    が記録された記録媒体。
  97. 【請求項97】 上記音声合成を行うために必要なタグ
    情報は、読み仮名又は発音を示す属性情報を含むことを
    特徴とする請求項95記載の電子文書処理プログラムが
    記録された記録媒体。
  98. 【請求項98】 上記電子文書処理プログラムは、上記
    電子文書に基づいて、音声合成して読み上げるための音
    声読み上げ用ファイルを生成する音声読み上げ用ファイ
    ル生成工程を備え、 上記文書読み上げ工程では、上記音声読み上げ用ファイ
    ル生成工程にて生成された上記音声読み上げ用ファイル
    に基づいて、上記電子文書を読み上げることを特徴とす
    る請求項85記載の電子文書処理プログラムが記録され
    た記録媒体。
  99. 【請求項99】 上記音声読み上げ用ファイル生成工程
    では、上記電子文書を記述する言語を示す属性情報を付
    与して上記音声読み上げ用ファイルを生成することを特
    徴とする請求項98記載の電子文書処理プログラムが記
    録された記録媒体。
  100. 【請求項100】 上記音声読み上げ用ファイル生成工
    程では、上記電子文書を構成する複数の要素のうち、段
    落、文及び句の開始位置を示す属性情報を付与して上記
    音声読み上げ用ファイルを生成することを特徴とする請
    求項98記載の電子文書処理プログラムが記録された記
    録媒体。
  101. 【請求項101】 上記音声読み上げ用ファイル生成工
    程では、上記段落、文及び句の開始位置を示す属性情報
    のうち、同種の統語構造を表す属性情報が連続して重複
    される場合には、これらの属性情報を単一にまとめるこ
    とを特徴とする請求項100記載の電子文書処理プログ
    ラムが記録された記録媒体。
  102. 【請求項102】 上記音声読み上げ用ファイル生成工
    程では、上記段落、文及び句の開始位置を示す属性情報
    に対応して休止期間を設けることを示す属性情報を付与
    して上記音声読み上げ用ファイルを生成することを特徴
    とする請求項100記載の電子文書処理プログラムが記
    録された記録媒体。
  103. 【請求項103】 上記音声読み上げ用ファイル生成工
    程では、読み上げが禁止されている部分を除去して上記
    音声読み上げ用ファイルを生成することを特徴とする請
    求項98記載の電子文書処理プログラムが記録された記
    録媒体。
  104. 【請求項104】 上記音声読み上げ用ファイル生成工
    程では、正確な読み又は発音に置換して上記音声読み上
    げ用ファイルを生成することを特徴とする請求項98記
    載の電子文書処理プログラムが記録された記録媒体。
  105. 【請求項105】 上記音声読み上げ用ファイル生成工
    程では、読み上げの音量を示す属性情報を付与して上記
    音声読み上げ用ファイルを生成することを特徴とする請
    求項98記載の電子文書処理プログラムが記録された記
    録媒体。
  106. 【請求項106】 電子文書を処理するコンピュータ制
    御可能な電子文書処理プログラムが記録された記録媒体
    において、 上記電子文書処理プログラムは、複数の要素が階層化さ
    れた木構造である内部構造を有し、上記木構造における
    階層を示すタグ情報が付与されている上記電子文書の一
    部を表示領域に切り換え表示又は移動表示する表示制御
    工程を備え、 上記表示制御工程では、上記タグ情報に基づいて、上記
    階層毎に上記電子文書の階層の先頭に頭出しして上記電
    子文書の一部を上記表示領域に切り換え表示又は移動表
    示することを特徴とする電子文書処理プログラムが記録
    された記録媒体。
  107. 【請求項107】 上記表示制御工程では、上記タグ情
    報に基づいて、上記電子文書を構成する複数の要素のう
    ち、上記表示領域に現在切り換え表示又は移動表示して
    いる要素が属する階層の先頭に頭出しすることを特徴と
    する請求項106記載の電子文書処理プログラムが記録
    された記録媒体。
  108. 【請求項108】 上記表示制御工程では、上記タグ情
    報に基づいて、上記電子文書を構成する複数の要素のう
    ち、上記表示領域に現在切り換え表示又は移動表示して
    いる要素と同種の統語構造を有する要素であり且つ上記
    現在切り換え表示又は移動表示している要素の前の要素
    が属する階層の先頭に頭出しすることを特徴とする請求
    項106記載の電子文書処理プログラムが記録された記
    録媒体。
  109. 【請求項109】 上記表示制御工程では、上記タグ情
    報に基づいて、上記電子文書を構成する複数の要素のう
    ち、上記表示領域に現在切り換え表示又は移動表示して
    いる要素と同種の統語構造を有する要素であり且つ上記
    現在切り換え表示又は移動表示している要素の次の要素
    が属する階層の先頭に頭出しすることを特徴とする請求
    項106記載の電子文書処理プログラムが記録された記
    録媒体。
  110. 【請求項110】 上記電子文書には、上記階層として
    少なくとも段落、文及び句を示すタグ情報が付与されて
    おり、 上記表示制御工程では、上記段落、文及び句を示すタグ
    情報に基づいて、段落、文及び句の単位で、上記表示領
    域に現在切り換え表示又は移動表示している段落、文又
    は句の先頭に頭出しすることを特徴とする請求項107
    記載の電子文書処理プログラムが記録された記録媒体。
  111. 【請求項111】 上記電子文書には、上記階層として
    少なくとも段落、文及び句を示すタグ情報が付与されて
    おり、 上記表示制御工程では、上記段落、文及び句を示すタグ
    情報に基づいて、段落、文及び句の単位で、上記表示領
    域に現在切り換え表示又は移動表示している段落、文又
    は句の前の段落、文又は句の先頭に頭出しすることを特
    徴とする請求項108記載の電子文書処理プログラムが
    記録された記録媒体。
  112. 【請求項112】 上記電子文書には、上記階層として
    少なくとも段落、文及び句を示すタグ情報が付与されて
    おり、 上記表示制御工程では、上記段落、文及び句を示すタグ
    情報に基づいて、段落、文及び句の単位で、上記表示領
    域に現在切り換え表示又は移動表示している段落、文又
    は句の次の段落、文又は句の先頭に頭出しすることを特
    徴とする請求項109記載の電子文書処理プログラムが
    記録された記録媒体。
  113. 【請求項113】 上記タグ情報は、上記電子文書に予
    め付与されていることを特徴とする請求項106記載の
    電子文書処理プログラムが記録された記録媒体。
  114. 【請求項114】 上記電子文書処理プログラムは、上
    記電子文書を上記タグ情報に基づいて読み上げる文書読
    み上げ工程を備え、 上記表示制御工程では、上記電子文書の読み上げに連動
    して上記電子文書の一部を表示領域に切り換え表示又は
    移動表示することを特徴とする請求項106記載の電子
    文書処理プログラムが記録された記録媒体。
  115. 【請求項115】 上記表示制御工程では、上記電子文
    書の読み上げに連動して上記電子文書の一部を上記表示
    領域に間欠的に切り換え表示又は移動表示することを特
    徴とする請求項114記載の電子文書処理プログラムが
    記録された記録媒体。
  116. 【請求項116】 上記電子文書処理プログラムは、上
    記電子文書を任意のまとまり毎に区切るための識別子を
    上記電子文書に付与する識別子付与工程を備え、 上記表示制御工程では、上記識別子付与工程にて付与さ
    れた任意の識別子から次の識別子までの範囲を読み上げ
    る所要時間に相当する読み上げ相当所要時間に応じて、
    上記電子文書の上記表示領域への表示形態を制御するこ
    とを特徴とする請求項114記載の電子文書処理プログ
    ラムが記録された記録媒体。
  117. 【請求項117】 上記電子文書のうち上記任意の識別
    子以降の範囲を上記表示領域に表示しているときに、上
    記読み上げ相当所要時間が経過すると、上記電子文書の
    うち上記次の識別子に対応する部分を上記表示領域の先
    頭とするように、上記電子文書を上記表示領域に切り換
    え表示又は移動表示することを特徴とする請求項116
    記載の電子文書処理プログラムが記録された記録媒体。
  118. 【請求項118】 上記識別子付与工程では、上記電子
    文書を構成する要素のうち、少なくとも句の単位で上記
    識別子を上記電子文書に付与することを特徴とする請求
    項116記載の電子文書処理プログラムが記録された記
    録媒体。
  119. 【請求項119】 上記電子文書処理プログラムは、上
    記電子文書のうち上記任意の識別子から上記次の識別子
    までの範囲が、上記表示領域におさまらない場合には、
    上記電子文書を構成する要素のうち、少なくとも句より
    も小さい単位で上記任意の識別子から上記次の識別子の
    間に新たな識別子を上記電子文書に付与して上記電子文
    書を分割する分割工程を備えることを特徴とする請求項
    118記載の電子文書処理プログラムが記録された記録
    媒体。
  120. 【請求項120】 上記電子文書処理プログラムは、上
    記電子文書のうち上記任意の識別子から上記次の識別子
    までの範囲が、上記表示領域におさまらない場合には、
    上記任意の識別子から上記次の識別子までの範囲を構成
    する上記電子文書の任意の要素を省略する省略工程を備
    えることを特徴とする請求項118記載の電子文書処理
    プログラムが記録された記録媒体。
  121. 【請求項121】 上記省略工程では、上記電子文書の
    うち上記任意の識別子から上記次の識別子までの範囲を
    体言止めにして省略することを特徴とする請求項120
    記載の電子文書処理プログラムが記録された記録媒体。
  122. 【請求項122】 上記任意の識別子から上記次の識別
    子までの範囲を構成する上記電子文書の任意の要素は、
    接続詞及び/又は助詞を含むことを特徴とする請求項1
    20記載の電子文書処理プログラムが記録された記録媒
    体。
  123. 【請求項123】 上記電子文書処理プログラムは、上
    記電子文書のうち上記任意の識別子から上記次の識別子
    までの範囲が、上記表示領域におさまらない場合には、
    上記電子文書を構成する要素のうち、少なくとも句より
    も小さい単位で上記任意の識別子から上記次の識別子の
    間に新たな識別子を上記電子文書に付与して上記電子文
    書を分割するとともに、上記任意の識別子から上記次の
    識別子までの範囲を構成する上記電子文書の任意の要素
    を省略する分割省略工程を備えることを特徴とする請求
    項118記載の電子文書処理プログラムが記録された記
    録媒体。
  124. 【請求項124】 上記電子文書処理プログラムは、上
    記電子文書に基づいて、音声合成して読み上げるための
    音声読み上げ用ファイルを生成する音声読み上げ用ファ
    イル生成工程を備え、 上記文書読み上げ工程では、上記音声読み上げ用ファイ
    ル生成工程にて生成された上記音声読み上げ用ファイル
    に基づいて、上記電子文書を読み上げることを特徴とす
    る請求項114記載の電子文書処理プログラムが記録さ
    れた記録媒体。
  125. 【請求項125】 上記電子文書には、上記階層として
    少なくとも句を示すタグ情報が付与されていることを特
    徴とする請求項106記載の電子文書処理プログラムが
    記録された記録媒体。
  126. 【請求項126】 上記電子文書には、音声合成を行う
    ために必要なタグ情報が付与されていることを特徴とす
    る請求項106記載の電子文書処理プログラムが記録さ
    れた記録媒体。
JP19948199A 1999-07-13 1999-07-13 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体 Withdrawn JP2001027997A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19948199A JP2001027997A (ja) 1999-07-13 1999-07-13 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19948199A JP2001027997A (ja) 1999-07-13 1999-07-13 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体

Publications (1)

Publication Number Publication Date
JP2001027997A true JP2001027997A (ja) 2001-01-30

Family

ID=16408533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19948199A Withdrawn JP2001027997A (ja) 1999-07-13 1999-07-13 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体

Country Status (1)

Country Link
JP (1) JP2001027997A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005301953A (ja) * 2004-04-12 2005-10-27 Kenichi Asano 聞き手の側のペースで音声とそれに対応する文章を関連させる方法
JP2017162501A (ja) * 2012-06-29 2017-09-14 アップル インコーポレイテッド 文書のブラウジング方法、ポータブル電子機器、情報処理装置及びプログラム
CN112750423A (zh) * 2019-10-29 2021-05-04 阿里巴巴集团控股有限公司 个性化语音合成模型构建方法、装置、系统及电子设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005301953A (ja) * 2004-04-12 2005-10-27 Kenichi Asano 聞き手の側のペースで音声とそれに対応する文章を関連させる方法
JP2017162501A (ja) * 2012-06-29 2017-09-14 アップル インコーポレイテッド 文書のブラウジング方法、ポータブル電子機器、情報処理装置及びプログラム
CN112750423A (zh) * 2019-10-29 2021-05-04 阿里巴巴集团控股有限公司 个性化语音合成模型构建方法、装置、系统及电子设备
CN112750423B (zh) * 2019-10-29 2023-11-17 阿里巴巴集团控股有限公司 个性化语音合成模型构建方法、装置、系统及电子设备

Similar Documents

Publication Publication Date Title
JP2001014306A (ja) 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体
US6981218B1 (en) Document processing apparatus having an authoring capability for describing a document structure
US7610546B1 (en) Document processing apparatus having capability of controlling video data
US7181692B2 (en) Method for the auditory navigation of text
US20080300872A1 (en) Scalable summaries of audio or visual content
JP4790119B2 (ja) テキストプロセッサ
US7305624B1 (en) Method for limiting Internet access
US7120861B1 (en) Document processing system
US20080027726A1 (en) Text to audio mapping, and animation of the text
JP2000003126A (ja) 音声部を使用するテキスト要約方法
JP2000081892A (ja) 効果音付加装置および効果音付加方法
JP4214598B2 (ja) 文書処理方法および装置ならびに記録媒体
JP4085156B2 (ja) テキスト生成方法及びテキスト生成装置
WO2000043909A1 (fr) Procede et dispositif de traitement de documents et support d'enregistrement
Kong et al. Improved spoken document summarization using probabilistic latent semantic analysis (plsa)
JP2001027997A (ja) 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体
Mukherjee et al. Automatic curation of content tables for educational videos
JP2001027996A (ja) 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体
JP2001014305A (ja) 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体
JP2001027995A (ja) 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体
JP3707872B2 (ja) 音声出力装置及びその方法
JP2001109762A (ja) 文書処理方法及び装置並びに記録媒体
JP4186321B2 (ja) 文書処理方法及び装置並びに記録媒体
JP2001014137A (ja) 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体
JP4799677B2 (ja) 出願文書情報作成装置、出願文書情報作成方法、及びプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20061003