WO2001001390A1

WO2001001390A1 - Trieuse-liseuse electronique

Info

Publication number: WO2001001390A1
Application number: PCT/JP2000/004109
Authority: WO
Inventors: Katashi Nagao
Original assignee: Sony Corporation
Priority date: 1999-06-30
Filing date: 2000-06-22
Publication date: 2001-01-04
Also published as: JP2001014306A; US7191131B1; US20050055212A1; EP1109151A1; EP1109151A4; US6985864B2

Description

明細書電子文書処理装置技術分野本発明は、電子文書を処理する電子文書処理装置に関する背景技術従来、インターネットにおいて、ウィンドウ形式でハイパーテキスト型情報を提供するアプリケーションサービスとして WW W (Wo r i d Wi de Web) が提供されている。

WWWは、文書の作成、公開又は共有化の文書処理を実行し、新しいスタイルの文書の在り方を示したシステムである。しかし、文書の実際上の利用の観点からは、文書の内容に基づいた文書の分類や要約といった、 WWWを越える高度な文書処理が求められているこのような高度な文書処理には、文書の内容の機械的な処理が不可欠である。

しかしながら、文書の内容の機械的な処理は、以下のような理由から依然として困難である。すなわち、第 1には、ハイパーテキストを記述する言語である H T M L ( Hyper Text Markup Language) は、文書の表現については規定するが、文書の内容についてはほとんど規定しないためである。第 2には、文書間に構成されたハイパ一テキストのネットワークは、文書の読者にとって文書の内容を理 W

解するために必ずしも利用しゃすいものではないためである。第 3 には、一般に文書の著作者は、読者の便宜を念頭に置かずに著作するが、文書の読者の便宜が著作者の便宜と調整されることはないためである。

このように、 WWWは、新しい文書の在り方を示したシステムであるが、文書を機械的に処理しないために、高度な文書処理を行うことができなかった。換言すると、高度な文書処理を実行するためには、文書を機械的に処理することが必要となる。

そこで、文書の機械的な処理を目標として、文書の機械的な処理を支援するシステムが自然言語研究の成果に基づいて開発されている。自然言語研究による文書処理として、文書の著作者等による文書の内部構造についての属性情報、いわゆるタグの付与を前提とした、文書に付与されたタグを利用する機械的な文書処理が提案されている。

ところで、ユーザは、例えばいわゆるサーチエンジンのような情報検索システムを利用し、ィンターネットを介して提供される膨大な情報の中から所望の情報を探し出すようにしている。この情報検索システムは、指定されたキーワードに基づいて情報を検索し、検索した情報をユーザに提供するシステムである。ユーザは、提供された情報の中から所望の情報を選択する。

情報検索システムにおいては、このように容易に情報を検索することができるが、ユーザは、検索されて提供された情報を一読して概略を理解し、それが希望する情報であるか否かを判断する必要がある。この作業は、特に、提供された情報の量が多い場合には、ュ —ザにとって大きな負担となる。そこで、最近、テキスト情報、すなわち文書の内容を自動的に要約するシステムであるいわゆる自動要約作成システムが注目されている。

自動要約作成システムは、元の情報、すなわち文書の大意を保持したままテキストの情報の長さや複雑さを減らすことによって、要約を作成するシステムである。ユーザは、この自動要約作成システムにより作成された要約を一読することで、文書の概略を理解することができる。

通常、自動要約作成システムは、テキスト中の文や単語を 1つの単位とし、それに何らかの情報に基づいた重要度を付与して順序付けする。そして、自動要約作成システムは、上位に順序付けした文や単語を寄せ集め、要約を作成する。

ところで、近年のコンピュータの普及ゃネットワーク化の進展にともない、文書処理の高機能化が求められており、そのなかでも、文書を音声合成して読み上げる機能が求められている。

音声合成は、本来、音声の分析結果や人間の音声の生成機構の模擬に基づいて機械的に音声を生成するものであり、個々の言語の要素又は音素をディジタル制御のもとに組み立てるものである。

しかしながら、音声合成においては、任意の文書を読み上げる際に、文書の切れ目等を考慮して読み上げることはできず、自然な読み上げを行うことはできなかった。また、音声合成においては、言語に応じて、使用する音声合成エンジンをユーザが適宜選択する必要があった。さらに、音声合成においては、例えば専門用語や難訓語といった読み誤りを生じやすい語を正確に読み上げる精度は、使用する辞書に依存するものであった。さらにまた、要約文を作成した場合には、その部分が重要であることを視覚的に判断することができるが、音声合成においては、ユーザの注意を喚起することは困難であった。発明の開示本発明は、このような実情に鑑みてなされたものであり、任意の文書を音声合成により高精度で且つ違和感がなく、さらに、重要な部分を強調して読み上げることができる電子文書処理装置及び電子文書処理方法、並びに電子文書処理プログラムが記録された記録媒体を提供することを目的とするものである。

上述した目的を達成する本発明にかかる電子文書処理装置は、電子文書を処理する電子文書処理装置において、電子文書が入力される文書入力手段と、電子文書に基づいて、音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデータ生成手段とを備えることを特徴としている。

このような本発明にかかる電子文書処理装置は、電子文書に基づいて、音声読み上げデータを生成する。

また、上述した目的を達成する本発明にかかる電子文書処理方法は、電子文書を処理する電子文書処理方法において、電子文書が入力される文書入力工程と、電子文書に基づいて、音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデータ生成工程とを備えることを特徴としている。

このような本発明にかかる電子文書処理方法は、電子文書に基づいて、音声読み上げデータを生成する。

さらに、上述した目的を達成する本発明にかかる電子文書処理プ口グラムが記録された記録媒体は、電子文書を処理するコンビユータ制御可能な電子文書処理プログラムが記録された記録媒体において、電子文書処理プログラムは、電子文書が入力される文書入力ェ程と、電子文書に基づいて、音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデータ生成工程とを備えることを特徴としている。

このような本発明にかかる電子文書処理プログラムが記録された記録媒体は、電子文書に基づいて、音声読み上げデータを生成する電子文書処理プログラムを提供する。

さらにまた、上述した目的を達成する本発明にかかる電子文書処理装置は、電子文書を処理する電子文書処理装置において、複数の要素を有し階層化された構造を有する電子文書の内部構造を示すタグ情報が付与されている当該電子文書が入力される文書入力手段と、タグ情報に基づいて、電子文書を音声合成して読み上げる文書読み上げ手段とを備えることを特徴としている。

このような本発明にかかる電子文書処理装置は、複数の要素を有し階層化された構造を有する電子文書の内部構造を示すタグ情報が付与されている電子文書を入力し、この電子文書に付与されたタグ情報に基づいて電子文書を直接読み上げる。

また、上述した目的を達成する本発明にかかる電子文書処理方法は、電子文書を処理する電子文書処理方法において、複数の要素を有し階層化された構造を有する電子文書の内部構造を示すタグ情報が付与されている当該電子文書が入力される文書入力工程と、タグ情報に基づいて、電子文書を音声合成して読み上げる文書読み上げ工程とを備えることを特徴としている。このような本発明にかかる電子文書処理方法は、複数の要素を有し階層化された構造を有する電子文書の内部構造を示すタグ情報が付与されている電子文書を入力し、この電子文書に付与されたタグ情報に基づいて電子文書を直接読み上げる。

さらに、上述した目的を達成する本発明にかかる電子文書処理プ口グラムが記録された記録媒体は、電子文書を処理するコンビユータ制御可能な電子文書処理プログラムが記録された記録媒体において、電子文書処理プログラムは、複数の要素を有し階層化された構造を有する電子文書の内部構造を示すタグ情報が付与されている当該電子文書が入力される文書入力工程と、タグ情報に基づいて、電子文書を音声合成して読み上げる文書読み上げ工程とを備えることを特徴としている。

このような本発明にかかる電子文書処理プログラムが記録された記録媒体は、複数の要素を有し階層化された構造を有する電子文書の内部構造を示すタグ情報が付与されている電子文書を入力し、この電子文書に付与されたタグ情報に基づいて電子文書を直接読み上げる電子文書処理プログラムを提供する。

さらにまた、上述した目的を達成する本発明にかかる電子文書処理装置は、電子文書を処理する電子文書処理装置において、電子文書の要約文を作成する要約文作成手段と、電子文書を音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデータ生成手段とを備え、この音声読み上げデータ生成手段は、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報を付与することで、音声読み上げデータを生成することを特徴としている。このような本発明にかかる電子文書処理装置は、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報を付与して音声読み上げデータを生成する。

また、上述した目的を達成する本発明にかかる電子文書処理方法は、電子文書を処理する電子文書処理方法において、電子文書の要約文を作成する要約文作成工程と、電子文書を音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデータ生成工程とを備え、この音声読み上げデータ生成工程では、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報が付与されることで、音声読み上げデータが生成されることを特徴としている。

このような本発明にかかる電子文書処理方法は、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報を付与して音声読み上げデ —タを生成する。

さらに、上述した目的を達成する本発明にかかる電子文書処理プ口グラムが記録された記録媒体は、電子文書を処理するコンビユータ制御可能な電子文書処理プログラムが記録された記録媒体において、電子文書処理プログラムは、電子文書の要約文を作成する要約文作成工程と、電子文書を音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデータ生成工程とを備え、この音声読み上げデータ生成工程では、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報が付与されることで、音声読み上げデ —タが生成されることを特徴としている。

このような本発明にかかる電子文書処理プログラムが記録された記録媒体は、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報を付与して音声読み上げデータを生成する電子文書処理プログラムを提供する。

さらにまた、上述した目的を達成する本発明にかかる電子文書処理装置は、電子文書を処理する電子文書処理装置において、電子文書の要約文を作成する要約文作成手段と、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げる文書読み上げ手段とを備えることを特徴としている。このような本発明にかかる電子文書処理装置は、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して直接読み上げる。

また、上述した目的を達成する本発明にかかる電子文書処理方法は、電子文書を処理する電子文書処理方法において、電子文書の要約文を作成する要約文作成工程と、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げる文書読み上げ工程とを備えることを特徴としている。

このような本発明にかかる電子文書処理方法は、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して直接読み上げる。

さらに、上述した目的を達成する本発明にかかる電子文書処理プ口グラムが記録された記録媒体は、電子文書を処理するコンビユータ制御可能な電子文書処理プログラムが記録された記録媒体において、電子文書処理プログラムは、電子文書の要約文を作成する要約文作成工程と、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げる文書読み上げ工程とを備えることを特徴としている。

このような本発明にかかる電子文書処理プログラムが記録された記録媒体は、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して直接読み上げる電子文書処理プログラムを提供する。

さらにまた、上述した目的を達成する本発明にかかる電子文書処理装置は、電子文書を処理する電子文書処理装置において、電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2つの開始位置を検出する検出手段と、この検出手段により得られた検出結果に基づいて、電子文書に対して、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性情報を付与することで、音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデータ生成手段とを備えることを特徴としている。

このような本発明にかかる電子文書処理装匱は、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性情報を付与して音声読み上げデータを生成する。また、上述した目的を達成する本発明にかかる電子文書処理方法は、電子文書を処理する電子文書処理方法において、電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2 つの開始位置を検出する検出工程と、この検出工程にて得られた検出結果に基づいて、電子文書に対して、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性情報を付与されることで、音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデータ生成工程とを備えることを特徴としている。

このような本発明にかかる電子文書処理方法は、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性情報を付与して音声読み上げデータを生成する。さらに、上述した目的を達成する本発明にかかる電子文書処理プ口グラムが記録された記録媒体は、電子文書を処理するコンビユータ制御可能な電子文書処理プログラムが記録された記録媒体において、電子文書処理プログラムは、電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2つの開始位置を検出する検出工程と、この検出工程にて得られた検出結果に基づいて、電子文書に対して、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性情報を付与されることで、音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデータ生成工程とを備えることを特徴としてレヽる。

このような本発明にかかる電子文書処理プログラムが記録された記録媒体は、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性情報を付与して音声読み上げデータを生成する電子文書処理プログラムを提供する。

さらにまた、上述した目的を達成する本発明にかかる電子文書処理装置は、電子文書を処理する電子文書処理装置において、電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2つの開始位置を検出する検出手段と、この検出手段により得られた検出結果に基づいて、段落、文及び句のうちの少なくとも 2 つの開始位置に互いに異なる休止期間を設けて電子文書を音声合成して読み上げる文書読み上げ手段とを備えることを特徴としている。このような本発明にかかる電子文書処理装置は、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けて電子文書を直接読み上げる。

また、上述した目的を達成する本発明にかかる電子文書処理方法は、電子文書を処理する電子文書処理方法において、電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2 つの開始位置を検出する検出工程と、この検出工程にて得られた検出結果に基づいて、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けて電子文書を音声合成して読み上げる文書読み上げ工程とを備えることを特徴としている。

このような本発明にかかる電子文書処理方法は、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けて電子文書を直接読み上げる。

さらに、上述した目的を達成する本発明にかかる電子文書処理プログラムが記録された記録媒体は、電子文書を処理するコンビユータ制御可能な電子文書処理プログラムが記録された記録媒体において、電子文書処理プログラムは、電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2つの開始位置を検出する検出工程と、この検出工程にて得られた検出結果に基づいて、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けて電子文書を音声合成して読み上げる文書読み上げ工程とを備えることを特徴としている。

このような本発明にかかる電子文書処理プログラムが記録された記録媒体は、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けて電子文書を直接読み上げる電子文書処理プログラムを提供する。

図面の簡単な説明図 1は、本発明の実施の形態として示す文書処理装置の構成を説明するブロック図である。

図 2は、文書の内部構造を示す図である。

図 3は、表示部の表示内容を説明する図であって、文書の内部構造をタグにより表示したウィンドウを示す図である。

図 4は、文書の読み上げを行う際の一連の処理を説明するフローチャートである。

図 5は、受信又は作成した日本語の文書の一例を示す図であって, 文書を表示したウインドウを示す図である。

図 6は、受信又は作成した英語の文書の一例を示す図であって、文書を表示したウインドウを示す図である。

図 7 Aは、図 5に示すタグ付けされた日本語の文書であるタダフアイルを示す図であって、見出しの部分を示す図である。

図 7 Bは、図 5に示すタグ付けされた日本語の文書であるタグフアイルを示す図であっ、最後の段落を示す図である。

図 8は、図 6に示すタグ付けされた英語の文書であるタグフアイルを示す図である。図 9 Aは、図 7に示すタグファイルから生成した音声読み上げフアイルを示す図であって、図 7 Aに示す見出しの部分の抜粋に対応する図である。

図 9 Bは、図 7に示すタグファイルから生成した音声読み上げフアイルを示す図であって、図 7 Bに示す最後の段落の抜粋に対応する図である。

図 1 0は、図 8に示すタグファイルから生成した音声読み上げフアイルを示す図である。

図 1 1は、音声読み上げファイルを生成する際の一連の処理を説明するフローチャートである。

図 1 2は、ユーザインターフェースウィンドウを示す図である。図 1 3は、文書を表示したウィンドウを示す図である。

図 1 4は、文書を表示したウィンドウを示す図であって、要約文を表示する表示領域が図 1 3に示す表示領域よりも拡大された様子を示す図である。

図 1 5は、要約文を作成する際の一連の処理を説明するフローチヤートである。

図 1 6は、活性拡散を行う際の一連の処理を説明するフ口一チヤ一トである。

図 1 7は、活性拡散の処理を説明するためのエレメントの連結構造を示す図である。

図 1 8は、活性拡散のリンク処理を行う際の一連の処理を説明するフローチヤ一トである。

図 1 9は、文書とその要約文を表示したウインドウを示す図である。図 2 0は、要約文を表示する表示領域の表示範囲を変更して新たに要約文を作成する際の一連の処理を説明するフローチヤ一トである。

図 2 1は、文書とその要約文を表示したウインドウを示す図であつて、図 1 4に示すウインドウに要約文を表示した様子を示す図である。

図 2 2は、要約文を作成して文書の読み上げを行う際の一連の処理を説明するフローチャートである。

図 2 3は、要約文を作成した後に音声読み上げファイルを生成する際の一連の処理を説明するフローチヤ一トである。発明を実施するための最良の形態以下、本発明を適用した具体的な実施の形態について図面を参照しながら詳細に説明する。

本発明の実施の形態として示す文書処理装置は、与えられた電子文書やその電子文書から作成した要約文を音声合成エンジンにより音声合成して読み上げる機能を有し、これらの電子文書や要約文を読み上げる際に、要約文に含まれる要素については、音量を増大させて読み上げるとともに、これらの電子文書や要約文を構成する段落、文及び句の開始位置に所定の休止期間を設けて読み上げるものである。なお、以下の説明では、電子文書を単に文書と記すものとする。

文書処理装置は、図 1に示すように、制御部 1 1及びインタ一フエース 1 2を有する本体 1 0と、ユーザにより入力された情報を本体 1 0に供給する入力部 2 0と、外部からの信号を受信して本体 1 0に供給する受信部 2 1 と、サーバ 2 4 と本体 1 0との間の通信処理を行う通信部 2 2と、本体 1 0から出力される情報を音声として出力する音声出力部 3 0と、本体 1 0から出力される情報を表示する表示部 3 1 と、記録媒体 3 3に対して情報を記録及びノ又は再生する記録再生部 3 2と、ハードディスクドライブ（Hard Disk Dr ive； HD D) 3 4とを備える。

本体 1 0は、制御部 1 1 と、ィンターフェース 1 2 とを有し、この文書処理装置の主要な部分を構成する。

制御部 1 1は、この文書処理装置における処理を実行する C P U (Central Processing Unit) 1 3 と、揮発性のメモリである R AM (Random Access Memory) 1 4 と、不揮発性のメモリである R O M (Read Only Memory) 1 5 とを有する。

C P U 1 3は、例えば R OM 1 5やハードディスクに記録されているプログラムにしたがって、プログラムを実行するための制御を行う。 RAM I 4には、 C PU 1 3が各種処理を実行する上で必要なプログラムやデータが必要に応じて一時的に格納される。

インターフェース 1 2は、入力部 2 0、受信部 2 1、通信部 2 2、表示部 3 1、記録再生部 3 2及びハードディスクドライブ 3 4に接続される。インタ一フェース 1 2は、制御部 1 1の制御のもとに、入力部 2 0、受信部 2 1及び通信部 2 2を介して供給されるデータの入力、表示部 3 1へのデータの出力、記録再生部 3 2に対するデータの入出力について、データを入出力するタイミングを調整し、データの形式を変換する。

入力部 2 0は、この文書処理装置に対するユーザの入力を受ける部分である。この入力部 2 0は、例えばキーボードやマウスにより構成される。ユーザは、この入力部 2 0を用いることで、例えば、キーボードによりキーヮードを入力したり、マウスにより表示部 3 1に表示される文書のエレメントを選択して入力することができる。なお、エレメントとは、文書を構成する要素であって、例えば文書、文及び語を含むものである。

受信部 2 1は、この文書処理装置に対して、外部から例えば通信回線を介して送信されるデータを受信する。この受信部 2 1は、電子文書である複数の文書やこれらの文書を処理するための電子文書処理プログラムを受信する。受信部 2 1により受信されたデータは、本体 1 0に供給される。

通信部 2 2は、例えばモデムやターミナルアダプタ等により構成され、電話回線を介してインターネット 2 3に接続される。インターネット 2 3には、文書等のデータを格納したサーバ 2 4が接続されており、通信部 2 2は、インターネット 2 3を介してサーバ 2 4 にアクセスし、このサーバ 2 4からデータを受信することができる。この通信部 2 2により受信されたデータは、本体 1 0に供給される。音声出力部 3 0は、例えば、スピーカにより構成される。この音声出力部 3 0には、音声合成エンジン等により音声合成されて得られる電気的な音声信号やその他の各種音声信号がィンターフェース 1 2を介して入力される。音声出力部 3 0は、入力された信号を音声に変換して出力する。

表示部 3 1には、文字情報や画像情報がィンターフェース 1 2を介して入力される。この表示部 3 1は、入力された情報を表示する。より具体的には、表示部 3 1は、例えば陰極線管（Cathode Ray Tu be； C R T ) や液晶表示装置（Liqu i d Crystal Di splay； L C D ) により構成され、例えば単数又は複数のウィンドウを表示し、このウィンドウ上に文字や図形等を表示する。

記録ノ再生部 3 2は、制御部 1 1の制御のもとに、例えば、フロッピーディスク、光ディスク、光磁気ディスクといった着脱可能な記録媒体 3 3に対してデータの記録及びノ又は再生を行う。また、記録媒体 3 3には、文書を処理するための電子文書処理プログラムや処理対象とする文書が記録されている。

ハードディスクドライブ 3 4は、大容量の磁気記録媒体であるハ ―ドディスクに対してデータの記録及び Z又は再生を行う。

このような文書処理装置は、以下のようにして所望の文書を受信し、表示部 3 1に表示する。

文書処理装置においては、まずユーザが入力部 2 0を操作してィンタ一ネット 2 3を介して通信を行うためのプログラムを起動し、サーバ 2 4 (サーチエンジン）の U R L ( Un i form Resource Locat or) を入力すると、制御部 1 1は、通信部 2 2を制御し、サーバ 2 4にアクセスする。

これに応じて、サーバ 2 4は、インターネット 2 3を介して、文書処理装置の通信部 2 2に検索画面のデータを出力する。文書処理装置において C P U 1 3は、このデータをインターフェース 1 2を介して表示部 3 1に出力し、表示させる。

文書処理装置においては、ユーザが入力部 2 0を用いてこの検索画面上でキーヮ一ド等を入力して検索を指令すると、通信部 2 2からィンターネット 2 3を介して、サーチエンジンとしてのサーバ 2 4に対して検索命令が送信される。サーバ 2 4は、検索命令を受信すると、この検索命令を実行し、得られた検索結果をインターネット 2 3を介して通信部 2 2に送信する。文書処理装置において制御部 1 1は、通信部 2 2を制御し、サーバ 2 4から送信される検索結果を受信させ、その一部を表示部 3 1に表示させる。

具体的には、ユーザが入力部 2 0を用いて例えば「T C P」というキーワードを入力して検索を指令した場合には、文書処理装置には、サーバ 2 4から「T C P」のキーワードを含む各種情報が送信され、表示部 3 1には例えば以下のような文書が表示される。

「丁 CP/IP (丁 ransmission Control Protocol /Internet Protocol) CO 歴史は、北米の、いや世界のコンピュータネットワークの歴史であるといっても過言ではない。そしてその TCP/IPの歴史は、 ARPANETを抜きにして語ることはできなレ、。 ARPANETは正式名称を Advanced Re search Project Agency Network (高等研究計画局ネッ卜ワーク) とレ、い、ァメリカ国防省の DOD(Department of Defence)の国防高等研究計画局（DARPA:Defence Advanced Research Project Agency)力 ^スポンサ一となって構築されてきた、実験および研究用のバケツト交換ネットワークである。 1969年北米西海岸の 4個所の大学、研究機関のホストコンピュータを 50kbpsの回線で結んだきわめて小規模なネットワークから ARPANETは出発した。

当時は 1945年に世界初のコンピュータである ENIACがペンシルバニァ大学で開発され、 1964年にはじめて ICを理論素子として実装し、第 3世代のコンピュータの歴史を形成したメインフレームの汎用コンピュ一タシリーズが開発され、やっとコンピュータが産声をあげたばかりあった。この時代背景を考えると、将来のコンピュータ通信の最盛を見越したこのようなプロジェクトは、まさに米国ならではのものであったといえるだろう。」

この文書は、その内部構造を後述するタグ付けによる属性情報によって記述されている。文書処理装置における文書処理は、文書に付与されたタグを参照して行われる。この実施の形態においては、文書の構造を示す統語論的タグとともに、多言語間で文書の機械的な内容理解を可能にするような意味的 · 語用論的タグを文書に付与している。

統語論的タグ付けとしては、文書のッリ一状の内部構造を記述するタグ付けがある。すなわち、本実施の形態においては、図 2に示すように、このタグ付けによる内部構造、文書、文、語彙エレメント等の各エレメント、通常リンク、参照 ·被参照リンク等が、タグとして予め文書に付与されている。図 2中において、白丸 "〇" は、語彙、セグメント、文といった文書の要素、すなわちエレメントであり、最下位の白丸 "〇" は、文書における最小レベルの語に対応する語彙エレメントである。また、実線は、語、句、節、文等の文書のエレメント間のつながりを示す通常リンク（normal link) である。破線は、参照 ·被参照による係り受け関係を示す参照リンク

(reference link) である。文書の内部構造は、上位から下位への順序で、文書（document) 、サブディビジョン（subdivision) 、段落 (paragraph) 、文 (sentence ) 、サブセンテンシャノレセクメント、 subsentential segment ) 、 · · -、 g§ エレメン卜力 ^¾ら構成される。これらのうち、サブディビジョンと段落は、オプションである。

一方、意味論 ·語用論的なタグ付けとしては、係り受け、例えば代名詞の指示対象等を示す統語構造（syntactic structure) に関するタグ付けや多義語の意味のように意味（semantic) の情報を記述するものがある。本実施の形態におけるタグ付けは、 HTML (Hy per Text Markup Language) と同様 XML (extensible Markup Language) の形式によるものである。

ここで、タグ付けされた文書の内部構造の一例を以下に示すが、文書へのタグ付けは、この方法に限定されるものではない。また、以下では、英語と日本語の文書の例を示すが、タグ付けによる内部構造の記述は、他の言語にも同様に適用可能であることを断ってお <。

^ [列ば'、 "Time flies like an arrow. " とレヽぅ文につレヽて fま、 <文〉く名詞句語義 = "TimeO" 〉time<Z名詞句〉

く動詞句〉 <動詞語義 = "flyl" 〉flies<Z動詞 >

く形容動詞句〉 <形容動詞語義 = "likeO" 〉 likeく Z形容動詞〉く名詞句〉 anく名詞語義 = "arrowO" 〉 arrowく Z名詞〉く Z名詞句〉

<ノ形容動詞句〉 < 動詞句 >. <z文〉

というようにタグ付けすることができる。

ここで、 <文〉、 <名詞〉、 <名詞句〉、 <動詞〉、 <動詞句〉、 <形容動詞 >、 <形容動詞句〉は、それぞれ、文、名詞、名詞句、動詞、動詞句、形容詞を含む前置詞句又は後置詞句 /形容詞句、形容詞句形容動詞句のような文の統語構造を表している。タグは、エレメン卜の先端の直前及び終端の直後に対応して配置される。ェレメントの終端の直後に配置されるタグは、記号 " " によりエレメントの終端であることを示している。エレメントは、統語的構成素、すなわち、句、節及び文を示す。なお、語義（word sense) =

"tiraeO" は、語 "time" の有する複数の意味、すなわち、複数の語義のうちの第 0番目の意味であることを指している。具体的には、 "time" には、名詞と動詞があるが、ここでは "time" が名詞であることを示している。この例示の他にも、例えば、語 "オレンジ" は、少なくとも植物の名前、色、果物の意味があるが、これらも語義によって区別することができる。

このような文書を用いる文書処理装置においては、図 3に示すように、表示部 3 1のウィンドウ 1 0 1に統語構造を表示すること力 S できる。ウィンドウ 1 0 1においては、右半面 1 0 3に語彙ェレメントが表示されるとともに、左半面 1 0 2に文の内部構造が表示される。このウィンドウ 1 0 1においては、日本語で記述された文書のみならず、英語等の任意の言語で記述された文書についても、統語構造を表示することができる。

具体的には、このウィンドウ 1 0 1の右半面 1 0 3には、ここでは、タグ付けされた次に示すような文書「A氏の B会が終わった C 市で、一部の大衆紙と一般紙がその写真報道を自主規制する方針を紙面で明らかにした。」の一部が表示されている。この文書のタグ付けの例を次に示す。

<文書〉 <文〉 <形容動詞句関係 = "場所" 〉<名詞句〉 <形容動詞句場所 = "C市" 〉

<形容動詞句関係 == "主語" 〉<名詞句識別子 = "B会" >< 形容動詞句関係 = "所有" 〉<人名識別子 = "A氏" > く /人名〉の < 形容動詞句〉 <組織名識別子 = "B会" 〉 8会< /組織名 > < /名詞句〉が < 形容動詞句〉終わったくノ形容動詞句〉く地名識別子 = "C巿" >〇巿< 地名 > <ノ名詞句 >で、 <Z形容動詞句〉 <形容動詞句関係 = "主語" ><名詞句識別子 = "新聞" 統語 = "並列" 〉 <名詞句 > <形容動詞句〉一部の <ノ形容動詞句〉大衆紙 < /名詞句 >と <名詞 >一般紙 < Z名詞〉 < /名詞句 >が < Z形容動詞句 >

<形容動詞句関係 = "目的語" 〉 <形容動詞句関係 = "内容" 主語 = "新聞" > <形容動詞句関係 = "目的語" 〉 <名詞句〉

<形容動詞句〉 <名詞共参照 = "B会" 〉そ< 名詞 >の< /形容動詞句 >写真報道 <Z名詞句〉をく Z形容動詞句〉

自主規制する <Z形容動詞句〉方針をく Z形容動詞句〉

<形容動詞句関係 = "位置" 〉紙面で < 形容動詞句〉

明ら力にした。 <ノ文 >< 文書〉

この文書においては、「一部の大衆紙と一般紙」は、統語 = "並列" というタグにより並列であることが表されている。並列の定義は、係り受け関係を共有するということである。特に何も指定がない場合には、例えば、 <名詞句関係 = " X " 〉 <名詞〉 Aく Z名詞〉 <名詞〉 B < 名詞〉 <ノ名詞句〉は、 Aが Bに依存関係があることを表す。

また、関係 = "x " は、関係属性を表す。この関係属性は、統語、意味、修辞についての相互関係を記述する。主語、目的語、間接目的語のような文法機能、動作主、被動作主、受益者等のような主題役割、及び理由、結果等のような修辞関係は、この関係属性により記述される。関係属性は、関係 = という形で表される。本実施の形態においては、主語、目的語、間接目的語のような比較的容易な文法機能について関係属性を記述する。また、この文書においては、例えば、 " A氏" 、 " B会" 、 " C 市" のような固有名詞について、地名、人名、組織名等のタグにより属性が記述される。これらの地名、人名、組織名等のタグが付与される語は、固有名詞である。

文書処理装置は、このようにタグ付けされた文書を受信することができる。文書処理装置は、 C P U 1 3により R O M 1 5やハードディスクに記録されている電子文書処理プログラムのうちの音声読み上げプログラムを起動すると、図 4に示すような一連の工程を経ることによって、文書の読み上げを行う。まず、ここでは、簡略化した各工程の説明を行い、その後、具体的な文書例を用いて、各ェ程の説明を詳細に行う。

まず、文書処理装置は、図 4に示すように、ステップ S 1において、タグ付けされた文書を受信する。なお、この文書には、後述するように、音声合成を行うために必要なタグが付与されているものとする。また、文書処理装置は、タグ付けされた文書を受信し、その文書に音声合成を行うために必要なタグを新たに付与して文書を作成することもできる。さらに、文書処理装置は、タグ付けされていない文書を受信し、その文書に音声合成を行うために必要なタグを含めたタグ付けを行い、タグファイルを作成してもよい。以下では、このようにして受信又は作成されて用意されたタグ付けされた文書をタグファイルと記す。

続いて、文書処理装置は、ステップ S 2において、 C P U 1 3の制御のもとに、タグファイルに基づいて音声読み上げファイル（音声読み上げデータ）を生成する。この音声読み上げファイルは、後述するように、タグファイル中のタグから、読み上げのための属性情報を導出し、この属性情報を埋め込むことにより生成される。続いて、文書処理装置は、ステップ S 3において、 C P U 1 3の制御のもとに、音声読み上げファイルを用いて、音声合成エンジンに適した処理を行う。なお、この音声合成エンジンは、ハードゥエァで構成してもよいし、ソフトウェアで実現するようにしてもよレ、。音声合成エンジンをソフトウェアで実現する場合には、そのアプリケーシヨンプログラムは、文書処理装置の R O M 1 5やハードディスク等に予め記憶されている。

そして、文書処理装置は、ステップ S 4において、ユーザが後述するユーザィンターフェースを用いて行う操作に応じて処理を行う。文書処理装置は、このような処理を行うことによって、与えられた文書を音声合成して読み上げることができる。これらの各工程について、以下詳細に説明する。

まず、ステップ S 1におけるタグ付けされた文書の受信又は作成について説明する。文書処理装置は、例えば上述したように、先に図 1に示したサーバ 2 4にアクセスし、キーヮード等に基づいて検索された結果としての文書を受信する。また、文書処理装置は、タグ付けされた文書を受信し、その文書に音声合成を行うために必要なタグを新たに付与して文書を作成する。さらに、文書処理装置は、タグ付けされていない文書を受信し、その文書に音声合成を行うために必要なタグを含めたタグ付けを行い、タグフアイルを作成することもできる。

ここでは、図 5又は図 6に示すような日本語又は英語による文書にタグ付けがなされたタグファイルを受信又は作成したものとする。すなわち、図 5に示すタグファイルの元の文書は、次のような日本語の文書である。

「 [素敵にエイジング] / 8ガン転移、抑えられる！？

がんはこの十数年、わが国の死因第一位を占めている。その死亡率は年齢が進むとともに増加傾向にある。高齢者の健康を考えるとき、がんの問題を避けて通れない。

がんを特徴づけるのは、細胞増殖と転移である。人間の細胞には、自動車でいえばアクセルに当たり、がんをどんどん増殖する「がん遺伝子」と、ブレーキ役の「がん抑制遺伝子」がある。

双方のバランスが取れていれば問題はない。正常な調節機能が失われ、細胞内でブレーキが利かない変異が起こると、がんの増殖が始まる。高齢者の場合、長い年月の間にこの変異が蓄積し、がん化の条件を備えた細胞の割合が増え、がん多発につながるわけだ。

ところで、もう一つの特徴、転移という性質がなければ、がんはそれほど恐れる必要はない。切除するだけで、完治が可能になるからである。転移を抑制することの重要性がここにある。

この転移、がん細胞が増えるだけでは発生しない。がん細胞が細胞と細胞の間にある蛋白（たんぱく）質などを溶かし、自分の進む道をつくって、血管やリンパ管に入り込む。循環しながら新たな " 住み家" を探して潜り込む、といった複雑な動きをすることが、近年解明されつつある。」

文書処理装置は、この日本語の文書を受信した場合には、図 5に示すように、表示部 3 1に表示されるウィンドウ 1 1 0に文書を表示する。ウィンドウ 1 1 0は、文書の名称が表示される文書名表示部 1 1 1、キーヮードが入力されるキ一ヮ一ド入力部 1 1 2、後述するように文書の要約文を作成するための実行ボタンである要約作成実行ボタン 1 1 3及び音声読み上げを実行するための実行ボタンである読み上げ実行ボタン 1 1 4等が表示される表示領域 1 2 0と、文書が表示される表示領域 1 3 0とに区分されている。表示領域 1 3 0の右端には、スクローノレバー 1 3 1 と、このスクロールバー 1 3 1 を上下に動かすためのボタン 1 3 2 , 1 3 3が設けられており、ュ一ザが例えば入力部 2 0のマウス等を用いて、スクロールバー 1 3 1 を上下に直接動かしたり、ボタン 1 3 2， 1 3 3を押してスク口一ルバ一 1 3 1を上下に動かすことによって、表示領域 1 3 0に表示される表示内容を縦方向にスクロールすることができる。

一方、図 6に示すタグファイルの元の文書は、次のような英語の文書である。

「During its centennial year, The Wall Street Journal will report events of the past century that stand as milestones of American business history. THREE COMPUTERS THAT CHANGED t he face of personal computing were launched in 1977. That ye ar the Apple II, Commodore Pet and Tandy TRS came to market.

The computers were crude by today' s standards. Apple II own ers, for example, had to use their television sets as screen s and stored data on audiocassettes.」

文書処理装置は、この英語の文書を受信した場合には、図 6に示すように、表示部 3 1に表示されるウィンドウ 1 4 0に文書を表示する。ウィンドウ 1 40は、ウィンドウ 1 1 0と同様に、文書の名称が表示される文書名表示部 1 4 1、キ一ヮ一ドが入力されるキーヮ一ド入力部 1 4 2、文書の要約文を作成するための実行ボタンである要約作成実行ボタン 1 4 3及び音声読み上げを実行するための実行ボタンである読み上げ実行ボタン 1 4 4等が表示される表示領域 1 5 0と、文書が表示される表示領域 1 6 0とに区分されている。表示領域 1 6 0の右端には、スクロールバー 1 6 1 と、このスクロ一ルバ一 1 6 1を上下に動かすためのボタン 1 6 2， 1 6 3が設けられており、ユーザが例えば入力部 2 0のマウス等を用いて、スク口一ルバ一 1 6 1を上下に直接動かしたり、ボタン 1 6 2， 1 6 3 を押してスクロールバー 1 6 1を上下に動かすことによって、表示領域 1 6 0に表示される表示内容を縦方向にスク口ールすることができる。

図 5又は図 6に示す日本語又は英語の文書は、それぞれ、図 7又は図 8に示すようなタグファイルとして構成されている。

ここで、図 7 Aに示すタグファイルは、見出しの部分である「 [素敵にエイジング] Z 8ガン転移、抑えられる！？」を抜粋したものを示している。また、図 7 Bに示すタグファイルは、最後の段落である「この転移、がん細胞が増えるだけでは発生しない。がん細胞が細胞と細胞の間にある蛋白質などを溶かし、自分の進む道をつくって、血管やリンパ管に入り込む。循環しながら新たな "住み家" を探して潜り込む、といった複雑な動きをすることが、近年解明されつつある。」を抜粋したものを示し、残りの段落については省略したものを示している。この場合、実際のタグファイルは、見出し部分から最後の段落までが 1つのファイルとして構成されている。

図 7 Aに示す見出し部分において <見出し〉は、この部分が見出しであることを示している。また、図 7 Bに示す最後の段落には、関係属性が "条件" や "手段" であることを示すタグ等が付与されている。さらに、図 7 Bに示す最後の段落には、上述した音声合成を行うために必要なタグの例が示されている。

まず、音声合成を行うために必要なタグとしては、「蛋白（たんばく）」のように、元の文書に発音（読み仮名）を示す情報が与えられているときに付与されるものがある。すなわち、この場合では、

「たんぱくたんぱく」と重複して読み上げてしまうことを防ぐために、発音 = " nu l l " という読み属性情報が記述されており、「（たんばく）」の部分の読み上げを禁止するタグが付与されている。また、このタグには、特殊な機能を有するものであることを示す情報が示されている。

また、音声合成を行うために必要なタグとしては、「リンパ管」のような専門用語や「住み家」のように、誤った読み上げを行う可能性のある難訓部分に付与されるものがある。すなわち、この場合では、「りんぱくだ」や「すみいえ」と読み上げてしまうことを防ぐために、それぞれ、発音 = "りんぱかん" 、発音 = "すみか" という発音（読み仮名）を示す読み属性情報が記述されている。

一方、図 8に示すタグファイルには、補文であることを示すタグや、複数の文が 1つの文として連続して構成されていることを示すタグが付与されている。また、このタグファイルにおける音声合成を行うために必要なタグとしては、「I I」というローマ数字に対して、発音 = " two" という読み属性情報が記述されている。これは、「I I」を「トウ（two) 」と読み上げさせたい場合に、「セカンド ( second) 」と読み上げてしまうことを防ぐために記述されているものである。

また、例えば文書内に引用文が含まれている場合、このようなタグファイルには、図示しないが、その文が引用文であることを示すタグが付与される。さらに、タグファイルには、例えば文書内に疑問文がある場合、図示しないが、その文が疑問文であることを示すタグが付与される。

文書処理装置は、先に図 4に示したステップ S 1において、このように音声合成を行うために必要なタグが付与された文書を受信又は作成する。

つぎに、ステップ S 2における音声読み上げファイルの生成について説明する。文書処理装置は、タグファイル中のタグから、読み上げのための属性情報を導出し、この属性情報を埋め込むことによつて、音声読み上げファイルを生成する。

具体的には、文書処理装置は、文書の段落、文及び句の開始位置を示すタグを見つけ出し、これらのタグに対応して読み上げのための属性情報を埋め込む。また、文書処理装置は、後述するように、文書の要約文を作成した場合には、その要約文に含まれる部分の開始位置を文書から見つけ出し、読み上げの際に音量を増大させる属性情報を埋め込み、要約文に含まれる部分であることを強調することもできる。

文書処理装置は、先に図 7又は図 8に示したタグファイルから図 9又は図 1 0に示すような音声読み上げファイルを生成する。なお、図 9 Aに示す音声読み上げファイルは、先に図 7 Aに示した見出しの部分の抜粋に対応するものであり、図 9 Bに示す音声読み上げフアイルは、先に図 8 Bに示した最後の段落の抜粋に対応するものである。実際の音声読み上げファイルは、見出し部分から最後の段落までが 1つのファイルとして構成されていることは勿論である。図 9 Aに示す音声読み上げファイルには、文書の開始位置に対応して Com=Lang=***という属性情報が埋め込まれている。この属性情報は、文書を記述している言語を示す。ここでは、 Com=Lang=JPNという属性情報であり、文書を記述している言語が日本語であることを示している。文書処理装置においては、この属性情報を参照することで、文書毎に言語に応じた適切な音声合成エンジンを選択することができる。

また、図 9 A及び図 9 Bに示す音声読み上げファイルには、 Com= beg i n— p、 Com二 begi n— s及び Com=beg in— phとレヽぅ属十生 t青報力 ^s埋め込まれている。これらの属性情報は、それぞれ、文書の段落、文及び句の開始位置を示す。文書処理装置は、上述したタグファイル中のタグに基づいて、これらの段落、文及び句のうちの少なくとも 2つの開始位置を検出する。音声読み上げファイルにおいて、例えば上述したタグフアイル中のく形容動詞句 > <名詞句〉のように、同じレベルの統語構造を表すタグが連続して現れる部分に対しては、それぞれに対応する数の Com=begi n— phが埋め込まれずに、まとめられて

1つの Com=begi n— ph力 ^s埋め込まれる。

さらに、音声読み上げフアイノレには、 Com=begi n_p Com=begi n_s 及び Com=beg in_phに対応して、それぞれ、 Pau=500、 Pau= 100及び Pa u=50という属性情報が埋め込まれている。これらの属性情報は、それぞれ、読み上げの際に 5 0 0ミリ秒、 1 0 0 ミリ秒及び 5 0 ミリ秒の休止期間を設けることを示す。すなわち、文書処理装置は、文書の段落、文及び句の開始位置において、それぞれ、 5 0 0 ミリ秒、

1 0 0 ミリ秒及び 5 0 ミリ秒の休止期間を設けて文書を音声合成ェンジンにより読み上げる。なお、これらの属性情報は、 Com=begi n_ 3 L p、 Com=begin_s及び Com=begin—phに対応して埋め込まれる。そのため、例えばタグファィル中の <形容動詞句 > <名詞句〉のように、同じレベルの統語構造を表すタグが連続して現れる部分は、 1つの句として捉えられ、それぞれに対応する数の Pau=50が埋め込まれずに、まとめられて 1つの Pau=50が埋め込まれる。また、例えばタグフアイノレ中の <段落〉く文〉 <名詞句〉のように、異なるレべノレの統語構造を表すタグが連続して現れる部分については、それぞれに対応する Pau=***が埋め込まれる。そのため、文書処理装置は、このような部分を読み上げる際には、例えば文書の段落、文及び句のそれぞれの休止期間を加算して得られる 6 5 0 ミリ秒の休止期間を設けて読み上げる。このように、文書処理装置は、例えば、段落、文及び句の順序で長さが短くなるように、段落、文及び句に対応した休止期間を設けることで、段落、文及び句の切れ目を考慮した違和感のない読み上げを行うことができる。なお、この休止期間は、文書の段落、文及び句の開始位置において、それぞれ、 5 0 0 ミリ秒、 1 0 ◦ ミリ秒及び 5 0 ミリ秒である必要はなく、適宜変更することができる。

さらにまた、図 9 Bに示す音声読み上げファイルにおいては、タグファイル中で記述されている発音 = " nu l l " という読み属性情報に対応して、「（たんぱく）」が除かれているとともに、発音 = " りんぱかん" 、発音 = "すみか" という読み属性情報に対応して、「リンパ管」、「住み家」 i それぞれ、「りんぱかん」、「すみカ^ に置換されている。文書処理装置は、このような読み属性情報を埋め込むことで、音声合成エンジンが参照する辞書の不備による読み誤りをすることがない。また、音声読み上げファイルには、文書内に含まれた引用文であることを示すタグに基づいて、この引用文のみを別の音声合成ェンジンを用いるように指定するための属性情報が埋め込まれてもよい。さらに、音声読み上げファイルには、疑問文であることを示すタグに基づいて、その文の語尾のィントネーシヨンを上げるための属性情報が埋め込まれてもよい。

さらにまた、音声読み上げファイルには、必要に応じて、いわゆる「である調」といった丁寧でない表現の文体を「ですます調」といった丁寧な表現の文体に変換するための属性情報を埋め込むこともできる。なお、この場合、文書処理装置は、このような属性情報を音声読み上げファィルに埋め込むのではなく、丁寧でない表現の文体を丁寧な表現の文体に変換して音声読み上げフアイルを生成するようにしてもよい。

一方、図 1 0に示す音声読み上げファイルには、文書の開始位置に対応して Com=Lang=ENGという属性情報が埋め込まれており、文書を記述している言語が英語であることを示している。

また、音声読み上げファイルには、 Co_m=Vo l=***という属性情報が埋め込まれている。この属性情報は、読み上げの際の音量を示す。例えば、 Com=Vo l =0は、文書処理装置のデフォルトの音量で読み上げることを示している。また、 Com=Vol =80は、デフォルトの音量を 8 0 %増量した音量で読み上げることを示している。任意の Com=Vo l = ヽの Com=Vo l =***までである。

さらに、音声読み上げファイルにおいては、タグファイル中で記述されている発音 = " two" という読み属性情報に対応して、「I I」が「two」に置換されている。文書処理装置は、図 1 1に示す一連の工程を経ることによって、このような音声読み上げファイルを生成する。

まず、文書処理装置は、図 1 1に示すように、ステップ S 1 1において、 C P U 1 3によって、受信又は作成したタグファイルを解析する。ここで、文書処理装置は、文書を記述している言語を判別するとともに、文書の段落、文及び句の開始位置や、読み属性情報をタグに基づいて探し出す。

続いて、文書処理装置は、ステップ S 1 2において、 C P U 1 3 によって、文書を記述している言語に応じて文書の開始位置に Com= Lang:*** 埋め込む。

続いて、文書処理装置は、ステップ S 1 3において、 C P U 1 3 によって、文書の段落、文及び句の開始位置を音声読み上げフアイルにおける属性情報に置換する。すなわち、文書処理装置は、タグファイル中の <段落〉、 <文〉及び < * * *句 >を、それぞれ、 Co m=begin_p し om=begin— s及びし om=begin— ph (こ ft;換す □

続いて、文書処理装置は、ステップ S 1 4において、 C P U 1 3 によって、同じレベルの統語構造が表れて同じ Com=begin_***が重複してレ、るものを、 1つの Com=begin_***【こ統合する。

続いて、文書処理装置は、ステップ S 1 5において、 C P U 1 3 tこよって、 Com=begin— こ対応して Pau=***を埋め込む。すなわち、文書処理装置は、 Com=begin_pの直前に Pau=500を埋め込み、 Com=be gin— sの直前 ίこ Pau=100を埋め込み、 Com=begin_phの直前こ Pau=50を埋め込む。

そして、文書処理装置は、ステップ S 1 6において、 C P U 1 3 によって、読み属性情報に基づいて、正しい読みに置換する。すなわち、文書処理装置は、発音 = " nul l " という読み属性情報に基づいて、「（たんぱく）」を除去するとともに、発音 = "りんぱかん " 、発音 = "すみか" という読み属性情報に基づいて、「リンパ管」、「住み家」を、それぞれ、「りんぱかん」、「すみか」に置換する。

文書処理装置は、先に図 4に示したステップ S 2において、図 1 1に示す処理を行うことによって、音声読み上げファイルを自動的に生成する。文書処理装置は、生成した音声読み上げファイルを R A M 1 4に記憶させる。

つぎに、図 4中ステップ S 3における音声読み上げファイルを用いた処理について説明する。文書処理装置は、音声読み上げフアイルを用いて、 R O M 1 5やハードディスク等に予め記憶されている音声合成エンジンに適した処理を C P U 1 3の制御のもとに行う。具体的には、文書処理装置は、音声読み上げファイルに埋め込まれている Com=Lang=***という属性情報に基づいて、使用する音声合成エンジンを選択する。音声合成エンジンは、言語や男声 Z女声等の種類に応じて識別子が付されており、その情報が例えば初期設定ファイルとしてハードディスクに記録されている。文書処理装置は、初期設定ファイルを参照し、言語に対応した識別子の音声合成ェンジンを選択する。

また、文書処理装置は、音声読み上げファイルに埋め込まれている Co_m=begi n一 ***を音声合成エンジンに適した形式に変換する。例えば、文書処理装置は、 Com=beg in— pを Mark= 100のように 1 0 0番台の番号でマーク付けし、 Com=beg i n— sを Mark= 1000のように 1 0 0 0番台の番号でマーク付けし、 Com=begin— phを Mark=10000のように 1 0 0 0 0番台の番号でマーク付けする。

さらに、音声読み上げファイルにおいては、音量の属性情報が V。

のようにデフオルトの音量に対する増量分の百分率で表されていることから、文書処理装置は、この属性情報に基づいて、百分率の情報を絶対値の情報に変換して求める。

文書処理装置は、先に図 4に示したステップ S 3において、このような音声読み上げファイルを用いた処理を行うことによって、音声読み上げファィルを音声合成エンジンが文書を読み上げることが可能な形式に変換する。

つぎに、図 4中ステップ S 4におけるユーザインターフェースを用いた操作について説明する。文書処理装置は、ユーザが例えば入力部 2 0のマウス等を操作して先に図 5又は図 6に示した読み上げ実行ボタン 1 1 4又は読み上げ実行ボタン 1 4 4を押すことによつて、音声合成エンジンを起動する。そして、文書処理装置は、図 1

2に示すようなユーザインターフェースウィンドウ 1 7 0を表示部

3 1に表示する。

ユーザインターフェースウィンドウ 1 7 0は、図 1 2に示すように、文書を読み上げさせるための再生ボタン 1 7 1 と、読み上げを停止させるための停止ボタン 1 7 2と、読み上げを一時停止させるための一時停止ボタン 1 7 3とを有する。また、ユーザインタ一フエースウィンドウ 1 7 0は、巻き戻し及び早送りを含む頭出しを行うためのボタンを有する。具体的には、ユーザインターフェースゥインドウ 1 7 0は、文単位で頭出し、卷き戻し及び早送りさせるための頭出しボタン 1 7 4、巻き戻しボタン 1 7 5及び早送りボタン 1 7 6と、段落単位で頭出し、巻き戻し及び早送りさせるための頭出しポタン 1 7 7、巻き戻しボタン 1 7 8及び早送りボタン 1 7 9 と、句単位で頭出し、巻き戻し及び早送りさせるための頭出しボタン 1 8 0、巻き戻しボタン 1 8 1及び早送りボタン 1 8 2とを有する。さらに、ユーザインタ一フェースウィンドウ 1 7 0は、読み上げる対象を全文とするか、後述するように作成した要約文とするかを選択するための選択スィッチ 1 8 3， 1 8 4を有する。なお、ュ —ザインターフェースウィンドウ 1 7 0は、ここでは図示しないが、例えば、音量を増減させるためのボタンや読み上げの速さを増減させるためのボタン、男声ノ女声等の声を変化させるためのボタン等を有していてもよい。

文書処理装置は、ユーザがこれらの各種ボタン Zスィツチを例えば入力部 2 0のマウス等を操作して押すノ選択することによって、音声合成エンジンによる読み上げ動作を行う。例えば、文書処理装置は、ユーザが再生ボタン 1 7 1を押すことによって、文書の読み上げを開始し、読み上げの途中でユーザが頭出しボタン 1 7 4を押すことによって、現在読み上げている文の開始位置にジャンプして再び読み上げる。また、文書処理装置は、図 4中ステップ S 3において行ったマーク付けによって、読み上げの際にこのようなマーク単位でのジャンプをすることができる。すなわち、文書処理装置は、ユーザが例えば入出力部 2 0のマウス等を用いて巻き戻しボタン 1 7 8や早送りボタン 1 7 9を押した場合には、例えば Mark=100のように、 1 0 0番台の番号である段落の開始位置を示すマークのみを識別してジャンプする。同様に、文書処理装置は、ユーザが例えば入出力部 2 0のマウス等を用いて卷き戻しボタン 1 7 5及び早送りボタン 1 7 6、巻き戻しボタン 1 8 1及び早送りボタン 1 8 2をそれぞれ押した場合には、それぞれ、 Mark=1000、 Mark=10000のように、 1 0 0 0番台、 1 0 0 0 0番台の番号である文、句の開始位置を示すマークのみを識別してジャンプする。このように、文書処理装置は、読み上げの際に段落、文及び句単位でのジャンプを行うことによって、例えば文書中でユーザが所望の部分を繰り返し再生させたいといった要求に応えることができる。

文書処理装置は、ステップ S 4において、ユーザがこのようなューザィンタ一フェースを用いた操作を行うことによって、音声合成エンジンにより文書を読み上げる。読み上げた情報は、音声出力部 3 0から出力される。

このようにして、文書処理装置は、所望の文書を音声合成ェンジンにより違和感なく読み上げることができる。

つぎに、文書の要約文を作成した際の読み上げ処理について説明する。まず、ここでは、タグ付けされた文書を要約して要約文を作成する処理について図 1 3乃至図 2 1を参照して説明する。

文書処理装置においては、文書の要約を作成する場合には、その文書が表示部 3 1に表示されている状態で、ユーザが入力部 2 0を操作し、自動要約作成モードを実行するように指令する。すなわち、文書処理装置は、 C P U 1 3の制御のもとに、ハードディスクドライブ 3 4を駆動して、ハードディスクに記憶されている電子文書処理プログラムのうちの自動要約文作成プログラムを起動する。文書処理装置は、 C P U 1 3により表示部 3 1を制御して、図 1 3に示すような自動要約文作成プログラム用の初期画面を表示させる。ここでは、表示部 3 1に表示されるウィンドウ 1 9 0は、文書の名称が表示される文書名表示部 1 9 1、キーヮードが入力されるキーヮ一ド入力部 1 9 2、文書の要約文を作成するための実行ボタンである要約作成実行ボタン 1 9 3等が表示される表示領域 2 0 0と、文書が表示される表示領域 2 1 0と、文書の要約文が表示される表示領域 2 2 0とに区分されている。

表示領域 2 0 0の文書名表示部 1 9 1には、表示領域 2 1 0に表示される文書の文書名等が表示される。また、キーワード入力部 1 9 2には、例えば入力部 2 0のキーボード等を用いて文書の要約文を作成するためのキーヮードが入力される。要約作成実行ボタン 1 9 3は、例えば入力部 2 0のマウス等を用いて押されることによつて、表示領域 2 1 0に表示されている文書の要約作成処理を実行開始するための実行ボタンである。

表示領域 2 1 0には、文書が表示される。表示領域 2 1 0の右端には、スクローノレバ一 2 1 1 と、このスクロ一ノレバー 2 1 1を上下に動かすためのボタン 2 1 2 , 2 1 3が設けられており、ユーザが例えば入力部 2 0のマウス等を用いて、スクロ一ルバ一 2 1 1 を上下に直接動かしたり、ボタン 2 1 2 ， 2 1 3を押してスクロ一ルバ - 2 1 1を上下に動かすことによって、表示領域 2 1 0に表示される表示内容を縦方向にスクロールすることができる。ユーザは、入力部 2 0を操作することによって、表示領域 2 1 0に表示されている文書の一部を選択して要約させることもでき、文書全体を要約させることもできる。

表示領域 2 2 0には、要約文が表示される。図 1 3においては、要約文がまだ作成されていない状態であるため、この表示領域 2 2 0には、何も表示されていない。ュ一ザは、入力部 2 0を操作することによって、表示領域 2 2 0の表示範囲（大きさ）を変更することができる。具体的には、ユーザは、図 1 3に示す表示領域 2 2 0 の表示範囲（大きさ）を、例えば図 1 4に示すように拡大することができる。

文書処理装置は、ユーザが例えば入力部 2 0のマウス等を用いて、要約作成実行ボタン 1 9 3を押してオン状態とすると、 C P U 1 3 の制御のもとに、図 1 5に示す処理を実行して要約文の作成を開始する。

文書から要約文を作成する処理は、文書の内部構造に関するタグ付けに基づいて実行される。文書処理装置においては、先に図 1 4 に示したように、ウィンドウ 1 9 0の表示領域 2 2 0の大きさを変更することができる。文書処理装置は、 C P U 1 3の制御のもとに、新たにウインドウ 1 9 0が表示部 3 1に描画される力又は、表示領域 2 2 0の大きさが変更された後、要約作成実行ボタン 1 9 3が操作されたときには、表示領域 2 2 0に適合するように、ウィンドゥ 1 9 0の表示領域 2 1 0に少なくともその一部が表示されている文書から、要約文を作成する処理を実行する。

まず、文書処理装置は、図 1 5に示すように、ステップ S 2 1 において、 C P U 1 3の制御のもとに、活性拡散と呼ばれる処理を行う。本実施の形態においては、活性拡散により得られた中心活性値を重要度として採用することによって、文書の要約を行う。すなわち、内部構造に関するタグ付けがされた文書においては、活性拡散を行うことによって、各エレメントに対して、内部構造に関するタグ付けに応じた中心活性値を付与することができる。

ここで、活性拡散は、中心活性値の高いエレメントと関わりのあるエレメントにも高い中心活性値を与えるような処理である。すなわち、活性拡散は、照応（anaphora；共参照（coref erence) ) 表現されたエレメントとその先行詞との間で中心活性値が等しくなり、それ以外では各中心活性値が同じ値に収束していく。この中心活性値は、文書の内部構造に関するタグ付けに応じて決定されるため、内部構造を考慮した文書の分析に利用することができる。

文書処理装置は、図 1 6に示す一連の工程を経ることによって、活性拡散を実行する。

まず、文書処理装置は、図 1 6に示すように、ステップ S 4 1において、 C P U 1 3の制御のもとに、各エレメントの初期化を行う。文書処理装置は、語彙エレメントを除いた全てのエレメントと語彙エレメントとに対して中心活性値の初期値を割り当てる。例えば、文書処理装置は、中心活性値の初期値として、語彙エレメントを除いた全てのエレメントに対しては " 1 " を、語彙エレメントに対しては "◦" を割り当てる。また、文書処理装置は、各エレメントの中心活性値の初期値に均一ではない値を予め割り当てることによつて、活性拡散の結果得られた中心活性値に、初期値の偏りを反映させることができる。例えば、文書処理装置は、ユーザが関心を有するエレメントに対しては、中心活性値の初期値を高く設定することによって、ュ一ザの関心を反映した中心活性値を得ることができる。エレメント間で参照 ·被参照による係り受けの関係にあるリンクである参照 ·被参照リンクと、それ以外のリンクである通常リンクとに関しては、エレメントを連結するリンクの端点の端点活性値を " 0 " に設定する。文書処理装置は、このようにして付与した端点活性値の初期値を例えば R A M 1 4に記憶させる。

ここで、エレメントとエレメントの連結構造の一例を図 1 7に示す。この図 1 7においては、文書を構成するエレメントとリンクの構造の一部として、エレメント E i及びエレメント E iが示されている。エレメント E iとエレメント E iとは、それぞれ、中心活性値 e ； , を有し、リンク L _;；にて接続されている。リンク L i )のエレメント E iに接続する端点は、 T i iであり、エレメント E iに接続する端点は、丁である。エレメント E iは、リンク L i iにより接続されるエレメント E iの他に、リンク L _{i k}， L i ,及び L _imにより図示しないエレメント E _k， E ,及び E_mにそれぞれ接続している。エレメント E iは、リンク L i iにより接続されるエレメント E iの他に、リンク L , _P， L i _q及び L により図示しないエレメント E _P，及び E _rにそれぞれ接続している。

続いて、文書処理装置は、図 1 6中ステップ S 4 2において、 C P U 1 3の制御のもとに、文書を構成するエレメント E iを計数するカウンタの初期化を行う。すなわち、文書処理装置は、エレメントを計数する力ゥンタのカウント値 i を " 1 " に設定する。このことにより、カウンタは、第 1番目のエレメント E〗を参照していることになる。

続いて、文書処理装置は、ステップ S 4 3において、 C P U 1 3 の制御のもとに、カウンタが参照するエレメントについて、新たな中心活性値を計算するリンク処理を実行する。このリンク処理については、さらに後述する。

続いて、文書処理装置は、ステップ S 4 4において、 C P U 1 3 の制御のもとに、文書中の全てのエレメントについて新たな中心活性値の計算が完了したか否かを判断する。

ここで、文書処理装置は、文書中の全てのエレメントについて新たな中心活性値の計算が完了したことを判断した場合には、ステツプ S 4 5へと処理を移行し、一方、文書中の全てのエレメントについて新たな中心活性値の計算が完了していないことを判断した場合には、ステップ S 4 7へと処理を移行する。

具体的には、文書処理装置は、 C P U 1 3の制御のもとに、カウンタのカウント値 i 力文書が含むエレメントの総数に達したか否かを判断する。そして、文書処理装置は、カウンタのカウント値 i が、文書が含むエレメントの総数に達したことを判断した場合には、全てのエレメントが計算済みであるものとして、ステップ S 4 5へと処理を移行する。一方、文書処理装置は、カウンタのカウント値 i 力；、文書が含むエレメントの総数に達していないことを判断した場合には、全てのエレメントについて計算が終了していないものとしてステップ S 4 7へと処理を移行する。

文書処理装置は、カウンタのカウント値 i 力 ^s、文書が含むエレメントの総数に達していないことを判断した場合には、ステップ S 4 7において、 C P U 1 3の制御のもとに、カウンタのカウントイ直 i を " 1 " だけィンクリメントさせ、カウンタのカウント値を " i + 1 " とする。このことにより、カウンタは、 i + 1番目のエレメント、すなわち次のエレメントを参照する。そして、文書処理装置は、ステップ S 4 3へと処理を移行し、端点活性値の計算及びこれに続く一連の行程が、次の i + 1番目のエレメントについて実行される。また、文書処理装置は、カウンタのカウント値 i 力文書が含むエレメントの総数に達したことを判断した場合には、ステップ S 4 5において、 C P U 1 3の制御のもとに、文書に含まれる全てのェレメントの中心活性値の変化分、すなわち新たに計算された中心活性値の元の中心活性値に対する変化分について平均値を計算する。文書処理装置は、 C P U 1 3の制御のもとに、例えば R A M 1 4 に記憶された元の中心活性値と新たに計算した中心活性値を、文書に含まれる全てのエレメントについて読み出す。文書処理装置は、新たに計算した中心活性値の元の中心活性値に対するそれぞれの変化分の総和を文書に含まれるエレメントの総数で除することにより、全てのエレメントの中心活性値の変化分の平均値を計算する。文書処理装置は、このように計算した全てのエレメントの中心活性値の変化分.の平均値を、例えば R A M I 4に記憶させる。

そして、文書処理装置は、ステップ S 4 6において、 C P U 1 3 の制御のもとに、ステップ S 4 5で計算した全てのエレメントの中心活性値の変化分の平均値が、予め設定された閾値以内であるか否かを判断する。そして、文書処理装置は、この変化分が閾値以内であると判断した場合には、この一連の行程を終了する。一方、文書処理装置は、変化分が閾値以内でないと判断した場合には、ステツプ S 4 2へと処理を移行し、カウンタのカウント値 i を " 1 " に設定して文書のエレメントの中心活性値を計算する一連の行程を再び実行する。文書処理装置においては、これらのステップ S 4 2乃至ステップ S 4 6のループが繰り返される毎に、変化分は、徐々に減少する。

文書処理装置は、このようにして活性拡散を行うことができる。つぎに、この活性拡散を行うためにステップ S 4 3において実行されるリンク処理について図 1 8を参照して説明する。なお、図 1 8 に示すフローチヤ一トは、 1つのエレメント E iに対する処理を示したものであるが、この処理は、全てのエレメントに対して行われるものである。

まず、文書処理装置は、図 1 8に示すように、ステップ S 5 1において、 C P U 1 3の制御のもとに、文書を構成する 1つのエレメント E iと一端が接続されたリンクを計数するカウンタの初期化を行う。すなわち、文書処理装置は、リンクを計数するカウンタのカウント値 j を " 1 " に設定する。このカウンタは、エレメント E iと接続された第 1番目のリンク L _;；を参照することになる。

続いて、文書処理装置は、ステップ S 5 2において、 C P U 1 3 の制御のもとに、エレメント E i とエレメント E】とを接続するリンクについて、関係属性のタグを参照することによって、そのリンク L i iが通常リンクであるか否かを判断する。文書処理装置は、リンク L _uが、語に対応する語彙エレメント、文に対応する文エレメント、段落に対応する段落エレメント等の間の関係を示す通常リンクと、参照 ■被参照による係り受けの関係を示す参照リンクのいずれであるかを判断する。文書処理装置は、リンクが通常リンクであると判断した場合には、ステップ S 5 3へと処理を移行し、リンク L ； iが参照リンクであると判断した場合には、ステップ S 5 4へと処理を移行する。

文書処理装置は、リンクし i iが通常リンクであると判断した場合には、ステップ S 5 3において、エレメント E iの通常リンクしに接続された端点 T i iの新たな端点活性値を計算する処理を行う。

このステップ S 5 3では、ステップ S 5 2における判別により、リンク L _uが通常リンクであることが明らかになつている。エレメント Ε ;の通常リンク L uに接続される端点 T の新たな端点活性値 t _uは、エレメント E iの端点活性値のうち、リンク L i i以外のリンクに接続する全ての端点 T _{i p}, T_{i q}, T の端点活性値 t _{i P}、 t ， t _{i r}と、エレメント E iがリンク L iiにより接続されるエレメント E ,の中心活性値 e とを加算し、この加算で得た値を文書に含まれるエレメントの総数で除することにより求められる。

文書処理装置は、 C P U 1 3の制御のもとに、例えば RAM 1 4 から必要な端点活性値及び中心活性値を読み出す。文書処理装置は、読み出された端点活性値及び中心活性値について、上述のようにその通常リンクと接続された端点の新たな端点活性値を計算する。そして、文書処理装置は、このように計算した新たな端点活性値を、例えば RAM I 4に記憶させる。

一方、文書処理装置は、リンク L i iが通常リンクでないと判断した場合には、ステップ S 5 4において、エレメント E ,の参照リンクに接続された端点 T _; ,の端点活性値を計算する処理を行う。

このステップ S 5 4では、ステップ S 5 2における判別により、リンク L , )が参照リンクであることが明ら力になっている。エレメント E ,の参照リンク L i iに接続される端点 T , )の端点活性値 t i；は、エレメント E iの端点活性値のうち、リンクし，，を除いたリンクに接続される全ての端点 T j _P， T_{i q}, t j _rの端点活性値 t i p, t _{i Q}， t と、エレメントがリンクにより接続されるエレメント Ε ; の中心活性値 e iとを加算することにより求められる。

文書処理装置は、 C P U 1 3の制御のもとに、例えば RAM 1 4 に記憶された端点活性値及び中心活性値から、必要な端点活性値及び中心活性値を読み出す。文書処理装置は、読み出された端点活性値及び中心活性値を用いて、上述のように参照リンクと接続された新たな端点活性値を計算する。そして、文書処理装置は、このように計算した端点活性値を、例えば R A M 1 4に記憶させる。

これらのステップ S 5 3における通常リンクの処理及びステップ S 5 4における参照リンクの処理は、ステップ S 5 2からステップ S 5 5に至り、ステップ S 5 7を介してステップ S 5 2に戻るループに示すように、カウント値 i により参照されているエレメント E iに接続される全てのリンク L i iに対して実行される。なお、ステツプ S 5 7では、エレメント E _;に接続されるリンクを計数するカウント値： j をインクリメントしている。

文書処理装置は、これらのステップ S 5 3又はステップ S 5 4の処理を行った後、ステップ S 5 5において、 C P U 1 3の制御のもとに、エレメント E iに接続される全てのリンクについて端点活性値が計算されたか否かを判別する。そして、文書処理装置は、全てのリンクについて端点活性値が計算されていると判断した場合には、ステップ S 5 6の処理へと移行し、全てのリンクについて端点活性値が計算されていないと判断した場合には、ステップ S 5 7へと処理を移行する。

ここで、文書処理装置は、全てのリンクについて端点活性値が計算されていると判断した場合には、ステップ S 5 6において、 C P U 1 3の制御のもとに、エレメント E；の中心活性値 e iの更新を実行する。

エレメント E iの中心活性値 e iの新たな値、すなわち更新値は、エレメント E iの現在の中心活性直 _{e i}と、エレメント E iの全ての端点の新たな端点活性値との和である e ； ' = e i + ∑ t j ' をとることにより求められる。ここで、プライム " ' ，' は、新たな値という意味である。このように、新たな中心活性値は、そのエレメントの元の中心活性値に、そのエレメントの端点の新たな端点活性値の総和に加えることにより得られる。

文書処理装置は、 C P U 1 3の制御のもとに、例えば RAM 1 4 に記憶された端点活性値及び中心活性値から必要な端点活性値を読み出す。文書処理装置は、上述したような計算を実行し、そのエレメント E iの中心活性値 e iを算出する。そして、文書処理装置は、計算した新たな中心活性値 e iを例えば RAM 1 4に記憶させる。

このようにして、文書処理装置は、文書中の各エレメントについて、新たな中心活性値を計算する。そして、文書処理装置は、このようにして図 1 5中ステップ S 2 1における活性拡散を実行する。続いて、文書処理装置は、図 1 5中ステップ S 2 2において、 C P U 1 3の制御のもとに、先に図 1 3に示した表示部 3 1に表示されているウィンドウ 1 9 0の表示領域 2 2 0の大きさ、すなわち、この表示領域 2 2 0に表示可能な最大文字数を W_sと設定する。また、文書処理装置は、 C PU 1 3の制御のもとに、要約 Sを初期化して初期値 S。 = " " と設定する。これは、要約に何も文字列が存在していないことを示す。文書処理装置は、このように設定した、表示領域 2 2 0に表示可能な最大文字数 W_s及び要約 Sの初期値 S。を、例えば R AM 1 4に記憶させる。

続いて、文書処理装置は、ステップ S 2 3において、 C PU 1 3 の制御のもとに、要約文の骨格の順次での作成をカウントするカウンタのカウント値 i を " 1 " に設定する。すなわち、文書処理装置は、カウント値について、 i = l と設定する。文書処理装置は、このように設定した力ゥント値 i を例えば R AM 1 4に記憶させる。続いて、文書処理装置は、ステップ S 2 4において、 C PU 1 3 の制御のもとに、カウンタのカウント値 i について、要約作成対照の文章から i番目に平均中心活性値の高い文の骨格を抽出する。ここで、平均中心活性値とは、 1つの文を構成する各エレメントの中心活性値を平均したものである。文書処理装置は、例えば RAM I 4に記憶させた要約 S ！を読み出し、この要約 S ：に対して抽出した文の骨格の文字列を加えて、要約 S iとする。そして、文書処理装置は、このようにして得た要約 S iを、例えば RAM 1 4に記憶させる。同時に、文書処理装置は、文の骨格に含まれないエレメントの中心活性値順のリスト 1 ；を作成し、このリスト 1 iを例えば R A M 1 4に記憶させる。

すなわち、このステップ S 24においては、文書処理装置は、 C PU 1 3の制御のもとに、活性拡散の結果を用いて、平均中心活性値の大きい順に文を選択し、選択された文の骨格を抽出する。文の骨格は、文から抽出した必須エレメントにより構成される。必須ェレメントになり得るものは、エレメントの主辞（head) と、主語

(subject) 、目的語 (object) 、間接目的語 (indirect object) 、所有者（posessor) 、原因（cause) 、条件（condition) 又は比較 (comparison) の関係属性を有するエレメントと、等位構造とされた関連するエレメントが必須エレメントのときには、その等位構造に直接含まれるエレメントとである。文書処理装置は、文の必須ェレメントをつなげて文の骨格を生成し、要約に加える。

続いて、文書処理装置は、ステップ S 2 5において、 C PU 1 3 の制御のもとに、要約 S iの長さ、すなわち文字数がウインドウ 1 9 0の表示領域 2 2 0の最大文字数 Wsよりも多いか否かを判断する。ここで、文書処理装置は、要約 S iの文字数が最大文字数 Wsよりも多いと判断した場合には、ステップ S 3 0において、 C P U 1 3 の制御のもとに、要約 S ：を最終的な要約文として設定し、一連の処理を終了する。なお、この場合には、要約 S i = S。= " " を出力するため、要約文は、表示領域 2 2 0に表示されないことになる。一方、文書処理装置は、要約 S iの文字数が最大文字数 W _sよりも多くないと判断した場合には、ステップ S 2 6の処理へと移行し、 C P U 1 3の制御のもとに、 i + 1番目に平均中心活性値が高い文の中心活性値と、ステップ S 2 4で作成したリスト l iのエレメントの中で最も中心活性値が高いエレメントの中心活性値とを比較する。そして、文書処理装置は、 i + 1番目に平均中心活性値が高い文の中心活性値が、リスト 1 iのエレメントの中で最も中心活性値が高いエレメントの中心活性値よりも高いと判断した場合には、ステップ S 2 8へと処理を移行する。一方、文書処理装置は、 i + 1番目に平均中心活性値が高い文の中心活性値が、リスト l iのエレメントの中で最も中心活性値が高いエレメントの中心活性値よりも高くないと判断した場合には、ステップ S 2 7へと処理を移行する。

文書処理装置は、 i + 1番目に平均中心活性値が高い文の中心活性値が、リスト 1 _;のエレメントの中で最も中心活性値が高いエレメントの中心活性値よりも高くないと判断した場合には、ステップ S 2 7において、 C P U 1 3の制御のもとに、カウンタのカウント直 i を " 1 " だけィンクリメントさせ、ステップ S 2 4へと処理を戻す。

また、文書処理装置は、 i + 1番目に平均中心活性値が高い文の中心活性値が、リスト 1 iのエレメントの中で最も中心活性値が高いエレメン卜の中心活性値よりも高いと判断した場合には、ステップ S 2 8において、 C P U 1 3の制御のもとに、リスト l iエレメントの中で最も中心活性値の高いエレメント eを要約 S iに加えて S S i を生成し、さらに、エレメント eをリスト 1 iから削除する。そして、文書処理装置は、このようにして生成した要約 S S iを例えば R A M 1 4に記憶させる。

続いて、文書処理装置は、ステップ S 2 9において、 C P U 1 3 の制御のもとに、要約 S S；の文字数がウィンドウ 1 9 0の表示領域 2 2 0の最大文字数 W _sよりも多いか否かを判別する。文書処理装置は、要約 s S iの文字数が最大文字数 w _sよりも多くないと判別した場合には、ステップ S 2 6からの処理を繰り返す。一方、文書処理装置は、要約 S S；の文字数が最大文字数 W _sよりも多いと判別した場合には、ステップ S 3 1において、 C P U 1 3の制御のもとに、要約 S _;を最終的な要約文として設定し、表示領域 2 2 0に表示して一連の処理を終了する。このようにして、文書処理装置は、最大文字数 W sよりも多くならないように要約文を生成する。

文書処理装置は、このような一連の処理を行うことによって、タグ付けされた文書を要約して要約文を作成することができる。文書処理装置は、例えば図 1 3に示した文書を要約した場合には、図 1 9に示すような要約文を作成し、表示範囲の表示領域 2 2 0に表示する。

すなわち、文書処理装置は、「TCP/IPの歴史は ARPANETを抜きにして語ることはできない。 ARPANETは 1969年北米西海岸の 4個所の大学、研究機関のホストコンピュータを 50kbpsの回線で結んだ小規模なネットワークから ARPANETは出発した。当時は 1964年にメインフレームの汎用コンピュータシリーズが開発された。この時代背景を考えると、将来のコンピュータ通信の最盛を見越したこのようなプロジェクトは、まさに米国ならではのものであったといえるだろう。」という要約文を作成し、表示領域 2 2 0に表示する。

文書処理装置においては、ユーザは、文書の全文章を一読する代わりに、この要約文を読むことで、文章の概要を理解し、この文章が所望する情報であるか否かを判定することができる。

なお、文書処理装置においては、文書中のエレメントに対して重要度を付与する方法としては、必ずしも上述したような活性拡散を用いる必要はなく、例えば、 Zechnerが提案するように、単語に tf* idf法で重み付けし、文書中に出現する単語の重みの総和を文書の重要度とする方法でもよい。この方法の詳細は、 "K. Zechner, Fast generation of abstracts from general domain text corpora by extracting relevant sentences, In Proc. of the 16th Interna tional Conference on Computational Linguistics, pp.986-989, 1996" に説明されている。また、重要度の付与方法は、これらの方法以外のものを利用することもできる。さらに、表示領域 2 0 0のキーワード入力部 1 9 2にキ一ヮ一ドを入力することによって、そのキ一ヮ一ドに基づいた重要度の設定を行うこともできる。

さて、文書処理装置は、先に図 1 4に示したように、表示部 3 1 に表示されるウィンドウ 1 9 0の表示領域 2 2 0の表示範囲を拡大することができるが、作成した要約文が表示領域 2 2 0に表示されている状態において、表示領域 2 2 0の表示範囲を変更すると、その表示範囲に応じて、要約文の情報量を変更することができる。この場合、文書処理装置は、図 2 0に示す処理を行う。

すなわち、文書処理装置は、図 20に示すように、ステップ S 6 1において、 C P U 1 3の制御のもとに、ユーザが入力部 2 0を操作することに対応して、表示部 3 1に表示されたウインドウ 1 9 0 の表示領域 2 2 0の表示範囲が変更されるまで待機する。

そして、文書処理装置は、表示領域 2 2 0の表示範囲が変更されると、ステップ S 6 2へと処理を移行し、 C P U 1 3の制御のもとに、表示領域 2 2 0の表示範囲を測定する。

以下、ステップ S 6 3乃至ステップ S 6 5で行われる処理は、図 1 5中ステップ S 2 2以降で行われる処理と同様であり、表示領域 2 2 0の表示範囲に対応した要約文が作成されて終了する。

すなわち、文書処理装置は、ステップ S 6 3において、 C P U 1 3の制御のもとに、表示領域 2 2 0の表示範囲の測定結果と、予め指定された文字の大きさとに基づいて、表示領域 2 2 0に表示される要約文の総文字数を決定する。

続いて、文書処理装置は、ステップ S 6 4において、 C P U 1 3 の制御のもとに、作成される要約がステップ S 6 3において決定された文字数を越えないように、 R A M 1 4から重要度の高い順に文又は単語を選択する。

そして、文書処理装置は、ステップ S 6 5において、 C P U 1 3 の制御のもとに、ステップ S 6 4において選択された文又は単語をつなぎ合わせて要約文を作成し、表示部 3 1 の表示領域 2 2 0に表示させる。

文書処理装置は、このような処理を行うことによって、表示領域 2 2 0の表示範囲に応じた要約文を新たに作成することができる。例えば、文書処理装置は、ユーザが入力部 2 0のマウスをドラッグ操作することにより表示領域 2 2 0の表示範囲を拡大すると、より詳細な要約文を新たに作成し、図 2 1に示すように、新たな要約文をウィンドウ 1 9 0の表示領域 2 2 0に表示する。

すなわち、文書処理装置は、「TCP/IPの歴史は ARPANETを抜きにして語ることはできない。 ARPANETはァメリカ国防省 D0Dの国防高等研究計画局がスポンサーとなって構築されてきた、実験および研究用のバケツト交換ネットワークである。 1969年北米西海岸の 4個所の大学、研究機関のホストコンピュータを 50kbpsの回線で結んだきわめて小規模なネットワークから ARPANETは出発した。当時は 1945年に世界初のコンピュータである ENIACがペンシルバニア大学で開発され、 1964年にはじめて ICを理論素子として実装したメインフレームの汎用コンピュータシリ一ズが開発され、やっとコンピュータが産声をあげたばかりあった。この時代背景を考えると、将来のコンビユータ通信の最盛を見越したこのようなプロジェクトは、まさに米国ならではのものであったといえるだろう。 j という要約文を作成し、表示領域 2 2 0に表示する。

このように、文書処理装置においては、表示された要約文が簡略すぎて文書の概略を把握することができない場合、ユーザは、表示領域 2 2 0の表示範囲を拡大することで、より多くの情報量を有するより詳細な要約文を参照することができる。

文書処理装置は、このようにして文書の要約文を作成する際に、 C P U 1 3により R O M 1 5やハードディスクに記録されている電子文書処理プログラムのうちの音声読み上げプログラムを起動すると、図 2 2に示すような一連の工程を経ることによって、文書又は要約文の読み上げを行うことができる。なおここでは、先に図 6に示した文書を例として挙げて説明する。まず、文書処理装置は、図 2 2に示すように、ステップ S 7 1において、タグ付けされた文書を受信する。なお、この文書は、上述したように、音声合成を行うために必要なタグが付与されており、図 8に示すタグファイルとして構成されている。また、文書処理装置は、タグ付けされた文書を受信し、その文書に音声合成を行うために必要なタグを新たに付与して文書を作成することもできる。さらに、文書処理装置は、タグ付けされていない文書を受信し、その文書に音声合成を行うために必要なタグを含めたタグ付けを行い、タグファイルを作成してもよい。なお、この工程は、図 4中ステツプ S 1に対応するものである。

続いて、文書処理装置は、ステップ S 7 2において、 C P U 1 3 の制御のもとに、上述した方法により文書の要約文を作成する。ここで、要約文の元となる文書は、ステップ S 7 1に示すようにタグ付けがなされていることから、作成した要約文にも、文書に対応するタグが付与されている。

続いて、文書処理装置は、ステップ S 7 3において、 C P U 1 3 の制御のもとに、タグファイルに基づいて文書の全内容についての音声読み上げファイルを生成する。この音声読み上げファイルは、タグファイル中のタグから、読み上げのための属性情報を導出し、この属性情報を埋め込むことにより生成される。

このとき、文書処理装置は、図 2 3に示す一連の工程を経ることによって、音声読み上げファイルを生成する。

まず、文書処理装置は、図 2 3に示すように、ステップ S 8 1において、 C P U 1 3によって、受信又は作成したタグファイルを解析する。ここで、文書処理装置は、文書を記述している言語を判別するとともに、文書の段落、文及び句の開始位置や、読み属性情報をタグに基づいて探し出す。

続いて、文書処理装置は、ステップ S 8 2において、 C P U 1 3 によって、文書を記述している言語に応じて文書の開始位置に Com- _Lang=***を埋め込む。ここでは、文書処理装置は、文書の開始位置に Com=し ang=ENGを ¾め込む。

続いて、文書処理装置は、ステップ S 8 3において、 C P U 1 3 によって、文書の段落、文及び句の開始位置を音声読み上げフアイルにおける属性情報に置換する。すなわち、文書処理装置は、タグファイル中の <段落〉、 <文>及びく * * *句〉を、それぞれ、 Co m=begin— p、 .Com=begin— s及び Com=begin— phに置換する。

続いて、文書処理装置は、ステップ S 8 4において、 C P U 1 3 によって、同じレベルの統語構造が表れて同じ Com=begin— ***が重複してヽるものを、 1つの Com=begin一こ統合する。

続いて、文書処理装置は、ステップ S 8 5において、 C P U 1 3 (こよって、 Com=begin一 *** (こ対応して Pau=***を埋め込む。すなわち、文書処理装置は、 Com=begin— pの直前に Pau=500を埋め込み、 Com=be gin— sの直前 ίこ Pau=100を埋め込み、 Com=begin— phの直前 ίこ Pau=50を埋め込む。

続いて、文書処理装置は、ステップ S 8 6において、 C P U 1 3 によって、読み属性情報に基づいて、正しい読みに置換する。ここでは、文書処理装置は、発音 = "two" という読み属性情報に基づいて、「II」を「two」に置換する。

続いて、文書処理装置は、ステップ S 8 7において、 C P U 1 3 によって、要約文に含まれる部分を探し出す。そして、文書処理装置は、ステップ S 8 8において、 C P U 1 3 によって、ステップ S 8 7にて探し出した要約文に含まれる部分に応じて、 Com=Vol=***を埋め込む。具体的には、文書処理装置は、文書の全内容のうち、図 2 2中ステップ S 7 2にて作成した要約文に含まれる部分の開始位置について、エレメント単位で Com=Vol=80という属性情報を埋め込むとともに、それ以外の部分の開始位置については、 Com=Vol=0という属性情報を埋め込む。すなわち、文書処理装置は、要約文に含まれる部分については、デフォルトの音量を 8 0 %増量した音量で読み上げる。なお、音量は、デフォルトの音量を 8 0 %増量したものである必要はなく、適宜変更することができる。また、文書処理装置は、ステップ S 8 7にて探し出した要約文に含まれる部分に応じて、 Com=Vol=***のみを埋め込むのではなく、要約文に含まれる部分に応じて、例えば、異なる音声合成エンジンを指定する属性情報を埋め込み、男声ノ女声といったように、読み上げの声を、要約文に含まれない部分を読み上げる声と異なる特徴を持たせて変えるようにしてもよい。さらに、文書処理装置は、例えば、要約文に含まれる部分にァクセントを強調して読み上げさせるための属性情報を埋め込み、要約文に含まれる部分に応じて、読み方を変化させるようにしてもよい。このように、文書処理装置は、要約文に含まれる部分を読み上げの際にも強調することができ、ュ一ザの注意を喚起することができる。

文書処理装置は、図 2 2中ステップ S 7 3において、図 2 3に示す処理を行うことによって、音声読み上げファイルを自動的に生成する。文書処理装置は、生成した音声読み上げファイルを R A M 1 4に記憶させる。なお、この工程は、図 4中ステップ S 2に対応するものである。

続いて、文書処理装置は、図 2 2中ステップ S 7 4において、 C P U 1 3の制御のもとに、音声読み上げファイルを用いて、 R O M 1 5ゃハ一ドディスク等に予め記憶されている音声合成エンジンに適した処理を行う。なお、この工程は、図 4中ステップ S 3に対応するものである。

そして、文書処理装置は、ステップ S 7 5において、ユーザが上述したユーザィン夕一フェースを用いて行う操作に応じて処理を行う。なお、この工程は、図 4中ステップ S 4に対応するものである。文書処理装置は、例えばユーザが入力部 2 0のマウス等を用いて、先に図 1 2に示したユーザィン夕一フェースウィンドウ 1 7 0の選択スィッチ 1 8 4を選択することによって、ステップ S 7 2にて作成した要約文を読み上げ対象とすることができる。この場合、文書処理装置は、例えばユーザが入力部 2 0のマウス等を用いて、再生ボタン 1 7 1を押すことによって、要約文の読み上げを開始することができる。また、文書処理装置は、例えばユーザが入力部 2 0のマウス等を用いて、選択スィツチ 1 8 3を選択し、再生ボタン 1 7 1を押した場合には、上述したように文書の読み上げを開始する。この際、文書処理装置は、ステップ S 7 3にて音声読み上げフアイルに埋め込んだ Pau=***という属性情報に基づいて、段落、文及び句の開始位置において互いに異なる休止期間を設けて読み上げる。また、文書処理装置は、ステップ S 7 3にて音声読み上げファイルに埋め込んだ COH VO 1=***という属性情報に基づいて、要約文に含まれる部分については音量を増大させる他、必要に応じて、アクセントを強調したり、要約文に含まれる部分を読み上げる声を、要約文に含まれない部分を読み上げる声と異なる特徴を持たせることで変化させ、文書を読み上げる。

文書処理装置は、このような処理を行うことによって、与えられた文書や作成した要約文を読み上げることができる。また、文書処理装置は、与えられた文書を読み上げる際に、作成した要約文に含まれる部分を強調して読み上げるといったように、作成した要約文に応じて読み上げ方を変化させることもできる。

以上説明したように、文書処理装置は、与えられた文書から音声読み上げファイルを自動的に生成し、文書やその文書から作成した要約文を適切な音声合成エンジンを用いて読み上げることができる。その際、文書処理装置は、作成した要約文に含まれる部分を読み上げる際に、その部分の音量を増大させることによって、要約文に含まれる部分を強調して読み上げることができ、ユーザの注意を喚起することができる。また、文書処理装置は、段落、文及び句の開始位置を識別し、それぞれに対応する長さの休止期間を設けることによって、違和感のない自然な読み上げを行うことができる。

なお、本発明は、上述した実施の形態に限定されるものではなく、例えば、文書や音声読み上げファイルへのタグ付けが上述のものに限定されるものではないことは勿論である。

また、上述した実施の形態においては、通信部 2 2に外部から電話回線を介して文書が送信されるものとして説明したが、本発明は、これに限定されるものではない。例えば、衛星等を介して文書が送信される場合にも適用できる他、記録/再生部 3 2において記録媒体 3 3から読み出されたり、 R O M 1 5に予め文書が記録されていてもよい。さらに、上述した実施の形態においては、受信又は作成したタグファイルから音声読み上げファイルを生成するものとしたが、このような音声読み上げファイルを生成せずに、夕グファイルに基づいて直接読み上げるようにしてもよい。

この場合、文書処理装置は、タグファイルを受信又は作成した後、音声合成エンジンを用い、タグファイルに付与されている段落、文及び句を示すタグに基づいて、段落、文及び句を識別し、これらの段落、文及び句の開始位置に所定の休止期間を設けて読み上げる。タグファイルには、上述したように、読み上げを禁止するための属性情報や、発音を示す属性情報が付与されており、文書処理装置は、読み上げが禁止されている部分を除去するとともに、正確な読み又は発音に置換して読み上げを行う。また、文書処理装置は、読み上げの途中で、ユーザが上述したユーザィン夕一フェースを操作することによって、タグファイルに付与されている段落、文及び句を示すタグに基づいて、段落、文及び句の単位で読み上げの際の頭出し、早送り又は巻き戻しを行うこともできる。

このようにすることによって、文書処理装置は、音声読み上げフアイルを生成することなく、タグファイルに基づいて文書を直接読み上げることができる。

さらにまた、本発明においては、記録媒体 3 3として、上述した電子文書処理プログラムが書き込まれたディスク状記録媒体ゃテープ状記録媒体等を提供することも容易に実現できる。

また、上述した実施の形態においては、表示部 3 1に表示される種々のウィンドウを操作するデバイスとして入力部 2 0のマウスを例示したが、本発明がこれに限定されるものではないことはいうまでもない。例えば、このようなデバイスとしては、夕ブレットゃラィトペン等も利用することができる。

さらに、上述した実施の形態においては、日本語及び英語の文書を例示したが、本発明がいかなる言語にも適用可能であることは勿 e冊 t¹ る o

このように、本発明は、その趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。産業上の利用可能性以上詳細に説明したように、本発明にかかる電子文書処理装置は、電子文書を処理する電子文書処理装置において、電子文書が入力される文書入力手段と、電子文書に基づいて、音声合成器で読み上げるための音声読み上げデ一夕を生成する音声読み上げデータ生成手段とを備える。

したがって、本発明にかかる電子文書処理装置は、電子文書に基づいて、音声読み上げデータを生成することによって、音声読み上げデ一夕を用いて、任意の電子文書を音声合成により高精度で且つ違和感がなく読み上げることができる。

また、本発明にかかる電子文書処理方法は、電子文書を処理する電子文書処理方法において、電子文書が入力される文書入力工程と、電子文書に基づいて、音声合成器で読み上げるための音声読み上げデ一夕を生成する音声読み上げデータ生成工程とを備える。

したがって、本発明にかかる電子文書処理方法は、電子文書に基づいて、音声読み上げデータを生成することによって、音声読み上げデ一夕を用いて、任意の電子文書を音声合成により高精度で且つ違和感がなく読み上げることを可能とする。

さらに、本発明にかかる電子文書処理プログラムが記録された記録媒体は、電子文書を処理するコンピュータ制御可能な電子文書処理プログラムが記録された記録媒体において、電子文書処理プログラムは、電子文書が入力される文書入力工程と、電子文書に基づいて、音声合成器で読み上げるための音声読み上げデ一夕を生成する音声読み上げデータ生成工程とを備える。

したがって、本発明にかかる電子文書処理プログラムが記録された記録媒体は、電子文書に基づいて、音声読み上げデ一夕を生成する電子文書処理プログラムを提供することができる。そのため、この電子文書処理プログラムが提供された装置は、音声読み上げデ一夕を用いて、任意の電子文書を音声合成により高精度で且つ違和感がなく読み上げることが可能となる。

さらにまた、本発明にかかる電子文書処理装置は、電子文書を処理する電子文書処理装置において、複数の要素を有し階層化された構造を有する電子文書の内部構造を示すタグ情報が付与されている当該電子文書が入力される文書入力手段と、タグ情報に基づいて、電子文書を音声合成して読み上げる文書読み上げ手段とを備える。

したがって、本発明にかかる電子文書処理装置は、複数の要素を有し階層化された構造を有する電子文書の内部構造を示すタグ情報が付与されている電子文書を入力し、この電子文書に付与された夕グ情報に基づいて、電子文書を高精度で且つ違和感がなく直接読み上げることができる。

また、本発明にかかる電子文書処理方法は、電子文書を処理する電子文書処理方法において、複数の要素を有し階層化された構造を有する電子文書の内部構造を示すタグ情報が付与されている当該電子文書が入力される文書入力工程と、タグ情報に基づいて、電子文書を音声合成して読み上げる文書読み上げ工程とを備える。

したがって、本発明にかかる電子文書処理方法は、複数の要素を有し階層化された構造を有する電子文書の内部構造を示す夕グ情報が付与されている電子文書を入力し、この電子文書に付与された夕グ情報に基づいて、電子文書を高精度で且つ違和感がなく直接読み上げることを可能とする。

さらに、本発明にかかる電子文書処理プログラムが記録された記録媒体は、電子文書を処理するコンピュータ制御可能な電子文書処理プログラムが記録された記録媒体において、電子文書処理プログラムは、複数の要素を有し階層化された構造を有する電子文書の内部構造を示すタグ情報が付与されている当該電子文書が入力される文書入力工程と、タグ情報に基づいて、電子文書を音声合成して読み上げる文書読み上げ工程とを備える。

したがって、本発明にかかる電子文書処理プログラムが記録された記録媒体は、複数の要素を有し階層化された構造を有する電子文書の内部構造を示すタグ情報が付与されている電子文書を入力し、この電子文書に付与されたタグ情報に基づいて、電子文書を高精度で且つ違和感がなく直接読み上げる電子文書処理プログラムを提供することができる。そのため、この電子文書処理プログラムが提供された装置は、電子文書を入力して高精度で且つ違和感がなく直接読み上げることが可能となる。

さらにまた、本発明にかかる電子文書処理装置は、電子文書を処理する電子文書処理装置において、電子文書の要約文を作成する要約文作成手段と、電子文書を音声合成器で読み上げるための音声読み上げデ一夕を生成する音声読み上げデ一夕生成手段とを備え、この音声読み上げデ一夕生成手段は、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報を付与することで、音声読み上げデー夕を生成する。

したがって、本発明にかかる電子文書処理装置は、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報を付与して音声読み上げデータを生成することによって、音声読み上げデータを用いて、任意の電子文書を音声合成により高精度で且つ違和感がなく、さらに、要約文に含まれる重要な部分を強調して読み上げることができる。

また、本発明にかかる電子文書処理方法は、電子文書を処理する電子文書処理方法において、電子文書の要約文を作成する要約文作成工程と、電子文書を音声合成器で読み上げるための音声読み上げデ一夕を生成する音声読み上げデータ生成工程とを備え、この音声読み上げデータ生成工程では、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報が付与されることで、音声読み上げデータが生成される。

したがって、本発明にかかる電子文書処理方法は、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報を付与して音声読み上げデータを生成することによって、音声読み上げデ一夕を用いて、任意の電子文書を音声合成により高精度で且つ違和感がなく、さらに、要約文に含まれる重要な部分を強調して読み上げることを可能とする。

さらに、本発明にかかる電子文書処理プログラムが記録された記録媒体は、電子文書を処理するコンピュータ制御可能な電子文書処理プログラムが記録された記録媒体において、電子文書処理プログラムは、電子文書の要約文を作成する要約文作成工程と、電子文書を音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデ一夕生成工程とを備え、この音声読み上げデ一夕生成工程では、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報が付与されることで、音声読み上げデータが生成される。

したがって、本発明にかかる電子文書処理プログラムが記録された記録媒体は、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報を付与して音声読み上げデータを生成する電子文書処理プログラムを提供することができる。そのため、この電子文書処理プログラムが提供された装置は、音声読み上げデータを用いて、任意の電子文書を音声合成により高精度で且つ違和感がなく、さらに、要約文に含まれる重要な部分を強調して読み上げることが可能となる。さらにまた、本発明にかかる電子文書処理装置は、電子文書を処理する電子文書処理装置において、電子文書の要約文を作成する要約文作成手段と、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げる文書読み上げ手段とを備える。

したがって、本発明にかかる電子文書処理装置は、任意の電子文書を音声合成により高精度で且つ違和感がなく、さらに、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して直接読み上げることができる。

また、本発明にかかる電子文書処理方法は、電子文書を処理する電子文書処理方法において、電子文書の要約文を作成する要約文作成工程と、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げる文書読み上げェ程とを備える。

したがって、本発明にかかる電子文書処理方法は、任意の電子文書を音声合成により高精度で且つ違和感がなく、さらに、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して直接読み上げることを可能とする。

さらに、本発明にかかる電子文書処理プログラムが記録された記録媒体は、電子文書を処理するコンピュータ制御可能な電子文書処理プログラムが記録された記録媒体において、電子文書処理プログラムは、電子文書の要約文を作成する要約文作成工程と、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して読み上げる文書読み上げ工程とを備える。

したがって、本発明にかかる電子文書処理プログラムが記録された記録媒体は、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して直接読み上げる電子文書処理プログラムを提供することができる。そのため、この電子文書処理プログラムが提供された装置は、任意の電子文書を音声合成により高精度で且つ違和感がなく、さらに、電子文書のうち、要約文に含まれる部分については、要約文に含まれない部分に比べ、強調して直接読み上げることが可能となる。

さらにまた、本発明にかかる電子文書処理装置は、電子文書を処理する電子文書処理装置において、電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2つの開始位置を検出する検出手段と、この検出手段により得られた検出結果に基づいて、電子文書に対して、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性情報を付与することで、音声合成器で読み上げるための音声読み上げデ一夕を生成する音声読み上げデータ生成手段とを備える。

したがって、本発明にかかる電子文書処理装置は、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性倩報を付与して音声読み上げデータを生成することによって、音声読み上げデータを用いて、任意の電子文書を音声合成により高精度で且つ違和感がなく読み上げることができる。また、本発明にかかる電子文書処理方法は、電子文書を処理する電子文書処理方法において、電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2つの開始位置を検出する検出工程と、この検出工程にて得られた検出結果に基づいて、電子文書に対して、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性情報を付与されることで、音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデ一夕生成工程とを備える。

したがって、本発明にかかる電子文書処理方法は、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性情報を付与して音声読み上げデ一夕を生成することによって、音声読み上げデータを用いて、任意の電子文書を音声合成により高精度で且つ違和感がなく読み上げることを可能とする。

さらに、本発明にかかる電子文書処理プログラムが記録された記録媒体は、電子文書を処理するコンピュータ制御可能な電子文書処理プログラムが記録された記録媒体において、電子文書処理プログラムは、電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2つの開始位置を検出する検出工程と、この検出工程にて得られた検出結果に基づいて、電子文書に対して、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性情報を付与されることで、音声合成器で読み上げるための音声読み上げデ一夕を生成する音声読み上げデ一夕生成工程とを備える。

したがって、本発明にかかる電子文書処理プログラムが記録された記録媒体は、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性情報を付与して音声読み上げデ一夕を生成する電子文書処理プログラムを提供することができる。そのため、この電子文書処理プログラムが提供された装置は、音声読み上げデータを用いて、任意の電子文書を音声合成により高精度で且つ違和感がなく読み上げることが可能となる。さらにまた、本発明にかかる電子文書処理装置は、電子文書を処理する電子文書処理装置において、電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2つの開始位置を検出する検出手段と、この検出手段により得られた検出結果に基づいて、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けて電子文書を音声合成して読み上げる文書読み上げ手段とを備える。

したがって、本発明にかかる電子文書処理装置は、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けて、任意の電子文書を音声合成により高精度で且つ違和感がなく直接読み上げることができる。

また、本発明にかかる電子文書処理方法は、電子文書を処理する電子文書処理方法において、電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2つの開始位置を検出する検出工程と、この検出工程にて得られた検出結果に基づいて、段落、文及び句のうちの少なくとも 2つの閧始位置に互いに異なる休止期間を設けて電子文書を音声合成して読み上げる文書読み上げ工程とを備える。

したがって、本発明にかかる電子文書処理方法は、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けて、任意の電子文書を音声合成により高精度で且つ違和感がなく直接読み上げることを可能とする。

さらに、本発明にかかる電子文書処理プログラムが記録された記録媒体は、電子文書を処理するコンピュータ制御可能な電子文書処理プログラムが記録された記録媒体において、電子文書処理プログラムは、電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2つの開始位置を検出する検出工程と、この検出工程にて得られた検出結果に基づいて、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けて電子文書を音声合成して読み上げる文書読み上げ工程とを備える。

したがって、本発明にかかる電子文書処理プログラムが記録された記録媒体は、段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けて電子文書を直接読み上げる電子文書処理プログラムを提供することができる。そのため、この電子文書処理プログラムが提供された装置は、任意の電子文書を音声合成により高精度で且つ違和感がなく直接読み上げることが可能となる。

Claims

請求の範囲

1 . 電子文書を処理する電子文書処理装置において、

上記電子文書が入力される文書入力手段と、

上記電子文書に基づいて、音声合成器で読み上げるための音声読み上げデ一夕を生成する音声読み上げデータ生成手段とを備えること

を特徴とする電子文書処理装置。

2 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、上記音声合成器で読み上げるのに必要なタグ情報を付与することを特徴とする請求の範囲第 1項記載の電子文書処理装置。

3 . 上記電子文書は、複数の要素を有し階層化された構造を有する上記電子文書の内部構造を示すタグ情報が付与されていることを特徴とする請求の範囲第 1項記載の電子文書処理装置。

4 . 上記電子文書は、この電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されており、上記音声読み上げデータ生成手段は、これらの段落、文及び句を示すタグ情報に基づいて、上記電子文書を構成する段落、文及び句を識別すること

を特徴とする請求の範囲第 3項記載の電子文書処理装置。

5 . 上記電子文書は、上記音声合成器で読み上げるのに必要なタグ情報が付与されていること

を特徴とする請求の範囲第 3項記載の電子文書処理装置。

6 . 上記音声合成器で読み上げるのに必要なタグ情報は、読み上げを禁止するための属性情報を含むことを特徴とする請求の範囲第 5項記載の電子文書処理装置。

7 . 上記音声合成器で読み上げるのに必要なタグ情報は、発音を示す属性情報を含むこと

を特徴とする請求の範囲第 5項記載の電子文書処理装置。

8 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、上記電子文書を記述する言語を示す属性情報を付与することで、上記音声読み上げデータを生成すること

を特徴とする請求の範囲第 1項記載の電子文書処理装置。

9 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報を付与することで、上記音声読み上げデ一夕を生成すること

を特徴とする請求の範囲第 1項記載の電子文書処理装置。

1 0 . 上記音声読み上げデータ生成手段は、上記段落、文及び句の開始位置を示す属性情報のうちの、同種の統語構造を表す属性情報が、上記電子文書内に連続して現れる場合には、これらの連続する属性情報を 1つの属性情報に統合すること

を特徴とする請求の範囲第 9項記載の電子文書処理装置。

1 1 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、上記段落、文及び句の開始位置を示す属性情報に対応して休止期間を設けることを示す属性情報を付与することで、上記音声読み上げデータを生成すること

を特徴とする請求の範囲第 9項記載の電子文書処理装置。

1 2 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、読み上げが禁止されている部分を示す属性情報を付与することで、上記音声読み上げデ一夕を生成すること

を特徴とする請求の範囲第 1項記載の電子文書処理装置。

1 3 . 上記音声読み上げデ一夕生成手段は、上記電子文書に対して、正確な読み又は発音を示す属性情報を付与することで、上記音声読み上げデ一夕を生成すること

を特徴とする請求の範囲第 1項記載の電子文書処理装置。

1 4 . 上記音声読み上げデ一夕生成手段は、上記電子文書に対して、読み上げの音量を示す属性情報を付与することで、上記音声読み上げデ一夕を生成すること

を特徴とする請求の範囲第 1項記載の電子文書処理装置。

1 5 . 上記音声読み上げデータを用いて、音声合成器に適した処理を行う処理手段をさらに備え、

上記処理手段は、上記音声読み上げデータに付与される上記電子文書を記述する言語を示す属性情報に基づいて、音声合成器を選択すること

を特徴とする請求の範囲第 1項記載の電子文書処理装置。

1 6 . 上記音声読み上げデータを用いて、音声合成器に適した処理を行う処理手段をさらに備え、

上記処理手段は、上記音声読み上げデータに付与される読み上げの音量を示す属性情報に基づいて、読み上げの音量の絶対値を求めること

を特徴とする請求の範囲第 1項記載の電子文書処理装置。

1 7 . 上記音声読み上げデータに基づいて、上記電子文書を読み上げる文書読み上げ手段をさらに備えること

を特徴とする請求の範囲第 1項記載の電子文書処理装置。

1 8 . 上記文書読み上げ手段は、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報に基づいて、上記段落、文及び句の単位で頭出しを行うこと

を特徴とする請求の範囲第 1 7項記載の電子文書処理装置。

1 9 . 電子文書を処理する電子文書処理方法において、

上記電子文書が入力される文書入力工程と、

上記電子文書に基づいて、音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデータ生成工程とを備えること

を特徴とする電子文書処理方法。

2 0 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、上記音声合成器で読み上げるのに必要なタグ情報が付与されること

を特徴とする請求の範囲第 1 9項記載の電子文書処理方法。

2 1 . 上記電子文書は、複数の要素を有し階層化された構造を有する上記電子文書の内部構造を示すタグ情報が付与されていることを特徴とする請求の範囲第 1 9項記載の電子文書処理方法。

2 2 . 上記電子文書は、この電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されており、上記音声読み上げデータ生成工程では、これらの段落、文及び句を示すタグ情報に基づいて、上記電子文書を構成する段落、文及び句が識別されること

を特徴とする請求の範囲第 2 1項記載の電子文書処理方法。

2 3 . 上記電子文書は、上記音声合成器で読み上げるのに必要な夕グ情報が付与されていることを特徴とする請求の範囲第 2 1項記載の電子文書処理方法。

2 4 . 上記音声合成器で読み上げるのに必要なタグ情報は、読み上げを禁止するための属性情報を含むこと

を特徴とする請求の範囲第 2 3項記載の電子文書処理方法。

2 5 . 上記音声合成器で読み上げるのに必要なタグ情報は、発音を示す属性情報を含むこと

を特徴とする請求の範囲第 2 3項記載の電子文書処理方法。

2 6 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、上記電子文書を記述する言語を示す属性情報が付与されることで、上記音声読み上げデータが生成されること

を特徴とする請求の範囲第 1 9項記載の電子文書処理方法。

2 7 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報が付与されることで、上記音声読み上げデ —夕が生成されること

を特徴とする請求の範囲第 1 9項記載の電子文書処理方法。

2 8 . 上記音声読み上げデータ生成工程では、上記段落、文及び句の開始位置を示す属性情報のうちの、同種の統語構造を表す属性情報が、上記電子文書内に連続して現れる場合には、これらの連続する属性情報が 1つの属性情報に統合されること

を特徴とする請求の範囲第 2 7項記載の電子文書処理方法。

2 9 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、上記段落、文及び句の開始位置を示す属性情報に対応して休止期間を設けることを示す属性情報が付与されることで、上記音声読み上げデータが生成されることを特徴とする請求の範囲第 2 7項記載の電子文書処理方法。 3 0 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、読み上げが禁止されている部分を示す属性情報が付与されることで、上記音声読み上げデ一夕が生成されること

を特徴とする請求の範囲第 1 9項記載の電子文書処理方法。

3 1 . 上記音声読み上げデ一夕生成工程では、上記電子文書に対して、正確な読み又は発音を示す属性情報が付与されることで、上記音声読み上げデータが生成されること

を特徴とする請求の範囲第 1 9項記載の電子文書処理方法。

3 2 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、読み上げの音量を示す属性情報が付与されることで、上記音声読み上げデータが生成されること

を特徴とする請求の範囲第 1 9項記載の電子文書処理方法。

3 3 . 上記音声読み上げデ一夕を用いて、音声合成器に適した処理を行う処理工程をさらに備え、

上記処理工程では、上記音声読み上げデータに付与される上記電子文書を記述する言語を示す属性情報に基づいて、音声合成器が選択されること

を特徴とする請求の範囲第 1 9項記載の電子文書処理方法。

3 4 . 上記音声読み上げデータを用いて、音声合成器に適した処理を行う処理工程をさらに備え、

上記処理工程では、上記音声読み上げデ一夕に付与される読み上げの音量を示す属性情報に基づいて、読み上げの音量の絶対値が求められること

を特徴とする請求の範囲第 1 9項記載の電子文書処理方法。

3 5 . 上記音声読み上げデータに基づいて、上記電子文書を読み上げる文書読み上げ工程をさらに備えること

を特徴とする請求の範囲第 1 9項記載の電子文書処理方法。

3 6 . 上記文書読み上げ工程では、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報に基づいて、上記段落、文及び句の単位で頭出しが行われること

を特徴とする請求の範囲第 3 5項記載の電子文書処理方法。

3 7 . 電子文書を処理するコンピュータ制御可能な電子文書処理プログラムが記録された記録媒体において、

上記電子文書処理プログラムは、

上記電子文書が入力される文書入力工程と、

を特徴とする電子文書処理プログラムが記録された記録媒体。

3 8 . 電子文書を処理する電子文書処理装置において、

複数の要素を有し階層化された構造を有する上記電子文書の内部構造を示すタグ情報が付与されている当該電子文書が入力される文書入力手段と、

上記タグ情報に基づいて、上記電子文書を音声合成して読み上げる文書読み上げ手段とを備えること

を特徴とする電子文書処理装置。

3 9 . 上記文書入力手段には、上記電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されている電子文書が入力され、上記文書読み上げ手段は、これらの段落、文及び句を示すタグ情報に基づいて、上記段落、文及び句の開始位置に休止期間を設けて上記電子文書を読み上げること

を特徴とする請求の範囲第 3 8項記載の電子文書処理装置。

4 0 . 上記電子文書は、この電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されており、上記文書読み上げ手段は、これらの段落、文及び句を示すタグ倩報に基づいて、上記電子文書を構成する段落、文及び句を識別すること

を特徴とする請求の範囲第 3 8項記載の電子文書処理装置。

4 1 . 上記電子文書は、上記文書読み上げ手段で読み上げるのに必要なタグ情報が付与されていること

を特徴とする請求の範囲第 3 8項記載の電子文書処理装置。

4 2 . 上記文書読み上げ手段で読み上げるのに必要なタグ情報は、読み上げを禁止するための属性情報を含むこと

を特徴とする請求の範囲第 4 1項記載の電子文書処理装置。

4 3 . 上記文書読み上げ手段で読み上げるのに必要なタグ情報は、発音を示す属性情報を含むこと

を特徴とする請求の範囲第 4 1項記載の電子文書処理装置。

4 4 . 上記文書読み上げ手段は、上記電子文書のうち、読み上げが禁止されている部分を除去して、上記電子文書を読み上げることを特徴とする請求の範囲第 3 8項記載の電子文書処理装置。

4 5 . 上記文書読み上げ手段は、正確な読み又は発音に置換して上記電子文書を読み上げること

を特徴とする請求の範囲第 3 8項記載の電子文書処理装置。

4 6 . 上記文書読み上げ手段は、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報に基づいて、上記段落、文及び句の単位で頭出しを行うこと

を特徴とする請求の範囲第 3 8項記載の電子文書処理装置。

4 7 . 電子文書を処理する電子文書処理方法において、

複数の要素を有し階層化された構造を有する上記電子文書の内部構造を示すタグ情報が付与されている当該電子文書が入力される文書入力工程と、

上記タグ情報に基づいて、上記電子文書を音声合成して読み上げる文書読み上げ工程とを備えること

を特徴とする電子文書処理方法。

4 8 . 上記文書入力工程では、上記電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されている電子文書が入力され、

上記文書読み上げ工程では、これらの段落、文及び句を示すタグ情報に基づいて、上記段落、文及び句の開始位置に休止期間が設けられて上記電子文書が読み上げられること

を特徴とする請求の範囲第 4 7項記載の電子文書処理方法。

4 9 . 上記電子文書は、この電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ倩報が付与されており、上記文書読み上げ工程では、これらの段落、文及び句を示すタグ情報に基づいて、上記電子文書を構成する段落、文及び句が識別されること

を特徴とする請求の範囲第 4 7項記載の電子文書処理方法。

5 0 . 上記電子文書は、上記文書読み上げ工程にて読み上げられるのに必要なタグ情報が付与されていること

を特徴とする請求の範囲第 4 7項記載の電子文書処理方法。

5 1 . 上記文書読み上げ工程にて読み上げられるのに必要なタグ情報は、読み上げを禁止するための属性情報を含むこと

を特徴とする請求の範囲第 5 0項記載の電子文書処理方法。

5 2 . 上記文書読み上げ工程にて読み上げられるのに必要なタグ情報は、発音を示す属性情報を含むこと

を特徴とする請求の範囲第 5 0項記載の電子文書処理方法。

5 3 . 上記文書読み上げ工程では、上記電子文書のうち、読み上げが禁止されている部分が除去されて、上記電子文書が読み上げられること

を特徴とする請求の範囲第 4 7項記載の電子文書処理方法。

5 4 . 上記文書読み上げ工程では、正確な読み又は発音に置換されて上記電子文書が読み上げられること

を特徴とする請求の範囲第 4 7項記載の電子文書処理方法。

5 5 . 上記文書読み上げ工程では、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報に基づいて、上記段落、文及び句の単位で頭出しが行われること

を特徴とする請求の範囲第 4 7項記載の電子文書処理方法。

5 6 . 電子文書を処理するコンピュータ制御可能な電子文書処理プログラムが記録された記録媒体において、

上記電子文書処理プログラムは、

複数の要素を有し階層化された構造を有する上記電子文書の内部構造を示すタグ情報が付与されている当該電子文書が入力される文書入力工程と、上記夕グ情報に基づいて、上記電子文書を音声合成して読み上げる文書読み上げ工程とを備えること

5 7 . 電子文書を処理する電子文書処理装置において、

上記電子文書の要約文を作成する要約文作成手段と、

上記電子文書を音声合成器で読み上げるための音声読み上げデ一夕を生成する音声読み上げデ一夕生成手段とを備え、

上記音声読み上げデータ生成手段は、上記電子文書のうち、上記要約文に含まれる部分については、上記要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報を付与することで、上記音声読み上げデータを生成すること

を特徴とする電子文書処理装置。

5 8 . 上記属性情報は、上記電子文書のうち、上記要約文に含まれる部分を読み上げる際の音量を、上記要約文に含まれない部分を読み上げる際の音量に比して増量させるための音量を示す属性情報を含むこと

を特徴とする請求の範囲第 5 7項記載の電子文書処理装置。

5 9 . 上記音量を示す属性情報は、標準の音量に対する増量分の百分率で表されること

を特徴とする請求の範囲第 5 8項記載の電子文書処理装置。

6 0 . 上記属性情報は、上記電子文書のうち、上記要約文に含まれる部分を読み上げる際にァクセントを強調するための属性情報を含むこと

を特徴とする請求の範囲第 5 7項記載の電子文書処理装置。

6 1 . 上記属性情報は、上記電子文書のうち、上記要約文に含まれる部分を読み上げる際の音声を、上記要約文に含まれない部分を読み上げる際の音声と異なる特徴を持たせるための属性情報を含むこと

を特徴とする請求の範囲第 5 7項記載の電子文書処理装置。

6 2 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、上記音声合成器で読み上げるのに必要なタグ情報を付与することを特徴とする請求の範囲第 5 7項記載の電子文書処理装置。

6 3 . 上記要約文作成手段は、

上記電子文書の要約文が表示される要約文表示領域の大きさを設定し、

設定した要約文表示領域の大きさに応じて、上記電子文書の要約文の長さを決定し、

決定した要約文の長さに基づいて、上記要約文表示領域内におさまる長さの要約文を作成すること

を特徴とする請求の範囲第 5 7項記載の電子文書処理装置。

6 4 . 上記電子文書は、複数の要素を有し階層化された構造を有する上記電子文書の内部構造を示すタグ情報が付与されていることを特徴とする請求の範囲第 5 7項記載の電子文書処理装置。

6 5 . 上記電子文書は、この電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されており、

上記音声読み上げデ一夕生成手段は、これらの段落、文及び句を示すタグ情報に基づいて、上記電子文書を構成する段落、文及び句を識別すること

を特徴とする請求の範囲第 6 4項記載の電子文書処理装置。

6 6 . 上記電子文書は、上記音声合成器で読み上げるのに必要な夕グ情報が付与されていること

を特徴とする請求の範囲第 6 4項記載の電子文書処理装置。

6 7 . 上記音声合成器で読み上げるのに必要なタグ情報は、読み上げを禁止するための属性情報を含むこと

を特徴とする請求の範囲第 6 6項記載の電子文書処理装置。

6 8 . 上記音声合成器で読み上げるのに必要なタグ情報は、発音を示す属性情報を含むこと

を特徴とする請求の範囲第 6 6項記載の電子文書処理装置。

6 9 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、上記電子文書を記述する言語を示す属性情報を付与することで、上記音声読み上げデ一夕を生成すること

を特徴とする請求の範囲第 5 7項記載の電子文書処理装置。

7 0 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報を付与することで、上記音声読み上げデ一夕を生成すること

を特徴とする請求の範囲第 5 7項記載の電子文書処理装置。

7 1 . 上記音声読み上げデータ生成手段は、上記段落、文及び句の開始位置を示す属性情報のうちの、同種の統語構造を表す属性情報が、上記電子文書内に連続して現れる場合には、これらの連続する属性情報を 1つの属性情報に統合すること

を特徴とする請求の範囲第 7 0項記載の電子文書処理装置。

7 2 . 上記音声読み上げデ一夕生成手段は、上記電子文書に対して、上記段落、文及び句の開始位置を示す属性情報の直前に上記休止期間を設けることを示す属性情報を付与することで、上記音声読み上げデ一夕を生成すること

を特徴とする請求の範囲第 7 0項記載の電子文書処理装置。

7 3 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、読み上げが禁止されている部分を示す属性情報を付与することで、上記音声読み上げデータを生成すること

を特徴とする請求の範囲第 5 7項記載の電子文書処理装置。

7 4 . 上記音声読み上げデ一夕生成手段は、上記電子文書に対して、正確な読み又は発音を示す属性情報を付与することで、上記音声読み上げデータを生成すること

を特徴とする請求の範囲第 5 7項記載の電子文書処理装置。

7 5 . 上記音声読み上げデ一夕を用いて、音声合成器に適した処理を行う処理手段をさらに備え、

上記処理手段は、上記音声読み上げデ一夕に付与される読み上げの音量を示す属性情報に基づいて、読み上げの音量の絶対値を求めること

を特徴とする請求の範囲第 5 7項記載の電子文書処理装置。

7 6 . 上記音声読み上げデータを用いて、音声合成器に適した処理を行う処理手段をさらに備え、

上記処理手段は、上記音声読み上げデ一夕に付与される上記電子文書を記述する言語を示す属性情報に基づいて、音声合成器を選択すること

を特徴とする請求の範囲第 5 7項記載の電子文書処理装置。

7 7 . 上記音声読み上げデータに基づいて、上記電子文書を読み上げる文書読み上げ手段をさらに備えること

を特徴とする請求の範囲第 5 7項記載の電子文書処理装置。

7 8 . 上記文書読み上げ手段は、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報に基づいて、上記段落、文及び句の単位で頭出しを行うこと

を特徴とする請求の範囲第 7 7項記載の電子文書処理装置。

7 9 . 電子文書を処理する電子文書処理方法において、

上記電子文書の要約文を作成する要約文作成工程と、

上記電子文書を音声合成器で読み上げるための音声読み上げデー夕を生成する音声読み上げデータ生成工程とを備え、

上記音声読み上げデ一夕生成工程では、上記電子文書のうち、上記要約文に含まれる部分については、上記要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報が付与されることで、上記音声読み上げデータが生成されること

を特徴とする電子文書処理方法。

8 0 . 上記属性情報は、上記電子文書のうち、上記要約文に含まれる部分を読み上げる際の音量を、上記要約文に含まれない部分を読み上げる際の音量に比して増量させるための音量を示す属性情報を含むこと

を特徴とする請求の範囲第 7 9項記載の電子文書処理方法。 8 1 . 上記音量を示す属性情報は、標準の音量に対する増量分の百分率で表されること

を特徴とする請求の範囲第 8 0項記載の電子文書処理方法。 8 2 . 上記属性情報は、上記電子文書のうち、上記要約文に含まれる部分を読み上げる際にァクセントを強調するための属性情報を含むこと

を特徴とする請求の範囲第 7 9項記載の電子文書処理方法。

8 3 . 上記属性情報は、上記電子文書のうち、上記要約文に含まれる部分を読み上げる際の音声を、上記要約文に含まれない部分を読み上げる際の音声と異なる特徴を持たせるための属性情報を含むこと

を特徴とする請求の範囲第 7 9項記載の電子文書処理方法。

8 4 . 上記音声読み上げデ一夕生成工程では、上記電子文書に対して、上記音声合成器で読み上げるのに必要な夕グ情報が付与されること

を特徴とする請求の範囲第 7 9項記載の電子文書処理方法。

8 5 . 上記要約文作成工程では、

上記電子文書の要約文が表示される要約文表示領域の大きさが設定され、

設定された要約文表示領域の大きさに応じて、上記電子文書の要約文の長さが決定され、

決定された要約文の長さに基づいて、上記要約文表示領域内におさまる長さの要約文が作成されること

を特徴とする請求の範囲第 7 9項記載の電子文書処理方法。

8 6 . 上記電子文書は、複数の要素を有し階層化された構造を有する上記電子文書の内部構造を示すタグ情報が付与されていることを特徴とする請求の範囲第 7 9項記載の電子文書処理方法。

8 7 . 上記電子文書は、この電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されており、上記音声読み上げデータ生成工程では、これらの段落、文及び句を示すタグ情報に基づいて、上記電子文書を構成する段落、文及び句が識別されることを特徴とする請求の範囲第 8 6項記載の電子文書処理方法。 8 8 . 上記電子文書は、上記音声合成器で読み上げるのに必要な夕グ情報が付与されていること

を特徴とする請求の範囲第 8 6項記載の電子文書処理方法。

8 9 . 上記音声合成器で読み上げるのに必要なタグ情報は、読み上げを禁止するための属性情報を含むこと

を特徴とする請求の範囲第 8 8項記載の電子文書処理方法。

9 0 . 上記音声合成器で読み上げるのに必要なタグ情報は、発音を示す属性情報を含むこと

を特徴とする請求の範囲第 8 8項記載の電子文書処理方法。

9 1 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、上記電子文書を記述する言語を示す属性情報が付与されることで、上記音声読み上げデータが生成されること

を特徴とする請求の範囲第 7 9項記載の電子文書処理方法。

9 2 . 上記音声読み上げデ一夕生成工程では、上記電子文書に対して、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報が付与されることで、上記音声読み上げデ一夕が生成されること

を特徴とする請求の範囲第 7 9項記載の電子文書処理方法。

9 3 . 上記音声読み上げデータ生成工程では、上記段落、文及び句の開始位置を示す属性情報のうちの、同種の統語構造を表す属性情報が、上記電子文書内に連続して現れる場合には、これらの連続する属性情報が 1つの属性情報に統合されること

を特徴とする請求の範囲第 9 2項記載の電子文書処理方法。

9 4 . 上記音声読み上げデ一夕生成工程では、上記電子文書に対して、上記段落、文及び句の開始位置を示す属性情報の直前に上記休止期間を設けることを示す属性情報が付与されることで、上記音声読み上げデータが生成されること

を特徴とする請求の範囲第 9 2項記載の電子文書処理方法。 9 5 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、読み上げが禁止されている部分を示す属性情報が付与されることで、上記音声読み上げデ一夕が生成されること

を特徴とする請求の範囲第 7 9項記載の電子文書処理方法。 9 6 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、正確な読み又は発音を示す属性情報が付与されることで、上記音声読み上げデータが生成されること

を特徴とする請求の範囲第 7 9項記載の電子文書処理方法。

9 7 . 上記音声読み上げデータを用いて、音声合成器に適した処理を行う処理工程をさらに備え、

上記処理工程では、上記音声読み上げデータに付与される読み上げの音量を示す属性情報に基づいて、読み上げの音量の絶対値が求められること

を特徴とする請求の範囲第 7 9項記載の電子文書処理方法。

9 8 . 上記音声読み上げデータを用いて、音声合成器に適した処理を行う処理工程をさらに備え、

を特徴とする請求の範囲第 7 9項記載の電子文書処理方法。

9 9 . 上記音声読み上げデ一夕に基づいて、上記電子文書を読み上げる文書読み上げ工程をさらに備えること

を特徴とする請求の範囲第 7 9項記載の電子文書処理方法。 1 0 0 . 上記文書読み上げ工程では、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報に基づいて、上記段落、文及び句の単位で頭出しが行われること

を特徴とする請求の範囲第 9 9項記載の電子文書処理方法。 1 0 1 . 電子文書を処理するコンビユー夕制御可能な電子文書処理プログラムが記録された記録媒体において、

上記電子文書処理プログラムは、

上記電子文書の要約文を作成する要約文作成工程と、

上記音声読み上げデータ生成工程では、上記電子文書のうち、上記要約文に含まれる部分については、上記要約文に含まれない部分に比べ、強調して読み上げることを示す属性情報が付与されることで、上記音声読み上げデータが生成されること

を特徴とする電子文書処理プログラムが記録された記録媒体。 1 0 2 . 電子文書を処理する電子文書処理装置において、

上記電子文書の要約文を作成する要約文作成手段と、

上記電子文書のうち、上記要約文に含まれる部分については、上記要約文に含まれない部分に比べ、強調して読み上げる文書読み上げ手段とを備えること

を特徴とする電子文書処理装置。

1 0 3 . 上記文書読み上げ手段は、上記電子文書のうち、上記要約文に含まれる部分を読み上げる際の音量を、上記要約文に含まれない部分を読み上げる際の音量に比して増量させて、上記電子文書を読み上げること

を特徴とする請求の範囲第 1 0 2項記載の電子文書処理装置。 1 0 4 . 上記文書読み上げ手段は、上記電子文書のうち、上記要約文に含まれる部分を読み上げる際にァクセントを強調して、上記電子文書を読み上げること

を特徴とする請求の範囲第 1 0 2項記載の電子文書処理装置。 1 0 5 . 上記文書読み上げ手段は、上記電子文書のうち、上記要約文に含まれる部分を読み上げる際の音声を、上記要約文に含まれない部分を読み上げる際の音声と異なる特徴を持たせて、上記電子文書を読み上げること

を特徴とする請求の範囲第 1 0 2項記載の電子文書処理装置。 1 0 6 . 上記要約文作成手段は、

を特徴とする請求の範囲第 1 0 2項記載の電子文書処理装置。 1 0 7 . 複数の要素を有し階層化された構造を有する上記電子文書の内部構造を示す夕グ情報が付与されている当該電子文書が入力される文書入力手段をさらに備えること

を特徴とする請求の範囲第 1 0 2項記載の電子文書処理装置。 1 0 8 . 上記文書入力手段には、上記電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されている電子文書が入力され、

上記文書読み上げ手段は、これらの段落、文及び句を示すタグ情報に基づいて、上記段落、文及び句の開始位置に休止期間を設けて上記電子文書を読み上げること

を特徴とする請求の範囲第 107項記載の電子文書処理装置。 109. 上記電子文書は、この電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されており、上記文書読み上げ手段は、これらの段落、文及び句を示すタグ情報に基づいて、上記電子文書を構成する段落、文及び句を識別すること

を特徴とする請求の範囲第 107項記載の電子文書処理装置。

1 10. 上記電子文書は、上記文書読み上げ手段で読み上げるのに必要なタグ情報が付与されていること

を特徴とする請求の範囲第 107項記載の電子文書処理装置。

1 1 1. 上記文書読み上げ手段で読み上げるのに必要なタグ情報は、読み上げを禁止するための属性情報を含むこと

を特徴とする請求の範囲第 1 10項記載の電子文書処理装置。

1 12. 上記文書読み上げ手段で読み上げるのに必要なタグ情報は、発音を示す属性情報を含むこと

1 13. 上記文書読み上げ手段は、上記電子文書のうち、読み上げが禁止されている部分を除去して、上記電子文書を読み上げることを特徴とする請求の範囲第 102項記載の電子文書処理装置。

1 14. 上記文書読み上げ手段は、正確な読み又は発音に置換して上記電子文書を読み上げること

を特徴とする請求の範囲第 1 0 2項記載の電子文書処理装置。

1 1 5 . 上記文書読み上げ手段は、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報に基づいて、上記段落、文及び句の単位で頭出しを行うこと

を特徴とする請求の範囲第 1 0 7項記載の電子文書処理装置。

1 1 6 . 電子文書を処理する電子文書処理方法において、

上記電子文書の要約文を作成する要約文作成工程と、

上記電子文書のうち、上記要約文に含まれる部分については、上記要約文に含まれない部分に比べ、強調して読み上げる文書読み上げ工程とを備えること

を特徴とする電子文書処理方法。

1 1 7 . 上記文書読み上げ工程では、上記電子文書のうち、上記要約文に含まれる部分を読み上げる際の音量を、上記要約文に含まれない部分を読み上げる際の音量に比して増量させられて、上記電子文書が読み上げられること

を特徴とする請求の範囲第 1 1 6項記載の電子文書処理方法。

1 1 8 . 上記文書読み上げ工程では、上記電子文書のうち、上記要約文に含まれる部分を読み上げる際にァクセン卜が強調されて、上記電子文書が読み上げられること

1 1 9 . 上記文書読み上げ工程では、上記電子文書のうち、上記要約文に含まれる部分を読み上げる際の音声を、上記要約文に含まれない部分を読み上げる際の音声と異なる特徴を持たせられて、上記電子文書が読み上げられることを特徴とする請求の範囲第 1 1 6項記載の電子文書処理方法。 1 2 0 . 上記要約文作成工程では、

を特徴とする請求の範囲第 1 1 6項記載の電子文書処理方法。 1 2 1 . 複数の要素を有し階層化された構造を有する上記電子文書の内部構造を示すタグ情報が付与されている当該電子文書が入力される文書入力工程をさらに備えること

を特徴とする請求の範囲第 1 1 6項記載の電子文書処理方法。 1 2 2 . 上記文書入力工程では、上記電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されている電子文書が入力され、

を特徴とする請求の範囲第 1 2 1項記載の電子文書処理方法。 1 2 3 . 上記電子文書は、この電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されており、上記文書読み上げ工程では、これらの段落、文及び句を示すタグ情報に基づいて、上記電子文書を構成する段落、文及び句が識別されることを特徴とする請求の範囲第 1 2 1項記載の電子文書処理方法。 1 2 4 . 上記電子文書は、上記文書読み上げ工程にて読み上げられるのに必要なタグ情報が付与されていること

を特徴とする請求の範囲第 1 2 1項記載の電子文書処理方法。 1 2 5 . 上記文書読み上げ工程にて読み上げられるのに必要なタグ情報は、読み上げを禁止するための属性情報を含むこと

を特徴とする請求の範囲第 1 2 4項記載の電子文書処理方法。 1 2 6 . 上記文書読み上げ工程にて読み上げられるのに必要なタグ情報は、発音を示す属性情報を含むこと

を特徴とする請求の範囲第 1 2 4項記載の電子文書処理方法。 1 2 7 . 上記文書読み上げ工程では、上記電子文書のうち、読み上げが禁止されている部分が除去されて、上記電子文書が読み上げられること

を特徴とする請求の範囲第 1 1 6項記載の電子文書処理方法。 1 2 8 . 上記文書読み上げ工程では、正確な読み又は発音に置換されて上記電子文書が読み上げられること

1 2 9 . 上記文書読み上げ工程では、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報に基づいて、上記段落、文及び句の単位で頭出しが行われること

を特徴とする請求の範囲第 1 2 1項記載の電子文書処理方法。

1 3 0 . 電子文書を処理するコンビユー夕制御可能な電子文書処理プログラムが記録された記録媒体において、

上記電子文書処理プログラムは、

上記電子文書の要約文を作成する要約文作成工程と、上記電子文書のうち、上記要約文に含まれる部分については、上記要約文に含まれない部分に比べ、強調して読み上げる文書読み上げ工程とを備えること

1 3 1 . 電子文書を処理する電子文書処理装置において、

上記電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2つの開始位置を検出する検出手段と、

上記検出手段により得られた検出結果に基づいて、上記電子文書に対して、上記段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性情報を付与することで、音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデータ生成手段とを備えること

を特徴とする電子文書処理装置。

1 3 2 . 上記休止期間は、段落の開始位置に設けられるものが最も長く、文の開始位置及び句の開始位置の順序で短くなることを特徴とする請求の範囲第 1 3 1項記載の電子文書処理装置。 1 3 3 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、上記音声合成器で読み上げるのに必要なタグ情報を付与すること

を特徴とする請求の範囲第 1 3 1項記載の電子文書処理装置。 1 3 4 . 上記電子文書は、複数の要素を有し階層化された構造を有する上記電子文書の内部構造を示すタグ情報が付与されていることを特徴とする請求の範囲第 1 3 1項記載の電子文書処理装置。 1 3 5 . 上記電子文書は、この電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されており、上記検出手段は、これらの段落、文及び句を示すタグ情報に基づいて、上記電子文書を構成する段落、文及び句を検出することを特徴とする請求の範囲第 1 3 4項記載の電子文書処理装置。 1 3 6 . 上記電子文書は、上記音声合成器で読み上げるのに必要な夕グ情報が付与されていること

を特徴とする請求の範囲第 1 3 4項記載の電子文書処理装置。 1 3 7 . 上記音声合成器で読み上げるのに必要なタグ情報は、読み上げを禁止するための属性情報を含むこと

を特徴とする請求の範囲第 1 3 6項記載の電子文書処理装置。 1 3 8 . 上記音声合成器で読み上げるのに必要なタグ情報は、発音を示す属性情報を含むこと

を特徴とする請求の範囲第 1 3 6項記載の電子文書処理装置。

1 3 9 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、上記電子文書を記述する言語を示す属性情報を付与することで、上記音声読み上げデータを生成すること

を特徴とする請求の範囲第 1 3 1項記載の電子文書処理装置。

1 4 0 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報を付与することで、上記音声読み上げデ一夕を生成すること

を特徴とする請求の範囲第 1 3 1項記載の電子文書処理装置。 1 4 1 . 上記音声読み上げデータ生成手段は、上記段落、文及び句の開始位置を示す属性情報のうちの、同種の統語構造を表す属性情報が、上記電子文書内に連続して現れる場合には、これらの連続する属性情報を 1つの属性情報に統合することを特徴とする請求の範囲第 1 4 0項記載の電子文書処理装置。 1 4 2 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、上記段落、文及び句の開始位置を示す属性情報の直前に上記休止期間を設けることを示す属性情報を付与することで、上記音声読み上げデータを生成すること

を特徴とする請求の範囲第 1 4 0項記載の電子文書処理装置。 1 4 3 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、読み上げが禁止されている部分を示す属性情報を付与することで、上記音声読み上げデータを生成すること

を特徴とする請求の範囲第 1 3 1項記載の電子文書処理装置。 1 4 4 . 上記音声読み上げデ一夕生成手段は、上記電子文書に対して、正確な読み又は発音を示す属性情報を付与することで、上記音声読み上げデータを生成すること

を特徴とする請求の範囲第 1 3 1項記載の電子文書処理装置。 1 4 5 . 上記音声読み上げデータ生成手段は、上記電子文書に対して、読み上げの音量を示す属性情報を付与することで、上記音声読み上げデ一夕を生成すること

を特徴とする請求の範囲第 1 3 1項記載の電子文書処理装置。 1 4 6 . 上記音声読み上げデ一夕を用いて、音声合成器に適した処理を行う処理手段をさらに備え、

を特徴とする請求の範囲第 1 3 1項記載の電子文書処理装置。 1 4 7 . 上記音声読み上げデータを用いて、音声合成器に適した処理を行う処理手段をさらに備え、

を特徴とする請求の範囲第 1 3 1項記載の電子文書処理装置。 1 4 8 . 上記音声読み上げデ一夕に基づいて、上記電子文書を読み上げる文書読み上げ手段をさらに備えること

1 4 9 . 上記文書読み上げ手段は、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報に基づいて、上記段落、文及び句の単位で頭出しを行うこと

を特徴とする請求の範囲第 1 4 8項記載の電子文書処理装置。

1 5 0 . 電子文書を処理する電子文書処理方法において、

上記電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2つの開始位置を検出する検出工程と、

上記検出工程にて得られた検出結果に基づいて、上記電子文書に対して、上記段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性情報を付与されることで、音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデ一夕生成工程とを備えること

を特徴とする電子文書処理方法。

1 5 1 . 上記休止期間は、段落の開始位置に設けられるものが最も長く、文の開始位置及び句の開始位置の順序で短くなること

を特徴とする請求の範囲第 1 5 0項記載の電子文書処理方法。 1 5 2 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、上記音声合成器で読み上げるのに必要なタグ倩報が付与されること

を特徴とする請求の範囲第 1 5 0項記載の電子文書処理方法。 1 5 3 . 上記電子文書は、複数の要素を有し階層化された構造を有する上記電子文書の内部構造を示すタグ情報が付与されていることを特徴とする請求の範囲第 1 5 0項記載の電子文書処理方法。 1 5 4 . 上記電子文書は、この電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されており、上記検出工程では、これらの段落、文及び句を示すタグ情報に基づいて、上記電子文書を構成する段落、文及び句が検出されることを特徴とする請求の範囲第 1 5 3項記載の電子文書処理方法。 1 5 5 . 上記電子文書は、上記音声合成器で読み上げるのに必要な夕グ情報が付与されていること

を特徴とする請求の範囲第 1 5 3項記載の電子文書処理方法。 1 5 6 . 上記音声合成器で読み上げるのに必要なタグ情報は、読み上げを禁止するための属性情報を含むこと

を特徴とする請求の範囲第 1 5 5項記載の電子文書処理方法。 1 5 7 . 上記音声合成器で読み上げるのに必要なタグ情報は、発音を示す属性情報を含むこと

を特徴とする請求の範囲第 1 5 5項記載の電子文書処理方法。 1 5 8 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、上記電子文書を記述する言語を示す属性情報が付与されることで、上記音声読み上げデータが生成されること

を特徴とする請求の範囲第 1 5 0項記載の電子文書処理方法。 1 5 9 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報が付与されることで、上記音声読み上げデータが生成されること

を特徴とする請求の範囲第 1 5 0項記載の電子文書処理方法。 1 6 0 . 上記音声読み上げデータ生成工程では、上記段落、文及び句の開始位置を示す属性情報のうちの、同種の統語構造を表す属性情報が、上記電子文書内に連続して現れる場合には、これらの連続する属性情報が 1つの属性情報に統合されること

を特徴とする請求の範囲第 1 5 9項記載の電子文書処理方法。 1 6 1 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、上記段落、文及び句の開始位置を示す属性情報の直前に上記休止期間を設けることを示す属性情報が付与されることで、上記音声読み上げデ一夕が生成されること

を特徴とする請求の範囲第 1 5 9項記載の電子文書処理方法。 1 6 2 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、読み上げが禁止されている部分を示す属性情報が付与されることで、上記音声読み上げデータが生成されること

を特徴とする請求の範囲第 1 5 0項記載の電子文書処理方法。 1 6 3 . 上記音声読み上げデータ生成工程では、上記電子文書に対して、正確な読み又は発音を示す属性情報が付与されることで、上記音声読み上げデータが生成されること

を特徴とする請求の範囲第 1 5 0項記載の電子文書処理方法。 1 6 4 . 上記音声読み上げデ一夕生成工程では、上記電子文書に対して、読み上げの音量を示す属性情報が付与されることで、上記音声読み上げデータが生成されることを特徴とする請求の範囲第 1 5 0項記載の電子文書処理方法。 1 6 5 . 上記音声読み上げデ一夕を用いて、音声合成器に適した処理を行う処理工程をさらに備え、

を特徴とする請求の範囲第 1 5 0項記載の電子文書処理方法。 1 6 6 . 上記音声読み上げデータを用いて、音声合成器に適した処理を行う処理工程をさらに備え、

を特徴とする請求の範囲第 1 5 0項記載の電子文書処理方法。 1 6 7 . 上記音声読み上げデータに基づいて、上記電子文書を読み上げる文書読み上げ工程をさらに備えること

を特徴とする請求の範囲第 1 5 0項記載の電子文書処理方法。 1 6 8 . 上記文書読み上げ工程では、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報に基づいて、上記段落、文及び句の単位で頭出しが行われること

を特徴とする請求の範囲第 1 6 7項記載の電子文書処理方法。 1 6 9 . 電子文書を処理するコンピュータ制御可能な電子文書処理プログラムが記録された記録媒体において、

上記電子文書処理プログラムは、

上記電子文書を構成する複数の要素の中から、段落、文及び句のうちの少なくとも 2つの開始位置を検出する検出工程と、上記検出工程にて得られた検出結果に基づいて、上記電子文書に対して、上記段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けることを示す属性情報を付与されることで、音声合成器で読み上げるための音声読み上げデータを生成する音声読み上げデータ生成工程とを備えること

を特徴とする電子文書処理プログラムが記録された記録媒体。 1 0 . 電子文書を処理する電子文書処理装置において、

上記検出手段により得られた検出結果に基づいて、上記段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けて上記電子文書を音声合成して読み上げる文書読み上げ手段とを備えること

を特徴とする電子文書処理装置。

1 7 1 . 上記休止期間は、段落の開始位置に設けられるものが最も長く、文の開始位置及び句の開始位置の順序で短くなることを特徴とする請求の範囲第 1 7 0項記載の電子文書処理装置。 1 7 2 . 複数の要素を有し階層化された構造を有する上記電子文書の内部構造を示す夕グ情報が付与されている当該電子文書が入力される文書入力手段をさらに備えること

を特徴とする請求の範囲第 1 7 0項記載の電子文書処理装置。 1 7 3 . 上記電子文書は、この電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されており、上記検出手段は、これらの段落、文及び句を示すタグ情報に基づいて、上記電子文書を構成する段落、文及び句を検出することを特徴とする請求の範囲第 1 7 2項記載の電子文書処理装置。 1 7 4 . 上記電子文書は、上記文書読み上げ手段で読み上げるのに必要なタグ情報が付与されていること

を特徴とする請求の範囲第 1 7 2項記載の電子文書処理装置。 1 7 5 . 上記文書読み上げ手段で読み上げるのに必要なタグ情報は、読み上げを禁止するための属性情報を含むこと

を特徴とする請求の範囲第 1 7 4項記載の電子文書処理装置。 1 7 6 . 上記文書読み上げ手段で読み上げるのに必要なタグ情報は、発音を示す属性情報を含むこと

を特徴とする請求の範囲第 1 7 4項記載の電子文書処理装置。 1 7 7 . 上記文書読み上げ手段は、上記電子文書のうち、読み上げが禁止されている部分を除去して、上記電子文書を読み上げることを特徴とする請求の範囲第 1 7 0項記載の電子文書処理装置。 1 7 8 . 上記文書読み上げ手段は、正確な読み又は発音に置換して上記電子文書を読み上げること

を特徴とする請求の範囲第 1 7 0項記載の電子文書処理装置。

1 9 . 上記文書読み上げ手段は、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報に基づいて、上記段落、文及び句の単位で頭出しを行うこと

を特徴とする請求の範囲第 1 7 2項記載の電子文書処理装置。

1 8 0 . 電子文書を処理する電子文書処理方法において、

上記検出工程にて得られた検出結果に基づいて、上記段落、文及び句のうちの少なくとも 2つの開始位置に互いに異なる休止期間を設けて上記電子文書を音声合成して読み上げる文書読み上げ工程とを備えること

を特徴とする電子文書処理方法。

1 8 1 . 上記休止期間は、段落の開始位置に設けられるものが最も長く、文の開始位置及び句の開始位置の順序で短くなることを特徴とする請求の範囲第 1 8 0項記載の電子文書処理方法。 1 8 2 . 複数の要素を有し階層化された構造を有する上記電子文書の内部構造を示すタグ情報が付与されている当該電子文書が入力される文書入力工程をさらに備えること

を特徴とする請求の範囲第 1 8 0項記載の電子文書処理方法。 1 8 3 . 上記電子文書は、この電子文書を構成する複数の要素のうち、少なくとも段落、文及び句を示すタグ情報が付与されており、上記検出工程では、これらの段落、文及び句を示すタグ情報に基づいて、上記電子文書を構成する段落、文及び句が検出されることを特徴とする請求の範囲第 1 8 2項記載の電子文書処理方法。 1 8 4 . 上記電子文書は、上記文書読み上げ工程にて読み上げられるのに必要なタグ情報が付与されていること

を特徴とする請求の範囲第 1 8 2項記載の電子文書処理方法。 1 8 5 . 上記文書読み上げ工程にて読み上げられるのに必要なタグ情報は、読み上げを禁止するための属性情報を含むこと

を特徴とする請求の範囲第 1 8 4項記載の電子文書処理方法。 1 8 6 . 上記文書読み上げ工程にて読み上げられるのに必要なタグ情報は、発音を示す属性情報を含むこと

を特徴とする請求の範囲第 1 8 4項記載の電子文書処理方法。 1 8 7 . 上記文書読み上げ工程では、上記電子文書のうち、読み上げが禁止されている部分が除去されて、上記電子文書が読み上げられること

を特徴とする請求の範囲第 1 8 0項記載の電子文書処理方法。 1 8 8 . 上記文書読み上げ工程では、正確な読み又は発音に置換されて上記電子文書が読み上げられること

を特徴とする請求の範囲第 1 8 0項記載の電子文書処理方法。

1 8 9 . 上記文書読み上げ工程では、上記電子文書を構成する複数の要素のうち、段落、文及び句の開始位置を示す属性情報に基づいて、上記段落、文及び句の単位で頭出しが行われること

を特徴とする請求の範囲第 1 8 2項記載の電子文書処理方法。

1 9 0 . 電子文書を処理するコンピュータ制御可能な電子文書処理プログラムが記録された記録媒体において、

上記電子文書処理プログラムは、