JP2001109762A - 文書処理方法及び装置並びに記録媒体 - Google Patents

文書処理方法及び装置並びに記録媒体

Info

Publication number
JP2001109762A
JP2001109762A JP28595699A JP28595699A JP2001109762A JP 2001109762 A JP2001109762 A JP 2001109762A JP 28595699 A JP28595699 A JP 28595699A JP 28595699 A JP28595699 A JP 28595699A JP 2001109762 A JP2001109762 A JP 2001109762A
Authority
JP
Japan
Prior art keywords
document
elements
list
title
document processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP28595699A
Other languages
English (en)
Inventor
Katashi Nagao
確 長尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP28595699A priority Critical patent/JP2001109762A/ja
Publication of JP2001109762A publication Critical patent/JP2001109762A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 与えられた電子文書に基づいて、プレゼンテ
ーション用等のスライドを自動作成する。 【解決手段】 ステップS71で文書中の見出し及び図
への参照を含むタイトルエレメントを抽出し、ステップ
S73,S75で、抽出したタイトルエレメントの参照
エレメントと被参照エレメントのリストRList(si)を含
むリストRListiを作成し、ステップS76で上記タイ
トルエレメントに基づくスライドタイトルを決定し、ス
テップS77で、上記作成されたリストRListi 内の要
素を含む文を生成し、その文の出現順に箇条書きすると
共に、上記タイトルエレメントが図への参照文のときは
その図を追加してスライドを生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電子文書を処理す
る文書処理方法及び装置並びに電子文書を処理する文書
処理プログラムが記録された記録媒体に関する。
【0002】
【従来の技術】従来、インターネットにおいて、ウィン
ドウ形式でハイパーテキスト型情報を提供するアプリケ
ーションサービスとしてWWW(World Wide Web)が知
られている。
【0003】WWWは、文書の作成、公開又は共有化の
文書処理を実行し、新しいスタイルの文書の在り方を示
したシステムである。しかし、文書の実際上の利用の観
点からは、文書の内容に基づいた文書の分類や要約とい
った、WWWを越える高度な文書処理が求められてい
る。このような高度な文書処理には、文書の内容の機械
的な処理が不可欠である。
【0004】しかしながら、文書の内容の機械的な処理
は、以下のような理由から依然として困難である。すな
わち、第1に、ハイパーテキストを記述する言語である
HTML(Hyper Text Markup Language)は、文書の表
現については規定するが、文書の内容についてはほとん
ど規定しない点、第2に、文書間に構成されたハイパー
テキストのネットワークは、文書の読者にとって文書の
内容を理解するために必ずしも利用しやすいものではな
い点、第3に、一般に文章の著作者は読者の便宜を念頭
に置かずに著作するが、文書の読者の便宜が著作者の便
宜と調整されることはない点が、文書の機械的処理を困
難とする理由である。
【0005】このように、WWWは新しい文書の在り方
を示したシステムであるが、文書を機械的に処理しない
ので、高度な文書処理を行うことができなかった。換言
すると、高度な文書処理を実行するためには、文書を機
械的に処理することが必要となる。
【0006】そこで、文書の機械的な処理を目標とし
て、文書の機械的な処理を支援するシステムが自然言語
研究の成果に基づいて開発されている。自然言語研究に
よる文書処理として、文書の著作者等による文書の内部
構造についての属性情報、いわゆるタグの付与を前提と
した、文書に付与されたタグを利用する機械的な文書処
理が提案されている。
【0007】
【発明が解決しようとする課題】ところで、近年のコン
ピュータの普及や、ネットワーク化の進展に伴い、高機
能の文書処理の自動化が求められている。例えば、ユー
ザの要望に応じて、自動的に文書の要約や、文書の分類
等を行ったり、プレゼンテーション等のためのスライド
を自動作成すること等が望まれる。
【0008】本発明は、このような実情に鑑みて提案さ
れたものであり、入力された文書に基づいて、プレゼン
テーション等のためのスライドを自動生成し得るような
文書処理方法及び装置、並びに文書処理プログラムが記
録されてなる記録媒体を提供することを目的とする。
【0009】
【課題を解決するための手段】上述の課題を解決するた
めに、本発明は、電子文書の形態の文書を処理する文書
処理方法及び装置において、上記文書中の見出し及び図
への参照を含むタイトルエレメントを抽出し、抽出した
タイトルエレメントの参照エレメントと被参照エレメン
トを含むリストを作成し、上記タイトルエレメントに基
づくスライドタイトルを作成し、上記作成されたリスト
内の要素を含む文を生成し、その文の出現順に箇条書き
すると共に、上記タイトルエレメントが図への参照文の
ときはその図を追加してスライドを生成することを特徴
としている。
【0010】ここで、上記文書は、複数のエレメントが
階層化された内部構造を有し、上記内部構造を示すタグ
情報が予め付与されていることが好ましく、上記タグ情
報には、上記複数のエレメントの間の参照、被参照の関
係を示す属性情報を含むことが好ましい。
【0011】また上記タイトルエレメント抽出の際に
は、上記タグ情報に基づいて活性拡散を行い、活性値の
高いエレメントの内の名詞句を抽出してタイトルエレメ
ントとし、上記スライドタイトル作成の際には、上記タ
イトルエレメントとなる名詞句の主語をスライドタイト
ルとすることが好ましい。
【0012】これによって、入力された文書から自動的
にスライドを作成できる。
【0013】
【発明の実施の形態】以下、図面を参照して、本発明に
係る文書処理方法及び装置並びに文書処理プログラムが
記録された記録媒体の実施の形態について説明する。
【0014】本発明の実施の形態としての文書処理装置
は、図1に示すように、制御部11及びインターフェー
ス12を備える本体10と、ユーザからの入力を受けて
本体10に送る入力部20と、外部からの信号を受信し
て本体10に送る通信部22と、本体10からの出力を
表示する表示部30と、記録媒体32に対して情報を記
録/再生する記録/再生部31とを有している。
【0015】本体10は、制御部11及びインターフェ
ース12を有し、この文書処理装置の主要な部分を構成
している。制御部11は、この文書処理装置における処
理を実行するCPU13と、揮発性のメモリであるRA
M14と、不揮発性のメモリであるROM15とを有し
ている。CPU13は、例えばROM15に記録された
プログラムの手順にしたがって各処理を実行するための
制御を行う。RAM14には、CPU13が各種の処理
を実行する上で必要なプログラムやデータが一時的に格
納される。インターフェース12は、制御部11、入力
部20、通信部22、表示部30及び記録/再生部31
に接続されている。このインターフェース12は、制御
部11の制御の下に、入力部20及び通信部22からの
データの入力、表示部30へのデータの送信、記録/再
生部31に対するデータの送受信について、データを送
信するタイミングを調整したり、データの形式を変換し
たりする。
【0016】入力部20は、この文書処理装置に対する
ユーザの入力を受ける部分であり、例えばキーボードや
マウスにより構成される。ユーザは、この入力部20を
用い、キーボードによりキーワードを入力したり、マウ
スにより表示部30に表示されている電子文書のエレメ
ントを選択して入力したりすることができる。なお、以
下では電子文書を単に文書と称することにする。ここ
で、エレメントとは文書を構成する要素であって、例え
ば文、句及び語が含まれる。
【0017】通信部22は、この文書処理装置に外部か
ら通信路、例えば電話回線を介して送信される信号を受
信する部分である。具体的には、通信部22は、例え
ば、モデム、ターミナルアダプタ等により構成され、電
話回線を介してインターネット23に接続され、インタ
ーネットに接続されているサーバ24にアクセスし、そ
こから文書等のデータを受信することができるようにさ
れている。このような通信部22は、外部から送信され
た複数の文書等のデータを受信し、受信したデータを本
体10に送る。
【0018】表示部30は、この文書処理装置からの文
字や画像情報の出力を表示する。表示部30は、例えば
陰極線管(cathode ray tube;CRT)や液晶表示装置(li
quidcrystal display;LCD)から構成され、例えば単数
又は複数のウィンドウを表示したり、文字、図形、又は
画像等を表示したりする。
【0019】記録/再生部31は、例えばフロッピー
(登録商標)ディスク、光ディスク、光磁気ディスクの
ような着脱可能な記録媒体32に対してデータの記録及
び/又は再生を行う。記録媒体32には、文書を処理す
る文書処理プログラムが記録されている。この記録媒体
32には、文書を処理するための電子文書処理プログラ
ムや処理対象とする文書が記録されている。
【0020】ハードディスクドライブ33は、大容量の
磁気記録媒体であるハードディスクに対してデータの記
録及び/又は再生を行う。
【0021】このような文書処理装置は、以下のように
して所望の文書を受信し、表示部30に表示する。
【0022】文書処理装置においては、まずユーザが入
力部20を操作してインターネット23を介して通信を
行うためのプログラムを起動し、サーバ24(サーチエ
ンジン)のURL(Uniform Resource Locator)を入力
すると、制御部11は、通信部22を制御し、サーバ2
4にアクセスする。
【0023】これに応じて、サーバ24は、インターネ
ット23を介して、文書処理装置の通信部22に検索画
面のデータを出力する。文書処理装置においてCPU1
3は、このデータをインターフェース12を介して表示
部30に出力し、表示させる。
【0024】文書処理装置においては、ユーザが入力部
20を用いてこの検索画面上でキーワード等を入力して
検索を指令すると、通信部22からインターネット23
を介して、サーチエンジンとしてのサーバ24に対して
検索命令が送信される。
【0025】サーバ24は、検索命令を受信すると、こ
の検索命令を実行し、得られた検索結果をインターネッ
ト23を介して通信部22に送信する。文書処理装置に
おいて制御部11は、通信部22を制御し、サーバ24
から送信される検索結果を受信させ、その一部を表示部
30に表示させる。
【0026】具体的には、ユーザが入力部20を用いて
例えば「TCP」というキーワードを入力して検索を指
令した場合には、文書処理装置には、サーバ24から
「TCP」のキーワードを含む各種情報が送信され、表
示部30に表示される。
【0027】続いて、本実施の形態における文書につい
て説明する。本実施の形態においては、文書処理は、文
書に付与された属性情報であるタグを参照して行われ
る。本実施の形態で用いられるタグには、文書の構造を
示す統語論的(syntactic)タグと、多言語間で文書の
機械的な内容理解を可能にするような意味的(semanti
c)・語用論的タグとがある。
【0028】統語論的なタグとしては、文書の内部構造
を記述するものがある。タグ付けによる内部構造は、図
2に示すように、文書、文、語彙エレメント等の各エレ
メントが、通常リンク、参照・被参照リンクにより関連
付けられて構成されている。図中において、白丸“○”
はエレメントを示し、最下位の白丸は文書における最小
レベルの語に対応する語彙エレメントである。また、実
線は文書、文、語彙エレメント等のエレメント間のつな
がり示す通常リンク(normal link) である。破線は参
照・被参照による係り受け関係を示す参照リンク(refe
rence link)である。文書の内部構造は、上位から下位
への順序で、文書(document)、サブディビジョン(su
bdivision) 、段落(paragraph)、文(sentence) 、
サブセンテンシャルセグメント(subsentential segmen
t) 、・・・、語彙エレメントから構成される。これら
のうち、サブディビジョンと段落とは、例えばオプショ
ンとして用いられるものである。
【0029】一方、意味論・語用論的なタグ付けとして
は、係り受け、例えば代名詞の指示対象等を示す統語構
造(syntactic structure) に関するタグ付けや多義語
の意味のように意味(semantic)の情報を記述するもの
がある。本実施の形態におけるタグ付けは、HTML
(Hyper Text Markup Language)と同様なXML(eXte
nsible Markup Language)の形式によるものである。
【0030】以下にタグ付けされた文や文書の例を示す
が、文書へのタグ付けはこの方法に限定されるものでは
ない。また、以下では英語と日本語の文書の例を示す
が、タグ付けによる内部構造の記述は、他の言語にも同
様に適用することができることは勿論である。
【0031】例えば、“Time flies like an arrow.”
という文については、下記のようなタグ付けをすること
ができる。
【0032】 <文><名詞句 語義=“time0”>time</名詞句> <動詞句><動詞 語義=“fly1”>flies</動詞> <形容動詞句><形容動詞 語義=“like0”>like<
/形容動詞> <名詞句>an<名詞 語義=“arrow0”>arrow</名
詞></名詞句> </形容動詞句></動詞句>.</文> ここで<文>、<名詞>、<名詞句>、<動詞>、<動
詞句>、<形容動詞>、<形容動詞句>は、それぞれ
文、名詞、名詞句、動詞、動詞句、形容詞を含む前置詞
句又は後置詞句/形容詞句、形容詞句/形容動詞句のよ
うな文の統語構造(syntactic structure) を表してい
る。タグは、エレメントの先端の直前及び終端の直後に
対応して配置される。エレメントの終端の直後に配置さ
れるタグは、記号“/”によりエレメントの終端である
ことを示している。エレメントは統語的構成素、すなわ
ち句、節、及び文を示す。なお、語義(word sense)=
“time0”は、語“time”の有する複数の意味、すなわ
ち複数の語義のうちの第0番目の意味を指している。具
体的には、語“time”には少なくとも名詞、形容詞、動
詞の意味があるが、ここでは語“time”が名詞であるこ
とを示している。同様に、語“オレンジ”は少なくとも
植物の名前、色、果物の意味があるが、これらも語義に
よって区別することができる。
【0033】本実施の形態に用いられる文書は、図3に
示すように、上記図1の表示部30のウィンドウ101
に統語構造を表示することができる。このウィンドウ1
01においては、右半面103に語彙エレメントが、左
半面102に文の内部構造がそれぞれ表示されている。
このウィンドウ101においては、日本語で記述された
文書のみならず、英語等の任意の言語で記述された文書
についても、統語構造を表示することができる。
【0034】このウィンドウ101には、一例として、
タグ付けにより内部構造を記述された次に示すような文
書「A氏のB会が終わったC市で、一部の大衆紙と一般
紙がその写真報道を自主規制する方針を紙面で明らかに
した。」の一部が表示されている。この文書のタグ付け
の例を次に示す。
【0035】 <文書><文><形容動詞句 関係=“位置”><名詞句><形容動詞句 場所 =“C市”> <形容動詞句 関係=“主語”><名詞句 識別子=“B会”><形容動詞句 関係=“所属”><人名 識別子=“A氏”>A氏</人名>の</形容動詞句 ><組織名 識別子=“B会”>B会</組織名></名詞句>が</形容動詞 句> 終わった</形容動詞句><地名 識別子=“C市”>C市</地名></名詞 句>で、</形容動詞句><形容動詞句 関係=“主語”><名詞句 識別子= “press” 統語=“並列”><名詞句><形容動詞句>一部の</形容動詞句 >大衆紙</名詞句>と<名詞>一般紙</名詞></名詞句>が</形容動詞 句> <形容動詞句 関係=“目的語”><形容動詞句 関係=“内容” 主語=“pr ess”><形容動詞句 関係=“目的語”><名詞句><形容動詞句><名詞 共参照=“B会”>そ</名詞>の</形容動詞句>写真報道</名詞句>を< /形容動詞句> 自主規制する</形容動詞句>方針を</形容動詞句> <形容動詞句 関係=“位置”>紙面で</形容動詞句> 明らかにした。</文></文書> この文書においては、「一部の大衆紙と一般紙」は、統
語=“並列”というタグにより並列であることが表され
ている。並列の定義は、係り受け関係を共有すると言う
ことである。特に何も指定がない場合は、例えば、<名
詞句 関係=x><名詞>A</名詞><名詞>B</
名詞></名詞句> はAがBに依存関係のあることを
表す。関係=xは関係属性を表す。
【0036】関係属性は、統語、意味、修辞についての
相互関係を記述する。主語、目的語、間接目的語のよう
な文法機能、動作主、被動作者、受益者などのような主
題役割、及び理由、結果などのような修辞関係はこの関
係属性により記述される。本実施の形態では、主語、目
的語、間接目的語のような比較的容易な文法機能につい
て関係属性を記述する。
【0037】また、この文書においては、“A氏”、
“B会”、“C市”のような固有名詞について、地名、
人名、組織名等のタグにより属性が記述されている。こ
れら地名、人名、組織名等のタグが付与される語は固有
名詞である。
【0038】以下、本発明に係る実施の形態の文書処理
装置の具体的な動作について説明する。本実施の形態の
文書処理装置は、上述したようなタグ付けされた文書に
対して、自動要約処理やスライド作成処理を行わせるも
のである。ここで、いわゆるプレゼンテーション用等の
スライドの自動作成処理に先立って、文書の自動要約処
理について説明する。
【0039】文書処理装置において文書の要約文を作成
する場合には、その文書が図1の表示部30に文書が表
示されている状態で、ユーザが入力部20を操作し、自
動要約モードに切り換える。制御部11は、この自動要
約モードに切り換えられたとき、図4に示すような自動
要約文作成プログラムの初期画面を表示して、ユーザに
よる自動要約文作成の開始操作を待つ。
【0040】すなわち、ユーザが上記自動要約文作成モ
ードに切り換え操作したときには、図1の制御部11
は、ハードディスクドライブ33に保存されている自動
要約文作成プログラムを起動し、表示部30を制御し、
図4に示すような自動要約文作成プログラムの初期画面
を表示させる。この例においては、表示部31に表示さ
れるウィンドウ190は、文書の名称が表示される文書
名表示部191、キーワードが入力されるキーワード入
力部192、文書の要約文を作成するための実行ボタン
である要約文作成実行ボタン193等が表示される表示
領域200と、文書が表示される表示領域210と、文
書の要約文が表示される表示領域220とに区分されて
いる。
【0041】表示領域200の文書名表示部191に
は、表示領域210に表示される文書の文書名等が表示
される。また、キーワード入力部192には、例えば入
力部20のキーボード等を用いて文書の要約文を作成す
るためのキーワードが入力される。要約文作成実行ボタ
ン193は、例えば入力部20のマウス等を用いて押さ
れることによって、表示領域210に表示されている文
書の要約文作成処理を実行開始するための実行ボタンで
ある。
【0042】表示領域210には、文書が表示される。
表示領域210の右端には、スクロールバー211と、
このスクロールバー211を上下に動かすためのボタン
212,213が設けられており、ユーザが例えば入力
部20のマウス等を用いて、スクロールバー211を上
下に直接動かしたり、ボタン212,213を押してス
クロールバー211を上下に動かすことによって、表示
領域210に表示される表示内容を縦方向にスクロール
することができる。ユーザは、入力部20を操作するこ
とによって、表示領域210に表示されている文書の一
部を選択して要約させることもでき、文書全体を要約さ
せることもできる。
【0043】表示領域220には、要約文が表示され
る。図4においては、要約文がまだ作成されていない状
態であるため、この表示領域220には、何も表示され
ていない。ユーザは、入力部20を操作することによっ
て、要約文の表示領域220の表示範囲(大きさ)を変
更することができる。具体的には、ユーザは、同図に示
す表示領域220の表示範囲(大きさ)を、例えば図5
に示すように拡大することができる。
【0044】文書処理装置は、ユーザが例えば入力部2
0のマウス等を用いて、要約文作成実行ボタン193を
押してオン状態とすると、CPU13の制御のもとに、
図6に示す処理を実行して要約文の作成を開始する。
【0045】文書から要約文を作成する処理は、文書の
内部構造に関するタグ付けに基づいて実行される。文書
処理装置においては、先に図5に示したように、ウィン
ドウ190の表示領域220の大きさを変更することが
できる。文書処理装置は、CPU13の制御のもとに、
新たにウィンドウ190が表示部30に描画されるか、
又は、表示領域220の大きさが変更された後、要約文
作成実行ボタン193が操作されたときには、表示領域
220に適合するように、ウィンドウ190の表示領域
210に少なくともその一部が表示されている文書か
ら、要約文を作成する処理を実行する。
【0046】まず、文書処理装置は、図6に示すよう
に、ステップS21において、CPU13の制御のもと
に、活性拡散と呼ばれる処理を行う。本実施の形態にお
いては、活性拡散により得られた中心活性値を重要度と
して採用することによって、文書の要約文を行う。すな
わち、内部構造に関するタグ付けがされた文書において
は、活性拡散を行うことによって、各エレメントに対し
て、内部構造に関するタグ付けに応じた中心活性値を付
与することができる。
【0047】ここで、活性拡散は、中心活性値の高いエ
レメントと関わりのあるエレメントにも高い中心活性値
を与えるような処理である。すなわち、活性拡散は、照
応(anaphora;共参照(coreference))表現されたエ
レメントとその先行詞との間で中心活性値が等しくな
り、それ以外では各中心活性値が同じ値に収束してい
く。この中心活性値は、文書の内部構造に関するタグ付
けに応じて決定されるため、内部構造を考慮した文書の
分析に利用することができる。
【0048】文書処理装置は、図7に示す一連の工程を
経ることによって、活性拡散を実行する。
【0049】まず、文書処理装置は、図7に示すよう
に、ステップS41において、CPU13の制御のもと
に、各エレメントの初期化を行う。文書処理装置は、語
彙エレメントを除いた全てのエレメントと語彙エレメン
トとに対して中心活性値の初期値を割り当てる。例え
ば、文書処理装置は、中心活性値の初期値として、語彙
エレメントを除いた全てのエレメントに対しては“1”
を、語彙エレメントに対しては“0”を割り当てる。ま
た、文書処理装置は、各エレメントの中心活性値の初期
値に均一ではない値を予め割り当てることによって、活
性拡散の結果得られた中心活性値に、初期値の偏りを反
映させることができる。例えば、文書処理装置は、ユー
ザが関心を有するエレメントに対しては、中心活性値の
初期値を高く設定することによって、ユーザの関心を反
映した中心活性値を得ることができる。
【0050】エレメント間で参照・被参照による係り受
けの関係にあるリンクである参照・被参照リンクと、そ
れ以外のリンクである通常リンクとに関しては、エレメ
ントを連結するリンクの端点の端点活性値を“0”に設
定する。文書処理装置は、このようにして付与した端点
活性値の初期値を例えばRAM14に記憶させる。
【0051】ここで、エレメントとエレメントの連結構
造の一例を図8に示す。同図においては、文書を構成す
るエレメントとリンクの構造の一部として、エレメント
i及びエレメントEjが示されている。エレメントEi
とエレメントEjとは、それぞれ、中心活性値ei,ej
を有し、リンクLijにて接続されている。リンクLij
エレメントEiに接続する端点は、Tijであり、エレメ
ントEjに接続する端点は、Tjiである。エレメントEi
は、リンクLijにより接続されるエレメントEjの他
に、リンクLik,Lil及びLimにより図示しないエレメ
ントEk,El及びEmにそれぞれ接続している。エレメ
ントEjは、リンクLjiにより接続されるエレメントEi
の他に、リンクLjp,Ljq及びLjrにより図示しないエ
レメントEp,Eq及びErにそれぞれ接続している。
【0052】続いて、文書処理装置は、図7中のステッ
プS42において、CPU13の制御のもとに、文書を
構成するエレメントEiを計数するカウンタの初期化を
行う。すなわち、文書処理装置は、エレメントを計数す
るカウンタのカウンタ値iを“1”に設定する。このこ
とにより、カウンタは、第1番目のエレメントE1を参
照していることになる。
【0053】続いて、文書処理装置は、ステップS43
において、CPU13の制御のもとに、カウンタが参照
するエレメントについて、新たな中心活性値を計算する
リンク処理を実行する。このリンク処理については、さ
らに後述する。
【0054】続いて、文書処理装置は、ステップS44
において、CPU13の制御のもとに、文書中の全ての
エレメントについて新たな中心活性値の計算が完了した
か否かを判断する。
【0055】ここで、文書処理装置は、文書中の全ての
エレメントについて新たな中心活性値の計算が完了した
ことを判断した場合には、ステップS45へと処理を移
行し、一方、文書中の全てのエレメントについて新たな
中心活性値の計算が完了していないことを判断した場合
には、ステップS47へと処理を移行する。
【0056】具体的には、文書処理装置は、CPU13
の制御のもとに、カウンタのカウンタ値iが、文書が含
むエレメントの総数に達したか否かを判断する。そし
て、文書処理装置は、カウンタのカウンタ値iが、文書
が含むエレメントの総数に達したことを判断した場合に
は、全てのエレメントが計算済みであるものとして、ス
テップS45へと処理を移行する。一方、文書処理装置
は、カウンタのカウンタ値iが、文書が含むエレメント
の総数に達していないことを判断した場合には、全ての
エレメントについて計算が終了していないものとしてス
テップS47へと処理を移行する。
【0057】文書処理装置は、カウンタのカウンタ値i
が、文書が含むエレメントの総数に達していないことを
判断した場合には、ステップS47において、CPU1
3の制御のもとに、カウンタのカウント値iを“1”だ
けインクリメントさせ、カウンタのカウント値を“i+
1”とする。このことにより、カウンタは、i+1番目
のエレメント、すなわち次のエレメントを参照する。そ
して、文書処理装置は、ステップS43へと処理を移行
し、端点活性値の計算及びこれに続く一連の行程が、次
のi+1番目のエレメントについて実行される。
【0058】また、文書処理装置は、カウンタのカウン
タ値iが、文書が含むエレメントの総数に達したことを
判断した場合には、ステップS45において、CPU1
3の制御のもとに、文書に含まれる全てのエレメントの
中心活性値の変化分、すなわち新たに計算された中心活
性値の元の中心活性値に対する変化分について平均値を
計算する。
【0059】文書処理装置は、CPU13の制御のもと
に、例えばRAM14に記憶された元の中心活性値と新
たに計算した中心活性値を、文書に含まれる全てのエレ
メントについて読み出す。文書処理装置は、新たに計算
した中心活性値の元の中心活性値に対するそれぞれの変
化分の総和を文書に含まれるエレメントの総数で除する
ことにより、全てのエレメントの中心活性値の変化分の
平均値を計算する。文書処理装置は、このように計算し
た全てのエレメントの中心活性値の変化分の平均値を、
例えばRAM14に記憶させる。
【0060】そして、文書処理装置は、ステップS46
において、CPU13の制御のもとに、ステップS45
で計算した全てのエレメントの中心活性値の変化分の平
均値が、予め設定された閾値以内であるか否かを判断す
る。そして、文書処理装置は、この変化分が閾値以内で
あると判断した場合には、この一連の処理を終了する。
一方、文書処理装置は、変化分が閾値以内でないと判断
した場合には、ステップS42へと処理を移行し、カウ
ンタのカウント値iを“1”に設定して文書のエレメン
トの中心活性値を計算する一連の処理を再び実行する。
文書処理装置においては、これらのステップS42乃至
ステップS46のループが繰り返される毎に、変化分
は、徐々に減少する。
【0061】文書処理装置は、このようにして活性拡散
を行うことができる。つぎに、この活性拡散を行うため
にステップS43において実行されるリンク処理につい
て図9を参照して説明する。なお、同図に示すフローチ
ャートは、1つのエレメントEiに対する処理を示した
ものであるが、この処理は、全てのエレメントに対して
行われるものである。
【0062】まず、文書処理装置は、図9に示すよう
に、ステップS51において、CPU13の制御のもと
に、文書を構成する1つのエレメントEiと一端が接続
されたリンクを計数するカウンタの初期化を行う。すな
わち、文書処理装置は、リンクを計数するカウンタのカ
ウント値jを“1”に設定する。このカウンタは、エレ
メントEiと接続された第1番目のリンクLijを参照す
ることになる。
【0063】続いて、文書処理装置は、ステップS52
において、CPU13の制御のもとに、エレメントEi
とEjを接続するリンクLijについて、関係属性のタグ
を参照することによって、そのリンクLijが通常リンク
であるか否かを判断する。文書処理装置は、リンクLij
が、語に対応する語彙エレメント、文に対応する文エレ
メント、段落に対応する段落エレメント等の間の関係を
示す通常リンクと、参照・被参照による係り受けの関係
を示す参照リンクのいずれであるかを判断する。文書処
理装置は、リンクLijが通常リンクであると判断した場
合には、ステップS53へと処理を移行し、リンクLij
が参照リンクであると判断した場合には、ステップS5
4へと処理を移行する。
【0064】文書処理装置は、リンクLijが通常リンク
であると判断した場合には、ステップS53において、
エレメントEiの通常リンクLijに接続された端点Tij
の新たな端点活性値を計算する処理を行う。
【0065】このステップS53では、ステップS52
における判別により、リンクLijが通常リンクであるこ
とが明らかになっている。エレメントEiの通常リンク
ijに接続される端点Tijの新たな端点活性値tijは、
エレメントEjの端点活性値のうち、リンクLij以外の
リンクに接続する全ての端点Tjp,Tjq,Tjrの端点活
性値tjp、tjq,tjrと、エレメントEiがリンクLij
により接続されるエレメントEjの中心活性値ejとを加
算し、この加算で得た値を文書に含まれるエレメントの
総数で除することにより求められる。
【0066】文書処理装置は、CPU13の制御のもと
に、例えばRAM14から必要な端点活性値及び中心活
性値を読み出す。文書処理装置は、読み出された端点活
性値及び中心活性値について、上述のようにその通常リ
ンクと接続された端点の新たな端点活性値を計算する。
そして、文書処理装置は、このように計算した新たな端
点活性値を、例えばRAM14に記憶させる。
【0067】一方、文書処理装置は、リンクLijが通常
リンクでないと判断した場合には、ステップS54にお
いて、エレメントEiの参照リンクに接続された端点T
ijの端点活性値を計算する処理を行う。
【0068】このステップS54では、ステップS52
における判別により、リンクLijが参照リンクであるこ
とが明らかになっている。エレメントEiの参照リンク
ijに接続される端点Tijの端点活性値tijは、エレメ
ントEjの端点活性値のうち、リンクLijを除いたリン
クに接続される全ての端点Tjp,Tjq,tjrの端点活性
値tjp,tjq,tjrと、エレメントEiがリンクLij
より接続されるエレメントEjの中心活性値ejとを加算
することにより求められる。
【0069】文書処理装置は、CPU13の制御のもと
に、例えばRAM14に記憶された端点活性値及び中心
活性値から、必要な端点活性値及び中心活性値を読み出
す。文書処理装置は、読み出された端点活性値及び中心
活性値を用いて、上述のように参照リンクと接続された
新たな端点活性値を計算する。そして、文書処理装置
は、このように計算した端点活性値を、例えばRAM1
4に記憶させる。
【0070】これらのステップS53における通常リン
クの処理及びステップS54における参照リンクの処理
は、ステップS52からステップS55に至り、ステッ
プS57を介してステップS52に戻るループに示すよ
うに、カウント値iにより参照されているエレメントE
iに接続される全てのリンクLijに対して実行される。
なお、ステップS57では、エレメントEiに接続され
るリンクを計数するカウント値jをインクリメントして
いる。
【0071】文書処理装置は、これらのステップS53
又はステップS54の処理を行った後、ステップS55
において、CPU13の制御のもとに、エレメントEi
に接続される全てのリンクについて端点活性値が計算さ
れたか否かを判別する。そして、文書処理装置は、全て
のリンクについて端点活性値が計算されていると判断し
た場合には、ステップS56の処理へと移行し、全ての
リンクについて端点活性値が計算されていないと判断し
た場合には、ステップS57へと処理を移行する。
【0072】ここで、文書処理装置は、全てのリンクに
ついて端点活性値が計算されていると判断した場合に
は、ステップS56において、CPU13の制御のもと
に、エレメントEiの中心活性値eiの更新を実行する。
【0073】エレメントEi の中心活性値ei の新たな
値、すなわち更新値は、エレメントEiの現在の中心活
性値eiと、エレメントEiの全ての端点の新たな端点活
性値との和であるei’=ei+Σtj’をとることによ
り求められる。ここで、プライム“’”は、新たな値と
いう意味である。このように、新たな中心活性値は、そ
のエレメントの元の中心活性値に、そのエレメントの端
点の新たな端点活性値の総和に加えることにより得られ
る。
【0074】文書処理装置は、CPU13の制御のもと
に、例えばRAM14に記憶された端点活性値及び中心
活性値から必要な端点活性値を読み出す。文書処理装置
は、上述したような計算を実行し、そのエレメントEi
の中心活性値eiを算出する。そして、文書処理装置
は、計算した新たな中心活性値eiを例えばRAM14
に記憶させる。
【0075】このようにして、文書処理装置は、文書中
の各エレメントについて、新たな中心活性値を計算す
る。そして、文書処理装置は、このようにして図6中の
ステップS21における活性拡散を実行する。
【0076】続いて、文書処理装置は、図6中のステッ
プS22において、CPU13の制御のもとに、先に図
4に示した表示部30に表示されているウィンドウ19
0の表示領域220の大きさ、すなわちこの表示領域2
20に表示可能な最大文字数をWsと設定する。また、
文書処理装置は、CPU13の制御のもとに、要約文S
を初期化して初期値S0=””と設定する。これは、要
約文に何も文字列が存在していないことを示す。文書処
理装置は、このように設定した、表示領域220に表示
可能な最大文字数Ws及び要約文Sの初期値S0を、例え
ばRAM14に記憶させる。
【0077】続いて、文書処理装置は、ステップS23
において、CPU13の制御のもとに、要約文の骨格の
順次での作成をカウントするカウンタのカウント値iを
“1”に設定する。すなわち、文書処理装置は、カウン
ト値について、i=1と設定する。文書処理装置は、こ
のように設定したカウント値iを例えばRAM14に記
憶させる。
【0078】続いて、文書処理装置は、ステップS24
において、CPU13の制御のもとに、カウンタのカウ
ント値iについて、要約文作成対照の文章からi番目に
平均中心活性値の高い文の骨格を抽出する。ここで、平
均中心活性値とは、1つの文を構成する各エレメントの
中心活性値を平均したものである。文書処理装置は、例
えばRAM14に記憶させた要約文Si-1を読み出し、
この要約文Si-1に対して抽出した文の骨格の文字列を
加えて、要約文Siとする。そして、文書処理装置は、
このようにして得た要約文Siを、例えばRAM14に
記憶させる。同時に、文書処理装置は、文の骨格に含ま
れないエレメントの中心活性値順のリストliを作成
し、このリストliを例えばRAM14に記憶させる。
【0079】すなわち、このステップS24において
は、文書処理装置は、CPU13の制御のもとに、活性
拡散の結果を用いて、平均中心活性値の大きい順に文を
選択し、選択された文の骨格を抽出する。文の骨格は、
文から抽出した必須エレメントにより構成される。必須
エレメントになり得るものは、エレメントの主辞(hea
d)と、主語(subject)、目的語(object)、間接目的
語(indirect object)、所有者(posessor)、原因(c
ause)、条件(condition)又は比較(comparison)の
関係属性を有するエレメントと、等位構造とされた関連
するエレメントが必須エレメントのときには、その等位
構造に直接含まれるエレメントとである。文書処理装置
は、文の必須エレメントをつなげて文の骨格を生成し、
要約文に加える。
【0080】続いて、文書処理装置は、ステップS25
において、CPU13の制御のもとに、要約文Siの長
さ、すなわち文字数が、ウィンドウ190の表示領域2
20の最大文字数Wsよりも多いか否かを判断する。
【0081】ここで、文書処理装置は、要約文Siの文
字数が最大文字数Wsよりも多いと判断した場合には、
ステップS30において、CPU13の制御のもとに、
要約文Si-1を最終的な要約文として設定し、一連の処
理を終了する。なお、この場合には、要約文Si=S0
“”を出力するため、要約文は、表示領域220に表示
されないことになる。
【0082】一方、文書処理装置は、要約文Siの文字
数が最大文字数Wsよりも多くないと判断した場合に
は、ステップS26の処理へと移行し、CPU13の制
御のもとに、i+1番目に平均中心活性値が高い文の平
均中心活性値と、ステップS24で作成したリストli
のエレメントの中で最も中心活性値が高いエレメントの
中心活性値とを比較する。そして、文書処理装置は、i
+1番目に平均中心活性値が高い文の平均中心活性値
が、リストliのエレメントの中で最も中心活性値が高
いエレメントの中心活性値よりも高いと判断した場合に
は、ステップS27へと処理を移行する。一方、文書処
理装置は、i+1番目に平均中心活性値が高い文の平均
中心活性値が、リストliのエレメントの中で最も中心
活性値が高いエレメントの中心活性値よりも高くないと
判断した場合には、ステップS28へと処理を移行す
る。
【0083】文書処理装置は、i+1番目に平均中心活
性値が高い文の平均中心活性値が、リストliのエレメ
ントの中で最も中心活性値が高いエレメントの中心活性
値よりも高いと判断した場合には、ステップS27にお
いて、CPU13の制御のもとに、カウンタのカウント
値iを“1”だけインクリメントさせ、ステップS24
へと処理を戻す。
【0084】また、文書処理装置は、i+1番目に平均
中心活性値が高い文の平均中心活性値が、リストli
エレメントの中で最も中心活性値が高いエレメントの中
心活性値よりも高くないと判断した場合には、ステップ
S28において、CPU13の制御のもとに、リストl
iのエレメントの中で最も中心活性値の高いエレメント
eを要約文Siに加えてSSiを生成し、さらに、エレメ
ントeをリストliから削除する。そして、文書処理装
置は、このようにして生成した要約文SSiを例えばR
AM14に記憶させる。
【0085】続いて、文書処理装置は、ステップS29
において、CPU13の制御のもとに、要約文SSi
文字数がウィンドウ190の表示領域220の最大文字
数Wsよりも多いか否かを判別する。文書処理装置は、
要約文SSiの文字数が最大文字数Wsよりも多くないと
判別した場合には、ステップS26からの処理を繰り返
す。一方、文書処理装置は、要約文SSiの文字数が最
大文字数Wsよりも多いと判別した場合には、ステップ
S31において、CPU13の制御のもとに、要約文S
iを最終的な要約文として設定し、表示領域220に表
示して一連の処理を終了する。このようにして、文書処
理装置は、最大文字数Wsよりも多くならないように要
約文を生成する。
【0086】文書処理装置は、このような一連の処理を
行うことによって、タグ付けされた文書を要約して要約
文を作成することができる。文書処理装置は、例えば図
4に示した文書を要約した場合には、図10に示すよう
な要約文を作成し、表示範囲の表示領域220に表示す
る。
【0087】すなわち、文書処理装置は、「TCP/IPの歴
史はARPANETを抜きにして語ることはできない。ARPANET
は1969年北米西海岸の4個所の大学、研究機関のホスト
コンピュータを50kbpsの回線で結んだ小規模なネットワ
ークからARPANETは出発した。当時は1964年にメインフ
レームの汎用コンピュータシリーズが開発された。この
時代背景を考えると、将来のコンピュータ通信の最盛を
見越したこのようなプロジェクトは、まさに米国ならで
はのものであったといえるだろう。」という要約文を作
成し、表示領域220に表示する。
【0088】文書処理装置においては、ユーザは、文書
の全文章を一読する代わりに、この要約文を読むこと
で、文章の概要を理解し、この文章が所望する情報であ
るか否かを判定することができる。
【0089】なお、文書処理装置においては、文書中の
エレメントに対して重要度を付与する方法としては、必
ずしも上述したような活性拡散を用いる必要はなく、例
えば、文書中に出現する単語の重みの総和を文書の重要
度とする方法でもよい。また、重要度の付与方法は、こ
れらの方法以外のものを利用することもできる。さら
に、表示領域200のキーワード入力部192にキーワ
ードを入力することによって、そのキーワードに基づい
た重要度の設定を行うこともできる。
【0090】さて、文書処理装置は、先に図5に示した
ように、表示部31に表示されるウィンドウ190の表
示領域220の表示範囲を拡大することができるが、作
成した要約文が表示領域220に表示されている状態に
おいて、表示領域220の表示範囲を変更すると、その
表示範囲に応じて、要約文の情報量を変更することがで
きる。
【0091】この場合、文書処理装置は、CPU13の
制御のもとに、ユーザが入力部20を操作することに対
応して、表示部31に表示されたウィンドウ190の表
示領域220の表示範囲が変更されるまで待機する。そ
して、文書処理装置は、表示領域220の表示範囲が変
更されると、CPU13の制御のもとに、先に図6に示
した一連の処理と同様の処理を行い、表示領域220の
表示範囲に対応した要約文を作成する。
【0092】文書処理装置は、このようにして、表示領
域220の表示範囲に応じた要約文を新たに作成するこ
とができる。例えば、文書処理装置は、ユーザが入力部
20のマウスをドラッグ操作することにより表示領域2
20の表示範囲を拡大すると、より詳細な要約文を新た
に作成し、図11に示すように、新たな要約文をウィン
ドウ190の表示領域220に表示する。
【0093】すなわち、文書処理装置は、「TCP/IPの歴
史はARPANETを抜きにして語ることはできない。ARPANET
はアメリカ国防省DODの国防高等研究計画局がスポンサ
ーとなって構築されてきた、実験および研究用のパケッ
ト交換ネットワークである。1969年北米西海岸の4個所
の大学、研究機関のホストコンピュータを50kbpsの回線
で結んだきわめて小規模なネットワークからARPANETは
出発した。当時は1945年に世界初のコンピュータである
ENIACがxxxxxxx大学で開発され、1964年にはじ
めてICを理論素子として実装したメインフレームの汎用
コンピュータシリーズが開発され、やっとコンピュータ
が産声をあげたばかりあった。この時代背景を考える
と、将来のコンピュータ通信の最盛を見越したこのよう
なプロジェクトは、まさに米国ならではのものであった
といえるだろう。」という要約文を作成し、表示領域2
20に表示する。
【0094】このように、文書処理装置においては、表
示された要約文が簡略すぎて文書の概略を把握すること
ができない場合、ユーザは、表示領域220の表示範囲
を拡大することで、より多くの情報量を有するより詳細
な要約文を参照することができる。
【0095】また、本発明に係る実施の形態の文書処理
装置は、ユーザの要望に応じて、プレゼンテーション等
のためのスライドを自動作成する。このスライドの自動
作成について、図12のフローチャートを参照しながら
説明する。
【0096】図12において、文書処理装置は図1のC
PU13の制御のもとに、最初のステップS71で、入
力された文書の見出しやトピック、あるいは図への参照
文等のタイトルエレメントを抽出する。この場合の文書
中の見出しやトピック等のタイトルエレメントとなるエ
レメントとしては、上記文書要約の動作説明において述
べた活性拡散を行い、活性拡散を行った結果の活性値の
高いエレメントであって、エレメントが名詞句のものを
選んでおり、この名詞句の主語がスライドのタイトルと
される。
【0097】また、上記図への参照文は、上記文書中
で、 <タグ名 href =“abc.gif” caption =“xy
z”> のようにタグ付けされて示される。ここで、href =
“abc.gif”は、図の参照ファイルが「abc.gif」
であることを示し、参照ファイルとしては、各種画像フ
ォーマットのファイル「*.jpg」や「*.bmp」等が用い
られる。また、caption =“xyz”は、図のキャプシ
ョン(図の説明文)が「xyz」であることを示してい
る。
【0098】次のステップS72で、文書処理装置は、
抽出したタイトルエレメントの配列に関して、現在の処
理対象範囲の開始位置を表す変数start 及びカウンタの
カウント値iの初期値として、 start=0,i=1を設
定(初期設定)する。
【0099】次のステップS73で、文書処理装置は、
上記タイトルエレメントである配列の要素(エレメン
ト)si に含まれるエレメントの参照エレメントと被参
照エレメントのリストRList(si)を作成する。ステップ
S74で、文書処理装置は、上記入力された文書中での
次の要素(次のタイトルエレメント)si+1 の出現位置
を、現在の処理対象範囲の終了位置を表す変数end とす
る。
【0100】次のステップS75で、文書処理装置は、
上記リストRList(si)の要素(エレメント)を含む文ss
i に関して上記ステップS73と同様にリストRList(s
si)を作成して、上記リストRList(si)と結合してリス
トRListi とする。すなわち、上記文(エレメント)ss
i に含まれるエレメントの参照エレメントと被参照エレ
メントのリストRList(ssi) を作成し、このリストRLi
st(ssi) を上記リストRList(si)と結合して、その結果
をリストRListi とする。
【0101】次のステップS76で、文書処理装置は、
上記要素(エレメント)si が見出しやトピックの場合
はその文を、図への参照文の場合は図のキャプション
(図の説明文)を、スライドのタイトル(スライドタイ
トル)とする。
【0102】次のステップS77で、文書処理装置は、
上記ステップS75で得られたリストRListi の要素の
内で、その出現位置が上記start より大きく、上記end
より小さいものを選択し、その選択された要素に対し
て、その要素を含む文の骨格となる文字列を加えて文を
生成し、その文の出現順に箇条書きにすると共に、現在
処理中のタイトルエレメントsi が図への参照文の場合
はその図を追加して、スライドを生成する。
【0103】次にステップS78で、文書処理装置は、
上記カウント値iが文書中のタイトルエレメントの配列
の総数に達したか否かを判別し、YESのときは処理を
終了し、NOのときは、タイトルエレメントsi の位置
をstart とし、カウント値iをインクリメント(i=i
+1)して、上記ステップS73に戻っている。
【0104】ここで、図13は、処理対象となる入力文
書の一具体例の一部を示し、図14〜図16は、このよ
うな入力文書から自動作成されたスライドの一部を示し
ている。
【0105】なお、本実施の形態においては、文書への
タグ付けの方法の一例を示したが、本発明がこのタグ付
けの方法に限定されないことは勿論である。また、本実
施の形態においては、文書処理装置の通信部22に外部
から電話回線を介して文書が送信されるとしたが、本発
明はこれに限定されない。例えば、衛星等を介して文書
が送信される場合にも適用でき、また、記録/再生部3
1において記録媒体32から読み出されたり、文書処理
装置のROM15に文書が書き込まれていたりしてもよ
い。
【0106】また、本発明の実施の形態においては、文
書要約機能及びスライド自動作成機能の両機能を有する
文書処理装置について説明したが、スライド自動作成機
能のみを有する文書処理装置とすることも容易に実現で
きる。
【0107】また、本発明の実施の形態においては、上
記図1の記録媒体32として、上述した文書処理プログ
ラムが書き込まれたディスク状記録媒体やテープ状記録
媒体等を提供することも容易に実現できる。さらに、上
述した文書処理プログラムについては、通信回線等の伝
送媒体を介して供給することも容易に実現できる。
【0108】また、上述の実施の形態においては、文書
処理装置の表示部30に表示された文書から所望のエレ
メントを選択するデバイスとしてマウスを例示したが、
本発明がこれに限定されないことはいうまでもない。文
書処理装置におけるエレメントの入力には、タブレッ
ト、ライトペン等の他のデバイスを利用することができ
る。
【0109】さらに、上述の実施の形態においては日本
語の文章を例示したが、本発明は、日本語に限定され
ず、英語、ドイツ語、フランス語、ロシア語、イタリア
語、スペイン語、中国語、韓国語等の種々の言語に適用
できることはいうまでもない。
【0110】
【発明の効果】以上の説明からも明らかなように、本発
明によれば、入力された文書中の見出し及び図への参照
を含むタイトルエレメントを抽出し、抽出したタイトル
エレメントの参照エレメントと被参照エレメントを含む
リストを作成し、上記タイトルエレメントに基づくスラ
イドタイトルを作成し、上記作成されたリスト内の要素
を含む文を生成し、その文の出現順に箇条書きすると共
に、上記タイトルエレメントが図への参照文のときはそ
の図を追加してスライドを生成することにより、自動的
にスライドを作成することができる。
【図面の簡単な説明】
【図1】本実施の形態を適用した文書処理装置の概略構
成を示すブロック図である。
【図2】文書のタグ付けによる内部構造の一例を示す図
である。
【図3】文書のタグ付けによる内部構造を表示したウィ
ンドウを示す図である。
【図4】文書を表示したウィンドウを示す図である。
【図5】文書を表示したウィンドウを示す図であって、
要約文を表示する表示領域が図13に示す表示領域より
も拡大された様子を示す図である。
【図6】要約文を作成する際の一連の処理を説明するフ
ローチャートである。
【図7】活性拡散を行う際の一連の処理を説明するフロ
ーチャートである。
【図8】活性拡散の処理を説明するためのエレメントの
連結構造を示す図である。
【図9】活性拡散のリンク処理を行う際の一連の処理を
説明するフローチャートである。
【図10】文書とその要約文を表示したウィンドウを示
す図である。
【図11】文書とその要約文を表示したウィンドウを示
す図であって、図5に示すウィンドウに要約文を表示し
た様子を示す図である。
【図12】文書に基づくスライドの自動作成処理を説明
するためのフローチャートである。
【図13】スライドの自動作成処理対象となる文書の一
具体例の一部を示す図である。
【図14】図13に示す文書から自動作成されたスライ
ドの一例を示す図である。
【図15】図13に示す文書から自動作成されたスライ
ドの他の例を示す図である。
【図16】図13に示す文書から自動作成されたスライ
ドのさらに他の例を示す図である。
【符号の説明】
10 文書処理装置の本体、 11 制御部、 12
インターフェース、13 CPU、 20 入力部、
22 通信部、 30 表示部、 31 記録/再生
部、 32 記録媒体、 33 ハードディスクドライ

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 電子文書の形態の文書を処理する文書処
    理方法において、 上記文書中の見出し及び図への参照を含むタイトルエレ
    メントを抽出するタイトルエレメント抽出工程と、 上記抽出したタイトルエレメントの参照エレメントと被
    参照エレメントを含むリストを作成するリスト作成工程
    と、 上記タイトルエレメントに基づくスライドタイトルを作
    成するスライドタイトル作成工程と、 上記リスト作成工程により作成されたリスト内の要素を
    含む文を生成し、その文の出現順に箇条書きすると共
    に、上記タイトルエレメントが図への参照文のときはそ
    の図を追加してスライドを生成するスライド生成工程と
    を有することを特徴とする文書処理方法。
  2. 【請求項2】 上記文書は、複数のエレメントが階層化
    された内部構造を有し、上記内部構造を示すタグ情報が
    予め付与されていることを特徴とする請求項1記載の文
    書処理方法。
  3. 【請求項3】 上記タグ情報には、上記複数のエレメン
    トの間の参照、被参照の関係を示す属性情報を含むこと
    を特徴とする請求項2記載の文書処理方法。
  4. 【請求項4】 上記タイトルエレメント抽出工程では、
    上記タグ情報に基づいて活性拡散を行い、活性値の高い
    エレメントの内の名詞句を抽出してタイトルエレメント
    とし、上記スライドタイトル作成工程では、上記タイト
    ルエレメントとなる名詞句の主語をスライドタイトルと
    することを特徴とする請求項2記載の文書処理方法。
  5. 【請求項5】 上記リスト作成工程では、上記抽出した
    タイトルエレメントの参照エレメントと被参照エレメン
    トのリストRList(si)を作成し、このリストRList(si)
    のエレメントを含む文ssi のエレメントの参照エレメン
    トと被参照エレメントのリストRList(ssi) を作成し、
    このリストRList(ssi) を上記リストRList(si)と結合
    してリストRListi とすることを特徴とする請求項1記
    載の文書処理方法。
  6. 【請求項6】 電子文書の形態の文書を処理する文書処
    理装置において、 上記文書中の見出し及び図への参照を含むタイトルエレ
    メントを抽出するタイトルエレメント抽出手段と、 上記抽出したタイトルエレメントの参照エレメントと被
    参照エレメントを含むリストを作成するリスト作成手段
    と、 上記タイトルエレメントに基づくスライドタイトルを作
    成するスライドタイトル作成手段と、 上記リスト作成手段により作成されたリスト内の要素を
    含む文を生成し、その文の出現順に箇条書きすると共
    に、上記タイトルエレメントが図への参照文のときはそ
    の図を追加してスライドを生成するスライド生成手段と
    を有することを特徴とする文書処理装置。
  7. 【請求項7】 上記文書は、複数のエレメントが階層化
    された内部構造を有し、上記内部構造を示すタグ情報が
    予め付与されていることを特徴とする請求項6記載の文
    書処理装置。
  8. 【請求項8】 上記タグ情報には、上記複数のエレメン
    トの間の参照、被参照の関係を示す属性情報を含むこと
    を特徴とする請求項7記載の文書処理装置。
  9. 【請求項9】 上記タイトルエレメント抽出手段は、上
    記タグ情報に基づいて活性拡散を行い、活性値の高いエ
    レメントの内の名詞句を抽出してタイトルエレメントと
    し、上記スライドタイトル作成手段は、上記タイトルエ
    レメントとなる名詞句の主語をスライドタイトルとする
    ことを特徴とする請求項7記載の文書処理装置。
  10. 【請求項10】 上記リスト作成手段は、上記抽出した
    タイトルエレメントの参照エレメントと被参照エレメン
    トのリストRList(si)を作成し、このリストRList(si)
    のエレメントを含む文ssi のエレメントの参照エレメン
    トと被参照エレメントのリストRList(ssi) を作成し、
    このリストRList(ssi) を上記リストRList(si)と結合
    してリストRListi とすることを特徴とする請求項6記
    載の文書処理装置。
  11. 【請求項11】 電子文書の形態の文書を処理するコン
    ピュータ制御可能な文書処理プログラムが記録された記
    録媒体において、 上記文書処理プログラムは、 上記文書中の見出し及び図への参照を含むタイトルエレ
    メントを抽出するタイトルエレメント抽出工程と、 上記抽出したタイトルエレメントの参照エレメントと被
    参照エレメントを含むリストを作成するリスト作成工程
    と、 上記タイトルエレメントに基づくスライドタイトルを作
    成するスライドタイトル作成工程と、 上記リスト作成工程により作成されたリスト内の要素を
    含む文を生成し、その文の出現順に箇条書きすると共
    に、上記タイトルエレメントが図への参照文のときはそ
    の図を追加してスライドを生成するスライド生成工程と
    を有することを特徴とする文書処理プログラムが記録さ
    れた記録媒体。
  12. 【請求項12】 上記文書は、複数のエレメントが階層
    化された内部構造を有し、上記内部構造を示すタグ情報
    が予め付与されていることを特徴とする請求項11記載
    の文書処理プログラムが記録された記録媒体。
  13. 【請求項13】 上記タグ情報には、上記複数のエレメ
    ントの間の参照、被参照の関係を示す属性情報を含むこ
    とを特徴とする請求項12記載の文書処理プログラムが
    記録された記録媒体。
  14. 【請求項14】 上記タイトルエレメント抽出工程で
    は、上記タグ情報に基づいて活性拡散を行い、活性値の
    高いエレメントの内の名詞句を抽出してタイトルエレメ
    ントとし、上記スライドタイトル作成工程では、上記タ
    イトルエレメントとなる名詞句の主語をスライドタイト
    ルとすることを特徴とする請求項12記載の文書処理プ
    ログラムが記録された記録媒体。
  15. 【請求項15】 上記リスト作成工程では、上記抽出し
    たタイトルエレメントの参照エレメントと被参照エレメ
    ントのリストRList(si)を作成し、このリストRList(s
    i)のエレメントを含む文ssi のエレメントの参照エレメ
    ントと被参照エレメントのリストRList(ssi) を作成
    し、このリストRList(ssi) を上記リストRList(si)と
    結合してリストRListi とすることを特徴とする請求項
    11記載の文書処理プログラムが記録された記録媒体。
JP28595699A 1999-10-06 1999-10-06 文書処理方法及び装置並びに記録媒体 Withdrawn JP2001109762A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28595699A JP2001109762A (ja) 1999-10-06 1999-10-06 文書処理方法及び装置並びに記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28595699A JP2001109762A (ja) 1999-10-06 1999-10-06 文書処理方法及び装置並びに記録媒体

Publications (1)

Publication Number Publication Date
JP2001109762A true JP2001109762A (ja) 2001-04-20

Family

ID=17698141

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28595699A Withdrawn JP2001109762A (ja) 1999-10-06 1999-10-06 文書処理方法及び装置並びに記録媒体

Country Status (1)

Country Link
JP (1) JP2001109762A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006254463A (ja) * 2005-03-10 2006-09-21 Avaya Technology Llc 対話型音声応答システムにおける動的ビデオ生成
JP2016526238A (ja) * 2013-06-06 2016-09-01 マイクロソフト テクノロジー ライセンシング,エルエルシー プレゼンテーションスライドを編成するための自動化システム
KR102014501B1 (ko) * 2019-05-17 2019-08-27 김성용 드릴-다운 슬라이드 프리젠테이션 콘텐츠 생성 방법 및 장치, 드릴-다운 슬라이드 프리젠테이션 콘텐츠 배포 방법 및 장치, 드릴-다운 슬라이드 프리젠테이션 콘텐츠 재생 방법 및 장치, 및 드릴-다운 프리젠테이션 콘텐츠 배포 및 재생 시스템
KR102014500B1 (ko) * 2018-02-28 2019-08-27 김성용 드릴-다운 슬라이드 프리젠테이션 콘텐츠 생성 방법 및 장치, 드릴-다운 슬라이드 프리젠테이션 콘텐츠 배포 방법 및 장치, 드릴-다운 슬라이드 프리젠테이션 콘텐츠 재생 방법 및 장치, 및 드릴-다운 프리젠테이션 콘텐츠 배포 및 재생 시스템
JP2020108162A (ja) * 2020-03-05 2020-07-09 株式会社オープンエイト サーバおよびプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006254463A (ja) * 2005-03-10 2006-09-21 Avaya Technology Llc 対話型音声応答システムにおける動的ビデオ生成
JP4514723B2 (ja) * 2005-03-10 2010-07-28 アバイア テクノロジー エルエルシー 対話型音声応答システムにおける動的ビデオ生成
US7778397B2 (en) 2005-03-10 2010-08-17 Avaya Inc. Dynamic video generation in interactive voice response systems
JP2016526238A (ja) * 2013-06-06 2016-09-01 マイクロソフト テクノロジー ライセンシング,エルエルシー プレゼンテーションスライドを編成するための自動化システム
KR102014500B1 (ko) * 2018-02-28 2019-08-27 김성용 드릴-다운 슬라이드 프리젠테이션 콘텐츠 생성 방법 및 장치, 드릴-다운 슬라이드 프리젠테이션 콘텐츠 배포 방법 및 장치, 드릴-다운 슬라이드 프리젠테이션 콘텐츠 재생 방법 및 장치, 및 드릴-다운 프리젠테이션 콘텐츠 배포 및 재생 시스템
KR102014501B1 (ko) * 2019-05-17 2019-08-27 김성용 드릴-다운 슬라이드 프리젠테이션 콘텐츠 생성 방법 및 장치, 드릴-다운 슬라이드 프리젠테이션 콘텐츠 배포 방법 및 장치, 드릴-다운 슬라이드 프리젠테이션 콘텐츠 재생 방법 및 장치, 및 드릴-다운 프리젠테이션 콘텐츠 배포 및 재생 시스템
JP2020108162A (ja) * 2020-03-05 2020-07-09 株式会社オープンエイト サーバおよびプログラム

Similar Documents

Publication Publication Date Title
US7076732B2 (en) Document processing apparatus having an authoring capability for describing a document structure
WO2001001390A1 (fr) Trieuse-liseuse electronique
US7176931B2 (en) Modifying hyperlink display characteristics
US7610546B1 (en) Document processing apparatus having capability of controlling video data
US7941745B2 (en) Method and system for tagging electronic documents
US5748186A (en) Multimodal information presentation system
US7992085B2 (en) Lightweight reference user interface
US5963205A (en) Automatic index creation for a word processor
US5708825A (en) Automatic summary page creation and hyperlink generation
JP4214598B2 (ja) 文書処理方法および装置ならびに記録媒体
US20060085735A1 (en) Annotation management system, annotation managing method, document transformation server, document transformation program, and electronic document attachment program
JPH1078952A (ja) 音声合成方法、音声合成装置、ハイパーテキストの制御方法及び制御装置
US20070005649A1 (en) Contextual title extraction
JPH11161682A (ja) 情報検索装置、情報検索方法及び記録媒体
JPH1125098A (ja) 情報処理装置、リンク先ファイルの取得方法および記憶媒体
WO2000043909A1 (fr) Procede et dispositif de traitement de documents et support d'enregistrement
US20040066914A1 (en) Systems and methods for providing a user-friendly computing environment for the hearing impaired
US20020143817A1 (en) Presentation of salient features in a page to a visually impaired user
JP2001109762A (ja) 文書処理方法及び装置並びに記録媒体
JP4186321B2 (ja) 文書処理方法及び装置並びに記録媒体
JP2001043219A (ja) 文書処理方法及び装置並びに記録媒体
JP2000222326A (ja) 学習支援方法及びシステム及び学習支援プログラムを格納した記憶媒体
JP2001027997A (ja) 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体
JP2001027996A (ja) 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体
JP2002229578A (ja) 音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070109