JP3718044B2 - 文書閲覧装置およびそのプログラムを格納した記憶媒体 - Google Patents

文書閲覧装置およびそのプログラムを格納した記憶媒体 Download PDF

Info

Publication number
JP3718044B2
JP3718044B2 JP02085298A JP2085298A JP3718044B2 JP 3718044 B2 JP3718044 B2 JP 3718044B2 JP 02085298 A JP02085298 A JP 02085298A JP 2085298 A JP2085298 A JP 2085298A JP 3718044 B2 JP3718044 B2 JP 3718044B2
Authority
JP
Japan
Prior art keywords
document
attention
user
attention word
browsed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02085298A
Other languages
English (en)
Other versions
JPH11219361A (ja
Inventor
由雄 仲尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP02085298A priority Critical patent/JP3718044B2/ja
Publication of JPH11219361A publication Critical patent/JPH11219361A/ja
Application granted granted Critical
Publication of JP3718044B2 publication Critical patent/JP3718044B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は,電子ファイル化された文書を閲覧するための装置に関し,対象文書の要約を自動作成して表示する装置に関する。特に,文書の骨組みを示す見出しと文書の重要箇所を示す重要度表示を含む文書のアウントライン情報および要約文書を表示する文書閲覧装置に関するものである。そして,表示された要約文書を対話形式で容易に編集できるようにしたものである。
【0002】
【従来の技術】
オンラインで文書を閲覧し,表示する場合,1文書の内容を1画面に全部表示することができないことが多い。そのため,ワードプロセッサやDTPソフトウェアでは文書全体の構成を一覧できるように,文書中の章,節等の見出しだけを抜き出して提示するアウトライン表示を行うようにしている。
【0003】
元来,アウトライン表示は,文書作成時に文書全体の構成を推敲するために使用されていたのであるが,この機能は文書の閲覧,参照等に使用されるようになった。文書の全文を表示するビュー(ウィンドウ)の左に,文書中の大見出しなどにより文書のアウトライン(骨組み)を表示したガイドビューを配置するものである。そして,利用者がガイド用ビューの見出し部分をポインティングデバイス等により指定すると,右のウィンドウが連動してその見出しと対応する部分に表示が切替わるように動作するものである。
【0004】
この方法により,利用者はガイド用ビューに示された見出しを手掛かりに自分にとって関心のある情報が書かれている部分を選択して参照できる。
また,検索文書の概要の把握を支援するために,見出しとともに要約を提示し,また必要に応じて利用者の指定した見出しに関連する部分の要約を詳細化する手段を備えた文書検索装置も従来から知られている(特開平7−129605号「文書検索装置」参照)。
【0005】
【発明が解決しようとする課題】
このような従来の表示方法は,利用者の関心のある内容が見出しに表現されている場合には有効であるが,そうでない場合には,どの部分を参照すべきか利用者が判断できないという問題がある。例えば,章,節などの見出しが,書かれている内容を十分に表現していない場合には,ガイド用ビューに表示された情報が役に立たないため,結果として利用者が文書の大部分を見ざるを得ないことがある。
【0006】
この場合,特開平7−129605号のように,利用者の指定した見出しに対応する部分の要約を自動作成してガイトビューに追加する手段を備えていたとしても,要約を追加すべき部分を見つける手がかりである見出しが理解不能であれば,どの部分に要約を追加するよう指示すれば良いかを利用者が判定でない。
【0007】
本発明は,閲覧文書の要約から利用者が必要とする情報を容易に得ることができ,さらに閲覧文書の要約を利用者の関心の高い注目語に応じて簡単に再作成することのできる文書閲覧装置および記憶媒体を提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明は,電子ファイル化された文書を入力し,要約を自動作成して出力する文書閲覧装置において,利用者にとって関心のある内容を示す注目語を元にして閲覧文書の要約を自動作成して表示する要約文書提示手段と,文書の骨組みを示す見出しと文書の重要箇所を示す重要度表示とを含む文書のアウントライン情報を自動作成して表示する文書構造提示手段と,作成した要約を利用者の指示に従って変更する要約変更手段とを備え,作成した要約を要約文書表示領域に表示し,文書のアウトライン情報を文書構造表示領域に表示し,作成した要約を利用者が変更できるようにした。
【0009】
図1は本発明の基本構成を示す。
図1において,
1は文書閲覧装置である。
【0010】
Aは要約文書提示手段である。
Bは文章構造提示手段である。
Cは要約変更手段である。
【0011】
12は閲覧文書である。
13は質問文入力部であって,利用者が閲覧文書で閲覧したいと思っている事柄を文や単語の形で入力するためのものである。
【0012】
2は文書要約部であって,閲覧文書の要約を作成するものである。
3は見出し抽出部であって,閲覧文書の構造を解析し,章・節等の論理的なまとまり(文書要素)を認定し,その部分に付与された見出しを抽出するものである。この処理は,文書のフォーマットの種類によって異なり,また,本発明にとって本質的なものではないので,詳細な説明は省略するが,例えば,次のように行う。SGML(Standard Generalized Markup Language: ISO8879)等の文書構造のマークアップ言語やDTP用ソフトウェア固有のフォーマット等によって構造化された文書であれば,閲覧文書に付与されている構造情報を本発明で利用できる形に変換すれば良い。構造化されていない単純な文書(プレーンテキスト:plain text) の場合には,書式(段下げや見出し部分の番号付けなど)を手がかりに,見出しと章・節等のまとまりを認定すればよい。
【0013】
4は注目語抽出部であって,対象文書中の見出しや強調語句等から作成者注目語を,利用者が入力した質問文および利用者が関心をもった要約文書の部分から利用者注目語を抽出するものである。ここで,作成者注目語とは,文書の作成者が書こうとした内容を示すキーワードのことであり,利用者注目語とは,利用者が閲覧文書で閲覧したいと思っている事柄を示すキーワードのことである。
【0014】
5は文書要素注目度計算部であって,章・節等の文書要素に対して,そこに出現している利用者注目語の数に基づいて,注目度(利用者が閲覧したいと思っている事柄との関連度)を計算するものである。
【0015】
7は重要度表示生成部であって,見出しに対応する文書要素の注目度に基づいて,それぞれの見出しに付与する重要度表示を生成するものである。重要度表示は,利用者が要約文書を拾い読みする場合などに,いずれの部分を読めば良いかの指標となるよう,文書のアウトライン情報において見出しと対応付けて表示する記号である。
【0016】
8は要約文書変更部であって,要約文書を作成するものである。
8’は要約再作成情報獲得部であって,自動作成した要約文書の利用者の指示に従って変更(再作成)するために必要な情報を獲得するものである。具体的には,利用者の指示(要約文書編集要求)を,ディスプレイ上におけるポインティングデバイスによる指定もしくは入力装置からのキー入力等の形で受け付け,要約文書変更部8および文書要素注目度計算部5へ渡す追加注目語やその他のパラメータの作成を行う。
【0017】
9は表示処理部であって,要約文書との文書のアウトライン情報とを表示装置に連動して表示するためのものである。
10は要約文書の出力部であって,要約文書を画面表示するディスプレイ等である。
【0018】
11は編集情報入力部であって,要約文書を編集するための情報を入力するものである。
図1の構成の動作を説明する。
【0019】
(1) 見出し抽出部3は,閲覧文書の構造を解析し,章・節等の文書要素を認定し,それと対応する見出しを抽出する。
(2) 注目語抽出部4は,質問文入力部13を介して利用者の質問文を受け取り,利用者注目語を抽出する。また,見出し抽出部3から文書の標題,章・節の見出しを受け取り,作成者注目語を抽出する。
【0020】
(3) 文書要素注目度計算部5は,利用者注目語に基づき,文書要素(閲覧文書中の章・節等)毎に注目度を計算する。注目度は例えば,文書要素中に出現する利用者注目語の数を1文字当たりの出現数に規格したもの(出現密度)等である。
【0021】
(4) 重要度表示生成部7は,文書のアウトライン情報に表示するそれぞれの見出しに対して,重要度表示を作成する。重要度表示は,利用者が要約文書を拾い読みする場合などに,いずれの部分を読めばよいかの指標となるよう,文書のアウトライン情報において見出しと対応付けて表示する記号であり,それぞれの見出しに対応する文書要素の注目度に基づいて作成される。
【0022】
(5) 文書要約部2は,(1) で認定した文書要素毎に要約を作成する。要約作成は,文書要素に付与されている見出しから抽出した作成者注目語と,質問文から抽出した作成者注目語と,質問文から抽出した利用者注目語を手がかりに,それらの注目語が出現している文を抜粋することで行う。
【0023】
(6) ,(7) 表示処理部9は,要約文書と文書のアウトライン情報(重要度表示付きの見出し)とを対応付けて表示するための処理を行い,それぞれを文書要約ビュー・文書構造ビューとして出力部(表示装置)10に出力する。
【0024】
次に編集情報入力部11は,利用者から次の2種類の要求を受け取り,表示処理部9または要約再作成情報獲得部8’に通知する。
1つは,要約文書の表示切替え要求であり,利用者が文書構造ビューに表示した見出しをポインティングデバイス等により指定した時に発生する。
【0025】
(8) ,(9) 要約文書の表示切替え要求が発生した場合には,編集情報入力部11は表示処理部9に通知して,要約文書ビューの表示内容を指定された見出しに対応する要約文書の部分へ切り替える。
【0026】
もう1つは,要約文書の編集要求であり,要約文書のビューあるいは文書構造ビュー上の部分をポインティングデバイス等で範囲指定した場合,あるいはそれぞれのビュー上でポインティングデバイスによりメニューを選択した場合,あるいは入力装置からキー入力した場合に発生する。
【0027】
(10) 要約文書の編集要求は,要約再作成情報獲得部8’に通知され,そこで処理される。要約再作成情報獲得部8’は要約文書の編集要求を解釈し,文書注目度計算部5および要約文書変更部8に与えられるパラメータを作成する。文書要素注目度計算部5に与える。パラメータは,範囲指定された要約文書の部分あるいはキー入力された追加の質問文から注目語抽出部4を使って抽出した注目語を追加した利用者注目語のリストであり,要約文書変更部8に与えるパラメータ(再作成情報)には,要約文書から削除すべき部分として範囲指定された要約文書の部分等がある。
【0028】
(11),(12) 文書要素注目度計算部5は,要約再作成情報獲得部8’から与えられた注目語リストに従って文書要素の注目度を計算し直す。その結果に基づき,重要度表示生成部7は見出しに付与する重要度表示を再生成する。
【0029】
(13) 要約文書変更部8は,要約再作成情報獲得部8’から与えられた再作成情報をもとに要約を再作成する。
(14),(15) 表示処理部9は,変更された要約文書と文書のアウトライン情報(重要度表示付きの見出し)とを対応付けて表示するための処理を行い,それぞれを要約文書ビュー・文書構造ビューとして出力部(表示装置)10に出力する。
【0030】
本発明は,章・節等について利用者の関心の程度を判定し,その程度を示す重要度表示付きの見出しからなる文書のアウトライン情報を文書構造ビューに提示する。これにより利用者は,重要度を示す重要度付きの見出しを手がかりに,要約文書を拾い読んだり,より詳細化すべき部分を指定して要約を再作成させることができる。重要度表示という手がかりがあるので,たとえアウントライン情報として提示された見出しが理解できない場合であっても,利用者は自身の関心のある部分を素早く見つけることが可能になる。
【0031】
【発明の実施の形態】
図2は本発明の装置構成の実施の形態を示す。
図2において,
1は文書閲覧装置である。
【0032】
3は見出し抽出部であって,閲覧文書を解析し,章・節等の文書要素を認定し,文書構造ビューに表示する見出しを抽出する部分である。
2は文書要約部であって,構造解析された閲覧対象文書を見出し抽出部3から,注目語リストを注目語抽出部4から,プロセス制御部20を介して受け取り,章・節等の文書要素毎に注目語に関係の深い文を抜粋し,閲覧文書の要約を作成する部分である(要約作成の方法は,図14,図16のフローチャートを参照)。
【0033】
4は注目語抽出部であって,利用者から与えられた質問文あるいは文書中の見出し等から名詞を注目語として抽出する部分である。
注目語抽出部4と文書要約部2は公知の手段を利用できるが,特に,本出願の発明者により特許出願されている作成者注目情報と利用者注目情報の両方を考慮して要約を作成する方法(特願平9−00677号)によってもよい。
【0034】
5は文書要素注目度計算部であって,構造解析された閲覧対象文書と利用者注目語をプロセス制御部20から受け取り,章・節等の文書要素毎に利用者注目語の出現密度を計算する部分である。
【0035】
7は重要度表示生成部であって,文書要素注目度計算部5の計算結果に従って,文書構造ビューの見出しに対応付けて表示する重要度表示を生成する部分である。
【0036】
8は要約文書変更部であって,要約文書を再作成するものである。
8’は要約再作成情報獲得部であって,利用者の要約編集要求をプロセス制御部20を介して受け取り,要約文書変更部8で要約文書を再作成するために必要な情報を獲得するものである。
【0037】
9は表示処理部であって,全文書ビュー,要約文書ビュー,文書構造ビューにそれぞれ全文書,要約文書,文書のアウトライン情報(重要度表示付きの見出し)を表示するための処理を行う部分である。
【0038】
21は入力部であって,入力装置から利用者によって入力される閲覧文書の指定,質問文,要約文書の編集要求等を入力するものである。
10は出力部であって,表示データを出力するものである。
【0039】
31は入力装置であって,閲覧文書の指定,質問文の入力,要約文書の編集要求等の入力を行うものである。
32は閲覧対象文書保持装置であって,閲覧対象の文書を保持する装置である。
【0040】
33は表示装置であって,閲覧文書の全部を表示する全文書ビュー,要約文書を表示する要約文書ビュー,文書のアウトライン情報(重要度表示付きの見出し)を表示する文書構造ビューにより,全文書,要約文書,文書のアウトライン情報を表示するものである。
【0041】
図2の構成の動作を説明する。
(1) 文書を閲覧する時
利用者は入力装置31により閲覧文書を指定する。そして,閲覧文書で閲覧しようとする事柄を質問文の形で入力する。
【0042】
プロセス制御部20は,指定された閲覧文書を閲覧対象文書保持装置32から入力部21を介して取り出し,表示処理部9と出力部10を介して全文書ビューを表示装置33に表示するとともに,見出し抽出部3に与えて閲覧文章を構成する章・節等の文書要素とそれに付与されている見出しを抽出する。また,入力された質問文を注目語抽出部4に与えて利用者注目語を抽出し,得られた利用者注目語リストと閲覧文章(文書要素とその見出し)を文書要約部2と文章要素注目度計算部5に与えて,閲覧文書の要約とアウトライン情報を作成する。
【0043】
文書要約部2は,閲覧文書中の文書要素毎に,それらに付けられている見出しから抽出した作成者注目語とプロセス制御部20から与えられた利用者注目語リストをマージして注目語リスト作成し,注目語に関係の深い文を抜粋することで要約を作成する(作成者注目語リストを用いずに要約を作成しても良い)。
【0044】
文書要素注目度計算部5は,利用者注目語リストをもとにそれぞれの文書要素の注目度を計算する。注目度は,章・節等の文書要素で使用されている注目語の数を文書要素の数で割って,1文字当たりの出現数に規格化されたもの(出現密度)である。注目度の計算方法はこの方法に限られるものではなく,他の計算方法でも良く,また,利用者注目語の両方を考慮して計算しても良い。重要度表示生成部7は,文書要素の注目度をもとに,重要度表示を作成する。重要度表示は,利用者が要約文書を拾い読みする場合などに,いずれの部分を読めばよいかの指標となるよう,文書のアウトライン情報において見出しと対応づけて表示する記号である。
【0045】
最後にプロセス制御部20は,作成した文書とアウトライン情報を表示処理部9と出力部10を介して表示装置33上に要約文書ビューと文書構造ビューを表示する。
【0046】
(2) 要約文書の表示の切替え
利用者は,文書要約部2の作成した要約文書を要約文書ビューの表示により閲覧する。その時,要約文書の全体が1画面に表示されるとは限らない。そのような時,利用者は,文書構造ビュー上て閲覧したい部分の見出しをポインティングデバイスにより指定し,要約文書の表示切替え要求を発行することができる。この時,表示処理部9は,要約文書の表示切替え要求を受け取り,要約文書のビューの表示内容を利用者が指定した見出しに対応する部分へと切替える。
【0047】
(3) 要約文書の編集
利用者は,自動作成した要約を自身の関心に応じて変更するよう閲覧装置に指示して,要約を変更することができる。
【0048】
まず,要約文書中に興味深い部分が見つかり,それに関する内容を要約に追加したい場合には,興味を惹いた部分を範囲指定し,要約の再作成を指示する。この時,要約再作成情報獲得部8’は,範囲指定された部分を切り出す。プロセス制御部20は,切り出された部分を対象に注目語抽出部4を使って注目語を取り出し,利用者注目語のリストに追加する。要約文書変更部8は新たな注目語リストをもとに再要約し,要約文書を変更する。
【0049】
次に要約文書中に利用者にとって必要のない部分があった場合には,不要な部分を範囲指定し,要約の再作成を指示する。この時,要約再作成情報獲得部8’は,範囲指定された部分を認識し,要約からはずすように要約文書変更部8に通知する。要約文書変更部8は,指示された部分を要約対象からはずして再要約をすることで,その部分を含まない要約を作成する。
【0050】
図3は本発明のシステム構成の実施の形態である。
図3において,
41は記憶媒体であって,磁気ディスク,CDROM等の記憶媒体である。
【0051】
42は閲覧文書入力プログラムであって,閲覧対象文書を入力するプログラムである。
43は文書要約プログラムであって,閲覧対象文書を要約するプログラムである。
【0052】
44は注目語抽出プログラムであって,注目語を抽出するプログラムである。45は文書要素注目度計算プログラムであって,文書要素の注目度を計算するプログラムである。
【0053】
46は見出し抽出プログラムであって,要約文書の見出しを生成もしくは閲覧文書に付けられている見出しを獲得するプログラムである。
47は重要度表示生成プログラムであって,見出しに対応する部分の重要度表示を生成するものである。
【0054】
48は要約文書変更プログラムであって,要約文書を変更して再作成するためのプログラムである。
49は要約再作成情報獲得プログラムである。
【0055】
文書要約プログラム43,注目語抽出プログラム44,見出し抽出プログラム46は要約文書停止プログラムを構成する。
注目語抽出プログラム44,文書要素注目度計算プログラム45,見出し抽出プログラム重要度表示生成プログラム47は文書構造提示プログラムを構成する。
【0056】
要約文書変更プログラム48,要約再作成情報獲得プログラム49は要約変更プログラムを構成する。
121コンピュータAである。
【0057】
122はメモリであって,記憶媒体41に格納されている文書閲覧プログラム(閲覧対象文書入力プログラム42,文書要約プログラム43,注目語抽出プログラム44,文書要素注目度計算プログラム45,見出し抽出プログラム46,重要度表示生成プログラム47,要約文書変更プログラム48等)あるいは閲覧文書をロードして保持する。
【0058】
123は文書閲覧プログラムであって,記憶媒体41からロードされたプログラムを表す。
124はCPUである。
【0059】
125は入出力インタフェースである。
130は記憶媒体ドライバであって,記憶媒体41の内容をコンピュータAにロードするものである。
【0060】
131は閲覧文書保持装置Aであって,コンピュータA(121)に接続されている記憶装置であり,閲覧文書を保持するものである。
135は入力装置であって,キーボード等である。
【0061】
136は表示装置であって,ディスプレイ等である。
141はコンピュータBであって,コンピュータA(121)とオンライン接続されているものである。
【0062】
142は閲覧文書保持装置Bであって,コンピュータB(141)に接続されているものであり,閲覧文書を保持するものである。
図3の構成の動作を説明する。
【0063】
記憶媒体41の各種文書閲覧プログラムが記憶媒体41を介して,コンピュータA(121)のメモリ122にロードされる。利用者は,閲覧文書保持装置A131から文書を読み出し,表示装置136に内容を表示して閲覧する。そして,必要に応じて要約を編集する。文書がコンピュータB(141)の閲覧文書保持装置B142にある場合には,コンピュータB(141)を介して閲覧文書保持装置B(142)から文書をオンラインで読み出し,コンピュータA(121)にロードして表示装置136に内容を表示して閲覧する。
【0064】
図4は本発明の文書閲覧装置で作成した要約文書の例である。閲覧文書として前述の特開平7−129605号を使用し,要約文書を作成したものである。要約は〔〕(墨付き括弧)で囲まれた文書要素単位に行い,文書のアウトライン情報では□で囲まれたそのひとつの下のレベルの見出し(
[目的],
[構成]の2つ)までを表示している(アウトライン情報に表示した見出しは,必須出力要素として要約文書に出力してある)。また,発明の名称「文書検索装置」を,文書の標題(再上位レベルの見出し)として扱った。
【0065】
実線もしくは点線の矩形の領域は1画面で表示できる領域の大きさを示す。
図5は図4の要約文書の表示画面である。図4の実線の矩形の領域が要約文書ビューで表示されている状態である。
【0066】
図5において,
51は注目語表示領域であって,図5の状態では注目語が「要約」であることを示している。
【0067】
52は要約文書ビューであって,図4の実線の矩形領域の表示である。要約文書ビューにおいて,太字で強調して表示してある語は注目語(図5では「要約」)である。
【0068】
53は文書構造ビューであって,閲覧文書の見出しが表示されている。
54は重要度表示であって,見出しに対応する部分の重要度,すなわち,見出しに対応する部分における利用者注目語の出現密度を表している。
【0069】
図5では,「構成」を見出しとする部分の重要度(利用者注目語の出現密度)が最大であり,ついで,「要約」,「発明が解決しようとする課題」を見出しとする部分の重要度が高い。以下,「特許請求の範囲」,「請求項1」,「目的」,「図面の簡単な説明」,「発明の詳細な説明」,「従来の技術」,「発明の効果」の順に重要度が低くなっていることを表している。そして,見出しが薄くなっている部分(「産業上の利用分野」,「作用」,「実施例」)には全く注目語が存在しないことを表している。また,文書構造ビューにおいて「文書検索装置」の部分が反転しているのは,(図では斜線で表わしている(各図で同じ))この見出しが要約文書ビューの先頭に表示されることを示している。
【0070】
図6は本発明の文書閲覧装置の画面の例である。
図5,図6を使って,要約文書ビューの表示の切替えの動作を説明する。
図5では「発明が解決しようとする課題」にも多くの利用者注目語が存在することが示されているが,これに対応する要約の部分(図4の点線の矩形で囲った部分)は要約文書ビューに表示されていない。利用者は,文書構造ビューの「発明が解決しようとする課題」の見出しをマウスでクリックすることで,図6に示すように,図4の点線部分を要約文書ビューに表示させることができる。この操作により,利用者は重要度表示を参考に要約文書の重要そうな部分を拾い読みすることができる。
【0071】
図7,図8,図9,図10はそれぞれ本発明の文書閲覧装置の画面の例である。
図7〜図10を使って,自動作成された要約の変更の仕方を説明する。
【0072】
利用者が自動作成された要約を変更する場合には,要約文書ビューにおいて,詳細に内容を見たい部分,あるいは逆に自分の関心のない部分等を印をつけて再要約を指示する。
【0073】
図7,図8は要約文書を編集する仕方を説明するための図である。
図7では「目的」の部分の内容が表示されていない(図7の要約文書ビューでは「・・・」によってその部分が省略されていることが示されている)。その部分を表示させるためには,利用者は次のように操作する。まず画面上で「目的」(文書構造ビュー,要約文書ビューのいずれの上でも良い)の表示を選択する。次にコンテキストメニュー(ポップアップメニュー)を呼び出し,編集用のメニューを表示させる。編集メニューで,“もっと詳しく”を選択すると,図7では「・・・」とだけなっていた部分を要約文書ビューに表示させることができる。
【0074】
図8,図7で“もっと詳しく”を選択して再要約させた後の表示の様子を示している。図8では「目的」の部分の全ての内容が表示されているが,これは,「目的」の内容が1文だけからなるためであり,この部分が複数の文からなっている場合には,一部が「・・・」として省略された要約が示されることになる。なお,図7に示されるように,「目的」の見出しに対応する部分にも注目語「要約」が含まれているが,要約を作成した単位(「要約」から「特許請求の範囲」までの間)に,より多くの注目語が出現している文(「構成」の後の1文)があるため,図8の要約では表示されなかった。
【0075】
図9〜図10は要約文書の再作成の仕方を説明するための図である。
図9は,「目的」の欄の文章に関係のある部分を要約に取り込むための操作を行う際の画面の様子を示している。この場合,利用者は次のように操作する。まず,「目的」の欄の文章をドラッグして範囲指定してから,コンテキストメニューを呼出して“もっと詳しく”を選択する(複数箇所を範囲指定する場合にはこの操作を繰り返す)。次に,コンテキストメニューを呼出して“再要約”を指示する。この操作により,指定した範囲に含まれる単語が利用者注目語として追加され,それに基づいて要約が再作成され,表示される。
【0076】
図10は,上記の操作を使って作成した後の画面を示している。図10の注目語の表示領域には,上記の操作によって15語の注目語「タイトル,一覧,・・・,利用者」が追加されたことが示されている。要約文書ビューには,その注目語を使って作成した要約が表示されている。要約文書ビューの重要度表示が図7と変わっているのは,注目語の追加によってそれぞれの文書要素の注目度を変化したためである。
【0077】
図11は本発明の文書閲覧装置で作成した要約文書の例であって,作成した要約である。
図12は本発明の文書閲覧装置で作成した要約文書の例であって,作成した要約であり,図11の要約の続きの部分である。
【0078】
図13は本発明の文書閲覧装置の処理の初期化のフローチャートであり,閲覧文書の受け入れ,注目語の入力等の初期化処理のフローチャートである。
図示のステップの番号に従ってフローチャートを説明する。
【0079】
S1 初期化処理を開始する。
S2 入力部を介して入力文書(閲覧文書),利用者からの質問文を受け入れる。
【0080】
S3 質問文が入力されたか判定する。入力されていればS4の処理を行い,入力されていなければS5の処理を行う。
S4 質問文から利用者の注目語(利用者が関心のある事柄を示す名詞)を抽出する。
【0081】
S5 閲覧文書を要約する(詳細は図14のフローチャートを参照)。
S6 文書中の各要素(章,節等)の中に現れた利用者注目語の数を数え,文書要素中の文字数で割って正規化する。
【0082】
S7 表示装置の文書構造ビューと要約ビューを開く。
S8 初期化処理を終了する。
図14は本発明の要約文書作成処理のフローチャートである。
【0083】
S1 要約処理(要約文書作成処理)を開始する。
S2 要約を作成していない部分があるか判定する。要約を作成していない部分があれば,S3の処理を行い,なければS6で要約処理を終了する。
【0084】
S3 要約を作成していない部分があれば,文章の標題および章,節の見出しから作成者注目語を抽出する。
S4 利用者注目語と作成者注目語をマージし,注目語リストを作成する。
【0085】
S5 文書要約部を呼び出して,要約を作成する。
S6 要約処理を終了する。
図15は本発明の注目語抽出の処理のフローチャートである。
【0086】
S1 注目語抽出処理を開始する。
S2 注目語抽出対象部分(注目語を抽出する対象とした領域)に形態素解析(文を単語に分解し,それらの単語の品詞(名詞,助詞,動詞等)を認定する操作)を施す。
【0087】
S3 品詞を手掛かりに注目語を抽出する。
S4 注目語抽出処理を終了する。
図16は本発明の文書要約処理(文抜粋処理)のフローチャートである。
【0088】
S1 文抜粋処理を開始する。
S2 注目語リストが空か判定する。空でなければS3の処理を行い,空であればS6の処理を行う。
【0089】
S3 注目語リスト中の注目語の出現数によって要約対象文書中の各文の注目情報量を求める。注目情報量としては,最も単純には,章もしくは節におけるひと区切りの文において使われている注目語の数をそのまま評価値として用いればよい。あるいは,文で使われている注目語の種類(異なり数)と延べ繰り数を別々に記録しておいて,次のステップS4で注目情報量を比較する際に,まず異なり数を比較し,同じである場合にだけ延べ数を比較するようにしてもよい。また,個々の注目語に重み等をつけて評価値を求めてもよい。
【0090】
S4 要約対象文書中の必須出力部分(例えば,見出しの文章,利用者の指定した部分の文章等)以外から注目語情報量最大の文を選択する。例えば,章もしくは節の各文においてS4で求めた評価値が最大の文を選択する。
【0091】
S5 選択した文に現れている注目語を注目語リストから除く。例えば,前述の5種類の注目語のうち4種類が使用されていれば,残りの1種類のみを残して注目語リストから除く。
【0092】
S6 選択した文と必須出力部の文をマージし,もとの文書中での出現順に並べる。
S7 文抜粋処理を終了する。
【0093】
図17は本発明のプロセス制御部の要約変更の処理のフローチャートである。
S1 処理を開始する。
S2 利用者の入力を待つ。
【0094】
S3 入力があり,マウスのクリックでコンテキストメニュー表示を指定したのであればS5の処理を行い,ドラッグで範囲したのであればS4の処理を行う。
【0095】
S4 S3でドラッグで範囲指定されたので,ドラッグ範囲を選択範囲として記憶する。
S5 S3でコンテキストメニュー表示を選択されたのでコンテキストメニューを表示し,利用者の選択を待つ。
【0096】
S6,S7 選択項目としてもっと詳しくが選択され,選択範囲が見出しでなければS8の処理を行い,選択範囲が見出しであれば,S9の処理を行う。
S8 選択範囲(その直前にドラッグによって指定された範囲)を注目語抽出対象部として利用者注目語を抽出する(注目語の抽出は図15による)。
【0097】
S9 見出しに対応する本文部分から1文を追加選択し,要約に追加する。
S6,S10,選択項目として,これで十分が選択された時,選択範囲が見出しでなければS11の処理を行い,見出しであれば,S12の処理を行う。
【0098】
S11 選択範囲を必須出力部とする。
S12 見出しに対応する本文部分で要約に含まれている部分を必須出力部とする。
【0099】
S6,S13 不要が選択され,選択範囲が見出しでなければ,S14の処理を行い,選択範囲が見出しであればS15の処理を行う。
S14 選択範囲を要約対象から外す。
【0100】
S15 見出しに対応する本文部分で要約に含まれている部分を要約対象から外す。
S16 S6で要約再作成が選択されれば,閲覧文書の要約を再作成をする(図14のフローチャートに従う)。
【0101】
【発明の効果】
本発明の方法によれば,利用者は,自分の注目している情報を核とした要約を閲覧することができ,また,提示された要約の中から関心のある事柄を選んでそれに関する内容を要約に取り入れるよう指示することができるので,次々に関連の部分を閲覧していくことができるようになる。
【0102】
また,文書構造ビューに利用者の注目している情報が文書のどのあたりに多く出現しているのかが示されるので,文書構造ビューに示される見出しが理解できない場合でも,効率良く閲覧したい情報を見つけ出すことが可能になる。
【図面の簡単な説明】
【図1】本発明の基本構成を示す図である。
【図2】本発明の装置構成の実施の形態を示す図である。
【図3】本発明のシステム構成の実施の形態を示す図である。
【図4】本発明の文書閲覧装置で作成した要約文書の例を示す図である。
【図5】本発明の文書閲覧装置の画面の例を示す図である。
【図6】本発明の文書閲覧装置の画面の例を示す図である。
【図7】本発明の文書閲覧装置の画面の例を示す図である。
【図8】本発明の文書閲覧装置の画面の例を示す図である。
【図9】本発明の文書閲覧装置の画面の例を示す図である。
【図10】本発明の文書閲覧装置の画面の例を示す図である。
【図11】本発明の文書閲覧装置で作成した要約文書の例を示す図である。
【図12】本発明の文書閲覧装置で作成した要約文書の例を示す図である。
【図13】本発明の文書閲覧装置の初期化のフローチャートを示す図である。
【図14】本発明の要約文書作成の処理のフローチャートを示す図である。
【図15】本発明の注目語抽出の処理のフローチャートを示す図である。
【図16】本発明の文書要約部における文書要約処理(文抜粋処理)のフローチャートを示す図である。
【図17】本発明の要約変更の処理のフローチャートを示す図である。
【符号の説明】
A:要約文書提示手段
B:文書構造提示手段
1:文書閲覧装置
2:文書要約部
4:注目語抽出部
5:文書要素注目度計算部
3:見出し抽出部
7:重要度表示生成部
8:要約文書変更部
9:表示処理部
10:出力部
11:編集要求入力部
12:閲覧文書
13:質問文入力部

Claims (5)

  1. 電子ファイル化された文書を入力し,要約を自動作成して出力する文書閲覧装置において,
    利用者に関心のある内容を示す注目語を元にして閲覧文書の要約を自動作成して表示する要約文書提示手段と,文書の骨組みを示す見出しと文書の重要箇所を示す重要度表示とを含む文書のアウトライン情報を作成して表示する文書構造提示手段と,作成した要約を利用者の指示に従って変更する要約変更手段とを備え,
    閲覧文書の要約を要約文書表示領域に表示し,閲覧文書のアウトライン情報を文書構造表示領域に表示し,利用者からの変更要求に応じて閲覧文書の要約を再作成することを特徴とする文書閲覧装置。
  2. 要約文書提示手段は利用者から与えられた質問文もしくは閲覧文書中の部分から注目語を求める注目語抽出部と,閲覧対象文書を入力して該注目語の使用されている文章の部分をもとに対象文書の要約を作成する文書要約部と,要約された文書を変更する要約文書変更部とを備え,
    文書構造提示手段は要約文書の文書の骨組みを示す見出しを抽出する見出し抽出部と,対象文書の文章要素において使用されている注目語の数をもとに文章要素の注目度を計算する文書要素注目度計算部と,文章要素の注目度に応じて文章の内容の重要度表示を生成する重要度表示生成部とを備えることを特徴とする請求項1に記載の文書閲覧装置。
  3. 注目語抽出部は閲覧文書に固有な作成者注目語と利用者から与えられる利用者注目語の双方を含む注目語リストを生成し,文書要約部は該注目語リストに基づいて要約を作成することを特徴とする請求項2に記載の文書閲覧装置。
  4. 要約文書変更部は,利用者が不要な部分を要約から削除し,利用者が関心を示した部分から注目語を抽出してその注目語に関連した文章の部分を要約に追加することで要約を再作成することを特徴とする請求項2もしくは3に記載の文書閲覧装置。
  5. 電子ファイル化された文書を入力し,要約を自動作成する文書閲覧装置のプログラムを格納した記憶媒体において,
    利用者に関心のある内容を示す注目語を元にして閲覧文書の要約を自動作成して表示する要約文書提示プログラムと,文書の骨組みを示す見出しと文書の重要箇所を示す重要度表示とを含む文書のアウトライン情報を作成して表示する文書構造提示プログラムと,作成した要約を利用者の指示に従って変更する要約変更プログラムとを備え,
    閲覧文書の要約を要約文書表示領域に表示し,閲覧文書のアウトライン情報を文書構造表示領域に表示し,利用者からの変更要求に応じて閲覧文書の要約を再作成することを特徴とするプログラムを格納した記憶媒体。
JP02085298A 1998-02-02 1998-02-02 文書閲覧装置およびそのプログラムを格納した記憶媒体 Expired - Fee Related JP3718044B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02085298A JP3718044B2 (ja) 1998-02-02 1998-02-02 文書閲覧装置およびそのプログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02085298A JP3718044B2 (ja) 1998-02-02 1998-02-02 文書閲覧装置およびそのプログラムを格納した記憶媒体

Publications (2)

Publication Number Publication Date
JPH11219361A JPH11219361A (ja) 1999-08-10
JP3718044B2 true JP3718044B2 (ja) 2005-11-16

Family

ID=12038639

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02085298A Expired - Fee Related JP3718044B2 (ja) 1998-02-02 1998-02-02 文書閲覧装置およびそのプログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JP3718044B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001175673A (ja) * 1999-12-20 2001-06-29 Sharp Corp 電子書籍表示装置及び電子書籍表示プログラムを記憶した記憶媒体
AU2001237017A1 (en) * 2000-02-17 2001-08-27 Digimarc Corporation Watermark encoder and decoder enabled software and devices
JP4088176B2 (ja) * 2003-03-11 2008-05-21 日本放送協会 質問応答装置及び質問応答プログラム
CN101526938B (zh) * 2008-03-06 2011-12-28 夏普株式会社 文档处理装置
JP5884740B2 (ja) * 2011-02-15 2016-03-15 日本電気株式会社 時系列文書要約装置、時系列文書要約方法および時系列文書要約プログラム
JP6817690B2 (ja) * 2015-03-30 2021-01-20 日本電気株式会社 抽出装置、抽出方法とそのプログラム、及び、支援装置、表示制御装置
JP6860472B2 (ja) * 2017-12-28 2021-04-14 株式会社日立ソリューションズ 会議の音声データから要約書を作成する方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2937519B2 (ja) * 1991-03-08 1999-08-23 株式会社東芝 文書検索装置
JPH06259424A (ja) * 1993-03-02 1994-09-16 Ricoh Co Ltd 文書表示装置及び文書要約装置並びにディジタル複写装置
JP3383049B2 (ja) * 1993-09-13 2003-03-04 株式会社東芝 文書検索装置

Also Published As

Publication number Publication date
JPH11219361A (ja) 1999-08-10

Similar Documents

Publication Publication Date Title
KR100345945B1 (ko) 텍스트및이미지문서를동기시켜표시하며조작하기위한방법및장치
JP3614648B2 (ja) 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体
US6792475B1 (en) System and method for facilitating the design of a website
US6177933B1 (en) Providing visual continuity when displaying related information
US6370551B1 (en) Method and apparatus for displaying references to a user's document browsing history within the context of a new document
JPH0352098B2 (ja)
US5129052A (en) Dynamic selection of recursively nested logical element data formats
JPH04229364A (ja) 強調特性変更方法及びシステム
JP3718044B2 (ja) 文書閲覧装置およびそのプログラムを格納した記憶媒体
Diaz et al. The mathdeck formula editor: Interactive formula entry combining latex, structure editing, and search
JPH11184865A (ja) 文書要約装置
JP2957875B2 (ja) 文書情報検索装置及び文書検索結果表示方法
JP3308153B2 (ja) マルチメディア情報高次元化表示システム
JP2000250908A (ja) 電子書籍の作成支援装置
JP2003091344A (ja) 情報処理装置および情報処理方法、記録媒体、データ構造、並びにプログラム
JP2766261B2 (ja) 文章要約システム
JP2004157965A (ja) 検索支援装置、検索支援方法、プログラムおよび記録媒体
JP2947686B2 (ja) 翻訳支援システムにおける検索結果表示方式
JPH11203305A (ja) 文書画像処理方法および記録媒体
JP3710463B2 (ja) 翻訳支援辞書装置
JP2868256B2 (ja) プログラム編集装置
JP2003223466A (ja) 特許検索装置、特許検索装置の制御方法、制御プログラムおよび記録媒体
JP3788864B2 (ja) 関連語自動抽出装置及び方法並びに情報記憶媒体
JP3112298B2 (ja) プログラムテキスト編集装置
JPH10320409A (ja) 文書情報抽出方法及び装置並びに文書抽出処理プログラムを記憶した記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050830

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050901

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080909

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090909

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090909

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100909

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100909

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110909

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120909

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120909

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130909

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees