JP3383049B2 - 文書検索装置 - Google Patents

文書検索装置

Info

Publication number
JP3383049B2
JP3383049B2 JP34952993A JP34952993A JP3383049B2 JP 3383049 B2 JP3383049 B2 JP 3383049B2 JP 34952993 A JP34952993 A JP 34952993A JP 34952993 A JP34952993 A JP 34952993A JP 3383049 B2 JP3383049 B2 JP 3383049B2
Authority
JP
Japan
Prior art keywords
document
sentence
chapter
unit
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34952993A
Other languages
English (en)
Other versions
JPH07129605A (ja
Inventor
一男 住田
誠司 三池
悦雄 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP34952993A priority Critical patent/JP3383049B2/ja
Publication of JPH07129605A publication Critical patent/JPH07129605A/ja
Application granted granted Critical
Publication of JP3383049B2 publication Critical patent/JP3383049B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の文書を格納した
文章データベースから所望の文書を検索提示する文書検
索装置に関する。
【0002】
【従来の技術】近年、ワープロや計算機の普及、電子ニ
ュースや電子メールの普及、従来紙の上でしか得られな
かった情報のCDROMによる出版(辞書、百科事典な
ど)など、文書の電子化が進みつつある。今後、このよ
うな文書の電子化は加速的に進んでいくと予測される。
【0003】これにともない、蓄積した文書を有効利用
するため、大量の文書から所望の文書を検索する情報検
索システムの需要が増加しつつある。
【0004】従来型の文書情報検索システムにあって
は、キーワードなどの検索命令の指定に従って、一定の
順序(例えば、キーワードと類似する文書の順)で検索
結果の文書のタイトルを並べて表示するだけであった。
このため、検索した文書間の相対的な関係や、検索命令
との類似性の度合が利用者に実感できず、検索結果の妥
当性を利用者が直感することが難しかった。
【0005】従来型の文書情報検索システムにあって
は、検索した結果が所望の文書であるか否かを利用者が
判定するために、個々の文書の全文を詳細に読むという
作業を行わなければならず、所望の文書を得るまでに多
大な時間を要していた。
【0006】検索した結果の一部だけを表示すること
で、全文を読まなければならない手間を軽減することが
できる。しかし、その表示した一部分が文書において他
の部分とどのような関係にあるかが明らかでなければ、
その文書が所望の文書であるかどうかが判定できない。
例えば、ある文書について背景情報を述べている部分が
表示され、また他の文書について結論を述べている部分
が表示された場合、統一した視点で見渡すことができな
いため、いずれの文書が必要であるかを判定することが
困難である。したがって、表示した部分が全文に対して
どのような位置付けにあるかを理解するためには、全文
を読まなければならず、結果的に手間の軽減にならな
い。
【0007】また、格納されている個々の文書の要約文
章を人手で作成し、これを原文書に対応づけて格納して
おくことができる。検索結果の表示において、この要約
文章を表示することで、利用者の検証の手間を軽減する
ことが可能である。しかるに、要約文章を人手で作成す
るには多大な時間を要し、よほど利用規模の大きいデー
タベースでなければ、到底用意できないものである。ま
た、これまで個々の文書についての要約が準備されてい
ないようなデータベースも存在しており、それらについ
て人手で要約を作成することは多大な費用と労力を要す
る。
【0008】さらに、人手で作成した要約文章は、ごく
一般向けに作成されるため、利用者の目的に合った視点
で要約されているとは限らない。このため、利用者にと
っては、ピント外れの文章となっている場合があり、所
望の文書であるかどうかを判定する時に、必要な文書を
見過ごしてしまうことがあるという問題点もあった。ま
た、人手で作成した要約文章は、利用者の必要に応じて
その長さを変えるということができない。このため、利
用者が要約文章を読んでいる際に、その部分をより詳し
く読みたいと思っても、対応する原文やより詳しい要約
を提示することができず、全文を提示したりプリントア
ウトするなどして全文を読まなければならず、このよう
な場合については検索した文書を読む手間は軽減されな
いという問題点がある。
【0009】例えば、PATOLISでは検索結果の複
数の要約を同時にリストアップすることができるもの
の、利用者が検索結果のより詳しい内容を知りたい場合
は、新たにその文書をプリントアウトしなければならな
い。その結果、検索行為に関わる手間が軽減される度合
が低かった。
【0010】
【発明が解決しようとする課題】本発明は、上述のよう
な事情を考慮してなされたもので、利用者の要求に応じ
て詳細度の変化させた要約文章を対話的に提示すること
のできる文書検索装置を提供することを目的とするもの
である。
【0011】
【課題を解決するための手段】本発明の文書検索装置に
おいては、文書のタイトル情報から章立ての構造を解析
する書式解析手段と、該書式解析手段で得られた各章の
文章について可変長の要約文章を生成する要約生成手段
と、検索結果で得られた複数の文書についての要約を同
時に提示する検索結果提示手段と、該検索結果提示手段
で提示された要約文章の一つを選択することをきっかけ
としてさらに詳しい要約文章あるいは原文書を提示する
とともに、提示されているその要約文章上の章や節のタ
イトル、段落、文を指定する手段を有し、指定した部分
に対応する要約文章あるいは原文を表示中の要約文章に
挿入する要約文章提示手段を有する。
【0012】書式解析手段では、文書における各章や節
に付与されているタイトルやヘディング、改行と空白文
字の出現の関係から、原文書の章立ての構造を解析す
る。
【0013】要約生成手段は、書式解析手段が解析して
得た章立ての構造に基づいて、各章に含まれる文章の要
約文章を生成する。この要約生成では生成する要約文章
の長さを可変にすることが可能である。
【0014】検索結果提示手段では、検索結果として得
られた複数の文書について、それぞれタイトル、著者
名、要約を提示する機能を有する。また、提示された複
数の文書のうち1つを選択する機能を有し、要約文書提
示手段を起動して選択された文書のより詳しい要約文章
を提示する。
【0015】要約文書提示手段では、少なくとも検索結
果提示部で提示されている要約文章より詳しい要約文章
を提示するとともに、提示されている要約文章中のヘデ
ィングや段落、文の一部を指定する機能を有する。利用
者が適宜この指定を行うことにより、対応する部分のさ
らに詳しい要約(原文も含む)を、提示している要約文
章中に挿入する。
【0016】
【作用】簡単なタイトルと要約が検索結果の複数の文書
に同時に表示されるので、読む必要のない文書まで読ま
なければならないと言う手間が大幅に削減される。ま
た、提示されている要約文章の詳しさでは十分でない場
合、対応箇所を詳細に表示することを動的に指定できる
ので、必要最少限の労力で検索結果で得られた文書の内
容を利用者は理解できるようになる。これにより検索行
為の効率を向上させることが可能になる。
【0017】
【実施例】本発明の実施例を図面に基づいて説明する。
【0018】図1は、実施例を構成する上で必要となる
機器の構成を示す構成図である。中央処理手段1、半導
体メモリや磁気ディスク、光ディスクなどの記憶手段
2、CRTディスプレイや液晶ディスプレイ、プラズマ
ディスプレイなどのディスプレイなどの表示手段4、表
示を制御する表示コントローラ3、キーボードやマウ
ス、ペンなどの入力手段6、入力を制御する入力コント
ローラ5からなる。
【0019】図2は、実施例における機能構成を示した
ブロック図である。入力部11、検索処理部12、書式
解析部13、要約生成部14、文書構造記憶部15、要
約文章記憶部16、検索結果提示部17、要約文章提示
部18、全体システムを制御するシステム制御部19か
らなる。テキストデータベース20には検索の対象とな
るテキストデータが格納される。
【0020】図3は、実施例の文書検索装置の全体を制
御するシステム制御部19の処理の流れを図示してい
る。
【0021】入力部11は、検索命令となるキーワー
ド、および自然言語文の入力を受け付ける。
【0022】まず始めに、システム制御部19は、入力
部への検索命令入力を検知して、検索処理部12を起動
する。検索処理部12は、検索命令に従ってテキストデ
ータベース20から対応する文書を検索する(ステップ
31)。
【0023】次に、システム制御部19は、検索処理部
12の処理の終了を検知して、書式解析部13を起動す
る(ステップ32)。書式解析部13は、検索結果の各
文書の章構成を解析し、文書構造記憶部15に格納す
る。
【0024】次に、システム制御部19は、書式解析部
13の処理の終了を検知して、要約生成部14を起動す
る。要約生成部14は、検索結果の文書の各章の要約を
生成し、要約文章記憶部16に格納する(ステップ3
3)。
【0025】次に、システム制御部19は、要約生成部
14の処理の終了を検知して、検索結果提示部17を起
動する(ステップ34)。検索結果提示部17は、文書
構造記憶部15に格納された検索結果の各文書の文書構
造および要約文書記憶部16に格納された要約文章に従
って図1に図示する表示手段4に検索結果のリストアッ
プを行う(ステップ35)。
【0026】表示された検索結果のリストアップから1
つの文書が選択された場合、システム制御部19は、要
約文章提示部18を起動する。要約文章提示部18は、
前記検索結果提示部17で選択された文書の要約文章を
提示するとともに、利用者の指示に従って指示された文
書位置に対応する部分の要約の詳細度を変えて、その位
置に挿入し表示する。
【0027】検索処理部12は、本願の発明の主旨では
なく、全文検索システムなどですでに実施されている手
法を利用することにより実現される。
【0028】図4乃至図6に書式解析部13の処理の流
れを図示する。
【0029】処理は、タイトル検出パタンに基づいて解
析を行う。検出パタンの一例を図5に示す。パタンは、
レベル0として文書の章タイトルを検出するパタン、レ
ベル1として章を構成する節タイトルを検出するパタ
ン、さらには、より下位のレベルの節のタイトルを検出
するパタンをあらかじめ設定しておく。
【0030】図7において、記号“^”は行の先頭と、
“Snumber ”は数字と、“Sstring”は任意の文字列
と、“\n ”は改行と、それぞれ照合することを意味し
ている。例えば、レベル0の検出パタン“^[Snumber
]Sstring \n ”は、行の先頭に“[1]はじめに”
という文字列が存在した場合、その行と照合が成功する
ことになる。また、解析した結果は、例えば図8に示す
形式の図2に図示する文書構造記憶部15に格納する。
【0031】書式解析部13では、まず始めに、文書が
格納されているバッファの先頭アドレスへのポインタを
P、文字数をN、タイトルの検出レベルをOとして処理
を始める。章カウンタをOと設定するとともに、Pなら
びにNをそれぞれ、文書構造記憶部15のタイトルポイ
ンタおよび文字数に格納する。
【0032】検出パタンと照合する文字列が存在する位
置を探す。最初に、検出パタンと照合した文字列の先頭
アドレスを本文ポインタとして本文ポインタ(章カウン
タ+1)に格納する。そして、章カウンタの値を1だけ
増やす。順次、この処理を繰り返すことにより、本文ポ
インタ1、本文ポインタ2、本文ポインタ3へ、それぞ
れ章の先頭アドレスを格納していく。文書が格納されて
いるバッファも字数Nに対して処理が終了すると、文書
構造記憶部15に章の数が章カウンタ、それぞれの章へ
の先頭アドレスが、本文ポインタ1から本文ポインタn
へ格納されている。本文ポインタ1の指す最初の章か
ら、処理を行う。本文ポインタTの値をタイトルポイン
タTに格納する。さらに、本文ポインタT+1との差か
らも字数を求め、文字数Tに格納する。その後、タイト
ルポインタTのアドレスを本文ポインタTに格納する。
章カウンタTの値はOと設定する。
【0033】レベル1の検出パタンに照合する文字列が
存在する位置を探す。検出パタンと照合する文字列の先
頭アドレスを本文ポインタ(T,章カウンタ+1)に格
納し、章カウンタTを1増やす。これを繰り返すことに
より、節構造を得る。章Tに対して、章カウンタTの値
が0であった場合は、節が存在しなかったことを意味し
ている。そこで、その場合は、章のタイトルの次の文字
のアドレスを本文ポインタ(T,1)に格納する。すべ
ての章について以上の処理を行うことにより、章−節構
造を得る。
【0034】図4は、節の下位構成まで解析する場合の
流れを示している(例えば、“2.3.4”というよう
な章番号のタイトルを持つレベルまでの解析処理)。
【0035】書式解析部13で解析した文書構造は、文
書構造記憶部15に格納される。例えば、図9に示すよ
うな文書の場合、処理の結果、文書構造記憶部15に
は、図10に示すような値がそれぞれ設定される。
【0036】図11に、要約生成部14の構成を図示す
る。
【0037】本実施例における要約生成部14は、文脈
構造解析部41、ペナルティ計算部42、文章再構成部
43からなる。文脈構造解析部41は、文書中で用いら
れている修辞的な表現を抽出し、各章あるいは節の文章
部分の論理的な構造を解析する。ペナルティ計算部42
は、解析した文脈構造に基づいて各文の重用度について
のペナルティの計算を行う。
【0038】文脈構造解析部41における処理自体は、
本願の発明の主旨ではない。例えば文献(A Discourse
Structure Analyzer for Japanese Text,K.Sumita,Int.
Conf.on Fifth Generation Computer ´92)で開示さ
れている方法を用いることができる。この処理により、
図12の(b)に示す文章に対して、図12の(a)に
示す文脈構造を得ることができる。図示した文脈構造
は、第2文が第1文に対して「展開」という関係にあ
り、さらに第3文が第1文と第2文に対して「予定」と
いう関係にあることを表している。
【0039】文脈構造は、図13に示すデータ構造で要
約文章記憶部15に記憶する。データ構造は、そのノー
ドの持つ関係(文脈構造.Rel)と、左右のノードへ
のリンク(文脈構造.L、文脈構造.R)を表現してい
る。ただし、終端ノードの場合、文脈構造.Relには
対応する文へのポインタを、また文脈構造.Lと文脈構
造.Rには−1をそれぞれ格納する。
【0040】図14にペナルティ計算部42の処理の流
れを示す。ペナルティ計算部42は、ペナルティ計算を
再帰的に行うことにより処理を進める。処理が終わった
段階でペナルティの小さい終端ノードが、より重要であ
ることになる。
【0041】ペナルティ計算は、文脈構造解析部41で
解析した文脈構造、ならびにペナルティの初期値を入力
とする。始めに、文脈構造が終端ノードか否かを判定す
る。文脈構造.Lに格納されている値が−1である場
合、終端ノードであるので、入力されたペナルティを文
脈構造.Pに設定する。
【0042】一方、文脈構造.Lに格納されている値が
−1でなければ、終端ノードではなく、非終端ノードで
ある。この場合、文脈構造.Relに格納されている関
係が右重点型か左重点型か、あるいはそのいずれでもな
いかの判定を行う。この判定は、予め記憶しておいた関
係テーブルに基づいて行う。関係テーブルの一例を下に
示す。 順接 右重点型 予定 左重点型 例示 左重点型 上記のテーブルは、「順接」という関係が右重点型であ
ることを表している。
【0043】文脈構造.Relに格納されている関係が
右重点型である場合、右ノードの方が重要であるから、
ペナルティPにペナルティP1を足し合わせた値を左ノ
ードの側のペナルティ計算に与え、ペナルティPを右ノ
ードの側のペナルティ計算に与える。
【0044】逆に、文脈構造.Relに格納されている
関係が左重点型である場合、左ノードが重要であるの
で、ペナルティPを左ノードの側のペナルティ計算に与
え、ペナルティPにペナルティP1を足し合わせた値を
右ノードの側のペナルティ計算に与える。
【0045】また、文脈構造.Relに格納されている
関係が右重点型でも左重点型でもない場合、左右のノー
ドそれぞれについてのペナルティ計算には、ペナルティ
Pがそのまま引き渡される。
【0046】以上の再帰的な処理により、重用度の高い
文のペナルティには小さい値が、一方、重用度の低い文
のペナルティには大きい値が設定されることになる。そ
して、各文についてのペナルティが、要約文書記憶部1
5に格納される。
【0047】文章再構成部43の処理の流れを図15に
示す。文章再構成部43では、ペナルティ計算部42で
求めた全ての文のペナルティを参照し、予め定めたペナ
ルティ以下の文を取り出す。そして、接続表現の変更を
行い要約文を生成する。例えば、次のような文章を仮定
する。(ここで1、2、3は文を表現する)。 1 “よい建築物を作るためにはよい材料が必要であ
る。” 2 “しかし、よい道具も必要である。” 3 “つまり、材料だけではダメである。” そして、この文章に対応する文脈構造が次のような構造
であること。 (1 <逆接> (2 <重複> 3)) さらに、ペナルティ計算部により文1と文3がより小さ
いペナルティを与えられていると仮定する。
【0048】文1と文3を単純につなげた場合、原文と
論理的に異なる次のような文章が生成される。“よい建
築物を作るためにはよい材料が必要である。”“つま
り、材料だけではダメである。”そこで、接続表現の変
更では、キーセンテンスと判定された文間の最も上位の
関係に対応する接続表現に付け代える。上記の例では、
文1と文3の間の最も上位の関係は、<逆接>であるの
で、この関係に対応する接続表現「しかし」に置き換え
ることにより、次のような文章を生成する。“よい建築
物を作るためにはよい材料が必要である。”“しかし、
材料だけではダメである。”文章再構成部43により、
原文と論理的に整合性のある要約文が生成される。ま
た、文章再構成部43におけるペナルティP2の値を変
化させることにより、要約文として生成する文の量を制
御することができる。したがって、利用者がこのペナル
ティP2を設定し直すことにより、表示される要約文の
量を制御することが可能である。
【0049】図16に検索結果提示部17の処理の流れ
を図示する。
【0050】まず始めに、検索結果の各文書に対して、
文書構造記憶部15に格納されている文書からタイトル
と著者名を取り出す。例えば、図9に図示した文書例に
対しては、「文書の自動レイアウトシステム」というタ
イトルと「山田太郎、佐藤花子」という著者名が取り出
される。
【0051】次に、前記のステップに対応して要約文章
記憶部16から「概要」部分に対応する文脈構造を取り
出す。そして、図15に図示した文章再構成処理43を
起動し、「概要」部分の要約文章を生成する。そして、
図1に図示した表示手段4に対して、図17に示すよう
な検索結果のリストアップ表示を行う。例えば、図9に
図示した文書に対しては、次のように一番上に図示され
ているという表示が行われる。 「文章の自動レイアウトシステム 山田太郎、佐藤花子 本稿では、その技術的な詳細について解説する。」 表示を行った後、検索結果提示部17はマウスなどポイ
ンティングデバイスからの入力イベントを待つ。利用者
がマウスによってリストアップされている一つの文書を
選択した場合、選択された文書に対して要約文章提示部
18を起動する。図18に要約文章提示部18の処理の
流れを図示する。また、図19から図22に要約文章提
示部18における表示例を図示する。
【0052】まず始めに、要約文章提示部18では、検
索結果提示部17で選択された文書の要約文章を表示す
る。この表示では、検索結果提示部17と同様にタイト
ル、著者名、概要部分を表示するとともに、文書構造記
憶部15を参照して文書の各章の見出しも表示する。図
19は、図17に図示したリストアップから最初の文書
を選択した場合の表示例を図示したものである。
【0053】次に、利用者により表示の入力が行われ、
それが詳細度変更のコマンドであった場合、指定された
位置から章番号を求めるとともに、図20に図示するよ
うに詳細度入力メニューを表示する。そして、利用者が
詳細度を入力することにより、例えば、以下の式によっ
て文章再構成部43が生成する際のペナルティP2を決
定し、対応する章の要約文章を生成する。 P2=C×(詳細度) ここで、Cは予め定められた定数である。
【0054】次に、要約文章提示部16は、改めて生成
した要約文章を始めに表示した要約文章に挿入して表示
する。この様子を図21に図示している。図21に斜線
で囲んだ部分は、新たに生成した要約文章のうちの追加
部分である。
【0055】図21では、概要部分を指定して、その部
分の要約文章の詳細度を変更して表示したが、図22に
図示したように各章の見出し部分が指定された場合は、
その指定された章の要約を新たに表示することになる。
【0056】要約文章提示部18は、以上の処理を繰り
返し行う。これにより、利用者は所望の章の要約文章の
詳細度を変更することができる。詳細度を100%にし
た場合、原文が表示されることになる。
【0057】実施例の要約生成部14では、文脈構造を
解析することにより要約文章を生成したが、その他の従
来より開示されている手法(例えば、使われている単語
の頻度を求めて、頻度の高い単語を含む文を取り出す手
法、あるいは、単純に文章の前方から順に文を切り取っ
て来る手法など)など利用するように変形することは容
易である。
【0058】また、実施例の検索結果提示部17は、文
章再編成部43で生成した要約文章をそのまま表示して
いる。このため、図17に図示したように第3番目の文
書については、要約文章が3行に亘って表示されてい
る。しかし、これを、次に示すように要約文章の部分を
一定の長さに制限して提示するようにすることも可能で
ある。 「DSIのCAD 田中一夫 各種のLSIのCADの中で、EAの代表として、 カスタムVLSICADとアナログレイアウトCAD」 実施例の要約文章提示部18では、起動時点では、タイ
トル、著者名、概要部分の要約文章、各章の見出しを表
示したが、これを例えば、後書きの部分についての要約
文書を提示するように変形することは容易である。同様
に様々な形態での表示を行えるように利用者がカスタマ
イズできるようにすることも可能である。また、実施例
では、図20に図示したように逐一詳細度を設定するよ
うにしているが、詳細度を一定の比率で増加させるよう
にすることにより、逐一設定することを省略することも
可能である。
【0059】実施例の検索処理部12は、検索装置内に
もちローカルなテキストデータベースを対象にして検索
処理を行っているが、これをオンラインでアクセスする
形態のデータベースに変更することも容易である。
【0060】又、複数の要約文の提示を同時に行ったが
順々に提示してもよいし、所定個ずつ分割して提示して
もよい。又さらに上述した利用者の要求に応じた詳細度
は外部から指定することも可能である。
【0061】次に、図23ないし図26を参照して他の
実施例を説明する。
【0062】この実施例は、図2の要約文書提示部18
の処理内容以外は先の実施例と同じであり、同一部分に
ついては詳細な説明を省く。
【0063】図23は、この実施例に従った要約文書提
示部18の処理の流れを示している。この処理の流れに
よると、スタートで、まず、レベル0からレベルMまで
の章あるいは節などのタイトルを図25の(a)に示す
ように表示する。その後、入力イベントを待つ。入力が
あると、入力が詳細度変更コマンドか否かを判定する。
この判定がYESであれば、レベルMはレベルの最大値
であるかを判定するステップに進み、NOであれば、終
了コマンドか否かを判定するステップに進む。
【0064】レベルMの判定結果がNOであれば、Mを
1つインクリメントし、最初のステップに戻り、YES
ならカーソルの位置が含まれる章あるいは節などのレベ
ルLと章番号Qを求める。この後、詳細度入力メニュー
を表示し、詳細度の入力を待つ。詳細度コマンドが指定
されると、図24の(b)に示すように節の見出しが追
加表示される。さらに、図25の(a)に示すように、
3.2節の(1)と(2)の見出しが表示される。
【0065】さらに、詳細度コマンドが指定されると、
カーソルにより指示されている2.1節の抄録文章が図
25の(b)に示すように表示される。このとき、カー
ソルが第2章の見出しの位置に置かれていた場合には、
図26に示すように第2章の見出しの直後に、2.1節
および2.2節の文章の抄録文が表示される。
【0066】次に、入力された詳細度に従って文書再構
成処理を行う。この文書再構成処理により生成された要
約文書を表示中のテキストに挿入する。この後、章番号
Qがインクリメントされ、章番号の章あるいは節などの
レベルがLより小さいか否かが判定される。この判定が
YESであれば、文書再構成処理のステップに戻り、N
Oであれば、入力イベント待ちのステップに戻る。
【0067】入力が詳細変更コマンドか否かを判定する
上述した判定ステップにおいて、判定がNOであれば、
入力が終了コマンドか否かが判定され、終了コマンドで
あれば、ウィンドウを消去し、動作が終了するが、この
判定がNOであれば、入力イベント待ちのステップに戻
る。
【0068】以上に説明したように、上記実施例による
と、詳細度コマンドの指定に従って抄録文章を表示し、
入力された詳細度に従って文書再構成処理を行うことに
よって要約文書を作成し、この要約文書を検索に適用し
ているので、文書検索において、必要最小限の労力で検
索対象の文章の内容を利用者に理解させることができ
る。
【0069】本発明は、上記実施例に限定されず、発明
の主旨を逸脱しない範囲において様々な変形を行うこと
ができる。
【0070】
【発明の効果】以上説明したように、本発明の文書検索
装置では、指定する章や節を個別に詳細度の異なる要約
文章として動的に提示することが可能になる。これによ
り、利用者は必要最少限の労力で検索結果の個々の文書
に書かれた内容を理解することができるようになり、効
率的な検索行為が実現できる。
【図面の簡単な説明】
【図1】機器構成図。
【図2】機能構成図。
【図3】システム制御部の処理の流れを示す図。
【図4】書式解析部の処理の流れを示す図。
【図5】書式解析部の処理の流れを示す図。
【図6】書式解析部の処理の流れを示す図。
【図7】タイトル検出パターンを示す図。
【図8】文書構造記録部の形式を示す図。
【図9】文書例を示す図。
【図10】文書構造記録部の内容例を示す図。
【図11】要約生成部の処理の流れを示す図。
【図12】文書例と文脈構造を示す図。
【図13】要約文章記憶部に格納される文脈構造の例を
示す図。
【図14】ペナルティ計算部の処理の流れを示す図。
【図15】文章再構成部の処理の流れを示す図。
【図16】検索結果提示部の処理の流れを示す図。
【図17】検索結果提示部における表示例を示す図。
【図18】要約文章提示部の処理の流れを示す図。
【図19】要約文章提示部における表示例を示す図。
【図20】要約文章提示部における表示例を示す図。
【図21】要約文章提示部における表示例を示す図。
【図22】要約文章提示部における表示例を示す図。
【図23】他の実施例に従った要約文書提示部の処理内
容を示す流れ図。
【図24】図24の実施例に基づいた要約文章提示部に
おける表示の一例を示す図。
【図25】図24の実施例に基づいた要約文章提示部に
おける表示の他の例を示す図。
【図26】図24の実施例に基づいた要約文章提示部に
おける表示の他の例を示す図。
【符号の説明】
1…中央処理手段 2…記憶手段 3…表示コ
ントローラ 4…表示手段 5…入力コントローラ 6…入力手
フロントページの続き (56)参考文献 特開 平4−281566(JP,A) 特開 平4−4467(JP,A) 特開 平4−175966(JP,A) 特開 平2−224069(JP,A) 野上 他,文書の意味構造を用いたブ ラウジング機能の開発,情報処理学会第 45回(平成4年後期)全国大会講演論文 集(3),日本,社団法人情報処理学 会,1992年10月11日,p.3−193−p. 3−194 岩井 他,文書の自動レイアウトシス テム,東芝レビュー,日本,1988年 5 月 1日,Vol.43,No.5,p. 405−408 西村 他,キー・センテンスの選択的 解析による論文要約法,情報処理学会第 44回(平成4年前期)全国大会講演論文 集(3),日本,社団法人情報処理学 会,1992年 3月17日,p.313−314 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】複数の文書が記憶された記憶手段と、 この記憶手段に記憶された文書に対し検索を行う検索手
    段と、 この検索手段によって得られた文書の章立ての構造を解
    析する文書構造解析手段と、 この文書構造解析手段で得られた章立ての構造と、前記
    文書中で用いられる修辞表現の解析結果である文脈構造
    から得られた前記文書の各文の重要度に基づいて要約文
    章を生成する要約生成手段と、 この要約生成手段によって得られた複数の要約文章を同
    時あるいは順次提示する検索結果提示手段と、 この検索結果提示手段で提示された要約文章の1つを選
    択させる選択手段と、この選択手段によって選択された
    要約文章に対して、詳細度の変更を入力させるための詳
    細度入力手段と、 この詳細度入力手段によって入力された詳細度から新た
    に重要度を生成し、この生成された重要度に基づいて、
    前記選択された要約文書の章に対応する新たな要約文書
    を再構成し、この新たな 要約文書あるいは原文書そのも
    のを提示する要約文章提示手段とを有することを特徴と
    する文書検索装置。
  2. 【請求項2】前記要約文章提示手段によって提示されて
    いる要約文章上の章や節のタイトル、段落、文を指定す
    る手段を有し、 指定した部分に対応する要約文章あるいは原文を表示中
    の要約文章に挿入することを特徴とする請求項1記載の
    文書検索装置。
  3. 【請求項3】前記検索結果提示手段では、検索結果とし
    て得られた複数の文書について、それぞれタイトル、著
    者名、要約を提示することを特徴とする請求項1記載の
    文書検索装置。
JP34952993A 1993-09-13 1993-12-28 文書検索装置 Expired - Fee Related JP3383049B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34952993A JP3383049B2 (ja) 1993-09-13 1993-12-28 文書検索装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP5-226815 1993-09-13
JP22681593 1993-09-13
JP34952993A JP3383049B2 (ja) 1993-09-13 1993-12-28 文書検索装置

Publications (2)

Publication Number Publication Date
JPH07129605A JPH07129605A (ja) 1995-05-19
JP3383049B2 true JP3383049B2 (ja) 2003-03-04

Family

ID=26527356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34952993A Expired - Fee Related JP3383049B2 (ja) 1993-09-13 1993-12-28 文書検索装置

Country Status (1)

Country Link
JP (1) JP3383049B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5751672A (en) * 1995-07-26 1998-05-12 Sony Corporation Compact disc changer utilizing disc database
JP3810463B2 (ja) * 1995-07-31 2006-08-16 株式会社ニューズウオッチ 情報フィルタリング装置
JP3579204B2 (ja) * 1997-01-17 2004-10-20 富士通株式会社 文書要約装置およびその方法
JP3270351B2 (ja) * 1997-01-31 2002-04-02 株式会社東芝 電子化文書処理装置
JP3718044B2 (ja) * 1998-02-02 2005-11-16 富士通株式会社 文書閲覧装置およびそのプログラムを格納した記憶媒体
JP3560841B2 (ja) * 1999-02-19 2004-09-02 日本電信電話株式会社 話題抽出方法、装置、および話題抽出プログラムを記録した記録媒体
KR100319756B1 (ko) * 2000-01-21 2002-01-09 오길록 논문 문서영상 구조 분석 방법
KR100435442B1 (ko) * 2001-11-13 2004-06-10 주식회사 포스코 문서 요약 방법 및 시스템
JP4572321B2 (ja) * 2004-03-10 2010-11-04 セイコーエプソン株式会社 文書出力装置及びその制御方法
CN102023989B (zh) 2009-09-23 2012-10-10 阿里巴巴集团控股有限公司 一种信息检索方法及其系统
JP5372733B2 (ja) * 2009-12-28 2013-12-18 楽天株式会社 情報検索装置、情報提供方法、情報検索プログラム及び情報検索システム
KR102218217B1 (ko) * 2018-12-20 2021-02-22 주식회사 로지스랩 화물 운송을 위한 운송료 결제 시스템 및 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2791147B2 (ja) * 1988-11-21 1998-08-27 株式会社日立製作所 情報検索方法
JPH044467A (ja) * 1990-04-23 1992-01-08 Oki Electric Ind Co Ltd 文書構造解析装置
JPH0769921B2 (ja) * 1990-11-09 1995-07-31 株式会社日立製作所 文書論理構造生成方法
JP2937521B2 (ja) * 1991-03-08 1999-08-23 株式会社東芝 文書検索装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
岩井 他,文書の自動レイアウトシステム,東芝レビュー,日本,1988年 5月 1日,Vol.43,No.5,p.405−408
西村 他,キー・センテンスの選択的解析による論文要約法,情報処理学会第44回(平成4年前期)全国大会講演論文集(3),日本,社団法人情報処理学会,1992年 3月17日,p.313−314
野上 他,文書の意味構造を用いたブラウジング機能の開発,情報処理学会第45回(平成4年後期)全国大会講演論文集(3),日本,社団法人情報処理学会,1992年10月11日,p.3−193−p.3−194

Also Published As

Publication number Publication date
JPH07129605A (ja) 1995-05-19

Similar Documents

Publication Publication Date Title
US6411924B1 (en) System and method for linguistic filter and interactive display
US8359550B2 (en) Method for dynamically generating a “table of contents” view of the HTML-based information system
JP3691844B2 (ja) 文書処理方法
US6240410B1 (en) Virtual bookshelf
US6304259B1 (en) Computer system, method and user interface components for abstracting and accessing a body of knowledge
US20050268227A1 (en) Method and system for mapping content between a starting template and a target template
US6874123B1 (en) Three-dimensional model to facilitate user comprehension and management of information
US5982365A (en) System and methods for interactively generating and testing help systems
JP3383049B2 (ja) 文書検索装置
US6789083B2 (en) Methods and system for browsing large text files
JP3134204B2 (ja) 情報検索用端末装置及び情報検索用端末装置における情報表示・入出力方法
JP3143345B2 (ja) 文字列検索装置
JPH11184865A (ja) 文書要約装置
JP2937519B2 (ja) 文書検索装置
JP3431836B2 (ja) ドキュメントデータベースの検索支援方法とそのプログラムを記憶した記憶媒体
JP2957875B2 (ja) 文書情報検索装置及び文書検索結果表示方法
JP3767763B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
MacKay et al. The impact of migration of data to small screens on navigation
JPH06231178A (ja) 文書検索装置
JP3237619B2 (ja) 文書表示装置および文書表示方法並びに文書表示プログラムを記録した記録媒体
JP2785692B2 (ja) 辞書検索表示装置
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH10162011A (ja) 情報検索方法、情報検索システム、情報検索端末装置および情報検索装置
JPH06195386A (ja) データ検索装置
JPH10340271A (ja) 文書抄録作成装置及び文書抄録作成プログラムを記録した記憶媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071220

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081220

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091220

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091220

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101220

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101220

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111220

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121220

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131220

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees