JPH07129605A - Document retrieval device - Google Patents

Document retrieval device

Info

Publication number
JPH07129605A
JPH07129605A JP5349529A JP34952993A JPH07129605A JP H07129605 A JPH07129605 A JP H07129605A JP 5349529 A JP5349529 A JP 5349529A JP 34952993 A JP34952993 A JP 34952993A JP H07129605 A JPH07129605 A JP H07129605A
Authority
JP
Japan
Prior art keywords
document
sentence
unit
chapter
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5349529A
Other languages
Japanese (ja)
Other versions
JP3383049B2 (en
Inventor
Kazuo Sumita
一男 住田
Seiji Miike
誠司 三池
Etsuo Ito
悦雄 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP34952993A priority Critical patent/JP3383049B2/en
Publication of JPH07129605A publication Critical patent/JPH07129605A/en
Application granted granted Critical
Publication of JP3383049B2 publication Critical patent/JP3383049B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PURPOSE:To understand the contents of a document by a user with the irreducible minimum labor and time by simultaneously displaying simple titles and summaries in the plural documents of retrieved results. CONSTITUTION:A system control part 19 detects retrieval instruction input to an input part 10 and starts a retrieval processing part 12 and the retrieval processing part 12 retrieves the corresponding document from a.= text data base 20 corresponding to a retrieval instruction. Then, the system control part 19 detects the completion of the processing of a format analysis part 13 and starts a summary generation part 14. The summary generation part 14 generates the summaries of the respective chapters of the document of the retrieved result and stores them in a summary sentence storage part 16. A retrieved result presenting part 17 makes the list of the retrieved results in a display means corresponding to summary sentences stored in the summary sentence storage part 16. A summary sentence presenting part 18 presents the summary sentence of the document selected in the retrieved result presenting part 17, also changes the detailed degree of the summary of a part corresponding to an instructed document position, inserts the summary sentence to the position and displays it.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、複数の文書を格納した
文章データベースから所望の文書を検索提示する文書検
索装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document retrieval device for retrieving and presenting a desired document from a sentence database storing a plurality of documents.

【0002】[0002]

【従来の技術】近年、ワープロや計算機の普及、電子ニ
ュースや電子メールの普及、従来紙の上でしか得られな
かった情報のCDROMによる出版(辞書、百科事典な
ど)など、文書の電子化が進みつつある。今後、このよ
うな文書の電子化は加速的に進んでいくと予測される。
2. Description of the Related Art In recent years, the digitization of documents, such as the spread of word processors and computers, the spread of electronic news and electronic mail, and the publication of information (dictionaries, encyclopedias, etc.) in CDROM, which was previously only available on paper, has become possible. It's going on. In the future, it is expected that the digitization of such documents will accelerate.

【0003】これにともない、蓄積した文書を有効利用
するため、大量の文書から所望の文書を検索する情報検
索システムの需要が増加しつつある。
Along with this, there is an increasing demand for an information retrieval system for retrieving a desired document from a large number of documents in order to effectively use the accumulated documents.

【0004】従来型の文書情報検索システムにあって
は、キーワードなどの検索命令の指定に従って、一定の
順序(例えば、キーワードと類似する文書の順)で検索
結果の文書のタイトルを並べて表示するだけであった。
このため、検索した文書間の相対的な関係や、検索命令
との類似性の度合が利用者に実感できず、検索結果の妥
当性を利用者が直感することが難しかった。
In the conventional document information retrieval system, the titles of the retrieval result documents are displayed side by side in a fixed order (for example, the order of documents similar to the keyword) according to the designation of a retrieval command such as a keyword. Met.
Therefore, it is difficult for the user to perceive the validity of the search result because the relative relationship between the searched documents and the degree of similarity with the search command cannot be realized by the user.

【0005】従来型の文書情報検索システムにあって
は、検索した結果が所望の文書であるか否かを利用者が
判定するために、個々の文書の全文を詳細に読むという
作業を行わなければならず、所望の文書を得るまでに多
大な時間を要していた。
In the conventional document information retrieval system, the user must read the entire text of each document in detail in order for the user to determine whether or not the retrieved result is the desired document. Therefore, it took a lot of time to obtain a desired document.

【0006】検索した結果の一部だけを表示すること
で、全文を読まなければならない手間を軽減することが
できる。しかし、その表示した一部分が文書において他
の部分とどのような関係にあるかが明らかでなければ、
その文書が所望の文書であるかどうかが判定できない。
例えば、ある文書について背景情報を述べている部分が
表示され、また他の文書について結論を述べている部分
が表示された場合、統一した視点で見渡すことができな
いため、いずれの文書が必要であるかを判定することが
困難である。したがって、表示した部分が全文に対して
どのような位置付けにあるかを理解するためには、全文
を読まなければならず、結果的に手間の軽減にならな
い。
By displaying only a part of the retrieved results, it is possible to reduce the labor required to read the whole sentence. However, if it is not clear how the displayed part relates to other parts of the document,
It cannot be determined whether the document is the desired document.
For example, if a part that describes background information about one document is displayed and a part that describes a conclusion about another document is displayed, which document is necessary because it cannot be viewed from a unified viewpoint. It is difficult to determine if Therefore, in order to understand how the displayed part is positioned with respect to the whole sentence, the whole sentence must be read, and as a result, the labor is not reduced.

【0007】また、格納されている個々の文書の要約文
章を人手で作成し、これを原文書に対応づけて格納して
おくことができる。検索結果の表示において、この要約
文章を表示することで、利用者の検証の手間を軽減する
ことが可能である。しかるに、要約文章を人手で作成す
るには多大な時間を要し、よほど利用規模の大きいデー
タベースでなければ、到底用意できないものである。ま
た、これまで個々の文書についての要約が準備されてい
ないようなデータベースも存在しており、それらについ
て人手で要約を作成することは多大な費用と労力を要す
る。
Further, it is possible to manually create a summary sentence of each stored document and store it in association with the original document. By displaying this summary sentence in the display of the search result, it is possible to reduce the user's time and effort for verification. However, it takes a lot of time to manually create a summary sentence, and it is impossible to prepare unless the database is so large in scale. In addition, there are databases that do not yet have a summary of individual documents, and it is very costly and laborious to manually create a summary of them.

【0008】さらに、人手で作成した要約文章は、ごく
一般向けに作成されるため、利用者の目的に合った視点
で要約されているとは限らない。このため、利用者にと
っては、ピント外れの文章となっている場合があり、所
望の文書であるかどうかを判定する時に、必要な文書を
見過ごしてしまうことがあるという問題点もあった。ま
た、人手で作成した要約文章は、利用者の必要に応じて
その長さを変えるということができない。このため、利
用者が要約文章を読んでいる際に、その部分をより詳し
く読みたいと思っても、対応する原文やより詳しい要約
を提示することができず、全文を提示したりプリントア
ウトするなどして全文を読まなければならず、このよう
な場合については検索した文書を読む手間は軽減されな
いという問題点がある。
Further, since the summary text manually created is created for the general public, it is not always summarized from the viewpoint suitable for the purpose of the user. For this reason, there is a problem that the user may have a sentence that is out of focus, and may overlook a necessary document when determining whether or not the document is a desired document. In addition, the length of the manually created summary text cannot be changed according to the needs of the user. Therefore, while the user is reading the summary text, even if he / she wants to read that part in more detail, he / she cannot present the corresponding original text or a more detailed summary, and present the full text or print it out. It is necessary to read the entire text by doing so, and in such a case, there is a problem that the time and effort to read the searched document cannot be reduced.

【0009】例えば、PATOLISでは検索結果の複
数の要約を同時にリストアップすることができるもの
の、利用者が検索結果のより詳しい内容を知りたい場合
は、新たにその文書をプリントアウトしなければならな
い。その結果、検索行為に関わる手間が軽減される度合
が低かった。
For example, in PATOLIS, a plurality of summaries of search results can be listed at the same time, but if the user wants to know more detailed contents of the search results, the document must be newly printed out. As a result, the degree to which the effort involved in the search act was reduced was low.

【0010】[0010]

【発明が解決しようとする課題】本発明は、上述のよう
な事情を考慮してなされたもので、利用者の要求に応じ
て詳細度の変化させた要約文章を対話的に提示すること
のできる文書検索装置を提供することを目的とするもの
である。
SUMMARY OF THE INVENTION The present invention has been made in consideration of the above-mentioned circumstances, and it is possible to interactively present a summary sentence whose detail level is changed according to a user's request. It is an object of the present invention to provide a document retrieval device that can be used.

【0011】[0011]

【課題を解決するための手段】本発明の文書検索装置に
おいては、文書のタイトル情報から章立ての構造を解析
する書式解析手段と、該書式解析手段で得られた各章の
文章について可変長の要約文章を生成する要約生成手段
と、検索結果で得られた複数の文書についての要約を同
時に提示する検索結果提示手段と、該検索結果提示手段
で提示された要約文章の一つを選択することをきっかけ
としてさらに詳しい要約文章あるいは原文書を提示する
とともに、提示されているその要約文章上の章や節のタ
イトル、段落、文を指定する手段を有し、指定した部分
に対応する要約文章あるいは原文を表示中の要約文章に
挿入する要約文章提示手段を有する。
In the document retrieval apparatus of the present invention, a format analysis means for analyzing the structure of chapters from the title information of a document, and a variable length for the text of each chapter obtained by the format analysis means. , A search result presenting means for simultaneously presenting summaries of a plurality of documents obtained by the search results, and one of the summary texts presented by the search result presenting means. In addition to presenting a more detailed summary sentence or original document as a trigger, there is a means to specify the title, paragraph, sentence of the chapter or section on the presented summary sentence, and the summary sentence corresponding to the specified part Alternatively, it has a summary sentence presenting means for inserting the original sentence into the summary sentence being displayed.

【0012】書式解析手段では、文書における各章や節
に付与されているタイトルやヘディング、改行と空白文
字の出現の関係から、原文書の章立ての構造を解析す
る。
The format analysis means analyzes the chapter structure of the original document from the relationship between the titles and headings assigned to each chapter and section in the document, the line feed and the appearance of white space characters.

【0013】要約生成手段は、書式解析手段が解析して
得た章立ての構造に基づいて、各章に含まれる文章の要
約文章を生成する。この要約生成では生成する要約文章
の長さを可変にすることが可能である。
The summary generating means generates a summary sentence of the sentences included in each chapter, based on the chapter structure obtained by the format analyzing means. In this summary generation, the length of the generated summary sentence can be made variable.

【0014】検索結果提示手段では、検索結果として得
られた複数の文書について、それぞれタイトル、著者
名、要約を提示する機能を有する。また、提示された複
数の文書のうち1つを選択する機能を有し、要約文書提
示手段を起動して選択された文書のより詳しい要約文章
を提示する。
The search result presenting means has a function of presenting the title, author name, and abstract of each of the plurality of documents obtained as the search results. Further, it has a function of selecting one of a plurality of presented documents, and activates the summary document presenting means to present a more detailed summary sentence of the selected document.

【0015】要約文書提示手段では、少なくとも検索結
果提示部で提示されている要約文章より詳しい要約文章
を提示するとともに、提示されている要約文章中のヘデ
ィングや段落、文の一部を指定する機能を有する。利用
者が適宜この指定を行うことにより、対応する部分のさ
らに詳しい要約(原文も含む)を、提示している要約文
章中に挿入する。
The summary document presenting means presents at least a summary sentence that is more detailed than the summary sentence presented by the search result presenting section, and specifies a heading, a paragraph, or a part of the sentence in the presented summary sentence. Have. When the user makes this designation as appropriate, a more detailed summary (including the original text) of the corresponding part is inserted into the presented summary text.

【0016】[0016]

【作用】簡単なタイトルと要約が検索結果の複数の文書
に同時に表示されるので、読む必要のない文書まで読ま
なければならないと言う手間が大幅に削減される。ま
た、提示されている要約文章の詳しさでは十分でない場
合、対応箇所を詳細に表示することを動的に指定できる
ので、必要最少限の労力で検索結果で得られた文書の内
容を利用者は理解できるようになる。これにより検索行
為の効率を向上させることが可能になる。
Since the simple title and the abstract are simultaneously displayed on a plurality of documents as the retrieval result, the trouble of having to read even a document that does not need to be read is greatly reduced. Also, if the detail of the presented summary is not sufficient, it is possible to dynamically specify that the corresponding part should be displayed in detail, so the content of the document obtained from the search results can be displayed to the user with the minimum required effort. Will be understandable. This makes it possible to improve the efficiency of search operations.

【0017】[0017]

【実施例】本発明の実施例を図面に基づいて説明する。Embodiments of the present invention will be described with reference to the drawings.

【0018】図1は、実施例を構成する上で必要となる
機器の構成を示す構成図である。中央処理手段1、半導
体メモリや磁気ディスク、光ディスクなどの記憶手段
2、CRTディスプレイや液晶ディスプレイ、プラズマ
ディスプレイなどのディスプレイなどの表示手段4、表
示を制御する表示コントローラ3、キーボードやマウ
ス、ペンなどの入力手段6、入力を制御する入力コント
ローラ5からなる。
FIG. 1 is a block diagram showing the configuration of equipment necessary for constructing the embodiment. Central processing means 1, storage means 2 such as semiconductor memory, magnetic disk, optical disk, display means 4 such as display such as CRT display, liquid crystal display, plasma display, display controller 3 for controlling display, keyboard, mouse, pen, etc. The input means 6 and the input controller 5 for controlling the input.

【0019】図2は、実施例における機能構成を示した
ブロック図である。入力部11、検索処理部12、書式
解析部13、要約生成部14、文書構造記憶部15、要
約文章記憶部16、検索結果提示部17、要約文章提示
部18、全体システムを制御するシステム制御部19か
らなる。テキストデータベース20には検索の対象とな
るテキストデータが格納される。
FIG. 2 is a block diagram showing the functional configuration of the embodiment. Input unit 11, search processing unit 12, format analysis unit 13, summary generation unit 14, document structure storage unit 15, summary text storage unit 16, search result presentation unit 17, summary text presentation unit 18, system control for controlling the overall system It consists of part 19. Text data to be searched is stored in the text database 20.

【0020】図3は、実施例の文書検索装置の全体を制
御するシステム制御部19の処理の流れを図示してい
る。
FIG. 3 illustrates a flow of processing of the system control unit 19 which controls the entire document retrieval apparatus of the embodiment.

【0021】入力部11は、検索命令となるキーワー
ド、および自然言語文の入力を受け付ける。
The input unit 11 receives input of a keyword as a search command and a natural language sentence.

【0022】まず始めに、システム制御部19は、入力
部への検索命令入力を検知して、検索処理部12を起動
する。検索処理部12は、検索命令に従ってテキストデ
ータベース20から対応する文書を検索する(ステップ
31)。
First, the system control unit 19 detects the input of a search command to the input unit and activates the search processing unit 12. The search processing unit 12 searches the text database 20 for the corresponding document according to the search command (step 31).

【0023】次に、システム制御部19は、検索処理部
12の処理の終了を検知して、書式解析部13を起動す
る(ステップ32)。書式解析部13は、検索結果の各
文書の章構成を解析し、文書構造記憶部15に格納す
る。
Next, the system control unit 19 detects the end of the processing of the search processing unit 12 and activates the format analysis unit 13 (step 32). The format analysis unit 13 analyzes the chapter structure of each document as a search result and stores it in the document structure storage unit 15.

【0024】次に、システム制御部19は、書式解析部
13の処理の終了を検知して、要約生成部14を起動す
る。要約生成部14は、検索結果の文書の各章の要約を
生成し、要約文章記憶部16に格納する(ステップ3
3)。
Next, the system control section 19 detects the end of the processing of the format analysis section 13 and activates the summary generation section 14. The summary generation unit 14 generates a summary of each chapter of the search result document and stores it in the summary sentence storage unit 16 (step 3).
3).

【0025】次に、システム制御部19は、要約生成部
14の処理の終了を検知して、検索結果提示部17を起
動する(ステップ34)。検索結果提示部17は、文書
構造記憶部15に格納された検索結果の各文書の文書構
造および要約文書記憶部16に格納された要約文章に従
って図1に図示する表示手段4に検索結果のリストアッ
プを行う(ステップ35)。
Next, the system control unit 19 detects the end of the processing of the abstract generation unit 14 and activates the search result presentation unit 17 (step 34). The search result presentation unit 17 lists the search results on the display unit 4 shown in FIG. 1 according to the document structure of each document of the search results stored in the document structure storage unit 15 and the summary text stored in the summary document storage unit 16. Up (step 35).

【0026】表示された検索結果のリストアップから1
つの文書が選択された場合、システム制御部19は、要
約文章提示部18を起動する。要約文章提示部18は、
前記検索結果提示部17で選択された文書の要約文章を
提示するとともに、利用者の指示に従って指示された文
書位置に対応する部分の要約の詳細度を変えて、その位
置に挿入し表示する。
From the displayed list of search results, 1
When one document is selected, the system control unit 19 activates the summary sentence presentation unit 18. The summary sentence presenting section 18
The summary text of the document selected by the search result presentation unit 17 is presented, the detail level of the summary of the portion corresponding to the document position instructed according to the user's instruction is changed, and the summary is inserted and displayed.

【0027】検索処理部12は、本願の発明の主旨では
なく、全文検索システムなどですでに実施されている手
法を利用することにより実現される。
The search processing unit 12 is realized not by the gist of the invention of the present application but by using a method already implemented in a full-text search system or the like.

【0028】図4乃至図6に書式解析部13の処理の流
れを図示する。
4 to 6 show the flow of processing of the format analysis unit 13.

【0029】処理は、タイトル検出パタンに基づいて解
析を行う。検出パタンの一例を図5に示す。パタンは、
レベル0として文書の章タイトルを検出するパタン、レ
ベル1として章を構成する節タイトルを検出するパタ
ン、さらには、より下位のレベルの節のタイトルを検出
するパタンをあらかじめ設定しておく。
The processing analyzes based on the title detection pattern. An example of the detection pattern is shown in FIG. The pattern is
A pattern for detecting chapter titles of a document as level 0, a pattern for detecting section titles constituting a chapter as level 1, and a pattern for detecting section titles at lower levels are set in advance.

【0030】図7において、記号“^”は行の先頭と、
“Snumber ”は数字と、“Sstring”は任意の文字列
と、“\n ”は改行と、それぞれ照合することを意味し
ている。例えば、レベル0の検出パタン“^[Snumber
]Sstring \n ”は、行の先頭に“[1]はじめに”
という文字列が存在した場合、その行と照合が成功する
ことになる。また、解析した結果は、例えば図8に示す
形式の図2に図示する文書構造記憶部15に格納する。
In FIG. 7, the symbol "^" indicates the beginning of the line,
"Snumber" means to match a number, "Sstring" to an arbitrary character string, and "\ n" to a line break, respectively. For example, the level 0 detection pattern “^ [Snumber
] Sstring \ n "is" [1] Introduction "at the beginning of the line
If the string is present, the match with that line is successful. The analysis result is stored in the document structure storage unit 15 shown in FIG. 2 in the format shown in FIG. 8, for example.

【0031】書式解析部13では、まず始めに、文書が
格納されているバッファの先頭アドレスへのポインタを
P、文字数をN、タイトルの検出レベルをOとして処理
を始める。章カウンタをOと設定するとともに、Pなら
びにNをそれぞれ、文書構造記憶部15のタイトルポイ
ンタおよび文字数に格納する。
In the format analysis unit 13, first, the pointer to the head address of the buffer in which the document is stored is set to P, the number of characters is set to N, and the detection level of the title is set to O to start the processing. The chapter counter is set to O, and P and N are stored in the title pointer and the number of characters of the document structure storage unit 15, respectively.

【0032】検出パタンと照合する文字列が存在する位
置を探す。最初に、検出パタンと照合した文字列の先頭
アドレスを本文ポインタとして本文ポインタ(章カウン
タ+1)に格納する。そして、章カウンタの値を1だけ
増やす。順次、この処理を繰り返すことにより、本文ポ
インタ1、本文ポインタ2、本文ポインタ3へ、それぞ
れ章の先頭アドレスを格納していく。文書が格納されて
いるバッファも字数Nに対して処理が終了すると、文書
構造記憶部15に章の数が章カウンタ、それぞれの章へ
の先頭アドレスが、本文ポインタ1から本文ポインタn
へ格納されている。本文ポインタ1の指す最初の章か
ら、処理を行う。本文ポインタTの値をタイトルポイン
タTに格納する。さらに、本文ポインタT+1との差か
らも字数を求め、文字数Tに格納する。その後、タイト
ルポインタTのアドレスを本文ポインタTに格納する。
章カウンタTの値はOと設定する。
The position where the character string to be matched with the detection pattern exists is searched for. First, the start address of the character string matched with the detected pattern is stored in the body pointer (chapter counter + 1) as the body pointer. Then, the value of the chapter counter is incremented by 1. By sequentially repeating this process, the start addresses of the chapters are stored in the body pointer 1, the body pointer 2, and the body pointer 3, respectively. When the processing of the buffer in which the document is stored is completed for the number of characters N, the document structure storage unit 15 stores the number of chapters as a chapter counter, and the start address of each chapter is from body pointer 1 to body pointer n.
Stored in. Processing is performed from the first chapter pointed to by body pointer 1. The value of the body pointer T is stored in the title pointer T. Further, the number of characters is calculated from the difference from the body pointer T + 1 and is stored in the number of characters T. After that, the address of the title pointer T is stored in the body pointer T.
The value of the chapter counter T is set to O.

【0033】レベル1の検出パタンに照合する文字列が
存在する位置を探す。検出パタンと照合する文字列の先
頭アドレスを本文ポインタ(T,章カウンタ+1)に格
納し、章カウンタTを1増やす。これを繰り返すことに
より、節構造を得る。章Tに対して、章カウンタTの値
が0であった場合は、節が存在しなかったことを意味し
ている。そこで、その場合は、章のタイトルの次の文字
のアドレスを本文ポインタ(T,1)に格納する。すべ
ての章について以上の処理を行うことにより、章−節構
造を得る。
The position where the character string to be matched with the level 1 detection pattern exists is searched for. The start address of the character string to be matched with the detection pattern is stored in the body pointer (T, chapter counter + 1), and the chapter counter T is incremented by 1. A node structure is obtained by repeating this. When the value of the chapter counter T is 0 for the chapter T, it means that the clause does not exist. Therefore, in that case, the address of the character next to the chapter title is stored in the body pointer (T, 1). The chapter-clause structure is obtained by performing the above processing for all chapters.

【0034】図4は、節の下位構成まで解析する場合の
流れを示している(例えば、“2.3.4”というよう
な章番号のタイトルを持つレベルまでの解析処理)。
FIG. 4 shows a flow in the case of analyzing a subordinate structure of a section (for example, analysis processing up to a level having a title of a chapter number such as "2.3.4").

【0035】書式解析部13で解析した文書構造は、文
書構造記憶部15に格納される。例えば、図9に示すよ
うな文書の場合、処理の結果、文書構造記憶部15に
は、図10に示すような値がそれぞれ設定される。
The document structure analyzed by the format analysis unit 13 is stored in the document structure storage unit 15. For example, in the case of a document as shown in FIG. 9, as a result of the processing, the values shown in FIG. 10 are set in the document structure storage unit 15.

【0036】図11に、要約生成部14の構成を図示す
る。
FIG. 11 shows the configuration of the summary generator 14.

【0037】本実施例における要約生成部14は、文脈
構造解析部41、ペナルティ計算部42、文章再構成部
43からなる。文脈構造解析部41は、文書中で用いら
れている修辞的な表現を抽出し、各章あるいは節の文章
部分の論理的な構造を解析する。ペナルティ計算部42
は、解析した文脈構造に基づいて各文の重用度について
のペナルティの計算を行う。
The summary generation unit 14 in this embodiment comprises a context structure analysis unit 41, a penalty calculation unit 42, and a sentence reconstruction unit 43. The context structure analysis unit 41 extracts rhetorical expressions used in the document and analyzes the logical structure of the text portion of each chapter or section. Penalty calculation unit 42
Calculates the penalty for the degree of importance of each sentence based on the analyzed context structure.

【0038】文脈構造解析部41における処理自体は、
本願の発明の主旨ではない。例えば文献(A Discourse
Structure Analyzer for Japanese Text,K.Sumita,Int.
Conf.on Fifth Generation Computer ´92)で開示さ
れている方法を用いることができる。この処理により、
図12の(b)に示す文章に対して、図12の(a)に
示す文脈構造を得ることができる。図示した文脈構造
は、第2文が第1文に対して「展開」という関係にあ
り、さらに第3文が第1文と第2文に対して「予定」と
いう関係にあることを表している。
The process itself in the context structure analysis unit 41 is
It is not the gist of the invention of the present application. For example, reference (A Discourse
Structure Analyzer for Japanese Text, K.Sumita, Int.
The method disclosed in Conf. On Fifth Generation Computer '92) can be used. By this process,
With respect to the sentence shown in FIG. 12B, the context structure shown in FIG. 12A can be obtained. The illustrated context structure shows that the second sentence has a relationship of “expansion” with respect to the first sentence, and the third sentence has a relationship of “planned” with respect to the first sentence and the second sentence. There is.

【0039】文脈構造は、図13に示すデータ構造で要
約文章記憶部15に記憶する。データ構造は、そのノー
ドの持つ関係(文脈構造.Rel)と、左右のノードへ
のリンク(文脈構造.L、文脈構造.R)を表現してい
る。ただし、終端ノードの場合、文脈構造.Relには
対応する文へのポインタを、また文脈構造.Lと文脈構
造.Rには−1をそれぞれ格納する。
The context structure is stored in the summary sentence storage unit 15 as the data structure shown in FIG. The data structure represents the relationship (context structure.Rel) that the node has and the links (context structure.L, context structure.R) to the left and right nodes. However, in the case of a terminal node, the context structure. Rel is a pointer to the corresponding sentence, and context structure. L and context structure. -1 is stored in R.

【0040】図14にペナルティ計算部42の処理の流
れを示す。ペナルティ計算部42は、ペナルティ計算を
再帰的に行うことにより処理を進める。処理が終わった
段階でペナルティの小さい終端ノードが、より重要であ
ることになる。
FIG. 14 shows a processing flow of the penalty calculating section 42. The penalty calculation unit 42 advances the processing by recursively executing the penalty calculation. A terminal node with a small penalty at the end of processing becomes more important.

【0041】ペナルティ計算は、文脈構造解析部41で
解析した文脈構造、ならびにペナルティの初期値を入力
とする。始めに、文脈構造が終端ノードか否かを判定す
る。文脈構造.Lに格納されている値が−1である場
合、終端ノードであるので、入力されたペナルティを文
脈構造.Pに設定する。
In the penalty calculation, the context structure analyzed by the context structure analysis unit 41 and the initial value of the penalty are input. First, it is determined whether the context structure is a terminal node. Context structure. If the value stored in L is −1, it is a terminal node, so the input penalty is the context structure. Set to P.

【0042】一方、文脈構造.Lに格納されている値が
−1でなければ、終端ノードではなく、非終端ノードで
ある。この場合、文脈構造.Relに格納されている関
係が右重点型か左重点型か、あるいはそのいずれでもな
いかの判定を行う。この判定は、予め記憶しておいた関
係テーブルに基づいて行う。関係テーブルの一例を下に
示す。 順接 右重点型 予定 左重点型 例示 左重点型 上記のテーブルは、「順接」という関係が右重点型であ
ることを表している。
On the other hand, the context structure. If the value stored in L is not -1, it is not a terminal node but a non-terminal node. In this case, the context structure. It is determined whether the relation stored in Rel is the right-weighted type, the left-weighted type, or neither. This determination is performed based on the relationship table stored in advance. An example of the relationship table is shown below. Sequential right-weighted type Planned left-weighted type Illustrated left-weighted type The table above shows that the relationship "sequential" is the right-weighted type.

【0043】文脈構造.Relに格納されている関係が
右重点型である場合、右ノードの方が重要であるから、
ペナルティPにペナルティP1を足し合わせた値を左ノ
ードの側のペナルティ計算に与え、ペナルティPを右ノ
ードの側のペナルティ計算に与える。
Context structure. If the relationship stored in Rel is right-weighted, the right node is more important, so
A value obtained by adding the penalty P1 to the penalty P is given to the penalty calculation on the left node side, and the penalty P is given to the penalty calculation on the right node side.

【0044】逆に、文脈構造.Relに格納されている
関係が左重点型である場合、左ノードが重要であるの
で、ペナルティPを左ノードの側のペナルティ計算に与
え、ペナルティPにペナルティP1を足し合わせた値を
右ノードの側のペナルティ計算に与える。
Conversely, the context structure. When the relation stored in Rel is a left-weighted type, the left node is important, so the penalty P is given to the penalty calculation on the side of the left node, and the value obtained by adding the penalty P1 to the penalty P is added to the right node. Give to the side penalty calculation.

【0045】また、文脈構造.Relに格納されている
関係が右重点型でも左重点型でもない場合、左右のノー
ドそれぞれについてのペナルティ計算には、ペナルティ
Pがそのまま引き渡される。
Context structure. When the relation stored in Rel is neither right-weighted nor left-weighted, the penalty P is passed as it is to the penalty calculation for each of the left and right nodes.

【0046】以上の再帰的な処理により、重用度の高い
文のペナルティには小さい値が、一方、重用度の低い文
のペナルティには大きい値が設定されることになる。そ
して、各文についてのペナルティが、要約文書記憶部1
5に格納される。
By the above recursive processing, a small value is set for the penalty of a sentence of high importance, while a large value is set for the penalty of a sentence of low importance. Then, the penalty for each sentence is the summary document storage unit 1
Stored in 5.

【0047】文章再構成部43の処理の流れを図15に
示す。文章再構成部43では、ペナルティ計算部42で
求めた全ての文のペナルティを参照し、予め定めたペナ
ルティ以下の文を取り出す。そして、接続表現の変更を
行い要約文を生成する。例えば、次のような文章を仮定
する。(ここで1、2、3は文を表現する)。 1 “よい建築物を作るためにはよい材料が必要であ
る。” 2 “しかし、よい道具も必要である。” 3 “つまり、材料だけではダメである。” そして、この文章に対応する文脈構造が次のような構造
であること。 (1 <逆接> (2 <重複> 3)) さらに、ペナルティ計算部により文1と文3がより小さ
いペナルティを与えられていると仮定する。
FIG. 15 shows a processing flow of the text reconstructing section 43. The sentence reconstructing unit 43 refers to the penalties of all the sentences calculated by the penalty calculating unit 42, and takes out the sentences below the predetermined penalty. Then, the connection expression is changed to generate a summary sentence. For example, assume the following sentence: (Where 1, 2, 3 represent sentences). 1 “Good materials are needed to make good buildings.” 2 “But good tools are also needed.” 3 “In other words, materials are not enough.” And the context corresponding to this sentence The structure is as follows. (1 <reverse connection> (2 <duplication> 3)) Further, it is assumed that sentence 1 and sentence 3 are given a smaller penalty by the penalty calculation unit.

【0048】文1と文3を単純につなげた場合、原文と
論理的に異なる次のような文章が生成される。“よい建
築物を作るためにはよい材料が必要である。”“つま
り、材料だけではダメである。”そこで、接続表現の変
更では、キーセンテンスと判定された文間の最も上位の
関係に対応する接続表現に付け代える。上記の例では、
文1と文3の間の最も上位の関係は、<逆接>であるの
で、この関係に対応する接続表現「しかし」に置き換え
ることにより、次のような文章を生成する。“よい建築
物を作るためにはよい材料が必要である。”“しかし、
材料だけではダメである。”文章再構成部43により、
原文と論理的に整合性のある要約文が生成される。ま
た、文章再構成部43におけるペナルティP2の値を変
化させることにより、要約文として生成する文の量を制
御することができる。したがって、利用者がこのペナル
ティP2を設定し直すことにより、表示される要約文の
量を制御することが可能である。
When sentence 1 and sentence 3 are simply connected, the following sentence which is logically different from the original sentence is generated. “Good materials are needed to make a good building.” “That is, materials are not enough.” Therefore, in changing the connection expression, the highest level relationship between sentences judged as key sentences was decided. Replace with the corresponding connection expression. In the above example,
Since the highest-level relationship between sentences 1 and 3 is <reverse connection>, the following sentence is generated by substituting the connection expression “but” corresponding to this relation. “To build a good building you need good materials.” “But
Only the materials are useless. By the sentence reconstructing section 43,
A summary sentence that is logically consistent with the original sentence is generated. Further, by changing the value of the penalty P2 in the sentence reconstructing unit 43, the amount of sentence generated as a summary sentence can be controlled. Therefore, it is possible for the user to control the amount of displayed summary by resetting the penalty P2.

【0049】図16に検索結果提示部17の処理の流れ
を図示する。
FIG. 16 illustrates a processing flow of the search result presentation unit 17.

【0050】まず始めに、検索結果の各文書に対して、
文書構造記憶部15に格納されている文書からタイトル
と著者名を取り出す。例えば、図9に図示した文書例に
対しては、「文書の自動レイアウトシステム」というタ
イトルと「山田太郎、佐藤花子」という著者名が取り出
される。
First, for each document in the search result,
The title and the author name are extracted from the document stored in the document structure storage unit 15. For example, for the document example shown in FIG. 9, the title “Automatic document layout system” and the author names “Taro Yamada, Hanako Sato” are extracted.

【0051】次に、前記のステップに対応して要約文章
記憶部16から「概要」部分に対応する文脈構造を取り
出す。そして、図15に図示した文章再構成処理43を
起動し、「概要」部分の要約文章を生成する。そして、
図1に図示した表示手段4に対して、図17に示すよう
な検索結果のリストアップ表示を行う。例えば、図9に
図示した文書に対しては、次のように一番上に図示され
ているという表示が行われる。 「文章の自動レイアウトシステム 山田太郎、佐藤花子 本稿では、その技術的な詳細について解説する。」 表示を行った後、検索結果提示部17はマウスなどポイ
ンティングデバイスからの入力イベントを待つ。利用者
がマウスによってリストアップされている一つの文書を
選択した場合、選択された文書に対して要約文章提示部
18を起動する。図18に要約文章提示部18の処理の
流れを図示する。また、図19から図22に要約文章提
示部18における表示例を図示する。
Next, the context structure corresponding to the "outline" portion is extracted from the summary sentence storage unit 16 in correspondence with the above steps. Then, the sentence reconstructing process 43 shown in FIG. 15 is activated to generate a summary sentence of the "outline" portion. And
A list of search results as shown in FIG. 17 is displayed on the display unit 4 shown in FIG. For example, for the document shown in FIG. 9, the display shown at the top is performed as follows. "Automatic layout system for sentences Taro Yamada, Hanako Sato This article describes the technical details." After displaying, the search result presentation unit 17 waits for an input event from a pointing device such as a mouse. When the user selects one of the listed documents with the mouse, the summary sentence presenting unit 18 is activated for the selected document. FIG. 18 illustrates a processing flow of the summary text presentation unit 18. 19 to 22 show display examples in the summary sentence presenting section 18.

【0052】まず始めに、要約文章提示部18では、検
索結果提示部17で選択された文書の要約文章を表示す
る。この表示では、検索結果提示部17と同様にタイト
ル、著者名、概要部分を表示するとともに、文書構造記
憶部15を参照して文書の各章の見出しも表示する。図
19は、図17に図示したリストアップから最初の文書
を選択した場合の表示例を図示したものである。
First, the summary sentence presentation unit 18 displays the summary sentence of the document selected by the search result presentation unit 17. In this display, the title, the author name, and the outline portion are displayed as in the search result presentation unit 17, and the heading of each chapter of the document is also displayed by referring to the document structure storage unit 15. FIG. 19 shows a display example when the first document is selected from the list shown in FIG.

【0053】次に、利用者により表示の入力が行われ、
それが詳細度変更のコマンドであった場合、指定された
位置から章番号を求めるとともに、図20に図示するよ
うに詳細度入力メニューを表示する。そして、利用者が
詳細度を入力することにより、例えば、以下の式によっ
て文章再構成部43が生成する際のペナルティP2を決
定し、対応する章の要約文章を生成する。 P2=C×(詳細度) ここで、Cは予め定められた定数である。
Next, the display is input by the user,
If the command is a detail level change command, the chapter number is obtained from the designated position and the detail level input menu is displayed as shown in FIG. Then, when the user inputs the degree of detail, the penalty P2 when the sentence reconstructing unit 43 generates the sentence is determined by the following formula, and the summary sentence of the corresponding chapter is generated. P2 = C × (detail level) Here, C is a predetermined constant.

【0054】次に、要約文章提示部16は、改めて生成
した要約文章を始めに表示した要約文章に挿入して表示
する。この様子を図21に図示している。図21に斜線
で囲んだ部分は、新たに生成した要約文章のうちの追加
部分である。
Next, the summary sentence presenting section 16 inserts the newly generated summary sentence into the initially displayed summary sentence and displays it. This state is shown in FIG. The hatched portion in FIG. 21 is the additional portion of the newly generated summary sentence.

【0055】図21では、概要部分を指定して、その部
分の要約文章の詳細度を変更して表示したが、図22に
図示したように各章の見出し部分が指定された場合は、
その指定された章の要約を新たに表示することになる。
In FIG. 21, the outline portion is designated and the summary text of the portion is changed and displayed. However, when the heading portion of each chapter is designated as shown in FIG. 22,
A new summary of the specified chapter will be displayed.

【0056】要約文章提示部18は、以上の処理を繰り
返し行う。これにより、利用者は所望の章の要約文章の
詳細度を変更することができる。詳細度を100%にし
た場合、原文が表示されることになる。
The summary sentence presenting section 18 repeats the above processing. This allows the user to change the level of detail of the summary text of the desired chapter. When the detail level is 100%, the original text is displayed.

【0057】実施例の要約生成部14では、文脈構造を
解析することにより要約文章を生成したが、その他の従
来より開示されている手法(例えば、使われている単語
の頻度を求めて、頻度の高い単語を含む文を取り出す手
法、あるいは、単純に文章の前方から順に文を切り取っ
て来る手法など)など利用するように変形することは容
易である。
The summary generating unit 14 of the embodiment generates the summary sentence by analyzing the context structure. However, other conventionally disclosed methods (for example, the frequency of a used word is calculated to determine the frequency). It is easy to transform it into a method that takes out a sentence containing a high word or a method that simply cuts out the sentence from the front of the sentence).

【0058】また、実施例の検索結果提示部17は、文
章再編成部43で生成した要約文章をそのまま表示して
いる。このため、図17に図示したように第3番目の文
書については、要約文章が3行に亘って表示されてい
る。しかし、これを、次に示すように要約文章の部分を
一定の長さに制限して提示するようにすることも可能で
ある。 「DSIのCAD 田中一夫 各種のLSIのCADの中で、EAの代表として、 カスタムVLSICADとアナログレイアウトCAD」 実施例の要約文章提示部18では、起動時点では、タイ
トル、著者名、概要部分の要約文章、各章の見出しを表
示したが、これを例えば、後書きの部分についての要約
文書を提示するように変形することは容易である。同様
に様々な形態での表示を行えるように利用者がカスタマ
イズできるようにすることも可能である。また、実施例
では、図20に図示したように逐一詳細度を設定するよ
うにしているが、詳細度を一定の比率で増加させるよう
にすることにより、逐一設定することを省略することも
可能である。
Further, the search result presentation unit 17 of the embodiment directly displays the summary sentence generated by the sentence reorganization unit 43. Therefore, as shown in FIG. 17, the summary sentence is displayed over three lines for the third document. However, it is also possible to limit the portion of the summary text to a certain length and present it as shown below. "DSI's CAD, Kazuo Tanaka, among various kinds of LSI's CAD, as a representative of EA, custom VLSI CAD and analog layout CAD" In the summary sentence presenting section 18 of the embodiment, at the time of start-up, the title, author's name, and summary portion are summarized. Although the sentences and the headings of the respective chapters are displayed, it is easy to transform them so as to present, for example, a summary document about the postscript part. Similarly, it is possible to allow the user to customize the display in various forms. Further, in the embodiment, the detail level is set one by one as shown in FIG. 20, but it is possible to omit the setting level by increasing the detail level at a constant rate. Is.

【0059】実施例の検索処理部12は、検索装置内に
もちローカルなテキストデータベースを対象にして検索
処理を行っているが、これをオンラインでアクセスする
形態のデータベースに変更することも容易である。
The search processing unit 12 of the embodiment performs a search process for a local text database that is in the search device, but it is easy to change this to a database that can be accessed online. .

【0060】又、複数の要約文の提示を同時に行ったが
順々に提示してもよいし、所定個ずつ分割して提示して
もよい。又さらに上述した利用者の要求に応じた詳細度
は外部から指定することも可能である。
Although a plurality of abstract sentences are presented at the same time, they may be presented one after another or may be presented by dividing them by a predetermined number. Furthermore, the degree of detail corresponding to the user's request described above can be designated from the outside.

【0061】次に、図23ないし図26を参照して他の
実施例を説明する。
Next, another embodiment will be described with reference to FIGS.

【0062】この実施例は、図2の要約文書提示部18
の処理内容以外は先の実施例と同じであり、同一部分に
ついては詳細な説明を省く。
In this embodiment, the summary document presenting section 18 of FIG. 2 is used.
Except for the processing contents of the above, it is the same as the previous embodiment, and the detailed description of the same parts will be omitted.

【0063】図23は、この実施例に従った要約文書提
示部18の処理の流れを示している。この処理の流れに
よると、スタートで、まず、レベル0からレベルMまで
の章あるいは節などのタイトルを図25の(a)に示す
ように表示する。その後、入力イベントを待つ。入力が
あると、入力が詳細度変更コマンドか否かを判定する。
この判定がYESであれば、レベルMはレベルの最大値
であるかを判定するステップに進み、NOであれば、終
了コマンドか否かを判定するステップに進む。
FIG. 23 shows a processing flow of the summary document presenting section 18 according to this embodiment. According to the flow of this process, at the start, first, titles of chapters or sections from level 0 to level M are displayed as shown in FIG. Then wait for an input event. When there is an input, it is determined whether or not the input is a detail level change command.
If this determination is YES, it proceeds to the step of determining whether the level M is the maximum value of the level, and if NO, it proceeds to the step of determining whether it is an end command.

【0064】レベルMの判定結果がNOであれば、Mを
1つインクリメントし、最初のステップに戻り、YES
ならカーソルの位置が含まれる章あるいは節などのレベ
ルLと章番号Qを求める。この後、詳細度入力メニュー
を表示し、詳細度の入力を待つ。詳細度コマンドが指定
されると、図24の(b)に示すように節の見出しが追
加表示される。さらに、図25の(a)に示すように、
3.2節の(1)と(2)の見出しが表示される。
If the determination result of the level M is NO, M is incremented by 1, the process returns to the first step, and YES.
Then, the level L and chapter number Q of the chapter or section including the position of the cursor are obtained. After that, the detail level input menu is displayed to wait for the input of the detail level. When the detail level command is designated, the section headings are additionally displayed as shown in FIG. Furthermore, as shown in FIG.
The headings (1) and (2) in section 3.2 are displayed.

【0065】さらに、詳細度コマンドが指定されると、
カーソルにより指示されている2.1節の抄録文章が図
25の(b)に示すように表示される。このとき、カー
ソルが第2章の見出しの位置に置かれていた場合には、
図26に示すように第2章の見出しの直後に、2.1節
および2.2節の文章の抄録文が表示される。
Further, when the detail level command is specified,
The abstract text of section 2.1 designated by the cursor is displayed as shown in FIG. At this time, if the cursor is placed at the position of the chapter 2 heading,
As shown in FIG. 26, the abstract sentences of the sentences in sections 2.1 and 2.2 are displayed immediately after the chapter 2 heading.

【0066】次に、入力された詳細度に従って文書再構
成処理を行う。この文書再構成処理により生成された要
約文書を表示中のテキストに挿入する。この後、章番号
Qがインクリメントされ、章番号の章あるいは節などの
レベルがLより小さいか否かが判定される。この判定が
YESであれば、文書再構成処理のステップに戻り、N
Oであれば、入力イベント待ちのステップに戻る。
Next, the document reconstruction process is performed according to the input degree of detail. The summary document generated by this document reconstruction process is inserted into the text being displayed. After that, the chapter number Q is incremented, and it is determined whether or not the level of the chapter or section of the chapter number is smaller than L. If this determination is YES, the process returns to the step of document reconstruction processing, and N
If it is O, the process returns to the step of waiting for an input event.

【0067】入力が詳細変更コマンドか否かを判定する
上述した判定ステップにおいて、判定がNOであれば、
入力が終了コマンドか否かが判定され、終了コマンドで
あれば、ウィンドウを消去し、動作が終了するが、この
判定がNOであれば、入力イベント待ちのステップに戻
る。
If the judgment is NO in the above-mentioned judgment step for judging whether or not the input is the detail change command,
Whether the input is an end command is determined. If the input command is an end command, the window is erased and the operation ends. If the determination is NO, the process returns to the step of waiting for an input event.

【0068】以上に説明したように、上記実施例による
と、詳細度コマンドの指定に従って抄録文章を表示し、
入力された詳細度に従って文書再構成処理を行うことに
よって要約文書を作成し、この要約文書を検索に適用し
ているので、文書検索において、必要最小限の労力で検
索対象の文章の内容を利用者に理解させることができ
る。
As described above, according to the above embodiment, the abstract text is displayed according to the specification of the detail command,
Since the summary document is created by performing the document reconstruction process according to the input level of detail and this summary document is applied to the search, the content of the search target sentence is used with the minimum required effort in the document search. Can be understood by others.

【0069】本発明は、上記実施例に限定されず、発明
の主旨を逸脱しない範囲において様々な変形を行うこと
ができる。
The present invention is not limited to the above embodiments, and various modifications can be made without departing from the spirit of the invention.

【0070】[0070]

【発明の効果】以上説明したように、本発明の文書検索
装置では、指定する章や節を個別に詳細度の異なる要約
文章として動的に提示することが可能になる。これによ
り、利用者は必要最少限の労力で検索結果の個々の文書
に書かれた内容を理解することができるようになり、効
率的な検索行為が実現できる。
As described above, in the document search device of the present invention, it is possible to dynamically present a specified chapter or section individually as a summary sentence having a different level of detail. As a result, the user can understand the content written in each document of the search result with the minimum required effort, and an efficient search action can be realized.

【図面の簡単な説明】[Brief description of drawings]

【図1】機器構成図。FIG. 1 is a device configuration diagram.

【図2】機能構成図。FIG. 2 is a functional configuration diagram.

【図3】システム制御部の処理の流れを示す図。FIG. 3 is a diagram showing a processing flow of a system control unit.

【図4】書式解析部の処理の流れを示す図。FIG. 4 is a diagram showing a processing flow of a format analysis unit.

【図5】書式解析部の処理の流れを示す図。FIG. 5 is a diagram showing a processing flow of a format analysis unit.

【図6】書式解析部の処理の流れを示す図。FIG. 6 is a diagram showing a processing flow of a format analysis unit.

【図7】タイトル検出パターンを示す図。FIG. 7 is a diagram showing a title detection pattern.

【図8】文書構造記録部の形式を示す図。FIG. 8 is a diagram showing a format of a document structure recording unit.

【図9】文書例を示す図。FIG. 9 is a diagram showing an example of a document.

【図10】文書構造記録部の内容例を示す図。FIG. 10 is a diagram showing an example of contents of a document structure recording unit.

【図11】要約生成部の処理の流れを示す図。FIG. 11 is a diagram showing a flow of processing of a summary generation unit.

【図12】文書例と文脈構造を示す図。FIG. 12 is a diagram showing an example of a document and a context structure.

【図13】要約文章記憶部に格納される文脈構造の例を
示す図。
FIG. 13 is a diagram showing an example of a context structure stored in a summary text storage unit.

【図14】ペナルティ計算部の処理の流れを示す図。FIG. 14 is a diagram showing a processing flow of a penalty calculation unit.

【図15】文章再構成部の処理の流れを示す図。FIG. 15 is a diagram showing a flow of processing of a sentence reconstructing unit.

【図16】検索結果提示部の処理の流れを示す図。FIG. 16 is a diagram showing a processing flow of a search result presentation unit.

【図17】検索結果提示部における表示例を示す図。FIG. 17 is a diagram showing a display example in the search result presentation unit.

【図18】要約文章提示部の処理の流れを示す図。FIG. 18 is a diagram showing a flow of processing of a summary text presentation unit.

【図19】要約文章提示部における表示例を示す図。FIG. 19 is a diagram showing a display example in a summary text presentation unit.

【図20】要約文章提示部における表示例を示す図。FIG. 20 is a diagram showing a display example in a summary text presentation unit.

【図21】要約文章提示部における表示例を示す図。FIG. 21 is a diagram showing a display example in a summary text presentation unit.

【図22】要約文章提示部における表示例を示す図。FIG. 22 is a diagram showing a display example in a summary text presentation unit.

【図23】他の実施例に従った要約文書提示部の処理内
容を示す流れ図。
FIG. 23 is a flowchart showing the processing contents of a summary document presenting unit according to another embodiment.

【図24】図24の実施例に基づいた要約文章提示部に
おける表示の一例を示す図。
FIG. 24 is a diagram showing an example of a display in a summary sentence presentation unit based on the embodiment of FIG. 24.

【図25】図24の実施例に基づいた要約文章提示部に
おける表示の他の例を示す図。
FIG. 25 is a diagram showing another example of the display in the summary sentence presentation unit based on the embodiment of FIG. 24.

【図26】図24の実施例に基づいた要約文章提示部に
おける表示の他の例を示す図。
FIG. 26 is a diagram showing another example of the display in the summary sentence presentation unit based on the embodiment of FIG. 24.

【符号の説明】[Explanation of symbols]

1…中央処理手段 2…記憶手段 3…表示コ
ントローラ 4…表示手段 5…入力コントローラ 6…入力手
DESCRIPTION OF SYMBOLS 1 ... Central processing means 2 ... Storage means 3 ... Display controller 4 ... Display means 5 ... Input controller 6 ... Input means

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 複数の文書が記憶された記憶手段と、こ
の記憶手段に記憶された文書に対し検索を行う検索手段
と、この検索手段によって得られた文書の構造を解析す
る解析手段と、この解析手段で得られた文書構造に基づ
いて要約文章を生成する要約生成手段と、この要約生成
手段によって得られた文書についての要約文章が複数存
在する場合にこれらを同時あるいは順次提示する検索結
果提示手段と、この検索結果提示手段で提示された要約
文章の1つを選択する選択手段と、この選択手段によっ
て選択された要約文章に対して、より詳しい要約文章あ
るいは原の文書そのものを提示することを特徴とする文
書検索装置。
1. Storage means for storing a plurality of documents, search means for searching the documents stored in the storage means, and analysis means for analyzing the structure of the document obtained by the search means. Summary generating means for generating a summary sentence based on the document structure obtained by the analyzing means, and a search result for presenting simultaneously or sequentially a plurality of summary sentences for the document obtained by the summary generating means The presenting means, the selecting means for selecting one of the summary sentences presented by this search result presenting means, and the more detailed summary sentence or the original document itself is presented for the summary sentence selected by this selecting means. A document retrieval device characterized by the above.
JP34952993A 1993-09-13 1993-12-28 Document search device Expired - Fee Related JP3383049B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34952993A JP3383049B2 (en) 1993-09-13 1993-12-28 Document search device

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP22681593 1993-09-13
JP5-226815 1993-09-13
JP34952993A JP3383049B2 (en) 1993-09-13 1993-12-28 Document search device

Publications (2)

Publication Number Publication Date
JPH07129605A true JPH07129605A (en) 1995-05-19
JP3383049B2 JP3383049B2 (en) 2003-03-04

Family

ID=26527356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34952993A Expired - Fee Related JP3383049B2 (en) 1993-09-13 1993-12-28 Document search device

Country Status (1)

Country Link
JP (1) JP3383049B2 (en)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101990A (en) * 1995-07-31 1997-04-15 Toshiba Corp Information filtering device
EP0855660A2 (en) * 1997-01-17 1998-07-29 Fujitsu Limited Summarization apparatus and method
JPH10222520A (en) * 1997-01-31 1998-08-21 Toshiba Corp Electronic document processor
JPH11219361A (en) * 1998-02-02 1999-08-10 Fujitsu Ltd Document browsing device and medium to store its program
JP2000242656A (en) * 1999-02-19 2000-09-08 Nippon Telegr & Teleph Corp <Ntt> Topic extraction method and device and storage medium recorded with topic extraction program
KR100319756B1 (en) * 2000-01-21 2002-01-09 오길록 Method for analyzing structure of treatise typed of document image
JP2003281165A (en) * 2001-11-13 2003-10-03 Posco Document summarization method and system
JP2005258676A (en) * 2004-03-10 2005-09-22 Seiko Epson Corp Document outputting device and its control method
JP2008192294A (en) * 1995-07-26 2008-08-21 Sony Electronics Inc Information obtaining device and information obtaining method
JP2011138270A (en) * 2009-12-28 2011-07-14 Rakuten Inc Information retrieval device, information providing method, program and system for retrieving information
US9367605B2 (en) 2009-09-23 2016-06-14 Alibaba Group Holding Limited Abstract generating search method and system
KR20200077126A (en) * 2018-12-20 2020-06-30 주식회사 로지스랩 Freight charge payment system and method for freight transport

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02224069A (en) * 1988-11-21 1990-09-06 Hitachi Ltd Information retrieving system
JPH044467A (en) * 1990-04-23 1992-01-08 Oki Electric Ind Co Ltd Sentence structure analyzing device
JPH04175966A (en) * 1990-11-09 1992-06-23 Hitachi Ltd Document logical structure generating method
JPH04281566A (en) * 1991-03-08 1992-10-07 Toshiba Corp Document retrieving device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02224069A (en) * 1988-11-21 1990-09-06 Hitachi Ltd Information retrieving system
JPH044467A (en) * 1990-04-23 1992-01-08 Oki Electric Ind Co Ltd Sentence structure analyzing device
JPH04175966A (en) * 1990-11-09 1992-06-23 Hitachi Ltd Document logical structure generating method
JPH04281566A (en) * 1991-03-08 1992-10-07 Toshiba Corp Document retrieving device

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4660565B2 (en) * 1995-07-26 2011-03-30 ソニー エレクトロニクス インク Information acquisition apparatus and information acquisition method
JP2008192294A (en) * 1995-07-26 2008-08-21 Sony Electronics Inc Information obtaining device and information obtaining method
JPH09101990A (en) * 1995-07-31 1997-04-15 Toshiba Corp Information filtering device
EP1338983A3 (en) * 1997-01-17 2003-12-17 Fujitsu Limited Summarization apparatus and method
EP0855660A2 (en) * 1997-01-17 1998-07-29 Fujitsu Limited Summarization apparatus and method
EP0855660A3 (en) * 1997-01-17 1998-08-19 Fujitsu Limited Summarization apparatus and method
EP1338983A2 (en) * 1997-01-17 2003-08-27 Fujitsu Limited Summarization apparatus and method
JPH10222520A (en) * 1997-01-31 1998-08-21 Toshiba Corp Electronic document processor
JPH11219361A (en) * 1998-02-02 1999-08-10 Fujitsu Ltd Document browsing device and medium to store its program
JP2000242656A (en) * 1999-02-19 2000-09-08 Nippon Telegr & Teleph Corp <Ntt> Topic extraction method and device and storage medium recorded with topic extraction program
KR100319756B1 (en) * 2000-01-21 2002-01-09 오길록 Method for analyzing structure of treatise typed of document image
JP2003281165A (en) * 2001-11-13 2003-10-03 Posco Document summarization method and system
KR100435442B1 (en) * 2001-11-13 2004-06-10 주식회사 포스코 Method And System For Summarizing Document
JP2005258676A (en) * 2004-03-10 2005-09-22 Seiko Epson Corp Document outputting device and its control method
JP4572321B2 (en) * 2004-03-10 2010-11-04 セイコーエプソン株式会社 Document output apparatus and control method thereof
US9367605B2 (en) 2009-09-23 2016-06-14 Alibaba Group Holding Limited Abstract generating search method and system
JP2011138270A (en) * 2009-12-28 2011-07-14 Rakuten Inc Information retrieval device, information providing method, program and system for retrieving information
KR20200077126A (en) * 2018-12-20 2020-06-30 주식회사 로지스랩 Freight charge payment system and method for freight transport

Also Published As

Publication number Publication date
JP3383049B2 (en) 2003-03-04

Similar Documents

Publication Publication Date Title
JP3691844B2 (en) Document processing method
US6411924B1 (en) System and method for linguistic filter and interactive display
US7617449B2 (en) Method and system for mapping content between a starting template and a target template
US8359550B2 (en) Method for dynamically generating a “table of contents” view of the HTML-based information system
JP2783558B2 (en) Summary generation method and summary generation device
JP2003223437A (en) Method of displaying candidate for correct word, method of checking spelling, computer device, and program
JP3383049B2 (en) Document search device
JP2002197104A (en) Device and method for data retrieval processing, and recording medium recording data retrieval processing program
JP3143345B2 (en) String search device
JP2937519B2 (en) Document search device
JPH11184865A (en) Document summarizing device
JP2957875B2 (en) Document information search device and document search result display method
JP3937741B2 (en) Document standardization
JPH08287088A (en) Method and device for information retrieval
JP2785692B2 (en) Dictionary search and display device
JPH06231178A (en) Document retrieving device
JPH05113964A (en) Electronic dictionary
JPH08212230A (en) Document retrieval method and device therefor
JPH10340271A (en) Document abstract preparation device, and storage medium where document abstract generation program is recorded
JPH06195386A (en) Data retriever
JPH08137892A (en) Method and device for document retrieval
JPH08235191A (en) Method and device for document retrieval
JP3022079B2 (en) Full-text database system
JPH0969087A (en) Device and method for document preparation
JPH01214963A (en) Device for consulting dictionary

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071220

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081220

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091220

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091220

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101220

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101220

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111220

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121220

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131220

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees