JP2581376B2 - Document search device - Google Patents

Document search device

Info

Publication number
JP2581376B2
JP2581376B2 JP4160895A JP16089592A JP2581376B2 JP 2581376 B2 JP2581376 B2 JP 2581376B2 JP 4160895 A JP4160895 A JP 4160895A JP 16089592 A JP16089592 A JP 16089592A JP 2581376 B2 JP2581376 B2 JP 2581376B2
Authority
JP
Japan
Prior art keywords
document
search
attribute
difference
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4160895A
Other languages
Japanese (ja)
Other versions
JPH06318234A (en
Inventor
研治 佐藤
一至 村木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP4160895A priority Critical patent/JP2581376B2/en
Publication of JPH06318234A publication Critical patent/JPH06318234A/en
Application granted granted Critical
Publication of JP2581376B2 publication Critical patent/JP2581376B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、文書検索装置に関し、
特に文書とその差異性・類似性での検索機能を有する文
書検索装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document retrieval apparatus,
In particular, the present invention relates to a document search device having a search function for documents and their differences / similarities.

【0002】[0002]

【従来の技術】従来の文書検索装置は、文書の属性のみ
を検索条件として入力し、複数の検索条件により文書の
数を絞り込み、目的文書を探し出すという検索を行う文
書検索装置である。文書の検索においては、1つの文書
を検索して、その文書が目的の文書ではないが近いと感
じられる際に、目的の文書と非常に似かよっているとい
う観点での類似性での検索要求が生じたり、ある点では
目的の文書と同じなのだがある点では異なっているとい
う観点での差異性での検索要求が生じることがある。例
えば、特開平2−2458号公報では、キーワードが振
られていない文書から自動的にキーワードを抽出し、そ
のキーワードと検索キーとして与えられたキーワードの
類似度を計算し文書を検索する方法が提案されていて、
検索キーとしてキーワードを持っていない文書を与えて
も、その文書からキーワードを抽出することで類似した
文書の検索が可能になっている。
2. Description of the Related Art A conventional document search apparatus is a document search apparatus that performs a search by inputting only the attributes of a document as search conditions, narrowing down the number of documents by a plurality of search conditions, and searching for a target document. In a document search, when a single document is searched and the document is not the target document but is felt to be close, a search request based on the similarity in terms of being very similar to the target document is issued. In some cases, a search request may be made with a difference in terms of being different in some respects that are the same as the target document in some respects. For example, Japanese Patent Application Laid-Open No. 2-2458 proposes a method of automatically extracting a keyword from a document to which no keyword is assigned, calculating the similarity between the keyword and a keyword given as a search key, and searching for the document. Have been
Even if a document that does not have a keyword is given as a search key, a similar document can be searched by extracting the keyword from the document.

【0003】従来の装置では、表示されている文書自身
を検索キーとして類似した文書を検索するという検索手
段が提供されていないため、探したい文書を特定するよ
うなキーワードを想像してそのキーワードを入力する
が、キーワードが文書を正確に特定できないため、正し
く検索が行えないという問題点が存在する。
The conventional apparatus does not provide a search means for searching for a similar document using the displayed document itself as a search key. Therefore, a keyword for specifying a document to be searched is imagined and the keyword is searched for. There is a problem that a search cannot be performed correctly because a keyword cannot be accurately specified for a document.

【0004】前述の公報に記載された検索法でも、文書
を検索元としてその文書との差異や類似を更に指定する
方法での検索法は与えられていない。
[0004] Even the search method described in the above-mentioned publication does not provide a search method in which a document is used as a search source and a difference or similarity with the document is further designated.

【0005】このように従来の文書検索装置では、1つ
の文書が検索された場合や、既に提示されている場合
に、その文書との類似での文書検索の指定や、その文書
とある観点が異なっている文書の検索の指定が行えない
という問題がある。
[0005] As described above, in the conventional document retrieval apparatus, when one document is retrieved or already presented, it is difficult to specify a document retrieval similar to the document or to obtain a certain viewpoint with the document. There is a problem that a search for a different document cannot be specified.

【0006】[0006]

【課題を解決するための手段】上述した問題点を解決す
るために、本発明による文書検索装置は、文書を保持す
る文書保持手段と、文書に付属する属性を保持する文書
属性保持手段と、文書の検索条件を入力する検索条件入
力手段と、検索条件に従って文書を検索する文書検索手
段と、前記文書検索手段により検索された当該検索文書
および当該検索文書に関する属性情報を提示する文書提
示手段と、当該検索文書と属性の値を検索条件として入
力する文書属性値条件入力手段と、当該検索文書と属性
の型を検索条件として入力する文書属性型条件入力手段
と、当該検索文書の近隣の提示の要求を入力する文書近
隣要求入力手段と、当該検索文書の属性と他の文書の属
性から類似性を計算する類似性計算手段と、当該検索文
書の属性と他の文書の属性から差異性を計算する差異性
計算手段と、計算された類似性または差異性と前記文書
属性値条件入力手段および文書属性型条件入力手段およ
び文書近隣要求入力手段によって得られた検索条件に従
って文書を検索する類似・差異検索手段と、検索結果が
複数文書である場合に、当該検索文書とその近隣文書の
類似・差異性情報を提示する近隣情報提示手段を有す
る。
In order to solve the above-mentioned problems, a document search apparatus according to the present invention comprises: a document holding unit for holding a document; a document attribute holding unit for holding an attribute attached to the document; Search condition input means for inputting a search condition of a document, document search means for searching for a document according to the search condition, document presentation means for presenting the search document searched by the document search means and attribute information related to the search document Document attribute value condition input means for inputting the search document and attribute values as search conditions, document attribute type condition input means for inputting the search document and attribute types as search conditions, and presentation of neighborhood of the search document Document proximity request input means for inputting a request of the same, similarity calculation means for calculating similarity from the attribute of the search document and the attribute of another document, the attribute of the search document and another sentence A difference calculating means for calculating the difference from the attribute of the document, and the calculated similarity or difference and a search condition obtained by the document attribute value condition input means, the document attribute type condition input means and the document neighborhood request input means. A similarity / difference search means for searching for a document, and a proximity information presenting means for presenting similarity / difference information between the search document and its neighboring documents when the search result is a plurality of documents.

【0007】[0007]

【実施例】次に、本発明について図面を参照して説明す
る。図1は本発明の一実施例を示すブロック図である。
図1を参照すると、本発明の実施例は、文書を保持する
文書保持手段2と文書に付属する属性を保持する文書属
性保持手段3を内部に備えた文書データベース1と、文
書の検索条件を入力する検索条件入力手段4と、前記検
索条件入力手段4によって入力された検索条件に従って
文書を検索する文書検索手段5と、前記文書検索手段5
により検索された当該検索文書および当該検索文書に関
する属性情報を提示する文書提示手段12と、当該検索
文書と属性の値を検索条件として入力する文書属性値条
件入力手段6と、当該検索文書と属性の型を検索条件と
して入力する文書属性型条件入力手段7と、当該検索文
書の近隣の提示の要求を入力する文書近隣要求入力手段
8と、当該検索文書の属性と他の文書の属性から類似性
を計算する類似性計算手段9と、当該検索文書の属性と
他の文書の属性から差異性を計算する差異性計算手段1
0と、計算された類似性または差異性と前記文書属性値
条件入力手段6および文書属性型条件入力手段7および
文書近隣要求入力手段8によって得られた検索条件に従
って文書を検索する類似・差異検索手段11と、検索結
果が複数文書である場合に、当該検索文書とその近隣文
書の類似・差異性情報を提示する近隣情報提示手段13
とから構成される。
Next, the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing one embodiment of the present invention.
Referring to FIG. 1, in an embodiment of the present invention, a document database 1 including therein a document holding unit 2 for holding a document and a document attribute holding unit 3 for holding an attribute attached to the document, and a search condition of the document. Search condition input means 4 for inputting, document search means 5 for searching for a document according to the search condition input by the search condition input means 4, and document search means 5
A document presenting unit 12 for presenting the search document and attribute information related to the search document searched by the search unit; a document attribute value condition input unit 6 for inputting the search document and attribute values as search conditions; Attribute type input means 7 for inputting the type of the search document as a search condition, document neighborhood request input means 8 for inputting a request for presentation of the vicinity of the search document, and similarity from the attribute of the search document and the attribute of another document Similarity calculating means 9 for calculating the similarity, and difference calculating means 1 for calculating the difference from the attribute of the search document and the attribute of another document.
0, a similarity / difference search for searching a document in accordance with the calculated similarity or difference and the search conditions obtained by the document attribute value condition input means 6, the document attribute type condition input means 7, and the document neighborhood request input means 8 A means 11 for presenting similarity / difference information between the search document and its neighboring documents when the retrieval result is a plurality of documents;
It is composed of

【0008】検索条件入力手段4により入力された文書
の通常の検索条件は通信線45を通して文書検索手段5
へ送られる。文書検索手段5では、文書属性保存手段3
より文書属性を通信線35を通して取り出し、条件に当
てはまる属性を探し、対応する文書を文書保存手段2よ
り通信線25を通して取り出す。検索された文書は通信
線512を通して文書提示手段12へ送られ使用者に提
示される。文書属性値条件入力手段6により入力された
特定文書(提示中の文書)と属性値は通信線611を通
して、文書属性型条件入力手段7により入力された特定
文書と属性型は通信線711を通して、文書近隣要求入
力手段8により入力された特定文書と近隣の距離は通信
線811を通して、類似・差異検索手段11に送られ
る。類似・差異検索手段11では通信線311を通して
文書属性保存手段3より文書属性を取り出す。検索文書
の属性と表示文書の属性は通信線119を通して類似性
計算手段9へ、通信線1110を通して差異性計算手段
10ヘ送られる。類似性計算手段9および差異性計算手
段10で計算された類似性および差異性は、それぞれ通
信線911および通信線1011を通して、類似・差異
計算手段11へ送られる。類似・差異・差異検索手段1
1では、得られた類似性・差異性を基に検索条件に該当
する文書を探し、対応する文書を文書保存手段2より通
信線211を通して取り出す。検索された文書が1つの
場合は、通信線1112を通して文書提示手段12へ送
られ使用者に提示される。検索された文書が複数の場合
は、通信線1113を通して近隣情報提示手段に送ら
れ、文書間の類似性・差異性と共に検索された文書が提
示される。
[0008] The ordinary search condition of the document input by the search condition input means 4 is transmitted through the communication line 45 to the document search means 5.
Sent to In the document search means 5, the document attribute storage means 3
More document attributes are extracted through the communication line 35, attributes matching the conditions are searched, and the corresponding document is extracted from the document storage unit 2 through the communication line 25. The retrieved document is sent to the document presenting means 12 through the communication line 512 and presented to the user. The specific document (present document) and the attribute value input by the document attribute value condition input unit 6 are transmitted through a communication line 611, and the specific document and the attribute type input by the document attribute type condition input unit 7 are transmitted through a communication line 711. The distance between the specific document and the neighborhood inputted by the document neighborhood request input means 8 is sent to the similarity / difference search means 11 through the communication line 811. The similarity / difference searching means 11 retrieves the document attribute from the document attribute storing means 3 through the communication line 311. The attribute of the search document and the attribute of the display document are sent to the similarity calculating means 9 through the communication line 119 and to the difference calculating means 10 through the communication line 1110. The similarity and difference calculated by the similarity calculator 9 and the difference calculator 10 are sent to the similarity / difference calculator 11 through the communication line 911 and the communication line 1011 respectively. Similarity / difference / difference search means 1
In step 1, a document that satisfies the search condition is searched based on the obtained similarity / difference, and the corresponding document is extracted from the document storage unit 2 through the communication line 211. If one document is found, the document is sent to the document presenting means 12 through the communication line 1112 and presented to the user. If there are a plurality of retrieved documents, the retrieved documents are sent to the neighborhood information presenting unit via the communication line 1113, and the retrieved documents are presented together with the similarity / difference between the documents.

【0009】本実施例では、属性とは文書内部に存在す
るキーワードや文書に付与されたキーワードも含んでい
る。
In the present embodiment, the attributes include keywords existing in the document and keywords assigned to the document.

【0010】文書属性値条件入力手段6では、ユーザは
現在提示されている文書に対してその文書とはここが違
うまたはここが同じという点を入力する。例えば、該当
提示文書は「佐藤」が書いたものであるが、検索したい
文書は私がかいたものといった指定や、この文書にさら
に「経済摩擦」というキーワードが増えたものといった
指定や、この文書から「首相」というキーワードが抜け
たものといった指定をする。
In the document attribute value condition input means 6, the user inputs to the currently presented document that the document is different from or the same as the document. For example, the relevant presentation document was written by "Sato", but the document to be searched was specified by me, or this document was further specified by the keyword "economic friction". From the keyword "Prime Minister".

【0011】文書属性型条件入力手段7では、ユーザが
現在提示されている文書との違いを明確に指定できない
場合に、異なっているまたは同じと意識できる属性の型
で検索を指定する。例えば、いつ書いた文書だったかは
思い出せないが、この文書とは「作成日時」が異なって
いるものといった指定をする。
The document attribute type condition input means 7 specifies a search using an attribute type that is different or the same as the attribute when the user cannot clearly specify the difference from the currently presented document. For example, the user cannot remember when the document was written, but specifies that the document has a different "date and time" from this document.

【0012】文書近隣要求入力手段8では、ユーザが現
在提示されている文書に対し、この文書ではないが、非
常に似ていると意識した場合に、その文書と属性で近い
ものという指定をする。
In the document neighborhood request input means 8, when the user is conscious that the document presently presented is not this document but very similar, the user designates that the document is close in attribute to the document. .

【0013】これらの検索条件に対し、類似性計算手段
9では、より多くの属性が共通している文書を類似文書
として文書の分類を行なう。また差異性計算手段10で
は、類似している文書の差異を属性の異なりで更に分類
を行う。これらの計算法としては、例えば2つの文書の
異なっている属性値の数をそれらの文書間の距離として
計算し、この距離を用いて文書の分類を行なうといった
方法を用いることができる。類似・差異検索手段11で
は、この計算された文書の類似性および差異性を用い
て、検索条件に適合する文書を検索する。
In response to these search conditions, the similarity calculation means 9 classifies documents having more common attributes as similar documents. Further, the difference calculating means 10 further classifies differences between similar documents based on differences in attributes. As these calculation methods, for example, a method of calculating the number of different attribute values of two documents as a distance between the documents, and classifying the documents using this distance can be used. The similarity / difference search unit 11 searches for a document that satisfies the search condition using the calculated similarity and difference between the documents.

【0014】近隣情報提示手段13では、検索結果の文
章が複数である場合に、その直前の検索で検索条件とな
った文書と、検索された文書の差異を、検索された文書
に付加してユーザに提示する。この提示方法としては、
例えば検索条件の文書と検索された文書をそれぞれノー
ドとするグラフ構造で表し、検索条件の文書と検索され
た文書を結ぶ線にその差を表す属性値を付与してやると
いった方法を用いることができる。
When there are a plurality of sentences in the search result, the neighborhood information presenting means 13 adds the difference between the document that was the search condition in the immediately preceding search and the searched document to the searched document. Present to the user. As a presentation method,
For example, it is possible to use a method in which the document of the search condition and the retrieved document are represented by a graph structure having nodes as nodes, and a line connecting the document of the search condition and the retrieved document is given an attribute value indicating the difference.

【0015】[0015]

【発明の効果】以上説明したように、本発明による文書
検索装置では、1つの文書が検索された場合や、既に提
示されている場合に、その文書との類似での文書検索の
指定や、その文書とある観点が異なっている文書の検索
の指定により文書検索が行えるようになるという効果を
有する。またこの文書検索装置は、文字で構成された文
書だけではなく、画像データや音声データ等の付加的な
属性に対しても類似性・差異性を取り扱うことで、マル
チメディア文書の類似・差異による検索をも行える。
As described above, in the document retrieval apparatus according to the present invention, when one document is retrieved or already presented, designation of document retrieval similar to the document, This has an effect that a document search can be performed by designating a search for a document having a different viewpoint from the document. In addition, this document search apparatus handles similarity / difference not only for a document composed of characters but also for additional attributes such as image data and audio data, so that a similarity / difference of a multimedia document can be obtained. You can also search.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例を示すブロック図である。FIG. 1 is a block diagram showing one embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 文書データベース 2 文書保存手段 3 文書属性保存手段 4 検索条件入力手段 5 文書検索手段 6 文書属性値条件入力手段 7 文書属性型条件入力手段 8 文書近隣要求入力手段 9 類似性計算手段 10 差異性計算手段 11 類似・差異検索手段 12 文書提示手段 13 近隣情報提示手段 Reference Signs List 1 document database 2 document storage means 3 document attribute storage means 4 search condition input means 5 document search means 6 document attribute value condition input means 7 document attribute type condition input means 8 document neighborhood request input means 9 similarity calculation means 10 difference calculation Means 11 Similarity / difference search means 12 Document presentation means 13 Neighborhood information presentation means

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 文書を保持する文書保持手段と、文書に
付属する属性を保持する文書属性保持手段と、文書の検
索条件を入力する検索条件入力手段と、検索条件に従っ
て文書を検索する文書検索手段と、前記文書検索手段に
より検索された当該検索文書および当該検索文書に関す
る属性情報を提示する文書提示手段と、当該検索文書と
属性の値を検索条件として入力する文書属性値条件入力
手段と、当該検索文書と属性の型を検索条件として入力
する文書属性型条件入力手段と、当該検索文書の近隣の
提示の要求を入力する文書近隣要求入力手段と、当該検
索文書の属性と他の文書の属性から類似性を計算する類
似性計算手段と、当該検索文書の属性と他の文書の属性
から差異性を計算する差異性計算手段と、計算された類
似性または差異性と前記文書属性値条件入力手段および
文書属性型条件入力手段および文書近隣要求入力手段に
よって得られた検索条件に従って文書を検索する類似・
差異検索手段と、検索結果が複数文書である場合に、当
該検索文書とその近隣文書の類似・差異性情報を提示す
る近隣情報提示手段を有することを特徴とする文書検索
装置。
1. A document holding unit for holding a document, a document attribute holding unit for holding an attribute attached to the document, a search condition input unit for inputting a search condition of the document, and a document search for searching the document according to the search condition Means, document presenting means for presenting the search document searched by the document search means and attribute information about the search document, document attribute value condition input means for inputting the search document and attribute values as search conditions, A document attribute type condition input unit for inputting the search document and the attribute type as search conditions, a document neighborhood request input unit for inputting a request for presentation of the vicinity of the search document; A similarity calculating means for calculating the similarity from the attribute, a difference calculating means for calculating the difference from the attribute of the search document and the attribute of another document, and a calculated similarity or difference. A similarity search for a document according to the search conditions obtained by the document attribute value condition input means, the document attribute type condition input means and the document neighborhood request input means.
A document search device comprising: a difference search unit; and, when a search result is a plurality of documents, a neighborhood information presenting unit that presents similarity / difference information between the search document and a neighboring document thereof.
JP4160895A 1992-06-19 1992-06-19 Document search device Expired - Lifetime JP2581376B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4160895A JP2581376B2 (en) 1992-06-19 1992-06-19 Document search device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4160895A JP2581376B2 (en) 1992-06-19 1992-06-19 Document search device

Publications (2)

Publication Number Publication Date
JPH06318234A JPH06318234A (en) 1994-11-15
JP2581376B2 true JP2581376B2 (en) 1997-02-12

Family

ID=15724685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4160895A Expired - Lifetime JP2581376B2 (en) 1992-06-19 1992-06-19 Document search device

Country Status (1)

Country Link
JP (1) JP2581376B2 (en)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01304531A (en) * 1988-06-01 1989-12-08 Hitachi Ltd Data base system
JPH0415869A (en) * 1990-05-10 1992-01-21 Toshiba Corp Electronic filing device

Also Published As

Publication number Publication date
JPH06318234A (en) 1994-11-15

Similar Documents

Publication Publication Date Title
US5523945A (en) Related information presentation method in document processing system
JPH10171819A (en) Information retrieving device
JPH11224256A (en) Information retrieving method and record medium recording information retrieving program
JP3178421B2 (en) Text search device and computer-readable recording medium storing text search program
JP3612769B2 (en) Information search apparatus and information search method
JP3281639B2 (en) Document search system
JP2581376B2 (en) Document search device
JPH0581326A (en) Data base retrieving device
JPS6378228A (en) Information retrieving device
JP3222193B2 (en) Information retrieval device
JP2732661B2 (en) Text type database device
JP2009104475A (en) Similar document retrieval device, and similar document retrieval method and program
JPH07134720A (en) Method and device for presenting relative information in sentence preparing system
JP3825829B2 (en) Registration information retrieval apparatus and method
JP3591813B2 (en) Data retrieval method, apparatus and recording medium
JP4034503B2 (en) Document search system and document search method
JP3436109B2 (en) Related search formula search device and computer-readable recording medium storing related search formula search program
JP3897409B2 (en) Information processing apparatus and method, and storage medium storing program
JPH09297795A (en) Relative name removal batch retrieval system
JPH0488474A (en) Document processor
JPH02108157A (en) Information retrieving method
JPH08249341A (en) Document storage and retrieval device for document data base
JPH07120357B2 (en) Document retrieval device
JPH01233517A (en) Data base retrieving device
JP2739589B2 (en) Information retrieval device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19961001