JPH07262199A - Retrieval result sorter - Google Patents

Retrieval result sorter

Info

Publication number
JPH07262199A
JPH07262199A JP6048455A JP4845594A JPH07262199A JP H07262199 A JPH07262199 A JP H07262199A JP 6048455 A JP6048455 A JP 6048455A JP 4845594 A JP4845594 A JP 4845594A JP H07262199 A JPH07262199 A JP H07262199A
Authority
JP
Japan
Prior art keywords
classification
item
result
item value
search result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6048455A
Other languages
Japanese (ja)
Inventor
Hide Fuji
秀 富士
Naomi Sugimoto
尚美 杉本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP6048455A priority Critical patent/JPH07262199A/en
Publication of JPH07262199A publication Critical patent/JPH07262199A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To improve classification efficiency by automatically selecting an appropriate classification axis by finding the evaluation value of the item value of an item sampled from a retrieval result and providing by classifying the retrieval result to a retriever based on a selected classification axis. CONSTITUTION:This sorter is equipped with an item/item value sampling means 3 which samples the item 31 and the item value 32 from the retrieval result 1, a classification axis selecting means 4 which selects the classification axis from sampled item 31 and item value 32, and a classification execution means 5 which classifies the retrieval result 1 based on the selected classification axis.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、検索結果の分類を行う
検索結果分類装置であって、情報検索装置において、検
索結果に適した分類軸を選定して当該分類軸に沿って検
索結果を自動的に分類する検索結果分類装置に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention is a search result classification device for classifying search results, wherein an information search device selects a classification axis suitable for a search result and searches results along the classification axis. The present invention relates to a search result classification device that classifies automatically.

【0002】[0002]

【従来の技術】情報検索装置において、ある1つの入力
に対する結果は、1つだけでなく複数存在することが多
い。近年のように多量の電子化文書が出回り、大規模デ
ータベースなどが普及してくると、これらのデータベー
スを対象として情報検索を行った際の検索結果数は大き
なものになっている。
2. Description of the Related Art In an information retrieval system, there are many results for one input, not only one result. When a large amount of electronic documents have been distributed and large-scale databases have become widespread as in recent years, the number of search results when conducting information searches on these databases has become large.

【0003】最も基本的な情報検索装置は、検索を行う
と検索結果数が表示され、論理演算などによってこの件
数がある程度小さくなってから、検索者が一次情報を1
件1件見て必要とする文献を探すようになっている。
In the most basic information retrieval device, the number of retrieval results is displayed when a retrieval is performed, and the number of retrieval results is reduced to some extent by a logical operation or the like, and then the retrieval person sets the primary information to 1
After looking at one case, they are looking for the documents they need.

【0004】しかし、このような検索装置は、ヒットし
た結果集合の内容が妥当であるか否かは、各一次情報を
見て初めて判るので、最終的に必要な情報を探し出すの
に時間がかかるという欠点がある。
However, in such a retrieval device, it is only possible to determine whether or not the contents of the hit result set are appropriate by looking at each primary information, so it takes time to finally find the necessary information. There is a drawback that.

【0005】そこで、結果件数が得られた時点で、その
結果集合を適当な分類軸によって分類して表示するよう
な装置もある。分類軸として、一次情報の中の例えば
「日付」や「作成者名」などの項目を使うこともでき
る。検索者は、このような分類された結果を見ることに
よって、見る必要のある一次情報の量を事前に減らすこ
とができるので、検索の効率化につながる。
Therefore, there is also an apparatus which, when the number of results is obtained, classifies and displays the result set by an appropriate classification axis. Items such as "date" and "creator name" in the primary information can be used as the classification axis. By looking at such classified results, the searcher can reduce the amount of primary information that he or she needs to see in advance, which leads to efficient search.

【0006】従来の分類機構付の検索装置は、検索者が
適当な分類軸を自ら選ぶようになっており、検索装置は
この選ばれた分類軸を使って分類表示していた。
[0006] In a conventional search device with a classification mechanism, a searcher himself or herself selects an appropriate classification axis, and the search device performs classification display using this selected classification axis.

【0007】[0007]

【発明が解決しようとする課題】従来の分類軸をもとに
検索結果を分類して表示する検索装置は、検索者自身が
分類軸を選ぶ必要があり、検索機構や検索対象データに
詳しくない一般検索者にとっては、操作が難しいという
問題があった。
In the conventional search device for classifying and displaying the search results based on the classification axis, the searcher himself / herself needs to select the classification axis and is not familiar with the search mechanism or the search target data. There is a problem that the operation is difficult for general searchers.

【0008】一般検索者は、結果を分類表示することが
検索の効率化につながるということを認識していない場
合が多く、また、認識している場合でも分類表示の操作
方法が判らなかったり、どうような分類項目があるかに
ついて知識のない場合が多い。せっかくこのような結果
分類機能のある検索装置でも、分類機能が有効に活用さ
れないという問題があった。
[0008] In general, a general searcher does not recognize that displaying the results in a classified manner leads to an increase in the efficiency of the search, and even if he / she recognizes it, he / she does not know how to operate the classified display. In many cases, there is no knowledge about what kind of classification items there are. Even with such a search device having a result classification function, there is a problem that the classification function is not effectively utilized.

【0009】本発明は、これらの問題を解決するため、
検索結果から抽出した項目の項目値の評価値を求めて適
切な分類軸を自動選定し、この選定した分類軸をもとに
検索結果の分類を行って検索者に提示し、検索効率を向
上させることを目的としている。
The present invention solves these problems.
The evaluation value of the item value extracted from the search result is obtained, and the appropriate classification axis is automatically selected. Based on this selected classification axis, the search results are classified and presented to the searcher to improve search efficiency. The purpose is to let.

【0010】[0010]

【課題を解決するための手段】図1は、本発明の原理ブ
ロック図を示す。図1において、検索結果1は、検索し
た結果である。
FIG. 1 shows a block diagram of the principle of the present invention. In FIG. 1, a search result 1 is a search result.

【0011】項目/項目値抽出手段3は、検索結果1か
ら項目31および項目値32を抽出するものである。分
類軸選定手段4は、抽出された項目31および項目値3
2をもとに分類軸を選定するものである。
The item / item value extraction means 3 extracts the item 31 and the item value 32 from the search result 1. The classification axis selection means 4 uses the extracted item 31 and item value 3
The classification axis is selected based on 2.

【0012】分類実行手段5は、選定された分類軸をも
とに検索結果1を分類して分類結果7を出力するもので
ある。ラベル付手段6は、分類結果7の項目値32を持
った文書からキーワードを抽出して当該分類結果7に付
加などするものである。
The classification executing means 5 classifies the search result 1 based on the selected classification axis and outputs the classification result 7. The labeling means 6 extracts a keyword from the document having the item value 32 of the classification result 7 and adds it to the classification result 7.

【0013】[0013]

【作用】本発明は、図1に示すように、項目/項目値抽
出手段3が検索結果1から項目31および項目値32を
抽出し、分類軸選定手段4が抽出された項目31および
項目値32から分類軸を選定し、分類実行手段5が選定
された分類軸をもとに検索結果1を分類するようにして
いる。
In the present invention, as shown in FIG. 1, the item / item value extracting means 3 extracts the item 31 and the item value 32 from the search result 1, and the classification axis selecting means 4 extracts the item 31 and the item value. A classification axis is selected from 32, and the classification execution means 5 classifies the search results 1 based on the selected classification axis.

【0014】この際、分類軸選定手段4が抽出した項目
31の項目値32の種類が2種類以上のうちの少ないも
のから所定数を分類軸と選定するようにしている。ま
た、分類実行手段5が選定された分類軸である項目値3
2に意味のある順序関係が存在するときに当該意味のあ
る順序関係で分類するようにしている。
At this time, a predetermined number is selected as the classification axis from the smallest of the two or more kinds of the item value 32 of the item 31 extracted by the classification axis selection means 4. Further, the item value 3 which is the classification axis selected by the classification executing means 5
When there is a meaningful order relationship in 2, the classification is performed according to the meaningful order relationship.

【0015】また、分類実行手段5が選定された分類軸
である項目値32に意味のある順序関係が存在しないと
きに当該項目値32の出現頻度で分類するようにしてい
る。また、ラベル付加手段6が分類された分類結果の項
目値32を持った文書からキーワードを抽出して当該分
類結果に付加するようにしている。
Further, when the item value 32 which is the selected classification axis does not have a meaningful order relation, the classification executing means 5 classifies the item value 32 by the appearance frequency of the item value 32. Further, the label adding means 6 extracts the keyword from the document having the classified result item value 32 and adds it to the classified result.

【0016】また、ラベル付加手段6が分類された分類
結果の項目値32を持った文書からキーワードを抽出し
て頻度順に並べて当該分類結果に付加するようにしてい
る。また、ラベル付加手段6が分類された分類結果の項
目値32を持った文書からキーワードを抽出して頻度順
に並べた後、以前の使用頻度の高いものを先頭に位置づ
けて当該分類結果に付加するようにしている。
Further, the label adding means 6 extracts the keywords from the document having the classified result item value 32, arranges them in order of frequency, and adds them to the classified result. In addition, after the keywords are extracted from the document having the item value 32 of the classified result by the label adding means 6 and arranged in the order of frequency, the one having the highest frequency of use is positioned at the head and added to the classified result. I am trying.

【0017】従って、検索結果1から抽出した項目31
の項目値32の評価値を求めて適切な分類軸を自動選定
し、この選定した分類軸をもとに検索結果1を分類した
り、更に分類軸の項目値32を持つ文書のキーワードを
付加したすることにより、自動的に選定した分類軸に従
って検索結果1を分類して表示したり、更にキーワード
を付加して表示したりし検索者に提示し、検索効率を向
上させることが可能となる。
Therefore, the item 31 extracted from the retrieval result 1
The evaluation value of the item value 32 of is determined and an appropriate classification axis is automatically selected, and the search result 1 is classified based on the selected classification axis, or the keyword of the document having the classification axis item value 32 is added. By doing so, it is possible to classify and display the search result 1 according to the automatically selected classification axis, display it by adding a keyword, and present it to the searcher to improve the search efficiency. .

【0018】[0018]

【実施例】次に、図2から図12を用いて本発明の実施
例の構成および動作を順次詳細に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, the construction and operation of an embodiment of the present invention will be described in detail with reference to FIGS.

【0019】図2は、本発明の動作説明フローチャート
を示す。これは、図1の構成における分類軸を自動選定
して分類結果7を出力するときの手順である。図2にお
いて、S1は、検索結果を受け取る。これは、例えばキ
ーワード“翻訳”によって図示外のデータベースを検索
した検索結果1として、図3を受け取る。検索結果1
は、図3に示すように、項目31の項目値32のリスト
である。
FIG. 2 shows a flowchart for explaining the operation of the present invention. This is a procedure for automatically selecting the classification axis in the configuration of FIG. 1 and outputting the classification result 7. In FIG. 2, S1 receives the search result. For example, FIG. 3 is received as the search result 1 obtained by searching a database (not shown) with the keyword “translation”. Search result 1
Is a list of item values 32 of items 31 as shown in FIG.

【0020】S2は、検索結果から項目と項目値を抽出
する。S3は、項目を1つ取り出す。これは、図3の検
索結果1から項目3を1つ、例えば項目“著者名”を取
り出す。
In step S2, items and item values are extracted from the search results. In S3, one item is taken out. This retrieves one item 3 from the search result 1 in FIG. 3, for example, the item “author name”.

【0021】S4は、項目に対応する項目値の種類を数
える。これは、S3で取り出した項目31の項目値32
の種類、例えば図3の項目31“著者”の項目値32の
種類“鈴木太郎”、“山田次郎”、・・・というように
その種類の総数を算出する。
In S4, the types of item values corresponding to the items are counted. This is the item value 32 of the item 31 extracted in S3.
, The type of item value 32 of the item 31 “author” in FIG. 3, for example, “Taro Suzuki”, “Jiro Yamada”, ...

【0022】S5は、最後の項目か判別する。YESの
場合には、全ての項目31の項目値32の数をそれぞれ
数えたので、S6に進む。一方、NOの場合には、次の
項目3について、S3、S4を繰り返し、項目値32の
種類を数える。
In step S5, it is determined whether the item is the last item. In the case of YES, since the number of item values 32 of all items 31 has been counted, the process proceeds to S6. On the other hand, in the case of NO, S3 and S4 are repeated for the next item 3, and the number of item values 32 is counted.

【0023】以上のS1からS5によって、検索結果1
の項目31毎の項目値32の種類をそれぞれ数え、例え
ば図4の右欄に示すように、項目値の種類数が求まった
こととなる。
Search result 1 is obtained by the above S1 to S5.
The number of types of item values 32 for each item 31 is counted, and the number of types of item values is obtained as shown in the right column of FIG. 4, for example.

【0024】S6は、項目を選ぶ。S7は、S6で選ば
れた項目を分類軸として分類を実行する。これらS6、
S7は、S4で数えた項目31毎の項目数32の数(図
4の項目値種類数)のうち、2以上で少ない種類の項目
から所定数の項目31を選び、この選んだ項目31を分
類軸として、検索結果1を分類する。例えば後述する図
4の項目値分類数の2以上で少ない種類の項目から3つ
の項目31として、 ・分類コード:2(項目値種類数) ・著者名:5 ・発行年:9 を選び、この選んだ3つの各分類軸(分類コード、著者
名、発行年)について、検索結果1の項目値の出現頻度
(評価値)の高い順に図5の分類結果7に示すように分
類する。ここで、2つ以上で少ない種類の項目から選ん
だ理由は、項目値32の多い項目が検索者にとって絞り
込みのために有効か否かを判断しにくく、また表示領域
をとることから外したものである。
At S6, an item is selected. In S7, the classification is performed with the item selected in S6 as the classification axis. These S6,
In S7, a predetermined number of items 31 are selected from the items of less than 2 in the number of items 32 (the number of item value types in FIG. 4) of each item 31 counted in S4, and the selected items 31 are selected. Search result 1 is classified as a classification axis. For example, as shown in FIG. 4 which will be described later, the number of item value classifications in FIG. 4 is two or more and the smallest number of items is three items 31. Classification code: 2 (number of item value types) Author name: 5 Publication year: 9 For each of the three selected classification axes (classification code, author name, publication year), the items are classified in descending order of appearance frequency (evaluation value) of the item value of the search result 1 as shown in the classification result 7 of FIG. Here, the reason why the item having two or more items and having a small number of items is selected is that it is difficult for the searcher to determine whether or not the item having a large item value 32 is effective for narrowing down, and the item is excluded from the display area. Is.

【0025】S8は、分類結果を出力装置に出力する。
以上によって、図3の検索結果1の項目31の項目値3
2の種類を数えると図4に示すように、項目31毎に項
目値種類数が得られ、この項目値32の種類が2以上で
少ない種類から所定数として、3つを選ぶと図5に示す
ように、項目31として、“分野コード”、“著者
名”、“発行年”が得られ、それらの各項目値32の出
現頻度順に並べて図示のように分類結果7を出力する。
これらにより、検索結果1から自動的に分類軸を選定
し、分類軸に従って分類した分類結果7を表示し、検索
者に自動提示でき、検索効率の向上を図るこことが可能
となる。
In step S8, the classification result is output to the output device.
As described above, the item value 3 of the item 31 of the search result 1 in FIG.
When the two types are counted, as shown in FIG. 4, the number of item value types is obtained for each item 31, and when the number of types of the item value 32 is 2 or more and a small number is selected as a predetermined number, 3 is selected. As shown, “field code”, “author name”, and “issue year” are obtained as the item 31, and the classification result 7 is output as shown in the drawing by arranging the item values 32 in the order of appearance frequency.
As a result, the classification axis is automatically selected from the search result 1, the classification result 7 classified according to the classification axis can be displayed, and can be automatically presented to the searcher, and the search efficiency can be improved.

【0026】図3は、本発明の検索結果例を示す。この
検索結果1は、キーワード“翻訳”をもとに図示外のデ
ータベースを検索して得た結果の一部を示す。ここで、
上段の ・著者名 ・題名 ・発行年 ・出典 ・分野コード ・本文 などが項目31である。これらの項目31の下にそれぞ
れ記載したものがそれぞれの項目値32である。例えば
項目31“著者名”の項目値32“鈴木太郎”、“山田
次郎”・・・である。
FIG. 3 shows an example of the search result of the present invention. The search result 1 shows a part of the result obtained by searching a database (not shown) based on the keyword "translation". here,
Item 31 is the author name, title, year of publication, source, field code, text, etc. in the upper row. The items described below these items 31 are the item values 32. For example, the item values 32 “Taro Suzuki”, “Jiro Yamada” of the item 31 “Author name” are ...

【0027】図4は、本発明の検索結果の項目ごとの整
列例を示す。これは、図3の検索結果1の項目31毎に
横方向にその項目値32を並べ、そのときの項目値32
の種類数(項目値種類数)を数えたものである(図2の
S4参照)。
FIG. 4 shows an example of sorting search results according to the present invention for each item. This means that the item values 32 are arranged in the horizontal direction for each item 31 of the search result 1 in FIG.
The number of types (number of item value types) is counted (see S4 in FIG. 2).

【0028】図5は、本発明の分類結果例を示す。これ
は、図4の整列例の項目値種類数が2以上で少ない種類
の項目を所定数、ここでは、3つ選んで各項目31の項
目値32と、項目値32の評価値、ここでは出現頻度を
集計したものである。即ち、図4の項目値種類数が2以
上で少ない、 ・項目値種類数2の項目31“分野コード” ・項目値種類数5の項目31“著者名” ・項目値種類数9の項目31“発行年” の順に選び(分類軸として選び)、各項目31の項目値
32の出現頻度を評価値として図示のように集計したも
のである。
FIG. 5 shows an example of the classification result of the present invention. This is because the number of item value types in the arrangement example of FIG. 4 is 2 or more and a small number of items are selected, here, three items are selected and the item value 32 of each item 31 and the evaluation value of the item value 32, here, It is a compilation of appearance frequencies. That is, the number of item value types in FIG. 4 is 2 or more, which is small.-Item 31 with item value type 2 "Field code" -Item 31 with item value type 5 "Author" -Item 31 with item value type 9 “Issuance year” is selected in order (selected as a classification axis), and the appearance frequency of the item value 32 of each item 31 is tabulated as an evaluation value as illustrated.

【0029】次に、図6のフローチャートに示す順序に
従い、図5の分類結果7をもとに、ラベル付けするとき
の構成および動作を、図7から図9を用いて詳細に説明
する。
Next, according to the order shown in the flow chart of FIG. 6, the structure and operation for labeling will be described in detail with reference to FIGS. 7 to 9 based on the classification result 7 of FIG.

【0030】図6において、S11は、分類結果の項目
値にコードがあるか判別する。これは、分類結果の項目
値31のコードがあるか、例えば図5の分類結果7中に
コード、ここでは分野コードがあるか判別する。YES
の場合には、S12以降のキーワードをラベルとして付
加する処理を行う。一方、NOの場合には、終了する。
In FIG. 6, S11 determines whether or not the item value of the classification result has a code. This determines whether there is a code of the item value 31 of the classification result, for example, there is a code in the classification result 7 of FIG. 5, here a field code. Yes
In this case, the processing of adding the keyword after S12 as a label is performed. On the other hand, in the case of NO, the process ends.

【0031】S12は、検索結果から当該項目値を持っ
た文書の本文を取り出す。これは、例えば対応する項目
値32を持った図3の検索結果1の文書の本文を取り出
す。S13は、S12で取り出した本文からキーワード
抽出する。例えば出現頻度の高い文字列をキーワードと
して抽出する。
In step S12, the body of the document having the item value is extracted from the search result. This retrieves, for example, the body of the document of search result 1 in FIG. 3 having the corresponding item value 32. In step S13, keywords are extracted from the text extracted in step S12. For example, a character string having a high appearance frequency is extracted as a keyword.

【0032】S14は、キーワードをラベルとして分類
結果7に付加する。これは、例えば図7に示すように、
項目値32に対するラベルとして、図示の本文中から抽
出したキーワード“プロセッサ”などを付加する。
In step S14, the keyword is added as a label to the classification result 7. For example, as shown in FIG.
As a label for the item value 32, the keyword "processor" or the like extracted from the illustrated text is added.

【0033】S15は、ラベル付の分類結果を出力す
る。これは、例えば図5の分類結果7に図7のラベルを
付加して出力する。以上によって、既述した図5の分類
結果7の項目値32にコード(例えば分野コード)があ
ったときに当該コードの項目値32を持った文書の本文
からキーワード(例えば出現頻度の高い文字列)を抽出
して当該分類結果7にラベルとして付加し、出力する。
これにより、検索者に図5の分類結果7の表示と、本文
中から抽出したキーワードとを項目値3に対応づけて一
緒に表示でき、検索効率の向上を図ることができる。
In step S15, the classification result with the label is output. For example, the label of FIG. 7 is added to the classification result 7 of FIG. 5 and output. As described above, when the item value 32 of the classification result 7 of FIG. 5 described above has a code (for example, a field code), a keyword (for example, a character string having a high appearance frequency) is extracted from the text of the document having the item value 32 of the code. ) Is extracted, added to the classification result 7 as a label, and output.
This allows the searcher to display the classification result 7 in FIG. 5 and the keyword extracted from the text in association with the item value 3 and improve the search efficiency.

【0034】図7は、本発明の項目値に対するラベル付
け例を示す。これは、分類軸の項目値のコードに対応づ
けて、本文中から抽出したキーワードをラベルとして抽
出したものである。ここでは、出現頻度の高い順に3つ
をそれぞれ選んだものである。
FIG. 7 shows an example of labeling item values according to the present invention. This is a keyword extracted from the text as a label in association with the code of the item value on the classification axis. Here, three are selected in descending order of appearance frequency.

【0035】図8は、本発明の項目/項目値の学習デー
タを示す。これは、データベース毎にファイルに格納す
るものであって、分類軸に対応づけてその使用頻度を保
存したものである。ここで、分類軸“著者名”が25回
使用され、分類軸“分野コード”が18回使用されてい
る。
FIG. 8 shows item / item value learning data of the present invention. This is stored in a file for each database, and the usage frequency is stored in association with the classification axis. Here, the classification axis "author name" is used 25 times, and the classification axis "field code" is used 18 times.

【0036】図9は、本発明の分類結果例を示す。これ
は、図5の分類結果7(項目値種類数が2以上で少ない
順に項目を選んだ検索結果7)に、図8の学習データを
反映させたものである。即ち、図7のデータベース毎に
保持する学習データによれば、著者名の使用頻度が25
で分野コードの使用頻度18回よりも多いので、図5の
検索結果7の分野コードと著者名の順番を入れ替えたも
のである。
FIG. 9 shows an example of the classification result of the present invention. This reflects the learning data of FIG. 8 on the classification result 7 of FIG. 5 (the search result 7 in which the number of item value types is 2 or more and the items are selected in ascending order). That is, according to the learning data held for each database in FIG. 7, the usage frequency of the author name is 25
Since the field code is used more frequently than 18 times, the field code and the author name in the search result 7 in FIG. 5 are replaced with each other.

【0037】次に、図10のフローチャートに示す順序
に従い、図5の分類結果7に、図11の学習キーワード
をもとに図12に示すように高使用頻度のキーワードを
ラベル付けするときの構成および動作を詳細に説明す
る。
Next, according to the order shown in the flow chart of FIG. 10, the classification result 7 shown in FIG. 5 is labeled with high-use keywords as shown in FIG. 12 based on the learning keywords shown in FIG. The operation will be described in detail.

【0038】図10において、S21は、分類結果の項
目値にコードがあるか判別する。これは、分類結果の項
目値31にコードがあるか、例えば図5の分類結果7中
にコード、ここでは分野コードがあるか判別する。YE
Sの場合には、S22以降のキーワードをラベルとして
付加する処理を行う。一方、NOの場合には、終了す
る。
In FIG. 10, a step S21 decides whether or not there is a code in the item value of the classification result. This determines whether or not there is a code in the item value 31 of the classification result, for example, there is a code in the classification result 7 in FIG. 5, here a field code. YE
In the case of S, the process of adding the keyword after S22 as a label is performed. On the other hand, in the case of NO, the process ends.

【0039】S22は、検索結果から当該項目値を持っ
た文書の本文を取り出す。これは、例えば対応する項目
値32を持った図3の検索結果1の文書の本文を取り出
す。S23は、S22で取り出した本文からキーワード
抽出する。例えば出現頻度の高い文字列をキーワードと
して抽出する。
In step S22, the body of the document having the item value is extracted from the search result. This retrieves, for example, the body of the document of search result 1 in FIG. 3 having the corresponding item value 32. In step S23, keywords are extracted from the text extracted in step S22. For example, a character string having a high appearance frequency is extracted as a keyword.

【0040】S24は、本文中のキーワードのなかに学
習キーワードがあったら、これを順番の最初に持ってく
る。例えばデータベース毎に設けた図11の学習キーワ
ードに頻度が10以上のキーワード(通信、データベー
ス)を取り出し、S23で抽出したキーワードリスト中
に当該学習キーワードがあった場合、分類軸の項目を最
初に持ってくる。例えば図5の検索結果7について、該
当するデータベースに図11に示すように学習キーワー
ドが登録されており、かつキーワードリストの中に評価
値が低くても、当該学習キーワードについて、図12に
示すように、ラベルの最初に持ってくる(例えば学習キ
ーワードから取り出した“通信”、“データベー
ス”をそれぞれ図12の、に示すように、最初に付
加する。
In S24, if there is a learning keyword among the keywords in the text, this is brought to the beginning of the order. For example, if the learning keywords shown in FIG. 11 provided for each database have a frequency of 10 or more (communication, database), and the learning keyword is found in the keyword list extracted in S23, the category axis item is given first. Come on. For example, regarding the search result 7 of FIG. 5, even if the learning keyword is registered in the corresponding database as shown in FIG. 11 and the evaluation value is low in the keyword list, the learning keyword is as shown in FIG. To the beginning of the label (for example, “communication” and “database” extracted from the learning keyword are added to the beginning as shown in FIG.

【0041】図11は、本発明の学習キーワード例を示
す。この学習キーワードは、データベース毎に設け、本
文中から抽出したキーワードの出現頻度順に並べた後
(図5参照)、図11の学習キーワードで頻度が10以
上のもので、かつ図12のキーワードの出現頻度が低く
ても存在した場合には、最初に学習キーワードを付加す
る。学習キーワードは、使用する毎に頻度を+1する。
FIG. 11 shows an example of learning keywords of the present invention. The learning keywords are provided for each database and arranged in the order of appearance frequency of the keywords extracted from the text (see FIG. 5). Then, the learning keywords of FIG. 11 having a frequency of 10 or more and the appearance of the keywords of FIG. If it exists even if the frequency is low, the learning keyword is added first. Each time the learning keyword is used, the frequency is incremented by one.

【0042】図12は、本発明の高頻度キーワードを反
映させたラベル付け例を示す。これは、図11の学習キ
ーワードの頻度が例えば10以上の項目値32を取り出
し、図12にラベルの先頭に付加したものである。
FIG. 12 shows an example of labeling reflecting the high-frequency keywords of the present invention. In this case, the item value 32 in which the frequency of the learning keyword in FIG. 11 is, for example, 10 or more is taken out and added to the head of the label in FIG.

【0043】[0043]

【発明の効果】以上説明したように、本発明によれば、
検索結果1から抽出した項目31の項目値32の評価値
を求めて適切な分類軸を自動選定し、この選定した分類
軸をもとに検索結果1の分類したり、更に分類軸の項目
値32を持つ文書のキーワードを付加したりする構成を
採用しているため、自動的に選定した分類軸に従って検
索結果を分類して表示したり、更にキーワードを付加し
て表示したりし、検索者に提示し、検索効率を向上させ
ることが可能となる。
As described above, according to the present invention,
The evaluation value of the item value 32 of the item 31 extracted from the search result 1 is obtained, and an appropriate classification axis is automatically selected, and the search result 1 is classified based on the selected classification axis, or the item value of the classification axis is further selected. Since the structure of adding the keyword of the document having 32 is adopted, the search result is classified according to the automatically selected classification axis and displayed, or further added with the keyword and displayed. To improve the search efficiency.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理ブロック図である。FIG. 1 is a principle block diagram of the present invention.

【図2】本発明の動作説明フローチャートである。FIG. 2 is a flowchart explaining the operation of the present invention.

【図3】本発明の検索結果例である。FIG. 3 is an example of a search result of the present invention.

【図4】本発明の検索結果の項目ごとの整列例である。FIG. 4 is an example of sorting search results according to items of the present invention.

【図5】本発明の分類結果例である。FIG. 5 is an example of a classification result of the present invention.

【図6】本発明のラベル付フローチャート(その1)で
ある。
FIG. 6 is a labeled flowchart (No. 1) of the present invention.

【図7】本発明の項目値に対するラベル付例である。FIG. 7 is an example of labeling of item values according to the present invention.

【図8】本発明の項目/項目値の学習データである。FIG. 8 is learning data of items / item values of the present invention.

【図9】本発明の分類結果例である。FIG. 9 is an example of a classification result of the present invention.

【図10】本発明のラベル付フローチャート(その2)
である。
FIG. 10 is a flowchart with a label according to the present invention (Part 2).
Is.

【図11】本発明の学習キーワード例である。FIG. 11 is an example of a learning keyword of the present invention.

【図12】本発明の高頻度キーワードを反映させたラベ
ル付け例である。
FIG. 12 is an example of labeling in which high-frequency keywords of the present invention are reflected.

【符号の説明】[Explanation of symbols]

1:検索結果 2:検索結果分類装置 3:項目/項目値抽出手段 31:項目 32:項目値 4:分類軸選定手段 5:分類実行手段 6:ラベル付手段 7:分類結果 1: Search result 2: Search result classification device 3: Item / item value extraction means 31: Item 32: Item value 4: Classification axis selection means 5: Classification execution means 6: Labeling means 7: Classification result

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】検索結果の分類を行う検索結果分類装置に
おいて、 検索結果(1)から項目(31)および項目値(32)
を抽出する項目/項目値抽出手段(3)と、 これら抽出された項目(31)および項目値(32)か
ら分類軸を選定する分類軸選定手段(4)と、 この選定された分類軸をもとに上記検索結果(1)を分
類する分類実行手段(5)とを備えたことを特徴とする
検索結果分類装置。
1. A search result classification device for classifying search results, wherein items (31) and item values (32) from search result (1).
An item / item value extraction means (3) for extracting a classification axis, a classification axis selection means (4) for selecting a classification axis from the extracted item (31) and item value (32), and the selected classification axis. A search result classification device, characterized by further comprising a classification execution means (5) for classifying the search results (1).
【請求項2】上記分類軸選定手段(4)が上記抽出した
項目(31)の項目値(32)の種類が2種類以上のう
ちの少ないものから所定数を分類軸と選定することを特
徴とする請求項1に記載の検索結果分類装置。
2. The classification axis selecting means (4) selects a predetermined number as a classification axis from the smallest of two or more kinds of the item value (32) of the extracted item (31). The search result classification device according to claim 1.
【請求項3】上記分類実行手段(5)が上記選定された
分類軸である項目値(32)に意味のある順序関係が存
在するときに当該意味のある順序関係で分類することを
特徴とする請求項1または請求項2に記載の検索結果分
類装置。
3. The classification executing means (5), when there is a meaningful order relationship in the item value (32) which is the selected classification axis, performs classification according to the meaningful order relationship. The search result classification device according to claim 1 or 2.
【請求項4】上記分類実行手段(5)が上記選定された
分類軸である項目値(32)に意味のある順序関係が存
在しないときに当該項目値(32)の出現頻度で分類す
ることを特徴とする請求項1または請求項2に記載の検
索結果分類装置。
4. The classification executing means (5) classifies the item value (32) according to the frequency of appearance when the item value (32) which is the selected classification axis does not have a meaningful order relationship. The search result classification device according to claim 1 or 2, characterized in that.
【請求項5】上記分類された分類結果(7)の項目値
(32)を持った文書からキーワードを抽出して当該分
類結果(7)に付加するラベル付加手段(6)を備えた
ことを特徴とする請求項1から請求項4に記載の検索結
果分類装置。
5. A label adding means (6) for extracting a keyword from a document having an item value (32) of the classified result (7) and adding it to the classified result (7) is provided. The search result classification device according to any one of claims 1 to 4, which is characterized.
【請求項6】上記分類された分類結果(7)の項目値
(32)を持った文書からキーワードを抽出して頻度順
に並べて当該分類結果(7)に付加するラベル付加手段
(6)を備えたことを特徴とする請求項1から請求項4
に記載の検索結果分類装置。
6. A label adding means (6) for extracting keywords from a document having an item value (32) of the classified result (7), arranging them in order of frequency and adding them to the classified result (7). Claims 1 to 4 characterized in that
Search result classification device described in.
【請求項7】上記分類された分類結果(7)の項目値
(32)を持った文書からキーワードを抽出して頻度順
に並べた後、以前の使用頻度の高いものを先頭に位置づ
けて当該分類結果(7)に付加するラベル付加手段
(6)を備えたことを特徴とする請求項1から請求項4
に記載の検索結果分類装置。
7. After extracting keywords from a document having an item value (32) of the classified result (7) and arranging them in order of frequency, the previously used one having a high frequency of use is positioned at the head and the classification is performed. 5. A label adding means (6) for adding to the result (7), comprising: a label adding means (6).
Search result classification device described in.
JP6048455A 1994-03-18 1994-03-18 Retrieval result sorter Pending JPH07262199A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6048455A JPH07262199A (en) 1994-03-18 1994-03-18 Retrieval result sorter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6048455A JPH07262199A (en) 1994-03-18 1994-03-18 Retrieval result sorter

Publications (1)

Publication Number Publication Date
JPH07262199A true JPH07262199A (en) 1995-10-13

Family

ID=12803836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6048455A Pending JPH07262199A (en) 1994-03-18 1994-03-18 Retrieval result sorter

Country Status (1)

Country Link
JP (1) JPH07262199A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09319752A (en) * 1996-05-29 1997-12-12 Nec Corp Retrieval supporting device
JP2002049621A (en) * 2000-05-16 2002-02-15 At & T Wireless Services Inc Information retrieval using radio data device, management method and device
JP2002108881A (en) * 2000-10-02 2002-04-12 Hitachi Tool Engineering Ltd Electronic catalog system
JP2020155001A (en) * 2019-03-22 2020-09-24 三菱電機インフォメーションネットワーク株式会社 Data visualization system and data visualization program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01189721A (en) * 1988-01-25 1989-07-28 Nec Corp Electronic document retriever
JPH0524551B2 (en) * 1986-12-22 1993-04-08 Nippon Electric Co
JPH0612553B2 (en) * 1988-01-25 1994-02-16 日本電気株式会社 Electronic document retrieval device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0524551B2 (en) * 1986-12-22 1993-04-08 Nippon Electric Co
JPH01189721A (en) * 1988-01-25 1989-07-28 Nec Corp Electronic document retriever
JPH0612553B2 (en) * 1988-01-25 1994-02-16 日本電気株式会社 Electronic document retrieval device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09319752A (en) * 1996-05-29 1997-12-12 Nec Corp Retrieval supporting device
JP2002049621A (en) * 2000-05-16 2002-02-15 At & T Wireless Services Inc Information retrieval using radio data device, management method and device
JP2002108881A (en) * 2000-10-02 2002-04-12 Hitachi Tool Engineering Ltd Electronic catalog system
JP2020155001A (en) * 2019-03-22 2020-09-24 三菱電機インフォメーションネットワーク株式会社 Data visualization system and data visualization program

Similar Documents

Publication Publication Date Title
US6243713B1 (en) Multimedia document retrieval by application of multimedia queries to a unified index of multimedia data for a plurality of multimedia data types
US7096218B2 (en) Search refinement graphical user interface
Ahonen et al. Applying data mining techniques for descriptive phrase extraction in digital document collections
US7257530B2 (en) Method and system of knowledge based search engine using text mining
US8321455B2 (en) Method for clustering automation and classification techniques
US20030101182A1 (en) Method and system for smart search engine and other applications
US20050060290A1 (en) Automatic query routing and rank configuration for search queries in an information retrieval system
US20030004932A1 (en) Method and system for knowledge repository exploration and visualization
KR20120073229A (en) Trusted query system and method
US20180004838A1 (en) System and method for language sensitive contextual searching
US7024405B2 (en) Method and apparatus for improved internet searching
JPH0628409A (en) Method and system for retrieval of molecule
US20190213277A1 (en) Cognitive retrieve and rank search improvements using natural language for product attributes
US20050114317A1 (en) Ordering of web search results
JP2010262577A (en) System, method and program for creation of extraction rule
Manaf et al. Comparison of carp rabin algorithm and Jaro-Winkler distance to determine the equality of Sunda languages
JPH07262199A (en) Retrieval result sorter
JP2732661B2 (en) Text type database device
JP2004192368A (en) Method and device for extracting relevant class
JP3678615B2 (en) Document search apparatus and document search method
JPH03294964A (en) Document retrieving method
JPH08305726A (en) Information retrieving device
JP3264252B2 (en) Document processing apparatus, processing method, and recording medium recording control program
JPH07104869B2 (en) Data retrieval processing system
JPH05314181A (en) Information retrieving device

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030527