JP2000172698A - System and method for retrieving document and computer-readable recording medium with program for executing the method recorded therein - Google Patents

System and method for retrieving document and computer-readable recording medium with program for executing the method recorded therein

Info

Publication number
JP2000172698A
JP2000172698A JP10344973A JP34497398A JP2000172698A JP 2000172698 A JP2000172698 A JP 2000172698A JP 10344973 A JP10344973 A JP 10344973A JP 34497398 A JP34497398 A JP 34497398A JP 2000172698 A JP2000172698 A JP 2000172698A
Authority
JP
Japan
Prior art keywords
search
document
collation
unit
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10344973A
Other languages
Japanese (ja)
Other versions
JP3578651B2 (en
Inventor
Masayuki Kameda
雅之 亀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP34497398A priority Critical patent/JP3578651B2/en
Publication of JP2000172698A publication Critical patent/JP2000172698A/en
Application granted granted Critical
Publication of JP3578651B2 publication Critical patent/JP3578651B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To constitute an information retrieval system with minimum labor by easily selecting a document intended by a user from the retrieved result and utilizing the document for data base retrieval, when a document data base is retrieved by a keyword retrieval conditional expression. SOLUTION: Retrieval conditions are inputted (10), and a document data base (20) storing plural documents is retrieved (30) by the retrieval conditions. The degree of collation is found (40) for each retrieval key to each retrieved document, and based on this collation degree, the list of an expression (52) enabling comprehension of the condition of collation with the retrieval key and the retrieved document is displayed (50) while relating them.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文書検索システム
における文書検索結果の一覧表示に関する。
[0001] 1. Field of the Invention [0002] The present invention relates to displaying a list of document search results in a document search system.

【0002】[0002]

【従来の技術】文書の電子化やインターネットの普及に
より、文書検索システムのニーズが高まってきている。
文書検索システムでは、通常、検索語や検索文字列(以
下「検索キー」と呼ぶ)を並べたり、AND/OR論理演算子
で組み合わせた検索条件をユーザーが指定して、その検
索条件に合致する文書を検索し、検索結果として検索さ
れた文書を一覧表示で提示し、また、必要に応じてユー
ザーが指定した文書を参照表示等することができる。ま
た、検索条件に、自然言語文や文書の一部あるいは全体
を指定できる文書検索システムもある。文書の一覧は、
通常、文書のタイトルに相当する部分が名称情報として
表示されるが、近年では、併せて、その文書の冒頭部
分、重要キーワード、要約文等の効果的な縮約情報を表
示することで、ユーザーが文書を直接に参照する前に、
その文書がユーザーの求めている文書かどうかを判断す
ることを助ける機能が用意されるようになっている。
2. Description of the Related Art With the digitization of documents and the spread of the Internet, the need for document retrieval systems has increased.
In a document search system, usually, a user specifies search terms or search character strings (hereinafter referred to as "search keys") or specifies search conditions combined by an AND / OR logical operator and matches the search conditions. It is possible to search for a document, present the searched document as a search result in a list display, and, if necessary, display and display the document specified by the user. There is also a document search system that can specify a natural language sentence or part or all of a document as a search condition. The list of documents is
Usually, the part corresponding to the title of the document is displayed as name information. In recent years, however, by displaying effective contraction information such as the beginning of the document, important keywords, and a summary sentence, the Before they directly reference the document,
A function has been provided to help determine whether the document is the one the user wants.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、上述の
ような従来の手法では以下のような問題がある。提示さ
れるタイトル、冒頭部分、重要キーワード、要約文は、
ユーザーの検索条件を指向したものではない。そこで、
ユーザーの検索条件を反映した情報として、ユーザーの
検索条件とどの程度照合しているかを点数(スコア)付け
して、その順に文書一覧を並べたり、さらにそのスコア
を付与して、ユーザーの検索条件に応じた情報を付加す
ることも行われるようになってきた。
However, the above-mentioned conventional method has the following problems. Suggested titles, beginnings, key keywords, and summaries
It is not oriented to user search criteria. Therefore,
As information reflecting the user's search conditions, a score (score) is attached to the degree of matching with the user's search conditions, and a list of documents is arranged in that order, and the score is added, and the user's search conditions are added. In addition, information corresponding to the information is added.

【0004】しかし、検索キーが一つだけの場合なら、
スコアでも十分であるが、実際には、複数の検索キーが
ある場合に、検索条件には表現しきれないユーザーの検
索キーの重きの置き方等がスコアに反映されていないの
で、適切な判定の参考にはなりにくい面があった。又、
検索条件式の中の検索キーが各文書に対してどの程度の
重要なキーとなっているかどうかが判然としないため、
目視による文書の選定を行うことができなかった。
However, if there is only one search key,
A score is sufficient, but in reality, when there are multiple search keys, the score does not reflect how the search keys are weighted by the user that cannot be expressed in the search conditions. There was a face that was not helpful. or,
Because it is not clear how important the search key in the search expression is for each document,
Documents could not be selected visually.

【0005】これを解決するために、特開平10−49
543号公報における技術では、ユーザーの検索意図を
表す言語特徴を分類し、その分類の特徴を表すキーワー
ド(入力特徴)を選定してから文書群を分類する。分類
わけした後、分類毎に評価点を計算し、評価点の高い順
に文書とその分類毎の評価点とを表示するようにして、
その分類と評価点を確認することで検索意図に近い文書
を効率良く絞り込むことを支援している。しかしなが
ら、文書検索するためにこのような言語特徴を分類する
という新たな困難な作業を行わなければならないし、シ
ステムとしてもシソーラスや概念辞書、共起辞書を必要
とすることになり、システムも大きくなるという問題点
がでてくる。
In order to solve this problem, Japanese Patent Application Laid-Open No. 10-49 discloses
According to the technique disclosed in Japanese Patent No. 543, a linguistic feature indicating a user's search intention is classified, and a keyword (input feature) indicating a characteristic of the classification is selected, and then the document group is classified. After classifying, the score is calculated for each class, and the documents and the score for each class are displayed in descending order of the score,
By confirming the classification and evaluation points, it helps to efficiently narrow down documents that are close to the intended search. However, a new and difficult task of classifying such linguistic features must be performed in order to search for documents, and the system requires a thesaurus, a concept dictionary, and a co-occurrence dictionary. The problem that comes out.

【0006】このような問題点を解決するために、本発
明では、一般に使われているキーワード検索条件式によ
ってユーザーの意図する文書を検索する文書検索システ
ムにおいて、「検索された文書が選定されるために、ユ
ーザーの指定した検索条件の中のどの検索キーがどの程
度貢献しているかを照合度で提示する」ことによってユ
ーザーの検索意図がどの程度反映された文書であるかを
自分で確かめられるような文書検索システムを最小限の
労力にて構成できるようにすることを目的とする。
In order to solve such a problem, according to the present invention, in a document search system for searching for a document intended by a user according to a generally used keyword search condition expression, “the searched document is selected. Therefore, it is possible to confirm for yourself how much a document reflects the user's search intention by presenting which search key in the search condition specified by the user and how much contributed to it by matching degree " It is an object of the present invention to enable such a document search system to be configured with minimum effort.

【0007】[0007]

【課題を解決するための手段】請求項1の文書検索シス
テムは、検索条件を入力して文書データベースを検索
し、検索結果を一覧表示する文書検索システムにおい
て、検索条件を入力する検索条件入力部と、複数の文書
が格納されている文書データベースと、前記検索条件入
力部で入力した検索条件で前記文書データベースを検索
する検索部と、前記検索部で検索された各文書に対して
検索条件中の検索語あるいは検索文字列(以下「検索キ
ー」と呼ぶ)毎に照合度を求める照合度評価部と、前記
検索部で検索された文書を一覧表示する検索結果表示部
とを備え、前記検索結果表示部に前記照合度評価部で得
た照合度をもとに検索キーとの照合状況が分かるように
表現する照合状況表現部を付加して前記検索部で検索さ
れた文書と該照合状況表現部で得た表現とを関連付けて
一覧表示するようにした。
According to a first aspect of the present invention, there is provided a document search system for searching a document database by inputting search conditions and displaying a list of search results. A document database in which a plurality of documents are stored, a search unit for searching the document database with the search condition input in the search condition input unit, and a search condition for each document searched by the search unit. A collation degree evaluator for obtaining a collation degree for each search word or search character string (hereinafter referred to as a “search key”); and a search result display section for displaying a list of documents searched by the search section. A document retrieved by the retrieval unit and a collation status are added to the result display unit by adding a collation status expression unit that expresses the collation status with the search key based on the collation obtained in the collation evaluation unit. It was to display a list in association with the expression obtained in the current part.

【0008】請求項2の文書検索システムは、検索条件
を入力して文書データベースを検索し、検索結果を一覧
表示する文書検索システムにおいて、検索条件を入力す
る検索条件入力部と、前記検索条件入力部で入力した検
索条件を送って、その検索条件で複数の文書が格納され
ている文書データベースを検索した結果を受信する検索
インタフェース部と、前記検索インタフェース部で受信
した検索結果の各文書に対して検索条件中の検索語ある
いは検索文字列(以下「検索キー」と呼ぶ)毎に照合度
を求める照合度評価部と、前記検索インタフェース部で
受信した検索結果の文書を一覧表示する検索結果表示部
とを備え、前記検索結果表示部に前記照合度評価部で得
た照合度をもとに検索キーとの照合状況が分かるように
表現する照合状況表現部を付加して前記検索インタフェ
ース部で受信した検索結果の文書と該照合状況表現部で
得た表現とを関連付けて一覧表示するようにした。
According to a second aspect of the present invention, there is provided a document search system for searching a document database by inputting a search condition and displaying a list of search results. A search interface unit that sends a search condition input by the search unit and receives a search result of a document database storing a plurality of documents with the search condition, and a search interface unit that receives the search result received by the search interface unit. And a search result evaluator for obtaining a match degree for each search word or search character string (hereinafter referred to as a “search key”) in the search condition, and a list of documents of the search results received by the search interface unit And a matching status that the search result display unit expresses so that the matching status with the search key can be understood based on the matching score obtained by the matching score evaluation unit. And to display a list in association with expression and obtained written and collating status representation of the search result received in the search interface unit adds the current section.

【0009】請求項3の文書検索システムは、請求項1
又は請求項2の文書検索システムにおいて、前記照合状
況表現部は、照合度の評価値の順序で検索キーを並べる
ようにした。
[0009] The document search system according to claim 3 is based on claim 1.
Alternatively, in the document retrieval system according to claim 2, the collation status expressing section arranges the retrieval keys in the order of the collation degree evaluation value.

【0010】請求項4の文書検索システムは、請求項1
又は請求項2の文書検索システムにおいて、前記照合状
況表現部は、検索条件式の構成が分かるような図形とし
た。
[0010] According to a fourth aspect of the present invention, there is provided a document search system.
Alternatively, in the document search system according to claim 2, the collation status expression unit is a figure that allows the configuration of a search condition expression to be understood.

【0011】請求項5の文書検索システムは、請求項1
又は請求項2又は請求項4の文書検索システムにおい
て、前記照合状況表現部は、検索キー毎に照合度の評価
値を図形の装飾によって照合度の評価値の違いが分かる
ようにした。
According to a fifth aspect of the present invention, there is provided the document search system according to the first aspect.
Alternatively, in the document search system according to claim 2 or 4, the collation status expressing section is configured to recognize the difference in the collation evaluation value by the decoration of the figure for the collation degree for each search key.

【0012】請求項6の文書検索システムは、請求項1
又は請求項2又は請求項4の文書検索システムにおい
て、前記照合状況表現部は、検索キー毎に照合度の評価
値を図形の形状によって照合度の評価値の違いが分かる
ようにした。
According to a sixth aspect of the present invention, there is provided the document search system according to the first aspect.
Alternatively, in the document retrieval system according to claim 2 or 4, the collation status expressing section is configured to recognize the evaluation value of the collation degree for each search key so that the difference in the evaluation value of the collation degree can be recognized depending on the shape of the graphic.

【0013】請求項7の文書検索方法は、検索条件によ
って文書データベースを検索し、検索結果を一覧表示す
る文書検索方法において、検索条件を入力し、複数の文
書が格納されている文書データベースを前記検索条件に
よって検索し、この検索された各文書に対して検索キー
毎に照合度を求め、この照合度をもとに検索キーとの照
合状況が分かるような表現と検索された文書とを関連付
けて一覧表示する。
According to a seventh aspect of the present invention, there is provided a document search method for searching a document database according to a search condition and displaying a list of search results, wherein the search condition is input and the document database storing a plurality of documents is stored in the document database. A search is performed according to the search condition, a matching degree is obtained for each searched key for each of the searched documents, and an expression that allows the user to know the matching state with the search key is associated with the searched document based on the matching degree. To display a list.

【0014】請求項8のプログラムを記録したコンピュ
ータ読み取り可能な記録媒体は、検索条件を入力し、複
数の文書が格納されている文書データベースを前記検索
条件によって検索し、この検索された各文書に対して検
索キー毎に照合度を求め、この照合度をもとに検索キー
との照合状況が分かるような表現と検索された文書とを
関連付けて一覧表示するプログラムを記録した。
The computer-readable recording medium storing the program according to the present invention inputs a search condition, searches a document database storing a plurality of documents according to the search condition, and stores a search result in each of the searched documents. On the other hand, a program for obtaining a degree of collation for each search key and recording a list in which an expression that allows the user to know the state of collation with the search key based on the degree of collation is associated with the retrieved document is displayed.

【0015】[0015]

【発明の実施の形態】以下、3つの実施例を用いて、本
発明の構成および動作原理について説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The construction and operation principle of the present invention will be described below using three embodiments.

【0016】1.実施例1(単独型) 本発明の第1の実施例について図1〜図14を用いて説
明する。 (1)全体構成 図1に本実施例の文書検索システム(以下、本システム
という)の全体構成を示す。1は入力手段、2は表示手
段、3はCPU、4はメモリ、5は記憶手段である。入
力手段1はキーボード、マウス、タッチパネル等により
構成され、本システムへの情報の入力に使用される。表
示手段2は、本システムからの出力情報や入力手段1か
らの入力された情報などを表示させるものである。CP
U3は、本システムの各部(後述する検索条件入力部、
検索部、照合度評価部、検索結果表示部、照合状況表現
部等)のプログラムを動作させる。メモリ4には、本シ
ステムの各部がCPU3によって実行されるときに一時
的に作成される情報や各部のプログラム等が保持され
る。記憶手段5は、文書群を保持する文書データベース
や本システムの各部のプログラム等を保持している。
1. Embodiment 1 (Single Type) A first embodiment of the present invention will be described with reference to FIGS. (1) Overall Configuration FIG. 1 shows the overall configuration of a document search system (hereinafter, referred to as the present system) of the present embodiment. 1 is input means, 2 is display means, 3 is CPU, 4 is memory, and 5 is storage means. The input unit 1 includes a keyboard, a mouse, a touch panel, and the like, and is used for inputting information to the present system. The display means 2 displays output information from the present system, information input from the input means 1, and the like. CP
U3 is a part of the system (a search condition input part described later,
A program of a search unit, a collation evaluation unit, a search result display unit, a collation status expression unit, etc.) is operated. The memory 4 holds information temporarily created when each unit of the system is executed by the CPU 3, programs of each unit, and the like. The storage unit 5 holds a document database that holds a group of documents, a program of each unit of the present system, and the like.

【0017】図2は、本システムの機能構成を示す図で
ある。検索条件入力部10は、入力部1から入力される
検索のための検索条件式を入力させ、それを検索部20
へ送る。文書データベース20は、複数の文書を登録管
理するデータベースであり、記憶手段5に保持され、例
えばリレーショナルデータベース管理システムのような
既存のものを使って管理する。このデータベースの管理
する情報としては、1つの文書について少なくともタイ
トルと文書内容の情報を持っている。検索部30は、検
索条件入力部10から与えられた検索条件式を使って文
書データベース20を検索して検索結果を照合度評価部
へ送る。照合度評価部40は、検索結果の各文書に対し
て検索条件式にある検索キー毎の照合度を評価する。検
索結果表示部50は、検索された文書とその照合度とを
受けて表示手段2へ一覧表示する。このとき検索結果表
示部50の照合状況表現部52は、ユーザーの指示又は
システムで予め決めた表現方法により検索キーの照合度
を出力可能な形に変換する。
FIG. 2 is a diagram showing a functional configuration of the present system. The search condition input unit 10 allows a search condition expression for a search input from the input unit 1 to be input, and inputs the search condition expression to the search unit 20.
Send to The document database 20 is a database for registering and managing a plurality of documents, and is held in the storage unit 5 and managed using an existing database such as a relational database management system. The information managed by this database includes at least information of a title and document contents for one document. The search unit 30 searches the document database 20 using the search condition formula given from the search condition input unit 10 and sends the search result to the matching degree evaluation unit. The matching degree evaluation unit 40 evaluates the matching degree of each document in the search result for each search key in the search condition expression. The search result display unit 50 receives the searched documents and their matching degrees and displays them in a list on the display unit 2. At this time, the matching status expressing unit 52 of the search result display unit 50 converts the matching degree of the search key into a form that can be output according to a user's instruction or an expression method predetermined by the system.

【0018】(2)処理の流れ 以下に、本システムの処理の流れを図3のフローチャー
トを使って説明する。
(2) Processing Flow The processing flow of the present system will be described below with reference to the flowchart of FIG.

【0019】ステップS100:ユーザーは、必要とす
る文書に対する検索語等(検索キー)を単位にした論理
式で表現した検索条件式を入力手段1(例えば、キーボ
ード等)から入力する。例えば、検索キー「兵器」を持
ち且つ、検索キー「輸出規制」又は「輸出緩和」のいず
れかをもつ文書を文書データベース20から検索するた
めの検索条件式は次のような形式をとる。 兵器 & (輸出規制 | 輸出緩和) ここで、&は論理積(AND演算子)、|は論理和(O
R演算子)、( )は優先範囲を示す。この他に、最も
単純な場合は、単一の検索キーだけであったり、また、
演算子を用いずに複数の検索キーを並べて、「すべて含
む」とか「いずれかを含む」という意味で記述すること
もできる。さらに、自然言語文や文書の一部あるいは全
部を検索条件として受け入れるようにもできる。ただ
し、この場合は、必ずしもその内容の理解に基づくわけ
ではなく、自然言語文や文書に含まれる単語群を検索キ
ー群と見て、それらを論理和的に扱ったり、検索条件内
及び文書データベースの各文書内の単語群をベクトルと
して見なす方法などがあるが、本実施例では論理式で表
現された検索条件式を対象にして説明することにする。
Step S100: The user inputs from the input means 1 (for example, a keyboard or the like) a search condition expression expressed as a logical expression in units of a search word or the like (search key) for a required document. For example, a search condition formula for searching the document database 20 for a document having the search key "weapon" and having either the search key "export control" or the "export mitigation" has the following format. Weapons & (Export control | Export mitigation) where & is the logical product (AND operator), | is the logical sum (O
(R operator) and () indicate priority ranges. In other cases, the simplest case is just a single search key,
A plurality of search keys can be arranged without using an operator, and can be described in the meaning of “include all” or “include any”. Furthermore, part or all of a natural language sentence or a document can be accepted as a search condition. However, in this case, it is not necessarily based on the understanding of the contents, and the words included in the natural language sentence or the document are regarded as a search key group, and they are treated in a logical OR manner, or are included in the search condition and in the document database. There is a method of regarding a word group in each document as a vector, and the like. In this embodiment, a description will be given of a search condition expression represented by a logical expression.

【0020】ステップS110:この入力された検索条
件式を解釈し、文書データベース20中から検索条件式
に合致する文書を検索する。これを実現する方法として
例えば、文書毎の検索キー頻度テーブル200(図4)
を作成し、検索キーの出現頻度と検索条件式から条件に
合致する文書を選択する。この合致した文書に対して、
次の情報からなる文書一覧テーブル300(図5)を作
成する。 文書ID(識別子) タイトル この文書内での検索キーの出現頻度(すべての検索キー
に対して) 尚、検索キー頻度テーブル200を作成せず各文書の検
索時に合致したものだけを文書一覧テーブル300とし
て直接作成しても良い。
Step S110: The input search condition expression is interpreted, and a document matching the search condition expression is searched from the document database 20. As a method for realizing this, for example, a search key frequency table 200 for each document (FIG. 4)
Is created, and a document that matches the condition is selected from the appearance frequency of the search key and the search condition expression. For this matched document,
A document list table 300 (FIG. 5) including the following information is created. Document ID (identifier) Title Frequency of occurrence of search keys in this document (for all search keys) Note that search key frequency table 200 is not created, and only those that match at the time of searching each document are listed in document list table 300. It may be directly created as.

【0021】ステップS120:検索された文書一覧テ
ーブル300にある各文書ごとに、検索条件式の各検索
キーの照合度を計算する(図7)。上記の例では、「兵
器」、「輸出規制」、「輸出緩和」の3つの検索キーが
それぞれ各文書にどのくらい貢献しているのかを照合度
として評価する(詳細は後述する)。
Step S120: For each document in the searched document list table 300, the degree of collation of each search key of the search condition formula is calculated (FIG. 7). In the above example, how much each of the three search keys “weapon”, “export control”, and “export mitigation” contribute to each document is evaluated as a matching degree (details will be described later).

【0022】ステップS130:文書一覧テーブル30
0に設定された照合度をもとに、各文書について検索キ
ー毎の照合の状況表現を生成する。この表現生成に際し
ては、入力手段1からどのような形式で状況を表示した
いかをユーザーが指定することによって変更することが
できる。指定されなければ予め定められた形式とされる
(詳細は後述する)。
Step S130: Document list table 30
Based on the collation degree set to 0, a collation situation expression for each search key is generated for each document. At the time of generating the expression, the user can change the format of the situation to be displayed from the input unit 1 by specifying the user. If not specified, the format is a predetermined format (details will be described later).

【0023】ステップS140:その結果を各文書ごと
に検索キー毎の照合状況を付加した検索文書の一覧(例
えば文書タイトル等の一覧)をディスプレイ等の表示手
段2へ表示する(詳細は後述する)。
Step S140: A list of search documents (for example, a list of document titles) to which the result is added with the collation status for each search key for each document is displayed on the display means 2 such as a display (details will be described later). .

【0024】(a)照合度評価(ステップS120) 本システムの照合度の評価には検索キー(単語)毎の重
要度を用いて計算する。この単語の重要度には、次のよ
うな種々の計算方法がある。 ・文書内での出現頻度(tf:term frequency)、 ・文書頻度(文書データベース全体でその単語が出現す
る文書の数df:documentfrequency)の逆数値(idf:invert
ed df) ・idfの対数値(これを改めてidfと呼ぶことがある) ・tfとidfとの積
(A) Evaluation of collation degree (step S120) Evaluation of the collation degree of the present system is performed using the importance of each search key (word). There are various calculation methods for the importance of this word as follows.・ The frequency of occurrence (tf: term frequency) in the document ・ The reciprocal value (idf: invert) of the document frequency (the number of documents in which the word appears in the entire document database df: documentfrequency)
ed df) ・ Log value of idf (this may be called idf again) ・ Product of tf and idf

【0025】本システムでは、上記のうち最後に上げた
「tfとidfの対数値(ここではlog(1000/df)として計算
した)との積」に基づいて評価することにする。この場
合は、予め文書データベース20全体について、単語ご
とに出現する文書数(文書頻度:df)を計数し、上記計
算式で単語の重要度として計算し、単語重要度テーブル
400(図6)を作成する。単語重要度テーブル400
は次のエントリーを持つ。 単語 この単語のデータベース内での出現頻度 この単語の重要度(上記の計算式で求めたもの) 従って、各文書の検索キー毎の照合度は、文書一覧テー
ブル300の各検索キーの文書内頻度と単語頻度テーブ
ル400の単語(検索キー)の重要度との積をとった値
として計算できる。その結果、次のエントリーを持つ照
合度テーブル500を作成する。図7はその計算結果で
ある。 文書ID 文書タイトル 検索キー毎の照合度
In the present system, the evaluation is made based on the last raised "product of logarithmic value of tf and idf (calculated here as log (1000 / df))". In this case, for the entire document database 20, the number of documents (document frequency: df) appearing for each word is counted in advance, calculated as the importance of the word by the above formula, and the word importance table 400 (FIG. 6) is calculated. create. Word importance table 400
Has the following entry: Word Appearance frequency of this word in the database Importance of this word (calculated by the above formula) Therefore, the matching degree of each search key of each document is determined by the frequency of each search key in the document list table 300 in the document. And the importance of the word (search key) in the word frequency table 400. As a result, a collation degree table 500 having the next entry is created. FIG. 7 shows the calculation result. Document ID Document title Matching degree for each search key

【0026】又、照合度の評価値を検索キーの文書内頻
度としても良い。このときには上記の単語重要度テーブ
ル400は必要なくなり、頻度そのものが評価値とな
る。
Further, the evaluation value of the degree of collation may be used as the frequency of the retrieval key in the document. At this time, the word importance table 400 is not necessary, and the frequency itself is the evaluation value.

【0027】(b)照合状況表現(ステップS130) 本システムでは、照合度テーブル500の検索キー毎の
照合度を用いて照合状況の表現を生成するが、これには
下記のような種々の表現がある。更にこれらを適宜組み
合わせて表現を生成することもできる。
(B) Matching Situation Expression (Step S130) In the present system, a matching situation expression is generated using the matching degree for each search key in the matching degree table 500. There is. Further, expressions can be generated by appropriately combining these.

【0028】(i)照合状況を照合度評価値そのものの
大きさを使って表現する場合 (イ)照合状況をその文書で合致した検索キーをリスト
アップする。 例えば、図7の文書IDが12の場合 兵器 輸出規制 文書IDが1245の場合 兵器 輸出規制 輸出緩和 というように表現を生成する。又、この検索キーリスト
を照合度の大きい順に並べることも検索キーの貢献度を
知る上で有効である。図7の文書IDが1245の場合 輸出緩和 輸出規制 兵器 又、検索条件式そのものを用いて、照合度がゼロの検索
キーを省略した形での表現を生成することもできる。例
えば、図7の文書IDが201の場合 兵器 & 輸出規制 文書IDが1245の場合 兵器 & (輸出規制 | 輸出緩和)
(I) When the collation state is expressed using the magnitude of the collation degree evaluation value itself (a) A search key that matches the collation state in the document is listed. For example, in the case where the document ID in FIG. 7 is 12, a weapon export control is performed. In the case where the document ID is 1245, an expression such as weapon export control export mitigation is generated. Arranging the search key list in descending order of the matching degree is also effective in knowing the contribution degree of the search key. In the case where the document ID in FIG. 7 is 1245, export mitigation Export control Weapons Alternatively, an expression in a form in which a search key with a matching degree of zero is omitted can be generated using the search condition expression itself. For example, if the document ID in FIG. 7 is 201, weapons & export control If the document ID is 1245, weapons & (export control | export mitigation)

【0029】(ロ)照合状況をその文書で合致した検索
キーに照合度を付加した形でリストアップする。上例
(イ)では、照合があったこととその順位はわかるがそ
の貢献の程度は分からないので、照合度の数値を付加し
た形で表現を生成する(この形式を検索結果表示部50
から検索結果一覧表を表示する際の規定値とする)。例
えば、図7の文書IDが201の場合 兵器:1.34 輸出規制:2.94 又は、照合度の順番に並べて 輸出規制:2.94 兵器:1.34 とすることもできる。表示されなかった検索キーは、存
在していなかったのか又は省略されているのか分からな
いときもあるので、このように照合度を付加するときは
照合度がゼロであってもリストに加えることも有効であ
る。 兵器:2.01 輸出規制:0.98 輸出緩和:0.00 又は、検索条件式そのものを用いて、検索条件式の中の
検索キーに照合度を付加して表現を生成することも有効
である。例えば、図7の文書IDが1245の場合 兵器:0.67 & (輸出規制:1.96 | 輸出
緩和:3.50) 又、文書IDが999は照合度がゼロのところを省略し
た形で 兵器:2.01 & 輸出規制:0.98 とも表現を生成できるし、ゼロを省略せずにそのまま付
加した形でも良い。上記の照合度の数値は、計算された
ものをそのまま用いているが、これを四捨五入や何倍か
して整数型としてもよい。 例: 兵器:2 & 輸出規制:1
(B) The collation status is listed in a form in which the collation degree is added to the retrieval key that matches the document. In the above example (a), the fact that the collation has been performed and the rank thereof can be known, but the degree of the contribution is not known.
From when the search result list is displayed). For example, when the document ID in FIG. 7 is 201, weapons: 1.34 export control: 2.94, or export controls: 2.94 weapons: 1.34 in order of matching degree. Search keys that are not displayed may not be known to exist or have been omitted.Therefore, when adding a matching degree in this way, even if the matching degree is zero, it may be added to the list. It is valid. Weapons: 2.01 Export restrictions: 0.98 Export mitigation: 0.00 Or, it is also effective to use the search condition expression itself and add a matching degree to the search key in the search condition expression to generate an expression. is there. For example, when the document ID in FIG. 7 is 1245 Weapons: 0.67 & (Export restrictions: 1.96 | Export mitigation: 3.50) Also, for the document ID 999, the place where the matching degree is zero is omitted. Weapons: 2.01 & Export restrictions: 0.98 can be used to create expressions, and zeros may be added without omission. Although the numerical value of the above-mentioned collation degree is directly used as calculated, it may be rounded or multiplied to obtain an integer type. Example: Weapons: 2 & Export restrictions: 1

【0030】(ii)照合状況を照合度の大きさを長さ、
面積、形状、色の相違、濃淡、装飾の相違等によって表
現する場合 (イ)照合状況をその文書で合致した検索キーを図形
(円形、長方形、帯グラフ等)で囲った形でリストアッ
プする。又、この図形を照合度の大きい順に並べること
も検索キーの貢献度を知る上で有効である。照合度がゼ
ロの場合には対応する図形を省略するようにしてもよ
い。
(Ii) The collation status is represented by the length of the collation degree,
When expressing by area, shape, color difference, shading, decoration difference, etc. (a) List matching conditions in a form in which search keys matching the document are enclosed in figures (circles, rectangles, band graphs, etc.) . Also, arranging these figures in descending order of the matching degree is effective in knowing the contribution degree of the search key. When the matching degree is zero, the corresponding figure may be omitted.

【0031】(ロ)寸法線の長さや棒グラフの棒の長さ
によって大きさを表現する。(図8)照合度を付加して
表現しても良い。 (ハ)図形(円形、長方形、帯グラフ等)の面積によっ
て大きさを表現する(図9)。 (ニ)大きさを図形の形状に対応付けて表現する。 例:◎、○、□、△、×等の順で大きさを定義して使用
する。このうち×を照合度がゼロに対応させるようにす
れば、合致しなかった検索キーを知ることができる。 (ホ)図形(○や□等)を色彩の種類によって大きさを
表現する。 例:赤、青、紫、緑、黄色、黒、白等の順で大きさを定
義して使用する。無色の輪郭だけの図形は照合度がゼロ
に対応させるようにすれば、合致しなかった検索キーを
知ることができる。
(B) The size is expressed by the length of the dimension line or the length of the bar of the bar graph. (FIG. 8) It may be expressed by adding a collation degree. (C) The size is represented by the area of a figure (circle, rectangle, band graph, etc.) (FIG. 9). (D) Express the size in association with the shape of the figure. Example: Define and use sizes in the order of ◎, ○, □, △, ×, etc. If X is made to correspond to the matching degree of zero, the search key that does not match can be known. (E) The size of a figure (such as ○ or □) is represented by the type of color. Example: Define and use sizes in the order of red, blue, purple, green, yellow, black, white, etc. If a colorless outline-only figure is made to correspond to a matching degree of zero, a search key that does not match can be known.

【0032】(ヘ)図形(○や□等)を色彩の濃淡によ
って大きさを表現する。 例:上記の中でも色の濃淡を使い分けて、濃いほうを大
きさが大きいとする。この場合、一色でも上記のように
多色でも良い。無色の輪郭だけの図形は照合度がゼロに
対応させるようにすれば、合致しなかった検索キーを知
ることができる。 (ト)図形(○や□等)をハッチングするとき、その模
様の相違によって大きさを表現する(図10)。ハッチ
ングの無い輪郭だけの図形は照合度がゼロに対応させる
ようにすれば、合致しなかった検索キーを知ることがで
きる。 (チ)検索条件式において、論理形式のANDとORの関係
の軸を図形(例えば、帯グラフ)を用いて、直交させる
ように表現する。図11は検索条件式が 兵器 & (輸出規制 | 輸出緩和)& 日本 であり、照合度がそれぞれ兵器:2、輸出規制:3、輸
出緩和:1、日本:0のときの表現を表している。
(F) The size of a figure (○, □, etc.) is represented by the shade of color. Example: Among the above, different shades of color are used, and the darker one is larger in size. In this case, one color or multiple colors as described above may be used. If a colorless outline-only figure is made to correspond to a matching degree of zero, a search key that does not match can be known. (G) When hatching a figure (such as や or □), the size is represented by the difference in the pattern (FIG. 10). If a figure having only a contour without hatching is made to correspond to a matching degree of zero, a search key that does not match can be known. (H) In the search condition formula, the axes of the relationship between the logical form of AND and OR are expressed so as to be orthogonal using a graphic (for example, a band graph). Fig. 11 shows expressions when the search condition formula is weapons & (export control | export mitigation) & Japan, and the matching degrees are weapons: 2, export control: 3, export mitigation: 1, and Japan: 0, respectively. .

【0033】(iii)照合状況を上記の(ロ)、(ハ)
や(チ)のように図形の面積や線分の長さを使って表現
する場合に、トータルの大きさを文書の照合度の大きさ
にして、それを各検索キーの照合度の割合に分割して表
現するようにしても良い(図12)。
(Iii) The collation status is determined by the above (b) and (c).
When expressing using the area of a figure or the length of a line segment as in (h) or (h), the total size is set to the collation degree of the document, and it is calculated as the ratio of the collation degree of each search key. It may be divided and expressed (FIG. 12).

【0034】(c)検索結果表示(ステップS140) 図13は、検索条件式の照合状況表現が付加されていな
い検索結果一覧の例で、表示順番号と文書のタイトルと
をリストアップしている。又、検索結果一覧を表示する
際には、文書毎の照合度を計算して、その照合度の値の
順序で表示するようにしても良い。図14は、検索結果
一覧に文書のタイトルだけでなく、文書毎の照合度を示
す値が〔 〕内に示され、その値の大きさの順にソート
して表示するようにしている。
(C) Search Result Display (Step S140) FIG. 13 is an example of a search result list to which the collation status expression of the search condition expression is not added, in which display order numbers and document titles are listed. . When displaying the search result list, the collation degree for each document may be calculated and displayed in the order of the collation degree values. In FIG. 14, not only the title of the document but also a value indicating the degree of collation for each document is shown in [] in the search result list, and the values are sorted and displayed in the order of the magnitude of the value.

【0035】この文書毎の照合度は、ここでは各検索キ
ーの照合度の和を10倍して、四捨五入した値として求め
る。このとき、'&'関係のキーの組み合わせの照合度
は、各検索キーの照合度の和とし、「輸出規制」と「輸
出緩和」のような'|'関係の検索キーの組み合わせは、
各検索キーの照合度のうちの最大の照合度として計算す
る。このようにして求めた文書の照合度は、照合度テー
ブル500に文書の照合度というエントリーを作成して
保存する。例えば、文書IDが1245の文書では、 0.67+max(1.96,3.50)=0.67+3.50=4.17 であり、文書の照合度は、上記の照合度和を10倍して、
四捨五入した値として算出する。
Here, the collation degree for each document is obtained as a value obtained by multiplying the sum of the collation degrees of each search key by 10 and rounding it. At this time, the matching degree of the key combination of '&' relation is the sum of the matching degrees of each search key, and the combination of search keys of '|' relation such as “export control” and “export mitigation”
It is calculated as the maximum matching degree of the matching degrees of each search key. The collation degree of the document obtained in this way is created and stored in the collation degree table 500 as an entry called the collation degree of the document. For example, in the document with the document ID of 1245, 0.67 + max (1.96,3.50) = 0.67 + 3.50 = 4.17, and the collation degree of the document is obtained by multiplying the above collation degree by 10 times.
Calculate as a rounded value.

【0036】図14のような一覧表示からユーザーの望
んでいる文書を選択するときに、検索キー毎の照合度や
文書の内容を表示させて判断材料とすることができる。
例えば、詳細な内容を表示させたいときには、対象とな
る文書をマウスのような入力手段1を使ってダブルクリ
ックして、その選択された文書の文書IDで文書データ
ベース20から文書の内容を抽出して表示させて判断材
料とすることができる。
When selecting a document desired by the user from the list display as shown in FIG. 14, the degree of collation for each search key and the contents of the document can be displayed for use as a judgment material.
For example, when the user wants to display the detailed contents, the user double-clicks the target document using the input means 1 such as a mouse, and extracts the contents of the document from the document database 20 by the document ID of the selected document. Can be displayed as a judgment material.

【0037】又、本発明で提案されているように検索キ
ー毎の照合度を表示させて判断材料とすることもでき
る。これには、照合状況を前記したいずれか又はその組
み合わせのいずれの形式で表示したいかをユーザーがメ
ニュー表示させた中から選択する。検索結果表示部50
は、この指示に従って照合テーブル500の各照合度を
照合状況表現部52によって生成された表現は、各文書
のタイトルの下に図15(a)のような形式で表示手段
2へ表示される。又は、文書の照合度とタイトルとの間
に照合状況を図15(b)のような形式で表示手段2へ
表示するようにしても良い。又は、文書の照合度とタイ
トルとの間に照合状況を図15(c)のような形式で表
示手段2へ表示するようにしても良い。又は、検索結果
一覧を図14の形式で表示してから、個別に照合状況を
表示させるようにしても良い。
Further, as proposed in the present invention, the degree of collation for each search key can be displayed and used as a judgment material. For this purpose, the user selects from the menu display the user wants to display the collation status in any one of the above-described formats or a combination thereof. Search result display section 50
According to the instruction, the expression generated by the collation status expressing unit 52 of each collation degree of the collation table 500 is displayed on the display unit 2 under the title of each document in a format as shown in FIG. Alternatively, the collation status may be displayed on the display unit 2 between the collation degree of the document and the title in a format as shown in FIG. Alternatively, the collation status may be displayed on the display unit 2 between the collation degree of the document and the title in a format as shown in FIG. Alternatively, the search result list may be displayed in the format shown in FIG. 14, and then the matching status may be displayed individually.

【0038】例えば、図15(b)は、検索キーに付け
られた照合度により、上位4文書のうち、 ・1番目の文書は、「輸出規制」について多く記述され
ている ・2番目の文書だけは、「輸出緩和」についても述べら
れている といったことがわかり、ユーザーの文書選択の判断に有
効な情報となり得る。
For example, FIG. 15 (b) shows that among the top four documents, the first document describes a lot of “export restrictions” according to the degree of matching given to the search key. Alone can also be said to mention "export mitigation," and could be useful information for users to decide on document selection.

【0039】(d)評価のタイミング 上述した検索部30では、文書毎に検索キー毎の文書頻
度を計算して文書一覧テーブル300を作成したが、次
の2つのうちのいずれの構成方法であってもよい。 (1)検索部30では、検索条件に合致する文書だけを
検出し、その合致した文書IDのみを文書一覧テーブル
300として作成する。照合度評価部40では、この文
書一覧テーブル300に登録された文書毎に各検索キー
毎の文書内の出現頻度を計算する。この頻度を基に検索
キーの照合度を計算する。さらに必要であれば文書毎の
照合度も計算する。 (2)検索部30で合致する文書を検出するだけでな
く、合致した文書の検索キー毎の出現頻度から照合度、
更には必要であれば文書毎の照合度も計算してしまう。
即ち、検索部30と照合度評価部40とが一体となって
動作するように構成する。
(D) Evaluation Timing In the above-described search unit 30, the document frequency table is calculated for each search key for each document, and the document list table 300 is created. You may. (1) The search unit 30 detects only documents that match the search conditions, and creates only the matched document IDs as the document list table 300. The collation evaluation unit 40 calculates the appearance frequency of each search key in the document for each document registered in the document list table 300. Based on this frequency, the matching degree of the search key is calculated. If necessary, the degree of collation for each document is also calculated. (2) The search unit 30 not only detects a matching document, but also determines the matching degree based on the frequency of occurrence of the matching document for each search key.
Furthermore, if necessary, the degree of collation for each document is calculated.
That is, the search unit 30 and the matching degree evaluation unit 40 are configured to operate integrally.

【0040】2.実施例2(ネットワーク型) 本発明の第2の実施例は、クライアント/サーバー型に
よって構成した例であり、図16はその全体構成図であ
る。サーバーは、実施例1と同じ構成としており、文書
データベースの検索サーバーとして動作する。クライア
ントは、実施例1の構成から文書データベースと検索実
行部分を省略したもので構成している。これらの1台の
検索サーバーと複数台のクライアントとはLANを介し
て結合されている。
2. Embodiment 2 (Network Type) The second embodiment of the present invention is an example configured by a client / server type, and FIG. 16 is an overall configuration diagram thereof. The server has the same configuration as that of the first embodiment, and operates as a document database search server. The client is configured by omitting the document database and the search execution part from the configuration of the first embodiment. These one search server and a plurality of clients are connected via a LAN.

【0041】図17は、本実施例の機能構成図であり、
以下のように検索サーバーとクライアントとは連携して
動作する。クライアント1が本文書検索システムを利用
するときには、クライアント1の検索条件入力部10で
検索条件を入力し、この検索条件を検索インタフェース
部60が検索サーバーの検索部30へ送信し、検索サー
バーの検索部30が指定された検索条件に合致した文書
の文書一覧テーブル300をクライアント1の検索イン
ターフェース部60へ送り返す。クライアント1は、こ
の文書一覧テーブル300から照合度評価部40によっ
て照合度を計算し、その結果の照合テーブル500によ
って検索結果表示部50によって表示手段2へ表示され
る。
FIG. 17 is a functional block diagram of the present embodiment.
The search server and the client work together as follows. When the client 1 uses the present document search system, a search condition is input in the search condition input unit 10 of the client 1, and the search interface unit 60 transmits the search condition to the search unit 30 of the search server, and searches the search server. The unit 30 sends back the document list table 300 of the documents that match the specified search condition to the search interface unit 60 of the client 1. The client 1 calculates the matching degree from the document list table 300 by the matching degree evaluation unit 40, and displays the result on the display unit 2 by the search result display unit 50 based on the matching table 500.

【0042】尚、クライアント側に照合度評価部30を
備えるように構成したが、検索サーバーに照合度評価部
40を備えさせて検索された文書とその照合度を計算
し、その結果である照合テーブル500をクライアント
の検索インタフェース部60へ送り返し、検索インタフ
ェース部60から検索結果表示部50を通じて照合度の
表現を付加した検索結果一覧表を表示手段2へ表示する
ように構成しても良い。
Although the client is provided with the collation evaluation unit 30 on the client side, the search server is provided with the collation evaluation unit 40 to calculate the retrieved document and its collation, and the collation as the result is obtained. The table 500 may be sent back to the search interface unit 60 of the client, and a search result list to which the expression of the matching degree is added from the search interface unit 60 through the search result display unit 50 may be displayed on the display unit 2.

【0043】3.実施例3(プログラムとしての実施
例) なお、本発明の文書検索システムは上記の実施形態のみ
に限定されたものではない。例えば、図2に示した文書
検索システムを構成する検索条件入力部10、検索部3
0、照合度評価部40、検索結果表示部50の各機能を
プログラム化し、予めCD−ROM等の記録媒体に書き
込んでおき、このCD−ROMをCD−ROMドライブ
を搭載したコンピュータに装着して、コンピュータへそ
のプログラムをロードすることによって、実施例1の実
施形態と同様な機能を実現することができる。
3. Example 3 (Example as a Program) The document search system of the present invention is not limited to the above embodiment. For example, the search condition input unit 10 and the search unit 3 forming the document search system shown in FIG.
0, the respective functions of the matching degree evaluation unit 40 and the search result display unit 50 are programmed, written in advance on a recording medium such as a CD-ROM, and this CD-ROM is mounted on a computer equipped with a CD-ROM drive. By loading the program into a computer, the same function as that of the first embodiment can be realized.

【0044】又、本文書検索システムを図16のような
クライアント/サーバーシステム(実施例2)で構成す
ることもあるが、サーバー側の検索部30の機能をプロ
グラム化してCD−ROMへ記録し、クライアント側は
検索条件入力部10、照合度評価部40、検索結果表示
部50、検索インタフェース部60の各機能をプログラ
ム化してCD−ROMへ記録するようにしてもよい。
Although the present document search system may be constituted by a client / server system (second embodiment) as shown in FIG. 16, the function of the search unit 30 on the server side is programmed and recorded on a CD-ROM. On the client side, the functions of the search condition input unit 10, the matching degree evaluation unit 40, the search result display unit 50, and the search interface unit 60 may be programmed and recorded on a CD-ROM.

【0045】又は、サーバー側の検索部30、照合度評
価部40の各機能をプログラム化してCD−ROMへ記
録し、クライアント側は検索条件入力部10、検索結果
表示部50、検索インタフェース部60の各機能をプロ
グラム化してCD−ROMへ記録するようにしてもよ
い。
Alternatively, the functions of the search unit 30 and the collation degree evaluation unit 40 on the server side are programmed and recorded on a CD-ROM, and the search condition input unit 10, search result display unit 50 and search interface unit 60 are provided on the client side. May be programmed and recorded on a CD-ROM.

【0046】尚、記録媒体としては半導体媒体(例え
ば、ROM、ICメモリカード等)、光媒体(例えば、
DVD−ROM,MO,MD,CD−R等)、磁気媒体
(例えば、磁気テープ、フレキシブルディスク等)のい
ずれであってもよい。
As a recording medium, a semiconductor medium (for example, ROM, IC memory card, etc.), an optical medium (for example, ROM,
Any of DVD-ROM, MO, MD, CD-R, etc.) and magnetic media (for example, magnetic tape, flexible disk, etc.) may be used.

【0047】[0047]

【発明の効果】以上説明したように特許請求の範囲の発
明によれば、検索結果の一覧を表示するときに、文書毎
に検索キーとの照合状況を表示する種々の表現手段を提
供し、且つ、ユーザーの検索条件に応じて簡潔な情報を
提供することにより、検索結果の一覧の中から所望の文
書を効率良く選択することができるようになった。
As described above, according to the claimed invention, when displaying a list of search results, there are provided various expression means for displaying a matching state with a search key for each document. In addition, by providing simple information according to a user's search condition, a desired document can be efficiently selected from a list of search results.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の文書検索システムに関する実施例1
の全体構成図である。
FIG. 1 shows a first embodiment of a document search system according to the present invention.
FIG.

【図2】 本発明の文書検索システムに関する実施例1
の機能構成図である。
FIG. 2 is a diagram illustrating a document search system according to a first embodiment of the present invention;
FIG. 2 is a functional configuration diagram.

【図3】 本発明の文書検索システムに関する処理の流
れを説明するためのフローチャートである。
FIG. 3 is a flowchart illustrating a flow of a process related to the document search system of the present invention.

【図4】 検索キー頻度テーブルのデータ構造を説明す
るための図である。
FIG. 4 is a diagram illustrating a data structure of a search key frequency table.

【図5】 文書一覧テーブルのデータ構造を説明するた
めの図である。
FIG. 5 is a diagram illustrating a data structure of a document list table.

【図6】 単語重要度テーブルのデータ構造を説明する
ための図である。
FIG. 6 is a diagram illustrating a data structure of a word importance table.

【図7】 照合度テーブルのデータ構造を説明するため
の図である。
FIG. 7 is a diagram illustrating a data structure of a collation degree table.

【図8】 照合状況表現のうち長さによって表現する例
を示す図である。
FIG. 8 is a diagram illustrating an example in which a matching state expression is represented by a length.

【図9】 照合状況表現のうち図形の面積によって大き
さを表現する例を示す図である。
FIG. 9 is a diagram illustrating an example in which the size is represented by the area of the figure in the collation situation expression.

【図10】 照合状況表現のうち図形のハッチングの模
様によって表現する例を示す図である。
FIG. 10 is a diagram illustrating an example in which a matching state expression is represented by a hatched pattern of a figure.

【図11】 照合状況表現のうち検索条件式の構造を表
現する例を示す図である。
FIG. 11 is a diagram illustrating an example of expressing a structure of a search condition expression in a matching status expression.

【図12】 照合状況表現のうち文書の照合度の大きさ
を検索キーの照合度の割合で分割して表現する例を示す
図である。
FIG. 12 is a diagram showing an example in which the magnitude of the collation degree of a document in the collation state expression is divided and expressed according to the ratio of the collation degree of the search key.

【図13】 一般的な検索結果一覧の出力画面の一例で
ある。
FIG. 13 is an example of a general search result list output screen.

【図14】 本発明の検索結果一覧の出力画面の一例で
ある。
FIG. 14 is an example of a search result list output screen of the present invention.

【図15】 本発明の検索結果一覧の出力画面の他の例
である。
FIG. 15 is another example of the search result list output screen of the present invention.

【図16】 本発明の情報検索システムに関する実施例
2の全体構成図である。
FIG. 16 is an overall configuration diagram of Embodiment 2 relating to the information search system of the present invention.

【図17】 本発明の文書検索システムに関する実施例
2の機能構成図である。
FIG. 17 is a functional configuration diagram of a document search system according to a second embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1…入力手段、2…表示手段、3…CPU、4…メモ
リ、5…記憶手段、10…検索条件入力部、20…文書
データベース、30…検索部、40…照合度評価部、5
0…検索結果表示部、52…照合状況表現部、200…
検索キー頻度テーブル、300…文書一覧テーブル、4
00…単語重要度テーブル、500…照合度テーブル。
DESCRIPTION OF SYMBOLS 1 ... Input means, 2 ... Display means, 3 ... CPU, 4 ... Memory, 5 ... Storage means, 10 ... Search condition input part, 20 ... Document database, 30 ... Search part, 40 ... Matching degree evaluation part, 5
0: search result display section, 52: collation status expression section, 200:
Search key frequency table, 300: Document list table, 4
00: word importance table, 500: collation degree table.

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 検索条件を入力して文書データベースを
検索し、検索結果を一覧表示する文書検索システムにお
いて、検索条件を入力する検索条件入力部と、複数の文
書が格納されている文書データベースと、前記検索条件
入力部で入力した検索条件で前記文書データベースを検
索する検索部と、前記検索部で検索された各文書に対し
て検索条件中の検索語あるいは検索文字列(以下「検索
キー」と呼ぶ)毎に照合度を求める照合度評価部と、前
記検索部で検索された文書を一覧表示する検索結果表示
部とを備え、前記検索結果表示部に前記照合度評価部で
得た照合度をもとに検索キーとの照合状況が分かるよう
な表現を生成する照合状況表現部を付加して前記検索部
で検索された文書と該照合状況表現部で得た表現とを関
連付けて一覧表示するようにしたことを特徴とする文書
検索システム。
1. A document search system for inputting search conditions to search a document database and displaying a list of search results, comprising: a search condition input unit for inputting search conditions; a document database storing a plurality of documents; A search unit for searching the document database based on the search condition input by the search condition input unit; and a search word or search character string (hereinafter, “search key”) in the search condition for each document searched by the search unit. A collation degree estimating unit for obtaining a collation degree for each of them, and a search result display unit for displaying a list of documents searched by the search unit, and a collation obtained by the collation degree evaluation unit in the search result display unit. A collation status expression section for generating an expression that allows the user to understand the collation situation with the search key based on the degree is added, and a list obtained by associating the documents retrieved by the retrieval section with the expressions obtained by the collation status expression section Show A document search system characterized in that:
【請求項2】 検索条件を入力して文書データベースを
検索し、検索結果を一覧表示する文書検索システムにお
いて、検索条件を入力する検索条件入力部と、前記検索
条件入力部で入力した検索条件を送って、その検索条件
で複数の文書が格納されている文書データベースを検索
した結果を受信する検索インタフェース部と、前記検索
インタフェース部で受信した検索結果の各文書に対して
検索条件中の検索語あるいは検索文字列(以下「検索キ
ー」と呼ぶ)毎に照合度を求める照合度評価部と、前記
検索インタフェース部で受信した検索結果の文書を一覧
表示する検索結果表示部とを備え、前記検索結果表示部
に前記照合度評価部で得た照合度をもとに検索キーとの
照合状況が分かるように表現する照合状況表現部を付加
して前記検索インタフェース部で受信した検索結果の文
書と該照合状況表現部で得た表現とを関連付けて一覧表
示するようにしたことを特徴とする文書検索システム。
2. A document search system for searching a document database by inputting search conditions and displaying a list of search results, comprising: a search condition input unit for inputting search conditions; and a search condition input by the search condition input unit. A search interface unit for sending and receiving a result of searching a document database in which a plurality of documents are stored under the search condition; and a search term in the search condition for each document of the search result received by the search interface unit Alternatively, the search method further comprises a collation degree evaluation unit for obtaining a collation degree for each search character string (hereinafter, referred to as a “search key”), and a search result display unit for displaying a list of documents of search results received by the search interface unit. The result display unit is provided with a collation status expression unit for expressing the collation status with the search key based on the collation degree obtained by the collation degree evaluation unit, and the search interface is displayed. A document search system wherein a document of a search result received by a face unit and an expression obtained by the matching status expression unit are displayed in a list in association with each other.
【請求項3】 請求項1又は請求項2記載の文書検索シ
ステムにおいて、前記照合状況表現部は、照合度の評価
値の順序で検索キーを並べることを特徴とする文書検索
システム。
3. The document retrieval system according to claim 1, wherein the collation status expression unit arranges retrieval keys in the order of collation degree evaluation values.
【請求項4】 請求項1又は請求項2記載の文書検索シ
ステムにおいて、前記照合状況表現部は、検索条件式の
構成が分かるような図形としたことを特徴とする文書検
索システム。
4. The document search system according to claim 1, wherein the collation status expression unit is a figure that allows the configuration of a search condition expression to be understood.
【請求項5】 請求項1又は請求項2又は請求項4記載
の文書検索システムにおいて、前記照合状況表現部は、
検索キー毎に照合度の評価値を図形の装飾によって照合
度の評価値の違いが分かるようにしたことを特徴とする
文書検索システム。
5. The document search system according to claim 1, wherein the collation status expression unit comprises:
A document retrieval system characterized in that the evaluation value of the collation degree for each search key is differentiating between the evaluation values of the collation degree by decoration of a figure.
【請求項6】 請求項1又は請求項2又は請求項4記載
の文書検索システムにおいて、前記照合状況表現部は、
検索キー毎に照合度の評価値を図形の形状によって照合
度の評価値の違いが分かるようにしたことを特徴とする
文書検索システム。
6. The document search system according to claim 1, wherein the collation status expression unit comprises:
A document retrieval system characterized in that the evaluation value of the matching degree for each search key is such that the difference in the evaluation value of the matching degree can be understood depending on the shape of the figure.
【請求項7】 検索条件によって文書データベースを検
索し、検索結果を一覧表示する文書検索方法において、
検索条件を入力し、複数の文書が格納されている文書デ
ータベースを前記検索条件によって検索し、この検索さ
れた各文書に対して検索キー毎に照合度を求め、この照
合度をもとに検索キーとの照合状況が分かるような表現
と検索された文書とを関連付けて一覧表示することを特
徴とする文書検索方法。
7. A document search method for searching a document database according to search conditions and displaying a list of search results,
A search condition is entered, a document database storing a plurality of documents is searched according to the search condition, a matching degree is obtained for each search key for each of the searched documents, and a search is performed based on the matching degree. A document search method characterized by displaying a list in which an expression that indicates a matching state with a key and a searched document are associated with each other.
【請求項8】 検索条件を入力し、複数の文書が格納さ
れている文書データベースを前記検索条件によって検索
し、この検索された各文書に対して検索キー毎に照合度
を求め、この照合度をもとに検索キーとの照合状況が分
かるような表現と検索された文書とを関連付けて一覧表
示するプログラムを記録したコンピュータ読み取り可能
な記録媒体。
8. A search condition is input, a document database storing a plurality of documents is searched by the search condition, and a collation degree is determined for each of the retrieved documents for each retrieval key. A computer-readable recording medium which records a program for displaying a list in which an expression such that a matching state with a search key can be recognized based on a search key is associated with a searched document.
JP34497398A 1998-12-04 1998-12-04 Document retrieval system, document retrieval method, and computer-readable recording medium recording program for executing the method Expired - Fee Related JP3578651B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34497398A JP3578651B2 (en) 1998-12-04 1998-12-04 Document retrieval system, document retrieval method, and computer-readable recording medium recording program for executing the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34497398A JP3578651B2 (en) 1998-12-04 1998-12-04 Document retrieval system, document retrieval method, and computer-readable recording medium recording program for executing the method

Publications (2)

Publication Number Publication Date
JP2000172698A true JP2000172698A (en) 2000-06-23
JP3578651B2 JP3578651B2 (en) 2004-10-20

Family

ID=18373421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34497398A Expired - Fee Related JP3578651B2 (en) 1998-12-04 1998-12-04 Document retrieval system, document retrieval method, and computer-readable recording medium recording program for executing the method

Country Status (1)

Country Link
JP (1) JP3578651B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006323811A (en) * 2005-04-20 2006-11-30 Just Syst Corp Document processor, document processing method, document processing program, and computer readable recording medium
JP2007219722A (en) * 2006-02-15 2007-08-30 Just Syst Corp Document retrieval server and document retrieval method
JP2007334590A (en) * 2006-06-14 2007-12-27 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for information ranking, and computer readable recording medium
JP2010061322A (en) * 2008-09-03 2010-03-18 Nippon Telegr & Teleph Corp <Ntt> Information retrieving device and information retrieval program
JPWO2013021696A1 (en) * 2011-08-05 2015-03-05 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Information retrieval system, method, and program
JP2015207159A (en) * 2014-04-21 2015-11-19 アルパイン株式会社 Content search device, method and program
WO2017134760A1 (en) * 2016-02-03 2017-08-10 株式会社日立製作所 Information search method, information search device and information search system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03108064A (en) * 1989-09-20 1991-05-08 Internatl Business Mach Corp <Ibm> Information retrieving method and system
JPH06208588A (en) * 1992-08-14 1994-07-26 Ricoh Co Ltd Document retrieving system
JPH1097545A (en) * 1996-09-20 1998-04-14 Sharp Corp Information processor
JPH10240759A (en) * 1997-02-28 1998-09-11 Sharp Corp Retrieval device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03108064A (en) * 1989-09-20 1991-05-08 Internatl Business Mach Corp <Ibm> Information retrieving method and system
JPH06208588A (en) * 1992-08-14 1994-07-26 Ricoh Co Ltd Document retrieving system
JPH1097545A (en) * 1996-09-20 1998-04-14 Sharp Corp Information processor
JPH10240759A (en) * 1997-02-28 1998-09-11 Sharp Corp Retrieval device

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006323811A (en) * 2005-04-20 2006-11-30 Just Syst Corp Document processor, document processing method, document processing program, and computer readable recording medium
JP2007219722A (en) * 2006-02-15 2007-08-30 Just Syst Corp Document retrieval server and document retrieval method
JP4746439B2 (en) * 2006-02-15 2011-08-10 株式会社ジャストシステム Document search server and document search method
JP2007334590A (en) * 2006-06-14 2007-12-27 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for information ranking, and computer readable recording medium
JP2010061322A (en) * 2008-09-03 2010-03-18 Nippon Telegr & Teleph Corp <Ntt> Information retrieving device and information retrieval program
JPWO2013021696A1 (en) * 2011-08-05 2015-03-05 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Information retrieval system, method, and program
US9811584B2 (en) 2011-08-05 2017-11-07 International Business Machines Corporation Information retrieval system, method, and program
JP2015207159A (en) * 2014-04-21 2015-11-19 アルパイン株式会社 Content search device, method and program
WO2017134760A1 (en) * 2016-02-03 2017-08-10 株式会社日立製作所 Information search method, information search device and information search system
JPWO2017134760A1 (en) * 2016-02-03 2018-08-02 株式会社日立製作所 Information search method, information search device, and information search system

Also Published As

Publication number Publication date
JP3578651B2 (en) 2004-10-20

Similar Documents

Publication Publication Date Title
JP3132738B2 (en) Text search method
US6768997B2 (en) System and method for creating a search query using movable elements in a graphical user interface
US5671328A (en) Method and apparatus for automatic creation of a voice recognition template entry
JPH0424869A (en) Document processing system
JP3702414B2 (en) Information search support method, computer-readable storage medium, and information search device
JPH08255172A (en) Document retrieval system
US20080140608A1 (en) Information Managing Apparatus, Method, and Program
JP2001117937A (en) Method and device for retrieving document
JP3578651B2 (en) Document retrieval system, document retrieval method, and computer-readable recording medium recording program for executing the method
JPH0773197A (en) Supporting system for preparing different notation word dictionary
JP2000137725A (en) System and method for information retrieval, and computer-readable recording medium where program for implementing same method is recorded
JP5439028B2 (en) Information search apparatus, information search method, and program
JPH0581326A (en) Data base retrieving device
JP3489326B2 (en) Table generation method
US5715442A (en) Data unit group handling apparatus
JPH0887509A (en) Information display method
JP3933407B2 (en) Document processing apparatus, document processing method, and storage medium storing document processing program
KR102593884B1 (en) System and method for automatically generating documents and computer-readable recording medium storing of the same
JPH10105561A (en) Retrieval condition generator, retrieval condition generating method, document retrieving device and medium for document retrieval
JP2000207422A (en) Retrieval and ranking system and method for document using concept thesaurus
JPH0535798A (en) Data base retrieving device
JP3444223B2 (en) Database registration device
JP2004192221A (en) Document retrieval processing method and device, and recording medium with the method recorded
JPH1027125A (en) Document classifying device
JPH08278982A (en) Method for retrieving similar word or similar sentense

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040427

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040602

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040713

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070723

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080723

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090723

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090723

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100723

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110723

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120723

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120723

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130723

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees