JP3374946B2 - Search device - Google Patents

Search device

Info

Publication number
JP3374946B2
JP3374946B2 JP21606894A JP21606894A JP3374946B2 JP 3374946 B2 JP3374946 B2 JP 3374946B2 JP 21606894 A JP21606894 A JP 21606894A JP 21606894 A JP21606894 A JP 21606894A JP 3374946 B2 JP3374946 B2 JP 3374946B2
Authority
JP
Japan
Prior art keywords
attribute
search
evaluation value
storage unit
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21606894A
Other languages
Japanese (ja)
Other versions
JPH0877198A (en
Inventor
高志 湯川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP21606894A priority Critical patent/JP3374946B2/en
Publication of JPH0877198A publication Critical patent/JPH0877198A/en
Application granted granted Critical
Publication of JP3374946B2 publication Critical patent/JP3374946B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は、例えば図形や文字など
の認識のための入力パターンの特徴量とパターン辞書に
記憶されたデンプレート情報の照合、データベースにお
ける類似レコードの検索、知識処理の類推的推論におけ
る類似概念・類似規則の検索等のような情報照合および
情報検索に使用される検索装置に関する。 【0002】 【従来の技術】パターン認識やデータベース検索、知識
ベース検索などの情報照合や情報検索において、予め記
憶されたパターンのテンプレートやデータベースのレコ
ード、知識記述などに対し、入力パターンや検索要求に
完全には一致しなくとも、ある選考基準に従って最も好
ましいものを見つけ出したいという要求が多く存在す
る。このような情報照合や情報検索は、好ましさの度合
をスカラ量として表現できる評価関数を定義し、該評価
関数を最大とするものを照合結果や検索結果とすること
で実現するのが最も一般的である。この場合、評価関数
は、入力パターンや検索要求とし、記憶されたテンプレ
ートやレコードと、選考基準をユーザが指定するための
パラメータ(以下、パラメータと呼ぶ)との3つの変量
をひとつのスカラ量へ写像する関数となる。ここで、こ
れら3つの変量は一般に構造をもった量、すなわち複数
の名前や複数の量から構成される量である。記憶された
複数の要素の中から、与えられた検索要求とパラメータ
とに対し評価関数を最大にする要素を見つけ出すことを
最適要素検索と呼ぶことにする。 【0003】以下、データベースの類似レコードの検索
を例としてより具体的に説明する。図2に示すように、
ひとつの要素であるところのレコード201が見出し2
02とひとつまたは複数の属性名203−重み204の
組(この組を単に属性とも呼ぶ)の並びとで構成されて
いるデータベースがあり、該データベースのレコードと
同様の形式を持つ検索要求およびユーザの選考基準を表
すパラメータに対し、類似度の最も大きいレコードを該
データベースより検索することを考える。ここで、重み
204は実数値をとるものとする。 【0004】類似度は、該検索要求の属性の並びと、デ
ータベースのレコードの属性の並び、そしてパラメータ
とから計算される実数のスカラ量であり、これら三者が
共通して持つ属性名に関し、それらに対応する重みに基
づいて計算される。類似度の例としては、これら三者が
共通して持つ属性に関し、個々の属性について検索要求
とデータベースレコードの重みをかけ算し、そのかけ算
の結果をすべての共通属性について総和した値などが考
えられる。もちろん、ここで示した類似度は一例に過ぎ
ず、検索要求の属性並び、データベースのレコードの属
性並び、パラメータの属性並びの3つの変量から実数の
スカラ量を計算できる関数ならば、原理的にはどのよう
なものでもよい。 【0005】このような検索を行うために、図4に示す
ような検索装置が従来から実現されている。要素記憶部
101はデータベースのレコードを格納し、評価値計算
部103はユーザが与えた検索要求とパラメータとレコ
ードとから類似度を計算する。検索制御部104は検索
動作を司る部分であり、検索途中における類似度の最大
値を保持する最大評価値格納変数105と該類似度の最
大値を与えるレコードを保持する最適要素格納変数10
6とを内蔵し、以下のように動作する。 【0006】ユーザが検索要求とパラメータを与える
と、検索装置は、まず、該データベースからレコードを
ひとつ取り出して類似度を計算し、該評価値を最大評価
値格納変数105に格納し、該レコードを最適要素格納
変数106に格納する。続いて、該データベースからこ
れまで取り出されたことのない別のレコードを取り出
し、該評価関数を用いて類似度を計算し、最大評価値格
納変数105に格納された類似度の最大値と比較し、該
計算した類似度の方が大きければ該計算した類似度を最
大評価値格納変数105に格納するとともに、該取り出
したレコードを最適要素格納変数106に格納する。こ
のような、これまでに取り出されたことのないレコード
の取り出しと類似度の計算、大小比較とそれに基づく変
数の格納をすべてのレコードに対して繰り返した後、最
適要素格納変数106に格納されたレコードを検索結果
として出力する。このように、すべてのレコードを取り
出して評価関数を計算する検索装置を全走査型検索装置
と呼ぶ。全走査型検索装置は、検索要求が発生した時点
で、要素記憶部101に格納されたすべての要求に対し
類似度を計算するため、検索のたびに要素記憶部101
に格納された要素の数に比例した時間が必要となる。 【0007】検索時間を短縮するために、予めすべての
類似度を計算してソートした表を記憶領域に格納してお
く検索装置が考えられている。しかし、類似度は3個の
要素を変量としてとるため、すべての変量に対する類似
度を計算して作る表の規模は、要素記憶部に格納された
要素の3乗に比例することになる。 【0008】 【発明が解決しようとする課題】全走査型検索装置は、
要素記憶部に格納された要素すべてに対し評価関数を計
算するため、要素記憶部に格納された要素数に比例して
検索時間が増大する。このため、要素記憶部に格納され
た要素が多い場合に検索時間が長くかかるという問題が
あった。また、予めすべての類似度を計算しソートした
表を格納しておく検索装置では、検索時間は短縮できる
が、要素記憶部に格納された要素数の3乗に比例した規
模の記憶領域が必要となる。このように、従来の装置で
は、検索時間が多くかかるという問題があった。また、
これを解決しようすれば非常に大きな記憶領域が必要に
なるという問題があった。 【0009】本発明は、上記に鑑みてなされたもので、
その目的とするところは、小さな記憶領域をもって高速
に検索を行うことができる検索装置を提供することにあ
る。 【0010】 【課題を解決するための手段】上記目的を達成するた
め、本発明の検索装置は、属性名と重要度の組である属
性を1つ以上持つ要素を複数個格納した要素記憶部と、
任意の2つの要素および要素と同一構造のパラメータの
三者の間で属性名が一致した属性に関し、該属性の重要
度に基づいて評価値が決まる評価関数が定義されてお
り、該評価関数に従い評価値を計算する評価値計算部
と、検索要求として1つの要素と選考基準としてパラメ
ータとを与えた際に、検索要求として与えた要素以外の
すべての要素の中から評価値を最大とするような要素を
検索する検索制御部とを有する検索装置であって、前記
要素記憶部に格納された要素に含まれるすべての属性名
に関して、各属性名と該属性名を含む要素との対応の情
報を格納した属性索引記憶部を有し、前記検索制御部
は、検索要求としての要素と選考基準としてのパラメー
タとを与えられた際に、該要素と該パラメータとに共通
に含まれる属性名に関し、前記属性索引記憶部を参照し
て、該属性名を含む要素を前記要素記憶部から取り出
し、この取り出した要素の個々について評価値を計算
し、該評価値が最大の要素を選択することを要旨とす
る。 【0011】 【作用】本発明の検索装置では、要素記憶部に格納され
た要素に含まれるすべての属性名に関して、各属性名と
該属性名を含む要素との対応の情報を属性検索記憶部に
格納し、検索制御部は検索要求とパラメータを与えられ
た際に、属性索引記憶部を参照して、検索対象を該検索
要求と該パラメータとに共通に含まれる属性名を含む要
素のみに絞り込んで該要素を要素記憶部から取り出し、
この要素の個々について評価値を計算し、評価値が最大
の要素を選択している。 【0012】 【実施例】以下、図面を用いて本発明の実施例を説明す
る。 【0013】図1は、本発明の一実施例に係わる検索装
置の構成を示すブロック図である。同図において、要素
記憶部101は要素を格納する部分であり、図2に示す
ような構造の要素を格納し、任意の要素を外部からの要
求にしたがって取り出すことができるようになってい
る。評価値計算部103は、検索要求の要素と検索対象
の要素とパラメータとが外部より与えられた場合に、評
価関数に従って評価値を計算し外部に出力する。評価関
数としては、従来技術の項で例として説明した類似度関
数が代表的に考えられる。本実施例では、該類似度関数
を評価関数として用いて説明する。 【0014】属性索引記憶部102は、個々の属性名に
対し、該属性名を含む要素を羅列した情報を記憶する。
具体的には、図3に示すように、属性名と要素番号のリ
ストを記憶する方法が考えられる。しかし、ここに示し
た記憶内容の構造は本発明で本質的に規定されるもので
はなく、属性名と該属性名を含む要素との対応情報が記
憶できるのであれば、どのような構造でもかまわない。
検索制御部110は検索動作を司る部分であり、最大評
価値格納変数105、最適要素格納変数106、共通属
性リスト変数107を内蔵しており、ユーザが与えた検
索要求の要素に対し、ユーザが与えたパラメータのもと
で最大の評価値を得られる要素を要素記憶部101の中
から検索する。 【0015】以下、該検索制御部110の動作を図5に
示す処理流れ図を用いて詳細に説明する。 【0016】図5においては、まず、検索要求格納処理
ステップS601によりユーザからの検索要求の要素と
パラメータを受け付け、制御部内の変数として保持す
る。次に、格納変数初期化処理ステップS602におい
て最大評価値格納変数105を該評価値が取りうる最小
値以下に、最適要素格納変数106を「空」にそれぞれ
初期化する。本実施例における評価関数は0以上の値を
とるため、同図では最大評価値格納変数105を0に初
期化している。続いて、共通属性抽出処理ステップS6
03により、検索要求の要素とパラメータとが共通に持
つ属性名を抽出し、共通属性リスト変数107に格納す
る。以上までの各処理は、検索要求とパラメータが与え
られた直後から、検索処理の冒頭に一回だけ行われる。
これら処理の順番については、必要なデータが揃い処理
が可能な限りにおいて、上記と同一である必要はない。
例えば、共通属性抽出処理ステップS603を格納変数
初期化処理ステップS602よりも先に行ってもかまわ
ない。 【0017】以後の処理は、検索終了条件が成立するま
で繰り返される処理である。まず、共通属性名取り出し
処理ステップS604により、共通属性リスト変数10
7から属性名を1個取り出す。ここで以前に取り出され
た属性名は2度取り出すことはしない。続いて、要素情
報取り出し処理ステップS605において、該属性名に
基づいて属性索引記憶部102を参照し、該属性を含む
要素の情報を1個取り出す。この際、以前に取り出した
情報は2度取り出すことはしない。また、上述の説明に
あるように、本実施例では、要素の情報として要素番号
を用いる。要素取り出し処理ステップS606では、要
素情報取り出し処理ステップS605により取り出され
た要素番号に基づいて、要素記憶部101から該要素番
号に対応する要素を1個取り出す。要素を取り出した
ら、評価値計算処理ステップS607により、該取り出
された要素と検索要求の要素とパラメータの三者を評価
値計算部103に与えて評価値を得る。ここで得られた
評価値と最大評価値格納変数105に格納された評価値
とを比較し(比較処理ステップS613)、もしも該得
られた評価値が大きければ格納変数更新処理ステップS
608を行う。格納変数更新処理ステップS608で
は、最大評価値格納変数105に該得られた評価値を、
最適要素格納変数106には該取り出した要素を格納す
る。この際、以前に各変数に格納されていた値は消去す
る。 【0018】以上の要素情報取り出し処理ステップS6
05から格納変数更新処理ステップS608までの処理
を、ひとつの属性名について属性索引記憶部102から
該属性を含む要素が取り出せなくなるまで繰り返し(繰
り返し処理ステップS612)、該繰り返しを、共通属
性名取り出し処理ステップS604において共通属性リ
スト変数107から属性名が取り出せなくなるまで繰り
返す(繰り返し処理ステップS611)。繰り返しが終
了した時点で、最適要素格納変数106に格納された要
素が最適要素であり、その際の評価値は最大評価値格納
変数105に格納されているので、これを結果として出
力する。 【0019】このように、評価値が大きくなるために必
要な共通属性を持った要素のみを検索対象とすること
で、検索する要素を削減でき高速な検索が実現できる。 【0020】上述したように、本発明の検索装置では、
従来の全走査型検索装置の構成要素に加えて、格納され
た要素に含まれるすべての属性に関して、個々の属性名
と該属性名とを含む要素との対応に関する情報を格納し
た属性索引記憶部102を具備し、検索制御部110
は、従来方式のような全要素に対しての検索をするので
はなく、検索要求とパラメータが与えられた際に、属性
索引記憶部を参照することによって、検索対象を該検索
要求と該パラメータに共通に含まれる属性名を含む要素
のみに絞り込んで最適要素検索を行うことを特徴とす
る。 【0021】評価関数の値は、検索要求の要素とパラメ
ータ、そして検索対象の要素の三者に共通に含まれる属
性から計算されるため、三者共通に含まれない属性は評
価関数の値に影響を与えない。 【0022】そして、上述したように、評価関数の値が
大きくなる三者共通の属性を含む要素のみに検索対象を
絞り込む点が従来の全走査型検索装置と本質的に異なっ
ている。また、この検索対象の絞り込みのために、属性
名と該属性名を含む要素との対応情報を格納した属性索
引記憶部を構成要素として持つ点が従来方式との構成上
の差異である。 【0023】すなわち、本発明では、評価値を最大とす
る要素を検索する際に、属性索引記憶部を参照して検索
要求の要素とパラメータとが共通して持つ属性を含む要
素のみを検索対象とする。このため検索対象の要素を絞
り込むことができ、検索動作を通した評価値計算の回数
が減り、これによって最適要素検索が高速化される。ま
た、属性索引記憶部は、要素記憶部の情報を属性名に基
づいて並べかえた形式となるため、記憶容量は要素記憶
部と同程度ですむ。 【0024】なお、本実施例では、検索制御部110は
最大評価値と該最大評価値を与える要素を格納するため
に最大評価値格納変数105と最適要素格納変数106
を内蔵しているが、これは本発明において本質的に規定
されるものではなく、検索途中における最大評価値と該
最大評価値を与える要素を知ることができるならばどの
ような方法でもよい。例えば、事前評価値記憶部および
要素記憶部に格納された要素にフラグ領域をもたせ、最
大評価値を与える要素にフラグを立てるなどの方法も考
えられる。また、検索制御部110の動作についても本
実施例の流れ図に規定されるものではなく、属性索引記
憶部102の内容に基づいて検索要求要素とパラメータ
との共通属性を持つ要素のみを検索対象として検索を行
うならばどのような処理流れでもよい。 【0025】さらに、本実施例の構成図では、各部が独
立したモジュールとして表現されているが、これらが物
理的に独立している必要はない。例えば、プロセッサと
メモリからなるコンピュータを用いて、要素記憶部10
1、属性索引記憶部102、最大評価値格納変数10
5、最適要素格納変数106、共通属性リスト変数10
7の各機能をメモリに割り付け、評価値計算部103、
検索制御部110の各機能をプロセッサに割り付ける方
法などが考えられる。 【0026】 【発明の効果】以上説明したように、本発明によれば、
検索要求の要素とパラメータに基づき、多くの要素の中
から評価関数を最大とする要素を検索する場合に、要素
記憶部と同程度の記憶容量の属性索引記憶部を設け、該
属性索引記憶部に格納された情報に基づいて検索要求の
要素とパラメータとに共通の属性を持つ要素のみに検索
対象を限定して検索を行うため、要素が多い場合にも比
較的小さな記憶容量で高速に検索することができる。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to the collation of a feature amount of an input pattern for recognizing, for example, a figure or a character with template information stored in a pattern dictionary, and a database. The present invention relates to a search device used for information matching and information search, such as searching for similar records, searching for similar concepts / similar rules in analogous inference of knowledge processing, and the like. 2. Description of the Related Art In information collation and information retrieval such as pattern recognition, database retrieval, and knowledge base retrieval, input patterns and retrieval requests are applied to previously stored pattern templates, database records, and knowledge descriptions. Even if they do not match exactly, there are many demands to find the most favorable ones according to certain selection criteria. Such information collation and information retrieval are most realized by defining an evaluation function that can express the degree of preference as a scalar quantity, and using the evaluation function that maximizes the evaluation function as the collation result or search result. General. In this case, the evaluation function is an input pattern or a search request, and converts three variables of the stored template or record and a parameter (hereinafter referred to as a parameter) for a user to specify a selection criterion into one scalar quantity. It becomes a function to map. Here, these three variables are generally structured quantities, that is, quantities composed of a plurality of names and a plurality of quantities. Finding an element that maximizes the evaluation function for a given search request and parameter from a plurality of stored elements is referred to as optimal element search. [0003] A more specific description will be given below by taking a search for a similar record in a database as an example. As shown in FIG.
Record 201 which is one element is heading 2
02 and a sequence of one or a plurality of attribute names 203 and weights 204 (this pair is also simply referred to as an attribute), and a search request and a user request having the same format as the record of the database are provided. It is considered that a record having the highest similarity to the parameter representing the selection criterion is searched from the database. Here, the weight 204 takes a real value. [0004] The similarity is a real scalar quantity calculated from the sequence of attributes of the search request, the sequence of attributes of database records, and the parameters. Calculated based on their corresponding weights. As an example of the similarity, a value obtained by multiplying the search request and the weight of the database record for each attribute and summing up the result of the multiplication for all common attributes with respect to the attribute common to these three parties can be considered. . Of course, the similarity shown here is only an example, and if it is a function that can calculate a real scalar quantity from the three variables of the attribute list of the search request, the attribute list of the record of the database, and the attribute list of the parameter, May be any. In order to perform such a search, a search device as shown in FIG. 4 has been conventionally realized. The element storage unit 101 stores records of the database, and the evaluation value calculation unit 103 calculates the similarity from the search request, the parameter, and the record given by the user. The search control unit 104 is a part that controls the search operation, and stores a maximum evaluation value storage variable 105 that holds the maximum value of similarity during the search and an optimal element storage variable 10 that holds a record that gives the maximum value of the similarity.
6 and operates as follows. When the user gives a search request and parameters, the search device first retrieves one record from the database, calculates the similarity, stores the evaluation value in the maximum evaluation value storage variable 105, and stores the record in the maximum evaluation value storage variable 105. It is stored in the optimum element storage variable 106. Subsequently, another record that has not been retrieved is retrieved from the database, the similarity is calculated using the evaluation function, and compared with the maximum value of the similarity stored in the maximum evaluation value storage variable 105. If the calculated similarity is larger, the calculated similarity is stored in the maximum evaluation value storage variable 105, and the extracted record is stored in the optimum element storage variable 106. After fetching records that have not been fetched and calculating similarity, comparing the magnitudes and storing variables based on them, were repeated for all records, the records were stored in the optimal element storage variables 106. Output records as search results. Such a retrieval device that retrieves all records and calculates an evaluation function is called a full-scan retrieval device. The full-scan search device calculates the similarity for all the requests stored in the element storage unit 101 when the search request is generated.
Requires a time proportional to the number of elements stored in the. [0007] In order to shorten the search time, a search apparatus has been considered in which a table in which all similarities are calculated and sorted in advance is stored in a storage area. However, since the degree of similarity takes three elements as variables, the size of the table created by calculating the degrees of similarity for all variables is proportional to the cube of the elements stored in the element storage unit. [0008] The full-scan search device is
Since the evaluation function is calculated for all the elements stored in the element storage unit, the search time increases in proportion to the number of elements stored in the element storage unit. Therefore, there is a problem that the search time is long when there are many elements stored in the element storage unit. Further, in a search device that stores a table in which all similarities are calculated and sorted in advance, the search time can be reduced, but a storage area having a scale proportional to the cube of the number of elements stored in the element storage unit is required. Becomes As described above, the conventional device has a problem that a long search time is required. Also,
To solve this problem, a very large storage area is required. [0009] The present invention has been made in view of the above,
An object of the present invention is to provide a search device capable of performing a high-speed search with a small storage area. [0010] In order to achieve the above object, a retrieval apparatus according to the present invention comprises an element storage unit storing a plurality of elements each having at least one attribute which is a set of an attribute name and a degree of importance. When,
For an attribute whose attribute name matches between any two elements and a parameter having the same structure as the element, an evaluation function whose evaluation value is determined based on the importance of the attribute is defined. An evaluation value calculation unit that calculates an evaluation value, and when one element is given as a search request and a parameter is given as a selection criterion, the evaluation value is maximized from all elements other than the element given as the search request. A search control unit for searching for an element, and for all attribute names included in the element stored in the element storage unit, information on the correspondence between each attribute name and the element including the attribute name When the element as a search request and the parameter as a selection criterion are given, the search control unit relates to an attribute name commonly included in the element and the parameter. An element including the attribute name is extracted from the element storage unit with reference to the attribute index storage unit, an evaluation value is calculated for each of the extracted elements, and an element having the maximum evaluation value is selected. And According to the search device of the present invention, with respect to all the attribute names included in the elements stored in the element storage unit, information on the correspondence between each attribute name and the element including the attribute name is stored in the attribute search storage unit. When a search request and a parameter are given, the search control unit refers to the attribute index storage unit to limit the search target to only the element including the attribute name commonly included in the search request and the parameter. Refine and take out the element from the element storage unit,
The evaluation value is calculated for each of the elements, and the element having the highest evaluation value is selected. Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the configuration of a search device according to one embodiment of the present invention. In the figure, an element storage unit 101 is a part for storing elements, and stores elements having a structure as shown in FIG. 2 so that an arbitrary element can be extracted according to a request from the outside. The evaluation value calculation unit 103 calculates an evaluation value according to an evaluation function and outputs the evaluation value to the outside when the element of the search request, the element to be searched, and the parameter are given from outside. As the evaluation function, the similarity function described as an example in the section of the related art is typically considered. In this embodiment, the similarity function will be described as an evaluation function. The attribute index storage unit 102 stores, for each attribute name, information in which elements including the attribute name are listed.
Specifically, as shown in FIG. 3, a method of storing a list of attribute names and element numbers is conceivable. However, the structure of the storage content shown here is not essentially defined in the present invention, and any structure may be used as long as the correspondence information between the attribute name and the element including the attribute name can be stored. Absent.
The search control unit 110 is a part that controls the search operation, and incorporates a maximum evaluation value storage variable 105, an optimum element storage variable 106, and a common attribute list variable 107. The element that can obtain the maximum evaluation value under the given parameters is searched from the element storage unit 101. Hereinafter, the operation of the search control unit 110 will be described in detail with reference to a processing flowchart shown in FIG. In FIG. 5, first, in a search request storage processing step S601, elements and parameters of a search request from a user are received and held as variables in the control unit. Next, in a storage variable initialization processing step S602, the maximum evaluation value storage variable 105 is initialized to be equal to or less than the minimum value that the evaluation value can take, and the optimum element storage variable 106 is initialized to “empty”. Since the evaluation function in the present embodiment takes a value of 0 or more, the maximum evaluation value storage variable 105 is initialized to 0 in FIG. Subsequently, common attribute extraction processing step S6
In step 03, an attribute name that the element and the parameter of the search request have in common is extracted and stored in the common attribute list variable 107. The above processes are performed only once at the beginning of the search process immediately after the search request and the parameter are given.
The order of these processes does not need to be the same as described above, as long as necessary data is available and the processes can be performed.
For example, the common attribute extraction processing step S603 may be performed before the storage variable initialization processing step S602. The subsequent processing is repeated until the search termination condition is satisfied. First, the common attribute list variable 10
7 to extract one attribute name. Here, the previously extracted attribute name is not extracted twice. Subsequently, in the element information extraction processing step S605, the attribute index storage unit 102 is referred to based on the attribute name, and one piece of element information including the attribute is extracted. At this time, the previously extracted information is not extracted twice. Further, as described above, in this embodiment, an element number is used as element information. In the element retrieval processing step S606, one element corresponding to the element number is retrieved from the element storage unit 101 based on the element number retrieved in the element information retrieval processing step S605. When the element is extracted, in evaluation value calculation processing step S607, the extracted element, the element of the search request, and the parameter are given to the evaluation value calculation unit 103 to obtain an evaluation value. The evaluation value obtained here is compared with the evaluation value stored in the maximum evaluation value storage variable 105 (comparison processing step S613). If the obtained evaluation value is large, the storage variable update processing step S613 is performed.
608 is performed. In the storage variable update processing step S608, the obtained evaluation value is stored in the maximum evaluation value storage variable 105.
The extracted element is stored in the optimum element storage variable 106. At this time, the values previously stored in each variable are deleted. The above element information extraction processing step S6
05 to the stored variable update processing step S608 until the element including the attribute for one attribute name cannot be retrieved from the attribute index storage unit 102 (repetition processing step S612). The process is repeated until the attribute name cannot be extracted from the common attribute list variable 107 in step S604 (repetition processing step S611). At the end of the repetition, the element stored in the optimum element storage variable 106 is the optimum element, and the evaluation value at that time is stored in the maximum evaluation value storage variable 105, which is output as a result. As described above, by searching only elements having common attributes necessary for increasing the evaluation value, elements to be searched can be reduced and high-speed search can be realized. As described above, in the search device of the present invention,
Attribute index storage unit that stores, in addition to the constituent elements of the conventional all-scan search device, information on the correspondence between individual attribute names and elements including the attribute names for all attributes included in the stored elements. 102, a search control unit 110
Does not perform a search for all elements as in the conventional method, but when a search request and a parameter are given, refers to the attribute index storage unit to search for the search target and the parameter. It is characterized in that an optimum element search is performed by narrowing down to only elements including an attribute name that is commonly included in. Since the value of the evaluation function is calculated from the attributes and parameters of the search request and the attributes that are commonly included in the three elements to be searched, the attributes that are not commonly included in the three are included in the value of the evaluation function. Has no effect. As described above, the point that the search target is narrowed down to only the element including the attribute common to the three members where the value of the evaluation function becomes large is essentially different from the conventional full-scan search apparatus. Further, in order to narrow down the search target, a configuration difference from the conventional method is that an attribute index storage unit storing correspondence information between attribute names and elements including the attribute names is provided as a component. That is, in the present invention, when searching for the element having the maximum evaluation value, only the element including the attribute which is shared by the element of the search request and the parameter is searched by referring to the attribute index storage unit. And For this reason, elements to be searched can be narrowed down, and the number of evaluation value calculations through the search operation is reduced, thereby speeding up the optimum element search. Further, the attribute index storage unit has a format in which the information in the element storage unit is rearranged based on the attribute names, so that the storage capacity is almost the same as that of the element storage unit. In this embodiment, the search control unit 110 stores the maximum evaluation value storage variable 105 and the optimum element storage variable 106 to store the maximum evaluation value and the element giving the maximum evaluation value.
Is not essentially defined in the present invention, and any method may be used as long as the maximum evaluation value during the search and the element giving the maximum evaluation value can be known. For example, a method of giving a flag area to the elements stored in the pre-evaluation value storage unit and the element storage unit and setting a flag to the element giving the maximum evaluation value is also conceivable. Also, the operation of the search control unit 110 is not specified in the flowchart of the present embodiment. Any processing flow may be used if a search is performed. Further, in the configuration diagram of this embodiment, each unit is represented as an independent module, but it is not necessary that these units are physically independent. For example, using a computer including a processor and a memory, the element storage unit 10
1, attribute index storage unit 102, maximum evaluation value storage variable 10
5, optimal element storage variable 106, common attribute list variable 10
7 are allocated to the memory, and the evaluation value calculation unit 103
A method of allocating each function of the search control unit 110 to the processor can be considered. As described above, according to the present invention,
When searching for an element that maximizes the evaluation function from among a large number of elements based on the elements and parameters of the search request, an attribute index storage unit having the same storage capacity as the element storage unit is provided. Based on the information stored in the search request, the search is limited to only the elements having the common attribute to the elements and parameters of the search request. Therefore, even if there are many elements, the search can be performed quickly with a relatively small storage capacity. can do.

【図面の簡単な説明】 【図1】本発明の一実施例に係わる検索装置の構成を示
すブロック図である。 【図2】要素の記憶形態の一例を示す図である。 【図3】属性索引記憶部の記憶形態の一例を示す図であ
る。 【図4】従来の検索装置の構成を示すブロック図であ
る。 【図5】図1に示す実施例の検索装置の作用を示すフロ
ーチャートである。 【符号の説明】 101 要素記憶部 102 属性索引記憶部 103 評価値計算部 105 最大評価値格納変数 106 最適要素格納変数 107 共通属性リスト変数 110 検索制御部
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing a configuration of a search device according to one embodiment of the present invention. FIG. 2 is a diagram showing an example of an element storage mode. FIG. 3 is a diagram illustrating an example of a storage form of an attribute index storage unit. FIG. 4 is a block diagram showing a configuration of a conventional search device. FIG. 5 is a flowchart showing the operation of the search device of the embodiment shown in FIG. [Description of Signs] 101 element storage unit 102 attribute index storage unit 103 evaluation value calculation unit 105 maximum evaluation value storage variable 106 optimal element storage variable 107 common attribute list variable 110 search control unit

フロントページの続き (56)参考文献 特開 平7−85068(JP,A) 特開 平6−162099(JP,A) 湯川高志,笠原要,松澤和光,石川 勉,アバウト推論:多観点概念ベースに おける類似概念検索の高速化,情報処理 学会第47回(平成5年後期)全国大会講 演論文集(3),情報処理学会,1997年 9月27日,pp.51−58 湯川高志,笠原要,類似概念の高速検 索手法,情報処理学会第49回(平成6年 後期)全国大会講演論文集(3),1994 年9月20日,pp.75−76 松澤和光,石川勉,湯川高志,河岡 司,アバウト推論方式の基本構想につい て,電子情報通信学会技術研究報告(A I93−77),1994年1月20日,第93巻, 第424号,pp.41−48 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)Continuation of the front page (56) References JP-A-7-85068 (JP, A) JP-A-6-162099 (JP, A) Takashi Yukawa, Kaname Kasahara, Kazumitsu Matsuzawa, Tsutomu Ishikawa, About inference: Multi-perspective concept base Acceleration of Similarity Concept Retrieval in IPSJ, The 47th Annual Meeting of the Information Processing Society of Japan (late 1993), National Symposium on Informatics (3), Information Processing Society of Japan, September 27, 1997, pp. 51-58 Takashi Yukawa, Kaname Kasahara, High-speed Search Method for Similar Concepts, IPSJ 49th (Late 1994) National Conference Proceedings (3), September 20, 1994, pp. 75-76 Kazumitsu Matsuzawa, Tsutomu Ishikawa, Takashi Yukawa, Tsukasa Kawaoka, About the Basic Concept of About Inference Method, IEICE Technical Report (AI93-77), January 20, 1994, Vol. 93, No. 93. No. 424, p. 41-48 (58) Field surveyed (Int. Cl. 7 , DB name) G06F 17/30 JICST file (JOIS)

Claims (1)

(57)【特許請求の範囲】 【請求項1】 属性名と重要度の組である属性を1つ以
上持つ要素を複数個格納した要素記憶部と、任意の2つ
の要素および要素と同一構造のパラメータの三者の間で
属性名が一致した属性に関し、該属性の重要度に基づい
て評価値が決まる評価関数が定義されており、該評価関
数に従い評価値を計算する評価値計算部と、検索要求と
して1つの要素と選考基準としてパラメータとを与えた
際に、検索要求として与えた要素以外のすべての要素の
中から評価値を最大とするような要素を検索する検索制
御部とを有する検索装置であって、 前記要素記憶部に格納された要素に含まれるすべての属
性名に関して、各属性名と該属性名を含む要素との対応
の情報を格納した属性索引記憶部を有し、 前記検索制御部は、検索要求としての要素と選考基準と
してのパラメータとを与えられた際に、該要素と該パラ
メータとに共通に含まれる属性名に関し、前記属性索引
記憶部を参照して、該属性名を含む要素を前記要素記憶
部から取り出し、この取り出した要素の個々について評
価値を計算し、該評価値が最大の要素を選択することを
特徴とする検索装置。
(57) [Claim 1] An element storage unit storing a plurality of elements having at least one attribute which is a set of an attribute name and a degree of importance, and arbitrary two elements and the same structure as the elements An evaluation function whose evaluation value is determined based on the importance of the attribute is defined for an attribute whose attribute name matches among the three parameters, and an evaluation value calculation unit that calculates the evaluation value according to the evaluation function. A search control unit that searches for an element that maximizes an evaluation value among all elements other than the element given as a search request when one element is given as a search request and a parameter is given as a selection criterion. A search device having an attribute index storage unit that stores information on correspondence between each attribute name and an element including the attribute name for all attribute names included in the element stored in the element storage unit . The search control unit includes: When given as an element and a parameter as a selection criterion, regarding an attribute name commonly included in the element and the parameter, referring to the attribute index storage unit, the element including the attribute name is referred to as A retrieval apparatus, wherein the retrieval unit retrieves an element from an element storage unit, calculates an evaluation value for each of the retrieved elements, and selects an element having the maximum evaluation value.
JP21606894A 1994-09-09 1994-09-09 Search device Expired - Fee Related JP3374946B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21606894A JP3374946B2 (en) 1994-09-09 1994-09-09 Search device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21606894A JP3374946B2 (en) 1994-09-09 1994-09-09 Search device

Publications (2)

Publication Number Publication Date
JPH0877198A JPH0877198A (en) 1996-03-22
JP3374946B2 true JP3374946B2 (en) 2003-02-10

Family

ID=16682771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21606894A Expired - Fee Related JP3374946B2 (en) 1994-09-09 1994-09-09 Search device

Country Status (1)

Country Link
JP (1) JP3374946B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3353265B2 (en) * 1996-02-15 2002-12-03 日本電信電話株式会社 Similarity search method and apparatus

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06162099A (en) * 1992-11-25 1994-06-10 Nippon Telegr & Teleph Corp <Ntt> Method for discriminating similarity based on view point
JP3348314B2 (en) * 1993-09-13 2002-11-20 日本電信電話株式会社 Search device

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
松澤和光,石川勉,湯川高志,河岡司,アバウト推論方式の基本構想について,電子情報通信学会技術研究報告(AI93−77),1994年1月20日,第93巻,第424号,pp.41−48
湯川高志,笠原要,松澤和光,石川勉,アバウト推論:多観点概念ベースにおける類似概念検索の高速化,情報処理学会第47回(平成5年後期)全国大会講演論文集(3),情報処理学会,1997年9月27日,pp.51−58
湯川高志,笠原要,類似概念の高速検索手法,情報処理学会第49回(平成6年後期)全国大会講演論文集(3),1994年9月20日,pp.75−76

Also Published As

Publication number Publication date
JPH0877198A (en) 1996-03-22

Similar Documents

Publication Publication Date Title
JP3026712B2 (en) Image search method and apparatus
US4785400A (en) Method for processing a data base
JP3087694B2 (en) Information retrieval device and machine-readable recording medium recording program
JPH11212980A (en) Production of index and retrieval method
JP2792293B2 (en) Information retrieval device
JP3315781B2 (en) User information management device, information filter, information classification device, information reproduction device, information search device, and kana-kanji conversion device
US6334129B1 (en) Data processing apparatus and method
JP3374946B2 (en) Search device
JP3418876B2 (en) Data base search apparatus and method
JPH11213004A (en) Data processor, its method and storage medium storing data processing program
JP2020071678A (en) Information processing device, control method, and program
JPH07146880A (en) Document retrieval device and method therefor
JPH05266085A (en) Method and device for similar retrieval using dynamic concept dictionary
JPH08329101A (en) Data base system
JP2001134584A (en) Method and device for retrieving similar data and similar data retrieving program recording medium
JP3348314B2 (en) Search device
JP3395232B2 (en) Search item determination method
JPH08305711A (en) Method and device for retrieving information
JP3019286B2 (en) Document search device
JPH11232283A (en) Information retrieving method
JP3019780B2 (en) Similar name search device
JPH06180717A (en) Data base retrieving system
JP3111081B2 (en) Data retrieval device
JPH11306201A (en) Image retrieval device and method and computer readable memory
JPS62159223A (en) Retrieving system for document information

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071129

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081129

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees