JP5225350B2 - Information retrieval device - Google Patents
Information retrieval device Download PDFInfo
- Publication number
- JP5225350B2 JP5225350B2 JP2010217691A JP2010217691A JP5225350B2 JP 5225350 B2 JP5225350 B2 JP 5225350B2 JP 2010217691 A JP2010217691 A JP 2010217691A JP 2010217691 A JP2010217691 A JP 2010217691A JP 5225350 B2 JP5225350 B2 JP 5225350B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- concept
- network
- keyword
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明の実施形態は、例えばキーワード指定による検索条件を満たす情報を出力する情報検索装置に関する。 Embodiments described herein relate generally to an information search apparatus that outputs information that satisfies a search condition by keyword specification, for example.
情報検索の分野においては、必要な情報を過不足なく取得するという課題があり、何らかの形でキーワード(単語)を用いる情報検索においては、キーワード間の関係を検索精度の向上に利用する技術が多く用いられている。 In the field of information retrieval, there is a problem of acquiring necessary information without excess or deficiency, and in information retrieval using keywords (words) in some form, there are many techniques that use the relationship between keywords to improve search accuracy. It is used.
キーワード間の関係を処理する検索技術としては、(1)AND、OR、NOTなどの論理演算子を用いてキーワードの出現条件を詳細に指定することを可能にしたり、(2)例えば文書検索であればキーワードが出現する段落を指定するなど、検索対象におけるキーワードの位置付けを指定することで、検索実行者が求める情報の条件をより正確に表現できるようにする手法が知られている。しかし、これらの手法はキーワードの有無判定を厳密に行う点での向上でしかなく、検索対象の情報におけるキーワード間の関係までは扱っていなかった。例えば、「計算機を対象とした発明」を想定した場合であっても、「発明を用いた計算機」を想定した場合であっても、従来方式のキーワード指定型検索装置では「計算機 AND 発明」あるいは「発明 AND 計算機」などとしか検索条件を表現できず、その違いを検索処理に反映できないという問題があった。 Search techniques for processing the relationship between keywords include: (1) It is possible to specify the keyword appearance conditions in detail using logical operators such as AND, OR, NOT, and (2) There is known a technique that can express the condition of information required by the searcher more accurately by specifying the position of the keyword in the search target, for example, by specifying the paragraph in which the keyword appears. However, these methods only improve in terms of strictly determining the presence / absence of keywords, and do not deal with the relationship between keywords in search target information. For example, even if “invention intended for computers” is assumed or “computers using the invention” is assumed, the conventional keyword specification type search device uses “computer AND invention” or There is a problem that the search condition can only be expressed as “invention AND computer” and the difference cannot be reflected in the search processing.
上記問題の解決に向け、自然言語文を検索条件として受け付け、そこに含まれるキーワード間の係り受け関係によって条件判定を行う検索装置が提案されている。しかし、係り受け関係によって条件判定を行う検索装置は、キーワードのみを列挙することで表現された検索条件には対応していない。例えば、自然言語文(節)を対象として係り受け解析を行うものであり、当該データには品詞による係り受け構造が内包されていなければならないという問題があった。 In order to solve the above problem, a search device has been proposed in which a natural language sentence is received as a search condition and a condition is determined based on a dependency relationship between keywords included therein. However, a search device that performs condition determination based on the dependency relationship does not support search conditions expressed by enumerating only keywords. For example, dependency analysis is performed on a natural language sentence (clause), and there is a problem that a dependency structure based on parts of speech must be included in the data.
さらに、係り受け解析は自然言語文(節)中の文法上の関係を利用するものであり、それは必ずしも意味上の関係と一致しない。例えば、「赤い車」と「赤い色の車」と「色の赤い車」が意味するところは同じであるが、これらの係り受け構造は全て異なり、しかも、「赤い車」のみ“色”に関するキーワードが含まれていない。そのため、例えば「赤い車」を条件として係り受け解析を応用した検索判定を行う場合、「色の赤い車」は “赤い”が“車”に係る構造になっているため条件を満たすが、「赤い色の車」は“赤い”が“色の”に係る構造であるため、構造が一致せず、条件を満たさないと判定されてしまう。このように、同じだと判定できるキーワードによって同じ係り受け構成で指定されていなければ、同じ意味構造だと判定できないことは、検索再現率が低下する原因となるという問題があった。 Furthermore, dependency analysis uses grammatical relationships in natural language sentences (sections), which do not necessarily coincide with semantic relationships. For example, “red car”, “red car” and “red car” mean the same thing, but their dependency structures are all different, and only “red car” is related to “color”. The keyword is not included. Therefore, for example, when performing a search determination using dependency analysis under the condition of “red car”, “red car” satisfies the condition because “red” has a structure related to “car”. Since “red” is a structure related to “red” in “color”, the structure does not match and it is determined that the condition is not satisfied. As described above, if the same dependency structure is not specified by a keyword that can be determined to be the same, it cannot be determined that the semantic structure is the same, which causes a reduction in search recall.
一方、文法上の関係ではなく、キーワード間の意味関係を用いて情報検索を行う装置がある。しかし、当該装置では検索条件として指定する意味関係を検索実行者が自ら構築しなければならず、係り受け解析による検索装置と同様、キーワード指定によって検索条件を受け付ける他の情報検索システムとは互換性がないという問題があった。 On the other hand, there is an apparatus that performs information retrieval using a semantic relationship between keywords instead of a grammatical relationship. However, in this device, the searcher must construct the semantic relationship specified as the search condition by himself / herself, and it is compatible with other information search systems that accept search conditions by specifying keywords as well as search devices by dependency analysis. There was no problem.
一方、検索実行者が指定したキーワードのみを検索条件として受け付け、当該キーワード間の関係を統計的に処理することで、検索精度を向上させる技術として、概念検索を用いた技術がある。この概念検索は、与えられた学習データ内でのキーワード共起頻度などからキーワード間の距離を算出しておき、これを利用して検索対象と検索条件との距離を求め、検索条件に近い検索対象を、条件を満たすものとして出力するものである。しかし、概念検索に代表されるような、統計上の評価結果を用いた検索手法では、“似ている”度合いや“関連がある”度合いを抽象化した定量比較によって条件判定を行うため、当該手法による情報検索装置は、あるデータが検索条件を満たすか否かの判定を、検索対象となるデータ全体における相対的な関係から行うことしか出来ない。そのことは、ある対象が検索条件を満たすか否かの結果が、登録されている他のデータによって変わってしまうという事態に繋がりかねない。また、条件を満たすか否かを判断する固定的な閾値を別途用意しなければ、「○○件が条件に該当し、○○件は該当しない」など、登録データには左右されない決定的な評価を行う事もできない。しかし、そのような閾値は人間が直感的に指定できるものではないため、検索実行者に受け入れられる結果となるまでには、試行錯誤しながら閾値の調整を繰り返すという極めてコストの高い作業を行わなければならない。 On the other hand, there is a technique using concept search as a technique for improving the search accuracy by accepting only a keyword designated by a search performer as a search condition and statistically processing the relationship between the keywords. In this conceptual search, the distance between keywords is calculated from the keyword co-occurrence frequency in the given learning data, and the distance between the search target and the search condition is obtained using this, and the search is close to the search condition. The target is output as satisfying the condition. However, in a search method using statistical evaluation results as represented by concept search, condition determination is performed by quantitative comparison that abstracts the degree of “similarity” or “relevance”. The information search apparatus using the technique can only determine whether or not certain data satisfies the search condition from the relative relationship in the entire data to be searched. This may lead to a situation in which the result of whether or not a certain object satisfies the search condition changes depending on other registered data. In addition, unless a fixed threshold value is separately prepared to determine whether or not the condition is satisfied, a decisive factor that does not depend on the registered data, such as “XX cases are applicable and XX cases are not applicable”. It is not possible to evaluate. However, since such a threshold value cannot be intuitively specified by humans, it is necessary to perform an extremely expensive operation of repeatedly adjusting the threshold value through trial and error until a result that can be accepted by a searcher is obtained. I must.
本発明は、再現率および適合率の高い検索を低コストで可能にする情報検索装置を提供する。 The present invention provides an information search apparatus that enables a search with a high recall and relevance rate at a low cost.
本発明の実施形態としての情報検索装置は、オントロジーデータベースと、検索対象データベースと、インデックスキーワードデータベースと、検索条件受付部と、意味ネットワーク生成部と、検索条件ネットワーク生成部と、インデックスネットワーク生成部と、検索条件判定部と、検索結果出力部とを備える。 An information search apparatus as an embodiment of the present invention includes an ontology database, a search target database, an index keyword database, a search condition reception unit, a semantic network generation unit, a search condition network generation unit, and an index network generation unit. A search condition determination unit and a search result output unit.
前記オントロジーデータベースは、複数の概念を表し階層状に接続された複数のノードと、それぞれ2つのノード間を接続し前記2つのノードに対応する概念間の関係を表す複数の方向付きのリンクとをもつ第1オントロジーと、複数の前記関係を表し階層状に接続された複数のノードを有する第2オントロジーとを表現する。 The ontology database includes a plurality of nodes representing a plurality of concepts and connected in a hierarchy, and a plurality of directional links that connect the two nodes and represent the relationship between the concepts corresponding to the two nodes. And a second ontology having a plurality of nodes representing a plurality of the relations and connected in a hierarchical manner.
検索対象データベースは、複数の検索対象データを記憶する。 The search target database stores a plurality of search target data.
前記インデックスキーワードデータベースは、前記検索対象データ毎にインデックスキーワードのリストを記憶する。 The index keyword database stores a list of index keywords for each search target data.
前記検索条件受付部は、利用者が検索条件として指定した検索キーワードのリストを受け付ける。 The search condition receiving unit receives a list of search keywords specified as a search condition by a user.
前記意味ネットワーク生成部は、複数のキーワードを受け取り、受け取ったキーワードに対応する概念または関係を表すノードまたはリンクを前記第1オントロジーにおいて特定し、特定したノードまたはリンク間をつなぐ経路を前記第1オントロジー内のノードとリンクを辿って探索し、前記特定したノードまたはリンクを、探索により見つけた経路で接続した意味ネットワークを生成する。 The semantic network generation unit receives a plurality of keywords, specifies a node or link representing a concept or relationship corresponding to the received keyword in the first ontology, and a path connecting between the specified nodes or links to the first ontology. A semantic network in which the identified node or link is connected by the route found by the search is generated by tracing the node and the link.
前記検索条件ネットワーク生成部は、前記検索条件受付部で受け付けた検索キーワードを前記キーワードとして前記意味ネットワーク生成部に与え、前記意味ネットワーク生成部で生成される意味ネットワークを検索条件ネットワークとして取得する。 The search condition network generation unit gives the search keyword received by the search condition reception unit as the keyword to the semantic network generation unit, and acquires the semantic network generated by the semantic network generation unit as a search condition network.
前記インデックスネットワーク生成部は、前記検索対象データ毎に前記リストに含まれるインデックスキーワードを前記キーワードとして前記意味ネットワーク生成部に与え、前記意味ネットワーク生成部で生成される意味ネットワークをインデックスネットワークとして取得する。 The index network generation unit gives an index keyword included in the list for each search target data as the keyword to the semantic network generation unit, and acquires the semantic network generated by the semantic network generation unit as an index network.
前記検索条件判定部は、前記検索条件ネットワークと同一の構造、もしくは前記検索条件ネットワークに含まれる任意のノードまたはリンクを下位概念または下位関係を表すノードまたはリンクに置換したものと同一の構造、を含むインデックスネットワークを、前記インデックスネットワーク生成部により生成されたインデックスネットワークの中から検出する。 The search condition determination unit has the same structure as the search condition network, or the same structure as that obtained by replacing any node or link included in the search condition network with a node or link representing a lower concept or a lower relationship. An index network including the index network is detected from the index networks generated by the index network generation unit.
前記検索結果出力部は、前記検索条件判定部で検出したインデックスネットワークに対応する検索対象データを前記検索対象データベースから取得し、取得した検索対象データを出力する。 The search result output unit acquires search target data corresponding to the index network detected by the search condition determination unit from the search target database, and outputs the acquired search target data.
本発明の実施形態は、キーワード指定による検索条件を満たす情報を出力する情報検索装置において、検索条件として指定されたキーワード間の意味的な関係をオントロジーに基づいて解析し、これを検索判定で用いることで検索精度を高め、データの共用性、再利用性を向上させるための技術に関するものである。 Embodiments of the present invention analyze an semantic relationship between keywords specified as a search condition based on an ontology in an information search apparatus that outputs information that satisfies a search condition based on keyword specification, and use this in search determination. The present invention relates to a technique for improving search accuracy and improving data sharing and reusability.
より詳しくは、本発明の実施形態は、以下の機能を有する情報検索装置に関する。 More specifically, the embodiment of the present invention relates to an information search apparatus having the following functions.
1)検索条件として列挙されたキーワード、および、その語順を受け付け、オントロジーを参照して、当該キーワードに対応する概念または関係が含まれる意味ネットワーク(検索条件ネットワーク)を生成する機能
2)検索対象にインデックスとして付与されたキーワード、および、その語順を受け付け、オントロジーを参照して、当該キーワードに対応する概念または関係が含まれる意味ネットワーク(インデックスネットワーク)を生成する機能
3)上記1)で生成した検索条件ネットワークを上記2)で生成したインデックスネットワークが包含するか否かによって、検索条件を満たすか否かを判定する機能
4)上記1)で受け付けたキーワード、および、その語順に対して条件判定を行う検索対象を選択し、上記3)によって検索条件を満たすと判定された検索対象を、条件を満たす対象として出力する機能
1) A function that accepts keywords listed as search conditions and their word order, and refers to the ontology to generate a semantic network (search condition network) that includes concepts or relationships corresponding to the keywords.
2) A function that accepts keywords assigned as indexes to search targets and their word order, and refers to the ontology to generate a semantic network (index network) that includes concepts or relationships corresponding to the keywords.
3) A function that determines whether or not the search condition is satisfied depending on whether or not the search condition network generated in 1) above is included in the index network generated in 2) above.
4) Select the keyword received in 1) above and the search target that performs condition determination for the word order, and output the search target determined as satisfying the search condition in 3) above as the condition satisfied function
本発明の実施形態の概要を述べると以下の通りである。 The outline of the embodiment of the present invention will be described as follows.
(1)キーワード指定による情報検索において必要な情報を過不足なく取得するという課題において、検索条件として指定されたキーワードから、その間にある意味的な関係の種類、および、関係の方向、また、関連する他のキーワードを同定し、これらから生成される意味ネットワークを検索条件として判定を行うことにより、キーワード個別の有無判定による従来方式よりも再現率や適合率の高い検索を可能にする。 (1) In the issue of acquiring information necessary for information search by keyword specification without excess or deficiency, from the keyword specified as the search condition, the type of semantic relationship between them, the direction of the relationship, and the relationship By identifying other keywords to be used and making a determination using a semantic network generated therefrom as a search condition, it is possible to perform a search with a higher recall and relevance rate than the conventional method based on the presence / absence determination of each keyword.
(2)オントロジーを参照し、検索条件として指定されたキーワードの種類および語順に応じて、関連付けるキーワード間の関係の種類および方向の解析手順を変えることにより、品詞を伴ったテキストデータを入力しなければキーワード間の関係を解析できないという従来方式の欠点を補い、列挙されたキーワードのみを検索条件として受け付け、その間にある関係を解析出来るようにする。 (2) Refer to the ontology and enter text data with parts of speech by changing the analysis procedure for the type and direction of the relationship between the keywords to be associated according to the type and word order of the keywords specified as the search conditions. For example, it compensates for the disadvantage of the conventional method that the relationship between keywords cannot be analyzed, and accepts only enumerated keywords as a search condition so that the relationship between them can be analyzed.
(3)オントロジーを参照し、必要に応じては暗黙的に含まれている意味を表わすキーワードを補いながら、キーワード間の関係を解析することにより、暗黙的な意味内容を同定できる程度にキーワードを指定すれば、異なるキーワードの組から同じ意味構造を導出して処理する。 (3) By referring to the ontology and supplementing the keywords that represent the meanings that are implicitly included as necessary, the keywords are selected to such an extent that the implicit semantic content can be identified by analyzing the relationship between the keywords. If specified, the same semantic structure is derived from different keyword pairs and processed.
(4)列挙されたキーワードを検索条件として受け付け、その間にある意味関係を推定することを可能とすることにより、検索実行者が直接キーワード間の関係を指定しなければならない従来方式の欠点を補い、入力の手間を軽減し、かつ、キーワード指定によって検索条件を受け付ける他の情報検索システムとの互換性を保つ。 (4) By accepting enumerated keywords as search conditions and estimating the semantic relationship between them, it compensates for the drawbacks of the conventional method in which the searcher must directly specify the relationship between keywords. This saves input time and maintains compatibility with other information retrieval systems that accept search conditions by specifying keywords.
(5)キーワード間の関係の種類を扱い、ある対象が検索条件を満たすか否かを、特定キーワード間に特定種類の関係があるか否かで判定することにより、検索対象範囲の影響を受ける相対的な評価しか行えない従来手法の欠点や、判定基準の調整作業が必要となる従来手法の欠点を補い、利用するオントロジーさえ変わらなければ、検索条件と個々の判定対象のみを用いて検索条件判定を行うことが可能であり、しかも、判定基準の調整作業が必要ない検索を実現する。 (5) Handles the type of relationship between keywords, and determines whether a target satisfies the search condition by determining whether there is a specific type of relationship between specific keywords. To compensate for the disadvantages of the conventional method that can only perform relative evaluations and the disadvantages of the conventional method that requires adjustment work of judgment criteria, and the ontology to be used does not change, the search condition and only the individual judgment objects are used. It is possible to make a determination, and to achieve a search that does not require adjustment work of the determination criteria.
以下、図面を参照しながら、本発明の実施形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図1〜図4は、本発明の実施形態を示すブロック図である。このうち、図1は本実施形態における情報検索装置全体の内部構成を表しており、図2は図1におけるインデックスネットワーク処理部7の内部構成を表しており、図3は図1における検索処理部9の内部構成を表しており、図4は図1における意味ネットワーク生成部3の内部構成を表したものである。
1 to 4 are block diagrams showing an embodiment of the present invention. Among these, FIG. 1 shows the internal configuration of the entire information search apparatus in the present embodiment, FIG. 2 shows the internal configuration of the index
本実施形態においては、図5に示すオントロジー100があらかじめオントロジーDB1に記録されているものとする。オントロジーとは、システムが対象とする世界に登場する概念や関係を表わしたものである。オントロジーは、データ構造の面からは、概念をノードとし、関係をリンクとするグラフネットワークとして表現することが出来る。オントロジーの記録方法、および、オントロジーの処理方法については、例えばW3C(World Wide Web Consortium)が策定したオントロジー記述言語OWL(Web Ontology Language)を用いてオントロジーを表現しておき、 Jena(URL:http://jena.sourceforge.net/)やThe OWL API(URL:http://owlapi.sourceforge.net/)などの公知技術を用いて内容を管理・処理してもよい。オントロジーDB1は、表形式のメモリ構造を用いてオントロジー100のネットワークを記録してもよいし、構造化ドキュメントを保持できるDB(XML DBなど)であれば、OWL記述をそのままDB内で記録してもよい。
In the present embodiment, the ontology 100 shown in FIG. 5 is recorded in the
図5のオントロジー100の詳細を説明する。オントロジー100は、エレベータに係わる概念体系を表したオントロジー(第1オントロジー)と、関係に関する概念体系を表したオントロジー(第2オントロジー)とを含んでいる。図中の四角は1つの概念に対応しており、四角の中の文字列は概念のラベルを表わしている。 Details of ontology 100 in FIG. 5 will be described. The ontology 100 includes an ontology (first ontology) representing a conceptual system related to an elevator and an ontology (second ontology) representing a conceptual system related to a relationship. A square in the figure corresponds to one concept, and a character string in the square represents a concept label.
第1オントロジーでは、エレベータに関する複数の概念が階層状に結合されており、親子関係にある概念間には、一般−特殊関係(is-a関係)を表すリンクが設定されている。たとえば「ギヤレスエレベータはエレベータを特殊化したものである」、および「大理石は材種を一般化したものである」などと表現される。また第1オントロジーでは非親子間の概念間にも方向付き矢印のリンクが設定されているものがある。このリンクが表す関係は、付与された<>付きのタグで表現されている。たとえば「板」は、「材種」と、「素材」という関係で結ばれている。ここで一般−特殊関係には推移律が成り立つ。「ギヤレスエレベータはエレベータを特殊化したものである」および「エレベータはモノを特殊化したものである」ことから、「ギヤレスエレベータはモノを特殊化したものである」という関係が成り立つものとみなす(継承)。 In the first ontology, a plurality of elevator-related concepts are combined in a hierarchical manner, and a link representing a general-special relationship (is-a relationship) is set between concepts in a parent-child relationship. For example, “gearless elevators are specialized elevators” and “marble is a generalized grade”. In the first ontology, a link with a directional arrow is also set between concepts between non-parents. The relationship represented by this link is represented by an attached tag with <>. For example, “board” is connected with “material type” and “material”. Here, the transition rule holds for the general-special relationship. Since “gearless elevator is a specialization of elevator” and “elevator is a specialization of things”, it is considered that the relationship of “gearless elevator is a specialization of things” is established ( Inheritance).
第2オントロジーでも、関係に関する複数の概念が階層状に結合されており、親子関係にある概念間には、一般−特殊関係(is-a関係)を表すリンクが設定されている。第2オントロジーに含まれる概念は、最上位概念が「関係」であり、その下位にある概念はすべて、第1オントロジーの非親子の関係にある概念間に設定された関係である。第1オントロジーと同様、推移律が成り立つ。 Also in the second ontology, a plurality of concepts related to relationships are combined in a hierarchical manner, and a link representing a general-special relationship (is-a relationship) is set between concepts in a parent-child relationship. The concepts included in the second ontology are “relationships” at the topmost concept, and all the concepts below it are relationships set between the concepts in the non-parent-child relationship of the first ontology. Similar to the first ontology, the transition rule holds.
本実施形態ではオントロジー100は、図6の概念テーブル110および図7の関係テーブル120の形式で記録されている。 In the present embodiment, the ontology 100 is recorded in the format of the concept table 110 in FIG. 6 and the relationship table 120 in FIG.
検索対象DB4には、検索対象となるデータが、検索対象データテーブル200の表形式(図10)であらかじめ記録されている。各検索対象データに対してインデックスキーワードが付与されている。それらは図11に示すインデックスキーワードテーブル210の表形式でインデックスキーワードDB5に記録されているものとする。
In the
以下、処理S0000から始まる図38のフローに沿って、本実施形態の情報検索の処理フローについて説明する。 The information search processing flow of this embodiment will be described below along the flow of FIG. 38 starting from processing S0000.
(処理S0001)
インデックスネットワーク処理部7が、処理S0300(後述する図41)を実行し、検索対象の各データに対応するインデックスネットワークを生成する。
(Processing S0001)
The index
本実施形態においては、図10の検索対象ID2100、2200、2300の検索対象データに対して、それぞれ、図12、図13、図14に示す内容のインデックスネットワーク310、320、330が生成され、インデックスネットワークDB72(図2)に記録される。なお、本実施形態において、インデックスネットワークは図15と図16に示す構成の表形式でインデックスネットワークDB72に記録されるものとし、例えば、インデックスネットワーク310は、概念インスタンステーブル311と概念インスタンステーブル312に示すレコードで記録されるものとする。
In the present embodiment,
ここで、概念インスタンスおよび関係インスタンスとは、本実施形態における意味ネットワーク(検索条件ネットワークまたはインデックスネットワーク)を構成するノードおよびリンクである。概念インスタンスと関係インスタンスは、それぞれ、オントロジーで記述された概念または関係の1つを参照する。例えば、図15の概念インスタンステーブル311 における概念インスタンス「3101」のレコードは、当該概念インスタンスが検索対象ID「2100」(図10)の検索対象データに対して生成されたインデックスネットワークのノードであり、かつ、オントロジーで定義された概念「ギヤレスエレベータ」(概念ID117)(図6)を参照するものであることを記録したものである。また、図16の例えば関係インスタンステーブル312における関係インスタンス「3121」のレコードは、当該関係インスタンスが検索対象ID「2100」(図10)の検索対象データに対して生成されたインデックスネットワークに含まれ、かつ、概念インスタンス「3101」(ギヤレスエレベータを参照)から概念インスタンス「3102」(扉を参照)への有向リンクであり、かつ、オントロジーで定義された関係「部品(0202)」(図7)を参照していることを記録したものである。インデックスネットワーク320と330(図13、図14)も同様の形式で記録するものとし、詳細は割愛する。(意味ネットワーク(インデックスネットワーク)の生成方法は後で詳述する) Here, the concept instance and the relation instance are nodes and links constituting the semantic network (search condition network or index network) in the present embodiment. A concept instance and a relationship instance each refer to one of the concepts or relationships described in the ontology. For example, the record of the concept instance “3101” in the concept instance table 311 of FIG. 15 is a node of the index network in which the concept instance is generated for the search target data of the search target ID “2100” (FIG. 10). It is also recorded that it refers to the concept “gearless elevator” (concept ID 117) (FIG. 6) defined in the ontology. Further, for example, the record of the relation instance “3121” in the relation instance table 312 of FIG. 16 is included in the index network in which the relation instance is generated for the search target data of the search target ID “2100” (FIG. 10), And the directional link from concept instance “3101” (see gearless elevator) to concept instance “3102” (see door) and the relation “part (0202)” defined in the ontology (Figure 7) Is recorded. The index networks 320 and 330 (FIGS. 13 and 14) are recorded in the same format, and details are omitted. (The method of creating a semantic network (index network) will be described in detail later)
(処理S0002)
次に、検索条件受付部8が、検索条件となるキーワード(検索キーワード)および語順を受け付け、キーワードリストとして記録する。検索条件受付部8は、例えば図17に示す検索キーワード入力画面を検索実行者に提供し、検索ボタンが押下されたタイミングで、検索条件入力部の入力内容を取得し、これをキーワード単位に分解したリストを記録する。本実施形態においては、図18(a) 検索キーワード入力画面例1に入力されている文字列「エレベータ 側板 鏡面加工 HL加工 素材 SUS」を取得し、空白文字毎に入力を分割し、各々をキーワードとして処理した結果を図19に示すキーワード保持テーブル400の形式で記録する。キーワード保持テーブル400は、検索キーワード入力画面に入力されたキーワードを順位付きでキーワードリストとして保持し、当該入力画面の左のキーワードほど、高い順位を付与する。
(Processing S0002)
Next, the search
(処理S0003)
次に、検索処理部9の検索条件ネットワーク生成部91が、図19のキーワード保持テーブル400に記録されているキーワードリストを用いて処理S0400(後述する図42)を実行し、図20に示す検索条件ネットワーク410を生成し、これを図21に示す概念インスタンステーブルと図22に示す関係インスタンステーブルの形式で記録する。なお、本実施形態において、検索条件ネットワークを記録するテーブルの構造は、インデックスネットワークを表す概念インスタンステーブル311(図15)と関係インスタンステーブル312(図16)のそれぞれから検索対象IDのカラムを削除した構成と同様である。(意味ネットワーク(検索条件ネットワーク)の生成方法は後で詳述する)
(Processing S0003)
Next, the search condition
(処理S0004)
インデックスネットワーク取得部92が、処理S0003で記録された図21の概念インスタンステーブル411を参照し、各概念インスタンスについて、各々が関係先概念として記録されているか否かを、図22の関係インスタンステーブル412を参照しながら判定する。そして、関係先概念インスタンスとして記録されていない概念インスタンス「4101」(エレベータ)を、概念インスタンステーブル411のルート要素とし、概念インスタンス「4101」が参照する概念である「エレベータ」を取得する。次に、オントロジー管理部2を介してオントロジーDB1の概念テーブル110(図6)を参照し、概念「エレベータ」の下位概念である「ギヤ式エレベータ」「ギヤレスエレベータ」を取得する。そして、これらの取得した概念を要素として持つ集合をクエリ概念テーブル500(図23)に1レコードとして記録する。
(Processing S0004)
The index
ここで、“概念「エレベータ」の下位概念である”とは、概念「エレベータ」を直接的または間接的に上位概念とする概念のことを指す。また、“概念「エレベータ」を直接的に上位概念とする概念”とは、概念テーブル110(図6)において上位概念の値が「エレベータ」と一致する概念を指すものである。この取得は、例えば、概念テーブル110の上位概念列をサーチすることで取得できる。また、“概念「エレベータ」を間接的に上位概念とする”とは、上位概念の上位概念の・・・と辿った時に、どこかに概念「エレベータ」が登場する概念のうち、直接的に概念「エレベータ」を上位概念として持たない概念のことを指すものである。これらの概念の取得は、例えば、概念「エレベータ」を直接的に上位概念とする概念のみが入ったキューを最初に用意し、“pollした概念を記録し、それを直接の上位概念とする全ての概念をキューにputする”という処理を、キューが空になるまで繰り返し行うことで取得できる。 Here, “a concept that is a subordinate concept of the concept“ elevator ”” refers to a concept in which the concept “elevator” is directly or indirectly a superordinate concept. In addition, “a concept in which the concept“ elevator ”is directly a superordinate concept” refers to a concept in which the value of the superordinate concept matches “elevator” in the concept table 110 (FIG. 6). This acquisition can be acquired, for example, by searching a higher concept column in the concept table 110. In addition, “the concept“ elevator ”is indirectly a superordinate concept” means that the concept “elevator” appears directly somewhere in the concept where the concept “elevator” appears. It refers to a concept that does not have the concept “elevator” as a superordinate concept. To acquire these concepts, for example, first prepare a cue that contains only concepts whose concept “elevator” is directly a superordinate concept, record “polled concepts”, and make them all direct superordinate concepts. It can be obtained by repeatedly performing the process of “putting the concept of“ to the queue ”until the queue becomes empty.
なお、検索条件ネットワークにルート要素が複数存在する場合は、上記の処理を繰り返し実行し、ルート要素毎に概念セットのレコードを記録する。 When there are a plurality of root elements in the search condition network, the above process is repeatedly executed, and a record of the concept set is recorded for each root element.
(処理S0005)
インデックスネットワーク管理部73が、処理S0004で記録された概念セットを順に取得し、「全てのレコードについて、概念セットに含まれるいずれか1要素を参照する概念インスタンスを持つ」ことを条件として、インデックスネットワークDB72(図15、図16)に記録されているインデックスネットワークを取得する。本実施形態の場合、まずクエリ概念テーブル500を参照し、概念セット「{エレベータ, ギヤ式エレベータ, ギヤレスエレベータ}」を取得する。次に、概念インスタンステーブル311(図15)に基づき、概念セットのうちの1つの要素である「ギヤレスエレベータ」が記録されている検索対象ID2100のインデックスネットワーク(つまり、インデックスネットワーク310)を取得する。同様の処理を行い、インデックスネットワーク320と330も取得する。
(Processing S0005)
The index
(処理S0006)
検索条件判定部93が、検索条件ネットワーク410とインデックスネットワーク310、320、330それぞれを指定して、処理S1100(後述する図48)を実行し、各インデックスネットワークを対象として検索条件を満たすか否かの判定を行う。本実施形態の場合、インデックスネットワーク310は「検索条件を満たさない」と判定され、インデックスネットワーク320、330はともに「検索条件を満たす」と判定される。(検索条件判定の方法は後で詳述する)
(Processing S0006)
Whether the search
(処理S0007)
検索処理部9が、処理S0006の結果を受け、「検索条件を満たす」と判定されたインデックスネットワーク320および330について処理S0008を実行し、「検索条件を満たさない」と判定されたインデックスネットワーク310については処理S0010を実行する。
(Processing S0007)
The
(処理S0008)
インデックスネットワーク管理部73が、検索条件を満たすと判定されたインデックスネットワーク320、330それぞれが記録されている概念インスタンステーブル311から、当該レコードの検索対象ID「2200」「2300」を取得し、それぞれに該当する検索対象データを、検索対象データ管理部6が、図10の検索対象データテーブル200から取得する。
(Processing S0008)
The index
(処理S0009)
検索結果出力部10が、処理S0008で取得した検索対象データを取得し、検索結果表示画面(図24)を用いて、検索対象ID、インデックスネットワーク、検索対象データの組を、それぞれ検索対象ID表示領域、インデックスネットワーク表示領域、検索対象データ表示領域に表示する。本実施形態においては、検索結果表示画面例1(図25)が表示される。
(Processing S0009)
The search
(処理S0010)
検索処理部9が、処理S0005で取得した全てのインデックスネットワークについて、検索条件を満たすか否かを判定していれば処理S0011を実行し、未実施のインデックスネットワークが存在すれば、処理S0006を実行して処理を継続する。
(Processing S0010)
If the
(処理S0011)
検索結果の出力を終了する。このとき、検索結果出力部10にて出力するデータが1件も存在しない場合(このことは、出力の回数を記録したり、出力処理を行ったか否かのフラグを用いたりすることで容易に判定できる)は、「該当するデータがありません」といったメッセージを、図27に示す検索結果なし表示画面を用いて通知してもよい。
(Processing S0011)
Ends output of search results. At this time, if there is no data to be output by the search result output unit 10 (this can be easily done by recording the number of times of output or using a flag indicating whether output processing has been performed or not). May be notified using the search result display screen shown in FIG. 27, such as “no corresponding data”.
次に、処理S0300から始まる図41のフローに沿って、本実施形態における検索対象データに対するインデックスネットワークの生成過程について説明する。 Next, an index network generation process for search target data in the present embodiment will be described along the flow of FIG. 41 starting from processing S0300.
本実施形態では、あらかじめ検索対象となるデータを記録した図10の検索対象データテーブル200を持つ検索対象DB4、および、各検索対象データに順序付きで付与されたキーワードを記録したインデックステーブル210を持つ図11のインデックスキーワードDB5が用意されている場合について説明する。検索対象データテーブル200の各行は、1つの検索対象データに相当するものである。また、インデックスキーワードテーブル210(図11)の各行は、検索対象データに付与されたキーワードの1つに対応するものであり、付与対象となる検索対象の検索対象ID、付与順序(語順)、付与されたキーワード文字列から構成されるとする。
In this embodiment, there is a
なお、本実施形態ではテキストデータを検索対象データとする場合について説明するが、表、図形、画像、動画、音声など、情報検索の対象となり得るものであれば構わない。また、検索対象となるデータをキーワードとともに管理する装置や、そのためにキーワードを抽出・生成する手法、また、付与するキーワードの編集・管理手法については、公知化されている技術(特登4224131、特登3173411)を用いてもよい。 In the present embodiment, a case where text data is used as search target data will be described. However, any data search target may be used, such as a table, a figure, an image, a moving image, and voice. In addition, devices that manage data to be searched together with keywords, a method for extracting and generating keywords for that purpose, and a method for editing and managing keywords to be assigned are well-known techniques (Tokuto 4224131, No. 3173411) may be used.
(処理S0301)
検索対象データ管理部6が、検索対象DB4(図10)にアクセスし、レコード順に、まず検索対象ID「2100」を取得する。次に、図11のインデックスキーワードDB5から、検索対象ID「2100」に該当するキーワードおよび語順の全てを取得する。
(Processing S0301)
The search target
(処理S0302)
ネットワーク処理部7のインデックスネットワーク生成部71が、 処理S0301にて取得したキーワードおよび語順「ギヤレスエレベータ(1)、扉板(2)、鏡面加工(3)、アルミ(4)、側板(5)、SUS(6)、HL加工(7)」(括弧内の数値は語順)を、キーワードリストとして、指定して処理S0400(後述する図9)を実行し、生成されたインデックスネットワーク310(図12)を、検索対象ID「2100」の検索対象データに対するインデックスネットワークとして、インデックスネットワークDBに記録する。なお、既に述べたように、本実施形態においてインデックスネットワークは図15と図16に示す構成の表形式でインデックスネットワークDB72に記録されるものとする。
(Processing S0302)
The index
(処理S303)
検索対象DB4に登録されている全ての検索対象データについてインデックスネットワークを生成・記録したか否かを判定する。このとき、未処理のものがあれば処理S0301に戻って処理を続け、全ての検索対象データについて処理が終了していれば、処理S0304 を実行する。本実施形態においては、検索対象ID「2100」に付与された処理に続き、検索対象ID「2200」に付与されたキーワード「ギヤレスエレベータ(1)、側板(2)、SUS(3)、HL加工(4)、鏡面加工(5)、側板(6)、鏡面加工(7)、アルミ(8)」からインデックスネットワーク320(図13)を生成し、検索対象ID「2300」に付与されたキーワード「ギヤ式エレベータ(1)、側板(2)、SUS(3)、HL加工(4)、鏡面加工(5)、側板(6)、サテン加工(7)、アルミ(8)」からインデックスネットワーク330(図14)を生成し、それぞれインデックスネットワークDB72に記録したところで、処理S0304を実行する。
(Processing S303)
It is determined whether or not an index network has been generated and recorded for all search target data registered in the search target DB4. At this time, if there is an unprocessed item, the process returns to step S0301, and the process is continued. In this embodiment, following the process assigned to the search target ID “2100”, the keywords “gearless elevator (1), side plate (2), SUS (3), HL processing” assigned to the search target ID “2200”. The index network 320 (Fig. 13) is generated from (4), mirror finish (5), side plate (6), mirror finish (7), aluminum (8) ", and the keyword" 2300 "assigned to the search target ID" 2300 " Index network 330 from gear type elevator (1), side plate (2), SUS (3), HL processing (4), mirror surface processing (5), side plate (6), satin processing (7), aluminum (8) 14) is generated and recorded in the
(処理S0304)
検索対象データに対するインデックスネットワークの生成・記録処理を終了する。
(Processing S0304)
The index network generation / recording process for the search target data is terminated.
次に、処理S0400から始まる図42のフローに沿って、本実施形態における意味ネットワーク(検索条件ネットワーク、インデックスネットワーク)の生成過程について説明する。ここでは、図10における検索対象ID「2100」の検索対象データに付与されたキーワード「ギヤレスエレベータ(1)、扉板(2)、鏡面加工(3)、アルミ(4)、側板(5)、SUS(6)、HL加工(7)」(括弧内の数値は語順)に関するキーワードのリストに対する処理例について説明する。
(処理S0401)
まず、意味ネットワーク生成部6が、要素が0個の意味ネットワークおよび要素が0個の探索終端リストを生成し、記録する。
Next, the generation process of the semantic network (search condition network, index network) in the present embodiment will be described along the flow of FIG. 42 starting from the processing S0400. Here, the keywords `` gearless elevator (1), door plate (2), mirror finish (3), aluminum (4), side plate (5), given to the search target data of the search target ID `` 2100 '' in FIG. A processing example for a list of keywords related to “SUS (6), HL processing (7)” (numbers in parentheses are in word order) will be described.
(Processing S0401)
First, the semantic
ここで、探索終端リストとは、あるキーワードに対応するインスタンスを始点として探索を行う際に、見つかった時点で当該探索を終了する概念インスタンスを記録したものである。 Here, the search end list is a record of concept instances that end the search when found when an instance corresponding to a certain keyword is used as a starting point.
(処理S0402)
意味ネットワーク生成部6が、上記処理S0302(図41)にて指定されたキーワードのリスト「ギヤレスエレベータ(1)、扉板(2)、鏡面加工(3)、アルミ(4)、側板(5)、SUS(6)、HL加工(7)」(括弧内の数値は語順)を参照し、語順の値が最も小さいキーワードである「ギヤレスエレベータ」と語順「1」を取得する。次に、取得したキーワード「ギヤレスエレベータ」を用い、図6の概念テーブル110および図7の関係テーブル120のキーワード列を検索し、キーワードが完全に一致する概念および関係を取得し、リスト(オブジェクトリスト)として保持する。複数の概念または関係についてキーワードが一致する場合は、その全てをリスト(オブジェクトリスト)として記録する。本実施形態において、キーワード「ギヤレスエレベータ」に一致するものは概念「ギヤレスエレベータ」のみであるため、当該概念のみを要素として持つリスト「{ギヤレスエレベータ}」を記録する。なお、対応する概念や関係が存在しない場合、そのキーワードはキーワードリストから削除してもよいものとする。
(Processing S0402)
The semantic
(処理S0403)
意味ネットワーク生成部6が、処理S0402にて記録されたオブジェクト(概念または関係)のリスト「{ギヤレスエレベータ}」および要素が0個の探索終端リストを指定して、処理S0600(図43)を実行し、経路データ760(図28(a))を取得し、また接続インスタンスとしてnull値を取得する。(経路データおよび接続インスタンスの生成・取得方法は後で詳述する)
経路データとはキーワード間のつながりを表す概念および関係のリストであり、また、接続インスタンスとは、当該経路データを接続する接点となる意味ネットワーク内の概念インスタンスである。後述するように、経路データに要素として含まれるオブジェクトのインスタンスを生成し、接続インスタンスとして指定された概念インスタンスに順次接続していくことで、意味ネットワークが拡張される。
(Processing S0403)
The semantic
The route data is a list of concepts and relationships representing the connection between keywords, and the connection instance is a concept instance in the semantic network that becomes a contact point for connecting the route data. As will be described later, the semantic network is expanded by generating an instance of an object included as an element in the route data and sequentially connecting to the concept instance designated as the connection instance.
(処理S0404)
意味ネットワーク生成部6が、処理S0403で取得した経路データ760(図28(a))と、接続インスタンスとしてのnull値とを指定して、処理S1000(後述する図47)を実行し、意味ネットワークを拡張する。本実施形態の場合、処理前はノード数が0の状態から、図29(a)に示すノード数1の意味ネットワークへと拡張される。(意味ネットワークの拡張方法は後で詳述する)
(Processing S0404)
The semantic
(処理S0405)
全てのキーワードについて意味ネットワーク拡張処理を実行したか否かを、処理S0402にて取得したキーワードより語順の大きいキーワード(すなわち下位のキーワード)が存在するか否かによって確認し、存在する場合は処理S0406を実行して探索終端リストを更新し、存在しない場合は全てのキーワードについて処理を実行したとして、処理S0407を実行する。
(Processing S0405)
Whether or not the semantic network expansion processing has been executed for all the keywords is checked based on whether or not there is a keyword having a word order larger than the keyword acquired in processing S0402 (that is, a lower keyword). If there is, processing S0406 is performed. Is executed to update the search end list, and if it does not exist, the process is executed for all the keywords, and the process S0407 is executed.
本実施形態の場合、語順が1の「ギヤレスエレベータ」の処理に続き、語順が2の「扉板」が存在するため、処理S0406を実行した後、処理0402に戻り、処理S0403で得られた経路データ761(図28(b))と接続インスタンス「3101」(ギヤレスエレベータを参照)に対し処理S0404を実行することで、意味ネットワーク312(図29(b))が得られる。
In the case of the present embodiment, following the process of “gearless elevator” with the
また、処理S0406を経て、語順が3の「鏡面加工」に対して、処理S0402の後、処理S0403で得られた経路データ762(図28(c))と接続インスタンス「3103」(板を参照)に対し処理S0404を実行することで、意味ネットワーク312(図29(c))が得られる。 Also, after the process S0406, the path data 762 (FIG. 28 (c)) obtained in the process S0403 and the connection instance “3103” (refer to the board) after the process S0402 for the “mirror finish” with the word order 3 )), The semantic network 312 (FIG. 29 (c)) is obtained.
以下同様に繰り返して、語順が7の「HL加工」に対して処理S0402〜S0404を実行し、意味ネットワーク(本実施形態の場合、インデックスネットワーク)が図12の状態になった時点で、語順が7より大きいキーワードがないため、処理S0407を実行する。 The same is repeated thereafter, and the processes S0402 to S0404 are executed for the “HL processing” whose word order is 7, and when the semantic network (in this embodiment, the index network) is in the state of FIG. Since there is no keyword greater than 7, process S0407 is executed.
(処理S0406)
意味ネットワーク生成部6が、探索終端リストの要素をクリアした後、その時点の意味ネットワークの経路末インスタンスを取得し、当該経路末インスタンスから意味ネットワークの根ノードである概念インスタンスまでの経路上に存在する概念インスタンスのリストを作成し、これを探索終端リストとして、記録する。この探索終端リストは、次に実行される処理S0403で用いる。
(Processing S0406)
After the semantic
ここで経路末インスタンスとは、インデックスネットワークを拡張した際に、拡張された部分で最も根から遠い概念インスタンス(つまり、いわゆる葉ノード)のことである。 Here, the end-of-path instance is a concept instance (that is, a so-called leaf node) farthest from the root in the expanded portion when the index network is expanded.
本実施形態において、語順が1の「ギヤレスエレベータ」に対する処理では、経路末インスタンス「3101」(ギヤレスエレベータを参照)が得られ、これはそのまま根ノードである(意味ネットワーク内に、親となる概念インスタンスが存在しない)であるため、探索終端リスト「{3101}」が得られ、語順が2の「扉板」に対する処理で用いられる。 In the present embodiment, the process for the “gearless elevator” having the word order of 1 yields the path end instance “3101” (see the gearless elevator), which is the root node (the parent concept in the semantic network). Therefore, the search end list “{3101}” is obtained and used in the process for the “doorboard” having the word order of 2.
また、語順が2の「扉板」に対する処理では、経路末インスタンス「3103」(板を参照)が得られ、当該板のノードから順に概念インスタンスを追加し、親ノードが存在しなくなるまで処理を繰り返すことで、探索終端リスト「{3103、3102、3101}」(それぞれ板、扉、ギヤレスエレベータを参照)が得られ、語順が3の「鏡面加工」に対する処理で用いられる。
In addition, in the process for “doorboard” with
(処理S0407)
意味ネットワーク生成処理を終了する。
(Processing S0407)
The semantic network generation process ends.
次に、処理S0600から始まる図43のフローに沿って、本実施形態における経路データ生成処理について説明する。ここでは、検索対象ID「2100」の検索対象データに付与されたキーワード「ギヤレスエレベータ(1)、扉板(2)、鏡面加工(3)、アルミ(4)、側板(5)、SUS(6)、HL加工(7)」(括弧内の数値は語順)からインデックスネットワークを生成する途上で、語順が3の「鏡面加工」を対象として経路データを生成する場合について説明する。このとき、意味ネットワークは意味ネットワーク312(図29(b))の状態にあり、探索終端リストは「{3103、3102、3101}」(それぞれ板、扉、ギヤレスエレベータを参照)であり、キーワードに対応するオブジェクトリストは「{鏡面加工}」である。 Next, route data generation processing in the present embodiment will be described along the flow of FIG. 43 starting from processing S0600. Here, the keywords `` gearless elevator (1), door plate (2), mirror finish (3), aluminum (4), side plate (5), SUS (6 ), HL processing (7) ”(numerical values in parentheses are in word order), a case will be described in which path data is generated for“ mirror processing ”in which the word order is 3. At this time, the semantic network is in the state of the semantic network 312 (FIG. 29 (b)), the search termination list is “{3103, 3102, 3101}” (refer to the board, door, and gearless elevator, respectively). The corresponding object list is “{mirror finish}”.
(処理S0601)
最大探索経路長受付部34が、最大経路長Lを取得する。最大経路長受付部34は、例えば、図17に示す検索キーワード入力画面の探索最大経路長入力部から取得して良いものとする。本実施形態においては、図18(a) 検索キーワード入力画面例1 で示すように、最大経路長L=5を取得する。
(Processing S0601)
The maximum searched route
ここで、探索最大経路長とは、指定されたキーワード(ここでは鏡面加工)から経路(オントロジー)を探索する際に辿る最大段数の指定値である。この値に到達しても、指定されたキーワードが、探索終端リストの概念のうちの1つに到達しない場合は、経路データ生成を打ち切り、接続インスタンスをnull値として、経路データ生成処理を終了する(この場合、生成される意味ネットワークが複数になり得る)。 Here, the maximum search path length is a specified value of the maximum number of steps to be followed when searching for a path (ontology) from a specified keyword (here, mirror processing). Even if this value is reached, if the specified keyword does not reach one of the concepts in the search termination list, the route data generation is terminated, the connection instance is set to a null value, and the route data generation process is terminated. (In this case, there can be multiple semantic networks generated).
(処理S0602)
指定された探索終端リストの要素が0個の場合は処理S0603を実行し、それ以外の場合は処理S0605を実行する。本実施形態の場合、探索終端リストの要素数は0でないため、処理S0605 を実行する。
(Processing S0602)
If the number of elements in the designated search end list is zero, process S0603 is executed, and otherwise, process S0605 is executed. In the present embodiment, since the number of elements in the search end list is not 0, process S0605 is executed.
(処理S0605)
経路データ生成部31が、語順値m=3、探索最大経路長L=5に対する探索優先度行列Vm,L-1(本実施形態の場合V3,4)を算出し、記録する。
(Processing S0605)
The route
ここで、探索優先度行列Vx,yは、(系統リストの要素数+1)×1行列であり、
まず、オントロジー経路データ生成部31が、処理S0100(後述する図39)を実行し、系統接続行列O(後述)および系統リスト(後述)を求める。本実施形態では、オントロジー100より、
First, the ontology path
次に、オントロジー経路データ生成部31が、(系統リストの要素数+1)×1のゼロ行列を生成し、行列V3,0として記録する。次に、語順が3より小さいキーワード「ギヤレスエレベータ」「扉板」を順に取得し、オントロジー管理部2を用いてキーワードが一致する概念/関係を全て取得し、それらを重複がないように記録する。本実施形態の場合「{ギヤレスエレベータ}{扉板(0203)}」が得られる。次に、要素である概念および関係「ギヤレスエレベータ」「扉板(0203)」について処理S700(後述する図44)を行い、それぞれを含む系統「モノ」「板」を取得する。そして、取得した系統を系統リスト130と照らし合わせ、系統それぞれの順位「2」「1」を取得し、V3,0の2行1列要素、1行1列要素にそれぞれ1を加える。このようにして、
(処理S0606)
経路データ生成部31が、語順=3のキーワードに対応するオブジェクトのリスト「{鏡面加工}」の要素について順に取得し、探索終端リスト「{3103、3102、3101}」(それぞれ板、扉、ギヤレスエレベータを参照)、および処理S0605にて計算した優先度行列V3,4を指定して処理S0800(後述する図45)を実行し、経路データおよび接続インスタンスを取得する。本実施形態の場合、オブジェクト「鏡面加工」に対する経路データとして、経路データ762「{板、仕上げ(0208)、鏡面加工}」(図28(c))、および接続インスタンス「3103」(板)が取得される。(経路データの生成および接続インスタンスの取得方法は後で詳述する)
(Processing S0606)
The route
(処理S0607〜S0609)
経路データ生成部31が、処理S0606の処理が終了する都度、処理S0606にて取得した経路データの概念インスタンス数と、その時点で記録されている経路データの概念インスタンス数を比較し、少ないほうを経路データとして記録し、多いほうを消去する。このとき、経路データが記録されていなければ、処理S0606にて取得した経路データを、そのまま記録する。そして、語順=3のキーワードに対応するオブジェクト全てについて経路データの比較が終了した時点で、処理S0610を実行する。
(Processing S0607 ~ S0609)
Each time the process of process S0606 ends, the path
本実施形態においては、語順=3のキーワードに対応するオブジェクトの要素が1つであるため、比較処理を繰り返すことなく、処理S0610が実行される。 In the present embodiment, since there is one element of the object corresponding to the keyword of word order = 3, the process S0610 is executed without repeating the comparison process.
(処理S0610)
経路データ生成処理を終了する。
(Processing S0610)
The route data generation process is terminated.
次に、処理S0100から始まる図39のフローに沿って、系統接続行列Oの生成処理ついて説明する。 Next, the generation process of the system connection matrix O will be described along the flow of FIG. 39 starting from the process S0100.
(処理S0101)
オントロジー管理部2が、オントロジー100を指定して処理S0200(後述する図40)を実行し、系統リスト130を取得する。
(Processing S0101)
The
(処理S0102)
オントロジー管理部2が、系統リスト130およびオントロジー100から、系統接続行列Oを算出し、記録する。
(Processing S0102)
The
ここで、系統接続行列Oは(系統リストの要素数+1)×(系統リストの要素数+1)行列であり、
本実施形態の場合、最初に、系統リスト130の要素の数「3」に基づき、4×4行列Oをワーキングメモリに記録し、全要素の値を0とする。 In the case of the present embodiment, first, based on the number of elements “3” in the system list 130, the 4 × 4 matrix O is recorded in the working memory, and the values of all elements are set to 0.
次に、関係テーブル120(図7)の関係「部品(0201)」における関係元概念「モノ」と関係先概念「モノ」のそれぞれに対して処理S0700(後述する図44)を行い、各々が含まれる系統を取得し、同じであるか否かを比較判定する。この場合、含まれる系統はどちらも「モノ」であり互いに等しい(つまり対角成分)ため、行列Oは更新しない。
次に、関係テーブル120の関係「部品(0202)」について、その関係元概念「エレベータ」、および、関係先概念「扉」が含まれる系統を取得し、等しいか否かを比較判定する。この場合も、含まれる系統はどちらも「モノ」であり互いに等しいため、行列Oは更新しない。
次に、関係テーブル120の関係「扉板(0203)」について、その関係元概念「扉」、および、関係先概念「板」が含まれる系統を取得し、等しいか否かを比較判定する。この場合、関係元概念「扉」と関係先概念「板」が所属する系統は、それぞれ「モノ」「板」であり、等しくない。そこで、各系統を系統リスト130と照合し、それぞれが何番目の系統であるかを取得する。この場合、関係元側の「モノ」は「2」番目であり、関係先側の「板」は「1」番目の系統であることが得られる。そこで、行列Oの要素O12の値を1加算する。
以下同様に、関係テーブル120(図7)の全てのレコードについて、関係元概念と関係先概念それぞれが含まれる系統を比較し、系統が異なる場合には、行列Oの定義に沿って該当する要素に1を加える操作を繰り返すことで、
Next, with respect to the relationship “part (0202)” in the relationship table 120, the system including the relationship source concept “elevator” and the relationship destination concept “door” is acquired, and whether or not they are equal is determined. Also in this case, since the included systems are both “mono” and equal to each other, the matrix O is not updated.
Next, with respect to the relationship “door plate (0203)” in the relationship table 120, the system including the relationship source concept “door” and the relationship destination concept “plate” is acquired, and whether or not they are equal is determined. In this case, the systems to which the relation source concept “door” and the relation destination concept “board” belong are “thing” and “board”, which are not equal. Therefore, each system is collated with the system list 130 to obtain the number of each system. In this case, it is obtained that the “thing” on the relation source side is the “2” th, and the “board” on the relation destination side is the “1” th system. Therefore, 1 is added to the value of the element O 12 of the matrix O.
Similarly, for all the records in the relationship table 120 (FIG. 7), the system including the relationship source concept and the relationship destination concept is compared, and if the systems are different, the corresponding elements according to the definition of the matrix O. By repeating the operation of adding 1 to
(処理S0102)
系統接続行列Oの計算処理を終了する。
(Processing S0102)
The calculation process of the system connection matrix O is terminated.
次に、処理S0200から始まる図40のフローに沿って、系統リストの生成フローについて説明する。 Next, the flow of generating a system list will be described along the flow of FIG. 40 starting from processing S0200.
(処理S0201)
オントロジー管理部2が、関係テーブル120(図7)を参照し、関係先概念として記録されている概念を系統候補とし、その記録数(被参照数)とともに、系統候補テーブル140に記録する。なお、系統候補とは、系統となり得る概念であり、以降の処理にて系統として変更されるか、系統候補から消去される。
(Processing S0201)
The
本実施形態においては図9に示す系統候補テーブル140が記録されるが、これは関係テーブル120(図7)を対象とした上記処理の結果として得られるものである。例えば、概念「板」の被参照数が「3」となっていることは、関係テーブル120において概念「板」が関係ID「0203」「0204」「0205」の3レコードで関係先概念として記録されていることによる。被参照数は、例えば、関係テーブル120の関係先概念の列に対して、“関係先概念に記録されている概念が、系統候補テーブル140の系統候補概念に含まれていれば、その被参照数を1加え、含まれていなければ系統候補概念として新たな行を加えて記録し、被参照概念数を1とする”という処理を繰り返すことで求めてもよいものとする。 In the present embodiment, the system candidate table 140 shown in FIG. 9 is recorded, which is obtained as a result of the above processing for the relation table 120 (FIG. 7). For example, if the number of references to the concept “board” is “3”, the concept “board” is recorded in the relationship table 120 as 3 related records with the relationship IDs “0203”, “0204”, and “0205”. By being. For example, if the concept recorded in the related concept is included in the system candidate concept in the system candidate table 140, the number of the referenced concept is as follows. The number may be added by 1 and if not included, a new line may be added and recorded as a systematic candidate concept, and the process may be obtained by repeating the process of “referring to 1 referenced concept number”.
(処理S0202)
オントロジー管理部2が、系統候補テーブル140(図9)を参照し、系統候補が存在するか否かをチェックする。存在する場合は処理S0203を実行し、存在しない場合は処理S0207を実行する。系統候補テーブルが図9の状態の場合、系統候補が存在するため、処理S0203を実行する。
(Processing S0202)
The
(処理S0203)
オントロジー管理部が、系統候補テーブル140(図9)を参照し、被参照数が最多の概念を選択する(複数ある場合は、概念IDの番号が若いものを選ぶとする)。本実施形態の場合、まず「板」が系統リストに追加される。
(Processing S0203)
The ontology management unit refers to the system candidate table 140 (FIG. 9) and selects the concept with the largest number of references (assuming that the concept ID with the smallest concept ID number is selected). In the present embodiment, first, “board” is added to the system list.
(処理S0204〜S0206)
処理S0203で選択した概念の上位概念となる概念が系統リストの中に含まれているか否かを判定し、含まれていない場合のみS0203で取得した概念を系統リストに追加した後、系統候補テーブルから削除する。
(Processing S0204 to S0206)
It is determined whether or not a concept that is a superordinate concept of the concept selected in process S0203 is included in the system list, and if not included, the concept acquired in S0203 is added to the system list, and then the system candidate table Delete from.
本実施形態の場合、「板」が系統リストに追加された後、「モノ」、「属性値」が系統リストに追加され、系統リストは図8の状態となる。「板」「モノ」「属性値」は系統候補テーブルから削除される。「扉」「金属」「仕上種」「防犯窓」は、系統リストに追加されずに、系統候補テーブルから削除される。そして、全ての系統候補について処理が終了した時点で、処理S0207が実行される。 In the case of the present embodiment, after “board” is added to the system list, “mono” and “attribute value” are added to the system list, and the system list is in the state of FIG. The “board”, “thing”, and “attribute value” are deleted from the system candidate table. “Door”, “Metal”, “Finish Type”, and “Security Window” are deleted from the system candidate table without being added to the system list. Then, when the processing is completed for all the system candidates, processing S0207 is executed.
(処理0207)
系統リスト取得処理を終了する。
(Process 0207)
The system list acquisition process ends.
次に、処理S0700から始まる図44のフローに沿って、系統の同定フローについて説明する。 Next, a system identification flow will be described along the flow of FIG. 44 starting from processing S0700.
(処理S0701)
オントロジー管理部2が、系統を取得するものとして指定されたオブジェクトを取得し、当該オブジェクトが概念であれば、当該オブジェクトを系統取得対象として記録する。一方、当該オブジェクトが関係であれば、当該関係の関係先概念を系統取得対象として記録する。
(Processing S0701)
The
本実施形態として、概念「ギヤレスエレベータ」および関係「扉板(0203)」が指定された場合について説明する。まず、概念「ギヤレスエレベータ」の場合、系統取得対象を「ギヤレスエレベータ」として記録する。一方、関係「扉板(0203)」が指定された場合は、関係テーブル120(図7)を参照し、当該関係の関係先概念「板」を系統取得対象として記録する。 As the present embodiment, a case where the concept “gearless elevator” and the relationship “door plate (0203)” are designated will be described. First, in the case of the concept “gearless elevator”, the system acquisition target is recorded as “gearless elevator”. On the other hand, when the relationship “doorboard (0203)” is designated, the relationship table 120 (FIG. 7) is referred to, and the relationship destination concept “board” of the relationship is recorded as a system acquisition target.
(処理S0702)
オントロジー管理部2が、処理S0701で記録した系統取得対象「ギヤレスエレベータ」「板」が、系統リスト130(図8)に含まれているか否かを判定する。含まれている場合は、系統取得対象を記録し、処理S0703を実行する。含まれていない場合は、処理S0704を実行する。
(Processing S0702)
The
本実施形態について、系統取得対象「ギヤレスエレベータ」の場合は、系統リスト130に含まれないため、処理S0704を実行する。一方、系統取得対象「板」の場合は系統リスト130に含まれているため、処理S0703を実行する。 In the present embodiment, since the system acquisition target “gearless elevator” is not included in the system list 130, the process S0704 is executed. On the other hand, since the system acquisition target “board” is included in the system list 130, the process S0703 is executed.
(処理S0703)
オントロジー管理部2が、系統取得対象を系統として記録する 。系統取得対象「板」の場合、「板」が系統として記録される。
(Processing S0703)
The
(処理S0704〜S0706)
オントロジー管理部2が、系統取得対象の上位概念を系統取得対象に設定しなおして、処理S0702を実行する。このとき、上位概念の存在しない概念が系統取得対象であった場合、系統をnull値として記録し、処理S0707を実行する。
(Processing S0704 to S0706)
The
本実施形態の場合、系統取得対象「ギヤレスエレベータ」について、上位概念「エレベータ」を系統取得対象として設定しなおして処理を繰り返し、さらに上位概念「モノ」となった段階で、これが系統リスト130(図8)に含まれることから、処理S0707が実行される。 In the case of this embodiment, for the system acquisition target “gearless elevator”, the superordinate concept “elevator” is set as the system acquisition target again, and the process is repeated. Since it is included in FIG. 8), the process S0707 is executed.
(処理S0707)
経路同定処理を終了する。
(Processing S0707)
The route identification process is terminated.
次に、処理S0800から始まる図45のフローに沿って、経路データ生成および接続インスタンス取得フローについて説明する。図45A、図45B、図45C、図45D、図45E、図45Fは、図45の部分拡大図である。なお、ここではオブジェクトのリスト「{鏡面加工}」、探索終端リスト「{3103、3102、3101}」(それぞれ板、扉、ギヤレスエレベータを参照)、および優先度行列V3,4が指定された場合の処理について説明する。 Next, the route data generation and connection instance acquisition flow will be described along the flow of FIG. 45 starting from processing S0800. 45A, 45B, 45C, 45D, 45E, and 45F are partially enlarged views of FIG. Here, the object list “{mirror finish}”, the search end list “{3103, 3102, 3101}” (refer to the plate, door, and gearless elevator, respectively) and the priority matrix V 3,4 are specified. The processing in the case will be described.
(処理S0801)
経路データ生成部31が、経路探索木を生成し、これを記録する。なお、経路探索木、および、その構成要素となる探索ノード、探索ノードが参照するオブジェクト(概念または関係)をワーキングメモリ上で表現する手段としては、例えば経路探索木730(図30)に対する経路探索木テーブル740(図40)のような表形式のデータ構造を用いることが可能であるが、同等の内容を処理可能な他の方法を用いても構わない。
(Processing S0801)
The route
ここで、経路探索木とは、木構造のデータであり、指定されたキーワードに対応するオブジェクトを参照する探索ノードを根として持つ。探索ノードとは、経路探索木の要素となるノードであり、必ず1つ、オントロジーで定義されたオブジェクトに対する参照を持つ。経路探索処理は、オントロジーを参照しながら経路探索木を拡張し、探索終端リストに含まれるインスタンスが参照する概念のうちの1つに辿りつくことで、経路が発見されたものとする。 Here, the route search tree is data of a tree structure, and has a search node that refers to an object corresponding to a specified keyword as a root. A search node is a node that is an element of a route search tree, and always has one reference to an object defined by an ontology. In the route search process, it is assumed that the route is found by expanding the route search tree while referring to the ontology, and reaching one of the concepts referred to by the instances included in the search end list.
(処理S0802)
経路データ生成部31が、指定されたオブジェクトを取得し、当該オブジェクトを参照する探索ノードを経路探索木730(図30)の根ノードとして設定する。例えば図31の経路探索木テーブル740においては、親ノードの値を空(null値)にしておくことで、それが根であることを識別できるものとする。
(Processing S0802)
The route
本実施形態の場合では、概念「鏡面加工」への参照を持ったノード7301が経路探索木730の根として記録される。
In this embodiment, a
(処理S0803〜S0804)
経路データ生成部31が、優先度付き探索候補キュー750(図32)を生成し、優先度0として経路探索木730の根ノードをpushする。
(Processing S0803 to S0804)
The route
優先度付き探索候補キューとは、優先度付きキューの1つであり、探索データを生成するために、次に探索すべきオブジェクトを参照するノードを格納するためのキューである。 The search candidate queue with priority is one of the queues with priority, and is a queue for storing a node that refers to an object to be searched next in order to generate search data.
本実施形態の場合では、まず鏡面加工のノード7301(優先度=0)がキューに格納される。 In the case of this embodiment, first, the mirror processing node 7301 (priority = 0) is stored in the queue.
(処理S0805)
経路データ生成部31が、優先度付き探索候補キュー750の要素を参照し、ノード7301がキューに存在することから、処理S0806を実行する。
(Processing S0805)
The route
(処理S0806)
経路データ生成部31が、優先度付き探索候補キュー750から探索ノード、および、その優先度pを1つpullし、優先度が最も低いノードであるノード7301(優先度=0)を取得する。
(Processing S0806)
The route
(処理S0807)
このとき、最初に取得された探索ノード7301(優先度「0」)が参照するオブジェクト「鏡面加工」が概念であることから、処理S0808が実行される。
(Processing S0807)
At this time, since the object “mirror finishing” referred to by the search node 7301 (priority “0”) acquired first is a concept, processing S0808 is executed.
(処理S0808〜処理S0816)
経路データ生成部31が、概念「鏡面加工」を関係先概念とする関係を取得する。この場合、条件を満たす関係が存在しないため、経路探索木730は更新されない。
(Processing S0808 to Processing S0816)
The route
(処理S0817〜処理S0819)
経路データ生成部31が、オントロジー管理部2を参照して概念「鏡面加工」の上位概念である「仕上種」を取得し、これを参照するノード7302を生成して、ノード7301の子として経路探索木730に追加する。また、ノード7302を優先度「1」として優先度付きキュー750にpushする。
(Processing S0817 to Processing S0819)
The path
(処理S0815)
処理S0805〜0819を繰り返して、経路探索木が731(図33)、優先度付き探索キューが751(図34)となった状態で、処理S0814を実行した際、処理S0900(後述)から接続インスタンス3103が取得されるため、これと優先度付キュー751末尾のノード7305を指定して処理S0822を実行する。なお、図34においては、優先度の値を小数点第3位を四捨五入して記載している。(接続インスタンスの取得方法は後で詳述する)
(処理S0822〜S0827)
まず経路データに、ノード7305が参照する概念「0104」(板)を経路データに追加し、順次、親ノードが参照するオブジェクトを追加することで、経路データ761「{板、仕上(0208)、鏡面加工}」(図28(C))が生成される。
(Processing S0815)
When processing S0814 is executed in a state where the route search tree is 731 (FIG. 33) and the priority search queue is 751 (FIG. 34) by repeating the processing S0805 to 0819, the connection instance from the processing S0900 (described later) Since 3103 is acquired, this and the
(Processing S0822 to S0827)
First, the concept “0104” (board) referred to by the
(処理S0828)
経路データ先頭の要素「板」は、接続インスタンス3103が参照する概念「板」と一致するため、処理S0838を実行し、経路データ生成および接続インスタンス取得処理を終了する。
(Processing S0828)
Since the element “plate” at the head of the route data matches the concept “plate” referred to by the
次に、処理S0900から始まる図46のフローに沿って、接続インスタンス取得フローについて説明する。 Next, a connection instance acquisition flow will be described along the flow of FIG. 46 starting from processing S0900.
ここでは、探索終端リストが「{3103、3102、3101}」(それぞれ板、扉、ギヤレスエレベータを参照)であり、また、優先度付きキューが751の状態である場合の実施形態について説明する。このとき、探索終端リストの先頭要素である概念インスタンス「3103」が参照する概念「板」は、優先度付きキュー751末尾のノードが参照する概念「板」と等しいため、ワーキングメモリに接続インスタンス「3103」が記録され、処理0900が終了する。 Here, an embodiment will be described in which the search termination list is “{3103, 3102, 3101}” (refer to plates, doors, and gearless elevators, respectively), and the priority queue is in the 751 state. At this time, the concept “board” referred to by the concept instance “3103” that is the first element of the search termination list is equal to the concept “board” referenced by the node at the end of the priority-added queue 751, so the connection instance “ 3103 "is recorded, and the process 0900 ends.
次に、処理S1000から始まる図47のフローに沿って、意味ネットワーク拡張フローについて説明する。図47A、図47Bは、図47の部分拡大図である。 Next, the semantic network expansion flow will be described along the flow of FIG. 47 starting from processing S1000. 47A and 47B are partial enlarged views of FIG.
本実施形態として、図29(b)の意味ネットワーク312、図28(c)の経路データ762「{板、仕上(0208)、鏡面加工}」、および、接続先インスタンス3103が与えられたときの処理について説明する。
In this embodiment, when the semantic network 312 in FIG. 29B, the route data 762 “{plate, finish (0208), mirror finish}” in FIG. 28C, and the
まず、接続先インスタンス3103を親インスタンスとして記録する。親インスタンスはnull値でないため、図28(c)の経路データ762から先頭の概念「板」を取得する。これは、親インスタンス3103が参照する概念「板」と一致するため、親インスタンスの参照概念は更新されない。そして、経路データ762から先頭の要素である概念「板」が削除される。経路データ762にはまだ要素があるため、次の要素である関係「仕上(0208)」を取得する。まず、これを参照する関係インスタンス3124を生成し、記録する。次に、関係インスタンス3124の関係元概念インスタンスとして、親インスタンスとして指定されている概念インスタンス3103を指定し、記録する。そして、経路データ762から先頭の要素である関係「仕上(0208)」を削除する。次に、経路データ762から先頭の要素である概念「鏡面加工」を取得する。まず、これを参照する概念インスタンス3104 を生成し、記録する。そして、概念インスタンス3104を、関係インスタンス3124の関係先概念インスタンスとして指定し、記録する。そして、経路データ762から先頭の要素である概念「鏡面加工」を削除する。
First, the
この段階で、経路データ762には要素がなくなり、処理1000が終了する。このとき意味ネットワーク312は図29(c)の313の状態に更新された状態で記録されている。
At this stage, the route data 762 has no elements, and the
次に、処理S1100から始まる図48のフローに沿って、検索条件の判定フローについて説明する。図48A、図48B、図48C、図48Dは、図48の部分拡大図である。 Next, the search condition determination flow will be described along the flow of FIG. 48 starting from step S1100. 48A, 48B, 48C, and 48D are partially enlarged views of FIG.
ここでは、図13のインデックスネットワーク320と図20の検索条件ネットワーク410が指定され、検索条件ネットワーク410全てのインスタンスについてインデックスネットワーク320内に対応するインスタンスが存在するか否かを判定する過程を例に説明する。 Here, the index network 320 in FIG. 13 and the search condition network 410 in FIG. 20 are designated, and an example is a process of determining whether or not there is a corresponding instance in the index network 320 for all instances of the search condition network 410. explain.
なお、検索条件ネットワークのインスタンスをインデックスネットワークのインスタンスに対応付けることを「マッチングを取る」といい、その対応付けを「マッチング」という。マッチングにおいて、検索条件ネットワーク側のインスタンスを「マッチング元(インスタンス)」、インデックスネットワーク側のインスタンスを「マッチング先(インスタンス)」という。このとき、マッチング先インスタンスが参照する概念/関係は、マッチング元インスタンスが参照する概念/関係と等しいか下位概念/関係でなければならない。また、既に定まっているマッチングと整合する範囲で、新たなマッチングを追加することが可能/不可能なことを「マッチング可能/マッチング不可能」という。また、マッチング先が定められていない検索条件ネットワークのインスタンスの状態を「マッチング未定」という。 Note that associating an instance of the search condition network with an instance of the index network is called “matching”, and the association is called “matching”. In matching, an instance on the search condition network side is called a “matching source (instance)”, and an instance on the index network side is called a “matching destination (instance)”. At this time, the concept / relationship referenced by the matching destination instance must be equal to or lower than the concept / relationship referenced by the matching source instance. In addition, “matchable / unmatchable” means that a new matching can be added / impossible within a range that matches a predetermined matching. In addition, the state of a search condition network instance for which no matching destination is defined is referred to as “matching undecided”.
(処理S1101〜処理S1102)
検索処理部9の検索条件判定部93が、適用待ちスタック及び適用中スタックを作成する。
(Processing S1101 to Processing S1102)
The search
ここで適用待ちスタックとは、マッチングの候補を記録するためのスタックである。一方、適用中スタックとは、実際に適用しているマッチングを記録するためのものである。適用中スタックに記録された対応は他の対応に対する制約となるが、適用待ちスタックに記録された対応は、あくまで適用前の候補である。 The application waiting stack is a stack for recording matching candidates. On the other hand, the stack being applied is for recording the matching that is actually applied. The correspondence recorded in the application stack is a restriction on other correspondences, but the correspondence recorded in the application waiting stack is a candidate before application.
(処理S1103〜S1108)
検索条件判定部93が、検索条件ネットワーク410内でマッチングがないインスタンスについて、影響度および候補数を記録する。
(Processing S1103 to S1108)
The search
影響度とは、当該インスタンスについてインデックスネットワークにおける対応するインスタンスが決定された場合に、どの程度、検索条件ネットワーク内で他のインスタンスに対する制約が生じるかを示す数値である。概念インスタンスの影響度は、それを関係先概念インスタンスまたは関係元インスタンスとして参照する関係インスタンスのうち、マッチング未定のものの個数である。また、関係インスタンスの影響度は、その関係先概念インスタンスまたは関係元概念インスタンスのうち、マッチング未定のものの個数である。 The degree of influence is a numerical value indicating how much restriction is imposed on other instances in the search condition network when a corresponding instance in the index network is determined for the instance. The influence degree of a concept instance is the number of undecided matches among relation instances that refer to the concept instance as a relation destination concept instance or a relation source instance. The influence degree of the relationship instance is the number of undecided matches among the relationship destination concept instances or the relationship source concept instances.
一方、候補数とは、検索条件ネットワークのインスタンスについて、インデックスネットワークおいてマッチング可能なマッチング先の個数である。候補数=0と、インデックスネットワークのどのインスタンスに対してもマッチング不可であることは等価である。 On the other hand, the number of candidates is the number of matching destinations that can be matched in the index network for an instance of the search condition network. It is equivalent that the number of candidates = 0 cannot be matched to any instance of the index network.
本実施形態の場合、まず適用中スタックにマッチングが一つも記録されていないため、検索条件ネットワーク410に含まれる全ての概念インスタンスと関係インスタンスについて候補数と影響度を求めた結果を、検索条件ネットワーク評価テーブル800 (図35(a))として記録する。候補数は、インスタンス、インデックスネットワーク、および適用中スタックを指定して処理S1200(後述する図49)を実行し、マッチング可能な候補を取得することで求められる。例えば、ここで図20の概念インスタンス「4102」(板)、図13のインデックスネットワーク320、空の適用中スタックを指定して処理1200(図49)を実行することで、マッチング可能な候補「{3202、3206}」(それぞれ板を参照)が得られるため、その要素数2を概念インスタンス「4102」の候補数として記録する。一方、検索条件ネットワーク410にて、概念インスタンス4102(板)が関係元または関係先概念インスタンスとなっている関係インスタンスは「4121」「4122」「4123」「4124」(それぞれ側板、仕上、仕上、素材を参照)の4つであるため、影響数=4が記録される。
In the case of the present embodiment, since no matching is recorded in the applied stack, first, the number of candidates and the degree of influence are obtained for all concept instances and relation instances included in the search condition network 410. Recorded as an evaluation table 800 (FIG. 35 (a)). The number of candidates can be obtained by designating an instance, an index network, and a stack being applied, and executing processing S1200 (FIG. 49 described later) to obtain matching candidates. For example, by specifying the conceptual instance “4102” (board) in FIG. 20, the index network 320 in FIG. 13, and an empty applied stack, and executing the process 1200 (FIG. 49), a candidate “{ 3202 and 3206} ”(see the respective plates), the number of
(処理S1109〜S1110)
図35(a)の検索条件ネットワーク評価テーブル800から候補数が最小のインスタンスとしてインスタンス「4101」「4104」「4105」(それぞれエレベータ、HL加工、SUSを参照)を取得する。これらの候補数は0でなく、また影響度は全て等しい(影響度=1)ため、これら全てに関する適用可能なマッチングを処理1200(図49)を実行して取得し、適用待ちスタックにpushする。このとき、適用待ちスタックは適用待ちスタック900(図36(a))の状態となる。(適用可能なマッチングの取得方法は後で詳述する)
(処理S1111〜)
次に、適用待ちスタックが空でないため、popしてマッチング「4105−3203」を取得し、適用中スタックが空であることから、検索条件ネットワーク評価テーブル800 の記録内容をすべてクリアし、適用中スタックにマッチング「4105−3203」を加える(図37(a))。
(Processing S1109 to S1110)
Instances “4101”, “4104”, and “4105” (refer to elevator, HL processing, and SUS, respectively) are acquired as instances with the smallest number of candidates from the search condition network evaluation table 800 in FIG. Since the number of these candidates is not 0 and the influences are all equal (impact = 1), applicable matching for all of them is obtained by executing the process 1200 (FIG. 49) and pushed to the application waiting stack. . At this time, the application waiting stack becomes the state of the application waiting stack 900 (FIG. 36 (a)). (Applicable matching acquisition methods will be described in detail later)
(Processing S1111 ~)
Next, since the stack to be applied is not empty, pop and obtain matching “4105-3203”. Since the stack being applied is empty, all the contents of the search condition network evaluation table 800 are cleared and applied. The matching “4105-3203” is added to the stack (FIG. 37 (a)).
次に、処理S1103〜S1110を繰り返す。まず、適用中スタックに存在する概念/関係以外のインスタンスについて、検索条件ネットワーク評価テーブル810 (図35(b))を記録する。このとき、候補数が最小のインスタンスを取得し、その中から影響度が最大のインスタンスとして「4101」「4104」「4124」を取得し、各々を対象として処理1200(図49)を実行して得られたマッチング先を、適用待ちスタックにpushする。このとき、適用待ちスタックは適用待ちスタック910(図36(b))の状態となる。そして、適用待ちスタックが空でないため、popしてマッチング「4124−3222」を取得する。このとき、当該マッチングのマッチング元「4124」は、適用中スタック末尾のマッチングのマッチング元「4105」と異なるため、検索条件ネットワーク評価テーブル800 の記録内容をすべてクリアし、適用中スタックにマッチング「4105−3203」を加える(図37(b))。 Next, processing S1103 to S1110 is repeated. First, the search condition network evaluation table 810 (FIG. 35 (b)) is recorded for the instances other than the concept / relationship existing in the applied stack. At this time, the instance having the smallest number of candidates is obtained, and “4101”, “4104”, and “4124” are obtained as the instances having the greatest influence from among them, and the processing 1200 (FIG. 49) is executed for each of them. Push the obtained matching destination to the stack waiting for application. At this time, the application waiting stack becomes the application waiting stack 910 (FIG. 36B). Then, since the application waiting stack is not empty, it is popped to obtain the matching “4124-3222”. At this time, since the matching source “4124” of the matching is different from the matching source “4105” at the end of the applied stack, all the recorded contents of the search condition network evaluation table 800 are cleared, and the matching “4105” is applied to the applied stack. −3203 ”is added (FIG. 37 (b)).
次に、処理S1103〜S1110を繰り返す。まず、検索条件ネットワーク評価テーブル820 (図35(c))を記録する。このとき、候補数が最小のインスタンスを取得し、その中から影響度が最大のインスタンスとして「4102」を取得し、これを対象として処理1200(図49)を実行して得られたマッチング先を、適用待ちスタックにpushする。このとき、適用待ちスタックは適用待ちスタック920(図36(c))の状態となる。そして、適用待ちスタックが空でないため、popしてマッチング「4102−3202」を取得する。このとき、当該マッチングのマッチング元「4102」は、適用中スタック末尾のマッチングのマッチング元「4124」と異なるため、検索条件ネットワーク評価テーブル820 の記録内容をすべてクリアし、適用中スタックにマッチング「4102−3202」を加える(図37(c))。 Next, processing S1103 to S1110 is repeated. First, the search condition network evaluation table 820 (FIG. 35 (c)) is recorded. At this time, the instance with the smallest number of candidates is obtained, and “4102” is obtained as the instance with the largest degree of influence, and the matching destination obtained by executing the process 1200 (FIG. 49) for this is selected. Push to the stack waiting for application. At this time, the application waiting stack becomes the application waiting stack 920 (FIG. 36C). Then, since the application waiting stack is not empty, it is popped to obtain the matching “4102-3202”. At this time, since the matching source “4102” of the matching is different from the matching source “4124” at the end of the applied stack, all the recorded contents of the search condition network evaluation table 820 are cleared, and the matching “4102” is applied to the applied stack. −3202 ”is added (FIG. 37 (c)).
以下、同様に繰り返して、適用中スタックが図37(d)の状態になった時に、検索条件ネットワーク410に含まれる全ての概念インスタンス/関係インスタンスについてマッチング先が存在すると判定され、判定結果を「真」と記録し、終了する。 Hereinafter, in the same manner, when the applied stack is in the state shown in FIG. 37 (d), it is determined that there are matching destinations for all concept instances / relationship instances included in the search condition network 410, and the determination result is “ Record "true" and exit.
次に、処理S1200から始まる図49のフローに沿って、適用可能なマッチングの取得フローについて説明する。図49A、図49Bは、図49の部分拡大図である。ここでは、インデックスネットワーク320(図13)を対象とし、適用中スタックは空であるとし、検索条件ネットワーク410のインスタンスの概念インスタンス「4102」(板)を指定して、当該概念インスタンスをマッチング元とするマッチングを取得する過程について説明する。まず、検索条件判定部93が、インデックスネットワークの要素を1つずつ取得し、指定された概念インスタンス「4102」が参照する概念「板」のインスタンスであるか否かを判定する。
Next, an applicable matching acquisition flow will be described along the flow of FIG. 49 starting from processing S1200. 49A and 49B are partially enlarged views of FIG. Here, the index network 320 (FIG. 13) is targeted, the applied stack is empty, the concept instance “4102” (board) of the instance of the search condition network 410 is designated, and the concept instance is set as the matching source. A process for acquiring matching to be performed will be described. First, the search
ここで、あるインスタンスaがオブジェクト(概念または関係)Bのインスタンスであるかどうかは、インスタンスaの参照するオブジェクトAの上位概念(上位関係)にオブジェクトBが位置付けられるか否かで判定する。このとき、インスタンスaが参照するオブジェクトAを取得してオブジェクトBと一致するか比較し、一致しなければ、さらにオブジェクトAの上位オブジェクトを取得してオブジェクトBと比較する、という処理を、オブジェクトAの上位概念がなくなるまで繰り返すことで判定できる。 Here, whether an instance a is an instance of an object (concept or relationship) B is determined by whether or not the object B is positioned in a superordinate concept (superordinate relationship) of the object A referred to by the instance a. At this time, the object A referred to by the instance a is acquired and compared with the object B, and if it does not match, the object A is further acquired and compared with the object B. It can be judged by repeating until the superordinate concept of is gone.
このとき、例えばインデックスネットワーク320に含まれる概念インスタンス「3201」(ギヤレスエレベータを参照)や関係インスタンス「3222」(素材を参照)などは概念「板」のインスタンスとして判定されず、概念インスタンス「3202」「3206」(それぞれ板を参照)のみが概念「板」のインスタンスに該当する。このとき、適用中マッチングは登録されていないため、各インスタンスに対するマッチングのリスト「{「4102−3202」「4102−3206」}」が得られる。 At this time, for example, the concept instance “3201” (refer to the gearless elevator) and the related instance “3222” (refer to the material) included in the index network 320 are not determined as instances of the concept “plate”, but the concept instance “3202”. Only “3206” (refer to the plate respectively) corresponds to the instance of the concept “plate”. At this time, since the matching under application is not registered, a matching list “{“ 4102-3202 ”“ 4102-3206 ”}” for each instance is obtained.
また、インデックスネットワーク320を対象とし、適用中スタックが図37(b)の状態にあるとき、検索条件ネットワークのインスタンスの概念インスタンス「4102」(板)を指定して、当該概念インスタンスをマッチング元とするマッチングを取得する過程について説明する。まず、検索条件判定部93が、インデックスネットワークの要素を1つずつ取得し、指定された概念インスタンス「4102」が参照する概念「板」のインスタンスを取得する。本実施形態の場合、概念インスタンス「3202」「3206」が取得される。次に、概念インスタンス「3202」「3206」を関係元概念インスタンスまたは関係先概念インスタンスとする関係インスタンスを取得する。この場合、概念インスタンス「3202」からは関係インスタンス「3221」「3222」「3223」「3224」が得られ、概念インスタンス「3206」からは関係インスタンス「3220」「3225」「3227」が取得される。次に、適用中スタックに登録されているマッチングから、取得した関係インスタンスのいずれかをマッチング先とするマッチングを取得する。この実施形態の場合、「4124−3222」が得られる。そこで、当該マッチング「4124−3222」と概念インスタンス「4102」を指定して処理S1300(後述する図50)を実行し、「4102−3202」がマッチング適用可能であるかどうかを取得する。この場合、処理S1300(図50)の実行結果が「真」となることから、「4102−3202」を適用可能マッチングリストの末尾に記録する。(マッチング適用可否の判定方法は後で詳述する)
When the index network 320 is targeted and the applied stack is in the state shown in FIG. 37 (b), the concept instance “4102” (board) of the search condition network instance is designated, and the concept instance is set as the matching source. A process for acquiring matching to be performed will be described. First, the search
次に、処理S1300から始まる図50のフローに沿って、マッチング適用可否の判定フローについて説明する。図50A、図50B、図50C、図50Dは、図50の部分拡大図である。ここでは、マッチング「4124−3222」と概念インスタンス「4102」を指定して実行した結果について説明する。 Next, a flow for determining whether or not to apply matching will be described along the flow of FIG. 50 starting from processing S1300. 50A, 50B, 50C, and 50D are partially enlarged views of FIG. Here, the result of specifying and executing the matching “4124-3222” and the concept instance “4102” will be described.
(処理S1301〜S1305)
まず、指定された概念インスタンス「4102」は、概念インスタンスであるため、指定されたマッチングのマッチング元インスタンス「4124」の関係元概念であるか否かをチェックする。検索条件ネットワーク410から、判定結果は真となる。
(Processing S1301 to S1305)
First, since the designated concept instance “4102” is a concept instance, it is checked whether or not it is a relation source concept of the matching source instance “4124” of the designated matching. From the search condition network 410, the determination result is true.
(処理S1306)
次に、概念インスタンス「4102」が、関係インスタンス「3222」の関係元概念インスタンスである概念インスタンス「3202」の参照する概念「板」のインスタンスであるか、さらに上位概念のインスタンスであるかをチェックする。概念インスタンス「4102」が参照する概念は「板」であるため、判定結果は真となる。
(Processing S1306)
Next, it is checked whether the concept instance “4102” is an instance of the concept “board” referenced by the concept instance “3202” that is the relation source concept instance of the relationship instance “3222”, or a higher-level concept instance. To do. Since the concept referred to by the concept instance “4102” is “board”, the determination result is true.
(処理S1311〜S1312)
判定結果を真として、処理を終了する。
(Processing S1311 to S1312)
The determination result is true and the process is terminated.
<実施形態における効果>
以上により、図18(a)検索キーワード入力画面1の検索条件入力部に入力されている内容で情報検索を行った場合は、図25の検索結果表示画面例1が検索結果として表示されることの説明を終える。ところで、同様の実施形態を持つ本実施形態を他の入力に対して実行すると、図18(b) 検索キーワード入力画面例2の検索条件入力部に入力されている内容で情報検索を行った場合は図26の検索結果表示画面例2が検索結果として表示され、図18(c) 検索キーワード入力画面例3の検索条件入力部に入力されている内容で情報検索を行った場合は、図27検索結果なし表示画面が検索結果として表示される。
<Effect in embodiment>
As described above, when an information search is performed with the content entered in the search condition input part of the search
ここで本実施形態の効果を明確にするため、従来手法を用いた情報検索装置に本実施形態と同様の入力を与えて判定した結果と、本実施形態の結果とを比較する。まず、オントロジーを用いることで「下位のキーワードが含まれていれば上位のキーワードが含まれていると同様に扱う」処理が可能ではあるが、検索条件判定は個別のキーワード有無を行う従来型キーワードマッチング情報検索装置を想定する。ここで、この装置に対し、“SUSの素材で、HL加工や鏡面加工が施された側板を持つエレベータ”を意図して「エレベータ 側板 鏡面加工 HL加工 素材 SUS」と列挙されたキーワードを入力し、AND型の検索を実行する場合を考える。この結果は、検索対象ID2200の検索対象データは検索条件を満たさないものとして処理される(キーワード「素材」が付与されていないため)。一方、同様の意図を持って、「エレベータ 側板 鏡面加工 HL加工 素材 SUS」とキーワードを列挙して入力とした場合、本実施形態によれば検索対象ID「2200」の検索対象データは検索条件を満たすものとして出力される。ここで、本実施形態が対象とするデータやオントロジーの範囲で解釈すると、検索対象ID「2200」の検索対象データに付与されている「SUS」は、側板における素材の役割を担うものであり、検索対象ID「2200」の検索対象データは検索条件を満たすものとして扱われる方が適切であると言える。このことから、本実施形態の情報検索装置によれば、従来方式では「検索条件に指定されたキーワードが、あるインデックスに含まれていない」ことから検索条件を満たさないと判定されていたデータに対して、「検索条件ネットワークの概念インスタンス/関係インスタンスが、インデックスネットワークのある概念インスタンス/関係インスタンスに対応する」ことから検索条件を満たすと判定することを可能にしており、検索再現率を向上させる効果が得られると言える。
Here, in order to clarify the effect of the present embodiment, the determination result obtained by giving the same input as in the present embodiment to the information search apparatus using the conventional method is compared with the result of the present embodiment. First, by using an ontology, it is possible to process “if a lower keyword is included, treat it as if a higher keyword is included”, but search condition determination is a conventional keyword that determines whether or not an individual keyword exists. A matching information retrieval device is assumed. Here, the keyword enumerated as “Elevator side plate Mirror surface processed HL processed material SUS” was input to this device with the intention of “Elevator with side plate that is made of SUS material and subjected to HL processing and mirror surface processing”. Consider the case of performing an AND type search. This result is processed assuming that the search target data of the
また、上記の従来型キーワードマッチング情報検索装置に対して、同様の意図の下、「エレベータ 側板 鏡面加工 HL加工 SUS」と列挙されたキーワードを入力し、AND型の検索を実行した場合を考える。この結果は、検索対象ID「2100」の検索対象データは検索条件を満たすものとして処理される(オントロジー100を利用することで、「エレベータ」というキーワードが含まれていれば「ギヤレスエレベータ」や「ギヤ式エレベータ」というキーワードが含まれていると見なされるものとする)。一方、本実施形態によれば、「エレベータ 側板 鏡面加工 HL加工 SUS」という入力を受け付けた場合でも、「エレベータ 側板 鏡面加工 HL加工 素材 SUS」という入力を受け付けた場合と同様の検索条件ネットワークが形成され、索対象ID「2100」の検索対象データは条件を満たさないものとして処理される。ここで、本実施形態が対象とするデータやオントロジーの範囲で解釈すると、検索対象ID「2100」の検索対象およびインデックスネットワーク310における「鏡面加工」は、側板に施されるものではなく、扉板に施されるものであるため、検索対象ID「2100」の検索対象データは検索条件を満たさないものとして扱われる方が適切であると言える。このことから、本実施形態の情報検索装置によれば、従来方式では「検索条件に指定されたキーワードが、あるインデックスに含まれる」ことから検索条件を満たすと判定されていたデータに対して、「検索条件ネットワークの概念インスタンス/関係インスタンスが、インデックスネットワークの概念インスタンス/関係インスタンスに対応しない」ことから検索条件を満たさないと判定することを可能にすることで、検索条件として指定されたキーワードが検索対象データに付与されたキーワードに含まれるか否かのみで判定することに起因する検索適合率・検索再現率の低下を防ぎ、従来方式よりも再現率や適合率の高い検索を可能にする。
Also, consider the case where an AND-type search is executed by inputting the keyword listed as “elevator side plate mirror surface processing HL processing SUS” with the same intention to the above conventional keyword matching information search device. As a result, the search target data of the search target ID “2100” is processed as satisfying the search condition (if the keyword “elevator” is included by using ontology 100, “gearless elevator” or “ It ’s assumed that the keyword “gear elevator” is included). On the other hand, according to the present embodiment, even when an input of “elevator side plate mirror finish HL machining SUS” is accepted, a search condition network similar to that when an input of “elevator side plate mirror finish HL machining material SUS” is accepted is formed. Thus, the search target data with the search target ID “2100” is processed as not satisfying the condition. Here, when interpreted in the range of the data and ontology targeted by this embodiment, the search target of the search target ID “2100” and the “mirror finish” in the
なお以上に説明した図1の情報検索装置は、例えば、汎用のコンピュータ装置を基本ハードウエアとして用いることでも実現することが可能である。すなわち、図1の装置が備える各要素は、各要素の処理を行う指示を記述したプログラムをコンピュータに実行させることにより実現してもよい。このとき、情報分類階層管理装置は、上記のプログラムをコンピュータ装置にあらかじめインストールすることで実現してもよいし、ハードディスク、メモリ装置、光ディスク等の記憶媒体に記憶して、あるいはネットワークを介して上記のプログラムを配布して、このプログラムをコンピュータ装置に適宜インストールすることで実現してもよい。また、オントロジーDB、インデックスキーワードDB、検索対象DBは、上記のコンピュータ装置に内蔵あるいは外付けされたメモリ、ハードディスクもしくはCD−R、CD−RW、DVD−RAM、DVD−Rなどの記憶媒体などを適宜利用して実現することができる。 The above-described information retrieval apparatus shown in FIG. 1 can also be realized by using, for example, a general-purpose computer apparatus as basic hardware. That is, each element provided in the apparatus of FIG. 1 may be realized by causing a computer to execute a program describing an instruction to perform processing of each element. At this time, the information classification hierarchy management device may be realized by installing the above program in a computer device in advance, or may be stored in a storage medium such as a hard disk, a memory device, or an optical disk, or via a network. This program may be distributed and this program may be installed in a computer device as appropriate. In addition, the ontology DB, index keyword DB, and search target DB are stored in a memory device such as a hard disk or a CD-R, a CD-RW, a DVD-RAM, a DVD-R, etc. It can be realized by appropriately using.
Claims (4)
複数の検索対象データを記憶する検索対象データベースと、
前記検索対象データ毎にインデックスキーワードのリストを記憶するインデックスキーワードデータベースと、
利用者が検索条件として指定した検索キーワードのリストを受け付ける検索条件受付部と、
複数のキーワードを受け取り、受け取ったキーワードに対応する概念または関係を表すノードまたはリンクを前記第1オントロジーにおいて特定し、特定したノードまたはリンク間をつなぐ経路を前記第1オントロジー内のノードとリンクを辿って探索し、前記特定したノードまたはリンクを、探索により見つけた経路で接続した意味ネットワークを生成する意味ネットワーク生成部と、
前記検索条件受付部で受け付けた検索キーワードを前記キーワードとして前記意味ネットワーク生成部に与え、前記意味ネットワーク生成部で生成される意味ネットワークを検索条件ネットワークとして取得する検索条件ネットワーク生成部と、
前記検索対象データ毎に前記リストに含まれるインデックスキーワードを前記キーワードとして前記意味ネットワーク生成部に与え、前記意味ネットワーク生成部で生成される意味ネットワークをインデックスネットワークとして取得するインデックスネットワーク生成部と、
前記検索条件ネットワークと同一の構造、もしくは前記検索条件ネットワークに含まれる任意のノードまたはリンクを下位概念または下位関係を表すノードまたはリンクに置換したものと同一の構造、を含むインデックスネットワークを、前記インデックスネットワーク生成部により生成されたインデックスネットワークの中から検出する検索条件判定部と、
前記検索条件判定部で検出したインデックスネットワークに対応する検索対象データを前記検索対象データベースから取得し、取得した検索対象データを出力する検索結果出力部と、
を備えた情報検索装置。 A first ontology having a plurality of nodes representing a plurality of concepts and connected in a hierarchy, and a plurality of directional links that connect the two nodes and represent a relationship between the concepts corresponding to the two nodes; An ontology database representing a second ontology having a plurality of nodes representing a plurality of the relationships and connected in a hierarchical manner;
A search target database for storing a plurality of search target data; and
An index keyword database for storing a list of index keywords for each search target data;
A search condition receiving unit for receiving a list of search keywords specified by the user as a search condition;
A plurality of keywords are received, a node or link representing a concept or relationship corresponding to the received keyword is identified in the first ontology, and a path connecting the identified nodes or links is traced to the nodes and links in the first ontology. And a semantic network generation unit that generates a semantic network in which the identified node or link is connected by a route found by the search;
A search condition network generation unit that gives the search keyword received by the search condition reception unit as the keyword to the semantic network generation unit, and acquires the semantic network generated by the semantic network generation unit as a search condition network;
An index network generation unit that gives an index keyword included in the list for each search target data as the keyword to the semantic network generation unit, and acquires a semantic network generated by the semantic network generation unit as an index network;
An index network including the same structure as the search condition network, or the same structure obtained by replacing any node or link included in the search condition network with a node or link representing a subordinate concept or subordinate relationship, A search condition determination unit for detecting from the index network generated by the network generation unit;
A search result output unit that acquires search target data corresponding to the index network detected by the search condition determination unit from the search target database, and outputs the acquired search target data;
An information retrieval apparatus comprising:
前記検索条件ネットワーク生成部は、検索キーワードの順位を前記意味ネットワーク生成部に通知し、
前記意味ネットワーク生成部は、n番目の順位のキーワードに対応するノードまたはリンクから、方向付きリンクの逆方向をたどる探索を行って、1番目〜n−1番目の順位のいずれか1つのキーワードに対応するノードまたはリンクへの経路を見つけ、この処理をnの値を1から、前記検索条件ネットワーク生成部から受け取ったキーワード数まで順次増加させながら行う
ことを特徴とする請求項1に記載の情報検索装置。 The search condition accepting unit accepts a search keyword order specification,
The search condition network generation unit notifies the meaning network generation unit of the ranking of search keywords,
The semantic network generation unit searches a node or link corresponding to the n-th ranking keyword in the reverse direction of the link with direction, and selects any one of the first to n−1 ranking keywords. 2. The information according to claim 1, wherein a route to a corresponding node or link is found, and this process is performed while sequentially increasing the value of n from 1 to the number of keywords received from the search condition network generation unit. Search device.
前記インデックスネットワーク生成部は、前記インデックスキーワードの順位を前記意味ネットワーク生成部に通知し、
前記意味ネットワーク生成部は、n番目の順位のキーワードに対応するノードまたはリンクから、方向付きリンクの逆方向をたどる探索を行って、1番目〜n−1番目の順位のいずれか1つのキーワードに対応するノードまたはリンクへの経路を見つけ、この処理をnの値を1から、前記インデックスネットワーク生成部から通知されたキーワード数まで順次増加させながら行う
ことを特徴とする請求項1または2に記載の情報検索装置。 A ranking is specified for the index keywords in the list in the index keyword database,
The index network generation unit notifies the semantic network generation unit of the index keyword ranking;
The semantic network generation unit searches a node or link corresponding to the n-th ranking keyword in the reverse direction of the link with direction, and selects any one of the first to n−1 ranking keywords. 3. The route to the corresponding node or link is found, and this process is performed while sequentially increasing the value of n from 1 to the number of keywords notified from the index network generation unit. Information retrieval device.
前記意味ネットワーク生成部は、
1〜n−1番目の順位のキーワードに対応するノードまたはリンクのうち前記複数の部分的オントロジーにそれぞれ属するものの個数を利用して、前記複数の部分的オントロジーにそれぞれ探索優先順位を設定し、
前記探索において探索可能な複数のリンクが存在するときは、前記複数のリンクの接続元のノードが属する部分的オントロジーの探索優先順位に基づき、探索を優先して行うリンクを前記複数のリンクから特定し、特定したリンクから優先的に探索する
ことを特徴とする請求項2または3に記載の情報検索装置。 The ontology comprises a plurality of partial ontologies;
The semantic network generation unit
A search priority is set for each of the plurality of partial ontologies using the number of nodes or links corresponding to the 1st to n−1th ranking keywords respectively belonging to the plurality of partial ontologies,
When there are a plurality of links that can be searched in the search, a link to be prioritized for the search is identified from the plurality of links based on the search priority of the partial ontology to which the connection source node of the plurality of links belongs. 4. The information search device according to claim 2, wherein the search is performed preferentially from the specified link.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217691A JP5225350B2 (en) | 2010-09-28 | 2010-09-28 | Information retrieval device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217691A JP5225350B2 (en) | 2010-09-28 | 2010-09-28 | Information retrieval device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012073787A JP2012073787A (en) | 2012-04-12 |
JP5225350B2 true JP5225350B2 (en) | 2013-07-03 |
Family
ID=46169895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010217691A Expired - Fee Related JP5225350B2 (en) | 2010-09-28 | 2010-09-28 | Information retrieval device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5225350B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107451164B (en) * | 2016-06-01 | 2020-05-19 | 华为技术有限公司 | Semantic query method and device |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4547300B2 (en) * | 2005-05-09 | 2010-09-22 | 日本電信電話株式会社 | Common query graph pattern generation device, generation method, generation program, and common subgraph search device, search method, and search program using the same |
-
2010
- 2010-09-28 JP JP2010217691A patent/JP5225350B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012073787A (en) | 2012-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jung | Semantic vector learning for natural language understanding | |
US9542477B2 (en) | Method of automated discovery of topics relatedness | |
JP5376163B2 (en) | Document management / retrieval system and document management / retrieval method | |
US10853357B2 (en) | Extensible automatic query language generator for semantic data | |
US20170147566A1 (en) | Converting data into natural language form | |
US8401842B1 (en) | Phrase matching for document classification | |
JP2009104630A (en) | Machine learning approach to determining document relevance for searching over large electronic collections of documents | |
US11429792B2 (en) | Creating and interacting with data records having semantic vectors and natural language expressions produced by a machine-trained model | |
CN113254507B (en) | Intelligent construction and inventory method for data asset directory | |
CN108664509A (en) | A kind of method, apparatus and server of extemporaneous inquiry | |
CN115438195A (en) | Construction method and device of knowledge graph in financial standardization field | |
Sun | A natural language interface for querying graph databases | |
US7676739B2 (en) | Methods and apparatus for knowledge base assisted annotation | |
Barbosa et al. | An approach to clustering and sequencing of textual requirements | |
Artiles et al. | CUNY BLENDER TAC-KBP2011 Temporal Slot Filling System Description. | |
JP5225350B2 (en) | Information retrieval device | |
CN116861269A (en) | Multi-source heterogeneous data fusion and analysis method in engineering field | |
Martarelli et al. | How to undertake reviews of large collections of articles and establish main contributions: An ontology-based literature review approach | |
Rashid | Access methods for Big Data: current status and future directions | |
JP5916016B2 (en) | Synonym determination device, synonym learning device, and program | |
WO2022234273A1 (en) | Project data processing method and apparatus | |
Sharma et al. | Indexer++ workload-aware online index tuning with transformers and reinforcement learning | |
US20220156285A1 (en) | Data Tagging And Synchronisation System | |
US20090319505A1 (en) | Techniques for extracting authorship dates of documents | |
Chiarello et al. | Design and implementation of a text mining-based tool to support scoping reviews |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130312 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160322 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |