JP5330049B2 - Search device, method and program - Google Patents

Search device, method and program Download PDF

Info

Publication number
JP5330049B2
JP5330049B2 JP2009074490A JP2009074490A JP5330049B2 JP 5330049 B2 JP5330049 B2 JP 5330049B2 JP 2009074490 A JP2009074490 A JP 2009074490A JP 2009074490 A JP2009074490 A JP 2009074490A JP 5330049 B2 JP5330049 B2 JP 5330049B2
Authority
JP
Japan
Prior art keywords
dictionary data
class
dictionary
property
word element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009074490A
Other languages
Japanese (ja)
Other versions
JP2010225101A (en
Inventor
康隆 大嶽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2009074490A priority Critical patent/JP5330049B2/en
Publication of JP2010225101A publication Critical patent/JP2010225101A/en
Application granted granted Critical
Publication of JP5330049B2 publication Critical patent/JP5330049B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a retrieval technology allowing retrieval of dictionary data fit for an intention of a retriever. <P>SOLUTION: When a dictionary data management part 21 registers dictionary data into a dictionary DB 13, an index storage part 22 word-analyzes a certain kind of attribute included in the dictionary data, performs weighting in each word element according to the kind of the attribute, and registers an index. The dictionary data are retrieved by use of the index and the word element obtained by appropriately decomposing a keyword whose input is received by an input reception part 23. When the retrieved dictionary data are both pieces of the dictionary data corresponding to a class and the dictionary data corresponding to a property, a dictionary element ranking decision part 25 decides ranking according to correspondence relation between the class and the property. A retrieval result output part 26 transmits at least recommendation name included in each piece of the dictionary data to a retriever terminal 12 as a retrieval result in decided ranking order. <P>COPYRIGHT: (C)2011,JPO&amp;INPIT

Description

本発明は、検索装置、方法及びプログラムに関する。   The present invention relates to a search device, a method, and a program.

従来、製品を製造したり販売したりするサプライヤ企業と、その製品を利用するユーザ企業との間で交換される技術文書には、製品カタログ、スペックシート、納入仕様書などがある。これらの文書で用いる用語、特に、製品の仕様を表すデータ項目の統一が急務の課題となっている。用語やデータ項目の統一は、サプライヤ企業内におけるデータ作成のみならず、ユーザ企業とサプライヤ企業との間においても、ユーザ企業側の文書の一覧性の観点から必要となってきている。最近では、サプライヤ企業と、ユーザ企業とが一丸となり製品分類毎に標準的なデータ項目を定めた辞書(標準辞書という)を開発しており、データ項目の標準化や統一化がはかられるようになってきている。辞書の形式の1つとして、ISO13584(通称、PLIB:Parts Library)がある。PLIBは、各製品の仕様データを表現するためのデータ項目の集合である「プロパティ」と製品分類を定める「クラス」とを定義するための構造及びその辞書に従って具体的な製品仕様を記述した「コンテンツ」を交換するための構造を定めた国際規格である。PLIBにおいては、データ項目が何を意味するかを説明する詳細項目に相当する「アトリビュート」を標準化している。PLIBに従ったデータを管理するデータベースは、階層型データベースの1つととらえることができる。   Conventionally, technical documents exchanged between a supplier company that manufactures or sells a product and a user company that uses the product include a product catalog, a specification sheet, and a delivery specification. Unification of terms used in these documents, especially data items representing product specifications, is an urgent issue. Unification of terms and data items is required not only for data creation within the supplier company, but also between the user company and the supplier company from the viewpoint of the list of documents on the user company side. Recently, a supplier company and a user company have been working together to develop a dictionary (standard dictionary) that defines standard data items for each product category, so that data items can be standardized and unified. It has become to. One dictionary format is ISO13584 (commonly known as PLIB: Parts Library). PLIB describes a specific product specification according to a structure for defining a “property” that is a set of data items for expressing specification data of each product and a “class” that defines a product classification and a dictionary thereof. It is an international standard that defines a structure for exchanging “content”. In PLIB, “attributes” corresponding to detailed items for explaining what a data item means are standardized. A database that manages data according to PLIB can be regarded as one of hierarchical databases.

PLIBに従う国際辞書としては、計測器に関するISO13584-501や、ボルト/ナットなどに関するISO13584-511などがある。また、工業界標準辞書としては、日本では(社)電子情報技術産業協会のECALS辞書、(社)日本電機工業会のJeMarche辞書などがある。世界各国においても、このような辞書の開発が活発となっている。   International dictionaries conforming to PLIB include ISO13584-501 for measuring instruments and ISO13584-511 for bolts / nuts. In Japan, there are ECALS dictionaries of the Japan Electronics and Information Technology Industries Association and JeMarche dictionaries of the Japan Electrical Manufacturers' Association. Development of such dictionaries is also active all over the world.

PLIB辞書には、「プロパティ」の「アトリビュート」の1つとして、「推奨名」が定義されており、一般の製品仕様文書などの技術文書においても、この「推奨名」で定義された用語が用いられることが望ましいと考えられる。用語として別名が用いられていたとしても、その概念自体は辞書にて定義された「プロパティ」と一致することが望ましい。   In the PLIB dictionary, “recommended name” is defined as one of “attributes” of “property”, and the term defined by this “recommended name” is also used in technical documents such as general product specification documents. It is considered desirable to be used. Even if an alias is used as a term, the concept itself preferably matches the “property” defined in the dictionary.

通常、技術文書を作成するのは、一般のドメインエンジニアである。このためPLIBに精通していないエンジニアであっても、自分が頭の中で思い描いている「プロパティ」やその「推奨名」をキーワード入力等により簡単に正しく同定(検索)できる機能が必要とされている。   Usually, a general domain engineer creates a technical document. For this reason, even an engineer who is not familiar with PLIB needs a function that can easily identify (search) the “property” and its “recommended name” that he / she envisioned in his / her head by inputting keywords. ing.

階層型データベースの「プロパティ」及び「アトリビュート」を含む辞書データを検索する方式としては、例えば以下の2つの方式がある。
(1)いくつかのアトリビュートをまとめて部分一致検索する方式。例えば「推奨名」と「別名」と「短縮名」などのアトリビュートに関して入力したキーワードと部分一致するプロパティを出力するという方式(例えば特許文献1,2参照)。
(2)ベクトル空間法によって検索する方式。例えば、全文検索を利用し、文書をN-gram又は形態素解析により単語に分割して、tf-idfに代表されるように特徴ベクトルを抽出し、これをキーワードのベクトルと比較し、類似する辞書データを検索するという方式。
For example, there are the following two methods for searching dictionary data including “property” and “attribute” of the hierarchical database.
(1) A method in which several attributes are collectively searched for partial matching. For example, a method of outputting a property that partially matches a keyword input with respect to attributes such as “recommended name”, “alias”, and “short name” (see, for example, Patent Documents 1 and 2).
(2) A search method using a vector space method. For example, use full-text search, divide a document into words by N-gram or morphological analysis, extract feature vectors as typified by tf-idf, compare this with keyword vectors, and similar dictionary A method of retrieving data.

また、PLIBの検索とは少し異なるが、一般のオントロジー検索エンジンの分野において、辞書データを検索する方式としては、例えば以下の2つの方式がある。
(3)Web上のオントロジーについて「クラス名」や「プロパティ名」などを対象に部分一致検索し、閲覧するOntoSelectという方式。これは上述の(1)の方式と略同等である。
(4)より多くのセマンティックWebコンテンツから参照されているクラスやプロパティが良いオントロジーであるとの前提に立ち、検索結果をランキングするSwoogleにおけるOntoRankやTermRankなどの方式。
Further, although a little different from PLIB search, there are the following two methods for searching dictionary data in the field of general ontology search engines, for example.
(3) A method called OntoSelect that searches for partial matches on the ontologies on the Web for "class names" and "property names" and browses them. This is substantially equivalent to the method (1) described above.
(4) A method such as OntoRank or TermRank in Swoogle that ranks search results on the premise that the classes and properties referenced from more semantic Web contents are good ontologies.

特開2004−177996号公報JP 2004-177996 A 特開2004−178015号公報JP 2004-178015 A

しかしながら、(1)、(3)の方式では、個々の辞書データを検索対象としているため、例えば以下のような問題が発生する恐れがある。検索者が「クラス」「プロパティ」をまたがるキーワードを入力することで、関連する辞書データを検索して関連性の高い順にランキングするといったケースでは、辞書上に同一の「推奨名」を持つプロパティが存在する場合、検索者の意図に合わない誤ったランキングを提示してしまう恐れがある。   However, in the methods (1) and (3), since individual dictionary data is a search target, for example, the following problems may occur. When a searcher inputs a keyword that crosses “class” and “property”, and the related dictionary data is searched and ranked in the order of high relevance, a property with the same “recommended name” is displayed on the dictionary. If it exists, there is a risk of presenting an incorrect ranking that does not match the searcher's intention.

また、各辞書データを文書と見なし、(2)の方式で辞書データを検索する場合には、例えば以下のことが困難になる恐れがある。辞書データにおける定義は文字数が少ないため、そこから特徴ベクトルを抽出することは不正確となり、PLIB内にある「クラス」「プロパティ」間の明示的な関係を検索結果に反映するということである。更に(4)の方式では、ランキングの上位になった辞書データが、必ずしも対象領域において適用可能であるとは限らない、といった問題があることが分かっている。   Further, when each dictionary data is regarded as a document and the dictionary data is searched by the method (2), for example, the following may be difficult. Since the definition in the dictionary data has a small number of characters, it is inaccurate to extract a feature vector therefrom, and the explicit relationship between “class” and “property” in the PLIB is reflected in the search result. Furthermore, it has been found that the method (4) has a problem that dictionary data having a higher ranking is not always applicable in the target area.

本発明は、上記に鑑みてなされたものであって、検索者の意図に合った辞書データを検索可能な検索装置、方法及びプログラムを提供することを目的とする。   The present invention has been made in view of the above, and an object of the present invention is to provide a search device, method, and program capable of searching dictionary data that matches a searcher's intention.

上述した課題を解決し、本発明は、検索装置であって、分類を示すクラス毎のデータであってアトリビュートによって記述される辞書データ及びプロパティ毎のデータであってアトリビュートによって記述される辞書データを記憶する第1記憶手段と、前記辞書データのアトリビュートのうちある種類のアトリビュートの値を単語解析して、前記辞書データ毎に少なくとも1つの第1単語要素を各々得る第1解析手段と、前記辞書データ毎の各前記第1単語要素に対して、前記アトリビュートの種類に応じた重み付けを行う重み付け手段と、前記第1単語要素と、当該第1単語要素に対して付けられた重みとを前記辞書データと対応付けて記憶する第2記憶手段と、キーワードの入力を受け付ける第1入力受付手段と、前記キーワードを単語解析して、少なくとも1つの第2単語要素を得る第2解析手段と、前記第2単語要素と一致する前記第1単語要素に対応する前記辞書データを検索する検索手段と、検索された前記辞書データを同一のクラス又は同一のプロパティ毎にグループ化し、前記第1単語要素に対して付けられた重みに従って、グループ毎に前記辞書データをランキングするランキング手段と、検索された辞書データが、クラスに対応する前記辞書データ及びプロパティに対応する前記辞書データの両方ある場合、クラスとプロパティとの対応関係に応じて、前記グループ毎の前記辞書データのランキングを確定する確定手段と、確定されたランキングの順に前記辞書データのアトリビュートのうち少なくとも1つを出力する出力手段とを備えることを特徴とする。 To solve the above problems, the present invention provides a searching apparatus is described by attribute a data dictionary data and each piece of property that a data is therefore described in the Attributes, for each class indicating the classification First storage means for storing dictionary data, and first analysis means for analyzing at least one first word element for each dictionary data by word-analyzing a certain kind of attribute value among the attributes of the dictionary data , Weighting means for weighting each first word element for each dictionary data according to the type of the attribute, the first word element, and a weight attached to the first word element Is stored in association with the dictionary data, first input receiving means for receiving keyword input, and the keyword as a word. Second analysis means for analyzing and obtaining at least one second word element; search means for searching for the dictionary data corresponding to the first word element matching the second word element; and the searched dictionary Ranking means for grouping the data into the same class or the same property, ranking the dictionary data for each group according to the weight assigned to the first word element, and the searched dictionary data into the class When there is both the corresponding dictionary data and the dictionary data corresponding to the property, a determination unit that determines the ranking of the dictionary data for each group according to the correspondence relationship between the class and the property, and Output means for outputting at least one of the attributes of the dictionary data in order.

また、本発明は、分類を示すクラス毎のデータであってアトリビュートによって記述される辞書データ及びプロパティ毎のデータであってアトリビュートによって記述される辞書データを記憶する第1記憶手段を備える検索装置で実行される検索方法であって、前記辞書データのアトリビュートのうちある種類のアトリビュートの値を単語解析して、前記辞書データ毎に少なくとも1つの第1単語要素を各々得る第1解析ステップと、前記辞書データ毎の各前記第1単語要素に対して、前記アトリビュートの種類に応じた重み付けを行う重み付けステップと、前記第1単語要素と、当該第1単語要素に対して付けられた重みとを前記辞書データと対応付けて第2記憶手段に記憶させる記憶制御ステップと、キーワードの入力を受け付ける第1入力受付ステップと、前記キーワードを単語解析して、少なくとも1つの第2単語要素を得る第2解析ステップと、前記第2単語要素と一致する前記第1単語要素に対応する前記辞書データを検索する検索ステップと、検索された前記辞書データを同一のクラス又は同一のプロパティ毎にグループ化し、前記第1単語要素に対して付けられた重みに従って、グループ毎に前記辞書データをランキングするランキングステップと、検索された辞書データが、クラスに対応する前記辞書データ及びプロパティに対応する前記辞書データの両方ある場合、クラスとプロパティとの対応関係に応じて、前記グループ毎の前記辞書データのランキングを確定する確定ステップと、確定されたランキングの順に前記辞書データのアトリビュートのうち少なくとも1つを出力する出力ステップとを含むことを特徴とする。 Further, the present invention comprises a first storage means for storing the dictionary data described by a data dictionary data and each piece of the property attributes to be thus described Attributes, a data for each class indicating the classification A search method executed by a search device, wherein a word analysis is performed on a value of a certain kind of attribute among the attributes of the dictionary data to obtain at least one first word element for each dictionary data. A weighting step for weighting each first word element for each dictionary data according to the type of the attribute, the first word element, and a weight assigned to the first word element Is stored in the second storage means in association with the dictionary data, and a first keyword input is received. A force receiving step, a second analysis step of analyzing the keyword to obtain at least one second word element, and searching the dictionary data corresponding to the first word element that matches the second word element A ranking step of grouping the searched dictionary data into the same class or the same property, and ranking the dictionary data for each group according to a weight attached to the first word element; When the retrieved dictionary data includes both the dictionary data corresponding to the class and the dictionary data corresponding to the property, the ranking of the dictionary data for each group is determined according to the correspondence between the class and the property. Among the attributes of the dictionary data in the order of the confirmation step and the confirmed ranking, Both characterized in that it comprises an output step of outputting one.

また、本発明は、上記の記載の方法をコンピュータに実行させるためのプログラムである。   The present invention is also a program for causing a computer to execute the above-described method.

本発明によれば、検索者の意図に合った辞書データを検索可能になる。   According to the present invention, it is possible to search dictionary data that matches a searcher's intention.

以下に添付図面を参照して、この発明にかかる検索装置、方法及びプログラムの最良な実施の形態を詳細に説明する。   Exemplary embodiments of a search device, a method, and a program according to the present invention will be explained below in detail with reference to the accompanying drawings.

(1)構成
まず、本実施の形態にかかる検索システムの構成について図1を用いて説明する。検索システムは、検索装置10は、辞書管理者端末11と有線又は無線により接続され、検索者端末12と有線又は無線により接続される。辞書管理者端末11は、後述する辞書DBへ登録する辞書データを検索装置10に送信する。検索者端末12は、検索者が辞書データを検索するためにキーワードが入力される装置であり、入力されたキーワードを検索装置10に送信する。
(1) Configuration First, the configuration of the search system according to the present embodiment will be described with reference to FIG. In the search system, the search device 10 is connected to the dictionary manager terminal 11 by wire or wireless, and is connected to the searcher terminal 12 by wire or wireless. The dictionary manager terminal 11 transmits dictionary data to be registered in a dictionary DB, which will be described later, to the search device 10. The searcher terminal 12 is a device in which a keyword is input in order for the searcher to search dictionary data, and transmits the input keyword to the search device 10.

次に、検索装置10のハードウェア構成について図2を用いて説明する。検索装置10は、装置全体を制御するCPU(Central Processing Unit)等の制御部101と、各種データや各種プログラムを記憶するROM(Read Only Memory)104やRAM105(Random Access Memory)等の記憶部と、各種データや各種プログラムを記憶するHDD(Hard Disk Drive)やCD(Compact Disk)ドライブ装置等の外部記憶部107と、これらを接続するバス108とを備えており、通常のコンピュータを利用したハードウェア構成となっている。また、検索装置10には、情報を表示する表示部103と、ユーザの指示入力を受け付けるキーボードやマウス等の操作部102と、外部装置である辞書管理者端末11や検索者端末12との通信を制御する通信I/F(interface)とが有線又は無線により各々接続される。   Next, the hardware configuration of the search device 10 will be described with reference to FIG. The search device 10 includes a control unit 101 such as a CPU (Central Processing Unit) that controls the entire device, and a storage unit such as a ROM (Read Only Memory) 104 and a RAM 105 (Random Access Memory) that store various data and various programs. And an external storage unit 107 such as an HDD (Hard Disk Drive) or a CD (Compact Disk) drive device for storing various data and various programs, and a bus 108 for connecting them, and a hardware using an ordinary computer The hardware configuration. The search device 10 includes a display unit 103 that displays information, an operation unit 102 such as a keyboard and a mouse that accepts user instruction inputs, and communication with the dictionary administrator terminal 11 and the searcher terminal 12 that are external devices. A communication I / F (interface) for controlling is connected to each other by wire or wirelessly.

次に、このようなハードウェア構成において、検索装置10の制御部101がROM104や外部記憶部107に記憶された各種プログラムを実行することにより実現される各種機能について具体的に説明する。図3は、検索装置10の各機能的構成を例示する図である。検索装置10は、辞書DB13と、辞書データ管理部21と、インデックス格納部22と、入力受付部23と、辞書要素あいまい検索部24と、辞書要素ランキング確定部25と、検索結果出力部26とを有する。これらのうち、辞書データ管理部21と、インデックス格納部22と、入力受付部23と、辞書要素あいまい検索部24と、辞書要素ランキング確定部25と、検索結果出力部26とは、制御部101のプログラム実行時にRAM105などの記憶部上に生成されるものである。辞書DB13は、例えば外部記憶部107に記憶されるものである。   Next, in the hardware configuration described above, various functions that are realized when the control unit 101 of the search device 10 executes various programs stored in the ROM 104 or the external storage unit 107 will be specifically described. FIG. 3 is a diagram illustrating functional configurations of the search device 10. The search apparatus 10 includes a dictionary DB 13, a dictionary data management unit 21, an index storage unit 22, an input reception unit 23, a dictionary element ambiguous search unit 24, a dictionary element ranking determination unit 25, and a search result output unit 26. Have Among these, the dictionary data management unit 21, the index storage unit 22, the input reception unit 23, the dictionary element fuzzy search unit 24, the dictionary element ranking determination unit 25, and the search result output unit 26 are the control unit 101. Is generated on a storage unit such as the RAM 105 when the program is executed. The dictionary DB 13 is stored in the external storage unit 107, for example.

辞書DB13は、辞書データ及びインデックステーブルを記憶する。辞書データは、製品の分類と階層を示すクラスと、クラスを特徴付けるプロパティによって定義される。またプロパティは少なくとも1つのアトリビュートによって記述される。このクラス及びプロパティ毎に辞書データは存在する。辞書データの具体例及びインデックステーブルの詳細については後述する。尚、製品とは、ユーザのニーズや欲求を満たすために、市場へと提供されるものであり、有形のものだけでなく、サービス、経験、イベント、人、場所、資産、組織、情報、アイデアなどが製品に含まれる。   The dictionary DB 13 stores dictionary data and an index table. The dictionary data is defined by a class indicating the classification and hierarchy of products and a property that characterizes the class. A property is described by at least one attribute. Dictionary data exists for each class and property. Specific examples of dictionary data and details of the index table will be described later. Products are provided to the market in order to meet the needs and desires of users. Not only tangible items but also services, experiences, events, people, places, assets, organizations, information, ideas Etc. are included in the product.

図4は、辞書DB13のデータ構造を例示する図である。同図では、辞書DB13は、分類(クラス)を中心とした階層構造を有していることが示されている。同図に示される階層構造においては、「半導体」という分類をルートクラスとし、その子クラスとして「発光ダイオード」と「受光素子」とが存在する。即ち、「半導体」は「発光ダイオード」「受光素子」という2つの分類に細分化されることが示されている。階層構造は何層であっても構わない。尚、()内に書かれた記号(この例ではC1〜C3)は、辞書DB13内で唯一につけられたクラスを表すコードであり、PLIB規格では「クラスBSUコード」と呼ぶ識別子に相当する。   FIG. 4 is a diagram illustrating a data structure of the dictionary DB 13. In the figure, it is shown that the dictionary DB 13 has a hierarchical structure centered on classification (class). In the hierarchical structure shown in the figure, the classification “semiconductor” is a root class, and “light emitting diode” and “light receiving element” exist as child classes. That is, it is shown that “semiconductor” is subdivided into two categories of “light emitting diode” and “light receiving element”. The hierarchical structure may have any number of layers. Symbols (in this example, C1 to C3) written in parentheses are codes that represent classes uniquely assigned in the dictionary DB 13, and correspond to identifiers called “class BSU codes” in the PLIB standard.

図4に示すように、階層構造を定義するクラスでは、それぞれ固有のプロパティ(図4中、点線で囲まれた部分)が定義される。各クラスにおいては、当該クラスの上位クラスで定義されたプロパティが継承される。例えば、クラス「受光素子」が持つプロパティは、当該クラスで定義されたプロパティと、その上位クラス「半導体」で定義されたプロパティということになる。このようにクラスとプロパティとは対応関係を有している。尚、クラスの場合と同様にプロパティにおいても辞書DB13内で唯一に付与されたプロパティを表すコード(「プロパティBSUコード」又は単に「BSU」)(この例ではP0〜P3)が付与される。以降では、上述したクラスを表すコード及びプロパティを表すコードを共にBSUコードとして取り扱う。   As shown in FIG. 4, each class defining a hierarchical structure defines a unique property (a part surrounded by a dotted line in FIG. 4). In each class, the properties defined in the upper class of the class are inherited. For example, the properties of the class “light receiving element” are the properties defined in the class and the properties defined in the upper class “semiconductor”. In this way, classes and properties have a correspondence relationship. As in the case of a class, a code (“property BSU code” or simply “BSU”) (in this example, P0 to P3) representing a property uniquely assigned in the dictionary DB 13 is also assigned to the property. Hereinafter, both the code representing the class and the code representing the property are handled as the BSU code.

図5は、クラス毎の辞書データを例示する図である。各行がクラス毎の各辞書データに対応しており、各辞書データは、各クラスを識別するためのBSUコードと、各アトリビュートとして「推奨名」「別名」「定義」と、当該クラスの上位のクラスを識別するための上位クラスのBSUコードとを各々含んでいる。   FIG. 5 is a diagram illustrating dictionary data for each class. Each row corresponds to each dictionary data for each class. Each dictionary data includes a BSU code for identifying each class, “recommended name”, “alias”, “definition” as attributes, and a higher level of the class. Each includes a BSU code of a higher class for identifying the class.

図6は、プロパティ毎の辞書データを例示する図である。1番上の行を除く各行がプロパティ毎の各辞書データに対応したレコードである。各辞書データは、各プロパティを識別するためのBSUコードと、当該プロパティが定義されたクラス(定義クラスという)を識別するためのBSUコードと、各アトリビュートとして「推奨名」「別名」「定義」「単位」とを各々含んでいる。また本実施の形態では利用しないがプロパティの「短縮名称」や「シンボル」や「データ型」や、プロパティ自体の定義の出典を示す「出典」といったアトリビュートもPLIBには存在する。このようにクラスの親子関係、プロパティとそのアトリビュートの種類及びデータ型の種類などの辞書の構造を定めたデータモデルの1つとして、前述した製品部品ライブラリの交換フォーマットの国際標準であるISO13584(Parts Library:PLIB)がある。なお、本実施の形態においては、辞書がPLIBに従った場合の適用例を用いて説明するが、PLIB以外のデータベースへ適用しても構わない。   FIG. 6 is a diagram illustrating dictionary data for each property. Each row except the top row is a record corresponding to each dictionary data for each property. Each dictionary data includes a BSU code for identifying each property, a BSU code for identifying a class in which the property is defined (referred to as a definition class), and “recommended name”, “alias”, and “definition” as attributes. Each includes “unit”. Although not used in this embodiment, there are also attributes such as “short name”, “symbol”, “data type” of the property, and “source” indicating the source of the definition of the property itself. As one of the data models that define the structure of the dictionary such as the parent-child relationship of classes, the types of properties and their attributes, and the types of data types, ISO13584 (Parts Library: PLIB). In the present embodiment, description will be made using an application example where the dictionary conforms to the PLIB. However, the present invention may be applied to a database other than the PLIB.

図3の説明に戻る。辞書データ管理部21は、辞書DB13を管理するものであり、具体的には、辞書管理者端末11から送信された辞書データを受信し、これを辞書DB13に登録したり、辞書DB13に登録された辞書データへのアクセスを制御したり当該辞書データの修正や削除を行なったりする。インデックス格納部22は、辞書データ管理部21が辞書データを辞書DB13に登録する際に、当該辞書データに含まれるアトリビュートのうちある種類のアトリビュートの値を単語解析して各単語(単語要素という)に分解し、単語要素毎にアトリビュートの種類に応じて重み付けを行って、各クラス及び各プロパティの単語要素毎のインデックスとしてインデックステーブルに各々登録する。ある種類のアトリビュートとは、ここでは「推奨名」「別名」「定義」とする。   Returning to the description of FIG. The dictionary data management unit 21 manages the dictionary DB 13. Specifically, the dictionary data management unit 21 receives dictionary data transmitted from the dictionary manager terminal 11, registers it in the dictionary DB 13, or registers it in the dictionary DB 13. Controls access to dictionary data and corrects or deletes the dictionary data. When the dictionary data management unit 21 registers dictionary data in the dictionary DB 13, the index storage unit 22 performs word analysis on the value of a certain type of attribute included in the dictionary data, and each word (referred to as a word element). Each word element is weighted according to the type of attribute, and is registered in the index table as an index for each word element of each class and each property. Here, a certain kind of attribute is referred to as “recommended name”, “alias”, or “definition”.

図7は、インデックスを例示する図である。図7に示されるように、図5及び図6に示した各クラス及び各プロパティのそれぞれについて、アトリビュートである「推奨名」「別名」「定義」の各値である文字列が各々分解された単語要素毎のインデックスが各行において例示されている。各行において示されるインデックスは、クラスかプロパティかをC又はPにより識別するためのC/Pと、当該クラス又はプロパティのBSUコードと、単語要素と、当該単語要素に分解されたアトリビュートのアトリビュート名と、重みの値とを含む。各インデックスは、BSUコードにより、クラス又はプロパティの辞書データと対応付けられる。   FIG. 7 is a diagram illustrating an index. As shown in FIG. 7, for each class and each property shown in FIGS. 5 and 6, the character strings that are the values of “recommended name”, “alias”, and “definition” that are attributes are respectively decomposed. An index for each word element is illustrated in each line. The index shown in each line is C / P for identifying whether it is a class or a property by C or P, the BSU code of the class or property, the word element, and the attribute name of the attribute decomposed into the word element. And weight values. Each index is associated with dictionary data of a class or property by a BSU code.

図3の説明に戻る。入力受付部23は、検索者端末12において入力され送信されたキーワードを受信し、当該キーワードを単語解析して各単語要素に適宜分解する。辞書要素あいまい検索部24は、入力受付部23が入力を受け付けたキーワードを適宜分解した単語要素とインデックステーブルに登録されたインデックスとを用いて、辞書データを検索して、当該辞書データをランキングする。具体的には、辞書要素あいまい検索部24は、キーワードから適宜分解された単語要素と一致する単語要素を含むインデックスのレコードをインデックステーブルから検索し、その検索結果を同一のクラス又は同一のプロパティ毎にグループ化し、重み付けに従って各辞書データの得点を計算し、得点の順に辞書データをランキングする。尚、検索されたインデックスに含まれるBSUコードに対応する辞書データが、検索された辞書データとなる。辞書要素ランキング確定部25は、辞書要素あいまい検索部24が検索した辞書データが、クラスに対応する辞書データ及びプロパティに対応する辞書データの両方ある場合、クラスとプロパティとの対応関係に応じてランキングを確定する。検索結果出力部26は、辞書要素ランキング確定部25が確定したランキングの順に、各辞書データに含まれる少なくとも「推奨名」を含むアトリビュートの値を検索結果として検索者端末12へ送信する。   Returning to the description of FIG. The input receiving unit 23 receives a keyword input and transmitted at the searcher terminal 12, analyzes the keyword, and decomposes it into each word element as appropriate. The dictionary element ambiguous search unit 24 searches the dictionary data using the word element obtained by appropriately decomposing the keyword received by the input receiving unit 23 and the index registered in the index table, and ranks the dictionary data. . Specifically, the dictionary element ambiguity search unit 24 searches the index table for an index record including a word element that matches the word element appropriately decomposed from the keyword, and finds the search result for the same class or the same property. The score of each dictionary data is calculated according to the weighting, and the dictionary data is ranked in the order of the score. The dictionary data corresponding to the BSU code included in the searched index becomes the searched dictionary data. If the dictionary data searched by the dictionary element fuzzy search unit 24 includes both dictionary data corresponding to a class and dictionary data corresponding to a property, the dictionary element ranking determination unit 25 ranks according to the correspondence relationship between the class and the property. Confirm. The search result output unit 26 transmits attribute values including at least “recommended name” included in each dictionary data to the searcher terminal 12 as a search result in the order of ranking determined by the dictionary element ranking determination unit 25.

(2)動作
次に、本実施の形態にかかる検索装置10の行う処理の手順について説明する。まず、検索装置10が辞書データを辞書DB13に登録すると共にインデックスをインデックステーブルに登録する登録処理の手順について説明する。検索装置10は、辞書管理者端末11から送信された辞書データを受信すると、辞書データ管理部21の機能により、辞書データを辞書DB13に登録する。ここで登録対象の辞書データは図5〜6に示したものとする。このとき、検索装置10は、インデックス格納部22の機能により、当該辞書データのインデックスをインデックステーブルに登録する。図8は、辞書データのインデックスをインデックステーブルに登録する処理の手順を示すフローチャートである。検索装置10は、図5〜6に示した登録対象の辞書データをdicElem(i,j)としてRAM105などの記憶部に記憶する(ステップS1)。但し、iは一番上の行を除く各行に対応する、辞書データのレコードを表し、jは各列に対応するアトリビュートを表している。上述したようにアトリビュートの種類はここでは「推奨名」「定義」「別名」であり、jの値は左から順に「1」,「2」,「3」とする。次に、検索装置10は、dicElem(i,j)の全ての辞書データについて(ステップS2)、対象とするアトリビュートの全てに対して(ステップS3)、アトリビュート値として表される文字列を各々単語解析する(ステップS4)。例えば、図5においてiが「2」でありjが「1」のアトリビュートについては、即ち、図5の2行目のクラス「C2」でアトリビュート「推奨名」については、その文字列は「発光ダイオード」である。この場合、検索装置10は、単語解析により、これを「発光」と「ダイオード」とに分解する。そして、検索装置10は、このように分解した全ての単語(単語要素)に対して、アトリビュートの種類に応じた重み付けを行い、この重みの値(w(j))をBSUコードと共にインデックステーブルに登録する(ステップS5)。
(2) Operation Next, a procedure of processing performed by the search device 10 according to the present embodiment will be described. First, a registration process procedure in which the search device 10 registers dictionary data in the dictionary DB 13 and registers an index in the index table will be described. Upon receiving the dictionary data transmitted from the dictionary manager terminal 11, the search device 10 registers the dictionary data in the dictionary DB 13 by the function of the dictionary data management unit 21. Here, it is assumed that dictionary data to be registered is shown in FIGS. At this time, the search device 10 registers the index of the dictionary data in the index table by the function of the index storage unit 22. FIG. 8 is a flowchart showing a processing procedure for registering an index of dictionary data in the index table. The search device 10 stores the dictionary data to be registered shown in FIGS. 5 to 6 as dicElem (i, j) in a storage unit such as the RAM 105 (step S1). Here, i represents a dictionary data record corresponding to each row except the top row, and j represents an attribute corresponding to each column. As described above, the attribute types are “recommended name”, “definition”, and “alias” here, and the values of j are “1”, “2”, and “3” in order from the left. Next, for all dictionary data of dicElem (i, j) (step S2), the search device 10 sets the character strings represented as attribute values to words for all the target attributes (step S3). Analysis is performed (step S4). For example, in FIG. 5, for the attribute where i is “2” and j is “1”, that is, for the attribute “recommended name” in the class “C2” in the second row in FIG. A diode. In this case, the search device 10 decomposes this into “light emission” and “diode” by word analysis. Then, the search device 10 weights all the words (word elements) thus decomposed according to the type of the attribute, and stores the weight value (w (j)) in the index table together with the BSU code. Register (step S5).

本実施の形態では、重みとして、アトリビュートの種類毎に以下の値を用いるものとする。
「推奨名」:1.0
「別名」:0.8
「定義」:0.2
In the present embodiment, the following values are used for the types of attributes as weights.
"Recommended name": 1.0
"Alias": 0.8
"Definition": 0.2

この結果、図5の2行目のクラス「C2」でアトリビュート「推奨名」については、図7に示されるインデックスId1〜Id2がインデックステーブルに登録される。検索装置10は、登録対象の全ての辞書データに含まれ、対象となるアトリビュートの全てに対して以上の処理を繰り返す。図5〜6に示した辞書データについては、図7に示される全てのインデックスがインデックステーブルに登録されることになる。   As a result, for the attribute “recommended name” in the class “C2” on the second line in FIG. 5, the indexes Id1 to Id2 shown in FIG. 7 are registered in the index table. The search device 10 repeats the above processing for all the target attribute included in all the dictionary data to be registered. For the dictionary data shown in FIGS. 5 to 6, all the indexes shown in FIG. 7 are registered in the index table.

次に、検索者が入力したキーワードに基づいて辞書データを検索する検索処理の手順について図9〜10を用いて説明する。検索装置10は、入力受付部23の機能により、検索者端末12で入力され送信されたキーワードを受信すると、当該キーワードを単語解析して、単語に分解する(ステップS10)。ここでの単語解析の方法はステップS4で行なう単語解析の方法と同様である。例えばここでは、キーワードとして、「ダイオード 上昇時間」が入力されたとする。このとき、ステップS10では、検索装置10は、「ダイオード」と「上昇」と「時間」との各単語に分解する。続いて、検索装置10は、分解した各単語(単語要素)を用いて、辞書要素あいまい検索部24の機能により、以下の処理を行う。まず、検索装置10は、キーワードから分解した各単語要素に一致する単語要素を含むインデックスをインデックステーブルから検索する(ステップS11)。そして、検索装置10は、その検索結果を同一のクラス又は同一のプロパティ毎にグループ化して、重み付けに従って辞書データの得点を計算する(ステップS12)。本実施の形態ではBSUコードによりインデックスと辞書データとが対応付けられている。このため、グループ化は、BSUコード毎に行うものとする。また、得点は、BSUコード毎に重みの値を単純に合算するものとする。   Next, a search processing procedure for searching dictionary data based on a keyword input by a searcher will be described with reference to FIGS. When the search device 10 receives a keyword input and transmitted from the searcher terminal 12 by the function of the input receiving unit 23, the search device 10 analyzes the keyword and breaks it down into words (step S10). The word analysis method here is the same as the word analysis method performed in step S4. For example, it is assumed here that “diode rise time” is input as a keyword. At this time, in step S10, the search device 10 breaks it down into the words “diode”, “rising”, and “time”. Subsequently, the search device 10 performs the following processing by using the function of the dictionary element ambiguous search unit 24 using each decomposed word (word element). First, the search device 10 searches the index table for an index including a word element that matches each word element decomposed from the keyword (step S11). Then, the search device 10 groups the search results by the same class or the same property, and calculates the score of the dictionary data according to the weighting (step S12). In the present embodiment, the index and the dictionary data are associated with each other by the BSU code. For this reason, grouping is performed for each BSU code. In addition, the score is obtained by simply adding the weight values for each BSU code.

「ダイオード」と「上昇」と「時間」との各単語要素の例では、ステップS12では、図7に示されるインデックスId2〜Id9が検索の結果得られる。図11は、この検索結果をBSUコード毎にグループ化し、重み付けに従って計算された辞書データの得点を示す図である。図11においては、各辞書データを識別するためのBSUコードと、計算された得点とが辞書データ毎に示されている。以上のようにして検索された結果は簡単なあいまい検索の結果と同様であり、この結果だけを参照すると、プロパティ「P1」(クラス「C3」における「立ち上がり時間」)の得点が一番高いため、プロパティ「P1」の辞書データが検索結果としてもっともらしいという結果が得られる。   In the example of each word element of “diode”, “rising”, and “time”, in step S12, indexes Id2 to Id9 shown in FIG. 7 are obtained as a result of the search. FIG. 11 is a diagram showing scores of dictionary data calculated by grouping the search results for each BSU code and weighting. In FIG. 11, the BSU code for identifying each dictionary data and the calculated score are shown for each dictionary data. The search result as above is the same as the result of the simple fuzzy search. If you refer only to this result, the score of property “P1” (“rise time” in class “C3”) is the highest. The result is that the dictionary data of the property “P1” is plausible as a search result.

続いて、検索装置10は、辞書要素ランキング確定部25の機能により、ランキングされた辞書データが、クラスに対応する辞書データ及びプロパティに対応する辞書データの両方ある場合、クラスとプロパティとの対応関係に応じてランキングを確定する(ステップS13)。具体的には、検索装置10は、クラスと当該クラスで定義されたプロパティとについて、その得点をプロパティ毎及びクラス毎に合計して、合計得点の順をランキングとして確定する。ここで、ランキングを確定する処理の手順の詳細について図10を用いて説明する。尚、プロパティPiの定義されているクラス(定義クラス)をPi.def_classと表記し、プロパティPiに対応する辞書データの得点をPoint^(Pi)と表記する。ここでは、各プロパティの定義クラスは以下の通りである。
P0.def_class=C1
P1.def_class=C3
P2.def_class=C2
P3.def_class= C2
Subsequently, when the dictionary data ranked by the function of the dictionary element ranking determination unit 25 includes both dictionary data corresponding to the class and dictionary data corresponding to the property, the search device 10 has a correspondence relationship between the class and the property. The ranking is determined according to (step S13). Specifically, the search device 10 adds the scores for each property and each class for the class and the properties defined in the class, and determines the order of the total score as a ranking. Here, the details of the procedure for determining the ranking will be described with reference to FIG. The class (definition class) in which the property Pi is defined is expressed as Pi.def_class, and the score of the dictionary data corresponding to the property Pi is expressed as Point ^ (Pi). Here, the definition class of each property is as follows.
P0.def_class = C1
P1.def_class = C3
P2.def_class = C2
P3.def_class = C2

検索装置10は、プロパティPiの得点に対し、その定義クラスPi.def_classの得点を合算して、プロパティPiの合計得点を算出する(ステップS20)。各合計得点は例えば以下の通りとなる。
Point^(P0)=0+0=0
Point^(P1)=2.8+0=2.8
Point^(P2)=2.6+1.0=3.6
Point^(P3)=0+1.0 =1.0
The search device 10 adds the score of the definition class Pi.def_class to the score of the property Pi, and calculates the total score of the property Pi (step S20). Each total score is as follows, for example.
Point ^ (P0) = 0 + 0 = 0
Point ^ (P1) = 2.8 + 0 = 2.8
Point ^ (P2) = 2.6 + 1.0 = 3.6
Point ^ (P3) = 0 + 1.0 = 1.0

その後、検索装置10は、合計得点の順に辞書データをランキングする(ステップS21)。上述の例では、プロパティについてのランキングの順は、「P2>P1>P3>P0」となる。   Thereafter, the search device 10 ranks the dictionary data in the order of the total score (step S21). In the above example, the ranking order of properties is “P2> P1> P3> P0”.

そして、クラス自体の得点については、検索装置10は変更せずに、その得点の順に辞書データをランキングする(ステップS22)。図6の例では、クラスについてのランキングの順は、「C2>C3=C1」となる。   Then, the search device 10 does not change the score of the class itself, and ranks the dictionary data in the order of the score (step S22). In the example of FIG. 6, the ranking order for classes is “C2> C3 = C1”.

この結果、プロパティP1,P2の各「推奨名」は、いずれも「立ち上がり時間」であり同一であるが、プロパティと定義クラスとの関係を考慮することで、同一の推奨名を有するプロパティのいずれが、検索者の意図に合うかを判別することができる。従って、適切な辞書データを検索することが可能になる。   As a result, the “recommended names” of properties P1 and P2 are both “rise time” and the same, but considering the relationship between the property and the definition class, any of the properties having the same recommended name Can be determined whether or not the searcher's intention is met. Therefore, it is possible to search for appropriate dictionary data.

図9の説明に戻る。最後に、検索装置10は、検索結果出力部26の機能により、ステップS13で確定したランキングの順に、各辞書データとして少なくとも「推奨名」を含むアトリビュートの値を検索結果として検索者端末12へ送信する(ステップS14)。図12は、検索結果を例示する図である。図12においては、辞書データを識別するためのBSUコードと、「推奨名」とが検索結果として各々示されている。   Returning to the description of FIG. Finally, the search device 10 transmits the value of the attribute including at least “recommended name” as each dictionary data to the searcher terminal 12 as a search result in the order of ranking determined in step S13 by the function of the search result output unit 26. (Step S14). FIG. 12 is a diagram illustrating search results. In FIG. 12, a BSU code for identifying dictionary data and a “recommended name” are shown as search results.

以上のように、クラスの辞書データ及びプロパティの辞書データのうちある種類のアトリビュートについて単語要素を切り出し、アトリビュートの種類に応じて各単語要素に重み付けを行なう。これにより、辞書データ内のあいまい性を持たせた上で、PLIBの特徴である辞書データ間で定義された対応関係、例えばプロパティと当該プロパティが定義されているクラスとの関係を考慮した検索を実現することができる。即ち、辞書データにおいて同一の推奨名を持つプロパティが存在し、検索者がクラスとプロパティとで共通するキーワードを入力しこれを用いて検索する場合においても、単語要素に付けられた重みを考慮してランキングすることにより、検索者の意図にあった確からしいランキングで辞書データを提示することができる。このため、PLIBに精通していない人でも、キーワードの入力から、「プロパティ」や「推奨名」を簡単に同定(検索)することができる。このため、製品の仕様文書などの技術文書の作成時に、標準辞書で定義された推奨名と概念を用いた記述の支援をすることができる。このように、製品の仕様文書に記述される用語を、標準辞書で定義された推奨名に統一することで、仕様文書を作成するサプライ企業及び仕様文書を利用するユーザ企業間の意味解釈の齟齬をなくすことができ、仕様文書の品質を向上させることができる。   As described above, word elements are extracted from certain types of attributes in the class dictionary data and the property dictionary data, and each word element is weighted according to the attribute type. As a result, with the ambiguity in the dictionary data, a search that takes into account the correspondence defined between the dictionary data, which is a feature of PLIB, for example, the relationship between the property and the class in which the property is defined, is performed. Can be realized. That is, even when there is a property with the same recommended name in the dictionary data, and the searcher inputs a keyword common to the class and the property and performs a search using this keyword, the weight attached to the word element is taken into consideration. Thus, the dictionary data can be presented with a certain ranking that matches the searcher's intention. Therefore, even a person who is not familiar with PLIB can easily identify (search) a “property” or “recommended name” by inputting a keyword. Therefore, it is possible to support the description using the recommended name and concept defined in the standard dictionary when creating a technical document such as a product specification document. In this way, the terms described in the product specification document are unified with the recommended names defined in the standard dictionary, thereby reducing the meaning interpretation between the supply company that creates the specification document and the user company that uses the specification document. And the quality of the specification document can be improved.

[変形例]
なお、本発明は前記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。また、以下に例示するような種々の変形が可能である。
[Modification]
Note that the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Moreover, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined. Further, various modifications as exemplified below are possible.

<変形例1>
上述した実施の形態において、検索装置10で実行される各種プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また当該各種プログラムを、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成しても良い。
<Modification 1>
In the embodiment described above, various programs executed by the search device 10 may be stored on a computer connected to a network such as the Internet and provided by being downloaded via the network. The various programs are recorded in a computer-readable recording medium such as a CD-ROM, a flexible disk (FD), a CD-R, and a DVD (Digital Versatile Disk) in a file in an installable or executable format. May be configured to be provided.

<変形例2>
上述した実施の形態において、検索者端末12でキーワードと共に検索の対象となるクラスが入力され検索装置10に送信されるようにしても良い。検索装置10は、キーワードと共にクラスの入力を受け付けると、辞書DB13に記憶された辞書データのうち、当該クラスの辞書データのみを検索の対象として上述の検索処理を行うようにする。このように検索の対象を限定することで、検索処理をより効率的に行うことができる。
<Modification 2>
In the embodiment described above, the search target class may be input together with the keyword at the searcher terminal 12 and transmitted to the search device 10. When receiving the class input together with the keyword, the search device 10 performs the above-described search process using only the dictionary data of the class among the dictionary data stored in the dictionary DB 13 as a search target. By limiting the search target in this way, the search process can be performed more efficiently.

<変形例3>
上述した実施の形態において、インデックス格納部22は、各クラス及び各プロパティの単語要素毎のインデックスをインデックステーブルに各々登録する際に、助詞や副詞や形容詞などの単語を登録の対象外とし、名詞や未知の単語のみを登録の対象とするようにしても良い。
<Modification 3>
In the embodiment described above, the index storage unit 22 excludes words such as particles, adverbs, and adjectives from registration when registering the index for each word element of each class and each property in the index table. Or only unknown words may be registered.

<変形例4>
上述した実施の形態において、重み付けに従って辞書データの得点を計算する方法は、上述の例に限らず、また、クラスとプロパティとの対応関係に応じてランキングを確定する方法も上述の例に限らない。
<Modification 4>
In the embodiment described above, the method for calculating the score of the dictionary data according to the weighting is not limited to the above example, and the method for determining the ranking according to the correspondence between the class and the property is not limited to the above example. .

<変形例5>
上述した実施の形態において、検索対象とするクラスを検索者が指定するように構成しても良い。この場合、入力受付部23は、検索者端末12を介して、キーワードの他、検索対象のクラスを識別可能なクラス識別子の入力を受け付ける。クラス識別子は、例えばBSUコードや「推奨名」などの名称である。辞書要素あいまい検索部24は、入力受付部23が入力を受け付けたキーワードを適宜分解した単語要素とインデックステーブルに登録されたインデックスとを用いて、入力受付部23が入力を受け付けた検索対象のクラスの辞書データを検索して、当該辞書データをランキングする。
<Modification 5>
In the above-described embodiment, the searcher may specify a class to be searched. In this case, the input receiving unit 23 receives input of a class identifier that can identify a search target class in addition to the keyword via the searcher terminal 12. The class identifier is a name such as a BSU code or “recommended name”, for example. The dictionary element ambiguous search unit 24 uses the word element obtained by appropriately decomposing the keyword received by the input receiving unit 23 and the index registered in the index table, and the search target class received by the input receiving unit 23 The dictionary data is searched and the dictionary data is ranked.

図13は、本変形例にかかる検索者が入力したキーワードに基づいて辞書データを検索する検索処理の手順を示すフローチャートである。ステップS10は上述の実施の形態と同様である。ステップS30では、検索装置10は、検索対象のクラスの上位のクラスと、自身を含む下位のクラスと、上位のクラスで定義されたプロパティと、自身を含む下位のクラスで定義されたプロパティとの各々に対応する辞書データを検索対象とする(ステップS30)。検索対象の辞書データのBSUコードの集合を検索対象集合Eとする。例えば、検索対象のクラスとして「発光ダイオード(C2)」が指定されている場合、この上位のクラスはC1である。下位クラスは存在しないため、自身を含む下位のクラスは、C2である。上位のクラスで定義されたプロパティは、P0である。自身を含む下位のクラスで定義されたプロパティは、P2,P3である。従って、検索対象集合は、「E={C1,C2,P0,P2,P3}」となる。   FIG. 13 is a flowchart showing a procedure of search processing for searching dictionary data based on a keyword input by a searcher according to this modification. Step S10 is the same as that in the above-described embodiment. In step S30, the search device 10 includes the upper class of the search target class, the lower class including itself, the property defined in the upper class, and the property defined in the lower class including itself. The dictionary data corresponding to each is searched (step S30). A set of BSU codes of dictionary data to be searched is set as a search target set E. For example, when “light emitting diode (C2)” is designated as the class to be searched, the higher class is C1. Since there is no lower class, the lower class including itself is C2. The property defined in the higher class is P0. The properties defined in the lower class including itself are P2 and P3. Therefore, the search target set is “E = {C1, C2, P0, P2, P3}”.

そして、検索装置10は、BSUコードが検索対象集合に含まれるインデックスのうち、キーワードから分解した各単語要素に一致する単語要素を含むインデックスをインデックステーブルから検索する(ステップS31)。例えば、キーワードとして、「ダイオード 上昇時間」が入力された場合、キーワードから分解した各単語要素は、「ダイオード」と「上昇」と「時間」である。この各単語要素を用いた検索の結果、本変形例においては、ステップS31では、図7に示されるインデックスId2,Id7〜Id9が得られる。そして、検索装置10は、上述の実施の形態と同様にして、検索結果を同一のクラスと同一のプロパティ毎とにグループ化して、重み付けに従って辞書データの得点を計算する(ステップS32)。図14は、この検索結果をBSUコード毎にグループ化し、重み付けに従って計算された辞書データの得点を示す図である。ステップS13は上述の実施の形態と同様である。各プロパティの定義クラスは以下の通りである。
P0.def_class=C1
P2.def_class=C2
P3.def_class= C2
Then, the search device 10 searches the index table for an index that includes a word element that matches each word element decomposed from the keyword among indexes whose BSU codes are included in the search target set (step S31). For example, when “diode rise time” is input as a keyword, the word elements decomposed from the keyword are “diode”, “rise”, and “time”. As a result of the search using each word element, in this modification, the indexes Id2, Id7 to Id9 shown in FIG. 7 are obtained in step S31. Then, the search device 10 groups the search results into the same class and the same property as in the above embodiment, and calculates the score of the dictionary data according to the weighting (step S32). FIG. 14 is a diagram showing scores of dictionary data calculated by grouping the search results for each BSU code and weighting. Step S13 is the same as that of the above-mentioned embodiment. The definition class of each property is as follows.
P0.def_class = C1
P2.def_class = C2
P3.def_class = C2

この検索対象集合の例では、検索装置10は、プロパティPiの得点に対し、その定義クラスPi.def_classの得点を合算して、プロパティPiの合計得点を算出すると、各合計得点は例えば以下の通りとなる。
Point^(P0)=0+0=0
Point^(P2)=2.6+1.0=3.6
Point^(P3)=0+1.0 =1.0
プロパティについてのランキングの順は、「P2>P3>P0」となる。上述の実施の形態の例と比べて、ここでは、プロパティP1及びクラスC3が対象外となっているため、上述の実施の形態の例と異なるランキングとなる。クラスについてのランキングの順は、「C2>C3」となる。このようにランキングを確定した後検索装置10は、ステップS14で、上述の実施の形態と同様にして検索結果を検索者端末12へ送信する。
In this search target set example, the search device 10 calculates the total score of the property Pi by adding the scores of the definition class Pi.def_class to the score of the property Pi. It becomes.
Point ^ (P0) = 0 + 0 = 0
Point ^ (P2) = 2.6 + 1.0 = 3.6
Point ^ (P3) = 0 + 1.0 = 1.0
The order of ranking of properties is “P2>P3> P0”. Compared with the example of the above-described embodiment, since the property P1 and the class C3 are not targeted here, the ranking is different from that of the above-described embodiment. The ranking order for classes is “C2> C3”. After determining the ranking in this manner, the search device 10 transmits the search result to the searcher terminal 12 in the same manner as in the above-described embodiment in step S14.

以上のように、検索対象のクラスを絞ることで、検索の処理効率を向上させることができつつ、仕様文書の品質を向上させることができる。   As described above, by narrowing down the search target class, it is possible to improve the processing efficiency of the search and improve the quality of the specification document.

<変形例6>
上述した実施の形態において、表面的に仕様文書上の用語を推奨語に合わせることの他に、辞書データを仕様文書に埋め込むことができる場合には、検索した辞書データ自体又はそのBSUコードを仕様文書に埋め込むようにしても良い。図15は、Office Open XML形式に従い、カスタム定義XMLを利用した時のタグ挿入例を示す図である。図15においては、辞書データのBSUコードがタグTG1により埋め込まれ、「推奨名」がタグTG2により埋め込まれている。図16は、尚、予め定義したカスタムXMLのスキーマを例示する図である。このような構成によれば、ステップS14の検索結果として、例えば、図17に示されるように、タグTG1〜TG2が表示されないものの、このような情報を埋め込むための情報を、検索者端末12に表示させることができる。
<Modification 6>
In the above-described embodiment, when dictionary data can be embedded in the specification document in addition to superimposing the term on the specification document to the recommended word, the searched dictionary data itself or its BSU code is specified. It may be embedded in a document. FIG. 15 is a diagram showing an example of tag insertion when custom definition XML is used in accordance with the Office Open XML format. In FIG. 15, the BSU code of the dictionary data is embedded with the tag TG1, and the “recommended name” is embedded with the tag TG2. FIG. 16 is a diagram illustrating an example of a predefined custom XML schema. According to such a configuration, as a search result in step S14, for example, as shown in FIG. 17, although the tags TG1 and TG2 are not displayed, information for embedding such information is sent to the searcher terminal 12. Can be displayed.

一実施の形態にかかる検索システムの構成を例示する図である。It is a figure which illustrates the composition of the search system concerning one embodiment. 同実施の形態にかかる検索装置10のハードウェア構成を例示する図である。It is a figure which illustrates the hardware constitutions of the search device 10 concerning the embodiment. 同実施の形態にかかる検索装置10の各機能的構成を例示する図である。It is a figure which illustrates each functional structure of the search device 10 concerning the embodiment. 同実施の形態にかかる辞書DB13のデータ構造を例示する図である。It is a figure which illustrates the data structure of dictionary DB13 concerning the embodiment. 同実施の形態にかかるクラス毎の辞書データを例示する図である。It is a figure which illustrates the dictionary data for every class concerning the embodiment. 同実施の形態にかかるプロパティ毎の辞書データを例示する図である。It is a figure which illustrates the dictionary data for every property concerning the embodiment. 同実施の形態にかかるインデックスを例示する図である。It is a figure which illustrates the index concerning the embodiment. 同実施の形態にかかる辞書データのインデックスをインデックステーブルに登録する処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the process which registers the index of the dictionary data concerning the embodiment in an index table. 検索者が入力したキーワードに基づいて辞書データを検索する検索処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the search process which searches dictionary data based on the keyword which the searcher input. 同実施の形態にかかるランキングを確定する処理の手順の詳細について図10を用いて説明する。Details of the procedure for determining the ranking according to the embodiment will be described with reference to FIG. 同実施の形態にかかる検索結果をBSUコード毎にグループ化し、重み付けに従って計算された辞書データの得点を示す図である。It is a figure which shows the score of the dictionary data calculated by grouping the search result concerning the embodiment for every BSU code | cord | chord, and weighting. 同実施の形態にかかる最終的な検索結果を例示する図である。It is a figure which illustrates the final search result concerning the embodiment. 同実施の形態の変形例にかかる検索者が入力したキーワードに基づいて辞書データを検索する検索処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the search process which searches dictionary data based on the keyword which the searcher concerning the modification of the embodiment inputs. 同変形例にかかる検索結果をBSUコード毎にグループ化し、重み付けに従って計算された辞書データの得点を示す図である。It is a figure which shows the score of the dictionary data calculated according to the weighting which grouped the search result concerning the modification for every BSU code. 一変形例にかかるOffice Open XML形式に従い、カスタム定義XMLを利用した時のタグ挿入例を示す図である。It is a figure which shows the example of tag insertion when using custom definition XML according to the Office Open XML format concerning one modification. 同変形例にかかる予め定義したカスタムXMLのスキーマを例示する図である。It is a figure which illustrates the schema of the predefined custom XML concerning the modification. 同変形例にかかる検索結果を例示する図である。It is a figure which illustrates the search result concerning the modification.

10 検索装置
11 辞書管理者端末
12 検索者端末
13 辞書DB
21 辞書データ管理部
22 インデックス格納部
23 入力受付部
24 辞書要素あいまい検索部
25 辞書要素ランキング確定部
26 検索結果出力部
101 制御部
102 操作部
103 表示部
107 外部記憶部
108 バス
10 Search Device 11 Dictionary Manager Terminal 12 Searcher Terminal 13 Dictionary DB
21 Dictionary data management unit 22 Index storage unit 23 Input reception unit 24 Dictionary element ambiguous search unit 25 Dictionary element ranking determination unit 26 Search result output unit 101 Control unit 102 Operation unit 103 Display unit 107 External storage unit 108 Bus

Claims (8)

分類を示すクラス毎のデータであってアトリビュートによって記述される辞書データ及びプロパティ毎のデータであってアトリビュートによって記述される辞書データを記憶する第1記憶手段と、
前記辞書データのアトリビュートのうちある種類のアトリビュートの値を単語解析して、前記辞書データ毎に第1単語要素を各々得る第1解析手段と、
前記辞書データ毎の各前記第1単語要素に対して、前記アトリビュートの種類に応じた重み付けを行う重み付け手段と、
前記第1単語要素と、当該第1単語要素に対して付けられた重みとを前記辞書データと対応付けて記憶する第2記憶手段と、
キーワードの入力を受け付ける第1入力受付手段と、
前記キーワードを単語解析して、第2単語要素を得る第2解析手段と、
前記第2単語要素と一致する前記第1単語要素に対応する前記辞書データを検索する検索手段と、
検索された前記辞書データを同一のクラス又は同一のプロパティ毎にグループ化し、前記第1単語要素に対して付けられた重みに従って、グループ毎に前記辞書データをランキングするランキング手段と、
検索された辞書データが、クラスに対応する前記辞書データ及びプロパティに対応する前記辞書データの両方ある場合、クラスとプロパティとの対応関係に応じて、前記グループ毎の前記辞書データのランキングを確定する確定手段と、
確定されたランキングの順に前記辞書データのアトリビュートのうち少なくとも1つを出力する出力手段とを備える
ことを特徴とする検索装置。
First storage means for storing the dictionary data described by attribute a data for each class indicating the classification A data for each dictionary data and properties that are thus written in Attributes,,
First analysis means for analyzing the value of a certain kind of attribute among the attributes of the dictionary data and obtaining each first word element for each dictionary data;
Weighting means for performing weighting according to the type of the attribute for each first word element for each dictionary data;
Second storage means for storing the first word element and the weight assigned to the first word element in association with the dictionary data;
First input receiving means for receiving keyword input;
Second analysis means for analyzing the keyword to obtain a second word element;
Search means for searching the dictionary data corresponding to the first word element matching the second word element;
Ranking means for grouping the searched dictionary data for the same class or the same property, and ranking the dictionary data for each group according to a weight attached to the first word element;
When the retrieved dictionary data includes both the dictionary data corresponding to the class and the dictionary data corresponding to the property, the ranking of the dictionary data for each group is determined according to the correspondence between the class and the property. A confirmation means;
A search device comprising: output means for outputting at least one of the attributes of the dictionary data in the determined ranking order.
前記確定手段は、検索された辞書データが、クラスに対応する前記辞書データ及びプロパティに対応する前記辞書データの両方ある場合、クラスと当該クラスで定義されたプロパティとの関係に応じて、前記グループ毎の前記辞書データのランキングを確定する
ことを特徴とする請求項1に記載の検索装置。
In the case where the retrieved dictionary data includes both the dictionary data corresponding to a class and the dictionary data corresponding to a property, the determining means determines the group according to the relationship between the class and the property defined in the class. The search device according to claim 1, wherein the ranking of each dictionary data is determined.
検索対象となるクラスを識別可能なクラス識別子の入力を受け付ける第2入力受付手段を更に備え、
前記検索手段は、前記クラス識別子によって特定されるクラスに対応する前記辞書データであって前記第2単語要素と一致する前記第1単語要素に対応する前記辞書データを検索する
ことを特徴とする請求項1又は2に記載の検索装置。
A second input receiving means for receiving an input of a class identifier capable of identifying a class to be searched;
The retrieval means retrieves the dictionary data corresponding to the first word element that corresponds to the second word element and corresponds to the class specified by the class identifier. Item 3. The search device according to Item 1 or 2.
前記辞書データは、階層付けられており、
前記第1記憶手段は、階層の上位の分類に属する前記プロパティがその下位の分類に継承される前記辞書データを記憶する
ことを特徴とする請求項1乃至3のいずれか一項に記載の検索装置。
The dictionary data is hierarchically arranged,
The search according to any one of claims 1 to 3, wherein the first storage unit stores the dictionary data in which the property belonging to a higher class of the hierarchy is inherited by the lower class. apparatus.
前記出力手段は、確定されたランキングの順に前記辞書データのアトリビュートのうち少なくとも推奨名を出力する
ことを特徴とする請求項1乃至4のいずれか一項に記載の検索装置。
5. The search device according to claim 1, wherein the output unit outputs at least a recommended name among the attributes of the dictionary data in the determined ranking order. 6.
前記第1解析手段は、前記辞書データのうち、アトリビュートの種類である推奨名、別名及び定義のうち少なくとも1つの値を単語解析して、前記辞書データ毎に少なくとも1つの第1単語要素を各々得る
ことを特徴とする請求項1乃至5のいずれか一項に記載の検索装置。
The first analysis means performs word analysis on at least one value of a recommended name, an alias, and a definition that are types of attributes in the dictionary data, and each of the dictionary data includes at least one first word element. The search device according to claim 1, wherein the search device is obtained.
分類を示すクラス毎のデータであってアトリビュートによって記述される辞書データ及びプロパティ毎のデータであってアトリビュートによって記述される辞書データを記憶する第1記憶手段を備える検索装置で実行される検索方法であって、
前記辞書データのアトリビュートのうちある種類のアトリビュートの値を単語解析して、前記辞書データ毎に少なくとも1つの第1単語要素を各々得る第1解析ステップと、
前記辞書データ毎の各前記第1単語要素に対して、前記アトリビュートの種類に応じた重み付けを行う重み付けステップと、
前記第1単語要素と、当該第1単語要素に対して付けられた重みとを前記辞書データと対応付けて第2記憶手段に記憶させる記憶制御ステップと、
キーワードの入力を受け付ける第1入力受付ステップと、
前記キーワードを単語解析して、少なくとも1つの第2単語要素を得る第2解析ステップと、
前記第2単語要素と一致する前記第1単語要素に対応する前記辞書データを検索する検索ステップと、
検索された前記辞書データを同一のクラス又は同一のプロパティ毎にグループ化し、前記第1単語要素に対して付けられた重みに従って、グループ毎に前記辞書データをランキングするランキングステップと、
検索された辞書データが、クラスに対応する前記辞書データ及びプロパティに対応する前記辞書データの両方ある場合、クラスとプロパティとの対応関係に応じて、前記グループ毎の前記辞書データのランキングを確定する確定ステップと、
確定されたランキングの順に前記辞書データのアトリビュートのうち少なくとも1つを出力する出力ステップとを含む
ことを特徴とする検索方法。
Executed by the search apparatus comprising a first memory means for storing the dictionary data described a data of a data for each class indicating a classification for each dictionary data and properties that are thus written in Attributes, by attributes A search method,
A first analysis step of analyzing the value of a certain type of attribute among the attributes of the dictionary data to obtain at least one first word element for each dictionary data;
A weighting step for weighting each first word element for each dictionary data according to the type of the attribute;
A storage control step of storing the first word element and the weight assigned to the first word element in the second storage means in association with the dictionary data;
A first input receiving step for receiving an input of a keyword;
A second analysis step of analyzing the keyword to obtain at least one second word element;
A search step of searching the dictionary data corresponding to the first word element that matches the second word element;
A ranking step of grouping the searched dictionary data into the same class or the same property and ranking the dictionary data for each group according to a weight attached to the first word element;
When the retrieved dictionary data includes both the dictionary data corresponding to the class and the dictionary data corresponding to the property, the ranking of the dictionary data for each group is determined according to the correspondence between the class and the property. A confirmation step;
And a outputting step of outputting at least one of the attributes of the dictionary data in the determined ranking order.
請求項7に記載の方法をコンピュータに実行させるためのプログラム。   A program for causing a computer to execute the method according to claim 7.
JP2009074490A 2009-03-25 2009-03-25 Search device, method and program Expired - Fee Related JP5330049B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009074490A JP5330049B2 (en) 2009-03-25 2009-03-25 Search device, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009074490A JP5330049B2 (en) 2009-03-25 2009-03-25 Search device, method and program

Publications (2)

Publication Number Publication Date
JP2010225101A JP2010225101A (en) 2010-10-07
JP5330049B2 true JP5330049B2 (en) 2013-10-30

Family

ID=43042188

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009074490A Expired - Fee Related JP5330049B2 (en) 2009-03-25 2009-03-25 Search device, method and program

Country Status (1)

Country Link
JP (1) JP5330049B2 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03294963A (en) * 1990-04-12 1991-12-26 Ricoh Co Ltd Document retrieving device
JP3558854B2 (en) * 1998-02-18 2004-08-25 シャープ株式会社 Data retrieval device and computer-readable recording medium
JP3746635B2 (en) * 1999-04-28 2006-02-15 株式会社東芝 Electronic catalog using device and electronic catalog system
JP2006309446A (en) * 2005-04-27 2006-11-09 Toshiba Corp Classification dictionary updating device, classification dictionary updating program, and classification dictionary updating method
JP2007026074A (en) * 2005-07-15 2007-02-01 Toshiba Corp Component information display device, component information display system, component information display program, and method for displaying component information
JP2008242836A (en) * 2007-03-27 2008-10-09 Toshiba Corp Dictionary updating apparatus and program

Also Published As

Publication number Publication date
JP2010225101A (en) 2010-10-07

Similar Documents

Publication Publication Date Title
KR101793222B1 (en) Updating a search index used to facilitate application searches
Wache et al. Ontology-based integration of information-a survey of existing approaches.
US10783159B2 (en) Question answering with entailment analysis
US9846901B2 (en) Product recommendation with ontology-linked product review
US10565533B2 (en) Systems and methods for similarity and context measures for trademark and service mark analysis and repository searches
US9262527B2 (en) Optimized ontology based internet search systems and methods
US6523025B1 (en) Document processing system and recording medium
US7444325B2 (en) Method and system for information extraction
US20160179934A1 (en) Question answering from structured and unstructured data sources
US20160180438A1 (en) Product recommendation with product review analysis
US20060173753A1 (en) Method and system for online shopping
WO2011105606A1 (en) Information processing device, information processing method, program for information processing device, and recording medium
EP3077918A1 (en) Systems and methods for in-memory database search
JP5237353B2 (en) SEARCH DEVICE, SEARCH SYSTEM, SEARCH METHOD, SEARCH PROGRAM, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING SEARCH PROGRAM
US8121970B1 (en) Method for identifying primary product objects
JP4361526B2 (en) Reputation information processing apparatus, reputation information processing method, reputation information processing program, and recording medium
JP5836893B2 (en) File management apparatus, file management method, and program
JP2010134709A (en) Device and method for detection of vocabulary error
Jannach et al. Automated ontology instantiation from tabular web sources—the AllRight system
JP2001184358A (en) Device and method for retrieving information with category factor and program recording medium therefor
JP2010198278A (en) Apparatus, method, and program for classification of reputation information
JP6305630B2 (en) Document search apparatus, method and program
JP5330049B2 (en) Search device, method and program
JP2005128872A (en) Document retrieving system and document retrieving program
US11017172B2 (en) Proposition identification in natural language and usage thereof for search and retrieval

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130402

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130725

LAPS Cancellation because of no payment of annual fees