JP2019164557A - Retrieval system - Google Patents

Retrieval system Download PDF

Info

Publication number
JP2019164557A
JP2019164557A JP2018051765A JP2018051765A JP2019164557A JP 2019164557 A JP2019164557 A JP 2019164557A JP 2018051765 A JP2018051765 A JP 2018051765A JP 2018051765 A JP2018051765 A JP 2018051765A JP 2019164557 A JP2019164557 A JP 2019164557A
Authority
JP
Japan
Prior art keywords
data
projection
information
mapping
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018051765A
Other languages
Japanese (ja)
Inventor
光治 杉山
Mitsuharu Sugiyama
光治 杉山
ラーシュ オーベロ
Obero Laasch
ラーシュ オーベロ
剛 及川
Tsuyoshi Oikawa
剛 及川
信二 山本
Shinji Yamamoto
信二 山本
尚紀 大口
Naoki Oguchi
尚紀 大口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mamezou Co Ltd
Original Assignee
Mamezou Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mamezou Co Ltd filed Critical Mamezou Co Ltd
Priority to JP2018051765A priority Critical patent/JP2019164557A/en
Publication of JP2019164557A publication Critical patent/JP2019164557A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To provide a retrieval system which executes various retrievals which transverse data in a plurality of existing database.SOLUTION: A retrieval system includes: a mapping system configured of metadata creation means which creates metadata structured from existing database, projection creation means which creates a projection for extracting specific information from the metadata, first mapping means which maps the projection to a class of information ontology database, and second mapping means which maps a projection item of the projection to a property of the class in a state in which the class and the projection are mapped with each other; and a data lake system configured of data association means which associates data items of a data file stored in the existing database based on the mapping, and storage means which stores the information of the data item in an atypical data structure database.SELECTED DRAWING: Figure 1

Description

この発明は、情報オントロジーを構築し、既存の情報システムのデータベースと対応付けて、当該対応付けによって関連付けられた複数の既存データベース内のデータ当該関連付けに基づいて、ユーザが要求するデータを抽出・接合して提示する検索システムに関する。   The present invention constructs an information ontology, associates it with a database of an existing information system, and extracts / joins data requested by the user based on the association of data in a plurality of existing databases associated by the association The present invention relates to a search system to present.

従来、検索システムにおいて、既存のデータをオントロジーと対応させる情報構造及び機能を有し、これによって構築されたオントロジーを既存の情報システムのデータベースと対応づけることで、オントロジーによって情報処理対象を拡大可能な技術が開発されている。 Conventionally, a search system has an information structure and function for associating existing data with an ontology, and by mapping the ontology constructed thereby with an existing information system database, the information processing target can be expanded by the ontology. Technology has been developed.

具体的には、データ構造、文法、基準の異なる既存データベースの情報を、情報オントロジーの各構造にマッピングすることで既存データベースのデータを情報オントロジーで標準化された情報に対して互換させる。これによって、単一の情報オントロジーに対し、複数の既存データベースをマッピングすることで、データ構造、文法、基準がそれぞれ異なる各既存データベースのデータを、情報オントロジーを通じて相互に互換させることが可能となる。   Specifically, information in an existing database having a different data structure, grammar, and standard is mapped to each structure of the information ontology, thereby making the data in the existing database compatible with information standardized in the information ontology. Thus, by mapping a plurality of existing databases to a single information ontology, it becomes possible to make the data of each existing database having different data structures, grammars and standards compatible with each other through the information ontology.

特許文献1には、複数のデータベースを検索する場合において、ユーザの利便性を高めるための技術を提供する技術について開示されている。具体的には、(A)ユーザから入力された第1の検索クエリーに含まれる1又は複数のクエリー要素を抽出し、(B)クエリー要素ごとに、各々異なる種類のデータを格納する複数のデータベースとの関連度を算出し、(C)関連度に基づいて、クエリー要素ごとに複数のデータベースの各々との関連の有無を判定し、(D)複数のデータベースの各々について、当該データベースと関連有りと判定されたクエリー要素がある場合は、当該クエリー要素を含む第2の検索クエリーを生成し、(E)第2の検索クエリーに基づいて、複数のデータベースのうち、当該第2の検索クエリーに対応するデータベースを検索する処理を含む検索プログラム、装置及び方法が開示されている。   Patent Document 1 discloses a technique for providing a technique for improving user convenience when searching a plurality of databases. Specifically, (A) one or more query elements included in the first search query input by the user are extracted, and (B) a plurality of databases storing different types of data for each query element. (C) Based on the degree of association, the presence / absence of association with each of the plurality of databases is determined for each query element, and (D) each of the plurality of databases is associated with the database. If there is a query element determined to be, a second search query including the query element is generated. (E) Based on the second search query, the second search query is selected from the plurality of databases. A search program, apparatus, and method including processing for searching a corresponding database are disclosed.

特許文献2には、既存のデータをオントロジーと対応させる情報構造及び機能を有し、これによって構築されたオントロジーを既存の情報システムのデータベースと対応づける発明が開示されている。具体的には、データ構造、文法、基準の異なる既存データベースの情報を、情報オントロジーの各構造にマッピングすることで既存データベースのデータを情報オントロジーで標準化された情報に対して互換させる。これによって、単一の情報オントロジーに対し、複数の既存データベースをマッピングすることで、データ構造、文法、基準がそれぞれ異なる各既存データベースのデータを、情報オントロジーを通じて相互に互換させる検索システムが開示されている。   Patent Document 2 discloses an invention having an information structure and function for associating existing data with an ontology, and associating an ontology constructed thereby with a database of an existing information system. Specifically, information in an existing database having a different data structure, grammar, and standard is mapped to each structure of the information ontology, thereby making the data in the existing database compatible with information standardized in the information ontology. As a result, a search system is disclosed in which multiple existing databases are mapped to a single information ontology, so that the data in each existing database with different data structures, grammar, and standards can be mutually compatible through the information ontology. Yes.

特許文献3には、複数のデータスキーマ間でデータ項目名を対応付ける技術について開示されている。具体的には、ターゲットとなるデータベースの項目名を、ソースとなるデータベースの項目名に対応付け、2つのデータベースのデータスキーマ定義およびインスタンス文書から概念間の弁別関係(区別すべき概念で同義または類義にはなり得ない関係)および時間的順序関係を抽出することにより、オントロジーに格納する機能と、オントロジーを用いてデータ項目名の対応関係の絞込みを行う機能とを備えているデータスキーマのマッピングプログラム及び計算機システムが開示されている。   Patent Document 3 discloses a technique for associating data item names among a plurality of data schemas. Specifically, the item name of the target database is associated with the item name of the source database, and the discriminating relationship between the concepts from the data schema definitions and instance documents of the two databases (synonymous or Data schema mapping that has the function to store in the ontology by extracting the temporal order relation) and the function to narrow down the correspondence of data item names using the ontology A program and a computer system are disclosed.

特開2012−247869号公報JP2012-247869A 特開2010−86437号公報JP 2010-86437 A 特開2007−179146号公報JP 2007-179146 A

ここで、ユーザの検索要求に対して、当該要求に合致するデータを過不足のなく抽出し、また、当該要求に合わせた形に加工して検索結果として提示してほしいとのニーズが存在する。   Here, there is a need to extract data matching the request without excess or deficiency in response to the user's search request, and to process the data in accordance with the request and present it as a search result. .

特許文献1乃至3の各々に記載された従来技術は、既存データベースの情報を、情報オントロジーの各構造にマッピングすることしか開示されておらず、単に、情報オントロジーで標準化された情報によって、各既存データベースからデータを検索することはできるが、複数の既存のデータベースから、情報オントロジーで標準化された情報に関連するデータを横断的に検索・抽出し、それらを接合して提示することまではできない。そのため、ユーザの要求に対して、過不足のないデータを抽出・提示することができなく、上記ニーズに対して十分ではなかった。   The prior art described in each of Patent Documents 1 to 3 only discloses mapping of information in an existing database to each structure of the information ontology, and each existing information is simply based on information standardized by the information ontology. Although data can be retrieved from a database, it is not possible to search and extract data related to information standardized by an information ontology from a plurality of existing databases and to present them by joining them together. For this reason, it is impossible to extract and present data without excess or deficiency in response to a user request, which is not sufficient for the above needs.

そこで、本発明は、上記のような課題を鑑み、既存のデータをオントロジーと対応させる情報構造及び機能を有し、これによってオントロジーを構築し、既存の情報システムのデータベースと対応づけ、当該対応付けによって、情報オントロジーで標準化されたデータを介して、複数の既存データベース内のデータを互いに関連付けて、複数の既存データベース内のデータを横断した各種検索を実行することが可能となる検索システムを提供することにある。   Therefore, in view of the above problems, the present invention has an information structure and function for associating existing data with an ontology, thereby constructing an ontology, associating it with a database of an existing information system, and associating the association Provides a search system capable of executing various searches across data in a plurality of existing databases by associating data in a plurality of existing databases with each other through data standardized by an information ontology. There is.

本願発明に係る検索システムは、対象物の概念により知識化するクラスを有し、当該クラスを特定するプロパティが1つ以上結びつけられる情報オントロジーに基づいて、業務プロセスを支援する目的で構築され、稼働している既存の情報システムが使用している既存データベースから検索を行う検索システムにおいて、既存データベースから構造化されたメタデータを作成するメタデータ作成手段と、当該メタデータ作成手段によって構造化されたメタデータから特定の情報を抽出するための射影を作成する射影作成手段と、当該射影作成手段によって作成された射影を情報オントロジーデータベースのクラスにマッピングさせる第1のマッピング手段と、当該第1のマッピング手段によってクラスと射影がマッピングされた状態で、射影の射影項目をクラスのプロパティにマッピングさせる第2のマッピング手段と、によって構成されるマッピングシステムと、第1乃至2のマッピング手段によるマッピングに基づき、既存データベースにストアされているデータファイルのデータ項目同士を関連付ける関連付け手段と、データ項目の情報を、非定型データ構造データベースに蓄積する蓄積手段と、によって構成されるデータレイクシステムを具備する。   The search system according to the present invention is constructed and operated for the purpose of supporting a business process based on an information ontology that has a class that is made into a knowledge based on the concept of an object and that is associated with one or more properties that specify the class. In a search system that searches from an existing database used by an existing information system, metadata creation means for creating structured metadata from the existing database and structured by the metadata creation means Projection creation means for creating a projection for extracting specific information from the metadata, first mapping means for mapping the projection created by the projection creation means to a class of the information ontology database, and the first mapping Projection with class and projection mapped by means Based on mapping by the second mapping means for mapping the projection item to the property of the class, and mapping by the first or second mapping means, the data items of the data file stored in the existing database are A data lake system comprising an associating means for associating and an accumulating means for accumulating data item information in an atypical data structure database is provided.

また、前記メタデータは、物理的なデータベース情報、データベースにストアされているデータファイルの情報、データファイル間の結合情報、データファイルのデータ項目の情報及びデータ項目の有効なデータ値の情報であることが望ましい。   The metadata includes physical database information, information on data files stored in the database, information on connection between data files, information on data items in the data file, and information on valid data values of the data items. It is desirable.

前記射影作成手段は、さらに単位データベースを具備し、射影の構造定義時に、単位概念を持つデータの射影項目に対して、単位が異なることを検知した場合、その単位間の互換方法を前記単位データベースから検索して単位変換することが望ましい。   The projection creating means further comprises a unit database, and when the projection structure definition defines that the units are different with respect to the projection item of the data having the unit concept, the unit database has a compatibility method between the units. It is desirable to convert the unit by searching from.

前記情報オントロジーから所望のクラスを選択することによって、前記マッピングシステムよって所望のクラスとマッピングされた少なくとも一つの射影を介して既存データベースから情報を入手することが望ましい。   It is desirable to obtain information from an existing database via at least one projection mapped to the desired class by the mapping system by selecting a desired class from the information ontology.

したがって、本願発明によれば、情報オントロジーで標準化されたデータを介して、複数の既存データベース内のデータを互いに関連付けるため、複数の既存データベース内のデータを横断した各種検索を実行することが可能となる。   Therefore, according to the present invention, it is possible to execute various searches across data in a plurality of existing databases in order to associate data in a plurality of existing databases with each other through data standardized by an information ontology. Become.

本願発明に係るマッピングシステムを具備する検索システムの構成を示したフローチャート図である。It is the flowchart figure which showed the structure of the search system which comprises the mapping system which concerns on this invention. 本願発明に係るマッピングシステムの射影の作成を示したフローチャート図である。It is the flowchart figure which showed creation of the projection of the mapping system which concerns on this invention. 本願発明に係るマッピングシステムの射影項目の定義を示したフローチャート図である。It is the flowchart figure which showed the definition of the projection item of the mapping system which concerns on this invention. 本願発明に係る検索システムの検索処理を示したフローチャート図である。It is the flowchart figure which showed the search process of the search system which concerns on this invention. 本願発明に係るマッピングシステムの構造ブロック図である。1 is a structural block diagram of a mapping system according to the present invention. 本願発明に係るマッピングシステムの一例を示した説明図である。It is explanatory drawing which showed an example of the mapping system which concerns on this invention. (a),(b)は本願発明の実施例に係るマッピングシステムのメタデータの一例を示した説明図である。(a), (b) is explanatory drawing which showed an example of the metadata of the mapping system based on the Example of this invention. 本願発明の実施例に係る射影項目とクラスのマッピングの一例を示した説明図である。It is explanatory drawing which showed an example of the mapping of the projection item and class which concern on the Example of this invention. 本願発明の実施例に係る有効値リストのマッピングの一例を示した説明図である。It is explanatory drawing which showed an example of the mapping of the effective value list which concerns on the Example of this invention. 本願発明の検索システムの探索・接合処理を示したフローチャート図である。It is the flowchart figure which showed the search and joining process of the search system of this invention. (a),(b)本願発明の実施例に係るデータレイクシステムの関連付けの一例を示した説明図である。(a), (b) It is explanatory drawing which showed an example of the correlation of the data lake system based on the Example of this invention. (a),(b)本願発明の実施例に係るデータレイクシステムの関連付けの一例を示した説明図である。(a), (b) It is explanatory drawing which showed an example of the correlation of the data lake system based on the Example of this invention. 本願発明の実施例に係る非定型データ構造データベースに蓄積されたデータ項目に付帯する属性情報の一例を示した説明図である。It is explanatory drawing which showed an example of the attribute information incidental to the data item accumulate | stored in the atypical data structure database which concerns on the Example of this invention.

以下、本願発明の一実施形態について、添付の図面を参照して具体的に説明する。   Hereinafter, an embodiment of the present invention will be specifically described with reference to the accompanying drawings.

図1に示すように、本願発明に係る検索システムは、ステップ100〜500で構成されるマッピングシステム1と、ステップ510〜520及び探索・接合処理手段700で構成されるデータレイクシステム2と、検索処理手段600と、を具備する。   As shown in FIG. 1, the search system according to the present invention includes a mapping system 1 composed of steps 100 to 500, a data lake system 2 composed of steps 510 to 520 and search / join processing means 700, and a search. And processing means 600.

このマッピングシステム1は、対象物の概念により知識化するクラスを有し、該クラスを特定するプロパティが1つ以上結びつけられる情報オントロジーに基づいて、業務プロセスを支援する目的で構築され、稼働している既存の情報システムが使用している既存データベースから検索を行う検索システムにおいて、前記既存のデータベースのメタデータを作成するメタデータ作成手段100と、このメタデータ作成手段100によって作成されたメタデータから特定の情報を抽出するための射影を作成する射影作成手段200と、この射影作成手段200によって作成された射影を情報オントロジーデータベースのクラスにマッピングさせる第1のマッピング手段300と、この第1のマッピング手段300によってクラスと射影がマッピングされた状態で、射影の射影項目をクラスのプロパティにマッピングさせる第2のマッピング手段400と、この第2のマッピング手段400によって有効値リストを有するプロパティと有効値リストを有する射影項目がマッピングされた状態で、その射影項目の有効値リストの値をそのプロパティの有効値リストの値にマッピングさせる第3のマッピング手段500と、によって構成される。   This mapping system 1 has a class that becomes knowledge based on the concept of an object, and is constructed and operated for the purpose of supporting a business process based on an information ontology in which one or more properties specifying the class are linked. In a search system for performing a search from an existing database used by an existing information system, metadata creating means 100 for creating metadata of the existing database, and metadata created by the metadata creating means 100 Projection creation means 200 for creating a projection for extracting specific information, first mapping means 300 for mapping the projection created by the projection creation means 200 to a class of the information ontology database, and the first mapping Class and projection are mapped by means 300 The second mapping means 400 for mapping the projection item of the projection to the property of the class, and the second mapping means 400 maps the property having the valid value list and the projection item having the valid value list. And a third mapping unit 500 that maps the value of the effective value list of the projection item to the value of the effective value list of the property.

マッピングシステム1において、情報オントロジーと既存データベースのマッピングの構造は、既存データベースのメタデータを基にクラス定義に近似の既存データベースの射影を構造定義し、射影の各部と情報オントロジーの各部を対応づけすることにより実現することができるものである。   In the mapping system 1, the mapping structure between the information ontology and the existing database defines the projection of the existing database approximate to the class definition based on the metadata of the existing database, and associates each part of the projection with each part of the information ontology. Can be realized.

このデータレイクシステム2は、センサーのログデータ、GPS(全地球測位システム)データ、画像・映像データ、音声データといった「非構造化データ」を含めた多種多様なデータをスキーマレスなデータベースである非定型データ構造データベースに蓄積し、ユーザからの検索要求に応じて、当該蓄積されたデータから当該要求に合致するデータを探索・抽出・接合してユーザに提示するシステムである。データレイクシステム2は、具体的には、マッピングシステム1による第1〜第3のマッピング手段によるマッピングに基づき、既存データベースにストアされているデータファイルのデータ項目同士を関連付ける関連付け手段510と、データ項目の情報を、非定型データ構造データベースに蓄積する蓄積手段520と、ユーザの要求に基づき、データ項目同士の関連付けに沿って非定型データ構造データベースに蓄積されたデータ項目の情報を探索して当該要求に合致したデータ項目を抽出し、当該抽出されたデータ項目の情報を接合して情報を提示する探索・接合手段700と、によって構成される。   This data lake system 2 is a non-schema-less database that includes a variety of data including “unstructured data” such as sensor log data, GPS (global positioning system) data, image / video data, and audio data. In this system, data is stored in a fixed data structure database, and in accordance with a search request from the user, data matching the request is searched for, extracted, and joined from the stored data and presented to the user. Specifically, the data lake system 2 includes an association unit 510 that associates data items of data files stored in an existing database, based on the mapping by the first to third mapping units by the mapping system 1, and the data items The information is stored in the atypical data structure database, and based on the user's request, the data item information stored in the atypical data structure database is searched according to the association between the data items. And a search / joining means 700 that extracts information items that match the above and joins the information of the extracted data items to present information.

前記メタデータ作成手段100において、メタデータはデータに関するデータであり、既存データベースのメタデータとは、既存データベースに格納されているデータに関するデータである。既存データベースのメタデータは、物理的なデータベースの情報、データベースにストアされているデータファイルの情報、データファイル間の結合情報、データファイルのデータ項目の情報及びデータ項目の有効なデータ値の情報である。これらの既存データベースのメタデータは、既存データベースの管理システムが保有するカタログ情報などから自動的に生成することができる。また、不足する情報については手作業によって補完することも可能である。   In the metadata creating means 100, the metadata is data related to data, and the metadata of the existing database is data related to data stored in the existing database. The metadata of an existing database includes physical database information, information on data files stored in the database, information on connection between data files, data file data item information, and data item valid data value information. is there. The metadata of these existing databases can be automatically generated from the catalog information held by the management system of the existing database. In addition, it is possible to supplement the missing information manually.

本願発明に係る検索システムは、特定の概念として知識化された情報オントロジーのクラスと、そのクラスで知識化された概念と同一若しくは同等な情報を有する既存データベースを結合させる仕組みであり、この仕組みにより、データ構造、文法、基準の異なる既存データベースの情報を、情報オントロジーの各構造にマッピングすることで既存データベースのデータを情報オントロジーで標準化されたデータに対して互換させるものを含んで構成してもよい。   The search system according to the present invention is a mechanism for combining an information ontology class that has been made into a knowledge as a specific concept and an existing database that has the same or equivalent information as the concept that has been made into knowledge in that class. Including existing database information with different data structure, grammar, and standards, mapping information on each structure of information ontology to make data of existing database compatible with data standardized by information ontology Good.

また、単一の情報オントロジーに対し、複数の既存データベースをマッピングすることで、データ構造、文法、基準がそれぞれ異なる各既存データベースのデータは、情報オントロジーを通じて相互に互換することが可能となる。   Further, by mapping a plurality of existing databases to a single information ontology, the data of each existing database having different data structures, grammars, and standards can be interchanged through the information ontology.

本願発明によれば、情報オントロジーデータベースが、クラスのインスタンスデータを持たず、既存の情報システムが処理しているデータベース内のデータをインスタンスデータとして取り扱うことから、複数の既存データベースをそのまま使用することができるという効果がある。   According to the present invention, the information ontology database does not have the instance data of the class, and the data in the database processed by the existing information system is handled as the instance data. Therefore, a plurality of existing databases can be used as they are. There is an effect that can be done.

前記射影作成手段200における射影の作成は、例えば図2のフローチャートに示される。ステップ200から開始される射影の作成において、ステップ201において、既存データベース内のデータファイルを一つ選択する。ステップ202においてさらにデータファイルを選択するか否かが判定され、選択する場合(Y)には、ステップ201に戻ってさらにデータファイルを選択し、ステップ202の選択において選択しない(N)が判定されるまで、データファイルが選択される。これによって、既存データベース内にある1つ以上のデータファイルが選択される。   Projection creation in the projection creation means 200 is shown in the flowchart of FIG. 2, for example. In creating a projection starting from step 200, one data file in an existing database is selected in step 201. In step 202, it is determined whether or not to further select a data file. When selecting (Y), the process returns to step 201 to select another data file, and it is determined not to select (N) in the selection in step 202. Until the data file is selected. As a result, one or more data files in the existing database are selected.

ステップ203の判定において、選択されたデータファイル数が2以上ある場合(Y)には、ステップ204に進んで、選択したデータファイルの結合条件が設定され、ステップ205の射影項目が定義される。また、選択されたデータファイル数が1の場合(N)は、ステップ204を回避してステップ205に進んで射影項目が定義される。この定義は、
1.単一のデータ項目をそのまま参照する射影項目を定義する。
2.単一のデータ項目を計算して導出する射影項目を定義する。
3.複数のデータ項目を計算して導出する射影項目を定義する。
4.データ項目を参照しない定数、若しくは環境等から動的に導出する射影項目を定義する。
ことである。
If it is determined in step 203 that the number of selected data files is 2 or more (Y), the process proceeds to step 204, where the combination conditions for the selected data files are set, and the projection items in step 205 are defined. If the number of selected data files is 1 (N), the process skips step 204 and proceeds to step 205 to define a projection item. This definition is
1. Define a projection item that directly references a single data item.
2. Define a projection item that computes and derives a single data item.
3. Define a projection item that calculates and derives multiple data items.
4). Defines a constant that does not refer to a data item, or a projection item that is dynamically derived from the environment.
That is.

具体的には、図3で示すように、ステップ206において、射影項目がデータ項目の単純参照か否かが判定され、単純参照である場合(Y)には、ステップ207においてデータ項目が選択される。また、単純参照でない場合(N)には、ステップ208に進んで、射影項目がデータ項目を参照する場合(Y)には、ステップ209に進んでデータ項目を選択し、ステップ210において選択が終了するまで、ステップ209のデータ項目の選択が繰り返され、その後ステップ211に進んで射影項目を導出する式の定義が行われる。また、ステップ208の判定において射影項目がデータ項目を参照しない場合にもステップ211に進んで射影項目を導出する式の定義が行われる。そして、ステップ207及びステップ211からステップ212において、射影項目の名称が定義される。   Specifically, as shown in FIG. 3, it is determined in step 206 whether or not the projection item is a simple reference to a data item. If it is a simple reference (Y), the data item is selected in step 207. The If it is not a simple reference (N), the process proceeds to step 208. If the projection item refers to a data item (Y), the process proceeds to step 209 to select the data item, and the selection is completed in step 210. Until then, the selection of the data item in step 209 is repeated, and then the process proceeds to step 211 to define an expression for deriving the projection item. Further, even when the projection item does not refer to the data item in the determination in step 208, the process proceeds to step 211 to define an expression for deriving the projection item. In step 207 and steps 211 to 212, the names of the projection items are defined.

その後、ステップ213において意味データ型を設定する。射影項目に適用する意味データ型がある(字下げされたデータ側は、前行のデータ型のサブ型として扱われる)。
・論理型
・文字列型
・可変長文字型
・固定長文字型
・非数量コード型
・数値型
・整数型
・数量整数型
・数量レベル整数型
・非数量整数型
・通過整数型
・実数型
・数量実数型
・数量レベル実数型
・通過実数型
・日付時間型
Thereafter, in step 213, a semantic data type is set. There is a semantic data type applied to the projection item (the indented data side is treated as a subtype of the data type of the previous line).
・ Logical type ・ String type ・ Variable length type ・ Fixed length type ・ Non-quantity code type ・ Numeric type ・ Integer type ・ Quantity integer type ・ Quantity level integer type ・ Non-quantity integer type ・ Passing integer type ・ Real number type ・Quantity real type ・ Quantity level real type ・ Passing real number type ・ Date time type

ステップ214では、単位が設定される。この単位としては、
・数量単位:メートル、グラム、リットル、摂氏度...等
・通貨単位:日本円、米国ドル、ユーロ、香港ドル...等
・紀年法 :西暦、和暦...等
・時間帯 :日本標準時間、米国西海岸時間(夏時間)...等
がある。これによって、将来的にマッピングされたプロパティと射影項目との間で単位が異なっていることを検知することが可能となる。利用者若しくはコンピュータシステムは、単位が異なることを検知した場合、その単位間の互換方法を単位データベースから検索し、単位変換を行う知識を得ることができる。
In step 214, the unit is set. As this unit,
-Units of measure: meters, grams, liters, degrees Celsius. . .・ Currency units: Japanese yen, US dollar, Euro, Hong Kong dollar. . . Etc. ・ Year-of-year: Western calendar, Japanese calendar. . .・ Time zone: Japan Standard Time, US West Coast Time (Daylight Saving Time). . . Etc. Thereby, it is possible to detect that the unit is different between the property mapped in the future and the projection item. When the user or the computer system detects that the units are different, the user or the computer system can obtain a knowledge for performing unit conversion by searching the unit database for a compatibility method between the units.

さらに、ステップ216において、前記射影項目に有効値リストがあるか否かが判定される。無い場合(N)にはステップ220から基の制御ルーチンに回帰する。ある場合(Y)にはステップ217に進んで有効値リストを作成し、ステップ218において有効値リストに有効値を追加し、ステップ219の判定において有効値が無くなったと判定されるまでステップ218が継続され、無くなった場合(N)にステップ220において基のルーチンに回帰する。   Further, in step 216, it is determined whether or not there is a valid value list for the projection item. If not (N), the process returns to step 220 from the control routine. If there is (Y), the process proceeds to step 217 to create an effective value list, an effective value is added to the effective value list in step 218, and step 218 continues until it is determined in step 219 that there is no effective value. If no more (N), return to the base routine in step 220.

ステップ205からの射影項目の定義作業は、ステップ230の判定において定義されリストに有効値を追加し、ステップ219の判定において有効値が無くなったと判定されるまでステップ218が継続され、無くなった場合(N)にステップ220において基のルーチンに回帰する。   In the project item definition work from step 205, an effective value is added to the list defined in the determination of step 230, and step 218 is continued until it is determined that there is no effective value in the determination of step 219. N) Return to the base routine at step 220.

ステップ205からの射影項目の定義作業は、ステップ230の判定において定義される射影項目が無くなるまで実行され、すべての射影項目が定義されたと判定した場合(N)には、図2のステップ231に進んで射影の範囲となるレコードの検索条件が定義される(抽出条件の設定)。射影の範囲となるレコードの検索条件は、同一の既存データベースに定義される他の射影に対し、排他的な情報を提供するよう定義される。この排他的な射影定義が保障されなければ、既存データベースのあるデータが複数の情報オントロジーのクラスにマッピングされることになるため、情報オントロジーが表す概念が曖昧なものとなってしまうからである。尚、射影作成手段200は、ステップ232において終了し、メインルーチンに回帰する。 Projection item definition work from step 205 is executed until there is no projection item defined in the determination in step 230, and if it is determined that all projection items have been defined (N), the process proceeds to step 231 in FIG. The search condition for the record that will be the projection range is defined (extraction condition setting). The search condition for the record that is the projection range is defined so as to provide exclusive information to other projections defined in the same existing database. If this exclusive projection definition is not guaranteed, certain data in the existing database is mapped to a plurality of information ontology classes, so that the concept represented by the information ontology becomes ambiguous. The projection creating means 200 ends in step 232 and returns to the main routine.

前記第1のマッピング手段300は、射影を情報オントロジーデータベースのクラスにマッピングさせる。但し、射影とクラスのマッピングには以下の制約がある。
・射影を複数のクラスにマッピングさせることはできない。
・クラスは複数の射影にマッピングさせることができる。
・クラスは同一の既存データベースに対し定義された複数の射影をマッピングさせることができない。
情報オントロジーのクラスと、任意の既存データベースに対して定義された射影とのマッピングは、1:1である。
The first mapping unit 300 maps projections to information ontology database classes. However, projection and class mapping have the following restrictions.
• Projections cannot be mapped to multiple classes.
A class can be mapped to multiple projections.
A class cannot map multiple projections defined for the same existing database.
The mapping between information ontology classes and projections defined for any existing database is 1: 1.

前記第2のマッピング手段400は、クラスと射影がマッピングされた状態で、射影の射影項目をクラスのプロパティにマッピングさせる。プロパティのデータ型と射影項目の意味データ型が一致しているもののみをマッピングさせることができる。有効値リストを持つプロパティには有効値リストを持つ射影項目のみをマッピングさせることができる。   The second mapping unit 400 maps the projection item of the projection to the property of the class in a state where the class and the projection are mapped. Only those whose property data type and the semantic data type of the projection item match can be mapped. Only a project item having a valid value list can be mapped to a property having a valid value list.

前記第3のマッピング手段500は、有効値リストを持つプロパティと有効値リストを持つ射影項目がマッピングされた状態で、その射影項目の有効値リストの値をそのプロパティの有効値リストの値にマッピングさせるものである。   The third mapping unit 500 maps the value of the effective value list of the projection item to the value of the effective value list of the property in a state where the property having the effective value list and the projection item having the effective value list are mapped. It is something to be made.

前記情報オントロジーのクラス、プロパティ、プロパティの有効値等の定義において言語表記される情報は、同一の意味をなす別言語による表記を任意言語数登録することができ、かつ、言語毎に同一の意味をなす別表記を任意数登録することができる構造体に格納する。これによって、日本語での「テレビ」、「テレビジョン」、「TV」、「ティービー」、英語での「television」、中国語での「電視」などから同一の情報を発見することができるものである。   Information written in the language in the definition of the information ontology class, property, property valid value, etc., can be registered in any number of languages in the same language, and the same meaning for each language Is stored in a structure that can register an arbitrary number of different notations. This makes it possible to find the same information from "TV", "TV", "TV", "TV" in Japanese, "television" in English, "TV" in Chinese, etc. It is.

前記関連付け手段510は、前記第1〜第3のマッピング手段によるマッピングに基づき、前記既存データベースにストアされているデータファイルのデータ項目同士を関連付ける。当該関連付けについては、どのような態様で関連付けてもよく、(1)データ項目にタグ付けすることで関連付けてもよいし、(2)ポインター型のデータを持たせて相互にポインティングすることで関連付けてもよいし、(3)辞書機能等によって当該関連付けを別途登録することで関連付けてもよい。   The associating unit 510 associates data items of data files stored in the existing database based on the mapping by the first to third mapping units. The association may be associated in any manner, (1) may be associated by tagging the data item, or (2) associated by pointing to each other with pointer-type data. Alternatively, (3) the association may be performed by separately registering the association using a dictionary function or the like.

前記蓄積手段520は、前記データ項目の情報を、非定型データ構造データベースに蓄積する。当該蓄積については、例えば、既存のデータベースのデータファイルから、キー情報(PK)をキー値として、各データ項目の情報をデータ値として非定型に蓄積することで、構成してもよい。   The storage means 520 stores the information on the data items in an atypical data structure database. The storage may be configured, for example, by storing the information of each data item as a data value in an atypical form from a data file of an existing database, using the key information (PK) as a key value.

上記のような構成によれば、ユーザのデータの検索要求があった際に、非定型データ構造のデータベースに蓄積したデータを利用することで、あらゆる種類のデータを対象にすることができ、かつ、情報オントロジーの標準化を介して関連付けられた状態でデータを管理することができるため、当該要求があった際には、データ間の関連付けを利用して探索処理を行うことができる。   According to the above configuration, when there is a user data search request, it is possible to target all kinds of data by using the data stored in the database of the atypical data structure, and Since the data can be managed in the associated state through the standardization of the information ontology, the search process can be performed using the association between the data when the request is made.

前記検索処理手段600は、例えば図4で示すものである。この検索処理600において、先ずステップ601において、情報オントロジーを選択し、その情報オントロジー内の所定のクラスを選択する。そして、ステップ603において前記選択されたクラスにマッピングされている射影を取得し、ステップ604で射影の構造定義を取得し、ステップ605で、抽出する前記クラスのプロパティ/射影項目を選択する。ステップ606で抽出条件(検索条件)を指定し、ステップ607で既存データベースへの検索リクエストを生成し、ステップ608で既存データベースの検索処理を行う。ステップ609でこの検索結果データを取得し、ステップ610で単位を変化して整合させ、ステップ611で検索結果データを返し、ステップ612において検索処理作業が完了するものである。   The search processing means 600 is, for example, as shown in FIG. In the search process 600, first, in step 601, an information ontology is selected, and a predetermined class in the information ontology is selected. In step 603, the projection mapped to the selected class is acquired. In step 604, the structure definition of the projection is acquired. In step 605, the property / projection item of the class to be extracted is selected. In step 606, an extraction condition (search condition) is specified. In step 607, a search request for the existing database is generated. In step 608, the existing database is searched. In step 609, the search result data is acquired. In step 610, the units are changed and matched. In step 611, the search result data is returned. In step 612, the search processing operation is completed.

前記探索・接合手段700は、ユーザの要求に基づき、前記データ項目同士の関連付けに沿って前記非定型データ構造データベースに蓄積されたデータ項目の情報を探索して当該要求に合致したデータ項目を抽出し、当該抽出されたデータ項目の情報を接合して情報を入手してもよい。当該関連付けに沿った探索においては、例えば、同義的に意味付けられた関連を持つデータのうち、一つのデータが選択されたら、他のデータも同時に選択されるようにしてもよいし、前後に意味付けられた関連を持つデータであれば、前のデータが選択されたら、後に続くデータが次に選択されるようにしてもよい。また、当該接合においては、例えば、単純に当該抽出したデータ項目の情報を連結させてもよいし、当該抽出したデータ項目を加工した上で、連結させてもよいし、当該抽出したデータ同士を加減乗除の演算処理を行ってもよい。   Based on the user's request, the search / joining means 700 searches the data item information stored in the atypical data structure database along the association between the data items and extracts the data item that matches the request. The information of the extracted data items may be joined to obtain the information. In the search along the association, for example, when one data is selected from the data having the synonymous meaning, the other data may be selected at the same time. If the data has a meaningful association, if the previous data is selected, the subsequent data may be selected next. Further, in the joining, for example, the information of the extracted data items may be simply connected, or the extracted data items may be processed and connected, or the extracted data may be connected to each other. Addition / subtraction / division / division calculation processing may be performed.

上記のような構成によれば、非定型データ構造データベースに蓄積されたデータに対して、単に要求に合致したデータをデータベースから抽出するだけではなく、情報オントロジーによる標準化を介した関連付けを利用してデータを探索して抽出し、さらに接合することができるため、よりユーザの要求に合った(ユーザの意思に沿った)データの照会ができる検索システムを提供することができる。   According to the above configuration, the data stored in the atypical data structure database is not simply extracted from the database according to the request, but is also associated with the standardization based on the information ontology. Since the data can be searched, extracted, and further joined, it is possible to provide a search system that can inquire data more in line with the user's request (in line with the user's intention).

前記探索・接合手段700は、前記非定型データ構造データベースに蓄積されたデータ項目は、文の構成要素に関する属性情報を付帯し、前記データ同士の関連付けに沿って前記非定型データ構造データベースに蓄積されたデータ項目の情報を探索する際に、前記属性情報に基づいて、探索順序を決定してもよい。   In the search / joining means 700, the data items stored in the atypical data structure database are accompanied by attribute information related to the constituent elements of the sentence, and are stored in the atypical data structure database along with the association of the data. When searching for the information of the data item, the search order may be determined based on the attribute information.

上記のような構成によれば、データの背景となる属性情報によって探索順序を決定することで、文構成にそった探索が実現でき、より形式的なデータの照会を行うことができる。   According to the above configuration, the search according to the sentence configuration can be realized by determining the search order based on the attribute information that is the background of the data, and a more formal data inquiry can be performed.

前記探索・接合手段700は、具体的には、例えば図10で示すものである。この探索・接合処理700において、先ずステップ701において、ユーザのデータの検索要求を受け付ける。当該要求の受付においては、具体的には、直接、非定型データ構造データベースに合わせた関数を利用してキー値等を指定されること(クエリーによる問合せ)で受け付けてもよいし、GUI(Graphical User Interface)による要求操作手段(例えば、要求対象のデータ項目のキーワードを入力するテキストボックスなど)を提供し、当該手段によって受け付けてもよい。   Specifically, the search / joining means 700 is, for example, as shown in FIG. In this search / joining process 700, first, in step 701, a user data search request is accepted. In accepting the request, specifically, it may be accepted by directly specifying a key value or the like using a function matched to an atypical data structure database (query by query), or GUI (Graphical Request operation means (for example, a text box for inputting a keyword of a data item to be requested) may be provided by the user interface and accepted by the means.

ステップ702において、データ項目に付帯する文構成要素に関する属性情報を利用するか否か判定する。当該属性情報を利用するか否かは予め設定された条件によって判定してもよいし、ユーザ要求の内容や利用される関数に応じて判定してもよい。利用する場合(Y)はステップ703に進む。   In step 702, it is determined whether or not the attribute information related to the sentence component attached to the data item is to be used. Whether to use the attribute information may be determined according to a preset condition, or may be determined according to the content of a user request or a function to be used. When using (Y), the process proceeds to step 703.

ステップ703において、当該属性情報による探索順序を決定する。当該探索順序の決定においては、例えば、当該属性情報の優先順位を決定し、当該順位に応じてソートさせて探索するよう探索順序を決定してもよい。   In step 703, the search order based on the attribute information is determined. In the determination of the search order, for example, the priority order of the attribute information may be determined, and the search order may be determined so that the search is performed by sorting according to the order.

ステップ704において、非定型データ構造データベースへの探索リクエストを生成し、ステップ705でデータ同士の関連付けに沿って非定型データ構造データベースに蓄積されたデータ項目の情報を探索する探索処理を行う。この際、ユーザの要求が直接問い合わせるクエリーであれば、当該クエリーをそのまま探索リクエストとしてもよいし、GUI操作手段によるものであれば、当該指定されたパラメータを埋め込んだクエリーを新たに発行することで生成してもよい。また、この際、ステップ703で決定された探索順序があればそれに従う。ステップ706でこの探索結果のデータ項目を抽出し、ステップ707で当該抽出したデータ項目の情報を接合させる。ステップ708で接合した情報を返し、探索・接合処理作業が完了するものである。   In step 704, a search request to the atypical data structure database is generated, and in step 705, a search process is performed to search for information on the data items stored in the atypical data structure database along the association between the data. In this case, if the user's request is a query that directly inquires, the query may be used as it is as a search request, or if it is based on GUI operation means, a new query with the specified parameter embedded may be issued. It may be generated. At this time, if there is a search order determined in step 703, it is followed. In step 706, the data item of the search result is extracted, and in step 707, the information of the extracted data item is joined. The information joined at step 708 is returned, and the search / join processing work is completed.

以上のことから、本願発明に係るマッピングシステムを概略的に説明すると、図5で示すようなブロック構成となる。このブロック構成において、既存データベースから抽出された既存データベースのメタデータ20は、少なくともデータベース情報、データファイル情報、データファイル項目情報、データファイル項目値リストから構成される。   From the above, when the mapping system according to the present invention is schematically described, a block configuration as shown in FIG. 5 is obtained. In this block configuration, the metadata 20 of the existing database extracted from the existing database includes at least database information, data file information, data file item information, and a data file item value list.

この既存データベースのメタデータ20の概念的上部には、射影構造定義30が存在する。この射影構造定義、具体的には、データファイル選択、データファイル結合定義、データファイル項目選択、データ抽出定義、射影項目表現定義、射影項目値リストによって射影が生成される。   A projective structure definition 30 exists at the conceptual upper part of the metadata 20 of the existing database. Projections are generated by this projection structure definition, specifically, data file selection, data file connection definition, data file item selection, data extraction definition, projection item expression definition, and projection item value list.

この射影は、射影−情報オントロジーマッピング40を介して、情報オントロジーデータベース50が有するクラスとマッピングされ、射影項目は、クラスのプロパティとマッピングされ、且つ射影項目の値リストの値は、クラスのプロパティ値リストの値とマッピングされる。   This projection is mapped to a class included in the information ontology database 50 via a projection-information ontology mapping 40, the projection item is mapped to a class property, and the value of the projection item value list is the property value of the class. Mapped to list value.

図6において、これをさらに詳細に説明すると、既存データベース10から抽出されたメタデータ20は、データベースファイル情報Tbl1,Tbl2,Tbl3,Tbl4と、データベースファイル項目情報C11,C12,C13,C21,C22,C23,C31,C32,C33,C41,C42,C43と、データベースファイル項目の値リストLvとを具備する。   In FIG. 6, this will be described in more detail. The metadata 20 extracted from the existing database 10 includes database file information Tbl1, Tbl2, Tbl3, Tbl4 and database file item information C11, C12, C13, C21, C22, C23, C31, C32, C33, C41, C42, C43, and a database file item value list Lv.

前記データベースファイル情報Tbl1,Tbl2,Tbl3,Tbl4は、データ抽出条件34及びデータファイル結合条件35を介してデータファイル選択され、射影Prj1,Prj2,Prj3に生成され、またデータベースファイル項目情報C11〜C43はデータファイル項目選択されて射影項目Pjc1-1〜Pjc3-3が生成される。さらに、データベースファイル項目の値リストLvは、射影項目の値リストPjvとして生成される。これらが、射影構造定義30を構成する。   The database file information Tbl1, Tbl2, Tbl3, and Tbl4 are selected as data files through the data extraction condition 34 and the data file combination condition 35, and are generated into projections Prj1, Prj2, Prj3, and the database file item information C11 to C43 are Data file items are selected and projection items Pjc1-1 to Pjc3-3 are generated. Further, the database file item value list Lv is generated as a projection item value list Pjv. These constitute the projective structure definition 30.

この射影Prj1,Prj2,Prj3は、情報オントロジーデータベース50のクラスCls1,Cls2,Cls3と、射影−情報オントロジーマッピング40を介してマッピングされる。これと同時に、クラスCls1のクラスプロパティPrp1-1には例えば射影項目Pjc1-1,Pjc2-1がマッピングされ、クラスプロパティPrp1-2には、射影項目Pjc1-2,Pjc2-2がマッピングされ、クラスブロックパティPrp2-1には、射影項目Pjc1-3,Pjc2-3がマッピングされる。また、射影項目値リストPjvは、クラスプロパティの値リストPrpvにマッピングされる。   The projections Prj1, Prj2, and Prj3 are mapped to the classes Cls1, Cls2, and Cls3 of the information ontology database 50 via the projection-information ontology mapping 40. At the same time, for example, projection items Pjc1-1 and Pjc2-1 are mapped to the class property Prp1-1 of the class Cls1, and projection items Pjc1-2 and Pjc2-2 are mapped to the class property Prp1-2. Projection items Pjc1-3 and Pjc2-3 are mapped to the block patty Prp2-1. The projection item value list Pjv is mapped to the class property value list Prpv.

これによって、例えばクラスCls2が選択された場合、射影Prj1及びPrj2が選択され、射影項目としてPjc1-1〜Pjc2-3が選択され、メタデータとしてそれぞれデータベースファイル情報Tbl1〜Tbl4が選択され、これに基づいて既存データベースの項目が選択され、抽出条件に従ってデータが吸い上げられるようになっている。   Thus, for example, when class Cls2 is selected, projections Prj1 and Prj2 are selected, Pjc1-1 to Pjc2-3 are selected as projection items, and database file information Tbl1 to Tbl4 are selected as metadata, respectively. Based on this, an item of an existing database is selected, and data is downloaded according to the extraction condition.

情報オントロジーから特定の既存データベースの情報を検索する実施例を以下に示す。   An example of retrieving information in a specific existing database from the information ontology is shown below.

図7(a)で示すように、例えば既存データベースに基づいて作成されたメタデータdb01は、商品分類情報として、商品分類コード及び商品分類名を有し、商品情報として、SKU、代表JANコード8桁、代表JANコード13桁、商品名及び分類を有し、仕入情報としてSKU、会社コード、仕入開始、仕入終了及び仕入価格を有し、仕入先企業情報として会社コード及び会社名を有する。また、メタデータdb02は、図7(b)で示すように、商品部門情報として部門CD及び部門名を有し、品名情報として品名CD、品名及び部門CDを有し、販売商品情報として商品CD、商品CD国、商品CDアイテム、商品CDチェックデジット、商品名、商品レシート表示名、品名CD及び登録日を有し、EAN国CD情報として国CD及び国名を有し、取引先情報として取引先CD及び取引先名を有し、仕入情報として商品CD、仕入先会社、開始日及び終了日を有し、価格情報として、商品CD、開始日、終了日及び価格を有する。   As shown in FIG. 7 (a), for example, metadata db01 created based on an existing database has a product classification code and a product classification name as product classification information, and SKU, representative JAN code 8 as product information. It has 13 digits, representative JAN code, product name and classification, SKU, company code, purchase start, purchase end and purchase price as purchase information, company code and company as supplier company information Have a name. In addition, as shown in FIG. 7B, the metadata db02 has a department CD and a department name as product department information, a product name CD, a product name and department CD as product name information, and a product CD as sales product information. , Commodity CD country, commodity CD item, commodity CD check digit, commodity name, commodity receipt display name, commodity name CD and registration date, country CD and country name as EAN country CD information, business partner information It has CD and supplier name, has product CD, supplier company, start date and end date as purchase information, and has product CD, start date, end date and price as price information.

また図8に示すように、プロパティとして、商品名、商品短縮名、商品分類、商品仕入先企業、商品仕入開始日、商品仕入終了日、商品仕入価格を有する情報オントロジーデータベースのクラス(:電化製品)は、商品名については射影:db01電化製品の商品名及び射影:db02電化製品の商品名がマッピングされ、商品短縮名については射影:db02電化製品の商品レシート表示名がマッピングされ、商品分類については射影:db01電化製品の商品分類名及び射影:db02電化製品の部門名がマッピングされ、商品仕入先企業については射影:db01電化製品の会社名及び射影:db02電化製品の取引先名がマッピングされ、商品仕入開始日については射影:db01電化製品の仕入開始及び射影:db02電化製品の開始日がマッピングされ、商品仕入終了日については、射影:db01電化製品の仕入終了及び射影:db02電化製品の終了日がマッピングされ、商品仕入価格については射影:db01電化製品の仕入価格がマッピングされる。   Also, as shown in FIG. 8, a class of an information ontology database having, as properties, a product name, a product short name, a product classification, a product supplier company, a product purchase start date, a product purchase end date, and a product purchase price (: Electrical products), the product name is projected: the product name of db01 electrical appliance and the projection: the product name of db02 electrical appliance is mapped, and the product abbreviated name is projected: the product receipt display name of db02 electrical appliance is mapped For product classification, projection: db01 electrical product product classification name and projection: db02 electrical product department name is mapped, product supplier company projection: db01 electrical appliance company name and projection: db02 electrical product transactions The name is mapped and the product purchase start date is projected: db01 electrical product purchase start and projection: db02 electrical product start date is mapped, and the product purchase end date Projection: db01 appliances purchase end and projection: db02 appliances end date is mapped, about the product purchase price projection: db01 purchase price of electrical appliances is mapped.

また、図9で示すように、この実施例では射影:db01電化製品の射影項目:商品分類名には有効値リストとして商品分類コード及び商品分類名があり、さらに射影:db02電化製品の射影項目:部門名には、有効値リストとして部門CDと部門名が付随し、これらはクラス:電化製品のプロパティ:有効値リスト商品分類及び正式名称にマッピングされる。   Further, as shown in FIG. 9, in this embodiment, the projection: projection item of db01 electrical appliance: the product category name has a product category code and product category name as a valid value list, and the projection: projection item of db02 electrical appliance. : The department name is accompanied by a department CD and a department name as a valid value list, and these are mapped to class: appliance property: valid value list product classification and formal name.

上記構成により、情報オントロジーから既存データベースの製品情報を検索する例を以下に示す。利用者が音響映像製品の一覧とその仕入価格を既存データベースから取得する場合、利用者は、情報オントロジーからクラス:電化製品を走査し選択する。上述したように、クラス:電化製品には、プロパティ:商品名、プロパティ:商品短縮名、プロパティ:商品分類、プロパティ:商品仕入終了日、プロパティ:商品仕入価格がある。また、クラス:電化製品は、射影:db01電化製品、射影:db02電化製品にマッピングされている。利用者は、一覧に必要な項目としてプロパティ:商品名、プロパティ:商品分類、プロパティ:商品仕入価格を選択する。   An example of searching for product information in an existing database from the information ontology with the above configuration is shown below. When a user obtains a list of audiovisual products and their purchase price from an existing database, the user scans and selects a class: appliance from the information ontology. As described above, the class: electrical appliance has property: product name, property: product short name, property: product classification, property: product purchase end date, and property: product purchase price. Also, the class: electrical appliance is mapped to the projection: db01 electrical appliance and the projection: db02 electrical appliance. The user selects property: product name, property: product classification, property: product purchase price as items necessary for the list.

プロパティ:商品名、プロパティ:商品分類は、射影:db01電化製品、射影:db02電化製品の対応する射影項目にマッピングされているが、仕入価格は、射影:db01電化製品の射影項目:仕入価格のみマッピングされている。このため、使用する射影は、射影:db01電化製品を選択する。プロパティ:製品名は、射影項目:製品名に、プロパティ:商品分類は、射影項目:商品分類コードに、プロパティ:商品仕入価格は、射影項目:仕入価格にマッピングされている。   Property: Product name, Property: Product classification, Projection: db01 electrical appliance, Projection: db02 It is mapped to the corresponding projection item of electrical appliance, but the purchase price is projected: Projection of db01 electrical appliance: Purchase Only the price is mapped. For this reason, projection: db01 electrical appliance is selected as the projection to be used. Property: product name is mapped to projection item: product name, property: product classification is mapped to projection item: product classification code, property: product purchase price is mapped to projection item: purchase price.

また、射影:db01電化製品は、db01メタデータから構造化されており、射影項目:製品名は、データファイルの項目:商品名に、射影項目:商品分類コードはデータファイル:商品分類の項目:商品分類コードに、射影項目:仕入価格は、データファイル:仕入の項目:仕入価格にマッピングされている。この2層のマッピングから情報オントロジー(クラス:電化製品)→既存のデータベース:db01へのマッピングが行われる。既存データベース:db01がRDBMSである場合、既存データ:db01のメタデータから以下のSQLがオントロジーから既存データベースへのリクエストとして得られる。   Projection: db01 electrical appliance is structured from db01 metadata, Projection item: Product name is in data file item: Product name, Projection item: Product classification code is Data file: Product classification item: In the product classification code, the projection item: purchase price is mapped to the data file: purchase item: purchase price. Mapping from this two-layer mapping to information ontology (class: electrical appliance) → existing database: db01 is performed. When the existing database: db01 is an RDBMS, the following SQL is obtained as a request from the ontology to the existing database from the metadata of the existing data: db01.

select 商品分類.商品分類コード as 商品分類、
商品.商品名 as 商品名、
仕入.仕入価格 as 商品仕入価格
from 商品分類
left join 商品 on (商品分類.商品分類コード=商品.分類)
left join 仕入 on (商品.SKU=仕入.SKU);
select Product classification. Product classification code as product classification,
Product. Product name as product name,
Purchase. Purchase price as Product purchase price
from Product Classification
left join product on (Product classification. Product classification code = Product. Classification)
left join purchase on (product.SKU = purchase.SKU);

利用者は、音響映像製品の一覧が必要であるため、検索条件としてプロパティ:商品分類の有効値リストの値、商品分類:2(音響映像品)を設定する。プロパティ:商品分類の有効値リストの値、商品分類:2は、射影項目:商品分類の有効値リストの値、商品分類コード:DD200(図9参照)にマッピングされている。これにより、前記SQLは、以下のように条件が付加される。   Since the user needs a list of audiovisual products, the user sets property: value of effective value list of product category, product category: 2 (audio video product) as a search condition. Property: Value of product category effective value list, Product category: 2 is mapped to Projection item: Value of product category effective value list, Product category code: DD200 (see FIG. 9). Thereby, the condition is added to the SQL as follows.

select 商品分類.商品分類コード as 商品分類、
商品.商品名 as 商品名、
仕入.仕入価格 as 商品仕入価格
from 商品分類
left join 商品 on (商品分類、商品分類コード=商品.分類)
left join 仕入 on (商品.SKU=仕入.SKU);
when 商品分類.商品分類コード='DD200';
このリクエストを既存データベース:db01に対して実行することで必要とする情報が得られる。
select Product classification. Product classification code as product classification,
Product. Product name as product name,
Purchase. Purchase price as Product purchase price
from Product Classification
left join product on (product classification, product classification code = product. classification)
left join purchase on (product.SKU = purchase.SKU);
when Product classification. Product classification code = 'DD200';
Necessary information can be obtained by executing this request on the existing database: db01.

情報オントロジーを介したマッピングに基づいた、既存データベースのデータ項目同士の関連付けの実施例を以下に示す。当該実施例では、図9のマッピング例、図11及び図12を用いて説明する。   An example of associating data items in an existing database based on mapping through an information ontology is shown below. This embodiment will be described with reference to the mapping example of FIG. 9 and FIGS. 11 and 12.

図11は、既存データベースにストアされているデータ項目を、それぞれ、非定型データ構造データベースに蓄積した際の例を示す。当該データ項目は、キー値(key)とデータ値(Value)で構成され、それぞれの値は、データ型や長さ等の制限なく、保有される。図11(a)では、データ項目の関連付けがなされていない状態の例を、図11(b)ではタグデータによってデータ項目の関連付けをした状態の例を示す。   FIG. 11 shows an example when the data items stored in the existing database are each stored in the atypical data structure database. The data item is composed of a key value (key) and a data value (Value), and each value is held without any limitation on data type, length, or the like. FIG. 11A shows an example of a state in which data items are not associated, and FIG. 11B shows an example of a state in which data items are associated by tag data.

図12は、図11同様に、既存データベースにストアされているデータ項目を、それぞれ、非定型データ構造データベースに蓄積し、関連付けした際の例を示す。図12(a)では、ポインター型のデータによってデータ項目の関連付けをした状態の例、図12(b)では、データ項目の関連付けを別途辞書機能で登録された例を示す。   FIG. 12 shows an example when the data items stored in the existing database are accumulated in the atypical data structure database and associated with each other, as in FIG. 12A shows an example of a state in which data items are associated by pointer type data, and FIG. 12B shows an example in which the association of data items is separately registered by a dictionary function.

図9に示すマッピングの例では、クラス:電化製品のプロパティ:商品仕入先企業においては、射影:db01電化製品の会社名及び射影:db02電化製品の取引先名がマッピングされている。また、図9に示す他のマッピングの例として、クラス:電化製品のプロパティ:商品仕入価格においては、射影:db01電化製品の仕入価格がマッピングされ、プロパティ:商品仕入先企業を介して、射影:db01電化製品の会社名及び射影:db02電化製品の取引先名と関連付けられている。図9のこれらのマッピングの例を用いて以下説明する。   In the example of mapping shown in FIG. 9, in class: appliance property: merchandise supplier company, projection: db01 appliance company name and projection: db02 appliance supplier name are mapped. Further, as another mapping example shown in FIG. 9, in the class: electrical property: product purchase price, the projection: db01 purchase price of the electrical appliance is mapped, and the property: via the product supplier company. , Projection: db01 is associated with the company name of the appliance and Projection: db02 is associated with the supplier name of the appliance. This will be described below with reference to these mapping examples in FIG.

当該実施例に係る検索システムは、図11(a)に示すような、メタデータdb01の仕入先企業の会社コード及び会社名(Rec1)、メタデータdb02の取引CD及び取引先名(Rec2)に対して、図11(b)に示すように上記マッピングに基づき、これらのデータ項目同士を関連付ける。なお、当該関連付けについては、どのような態様で関連付けてもよく、(1)図11(b)に示すように、同じ意味をもつデータ項目同士であれば、同じタグデータ(本例では、「商品仕入先企業」というタグ)をタグ付けすることで関連付けてもよいし、(2)図12(a)に示すように、ポインター型のデータを持たせて相互にポインティングすることで関連付けてもよい。図12(a)の例では、「equal」は同義の意味を持たせ相互のポインターとし、「previous」は前に続くデータのポインター、「next」は次に続くデータのポインターとする。また、(3)図12(b)に示すように、辞書機能等によって当該関連付けを別途登録することで関連付けてもよい。図12(b)の例では、まず、Dec Item1でクラスのプロパティ間の関連付けを、Dec Item2〜4は、各プロパティと当該各プロパティにマッピングされたデータ項目間の関連付けを登録する例を示す。   The search system according to the embodiment includes a company code and company name (Rec1) of a supplier company of metadata db01, a transaction CD and a supplier name (Rec2) of metadata db02 as shown in FIG. On the other hand, as shown in FIG. 11B, these data items are associated with each other based on the mapping. The association may be associated in any manner. (1) As shown in FIG. 11B, if the data items have the same meaning, the same tag data (in this example, “ Tag (product supplier company tag)), or (2) as shown in FIG. 12 (a), by having pointer type data and pointing to each other, Also good. In the example of FIG. 12A, “equal” has the same meaning and is a mutual pointer, “previous” is a pointer to the preceding data, and “next” is a pointer to the following data. (3) As shown in FIG. 12B, the association may be performed by separately registering the association using a dictionary function or the like. In the example of FIG. 12B, first, an association between properties of a class is registered with Dec Item 1, and Dec Items 2 to 4 show an example of registering an association between each property and a data item mapped to each property.

当該実施例に係る検索システムは、上記以外にも、具体的には、図11(a)に示すような、メタデータdb01の仕入の仕入価格に対して、図11(b)に示すように前記マッピングに基づき、メタデータdb02の取引CD及び取引先名(Rec2)のデータ項目同士を関連付けてもよい。関連付け手段の具体的な態様については、上記(1)〜(3)の例と同様に、どのような態様で関連付けてもよい。   In addition to the above, the search system according to the embodiment specifically shows the purchase price of the purchase of the metadata db01 as shown in FIG. As described above, the data items of the transaction CD and the supplier name (Rec2) in the metadata db02 may be associated with each other based on the mapping. About the specific aspect of an association means, you may link | relate by what kind of aspect similarly to the example of said (1)-(3).

非定型データ構造データベースに蓄積されたデータ項目に付帯する文の構成要素に関する属性情報に基づいて、探索順序の決定の実施例を以下に示す。当該実施例では、図13を用いて説明する。   An example of determining the search order based on the attribute information related to the constituent elements of the sentence attached to the data item stored in the atypical data structure database is shown below. This embodiment will be described with reference to FIG.

当該実施例に係る検索システムにおいて、非構造データ構造データベースに蓄積されたデータ項目は、図13に示すような5W2H(Who,What,When,Where,Why,How,How Many(How Much))といった文構成要素に関する属性情報を付帯してもよい。当該属性情報は、言い換えれば、対象のデータが収集された際の背景となる情報である。図13の例においては、例えば、製造作業において、センシングされたデータの場合を示す。当該実施例で示すように、蓄積され、探索されるデータがセンサーのログデータであった場合に、当該ログデータに付帯する検知した日時情報であったり、どのセンサーが検知したかの検知をした機器の情報であったり、どこで検知されたのかの位置情報であったりすればよい。   In the search system according to the embodiment, the data items stored in the unstructured data structure database are 5W2H (Who, What, When, Where, Why, How, How Many (How Much)) as shown in FIG. You may attach the attribute information regarding a sentence component. In other words, the attribute information is information serving as a background when target data is collected. In the example of FIG. 13, for example, the case of sensed data in a manufacturing operation is shown. As shown in the embodiment, when the accumulated and searched data is the log data of the sensor, the detected date / time information attached to the log data or which sensor is detected is detected. What is necessary is just the information of an apparatus, or the positional information on where it was detected.

当該実施例に係る検索システムは、図13に示すように、例えば、「Image01」をキー値に持つ画像データからデータ項目同士の関連付けに基づいて、次のデータを探索する際に、Whenに係る属性情報を最優先にして、次に、Whereに係る属性情報の優先順位を高く設定する。当該実施例に係る検索システムは、当該設定従って、それらの属性情報の値でデータをソートして、画像データとこれらの属性情報(Whenが「20170930」で、Whereが「工場A」)が合致する項目にキー値を持つ「Voice01」を「Voice02」より優先して探索するように探索順序を決定することができる。これにより、当該実施例に係る検索システムは、ユーザの目的にそって抽出することができる。   As shown in FIG. 13, the search system according to the embodiment relates to When, for example, when searching for the next data based on the association between data items from image data having “Image01” as a key value. Attribute information is given the highest priority, and then the priority order of attribute information related to Where is set higher. The search system according to the embodiment sorts the data by the value of the attribute information according to the setting, and the image data and the attribute information (When is “20170930” and Where is “factory A”) match. The search order can be determined so that “Voice01” having a key value in the item to be searched is prioritized over “Voice02”. Thereby, the search system according to the embodiment can be extracted according to the purpose of the user.

本願発明におけるプログラムは、コンピュータに読み取り可能な記憶媒体に記憶された状態で提供されてもよい。記憶媒体は、「一時的でない有形の媒体」に、プログラムを記憶可能である。記憶媒体は、HDDやSDDなどの任意の適切な記憶媒体、またはこれらの2つ以上の適切な組合せを含むことができる。記憶媒体は、揮発性、不揮発性、または揮発性と不揮発性の組合せでよい。なお、記憶媒体はこれらの例に限られず、プログラムを記憶可能であれば、どのようなデバイスまたは媒体であってもよい。   The program in the present invention may be provided in a state stored in a computer-readable storage medium. The storage medium can store the program in “a tangible medium that is not temporary”. The storage medium can include any suitable storage medium such as HDD or SDD, or a suitable combination of two or more thereof. The storage medium may be volatile, non-volatile, or a combination of volatile and non-volatile. The storage medium is not limited to these examples, and any device or medium may be used as long as it can store the program.

本開示の実施形態を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本開示の範囲に含まれることに留意されたい。例えば、各手段、各ステップ等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の手段やステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。また、各実施形態に示す構成を適宜組み合わせることとしてもよい。   Although the embodiments of the present disclosure have been described based on the drawings and examples, it should be noted that those skilled in the art can easily make various changes and modifications based on the present disclosure. Therefore, it should be noted that these variations and modifications are included in the scope of the present disclosure. For example, the functions included in each means, each step, etc. can be rearranged so that there is no logical contradiction, and a plurality of means, steps, etc. can be combined or divided into one. . Moreover, it is good also as combining suitably the structure shown to each embodiment.

100 メタデータ作成手段
200 射影作成手段
300 第1のマッピング手段
400 第2のマッピング手段
500 第3のマッピング手段
600 検索処理手段
700 探索・接合処理手段
DESCRIPTION OF SYMBOLS 100 Metadata production | generation means 200 Projection production means 300 1st mapping means 400 2nd mapping means 500 3rd mapping means 600 Search processing means 700 Search and joining processing means

Claims (7)

対象物の概念により知識化するクラスを有し、該クラスを特定するプロパティが1つ以上結びつけられる情報オントロジーに基づいて、業務プロセスを支援する目的で構築され、稼働している既存の情報システムが使用している既存データベースから検索を行う検索システムにおいて、
前記既存データベースから構造化されたメタデータを作成するメタデータ作成手段と、
該メタデータ作成手段によって構造化されたメタデータから特定の情報を抽出するための射影を作成する射影作成手段と、
該射影作成手段によって作成された射影を情報オントロジーデータベースのクラスにマッピングさせる第1のマッピング手段と、
該第1のマッピング手段によってクラスと射影がマッピングされた状態で、射影の射影項目をクラスのプロパティにマッピングさせる第2のマッピング手段と、
によって構成されるマッピングシステムと、
前記第1乃至2のマッピング手段によるマッピングに基づき、前記既存データベースにストアされているデータファイルのデータ項目同士を関連付ける関連付け手段と、
前記データ項目の情報を、非定型データ構造データベースに蓄積する蓄積手段と、
によって構成されるデータレイクシステムと、を具備することを特徴とする検索システム。
An existing information system constructed and operated for the purpose of supporting a business process based on an information ontology that has a class that becomes knowledge based on the concept of an object and that is linked with one or more properties that specify the class. In a search system that searches from an existing database in use,
Metadata creation means for creating structured metadata from the existing database;
Projection creating means for creating a projection for extracting specific information from the metadata structured by the metadata creating means;
First mapping means for mapping the projection created by the projection creation means to a class of an information ontology database;
A second mapping means for mapping a projection item of the projection to a property of the class in a state where the class and the projection are mapped by the first mapping means;
A mapping system comprising:
An association means for associating data items of the data file stored in the existing database based on the mapping by the first or second mapping means;
Storage means for storing information of the data items in an atypical data structure database;
And a data lake system comprising: a search system comprising:
前記マッピングシステムは、該第2のマッピング手段によって該射影項目が該プロパティにマッピングされた状態で、該射影項目及び該プロパティに有効値リストが存在する場合、該射影項目の有効値リストの値を該プロパティの有効値リストの値にマッピングさせる第3のマッピング手段と、を含んで構成され、
前記関連付け手段は、前記第1乃至3のマッピング手段によるマッピングに基づき、前記既存データベースにストアされているデータファイルのデータ項目同士を関連付けることを特徴とする請求項1に記載の検索システム。
The mapping system, when the projection item is mapped to the property by the second mapping means, and when there is a valid value list for the projection item and the property, the value of the valid value list of the projection item is displayed. A third mapping means for mapping to the value of the valid value list of the property,
The search system according to claim 1, wherein the association unit associates data items of data files stored in the existing database based on the mapping by the first to third mapping units.
前記メタデータ作成手段は、前記既存データベースから物理的なデータベース情報、データベースにストアされているデータファイルの情報、データファイル間の結合情報、データファイルのデータ項目の情報及びデータ項目の有効なデータ値を有する構造化されたメタデータを作成することを特徴とする請求項1又は2に記載の検索システム。   The metadata creation means includes physical database information from the existing database, information on data files stored in the database, information on connection between data files, data item information of the data file, and valid data values of the data items. 3. The search system according to claim 1 or 2, wherein structured metadata including: is created. 前記情報オントロジーから所望のクラスを選択することによって、前記マッピングシステムによって、所望のクラスとマッピングされた少なくとも一つの射影を介して既存データベースから情報を入手することを特徴とする請求項1乃至3のいずれか1項に記載の検索システム。   4. Information from an existing database is obtained by said mapping system via at least one projection mapped to a desired class by selecting a desired class from said information ontology. The search system according to any one of the above items. ユーザの要求に基づき、前記データ項目同士の関連付けに沿って前記非定型データ構造データベースに蓄積されたデータ項目の情報を探索して該要求に合致したデータ項目を抽出し、該抽出されたデータ項目の情報を接合して情報を入手することを特徴とする請求項1乃至4のいずれか1項に記載の検索システム。   Based on the user's request, the data item stored in the atypical data structure database is searched along with the association between the data items to extract the data item that matches the request, and the extracted data item The search system according to any one of claims 1 to 4, wherein the information is obtained by joining the information. 前記非定型データ構造データベースに蓄積されたデータ項目は、文の構成要素に関する属性情報を付帯し、
前記データ同士の関連付けに沿って前記非定型データ構造データベースに蓄積されたデータ項目の情報を探索する際に、前記属性情報に基づいて、探索順序を決定することを特徴とする請求項1乃至4のいずれか1項に記載の検索システム。
The data items stored in the atypical data structure database are accompanied by attribute information related to sentence components,
5. The search order is determined based on the attribute information when searching for information on data items stored in the atypical data structure database along the association of the data. The search system according to any one of the above.
前記射影作成手段は、さらに単位データベースを具備し、単位概念を持つデータの該射影項目に対して、マッピングされた該プロパティが持つ単位が異なることを検知した場合、該射影項目及び該プロパティが持つ単位間の互換方法を前記単位データベースから検索して単位変換することを特徴とする請求項3に記載の検索システム。   The projection creation means further comprises a unit database, and when it is detected that the unit of the mapped property is different with respect to the projection item of the data having the unit concept, the projection item and the property have 4. The search system according to claim 3, wherein a compatibility method between units is searched from the unit database and unit conversion is performed.
JP2018051765A 2018-03-19 2018-03-19 Retrieval system Pending JP2019164557A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018051765A JP2019164557A (en) 2018-03-19 2018-03-19 Retrieval system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018051765A JP2019164557A (en) 2018-03-19 2018-03-19 Retrieval system

Publications (1)

Publication Number Publication Date
JP2019164557A true JP2019164557A (en) 2019-09-26

Family

ID=68065642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018051765A Pending JP2019164557A (en) 2018-03-19 2018-03-19 Retrieval system

Country Status (1)

Country Link
JP (1) JP2019164557A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364033A (en) * 2021-01-13 2021-02-12 北京云真信科技有限公司 Data retrieval system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364033A (en) * 2021-01-13 2021-02-12 北京云真信科技有限公司 Data retrieval system
CN112364033B (en) * 2021-01-13 2021-04-13 北京云真信科技有限公司 Data retrieval system

Similar Documents

Publication Publication Date Title
JP3597370B2 (en) Document processing device and recording medium
US10997167B2 (en) Disambiguating join paths for natural language queries
US9767499B2 (en) Supply chain orchestration system with configure-to-order item matching
JP4859456B2 (en) Data schema mapping program and computer system
US8898194B2 (en) Searching and displaying data objects residing in data management systems
TWI522942B (en) User favorites data processing method and device, user favorite data searching method and device, and user favorite system
KR102330547B1 (en) Building reports
US7333986B2 (en) Hierarchical database management system, hierarchical database management method, and hierarchical database management program
Etcheverry et al. Enhancing OLAP analysis with web cubes
US10467265B2 (en) Method for extracting entries from a database
CN103970761A (en) Commodity data searching method and device
US7702609B2 (en) Adapting to inexact user input
US8161061B2 (en) Module and method for searching named entity of terms from the named entity database using named entity database and mining rule merged ontology schema
JP7141270B2 (en) Database search system and method
US20190130050A1 (en) Dynamically generating normalized master data
CN110134681B (en) Data storage and query method and device, computer equipment and storage medium
US20230222136A1 (en) Information providing device
US20190129981A1 (en) Asynchronous distributed data cleansing
JP2002099561A (en) Method and system for data conversion, and storage medium
US20190121822A1 (en) Image metadata enrichment generator
US20070300176A1 (en) Entering Information in Input Field
US8862609B2 (en) Expanding high level queries
JP2019164557A (en) Retrieval system
JP5281354B2 (en) Search system
CN112560418A (en) Creating row item information from freeform tabular data