WO2023188049A1 - Metadata management system, metadata management method, and program - Google Patents

Metadata management system, metadata management method, and program Download PDF

Info

Publication number
WO2023188049A1
WO2023188049A1 PCT/JP2022/015745 JP2022015745W WO2023188049A1 WO 2023188049 A1 WO2023188049 A1 WO 2023188049A1 JP 2022015745 W JP2022015745 W JP 2022015745W WO 2023188049 A1 WO2023188049 A1 WO 2023188049A1
Authority
WO
WIPO (PCT)
Prior art keywords
metadata
management system
general type
user
document type
Prior art date
Application number
PCT/JP2022/015745
Other languages
French (fr)
Japanese (ja)
Inventor
岳夫 荒木
Original Assignee
株式会社Robon
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Robon filed Critical 株式会社Robon
Priority to JP2022549966A priority Critical patent/JP7319475B1/en
Priority to PCT/JP2022/015745 priority patent/WO2023188049A1/en
Publication of WO2023188049A1 publication Critical patent/WO2023188049A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/81Indexing, e.g. XML tags; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Definitions

  • the present disclosure relates to a metadata management system, a metadata management method, and a program.
  • this type of technology is a system that registers the correspondence between data item names and data attributes for data items (metadata) handled during a series of processes in software design and development, and uses them as a shared resource.
  • the data item registration and search method includes a data item dictionary that manages data items that combine purpose of use and attributes under a single name. It has been proposed that when a data item is registered as a data item and the data item is searched, the attribute of the target is uniquely determined by using the name and purpose of use as keys (for example, see Patent Document 1).
  • the main purpose of the metadata management system, metadata management method, and program of the present disclosure is to make it possible to easily obtain desired metadata.
  • the metadata management system, metadata management method, and program of the present disclosure employ the following means to achieve the above-mentioned main purpose.
  • the metadata management system of the present disclosure includes: A metadata management system that manages metadata, a general type metadata acquisition unit that acquires each general type metadata, each of which is metadata defined by an arbitrary metadata schema; a document type metadata creation unit that creates each document type metadata from each of the general type metadata; The purpose is to have the following.
  • each general type metadata each of which is metadata defined by an arbitrary metadata schema
  • each document type metadata is created from each general type metadata. Therefore, by creating each document type metadata and performing a full-text search on each document type metadata according to the user's instructions, the user can search for the desired document type metadata even if the metadata schema of each metadata is not unified. metadata can be easily obtained.
  • each document type metadata is created, by performing natural language processing on each document type metadata, the information in each document type metadata can be supplemented and users can search for similar document type metadata. You can assist.
  • natural language processing examples include document vector calculation processing, complementation processing, proofreading processing, classification processing, search processing for similar document type metadata, and the like.
  • natural language processing can be performed using deep learning, for example, techniques such as RNN (Recurrent Neural Network) and BERT (Bidirectional Encoder Representations from Transformers).
  • the document type metadata creation unit may create the document type metadata from the general type metadata having a graph structure.
  • the document type metadata creation unit may create the document type metadata having an outline structure from the general type metadata having a tree structure among the graph structures.
  • the general type metadata includes first metadata about a data item holding a single value and second metadata about a set of the data items, and the first metadata
  • the second metadata includes a second common part, a second metadata source dependent part, and a second user defined part.
  • the general type metadata has the second common part as a vertex, and the second metadata source dependent part and the second user defined part as child nodes of the second common part.
  • the data has a second common part related part related to the second common part as a chapter, a second metadata source dependent part related part related to the second metadata source dependent part as a section, and a second common part related part related to the second metadata source dependent part as a section; a second user definition section related section that is related to the second user definition section; and a first common section set related section that is related to the set of the first common section; a first metadata source dependent part related part associated with the first metadata source dependent part, and a first user defined part associated with the first user defined part;
  • the user definition section and the related section may also be provided.
  • the general type metadata acquisition unit acquires each of the general type metadata, and the first item set by the user and the second item proposed and approved by the user. , a predetermined third item may be added.
  • a full text search is performed for each of the document type metadata using the search strings. It may further include a full text search section.
  • the metadata management system of the present disclosure may further include a natural language processing unit that performs natural language processing on the document type metadata, and at least the natural language processing unit may be configured as a multi-tenant system in a cloud environment. good.
  • a natural language processing unit that performs natural language processing on the document type metadata
  • at least the natural language processing unit may be configured as a multi-tenant system in a cloud environment. good.
  • the natural language processing unit proposes the calculation result to the user, and when the calculation result is approved by the user, the general type data acquisition unit reflects the calculation result in the general type data. It may also be updated. In this way, the calculation results of natural language processing can be reflected in the general metadata based on the user's intention.
  • the metadata management method of the present disclosure is A metadata management method for managing metadata, the method comprising: (a) obtaining each general type of metadata, each of which is metadata specified by an arbitrary metadata schema; (b) creating each document type metadata from each of the general type metadata;
  • the gist is to have the following.
  • each general type metadata each of which is metadata defined by an arbitrary metadata schema
  • each document type metadata is created from each general type metadata. Therefore, by creating each document type metadata and performing a full-text search on each document type metadata according to the user's instructions, the user can search for the desired document type metadata even if the metadata schema of each metadata is not unified. metadata can be easily obtained.
  • each document type metadata is created, by performing natural language processing on each document type metadata, the information in each document type metadata can be supplemented and users can search for similar document type metadata. You can assist.
  • the program of this disclosure is A program for making a computer function as a metadata management system for managing metadata, (a) obtaining each general type of metadata, each of which is metadata specified by an arbitrary metadata schema; (b) creating each document type metadata from each of the general type metadata;
  • the gist is to have the following.
  • the program of the present disclosure acquires each general type metadata, each of which is metadata defined by an arbitrary metadata schema, and creates each document type metadata from each general type metadata. Therefore, by creating each document type metadata and performing a full-text search on each document type metadata according to the user's instructions, the user can search for the desired document type metadata even if the metadata schema of each metadata is not unified. metadata can be easily obtained.
  • each document type metadata is created, by performing natural language processing on each document type metadata, the information in each document type metadata can be supplemented and users can search for similar document type metadata. You can assist.
  • 1 is a configuration diagram schematically showing the configuration of a metadata management system 20 as an example of the present disclosure.
  • 3 is a flowchart illustrating an example of metadata acquisition related processing. It is an explanatory diagram showing an example of data. It is an explanatory diagram showing an example of general type metadata. It is an explanatory diagram showing an example of general type metadata. It is an explanatory diagram showing an example of document type metadata. It is an explanatory diagram showing an example of general type metadata. It is an explanatory diagram showing an example of document type metadata. 3 is a flowchart illustrating an example of metadata search processing.
  • FIG. 1 is a configuration diagram schematically showing the configuration of a metadata management system 20 as an embodiment of the present disclosure.
  • the metadata management system 20 of the embodiment is configured as a system for managing metadata, and as shown in the figure, includes an on-premises version of the first main management system 32 and a cloud version of the second main management system 42. , a database system 44, a full text search system 46, a natural language processing system 48, and a user authentication system (not shown).
  • each of the first main management systems 32 exists in an on-premises environment 30, such as an environment within a company's intranet, and is configured using a well-known computer.
  • This on-premises environment 30 also includes a user terminal 50 and a metadata source 60.
  • the second main management system 42, database system 44, full text search system 46, natural language processing system 48, and user authentication system all exist in the cloud environment 40, and each uses a cloud service provided by a cloud vendor. It is configured as a multi-tenant system.
  • a metadata source 70 also exists in this cloud environment 40 .
  • the first main management system 32 sends each general type of metadata from the database 62 and tool 64 of the metadata source 60 to the second main management system 42 .
  • general type metadata is metadata defined by an arbitrary metadata schema.
  • the general type metadata includes first metadata about a data item holding a single value and second metadata about a set of data items.
  • the first metadata includes a first common part, a first metadata source dependent part defined when stored in the metadata sources 60 and 70, and a first metadata source dependent part defined by the user, automatically defined, or predefined. and a first user definition section in which the first user definition section is defined.
  • the second metadata includes a second common part, a second metadata source dependent part defined when stored in the metadata sources 60 and 70, and a second metadata source dependent part defined by the user, automatically defined, or predefined. and a second user definition section in which the user definition section is defined.
  • the general type metadata is configured as a tree structure, and has a second common part as a vertex, a second metadata source dependent part, a second user defined part, and a second common part as child nodes of the second common part.
  • the first common part has a first metadata source dependent part and a first user defined part as child nodes of the first common part.
  • the metadata source 60 includes a database 62 and tools 64. Note that in FIG. 1, the metadata source 60 includes one database 62 and one tool 64, but it may include only one of them, or it may include one or more of both. You can also use it as Examples of the tool 64 include ETL (Extract Transform Load).
  • the database 62 and the tool 64 store, for example, each file (data and general metadata attached to the data).
  • the metadata source 60 (database 62 and tools 64) is exposed to the first main management system 32 through an API (Application Programming Interface).
  • the second main management system 42 stores each general type metadata from the first main management system 32 and the metadata source 70 in the database 44a of the database system 44.
  • the second main management system 42 is exposed to the first main management system 32 and the user terminal 50 via API.
  • the metadata source 70 includes a database 72 and tools 74.
  • the metadata source 70 includes one database 72 and one tool 74, but it may include only one of them, or it may include one or more of both. You can also use it as As the tool 74, for example, ETL etc. can be mentioned.
  • the database 72 and the tool 74 store, for example, each file (data and general metadata attached to the data).
  • the metadata source 70 (database 72 and tools 74) is exposed to the second main management system 42 via an API.
  • the database system 44 creates each document type metadata from each general type metadata, and performs various processes in cooperation with the full text search system 46 and the natural language processing system 48.
  • Document type metadata is configured as an outline structure.
  • This document type metadata has, as a chapter, a second common part related part that is related to the second common part of the second metadata of the general type metadata. Further, as a clause, a second metadata source dependent part related part related to the second metadata source dependent part of the second metadata, and a second user definition related to the second user defined part of the second metadata. and a first common part set related part related to a set of first common parts of the first metadata. Further, as a term, there is a first common part related part related to the first common part.
  • a first metadata source dependent part related part related to the first metadata source dependent part of the first metadata and a first user defined part related to the first user defined part of the first metadata. It has a definition part and a related part.
  • the database system 44 has a database 44a. For example, each general type metadata is stored in the database 44a.
  • the database system 44 is exposed to the second main management system 42 via an API.
  • the full-text search system 46 breaks down each document type metadata into document components and creates an index, and performs a full-text search using the index of each document type data and the search string from the user terminal 50. I do it.
  • the full text search system 46 has a database 46a.
  • the database 46a stores, for example, each document type metadata, an index of each document type metadata, calculation results of natural language processing by the natural language processing system 48, and the like.
  • Each document type metadata, the index of each document type metadata, and the calculation result of natural language processing are respectively associated with each other using keys, and the keys are also attached to the general type metadata of the database 44a of the database system 44. associated with the use of
  • the full text search system 46 is exposed to the second main management system 42, database system 44, and natural language processing system 48 via API.
  • the natural language processing system 48 performs natural language processing on each document type metadata.
  • natural language processing include document vector calculation processing, complementation processing, proofreading processing, classification processing, search processing for similar document type metadata, and the like.
  • natural language processing can be performed using deep learning, for example, techniques such as RNN (Recurrent Neural Network) and BERT (Bidirectional Encoder Representations from Transformers).
  • Natural language system 48 has a database 48a. The natural language processing system 48 is exposed to the second main management system 42 and database system 44 via API.
  • the user terminal 50 is configured as a desktop computer, a notebook computer, a smartphone, a tablet terminal, etc., and includes a processing section, a storage section, an input section, a display section, and the like.
  • the processing unit is configured as a well-known computer.
  • the storage unit is configured as a hard disk, SSD, or the like. Examples of the input unit include a keyboard, a mouse, and a touch panel.
  • the user terminal 50 is capable of communicating with the first main management system 32 and the second main management system 42.
  • the following describes user authentication processing when a user performs authentication, metadata acquisition related processing when acquiring general metadata from the metadata sources 60 and 70, and processing when a user searches for desired metadata.
  • the metadata search process will be explained in order.
  • This process is executed when the user operates the input section of the user terminal 50 and instructs to display an authentication screen for user authentication. Note that when this instruction is given, the user terminal 50 transmits the instruction to a user authentication system (not shown).
  • the user authentication system transmits the data of the authentication screen to the user terminal 50, and displays the authentication screen on the display section of the user terminal 50.
  • the authentication screen is configured so that the user can input the user's ID and password and issue authentication instructions.
  • the user operates the input unit 76 and inputs the user's ID and password and provides authentication instructions on the authentication screen, and the information is transmitted from the user terminal 50 to the user authentication system, the user The authentication system authenticates the user using the user's ID and password.
  • the user authentication system completes the user authentication, transmits the main screen data to the user terminal 50 and causes the display unit of the user terminal 50 to display the main screen.
  • the main screen is configured so that execution instructions such as metadata acquisition related processing and metadata search processing can be given.
  • FIG. 2 is a flowchart illustrating an example of metadata acquisition related processing. This process is performed when the user operates the input section of the user terminal 50 to set the databases 62, 72 and tools 64, 74 to be acquired in the metadata sources 60, 70 and issue an acquisition instruction. , the metadata management system 20.
  • the user terminal 50 transmits information on the databases 62, 72 and tools 64, 74 to be acquired, and an acquisition instruction to the first and second main management systems 32, 42. Note that this process may be executed periodically (for example, every few days or every few weeks) once the databases 62, 72 and tools 64, 74 to be acquired are set.
  • the information is transmitted to the main management system 42 (step S100).
  • the second main management system 42 acquires each general type of metadata from the database 72 to be acquired in the metadata source 70 and the API of the tool 74, and Each new general type metadata from the tool 74 is merged with each existing general type metadata in the database 44a of the database system 44 and stored in the database 44a using the API of the database system 44 (step S110 ).
  • each new general type metadata from the databases 62, 72 and tools 64, 74 to be acquired may not contain enough information needed by the user.
  • the second main management system 42 allows each new general-type metadata to be configured by the user before merging each new general-type metadata with each existing general-type metadata. At least one of the set first item, the second item proposed and approved by the user, and the predetermined third item is added as an additional item.
  • the input section of the user terminal 50 is operated by the user, and an item (first item) to be added to the general metadata is set and sent from the user terminal 50 to the second main management system 42. If so, the second main management system 42 adds that item (first item) to each new general type metadata as an additional item.
  • the second main management system 42 adds that item (first item) to each new general type metadata as an additional item.
  • the second main management system 42 adds that item (first item) to each new general type metadata as an additional item.
  • the second main management system 42 adds that item (first item) to each new general type metadata as an additional item.
  • step S110 at least one of the first item, second item, and third item is added to each new general type metadata as an additional item, so that the additional item is a logical name, a description, If it is the presence or absence of personal information, general type metadata as shown in FIG. 4 is converted to general type metadata as shown in FIG. 5.
  • a black square in FIG. 5 means that the information is blank (unknown).
  • the general type metadata is configured as a tree structure, and has a second common part as a vertex, and a second metadata source dependent part and a second used part as child nodes of the second common part. The first metadata source dependent part and the first user defined part are provided as child nodes of the first common part.
  • the set of "table name” and “STUDENT_TABLE” corresponds to the second common part.
  • the set of "file name” and “student.dat” corresponds to the second metadata source dependent part.
  • the set of "logical name” and “punched”, the set of “description” and “punched”, and the set of "personal information” and “information with punched” correspond to the second user-defined section.
  • a “column” corresponds to a set of first common parts, and a set of "column name” and “ID”, a set of "column name” and “Name”, etc. correspond to the first common part.
  • the set of "data type” and “integer” in the set of “column name” and “ID”, the set of “number of digits” and “18”, the set of “data type” and The set of “character string”, the set of "number of digits” and “16”, etc. correspond to the first metadata source dependent part.
  • the set of "personal information” and “information with holes” corresponds to the first user definition section.
  • the second main management system 42 communicates with the database 62 and tool 64 to be acquired via the first main management system 32, and performs communication with the database 62 and tools 64 to be acquired.
  • the general type When detecting general type metadata that does not exist in the target database 62, 72 or tool 64, 74 among existing general type data in the database 44a through communication with the database 72 or tool 74, the general type
  • the document type metadata corresponding to the deleted general type metadata, the index of the document type metadata, and the calculation results of natural language processing are also deleted from the database 46a of the full text search system 46.
  • general type metadata if it exists in the database 44a but does not exist in the acquisition target, in addition to the case where the general type metadata to be acquired is deleted, the name of the general type metadata to be acquired is changed. It is also possible to consider cases where multiple general type metadata to be acquired are integrated. Further, regarding the deletion of general type metadata, etc., it may be possible to do so without automatically deleting the data completely and only adding a deletion mark, and to completely delete it based on the user's instructions.
  • the second main management system 42 transmits a message to the user terminal 50 to the effect that each new general type metadata is stored in the database 44a, and displays the information on the display screen of the second main management system 42. to be displayed. In this way, the user is notified that each new general type metadata is stored in the database 44a.
  • the database system 44 creates each document type metadata from each general type metadata in the database 44a, and uses the API of the full text search system 46a to create each document type metadata in the database 46a of the full text search system 46. (Step S120).
  • This process is performed on new general type metadata.
  • Each document type metadata in the database 46a is associated with the general type metadata in the database 44a using a key.
  • the new general type metadata includes additional items and the information of the additional items is blank, so the document type metadata created by the process of step S120 also does not contain any additional items. , an additional item is included, and the information of the additional item is punched out.
  • the process of step S120 creates document type metadata as shown in FIG. be done. Similar to the black squares in FIG. 5, the black squares in FIG. 6 mean that the information is blank (unknown).
  • the document type metadata is structured as an outline structure, and has a second common part related part as a chapter, and a second metadata source dependent part related part and a second user defined part as sections. has a section related section and a first common section set related section, has the first common section as a term, and has a first metadata source dependent section related section and a first user defined section related section as eyes.
  • "table name: STUDENT_TABLE" corresponds to the second common part-related part.
  • the database system 44 cooperates with the full-text search system 46 using the API of the full-text search processing system 46, and causes the full-text search system 46 to create an index for each document type metadata (step S130).
  • the full-text search system 46 breaks down each document type metadata in the database 46a into document constituent elements, creates an index, and stores the created index for each document type metadata in the database 46a (step S140).
  • the process in step S140 is performed on new document type metadata.
  • Each document type metadata index in the database 46a is associated with the general type metadata in the database 44a and the document type metadata in the database 46a using a key.
  • the database system 44 uses the API of the natural language processing system 48 to cooperate with the full text search system 46, and causes the natural language processing system 48 to perform natural language processing on each document type metadata (step S150).
  • the natural language processing system 48 uses the API of the full-text search system 46 to acquire each document type metadata in the database 46a of the full-text search system 46, performs natural language processing on each document type metadata, and calculates the result of the calculation. is stored in the database 46a and proposed to the user (step S160).
  • the process in step S160 is performed on new document type metadata, similar to the process in step S140.
  • the calculation results of natural language processing for each document type metadata in the database 46a are respectively associated with the general type metadata in the database 44a, the document type metadata in the database 46a, and the document type metadata index using a key.
  • natural language processing examples include document vector calculation processing, complementation processing, proofreading processing, classification processing, search processing for similar document type metadata, and the like. Further, natural language processing can be performed using deep learning techniques such as RNN and BERT. In the embodiment, since the natural language processing system 48 is configured as a multi-tenant system, natural language processing can be performed with higher accuracy than when configured as a single tenant system. In the embodiment, natural language processing includes at least document vector calculation processing, similar document type metadata search processing, and complementation processing. Since the document vector calculation process does not form the core of the present invention, a detailed explanation will be omitted.
  • This search process for similar document type metadata will be explained.
  • This search process calculates the cosine distance between document vectors of each other document type metadata for the target document type metadata, and searches for similar document type metadata using the calculated cosine distance. This is done by
  • the natural language processing system 48 uses the API of the full-text search system 46 to cooperate with the full-text search system 46 and perform the full-text search system 46. 46 may be configured to perform similar document-type metadata search processing.
  • the document type metadata created by the process of step S120 includes an additional item, and the information of the additional item is left blank.
  • the complementation process in this case is performed as follows, for example.
  • the natural language processing system 48 uses deep learning (for example, RNN, BERT, etc.) technology to perform calculations for solving a fill-in-the-blank problem for document-type metadata in which additional item information has holes.
  • deep learning for example, RNN, BERT, etc.
  • the natural language processing system 48 stores the fill-in-the-blank candidates as the calculation result in the database 46a of the full-text search system 46 and transmits them to the second main management system 42.
  • the second main management system 42 acquires the corresponding general type metadata of the database 44a of the database system 44, fills in the blanks with information in the acquired general type metadata, and fills in the blanks with the information in the general type metadata after the completion.
  • fill-in candidates are proposed to the user. Note that instead of the general metadata after complementation, only candidates for filling in gaps in the information may be suggested to the user.
  • the processes of steps S180 to S220 are performed in the same way as the processes of steps S120 to S160 described above for the updated general type metadata, and the metadata acquisition related process of FIG. ends.
  • the details are as follows. Similar to the process in step S120, the database system 44 creates document-type metadata from the updated general-type metadata in the database 44a, and uses the created document-type metadata in the database 46a of the full-text search system 46 before the update.
  • the document type metadata is updated by overwriting the document type metadata (step S180).
  • document type metadata as shown in FIG. 8 is created by the process of step S180.
  • the full-text search system 46 creates an index for the updated document type metadata in the database 46a, and uses the created index in the database 46a.
  • the index of the document type metadata is updated by overwriting the index before the update (steps S190, S200).
  • the natural language processing system 48 performs natural language processing (for example, document vector calculation processing, etc.) on the updated document type metadata in the database 46a. ) and overwrites the calculation result in the database 46a before the update, thereby updating the calculation result of the natural language processing (steps S210, S220).
  • the database system 44 transmits a notification that the metadata acquisition-related process has been completed to the user terminal 50 via the second main management system 42, and displays the message on the display unit.
  • FIG. 9 is a flowchart illustrating an example of metadata search processing. This process is performed by each of the metadata management system 20 when the user operates the input section of the user terminal 50, specifies one or more search strings, and instructs the execution of this process. Executed by the system. Note that when an instruction to execute this process is given, the user terminal 50 transmits one or more search character strings and a search instruction to the second main management system 42.
  • the second main management system 42 transmits a search character string and a search instruction to the full text search system 46 (step S300).
  • the full-text search system 46 uses the search string and the index of each document type metadata in the database 46a and the calculation results of natural language processing (for example, the calculation results of document vectors, the search results of similar document type metadata, etc.).
  • the search results are sent to the second main management system 42 (step S310).
  • a full-text search method for example, each document type metadata is scored using the search string and the index of each document type metadata or the calculation result of natural language processing, and the results are arranged in order of highest score. can be mentioned. In this way, document-type metadata containing content that is the same as or similar to (related to) the search character string can be searched relatively easily and in a short time.
  • the second main management system 42 transmits the search results from the full text search system 46 and general type metadata and/or document type metadata related to the search results in the database 44a of the database system 44 to the user terminal 50. (Step S320), and the metadata search process ends.
  • the user terminal 50 displays this information on the display section.
  • this display method can be used to link parts of general type metadata and/or document type metadata (e.g., table names, file names, etc.) in the order of the above-mentioned scores, such as displaying search engine results. When a link is selected, all items of general type metadata and/or document type metadata are displayed.
  • each document type metadata is created from each general type metadata, and an index of each document type metadata is also created. Therefore, by performing a full-text search using the search string and the index of each document type metadata and the calculation result of natural language processing, even if the metadata schema of each general type metadata is not unified, Desired metadata (general type metadata and document type metadata) can be easily obtained. For example, even if the number of metadata is sufficiently large, desired metadata can be acquired in a short time. Furthermore, by performing natural language processing on each document type metadata, it is possible to complement the information of each document type metadata and to assist the user in searching for similar document type metadata.
  • each general type metadata is acquired from the databases 62, 72 and the tools 64, 74 that are the acquisition targets of the metadata sources 60, 70, and from each acquired general type metadata.
  • Create each document type metadata Therefore, an index of each document type metadata is created, natural language processing is performed on each document type data, and search strings and indexes of each document type metadata and calculation results of natural language processing are created according to the user's instructions.
  • searching for each document type metadata using (metadata) can be easily obtained.
  • natural language processing on each document type data it is possible to complement the information of each document type metadata and to assist the user in searching for similar document type metadata.
  • the database 62 and tools 64 of the metadata source 60 are exposed to the first main management system 32 via API, and the first main management system 32 can access the database 62 and tools 64 to be acquired.
  • the API of the tool 64 is used to obtain each general type metadata from these.
  • at least a portion of the database 62 and tools 64 may not be disclosed to the first main management system 32 via API. If the database 62 or tool 64 to be acquired is not disclosed to the first main management system 32 via API, the first main management system 32 sends an acquisition request to the database 62 or tool 64 to be acquired. It is conceivable that the receiving database 62 or tool 64 sends each general type metadata to the first main management system 32 .
  • the database 72 and tools 74 of the metadata source 70 are exposed to the second main management system 42 via API, and the second main management system 42 is responsible for the database 72 and tools 74 to be acquired.
  • Each general type metadata is obtained from these using the API of the tool 74.
  • at least a portion of the database 72 and tools 74 may not be exposed to the second main management system 42 through the API. If the database 72 or tool 74 to be acquired is not disclosed to the second main management system 42 via the API, the second main management system 42 sends an acquisition request to the database 72 or tool 74 to be acquired, and It is conceivable that the receiving database 72 or tool 74 sends each generic metadata to the second main management system 42 .
  • each tree-structured general type metadata is acquired from the target databases 62, 72 and tools 64, 74, and each outline-structured document type metadata is acquired from each acquired general type metadata.
  • the data was created.
  • the structure of the general metadata to be acquired may be any graph structure and is not limited to a tree structure. If the structure of general type metadata is a graph structure other than a tree structure, for example, at least part of it is a circular structure or a net structure, the structure of document type metadata is not an outline structure, but, for example, reference by linking to the outline structure. It is necessary to create a structure that includes the following.
  • the processing in steps S160 to S220 of the metadata acquisition related processing in FIG. 2 specifically, natural language processing for document type data (step S160), general type meta Updating data (step S170), updating the document type metadata in the database 46a (step S180), and updating the index of the document type metadata in the database 46a and the calculation results of natural language processing (steps S190 to S220) are automatically performed. It was decided that it would be carried out. However, these processes may be performed in response to instructions from the user.
  • step S110 of the metadata acquisition related process in FIG. At least one of the first item, second item, and third item is added to each new general type metadata and stored in the database 44a.
  • the second main management system 42 may store each new general type metadata as is in the database 44a.
  • the processes after step S170 may be performed automatically or may be performed in response to instructions from the user.
  • step S310 of the metadata search process in FIG. A full text search was performed using the calculation results.
  • the full text search system 46 may perform a full text search without using the calculation results of natural language processing.
  • the metadata management system 20 of the embodiment includes a database system 44, a second main management system 42, a full text search system 46, and a natural language processing system 48. However, at least two of these may be configured as an integrated system.
  • the metadata management system 20 of the embodiment includes a first main management system 32 in an on-premises environment, and a database system 44, a second main management system 42, a full text search system 46, and a natural language processing system 48 in a cloud environment. I decided to prepare.
  • the on-premises environment may include a database system 44, a second main management system 42, a full text search system 46, and a natural language processing system 48.
  • the first main management system 32 and the second main management system 42 may be configured integrally.
  • the first main management system 32 and the second main management system 42 correspond to a "general type metadata acquisition section"
  • the database system 44 corresponds to a "document type metadata creation section”.
  • the full text search system 46 corresponds to a "full text search unit”.
  • the natural language processing system 48 corresponds to a "natural language processing unit”.
  • the correspondence relationship between the main elements of the examples and the main elements of the invention described in the column of means for solving the problem is that the example implements the invention described in the column of means for solving the problem. Since this is an example for specifically explaining a form for solving the problem, it is not intended to limit the elements of the invention described in the column of means for solving the problems. In other words, the interpretation of the invention described in the column of means for solving the problem should be based on the description in that column, and the examples are based on the description of the invention described in the column of means for solving the problem. This is just one specific example.
  • the present disclosure can be used in the field of managing metadata.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Provided is a metadata management system for managing metadata, the metadata management system comprising a general metadata acquisition unit that acquires each general metadata that is metadata defined by a certain metadata schema, and a document metadata creation unit that creates each document metadata from each general metadata. The present invention thereby enables intended metadata to be acquired easily.

Description

メタデータ管理システム、メタデータ管理方法、プログラムMetadata management system, metadata management method, program
 本開示は、メタデータ管理システム、メタデータ管理方法、プログラムに関する。 The present disclosure relates to a metadata management system, a metadata management method, and a program.
 従来、この種の技術としては、ソフトウェアの設計、開発における一連の工程中で扱うデータ項目(メタデータ)について、データ項目の名称とデータの属性との対応を登録し、共有資源として利用するシステムのデータ項目の登録および検索方法において、単一の名称のもとに使用目的および属性を組み合わせたデータ項目を管理するデータ項目辞書を備え、論理的に同一のデータを、名称のもとに同一のデータ項目として登録しておき、データ項目を検索する場合、名称および使用目的をキーにすることにより、対象の属性を一意に決定するものが提案されている(例えば、特許文献1参照)。 Conventionally, this type of technology is a system that registers the correspondence between data item names and data attributes for data items (metadata) handled during a series of processes in software design and development, and uses them as a shared resource. The data item registration and search method includes a data item dictionary that manages data items that combine purpose of use and attributes under a single name. It has been proposed that when a data item is registered as a data item and the data item is searched, the attribute of the target is uniquely determined by using the name and purpose of use as keys (for example, see Patent Document 1).
特開平5-197533号公報Japanese Patent Application Publication No. 5-197533
 データを利活用するために、メタデータを用いて所望のデータを検索することが考えられているものの、各メタデータのメタデータスキーマが統一されていない場合、所望のメタデータを簡易に取得することが困難であった。 In order to utilize data, searching for desired data using metadata is considered, but if the metadata schema of each metadata is not unified, it is possible to easily obtain the desired metadata. It was difficult.
 本開示のメタデータ管理システム、メタデータ管理方法、プログラムは、所望のメタデータを簡易に取得可能とすることを主目的とする。 The main purpose of the metadata management system, metadata management method, and program of the present disclosure is to make it possible to easily obtain desired metadata.
 本開示のメタデータ管理システム、メタデータ管理方法、プログラムは、上述の主目的を達成するために以下の手段を採った。 The metadata management system, metadata management method, and program of the present disclosure employ the following means to achieve the above-mentioned main purpose.
 本開示のメタデータ管理システムは、
 メタデータを管理するメタデータ管理システムであって、
 それぞれが任意のメタデータスキーマにより規定されたメタデータである各一般型メタデータを取得する一般型メタデータ取得部と、
 前記各一般型メタデータから各文書型メタデータを作成する文書型メタデータ作成部と、
 を備えることを要旨とする。
The metadata management system of the present disclosure includes:
A metadata management system that manages metadata,
a general type metadata acquisition unit that acquires each general type metadata, each of which is metadata defined by an arbitrary metadata schema;
a document type metadata creation unit that creates each document type metadata from each of the general type metadata;
The purpose is to have the following.
 本開示のメタデータ管理システムでは、それぞれが任意のメタデータスキーマにより規定されたメタデータである各一般型メタデータを取得し、各一般型メタデータから各文書型メタデータを作成する。したがって、各文書型メタデータを作成するから、使用者の指示に従って各文書型メタデータについて全文検索を行なうことにより、各メタデータのメタデータスキーマが統一されていない場合でも、使用者は、所望のメタデータを簡易に取得することができる。また、各文書型メタデータを作成するから、各文書型メタデータについて自然言語処理を行なうことにより、各文書型メタデータの情報を補完したり、使用者による類似の文書型メタデータの探索を補助したりすることができる。例えば、一般型メタデータの場合、自然言語処理を行なうのが困難であり、情報の補完などを人間が手作業で行なうと多大な労力を要するのに対し、文書型メタデータを作成することにより、自然言語処理を行なって情報の補完などを容易に行なうことができるのである。 In the metadata management system of the present disclosure, each general type metadata, each of which is metadata defined by an arbitrary metadata schema, is acquired, and each document type metadata is created from each general type metadata. Therefore, by creating each document type metadata and performing a full-text search on each document type metadata according to the user's instructions, the user can search for the desired document type metadata even if the metadata schema of each metadata is not unified. metadata can be easily obtained. In addition, since each document type metadata is created, by performing natural language processing on each document type metadata, the information in each document type metadata can be supplemented and users can search for similar document type metadata. You can assist. For example, in the case of general-type metadata, it is difficult to perform natural language processing, and it would take a lot of effort for humans to manually complete the information, but by creating document-type metadata, it is difficult to perform natural language processing. , it is possible to easily supplement information by performing natural language processing.
 ここで、自然言語処理としては、例えば、文書ベクトルの計算処理、補完処理、校正処理、分類処理、類似の文書型メタデータの探索処理などを挙げることができる。また、自然言語処理は、ディープラーニング、例えば、RNN(Recurrent Neural Network)やBERT(Bidirectional Encoder Representations from Transformaers)などの技術を用いて行なうことができる。 Here, examples of natural language processing include document vector calculation processing, complementation processing, proofreading processing, classification processing, search processing for similar document type metadata, and the like. Further, natural language processing can be performed using deep learning, for example, techniques such as RNN (Recurrent Neural Network) and BERT (Bidirectional Encoder Representations from Transformers).
 本開示のメタデータ管理システムにおいて、前記文書型メタデータ作成部は、グラフ構造の前記一般型メタデータから前記文書型メタデータを作成するものとしてもよい。この場合、前記文書型メタデータ作成部は、前記グラフ構造のうち木構造の前記一般型メタデータからアウトライン構造の前記文書型メタデータを作成するものとしてもよい。この場合、前記一般型メタデータは、単一の値を保持するデータ項目についての第1メタデータと前記データ項目の集合についての第2メタデータとを有し、前記第1メタデータは、第1共通部と第1メタデータソース依存部と第1使用者定義部とを有し、前記第2メタデータは、第2共通部と第2メタデータソース依存部と第2使用者定義部とを有し、前記一般型メタデータは、頂点として、前記第2共通部を有し、前記第2共通部の子ノードとして、前記第2メタデータソース依存部と、前記第2使用者定義部と、前記第1共通部の集合とを有し、前記第1共通部の子ノードとして、前記第1メタデータソース依存部と、前記第1使用者定義部とを有し、前記文書型メタデータは、章として、前記第2共通部に関連する第2共通部関連部を有し、節として、前記第2メタデータソース依存部に関連する第2メタデータソース依存部関連部と、前記第2使用者定義部に関連する第2使用者定義部関連部と、前記第1共通部の集合に関連する第1共通部集合関連部とを有し、項として、前記第1共通部に関連する第1共通部関連部を有し、目として、前記第1メタデータソース依存部に関連する第1メタデータソース依存部関連部と、前記第1使用者定義部に関連する第1使用者定義部関連部とを有するものとしてもよい。 In the metadata management system of the present disclosure, the document type metadata creation unit may create the document type metadata from the general type metadata having a graph structure. In this case, the document type metadata creation unit may create the document type metadata having an outline structure from the general type metadata having a tree structure among the graph structures. In this case, the general type metadata includes first metadata about a data item holding a single value and second metadata about a set of the data items, and the first metadata The second metadata includes a second common part, a second metadata source dependent part, and a second user defined part. The general type metadata has the second common part as a vertex, and the second metadata source dependent part and the second user defined part as child nodes of the second common part. and a set of the first common parts, the first metadata source dependent part and the first user definition part as child nodes of the first common part, and the document type meta The data has a second common part related part related to the second common part as a chapter, a second metadata source dependent part related part related to the second metadata source dependent part as a section, and a second common part related part related to the second metadata source dependent part as a section; a second user definition section related section that is related to the second user definition section; and a first common section set related section that is related to the set of the first common section; a first metadata source dependent part related part associated with the first metadata source dependent part, and a first user defined part associated with the first user defined part; The user definition section and the related section may also be provided.
 本開示のメタデータ管理システムにおいて、前記一般型メタデータ取得部は、前記各一般型メタデータを取得し、使用者により設定された第1項目、使用者に提案して承認された第2項目、予め定められた第3項目、のうちの少なくとも1つを追加するものとしてもよい。 In the metadata management system of the present disclosure, the general type metadata acquisition unit acquires each of the general type metadata, and the first item set by the user and the second item proposed and approved by the user. , a predetermined third item may be added.
 本開示のメタデータ管理システムにおいて、使用者により1または複数の検索用文字列が設定されて検索指示が行なわれると、前記検索用文字列を用いて前記各文書型メタデータについて全文検索を行なう全文検索部を更に備えるものとしてもよい。検索用文字列を用いて各文書型メタデータについて全文検索を行なうことにより、各メタデータのメタデータスキーマが統一されていない場合でも、使用者は、所望のメタデータを簡易に取得することができる。 In the metadata management system of the present disclosure, when a user sets one or more search strings and issues a search instruction, a full text search is performed for each of the document type metadata using the search strings. It may further include a full text search section. By performing a full-text search for each document type metadata using a search string, users can easily obtain the desired metadata even if the metadata schema of each metadata is not unified. can.
 本開示のメタデータ管理システムにおいて、前記文書型メタデータについて自然言語処理を行なう自然言語処理部を更に備え、少なくとも前記自然言語処理部は、クラウド環境のマルチテナントシステムとして構成されているものとしてもよい。文書型メタデータについて自然言語処理を行なうことにより、文書型メタデータの情報を補完したり、使用者による類似の文書型メタデータの探索を補助したりすることができる。また、自然言語処理部をマルチテナントシステムとして構成することにより、シングルテナントシステムとして構成する場合に比して、自然言語処理を精度よく行なうことができる。 The metadata management system of the present disclosure may further include a natural language processing unit that performs natural language processing on the document type metadata, and at least the natural language processing unit may be configured as a multi-tenant system in a cloud environment. good. By performing natural language processing on document-type metadata, it is possible to complement the information in the document-type metadata and assist the user in searching for similar document-type metadata. Further, by configuring the natural language processing unit as a multi-tenant system, natural language processing can be performed with higher precision than when configuring it as a single tenant system.
 この場合、前記自然言語処理部は、前記演算結果を使用者に提案し、前記一般型データ取得部は、前記演算結果が使用者により承認されると、前記一般型データに前記演算結果を反映させて更新するものとしてもよい。こうすれば、自然言語処理の演算結果を、使用者の意図を踏まえて一般型メタデータに反映させることができる。 In this case, the natural language processing unit proposes the calculation result to the user, and when the calculation result is approved by the user, the general type data acquisition unit reflects the calculation result in the general type data. It may also be updated. In this way, the calculation results of natural language processing can be reflected in the general metadata based on the user's intention.
 本開示のメタデータ管理方法は、
 メタデータを管理するメタデータ管理方法であって、
(a)それぞれが任意のメタデータスキーマにより規定されたメタデータである各一般型メタデータを取得するステップと、
(b)前記各一般型メタデータから各文書型メタデータを作成するステップと、
 を有することを要旨とする。
The metadata management method of the present disclosure is
A metadata management method for managing metadata, the method comprising:
(a) obtaining each general type of metadata, each of which is metadata specified by an arbitrary metadata schema;
(b) creating each document type metadata from each of the general type metadata;
The gist is to have the following.
 本開示のメタデータ管理方法では、それぞれが任意のメタデータスキーマにより規定されたメタデータである各一般型メタデータを取得し、各一般型メタデータから各文書型メタデータを作成する。したがって、各文書型メタデータを作成するから、使用者の指示に従って各文書型メタデータについて全文検索を行なうことにより、各メタデータのメタデータスキーマが統一されていない場合でも、使用者は、所望のメタデータを簡易に取得することができる。また、各文書型メタデータを作成するから、各文書型メタデータについて自然言語処理を行なうことにより、各文書型メタデータの情報を補完したり、使用者による類似の文書型メタデータの探索を補助したりすることができる。例えば、一般型メタデータの場合、自然言語処理を行なうのが困難であり、情報の補完などを人間が手作業で行なうと多大な労力を要するのに対し、文書型メタデータを作成することにより、自然言語処理を行なって情報の補完などを容易に行なうことができるのである。 In the metadata management method of the present disclosure, each general type metadata, each of which is metadata defined by an arbitrary metadata schema, is acquired, and each document type metadata is created from each general type metadata. Therefore, by creating each document type metadata and performing a full-text search on each document type metadata according to the user's instructions, the user can search for the desired document type metadata even if the metadata schema of each metadata is not unified. metadata can be easily obtained. In addition, since each document type metadata is created, by performing natural language processing on each document type metadata, the information in each document type metadata can be supplemented and users can search for similar document type metadata. You can assist. For example, in the case of general-type metadata, it is difficult to perform natural language processing, and it would take a lot of effort for humans to manually complete the information, but by creating document-type metadata, it is difficult to perform natural language processing. , it is possible to easily supplement information by performing natural language processing.
 本開示のプログラムは、
 コンピュータを、メタデータを管理するメタデータ管理システムとして機能させるためのプログラムであって、
(a)それぞれが任意のメタデータスキーマにより規定されたメタデータである各一般型メタデータを取得するステップと、
(b)前記各一般型メタデータから各文書型メタデータを作成するステップと、
 を有することを要旨とする。
The program of this disclosure is
A program for making a computer function as a metadata management system for managing metadata,
(a) obtaining each general type of metadata, each of which is metadata specified by an arbitrary metadata schema;
(b) creating each document type metadata from each of the general type metadata;
The gist is to have the following.
 本開示のプログラムでは、それぞれが任意のメタデータスキーマにより規定されたメタデータである各一般型メタデータを取得し、各一般型メタデータから各文書型メタデータを作成する。したがって、各文書型メタデータを作成するから、使用者の指示に従って各文書型メタデータについて全文検索を行なうことにより、各メタデータのメタデータスキーマが統一されていない場合でも、使用者は、所望のメタデータを簡易に取得することができる。また、各文書型メタデータを作成するから、各文書型メタデータについて自然言語処理を行なうことにより、各文書型メタデータの情報を補完したり、使用者による類似の文書型メタデータの探索を補助したりすることができる。例えば、一般型メタデータの場合、自然言語処理を行なうのが困難であり、情報の補完などを人間が手作業で行なうと多大な労力を要するのに対し、文書型メタデータを作成することにより、自然言語処理を行なって情報の補完などを容易に行なうことができるのである。 The program of the present disclosure acquires each general type metadata, each of which is metadata defined by an arbitrary metadata schema, and creates each document type metadata from each general type metadata. Therefore, by creating each document type metadata and performing a full-text search on each document type metadata according to the user's instructions, the user can search for the desired document type metadata even if the metadata schema of each metadata is not unified. metadata can be easily obtained. In addition, since each document type metadata is created, by performing natural language processing on each document type metadata, the information in each document type metadata can be supplemented and users can search for similar document type metadata. You can assist. For example, in the case of general-type metadata, it is difficult to perform natural language processing, and it would take a lot of effort for humans to manually complete the information, but by creating document-type metadata, it is difficult to perform natural language processing. , it is possible to easily supplement information by performing natural language processing.
本開示の一実施例としてのメタデータ管理システム20の構成の概略を示す構成図である。1 is a configuration diagram schematically showing the configuration of a metadata management system 20 as an example of the present disclosure. メタデータ取得関連処理の一例を示すフローチャートである。3 is a flowchart illustrating an example of metadata acquisition related processing. データの一例を示す説明図である。It is an explanatory diagram showing an example of data. 一般型メタデータの一例を示す説明図である。It is an explanatory diagram showing an example of general type metadata. 一般型メタデータの一例を示す説明図である。It is an explanatory diagram showing an example of general type metadata. 文書型メタデータの一例を示す説明図である。It is an explanatory diagram showing an example of document type metadata. 一般型メタデータの一例を示す説明図である。It is an explanatory diagram showing an example of general type metadata. 文書型メタデータの一例を示す説明図である。It is an explanatory diagram showing an example of document type metadata. メタデータ検索処理の一例を示すフローチャートである。3 is a flowchart illustrating an example of metadata search processing.
 次に、本開示を実施するための形態を実施例を用いて説明する。 Next, a mode for carrying out the present disclosure will be described using examples.
 図1は、本開示の一実施例としてのメタデータ管理システム20の構成の概略を示す構成図である。実施例のメタデータ管理システム20は、メタデータを管理するためのシステムとして構成されており、図示するように、オンプレミス版の第1メイン管理システム32と、クラウド版の第2メイン管理システム42と、データベースシステム44と、全文検索システム46と、自然言語処理システム48と、使用者認証システム(図示省略)とを備える。ここで、第1メイン管理システム32は、何れもオンプレミス環境30、例えば、企業のイントラネット内の環境などに存在し、周知のコンピュータを用いて構成されている。このオンプレミス環境30には、使用者端末50やメタデータソース60も存在する。第2メイン管理システム42やデータベースシステム44、全文検索システム46、自然言語処理システム48、使用者認証システムは、何れもクラウド環境40に存在し、それぞれ、クラウドベンダにより提供されるクラウドサービスを利用してマルチテナントのシステムとして構成されている。このクラウド環境40には、メタデータソース70も存在する。 FIG. 1 is a configuration diagram schematically showing the configuration of a metadata management system 20 as an embodiment of the present disclosure. The metadata management system 20 of the embodiment is configured as a system for managing metadata, and as shown in the figure, includes an on-premises version of the first main management system 32 and a cloud version of the second main management system 42. , a database system 44, a full text search system 46, a natural language processing system 48, and a user authentication system (not shown). Here, each of the first main management systems 32 exists in an on-premises environment 30, such as an environment within a company's intranet, and is configured using a well-known computer. This on-premises environment 30 also includes a user terminal 50 and a metadata source 60. The second main management system 42, database system 44, full text search system 46, natural language processing system 48, and user authentication system all exist in the cloud environment 40, and each uses a cloud service provided by a cloud vendor. It is configured as a multi-tenant system. A metadata source 70 also exists in this cloud environment 40 .
 第1メイン管理システム32は、メタデータソース60のデータベース62やツール64からの各一般型メタデータを第2メイン管理システム42に送信する。ここで、一般型メタデータは、任意のメタデータスキーマにより定義されたメタデータである。具体的には、一般型メタデータは、単一の値を保持するデータ項目についての第1メタデータと、データ項目の集合についての第2メタデータとを有する。第1メタデータは、第1共通部と、メタデータソース60,70に記憶されているときに定義されている第1メタデータソース依存部と、使用者により定義されたり自動で定義されたり予め定義されたりする第1使用者定義部とを有する。第2メタデータは、第2共通部と、メタデータソース60,70に記憶されているときに定義されている第2メタデータソース依存部と、使用者により定義されたり自動で定義されたり予め定義されたりする第2使用者定義部とを有する。一般型メタデータは、木構造として構成されており、頂点として、第2共通部を有し、第2共通部の子ノードとして、第2メタデータソース依存部と第2使用者定義部と第1共通部の集合とを有し、第1共通部の子ノードとして第1メタデータソース依存部と第1使用者定義部とを有する。 The first main management system 32 sends each general type of metadata from the database 62 and tool 64 of the metadata source 60 to the second main management system 42 . Here, general type metadata is metadata defined by an arbitrary metadata schema. Specifically, the general type metadata includes first metadata about a data item holding a single value and second metadata about a set of data items. The first metadata includes a first common part, a first metadata source dependent part defined when stored in the metadata sources 60 and 70, and a first metadata source dependent part defined by the user, automatically defined, or predefined. and a first user definition section in which the first user definition section is defined. The second metadata includes a second common part, a second metadata source dependent part defined when stored in the metadata sources 60 and 70, and a second metadata source dependent part defined by the user, automatically defined, or predefined. and a second user definition section in which the user definition section is defined. The general type metadata is configured as a tree structure, and has a second common part as a vertex, a second metadata source dependent part, a second user defined part, and a second common part as child nodes of the second common part. The first common part has a first metadata source dependent part and a first user defined part as child nodes of the first common part.
 メタデータソース60には、データベース62やツール64が含まれる。なお、図1では、メタデータソース60には、データベース62やツール64が1つずつ含まれるものとしたが、何れか一方だけが含まれるものとしてもよいし、一方または両方が複数含まれるものとしてもよい。ツール64としては、例えば、ETL(Extract Transform Load)などを挙げることができる。データベース62やツール64には、例えば、各ファイル(データや、データに付帯する一般型メタデータ)などが記憶されている。メタデータソース60(データベース62やツール64)は、API(Application Programming Interface)により第1メイン管理システム32に公開されている。 The metadata source 60 includes a database 62 and tools 64. Note that in FIG. 1, the metadata source 60 includes one database 62 and one tool 64, but it may include only one of them, or it may include one or more of both. You can also use it as Examples of the tool 64 include ETL (Extract Transform Load). The database 62 and the tool 64 store, for example, each file (data and general metadata attached to the data). The metadata source 60 (database 62 and tools 64) is exposed to the first main management system 32 through an API (Application Programming Interface).
 第2メイン管理システム42は、第1メイン管理システム32やメタデータソース70からの各一般型メタデータをデータベースシステム44のデータベース44aに格納する。第2メイン管理システム42は、APIにより第1メイン管理システム32や使用者端末50に公開されている。 The second main management system 42 stores each general type metadata from the first main management system 32 and the metadata source 70 in the database 44a of the database system 44. The second main management system 42 is exposed to the first main management system 32 and the user terminal 50 via API.
 メタデータソース70には、データベース72やツール74が含まれる。なお、図1では、メタデータソース70には、データベース72やツール74が1つずつ含まれるものとしたが、何れか一方だけが含まれるものとしてもよいし、一方または両方が複数含まれるものとしてもよい。ツール74としては、例えば、ETLなどを挙げることができる。データベース72やツール74には、例えば、各ファイル(データや、データに付帯する一般型メタデータ)などが記憶されている。メタデータソース70(データベース72やツール74)は、APIにより第2メイン管理システム42に公開されている。 The metadata source 70 includes a database 72 and tools 74. In addition, in FIG. 1, the metadata source 70 includes one database 72 and one tool 74, but it may include only one of them, or it may include one or more of both. You can also use it as As the tool 74, for example, ETL etc. can be mentioned. The database 72 and the tool 74 store, for example, each file (data and general metadata attached to the data). The metadata source 70 (database 72 and tools 74) is exposed to the second main management system 42 via an API.
 データベースシステム44は、各一般型メタデータから各文書型メタデータを作成したり、全文検索システム46や自然言語処理システム48と連携して各種処理を行なわせたりする。文書型メタデータは、アウトライン構造として構成されている。この文書型メタデータは、章として、一般型メタデータの第2メタデータの第2共通部に関連する第2共通部関連部を有する。また、節として、第2メタデータの第2メタデータソース依存部に関連する第2メタデータソース依存部関連部と、第2メタデータの第2使用者定義部に関連する第2使用者定義部関連部と、第1メタデータの第1共通部の集合に関連する第1共通部集合関連部とを有する。さらに、項として、第1共通部に関連する第1共通部関連部を有する。加えて、目として、第1メタデータの第1メタデータソース依存部に関連する第1メタデータソース依存部関連部と、第1メタデータの第1使用者定義部に関連する第1使用者定義部関連部とを有する。データベースシステム44は、データベース44aを有する。データベース44aには、例えば、各一般型メタデータなどが記憶されている。データベースシステム44は、APIにより第2メイン管理システム42に公開されている。 The database system 44 creates each document type metadata from each general type metadata, and performs various processes in cooperation with the full text search system 46 and the natural language processing system 48. Document type metadata is configured as an outline structure. This document type metadata has, as a chapter, a second common part related part that is related to the second common part of the second metadata of the general type metadata. Further, as a clause, a second metadata source dependent part related part related to the second metadata source dependent part of the second metadata, and a second user definition related to the second user defined part of the second metadata. and a first common part set related part related to a set of first common parts of the first metadata. Further, as a term, there is a first common part related part related to the first common part. In addition, a first metadata source dependent part related part related to the first metadata source dependent part of the first metadata, and a first user defined part related to the first user defined part of the first metadata. It has a definition part and a related part. The database system 44 has a database 44a. For example, each general type metadata is stored in the database 44a. The database system 44 is exposed to the second main management system 42 via an API.
 全文検索システム46は、各文書型メタデータについて文書の構成要素に分解して索引を作成したり、各文書型データの索引と使用者端末50からの検索用文字列とを用いて全文検索を行なったりする。全文検索システム46は、データベース46aを有する。データベース46aには、例えば、各文書型メタデータや、各文書型メタデータの索引や自然言語処理システム48による自然言語処理の演算結果などが記憶されている。各文書型メタデータや、各文書型メタデータの索引や自然言語処理の演算結果は、それぞれ、互いにキーを用いて関連付けられていると共に、データベースシステム44のデータベース44aの一般型メタデータにキーを用いて関連付けられている。全文検索システム46は、APIにより第2メイン管理システム42やデータベースシステム44、自然言語処理システム48に公開されている。 The full-text search system 46 breaks down each document type metadata into document components and creates an index, and performs a full-text search using the index of each document type data and the search string from the user terminal 50. I do it. The full text search system 46 has a database 46a. The database 46a stores, for example, each document type metadata, an index of each document type metadata, calculation results of natural language processing by the natural language processing system 48, and the like. Each document type metadata, the index of each document type metadata, and the calculation result of natural language processing are respectively associated with each other using keys, and the keys are also attached to the general type metadata of the database 44a of the database system 44. associated with the use of The full text search system 46 is exposed to the second main management system 42, database system 44, and natural language processing system 48 via API.
 自然言語処理システム48は、各文書型メタデータについて自然言語処理を行なう。ここで、自然言語処理としては、例えば、文書ベクトルの計算処理、補完処理、校正処理、分類処理、類似の文書型メタデータの探索処理などを挙げることができる。また、自然言語処理は、ディープラーニング(深層学習)、例えば、RNN(Recurrent Neural Network)やBERT(Bidirectional Encoder Representations from Transformaers)などの技術を用いて行なうことができる。自然言語システム48は、データベース48aを有する。自然言語処理システム48は、APIにより第2メイン管理システム42やデータベースシステム44に公開されている。 The natural language processing system 48 performs natural language processing on each document type metadata. Here, examples of natural language processing include document vector calculation processing, complementation processing, proofreading processing, classification processing, search processing for similar document type metadata, and the like. Further, natural language processing can be performed using deep learning, for example, techniques such as RNN (Recurrent Neural Network) and BERT (Bidirectional Encoder Representations from Transformers). Natural language system 48 has a database 48a. The natural language processing system 48 is exposed to the second main management system 42 and database system 44 via API.
 使用者端末50は、デスクトップパソコンやノートパソコン、スマートフォン、タブレット端末などとして構成されており、処理部や記憶部、入力部、表示部(ディスプレイ)などを備える。処理部は、周知のコンピュータとして構成されている。記憶部は、ハードディスクやSSDなどとして構成されている。入力部としては、キーボードやマウス、タッチパネルなどを挙げることができる。使用者端末50は、第1メイン管理システム32や第2メイン管理システム42と通信可能となっている。 The user terminal 50 is configured as a desktop computer, a notebook computer, a smartphone, a tablet terminal, etc., and includes a processing section, a storage section, an input section, a display section, and the like. The processing unit is configured as a well-known computer. The storage unit is configured as a hard disk, SSD, or the like. Examples of the input unit include a keyboard, a mouse, and a touch panel. The user terminal 50 is capable of communicating with the first main management system 32 and the second main management system 42.
 次に、実施例のメタデータ管理システム20の動作について説明する。以下、使用者が認証を行なう際の使用者認証処理や、メタデータソース60,70から一般型メタデータを取得する際のメタデータ取得関連処理、使用者が所望のメタデータを検索する際のメタデータ検索処理について順に説明する。 Next, the operation of the metadata management system 20 of the embodiment will be explained. The following describes user authentication processing when a user performs authentication, metadata acquisition related processing when acquiring general metadata from the metadata sources 60 and 70, and processing when a user searches for desired metadata. The metadata search process will be explained in order.
 最初に、使用者が認証を行なう際の使用者認証処理について説明する。本処理は、使用者により使用者端末50の入力部が操作されて、使用者の認証を行なうための認証画面の表示指示が行なわれたときに実行される。なお、この指示が行なわれると、使用者端末50は、その指示を使用者認証システム(図示省略)に送信する。 First, the user authentication process when a user performs authentication will be explained. This process is executed when the user operates the input section of the user terminal 50 and instructs to display an authentication screen for user authentication. Note that when this instruction is given, the user terminal 50 transmits the instruction to a user authentication system (not shown).
 使用者認証処理では、最初に、使用者認証システムは、認証画面のデータを使用者端末50に送信し、使用者端末50の表示部に認証画面を表示させる。ここで、認証画面は、使用者のIDやパスワードの入力や認証指示を行なえるように画面構成されている。使用者により入力部76が操作されて、認証画面において使用者のIDやパスワードの入力や認証指示が行なわれ、使用者端末50から使用者認証システムにそれらの情報が送信されると、使用者認証システムは、使用者のIDやパスワードを用いて使用者の認証を行なう。そして、使用者認証システムは、使用者の認証が完了すると、メイン画面のデータを使用者端末50に送信し、使用者端末50の表示部にメイン画面を表示させる。ここで、メイン画面は、メタデータ取得関連処理やメタデータ検索処理などの実行指示を行なえるように画面構成されている。 In the user authentication process, first, the user authentication system transmits the data of the authentication screen to the user terminal 50, and displays the authentication screen on the display section of the user terminal 50. Here, the authentication screen is configured so that the user can input the user's ID and password and issue authentication instructions. When the user operates the input unit 76 and inputs the user's ID and password and provides authentication instructions on the authentication screen, and the information is transmitted from the user terminal 50 to the user authentication system, the user The authentication system authenticates the user using the user's ID and password. When the user authentication system completes the user authentication, the user authentication system transmits the main screen data to the user terminal 50 and causes the display unit of the user terminal 50 to display the main screen. Here, the main screen is configured so that execution instructions such as metadata acquisition related processing and metadata search processing can be given.
 次に、メタデータソース60,70から一般型メタデータを取得する際のメタデータ取得関連処理について説明する。図2は、メタデータ取得関連処理の一例を示すフローチャートである。本処理は、使用者により使用者端末50の入力部が操作されて、メタデータソース60,70における取得対象のデータベース62,72やツール64,74が設定されて取得指示が行なわれたときに、メタデータ管理システム20の各システムにより実行される。使用者端末50は、取得対象のデータベース62,72やツール64,74の情報および取得指示を第1、第2メイン管理システム32,42に送信する。なお、本処理は、取得対象のデータベース62,72やツール64,74が設定されると、定期的に(例えば、数日ごとや数週間ごとなど)実行されるものとしてもよい。 Next, a description will be given of metadata acquisition related processing when general type metadata is acquired from the metadata sources 60 and 70. FIG. 2 is a flowchart illustrating an example of metadata acquisition related processing. This process is performed when the user operates the input section of the user terminal 50 to set the databases 62, 72 and tools 64, 74 to be acquired in the metadata sources 60, 70 and issue an acquisition instruction. , the metadata management system 20. The user terminal 50 transmits information on the databases 62, 72 and tools 64, 74 to be acquired, and an acquisition instruction to the first and second main management systems 32, 42. Note that this process may be executed periodically (for example, every few days or every few weeks) once the databases 62, 72 and tools 64, 74 to be acquired are set.
 図2のメタデータ取得関連処理では、第1メイン管理システム32は、メタデータソース60の取得対象のデータベース62やツール64のAPIを使用してこれらから各一般型メタデータを取得し、第2メイン管理システム42に送信する(ステップS100)。第2メイン管理システム42は、メタデータソース70の取得対象のデータベース72やツール74のAPIを使用してこれらから各一般型メタデータを取得し、第1メイン管理システム32や取得対象のデータベース72やツール74からの新規の各一般型メタデータを、データベースシステム44のAPIを使用して、データベースシステム44のデータベース44aの既存の各一般型メタデータとマージしてデータベース44aに格納する(ステップS110)。 In the metadata acquisition-related process in FIG. The information is transmitted to the main management system 42 (step S100). The second main management system 42 acquires each general type of metadata from the database 72 to be acquired in the metadata source 70 and the API of the tool 74, and Each new general type metadata from the tool 74 is merged with each existing general type metadata in the database 44a of the database system 44 and stored in the database 44a using the API of the database system 44 (step S110 ).
 ここで、取得対象のデータベース62,72やツール64,74からの新規の各一般型メタデータには、使用者が必要とする情報が十分に含まれていない可能性がある。使用者がデータを利用する場合、データの名称や特性、構成のルールなどが使用者に分かりやすいのが好ましい。また、法制度の改正により、或る種類のデータを管理しなければならいこともある。これらを踏まえて、実施例では、第2メイン管理システム42は、新規の各一般型メタデータを既存の各一般型メタデータとマージする前に、新規の各一般型メタデータに、使用者により設定された第1項目、使用者に提案して承認された第2項目、予め定められた第3項目、のうちの少なくとも1つを追加項目として追加するものとした。例えば、使用者により使用者端末50の入力部が操作され、一般型メタデータに追加するための項目(第1項目)が設定されて使用者端末50から第2メイン管理システム42に送信されている場合、第2メイン管理システム42は、新規の各一般型メタデータにその項目(第1項目)を追加項目として追加する。また、使用者により過去に所定回数を超過して設定され且つ現在設定されていない、一般型メタデータに追加するための項目(第2項目)がある場合、第2メイン管理システム42は、その項目(第2項目)を使用者端末50に送信してその表示部に表示させることによって使用者に提案し、使用者が承認すると、新規の各一般型メタデータにその項目(第2項目)を追加項目として追加する。なお、追加項目の情報は、穴あき(不明)となっている。 Here, each new general type metadata from the databases 62, 72 and tools 64, 74 to be acquired may not contain enough information needed by the user. When a user uses data, it is preferable that the name, characteristics, configuration rules, etc. of the data be easily understood by the user. Additionally, due to amendments to the legal system, certain types of data may need to be managed. Based on these considerations, in the embodiment, the second main management system 42 allows each new general-type metadata to be configured by the user before merging each new general-type metadata with each existing general-type metadata. At least one of the set first item, the second item proposed and approved by the user, and the predetermined third item is added as an additional item. For example, the input section of the user terminal 50 is operated by the user, and an item (first item) to be added to the general metadata is set and sent from the user terminal 50 to the second main management system 42. If so, the second main management system 42 adds that item (first item) to each new general type metadata as an additional item. In addition, if there is an item (second item) to be added to the general type metadata that has been set by the user more than a predetermined number of times in the past and is not currently set, the second main management system 42 The item (second item) is proposed to the user by being sent to the user terminal 50 and displayed on its display, and when the user approves, the item (second item) is added to each new general type metadata. Add as an additional item. Note that information on additional items is left blank (unknown).
 ステップS100,S110の処理を説明するための一例として、取得対象のデータベース62,72やツール64,74に、図3のようなデータおよび図4のような一般型メタデータが記憶されている場合を考える。なお、上述したように、一般型メタデータは木構造として構成されているものの、理解の容易のために、図4ではテーブルとして図示した。データ(ファイル)を管理する場合、必要な情報を登録したり参照したりするために一般型メタデータが必要となるため、図3のようなデータの場合、図4のような一般型メタデータが付帯される。 As an example for explaining the processing of steps S100 and S110, a case where data as shown in FIG. 3 and general type metadata as shown in FIG. 4 are stored in the databases 62, 72 and tools 64, 74 to be acquired. think of. Although the general metadata is configured as a tree structure as described above, it is illustrated as a table in FIG. 4 for ease of understanding. When managing data (files), general type metadata is required to register and reference the necessary information, so in the case of data like Figure 3, general type metadata like Figure 4 is required. will be attached.
 図3のデータでは、「テーブル名」が「STUDENT_TABLE」であり、「ファイル名」が「student.dat」であり、複数人の「ID」、「Name」、「Kana」、「Birthday」、「Height」、「Weight」についての情報が含まれている。図4の一般型メタデータでは、「テーブル名」が「STUDENT_TABLE」であり、「ファイル名」が「student.dat」であり、「カラム名」の「ID」、「Name」、「Kana」、「Birthday」、「Height」、「Weight」のそれぞれについて対応する「データ型」、「桁数」の情報が含まれている。例えば、「カラム名」の「ID」について、「データ型」が「整数」で且つ「桁数」が「18」となっており、「カラム名」の「Name」について、「データ型」が「文字列」で且つ「桁数」が「16」となっている。 In the data in Figure 3, the "table name" is "STUDENT_TABLE", the "file name" is "student.dat", and the "ID", "Name", "Kana", "Birthday", " ``Height'' and ``Weight'' are included. In the general type metadata in Figure 4, the "table name" is "STUDENT_TABLE", the "file name" is "student.dat", and the "column names" are "ID", "Name", "Kana", Information on the corresponding "data type" and "number of digits" is included for each of "Birthday", "Height", and "Weight". For example, for "ID" of "column name", "data type" is "integer" and "number of digits" is "18", and for "name" of "column name", "data type" is "integer" and "number of digits" is "18". It is a "character string" and the "number of digits" is "16".
 そして、ステップS110の処理により、新規の各一般型メタデータに第1項目、第2項目、第3項目、のうちの少なくとも1つを追加項目として追加するため、追加項目が論理名、説明、個人情報の有無である場合、図4のような一般型メタデータが図5のような一般型メタデータに変換される。図5の黒四角は、情報が穴あき(不明)であることを意味する。上述したように、一般型メタデータは、木構造として構成されており、頂点として、第2共通部を有し、第2共通部の子ノードとして、第2メタデータソース依存部と第2使用者定義部と第1共通部の集合とを有し、第1共通部の子ノードとして第1メタデータソース依存部と第1使用者定義部とを有する。図5の一般型メタデータに当てはめると、「テーブル名」および「STUDENT_TABLE」の組が第2共通部に相当する。「ファイル名」および「student.dat」の組が第2メタデータソース依存部に相当する。「論理名」および「穴あき」の組、「説明」および「穴あき」の組、「個人情報」および「情報が穴あき」の組が第2使用者定義部に相当する。「カラム」が第1共通部の集合に相当し、「カラム名」および「ID」の組、「カラム名」および「Name」の組などが第1共通部に相当する。「カラム名」および「ID」の組における「データ型」および「整数」の組、「桁数」および「18」の組や、「カラム名」および「Name」の組における「データ型」および「文字列」の組、「桁数」および「16」の組などが第1メタデータソース依存部に相当する。「カラム名」および「ID」の組、「カラム名」および「Name」の組などにおける「論理名」および「情報が穴あき」の組、「説明」および「情報が穴あき」の組、「個人情報」および「情報が穴あき」の組が第1使用者定義部に相当する。 Then, in the process of step S110, at least one of the first item, second item, and third item is added to each new general type metadata as an additional item, so that the additional item is a logical name, a description, If it is the presence or absence of personal information, general type metadata as shown in FIG. 4 is converted to general type metadata as shown in FIG. 5. A black square in FIG. 5 means that the information is blank (unknown). As described above, the general type metadata is configured as a tree structure, and has a second common part as a vertex, and a second metadata source dependent part and a second used part as child nodes of the second common part. The first metadata source dependent part and the first user defined part are provided as child nodes of the first common part. When applied to the general type metadata in FIG. 5, the set of "table name" and "STUDENT_TABLE" corresponds to the second common part. The set of "file name" and "student.dat" corresponds to the second metadata source dependent part. The set of "logical name" and "punched", the set of "description" and "punched", and the set of "personal information" and "information with punched" correspond to the second user-defined section. A "column" corresponds to a set of first common parts, and a set of "column name" and "ID", a set of "column name" and "Name", etc. correspond to the first common part. The set of "data type" and "integer" in the set of "column name" and "ID", the set of "number of digits" and "18", the set of "data type" and The set of "character string", the set of "number of digits" and "16", etc. correspond to the first metadata source dependent part. A set of "column name" and "ID", a set of "logical name" and "information with holes" in the set of "column name" and "Name", a set of "description" and "information with holes", The set of "personal information" and "information with holes" corresponds to the first user definition section.
 なお、実施例では、ステップS100,S110の処理と並行して、第2メイン管理システム42は、第1メイン管理システム32を介した取得対象のデータベース62やツール64との通信や、取得対象のデータベース72やツール74との通信により、データベース44aの既存の各一般型データのうち取得対象のデータベース62,72やツール64,74に存在しない一般型メタデータを検知した場合などに、その一般型メタデータを削除すると共に、全文検索システム46のデータベース46aの、削除した一般型メタデータに対応する文書型メタデータや、その文書型メタデータの索引や自然言語処理の演算結果を削除する。なお、一般型メタデータについて、データベース44aに存在し且つ取得対象に存在しない場合としては、取得対象の一般型メタデータが削除された場合に加えて、取得対象の一般型メタデータの名前が変更された場合、取得対象の複数の一般型メタデータが統合された場合なども考えることができる。また、一般型メタデータなどの削除について、自動では、完全には削除せずに削除マークを付与するだけとし、使用者の指示に基づいて、完全に削除するものとしてもよい。 In the embodiment, in parallel with the processing in steps S100 and S110, the second main management system 42 communicates with the database 62 and tool 64 to be acquired via the first main management system 32, and performs communication with the database 62 and tools 64 to be acquired. When detecting general type metadata that does not exist in the target database 62, 72 or tool 64, 74 among existing general type data in the database 44a through communication with the database 72 or tool 74, the general type Along with deleting the metadata, the document type metadata corresponding to the deleted general type metadata, the index of the document type metadata, and the calculation results of natural language processing are also deleted from the database 46a of the full text search system 46. Regarding general type metadata, if it exists in the database 44a but does not exist in the acquisition target, in addition to the case where the general type metadata to be acquired is deleted, the name of the general type metadata to be acquired is changed. It is also possible to consider cases where multiple general type metadata to be acquired are integrated. Further, regarding the deletion of general type metadata, etc., it may be possible to do so without automatically deleting the data completely and only adding a deletion mark, and to completely delete it based on the user's instructions.
 こうしてステップS110の処理を終了すると、第2メイン管理システム42は、新規の各一般型メタデータをデータベース44aに格納した旨を第2メイン管理システム42から使用者端末50に送信してその表示部に表示させる。このようにして、新規の各一般型メタデータをデータベース44aに格納した旨を使用者に報知する。 When the process of step S110 is thus completed, the second main management system 42 transmits a message to the user terminal 50 to the effect that each new general type metadata is stored in the database 44a, and displays the information on the display screen of the second main management system 42. to be displayed. In this way, the user is notified that each new general type metadata is stored in the database 44a.
 続いて、データベースシステム44は、データベース44aの各一般型メタデータから各文書型メタデータを作成し、全文検索システム46aのAPIを使用して、各文書型メタデータを全文検索システム46のデータベース46aに格納する(ステップS120)。この処理は、新規の一般型メタデータについて行なわれる。データベース46aの各文書型メタデータは、データベース44aの一般型メタデータにキーを用いて関連付けられる。上述したように、新規の一般型メタデータには、追加項目が含まれており且つその追加項目の情報が穴あきになっているため、ステップS120の処理により作成される文書型メタデータにも、追加項目が含まれており且つその追加項目の情報が穴あきになっている。 Subsequently, the database system 44 creates each document type metadata from each general type metadata in the database 44a, and uses the API of the full text search system 46a to create each document type metadata in the database 46a of the full text search system 46. (Step S120). This process is performed on new general type metadata. Each document type metadata in the database 46a is associated with the general type metadata in the database 44a using a key. As described above, the new general type metadata includes additional items and the information of the additional items is blank, so the document type metadata created by the process of step S120 also does not contain any additional items. , an additional item is included, and the information of the additional item is punched out.
 図5のような一般型メタデータの場合、ステップS120の処理により、図6のような文書型メタデータ、即ち、論理名、説明、個人情報の有無の情報が穴あきの文書型メタデータが作成される。図6の黒四角は、図5の黒四角と同様に、情報が穴あき(不明)であることを意味する。上述したように、文書型メタデータは、アウトライン構造として構成されており、章として、第2共通部関連部を有し、節として、第2メタデータソース依存部関連部と第2使用者定義部関連部と第1共通部集合関連部とを有し、項として、第1共通部を有し、目として、第1メタデータソース依存部関連部と第1使用者定義部関連部とを有する。図6の文書型メタデータに当てはめると、「テーブル名:STUDENT_TABLE」が第2共通部関連部に相当する。「ファイル名:student.dat」が第2メタデータソース依存部関連部に相当する。「論理名:情報が穴あき」、「説明:情報が穴あき」、「個人情報:情報が穴あき」が第2使用者定義部関連部に相当する。「カラム」が第1共通部集合関連部に相当する。「カラム名:ID」、「カラム名:Name」などが第1共通部関連部に相当する。「カラム名:ID」における「データ型:整数」、「桁数:18」や、「カラム名:Name」における「データ型:文字列」、「桁数:16」などが第1メタデータソース依存部関連部に相当する。「カラム名:ID」、「カラム名:Name」などにおける「論理名:情報が穴あき」、「説明:情報が穴あき」、「個人情報:情報が穴あき」が第1使用者定義部関連部に相当する。 In the case of general type metadata as shown in FIG. 5, the process of step S120 creates document type metadata as shown in FIG. be done. Similar to the black squares in FIG. 5, the black squares in FIG. 6 mean that the information is blank (unknown). As described above, the document type metadata is structured as an outline structure, and has a second common part related part as a chapter, and a second metadata source dependent part related part and a second user defined part as sections. has a section related section and a first common section set related section, has the first common section as a term, and has a first metadata source dependent section related section and a first user defined section related section as eyes. have When applied to the document type metadata in FIG. 6, "table name: STUDENT_TABLE" corresponds to the second common part-related part. "File name: student.dat" corresponds to the second metadata source dependent part related part. "Logical name: information has holes", "description: information has holes", and "personal information: information has holes" correspond to the second user definition section related section. The "column" corresponds to the first common part set related part. "Column name: ID", "Column name: Name", etc. correspond to the first common part related part. "Data type: Integer" and "Number of digits: 18" in "Column name: ID" and "Data type: String" and "Number of digits: 16" in "Column name: Name" are the first metadata sources. Corresponds to the dependent part and related part. "Logical name: Information is blank", "Description: Information is blank", and "Personal information: Information is blank" in "Column name: ID", "Column name: Name", etc. are the first user defined part. Corresponds to the related department.
 ステップS120の処理後に、データベースシステム44は、全文検索処理システム46のAPIを使用して全文検索システム46と連携し、全文検索システム46に各文書型メタデータの索引を作成させる(ステップS130)。全文検索システム46は、データベース46aの各文書型メタデータについて文書の構成要素に分解して索引を作成し、作成した各文書型メタデータの索引をデータベース46aに格納する(ステップS140)。ステップS140の処理は、新規の文書型メタデータについて行なわれる。データベース46aの各文書型メタデータの索引は、それぞれ、データベース44aの一般型メタデータやデータベース46aの文書型メタデータにキーを用いて関連付けられる。 After the processing in step S120, the database system 44 cooperates with the full-text search system 46 using the API of the full-text search processing system 46, and causes the full-text search system 46 to create an index for each document type metadata (step S130). The full-text search system 46 breaks down each document type metadata in the database 46a into document constituent elements, creates an index, and stores the created index for each document type metadata in the database 46a (step S140). The process in step S140 is performed on new document type metadata. Each document type metadata index in the database 46a is associated with the general type metadata in the database 44a and the document type metadata in the database 46a using a key.
 ステップS140の処理後に、データベースシステム44は、自然言語処理システム48のAPIを使用して全文検索システム46と連携し、自然言語処理システム48に各文書型メタデータについて自然言語処理を行なわせる(ステップS150)。自然言語処理システム48は、全文検索システム46のAPIを使用して、全文検索システム46のデータベース46aの各文書型メタデータを取得して各文書型メタデータについて自然言語処理を行ない、その演算結果をデータベース46aに格納すると共に使用者に提案する(ステップS160)。ステップS160の処理は、ステップS140の処理と同様に、新規の文書型メタデータについて行なわれる。データベース46aの各文書型メタデータの自然言語処理の演算結果は、それぞれ、データベース44aの一般型メタデータやデータベース46aの文書型メタデータや文書型メタデータの索引にキーを用いて関連付けられる。 After the processing in step S140, the database system 44 uses the API of the natural language processing system 48 to cooperate with the full text search system 46, and causes the natural language processing system 48 to perform natural language processing on each document type metadata (step S150). The natural language processing system 48 uses the API of the full-text search system 46 to acquire each document type metadata in the database 46a of the full-text search system 46, performs natural language processing on each document type metadata, and calculates the result of the calculation. is stored in the database 46a and proposed to the user (step S160). The process in step S160 is performed on new document type metadata, similar to the process in step S140. The calculation results of natural language processing for each document type metadata in the database 46a are respectively associated with the general type metadata in the database 44a, the document type metadata in the database 46a, and the document type metadata index using a key.
 上述したように、自然言語処理としては、例えば、文書ベクトルの計算処理、補完処理、校正処理、分類処理、類似の文書型メタデータの探索処理などを挙げることができる。また、自然言語処理は、ディープラーニング、例えば、RNNやBERTなどの技術を用いて行なうことができる。実施例では、自然言語処理システム48をマルチテナントのシステムとして構成するため、シングルテナントシステムとして構成する場合に比して、自然言語処理を精度よく行なうことができる。実施例では、自然言語処理として、少なくとも、文書ベクトルの計算処理や、類似の文書型メタデータの探索処理、補完処理を行なうものとした。文書ベクトルの計算処理については、本発明の中核をなさないため、詳細な説明を省略する。 As described above, examples of natural language processing include document vector calculation processing, complementation processing, proofreading processing, classification processing, search processing for similar document type metadata, and the like. Further, natural language processing can be performed using deep learning techniques such as RNN and BERT. In the embodiment, since the natural language processing system 48 is configured as a multi-tenant system, natural language processing can be performed with higher accuracy than when configured as a single tenant system. In the embodiment, natural language processing includes at least document vector calculation processing, similar document type metadata search processing, and complementation processing. Since the document vector calculation process does not form the core of the present invention, a detailed explanation will be omitted.
 類似の文書型メタデータの探索処理について説明する。この探索処理は、例えば、対象の文書型メタデータについて、別の各文書型メタデータとの文書ベクトル間のコサイン距離を演算し、演算したコサイン距離を用いて類似の文書型メタデータを探索することにより行なわれる。全文検索システム46に、文書ベクトル間のコサイン距離の演算処理が実装されている場合、自然言語処理システム48は、全文検索システム46のAPIを使用して全文検索システム46と連携し、全文検索システム46に類似の文書型メタデータの探索処理を行なわせるものとしてもよい。 The search process for similar document type metadata will be explained. This search process, for example, calculates the cosine distance between document vectors of each other document type metadata for the target document type metadata, and searches for similar document type metadata using the calculated cosine distance. This is done by When the full-text search system 46 is implemented with calculation processing of the cosine distance between document vectors, the natural language processing system 48 uses the API of the full-text search system 46 to cooperate with the full-text search system 46 and perform the full-text search system 46. 46 may be configured to perform similar document-type metadata search processing.
 補完処理について説明する。実施例では、ステップS120の処理により作成される文書型メタデータに追加項目が含まれており且つその追加項目の情報が穴あきになっている。この場合の補完処理は、例えば、以下のように行なわれる。自然言語処理システム48は、追加項目の情報が穴あきの文書型メタデータについて、穴埋め問題を解くための演算をディープラーニング(例えば、RNNやBERTなど)の技術を用いて行なう。類似の文書型メタデータの探索処理により類似の文書型メタデータを探索している場合、その類似の文書型メタデータを考慮して穴埋め問題を解くことが考えられる。そして、自然言語処理システム48は、演算結果としての穴埋め候補を全文検索システム46のデータベース46aに格納すると共に第2メイン管理システム42に送信する。第2メイン管理システム42は、データベースシステム44のデータベース44aの対応する一般型メタデータを取得し、取得した一般型メタデータにおける情報が穴あきの部分に穴埋め候補を補完し、補完後の一般型メタデータを使用者端末50に送信してその表示部に表示させることにより、穴埋め候補を使用者に提案する。なお、補完後の一般型メタデータに代えて、情報が穴あきの部分の穴埋め候補だけを使用者に提案するものとしてもよい。 The complementation process will be explained. In the embodiment, the document type metadata created by the process of step S120 includes an additional item, and the information of the additional item is left blank. The complementation process in this case is performed as follows, for example. The natural language processing system 48 uses deep learning (for example, RNN, BERT, etc.) technology to perform calculations for solving a fill-in-the-blank problem for document-type metadata in which additional item information has holes. When similar document type metadata is being searched for using similar document type metadata search processing, it is conceivable to solve a fill-in-the-blank problem by considering the similar document type metadata. Then, the natural language processing system 48 stores the fill-in-the-blank candidates as the calculation result in the database 46a of the full-text search system 46 and transmits them to the second main management system 42. The second main management system 42 acquires the corresponding general type metadata of the database 44a of the database system 44, fills in the blanks with information in the acquired general type metadata, and fills in the blanks with the information in the general type metadata after the completion. By transmitting the data to the user terminal 50 and displaying it on the display unit, fill-in candidates are proposed to the user. Note that instead of the general metadata after complementation, only candidates for filling in gaps in the information may be suggested to the user.
 図6のような文書型メタデータ、即ち、論理名、説明、個人情報の有無の情報が穴あきの文書型メタデータについて補完処理を行なった場合、図5のような一般型メタデータにおける情報が穴あきの部分に穴埋め候補を補完した図7のような一般型メタデータを使用者に提案する。なお、これに代えて、論理名、説明、個人情報の有無の穴埋め候補だけを使用者に提案するものとしてもよい。 When supplementation processing is performed on document type metadata as shown in Figure 6, that is, document type metadata with holes in the logical name, description, and information on the presence or absence of personal information, the information in general type metadata as shown in Figure 5 is General metadata as shown in FIG. 7, in which holes are filled with filling candidates, is proposed to the user. Note that instead of this, only the logical name, description, and fill-in-the-blank candidates for the presence or absence of personal information may be suggested to the user.
 そして、使用者により穴埋め候補が承認されると、その旨が第2メイン管理システム42に送信され、第2メイン管理システム42は、情報が穴あきの部分に穴埋め候補を補完した一般型メタデータ(例えば、図7参照)を、データベースシステム44のデータベース44aの、情報が穴あきの部分を有する一般型メタデータ(例えば、図5参照)に対して上書きすることにより、一般型メタデータを更新する(ステップS170)。 Then, when the user approves the filling-in candidates, a notification to that effect is sent to the second main management system 42, and the second main management system 42 stores general metadata (general metadata) in which the information is filled in with the filling-in candidates. For example, see FIG. 7) is updated by overwriting the general metadata (see FIG. 5) in the database 44a of the database system 44 that has a hole in the information (for example, see FIG. 5). Step S170).
 こうしてデータベース44aの一般型メタデータを更新すると、更新後の一般型メタデータについて、上述のステップS120~S160の処理と同様にステップS180~S220の処理が行なわれ、図2のメタデータ取得関連処理が終了する。具体的には以下の通りである。ステップS120の処理と同様に、データベースシステム44は、データベース44aの更新後の一般型メタデータから文書型メタデータを作成し、作成した文書型メタデータを、全文検索システム46のデータベース46aの更新前の文書型メタデータに対して上書きすることにより、文書型メタデータを更新する(ステップS180)。図7のような一般型メタデータの場合、ステップS180の処理により、図8のような文書型メタデータが作成される。続いて、ステップS130,S140の処理と同様に、データベースシステム44からの指示に従って、全文検索システム46は、データベース46aの更新後の文書型メタデータについて索引を作成し、作成した索引を、データベース46aの更新前の索引に対して上書きすることにより、文書型メタデータの索引を更新する(ステップS190,S200)。そして、ステップS150,S160の処理と同様に、データベースシステム44からの指示に従って、自然言語処理システム48は、データベース46aの更新後の文書型メタデータについて自然言語処理(例えば、文書ベクトルの計算処理など)を行ない、その演算結果を、データベース46aの更新前の演算結果に対して上書きすることにより、自然言語処理の演算結果を更新する(ステップS210,S220)。 When the general type metadata in the database 44a is updated in this way, the processes of steps S180 to S220 are performed in the same way as the processes of steps S120 to S160 described above for the updated general type metadata, and the metadata acquisition related process of FIG. ends. Specifically, the details are as follows. Similar to the process in step S120, the database system 44 creates document-type metadata from the updated general-type metadata in the database 44a, and uses the created document-type metadata in the database 46a of the full-text search system 46 before the update. The document type metadata is updated by overwriting the document type metadata (step S180). In the case of general type metadata as shown in FIG. 7, document type metadata as shown in FIG. 8 is created by the process of step S180. Subsequently, similar to the processing in steps S130 and S140, in accordance with instructions from the database system 44, the full-text search system 46 creates an index for the updated document type metadata in the database 46a, and uses the created index in the database 46a. The index of the document type metadata is updated by overwriting the index before the update (steps S190, S200). Then, similar to the processing in steps S150 and S160, in accordance with instructions from the database system 44, the natural language processing system 48 performs natural language processing (for example, document vector calculation processing, etc.) on the updated document type metadata in the database 46a. ) and overwrites the calculation result in the database 46a before the update, thereby updating the calculation result of the natural language processing (steps S210, S220).
 こうして図2のメタデータ取得関連処理を終了すると、データベースシステム44は、メタデータ取得関連処理を終了した旨を第2メイン管理システム42を介して使用者端末50に送信してその表示部に表示させる。 When the metadata acquisition-related process of FIG. 2 is thus completed, the database system 44 transmits a notification that the metadata acquisition-related process has been completed to the user terminal 50 via the second main management system 42, and displays the message on the display unit. let
 次に、使用者が所望のメタデータを検索する際のメタデータ検索処理について説明する。図9は、メタデータ検索処理の一例を示すフローチャートである。本処理は、使用者により使用者端末50の入力部が操作されて、1または複数の検索用文字列が指定されて本処理の実行指示が行なわれたときに、メタデータ管理システム20の各システムにより実行される。なお、本処理の実行指示が行なわれると、使用者端末50は、第2メイン管理システム42に1または複数の検索用文字列と検索指示とを送信する。 Next, a description will be given of metadata search processing when a user searches for desired metadata. FIG. 9 is a flowchart illustrating an example of metadata search processing. This process is performed by each of the metadata management system 20 when the user operates the input section of the user terminal 50, specifies one or more search strings, and instructs the execution of this process. Executed by the system. Note that when an instruction to execute this process is given, the user terminal 50 transmits one or more search character strings and a search instruction to the second main management system 42.
 図9のメタデータ検索処理では、第2メイン管理システム42は、検索用文字列と検索指示とを全文検索システム46に送信する(ステップS300)。全文検索システム46は、検索用文字列とデータベース46aの各文書型メタデータの索引や自然言語処理の演算結果(例えば、文書ベクトルの計算結果や類似の文書型メタデータの探索結果など)とを用いて全文検索を行なって、その検索結果を第2メイン管理システム42に送信する(ステップS310)。全文検索の方法としては、例えば、検索用文字列と各文書型メタデータの索引や自然言語処理の演算結果とを用いて各文書型メタデータのスコアリングを行ない、スコアの高い順に並べる方法を挙げることができる。このようにして、検索用文字列と同一または類似の(関連する)内容を含む文書型メタデータを比較的簡易にかつ短時間で探索することができる。 In the metadata search process of FIG. 9, the second main management system 42 transmits a search character string and a search instruction to the full text search system 46 (step S300). The full-text search system 46 uses the search string and the index of each document type metadata in the database 46a and the calculation results of natural language processing (for example, the calculation results of document vectors, the search results of similar document type metadata, etc.). The search results are sent to the second main management system 42 (step S310). As a full-text search method, for example, each document type metadata is scored using the search string and the index of each document type metadata or the calculation result of natural language processing, and the results are arranged in order of highest score. can be mentioned. In this way, document-type metadata containing content that is the same as or similar to (related to) the search character string can be searched relatively easily and in a short time.
 第2メイン管理システム42は、全文検索システム46からの検索結果と、データベースシステム44のデータベース44aにおける検索結果に関連する一般型メタデータおよび/または文書型メタデータと、を使用者端末50に送信して(ステップS320)、メタデータ検索処理を終了する。使用者端末50は、これらの情報を表示部に表示する。この表示方法としては、例えば、検索エンジンの検索結果表示のように、上述のスコアの高い順に一般型メタデータおよび/または文書型メタデータの一部(例えば、テーブル名やファイル名など)をリンクとして表示し、リンクが選択されると、一般型メタデータおよび/または文書型メタデータの全項目を表示する方法を挙げることができる。 The second main management system 42 transmits the search results from the full text search system 46 and general type metadata and/or document type metadata related to the search results in the database 44a of the database system 44 to the user terminal 50. (Step S320), and the metadata search process ends. The user terminal 50 displays this information on the display section. For example, this display method can be used to link parts of general type metadata and/or document type metadata (e.g., table names, file names, etc.) in the order of the above-mentioned scores, such as displaying search engine results. When a link is selected, all items of general type metadata and/or document type metadata are displayed.
 実施例では、上述したように、各一般型メタデータから各文書型メタデータを作成し、更に各文書型メタデータの索引を作成する。このため、検索用文字列と各文書型メタデータの索引や自然言語処理の演算結果とを用いて全文検索を行なうことにより、各一般型メタデータのメタデータスキーマが統一されていない場合でも、所望のメタデータ(一般型メタデータや文書型メタデータ)を簡易に取得することができる。例えば、メタデータの数が十分に多い場合でも、所望のメタデータを短時間で取得することができる。また、各文書型メタデータについて自然言語処理を行なうことにより、各文書型メタデータの情報を補完したり、使用者による類似の文書型メタデータの探索を補助したりすることができる。例えば、一般型メタデータの場合、自然言語処理を行なうのが困難であり、情報の補完などを人間が手作業で行なうと多大な労力を要するのに対し、文書型メタデータを作成することにより、自然言語処理を行なって情報の補完などを容易に行なうことができるのである。 In the embodiment, as described above, each document type metadata is created from each general type metadata, and an index of each document type metadata is also created. Therefore, by performing a full-text search using the search string and the index of each document type metadata and the calculation result of natural language processing, even if the metadata schema of each general type metadata is not unified, Desired metadata (general type metadata and document type metadata) can be easily obtained. For example, even if the number of metadata is sufficiently large, desired metadata can be acquired in a short time. Furthermore, by performing natural language processing on each document type metadata, it is possible to complement the information of each document type metadata and to assist the user in searching for similar document type metadata. For example, in the case of general-type metadata, it is difficult to perform natural language processing, and it would take a lot of effort for humans to manually complete the information, but by creating document-type metadata, it is difficult to perform natural language processing. , it is possible to easily supplement information by performing natural language processing.
 以上説明した実施例のメタデータ管理システム20では、メタデータソース60,70の取得対象のデータベース62,72やツール64,74から各一般型メタデータを取得し、取得した各一般型メタデータから各文書型メタデータを作成する。したがって、各文書型メタデータの索引を作成したり各文書型データについて自然言語処理を行なったりし、使用者の指示に従って検索用文字列と各文書型メタデータの索引や自然言語処理の演算結果とを用いて各文書型メタデータについて全文検索を行なうことにより、各一般型メタデータのメタデータスキーマが統一されていない場合でも、使用者は、所望のメタデータ(一般型メタデータや文書型メタデータ)を簡易に取得することができる。また、各文書型データについて自然言語処理を行なうことにより、各文書型メタデータの情報を補完したり、使用者による類似の文書型メタデータの探索を補助したりすることができる。 In the metadata management system 20 of the embodiment described above, each general type metadata is acquired from the databases 62, 72 and the tools 64, 74 that are the acquisition targets of the metadata sources 60, 70, and from each acquired general type metadata. Create each document type metadata. Therefore, an index of each document type metadata is created, natural language processing is performed on each document type data, and search strings and indexes of each document type metadata and calculation results of natural language processing are created according to the user's instructions. By performing a full-text search for each document type metadata using (metadata) can be easily obtained. Furthermore, by performing natural language processing on each document type data, it is possible to complement the information of each document type metadata and to assist the user in searching for similar document type metadata.
 実施例のメタデータ管理システム20では、メタデータソース60のデータベース62やツール64は、APIにより第1メイン管理システム32に公開されており、第1メイン管理システム32が、取得対象のデータベース62やツール64のAPIを使用してこれらから各一般型メタデータを取得するものとした。しかし、データベース62やツール64のうちの少なくとも一部は、APIにより第1メイン管理システム32に公開されていないものとしてもよい。取得対象のデータベース62やツール64がAPIにより第1メイン管理システム32に公開されていない場合、第1メイン管理システム32が、取得対象のデータベース62やツール64に取得要求を送信し、取得要求を受信したデータベース62やツール64が、各一般型メタデータを第1メイン管理システム32に送信することが考えられる。 In the metadata management system 20 of the embodiment, the database 62 and tools 64 of the metadata source 60 are exposed to the first main management system 32 via API, and the first main management system 32 can access the database 62 and tools 64 to be acquired. The API of the tool 64 is used to obtain each general type metadata from these. However, at least a portion of the database 62 and tools 64 may not be disclosed to the first main management system 32 via API. If the database 62 or tool 64 to be acquired is not disclosed to the first main management system 32 via API, the first main management system 32 sends an acquisition request to the database 62 or tool 64 to be acquired. It is conceivable that the receiving database 62 or tool 64 sends each general type metadata to the first main management system 32 .
 実施例のメタデータ管理システム20では、メタデータソース70のデータベース72やツール74は、APIにより第2メイン管理システム42に公開されており、第2メイン管理システム42が、取得対象のデータベース72やツール74のAPIを使用してこれらから各一般型メタデータを取得するものとした。しかし、データベース72やツール74のうちの少なくとも一部は、APIにより第2メイン管理システム42に公開されていないものとしてもよい。取得対象のデータベース72やツール74がAPIにより第2メイン管理システム42に公開されていない場合、第2メイン管理システム42が、取得対象のデータベース72やツール74に取得要求を送信し、取得要求を受信したデータベース72やツール74が、各一般型メタデータを第2メイン管理システム42に送信することが考えられる。 In the metadata management system 20 of the embodiment, the database 72 and tools 74 of the metadata source 70 are exposed to the second main management system 42 via API, and the second main management system 42 is responsible for the database 72 and tools 74 to be acquired. Each general type metadata is obtained from these using the API of the tool 74. However, at least a portion of the database 72 and tools 74 may not be exposed to the second main management system 42 through the API. If the database 72 or tool 74 to be acquired is not disclosed to the second main management system 42 via the API, the second main management system 42 sends an acquisition request to the database 72 or tool 74 to be acquired, and It is conceivable that the receiving database 72 or tool 74 sends each generic metadata to the second main management system 42 .
 実施例のメタデータ管理システム20では、取得対象のデータベース62,72やツール64,74から木構造の各一般型メタデータを取得し、取得した各一般型メタデータからアウトライン構造の各文書型メタデータを作成するものとした。しかし、取得する一般型メタデータの構造としては、グラフ構造であればよく、木構造に限定されるものではない。一般型メタデータの構造が木構造以外のグラフ構造、例えば、少なくとも一部が循環構造やネット構造などの場合、文書型メタデータの構造は、アウトライン構造でなく、例えば、アウトライン構造にリンクによる参照などを付加した構造とする必要がある。 In the metadata management system 20 of the embodiment, each tree-structured general type metadata is acquired from the target databases 62, 72 and tools 64, 74, and each outline-structured document type metadata is acquired from each acquired general type metadata. The data was created. However, the structure of the general metadata to be acquired may be any graph structure and is not limited to a tree structure. If the structure of general type metadata is a graph structure other than a tree structure, for example, at least part of it is a circular structure or a net structure, the structure of document type metadata is not an outline structure, but, for example, reference by linking to the outline structure. It is necessary to create a structure that includes the following.
 実施例のメタデータ管理システム20では、図2のメタデータ取得関連処理のステップS160~S220の処理、具体的には、文書型データについての自然言語処理(ステップS160)、データベース44aの一般型メタデータの更新(ステップS170)、データベース46aの文書型メタデータの更新(ステップS180)、データベース46aの文書型メタデータの索引や自然言語処理の演算結果の更新(ステップS190~S220)は、自動で行なわれるものとした。しかし、これらの処理は、使用者による指示に応じて行なわれるものとしてもよい。 In the metadata management system 20 of the embodiment, the processing in steps S160 to S220 of the metadata acquisition related processing in FIG. 2, specifically, natural language processing for document type data (step S160), general type meta Updating data (step S170), updating the document type metadata in the database 46a (step S180), and updating the index of the document type metadata in the database 46a and the calculation results of natural language processing (steps S190 to S220) are automatically performed. It was decided that it would be carried out. However, these processes may be performed in response to instructions from the user.
 実施例のメタデータ管理システム20では、図2のメタデータ取得関連処理のステップS110の処理において、第2メイン管理システム42は、第1メイン管理システム32や取得対象のデータベース72やツール74からの新規の各一般型メタデータに第1項目、第2項目、第3項目のうちの少なくとも1つを付加してデータベース44aに格納するものとした。しかし、第2メイン管理システム42は、新規の各一般型メタデータをそのままデータベース44aに格納するものとしてもよい。この場合、ステップS170以降の処理は、自動で行なわれるものとしてもよいし、使用者による指示に応じて行なわれるものとしてもよい。 In the metadata management system 20 of the embodiment, in the process of step S110 of the metadata acquisition related process in FIG. At least one of the first item, second item, and third item is added to each new general type metadata and stored in the database 44a. However, the second main management system 42 may store each new general type metadata as is in the database 44a. In this case, the processes after step S170 may be performed automatically or may be performed in response to instructions from the user.
 実施例のメタデータ管理システム20では、図9のメタデータ検索処理のステップS310の処理において、全文検索システム46は、検索用文字列とデータベース46aの各文書型メタデータの索引や自然言語処理の演算結果とを用いて全文検索を行なうものとした。しかし、全文検索システム46は、自然言語処理の演算結果を用いずに全文検索を行なうものとしてもよい。 In the metadata management system 20 of the embodiment, in the process of step S310 of the metadata search process in FIG. A full text search was performed using the calculation results. However, the full text search system 46 may perform a full text search without using the calculation results of natural language processing.
 実施例のメタデータ管理システム20では、データベースシステム44と第2メイン管理システム42と全文検索システム46と自然言語処理システム48とを備えるものとした。しかし、これらのうちの少なくとも2つを一体のシステムとして構成するものとしてもよい。 The metadata management system 20 of the embodiment includes a database system 44, a second main management system 42, a full text search system 46, and a natural language processing system 48. However, at least two of these may be configured as an integrated system.
 実施例のメタデータ管理システム20では、オンプレミス環境で第1メイン管理システム32を備えると共に、クラウド環境で、データベースシステム44と第2メイン管理システム42と全文検索システム46と自然言語処理システム48とを備えるものとした。しかし、オンプレミス環境で、第1メイン管理システム32に加えて、データベースシステム44と第2メイン管理システム42と全文検索システム46と自然言語処理システム48とを備えるものとしてもよい。この場合、第1メイン管理システム32と第2メイン管理システム42とを一体に構成するものとしてもよい。 The metadata management system 20 of the embodiment includes a first main management system 32 in an on-premises environment, and a database system 44, a second main management system 42, a full text search system 46, and a natural language processing system 48 in a cloud environment. I decided to prepare. However, in addition to the first main management system 32, the on-premises environment may include a database system 44, a second main management system 42, a full text search system 46, and a natural language processing system 48. In this case, the first main management system 32 and the second main management system 42 may be configured integrally.
 実施例の主要な要素と課題を解決するための手段の欄に記載した発明の主要な要素との対応関係について説明する。実施例では、第1メイン管理システム32や第2メイン管理システム42が「一般型メタデータ取得部」に相当し、データベースシステム44が「文書型メタデータ作成部」に相当する。また、全文検索システム46が「全文検索部」に相当する。自然言語処理システム48が「自然言語処理部」に相当する。 The correspondence between the main elements of the embodiments and the main elements of the invention described in the section of means for solving the problems will be explained. In the embodiment, the first main management system 32 and the second main management system 42 correspond to a "general type metadata acquisition section", and the database system 44 corresponds to a "document type metadata creation section". Further, the full text search system 46 corresponds to a "full text search unit". The natural language processing system 48 corresponds to a "natural language processing unit".
 なお、実施例の主要な要素と課題を解決するための手段の欄に記載した発明の主要な要素との対応関係は、実施例が課題を解決するための手段の欄に記載した発明を実施するための形態を具体的に説明するための一例であることから、課題を解決するための手段の欄に記載した発明の要素を限定するものではない。即ち、課題を解決するための手段の欄に記載した発明についての解釈はその欄の記載に基づいて行なわれるべきものであり、実施例は課題を解決するための手段の欄に記載した発明の具体的な一例に過ぎないものである。 The correspondence relationship between the main elements of the examples and the main elements of the invention described in the column of means for solving the problem is that the example implements the invention described in the column of means for solving the problem. Since this is an example for specifically explaining a form for solving the problem, it is not intended to limit the elements of the invention described in the column of means for solving the problems. In other words, the interpretation of the invention described in the column of means for solving the problem should be based on the description in that column, and the examples are based on the description of the invention described in the column of means for solving the problem. This is just one specific example.
 以上、本開示を実施するための形態について実施例を用いて説明したが、本開示はこうした実施例に何等限定されるものではなく、本開示の要旨を逸脱しない範囲内において、種々なる形態で実施し得ることは勿論である。 Although the embodiments of the present disclosure have been described above, the present disclosure is not limited to these embodiments in any way, and may be modified in various forms without departing from the gist of the present disclosure. Of course, it can be implemented.
 本開示は、メタデータを管理する分野などに利用可能である。 The present disclosure can be used in the field of managing metadata.

Claims (10)

  1.  メタデータを管理するメタデータ管理システムであって、
     それぞれが任意のメタデータスキーマにより規定されたメタデータである各一般型メタデータを取得する一般型メタデータ取得部と、
     前記各一般型メタデータから各文書型メタデータを作成する文書型メタデータ作成部と、
     を備えるメタデータ管理システム。
    A metadata management system that manages metadata,
    a general type metadata acquisition unit that acquires each general type metadata, each of which is metadata defined by an arbitrary metadata schema;
    a document type metadata creation unit that creates each document type metadata from each of the general type metadata;
    A metadata management system with.
  2.  請求項1記載のメタデータ管理システムであって、
     前記文書型メタデータ作成部は、グラフ構造の前記一般型メタデータから前記文書型メタデータを作成する、
     メタデータ管理システム。
    The metadata management system according to claim 1,
    The document type metadata creation unit creates the document type metadata from the general type metadata having a graph structure.
    Metadata management system.
  3.  請求項2記載のメタデータ管理システムであって、
     前記文書型メタデータ作成部は、前記グラフ構造のうち木構造の前記一般型メタデータからアウトライン構造の前記文書型メタデータを作成する、
     メタデータ管理システム。
    3. The metadata management system according to claim 2,
    The document type metadata creation unit creates the document type metadata having an outline structure from the general type metadata having a tree structure among the graph structures.
    Metadata management system.
  4.  請求項3記載のメタデータ管理システムであって、
     前記一般型メタデータは、単一の値を保持するデータ項目についての第1メタデータと前記データ項目の集合についての第2メタデータとを有し、
     前記第1メタデータは、第1共通部と第1メタデータソース依存部と第1使用者定義部とを有し、
     前記第2メタデータは、第2共通部と第2メタデータソース依存部と第2使用者定義部とを有し、
     前記一般型メタデータは、
      頂点として、前記第2共通部を有し、
      前記第2共通部の子ノードとして、前記第2メタデータソース依存部と前記第2使用者定義部と前記第1共通部の集合とを有し、
      前記第1共通部の子ノードとして、前記第1メタデータソース依存部と前記第1使用者定義部とを有し、
     前記文書型メタデータは、
      章として、前記第2共通部に関連する第2共通部関連部を有し、
      節として、前記第2メタデータソース依存部に関連する第2メタデータソース依存部関連部と、前記第2使用者定義部に関連する第2使用者定義部関連部と、前記第1共通部の集合に関連する第1共通部集合関連部とを有し、
      項として、前記第1共通部に関連する第1共通部関連部を有し、
      目として、前記第1メタデータソース依存部に関連する第1メタデータソース依存部関連部と、前記第1使用者定義部に関連する第1使用者定義部関連部とを有する、
     メタデータ管理システム。
    4. The metadata management system according to claim 3,
    The general type metadata has first metadata about a data item holding a single value and second metadata about a set of the data items,
    The first metadata has a first common part, a first metadata source dependent part, and a first user defined part,
    The second metadata has a second common part, a second metadata source dependent part, and a second user defined part,
    The general type metadata is
    having the second common part as a vertex;
    a set of the second metadata source dependent part, the second user definition part, and the first common part as a child node of the second common part;
    having the first metadata source dependent part and the first user defined part as child nodes of the first common part;
    The document type metadata is
    As a chapter, it has a second common part related part related to the second common part,
    The sections include a second metadata source dependent part related part related to the second metadata source dependent part, a second user defined part related part related to the second user defined part, and the first common part. a first common part set related part related to the set of;
    a first common part related part related to the first common part,
    a first metadata source dependent part related part related to the first metadata source dependent part; and a first user defined part related part related to the first user defined part;
    Metadata management system.
  5.  請求項1ないし4のうちの何れか1つの請求項に記載のメタデータ管理システムであって、
     前記一般型メタデータ取得部は、前記各一般型メタデータを取得し、使用者により設定された第1項目、使用者に提案して承認された第2項目、予め定められた第3項目、のうちの少なくとも1つを追加する、
     メタデータ管理システム。
    A metadata management system according to any one of claims 1 to 4, comprising:
    The general type metadata acquisition unit acquires each of the general type metadata, and includes a first item set by the user, a second item proposed and approved by the user, a predetermined third item, adding at least one of the
    Metadata management system.
  6.  請求項1ないし5のうちの何れか1つの請求項に記載のメタデータ管理システムであって、
     使用者により1または複数の検索用文字列が設定されて検索指示が行なわれると、前記検索用文字列を用いて前記各文書型メタデータについて全文検索を行なう全文検索部、
     を更に備えるメタデータ管理システム。
    A metadata management system according to any one of claims 1 to 5, comprising:
    a full-text search unit that, when a user sets one or more search strings and issues a search instruction, performs a full-text search on each of the document type metadata using the search strings;
    A metadata management system further comprising:
  7.  請求項1ないし6のうちの何れか1つの請求項に記載のメタデータ管理システムであって、
     前記文書型メタデータについて自然言語処理を行なう自然言語処理部を更に備え、
     少なくとも前記自然言語処理部は、クラウド環境のマルチテナントシステムとして構成されている、
     メタデータ管理システム。
    A metadata management system according to any one of claims 1 to 6, comprising:
    further comprising a natural language processing unit that performs natural language processing on the document type metadata,
    At least the natural language processing unit is configured as a multi-tenant system in a cloud environment.
    Metadata management system.
  8.  請求項7記載のメタデータ管理システムであって、
     前記自然言語処理部は、前記演算結果を使用者に提案し、
     前記一般型データ取得部は、前記演算結果が使用者により承認されると、前記一般型データに前記演算結果を反映させて更新する、
     メタデータ管理システム。
    8. The metadata management system according to claim 7,
    The natural language processing unit proposes the calculation result to the user,
    When the calculation result is approved by the user, the general type data acquisition unit updates the general type data to reflect the calculation result.
    Metadata management system.
  9.  メタデータを管理するメタデータ管理方法であって、
    (a)それぞれが任意のメタデータスキーマにより規定されたメタデータである各一般型メタデータを取得するステップと、
    (b)前記各一般型メタデータから各文書型メタデータを作成するステップと、
     を有するメタデータ管理方法。
    A metadata management method for managing metadata, the method comprising:
    (a) obtaining each general type of metadata, each of which is metadata specified by an arbitrary metadata schema;
    (b) creating each document type metadata from each of the general type metadata;
    A metadata management method having.
  10.  コンピュータを、メタデータを管理するメタデータ管理システムとして機能させるためのプログラムであって、
    (a)それぞれが任意のメタデータスキーマにより規定されたメタデータである各一般型メタデータを取得するステップと、
    (b)前記各一般型メタデータから各文書型メタデータを作成するステップと、
     を有するプログラム。
    A program for making a computer function as a metadata management system for managing metadata,
    (a) obtaining each general type of metadata, each of which is metadata specified by an arbitrary metadata schema;
    (b) creating each document type metadata from each of the general type metadata;
    A program with
PCT/JP2022/015745 2022-03-30 2022-03-30 Metadata management system, metadata management method, and program WO2023188049A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022549966A JP7319475B1 (en) 2022-03-30 2022-03-30 METADATA MANAGEMENT SYSTEM, METADATA MANAGEMENT METHOD, AND PROGRAM
PCT/JP2022/015745 WO2023188049A1 (en) 2022-03-30 2022-03-30 Metadata management system, metadata management method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/015745 WO2023188049A1 (en) 2022-03-30 2022-03-30 Metadata management system, metadata management method, and program

Publications (1)

Publication Number Publication Date
WO2023188049A1 true WO2023188049A1 (en) 2023-10-05

Family

ID=87469694

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/015745 WO2023188049A1 (en) 2022-03-30 2022-03-30 Metadata management system, metadata management method, and program

Country Status (2)

Country Link
JP (1) JP7319475B1 (en)
WO (1) WO2023188049A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348593A (en) * 2003-05-23 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> Apparatus and method for retrieving storage, storage retrieval program, and storage retrieval program recording medium
JP2005322025A (en) * 2004-05-10 2005-11-17 Matsushita Electric Ind Co Ltd Device and method for converting structure description data into semantic description data

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003256432A (en) 2002-03-06 2003-09-12 Telecommunication Advancement Organization Of Japan Image material information description method, remote retrieval system, remote retrieval method, edit device, remote retrieval terminal, remote edit system, remote edit method, edit device, remote edit terminal, and image material information storage device, and method
JP2004102767A (en) 2002-09-11 2004-04-02 Nippon Hoso Kyokai <Nhk> Metadata collection/distribution system, metadata collection server, metadata collection method, metadata collection program, and recording medium having metadata collection program recorded therein
JP5056384B2 (en) 2006-12-21 2012-10-24 富士通株式会社 Search program, method and apparatus
JP6108755B2 (en) 2012-10-18 2017-04-05 オリンパス株式会社 Shooting device, shot image transmission method, and shot image transmission program
JP6216929B2 (en) 2014-03-27 2017-10-25 株式会社Kddi総合研究所 Detection apparatus, detection method, and detection program
JP6617089B2 (en) 2016-09-21 2019-12-04 Kddi株式会社 Determination device, determination system, and determination method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348593A (en) * 2003-05-23 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> Apparatus and method for retrieving storage, storage retrieval program, and storage retrieval program recording medium
JP2005322025A (en) * 2004-05-10 2005-11-17 Matsushita Electric Ind Co Ltd Device and method for converting structure description data into semantic description data

Also Published As

Publication number Publication date
JPWO2023188049A1 (en) 2023-10-05
JP7319475B1 (en) 2023-08-01

Similar Documents

Publication Publication Date Title
JP4352079B2 (en) System, apparatus, and method for retrieving information from a distributed database
US8396894B2 (en) Integrated repository of structured and unstructured data
US8943059B2 (en) Systems and methods for merging source records in accordance with survivorship rules
US9684699B2 (en) System to convert semantic layer metadata to support database conversion
WO2017100544A1 (en) Query processor
US7668888B2 (en) Converting object structures for search engines
US11263187B2 (en) Schema alignment and structural data mapping of database objects
Fehily SQL Database Programming
CN117453980A (en) Metadata management, configuration page generation method, server and storage medium
WO2023188049A1 (en) Metadata management system, metadata management method, and program
Wilton Beginning sql
Fehily SQL
JP2003281149A (en) Method of setting access right and system of structured document management
CN108614821B (en) Geological data interconnection and mutual-checking system
US20140304293A1 (en) Apparatus and Method for Query Based Replication of Database
Gašpar et al. Integrating Two Worlds: Relational and NoSQL
US20180357297A1 (en) Rdb system
US10896174B2 (en) Sharing artifacts with heterogeneous database connectivity
Mukhopadhyay et al. Developing geodetic search interface through auto-generation of geographic name authority datasets
JP4749899B2 (en) Table structure determination and notification system
Trotter et al. FIMS: a free and open-source spatial database system for plant observation and mobile data collection.
JP2004126680A (en) Sql masking type database access method and computer program
Masri et al. Relational databases and normalization
Viescas et al. Effective SQL: 61 specific ways to write better SQL
Tahiri Alaoui An approach to automatically update the Spanish DBpedia using DBpedia Databus

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 2022549966

Country of ref document: JP

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22935197

Country of ref document: EP

Kind code of ref document: A1