WO2021234916A1 - 分析装置、分析方法および分析プログラム - Google Patents

分析装置、分析方法および分析プログラム Download PDF

Info

Publication number
WO2021234916A1
WO2021234916A1 PCT/JP2020/020144 JP2020020144W WO2021234916A1 WO 2021234916 A1 WO2021234916 A1 WO 2021234916A1 JP 2020020144 W JP2020020144 W JP 2020020144W WO 2021234916 A1 WO2021234916 A1 WO 2021234916A1
Authority
WO
WIPO (PCT)
Prior art keywords
meaning
data
conversion rule
cost
analysis
Prior art date
Application number
PCT/JP2020/020144
Other languages
English (en)
French (fr)
Inventor
昌史 小山田
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to US17/925,516 priority Critical patent/US20230195746A1/en
Priority to JP2022524810A priority patent/JP7444248B2/ja
Priority to PCT/JP2020/020144 priority patent/WO2021234916A1/ja
Publication of WO2021234916A1 publication Critical patent/WO2021234916A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Definitions

  • the present invention relates to an analyzer, an analysis method, and an analysis program for analyzing what kind of analysis can be performed using data having the meaning given the meaning of the data.
  • Patent Document 1 describes a device capable of deriving a highly accurate latent target by combining sequence analysis and decision tree analysis.
  • the apparatus described in Patent Document 1 inputs time-series data, and also inputs rules specific to a specific attribute data appearance set. Then, the device processes data having the same time-series transition as the rule having a positive correlation with the specific attribute data appearance tendency, and the same time as the rule having a negative correlation with the specific attribute data non-appearance tendency. Process data with serial transition.
  • Patent Document 2 describes a technique for estimating the meaning of the data stored in a column for each column of the table when a table storing the data is input.
  • the "meaning of data” is a concept represented by the data.
  • a column name is assigned to each column.
  • the column name is determined by a human being, so that the column name is notated.
  • various column names such as "type” and “male and female” may be given as column names of columns storing the gender of a person.
  • the "meaning of data” is a concept represented by the data and is distinguished from the column name.
  • "gender” corresponds to the meaning of the data.
  • a person with such a large amount of data has data, but often does not know what kind of analysis can be performed using that data.
  • an object of the present invention is to provide an analyzer, an analysis method, and an analysis program capable of deriving information indicating what kind of analysis can be performed using the possessed data.
  • the analyzer comprises a conversion rule storage means for storing a plurality of conversion rules for converting the meaning of one or more data into the meaning of one or more other data, and a conversion rule storage means for one or more given data. It is provided with an analysis means for deriving information indicating what kind of analysis can be performed using the data having the meaning based on the meaning and the conversion rule.
  • one or more computers provided with a conversion rule storage means for storing a plurality of conversion rules for converting the meaning of one or more data into the meaning of one or more other data. Based on the meaning of the data and the conversion rule, information indicating what kind of analysis can be performed using the data having the meaning is derived.
  • the recording medium according to the present invention is one or more given to a computer provided with a conversion rule storage means for storing a plurality of conversion rules for converting the meaning of one or more data into the meaning of one or more other data.
  • a computer-readable computer that records an analysis program for executing an analysis process that derives information indicating what kind of analysis can be performed using the data having the meaning based on the meaning of the data and the conversion rule. Recording medium.
  • FIG. 1 is a block diagram showing an example of an analyzer according to the first embodiment of the present invention.
  • the analysis device 1 of the present embodiment includes an acquisition unit 2, a semantic estimation unit 3, a semantic storage unit 4, a conversion rule storage unit 5, and an analysis unit 6.
  • the acquisition unit 2 acquires the data possessed by a person who has a lot of data.
  • the acquisition unit 2 acquires a table in which data is stored will be described as an example.
  • the table contains one or more columns, each of which stores data.
  • the data possessed by the person who has the data may include the data purchased by that person from another person.
  • the acquisition unit 2 may be realized by a data reading device that reads a table recorded on a data recording medium such as an optical disk, but the acquisition unit 2 is not limited to such a data reading device.
  • the acquisition unit 2 may be realized by a communication interface that receives a table distributed via a communication network.
  • the meaning estimation unit 3 estimates the meaning of the data for each of the various data groups acquired by the acquisition unit 2.
  • the meaning estimation unit 3 estimates the meaning of the data stored in each column of the table acquired by the acquisition unit 2 as an example.
  • the number of meanings of the data estimated by the meaning estimation unit 3 is one or more.
  • the method in which the acquisition unit 2 estimates the meaning of the data may be a known method.
  • the meaning estimation unit 3 may estimate the meaning of the data stored in the column for each column by the method described in Patent Document 2. It can be said that the meaning of various data estimated by the meaning estimation unit 3 is the "meaning of data" given by the person who has the data.
  • the meaning estimation unit 3 stores various "meanings of data” obtained by estimation in the meaning storage unit 4. For example, when the meaning estimation unit 3 obtains "height”, “weight”, “annual income”, “age”, etc. as the meaning of the data by estimation, the meaning of those data is stored in the meaning storage unit 4. Let me.
  • the semantic storage unit 4 is a storage device that stores the meaning of data.
  • the conversion rule storage unit 5 is a storage device that stores a plurality of conversion rules.
  • a “conversion rule” is a rule that converts the meaning of one or more data into the meaning of one or more other data.
  • "converting the meaning of one or more data into the meaning of one or more other data” means “calculating data having another meaning based on the data having one meaning, or calculating data having another meaning.” It can be estimated.
  • the conversion rule ID is predetermined for each conversion rule.
  • FIG. 2 is a schematic diagram showing an example of a conversion rule.
  • FIG. 2 shows three conversion rules.
  • the first conversion rule shown in FIG. 2 indicates that the meaning of the data "height” and the meaning of the data "weight” are converted into the meaning of the data "BMI (Body Mass Index)". ing.
  • BMI Body Mass Index
  • a conversion rule ID called "BMI calculation” is defined.
  • FIG. 2 shows a case where there are multiple meanings of the data on the left side (meaning of the data before conversion) in each conversion rule, but even if the number of meanings of the data on the left side is one in the conversion rule. good. Further, FIG. 2 shows a case where the number of meanings of the data on the right side (meaning of the data after conversion) is one in each conversion rule, but there are a plurality of meanings of the data on the right side in the conversion rule. May be. The fact that there are multiple meanings of the data on the right side means that a plurality of types of data can be obtained based on the meaning of the data on the left side.
  • Each conversion rule is provided by, for example, a person who provides an analysis processing service, a person who sells data, or the like, and is stored in the conversion rule storage unit 5 in advance.
  • the analysis unit 6 derives information indicating what kind of analysis can be performed using the data having the meaning based on the meaning of the data obtained by the meaning estimation unit 3 and each conversion rule.
  • the analysis unit 6 derives a set of conversion rules recursively extracted from the meaning of the data obtained by the meaning estimation unit 3 as this information.
  • the meaning of various data estimated by the meaning estimation unit 3 is the "meaning of data” given by the person who has the data. Therefore, hereinafter, the meaning of the data estimated by the meaning estimation unit 3 may be referred to as the meaning of the given data.
  • the analysis unit 6 extracts a conversion rule that satisfies the condition that the meaning of the data on the left side (meaning of the data before conversion) is included in the meaning of the given data. Then, the analysis unit 6 obtains a union of the meaning of the data on the right side (meaning of the data after conversion) and the meaning of the given data in each of the extracted conversion rules, and the union is the given data. It is regarded as the meaning of. The analysis unit 6 repeats this operation.
  • the analysis unit 6 provides information indicating what kind of analysis can be performed on the set of the newly extracted conversion rules. It is determined as.
  • the meaning estimation unit 3 and the analysis unit 6 are realized by, for example, a CPU (Central Processing Unit) of a computer that operates according to an analysis program.
  • the CPU may read an analysis program from a program recording medium such as a program storage device of a computer and operate as a meaning estimation unit 3 and an analysis unit 6 according to the analysis program.
  • the semantic storage unit 4 and the conversion rule storage unit 5 are realized by, for example, a storage device provided in a computer.
  • FIG. 3 is a flowchart showing an example of the processing progress of the first embodiment. It is assumed that the acquisition unit 2 has acquired the data (table). Further, for the sake of simplicity, it is assumed that the conversion rule storage unit 5 stores the three conversion rules shown in FIG. Further, detailed description of the matters already described will be omitted.
  • the meaning estimation unit 3 estimates the meaning of the data acquired by the acquisition unit 2 (step S1).
  • the meaning estimation unit 3 estimates the meaning of the data stored in each column of the table.
  • step S1 the meaning of one or more data is obtained.
  • the meaning of the data obtained in step S1 will be referred to as the meaning of the given data.
  • the meaning estimation unit 3 stores the meaning of the given data (“height”, “weight”, “annual income”, “age”) in the meaning storage unit 4.
  • the analysis unit 6 extracts all conversion rules satisfying the condition that the meaning of the data on the left side (meaning of the data before conversion) is included in the meaning of the given data (step S2). ..
  • the meaning of the given data is ⁇ "height", “weight”, “annual income”, “age” ⁇ .
  • the meaning of the data on the left side of the conversion rule "BMI calculation” shown in FIG. 2 is ⁇ "height", “weight” ⁇ . Therefore, the meaning of the data on the left side of the conversion rule "BMI calculation” is included in the meaning of the given data. Therefore, since the conversion rule "BMI calculation" satisfies the above conditions, the analysis unit 6 extracts the conversion rule "BMI calculation".
  • step S2 the analysis unit 6 determines whether or not the conversion rule extracted in the latest step S2 and the conversion rule extracted in the previous step S2 are the same (step S3). If they are not the same (No in step S3), the process proceeds to step S4. If both are the same (Yes in step S3), the process proceeds to step S5. At the time of first shifting to step S3, since step S2 has been executed only once, the transition to step S4 is performed. Therefore, here, the process proceeds to step S4.
  • step S4 the analysis unit 6 obtains a union of the meaning of the data on the right side of each extracted conversion rule (meaning of the data after conversion) and the meaning of the given data, and is given the union. It is regarded as the meaning of the data. Then, the analysis unit 6 stores the meaning of the given data in the semantic storage unit 4.
  • the meaning of the data on the right side of the extracted conversion rule "BMI calculation” is ⁇ "BMI” ⁇ . Therefore, the analysis unit 6 sets ⁇ "height", “weight” as a union of ⁇ "BMI” ⁇ and the meaning of the given data ⁇ "height", “weight”, “annual income”, “age” ⁇ . , “Annual income”, “age”, “BMI” ⁇ . Then, the analysis unit 6 regards the union ⁇ “height”, “weight”, “annual income”, “age”, “BMI” ⁇ as the meaning of the given data. Further, the analysis unit 6 stores ⁇ “height”, “weight”, “annual income”, “age”, “BMI” ⁇ in the semantic storage unit 4.
  • step S4 the analysis unit 6 repeats the processes after step S2.
  • the meanings of the given data are ⁇ “height”, “weight”, “annual income”, “age”, “BMI” ⁇ . Therefore, at this time, the analysis unit 6 extracts the conversion rule “BMI calculation” and the conversion rule “cancer risk prediction” (see FIG. 2).
  • step S3 the analysis unit 6 executes step S3 again.
  • the conversion rules extracted in the latest step S2 are the conversion rule "BMI calculation” and the conversion rule "cancer risk prediction”. Further, the conversion rule extracted in the previous step S2 is only the conversion rule "BMI calculation”. Therefore, since they are not the same (No in step S3), the process proceeds to step S4.
  • step S4 the analysis unit 6 has ⁇ “BMI”, “cancer risk” ⁇ and the meaning of the given data ⁇ “height”, “weight”, “annual income”, “age”, “BMI” ⁇ . ⁇ "Height”, “Weight”, “Annual income”, “Age”, “BMI”, “Cancer risk” ⁇ is calculated as the union of. Then, the analysis unit 6 regards the union ⁇ “height”, “weight”, “annual income”, “age”, “BMI”, “cancer risk” ⁇ as the meaning of the given data (step S4). .. Further, the analysis unit 6 stores ⁇ “height”, “weight”, “annual income”, “age”, “BMI”, “cancer risk” ⁇ in the semantic memory unit 4.
  • step S4 the analysis unit 6 executes the third step S2.
  • the meanings of the given data are ⁇ “height”, “weight”, “annual income”, “age”, “BMI”, “cancer risk” ⁇ . Therefore, at this time, the analysis unit 6 extracts the conversion rule “BMI calculation” and the conversion rule “cancer risk prediction” (see FIG. 2).
  • step S3 the analysis unit 6 executes step S3 again.
  • the conversion rules extracted in the latest step S2 are the conversion rule "BMI calculation” and the conversion rule “cancer risk prediction”.
  • the conversion rule extracted in the previous step S2 is also the conversion rule "BMI calculation” and the conversion rule "cancer risk prediction”. Therefore, since both are the same (Yes in step S3), the process proceeds to step S5.
  • step S5 the analysis unit 6 defines a set of conversion rules extracted in the latest step S2 as information indicating what kind of analysis can be performed, and outputs the information (step S5).
  • the analysis unit 6 defines a set of conversion rules including the conversion rule "BMI calculation” and the conversion rule "cancer risk prediction” as information indicating what kind of analysis can be performed.
  • the analysis unit 6 may display information on, for example, a display device (not shown) provided in the analysis device 1.
  • the display is an example of the output mode, and the analysis unit 6 may output the information in another mode. This point is the same in other embodiments described later.
  • the analysis unit 6 extracts all the conversion rules satisfying the condition that the meaning of the data on the left side is included in the meaning of the given data in step S2. That is, it can be said that the conversion rule extracted in step S2 represents an analysis that can be performed using data having a given meaning. Further, in the first embodiment, the union is obtained in step S4, and the union is regarded as the meaning of the given data, thereby increasing the number of meanings of the given data. As a result, in the iterative process of steps S2 to S4, as the number of repetitions increases, the conversion rules extracted in step S2 also increase.
  • step S2 Since the analysis unit 6 executes the iterative process of steps S2 to S4 until the conversion rule extracted in step S2 does not change, as many conversion rules as possible representing the analysis that can be performed using the data having the given meaning are performed. Can be extracted. Therefore, according to the present embodiment, it is possible to present what kind of analysis can be performed using the data possessed by the user.
  • FIG. 4 is a block diagram showing an example of the analyzer of the second embodiment of the present invention.
  • the analysis device 1 of the present embodiment includes an acquisition unit 2, a semantic estimation unit 3, a semantic storage unit 4, a conversion rule storage unit 5, a graph generation unit 7, a graph storage unit 8, and an analysis unit 26. Be prepared.
  • the acquisition unit 2, the semantic estimation unit 3, the semantic storage unit 4, and the conversion rule storage unit 5 in the second embodiment include the acquisition unit 2, the semantic estimation unit 3, the semantic storage unit 4, and the conversion rule storage in the first embodiment. This is the same as that of the part 5, and the description thereof will be omitted.
  • the graph generation unit 7 is a directed bipartite graph including a set of nodes representing the meaning of data and a set of nodes representing the conversion rule ID based on each conversion rule stored in the conversion rule storage unit 5 in advance. To generate.
  • the conversion rule storage unit 5 stores the six conversion rules illustrated in FIG. 5 will be described as an example.
  • FIG. 6 is an explanatory diagram showing an example of a directed bipartite graph generated based on each conversion rule shown in FIG.
  • the graph generation unit 7 may generate a directed bipartite graph by another method.
  • the graph generation unit 7 selects one unselected conversion rule from each conversion rule stored in the conversion rule storage unit 5.
  • the graph generation unit 7 generates a node representing the meaning of the data on the left side of the selected conversion rule and a node representing the meaning of the data on the right side, and includes those nodes in the first set of nodes. Further, the graph generation unit 7 generates a node representing the conversion rule ID of the selected conversion rule and includes it in the second set of nodes.
  • the first set of nodes is a set of nodes corresponding to the meaning of the data
  • the second set of nodes is a set of nodes corresponding to the conversion rule ID.
  • the graph generation unit 7 generates an edge from each node corresponding to the meaning of the data on the left side of the selected conversion rule toward the node corresponding to the conversion rule ID of the selected conversion rule. Further, the graph generation unit 7 generates an edge from the node corresponding to the conversion rule ID of the selected conversion rule toward each node corresponding to the meaning of the data on the right side of the selected conversion rule.
  • the graph generation unit 7 generates a node corresponding to "height", a node corresponding to "weight”, and a node corresponding to "BMI", and includes those nodes in the first set. Further, the graph generation unit 7 generates a node corresponding to the "BMI calculation” and includes it in the second set. Then, the graph generation unit 7 generates an edge from each of the node corresponding to "height” and the node corresponding to "weight” toward the node corresponding to "BMI calculation”. Further, the graph generation unit 7 generates an edge from the node corresponding to the “BMI calculation” toward the node corresponding to the “BMI”.
  • the graph generation unit 7 selects conversion rules one by one and executes the above processing until there are no unselected conversion rules. However, if a node corresponding to the meaning of the data to be newly generated has already been generated, the graph generation unit 7 does not have to generate the node in duplicate. For example, consider a case where the conversion rule "BMI calculation" is selected and then the conversion rule "cancer risk prediction” is selected to execute the above processing. When the conversion rule "cancer risk prediction" is selected, the graph generation unit 7 sets the node corresponding to the meaning of the data to the node corresponding to "BMI", the node corresponding to "age”, and the node corresponding to "cancer risk". The corresponding node will be generated, but the node corresponding to "BMI" has already been generated. Therefore, in this case, the graph generation unit 7 does not have to generate duplicate nodes corresponding to "BMI".
  • FIG. 6 shows an example of the directed bipartite graph generated in this way.
  • the edge from the node corresponding to the meaning of the data to the node corresponding to the conversion rule ID is shown by a solid line.
  • the edge from the node corresponding to the conversion rule ID to the node corresponding to the meaning of the data is shown by a broken line.
  • the edges from the nodes in the first set to the nodes in the second set are shown by solid lines
  • the edges from the nodes in the second set to the nodes in the first set are shown by dashed lines. There is.
  • the graph generation unit 7 stores the generated directed bipartite graph in the graph storage unit 8.
  • the graph storage unit 8 is a storage device that stores the generated directed bipartite graph.
  • the analysis unit 26 defines each node corresponding to the meaning of the given data as the search start point.
  • the analysis unit 26 repeats the following processing.
  • the analysis unit 26 identifies the node corresponding to the conversion rule ID that arrives from the search start point via one edge in the directed bipartite graph.
  • each node corresponding to the "meaning of data" on the left side of the conversion rule represented by the conversion rule ID corresponding to the specified node is the search start point, and the specified node searches for them.
  • the search route from those search start points to the node representing the meaning of the data on the right side of the conversion rule is derived.
  • the analysis unit 26 defines a node representing the meaning of the above-mentioned data on the right side as a search start point.
  • the analysis unit 26 defines the search route derived by the time when a new search route cannot be derived as information indicating what kind of analysis can be performed.
  • the graph generation unit 7 and the analysis unit 26 are realized, for example, by the CPU of a computer that operates according to an analysis program. Further, the graph storage unit 8 is realized by, for example, a storage device provided in a computer.
  • 7, 8 and 9 are flowcharts showing an example of the processing progress of the second embodiment. However, detailed description of the matters already described will be omitted.
  • the conversion rule storage unit 5 stores each conversion rule illustrated in FIG. 5 in advance. Further, the graph generation unit 7 has already generated the directed bipartite graph illustrated in FIG. 6 based on the conversion rules, and stores the directed bipartite graph in the graph storage unit 8. And. Further, it is assumed that the acquisition unit 2 has acquired the data (table).
  • the meaning estimation unit 3 estimates the meaning of the data acquired by the acquisition unit 2 (step S11).
  • the meaning estimation unit 3 estimates the meaning of the data stored in each column of the table.
  • step S11 the meaning of one or more data is obtained.
  • the meaning of the data obtained in step S11 will be referred to as the meaning of the given data.
  • the meaning of the given data is ⁇ "height", “weight”, “annual income”, “age” ⁇ .
  • the analysis unit 26 defines each node corresponding to the meaning of the given data as the search start point in the pre-generated directed bipartite graph (step S12). This node belongs to the first set of directed bipartite graphs. Further, the analysis unit 26 stores the meaning of the data corresponding to the search start point in the semantic storage unit 4. The number of search start points is not limited to one.
  • each node corresponding to "height”, “weight”, “annual income”, and “age” is set as the search start point.
  • the analysis unit 26 identifies the nodes in the second set whose edges are heading from each search start point in the directed bipartite graph (step S13).
  • the number of nodes specified in step S13 is not limited to one. Further, it can be said that the node specified in step S13 is a node that arrives from the search start point via one edge.
  • each node corresponding to "height”, “weight”, “annual income”, and “age” is the search start point, so in step S13, "BMI calculation”, “age estimation”, and “cancer risk”
  • the nodes corresponding to "Forecast”, “Annual income estimation”, and “Insurance claim calculation” are specified.
  • the analysis unit 26 determines whether or not all the nodes specified in step S13 have been selected in step S15 (step S14).
  • step S13 If among the nodes specified in step S13, the nodes not selected in step S15 remain (No in step S14), the process proceeds to step S15.
  • step S15 the analysis unit 26 selects one unselected node from the nodes specified in step S13.
  • the analysis unit 26 adds the meaning of the data corresponding to each search start point reaching the node to the conversion rule having the conversion rule ID corresponding to the node selected in step S15 (step S16). ..
  • the conversion rule ID is expressed as "r”
  • the meaning of the data at the search start point reaching the node corresponding to the conversion rule ID is expressed as "r.visited_semantics”.
  • the analysis unit 26 adds a specific meaning of data to "r.visited_semantics”.
  • the analysis unit 26 has the "meaning of data” on the left side of the conversion rule having the conversion rule ID corresponding to the node selected in step S15, and the "data” added to the conversion rule in step S16. It is determined whether or not the set of "meaning of” matches (step S17). Assuming that the conversion rule ID corresponding to the selected node is "r”, in step S17, the analysis unit 26 has a set of "r.input_semantics” and “meaning of data” added to "r.visited_semantics”. It suffices to judge whether or not they match.
  • step S17 means that all the nodes corresponding to the "meaning of data" before conversion in the conversion rule having the conversion rule ID corresponding to the selected node start searching. A point, meaning that the selected node has been reached from all of its search start points.
  • step S17 If it is determined in step S17 that they do not match (No in step S17), the analysis unit 26 repeats the processes after step S14 (see FIG. 7).
  • step S17 When it is determined in step S17 that the match is made (Yes in step S17), the analysis unit 26 indicates each search start point representing the meaning of the data on the left side of the conversion rule having the conversion rule ID corresponding to the node selected in step S15. From, the search route to reach the node representing the meaning of the data on the right side of the conversion rule via the selected node is derived as a new search route. Then, the analysis unit 26 stores the search route in the graph storage unit 8 (step S18). However, the analysis unit 26 does not have to store the same search route as the already derived search route in the graph storage unit 8 in duplicate.
  • FIG. 10 is a schematic diagram showing an example of the search route derived in step S18.
  • step S18 the analysis unit 26 determines the node corresponding to the end point of the search route derived in step S18 as the search start point (step S19). That is, in step S19, a new search start point is added to the existing search start point. For example, when the search route illustrated in FIG. 10 is derived in step S18, the analysis unit 26 sets the node corresponding to the end point of the search route and representing the meaning of the data "BMI" as a new search start point. Add to an existing search start point. The analysis unit 26 stores the meaning of the data corresponding to the search start point (in other words, the newly added search start point) defined in step S19 in the semantic storage unit 4.
  • step S19 the analysis unit 26 repeats the processes after step S14 (see FIG. 7).
  • step S14 the process proceeds to step S14, and when it is determined that all the nodes specified in step S13 have been selected in step S15 (Yes in step S14), the process proceeds to step 20 (see FIG. 9).
  • step S20 the analysis unit 26 determines whether or not a new search route different from the existing search route is derived in step S18 for some of the nodes among all the nodes specified in step S13. (Step S20).
  • step S18 If a new search route has been derived in step S18 for some of the nodes identified in step S13 (Yes in step S20), the analysis unit 26 will perform step S13 (see FIG. 7). ) Repeat the subsequent processing.
  • step S21 If a new search route has not been derived in step S18 for any of the nodes identified in step S13 (No in step S20), the analysis unit 26 determines which search route is obtained at that time. It is determined as information indicating whether such an analysis can be performed, and the information is output (step S21). The process ends in step S21.
  • FIG. 11 is a schematic diagram showing an example of the search route finally obtained in this example.
  • a search route based on a node corresponding to the meaning of the given data can be obtained. Then, the node corresponding to the conversion rule ID is included on the search route. Therefore, as in the first embodiment, it is possible to present what kind of analysis can be performed using the data possessed by the user. Further, in the second embodiment, information indicating what kind of analysis can be performed is derived in the form of a search route, so that not only what kind of analysis can be performed but also what kind of procedure is used for analysis. An analysis procedure can also be presented. For example, when the search route illustrated in FIG. 11 is presented, the user can understand that "cancer risk" can be obtained by performing BMI calculation and then performing cancer risk prediction.
  • FIG. 11 shows a search route in which the end point is only "cancer risk”
  • the search route may be branched and a search route having a plurality of end points may be obtained.
  • Such a search route represents that multiple types of analysis can be performed, and also represents the meaning of the data obtained for each of those analyses. This point is the same in the third embodiment described later.
  • FIG. 12 is a block diagram showing an example of an analyzer according to a third embodiment of the present invention.
  • the analysis device 1 of the present embodiment includes an acquisition unit 2, a semantic estimation unit 3, a semantic storage unit 4, a conversion rule storage unit 5, a graph generation unit 7, a graph storage unit 8, and a cost initial value setting unit.
  • a 31 unit, a cost storage unit 32, and an analysis unit 36 are provided.
  • the cost is set for each "meaning of data" corresponding to each node belonging to the first set of the directed bipartite graph.
  • the cost is set in advance for each conversion rule.
  • a cost upper limit (hereinafter referred to as max_cost) is predetermined for the user who gives the data (the person who has the data). It can be said that max_coxt represents the upper limit of the budget for the available conversion rules (in other words, the available analytical processing).
  • max_cost can also be referred to as a predetermined upper limit of cost.
  • the "meaning of data” may be expressed as "s i ", and the cost of the meaning of the data may be expressed as "s i .cost”.
  • the conversion rule ID of a certain conversion rule may be expressed as "r”
  • the cost of the conversion rule may be expressed as "r.cost”.
  • the acquisition unit 2, the semantic estimation unit 3, the semantic storage unit 4, and the conversion rule storage unit 5 in the third embodiment include the acquisition unit 2, the semantic estimation unit 3, and the semantic storage in the first embodiment and the second embodiment. This is the same as the unit 4 and the conversion rule storage unit 5, and the description thereof will be omitted. However, in the present embodiment, the cost is individually determined in advance for each conversion rule stored in the conversion rule storage unit 5.
  • graph generation unit 7 and the graph storage unit 8 in the third embodiment are the same as the graph generation unit 7 and the graph storage unit 8 in the second embodiment, and the description thereof will be omitted.
  • the cost initial value setting unit 31 sets the initial cost value for the meaning of the individual data corresponding to the individual nodes belonging to the first set of the directed bipartite graph. At this time, the cost initial value setting unit 31 sets the cost of the meaning of the given data (in other words, the meaning of the data estimated by the meaning estimation unit 3) to “0”, and the meaning of the remaining data. Set the cost of to infinite.
  • the cost storage unit 32 is a storage device that stores a combination of the meaning of the data and the cost for each meaning of the data.
  • the analysis unit 36 derives a search route from the search start point based on the cost of the meaning of the data, the cost predetermined for each conversion rule, and max_cost.
  • the analysis unit 36 defines each node corresponding to the meaning of the given data as the search start point.
  • the analysis unit 36 repeats the following processing.
  • the analysis unit 36 determines the cost of the meaning of the data corresponding to the search start point among the nodes corresponding to the conversion rule ID to which one edge is heading from the search start point, and the conversion rule. Only the nodes that satisfy the condition that the sum with the cost of the conversion rule represented by the ID is equal to or less than max_cost are specified as the nodes reached from the search start point via one edge. Therefore, in the third embodiment, the condition that the sum of the cost (s i .cost) of the meaning of the data corresponding to the search start point and the cost (r.cost) of the conversion rule is not more than max_cost is satisfied. Only when there is, the node corresponding to the conversion rule ID of the conversion rule is specified as a node reached from the search start point via one edge.
  • each node corresponding to the "meaning of data" on the left side of the conversion rule represented by the conversion rule ID corresponding to the specified node is the search start point, and the specified node searches for them.
  • the search route from those search start points to the node representing the meaning of the data on the right side of the conversion rule is derived.
  • the analysis unit 36 defines a node representing the meaning of the above-mentioned data on the right side as a search start point.
  • the analysis unit 36 updates the cost of the meaning of the data corresponding to the search start point when the predetermined condition is satisfied.
  • the predetermined condition means the cost of the conversion rule represented by the last conversion rule ID on the derived search route and each data corresponding to all the search start points reaching the node corresponding to the conversion rule ID.
  • the condition is that the sum with the sum of the costs is less than or equal to the cost of the meaning of the data corresponding to the newly defined search start point.
  • the analysis unit 36 updates the cost of the meaning of the data corresponding to the newly determined search start point with the above sum value. Further, if this condition is not satisfied, the analysis unit 36 does not update the cost of the meaning of the data corresponding to the newly determined search start point.
  • the analysis unit 36 defines the search route derived by the time when a new search route cannot be derived as information indicating what kind of analysis can be performed.
  • the cost initial value setting unit 31 and the analysis unit 36 are realized by, for example, the CPU of a computer that operates according to the analysis program. Further, the cost storage unit 32 is realized by, for example, a storage device included in a computer.
  • FIG. 14 and FIG. 15 are flowcharts showing an example of the processing progress of the third embodiment.
  • detailed description of the matters already described will be omitted.
  • the same step numbers as those in FIGS. 7, 8 and 9 are assigned, and detailed description thereof will be omitted.
  • the conversion rule storage unit 5 stores each conversion rule illustrated in FIG. 5 in advance.
  • the conversion rules "BMI calculation”, “age estimation”, “cancer risk prediction”, “annual income estimation”, “insurance claim calculation” and “gender determination” have the costs of "5", "10”, respectively. It is assumed that “20”, “20”, “12” and “9” are predetermined. It is also assumed that the value of max_cost is predetermined.
  • the graph generation unit 7 has already generated the directed bipartite graph illustrated in FIG. 6 based on the conversion rules, and stores the directed bipartite graph in the graph storage unit 8. And. Further, it is assumed that the acquisition unit 2 has acquired the data (table).
  • the meaning estimation unit 3 estimates the meaning of the data acquired by the acquisition unit 2 (step S11).
  • the meaning of the data obtained in step S11 will be referred to as the meaning of the given data.
  • the meaning of the given data is ⁇ "height", “weight”, “annual income”, “age” ⁇ .
  • the cost initial value setting unit 31 sets the initial cost value of the meaning of the individual data corresponding to the individual nodes belonging to the first set of the directed bipartite graph.
  • Set (step S31) Specifically, the cost initial value setting unit 31 sets the cost of the meaning of the given data ⁇ "height", “weight”, “annual income”, “age” ⁇ to 0, respectively, and the meaning of the remaining data. Set the cost of to infinite.
  • FIG. 16 is a schematic diagram showing the cost set in step S31 together with a directed bipartite graph. FIG. 16 also illustrates the cost of a predetermined conversion rule.
  • step S31 the cost initial value setting unit 31 stores the combination of the meaning of the data and the cost in the cost storage unit 32 for each meaning of the data.
  • step S31 the analysis unit 36 defines each node corresponding to the meaning of the given data as the search start point in the directed bipartite graph (step S12).
  • each node corresponding to "height”, “weight”, “annual income”, and "age” is set as the search start point.
  • the analysis unit 36 determines the cost of the meaning of the data corresponding to the search start point among the nodes corresponding to the conversion rule ID to which one edge is heading from the search start point, and the conversion represented by the conversion rule ID. Only the nodes that satisfy the condition that the sum with the cost of the rule is max_cost or less are specified as the nodes reached from the search start point via one edge (step S32).
  • step S32 when no node reached from the search start point via one edge is specified, information indicating what kind of analysis can be performed on the search route obtained at that time. Is set as, the information is output, and the process is terminated.
  • step S32 the analysis unit 36 performs the processing after step S14.
  • the operation of steps S14 to S19 is the same as the operation of steps S14 to S19 in the second embodiment, and the description thereof will be omitted.
  • the analysis unit 36 determines whether or not all the nodes specified in step S32 have been selected in step S15. Further, in step S15, the analysis unit 36 selects one unselected node from the nodes specified in step S32.
  • the analysis unit 36 sets the cost of the conversion rule represented by the last conversion rule ID on the search route derived in step S18 and all the search start points reaching the node corresponding to the conversion rule ID. It is determined whether or not the condition that the sum with the sum of the meaning costs of the corresponding data is equal to or less than the cost of the meaning of the data corresponding to the search start point newly determined in step S19 is satisfied. If the condition is satisfied, the cost of the meaning of the data corresponding to the newly determined search start point is updated with the above sum value. If that condition is not met, the cost of the meaning of the data corresponding to the newly defined search start point is not updated (step S33).
  • the search route shown in FIG. 17 is derived in step S18.
  • the last conversion rule ID on the search route is "BMI calculation”
  • the cost of the conversion rule "BMI calculation” is "5".
  • all the search start points that reach the node corresponding to the "BMI calculation” are the search start point corresponding to the "height” and the search start point corresponding to the "weight”. Since the cost of "height” and the cost of "weight” are both "0", the sum of them is also "0". Therefore, the sum of the cost “5” of the conversion rule “BMI calculation” and the above sum “0” is “5”.
  • the search start point corresponding to "BMI" is the newly defined search start point.
  • the cost of "BMI” is infinite. Therefore, since the sum "5" is equal to or less than the cost "infinity” of "BMI", the condition in step S33 is satisfied. Therefore, the analysis unit 36 updates the cost of "BMI” from “infinity” to the above sum "5".
  • step S33 If the cost of "BMI” is "4", the condition in step S33 will not be satisfied. In this case, the analysis unit 36 does not update the cost of "BMI” and keeps it at "4".
  • the analysis unit 36 may update the cost of the meaning of the data stored in the cost storage unit 32.
  • step S33 the analysis unit 36 repeats the processes after step S14 (see FIG. 13).
  • steps S20 and S21 are the same as steps S20 and S21 in the second embodiment, and the description thereof will be omitted.
  • the analysis unit 36 determines whether or not a new search route different from the existing search route is derived in step S18 for some of the nodes among all the nodes specified in step S32. judge
  • the length of the obtained search route differs depending on the value of max_cost. That is, in the third embodiment, a search route having a length corresponding to the value of max_cost is obtained. This means, for example, that it is possible to present an analysis that can be done within the budget of the person who has the data.
  • the search route may be branched and a search route having a plurality of end points may be obtained.
  • the meaning of the data may be specified. Then, the analysis unit 26 of the second embodiment and the analysis unit 36 of the third embodiment branch out the search route to obtain a search route having a plurality of end points, and then the designated "data position". You may extract only the search route ending in and output the search route.
  • the analyzer 1 may not be provided with the meaning estimation unit 3.
  • the acquisition unit 2 may directly acquire the meaning of the data possessed by the user. That is, the acquisition unit 2 may directly acquire one or more "meanings of data” from the outside. In this case, the "meaning of data” may be treated as "meaning of given data” in each of the above embodiments.
  • FIG. 18 is a schematic block diagram showing a configuration example of a computer according to the analyzer 1 of each embodiment of the present invention.
  • the computer 1000 includes a CPU 1001, a main storage device 1002, an auxiliary storage device 1003, an interface 1004, and a data reading device 1005 for reading data (table).
  • the analyzer 1 of each embodiment of the present invention is realized by the computer 1000.
  • the operation of the analyzer 1 is stored in the auxiliary storage device 1003 in the form of a program (analysis program).
  • the CPU 1001 reads a program from the auxiliary storage device 1003, expands the program to the main storage device 1002, and executes the process described in each of the above embodiments according to the program.
  • Auxiliary storage 1003 is an example of a non-temporary tangible medium.
  • Other examples of non-temporary tangible media include magnetic disks, optical magnetic disks, CD-ROMs (Compact Disk Read Only Memory), DVD-ROMs (Digital Versatile Disk Read Only Memory), which are connected via interface 1004. Examples include semiconductor memory. Further, when the program is distributed to the computer 1000 by the communication line, even if the distributed computer 1000 expands the program to the main storage device 1002 and executes the process described in each of the above embodiments according to the program. good.
  • each component may be realized by a general-purpose or dedicated circuit (circuitry), a processor, or a combination thereof. These may be composed of a single chip or may be composed of a plurality of chips connected via a bus. A part or all of each component may be realized by the combination of the circuit or the like and the program described above.
  • the plurality of information processing devices and circuits may be centrally arranged or distributed.
  • the information processing device, the circuit, and the like may be realized as a form in which each is connected via a communication network, such as a client-and-server system and a cloud computing system.
  • FIG. 19 is a block diagram showing an example of an outline of the analyzer of the present invention.
  • the analyzer of the present invention includes a conversion rule storage means 75 and an analysis means 76.
  • the conversion rule storage means 75 (for example, the conversion rule storage unit 5) stores a plurality of conversion rules for converting the meaning of one or more data into the meaning of one or more other data.
  • What kind of analysis means 76 uses the meaning of one or more given data and the data having the meaning based on the conversion rule. Derive information that indicates whether analysis can be performed.
  • a graph generation means (for example, graph generation unit 7) that generates a directed bipartite graph including a set of nodes representing the meaning of data and a set of nodes representing the conversion rule ID based on each conversion rule is provided.
  • Prepare, Analytical means 76 (for example, analysis unit 26) After defining each node corresponding to the meaning of one or more given data as the search start point, In the directed bipartite graph, identify the node corresponding to the conversion rule ID that arrives from the search start point via one edge. Each node corresponding to the meaning of the data before conversion in the conversion rule represented by the conversion rule ID corresponding to the specified node is the search start point, and the specified node is reached from all of the search start points.
  • a graph generation means (for example, graph generation unit 7) that generates a directed bipartite graph including a set of nodes representing the meaning of data and a set of nodes representing the conversion rule ID based on each conversion rule.
  • a cost initial value setting means (for example, a cost initial value setting unit 31) for setting an initial cost value for the meaning of individual data in the directed bipartite graph is provided.
  • Analytical means 76 (for example, analysis unit 36) After defining each node corresponding to the meaning of one or more given data as the search start point, In the directed bipartite graph, among the nodes corresponding to the conversion rule ID in which one edge is heading from the search start point, the cost of the meaning of the data corresponding to the search start point and the conversion rule represented by the conversion rule ID. Only the nodes that satisfy the condition that the sum with the cost is equal to or less than the predetermined cost upper limit is specified as the nodes reached from the search start point via one edge. Each node corresponding to the meaning of the data before conversion in the conversion rule represented by the conversion rule ID corresponding to the specified node is the search start point, and the specified node is reached from all of the search start points.
  • a node representing the meaning of the converted data is set as the search start point, and when a predetermined condition is satisfied, the cost of the meaning of the data corresponding to the node is repeatedly updated.
  • the search route derived by the time when a new search route cannot be derived may be defined as the above information.
  • the cost initial value setting means is Set the cost of the meaning of one or more given data to 0, and set the cost of the meaning of the rest of the data to infinity
  • Analytical means 76 (for example, analysis unit 36) The sum of the cost of the conversion rule represented by the last conversion rule ID on the derived search route and the sum of the meaning costs of each data corresponding to all search start points reaching the node corresponding to the conversion rule ID. However, if it is equal to or less than the cost of the meaning of the converted data in the conversion rule, the cost of the meaning of the data may be updated by the above sum.
  • the analysis means 76 (for example, the analysis unit 6) Extract a conversion rule that satisfies the condition that the meaning of the data before conversion is included in the meaning of one or more given data.
  • the union of the meaning of the converted data in each extracted conversion rule and the meaning of one or more given data is obtained, and the union is regarded as the meaning of one or more given data repeatedly.
  • the set of the extracted conversion rules may be defined as the above information.
  • a meaning estimation means for example, a meaning estimation unit 3 for estimating the meaning of the data.
  • the present invention is suitably applicable to an analyzer that analyzes what kind of analysis can be performed using data having the meaning given the meaning of the data.

Abstract

変換ルール記憶手段75は、1つ以上のデータの意味を、1つ以上の別のデータの意味に変換する変換ルールを複数個記憶する。分析手段76は、与えられた1つ以上のデータの意味と、変換ルールとに基づいて、その意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する。

Description

分析装置、分析方法および分析プログラム
 本発明は、データの意味が与えられた場合に、その意味を持つデータを用いてどのような分析を行えるのかを分析する分析装置、分析方法および分析プログラムに関する。
 特許文献1には、シーケンス分析と決定木分析を組み合わせて、精度の高い潜在ターゲットを導出できる装置が記載されている。特許文献1に記載された装置は、時系列データを入力し、また、特定属性データ出現集合特有のルールを入力する。そして、その装置は、特定属性データ出現傾向と正の相関があるルールと同一の時系列的推移を持つデータの加工、および、特定属性データ非出現傾向と負の相関があるルールと同一の時系列的推移を持つデータの加工を行う。
 また、特許文献2には、データを格納したテーブルが入力された場合に、そのテーブルのカラム毎に、カラムに格納されたデータの意味を推定する技術が記載されている。ここで、「データの意味」とは、そのデータが表す概念である。各カラムにはカラム名が付与されている。しかし、一般に、カラム名は、人間によって決定されるので、カラム名には表記ゆれが生じる。例えば、人物の性別を格納したカラムのカラム名として、「種別」、「男女」等の種々のカラム名が付与され得る。前述のように、「データの意味」とは、そのデータが表す概念であり、カラム名とは区別される。上記の例では、「性別」がデータの意味に該当する。
特開2005-70913号公報 国際公開第2018/025706号
 一般に、多くのデータを持つ者がいる。このような者の例として、例えば、種々の店舗等が挙げられる。ただし、このような者は、店舗に限定されない。
 このように多くのデータを持つ者は、データを持つ一方で、そのデータを用いてどのような分析を行えるかを分かっていないことが多い。
 そこで、本発明は、所持されているデータを用いてどのような分析を行えるかを示す情報を導出することができる分析装置、分析方法および分析プログラムを提供することを目的とする。
 本発明による分析装置は、1つ以上のデータの意味を、1つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段と、与えられた1つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する分析手段とを備える。
 本発明による分析方法は、1つ以上のデータの意味を、1つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段を備えるコンピュータが、与えられた1つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する。
 本発明による記録媒体は、1つ以上のデータの意味を、1つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段を備えるコンピュータに、与えられた1つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する分析処理を実行させるための分析プログラムを記録したコンピュータ読み取り可能な記録媒体である。
 本発明によれば、所持されているデータを用いてどのような分析を行えるかを示す情報を導出することができる。
本発明の第1の実施形態の分析装置の例を示すブロック図である。 変換ルールの例を示す模式図である。 第1の実施形態の処理経過の例を示すフローチャートである。 本発明の第2の実施形態の分析装置の例を示すブロック図である。 変換ルールの例を示す模式図である。 図5に示す各変換ルールに基づいて生成された有向2部グラフの例を示す説明図である。 第2の実施形態の処理経過の例を示すフローチャートである。 第2の実施形態の処理経過の例を示すフローチャートである。 第2の実施形態の処理経過の例を示すフローチャートである。 ステップS18で導出される探索ルートの例を示す模式図である。 最終的に得られる探索ルートの例を示す模式図である。 本発明の第3の実施形態の分析装置の例を示すブロック図である。 第3の実施形態の処理経過の例を示すフローチャートである。 第3の実施形態の処理経過の例を示すフローチャートである。 第3の実施形態の処理経過の例を示すフローチャートである。 ステップS31で設定されたコストを有向2部グラフとともに示した模式図である。 ステップS18で導出される探索ルートの例を示す模式図である。 本発明の各実施形態の分析装置に係るコンピュータの構成例を示す概略ブロック図である。 本発明の分析装置の概要の例を示すブロック図である。
 以下、本発明の実施形態を図面を参照して説明する。
 図1は、本発明の第1の実施形態の分析装置の例を示すブロック図である。本実施形態の分析装置1は、取得部2と、意味推定部3と、意味記憶部4と、変換ルール記憶部5と、分析部6とを備える。
 取得部2は、多くのデータを持つ者によって所持されているデータを取得する。本実施形態では、説明を簡単にするために、取得部2が、データを格納したテーブルを取得する場合を例にして説明する。テーブルは、1つ以上のカラムを含み、各カラムにデータが格納されている。
 なお、データを持つ者によって所持されているデータには、その者が他者から購入したデータが含まれていてもよい。
 取得部2は、例えば、光学ディスク等のデータ記録媒体に記録されたテーブルを読み込むデータ読み込み装置によって実現されてもよいが、取得部2は、そのようなデータ読み込み装置に限定されない。例えば、取得部2は、通信ネットワークを介して配信されるテーブルを受信する通信インタフェースによって実現されてもよい。
 意味推定部3は、取得部2が取得した種々のデータ群毎に、データの意味を推定する。本実施形態では、意味推定部3が、取得部2が取得したテーブルのカラム毎に、カラムに格納されたデータの意味を推定する場合を例にして説明する。意味推定部3によって推定されるデータの意味の数は1つ以上である。取得部2がデータの意味を推定する方法は、公知の方法でよい。例えば、意味推定部3は、特許文献2に記載された方法で、カラム毎に、カラムに格納されたデータの意味を推定してもよい。意味推定部3によって推定された種々のデータの意味は、データを持つ者から与えられた「データの意味」であると言うことができる。
 意味推定部3は、推定によって得た種々の「データの意味」を、意味記憶部4に記憶させる。例えば、意味推定部3が、推定によって、データの意味として、「身長」、「体重」、「年収」、「年齢」等を得た場合、それらのデータの意味を、意味記憶部4に記憶させる。
 意味記憶部4は、データの意味を記憶する記憶装置である。
 変換ルール記憶部5は、複数の変換ルールを記憶する記憶装置である。「変換ルール」とは、1つ以上のデータの意味を、1つ以上の別のデータの意味に変換するルールである。ここで、「1つ以上のデータの意味を、1つ以上の別のデータの意味に変換する」とは、「ある意味を持つデータに基づいて、別の意味を持つデータを計算したり、推定したりすることができる」ということを表している。また、個々の変換ルールにはそれぞれ、変換ルールID(変換ルールの識別情報)が予め定められている。
 図2は、変換ルールの例を示す模式図である。図2では、3つの変換ルールを示している。例えば、図2に示す1番目の変換ルールは、「身長」というデータの意味、および、「体重」というデータの意味を、「BMI(Body Mass Index )」というデータの意味に変換することを表している。このことは、「身長」という意味を持つデータ、および、「体重」という意味を持つデータに基づいて、「BMI」という意味を持つデータを計算できることを表している。また、この変換ルールには、「BMI計算」という変換ルールIDが定められている。
 図2に示す1番目の変換ルールでは、「身長」および「体重」が変換前の「データの意味」に該当し、「BMI」が変換後の「データの意味」に該当する。図2に示すように矢印を用いて模式的に変換ルールを表した場合、図2に示す例では、矢印の左辺に変換前の「データの意味」が示され、矢印の右辺に変換後の「データの意味」が示されている。そのため、便宜的に、変換前のデータの意味を、左辺のデータの意味と称し、変換後のデータの意味を右辺のデータの意味と称する場合がある。
 図2では、各変換ルールにおいて、左辺のデータの意味(変換前のデータの意味)が複数存在する場合を示したが、変換ルールにおいて、左辺のデータの意味の数が1つであってもよい。また、図2では、各変換ルールにおいて、右辺のデータの意味(変換後のデータの意味)の数が1つである場合を示したが、変換ルールにおいて、右辺のデータの意味が複数存在していてもよい。右辺のデータの意味が複数存在するということは、左辺のデータの意味に基づいて、複数種類のデータが得られることを意味している。
 また、以下の説明において、変換ルールIDを“r ”と表した場合に、左辺に該当する全てのデータの意味を、“r.input_semantics ”と表す場合がある。同様に、右辺に該当する全てのデータの意味を、“r.output_semantics”と表す場合がある。例えば、図2に示す1番目の変換ルールでは、“BMI計算.input_semantics”は、{「身長」、「体重」}であり、“BMI計算.output_semantics ”は、{「BMI」}である。
 各変換ルールは、例えば、分析処理のサービスを提供する者や、データを販売する者等によって提供され、予め変換ルール記憶部5に記憶される。
 分析部6は、意味推定部3によって得られたデータの意味と、各変換ルールとに基づいて、その意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する。本実施形態では、分析部6は、この情報として、意味推定部3によって得られたデータの意味を起点にして再帰的に抽出した変換ルールの集合を導出する。
 前述のように、意味推定部3によって推定された種々のデータの意味は、データを持つ者から与えられた「データの意味」であると言うことができる。そのため、以下、意味推定部3によって推定されたデータの意味を、与えられたデータの意味と記す場合がある。
 分析部6は、左辺のデータの意味(変換前のデータの意味)が、与えられたデータの意味に包含されているという条件を満たす変換ルールを抽出する。そして、分析部6は、抽出した各変換ルールにおける右辺のデータの意味(変換後のデータの意味)と、与えられたデータの意味との和集合を求め、その和集合を、与えられたデータの意味とみなす。分析部6は、この動作を繰り返す。
 そして、分析部6は、新たに抽出した変換ルールと、前回抽出した変換ルールとが同一になったならば、その新たに抽出した変換ルールの集合を、どのような分析を行えるかを示す情報として定める。
 意味推定部3および分析部6は、例えば、分析プログラムに従って動作するコンピュータのCPU(Central Processing Unit )によって実現される。例えば、CPUが、コンピュータのプログラム記憶装置等のプログラム記録媒体から分析プログラムを読み込み、その分析プログラムに従って、意味推定部3および分析部6として動作すればよい。
 意味記憶部4および変換ルール記憶部5は、例えば、コンピュータが備える記憶装置によって実現される。
 次に、第1の実施形態の処理経過について説明する。図3は、第1の実施形態の処理経過の例を示すフローチャートである。なお、取得部2がデータ(テーブル)を取得しているものとする。また、説明を簡単にするために、変換ルール記憶部5が、図2に示す3つの変換ルールを記憶しているものとする。また、既に説明した事項については、詳細な説明を省略する。
 まず、意味推定部3が、取得部2が取得したデータの意味を推定する(ステップS1)。意味推定部3は、テーブルのカラム毎に、カラムに格納されたデータの意味を推定する。ステップS1では、1つ以上のデータの意味が得られる。本例では、データの意味として、「身長」、「体重」、「年収」、「年齢」が得られたものとする。以下、ステップS1で得られたデータの意味を、与えられたデータの意味と記す。意味推定部3は、与えられたデータの意味(「身長」、「体重」、「年収」、「年齢」)を、意味記憶部4に記憶させる。
 ステップS1の後に、分析部6は、左辺のデータの意味(変換前のデータの意味)が、与えられたデータの意味に包含されているという条件を満たす変換ルールを全て抽出する(ステップS2)。本例では、与えられたデータの意味は、{「身長」、「体重」、「年収」、「年齢」}である。また、図2に示す変換ルール「BMI計算」の左辺のデータの意味は、{「身長」、「体重」}である。従って、変換ルール「BMI計算」の左辺のデータの意味は、与えられたデータの意味に包含されている。従って、変換ルール「BMI計算」は、上記の条件を満たしているので、分析部6は、変換ルール「BMI計算」を抽出する。
 また、図2に示す変換ルール「年齢推定」に関しては、「性別」が、与えられたデータの意味に包含されていない。同様に、変換ルール「癌リスク予測」に関しては、「BMI」が、与えられたデータの意味に包含されていない。よって、変換ルール「年齢推定」および変換ルール「癌リスク予測」は、抽出されない。
 ステップS2の次に、分析部6は、直近のステップS2で抽出した変換ルールと、前回のステップS2で抽出した変換ルールとが同一であるか否かを判定する(ステップS3)。両者が同一でない場合(ステップS3のNo)、ステップS4に移行する。両者が同一である場合(ステップS3のYes)、ステップS5に移行する。最初にステップS3に移行した時点では、ステップS2は1回しか実行されていないため、ステップS4に移行する。従って、ここでは、ステップS4に移行する。
 ステップS4において、分析部6は、抽出した各変換ルールの右辺のデータの意味(変換後のデータの意味)と、与えられたデータの意味との和集合を求め、その和集合を、与えられたデータの意味とみなす。そして、分析部6は、与えられたデータの意味を、意味記憶部4に記憶させる。
 本例では、抽出した変換ルール「BMI計算」の右辺のデータの意味は、{「BMI」}である。従って、分析部6は、{「BMI」}と、与えられたデータの意味{「身長」、「体重」、「年収」、「年齢」}との和集合として、{「身長」、「体重」、「年収」、「年齢」、「BMI」}を求める。そして、分析部6は、その和集合{「身長」、「体重」、「年収」、「年齢」、「BMI」}を、与えられたデータの意味とみなす。さらに、分析部6は、{「身長」、「体重」、「年収」、「年齢」、「BMI」}を意味記憶部4に記憶させる。
 ステップS4の後、分析部6は、ステップS2以降の処理を繰り返す。2回目のステップS2において、与えられたデータの意味は、{「身長」、「体重」、「年収」、「年齢」、「BMI」}となっている。従って、このとき、分析部6は、変換ルール「BMI計算」、および、変換ルール「癌リスク予測」を抽出する(図2参照)。
 次に、分析部6は、再度、ステップS3を実行する。このとき、直近のステップS2で抽出した変換ルールは、変換ルール「BMI計算」、および、変換ルール「癌リスク予測」である。また、前回のステップS2で抽出した変換ルールは、変換ルール「BMI計算」のみである。従って、両者は同一ではないので(ステップS3のNo)、ステップS4に移行する。
 直近のステップS2で、抽出した2つの変換ルールの右辺の意味は、それぞれ、「BMI」、「癌リスク」である。従って、ステップS4において、分析部6は、{「BMI」、「癌リスク」}と、与えられたデータの意味{「身長」、「体重」、「年収」、「年齢」、「BMI」}の和集合として、{「身長」、「体重」、「年収」、「年齢」、「BMI」、「癌リスク」}を求める。そして、分析部6は、その和集合{「身長」、「体重」、「年収」、「年齢」、「BMI」、「癌リスク」}を、与えられたデータの意味とみなす(ステップS4)。さらに、分析部6は、{「身長」、「体重」、「年収」、「年齢」、「BMI」、「癌リスク」}を意味記憶部4に記憶させる。
 ステップS4の後、分析部6は、3回目のステップS2を実行する。このとき、与えられたデータの意味は、{「身長」、「体重」、「年収」、「年齢」、「BMI」、「癌リスク」}となっている。従って、このとき、分析部6は、変換ルール「BMI計算」、および、変換ルール「癌リスク予測」を抽出する(図2参照)。
 次に、分析部6は、再度、ステップS3を実行する。このとき、直近のステップS2で抽出した変換ルールは、変換ルール「BMI計算」、および、変換ルール「癌リスク予測」である。また、前回のステップS2で抽出した変換ルールも、変換ルール「BMI計算」、および、変換ルール「癌リスク予測」である。従って、両者は同一であるので(ステップS3のYes)、ステップS5に移行する。
 ステップS5において、分析部6は、直近のステップS2で抽出した変換ルールの集合を、どのような分析を行えるかを示す情報として定め、その情報を出力する(ステップS5)。本例では、分析部6は、変換ルール「BMI計算」、および、変換ルール「癌リスク予測」からなる変換ルールの集合を、どのような分析を行えるかを示す情報として定める。
 また、ステップS5では、分析部6は、例えば、分析装置1に設けられたディスプレイ装置(図示略)に、情報を表示させてもよい。ただし、表示は、出力態様の一例であり、分析部6は、他の態様で情報を出力してもよい。この点は、後述の他の実施形態でも同様である。
 第1の実施形態では、分析部6が、ステップS2で、左辺のデータの意味が、与えられたデータの意味に包含されているという条件を満たす変換ルールを全て抽出する。すなわち、ステップS2で抽出される変換ルールは、与えられた意味を持つデータを用いて行える分析を表しているということができる。さらに、第1の実施形態では、ステップS4で和集合を求め、その和集合を、与えられたデータの意味とみなすことによって、与えられたデータの意味の数を増加させる。この結果、ステップS2~S4の繰り返し処理において、繰り返し回数が増えるほど、ステップS2で抽出される変換ルールも増加する。ステップS2で抽出される変換ルールが変化しなくなるまで、分析部6は、ステップS2~S4の繰り返し処理を実行するので、与えられた意味を持つデータを用いて行える分析を表す変換ルールをできるだけ多く抽出することができる。従って、本実施形態によれば、ユーザに所持されているデータを用いてどのような分析を行えるかを提示することができる。
実施形態2.
 図4は、本発明の第2の実施形態の分析装置の例を示すブロック図である。本実施形態の分析装置1は、取得部2と、意味推定部3と、意味記憶部4と、変換ルール記憶部5と、グラフ生成部7と、グラフ記憶部8と、分析部26とを備える。
 第2の実施形態における取得部2、意味推定部3、意味記憶部4および変換ルール記憶部5は、第1の実施形態における取得部2、意味推定部3、意味記憶部4および変換ルール記憶部5と同様であり、説明を省略する。
 グラフ生成部7は、予め変換ルール記憶部5に記憶されている各変換ルールに基づいて、データの意味を表すノードの集合と、変換ルールIDを表すノードの集合とを含む有向2部グラフを生成する。第2の実施形態では、変換ルール記憶部5が、図5に例示する6個の変換ルールを記憶している場合を例にして説明する。また、図6は、図5に示す各変換ルールに基づいて生成された有向2部グラフの例を示す説明図である。
 グラフ生成部7が有向2部グラフを生成する動作の例を以下に示す。ただし、グラフ生成部7は、有向2部グラフを他の方法で生成してもよい。
 グラフ生成部7は、変換ルール記憶部5に記憶されている各変換ルールのうち、未選択の変換ルールを1つ選択する。グラフ生成部7は、選択した変換ルールの左辺のデータの意味を表すノード、および、右辺のデータの意味を表すノードを生成し、それらのノードを第1のノードの集合に含める。また、グラフ生成部7は、選択した変換ルールの変換ルールIDを表すノードを生成し、第2のノードの集合に含める。第1のノードの集合は、データの意味に対応するノードの集合であり、第2のノードの集合は、変換ルールIDに対応するノードの集合である。そして、グラフ生成部7は、選択した変換ルールの左辺のデータの意味に対応する各ノードそれぞれから、選択した変換ルールの変換ルールIDに対応するノードに向かうエッジを生成する。さらに、グラフ生成部7は、選択した変換ルールの変換ルールIDに対応するノードから、選択した変換ルールの右辺のデータの意味に対応する各ノードそれぞれに向かうエッジを生成する。
 例えば、図5に示す変換ルール「BMI計算」が選択されたとする。この場合、グラフ生成部7は、「身長」に対応するノード、「体重」に対応するノード、および「BMI」に対応するノードを生成し、それらのノードを第1の集合に含める。また、グラフ生成部7は、「BMI計算」に対応するノードを生成し、第2の集合に含める。そして、グラフ生成部7は、「身長」に対応するノード、および、「体重」に対応するノードそれぞれから、「BMI計算」に対応するノードに向かうエッジを生成する。さらに、グラフ生成部7は、「BMI計算」に対応するノードから、「BMI」に対応するノードに向かうエッジを生成する。
 グラフ生成部7は、未選択の変換ルールが無くなるまで、変換ルールを1つずつ選択し、上記の処理を実行する。ただし、新たに生成しようとするデータの意味に対応するノードが、既に生成されている場合には、グラフ生成部7は、そのノードを重複して生成しなくてもよい。例えば、変換ルール「BMI計算」を選択した後に、変換ルール「癌リスク予測」を選択して上記の処理を実行する場合を考える。変換ルール「癌リスク予測」を選択する場合、グラフ生成部7は、データの意味に対応するノードとして、「BMI」に対応するノード、「年齢」に対応するノード、および、「癌リスク」に対応するノードを生成することになるが、「BMI」に対応するノードは、既に生成済みである。従って、この場合、グラフ生成部7は、「BMI」に対応するノードを重複して生成しなくてよい。
 このようにして生成された有向2部グラフの例を図6に示す。図6では、データの意味に対応するノードから変換ルールIDに対応するノードに向かうエッジを実線で示している。また、変換ルールIDに対応するノードからデータの意味に対応するノードに向かうエッジを破線で示している。換言すれば、第1の集合内のノードから第2の集合内のノードに向かうエッジを実線で示し、第2の集合内のノードから第1の集合内のノードに向かうエッジを破線で示している。
 グラフ生成部7は、生成した有向2部グラフをグラフ記憶部8に記憶させる。グラフ記憶部8は、生成された有向2部グラフを記憶する記憶装置である。
 分析部26は、与えられたデータの意味に対応する各ノードをそれぞれ探索開始点と定める。
 その後、分析部26は、以下の処理を繰り返す。
 分析部26は、有向2部グラフにおいて、探索開始点から1つのエッジを介して到達する変換ルールIDに対応するノードを特定する。
 そして、分析部26は、特定されたノードに対応する変換ルールIDが表す変換ルールの左辺の「データの意味」に対応する各ノードが全て探索開始点であり、特定されたノードがそれらの探索開始点の全てから到達されている場合に、それらの探索開始点から、その変換ルールの右辺のデータの意味を表すノードまでの探索ルートを導出する。
 そして、分析部26は、上述の右辺のデータの意味を表すノードを探索開始点として定める。
 分析部26は、新たな探索ルートを導出できなくなった時点までに導出された探索ルートを、どのような分析を行えるかを示す情報として定める。
 グラフ生成部7および分析部26は、例えば、例えば、分析プログラムに従って動作するコンピュータのCPUによって実現される。また、グラフ記憶部8は、例えば、コンピュータが備える記憶装置によって実現される。
 次に、第2の実施形態の処理経過について説明する。図7、図8および図9は、第2の実施形態の処理経過の例を示すフローチャートである。ただし、既に説明した事項については、詳細な説明を省略する。
 なお、変換ルール記憶部5は、予め図5に例示する各変換ルールを記憶しているものとする。また、グラフ生成部7は、その各変換ルールに基づいて、図6に例示する有向2部グラフを既に生成しており、その有向2部グラフをグラフ記憶部8に記憶させているものとする。また、取得部2がデータ(テーブル)を取得しているものとする。
 まず、意味推定部3が、取得部2が取得したデータの意味を推定する(ステップS11)。意味推定部3は、テーブルのカラム毎に、カラムに格納されたデータの意味を推定する。ステップS11では、1つ以上のデータの意味が得られる。以下、ステップS11で得られたデータの意味を、与えられたデータの意味と記す。本例では、与えられたデータの意味が、{「身長」、「体重」、「年収」、「年齢」}であるものとする。
 次に、分析部26は、予め生成されている有向2部グラフにおいて、与えられたデータの意味に対応する各ノードをそれぞれ探索開始点と定める(ステップS12)。このノードは、有向2部グラフの第1の集合に属している。また、分析部26は、探索開始点に対応するデータの意味を、意味記憶部4に記憶させる。探索開始点の数は1つとは限らない。
 本例では、「身長」、「体重」、「年収」、「年齢」に対応するそれぞれのノードを、探索開始点とする。
 次に、分析部26は、有向2部グラフにおいて、各探索開始点からエッジが向かっている第2の集合内のノードを特定する(ステップS13)。ステップS13で特定されるノードの数は、1つとは限らない。また、ステップS13で特定されたノードは、探索開始点から1つのエッジを介して到達するノードであると言える。
 本例では、「身長」、「体重」、「年収」、「年齢」に対応するそれぞれのノードが探索開始点であるので、ステップS13では、「BMI計算」、「年齢推定」、「癌リスク予測」、「年収推定」、「保険金算出」に対応するノードが特定される。
 次に、分析部26は、ステップS13で特定されたノードが全てステップS15で選択済みであるか否かを判定する(ステップS14)。
 ステップS13で特定されたノードのうち、ステップS15で選択されていないノードが残っているならば(ステップS14のNo)、ステップS15に移行する。
 ステップS15において、分析部26は、ステップS13で特定されたノードのうち、未選択のノードを1つ選択する。
 次に、分析部26は、ステップS15で選択されたノードに対応する変換ルールIDを持つ変換ルールに、そのノードに到達する各探索開始点それぞれに対応するデータの意味を付加する(ステップS16)。変換ルールIDを“r ”と表した場合に、その変換ルールIDに対応するノードに到達する探索開始点におけるデータの意味を、“r.visited_semantics ”と表すこととする。選択されたノードに対応する変換ルールIDを“r ”とすると、ステップS16で、分析部26は、“r.visited_semantics ”に、具体的なデータの意味を付加する。
 ステップS16の次に、分析部26は、ステップS15で選択されたノードに対応する変換ルールIDを持つ変換ルールの左辺の「データの意味」と、ステップS16でその変換ルールに付加された「データの意味」の集合とが合致するか否かを判定する(ステップS17)。選択されたノードに対応する変換ルールIDを“r ”とすると、ステップS17で、分析部26は、“r.input_semantics ”と、“r.visited_semantics ”に付加された「データの意味」の集合とが合致しているか否かを判定すればよい。
 ステップS17で合致すると判定されたということは(ステップS17のYes)、選択されたノードに対応する変換ルールIDを持つ変換ルールにおける変換前の「データの意味」に対応する各ノードが全て探索開始点であり、選択されたノードが、その探索開始点の全てから到達されていることを意味する。
 ステップS17で合致しないと判定された場合(ステップS17のNo)、分析部26は、ステップS14(図7参照)以降の処理を繰り返す。
 ステップS17で合致すると判定された場合(ステップS17のYes)、分析部26は、ステップS15で選択されたノードに対応する変換ルールIDを持つ変換ルールの左辺のデータの意味を表す各探索開始点から、選択されたノードを経由して、その変換ルールの右辺のデータの意味を表すノードに行き着くまでの探索ルートを、新たな探索ルートとして導出する。そして、分析部26は、その探索ルートをグラフ記憶部8に記憶させる(ステップS18)。ただし、既に導出済みの探索ルートと同じ探索ルートについては、分析部26は、重複してグラフ記憶部8に記憶させなくてよい。
 図10は、ステップS18で導出される探索ルートの例を示す模式図である。
 ステップS18の次に、分析部26は、ステップS18で導出された探索ルートの終点に該当するノードを、探索開始点として定める(ステップS19)。すなわち、ステップS19において、既存の探索開始点に、新たな探索開始点が追加されることになる。例えば、ステップS18で図10に例示する探索ルートを導出した場合、分析部26は、その探索ルートの終点に該当する、「BMI」というデータの意味を表すノードを、新たな探索開始点として、既存の探索開始点に追加する。分析部26は、ステップS19で定めた探索開始点(換言すれば、新たに追加された探索開始点)に対応するデータの意味を、意味記憶部4に記憶させる。
 ステップS19の後、分析部26は、ステップS14(図7参照)以降の処理を繰り返す。
 ステップS14に移行し、ステップS13で特定されたノードが全てステップS15で選択済みであると判定した場合(ステップS14のYes)、ステップ20(図9参照)に移行する。
 ステップS20において、分析部26は、ステップS13で特定された全てのノードのうちの一部のノードに関して、ステップS18で既存の探索ルートとは異なる新たな探索ルートが導出されたか否かを判定する(ステップS20)。
 ステップS13で特定された全てのノードのうちの一部のノードに関して、ステップS18で新たな探索ルートが導出されていたならば(ステップS20のYes)、分析部26は、ステップS13(図7参照)以降の処理を繰り返す。
 ステップS13で特定されたいずれのノードに関しても、ステップS18で新たな探索ルートが導出されていないならば(ステップS20のNo)、分析部26は、その時点で得られている探索ルートを、どのような分析を行えるかを示す情報として定め、その情報を出力する(ステップS21)。ステップS21で処理を終了する。
 図11は、本例で最終的に得られる探索ルートの例を示す模式図である。
 第2の実施形態によれば、図11に示すように、与えられたデータの意味に対応するノードに基づく探索ルートが得られる。そして、その探索ルート上には、変換ルールIDに対応するノードが含まれている。従って、第1の実施形態と同様に、ユーザに所持されているデータを用いてどのような分析を行えるかを提示することができる。さらに、第2の実施形態では、どのような分析を行えるかを示す情報が、探索ルートの形式で導出されるので、どのような分析を行えるかだけでなく、どのような手順で分析を行うかという分析手順も提示することができる。例えば、図11に例示する探索ルートが提示された場合、ユーザは、BMI計算を行い、その後、癌リスク予測を行うことによって、「癌リスク」が得られるということを理解できる。
 なお、図11では、終点が「癌リスク」のみであるような探索ルートを示しているが、探索ルートが枝分かれしていき、終点が複数存在する探索ルートが得られてもよい。そのような探索ルートは、複数種類の分析を行うことができるということを表し、また、それらの分析毎に得られるデータの意味を表している。この点は、後述の第3の実施形態でも同様である。
実施形態3.
 図12は、本発明の第3の実施形態の分析装置の例を示すブロック図である。本実施形態の分析装置1は、取得部2と、意味推定部3と、意味記憶部4と、変換ルール記憶部5と、グラフ生成部7と、グラフ記憶部8と、コスト初期値設定部31と、コスト記憶部32と、分析部36とを備える。
 第3の実施形態では、有向2部グラフの第1の集合に属する個々のノードに対応する個々の「データの意味」にコストが設定される。また、各変換ルールにも予めコストが定められている。また、データを与えるユーザ(データを持つ者)には、コスト上限(以下、max_costと記す。)が予め定められている。max_coxtは、利用可能な変換ルール(換言すれば、利用可能な分析処理)に対する予算の上限を表していると言うことができる。また、max_costは、所定のコスト上限値と称することもできる。
 以下、「データの意味」を“si”と表し、そのデータの意味のコストを“si.cost ”と表す場合がある。また、ある変換ルールの変換ルールIDを“r ”と表し、その変換ルールのコストを“r.cost”と表す場合がある。
 第3の実施形態における取得部2、意味推定部3、意味記憶部4および変換ルール記憶部5は、第1の実施形態や第2の実施形態における取得部2、意味推定部3、意味記憶部4および変換ルール記憶部5と同様であり、説明を省略する。ただし、本実施形態では、変換ルール記憶部5に記憶されている個々の変換ルールには、予め個別にコストが定められている。
 また、第3の実施形態におけるグラフ生成部7およびグラフ記憶部8は、第2の実施形態におけるグラフ生成部7およびグラフ記憶部8と同様であり、説明を省略する。
 コスト初期値設定部31は、有向2部グラフの第1の集合に属する個々のノードに対応する個々のデータの意味に対して、コストの初期値を設定する。このとき、コスト初期値設定部31は、与えられたデータの意味(換言すれば、意味推定部3によって推定されたデータの意味)のコストをそれぞれ“0”に設定し、残りのデータの意味のコストを無限大に設定する。
 コスト記憶部32は、データの意味毎に、データの意味とコストとの組み合わせを記憶する記憶装置である。
 分析部36は、データの意味のコスト、各変換ルールに予め定められたコスト、および、max_costに基づいて、探索開始点からの探索ルートを導出する。
 具体的には、分析部36は、与えられたデータの意味に対応する各ノードをそれぞれ探索開始点と定める。
 その後、分析部36は、以下の処理を繰り返す。
 分析部36は、有向2部グラフにおいて、探索開始点から1つのエッジが向かっている変換ルールIDに対応する各ノードのうち、その探索開始点に対応するデータの意味のコストと、変換ルールIDが表す変換ルールのコストとの和が、max_cost以下であるという条件を満たしているノードのみを、その探索開始点から1つのエッジを介して到達されるノードとして特定する。従って、第3の実施形態では、探索開始点に対応するデータの意味のコスト(si.cost )と、変換ルールのコスト(r.cost)との和がmax_cost以下であるという条件を満たしている場合にのみ、その変換ルールの変換ルールIDに対応するノードが、その探索開始点から1つのエッジを介して到達されるノードとして特定される。
 そして、分析部36は、特定されたノードに対応する変換ルールIDが表す変換ルールの左辺の「データの意味」に対応する各ノードが全て探索開始点であり、特定されたノードがそれらの探索開始点の全てから到達されている場合に、それらの探索開始点から、その変換ルールの右辺のデータの意味を表すノードまでの探索ルートを導出する。
 そして、分析部36は、上述の右辺のデータの意味を表すノードを探索開始点として定める。このとき、分析部36は、所定の条件が満たされている場合に、その探索開始点に対応するデータの意味のコストを更新する。所定の条件とは、導出された探索ルート上の最後の変換ルールIDが表す変換ルールのコストと、その変換ルールIDに対応するノードに到達する全ての探索開始点に対応する各データの意味のコストの総和との和が、新たに定められた探索開始点に対応するデータの意味のコスト以下であるという条件である。この条件が満たされている場合、分析部36は、新たに定められた探索開始点に対応するデータの意味のコストを、上記の和の値で更新する。また、この条件が満たされていない場合、分析部36は、新たに定められた探索開始点に対応するデータの意味のコストを更新しない。
 分析部36は、新たな探索ルートを導出できなくなった時点までに導出された探索ルートを、どのような分析を行えるかを示す情報として定める。
 コスト初期値設定部31および分析部36は、例えば、分析プログラムに従って動作するコンピュータのCPUによって実現される。また、コスト記憶部32は、例えば、コンピュータが備える記憶装置によって実現される。
 次に、第3の実施形態の処理経過について説明する。図13、図14および図15は、第3の実施形態の処理経過の例を示すフローチャートである。ただし、既に説明した事項については、詳細な説明を省略する。また、第2の実施形態と同様の処理についても、図7、図8および図9と同一のステップ番号を付し、詳細な説明を省略する。
 なお、変換ルール記憶部5は、図5に例示する各変換ルールを予め記憶しているものとする。ただし、変換ルール「BMI計算」、「年齢推定」、「癌リスク予測」、「年収推定」、「保険金算出」および「性別判定」にはそれぞれ、コストとして、“5”,“10”,“20”,“20”,“12”および“9”が予め定められているものとする。また、max_costの値も予め定められているものとする。
 また、グラフ生成部7は、その各変換ルールに基づいて、図6に例示する有向2部グラフを既に生成しており、その有向2部グラフをグラフ記憶部8に記憶させているものとする。また、取得部2がデータ(テーブル)を取得しているものとする。
 まず、意味推定部3が、取得部2が取得したデータの意味を推定する(ステップS11)。以下、ステップS11で得られたデータの意味を、与えられたデータの意味と記す。本例では、与えられたデータの意味が、{「身長」、「体重」、「年収」、「年齢」}であるものとする。
 第3の実施形態では、ステップS11の次に、コスト初期値設定部31が、有向2部グラフの第1の集合に属する個々のノードに対応する個々のデータの意味のコストの初期値を設定する(ステップS31)。具体的には、コスト初期値設定部31は、与えられたデータの意味{「身長」、「体重」、「年収」、「年齢」}のコストをそれぞれ0に設定し、残りのデータの意味のコストを無限大に設定する。図16は、ステップS31で設定されたコストを有向2部グラフとともに示した模式図である。図16では、予め定められている変換ルールのコストも図示している。
 なお、ステップS31において、コスト初期値設定部31は、データの意味毎に、データの意味とコストとの組み合わせをコスト記憶部32に記憶させる。
 ステップS31の次に、分析部36は、有向2部グラフにおいて、与えられたデータの意味に対応する各ノードをそれぞれ探索開始点と定める(ステップS12)。本例では、「身長」、「体重」、「年収」、「年齢」に対応するそれぞれのノードを、探索開始点とする。
 次に、分析部36は、探索開始点から1つのエッジが向かっている変換ルールIDに対応する各ノードのうち、その探索開始点に対応するデータの意味のコストと、変換ルールIDが表す変換ルールのコストとの和が、max_cost以下であるという条件を満たしているノードのみを、その探索開始点から1つのエッジを介して到達されるノードとして特定する(ステップS32)。
 例えば、「身長」と「BMI計算」とに着目して説明する。「身長」に対応するノードは探索開始点である。また、「身長」のコストは“0”であり、変換ルール「BMI計算」のコストは“5”である(図16参照)。換言すれば。“身長.cost =0”、“BMI計算.cost =5”である。従って、「“身長.cost”+“BMI計算.cost”」の値がmax_cost以下であるならば、「BMI計算」に対応するノードは、「身長」に対応する探索開始点から1つのエッジを介して到達されるノードとして特定される。一方、「“身長.cost”+“BMI計算.cost”」の値がmax_costよりも大きいならば、「BMI計算」に対応するノードは、「身長」に対応する探索開始点から1つのエッジを介して到達されるノードとして特定されない。
 また、ステップS32において、探索開始点から1つのエッジを介して到達されるノードが1つも特定されない場合には、その時点で得られている探索ルートを、どのような分析を行えるかを示す情報として定め、その情報を出力し、処理を終了する。
 ステップS32の次に、分析部36は、ステップS14以降の処理を行う。ステップS14~S19の動作は、第2の実施形態におけるステップS14~S19の動作と同様であり、説明を省略する。ただし、分析部36は、ステップ14において、ステップS32で特定されたノードが全てステップS15で選択済みであるか否かを判定する。また、分析部36は、ステップS15において、ステップS32で特定されたノードのうち、未選択のノードを1つ選択する。
 ステップS19の後、分析部36は、ステップS18で導出された探索ルート上の最後の変換ルールIDが表す変換ルールのコストと、その変換ルールIDに対応するノードに到達する全ての探索開始点に対応する各データの意味のコストの総和との和が、ステップS19で新たに定められた探索開始点に対応するデータの意味のコスト以下であるという条件を満たすか否かを判定する。その条件が満たされているならば、新たに定められた探索開始点に対応するデータの意味のコストを、上記の和の値で更新する。その条件が満たされていないならば、新たに定められた探索開始点に対応するデータの意味のコストを更新しない(ステップS33)。
 例えば、ステップS18において、図17に示す探索ルートが導出されたとする。この場合、探索ルート上の最後の変換ルールIDは「BMI計算」であり、変換ルール「BMI計算」のコストは“5”である。また、「BMI計算」に対応するノードに到達する全ての探索開始点は、「身長」に対応する探索開始点、および、「体重」に対応する探索開始点である。そして、「身長」のコスト、および、「体重」のコストはいずれも“0”であるので、それらの総和も“0”である。従って、変換ルール「BMI計算」のコスト “5”と、上記の総和“0”との和は“5”である。
 また、図17に示す探索ルートでは、「BMI」に対応する探索開始点が、新たに定められた探索開始点である。そして、「BMI」のコストは無限大である。従って、上記の和“5”は、「BMI」のコスト“無限大”以下であるので、ステップS33における条件は満たされている。従って、分析部36は、「BMI」のコストを“無限大”から、上記の和“5”に更新する。
 仮に、「BMI」のコストが“4”であるとすると、ステップS33における条件は満たされないことになる。この場合、分析部36は、「BMI」のコストを更新せず、“4”のままとする。
 分析部36は、データの意味のコストを更新する場合、コスト記憶部32に記憶されているデータの意味のコストを更新すればよい。
 ステップS33の後、分析部36は、ステップS14(図13参照)以降の処理を繰り返す。
 また、ステップS20,S21は、第2の実施形態におけるステップS20,S21と同様であり、説明を省略する。ただし、ステップS20において、分析部36は、ステップS32で特定された全てのノードのうちの一部のノードに関して、ステップS18で既存の探索ルートとは異なる新たな探索ルートが導出されたか否かを判定する
 第3の実施形態においても、第2の実施形態と同様の効果が得られる。さらに、第3の実施形態では、max_costの値に応じて、得られる探索ルートの長さが異なる。すなわち、第3の実施形態では、max_costの値に応じた長さの探索ルートが得られる。このことは、例えば、データを持つ者の予算の範囲内で行える分析を提示できるということを意味している。
 上記の例において、例えば、max_costが“2”であるならば、探索ルートは得られずに処理が終了する。また、上記の例において、例えば、max_costが“15”であるならば、図10に示す探索ルートが導出され、処理が終了する。また、上記の例において、例えば、max_costが“30”であるならば、図11に示す探索ルートが導出され、処理が終了する。このように、第3の実施形態では、max_costの値に応じた長さの探索ルートが得られる。
 また、第2の実施形態で説明したように、探索ルートが枝分かれしていき、終点が複数存在する探索ルートが得られてもよい。
 また、第2の実施形態や第3の実施形態において、データを持つ者が分析によって得たいと考えているデータがあるならば、そのデータの意味が指定されてもよい。そして、第2の実施形態の分析部26や第3の実施形態の分析部36は、探索ルートが枝分かれしていき終点が複数存在する探索ルートを得た後、指定された「データの位置」を終点とする探索ルートのみを抽出し、その探索ルートを出力してもよい。
 次に、各実施形態の変形例について説明する。本発明の各実施形態において、分析装置1に、意味推定部3が設けられていなくてもよい。その場合、取得部2は、ユーザに所持されているデータの意味を直接取得してもよい。すなわち、取得部2が、1つ以上の「データの意味」を直接外部から取得してよい。この場合、その「データの意味」を、上記の各実施形態における「与えられたデータの意味」として扱えばよい。
 図18は、本発明の各実施形態の分析装置1に係るコンピュータの構成例を示す概略ブロック図である。例えば、コンピュータ1000は、CPU1001と、主記憶装置1002と、補助記憶装置1003と、インタフェース1004と、データ(テーブル)を読み込むデータ読み込み装置1005とを備える。
 本発明の各実施形態の分析装置1は、コンピュータ1000によって実現される。分析装置1の動作は、プログラム(分析プログラム)の形式で補助記憶装置1003に記憶されている。CPU1001は、プログラムを補助記憶装置1003から読み出し、そのプログラムを主記憶装置1002に展開し、そのプログラムに従って、上記の各実施形態で説明した処理を実行する。
 補助記憶装置1003は、一時的でない有形の媒体の例である。一時的でない有形の媒体の他の例として、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD-ROM(Compact Disk Read Only Memory )、DVD-ROM(Digital Versatile Disk Read Only Memory )、半導体メモリ等が挙げられる。また、プログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000がそのプログラムを主記憶装置1002に展開し、そのプログラムに従って上記の各実施形態で説明した処理を実行してもよい。
 また、各構成要素の一部または全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組合せによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各構成要素の一部または全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。
 各構成要素の一部または全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
 次に、本発明の概要について説明する。図19は、本発明の分析装置の概要の例を示すブロック図である。本発明の分析装置は、変換ルール記憶手段75と、分析手段76とを備える。
 変換ルール記憶手段75(例えば、変換ルール記憶部5)は、1つ以上のデータの意味を、1つ以上の別のデータの意味に変換する変換ルールを複数個記憶する。
 分析手段76(例えば、分析部6、分析部26または分析部36)は、与えられた1つ以上のデータの意味と、変換ルールとに基づいて、その意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する。
 そのような構成によって、所持されているデータを用いてどのような分析を行えるかを示す情報を導出することができる。
 また、各変換ルールに基づいて、データの意味を表すノードの集合と、変換ルールIDを表すノードの集合とを含む有向2部グラフを生成するグラフ生成手段(例えば、グラフ生成部7)を備え、
 分析手段76(例えば、分析部26)が、
 与えられた1つ以上のデータの意味に対応する各ノードを探索開始点と定めた後に、
 有向2部グラフにおいて、探索開始点から1つのエッジを介して到達する変換ルールIDに対応するノードを特定し、
 特定されたノードに対応する変換ルールIDが表す変換ルールにおける変換前のデータの意味に対応する各ノードが全て探索開始点であり、特定されたノードが当該探索開始点の全てから到達されている場合に、その変換ルールにおける変換後のデータの意味を表すノードまでの探索ルートを導出し、
 その変換後のデータの意味を表すノードを探索開始点として定めること
 を繰り返し、
 新たな探索ルートが導出できなくなった時点までに導出された探索ルートを、上記の情報として定める
 構成であってもよい。
 また、個々の変換ルールにそれぞれコストが予め定められていて、
 各変換ルールに基づいて、データの意味を表すノードの集合と、変換ルールIDを表すノードの集合とを含む有向2部グラフを生成するグラフ生成手段(例えば、グラフ生成部7)と、
 有向2部グラフにおける個々のデータの意味に対して、コストの初期値を設定するコスト初期値設定手段(例えば、コスト初期値設定部31)とを備え、
 分析手段76(例えば、分析部36)が、
 与えられた1つ以上のデータの意味に対応する各ノードを探索開始点と定めた後に、
 有向2部グラフにおいて、探索開始点から1つのエッジが向かっている変換ルールIDに対応するノードのうち、その探索開始点に対応するデータの意味のコストと、変換ルールIDが表す変換ルールのコストとの和が、所定のコスト上限値以下であるという条件を満たすノードのみを、その探索開始点から1つのエッジを介して到達されるノードとして特定し、
 特定されたノードに対応する変換ルールIDが表す変換ルールにおける変換前のデータの意味に対応する各ノードが全て探索開始点であり、特定されたノードが当該探索開始点の全てから到達されている場合に、その変換ルールにおける変換後のデータの意味を表すノードまでの探索ルートを導出し、
 その変換後のデータの意味を表すノードを探索開始点として定めるとともに、所定の条件を満たす場合に、当該ノードに対応するデータの意味のコストを更新すること
 を繰り返し、
 新たな探索ルートが導出できなくなった時点までに導出された探索ルートを、上記の情報として定める
 構成であってもよい。
 また、コスト初期値設定手段が、
 与えられた1つ以上のデータの意味のコストをそれぞれ0に設定し、残りのデータの意味のコストを無限大に設定し、
 分析手段76(例えば、分析部36)が、
 導出された探索ルート上の最後の変換ルールIDが表す変換ルールのコストと、その変換ルールIDに対応するノードに到達する全ての探索開始点に対応する各データの意味のコストの総和との和が、その変換ルールにおける変換後のデータの意味のコスト以下である場合に、当該データの意味のコストを、上記の和で更新する
 構成であってもよい。
 また、分析手段76(例えば、分析部6)が、
 変換前のデータの意味が、与えられた1つ以上のデータの意味に包含されているという条件を満たす変換ルールを抽出し、
 抽出した各変換ルールにおける変換後のデータの意味と、与えられた1つ以上のデータの意味との和集合を求め、当該和集合を与えられた1つ以上のデータの意味とみなすことを繰り返し、
 抽出した変換ルールと、前回抽出した変換ルールとが同一になったならば、その抽出した変換ルールの集合を、上記の情報として定める
 構成であってもよい。
 また、データが与えられた場合に、当該データの意味を推定する意味推定手段(例えば、意味推定部3)を備える構成であってもよい。
 以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
産業上の利用の可能性
 本発明は、データの意味が与えられた場合に、その意味を持つデータを用いてどのような分析を行えるのかを分析する分析装置に好適に適用可能である。
 1 分析装置
 2 取得部
 3 意味推定部
 4 意味記憶部
 5 変換ルール記憶部
 6,26,36 分析部
 7 グラフ生成部
 8 グラフ記憶部
 31 コスト初期値設定部
 32 コスト記憶部

Claims (8)

  1.  1つ以上のデータの意味を、1つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段と、
     与えられた1つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する分析手段とを備える
     ことを特徴とする分析装置。
  2.  各変換ルールに基づいて、データの意味を表すノードの集合と、変換ルールIDを表すノードの集合とを含む有向2部グラフを生成するグラフ生成手段を備え、
     前記分析手段は、
     前記与えられた1つ以上のデータの意味に対応する各ノードを探索開始点と定めた後に、
     前記有向2部グラフにおいて、前記探索開始点から1つのエッジを介して到達する変換ルールIDに対応するノードを特定し、
     特定された前記ノードに対応する変換ルールIDが表す変換ルールにおける変換前のデータの意味に対応する各ノードが全て探索開始点であり、特定された前記ノードが当該探索開始点の全てから到達されている場合に、前記変換ルールにおける変換後のデータの意味を表すノードまでの探索ルートを導出し、
     前記変換後のデータの意味を表すノードを探索開始点として定めること
     を繰り返し、
     新たな探索ルートが導出できなくなった時点までに導出された探索ルートを、前記情報として定める
     請求項1に記載の分析装置。
  3.  個々の変換ルールにそれぞれコストが予め定められていて、
     各変換ルールに基づいて、データの意味を表すノードの集合と、変換ルールIDを表すノードの集合とを含む有向2部グラフを生成するグラフ生成手段と、
     前記有向2部グラフにおける個々のデータの意味に対して、コストの初期値を設定するコスト初期値設定手段とを備え、
     前記分析手段は、
     前記与えられた1つ以上のデータの意味に対応する各ノードを探索開始点と定めた後に、
     前記有向2部グラフにおいて、前記探索開始点から1つのエッジが向かっている変換ルールIDに対応するノードのうち、前記探索開始点に対応するデータの意味のコストと、前記変換ルールIDが表す変換ルールのコストとの和が、所定のコスト上限値以下であるという条件を満たすノードのみを、前記探索開始点から1つのエッジを介して到達されるノードとして特定し、
     特定された前記ノードに対応する変換ルールIDが表す変換ルールにおける変換前のデータの意味に対応する各ノードが全て探索開始点であり、特定された前記ノードが当該探索開始点の全てから到達されている場合に、前記変換ルールにおける変換後のデータの意味を表すノードまでの探索ルートを導出し、
     前記変換後のデータの意味を表すノードを探索開始点として定めるとともに、所定の条件を満たす場合に、当該ノードに対応するデータの意味のコストを更新すること
     を繰り返し、
     新たな探索ルートが導出できなくなった時点までに導出された探索ルートを、前記情報として定める
     請求項1に記載の分析装置。
  4.  前記コスト初期値設定手段は、
     前記与えられた1つ以上のデータの意味のコストをそれぞれ0に設定し、残りのデータの意味のコストを無限大に設定し、
     前記分析手段は、
     導出された探索ルート上の最後の変換ルールIDが表す変換ルールのコストと、前記変換ルールIDに対応するノードに到達する全ての探索開始点に対応する各データの意味のコストの総和との和が、前記変換ルールにおける変換後のデータの意味のコスト以下である場合に、当該データの意味のコストを、前記和で更新する
     請求項3に記載の分析装置。
  5.  前記分析手段は、
     変換前のデータの意味が、前記与えられた1つ以上のデータの意味に包含されているという条件を満たす変換ルールを抽出し、
     抽出した各変換ルールにおける変換後のデータの意味と、前記与えられた1つ以上のデータの意味との和集合を求め、当該和集合を前記与えられた1つ以上のデータの意味とみなすことを繰り返し、
     抽出した変換ルールと、前回抽出した変換ルールとが同一になったならば、前記抽出した変換ルールの集合を、前記情報として定める
     請求項1に記載の分析装置。
  6.  データが与えられた場合に、当該データの意味を推定する意味推定手段を備える
     請求項1から請求項5のうちのいずれか1項に記載の分析装置。
  7.  1つ以上のデータの意味を、1つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段を備えるコンピュータが、
     与えられた1つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する
     ことを特徴とする分析方法。
  8.  1つ以上のデータの意味を、1つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段を備えるコンピュータに、
     与えられた1つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する分析処理
     を実行させるための分析プログラムを記録したコンピュータ読み取り可能な記録媒体。
PCT/JP2020/020144 2020-05-21 2020-05-21 分析装置、分析方法および分析プログラム WO2021234916A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US17/925,516 US20230195746A1 (en) 2020-05-21 2020-05-21 Analysis device, analysis method, and analysis program
JP2022524810A JP7444248B2 (ja) 2020-05-21 2020-05-21 分析装置、分析方法および分析プログラム
PCT/JP2020/020144 WO2021234916A1 (ja) 2020-05-21 2020-05-21 分析装置、分析方法および分析プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/020144 WO2021234916A1 (ja) 2020-05-21 2020-05-21 分析装置、分析方法および分析プログラム

Publications (1)

Publication Number Publication Date
WO2021234916A1 true WO2021234916A1 (ja) 2021-11-25

Family

ID=78707831

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/020144 WO2021234916A1 (ja) 2020-05-21 2020-05-21 分析装置、分析方法および分析プログラム

Country Status (3)

Country Link
US (1) US20230195746A1 (ja)
JP (1) JP7444248B2 (ja)
WO (1) WO2021234916A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241901A (ja) * 2006-03-10 2007-09-20 Univ Of Tsukuba 意思決定支援システム及び意思決定支援方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4010516B2 (ja) * 2000-01-27 2007-11-21 株式会社日立製作所 変換規則導出システム
JP4100156B2 (ja) * 2002-12-06 2008-06-11 株式会社日立製作所 データ変換システム
JP2008310650A (ja) 2007-06-15 2008-12-25 Nec Corp コミュニケーション弊害原因推定システム、方法及びプログラム
US20200409951A1 (en) * 2019-06-26 2020-12-31 Michael Kowolenko Intelligence Augmentation System for Data Analysis and Decision Making

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241901A (ja) * 2006-03-10 2007-09-20 Univ Of Tsukuba 意思決定支援システム及び意思決定支援方法

Also Published As

Publication number Publication date
JP7444248B2 (ja) 2024-03-06
JPWO2021234916A1 (ja) 2021-11-25
US20230195746A1 (en) 2023-06-22

Similar Documents

Publication Publication Date Title
JP4011906B2 (ja) プロファイル情報の情報検索方法、プログラム、記録媒体及び装置
CN108182972B (zh) 基于分词网络的中文疾病诊断的智能编码方法及系统
US10860800B2 (en) Information processing method, information processing apparatus, and program for solving a specific task using a model of a dialogue system
CN108182207B (zh) 基于分词网络的中文手术操作的智能编码方法及系统
CN109241243B (zh) 候选文档排序方法及装置
CN110609889B (zh) 基于学术网络确定对象重要性排名及选择评审专家的方法和系统
KR20170133692A (ko) 의료 기록 문서에서의 의료 단어의 연관 규칙 생성 방법 및 그 장치
JP2019082931A (ja) 検索装置、類似度算出方法、およびプログラム
US20140236869A1 (en) Interactive variable selection device, interactive variable selection method, and interactive variable selection program
WO2018072501A1 (en) Information extraction apparatus and method
WO2021234916A1 (ja) 分析装置、分析方法および分析プログラム
CN115617978A (zh) 指标名称检索方法、装置、电子设备及存储介质
CN114429140A (zh) 一种基于相关图信息进行因果推断的案由认定方法及系统
CN114115878A (zh) 一种工作流节点推荐方法及装置
JP6984729B2 (ja) 意味推定システム、方法およびプログラム
JP6763530B2 (ja) 歌詞のトピック推定情報生成システム
CN114282066A (zh) 目录树扩展方法、模型训练方法、装置、设备及存储介质
JP6001173B2 (ja) データ分析装置、rdfデータの拡張方法、およびデータ分析プログラム
WO2019171538A1 (ja) 意味推定システム、方法およびプログラム
JP6563549B1 (ja) データ傾向分析方法、データ傾向分析システム及び絞り込み及び復元装置
WO2023073837A1 (ja) データ修正プログラム、装置、及び方法
JP7333891B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US20230306037A1 (en) Non-transitory computer-readable recording medium storing information processing program, information processing method, and information processing apparatus
US20230289657A1 (en) Computer-readable recording medium storing determination program, determination method, and information processing device
JP6622856B2 (ja) データ構造、雑音抑圧装置、雑音抑圧方法、プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20936455

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022524810

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20936455

Country of ref document: EP

Kind code of ref document: A1