WO2016088230A1 - 因果関係分析装置、及び因果関係分析方法 - Google Patents
因果関係分析装置、及び因果関係分析方法 Download PDFInfo
- Publication number
- WO2016088230A1 WO2016088230A1 PCT/JP2014/082062 JP2014082062W WO2016088230A1 WO 2016088230 A1 WO2016088230 A1 WO 2016088230A1 JP 2014082062 W JP2014082062 W JP 2014082062W WO 2016088230 A1 WO2016088230 A1 WO 2016088230A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- node
- causal relationship
- nodes
- series data
- time
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Z—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
- G16Z99/00—Subject matter not provided for in other main groups of this subclass
Definitions
- the present invention relates to a causal relationship analysis apparatus and a causal relationship analysis method.
- Patent Document 1 includes “structure data indicating a causal relationship between a plurality of events and information indicating the strength of the causal relationship between any two events for any two events having a causal relationship.
- a time-series first causal model and second causal model are generated, and for each event that has a causal relationship with the first event, the causal relationship with the first event between the first and second causal models
- the amount of change in strength and the amount of change in the probability of occurrence of each event are calculated, and among the events that have a causal relationship with the first event, the amount of change in the strength of the causal relationship is greater than or equal to a predetermined threshold
- System Dynamics is known as a technique for analyzing the factors of time-series changes by paying attention to the behavior of the system that fluctuates over time.
- elements nodes
- causal relationships between the nodes are modeled. Then, by performing a simulation based on the created model, the characteristics of the system that change over time are analyzed.
- causal loop diagram In system dynamics, a causal loop diagram is used when modeling causal relationships between nodes.
- the causal loop diagram is composed of arrows indicating the causal relationship with each node.
- the arrow expresses a "positive correlation” in which if one increases (or decreases) the other increases (or decreases), and one increases (or decreases) the other decreases (or increases) There is something that expresses the “negative correlation”.
- Patent Document 1 the strength of the causal relationship between the first event and the event in which the amount of change in the strength of the causal relationship is greater than or equal to a predetermined threshold among the events having a causal relationship with the first event.
- a predetermined threshold among the events having a causal relationship with the first event.
- Patent Document 1 does not analyze the time difference of the time-series data change for each event, for example, analyze the influence of changes that occurred in the event A on the current event B in the past. I can't.
- the amount of change in the strength of the causal relationship is less than or equal to the threshold, it is not possible to detect the node that causes the change when the sign of the change amount changes from positive (negative) to negative (positive).
- a group of nodes constituting the causal relationship model forms a loop, that is, a cause of a change in a certain result node is traced back to a node that is in a causal relationship with the result node (tracing the cause node in order). In the case of searching, handling in the case of returning to the result node is not particularly mentioned in Patent Document 1.
- the present invention has been made in view of such a background, applying system dynamics to factor analysis of time series changes such as social changes, industry trends, personal values, etc. to create a causal relationship model, It is an object of the present invention to provide a causal relationship analysis apparatus and a causal relationship analysis method capable of analyzing the influence between nodes on changes in time-series data of nodes constituting a model.
- a causal relationship analysis apparatus of the present invention is an information processing apparatus that analyzes a cause of a change in time-series data of nodes constituting a causal relationship model, and between nodes constituting a causal relationship model Stores data indicating the causal relationship and time-series data of each node constituting the causal relationship model, and starts from a node of interest that is a node having an inflection point in the time-series data among the nodes constituting the causal relationship model
- the time series data of the node of interest is searched by sequentially searching for nodes having inflection points in the time series data that occurred at a past time point. Identify the node that affected the change in.
- FIG. 1 is a diagram illustrating a schematic configuration of a causal relationship analysis system 1.
- FIG. It is a data flow figure explaining the function with which the causal relationship analysis apparatus 10 is provided, and the data which the causal relationship analysis apparatus 10 manages.
- It is an example of a causal relationship model (causal loop diagram).
- It is an example of causal relationship model data 201.
- It is an example of the social media data 203.
- FIG. 2 is an example of open data 204; It is an example of the time series data 205.
- It is a flowchart explaining time series data generation processing S800.
- It is a flowchart explaining causal relationship analysis processing S900. It is an example of the analysis result display screen 1000.
- FIG. 1 shows a schematic configuration of a causal relationship analysis system 1 described as an embodiment.
- the causal relationship analysis system 1 includes a causal relationship analysis device 10 and a server device 20.
- the causal relationship analysis device 10 and the server device 20 are communicably connected via the communication network 5.
- the communication network 5 is, for example, the Internet or a dedicated line.
- the server device 20 is, for example, an SNS server (SNS: Social Network Service), an open data server, a Web server, and the like, and provides information (data) to other devices accessed via the communication network 5. .
- SNS Social Network Service
- the causal relationship analysis device 10 accesses the server device 20 via the communication network 5 and acquires information from the server device 20.
- the causal relationship analysis device 10 uses the acquired information and applies system dynamics (System Dynamics) to surveys of social trends, industry trends, changes in personal values, etc. (causal loop diagram (causal loop diagram ( CLD: Causal Loop Diagram)), the cause of the change in the time series data of the nodes constituting the above causal relationship model is analyzed.
- System Dynamics System Dynamics
- CLD Causal Loop Diagram
- the causal relationship analysis device 10 stores data indicating the causal relationship between nodes constituting the causal relationship model, and time-series data of each node constituting the causal relationship model.
- the causal relationship analysis apparatus 10 generates the time series data based on information acquired via the communication network 5, for example.
- the causal relationship analysis apparatus 10 uses the generated time series data, and among the nodes constituting the causal relationship model, the causal relationship between the nodes is sequentially determined starting from the node of interest that is a node having an inflection point in the time series data. For a node identified by going back, the node that has affected the change in the time-series data of the node of interest is identified by sequentially searching for nodes that have inflection points that occurred in the past in the time-series data. . More specifically, for example, the causal relationship analyzer 10 traces the causal relationship between the nodes in order, so that the node identified last as the node having the inflection point generated in the past time point in the time-series data. Are identified as nodes that have affected the change in the time-series data of the node of interest.
- the causal relationship analysis apparatus 10 appropriately uses a degree of association, which is an index indicating the strength of connection between nodes, in the above specification. For example, the causal relationship analysis apparatus 10 determines that the node that has been confirmed last is affected by the node of interest when the degree of association between the node identified last and the node of interest is greater than or equal to a preset strength. As specified.
- the inflection point is, for example, (1) the point where the sign of the slope of the rate of change of the time series data is inverted, and (2) the point where the absolute value of the slope of the rate of change of the time series data changes more than a preset threshold value. (3) The point where the sign of the slope of the rate of change of the time series data is inverted and the absolute value of the slope of the rate of change has changed more than a preset threshold value.
- the causal relationship analysis apparatus 10 When the causal relationship analysis apparatus 10 detects a loop by sequentially tracing the causal relationships between the nodes, the causal relationship analyzing apparatus 10 also causes other nodes that do not constitute the loop that are the causal nodes of the nodes that constitute the loop. Include in search target. In this way, the causal relationship analysis apparatus 10 detects the presence of a loop and expands the search range outside the loop, so that it is possible to reliably identify a node that has affected the change in time-series data of the node of interest without omission. it can.
- the causal relationship analysis apparatus 10 is realized by an information processing apparatus (computer) including a processor 101, a storage device 102, an input device 103, an output device 104, and a communication device 105.
- the processor 101 is configured using, for example, a CPU (Central Processing Unit) and an MPU (Micro Processing Unit).
- the storage device 102 is a device for storing programs and data. For example, a ROM (Read Only Memory), a RAM (Random Access Memory), an NVRAM (Non Volatile RAM), a hard disk drive, an SSD (Solid State Drive), an optical type.
- a storage device or the like is a storage device for storing programs and data.
- ROM Read Only Memory
- RAM Random Access Memory
- NVRAM Non Volatile RAM
- hard disk drive an SSD (Solid State Drive)
- SSD Solid State Drive
- the input device 103 is a user interface that receives input of information and instructions from the user, and is, for example, a keyboard, a mouse, a touch panel, or the like.
- the output device 104 is a user interface that provides information to the user, such as a graphic card or a liquid crystal monitor.
- the communication device 105 is a communication interface that communicates with other devices via the communication network 5, and is, for example, a NIC (Network Interface Card) or a wireless LAN interface.
- the processor 101, the storage device 102, the input device 103, the output device 104, and the communication device 105 are communicably connected via communication means such as a bus.
- FIG. 2 is a data flow diagram for explaining the functions of the causal relationship analysis device 10 and the data managed by the causal relationship analysis device 10.
- the causal relationship analysis apparatus 10 includes functions of a time-series data generation unit 206, a causal relationship analysis unit 207, and an analysis result output unit 208. These functions are realized by the processor 101 reading and executing a program stored in the storage device 102. Each function shown in the figure is merely set for convenience in order to facilitate understanding of the function of the causal relationship analyzer 10, and the classification method and name of each function are not limited to the modes shown here. .
- These functions may be realized by, for example, hardware (ASIC (Application) Specific Integrated Circuit) or the like). Further, for example, a configuration in which a plurality of these functions are realized by a single piece of hardware may be adopted. Further, for example, a configuration in which these functions are realized in a distributed or cooperative manner by a plurality of hardware may be employed.
- the causal relationship analysis apparatus 10 includes causal relationship model data 201, a natural language dictionary 202 (such as a synonym dictionary and a co-occurrence word dictionary), social media data 203, open data 204, and time-series data 205. to manage.
- the causal relationship analysis apparatus 10 manages these data as, for example, a database table provided by a DBMS (DataBase Management System).
- DBMS DataBase Management System
- the causal relationship model data 201 is data representing a relationship between nodes described in the causal relationship model regarding, for example, changes in social trends, industry trends, individual values, and the like.
- FIG. 3 shows an example of a causal relationship model (causal loop diagram) expressed by the causal relationship model data 201.
- a node 301 indicates a node constituting the social trend A, for example.
- the link 302 indicates that there is a causal relationship between the nodes.
- the start point of the arrow is connected to the “cause node”, and the end point of the arrow is connected to the “result node”.
- a link 302 indicated by a solid line indicates that there is a “positive correlation” between the node at the start point and the node at the end point to which the link 302 is connected, and the link 302 indicated by the dotted line is connected to the link 302. It shows that there is a “negative correlation” between the start node and the end node.
- the loop 303 is a structure that returns to the starting node as a result of tracing back the causal relationship between the nodes in order from a certain node (tracing the cause node in order).
- the cause node of node A is node D
- the cause node of node D is node C
- the cause node of node C is node B
- the cause node of node B is node A.
- a loop is formed from node A back to node A.
- FIG. 4 shows causal relationship model data 201 corresponding to the causal relationship model (causal loop diagram) shown in FIG.
- the causal relation model data 201 includes a node ID 401, a node name 402, a cause node ID 403, a cause node relation 404, a cause node relation 405, a result node ID 406, a result node relation 407, and a result. It is composed of a plurality of records having each item of the degree of relevance 408 between nodes.
- the node ID 401 is set with an identifier (a character string, a numerical value, etc.) of a node constituting the causality model.
- the node name 402 is set with information (such as a character string) indicating the name of the node, for example, information indicating the contents of the node.
- the node ID of the node corresponding to the cause node when the node identified by the node ID 401 is set as the result node is set.
- the inter-cause node relationship 404 information indicating the relationship (“positive correlation” or “negative correlation”) between the node identified by the node ID 401 and the node identified by the cause node ID 403 is set.
- “1” indicates that the node specified by the node ID 401 and the cause node ID 403. If there is a “negative correlation” with the node specified by “0”, “0” is set.
- the cause node relevance degree 405 is a relevance index (hereinafter also referred to as a cause node relevance degree) that indicates the strength of association between the node identified by the node ID 401 and the node identified by the cause node ID 403. ) Is set.
- the causal relationship analysis unit 207 includes, for example, terms (keywords) included in the social media data 203 (or open data 204) related to the node specified by the node ID 401 and social related to the node specified by the cause node ID 403. The degree of association is obtained based on the co-occurrence frequency between terms (keywords) included in the media data 203 (or open data 204).
- the causal relationship analysis unit 207 stores the social media data 203 that matches “keyword a” and “keyword b” of the cause node ID 403.
- the number of cases is used as a denominator, and in addition to “keyword a” and “keyword b” of cause node ID 403, the degree of relevance is obtained based on the ratio obtained by using the number of cases of social media data 203 including “keyword d” of node ID 401 as a numerator. .
- the degree of association between cause nodes may be obtained from the correlation between the time series data 205 of the node specified by the node ID 401 and the time series data 205 of the node specified by the cause node ID 403 (in this case, the time series data 205, the evaluation value may be normalized or the time lag on the horizontal axis may be corrected as appropriate.
- the node ID of the node corresponding to the result node when the node specified by the node ID 401 is set as the cause node is set.
- information indicating the relationship between the node identified by the node ID 401 and the node identified by the result node ID 406 (“positive correlation” or “negative correlation”) is set.
- “1” indicates that the node identified by the node ID 401 and the result node ID 406 If there is a “negative correlation” with the node specified by “0”, “0” is set.
- the inter-result node association degree 408 is an association degree that is an index indicating the strength of connection between the node identified by the node ID 401 and the node identified by the result node ID 406 (hereinafter also referred to as inter-result node association degree). ) Is set.
- the causal relationship analysis unit 207 obtains the degree of association between result nodes by the same method as the degree of association between cause nodes described above, for example.
- the degree of association between result nodes may be obtained from the correlation between the time series data 205 of the node specified by the node ID 401 and the time series data 205 of the node specified by the result node ID 406 (in this case, the time series data 205, the evaluation value may be normalized or the time lag on the horizontal axis may be corrected as appropriate.
- FIG. 5 shows an example of the social media data 203 acquired from the server device 20.
- the social media data 203 is composed of a plurality of records having items of a speaker ID 501, a speech ID 502, a speech date 503, and a speech content 504.
- the social media data 203 is data provided by, for example, a social networking service, a blog, a bulletin board, or the like.
- information (character string, numerical value, etc.) for specifying the speaker of the social media data 203 is set, for example, a user name is set.
- Information (character string, numerical value, etc.) for identifying each utterance (record) is set in the utterance ID 502.
- information (character string, numerical value, etc.) indicating the date and time when the utterance of the record is posted (posted) on social media is set.
- comment content 504 information (character string, numerical value, etc.) indicating the content of the comment posted (posted) on social media is set.
- FIG. 6 shows an example of the open data 204 acquired from the server device 20.
- the open data 204 is composed of a plurality of records each having items of a list ID 601, a title 602, and link information 603.
- Open data 204 is, for example, public information published by public offices, public institutions, companies, and research institutions.
- the open data 204 is publicly available and highly reliable information such as news and weather information, which is disclosed on a medium such as TV.
- the open data 204 includes, for example, attribute information of a publisher such as a publication date and a publication source.
- the open data 204 includes information such as “who”, “what”, “when”, “where”, “why”, “how”, and the like.
- the open data 204 includes, for example, information that does not use slang or intentional erroneous input / error conversion.
- an identifier (character string, numerical value, etc.) of each record of the open data 204 is set.
- information character string, numerical value, etc.
- link information 603 information indicating the location of the open data 204 of the record (for example, URL (Uniform Resource Locator)) is set.
- FIG. 7 is an example of time-series data 205 generated using social media data 203 or open data 204.
- the time-series data 205 is composed of a plurality of records having items of node ID 701, node name 702, time 703, actual data 704, and negative / positive ratio 705.
- a node identifier (character string, numerical value, etc.) is set.
- the identifier set for the node ID 701 is common to the node ID 401 of the causal relationship model data 201.
- information (such as a character string) indicating the name of the node is set. For example, information indicating the specific contents of the node is set.
- Information set in the node name 702 is the same as the node name 402 of the causal relationship model data 201.
- time 703 information indicating the time corresponding to the actual data 704 (for example, the time when the actual data 704 is generated) is set.
- the time 703 is used as information on the horizontal axis when the time series data 205 is expressed in a graph.
- the time when the actual data 704 is acquired is set as the time 703.
- the figure shows a case where the year is set for the time 703, for example, a month, a date, or the like can be set for the time 703.
- Data included in the social media data 203 and the open data 204 may be used as they are for the period and step size of the time 703, or the data may be appropriately processed by the user or the like.
- the contents of the time series data 205 are set.
- an evaluation value included in the social media data 203 or the open data 204 and a value obtained by processing the evaluation value (ratio, etc.) are set.
- the actual data 704 is used as information on the vertical axis when the time series data 205 is expressed in a graph.
- the number of social media data 203 having negative (negative) content about the content of the node corresponding to the record for example, the content of the node name 702 in the entire social media data 203 corresponding to the record.
- the number of social media data 203 having a positive content hereinafter also referred to as a negative / positive ratio.
- the causal relationship analysis apparatus 10 determines whether the social media data 203 is negative content or positive content with respect to the content of the node, for example, the content of the social media data 203, the content of the node of the record, And by comparing the natural language dictionary 202.
- the negative / positive ratio 705 is used as information on the vertical axis when the time-series data 205 is expressed in a graph.
- FIG. 8 is a flowchart for explaining processing performed by the time series data generation unit 206 (hereinafter referred to as time series data generation processing S800).
- time series data generation processing S800 the time series data generation process S800 will be described with reference to FIG.
- the time series data generation process S800 is executed as needed.
- the time series data generation unit 206 selects one node (record, node ID 401) of the causal relationship model data 201 (S801).
- the time series data generation unit 206 generates a keyword used for generating the time series data 205 based on the node name 402 of the selected node. For example, when the character string “node A” is set in the node name 402, the time-series data generation unit 206 generates “keyword a” and “keyword b” based on the character string.
- the keyword may be generated using a word extracted from the node name 402 as it is, or a synonym or co-occurrence word acquired by comparing the word extracted from the node name 402 with the natural language dictionary 202, etc. (S802).
- the time series data generation unit 206 determines whether there is open data 204 that matches the keyword generated in S802 (S803). If there is open data 204 that matches the generated keyword (S803: YES), the process proceeds to S804. If there is no open data 204 that matches the generated keyword (S803: NO), the process proceeds to S805.
- the time-series data generation unit 206 acquires the open data 204 using the keyword generated in S802, and generates the time-series data 205 using the acquired open data 204. Thereafter, the process proceeds to S806.
- the time-series data generation unit 206 acquires the social media data 203 using the keyword generated in S802, and generates the time-series data 205 using the acquired social media data 203.
- the data on the vertical axis of the time-series data 205 may be actual data 704 or a negative / positive ratio 705. Thereafter, the process proceeds to S806.
- the time series data generation unit 206 determines whether all nodes have been selected in S801. When all the nodes have been selected (S806: YES), the time series data generation unit 206 ends the time series data generation process S800. If an unselected node remains (S806: NO), the time-series data generation unit 206 selects one unselected node in S801 and executes the processing from S802.
- time-series data 205 based on the social media data 203 or the open data 204 is generated.
- FIG. 9 is a flowchart for explaining a process (hereinafter referred to as a causal relation analysis process S900) performed by the causal relation analysis unit 207.
- a causal relation analysis process S900 By executing the causal relationship analysis process S900, it is possible to identify a node (hereinafter, also referred to as a factor node) that has affected the change in the time-series data 205 of the node of interest in the causal relationship model.
- a node hereinafter, also referred to as a factor node
- the causal relationship analysis process S900 is executed after the time-series data generation process is executed.
- the causal relationship analysis unit 207 determines the relevance level (cause node relevance 405, result node relevance) of each node (each node (record, node ID 401) of the causal relationship model data 201) of the causal relationship model (causal loop diagram). Degree 408) is calculated (S901).
- the causal relationship analysis unit 207 calculates the rate of change of the time-series data 205 for each node (each node (record, node ID 401) of the causal relationship model data 201) of the causal relationship model (causal loop diagram). For example, the causal relationship analysis unit 207 calculates the rate of change of the time series data 205 for each year based on the difference between the previous year's evaluation value and the current year's evaluation value (S902).
- the causal relationship analysis unit 207 determines whether or not there is a node having an inflection point in the time series data 205 for each node constituting the causal relationship model (causal loop diagram) (S903). .
- the causal relationship analysis unit 207 performs the processing from S904.
- the causal relationship analysis unit 207 ends the causal relationship analysis process S900.
- the causal relationship analysis unit 207 selects one node as a target node from nodes having inflection points in the time series data 205 (S904).
- the selection may be made from among the nodes having inflection points in the time-series data 205, for example, the nodes where the cause node relation 404 or the result node relation 407 is broken before and after the occurrence of the inflection point (for example, the correct node This is performed by selecting a node that has changed from a negative correlation to a negative correlation or vice versa. Further, for example, the user may make the selection.
- the causal relationship analysis unit 207 determines whether or not the time-series data 205 of the cause node of the node of interest has an inflection point that occurred in the past from the time t1 when the inflection point of the node of interest occurred. Determination is made (S905). If the time-series data 205 of the cause node of the node of interest has an inflection point that occurred in the past from the time t1 at which the inflection point of the node of interest occurred (S905: YES), the process proceeds to S906.
- the causal relationship analysis unit 207 determines that the node that matches the condition in S905 (the time series data 205 has an inflection point that occurred in the past from the time t1 when the inflection point of the node of interest occurred). Node) is set as a terminal node. Note that when there are a plurality of nodes that match the condition of S905, the causal relationship analysis unit 207 selects, for example, the cause node having the maximum value of the relationship degree 405 between cause nodes. Thereafter, the process proceeds to S908.
- the causal relationship analysis unit 207 selects the end node (the node of interest when there is no node that matches the condition in S905; otherwise, the node set in S906) in the time-series data 205 of the node of interest. It is determined that the node has influenced the change, that is, the factor node, and the causal relationship analysis process S900 is ended. In S907, when the causal relationship analysis unit 207 determines that the node that has detected the terminal node is the factor node, the terminal node is also conditional on the degree of association between the terminal node and the node of interest being greater than or equal to a preset strength. May be determined as a factor node.
- the causal relationship analysis unit 207 determines whether or not there is a loop including the node of interest by tracing back the nodes having the causal relationship starting from the node of interest based on the causal relationship model data 201 (tracing the cause node in order).
- the causal relationship analysis unit 207 detects a loop, the causal relationship analysis unit 207 includes a change that occurred in the past from the time t2 when the inflection point occurred in the time series data 205 of the end node in the time series data 205 during the loop. It is determined whether there is a node having a point.
- the process proceeds to S907.
- the causal relationship analysis unit 207 determines that the terminal node is a factor node, and ends the process.
- the causal relationship analysis unit 207 sets the node detected in S908 as a terminal node.
- the causal relationship analysis unit 207 traces the causal relationship of the nodes constituting the loop detected in S908 (following the cause nodes in order), thereby causing the cause nodes of the nodes included in the loop detected in S908. It is determined whether or not there is a node outside the loop that has an inflection point that occurred in the past from time t3 when the time series data 205 of the end node occurred. If such a node exists (S910: YES), the process proceeds to S911. On the other hand, when such a node does not exist (S910: NO), the process proceeds to S912.
- the causal relationship analysis unit 207 determines that the node detected in S910 is a factor node, and ends the causal relationship analysis process S900. In S911, when the causal relationship analysis unit 207 determines that the node detected in S910 is a factor node, it is also a condition that the degree of association between the node detected in S910 and the node of interest is greater than a preset strength. The node detected in S910 may be determined as the factor node.
- the causal relationship analysis unit 207 determines that the node set as the terminal node in S909 is a factor node, and ends the causal relationship analysis process S900.
- the terminal node is determined to be the factor node on the condition that the degree of association between the terminal node and the node of interest is equal to or higher than a preset strength. May be determined.
- the causal relationship analysis unit 207 configures character information (for example, social media data 203 and open data 204) related to the node of interest. From the term that makes up the character information related to the node that has a causal relationship with the node of interest (for example, social media data 203 or open data 204), out of the character information related to the node of interest after the removal, You may make it output the term which cooccurs with the keyword (for example, the keyword produced
- the keyword for example, the keyword produced
- step S905 the causal relationship analysis unit 207 identifies “node D” or “node G” that is the cause node of the node of interest “node A”, and the time series data 205 indicates the inflection point of the node of interest. It is determined whether or not it has an inflection point that occurred in the past from the time t1 that occurred.
- the causal relationship analysis unit 207 determines that the time-series data 205 of “node D” has an inflection point that occurred in the past from time t1 (S905: YES), and in S906, the causality
- the relationship analysis unit 207 sets “node D” as a terminal node.
- the causal relationship analysis unit 207 detects the loop 303 including the “node A” by tracing back the nodes having the causal relationship starting from the “node A” that is the node of interest. Then, the causal relationship analysis unit 207 determines whether there is a node in the loop 303 that has an inflection point that occurred in the past from the time t2 when the inflection point occurred in the time series data 205 of the terminal node in the time series data 205. Determine whether or not. Here, it is assumed that the causal relationship analysis unit 207 detects “node C”, which is a node having an inflection point that occurred at time t3 past time t2 in the time series data 205.
- the causal relationship analysis unit 207 sets “node C” detected in S908 as a terminal node.
- the causal relationship analysis unit 207 traces back the causal relationship of the nodes constituting the loop detected in S908, so that the cause node of the node included in the loop detected in S908 (the node outside the loop) It is determined whether or not there is data having an inflection point that occurred in the past from the time t3 when the time series data 205 of the end node is generated. Here, it is assumed that such a node is not detected, and the process proceeds to S912.
- the causal relationship analysis unit 207 determines that “node C” set as the terminal node in S909 is a factor node.
- the causal relationship analysis system 1 of the present embodiment it is possible to analyze the influence between nodes on the change of the time-series data 205 of the nodes constituting the causal relationship model. Therefore, for example, it is possible to analyze the influence of changes that have occurred in the event A in the past on the current event B.
- the causal relationship analysis device 10 searches for a node using the time when the inflection point occurs as a criterion, it can accurately identify the factor node.
- the causal relationship analysis apparatus 10 searches for a factor node while considering a loop, the factor node can be reliably searched without omission.
- FIG. 10 is an example of a screen (hereinafter referred to as an analysis result display screen 1000) that the analysis result output unit 208 outputs (displays) to the output device 104.
- the analysis result display screen 1000 has a causal relationship model display column 1010, a time series data (attention node) display column 1020, and a time series data (detection node) display column 1030.
- the causal relationship model display field 1010 is provided with an inflection point detection time display field 1011.
- a causal loop diagram of the causal relationship model as an analysis target is displayed.
- a design that highlights the node of interest in the same diagram, a design in which the symbol “!” Is drawn in a solid circle
- a design that highlights the cause node in the diagram, A design in which a symbol “*” is drawn in a solid circle
- a design in which a node having an inflection point is highlighted in the time series data 205 (in the same drawing, a symbol “!” Is drawn in a broken circle).
- the inflection point detection time display field 1011 displays the time at which the inflection point of the time series data 205 of the node of interest has occurred.
- the user can easily grasp the attention node and the factor node by referring to the causal relationship model display column 1010. Further, by referring to the causal relationship model display field 1010, it is possible to easily grasp the node having the inflection point in the time series data 205, and the user can easily grasp the node that is a candidate of the node of interest. it can. Also, the user refers to the inflection point detection time display column 1011, and the time when the inflection point of the time-series data 205 of the node of interest occurs (which inflection point is used as the starting point to search for the factor node) Can be easily grasped. Note that the node of interest to be analyzed may be specified by the user operating the user interface to specify the node displayed in the causal relationship model display field 1010.
- time series data (attention node) display field 1020 the inflection point of the time series data 205 corresponding to the attention node is displayed.
- the user can easily confirm the time series data 205 of the node of interest by referring to the time series data (node of interest) display column 1020.
- the time series data (attention node) display field 1020 has a design for emphasizing the attention node (in FIG. Is displayed on the screen).
- time-series data (detection node) display column 1030 the time-series data 205 of the node detected by tracing the cause node starting from the node of interest and the time when the inflection point occurred in each time-series data 205 are displayed.
- the In the time-series data (detection node) display field 1030 the time-series data 205 of the node specified as the factor node is highlighted (in the figure, a thick frame line and an emphasis design (in the solid line circle in the figure)).
- the symbol “*” is highlighted by the design drawn.)
- the user refers to the time series data (attention node) display field 1020 and the time series data (detection node) display field 1030 to indicate It is possible to visually grasp the relationship between the time series data 205 and the time series data 205 of the factor node.
- the present invention is not limited to the above-described embodiment, and includes various modifications.
- the above-described embodiment has been described in detail for easy understanding of the present invention, and is not necessarily limited to one having all the configurations described.
- a part of the configuration of an embodiment can be replaced with the configuration of another embodiment, and the configuration of another embodiment can be added to the configuration of an embodiment.
- each of the above-described configurations, functions, and the like may be realized by hardware by designing a part or all of them, for example, with an integrated circuit.
- each of the above-described configurations, functions, and the like may be realized by software by interpreting and executing a program that realizes each function by the processor.
- Information such as programs, tables, and files for realizing each function can be stored in a recording device such as a memory, a hard disk, or an SSD, or a recording medium such as an IC card, an SD card, or a DVD.
- control lines and information lines indicate what is considered necessary for the explanation, and not all control lines and information lines on the product are necessarily shown. Actually, it may be considered that almost all the components are connected to each other.
- 1 causal relationship analysis system 5 communication network, 10 causal relationship analysis device, 20 server device, 101 processor, 102 storage device, 103 input device, 104 output device, 105 communication device, 201 causal relationship model data, 202 natural language dictionary, 203 social media data, 204 open data, 205 time-series data, 206 time-series data generation unit, 207 causal relationship analysis unit, 208 analysis result output unit, S800 time-series data generation process, S900 causal relationship analysis process, 1000 analysis result display Screen, 1010 Causal relation model display field, 1020 Time series data (attention node) display field, 1030 Time series data (detection node) display field
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
因果関係分析装置10は、因果関係モデル(因果ループ図)を構成するノードの時系列データ205の変化の要因を分析する。因果関係分析装置10は、因果関係モデルを構成するノードのうち、その時系列データ205に変局点を有するノードである注目ノードを起点として、ノード間の因果関係を順に遡ることにより特定されるノードについて、より過去の時点に生じた変局点をその時系列データ205に有するノードを順に探索することにより、注目ノードの時系列データ205の変化に影響を与えたノードを特定する。因果関係分析装置10は、ノード間の因果関係を順に辿ることによりループが検出された場合、ループを構成しているノードの原因ノードである、ループを構成していない他のノードを探索の対象に含める。
Description
本発明は、因果関係分析装置、及び因果関係分析方法に関する。
特許文献1には、「複数の事象間の因果関係を示す構造データと、因果関係のある任意の2つの事象間について当該任意の2つの事象間の因果関係の強さを示す情報を含む、時系列な第1の因果モデルと第2の因果モデルを生成し、第1の事象と因果関係のある各事象について、第1及び第2の因果モデル間で、第1の事象との因果関係の強さの変化量及び当該各事象の起こる確率の変化量を算出し、第1の事象と因果関係のある事象のうち因果関係の強さの変化量が予め定められた閾値以上である事象と第1の事象との因果関係の強さの変化、及び第1の事象と因果関係のある事象のうち確率の変化量が予め定められた閾値以上である事象の変化を、第1及び第2の因果モデル間での第1の事象の変化の要因として特定する。」と記載されている。
近年、データ分析技術の進展に伴い、政府が公開する統計情報等のオープンデータやニュース記事、SNS(Social Networking Service)の発言等を活用して複雑化する社会動向や業界動向や個人の価値観等の時系列な変化を分析し、マーケティング等への積極的な研究や活用が進められている。しかし社会動向や業界動向、個人の価値観は様々な要素が複雑に絡み合い変化するため、ある注目対象の要素の時系列データの変化に着目したとき、その変化の真の要因となる要素を見つけることは必ずしも容易でない。
時間の経過とともに変動するシステムの挙動に着目して時系列な変化の要因を分析する手法としてシステムダイナミクス(System Dynamics)が知られている。システムダイナミクスでは、システムの変動に影響を及ぼす要素(ノード)を特定し、そのノード間の因果関係をモデル化する。そして作成したモデルに基づきシミュレーションを実施することにより、時間経過に伴って変化するシステムの特性を分析する。
システムダイナミクスでは、ノード間の因果関係モデル化する際に因果ループ図を用いる。因果ループ図は、各ノードと因果関係を表す矢印で構成される。矢印には、一方が増加(または減少)すれば他方も増加(または減少)するという「正の相関」を表現するものと、一方が増加(または減少)すれば他方は減少(または増加)するという「負の相関」を表現するものがある。因果ループ図を用いることで、効果が現れるまでに時間が掛かるようなノードについても表現することができる。そのため、因果ループ図は時間経過に伴って変化する要素の特性をモデル化するのに適している。
ここで上記特許文献1では、第1の事象と因果関係のある事象のうち因果関係の強さの変化量が予め定められた閾値以上である事象と第1の事象との因果関係の強さの変化、及び第1の事象と因果関係のある事象のうち確率の変化量が予め定められた閾値以上である事象の変化を、第1及び第2の因果モデル間での第1の事象の変化の要因として特定している。
しかし特許文献1では、事象毎の時系列データの変化の時間差を考慮した分析を行っていないため、例えば、過去に事象Aで起こった変化が、現在の事象Bに及ぼす影響については分析することができない。また因果関係の強さの変化量が閾値以下である場合、変化量の符号が正(負)から負(正)に転じたときの変化については、その要因となるノードを検出することができない。また因果関係モデルを構成しているノード群がループを構成している場合、即ちある結果ノードの変化の要因を、その結果ノードと因果関係にあるノードを遡って(原因ノードを順に辿って)探索した際、上記結果ノードに回帰するような場合の取り扱いについて特許文献1ではとくに言及していない。
本発明はこのような背景に鑑みてなされたもので、システムダイナミクスを社会変動や業界動向、個人の価値観等の時系列な変化の要因分析に応用して因果関係モデルを作成し、因果関係モデルを構成するノードの時系列データの変化に対するノード間の影響を分析することが可能な、因果関係分析装置、及び因果関係分析方法を提供することを目的とする。
上記目的を達成するための本発明の因果関係分析装置は、因果関係モデルを構成するノードの時系列データの変化の要因を分析する情報処理装置であって、因果関係モデルを構成するノード間の因果関係を示すデータ、及び前記因果関係モデルを構成する各ノードの時系列データを記憶し、因果関係モデルを構成するノードのうち、その時系列データに変局点を有するノードである注目ノードを起点として、前記ノード間の因果関係を順に遡ることにより特定されるノードについて、より過去の時点に生じた変局点をその時系列データに有するノードを順に探索することにより、前記注目ノードの時系列データの変化に影響を与えたノードを特定する。
その他、本願が開示する課題、及びその解決方法は、発明を実施するための形態の欄、及び図面により明らかにされる。
本発明によれば、因果関係モデルを構成するノードの時系列データの変化に対するノード間の影響を分析することができる。
以下、実施形態について図面を参照しつつ詳細に説明する。
図1に一実施形態として説明する因果関係分析システム1の概略的な構成を示している。同図に示すように、因果関係分析システム1は、因果関係分析装置10及びサーバ装置20を含む。因果関係分析装置10とサーバ装置20は、通信ネットワーク5を介して通信可能に接続されている。通信ネットワーク5は、例えば、インターネットや専用回線等である。
サーバ装置20は、例えば、SNSサーバ(SNS:Social Network Service)、オープンデータサーバ、Webサーバ等であり、通信ネットワーク5を介してアクセスしてくる他の装置に対して情報(データ)を提供する。
因果関係分析装置10は、通信ネットワーク5を介してサーバ装置20にアクセスし、サーバ装置20から情報を取得する。因果関係分析装置10は、取得した情報を用い、システムダイナミクス(System Dynamics)を社会動向、業界動向、個人の価値観等の変化等の調査に応用して構築した因果関係モデル(因果ループ図(CLD:Causal Loop Diagram))について、上記因果関係モデルを構成するノードの時系列データの変化の要因を分析する。
因果関係分析装置10は、因果関係モデルを構成するノード間の因果関係を示すデータ、及び因果関係モデルを構成する各ノードの時系列データを記憶する。因果関係分析装置10は、上記時系列データを、例えば、通信ネットワーク5を介して取得される情報に基づき生成する。
因果関係分析装置10は、生成した時系列データを用い、因果関係モデルを構成するノードのうち、その時系列データに変局点を有するノードである注目ノードを起点として、ノード間の因果関係を順に遡ることにより特定されるノードについて、より過去の時点に生じた変局点をその時系列データに有するノードを順に探索することにより、注目ノードの時系列データの変化に影響を与えたノードを特定する。より具体的には、例えば、因果関係分析装置10は、ノード間の因果関係を順に遡ることにより、より過去の時点に生じた変局点をその時系列データに有するノードとして最後に特定されたノードを、注目ノードの時系列データの変化に影響を与えたノードとして特定する。
尚、因果関係分析装置10は、上記特定に際し、ノード間の結びつきの強さを示す指標である関連度を適宜併用する。例えば、因果関係分析装置10は、最後に特定されたノードと注目ノードとの関連度が予め設定された強さ以上である場合に、最後に確認されたノードを注目ノードに影響を与えたノードとして特定する。
上記変局点は、例えば、(1)時系列データの変化率の傾きの符号が反転した点、(2)時系列データの変化率の傾きの絶対値が予め設定された閾値以上変化した点、(3)時系列データの変化率の傾きの符号が反転しかつ変化率の傾きの絶対値が予め設定された閾値以上変化した点等である。このような点を変局点とすることで、注目ノードの時系列データの変化に影響を与えたノードを精度よく特定することができる。
尚、因果関係分析装置10は、ノード間の因果関係を順に辿ることによりループが検出された場合、ループを構成しているノードの原因ノードである、ループを構成していない他のノードについても探索の対象に含める。このように因果関係分析装置10は、ループの存在を検出するとともに、ループ外に探索範囲を広げるので、注目ノードの時系列データの変化に影響を与えたノードを漏れなく確実に特定することができる。
図1に示すように、因果関係分析装置10は、プロセッサ101、記憶装置102、入力装置103、出力装置104、及び通信装置105を備えた情報処理装置(コンピュータ)によって実現される。プロセッサ101は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)を用いて構成されている。記憶装置102は、プログラムやデータを記憶する装置であり、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、NVRAM(Non Volatile RAM)、ハードディスクドライブ、SSD(Solid State Drive)、光学式記憶装置等である。入力装置103は、ユーザから情報や指示の入力を受け付けるユーザインタフェースであり、例えば、キーボード、マウス、タッチパネル等である。出力装置104は、ユーザに情報を提供するユーザインタフェースであり、例えば、グラフィックカード、液晶モニタ等である。通信装置105は、通信ネットワーク5を介して他の装置と通信する通信インタフェースであり、例えば、NIC(Network Interface Card)や無線LANインタフェースである。プロセッサ101、記憶装置102、入力装置103、出力装置104、及び通信装置105はバス等の通信手段を介して通信可能に接続されている。
図2は因果関係分析装置10が備える機能及び因果関係分析装置10が管理するデータを説明するデータフロー図である。因果関係分析装置10は、時系列データ生成部206、因果関係分析部207、及び分析結果出力部208の各機能を備える。これらの機能は、プロセッサ101が、記憶装置102に格納されているプログラムを読み出して実行することにより実現される。同図に示す各機能は、因果関係分析装置10の機能の理解を容易にするために便宜的に設定したものに過ぎず、各機能の分類の仕方や名称はここに示した態様に限定されない。これらの機能は、例えば、ハードウェア(ASIC(Application Specific Integrated Circuit)等)によって実現されるものであってもよい。また例えば、これらの機能の複数が一つのハードウェアによって実現される構成としてもよい。また例えば、これらの機能が複数のハードウェアによって分散もしくは協調して実現される構成としてもよい。
同図に示すように、因果関係分析装置10は、因果関係モデルデータ201、自然言語辞書202(類義語辞書や共起語辞書等)、ソーシャルメディアデータ203、オープンデータ204、及び時系列データ205を管理する。因果関係分析装置10は、これらのデータを、例えば、DBMS(DataBase Management System)が提供するデータベースのテーブルとして管理する。
因果関係モデルデータ201は、例えば、社会動向、業界動向、個人の価値観等の変化等に関して因果関係モデルで記述されたノード間の関係を表わすデータである。
図3に因果関係モデルデータ201によって表現される因果関係モデル(因果ループ図)の一例を示している。同図において、ノード301は、例えば、社会動向Aを構成するノードを示す。リンク302は、ノード間に因果関係があることを示しており、矢印の始点は「原因ノード」に接続し、矢印の終点は「結果ノード」に接続している。実線で示すリンク302は、当該リンク302が接続する始点のノードと終点のノードとの間に「正の相関」があることを示しており、点線で示すリンク302は、当該リンク302が接続する始点のノードと終点のノードとの間に「負の相関」があることを示している。
ループ303は、あるノードを起点としてノード間の因果関係を順に遡った(原因ノードを順に辿った)結果、上記起点ノードに戻る構造である。この例では、ノードAの原因ノードがノードDであり、ノードDの原因ノードがノードCであり、ノードCの原因ノードがノードBであり、ノードBの原因ノードがノードAであることから、ノードAを起点としてノードAに戻るループが形成されている。
図4に図3に示した因果関係モデル(因果ループ図)に対応する因果関係モデルデータ201を示している。同図に示すように、因果関係モデルデータ201は、ノードID401、ノード名称402、原因ノードID403、原因ノード間関係404、原因ノード間関連度405、結果ノードID406、結果ノード間関係407、及び結果ノード間関連度408の各項目を有する複数のレコードで構成されている。
このうちノードID401には、因果関係モデルを構成するノードの識別子(文字列、数値等)が設定される。またノード名称402には、ノードの名称を示す情報(文字列等)が設定され、例えば、ノードの内容を示す情報が設定される。
原因ノードID403には、ノードID401で特定されるノードを結果ノードとしたときに原因ノードに相当するノードのノードIDが設定される。原因ノード間関係404には、ノードID401で特定されるノードと、原因ノードID403で特定されるノードとの関係(「正の相関」又は「負の相関」)を示す情報が設定される。本実施形態では、ノードID401で特定されるノードと原因ノードID403で特定されるノードとの間に「正の相関」がある場合は「1」が、ノードID401で特定されるノードと原因ノードID403で特定されるノードとの間に「負の相関」がある場合は「0」が設定されるものとする。
原因ノード間関連度405には、ノードID401で特定されるノードと、原因ノードID403で特定されるノードとの結びつきの強さを示す指標である関連度(以下、原因ノード間関連度とも称する。)が設定される。因果関係分析部207は、例えば、ノードID401で特定されるノードに関連するソーシャルメディアデータ203(又はオープンデータ204)に含まれる用語(キーワード)と、原因ノードID403で特定されるノードに関連するソーシャルメディアデータ203(又はオープンデータ204)に含まれる用語(キーワード)との間の共起頻度に基づき関連度を求める。例えば、因果関係分析部207は、ノードID401を「ノードA」、原因ノードID403を「ノードD」としたとき、原因ノードID403の「キーワードa」及び「キーワードb」に合致するソーシャルメディアデータ203の件数を分母とし、また原因ノードID403の「キーワードa」「キーワードb」に加えて、更にノードID401の「キーワードd」を含むソーシャルメディアデータ203の件数を分子として求められる比率に基づき関連度を求める。尚、原因ノード間関連度は、ノードID401で特定されるノードの時系列データ205と原因ノードID403で特定されるノードの時系列データ205との相関から求めてもよい(その場合、時系列データ205に適宜、評価値の正規化や横軸の時間ずれの補正を施してもよい)。
結果ノードID406には、ノードID401で特定されるノードを原因ノードとしたときの結果ノードに相当するノードのノードIDが設定される。結果ノード間関係407には、ノードID401で特定されるノードと、結果ノードID406で特定されるノードと関係(「正の相関」又は「負の相関」)を示す情報が設定される。本実施形態では、ノードID401で特定されるノードと結果ノードID406で特定されるノードとの間に「正の相関」がある場合は「1」が、ノードID401で特定されるノードと結果ノードID406で特定されるノードとの間に「負の相関」がある場合は「0」が設定されるものとする。
結果ノード間関連度408には、ノードID401で特定されるノードと、結果ノードID406で特定されるノードとの結びつきの強さを示す指標である関連度(以下、結果ノード間関連度とも称する。)が設定される。因果関係分析部207は、例えば、前述した原因ノード間関連度と同様の方法により結果ノード間関連度を求める。尚、結果ノード間関連度は、ノードID401で特定されるノードの時系列データ205と結果ノードID406で特定されるノードの時系列データ205との相関から求めてもよい(その場合、時系列データ205に適宜、評価値の正規化や横軸の時間ずれの補正を施してもよい)。
図5にサーバ装置20から取得されるソーシャルメディアデータ203の一例を示す。同図に示すように、ソーシャルメディアデータ203は、発言者ID501、発言ID502、発言日時503、及び発言内容504の各項目を有する複数のレコードで構成される。尚、ソーシャルメディアデータ203は、例えば、ソーシャルネットワーキングサービス、ブログ、掲示板等によって提供されるデータである。
発言者ID501には、当該ソーシャルメディアデータ203の発言者を特定する情報(文字列、数値等)が設定され、例えば、ユーザ名が設定される。発言ID502には、各発言(レコード)を識別する情報(文字列、数値等)が設定される。発言日時503には、ソーシャルメディアにおいて当該レコードの発言が掲載(投稿)された日時を示す情報(文字列、数値等)が設定される。発言内容504には、ソーシャルメディアに掲載(投稿)された発言の内容を示す情報(文字列、数値等)が設定される。
図6にサーバ装置20から取得されるオープンデータ204の一例を示す。同図に示すように、オープンデータ204は、リストID601、タイトル602、及びリンク情報603の各項目を有する複数のレコードで構成されている。
オープンデータ204は、例えば、官公庁、公共機関、企業、研究機関が公開する公的な情報である。またオープンデータ204は、例えば、TVなどの媒体により公開され、ニュース、気象情報など公共性、信頼性の高い情報である。またオープンデータ204は、例えば、公開日時、公開元などの公開者の属性情報を含む。またオープンデータ204は、例えば、「誰が」、「何を」、「いつ」、「どこで」、「なぜ」、「どのように」等の情報を含む。またオープンデータ204は、例えば、俗語および意図的な誤入力・誤変換などを用いていない情報を含む。
リストID601には、オープンデータ204の各レコードの識別子(文字列、数値等)が設定される。タイトル602には、当該レコードのオープンデータ204のタイトルに相当する情報(文字列、数値等)が設定される。リンク情報603は、当該レコードのオープンデータ204の所在を示す情報(例えば、URL(Uniform Resource Locator)が設定される。
図7はソーシャルメディアデータ203又はオープンデータ204を用いて生成される時系列データ205の一例である。同図に示すように、時系列データ205は、ノードID701、ノード名称702、時間703、実データ704、及びネガポジ比率705の各項目を有する複数のレコードで構成される。
ノードID701には、ノードの識別子(文字列、数値等)が設定される。ノードID701に設定される識別子は、因果関係モデルデータ201のノードID401と共通である。ノード名称702には、ノードの名称を示す情報(文字列等)が設定され、例えば、ノードの具体的な内容を示す情報が設定される。ノード名称702に設定される情報は因果関係モデルデータ201のノード名称402と共通である。
時間703には、実データ704に対応する時間(例えば実データ704が発生した時間)を示す情報が設定される。時間703は、時系列データ205をグラフで表現した場合に横軸の情報として用いられる。時間703には、例えば、実データ704が取得された時間が設定される。同図では時間703に年次を設定した場合を示しているが、時間703には、例えば、月次や日付等を設定することもできる。時間703の期間や刻み幅はソーシャルメディアデータ203やオープンデータ204に含まれるデータをそのまま用いてもよいし、それらのデータをユーザ等が適宜加工してもよい。
実データ704には、時系列データ205の内容(大きさを示す数値等)が設定される。例えば、実データ704には、ソーシャルメディアデータ203やオープンデータ204に含まれている評価値や評価値を加工した値(比率等)が設定される。実データ704は、時系列データ205をグラフで表現した場合に縦軸の情報として用いられる。
ネガポジ比率705には、当該レコードに対応するソーシャルメディアデータ203全体における、当該レコードに対応するノードの内容(例えばノード名称702の内容)についてのネガティブ(否定的)な内容のソーシャルメディアデータ203の件数とポジティブ(肯定的)な内容のソーシャルメディアデータ203の件数との比率(以下、ネガポジ比率とも称する。)が設定される。尚、因果関係分析装置10は、ソーシャルメディアデータ203がノードの内容に対してネガティブな内容であるかポジティブな内容であるかを、例えば、ソーシャルメディアデータ203の内容、当該レコードのノードの内容、及び自然言語辞書202を対照することにより判定する。ネガポジ比率705は、時系列データ205をグラフで表現した場合に縦軸の情報として用いられる。
続いて、因果関係分析装置10が行う処理について説明する。尚、以下の説明において、符号の先頭に付している「S」の文字は処理ステップの略字である。
<時系列データ生成処理>
図8は、時系列データ生成部206が行う処理(以下、時系列データ生成処理S800と称する。)を説明するフローチャートである。以下、同図とともに時系列データ生成処理S800について説明する。時系列データ生成処理S800は随時実行される。
図8は、時系列データ生成部206が行う処理(以下、時系列データ生成処理S800と称する。)を説明するフローチャートである。以下、同図とともに時系列データ生成処理S800について説明する。時系列データ生成処理S800は随時実行される。
まず時系列データ生成部206は、因果関係モデルデータ201のノード(レコード、ノードID401)を一つ選択する(S801)。
続いて、時系列データ生成部206は、選択したノードのノード名称402に基づき、時系列データ205の生成に用いるキーワードを生成する。例えば、ノード名称402に「ノードA」という文字列が設定されていた場合、時系列データ生成部206は、当該文字列に基づき「キーワードa」、「キーワードb」を生成する。キーワードは、ノード名称402から抽出される単語をそのまま用いて生成してもよいし、ノード名称402から抽出される単語と自然言語辞書202とを対照することにより取得される類義語や共起語等を用いて生成してもよい(S802)。
続いて、時系列データ生成部206は、S802で生成したキーワードに合致するオープンデータ204が存在するか否かを判定する(S803)。生成したキーワードに合致するオープンデータ204が存在する場合には(S803:YES)、S804に進む。生成したキーワードに合致するオープンデータ204が存在しない場合には(S803:NO)、S805に進む。
S804では、時系列データ生成部206は、S802で生成したキーワードを用いてオープンデータ204を取得し、取得したオープンデータ204を用いて時系列データ205を生成する。その後はS806に進む。
一方、S805では、時系列データ生成部206は、S802で生成したキーワードを用いてソーシャルメディアデータ203を取得し、取得したソーシャルメディアデータ203を用いて時系列データ205を生成する。この場合、時系列データ205の縦軸となるデータは、実データ704としてもよいし、ネガポジ比率705としてもよい。その後はS806に進む。
S806では、時系列データ生成部206は、S801にて全てのノードを選択済か否かを判定する。全てのノードを選択済である場合(S806:YES)、時系列データ生成部206は時系列データ生成処理S800を終了する。未選択のノードが残存する場合(S806:NO)、時系列データ生成部206はS801で未選択のノードを一つ選択してS802からの処理を実行する。
以上の時系列データ生成処理S800が実行されることにより、ソーシャルメディアデータ203又はオープンデータ204に基づく時系列データ205が生成される。
<因果関係分析処理>
図9は因果関係分析部207が行う処理(以下、因果関係分析処理S900と称する。)を説明するフローチャートである。因果関係分析処理S900が実行されることにより、因果関係モデルにおける注目ノードの時系列データ205の変化に影響を与えたノード(以下、要因ノードとも称する。)を特定することができる。以下、同図とともに因果関係分析処理S900について説明する。因果関係分析処理S900は、時系列データ生成処理が実行された後に実行される。
図9は因果関係分析部207が行う処理(以下、因果関係分析処理S900と称する。)を説明するフローチャートである。因果関係分析処理S900が実行されることにより、因果関係モデルにおける注目ノードの時系列データ205の変化に影響を与えたノード(以下、要因ノードとも称する。)を特定することができる。以下、同図とともに因果関係分析処理S900について説明する。因果関係分析処理S900は、時系列データ生成処理が実行された後に実行される。
まず因果関係分析部207は、因果関係モデル(因果ループ図)の各ノード(因果関係モデルデータ201の各ノード(レコード、ノードID401))の関連度(原因ノード間関連度405、結果ノード間関連度408)を算出する(S901)。
続いて、因果関係分析部207は、因果関係モデル(因果ループ図)の各ノード(因果関係モデルデータ201の各ノード(レコード、ノードID401))について時系列データ205の変化率を算出する。例えば、因果関係分析部207は、前年度の評価値と今年度の評価値の差分に基づき、各年毎の時系列データ205の変化率を算出する(S902)。
続いて、因果関係分析部207は、因果関係モデル(因果ループ図)を構成している各ノードについて、その時系列データ205に変局点を有するノードが存在するか否かを判定する(S903)。そのようなノードが存在する場合(S903:YES)、因果関係分析部207は、S904からの処理を行う。一方、そのようなノードが存在しない場合(S903:NO)、因果関係分析部207は、因果関係分析処理S900を終了する。
S904では、因果関係分析部207は、その時系列データ205に変局点を有するノードの中から、注目ノードとするノードを一つ選択する(S904)。上記選択は、例えば、その時系列データ205に変局点を有するノードの中から、変局点の発生時点の前後で原因ノード間関係404又は結果ノード間関係407が崩れているノード(例えば、正の相関から負の相関に変化している、もしくはその逆の変化が生じているノード等)を選択することにより行う。また例えば、上記選択はユーザが行うようにしてもよい。
続いて、因果関係分析部207は、注目ノードの原因ノードの時系列データ205が、注目ノードの変局点が生じた時刻t1よりも過去に生じた変局点を有しているか否かを判定する(S905)。注目ノードの原因ノードの時系列データ205が、注目ノードの変局点が生じた時刻t1よりも過去に生じた変局点を有している場合(S905:YES)、処理はS906に進む。一方、注目ノードの原因ノードの時系列データ205が、注目ノードの変局点が生じた時刻t1よりも過去に生じた変局点を有していない場合(S905:NO)、処理はS907に進む。
S906では、因果関係分析部207は、S905の条件に合致したノード(その時系列データ205が注目ノードの変局点が生じた時刻t1よりも過去に生じた変局点を有していると判定されたノード)を末端ノードとして設定する。尚、S905の条件に合致するノードが複数存在する場合、因果関係分析部207は、例えば、原因ノード間関連度405の値が最大の原因ノードを選択する。その後、処理はS908に進む。
S907では、因果関係分析部207は、末端ノード(S905で条件に合致するノードが存在しなかった場合は注目ノード。それ以外はS906で設定された末端ノード)を注目ノードの時系列データ205の変化に影響を与えたノード、即ち要因ノードと判定し、因果関係分析処理S900を終了する。尚、S907において、因果関係分析部207が末端ノードを検出したノードを要因ノードと判定する際、末端ノードと注目ノードとの関連度が予め設定された強さ以上であることも条件として末端ノードを要因ノードと判定するようにしてもよい。
S908では、因果関係分析部207は、因果関係モデルデータ201に基づき注目ノードを起点として因果関係のあるノードを順に遡る(原因ノードを順に辿る)ことにより注目ノードを含むループの有無を判定する。そして因果関係分析部207は、ループが検出された場合は、そのループ中に、その時系列データ205に末端ノードの時系列データ205に変局点が生じた時刻t2よりも過去に生じた変局点を有するノードが存在するか否かを判定する。ループが存在し、かつ、そのループ中にその時系列データ205に末端ノードの時系列データ205に変局点が生じた時刻t2よりも過去に生じた変局点を有するノードが存在する場合(S908:YES)、処理はS909に進む。
一方、ループが存在しないか、もしくは、その時系列データ205に末端ノードの時系列データ205に変局点が生じた時刻t2よりも過去に生じた変局点を有するノードが存在しない場合(S908:NO)、処理はS907に進む。S907では、因果関係分析部207は、末端ノードを要因ノードと判定して処理を終了する。
S909では、因果関係分析部207は、S908で検出されたノードを末端ノードとして設定する。
S910では、因果関係分析部207は、S908で検出されたループを構成しているノードの因果関係を遡る(原因ノードを順に辿る)ことにより、S908で検出されたループに含まれるノードの原因ノード(ループ外のノード)でその時系列データ205に末端ノードの時系列データ205が生じた時刻t3よりも過去に生じた変局点を有するものが存在するか否かを判定する。そのようなノードが存在する場合(S910:YES)、処理はS911に進む。一方、そのようなノードが存在しない場合(S910:NO)、処理はS912に進む。
S911では、因果関係分析部207は、S910で検出したノードを要因ノードと判定し、因果関係分析処理S900を終了する。尚、S911において、因果関係分析部207がS910で検出したノードを要因ノードと判定する際、S910で検出したノードと注目ノードとの関連度が予め設定された強さ以上であることも条件として、S910で検出したノードを要因ノードと判定するようにしてもよい。
一方、S912では、因果関係分析部207は、S909で末端ノードとして設定したノードを要因ノードと判定し、因果関係分析処理S900を終了する。尚、S912において、因果関係分析部207が末端ノードを要因ノードと判定する際、末端ノードと注目ノードとの関連度が予め設定された強さ以上であることも条件として、末端ノードを要因ノードと判定するようにしてもよい。
以上に説明した因果関係分析処理S900によれば、注目ノードの時系列データ205に影響を与えた要因ノードを特定することができる。
尚、上記因果関係分析処理S900によっても要因ノードを特定することができない場合、例えば、因果関係分析部207が、注目ノードに関連する文字情報(例えば、ソーシャルメディアデータ203やオープンデータ204)を構成する用語から、注目ノードと因果関係を有するノードに関連する文字情報(例えば、ソーシャルメディアデータ203やオープンデータ204)を構成する用語を除去し、除去後の注目ノードに関連する文字情報のうち、注目ノードについてのキーワード(例えば注目ノードのノード名称702から生成されるキーワード)と共起する用語を出力するようにしてもよい。これによりユーザに要因ノードを特定するための手掛かりとなる情報を提供することができる。
<処理例>
続いて、因果関係モデルが図3の内容であり、S904にてノード名称402が「ノードA」のノードを注目ノードとして選択した場合について、因果関係分析処理S900の具体的な処理例を示す。
続いて、因果関係モデルが図3の内容であり、S904にてノード名称402が「ノードA」のノードを注目ノードとして選択した場合について、因果関係分析処理S900の具体的な処理例を示す。
まずS905において、因果関係分析部207は、注目ノード「ノードA」の原因ノードである「ノードD」又は「ノードG」を特定し、これらの時系列データ205が、注目ノードの変局点が生じた時刻t1よりも過去に生じた変局点を有しているか否かを判定する。ここでは、因果関係分析部207は、「ノードD」の時系列データ205が、時刻t1よりも過去に生じた変局点を有していると判定し(S905:YES)、S906において、因果関係分析部207は、「ノードD」を末端ノードに設定する。
続いて、S908において、因果関係分析部207は、注目ノードである「ノードA」を起点として因果関係のあるノードを順に遡ることにより「ノードA」を含むループ303を検出する。そして因果関係分析部207は、ループ303中に、その時系列データ205に末端ノードの時系列データ205に変局点が生じた時刻t2よりも過去に生じた変局点を有するノードが存在するか否かを判定する。ここでは、因果関係分析部207は、その時系列データ205に時刻t2よりも過去の時刻t3に生じた変局点を有するノードである「ノードC」を検出するものとする。
S909では、因果関係分析部207は、S908で検出された「ノードC」を末端ノードとして設定する。
S910では、因果関係分析部207は、S908で検出されたループを構成するノードの因果関係を遡ることにより、S908で検出されたループに含まれるノードの原因ノード(ループ外のノード)で、その時系列データ205に末端ノードの時系列データ205が生じた時刻t3よりも過去に生じた変局点を有するものが存在するか否かを判定する。ここではそのようなノードは検出されないものとし、処理はS912に進む。
S912では、因果関係分析部207は、S909で末端ノードに設定された「ノードC」を要因ノードと判定する。
以上に説明したように、本実施形態の因果関係分析システム1によれば、因果関係モデルを構成するノードの時系列データ205の変化に対するノード間の影響を分析することができる。このため、例えば、過去に事象Aで起こった変化が、現在の事象Bに及ぼす影響を分析することができる。また因果関係分析装置10は、変局点が生じた時刻を判断基準としてノードを探索するので要因ノードを精度よく特定することができる。また因果関係分析装置10は、ループを考慮しつつ要因ノードを探索するので、要因ノードを漏れなく確実に探索することができる。
<画面例>
図10は分析結果出力部208が出力装置104に出力(表示)する画面(以下、分析結果表示画面1000と称する。)の一例である。同図に示すように、分析結果表示画面1000は、因果関係モデル表示欄1010、時系列データ(注目ノード)表示欄1020、及び時系列データ(検出ノード)表示欄1030を有している。また因果関係モデル表示欄1010には、変局点検出時期表示欄1011が設けられている。
図10は分析結果出力部208が出力装置104に出力(表示)する画面(以下、分析結果表示画面1000と称する。)の一例である。同図に示すように、分析結果表示画面1000は、因果関係モデル表示欄1010、時系列データ(注目ノード)表示欄1020、及び時系列データ(検出ノード)表示欄1030を有している。また因果関係モデル表示欄1010には、変局点検出時期表示欄1011が設けられている。
因果関係モデル表示欄1010には、分析対象とされた因果関係モデルの因果ループ図が表示される。また表示される因果ループ図には、注目ノードを強調して示す図案(同図では実線円の中に記号「!」が描かれた図案)、要因ノードを強調して示す図案(同図では実線円の中に記号「※」が描かれた図案)、及びその時系列データ205に変局点を有するノードを強調して示す図案(同図では破線円の中に記号「!」が描かれた図案)が表示される。また変局点検出時期表示欄1011には、注目ノードの時系列データ205の変局点が生じた時刻が表示される。
ユーザは、因果関係モデル表示欄1010を参照することにより、注目ノード及び要因ノードを容易に把握することができる。また因果関係モデル表示欄1010を参照することにより、その時系列データ205に変局点を有するノードを容易に把握することができ、ユーザは、注目ノードの候補となるノードを容易に把握することができる。またユーザは、変局点検出時期表示欄1011を参照することで、注目ノードの時系列データ205の変局点が生じた時刻(どの変局点を起点として要因ノードを探索しているのか)を容易に把握することができる。尚、因果関係モデル表示欄1010に表示されているノードをユーザがユーザインタフェースを操作して指定することにより分析対象とする注目ノードを指定できるようにしてもよい。
時系列データ(注目ノード)表示欄1020には、注目ノードに対応する時系列データ205の変局点が表示される。ユーザは、時系列データ(注目ノード)表示欄1020を参照することで、注目ノードの時系列データ205を容易に確認することができる。尚、因果関係モデル表示欄1010の表示内容との対応を容易にとることができるよう、時系列データ(注目ノード)表示欄1020には、注目ノードを強調する図案(同図では実線円の中に「!」が表示されている図案)が表示される。
時系列データ(検出ノード)表示欄1030には、注目ノードを起点として原因ノードを遡ることにより検出されたノードの時系列データ205並びに各時系列データ205において変局点が生じた時刻が表示される。また時系列データ(検出ノード)表示欄1030には、要因ノードとして特定されたノードの時系列データ205が強調表示される(同図では太枠線と強調図案(同図では実線円の中に記号「※」が描かれた図案によって強調されている。)。ユーザは、時系列データ(注目ノード)表示欄1020及び時系列データ(検出ノード)表示欄1030を参照することにより、注目ノードの時系列データ205と要因ノードの時系列データ205の関係を視覚的に把握することができる。
ところで、本発明は上記した実施形態に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態の構成に置き換えることが可能であり、また、ある実施形態の構成に他の実施形態の構成を加えることも可能である。また、各実施形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
上記の各構成、機能、処理部、処理手段等は、それらの一部または全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサが夫々の機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD等の記録装置や、ICカード、SDカード、DVD等の記録媒体に置くことができる。
制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
1 因果関係分析システム、5 通信ネットワーク、10 因果関係分析装置、20 サーバ装置、101 プロセッサ、102 記憶装置、103 入力装置、104 出力装置、105 通信装置、201 因果関係モデルデータ、202 自然言語辞書、203 ソーシャルメディアデータ、204 オープンデータ、205 時系列データ、206 時系列データ生成部、207 因果関係分析部、208 分析結果出力部、S800 時系列データ生成処理、S900 因果関係分析処理、1000 分析結果表示画面、1010 因果関係モデル表示欄、1020 時系列データ(注目ノード)表示欄、1030 時系列データ(検出ノード)表示欄
Claims (15)
- 因果関係モデルを構成するノードの時系列データの変化の要因を分析する情報処理装置であって、
因果関係モデルを構成するノード間の因果関係を示すデータ、及び前記因果関係モデルを構成する各ノードの時系列データを記憶し、
因果関係モデルを構成するノードのうち、その時系列データに変局点を有するノードである注目ノードを起点として、前記ノード間の因果関係を順に遡ることにより特定されるノードについて、より過去の時点に生じた変局点をその時系列データに有するノードを順に探索することにより、前記注目ノードの時系列データの変化に影響を与えたノードを特定する
因果関係分析装置。 - 請求項1に記載の因果関係分析装置であって、
前記変局点は、時系列データの変化率の傾きの符号が反転した点、時系列データの変化率の傾きの絶対値が閾値以上変化した点、及び、時系列データの変化率の傾きの符号が反転しかつ前記変化率の傾きの絶対値が閾値以上変化した点、のうちの少なくともいずれかである
因果関係分析装置。 - 請求項1に記載の因果関係分析装置であって、
前記ノード間の因果関係を順に辿ることによりループが検出された場合、前記ループを構成しているノードの原因ノードである、前記ループを構成していない他のノードを前記探索の対象に含める
因果関係分析装置。 - 請求項1に記載の因果関係分析装置であって、
前記ノード間の因果関係を順に遡ることにより、より過去の時点に生じた変局点をその時系列データに有するノードとして最後に特定されたノードを、前記注目ノードの時系列データの変化に影響を与えたノードとして特定する
因果関係分析装置。 - 請求項4に記載の因果関係分析装置であって、
前記ノード間の結びつきの強さを示す指標である関連度を記憶し、
前記最後に特定されたノードと前記注目ノードとの前記関連度が予め設定された強さ以上である場合に、前記最後に特定されたノードを前記注目ノードに影響を与えたノードとして特定する
因果関係分析装置。 - 請求項5に記載の因果関係分析装置であって、
前記因果関係モデルを構成するノードに関連する文字情報を記憶し、
前記関連度を、前記最後に特定されたノードの前記文字情報に含まれる用語と、前記注目ノードの前記文字情報に含まれる用語との共起頻度に基づき求める
因果関係分析装置。 - 請求項1に記載の因果関係分析装置であって、
前記因果関係モデルを構成するノードに関連する文字情報を記憶し、
前記探索により前記注目ノードの時系列データの変化に影響を与えたノードを特定することができない場合、前記注目ノードに関連する文字情報を構成する用語から、前記注目ノードと因果関係を有するノードに関連する文字情報を構成する用語を除去し、前記除去後の前記注目ノードに関連する文字情報のうち前記注目ノードについてのキーワードと共起する用語を出力する
因果関係分析装置。 - 請求項1に記載の因果関係分析装置であって、
前記時系列データを、オープンデータ及びソーシャルメディアデータのうちの少なくともいずれかに基づき生成する
因果関係分析装置。 - 請求項1に記載の因果関係分析装置であって、
前記注目ノードの時系列データの変化に影響を与えたノードとして特定したノードを示す情報、前記注目ノードの前記時系列データの変化を示す情報、及び前記注目ノードの時系列データの変化に影響を与えたノードの前記前記時系列データの変化を示す情報、を含む画面を生成する
因果関係分析装置。 - 因果関係モデルを構成するノードの時系列データの変化の要因を分析する方法であって、
情報処理装置が、
因果関係モデルを構成するノード間の因果関係を示すデータ、及び前記因果関係モデルを構成する各ノードの時系列データを記憶するステップ、
因果関係モデルを構成するノードのうち、その時系列データに変局点を有するノードである注目ノードを起点として、前記ノード間の因果関係を順に遡ることにより特定されるノードについて、より過去の時点に生じた変局点をその時系列データに有するノードを順に探索することにより、前記注目ノードの時系列データの変化に影響を与えたノードを特定するステップ
を含む、因果関係分析方法。 - 請求項10に記載の因果関係分析方法であって、
前記変局点は、時系列データの変化率の傾きの符号が反転した点、時系列データの変化率の傾きの絶対値が閾値以上変化した点、及び、時系列データの変化率の傾きの符号が反転しかつ前記変化率の傾きの絶対値が閾値以上変化した点、のうちの少なくともいずれかである
因果関係分析方法。 - 請求項10に記載の因果関係分析方法であって、
前記情報処理装置は、前記ノード間の因果関係を順に辿ることによりループが検出された場合、前記ループを構成しているノードの原因ノードである、前記ループを構成していない他のノードを前記探索の対象に含める
因果関係分析方法。 - 請求項10に記載の因果関係分析方法であって、
前記情報処理装置は、前記ノード間の因果関係を順に遡ることにより、より過去の時点に生じた変局点をその時系列データに有するノードとして最後に特定されたノードを、前記注目ノードの時系列データの変化に影響を与えたノードとして特定する
因果関係分析方法。 - 請求項13に記載の因果関係分析方法であって、
前記情報処理装置が、
前記ノード間の結びつきの強さを示す指標である関連度を記憶するステップと、
前記最後に特定されたノードと前記注目ノードとの前記関連度が予め設定された強さ以上である場合に、前記最後に特定されたノードを前記注目ノードに影響を与えたノードとして特定するステップと
を更に含む、因果関係分析方法。 - 請求項14に記載の因果関係分析方法であって、
前記情報処理装置が、
前記因果関係モデルを構成するノードに関連する文字情報を記憶するステップと、
前記関連度を、前記最後に特定されたノードの前記文字情報に含まれる用語と、前記注目ノードの前記文字情報に含まれる用語との共起頻度に基づき求めるステップと
を更に含む、因果関係分析方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016562150A JP6230725B2 (ja) | 2014-12-04 | 2014-12-04 | 因果関係分析装置、及び因果関係分析方法 |
PCT/JP2014/082062 WO2016088230A1 (ja) | 2014-12-04 | 2014-12-04 | 因果関係分析装置、及び因果関係分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/082062 WO2016088230A1 (ja) | 2014-12-04 | 2014-12-04 | 因果関係分析装置、及び因果関係分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2016088230A1 true WO2016088230A1 (ja) | 2016-06-09 |
Family
ID=56091203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2014/082062 WO2016088230A1 (ja) | 2014-12-04 | 2014-12-04 | 因果関係分析装置、及び因果関係分析方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6230725B2 (ja) |
WO (1) | WO2016088230A1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2018015999A1 (ja) * | 2016-07-19 | 2018-07-19 | 株式会社日立製作所 | 議論支援システム、議論支援方法、及び議論支援プログラム |
JP2019121159A (ja) * | 2018-01-04 | 2019-07-22 | 富士通株式会社 | 選択プログラム、選択方法、及び選択装置 |
WO2019225125A1 (ja) * | 2018-05-22 | 2019-11-28 | 株式会社日立製作所 | データ処理装置およびデータ処理方法 |
WO2020162073A1 (ja) * | 2019-02-06 | 2020-08-13 | 日本電気株式会社 | 情報可視化装置、情報可視化方法、及びコンピュータ読み取り可能な記録媒体 |
US11544422B2 (en) * | 2019-09-16 | 2023-01-03 | Palo Alto Research Center Incorporated | Machine learning based systems and methods for real time, model based diagnosis |
WO2023238456A1 (ja) * | 2022-06-07 | 2023-12-14 | 株式会社日立製作所 | 因果処理装置、および、因果処理方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012113537A (ja) * | 2010-11-25 | 2012-06-14 | Hitachi Ltd | 潜在リスク抽出方法およびシステム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001001206A2 (en) * | 1999-06-30 | 2001-01-04 | Strategic Simulation Systems, Inc. | System dynamics model builder and simulator |
US9355170B2 (en) * | 2012-11-27 | 2016-05-31 | Hewlett Packard Enterprise Development Lp | Causal topic miner |
-
2014
- 2014-12-04 WO PCT/JP2014/082062 patent/WO2016088230A1/ja active Application Filing
- 2014-12-04 JP JP2016562150A patent/JP6230725B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012113537A (ja) * | 2010-11-25 | 2012-06-14 | Hitachi Ltd | 潜在リスク抽出方法およびシステム |
Non-Patent Citations (2)
Title |
---|
YU HAYASHI ET AL.: "Graphical Model no Kozo Henka Kenshutsu to Marketing no Oyo", 13TH WORKSHOP ON INFORMATION-BASED INDUCTION SCIENCES (IBIS2010) [ ONLINE ], INFORMATION-BASED INDUCTION SCIENCES AND MACHINE LEARNING (IBISML, November 2010 (2010-11-01), Retrieved from the Internet <URL:http://ibisml.org/ibis2010/preview/P5-25.pdf> [retrieved on 20150227] * |
YU HAYASHI: "Sequential Network Change Detection with Its Applications to Advertisement Impact Relation Analysis", IEICE TECHNICAL REPORT, vol. 111, no. 275, 2 November 2011 (2011-11-02), pages 199 - 206 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2018015999A1 (ja) * | 2016-07-19 | 2018-07-19 | 株式会社日立製作所 | 議論支援システム、議論支援方法、及び議論支援プログラム |
JP2019121159A (ja) * | 2018-01-04 | 2019-07-22 | 富士通株式会社 | 選択プログラム、選択方法、及び選択装置 |
JP7081155B2 (ja) | 2018-01-04 | 2022-06-07 | 富士通株式会社 | 選択プログラム、選択方法、及び選択装置 |
WO2019225125A1 (ja) * | 2018-05-22 | 2019-11-28 | 株式会社日立製作所 | データ処理装置およびデータ処理方法 |
JP2019203759A (ja) * | 2018-05-22 | 2019-11-28 | 株式会社日立製作所 | データ処理装置およびデータ処理方法 |
WO2020162073A1 (ja) * | 2019-02-06 | 2020-08-13 | 日本電気株式会社 | 情報可視化装置、情報可視化方法、及びコンピュータ読み取り可能な記録媒体 |
JPWO2020162073A1 (ja) * | 2019-02-06 | 2021-12-09 | 日本電気株式会社 | 情報可視化装置、情報可視化方法、及びプログラム |
JP7259874B2 (ja) | 2019-02-06 | 2023-04-18 | 日本電気株式会社 | 情報可視化装置、情報可視化方法、及びプログラム |
US11544422B2 (en) * | 2019-09-16 | 2023-01-03 | Palo Alto Research Center Incorporated | Machine learning based systems and methods for real time, model based diagnosis |
WO2023238456A1 (ja) * | 2022-06-07 | 2023-12-14 | 株式会社日立製作所 | 因果処理装置、および、因果処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2016088230A1 (ja) | 2017-06-15 |
JP6230725B2 (ja) | 2017-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6230725B2 (ja) | 因果関係分析装置、及び因果関係分析方法 | |
US10891322B2 (en) | Automatic conversation creator for news | |
US8370278B2 (en) | Ontological categorization of question concepts from document summaries | |
KR102310650B1 (ko) | 검색 결과에서의 논리적인 질문 응답 기법 | |
US10387568B1 (en) | Extracting keywords from a document | |
US20180075013A1 (en) | Method and system for automating training of named entity recognition in natural language processing | |
US20130263019A1 (en) | Analyzing social media | |
JP6404106B2 (ja) | コンテント及び関係距離に基づいて人々をつなげるコンピューティング装置及び方法 | |
US8769037B2 (en) | Managing tag clouds | |
US10102246B2 (en) | Natural language consumer segmentation | |
CN107077640B (zh) | 经由经验归属来分析、资格化和摄取非结构化数据源的系统和处理 | |
US11416907B2 (en) | Unbiased search and user feedback analytics | |
US10073839B2 (en) | Electronically based thesaurus querying documents while leveraging context sensitivity | |
JP5442401B2 (ja) | 行動情報抽出システム及び抽出方法 | |
US20170228378A1 (en) | Extracting topics from customer review search queries | |
US10042913B2 (en) | Perspective data analysis and management | |
Gupta et al. | Sentiment analysis on hadoop with hadoop streaming | |
US10614100B2 (en) | Semantic merge of arguments | |
JP6522446B2 (ja) | ラベル付与装置、方法およびプログラム | |
Riadsolh et al. | Cloud-Based Sentiment Analysis for Measuring Customer Satisfaction in the Moroccan Banking Sector Using Na? ve Bayes and Stanford NLP | |
US20230090601A1 (en) | System and method for polarity analysis | |
US11699177B1 (en) | Systems and methods for automated modeling of quality for products and services based on contextual relevance | |
US10387472B2 (en) | Expert stance classification using computerized text analytics | |
US20160078341A1 (en) | Building a Domain Knowledge and Term Identity Using Crowd Sourcing | |
JP2024530968A (ja) | データを変換、分析、および可視化するためにテキスト分析を使用するためのシステムおよび方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 14907216 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2016562150 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 14907216 Country of ref document: EP Kind code of ref document: A1 |