JP5034580B2 - Causal reasoning apparatus, control program and control method thereof - Google Patents

Causal reasoning apparatus, control program and control method thereof Download PDF

Info

Publication number
JP5034580B2
JP5034580B2 JP2007067345A JP2007067345A JP5034580B2 JP 5034580 B2 JP5034580 B2 JP 5034580B2 JP 2007067345 A JP2007067345 A JP 2007067345A JP 2007067345 A JP2007067345 A JP 2007067345A JP 5034580 B2 JP5034580 B2 JP 5034580B2
Authority
JP
Japan
Prior art keywords
causal
data
sentence
case
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007067345A
Other languages
Japanese (ja)
Other versions
JP2008226168A (en
Inventor
政樹 伊田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2007067345A priority Critical patent/JP5034580B2/en
Publication of JP2008226168A publication Critical patent/JP2008226168A/en
Application granted granted Critical
Publication of JP5034580B2 publication Critical patent/JP5034580B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、対象とする現象に結び付く原因の探索を支援する因果推論装置、その制御プログラムおよび制御方法に関するものである。   The present invention relates to a causal reasoning apparatus that supports a search for a cause associated with a target phenomenon, a control program thereof, and a control method thereof.

従来から、文字列、単語、画像等の表層的な類似性をもとにして、様々な情報が格納されたデータベースから目的とする情報を選び出す検索手法が知られている。   2. Description of the Related Art Conventionally, a search method is known in which target information is selected from a database in which various types of information are stored based on surface layer similarities such as character strings, words, and images.

また、近年では、対象とする現象に結び付く原因を探求するために検索を利用することが試みられている。具体的には、失敗の原因究明を目的として、過去の失敗事例を集めたデータベースから事例検索を行うことなどが試みられている。   In recent years, attempts have been made to use search in order to search for causes that lead to a target phenomenon. Specifically, for the purpose of investigating the cause of failure, attempts have been made to search for cases from a database of past failure cases.

他にも、例えば、特許文献1では、車輌、航空機等の不具合現象に結び付く故障原因を探求する故障診断装置が開示されている。すなわち、所定の不具合現象を含む過去の事例を格納しておき、不具合現象を表す文字列が検索文字列として入力された場合に、入力された文字列に最も類似する文字列で表される不具合現象を含む事例を選び出し、選び出した事例に含まれる不具合現象から所定のルールに従って原因を推論する故障診断装置が開示されている。
特開平7−271590号公報(平成7年10月20日公開) “出現頻度と連接頻度に基づく専門用語抽出”,自然言語処理,vol.0,No.0,2001 “Support Vector Machine を用いたChunk 同定”,自然言語処理,vol.2,No.3,1995
In addition, for example, Patent Document 1 discloses a failure diagnosis apparatus that searches for a cause of a failure associated with a failure phenomenon such as a vehicle or an aircraft. In other words, when past cases including a predetermined defect phenomenon are stored, and a character string representing the defect phenomenon is input as a search character string, the defect represented by the character string most similar to the input character string There is disclosed a failure diagnosis apparatus that selects a case including a phenomenon and infers a cause according to a predetermined rule from a failure phenomenon included in the selected case.
JP 7-271590 A (published on October 20, 1995) “Extraction of technical terms based on appearance frequency and connection frequency”, natural language processing, vol.0, No.0, 2001 “Chunk Identification Using Support Vector Machine”, Natural Language Processing, vol.2, No.3, 1995

失敗の原因究明を目的として、過去の失敗事例を集めたデータベースから従来の検索手法を用いて検索を行うことを想定した場合、対象とする現象を表す文字列を検索文字列として検索を行うと、現象のみが類似した過去事例を事例検索で選び出すことになる。しかしながら、現象が類似している過去事例から得られる原因は、必ずしも対象とする現象の原因であるとは限らない。上述の従来の検索手法を用いて過去の失敗事例を集めたデータベースから検索を行った場合の例を図12を用いて示すと、現象Aと過去事例の現象Bとの間では、「緊急停止」、「漏洩」、および「発火」といった文字列が共通であり、現象としては類似しているが、「発火」の原因はそれぞれ、「配管の劣化」と「油の粘度の増加による弁詰まり」と異なっている。   For the purpose of investigating the cause of failure, assuming a search using a conventional search technique from a database of past failure cases, search using a character string representing the target phenomenon as a search character string. The past cases where only the phenomenon is similar are selected by the case search. However, the cause obtained from the past case where the phenomenon is similar is not necessarily the cause of the target phenomenon. An example of a case where a search is performed from a database in which past failure cases are collected using the above-described conventional search method will be described with reference to FIG. ”,“ Leakage ”, and“ Ignition ”are common, and the phenomenon is similar, but the causes of“ Ignition ”are“ Pipe deterioration ”and“ Valve clogging due to increased oil viscosity ”, respectively. Is different.

以上のように、従来の検索手法では、失敗の原因究明のために重要な、現象と原因との因果関係について、類似性の低い事例までも検索によって選び出してしまう可能性が高いので、適切な原因を選び出せない可能性が高くなる。すなわち、対象とする現象に結び付く原因を求めるための事例検索において、検索精度が低くなってしまう可能性が生じる。   As described above, in the conventional search method, there is a high possibility that a case with a low similarity will be selected for the causal relationship between the phenomenon and the cause, which is important for investigating the cause of the failure. There is a high possibility that the cause cannot be selected. That is, there is a possibility that the search accuracy may be lowered in the case search for finding the cause that leads to the target phenomenon.

また、上記特許文献1に開示の故障診断装置では、可観測な不具合現象を表す文字列を検索文字列とした場合に、文字列の類似性といった表層的な類似性を有する不具合現象を含む過去の事例を選び出し、選び出した事例をもとに原因を推論することになる。よって、上記特許文献1に開示の故障診断装置では、失敗の原因究明のために重要な、現象と原因との因果関係について、類似性の低い事例をもとに、原因を推論する可能性が高くなる。すなわち、誤った事例に基づいて、誤った原因を推論してしまう可能性が高くなる。従って、上記特許文献1に開示の故障診断装置でも、対象とする現象に結び付く原因を求めるための事例検索において、検索精度が低くなってしまう可能性が生じる。   Further, in the failure diagnosis apparatus disclosed in Patent Document 1, when a character string representing an observable defect phenomenon is used as a search character string, the past includes a defect phenomenon having a surface similarity such as a character string similarity. The case is selected and the cause is inferred based on the selected case. Therefore, in the fault diagnosis apparatus disclosed in Patent Document 1, there is a possibility of inferring the cause of the causal relationship between the phenomenon and the cause, which is important for investigating the cause of the failure, based on a case of low similarity. Get higher. That is, there is a high possibility that an erroneous cause is inferred based on an incorrect case. Therefore, even in the failure diagnosis apparatus disclosed in Patent Document 1, there is a possibility that the search accuracy may be lowered in the case search for finding the cause that leads to the target phenomenon.

本発明は、上記従来の問題点に鑑みなされたものであって、その目的は、対象とする現象に結び付く原因を求めるための事例検索において、より検索精度を高めることを可能にする因果推論装置、その制御プログラムおよび制御方法を提供することにある。   The present invention has been made in view of the above-described conventional problems, and the purpose thereof is a causal reasoning apparatus that can further improve search accuracy in case search for obtaining a cause that leads to a target phenomenon. And providing a control program and a control method thereof.

本発明の因果推論装置は、上記課題を解決するために、対象となる現象について記された文章のデータを取得する文章データ取得手段と、受け付けた上記文章中の文構造を解析することによって、当該文章に含まれる文中の語句同士の因果関係を抽出する第1因果関係抽出手段と、現象について予め記された文章である複数の事例のデータを格納しているデータベースから事例のデータを取得する事例データ取得手段と、取得した事例の文章中の文構造を解析することによって、事例中の文章に含まれる文中の語句同士の因果関係を抽出する第2因果関係抽出手段と、第2因果関係抽出手段によって複数の事例から抽出した複数の因果関係のそれぞれを、因果関係を構成する語句間の重なりに応じて連結し、ネットワーク状に表したものである、因果ネットワークのデータを作成する因果ネットワーク作成手段と、第1因果関係抽出手段で抽出した因果関係のデータと上記因果ネットワークのデータとに基づいて、上記因果関係が上記因果ネットワーク上のどのパスに類似するのかを推論し、上記推論したパスに基づいて因果パスを生成する推論手段とを備えることを特徴としている。   In order to solve the above problem, the causal reasoning apparatus of the present invention, by analyzing sentence data acquisition means for acquiring sentence data described about the phenomenon of interest, and sentence structure in the received sentence, Case data is obtained from a first causal relationship extracting means for extracting a causal relationship between words in a sentence included in the sentence, and a database storing a plurality of case data that are sentences written in advance about the phenomenon. Case data acquisition means, second causal relation extraction means for extracting the causal relationship between words in the sentence included in the sentence in the case by analyzing the sentence structure in the sentence of the acquired case, and second causal relation Each of a plurality of causal relationships extracted from a plurality of cases by the extraction means is connected in accordance with the overlap between words constituting the causal relationship and expressed in a network form. Based on the causal network creation means for creating the causal network data, the causal relation data extracted by the first causal relation extraction means, and the causal network data, on which path on the causal network the causal relation is located. Inference means for inferring whether they are similar and generating a causal path based on the inferred path is provided.

また、本発明の制御方法は、上記課題を解決するために、文章データ取得手段によって、対象となる現象について記された文章のデータを取得する文章データ取得ステップと、第1因果関係抽出手段によって、文章データ取得ステップで受け付けた上記文章中の文構造を解析することによって、当該文章に含まれる文中の語句同士の因果関係を抽出する第1因果関係抽出ステップと、事例データ取得手段によって、現象について予め記された文章である複数の事例のデータを格納しているデータベースから事例のデータを取得する事例データ取得ステップと、第2因果関係抽出手段によって、事例データ取得ステップで取得した事例の文章中の文構造を解析することによって、事例中の文章に含まれる文中の語句同士の因果関係を抽出する第2因果関係抽出ステップと、因果ネットワーク作成手段によって、第2因果関係抽出ステップによって複数の事例から抽出した複数の因果関係のそれぞれを、因果関係を構成する語句間の重なりに応じて連結し、ネットワーク状に表したものである、因果ネットワークのデータを作成する因果ネットワーク作成ステップと、推論手段によって、第1因果関係抽出ステップで抽出した因果関係のデータと上記因果ネットワークのデータとに基づいて、上記因果関係が上記因果ネットワーク上のどのパスに類似するのかを推論し、上記推論したパスに基づいて因果パスを生成する推論ステップとを含むことを特徴としている。   In addition, in order to solve the above-described problem, the control method of the present invention includes a sentence data acquisition step of acquiring sentence data describing a target phenomenon by a sentence data acquisition unit, and a first causal relationship extraction unit. By analyzing the sentence structure in the sentence received in the sentence data obtaining step, the first causal relation extracting step for extracting the causal relation between words in the sentence included in the sentence and the case data obtaining means A case data acquisition step for acquiring case data from a database storing a plurality of case data, which are sentences written in advance, and a case sentence acquired in the case data acquisition step by the second causal relationship extraction means Analyzing the sentence structure in the sentence, the causal relationship between words in the sentence included in the sentence in the case is extracted. The causal relationship extracting step and the causal network creating means connect the plurality of causal relationships extracted from the plurality of cases by the second causal relationship extracting step according to the overlap between the words constituting the causal relationship, The causal network creation step for creating the causal network data, and the causal network data extracted in the first causal relationship extraction step by the inference means and the causal network data. It is characterized by including an inference step for inferring which path on the causal network is similar to the relation and generating a causal path based on the inferred path.

上記の発明によれば、文章データ取得手段で入力を受け付けた文章から、第1因果関係抽出手段によって、当該文章に含まれる文中の語句同士の因果関係を抽出することになる。また、事例データ取得手段で取得された複数の事例から、第2因果関係抽出手段によって、事例に含まれる文中の語句同士の因果関係を抽出し、抽出した複数の因果関係のそれぞれを、因果関係を構成する語句間の重なりに応じて繋ぎ合わせて因果ネットワークのデータを作成することになる。そして、推論手段によって、第1因果関係抽出手段で抽出した因果関係が上記因果ネットワーク上のどのパスに類似するのかを推論した結果に応じた因果パスを生成することになる。   According to said invention, the causal relationship between the phrases in the sentence contained in the said sentence is extracted by the 1st causal relationship extraction means from the text which received the input by the text data acquisition means. In addition, the second causal relationship extracting unit extracts the causal relationship between the phrases in the sentence included in the case from the plurality of cases acquired by the case data acquiring unit, and each of the extracted plurality of causal relationships is converted into the causal relationship. The data of the causal network is created by connecting according to the overlap between the words constituting the word. Then, a causal path corresponding to a result of inferring which path on the causal network is similar to the causal relation extracted by the first causal relation extracting means is generated by the inference means.

第1因果関係抽出手段で抽出した因果関係が上記因果ネットワーク上のどのパスに類似するのかの推論によって、第1因果関係抽出手段で抽出した因果関係に、より類似した上記因果ネットワーク上のパスを求めることが可能になる。そして、第1因果関係抽出手段で抽出した因果関係に類似した上記因果ネットワーク上のパスに基づいて、第1因果関係抽出手段で抽出した因果関係に類似した上記因果ネットワーク上のパスに類似する因果パスを生成すれば、因果ネットワークが、現象について予め記された文章である複数の事例から得られる因果関係からなるものであるので、上記因果パスによって、入力を受け付けた文章と因果関係の類似した事例を上記複数の事例から選択することが可能になる。   A path on the causal network that is more similar to the causal relationship extracted by the first causal relation extracting unit is inferred by inferring to which path on the causal network the causal relationship extracted by the first causal relationship extracting unit is similar. It becomes possible to ask. Then, based on the path on the causal network similar to the causal relationship extracted by the first causal relation extracting unit, the causal similar to the path on the causal network similar to the causal relationship extracted by the first causal relationship extracting unit. If a path is generated, the causal network consists of causal relationships obtained from a plurality of cases that are sentences written in advance about the phenomenon. A case can be selected from the plurality of cases.

従って、対象とする現象に結び付く原因を含む事例を検索によってより適切に選び出すことが可能になる。その結果、対象とする現象に結び付く原因を求めるための事例検索において、より検索精度を高めることを可能にするという効果を奏する。   Accordingly, it is possible to more appropriately select cases including causes that are linked to the target phenomenon by searching. As a result, there is an effect that it is possible to further improve the search accuracy in the case search for finding the cause associated with the target phenomenon.

ところで、因果推論装置は、プログラムをコンピュータに実行させることによって実現してもよい。具体的には、本発明に係る制御プログラムは、上記因果推論装置としてコンピュータを動作させるプログラムである。   By the way, the causal reasoning apparatus may be realized by causing a computer to execute a program. Specifically, the control program according to the present invention is a program that causes a computer to operate as the causal reasoning apparatus.

これらの制御プログラムがコンピュータによって実行されると、当該コンピュータは、上記因果推論装置として動作する。従って、上記因果推論装置と同様に、対象とする現象に結び付く原因を求めるための事例検索において、より検索精度を高めることを可能にし得る。   When these control programs are executed by a computer, the computer operates as the causal inference apparatus. Therefore, similarly to the above-described causal reasoning apparatus, it is possible to further improve the search accuracy in the case search for obtaining the cause associated with the target phenomenon.

また、本発明の因果推論装置では、前記第2因果関係抽出手段で抽出された因果関係のデータを、各事例ごとに収集する因果関係データ収集手段と、各事例ごとに収集した因果関係のデータである因果関係データ群を各事例ごとに区別して格納する因果関係データ格納部と、前記推論手段で生成した因果パスに類似する因果関係データ群を上記因果関係データ格納部から選択し、選択した因果関係データ群に対応する事例を前記データベースから読み出す類似検索手段とをさらに備えることが好ましい。   In the causal inference apparatus of the present invention, the causal relation data collecting means for collecting the causal relation data extracted by the second causal relation extracting means for each case, and the causal relation data collected for each case. The causal relationship data storage unit that stores the causal relationship data group that is distinguished for each case and the causal relationship data group that is similar to the causal path generated by the inference means are selected from the causal relationship data storage unit and selected. It is preferable that the information processing apparatus further includes similarity search means for reading a case corresponding to the causal relationship data group from the database.

これにより、類似検索手段によって、前記推論手段で生成した因果パスに類似する因果データ群を因果関係データ格納部から選択することになる。因果関係データ格納部には、因果関係データ収集手段によって収集された因果関係データ群が各事例ごとに区別して格納されているので、選択した因果関係データ群に対応する事例を前記データベースから読み出すことが可能になる。また、第1因果関係抽出手段で抽出した因果関係に類似した上記因果ネットワーク上のパスに類似する因果パスを因果パスとして用いれば、入力を受け付けた文章と因果関係の類似した事例を上記複数の事例から選択することが可能になる。   As a result, a causal data group similar to the causal path generated by the inference means is selected from the causal relation data storage unit by the similarity search means. In the causal relation data storage unit, the causal relation data group collected by the causal relation data collecting means is stored separately for each case, so that the case corresponding to the selected causal relation data group is read from the database. Is possible. In addition, if a causal path similar to the path on the causal network similar to the causal relationship extracted by the first causal relation extracting unit is used as the causal path, a case similar to the sentence that has received the input and the causal relation is selected. It is possible to select from cases.

従って、対象とする現象に結び付く原因を含む事例を検索によってより適切に選び出すことが可能になる。その結果、対象とする現象に結び付く原因を求めるための事例検索において、より検索精度を高めることを可能にするという効果を奏する。   Accordingly, it is possible to more appropriately select cases including causes that are linked to the target phenomenon by searching. As a result, there is an effect that it is possible to further improve the search accuracy in the case search for finding the cause associated with the target phenomenon.

また、本発明の因果推論装置では、前記因果パスは、前記第1因果関係抽出手段で抽出した因果関係と前記因果ネットワークとが類似する箇所にあたる上記因果ネットワーク上のパスであることが好ましい。   In the causal inference apparatus according to the present invention, it is preferable that the causal path is a path on the causal network corresponding to a location where the causal relationship extracted by the first causal relationship extracting unit is similar to the causal network.

これにより、前記第1因果関係抽出手段で抽出した因果関係と前記因果ネットワークとが最も一致する箇所にあたる上記因果ネットワーク上のパスを因果パスとして因果推論装置で用いることが可能になる
また、本発明の因果推論装置では、前記因果パスは、前記第1因果関係抽出手段で抽出した因果関係と前記因果ネットワークとが類似する箇所にあたる上記因果ネットワーク上のパスに、上記因果関係を繋ぎ合わせたパスであることが好ましい。
As a result, the causal reasoning apparatus can use the path on the causal network corresponding to the location where the causal relation extracted by the first causal relation extracting unit and the causal network most closely match as a causal path. In the causal inference apparatus, the causal path is a path obtained by connecting the causal relation to a path on the causal network corresponding to a place where the causal relation extracted by the first causal relation extracting unit is similar to the causal network. Preferably there is.

これにより、前記第1因果関係抽出手段で抽出した因果関係と前記因果ネットワークとが最も一致する箇所にあたる上記因果ネットワーク上のパスに、上記因果関係を繋ぎ合わせたパスを因果パスとして因果推論装置で用いることが可能になる   As a result, the causal inference apparatus uses a path obtained by connecting the causal relation to the path on the causal network corresponding to the location where the causal relation extracted by the first causal relation extracting unit most closely matches the causal network. Can be used

本発明によれば、第1因果関係抽出手段で抽出した因果関係が上記因果ネットワーク上のどのパスに類似するのかの推論手段での推論によって、第1因果関係抽出手段で抽出した因果関係に最も類似した上記因果ネットワーク上のパスを求めることが可能になる。そして、第1因果関係抽出手段で抽出した因果関係に、より類似した上記因果ネットワーク上のパスに応じて、第1因果関係抽出手段で抽出した因果関係に類似した上記因果ネットワーク上のパスに類似する因果パスを生成すれば、因果ネットワークが現象について予め記された文章である複数の事例から得られる因果関係からなるものであるので、上記因果パスによって、因果関係の類似した事例を上記複数の事例から選択することが可能になる。従って、対象とする現象に結び付く原因を含む事例を検索によってより適切に選び出すことが可能になる。その結果、対象とする現象に結び付く原因を求めるための事例検索において、より検索精度を高めることを可能にするという効果を奏する。   According to the present invention, the causal relationship extracted by the first causal relationship extracting unit is the most inferred by the reasoning unit in which the causal relationship extracted by the first causal relationship extracting unit is similar to the path on the causal network. It is possible to obtain a similar path on the causal network. And similar to the path on the causal network similar to the causal relationship extracted by the first causal relation extracting means according to the path on the causal network more similar to the causal relation extracted by the first causal relation extracting means. If the cause-and-effect path is generated, the cause-and-effect network is composed of a plurality of cases that are sentences written in advance about the phenomenon. It is possible to select from cases. Accordingly, it is possible to more appropriately select cases including causes that are linked to the target phenomenon by searching. As a result, there is an effect that it is possible to further improve the search accuracy in the case search for finding the cause associated with the target phenomenon.

本発明の一実施形態について図1ないし図13に基づいて説明すれば、以下の通りである。   An embodiment of the present invention will be described with reference to FIGS. 1 to 13 as follows.

最初に、図1を用いて、因果推論装置1の構成の概要について説明を行う。図1は、本実施の形態の因果推論装置1の構成を示す機能ブロック図である。因果推論装置1は、図1に示すように、入力部(文章データ取得手段手段)11、第1重要語抽出部12、第1一般化処理部13、文構造解析部(第1因果関係抽出手段)14、事例データ取得部(事例データ取得手段)15、第2重要語抽出部16、第2一般化処理部17、因果関係抽出部(第2因果関係抽出手段)18、因果ネットワーク作成部(因果ネットワーク作成手段)19、因果ネットワークデータ格納部20、因果関係データ収集部(因果関係データ収集手段)21、因果関係データ格納部(因果関係データ格納部)22、および推論部23を備えている。また、推論部23は、マッチング部(推論手段)31および類似検索部(類似検索手段)32を含んでいる。   First, the outline of the configuration of the causal inference apparatus 1 will be described with reference to FIG. FIG. 1 is a functional block diagram showing the configuration of the causal reasoning apparatus 1 according to the present embodiment. As shown in FIG. 1, the causal inference apparatus 1 includes an input unit (sentence data acquisition means) 11, a first important word extraction unit 12, a first generalization processing unit 13, a sentence structure analysis unit (first causal relationship extraction). Means) 14, case data acquisition unit (case data acquisition unit) 15, second important word extraction unit 16, second generalization processing unit 17, causal relationship extraction unit (second causal relationship extraction unit) 18, causal network creation unit (Causal network creation means) 19, causal network data storage section 20, causal relation data collection section (causal relation data collection means) 21, causal relation data storage section (causal relation data storage section) 22, and inference section 23. Yes. The inference unit 23 includes a matching unit (inference unit) 31 and a similar search unit (similar search unit) 32.

まず、入力部11は、対象となる現象について記された、ユーザからの一文以上を含む文章(検索文字列)の入力を受け付けるものであって、各種キーなどによって構成されるものである。入力部11は、入力を受け付けた文章のテキストデータを、第1重要語抽出部12に送るものである。なお、入力部11は、因果推論装置1の外部の装置から有線または無線で送られてくる文章(検索文字列)のデータを受け付けるものであってもよい。   First, the input unit 11 receives an input of a sentence (search character string) including one or more sentences described about a target phenomenon, and includes various keys. The input unit 11 sends text data of a sentence that has been accepted to the first important word extraction unit 12. Note that the input unit 11 may receive text (search character string) data sent from a device external to the causal reasoning device 1 by wire or wirelessly.

また、第1重要語抽出部12は、因果推論装置1の外部の装置に格納されているドメイン辞書のデータをもとに、入力部11から送られてきたテキストデータからドメイン辞書に収められている単語(重要語)を含む文を選択し、抽出するものである。なお、第1重要語抽出部12は、構文解析結果に基づいて単語の重要度を算出し、重要度の高い単語(重要語)を含む文を抽出する構成であってもよい。すなわち、第1重要語抽出部12は、例えば「言選Web」などで用いられている公知の専門用語自動抽出方法によって、重要語を含む文を抽出する構成であってもよい。そして、第1重要語抽出部12は、抽出した重要語を含む文のテキストデータを、第1一般化処理部13に送るものである。なお、ここで言うところのドメイン辞書とは、特定分野の用語を収集したものである。また、本実施の形態では、重要語を含む文を選択する構成になっているが、重要語を含む文節を選択し、後の処理を行う構成であってもよい。   The first important word extraction unit 12 is stored in the domain dictionary from the text data sent from the input unit 11 based on the domain dictionary data stored in the external device of the causal reasoning device 1. A sentence including a certain word (important word) is selected and extracted. The first important word extraction unit 12 may be configured to calculate the importance of a word based on the syntax analysis result and extract a sentence including a word (important word) having a high importance. That is, the 1st important word extraction part 12 may be the structure which extracts the sentence containing an important word by the well-known automatic technical vocabulary extraction method used by "word selection Web" etc., for example. Then, the first important word extraction unit 12 sends text data of a sentence including the extracted important words to the first generalization processing unit 13. The domain dictionary referred to here is a collection of terms in a specific field. In the present embodiment, a sentence including an important word is selected, but a phrase including an important word may be selected and a subsequent process may be performed.

第1一般化処理部13は、因果推論装置1の外部の装置に備えられている類語辞典のデータをもとに、重要語を含む各文中の用語の一般化を行うものである。また、第1一般化処理部13は、用語の一般化を行った重要語を含む各文のテキストデータ(一般化を行った文のテキストデータ)を、文構造解析部14に送るものである。なお、類語辞典とは、同義関係、類義関係などにある単語をまとめて分類したものである。また、ここで言うところの用語の一般化とは、同義関係、類義関係などにある単語を統一した用語に変換する処理である。なお、類語辞典としては、例えばシソーラスなどを用いてもよい。   The first generalization processing unit 13 generalizes terms in each sentence including important words based on the data of synonym dictionaries provided in a device external to the causal reasoning device 1. Further, the first generalization processing unit 13 sends text data of each sentence including the generalized word (term text data of the generalized sentence) to the sentence structure analysis unit 14. . The synonym dictionary is a grouping of words in synonym relations and synonym relations. The term generalization referred to here is a process of converting words in synonym relations and synonym relations into unified terms. For example, a thesaurus may be used as the thesaurus.

文構造解析部14は、因果推論装置1の外部の装置に備えられている文構造知識のデータをもとに、一般化を行った各文の格解析・係り受けの解析などといった文構造の解析を行うものである。また、文構造解析部14は、各文の文構造の情報が付与されたテキストデータを生成し、文構造の解析の結果として推論部23に送るものである。なお、ここで言うところの文構造知識とは、構文構造、文法知識、係り受け知識、格構造知識などである。また、格解析・係り受けの解析とは、本実施の形態では、各文中の用語と用語との関係を決定する処理を表している。なお、格解析・係り受けの解析によって決定される各文中の用語と用語との関係としては、例えば接続・被接続の関係などがある。例えば、文構造の解析の結果、文中の用語と用語との間に順接の関係があった場合には、当該用語間には原因と結果との関係が成り立つので、文構造の解析によって、原因にあたる事象と結果にあたる事象との関係(因果関係)のデータを得ることが可能である。なお、本実施の形態では、各文中の用語と用語との関係を決定する処理を行う構成になっているが、各文中の文節と文節との関係を決定し、後の処理を行う構成であってもよい。   The sentence structure analysis unit 14 uses sentence structure knowledge data provided in an external device of the causal reasoning apparatus 1 to generalize sentence structures such as case analysis and dependency analysis of each sentence that has been generalized. Analyze. The sentence structure analysis unit 14 generates text data to which information on the sentence structure of each sentence is given, and sends it to the inference unit 23 as a result of the analysis of the sentence structure. The sentence structure knowledge mentioned here includes syntax structure, grammar knowledge, dependency knowledge, case structure knowledge, and the like. In the present embodiment, case analysis and dependency analysis represent processing for determining the relationship between terms in each sentence. The relationship between the terms in each sentence determined by the case analysis and dependency analysis includes, for example, a connection / connection relationship. For example, as a result of sentence structure analysis, if there is a tangent relationship between terms in the sentence, the relationship between cause and effect is established between the terms. It is possible to obtain data on the relationship (causal relationship) between the event corresponding to the cause and the event corresponding to the result. In this embodiment, the process of determining the relationship between terms in each sentence is performed. However, the process of determining the relationship between clauses in each sentence and performing subsequent processes. There may be.

なお、第1重要語抽出部12、第1一般化処理部13、文構造解析部14のそれぞれは、ドメイン辞書、類語辞典、文構造知識などのデータを、ドメイン辞書、類語辞典、文構造知識などのデータを格納する外部記憶装置、またはネットワークを介して接続されるサーバなどの装置にアクセスすることによって利用している。   Each of the first important word extraction unit 12, the first generalization processing unit 13, and the sentence structure analysis unit 14 receives data such as a domain dictionary, a thesaurus, and a sentence structure knowledge, a domain dictionary, a thesaurus, and a sentence structure knowledge. It is used by accessing a device such as an external storage device that stores data such as a server connected via a network.

事例データ取得部15は、過去の事例のデータを格納した事例データベース(現象について予め記された文章である複数の事例のデータを格納しているデータベース)から過去の事例のデータ(事例データ)を取得するものである。また、事例データ取得部15は、取得した事例データを、第2重要語抽出部16に送るものである。続いて、第2重要語抽出部16は、因果推論装置1の外部の装置に格納されているドメイン辞書のデータをもとに、事例データ取得部15から送られてきた事例データからドメイン辞書に収められている単語(重要語)を含む文を選択し、抽出するものである。そして、第2重要語抽出部16は、抽出した重要語を含む文のテキストデータを、第2一般化処理部17に送るものである。   The case data acquisition unit 15 obtains past case data (case data) from a case database (a database storing a plurality of case data, which are sentences written in advance regarding phenomena), which stores past case data. To get. The case data acquisition unit 15 sends the acquired case data to the second important word extraction unit 16. Subsequently, the second important word extraction unit 16 converts the case data sent from the case data acquisition unit 15 into the domain dictionary based on the domain dictionary data stored in the external device of the causal reasoning device 1. A sentence including the stored word (important word) is selected and extracted. Then, the second important word extraction unit 16 sends text data of a sentence including the extracted important word to the second generalization processing unit 17.

第2一般化処理部17は、因果推論装置1の外部の装置に備えられている類語辞典のデータをもとに、重要語を含む各文中の用語の一般化を行うものである。また、第2一般化処理部17は、用語の一般化を行った重要語を含む各文のテキストデータを、因果関係抽出部18に送るものである。   The second generalization processing unit 17 generalizes terms in each sentence including important words based on the data of synonym dictionaries provided in a device external to the causal reasoning device 1. Further, the second generalization processing unit 17 sends the text data of each sentence including the important word that has been generalized the term to the causal relationship extraction unit 18.

因果関係抽出部18は、因果推論装置1の外部の装置に備えられている文構造知識のデータをもとに、一般化を行った各文の格解析・係り受けの解析などといった文構造の解析を行い、文構造の解析によって決定した各文中の用語と用語との関係を、原因にあたる事象と結果にあたる事象との関係(因果関係)として抽出するものである。なお、本実施の形態では、各文中の用語と用語との関係を決定する処理を行う構成になっているが、文構造解析部14で各文中の文節と文節との関係を決定し、後の処理を行う構成であった場合には、因果関係抽出部18でも、各文中の文節と文節との関係を決定し、後の処理を行う構成となる。   The causal relation extraction unit 18 uses sentence structure knowledge data provided in a device external to the causal reasoning apparatus 1 to analyze sentence structures such as case analysis and dependency analysis of each sentence that has been generalized. Analysis is performed, and the relationship between terms in each sentence determined by analyzing the sentence structure is extracted as a relationship (causal relationship) between an event that is a cause and an event that is a result. In the present embodiment, the processing for determining the relationship between terms in each sentence is performed. However, the sentence structure analysis unit 14 determines the relationship between clauses in each sentence, and If the configuration is such that the causal relationship extraction unit 18 determines the relationship between clauses in each sentence, the subsequent processing is performed.

ここで、因果関係の抽出について、図2(a)および図2(b)を用いて説明を行う。図2(a)は、複数の事例のそれぞれから、重用語を含む文を抽出した結果の一例を示す図である。なお、図2(a)では、事例を識別する番号ごとに、重用語を含む文を抽出した結果の一部を抜粋して示している。また、図2(b)は、因果関係抽出部18によって抽出された因果関係の一例を示す図である。なお、図2(b)では、原因にあたる事象から結果にあたる事象に矢印を引くことによって因果関係を表現している。   Here, the extraction of the causal relationship will be described with reference to FIGS. 2 (a) and 2 (b). FIG. 2A is a diagram illustrating an example of a result of extracting sentences including multiple terms from each of a plurality of cases. In FIG. 2 (a), a part of the result of extracting a sentence including multiple terms is extracted for each number for identifying a case. FIG. 2B is a diagram illustrating an example of the causal relationship extracted by the causal relationship extracting unit 18. In FIG. 2B, the causal relationship is expressed by drawing an arrow from the event that is the cause to the event that is the result.

例えば、図2(a)の事例番号79のデータを用いて具体例を示すと、まず、事例番号79から抽出した重用語を含む文の“急激な温度低下により鋼板の延性が失われた”との記載は、用語の一般化により、例えば“急激な温度低下”が“気温低下”と変換され、“鋼板の延性が失われた”が“素材劣化”と変換される。そして、用語の一般化によって“気温低下により素材劣化”と変換された文の文構造を解析することにより、“気温低下”が原因となって“素材劣化”という結果になったという因果関係を抽出する。因果関係抽出部18では、以上のような因果関係の抽出処理を複数の事例に対して行う。   For example, when a specific example is shown by using the data of case number 79 in FIG. 2A, first, a sentence including a multiple term extracted from case number 79 “The ductility of the steel sheet has been lost due to a rapid temperature drop”. With the generalization of the term, for example, “rapid temperature drop” is converted to “temperature drop”, and “steel sheet ductility is lost” is converted to “material deterioration”. And by analyzing the sentence structure of the sentence that was converted to “material deterioration due to temperature drop” due to the generalization of terms, the causal relationship that “temperature deterioration” resulted in “material deterioration” Extract. The causal relationship extraction unit 18 performs the above causal relationship extraction processing for a plurality of cases.

なお、第2重要語抽出部16、第2一般化処理部17、因果関係抽出部18のそれぞれは、ドメイン辞書、類語辞典、文構造知識などのデータを、ドメイン辞書、類語辞典、文構造知識などのデータを格納する外部記憶装置、またはネットワークを介して接続されるサーバなどの装置にアクセスすることによって利用している。   Each of the second important word extraction unit 16, the second generalization processing unit 17, and the causal relationship extraction unit 18 receives data such as a domain dictionary, a thesaurus, and a sentence structure knowledge, a domain dictionary, a thesaurus, and a sentence structure knowledge. It is used by accessing a device such as an external storage device that stores data such as a server connected via a network.

因果ネットワーク作成部19は、因果関係抽出部18によって抽出された複数の因果関係のデータをもとに、一方の因果関係の結果にあたる事象と他方の因果関係の原因にあたる事象とが一致する因果関係同士を、一致する事象を共有する形式でお互い繋げて因果ネットワークを作成するものである。また、因果ネットワーク作成部19は、因果関係抽出部18で抽出した因果関係に対して、抽出したすべての因果関係のうちで、ある原因となる事象が、ある結果となる事象と組みになっている確率を求めることによって、原因となる事象が起きたときに結果となる事象が起きる条件付き確率(因果の強さ)を求め、各因果関係に付与するものである。本実施の形態では、因果の強さ(スコア)は0.0〜1.0の値で表される。   The causal network creation unit 19 uses a plurality of causal relationship data extracted by the causal relationship extraction unit 18 so that an event corresponding to the result of one causal relationship matches an event corresponding to the cause of the other causal relationship. A causal network is created by connecting each other in the form of sharing matching events. In addition, the causal network creation unit 19 is configured by combining a causal relationship extracted by the causal relationship extraction unit 18 with an event that causes a certain cause among all the extracted causal relationships. By determining the probability, the conditional probability (causal strength) that the event that occurs when the event that causes it occurs will be obtained and assigned to each causal relationship. In the present embodiment, the causal strength (score) is represented by a value of 0.0 to 1.0.

なお、本実施の形態では、各因果関係の因果の強さを因果ネットワーク作成部19で求めて付与する構成を示したが、必ずしもこれに限らない。例えば、因果関係抽出部18で抽出した因果関係のデータを図示しない表示部に表示することによって、ユーザからの各因果関係に対してのスコアの設定を図示しないスコア設定部で受け付け、ユーザによって設定されたスコアを対応する各因果関係に付与する構成であってもよい。   In the present embodiment, the causal network creation unit 19 obtains and assigns the causal strength of each causal relationship. However, the present invention is not limited to this. For example, by displaying the causal relationship data extracted by the causal relationship extracting unit 18 on a display unit (not shown), a score setting unit for each causal relationship from the user is received by a score setting unit (not shown) and set by the user. The structure which assign | provided score to each corresponding causal relationship may be sufficient.

また、因果ネットワークデータ格納部20は、因果ネットワーク作成部19で作成した因果ネットワークのデータを格納するものである。例えば、特定の分野についての複数の過去の事例データをもとに因果ネットワークを作成すれば、特定の分野の因果関係を網羅することが可能になる。   The causal network data storage unit 20 stores the causal network data created by the causal network creation unit 19. For example, if a causal network is created based on a plurality of past case data for a specific field, it is possible to cover the causal relationship of the specific field.

ここで、因果ネットワークについて、図3(a)および図3(b)を用いて説明を行う。図3(a)は、本実施の形態における因果ネットワークの一例を示す図である。また、図3(b)は、因果関係と因果の強さ(因果関係の強さ)との対応付けの一例を示す図である。   Here, the causal network will be described with reference to FIGS. 3 (a) and 3 (b). FIG. 3A is a diagram illustrating an example of a causal network in the present embodiment. FIG. 3B is a diagram illustrating an example of association between the causal relationship and the causal strength (causal strength).

因果ネットワークは、図3(a)に示すとおり、原因となる事象と結果となる事象との関係をスコア付きの有向グラフとして示したものである。本実施の形態における因果ネットワークでは、ある事象から他のある事象に至るパス(因果パス)の途中に複数のノードが存在している。例えば、図3(a)では、“経年”という事象のノードから“火災”という事象のノードに至るパスの途中に、“素材劣化”、“割れ”、および“漏洩”といったノードが存在している。また、各ノードは特定の事象を示しており、因果関係抽出部18で抽出された因果関係のうちの原因にあたる事象および結果にあたる事象が割り当てられる。例えば、“素材劣化”と“割れ”との因果関係では、“素材劣化”が原因にあたる事象となり、“割れ”が結果にあたる事象となるが、“割れ”と“漏洩”との因果関係では、“割れ”が原因にあたる事象となり、“漏洩”が結果にあたる事象となるといったように、因果パスの上流と下流との関係が常に原因と結果との関係になるような構造をとるものとする。なお、本実施の形態では、図3(b)の表に示すような、原因となる事象が起きたときに結果となる事象が起きる条件付き確率(因果の強さ)を表すスコアが、原因となる事象に対応するノードと結果となる事象に対応するノードとを結ぶアークに付与されるものとする。図3(b)の表を例にとって具体例を示すと、原因となる事象(因)が“経年”であった場合、結果となる事象(果)の“素材劣化”との因果の強さは1.0となる。また、原因となる事象(因)が“保守点検不足”であった場合、結果となる事象(果)の“経年”との因果の強さは0.7となる。なお、本実施の形態では、因果の強さを0.0〜1.0の値で表しているが、必ずしもこれに限定されず、例えば、百分率(%)で表現してもよい。   As shown in FIG. 3A, the causal network shows a relationship between a causal event and a resulting event as a directed graph with a score. In the causal network in the present embodiment, a plurality of nodes exist in the middle of a path (causal path) from a certain event to another certain event. For example, in FIG. 3A, there are nodes such as “material degradation”, “crack”, and “leakage” in the middle of the path from the event node “Aging” to the event node “Fire”. Yes. Each node indicates a specific event, and an event corresponding to the cause and an event corresponding to the result among the causal relationships extracted by the causal relationship extracting unit 18 are assigned. For example, in the causal relationship between “material degradation” and “crack”, “material degradation” is the cause and “crack” is the event, but in the causal relationship between “crack” and “leakage”, The structure is such that the relationship between the upstream and downstream of the causal path is always the relationship between the cause and the result, such that “break” is the cause of the event and “leakage” is the event of the result. In the present embodiment, as shown in the table of FIG. 3B, a score indicating a conditional probability (causal strength) that a resultant event occurs when a causal event occurs is a cause. It is assumed that it is given to an arc connecting the node corresponding to the event to be and the node corresponding to the event to be the result. When a specific example is shown by taking the table of FIG. 3B as an example, if the event (cause) that is the cause is “Aged”, the causal strength of “material deterioration” of the event (result) that is the result Becomes 1.0. Further, when the cause event (cause) is “insufficient maintenance check”, the causal strength of the resulting event (result) with “age” is 0.7. In the present embodiment, the causal strength is represented by a value of 0.0 to 1.0, but is not necessarily limited thereto, and may be represented by, for example, a percentage (%).

続いて、因果関係データ収集部21は、因果関係抽出部18で抽出した因果関係のデータを由来する事例ごとにまとめて収集するものであって、事例ごとにまとめた因果関係のデータ(因果関係データ群)ごとに、対応する事例データを同定するためのIDを付与して因果関係データ格納部22に格納するものである。また、因果関係データ格納部22は、因果関係データ収集部21で収集を行った因果関係データ群を格納するものであり、因果関係データ格納部22に格納されているデータでは、因果関係データ群ごとに、当該データに対応する事例データを同定するためのIDが付与されている。   Subsequently, the causal relationship data collection unit 21 collects the causal relationship data extracted by the causal relationship extraction unit 18 for each case derived from the causal relationship data. For each data group), an ID for identifying corresponding case data is assigned and stored in the causal relationship data storage unit 22. In addition, the causal relationship data storage unit 22 stores the causal relationship data group collected by the causal relationship data collection unit 21, and the data stored in the causal relationship data storage unit 22 is a causal relationship data group. Each ID is assigned to identify the case data corresponding to the data.

推論部23は、文構造解析部14から送られてくる文構造の解析の結果(因果関係のデータ)と因果ネットワークデータ格納部20に格納されている因果ネットワークのデータとのマッチングを行い、最も重なりの一致した因果ネットワーク上の因果パスを用いて類似検索を行うものである。ここで言うところのマッチングとは、因果関係のデータと因果ネットワークのデータとを比較して、因果関係のデータに対して類似(最も重なりの一致)した因果ネットワーク上の因果パスを選択(生成)することを表す。また、類似検索とは、マッチング部31で選択した因果パスに類似する因果関係を含む因果関係データ群を検索することによって、当該因果パスに類似する因果関係を含む事例を得ることを表す。なお、マッチングとして、因果関係のデータと因果ネットワークのデータとを比較して、因果関係のデータに対して最も重なりの一致した因果ネットワーク上の因果パスを選択(生成)する構成であってもよい。   The inference unit 23 matches the result of the sentence structure analysis (causal relation data) sent from the sentence structure analysis unit 14 with the causal network data stored in the causal network data storage unit 20, Similarity search is performed by using causal paths on the causal network with overlapping overlap. Matching here refers to comparing causal data with causal network data and selecting (generating) a causal path on the causal network that is similar to the causal data (most coincident). Represents what to do. The similarity search represents obtaining a case including a causal relationship similar to the causal path by searching a causal relationship data group including a causal relationship similar to the causal path selected by the matching unit 31. The matching may be configured such that the causal relation data and the causal network data are compared, and the causal path on the causal network that most closely matches the causal relation data is selected (generated). .

さらに、推論部23に含まれるマッチング部31は、文構造解析部14から送られてくる因果関係のデータと因果ネットワークデータ格納部20に格納されている因果ネットワークのデータとをもとに、上述のマッチングを行うものである。そして、推論部23に含まれる類似検索部32は、マッチング部31から送られてくる因果パスのデータをもとに、因果関係データ格納部22に格納されている因果関係データ群から、当該因果パスに類似する因果関係を含む因果関係データ群を検索するものである。また、類似検索部32は、検索で得た因果関係データ群に対応する事例を事例データベースから読み出し、読み出した事例を検索結果として、図示しない表示部に出力するものである。なお、図示しない表示部は因果推論装置1に備えられていてもよいし、因果推論装置1の外部に備えられていてもよい。また、類似検索部32は、因果関係データ格納部22に格納されている因果関係データ群から、当該因果パスに最も類似する因果関係を含む因果関係データ群に対応する事例を事例データベースから読み出す構成であってもよいし、当該因果パスとの類似度が所定の高さ以上の因果関係を含む因果関係データ群に対応する事例を事例データベースから、上記類似度の高い順に読み出す構成であってもよい。なお、ここで言うところの類似度とは当該因果パスと一致している割合に基づいたスコアを指すものである。具体的な例を挙げると、A、B、C、D、E、Fをノードとした場合に、因果パスABCDEと因果パスABFDEとの類似度は、一致するパスがAB、DEの2つであって、一致しないパスがBC、CD(またはBF、FD)の2つです。なお、当該因果パスと一致している割合は、一致するパスの数を全体のパスの数で割算することによって求められるので、当該因果パスと一致している割合、すなわち類似度は、2÷4=0.5となります。また、所定の高さとは、任意に設定されるものである。   Further, the matching unit 31 included in the inference unit 23 is based on the causal network data stored in the causal network data storage unit 20 and the causal network data sent from the sentence structure analysis unit 14. Matching is performed. Then, the similarity search unit 32 included in the inference unit 23 uses the causal relationship data group stored in the causal relationship data storage unit 22 based on the causal path data sent from the matching unit 31 to the causal relationship data group. It searches for a causal relationship data group including a causal relationship similar to a path. Further, the similarity search unit 32 reads cases corresponding to the causal relationship data group obtained by the search from the case database, and outputs the read cases as search results to a display unit (not shown). Note that a display unit (not shown) may be provided in the causal inference apparatus 1 or may be provided outside the causal inference apparatus 1. The similarity search unit 32 reads a case corresponding to a causal relationship data group including a causal relationship most similar to the causal path from the causal relationship data group stored in the causal relationship data storage unit 22 from the case database. It may be a configuration in which cases corresponding to a causal relationship data group including a causal relationship whose similarity with the causal path is equal to or higher than a predetermined height are read from the case database in descending order of the similarity. Good. Note that the similarity here refers to a score based on a ratio that matches the causal path. As a specific example, when A, B, C, D, E, and F are nodes, the similarity between the causal path ABCDE and the causal path ABFDE is that the matching paths are AB and DE. There are two paths that do not match: BC and CD (or BF and FD). Note that the rate of matching with the causal path is obtained by dividing the number of matching paths by the total number of paths, so the rate of matching with the causal path, that is, the similarity is 2 ÷ 4 = 0.5. The predetermined height is arbitrarily set.

なお、本実施の形態では、第2重要語抽出部16で抽出した重要語をもとに、統計処理による辞書を作成する辞書自動作成部を備える構成であってもよく、また、辞書自動作成部で作成した統計処理による辞書のデータをもとに、第1重要語抽出部12が、入力部11から送られてきたテキストデータから統計処理による辞書に収められている単語(重要語)を含む文を選択し、抽出する構成であってもよい。   In the present embodiment, a configuration including an automatic dictionary creation unit that creates a dictionary by statistical processing based on the important words extracted by the second important word extraction unit 16 may be used. Based on the data of the dictionary created by the statistical processing created by the section, the first important word extracting unit 12 selects the words (important words) stored in the statistically processed dictionary from the text data sent from the input unit 11. The structure which selects the sentence to include and extracts may be sufficient.

なお、事例データから抽出した重要語をもとに、統計処理による辞書のデータを自動生成する処理については、例えば非特許文献1で述べられている公知の自動用語抽出方法を利用することによって実現可能にする構成であってもよい。   Note that the process of automatically generating dictionary data by statistical processing based on important words extracted from case data is realized by using a known automatic term extraction method described in Non-Patent Document 1, for example. The structure which makes it possible may be sufficient.

また、本実施の形態では、第2一般化処理部17で用語の一般化を行った重要語を含む各文のデータをもとに、重要語を含む各文のデータの文構造知識のデータを作成する文構造知識自動作成部を備える構成であってもよく、また、文構造知識自動作成部で作成した文構造知識のデータをもとに、第1一般化処理部13が、重要語を含む各文中の用語の一般化を行う構成であってもよい。なお、文構造知識を自動生成する処理については、例えば非特許文献2で述べられている公知の方法を利用することによって実現可能にする構成であってもよい。   In the present embodiment, the data of the sentence structure knowledge of the data of each sentence including the important word based on the data of each sentence including the important word subjected to the term generalization in the second generalization processing unit 17 The first generalization processing unit 13 may use an important word based on the sentence structure knowledge data created by the sentence structure knowledge automatic creation unit. The structure which generalizes the term in each sentence containing can be sufficient. The process for automatically generating sentence structure knowledge may be realized by using a known method described in Non-Patent Document 2, for example.

なお、本実施の形態では、因果関係データ収集部21で事例ごとにまとめて因果関係のデータを収集する構成を示したが、必ずしもこれに限らない。例えば、因果関係データ収集部21が、事例ごとにまとめて収集した因果関係のデータから、事例ごとの因果ネットワークまたはスコアが付与されていない事例ごとの因果ネットワークを作成して、因果関係データ格納部22にデータを格納する構成であってもよい。この場合、マッチング部31で因果ネットワークデータ格納部20に格納されている因果ネットワークのデータと因果関係データ格納部22に格納されている事例ごとの因果ネットワークのデータとのマッチングを行い、最も重なりの一致した因果ネットワーク(因果ネットワークデータ格納部20に格納されていた因果ネットワーク)上の因果パスを用いて類似検索を行う構成にすればよい。   In the present embodiment, the causal relationship data collecting unit 21 collects the causal relationship data for each case, but the present invention is not necessarily limited thereto. For example, the causal relationship data collection unit 21 creates a causal network for each case to which a causal network for each case or no score is assigned from the causal relationship data collected collectively for each case, and the causal relationship data storage unit 22 may be configured to store data. In this case, the matching unit 31 performs matching between the causal network data stored in the causal network data storage unit 20 and the causal network data for each case stored in the causal relationship data storage unit 22, and the most overlapping A similar search may be performed using a causal path on the matched causal network (causal network stored in the causal network data storage unit 20).

また、本実施の形態では、マッチング部31で得た因果パスのデータを用いて類似検索部32で類似検索を行う構成について示したが、必ずしもこれに限らない。例えば、マッチング部31で得た因果パスのデータを図示しない表示部に送り、表示部で当該因果パスを表示する構成であってもよい。   Further, in the present embodiment, the configuration in which the similarity search unit 32 performs the similarity search using the causal path data obtained by the matching unit 31 has been described, but the configuration is not necessarily limited thereto. For example, the causal path data obtained by the matching unit 31 may be sent to a display unit (not shown), and the causal path may be displayed on the display unit.

次に、図4ないし図8を用いて、因果推論装置1での動作フローについて説明を行う。図4は、因果推論装置1での動作フローを示すフローチャートである。図5は入力部11に入力される文章の一例を示す図である。図6は、第1重要語抽出部12による重要語を含む文の選択の一例を示す図である。図7は、第1一般化処理部13による用語の一般化の一例を示す図である。図8は、文構造解析部14による文構造の解析結果の一例を示す図である。   Next, the operation flow in the causal inference apparatus 1 will be described with reference to FIGS. FIG. 4 is a flowchart showing an operation flow in the causal reasoning apparatus 1. FIG. 5 is a diagram illustrating an example of text input to the input unit 11. FIG. 6 is a diagram illustrating an example of selection of a sentence including an important word by the first important word extraction unit 12. FIG. 7 is a diagram illustrating an example of generalization of terms by the first generalization processing unit 13. FIG. 8 is a diagram illustrating an example of a sentence structure analysis result by the sentence structure analysis unit 14.

まず、ステップS1では、入力部11が、文章(検索文字列)または文章のデータの入力を受け付け、ステップS2に移る。具体例を示すと、ステップS1の処理では、図5に示すような後の処理の原文となる文章の入力を入力部11で受け付ける。そして、ステップS2では、第1重要語抽出部12が、ドメイン辞書のデータをもとに、入力部11から送られてきたテキストデータからドメイン辞書に収められている単語(重要語)を含む文を選択し、抽出する。具体例を示すと、ステップS2の処理では、図6中の下線部で示すように、第1重要語抽出部12によって重要語を含む文のみが選択され、重要語を含む文のテキストデータが第1一般化処理部13に送られる。   First, in step S1, the input unit 11 accepts input of text (search character string) or text data, and proceeds to step S2. As a specific example, in the process of step S1, the input unit 11 receives an input of a sentence as a source sentence of the subsequent process as shown in FIG. Then, in step S2, the first important word extraction unit 12 uses the domain dictionary data, and the sentence including words (important words) stored in the domain dictionary from the text data sent from the input unit 11 Select and extract. As a specific example, in the process of step S2, as indicated by the underlined portion in FIG. 6, only the sentence including the important word is selected by the first important word extracting unit 12, and the text data of the sentence including the important word is obtained. It is sent to the first generalization processing unit 13.

続いて、ステップS3では、第1一般化処理部13が、類語辞典のデータをもとに、重要語を含む各文中の用語の一般化を行い、ステップS4に移る。具体例を示すと、ステップS3の処理では、図7の網かけした箇所に示すように、類語辞典のデータをもとに、同義関係、類義関係などにある用語が存在した場合には、第1一般化処理部13によって統一した用語に変換が行われ、一般化を行った文のテキストデータが文構造解析部14に送られる。   Subsequently, in step S3, the first generalization processing unit 13 generalizes terms in each sentence including important words based on the data of the thesaurus, and proceeds to step S4. As a specific example, in the process of step S3, as shown in the shaded part of FIG. 7, based on the data of the thesaurus, if there are terms that have a synonym relationship, a synonym relationship, etc., The first generalization processing unit 13 performs conversion into the unified term, and the generalized text data of the sentence is sent to the sentence structure analysis unit 14.

また、ステップS4では、文構造解析部14が、文構造知識のデータをもとに、一般化を行った各文の格解析・係り受けの解析などといった文構造の解析を行い、ステップS5に移る。具体例を示すと、ステップS4の処理では、図8に示すように、各文中の用語間の関係が決定され、各文中の因果関係が抽出される。なお、図8では、原因にあたる事象から結果にあたる事象に矢印を引くことによって因果関係を表現している。また、ステップS4の処理では、文構造の解析の結果得られるデータ(文構造の解析の結果)が推論部23に送られる。   In step S4, the sentence structure analysis unit 14 analyzes the sentence structure such as case analysis and dependency analysis of each sentence that has been generalized based on the sentence structure knowledge data. Move. As a specific example, in the process of step S4, as shown in FIG. 8, the relationship between terms in each sentence is determined, and the causal relationship in each sentence is extracted. In FIG. 8, the causal relationship is expressed by drawing an arrow from the event corresponding to the cause to the event corresponding to the result. In step S4, data obtained as a result of sentence structure analysis (result of sentence structure analysis) is sent to the inference unit 23.

そして、ステップS5では、推論部23が、文構造解析部14から送られてくる文構造の解析の結果(因果関係のデータ)と因果ネットワークデータ格納部20に格納されている因果ネットワークのデータとのマッチングを行い、最も重なりの一致した因果ネットワーク上の因果パスを用いて類似検索を行う。そして、類似検索の結果として得られる事例を図示しない表示部に出力し、フローを終了する。   In step S 5, the inference unit 23 receives the sentence structure analysis result (causal relation data) sent from the sentence structure analysis unit 14 and the causal network data stored in the causal network data storage unit 20. Similarity search is performed using the causal path on the causal network with the most overlap. Then, the case obtained as a result of the similarity search is output to a display unit (not shown), and the flow ends.

次に、図9ないし図11(b)を用いて、推論部23での動作フローについて説明を行う。図9は、因果推論装置1の推論部23での動作フローを示すフローチャートである。図10は、マッチング部31でのマッチングの結果得られる因果パスの一例を示す図である。図11(a)は、ある事例から重用語を含む文を抽出した結果の一部を抜粋して示した図である。そして、図11(b)は、ある事例から得られた因果関係の一部を抜粋して示した図である。   Next, an operation flow in the inference unit 23 will be described with reference to FIGS. 9 to 11B. FIG. 9 is a flowchart showing an operation flow in the inference unit 23 of the causal inference apparatus 1. FIG. 10 is a diagram illustrating an example of a causal path obtained as a result of matching in the matching unit 31. FIG. 11A shows a part of the result of extracting a sentence including a heavy term from a certain case. FIG. 11B is a diagram showing a part of the causal relationship obtained from a certain case.

まず、ステップS51では、マッチング部31が文構造の解析の結果を文構造解析部14から受け取る。続いてステップS52では、マッチング部31がテキストデータの順序を入れ替えることなく、一致しない箇所にはnullノードを挿入しながら、文構造の解析の結果を因果ネットワークのデータに重ね合わせる(マッチングを行う)。詳しくは、文構造の解析の結果得られる図8に示したようなテキストデータを、並び順に従って順番に、因果ネットワークのデータと一致させていき、最も因果構造が一致している因果ネットワーク上の因果パスを選択(生成)する。なお、ここで言うところの最も因果構造が一致している因果ネットワーク上の因果パスとは、構造の解析の結果得られるテキストデータと因果ネットワークのデータとが最初に一致したノードから、最後に一致したノードまでのパスを表している。また、因果パスには、因果ネットワーク上のスコアが付与される。さらに、本実施の形態では、最も因果構造が一致している因果ネットワーク上の因果パスに限らず、因果構造の類似度が所定の高さ以上の因果パスを選択(生成)構成であってもよい。なお、ここで言うところの類似度とは当該因果パスと一致している割合に基づいたスコアを指すものであり、前述した類似度と同様にして求められるものである。また、所定の高さとは、任意に設定されるものである。   First, in step S <b> 51, the matching unit 31 receives a sentence structure analysis result from the sentence structure analysis unit 14. Subsequently, in step S52, the matching unit 31 superimposes the result of the sentence structure analysis on the data of the causal network while inserting the null node in the non-matching place without changing the order of the text data (matching is performed). . Specifically, the text data as shown in FIG. 8 obtained as a result of the analysis of the sentence structure is matched with the data of the causal network in order according to the arrangement order, and the data on the causal network having the best causal structure. Select (generate) a causal path. Note that the causal path on the causal network where the causal structure most closely matches here is the last match from the node where the text data obtained as a result of the structural analysis and the data of the causal network match first. Represents the path to the selected node. A score on the causal network is assigned to the causal path. Further, in the present embodiment, not only the causal path on the causal network with the most matching causal structure but also a causal path having a causal structure similarity of a predetermined height or higher is selected (generated). Good. Note that the similarity described here refers to a score based on the ratio that matches the causal path, and is obtained in the same manner as the similarity described above. The predetermined height is arbitrarily set.

また、本実施の形態では、最も重なりの一致した因果ネットワーク上の因果パスを選択する構成を示したが、必ずしもこれに限らない。例えば、文構造の解析の結果得られる図8に示したようなテキストデータを、並び順に従って順番に、一致しない箇所にはnullノードを挿入しながら因果ネットワークのデータと一致させていくとともに、一致した箇所の間のパスに挿入されたnullノードを因果ネットワークのノードと入れ替えていくことによって、図10に示すような、文構造の解析の結果得られるテキストデータに由来するノードと因果ネットワークのデータに由来するノードとから生成される因果パスを得る構成であってもよい。なお、文構造の解析の結果得られるテキストデータに由来するノードと因果ネットワークのデータに由来するノードとから生成される因果パスでは、文構造の解析の結果得られるテキストデータに由来するノードのうちの、最初のノードから最後のノードまでを含むとともに、最初のノードから最後のノードまでの間のノードに、必要に応じて因果ネットワークのデータに由来するノードが挿入されている構造になっている。図10で具体例を示すと、図中で網かけされている箇所が因果ネットワークのデータに由来するノードであり、網かけしていない箇所が文構造の解析の結果得られるテキストデータに由来するノードである。なお、因果パスには、因果ネットワーク上のスコアが付与されるとともに、構造の解析の結果得られるテキストデータに由来するノード間のアークには、最高値の1.0のスコアが付与される。   In the present embodiment, a configuration has been shown in which the causal path on the causal network with the most overlap is selected, but the present invention is not necessarily limited thereto. For example, the text data as shown in FIG. 8 obtained as a result of the analysis of the sentence structure is matched with the data of the causal network while inserting null nodes in the order that does not match in order according to the arrangement order. The nodes and causal network data derived from the text data obtained as a result of the analysis of the sentence structure as shown in FIG. 10 by replacing the null node inserted in the path between the locations with the causal network nodes. The structure which acquires the causal path produced | generated from the node originating in may be sufficient. In the causal path generated from the node derived from the text data obtained as a result of the sentence structure analysis and the node derived from the data of the causal network, the nodes derived from the text data obtained as a result of the sentence structure analysis In addition to the first node to the last node, the nodes between the first node and the last node are inserted into the nodes from the causal network data as necessary. . Referring to a specific example in FIG. 10, shaded locations in the diagram are nodes derived from causal network data, and unshaded locations are derived from text data obtained as a result of sentence structure analysis. It is a node. The causal path is given a score on the causal network, and an arc between nodes derived from text data obtained as a result of structural analysis is given a maximum score of 1.0.

なお、本実施の形態では、最も一致したものだけでなく、文構造の解析の結果得られるテキストデータと因果ネットワークのデータとの類似度が所定の高さ以上のものを一致しているものとして、複数の因果パスの候補を生成する構成であってもよい。なお、ここで言うところの類似度とは当該因果パスと一致している割合に基づいたスコアを指すものであり、前述した類似度と同様にして求められるものである。また、ここで言うところの所定の高さとは、任意に設定されるものである。   In the present embodiment, it is assumed that the similarity between the text data obtained as a result of the sentence structure analysis and the data of the causal network is equal to or higher than a predetermined height, in addition to the best match. The configuration may be such that a plurality of causal path candidates are generated. Note that the similarity described here refers to a score based on the ratio that matches the causal path, and is obtained in the same manner as the similarity described above. In addition, the predetermined height here is arbitrarily set.

そして、ステップS53では、類似検索部32が、マッチング部31で選択した因果パスに類似する因果関係を含む因果関係データ群を因果関係データ格納部22に格納されている因果関係データ群から選択する。例として、図11(a)に示すような、ある事例から重用語を含む文を抽出した結果をもとに得られる、図11(b)に示すような因果関係と図10に示す因果パスとの類似性について説明を行う。図11(b)に示す因果関係のうち、図10に示す因果ネットワーク上のパスと一致している因果関係は、「“素材劣化”によって“割れ・亀裂”が起こった」、「“割れ・亀裂”によって“内容物漏洩”が起こった」、および「“可燃物漏洩”によって“火災・爆発”が起こった」という因果関係である。そして、類似検索部32では、上述したように一致したパスに付与されているスコアを合算し、因果パスと各事例ごとの因果関係データ群との類似性の強さの指標とする。類似検索部32では、このように各事例ごとに類似性の強さを求め、最もスコアの大きい因果関係データ群、またはスコアの大きい上位数組の因果関係データ群を、上述の類似する因果関係を含む因果関係データ群として選択する。   In step S <b> 53, the similarity search unit 32 selects a causal relationship data group including a causal relationship similar to the causal path selected by the matching unit 31 from the causal relationship data group stored in the causal relationship data storage unit 22. . As an example, the causal relationship as shown in FIG. 11B and the causal path shown in FIG. 10 obtained based on the result of extracting a sentence including a heavy term from a case as shown in FIG. The similarity to is explained. Among the causal relationships shown in FIG. 11B, the causal relationships that coincide with the paths on the causal network shown in FIG. 10 are “crack / crack occurred due to“ material degradation ””, “ This is a causal relationship that “content leak” occurred due to “crack” and “fire / explosion occurred due to“ flammable leak ””. Then, the similarity search unit 32 adds up the scores given to the matched paths as described above, and uses it as an index of the strength of similarity between the causal path and the causal relation data group for each case. In the similarity search unit 32, the strength of similarity is obtained for each case in this way, and the causal relationship data group with the highest score or the higher-ranked causal relationship data group with the highest score is used as the above-mentioned similar causal relationship. Is selected as a causal relationship data group including

続いて、類似検索部32は、選択の結果得られた因果関係データ群に対応する事例を、事例データ群ごとに付与されている各事例を同定するためのIDに基づいて同定し、該当する事例を事例データベースから読み出す。そして、類似検索部32は、読み出した事例を検索結果として図示しない表示部に出力し、フローを終了する。   Subsequently, the similarity search unit 32 identifies a case corresponding to the causal relationship data group obtained as a result of the selection based on an ID for identifying each case assigned to each case data group, and corresponds. Read the case from the case database. And the similarity search part 32 outputs the read example to the display part which is not shown in figure as a search result, and complete | finishes a flow.

次に、本発明によって得られる効果について、図12および図13を用いて説明を行う。図12は、従来の検索手法による類似検索の結果の一例を示す図である。また、図13は、本発明の検索手法による類似検索の結果の一例を示す図である。ここでは、失敗の原因究明を目的として、過去の失敗事例を収めたデータベースから検索を行う場合を例にとって説明を行う。   Next, the effect obtained by the present invention will be described with reference to FIGS. FIG. 12 is a diagram illustrating an example of a result of a similarity search using a conventional search method. FIG. 13 is a diagram showing an example of the result of the similarity search by the search method of the present invention. Here, for the purpose of investigating the cause of failure, a case where a search is performed from a database containing past failure cases will be described as an example.

まず、図12を用いて、対象とする現象を表す文字列の表層的な類似性をもとにして検索を行う、従来の検索手法を用いて検索を行った場合の例を示す。図12に示すように、従来の検索手法では、検索文字列との表層的な類似性をもとにして検索を行うので、現象Aを表す文章を検索文字列として検索を行うと、「緊急停止」、「漏洩」、および「発火」といった共通の用語を含む現象Bの事例が検索結果として得られる。しかしながら、現象Aと現象Bとの間では、「発火」という結果の原因はそれぞれ、「配管の劣化」と「油の粘度の増加による弁詰まり」と異なっており、従来の検索手法を用いて検索を行った場合には、失敗の原因究明を行うのに適切な事例を過去の失敗事例から検索できないことになる。   First, FIG. 12 is used to show an example in which a search is performed using a conventional search method in which a search is performed based on the surface layer similarity of character strings representing a target phenomenon. As shown in FIG. 12, in the conventional search method, the search is performed based on the surface similarity with the search character string. An example of phenomenon B including common terms such as “stop”, “leakage”, and “ignition” is obtained as a search result. However, between the phenomenon A and the phenomenon B, the cause of the result of “ignition” is different from “deterioration of piping” and “valve clogging due to an increase in oil viscosity”, respectively. When a search is performed, it is impossible to search for a case suitable for investigating the cause of the failure from past failure cases.

これに対して、本発明の検索手法によれば、検索文字列から因果関係を抽出し、抽出した因果関係をもとにして、因果関係に類似性のある事例の検索を行うので、図13に示すように、現象Aを表す文章を検索文字列として検索を行うと、“「素材劣化」によって「亀裂・流出」が起こった”という因果関係が共通な現象Cの事例が検索結果として得られることになる。現象Aと現象Cとの間では、「発火」という結果の原因はそれぞれ、「配管の劣化」と「タンクの劣化」となっており、素材の劣化という点で共通する結果が得られる。従って、「発火」の原因が素材の劣化であることが推測できるようになる。以上のように、本発明によれば、失敗の原因究明を行うのに適切な事例を過去の失敗事例から検索することが可能になる。すなわち、対象とする現象に結び付く原因を求めるための事例検索において、より検索精度を高めることができる。   On the other hand, according to the search method of the present invention, a causal relationship is extracted from the search character string, and a case similar to the causal relationship is searched based on the extracted causal relationship. As shown in Fig. 2, when a sentence representing phenomenon A is searched as a search character string, a case of phenomenon C having a common causal relationship "crack / outflow caused by" material degradation "" is obtained as a search result. Between the phenomena A and C, the cause of the result of “ignition” is “deterioration of the piping” and “deterioration of the tank”, respectively. Is obtained. Accordingly, it can be estimated that the cause of “ignition” is deterioration of the material. As described above, according to the present invention, it is possible to search from past failure cases for cases suitable for investigating the cause of failure. That is, the search accuracy can be further improved in the case search for finding the cause that leads to the target phenomenon.

本発明の因果推論装置1の応用例としては、失敗の原因究明を目的として、過去の失敗事例を収めたデータベースから検索を行うことが挙げられる。すなわち、発生した失敗についての可観測な現象を表す文字列を検索文字列として、因果推論装置1を用いて、過去の失敗事例を収めたデータベースから因果関係の類似した事例を検索するのに用いることが可能である。また、他にも、故障についてのコールセンターへの顧客問い合わせの内容に基づいて、過去の故障事例を収めたデータベースから故障の原因の類似した事例を検索したり、身体の計測データの内容に基づいて、過去の疾患の事例を収めたデータベースから類似した事例を検索することによって、現在罹っている病気、将来起こり得る病気などを推測したりするなど、類推を必要とする問題解決処理に適用することが可能である。   As an application example of the causal reasoning apparatus 1 of the present invention, for the purpose of investigating the cause of failure, a search is performed from a database containing past failure cases. That is, using a character string representing an observable phenomenon about the failure that has occurred as a search character string, the causal reasoning apparatus 1 is used to search for a case having similar causal relationships from a database containing past failure cases. It is possible. In addition, based on the contents of customer inquiries to the call center about breakdowns, search for similar cases of the causes of breakdowns from a database of past breakdown cases, or based on the contents of physical measurement data Applying to problem-solving processes that require analogy, such as inferring current and future illnesses by searching for similar cases from a database of past disease cases Is possible.

最後に、因果推論装置1の各ブロックは、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。   Finally, each block of the causal reasoning apparatus 1 may be configured by hardware logic, or may be realized by software using a CPU as follows.

すなわち、因果推論装置1は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである因果推論装置1の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読取り可能に記録した記録媒体を、因果推論装置1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。   That is, the causal inference apparatus 1 includes a CPU (central processing unit) that executes instructions of a control program that realizes each function, a ROM (read only memory) that stores the program, and a RAM (random access memory) that expands the program. And a storage device (recording medium) such as a memory for storing the program and various data. An object of the present invention is to provide a recording medium in which a program code (execution format program, intermediate code program, source program) of a control program of the causal reasoning apparatus 1 which is software that realizes the above-described functions is recorded so as to be readable by a computer. This can also be achieved by supplying the causal reasoning apparatus 1 and reading and executing the program code recorded on the recording medium by the computer (or CPU or MPU).

上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。   Examples of the recording medium include a tape system such as a magnetic tape and a cassette tape, a magnetic disk such as a floppy (registered trademark) disk / hard disk, and an optical disk such as a CD-ROM / MO / MD / DVD / CD-R. Card system such as IC card, IC card (including memory card) / optical card, or semiconductor memory system such as mask ROM / EPROM / EEPROM / flash ROM.

また、因果推論装置1を通信ネットワークと接続可能に構成し、上記プログラムコードを、通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。   Moreover, the causal inference apparatus 1 may be configured to be connectable to a communication network, and the program code may be supplied via the communication network. The communication network is not particularly limited. For example, the Internet, intranet, extranet, LAN, ISDN, VAN, CATV communication network, virtual private network, telephone line network, mobile communication network, satellite communication. A net or the like is available. Also, the transmission medium constituting the communication network is not particularly limited. For example, even in the case of wired such as IEEE 1394, USB, power line carrier, cable TV line, telephone line, ADSL line, etc., infrared rays such as IrDA and remote control, Bluetooth ( (Registered trademark), 802.11 wireless, HDR, mobile phone network, satellite line, terrestrial digital network, and the like can also be used. The present invention can also be realized in the form of a computer data signal embedded in a carrier wave in which the program code is embodied by electronic transmission.

なお、本発明は、上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。   The present invention is not limited to the above-described embodiments, and various modifications can be made within the scope of the claims, and the technical means disclosed in different embodiments can be appropriately combined. Such embodiments are also included in the technical scope of the present invention.

以上のように、本発明の因果推論装置、その制御プログラムおよび制御方法は、対象とする現象に結び付く原因を求めるための事例検索において、より検索精度を高めることを可能にする。従って、本発明は、対象とする現象に結び付く原因を事例検索によって求める装置に関連する産業分野に好適に用いることができる。   As described above, the causal reasoning apparatus, the control program, and the control method thereof according to the present invention make it possible to further improve the search accuracy in the case search for obtaining the cause associated with the target phenomenon. Therefore, the present invention can be suitably used in an industrial field related to an apparatus that obtains a cause that leads to a target phenomenon by a case search.

本発明における因果推論装置の実施の一形態を示す機能ブロック図である。It is a functional block diagram which shows one Embodiment of the causal inference apparatus in this invention. (a)は、複数の事例から重用語を含む文を抽出した結果の一例を示す図であり、(b)は、複数の事例から得られた因果関係の一例を示す図である。(A) is a figure which shows an example of the result of having extracted the sentence containing a heavy term from a some example, (b) is a figure which shows an example of the causal relationship obtained from the some example. (a)は、本発明における因果ネットワークの一例を示す図であり、(b)は、因果関係と因果関係の強さとの対応付けの一例を示す図である。(A) is a figure which shows an example of the causal network in this invention, (b) is a figure which shows an example of matching with causal relation and the strength of causal relation. 上記因果推論装置での動作フローを示すフローチャートである。It is a flowchart which shows the operation | movement flow in the said causal inference apparatus. 上記因果推論装置の入力部に入力される文章の一例を示す図である。It is a figure which shows an example of the text input into the input part of the said causal inference apparatus. 本発明における重要語を含む文の選択の一例を示す図である。It is a figure which shows an example of selection of the sentence containing the important word in this invention. 本発明における用語の一般化の一例を示す図である。It is a figure which shows an example of the generalization of the term in this invention. 本発明における文構造の解析結果の一例を示す図である。It is a figure which shows an example of the analysis result of the sentence structure in this invention. 上記因果推論装置の推論部での動作フローを示すフローチャートである。It is a flowchart which shows the operation | movement flow in the reasoning part of the said causal reasoning apparatus. 上記因果推論装置のマッチング部でのマッチングの結果得られる因果パスの一例を示す図である。It is a figure which shows an example of the causal path obtained as a result of the matching in the matching part of the said causal reasoning apparatus. (a)は、ある事例から重用語を含む文を抽出した結果の一部を抜粋して示した図であり、(b)は、ある事例から得られた因果関係の一部を抜粋して示した図である。(A) is a diagram showing an excerpt of a part of the result of extracting a sentence containing a heavy term from a case. (B) is an excerpt of a part of the causal relationship obtained from a case. FIG. 従来の検索手法による類似検索の結果の一例を示す図である。It is a figure which shows an example of the result of the similar search by the conventional search method. 本発明の検索手法による類似検索の結果の一例を示す図である。It is a figure which shows an example of the result of the similarity search by the search method of this invention.

符号の説明Explanation of symbols

1 因果推論装置
11 入力部(文章データ取得手段手段)
12 第1重要語抽出部
13 第1一般化処理部
14 文構造解析部(第1因果関係抽出手段)
15 事例データ取得部(事例データ取得手段)
16 第2重要語抽出部
17 第2一般化処理部
18 因果関係抽出部(第2因果関係抽出手段)
19 因果ネットワーク作成部(因果ネットワーク作成手段)
20 因果ネットワークデータ格納部
21 因果関係データ収集部(因果関係データ収集手段)
22 因果関係データ格納部(因果関係データ格納部)
23 推論部
31 マッチング部(推論手段)
32 類似検索部(類似検索手段)
1 Causal Reasoning Device 11 Input unit (text data acquisition means)
12 1st important word extraction part 13 1st generalization process part 14 Sentence structure analysis part (1st causal relationship extraction means)
15 Case data acquisition unit (Case data acquisition means)
16 second important word extraction unit 17 second generalization processing unit 18 causal relationship extraction unit (second causal relationship extraction means)
19 Causal network creation unit (causal network creation means)
20 Causal network data storage unit 21 Causal relationship data collection unit (causal relationship data collection means)
22 Causal relationship data storage unit (causal relationship data storage unit)
23 Inference part 31 Matching part (inference means)
32 Similarity search part (similarity search means)

Claims (6)

対象となる現象について記された文章のデータを取得する文章データ取得手段と、
受け付けた上記文章中の文構造を解析することによって、当該文章に含まれる文中の語句同士の因果関係を抽出する第1因果関係抽出手段と、
現象について予め記された文章である複数の事例のデータを格納しているデータベースから事例のデータを取得する事例データ取得手段と、
取得した事例の文章中の文構造を解析することによって、事例中の文章に含まれる文中の語句同士の因果関係を抽出する第2因果関係抽出手段と、
第2因果関係抽出手段によって複数の事例から抽出した複数の因果関係のそれぞれを、因果関係を構成する語句間の重なりに応じて連結し、ネットワーク状に表したものである、因果ネットワークのデータを作成する因果ネットワーク作成手段と、
第1因果関係抽出手段で抽出した因果関係のデータと上記因果ネットワークのデータとに基づいて、上記因果関係が上記因果ネットワーク上のどのパスに類似するのかを推論し、上記推論したパスに基づいて因果パスを生成する推論手段とを備えることを特徴とする因果推論装置。
Text data acquisition means for acquiring text data describing the phenomenon of interest;
First causal relationship extraction means for extracting a causal relationship between words in a sentence included in the sentence by analyzing the sentence structure in the accepted sentence;
Case data acquisition means for acquiring case data from a database storing a plurality of case data that are sentences written in advance about the phenomenon;
A second causal relationship extracting means for extracting a causal relationship between words in a sentence included in the sentence in the sentence by analyzing a sentence structure in the sentence of the acquired case;
The causal network data obtained by connecting each of the plurality of causal relationships extracted from the plurality of cases by the second causal relationship extracting means according to the overlap between the words and phrases constituting the causal relationship, and representing the data of the causal network. A causal network creation means to create,
Based on the causal relation data extracted by the first causal relation extracting means and the data of the causal network, it is inferred which path on the causal network the causal relation is similar to, and based on the inferred path A causal inference apparatus comprising an inference means for generating a causal path.
前記第2因果関係抽出手段で抽出された因果関係のデータを、各事例ごとに収集する因果関係データ収集手段と、
各事例ごとに収集した因果関係のデータである因果関係データ群を各事例ごとに区別して格納する因果関係データ格納部と、
前記推論手段で生成した因果パスに類似する因果関係データ群を上記因果関係データ格納部から選択し、選択した因果関係データ群に対応する事例を前記データベースから読み出す類似検索手段とをさらに備えることを特徴とする請求項1に記載の因果推論装置。
Causal relation data collecting means for collecting the data of the causal relation extracted by the second causal relation extracting means for each case;
A causal relationship data storage unit that stores causal relationship data groups that are data of causal relationships collected for each case separately for each case;
Selecting a causal relation data group similar to the causal path generated by the inference means from the causal relation data storage unit, and further comprising a similar search means for reading out a case corresponding to the selected causal relation data group from the database. The causal inference apparatus according to claim 1, wherein the causal inference apparatus is characterized by the following.
前記因果パスは、前記第1因果関係抽出手段で抽出した因果関係と前記因果ネットワークとが類似する箇所にあたる上記因果ネットワーク上のパスであることを特徴とする請求項1に記載の因果推論装置。   2. The causal reasoning apparatus according to claim 1, wherein the causal path is a path on the causal network corresponding to a place where the causal relation extracted by the first causal relation extracting unit is similar to the causal network. 前記因果パスは、前記第1因果関係抽出手段で抽出した因果関係と前記因果ネットワークとが類似する箇所にあたる上記因果ネットワーク上のパスに、上記因果関係を繋ぎ合わせたパスであることを特徴とする請求項1に記載の因果推論装置。   The causal path is a path obtained by connecting the causal relationship to a path on the causal network corresponding to a location where the causal relationship extracted by the first causal relationship extracting unit is similar to the causal network. The causal reasoning apparatus according to claim 1. 文章データ取得手段によって、対象となる現象について記された文章のデータを取得する文章データ取得ステップと、
第1因果関係抽出手段によって、文章データ取得ステップで受け付けた上記文章中の文構造を解析することによって、当該文章に含まれる文中の語句同士の因果関係を抽出する第1因果関係抽出ステップと、
事例データ取得手段によって、現象について予め記された文章である複数の事例のデータを格納しているデータベースから事例のデータを取得する事例データ取得ステップと、
第2因果関係抽出手段によって、事例データ取得ステップで取得した事例の文章中の文構造を解析することによって、事例中の文章に含まれる文中の語句同士の因果関係を抽出する第2因果関係抽出ステップと、
因果ネットワーク作成手段によって、第2因果関係抽出ステップによって複数の事例から抽出した複数の因果関係のそれぞれを、因果関係を構成する語句間の重なりに応じて連結し、ネットワーク状に表したものである、因果ネットワークのデータを作成する因果ネットワーク作成ステップと、
推論手段によって、第1因果関係抽出ステップで抽出した因果関係のデータと上記因果ネットワークのデータとに基づいて、上記因果関係が上記因果ネットワーク上のどのパスに類似するのかを推論し、上記推論したパスに基づいて因果パスを生成する推論ステップとを含むことを特徴とする因果推論装置の制御方法。
A sentence data acquisition step of acquiring sentence data described about the target phenomenon by the sentence data acquisition means;
A first causal relationship extracting step of extracting a causal relationship between words in a sentence included in the sentence by analyzing a sentence structure in the sentence received in the sentence data acquiring step by a first causal relation extracting unit;
A case data acquisition step for acquiring case data from a database storing a plurality of case data, which are sentences preliminarily described about the phenomenon, by case data acquisition means;
The second causal relationship extraction unit extracts the causal relationship between words in the sentence included in the sentence in the case by analyzing the sentence structure in the sentence of the case acquired in the case data acquisition step by the second causal relation extracting unit. Steps,
Each of a plurality of causal relationships extracted from a plurality of cases in the second causal relationship extraction step by the causal network creation means is connected in accordance with the overlap between words constituting the causal relationship and represented in a network form. A causal network creation step for creating causal network data;
Based on the causal relation data extracted in the first causal relation extracting step and the data of the causal network, the reasoning means infers which path on the causal network is similar to the causal network and inferred from the reasoning means. A causal inference apparatus control method comprising: an inference step for generating a causal path based on the path.
コンピュータに、
対象となる現象について記された文章のデータを取得する文章データ取得ステップと、
受け付けた上記文章中の文構造を解析することによって、当該文章に含まれる文中の語句同士の因果関係を抽出する第1因果関係抽出ステップと、
現象について予め記された文章である複数の事例のデータを格納しているデータベースから事例のデータを取得する事例データ取得ステップと、
取得した事例の文章中の文構造を解析することによって、事例中の文章に含まれる文中の語句同士の因果関係を抽出する第2因果関係抽出ステップと、
第2因果関係抽出手段によって複数の事例から抽出した複数の因果関係のそれぞれを、因果関係を構成する語句間の重なりに応じて連結し、ネットワーク状に表したものである、因果ネットワークのデータを作成する因果ネットワーク作成ステップと、
第1因果関係抽出手段で抽出した因果関係のデータと上記因果ネットワークのデータとに基づいて、上記因果関係が上記因果ネットワーク上のどのパスに類似するのかを推論し、上記推論したパスに基づいて因果パスを生成する推論ステップとを動作させる因果推論装置の制御プログラム。
On the computer,
A sentence data acquisition step for acquiring sentence data describing the phenomenon of interest;
A first causal relationship extracting step of extracting a causal relationship between words in the sentence included in the sentence by analyzing the sentence structure in the accepted sentence;
A case data acquisition step of acquiring case data from a database storing a plurality of case data which are sentences written in advance about the phenomenon;
A second causal relationship extracting step of extracting a causal relationship between words in the sentence included in the sentence in the case by analyzing the sentence structure in the sentence of the acquired case;
The causal network data obtained by connecting each of the plurality of causal relationships extracted from the plurality of cases by the second causal relationship extracting means according to the overlap between the words and phrases constituting the causal relationship, and representing the data of the causal network. A causal network creation step to create,
Based on the causal relation data extracted by the first causal relation extracting means and the data of the causal network, it is inferred which path on the causal network the causal relation is similar to, and based on the inferred path A control program for a causal inference apparatus that operates an inference step for generating a causal path.
JP2007067345A 2007-03-15 2007-03-15 Causal reasoning apparatus, control program and control method thereof Active JP5034580B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007067345A JP5034580B2 (en) 2007-03-15 2007-03-15 Causal reasoning apparatus, control program and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007067345A JP5034580B2 (en) 2007-03-15 2007-03-15 Causal reasoning apparatus, control program and control method thereof

Publications (2)

Publication Number Publication Date
JP2008226168A JP2008226168A (en) 2008-09-25
JP5034580B2 true JP5034580B2 (en) 2012-09-26

Family

ID=39844655

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007067345A Active JP5034580B2 (en) 2007-03-15 2007-03-15 Causal reasoning apparatus, control program and control method thereof

Country Status (1)

Country Link
JP (1) JP5034580B2 (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5404575B2 (en) * 2010-10-04 2014-02-05 日本電信電話株式会社 EXPERIENCE FACTOR RELATIONSHIP APPARATUS AND METHOD AND PROGRAM
JP5682448B2 (en) * 2011-05-20 2015-03-11 日本電気株式会社 Causal word pair extraction device, causal word pair extraction method, and causal word pair extraction program
JP5737642B2 (en) * 2014-08-15 2015-06-17 洋彰 宮崎 Autonomous knowledge improvement device
JP6547436B2 (en) * 2015-06-16 2019-07-24 日本電気株式会社 INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND PROGRAM
JP6767042B2 (en) * 2016-09-26 2020-10-14 国立研究開発法人情報通信研究機構 Scenario passage classifier, scenario classifier, and computer programs for it
WO2018159237A1 (en) * 2017-02-28 2018-09-07 国立研究開発法人物質・材料研究機構 Search method, search device, and search system
JP7305566B2 (en) 2020-01-21 2023-07-10 株式会社東芝 Information processing device, information processing system, and information processing program
JP2022122029A (en) * 2021-02-09 2022-08-22 株式会社東芝 Data processing device, data processing method, and data processing program
WO2022191379A1 (en) * 2021-03-10 2022-09-15 서울대학교산학협력단 Text-based relation extraction method and device
WO2023175687A1 (en) * 2022-03-14 2023-09-21 株式会社日立製作所 Logic model creation assistance device, logic model creation assistance method, and logic model creation assistance program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0973315A (en) * 1995-09-07 1997-03-18 Mitsubishi Electric Corp Equipment failure diagnostic device
JPH11250085A (en) * 1998-03-02 1999-09-17 Nippon Telegr & Teleph Corp <Ntt> Event transition estimating method and record medium recording event transition estimation program
JP2002014990A (en) * 2000-06-28 2002-01-18 Communication Research Laboratory Question answering system, question answering processing method, transformation rule automatic acquisition processing method and recording medium for these system and method programs

Also Published As

Publication number Publication date
JP2008226168A (en) 2008-09-25

Similar Documents

Publication Publication Date Title
JP5034580B2 (en) Causal reasoning apparatus, control program and control method thereof
US11037553B2 (en) Learning-type interactive device
TWI723528B (en) Computer-executed event risk assessment method and device, computer-readable storage medium and computing equipment
CN111291195B (en) Data processing method, device, terminal and readable storage medium
US20140337266A1 (en) Rapid development of virtual personal assistant applications
US20110093268A1 (en) Apparatus and method for analysis of language model changes
CN109726269B (en) Information processing method, information processing device, and program
JP6505421B2 (en) Information extraction support device, method and program
CN111427775B (en) Method level defect positioning method based on Bert model
JP2015176099A (en) Dialog system construction assist system, method, and program
JPH07334368A (en) Knowledge base system and recognition system
US10546065B2 (en) Information extraction apparatus and method
KR100835290B1 (en) System and method for classifying document
CN112256845A (en) Intention recognition method, device, electronic equipment and computer readable storage medium
CN114817570A (en) News field multi-scene text error correction method based on knowledge graph
CN110990563A (en) Artificial intelligence-based traditional culture material library construction method and system
JP4745422B2 (en) Representative sentence extraction device and program
CN115713072A (en) Relation category inference system and method based on prompt learning and context awareness
JP5812534B2 (en) Question answering apparatus, method, and program
CN110727764A (en) Phone operation generation method and device and phone operation generation equipment
Krishnan et al. Machine learning based sentiment analysis of coronavirus disease related twitter data
KR102422844B1 (en) Method of managing language risk of video content based on artificial intelligence
KR101983477B1 (en) Method and System for zero subject resolution in Korean using a paragraph-based pivotal entity identification
CN112071304B (en) Semantic analysis method and device
CN114780755A (en) Playing data positioning method and device based on knowledge graph and electronic equipment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120605

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120618

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5034580

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250