JP2010113412A - 文書情報加工方法、文書情報加工装置、文書情報加工プログラムおよび記録媒体 - Google Patents

文書情報加工方法、文書情報加工装置、文書情報加工プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2010113412A
JP2010113412A JP2008283451A JP2008283451A JP2010113412A JP 2010113412 A JP2010113412 A JP 2010113412A JP 2008283451 A JP2008283451 A JP 2008283451A JP 2008283451 A JP2008283451 A JP 2008283451A JP 2010113412 A JP2010113412 A JP 2010113412A
Authority
JP
Japan
Prior art keywords
graph
document
words
word
pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008283451A
Other languages
English (en)
Inventor
Hidefumi Konishi
秀文 小西
Hidenori Yatake
英紀 八竹
Takako Onishi
貴子 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP2008283451A priority Critical patent/JP2010113412A/ja
Publication of JP2010113412A publication Critical patent/JP2010113412A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】文章内に複数種類の項目を含む文書を視覚化する対象の文書とし、1つの項目が文書内の一箇所にまとめて記述されている点を有効利用して文書中の有用情報の発見をより良好に支援できるようにする。
【解決手段】不具合事例を文書読込部12で読込んでテキストを抽出して、そのテキスト中における2単語のペアの重要度(関連度)をペア重要度算出部14により算出して、そのペア重要度の高い単語同士をリンクで結合してノード集合のグラフをグラフ生成部16により生成し、そのグラフについてユーザが削除あるいは不具合事象として選択操作し、その選択結果である分類結果を分類結果DB18に格納する。ペア重要度算出部14によるペア重要度の算出において、現象、原因、対策等の複数項目ごとに構造化されている不具合事例文書について、2単語の距離の集合が小さい距離が多くなるほど重要度が高くなる評価関数を用いてペア重要度を算出する。
【選択図】図3

Description

本発明は、たとえば、製品の不良や故障あるいはクレームなどの不具合事例の文書や保健指導の対話を記録したカウンセリング事例の文書などの対応の文書から有用情報の発見を支援するための文書情報の加工技術に関する。
従来から、製品設計等に関する問題を故障モードに基づいて抽出し、設計段階で使用時に発生する問題を明らかにすることを目的とした手法であるFMEA(Failure Mode and Effect Analysis:故障モード影響解析)が知られている。
係るFMEAでは、一般的に、予想される不良発生パターンを抽出し、各不良発生パターンを製品の構成要素、たとえば、部品毎に区分し、その不良特有の現象や、影響、原因、対策などを記載した一覧表、いわゆるFMEAシートを作成し、故障や不具合を未然に防止するものである。
このFMEAでは起こり得る不具合をすべて網羅すべきであるが、設計者の経験・知識のみに頼って作成すると、設計者の知識、経験の相違等に起因して、担当者によるばらつきや抜け漏れが発生しがちであり、不具合の再発生に繋がるという課題がある。
このようなばらつき、抜け漏れをなくし、設計品質を向上させるには、市場不具合、工程不具合などのいわゆる過去トラからなる不具合事例をすべて確認してFMEAに反映することが効果的であるが、大量の不具合事例が存在する場合には膨大な工数がかかる不都合がある。
また、このような不具合事例に含まれる不具合事象(故障内容など)を効率的に確認するための一般的な方法としては、キーワード検索があるが、次のような課題が存在する。
まず、担当者の経験やスキルの違いによって、検索キーワードがばらつき、不具合事象の確認精度にばらつきが生ずる。
次に、不具合事例の作成者は一般的に言って品質管理部門が多く、不具合事例を確認する設計者は一般的に言って開発部門が多く、不具合事例の作成者が不具合事例を確認する設計者とは別の人間であることが多いため、表現が設計者の想定と異なり、適切な検索キーワードを決定できない場合がある。
さらに、製品についての工法や材料が変わると新しい不具合事例が発生するが、それらを抽出できるような検索キーワードを決定することは困難である。特に、ライフサイクルの短い商品ではそれが顕著となる。
このような事情に鑑み、抜け漏れなく不具合事象を抽出するには、次のようなステップで個々の不具合事例の内容を精査する必要がある。
(1) 検索キーワードの決定
(2) 決定された検索キーワードを用いての検索の実行
(3) 検索結果の確認
(4) 不具合事例の内容を精査し検索キーワードの妥当性の検証を行なう
(5) 検証結果検索キーワードが妥当でない場合に(1)〜(4)のステップを繰返す。
このようなステップを経る必要があるために、現実的な工数では実施できないという不都合があった。
このような実情に鑑み、不具合事例の確認を支援する技術として、不具合事象の視覚化を行なうものがあった(たとえば特許文献1)。
この特許文献1に記載の技術では、文書内容を単語間の関連度に基づいてグラフ化し、グラフを用いて視覚的に検索・分析を支援する。その結果、ユーザが適切なキーワードを知らなくても、グラフ(またはその一部)を選択して検索を実行することができる。
特開2003−330966号公報
しかし、特許文献1に記載された技術の場合には、以下のような課題が存在する。
(1) グラフ化の目的が不具合事例確認を支援することであるため、グラフに表示する単語数は一覧性を損なわない程度に制限しなくてはならないが、文書内での出現頻度等の単純な統計値で単語を選別して単語数を規制すると、不具合事象の理解に必要な重要単語が欠落するという不都合が生ずる。
(2) 不具合事例には、一般的に言って、不具合の現象、不具合の原因、不具合に対する対策などの項目に従った記述がなされており、それらの項目すべての単語をまとめてグラフ化すると、それらの項目同士の単語が混在したまとまりのないグラフとなり、不具合事象を理解することが困難になる。
(3) 複数の文書からなる文書集合全体の内容を視覚化すると、グラフに複数の不具合事象の内容が混在し、理解することが困難になる。
以上要するに、特許文献1に記載の技術は、文書の中から有用な情報の発見を支援することを目的とし、文書情報に基づいてグラフを生成して視覚化するものであるが、文書内での出現頻度等の単純な統計値に従った視覚化であるために、文書中からの有用情報の発見を十分には支援できないという欠点があった。
本発明は、係る実情に鑑み考え出されたものであり、その目的は、文章内に複数種類の項目を含む文書を視覚化する対象の文書とし、1つの項目が文書内の一箇所にまとめて記述されている点を有効利用して文書中の有用情報の発見をより良好に支援できるようにすることである。
上記目的を達成するために、本発明のある局面に従うと、文書中からの有用情報の発見を支援するための文書情報加工方法であって、文章内に複数種類の項目を含む文書を読込むステップと、文書を読込むステップにより読込まれた文書から単語を抽出するステップと、単語を抽出するステップにより抽出された単語同士の距離の集合に基づいた単語間の関連度を算出し、関連のある単語同士をリンクで結合して単語集合のグラフを生成するステップと、グラフを生成するステップにより生成されたグラフを表示装置に表示させるための制御を行なうステップと、表示させるための制御を行なうステップにより表示制御されたグラフを見たユーザによる当該グラフについての有用か否かの判断結果の入力を受付け、有用と判断された有用グラフの特徴を表わすラベルを当該有用グラフに付与して格納するステップとを含む。
このような構成によれば、文章内に複数種類の項目を含む文書では、1つの項目が文書内の一箇所にまとめて記述されているために、或る項目内に頻発する単語同士の距離の集合が短い距離の多いものとなるという、短距離増加現象が見られる。よって、単語間の距離の集合に基づいた単語間の関連度を算出していることにより、前述の短距離増加現象を反映させた単語間の関連度を算出でき、このような方法で算出された関連度に基づいて関連のある単語同士をリンクで結合して単語集合のグラフを生成することにより、各項目別の単語集合のグラフが生成できる。また、グラフに表示する単語数を一覧性を損なわない程度に制限したとしても、前述の短距離増加現象を反映させた単語間の関連度に基づいたグラフ化を行なっているために、項目内での重要単語が欠落する不都合を極力減少できるとともに、文章内容が理解できなくなる不都合も減少できる。
好ましくは、グラフを生成するステップは、単語を抽出するステップにより抽出された複数の単語のうちから任意の2単語を順次選択して、当該2単語の文書中における距離の集合について小さい距離が多いほど関連度が高くなる評価関数に基づいて関連度を算出する。
このような構成によれば、文章内に複数種類の項目を含む文書では、1つの項目が文書内の一箇所にまとめて記述されているために、或る項目内に頻発する単語同士の距離の集合が短い距離の多いものとなるという、短距離増加現象が見られる。よって、単語を抽出するステップにより抽出された複数の単語のうちから任意の2単語を順次選択して、当該2単語の文書中における距離の集合について小さい距離が多いほど関連度が高くなる評価関数に基づいて関連度を算出することにより、前述の短距離増加現象が強く現れる単語同士の関連度が高くなり、このような方法で算出された関連度に基づいて関連のある単語同士をリンクで結合して単語集合のグラフを生成することにより、各項目別の単語集合同士がリンクで結合されたグラフが生成できる。また、グラフに表示する単語数を一覧性を損なわない程度に制限したとしても、項目内での重要単語が欠落する不都合を極力減少できるとともに、文章内容が理解できなくなる不都合も減少できる。
本発明の他の局面に従うと、文書中からの有用情報の発見を支援するための文書情報加工装置であって、文章内に複数種類の項目を含む文書を読込む文書読込み手段と、文書読込み手段により読込まれた文書から単語を抽出する単語抽出手段と、単語抽出手段により抽出された単語同士の距離の集合に基づいた単語間の関連度を算出し、関連のある単語同士をリンクで結合して単語集合のグラフを生成するグラフ生成手段と、グラフ生成手段により生成されたグラフを表示させるための制御を行なうグラフ表示制御手段と、グラフ表示制御手段により表示制御されたグラフを見たユーザによる当該グラフについての有用か否かの判断結果の入力を受付け、有用と判断された有用グラフの特徴を表わすラベルを当該有用グラフに付与して分類済みグラフとして格納する格納手段とを含む。
このような構成によれば、文章内に複数種類の項目を含む文書では、1つの項目が文書内の一箇所にまとめて記述されているために、或る項目内に頻発する単語同士の距離の集合が短い距離の多いものとなるという、短距離増加現象が見られる。よって、単語間の距離の集合に基づいた単語間の関連度を算出していることにより、前述の短距離増加現象を反映させた単語間の関連度を算出でき、このような方法で算出された関連度に基づいて関連のある単語同士をリンクで結合して単語集合のグラフを生成することにより、各項目別の単語集合のグラフが生成できる。また、グラフに表示する単語数を一覧性を損なわない程度に制限したとしても、前述の短距離増加現象を反映させた単語間の関連度に基づいたグラフ化を行なっているために、項目内での重要単語が欠落する不都合を極力減少できるとともに、文章内容が理解できなくなる不都合も減少できる。
好ましくは、グラフ生成手段は、単語抽出手段により抽出された複数の単語のうちから任意の2単語を順次選択して、当該2単語の文書中における距離の集合について小さい距離が多いほど関連度が高くなる評価関数に基づいて関連度を算出する。
このような構成によれば、文章内に複数種類の項目を含む文書では、1つの項目が文書内の一箇所にまとめて記述されているために、或る項目内に頻発する単語同士の距離の集合が短い距離の多いものとなるという、短距離増加現象が見られる。よって、単語抽出手段により抽出された複数の単語のうちから任意の2単語を順次選択して、当該2単語の文書中における距離の集合について小さい距離が多いほど関連度が高くなる評価関数に基づいて関連度を算出することにより、前述の短距離増加現象が強く現れる単語同士の関連度が高くなり、このような方法で算出された関連度に基づいて関連のある単語同士をリンクで結合して単語集合のグラフを生成することにより、各項目別の単語集合同士がリンクで結合されたグラフが生成できる。また、グラフに表示する単語数を一覧性を損なわない程度に制限したとしても、項目内での重要単語が欠落する不都合を極力減少できるとともに、文章内容が理解できなくなる不都合も減少できる。
本発明のさらに他の局面に従うと、文書中からの有用情報の発見を支援するための文書情報加工装置であって、文章内に複数種類の項目を含む文書のデータを記憶している文書データ記憶手段と、文書データ記憶手段に記憶されている文書データから単語を抽出する単語抽出手段と、単語抽出手段により抽出された単語同士の距離の集合に基づいた単語間の関連度を算出する単語間関連度算出手段と、単語間関連度算出手段により算出された関連度に基づいて、関連のある単語同士をリンクで結合して単語集合のグラフを生成するグラフ生成手段と、グラフ生成手段により生成されたグラフを表示させるための制御を行なうグラフ表示制御手段とを含む。
このような構成によれば、文章内に複数種類の項目を含む文書では、1つの項目が文書内の一箇所にまとめて記述されているために、或る項目内に頻発する単語同士の距離の集合が短い距離の多いものとなるという、短距離増加現象が見られる。よって、単語間の距離の集合に基づいた単語間の関連度を算出していることにより、前述の短距離増加現象を反映させた単語間の関連度を算出でき、このような方法で算出された関連度に基づいて関連のある単語同士をリンクで結合して単語集合のグラフを生成することにより、各項目別の単語集合のグラフが生成できる。また、グラフに表示する単語数を一覧性を損なわない程度に制限したとしても、前述の短距離増加現象を反映させた単語間の関連度に基づいたグラフ化を行なっているために、項目内での重要単語が欠落する不都合を極力減少できるとともに、文章内容が理解できなくなる不都合も減少できる。
好ましくは、単語間関連度算出手段は、単語抽出手段により抽出された複数の単語のうちから任意の2単語を順次選択して、当該2単語の文書中における距離の集合について小さい距離が多いほど関連度が高くなる評価関数に基づいて関連度を算出する。
このような構成によれば、文章内に複数種類の項目を含む文書では、1つの項目が文書内の一箇所にまとめて記述されているために、或る項目内に頻発する単語同士の距離の集合が短い距離の多いものとなるという、短距離増加現象が見られる。よって、単語抽出手段により抽出された複数の単語のうちから任意の2単語を順次選択して、当該2単語の文書中における距離の集合について小さい距離が多いほど関連度が高くなる評価関数に基づいて関連度を算出することにより、前述の短距離増加現象が強く現れる単語同士の関連度が高くなり、このような方法で算出された関連度に基づいて関連のある単語同士をリンクで結合して単語集合のグラフを生成することにより、各項目別の単語集合同士がリンクで結合されたグラフが生成できる。また、グラフに表示する単語数を一覧性を損なわない程度に制限したとしても、項目内での重要単語が欠落する不都合を極力減少できるとともに、文章内容が理解できなくなる不都合も減少できる。
さらに好ましくは、グラフ生成手段は、複数の文書からなる文書集合についてのグラフを生成する文書集合グラフ生成手段をさらに含み、文書集合グラフ生成手段は、グラフの生成対象となる文書集合に含まれている複数文書の1文書毎に算出した単語間の関連度を用いて、文書集合のグラフを生成する。
このような構成によれば、複数の文章集合全体を1つの文書として取扱ってグラフ化しているのではなく、各文書それぞれの単語間の関連度を求め、その単一文書レベルでの単語間の関連度を全ての文書について集計して、複数の文章集合のグラフを生成しているため、複数の文章集合をグラフ化する場合に、関連性の低い単語同士がグラフ上で混在することがなく、かつ同種の内容の文章はまとめられたグラフとなり、別々の内容の文章は分離されたグラフとなる。その結果、理解しやすい。
さらに好ましくは、グラフ表示制御手段は、グラフ生成手段により生成された複数のグラフのうち、関連度の高い単語同士が多く含まれているグラフを上位から所定数選択して表示する制御を行なう上位表示処理を実行し、グラフ生成手段は、上位表示処理による表示を見たユーザによる当該グラフについての有用か否かの判断結果の入力に基づいて、有用でないと判断された削除対象グラフと有用と判断された有用グラフとに含まれる単語ペアを除く残りの単語ペアについて、単語同士の距離の集合に基づいた単語間の関連度を算出し、関連のある単語同士をリンクで結合して単語集合のグラフを生成する残り単語ペアグラフ生成処理を実行し、上位表示処理と残り単語ペアグラフ生成処理とを繰返し実行し、その結果を分類済みグラフとして格納手段が格納するとともに、有用ではなく削除対象と判断された削除対象グラフを削除対象であることを示す識別子を付与して格納する。ここに、単語ペアとは、グラフにおいてリンクで直接結合された2単語のことである。
このような構成によれば、上位表示処理と残り単語ペアグラフ生成処理とが繰返し実行され、その結果が分類済みグラフとして格納手段に格納されるために、ユーザによる有用か否かの判断結果が十分に反映された分類済みグラフが格納手段に格納され、利用価値の高い分類済みグラフのデータを取得できる状態となる。
さらに好ましくは、文書読込み手段により読込まれた新たな文書を自動的に分類するための分類ルールを設定する分類ルール設定手段をさらに含み、分類ルール設定手段は、グラフ生成手段により生成されたグラフのうち、関連度の高い単語同士が多く含まれているグラフを上位から所定数選択して格納する上位格納処理を実行する上位格納手段と、新たな文書のうち、上位格納手段により格納されたグラフに含まれる単語ペアを所定の重要度で含んでいる文書を除く残りの文書を割出す残り文書割出し処理を実行する残り文書割出し手段と、を含み、グラフ生成手段は、残り文書割出し処理により割出された残りの文書についてグラフを生成する残り文書グラフ生成処理を実行し、分類ルール設定手段は、さらに、残り文書グラフ生成処理と、該残り文書グラフ生成処理により生成された残りの文書のグラフについて行なう上位格納処理と、残り文書割出し処理とを、繰返し実行して、その結果上位格納手段に格納されたグラフをグラフ表示制御手段により表示制御させ、該表示制御されたグラフを見たユーザによる当該グラフについての有用か否かの判断結果の入力を受付け、有用と判断された有用グラフの特徴を表わすラベルを当該有用グラフに付与して分類ルールとして格納する分類ルール格納手段を含む。
このような構成によれば、残り文書グラフ生成処理と、該残り文書グラフ生成処理により生成された残りの文書のグラフについて行なう上位格納処理と、残り文書割出し処理とを、繰返し実行して、その結果上位格納手段に格納されたグラフを見たユーザによる当該グラフについての有用か否かの判断結果の入力を受付け、有用と判断された有用グラフの特徴を表わすラベルを当該有用グラフに付与して分類ルールとして格納しているために、ユーザによる有用か否かの判断結果が反映された分類ルールが分類ルール格納手段に格納され、その分類ルールを利用して、新たな文書の自動分類が可能となる。
さらに好ましくは、文書読込み手段により新たな文書が読込まれたときに、該新たな文書についてグラフ生成手段が生成した新たなグラフと分類ルール格納手段に格納されている分類ルールとしてのグラフとの類似度を算出し、類似する新たなグラフを類似する分類ルールに対応付けて格納する対応付け格納手段をさらに含む。
このような構成によれば、新たな文書についてのグラフと分類ルール格納手段に格納されている分類ルールとしてのグラフとの類似度が算出され、類似する新たなグラフが類似する分類ルールに対応付けて格納されるために、分類ルールを利用しての新たな文書の自動分類ができる。
また、この発明によれば、上述した文書情報加工方法をコンピュータに実行させるためのプログラムである。
また、この発明によれば、コンピュータ読取可能な記録媒体であって、上述した文書情報加工方法をコンピュータに実行させるためのプログラムを記録する。
次に、本発明の実施の形態を図面に基づいて詳細に説明する。
第1実施の形態
文章内に複数種類の項目を含む文書(例えば、複数種類の項目に関する記載を含み各項目に対応する記載エリア内に該当する項目に関連する記載が集中している文書)の一例として、不具合事例文書を図1に示す。不具合事例文書の場合には、一般的に言って、記載エリアが複数種類の項目に分割されている。たとえば、不具合の現象と不具合の原因と対策とからなる3つの項目について記述されている。不具合事例文書作成者は、まず不具合の現象を記述し、次にその現象が起こる原因を記述し、最後に不具合を解決するための対策を記述する。よって、不具合事例文書は、一般的に、現象の項目のエリアに不具合の現象に関する記述が集中しており、また原因の項目に関する記述エリアに対策の記述が集中している。現象の項目エリアでは、たとえば、コード、断線、OFFなどの現象に関連する単語が頻出し、対策の項目エリアには設計、工程、検査などの対策に関連する単語が頻出し、原因の項目エリアには外力、過大、衝撃などの原因に関連する単語が頻出する。なお、本発明が対象としている、記載エリアが複数種類の項目に分割されている文書としては、表などの構造化された形式や統一されたフォーマットで記述されているとは限らず、機械処理での項目抽出は困難な場合が多い。
このような不具合事例文書において、文書全体で頻出頻度が高い単語が不具合事象を的確に表わしているとは限らないが、1つの項目内に限定すると、出現頻度が高い単語は不具合事象を表わす可能性が高くなる。
したがって、次の方法によって不具合事象を理解するために適切なグラフを生成できる。
文書全体ではなく、文書内テキストにおける位置関係に基づいて単語間の関連度を算出する。具体的には、テキスト中で近くに出現することが多い2単語は、関連度を高くする。
このようにすることにより、たとえば現象の項目エリアに記載されている前述したライト、OFF、スイッチ等の現象に関連する単語同士では、たとえば原因の項目エリアに記載されているコンデンサ、焼損、電源などの原因に関連する単語同士に比べて、任意の2単語の距離が短い。その結果、文書全体での分布状況に依存せず、各項目の重要な単語を抽出することができる。
次に、このような方法で求めた単語間の関連度に基づいて、関連度が高い2単語はグラフ上でリンクを結合し、関連度が低い2単語はグラフ上でリンクを分離することにより、グラフを生成する。
このようにグラフを生成することにより、現象、原因、対策などの各項目別にまとまった単語集合を個別のグラフとして生成できる。
また、1文書ではなく複数の文書からなる文書集合をグラフ化する場合は、文書集合から得られる統計値(単語の出現回数の合計など)ではなく、各単一文書から得られた単語間の関連度を基にグラフを作成する。
つまり、各単一文書から抽出された不具合事象すなわち関連度の高い単語の組合せからグラフを作成するため、関連のない単語同士がグラフ上で混在することを防止でき、同種の不具合事象はまとめられ、別々の不具合事象は分離されたグラフになり、理解しやすいグラフとなる。
次に、本発明が適用されるシステム構成例を図2に基づいて説明する。企業等の事業所Aには、データセンター3、設計部門6、製造/品質管理部門7等の各種部門が作られている。データセンターには、サーバ4と知識データベース5とが備えられている。以下にデータベースのことを単にDBと記載する。この知識DBは、具体的には、後述するように、不具合事例DBとペア重要度DBと分類結果DBとを含んでいる。
設計部門6と製造/品質管理部門7とには、クライアントとしてのパーソナルコンピュータ8,9がそれぞれ設けられている。事業所Bについても、事業所Aと同様の構成となっている。
サーバ4と各パーソナルコンピュータ8,9とは、LAN/WAN10により情報の送受信ができるようになっている。
製品について故障等の不具合が発生した場合に、製造/品質管理部門7において担当者がパーソナルコンピュータ9を操作することにより、図1に示したような不具合事例文書を入力して作成する。この不具合事例文書は、データセンター3のサーバ4へ送信され、サーバ4においてテキストが抽出され、その抽出されたテキストに不具合事例IDを対応づけて知識DB5の不具合事例DB13(図4参照)に格納される。
サーバ4は、この不具合事例DB13に格納されている不具合実例のテキストデータを順次不具合事例DB13から読出し、単語ペアの重要度を算出し、その算出結果であるペア重要度データを不具合事例IDに対応づけてペア重要度DB15(具体的には図5の不具合事例別ペア重要度DB15a)に格納する。また、サーバ4は、そのペア重要度DB15に格納されているペア重要度データに基づいて、グラフを生成してパーソナルコンピュータ8または9により表示させる。設計部門6または製造/品質管理部門7のオペレータは、その表示されたグラフを見て、不具合事象と判断したグラフおよび不要と判断したグラフを特定する操作を行なう。この操作に従って、サーバ4が、不要と指定されたグラフに削除を示す弁別フラグを付与して分類結果DB18(図11参照)に格納するとともに、不具合事象と指定されたグラフについて不具合の内容を表わすターム(ラベル名)を付するラベリングを行なって分類結果DB18に格納する。
次に、第1実施の形態における文書情報加工装置11の機能ブロック図を図3に示す。図3を参照して、文書情報記憶装置11は、不具合事例の文書を読込むための文書読込部12と、不具合事例のテキストを格納する不具合事例DB13と、ペア重要度算出部14と、その算出されたペア重要度を格納するペア重要度DB15と、ペア重要度に基づいてグラフを生成するためのグラフ生成部16と、生成されたグラフを表示するとともにユーザ(オペレータ)の操作に従ってグラフを分類するグラフ表示・分類実施部17と、分類されたグラフデータを格納するための分類結果DB18とを含む。
不具合事例の文書が1文書ずつ文書読込部12に読込まれる。文書読込部12では、その読込まれた1文書ごとにテキストを抽出して1文書ごとの不具合事例IDを付与して、その不具合事例IDに対応づけて1文書ごとの不具合事例テキストのデータを不具合事例DB13に格納する。その格納処理と同時並行で、文書読込部12は、読込まれた1文書ごとのテキストをペア重要度算出部14に伝送する。ペア重要度算出部14では、その伝送されてきた不具合事例テキストに基づいて後述するようにペア重要度を算出し、その算出結果であるペア重要度データをペア重要度DB15に格納する。
なお、ペア重要度の算出においては、すべての不具合事例のテキストが不具合事例DB13に一旦格納された後それを順次読出してペア重要度算出部14によりペア重要度の算出を行なうようにしてもよい。
次に、グラフを生成するべくグラフ生成部16がペア重要度DB15からペア重要度データを読出し、そのペア重要度データに基づいてノード集合のグラフを生成する。その生成されたグラフがグラフ表示・分類実施部17によって表示される。ユーザ(オペレータ)は、その表示されたグラフを見て不要であり削除すべきグラフであるか分類するべくラベリングすべきグラフであるかを判断する。その判断結果が入力されると、グラフ表示・分類実施部17では、その入力に従って、削除を指定されたグラフに削除を示す弁別フラグを付与して分類結果DB18に格納する。また、削除を指定されなかったグラフすなわちラベリングすべきグラフについては、分類済を示す弁別フラグを付与してかつラベリングして分類結果DB18に格納する。
なお、文書情報加工装置11には、不具合事例の文書の他に、不具合事例IDも入力される。この不具合事例IDが入力された場合には、その不具合事例IDに基づいて不具合事例DB13が検索されて入力された不具合事例IDに対応する不具合事例テキストが取得され、そのテキストデータが表示される。
次に、第1実施の形態における分類情報加工装置の制御動作を、図4〜図9に基づいて説明する。
図4(a)は、メインプログラムのフローチャートを示している。まずステップS(以下単にSという)1により、文書読込処理が行なわれ、S2により、ペア重要度算出処理が行なわれ、S3により、グラフの生成/表示/分類実施処理が行なわれ、S4により指定グラフ表示処理が実行される。
S1の文書読込処理の具体的制御動作を図4(b)に示す。まずS10により、情報の入力があったか否かの判断がなされ、ない場合にはこの文書読込処理が終了する。情報の入力があった場合には、S11により、その入力された情報が不具合事例の文書であるかまたは不具合事例IDであるか判断される。不具合事例の文書であった場合には、S12により、その入力された文書からテキストを抽出し、S13により、その抽出されたテキスト、ファイル名、ファイル実態をIDとともに不具合事例DBに保存し、かつ抽出されたテキストをペア重要度算出部14に出力する処理が行なわれる。
このS13による処理が行なわれた結果、不具合事例DB13には、図4(c)に示すようなデータが格納される。つまり、入力された不具合事例の文書1つ1つに対応する不具合事例ID0000、0001、…Nに対応づけて、不具合事例のテキスト、ファイル名、ファイル実態のデータがテーブルの形で格納される。
一方、入力された情報が不具合事例IDであった場合には、図4(b)のS14に制御が進み、入力されたIDに基づいて不具合事例DB13を検索して対応するテキストを取得してそれを表示する処理が行なわれる。
次に、S2に示したペア重要度算出処理の具体的制御動作を図5に示す。まずS20により、文書読込部12からの不具合事例のテキストの入力があったか否かの判断がなされる。前述のS13により、文書読込部12からテキストが出力されてくれば、S20によりYESの判断がなされる。文書読込部12からは、たとえば、不具合事例テキストとして、「過大な外力の印加によりコード断線が発生した結果、出力信号の常時OFFによる装置異常が発生。…過大な外力が原因と推測…コード断線に至った経緯については確認中…」が出力されてくる。
次にS22により、入力された不具合事例テキストに対し形態素解析を行なって単語を抽出する処理が実行される。その結果、たとえば前述のテキストの場合には、「過大,外力,印加,コード断線,発生,結果,出力信号,…」という単語が抽出される。
次にS23により、抽出されたすべての単語のペア(2単語の組合せ)に対して、評価関数を用いてペアの重要度を算出する。
使用する評価関数としては、2単語について小さい距離が多くなるほど重要度(関連度)が高くなる関数を用いる。たとえば、
Figure 2010113412
(A→Bは、単語Aを基準とした単語Bまでの距離の集合、B→Aは、単語Bを基準とした単語Aまでの距離の集合、dは距離)
このような評価関数を用いてペアの重要度を算出した場合に、たとえば前述のテキストから抽出した単語の場合には、
コード断線−出力信号 …75
コード断線−常時OFF…65
コード断線−過大 …55
コード断線−外力 …65
等のような重要度となる。
次にS24により、重要度の算出結果をペア重要度DB15に格納する処理が行なわれる。この処理は、不具合事例IDに対応づけてペア重要度データをペア重要度DB15の不具合事例別ペア重要度DB15aに格納する。
次に、文書読込部12からのテキストの入力が終了した段階で、S27に制御が進み、不具合事例集合におけるペア重要度算出処理が実行される。
このように、本実施の形態では、文書読込部12により不具合事例が順次読込まれて文書読込部12により順次テキストを抽出し、その後順次抽出されたテキストが不具合事例DB13に順次格納されるとともに、同時にテキストデータが順次ペア重要度算出部14に与えられてペア重要度の算出が行なわれてペア重要度DB15に順次格納される。つまり、不具合事例DB13へのテキストの格納と並行してペア重要度算出部14によるペア重要度の算出を行なって、その算出結果をペア重要度DB15に格納する。その他の方法としては、すべての不具合事例のテキストが不具合事例DB13に一旦格納された後それを順次読出してペア重要度算出部14によりペア重要度の算出を行なうようにしてもよい。
次に、S27に示した不具合事例集合におけるペア重要度算出処理のサブルーチンプログラムのフローチャートを図6に示す。この図6に示す不具合事例集合におけるペア重要度算出処理は、1つ1つの不具合事例について前述のS21〜S24の処理により求めたペア重要度のデータをもとに、複数の不具合事例についての不具合事例集合におけるペア重要度を算出する点に特徴がある。
S30により、1分類確認操作があったか否かの判断がなされる。本実施の形態における不具合事例集合のペア重要度の算出は、2種類の、モードがあり、通常モードにおいては、ペア重要度を算出する対象の不具合事例集合に含まれている多くの文書に共通して出現するペアについては重要度を増加させる処理を行なう。一方、分類済の不具合事例集合の1分類を確認するときなどにおいて、個々の不具合事例に特徴的な情報を抽出したい場合に実行される1分類確認モードにおいては、多くの文書に共通して出現するペアについては一般的で特徴量が少ないものとして重要度を減少させる。
このS30により、通常モードか1分類確認モードかの判別を行ない、ユーザが1分類確認モードを選択する操作を行なった場合にはS30によりYESの判断がなされるが、1分類確認モードの操作を行なわなかった場合にはS30によりNOの判断がなされ、制御がS31へ進む。S31では、ペア重要度DB15の不具合事例別ペア重要度DB15aを検索して複数のテキストに共通するペアを特定する処理が行なわれる。次にS32により、その特定された共通するペアの各共通ペアにおける共通するテキスト数を算出する処理が行なわれる。次にS33により、その算出された共通テキスト数に応じて各共通ペアの重要度を増加させる処理が行なわれる。つまり、共通テキスト数の数が多ければ多いほど共通ペアの重要度を増加させる。次にS34により、ペア重要度データを共通化処理した後ペア重要度DB15の不具合事例別ペア重要度DB15aにおける集合共通領域に記憶させる処理が行なわれる。なお、この共通化処理とは、同種のものをまとめて1つにすることであり、ペア重要度データ中の2単語について同じ2単語が存在する場合にはそれをまとめて1つにすることである。
S30により、1分類確認操作があったと判断された場合には、S35により、ペア重要度DB15の不具合事例別ペア重要度DB15aを検索して複数のテキストに共通するペアを特定し、S36により、各共通ペアにおける共通するテキスト数を算出し、S37により、各共通ペアの重要度を共通テキスト数に応じて減少させ、S38により、ペア重要度データを共通化処理した後ペア重要度DB15の不具合事例別ペア重要度DB15aにおける1分類確認領域に記憶させる処理が行なわれる。
図4のS3に示したグラフ生成/表示/分類実施処理の具体的制御内容を図7に示す。このグラフ生成/表示/分類実施処理は、前述のペア重要度算出処理により算出されたペア重要度を利用してグラフを生成しユーザに表示し、そのグラフを見たユーザが不要なグラフで削除対象とするか不具合事象として選択するかの弁別操作(分類操作)を受付け、その操作結果を反映させた分類結果DB18を作成するものである。
図7を参照して、S50により、ペア重要度集計処理が行なわれ、S51によりグラフ生成表示処理が行なわれる。この2つの処理については、後述する。S51により表示されたグラフを見たユーザ(オペレータ)が、そのグラフを不要であると判断して削除対象として指定するかあるいは不具合事象として選択するかの操作を行ない、その操作がS52により受付けられ、その受付けた操作結果に応じて、不具合事象として選択されたグラフをラベリングして分類済フラグを付与して分類結果DB18に保存する処理が行なわれる。次にS53により、受付けた操作結果に応じて、削除対象として選択されたグラフを削除フラグを付与して分類結果DB18に保存する処理が行なわれる。
グラフの表示およびS52、S53の処理の状態が、図11に示されている。図11を参照して、生成されたグラフのうち重要度の合計が多い順にグラフを上位から規定数表示した状態が、図11の上方部分に表示画面として示されている。この規定数は、固定値、ユーザ指定、あるいは過去の操作履歴からの学習などによって決定される。この図11では、上位から3つのグラフが表示されている。この表示状態を見たユーザ(オペレータ)が、中央のグラフに対して、不具合事象と判断し、そのグラフを分類結果DB18に保存する弁別操作する。その結果が、分類結果DB18に格納されることとなる。
分類結果DB18は、グラフデータの行数、グラフデータ、弁別フラグ、グラフデータをラベリングしたときのラベル名、不具合事例IDの各項目がテーブルとして記憶される。ユーザが不具合事象として入力指定されたグラフは、そのグラフデータが分類結果DB18に格納されるとともに、それに対応して、弁別フラグの項目に「弁別済」のフラグが格納される。このような不具合事象として入力されたグラフについては、S52によりラベリングされるのであり、グラフデータの特徴を表わすターム(ラベル)が自動的にユーザに表示され、その表示されたラベリング名(ターム)に同意する操作が行なわれれば、そのラベリング名(ターム)が対応するグラフデータに対応付けてラベリング名の欄に格納される。またユーザが不要と判断したグラフについて削除対象として入力指定されれば、そのグラフデータが分類結果DB18に格納されるとともにそれに対応付けて弁別フラグの項目に削除のフラグが付与される。なお、ユーザが前述のラベリング名(ターム)に同意しないときには、ユーザ自ら適切なラベリング名(ターム)を考え出し、それを入力してラベリング名(ターム)にすることができる。
図7に戻り、次にS54により、削除対象として選択されたグラフに含まれるペアと同じものを不具合事例別ペア重要度DB15aから検索し、検索したペアに使用不可能フラグを付与する処理が行なわれる。次にS55により、未分類不具合事例ID取得処理が行なわれる。この未分類具合事例ID取得処理は、分類結果DB18に保存したグラフに含まれるペアを持つ不具合事例を不具合事例別ペア重要度DB15aから検索し、当該グラフで検索されない不具合事例IDの集合を取得する処理であり、詳しくは後述する。S55の処理の結果、後述するS110によりスコアが基準値未満の不具合事例IDの集合が取出されるのであり、そのスコアが基準値未満の不具合事例IDが存在するか否かが、S56により判断される。未だ存在する場合にはS50に進み、ペア重要度集計処理が行なわれた後S51に戻り、S51〜S55の処理が繰返し実行される。そして、スコアが基準値未満の不具合事例IDが存在しなくなった段階でS56によりNOの判断がなされてこのグラフ生成/表示/分類実施処理が終了する。
前述のS50に示したペア重要度集計処理のサブルーチンプログラムを図8(a)に示す。このペア重要度集計処理は、集計対象の不具合事例についての単語ペアと重要度を不具合事例別ペア重要度DB15aから読出してきて共通する単語ペアについてはその重要度を累積加算して当該単語ペアを単一のものにまとめ、ユニークな単語ペアとそれに対応する重要度合計とからなるペア重要度DB15b(図8(b)参照)を生成するための処理である。
まずS60により、ペア重要度集計DB15bの全行を削除する処理が行なわれる。これは、ペア重要度集計DB15bに記憶されている古いデータを削除する処理である。次にS61により、集計対象の不具合事例IDの集合ID(0)〜ID(R)を受取る処理が行なわれる。これは、このペア重要度集計処理のサブルーチンプログラムが前述のS51のグラフ生成表示処理の前の最初の段階で実行される場合には、不具合事例別ペア重要度DB15aに記憶されているすべての不具合事例IDが集計対象の不具合事例IDとなる。よって、この場合には、S61では、不具合事例別ペア重要度DB15aに記憶されているすべての不具合事例IDの集合ID(0000)〜ID(N)を不具合事例別ペア重要度DB15aから受取ることとなる。一方、このペア重要度集計処理のサブルーチンプログラムが前述したS56によりYESの判断がなされたときに行なわれる場合には、S55の未分類不具合事例ID取得処理の最後のステップであるS110(図10参照)によって取出されたスコア(D)が基準値未満の不具合事例IDが、S61により受取る集計対象の不具合事例IDとなる。
次にS62により、Kを「0」にする初期化処理が実行される。これは、S61により受取った不具合事例IDの集合ID(0)〜ID(R)をすべて順次ループさせるための初期化処理である。次にS63に進み、不具合事例別ペア重要度DB15aの不具合事例ID(K)に属する単語ペアと重要度とを読出す処理が行なわれる。Kが「0」の段階では、S63により読出す対象としては、不具合事例IDが「0000」に属する単語ペアのすべてと重要度のすべて(図5の不具合事例別ペア重要度DB15a参照)である。そして、この読出されたペアと重要度との組合せについてそのすべてを順次ループするための初期化処理が、S64により行なわれる。すなわち、PSを、不具合事例ID(K)に属するペアの総数にするとともに、Pを「1」にする。次にS65により、S63により読出されている単語ペアと重要度とのうち、P番目の単語ペアと重要度とを特定する処理が行なわれる。次にS66により、ペア重要度集計DB15bを検索する処理が行なわれる。そして、S65により特定された単語ペアと同じ単語ペアがペア重要度集計DB15bに存在するか否かの判断がS67により行なわれ、存在しない場合には、S68により、S65により特定されている単語ペアと重要度とを、ペア重要度DB15bに追加して記憶させる処理が行なわれる。一方、S67により同じペアがあると判断された場合には、S69により、当該ペアについての重要度を加算してペア重要度集計DB15bの重要度を加算更新する処理が行なわれる。
なお、S60によりペア重要度集計DB15bの全行が削除された後の最初の実行段階においては、ペア重要度集計DB15bには何らデータが記憶されていないために、S67では、同じペアが存在しないと判断されてS68の処理が実行されることとなる。
次にS70により、P=PSになったか否かの判断が行なわれ、未だなっていない場合にはS71に進み、Pに「1」加算する処理がなされた後S65に戻り、S65〜S71の処理が繰返し実行される。この処理の繰返し実行に伴うS71のPへの加算処理の結果、P=PSすなわちS63により読出された単語ペアおよびその重要度すべてについてS65〜S69の処理が実行された段階で、S70によりYESの判断がなされてS72により、Kに「1」を加算する処理が行なわれ、S73によりK=Rであるか否かの判断がなされる。未だK=Rになっていない場合には制御がS63に移行し、S63〜S73の処理をループして繰返し実行することとなる。この処理の繰返し実行のたびにS72によりKへの1加算処理がなされ、K=RすなわちS61により受取った不具合事例IDの集合のすべてについてS63〜S71の処理が実行された段階で、S73によりYESの判断がなされてこのペア重要度集計処理のサブルーチンプログラムが終了する。
このペア重要度集計処理のサブルーチンプログラムの実行の結果、図8(b)に示すデータがペア重要度集計DB15bに格納されることとなる。図8(b)に示すように、重要度の高い単語ペアから順番に0行から下位行に向かってペア重要度集計データが格納される。
次に、前述したS51により示されたグラフ生成表示処理のサブルーチンプログラムを図9(a)に示す。まずS80により、Bを0にし、ペア重要度集計DB15bの全行数をGにする初期化処理が実行される。次にS81により、ペア重要度集計DB15bの行数Bのペアと重要度とを読出す処理が行なわれる。次にS82により、使用可能ペアであるか否かの判断がなされる。これは、前述したS54により使用不可能フラグが付与されたペアであるか否かを判別し、使用不可能フラグが付与されていないペアのみを使用可能ペアと判別する。S82により使用可能ペアでないと判断された場合にはS83に進み、Bに「1」加算する処理を行ない、S84によりB=Gとなったか否かの判断がなされ、未だにB=Gになっていない場合にはS81に戻り、1加算されたBの行数(次の行数)のペアと重要度とをペア重要度集計DB15bから読出し、その読出したものが使用可能ペアであるか否かの判断がなされる。S81〜S84のループを巡回して使用可能ペアと判断された場合には制御はS85に進み、すべての読出済ペアに対して一致する単語を検索する処理が行なわれる。使用可能ペアを読出した1番最初の段階では、読出済ペアが存在しないために、S85の検索の結果一致する単語が存在せず、S86によりNOの判断が行なわれてS88によりノードの結合を行なわない処理が行なわれ、S89によりB=Gの判断がなされる。そして未だにB=Gになっていない段階ではS90によりBに「1」加算する処理が行なわれた後再度S81に制御が戻る。そしてS81〜S90のステップをループして繰返し実行し、その繰返しのたびにS90によるBへの1加算処理が行なわれて、ペア重要度集計DB15bの全行数にわたってS81〜S90の処理が実行された段階でS89によりYESの判断がなされて、S91に制御が移行する。なお、Gをペア重要度集計DB15bの全行とする代わりに、全行の1/2あるいは上位から数えて規定の行等にし、ペア重要度集計DB15bの上位の重要度の単語ペアのみについてS81〜S88の処理を行なうようにしてもよい。
そして、2回目以降の使用可能ペアの読出の段階では、読出済ペアが存在するために、S85では、その読出済ペアに対して一致する単語を検索し、一致する単語があった場合にはS86によりYESの判断がなされてS87へ進み、一致する単語を介してペア同士をノードで結合する処理が行なわれる。
この処理を、図9の(b)〜(d)に基づいて説明する。使用可能ペアがS81により読出された状態が(b)に示されている。たとえば「コード断線」と「外力」との単語ペアが読出されている。次に、前回以前の読出の段階で、読出済ペアとして「コード断線」と「出力信号」との単語ペアが読出済となっている場合(図9(c)参照)、S87によるノード結合処理が行なわれた結果、(d)に示すように、読出したペアと読出済ペアとにおける共通する単語である「コード断線」を介してそれ以外の単語である「外力」、「出力信号」がノード結合される。
このような処理をペア重要度集計DB15bの全行数にわたって実行した後、S91により、リンクで結合されているノード集合を1グラフとし、重要度の合計が多い順にグラフを上位から規定数表示する処理が行なわれる。この規定数は、固定値、ユーザ指定、あるいは過去の操作履歴からの学習などによって決定される。
前述したS55に示された未分類不具合事例ID取得処理のサブルーチンプログラムを図10(a)に示す。この未分類不具合事例ID取得処理は、分類結果DB18に保存したグラフに含まれるペアを持つ不具合事例を不具合事例別ペア重要度DB15bから検索し、当該グラフで検索されない不具合事例IDの集合を取得する処理である。まずS100により、分類結果DB18の全行数をAとし、Cを1にするとともに、Dを0000にする初期化処理が実行される。次にS101により、分類結果DB18の行数Cのグラフに含まれるペアを取出す処理が実行される。この処理の具体例が図10(b)に示されている。分類結果DBの行数Cのグラフが、たとえば「外力」と「コード断線」と「出力信号」との3つの単語がノード結合されたグラフであったとする。そして、このグラフに含まれるペアは、「コード断線−外力」と「コード断線−出力信号」の2つのペアとなる。
次にS102により、不具合事例別ペア重要度DB15aにおけるIDがDに属するペアを取出す処理が実行される。そして、S101により取出されたペアとS102に取出されたペアとが一致するか否かがS103により判断される。一致しない場合にはS105へ進むが、一致する場合には、S104へ進み、不具合事例別ペア重要度DB15aの当該ペアの重要度をスコア(D)に累積加算する処理が行なわれた後S105へ進む。
S105では、Dに「1」加算する処理が行なわれ、S106により、D=Nになったか否かの判断がなされ、未だになっていない場合にはS102へ戻り、S102〜S106のステップをループして繰返し実行し、その繰返し実行のたびにDに「1」が加算されて不具合事例別ペア重要度DB15aの全行であるNについて繰返し実行された段階でS106によりYESの判断がなされる。そして、S107により、再びDを0000に初期化し、S108によりC=Aの判断がなされ、未だにC=Aになっていない場合にはS109により、Cに「1」加算する処理がなされた後S101に戻る。そして、S101〜S109の処理をループして繰返し実行し、分類結果DB18の全行数について繰返し実行された段階で、C=Dになるために、S108によりYESの判断がなされてS110へ進む。
すなわち、分類結果DB18に記憶されているグラフに含まれるペアと同じペアが不具合事例別ペア重要度DB15aに存在すれば、その存在するペアの重要度を累積加算して当該存在するペアの不具合事例IDのスコアとして記憶するのである。分類結果DBに記憶されているグラフに含まれるペアが全く存在しない不具合事例IDについてはスコアが0となる。
そして、S110により、スコア(D)が基準値未満の不具合事例IDの集合を取出す処理がなされる。この取出された不具合事例IDが、前述したS61による集計対象の不具合事例IDの集合として受取られてペア重要度集計処理として用いられる。
図12(a)は指定グラフ表示処理のフローチャートを示している。この指定グラフ表示処理は、特に設計部門6のユーザ(オペレータ)がラベル名(ターム)を入力指定してそのラベル名の付されたグラフを読出して表示するための処理である。
まずS120により、ラベル名を入力して検索表示する操作が行なわれたか否かの判断がなされ、行なわれた場合には、S121により、その入力されたラベル名に基づいて分類結果DB18を検索し、S122により、その検索されたグラフを表示する処理がなされる。
一方、この指定グラフ表示処理は、ラベル名を指定しての表示ばかりでなく、集合グラフの表示も可能となっている。ユーザ(オペレータ)が集合グラフ表示の入力操作を行なえば、S120によりNOの判断がなされてS123によりYESの判断がなされ、S124により、集合グラフ生成表示処理が実行される。
この集合グラフ生成表示処理のサブルーチンプログラムを図12(b)に示す。まずS130により、1分類確認モードに基づいた表示であるか否かの判断がなされる。この1分類確認モードとは、前述した図6のS30で説明したように、1分類確認操作があった場合のペア重要度算出処理に基づいて表示モードである。1分類確認モードに基づいた表示の場合には、S134に制御が進み、不具合事例別ペア重要度DB15aの1分類確認領域に記憶されたペア重要度データすなわちS38により記憶されたペア重要度データを読出す処理が行なわれた後S132へ進む。一方、1分類確認モードに基づいた表示でないと判断された場合には制御がS131へ進み、不具合事例別ペア重要度DB15aの集合共通領域に記憶されているペア重要度データすなわちS34により記憶されたペア重要度データを読出す処理が行なわれた後S132へ進む。
S132では、重要度の高いペアを上位から規定数取出し、S133により、そのペアに含まれる2単語をリンクで結合し、各リンクに重要度の値を付与し、S135により、ノード集合をリンクで接続されているか否かで分割し、1個以上のグラフを生成し、S136により、その生成されたグラフのうち重要度の高いペアがより含まれているグラフを上位から規定数表示する処理が行なわれる。この規定数の取出しおよび規定数の表示における規定数は、固定値、ユーザ指定、あるいは過去の操作履歴からの学習などによって決定される。
第2実施の形態
図13〜図16に基づいて第2実施の形態を説明する。
この図13に示した機能ブロック図において、図3に示した第1実施の形態における機能ブロック図と同じ部分についてはハッチングのブロックで示しており、第1実施の形態との相違点を主に説明する。この第2実施の形態においては、分類ルール設定部19と自動分類部21と分類ルールDB20とが追加されている。これら追加部分の機能について以下に詳しく説明する。
図14は分類ルール設定処理の制御動作を示すフローチャートである。まずS140により、ペア重要度集計処理が実行され、S141により、グラフ生成登録処理が実行され、S142により、未分類不具合事例ID取得処理が行なわれる。このS140によるペア重要度集計処理とS142による未分類不具合事例ID取得処理とは、前述の第1実施の形態と同様の処理である。ただし、未分類不具合事例ID取得処理のS100とS101とのステップにおける「分類結果DB」が「分類ルールDB」に変更される。
次にS143により、スコアが基準値未満の不具合事例IDが存在するか否かの判断がなされる。そして存在する場合にはS144によるペア重要度集計処理が実行され、制御がS141に戻る。そしてこのS141〜S144の処理をループして繰返し実行し、何回か繰返すことにより、スコアが基準値未満の不具合事例IDが存在しなくなり、制御がS145へ進み、分類ルールの表示弁別処理が実行されてこの分類ルール設定処理が終了する。
なお、S144のペア重要度集計処理は、第1実施の形態と同じ処理である。
前述のS141に示したグラフ生成登録処理のサブルーチンプログラムを図15(a)に示す。まずS150により、S80〜S90のステップを実行する処理が行なわれる。このS80〜S90のステップは、図9(a)の第1実施の形態で示したグラフ生成表示処理のステップである。そして、S151により、リンクで結合されているノードの集合を1グラフとし、重要度の合計が多い順にグラフを上位から規定数分類ルールDB20に保存する処理が行なわれて、このグラフ生成登録処理が終了する。この規定数は、固定値、ユーザ指定、あるいは過去の操作履歴からの学習などによって決定される。
前述したS145の分類ルールの表示弁別処理のサブルーチンプログラムを図15(b)に示す。まずS155により、分類ルールDB20の全行数をRGとし、Rを「1」にして、初期化処理が実行される。次にS156により、分類ルールDB20からRの行数のグラフを読出して表示する処理が行なわれる。次にS157により、ユーザ(オペレータ)の弁別操作があったか否かの判断がなされ、あるまで待機する。この弁別操作は、表示されたグラフをユーザが不要と判断して削除指定する場合と表示されたグラフを不具合事象として選択する場合に加えて、表示されたグラフの一部を削除指定する場合とがある。
ユーザの弁別操作があれば制御がS158へ進み、グラフ全体の削除指定がなされた場合にそのグラフに削除フラグを付与して分類ルールDB20に保存する。また、グラフの一部削除指定があった場合にはそのグラフの指定された部分のノードを削除してラベリングした上で分類ルールDB20に保存する。さらに、不具合事象として選択されたグラフをラベリングして分類ルールDB20に保存する処理が行なわれる。
次にS159により、R=RGであるか否かの判断がなされ、未だR=RGになっていない場合にはS160に進み、Rに「1」加算する処理が行なわれた後にS156へ進む。そして、S156〜S160の処理をループして繰返し実行し、その繰返し実行のたびにS160によるRへの1加算処理が行なわれ、分類ルールDB20の全行数にわたってこのS156〜S158の処理が実行された段階で、R=RGとなり、S159によりYESの判断がなされてこの分類ルール表示弁別処理が終了する。
次に、分類ルール設定処理により設定された分類ルールを利用して新たな不具合事例のテキストを自動分類するための自動分類処理を図16に示す。
図16を参照して、まずS170により、Jを0001とし、自動分類するテキスト総数をMとする初期化処理が実行される。この図16に示す自動分類処理の実行に際しては、前提として、図4(c)の不具合事例DB13に不具合事例IDが0000〜NのN+1個の不具合事例テキストが既に格納されており、その不具合事例テキストについてペア重要度の算出処理が既になされておりその算出結果のデータが不具合事例別ペア重要度DB15aに格納されており、その不具合事例別ペア重要度DBaに格納されているデータに基づいて図14の分類ルール設定処理が既に実行されて分類ルールDB20に分類済のデータが保存されている状態となっている。
このような状態を前提とし、さらに新たな不具合事例の文書が読込まれて不具合事例IDとしてN+1〜N+Mの新たな不具合事例テキストが不具合事例DB13に格納され、その新たな不具合事例テキストに基づいてペア重要度算出処理が行なわれて不具合事例別ペア重要度DB15aに不具合事例IDとしてN+1〜N+Mのデータが新たに格納される。その状態において、S171以降の処理が実行される。
S171により、不具合事例IDがN+Jのペア重要度データを不具合事例別ペア重要度DB15aから読出す処理が行なわれる。次にS172により、その読出したペア重要度データから1個以上のグラフを生成する処理が行なわれる。次にS173により、その生成されたグラフのうち重要度の高いペアがより含まれているグラフを上位から規定数選択する処理が行なわれる。この規定数は、固定値、ユーザ指定、あるいは過去の操作履歴からの学習などによって決定される。次にS174により、その選択されたグラフと分類ルールDB20に既に記憶されているすべてのグラフとを比較し、類似度を算出する処理が行なわれる。
次にS175により、最も類似度が高いグラフとの類似度が閾値以下であるか否かの判断がなされ、閾値を超えていると判断された場合にはS176に進み、S173により選択されたグラフを、最も類似度の高いグラフ(分類ルール)と対応付けて分類結果DB18に保存する処理が行なわれる。一方、S175により、最も類似度の高いグラフとの類似度が閾値以下であると判断された場合には、制御がS177へ進み、類似分類なしのフラグを付与して分類結果DB18に保存する処理が行なわれる。この類似分類なしのフラグが付与されたグラフについてのみ、S140〜S145の処理を実行して、ユーザ(オペレータ)による弁別操作に基づいた人為的な分類処理を行なうようにしてもよい。
第3実施の形態
図17に基づいて第3実施の形態を説明する。図17の機能ブロック図におけるハッチングのブロックは前述の第2実施の形態と同じ部分であり、ここでは相違点のみについて説明する。
この第3実施の形態においては、分類設定部22が付け加わっている。この分類設定部22を、文書読込部12が読込んだ不具合事例のそれぞれに対し、ユーザが分類を入力するその入力操作を受付けて、その入力された分類ごとに読込不具合事例を分類して分割する機能を有する。この入力する分類は、ユーザが任意に決定してもよく、あるいは、規定の分類からユーザが選択して入力してもよい。この分類設定部22で入力された分類ごとに分割された状態で、文書読込部12により読込まれた文書のテキストが不具合事例DB13に格納される。それ以降、入力されたすべての不具合事例を一括して処理するのではなく、設定された分類によって不具合事例集合に分割し、それぞれの不具合事例集合に対して、ペア重要度算出部14によるペア重要度算出処理、グラフ生成部16によるグラフ生成処理、グラフ表示・分類実施部17によるグラフ表示・分類実施、分類ルール設定部19による分類ルールの設定処理、自動分類部21による自動分類処理が実行されることとなる。
分類ルール設定部19では、分類ルール(グラフ)を1個ずつ分類ルールDB20に登録する際に、分類設定部22により設定されたどの分類の不具合事例から作成された分類ルール(グラフ)かを示す情報を付与して登録する。
第4実施の形態
次に、第4実施の形態を図18、図19に示す。図18に示した第4実施の形態における機能ブロック図において、ハッチングで示す部分は第1実施の形態と同じ部分であり、ここでは異なる部分のみを説明する。
この図18に示す第4実施の形態においては、クラス設定部23が付け加わっている。このクラス設定部23は、表示されたグラフの全体または一部についてユーザが選択し、クラス(たとえば、原因、結果、部位、部品等)を入力するためのものである。入力するクラスは、ユーザが任意に決定してもよく、あるいは規定のクラスからユーザが選択するようにしてもよい。このクラス設定部によりクラス設定された場合には、そのクラス設定されたグラフとともにクラスを分類結果DB18に保存する。
図19は、クラス設定部23によるクラス設定処理を説明するための説明図である。この図19では、表示されたグラフについてユーザが一部を選択した場合が示されている。これは、ユーザがマウス等を操作してグラフの一部やノードを選択する。表示画面上では、その選択部分が枠組みされている。この選択操作を行なうことにより、表示画面上に、クラス分けの項目である部品、故障モード、原因、対策が表示される。この項目のうちユーザがマウス等を操作して1つを選択することにより、指定されたグラフ(またはグラフの一部)について故障モードというクラスが割付けられ、そのグラフとともに故障モードというクラスが分類結果DB18に保存される。
なお、クラスごとに表示方法(色など)を変えることによって、ユーザの理解を支援できるようにしてもよい。
分類結果DB18に保存されたクラスは、たとえば、グラフ表示・分類実施部17において、指定クラスのみを表示したり、前述の第2実施の形態における自動分類部21における類似度算出処理で、指定クラスに属するリンクの重みを増加あるいは減少させるような処理を行なう。
第5実施の形態
次に図20、図21に第5実施の形態を示す。図20に示す機能ブロック図において、ハッチングブロックの部分は、第1実施の形態と同じであり、ここでは、相違点のみを説明する。この第5実施の形態においては、複合語・ストップワード登録部24と、複合語・ストップワードDB25とが付け加わっている。この複合語・ストップワード登録部24による複合語・ストップワードの登録処理の具体例を、図21に基づいて説明する。ユーザ(オペレータ)は、まずグラフで別の単語として表示されている複数のノードを選択する。図21の画面図では、「抵抗」と「導体」とが選択される場合を示している。この選択方法は、ドラッグ&ドロップなどのGUI操作でもよいし、あるいは表形式で表示された単語リストに対する操作などであってもよい。「抵抗」と「導体」とが複合語として選択された場合には、「導体抵抗」という複合語として扱われるようになる。どちらの単語をどちらに持っていくかによって、複合語の順序を決定することができ、効率的である。
このようにして選択された複数のノードの単語が、複合語・ストップワードDB25に複合語として登録され、ペア重要度算出部14での形態素解析処理を行なう際に使用される。
また、ストップワードの登録を行なう場合には、グラフ上でのノードを選択し、その選択されたノードの単語が、複合語・ストップワードDB25にストップワードとして登録される。このストップワードとして登録された単語は、ペア重要度算出部14での形態素解析処理の際に、単語として抽出されなくなる。
以上説明した各実施の形態におけるフローチャートは、それらフローチャートで示されるプログラムがネットワークあるいは記録媒体に記録された状態で流通販売され、サーバ4あるいはパーソナルコンピュータ8,9に適宜記憶されて動作するように構成される。
また、以上説明した各実施の形態では、ソフトウェアにより制御するものを示したが、図3、図13、図17、図18、図20で示したの各機能ブロックの全部または一部をハードウェアで構成するようにしてもよい。
さらに、以上説明した各実施の形態では、記載エリアが複数種類の項目に分割されている文書の一例として、FMEAに用いられる不具合事例文書を示したが、これに限らず、文章内に複数種類の項目を含む文書であれば事足り、保健指導の対話を記録したカウンセリング事例等、種々のものが対象となる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
不具合事例文書を説明する説明図である。 システム構成例を示す図である。 第1実施の形態における機能ブロック図である。 (a)はメインプログラムを示すフローチャート、(b)は文書読込処理の具体的制御内容を示すフローチャート、(c)は不具合事例DBの記憶データを説明するための図である。 ペア重要度算出処理の具体的制御内容を示すフローチャート、および、ペア重要度算出の具体例を説明する図である。 不具合事例集合におけるペア重要度算出処理の具体的制御内容を示すフローチャートである。 グラフ生成/表示/分類実施処理の具体的制御内容を示すフローチャートである。 (a)は、ペア重要度集計処理のサブルーチンプログラムを示すフローチャートであり、(b)はペア重要度集計DBに格納されているデータを説明するための図である。 (a)はグラフ生成表示処理のサブルーチンプログラムを示すフローチャートであり、(b)は読出したペアを示す図であり、(c)は読出済ペアを示す図であり、(d)は、ノード結合の状態を示す図である。 (a)は未分類不具合事例ID取得処理のサブルーチンプログラムを示すフローチャートであり、(b)は分類結果DBのグラフに含まれるペアを取出すときの具体例を示す図である。 表示されたグラフを見たユーザによるグラフの弁別操作入力の具体例およびその入力操作に従って分類結果DBに格納されるデータを説明するための図である。 (a)は指定グラフ表示処理の制御動作を示す図であり、(b)は集合グラフ生成表示処理のサブルーチンプログラムを示すフローチャートである。 第2実施の形態における機能ブロック図である。 分類ルール設定処理の制御動作を示すフローチャートである。 (a)はグラフ生成登録処理のサブルーチンプログラムを示すフローチャートであり、(b)は分類ルールの表示弁別処理のサブルーチンプログラムを示すフローチャートである。 自動分類処理の制御動作を示すフローチャートである。 第3実施の形態における機能ブロック図である。 第4実施の形態における機能ブロック図である。 クラス設定部によるクラス設定の具体例を説明するための説明図である。 第5実施の形態における機能ブロック図である。 複合語・ストップワード登録部による複合語ストップワードの登録操作の具体例を示す説明図である。
符号の説明
4 サーバ、5 知識DB、8,9 パーソナルコンピュータ、11 文書情報加工装置、19 文書読込部、13 不具合事例DB、14 ペア重要度算出部、15 ペア重要度DB、16 グラフ生成部、17 グラフ表示・分類実施部、18 分類結果DB、15a 不具合事例別ペア重要度DB、15b ペア重要度集計DB、19 分類ルール設定部、20 分類ルールDB、21 自動分類部、22 分類設定部、23 クラス設定部、24 複合語・ストップワード登録部、25 複合語・ストップワードDB。

Claims (12)

  1. 文書中からの有用情報の発見を支援するための文書情報加工方法であって、
    文章内に複数種類の項目を含む文書を読込むステップと、
    前記文書を読込むステップにより読込まれた文書から単語を抽出するステップと、
    前記単語を抽出するステップにより抽出された単語同士の距離の集合に基づいた単語間の関連度を算出し、関連のある単語同士をリンクで結合して単語集合のグラフを生成するステップと、
    前記グラフを生成するステップにより生成されたグラフを表示装置に表示させるための制御を行なうステップと、
    前記表示させるための制御を行なうステップにより表示制御されたグラフを見たユーザによる当該グラフについての有用か否かの判断結果の入力を受付け、有用と判断された有用グラフの特徴を表わすラベルを当該有用グラフに付与して格納するステップとを含む、文書情報加工方法。
  2. 前記グラフを生成するステップは、前記単語を抽出するステップにより抽出された複数の単語のうちから任意の2単語を順次選択して、当該2単語の前記文書中における距離の集合について小さい距離が多いほど関連度が高くなる評価関数に基づいて関連度を算出する、請求項1に記載の文書情報加工方法。
  3. 文書中からの有用情報の発見を支援するための文書情報加工装置であって、
    文章内に複数種類の項目を含む文書を読込む文書読込み手段と、
    前記文書読込み手段により読込まれた文書から単語を抽出する単語抽出手段と、
    前記単語抽出手段により抽出された単語同士の距離の集合に基づいた単語間の関連度を算出し、関連のある単語同士をリンクで結合して単語集合のグラフを生成するグラフ生成手段と、
    前記グラフ生成手段により生成されたグラフを表示させるための制御を行なうグラフ表示制御手段と、
    前記グラフ表示制御手段により表示制御されたグラフを見たユーザによる当該グラフについての有用か否かの判断結果の入力を受付け、有用と判断された有用グラフの特徴を表わすラベルを当該有用グラフに付与して分類済みグラフとして格納する格納手段とを含む、文書情報加工装置。
  4. 前記グラフ生成手段は、前記単語抽出手段により抽出された複数の単語のうちから任意の2単語を順次選択して、当該2単語の前記文書中における距離の集合について小さい距離が多いほど関連度が高くなる評価関数に基づいて関連度を算出する、請求項3に記載の文書情報加工装置。
  5. 文書中からの有用情報の発見を支援するための文書情報加工装置であって、
    文章内に複数種類の項目を含む文書のデータを記憶している文書データ記憶手段と、
    前記文書データ記憶手段に記憶されている文書データから単語を抽出する単語抽出手段と、
    前記単語抽出手段により抽出された単語同士の距離の集合に基づいた単語間の関連度を算出する単語間関連度算出手段と、
    前記単語間関連度算出手段により算出された関連度に基づいて、関連のある単語同士をリンクで結合して単語集合のグラフを生成するグラフ生成手段と、
    前記グラフ生成手段により生成されたグラフを表示させるための制御を行なうグラフ表示制御手段とを含む、文書情報加工装置。
  6. 前記単語間関連度算出手段は、
    前記単語抽出手段により抽出された複数の単語のうちから任意の2単語を順次選択して、当該2単語の前記文書中における距離の集合について小さい距離が多いほど関連度が高くなる評価関数に基づいて関連度を算出する、請求項5に記載の文書情報加工装置。
  7. 前記グラフ生成手段は、複数の文書からなる文書集合についてのグラフを生成する文書集合グラフ生成手段をさらに含み、
    前記文書集合グラフ生成手段は、グラフの生成対象となる文書集合に含まれている複数文書の1文書毎に算出した単語間の関連度を用いて、文書集合のグラフを生成する、請求項3〜請求項6のいずれかに記載の文書情報加工装置。
  8. 前記グラフ表示制御手段は、前記グラフ生成手段により生成された複数のグラフのうち、関連度の高い単語同士が多く含まれているグラフを上位から所定数選択して表示する制御を行なう上位表示処理を実行し、
    前記グラフ生成手段は、前記上位表示処理による表示を見たユーザによる当該グラフについての有用か否かの判断結果の入力に基づいて、有用でないと判断された削除対象グラフと有用と判断された前記有用グラフとに含まれる単語ペアを除く残りの単語ペアについて、前記単語同士の距離の集合に基づいた単語間の関連度を算出し、関連のある単語同士をリンクで結合して単語集合のグラフを生成する残り単語ペアグラフ生成処理を実行し、
    前記上位表示処理と前記残り単語ペアグラフ生成処理とを繰返し実行し、その結果を前記分類済みグラフとして前記格納手段が格納するとともに、有用ではなく削除対象と判断された削除対象グラフを削除対象であることを示す識別子を付与して格納する、請求項3〜請求項7のいずれかに記載の文書情報加工装置。
  9. 前記文書読込み手段により読込まれた新たな文書を自動的に分類するための分類ルールを設定する分類ルール設定手段をさらに含み、
    前記分類ルール設定手段は、
    前記グラフ生成手段により生成されたグラフのうち、関連度の高い単語同士が多く含まれているグラフを上位から所定数選択して格納する上位格納処理を実行する上位格納手段と、
    前記新たな文書のうち、前記上位格納手段により格納されたグラフに含まれる単語ペアを所定の重要度で含んでいる文書を除く残りの文書を割出す残り文書割出し処理を実行する残り文書割出し手段と、を含み、
    前記グラフ生成手段は、前記残り文書割出し処理により割出された残りの文書についてグラフを生成する残り文書グラフ生成処理を実行し、
    前記分類ルール設定手段は、さらに、前記残り文書グラフ生成処理と、該残り文書グラフ生成処理により生成された残りの文書のグラフについて行なう前記上位格納処理と、前記残り文書割出し処理とを、繰返し実行して、その結果前記上位格納手段に格納されたグラフを前記グラフ表示制御手段により表示制御させ、該表示制御されたグラフを見たユーザによる当該グラフについての有用か否かの判断結果の入力を受付け、有用と判断された有用グラフの特徴を表わすラベルを当該有用グラフに付与して分類ルールとして格納する分類ルール格納手段を含む、請求項3〜請求項8のいずれかに記載の文書情報加工装置。
  10. 前記文書読込み手段により新たな文書が読込まれたときに、該新たな文書について前記グラフ生成手段が生成した新たなグラフと前記分類ルール格納手段に格納されている分類ルールとしてのグラフとの類似度を算出し、類似する前記新たなグラフを類似する前記分類ルールに対応付けて格納する対応付け格納手段をさらに含む、請求項9に記載の文書情報加工装置。
  11. 請求項1に記載の文書情報加工方法をコンピュータに実行させるためのプログラム。
  12. 請求項1に記載の文書情報加工方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読取可能な記録媒体。
JP2008283451A 2008-11-04 2008-11-04 文書情報加工方法、文書情報加工装置、文書情報加工プログラムおよび記録媒体 Pending JP2010113412A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008283451A JP2010113412A (ja) 2008-11-04 2008-11-04 文書情報加工方法、文書情報加工装置、文書情報加工プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008283451A JP2010113412A (ja) 2008-11-04 2008-11-04 文書情報加工方法、文書情報加工装置、文書情報加工プログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2010113412A true JP2010113412A (ja) 2010-05-20

Family

ID=42301945

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008283451A Pending JP2010113412A (ja) 2008-11-04 2008-11-04 文書情報加工方法、文書情報加工装置、文書情報加工プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP2010113412A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011258184A (ja) * 2010-06-08 2011-12-22 International Business Maschines Corporation コンピュータ解析のためにテキスト文書を表現するためのグラフィカル・モデル
JP2021015483A (ja) * 2019-07-12 2021-02-12 株式会社東芝 是正処置活動の支援装置、方法及びプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1074210A (ja) * 1996-07-05 1998-03-17 Hitachi Ltd 文献検索支援方法及び装置およびこれを用いた文献検索サービス
JP2000010986A (ja) * 1998-06-18 2000-01-14 Trendy:Kk ドキュメントデータベースの検索支援方法とそのプログラムを記憶した記憶媒体
JP2000123041A (ja) * 1998-10-19 2000-04-28 Nippon Telegr & Teleph Corp <Ntt> 類似度判定方法及び文書検索装置及び文書分類装置及び文書検索プログラムを格納した記憶媒体及び文書分類プログラムを格納した記憶媒体
JP2000339317A (ja) * 1999-05-25 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> リンク情報とキーワードの関連度計算方法、装置、及びその方法を記憶した記録媒体
JP2005250916A (ja) * 2004-03-05 2005-09-15 Senku:Kk 電子文書の話題単語関連図作成方法
JP2007193500A (ja) * 2006-01-18 2007-08-02 Mitsubishi Electric Corp 文書または図面作成支援装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1074210A (ja) * 1996-07-05 1998-03-17 Hitachi Ltd 文献検索支援方法及び装置およびこれを用いた文献検索サービス
JP2000010986A (ja) * 1998-06-18 2000-01-14 Trendy:Kk ドキュメントデータベースの検索支援方法とそのプログラムを記憶した記憶媒体
JP2000123041A (ja) * 1998-10-19 2000-04-28 Nippon Telegr & Teleph Corp <Ntt> 類似度判定方法及び文書検索装置及び文書分類装置及び文書検索プログラムを格納した記憶媒体及び文書分類プログラムを格納した記憶媒体
JP2000339317A (ja) * 1999-05-25 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> リンク情報とキーワードの関連度計算方法、装置、及びその方法を記憶した記録媒体
JP2005250916A (ja) * 2004-03-05 2005-09-15 Senku:Kk 電子文書の話題単語関連図作成方法
JP2007193500A (ja) * 2006-01-18 2007-08-02 Mitsubishi Electric Corp 文書または図面作成支援装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011258184A (ja) * 2010-06-08 2011-12-22 International Business Maschines Corporation コンピュータ解析のためにテキスト文書を表現するためのグラフィカル・モデル
JP2021015483A (ja) * 2019-07-12 2021-02-12 株式会社東芝 是正処置活動の支援装置、方法及びプログラム

Similar Documents

Publication Publication Date Title
JP4691374B2 (ja) 設計支援システム
JP6233411B2 (ja) 障害分析装置、障害分析方法、および、コンピュータ・プログラム
CN102576358B (zh) 单词对取得装置、单词对取得方法及其程序
US8019761B2 (en) Recording medium storing a design support program, design support method, and design support apparatus
JP2017224184A (ja) 機械学習装置
US20170109668A1 (en) Model for Linking Between Nonconsecutively Performed Steps in a Business Process
JP2008027072A (ja) データベース分析プログラム、データベース分析装置、データベース分析方法
JP6674831B2 (ja) 因果関係抽出装置、因果関係抽出方法及び因果関係抽出プログラム
WO2015061046A2 (en) Method and apparatus for performing topic-relevance highlighting of electronic text
Bykau et al. Fine-grained controversy detection in Wikipedia
JP6432266B2 (ja) グループ化方法、グループ化装置、およびグループ化プログラム
JP2017049639A (ja) 評価プログラム、手順書評価方法、および評価装置
JP2010113412A (ja) 文書情報加工方法、文書情報加工装置、文書情報加工プログラムおよび記録媒体
Yano et al. Labeling feature-oriented software clusters for software visualization application
Sharma et al. Bug Report Triaging Using Textual, Categorical and Contextual Features Using Latent Dirichlet Allocation
Gruppi et al. Tell me who your friends are: Using content sharing behavior for news source veracity detection
CN103853805B (zh) 信息处理装置和方法
TW201539217A (zh) 文件分析系統、文件分析方法、以及文件分析程式
JP6914982B2 (ja) 支援システム、プログラム、及び記憶媒体
JP6589036B1 (ja) 障害予兆検知システムおよびプログラム
Sönmez Classifying common vulnerabilities and exposures database using text mining and graph theoretical analysis
Hashemi et al. Graph centrality algorithms for hardware trojan detection at gate-level netlists
CN106227661A (zh) 数据处理方法及装置
JP2010238041A (ja) 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法
JP5900197B2 (ja) 経路条件選択装置、該プログラム、及び該方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110909

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130409

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130730