JP7223549B2 - 情報運用装置および情報運用方法 - Google Patents
情報運用装置および情報運用方法 Download PDFInfo
- Publication number
- JP7223549B2 JP7223549B2 JP2018196065A JP2018196065A JP7223549B2 JP 7223549 B2 JP7223549 B2 JP 7223549B2 JP 2018196065 A JP2018196065 A JP 2018196065A JP 2018196065 A JP2018196065 A JP 2018196065A JP 7223549 B2 JP7223549 B2 JP 7223549B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- document
- group
- incident
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
文書群の情報を運用する情報運用装置であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定部と、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析部と、
前記テキストデータの係り受け解析をする係り受け解析部と、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成部と、
前記作成されたグラフのクラスタリングを行うクラスタリング部と、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出部と、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算部と、を備え、
前記特定の文書群に含まれる第1の文書について、前記トピック割合計算部が計算したトピック割合と、前記特定の文書群に含まれる第2の文書について、前記トピック割合計算部が計算したトピック割合とを用いて、第1の文書と第2の文書との間の類似度を計算する類似度計算部、をさらに備える、
ことを特徴とする。
また、本発明は、
文書群の情報を運用する情報運用装置であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定部と、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析部と、
前記テキストデータの係り受け解析をする係り受け解析部と、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成部と、
前記作成されたグラフのクラスタリングを行うクラスタリング部と、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出部と、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算部と、を備え、
前記特定の文書群は、特定のインシデント群であり、
前記特定のインシデント群に関するインシデント傾向を通知する要求があった場合、前記特定のインシデント群に含まれる各インシデントについて、前記トピック割合計算部が計算したトピック割合を用いたインシデント傾向結果を応答するインシデント分析部、をさらに備える、
ことを特徴とする。
文書群の情報を運用する情報運用装置が実行する情報運用方法であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定ステップと、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析ステップと、
前記テキストデータの係り受け解析をする係り受け解析ステップと、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成ステップと、
前記作成されたグラフのクラスタリングを行うクラスタリングステップと、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出ステップと、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算ステップと、を実行し、
前記特定の文書群に含まれる第1の文書について、前記トピック割合計算ステップで計算したトピック割合と、前記特定の文書群に含まれる第2の文書について、前記トピック割合計算ステップで計算したトピック割合とを用いて、第1の文書と第2の文書との間の類似度を計算する類似度計算ステップ、をさらに実行する、
ことを特徴とする。
また、本発明は、
文書群の情報を運用する情報運用装置が実行する情報運用方法であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定ステップと、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析ステップと、
前記テキストデータの係り受け解析をする係り受け解析ステップと、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成ステップと、
前記作成されたグラフのクラスタリングを行うクラスタリングステップと、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出ステップと、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算ステップと、を実行し、
前記特定の文書群は、特定のインシデント群であり、
前記特定のインシデント群に関するインシデント傾向を通知する要求があった場合、前記特定のインシデント群に含まれる各インシデントについて、前記トピック割合計算ステップで計算したトピック割合を用いたインシデント傾向結果を応答するインシデント分析ステップ、をさらに備える、
ことを特徴とする。
その他の発明については、後記する。
また、本実施形態では、テキストデータは、日本語の文字列であるとするが、これに限定されず、他の言語の文字列であってもよい。
図1に示すように、情報運用装置100は、要求取得部1と、検索範囲指定部2と、テキストマイニング部3と、トピック割合計算部4と、類似度計算部5と、原因・対策推定部6と、ナレッジ修正支援部7と、インシデント分析部8と、応答出力部9と、インシデント対応履歴DB11と、ナレッジDB12と、を備える。
インシデント対応履歴DB11は、運用側で作成されたインシデントに所定の管理情報を付加した情報をインシデント対応履歴として記憶するデータベースである。図2に示すように、インシデント対応履歴DB11は、「カテゴリ」、「管理番号」、「類似度(タイトル・事象)」、「類似度(タイトル・事象・原因・対策)」、「タイトル」、「事象」、「原因」、「対策」、「ステータス」、「記録者」、「受付日時」、「原因分類」といった欄を有し、インシデントごとにエントリを作成して、管理する。
「事象」欄には、管理対象となるインシデントの事象を示すテキストデータが格納される。
「原因」欄には、管理対象となるインシデントの原因を示すテキストデータが格納される。
「対策」欄には、管理対象となるインシデントの対策を示すテキストデータが格納される。
「受付日時」欄には、管理対象となるインシデントに係る問合せをオペレータが受け付けた日時を示す値が格納される。
「原因分類」欄には、管理対象となるインシデントの原因を分類するための語(例:機能仕様、操作手順誤り)が格納される。
図1に戻って、ナレッジDB12は、運用側で作成されたナレッジに所定の管理情報を付加した情報を記憶するデータベースである。図3に示すように、ナレッジDB12は、「カテゴリ」、「管理番号」、「タイトル」、「事象」、「原因」、「対策」、「作成日時」、「原因分類」といった欄を有し、ナレッジごとにエントリを作成して、管理する。
「事象」欄には、管理対象となるナレッジの事象を示すテキストデータが格納される。
「原因」欄には、管理対象となるナレッジの原因を示すテキストデータが格納される。
「対策」欄には、管理対象となるナレッジの対策を示すテキストデータが格納される。
「原因分類」欄には、管理対象となるナレッジの原因を分類するための語が格納される。
図1に戻って、要求取得部1は、利用者からの要求を取得する。利用者は、例えば、システム障害等の問合せをするユーザ(または問合せを受けたオペレータ)、インシデントおよびナレッジを管理する管理者、インシデントを用いた分析を行う分析者に分類することができるが、これらに限定されない。よって、利用者からの要求の種類は様々である。また、要求取得部1が取得する要求には、システム稼働状況を監視する装置からのアラート情報等が含まれていてもよい。
検索範囲指定部2は、情報運用装置100が扱う文書群のうち特定の文書群を検索範囲として指定する。情報運用装置100が扱う文書群とは、具体的には、インシデント対応履歴DB11に登録されたインシデント、および、ナレッジDB12に登録されたナレッジである。特定の文書群は、情報運用装置100が扱う文書群の全体または部分文書群である。特定の文書群は、例えば、インシデント対応履歴DB11に登録されているすべてのインシデントでもよいし、直近1週間以内に作成されたインシデントのみでもよいし、任意に指定した1つのインシデントでもよいし、さまざま文書群とすることができる。
テキストマイニング部3は、文書群のテキストマイニングを行う。テキストマイニングの対象となる文書群は、検索範囲指定部2が指定した検索範囲となる特定の文書群である。図4に示すように、テキストマイニング部3は、読込部21と、前処理部22と、形態素解析部23と、係り受け解析部24と、グラフ作成部25と、クラスタリング部26と、抽出部27と、設定部28と、を備える。
前処理部22は、テキストデータの前処理を行う。テキストデータの前処理とは、形態素解析で正しい結果を得るための予備処理である。例えば、同じ意味となる語の全角文字と半角文字が存在する場合にいずれか一方に統一すること、長音記号「ー」とマイナス記号「-」のような、字形が類似することに起因する誤用に対して正しい記号に修正すること、などがある。
なお、テキストデータの前処理は、必須ではない。
クラスタリング部26は、グラフ作成部25が作成したグラフのクラスタリングを行う。クラスタリング部26は、複数の文書に対応する1つのグラフのクラスタリングを行うことができる。その結果、1または複数のクラスタが生成される。クラスタリングによって、グラフ上の各ノードの配置は、例えば、ばねモデルに従うようにすることができる。
ここで、テキストマイニング部3が実行するテキストマイニング処理について、図5を参照して説明する。説明の際、図4も適宜参照する。テキストマイニング部3は、テキストマイニング処理の対象となる文書群を予め記憶している。
テキストマイニング部3は、図5のテキストマイニング処理による結果を、既存のビジュアライズ技術によって、例えば、グラフ構造に従って配置された、文書群中の語の集合の画面表示として出力することができる。
したがって、本実施形態によれば、シソーラスを用いない高精度なテキストマイニング(シソーラスを用いた従来のテキストマイニングと同程度の精度のテキストマイニング)を実現することができる。
したがって、本実施形態によれば、〈評価対象〉の定義漏れに起因するテキストマイニングの精度の低下を防ぐことができる。
図1に戻って、トピック割合計算部4は、テキストマイニング処理がなされた特定の文書群に含まれる文書ごとのトピック割合を計算する。特定の文書群に含まれる各文書には、1または複数の特徴語が出現し、各特徴語は、テキストマイニング処理において生成された1または複数種類のクラスタの何れかに属している。また、生成されたクラスタの各々に対して所定のトピックが(設定部28によって設定されていなくても)対応付けられている。つまり、特定の文書群に含まれる各文書は、1または複数種類のトピックを含んでいる。
・対象文書における対象トピックのトピック割合 = (対象トピックに対応するクラスタに属する特徴語の数)/(対象文書に出現する特徴語の総数)
対象文書における対象トピックのトピック割合を、対象文書に含まれるすべてのトピックについて計算し、足し合わせれば1となる。
類似度計算部5は、特定の文書群に含まれる第1の文書について、トピック割合計算部4が計算したトピック割合と、特定の文書群に含まれる第2の文書について、トピック割合計算部5が計算したトピック割合とを用いて、第1の文書と第2の文書との間の類似度を計算する。類似度の計算方法は、例えば、コサイン類似度を用いることができるが、これに限定されない。コサイン類似度によって、第1の文書と第2の文書との間の類似度を計算する方法は以下の通りである。
また、図2に示す類似度(タイトル・事象)は、上記と同様のテキストマイニング処理(図5)を実行した場合において、類似度計算部5が、問合せデータに含まれるテキストデータと、各インシデントのタイトルおよび事象の2項目に含まれるテキストデータとに対して計算した類似度である。
原因・対策推定部6は、情報運用装置100の利用者が、システム障害等の問合せをするユーザであった場合、当該ユーザのユーザ端末からの要求、つまり問合せについて、インシデント対応履歴DB11およびナレッジDB12を参照して、事象の原因、および、対策を推定する。原因・対策推定部6による処理の詳細は、後記する。
ナレッジ修正支援部7は、情報運用装置100の利用者が、インシデントおよびナレッジを管理する管理者であった場合、当該管理者の管理者端末からの要求に応じて、インシデント対応履歴DB11およびナレッジDB12を参照して、ナレッジDB12のナレッジの修正を支援する。ナレッジ修正支援部7は、インシデント対応履歴DB11のインシデントの各々、および、ナレッジDB12のナレッジの各々の間で、類似度計算部5による類似度を計算し、計算した類似度を用いて、修正対象となるナレッジの候補を決定する。ナレッジ修正支援部7による処理の詳細は、後記する。
インシデント分析部8は、情報運用装置100の利用者が、インシデントを用いた分析を行う分析者であった場合、当該分析者の分析者端末からの要求に応じて、インシデント対応履歴DB11を参照して、インシデントの分析を支援する。インシデント分析部8は、トピック割合計算部4が計算したトピック割合を用いた画面情報を含むインシデント傾向結果を応答することができる。インシデント分析部8による処理の詳細は、後記する。
応答出力部9は、トピック割合計算部4、類似度計算部5、原因・対策推定部6、ナレッジ修正支援部7、および、インシデント分析部8による処理結果を出力し、利用者に応答する。
本実施形態の情報運用装置100が実行する具体的な処理について説明する。情報運用装置100が実行する具体的な処理には、トピック割合計算処理、類似度計算処理、原因・対策推定処理、新規ナレッジ作成支援処理、グループ化処理、既存ナレッジ統廃合支援処理、既存ナレッジ見直し支援処理、インシデント傾向把握支援処理があり、順次説明する。
トピック割合計算処理は、情報運用装置100がトピック割合計算部4によって実行する処理である。以下、図6を参照して、トピック割合計算処理の詳細を説明する(適宜他図を参照)。トピック割合計算処理は、例えば、オペレータからトピック割合計算の要求があった場合に開始する。
最後に、トピック割合計算部4は、トピック割合計算部4によって、テキストマイニング処理がなされた特定の文書群について、文書ごとのトピック割合を計算する(ステップT3)。
類似度計算処理は、情報運用装置100が類似度計算部5によって実行する処理である。以下、図7を参照して、類似度計算処理の詳細を説明する(適宜他図を参照)。類似度計算処理は、例えば、オペレータから類似度計算の要求があった場合に開始する。当該要求には、検索範囲指定部2が指定した検索範囲となる特定の文書群のうち、類似度の計算対象となる第1の文書および第2の文書の識別情報が含まれている。
原因・対策推定処理は、情報運用装置100が原因・対策推定部6によって実行する処理である。以下、図8を参照して、原因・対策推定処理の詳細を説明する(適宜他図を参照)。原因・対策推定処理は、システム障害等の対策を知りたいユーザから問合せがあった場合に開始する。
次に、原因・対策推定部6は、テキストマイニング部3によって、検索範囲のグラフ(以下、「グラフ(検索範囲)」を称する場合がある)を作成する(ステップA4)。具体的には、検索範囲に対し、前処理部22(図4)による前処理、形態素解析部23(図4)および係り受け解析部24(図4)による解析を経て、グラフ作成部25(図4)が、グラフ(検索範囲)を作成する。
次に、原因・対策推定部6は、テキストマイニング部3のクラスタリング部26によって、マージしたグラフのクラスタリングを行う(ステップA6)。その結果、マージしたグラフに関する1または複数のクラスタが生成される。
次に、原因・対策推定部6は、トピック割合計算部4によって、抽出された特徴語を用いて、検索範囲となる特定の文書群において、文書ごとのトピック割合を計算する(ステップA8)。
新規ナレッジ作成支援処理は、情報運用装置100がナレッジ修正支援部7によって実行する処理であり、蓄積されたインシデントを新規のナレッジとしてもよいか否かを判定することを目的とする処理である。以下、図9、図10を参照して、新規ナレッジ作成支援処理の詳細を説明する(適宜他図を参照)。新規ナレッジ作成支援処理は、日々更新されるインシデントに対してナレッジを修正したいと考えている管理者からの要求があった場合に開始する。
また、類似度計算部5は、トピック割合計算部4が計算したトピック割合を用いて、INC001~INC010のインシデント、および、KLG001~KLG010のナレッジからなる計20個の文書群のうち2文書の組のすべてに対して、類似度を計算することができる。図9に、類似度の計算結果のマトリクスを示す。この計算結果は、情報運用装置100の記憶部に記憶される。
また、図9において、類似度に関する閾値は0.6とし、閾値以上となる類似度を示すセルには斜線の網掛けを図示している。
次に、ナレッジ修正支援部7は、検索範囲指定部2によって、新規ナレッジ作成支援要求から、特定の文書群としての検索範囲を指定する(ステップB2)。新規ナレッジ作成支援要求には、新規ナレッジ作成支援処理を実行するときの対象となる特定の文書群(INC001~INC010のインシデント、および、KLG001~KLG010のナレッジからなる計20個の文書群)の識別情報が含まれており、当該識別情報から特定の文書群を処理対象とする。
次に、ナレッジ修正支援部7は、トピック割合計算部4および類似度計算部5によって、検索範囲となる特定の文書群に対する類似度計算結果(図9参照)を出力する(ステップB3)。
図11に示すグループ化処理について詳細に説明する。グループ化処理は、文書群中の各文書を複数のグループでグループ分けし、各文書がいずれのグループに属するかを決定する処理である。グループ化処理は、ナレッジ修正支援部7が実行する。
既存ナレッジ統廃合支援処理は、情報運用装置100がナレッジ修正支援部7によって実行する処理であり、ナレッジDB12に蓄積された既存のナレッジについて、いくつかを1つに統合したり、廃棄したりしてもよいか否かを判定することを目的とする処理である。以下、図9、図12を参照して、既存ナレッジ統廃合支援処理の詳細を説明する(適宜他図を参照)。既存ナレッジ統廃合支援処理は、ナレッジの修正を考えている管理者からの要求があった場合に開始する。新規ナレッジ作成支援処理(図10)と同様にして、既存ナレッジ統廃合支援処理を実行するために、検索範囲指定部2が検索範囲として指定した特定の文書群は、図9に示すものとする。
次に、ナレッジ修正支援部7は、検索範囲指定部2によって、既存ナレッジ統廃合支援要求から、特定の文書群としての検索範囲を指定する(ステップD2)。既存ナレッジ統廃合支援要求には、既存ナレッジ統廃合支援処理を実行するときの対象となる特定の文書群(INC001~INC010のインシデント、および、KLG001~KLG010のナレッジからなる計20個の文書群)の識別情報が含まれており、当該識別情報から特定の文書群を処理対象とする。
次に、ナレッジ修正支援部7は、トピック割合計算部4および類似度計算部5によって、検索範囲となる特定の文書群に対する類似度計算結果(図9参照)を出力する(ステップD3)。
既存ナレッジ見直し支援処理は、情報運用装置100がナレッジ修正支援部7によって実行する処理であり、蓄積されたインシデントから既存のナレッジを見直すべきか否かを判定することを目的とする処理である。以下、図9、図13を参照して、既存ナレッジ見直し支援処理の詳細を説明する(適宜他図を参照)。既存ナレッジ見直し支援処理は、日々更新されるインシデントに対してナレッジを見直したいと考えている管理者からの要求があった場合に開始する。新規ナレッジ作成支援処理(図10)と同様にして、既存ナレッジ見直し支援処理を実行するために、検索範囲指定部2が検索範囲として指定した特定の文書群は、図9に示すものとする。
次に、ナレッジ修正支援部7は、検索範囲指定部2によって、既存ナレッジ見直し支援要求から、特定の文書群としての検索範囲を指定する(ステップE2)。既存ナレッジ見直し支援要求には、既存ナレッジ見直し支援処理を実行するときの対象となる特定の文書群(INC001~INC010のインシデント、および、KLG001~KLG010のナレッジからなる計20個の文書群)の識別情報が含まれており、当該識別情報から特定の文書群を処理対象とする。
次に、ナレッジ修正支援部7は、トピック割合計算部4および類似度計算部5によって、検索範囲となる特定の文書群に対する類似度計算結果(図9参照)を出力する(ステップE3)。
インシデント傾向把握支援処理は、情報運用装置100がインシデント分析部8によって実行する処理である。以下、図14を参照して、インシデント傾向把握支援処理の詳細を説明する(適宜他図を参照)。インシデント傾向把握支援処理は、インシデント群を分析する分析者から要求があった場合に開始する。
なお、検索範囲が複数指定されていた場合、トピック割合計算部4は、指定された検索範囲ごとに、トピック割合計算結果を出力する。
なお、トピック割合計算結果は、画面情報として表示することに限定されず、例えば、テキスト情報といった他の媒体による情報として表示することもできる。
検索ボタン1301cは、コンボボックス1301aで選択された検索手段で、検索ワード入力欄1301bに入力された検索ワードで検索を開始するためのGUIである。
原因タブ1302bは、検索ボタン1301cの検索で該当するインシデントのうち、原因のテキストを表示するためのGUIである。
対策タブ1302cは、検索ボタン1301cの検索で該当するインシデントのうち、対策のテキストを表示するためのGUIである。
なお、文書のタイトルのテキストを表示するためのタイトルタブがあってもよい。
前年度ボタン1303bは、例えば、前年4月~当年3月の期間に受け付けたインシデント群(分析対象となるインシデント群全体)のインシデント傾向結果を表示するためのGUIである。
なお、任意の期間に受け付けたインシデント群のインシデント傾向結果を表示するためのGUIを設けてもよい。
なお、説明の便宜上、インシデントの発生日時は、インシデント対応履歴DB11(図2)の「受付日時」と同じとする。
「トピック割合」欄には、該当週に発生したインシデント群に対してトピック割合計算部4が計算したトピック割合の値が格納される。「トピック割合」欄に格納されたトピック割合は、対象のインシデント群の各インシデントごとにピック割合計算部4が計算したトピック割合の平均値を示す。
「トピック割合×インシデント発生件数」欄には、トピック割合と、該当週に発生したインシデントの発生件数との積の値が格納される。
「特徴語」欄には、該当週に発生したインシデント群に対して設定されたトピックに属する特徴語が格納される。
上記の情報リストL1に関する、トピック割合エリア1303、インシデント発生件数エリア1304、特徴語一覧エリア1305の表示の説明は、情報リストL2,L3にもあてはまる。つまり、図16に示すインシデント傾向結果の情報は、図15に示す画面に一通り表示される。
本実施形態によれば、情報運用装置100がトピック割合計算部4を備えることにより、特定の文書群の各文書がどのようなトピックで構成された文書であるかを定量的に評価することができ、文書の分類を詳細かつ容易にすることができる。つまり、トピック割合計算部4は、利用者からの要求に対し、正確な情報を迅速に応答するための手段となり得る。
したがって、情報発信の正確性および迅速性の向上を支援することができる。
このとき、検索範囲指定部2が、特定の文書群に含まれる各文書の一部を検索範囲として指定することで、原因および対策を含む文書が存在するか否かの判断に要する時間を短縮することができ、ユーザへの応答をより早くすることができる。
(a):本実施形態では、係り受け解析の際、係り受け解析部24が名詞および形容詞の形態素を選択した。しかし、選択される品詞は、名詞および形容詞に限らず、例えば副詞の形態素も選択してもよい。また、“何が(〈属性〉)どうなのか(〈評価〉)”ではなく、“何が(〈属性〉)どうした(〈評価〉)”を知りたい場合には、係り受け解析部24が名詞および動詞の形態素を選択することもできる。係り受けの種類に応じて、選択する形態素の品詞を適宜変更することができる。
本実施形態で説明したソフトウェアをハードウェアとして実現することもでき、ハードウェアをソフトウェアとして実現することもできる。
その他、ハードウェア、ソフトウェア、フローチャートなどについて、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
1 要求取得部
2 検索範囲指定部
3 テキストマイニング部
4 トピック割合計算部
5 類似度計算部
6 原因・対策推定部
7 ナレッジ修正支援部
8 インシデント分析部
9 応答出力部
11 インシデント対応履歴DB
12 ナレッジDB
21 読込部
22 前処理部
23 形態素解析部
24 係り受け解析部
25 グラフ作成部
26 クラスタリング部
27 抽出部
28 設定部
Claims (7)
- 文書群の情報を運用する情報運用装置であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定部と、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析部と、
前記テキストデータの係り受け解析をする係り受け解析部と、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成部と、
前記作成されたグラフのクラスタリングを行うクラスタリング部と、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出部と、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算部と、を備え、
前記特定の文書群に含まれる第1の文書について、前記トピック割合計算部が計算したトピック割合と、前記特定の文書群に含まれる第2の文書について、前記トピック割合計算部が計算したトピック割合とを用いて、第1の文書と第2の文書との間の類似度を計算する類似度計算部、をさらに備える、
ことを特徴とする情報運用装置。 - 問合せのテキストデータである問合せデータの入力があった場合、前記問合せデータと、前記特定の文書群との間で、前記類似度計算部による類似度を計算し、前記計算した類似度が閾値以上となる文書を応答する原因・対策推定部、をさらに備える、
ことを特徴とする請求項1に記載の情報運用装置。 - 前記検索範囲指定部は、前記特定の文書群に含まれる各文書の一部を前記検索範囲として指定し、
前記原因・対策推定部は、前記問合せデータと、前記特定の文書群のうち前記指定された検索範囲との間で、前記類似度計算部による類似度を計算し、前記計算した類似度が閾値以上となる文書を応答する、
ことを特徴とする請求項2に記載の情報運用装置。 - 前記特定の文書群に含まれる文書は、インシデントおよびナレッジであり、
前記インシデントおよび前記ナレッジの各々について、他のインシデントおよび他のナレッジとの間で、前記類似度計算部による類似度を計算し、前記計算した類似度を用いて、修正対象となる前記ナレッジの候補を決定するナレッジ修正支援部、をさらに備える、
ことを特徴とする請求項1に記載の情報運用装置。 - 文書群の情報を運用する情報運用装置であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定部と、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析部と、
前記テキストデータの係り受け解析をする係り受け解析部と、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成部と、
前記作成されたグラフのクラスタリングを行うクラスタリング部と、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出部と、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算部と、を備え、
前記特定の文書群は、特定のインシデント群であり、
前記特定のインシデント群に関するインシデント傾向を通知する要求があった場合、前記特定のインシデント群に含まれる各インシデントについて、前記トピック割合計算部が計算したトピック割合を用いたインシデント傾向結果を応答するインシデント分析部、をさらに備える、
ことを特徴とする情報運用装置。 - 文書群の情報を運用する情報運用装置が実行する情報運用方法であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定ステップと、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析ステップと、
前記テキストデータの係り受け解析をする係り受け解析ステップと、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成ステップと、
前記作成されたグラフのクラスタリングを行うクラスタリングステップと、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出ステップと、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算ステップと、を実行し、
前記特定の文書群に含まれる第1の文書について、前記トピック割合計算ステップで計算したトピック割合と、前記特定の文書群に含まれる第2の文書について、前記トピック割合計算ステップで計算したトピック割合とを用いて、第1の文書と第2の文書との間の類似度を計算する類似度計算ステップ、をさらに実行する、
ことを特徴とする情報運用方法。 - 文書群の情報を運用する情報運用装置が実行する情報運用方法であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定ステップと、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析ステップと、
前記テキストデータの係り受け解析をする係り受け解析ステップと、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成ステップと、
前記作成されたグラフのクラスタリングを行うクラスタリングステップと、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出ステップと、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算ステップと、を実行し、
前記特定の文書群は、特定のインシデント群であり、
前記特定のインシデント群に関するインシデント傾向を通知する要求があった場合、前記特定のインシデント群に含まれる各インシデントについて、前記トピック割合計算ステップで計算したトピック割合を用いたインシデント傾向結果を応答するインシデント分析ステップ、をさらに備える、
ことを特徴とする情報運用方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018196065A JP7223549B2 (ja) | 2018-10-17 | 2018-10-17 | 情報運用装置および情報運用方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018196065A JP7223549B2 (ja) | 2018-10-17 | 2018-10-17 | 情報運用装置および情報運用方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020064463A JP2020064463A (ja) | 2020-04-23 |
JP7223549B2 true JP7223549B2 (ja) | 2023-02-16 |
Family
ID=70388313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018196065A Active JP7223549B2 (ja) | 2018-10-17 | 2018-10-17 | 情報運用装置および情報運用方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7223549B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113722278A (zh) * | 2021-07-27 | 2021-11-30 | 山东旗帜信息有限公司 | 一种基于pdf文件的知识元抽取方法、设备及介质 |
US20230222358A1 (en) * | 2022-01-10 | 2023-07-13 | International Business Machines Corporation | Artificial intelligence operations adaptive multi-granularity event grouping |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009211429A (ja) | 2008-03-04 | 2009-09-17 | Fujitsu Ltd | 情報提供方法、情報提供装置、情報提供プログラム、および該プログラムをコンピュータに記録した記録媒体 |
US20150120738A1 (en) | 2010-12-09 | 2015-04-30 | Rage Frameworks, Inc. | System and method for document classification based on semantic analysis of the document |
-
2018
- 2018-10-17 JP JP2018196065A patent/JP7223549B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009211429A (ja) | 2008-03-04 | 2009-09-17 | Fujitsu Ltd | 情報提供方法、情報提供装置、情報提供プログラム、および該プログラムをコンピュータに記録した記録媒体 |
US20150120738A1 (en) | 2010-12-09 | 2015-04-30 | Rage Frameworks, Inc. | System and method for document classification based on semantic analysis of the document |
Non-Patent Citations (1)
Title |
---|
柳沢孝ほか,潜在的トピックモデルに基づく索引語の係り受けを用いた文書検索,第3回データ工学と情報マネジメントに関するフォーラム 論文集 [online],電子情報通信学会データ工学専門委員会,2011年08月04日,pp.1-6,[検索日:2011.08.04], Internet<URL:http://db-event.jpn.org/deim2011/proceedings/pdf/a1-1.pdf> |
Also Published As
Publication number | Publication date |
---|---|
JP2020064463A (ja) | 2020-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11789952B2 (en) | Ranking enterprise search results based on relationships between users | |
US11663254B2 (en) | System and engine for seeded clustering of news events | |
US9842170B2 (en) | Method, apparatus and system of intelligent navigation | |
US10970314B2 (en) | Content discovery systems and methods | |
US8719302B2 (en) | Methods, apparatus and software for analyzing the content of micro-blog messages | |
CN103729359B (zh) | 一种推荐搜索词的方法及系统 | |
CN113704451B (zh) | 一种电力用户诉求筛选方法、系统、电子设备和存储介质 | |
JP4962967B2 (ja) | Webページ検索サーバ及びクエリ推薦方法 | |
CN108475320B (zh) | 在搜索查询当中识别查询模式及相关联的聚合统计 | |
KR19990076970A (ko) | 다수 및/또는 복합 질의를 사용하여 데이터 세트의 내용을 평가하는 방법 및 시스템 | |
CN104077407B (zh) | 一种智能数据搜索系统及方法 | |
US10002187B2 (en) | Method and system for performing topic creation for social data | |
MXPA03009815A (es) | Generacion dinamica de presentaciones personalizadas de contenido de informacion de dominio especifico. | |
TW201915777A (zh) | 金融非結構化文本分析系統及其方法 | |
US20130066865A1 (en) | Implicit or explicit subscriptions and automatic user preference profiling in collaboration systems | |
US9996529B2 (en) | Method and system for generating dynamic themes for social data | |
JPWO2014002775A1 (ja) | 同義語抽出システム、方法および記録媒体 | |
KR20220064016A (ko) | 빅데이터를 활용한 데이터마이닝기반 건설사고 객체정보 추출 방법 | |
CA2956627A1 (en) | System and engine for seeded clustering of news events | |
JP7223549B2 (ja) | 情報運用装置および情報運用方法 | |
JP5556711B2 (ja) | カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム | |
JP4631795B2 (ja) | 情報検索支援システム、情報検索支援方法および情報検索支援プログラム | |
JP2015194831A (ja) | 障害現象情報分析装置及び障害現象情報分析方法 | |
JP2022137569A (ja) | 情報管理システム | |
JP2019117484A (ja) | テキストマイニング装置およびテキストマイニング方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211012 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221020 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230206 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7223549 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |