JP7223549B2

JP7223549B2 - 情報運用装置および情報運用方法

Info

Publication number: JP7223549B2
Application number: JP2018196065A
Authority: JP
Inventors: 彩中嶋; 隆之神田; 雅之山本; 公司田中; 信治三浦
Original assignee: Hitachi Social Information Services Ltd
Current assignee: Hitachi Social Information Services Ltd
Priority date: 2018-10-17
Filing date: 2018-10-17
Publication date: 2023-02-16
Anticipated expiration: 2038-10-17
Also published as: JP2020064463A

Description

本発明は、情報運用装置および情報運用方法に関する。

特許文献１には、「音声認識処理によって談話の内容がテキスト化された談話データ、および前記談話データにおける前記談話の構造の解析結果である、前記談話全体の意味内容を把握するための情報である談話セマンティクスを入力とし、前記談話データからＦＡＱ候補となる質問文を抽出して出力するＦＡＱ候補抽出システムであって、前記談話セマンティクスは、前記談話データにおける各ステートメントの意味内容を示すフローの情報を含むフロー情報を含み、前記談話データから、顧客によって発話され、前記談話セマンティクスの前記フロー情報において質問文もしくは要求文であることを示すフローが設定された質問・要求ステートメントを抽出する質問抽出部と、前記質問抽出部によって抽出された前記質問・要求ステートメントから、指定されたキーワードを含むものを抽出する候補抽出部と、前記候補抽出部によって抽出された前記質問・要求ステートメントについて、内容が同様のものにクラスタリングし、各クラスタの代表となる前記質問・要求ステートメントをＦＡＱ候補として出力するクラスタリング部とを有することを特徴とするＦＡＱ候補抽出システム」について開示されている。

特開２０１２－３７０４号公報（請求項１）

ヘルプデスクやサービスデスクなどの業務では、利用者からの問い合わせに対して、正確な情報を利用者に発信するという、情報発信の正確性、および、利用者への情報発信を迅速にするという、情報発信の迅速性の両方を向上させて欲しいという要望がある。この要望を満たすため、業務運用側は、利用者との対応履歴を蓄積していき、利用者からの問い合わせが過去の対応履歴と同一または類似していた場合には、当該対応履歴を利用者に即座に発信していた。一方、同一でも類似でもなかった場合には、例えば、担当部署に迅速に問合せを引き継ぐようにしていた。

しかし、業務の運用を継続するにつれ、利用者との対応履歴の蓄積量が増大するため、業務運用側で管理する情報が複雑化、多様化、重複化（同じ意味でも異なるテキストが用いられた情報を管理）する。その結果、同一または類似の対応履歴を抽出するのに時間を要してしまい、上記要望を満たすことが困難になるという問題がある。

特許文献１の技術によれば、利用者の話し言葉に起因する問合せのテキストのずれの影響を受けることなく、適切な対応履歴を発信することは可能と思われる。しかし、業務運用側で管理する情報の複雑化、多様化、重複化に対する解決策を何ら言及しておらず、上記要望に対して改善の余地が残されている。

本発明は、このような事情に鑑みて、情報発信の正確性および迅速性の向上を支援することを課題とする。

前記課題を解決するために、本発明は、
文書群の情報を運用する情報運用装置であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定部と、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析部と、
前記テキストデータの係り受け解析をする係り受け解析部と、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成部と、
前記作成されたグラフのクラスタリングを行うクラスタリング部と、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出部と、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算部と、を備え、
前記特定の文書群に含まれる第１の文書について、前記トピック割合計算部が計算したトピック割合と、前記特定の文書群に含まれる第２の文書について、前記トピック割合計算部が計算したトピック割合とを用いて、第１の文書と第２の文書との間の類似度を計算する類似度計算部、をさらに備える、
ことを特徴とする。
また、本発明は、
文書群の情報を運用する情報運用装置であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定部と、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析部と、
前記テキストデータの係り受け解析をする係り受け解析部と、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成部と、
前記作成されたグラフのクラスタリングを行うクラスタリング部と、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出部と、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算部と、を備え、
前記特定の文書群は、特定のインシデント群であり、
前記特定のインシデント群に関するインシデント傾向を通知する要求があった場合、前記特定のインシデント群に含まれる各インシデントについて、前記トピック割合計算部が計算したトピック割合を用いたインシデント傾向結果を応答するインシデント分析部、をさらに備える、
ことを特徴とする。

また、本発明は、
文書群の情報を運用する情報運用装置が実行する情報運用方法であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定ステップと、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析ステップと、
前記テキストデータの係り受け解析をする係り受け解析ステップと、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成ステップと、
前記作成されたグラフのクラスタリングを行うクラスタリングステップと、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出ステップと、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算ステップと、を実行し、
前記特定の文書群に含まれる第１の文書について、前記トピック割合計算ステップで計算したトピック割合と、前記特定の文書群に含まれる第２の文書について、前記トピック割合計算ステップで計算したトピック割合とを用いて、第１の文書と第２の文書との間の類似度を計算する類似度計算ステップ、をさらに実行する、
ことを特徴とする。
また、本発明は、
文書群の情報を運用する情報運用装置が実行する情報運用方法であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定ステップと、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析ステップと、
前記テキストデータの係り受け解析をする係り受け解析ステップと、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成ステップと、
前記作成されたグラフのクラスタリングを行うクラスタリングステップと、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出ステップと、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算ステップと、を実行し、
前記特定の文書群は、特定のインシデント群であり、
前記特定のインシデント群に関するインシデント傾向を通知する要求があった場合、前記特定のインシデント群に含まれる各インシデントについて、前記トピック割合計算ステップで計算したトピック割合を用いたインシデント傾向結果を応答するインシデント分析ステップ、をさらに備える、
ことを特徴とする。
その他の発明については、後記する。

本発明によれば、情報発信の正確性および迅速性の向上を支援することができる。

本実施形態の情報運用装置の機能構成図である。インシデント対応履歴ＤＢのデータ構造図である。ナレッジＤＢのデータ構造図である。テキストマイニング部の機能構成図である。テキストマイニング処理を示すフローチャートである。トピック割合計算処理を示すフローチャートである。類似度計算処理を示すフローチャートである。原因・対策推定処理を示すフローチャートである。類似度計算結果の例の説明図である。新規ナレッジ作成支援処理を示すフローチャートである。グループ化処理を示すフローチャートである。既存ナレッジ統廃合支援処理を示すフローチャートである。既存ナレッジ見直し支援処理を示すフローチャートである。インシデント傾向把握支援処理を示すフローチャートである。インシデント傾向結果の画面例である。インシデント傾向結果を数値化した表の例である。

続いて、本発明の実施形態について、図面を参照して説明する。本実施形態の情報運用装置は、入力部、出力部、制御部、および記憶部といったハードウェアを含むコンピュータである。例えば、制御部がＣＰＵ（Central Processing Unit）から構成される場合、その制御部を含むコンピュータによる情報処理は、ＣＰＵによるプログラム実行処理で実現される。また、そのコンピュータが含む記憶部は、ＣＰＵの指令により、そのコンピュータの機能を実現するためのさまざまなプログラムを記憶する。これによりソフトウェアとハードウェアの協働が実現される。前記プログラムは、記録媒体に記録したり、ネットワークを経由したりすることで提供することができる。

情報運用装置は、利用者に提供する情報を運用する装置である。情報運用装置が扱う情報は、テキストデータを含む文書であり、情報運用装置は、文書の集合となる文書群を管理する。文書は、例えば、ヘルプデスクやサービスデスクなどの業務を行うためのインシデント管理用の文書とすることができるが、これに限定されない。本実施形態では、文書は、１または複数の項目ごとにテキストデータが入力された構造をとる。例えば、システム障害などの問合せに対する文書は、タイトル、事象、原因、対策の項目ごとにテキストデータが入力された文書となる。なお、文書の項目は、タイトル、事象、原因、対策に限られない。また、本実施形態が対象とする文書は、項目を有しない文書であってもよい。
また、本実施形態では、テキストデータは、日本語の文字列であるとするが、これに限定されず、他の言語の文字列であってもよい。

本実施形態で扱う文書は、インシデントとしてテキスト入力される文書、および、ナレッジとしてテキスト入力される文書に分類することができる。インシデントとは、利用者の問合せ（質問・要望・依頼）や、システムの稼働状況を監視する装置からのアラート情報等に対し、問合せの内容（事象）と、事象の原因と、原因を解消するための対策とを纏めたものである。インシデントは、問合せを受けたオペレータが運用現場で即座に調査して、運用側で作成される文書である。ナレッジは、運用側で蓄積している情報を体系的に整理した文書であって、具体的には、ＦＡＱ（Frequently Asked Questions）である。問合せを受けたオペレータは、過去に作成されたインシデント、またはナレッジを抽出して応答することができる。本実施形態では、インシデントもナレッジも、タイトル、事象、原因、対策の項目ごとにテキストデータが入力された文書とする。

≪構成≫
図１に示すように、情報運用装置１００は、要求取得部１と、検索範囲指定部２と、テキストマイニング部３と、トピック割合計算部４と、類似度計算部５と、原因・対策推定部６と、ナレッジ修正支援部７と、インシデント分析部８と、応答出力部９と、インシデント対応履歴ＤＢ１１と、ナレッジＤＢ１２と、を備える。

（インシデント対応履歴ＤＢ１１）
インシデント対応履歴ＤＢ１１は、運用側で作成されたインシデントに所定の管理情報を付加した情報をインシデント対応履歴として記憶するデータベースである。図２に示すように、インシデント対応履歴ＤＢ１１は、「カテゴリ」、「管理番号」、「類似度（タイトル・事象）」、「類似度（タイトル・事象・原因・対策）」、「タイトル」、「事象」、「原因」、「対策」、「ステータス」、「記録者」、「受付日時」、「原因分類」といった欄を有し、インシデントごとにエントリを作成して、管理する。

「カテゴリ」欄には、文書の分類を示す値が格納される。インシデント対応履歴ＤＢ１１に記憶される文書はインシデントであるため、エントリのカテゴリは、「インシデント」となる。

「管理番号」欄には、管理対象となるインシデントの識別子を示す値が格納される。識別子は、例えば、「INCxxxxxxxx」とすることができるが、これに限定されない。「INC」は、インシデントを象徴する。「xxxxxxxx」は、任意の数値列や文字列である。

「類似度（タイトル・事象）」欄には、類似度計算部５が計算した類似度として、問合せのテキストデータ（「問合せデータ」と呼ぶ場合がある）と、管理対象となるインシデントのうち、タイトルおよび事象のテキストデータを合わせたものと、の間の類似度が格納される。この類似度に関する説明の詳細は、後記する。

「類似度（タイトル・事象・原因・対策）」欄には、類似度計算部５が計算した類似度として、問合せデータと、管理対象となるインシデントのうち、タイトル、事象、原因および対策のテキストデータを合わせたものと、の間の類似度が格納される。この類似度に関する説明の詳細は、後記する。

「タイトル」欄には、管理対象となるインシデントのタイトルを示すテキストデータが格納される。
「事象」欄には、管理対象となるインシデントの事象を示すテキストデータが格納される。
「原因」欄には、管理対象となるインシデントの原因を示すテキストデータが格納される。
「対策」欄には、管理対象となるインシデントの対策を示すテキストデータが格納される。

「ステータス」欄には、管理対象となるインシデントの対応の進捗を示す値が格納される。例えば、利用者からの問合せに対し、対策を通知する応答を完了したことを示す「クローズ」という値が格納される。

「記録者」欄には、管理対象となるインシデントをインシデント対応履歴ＤＢ１１に記録した者の氏名が格納される。
「受付日時」欄には、管理対象となるインシデントに係る問合せをオペレータが受け付けた日時を示す値が格納される。
「原因分類」欄には、管理対象となるインシデントの原因を分類するための語（例：機能仕様、操作手順誤り）が格納される。

（ナレッジＤＢ１２）
図１に戻って、ナレッジＤＢ１２は、運用側で作成されたナレッジに所定の管理情報を付加した情報を記憶するデータベースである。図３に示すように、ナレッジＤＢ１２は、「カテゴリ」、「管理番号」、「タイトル」、「事象」、「原因」、「対策」、「作成日時」、「原因分類」といった欄を有し、ナレッジごとにエントリを作成して、管理する。

「カテゴリ」欄は、文書の分類を示す値が格納される。ナレッジＤＢ１２に記憶される文書はナレッジであるため、エントリのカテゴリは、「ナレッジ」となる。

「管理番号」欄には、管理対象となるインシデントの識別子を示す値が格納される。識別子は、例えば、「KLGxxxxxxxx」とすることができるが、これに限定されない。「KLG」は、ナレッジを象徴する。「xxxxxxxx」は、任意の数値列や文字列である。

「タイトル」欄には、管理対象となるナレッジのタイトルを示すテキストデータが格納される。
「事象」欄には、管理対象となるナレッジの事象を示すテキストデータが格納される。
「原因」欄には、管理対象となるナレッジの原因を示すテキストデータが格納される。
「対策」欄には、管理対象となるナレッジの対策を示すテキストデータが格納される。

「作成日時」欄には、管理対象となるナレッジが作成された日時を示す値が格納される。
「原因分類」欄には、管理対象となるナレッジの原因を分類するための語が格納される。

（要求取得部１）
図１に戻って、要求取得部１は、利用者からの要求を取得する。利用者は、例えば、システム障害等の問合せをするユーザ（または問合せを受けたオペレータ）、インシデントおよびナレッジを管理する管理者、インシデントを用いた分析を行う分析者に分類することができるが、これらに限定されない。よって、利用者からの要求の種類は様々である。また、要求取得部１が取得する要求には、システム稼働状況を監視する装置からのアラート情報等が含まれていてもよい。

（検索範囲指定部２）
検索範囲指定部２は、情報運用装置１００が扱う文書群のうち特定の文書群を検索範囲として指定する。情報運用装置１００が扱う文書群とは、具体的には、インシデント対応履歴ＤＢ１１に登録されたインシデント、および、ナレッジＤＢ１２に登録されたナレッジである。特定の文書群は、情報運用装置１００が扱う文書群の全体または部分文書群である。特定の文書群は、例えば、インシデント対応履歴ＤＢ１１に登録されているすべてのインシデントでもよいし、直近１週間以内に作成されたインシデントのみでもよいし、任意に指定した１つのインシデントでもよいし、さまざま文書群とすることができる。

また、検索範囲指定部２が指定する検索範囲を、指定された特定の文書群のうち、当該特定の文書群に含まれる各文書の一部とすることができる。検索範囲とは、情報運用装置１００が各種処理を実行するために参照されるテキストデータの集合を意味する。よって、検索範囲指定部２は、特定の文書群に含まれる各文書の項目である、タイトル、事象、原因、対策の少なくともいずれかを対象とすることもでき、検索範囲を、指定された項目に含まれるテキストデータに限定することもできる。

検索範囲指定部２による検索範囲の指定は、例えば、情報運用装置１００のオペレータが行うがこれに限定されない。オペレータからの指定が無い場合、検索範囲指定部２はデフォルトの検索範囲を指定することができる。デフォルトの検索範囲とは、例えば、インシデント対応履歴ＤＢ１１に登録されたすべてインシデント、および、ナレッジＤＢ１２に登録されたすべてのナレッジとすることができるが、これに限定されない。

（テキストマイニング部３）
テキストマイニング部３は、文書群のテキストマイニングを行う。テキストマイニングの対象となる文書群は、検索範囲指定部２が指定した検索範囲となる特定の文書群である。図４に示すように、テキストマイニング部３は、読込部２１と、前処理部２２と、形態素解析部２３と、係り受け解析部２４と、グラフ作成部２５と、クラスタリング部２６と、抽出部２７と、設定部２８と、を備える。

読込部２１は、文書群からテキストデータを読み込む。
前処理部２２は、テキストデータの前処理を行う。テキストデータの前処理とは、形態素解析で正しい結果を得るための予備処理である。例えば、同じ意味となる語の全角文字と半角文字が存在する場合にいずれか一方に統一すること、長音記号「ー」とマイナス記号「－」のような、字形が類似することに起因する誤用に対して正しい記号に修正すること、などがある。
なお、テキストデータの前処理は、必須ではない。

形態素解析部２３は、テキストデータの形態素解析を行う。本実施形態の形態素解析は、既存の形態素解析、および、既存の形態素辞書を用いる。形態素解析によって、形態素群および各形態素の品詞が特定される。

係り受け解析部２４は、テキストデータの係り受け解析を行う。本実施形態の係り受け解析は、既存の係り受け解析を用いる。係り受け解析部２４によって、テキストデータの係り受け構造、つまり、どの形態素が「係り」に該当し、どの形態素が「受け」に該当するかを特定することができる。

グラフ作成部２５は、係り受け解析部２４が特定した係り受け構造に基づくグラフを作成する。本実施形態では、グラフの作成には既存の技術を用いる。グラフは、単語単位のノードと、ノード同士を結ぶエッジとから構成される。グラフ作成部２５は、文書ごとにグラフを作成することができる。また、グラフ作成部２５は、文書ごとに作成された複数のグラフをマージすることで、複数の文書に対応する１つのグラフを作成することができる。
クラスタリング部２６は、グラフ作成部２５が作成したグラフのクラスタリングを行う。クラスタリング部２６は、複数の文書に対応する１つのグラフのクラスタリングを行うことができる。その結果、１または複数のクラスタが生成される。クラスタリングによって、グラフ上の各ノードの配置は、例えば、ばねモデルに従うようにすることができる。

抽出部２７は、クラスタリング部２６によって生成された各クラスタから、１または複数の特徴語を抽出する。各クラスタから抽出された特徴語は、例えば、各クラスタ内で出現回数（ＴＦ：Term Frequency）が高い語（予め設定した閾値以上に出現する語）である。しかし、特徴語の抽出条件は、クラスタ内での出現回数を用いた条件とする必要はなく、他のパラメータを用いた条件としてもよい。

設定部２８は、クラスタリング部２６によって生成された各クラスタを象徴するトピックを設定する。クラスタごとのトピックは、例えば、各クラスタに含まれる語から推測することができる。また、トピックは、情報運用装置１００の運用者が設定することができる。なお、設定部２８によるトピックの設定は、形式的なものであって、実質的には、クラスタリング部２６によってクラスタが生成された時点で、当該クラスタに対応するトピックが存在しているといえる。生成されたクラスタに対して、設定部２８がトピックを設定しなければ、トピックが存在しないというわけではない。

（テキストマイニング処理）
ここで、テキストマイニング部３が実行するテキストマイニング処理について、図５を参照して説明する。説明の際、図４も適宜参照する。テキストマイニング部３は、テキストマイニング処理の対象となる文書群を予め記憶している。

まず、テキストマイニング部３は、読込部２１によって、文書群からテキストデータを読み込む（ステップＳ１）。タイトル、事象、原因、対策を含む、インシデントまたはナレッジであれば、読込部２１は、タイトル、事象、原因、対策すべてのテキストデータを読み込むことができる。

次に、テキストマイニング部３は、前処理部２２によって、読み込まれたテキストデータの前処理を行う（ステップＳ２）。次に、テキストマイニング部３は、形態素解析部２３および係り受け解析部２４によって、テキストデータの形態素解析および係り受け解析を行う（ステップＳ３）。

次に、テキストマイニング部３は、グラフ作成部２５によって、係り受け解析によって特定された係り受け構造に基づくグラフを文書ごとに作成する（ステップＳ４）。また、テキストマイニング部３は、グラフ作成部２５によって、文書ごとに作成したグラフをマージし、複数の文書に対応する１つのグラフを作成する。

次に、テキストマイニング部３は、クラスタリング部２６によって、マージしたグラフのクラスタリングを行う（ステップＳ５）。その結果、マージしたグラフに関する１または複数のクラスタが生成される。次に、テキストマイニング部３は、抽出部２７によって、生成された各クラスタから、１または複数の特徴語を抽出する（ステップＳ６）。

最後に、テキストマイニング部３は、設定部２８によって、生成された各クラスタに対してトピックを設定する（ステップＳ７）。
テキストマイニング部３は、図５のテキストマイニング処理による結果を、既存のビジュアライズ技術によって、例えば、グラフ構造に従って配置された、文書群中の語の集合の画面表示として出力することができる。

検索範囲指定部２が指定した検索範囲が、インシデント対応履歴ＤＢ１１に登録されているすべてのインシデント、および、ナレッジＤＢ１２に登録されているすべてのナレッジからなる文書群であった場合、テキストマイニング部３は、インシデント対応履歴ＤＢ１１に登録されているすべてのインシデント、および、ナレッジＤＢ１２に登録されているすべてのナレッジからなる文書群に対してテキストマイニング処理を行うことができる。

まず、テキストマイニング部３は、読込部２１によって、すべてのインシデントのテキストデータ（「タイトル」、「事象」、「原因」、「対策」の欄（図２参照）に格納されたデータ）、および、すべてのナレッジのテキストデータ（「タイトル」、「事象」、「原因」、「対策」の欄（図３参照）に格納されたデータ）を読み込む（図５のステップＳ１に対応）。次に、テキストマイニング部３は、前処理部２２によって、読み込んだテキストデータの前処理を行う（図５のステップＳ２に対応）。

次に、テキストマイニング部３は、形態素解析部２３および係り受け解析部２４によって、すべてのインシデントおよびすべてのナレッジを対象にして、テキストデータの形態素解析および係り受け解析を行う（図５のステップＳ３に対応）。形態素解析によって、すべてのインシデントおよびすべてのナレッジを対象にした、形態素群および各形態素の品詞が特定される。

例えば、“何が（〈属性〉）どうなのか（〈評価〉）”を知りたい場合、係り受け解析部２４は、名詞および形容詞の形態素を選択する。係り受け解析によって、選択された名詞および形容詞の各々が、「係り」または「受け」のいずれに該当するかが判定され、係り受け構造が特定される。

ところで、例えば、形容詞“広い”は、“部屋”や“風呂”など空間・場所を示す名詞を修飾する。このように、語の係り受け関係には意味的な制限があることが知られており、このような制限は「共起制限」と呼ばれる。係り受け解析部２４が特定する係り受け構造には、共起制限が強く反映される。

次に、テキストマイニング部３は、グラフ作成部２５によって、すべてのインシデントおよびすべてのナレッジのそれぞれについて、係り受け構造に基づくグラフを作成する（図５のステップＳ４に対応）。グラフ作成部２５は、選択された語（名詞および形容詞）の原型をノード（単語ノード）とし、係り受け関係をエッジとする。係り受け関係が成立している語のノード同士がエッジによって連結されている。

また、すべてのインシデントおよびすべてのナレッジについて、係り受け関係に参加しない端点ノードと、端点ノードと連結するエッジとを便宜上用意する。端点ノードは、例えば、各インシデントおよび各ナレッジの管理番号（図２、図３参照）と示すことができる。グラフ作成部２５は、端点ノードが同じ文書内のいずれかのノードに連結したグラフを作成する。

また、グラフ作成部２５は、選択された語（名詞および形容詞）の出現回数（ＴＦ値）を、単語ノードのアトリビュートとして設定する。なお、形容詞については、原型が同じであるが活用が異なる語同士（例：「広く」と「広けれ」）は、同じ形容詞（例：「広い」）が出現したとして扱い、原型の形容詞（例：「広い」）のＴＦ値として積算する。

また、グラフ作成部２５は、ある２単語間の係り受け関係が出現した回数を、その２単語ノード間のエッジの重み（weight）として設定する。

また、グラフ作成部２５は、インシデントごと、かつ、ナレッジごとに作成したグラフをマージする。マージするグラフ間で、同一の単語ノード、および、同一のエッジが存在する場合、それらのノードおよびエッジは共有されるとともに、ＴＦ値および重みは加算される。このように、各ノードにＴＦ値、および各エッジに重みが設定された、マージ後の１つのグラフが作成される。

次に、テキストマイニング部３は、は、クラスタリング部２６によって、すべてのインシデントおよびすべてのナレッジを対象にして、マージしたグラフのクラスタリングを行う（図５のステップＳ５に対応）。このクラスタリングは、エッジの重みを考慮したクラスタリングとなる。クラスタリングによって、１または複数のクラスタが生成される。クラスタリングの結果として、マージしたグラフ中の各ノードは、生成されたクラスタのいずれかに属する。

次に、テキストマイニング部３は、抽出部２７によって、生成されたクラスタの各々から、１または複数の特徴語を抽出する（図５のステップＳ６に対応）。具体的には、ＴＦ値が所定値以上に大きな値となるノードの語を特徴語として抽出する。

次に、テキストマイニング部３は、設定部２８によって、生成されたクラスタに対してトピックを設定する（図５のステップＳ７に対応）。例えば、設定部２８は、クラスタの各々について、上位２０個の特徴語から想定される話題となる語を定義することができる。しかし、上位２０個に限定する必要はなく、上位１９個以下から定義してもよいし、上位２１個以上から定義してもよいし、上位に該当しない同じクラスタ内の任意個数の特徴語から定義してもよい。

テキストマイニング部３のテキストマイニング処理によれば、同義語の関係にある複数種類の語（例：「値段」、「料金」、「価格」）は、同じクラスタに分類される傾向にある。また、テキストマイニング部３のテキストマイニング処理によれば、表記揺れの関係にある複数種類の語は、同じクラスタに分類されるといえる（例：「アメニティ」と「アメニティー」の関係、「ない」と「無い」といった漢字表記とひらがな表記の関係）。

上記の各種分類が可能になるのは、クラスタリングの対象となる文書群のグラフが、係り受け構造、具体的には、共起制限に基づいて作成されたことに起因する。本実施形態によれば、クラスタリングによって生成されたクラスタから、同義語、類義語、表記揺れの関係にある複数種類の語を容易に特定することができ、同義語、類義語、表記揺れを定義する役割を果たすシソーラスを不要とすることができる（クラスタ自身が実質的にシソーラスを構築している）。
したがって、本実施形態によれば、シソーラスを用いない高精度なテキストマイニング（シソーラスを用いた従来のテキストマイニングと同程度の精度のテキストマイニング）を実現することができる。

また、従来のテキストマイニングは、“何が（〈属性〉）どうなのか（〈評価〉）”を知るために、〈評価対象〉を定義する必要があった。換言すれば、〈評価対象〉を定義しなければ、〈属性〉を決定しても〈評価〉を抽出することができず、テキストマイニングを実現することができなかった。しかし、従来における〈評価対象〉の定義は、主にテキストマイニングを行うユーザが手動で行うものであったため、〈評価対象〉の定義漏れを確実に回避することはできなかった。このため、テキストマイニングの精度の低下を招くおそれがあった。

本実施形態によれば、設定部２８が設定するトピックが、〈評価対象〉の役割を果たす。クラスタリング部２６は、テキストマイニングの対象となる文書群に対してクラスタを漏れなく生成することができる。よって、設定部２８によって、生成されたクラスタごとにトピックを漏れなく設定することができ、〈評価対象〉の定義漏れを確実に回避することができる。換言すれば、クラスタリング部２６は、新たな〈評価対象〉を発見するためのきっかけを提供することができる。
したがって、本実施形態によれば、〈評価対象〉の定義漏れに起因するテキストマイニングの精度の低下を防ぐことができる。

（トピック割合計算部４）
図１に戻って、トピック割合計算部４は、テキストマイニング処理がなされた特定の文書群に含まれる文書ごとのトピック割合を計算する。特定の文書群に含まれる各文書には、１または複数の特徴語が出現し、各特徴語は、テキストマイニング処理において生成された１または複数種類のクラスタの何れかに属している。また、生成されたクラスタの各々に対して所定のトピックが（設定部２８によって設定されていなくても）対応付けられている。つまり、特定の文書群に含まれる各文書は、１または複数種類のトピックを含んでいる。

対象文書におけるトピック割合は、対象文書に含まれるトピックごとに計算することができる。対象文書における対象トピックのトピック割合は、以下の計算式で計算される。
・対象文書における対象トピックのトピック割合＝（対象トピックに対応するクラスタに属する特徴語の数）／（対象文書に出現する特徴語の総数）
対象文書における対象トピックのトピック割合を、対象文書に含まれるすべてのトピックについて計算し、足し合わせれば１となる。

トピック割合計算部４は、テキストマイニング処理がなされた特定の文書群のうち一部を対象とした対象部分文書群におけるトピック割合を計算することもできる。具体的には、対象部分文書群における対象トピックのトピック割合は、対象部分文書群に含まれる各文書における対象トピックのトピック割合（テキストマイニング処理がなされた特定の文書群の文書ごとのトピック割合）を、対象部分文書群に含まれる文書に対して集計した値に等しい。

検索範囲指定部２が指定した検索範囲が、特定の文書群に含まれる各文書の一部であった場合にも、トピック割合計算部４によるトピック割合を計算することができる。例えば、タイトル、事象、原因、対策の４項目を有する文書について、検索範囲を、各文書のタイトルおよび事象の２項目とした場合、各文書のうち、タイトルおよび事象の２項目に記載されているテキストデータを対象としたテキストマイニング処理がなされた後、トピック割合計算部４によって、対象文書における対象トピックのトピック割合を計算することができる。

（類似度計算部５）
類似度計算部５は、特定の文書群に含まれる第１の文書について、トピック割合計算部４が計算したトピック割合と、特定の文書群に含まれる第２の文書について、トピック割合計算部５が計算したトピック割合とを用いて、第１の文書と第２の文書との間の類似度を計算する。類似度の計算方法は、例えば、コサイン類似度を用いることができるが、これに限定されない。コサイン類似度によって、第１の文書と第２の文書との間の類似度を計算する方法は以下の通りである。

すなわち、特定の文書群に対してｎ種類のトピックが存在する（ｎ個のクラスタが生成した）とした場合、第１の文書について、ｉ（＝１，２，・・・，ｎ）番目のトピックのトピック割合を、第１の文書に対して用意する第１のベクトルのｉ番目の成分の値とする。次に、第２の文書について、ｉ番目のトピックのトピック割合を、第２の文書に対して用意する第２のベクトルのｉ番目の成分の値とする。

最後に、第１のベクトルおよび第２のベクトルの内積を計算し、正規化した値を計算し、第１の文書と第２の文書との間の類似度とする。コサイン類似度の場合、類似度は、０～１の実数値（絶対値）をとり、１に近づくほど類似度が高くなる。

検索範囲指定部２が指定した検索範囲が、特定の文書群に含まれる各文書の一部であった場合にも、類似度計算部５による類似度を計算することができる。例えば、タイトル、事象、原因、対策の４項目を有する文書について、検索範囲を、各文書のタイトルおよび事象の２項目とした場合、第１の文書のタイトルおよび事象の２項目に記載されているテキストデータに対してトピック割合計算部４が計算したトピック割合と、第２の文書のタイトルおよび事象の２項目に記載されているテキストデータに対してトピック割合計算部４が計算したトピック割合と、を用いて、類似度計算部５が、第１の文書（のタイトルおよび事象のテキストデータ）と第２の文書（のタイトルおよび事象のテキストデータ）との間の類似度を計算することができる。

図２に示す類似度（タイトル・事象・原因・対策）は、問合せデータ、すべてのインシデント、および、すべてのナレッジを対象にして、テキストマイニング部３によるテキストマイニング処理（図５）を実行した場合において、類似度計算部５が、問合せデータに含まれるテキストデータと、各インシデントのタイトル、事象、原因、対策の４項目すべてに含まれるテキストデータとに対して計算した類似度である。
また、図２に示す類似度（タイトル・事象）は、上記と同様のテキストマイニング処理（図５）を実行した場合において、類似度計算部５が、問合せデータに含まれるテキストデータと、各インシデントのタイトルおよび事象の２項目に含まれるテキストデータとに対して計算した類似度である。

（原因・対策推定部６）
原因・対策推定部６は、情報運用装置１００の利用者が、システム障害等の問合せをするユーザであった場合、当該ユーザのユーザ端末からの要求、つまり問合せについて、インシデント対応履歴ＤＢ１１およびナレッジＤＢ１２を参照して、事象の原因、および、対策を推定する。原因・対策推定部６による処理の詳細は、後記する。

（ナレッジ修正支援部７）
ナレッジ修正支援部７は、情報運用装置１００の利用者が、インシデントおよびナレッジを管理する管理者であった場合、当該管理者の管理者端末からの要求に応じて、インシデント対応履歴ＤＢ１１およびナレッジＤＢ１２を参照して、ナレッジＤＢ１２のナレッジの修正を支援する。ナレッジ修正支援部７は、インシデント対応履歴ＤＢ１１のインシデントの各々、および、ナレッジＤＢ１２のナレッジの各々の間で、類似度計算部５による類似度を計算し、計算した類似度を用いて、修正対象となるナレッジの候補を決定する。ナレッジ修正支援部７による処理の詳細は、後記する。

（インシデント分析部８）
インシデント分析部８は、情報運用装置１００の利用者が、インシデントを用いた分析を行う分析者であった場合、当該分析者の分析者端末からの要求に応じて、インシデント対応履歴ＤＢ１１を参照して、インシデントの分析を支援する。インシデント分析部８は、トピック割合計算部４が計算したトピック割合を用いた画面情報を含むインシデント傾向結果を応答することができる。インシデント分析部８による処理の詳細は、後記する。

（応答出力部９）
応答出力部９は、トピック割合計算部４、類似度計算部５、原因・対策推定部６、ナレッジ修正支援部７、および、インシデント分析部８による処理結果を出力し、利用者に応答する。

≪処理≫
本実施形態の情報運用装置１００が実行する具体的な処理について説明する。情報運用装置１００が実行する具体的な処理には、トピック割合計算処理、類似度計算処理、原因・対策推定処理、新規ナレッジ作成支援処理、グループ化処理、既存ナレッジ統廃合支援処理、既存ナレッジ見直し支援処理、インシデント傾向把握支援処理があり、順次説明する。

［トピック割合計算処理］
トピック割合計算処理は、情報運用装置１００がトピック割合計算部４によって実行する処理である。以下、図６を参照して、トピック割合計算処理の詳細を説明する（適宜他図を参照）。トピック割合計算処理は、例えば、オペレータからトピック割合計算の要求があった場合に開始する。

図６に示すように、まず、トピック割合計算部４は、検索範囲指定部２によって、トピック割合計算処理の対象となる特定の文書群を検索範囲として指定する（ステップＴ１）。指定される検索範囲は、例えば、オペレータからのトピック割合計算の要求に含まれており、つまり、オペレータの発意で決定される。

次に、トピック割合計算部４は、テキストマイニング部３によって、指定された特定の文書群に対するテキストマイニング処理（図５参照）を実行する（ステップＴ２）。
最後に、トピック割合計算部４は、トピック割合計算部４によって、テキストマイニング処理がなされた特定の文書群について、文書ごとのトピック割合を計算する（ステップＴ３）。

本実施形態のトピック割合計算処理によれば、トピック割合を計算することで、特定の文書群の各文書がどのようなトピックで構成された文書であるかを定量的に評価することができ、文書の分類を詳細かつ容易にすることができる。

［類似度計算処理］
類似度計算処理は、情報運用装置１００が類似度計算部５によって実行する処理である。以下、図７を参照して、類似度計算処理の詳細を説明する（適宜他図を参照）。類似度計算処理は、例えば、オペレータから類似度計算の要求があった場合に開始する。当該要求には、検索範囲指定部２が指定した検索範囲となる特定の文書群のうち、類似度の計算対象となる第１の文書および第２の文書の識別情報が含まれている。

図６に示すように、まず、類似度計算部５は、第１の文書のトピック割合を取得する（ステップＵ１）。具体的には、類似度計算部５は、類似度計算の要求に含まれている識別情報から読み出した第１の文書に対して、トピック割合計算部４がトピック割合計算処理（図６）を実行して計算したトピック割合を取得する。

次に、類似度計算部５は、第２の文書のトピック割合を取得する（ステップＵ２）。具体的には、類似度計算部５は、類似度計算の要求に含まれている識別情報から読み出した第２の文書に対して、トピック割合計算部４がトピック割合計算処理（図６）を実行して計算したトピック割合を取得する。

最後に、類似度計算部５は、第１の文書のトピック割合と、第２の文書のトピック割合とを用いて、第１の文書と第２の文書との間の類似度を計算する（ステップＵ３）。

本実施形態の類似度計算処理によれば、第１の文書と第２の文書との間の類似度を計算することで、利用者の要求を満たすことができる文書が存在するか否かを、トピック割合の観点から定量的に判断することができ、存在する場合には、当該文書を即座に利用者に応答することができる。

［原因・対策推定処理］
原因・対策推定処理は、情報運用装置１００が原因・対策推定部６によって実行する処理である。以下、図８を参照して、原因・対策推定処理の詳細を説明する（適宜他図を参照）。原因・対策推定処理は、システム障害等の対策を知りたいユーザから問合せがあった場合に開始する。

図８に示すように、まず、原因・対策推定部６は、要求取得部１によって、ユーザのユーザ端末からの問合せを受け付けた、オペレータのオペレータ端末が、ユーザの問合せを示す問合せデータを入力する（ステップＡ１）。問合せデータはテキストデータであり、例えば、「新規に参画した人がメールやＯＳの初期設定をしているのですが、設定がうまくいきません」というテキストデータであったとする。なお、問合せデータは、情報運用装置１００の記憶部に記憶される。また、問合せデータのタイムスタンプとして、問合せデータを受け付けた日時（例：2018/08/07）も関連付けて記憶部に記憶される。

次に、原因・対策推定部６は、テキストマイニング部３によって、問合せデータのグラフ（以下、「グラフ（問合せデータ）」を称する場合がある）を作成する（ステップＡ２）。具体的には、問合せデータに対し、前処理部２２（図４）による前処理、形態素解析部２３（図４）および係り受け解析部２４（図４）による解析を経て、グラフ作成部２５（図４）が、グラフ（問合せデータ）を作成する。

次に、原因・対策推定部６は、検索範囲指定部２によって、特定の文書群となる検索範囲を指定する（ステップＡ３）。検索範囲を指定は、例えば、オペレータのオペレータ端末から、オペレータの発意で行うことができる。なお、検索範囲の指定において、特定の文書群の各文書の一部を指定することもできる。
次に、原因・対策推定部６は、テキストマイニング部３によって、検索範囲のグラフ（以下、「グラフ（検索範囲）」を称する場合がある）を作成する（ステップＡ４）。具体的には、検索範囲に対し、前処理部２２（図４）による前処理、形態素解析部２３（図４）および係り受け解析部２４（図４）による解析を経て、グラフ作成部２５（図４）が、グラフ（検索範囲）を作成する。

次に、原因・対策推定部６は、テキストマイニング部３のグラフ作成部２５によって、グラフ（問合せデータ）とグラフ（検索範囲）とをマージする（ステップＡ５）。
次に、原因・対策推定部６は、テキストマイニング部３のクラスタリング部２６によって、マージしたグラフのクラスタリングを行う（ステップＡ６）。その結果、マージしたグラフに関する１または複数のクラスタが生成される。

次に、原因・対策推定部６は、テキストマイニング部３の抽出部２７によって、生成された各クラスタから、１または複数の特徴語を抽出する（ステップＡ７）。
次に、原因・対策推定部６は、トピック割合計算部４によって、抽出された特徴語を用いて、検索範囲となる特定の文書群において、文書ごとのトピック割合を計算する（ステップＡ８）。

次に、原因・対策推定部６は、類似度計算部５によって、問合せデータと、検索範囲となる特定の文書群の各文書との間の類似度を計算する（ステップＡ９）。なお、検索範囲の指定において、特定の文書群の各文書の一部を指定した場合、類似度計算部５は、問合せデータと、各文書のうち、指定した一部との間の類似度を計算する。

次に、原因・対策推定部６は、検索範囲となる特定の文書群のうち、類似度計算部５が計算した類似度が閾値以上となる文書を抽出する（ステップＡ１０）。コサイン類似度の場合、閾値として、０～１の任意の値を設定することができる。抽出された文書は、問合せデータに示す表現に類似する表現を含む文書であり、ユーザからの問合せで示される事象の原因および対策が記載されている可能性が高いといえる。

次に、原因・対策推定部６は、応答出力部９によって、抽出された文書を、オペレータのオペレータ端末に応答する（ステップＡ１１）。オペレータは、オペレータ端末を操作して、例えば、抽出された文書のすべてを、ユーザのユーザ端末に応答してもよいし、特に有用と判断した文書のみを応答してもよい。

最後に、原因・対策推定部６は、オペレータ端末によるユーザへの応答状況に応じて、インシデント対応履歴ＤＢ１１を更新する（ステップＡ１２）。具体的には、オペレータ端末が入力した問合せデータ（ステップＡ１）に対して、インシデント対応履歴ＤＢ１１（図２）のエントリを追加し、追加したエントリの各欄に、問合せデータに応じた事項を登録する。

例えば、インシデント対応履歴ＤＢ１１（図２）の「カテゴリ」欄には、「インシデント」が格納される。「管理番号」欄には、例えば、オペレータ端末が入力した問合せデータ（ステップＡ１）際に、自動付与された識別子（INCxxxxxxxx）が格納される。

「類似度（タイトル・事象）」欄には、類似度計算部５が、検索範囲となる特定の文書群の各文書のうち、タイトルおよび事象のテキストデータと、問合せデータとの間での類似度を計算した場合には、当該類似度が格納される。「類似度（タイトル・事象・原因・対策）」欄には、類似度計算部５が、検索範囲となる特定の文書群の各文書のうち、タイトル、事象、原因、対策のテキストデータと、問合せデータとの間での類似度を計算した場合には、当該類似度が格納される。

「タイトル」欄には、例えば、問合せの内容に応じて、オペレータが任意に決定した、タイトル用のテキストデータが格納される。「事象」欄には、問合せの内容そのものを示すテキストデータが格納される。

「原因」欄には、問合せデータに対して、原因・対策推定部６が抽出した文書の、原因の項目に記載されているテキストデータが格納される。「対策」欄には、原因・対策推定部６が抽出した文書の、対策の項目に記載されているテキストデータが格納される。

「ステータス」欄には、例えば、問合せをしたユーザへの応答が完了した場合には、クローズ値が格納される。「記録者」の欄には、例えば、ユーザからの問合せを受け付けたオペレータの氏名が格納される。「受付日時」の欄には、ユーザからの問合せをオペレータが受け付けた日時が格納される。「原因分類」の欄には、問合せの内容に応じて、オペレータが任意に決定した、原因分類用のテキストデータが格納される。

本実施形態の原因・対策推定処理によれば、係り受け構造に基づくテキストマイニングによって、ユーザからの問合せに類似する文書を抽出することができる。よって、ユーザからの問合せの原因、および、その原因の対策の推定を、正確に、かつ、迅速に行うことができる。

［新規ナレッジ作成支援処理］
新規ナレッジ作成支援処理は、情報運用装置１００がナレッジ修正支援部７によって実行する処理であり、蓄積されたインシデントを新規のナレッジとしてもよいか否かを判定することを目的とする処理である。以下、図９、図１０を参照して、新規ナレッジ作成支援処理の詳細を説明する（適宜他図を参照）。新規ナレッジ作成支援処理は、日々更新されるインシデントに対してナレッジを修正したいと考えている管理者からの要求があった場合に開始する。

なお、図９に示すように、説明の便宜上、新規ナレッジ作成支援処理を実行するために、検索範囲指定部２が検索範囲として指定した特定の文書群は、INC001～INC010の番号（管理番号）が付与された１０個のインシデント、および、KLG001～KLG010の番号（管理番号）が付与された１０個のナレッジであるとする。

また、トピック割合計算部４は、INC001～INC010のインシデント、および、KLG001～KLG010のナレッジからなる計２０個の文書群において、文書ごとのトピック割合を計算することができる。
また、類似度計算部５は、トピック割合計算部４が計算したトピック割合を用いて、INC001～INC010のインシデント、および、KLG001～KLG010のナレッジからなる計２０個の文書群のうち２文書の組のすべてに対して、類似度を計算することができる。図９に、類似度の計算結果のマトリクスを示す。この計算結果は、情報運用装置１００の記憶部に記憶される。

インシデントまたはナレッジの行と、インシデントまたはナレッジの列とが交差するセルに記載の数値（０～１の任意の実数値）は類似度を示す。例えば、INC004のインシデントと、KLG006のナレッジとの類似度は0.7である。
また、図９において、類似度に関する閾値は0.6とし、閾値以上となる類似度を示すセルには斜線の網掛けを図示している。

また、図９の右端部において、図９中上下に延びるセル群は、マトリクスの行に示すインシデントまたはナレッジと類似する、インシデント（INC）の件数、および、ナレッジ（KLG）の件数を示している（類似件数）。例えば、INC004の行に示すインシデントに関して、他のインシデントとの類似度はすべて閾値（0.6）以下となるため、類似件数は０となる。また、１０個のナレッジのうち、KLG003,KLG006の２つのナレッジとの類似度は閾値以上となるため、類似件数は２となる。

新規ナレッジ作成支援処理の説明であるが、図１０に示すように、まず、ナレッジ修正支援部７は、要求取得部１によって、管理者が操作する管理者端末からの要求を、新規ナレッジ作成支援要求として取得する（ステップＢ１）。
次に、ナレッジ修正支援部７は、検索範囲指定部２によって、新規ナレッジ作成支援要求から、特定の文書群としての検索範囲を指定する（ステップＢ２）。新規ナレッジ作成支援要求には、新規ナレッジ作成支援処理を実行するときの対象となる特定の文書群（INC001～INC010のインシデント、および、KLG001～KLG010のナレッジからなる計２０個の文書群）の識別情報が含まれており、当該識別情報から特定の文書群を処理対象とする。
次に、ナレッジ修正支援部７は、トピック割合計算部４および類似度計算部５によって、検索範囲となる特定の文書群に対する類似度計算結果（図９参照）を出力する（ステップＢ３）。

次に、ナレッジ修正支援部７は、すべてのナレッジとの類似度が閾値以下となるインシデントを新規ナレッジ候補と決定する（ステップＢ４）。図９に示すように、エリアＲ１に囲まれた類似度群は、マトリクスの行のインシデントと、マトリクスの列のナレッジとの間の類似度を示す。また、エリアＲ１１に囲まれた類似件数群は、マトリクスの行のインシデントごとの、当該インシデントと類似しているナレッジの件数を示す。

エリアＲ１１に注目すると、「すべてのナレッジとの類似度が閾値以下となるインシデント」には、エリアＲ１１内の類似件数が０となるINC001,INC002,INC003,INC005,INC006,INC007の６つのインシデントが該当する。該当の６つのインシデントは、ナレッジＤＢ１２に登録されているいずれのナレッジに示す事象とも異なり、過去に決定した原因とは異なる原因を有し、また、過去に決定した対策とは異なる対策で応答した、新しいパターンのインシデントであると考えられる。このような新しいパターンのインシデントは、新しい情報価値を提供し、ナレッジＤＢ１２に登録してもよいと考えられる新規ナレッジ候補とする。

次に、ナレッジ修正支援部７は、新規ナレッジ候補ごとにグループ化を実行する（ステップＢ５）。新規ナレッジ候補に対するグループ化は、図１１に示すグループ化処理によって、実現される。

＜グループ化処理＞
図１１に示すグループ化処理について詳細に説明する。グループ化処理は、文書群中の各文書を複数のグループでグループ分けし、各文書がいずれのグループに属するかを決定する処理である。グループ化処理は、ナレッジ修正支援部７が実行する。

まず、文書群の類似度マトリクステーブルを作成する（ステップＣ１）。類似度マトリクステーブルは、文書群の文書ごとの、他の文書との間の類似度をマトリクス化してまとめたテーブルであり、図９に示す類似度計算結果と同等である。なお、類似度は、例えば、コサイン類似度で求めた類似度とするが、これに限定されない。

次に、文書群の文書ごとに、他の文書との類似度が閾値以上となる他の文書の文書数をカウントする（ステップＣ２）。閾値は、０～１の間の任意の実数値として設定することができるが、これに限定されない。ステップＣ２でカウントする文書数は、図９の右端部に示す類似件数において、文書をインシデントおよびナレッジとして区別しない場合の類似件数と同じ意味である。

次に、カウントした他の文書の文書数が最大となる文書を選出する（ステップＣ３）。次に、選出した文書、および、選出した文書との類似度が閾値以上となる他の文書群とで第１グループを形成する（ステップＣ４）。

次に、文書群から、第１のグループを構成する文書を除いた文書群について、ステップＣ２～ステップＣ４を実行し、第２グループ、第３グループ、・・・を順次形成する（ステップＣ５）。ステップＣ４，Ｃ５によれば、第１グループが、最大規模のグループとなり、以下、グループの構成要素の数の降順に第２グループ、第３グループ、・・・が形成される。

最後に、すべての文書についてグループを形成したか否かを判定する（ステップＣ６）。形成した場合（ステップＣ６でＹｅｓ）、文書群中の各文書が、形成された第１グループ、第２グループ、・・・のいずれかのグループに属したことを意味し、グループ化処理を終了する。形成していない場合（ステップＣ６でＮｏ）、グループに属しない文書が存在することを意味しており、当該文書がいずれのグループに属するかが決まるまで、ステップＣ５，Ｃ６の処理を繰り返し、グループ化処理を終了する。

図１０に戻って、ステップＢ５のグループ化は、INC001～INC010の１０個のインシデント群に対して実行される。新規ナレッジ候補となる６つのインシデントINC001,INC002,INC003,INC005,INC006,INC007のうち、他のインシデントとの類似度が閾値（0.6）以上となる他のインシデントの数が最大となるインシデントは、INC001である（INC001との類似度が0.6以上となるインシデントが、INC002,INC006,INC008,INC010の４つであり、最大の類似件数を持つ（図９に示すエリアＲ１２参照）。）。よって、INC001（親）,INC002,INC006,INC008,INC010の５つのインシデントからなる第１グループを形成する（図１１のステップＣ４参照）。

また、新規ナレッジ候補となる６つのインシデントINC001,INC002,INC003,INC005,INC006,INC007から、第１グループを構成するINC001,INC002,INC006を除いたINC003,INC005,INC007のうち、他のインシデントとの類似度が閾値（0.6）以上となる他のインシデントの数が最大となるインシデントは、INC003である（図９に示すエリアＲ１２を参照すると、INC003と類似する他のインシデントの件数は２（INC007,INC009）であるのに対し、INC005と類似する他のインシデントの件数は０であり、INC007と類似する他のインシデントの件数は１である）。よって、INC003（親）,INC007,INC009の３つのインシデントからなる第２グループを形成する（図１１のステップＣ５参照）。

新規ナレッジ候補となる６つのインシデントINC001,INC002,INC003,INC005,INC006,INC007から、第１グループを構成するINC001,INC002,INC006を除き、かつ、第２グループを構成するINC003,INC007を除いたINC005については、INC005に類似するインシデントは存在しない（類似件数は０）。形式的に、INC005のみからなる第３のグループを形成することは可能であるが、INC005が示す事象は、極めて稀であり、ナレッジとして記録する必要性はそれほど高いとはいえないと考えるのが妥当である。よって、INC005のインシデントは、新規ナレッジ候補から外す。

ステップＢ５の後、ナレッジ修正支援部７は、グループ化した新規ナレッジの候補の一覧を、管理者端末に応答する（ステップＢ６）。図９の例に従えば、類似件数が最も多い第１グループ（INC001（親）,INC002,INC006,INC008,INC010）のインシデント群、および、類似件数が２番目に多い第２グループ（INC003（親）,INC007,INC009）のインシデント群を管理者に表示する。ステップＢ６の後、新規ナレッジ作成支援処理が終了する。

管理者は、第１グループ（INC001（親）,INC002,INC006,INC008,INC010）のインシデント群を精査して、これらのインシデントで示す事象に対する新規ナレッジを作成することができる。つまり、新規ナレッジのタイトル、事象、原因、対策をそれぞれ作成し、ナレッジＤＢ１２に新たなエントリとして追加することができる。よって、図１０の新規ナレッジ作成支援処理は、既存のナレッジ群に登録されていない事象が記録されたインシデント群を管理者に提示し、管理者による新規ナレッジの作成を支援することができる。

［既存ナレッジ統廃合支援処理］
既存ナレッジ統廃合支援処理は、情報運用装置１００がナレッジ修正支援部７によって実行する処理であり、ナレッジＤＢ１２に蓄積された既存のナレッジについて、いくつかを１つに統合したり、廃棄したりしてもよいか否かを判定することを目的とする処理である。以下、図９、図１２を参照して、既存ナレッジ統廃合支援処理の詳細を説明する（適宜他図を参照）。既存ナレッジ統廃合支援処理は、ナレッジの修正を考えている管理者からの要求があった場合に開始する。新規ナレッジ作成支援処理（図１０）と同様にして、既存ナレッジ統廃合支援処理を実行するために、検索範囲指定部２が検索範囲として指定した特定の文書群は、図９に示すものとする。

図１２に示すように、まず、ナレッジ修正支援部７は、要求取得部１によって、管理者が操作する管理者端末からの要求を、既存ナレッジ統廃合支援要求として取得する（ステップＤ１）。
次に、ナレッジ修正支援部７は、検索範囲指定部２によって、既存ナレッジ統廃合支援要求から、特定の文書群としての検索範囲を指定する（ステップＤ２）。既存ナレッジ統廃合支援要求には、既存ナレッジ統廃合支援処理を実行するときの対象となる特定の文書群（INC001～INC010のインシデント、および、KLG001～KLG010のナレッジからなる計２０個の文書群）の識別情報が含まれており、当該識別情報から特定の文書群を処理対象とする。
次に、ナレッジ修正支援部７は、トピック割合計算部４および類似度計算部５によって、検索範囲となる特定の文書群に対する類似度計算結果（図９参照）を出力する（ステップＤ３）。

次に、ナレッジ修正支援部７は、類似度が閾値以上となる他のナレッジの件数が閾値以上存在するナレッジを統廃合ナレッジ候補と決定する（ステップＤ４）。図９に示すように、エリアＲ２に囲まれた類似度群は、マトリクスの行のナレッジと、マトリクスの列のナレッジとの間の類似度を示す。また、エリアＲ２１に囲まれた類似件数群は、マトリクスの行のナレッジごとの、当該ナレッジと類似しているナレッジの件数を示す。

「類似度が閾値以上となる他のナレッジの件数」の閾値を４とした場合、エリアＲ２１に注目すると、KLG001のナレッジは、KLG002,KLG006,KLG008,KLG010の４つのナレッジと類似している。KLG001,KLG002,KLG006,KLG008,KLG010の５つのナレッジは、記載内容が重複していると考えられるため、１つのナレッジに統合したり、他の４つを廃棄してもあまり問題ないと考えられる統廃合ナレッジ候補とする。

次に、ナレッジ修正支援部７は、統廃合ナレッジ候補ごとにグループ化を実行する（ステップＤ５）。統廃合ナレッジ候補に対するグループ化は、既に説明した図１１に示すグループ化処理によって、実現され、詳細な説明は省略する。ステップＤ５のグループ化は、KLG001～KLG010の１０個のインシデント群に対して実行され、１または複数のグループが形成される。

最後に、グループ化した統廃合ナレッジ候補の一覧を、管理者端末に応答する（ステップＤ６）。図９の例に従えば、第１グループ（KLG001（親）,KLG002,KLG006,KLG008,KLG010）のナレッジ群を管理者に表示する。ステップＤ６の後、既存ナレッジ統廃合支援処理が終了する。

管理者は、第１グループ（KLG001（親）,KLG002,KLG006,KLG008,KLG010）のナレッジ群を精査して、これら５つのナレッジの統廃合を決定することができる。例えば、KLG001,KLG002,KLG006,KLG008,KLG010の５つのナレッジの記載内容を包含した１つのナレッジを作成し、ナレッジＤＢ１２に新たなエントリとして追加することができる。また、基本的には、KLG001,KLG002,KLG006,KLG008,KLG010の５つのナレッジの記載内容は概ね重複するため、４つのナレッジのエントリをナレッジＤＢ１２から削除してもよい。よって、図１２の既存ナレッジ統廃合支援処理は、記載内容が概ね重複する既存のナレッジ群を管理者に提示し、管理者による既存ナレッジ統廃合を支援することができる。

［既存ナレッジ見直し支援処理］
既存ナレッジ見直し支援処理は、情報運用装置１００がナレッジ修正支援部７によって実行する処理であり、蓄積されたインシデントから既存のナレッジを見直すべきか否かを判定することを目的とする処理である。以下、図９、図１３を参照して、既存ナレッジ見直し支援処理の詳細を説明する（適宜他図を参照）。既存ナレッジ見直し支援処理は、日々更新されるインシデントに対してナレッジを見直したいと考えている管理者からの要求があった場合に開始する。新規ナレッジ作成支援処理（図１０）と同様にして、既存ナレッジ見直し支援処理を実行するために、検索範囲指定部２が検索範囲として指定した特定の文書群は、図９に示すものとする。

図１３に示すように、まず、ナレッジ修正支援部７は、要求取得部１によって、管理者が操作する管理者端末からの要求を、既存ナレッジ見直し支援要求として取得する（ステップＥ１）。
次に、ナレッジ修正支援部７は、検索範囲指定部２によって、既存ナレッジ見直し支援要求から、特定の文書群としての検索範囲を指定する（ステップＥ２）。既存ナレッジ見直し支援要求には、既存ナレッジ見直し支援処理を実行するときの対象となる特定の文書群（INC001～INC010のインシデント、および、KLG001～KLG010のナレッジからなる計２０個の文書群）の識別情報が含まれており、当該識別情報から特定の文書群を処理対象とする。
次に、ナレッジ修正支援部７は、トピック割合計算部４および類似度計算部５によって、検索範囲となる特定の文書群に対する類似度計算結果（図９参照）を出力する（ステップＥ３）。

次に、ナレッジ修正支援部７は、類似度が閾値以上となるインシデントの件数が閾値以上存在するナレッジを見直しナレッジ候補と決定する（ステップＥ４）。図９に示すように、エリアＲ３に囲まれた類似度群は、マトリクスの行のナレッジと、マトリクスの列のインシデントとの間の類似度を示す。また、エリアＲ３１に囲まれた類似件数群は、マトリクスの行のナレッジごとの、当該ナレッジと類似しているインシデントの件数を示す。

「類似度が閾値以上となるインシデントの件数」の閾値を２とした場合、エリアＲ１１に注目すると、例えば、KLG003のナレッジは、INC004,INC008の２つのインシデントと類似している。INC004,INC008の２つのインシデントは、KLG003のナレッジが存在するにもかかわらず複数回作成されてしまったインシデントであって、KLG003のナレッジの必要性を乏しくさせるものと考えられる。この場合、KLG003のナレッジの改善を図り、KLG003のナレッジを見直しナレッジ候補とする。また、KLG006のナレッジは、INC004,INC009の２つのインシデントと類似しており、見直しナレッジ候補とする。

次に、ナレッジ修正支援部７は、見直しナレッジ候補ごとにグループ化を実行する（ステップＥ５）。見直しナレッジ候補に対するグループ化は、既に説明した図１１に示すグループ化処理によって、実現され、詳細な説明は省略する。ステップＥ５のグループ化は、KLG001～KLG010の１０個のインシデント群に対して実行され、１または複数のグループが形成される。結果として、見直しナレッジ候補となるKLG003のナレッジに対する第１グループ（KLG003（親）,INC004,INC008）、および、見直しナレッジ候補となるKLG006のナレッジに対する第２グループ（KLG006（親）,INC009）が形成される（INC004のインシデントは、KLG006のナレッジに類似するため第２グループに属することができるが、既に第１グループに属しているため、第２グループからは除外）。

最後に、グループ化した見直しナレッジ候補の一覧を、管理者端末に応答する（ステップＥ６）。図９の例に従えば、第１グループ（KLG003（親）,INC004,INC008）および第２グループ（KLG006（親）,INC009）のナレッジ群を管理者に表示する。ステップＥ５の後、既存ナレッジ見直し支援処理が終了する。

管理者は、第１グループ（KLG003（親）,INC004,INC008）のナレッジおよびインシデントを精査して、KLG003のナレッジを見直すことができる。例えば、KLG003のナレッジの記載内容に、INC004,INC008のインシデントの記載内容を包含させることができる。また、インシデント対応履歴ＤＢ１１のINC004,INC008のエントリの「対策」欄に、KLG003のナレッジのリンクを追記することができる。第２グループ（KLG006（親）,INC009）についても同様である。よって、図１３の既存ナレッジ見直し支援処理は、作成されたインシデントに対して改善が必要と考えられるナレッジを管理者に提示し、管理者による既存ナレッジ見直しを支援することができる。

また、既存ナレッジ見直し支援処理によれば、１つのグループに属するインシデントは、ユーザからの問合せに対して抽出されるべき、同じグループに属するナレッジに対して、本来は不要に作成されたインシデントであるといえる。このため、既存ナレッジ見直し支援処理は、作成されたインシデントの見直しを支援する処理としても機能することができる。

［インシデント傾向把握支援処理］
インシデント傾向把握支援処理は、情報運用装置１００がインシデント分析部８によって実行する処理である。以下、図１４を参照して、インシデント傾向把握支援処理の詳細を説明する（適宜他図を参照）。インシデント傾向把握支援処理は、インシデント群を分析する分析者から要求があった場合に開始する。

図１４に示すように、まず、インシデント分析部８は、要求取得部１によって、分析者が操作する分析者端末からの要求を、インシデント傾向通知要求として取得する（ステップＦ１）。インシデント傾向通知要求には、分析対象となる文書群を指定する情報が含まれている。分析対象となる文書群は、インシデント対応履歴ＤＢ１１に登録されているすべてのインシデントとしてもよいし、一部のインシデントとしてもよい。また、インシデント傾向通知要求において、インシデント群の指定は、複数存在してもよい。

インシデント分析部８は、検索範囲指定部２によって、インシデント傾向通知要求から、分析対象となる文書群（インシデント群）としての検索範囲を指定する（ステップＦ２）。なお、検索範囲は、複数指定することができる。

次に、インシデント分析部８は、トピック割合計算部４によって、指定されたインシデント群のインシデントごとのトピック割合を計算し、トピック割合計算結果として出力する（ステップＦ３）。具体的には、指定されたインシデント群に対してトピック割合計算処理（図６）がなされ、分析対象のインシデントごとに、かつ、テキストマイニング処理によって生成されたクラスタに対応するトピックごとに、トピック割合が計算される。対象のインシデントに含まれるすべてのトピックについてトピック割合を計算し、足し合わせれば１となる。
なお、検索範囲が複数指定されていた場合、トピック割合計算部４は、指定された検索範囲ごとに、トピック割合計算結果を出力する。

また、トピック割合計算部４は、分析対象となるインシデント群全体に対する、対象トピックのトピック割合（以下、「トピック割合［全体］」と呼ぶ場合がある）を計算することができる。具体的には、分析対象となるインシデント群の各インシデントについて計算した、対象トピックのトピック割合を集計することで、対象トピックのトピック割合［全体］を計算することができ、トピック割合計算結果として出力される。

また、トピック割合計算部４は、分析対象となるインシデント群の一部に対する、対象トピックのトピック割合（以下、「トピック割合［一部］」と呼ぶ場合がある）を計算することができる。具体的には、分析対象となるインシデント群の一部の各インシデントについて計算した、対象トピックのトピック割合を集計することで、対象トピックのトピック割合［一部］を計算することができる。分析対象となるインシデント群の一部の選択は、例えば、情報運用装置１００が行うことができ、トピック割合計算結果として出力される。

例えば、分析対象となるインシデント群全体を、直近１年間に作成されたインシデント群とした場合、選択されるインシデント群を、直近１年間のうち最初の１ヶ月間に作成されたインシデント群とすることができる。トピック割合計算部４は、直近１年間に作成されたインシデント群のインシデントごとの、対象トピックのトピック割合を計算する。すると、トピック割合計算部４は、直近１年間に作成されたインシデント群の各インシデントについて計算した、対象トピックのトピック割合を集計することで、対象トピックのトピック割合［全体］を計算することができる。また、トピック割合計算部４は、直近１年間のうち最初の１ヶ月間に作成されたインシデント群の各インシデントについて計算した、対象トピックのトピック割合を集計することで、対象トピックのトピック割合［一部］を計算することができる。

次に、インシデント分析部８は、出力されたトピック割合計算結果を表示する画面情報を生成するための画面加工処理を行う（ステップＦ４）。画面情報には、インシデント傾向通知要求において指定されたインシデント群に出現する特徴語に関するさまざまな統計情報を含めることができる。
なお、トピック割合計算結果は、画面情報として表示することに限定されず、例えば、テキスト情報といった他の媒体による情報として表示することもできる。

最後に、インシデント分析部８は、応答出力部９によって、画面加工処理によって生成された画面情報をインシデント傾向結果として分析者端末に応答する（ステップＦ５）。ステップＦ５の後、インシデント傾向把握支援処理が終了する。

ステップＦ５で分析者端末に応答したインシデント傾向結果を、分析者端末の表示部で表示したときの画面例を図１５に示す。図１５の画面には、コンボボックス１３０１ａと、検索ワード入力欄１３０１ｂと、検索ボタン１３０１ｃと、事象タブ１３０２ａと、原因タブ１３０２ｂと、対策タブ１３０２ｃと、今年度ボタン１３０３ａと、前年度ボタン１３０３ｂと、トピック割合エリア１３０３と、インシデント発生件数エリア１３０４と、特徴語一覧エリア１３０５とが設けられている。ただし、画面の構成要素は、これらに限定されない。

コンボボックス１３０１ａは、インシデントの検索手段の選択肢を格納するＧＵＩ（Graphic User Interface）である。選択肢が「インシデント管理番号検索」である場合、インシデントの管理番号（図２参照）を入力して検索することにより、該当のインシデントのタイトル、事象、原因、対策のテキストデータを表示することができる。また、選択肢が「テキスト検索」である場合、所定のテキストを入力して検索することにより、入力したテキストを含むインシデント一覧を表示することができる。

検索ワード入力欄１３０１ｂは、コンボボックス１３０１ａに示す検索手段に対応する検索ワードを入力するためのＧＵＩである。検索ワードには、例えば、数値（例：管理番号）やテキスト（例：インシデントのテキスト）があるが、これらに限定されない。
検索ボタン１３０１ｃは、コンボボックス１３０１ａで選択された検索手段で、検索ワード入力欄１３０１ｂに入力された検索ワードで検索を開始するためのＧＵＩである。

事象タブ１３０２ａは、検索ボタン１３０１ｃの検索で該当するインシデントのうち、事象のテキストを表示するためのＧＵＩである。
原因タブ１３０２ｂは、検索ボタン１３０１ｃの検索で該当するインシデントのうち、原因のテキストを表示するためのＧＵＩである。
対策タブ１３０２ｃは、検索ボタン１３０１ｃの検索で該当するインシデントのうち、対策のテキストを表示するためのＧＵＩである。
なお、文書のタイトルのテキストを表示するためのタイトルタブがあってもよい。

今年度ボタン１３０３ａは、例えば、当年４月～当月の期間に受け付けたインシデント群（分析対象となるインシデント群全体）のインシデント傾向結果を表示するためのＧＵＩである。
前年度ボタン１３０３ｂは、例えば、前年４月～当年３月の期間に受け付けたインシデント群（分析対象となるインシデント群全体）のインシデント傾向結果を表示するためのＧＵＩである。
なお、任意の期間に受け付けたインシデント群のインシデント傾向結果を表示するためのＧＵＩを設けてもよい。

トピック割合エリア１３０３には、インシデント傾向通知要求によって指定されたインシデント群に対するトピック割合が表示される。例えば、４月始まりの年度単位で発生したインシデント群に対するトピック割合を円グラフ（年度累計）で表示することができる。つまり、１年間に受け付けた問合せに対するインシデント群に対して設定される複数のトピックを、トピック割合の大きい順に円グラフで表示する。１年間という期間は、例えば、今年度でもよいし、前年度でもよいし、他の年度でもよい。
なお、説明の便宜上、インシデントの発生日時は、インシデント対応履歴ＤＢ１１（図２）の「受付日時」と同じとする。

インシデント発生件数エリア１３０４には、インシデント傾向通知要求によって指定されたインシデント群に対応する問合せ（つまり、インシデント）の発生件数が表示される。例えば、４月始まりの年度単位で発生したインシデントの件数を、月別の縦棒グラフで表示することができる。図１５に示すように、縦棒グラフを月別に横方向に並べることで、インシデント発生件数の月別推移を表示することができる。

また、図１５に示すように、各月の縦棒グラフは、当該月に発生したインシデント群に対して設定されたトピックごとに区分された積み上げ縦棒グラフとすることができる。ここで、「当該月に発生したインシデント群」は、当該月を含む年度に発生したインシデント群を分析対象となるインシデント群（検索範囲）とした場合に、当該分析対象となるインシデント群から一部が選択されたインシデント群である。各月の積み上げ縦棒グラフは、例えば、「トピック割合計算部４によって当該月に発生したインシデント群に対して設定されたトピックごとに計算されたトピック割合と、当該月のインシデント発生件数との積」が大きい順に、上から配置されるように表示することができる。このような表示により、発生したインシデントを特徴づけるトピックを、画面を閲覧する分析者に強く印象付けることができる。

特徴語一覧エリア１３０５には、インシデント傾向通知要求によって指定されたインシデント群に対して設定されるトピックごとに、当該トピックに属する特徴語の一覧が表示される。図１５に示すように、特徴語一覧エリア１３０５には、設定されたトピックの識別子となるトピックＩＤ（T001,T002,T003,・・・）と、当該トピックに対応するクラスタを構成するノードで示される特徴語（図１５では、「word-word」と略記）とが、対応付けが確認できるように表示されている。なお、トピックＩＤの各々には、ハイパーリンクが張られており、ハイパーリンクが張られたトピックＩＤをクリックすると、該当のトピックのクラスタを表示した画面（図示略）に遷移することができる。

インシデント分析部８によって、図１６に示すインシデント傾向結果が得られた場合について説明する。図１６には、2016/4/3～2016/4/9の１週間（該当週（の終了日）：2016/4/9）に発生したインシデント群から得られる複数のトピックに関する情報リストＬ１と、2016/4/10～2016/4/16の１週間（該当週（の終了日）：2016/4/16）に発生したインシデント群から得られる複数のトピックに関する情報リストＬ２と、2016/4/17～2016/4/23の１週間（該当週（の終了日）：2016/4/23）に発生したインシデント群から得られる複数のトピックに関する情報リストＬ３と、を合わせたインシデント傾向結果を示す。図１６の表は、「トピックＩＤ」欄、「トピック割合」欄、「トピック割合×インシデント発生件数」欄、「該当週」欄、「特徴語」欄を有し、トピックごと、かつ、該当週ごとにリストが作成される。

「トピックＩＤ」欄には、該当週に発生したインシデント群に対して設定されたトピックの識別子が格納される。
「トピック割合」欄には、該当週に発生したインシデント群に対してトピック割合計算部４が計算したトピック割合の値が格納される。「トピック割合」欄に格納されたトピック割合は、対象のインシデント群の各インシデントごとにピック割合計算部４が計算したトピック割合の平均値を示す。
「トピック割合×インシデント発生件数」欄には、トピック割合と、該当週に発生したインシデントの発生件数との積の値が格納される。
「特徴語」欄には、該当週に発生したインシデント群に対して設定されたトピックに属する特徴語が格納される。

情報リストＬ１に注目すると、情報リストＬ１の各トピック（T001,T003,T005,T006,T007,T009,T011,T012,T014）のトピック割合が、トピック割合エリア１３０３（図１５）に円グラフで表示される。このとき、情報リストＬ１内で最大のトピック割合を有するT005のトピック（トピック割合：0.41379）が、円グラフの時計回りに最初に表示される。なお、情報リストＬ１の各トピック割合の合計は１である。

また、情報リストＬ１に示す、2016/4/3～2016/4/9の１週間に発生したインシデントの発生件数は２である。よって、情報リストＬ１の各トピックの「トピック割合×インシデント発生件数」は、「トピック割合」の２倍になる。よって、インシデント発生件数エリア１３０４（図１５）には、2016/4/3～2016/4/9の１週間に発生したインシデントを一部として含むインシデント群全体に対するインシデント傾向結果における、「トピック割合×インシデント発生件数」の値に応じた、週別の積み上げ縦棒グラフが表示される。このとき、情報リストＬ１内で最大の「トピック割合×インシデント発生件数」を有するT005のトピック（トピック割合×インシデント発生件数：0.82759）が、積み上げ縦棒グラフの最上部に表示される。

また、情報リストＬ１に示す、トピックＩＤごとの特徴語が、特徴語一覧エリア１３０５（図１５）に一覧表示される。
上記の情報リストＬ１に関する、トピック割合エリア１３０３、インシデント発生件数エリア１３０４、特徴語一覧エリア１３０５の表示の説明は、情報リストＬ２，Ｌ３にもあてはまる。つまり、図１６に示すインシデント傾向結果の情報は、図１５に示す画面に一通り表示される。

したがって、図１４のインシデント傾向把握支援処理は、インシデント傾向結果を示す画面を分析者に提示することにより、分析者によるインシデント傾向の把握を支援することができる。

≪まとめ≫
本実施形態によれば、情報運用装置１００がトピック割合計算部４を備えることにより、特定の文書群の各文書がどのようなトピックで構成された文書であるかを定量的に評価することができ、文書の分類を詳細かつ容易にすることができる。つまり、トピック割合計算部４は、利用者からの要求に対し、正確な情報を迅速に応答するための手段となり得る。
したがって、情報発信の正確性および迅速性の向上を支援することができる。

また、情報運用装置１００が類似度計算部５を備えることにより、利用者の要求を満たすことができる文書が存在するか否かを、トピック割合の観点から定量的に判断することができ、存在する場合には、当該文書を即座に利用者に応答することができる。

また、情報運用装置１００が原因・対策推定部６を備えることにより、ユーザの問合せに対する、原因および対策を含む文書が存在するか否かを正確に判断することができ、存在する場合には、当該文書を即座にユーザに応答することができる。
このとき、検索範囲指定部２が、特定の文書群に含まれる各文書の一部を検索範囲として指定することで、原因および対策を含む文書が存在するか否かの判断に要する時間を短縮することができ、ユーザへの応答をより早くすることができる。

また、情報運用装置１００がナレッジ修正支援部７を備えることにより、管理者の要求に対して、情報運用装置１００が記憶する文書から、修正を必要とするナレッジの候補を即座に管理者に応答することができる。修正を必要とするナレッジの候補には、新規ナレッジとなり得るインシデント、ナレッジの重複に対して統廃合してもよいナレッジ、見直しが必要なナレッジが含まれる。

また、情報運用装置１００がインシデント分析部８を備えることにより、特定のインシデント群の各インシデントがどのようなトピックで構成された文書であるかを定量的に評価することができ、インシデントの分類を詳細かつ容易にすることができる。つまり、インシデント分析部８は、分析者からの要求に対し、正確な情報を迅速に応答するための手段となり得る。

≪その他≫
（ａ）：本実施形態では、係り受け解析の際、係り受け解析部２４が名詞および形容詞の形態素を選択した。しかし、選択される品詞は、名詞および形容詞に限らず、例えば副詞の形態素も選択してもよい。また、“何が（〈属性〉）どうなのか（〈評価〉）”ではなく、“何が（〈属性〉）どうした（〈評価〉）”を知りたい場合には、係り受け解析部２４が名詞および動詞の形態素を選択することもできる。係り受けの種類に応じて、選択する形態素の品詞を適宜変更することができる。

（ｂ）：グラフ作成部２５が作成するグラフは、無向グラフでもよいし、有向グラフでもよい。有向グラフの場合、「係り」に該当するノードから「受け」に該当するノードに向かうエッジとしてもよいし、「受け」に該当するノードから「係り」に該当するノードに向かうエッジとしてもよいし、「係り」に該当するノードにも「受け」に該当するノードにも向かうエッジとしてもよいし、これらが混在してもよい。

（ｃ）：クラスタリング部２６によるクラスタリンク結果の出力形式は、クラスタごとの特徴語の列挙であってもよい。また、特徴語ごとに、〈属性〉と〈評価〉との関係性や、ＴＦ値を明示した出力形式とすることができる。この出力形式は、名詞ノード（〈属性〉）と連結している形容詞ノード（〈評価〉）を抽出することで実現することができる。

出力形式の一例としては、「［〈属性〉の語］（ＴＦ値）－［第１の〈評価〉の語］（ＴＦ値）／［第２の〈評価〉の語］（ＴＦ値）／・・・」とすることができる。例えば、特定のクラスタ内の部屋，広い，お部屋，風呂，ベッド，綺麗，狭い，快適，・・・と列挙されている特徴語に対して、「部屋（128）－広い（34）／綺麗（20）・・・」という出力形式をとることができる。

（ｄ）：設定部２８が設定する話題は、例えば、対応のクラスタに属するノードの中心性の指標にもとづいて設定してもよい。

本実施形態で説明した種々の技術を適宜組み合わせた技術を実現することもできる。
本実施形態で説明したソフトウェアをハードウェアとして実現することもでき、ハードウェアをソフトウェアとして実現することもできる。
その他、ハードウェア、ソフトウェア、フローチャートなどについて、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。

１００情報運用装置
１要求取得部
２検索範囲指定部
３テキストマイニング部
４トピック割合計算部
５類似度計算部
６原因・対策推定部
７ナレッジ修正支援部
８インシデント分析部
９応答出力部
１１インシデント対応履歴ＤＢ
１２ナレッジＤＢ
２１読込部
２２前処理部
２３形態素解析部
２４係り受け解析部
２５グラフ作成部
２６クラスタリング部
２７抽出部
２８設定部

Claims

文書群の情報を運用する情報運用装置であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定部と、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析部と、
前記テキストデータの係り受け解析をする係り受け解析部と、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成部と、
前記作成されたグラフのクラスタリングを行うクラスタリング部と、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出部と、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算部と、を備え、
前記特定の文書群に含まれる第１の文書について、前記トピック割合計算部が計算したトピック割合と、前記特定の文書群に含まれる第２の文書について、前記トピック割合計算部が計算したトピック割合とを用いて、第１の文書と第２の文書との間の類似度を計算する類似度計算部、をさらに備える、
ことを特徴とする情報運用装置。
問合せのテキストデータである問合せデータの入力があった場合、前記問合せデータと、前記特定の文書群との間で、前記類似度計算部による類似度を計算し、前記計算した類似度が閾値以上となる文書を応答する原因・対策推定部、をさらに備える、
ことを特徴とする請求項１に記載の情報運用装置。
前記検索範囲指定部は、前記特定の文書群に含まれる各文書の一部を前記検索範囲として指定し、
前記原因・対策推定部は、前記問合せデータと、前記特定の文書群のうち前記指定された検索範囲との間で、前記類似度計算部による類似度を計算し、前記計算した類似度が閾値以上となる文書を応答する、
ことを特徴とする請求項２に記載の情報運用装置。
前記特定の文書群に含まれる文書は、インシデントおよびナレッジであり、
前記インシデントおよび前記ナレッジの各々について、他のインシデントおよび他のナレッジとの間で、前記類似度計算部による類似度を計算し、前記計算した類似度を用いて、修正対象となる前記ナレッジの候補を決定するナレッジ修正支援部、をさらに備える、
ことを特徴とする請求項１に記載の情報運用装置。
文書群の情報を運用する情報運用装置であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定部と、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析部と、
前記テキストデータの係り受け解析をする係り受け解析部と、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成部と、
前記作成されたグラフのクラスタリングを行うクラスタリング部と、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出部と、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算部と、を備え、
前記特定の文書群は、特定のインシデント群であり、
前記特定のインシデント群に関するインシデント傾向を通知する要求があった場合、前記特定のインシデント群に含まれる各インシデントについて、前記トピック割合計算部が計算したトピック割合を用いたインシデント傾向結果を応答するインシデント分析部、をさらに備える、
ことを特徴とする情報運用装置。
文書群の情報を運用する情報運用装置が実行する情報運用方法であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定ステップと、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析ステップと、
前記テキストデータの係り受け解析をする係り受け解析ステップと、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成ステップと、
前記作成されたグラフのクラスタリングを行うクラスタリングステップと、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出ステップと、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算ステップと、を実行し、
前記特定の文書群に含まれる第１の文書について、前記トピック割合計算ステップで計算したトピック割合と、前記特定の文書群に含まれる第２の文書について、前記トピック割合計算ステップで計算したトピック割合とを用いて、第１の文書と第２の文書との間の類似度を計算する類似度計算ステップ、をさらに実行する、
ことを特徴とする情報運用方法。
文書群の情報を運用する情報運用装置が実行する情報運用方法であって、
前記文書群のうち特定の文書群を検索範囲として指定する検索範囲指定ステップと、
前記指定された検索範囲のテキストデータを形態素解析する形態素解析ステップと、
前記テキストデータの係り受け解析をする係り受け解析ステップと、
前記係り受け解析によって特定された係り受け構造に基づくグラフを作成するグラフ作成ステップと、
前記作成されたグラフのクラスタリングを行うクラスタリングステップと、
前記クラスタリングによって生成されたクラスタから特徴語を抽出する抽出ステップと、
前記抽出された特徴語を用いて、前記特定の文書群に含まれる文書ごとのトピック割合を計算するトピック割合計算ステップと、を実行し、
前記特定の文書群は、特定のインシデント群であり、
前記特定のインシデント群に関するインシデント傾向を通知する要求があった場合、前記特定のインシデント群に含まれる各インシデントについて、前記トピック割合計算ステップで計算したトピック割合を用いたインシデント傾向結果を応答するインシデント分析ステップ、をさらに備える、
ことを特徴とする情報運用方法。