JPWO2016132716A1 - 文書処理装置及び文書処理方法 - Google Patents

文書処理装置及び文書処理方法 Download PDF

Info

Publication number
JPWO2016132716A1
JPWO2016132716A1 JP2017500504A JP2017500504A JPWO2016132716A1 JP WO2016132716 A1 JPWO2016132716 A1 JP WO2016132716A1 JP 2017500504 A JP2017500504 A JP 2017500504A JP 2017500504 A JP2017500504 A JP 2017500504A JP WO2016132716 A1 JPWO2016132716 A1 JP WO2016132716A1
Authority
JP
Japan
Prior art keywords
document
unit
similarity
processing apparatus
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017500504A
Other languages
English (en)
Inventor
文雄 町田
文雄 町田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2016132716A1 publication Critical patent/JPWO2016132716A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

他のシステムのシステム障害や事故の事例から得られた知見や教訓の利用を、一層容易あるいは効率的にすることが課題である。上記課題を解決するために、入力された、利用者が知りたいシステム障害に関する内容を記述した情報と、入力された、障害が発生したシステムについて障害の再発防止のための対策がされたことを説明した対策文書との類似度を算出し出力する。

Description

本発明は、文書処理装置、文書処理方法及び文書処理プログラムに関し、特に、ディペンダブルシステムの開発に関する、文書処理装置、文書処理方法及び文書処理プログラムに関する。
電力、交通、水道、通信などの社会インフラシステムは人々の暮らしや経済活動を支える重要な基盤である。そのため、社会インフラシステムには、多くの利用者が安心して使える高度な信頼性と安全性が求められる。信頼性や安全性が高く、障害や災害に強く、人々が安心して使えるシステムはディペンダブルシステムと呼ばれる。また、ディペンダブルシステムを実現するための要件はディペンダビリティ要件といわれる。
IT(Information Technology)やネットワーク技術の発展、またその用途の変化や拡大に伴って、システムの信頼性や安全性を脅かす要因は増大している。ソフトウェアの欠陥によって社会インフラシステムが停止し、経済活動や人命に大きな影響を及ぼすこともある。システムの信頼性や安全性を脅かす要因は増大している環境でディペンダブルシステムを提供しつづけていくためには、変化に対応してリスクを見直し、システムを改善していく取り組みが必要である。特に、システム障害や事故が起こってしまった場合には、同様な事故が二度と起きないように再発防止策を講ずるべきである。
従来、システム障害やシステムに起因した事故の事例は、そのシステムの開発や運用に関わった組織のメンバー間で共有され、当該メンバーによりシステムの高信頼化や安全性向上に活かすべく努力されてきた。
今後、社会インフラシステムにおいては、組織を越えて事例が共有され、公共利益に適うディペンダブルなシステムが提供されることを目指していかなければならない。公共利益に適うディペンダブルなシステムの提供のためには、事例から学んだ教訓を定まった形式で記述し、また、ディペンダビリティ要件を定義することが重要である。また、定まった形式で記述したものやディペンダビリティ要件を、システム提供に関わる関係者間で共有していくことが重要である。
システムの品質を保証する文書の形式としては、現在、Assurance Case(以下、「AC」という。)が活用されるようになってきている。ACは一般的にシステムが所与の性質を満たすことを保証する文書である。ACには、システムが満たす性質とその論理的な根拠が明示される。そして、ACはシステムの要件に関するステークホルダ間での合意形成に活用される。非特許文献1にはゴール構造記法(GSN)を用いてシステム安全性を保証するためのACを記述する方法が開示されている。GSNによるACの記述では最終的な目標をトップレベルのノードに記述する。また、GSNによるACの記述では、トップレベルのノード以下に、最終的な目標のサブ目標を示すノードを階層的に記述していく。目標を記述する各ノードには、その目標を設定するに至った背景や状況仮定を記述するコンテキストノードやその目標が達成されることを示す根拠ノードを関連づけて記述できる。これにより、トップレベルの目標が満たされるための要件と、その根拠およびコンテキストとを、構造化して示すことができる。
GSNによるACのトップ目標に「システムで起こった障害が二度と発生しないこと」を据えれば、障害の再発防止策を論理的に説明する文書を作ることができる。そのトップ目標のサブ目標にはシステム障害の原因となった障害がシステムから取り除かれていることが記述され、そのために必要な対策がさらに下位のサブ目標で示され、その根拠が末端ノードであるエビデンスにおいて示される。
ここで、本発明に関連して、特許文献1には、抽出された文字列の集合から他の文字列と同一或いは他の文字列の部分列である文字列を除去した文字列集合を作成する重複除去手段を備える文書検索装置が開示されている。
また、本発明に関連して、特許文献2には、文書分類情報の特徴を示す分類特徴量を計算し、検索質問と前記分類特徴量の類似度を示す第1の暫定類似度を計算し、前記第1の暫定類似度に基づき前記文書の集合を検索する文書検索方法が開示されている。
また、本発明に関連して、特許文献3には、蓄積保存された電子文書のうちの何れか複数を結合して結合電子文書を生成し、その属性情報を、結合される複数の電子文書の各々の属性情報に基づいて付加する画像処理装置が開示されている。
また、本発明に関連して、特許文献4には、再発防止チェック項目群を構成する各再発防止チェック項目の数をカウントし、当該カウント数の多さに応じて優先順位を定めるチェック項目診断システムが開示されている。
特開平11−039346号公報 特開2005−025465号公報 特開2008−186176号公報 特開2009−277088号公報
T. Kelly, and R. Weaver,The Goal Structuring Notation − ASafety Argument Notation, InProceedings of theDependable Systems and Networks 2004Workshop on Assurance Cases, July 2004.
しかしながら、システム障害や事故の事例から得られた知見や教訓をAC等の定まった形式の文書で記録し、その文書の利便性の向上を図ったとしても、その文書を活用しきれない場合がある。その文書を活用しきれない場合があるのは、その文書を利用するのがシステム開発者等の人であり、人の処理能力に限界があるためである。特に、開発対象のシステムが大きい場合には、システムにおいて考慮すべきディペンダビリティ要件は膨大になる。そのため、人が、文書に記述された再発防止策が役立つかどうかを一つ一つ判定するのは困難である。また、一つの事例においても多数の防止策があるため、対象とするシステムに適用すべき要件を人が特定することが難しい場合もある。
本発明の目的は、上記課題を解決し、他のシステムのシステム障害や事故の事例から得られた知見や教訓の利用を、一層容易あるいは効率的にすることができる、文書処理装置、文書処理方法及び文書処理プログラムを提供することにある。
本発明の文書処理装置は、類似度算出手段と出力手段とを備える。前記類似度算出手段は、前記類似度算出手段に入力された、利用者が知りたいシステム障害に関する内容を記述した情報と、障害が発生したシステムについて障害の再発防止のための対策がされたことを説明した対策文書と、の類似度を算出する。前記出力手段は、前記類似度を表す情報を出力する。
本発明の文書処理装置は、他のシステムのシステム障害や事故の事例から得られた知見や教訓の利用を、一層容易あるいは効率的にすることができる。
第一実施形態の文書処理装置を表す概念図である。 第二実施形態の文書処理装置の構成の例を表す概念図である。 第二実施形態の文書処理装置の処理フローの例を表す概念図である。 類似度を算出する処理の例を表す概念図である。 第三実施形態の文書処理装置の構成の例を表す概念図である。 第三実施形態の文書処理装置の処理フローの例を表す概念図である。 第四実施形態の文書処理装置の構成の例を表す概念図である。 第四実施形態の文書処理装置の処理フローの例を表す概念図である。 P文書抽出の処理フローの例を表す概念図である。 第五実施形態の文書処理装置の構成の例を表す概念図である。 第五実施形態の文書処理装置の処理フローの例を表す概念図である。 重複除去処理のフローの例を表す概念図である。 第六実施形態の文書処理装置の構成の例を表す概念図である。 第六実施形態の文書処理装置の処理フローの例を表す概念図である。 類似度の算出処理フローの例を表す概念図(その1)である。 類似度の算出処理フローの例を表す概念図(その2)である。 類似度の算出処理フローの例を表す概念図(その2のバリエーション)である。 D文書のGSNによる記述例を表す図である。 過去のシステム障害に関するP文書の例を表す図である。 関連するシステム障害に関するP文書の例を表す図である。 検索の結果得られた情報の例を表す図である。 P文書から抽出した関連ハザードの例を表す図である。 画面上の表示例を表すイメージ図である。 最終的なD文書の例を表す図である。
[用語の説明]
まず、[発明を実施するための形態]において用いる代表的な用語を、以下に説明する。
「障害情報」は、利用者が知りたいシステム障害に関する内容を記述した情報をいう。障害情報は典型的にはテキストで記述された情報である。
「対策文書」は、障害が発生したシステムについて障害の再発防止のための対策がされたことが説明された文書である。対策文書を、以下においては、「P文書」と記述する。P文書は、より典型的には、システムの障害が発生した後に、保守者あるいは第三者によって、その障害の原因が究明され、適切な対策によって障害の再発が防止されていること、を顧客や利用者に対して説明した障害再発防止保証文書である。P文書は、典型的には、システム種別、ハザード回避目標、ハザード回避策及びハザード回避策が有効であることを説明する根拠、を含む。
「システム種別」は、システムの種類の区分を表す表記である。例えば、後の説明で例示に用いた「スケジュール管理システム」等がこのシステム種別に該当する。
「ハザード回避目標」は、回避することを目標とするハザードの内容に関係する事項が記述されたテキスト情報をいう。
「ハザード」は、システムの障害や事故を生じる原因となる状態をいう。
「ディペンダビリティ説明文書」は、開発するシステムが、そのシステムが目標とするディペンダビリティを備えることができること、を説明する文書をいう。ディペンダビリティ説明文書を、以下においては、「D文書」と記述することにする。D文書は、典型的には、システム種別、ディペンダビリティ目標及びディペンダビリティコンテキスト情報を含む。D文書は、典型的には、新規に開発するシステムにが、そのシステムが目標とするディペンダビリティを備えることができること、の保証に関係する事項を説明するディペンダビリティ保証文書である。
「ディペンダビリティ目標」は、開発するシステムが備える予定のディペンダビリティの目標である。ディペンダビリティ目標を、以下においては、「D目標」と記述することにする。
「ディペンダビリティコンテキスト情報」は、開発するシステムのD文書において、D目標を設定するに至った背景、状況、仮定等を説明したテキスト情報をいう。ディペンダビリティコンテキスト情報を、以下においては、「DC」情報と記述することにする。
[第一実施形態]
第一実施形態は、本発明の文書処理装置の最小限の構成についての実施形態である。
[構成]
図1は、第一実施形態の文書処理装置の構成を表す概念図である。
第一実施形態の文書処理装置11は、類似度算出手段131Xと、出力手段141とを備える。
類似度算出手段131Xには、障害情報と、P文書が入力される。類似度算出手段131Xは、類似度算出手段131Xに入力された障害情報と、類似度算出手段131Xに入力されたP文書との類似度を算出し、類似度を出力手段141Xに送る。
出力手段141Xは、類似度算出手段131Xが出力手段141Xに送った類似度を表す情報の出力を行う。その出力は、例えば、表示部、印刷装置、コンピュータ又はネットワークへの出力である。
[効果]
第一実施形態の文書処理装置は、他のシステムのシステム障害や事故の事例から得られた知見や教訓の利用を、一層容易あるいは効率的にすることができる。
[第二実施形態]
第二実施形態は、類似度算出部に入力される障害情報及びP文書を記録する構成を備える文書処理装置についての実施形態である。
[構成及び動作]
図2は、第二実施形態の文書処理装置の構成例を表す概念図である。
第二実施形態の文書処理装置11は、障害情報記録部111と、P文書記録部121と、類似度算出部131と、出力部141と、を備える。
障害情報記録部111は、障害情報記録部111に入力された障害情報を記録する。障害情報記録部111は、記録した障害情報を、類似度算出部131に送る。
P文書記録部121は、P文書記録部121に入力されたP文書を記録する。P文書記録部121は、P文書記録部121が記録したP文書を、類似度算出部131に送る。
類似度算出部131は、障害情報記録部111が類似度算出部131に送った障害情報と、P文書記録部121が類似度算出部131に送ったP文書と、の類似度を算出する。類似度算出部131は、類似度算出部131が算出した類似度を、出力部141に送る。
出力部141は、類似度算出部131が出力部141に送った類似度により、その類似度を表す情報を導出する。出力部141は、出力部141が導出したその類似度を表す情報の出力を行う。その出力は、例えば、表示部、印刷装置、コンピュータ又はネットワークへの出力である。前記類似度を表す情報は、類似度の値そのものでも構わない。あるいは、前記類似度を表す情報は、類似度を別の表現に変換した情報でも構わない。
[処理フロー]
図3は、第二実施形態の文書処理装置の処理フローの例を表す概念図である。
まず、障害情報記録部111は、障害情報記録部111に入力された障害情報を図示しない記録部に記録する。障害情報記録部111は、障害情報記録部111が記録した障害情報を、類似度算出部131に送る。(S201)
P文書記録部121は、P文書記録部121に入力されたP文書を、図示しない記録部に記録する。P文書記録部121は、P文書記録部121が記録したP文書を、類似度算出部131に送る。(S202)
類似度算出部131は、障害情報記録部111が類似度算出部131に送った障害情報と、P文書記録部121が類似度算出部131に送ったP文書とから、障害情報とP文書との類似度を求める。類似度を求める方法は後述する。類似度算出部131は、類似度算出部131が求めた類似度を出力部141に送る。(S203)
出力部141は、類似度算出部131が出力部141に送った類似度により、その類似度を表す情報を導出する。出力部141は、出力部141が導出したその類似度を表す情報を、外部に出力する。(S204)
図4は、第一文書と第二文書との類似度を算出する処理の例を表す概念図である。ここで、第一文書及び第二文書はともに任意のある文書である。類似度算出部131が求める類似度は、図4に表わした処理において、障害情報を第一文書に、P文書を第二文書に、それぞれ設定することにより求めることができる。
図4に表す処理の説明は以下の通りである。
図4に表す処理は、類似度算出部131を含む一般的な類似度算出部が行う処理である。以下の図4の説明においては、一般的な類似度算出部を、単に「類似度算出部」ということにする。
まず、類似度算出部は、第一文書を、第一文書を構成する単語に分解し、分解した単語についての第一単語リストを作成する。類似度算出部は、第一文書の単語への分解に、例えば形態素解析の手法等を用いる。(S211)
次に、類似度算出部は、第一単語リストから、以降の処理に不要と判断される単語を削除する。そして、類似度算出部は、削除後の単語を備える第二単語リストを作成する。この際に削除される単語は、例えば、第一文書中に非常に高頻度に現れる助詞や一般的な用語等である。類似度算出部は、第二単語リストが備える単語を、予め用意した用語辞書にある単語に限定することもできる。(S212)
類似度算出部は、第二単語リストが備える一の単語を特定する。(S214)
次に、類似度算出部は、特定した単語が第二文書にあるかを判定する。類似度算出部は、その判定に、例えばパターンマッチングの手法を用いることができる。あるいは、類似度算出部は、単なる単語のマッチングだけでなく、オントロジを用いて単語間の意味的な近さの情報を加味して、特定した単語と第二文書が備える単語とが実質同一であるかの判定を行っても良い。
(S215)
類似度算出部は、類似度算出部が特定した単語が第二文書にあると判定した場合には、次の処理を行う。すなわち、類似度算出部は、スタート後最初に本処理を行う場合には、空の第三単語リストを新規に作成する。そして、類似度算出部は、第二文書にあると判定したその単語を、類似度算出部が作成した第三単語リストに追加する。一方、類似度算出部は、スタート後最初に本処理を行う場合以外の場合には、第二文書にあると判定したその単語を、既にある第三単語リストに追加する。(S216)
類似度算出部は、S215において、特定した単語が第二文書にあると判定しなかった場合には、S217の処理を行う。
そして、類似度算出部は、スタート後最初に本処理を行う場合には、S214で特定した単語を第二単語リストから削除したものを第四単語リストとして作成する。類似度算出部は、スタート後最初に本処理を行う場合以外の場合は、S214で特定した単語を第二単語リストから削除したリストで、既にある第四単語リストを置き換える。(S217)
次に、類似度算出部は、第四単語リストに単語があるか(残っているか)を判定する。(S218)
類似度算出部は、第四単語リストに単語があると判定した場合は、S214の処理を行う。
類似度算出部は、第四単語リストに単語があると判定しなかった場合は、S219の処理を行う。
そして、類似度算出部は、第三単語リストの単語数を第二単語リストの単語数で除した値を求め、その値を類似度とする。(S219)
類似度算出部は、類似度の算出方法としては、上記方法以外にも種々の方法を用いることができる。
[効果]
第二実施形態の文書処理装置は、当該文書処理装置に入力された障害情報と当該文書処理装置に入力されたP文書との類似度を算出する。そして、当該文書処理装置は、算出した類似度を表す情報を出力する。そのため、障害情報を入力することにより、文書処理装置が求めた類似度の値を知ることににより、そのP文書が知りたいシステム障害についての内容に関連するものかを知ることができる。当該P文書が知りたいシステム障害についての内容に関連するものかを、当該P文書の中身を読まなくても、知ることができる。
すなわち、他のシステムのシステム障害や事故の事例から得られた知見や教訓の利用を、一層容易あるいは効率的にすることができる。
[第三実施形態]
第三実施形態は、P文書を表す情報を、P文書とテキスト情報との類似度により、ランク付けする文書処理装置についての実施形態である。
[構成及び動作]
図5は、第三実施形態の文書処理装置の構成例を表す概念図である。
第三実施形態の文書処理装置11は、障害情報記録部111と、P文書記録部121と、類似度算出部131と、ランキング部161と、出力部141と、を備える。
障害情報記録部111と及びP文書記録部121についての説明は、図2について同じ番号で示した構成についての説明と同様であるので、省略する。
類似度算出部131は、障害情報記録部111が類似度算出部131に送った障害情報と、P文書記録部121が類似度算出部131に送ったP文書とから、障害情報とP文書との類似度を算出する。類似度算出部131は、類似度算出部131が算出した類似度を、ランキング部161に送る。
ランキング部161は、類似度算出部131がランキング部161に送った類似度の値により、P文書を表す情報を並び替える。P文書を表す情報は、典型的には、そのP文書を特定する記号、ハザード回避目標、ハザード回避策、及びそのハザード回避策が有効であることを説明する根拠、である。ランキング部161は、P文書を表す情報を、類似度算出部131がランキング部161に送った類似度の高さに応じて、典型的には、類似度が高い(類似している)順に並び替える。以下において、P文書を表す情報を、障害情報とP文書との類似度に応じて並び替えることを「ランキング」という。ランキング部161は、ランキング部161が並び替えたP文書を表す情報を、出力部141に送る。
出力部141は、ランキング部161が出力部141に送った、並び替えたP文書を表す情報を含む情報を、図示しない外部に出力する。この出力は、例えば、表示部、印刷装置、コンピュータ又はネットワークへの出力である。
[処理フロー]
図6は、第三実施形態の文書処理装置の処理フローの例を表す概念図である。
S201及びS202の処理についての説明は、図3において同じ番号で示した処理についての説明と同じなので、省略する。以下においては、S201及びS202の処理以外の処理についての説明を行う。
類似度算出部131は、障害情報記録部111が類似度算出部131に送った障害情報と、P文書記録部121が類似度算出部131に送ったP文書とから障害情報とP文書との類似度を算出する。そして、類似度算出部131は、類似度算出部131が算出した、障害情報とP文書とのその類似度を含む情報をランキング部161に送る。(S301)
ランキング部161は、類似度算出部131がランキング部161に送った類似度により、P文書を表す情報を並び替える。ランキング部161は、ランキング部161が並び替えたP文書を表す情報を、出力部141に送る。(S302)
出力部141は、ランキング部161が出力部141に送った、ランキングをされたP文書を表す情報を出力する。(S303)
[効果]
第三実施形態の文書処理装置は、第二実施形態の文書処理装置と同様の効果を奏する。
それに加えて、第三実施形態の文書処理装置は、障害情報とP文書との類似度の大小に応じて並べ替えたP文書の内容にを出力する。そのため、利用者は得たい障害情報が含まれるP文書かどうかを容易に知ることができる。従い、第三実施形態の文書処理装置は、第二実施形態の文書処理装置と比較して、他のシステムのシステム障害や事故の事例から得られた知見や教訓の利用を、一層容易あるいは効率的にすることができる。
[第四実施形態]
第四実施形態は、P文書の文書群を、以降の処理対象として適切な文書群に予めおおまかに絞り込み、その絞り込んだ文書群のP文書のそれぞれと障害情報との類似度を算出しランキングを行う、文書処理装置に関する実施形態である。
[構成と動作]
図7は、第四実施形態の文書処理装置の構成例を表す概念図である。
第四実施形態の文書処理装置11は、障害情報記録部111と、P文書記録部121と、P文書抽出部171と、類似度算出部131と、ランキング部161と、出力部141と、を備える。
障害情報記録部111と、ランキング部161と、出力部141とについての説明は、図5についての説明と同様であるので、省略する。以下においては、障害情報記録部111と、ランキング部161と、出力部141以外の構成についての説明を行う。
P文書記録部121は、P文書記録部121に入力されたP文書を図示しない記録部に記録する。P文書記録部121は、P文書記録部121が記録したP文書を、P文書抽出部171に送る。
P文書抽出部171は、P文書記録部121がP文書抽出部171に送ったP文書の文書群から以降の処理対象として適切なP文書の文書群を抽出する。P文書抽出部171は、以降の処理対象として適切なP文書の文書群の抽出を、典型的には、システム種別の一致や、指定した単語が含まれるかについての判定により行う(下記処理フロー参照。)。P文書抽出部171は、P文書抽出部171が抽出したP文書の文書群を類似度算出部131に送る。
ランキング部161は、類似度算出部131がランキング部161に送った類似度により、P文書を表す情報を並び替える。ランキング部161は、並び替えたP文書を表す情報を、出力部141に送る。
出力部141は、ランキング部161が出力部141に送った、ランキングをされたP文書を表す情報の出力を行う。その出力は、例えば、表示部、印刷装置、コンピュータ又はネットワークへの出力である。
[処理フロー]
図8は、第四実施形態の文書処理装置の処理フローを表す概念図である。
S201、S301及びS302についての説明は、図6における同じ番号で示した処理についての説明と同様であるので、省略する。以下、S201、S301及びS302以外の処理について説明する。
P文書記録部121は、P文書記録部121に入力されたP文書を、図示しない記録部に記録する。P文書記録部121は、P文書記録部121が記録したP文書を、P文書抽出部171に送る。(S401)
P文書抽出部171は、P文書記録部121がP文書抽出部171に送ったP文書の文書群から関連するP文書の文書群を抽出する。P文書抽出部171は、その抽出されたP文書は類似度算出部131に送られる。その際の抽出のフローは後述する。(S402)
類似度算出部131は、P文書抽出部171から送られた、抽出されたP文書について、障害情報記録部111から送られた障害情報との類似度を算出する。算出した類似度は、ランキング部161に送られる。(S403)
次に、S402において、P文書抽出部171が行う、P文書の抽出処理について説明する。
図9は、P文書抽出部171が行うP文書抽出処理の処理フロー例を表す概念図である。
まず、P文書抽出部171は、抽出するP文書のシステム種別を指定する。(S411)
次に、P文書抽出部171は、抽出する際に用いる単語を指定する。P文書抽出部171が指定する単語は、P文書抽出部171が抽出すべきP文書の内容を端的に表す単語であることが望ましい。P文書抽出部171が指定する単語は、複数の単語であっても構わない。(S412)
そして、P文書抽出部171は、P文書記録部121に、S411で指定したシステム種別のP文書を特定する番号(以下、「P文書番号」という。)を送るよう指示する。P文書抽出部171は、P文書記録部121からP文書番号を入手する。(S413)
P文書抽出部171は、S413で入手したP文書番号を用いて、以降の処理対象とするP文書番号のリスト(第一リスト)を作る。(S414)
P文書抽出部171は、第一リストから一のP文書番号を特定する。(S415)
P文書抽出部171は、P文書記録部121に、S415で特定したP文書番号のP文書を送るよう指示し、P文書記録部121から、S415で特定したP文書番号のP文書を入手する。(S416)
P文書抽出部171は、S416で入手したP文書に、S412で指定した単語があるかを判定する。P文書抽出部171は、P文書抽出部171がS412で指定した単語がP文書にあるかの判定を、単語同士のマッチングによって行ってもよい。あるいは、P文書抽出部171は、P文書抽出部171がS412で指定した単語と実質同一の類義語がP文書にある場合は、S412で指定した単語がP文書にあると判定してもよい。
P文書抽出部171は、P文書抽出部171がS412で指定した単語のそれぞれが、S415でP文書番号を特定したP文書にあるかを判定する。そして、P文書抽出部171は、S415でP文書番号を特定したP文書にあると判定した、P文書抽出部171がS412で指定した単語の数を求める。さらに、P文書抽出部171は、求めた、P文書抽出部171がS412で指定した単語の数が、図9に表す処理に先立ち定められた閾値以上であるかを判定する。なお、当該閾値は任意である。すなわち、当該閾値は、1であっても、S412で指定した単語の全数であっても構わない。
P文書抽出部171は、求めた、P文書抽出部171がS412で指定した単語の数が、閾値以上であると判定した場合(S417のyes)は、S418の処理を行う。
P文書抽出部171は、求めた、P文書抽出部171がS412で指定した単語の数が、閾値以上であると判定しなかった場合(S417のno)は、S419の処理を行う。
P文書抽出部171が行うS418の処理は以下の通りである。P文書抽出部171は、スタート後S418の処理を最初に行う場合は、内容が空の第二リストを新規に作成しする。そして、P文書抽出部171は、P文書抽出部171がS415で特定したP文書番号を、S418で作成した第二リストに追加する。スタート後S418の処理を最初に行う場合以外の場合には、P文書抽出部171は、既にある第二リストに、P文書抽出部171がS415で特定したP文書番号を追加する。(S418)
そして、P文書抽出部171は、P文書抽出部171がS415で特定したP文書番号を第一リストから削除する。(S419)
次に、P文書抽出部171は、第一リストにP文書番号があるか(残っているか)を判定する。(S420)
P文書抽出部171は、S420で、第一リストにP文書番号があると判定した場合は、S415の処理を行う。
P文書抽出部171は、S420で、第一リストにP文書番号があると判定しなかった場合は、図9に表す処理を終了する。
こうして、P文書抽出部171は、終了時に第二リストにあるP文書番号のP文書の文書群を、以降の処理対象として適切な文書群として抽出する。
[効果]
第四実施形態の文書処理装置は、まず、第三実施形態の文書処理装置と同様の効果を奏する。
それに加えて、第四実施形態の文書処理装置は、類似度を算出しP文書を表す情報についてのランキングを行うP文書の文書群を、予め、P文書にある指定単語の数が閾値以上であることから得たい情報に関係するP文書からなる文書群に絞り込む。従い、第四実施形態の文書処理装置は、得たい情報に無関係であることが明らかなP文書について、類似度の算出やランキング等の計算量の多い処理を行う無駄を省くことができる。
[第五実施形態]
第五実施形態は、P文書を表す情報についてのランキングを行うP文書の文書群から、ハザード回避目標が同一であるか、或いは、ハザード回避目標が類似するP文書を除去する、文書処理装置に関する実施形態である。
[構成と動作]
図10は、第五実施形態の文書処理装置の構成例を表す概念図である。
第五実施形態の文書処理装置11は、障害情報記録部111と、P文書記録部121と、P文書抽出部171と、類似度算出部131と、ランキング部161と、重複除去部181と、出力部141と、を備える。
障害情報記録部111と、P文書記録部121と、P文書抽出部171と、類似度算出部131とについての説明は、図7における同一の番号で示した構成についての説明と同様であるので、省略する。以下においては、障害情報記録部111と、P文書記録部121と、P文書抽出部171と、類似度算出部131以外の構成について説明する。
ランキング部161は、類似度算出部131から送られた、障害情報とP文書との類似度により、P文書を表す情報のランキングを行う。なお、第五実施形態におけるP文書を表す情報には、ハザード回避目標が含まれるものとする。P文書を表す情報には、典型的には、その他、そのP文書を特定する記号、ハザード回避策、及びハザード回避策が有効であることを説明する根拠が含まれる。ランキング部161は、P文書を表す情報を、典型的には、障害情報とP文書との類似度が高い(類似している)順に並び替える。ランキング部161は、ランキングを行ったP文書を表す情報を、重複除去部181に送る。
重複除去部181は、ランキングを行ったP文書に含まれるハザード回避目標どうしを比較する。そして、重複除去部181は、ランキングを行ったP文書に含まれるハザード回避目標どうしが、同一であるか或いは類似しているかを判定する。そして、重複除去部181は、ランキングを行ったP文書に含まれるハザード回避目標どうしが、同一であるか及び類似していると判定されたP文書を表す情報があった場合には、重複除去処理を行う。ここで、重複除去処理は、ランキングを行ったP文書に含まれるハザード回避目標どうしが、同一であるか及び類似していると判定されたP文書を表す情報のうちの一を残して他を削除する処理である。重複除去部181は、重複除去後のP文書を表す情報を、出力部141に送る。
出力部141は、重複除去部181が出力部141に送った、重複除去後のP文書を表す情報を、図示しない外部に出力する。その出力は、例えば、表示部、印刷装置、コンピュータ又はネットワークへの出力である。
図11は、第五実施形態の文書処理装置の処理フローを表す概念図である。
S201、S401、S402及びS403の処理の説明は、図8における同じ番号で示した処理の説明と同一であるので、省略する。以下、S201、S401、S402及びS403以外の処理について説明する。
ランキング部161は、類似度算出部131から送られた類似度により、P文書を表す情報のランキングを行う。ランキング部161は、ランキングを行ったP文書を表す情報を、重複除去部181に送る。(S501)
重複除去部181は、ランキング部161が重複除去部181に送った、ランキングを行ったP文書を表す情報について、後述の重複除去処理を行う。重複除去部181は、重複除去処理後のP文書を表す情報を、出力部141に送る。(S502)
出力部141は、重複除去部181が出力部141に送った、重複除去後のP文書を表す情報を出力する。(S503)
図12は、図11に表す前述のS502における重複除去処理の処理フロー例を表す概念図である。
まず、重複除去部181は、重複除去処理の対象とする複数のP文書のリスト(第一リスト)を作成する。(S511)
次に、重複除去部181は、第一リストにあるP文書から一のP文書を特定する。(S512)
そして、重複除去部181は、その特定したP文書におけるハザード回避目標を単語に分解する。(S513)
さらに、重複除去部181は、S513により分解した単語の単語群(第一の単語群)から不要と判断される助詞等の単語を除去して、第二の単語群からなる単語リストを作成する。(S514)
スタートから最初に本処理を行う場合は、次に、重複除去部181は、第一リストにあるP文書から、S512で特定したP文書以外の他のP文書を第二リストにする。スタートから最初に本処理を行う場合以外の場合は、次に、重複除去部181は、既にある第二リストを第一リストにあるP文書から、S512で特定したP文書以外の他のP文書で置き換える。(S515)
次に、重複除去部181は、第二リストにある一のP文書を特定する。(S516)
そして、重複除去部181は、S514で作成した単語リストの単語のうち、S516で特定したP文書のハザード回避目標に含まれる単語の割合Xを求める。(S517)
次に、重複除去部181は、割合Xが基準値以上かについて判定する。(S518)
重複除去部181は、S518において重複除去部181が割合Xが基準値以上と判定した場合は、S522の処理を行う。
一方、重複除去部181は、S518において重複除去部181が割合Xが基準値以上と判定しなかった場合は、S519の処理を行う。
そして、重複除去部181は、S516で特定したP文書を第二リストから削除する。(S519)
次に、重複除去部181は、第二リストにP文書があるか(S519において削除した結果、P文書がまだ残っているか)を判定する。(S520)
重複除去部181は、重複除去部181がS520で第二リストにP文書があると判定した場合は、S516の処理を行う。
重複除去部181は、重複除去部181がS520で第二リストにP文書があると判定しなかった場合は、S521の処理を行う。
スタート後最初にS521の処理を行う場合は、重複除去部181は、次に、内容が空の第三リストを新規に作成し、重複除去部181がS512で特定したP文書をその第三リストに追加する。
一方、スタート後最初に本処理を行う場合以外の場合は、重複除去部181は、次に、既にある第三リストに、重複除去部181がS512で特定したP文書を追加する。(S521)
重複除去部181は、S512で特定したP文書を第一リストから削除する。(S522)
次に、重複除去部181は、第一リストに複数のP文書があるか(S522において削除した結果P文書がまだ残っているか)を判定する。(S523)
重複除去部181は、重複除去部181がS523で第一リストに複数のP文書があると判定した場合は、S512の処理を行う。
重複除去部181は、重複除去部181がS523で第一リストに複数のP文書があると判定しなかった場合は、S524の処理を行う。
重複除去部181は、第一リストにあるP文書を第三リストに追加する。(S523)
そして、重複除去部181は、図12に表す処理を終了する。
重複除去部181は、終了時において第三リストにあるP文書を、図11に表すS502による重複除去処理後の文書である。
[効果]
第五実施形態の文書処理装置は、まず、第四実施形態の文書処理装置と同様の効果を奏する。
それに加えて、第五実施形態の文書処理装置は以下の効果を奏する。
ハザード回避目標が同一又は類似するP文書を表す情報は、類似している場合が多いので、利用者はハザード回避目標が同一又は類似するP文書のすべてを読む必要が無い場合が多い。ここで、第五実施形態の文書処理装置は、ランキングを行ったP文書を表す情報から、ハザード回避目標が同一又は類似するP文書を表す情報を削除する。従い、利用者は、同一又は類似のハザード回避目標をもつP文書を表す情報を重複して読まなくてすむ。そのため、第五実施形態の文書処理装置は、第二実施形態の文書処理装置と比較しても、他のシステムのシステム障害や事故の事例から得られた知見や教訓の利用を、一層容易あるいは効率的にすることができる。
[第六実施形態]
第六実施形態は、ランキングを行ったP文書を表す情報を利用してD文書の作成を支援する文書処理装置に関する実施形態である。
[構成と動作]
図13は、第六実施形態の文書処理装置の構成例を表す概念図である。
第六実施形態の文書処理装置11は、D文書作成部112と、D文書記録部113と、P文書記録部121と、P文書抽出部171と、類似度算出部131と、ランキング部161と、を備える。第六実施形態の文書処理装置11は、さらに、重複除去部181と、出力部141と、D文書作成支援部191と、を備える。
P文書記録部121と、P文書抽出部171と、ランキング部161と、重複除去部181についての説明は、図10において同じ番号で示した構成についての説明と同じであるので、省略する。以下においては、P文書記録部121と、P文書抽出部171と、ランキング部161と、重複除去部181以外の構成について説明する。
D文書作成部112は、利用者がD文書を作成又は修正するために用いる構成である。ただし、D文書を作成又は修正する利用者は必ずしも人に限られない。利用者は人が使用する機械であっても構わない。
利用者は、D文書作成部112に、D文書を構成する各情報を入力し、D文書を作成する。D文書作成部112は、利用者が作成したD文書(第六実施形態において、作成途中のD文書を含む。)を、D文書記録部113に送る、
D文書記録部113は、D文書作成部112がD文書記録部113に送ったD文書を記録する。D文書記録部113は、D文書記録部113が記録したD文書を、類似度算出部131に送る。
類似度算出部131は、D文書記録部113が類似度算出部131に送ったD文書と、P文書記録部121が類似度算出部131に送ったP文書との類似度を算出する。類似度算出部131は、類似度算出部131が算出した類似度を、ランキング部161に送る。
出力部141は、重複除去部181が出力部141に送った、重複除去後のP文書を表す情報をD文書作成支援部191に出力する。出力部141は、重複除去後のP文書を表す情報を、D文書作成支援部191以外に、表示部、印刷装置、コンピュータ又はネットワークに出力しても構わない。
D文書作成支援部191は、出力部141がD文書作成支援部191に出力した、ランキングをされたP文書を表す情報を利用して、D文書作成部112における、利用者によるD文書の作成(修正を含む。)の支援を行う。当該支援は、例えば次の支援である。すなわち、D文書作成支援部191は、利用者が選択したP文書の、ハザード回避目標、ハザード回避策及びハザード回避策が有効であることを説明する根拠を選択し、利用者がD文書作成部112において作成中のD文書に転記する等を行う。
利用者は、D文書作成部112において、D文書作成支援部191が利用者に支援した内容に基づいて、D文書の作成を継続する。
[処理フロー]
図14は、第六実施形態の文書処理装置の処理フロー例を表す概念図である。
S401、S402、S301及びS501についての説明は、図11における同じ番号で示した処理についての説明と同じであるので、省略する。以下においては、S401、S402、S301及びS501以外の処理について説明する。
D文書作成部112は、利用者がD文書作成部112で作成したD文書を、D文書記録部113に送る。(S601)
D文書記録部113は、D文書作成部112がD文書記録部113に送ったD文書を記録する。D文書記録部113は、D文書記録部113が記録したD文書を、類似度算出部131に送る。(S602)
類似度算出部131は、D文書記録部113が類似度算出部131に送ったD文書と、P文書記録部121が類似度算出部131に送ったP文書との類似度を算出する。類似度算出部131は、類似度算出部131が算出した類似度を、ランキング部161に送る。類似度算出部131がD文書とP文書との類似度を算出に用いる、類似度の算出方法の例は後述する。(S603)
出力部141は、重複除去部181が出力部141に送った、重複除去後のP文書を表す情報を出力する。P文書を表す情報の出力先には、D文書作成支援部191が含まれる。(S604)
D文書作成支援部191は、出力部141がD文書作成支援部191に出力した、ランキングをされたP文書を表す情報を利用して、D文書作成部112における、利用者によるD文書の作成を支援する。(S605)
利用者は、D文書作成部112において、D文書作成支援部191から支援された内容に基づいて、D文書の作成を継続する。(S606)
次に、S603における、D文書とP文書との類似度の算出処理の例を説明する。
図15A及び図15Bは、類似度算出部131が行う類似度算出の処理フローの例を表す概念図である。
同図において、Sの次の数字が2である番号で示した処理についての説明は、図4において同じ番号で示した処理についての説明と同じである。ただし、図4及びその説明において、第一文書はD文書と、第二文書は特定したP文書と、それぞれ読み替えることとする。以下においては、それら以外の処理について説明する。
まず、類似度算出部131は、処理対象とするP文書のリスト(第一P文書リスト)を作成する。(S611)
S211及びS212についての説明は、図4において同じ番号で表す処理についての説明と同じであるので、省略する。
次に、類似度算出部131は、第一P文書リストから一のP文書を特定する。(S612)
S214乃至S219について説明は、図4において同じ番号で表す処理についての説明と同じであるので、省略する。
そして、類似度算出部131は、スタートから最初に本処理を行う場合は、内容が空の第二P文書リストを新規に作成し、特定したP文書を、S219で求めた類似度と関連付けて追加する。類似度算出部131は、スタートから最初に本処理を行う場合以外の場合は、既にある第二P文書リストに、特定したP文書をS219で求めた類似度と関連付けて追加する。(S613)
類似度算出部131は、特定したP文書を第一P文書リストから削除する。(S614)
次に、類似度算出部131は、第一P文書リストにP文書があるかを判定する。(S615)
類似度算出部131は、類似度算出部131がS615において第一P文書リストにP文書があると判定した場合は、S612の処理を行う。
類似度算出部131は、類似度算出部131がS615において第一P文書リストにP文書があると判定しなかった場合は、図15A及び図15Bに表した処理を終了する。
類似度算出部131は、終了時において、第二P文書リストにある、P文書と関連付けられた類似度を、類似度算出部131が図14に表したS603の処理により求めた類似度である。
類似度算出部131が行う、類似度の算出処理フローとしては、図15Bを図15Cで置き換えたバリエーションが考えられる。
図15Cにおける、S612、S214、S217、S218、S614及びS615についての説明は、図15Bにおける同じ番号で示した処理についての説明と同じであるので、省略する。以下においては、S612、S214、S217、S218、S614及びS615以外の処理について説明する。
類似度算出部131は、類似度算出部131がS214において特定した単語と同一の単語が第二文書(類似度算出部131がS612において特定したP文書)に用いられている回数を求める。類似度算出部131は、この際の同一に、類似度算出部131が実質同一であると判定する場合を含めても構わない。類似度算出部131は、実質同一であることの判定を、例えば、次のように行う。類似度算出部131は、類似度算出部131がS214において特定した単語、及び類似度算出部131がS612において特定したP文書に含まれる単語、のそれぞれの意味を解析する。そして、類似度算出部131は、類似度算出部131がS214において特定した単語の意味と類似度算出部131がS612において特定したP文書に含まれる単語の意味とが同一な場合に実質同一であると判定する。あるいは、類似度算出部131は、予め同義語辞書を備えても構わない。その場合、類似度算出部131は、類似度算出部131がS214において特定した単語と、類似度算出部131がS214において特定した単語のそれぞれについてその同義語辞書を参照する。そして、類似度算出部131は、類似度算出部131がS214において特定した単語と、類似度算出部131がS214において特定した単語とが同義語になる場合には、実質同一であると判定する。(S621)
スタート後最初に本処理を行う場合は、類似度算出部131は、内容が空の第二P文書リストを新規に作成する。そして、類似度算出部131は、類似度算出部131がS621で求めた回数を、類似度算出部131がS214において特定したP文書及び類似度算出部131がS214において特定した単語と関連付けた情報を、類似度算出部131が作成した第二P文書リストに追加する。スタート後最初に本処理を行う場合以外の場合は、類似度算出部131は、S621で求めた回数を、S214において特定したP文書及びS214において特定した単語と関連付けた情報を、既にある第二P文書リストに追加する。(S622)
類似度算出部131は、S615において、第一リストにP文書があると判定しなかった場合は、以下の処理を行う。すなわち、類似度算出部131は、第二P文書リストにあるP文書それぞれについて、S621で求めた回数を、第二単語リストにあるすべての単語について足し合わせた値を求める。そして、類似度算出部131は、その足し合わせた値をそれぞれのP文書の類似度とする。類似度算出部131は、第二P文書リストにあるすべてのP文書のそれぞれについて類似度を求める。(S623)
次に、第六実施形態の文書処理装置について、具体例を用いてその動作を説明する。
以下の動作説明は、ACによってD文書及びP文書が記述された場合の具体例の説明である。本動作説明においては、D文書はディペンダビリティ保証文書であり、P文書は障害再発防止保証文書であることが想定されている。
まず、開発者が、新しくできた組織におけるスケジュールを管理を行うスケジュール管理システムを開発する状況を想定する。スケジュール管理システムは、その組織内でのコミュニケーションのために重要なツールであり、その組織において行われる活動に欠かせないシステムであることを想定する。そこで、開発者が、スケジュール管理システムの可用性を保証するために、D文書をACによって作成する状況を想定する。
まず、システム設計者は、図13に表したD文書作成部112によってスケジュール管理システムに対するD文書の骨子を作成する。当該骨子には、システム種別、D目標、DC情報が含まれる。
GSNによって記述したD文書の例を図16に表す。
図16に表したD文書におけるトップ目標は、「スケジュール管理システムは高可用である」ことである。
そして、トップノード目標にリンクされたDCノード情報には、スケジュール管理システムが「メール/スケジュールを集中管理するシステム」であることが付記されている。
トップ目標のサブ目標には、「システムが6時間以上停止することはない」ことが表される。このサブ目標にリンクされたDCノードで情報には、このサブ目標が設定された背景にある「6時間以上の停止は業務に重大な支障が出る」ことが付記されている。
さらに、このサブ目標を「システム障害ハザードに分けて議論する」という方針に従って分解する。その結果として、「スケジュール管理ソフトウェアが起動している」、「データベースにアクセス可能」、「認証サーバの応答が正しく機能」といったサブ目標がさらに導出される。システム障害ハザードに分けて議論して分解したこれらのサブ目標が、ハザード回避目標である。
そして、これらのハザード回避目標が達成されるための対策や方法であるハザード回避策が、それぞれのハザード回避目標についてさらに表され、そのハザード回避策が有効である根拠が合わせて表される。
例えば、「スケジュール管理ソフトウェアが起動している」というハザード回避目標を達成するためには、そのソフトウェアを機能させるプロセスの「プロセス起動確認」というハザード回避策が必要であることが表されている。さらに、そのハザード回避策が有効である根拠としては「プロセス死活監視結果」を提出できることが表されている。
システム設計者は、D文書を上記のような形式で記述することにより、システム設計において考慮した要件と議論の展開、その根拠を論理的に示すことができる。上記のような形式のD文書は、組織内外の利用者や意思決定者に説明する際に利用されることが可能なだけでなく、システム開発や運用に関わるステークホルダ間の合意形成においても活用されることが可能である。
しかし、上記の例のように「スケジュール管理システムは高可用である」というトップ目標を達成するために考慮すべき要件は多岐に亘る。そのため、考慮すべき要件を網羅的にGSNなどの記法によって記述する作業は手間がかかる。
D文書の記述を効率化し、かつ、過去の障害や事故の事例から得られた教訓を活かして同じ問題を再発させないことを保証していくためには、再発防止策を含むP文書もACのような保証文書として残していくことが必要である。
今、システム障害やシステムに起因した事故の再発防止策を含むP文書がACによって記述され、組織内あるいは組織を越えて共有されていることを想定する。
そのP文書の例を図17及び図18に表す。図17に表したP文書1及びP文書2は、開発対象のシステムと同じスケジュール管理システムにおいて発生した過去のシステム障害に関するP文書の例である。一方、図18に表したP文書3及びP文書4は、開発対象のシステムと同じではないが、開発対象のシステムに関連するシステム障害に関するP文書の例である。
図17に表したP文書1を例に説明する。P文書1には、「8月にスケジュール管理システムが数時間にわたって利用不能になった」という過去の障害Xが二度と発生しないことがトップ目標として記述されている。なわち、P文書1には、「スケジュール管理システムで発生した障害Xは再発しない」ことがトップ目標とされている。そして、P文書1には、そのトップ目標を達成するためには、「障害時のハザードに全て対処している」という、トップ目標を達成するためのサブ目標を達成することが必要であることが記述されている。そして、P文書1には、そのサブ目標を、「システム障害ハザードに分けて議論」した結果、障害が発生した原因であった「ソフトウェアバグb1の影響がない」ことがサブ目標、すなわちハザード回避目標に設定されている。そして、P文書1には、そのハザード回避目標を達成するためのハザード回避策としては、「ソフトウェアパッチp1の適用」があることが記述されている。さらには、P文書1には、「パッチ適用ログが利用できることの説明」がハザード回避策の根拠として記述されている。
システム障害後の原因分析やその対策立案は一般的に行われていることである。以下においては、システム障害後の原因分析やその対策立案の結果得られた情報を、構造化された文書であるP文書として記述し、利用することを前提とする。
本具体例において用いられる文書処理装置の構成は、図13に表した文書処理装置11の構成と同じである。文書処理装置11の類似度算出部131は、図16のD文書の目標ノード及びDCノードに記載された情報を構文解析して単語を抽出する(図15AのS211に相当する。)。そして、類似度算出部131は、図16に表わしたD文書から、「スケジュール管理システム」、「メール/スケジュール」、「集中管理」、「6時間以上停止」、「業務」などの単語を抽出する。その際に、類似度算出部131は、事前に作成された用語リスト等を用いて、D文書から、類似文書の検索に活用しやすい単語のみを抽出する。用語リストを作成する際には、例えば、「システム」などの一般的過ぎる用語は、単語リストから除外する。また、例えば、「重大な」などの程度を表す単語は特に対象を特定しないので用語リストから除外する。
次に、類似度算出部131はシステム種別である「スケジュール管理システム」であるという情報と、抽出した単語リストの情報を用いて、P文書記録部121に問い合わせる。そして、類似度算出部131は、類似性のあるP文書を検索する(図14のS402に相当する)。
検索の結果、類似度算出部131は、例えば図19に表す情報を得る。すなわち、類似度算出部131は、検索ヒットした障害再発防止ケースに対して、ヒットした単語、ヒット数及び類似度を得る。図19に表した情報には、P文書1はスケジュール管理システムを対象としており、「スケジュール管理システム」という単語が合計2箇所使われていることが表されている。図19に表した情報には、一方、P文書3はシステムAという異なる種別のシステムであるが、「メール/スケジュール」、「認証サーバ」といった単語が合計3箇所使われていることが表されている。
類似度算出部131は、図19に表した情報から、各P文書とD文書の類似度を算出する(図14のS604及び図15Cに表した処理)。ここで、類似度算出部131は、D文書から抽出した各単語についてP文書を検索し、ヒット単語数を類似度のスコアとする計算方法を採用したことを想定する。この計算方法を採用した場合、図17に表したP文書1のスコアは2と計算される。一方、図18に表したP文書3のスコアは3と計算される。類似度算出部131は、スコアを算出する際に、検索ヒット数を適当な値域に変換したり、単語の意味的な類似度の情報を用いてスコアの算出方法を工夫しても良い。当該工夫は、D文書との類似性が高いP文書のスコアがより高くなるように行われるべきである。
以上のようにしてP文書のスコア(類似度)を算出した後、ランキング部161は、スコアの高いP文書から順番にハザード回避目標ノードを特定する。そして、ランキング部161は、特定したハザード回避目標ノードに連なるハザード回避策ノード、および根拠ノードを一つのセットとして関連ハザード情報(P文書を表す情報の一例である。)にまとめる(図14のS301)。ランキング部161が、図19に表した検索結果に基いて、図17及び図18に表したP文書から抽出した関連ハザードの例を図20に示す。図20に表した関連ハザードでは、D文書との類似度に基づいてランキングされ、P文書を表す情報である、ハザード回避目標、ハザード回避策及びハザード回避策が有効である根拠がセットで表されている。
次に、出力部141は、ランキング部161がランキングした関連ハザードを、表示端末に表示する。(図14のS604)。システム設計者は、出力部141が表示端末に表示した関連ハザードを見ることができる。出力部141が表示端末に表示した関連ハザードは図20の表の情報と等価である。出力部141は、関連ハザードを、例えば図21に示すような画面上に表示する。図21の表示画面では左側に開発対象のスケジュール管理システムに対するD文書の入力支援機能が提供され、右側に過去の再発防止保証ケースから抽出された関連ハザードが表示されている。システム設計者は、例えば、図21に表した「検索」ボタンの押下によって再発防止保証ケースの検索と関連ハザードの表示を行うことができる。また、システム設計者は、例えば図21に表した「適用」ボタンの押下により選択した関連ハザードを右側のD文書に組み込むことができる。
関連ハザードは、開発対象システムのD文書でも記述すべき内容を含んでいる。そのため、システム設計者は、ハザード回避目標、ハザード回避策及びハザード回避策が有効である根拠のセットを、そのままD文書のサブ目標を記述するために利用することができる。ここでは、D文書に含めるべきかどうかをシステム設計者が判断し、必要に応じてノードの記述を修正する状況を想定する。また、ここでは、システム設計者が、図20に示された関連ハザードのうち、上位4つのハザードを記載すべきだと判断した場合を想定する。システム設計者は、図16に表わしたもとの(作成途中の)D文書に、図20において、P文書から転記した事項と記した部分を追記することにより、最終的に図22に示すD文書を得ることができる。
このようにして、システム設計者が得たD文書には、過去に発生したシステム障害の再発を防止するための要件が組み込まれるので、障害が再発しない根拠が表される。第六実施形態の文書処理装置を用いなかった場合は、システム設計者は過去の障害事例に関する文書を、システム設計者等が、一つ一つ精査した上で、図22に表したACの全てを記述しなければならない。そのため、システム設計者の手間がかかると共に、システム設計者が、考慮すべき重要な要件を見落とす可能性が高くなる。第六実施形態の文書処理装置を用いた場合、システム設計者は、過去のP文書の中からD文書との類似度の高いP文書抽出し、抽出したP文書の、ハザード回避目標、ハザード回避策及び根拠のセットを、D文書の記述に利用することができる。そのため、第六実施形態の文書処理装置は、システム設計者によるD文書の作成を効率化できる。
[効果]
第六実施形態の文書処理装置は、まず、第五実施形態の文書処理装置と同様の効果を奏する。
それに加えて、第六実施形態の文書処理装置を用いた場合、利用者は、作成途中のD文書の作成に流用したい情報を含むP文書を、その作成途中のD文書との類似度がすでにランキングをされたP文書から選ぶことができる。そして、第六実施形態の文書処理装置により、利用者は、選んだP文書の内容、例えば、ハザード回避目標、ハザード回避策及びハザード回避策が有効である根拠を流用することができる。そのため、第六実施形態の文書処理装置は、他のシステムのシステム障害や事故の事例から得られた知見や教訓の開発するシステムの、利用者によるD文書作成への利用を、一層容易かつ効率的にすることができる。
なお、第一乃至第六実施形態における文書処理装置における処理に用いられるD文書やP文書は、命題に対しての考察の過程を構造化により表わした文書、特に階層的な構造化により表わした文書であることが、より好ましい。ここでの、命題は、D文書では、開発するシステムにおいて目標とするディペンダビリティが備えられることの説明であり、P文書では、障害が発生したシステムについて障害の再発防止のための対策がされたことを説明することである。
上記が好ましい理由は、第一乃至第六実施形態において説明した処理において、文書処理装置が、D文書やP文書から、特に有効な部分を選択し、利用することが容易になるためである。具体的には、例えば、D文書においては、文書処理装置は、システム種別、D目標及びDC情報を選択し、システム種別、D目標及びDC情報から単語等の抽出を行うことが、容易になる。また、P文書においては、文書処理装置は、システム種別、ハザード回避目標、ハザード回避策及び根拠を選択し、システム種別、ハザード回避目標、ハザード回避策及び根拠に含まれる単語から、D文書との類似度を求めることが、容易になる。
また、上記が好ましい理由は、第六実施形態においては、利用者が、ランキングしたP文書から抜粋した情報を、D文書に流用することが容易であるためである。流用が容易になる理由は、D文書やP文書が、命題に対しての議論の過程を構造化して表わした文書であるからである。D文書やP文書が階層的に構造化されていれば、さらにその流用は容易である。
そして、上記のような、命題に対しての考察の過程を構造化して階層的に表わした文書の典型的な例が、ACによる形式で記述された文書である。
また、上記の実施形態の一部または全部は、以下の付記のようにも記述され得るが、以下には限られない。
(付記1)
入力された、利用者が知りたいシステム障害に関する内容を記述した記述情報と、入力された、障害が発生したシステムについて障害の再発防止のための対策がされたことを説明した対策文書と、の類似度を算出する類似度算出手段と、
前記類似度を表す情報を出力する出力手段と、
を備える、文書処理装置。
(付記2)
複数の前記対策文書について前記類似度を算出し、算出した前記類似度により前記複数の対策文書を表す情報のランキングを行い、ランキング後の前記対策文書を表す情報を出力する、付記1に記載された文書処理装置。
(付記3)
前記対策文書を表す情報が、システムの障害や事故を生じる原因となる状態であるハザードを回避することを目標として記述したハザード目標と、ハザードを回避するためのハザード回避策と、前記ハザード回避策が有効であることを説明する根拠を含む、付記2に記載された文書処理装置。
(付記4)
一の前記対策文書を表す情報に記述されたハザード回避目標と、他の前記対策文書を表す情報に記述されたハザード回避目標とが同一又は類似している場合に、そのいずれかの前記対策文書を表す情報を出力しない、付記3に記載された文書処理装置。
(付記5)前記記述情報が、開発するシステムにおいて目標とするディペンダビリティが備えられることを説明する説明文書から抜粋された情報である付記1乃至4のうちのいずれか一に記載された文書処理装置。
(付記6)前記記述情報が、作成途中の前記説明文書から抜粋された情報である付記5に記載された文書処理装置。
(付記7)前記記述情報が、作成途中のD文書における、ディペンダビリティ目標及びディペンダビリティコンテキスト情報である付記1乃至6のうちのいずれか一に記載された文書処理装置。
(付記8)
前記ランク付けをした前記対策文書を表す情報から選択した部分を用いて、前記作成途中の前記説明文書の作成を支援する、付記7に記載された文書処理装置。
(付記9)
前記、利用者が知りたいシステム障害に関する内容を記述した情報が、命題に対しての考察の過程を構造化により表わされた文書である、付記1乃至8のうちのいずれか一に記載された文書処理装置。
(付記10)
前記、利用者が知りたいシステム障害に関する内容を記述した情報が、命題に対しての考察の過程を階層化により表わされた文書である、付記1乃至9のうちのいずれか一に記載された文書処理装置。
(付記11)
前記、利用者が知りたいシステム障害に関する内容を記述した情報が、命題に対しての考察の過程をAssurance Caseの形式により表わされた文書である、付記1乃至10のうちのいずれか一に記載された文書処理装置。
(付記12)
前記対策文書が、命題に対しての考察の過程を構造化により表わされた文書である、付記1乃至11のうちのいずれか一に記載された文書処理装置。
(付記13)
前記対策文書が、命題に対しての考察の過程を階層化により表わされた文書である、付記1乃至12のうちのいずれか一に記載された文書処理装置。
(付記14)
前記対策文書が、命題に対しての考察の過程をAssurance Caseの形式により表わされた文書である、付記1乃至13のうちのいずれか一に記載された文書処理装置。
(付記15)
前記支援が、前記ランク付けをした前記対策文書を表す情報から選択した、前記ハザード回避目標、前記ハザード回避策及び前記根拠、の内容を、前記作成途中の説明文書に追加する支援である、付記8に記載された文書処理装置。
(付記16)
入力された、利用者が知りたいシステム障害に関する内容を記述した情報と、入力された、障害が発生したシステムについて障害の再発防止のための対策がされたことを説明した対策文書と、の類似度を算出し、
前記類似度を表す情報を出力する、
文書処理方法。
(付記11)
入力された、利用者が知りたいシステム障害に関する内容を記述した情報と、入力された、障害が発生したシステムについて障害の再発防止のための対策がされたことを説明した対策文書と、の類似度を算出する処理と、
前記類似度を表す情報を出力する処理と、
をコンピュータに実行させる文書処理プログラム、を記録した記録媒体。
以上、上述した実施形態を模範的な例として本発明を説明した。しかしながら、本発明は、上述した実施形態には限定されない。即ち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
この出願は、2015年2月17日に出願された日本出願特願2015−028339を基礎とする優先権を主張し、それらの開示の全てをここに取り込む。
11 文書処理装置
111 障害情報記録部
112 D文書作成部
113 D文書記録部
121 P文書記録部
131 類似度算出部
131X 類似度算出手段
141 出力部
141X 出力手段
161 ランキング部
171 P文書抽出部
181 重複除去部
191 D文書作成支援部

Claims (10)

  1. 入力された、利用者が知りたいシステム障害に関する内容を記述した記述情報と、入力された、障害が発生したシステムについて障害の再発防止のための対策がされたことを説明した対策文書と、の類似度を算出する類似度算出手段と、
    前記類似度を表す情報を出力する出力手段と、
    を備える、文書処理装置。
  2. 複数の前記対策文書について前記類似度を算出し、算出した前記類似度により前記複数の対策文書を表す情報のランキングを行い、ランキング後の前記対策文書を表す情報を出力する、請求項1に記載された文書処理装置。
  3. 前記対策文書を表す情報が、システムの障害や事故を生じる原因となる状態であるハザードを回避することを目標として記述したハザード目標と、ハザードを回避するためのハザード回避策と、前記ハザード回避策が有効であることを説明する根拠を含む、請求項2に記載された文書処理装置。
  4. 一の前記対策文書を表す情報に記述されたハザード回避目標と、他の前記対策文書を表す情報に記述されたハザード回避目標とが同一又は類似している場合に、そのいずれかの前記対策文書を表す情報を出力しない、請求項3に記載された文書処理装置。
  5. 前記記述情報が、開発するシステムにおいて目標とするディペンダビリティが備えられることを説明する説明文書から抜粋された情報である請求項1乃至4のうちのいずれか一に記載された文書処理装置。
  6. 前記記述情報が、作成途中の前記説明文書から抜粋された情報である請求項5に記載された文書処理装置。
  7. 前記記述情報が、作成途中のD文書における、ディペンダビリティ目標及びディペンダビリティコンテキスト情報である請求項1乃至6のうちのいずれか一に記載された文書処理装置。
  8. 前記ランク付けをした前記対策文書を表す情報から選択した部分を用いて、前記作成途中の前記説明文書の作成を支援する、請求項7に記載された文書処理装置。
  9. 前記支援が、前記ランク付けをした前記対策文書を表す情報から選択した、前記ハザード回避目標、前記ハザード回避策及び前記根拠、の内容を、前記作成途中の説明文書に追加する支援である、請求項8に記載された文書処理装置。
  10. 入力された、利用者が知りたいシステム障害に関する内容を記述した情報と、入力された、障害が発生したシステムについて障害の再発防止のための対策がされたことを説明した対策文書と、の類似度を算出し、
    前記類似度を表す情報を出力する、
    文書処理方法。
JP2017500504A 2015-02-17 2016-02-12 文書処理装置及び文書処理方法 Pending JPWO2016132716A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015028339 2015-02-17
JP2015028339 2015-02-17
PCT/JP2016/000722 WO2016132716A1 (ja) 2015-02-17 2016-02-12 文書処理装置及び文書処理方法

Publications (1)

Publication Number Publication Date
JPWO2016132716A1 true JPWO2016132716A1 (ja) 2018-01-11

Family

ID=56688767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017500504A Pending JPWO2016132716A1 (ja) 2015-02-17 2016-02-12 文書処理装置及び文書処理方法

Country Status (2)

Country Link
JP (1) JPWO2016132716A1 (ja)
WO (1) WO2016132716A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6660333B2 (ja) * 2017-03-13 2020-03-11 Kddi株式会社 情報抽出装置、情報抽出方法及び情報抽出プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123536A (ja) * 2000-10-18 2002-04-26 Nec Fielding Ltd 障害事例検索システム
JP2002297796A (ja) * 2001-03-29 2002-10-11 Hitachi Ltd ワークフローシステムを用いた問合せ型障害対策支援方法
JP2004295665A (ja) * 2003-03-27 2004-10-21 Japan Research Institute Ltd ヘルプデスク支援システムおよびヘルプデスク支援方法
JP2009276929A (ja) * 2008-05-13 2009-11-26 Hitachi Electronics Service Co Ltd 自動障害対応システム
WO2012073686A1 (ja) * 2010-11-30 2012-06-07 独立行政法人科学技術振興機構 ディペンダビリティ維持装置、ディペンダビリティ維持システム、障害対応システム、ディペンダビリティ維持装置の制御方法、制御プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123536A (ja) * 2000-10-18 2002-04-26 Nec Fielding Ltd 障害事例検索システム
JP2002297796A (ja) * 2001-03-29 2002-10-11 Hitachi Ltd ワークフローシステムを用いた問合せ型障害対策支援方法
JP2004295665A (ja) * 2003-03-27 2004-10-21 Japan Research Institute Ltd ヘルプデスク支援システムおよびヘルプデスク支援方法
JP2009276929A (ja) * 2008-05-13 2009-11-26 Hitachi Electronics Service Co Ltd 自動障害対応システム
WO2012073686A1 (ja) * 2010-11-30 2012-06-07 独立行政法人科学技術振興機構 ディペンダビリティ維持装置、ディペンダビリティ維持システム、障害対応システム、ディペンダビリティ維持装置の制御方法、制御プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
岡本悠希 他2名: "ログによる動的なアシュアランス・ケース機構", 第6回データ工学と情報マネジメントに関するフォーラム(第12回日本データベース学会年次大会)[ONL, vol. E7-4, JPN6016015291, 3 May 2014 (2014-05-03), ISSN: 0004337335 *
菊池紘 他3名: "類似パターンの省略によりソースコードの可読性を向上させる新技法", 電子情報通信学会技術研究報告, vol. 113, no. 215, JPN6016015292, 5 September 2013 (2013-09-05), pages 1 - 6, ISSN: 0004337336 *

Also Published As

Publication number Publication date
WO2016132716A1 (ja) 2016-08-25

Similar Documents

Publication Publication Date Title
KR102008707B1 (ko) 업무 리스크 관리 시스템
US11036867B2 (en) Advanced rule analyzer to identify similarities in security rules, deduplicate rules, and generate new rules
US10803255B2 (en) Formulating a response to a natural language query based on user intent
JP6077472B2 (ja) 機械学習を行うためのユーザインターフェース及びワークフロー
JP6919569B2 (ja) ログ分析システム、方法、及び記録媒体
US7386439B1 (en) Data mining by retrieving causally-related documents not individually satisfying search criteria used
US11418534B2 (en) Threat analysis system and threat analysis method
CN111179115A (zh) 故障处理辅助决策方法、装置、存储介质及电子设备
JP5651381B2 (ja) 障害原因判定ルール検証装置及びプログラム
CN112799722A (zh) 命令识别方法、装置、设备和存储介质
US11501006B2 (en) Leveraging natural language processing to refine access control within collections
Blanchard et al. The ethics of artificial intelligence for intelligence analysis: a review of the key challenges with recommendations
Mantha et al. Cybersecurity in construction: Where do we stand and how do we get better prepared
KR101444250B1 (ko) 개인정보 접근감시 시스템 및 그 방법
Sarkar et al. Text mining-based association rule mining for incident analysis: a case study of a steel plant in India
CN109067587B (zh) 关键信息基础设施的确定方法及装置
WO2016132716A1 (ja) 文書処理装置及び文書処理方法
Lo et al. An extended FMEA model for exploring the potential failure modes: a case study of a steam turbine for a nuclear power plant
Gordon et al. Comparing requirements from multiple jurisdictions
Nagashree et al. An early risk detection and management system for the cloud with log parser
Sharma et al. Bug Report Triaging Using Textual, Categorical and Contextual Features Using Latent Dirichlet Allocation
JP2014153736A (ja) 障害予兆検出方法、プログラムおよび装置
JP5623950B2 (ja) It障害予兆検知装置及びプログラム
JP2006099249A (ja) 障害管理装置および障害管理方法
Bhuiyan et al. Can we use software bug reports to identify vulnerability discovery strategies?

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200218

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200901