JP6514172B2 - 文書比較装置、文書比較方法及びプログラム - Google Patents

文書比較装置、文書比較方法及びプログラム Download PDF

Info

Publication number
JP6514172B2
JP6514172B2 JP2016189420A JP2016189420A JP6514172B2 JP 6514172 B2 JP6514172 B2 JP 6514172B2 JP 2016189420 A JP2016189420 A JP 2016189420A JP 2016189420 A JP2016189420 A JP 2016189420A JP 6514172 B2 JP6514172 B2 JP 6514172B2
Authority
JP
Japan
Prior art keywords
sentence
work
document
construction procedure
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016189420A
Other languages
English (en)
Other versions
JP2018055327A (ja
Inventor
暁 渡邉
暁 渡邉
敬志郎 渡辺
敬志郎 渡辺
川原 亮一
亮一 川原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016189420A priority Critical patent/JP6514172B2/ja
Publication of JP2018055327A publication Critical patent/JP2018055327A/ja
Application granted granted Critical
Publication of JP6514172B2 publication Critical patent/JP6514172B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、文書比較装置、文書比較方法及びプログラムに関する。
大規模化・構成機器の多様化が進むITネットワークシステムにおいては、システム利用者の要求に応えるため、システムを構成する装置の増設、交換、設定変更、撤去が繰り返し行われている。こうしたシステムへの構成変更業務を「工事」という。システムの規模によっては、工事が週に何回、何十回と行われることは珍しくない。
一般に、工事は工事手順書と呼ばれるテキスト文書に従って行われる。近年のITシステムは、構成装置が国内の様々な拠点や海外に跨って配置されており、工事を行いたい工事監理者と、実際に工事を行う作業者とは異なる人物である。どの作業者でもミス無く工事が行えるために、工事手順書が用いられる。
工事手順書とは、図1に示すような、システムに対して目的とする変更を加えるための、一連の作業の系列データをいう。なお、実際には工事手順書には工事日、工事名、作業者などの付加情報が存在するが、便宜上、ここでは省略する。作業者は、工事手順書に記載された作業を順に実施していく。
実際の工事では、何度も作業の確認を行いながら、順次作業が実施される。工事手順書を用いた工事の実施は、(1)工事手順書の作成、(2)作業実施、の2ステップの業務フローで行われる。
(1)工事手順書の作成では、まず、工事の行程を列挙し、各行程で実際に実施すべき詳細な作業を記述する。また、接続する装置名や、設定する値など、各種パラメータも同時に記入する。この際、工事によりシステムが停止する時間や作業者の稼働時間の把握のため、各作業の作業時間も記載される。工事では一つのミスがシステムの動作を止めるほど重大な異常を発生させ得るため、工事手順書の記述を行う際は、設定すべき値が正しいか、或いは対象となる装置に間違いが無いかなどの確認を記述時に行う。また、値が正しいかを複数の作業者で確認して承認する、といったような、工事手順書のレビュー業務が行われる。
(2)作業実施では、上記で作成した工事手順書に従い、作業を順次実施する。この際も、各作業が間違いないか一つずつ確認し、また記述が正しくても間違った値などを入力しないように、確認しながら作業が進められる。特に注意が必要となるのは、過去にミスが発生し工事が進められなかった経験のある、要注意作業である。
ここでは、各ステップにおける以下の業務を総称して、作業の確認業務と定義する。
(1)手順書のレビュー:作成した工事手順書において、作業の記述漏れと、パラメータの間違いが無いかを確認する業務
(2)要注意作業の確認:工事手順書の作業のうち、過去にミスの発生したことのある作業を把握する業務
これらの確認業務は、過去の同一の工事における工事手順書との比較で行われる。例えば、手順書のレビューでは、過去の工事手順書との違いを確認し、記述し損ねた作業がないかどうかを確かめる。また、過去にミスが起こったことのある作業があれば、そのときの工事手順書と比較して、ミスのあった作業を把握することが重要である。
工事手順書に基づく工事における作業の確認業務は、一般に非常に時間のかかる業務である。細かく一つずつ確認をしながら進めるのは、過去に発生したミスを発生させないためである。しかしながら、週に何度も行われることが多い工事に対して、工事手順書に記載される作業数は数百に及ぶことがある。そのため、作業の確認業務は、実際の作業時間以上の時間を費やして行われることも多い。
特開2016−053871号公報
過去の工事手順書との差異をdiffコマンドのような差分比較方法で確認できれば、差分確認は効率化できる。しかし、工事における作業は一般にコマンドとして記載される事が多く、"(コマンド) (パラメータ)"の形式で記述される(例:"ping 192.168.11.1")。パラメータは、同じ内容の工事でも毎回変化するため、工事手順書における作業の記述は、都度変化する。また、作業回数は状況により変化する。例えば、新規に設置するサーバに接続する装置数を3とすると、接続のための"ifconfig"は3回行われる必要がある。この行数は状況により異なる。
また、特に工事手順書においては、作業順序の入れ替わりが頻繁に発生する。例えば、工事において"NATが存在することを確認"という作業と"ACLが存在することを確認"という作業を行う場合、これらの作業はシステムに変更を加えるものではないため、いずれから実施しても問題ない。そのため、上記2つが行われる順序は工事ごとに異なる。
このように、工事手順書において、同一の工事であっても、作業の記述、行数及び作業順序が変化し得る。そのため、過去の工事手順書との比較が単純には行えない問題がある。
特許文献1では、非定型なテキストの比較が可能とされている。すなわち、特許文献1では、複数の業務履歴の記述文書において、文の単語特徴量に基づく類似性を用いて、同じ作業が記述された箇所を特定する。
特許文献1で提案された方法は、工事手順書の記述の違いと行数の違いに影響を受けないが、作業順序の違いを考慮できない問題がある。工事手順書を含む一般的な文書では、一つの文書に非常に多くの短文が含まれるため、無関係な文が偶然類似することがある。偶然類似した文を同一記述とみなさないように、特許文献1では文の順序の入れ替えが起こらないという制約を加えたマルチプルアラインメント問題の解法を応用し、同一記述の特定精度を向上させている。そのため、作業順序の入れ替わりが起こりやすい工事手順書への適用では、比較における同一作業箇所の特定精度に課題があり、適用が難しい。
本発明は、上記の点に鑑みてなされたものであって、文の順序の入れ替わりが許容される文書の比較を支援することを目的とする。
そこで上記課題を解決するため、文書比較装置は、第1の文書に含まれる各文と第2の文書に含まれるいずれかの文とを、文の類似度に基づいて組み合わせることで、複数の文集合を生成する文集合生成部と、前記各文書の文がいずれの文集合に含まれるのかを示すグラフを生成するグラフ生成部と、前記グラフを出力する出力部と、を有し、前記文集合生成部は、任意の文がいずれか一つの文集合にしか属さず、かつ、前記第1の文書における前の文が属する第1の文集合と後の文に属する第2の文集合とが有る場合に、前記第2の文書における前の文が前記第2の文集合に属し、後の文が前記第1の文集合に属するような文集合の数が所定数未満となるように、前記複数の文集合を生成する

文の順序の入れ替わりが許容される文書の比較を支援することができる。
工事手順書の一例を示す図である。 第1の実施の形態における工事手順書分析装置10のハードウェア構成例を示す図である。 第1の実施の形態における工事手順書分析装置10の機能構成例を示す図である。 3つの工事手順書を入力とした場合の同一作業の組の一例を示す図である。 交叉する文の組み合わせの一例を示す図である。 第1の実施の形態における比較グラフの一例を示す図である。 第2の実施の形態における比較グラフの一例を示す図である。
以下、図面に基づいて本発明の実施の形態を説明する。本実施の形態において、工事手順書とは、図1に示すような、システムに対して目的とする変更を加えるための、一連の作業の系列データを示す文書(例えば、テキスト文書)をいう。工事手順書はその都度作業の記述が異なる。そのため、文の完全一致では差分の比較が行えない。なお、工事手順書において、文とは、一つの作業を表現する記述であり、文法上の文には必ずしも一致しない。
本実施の形態では文の類似度を定義し、類似度が高い文の組を同じ作業だとみなす、特許文献1と同じ方法を用いる。これにより、異なる記述であっても作業の差分比較が行えるようにする。但し、特許文献1の方法は順序に制約を持つ方法を用いるため、作業の順序の変化がある工事手順書には適用困難である。そこで、本実施の形態では、順序の変化を許しつつ、特許文献1で用いられた手法と同様に偶然類似した文は同一とみなされない手法を提案する。これによって、従来困難であった、作業の順序変化が多い工事手順書での作業の差分比較を実現する。
図2は、第1の実施の形態における工事手順書分析装置10のハードウェア構成例を示す図である。図2の工事手順書分析装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、インタフェース装置105、表示装置106、及び入力装置107等を有する。
工事手順書分析装置10での処理を実現するプログラムは、CD−ROM等の記録媒体101によって提供される。プログラムを記憶した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従って工事手順書分析装置10に係る機能を実現する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。表示装置106はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置107はキーボード及びマウス等で構成され、様々な操作指示を入力させるために用いられる。
図3は、第1の実施の形態における工事手順書分析装置10の機能構成例を示す図である。図3において、工事手順書分析装置10は、入力部11、同一作業特定部12、比較グラフ生成部13、及びグラフ表示部14等を有する。これら各部は、工事手順書分析装置10にインストールされた1以上のプログラムが、CPU104に実行させる処理により実現される。工事手順書分析装置10は、また、工事手順書DB15を利用する。工事手順書DB15は、例えば、補助記憶装置102、又は工事手順書分析装置10にネットワークを介して接続可能な記憶装置等を用いて実現可能である。
工事手順書DB15には、作業者が工事を実施した際に記述した工事手順書が記憶されている。
入力部11は、分析対象の工事手順書と1以上の比較対象の工事手順書との複数の工事手順書の指定、各種の設定値、及び付加情報等の入力を利用者から受け付ける。
同一作業特定部12は、入力部11からの受付に応じて、利用者によって指定された複数の工事手順書を工事手順書DB15から取得し、各工事手順書に記載された作業のうち、同一の作業が記述された箇所(文)を異なる工事手順書間で特定する。同一の作業が記述された箇所は、異なる工事手順書間で類似箇所を特定することで特定される。その結果、異なる工事手順書に含まれる文の組み合わせ(文集合)が複数生成される。
比較グラフ生成部13は、各工事手順書の同一の作業(すなわち、同一の文集合に属する文)に同一のID(以下、「作業ID」という。)を与えることで、各工事手順書を作業IDの系列(以下、「作業ID列」という。)に変換する。比較グラフ生成部13は、各工事手順書の作業ID列に基づいて、各工事手順書の文がいずれの文集合に含まれるのか(いずれの作業に対応するのか)を示すグラフを生成する。当該グラフは、同一の作業を同一ノードとし、工事手順書の作業順序に従いフローを示した作業遷移図(以下、「比較グラフ」という。)である。
グラフ表示部14は、比較グラフを表示装置106に表示する。
以下、各部について詳細に説明する。
[同一作業特定部12]
まず、同一作業特定部12の入力と出力を定義する。同一作業特定部12に対する入力は、利用者によって指定された複数の工事手順書である。これらの工事手順書のうち、i番目の工事手順書を、Xとする。Xは、Ni個の作業を示す文からなり、各作業を示す文を、それぞれ、si1,・・・,siNiとする。また、文同士が同じ作業であるかどうかを類似度として算出するために、xijを、sijから得られる特徴量の集合であるとする。ここで定義する特徴量は、sijから得られればどのようなものでも構わない。一般に用いられる特徴量としては、"文sijに含まれる全ての文字の集合"、"文sijに含まれる2文字ずつの文字の集合"、"文sijに含まれる単語の集合"等が挙げられる。
例として、sij="ケーブルを接続する"であったとする。このとき前述した特徴量の集合は、それぞれ、xij={"ケ","ー","ブ","ル","を","接","続","す","る"}、xij={"ケ","ケー","ーブ","ブル","ルを","を接","接続","続す","する","る"}、xij={"ケーブル","を","接続","する"}となる。入力となる全ての工事手順書を、T={X,X,・・・,X}とし、i番目の工事手順書の特徴量の集合の集合を、X=<xi1,xi2,・・・,xiNi>とする。但し、Iは入力に与えられた工事手順書の数を示す。
同一作業特定部12の出力は、文の位置を示す添字を(i,j)として、同じ作業を記述した文の添字を要素として持つ文集合aの集合Aである。Aは集合の集合である点に注意を要する。
図4は、3つの工事手順書を入力とした場合の同一作業の組の一例を示す図である。図4において、両矢印によって接続された文が、同一作業の組を構成する文である。したがって、図4において、Aの値は、以下の通りである。
A={
[(1,1),(2,1),(3,1)],
[(1,2),(2,2),(3,2)],
[(1,3),(2,3),(3,3)],
[(1,4),(2,4),(3,4)],
[(1,5),(2,5),(3,5)],
[(1,6),(2,6),(3,6)],
[(1,7),(2,7)],
[(1,8),(2,8),(3,7)],
[(1,9),(2,9),(3,8)],
[(1,10),(2,10),(3,9)],
[(1,11),(2,11),(3,10)],
[(1,12),(2,12),(3,11)],
[(1,13),(2,13),(3,12)],
[(1,14),(2,14),(3,13)]}
同一作業特定部12は、2つの文xij、xi'j'の類似度を、sim(xij,xi'j')と定義し、次に示すAを、同一の作業を示す文の組として獲得する。
A=argmaxΣa∈AΣ(i,j),(i',j')∈a×asim(xij,xi'j'
上式は、文の類似度sim(xij,xi'j')を定義し、同じ作業の記述だとみなされた文の類似度が最大となる組み合わせをAとすることを意味する。類似度の定義は、特定のものに限定されない。例えば、単語の一致度合いを示す以下の様な値が類似度として利用されてもよい。
sim(xij,xi'j')=|xij∩xi'j'|/|xij∪xi'j'
但し、上式に加えて、Aは何らかの制約を満たすものとする。様々な制約が考えられるが、以下では様々な制約のうち、特に実際の同一作業の特定に有効で、かつ、その制約があっても最大解Aを得る方法がある制約(1)、(2)、(3)を、解法の一般に知られた名称と共に示す。
(1)「任意の文がいずれか一つの文の組にしか紐付かない。」
制約1:任意の(i,j)に対して、|{a|a∈A、(i,j)∈a}|=1
制約1は、図4のように、或る文が他の工事手順書のいずれかの文に高々1つにだけ紐づくことを意味する。この制約を加えた問題は、各工事手順書X,・・・,Xの文のうち、類似した文の組み合わせを紐付けることから、I部グラフの重み付き最大マッチング問題となり、Kuhn−Munkres法(又はハンガリアン法)(「The Assignment Problem and the Hungarian Method」,http://www.math.harvard.edu/archive/20_spring_05/handouts/assignment_overheads.pdf)によって効率的に解が得られる。
(2)「制約1に加えて、文の組が交叉しない。」
まず、交叉と呼ばれる文の組み合わせを定義する。Aに含まれるある2つの要素ap、aqで、(i,p)と(i',p')がapに含まれ、(i,q)と(i',q')がaqに含まれているとする。このとき、p<q、かつ、q'<p'ならば、ap、aqにおける文の組(xip,xi'p')と(xiq,xi'q')は交叉している、と定義する。直感的には、図5のように、文の順序が入れ替わるように対応付けがなされることを意味する。図5では、(1,11)と(2,10)との組が、(1,10)と(2,11)との組と交叉している。すなわち、交叉とは、或る工事手順書における前の文が属する第1の文集合と、後の文が属する第2の文集合とが有る場合に、他の工事手順書における前の文が前記第2の文集合に属し、後の文が前記第1の文集合に属するような状態をいう。(2)の制約では、(1)の制約に加えて、次の制約を満たすものとする。
制約2:Aに含まれる任意のap、aqにおいて、交叉する要素が存在しないものとする。
この制約を加えた問題は、DPマッチングと呼ばれる、特許文献1等で用いられている方法で、容易に最適解を得ることが可能である。
(3)「制約1に加えて、文の組が、規定回数以上交叉しない。」
制約3:組(i,j),(i',j')がAにおいて交叉する要素の数をCross(xij,xi'j',A)とする。このとき、任意の(i,j)に対してCross(xij,xi'j',A)<θである(θは利用者により指定された所定数)。
制約3は、極端に遠い位置にある文同士の対応付けを行わないことを意味する。
工事手順書における文書の記述の違い、行数の違い、順序の違いを考慮可能な制約条件は、(1)及び(3)である。(1)は、文の順序関係に一切の制約がないために、偶然類似した文の対応付けをすることが多く、多量の文を含む工事手順書での活用には適さない。(2)の制約を満たす類似度の高い文の組み合わせの獲得方法は、特許文献1で用いられているが、文の順序関係の制約が強く、これも作業順序の入れ替わりの多い工事手順書には適さない。
したがって、本実施の形態では、工事手順書での応用に適した(3)の制約を満たす類似度の高い文の獲得方法を用いるものとし、詳細に説明する。なお、作業順序の変化に対応可能、かつ、極端に離れた位置にある記述をマッチさせない(3)の制約を用いた文の組み合わせの獲得方法は、これまでに見当たらない。
(3)の制約が採用される本実施の形態では、交叉する要素が、利用者によって指定された値θを超える文の組が獲得されないように、類似度sim(xij,xi'j')に変更を加える。xij,xi'j'が交叉するAの要素数に基づいて値を返す関数CPを次のように定義する。
CP(xij,xi'j',A)=∞ if Cross(xij,xi'j',A)>θ,else 0
すなわち、CP(xij,xi'j',A)は、Cross(xij,xi'j',A)>θであれば、∞を返し、そうでなければ、0を返す。
そこで、同一作業特定部12は、新たな類似度の定義として、
SIM(xij,xi'j',A)=sim(xij,xi'j')−CP(xij,xi'j',A)
を用いる。すなわち、同一作業特定部12は、交叉数がθ以上の文の組のスコアを最低限まで低下させる。
関数CPの値が計算できれば、Kuhn−Munkres法によって、
Σa∈AΣ(i,j),(i',j')∈a×aSIM(xij,xi'j',A)
が最大となるAは計算可能である。
上記方法により、同一作業特定部12は、制約(3)を満たす形で得られたAを出力する。
[比較グラフ生成部13]
続いて、比較グラフ生成部13について説明する。同一作業特定部12により、同一の作業を示す文の添字集合Aが得られたものとする。集合Aの各要素を、添字kを用いて、A={a,・・・,a,・・・,a}と表す。
比較グラフ生成部13は、各工事手順書の各文sijの添字(i,j)が含まれる要素の添字kをk(i,j)とした場合において、各工事手順書を、次のようなID列に変換する。
=<k(i,1),・・・,k(i,Ni)>
すなわち、k(i,j)が、作業IDであり、Yが、作業ID列である。
例として、図4で示した同一作業組では、3番目の工事手順書Xに対応するYは、Y=<1,2,3,4,5,6,8,9,10,11,12,13,14>となる。この例ではk=7に対応する文が無い。
比較グラフ生成部13は、Yの集合L={Y,・・・,Y}を用いて、次のグラフGを、比較グラフとして生成する。
G(V,E),V={1,・・・,K},E={(k(i,j),k(i,j+1))|i∈{1,・・・,I},j∈{1,・・・,Ni}}
但し、各k∈Vのノードの表示は、kに対応する文sijとする。
図6は、第1の実施の形態における比較グラフの一例を示す図である。図6の比較グラフは、{Y,Y,Y}={<1,2,3,4,5,6,7,8,9,10,11,12,13,14,15>,<1,2,3,4,5,6,7,8,9,10,11,12,13,14,15>,<1,2,3,4,5,6,8,9,10,11,12,13,14,15>}とした際の比較グラフGを示している。なお、図6において、Yの枝は実線で示されており、Yの枝は破線で示されており、Yの枝は一点鎖線で示されている。
なお、比較グラフGをどのような方法で表示するかは、本実施の形態では限定されない。比較グラフの表示方法は様々なものが考えられる。例えば、「Graphviz - Graph Visualization Software, http://www.graphviz.org/」に記載された表示方法が利用されてもよい。
上述したように、第1の実施の形態によれば、分析対象となる工事手順書と、比較対象の工事手順書との、記述された作業の比較が、作業の記述文、行数、及び作業順序の違いに関わらずに可能となる。これによって、作業の確認業務のうち、工事手順書のレビュー業務を効率化できるという効果が得られる。すなわち、文の順序の入れ替わりが許容される文書の比較を支援することができる。
また、出力される図6のような比較グラフは、入力として与えられた工事手順書のうち、記述されていない作業が跳ぶように、作業の遷移が表示される。例えば、図6の例では、入力に与えられた工事手順書のうち、1件だけ、"バックアップの実行"が記述されていないことが瞬時に分かる。比較グラフは、複数の工事手順書のうち、異なる作業を遷移又はノードの有無として示す。そのため、何らかの形式で比較グラフを表示すれば、利用者は、作業の記述漏れの確認を容易に行える。
次に、第2の実施の形態について説明する。第2の実施の形態では第1の実施の形態と異なる点について説明する。第2の実施の形態において特に言及されない点については、第1の実施の形態と同様でもよい。
第2の実施の形態において、入力部11は、更に、注意すべき作業の入力を利用者から受け付ける。すなわち、入力部11は、複数の工事手順書に加えて、例えば、評価対象の工事手順書内で注意すべき作業、例えば過去にミスが発生しシステムに悪影響を与えた作業等(以下、「要注意作業」という。)の入力を利用者から受け付ける。
要注意作業は、評価対象の工事手順書の各文の中から、利用者によって直接的に要注意作業に対応する文が選択されることで特定されてもよい。又は、工事手順書DB15に記憶されている状態の工事手順書に対して、要注意作業に対応する文に所定のマークが付与されていてもよい。この場合、図7に示されるような比較グラフが出力されてもよい。
図7は、第2の実施の形態における比較グラフの一例を示す図である。図7に示されるように、グラフ表示部14は、要注意作業に対応するノードを強調表示することで、他のノード(作業)と区別可能なように出力する。そうすることで、複数の工事手順書からの同一作業の特定に加え、作業手順の図示により、注意が必要な作業を作業中に認識し易くし、少ない確認業務で注意すべき点だけを確認可能にすることができる。
上述したように、第2の実施の形態によれば、工事手順書に従って実際に工事を行う際の、注意が必要な作業を作業者に対して示すことが可能である。
なお、上記各実施の形態は、工事手順書以外の文書に対して適用されてもよい。
なお、上記各実施の形態において、工事手順書分析装置10は、文書比較装置の一例である。同一作業特定部12は、文集合生成部の一例である。比較グラフ生成部13は、グラフ生成部の一例である。グラフ表示部14は、出力部の一例である。
以上、本発明の実施例について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
10 工事手順書分析装置
11 入力部
12 同一作業特定部
13 比較グラフ生成部
14 グラフ表示部
15 工事手順書DB
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
106 表示装置
107 入力装置
B バス

Claims (5)

  1. 第1の文書に含まれる各文と第2の文書に含まれるいずれかの文とを、文の類似度に基づいて組み合わせることで、複数の文集合を生成する文集合生成部と、
    前記各文書の文がいずれの文集合に含まれるのかを示すグラフを生成するグラフ生成部と、
    前記グラフを出力する出力部と、
    を有し、
    前記文集合生成部は、任意の文がいずれか一つの文集合にしか属さず、かつ、前記第1の文書における前の文が属する第1の文集合と後の文に属する第2の文集合とが有る場合に、前記第2の文書における前の文が前記第2の文集合に属し、後の文が前記第1の文集合に属するような文集合の数が所定数未満となるように、前記複数の文集合を生成する、
    とを特徴とする文書比較装置。
  2. 前記出力部は、指定された文が属する文集合が他の文集合と区別可能なように前記グラフを出力する、
    ことを特徴とする請求項記載の文書比較装置。
  3. 第1の文書に含まれる各文と第2の文書に含まれるいずれかの文とを、文の類似度に基づいて組み合わせることで、複数の文集合を生成する文集合生成手順と、
    前記各文書の文がいずれの文集合に含まれるのかを示すグラフを生成するグラフ生成手順と、
    前記グラフを出力する出力手順と、
    をコンピュータが実行し、
    前記文集合生成手順は、任意の文がいずれか一つの文集合にしか属さず、かつ、前記第1の文書における前の文が属する第1の文集合と後の文に属する第2の文集合とが有る場合に、前記第2の文書における前の文が前記第2の文集合に属し、後の文が前記第1の文集合に属するような文集合の数が所定数未満となるように、前記複数の文集合を生成する、
    とを特徴とする文書比較方法。
  4. 前記出力手順は、指定された文が属する文集合が他の文集合と区別可能なように前記グラフを出力する、
    ことを特徴とする請求項記載の文書比較方法。
  5. 請求項1又は2記載の各部としてコンピュータを機能させることを特徴とするプログラム。
JP2016189420A 2016-09-28 2016-09-28 文書比較装置、文書比較方法及びプログラム Active JP6514172B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016189420A JP6514172B2 (ja) 2016-09-28 2016-09-28 文書比較装置、文書比較方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016189420A JP6514172B2 (ja) 2016-09-28 2016-09-28 文書比較装置、文書比較方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2018055327A JP2018055327A (ja) 2018-04-05
JP6514172B2 true JP6514172B2 (ja) 2019-05-15

Family

ID=61834099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016189420A Active JP6514172B2 (ja) 2016-09-28 2016-09-28 文書比較装置、文書比較方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6514172B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013105321A (ja) * 2011-11-14 2013-05-30 Hitachi Ltd 文書処理装置、文書構成要素間の関係解析方法およびプログラム

Also Published As

Publication number Publication date
JP2018055327A (ja) 2018-04-05

Similar Documents

Publication Publication Date Title
US20140280833A1 (en) System and method for efficiently managing network changes
JP6937703B2 (ja) 構成変更管理装置、構成変更管理方法、及びプログラム
JP6268029B2 (ja) テストケース生成装置及びテストケース生成方法
EP3502872A1 (en) Pipeline task verification for a data processing platform
CN109614325B (zh) 一种确定控件属性的方法及装置、电子设备和存储介质
EP2814208A1 (en) Program, apparatus, and method for creating configuration requirements
CN103970061A (zh) 数据生成装置以及方法
EP4182788A1 (en) Methods for software development and operation process analytics and devices thereof
KR102505002B1 (ko) 코드 재사용 처리 방법, 장치, 전자 기기, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램
US20190286453A1 (en) System construction assisting apparatus, method, and program
JP6514172B2 (ja) 文書比較装置、文書比較方法及びプログラム
EP3608786B1 (en) Systems and methods of requirements chaining and applications thereof
US9787552B2 (en) Operation process creation program, operation process creation method, and information processing device
Yu et al. Dynamic slicing of Petri nets based on structural dependency graph and its application in system analysis
JP2018120256A (ja) 設定操作入力支援装置、設定操作入力支援システム
US20210142237A1 (en) Management system
JP2005085182A (ja) 試験支援システム
JP6665637B2 (ja) プログラム作成支援システム
KR101585926B1 (ko) 운영체제의 자동 테스트 생성 장치 및 방법
CN112948244B (zh) 用于工业互联网信息模型测试的方法、装置和设备
JP5799005B2 (ja) 設備保全管理システム
US11880699B2 (en) Platform to control one or more systems and explore data across one or more systems
JP2019016186A (ja) 表示装置
JP5243474B2 (ja) インフラミドルウェアのパラメータ値改善点提示システム
CN115714712A (zh) 用于网络运维的方法、计算设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190411

R150 Certificate of patent or registration of utility model

Ref document number: 6514172

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150