JP6514172B2 - 文書比較装置、文書比較方法及びプログラム - Google Patents
文書比較装置、文書比較方法及びプログラム Download PDFInfo
- Publication number
- JP6514172B2 JP6514172B2 JP2016189420A JP2016189420A JP6514172B2 JP 6514172 B2 JP6514172 B2 JP 6514172B2 JP 2016189420 A JP2016189420 A JP 2016189420A JP 2016189420 A JP2016189420 A JP 2016189420A JP 6514172 B2 JP6514172 B2 JP 6514172B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- work
- document
- construction procedure
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(1)手順書のレビュー:作成した工事手順書において、作業の記述漏れと、パラメータの間違いが無いかを確認する業務
(2)要注意作業の確認:工事手順書の作業のうち、過去にミスの発生したことのある作業を把握する業務
これらの確認業務は、過去の同一の工事における工事手順書との比較で行われる。例えば、手順書のレビューでは、過去の工事手順書との違いを確認し、記述し損ねた作業がないかどうかを確かめる。また、過去にミスが起こったことのある作業があれば、そのときの工事手順書と比較して、ミスのあった作業を把握することが重要である。
まず、同一作業特定部12の入力と出力を定義する。同一作業特定部12に対する入力は、利用者によって指定された複数の工事手順書である。これらの工事手順書のうち、i番目の工事手順書を、Xiとする。Xiは、Ni個の作業を示す文からなり、各作業を示す文を、それぞれ、si1,・・・,siNiとする。また、文同士が同じ作業であるかどうかを類似度として算出するために、xijを、sijから得られる特徴量の集合であるとする。ここで定義する特徴量は、sijから得られればどのようなものでも構わない。一般に用いられる特徴量としては、"文sijに含まれる全ての文字の集合"、"文sijに含まれる2文字ずつの文字の集合"、"文sijに含まれる単語の集合"等が挙げられる。
A={
[(1,1),(2,1),(3,1)],
[(1,2),(2,2),(3,2)],
[(1,3),(2,3),(3,3)],
[(1,4),(2,4),(3,4)],
[(1,5),(2,5),(3,5)],
[(1,6),(2,6),(3,6)],
[(1,7),(2,7)],
[(1,8),(2,8),(3,7)],
[(1,9),(2,9),(3,8)],
[(1,10),(2,10),(3,9)],
[(1,11),(2,11),(3,10)],
[(1,12),(2,12),(3,11)],
[(1,13),(2,13),(3,12)],
[(1,14),(2,14),(3,13)]}
同一作業特定部12は、2つの文xij、xi'j'の類似度を、sim(xij,xi'j')と定義し、次に示すAを、同一の作業を示す文の組として獲得する。
A=argmaxAΣa∈AΣ(i,j),(i',j')∈a×asim(xij,xi'j')
上式は、文の類似度sim(xij,xi'j')を定義し、同じ作業の記述だとみなされた文の類似度が最大となる組み合わせをAとすることを意味する。類似度の定義は、特定のものに限定されない。例えば、単語の一致度合いを示す以下の様な値が類似度として利用されてもよい。
sim(xij,xi'j')=|xij∩xi'j'|/|xij∪xi'j'|
但し、上式に加えて、Aは何らかの制約を満たすものとする。様々な制約が考えられるが、以下では様々な制約のうち、特に実際の同一作業の特定に有効で、かつ、その制約があっても最大解Aを得る方法がある制約(1)、(2)、(3)を、解法の一般に知られた名称と共に示す。
制約1:任意の(i,j)に対して、|{a|a∈A、(i,j)∈a}|=1
制約1は、図4のように、或る文が他の工事手順書のいずれかの文に高々1つにだけ紐づくことを意味する。この制約を加えた問題は、各工事手順書X1,・・・,XIの文のうち、類似した文の組み合わせを紐付けることから、I部グラフの重み付き最大マッチング問題となり、Kuhn−Munkres法(又はハンガリアン法)(「The Assignment Problem and the Hungarian Method」,http://www.math.harvard.edu/archive/20_spring_05/handouts/assignment_overheads.pdf)によって効率的に解が得られる。
まず、交叉と呼ばれる文の組み合わせを定義する。Aに含まれるある2つの要素ap、aqで、(i,p)と(i',p')がapに含まれ、(i,q)と(i',q')がaqに含まれているとする。このとき、p<q、かつ、q'<p'ならば、ap、aqにおける文の組(xip,xi'p')と(xiq,xi'q')は交叉している、と定義する。直感的には、図5のように、文の順序が入れ替わるように対応付けがなされることを意味する。図5では、(1,11)と(2,10)との組が、(1,10)と(2,11)との組と交叉している。すなわち、交叉とは、或る工事手順書における前の文が属する第1の文集合と、後の文が属する第2の文集合とが有る場合に、他の工事手順書における前の文が前記第2の文集合に属し、後の文が前記第1の文集合に属するような状態をいう。(2)の制約では、(1)の制約に加えて、次の制約を満たすものとする。
制約3:組(i,j),(i',j')がAにおいて交叉する要素の数をCross(xij,xi'j',A)とする。このとき、任意の(i,j)に対してCross(xij,xi'j',A)<θである(θは利用者により指定された所定数)。
CP(xij,xi'j',A)=∞ if Cross(xij,xi'j',A)>θ,else 0
すなわち、CP(xij,xi'j',A)は、Cross(xij,xi'j',A)>θであれば、∞を返し、そうでなければ、0を返す。
SIM(xij,xi'j',A)=sim(xij,xi'j')−CP(xij,xi'j',A)
を用いる。すなわち、同一作業特定部12は、交叉数がθ以上の文の組のスコアを最低限まで低下させる。
Σa∈AΣ(i,j),(i',j')∈a×aSIM(xij,xi'j',A)
が最大となるAは計算可能である。
続いて、比較グラフ生成部13について説明する。同一作業特定部12により、同一の作業を示す文の添字集合Aが得られたものとする。集合Aの各要素を、添字kを用いて、A={a1,・・・,ak,・・・,aK}と表す。
Yi=<k(i,1),・・・,k(i,Ni)>
すなわち、k(i,j)が、作業IDであり、Yiが、作業ID列である。
G(V,E),V={1,・・・,K},E={(k(i,j),k(i,j+1))|i∈{1,・・・,I},j∈{1,・・・,Ni}}
但し、各k∈Vのノードの表示は、kに対応する文sijとする。
11 入力部
12 同一作業特定部
13 比較グラフ生成部
14 グラフ表示部
15 工事手順書DB
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
106 表示装置
107 入力装置
B バス
Claims (5)
- 第1の文書に含まれる各文と第2の文書に含まれるいずれかの文とを、文の類似度に基づいて組み合わせることで、複数の文集合を生成する文集合生成部と、
前記各文書の文がいずれの文集合に含まれるのかを示すグラフを生成するグラフ生成部と、
前記グラフを出力する出力部と、
を有し、
前記文集合生成部は、任意の文がいずれか一つの文集合にしか属さず、かつ、前記第1の文書における前の文が属する第1の文集合と後の文に属する第2の文集合とが有る場合に、前記第2の文書における前の文が前記第2の文集合に属し、後の文が前記第1の文集合に属するような文集合の数が所定数未満となるように、前記複数の文集合を生成する、
ことを特徴とする文書比較装置。 - 前記出力部は、指定された文が属する文集合が他の文集合と区別可能なように前記グラフを出力する、
ことを特徴とする請求項1記載の文書比較装置。 - 第1の文書に含まれる各文と第2の文書に含まれるいずれかの文とを、文の類似度に基づいて組み合わせることで、複数の文集合を生成する文集合生成手順と、
前記各文書の文がいずれの文集合に含まれるのかを示すグラフを生成するグラフ生成手順と、
前記グラフを出力する出力手順と、
をコンピュータが実行し、
前記文集合生成手順は、任意の文がいずれか一つの文集合にしか属さず、かつ、前記第1の文書における前の文が属する第1の文集合と後の文に属する第2の文集合とが有る場合に、前記第2の文書における前の文が前記第2の文集合に属し、後の文が前記第1の文集合に属するような文集合の数が所定数未満となるように、前記複数の文集合を生成する、
ことを特徴とする文書比較方法。 - 前記出力手順は、指定された文が属する文集合が他の文集合と区別可能なように前記グラフを出力する、
ことを特徴とする請求項3記載の文書比較方法。 - 請求項1又は2記載の各部としてコンピュータを機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016189420A JP6514172B2 (ja) | 2016-09-28 | 2016-09-28 | 文書比較装置、文書比較方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016189420A JP6514172B2 (ja) | 2016-09-28 | 2016-09-28 | 文書比較装置、文書比較方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018055327A JP2018055327A (ja) | 2018-04-05 |
JP6514172B2 true JP6514172B2 (ja) | 2019-05-15 |
Family
ID=61834099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016189420A Active JP6514172B2 (ja) | 2016-09-28 | 2016-09-28 | 文書比較装置、文書比較方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6514172B2 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013105321A (ja) * | 2011-11-14 | 2013-05-30 | Hitachi Ltd | 文書処理装置、文書構成要素間の関係解析方法およびプログラム |
-
2016
- 2016-09-28 JP JP2016189420A patent/JP6514172B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018055327A (ja) | 2018-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20140280833A1 (en) | System and method for efficiently managing network changes | |
JP6937703B2 (ja) | 構成変更管理装置、構成変更管理方法、及びプログラム | |
JP6268029B2 (ja) | テストケース生成装置及びテストケース生成方法 | |
EP3502872A1 (en) | Pipeline task verification for a data processing platform | |
CN109614325B (zh) | 一种确定控件属性的方法及装置、电子设备和存储介质 | |
EP2814208A1 (en) | Program, apparatus, and method for creating configuration requirements | |
CN103970061A (zh) | 数据生成装置以及方法 | |
EP4182788A1 (en) | Methods for software development and operation process analytics and devices thereof | |
KR102505002B1 (ko) | 코드 재사용 처리 방법, 장치, 전자 기기, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램 | |
US20190286453A1 (en) | System construction assisting apparatus, method, and program | |
JP6514172B2 (ja) | 文書比較装置、文書比較方法及びプログラム | |
EP3608786B1 (en) | Systems and methods of requirements chaining and applications thereof | |
US9787552B2 (en) | Operation process creation program, operation process creation method, and information processing device | |
Yu et al. | Dynamic slicing of Petri nets based on structural dependency graph and its application in system analysis | |
JP2018120256A (ja) | 設定操作入力支援装置、設定操作入力支援システム | |
US20210142237A1 (en) | Management system | |
JP2005085182A (ja) | 試験支援システム | |
JP6665637B2 (ja) | プログラム作成支援システム | |
KR101585926B1 (ko) | 운영체제의 자동 테스트 생성 장치 및 방법 | |
CN112948244B (zh) | 用于工业互联网信息模型测试的方法、装置和设备 | |
JP5799005B2 (ja) | 設備保全管理システム | |
US11880699B2 (en) | Platform to control one or more systems and explore data across one or more systems | |
JP2019016186A (ja) | 表示装置 | |
JP5243474B2 (ja) | インフラミドルウェアのパラメータ値改善点提示システム | |
CN115714712A (zh) | 用于网络运维的方法、计算设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190205 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190409 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190411 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6514172 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |