JP5818706B2 - 仕様書の検査方法、プログラム及びシステム - Google Patents
仕様書の検査方法、プログラム及びシステム Download PDFInfo
- Publication number
- JP5818706B2 JP5818706B2 JP2012016377A JP2012016377A JP5818706B2 JP 5818706 B2 JP5818706 B2 JP 5818706B2 JP 2012016377 A JP2012016377 A JP 2012016377A JP 2012016377 A JP2012016377 A JP 2012016377A JP 5818706 B2 JP5818706 B2 JP 5818706B2
- Authority
- JP
- Japan
- Prior art keywords
- rule
- candidate
- rules
- deriving
- application table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Debugging And Monitoring (AREA)
- Stored Programmes (AREA)
- User Interface Of Digital Computer (AREA)
Description
(1) 仕様書情報抽出ルールと仕様書群を元に、抽出ルールの修正優先順位を算出する処理。
(2) 抽出ルールの修正優先順位、仕様書群、仕様書情報抽出ルールから、抽出ルール修正候補を算出する処理。
(3) 抽出ルール修正候補の提示、及びユーザーによる確認・入力作業に必要なユーザーインターフェースを提供する処理。
・仕様書探索条件
− Microsoft(R) Word(R), Excel(R)など,ファイルの種類やファイル内の要素の種類にあわせて探索条件を記述する
型(例えば、Worksheet(ワークシート)、Cell(セル)、Shape(シェイプ)、Comment(コメント)など)
− 型に対応する要素の文字列(例えば、ファイル名、ワークシート名、セル文字列、シェイプ文字列など)にマッチする文字列パターンを記述する。文字列パターンは、正規表現などで記述する。
文字列パターン(例えば、“^画面レイアウト仕様”, “画面操作概要$”)
型・文字列パターンを連結し,取得したい仕様書情報までの探索方向を記述する.
− 探索条件(例えば、direction=RIGHT, traversal type=BORDER(境界線を基準に探索), 座標指定)
・Requirement level(要求レベル)
− 仕様書においてどの程度必須な情報かを記述する
例えば、must, should, may...
− Cardinality(濃度)
仕様書内の出現回数をcardinalityとして記述する(例えば、 0...1, 1, 0...*, 1...*)
H(Rn) = -PRnlog PRn - (1-PRn)log(1-PRn)
ここで、対数の底は2であるとする。また、PRnは、あるルールRnが仕様書にマッチする確率である。確率PRnの算出には、上述のように、過去のプロジェクトにおいて利用した仕様書群や、一般的に用いられるランダムなファイル群などの統計データを用いる。もし統計データがない場合は、PRn = 1/2とおく。
I(Rn,Rm) = H(Rn) + H(Rm) - H(Rn,Rm)
ここで、H(Rn)及びH(Rm)は、ステップ914に関連して説明した平均情報量である。
結合エントロピーの式を具体的に書き下すと、以下のとおりである。
-P(Rnがマッチ∧Rmがマッチ)logP(Rnがマッチ∧Rmがマッチ)
-P(Rnがマッチ∧Rmがマッチせず)logP(Rnがマッチ∧Rmがマッチせず)
-P(Rnがマッチせず∧Rmがマッチ)logP(Rnがマッチせず∧Rmがマッチ)
-P(Rnがマッチせず∧Rmがマッチせず)logP(Rnがマッチせず∧Rmがマッチせず)
この式で、NRnは、Rnのマッチしない仕様書の数であり、優先順位指数が高ければ高いほど、修正順位は高い。
例えば、PRn = 1/2、PRm = 1/2の場合、
H(Rn) = -(1-1/2)log(1-1/2) - (1/2)log(1/2) = 1
H(Rm) = -(1-1/2)log(1-1/2) - (1/2)log(1/2) = 1
さらに、Rn、RmのRequirement Levelはmust(α=1)、Rnの子ノードはRmのみとする。
P(Rnがマッチ∧Rmがマッチ) = 1/4
P(Rnがマッチ∧Rmがマッチせず) = 1/4
P(Rnがマッチせず∧Rmがマッチ) = P(Rnがマッチせず)*P(Rmがマッチ|Rnがマッチせず) = 0
P(Rnがマッチせず∧Rmがマッチせず) = P(Rnがマッチせず)*P(Rmがマッチせず|Rnがマッチせず) = 1/2
I(Rn,Rm) = 1+1-3/2 = 1/2
α(Rn) * H(Rn) + α(Rm) * I(Rn,Rm) * H(Rm)
= 1*1 + 1*(1/2)*1 = 1.5
例えば、PRn = 1/2、PRm = 1/2の場合、
H(Rn) = -(1-1/2)log(1-1/2) - (1/2)log(1/2) = 1
H(Rm) = -(1-1/2)log(1-1/2) - (1/2)log(1/2) = 1
P(Rnがマッチ∧Rmがマッチ) = 1/4
P(Rnがマッチ∧Rmがマッチせず) = 1/4
P(Rnがマッチせず∧Rmがマッチ) = P(Rnがマッチせず)*P(Rmがマッチ|Rnがマッチせず) = 1/4
P(Rnがマッチせず∧Rmがマッチせず) = P(Rnがマッチせず)*P(Rmがマッチせず|Rnがマッチせず) = 1/4
I(Rn,Rm) = 1+1-2 = 0
α(Rn) * H(Rn) + α(Rm) * I(Rn,Rm) * H(Rm)
= 1*1 + 1*0*1 = 1
106・・・RAM
108・・・ハードディスク・ドライブ
114・・・ディスプレイ
204・・・仕様書群
206・・・ルール木
208・・・ルール適用表作成ルーチン
210・・・ルール適用表
212・・・ルール木探索ルーチン
214・・・統計データ前処理ルーチン
216・・・優先順位指数導出ルーチン
218・・・ルール修正ルーチン
Claims (9)
- 記憶手段をもち、検査すべき仕様書が、該記憶手段にコンピュータ可読な形式で保存され、さらに検査を行うためのルールをグラフ構造で用意され該記憶手段に保存されているコンピュータ・システムにおいて、該コンピュータ・システムにおける処理により、仕様書を検査する方法であって、
前記仕様書の要素が前記ルールが適用対象であるかどうかのルール適用表を作成するステップと、
前記ルールのグラフ構造を探索することにより、前記グラフ構造の各ノードのルールで、当該ルールを前記仕様書が満たすかどうかの平均情報量を導出するステップと、
前記ルールのグラフ構造を深さ優先で探索しつつ、各ノードのルールで、前記ルール適用表から、前記平均情報量を用いて、優先順位指数を導出するステップと、
前記優先順位指数の値に従って修正候補のルールを表示するステップを有する、
仕様書検査方法。 - 前記優先順位指数を導出するステップが、前記ルール適用表において当該ルールの欄からマッチしない仕様書の要素の数をカウントするステップと、当該ルールの子孫ルールを探索しつつ、当該子孫ルールについて、当該ルールと当該子孫ルールの相互情報量を導出するステップと、前記マッチしない仕様書の要素の数と前記相互情報量とを用いて前記優先順位指数を導出するステップを有する、請求項1に記載の方法。
- 前記各ルールの制約を包含する制約を持つ代替可能な候補ルールを作成するステップと、
前記候補ルールを前記仕様書に適用して、
前記候補ルール及びその子ルールに対してルール適用表を作成するステップと、
前記候補ルールのうち,新たに該当するようになった仕様書の要素が存在するかどうか判断し、
もし存在するなら、前記候補ルールのオブジェクトツリーの数に従って、前記候補ルールを新しいルール適応表に追加するステップをさらに有する、請求項1に記載の方法。 - 記憶手段をもち、検査すべき仕様書が、該記憶手段にコンピュータ可読な形式で保存され、さらに検査を行うためのルールをグラフ構造で用意され該記憶手段に保存されているコンピュータ・システムにおいて、該コンピュータ・システムにおける処理により、仕様書を検査するプログラムであって、
前記コンピュータ・システムに、
前記仕様書の要素が前記ルールが適用対象であるかどうかのルール適用表を作成するステップと、
前記ルールのグラフ構造を探索することにより、前記グラフ構造の各ノードのルールで、当該ルールを前記仕様書が満たすかどうかの平均情報量を導出するステップと、
前記ルールのグラフ構造を深さ優先で探索しつつ、各ノードのルールで、前記ルール適用表から、前記平均情報量を用いて、優先順位指数を導出するステップと、
前記優先順位指数の値に従って修正候補のルールを表示するステップを実行させる、
仕様書検査プログラム。 - 前記優先順位指数を導出するステップが、前記ルール適用表において当該ルールの欄からマッチしない仕様書の要素の数をカウントするステップと、当該ルールの子孫ルールを探索しつつ、当該子孫ルールについて、当該ルールと当該子孫ルールの相互情報量を導出するステップと、前記マッチしない仕様書の要素の数と前記相互情報量とを用いて前記優先順位指数を導出するステップを有する、請求項4に記載のプログラム。
- 前記コンピュータ・システムに、
前記各ルールの制約を包含する制約を持つ代替可能な候補ルールを作成するステップと、
前記候補ルールを前記仕様書に適用して、
前記候補ルール及びその子ルールに対してルール適用表を作成するステップと、
前記候補ルールのうち,新たに該当するようになった仕様書の要素が存在するかどうか判断し、
もし存在するなら、前記候補ルールのオブジェクトツリーの数に従って、前記候補ルールを新しいルール適応表に追加するステップをさらに実行させる、請求項4に記載のプログラム。 - コンピュータ・システムにおける処理により、仕様書を検査するシステムであって、
記憶手段と、
前記記憶手段にコンピュータ可読な形式で保存された、検査すべき仕様書と、
前記記憶手段にコンピュータ可読な形式で保存された、検査を行うためのルールをグラフ構造のデータと、
前記仕様書の要素が前記ルールが適用対象であるかどうかのルール適用表を作成する手段と、
前記ルールのグラフ構造を探索することにより、前記グラフ構造の各ノードのルールで、当該ルールを前記仕様書が満たすかどうかの平均情報量を導出する手段と、
前記ルールのグラフ構造を深さ優先で探索しつつ、各ノードのルールで、前記ルール適用表から、前記平均情報量を用いて、優先順位指数を導出する手段と、
前記優先順位指数の値に従って修正候補のルールを表示する手段を有する、
仕様書検査システム。 - 前記優先順位指数を導出する手段が、前記ルール適用表において当該ルールの欄からマッチしない仕様書の要素の数をカウントする手段と、当該ルールの子孫ルールを探索しつつ、当該子孫ルールについて、当該ルールと当該子孫ルールの相互情報量を導出する手段と、前記マッチしない仕様書の要素の数と前記相互情報量とを用いて前記優先順位指数を導出する手段を有する、請求項7に記載のシステム。
- 前記各ルールの制約を包含する制約を持つ代替可能な候補ルールを作成する手段と、
前記候補ルールを前記仕様書に適用して、
前記候補ルール及びその子ルールに対してルール適用表を作成する手段と、
前記候補ルールのうち,新たに該当するようになった仕様書の要素が存在するかどうか判断し、
もし存在するなら、前記候補ルールのオブジェクトツリーの数に従って、前記候補ルールを新しいルール適応表に追加する手段をさらに有する、
請求項7に記載のシステム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012016377A JP5818706B2 (ja) | 2012-01-30 | 2012-01-30 | 仕様書の検査方法、プログラム及びシステム |
US13/751,187 US8914378B2 (en) | 2012-01-30 | 2013-01-28 | Specification document check method, program, and system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012016377A JP5818706B2 (ja) | 2012-01-30 | 2012-01-30 | 仕様書の検査方法、プログラム及びシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013156811A JP2013156811A (ja) | 2013-08-15 |
JP5818706B2 true JP5818706B2 (ja) | 2015-11-18 |
Family
ID=48871205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012016377A Expired - Fee Related JP5818706B2 (ja) | 2012-01-30 | 2012-01-30 | 仕様書の検査方法、プログラム及びシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8914378B2 (ja) |
JP (1) | JP5818706B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9715625B2 (en) | 2012-01-27 | 2017-07-25 | Recommind, Inc. | Hierarchical information extraction using document segmentation and optical character recognition correction |
US9483477B2 (en) * | 2015-01-19 | 2016-11-01 | Sas Institute Inc. | Automated data intake system |
US10956401B2 (en) * | 2017-11-28 | 2021-03-23 | International Business Machines Corporation | Checking a technical document of a software program product |
US11048762B2 (en) | 2018-03-16 | 2021-06-29 | Open Text Holdings, Inc. | User-defined automated document feature modeling, extraction and optimization |
US10762142B2 (en) * | 2018-03-16 | 2020-09-01 | Open Text Holdings, Inc. | User-defined automated document feature extraction and optimization |
US11610277B2 (en) | 2019-01-25 | 2023-03-21 | Open Text Holdings, Inc. | Seamless electronic discovery system with an enterprise data portal |
WO2020252614A1 (en) * | 2019-06-17 | 2020-12-24 | Beijing Voyager Technology Co., Ltd. | Systems and methods for data processing |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1894151A2 (en) * | 2005-06-20 | 2008-03-05 | Future Route Limited | Analytical system for discovery and generation of rules to predict and detect anomalies in data and financial fraud |
WO2007002468A2 (en) * | 2005-06-23 | 2007-01-04 | 1Stworks Corporation | Modeling for enumerative encoding |
JP4945383B2 (ja) | 2007-09-07 | 2012-06-06 | 株式会社日立ハイテクノロジーズ | 仕様書内容検査方法および仕様書内容検査システム |
US9411864B2 (en) * | 2008-08-26 | 2016-08-09 | Zeewise, Inc. | Systems and methods for collection and consolidation of heterogeneous remote business data using dynamic data handling |
JP2010118050A (ja) | 2008-10-17 | 2010-05-27 | Toyohashi Univ Of Technology | 特許文献自動検索システムおよび特許文献自動検索方法 |
US8849725B2 (en) * | 2009-08-10 | 2014-09-30 | Yahoo! Inc. | Automatic classification of segmented portions of web pages |
-
2012
- 2012-01-30 JP JP2012016377A patent/JP5818706B2/ja not_active Expired - Fee Related
-
2013
- 2013-01-28 US US13/751,187 patent/US8914378B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20130198201A1 (en) | 2013-08-01 |
US8914378B2 (en) | 2014-12-16 |
JP2013156811A (ja) | 2013-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5818706B2 (ja) | 仕様書の検査方法、プログラム及びシステム | |
Zhang et al. | Automated information transformation for automated regulatory compliance checking in construction | |
US10210249B2 (en) | Method and system of text synthesis based on extracted information in the form of an RDF graph making use of templates | |
JP4767694B2 (ja) | 不正ハイパーリンク検出装置及びその方法 | |
Nguyen et al. | Auto-locating and fix-propagating for HTML validation errors to PHP server-side code | |
Shokripour et al. | Automatic bug assignment using information extraction methods | |
Thakur et al. | Automatic generation of sequence diagram from use case specification | |
Reder et al. | Model/analyzer: a tool for detecting, visualizing and fixing design errors in UML | |
US9336207B2 (en) | Measuring linguistic markers and linguistic noise of a machine-human translation supply chain | |
Mariani et al. | Semantic matching of gui events for test reuse: are we there yet? | |
Nguyen et al. | Rule-based extraction of goal-use case models from text | |
CN113987199B (zh) | 一种规范自动解译的bim智能审图方法、系统和介质 | |
Zhong et al. | Inferring specifications for resources from natural language API documentation | |
Bacchelli et al. | Benchmarking lightweight techniques to link e-mails and source code | |
US20090204889A1 (en) | Adaptive sampling of web pages for extraction | |
Zhang et al. | Automatically reproducing android bug reports using natural language processing and reinforcement learning | |
Zhang et al. | An Accurate Identifier Renaming Prediction and Suggestion Approach | |
Carvalho et al. | DMOSS: Open source software documentation assessment | |
Alhindawi et al. | A Topic Modeling Based Solution for Confirming Software Documentation Quality | |
Ferrara et al. | Design of automatically adaptable web wrappers | |
Berta et al. | Employing issues and commits for in-code sentence based use case identification and remodularization | |
Liu et al. | CrawLabel: computing natural-language labels for UI test cases | |
CN107544906A (zh) | 一种基于内容非敏感性DOM骨架等价判定的Web自动化测试方法 | |
Both et al. | Quality assurance of a german covid-19 question answering systems using component-based microbenchmarking | |
Alabbas et al. | Online multilingual plagiarism detection system using multi search engines |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140808 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150908 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150929 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5818706 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |