CN105718256A - 用于通过本体模型的比较进行一致性检查的方法和装置 - Google Patents

用于通过本体模型的比较进行一致性检查的方法和装置 Download PDF

Info

Publication number
CN105718256A
CN105718256A CN201510951660.2A CN201510951660A CN105718256A CN 105718256 A CN105718256 A CN 105718256A CN 201510951660 A CN201510951660 A CN 201510951660A CN 105718256 A CN105718256 A CN 105718256A
Authority
CN
China
Prior art keywords
term
phrase
context
classification
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201510951660.2A
Other languages
English (en)
Inventor
D.拉吉帕塔克
R.塞图
P.M.珀拉南达姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GM Global Technology Operations LLC
Original Assignee
GM Global Technology Operations LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GM Global Technology Operations LLC filed Critical GM Global Technology Operations LLC
Publication of CN105718256A publication Critical patent/CN105718256A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/10Requirements analysis; Specification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了用于通过本体模型的比较进行一致性检查的方法和装置。一种从需求文档和软件产生本体模型并且使用本体模型在需求文档与软件代码之间执行一致性检查的方法。识别从数据库获得的多个需求文档中的术语。处理器为每个术语分配词性标签。词性标签指示需求文档中的每个术语的语法使用。处理器基于词性标签来将每个术语分类。分类识别每个术语是零件、症状、动作、事件还是故障模式以构建本体。处理器根据本体来构建基于本体的一致性引擎。一致性检查通过在从两个上下文文档提取的本体之间应用基于本体的一致性引擎来执行。识别上下文文档之间的不一致术语。校正具有不一致术语的上下文文档中的至少一个。

Description

用于通过本体模型的比较进行一致性检查的方法和装置
技术领域
实施例一般涉及根据使用由需求文档和软件代码构成的本体模型的需求文档和软件代码一致性检查。
背景技术
在系统开发过程中,需求文档提供关于软件必须为系统的成功运行提供的功能性的必要信息。需求通常是以流畅的英语语言捕获,并且所得的需求文档遍布数百页。多个功能需求可能具有一些重叠的功能性以及子功能性。因此,类似功能中的不一致可能导致软件中的错误,从而导致或者产生故障。通常,主题专家SME检阅需求文档以识别不一致性和正确性问题,并且将它们纠正以改进需求文档以及软件代码的一致性。此外,当在具有特定实体(例如,车辆)的领域中观察到故障时,也可以将该故障的根本原因追溯到安装在车辆中的模块中执行的其需求文档或软件。给定与需求相关的需求文档的长度和软件算法的数量,手动地链接思维模型中的适当需求的任务是重要、耗时且容易出错的操作。
发明内容
实施例的优点在于识别需求文档之间以及需求与软件代码之间的不一致,使得能够实现不同的子系统之间的故障可追溯性的。本发明还促进追溯通过车辆观察到的关于安装在作为车辆组件的一部分的模块中的其需求文档或软件的故障。本文描述的实施例使用从需求文档、软件代码以及从在用于识别不一致的领域中观察到故障时收集到的数据提取的本体的比较。本文描述的实施例可以处理从各个异构源获得的数据的质量数量以及确定需求文档水平和软件代码水平的根本原因,这通过最小化保修成本改进产品质量。
实施例预期一种在需求文档和软件代码之间应用一致性检查的方法。识别从数据库获得的多个需求文档中的术语。处理器为每个术语分配一个词性标签。词性标签指示需求文档中的每个术语的语法使用。处理器基于词性标签来将每个术语分类。分类识别每个术语是零件术语、症状术语、动作术语、事件术语还是故障模式术语。处理器根据所分类的术语来构建基于本体的一致性引擎。一致性检查通过在从两个上下文文档提取的本体之间应用基于本体的一致性引擎来执行。识别上下文文档之间的不一致术语。校正具有不一致术语的上下文文档中的至少一个。
本发明包括以下方案:
1.一种使用构建的本体模型在需求文档和软件代码之间执行一致性检查的方法,包括以下步骤:
识别从数据库获得的多个需求文档中的术语;
由处理器为每个术语分配词性标签,词性标签指示需求文档中的每个术语的语法使用;
由处理器基于词性标签来将每个术语分类,分类识别每个术语是零件术语、症状术语、动作术语、事件术语还是故障模式术语;
由处理器根据分类的术语来构建基于本体的一致性引擎;
通过在从两个上下文文档提取的本体之间应用基于本体的一致性引擎来执行一致性检查;
识别上下文文档之间的不一致术语;
校正具有不一致术语的上下文文档中的至少一个。
2.如方案1所述的方法,其进一步包括以下步骤:
响应于将词性标签分配给每个术语,识别每个术语是否是短语的一部分;以及
将所述短语分组为具有相同的术语数量的n元语法。
3.如方案2所述的方法,其进一步包括以下步骤:
基于POS标签来识别短语的开始和结束位置,用于确定短语的逐字长度。
4.如方案3所述的方法,其进一步包括以下步骤:根据逐字长度确定公共短语。
5.如方案3所述的方法,其进一步包括以下步骤:响应于确定两个相应短语包括公共词性标签,估计用于确定相关分类的短语的字典式交互信息。
6.如方案3所述的方法,其中用于第一短语和第二短语的字典式交互信息由以下公式确定:
7.如方案6所述的方法,其中将与第一短语相关的LMI概率和与第二短语相关的LMI概率相比较,并且其中将与具有较高概率的相应LMI相关的分类分配给第一短语和第二短语。
8.如方案7所述的方法,其中通过捕获其中指定特定短语的上下文使用朴素贝叶斯网模型来确定上下文概率,其中使用LMI概率和朴素贝叶斯网模型来分配所述分类。
9.如方案1所述的方法,其中两个上下文文档之间的一致性检查包括一个第一需求文档和一个第二需求文档。
10.如方案1所述的方法,其中两个上下文文档之间的一致性检查包括第一软件代码和第二软件代码。
11.如方案1所述的方法,其中两个上下文文档之间的一致性检查包括需求文档和软件代码。
12.如方案1所述的方法,其中两个上下文文档之间的一致性检查包括一个第一需求文档和第二需求文档。
13.如方案1所述的方法,其中在第一软件代码与第二软件代码之间执行故障可追溯性。
14.如方案1所述的方法,其中产生关于第一软件代码和第二软件代码的本体的实例,其中将相应本体实例相比较以用于识别第一软件代码与第二软件代码之间的不一致。
15.如方案1所述的方法,其中在第一软件代码与需求文档之间执行故障可追溯性。
16.如方案1所述的方法,其中通过发现第一组概念术语与第二组概念术语之间的类似性来确定一致性检查,其中使用以下公式来确定类似性:
其中P(c)是看见概念c的实例的概率,以及
其中如果大于第一预定阈值,则确定第一和第二组概念彼此一致。
17.如方案15所述的方法,其中当使用词的多个继承时通过发现第一组概念术语与第二组概念术语之间的类似性来确定一致性检查,其中使用以下公式来确定所述类似性:
其中P(c)是看见概念c的实例的概率,
;以及
其中指示用于词w的可能意义组,
其中如果大于第二预定阈值,则确定第一和第二组概念彼此一致。
18.如方案16所述的方法,其中第一预定阈值大于第二预定阈值。
附图说明
图1是一般流程一致性检测需求技术的方框图。
图2是需求链接技术的整体方法的方框图。
图3是用于识别关键n元语法的流程图。
图4是使用关键N元语法的示例性POS标签过程。
图5是用于POS标签的示例性概率估计的流程图。
图6是用于将概率与上下文信息相关的流程图。
图7示出与试验数据合作使用的训练表的使用。
图8示出示例性的基于本体的不同子系统之间的一致性检查。
图9示出用于从软件开发本体的技术的流程图。
图10示出可以用来捕获Java代码(例如,软件)的关键组件的域特定本体的实例。
图11示出图10中所示的本体的实例。
具体实施方式
图1示出基于本体的一致性引擎的一般流程的方框图10。虽然本文描述的实施例是基于车辆的系统,但是应理解,系统可以应用于各种其他系统,包括飞机或其他基于非汽车的系统。基于本体的一致性引擎使用一个或多个处理器、存储器(诸如存储器存储设备、数据库)以及用于输出来自一致性检查的结果的输出设备。此外,处理器或者另一个处理单元可以执行具有不一致术语的上下文文档的自主校正。在方框11中,获得包括多个需求的需求文档。从需求文档选择相应需求。需求是提供与零件、系统或软件的功能性和操作需求有关的细节的关于零件、系统或软件的描述。
在方框12中,在需求中删除停止词。在执行数据的自然语言处理时,停止词在数据中增加不必要的噪音。停止词由以下各项构成但不限于此:“一”、“一个”、“该”、“谁”、“www”、“因为”和“变成”,这些被认为是非描述性的。停止词列表可以存储在存储器13中,诸如服务器的存储器、数据库、比较数据库或者另一个相应的数据库或存储器。去除从存储器13获得的停止词列表中所识别出的作为需求中提取的信息的一部分的停止词。维持是关键术语的一部分的停止词,并且删除不是关键术语的一部分的仅各别停止词以维持文档的正确意义。
在方框14中,将词性(POS)和n元语法构造应用于来自方框12的剩余提取的术语或从其输出的短语,这在图2中详细示出。
在方框15中,确定数据中n元语法的位置,这在图3中详细示出。
在方框16中,识别关键术语的不同和公共POS标签(tag),这在图4和图5中详细示出。
在方框17中,如果POS标签是公共的,则例程进行到方框18;否则,例程进行到方框20。
在方框18中,估计字典式交互信息。
在方框19中,基于朴素贝叶斯网分类器估计上下文概率。
在方框20中,将术语分类为用于构建本体比较引擎的零件、症状、事件、故障模式或动作术语中的一个。
在方框21中,产生并识别需求子系统。在方框22中,产生本体比较引擎并且将其用来执行相应需求子系统之间的一致性检查。可以在两个或更多个需求文档之间、需求文档与软件代码之间、不同子系统的软件代码之间应用一致性检查,并且用于检测软件代码之间的故障可追溯性。
图2示出词性标注器,其中需求文档内的逐字数据被标注。如图2中所示,词性由相应标识符来标注,其中诸如“are”、“see”、“24HR”、“purge”、“evap”、“selenoid”的短语被分配下面的POS标签:“are/VBP”、“see/VB”、“24HR/JJ”、“purge/NNP”、“evap/NNP”以及“selenoid/NNP”。
使用POS标注模块来将标签应用于术语。可以在PennTreebankProject(http://www.ling.upenn.edu/courses/Fall_2007/ling001/penn_treebank_pos.html)中找到这些标签的实例,所述实例包括但不限于此。标签可以包括但不限于CC(并列连词)、CD(基数)、JJ(形容词)、JJR(形容词比较级)、NN(名词、单个或块)、NNS(名词复数)、NNP(适当的名词单数)、NNPS(适当的名词复数)、RB(副词)、RBR(副词比较级)、RBS(副词最高级)、VB(动词、基本形式)、VBD(动词过去式)、VBD(动词,现在分词)、VBN(动词,过去分词)、VBP(动词,非第三人称单数现在式)、VBZ(动词,第三人称单数现在式)。应理解,本文的POS标签是示例性的,并且可以使用不同的POS标识符。
识别与所提取的短语相关的N元语法(n-gram)。术语“语法(gram)”指代作为整体的短语的(一个或多个)术语并且“n”指代与短语相关的术语的数量。
图3是n元语法表的示例性图示。从每个需求文档,构建以下类型的n元语法:包括具有单个词的短语的一元语法(例如,电池、变速器);包括具有两个词的短语的二元语法(例如,电池没电);包括具有三个词的短语的三元语法(例如,主体控制模块、仪表板群集、动力总成控制模块);包括具有四个词的短语的四元语法(例如,主体控制模块不工作、变速器控制模块组件);以及包括具有五个词的短语的五元语法(例如,变速器控制模块组件故障)。潜在地使用可能五个词长的n元语法的基本原理是因为在含有五个词的一些实例中的短语(例如,燃料箱压力传感器模块)的关键性质。例如,关键术语的长度可以是五个词,这些术语是零件的名称、症状、事件、动作和故障模式。
当所使用的技术不使用将会提供术语的起源或数据库以从每个需求文档识别关键术语的任何域特定本体时(即,分类法),构建并使用n元语法。因此,可以使用自然语言处理(NLP)方法,由此在技术的这个阶段构建的n元语法随后被标注有其词性以用于识别术语的正确分类。
图4示出识别数据中的n元语法的位置的表。识别短语在每个其POS标签的开始和结束位置以用于确定其逐字长度。如以下所展示,在相应n元语法的每一侧上设置三个词的词窗。词窗是变量,其应基于文档的性质来决定。
XXXXT1XX[T2xxStartIndex{Phrasei}EndindexT3XT4]XXX
左边的上下文信息=(PhraseiT2)
右边的上下文信息=((PhraseiT3),(Phrasei,T4))
与词窗中的n元语法一起出现的术语被收集作为上下文信息。这有助于识别公共短语和关键短语。
图5示出识别与短语相关的公共和不同的POS标签的表。通过分析分配给第一子系统的POS来识别公共POS标签,其中POS被分配给第二子系统。POS标签的分组帮助识别子系统之间公共的那些相应POS标签。图6示出图形逻辑交叉,也称为分段之间的连接。如图6中所示,可以区别开在两个子系统之间具有公共POS标签的那些相应短语。
如果发现与不同子系统相关的POS标签是公共的,则应用字典式交互信息(LMI)概率技术。LMI概率技术帮助确定POS标签应被拣选到的分类。例如,以下短语“不应被启动(shallnotbeactivated)”与症状和故障模式短语“MDRBVBVBN”一起出现。确定用于潜在分类的以下短语的LMI概率:
确定以及
使用以下公式来确定用于每个相应短语的LIM:
在确定相应概率时,进行一起观察的的概率与在数据中独立地观察的的概率的比较,其中。因此,具有较高LMI概率的相应标签被分配给用于各别短语的分类。
此外,可以使用基于朴素贝叶斯网模型的上下文概率,该模型捕获其中指定特定短术语的上下文。朴素贝叶斯网模型预测分类成员概率。使用以下步骤来确定上下文概率:
步骤1:
在训练数据中使得T为具有特定标签的标注的n元语法的组,
类别、(和给定T组,我们估计T是否属于具有最大后验概率的特定类别,即,
,等
步骤2:
与当前标注的术语一起出现的术语为根据朴素贝叶斯网模型的上下文‘c’提供具有独立于对应于先前术语的标签的当前标签的术语。
步骤3:
如下计算最大似然估计:
在确定用于公共POS标签的LMI和上下文概率之后,术语或短语被分类在其相应收集器(例如,类别)中。分类后的收集器可以用于需求文档之间、软件代码之间或者需求文档与软件代码之间的一致性检查。此外,可以将分类后的收集器输入到可以与试验数据一起使用的训练表中。
图7示出与试验数据合作的训练表的使用。在方框30中,将试验数据输入到引擎中。在方框31中,识别试验数据中的N元语法,并且从试验数据识别出关键n元语法。
在方框33中,与训练表32合作使用来自方框31的关键n元语法以用于匹配试验数据中的n元语法模式。在方框34中,将所得匹配分类到其相应的收集器中。
在方框35中,主题专家(SME)分析所分类的收集器以用于确定是否误分类任何术语或短语。在方框36中,SME产生修订的收集器。
在方框37中,从相应分类的收集器构建本体。形成软件代码的相应本体可以从可用于软件代码与需求文档之间的一致性检查的结果来构建。所示本体模型优于其他类型的建模(诸如有限状态建模(FSM))的优点在于FSM主要用于过程流程建模而本体可以用于形式化话语的域。也就是说,本体区分领域的类别级和实例级视图。因此,本体不需要应用域的完整视图,而建模技术(诸如有限状态建模)需要应用域的完整信息。同样,可以在不改变域级别类别而是仅通过捕获新应用特有的新实例来建模与特定域有关的应用的不同类别。
图8示出示例性的基于本体的不同子系统之间的一致性检查。将本体引擎38应用于根概念和根概念。检查的术语的一致性。应用以下步骤:
其中P(c)是看见概念c的实例的概率(在层级结构中P(c)是单调的)。
其中是包括二者的概念组。
在具有词的多个继承中,确定直接超类别的类似性的多于一个意义。
其中指示用于词w的可能意义组。
可以将所确定的类似性与预定类似性相比较以用于确定一致性。例如:
如果
则确定彼此一致。
如果
则确定彼此一致。
图9示出用于从软件开发本体的技术的流程图。
在方框40中,对于每个方法,获得方法名称。
在方框41中,进行确定是否正在使用外部方法。例如,如果一个方法在其执行内调用另一个方法,则原始方法内另一个方法的调用称为外部方法。如果未使用外部方法,则例程进行到方框43,否则,例程进行到方框42。
在步骤42中,获得外部方法的名称并且例程进行到步骤43。
在步骤43中,获得返回类型。本文中返回类型的概念指定方法在执行步骤之后正在返回的输出。在步骤44中,识别回路和其范围。在步骤45中,识别“如果”参数和“获得”条件参数。在步骤46中,识别输入变量和变量类型。步骤43-46可以同时地或顺序地执行。此外,执行步骤43-46的次序不需要是本文中描述的次序。响应于收集信息和识别方法,例程进行到步骤47。
在步骤47中,获得方法层级。
在步骤48中,识别类别名称。
在步骤49中,识别项目文件夹和数据包的计数数量。在此步骤中应用信息的提取,因为文件夹通常含有特定需求特征的完整信息,且因此提取文件夹信息允许以一致的方式获得与特定需求特征相关的有关信息。
在步骤50中,从软件代码检索参数,并且基于在步骤40-50中识别出的参数需求来构建本体。
图10示出可以用来捕获Java代码(例如,软件)的关键组件的域特定本体的实例。本体展示类别和本体中所包括的任两个类别之间的“具有一个”关系。原则上,本体指示java代码可以具有“方法”并且该“方法”可以具有“名称”、“回路”、“输入参数”、“如果条件”等等。
如果在第一java代码与第二java代码之间进行比较,则必须创建关于第一java代码和第二java代码的本体的实例以比较两个java代码。
图11示出图10中所示的本体的实例。该实例是基于以下样本java代码来创建:
“类别”定义结构,并且该类别的实例定义类别内的目标。如图11中所示,java代码“ExteriorLightSubsystemFeatureRequirement(外部灯子系统特征需求)”的特征具有调用“checkLampActivation(检查灯启动)”的方法,并且此方法具有两个各别输入“vehicleSpeed(车辆速度)”和“lampActivated(灯启动)”。此方法还具有由返回陈述“lampActivated(灯启动)”指定的输出并且还具有含有相关运算符“>”的如果条件(ifcondition)。此如果条件具有基于如果条件的“真(true)”或“假(false)”值分配的结果分配陈述。应理解,图10和11是域特定本体的实例和本体的所得实例,并且本文描述的该发明并不限于本文所示的实例。
领域中的故障可以被链接到需求问题。追溯故障(诸如在需求或软件中捕获的参数值)是识别和校正问题的技术。在大多数情况下需要追溯高达需求水平的问题,因为与先进水平相比较的在需求水平,可以容易地分析任何校正或改变对系统的另一个零件的影响。
通过独立地测试不同产品并且手动地映射不同产品的结果(例如,映射需求和软件)来执行故障可追溯性。除了向后方向(诸如“系统水平”到“部件水平”到“需求水平”)之外,如本文所描述的技术使得能够在向前方向上(诸如“需求水平”到“部件水平”到“系统水平”)进行故障追溯。
虽然已经详细描述本发明的某些实施例,但是熟悉本发明所涉及领域的人员将认识到用于实践如以下权利要求所定义的本发明的各种替代设计和实施例。

Claims (10)

1.一种使用构建的本体模型在需求文档和软件代码之间执行一致性检查的方法,包括以下步骤:
识别从数据库获得的多个需求文档中的术语;
由处理器为每个术语分配词性标签,词性标签指示需求文档中的每个术语的语法使用;
由处理器基于词性标签来将每个术语分类,分类识别每个术语是零件术语、症状术语、动作术语、事件术语还是故障模式术语;
由处理器根据分类的术语来构建基于本体的一致性引擎;
通过在从两个上下文文档提取的本体之间应用基于本体的一致性引擎来执行一致性检查;
识别上下文文档之间的不一致术语;
校正具有不一致术语的上下文文档中的至少一个。
2.如权利要求1所述的方法,其进一步包括以下步骤:
响应于将词性标签分配给每个术语,识别每个术语是否是短语的一部分;以及
将所述短语分组为具有相同的术语数量的n元语法。
3.如权利要求2所述的方法,其进一步包括以下步骤:
基于POS标签来识别短语的开始和结束位置,用于确定短语的逐字长度。
4.如权利要求3所述的方法,其进一步包括以下步骤:根据逐字长度确定公共短语。
5.如权利要求3所述的方法,其进一步包括以下步骤:响应于确定两个相应短语包括公共词性标签,估计用于确定相关分类的短语的字典式交互信息。
6.如权利要求3所述的方法,其中用于第一短语和第二短语的字典式交互信息由以下公式确定:
7.如权利要求6所述的方法,其中将与第一短语相关的LMI概率和与第二短语相关的LMI概率相比较,并且其中将与具有较高概率的相应LMI相关的分类分配给第一短语和第二短语。
8.如权利要求7所述的方法,其中通过捕获其中指定特定短语的上下文使用朴素贝叶斯网模型来确定上下文概率,其中使用LMI概率和朴素贝叶斯网模型来分配所述分类。
9.如权利要求1所述的方法,其中两个上下文文档之间的一致性检查包括一个第一需求文档和一个第二需求文档。
10.如权利要求1所述的方法,其中两个上下文文档之间的一致性检查包括第一软件代码和第二软件代码。
CN201510951660.2A 2014-12-18 2015-12-18 用于通过本体模型的比较进行一致性检查的方法和装置 Withdrawn CN105718256A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/574,962 US20160179868A1 (en) 2014-12-18 2014-12-18 Methodology and apparatus for consistency check by comparison of ontology models
US14/574962 2014-12-18

Publications (1)

Publication Number Publication Date
CN105718256A true CN105718256A (zh) 2016-06-29

Family

ID=56099685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510951660.2A Withdrawn CN105718256A (zh) 2014-12-18 2015-12-18 用于通过本体模型的比较进行一致性检查的方法和装置

Country Status (3)

Country Link
US (1) US20160179868A1 (zh)
CN (1) CN105718256A (zh)
DE (1) DE102015121509A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170249309A1 (en) * 2016-02-29 2017-08-31 Microsoft Technology Licensing, Llc Interpreting and Resolving Conditional Natural Language Queries
CN110516722A (zh) * 2019-08-15 2019-11-29 南京航空航天大学 一种基于主动学习的需求与代码之间可追踪性的自动生成方法
CN110928546A (zh) * 2018-09-20 2020-03-27 西门子股份公司 确定存在依赖违规的方法、装置、电子设备、介质及程序
CN112733517A (zh) * 2021-01-12 2021-04-30 上海复佳信息科技有限公司 需求模板符合性检查的方法、电子设备及存储介质

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570187B (zh) * 2016-11-14 2020-04-21 南京邮电大学 一种基于本体概念相似度的软件构件检索方法
US10713432B2 (en) * 2017-03-31 2020-07-14 Adobe Inc. Classifying and ranking changes between document versions
US10891375B1 (en) * 2017-09-27 2021-01-12 Allure Security Technology Inc. Document behavior analytics—abnormal document flows to identify suspicious exfiltration utility patent
DE102018008923A1 (de) 2018-10-09 2020-05-20 makmad.org e. V. Verfahren zur Erstellung einer effizienten, logisch vollständigen, ontologischen Ebene im erweiterten relationalen Datenbankkonzept
US11803365B2 (en) 2022-03-25 2023-10-31 GM Global Technology Operations LLC System and process for vehicle software configuration coverage measurement for update validation

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040034665A1 (en) * 2002-06-17 2004-02-19 Kenneth Haase Extensible structured controlled vocabularies
US20050010912A1 (en) * 2003-07-10 2005-01-13 International Business Machines Corporation Method and apparatus for generating computer programming code selectively optimized for execution performance and not optimized for serviceability
US20060143594A1 (en) * 2004-12-28 2006-06-29 Microsoft Corporation Using code analysis to generate documentation
US20090138793A1 (en) * 2007-11-27 2009-05-28 Accenture Global Services Gmbh Document Analysis, Commenting, and Reporting System
US20090157656A1 (en) * 2005-10-27 2009-06-18 Libo Chen Automatic, computer-based similarity calculation system for quantifying the similarity of text expressions
US20100005386A1 (en) * 2007-11-27 2010-01-07 Accenture Global Services Gmbh Document analysis, commenting, and reporting system
CN101681348A (zh) * 2007-02-15 2010-03-24 塞科普公司 用于文档分析的基于语义的方法和装置
US20100114561A1 (en) * 2007-04-02 2010-05-06 Syed Yasin Latent metonymical analysis and indexing (lmai)
US20100257127A1 (en) * 2007-08-27 2010-10-07 Stephen Patrick Owens Modular, folder based approach for semi-automated document classification
US20110040766A1 (en) * 2009-08-13 2011-02-17 Charité-Universitätsmedizin Berlin Methods for searching with semantic similarity scores in one or more ontologies
CN102141993A (zh) * 2010-02-02 2011-08-03 同济大学 一种基于语义本体的案例表示方法
CN102194013A (zh) * 2011-06-23 2011-09-21 上海毕佳数据有限公司 一种基于领域知识的短文本分类方法及文本分类系统
US20120078969A1 (en) * 2010-09-24 2012-03-29 International Business Machines Corporation System and method to extract models from semi-structured documents
US8151248B1 (en) * 2007-10-31 2012-04-03 Sprint Communications Company L.P. Method and system for software defect management
US20120159441A1 (en) * 2010-12-17 2012-06-21 Tata Consultancy Services Limited Recommendation system for agile software development
CN102662923A (zh) * 2012-04-23 2012-09-12 天津大学 一种基于机器学习的本体实例学习方法
US8522196B1 (en) * 2001-10-25 2013-08-27 The Mathworks, Inc. Traceability in a modeling environment
US20140006861A1 (en) * 2012-06-28 2014-01-02 Microsoft Corporation Problem inference from support tickets
CN103593335A (zh) * 2013-09-05 2014-02-19 姜赢 基于本体一致性验证推理的中文语义校对方法
CN103853824A (zh) * 2014-03-03 2014-06-11 沈之锐 一种基于深度语义挖掘的内文广告发布方法与系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8191044B1 (en) * 2006-12-14 2012-05-29 Fannie Mae System and method for maintaining requirements traceability
US9292410B2 (en) * 2011-11-06 2016-03-22 International Business Machines Corporation Using traceability links strength for software development integrity monitoring
US9519872B2 (en) * 2013-08-23 2016-12-13 Wal-Mart Stores, Inc. Systematic discovery of business ontology
US9086824B1 (en) * 2014-01-15 2015-07-21 International Business Machines Corporation Requirements factorization mechanism

Patent Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8522196B1 (en) * 2001-10-25 2013-08-27 The Mathworks, Inc. Traceability in a modeling environment
US20040034665A1 (en) * 2002-06-17 2004-02-19 Kenneth Haase Extensible structured controlled vocabularies
US20050010912A1 (en) * 2003-07-10 2005-01-13 International Business Machines Corporation Method and apparatus for generating computer programming code selectively optimized for execution performance and not optimized for serviceability
US20060143594A1 (en) * 2004-12-28 2006-06-29 Microsoft Corporation Using code analysis to generate documentation
US20090157656A1 (en) * 2005-10-27 2009-06-18 Libo Chen Automatic, computer-based similarity calculation system for quantifying the similarity of text expressions
CN101681348A (zh) * 2007-02-15 2010-03-24 塞科普公司 用于文档分析的基于语义的方法和装置
US20100114561A1 (en) * 2007-04-02 2010-05-06 Syed Yasin Latent metonymical analysis and indexing (lmai)
US20100257127A1 (en) * 2007-08-27 2010-10-07 Stephen Patrick Owens Modular, folder based approach for semi-automated document classification
US8151248B1 (en) * 2007-10-31 2012-04-03 Sprint Communications Company L.P. Method and system for software defect management
US8266519B2 (en) * 2007-11-27 2012-09-11 Accenture Global Services Limited Document analysis, commenting, and reporting system
US20100005386A1 (en) * 2007-11-27 2010-01-07 Accenture Global Services Gmbh Document analysis, commenting, and reporting system
US20090138793A1 (en) * 2007-11-27 2009-05-28 Accenture Global Services Gmbh Document Analysis, Commenting, and Reporting System
US20110040766A1 (en) * 2009-08-13 2011-02-17 Charité-Universitätsmedizin Berlin Methods for searching with semantic similarity scores in one or more ontologies
CN102141993A (zh) * 2010-02-02 2011-08-03 同济大学 一种基于语义本体的案例表示方法
US20120078969A1 (en) * 2010-09-24 2012-03-29 International Business Machines Corporation System and method to extract models from semi-structured documents
US20120159441A1 (en) * 2010-12-17 2012-06-21 Tata Consultancy Services Limited Recommendation system for agile software development
CN102194013A (zh) * 2011-06-23 2011-09-21 上海毕佳数据有限公司 一种基于领域知识的短文本分类方法及文本分类系统
CN102662923A (zh) * 2012-04-23 2012-09-12 天津大学 一种基于机器学习的本体实例学习方法
US20140006861A1 (en) * 2012-06-28 2014-01-02 Microsoft Corporation Problem inference from support tickets
CN103593335A (zh) * 2013-09-05 2014-02-19 姜赢 基于本体一致性验证推理的中文语义校对方法
CN103853824A (zh) * 2014-03-03 2014-06-11 沈之锐 一种基于深度语义挖掘的内文广告发布方法与系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LINA ZHOU: "Ontology learning: state of the art and open issues", 《INFORMATION TECHNOLOGY AND MANAGEMENT》 *
PHILIP RESNIK: "Using information content to evaluate semantic similarity in a taxonomy", 《ARXIV PREPRINT CMP-LG/9511007》 *
YONGGANG ZHANG等: "An ontology-based approach for traceability recovery", 《3RD INTERNATIONAL WORKSHOP ON METAMODELS, SCHEMAS, GRAMMARS, AND ONTOLOGIES FOR REVERSE ENGINEERING (ATEM 2006)》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170249309A1 (en) * 2016-02-29 2017-08-31 Microsoft Technology Licensing, Llc Interpreting and Resolving Conditional Natural Language Queries
CN110928546A (zh) * 2018-09-20 2020-03-27 西门子股份公司 确定存在依赖违规的方法、装置、电子设备、介质及程序
CN110516722A (zh) * 2019-08-15 2019-11-29 南京航空航天大学 一种基于主动学习的需求与代码之间可追踪性的自动生成方法
CN110516722B (zh) * 2019-08-15 2023-08-22 南京航空航天大学 一种基于主动学习的需求与代码之间可追踪性的自动生成方法
CN112733517A (zh) * 2021-01-12 2021-04-30 上海复佳信息科技有限公司 需求模板符合性检查的方法、电子设备及存储介质

Also Published As

Publication number Publication date
DE102015121509A1 (de) 2016-06-23
US20160179868A1 (en) 2016-06-23

Similar Documents

Publication Publication Date Title
CN105718256A (zh) 用于通过本体模型的比较进行一致性检查的方法和装置
US8650022B2 (en) Method and an apparatus for automatic semantic annotation of a process model
US20200118014A1 (en) Adaptable Systems and Methods for Discovering Intent from Enterprise Data
Fischbach et al. Specmate: Automated creation of test cases from acceptance criteria
CN113220836B (zh) 序列标注模型的训练方法、装置、电子设备和存储介质
CN111435366A (zh) 设备故障诊断方法、装置和电子设备
CN111523119A (zh) 漏洞检测的方法和装置、电子设备及计算机可读存储介质
GB2513005A (en) System and method for data entity identification and analysis of maintenance data
CN113326380B (zh) 基于深度神经网络的设备量测数据处理方法、系统及终端
JPH10240536A (ja) 事例検索装置及び事例検索方法並びに事例ベース構築装置及び事例ベース構築方法
CN112966088B (zh) 未知意图的识别方法、装置、设备及存储介质
Pudlitz et al. Extraction of system states from natural language requirements
Leopold et al. Using hidden Markov models for the accurate linguistic analysis of process model activity labels
CN113919336A (zh) 基于深度学习的文章生成方法、装置及相关设备
WO2011109195A1 (en) System and associated method for determining and applying sociocultural characteristics
Tahvili et al. Artificial Intelligence Methods for Optimization of the Software Testing Process: With Practical Examples and Exercises
Azad et al. Picking pearl from seabed: Extracting artefacts from noisy issue triaging collaborative conversations for hybrid cloud services
CN110019821A (zh) 文本类标训练方法和识别方法、相关装置及存储介质
Zhang et al. Labelvizier: Interactive validation and relabeling for technical text annotations
CN111859862B (zh) 文本的数据标注方法和装置、存储介质及电子装置
Liu et al. Artificial Intelligence in Software Requirements Engineering: State-of-the-Art
CN112579781A (zh) 文本归类方法、装置、电子设备及介质
CN115757775B (zh) 基于文本蕴含的无触发词文本事件检测方法及系统
Shen et al. A general approach to multimodal document quality assessment
Shen et al. A Multimodal Approach to Assessing Document Quality.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20160629