CN109977021A - 一种基于关联规则分析的软件质量管理方法及系统 - Google Patents

一种基于关联规则分析的软件质量管理方法及系统 Download PDF

Info

Publication number
CN109977021A
CN109977021A CN201910259391.1A CN201910259391A CN109977021A CN 109977021 A CN109977021 A CN 109977021A CN 201910259391 A CN201910259391 A CN 201910259391A CN 109977021 A CN109977021 A CN 109977021A
Authority
CN
China
Prior art keywords
association rule
software quality
quality management
rule
software
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910259391.1A
Other languages
English (en)
Inventor
安程治
李锐
于治楼
高明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Hi Tech Investment and Development Co Ltd
Original Assignee
Jinan Inspur Hi Tech Investment and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Hi Tech Investment and Development Co Ltd filed Critical Jinan Inspur Hi Tech Investment and Development Co Ltd
Priority to CN201910259391.1A priority Critical patent/CN109977021A/zh
Publication of CN109977021A publication Critical patent/CN109977021A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3604Software analysis for verifying properties of programs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于关联规则分析的软件质量管理方法及系统,属于人工智能技术领域,该方法基于关联规则分析,选出软件质量管理数据库中在同一条问题下出现频率较高的词汇组,即高频项目组;然后计算所选高频项目组的置信度是否满足最小置信度;最后将同时满足最小支持度和最小置信度的项目组产生的规则划为与软件质量问题的关联规则。一种基于关联规则分析的软件质量管理系统,包括软件质量管理数据库、数据预处理模块、关联规则分析模块和强关联规则产生模块。本发明利用关联分析的方法快速发现软件的主要问题,从而可以有针对性的维护和修复软件问题,能够更高质量、高效率的完成工作。

Description

一种基于关联规则分析的软件质量管理方法及系统
技术领域
本发明涉及人工智能技术领域,具体地说是一种基于关联规则分析的软件质量管理方法及系统。
背景技术
随着第四次工业革命时代的到来,信息技术急速发展,大量帮助社会提高数据化和自动化的软件被物联网企业和软件公司开发出来。因此,软件质量管理也随之成为了一个重要课题。
通常软件公司会建立自己的数据库,对客户反馈回来的软件问题进行记录归类和总结。但是,由于数据量较大且运算复杂,单靠人力进行分析很难挖掘出深层的数据规律和价值点,很难挖掘出或准确的确定与软件问题间的相关性和与影响软件质量的相关因素。
发明内容
本发明的技术任务是针对以上不足之处,提供一种基于关联规则分析的软件质量管理方法及系统,利用关联分析的方法快速发现软件的主要问题,从而可以有针对性的维护和修复软件问题,更高质量、高效率的完成工作。
本发明解决其技术问题所采用的技术方案是:
一种基于关联规则分析的软件质量管理方法,该方法基于关联规则分析,
选出软件质量管理数据库中在同一条问题下出现频率较高的词汇组,即高频项目组,高频项目组基于最小支持度得出;
然后计算所选高频项目组的置信度是否满足最小置信度;
最后将同时满足最小支持度和最小置信度的项目组产生的规则划为与软件质量问题的关联规则。
关联规则是形如X->Y的蕴含式,是关联两个无交集项集的概念。关联规则的强弱可以用支持度和置信度两个指标来度量。根据业务需求设定最小支持度和最小置信度,同时满足所设定的最小支持度和最小置信度的项目组所产生的规则即为我们需求的关联规则。
优选的,所述选出软件质量管理数据库中在同一条问题下出现频率较高的词汇组,采用APRIORI算法,从原数据中根据设定的最小支持度阈值筛选出高频项目组。APRIORI算法是一种挖掘关联规则的代表性算法,核心思想是基于两阶段频集思想的递推算法,有利于更高质量、更高效率的完成运算。
具体的,所述关联规则分析的关联规则挖掘任务包括频繁项集产生和规则产生两个子任务,
所述频繁项集产生用于发现满足支持最小支持度阈值的所有项集,这些项集称为频繁项;
所述规则产生用于从所述频繁项集中提取所有高置信度的规则,这些规则称为强规则。
通过频繁项集产生和规则产生任务实现支持度与置信度的结合,通过强关联规则快速发现软件主要问题所在。
该基于关联规则分析的软件质量管理方法,其具体实施步骤如下:
1)、整理被分析的软件质量数据库的管理内容(即数据库中记录的软件问题的条目),对其进行业务方面的了解,对与软件问题关联性强的条目进行初步筛选;同时,对描述性的文本类条目进行自然语言文本处理;
2)、对被选取的分析数据进行关联规则分析:
首先根据业务需求确定最小支持度,
然后利用APRIORI算法根据预设的最小支持度阈值筛选出高频项目组;
3)、利用步骤2)得到的高频项目组产生关联规则,通过计算高频项目组的置信度是否满足最小置信度,产生反应软件质量问题内在联系的强关联规则。
通过产生的强关联规则我们能快速发现软件主要问题所在,进而有针对性的维护和修复软件存在的问题。
进一步的,根据关联规则分析所需的分析数据要求,所述的自然语言文本处理包括分词处理等。
本发明还公开了一种基于关联规则分析的软件质量管理系统,包括软件质量管理数据库、数据预处理模块、关联规则分析模块和强关联规则产生模块,
软件质量管理数据库用于存储与软件质量问题相关的条目,软件公司建立数据库,对客户反馈回来的软件问题进行记录归类和总结;
数据预处理模块用于对软件质量管理数据库中的条目进行问题的特征初步筛选和自然语言文本处理,使其符合关联规则分析的业务需求以及数据输入要求;
关联规则分析模块用于确定最小支持度,并根据预设的最小支持度阈值筛选出高频项目组;
强关联规则产生模块用于根据所述高频项目组产生反应软件质量问题内在联系的强关联规则。
在关联规则挖掘任务中包括频繁项集产生子任务和规则产生子任务,频繁项集产生目标是发现满足支持最小支持度阈值的所有项集,这些项集称为频繁项;规则产生的目标是从所述频繁项集中提取所有高置信度的规则,这些规则称为强规则。本系统中,关联规则分析模块完成频繁项集产生,通过预设的最小支持度得到频繁项;强关联规则分析模块完成强规则的产生的,通过预设的最小置信度得到与软件质量问题关联的强规则。
优选的,对于关联规则分析数据的预处理,根据数据输入要求,自然语言文本处理包括分词处理等。
优选的,所述关联规则分析模块采用APRIORI算法筛选出高频项目组。APRIORI算法从原始数据中根据设定的最小支持度阈值筛选出高频项目组,及选出软件质量管理数据库中在同一条问题下出现频率较高的词汇组。
进一步的,强关联规则产生模块通过计算高频项目组的置信度是否满足最小置信度来产生所述强关联规则。
同时满足最小支持度和最小置信度的项目组所产生的规则即为我们需求的关联规则。
本发明的一种基于关联规则分析的软件质量管理方法及系统与现有技术相比,具有以下有益效果:
该方法采用APRIORI算法,将APRIORI算法应用于软件质量管理和维护库中,通过客户反馈的问题产生关联规则;通过产生的强关联规则快速发现软件主要问题所在,进而可以有针对性的维护和修复软件存在的问题,有助于更高质量、高效率的完成工作。
该系统能够优化软件的质量管理工作的流程与效率,可极大的促进软件公司和互联网企业的发展进步。
附图说明
图1是本发明的基于关联规则分析的软件质量管理方法流程图;
图2是本发明的基于关联规则分析的软件质量管理系统框图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
一种基于关联规则分析的软件质量管理方法,该方法基于关联规则分析,结合业务知识,选取要研究的关联特征;
采用APRIORI算法,从原数据中根据设定的最小支持度阈值筛选出高频项目组,选出软件质量管理数据库中在同一条问题下出现频率较高的词汇组,即高频项目组,高频项目组基于最小支持度得出;
然后计算所选高频项目组的置信度是否满足最小置信度;
最后将同时满足最小支持度和最小置信度的项目组产生的规则划为与软件质量问题的关联规则。
关联规则是形如X->Y的蕴含式,是关联两个无交集项集的概念。关联规则的强弱可以用支持度和置信度两个指标来度量。根据业务需求设定最小支持度和最小置信度,同时满足所设定的最小支持度和最小置信度的项目组所产生的规则即为我们需求的关联规则。
其中,关联规则分析的关联规则挖掘任务包括频繁项集产生和规则产生两个子任务,
所述频繁项集产生用于发现满足支持最小支持度阈值的所有项集,这些项集称为频繁项;
所述规则产生用于从所述频繁项集中提取所有高置信度的规则,这些规则称为强规则。
通过频繁项集产生和规则产生任务实现支持度与置信度的结合,通过强关联规则快速发现软件主要问题所在。
该基于关联规则分析的软件质量管理方法,其具体实施步骤如下:
1)、整理被分析的软件质量数据库的管理内容(即数据库中记录的软件问题的条目),对其进行业务方面的了解,对与软件问题关联性强的条目进行初步筛选;同时,对描述性的文本类条目进行分词等自然语言文本预处理;
2)、对被选取的分析数据进行关联规则分析:
首先根据业务需求确定最小支持度,
然后利用APRIORI算法根据预设的最小支持度阈值筛选出高频项目组;
3)、利用步骤2)得到的高频项目组产生关联规则,通过计算高频项目组的置信度是否满足最小置信度,产生反应软件质量问题内在联系的强关联规则。
通过产生的强关联规则我们能快速发现软件主要问题所在,进而有针对性的维护和修复软件存在的问题。
在关联规则的思想指导下利用APRIORI算法挖掘出软件质量管理数据库中的频繁项目集。将关联规则分析算法应用于软件质量管理和维护库的规范化上,该方法可以挖掘出软件质量问题的相关因素和软件问题间的相关性。
在本发明的一个实施例中,一种基于关联规则分析的软件质量管理系统,包括软件质量管理数据库、数据预处理模块、关联规则分析模块和强关联规则产生模块。其中,
软件质量管理数据库用于存储与软件质量问题相关的条目,软件公司建立数据库,对客户反馈回来的软件问题进行记录归类和总结;
数据预处理模块用于对软件质量管理数据库中的条目进行问题的特征初步筛选和自然语言文本处理,使其符合关联规则分析的业务需求以及数据输入要求,对于关联规则分析数据的预处理,根据数据输入要求,自然语言文本处理包括分词处理等;
关联规则分析模块用于确定最小支持度,并根据预设的最小支持度阈值筛选出高频项目组;
强关联规则产生模块用于根据所述高频项目组产生反应软件质量问题内在联系的强关联规则。
在关联规则挖掘任务中包括频繁项集产生子任务和规则产生子任务,频繁项集产生目标是发现满足支持最小支持度阈值的所有项集,这些项集称为频繁项;规则产生的目标是从所述频繁项集中提取所有高置信度的规则,这些规则称为强规则。本系统中,关联规则分析模块完成频繁项集产生,通过预设的最小支持度得到频繁项;强关联规则分析模块完成强规则的产生的,通过预设的最小置信度得到与软件质量问题关联的强规则。
关联规则分析模块采用APRIORI算法筛选出高频项目组。APRIORI算法从原始数据中根据设定的最小支持度阈值筛选出高频项目组,及选出软件质量管理数据库中在同一条问题下出现频率较高的词汇组。
强关联规则产生模块通过计算高频项目组的置信度是否满足最小置信度来产生所述强关联规则。
同时满足最小支持度和最小置信度的项目组所产生的规则即为我们需求的关联规则。
该系统将APRIORI算法应用于软件质量管理数据的规则分析中,利用关联分析的方法发掘出与软件问题间的相关性和影响软件质量的相关因素,如版本、操作系统或使用用户等。
通过上面具体实施方式,所述技术领域的技术人员可容易的实现本发明。但是应当理解,本发明并不限于上述的具体实施方式。在公开的实施方式的基础上,所述技术领域的技术人员可任意组合不同的技术特征,从而实现不同的技术方案。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (9)

1.一种基于关联规则分析的软件质量管理方法,其特征在于该方法基于关联规则分析,
选出软件质量管理数据库中在同一条问题下出现频率较高的词汇组,即高频项目组;
然后计算所选高频项目组的置信度是否满足最小置信度;
最后将同时满足最小支持度和最小置信度的项目组产生的规则划为与软件质量问题的关联规则。
2.根据权利要求1所述的一种基于关联规则分析的软件质量管理方法,其特征在于所述选出软件质量管理数据库中在同一条问题下出现频率较高的词汇组,采用APRIORI算法,从原数据中根据设定的最小支持度阈值筛选出高频项目组。
3.根据权利要求1或2所述的一种基于关联规则分析的软件质量管理方法,其特征在于所述关联规则分析的关联规则挖掘任务包括频繁项集产生和规则产生两个子任务,
所述频繁项集产生用于发现满足支持最小支持度阈值的所有项集,这些项集称为频繁项;
所述规则产生用于从所述频繁项集中提取所有高置信度的规则,这些规则称为强规则。
4.根据权利要求2所述的一种基于关联规则分析的软件质量管理方法,其特征在于具体实施步骤如下:
1)、整理被分析的软件质量数据库的管理内容,对与软件问题关联性强的条目进行初步筛选;同时,对描述性的文本类条目进行自然语言文本处理;
2)、对被选取的分析数据进行关联规则分析:
首先根据业务需求确定最小支持度,
然后利用APRIORI算法根据预设的最小支持度阈值筛选出高频项目组;
3)、利用步骤2)得到的高频项目组产生关联规则,通过计算高频项目组的置信度是否满足最小置信度,产生反应软件质量问题内在联系的强关联规则。
5.根据权利要求4所述的一种基于关联规则分析的软件质量管理方法,其特征在于所述的自然语言文本处理包括分词处理。
6.一种基于关联规则分析的软件质量管理系统,其特征在于包括软件质量管理数据库、数据预处理模块、关联规则分析模块和强关联规则产生模块,
软件质量管理数据库用于存储与软件质量问题相关的条目;
数据预处理模块用于对软件质量管理数据库中的条目进行问题的特征初步筛选和自然语言文本处理;
关联规则分析模块用于确定最小支持度,并根据预设的最小支持度阈值筛选出高频项目组;
强关联规则产生模块用于根据所述高频项目组产生反应软件质量问题内在联系的强关联规则。
7.根据权利要求6所述的一种基于关联规则分析的软件质量管理系统,其特征在于所述自然语言文本处理包括分词处理。
8.根据权利要求6所述的一种基于关联规则分析的软件质量管理系统,其特征在于所述关联规则分析模块采用APRIORI算法筛选出高频项目组。
9.根据权利要求6或7或8所述的一种基于关联规则分析的软件质量管理系统,其特征在于强关联规则产生模块通过计算高频项目组的置信度是否满足最小置信度来产生所述强关联规则。
CN201910259391.1A 2019-04-02 2019-04-02 一种基于关联规则分析的软件质量管理方法及系统 Pending CN109977021A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910259391.1A CN109977021A (zh) 2019-04-02 2019-04-02 一种基于关联规则分析的软件质量管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910259391.1A CN109977021A (zh) 2019-04-02 2019-04-02 一种基于关联规则分析的软件质量管理方法及系统

Publications (1)

Publication Number Publication Date
CN109977021A true CN109977021A (zh) 2019-07-05

Family

ID=67082260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910259391.1A Pending CN109977021A (zh) 2019-04-02 2019-04-02 一种基于关联规则分析的软件质量管理方法及系统

Country Status (1)

Country Link
CN (1) CN109977021A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112068806A (zh) * 2020-09-09 2020-12-11 上海万向区块链股份公司 一种优化软件开发中项目管理的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110061040A1 (en) * 2009-09-06 2011-03-10 Muhammad Shaheen Association rule mining to predict co-varying software metrics
CN104715073A (zh) * 2015-04-03 2015-06-17 江苏物联网研究发展中心 基于改进Apriori算法的关联规则挖掘系统
CN106951372A (zh) * 2017-04-05 2017-07-14 西安邮电大学 一种基于变量切片和关联规则的软件错误定位方法
CN107402797A (zh) * 2016-05-19 2017-11-28 中兴通讯股份有限公司 一种软件编译方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110061040A1 (en) * 2009-09-06 2011-03-10 Muhammad Shaheen Association rule mining to predict co-varying software metrics
CN104715073A (zh) * 2015-04-03 2015-06-17 江苏物联网研究发展中心 基于改进Apriori算法的关联规则挖掘系统
CN107402797A (zh) * 2016-05-19 2017-11-28 中兴通讯股份有限公司 一种软件编译方法及装置
CN106951372A (zh) * 2017-04-05 2017-07-14 西安邮电大学 一种基于变量切片和关联规则的软件错误定位方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
颜乐鸣: "基于关联规则挖掘的软件缺陷分析研究", 《软件》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112068806A (zh) * 2020-09-09 2020-12-11 上海万向区块链股份公司 一种优化软件开发中项目管理的方法及系统

Similar Documents

Publication Publication Date Title
CN111461668A (zh) 一种基于流程自动化技术的数字化审计系统及方法
CN101093559B (zh) 一种基于知识发现的专家系统构造方法
CN109062763A (zh) 一种从svn日志事件流中动态实时挖掘软件过程活动的方法
CN101110089A (zh) 一种数据挖掘和建模的方法及系统
CN115238197B (zh) 一种基于专家思维模型的领域业务辅助分析方法
CN115794803B (zh) 一种基于大数据ai技术的工程审计问题监测方法与系统
CN116126569A (zh) 智能运维方法及装置
CN103744788B (zh) 基于多源软件数据分析的特征定位方法
CN109977021A (zh) 一种基于关联规则分析的软件质量管理方法及系统
CN116611813B (zh) 一种基于知识图谱的智能运维管理方法及系统
CN106056300A (zh) 纵横交错的混合式资源分配规则挖掘方法
CN110888850B (zh) 一种基于电力物联网平台的数据质量检测方法
CN112668733A (zh) 基于无监督学习的通信管理系统缺陷故障派单方法及装置
CN115062791A (zh) 一种人工智能的解释方法、装置、设备及存储介质
CN108763565B (zh) 一种基于深度学习的数据自动关联匹配的构建方法
CN113888231A (zh) 一种基于人工智能的营销数据筛选分析系统
CN113849656A (zh) 基于聚类图谱的技术文本挖掘方法和系统
Muneer et al. Comparison of modern techniques for analyzing NFRs in Agile: A systematic literature review
CN111291373A (zh) 用于分析数据污染传播的方法、设备和计算机可读存储介质
Kumar et al. Requirements Engineering Process Model Add-On For Software Development
CN107358348A (zh) 一种基于oee提高计划容错性的方法
Khaliq et al. DEVELOPING AN INTEGRATED HUMAN RESOURCE MANAGEMENT INFORMATION SYSTEM (HRMIS) FOR ENHANCED WORKFORCE EFFICIENCY AND PRODUCTIVITY
CN117787244A (zh) 一种面向Handle标识解析的数据解析方法和系统
Chen et al. Knowledge Engineering-Based Quality Management in Prefabricated Construction
Das et al. Semantic Prediction Using Distributed Rule Mining for Web-Based Big Stock Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190705

RJ01 Rejection of invention patent application after publication