CN108038056A - 一种基于不对称分类评估的软件缺陷检测系统 - Google Patents

一种基于不对称分类评估的软件缺陷检测系统 Download PDF

Info

Publication number
CN108038056A
CN108038056A CN201711281802.4A CN201711281802A CN108038056A CN 108038056 A CN108038056 A CN 108038056A CN 201711281802 A CN201711281802 A CN 201711281802A CN 108038056 A CN108038056 A CN 108038056A
Authority
CN
China
Prior art keywords
msub
mrow
software
data
msubsup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711281802.4A
Other languages
English (en)
Other versions
CN108038056B (zh
Inventor
马樱
朱顺痣
翁伟
王琰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University of Technology
Original Assignee
Xiamen University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University of Technology filed Critical Xiamen University of Technology
Priority to CN201711281802.4A priority Critical patent/CN108038056B/zh
Publication of CN108038056A publication Critical patent/CN108038056A/zh
Application granted granted Critical
Publication of CN108038056B publication Critical patent/CN108038056B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3684Test management for test design, e.g. generating new test cases

Abstract

本发明提供一种基于不对称分类评估的软件缺陷检测系统,该系统包括软件数据输入接口、控制器以及检测结果输出端口,所述控制器用于:首先对接收的软件模块进行检测,获取原始软件度量数据集,对原始软件度量数据集的数据进行预处理,将数据分为训练样本和测试样本,对训练样本数据进行字典学习模型,并判别,结构化字典,使用不对称分类器进行性能评估,检测转入所述测试样本,用模型对软件检测模块进行缺陷检测,将评估结果反馈给测试者,完成检测;然后通过检测结果输出端口将检测结果输出给用户。本发明可以使字典表示能力增强,具有很好的判别性能,同时有效解决数据不平衡问题带来的误差,准确定位软件缺陷位置。

Description

一种基于不对称分类评估的软件缺陷检测系统
【技术领域】
本发明涉及计算机系统,特别涉及一种基于不对称分类评估的软件缺陷检测系统。
【背景技术】
计算机系统包括软件系统与硬件系统,而面对庞大复杂的软件系统,软件缺陷是计算机软件经常出现问题,在软件整个生命周期里,软件缺陷成为影响软件质量的一个重要因素,发现和排查软件缺陷是一项重要的工作,然而,发现和排除软件缺陷需要耗费大量的人力和物力。2006年,在与软件缺陷相关的费用方面,美国花费大约780亿美元。根据美国国防部的数据显示,用在与软件相关的工作上的资金大约占整个IT产品的42%,据美国调查研究结果表示,在整个软件花费中,美国在软件测试上的花费就占了53%-87%。因此合理预测缺陷能够有助于及时找出未被发现但是真实存在的缺陷以及缺陷分布,因此,不仅可以节约大量的成本,提高产品质量,还能够客观地评价测试结果,让开发者合理的权衡潜在预测风险和测试成本之间的关系,便于科学的进行软件检测工作。虽然不同度元的数据采集方法不同,但是在预测算法中对不同的度量元并不区分处理,预测算法却具有通用性,现有技术中将字典学习方法用于软件缺陷检测中,但是常规的字典学习算法不能有效利用数据集中不同类型本的判别性质,同时在分类评估时没有考虑到算法中不对称性,因此,提供一种具有有效数据处理的软件检测系统势在必行。
【发明内容】
本发明旨在提供一种基于不对称分类评估的软件缺陷检测系统,能够通过在传统的字典学习模型中通过加入判别约束项、在分类器性能评估中考虑到不对称性,来提高数据性能,更好的完成软件检测。
技术方案为:一种基于不对称分类评估的软件缺陷检测系统,所述系统包括软件数据输入接口、控制器以及检测结果输出端口,所述软件数据输入接口用于接收要检测的软件数据,所述控制器用于对所述软件数据进行检测,并通过所述检测结果输出端口将结果输出,所述软件数据为要检测的软件的软件模块。
进一步的,所述控制器被构造为实现以下步骤:
步骤(1),对接收的软件模块进行检测;
步骤(2),获取原始软件度量数据集,对原始软件度量数据集的数据进行预处理;
步骤(3),将数据分为训练样本和测试样本,定义A=[A1,A2,A3……,Ai,……,Ac]为的训练样本集合,其中Ai为第i类的子样本集合,定义X=[X1,X2,X3……,Xi,……,Xc]为A关于字典集合D的表示系数矩阵;
步骤(4),对训练样本数据代入至字典学习模型,并判别;
步骤(5),通过元数据固定对所述步骤(4)中判别后的数据进行结构化;步骤(5)具体包括以下步骤,
步骤501,初始化字典集合D,对D每一列以随机矢量l1范式项进行初始化;
步骤502,固定字典集合D,通过IMP以迭代的形式进行求解系数集合X;
步骤503,通过元数据固定步骤502中的X,更新D,得到最终的结构化的字典,更新D方法如下:
其中d为字典的元数据,稀疏系数X为系数矩阵,X=[β12,…,βP],这里βj,j=1,2,……,p,是矩阵的行向量,逐个更新,当更新到dj时,其他字典集合D的列被固定,比如,dl,l≠j,然后,JD被转化为下述公式,
设置C=A-∑l≠jdlβl,则
使用拉格朗日乘子,等价于
其中γ是一个可变量,积分考虑dj,使其变0,得到 所以的约束下,解答等式(2),这里‖·‖2是l1范式项,
继而更新所有的dj的元数据。返回公式(1),一直到JD,X的迭代最大数已经达到,最后输出D;
步骤(6),使用非对称分类器对步骤(5)中结构化后的数据进行性能评估;
步骤(7),检测转入所述测试样本;
步骤(8),对测试样本使用步骤(4)、(5)、(6)进行性能评估,即对软件检测模块进行缺陷检测;
步骤(9),将评估结果反馈给测试者,完成检测。
更进一步的,步骤(6)中非对称分类器设计为:
步骤601,执行非线性映射Φ:对高维特征空间生成一个输入变量,在该空间进行线性偏最小二乘法。
定义为具有数目l的标签样本,和定义为有数目u的未标签样本。对于标签样本,Y={+1,-1},有缺陷模块被标记为‘+1’,没有缺陷的模块标记为‘-1’,软件缺陷数据设置为高度不平衡的状态,该状态为少数类样本(缺陷模块)相比与多数样本(非缺陷模块)数目相差悬殊;
步骤602,在类区r范围设定中心M和重叠参数ε,少数类样本与多数类样本可以被表示为M+1-M-1=ε(r+1-r-1),参数ε表示两个区域的重叠等级,如果重叠度高,设定特征值等式:
ΦΦTψψTτ=μτ (3)
这里Φ、ψ分别定义为X空间的映射矩阵和Y空间的映射矩阵,而X、Y空间均在特征空间中,为了减少不平衡问题带来的亏损,使用偏差非对称分类器可以表示为设定其中k是潜在变量的计数值,ti是测试数据第i个得分向量,mi表示第i个得分向量的方位,偏差b等于m1(M+1-r+1ε),回归分析 l是标记样本的技术,k(xi,x)是内核函数,不对称分类器在此推算为:
ai是双重回归系数,可以从最小二乘法获得,是分类器的偏差。
c1是第一得分τ1的位置,根据τ1计算中心值(M+1,M-1)和半径(r+1,r-1),τ可以根据等式(3)获得。
其中,本发明与现有技术相比,本发明提供的软件检测系统,能够将建模过程、检测过程和软件模块开发过程融合,有效处理数据,将数据样本预处理和处理有效融合,同时利用不对称分类对数据处理结果进行性能评估,以提升整个过程的测试性能。
【附图说明】
图1为本发明的系统结构示意图。
图2为本发明软件检测系统工作流程示意图。
图3为本发明数据进行结构化的流程示意图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。根据结合附图进行的对示例性实施例的以下描述,上述和/或其他方面将变得清楚并且更容易被理解。
实施例一。
一种基于不对称分类评估的软件缺陷检测系统,所述系统包括软件数据输入接口、控制器以及检测结果输出端口,所述软件数据输入接口用于接收要检测的软件数据,所述控制器用于对所述软件数据进行检测,并通过所述检测结果输出端口将结果输出,所述软件数据为要检测的软件的软件模块。
所述控制器被构造为实现以下步骤:
步骤(1),对接收的软件模块进行检测;
步骤(2),获取原始软件度量数据集,对原始软件度量数据集的数据进行预处理;
步骤(3),将数据分为训练样本和测试样本,定义A=[A1,A2,A3……,Ai,……,Ac]为的训练样本集合,其中Ai为第i类的子样本集合,定义X=[X1,X2,X3……,Xi,……,Xc]为A关于字典集合D的表示系数矩阵;
步骤(4),对训练样本数据代入至字典学习模型,并判别;
步骤(5),通过元数据固定对所述步骤(4)中判别后的数据进行结构化;步骤(5)具体包括以下步骤,
步骤501,初始化字典集合D,对D每一列以随机矢量l1范式项进行初始化;
步骤502,固定字典集合D,通过IMP以迭代的形式进行求解系数集合X;
步骤503,通过元数据固定步骤502中的X,更新D,得到最终的结构化的字典,更新D方法如下:
其中d为字典的元数据,稀疏系数X为系数矩阵,X=[β12,…,βP],这里βj,j=1,2,……,p,是矩阵的行向量,逐个更新,当更新到dj时,其他字典集合D的列被固定,比如,dl,l≠j,然后,JD被转化为下述公式,
设置C=A-∑l≠jdlβl,则
使用拉格朗日乘子,等价于
其中γ是一个可变量,积分考虑dj,使其变0,得到 所以的约束下,解答等式(2),这里‖·‖2是l1范式项,
继而更新所有的dj的元数据。返回公式(1),一直到JD,X的迭代最大数已经达到,最后输出D;
步骤(6),使用非对称分类器对步骤(5)中结构化后的数据进行性能评估;
步骤(7),检测转入所述测试样本;
步骤(8),对测试样本使用步骤(4)、(5)、(6)进行性能评估,即对软件检测模块进行缺陷检测;
步骤(9),将评估结果反馈给测试者,完成检测。
更进一步的,步骤(6)中非对称分类器设计为:
步骤601,执行非线性映射Φ:对高维特征空间生成一个输入变量,在该空间进行线性偏最小二乘法。
定义为具有数目l的标签样本,和定义为有数目u的未标签样本。对于标签样本,Y={+1,-1},有缺陷模块被标记为‘+1’,没有缺陷的模块标记为‘-1’,软件缺陷数据设置为高度不平衡的状态,该状态为少数类样本(缺陷模块)相比与多数样本(非缺陷模块)数目相差悬殊;
步骤602,在类区r范围设定中心M和重叠参数ε,少数类样本与多数类样本可以被表示为M+1-M-1=ε(r+1-r-1),参数ε表示两个区域的重叠等级,如果重叠度高,设定特征值等式:
ΦΦTψψTτ=μτ (3)
这里Φ、ψ分别定义为X空间的映射矩阵和Y空间的映射矩阵,而X、Y空间均在特征空间中,为了减少不平衡问题带来的亏损,使用偏差非对称分类器可以表示为设定其中k是潜在变量的计数值,ti是测试数据第i个得分向量,mi表示第i个得分向量的方位,偏差b等于m1(M+1-r+1ε),回归分析
l是标记样本的技术,k(xi,x)是内核函数,不对称分类器在此推算为:
ai是双重回归系数,可以从最小二乘法获得,是分类器的偏差。
c1是第一得分τ1的位置,根据τ1计算中心值(M+1,M-1)和半径(r+1,r-1),τ可以根据等式(3)获得。
实施例二。
首先通过接口对接收的软件模块进行检测,获取原始软件度量数据集的数据,对原始软件度量数据集的数据进行预处理,定义A=[A1,A2,A3……,Ai,……,Ac]为的训练样本集合,其中Ai为第i类的子样本集合,定义X=[X1,X2,X3……,Xi,……,Xc]为A关于字典集合D的表示系数矩阵,对样本集合进行线性组合表示:
A≈DX
其中,Xi是第i类样本Ai关于D集合训练得到的表示系数。
基于上述内容,将数据分为训练样本和测试样本,此处为本领域中常用的技术方法,在此不在赘述。
建立字典判别项的学习模型,其数学模型如下:
P(D,X)=arg(D,X) min{r(A,D,X)+λ‖X‖1}
其中r(A,D,X)是判别精确项,其能够较好地衡量样本的判别能力,‖X‖1为稀疏表示系数,参数是一个平衡因子,对于某一类样本的稀疏表示系数Xi可以表示为其中是Ai关于字典Dj的编码矩阵。定义Dk对于Ai的稀疏表示为:
判别字典学习模型首先需要使用整体字典集合D能够尽可能近似地表示出任一类样本集合A,因此需要满足下式:
其次,由于子字典Di是关于第i类的,显然希望尽可能地使得第i类样本Ai也能够由相应类的子字典Di(非Dj)进行近似表示,此时误差项均应最小化;而由不同类的字典表示的值较小。根据以上的分析,最终本发明的判别项定义为:
在此基础上,改善字典集合D的判别能力,在稀疏表示项中添加多元统计分析判别约束项f(X),以使得使用字典集合D对图像集A进行表示时有着较好的区分能力。因此可以定义表示系数矩阵X的类内、类间散度矩阵如下:
其中mi表示第i类表示系数的均值,xk表示第i类中一样本表示系数,m表示为总的样本,表示均值,ni是第i类样本的个数。
多元统计分析判别准则的目标函数可以简化为tr(Sw(X))/tr(SB(X))的形式,其中tr( )表示矩阵的迹。
判别后,通过固定字典集合D来更新系数矩阵X,然后通过固定系数矩阵X来更新字典集合D,通过这种模式来求解所需的结构化字典,及对数据进行元数据固定法来结构化。具体步骤如下:
步骤501,初始化字典集合D,对D每一列以随机矢量l1范式项进行初始化;
步骤502,固定字典集合,通过IMP以迭代的形式进行求解系数集合X;迭代方式为本领域中常用的方法,在此不在扩展描述。
步骤503,固定步骤502中的X,通过下述更新D,得到最终的结构化的字典。更新D方法如下:
其中d为字典的元数据,稀疏系数X为系数矩阵,X=[β12,…,βP],这里βj,j=1,2,……,p,是矩阵的行向量,逐个更新,当更新到dj时,其他字典集合D的列被固定,比如,dl,l≠j。然后,JD被转化为下述公式:
这里让C=A-∑l≠jdlβl,则上面等式变为:
使用拉格朗日乘子,等价于下述
这里γ是一个可变量,积分考虑dj,使其变0,得到 所以的约束下,解答等式(2),这里‖·‖2是l1范式项。
使用上面的程序,可以更新所有的dj的元数据。返回公式(1),一直到JD,X的迭代最大数已经达到,最后输出D。
对数据进行结构化后,一般情况使用SRC分类器对样本进行重构,本发明使用非对称分类器进行性能评,可以使数据分析更加准确。
对数据进行线性转换,执行子集上的回归,提取潜在变量,预测软件缺陷。第一步,首先执行非线性映射Φ:对高维特征空间生成一个输入变量。然后,在这个空间进行线性偏最小二乘法。
在软件缺陷检测中, 定义为具有数目l的标签样本,和定义为有数目u的未标签样本。对于标签样本,Y={+1,-1},有缺陷模块被标记为‘+1’,没有缺陷的模块标记为‘-1’,软件缺陷数据设置为高度不平衡的状态,比如一些少数类样本(缺陷模块)相比与多数样本(非缺陷模块)数目相差悬殊。
在类区r范围设定中心M和重叠参数ε,两个分类可以被表示为M+1-M-1=ε(r+1-r-1)。参数ε表示两个区域的重叠等级。如果重叠度高,特别数据设置已经是非线性可分开的。为了克服这种重叠问题,设定如下特征值等式:
ΦΦTψψTτ=μτ (3)
这里Φ、ψ分别定义为X空间的映射矩阵和Y空间的映射矩阵,而X、Y空间均在特征空间中。而非线性特征特征选择方法可以减少两个区域的重叠,但是类的不平衡问题可以导致不能够准确识别少数类。为了减少不平衡问题带来的亏损,在数学模型中使用偏差非对称分类器可以表示为这个可以从线性回归模型导出,设定其中k是潜在变量的计数值,ti是测试数据第i个得分向量,mi表示第i个得分向量的方位,偏差b等于m1(M+1-r+1ε)。回归分析这里l是标记样本的技术,k(xi,x)是内核函数,而ai是双重回归系数。那么分类器在此推算为:
这里ai是双重回归系数,可以从最小二乘法获得,是分类器的偏差。
这里c1是第一得分τ1的位置,根据τ1计算中心值(M+1,M-1)和半径(r+1,r-1),τ可以根据等式(3)获得。
根据上述步骤,得到软件缺陷位置,用上述设计好的整套模型对软件检测模块进行缺陷检测;步骤将评估结果反馈给测试者,完成检测。
以上所述仅用以对本申请的技术方案进行了详细介绍,但以上实施例的说明只是用于帮助理解本发明的方法及其核心思想,不应理解为对本发明的限制。本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (3)

1.一种基于不对称分类评估的软件缺陷检测系统,所述系统包括软件数据输入接口、控制器以及检测结果输出端口,所述软件数据输入接口用于接收要检测的软件数据,所述控制器用于对所述软件数据进行检测,并通过所述检测结果输出端口将结果输出,其特征在于,所述软件数据为要检测的软件的软件模块。
2.如权利要求1所述的一种基于不对称分类评估的软件缺陷检测系统,其特征在于,所述控制器被构造为实现以下步骤:
步骤(1),对接收的软件模块进行检测;
步骤(2),获取原始软件度量数据集,对原始软件度量数据集的数据进行预处理;
步骤(3),将数据分为训练样本和测试样本,定义A=[A1,A2,A3……,Ai,……,Ac]为的训练样本集合,其中Ai为第i类的子样本集合,定义X=[X1,X2,X3……,Xi,……,Xc]为A关于字典集合D的表示系数矩阵;
步骤(4),对训练样本数据代入至字典学习模型,并判别;
步骤(5),通过元数据固定对所述步骤(4)中判别后的数据进行结构化;步骤(5)具体包括以下步骤,
步骤501,初始化字典集合D,对D每一列以随机矢量l1范式项进行初始化;
步骤502,固定字典集合D,通过IMP以迭代的形式进行求解系数集合X;
步骤503,通过元数据固定步骤502中的X,更新D,得到最终的结构化的字典,更新D方法如下:
<mrow> <msub> <mi>J</mi> <mi>D</mi> </msub> <mo>=</mo> <mi>arg</mi> <munder> <mi>min</mi> <mi>D</mi> </munder> <mo>{</mo> <mo>|</mo> <mo>|</mo> <mi>A</mi> <mo>-</mo> <mi>D</mi> <mi>X</mi> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>}</mo> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> <msubsup> <mi>d</mi> <mi>j</mi> <mi>T</mi> </msubsup> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mo>&amp;ForAll;</mo> <mi>j</mi> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
其中d为字典的元数据,稀疏系数X为系数矩阵,X=[β12,…,βP],这里βj,j=1,2,……,p,是矩阵的行向量,逐个更新,当更新到dj时,其他字典集合D的列被固定,比如,dl,l≠j,然后,JD被转化为下述公式,
<mrow> <msub> <mi>J</mi> <msub> <mi>d</mi> <mi>j</mi> </msub> </msub> <mo>=</mo> <mi>arg</mi> <munder> <mi>min</mi> <msub> <mi>d</mi> <mi>j</mi> </msub> </munder> <mo>{</mo> <mo>|</mo> <mo>|</mo> <mi>A</mi> <mo>-</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>l</mi> <mo>&amp;NotEqual;</mo> <mi>j</mi> </mrow> </munder> <msub> <mi>d</mi> <mi>l</mi> </msub> <msub> <mi>&amp;beta;</mi> <mi>l</mi> </msub> <mo>-</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <msub> <mi>&amp;beta;</mi> <mi>j</mi> </msub> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>}</mo> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> <msubsup> <mi>d</mi> <mi>j</mi> <mi>T</mi> </msubsup> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>=</mo> <mn>1</mn> </mrow>
设置C=A-∑l≠jdlβl,则
<mrow> <msub> <mi>J</mi> <msub> <mi>d</mi> <mi>j</mi> </msub> </msub> <mo>=</mo> <mi>arg</mi> <munder> <mi>min</mi> <msub> <mi>d</mi> <mi>j</mi> </msub> </munder> <mo>|</mo> <mo>|</mo> <mi>C</mi> <mo>-</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <msub> <mi>&amp;beta;</mi> <mi>j</mi> </msub> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> <msubsup> <mi>d</mi> <mi>j</mi> <mi>T</mi> </msubsup> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>=</mo> <mn>1</mn> </mrow>
使用拉格朗日乘子将等价于
其中γ是一个可变量,积分考虑dj,使其变0,得到 所以的约束下,解答等式(2),这里‖·‖2是l1范式项,
继而更新所有的dj的元数据。返回公式(1),一直到JD,X的迭代最大数已经达到,最后输出D;
步骤(6),使用非对称分类器对步骤(5)中结构化后的数据进行性能评估;
步骤(7),检测转入所述测试样本;
步骤(8),对测试样本使用步骤(4)、(5)、(6)进行性能评估,即对软件检测模块进行缺陷检测;
步骤(9),将评估结果反馈给测试者,完成检测。
3.如权利要求2所述的软件缺陷检测系统,其特征在于:步骤(6)中非对称分类器设计为:
步骤601,执行非线性映射Φ:对高维特征空间生成一个输入变量,在该空间进行线性偏最小二乘法。
定义为具有数目l的标签样本,和定义为有数目u的未标签样本。对于标签样本,Y={+1,-1},有缺陷模块被标记为‘+1’,没有缺陷的模块标记为‘-1’,软件缺陷数据设置为高度不平衡的状态,该状态为少数类样本(缺陷模块)相比与多数样本(非缺陷模块)数目相差悬殊;
步骤602,在类区r范围设定中心M和重叠参数ε,少数类样本与多数类样本可以被表示为M+1-M-1=ε(r+1-r-1),参数ε表示两个区域的重叠等级,如果重叠度高,设定特征值等式:
ΦΦTψψTτ=μτ (3)
这里Φ、ψ分别定义为X空间的映射矩阵和Y空间的映射矩阵,而X、Y空间均在特征空间中,为了减少不平衡问题带来的亏损,使用偏差非对称分类器可以表示为设定其中k是潜在变量的计数值,ti是测试数据第i个得分向量,mi表示第i个得分向量的方位,偏差b等于m1(M+1-r+1ε),回归分析 l是标记样本的技术,k(xi,x)是内核函数,不对称分类器在此推算为:
<mrow> <mover> <mi>Y</mi> <mo>^</mo> </mover> <mo>=</mo> <mi>s</mi> <mi>i</mi> <mi>g</mi> <mi>n</mi> <mrow> <mo>(</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>l</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <mi>k</mi> <mo>(</mo> <mrow> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>x</mi> </mrow> <mo>)</mo> <mo>-</mo> <mover> <mi>b</mi> <mo>^</mo> </mover> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>
ai是双重回归系数,可以从最小二乘法获得,是分类器的偏差。
<mrow> <mover> <mi>b</mi> <mo>^</mo> </mover> <mo>=</mo> <msub> <mi>c</mi> <mn>1</mn> </msub> <mo>*</mo> <mrow> <mo>(</mo> <msub> <mi>M</mi> <mrow> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>-</mo> <msub> <mi>r</mi> <mrow> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mi>&amp;epsiv;</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>c</mi> <mn>1</mn> </msub> <mo>*</mo> <mfrac> <mrow> <msub> <mi>M</mi> <mrow> <mo>+</mo> <mn>1</mn> </mrow> </msub> <msub> <mi>r</mi> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>M</mi> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msub> <msub> <mi>r</mi> <mrow> <mo>+</mo> <mn>1</mn> </mrow> </msub> </mrow> <mrow> <msub> <mi>r</mi> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>r</mi> <mrow> <mo>+</mo> <mn>1</mn> </mrow> </msub> </mrow> </mfrac> </mrow>
c1是第一得分τ1的位置,根据τ1计算中心值(M+1,M-1)和半径(r+1,r-1),τ可以根据等式(3)获得。
CN201711281802.4A 2017-12-07 2017-12-07 一种基于不对称分类评估的软件缺陷检测系统 Active CN108038056B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711281802.4A CN108038056B (zh) 2017-12-07 2017-12-07 一种基于不对称分类评估的软件缺陷检测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711281802.4A CN108038056B (zh) 2017-12-07 2017-12-07 一种基于不对称分类评估的软件缺陷检测系统

Publications (2)

Publication Number Publication Date
CN108038056A true CN108038056A (zh) 2018-05-15
CN108038056B CN108038056B (zh) 2020-07-03

Family

ID=62096030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711281802.4A Active CN108038056B (zh) 2017-12-07 2017-12-07 一种基于不对称分类评估的软件缺陷检测系统

Country Status (1)

Country Link
CN (1) CN108038056B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108961249A (zh) * 2018-07-19 2018-12-07 厦门理工学院 一种子宫颈癌细胞再识别诊断方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833504A (zh) * 2010-04-19 2010-09-15 张翀斌 一种基于模型检验的时序软件质量缺陷检测方法及系统
CN103594084A (zh) * 2013-10-23 2014-02-19 江苏大学 联合惩罚稀疏表示字典学习的语音情感识别方法及系统
CN104966105A (zh) * 2015-07-13 2015-10-07 苏州大学 一种鲁棒机器错误检索方法与系统
CN106778807A (zh) * 2016-11-22 2017-05-31 天津大学 基于公共字典对和类依赖字典对的细粒度图像分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833504A (zh) * 2010-04-19 2010-09-15 张翀斌 一种基于模型检验的时序软件质量缺陷检测方法及系统
CN103594084A (zh) * 2013-10-23 2014-02-19 江苏大学 联合惩罚稀疏表示字典学习的语音情感识别方法及系统
CN104966105A (zh) * 2015-07-13 2015-10-07 苏州大学 一种鲁棒机器错误检索方法与系统
CN106778807A (zh) * 2016-11-22 2017-05-31 天津大学 基于公共字典对和类依赖字典对的细粒度图像分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马樱等: "偏相关方法在软件缺陷预测中的应用", 《计算机应用研究》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108961249A (zh) * 2018-07-19 2018-12-07 厦门理工学院 一种子宫颈癌细胞再识别诊断方法

Also Published As

Publication number Publication date
CN108038056B (zh) 2020-07-03

Similar Documents

Publication Publication Date Title
Cinelli et al. Recommending multiple criteria decision analysis methods with a new taxonomy-based decision support system
WO2021143067A1 (zh) 预测加工件质量的方法、装置和计算机设备
CN106815643A (zh) 基于随机森林迁移学习的红外光谱模型传递方法
CN103605711B (zh) 支持向量机分类器的构造方法及装置、分类方法及装置
Dong et al. Sensory quality evaluation for appearance of needle-shaped green tea based on computer vision and nonlinear tools
US11852591B2 (en) Inspection device and method
CN104700368B (zh) 基于核函数的数字图像相关方法的位移场自适应平滑方法
CN108564569B (zh) 一种基于多核分类学习的混凝土裂缝检测方法及装置
Brinkman Improving the rigor and reproducibility of flow cytometry-based clinical research and trials through automated data analysis
Kriváchy et al. High-speed batch processing of semidefinite programs with feedforward neural networks
CN115423594A (zh) 企业财务风险的评估方法、装置、设备及存储介质
CN114862144A (zh) 一种适用于绩效评价的权重确定方法
CN108038055A (zh) 一种有效数据处理的软件缺陷检测方法
Kostovska et al. The importance of landscape features for performance prediction of modular CMA-ES variants
CN108038056A (zh) 一种基于不对称分类评估的软件缺陷检测系统
CN116975558A (zh) 一种基于多维项目反应理论的计算思维测评方法
CN116861358A (zh) 基于bp神经网络与多源数据融合的计算思维评测方法
Freulon et al. CytOpT: Optimal transport with domain adaptation for interpreting flow cytometry data
CN111222529A (zh) 一种基于GoogLeNet-SVM的污水曝气池泡沫识别方法
Chen et al. Linking lung airway structure to pulmonary function via composite bridge regression
CN108596430A (zh) 一种专业性购物网站设计评价方法
CN108198173A (zh) 一种混凝土裂缝区域的在线检测方法、装置及终端设备
Brown et al. Modification indices for diagnostic classification models
Draganova et al. An approach for identifying of Fusarium infected maize grains by spectral analysis in the visible and near infrared region, SIMCA models, parametric and neural classifiers
Mythily et al. An efficient feature selection algorithm for health care data analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant