CN116909901B - 基于富样本径向投影可信聚类的软件性能可视评价方法 - Google Patents

基于富样本径向投影可信聚类的软件性能可视评价方法 Download PDF

Info

Publication number
CN116909901B
CN116909901B CN202310887404.6A CN202310887404A CN116909901B CN 116909901 B CN116909901 B CN 116909901B CN 202310887404 A CN202310887404 A CN 202310887404A CN 116909901 B CN116909901 B CN 116909901B
Authority
CN
China
Prior art keywords
performance
software
index
equal
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310887404.6A
Other languages
English (en)
Other versions
CN116909901A (zh
Inventor
程锦
叶虎强
谭建荣
刘振宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202310887404.6A priority Critical patent/CN116909901B/zh
Publication of CN116909901A publication Critical patent/CN116909901A/zh
Application granted granted Critical
Publication of CN116909901B publication Critical patent/CN116909901B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3604Software analysis for verifying properties of programs
    • G06F11/3608Software analysis for verifying properties of programs using formal methods, e.g. model checking, abstract interpretation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Mathematical Optimization (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种基于富样本径向投影可信聚类的软件性能可视评价方法。将富样本条件下的数据集进行标准化处理,通过有界概率变量建立各性能指标的数学描述并计算其可信度,从而获得软件性能二级指标可信得分。将各软件性能二级指标可信得分整合为一系列二级性能指标可信得分向量构成的多维度数据点,通过受力平衡原理确定各多维数据点的径向投影坐标,生成Radviz图,对其进行聚类分析,获得软件性能评价结果。该方法充分利用已有富样本测试数据,并考虑了通过自动化测试获得的性能测试数据的波动,结合可视化技术进行软件性能评价,结果直观可信。

Description

基于富样本径向投影可信聚类的软件性能可视评价方法
技术领域
本发明涉及软件性能评价领域,尤其涉及一种基于富样本径向投影可信聚类的软件性能可视评价方法。
背景技术
软件性能优劣往往是用户在多款功能相似的软件中选择适用工具时需考虑的重要因素。软件性能指标数据往往需通过测试获得,受测试环境不确定性的影响,即使采用相同的测试工具和测试用例对同一款软件进行多次重复测试所得的同一性能指标值也往往存在一定的波动。软件性能响应数据包括执行各类性能测试用例时所需的响应时间、内存占用量等不同类型,各类数据具有不同的量纲和不同的数量级,其值难以直接反映软件性能的优劣。此外,现有基于纯数学运算处理的软件性能评价方法不够直观。
发明内容
现有基于测试数据的软件性能评价方法没有考虑大量重复测试所得不确定性测试数据数学描述方式对评价结果可信度的影响,且不够直观。本发明的目的在于提供一种基于富样本径向投影可信聚类的软件性能可视评价方法,该方法针对样本量充足的软件性能指标测试数据建立各性能指标的有界概率描述并计算其可信度,从而利用富样本数据获得性能指标的可信得分,进而通过径向投影生成Radviz图并进行聚类分析,直观获得软件性能的评价结果。
本发明的目的是通过以下技术方案来实现的:一种基于富样本径向投影可信聚类的软件性能可视评价方法,包括如下步骤:
S1:确定软件性能评价指标集,包括性能一级指标Pri,1≤i≤IPr及其下属的性能二级指标Prij,1≤j≤Ji,其中,IPr为性能一级指标个数,Ji为性能一级指标Pri下的性能二级指标个数;
S2:执行N次测试,获取各性能二级指标的原始测试数据,并进行标准化处理得到标准化数据;
S3:将软件性能评价指标的标准化数据n=1,2,…,N整合为对应的样本集样本集中的最小值和最大值分别为/>和/>计算获得样本集/>的均值为方差为/>将均值和方差在区间/>内进行线性变换得到/>进而获得广义贝塔分布的形状参数/>与/>设一个概率不确定性变量/>其广义贝塔分布的有界概率密度函数为:
其中Γ(·)是伽马函数;获取此概率密度变量的期望表示性能二级指标得分,标准差/>表示性能二级指标得分的不确定性,性能二级指标的不确定度为可信度为/>
S4:将各性能二级指标得分与可信度相乘,获得富样本条件下基于有界概率变量描述的软件性能二级指标可信得分
S5:假设有M款软件进行比较,每款软件的性能二级指标可信得分为Exm,k,1≤m≤M,1≤k≤K,其中K为所有一级指标对应的二级指标的个数之和,即将Exm,k,1≤m≤M,1≤k≤K整合为一个包含各款软件所有性能二级指标可信得分的二维数据矩阵EM×K,EM×K中的每一行Em=(Exm,1,...,Exm,K),1≤m≤M为第m个软件性能二级指标可信得分向量构成的K维数据点,包含该款软件所对应的所有性能二级指标可信得分;对于K维数据点Em=(Exm,1,...,Exm,K),其第k,1≤k≤K维度的值Exm,k即为第k个弹簧的弹性系数,每个弹簧一端的端点按顺序从与x轴正方向的夹角为0度时开始逆时针均匀分布于单位圆圆周上,将每个端点在圆周上的位置点与圆心连线,每个指标的角度θk定义为该连线与x轴正方向的夹角,各端点Rk的坐标为(cosθk,sinθk),另一端固定在同一个平衡位置点Pm上,根据受力平衡原理,标量化计算点Pm的坐标(xm,ym),即径向投影点坐标为
S6:对二维数据矩阵EM×K中的所有数据点进行径向投影计算对应坐标,得到Radviz图;
S7:对通过径向投影获得的Radviz图进行聚类分析,直观获得软件性能可视评价结果。
进一步地,步骤S2中,对性能二级指标Prij的总共N个原始测试数据中的第n个数据样本若Prij为效益型指标,即/>越大反映对应的软件性能越好,则标准化数据若Prij为成本型指标,即/>越大反映对应的软件性能越差,则标准化数据/>其中/>和/>分别为所有参与测试的软件的同一性能二级指标Prij对应的响应数据最大值和最小值。
本发明的有益效果在于:
(1)利用有界概率变量来描述富样本条件下软件性能指标的不确定性,进而计算各性能指标的可信度,从而在性能指标量化过程中充分考虑了软件性能富样本测试数据中所蕴含的概率不确定性的影响,获得了基于有界概率变量的软件性能指标可信得分。
(2)利用软件性能指标的可信得分,通过基于受力平衡的径向投影生成了Radviz图,能够直观地反映不同软件性能指标的相似度,进而直观地分析比较不同软件性能的优劣。
附图说明
下面结合附图和实施例对本发明进一步说明:
图1是本发明方法的流程图;
图2是本发明实施例提供的三款三维CAD软件富样本测试数据径向可信投影生成的Radviz图。
具体实施方式
下面根据附图和优选实施例详细描述本发明,本发明的目的和效果将变得更加明白,应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明提出的基于富样本径向投影可信聚类的软件性能可视评价方法,具体包括如下步骤:
S1:确定软件性能评价指标集,包括性能一级指标Pri(1≤i≤IPr)及其下属的性能二级指标Prij(1≤j≤Ji),其中,IPr为性能一级指标个数,Ji(1≤i≤IPr)为性能一级指标Pri下的性能二级指标个数;
S2:执行N次测试,获取各性能二级指标的原始测试数据,并进行标准化处理得到标准化数据;
S3:将软件性能评价指标的标准化数据(n=1,2,…,N)整合为对应的样本集样本集中的最小值和最大值分别为/>和/>计算获得样本集/>的均值为方差为/>将均值和方差在区间/>内进行线性变换得到/>进而获得广义贝塔分布的形状参数/>与/>设一个概率不确定性变量/>其广义贝塔分布的有界概率密度函数为:
其中Γ(·)是伽马函数;获取此概率密度变量的期望表示性能二级指标得分,标准差/>表示性能二级指标得分的不确定性,性能二级指标的不确定度为可信度为/>
S4:将各性能二级指标得分与可信度相乘,获得富样本条件下基于有界概率变量描述的考虑指标可信度的软件性能二级指标可信得分
S5:假设有M款软件进行比较,每款软件的性能二级指标可信得分为Exm,k,1≤m≤M,1≤k≤K,其中K为所有一级指标对应的二级指标的个数之和,即将Exm,k,1≤m≤M,1≤k≤K整合为一个包含各款软件所有性能二级指标可信得分的二维数据矩阵EM×K,EM×K中的每一行Em=(Exm,1,...,Exm,K),(1≤m≤M)为第m个软件性能二级指标可信得分向量构成的K维数据点,包含该款软件所对应的所有性能二级指标可信得分;对于K维数据点Em=(Exm,1,...,Exm,K),(1≤m≤M),其第k,1≤k≤K维度的值Exm,k即为第k个弹簧的弹性系数,每个弹簧一端的端点按顺序从与x轴正方向的夹角为0度时开始逆时针均匀分布于单位圆圆周上,将每个端点在圆周上的位置点与圆心连线,每个指标的角度θk定义为该连线与x轴正方向的夹角,各端点Rk的坐标为(cosθk,sinθk),另一端固定在同一个平衡位置点Pm上,根据受力平衡原理,标量化计算点Pm的坐标(xm,ym),即径向投影点坐标为
S6:对二维数据矩阵EM×K中的所有数据点进行径向投影计算对应坐标,得到Radviz图;
S7:对通过径向投影获得的Radviz图进行聚类分析,直观获得软件性能可视评价结果。
进一步地,步骤S2中,对性能二级指标Prij的总共N个原始测试数据中的第n个数据样本若Prij为效益型指标,即/>越大反映对应的软件性能越好,则标准化数据若Prij为成本型指标,即/>越大反映对应的软件性能越差,则标准化数据/>其中/>和/>分别为所有参与测试的软件的同一性能二级指标Prij对应的响应数据最大值和最小值。
以下结合附图和实例对本发明作进一步说明。
参见图1,针对富样本条件下三维CAD软件性能的可视评价,选择三维建模、布尔运算、模型加载、装配设计、尺寸标注、工程图设计作为六个性能一级指标,各一级指标又由一系列具体二级指标组成,每个二级指标使用3个较为复杂的模型作为测试用例,通过自动化测试工具获得各性能二级指标的响应数据。各层级性能评价指标如表1所示。
表1三维CAD软件性能评价指标
通过自动化测试工具分别得到CATIA、ZW3D、KM3DCAD三款软件(分别用A、B、C表示)的测试数据,其中CATIA(A)是对标软件。三款软件的每个二级指标重复测试50组数据,其中CATIA软件的所有预处理后的标准化数据如表2所示。
表2CATIA软件50组测试数据标准化后的结果
依据标准化数据建立有界概率密度函数,用期望表示指标得分,用标准差/>表示指标得分的不确定度,并计算三维CAD软件性能二级指标的可信度/>其中CATIA软件的性能二级指标得分及可信度如表3所示。进而将可信度与对应二级指标得分相乘,获得A、B、C三款软件考虑可信度的二级指标可信得分/>具体如表4所示。
表3CATIA软件基于有界概率不确定性描述的性能二级指标得分及可信度
表4A、B、C三款软件考虑可信度的性能二级指标可信得分
将表4中A、B、C三款软件的各自考虑可信度的二级指标可信得分排为一行,得到一个3×14大小的矩阵,每一行作为一个性能二级指标可信得分向量构成的十四维度数据点。每个数据点有14个特征(即二级指标),其在单位圆上的位置及三角函数如表5所示。通过基于受力平衡的径向投影获得各个数据点的二维坐标值,具体数据如表6所示。不同软件各二级指标对应圆上各弹簧固定端,得到三款三维CAD软件性能测试数据考虑可信度的Radviz图,见图2。
表5各二级指标角度及其三角函数值
表6三款软件所有数据点在二维平面中的坐标
数据点标号 x y
A 0.173 -0.033
B 0.200 0.044
C -0.195 -0.285
分析图2中的Radviz图,可以很明显地观察到,B软件对应的数据点在二维平面上的投影相比于C软件对应的数据点在二维平面上的投影更加靠近对标软件A对应的数据点在二维平面上的投影,即B软件和A软件数据点间的距离更近,其性能更加接近,B软件性能优于C软件。
本领域普通技术人员可以理解,以上所述仅为发明的优选实例而已,并不用于限制发明,尽管参照前述实例对发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内,所做的修改、等同替换等均应包含在发明的保护范围之内。

Claims (1)

1.基于富样本径向投影可信聚类的软件性能可视评价方法,其特征在于,包括如下步骤:
S1:确定软件性能评价指标集,包括性能一级指标Pri,1≤i≤IPr及其下属的性能二级指标Prij,1≤j≤Ji,其中,IPr为性能一级指标个数,Ji为性能一级指标Pri下的性能二级指标个数;
S2:执行N次测试,获取各性能二级指标的原始测试数据,并进行标准化处理得到标准化数据;对性能二级指标Prij的总共N个原始测试数据中的第n个数据样本若Prij为效益型指标,即/>越大反映对应的软件性能越好,则标准化数据/>若Prij为成本型指标,即/>越大反映对应的软件性能越差,则标准化数据其中/>和/>分别为所有参与测试的软件的同一性能二级指标Prij对应的响应数据最大值和最小值;
S3:将软件性能评价指标的标准化数据整合为对应的样本集/>样本集中的最小值和最大值分别为/>和/>计算获得样本集/>的均值为/>方差为/>将均值和方差在区间/>内进行线性变换得到进而获得广义贝塔分布的形状参数/>与/>设一个概率不确定性变量/>其广义贝塔分布的有界概率密度函数为:
其中Γ(·)是伽马函数;获取此概率密度变量的期望表示性能二级指标得分,标准差/>表示性能二级指标得分的不确定性,性能二级指标的不确定度为可信度为/>
S4:将各性能二级指标得分与可信度相乘,获得富样本条件下基于有界概率变量描述的软件性能二级指标可信得分
S5:假设有M款软件进行比较,每款软件的性能二级指标可信得分为Exm,k,1≤m≤M,1≤k≤K,其中K为所有一级指标对应的二级指标的个数之和,即将Exm,k,1≤m≤M,1≤k≤K整合为一个包含各款软件所有性能二级指标可信得分的二维数据矩阵EM×K,EM×K中的每一行Em=(Exm,1,...,Exm,K),1≤m≤M为第m个软件性能二级指标可信得分向量构成的K维数据点,包含该款软件所对应的所有性能二级指标可信得分;对于K维数据点Em=(Exm,1,...,Exm,K),其第k,1≤k≤K维度的值Exm,k即为第k个弹簧的弹性系数,每个弹簧一端的端点按顺序从与x轴正方向的夹角为0度时开始逆时针均匀分布于单位圆圆周上,将每个端点在圆周上的位置点与圆心连线,每个指标的角度θk定义为该连线与x轴正方向的夹角,各端点Rk的坐标为(cosθk,sinθk),另一端固定在同一个平衡位置点Pm上,根据受力平衡原理,标量化计算点Pm的坐标(xm,ym),即径向投影点坐标为
S6:对二维数据矩阵EM×K中的所有数据点进行径向投影计算对应坐标,得到Radviz图;
S7:对通过径向投影获得的Radviz图进行聚类分析,直观获得软件性能可视评价结果。
CN202310887404.6A 2023-07-19 2023-07-19 基于富样本径向投影可信聚类的软件性能可视评价方法 Active CN116909901B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310887404.6A CN116909901B (zh) 2023-07-19 2023-07-19 基于富样本径向投影可信聚类的软件性能可视评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310887404.6A CN116909901B (zh) 2023-07-19 2023-07-19 基于富样本径向投影可信聚类的软件性能可视评价方法

Publications (2)

Publication Number Publication Date
CN116909901A CN116909901A (zh) 2023-10-20
CN116909901B true CN116909901B (zh) 2024-04-05

Family

ID=88352631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310887404.6A Active CN116909901B (zh) 2023-07-19 2023-07-19 基于富样本径向投影可信聚类的软件性能可视评价方法

Country Status (1)

Country Link
CN (1) CN116909901B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076293B (zh) * 2023-07-19 2024-04-05 浙江大学 基于贫样本层次可信聚类热力图的软件性能可视评价方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055466A (ja) * 2008-08-29 2010-03-11 Fuji Electric Systems Co Ltd セットベース設計手法を用いた製品最適化設計支援システム
WO2016180127A1 (zh) * 2015-09-16 2016-11-17 中兴通讯股份有限公司 一种网络性能的评估方法及系统
CN110162568A (zh) * 2019-05-24 2019-08-23 东北大学 一种基于PCA-Radviz的三维数据可视化方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055466A (ja) * 2008-08-29 2010-03-11 Fuji Electric Systems Co Ltd セットベース設計手法を用いた製品最適化設計支援システム
WO2016180127A1 (zh) * 2015-09-16 2016-11-17 中兴通讯股份有限公司 一种网络性能的评估方法及系统
CN110162568A (zh) * 2019-05-24 2019-08-23 东北大学 一种基于PCA-Radviz的三维数据可视化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《Radviz可视化技术度量模型的研究》;曾晶;《信息科技》;20110915;全文 *
《基于平行坐标和径向坐标的多维数据可视化方法研究》;方子璇;《信息科技》;20200515;全文 *

Also Published As

Publication number Publication date
CN116909901A (zh) 2023-10-20

Similar Documents

Publication Publication Date Title
van der Ark et al. A latent class approach to estimating test-score reliability
CN116909901B (zh) 基于富样本径向投影可信聚类的软件性能可视评价方法
CN108830554A (zh) 基于任务模型的数据成果信息质量智能检测方法和系统
Ray et al. On the upper bound of the number of modes of a multivariate normal mixture
CN112579783B (zh) 基于拉普拉斯图谱的短文本聚类方法
CN114281809A (zh) 一种多源异构数据清洗方法及装置
CN111209316A (zh) 一种信息素养数据挖掘方法、装置、电子设备及存储介质
Zhao et al. A comprehensive performance evaluation of 3-D transformation estimation techniques in point cloud registration
CN110990639B (zh) 一种教育信息化水平趋势分析的数据处理方法及装置
Lederer et al. Linear Regression
CN112307086B (zh) 一种消防业务中自动化数据校验方法及装置
CN109614074A (zh) 基于概率转移矩阵模型的近似加法器可靠度计算方法
CN112200252A (zh) 基于概率盒全局灵敏度分析和主动子空间的联合降维方法
CN105183804A (zh) 一种基于本体的聚类服务方法
CN115752243A (zh) 一种测量数据融合方法
CN114491699A (zh) 基于拓展区间数的三维cad软件易用性量化方法及装置
CN117076293B (zh) 基于贫样本层次可信聚类热力图的软件性能可视评价方法
CN111985826B (zh) 一种多指标工业产品的可视化质量分级方法和系统
CN114490412A (zh) 基于自减逆向云发生器的三维cad软件性能度量方法及装置
CN114511745A (zh) 三维点云分类及旋转姿态预测方法及系统
CN110569892B (zh) 一种泛在定位信号静态定位方法及系统
Myslin et al. State Approach-Index-based Measurement.
CN115902814B (zh) 基于信息空间度量的目标识别模型性能评估方法和装置
CN112085421A (zh) 一种基于深度bp神经网络的教师教学效果评价方法
KR101671908B1 (ko) 조립체 모델 비교 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant