CN103186711A - 基于非正交坐标系下软件成本评估方法 - Google Patents

基于非正交坐标系下软件成本评估方法 Download PDF

Info

Publication number
CN103186711A
CN103186711A CN2012103788559A CN201210378855A CN103186711A CN 103186711 A CN103186711 A CN 103186711A CN 2012103788559 A CN2012103788559 A CN 2012103788559A CN 201210378855 A CN201210378855 A CN 201210378855A CN 103186711 A CN103186711 A CN 103186711A
Authority
CN
China
Prior art keywords
coordinate system
orthogonal coordinate
attribute
mutual information
under
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012103788559A
Other languages
English (en)
Other versions
CN103186711B (zh
Inventor
刘琴
朱宏明
杨筱雯
关瑞博
褚晓圆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN201210378855.9A priority Critical patent/CN103186711B/zh
Publication of CN103186711A publication Critical patent/CN103186711A/zh
Application granted granted Critical
Publication of CN103186711B publication Critical patent/CN103186711B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于非正交坐标系下软件成本评估方法,其特征在于:该方法包括以下步骤:计算任意两个已知属性间的互信息值;将该互信息值转换成非正交坐标系下两个坐标轴的夹角,建立非正交坐标系;该非正交坐标系下的每个坐标轴分别对应每个已知属性;计算已知属性与预测成本属性间的互信息,同样把该互信息值转换成对应已知属性的权重;把用来估算软件成本的历史案例和当前案例映射在该非正交坐标系下,根据欧式距离和Cosine定理找到与当前案例最为相似的历史案例,之后输出历史案例进行成本估算。本发明一方面去除已知属性间的冗余度,另一方面增强已知属性与被预测属性间的相关性。

Description

基于非正交坐标系下软件成本评估方法
技术领域
本发明涉及一种基于互信息函数定义非正交坐标系下坐标轴间的夹角,并在该非正交坐标系下度量当前案例与历史案例间的相似度,由此对当前案例进行成本估算。
背景技术
随着软件系统复杂度的增长,其规模也呈现相应的趋势,在19世纪60年代末期软件危机(如预算超支,软件进度滞后等现象)的出现,预示着软件成本估算将在软件开发过程中扮演者举足轻重的作用。同时,随着研究重点的转向,基于类比方法的研究成为日前炙手可热的技术。
类比方法是基于CBR(case-based reasoning)技术在软件成本估算中的一种应用,即通过当前案例的属性在历史案例中寻找最为相似的案例,并对当前案例的成本进行评估。这里需要说明的是当前案例是指待评估的软件成本,而历史案例是指已经完成的项目。这个过程好比人类的学习过程,当我们学习新的知识时,总会不由自主地联系已学的知识,试图寻找到新知识的突破口,这个过程就是寻找相似度的过程。由上述过程可以看出,基于类比方法进行软件成本估算需解决三个主要问题:1)不同的已知属性对被预测属性的作用力不同,因此如何区分属性的作用力将在选择相似的历史案例过程中起到很大的作用;2)如何度量相似度,即如何建立相似度的数学模型;3)考虑到已知属性间的关系并不是完全独立的,因此属性间的冗余度将会直接影响到对软件成本估算的准确率。由上述背景分析可以看出相似度的度量则是基于CBR算法进行类比的重中之重,而如何去除掉属性间的冗余度以及如何区分不同属性对预测属性的作用力则是评价方法好坏的标准。
传统的相似度度量方法是基于正交直接坐标系下,根据当前案例和历史案例间的距离。这里有两种形式:一种是不加权重的欧式距离,另一种则是赋予权重的欧式距离,但是这个权重的数值则是由专家指定,很难说清该权重值的意义,因此要找到具有说服力和符合数学性质的权重实属不易。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于非正交坐标系下软件成本评估方法,用于解决现有技术中难以去除掉属性间的冗余度以难以区分不同属性对预测属性的作用力的问题。
为实现上述目的及其他相关目的,本发明提供一种基于非正交坐标系下软件成本评估方法,该方法包括以下步骤:
1)计算任意两个已知属性间的互信息值;
2)将该互信息值转换成非正交坐标系下两个坐标轴的夹角,建立非正交坐标系;该非正交坐标系下的每个坐标轴分别对应每个已知属性;
3)计算已知属性与预测成本属性间的互信息,同样把该互信息值转换成对应已知属性的权重;
4)把用来估算软件成本的历史案例和当前案例映射在该非正交坐标系下,根据欧式距离和Cosine定理找到与当前案例最为相似的历史案例,之后输出历史案例进行成本估算。
优选地,该方法进一步包括通过MMRE和Pred方法对估算结果进行评价的步骤。
优选地,所述步骤2)中,在该非正交坐标系中每一维度分别代表每一个已知属性。
优选地,所述步骤4)中应用CBR算法,利用非正交坐标系下的距离与Cosine定理相结合寻找出与当前案例最相似的历史案例进行估算。
本发明在计算案例间的相似度问题上,消除已知属性间的冗余度,并为每个已知属性赋予一个能够具有说服力和满足数学性质的权重来区分每个已知属性对被预测属性预测的能力。
本发明首先基于互信息函数表示已知属性间的冗余度,同时考虑到已知属性间的关系并不是完全独立的,因此利用互信息的函数表示属性间的夹角;其次权重的赋值也考虑到相应属性的物理含义(即,对被预测属性的作用力越强,则权重应越大);最后利用非正交坐标系下的距离公式和Cosine定理,查找案例在高维空间中的投影,投影角度越小,距离越小越相似。
附图说明
图1为本发明的基于非正交坐标系下估算软件成本方法使用的数据样本中Function Point(FP,已知属性)与Summary Work Effort(SWE,预测成本属性)间的关系。
其中,图中矩形表示当前要预测的案例,三角形表示按cosine定理找到的历史相似案例,圆圈表示按照欧式距离找到的历史相似案例。
图2为本发明的基于非正交坐标系下估算软件成本方法使用的数据样本中Time与SWE间的关系。
图3为本发明的基于非正交坐标系下估算软件成本方法使用的数据样本中Time,FP,Organization Type和SWE任意两两间的关系。
图4为本发明的流程示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
请参阅图1所示。需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
本发明提供一种基于非正交坐标系下软件成本评估方法,该方法包括以下步骤:
1)计算任意两个已知属性间的互信息值;
2)将该互信息值转换成非正交坐标系下两个坐标轴的夹角,建立非正交坐标系;该非正交坐标系下的每个坐标轴分别对应每个已知属性;
3)计算已知属性与预测成本属性间的互信息,同样把该互信息值转换成对应已知属性的权重;
4)把用来估算软件成本的历史案例和当前案例映射在该非正交坐标系下,根据欧式距离和Cosine定理找到与当前案例最为相似的历史案例,之后输出历史案例进行成本估算。
本发明首先通过计算出任意两个已知属性间的互信息,本实施例中,X,Y分别代表本发明中的属性列,如X代表“时间”属性,Y代表“函数点”属性
互信息的计算公式:I(X,Y)=H(X)-H(X|Y),这里I(X,Y)是X和Y的互信息,H(X)为X的熵,H(X|Y)是条件熵。
H(X)的计算公式:H(X)=-Σx∈Xp(x)logp(x),这里p(x)是离散随机变量X的概率密度函数。
H(X|Y)的计算公式:H(X|Y)=-Σx∈XΣy∈Yp(x,y)logp(x|y),
这里p(x|y)是一对离散随机变量(X,Y)的条件分布。
H(X,Y)的计算公式:H(X,Y)=-Σx∈XΣy∈Yp(x,y)logp(x|y),H(X,Y)是X和Y的联合熵,这里p(x|y)是一对离散随机变量(X,Y)的联合分布。
例如:设(X,Y)服从如下联合分布:
Figure BDA0000222666601
经计算得: H ( X | Y ) = 11 8 H ( X ) = 7 4 I ( X , Y ) = 3 8 H ( X , Y ) = 27 8
利用算出来的互信息值进行关系转换,把该数值转换成非正交坐标系下两个坐标轴间的夹角,建立非正交坐标系,而该非正交坐标系下的每个坐标轴分别对应每一个已知属性。
本实施例中,当获知任意两个属性的互信息值后,通过下面的公式将互信息转换成非正交坐标系下的坐标轴夹角。
互信息转夹角公式:
θ = [ 1 - I ( X , Y ) H ( X , Y ) ] * π 2
这里θ为两个属性间的夹角,H(X,Y)为离散变量(X,Y)的联合熵。按照上例结果得出
Figure BDA0000222666607
与此同时,计算已知属性与预测成本属性间的互信息,同样把该互信息值转换成对应已知属性的权重。
本实施例中,权重公式:
Figure BDA0000222666608
,其中设变量X为一种属性(如“时间”),变量Y为预测成本属性,得出的ω为权重值。
最后,由于之前的夹角计算,这时非正交坐标系已经建立完成,把本发明中所用到的用来估算软件成本的历史案例和当前案例映射的非正交坐标系下,根据欧式距离和Cosine定理找到与当前案例最为相似的历史案例,之后输出历史案例进行成本估算。
当已知的两两属性间的夹角计算完成后,按照计算出来的夹角建立非正交坐标系。之后按照案例值映射的非正交坐标系下。假设在正交坐标系下,A点的坐标是(1,2,3),B点的坐标是(2,3,1),其分别对应的是x,y,z轴的坐标值。同理,我们这里计算后的坐标轴的夹角不是90度,案例映射到非正交坐标系下,同样也是按照在每个坐标系下对应的值。
dis表示空间中两点间的距离,x和y分别表示当前案例和某一历史案例在非正交坐标系下的两个点。
按照前文所述,将当前案例和历史案例都映射到非正交坐标系后,根据欧式距离公式:d
Figure BDA0000222666609
,这里θ为坐标轴x和y的夹角。设A为经坐标原点和当前案例的直线,B为经过坐标原点和任意一个历史案例的直线,β为A和B的夹角。先按照与当前案例节点的距离大小排列,之后当距离相同时,则β夹角越小排名越靠前,最后选取排名最靠前的几个案例作为评估。
通过定义两两已知属性间的夹角,有利于在度量当前案例与历史案例间相似度的过程中能有效地消除已知属性间的冗余度。
通过为每个已知属性赋予一定的权重,增强已知属性与被预测属性间的相关性,这样将有效地区分不同的已知属性对被预测属性的作用能力。
通过数据在高维空间内的映射角度来的方式度量当前案例与历史案例间的相似度,这样将以更直观地方式呈现当前案例与历史案例间的相似度。
本实施例中,考虑到估算软件成本平台中所使用的样本数据ISBSG(International Software Benchmarking Standards Group)和Desharnails中属性间的特点(任意两个属性都不是完全独立的),因此本发明利用基于互信息的函数来衡量两两已知属性间的冗余度,在描述该非正交坐标系时,已知属性间的冗余度便用两两坐标轴之间的夹角来表示,一般来说,两两已知属性间的互信息越大,则表示这两个属性间的冗余度越大,在该非正交坐标系上则表示两个坐标轴间的夹角越小。
考虑到估算软件成本平台在估算成本时,每个属性对预测成本属性的作用力不同,因此本发明利用基于互信息的函数来表示不同的已知属性对预测成本属性的作用力,一般来说,已知属性与预测成本属性的互信息越大,则代表该属性对预测成本属性的作用力越强,因此分配较大的权重。
考虑到传统的度量案例间相似度所有的方法—欧氏距离,存在如图所示的问题,因此在度量案例间相似度的问题上结合Cosine定理进行度量,一般来说,在用欧式距离度量相似度的情况下,案例间距离越近则表示案例越相似,而用Cosine定理的情况下,案例间的角度越小则表示案例越相似。
综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (4)

1.一种基于非正交坐标系下软件成本评估方法,其特征在于:该方法包括以下步骤:
1)计算任意两个已知属性间的互信息值;
2)将该互信息值转换成非正交坐标系下两个坐标轴的夹角,建立非正交坐标系;该非正交坐标系下的每个坐标轴分别对应每个已知属性;
3)计算已知属性与预测成本属性间的互信息,同样把该互信息值转换成对应已知属性的权重;
4)把用来估算软件成本的历史案例和当前案例映射在该非正交坐标系下,根据欧式距离和Cosine定理找到与当前案例最为相似的历史案例,之后输出历史案例进行成本估算。
2.根据权利要求1所述的基于非正交坐标系下软件成本评估方法,其特征在于:该方法进一步包括通过MMRE和Pred方法对估算结果进行评价的步骤。
3.根据权利要求1所述的基于非正交坐标系下软件成本评估方法,其特征在于:所述步骤2)中,在该非正交坐标系中每一维度分别代表每一个已知属性。
4.根据权利要求1所述的基于非正交坐标系下软件成本评估方法,其特征在于:所述步骤4)中应用CBR算法,利用非正交坐标系下的距离与Cosine定理相结合寻找出与当前案例最相似的历史案例进行估算。
CN201210378855.9A 2012-10-08 2012-10-08 基于非正交坐标系下软件成本评估方法 Expired - Fee Related CN103186711B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210378855.9A CN103186711B (zh) 2012-10-08 2012-10-08 基于非正交坐标系下软件成本评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210378855.9A CN103186711B (zh) 2012-10-08 2012-10-08 基于非正交坐标系下软件成本评估方法

Publications (2)

Publication Number Publication Date
CN103186711A true CN103186711A (zh) 2013-07-03
CN103186711B CN103186711B (zh) 2016-04-20

Family

ID=48677878

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210378855.9A Expired - Fee Related CN103186711B (zh) 2012-10-08 2012-10-08 基于非正交坐标系下软件成本评估方法

Country Status (1)

Country Link
CN (1) CN103186711B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472011A (zh) * 2019-07-19 2019-11-19 平安科技(深圳)有限公司 一种诉讼成本预测方法、装置及终端设备
CN113011689A (zh) * 2019-12-19 2021-06-22 中国移动通信集团辽宁有限公司 软件开发工作量的评估方法、装置及计算设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156641A (zh) * 2011-04-20 2011-08-17 中国科学院软件研究所 一种软件成本置信区间预测方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156641A (zh) * 2011-04-20 2011-08-17 中国科学院软件研究所 一种软件成本置信区间预测方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
J.WEN等: "Improve Analogy-Based Software Effort Estimation Using Principal Components Analysis and", 《SOFTWARE ENGINEERING CONFERENCE, 2009. APSEC 09》 *
YF.LI等: "A study of mutual information based feature selection for case based reasoning in software cost estimation", 《A STUDY OF MUTUAL INFORMATION BASED FEATURE SELECTION FOR CASE BASED REASONING IN SOFTWARE COST ESTIMATION》 *
方礼远等: "基于类比方法的软件成本估算工具的分析与设计", 《科技信息(学术版)》 *
李效云等: "一种改进的类比估算方法及案例研究", 《计算机应用与软件》 *
蒋国萍等: "基于主成分分析的军用软件成本类比估算", 《舰船电子工程》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472011A (zh) * 2019-07-19 2019-11-19 平安科技(深圳)有限公司 一种诉讼成本预测方法、装置及终端设备
CN110472011B (zh) * 2019-07-19 2023-07-14 平安科技(深圳)有限公司 一种诉讼成本预测方法、装置及终端设备
CN113011689A (zh) * 2019-12-19 2021-06-22 中国移动通信集团辽宁有限公司 软件开发工作量的评估方法、装置及计算设备
CN113011689B (zh) * 2019-12-19 2024-05-07 中国移动通信集团辽宁有限公司 软件开发工作量的评估方法、装置及计算设备

Also Published As

Publication number Publication date
CN103186711B (zh) 2016-04-20

Similar Documents

Publication Publication Date Title
Zhan et al. A novel soft rough set: Soft rough hemirings and corresponding multicriteria group decision making
Jiang et al. Failure mode and effects analysis based on a novel fuzzy evidential method
Klamroth Single-facility location problems with barriers
GB2547816A (en) Actually-measured marine environment data assimilation method based on sequence recursive spare filtering three-dimensional variation
CN106600534A (zh) 一种基于多尺度小波支持向量机优化的克里金空间插值方法
CN104778173A (zh) 目标用户确定方法、装置及设备
CN107016649A (zh) 一种基于局部低秩张量估计的视觉数据补全方法
Patiniotakis et al. Managing imprecise criteria in cloud service ranking with a fuzzy multi-criteria decision making method
CN110001653A (zh) 一种驾驶行为评估方法、服务器及计算机可读介质
WO2023160162A1 (zh) 预测碰撞仿真结果的方法、装置、设备及存储介质
CN102656581B (zh) 信息处理设备、信息处理方法和存储介质
Sahu et al. Fuzziness: a mathematical tool
CN106525466A (zh) 一种动车组制动系统关键部件鲁棒滤波方法和系统
CN103699650A (zh) 消息传播预测方法及装置
Kovalev et al. Railway vehicle dynamics: Some aspects of wheel–rail contact modeling and optimization of running gears
CN103186711B (zh) 基于非正交坐标系下软件成本评估方法
Hovanov et al. The making of index numbers under uncertainty
CN102254184B (zh) 一种多物理域特征信息融合方法
CN108764523A (zh) 基于无偏非齐次灰色模型和马氏模型的交通事故预测方法
Sotoudeh-Anvari et al. A new data envelopment analysis in fully fuzzy environment on the base of the degree of certainty of information
CN106202694A (zh) 基于组合预测方法的组合Kriging模型构建方法
CN104850711A (zh) 一种机电产品设计标准选择方法
CN112016956B (zh) 基于bp神经网络的矿石品位估值方法及装置
CN111126706B (zh) 基于知识驱动的功能变更传播路径和工作量预测方法
CN108053266A (zh) 一种专利价值预估方法以及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160420

Termination date: 20181008

CF01 Termination of patent right due to non-payment of annual fee