CN115147071A - 一种软件研发成本估算方法 - Google Patents

一种软件研发成本估算方法 Download PDF

Info

Publication number
CN115147071A
CN115147071A CN202210687996.2A CN202210687996A CN115147071A CN 115147071 A CN115147071 A CN 115147071A CN 202210687996 A CN202210687996 A CN 202210687996A CN 115147071 A CN115147071 A CN 115147071A
Authority
CN
China
Prior art keywords
software
items
development
cost estimation
cost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210687996.2A
Other languages
English (en)
Inventor
徐爱霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yihai Yunfeng Technology Co ltd
Original Assignee
Shenzhen Yihai Yunfeng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yihai Yunfeng Technology Co ltd filed Critical Shenzhen Yihai Yunfeng Technology Co ltd
Priority to CN202210687996.2A priority Critical patent/CN115147071A/zh
Publication of CN115147071A publication Critical patent/CN115147071A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0278Product appraisal

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Stored Programmes (AREA)

Abstract

一种软件研发成本估算方法包括两部分,一是对已经进行精确软件成本估算或成本统计的历史项目进行标注和数据准备,包括将项目采购单位、项目名称和项目简介文本进行合并、分词、制作语料库、TF‑IDF模型构建,从而生成了所有历史项目的TF‑IDF文本矢量列表,还包括标注项目的实际开发成本(或精确估算成本),项目的功能点数,需求调整因子,软件因素调整因子,开发因素调整因子等;二是对某个单一新项目进行软件成本估算,包括新项目文本矢量生成、相似度计算、其他已知信息的获取和标注、历史项目的已知数据量化以及软件开发成本估算。

Description

一种软件研发成本估算方法
【技术领域】
本发明涉及计算机领域,具体为一种软件研发成本估算方法。
【背景技术】
近年来我国计算机软件份额占IT行业的比例越来越高,但在软件硏发项囯预算申报、审查、招投标、项目结算等活动中,软件造价估算的问题一直没有得到很好解决,成为制约软件产业进一步发展的障碍。科学统一的软件造价估算方法已成为行业的迫切需求。
成本估算的基本流程可以大致分为:先估算软件工作量,然后基于工作量估算直接人力成本和间接成本;常规来说,软件工作量的估算是估算软件的功能点规模,功能点分析法是一种用来量化应用向用户提供的功能数量的国际标准专业方法,因为它是一种客观的、可重复的、可验证的和可辩护的方式。功能点与软件的技术要求无关。所以基于功能点的软件度量,如生产率或交付速度,在软件估算和生成基线中十分重要。但是在很多时候,尤其是在项目初期,对于项目只有一些简单的文字描述,基本上无法对其进行详细的功能拆解和架构设计,因此基于功能、文件和输入输出进行详细精确的功能点估算非常困难,即使做了准确程度也很差。不仅如此,还有很多因素可以影响最终的软件成本估算,包括:需求调整因子,软件因素调整因子,开发因素调整因子,人月费率等,而这些因素在实际的项目初期有可能无法完整确定。
由此可见,提供一种软件研发成本估算方法是本领域亟需解决的问题。
【发明内容】
为解决上述问题,本发明提供了一种软件研发成本估算方法,其包括两部分,一是对已经进行精确软件成本估算或成本统计的历史项目进行标注和数据准备,包括将项目采购单位、项目名称和项目简介文本进行合并、分词、制作语料库、TF-IDF模型构建,从而生成了所有历史项目的TF-IDF文本矢量列表,还包括标注项目的实际开发成本、项目的功能点数、需求调整因子、软件因素调整因子、开发因素调整因子;二是对某个单一新项目进行软件成本估算,包括新项目文本矢量生成、相似度计算、其他已知信息的获取和标注、历史项目的已知数据量化以及软件开发成本估算。
进一步的,所述分词是对获得的文本进行自动化分词并去除停止词,形成每个项目的词列表。
进一步的,所述制作语料库包括生成包含所有分词的词袋并进行编码,通过稀疏向量转化形成语料库。
进一步的,所述TF-IDF模型构建是根据字词在文本中出现的次数和在整个语料中出现的文档频率来计算一个字词在整个语料中的重要程度。
进一步的,所述相似度计算基于余弦相似度算法,将新项目的TF-IDF文本矢量与前述历史项目TF-IDF文本矢量列表逐个进行余弦相似度计算,获得了一系列新项目与历史项目的相似度数据列表。
进一步的,所述其他已知信息的获取和标注尽量获取新项目的已知信息,包括但不限于:需求调整因子,软件因素调整因子,开发因素调整因子和开发费率。
与现有技术相比本发明具有以下有益效果:
本发明可以在项目早期基于简单的项目描述文本,通过与同类型项目的比较快速实现精准的软件成本估算,解决了对于项目只有一些简单的文字描述,无法对其进行详细的功能拆解和架构设计,进行详细精确的功能点估算非常困难、准确程度差的问题。
【具体实施方式】
下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
软件研发成本仅包括软件研发过程中的所有直接成本和间接成本,不包括数据迁移、软件维护等成本;直接成本包括直接人力成本和直接非人力成本,间接成本包括间接人力成本和间接非人力成本。
直接人力成本包括开发方项目组成员的工资、奖金、福利等人力资源费用。其中,项目成员包括参与该项目研发过程的所有研发或支持人员,如项目经理、需求分析人员、设计人员、开发人员、测试人员、部署人员、用户文档编写人员、质量保证人员、配置管理人员等。对于非全职投入该项目研发工作的人员,按照项目工作量所占其总工作量比例折算其人力资源费用。
间接人力成本指开发方服务于研发管理整体需求的非项目组人员的人力资源费用分摊。包括研发部门经理、项目管理办公室(PMO)人员、工程过程组(EPG)人员、产品规划人员、组织级质量保证人员、组织级配置管理人员等的工资、奖金、福利等的分摊。
间接非人力成本指开发方不为研发某个特定项日而产生,但服务于整体研发活动的非人力成本分摊。包括开发方研发场地房租、水电、物业,研发人员日常办公费用分摊及各种研发办公设备的阻赁、维修、折旧分摊。
本发明提供的一种软件研发成本估算方法包括两部分,一是对已经进行精确软件成本估算或成本统计的历史项目进行标注和数据准备,包括将项目采购单位、项目名称和项目简介文本进行合并、分词、制作语料库、TF-IDF 模型构建,从而生成了所有历史项目的TF-IDF文本矢量列表,还包括标注项目的实际开发成本(或精确估算成本),项目的功能点数,需求调整因子,软件因素调整因子,开发因素调整因子等;二是对某个单一新项目进行软件成本估算,包括新项目文本矢量生成、相似度计算、其他已知信息的获取和标注、历史项目的已知数据量化以及软件开发成本估算。
所述分词是对获得的文本进行自动化分词并去除停止词,形成每个项目的词列表。
所述制作语料库包括生成包含所有分词的词袋并进行编码,通过稀疏向量转化形成语料库(语料库是一组向量,向量中的元素是一个二元组)。
所述TF-IDF模型构建是根据字词在文本中出现的次数和在整个语料中出现的文档频率来计算一个字词在整个语料中的重要程度。
所述新项目文本矢量生成也是将项目采购单位、项目名称和项目简介文本进行合并、分词、制作语料库、TF-IDF模型构建,生成TF-IDF文本矢量列表。
所述相似度计算基于余弦相似度算法,将新项目的TF-IDF文本矢量与前述历史项目TF-IDF文本矢量列表逐个进行余弦相似度计算,获得了一系列新项目与历史项目的相似度数据列表(与每个历史项目生成一个相似度数据) Li,苴中i=1...N。
所述其他已知信息的获取和标注尽量获取新项目的已知信息,包括但不限于:需求调整因子,软件因素调整因子,开发因素调整因子和开发费率等。
所述历史项目的已知数据量化是对每个历史项目进行计算,公式如下:
SDC=(S×PDR)/174×SWF×RDF×F =(FPN×CF×PDR)/174×BF×ATF×QF×RDF×F
其中:SDC是软件开发成本,单位为万元;
S是调整后的规模,单位为功能点数;
PDR是生产率,单位为人时/功能点;
SWF是软件因素调整因子;
RDF是开发因素调整因子;
F是人月费率,单位为万元/人月;
ATF是应用类型调整因子;
QF是质量特性调整因子;
BF是业务领域调整因子;
假设新项目的信息中已知ATF和QF(如果已知的是其他因子,可以类推),那么我们针对所有历史项目计算“已知数据组合(KSET)”: KSETi=SDC/(ATF*QF),其中i=1...N,N是历史项目总数。
软件开发成本估算先基于上述成果通过加权平均计算出新项目的已知数据组合“KSETNEW”:
Figure BDA0003700425560000051
再计算新项目的软件开发成本为:SDC_NEW=KSETNEW×ATF×QF
本发明优点在于项目早期基于简单的项目描述文本,通过与同类型项目的比较快速实现精准的软件成本估算,解决了对于项目只有一些简单的文字描述,无法对其进行详细的功能拆解和架构设计,进行详细精确的功能点估算非常困难、准确程度差的问题。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (6)

1.一种软件研发成本估算方法,其特征在于,包括两部分,一是对已经进行精确软件成本估算或成本统计的历史项目进行标注和数据准备,包括将项目采购单位、项目名称和项目简介文本进行合并、分词、制作语料库、TF-IDF模型构建,从而生成了所有历史项目的TF-IDF文本矢量列表,还包括标注项目的实际开发成本、项目的功能点数、需求调整因子、软件因素调整因子、开发因素调整因子;二是对某个单一新项目进行软件成本估算,包括新项目文本矢量生成、相似度计算、其他已知信息的获取和标注、历史项目的已知数据量化以及软件开发成本估算。
2.根据权利要求1所述的一种一种软件研发成本估算方法,其特征在于,所述分词是对获得的文本进行自动化分词并去除停止词,形成每个项目的词列表。
3.根据权利要求1所述的一种一种软件研发成本估算方法,其特征在于,所述制作语料库包括生成包含所有分词的词袋并进行编码,通过稀疏向量转化形成语料库。
4.根据权利要求1所述的一种一种软件研发成本估算方法,其特征在于,所述TF-IDF模型构建是根据字词在文本中出现的次数和在整个语料中出现的文档频率来计算一个字词在整个语料中的重要程度。
5.根据权利要求1所述的一种一种软件研发成本估算方法,其特征在于,所述相似度计算基于余弦相似度算法,将新项目的TF-IDF文本矢量与前述历史项目TF-IDF文本矢量列表逐个进行余弦相似度计算,获得了一系列新项目与历史项目的相似度数据列表。
6.根据权利要求1所述的一种一种软件研发成本估算方法,其特征在于,所述其他已知信息的获取和标注尽量获取新项目的已知信息,包括但不限于:需求调整因子,软件因素调整因子,开发因素调整因子和开发费率。
CN202210687996.2A 2022-06-17 2022-06-17 一种软件研发成本估算方法 Pending CN115147071A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210687996.2A CN115147071A (zh) 2022-06-17 2022-06-17 一种软件研发成本估算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210687996.2A CN115147071A (zh) 2022-06-17 2022-06-17 一种软件研发成本估算方法

Publications (1)

Publication Number Publication Date
CN115147071A true CN115147071A (zh) 2022-10-04

Family

ID=83408083

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210687996.2A Pending CN115147071A (zh) 2022-06-17 2022-06-17 一种软件研发成本估算方法

Country Status (1)

Country Link
CN (1) CN115147071A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117557395A (zh) * 2024-01-12 2024-02-13 杭州谐云科技有限公司 一种研发成本管控方法、系统、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109460908A (zh) * 2018-10-29 2019-03-12 成都安美勤信息技术股份有限公司 软件工程的造价评估方法
US20200057632A1 (en) * 2018-08-20 2020-02-20 Accenture Global Solutions Limited Automatically evaluating software project requirements
CN111460401A (zh) * 2020-05-20 2020-07-28 南京大学 结合软件制品过程信息和文本相似度的制品自动追踪方法
CN111738589A (zh) * 2020-06-19 2020-10-02 国家电网有限公司大数据中心 基于内容推荐的大数据项目工作量评估方法、装置及设备
CN113011689A (zh) * 2019-12-19 2021-06-22 中国移动通信集团辽宁有限公司 软件开发工作量的评估方法、装置及计算设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200057632A1 (en) * 2018-08-20 2020-02-20 Accenture Global Solutions Limited Automatically evaluating software project requirements
CN109460908A (zh) * 2018-10-29 2019-03-12 成都安美勤信息技术股份有限公司 软件工程的造价评估方法
CN113011689A (zh) * 2019-12-19 2021-06-22 中国移动通信集团辽宁有限公司 软件开发工作量的评估方法、装置及计算设备
CN111460401A (zh) * 2020-05-20 2020-07-28 南京大学 结合软件制品过程信息和文本相似度的制品自动追踪方法
CN111738589A (zh) * 2020-06-19 2020-10-02 国家电网有限公司大数据中心 基于内容推荐的大数据项目工作量评估方法、装置及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117557395A (zh) * 2024-01-12 2024-02-13 杭州谐云科技有限公司 一种研发成本管控方法、系统、电子设备及存储介质
CN117557395B (zh) * 2024-01-12 2024-04-26 杭州谐云科技有限公司 一种研发成本管控方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
Vairaktarakis Robust multi-item newsboy models with a budget constraint
Shively et al. Nonparametric function estimation subject to monotonicity, convexity and other shape constraints
Jann Assessing inequality using percentile shares
CN115147071A (zh) 一种软件研发成本估算方法
Andradóttir et al. Computing Bayesian means using simulation
Kahn Effective load carrying capability of wind generation: Initial results with public data
Cervan et al. Cluster-based stratified sampling for fast reliability evaluation of composite power systems based on sequential Monte Carlo simulation
Gao et al. American barrier option pricing formulas for currency model in uncertain environment
CN108205761B (zh) 一种多层级售电市场数据分析监测系统
Lam et al. Total factor productivity measures for Hong Kong telephone
CN113011629A (zh) 一种基于开发团队角色的软件项目预算估算方法
CN110197316B (zh) 运营数据的处理方法、装置、计算机可读介质及电子设备
Buckland Monte Carlo methods for confidence interval estimation using the bootstrap technique
McCarl Preference among risky prospects under constant risk aversion
CN116843386A (zh) 一种基于大数据的广告设计管理系统及方法
Haepp et al. Is Taiwan’s workforce underpaid? Evidence from marginal product of labor estimates at the company level
Chen Component reliability analysis of k-out-of-n systems with censored data
CN114282881A (zh) 折旧测算方法、装置、存储介质及计算机设备
Nycander et al. Power-based modelling of renewable variability in dispatch models with clustered time periods
León-Novelo et al. Fully Bayesian Estimation Under Dependent and Informative Cluster Sampling
CN113837648A (zh) 企业关联性分析方法、关联企业推荐方法和装置
Cairns Principles of green accounting for renewable and nonrenewable energy resources
CN112669077A (zh) 软件计价系统
Hirsch et al. Introduction to the EGRET package
Suarez-Farinas et al. A methodology to filter time series: application to minute-by-minute electric load series

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination