CN114187047A - 一种项目费用的确定方法、装置、电子设备和存储介质 - Google Patents
一种项目费用的确定方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN114187047A CN114187047A CN202111523282.XA CN202111523282A CN114187047A CN 114187047 A CN114187047 A CN 114187047A CN 202111523282 A CN202111523282 A CN 202111523282A CN 114187047 A CN114187047 A CN 114187047A
- Authority
- CN
- China
- Prior art keywords
- project
- sample
- cost
- information
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Accounting & Taxation (AREA)
- Mathematical Optimization (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Finance (AREA)
- Computing Systems (AREA)
- Strategic Management (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Entrepreneurship & Innovation (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种项目费用的确定方法、装置、电子设备和存储介质,属于工程项目技术领域。所述方法包括:获取每个样本项目的项目信息,其中,所述项目信息包括所述样本项目的项目建设信息、项目环境信息和项目费用;确定所述项目建设信息和所述项目环境信息包含的多个样本特征;根据所述样本特征针对所述样本项目所消耗费用的影响程度,为每个所述样本特征分配对应的特征权重;根据所述样本特征、所述样本特征对应的特征权重和所述项目费用对初始估算模型进行训练,得到目标估算模型,以通过所述目标估算模型确定目标项目的项目费用。本申请无需采用人工方式,提高项目费用计算效率,减少项目投资。
Description
技术领域
本申请涉及工程项目技术领域,尤其涉及一种项目费用的确定方法、装置、电子设备和存储介质。
背景技术
工程项目建设中,工程建设费用估算是立项前的最后一步,投资方在可行性研究的基础上,需要根据费用估算最终确定是否落实投资。
在早期研究阶段,往往参考类似工厂的建设费用作为费用粗略估计。投资决策阶段一般需要精度为±15~20%的费用估算作为依据,要达到这样的精度,投资方需要雇佣有资质的勘察设计单位(设计院或工程公司)进行基础设计与前端设计(Front EndEngineering Design),获得初步的材料清单,并以此为基础结合市场价格、定额等,获得费用估算。根据项目投资大小,前端设计一般需要6~10个月时间,费用约为总投资的1~3%。
近年来,各大设计院、工程公司也在寻求能够加速前端设计,并为投资方降低费用的方法,一般称为快速前端设计。该方法是利用特定规则,对建设项目进行初步的自动布置与设计,从而获取材料清单。该方法在规则完善的前提下能够在保证精度的情况下,加速设计过程。但该方法严重依赖于专业人员的前期规则设定,并且自动设计过程也需要人工干预,无法完全取代前端设计。且仪表、电器、暖通等专业领域仍需要按传统方式进行前端设计。
传统的前端设计得到费用估算完全依赖于人工,周期长且费用高。利用软件进行快速前端设计的方法,严重依赖于前期规则设定与后期人工干预,其结果可靠性有限,对人员要求高。
针对目前依赖人工估算项目费用的方式,尚无良好的解决方案。
发明内容
本申请实施例的目的在于提供一种项目费用的确定方法、装置、电子设备和存储介质,以解决人工估算项目费用周期长且费用高的问题。具体技术方案如下:
第一方面,提供了一种项目费用的确定方法,所述方法包括:
获取每个样本项目的项目信息,其中,所述项目信息包括所述样本项目的项目建设信息、项目环境信息和项目费用;
确定所述项目建设信息和所述项目环境信息包含的多个样本特征;
根据所述样本特征针对所述样本项目所消耗费用的影响程度,为每个所述样本特征分配对应的特征权重;
根据所述样本特征、所述样本特征对应的特征权重和所述项目费用对初始估算模型进行训练,得到目标估算模型,以通过所述目标估算模型确定目标项目的项目费用。
可选地,确定所述项目建设信息和所述项目环境信息包含的多个样本特征之前,所述方法还包括:
确定所述项目信息中包含的项目数值;
将所述项目数值输入岭回归模型进行初步回归进行预测,得到预测结果;
在所述预测结果与所述项目数值之间的差值大于预设差值的情况下,确定所述项目数值为异常数值并删除所述项目数值。
可选地,所述确定所述项目建设信息和所述项目环境信息包含的多个样本特征包括:
确定所述项目建设信息和所述项目环境信息包含的多个初始特征;
针对所述初始特征,执行以下三种操作中的至少一种操作:
针对第一初始特征添加新增特征,其中,所述第一初始特征对所述样本项目所消耗费用的影响度大于第一预设阈值;
根据预设拆分方案,将第二初始特征拆分为多个子特征,其中,所述第二初始特征对所述样本项目所消耗费用的影响度大于第二预设阈值;
删除第三初始特征,其中,所述第三初始特征对所述样本项目所消耗费用的影响度小于第三预设阈值;
将上述操作执行结束后得到的特征作为样本特征,其中,所述样本特征包括特征类别和特征数值两者中的至少一种。
可选地,将上述操作执行结束后得到的特征作为样本特征之后,所述方法还包括:
将所述特征数值输入随机森林模型;
通过所述随机森林模型中的变量重要性度量对所述特征数值进行排序;
采用序列后向搜索方法,删除位于序列最后的重要性得分最小的特征数值,直至所述删除的特征数值的数量达到预设数量。
可选地,所述根据所述样本特征针对所述样本项目所消耗费用的影响程度,为每个所述样本特征分配对应的特征权重包括:
确定所述项目建设信息包含的样本特征为项目建设特征,其中,所述项目建设信息至少包括设备物品、占地面积、工艺类型和项目规模;
确定所述项目环境信息包含的样本特征为项目环境特征,其中,所述项目环境信息至少包括建设模式、建设期间当地人工成本、建设承包方、建设期间材料价格指数和建设期间当地环保要求;
在所述项目建设特征对所述样本项目所消耗费用的影响程度大于所述项目环境信息对所述样本项目所消耗费用的影响程度的情况下,为所述项目建设特征分配的特征权重大于为所述项目环境特征分配的特征权重。
可选地,所述样本项目为化工医药项目,为每个所述样本特征分配对应的特征权重之后,所述方法还包括:
确定所述样本特征中的保密特征,其中,所述保密特征包括变量名称、工艺设备名称、保密数值和数值型变量;
执行以下四种操作中的至少一种操作:
将所述变量名称替换为预设标识;
将所述工艺设备名称替换为类别代码;
将所述保密数值进行归一化;
将所述数值型变量进行去量纲。
可选地,初始估算模型每隔两个Dense层设置一个Dropout层,所述根据所述样本特征、所述样本特征对应的特征权重和所述项目费用对初始估算模型进行训练,得到目标估算模型包括:
将所述样本特征和所述样本特征对应的特征权重输入初始估算模型的输入层,其中,所述初始估算模型采用gelu作为激活函数;
通过Dense层和Dropout层计算估算费用,并通过输出层输出所述估算费用,其中,在计算所述估算费用的过程中所述初始估算模型进行两次残差计算;
在所述估算费用和所述项目费用不同的情况下,调整所述初始训练模型的模型参数,得到目标估算模型,其中,所述目标估算模型输出的估算费用与所述项目费用相同。
第二方面,提供了一种项目费用的确定装置,所述装置包括:
获取模块,用于获取每个样本项目的项目信息,其中,所述项目信息包括所述样本项目的项目建设信息、项目环境信息和项目费用;
确定模块,用于确定所述项目建设信息和所述项目环境信息包含的多个样本特征;
分配模块,用于根据所述样本特征针对所述样本项目所消耗费用的影响程度,为每个所述样本特征分配对应的特征权重;
训练模块,用于根据所述样本特征、所述样本特征对应的特征权重和所述项目费用对初始估算模型进行训练,得到目标估算模型,以通过所述目标估算模型确定目标项目的项目费用。
第三方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现任一所述的项目费用的确定方法步骤。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现任一所述的项目费用的确定方法步骤。
本申请实施例有益效果:
在本申请中,样本特征不但考虑了样本项目的项目建设信息,还考虑了项目环境信息,本申请采用多角度的样本特征,使得到的目标估算模型更加准确,输出的目标项目的项目费用更加准确,另外,采用目标估算模型确定目标项目的项目费用,无需采用人工方式,提高项目费用计算效率,减少项目投资。
当然,实施本申请的任一产品或方法并不一定需要同时达到以上的所有优点。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种项目费用的确定方法硬件环境示意图;
图2为本申请实施例提供的一种项目费用的确定的方法流程图;
图3为本申请实施例提供的初始估算模型示意图;
图4为本申请实施例提供的一种项目费用的确定装置的结构示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本申请的说明,其本身并没有特定的意义。因此,“模块”与“部件”可以混合地使用。
为了解决背景技术中提及的问题,根据本申请实施例的一方面,提供了一种项目费用的确定方法的实施例。
可选地,在本申请实施例中,上述项目费用的确定方法可以应用于如图1所示的由终端101和服务器103所构成的硬件环境中。如图1所示,服务器103通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务,可在服务器上或独立于服务器设置数据库105,用于为服务器103提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101包括但不限于PC、手机、平板电脑等。
本申请实施例中的一种项目费用的确定方法可以由服务器103来执行,还可以是由服务器103和终端101共同执行。
本申请实施例提供了一种项目费用的确定方法,可以应用于终端,用于根据目标估算模型确定项目费用。
下面将结合具体实施方式,对本申请实施例提供的一种项目费用的确定方法进行详细的说明,如图2所示,具体步骤如下:
步骤201:获取每个样本项目的项目信息。
其中,项目信息包括样本项目的项目建设信息、项目环境信息和项目费用。
样本项目的项目信息包括项目建设信息和项目环境信息,项目建设信息为样本项目的本身建设信息,项目建设信息包括至少包括设备物品、占地面积、工艺类型和项目规模;项目环境信息为样本项目所处市场环境的环境信息,项目环境信息至少包括建设模式(总包模式、设计+施工采购管理模式或其他模式)、建设期间当地人工成本、建设承包方、建设期间国际市场价格指数、建设期间材料价格指数(如钢筋、混凝土等)和建设期间当地环保要求。
样本项目的项目信息还包括项目费用,项目费用为样本项目在整个项目建设期间所花费的总费用。终端获取每个样本项目的项目信息。
步骤202:确定项目建设信息和项目环境信息包含的多个样本特征。
终端确定项目建设信息和项目环境信息中包含的初始特征,然后经过特征增加、特征拆分和特征删除操作后,得到多个样本特征。
步骤203:根据样本特征针对样本项目所消耗费用的影响程度,为每个样本特征分配对应的特征权重。
每个样本特征在样本项目的项目建设过程中都起到了一定的作用,且影响到了样本项目的消耗费用,终端可以根据样本特征针对样本项目所消耗费用的影响程度,为每个样本特征分配对应的特征权重。一般地,样本特征对消耗费用的影响程度和特征权重成正比,即影响程度越大,则特征权重越大。
示例性地,样本特征包括设备类型和当地物流水平,设备类型不同,消耗费用也不同,当地物流水平也会影响人工、水电等费用。设备类型对样本项目所消耗费用的影响程度大于当地物流水平对样本项目所消耗费用的影响程度,因此,设备类型的特征权重大于当地物流水平的特征权重。
步骤204:根据样本特征、样本特征对应的特征权重和项目费用对初始估算模型进行训练,得到目标估算模型,以通过目标估算模型确定目标项目的项目费用。
终端将样本特征、样本特征对应的特征权重和项目费用输入初始估算模型,对初始估算模型进行训练,得到目标估算模型。然后采用目标估算模型估算目标项目的项目费用。
在本申请中,样本特征不但考虑了样本项目的项目建设信息,还考虑了项目环境信息,本申请采用多角度的样本特征,使得到的目标估算模型更加准确,输出的目标项目的项目费用更加准确,另外,采用目标估算模型确定目标项目的项目费用,无需采用人工方式,提高项目费用计算效率,减少项目投资。
作为一种可选的实施方式,确定项目建设信息和项目环境信息包含的多个样本特征之前,方法还包括:确定项目信息中包含的项目数值;将项目数值输入岭回归模型进行初步回归进行预测,得到预测结果;在预测结果与项目数值之间的差值大于预设差值的情况下,确定项目数值为异常数值并删除项目数值。
在本申请实施例中,项目建设信息和项目环境信息是包含多个初始特征的,初始特征可以为特征类型,也可以为特征数值。若一些特征数值受到客观或主观的影响(如设计出现重大失误或发生安全、环保事故等),特征数值与行业水平的一般数值会有很大差异,这部分特征数值如果保留将会形成噪声。
因此,终端将项目数值输入岭回归模型进行初步回归进行预测,得到预测结果,若预测结果与项目数值之间的差值大于预设差值,表明该项目数值为异常数值,则终端删除项目数值,以避免后续该异常的项目数值生成样本特征,避免降低目标估算模型的准确性。
作为一种可选的实施方式,确定项目建设信息和项目环境信息包含的多个样本特征包括:确定项目建设信息和项目环境信息包含的多个初始特征;针对初始特征,执行以下三种操作中的至少一种操作:针对第一初始特征添加新增特征,其中,第一初始特征对样本项目所消耗费用的影响度大于第一预设阈值;根据预设拆分方案,将第二初始特征拆分为多个子特征,其中,第二初始特征对样本项目所消耗费用的影响度大于第二预设阈值;删除第三初始特征,其中,第三初始特征对样本项目所消耗费用的影响度小于第三预设阈值;将上述操作执行结束后得到的特征作为样本特征,其中,样本特征包括特征类别和特征数值两者中的至少一种。
在本申请实施例中,项目建设信息和项目环境信息包含多个初始特征,该初始特征为根据项目建设信息和项目环境信息能够直接得到的特征,示例性地,初始特征包括:设备数量、设备类型、工艺类型、当地公共服务水平、占地面积和项目建设周期。
其中,对样本项目所消耗费用的影响度大于第一预设阈值的初始特征为第一初始特征,由于第一初始特征对消耗费用的影响度比较大,因此,还需要针对第一初始特征添加新增特征,以进一步细化该第一初始特征,便于后续目标项目的项目花费更准确。
示例性地,第一初始特征为设备特征,设备特征已经包含了设备数量和设备类型,然而设备来源对消耗费用的影响度也很大,因此,终端还需要添加设备来源的特征,以表征该设备来自于进口、国产一级或国产二级等。
对样本项目所消耗费用的影响度大于第二预设阈值的初始特征为第二初始特征,终端可以根据预设拆分方案,将第二初始特征拆分为多个子特征,以增加特征维度,使目标估算模型训练更加准确。
示例性地,第二初始特征包括工艺类型、设备类型、当地公共服务水平、占地面积、项目建设周期和投资商特征,终端可以将工艺类型拆分成工艺产品、工艺产量、主工艺路线;将设备类型拆分为设备类别、设备规格、设备用途;将当地公共服务水平为当地政府服务水平、当地环保要求、当地物流服务水平、公用工程供应水平(水、电气)等;将占地面积拆分为占地长度和占地宽度;将项目建设周期拆分成设计周期与施工周期;将投资商特征拆分为地域(欧洲、北美、国内)和等级(一流、普通)。
对样本项目所消耗费用的影响度小于第三预设阈值为第三初始特征,第三初始特征对样本项目所消耗费用的影响度较小,因此可以删除该第三初始特征,其中,第三初始特征还可以为重复特征,避免多个重复特征造成目标估算模型不准确。示例性地,建设时间对消耗费用的影响,已经反映在劳动力价格指数、材料价格指数等特征上,该建设时间特征可以删除。
终端将上述执行新增、拆分和删除操作后的特征作为样本特征,样本特征包括特征类别和特征数值两者中的至少一种。
将样本特征采用特征类别和特征数值表示,可以使样本特征指标化,具体可以采用简单分类、特征替换、特征分解等方式,得到特征类别和特征数值。示例性地,简单分类——当地环保要求可以划分为宽松、普通、严格、非常严格;特征替换——当地政府服务水平可以用平均回复天数、平均审批天数、是否有专人对接等特征类别代替;特征分解——当地物流服务水平可以拆分为海运、水运、铁路、公路。
可选地,本申请还可以对样本特征还可以进行特征变换,即根据样本特征的特点确定适合的特征类别和特征数值。示例性地,项目周期采用月计比采用天计能够更好的反应项目周期对消耗费用的影响,因此采用月计的项目周期,这就变换了特征数值;特征类别转换成one-hot形式,这在一定程度上起到了扩展特征的作用。
本申请中,通过对初始特征进行新增、拆分和删除操作,得到样本特征,删除了重复特征,还丰富了样本特征的特征维度,使目标估算模型更加准确度。
作为一种可选的实施方式,将上述操作执行结束后得到的特征作为样本特征之后,方法还包括:将特征数值输入随机森林模型;通过随机森林模型中的变量重要性度量对特征数值进行排序;采用序列后向搜索方法,删除位于序列最后的重要性得分最小的特征数值,直至删除的特征数值的数量达到预设数量。
在本申请实施例中,终端得到特征数值后,为了提高特征数值的准确性,终端将特征数值输入随机森林模型;采用RRCF(Robust Random Cut Forest,异常检测算法)的变量重要性度量对特征数值进行排序,然后采用序列后向搜索方法,删除位于序列最后的重要性得分最小的特征数值,直至删除的特征数值的数量达到预设数量。
本申请通过删除异常的特征数值,保证对初始估算模型进行模型训练的样本特征都是正确的,提高目标估算模型的准确性。
作为一种可选的实施方式,根据样本特征针对样本项目所消耗费用的影响程度,为每个样本特征分配对应的特征权重包括:确定项目建设信息包含的样本特征为项目建设特征,其中,项目建设信息至少包括设备物品、占地面积、工艺类型和项目规模;确定项目环境信息包含的样本特征为项目环境特征,其中,项目环境信息至少包括建设模式、建设期间当地人工成本、建设承包方、建设期间材料价格指数和建设期间当地环保要求;在项目建设特征对样本项目所消耗费用的影响程度大于项目环境信息对样本项目所消耗费用的影响程度的情况下,为项目建设特征分配的特征权重大于为项目环境特征分配的特征权重。
在本申请实施例中,项目建设信息包含的项目建设特征至少包括设备物品、占地面积、工艺类型和项目规模;项目环境信息包含的项目环境特征至少包括建设模式、建设期间当地人工成本、建设承包方、建设期间材料价格指数和建设期间当地环保要求。
项目建设特征对样本项目所消耗费用的影响程度大于项目环境信息对样本项目所消耗费用的影响程度,因此终端为项目建设特征分配的特征权重大于为项目环境特征分配的特征权重。
作为一种可选的实施方式,样本项目为化工医药项目,为每个样本特征分配对应的特征权重之后,方法还包括:确定样本特征中的保密特征,其中,保密特征包括变量名称、工艺设备名称、保密数值和数值型变量;执行以下四种操作中的至少一种操作:将变量名称替换为预设标识;将工艺设备名称替换为类别代码;将保密数值进行归一化;将数值型变量进行去量纲。
若样本项目为化工医药项目,那么化工医药中的部分样本特征是需要保密的,需要对保密特征进行脱敏操作,避免机密特征泄露。其中,保密特征包括变量名称、工艺设备名称、保密数值和数值型变量。终端执行以下四种操作中的至少一种操作:将变量名称替换为预设标识,示例性地,将变量名称替换为V1,V2,……VXX;将工艺设备名称替换为类别代码;将保密数值进行归一化;将数值型变量进行去量纲。其中,本申请中的样本项目不仅限于化工医药项目,还可以为其他任意类型的项目。
作为一种可选的实施方式,初始估算模型每隔两个Dense层设置一个Dropout层,根据样本特征、样本特征对应的特征权重和项目费用对初始估算模型进行训练,得到目标估算模型包括:将样本特征和样本特征对应的特征权重输入初始估算模型的输入层,其中,初始估算模型采用gelu作为激活函数;通过Dense层和Dropout层计算估算费用,并通过输出层输出估算费用,其中,在计算估算费用的过程中初始估算模型进行两次残差计算;在估算费用和项目费用不同的情况下,调整初始训练模型的模型参数,得到目标估算模型,其中,目标估算模型输出的估算费用与项目费用相同。
在本申请实施例中,样本特征、样本特征对应的特征权重和项目费用为样本数据,终端得到过去20年的样本数据后,将样本数据划分为验证集、测试集与训练集,其中,验证集、测试集与训练集可以分别占样本数据的10%、20%和70%的。为了提高模型训练的准确性,终端确定测试集中的样本数据涵盖每一个年份和每一种项目类型,验证集为最近两年的样本数据。
本申请构建了一个初始估算模型,该初始估算模型包括输入层、Dense层、Dropout层、Add层、Substract层和输出层,初始估算模型每隔两个Dense层设置一个Dropout层,Dropout层可以防止过拟合,Add层和Dropout层用于残差计算,避免初始信息丢失,提高目标估算模型的准确性。
图3为本申请的初始估算模型示意图,如图3所示,初始估算模型包括19层,每隔两个Dense层设置一个Dropout层,最后一个Dense层为输出层,初始估算模型通过第二个Dense层和倒数第三个Dense层进行一次残差计算,并通过第一个Dense层和最后一个Dropout层进行一次残差计算,初始估算模型采用gelu作为激活函数。
终端将样本特征和样本特征对应的特征权重输入初始估算模型的输入层,通过Dense层和Dropout层计算估算费用,并通过输出层输出估算费用,在估算费用和项目费用不相同时,终端调整初始训练模型的模型参数,得到目标估算模型,其中,目标估算模型输出的估算费用与项目费用相同。
在本申请中,终端通过目标估算模型能够得到目标项目的项目费用,并使估算得到的项目费用与实际费用的费用差值保持在±15~20%,这有利于提高项目费用的确定效率和估算准确度,还能提高项目投资决策速率。
基于相同的技术构思,本申请实施例还提供了一种项目费用的确定装置,如图4所示,该装置包括:
获取模块401,用于获取每个样本项目的项目信息,其中,项目信息包括样本项目的项目建设信息、项目环境信息和项目费用;
确定模块402,用于确定项目建设信息和项目环境信息包含的多个样本特征;
分配模块403,用于根据样本特征针对样本项目所消耗费用的影响程度,为每个样本特征分配对应的特征权重;
训练模块404,用于根据样本特征、样本特征对应的特征权重和项目费用对初始估算模型进行训练,得到目标估算模型,以通过目标估算模型确定目标项目的项目费用。
可选地,该装置还用于:
确定项目信息中包含的项目数值;
将项目数值输入岭回归模型进行初步回归进行预测,得到预测结果;
在预测结果与项目数值之间的差值大于预设差值的情况下,确定项目数值为异常数值并删除项目数值。
可选地,确定模块402用于:
确定项目建设信息和项目环境信息包含的多个初始特征;
针对初始特征,执行以下三种操作中的至少一种操作:
针对第一初始特征添加新增特征,其中,第一初始特征对样本项目所消耗费用的影响度大于第一预设阈值;
根据预设拆分方案,将第二初始特征拆分为多个子特征,其中,第二初始特征对样本项目所消耗费用的影响度大于第二预设阈值;
删除第三初始特征,其中,第三初始特征对样本项目所消耗费用的影响度小于第三预设阈值;
将上述操作执行结束后得到的特征作为样本特征,其中,样本特征包括特征类别和特征数值两者中的至少一种。
可选地,该装置还用于:
将特征数值输入随机森林模型;
通过随机森林模型中的变量重要性度量对特征数值进行排序;
采用序列后向搜索方法,删除位于序列最后的重要性得分最小的特征数值,直至删除的特征数值的数量达到预设数量。
可选地,分配模块403用于:
确定项目建设信息包含的样本特征为项目建设特征,其中,项目建设信息至少包括设备物品、占地面积、工艺类型和项目规模;
确定项目环境信息包含的样本特征为项目环境特征,其中,项目环境信息至少包括建设模式、建设期间当地人工成本、建设承包方、建设期间材料价格指数和建设期间当地环保要求;
在项目建设特征对样本项目所消耗费用的影响程度大于项目环境信息对样本项目所消耗费用的影响程度的情况下,为项目建设特征分配的特征权重大于为项目环境特征分配的特征权重。
可选地,该装置还用于:
确定样本特征中的保密特征,其中,保密特征包括变量名称、工艺设备名称、保密数值和数值型变量;
执行以下四种操作中的至少一种操作:
将变量名称替换为预设标识;
将工艺设备名称替换为类别代码;
将保密数值进行归一化;
将数值型变量进行去量纲。
可选地,初始估算模型每隔两个Dense层设置一个Dropout层,训练模块404包括:
将样本特征和样本特征对应的特征权重输入初始估算模型的输入层,其中,初始估算模型采用gelu作为激活函数;
通过Dense层和Dropout层计算估算费用,并通过输出层输出估算费用,其中,在计算估算费用的过程中初始估算模型进行两次残差计算;
在估算费用和项目费用不同的情况下,调整初始训练模型的模型参数,得到目标估算模型,其中,目标估算模型输出的估算费用与项目费用相同。
根据本申请实施例的另一方面,本申请提供了一种电子设备,如图5所示,包括存储器503、处理器501、通信接口502及通信总线504,存储器503中存储有可在处理器501上运行的计算机程序,存储器503、处理器501通过通信接口502和通信总线504进行通信,处理器501执行计算机程序时实现上述方法的步骤。
上述电子设备中的存储器、处理器通过通信总线和通信接口进行通信。所述通信总线可以是外设部件互连标准(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable GateArray,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
根据本申请实施例的又一方面还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质。
可选地,在本申请实施例中,计算机可读介质被设置为存储用于所述处理器执行上述方法的程序代码。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本申请实施例在具体实现时,可以参阅上述各个实施例,具有相应的技术效果。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种项目费用的确定方法,其特征在于,所述方法包括:
获取每个样本项目的项目信息,其中,所述项目信息包括所述样本项目的项目建设信息、项目环境信息和项目费用;
确定所述项目建设信息和所述项目环境信息包含的多个样本特征;
根据所述样本特征针对所述样本项目所消耗费用的影响程度,为每个所述样本特征分配对应的特征权重;
根据所述样本特征、所述样本特征对应的特征权重和所述项目费用对初始估算模型进行训练,得到目标估算模型,以通过所述目标估算模型确定目标项目的项目费用。
2.根据权利要求1所述的方法,其特征在于,确定所述项目建设信息和所述项目环境信息包含的多个样本特征之前,所述方法还包括:
确定所述项目信息中包含的项目数值;
将所述项目数值输入岭回归模型进行初步回归进行预测,得到预测结果;
在所述预测结果与所述项目数值之间的差值大于预设差值的情况下,确定所述项目数值为异常数值并删除所述项目数值。
3.根据权利要求1所述的方法,其特征在于,所述确定所述项目建设信息和所述项目环境信息包含的多个样本特征包括:
确定所述项目建设信息和所述项目环境信息包含的多个初始特征;
针对所述初始特征,执行以下三种操作中的至少一种操作:
针对第一初始特征添加新增特征,其中,所述第一初始特征对所述样本项目所消耗费用的影响度大于第一预设阈值;
根据预设拆分方案,将第二初始特征拆分为多个子特征,其中,所述第二初始特征对所述样本项目所消耗费用的影响度大于第二预设阈值;
删除第三初始特征,其中,所述第三初始特征对所述样本项目所消耗费用的影响度小于第三预设阈值;
将上述操作执行结束后得到的特征作为样本特征,其中,所述样本特征包括特征类别和特征数值两者中的至少一种。
4.根据权利要求3所述的方法,其特征在于,将上述操作执行结束后得到的特征作为样本特征之后,所述方法还包括:
将所述特征数值输入随机森林模型;
通过所述随机森林模型中的变量重要性度量对所述特征数值进行排序;
采用序列后向搜索方法,删除位于序列最后的重要性得分最小的特征数值,直至所述删除的特征数值的数量达到预设数量。
5.根据权利要求1所述的方法,其特征在于,所述根据所述样本特征针对所述样本项目所消耗费用的影响程度,为每个所述样本特征分配对应的特征权重包括:
确定所述项目建设信息包含的样本特征为项目建设特征,其中,所述项目建设信息至少包括设备物品、占地面积、工艺类型和项目规模;
确定所述项目环境信息包含的样本特征为项目环境特征,其中,所述项目环境信息至少包括建设模式、建设期间当地人工成本、建设承包方、建设期间材料价格指数和建设期间当地环保要求;
在所述项目建设特征对所述样本项目所消耗费用的影响程度大于所述项目环境信息对所述样本项目所消耗费用的影响程度的情况下,为所述项目建设特征分配的特征权重大于为所述项目环境特征分配的特征权重。
6.根据权利要求1所述的方法,其特征在于,所述样本项目为化工医药项目,为每个所述样本特征分配对应的特征权重之后,所述方法还包括:
确定所述样本特征中的保密特征,其中,所述保密特征包括变量名称、工艺设备名称、保密数值和数值型变量;
执行以下四种操作中的至少一种操作:
将所述变量名称替换为预设标识;
将所述工艺设备名称替换为类别代码;
将所述保密数值进行归一化;
将所述数值型变量进行去量纲。
7.根据权利要求1所述的方法,其特征在于,初始估算模型每隔两个Dense层设置一个Dropout层,所述根据所述样本特征、所述样本特征对应的特征权重和所述项目费用对初始估算模型进行训练,得到目标估算模型包括:
将所述样本特征和所述样本特征对应的特征权重输入初始估算模型的输入层,其中,所述初始估算模型采用gelu作为激活函数;
通过Dense层和Dropout层计算估算费用,并通过输出层输出所述估算费用,其中,在计算所述估算费用的过程中所述初始估算模型进行两次残差计算;
在所述估算费用和所述项目费用不同的情况下,调整所述初始训练模型的模型参数,得到目标估算模型,其中,所述目标估算模型输出的估算费用与所述项目费用相同。
8.一种项目费用的确定装置,其特征在于,所述装置包括:
获取模块,用于获取每个样本项目的项目信息,其中,所述项目信息包括所述样本项目的项目建设信息、项目环境信息和项目费用;
确定模块,用于确定所述项目建设信息和所述项目环境信息包含的多个样本特征;
分配模块,用于根据所述样本特征针对所述样本项目所消耗费用的影响程度,为每个所述样本特征分配对应的特征权重;
训练模块,用于根据所述样本特征、所述样本特征对应的特征权重和所述项目费用对初始估算模型进行训练,得到目标估算模型,以通过所述目标估算模型确定目标项目的项目费用。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111523282.XA CN114187047A (zh) | 2021-12-13 | 2021-12-13 | 一种项目费用的确定方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111523282.XA CN114187047A (zh) | 2021-12-13 | 2021-12-13 | 一种项目费用的确定方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114187047A true CN114187047A (zh) | 2022-03-15 |
Family
ID=80543562
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111523282.XA Pending CN114187047A (zh) | 2021-12-13 | 2021-12-13 | 一种项目费用的确定方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114187047A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115932530A (zh) * | 2023-01-09 | 2023-04-07 | 东莞市兆恒机械有限公司 | 一种半导体检测设备标定的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9870546B1 (en) * | 2013-09-23 | 2018-01-16 | Turner Industries Group, L.L.C. | System and method for industrial project cost estimation risk analysis |
JP2019028871A (ja) * | 2017-08-02 | 2019-02-21 | Tis株式会社 | プロジェクト管理支援装置、プロジェクト管理支援方法およびプログラム |
CN112801687A (zh) * | 2020-12-10 | 2021-05-14 | 中国电力工程顾问集团中南电力设计院有限公司 | 基于架空线路工程的费用预测模型的构建方法 |
CN113554357A (zh) * | 2021-09-22 | 2021-10-26 | 北京国研科技咨询有限公司 | 基于大数据的信息化项目成本评估方法和电子设备 |
-
2021
- 2021-12-13 CN CN202111523282.XA patent/CN114187047A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9870546B1 (en) * | 2013-09-23 | 2018-01-16 | Turner Industries Group, L.L.C. | System and method for industrial project cost estimation risk analysis |
JP2019028871A (ja) * | 2017-08-02 | 2019-02-21 | Tis株式会社 | プロジェクト管理支援装置、プロジェクト管理支援方法およびプログラム |
CN112801687A (zh) * | 2020-12-10 | 2021-05-14 | 中国电力工程顾问集团中南电力设计院有限公司 | 基于架空线路工程的费用预测模型的构建方法 |
CN113554357A (zh) * | 2021-09-22 | 2021-10-26 | 北京国研科技咨询有限公司 | 基于大数据的信息化项目成本评估方法和电子设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115932530A (zh) * | 2023-01-09 | 2023-04-07 | 东莞市兆恒机械有限公司 | 一种半导体检测设备标定的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | A prediction method using the grey model GMC (1, n) combined with the grey relational analysis: a case study on Internet access population forecast | |
Lahdelma et al. | Multivariate Gaussian criteria in SMAA | |
Liu et al. | Exploring the dynamic relationship between energy efficiency, trade, economic growth, and CO2 emissions: Evidence from novel fourier ARDL approach | |
Sing et al. | Multiplier model for forecasting manpower demand | |
Mazelis et al. | Multi-period models for optimizing an institution’s project portfolio inclusive of risks and corporate social responsibility | |
Vučićević et al. | Sustainability assessment of residential buildings by non-linear normalization procedure | |
CN111833018A (zh) | 一种科技项目的专利分析方法及系统 | |
Kalbar et al. | Advancing life cycle sustainability assessment using multiple criteria decision making | |
CN111415027A (zh) | 构建件量预测模型的方法和装置 | |
CN107256461B (zh) | 一种充电设施建设地址评价方法及系统 | |
CN113554350A (zh) | 活跃度评估方法、装置、电子设备及计算机可读存储介质 | |
CN114187047A (zh) | 一种项目费用的确定方法、装置、电子设备和存储介质 | |
Ananda et al. | C4. 5 decision tree implementation in Sistem Informasi zakat (Sizakat) to automatically determining the amount of zakat received by Mustahik | |
CN113362191A (zh) | 设备投保数据处理方法、装置、计算机设备和存储介质 | |
CN108696397A (zh) | 一种基于ahp和大数据的电网信息安全评估方法及装置 | |
Neuenfeldt Junior et al. | Hierarchy the sectorial performance indicators for Brazilian franchises | |
CN106355306A (zh) | 基于地区用电特征的经济景气指数分析方法及其系统 | |
Kim et al. | Automated information retrieval for hazard identification in construction sites | |
CN111552814B (zh) | 基于考核指标图谱的考核方案生成方法及装置 | |
Vranjanac et al. | Guideline for Constructing Composite Indicators that measure Circular Economy Performance | |
CN112116139A (zh) | 一种电力需求预测方法及系统 | |
Kosacka et al. | Sustainability classification for SMEs from the remanufacturing sector | |
CN111738552A (zh) | 决策指标的自动生成方法、装置及计算机可读存储介质 | |
Derbasova et al. | System of quality indicators and the methodology of evaluation of the housing and communal service of the population | |
Pan et al. | The interval estimation order relation analysis method and its application |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220315 |
|
RJ01 | Rejection of invention patent application after publication |