CN113592537B - 一种土壤修复工程造价概算方法、装置及计算机系统 - Google Patents

一种土壤修复工程造价概算方法、装置及计算机系统 Download PDF

Info

Publication number
CN113592537B
CN113592537B CN202110750651.2A CN202110750651A CN113592537B CN 113592537 B CN113592537 B CN 113592537B CN 202110750651 A CN202110750651 A CN 202110750651A CN 113592537 B CN113592537 B CN 113592537B
Authority
CN
China
Prior art keywords
price
engineering
max
project
splitting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110750651.2A
Other languages
English (en)
Other versions
CN113592537A (zh
Inventor
朱志华
杨乔木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Zhuhe Engineering Technology Co ltd
Original Assignee
Guangzhou Zhuhe Engineering Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Zhuhe Engineering Technology Co ltd filed Critical Guangzhou Zhuhe Engineering Technology Co ltd
Priority to CN202110750651.2A priority Critical patent/CN113592537B/zh
Publication of CN113592537A publication Critical patent/CN113592537A/zh
Application granted granted Critical
Publication of CN113592537B publication Critical patent/CN113592537B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种土壤修复工程造价概算方法、装置、计算机系统及存储介质,其使用二分决策树自动判定当前工程应当采用定额计价模式还是市场计价模式,在分裂决策树时,基于预测精度提升的幅度最大的原则来选择进行分裂树的项目特征,使得决策树进行最快速的分裂;同时对于数值型数据,事先进行数据处理,依据预测精度最大的原则确定分组界限值,算法简明、节省了计算机算力;对于没有指导性计价规范的土壤修复工程,进行相应地模型训练,使得当前工程能够匹配至合适的历史工程记录,提高工程造价概算的准确程度;同时,还给用户提供自主决定选用哪个计价模式的选项,方便用户使用。

Description

一种土壤修复工程造价概算方法、装置及计算机系统
技术领域
本发明属于计算机软件技术领域,特别涉及一种土壤修复工程造价概算方法、装置及计算机系统。
背景技术
工程造价又称工程概预算,是对工程项目所需全部建设费用计算成果的统称。在工程项目初步设计阶段进行的工程计价又称为工程造价概算,要考虑从筹建开始到竣工验收交付使用前所需的一切费用来算出总的工程造价费用,上述费用一般包括人工费、材料费、机械(购置、租用、损耗)费、间接费(管理费)、税金、利润等项目。工程造价概算最基本的过程分为工程量计算和工程计价两个阶段,各分项目工程量乘以对应单价的总和即为整个工程的造价费用。运用BIM技术可以准确计算出工程量,继而套用概预算定额单价或单位估价表(基价)确定出直接工程费,再加上间接费、利润、税金等即可得出工程总造价。套用定额单价的计算方式称为定额计价模式。工程定额计价标准有国家和地方发布的各种指导性计价规范可供参考,这些政府权威机构发布的规范通常在5-10年的范围内均是行业执行标准,因此定额计价模式的优点在于可以做到量价合一,计算简捷,是目前业界最常用的一种工程造价计算方法(相关的技术可以参阅CN202110155029、CN202010919317等专利)。
然而,看到定额计价模式的优点之余,还应当注意其存在的明显不足之处:其一,工程的项目种类繁多,不同工程在人工、材料、机械、管理等项目上的成本比重极为不同,而指导性计价规范通常是将全国或地区的平均价格定为指导价格,并不能及时反映价格市场的波动;对于部分项目例如建筑安装工程造价来说,材料费的占比可以达到成本的70%,受材料价格市场的影响很大,用户使用工程造价软件来计算这类工程造价时,是极为不愿意仅使用定额计算模式的,其期望能够使用市场计价模式以获得较为准确的计算结果。其二,指导性计价规范当中,以广东省住房和城乡建设厅发布的《广东省房屋建筑与装饰工程综合定额(2018)》为例,其分部分项工程项目只涵盖了27大类常见项目,依然有表外项目待补充编制定额计价标准,本发明探讨的土壤修复工程即为其中之一。
发明内容
本申请的内容是提供一种土壤修复工程造价概算方法,其目的是克服目前工程造价软件通常只采用定额计价模式、不能满足用户需要的弊端。通过采集土壤修复工程领域的历史工程造价样本,经训练获得二分决策树模型,基于输入自动为用户提供适合项目的工程计价模式,以使得工程造价概算更加精确。对于土壤修复工程这种属于指导性计价规范之外所列项目之外的工程项目,参照指导性计价规范的编制方法,制定一套合适的定额计价标准,节省用户翻阅历史工程计价样本的计算时间。本发明的另一个目的是提供一种土壤修复工程造价概算装置,其具有上述技术效果,便于用户使用以获得准确的工程造价概算结果。此外,本发明还提供一种运行上述土壤修复工程造价概算方法的计算机系统。
为实现上述目的,本发明提供一种土壤修复工程造价概算方法,其特征在于:
采集土壤修复工程领域的历史工程造价样本,获得各工程样本中是采用定额计价模式还是市场计价模式;
通过训练获得二分决策树模型,所述决策树由根节点、内节点、叶节点组成,根节点所在的位置为第0层,然后依次向下为第1层、第2层……第N层;所述叶节点分为“接受市场计价模式”或“不接受市场计价模式”两种;
使用该二分决策树模型自动判定当前用户的工程项目应当采用定额计价模式还是市场计价模式;如果判定结果是定额计价模式,则基于采集的历史工程造价样本,汇总历史工程造价样本中每项费用的单价,对单价进行聚类,找出聚集度最高的价格作为定额计价模式中该项目的定额单价,据此计算工程造价;如果判定结果是市场计价模式,则基于对近期价格曲线进行回归以预测当前工程工期内的价格变化趋势,据此计算工程造价;
其中,所述模型训练的步骤为:
S1:对每个节点的是市场计价模式的正确结果和错误结果进行总数统计,在根节点中记录相应的数据;
S2:根据对市场计价模式的预测精度确定第1层进行分裂的项目特征,选择分裂后可以提高模型预测精度的项目特征作为内节点,对决策树进行分裂;对于多个可以满足分裂树要求的项目特征,则计算预测精度上升的幅度,幅度最大的被选作用于分裂的项目特征;
S3:在决策树第1层的内节点下属的各特征值中标注其下所涵盖的正确结果和错误结果的总数数据;
S4:以预测结果作为叶节点,分裂后检查每个特征值对应的分支,如果某个分支中只包含一种叶节点,则停止分裂,否则继续分裂;
S5:从剩余项目特征中依据S2中的方法找出进行第2层分裂的项目特征,依次检查是否满足S4的停止分裂条件,直至所有的项目特征均被用完,或者决策树的层数已经达到预先设定的最大层级;
所述对单价进行聚类,找出聚集度最高的价格作为定额计价模式中的定额单价的步骤具体为:
S6:找出汇总的样本费用单价中的最大值Pmax和最小值Pmin,作为样本单价的两个端点;计算样本中除了这两个之外的其他价格P与最大值和最小值的差值绝对值,如果|P-Pmax|<|P-Pmin|,则该点P距离聚类点Pmax较近,分入Pmax的组A1,否则分入Pmin的组A2;其中Pmax、Pmin分别是组A1、A2的聚类点;
S7:找出组A1中与Pmax具有最大的差值δ1的价格元素P1min,以及组A2中与Pmax具有最大的差值δ2的价格元素P2max,如果有δ1>δ2,则选择P1min作为第三个聚类点,否则选择P2max作为第三个聚类点;
S8:计算样本费用单价除Pmax、Pmin、P1min/P2max三值之外的其他价格P到三值的距离,按照S6中到聚类点距离最小的方法,分别分入Pmax、Pmin、P1min/P2max所在的三个组;
S9:分别计算分入Pmax、Pmin、P1min/P2max所在的三个组中各价格元素分别与所在组聚类点Pmax、Pmin、P1min/P2max的差值绝对值,获得最大的价格差绝对值δ;如果δ比步骤S7计算出的各组内元素最大差值以及最小差值的差值大,即δ>|δ12|,并且没有一组中的价格元素个数大于其余所有组中元素个数的两倍的情况,则应当重复S7-S8的过程找到新的聚类点,对样本价格按照新的聚类点进行重新分组;否则说明大部分单价样本已经完成聚集,停止找寻新的聚类点;
S10:停止重新分组后,具有最多单价样本个数的组即为聚集度最高的单价样本集合,将该样本集合的聚类点作为定额计价模式中该项目的定额单价。
进一步地,所述土壤修复工程整体上分为七大项目类型:污染土石方工程、监测注入井工程、防渗覆盖工程、土壤修复工程-细分、二次污染防治工程、设备安装工程、系统调试工程;用户输入的土壤修复工程的具体种类属于判定当前工程是否采用市场计价模式的依据之一。
进一步地,所述土壤修复工程-细分具体包括土壤预处理、土壤淋洗、药剂运输、固化稳定化修复、土方入窑、污染土外运、热脱附修复、植被修复、种植管理、废料处理、土方降含水量这十一种具体处理步骤。
进一步地,对数据库中各工厂或公司关于人工、材料、机械的报价费用按日期分组,对各组进行聚类以获得各组的费用聚类点,以所述费用聚类点作为该日期下的市场报价;依据所述市场报价绘制价格随时间的变化曲线,进而对近期价格曲线进行回归。
进一步地,在上述步骤S1之前,还有对数值型数据进行预处理的步骤S0;所述方法为对数值型数据进行分组,具体包括:
S0.1:将当前项目特征按照数值大小进行一维顺序排列,然后在数值的上方或下方对应位置标注是否接受市场计价模式的结果;
S0.2:对每两个相邻的点,计算出它们的算数平均值;
S0.3:计算每个算数平均值的结果预测精度,找到比根节点预测精度高且预测精度最大的,将其对应的算数平均值当作是最终的分组界限值;
S0.4:基于所述分组界限值将数值型数据分为2-3组。
此外,本发明还提供一种土壤修复工程造价概算装置,其特征在于:包括:
采集模块,用于采集土壤修复工程领域的历史工程造价样本,获得各工程样本中是采用定额计价模式还是市场计价模式;
训练模块,用于通过训练获得二分决策树模型,所述决策树由根节点、内节点、叶节点组成,根节点所在的位置为第0层,然后依次向下为第1层、第2层……第N层;所述叶节点分为“接受市场计价模式”或“不接受市场计价模式”两种;
判定模块,用于使用该二分决策树模型自动判定当前用户的工程项目应当采用定额计价模式还是市场计价模式;
计价模块,如果判定结果是定额计价模式,则用于基于采集的历史工程造价样本,汇总历史工程造价样本中每项费用的单价,对单价进行聚类,找出聚集度最高的价格作为定额计价模式中该项目的定额单价,据此计算工程造价;如果判定结果是市场计价模式,则用于基于对近期价格曲线进行回归以预测当前工程工期内的价格变化趋势,据此计算工程造价;
其中,所述训练模块训练模型的步骤为:
S1:对每个节点的是市场计价模式的正确结果和错误结果进行总数统计,在根节点中记录相应的数据;
S2:根据对市场计价模式的预测精度确定第1层进行分裂的项目特征,选择分裂后可以提高模型预测精度的项目特征作为内节点,对决策树进行分裂;对于多个可以满足分裂树要求的项目特征,则计算预测精度上升的幅度,幅度最大的被选作用于分裂的项目特征;
S3:在决策树第1层的内节点下属的各特征值中标注其下所涵盖的正确结果和错误结果的总数数据;
S4:以预测结果作为叶节点,分裂后检查每个特征值对应的分支,如果某个分支中只包含一种叶节点,则停止分裂,否则继续分裂;
S5:从剩余项目特征中依据S2中的方法找出进行第2层分裂的项目特征,依次检查是否满足S4的停止分裂条件,直至所有的项目特征均被用完,或者决策树的层数已经达到预先设定的最大层级;
所述计价模块对单价进行聚类,找出聚集度最高的价格作为定额计价模式中的定额单价的步骤具体为:
S6:找出汇总的样本费用单价中的最大值Pmax和最小值Pmin,作为样本单价的两个端点;计算样本中除了这两个之外的其他价格P与最大值和最小值的差值绝对值,如果|P-Pmax|<|P-Pmin|,则该点P距离聚类点Pmax较近,分入Pmax的组A1,否则分入Pmin的组A2;其中Pmax、Pmin分别是组A1、A2的聚类点;
S7:找出组A1中与Pmax具有最大的差值δ1的价格元素P1min,以及组A2中与Pmax具有最大的差值δ2的价格元素P2max,如果有δ1>δ2,则选择P1min作为第三个聚类点,否则选择P2max作为第三个聚类点;
S8:计算样本费用单价除Pmax、Pmin、P1min/P2max三值之外的其他价格P到三值的距离,按照S6中到聚类点距离最小的方法,分别分入Pmax、Pmin、P1min/P2max所在的三个组;
S9:分别计算分入Pmax、Pmin、P1min/P2max所在的三个组中各价格元素分别与所在组聚类点Pmax、Pmin、P1min/P2max的差值绝对值,获得最大的价格差绝对值δ;如果δ比步骤S7计算出的各组内元素最大差值以及最小差值的差值大,即δ>|δ12|,并且没有一组中的价格元素个数大于其余所有组中元素个数的两倍的情况,则应当重复S7-S8的过程找到新的聚类点,对样本价格按照新的聚类点进行重新分组;否则说明大部分单价样本已经完成聚集,停止找寻新的聚类点;
S10:停止重新分组后,具有最多单价样本个数的组即为聚集度最高的单价样本集合,
将该样本集合的聚类点作为定额计价模式中该项目的定额单价。
进一步地,在上述步骤S1之前,所述训练模块还执行对数值型数据进行预处理的步骤S0;所述方法为对数值型数据进行分组,具体包括:
S0.1:将当前项目特征按照数值大小进行一维顺序排列,然后在数值的上方或下方对应位置标注是否接受市场计价模式的结果;
S0.2:对每两个相邻的点,计算出它们的算数平均值;
S0.3:计算每个算数平均值的结果预测精度,找到比根节点预测精度高且预测精度最大的,将其对应的算数平均值当作是最终的分组界限值;
S0.4:基于所述分组界限值将数值型数据分为2-3组。
进一步地,所述计价模块还用于对数据库中各工厂或公司关于人工、材料、机械的报价费用按日期分组,对各组进行聚类以获得各组的费用聚类点,以所述费用聚类点作为该日期下的市场报价;依据所述市场报价绘制价格随时间的变化曲线,进而对近期价格曲线进行回归。
此外,本发明还提供一种计算机系统,其特征在于:包括:
存储器,用于存储计算机程序;
处理器,用于调用所述存储器中存储的所述计算机程序以实现如上述的土壤修复工程造价概算方法。
本发明提供的一种土壤修复工程造价概算方法、装置及计算机系统,具有以下优点:
(1)在进行工程造价概算时,基于用户输入的数据自动判断适合使用定额计价模式还是市场计价模式,为用户提供最合适的计价模式,不需要用户花精力去查询历史记录清单;
(2)判定采用二分决策树,依据预测精度上升的幅度最大的原则来选择进行分裂树的项目特征,使得决策树进行最快速的分裂;对于数值型数据,事先进行数据处理,依据预测精度最高的原则确定分组界限值,算法简明、节省了计算机算力;
(3)对于指导性规范中没有给予定额计价标准的土壤修复工程,参照指导性计价规范的编制方法,制定一套合适的定额计价标准,节省用户翻阅历史工程计价样本的计算时间;在获得定额单价时不是简单采取算术平均而是采用价格聚类的方式,使得选定的用于进行定额计价的定额单价能够最大程度的符合市场的整体报价情况。
附图说明
图1是本发明所用造价计算装置装载的软件的主界面。
图2是本发明所用造价计算装置装载的软件关于土壤修复工程的具体分类。
图3是全国水泥P.O42.5价格指数在一年内的变化趋势图。
图4是部分工厂报价的水泥P.O42.5单价的汇聚图。
具体实施方式
以下具体实施例将对本发明做进一步详细说明。此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例一:目前的工程造价软件,多是只能选择定额计价模式,而且其使用的定额计价项目往往仅限于国家和地方发布的各种指导性计价规范所列举的项目。即使在个别工程造价概算软件中为用户提供选项,令用户可以自由选择定额计价模式或者市场计价模式,用户也不清楚当前工程概算中应该选择定额计价模式还是市场计价模式。因此,合格的软件应当可以基于数据库分析建模,自动分情况向用户推荐采用何种模式进行造价计算。
基于此目的,本发明提供的一种土壤修复工程造价概算方法、装置、计算机系统,基于所涉及的具体项目内容,将土壤修复工程整体上分为七大项目类型:污染土石方工程、监测注入井工程、防渗覆盖工程、土壤修复工程-细分、二次污染防治工程、设备安装工程、系统调试工程。这其中的“土壤修复工程-细分”是次级概念,具体包括土壤预处理、土壤淋洗、药剂运输、固化稳定化修复、土方入窑、污染土外运、热脱附修复、植被修复、种植管理、废料处理、土方降含水量等具体处理步骤。申请人进行了市场调研,在软件中导入了相关的数据库中的历史工程造价样本,得到土壤修复工程七大项目类型下不同工程项目是接受定额计价模式还是市场计价模式的一手材料。由于造价受到价格波动、工期长短、各级政策等诸多因素的影响,为了简便讨论,仅列出工程项目类别、工期(工期长短影响人工费、机械使用费和管理费)、材料费上涨率这几种统计中影响决策较大的几个因素,列表1所示(注:表1中的“土壤修复工程”实际指的是“土壤修复工程-细分”):
表1
基于该数据,由于最终的判定结果只涉及“接受”和“不接受”市场计价模式两种结果,因此软件中主要采用二分树来进行是否采用市场计价模式的自动判定。通过训练获得二分决策树模型,所述决策树由根节点、内节点、叶节点组成,根节点所在的位置为第0层,然后依次向下为第1层、第2层……第N层;所述叶节点分为“接受市场计价模式”或“不接受市场计价模式”两种;
使用该二分决策树模型自动判定当前用户的工程项目应当采用定额计价模式还是市场计价模式;具体的判定方法步骤如下:
S1:对每个节点的是市场计价模式的正确结果和错误结果进行总数统计,在根节点中记录相应的数据。在类别栏中有22个“接受”、18个“不接受”,因此在根节点记录为(22,18)。
S2:根据对市场计价模式的预测精度确定第1层进行分裂的项目特征,选择分裂后可以提高模型预测精度的项目特征作为内节点,对决策树进行分裂;对于多个可以满足分裂树要求的项目特征,则计算预测精度上升的幅度,幅度最大的被选作用于分裂的项目特征。预测精度指的是错误预测结果的数量和总数量之比,对应于本发明的表1时,根节点的“接受”数量(22)大于“不接受”数量(18),基于多数优先的原则,预测结果是“接受”市场计价模式的几率即为预测精度,结果预测精度为55%(22/40=55%)。而经“项目类型”特征分裂后,“设备安装工程”、“工期”、“材料费涨幅”项下分有9/0、9/4、4/14个“接受/不接受”,因此预测结果是“接受”、“接受”、“不接受”是正确预测。在决策树的某个节点上,计算分裂前和分裂后的精度,如果前者比后者高,则不分裂该树;相反,如果分裂前比分裂后低,表明进行了能提升模型精确度的再分类,则应该分裂该树。据此,统计“项目类型”、“工期”、“材料费涨幅”三者分别作为第1层项目特征时前后对市场计价模式的预测精度。根据规则,可知“项目类型”特征下分裂后“设备安装工程”、“工期”、“材料费涨幅”项下分有9个“接受”、9个“接受”、14个“不接受”,共有32个预测正确,因此模型预测精度为80%(32/40=80%)。对比分裂前的预测精度是55%,可知精度上升幅度为25%。经计算,25%是三者中最大的(“工期”上升20%,“材料费涨幅”上升7.5%),应当根据该项目进行分裂。
S3:在决策树第1层的内节点下属的各特征值中标注其下所涵盖的正确结果和错误结果的总数数据。据此,将“项目类型”下属的“设备安装工程”、“污染土石方工程”、“土壤修复工程”三个特征值下分别标注(9,0)、(9,4)、(4,14)。
S4:以预测结果作为叶节点,分裂后检查每个特征值对应的分支,如果某个分支中只包含一种叶节点,则停止分裂,否则继续分裂。对于本案,叶节点为“接受”和“不接受”两种,在仅依据“项目类型”下面的三个特征值分裂一次后,只有“设备安装工程”的叶节点同属一类“接受”,另外两个特征值则都具有“接受”和“不接受”,应当继续进行分裂。
S5:从剩余项目特征中依据S2中的方法找出进行第2层分裂的项目特征,依次检查是否满足S4的停止分裂条件,直至所有的项目特征均被用完,或者决策树的层数已经达到设定层级。据此,因此在第2层中以“工期”项目特征进行分裂,第3层中以“材料费涨幅”进行分裂,得到最终的决策树。上述表1只是为了便于说明算法,将项目特征限定为三个,实际软件中影响造价的因素多达几十项(例如可以将工期影响的人工费、机械费、管理费都进行单列),决策树如果依据全部项目特征进行分裂,将导致树的分支过多,影响计算机的运算速度,造成过拟合,使得模型的通用性变差。每次分裂都让各个特征值下的样本数量大幅减少,从而使得剩余的项目特征对精度的影响逐渐减小,当决策树的层级已经达到六层之上时,后续参数的影响程度不到1%,再进行分裂的意义不大。此外,须知软件应以方便用户使用为宜,不可能让用户按照列表将当前工程项目的几十项数据全部输入才得出是使用定额计价模式还是市场计价模式的结论,应当至少在用户输入几项重要的数据时就可以得出。平衡各种因素,本发明将决策树分裂的层级限制为六层。
实施例二:实际上,表1的数据是处理过的数据,原始的数据当中诸如“材料费涨幅”是一个确定的数值而不是像表1中的“高”、“低”这样的表观值,实际的数值如下表2所示。
表2
倘若将基于上述数值对决策树进行分裂,则特征值过多,影响计算效率,而且模型的复用性很低。因此,应当对上述数值型数据进行分组,为了让各分支下的数据量不至于过低,考虑分为2-3组较为适宜。因此,在上述步骤S1之前,还有对数值型数据进行预处理的步骤S0。以分两组为例,具体的分组方法为:
S0.1:将所有项目特征“材料费涨幅”按照数值大小进行一维顺序排列,然后在数值的上方或下方对应位置标注是否接受市场计价模式的结果。
S0.2:对每两个相邻的点,计算出它们的算数平均值。由于上表中有40个数值,因此可以得到39个算数平均值。
S0.3:计算每个算数平均值的结果预测精度,找到比根节点预测精度高且预测精度最大的,将其对应的算数平均值当作是最终的分组界限值。经计算可知24.5%和27%的算数平均值25.75%(为了记录简便可以记为25%)可以获得最大的预测精度,其预测精度为60%(比根节点的55%高)。
S0.4:基于所述分组界限值将数值型数据依据分组界限值分为2-3组。本实施例中,基于分组界限值可以将数据分为25%以上(不包括本数)的(使用涨幅“高”代指)和25%以下(包括本数)的(使用涨幅“低”代指)两大组。
上述预处理步骤同样可以用于处理“工期”等其他数值型数据。工期在造价表单中一般都写成“XX年XX月”或“XX日”,经过计算分组界限值,可以“3年”为界将工期划分为“3年(不包括本数)以下”和“3年(包括本数)及以上”。
经过上述步骤S0-S5,可以获得决策是否使用定额计价模式的判断模型,当用户输入几项数据之后,即可自动判定应当采用定额计价模式还是市场计价模式,从而方便用户进行土壤修复工程造价概算。
实施例三:在实施例一的一种土壤修复工程造价概算方法、装置及计算机系统的基础上,本发明于自动判定当前用户的工程项目应当采用定额计价模式还是市场计价模式之后,还有进行工程造价概算的步骤。图1是本发明所用造价计算装置装载的软件的主界面,图2是本发明所用造价计算装置装载的软件关于土壤修复工程的具体分类。所述土壤修复工程整体上分为七大项目类型:污染土石方工程、监测注入井工程、防渗覆盖工程、土壤修复工程-细分、二次污染防治工程、设备安装工程、系统调试工程;用户输入的土壤修复工程的具体类型属于判定当前工程是否采用市场计价模式的依据之一。
如果判定结果是定额计价模式,则基于采集的历史工程造价样本,汇总历史工程造价样本中每项费用的单价,对单价进行聚类,找出聚集度最高的价格作为定额计价模式中该项目的定额单价,据此计算工程造价;如果判定结果是市场计价模式,则基于对近期价格曲线进行回归以预测当前工程工期内的价格变化趋势,据此计算工程造价。
图3是全国水泥P.O42.5价格指数在一年内的变化趋势图。对该趋势图的近期(例如3个月)内的价格变化趋势进行回归分析,获得回归曲线函数(比如可以进行线性回归),再代入当前工期的时间坐标,即可预测当前工期内的水泥价格指数变化情况。
由于土壤修复工程不属于指导性规范中规定的标准工程类目之一,规范没有给出定额计价标准的土壤修复工程,因此本发明参照指导性计价规范的编制方法,制定出一套合适的定额计价标准。本发明的方法主要是采用单价聚类:
S6:找出汇总的样本费用单价中的最大值Pmax和最小值Pmin,作为样本单价的两个端点;计算样本中除了这两个之外的其他价格P与最大值和最小值的差值绝对值,如果|P-Pmax|<|P-Pmin|,则该点P距离聚类点Pmax较近,分入Pmax的组A1,否则分入Pmin的组A2;其中Pmax、Pmin分别是组A1、A2的聚类点;
S7:找出组A1中与Pmax具有最大的差值δ1的价格元素P1min,以及组A2中与Pmax具有最大的差值δ2的价格元素P2max,如果有δ1>δ2,则选择P1min作为第三个聚类点,否则选择P2max作为第三个聚类点;
S8:计算样本费用单价除Pmax、Pmin、P1min/P2max三值之外的其他价格P到三值的距离,按照S6中到聚类点距离最小的方法,分别分入Pmax、Pmin、P1min/P2max所在的三个组;
S9:分别计算分入Pmax、Pmin、P1min/P2max所在的三个组中各价格元素分别与所在组聚类点Pmax、Pmin、P1min/P2max的差值绝对值,获得最大的价格差绝对值δ;如果δ比步骤S7计算出的各组内元素最大差值以及最小差值的差值大,即δ>|δ12|,并且没有一组中的价格元素个数大于其余所有组中元素个数的两倍的情况,则应当重复S7-S8的过程找到新的聚类点,对样本价格按照新的聚类点进行重新分组;否则说明大部分单价样本已经完成聚集,停止找寻新的聚类点;
S10:停止重新分组后,具有最多单价样本个数的组即为聚集度最高的单价样本集合,将该样本集合的聚类点作为定额计价模式中该项目的定额单价。
图4是部分工厂报价的水泥P.O42.5单价的汇聚图。编号10-150的工厂对P.O42.5型号的水泥的报价(单位:元/吨)分别为:420,385,330,305,355,375,390,412,378,345,395,405,392,380,290。
S6:找到最大值Pmax(420)和最小值Pmin(290),然后将15个单价分为A1={380,392,405,395,378,412,390,375,385,420}和A2={290,345,355,305,330}。
S7:接着计算出A1的δ1=45,A2的δ2=65,因此δ1<δ2,选择P2max(355)作为第三个聚类点。
S8:以(420,355,290)三个值对上述15个数据进行聚类,可以得到B1={392,405,395,412,390,420},B2={380,345,378,375,355,330,385},B3={290,305}。
S9:获得三组中最大的价格差绝对值δ=30(最小的为15),由于δ>|δ12|=20,并且三组中价格元素的个数分别是6、7、2,并且没有一组中的价格元素个数大于其余所有组中元素个数的两倍的情况,表明组内的价格元素之间距离差距过大,因此重复S7-S8找到新的聚类点390(选第二组的385也可)。重复S8的过程将上述15个单价分为四组:C1={405,412,420},C2={380,392,395,378,390,375,385},C3={345,355,330},C4={290,305}。由于C2组的元素个数7大于所有其他组元素个数的两倍,因此不需要再找聚类点。
S10:C2组是聚集度最高的单价样本集合,将该样本集合的聚类点390作为定额计价模式中该项目的定额单价。
如果采用全国或地区的平均价格,即对上述15个单价计算算数平均值,水泥的报价只有370元/吨,和聚类点390元/吨有一定差距,虽然看上去二者的差距不大,但是从图4直观上看,380-400元/吨范围内价格点的分布最密集,这说明370元/吨并不能反映市场整体的报价情况。可见,本发明采用聚类方法可以获得的市场价格更加准确。
此外,对数据库中各工厂或公司关于人工、材料、机械的报价费用按日期分组,对各组进行聚类以获得各组的费用聚类点,以所述费用聚类点作为该日期下的市场报价;依据所述市场报价绘制价格随时间的变化曲线,进而对近期价格曲线进行回归。
此外,本发明还提供一种计算机系统,其特征在于:包括:
存储器,用于存储计算机程序;
处理器,用于调用所述存储器中存储的所述计算机程序以实现如上述的土壤修复工程造价概算方法。
此外,本发明还提供一种计算机存储介质,其特征在于:其上存储有计算机程序,所述计算机程序被处理器执行以实现如上述的土壤修复工程造价概算方法。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其它的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (11)

1.一种土壤修复工程造价概算方法,其特征在于: 采集土壤修复工程领域的历史工程造价样本,获得各工程样本中是采用定额计价模式还是市场计价模式;
通过训练获得二分决策树模型,所述决策树由根节点、内节点、叶节点组成,根节点所在的位置为第0层,然后依次向下为第1层、第2层……第N层;所述叶节点分为“接受市场计价模式”或“不接受市场计价模式”两种;
使用该二分决策树模型自动判定当前用户的工程项目应当采用定额计价模式还是市场计价模式;如果判定结果是定额计价模式,则基于采集的历史工程造价样本,汇总历史工程造价样本中每项费用的单价,对单价进行聚类,找出聚集度最高的价格作为定额计价模式中该项目的定额单价,据此计算工程造价;如果判定结果是市场计价模式,则基于对近期价格曲线进行回归以预测当前工程工期内的价格变化趋势,据此计算工程造价;
其中,所述模型训练的步骤为:
S1:对每个节点的是市场计价模式的正确结果和错误结果进行总数统计,在根节点中记录相应的数据;
S2:根据对市场计价模式的预测精度确定第1层进行分裂的项目特征,选择分裂后可以提高模型预测精度的项目特征作为内节点,对决策树进行分裂;对于多个可以满足分裂树要求的项目特征,则计算预测精度上升的幅度,幅度最大的被选作用于分裂的项目特征;
S3:在决策树第1层的内节点下属的各特征值中标注其下所涵盖的正确结果和错误结果的总数数据;
S4:以预测结果作为叶节点,分裂后检查每个特征值对应的分支,如果某个分支中只包含一种叶节点,则停止分裂,否则继续分裂;
S5:从剩余项目特征中依据S2中的方法找出进行第2层分裂的项目特征,依次检查是否满足S4的停止分裂条件,直至所有的项目特征均被用完,或者决策树的层数已经达到预先设定的最大层级;
所述对单价进行聚类,找出聚集度最高的价格作为定额计价模式中的定额单价的步骤具体为:
S6:找出汇总的样本费用单价中的最大值P max和最小值P min,作为样本单价的两个端点;计算样本中除了这两个之外的其他价格P与最大值和最小值的差值绝对值,如果|P-Pmax|<|P-P min|,则该点P距离聚类点P max较近,分入P max的组A1,否则分入P min的组A2;其中P max、P min分别是组A1、A2的聚类点;
S7:找出组A1中与P max具有最大的差值δ 1的价格元素P1 min,以及组A2中与P max具有最大的差值δ 2的价格元素P2 max,如果有δ 1>δ 2,则选择P1 min作为第三个聚类点,否则选择P2 max作为第三个聚类点;
S8:计算样本费用单价除P max、P min、P1 min/P2 max三值之外的其他价格P到三值的距离,按照S6中到聚类点距离最小的方法,分别分入P max、P min、P1 min/P2 max所在的三个组;
S9:分别计算分入P max、P min、P1 min/P2 max所在的三个组中各价格元素分别与所在组聚类点P max、P min、P1 min/P2 max的差值绝对值,获得最大的价格差绝对值δ;如果δ比步骤S7计算出的各组内元素最大差值以及最小差值的差值大,即δ>|δ 1-δ 2|,并且没有一组中的价格元素个数大于其余所有组中元素个数的两倍的情况,则应当重复S7-S8的过程找到新的聚类点,对样本价格按照新的聚类点进行重新分组;否则说明大部分单价样本已经完成聚集,停止找寻新的聚类点;
S10:停止重新分组后,具有最多单价样本个数的组即为聚集度最高的单价样本集合,将该样本集合的聚类点作为定额计价模式中该项目的定额单价。
2.如权利要求1所述的土壤修复工程造价概算方法,其特征在于:所述土壤修复工程整体上分为七大项目类型:污染土石方工程、监测注入井工程、防渗覆盖工程、土壤修复工程-细分、二次污染防治工程、设备安装工程、系统调试工程;用户输入的土壤修复工程的具体种类属于判定当前工程是否采用市场计价模式的依据之一。
3.如权利要求2所述的土壤修复工程造价概算方法,其特征在于:所述土壤修复工程-细分具体包括土壤预处理、土壤淋洗、药剂运输、固化稳定化修复、土方入窑、污染土外运、热脱附修复、植被修复、种植管理、废料处理、土方降含水量这十一种具体处理步骤。
4.如权利要求1所述的土壤修复工程造价概算方法,其特征在于:对数据库中各工厂或公司关于人工、材料、机械的报价费用按日期分组,对各组进行聚类以获得各组的费用聚类点,以所述费用聚类点作为该日期下的市场报价;依据所述市场报价绘制价格随时间的变化曲线,进而对近期价格曲线进行回归。
5.如权利要求1所述的土壤修复工程造价概算方法,其特征在于:在上述步骤S1之前,还有对数值型数据进行预处理的步骤S0;所述方法为对数值型数据进行分组,具体包括:
S0.1:将当前项目特征按照数值大小进行一维顺序排列,然后在数值的上方或下方对应位置标注是否接受市场计价模式的结果;
S0.2:对每两个相邻的点,计算出它们的算数平均值;
S0.3:计算每个算数平均值的结果预测精度,找到比根节点预测精度高且预测精度最大的,将其对应的算数平均值当作是最终的分组界限值;
S0.4:基于所述分组界限值将数值型数据分为2-3组。
6.一种土壤修复工程造价概算装置,其特征在于:包括:
采集模块,用于采集土壤修复工程领域的历史工程造价样本,获得各工程样本中是采用定额计价模式还是市场计价模式;
训练模块,用于通过训练获得二分决策树模型,所述决策树由根节点、内节点、叶节点组成,根节点所在的位置为第0层,然后依次向下为第1层、第2层……第N层;所述叶节点分为“接受市场计价模式”或“不接受市场计价模式”两种;
判定模块,用于使用该二分决策树模型自动判定当前用户的工程项目应当采用定额计价模式还是市场计价模式;
计价模块,如果判定结果是定额计价模式,则用于基于采集的历史工程造价样本,汇总历史工程造价样本中每项费用的单价,对单价进行聚类,找出聚集度最高的价格作为定额计价模式中该项目的定额单价,据此计算工程造价;如果判定结果是市场计价模式,则用于基于对近期价格曲线进行回归以预测当前工程工期内的价格变化趋势,据此计算工程造价;
其中,所述训练模块训练模型的步骤为:
S1:对每个节点的是市场计价模式的正确结果和错误结果进行总数统计,在根节点中记录相应的数据;
S2:根据对市场计价模式的预测精度确定第1层进行分裂的项目特征,选择分裂后可以提高模型预测精度的项目特征作为内节点,对决策树进行分裂;对于多个可以满足分裂树要求的项目特征,则计算预测精度上升的幅度,幅度最大的被选作用于分裂的项目特征;
S3:在决策树第1层的内节点下属的各特征值中标注其下所涵盖的正确结果和错误结果的总数数据;
S4:以预测结果作为叶节点,分裂后检查每个特征值对应的分支,如果某个分支中只包含一种叶节点,则停止分裂,否则继续分裂;
S5:从剩余项目特征中依据S2中的方法找出进行第2层分裂的项目特征,依次检查是否满足S4的停止分裂条件,直至所有的项目特征均被用完,或者决策树的层数已经达到预先设定的最大层级; 所述计价模块对单价进行聚类,找出聚集度最高的价格作为定额计价模式中的定额单价的步骤具体为:
S6:找出汇总的样本费用单价中的最大值P max和最小值P min,作为样本单价的两个端点;计算样本中除了这两个之外的其他价格P与最大值和最小值的差值绝对值,如果|P-Pmax|<|P-P min|,则该点P距离聚类点P max较近,分入P max的组A1,否则分入P min的组A2;其中P max、P min分别是组A1、A2的聚类点;
S7:找出组A1中与P max具有最大的差值δ 1的价格元素P1 min,以及组A2中与P max具有最大的差值δ 2的价格元素P2 max,如果有δ 1>δ 2,则选择P1 min作为第三个聚类点,否则选择P2 max作为第三个聚类点;
S8:计算样本费用单价除P max、P min、P1 min/P2 max三值之外的其他价格P到三值的距离,按照S6中到聚类点距离最小的方法,分别分入P max、P min、P1 min/P2 max所在的三个组;
S9:分别计算分入P max、P min、P1 min/P2 max所在的三个组中各价格元素分别与所在组聚类点P max、P min、P1 min/P2 max的差值绝对值,获得最大的价格差绝对值δ;如果δ比步骤S7计算出的各组内元素最大差值以及最小差值的差值大,即δ>|δ 1-δ 2|,并且没有一组中的价格元素个数大于其余所有组中元素个数的两倍的情况,则应当重复S7-S8的过程找到新的聚类点,对样本价格按照新的聚类点进行重新分组;否则说明大部分单价样本已经完成聚集,停止找寻新的聚类点;
S10:停止重新分组后,具有最多单价样本个数的组即为聚集度最高的单价样本集合,将该样本集合的聚类点作为定额计价模式中该项目的定额单价。
7.如权利要求6所述的土壤修复工程造价概算装置,其特征在于:所述土壤修复工程整体上分为七大项目类型:污染土石方工程、监测注入井工程、防渗覆盖工程、土壤修复工程-细分、二次污染防治工程、设备安装工程、系统调试工程;用户输入的土壤修复工程的具体种类属于判定当前工程是否采用市场计价模式的依据之一。
8.如权利要求6所述的土壤修复工程造价概算装置,其特征在于:在上述步骤S1之前,所述训练模块还执行对数值型数据进行预处理的步骤S0;所述方法为对数值型数据进行分组,具体包括:
S0.1:将当前项目特征按照数值大小进行一维顺序排列,然后在数值的上方或下方对应位置标注是否接受市场计价的结果;
S0.2:对每两个相邻的点,计算出它们的算数平均值; S0.3:计算每个算数平均值的结果预测精度,找到比根节点预测精度高且预测精度最大的,将其对应的算数平均值当作是最终的分组界限值; S0.4:基于所述分组界限值将数值型数据分为2-3组。
9.如权利要求6所述的土壤修复工程造价概算装置,其特征在于:所述计价模块还用于对数据库中各工厂或公司关于人工、材料、机械的报价费用按日期分组,对各组进行聚类以获得各组的费用聚类点,以所述费用聚类点作为该日期下的市场报价;依据所述市场报价绘制价格随时间的变化曲线,进而对近期价格曲线进行回归。
10.一种计算机系统,其特征在于:包括:存储器,用于存储计算机程序;处理器,用于调用所述存储器中存储的所述计算机程序以实现如权利要求1-5任一项所述的土壤修复工程造价概算方法。
11.一种计算机存储介质,其特征在于:其上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-5任一项所述的土壤修复工程造价概算方法。
CN202110750651.2A 2021-07-01 2021-07-01 一种土壤修复工程造价概算方法、装置及计算机系统 Active CN113592537B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110750651.2A CN113592537B (zh) 2021-07-01 2021-07-01 一种土壤修复工程造价概算方法、装置及计算机系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110750651.2A CN113592537B (zh) 2021-07-01 2021-07-01 一种土壤修复工程造价概算方法、装置及计算机系统

Publications (2)

Publication Number Publication Date
CN113592537A CN113592537A (zh) 2021-11-02
CN113592537B true CN113592537B (zh) 2023-09-26

Family

ID=78245828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110750651.2A Active CN113592537B (zh) 2021-07-01 2021-07-01 一种土壤修复工程造价概算方法、装置及计算机系统

Country Status (1)

Country Link
CN (1) CN113592537B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977717A (zh) * 2017-11-24 2018-05-01 国网内蒙古东部电力有限公司 一种电网检修工程造价差额自动调整方法
CN108073764A (zh) * 2017-12-11 2018-05-25 安徽省交通规划设计研究总院股份有限公司 一种定额人工费单价增长对公路工程造价影响程度数学模型的计算方法
CN109685558A (zh) * 2018-12-14 2019-04-26 国网辽宁省电力有限公司经济技术研究院 一种基于bim技术的电力工程造价评价系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977717A (zh) * 2017-11-24 2018-05-01 国网内蒙古东部电力有限公司 一种电网检修工程造价差额自动调整方法
CN108073764A (zh) * 2017-12-11 2018-05-25 安徽省交通规划设计研究总院股份有限公司 一种定额人工费单价增长对公路工程造价影响程度数学模型的计算方法
CN109685558A (zh) * 2018-12-14 2019-04-26 国网辽宁省电力有限公司经济技术研究院 一种基于bim技术的电力工程造价评价系统

Also Published As

Publication number Publication date
CN113592537A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN108364085B (zh) 一种外卖配送时间预测方法和装置
CN106600455A (zh) 一种基于逻辑回归的电费敏感度评估方法
CN110988422A (zh) 一种窃电识别方法、装置及电子设备
CN113592538B (zh) 一种工程造价概算方法及系统
CN111260413A (zh) 一种基于矢量图形的电力主网工程施工图造价速算方法
CN109754177A (zh) 污染源画像标签体系、污染源画像的构造方法及其应用
CN105069542A (zh) 一种责任成本预算编制方法及系统
CN109033322A (zh) 一种多维数据的测试方法和装置
CN115905319B (zh) 一种海量用户电费异常的自动识别方法及系统
CN111695979A (zh) 一种原材料与成品的关系分析方法、装置及设备
WO2024125673A2 (zh) 一种数据处理及可视化的方法、装置、介质和设备
CN115204583A (zh) 化工园区区域风险分级管控评估分析方法、系统及装置
CN113837912A (zh) 一种建筑业碳排放影响因素分析方法
CN113409001A (zh) 一种控制建筑工程工程量清单自动组价的方法
CN115310752A (zh) 面向能源大数据的数据资产价值评价方法及系统
CN113592537B (zh) 一种土壤修复工程造价概算方法、装置及计算机系统
CN107093018A (zh) 基于健康模型的电信工程项目信息可视化方法及装置
CN111882289B (zh) 一种项目数据审核指标区间测算的装置和方法
CN113421037A (zh) 一种多源协同建设规划编制方法和装置
CN113537758A (zh) 基于大数据技术的制造业高质量发展综合评价方法和系统
CN111640031A (zh) 跨系统的理赔数据处理方法、装置及相关设备
CN113592536B (zh) 一种专用于土壤修复工程的工程造价概算方法及装置
CN111078683A (zh) 一种基于插值查找的电网台账数据填充与统计方法及装置
CN105404608A (zh) 一种基于公式解析的复杂指标集计算方法和系统
CN113781011A (zh) 一种配电网工程造价的审核方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant