CN109658156A - 一种材料价格测算方法、装置、终端设备及存储介质 - Google Patents
一种材料价格测算方法、装置、终端设备及存储介质 Download PDFInfo
- Publication number
- CN109658156A CN109658156A CN201811595069.8A CN201811595069A CN109658156A CN 109658156 A CN109658156 A CN 109658156A CN 201811595069 A CN201811595069 A CN 201811595069A CN 109658156 A CN109658156 A CN 109658156A
- Authority
- CN
- China
- Prior art keywords
- data
- measured
- price
- model
- matching materials
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000463 material Substances 0.000 title claims abstract description 400
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000003860 storage Methods 0.000 title claims abstract description 20
- 241001269238 Data Species 0.000 claims abstract description 49
- 239000010421 standard material Substances 0.000 claims abstract description 19
- 238000012417 linear regression Methods 0.000 claims description 29
- 238000009826 distribution Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 238000013075 data extraction Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 abstract description 6
- 238000012545 processing Methods 0.000 abstract description 5
- 239000000284 extract Substances 0.000 abstract description 3
- 238000005259 measurement Methods 0.000 abstract 1
- 239000000523 sample Substances 0.000 description 79
- 238000004154 testing of material Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 7
- 238000010276 construction Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 3
- 241000209094 Oryza Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 239000012237 artificial material Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 239000004800 polyvinyl chloride Substances 0.000 description 2
- 229920000915 polyvinyl chloride Polymers 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000004035 construction material Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000011810 insulating material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000005477 standard model Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
Landscapes
- Business, Economics & Management (AREA)
- Development Economics (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种材料价格测算方法、装置、终端设备及存储介质,包括,获取待测算材料的待测算材料数据,对待测算材数据进行处理获得待测算材料数据的标准材料名称、标准规格型号和标准单位;根据待测算材料数据的标准材料名称、标准规格型号和标准单位与预存数据库中的材料数据进行匹配,获得已匹配材料数据,提取所有已匹配材料数据,通过箱线图规则剔除已匹配材料数据集中,材料价格异常的已匹配材料数据,获得若干待测算样本数据;通过预设的测算模型,对所有待测算样本数据的材料价格进行处理,获得待测算材料的预估价格;通过实施本发明的实施例能够自动测算出待测算材料的预估价格,帮助缺乏经验的用户提高工程材料价格估计的合理性。
Description
技术领域
本发明涉及建设行业数据分析领域,具体涉及一种材料价格的测算方法、装置、终端设备及存储介质。
背景技术
在国内外建设工程中,建筑材料费用占工程造价的比例一般都超过了50%,材料费用是构成项目造价成本的主体费用,因此对材料价格的把控是相关造价部门和成本控制部门工作中的重点和难点。
随着互联网的发展,用户可轻易的在网络上获取各类工程材料的价格数据,但网络上工程材料数据出处多、数据杂乱且缺乏标准。缺乏经验的用户根据从网络上获取的不同来源且不断更新变化的材料价格,估算出的某一类工程材料的价格合理性较差。
发明内容
本发明实施例提供一种材料价格的测算方法、装置、终端设备及存储介质,能够自动测算出待测算材料的预估价格,帮助缺乏经验的用户提高工程材料估计的合理性。
本发明第一实施例提供一种材料价格的测算方法,包括:
获取待测算材料的待测算材料数据,并对所述待测算材料数据进行处理,获得所述待测算材料数据的标准材料名称、标准规格型号和标准单位;
根据所述待测算材料数据的标准材料名称、标准规格型号和标准单位与预存数据库中的材料数据进行匹配,并将每一匹配成功的材料数据作为已匹配材料数据;
提取所有所述已匹配材料数据,获得已匹配材料数据集;其中,每一所述已匹配材料数据包括材料名称、规格型号、单位和材料价格;
通过箱线图规则剔除所述已匹配材料数据集中,材料价格异常的已匹配材料数据,获得若干待测算样本数据;
通过预设的测算模型,对所有所述待测算样本数据的材料价格进行处理,获得所述待测算材料的预估价格;其中,所述预设的测算模型包括正态分布模型、算术平均数模型、加权平均数模型或线性回归模型。
进一步的,在获得所述待测算材料的预估价格之后还包括:
根据所述待测算材料的若干历史测算价格,计算所述待测算材料的平均价格走势;
若所述预估价格不在所述平均价格走势的预设波动范围内,则重新选择不同的预设的测算模型,对所述待处理材料价格进行处理。
进一步的,所述通过箱线图规则剔除所述已匹配材料数据集中,材料价格异常的已匹配材料数据,获得若干待测算样本数据,具体为:
将每一所述已匹配材料数据的材料价格,从小到大进行排序;
根据排序结果及所述已匹配材料数据的材料价格的总个数,获得下四分位数和上四分位数,并通过以下公式计算上限值和下限值;
IQR=Q3-Q1,
Q min=Q1-1.5*IQR,
Q max=Q3+1.5*IQR;
其中,Q3为上四分位数、Q1为下四分位数、IQR为四分位距、Q min为上限值、Q max为下限值;
若所述已匹配材料数据的材料价格小于所述下限值或大于所述上限值,则剔除,获得所述若干待测算样本数据。
进一步的,每一所述已匹配材料数据还包括报价时间、地区、价格类型、品牌和供应商。
进一步的,所述通过预设的测算模型,对所有所述待测算样本数据的材料价格进行处理,获得所述待测算材料的预估价格,具体为:
若通过所述正态分布模型对所有所述待测算样本数据的材料价格进行处理,则执行以下步骤:
根据所有所述待测算样本数据的材料价格绘制正态分布图;
将概率密度超过第一预设阈值的待测算样本数据的材料价格,作为第一待处理材料价格;
计算所有所述第一待处理材料价格的平均值获得所述待测算材料的预估价格;
若通过所述算术平均数模型对所有所述待测算样本数据的材料价格进行处理,则执行以下步骤:
直接计算所有所述待测算样本数据的材料价格的算术平均值,并将所述算术平均值作为所述待测算材料的预估价格;
若通过所述加权平均数模型对所有所述待测算样本数据的材料价格进行处理,则执行以下步骤:
根据所述待测算样本数据的报价时间、地区、价格类型、品牌和供应商,为每一所述待测算样本数据设置预设的权重;
根据每一所述待测算样本数据预设的权重和材料价格,计算所有所述待测算样本数据的材料价格的加权平均数,并将所述加权平均数作为所述待测算材料的预估价格;
若通过线性回归模型,对所有所述待测算样本数据的材料价格进行处理,则执行以下步骤:
以所述待测算样本数据的报价时间为Y轴,以所述待测算样本数据的材料价格为X轴建立直角坐标图;
根据所述直角坐标图,获得用于表示所述待测算样本数据报价时间与材料价格之间关系的线性回归方程;
根据所述线性回归方程,计算所述待测算材料的预估价格。
在本发明第一实施例的基础上,提供了第二实施例;
本发明第二实施例提供了一种材料价格测算装置,包括数据获取模块、数据匹配模块、数据提取模块、数据筛除模块和数据测算模块;
其中,所述数据获取模块,用于获取待测算材料的待测算材料数据,并对所述待测算材料数据进行处理,获得所述待测算材料数据的标准材料名称、标准规格型号和标准单位;
所述数据匹配模块,用于根据所述待测算材料数据的标准材料名称、标准规格型号和标准单位与预存数据库中的材料数据进行匹配,并将每一匹配成功的材料数据作为已匹配材料数据;
所述数据提取模块,用于提取所有所述已匹配材料数据,获得已匹配材料数据集;其中,每一所述已匹配材料数据包括材料名称、规格型号、单位和材料价格;
所述数据筛除模块,用于通过箱线图规则剔除所述已匹配材料数据集中,材料价格异常的已匹配材料数据,获得若干待测算样本数据;
所述数据测算模块,用于通过预设的测算模型,对所有所述待测算样本数据的材料价格进行处理,获得所述待测算材料的预估价格;其中,所述预设的测算模型包括正态分布模型、算术平均数模型、加权平均数模型或线性回归模型。
进一步的,还包括预估价格走势确定及比对模块;
所述预估价格走势确定及比对模块,用于根据所述待测算材料的若干历史测算价格,计算所述待测算材料的平均价格走势;
计算所述预估价格当前价格走势,并与所述平均价格走势进行比对;
若所述当前价格走势不在所述平均价格走势的预设波动范围内,则重新选择不同的预设的测算模型,对所述待处理材料价格进行处理。
在本发明第一实施例的基础上,提供了第三实施例;
本发明第三实施例提供了一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序是实现本发明第一实施例提供的材料价格测算方法。
在本发明第一实施例在本发明第一实施例的基础上,提供了第四实施例;
本发明第四实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在的设备执行本发明第一实施例提供的材料价格测算方法。通过实施本发明的实施例,有如下有益效果:
本发明实施例提供了一种材料价格测算方法、装置、终端设备及存储介质,通过获取待测算材料数据后,对待测算材料数据进行处理,然后与预存数据库中的材料数据进行匹配,获得已匹配材料数据,通过箱线图的规则剔除已匹配材料数据中材料价格异常的材料数据,从而提高测算样本数据的合理性,最后通过预设的测算模型,测算出待测算材料合理的预估价格,帮助缺乏经验的用户提高工程材料估计的合理性。
附图说明
图1是本发明第一实施例提供的一种材料价格测算方法的流程示意图;
图2是本发明第二实施例提供的一种材料价格测算装置的结构示意图;
附图标记说明:数据获取模块201;数据匹配模块202;数据提取模块203;数据筛除模块204;数据测算模块205。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明第一实施例提供的一种材料价格测算方法包括步骤:
S101、获取待测算材料的待测算材料数据,并对所述待测算材料数据进行处理,获得所述待测算材料数据的标准材料名称、标准规格型号和标准单位。
S102、根据所述待测算材料数据的标准材料名称、标准规格型号和标准单位与预存数据库中的材料数据进行匹配,并将每一匹配成功的材料数据作为已匹配材料数据。
S103、提取所有所述已匹配材料数据,获得已匹配材料数据集;其中,每一所述已匹配材料数据包括材料名称、规格型号、单位和材料价格。
S104、通过箱线图规则剔除所述已匹配材料数据集中,材料价格异常的已匹配材料数据,获得若干待测算样本数据。
S105、通过预设的测算模型,对所有所述待测算样本数据的材料价格进行处理,获得所述待测算材料的预估价格;其中,所述预设的测算模型包括正态分布模型、算术平均数模型、加权平均数模型或线性回归模型。
对于步骤S101、首先获取用户填写的待测算材料的初始的待测算材料数据,包括初始的材料名称、初始的规格型号,初始的单位,因为用户在填写数据时,可能填写的数据项的值,不够规范因此需要对用户填写的初始的待测算材料数据进行处理,从而识别出待测算材料数据的标准材料名称、标准规格型号和标准单位。
优选的,待测算材料数据的具体处理方式如下:
构建工程材料数据类别智能识别模型,用于根据不同工程材料的材料名称,识别工程材料所属的类别,其中,材料类别以《GB/T 50851-2013建设工程人工材料设备机械数据标准》(简称国标)的二级分类为准,
工程材料数类别智能识别模型具体构建方式如下:
步骤一,获取若干材料训练样本和材料测试样本,材料训练样本有国标二级分类编码及其对应的材料名称(国标二级分类名称),材料测试样本只有材料名称。
步骤二,将材料测试样本中的材料名称进行分词,并与整理好的停用词库中的词汇进行匹配;删除材料名称中的停用词,实现对材料名称的清洗;
由于从各个来源搜集的材料测试样本数据,对应的材料名称命名没有标准的规范,因此材料名称经常会加入一些规格、材质以及品牌系列数据,需对其进行整理。
停用词是指对材料类别识别没有意义的词,也称无效词。停用词表是在普通停用词表的基础上还添加了一些表示材料规格,数量+单位,以及括号为代表的符号等;例如:
步骤三,分别对国标二级分类编码所对应的材料训练样本进行分词处理,并对分词进行去重;留下的词为该类别的关键词,将这些关键词组合成各类别材料组合名称,关键词出现的频率越高,权重越高,例如:
步骤四,通过共现相似度算法计算出清洗后的材料测试样本材料名称与材料训练样本关键词组合名称的相似系数;对于材料测试样本A和材料测试样本 B,相似系数k的具体计算公式如
步骤五,设定相似系数的阈值为0.3;将相似系数大于0.3的材料训练样本对应的国标二级分类视为材料测试样本的候选类别;
步骤六,通过步骤五选出属于候选类别的所有样本,建立特征关键词和材料文本矩阵,使用信息增益法提取关键特征。
信息增益的计算公式如下
p(ci)表示第i个类别Ci出现的概率,p(t)表示关键特征t出现的概率;p(ci/t) 表示关键特征t出现时,Ci出现的概率;根据各特征IG值进行排序,取前2/3 特征关键词作为分类关键词。
步骤七、选取伯努利模型建立NB分类器(贝叶斯算法);伯努利模型中的特征值表示词组在材料文本中出现或不出现。材料文本为短文本;伯努利模型的贝叶斯分类器适合离散特征的数据分类;伯努利模型中的每个特征取值只能为1或0:若词组在材料文本中出现,特征值标识为1;若词组在材料文本中不出现,特征值标识为0。
训练样本有n个特征,分别用x1,x2……xn表示;则将其划分到类yk的可能性
当特征为1时,p(xi|yk)=p(xi=1|yk)
当特征值为0时,p(xi|yk)=1-p(xi=1|yk)
至此工程材料类别智能识别模型构建完毕,将待测算材料数据,输入到构建好的工程材料类别智能识别模型中,识别出待测算材料数据的标准名称。
在识别出待测算材料数据的标准名称后,还需识别待测算材料的标准规格型号和标准单位;
优选的,先构建工程材料特征值提取模型,具体构建步骤如下
步骤一、搜集整理工程材料数据,构建工程材料语料库。
通过调整数据格式,整合工程材料数据;形成由材料名称、材料规格/型号/ 材质特征、单位以及其他特殊描述的词条组成的工程材料语料库。不同渠道来源的工程材料数据的数据格式不一致,采集各计量计价软件、各项目中的材料机械设备数据、询价材料数据、供应商报价数据作为备用数据。通过爬虫程序从各大网站搜集材料数据作为备用数据。
步骤二、搜集数据并整理工程材料分词词库,构建分词词典
进入搜狗词库,下载计算机、电力电气、电子工程、材料科学、化工、环境能源、建筑等工程材料相关的多个专业词库;合并各专业词库并去重,再与语料库进行字符串匹配,删除匹配失败的分词,其他分词构成最终词典的分词。再将《GB/T 50851-2013建设工程人工材料设备机械数据标准》的一级分类名称、二级分类名称以及提及的其他材料名称加入分词库,形成最终分词词典。利用网络爬虫搜集互联网发布的国标二级分类下工程材料的材料名称、材料规格型号等特征、单位构成初始的材料名称词库、材料特征词库和单位词库。、将分词词典导入分词工具,对工程材料语料库进行分词,并自动进行词性标注词性类别包括名称、动词、量词、形容词、副形词;分词工具是Ansj,词性标注使用的是中科院标准。
步骤三、结合词库和规则匹配方法对分词的材料特征进行标注,完成工程材料样本构建。
步骤四、根据选输入的分词属性特征的不同,制定3个不同的随机条件场的特征,随机从工程材料样本中选取70%的数据,分别使用不同的特别模板训练出不同的模型模板;
步骤五、将工程材料样本剩余30%的数据输入模型,得到分词的材料特征预测结果,选出最优的工程材料特征值提取模型。
至此工程材料特征值提取模型构建结束。
通过该模型,获得待测算材料数据的标准规格型号和标准单位。
例如:待测算材料数据的初始的材料名称为“全塑电力电缆”规格为“120mm2二芯VV”,单位为“米”则经过数据处理之后,会得到以下结果:
标准材料名称:电力电缆
标准规格型号:1.标称截面:120mm2,2.芯数:2芯,3.绝缘材料:聚氯乙烯, 4.护套材料:聚氯乙烯,5.额定电压:1.00KV,6.型号:VV
标准单位:m
对于步骤S102、将待测算材料数据的标准材料名称、标准规格型号和标准单位与预存在数据库中材料数据进行匹配,将标准材料名称、标准规格型号、和标准单位均相同的材料数据作为,已匹配材料数据。
需要说明的是,预存在数据库中的材料数据,也是提前经过上述的工程材料数据类别智能识别模型和工程材料特征值提取模型,识别出了标准材料名称、标准规格型号和标准单位的。
对于步骤S103、将所有的已匹配材料数据进行归集,获得已匹配材料数据集,且每一已匹配材料数据包括材料名称、规格型号、单位和材料价格
优选的,每一已匹配材料数据还包括报价时间、地区、价格类型、品牌和供应商,字段,需要说明的是,价格类型预设的不同分类的价格,例如:场商报价、市场价、信息价、内部价、历史价、最新价等,可根据实际情况进行自定义。
例如:以待测算材料数据的初始的材料名称为“全塑电力电缆”规格为“120mm2二芯VV”,单位为“米”为例,经过匹配后得到如下已匹配材料数据:
对于步骤S104、具体为:将每一已匹配材料数据的材料价格,从小到大进行排序;
根据排序结果及已匹配材料数据的材料价格的总个数,获得下四分位数和上四分位数,并通过以下公式计算上限值和下限值;
IQR=Q3-Q1,
Q min=Q1-1.5*IQR,
Q max=Q3+1.5*IQR;
其中,Q3为上四分位数、Q1为下四分位数、IQR为四分位距、Q min为上限值、Q max为下限值;
若已匹配材料数据的材料价格小于下限值或大于上限值,则剔除,获得若干待测算样本数据。
例如:若在步骤S102、匹配到的材料价格分别为162;155;160;130;180; 215、140;
首先对这些价格进行排序:130;140;155;160;162;180;215
根据公式计算Q1,Q3的位置和值:n=7(价格总个数)
Q1的位置=(n+1)/4=(7+1)/4=2,该位置的数字为140;
Q2的位置=(n+1)/2=(7+1)/2=4,该位置的数字为160;
Q3的位置=3*(n+1)/4=3×(7+1)/4=6,该位置的数字为180;
即得到Q1=140;Q2=160;Q3=180;
根据公式计算四分位距,最小区间值和最大区间值
四分位距IQR=Q3-Q1=180-160=20
最小区间值min=Q1-1.5*IQR=140-1.5×20=110
最大区间值max=Q3+1.5*IQR=180+1.5×20=210
即得到异常值的范围:异常值<110,210<异常值
去除异常值:根据异常值的范围异常值<110,210<异常值,查看已匹配到的价格,发现215这个价格属于异常值,所以可去除这个价格。
对于步骤S105、具体的:若通过正态分布模型对所有待测算样本数据的材料价格进行处理,则执行以下步骤:
根据所有待测算样本数据的材料价格绘制正态分布图;
将概率密度超过第一预设阈值的待测算样本数据的材料价格,作为第一待处理材料价格;
计算所有第一待处理材料价格的平均值获得待测算材料的预估价格;
若通过算术平均数模型对所有待测算样本数据的材料价格进行处理,则执行以下步骤:
直接计算所有待测算样本数据的材料价格的算术平均值,并将算术平均值作为待测算材料的预估价格;
若通过加权平均数模型对所有待测算样本数据的材料价格进行处理,则执行以下步骤:
根据待测算样本数据的报价时间、地区、价格类型、品牌和供应商,为每一待测算样本数据设置预设的权重;
根据每一待测算样本数据预设的权重和材料价格,计算所有待测算样本数据的材料价格的加权平均数,并将加权平均数作为待测算材料的预估价格;
若通过线性回归模型,对所有待测算样本数据的材料价格进行处理,则执行以下步骤:
以待测算样本数据的报价时间为Y轴,以待测算样本数据的材料价格为X 轴建立直角坐标图;
根据直角坐标图,获得用于表示待测算样本数据报价时间与材料价格之间关系的线性回归方程;
根据线性回归方程,计算待测算材料的预估价格。
为了满足不同的场景需要,预设了不同的测算模型以供用户选择,若用户没有选择制定的测测算模型,则根据海量用户的使用情况,默认选择使用次数最多的测算模型进行测算;
需要说明的是,若采用正态分布模型进行估算,所提及的第一预设阈值可根据实际情况任意设定,提取出概率密度值较高即可能性较高的待测算样本数据。
算术平均数适用与在待测算样本数据较少的情况下,直接计算。
若待测算样本数据,包含于有不同来源、不同类型的材料价格的情形。假如一串价格里有信息价和市场价,如果想得到的测算价与信息价更切合,则可以加大信息价的权重,减少市场价的权重。具体所要进行权重设置的数据项,可以为报价时间、地区、价格类型、品牌和供应商中的任意一项,或多项组合,每一数据项权重值的设定可按实际情况,进行任意设定。
若待测算样本数据中的价格类型,只有历史价,即没有当前估算时间的价格数据,可以通过线性回归的模型,预测出当前估算时间点的待测算材料数据的估算价格。
优选的,在获得待测算材料的预估价格之后还包括:
根据待测算材料的若干历史测算价格,计算待测算材料的平均价格走势;
若预估价格不在平均价格走势的预设波动范围内,则重新选择不同的预设的测算模型,对待处理材料价格进行处理。
通过这一步可以对得到的预估价进行再一次的优化,最终得到一个最优的预估价格,其中,根据待测算材料的若干历史测算价格为过去一个时间段内,与待测算材料数据,标准名称相同、标准规格型号和标准单位相同的测算数据。
在本发明第一实施例的基础上,对应提供了第二实施例。
如图2所示:本发明第二实施例提供了一种材料价格测算装置包括:
包括数据获取模块201、数据匹配模块202、数据提取模块203、数据筛除模块204和数据测算模块205;
其中,数据获取模块201,用于获取待测算材料的待测算材料数据,并对待测算材数据进行处理,获得待测算材料数据的标准材料名称、标准规格型号和标准单位;
数据匹配模块202,用于根据待测算材料数据的标准材料名称、标准规格型号和标准单位与预存数据库中的材料数据进行匹配,并将每一匹配成功的材料数据作为已匹配材料数据;
数据提取模块203,用于提取所有已匹配材料数据,获得已匹配材料数据集;其中,每一已匹配材料数据包括材料名称、规格型号、单位和材料价格;
数据筛除模块204,用于通过箱线图规则剔除已匹配材料数据集中,材料价格异常的已匹配材料数据,获得若干待测算样本数据;
数据测算模块205,用于通过预设的测算模型,对所有待测算样本数据的材料价格进行处理,获得待测算材料的预估价格;其中,预设的测算模型包括正态分布模型、算术平均数模型、加权平均数模型或线性回归模型。
优选的,还包括预估价格走势确定及比对模块;
预估价格走势确定及比对模块,用于根据待测算材料的若干历史测算价格,计算待测算材料的平均价格走势;
计算预估价格当前价格走势,并与平均价格走势进行比对;
若当前价格走势不在平均价格走势的预设波动范围内,则重新选择不同的预设的测算模型,对待处理材料价格进行处理。
优选的,数据筛除模块204,用于通过箱线图规则剔除已匹配材料数据集中,材料价格异常的已匹配材料数据,获得若干待测算样本数据,具体为:将每一已匹配材料数据的材料价格,从小到大进行排序;
根据排序结果及已匹配材料数据的材料价格的总个数,获得下四分位数和上四分位数,并通过以下公式计算上限值和下限值;
IQR=Q3-Q1,
Q min=Q1-1.5*IQR,
Q max=Q3+1.5*IQR;
其中,Q3为上四分位数、Q1为下四分位数、IQR为四分位距、Q min为上限值、Q max为下限值;
若已匹配材料数据的材料价格小于下限值或大于上限值,则剔除,获得若干待测算样本数据。
优选的,数据测算模块205,用于通过预设的测算模型,对所有待测算样本数据的材料价格进行处理,获得待测算材料的预估价格,具体为:
若通过正态分布模型对所有待测算样本数据的材料价格进行处理,则执行以下步骤:
根据所有待测算样本数据的材料价格绘制正态分布图;
将概率密度超过第一预设阈值的待测算样本数据的材料价格,作为第一待处理材料价格;
计算所有第一待处理材料价格的平均值获得待测算材料的预估价格;
若通过算术平均数模型对所有待测算样本数据的材料价格进行处理,则执行以下步骤:
直接计算所有待测算样本数据的材料价格的算术平均值,并将算术平均值作为待测算材料的预估价格;
若通过加权平均数模型对所有待测算样本数据的材料价格进行处理,则执行以下步骤:
根据待测算样本数据的报价时间、地区、价格类型、品牌和供应商,为每一待测算样本数据设置预设的权重;
根据每一待测算样本数据预设的权重和材料价格,计算所有待测算样本数据的材料价格的加权平均数,并将加权平均数作为待测算材料的预估价格;
若通过线性回归模型,对所有待测算样本数据的材料价格进行处理,则执行以下步骤:
以待测算样本数据的报价时间为Y轴,以待测算样本数据的材料价格为X 轴建立直角坐标图;
根据直角坐标图,获得用于表示待测算样本数据报价时间与材料价格之间关系的线性回归方程;
根据线性回归方程,计算待测算材料的预估价格。
在本发明第一实施例的基础上提供了第三实施例:
在本发明第一实施例的基础上,提供了第三实施例;
本发明第三实施例提供了一种终端设备,包括处理器、存储器以及存储在存储器中且被配置为由处理器执行的计算机程序,处理器执行计算机程序是实现本发明第一实施例提供的材料价格测算方法。
在本发明第一实施例在本发明第一实施例的基础上,提供了第四实施例;
本发明第四实施例提供了一种计算机可读存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在的设备执行本发明第一实施例提供的材料价格测算方法。
通过实施本发明的实施例,有如下有益效果:
本发明实施例提供了一种材料价格测算方法、装置、终端设备及存储介质,通过获取待测算材料数据后,对待测算材料数据进行处理,然后与预存数据库中的材料数据进行匹配,获得已匹配材料数据,通过箱线图的规则剔除已匹配材料数据中材料价格异常的材料数据,从而提高测算样本数据的合理性,最后通过预设的测算模型,测算出待测算材料合理的预估价格,帮助缺乏经验的用户提高工程材料估计的合理性。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (9)
1.一种材料价格测算方法,其特征在于,包括:
获取待测算材料的待测算材料数据,并对所述待测算材料数据进行处理,获得所述待测算材料数据的标准材料名称、标准规格型号和标准单位;
根据所述待测算材料数据的标准材料名称、标准规格型号和标准单位与预存数据库中的材料数据进行匹配,并将每一匹配成功的材料数据作为已匹配材料数据;
提取所有所述已匹配材料数据,获得已匹配材料数据集;其中,每一所述已匹配材料数据包括材料名称、规格型号、单位和材料价格;
通过箱线图规则剔除所述已匹配材料数据集中,材料价格异常的已匹配材料数据,获得若干待测算样本数据;
通过预设的测算模型,对所有所述待测算样本数据的材料价格进行处理,获得所述待测算材料的预估价格;其中,所述预设的测算模型包括正态分布模型、算术平均数模型、加权平均数模型或线性回归模型。
2.如权利要求1所述的材料价格测算方法,其特征在于,在获得所述待测算材料的预估价格之后还包括:
根据所述待测算材料的若干历史测算价格,计算所述待测算材料的平均价格走势;
若所述预估价格不在所述平均价格走势的预设波动范围内,则重新选择不同的预设的测算模型,对所述待处理材料价格进行处理。
3.如权利要求1所述的材料价格测算方法,其特征在于,所述通过箱线图规则剔除所述已匹配材料数据集中,材料价格异常的已匹配材料数据,获得若干待测算样本数据,具体为:
将每一所述已匹配材料数据的材料价格,从小到大进行排序;
根据排序结果及所述已匹配材料数据的材料价格的总个数,获得下四分位数和上四分位数,并通过以下公式计算上限值和下限值;
IQR=Q3-Q1,
Q min=Q1-1.5*IQR,
Q max=Q3+1.5*IQR;
其中,Q3为上四分位数、Q1为下四分位数、IQR为四分位距、Q min为上限值、Q max为下限值;
若所述已匹配材料数据的材料价格小于所述下限值或大于所述上限值,则剔除,获得所述若干待测算样本数据。
4.如权利要求1所述的材料价格测算方法,其特征在于,每一所述已匹配材料数据还包括报价时间、地区、价格类型、品牌和供应商。
5.如权利要求4任意一项所述的材料价格测算方法,其特征在于,所述通过预设的测算模型,对所有所述待测算样本数据的材料价格进行处理,获得所述待测算材料的预估价格,具体为:
若通过所述正态分布模型对所有所述待测算样本数据的材料价格进行处理,则执行以下步骤:
根据所有所述待测算样本数据的材料价格绘制正态分布图;
将概率密度超过第一预设阈值的待测算样本数据的材料价格,作为第一待处理材料价格;
计算所有所述第一待处理材料价格的平均值获得所述待测算材料的预估价格;
若通过所述算术平均数模型对所有所述待测算样本数据的材料价格进行处理,则执行以下步骤:
直接计算所有所述待测算样本数据的材料价格的算术平均值,并将所述算术平均值作为所述待测算材料的预估价格;
若通过所述加权平均数模型对所有所述待测算样本数据的材料价格进行处理,则执行以下步骤:
根据所述待测算样本数据的报价时间、地区、价格类型、品牌和供应商,为每一所述待测算样本数据设置预设的权重;
根据每一所述待测算样本数据预设的权重和材料价格,计算所有所述待测算样本数据的材料价格的加权平均数,并将所述加权平均数作为所述待测算材料的预估价格;
若通过线性回归模型,对所有所述待测算样本数据的材料价格进行处理,则执行以下步骤:
以所述待测算样本数据的报价时间为Y轴,以所述待测算样本数据的材料价格为X轴建立直角坐标图;
根据所述直角坐标图,获得用于表示所述待测算样本数据报价时间与材料价格之间关系的线性回归方程;
根据所述线性回归方程,计算所述待测算材料的预估价格。
6.一种工程材料价格测算装置,其特征在于,包括数据获取模块、数据匹配模块、数据提取模块、数据筛除模块和数据测算模块;
其中,所述数据获取模块,用于获取待测算材料的待测算材料数据,并对所述待测算材料数据进行处理,获得所述待测算材料数据的标准材料名称、标准规格型号和标准单位;
所述数据匹配模块,用于根据所述待测算材料数据的标准材料名称、标准规格型号和标准单位与预存数据库中的材料数据进行匹配,并将每一匹配成功的材料数据作为已匹配材料数据;
所述数据提取模块,用于提取所有所述已匹配材料数据,获得已匹配材料数据集;其中,每一所述已匹配材料数据包括材料名称、规格型号、单位和材料价格;
所述数据筛除模块,用于通过箱线图规则剔除所述已匹配材料数据集中,材料价格异常的已匹配材料数据,获得若干待测算样本数据;
所述数据测算模块,用于通过预设的测算模型,对所有所述待测算样本数据的材料价格进行处理,获得所述待测算材料的预估价格;其中,所述预设的测算模型包括正态分布模型、算术平均数模型、加权平均数模型或线性回归模型。
7.如权利要求6所述的材料价格测算装置,其特征在于,还包括预估价格走势确定及比对模块;
所述预估价格走势确定及比对模块,用于根据所述待测算材料的若干历史测算价格,计算所述待测算材料的平均价格走势;
计算所述预估价格当前价格走势,并与所述平均价格走势进行比对;
若所述当前价格走势不在所述平均价格走势的预设波动范围内,则重新选择不同的预设的测算模型,对所述待处理材料价格进行处理。
8.一种终端设置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序是实现如权利要求1-5任意一项所述的材料价格测算方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在的设备执行如权利要求1-5中任意一项所述的材料价格测算方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811595069.8A CN109658156A (zh) | 2018-12-25 | 2018-12-25 | 一种材料价格测算方法、装置、终端设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811595069.8A CN109658156A (zh) | 2018-12-25 | 2018-12-25 | 一种材料价格测算方法、装置、终端设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109658156A true CN109658156A (zh) | 2019-04-19 |
Family
ID=66116301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811595069.8A Pending CN109658156A (zh) | 2018-12-25 | 2018-12-25 | 一种材料价格测算方法、装置、终端设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109658156A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737317A (zh) * | 2020-06-23 | 2020-10-02 | 广联达科技股份有限公司 | 一种测算方法及装置 |
CN113065881A (zh) * | 2020-01-02 | 2021-07-02 | 珠海格力电器股份有限公司 | 计算物料价格的方法、装置、计算机设备及存储介质 |
US20230206293A1 (en) * | 2021-12-27 | 2023-06-29 | Paypal, Inc. | Currency detection on merchant websites |
CN117010925B (zh) * | 2023-06-21 | 2024-03-22 | 广东中洲国信建设管理咨询有限公司 | 一种工程材料自动配价方法、系统、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779187A (zh) * | 2016-11-30 | 2017-05-31 | 广东电网有限责任公司电网规划研究中心 | 电网工程设备材料的价格参数生成方法及装置 |
US20170308934A1 (en) * | 2016-04-22 | 2017-10-26 | Economy Research Institute of State Grid Zhejiang Electric Power | Management method of power engineering cost |
CN107423264A (zh) * | 2017-07-10 | 2017-12-01 | 广东华联建设投资管理股份有限公司 | 一种工程材料专业特征提取方法 |
CN107480126A (zh) * | 2017-07-10 | 2017-12-15 | 广东华联建设投资管理股份有限公司 | 一种工程材料类别智能识别方法 |
CN107944905A (zh) * | 2017-11-10 | 2018-04-20 | 中交第二公路工程局有限公司 | 一种施工企业材料采购价格分析的方法与系统 |
-
2018
- 2018-12-25 CN CN201811595069.8A patent/CN109658156A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170308934A1 (en) * | 2016-04-22 | 2017-10-26 | Economy Research Institute of State Grid Zhejiang Electric Power | Management method of power engineering cost |
CN106779187A (zh) * | 2016-11-30 | 2017-05-31 | 广东电网有限责任公司电网规划研究中心 | 电网工程设备材料的价格参数生成方法及装置 |
CN107423264A (zh) * | 2017-07-10 | 2017-12-01 | 广东华联建设投资管理股份有限公司 | 一种工程材料专业特征提取方法 |
CN107480126A (zh) * | 2017-07-10 | 2017-12-15 | 广东华联建设投资管理股份有限公司 | 一种工程材料类别智能识别方法 |
CN107944905A (zh) * | 2017-11-10 | 2018-04-20 | 中交第二公路工程局有限公司 | 一种施工企业材料采购价格分析的方法与系统 |
Non-Patent Citations (4)
Title |
---|
张峥: "材料价格最低控制线的计算理论和方法" * |
张峥: "材料价格最低控制线的计算理论和方法", 《建筑》 * |
林东敏;杨晶;: "基于切比雪夫不等式的电网工程造价合理区间的计算方法研究" * |
林东敏等: "基于切比雪夫不等式的电网工程造价合理区间的计算方法研究", 《现代电子技术》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113065881A (zh) * | 2020-01-02 | 2021-07-02 | 珠海格力电器股份有限公司 | 计算物料价格的方法、装置、计算机设备及存储介质 |
CN111737317A (zh) * | 2020-06-23 | 2020-10-02 | 广联达科技股份有限公司 | 一种测算方法及装置 |
US20230206293A1 (en) * | 2021-12-27 | 2023-06-29 | Paypal, Inc. | Currency detection on merchant websites |
US11907979B2 (en) * | 2021-12-27 | 2024-02-20 | Paypal, Inc. | Currency detection on merchant websites |
CN117010925B (zh) * | 2023-06-21 | 2024-03-22 | 广东中洲国信建设管理咨询有限公司 | 一种工程材料自动配价方法、系统、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109658156A (zh) | 一种材料价格测算方法、装置、终端设备及存储介质 | |
CN105138653B (zh) | 一种基于典型度和难度的题目推荐方法及其推荐装置 | |
CN108363821A (zh) | 一种信息推送方法、装置、终端设备及存储介质 | |
CN106844407B (zh) | 基于数据集相关性的标签网络产生方法和系统 | |
Xian et al. | A new trapezoidal Pythagorean fuzzy linguistic entropic combined ordered weighted averaging operator and its application for enterprise location | |
CN110765268B (zh) | 一种基于客户诉求的配网精准投资策略方法 | |
CN107798435A (zh) | 一种基于文本信息抽取的电力物资需求预测方法 | |
CN109389321B (zh) | 一种项目清单的分类方法及装置 | |
CN106095939B (zh) | 账户权限的获取方法和装置 | |
CN109685576A (zh) | 一种工程材料自动配价方法、装置、终端设备及存储介质 | |
CN108345908A (zh) | 电网数据的分类方法、分类设备及存储介质 | |
CN109558993A (zh) | 犯罪理论刑期的预测方法、装置、存储介质及服务器 | |
CN113298318A (zh) | 一种新型的配电变压器重过载预测方法 | |
CN110991510B (zh) | 不平衡分类学习的泛化低压异常箱表关系识别方法及系统 | |
CN105786810B (zh) | 类目映射关系的建立方法与装置 | |
CN111027841A (zh) | 一种基于梯度提升决策树的低压台区线损计算方法 | |
CN105302844B (zh) | 互联网监测方法、装置及系统 | |
CN109190997A (zh) | 中文地址层级化解析与规范处理方法和系统 | |
CN109711719A (zh) | 一种工程材料数据监控方法、装置、终端设备及存储介质 | |
CN115454466A (zh) | 机器学习模型自动更新的方法、装置、设备和介质 | |
CN113688870B (zh) | 一种采用混合算法的基于用户用电行为的群租房识别方法 | |
CN112765314B (zh) | 一种基于电力本体知识库的电力信息检索方法 | |
CN114692978A (zh) | 一种基于大数据的社交媒体用户行为预测方法及系统 | |
CN113191409A (zh) | 标签数据扩充与深度学习的居民异常用电行为检测方法 | |
CN111651512A (zh) | 基于半监督学习的多源异构商品特征权重求解方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190419 |
|
RJ01 | Rejection of invention patent application after publication |