CN117391626A - 一种基于大数据的工程造价数据处理方法 - Google Patents
一种基于大数据的工程造价数据处理方法 Download PDFInfo
- Publication number
- CN117391626A CN117391626A CN202311356816.3A CN202311356816A CN117391626A CN 117391626 A CN117391626 A CN 117391626A CN 202311356816 A CN202311356816 A CN 202311356816A CN 117391626 A CN117391626 A CN 117391626A
- Authority
- CN
- China
- Prior art keywords
- data
- engineering cost
- feature
- processing method
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 134
- 238000011156 evaluation Methods 0.000 claims abstract description 246
- 238000000605 extraction Methods 0.000 claims description 76
- 238000012549 training Methods 0.000 claims description 42
- 238000000034 method Methods 0.000 claims description 34
- 238000010276 construction Methods 0.000 claims description 33
- 238000009826 distribution Methods 0.000 claims description 32
- 238000007781 pre-processing Methods 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 25
- 238000004364 calculation method Methods 0.000 claims description 20
- 238000010801 machine learning Methods 0.000 claims description 19
- 238000012937 correction Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 230000006978 adaptation Effects 0.000 claims description 12
- 238000002360 preparation method Methods 0.000 claims description 9
- 238000004140 cleaning Methods 0.000 claims description 7
- 230000000007 visual effect Effects 0.000 claims description 5
- 238000013480 data collection Methods 0.000 claims description 4
- 238000000611 regression analysis Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 12
- 238000004458 analytical method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 238000007405 data analysis Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000013079 data visualisation Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000012407 engineering method Methods 0.000 description 2
- 238000013439 planning Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 230000002087 whitening effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于大数据的工程造价数据处理方法。该基于大数据的工程造价数据处理方法,包括以下步骤:获取工程造价历史数据;确定预定义工程造价数据处理方法,评估预定义工程造价数据处理方法各步骤的决策支持性,得到工程造价数据处理方法综合评估数据;构建工程造价数据综合评估系数模型;判断工程造价数据处理方法是否出现问题并调整,确定工程造价数据处理方法。本发明通过构建工程造价数据综合评估系数模型评估判断工程造价数据处理方法是否出现问题并调整,确定工程造价数据处理方法,达到了提高工程造价数据处理方法的决策支持性的效果,解决了现有技术中存在不能有效的评估并提高工程造价数据处理方法决策支持性的问题。
Description
技术领域
本发明涉及电网工程技术领域,尤其涉及一种基于大数据的工程造价数据处理方法。
背景技术
随着大数据技术领域的快速发展为工程造价数据处理带来了新的机会。源于工程建设对成本控制、项目管理和效率提升的需求日益旺盛,传统的造价数据处理方法通常受限于数据规模、速度和多样性,大数据技术的兴起为解决这些问题提供了新的机会。
现有的基于大数据的工程造价数据处理方法通过以下方法实现,包括:数据存储:采集的数据通常非常庞大,需要存储在分布式数据库系统中;数据清洗和预处理:大数据通常包含不一致或不完整的数据,因此需要进行数据清洗和预处理;数据分析:大数据分析工具,可用于处理和分析大量的工程造价数据;实时数据处理:某些工程项目需要实时数据处理,以便迅速做出决策;数据可视化:数据可视化工具,可以帮助理解工程造价数据;预测和优化:大数据分析可用于预测工程项目的成本、进度和资源需求;安全和隐私:处理大数据时,安全和隐私是至关重要的;云计算:云计算平台提供了大规模的计算和存储资源。
例如公开号为:CN115496405A的发明专利公开的一种基于三维数字化的电网变电工程智能算量模式研究方法,包括:基于国网GIM标准的三维设计的造价智能数据共享研究;基于大数据聚类分析技术的造价自动编制研究;设计与造价的快速转化分析研究;基于区域性的设计和造价模式,研究符合实际设计造价一体化的数据配置;基于三维设计技术和智能造价,实现自动校验功能。
例如公开号为:CN114240070A的发明专利公开了一种配电网工程造价智能化评估系统,包括:云端服务器、工程数据采集模块、环境信息监测模块、自动化造价评估模块、工程造价确定模块以及工程造价报表生成模块,其中,云端服务器分别与工程数据采集模块、环境信息监测模块以及自动化造价评估模块相连;配电网工程造价智能化评估系统,能够智能化的测算出配电网工程造价指标,手动上传配电网工程的二维图像或三维图像模型。
但本申请在实现本申请实施例中发明技术方法的过程中,发现上述技术至少存在如下技术问题:
现有技术中,缺乏综合性的工程造价数据处理决策评估,存在不能有效的评估并提高工程造价数据处理方法决策支持性的问题。
发明内容
本申请实施例通过提供一种基于大数据的工程造价数据处理方法,解决了现有技术中,存在不能有效的评估并提高工程造价数据处理方法决策支持性的问题,实现了提高工程造价数据处理方法的决策支持性。
本申请实施例提供了一种基于大数据的工程造价数据处理方法,包括以下步骤:获取工程造价历史数据,所述获取工程造价历史数据包括工程造价数据处理方法历史问题数据;确定预定义工程造价数据处理方法,评估预定义工程造价数据处理方法各步骤的决策支持性,得到工程造价数据处理方法综合评估数据;根据工程造价数据处理方法综合评估数据,构建工程造价数据综合评估系数模型;获取工程造价数据综合评估系数模型计算得到的工程造价数据综合评估系数,并将工程造价数据综合评估系数与预定义工程造价数据综合评估系数阈值对比,判断预定义工程造价数据处理方法是否出现问题并调整,确定工程造价数据处理方法。
进一步的,所述确定工程造价数据处理方法的具体方法为:将工程造价数据综合评估系数与预定义工程造价数据综合评估系数阈值对比,若工程造价数据综合评估系数在预定义误差允许范围外,则判断预定义工程造价数据处理方法出现问题;当预定义工程造价数据处理方法出现问题时,根据工程造价数据处理方法历史问题数据,生成处理方法训练集,将预定义工程造价数据处理方法数据与训练集中的数据进行对比,若数据相同,则判断为历史问题,否则,为新问题,并将新问题进行保存;对新问题数据进行数据训练,根据数据训练结果对预定义工程造价数据处理方法调整并确定工程造价数据处理方法。
进一步的,所述确定预定义工程造价数据处理方法的具体步骤为:数据预处理:收集各类与工程造价相关的原始数据,清理和处理原始数据,得到工程造价原始数据组;数据特征提取:对有效工程造价数据组特征提取并做数据特征工程评估调节,得到特征提取数据组;数据特征分类:根据机器学习算法通过预定义特征决策支持性对有效特征工程数据组数据分类,得到若干特征子集数据组;数据特征子集:根据机器学习算法预定义子集决策支持性对特征子集数据组调节,得到决策支持特征子集数据组;数据文档注释:获取若干特征子集关联数据组的数据关联决策文档,对数据关联决策文档决策支持性调节,得到决策文档数据组;工程造价预测:根据有效决策文档数据组通过回归分析和机器学习工程预测工程造价结果;结果展示与报告生成:根据工程造价结果生成工程造价报告可视化展示。
进一步的,所述构建工程造价数据综合评估系数模型的具体计算公式为:式中,ω表示工程造价数据综合评估系数;θ表示数据文档注释评估系数,/>表示数据特征子集评估系数,φ表示数据特征分类评估系数,μ表示数据特征提取评估系数,α表示数据预处理评估系数,t、u、v和w分别表示数据预处理评估系数、数据特征子集评估系数、数据特征提取评估系数和数据特征分类评估系数对应的工程造价数据处理方法的决策支持性权重因子,e表示自然常数。
进一步的,所述数据预处理评估系数的具体计算公式为:式中,a0表示工程造价原始数据组数据类别,a0=1,2,...,a,a表示工程造价原始数据组数据类别总数,c0表示工程造价原始数据组第a0类数据的编号,c0=1,2,...,c,c表示工程造价原始数据组第a0类数据的编号总数,/>表示工程造价原始数据组中第a0类第c0个工程造价原始数据组数据,/>表示工程造价原始数据组中第a0类第c0个工程造价原始数据组数据噪音阈值标准值,β表示工程造价原始数据组数据噪音值读取误差因子,/>表示工程造价原始数据组中第a0类第c0个工程造价原始数据组数据噪音差值标准值,b表示工程造价原始数据组中第a0类第c0个工程造价原始数据组数据噪音修正标准值
进一步的,所述数据特征提取评估系数的具体计算公式为:式中,d0表示特征提取数据组数据类别,d0=1,2,...,d,d表示特征提取数据组数据类别总数,f0表示特征提取数据组第d0类数据的编号,f0=1,2,...,f,f为特征提取数据组第d0类数据的编号总数,/>表示特征提取数据组中第d0类第f0个特征提取数据组数据特征系数,/>表示特征提取数据组中第d0类第f0个特征提取数据组数据预定义特征系数,ε表示预定义特征提取数据组数据对应的数据类别误差因子,δ表示预定义特征提取数据组信息密度变化误差修正因子,/>表示特征提取数据组中第d0类第f0个特征提取数据组数据特征系数提取误差标准值,χ表示预定义特征系数影响匹配系数。
进一步的,所述数据特征分类评估系数的具体计算公式为:式中,C表示数据特征分类准确率评估值、D表示数据特征分类精准率评估值、E表示数据特征相关性评估系数,F表示工程造价影响修正评估值,γ表示数据特征分类准确率评估值和数据特征分类精准率评估值匹配调和因子,g和h分别表示数据特征分类准确率评估值和数据特征分类精准率评估值对应的特征决策支持性权重因子,D预表示预定义数据特征分类精准率评估标准值,E预表示数据特征相关性评估系数标准值,/>表示数据特征相关性评估系数匹配调和因子,/>表示预定义数据特征分类召回率匹配调和因子,η表示表示数据特征分类准确率评估值、数据特征分类精准率评估值和数据特征相关性评估系数相互叠加负向影响系数,λ表示预定义数据特征分类线性相关修正系数。
进一步的,所述数据特征子集评估系数的具体计算公式为:式中,G表示特征分配权重影响匹配评估值,H表示数据标签适配评估值,I表示工程领域特征匹配评估值,J表示特征分布互信息系数,K表示预定义特征距离相关修正系数,m和o分别表示特征分配权重影响匹配评估值和数据标签适配评估值对应的影响匹配因子,i和j分别表示特征分配权重影响匹配评估值和数据标签适配评估值对应的特征权重因子,H预表示数据标签适配评估标准值,n表示工程领域特征匹配评估值对特征分配权重影响匹配评估值和数据标签适配评估值的影响叠加因子,k表示特征分布互信息系数对特征子集评估系数的影响叠加因子。
进一步的,所述数据文档注释评估系数的具体计算公式为:式中,M表示文档特征覆盖度评估值,N表示文档信息量评估值,P表示文档客观性匹配影响系数,p与q分别表示文档特征覆盖度评估值和文档信息量评估值的决策权重因子,r表示文档特征覆盖度评估值和文档信息量评估值对文档客观性匹配影响系数的影响匹配因子,θ表示文档特征覆盖度评估值、文档信息量评估值和文档客观性匹配影响系数的叠加负向影响因子,S表示特征子集关联修正影响匹配因子,σ表示数据文档注释评估系数的决策支持性影响匹配因子。
进一步的,所述对新问题数据进行数据训练,根据数据训练结果对预定义工程造价数据处理方法调整并确定工程造价数据处理方法还包括:数据收集:将新问题加入处理方法训练集,将处理方法训练集按照预定义工程造价数据处理方法的数据预处理、数据特征提取、数据特征分类、数据特征子集、数据文档注释的具体步骤依次进行数据处理分别得到新的工程造价原始数据组、新的特征提取数据组、新的若干特征子集数据组和新的决策支持特征子集数据组;数据训练:根据收集到的各数据组选择对应的机器学习算法结合数据文档注释评估系数、数据特征子集评估系数、数据特征分类评估系数、数据特征提取评估系数和数据预处理评估系数进行数据训练;调整并确定预定义方法:根据数据训练结果,对预定义的工程造价数据处理方法进行调整并确定。
本申请实施例中提供的一个或多个技术方法,至少具有如下技术效果或优点:
1、通过构建工程造价数据综合评估系数模型将数据预处理评估、数据特征提取评估、数据特征分类评估、数据特征子集评估和数据文档注释评估得到的数据预处理评估系数、数据特征提取评估系数、数据特征分类评估系数、数据特征子集评估系数和数据文档注释评估系数综合计算得到工程造价数据综合评估系数,从而根据工程造价数据综合评估系数判断预定义工程造价数据处理方法是否出现问题并调整,确定工程造价数据处理方法,有效提高了提高工程造价数据处理方法的决策支持性,解决了现有技术中存在不能有效的评估并提高工程造价数据处理方法决策支持性的问题。
2、通过构建工程造价数据综合评估系数模型综合各评估系数,包括数据预处理评估系数、数据特征提取评估系数、数据特征分类评估系数、数据特征子集评估系数和数据文档注释评估系数计算得到工程造价数据综合评估系数并与预定义工程造价数据综合评估系数阈值对比判断预定义工程造价数据处理方法是否出现问题并调整,从而提高了工程造价数据处理方法得出决策结果的客观性,进而实现了提高确定工程造价数据处理方法的有效性。
3、通过将工程造价数据综合评估系数与预定义工程造价数据综合评估系数阈值对比,判断预定义工程造价数据处理方法是否出现新问题,对新问题数据进行数据训练,根据数据训练结果对预定义工程造价数据处理方法调整并确定工程造价数据处理方法,从而提高新问题数据在实际处理下的反馈性,进而实现了提高工程造价数据处理方法的鲁棒性。
附图说明
图1为本申请实施例提供的基于大数据的工程造价数据处理方法流程图;
图2为本申请实施例提供的预定义工程造价数据处理方法步骤结构示意图;
图3为本申请实施例提供的构建工程造价数据综合评估系数模型结构示意图。
具体实施方式
本申请实施例通过提供一种基于大数据的工程造价数据处理方法,解决了现有技术中,存在不能有效的评估并提高工程造价数据处理方法决策支持性的问题,通过构建工程造价数据综合评估系数模型评估判断工程造价数据处理方法是否出现问题并调整,确定工程造价数据处理方法,提高了工程造价数据处理方法的决策支持性。
本申请实施例中的技术方法为解决上述,存在不能有效的评估并提高工程造价数据处理方法决策支持性的问题,总体思路如下:
通过将构建工程造价数据综合评估系数模型评估得到工程造价数据综合评估系数;数据文档注释评估系数,数据特征子集评估系数,数据特征分类评估系数,数据特征提取评估系数,数据预处理评估系数,并据此判断工程造价数据处理方法是否出现问题并调整,确定工程造价数据处理方法,达到了提高工程造价数据处理方法的决策支持性的效果。
为了更好的理解上述技术方法,下面将结合说明书附图以及具体的实施方式对上述技术方法进行详细的说明。
如图1所示,为本申请实施例提供的基于大数据的工程造价数据处理方法流程图,该方法用于服务器,包括以下步骤:获取工程造价历史数据,获取工程造价历史数据包括工程造价数据处理方法历史问题数据;确定预定义工程造价数据处理方法,评估预定义工程造价数据处理方法各步骤的决策支持性,得到工程造价数据处理方法综合评估数据;根据工程造价数据处理方法综合评估数据,构建工程造价数据综合评估系数模型;获取工程造价数据综合评估系数模型计算得到的工程造价数据综合评估系数,并将工程造价数据综合评估系数与预定义工程造价数据综合评估系数阈值对比,判断预定义工程造价数据处理方法是否出现问题并调整,确定工程造价数据处理方法。
进一步的,确定工程造价数据处理方法的具体方法为:将工程造价数据综合评估系数与预定义工程造价数据综合评估系数阈值对比,若工程造价数据综合评估系数在预定义误差允许范围外,则判断预定义工程造价数据处理方法出现问题;当预定义工程造价数据处理方法出现问题时,根据工程造价数据处理方法历史问题数据,生成处理方法训练集,将预定义工程造价数据处理方法数据与训练集中的数据进行对比,若数据相同,则判断为历史问题,否则,为新问题,并将新问题进行保存;对新问题数据进行数据训练,根据数据训练结果对预定义工程造价数据处理方法调整并确定工程造价数据处理方法。
在本实施例中,及时识别问题:通过评估系数的对比,能够快速、及时地识别可能存在问题的数据处理方法,以便及时采取纠正措施。历史问题分析:通过对历史问题数据的分析,可以了解过去存在的问题模式,有助于避免类似问题的再次发生,提高数据处理方法的质量。自动化问题分类:将新问题自动分类并保存,为问题分析和改进提供便利,也可用于未来类似问题的自动识别。数据驱动的调整:通过对新问题数据的训练,可以获得数据驱动的调整建议,进而优化工程造价数据处理方法,提高其适应性和准确性。持续改进:通过持续分析新问题和改进数据处理方法,实现对工程造价数据处理方法的持续改进,逐步提高其效率和质量。
进一步的,确定预定义工程造价数据处理方法的具体步骤为:数据预处理:收集各类与工程造价相关的原始数据,清理和处理原始数据,得到工程造价原始数据组;数据特征提取:对有效工程造价数据组特征提取并做数据特征工程评估调节,得到特征提取数据组;数据特征分类:根据机器学习算法通过预定义特征决策支持性对有效特征工程数据组数据分类,得到若干特征子集数据组;数据特征子集:根据机器学习算法预定义子集决策支持性对特征子集数据组调节,得到决策支持特征子集数据组;数据文档注释:获取若干特征子集关联数据组的数据关联决策文档,对数据关联决策文档决策支持性调节,得到决策文档数据组;工程造价预测:根据有效决策文档数据组通过回归分析和机器学习工程预测工程造价结果;结果展示与报告生成:根据工程造价结果生成工程造价报告可视化展示,利用图表、报表等形式呈现工程造价相关的信息提供决策参考。
在本实施例中,如图2所示,为本申请实施例提供的预定义工程造价数据处理方法步骤结构示意图,原始数据被清理、转换和准备,以去除错误和不一致性。通过清理和处理,可以提高数据的质量和准确性。减少错误:预处理有助于减少后续分析中的错误。确保数据的一致性,以便后续的分析和建模。数据特征提取:从原始数据中提取重要的特征。只保留与问题相关的特征,减少数据维度。提取关键特征可以提高模型的性能。降低了数据处理和分析的计算成本。数据特征分类:使用机器学习算法对特征进行分类,以确定哪些特征对问题最有帮助。确定关键特征有助于构建更准确的模型。减少不相关特征对模型的干扰。分类有助于理解哪些特征在工程造价中更重要。数据特征子集:调节特征子集以进一步提高模型性能,最优特征选择:确保最终的特征集合是最相关的。模型简化:减少不必要的复杂性,提高模型的可解释性。数据文档注释:为特征子集创建数据关联决策文档,有助于了解模型选择和决策过程。提供有关模型和特征选择的决策支持信息。文档记录了选择和调整的决策,方便审计和复查。工程造价预测:通过机器学习和回归分析,利用经过特征选择和预处理的数据来进行工程造价预测。有效决策支持:提供了基于数据的预测,帮助制定决策。结果展示与报告生成:将工程造价结果可视化展示,以便决策者更好地理解和利用。可视化报告使决策者更容易理解和利用预测结果。
进一步的,构建工程造价数据综合评估系数模型公式如下:式中,ω表示工程造价数据综合评估系数;θ表示数据文档注释评估系数,/>表示数据特征子集评估系数,φ表示数据特征分类评估系数,μ表示数据特征提取评估系数,α表示数据预处理评估系数,t、u、v和w分别表示数据预处理评估系数、数据特征子集评估系数、数据特征提取评估系数和数据特征分类评估系数对应的工程造价数据处理方法的决策支持性权重因子。
在本实施例中,如图3所示,为本申请实施例提供的构建工程造价数据综合评估系数模型结构示意图,构建工程造价数据综合评估系数模型有许多好处,包括:成本控制和预测:这种模型可以帮助工程师和项目管理人员更好地掌握工程造价,更准确地预测项目的总成本。这有助于避免预算超支和确保项目的财务可行性。决策支持:通过分析和评估不同的造价数据,模型可以提供有关不同设计、施工和材料选择的建议,以实现成本效益最大化。这有助于项目相关方做出明智的决策。透明度:综合评估系数模型可以提高造价数据的透明度,使项目相关方更容易理解项目成本的各个组成部分。这有助于建立信任和降低潜在的争议。项目风险管理:通过识别和分析造价数据的潜在风险因素,模型可以帮助项目团队更好地管理项目风险。这可以减少不必要的成本增加和项目延期。数据驱动决策:模型可以基于实际数据和趋势进行评估,而不仅仅依赖于主观判断。这有助于提高决策的准确性和一致性。效率提升:综合评估系数模型可以加速成本估算和分析过程,减少了人工处理数据的时间和努力。这有助于提高工程项目的效率。
进一步的,数据预处理评估系数的具体计算公式为:式中,a0表示工程造价原始数据组数据类别,a0=1,2,...,a,a表示工程造价原始数据组数据类别总数,c0表示工程造价原始数据组第a0类数据的编号,c0=1,2,...,c,c表示工程造价原始数据组第a0类数据的编号总数,/>表示工程造价原始数据组中第a0类第c0个工程造价原始数据组数据,/>表示工程造价原始数据组中第a0类第c0个工程造价原始数据组数据噪音阈值标准值,β表示工程造价原始数据组数据噪音值读取误差因子,/>表示工程造价原始数据组中第a0类第c0个工程造价原始数据组数据噪音差值标准值,b表示工程造价原始数据组中第a0类第c0个工程造价原始数据组数据噪音修正标准值。
在本实施例中,数据收集:收集各种工程造价数据,包括工程项目的成本、时间、规模、地理位置、材料成本、人工成本等。这些数据可以来自各种来源,包括数据库、文件、传感器等;数据清洗:清洗数据以处理缺失值、异常值和重复数据;数据预处理:数据分类是按照机器学习算法预定义的数据分类类别分类的,此时,数据分类并未和数据决策支持性直接联系,对大数据的工程造价数据去白噪音具有以下重要意义:提高数据质量:白噪音是一种随机误差,它会干扰数据的质量。通过去除这种噪音,可以提高数据的准确性和可信度,确保分析和决策基于真实信息。改善数据可分析性:白噪音可以掩盖数据中的真实模式和趋势,使数据更难以分析。去噪可以使数据更易于理解和分析,从而更好地洞察数据的内在特征。提高模型性能:在建立预测模型时,白噪音可能会干扰模型的性能。去除白噪音可以减少模型的复杂性,并提高模型的预测准确性。减少存储和计算成本:白噪音会增加数据的存储和处理成本。通过去除噪音,可以降低数据处理的复杂性,减少存储需求,提高计算效率。更好的数据可视化:白噪音会干扰数据可视化的效果,使图表更难以解释。去除噪音可以生成更清晰的可视化图表,帮助用户更好地理解数据。支持决策制定:在工程造价管理中,精确的数据非常关键,因为它们直接影响项目成本和时间的决策。去白噪音可以提供更可信的数据,有助于更明智的决策。更好的预测和规划:在工程项目中,准确的成本估算和预测对于项目的成功至关重要。去除白噪音可以提高对未来成本和进展的准确预测,有助于更好地规划和管理项目。
进一步的,数据特征提取评估系数的具体计算公式为:式中,d0表示特征提取数据组数据类别,d0=1,2,...,d,d表示特征提取数据组数据类别总数,f0表示特征提取数据组第d0类数据的编号,f0=1,2,...,f,f为特征提取数据组第d0类数据的编号总数,/>表示特征提取数据组中第d0类第f0个特征提取数据组数据特征系数,/>表示特征提取数据组中第d0类第f0个特征提取数据组数据预定义特征系数,ε表示预定义特征提取数据组数据对应的数据类别误差因子,δ表示预定义特征提取数据组信息密度变化误差修正因子,/>表示特征提取数据组中第d0类第f0个特征提取数据组数据特征系数提取误差标准值,χ表示预定义特征系数影响匹配系数。
在本实施例中,预定义特征提取算法特征提取是从原始数据中提取有用信息和特征的过程,以便用于机器学习和数据分析。以下是一些常见的特征提取算法和方法:主成分分析:PCA是一种无监督学习方法,通过线性变换将原始特征投影到新的坐标系中,以获得具有最大方差的新特征。这有助于降低维度和去除冗余信息。线性判别分析:与PCA类似,LDA也是一种线性变换方法,但它是有监督学习方法,旨在最大化不同类别之间的距离和最小化同一类别内的距离,以提高分类性能。基于文本的特征提取方法:对于文本数据,特征提取方法包括词袋模型等;特征选择:特征选择方法用于选择最相关的特征,而丢弃不相关或冗余的特征。常见的特征选择方法包括互信息、卡方检验、方差阈值等。在基于大数据的工程造价数据处理中,进行特征提取和特征工程是非常关键的步骤,以便从原始数据中提取有意义的特征,以支持建模和分析。以下是特征工程的具体实现步骤:特征提取:特征提取是从原始数据中提取有用的信息。这可以包括从原始数据中选择、转换或创建新的特征。例如,从日期中提取年份、月份、季度等信息,或者从地理坐标中提取距离或区域信息。特征选择:特征选择是指从所有可用特征中选择最相关的特征,以降低维度和减少噪音。这可以使用统计方法、机器学习方法或领域专业知识来实现。目标是保留对任务有意义的特征,同时去除冗余或无关的特征。预定义特征变换:特征变换是通过数学变换改变特征的分布或尺度,以满足模型的假设或改善建模性能。例如,可以对特征进行标准化、归一化、对数变换等。特征工程评估:在进行特征工程之后,需要评估特征工程的效果。这可以包括使用交叉验证、模型性能指标等方法来评估特征对模型的影响。如果特征工程导致模型性能提升,那么可以继续优化特征工程方法。特征工程调节:根据评估结果,可以进一步调节特征工程方法。这可能涉及修改特征提取、选择或变换的方法,以获得更好的性能。特征工程是一个反复迭代的过程,其目标是不断改进模型的性能。最终的目标是从原始数据中提取出最具信息价值的特征,以便构建更准确的工程造价模型或进行深入的数据分析。同时,领域专业知识和理解业务需求也对特征工程的成功至关重要。
进一步的,数据特征分类评估系数的具体计算公式为:式中,C表示数据特征分类准确率评估值、D表示数据特征分类精准率评估值、E表示数据特征相关性评估系数,F表示工程造价影响修正评估值,γ表示数据特征分类准确率评估值和数据特征分类精准率评估值匹配调和因子,g和h分别表示数据特征分类准确率评估值和数据特征分类精准率评估值对应的特征决策支持性权重因子,D预表示预定义数据特征分类精准率评估标准值,E预表示数据特征相关性评估系数标准值,/>表示数据特征相关性评估系数匹配调和因子,/>表示预定义数据特征分类召回率匹配调和因子,η表示表示数据特征分类准确率评估值、数据特征分类精准率评估值和数据特征相关性评估系数相互叠加负向影响系数,λ表示预定义数据特征分类线性相关修正系数。
在本实施例中,对每个特征子集数据组,创建一个特征列表,其中包含被选中的特征。特征子集的创建:使用从特征工程步骤中获得的特征列表,对工程造价数据进行子集选择。可以采用不同的方法,如递归特征消除、前向选择、后向选择、基于特征重要性的选择等。对于每个特征子集,生成一个包含选中特征的新数据集。模型训练与评估:对每个特征子集数据组,使用机器学习算法训练模型。使用交叉验证等技术来评估模型性能,以确保所选的特征子集能够产生良好的模型性能。比较性能:比较不同特征子集数据组的模型性能。通常使用指标如均方误差、均方根误差、R方值等来评估模型的性能。可以绘制性能指标的图表,以直观比较不同特征子集的效果。选择最佳特征子集:根据性能评估结果选择最佳特征子集。通常选择具有最佳性能的子集作为最终的特征集合。模型部署与监测:部署使用最佳特征子集的模型到实际应用中。持续监测模型性能,并在需要时进行模型维护和更新。
进一步的,数据特征子集评估系数的具体计算公式为:式中,G表示特征分配权重影响匹配评估值,H表示数据标签适配评估值,I表示工程领域特征匹配评估值,J表示特征分布互信息系数,K表示预定义特征距离相关修正系数,m和o分别表示特征分配权重影响匹配评估值和数据标签适配评估值对应的影响匹配因子,i和j分别表示特征分配权重影响匹配评估值和数据标签适配评估值对应的特征权重因子,H预表示数据标签适配评估标准值,n表示工程领域特征匹配评估值对特征分配权重影响匹配评估值和数据标签适配评估值的影响叠加因子,k表示特征分布互信息系数对特征子集评估系数的影响叠加因子。
在本实施例中,在机器学习和特征选择中,预定义子集的决策支持性是一种方法,它允许根据特定的预设标准或算法来选择特征子集,以提高决策支持系统的性能。在评估决策支持特征子集数据组时,以下因素可能会影响决策支持的效果:特征权重:如果特征选择算法为特征分配权重,这些权重的选择和调节可能会影响最终的特征子集。调整特征的权重可以根据其对决策支持的重要性进行自定义。数据标签的质量:决策支持系统通常需要有标签的数据来进行训练和评估。如果标签数据不准确或不完整,特征选择的效果会受到影响。特征子集的大小:特征子集的大小对性能有影响。选择太少的特征可能导致信息损失,而选择太多的特征可能导致维度灾难,领域知识:针对特定领域的领域知识可以指导特征选择。有时,专家知识可以用来调整和预定义特征子集以符合领域需求。过拟合和欠拟合:过度精细调节特征子集可能导致过拟合,而特征子集太粗略可能导致欠拟合。需要平衡以避免这两种情况。数据分布:数据的分布特点,如正态分布、偏态分布等,可能影响特征选择算法的效果。不同的分布可能需要不同的特征选择策略。
进一步的,数据文档注释评估系数的具体计算公式为:式中,M表示文档特征覆盖度评估值,N表示文档信息量评估值,P表示文档客观性匹配影响系数,p与q分别表示文档特征覆盖度评估值和文档信息量评估值的决策权重因子,r表示文档特征覆盖度评估值和文档信息量评估值对文档客观性匹配影响系数的影响匹配因子,/>表示文档特征覆盖度评估值、文档信息量评估值和文档客观性匹配影响系数的叠加负向影响因子,S表示特征子集关联修正影响匹配因子,σ表示数据文档注释评估系数的决策支持性影响匹配因子。
在本实施例中,获取若干特征子集关联数据组的数据关联决策文档,对数据关联决策文档决策支持性调节,得到有效决策文档数据组,评估有效决策文档数据组决策性有哪些因素决策文档的准确性和可解释性。文档的实用性,是否为决策提供了有价值的信息。文档的更新和维护成本,是否需要保持文档的实时性。决策的时间效率,是否能够快速产生有用的决策。
进一步的,对新问题数据进行数据训练,根据数据训练结果对预定义工程造价数据处理方法调整并确定工程造价数据处理方法还包括:数据收集:将新问题加入处理方法训练集,将处理方法训练集按照预定义工程造价数据处理方法的数据预处理、数据特征提取、数据特征分类、数据特征子集、数据文档注释的具体步骤依次进行数据处理分别得到新的工程造价原始数据组、新的特征提取数据组、新的若干特征子集数据组和新的决策支持特征子集数据组;数据训练:根据收集到的各数据组选择对应的机器学习算法结合数据文档注释评估系数、数据特征子集评估系数、数据特征分类评估系数、数据特征提取评估系数和数据预处理评估系数进行数据训练;调整并确定预定义方法:根据数据训练结果,对预定义的工程造价数据处理方法进行调整并确定。
在本实施例中,通过对新问题数据进行数据训练,可以达成以下效果,个性化适应:模型可以自动适应新问题数据的特点,从而更好地满足不同问题的需求。连续改进:通过不断收集新数据并训练模型,可以持续改进工程造价数据处理方法,以适应不断变化的数据和需求。
上述本申请实施例中的技术方法,至少具有如下的技术效果或优点:相对于公开号为:CN115496405A的发明专利公开的一种基于三维数字化的电网变电工程智能算量模式研究方法,本申请实施例通过构建工程造价数据综合评估系数模型综合各评估系数,判断预定义工程造价数据处理方法是否出现问题并调整,从而提高了工程造价数据处理方法得出决策结果的客观性,进而实现了提高确定工程造价数据处理方法的有效性;相对于公开号为:CN114240070A的发明专利公开了一种配电网工程造价智能化评估系统,本申请实施例通过对新问题数据进行数据训练,根据数据训练结果对预定义工程造价数据处理方法调整并确定工程造价数据处理方法,从而提高新问题数据在实际处理下的反馈性,进而实现了提高工程造价数据处理方法的鲁棒性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种基于大数据的工程造价数据处理方法,用于服务器,其特征在于,包括以下步骤:
获取工程造价历史数据,所述获取工程造价历史数据包括工程造价数据处理方法历史问题数据;
确定预定义工程造价数据处理方法,评估预定义工程造价数据处理方法各步骤的决策支持性,得到工程造价数据处理方法综合评估数据;
根据工程造价数据处理方法综合评估数据,构建工程造价数据综合评估系数模型;
获取工程造价数据综合评估系数模型计算得到的工程造价数据综合评估系数,并将工程造价数据综合评估系数与预定义工程造价数据综合评估系数阈值对比,判断预定义工程造价数据处理方法是否出现问题并调整,确定工程造价数据处理方法。
2.根据权利要求1所述的基于大数据的工程造价数据处理方法,其特征在于,所述确定工程造价数据处理方法的具体方法为:
将工程造价数据综合评估系数与预定义工程造价数据综合评估系数阈值对比,若工程造价数据综合评估系数在预定义误差允许范围外,则判断预定义工程造价数据处理方法出现问题;
当预定义工程造价数据处理方法出现问题时,根据工程造价数据处理方法历史问题数据,生成处理方法训练集,将预定义工程造价数据处理方法数据与训练集中的数据进行对比,若数据相同,则判断为历史问题,否则,为新问题,并将新问题进行保存;
对新问题数据进行数据训练,根据数据训练结果对预定义工程造价数据处理方法调整并确定工程造价数据处理方法。
3.根据权利要求2所述的基于大数据的工程造价数据处理方法,其特征在于,所述确定预定义工程造价数据处理方法的具体步骤为:
数据预处理:收集各类与工程造价相关的原始数据,清理和处理原始数据,得到工程造价原始数据组;
数据特征提取:对有效工程造价数据组特征提取并做数据特征工程评估调节,得到特征提取数据组;
数据特征分类:根据机器学习算法通过预定义特征决策支持性对有效特征工程数据组数据分类,得到若干特征子集数据组;
数据特征子集:根据机器学习算法预定义子集决策支持性对特征子集数据组调节,得到决策支持特征子集数据组;
数据文档注释:获取若干特征子集关联数据组的数据关联决策文档,对数据关联决策文档决策支持性调节,得到决策文档数据组;
工程造价预测:根据有效决策文档数据组通过回归分析和机器学习工程预测工程造价结果;
结果展示与报告生成:根据工程造价结果生成工程造价报告可视化展示。
4.根据权利要求1所述的基于大数据的工程造价数据处理方法,其特征在于:所述构建工程造价数据综合评估系数模型的具体计算公式为:
式中,ω表示工程造价数据综合评估系数;θ表示数据文档注释评估系数,表示数据特征子集评估系数,φ表示数据特征分类评估系数,μ表示数据特征提取评估系数,α表示数据预处理评估系数,t、u、v和w分别表示数据预处理评估系数、数据特征子集评估系数、数据特征提取评估系数和数据特征分类评估系数对应的工程造价数据处理方法的决策支持性权重因子,e表示自然常数。
5.如权利要求4所述基于大数据的工程造价数据处理方法,其特征在于,所述数据预处理评估系数的具体计算公式为:
式中,a0表示工程造价原始数据组数据类别,a0=1,2,...,a,a表示工程造价原始数据组数据类别总数,c0表示工程造价原始数据组第a0类数据的编号,c0=1,2,...,c,c表示工程造价原始数据组第a0类数据的编号总数,表示工程造价原始数据组中第a0类第c0个工程造价原始数据组数据,/>表示工程造价原始数据组中第a0类第c0个工程造价原始数据组数据噪音阈值标准值,β表示工程造价原始数据组数据噪音值读取误差因子,/>表示工程造价原始数据组中第a0类第c0个工程造价原始数据组数据噪音差值标准值,b表示工程造价原始数据组中第a0类第c0个工程造价原始数据组数据噪音修正标准值。
6.如权利要求4所述基于大数据的工程造价数据处理方法,其特征在于,所述数据特征提取评估系数的具体计算公式为:
式中,d0表示特征提取数据组数据类别,d0=1,2,...,d,d表示特征提取数据组数据类别总数,f0表示特征提取数据组第d0类数据的编号,f0=1,2,...,f,f为特征提取数据组第d0类数据的编号总数,表示特征提取数据组中第d0类第f0个特征提取数据组数据特征系数,/>表示特征提取数据组中第d0类第f0个特征提取数据组数据预定义特征系数,ε表示预定义特征提取数据组数据对应的数据类别误差因子,δ表示预定义特征提取数据组信息密度变化误差修正因子,/>表示特征提取数据组中第d0类第f0个特征提取数据组数据特征系数提取误差标准值,χ表示预定义特征系数影响匹配系数。
7.如权利要求4所述基于大数据的工程造价数据处理方法,其特征在于,所述数据特征分类评估系数的具体计算公式为:
式中,C表示数据特征分类准确率评估值、D表示数据特征分类精准率评估值、E表示数据特征相关性评估系数,F表示工程造价影响修正评估值,γ表示数据特征分类准确率评估值和数据特征分类精准率评估值匹配调和因子,g和h分别表示数据特征分类准确率评估值和数据特征分类精准率评估值对应的特征决策支持性权重因子,D预表示预定义数据特征分类精准率评估标准值,E预表示数据特征相关性评估系数标准值,表示数据特征相关性评估系数匹配调和因子,/>表示预定义数据特征分类召回率匹配调和因子,η表示表示数据特征分类准确率评估值、数据特征分类精准率评估值和数据特征相关性评估系数相互叠加负向影响系数,λ表示预定义数据特征分类线性相关修正系数。
8.如权利要求4所述基于大数据的工程造价数据处理方法,其特征在于,所述数据特征子集评估系数的具体计算公式为:
式中,G表示特征分配权重影响匹配评估值,H表示数据标签适配评估值,I表示工程领域特征匹配评估值,J表示特征分布互信息系数,K表示预定义特征距离相关修正系数,m和o分别表示特征分配权重影响匹配评估值和数据标签适配评估值对应的影响匹配因子,i和j分别表示特征分配权重影响匹配评估值和数据标签适配评估值对应的特征权重因子,H预表示数据标签适配评估标准值,n表示工程领域特征匹配评估值对特征分配权重影响匹配评估值和数据标签适配评估值的影响叠加因子,k表示特征分布互信息系数对特征子集评估系数的影响叠加因子。
9.如权利要求4所述基于大数据的工程造价数据处理方法,其特征在于,所述数据文档注释评估系数的具体计算公式为:
式中,M表示文档特征覆盖度评估值,N表示文档信息量评估值,P表示文档客观性匹配影响系数,p与q分别表示文档特征覆盖度评估值和文档信息量评估值的决策权重因子,r表示文档特征覆盖度评估值和文档信息量评估值对文档客观性匹配影响系数的影响匹配因子,表示文档特征覆盖度评估值、文档信息量评估值和文档客观性匹配影响系数的叠加负向影响因子,S表示特征子集关联修正影响匹配因子,σ表示数据文档注释评估系数的决策支持性影响匹配因子。
10.如权利要求3所述基于大数据的工程造价数据处理方法,其特征在于,所述对新问题数据进行数据训练,根据数据训练结果对预定义工程造价数据处理方法调整并确定工程造价数据处理方法还包括:
数据收集:将新问题加入处理方法训练集,将处理方法训练集按照预定义工程造价数据处理方法的数据预处理、数据特征提取、数据特征分类、数据特征子集、数据文档注释的具体步骤依次进行数据处理分别得到新的工程造价原始数据组、新的特征提取数据组、新的若干特征子集数据组和新的决策支持特征子集数据组;
数据训练:根据收集到的各数据组选择对应的机器学习算法结合数据文档注释评估系数、数据特征子集评估系数、数据特征分类评估系数、数据特征提取评估系数和数据预处理评估系数进行数据训练;
调整并确定预定义方法:根据数据训练结果,对预定义的工程造价数据处理方法进行调整并确定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311356816.3A CN117391626A (zh) | 2023-10-19 | 2023-10-19 | 一种基于大数据的工程造价数据处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311356816.3A CN117391626A (zh) | 2023-10-19 | 2023-10-19 | 一种基于大数据的工程造价数据处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117391626A true CN117391626A (zh) | 2024-01-12 |
Family
ID=89438591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311356816.3A Pending CN117391626A (zh) | 2023-10-19 | 2023-10-19 | 一种基于大数据的工程造价数据处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117391626A (zh) |
-
2023
- 2023-10-19 CN CN202311356816.3A patent/CN117391626A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102044205B1 (ko) | 빅데이터와 기계학습을 이용한 타겟 정보 예측 시스템 및 예측 방법 | |
KR101802866B1 (ko) | 빅데이터와 기계학습을 이용한 타겟 정보 예측 시스템 및 예측 방법 | |
CN117875724B (zh) | 一种基于云计算的采购风险管控方法及系统 | |
CN113537807B (zh) | 一种企业智慧风控方法及设备 | |
CN117593101B (zh) | 基于多维数据的金融风险数据处理分析方法及系统 | |
CN117787569B (zh) | 一种智能辅助评标方法及系统 | |
CN114048436A (zh) | 一种预测企业财务数据模型构建方法及构建装置 | |
CN116861331A (zh) | 一种融合专家模型决策的数据识别方法及系统 | |
CN117670066B (zh) | 基于智能决策的司库管理方法、系统、设备及存储介质 | |
CN112700324A (zh) | 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法 | |
CN117093919B (zh) | 基于深度学习的岩土工程地质灾害预测方法及系统 | |
CN117172509B (zh) | 基于装修施工进度分析的施工项目分配系统 | |
CN117934035B (zh) | 一种房建工程造价预估方法、装置及存储介质 | |
US20210090101A1 (en) | Systems and methods for business analytics model scoring and selection | |
CN116883065A (zh) | 商户风险预测方法及装置 | |
CN118297271A (zh) | 一种基于可逆计算的耗能企业时序数据预测方法及系统 | |
CN117952456A (zh) | 基于涉企合同的综合智能评估方法及系统 | |
CA3160715A1 (en) | Systems and methods for business analytics model scoring and selection | |
CN117291575A (zh) | 设备检修方法、装置、计算机设备和存储介质 | |
CN117391626A (zh) | 一种基于大数据的工程造价数据处理方法 | |
CN117076454B (zh) | 一种工程质量验收表单数据结构化存储方法及系统 | |
CN117473435B (zh) | 一种基于时空特征的突发公共卫生事件虚假异常信息检测方法 | |
CN117539920B (zh) | 基于房产交易多维度数据的数据查询方法及系统 | |
CN118735283A (zh) | 一种用人工智能技术评估风险的方法、装置、设备及介质 | |
CN118260948A (zh) | 基于仿真的通用型计算机辅助量化决策平台 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |