CN112766536A - 计算公路工程人工单价的模型训练方法、装置及终端 - Google Patents
计算公路工程人工单价的模型训练方法、装置及终端 Download PDFInfo
- Publication number
- CN112766536A CN112766536A CN202011545160.6A CN202011545160A CN112766536A CN 112766536 A CN112766536 A CN 112766536A CN 202011545160 A CN202011545160 A CN 202011545160A CN 112766536 A CN112766536 A CN 112766536A
- Authority
- CN
- China
- Prior art keywords
- data
- training
- neural network
- unit price
- network model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 85
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000003062 neural network model Methods 0.000 claims abstract description 59
- 238000010276 construction Methods 0.000 claims abstract description 55
- 238000012360 testing method Methods 0.000 claims abstract description 28
- 238000010219 correlation analysis Methods 0.000 claims description 21
- 238000001914 filtration Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 4
- 206010063385 Intellectualisation Diseases 0.000 abstract 1
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
- G06Q10/1053—Employment or hiring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- General Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种计算公路工程人工单价的模型训练方法、装置及终端。其中方法包括:获取针对公路工程建设项目的多组历史数据,任一组历史数据包括针对公路工程建设项目的人工单价的第一数据以及与人工单价相关的多个第二数据;将多组历史数据划分为训练样本和测试样本;基于训练样本对预构建的神经网络模型进行训练,得到神经网络模型的多组参数;基于测试样本,确定神经网络模型的多组参数各自对应的预测误差值;依据预测误差值最小的一组参数,确定神经网络模型的目标参数,得到针对建设项目的预测模型。本申请能够通过预测模型为今后公路工程建设项目人工单价的预测提供了基础支撑,实现工程建设项目人工单价预测的自动化、智能化,提高人工单价预测的精度。
Description
技术领域
本申请涉及工程费预测技术领域,具体涉及一种计算公路工程人工单价模型训练方法、装置及终端。
背景技术
对工程建设项目,如公路工程建设项目,合理确定和有效控制工程造价造价,是造价管理机构和公路项目参建单位等各方十分关心的问题。其中,人工单价标准是影响造价高低的主要影响因素。工程建设项目当地的建筑业总产值、当地全社会固定资产投资、当地公路里程、当地建筑业从业人数、当地人均GDP、当地社会平均工资、当地劳动生产率、当地CPI及当地最低工资等数据又与人工单价标准有密切的关系。然而,这些宏观经济数据的分析,尤其是人工单价的确定更依赖于专业人员的评估,导致人工单价的确定滞后于建筑市场劳务工人的工资价格。因此,存在评估门槛高、数据获取及处理量庞大、精确度差等问题。
发明内容
为了解决上述至少一个技术问题,本申请提供一种计算公路工程人工单价模型训练方法、装置、终端及存储介质。
根据本申请的第一方面,提供了一种计算公路工程人工单价的模型训练方法,该方法包括:
获取针对公路工程建设项目的多组历史数据,任一组所述历史数据包括针对公路工程建设项目的人工单价的第一数据以及与人工单价相关的多个第二数据;
将多组历史数据划分为训练样本和测试样本;
基于训练样本对预构建的神经网络模型进行训练,得到神经网络模型的多组参数;
基于测试样本,确定神经网络模型依据多组参数各自对应的预测误差值;
依据预测误差值最小的一组参数,确定神经网络模型的目标参数,得到针对公路工程建设项目的预测模型。
根据本申请的第二方面,提供了一种计算公路工程人工单价的模型训练装置,该装置包括:
数据获取模块,用于获取针对公路工程建设项目的多组历史数据,任一组历史数据包括针对公路工程建设项目的人工单价的第一数据以及与人工单价相关的多个第二数据;
样本分类模块,用于将多组历史数据划分为训练样本和测试样本;
模型训练模块,用于基于训练样本对预构建的神经网络模型进行训练,得到神经网络模型的多组参数;
模型验证模块,用于基于测试样本,确定神经网络模型依据多组参数各自对应的预测误差值;
预测模型确定模块,用于依据预测误差值最小的一组参数,确定神经网络模型的目标参数,得到针对公路工程建设项目的预测模型。
根据本申请的第三方面,提供了一种终端,该终端包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时以实现上述计算公路工程人工单价的模型训练方法。
根据本申请的第四方面,提供了一种计算机可读存储介质,该介质存储有计算机可执行指令,该计算机可执行指令用于以执行上述计算公路工程人工单价的模型训练方法。
本申请实施例通过获取针对公路工程建设项目的多组历史数据,以将多组历史数据划分为训练样本和测试样本,从而基于训练样本对预构建的神经网络模型进行训练,得到神经网络模型的多组参数,基于测试样本,确定神经网络模型的多种参数各自对应的预测误差值,依据预测误差值最小的一组参数,确定神经网络模型的目标参数,得到针对建设项目的预测模型,任一组历史数据包括针对公路工程建设项目的人工单价的第一数据以及与人工单价相关的多个第二数据,这种利用历史数据来训练神经网络模型的方式,起到了有效利用历史数据得到预测模型的效果,进而得到能够对公路建设项目人工单价进行预测的预测模型,从而为后续对工程建设项目提供预测人工单单价的基础支撑,实现对公路建设项目人工单价进行自动化、智能化预测的目的,提高对工程建设项目的人工单价的预测精度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种计算公路工程人工单价的模型训练方法的流程示意图;
图2为本申请实施例提供的一种计算公路工程人工单价的模型训练方法中应用的历史记录一个实施例的示意图;
图3为本申请实施例提供的一种计算公路工程人工单价的模型训练方法中对应用的历史记录进行相关性分析得到的相关性分析结果的示意图;
图4为本申请实施例提供的一种计算公路工程人工单价的模型训练方法中对应用的历史记录进行过滤得到的结果示意图;
图5为本申请实施例提供的一种计算公路工程人工单价的模型训练装置的框图结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
根据本申请的一个实施例,提供了一种计算公路工程人工单价的模型训练方法,如图1所示,该方法包括:步骤S101至步骤S105。
步骤S101:获取针对公路工程建设项目的多组历史数据,任一组所述历史数据包括针对公路工程建设项目的人工单价的第一数据以及与人工单价相关的多个第二数据。
具体地,终端获取针对公路工程建设项目的多组历史数据。
具体地,可以通过对本地存储的读取来得到多条历史数据,也可以通过导入文件的方式来得到多条历史数据。
具体地,历史数据为过去预定时间内的记录,如过去10年的记录。
具体地,与人工单价相关的第二数据一般为工程建设项目的各项宏观经济基本数据,如建筑业总产值、当地全社会固定资产投资、当地公路里程、当地建筑业从业人数、当地人均GDP、当地社会平均工资、当地劳动生产率、当地CPI及当地最低工资等。
步骤S102:将多组历史数据划分为训练样本和测试样本。
具体地,可以按照预设比例来对多组数据进行分类。例如,假设步骤S101获取到13组历史数据,将多组数据按照12:1的比例,划分为训练样本和测试样本,那么训练样本包括12组历史数据,测试样本包括1组历史数据。
步骤S103:基于训练样本对预构建的神经网络模型进行训练,得到神经网络模型的多组参数。
具体地,训练样本包括的每组历史数据均可以得到一组参数,即,利用训练样本的每组历史数据对神经网络模型进行训练,均可以得到一组参数。
具体地,神经网络模型可以为采用人工神经网络(Artificial Neural Network,ANN)、整合移动平均自回归模型(Auto Regressive Integrated Moving Average model,ARIMA)、支持向量机(Support Vector Machine,SVM)、逻辑回归(Logistic Regression,LR)及基于Xgboost算法的模型等等。具体地,神经网路模型可以采用回归算法、分类算法、聚类算法、降维算法和集成算法等。
步骤S104:基于测试样本,确定神经网络模型依据多组参数各自对应的预测误差值。
具体地,测试样本用于验证神经网络模型在不同参数情形下的预测误差值。
步骤S105:依据预测误差值最小的一组参数,确定神经网络模型的目标参数,得到针对公路工程建设项目的预测模型。
本申请实施例通过获取针对公路工程建设项目的多组历史数据,以将多组历史数据划分为训练样本和测试样本,从而基于训练样本对预构建的神经网络模型进行训练,得到神经网络模型的多组参数,基于测试样本,确定神经网络模型的多种参数各自对应的预测误差值,依据预测误差值最小的一组参数,确定神经网络模型的目标参数,得到针对建设项目的预测模型,任一组历史数据包括针对公路工程建设项目的人工单价的第一数据以及与人工单价相关的多个第二数据,这种利用历史数据来训练神经网络模型的方式,起到了有效利用历史数据得到预测模型的效果,进而得到能够对公路工程建设项目人工单价进行预测的预测模型,从而为后续对公路工程建设项目提供预测人工单单价的基础支撑,实现对公路工程建设项目人工单价进行自动化、智能化预测的目的,提高对工程建设项目的人工单价的预测精度。
在一些实施例中,在步骤S101之后,该方法进一步还包括:步骤S1011和步骤S1012(图中未示出)。
步骤S1011:在针对第一数据的多个第二数据中,确定对第一数据无影响的目标数据;
步骤S1012:过滤多组历史数据各自包括的目标数据,得到多组待处理历史数据,以依据多组待处理历史数据来确定训练样本和测试样本。
具体地,目标数据可以为针对第一数据的多个第二数据的一个或多个。例如,假设针对第一数据的第二数据有9个,目标数据可以为这9个第二数据中的一个或几个。
本申请通过过滤处理起到了去除各组历史数据中无效参数的效果,从而避免了因无效参数参与训练,导致的预测模型的的预测精度低的问题。
在一些实施例中,步骤S1011进一步包括:
对多组历史数据进行相关性分析,得到第一数据与多个第二数据分别对应的相关值;
若第一数据与任一第二数据对应的相关值大于预设的相关值阈值,则将该任一第二数据确定为对第一数据无影响的目标数据。
具体地,可以通过预设的一种或几种相关性分析算法,对多条历史记录进行相关性分析。更具体地,在提供有多种相关性分析算法的情形下,可以预先选定其中一种作为默认的相关性分析算法,也可以根据用户的选定操作来确定进行相关性分析所采用的相关性分析算。
具体地,相关性分析算法可以运行在终端,也可以运行在服务端。若相关性分析算法运行在服务端,则可以将多条历史数据通过预设接口发送至指定的服务端,以获取来自相关性分析平台的相关性分析结果,从而得到第一数据与多个第二数据分别对应的相关值,进而确定出对第一数据无影响的目标数据。这种通过预设接口与指定的服务端的通信方式,实现了利用服务端来执行相关性分析的过程,起到了减小本地计算开销的效果,无需在本地对相关性算法的进行配置,起到了简化模型训练步骤的效果,提高了模型训练的效率。
本申请实施例中,利用SPSS工具来对多组历史数据进行相关性分析。具体地,通过SPSS工具得到的相关性分析结果包括第一数据与各个第二数据间的至少一种相关性参数,如皮尔逊相关性系数、显著性参数。通过将这种相关性参数与预设的相关性参数阈值进行比较,根据比较结果来对第一数据无影响的目标数据。例如,将小于相关性参数阈值的第二数据,作为对第一数据无影响的目标数据。
在本申请实施例中,第一数据与多个第二数据分别对应的相关值可以包括皮尔逊相关性系数、显著性参数,那么可以参照以下过程,确定对第一数据无影响的目标数据:若皮尔逊相关性系数在预定皮尔逊相关性系数阈值范围内,且显著性参数值不低于0.500的宏观经济基本数据,则确定该第二数据对第一数据无影响,将其确定为目标数据。在本申请实施例中,皮尔逊相关系数(Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,简称PPMCC或PCCs),是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。在本申请实施例中,显著性又称显著性水平,用于表征差异的程度。程度不同说明引起变动的原因也有不同。主要包括两类原因:一类是条件差异,一类是随机差异。
例如,假设步骤S101得到的历史记录如图2所示。图1中,Y表示人工费,X1-X9表示工程公路建设项目的几项宏观经济基本数据,分别为:建筑业总产值、当地全社会固定资产投资、当地公路里程、当地建筑业从业人数、当地人均GDP、当地社会平均工资、当地劳动生产率、当地CPI及当地最低工资。假设对步骤S101得到的多组历史数据进行相关性分析,得到图3所示的相关性分析结果。通过对图3的分析可知,X4皮尔逊相关性系数在预定皮尔逊相关性系数阈值范围内,且显著性参数值低于0.500的宏观经济基本数据,因此,X4不具有强相关性,其余几项具有强相关性,因此,将X4作为目标数据,并执行步骤S1012,得到如图4所示的数据,起到过滤处理起到了去除各组历史数据中无效参数的效果,从而避免了因无效参数参与训练,导致的预测模型的的预测精度低的问题。在得到图4所示的几组数据之后,将其划分为训练样本和测试样本。
在一些实施例中,步骤S101进一步包括:
初始化训练样本;
将初始化后的训练样本输入至神经网路模型,以得到神经网络模型的多组参数。
具体地,可以按照预设的数值对训练样本进行初始化处理,从而降低神经网络模型的运算量,加快对神经网络模型进行训练的时间,提高对神经网络模型的训练效率。
具体地,历史数据与参数一一对应,即一组历史数据对应神经网络模型的一组参数,这样能够从中筛选出使预测误差值的一组参数,并作为神经网络模型的目标参数,从而得到训练好的预测模型。
在一些实施例中,步骤S101进一步包括:
基于所选定的时间段,生成数据获取请求;
将数据获取请求发送至指定的数据服务平台;
获取来自数据服务平台依据数据获取请求反馈的多组历史数据。
具体地,假设选定的时间段为2003年至2015年,则可以生成获取2003年至2015年的针对建设项目的请求,并将将该请求发送至指定的数据服务平台(如国家统计局、当地统计局官方网站等),这样就能从数据平台直接获取到符合条件的多条历史数据。
在一些实施例中,该方法还包括:
获取多个待预测第二数据;
将多个待预测第二数据输入至预测模型,得到针对第一数据的预测范围。
具体地,可以通过预设的交互界面来获取用户输入的与第一数据(如人工费)具有强相关性的多个待预测第二数据(如宏观经济基本数据),并将该数据输入至预测模型,得到针对第一数据的预测范围。
具体地,待预测第二数据可以是通过指定的数据服务平台(如国家统计局、当地统计局官方网站等)获取到的。例如,当前时间为公元N年,若从数据服务平台获取到预测的公元N+1年的第二数据,那么可以直接利用步骤S101中得到的预测模型来预测第一数据。这种从指定的数据服务平台获取待预测的第二数据的方式,不仅能够省去用户预估第二数据的步骤,还避免了因预估的第二数据不符合官方标准,导致预估的第一数据不符合官方标准的问题,实现了提高对第一数据的预测效率的目的。
本申请实施例利用预测模型,起到了快速确定与多个待预测第二数据匹配的第一数据范围的效果,通过提供第一数据范围,便利了工程建设管理者进行定价并进行工程预算,以防止指定的人工费过高或过低带来的影响。
本申请的又一实施例提供了一种模型训练装置,如图5所示,该装置包括:数据获取模块501、样本分类模块502、模型训练模块503、模型验证模块504及预测模型确定模块505。
数据获取模块501,用于获取针对公路工程建设项目的多组历史数据,,任一组历史数据包括针对公路工程建设项目的人工单价的第一数据以及与人工单价相关的多个第二数据;
样本分类模块502,用于将多组所述历史数据划分为训练样本和测试样本;
模型训练模块503,用于基于训练样本对预构建的神经网络模型进行训练,得到神经网络模型的多组参数;
模型验证模块504,用于基于测试样本,确定神经网络模型依据多组参数各自对应的预测误差值;
预测模型确定模块505,用于依据预测误差值最小的一组参数,确定神经网络模型的目标参数,得到针对公路工程建设项目的预测模型。
本申请实施例通过获取针对公路工程建设项目的多组历史数据,以将多组历史数据划分为训练样本和测试样本,从而基于训练样本对预构建的神经网络模型进行训练,得到神经网络模型的多组参数,基于测试样本,确定神经网络模型的多种参数各自对应的预测误差值,依据预测误差值最小的一组参数,确定神经网络模型的目标参数,得到针对建设项目的预测模型,任一组历史数据包括针对公路工程建设项目的人工单价的第一数据以及与人工单价相关的多个第二数据,这种利用历史数据来训练神经网络模型的方式,起到了有效利用历史数据得到预测模型的效果,进而得到能够对公路建设项目人工单价进行预测的预测模型,从而为后续对公路工程建设项目提供预测人工单单价的基础支撑,实现对公路工程建设项目人工单价进行自动化、智能化预测的目的,提高对工程建设项目的人工单价的预测精度。
进一步地,在获取针对公路工程建设项目的多组历史数据之后,数据获取模块还包括:
目标数据确定子模块,用于在针对第一数据的多个第二数据中,确定对第一数据无影响的目标数据;
目标数据过滤子模块,用于过滤多组历史数据各自包括的目标数据,得到多组待处理历史数据,以依据多组待处理历史数据来确定训练样本和测试样本。
进一步地,目标数据确定子模块包括:
对多组历史数据进行相关性分析,得到第一数据与多个第二数据分别对应的相关值;
若第一数据与任一第二数据对应的相关值大于预设的相关值阈值,则将该任一第二数据确定为对第一数据无影响的目标数据。
进一步地,模型训练模块包括:
初始化子模块,用于初始化训练样本;
模型训练子模块,用于将初始化后的训练样本输入至神经网路模型,以得到神经网络模型的多组参数。
进一步地,数据获取模块包括:
请求生成子模块,用于基于所选定的时间段,生成数据获取请求;
请求发送子模块,用于将数据获取请求发送至指定的数据服务平台;
数据获取子模块,用于获取来自数据服务平台依据数据获取请求反馈的多组历史数据。
进一步地,该装置还包括:
预测输入模块,用于获取多个待预测第二数据;
预测输出模块,用于将多个待预测第二数据输入至预测模型,得到针对第一数据的预测范围。
本实施例的模型训练装置可执行本申请实施例提供的模型训练方法,其实现原理相类似,此处不再赘述。
本申请又一实施例提供了一种终端,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行计算机程序时以实现上述模型训练方法。
具体地,处理器可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
具体地,处理器通过总线与存储器连接,总线可包括一通路,以用于传送信息。总线可以是PCI总线或EISA总线等。总线可以分为地址总线、数据总线、控制总线等。
存储器可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
可选的,存储器用于存储执行本申请方案的计算机程序的代码,并由处理器来控制执行。处理器用于执行存储器中存储的应用程序代码,以实现上述实施例提供的模型训练装置的动作。
本申请又一实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,该计算机可执行指令用于执行上述模型训练方法。
以上所描述的装置实施例仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上是对本申请的较佳实施进行了具体说明,但本申请并不局限于上述实施方式,熟悉本领域的技术人员在不违背本申请精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (10)
1.一种计算公路工程人工单价的模型训练方法,其特征在于,包括:
获取针对公路工程建设项目的多组历史数据,任一组所述历史数据包括针对公路工程建设项目的人工单价的第一数据以及与人工单价相关的多个第二数据;
将多组所述历史数据划分为训练样本和测试样本;
基于所述训练样本对预构建的神经网络模型进行训练,得到所述神经网络模型的多组参数;
基于所述测试样本,确定所述神经网络模型的多组所述参数各自对应的预测误差值;
依据所述预测误差值最小的一组所述参数,确定所述神经网络模型的目标参数,得到针对所述公路工程建设项目的预测模型。
2.根据权利要求1所述的方法,其特征在于,所述获取针对公路工程建设项目的多组历史数据的步骤之后,所述方法还包括:
在针对所述第一数据的多个所述第二数据中,确定对所述第一数据无影响的目标数据;
过滤多组所述历史数据各自包括的所述目标数据,得到多组待处理历史数据,以依据多组所述待处理历史数据来确定所述训练样本和所述测试样本。
3.根据权利要求2所述的方法,其特征在于,所述在针对所述第一数据的多个所述第二数据中,确定对所述第一数据无影响的目标数据的步骤,包括:
对多组所述历史数据进行相关性分析,得到所述第一数据与多个第二数据分别对应的相关值;
若所述第一数据与任一所述第二数据对应的相关值大于预设的相关值阈值,则将该任一所述第二数据确定为对所述第一数据无影响的所述目标数据。
4.根据权利要求1所述的方法,其特征在于,所述基于所述训练样本对预构建的神经网络模型进行训练的步骤,包括:
初始化所述训练样本;
将初始化后的所述训练样本输入至所述神经网路模型,以得到所述神经网络模型的多组参数。
5.根据权利要求1所述的方法,其特征在于,所述获取针对公路工程建设项目的多组历史数据的步骤,包括:
基于所选定的时间段,生成数据获取请求;
将所述数据获取请求发送至指定的数据服务平台;
获取来自所述数据服务平台依据所述数据获取请求反馈的多组所述历史数据。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取多个待预测第二数据;
将多个所述待预测第二数据输入至所述预测模型,得到针对所述第一数据的预测范围。
7.一种计算公路工程人工单价的模型训练装置,其特征在于,包括:
数据获取模块,用于获取针对公路工程建设项目的多组历史数据,任一组所述历史数据包括针对公路工程建设项目的人工单价的第一数据以及与人工单价相关的多个第二数据;
样本分类模块,用于将多组所述历史数据划分为训练样本和测试样本;
模型训练模块,用于基于所述训练样本对预构建的神经网络模型进行训练,得到所述神经网络模型的多组参数;
模型验证模块,用于基于所述测试样本,确定所述神经网络模型依据多组所述参数各自对应的预测误差值;
预测模型确定模块,用于依据所述预测误差值最小的一组所述参数,确定所述神经网络模型的目标参数,得到针对所述公路工程建设项目的预测模型。
8.根据权利要求7所述的装置,其特征在于,在获取针对公路工程建设项目的多组历史数据之后,数据获取模块还包括:
目标数据确定子模块,用于在针对第一数据的多个第二数据中,确定对第一数据无影响的目标数据;
目标数据过滤子模块,用于过滤多组历史数据各自包括的目标数据,得到多组待处理历史数据,以依据多组待处理历史数据来确定训练样本和测试样本。
9.一种终端,其特征在于,包括:存储器、一个或多个处理器以及一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1-6任一项所述的方法。
10.一种计算机可读存储介质,存储有计算机可执行指令,其特征在于,该程序被处理器执行时用于实现权利要求1至6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011545160.6A CN112766536A (zh) | 2021-03-16 | 2021-03-16 | 计算公路工程人工单价的模型训练方法、装置及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011545160.6A CN112766536A (zh) | 2021-03-16 | 2021-03-16 | 计算公路工程人工单价的模型训练方法、装置及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112766536A true CN112766536A (zh) | 2021-05-07 |
Family
ID=75695437
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011545160.6A Pending CN112766536A (zh) | 2021-03-16 | 2021-03-16 | 计算公路工程人工单价的模型训练方法、装置及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112766536A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113537614A (zh) * | 2021-07-28 | 2021-10-22 | 广东电网有限责任公司 | 电网工程造价预测模型的构建方法、系统、设备及介质 |
WO2023081522A1 (en) * | 2021-11-08 | 2023-05-11 | Procore Technologies, Inc. | Machine-learning-based prediction of construction project parameters |
-
2021
- 2021-03-16 CN CN202011545160.6A patent/CN112766536A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113537614A (zh) * | 2021-07-28 | 2021-10-22 | 广东电网有限责任公司 | 电网工程造价预测模型的构建方法、系统、设备及介质 |
WO2023081522A1 (en) * | 2021-11-08 | 2023-05-11 | Procore Technologies, Inc. | Machine-learning-based prediction of construction project parameters |
US11983653B2 (en) | 2021-11-08 | 2024-05-14 | Procore Technologies, Inc. | Machine-learning-based prediction of construction project parameters |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Simchi-Levi et al. | Identifying risks and mitigating disruptions in the automotive supply chain | |
CN110992167A (zh) | 银行客户业务意图识别方法及装置 | |
CN110245980B (zh) | 基于神经网络模型确定目标用户激励形式的方法和设备 | |
CN112766536A (zh) | 计算公路工程人工单价的模型训练方法、装置及终端 | |
US11501239B2 (en) | Metric specific machine learning model improvement through metric specific outlier removal | |
CN112101939A (zh) | 基于区块链的节点管理方法及系统 | |
CN114170002A (zh) | 一种访问频次的预测方法及装置 | |
CN110659137A (zh) | 针对离线任务的处理资源分配方法及系统 | |
CN108416619B (zh) | 一种消费间隔时间预测方法、装置及可读存储介质 | |
CN111062486A (zh) | 一种评价数据的特征分布和置信度的方法及装置 | |
CN111768287A (zh) | 周期识别方法、装置、服务器及可读存储介质 | |
CN110795324A (zh) | 一种数据处理方法及装置 | |
CN108985755B (zh) | 一种账号状态识别方法、装置及服务器 | |
CN111784246B (zh) | 物流路径的估测方法 | |
CN117575804A (zh) | 一种货物资产风险分析方法、系统及介质 | |
CN110992189A (zh) | 资源数据估值方法、装置、计算机设备和存储介质 | |
CN110661913A (zh) | 一种用户排序方法、装置及电子设备 | |
CN111859057B (zh) | 数据特征处理方法及数据特征处理装置 | |
CN114708110A (zh) | 续保行为预测模型的联合训练方法、装置及电子设备 | |
CN113849618A (zh) | 基于知识图谱的策略确定方法、装置、电子设备及介质 | |
CN114676272A (zh) | 多媒体资源的信息处理方法、装置、设备及存储介质 | |
CN110708414B (zh) | 一种电话号码的排序方法、装置及电子设备 | |
CN112686423A (zh) | 基于机器学习的信托产品收益率预测方法及装置 | |
CN109903074A (zh) | 基于数据分析的市场状态划分方法和装置 | |
CN111210277A (zh) | 一种基于客户行为的预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210507 |
|
RJ01 | Rejection of invention patent application after publication |