CN113962158A - 基于改进决策树的压路机施工工艺知识库构建方法及系统 - Google Patents
基于改进决策树的压路机施工工艺知识库构建方法及系统 Download PDFInfo
- Publication number
- CN113962158A CN113962158A CN202111273382.1A CN202111273382A CN113962158A CN 113962158 A CN113962158 A CN 113962158A CN 202111273382 A CN202111273382 A CN 202111273382A CN 113962158 A CN113962158 A CN 113962158A
- Authority
- CN
- China
- Prior art keywords
- construction
- road roller
- decision tree
- data
- normal distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 161
- 238000000034 method Methods 0.000 title claims abstract description 93
- 238000003066 decision tree Methods 0.000 title claims abstract description 91
- 230000008569 process Effects 0.000 title claims abstract description 60
- 238000009411 base construction Methods 0.000 title claims abstract description 11
- 238000009826 distribution Methods 0.000 claims abstract description 66
- 230000009466 transformation Effects 0.000 claims abstract description 22
- 238000010224 classification analysis Methods 0.000 claims abstract description 10
- 238000013138 pruning Methods 0.000 claims abstract description 8
- 238000006243 chemical reaction Methods 0.000 claims description 22
- 238000003825 pressing Methods 0.000 claims description 21
- 238000005315 distribution function Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 10
- 239000002689 soil Substances 0.000 claims description 10
- 238000005457 optimization Methods 0.000 claims description 8
- 238000013016 damping Methods 0.000 claims description 7
- 230000001174 ascending effect Effects 0.000 claims description 6
- 238000005096 rolling process Methods 0.000 claims description 6
- 238000007476 Maximum Likelihood Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 claims description 5
- 238000001422 normality test Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了基于改进决策树的压路机施工工艺知识库构建方法及系统,根据压路机施工项目已有案例数据,构建压路机施工工艺数据库;判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布,如果是则保持现有数据不变,否则对非正态分布数据进行转换,将其转换为正态分布数据;计算各个判断属性的基尼系统并按序排列,初步形成决策树;对决策树中经过转换的数据进行逆变换;对逆变换后的决策树进行剪枝优化处理,形成最终改进后的决策树模型;利用改进后的决策树模型对实际数据进行分类分析,得到压路机施工方案。本发明能够保证压路机施工流程数据能够保证全为正态分布,解决现有决策树的局限性,能够辅助工程师进行压路机施工的决策。
Description
技术领域
本发明属于压路机施工技术领域,具体涉及基于改进决策树的压路机施工工艺知识库构建方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
近年来随着大数据时代的降临,土建工程行业迎来了新的机遇和挑战。传统的施工决策方式流程繁琐,耗费了人力物力。科研工作者开始尝试采用新技术来简化决策过程,以达到准确快速地确定工艺流程的目的。
土建行业确定压路机施工流程的各项工艺及参数的传统方式流程繁琐,并且较为依赖工程师的经验,主观性较强。每一个参数的确定都要查阅相关资料,进而由工程师统筹决定,并不利于具体施工的开展,容易延误工期或造车错误施工。
目前虽然有部分研究学者通过决策树利用数据生成决策,但决策树对于非正态数据的处理有自身的局限性,易陷入局部最优,而压路机施工流程数据很难保证全为正态分布,存在很大的局限性。
发明内容
本发明为了解决上述问题,提出基于改进决策树的压路机施工工艺知识库构建方法及系统,本发明能够保证压路机施工流程数据能够保证全为正态分布,解决现有决策树的局限性,能够辅助工程师进行压路机施工的决策。
根据一些实施例,本发明采用如下技术方案:
一种基于改进决策树的压路机施工工艺知识库构建方法,包括以下步骤:
根据压路机施工项目已有案例数据,构建压路机施工工艺数据库;
判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布,如果是则保持现有数据不变,否则对非正态分布数据进行Box—Cox转换,将其转换为正态分布数据;
计算各个判断属性的基尼系统并按序排列,初步形成决策树;
对决策树中经过Box—Cox转换的数据进行相关逆变换;
对逆变换后的决策树进行剪枝优化处理,保证最小实例数大于设定值,形成改进后的决策树模型;
获取压路机施工对象及施工要求相关参数;
根据施工对象及施工要求相关参数,利用改进后的决策树模型进行分类分析,得到压路机施工方案,形成压路机施工工艺知识库。
作为可选择的实施方式,所述压路机施工对象包括土壤类型,施工对象的底长、底宽、深度及放坡系数。
作为可选择的实施方式,所述压路机施工要求相关参数包括施工要求属性、压路机型号以及初压、复压、终压三个阶段的压路机振幅、频率、碾压速度和碾压遍数,施工要求属性包括压实度、平整度和均匀度。
作为可选择的实施方式,施工对象、施工要求两大类属性作为决策树模型中的判断属性,不同的判断属性组成决策树的根节点及内部节点,判断属性所划分等级为决策树各个分叉;
压路机型号以及初压、复压、终压三个阶段的压路机关键参数作为决策树的决策结果,决策树经各个分叉到达的各个叶节点分别代表一种压路机施工方案,每个施工方案对应决策树的一个叶节点。
作为可选择的实施方式,判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布的具体过程包括:采用Anderson-Darling正态性检验判断分布类型,对样本数据X进行升序排列,采用离散表达式计算经验分布函数与指定分布函数的距离参数,若所述距离参数小于设定的检验临界值,则认为相应变量的分布函数符合正态分布,反之不符合正态分布。
作为可选择的实施方式,对非正态分布数据进行Box—Cox转换的具体过程包括:利用Box—Cox的幂函数转换方法,将非正态分布数据转换为正态分布数据,对非正态分布随机变量X,有变换公式:
其中λ的取值由极大似然估计确定。
作为可选择的实施方式,计算各个判断属性的基尼系统并按序排列,初步形成决策树的具体过程包括:以施工对象及施工要求相关参数每个属性为一个判断属性,基尼系数计算公式为:
其中Gini(X)表示判断属性X某一等级的基尼系数,该等级中共有n个不同案例,p(xk)表示第k个案例在所有等级样本中的频率,依此计算判断属性X中所有等级的基尼系数,并对所有等级的基尼系数按照其样本数进行加权平均,得到该判断属性X的基尼系数;
将其升序排列,基尼系数最高的属性作为最初的根节点,该属性的分级作为根节点延伸出的分叉;
在每个分叉对应的子知识库分别计算剩余属性的基尼系数,基尼系数最低的属性作为根节点分叉后的第一个内部节点,逐步计算,构建决策树过程中按照基尼系数由低至高向下延伸。
作为进一步的限定,若某案例中缺少若干判断属性,则将此案例作为残缺数据进行舍去。
作为可选择的实施方式,所述施工方案中包括压路机型号以及初压、复压、终压三个阶段的压路机关键参数。
一种基于改进决策树的压路机施工工艺知识库构建系统,包括:
数据库构建模块,被配置为根据压路机施工项目已有案例数据,构建压路机施工工艺数据库;
数据转换模块,被配置为判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布,如果是则保持现有数据不变,否则对非正态分布数据进行Box—Cox转换,将其转换为正态分布数据;
决策树模型构建模块,被配置为计算各个判断属性的基尼系统并按序排列,初步形成决策树;
数据逆变换模块,被配置为对决策树中经过Box—Cox转换的数据进行相关逆变换;
决策树模型优化模块,被配置为对逆变换后的决策树进行剪枝优化处理,保证最小实例数大于设定值,形成最终改进后的决策树模型;
参数获取模块,被配置为获取压路机施工对象及施工要求相关参数;
分类分析模块,被配置为根据施工对象及施工要求相关参数,利用改进后的决策树模型进行分类分析,得到压路机施工方案,形成压路机施工工艺知识库。
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行上述方法的步骤。
一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行上述方法的步骤。
与现有技术相比,本发明的有益效果为:
本发明可以根据历史案例数据,从中剖析数据隐含的信息和规律,并对这种暗含规律进行处理利用,减少了工程师的经验参与程度,提高决策流程的合理性和智能性,实现压路机的智能一体化施工,同时,通过对非正态数据进行转换,能够保证压路机施工流程数据能够保证全为正态分布,解决现有决策树的局限性,能够辅助工程师进行压路机施工的决策,形成最终的建议建议施工方案,还可以形成压路机施工工艺知识库,指导实际施工。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明至少一个实施例的流程示意图。
具体实施方式:
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
一种基于改进决策树的压路机施工工艺知识库构建方法,针对压路机施工的大数据分析领域,采用Anderson-Darling正态性检验判断数据库中的各项数据是否为正态分布,若非正态分布,则将数据库中的案例数据中的非正态分布经过Box—Cox转换为正态分布数据。进行基尼系数的计算及排序,形成CART决策树,经由Box—Cox逆变换及剪枝处理形成一个压路机施工工艺知识库,指导实际施工,给出建议施工方案。
如图1所示,以一种典型实施例,介绍方法的具体步骤:
构建压路机施工案例数据库,数据库包含数年积累的海量压路机施工工艺数据,数据库中的案例主要包括施工对象、施工要求、压路机型号、以及初压、复压、终压三个阶段的压路机关键参数。施工对象属性包括土壤类型,施工对象的底长、底宽、深度及放坡系数。其中土壤类型依照土壤分类表分为一类土、二类土、三类土及四类土,施工对象的底长、底宽、深度及放坡系数也分别划分三个等级。施工要求属性包括压实度、平整度、均匀度三个属性,将此三个属性各自分为三个等级。初压、复压、终压三个阶段的压路机关键参数包括三个阶段的振幅、频率、碾压速度及碾压遍数,以上参数各自划分三个等级。
其中施工对象、施工要求两大类属性作为决策树中的判断属性,不同的判断属性组成了决策树的根节点及内部节点,判断属性所划分等级为决策树各个分叉。压路机型号以及初压、复压、终压三个阶段的压路机关键参数作为决策树的决策结果,决策树经各个分叉到达的各个叶节点分别代表一种压路机施工方案,每个施工方案对应决策树的一个叶节点。
判断施工对象和施工要求的各项数据是否为正态分布,如果不是正态分布,生成决策树容易陷入局部最优。采用Anderson-Darling正态性检验判断分布类型,对样本数据X进行升序排列,采用A2代表经验分布函数与指定分布函数的距离参数,本实施例采用离散表达式计算A2,公式如下:
式中,N代表样本数目,Yi是排序数据,F(Yi)是指定分布(这里为标准正态分布)的累积概率分布函数。
现有假设:假设H0:X变量的分布函数符合指定分布;
假设H1:X变量的分布函数不符合指定分布。
在指定显著性水平下,若参数A2小于检验临界值,则接受假设H0,认为X变量的分布函数符合指定分布,即符合正态分布,反之不符合正态分布。
根据样本数量n对A2进行修正,得到检验统计量A*,公式如下:
如果A*超过0.77则拒绝正态性假设,认为非正态分布,反之认为正态分布。因数据量庞大,判断为正态分布采用更宽容的判断标准,检验临界值0.77是一个相对较大的临界值。
若判断为正态分布数据,则保持不变;若判断为非正态分布数据,为避免决策树陷入局部最优,则利用Box—Cox的幂函数转换方法,将非正态分布数据转换为正态分布数据。对非正态分布随机变量X,有变换公式:
其中λ的取值由极大似然估计确定,通过确定合适的λ的取值使Y(λ)服从正态分布,即Y(λ)~N(μ,σ2)。则随机变量X的似然函数为:
为方便计算将似然函数取对数,对数似然函数为:
经对数似然函数转换后,确定均值的估计值:
经对数似然函数转换后,确定标准差的估计值:
将最大似然估计的μ和σ代入似然函数中,可以将λ计算出来。将计算的一系列λ进行正态分布数据的变换,对转换后的数据绘制概率图进行检验,选择概率图中P值最小的λ,完成Box—Cox转换。
压路机施工工艺流程的决策树构建过程如下:计算土壤类型、施工对象的底长、施工对象的底宽、施工对象的深度、施工对象的放坡系数、施工要求的压实度、施工要求的平整度、施工要求的均匀度等共计8个判断属性的基尼系数,基尼系数越低代表纯度越高、数据分类的效果越好,此时8个判断属性中的非正态分布数据已经经过Box—Cox转换为正态分布数据,即所有判断属性此时都是正态分布数据,基尼系数计算公式为:
其中Gini(X)表示判断属性X某一等级的基尼系数,该等级中共有n个不同案例,p(xk)表示第k个案例在所有等级样本中的频率。依此计算判断属性X中所有等级的基尼系数,并对所有等级的基尼系数按照其样本数进行加权平均,得到该判断属性X的基尼系数。
计算基尼系数前应对残缺数据进行缺省值处理,如果某条案例缺少8个判断属性的数据,或者缺少压路机型号的数据,应将本条案例舍去。缺省值处理完成后,计算各属性基尼系数,将其升序排列,基尼系数最高的属性作为最初的根节点,该属性的分级作为根节点延伸出的分叉。根节点判断完成,已经对知识库完成了一次分类。基于这次分类的结果,在每个分叉对应的子知识库分别计算剩余7个属性的基尼系数,基尼系数最低的属性作为根节点分叉后的第一个内部节点。以此类推,逐步计算,构建决策树过程中按照基尼系数由低至高向下延伸。
初步生成的决策树判断中的数据进行了Box—Cox变换,为方便使用决策树,对已经进行了Box—Cox变换的数据进行Box—Cox的逆变换,将正态分布数据重新转换为非正态数据,公式如下:
式中,X为非正态分布数据,Y(λ)为正态分布数据,λ由极大似然估计确定。
Box—Cox逆变换后对策树后进行后剪枝处理。最小实例数要求每个叶子的实例数应大于等于2,最小实例数小于2的叶子应舍去。由此完成对决策树的结果优化,提升了决策树的决策可信度。
生成决策树后,输入压路机施工对象及施工要求各项参数,经决策树进行分类分析,得到相应压路机施工方案,确定压路机型号以及初压、复压、终压三个阶段的压路机关键参数,指导实际施工。
当然,各个施工方案可以形成压路机施工工艺知识库,后期加以利用。
本部分还提供以下产品实施例:
一种基于改进决策树的压路机施工系统,包括:
数据库构建模块,被配置为根据压路机施工项目已有案例数据,构建压路机施工工艺数据库;
数据转换模块,被配置为判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布,如果是则保持现有数据不变,否则对非正态分布数据进行Box—Cox转换,将其转换为正态分布数据;
决策树模型构建模块,被配置为计算各个判断属性的基尼系统并按序排列,初步形成决策树;
数据逆变换模块,被配置为对决策树中经过Box—Cox转换的数据进行相关逆变换;
决策树模型优化模块,被配置为对逆变换后的决策树进行剪枝优化处理,保证最小实例数大于设定值,形成最终改进后的决策树模型;
参数获取模块,被配置为获取压路机施工对象及施工要求相关参数;
分类分析模块,被配置为根据施工对象及施工要求相关参数,利用改进后的决策树模型进行分类分析,得到压路机施工方案。
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行上述方法的步骤。
一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行上述方法的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (10)
1.一种基于改进决策树的压路机施工工艺知识库构建方法,其特征是:包括以下步骤:
根据压路机施工项目已有案例数据,构建压路机施工工艺数据库;
判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布,如果是则保持现有数据不变,否则对非正态分布数据进行Box—Cox转换,将其转换为正态分布数据;
计算各个判断属性的基尼系统并按序排列,初步形成决策树;
对决策树中经过Box—Cox转换的数据进行相关逆变换;
对逆变换后的决策树进行剪枝优化处理,保证最小实例数大于设定值,形成改进后的决策树模型;
获取压路机施工对象及施工要求相关参数;
根据施工对象及施工要求相关参数,利用改进后的决策树模型进行分类分析,得到压路机施工方案,形成压路机施工工艺知识库。
2.如权利要求1所述的一种基于改进决策树的压路机施工工艺知识库构建方法,其特征是:所述压路机施工对象包括土壤类型,施工对象的底长、底宽、深度及放坡系数;
所述压路机施工要求相关参数包括施工要求属性、压路机型号以及初压、复压、终压三个阶段的压路机振幅、频率、碾压速度和碾压遍数,施工要求属性包括压实度、平整度和均匀度。
3.如权利要求1所述的一种基于改进决策树的压路机施工工艺知识库构建方法,其特征是:施工对象、施工要求两大类属性作为决策树模型中的判断属性,不同的判断属性组成决策树的根节点及内部节点,判断属性所划分等级为决策树各个分叉;
压路机型号以及初压、复压、终压三个阶段的压路机关键参数作为决策树的决策结果,决策树经各个分叉到达的各个叶节点分别代表一种压路机施工方案,每个施工方案对应决策树的一个叶节点。
4.如权利要求1所述的一种基于改进决策树的压路机施工工艺知识库构建方法,其特征是:判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布的具体过程包括:采用Anderson-Darling正态性检验判断分布类型,对样本数据X进行升序排列,采用离散表达式计算经验分布函数与指定分布函数的距离参数,若所述距离参数小于设定的检验临界值,则认为相应变量的分布函数符合正态分布,反之不符合正态分布。
6.如权利要求1所述的一种基于改进决策树的压路机施工工艺知识库构建方法,其特征是:计算各个判断属性的基尼系统并按序排列,初步形成决策树的具体过程包括:以施工对象及施工要求相关参数每个属性为一个判断属性,基尼系数计算公式为:
其中Gini(X)表示判断属性X某一等级的基尼系数,该等级中共有n个不同案例,p(xk)表示第k个案例在所有等级样本中的频率,依此计算判断属性X中所有等级的基尼系数,并对所有等级的基尼系数按照其样本数进行加权平均,得到该判断属性X的基尼系数;
将其升序排列,基尼系数最高的属性作为最初的根节点,该属性的分级作为根节点延伸出的分叉;
在每个分叉对应的子知识库分别计算剩余属性的基尼系数,基尼系数最低的属性作为根节点分叉后的第一个内部节点,逐步计算,构建决策树过程中按照基尼系数由低至高向下延伸;
或进一步的,若某案例中缺少若干判断属性,则将此案例作为残缺数据进行舍去。
7.如权利要求1所述的一种基于改进决策树的压路机施工工艺知识库构建方法,其特征是:所述施工方案中包括压路机型号以及初压、复压、终压三个阶段的压路机关键参数。
8.一种基于改进决策树的压路机施工工艺知识库构建系统,其特征是:包括:
数据库构建模块,被配置为根据压路机施工项目已有案例数据,构建压路机施工工艺数据库;
数据转换模块,被配置为判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布,如果是则保持现有数据不变,否则对非正态分布数据进行Box—Cox转换,将其转换为正态分布数据;
决策树模型构建模块,被配置为计算各个判断属性的基尼系统并按序排列,初步形成决策树;
数据逆变换模块,被配置为对决策树中经过Box—Cox转换的数据进行相关逆变换;
决策树模型优化模块,被配置为对逆变换后的决策树进行剪枝优化处理,保证最小实例数大于设定值,形成最终改进后的决策树模型;
参数获取模块,被配置为获取压路机施工对象及施工要求相关参数;
分类分析模块,被配置为根据施工对象及施工要求相关参数,利用改进后的决策树模型进行分类分析,得到压路机施工方案,形成压路机施工工艺知识库。
9.一种计算机可读存储介质,其特征是:其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行权利要求1-7中任一项所述的方法的步骤。
10.一种终端设备,其特征是:包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行权利要求1-7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111273382.1A CN113962158A (zh) | 2021-10-29 | 2021-10-29 | 基于改进决策树的压路机施工工艺知识库构建方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111273382.1A CN113962158A (zh) | 2021-10-29 | 2021-10-29 | 基于改进决策树的压路机施工工艺知识库构建方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113962158A true CN113962158A (zh) | 2022-01-21 |
Family
ID=79468561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111273382.1A Pending CN113962158A (zh) | 2021-10-29 | 2021-10-29 | 基于改进决策树的压路机施工工艺知识库构建方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113962158A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114833455A (zh) * | 2022-05-23 | 2022-08-02 | 喆烯新材(北京)科技有限公司 | 飞秒激光进行轧辊辊面无序微造型的方法、装置及应用 |
CN118470705A (zh) * | 2024-07-11 | 2024-08-09 | 成都理工大学 | 一种基于图像处理的机器视觉检测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102289716A (zh) * | 2011-06-18 | 2011-12-21 | 合肥工业大学 | 智能压路机最佳工作参数的神经网络建模方法 |
CN111626821A (zh) * | 2020-05-26 | 2020-09-04 | 山东大学 | 基于集成特征选择实现客户分类的产品推荐方法及系统 |
WO2020247731A1 (en) * | 2019-06-05 | 2020-12-10 | Mug Life, LLC | Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees |
-
2021
- 2021-10-29 CN CN202111273382.1A patent/CN113962158A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102289716A (zh) * | 2011-06-18 | 2011-12-21 | 合肥工业大学 | 智能压路机最佳工作参数的神经网络建模方法 |
WO2020247731A1 (en) * | 2019-06-05 | 2020-12-10 | Mug Life, LLC | Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees |
CN111626821A (zh) * | 2020-05-26 | 2020-09-04 | 山东大学 | 基于集成特征选择实现客户分类的产品推荐方法及系统 |
Non-Patent Citations (5)
Title |
---|
HI_HEISEN: "决策树", Retrieved from the Internet <URL:https://www.cnblogs.com/guesswhy/p/12882794.html> * |
KWOK.IO: "Anderson Darling 检验", Retrieved from the Internet <URL:https://www.cnblogs.com/yuzukwok/archive/2013/06/06/3121477.html> * |
曹蕾等: "基于决策树的DRGs制度研究", 《应用数学进展》, vol. 08, no. 06, 20 June 2019 (2019-06-20), pages 1 - 5 * |
胡霞光等: "应用遗传算法技术优化路面养护决策", 《公路》, no. 04, 30 April 2002 (2002-04-30), pages 121 - 125 * |
赵鸿铎等: "基于数据挖掘的民用机场水泥道面维护辅助决策模型", 《同济大学学报(自然科学版)》, vol. 46, no. 12, 31 December 2018 (2018-12-31), pages 0 - 6 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114833455A (zh) * | 2022-05-23 | 2022-08-02 | 喆烯新材(北京)科技有限公司 | 飞秒激光进行轧辊辊面无序微造型的方法、装置及应用 |
CN114833455B (zh) * | 2022-05-23 | 2024-02-23 | 荣烯新材(北京)科技有限公司 | 飞秒激光进行轧辊辊面无序微造型的方法、装置及应用 |
CN118470705A (zh) * | 2024-07-11 | 2024-08-09 | 成都理工大学 | 一种基于图像处理的机器视觉检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109587713B (zh) | 一种基于arima模型的网络指标预测方法、装置及存储介质 | |
CN105512799B (zh) | 一种基于海量在线历史数据的电力系统暂态稳定评估方法 | |
CN109711609B (zh) | 基于小波变换和极限学习机的光伏电站输出功率预测方法 | |
CN107506865B (zh) | 一种基于lssvm优化的负荷预测方法及系统 | |
CN113962158A (zh) | 基于改进决策树的压路机施工工艺知识库构建方法及系统 | |
CN107038167A (zh) | 基于模型评估的大数据挖掘分析系统及其分析方法 | |
CN104865827A (zh) | 一种基于多工况模型的抽油机采油优化方法 | |
CN110210654A (zh) | 产品模型设计系统及方法 | |
CN113095511A (zh) | 一种在自动化主站实现操作到位的判断方法及装置 | |
CN110059938B (zh) | 一种基于关联规则驱动的配电网规划方法 | |
CN117151543A (zh) | 一种基于机器学习的工程项目质量管理方法及相关装置 | |
CN118014373A (zh) | 一种基于数据质量监测的风险识别模型及其构建方法 | |
CN109840335A (zh) | 基于强化t-s模糊神经网络的径向锻造凹坑预测优化方法 | |
CN111522705A (zh) | 一种工业大数据智能运维解决方法 | |
CN113610268A (zh) | 一种基于居住区空间形态的碳排放量预测方法 | |
CN113393051A (zh) | 基于深度迁移学习的配电网投资决策方法 | |
CN110956675B (zh) | 技术成熟度曲线自动生成方法及装置 | |
CN112967154B (zh) | 一种电力系统Well-being的评估方法及装置 | |
CN115809732A (zh) | 一种分布式光伏发电功率预测方法及系统 | |
CN114548739A (zh) | 一种变电站防汛风险组合评估方法 | |
CN112348275A (zh) | 一种基于在线增量学习的区域生态环境变化预测方法 | |
CN111898666A (zh) | 一种随机森林算法结合模群种群的数据变量选择方法 | |
CN117435308B (zh) | 一种基于并行计算算法的Modelica模型仿真方法及系统 | |
CN113822470B (zh) | 计及新能源场站出力不确定性的出力数据生成方法及系统 | |
CN115146543A (zh) | 一种轻质化结构产品可靠性优化设计方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |