CN113962158A - 基于改进决策树的压路机施工工艺知识库构建方法及系统 - Google Patents

基于改进决策树的压路机施工工艺知识库构建方法及系统 Download PDF

Info

Publication number
CN113962158A
CN113962158A CN202111273382.1A CN202111273382A CN113962158A CN 113962158 A CN113962158 A CN 113962158A CN 202111273382 A CN202111273382 A CN 202111273382A CN 113962158 A CN113962158 A CN 113962158A
Authority
CN
China
Prior art keywords
construction
road roller
decision tree
data
normal distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111273382.1A
Other languages
English (en)
Inventor
闫伟
袁子洋
胡滨
纪嘉树
吴凡
王俊博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202111273382.1A priority Critical patent/CN113962158A/zh
Publication of CN113962158A publication Critical patent/CN113962158A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了基于改进决策树的压路机施工工艺知识库构建方法及系统,根据压路机施工项目已有案例数据,构建压路机施工工艺数据库;判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布,如果是则保持现有数据不变,否则对非正态分布数据进行转换,将其转换为正态分布数据;计算各个判断属性的基尼系统并按序排列,初步形成决策树;对决策树中经过转换的数据进行逆变换;对逆变换后的决策树进行剪枝优化处理,形成最终改进后的决策树模型;利用改进后的决策树模型对实际数据进行分类分析,得到压路机施工方案。本发明能够保证压路机施工流程数据能够保证全为正态分布,解决现有决策树的局限性,能够辅助工程师进行压路机施工的决策。

Description

基于改进决策树的压路机施工工艺知识库构建方法及系统
技术领域
本发明属于压路机施工技术领域,具体涉及基于改进决策树的压路机施工工艺知识库构建方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
近年来随着大数据时代的降临,土建工程行业迎来了新的机遇和挑战。传统的施工决策方式流程繁琐,耗费了人力物力。科研工作者开始尝试采用新技术来简化决策过程,以达到准确快速地确定工艺流程的目的。
土建行业确定压路机施工流程的各项工艺及参数的传统方式流程繁琐,并且较为依赖工程师的经验,主观性较强。每一个参数的确定都要查阅相关资料,进而由工程师统筹决定,并不利于具体施工的开展,容易延误工期或造车错误施工。
目前虽然有部分研究学者通过决策树利用数据生成决策,但决策树对于非正态数据的处理有自身的局限性,易陷入局部最优,而压路机施工流程数据很难保证全为正态分布,存在很大的局限性。
发明内容
本发明为了解决上述问题,提出基于改进决策树的压路机施工工艺知识库构建方法及系统,本发明能够保证压路机施工流程数据能够保证全为正态分布,解决现有决策树的局限性,能够辅助工程师进行压路机施工的决策。
根据一些实施例,本发明采用如下技术方案:
一种基于改进决策树的压路机施工工艺知识库构建方法,包括以下步骤:
根据压路机施工项目已有案例数据,构建压路机施工工艺数据库;
判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布,如果是则保持现有数据不变,否则对非正态分布数据进行Box—Cox转换,将其转换为正态分布数据;
计算各个判断属性的基尼系统并按序排列,初步形成决策树;
对决策树中经过Box—Cox转换的数据进行相关逆变换;
对逆变换后的决策树进行剪枝优化处理,保证最小实例数大于设定值,形成改进后的决策树模型;
获取压路机施工对象及施工要求相关参数;
根据施工对象及施工要求相关参数,利用改进后的决策树模型进行分类分析,得到压路机施工方案,形成压路机施工工艺知识库。
作为可选择的实施方式,所述压路机施工对象包括土壤类型,施工对象的底长、底宽、深度及放坡系数。
作为可选择的实施方式,所述压路机施工要求相关参数包括施工要求属性、压路机型号以及初压、复压、终压三个阶段的压路机振幅、频率、碾压速度和碾压遍数,施工要求属性包括压实度、平整度和均匀度。
作为可选择的实施方式,施工对象、施工要求两大类属性作为决策树模型中的判断属性,不同的判断属性组成决策树的根节点及内部节点,判断属性所划分等级为决策树各个分叉;
压路机型号以及初压、复压、终压三个阶段的压路机关键参数作为决策树的决策结果,决策树经各个分叉到达的各个叶节点分别代表一种压路机施工方案,每个施工方案对应决策树的一个叶节点。
作为可选择的实施方式,判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布的具体过程包括:采用Anderson-Darling正态性检验判断分布类型,对样本数据X进行升序排列,采用离散表达式计算经验分布函数与指定分布函数的距离参数,若所述距离参数小于设定的检验临界值,则认为相应变量的分布函数符合正态分布,反之不符合正态分布。
作为可选择的实施方式,对非正态分布数据进行Box—Cox转换的具体过程包括:利用Box—Cox的幂函数转换方法,将非正态分布数据转换为正态分布数据,对非正态分布随机变量X,有变换公式:
Figure BDA0003328557600000031
其中λ的取值由极大似然估计确定。
作为可选择的实施方式,计算各个判断属性的基尼系统并按序排列,初步形成决策树的具体过程包括:以施工对象及施工要求相关参数每个属性为一个判断属性,基尼系数计算公式为:
Figure BDA0003328557600000041
其中Gini(X)表示判断属性X某一等级的基尼系数,该等级中共有n个不同案例,p(xk)表示第k个案例在所有等级样本中的频率,依此计算判断属性X中所有等级的基尼系数,并对所有等级的基尼系数按照其样本数进行加权平均,得到该判断属性X的基尼系数;
将其升序排列,基尼系数最高的属性作为最初的根节点,该属性的分级作为根节点延伸出的分叉;
在每个分叉对应的子知识库分别计算剩余属性的基尼系数,基尼系数最低的属性作为根节点分叉后的第一个内部节点,逐步计算,构建决策树过程中按照基尼系数由低至高向下延伸。
作为进一步的限定,若某案例中缺少若干判断属性,则将此案例作为残缺数据进行舍去。
作为可选择的实施方式,所述施工方案中包括压路机型号以及初压、复压、终压三个阶段的压路机关键参数。
一种基于改进决策树的压路机施工工艺知识库构建系统,包括:
数据库构建模块,被配置为根据压路机施工项目已有案例数据,构建压路机施工工艺数据库;
数据转换模块,被配置为判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布,如果是则保持现有数据不变,否则对非正态分布数据进行Box—Cox转换,将其转换为正态分布数据;
决策树模型构建模块,被配置为计算各个判断属性的基尼系统并按序排列,初步形成决策树;
数据逆变换模块,被配置为对决策树中经过Box—Cox转换的数据进行相关逆变换;
决策树模型优化模块,被配置为对逆变换后的决策树进行剪枝优化处理,保证最小实例数大于设定值,形成最终改进后的决策树模型;
参数获取模块,被配置为获取压路机施工对象及施工要求相关参数;
分类分析模块,被配置为根据施工对象及施工要求相关参数,利用改进后的决策树模型进行分类分析,得到压路机施工方案,形成压路机施工工艺知识库。
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行上述方法的步骤。
一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行上述方法的步骤。
与现有技术相比,本发明的有益效果为:
本发明可以根据历史案例数据,从中剖析数据隐含的信息和规律,并对这种暗含规律进行处理利用,减少了工程师的经验参与程度,提高决策流程的合理性和智能性,实现压路机的智能一体化施工,同时,通过对非正态数据进行转换,能够保证压路机施工流程数据能够保证全为正态分布,解决现有决策树的局限性,能够辅助工程师进行压路机施工的决策,形成最终的建议建议施工方案,还可以形成压路机施工工艺知识库,指导实际施工。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明至少一个实施例的流程示意图。
具体实施方式:
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
一种基于改进决策树的压路机施工工艺知识库构建方法,针对压路机施工的大数据分析领域,采用Anderson-Darling正态性检验判断数据库中的各项数据是否为正态分布,若非正态分布,则将数据库中的案例数据中的非正态分布经过Box—Cox转换为正态分布数据。进行基尼系数的计算及排序,形成CART决策树,经由Box—Cox逆变换及剪枝处理形成一个压路机施工工艺知识库,指导实际施工,给出建议施工方案。
如图1所示,以一种典型实施例,介绍方法的具体步骤:
构建压路机施工案例数据库,数据库包含数年积累的海量压路机施工工艺数据,数据库中的案例主要包括施工对象、施工要求、压路机型号、以及初压、复压、终压三个阶段的压路机关键参数。施工对象属性包括土壤类型,施工对象的底长、底宽、深度及放坡系数。其中土壤类型依照土壤分类表分为一类土、二类土、三类土及四类土,施工对象的底长、底宽、深度及放坡系数也分别划分三个等级。施工要求属性包括压实度、平整度、均匀度三个属性,将此三个属性各自分为三个等级。初压、复压、终压三个阶段的压路机关键参数包括三个阶段的振幅、频率、碾压速度及碾压遍数,以上参数各自划分三个等级。
其中施工对象、施工要求两大类属性作为决策树中的判断属性,不同的判断属性组成了决策树的根节点及内部节点,判断属性所划分等级为决策树各个分叉。压路机型号以及初压、复压、终压三个阶段的压路机关键参数作为决策树的决策结果,决策树经各个分叉到达的各个叶节点分别代表一种压路机施工方案,每个施工方案对应决策树的一个叶节点。
判断施工对象和施工要求的各项数据是否为正态分布,如果不是正态分布,生成决策树容易陷入局部最优。采用Anderson-Darling正态性检验判断分布类型,对样本数据X进行升序排列,采用A2代表经验分布函数与指定分布函数的距离参数,本实施例采用离散表达式计算A2,公式如下:
Figure BDA0003328557600000081
式中,N代表样本数目,Yi是排序数据,F(Yi)是指定分布(这里为标准正态分布)的累积概率分布函数。
现有假设:假设H0:X变量的分布函数符合指定分布;
假设H1:X变量的分布函数不符合指定分布。
在指定显著性水平下,若参数A2小于检验临界值,则接受假设H0,认为X变量的分布函数符合指定分布,即符合正态分布,反之不符合正态分布。
根据样本数量n对A2进行修正,得到检验统计量A*,公式如下:
Figure BDA0003328557600000082
如果A*超过0.77则拒绝正态性假设,认为非正态分布,反之认为正态分布。因数据量庞大,判断为正态分布采用更宽容的判断标准,检验临界值0.77是一个相对较大的临界值。
若判断为正态分布数据,则保持不变;若判断为非正态分布数据,为避免决策树陷入局部最优,则利用Box—Cox的幂函数转换方法,将非正态分布数据转换为正态分布数据。对非正态分布随机变量X,有变换公式:
Figure BDA0003328557600000091
其中λ的取值由极大似然估计确定,通过确定合适的λ的取值使Y(λ)服从正态分布,即Y(λ)~N(μ,σ2)。则随机变量X的似然函数为:
Figure BDA0003328557600000092
为方便计算将似然函数取对数,对数似然函数为:
Figure BDA0003328557600000093
经对数似然函数转换后,确定均值的估计值:
Figure BDA0003328557600000094
经对数似然函数转换后,确定标准差的估计值:
Figure BDA0003328557600000095
将最大似然估计的μ和σ代入似然函数中,可以将λ计算出来。将计算的一系列λ进行正态分布数据的变换,对转换后的数据绘制概率图进行检验,选择概率图中P值最小的λ,完成Box—Cox转换。
压路机施工工艺流程的决策树构建过程如下:计算土壤类型、施工对象的底长、施工对象的底宽、施工对象的深度、施工对象的放坡系数、施工要求的压实度、施工要求的平整度、施工要求的均匀度等共计8个判断属性的基尼系数,基尼系数越低代表纯度越高、数据分类的效果越好,此时8个判断属性中的非正态分布数据已经经过Box—Cox转换为正态分布数据,即所有判断属性此时都是正态分布数据,基尼系数计算公式为:
Figure BDA0003328557600000101
其中Gini(X)表示判断属性X某一等级的基尼系数,该等级中共有n个不同案例,p(xk)表示第k个案例在所有等级样本中的频率。依此计算判断属性X中所有等级的基尼系数,并对所有等级的基尼系数按照其样本数进行加权平均,得到该判断属性X的基尼系数。
计算基尼系数前应对残缺数据进行缺省值处理,如果某条案例缺少8个判断属性的数据,或者缺少压路机型号的数据,应将本条案例舍去。缺省值处理完成后,计算各属性基尼系数,将其升序排列,基尼系数最高的属性作为最初的根节点,该属性的分级作为根节点延伸出的分叉。根节点判断完成,已经对知识库完成了一次分类。基于这次分类的结果,在每个分叉对应的子知识库分别计算剩余7个属性的基尼系数,基尼系数最低的属性作为根节点分叉后的第一个内部节点。以此类推,逐步计算,构建决策树过程中按照基尼系数由低至高向下延伸。
初步生成的决策树判断中的数据进行了Box—Cox变换,为方便使用决策树,对已经进行了Box—Cox变换的数据进行Box—Cox的逆变换,将正态分布数据重新转换为非正态数据,公式如下:
Figure BDA0003328557600000111
式中,X为非正态分布数据,Y(λ)为正态分布数据,λ由极大似然估计确定。
Box—Cox逆变换后对策树后进行后剪枝处理。最小实例数要求每个叶子的实例数应大于等于2,最小实例数小于2的叶子应舍去。由此完成对决策树的结果优化,提升了决策树的决策可信度。
生成决策树后,输入压路机施工对象及施工要求各项参数,经决策树进行分类分析,得到相应压路机施工方案,确定压路机型号以及初压、复压、终压三个阶段的压路机关键参数,指导实际施工。
当然,各个施工方案可以形成压路机施工工艺知识库,后期加以利用。
本部分还提供以下产品实施例:
一种基于改进决策树的压路机施工系统,包括:
数据库构建模块,被配置为根据压路机施工项目已有案例数据,构建压路机施工工艺数据库;
数据转换模块,被配置为判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布,如果是则保持现有数据不变,否则对非正态分布数据进行Box—Cox转换,将其转换为正态分布数据;
决策树模型构建模块,被配置为计算各个判断属性的基尼系统并按序排列,初步形成决策树;
数据逆变换模块,被配置为对决策树中经过Box—Cox转换的数据进行相关逆变换;
决策树模型优化模块,被配置为对逆变换后的决策树进行剪枝优化处理,保证最小实例数大于设定值,形成最终改进后的决策树模型;
参数获取模块,被配置为获取压路机施工对象及施工要求相关参数;
分类分析模块,被配置为根据施工对象及施工要求相关参数,利用改进后的决策树模型进行分类分析,得到压路机施工方案。
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行上述方法的步骤。
一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行上述方法的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种基于改进决策树的压路机施工工艺知识库构建方法,其特征是:包括以下步骤:
根据压路机施工项目已有案例数据,构建压路机施工工艺数据库;
判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布,如果是则保持现有数据不变,否则对非正态分布数据进行Box—Cox转换,将其转换为正态分布数据;
计算各个判断属性的基尼系统并按序排列,初步形成决策树;
对决策树中经过Box—Cox转换的数据进行相关逆变换;
对逆变换后的决策树进行剪枝优化处理,保证最小实例数大于设定值,形成改进后的决策树模型;
获取压路机施工对象及施工要求相关参数;
根据施工对象及施工要求相关参数,利用改进后的决策树模型进行分类分析,得到压路机施工方案,形成压路机施工工艺知识库。
2.如权利要求1所述的一种基于改进决策树的压路机施工工艺知识库构建方法,其特征是:所述压路机施工对象包括土壤类型,施工对象的底长、底宽、深度及放坡系数;
所述压路机施工要求相关参数包括施工要求属性、压路机型号以及初压、复压、终压三个阶段的压路机振幅、频率、碾压速度和碾压遍数,施工要求属性包括压实度、平整度和均匀度。
3.如权利要求1所述的一种基于改进决策树的压路机施工工艺知识库构建方法,其特征是:施工对象、施工要求两大类属性作为决策树模型中的判断属性,不同的判断属性组成决策树的根节点及内部节点,判断属性所划分等级为决策树各个分叉;
压路机型号以及初压、复压、终压三个阶段的压路机关键参数作为决策树的决策结果,决策树经各个分叉到达的各个叶节点分别代表一种压路机施工方案,每个施工方案对应决策树的一个叶节点。
4.如权利要求1所述的一种基于改进决策树的压路机施工工艺知识库构建方法,其特征是:判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布的具体过程包括:采用Anderson-Darling正态性检验判断分布类型,对样本数据X进行升序排列,采用离散表达式计算经验分布函数与指定分布函数的距离参数,若所述距离参数小于设定的检验临界值,则认为相应变量的分布函数符合正态分布,反之不符合正态分布。
5.如权利要求1所述的一种基于改进决策树的压路机施工工艺知识库构建方法,其特征是:对非正态分布数据进行Box—Cox转换的具体过程包括:利用Box—Cox的幂函数转换方法,将非正态分布数据转换为正态分布数据,对非正态分布随机变量X,有变换公式:
Figure FDA0003328557590000021
其中λ的取值由极大似然估计确定。
6.如权利要求1所述的一种基于改进决策树的压路机施工工艺知识库构建方法,其特征是:计算各个判断属性的基尼系统并按序排列,初步形成决策树的具体过程包括:以施工对象及施工要求相关参数每个属性为一个判断属性,基尼系数计算公式为:
Figure FDA0003328557590000031
其中Gini(X)表示判断属性X某一等级的基尼系数,该等级中共有n个不同案例,p(xk)表示第k个案例在所有等级样本中的频率,依此计算判断属性X中所有等级的基尼系数,并对所有等级的基尼系数按照其样本数进行加权平均,得到该判断属性X的基尼系数;
将其升序排列,基尼系数最高的属性作为最初的根节点,该属性的分级作为根节点延伸出的分叉;
在每个分叉对应的子知识库分别计算剩余属性的基尼系数,基尼系数最低的属性作为根节点分叉后的第一个内部节点,逐步计算,构建决策树过程中按照基尼系数由低至高向下延伸;
或进一步的,若某案例中缺少若干判断属性,则将此案例作为残缺数据进行舍去。
7.如权利要求1所述的一种基于改进决策树的压路机施工工艺知识库构建方法,其特征是:所述施工方案中包括压路机型号以及初压、复压、终压三个阶段的压路机关键参数。
8.一种基于改进决策树的压路机施工工艺知识库构建系统,其特征是:包括:
数据库构建模块,被配置为根据压路机施工项目已有案例数据,构建压路机施工工艺数据库;
数据转换模块,被配置为判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布,如果是则保持现有数据不变,否则对非正态分布数据进行Box—Cox转换,将其转换为正态分布数据;
决策树模型构建模块,被配置为计算各个判断属性的基尼系统并按序排列,初步形成决策树;
数据逆变换模块,被配置为对决策树中经过Box—Cox转换的数据进行相关逆变换;
决策树模型优化模块,被配置为对逆变换后的决策树进行剪枝优化处理,保证最小实例数大于设定值,形成最终改进后的决策树模型;
参数获取模块,被配置为获取压路机施工对象及施工要求相关参数;
分类分析模块,被配置为根据施工对象及施工要求相关参数,利用改进后的决策树模型进行分类分析,得到压路机施工方案,形成压路机施工工艺知识库。
9.一种计算机可读存储介质,其特征是:其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行权利要求1-7中任一项所述的方法的步骤。
10.一种终端设备,其特征是:包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行权利要求1-7中任一项所述的方法的步骤。
CN202111273382.1A 2021-10-29 2021-10-29 基于改进决策树的压路机施工工艺知识库构建方法及系统 Pending CN113962158A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111273382.1A CN113962158A (zh) 2021-10-29 2021-10-29 基于改进决策树的压路机施工工艺知识库构建方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111273382.1A CN113962158A (zh) 2021-10-29 2021-10-29 基于改进决策树的压路机施工工艺知识库构建方法及系统

Publications (1)

Publication Number Publication Date
CN113962158A true CN113962158A (zh) 2022-01-21

Family

ID=79468561

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111273382.1A Pending CN113962158A (zh) 2021-10-29 2021-10-29 基于改进决策树的压路机施工工艺知识库构建方法及系统

Country Status (1)

Country Link
CN (1) CN113962158A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114833455A (zh) * 2022-05-23 2022-08-02 喆烯新材(北京)科技有限公司 飞秒激光进行轧辊辊面无序微造型的方法、装置及应用
CN118470705A (zh) * 2024-07-11 2024-08-09 成都理工大学 一种基于图像处理的机器视觉检测方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102289716A (zh) * 2011-06-18 2011-12-21 合肥工业大学 智能压路机最佳工作参数的神经网络建模方法
CN111626821A (zh) * 2020-05-26 2020-09-04 山东大学 基于集成特征选择实现客户分类的产品推荐方法及系统
WO2020247731A1 (en) * 2019-06-05 2020-12-10 Mug Life, LLC Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102289716A (zh) * 2011-06-18 2011-12-21 合肥工业大学 智能压路机最佳工作参数的神经网络建模方法
WO2020247731A1 (en) * 2019-06-05 2020-12-10 Mug Life, LLC Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees
CN111626821A (zh) * 2020-05-26 2020-09-04 山东大学 基于集成特征选择实现客户分类的产品推荐方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
HI_HEISEN: "决策树", Retrieved from the Internet <URL:https://www.cnblogs.com/guesswhy/p/12882794.html> *
KWOK.IO: "Anderson Darling 检验", Retrieved from the Internet <URL:https://www.cnblogs.com/yuzukwok/archive/2013/06/06/3121477.html> *
曹蕾等: "基于决策树的DRGs制度研究", 《应用数学进展》, vol. 08, no. 06, 20 June 2019 (2019-06-20), pages 1 - 5 *
胡霞光等: "应用遗传算法技术优化路面养护决策", 《公路》, no. 04, 30 April 2002 (2002-04-30), pages 121 - 125 *
赵鸿铎等: "基于数据挖掘的民用机场水泥道面维护辅助决策模型", 《同济大学学报(自然科学版)》, vol. 46, no. 12, 31 December 2018 (2018-12-31), pages 0 - 6 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114833455A (zh) * 2022-05-23 2022-08-02 喆烯新材(北京)科技有限公司 飞秒激光进行轧辊辊面无序微造型的方法、装置及应用
CN114833455B (zh) * 2022-05-23 2024-02-23 荣烯新材(北京)科技有限公司 飞秒激光进行轧辊辊面无序微造型的方法、装置及应用
CN118470705A (zh) * 2024-07-11 2024-08-09 成都理工大学 一种基于图像处理的机器视觉检测方法及系统

Similar Documents

Publication Publication Date Title
CN105512799B (zh) 一种基于海量在线历史数据的电力系统暂态稳定评估方法
CN107506865B (zh) 一种基于lssvm优化的负荷预测方法及系统
CN113962158A (zh) 基于改进决策树的压路机施工工艺知识库构建方法及系统
CN107038167A (zh) 基于模型评估的大数据挖掘分析系统及其分析方法
CN104865827A (zh) 一种基于多工况模型的抽油机采油优化方法
CN110210654A (zh) 产品模型设计系统及方法
CN110826237A (zh) 基于贝叶斯信念网络的风电设备可靠性分析方法及装置
CN113095511A (zh) 一种在自动化主站实现操作到位的判断方法及装置
CN110059938B (zh) 一种基于关联规则驱动的配电网规划方法
CN117151543A (zh) 一种基于机器学习的工程项目质量管理方法及相关装置
CN109840335A (zh) 基于强化t-s模糊神经网络的径向锻造凹坑预测优化方法
CN113505818A (zh) 改进决策树算法的熔铝炉能耗异常诊断方法和系统及设备
CN113610268A (zh) 一种基于居住区空间形态的碳排放量预测方法
CN113393051A (zh) 基于深度迁移学习的配电网投资决策方法
CN110956675B (zh) 技术成熟度曲线自动生成方法及装置
CN109743200B (zh) 基于资源特征的云计算平台计算任务成本预测方法及系统
CN111522705A (zh) 一种工业大数据智能运维解决方法
CN112967154B (zh) 一种电力系统Well-being的评估方法及装置
CN115809732A (zh) 一种分布式光伏发电功率预测方法及系统
CN114548739A (zh) 一种变电站防汛风险组合评估方法
CN114417918A (zh) 一种风电场信号特征提取及去噪优化数据的方法
CN112348275A (zh) 一种基于在线增量学习的区域生态环境变化预测方法
CN111898666A (zh) 一种随机森林算法结合模群种群的数据变量选择方法
CN117435308B (zh) 一种基于并行计算算法的Modelica模型仿真方法及系统
CN113822470B (zh) 计及新能源场站出力不确定性的出力数据生成方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination