CN104809477A - 一种基于几何语义的遗传规划分类方法 - Google Patents

一种基于几何语义的遗传规划分类方法 Download PDF

Info

Publication number
CN104809477A
CN104809477A CN201510240788.8A CN201510240788A CN104809477A CN 104809477 A CN104809477 A CN 104809477A CN 201510240788 A CN201510240788 A CN 201510240788A CN 104809477 A CN104809477 A CN 104809477A
Authority
CN
China
Prior art keywords
formula
individual
sorter
geometry
individuality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510240788.8A
Other languages
English (en)
Other versions
CN104809477B (zh
Inventor
许军才
任青文
张卫东
沈振中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN201510240788.8A priority Critical patent/CN104809477B/zh
Publication of CN104809477A publication Critical patent/CN104809477A/zh
Application granted granted Critical
Publication of CN104809477B publication Critical patent/CN104809477B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于几何语义的遗传规划分类方法,通过对训练过程和预测过程的分离,完成被测试样本的分类;所述训练过程,通过几何语义求解最优个体,并提取该最优个体的分类器公式,将最优个体的分类器公式存储在磁盘中;所述预测过程,调用训练过程中存储在磁盘中的最优个体的分类器公式,通过加载与计算恢复出分类器公式,根据分类器公式输出分类结果,进而实现对个体的分类。克服了现有遗传规划算法中存在收敛过早和分类准确率低等问题,分类的准确率高,且个体公式可以存储。

Description

一种基于几何语义的遗传规划分类方法
技术领域
本发明属于人工智能的技术领域,具体涉及一种基于几何语义的遗传规划分类方法。
背景技术
遗传算法是进化算法中最成熟一种算法,自Holland教授提出后,由于该算法是一种通用算法,被人们广泛应用于工业技术中,成为现代智能计算中的一项关键技术。美国学者Koza在遗传算法基础上,提出了遗传规划算法,通过层状树结构表示问题的特征,按照遗传算法的思想进化,遗传规划算法较遗传算法具有更广的适用性,由于其通用性和鲁棒性好,搜索能力强,在人工智能、结构优化设计、复杂系统分析得到广泛应用。但也存在一系列问题,由于算法收敛过早,算法进化计算规模过大等问题。近年来,人们通过语义的方式处理遗传规划过程中的进化策略,例如通过几何语义进化策略改善算法的性能,预测高性能混凝土强度及生物医药的配制效果预测等方面,并取得了很好的预测效果。以上这些算法一般都是针对回归分析中的预测问题,但对于样本的分类研究尚未见到相关报道。另一方面通过几何语义得出的计算公式规模呈现爆炸性的增长,Sn~2n*I(其中Sn公式规模,I为第一代公式规模,n为进化的代数),虽然有人直接将数值替代表达式的方式解决计算公式规模膨胀带来的难题,但另一方面由于放弃保留公式后,去掉了遗传规划算法最具代表性的优点,使得每次预测中必须重新训练样本。
发明内容
本发明为了解决现有技术中存在的上述缺陷和不足,提供了一种基于几何语义的遗传规划分类方法,克服了现有遗传规划算法中存在收敛过早和分类准确率低等问题,分类的准确率高,且个体公式可以存储。
为解决上述技术问题,本发明提供一种基于几何语义的遗传规划分类方法,通过对训练过程和预测过程的分离,完成被测试样本的分类;
所述训练过程,通过几何语义求解最优个体,并提取该最优个体的分类器公式,将最优个体的分类器公式存储在磁盘中;
所述预测过程,调用训练过程中存储在磁盘中的最优个体的分类器公式,通过加载与计算恢复出分类器公式,根据分类器公式输出分类结果,进而实现对个体的分类。
其中,所述训练过程包括以下步骤:
1.1初始化过程,根据函数集和终结点集构成个体,然后由个体生成初始化群体;群体中的个体采用层状计算机程序表达,具体由函数集F和终止符集T组成;
函数集F包含n个函数:
F={fi/fi=f1,f2,…,fn}
其中,fi为+,-,×,÷数学运算符号或标准数学函数,所述数学运算符号包含+,-,×,÷,所述标准数学函数包含sin,cos,log,exp;
终止符集T包含m个终止符:
T={ti/ti=t1,t2,…,tn}
其中,ti为变量或常量;
1.2通过计算每个个体的输出值BJx,确定分类器中各类别的边界值,边界值的确定方法为中心动态边界法,具体表达式为:
       BJ x = Σ m = 1 Tr Σ n = 1 P num Dout xmn TR * P num
其中,TR为训练集样本总数,Pnum为种群个体总数,Doutxmn为个体计算值,x为训练集中样本类别号;
1.3计算每个个体的适应度fitness,计算公式为:
       fitness = 1 - R num S num
其中,Rnum为个体分类正确的次数,Snum为训练样本个数;
1.4遗传操作,遗传操作包括父体的复制、交换、变异操作,交换操作生成的个体TC与变异操作生成的个体TM是父体通过几何语义方式产生的,分别表示为:
Tc=(T1·TR)+(1-TR)·T2
式中,T1,T2为两父体,TR真随机函数;
TM=T+ms·(TR1-TR2)
式中,T为父体,TR1,TR2表示两真随机函数,ms变异系数;
1.5判断个体是否达到最大迭代次数;若未达到,则重复步骤1.2-1.4;从达到最大迭代次数的个体中筛选出最大适应度个体作为最优个体,并提取该最优个体的分类器公式,将分类器公式存储在磁盘上,训练过程结束。
步骤1.2中,边界值的确定方法还包括静态边界法。
步骤1.3中,适应度的度量方法包括原始适应度、标准适应度和归一化适应度等。
步骤1.5中,最优个体分类器公式存储过程中,分别记录交换操作和变异操作过程的信息,通过5位16进制数记录随机公式,记录出现的节点,将最优个人的将分类器公式存储为分类器公式输出文件。
所述预测过程包括以下步骤:
2.1初始化计算过程,读取个体数据,并检个体数据的正确性;
2.2对分类器公式进行加载,通过循环调用加载公式,从存储于磁盘的16进制数据的信息中恢复出最优个体的分类器公式;
2.3分类计算,通过加载出的分类器公式对预测集中的每条记录进行计算,输出分类结果。
本发明所达到的有益技术效果:本发明采用几何语义方式表示遗传规划算法进化策略,实现对群体交叉和变异过程的计算,完成对测试样本的分类。分类的准确率高,且个体的分类器公式可以存储。
附图说明
图1本发明训练过程的流程示意图;
图2本发明预测过程的流程示意图。
具体实施方式
为了审查员能更好的了解本发明的技术特征、技术内容及其达到的技术效果,现将本发明的附图结合实施例进行更详细的说明。然而,所示附图,只是为了更好的说明本发明的技术方案,所以,请审查员不要就附图限制本发明的权利要求保护范围。
下面结合附图和实施例对本发明专利进一步说明。
如图1-2所示,本发明提供一种基于几何语义的遗传规划分类方法,通过对训练过程和预测过程的分离,完成被测试样本的分类;
一,训练过程,通过几何语义求解最优个体,并提取该最优个体的分类器公式,将最优个体的分类器公式存储在磁盘中,具体过程如下:
1.1初始化过程,根据函数集和终结点集构成个体,然后由个体生成初始化群体M;群体中的个体采用层状计算机程序表达,具体由函数集F和终止符集T组成;
函数集F包含n个函数:
F={fi/fi=f1,f2,…,fn}
其中,fi为+,-,×,÷数学运算符号或标准数学函数,所述数学运算符号包含+,-,×,÷,所述标准数学函数包含sin,cos,log,exp;
终止符集T包含m个终止符:
T={ti/ti=t1,t2,…,tn}
其中,ti为变量或常量。
1.2通过计算每个个体的输出值BJx,确定分类器中各类别的边界值,边界值的确定方法为中心动态边界法,具体表达式为:
       BJ x = Σ m = 1 Tr Σ n = 1 P num Dout xmn TR * P num
其中,TR为训练集样本总数,Pnum为种群个体总数,Doutxmn为个体计算值,x为训练集中样本类别号;
边界值的确定方法还包括静态边界法。
1.3计算每个个体的适应度fitness,适应度的度量方法包括原始适应度、标准适应度和归一化适应度,本发明适应度fitness的计算公式为:
       fitness = 1 - R num S num
其中,Rnum为个体分类正确的次数,Snum为训练样本个数;
1.4遗传操作,遗传操作包括父体的复制、交换、变异操作,交换操作生成的个体TC与变异操作生成的个体TM是父体通过几何语义方式产生的,分别表示为:
Tc=(T1·TR)+(1-TR)·T2
式中,T1,T2为两父体,TR真随机函数;
TM=T+ms·(TR1-TR2)
式中,T为父体,TR1,TR2表示两真随机函数,ms变异系数。
1.5判断个体是否达到最大迭代次数;若未达到,则重复步骤1.2-1.4;从达到最大迭代次数的个体中筛选出最大适应度个体作为最优个体,并提取该最优个体的分类器公式,将分类器公式存储在磁盘上,训练过程结束;
最优个体分类器公式存储过程中,分别记录交换操作和变异操作过程的信息,通过5位16进制数记录随机公式,记录出现的节点,将最优个人的将分类器公式存储为分类器公式输出文件。
二,预测过程,调用训练过程中存储在磁盘中的最优个体的分类器公式,通过加载与计算恢复出分类器公式,根据分类器公式输出分类结果,进而实现对个体的分类,具体过程如下:
2.1初始化计算过程,读取个体数据,并检个体数据的正确性;
2.2对分类器公式进行加载,通过循环调用加载公式,从存储于磁盘的16进制数据的信息中恢复出最优个体的分类器公式;
2.3分类计算,通过加载出的分类器公式对预测集中的每条记录进行计算,输出分类结果。
实施例
为了更好的说明本发明的技术效果,利用对边坡稳定性的分类和安全系数的预测做进一步说明。
收集的边坡数据见表1:
表1 实验数据集
      
      
其中,容重(γ)、黏聚力(c)、内摩擦角(Φ)、边坡角(β)、坡高(H)、孔隙压力比(ru),作为输入变量,输出变量为边坡稳定状态(S),当1是为稳定,当为-1为非稳定,S1表示边坡的稳定状态。1-40号样本作为训练集,并将41-52号样本作为测试集。利用本发明计算过程中,将遗传个体数设为500,遗传代数设为50。通过计算后,可以得出训练集和测试集中边坡稳定性和安全系数的预测值,预测结果S2见表1。
计算分类正确率,计算公式为:
       Performance ( % ) = ( Number of data predicted accurately by GSGP Total data ) × 100
其中,GSGP表示本发明提供的基于几何语义的遗传规划分类方法。将表1中计算的分类结果和真实值代入上述公式中,便可得出训练集与测试集各自的分类正确率。由本发明提供的方法分类得出的训练集的分类正确率为97.5%,而测试集中的分类正确率为91.7%,测试表明该方法具有很好的分类效果。
以上已以较佳地实施例公布了本发明,然其并非用以限制本发明,凡采取等同替换或等效变换的方案所获得的技术方案,均落在本发明的保护范围内。

Claims (6)

1.一种基于几何语义的遗传规划分类方法,其特征在于:通过对训练过程和预测过程的分离,完成被测试样本的分类;
所述训练过程,通过几何语义求解最优个体,并提取该最优个体的分类器公式,将最优个体的分类器公式存储在磁盘中;
所述预测过程,调用训练过程中存储在磁盘中的最优个体的分类器公式,通过加载与计算恢复出分类器公式,根据分类器公式输出分类结果,进而实现对个体的分类。
2.根据权利要求1所述的基于几何语义的遗传规划分类方法,其特征在于:所述训练过程包括以下步骤:
1.1初始化过程,根据函数集和终结点集构成个体,然后由个体生成初始化群体;群体中的个体采用层状计算机程序表达,具体由函数集F和终止符集T组成;
函数集F包含n个函数:
F={fi/fi=f1,f2,…,fn}
其中,fi为+,-,×,÷数学运算符号或标准数学函数,所述数学运算符号包含+,-,×,÷,所述标准数学函数包含sin,cos,log,exp;
终止符集T包含m个终止符:
T={ti/ti=t1,t2,…,tm}
其中,ti为变量或常量;
1.2通过计算每个个体的输出值BJx,确定分类器中各类别的边界值,边界值的确定方法为中心动态边界法,具体表达式为:
BJ x = Σ m = 1 Tr Σ n = 1 P num Dout xmn TR * R num
其中,TR为训练集样本总数,Pnum为种群个体总数,Doutxmn为个体计算值,x为训练集中样本类别号;
1.3计算每个个体的适应度fitness,计算公式为:
fitness = 1 - R num S sum
其中,Rnum为个体分类正确的次数,Snum为训练样本个数;
1.4遗传操作,遗传操作包括父体的复制、交换、变异操作,交换操作生成的个体TC与变异操作生成的个体TM是父体通过几何语义方式产生的,分别表示为:
Tc=(T1·TR)+(1-TR)·T2
式中,T1,T2为两父体,TR真随机函数;
TM=T+ms·(TR1-TR2)
式中,T为父体,TR1,TR2表示两真随机函数,ms变异系数;
1.5判断个体是否达到最大迭代次数;若未达到,则重复步骤1.2-1.4;从达到最大迭代次数的个体中筛选出最大适应度个体作为最优个体,并提取该最优个体的分类器公式,将分类器公式存储在磁盘上,训练过程结束。
3.根据权利要求2所述的基于几何语义的遗传规划分类方法,其特征在于:步骤1.2中,边界值的确定方法还包括静态边界法。
4.根据权利要求2所述的基于几何语义的遗传规划分类方法,其特征在于:步骤1.3中,适应度的度量方法包括原始适应度、标准适应度和归一化适应度。
5.根据权利要求2所述的基于几何语义的遗传规划分类方法,其特征在于:步骤1.5中,最优个体分类器公式存储过程中,分别记录交换操作和变异操作过程的信息,通过5位16进制数记录随机公式,记录出现的节点,将最优个人的将分类器公式存储为分类器公式输出文件。
6.根据权利要求1所述的基于几何语义的遗传规划分类方法,其特征在于:所述预测过程包括以下步骤:
2.1初始化计算过程,读取个体数据,并检查个体数据的正确性;
2.2对分类器公式进行加载,通过循环调用加载公式,从存储于磁盘的16进制数据的信息中恢复出最优个体的分类器公式;
2.3分类计算,通过加载出的分类器公式对预测集中的每条记录进行计算,输出分类结果。
CN201510240788.8A 2015-05-12 2015-05-12 一种基于几何语义的遗传规划分类方法 Active CN104809477B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510240788.8A CN104809477B (zh) 2015-05-12 2015-05-12 一种基于几何语义的遗传规划分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510240788.8A CN104809477B (zh) 2015-05-12 2015-05-12 一种基于几何语义的遗传规划分类方法

Publications (2)

Publication Number Publication Date
CN104809477A true CN104809477A (zh) 2015-07-29
CN104809477B CN104809477B (zh) 2018-08-28

Family

ID=53694288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510240788.8A Active CN104809477B (zh) 2015-05-12 2015-05-12 一种基于几何语义的遗传规划分类方法

Country Status (1)

Country Link
CN (1) CN104809477B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108573229A (zh) * 2017-12-29 2018-09-25 西安电子科技大学 基于智能高层语义的视频行为识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101251851A (zh) * 2008-02-29 2008-08-27 吉林大学 基于增量朴素贝叶斯网多分类器集成方法
CN103116637A (zh) * 2013-02-08 2013-05-22 无锡南理工科技发展有限公司 一种面向中文Web评论的文本情感分类方法
US20140314311A1 (en) * 2013-04-23 2014-10-23 Wal-Mart Stores, Inc. System and method for classification with effective use of manual data input

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101251851A (zh) * 2008-02-29 2008-08-27 吉林大学 基于增量朴素贝叶斯网多分类器集成方法
CN103116637A (zh) * 2013-02-08 2013-05-22 无锡南理工科技发展有限公司 一种面向中文Web评论的文本情感分类方法
US20140314311A1 (en) * 2013-04-23 2014-10-23 Wal-Mart Stores, Inc. System and method for classification with effective use of manual data input

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
乔金丽,等: ""基于遗传规划的边坡稳定安全系数预测"", 《煤炭学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108573229A (zh) * 2017-12-29 2018-09-25 西安电子科技大学 基于智能高层语义的视频行为识别方法
CN108573229B (zh) * 2017-12-29 2021-09-10 西安电子科技大学 基于智能高层语义的视频行为识别方法

Also Published As

Publication number Publication date
CN104809477B (zh) 2018-08-28

Similar Documents

Publication Publication Date Title
Rustam et al. Classification of shopify app user reviews using novel multi text features
CN102521656B (zh) 非平衡样本分类的集成迁移学习方法
Gupta et al. Performance analysis of classification tree learning algorithms
CN107578104A (zh) 一种中药生产过程知识系统
CN106952159B (zh) 一种不动产抵押品风险控制方法、系统及存储介质
CN105373606A (zh) 一种改进c4.5决策树算法下的不平衡数据抽样方法
CN105354595A (zh) 一种鲁棒视觉图像分类方法及系统
CN110188047A (zh) 一种基于双通道卷积神经网络的重复缺陷报告检测方法
CN104881689A (zh) 一种多标签主动学习分类方法及系统
CN110472203B (zh) 一种文章的查重检测方法、装置、设备及存储介质
CN111754345A (zh) 一种基于改进随机森林的比特币地址分类方法
CN102200981B (zh) 面向多层文本分类的特征选择方法和装置
CN103886030B (zh) 基于代价敏感决策树的信息物理融合系统数据分类方法
CN110222733B (zh) 一种高精度的多阶神经网络分类方法及系统
CN102629272A (zh) 一种基于聚类的考试系统试题库优化方法
CN112085384A (zh) 一种基于模糊推理与lstm结合的邮寄物风险评价方法与系统
CN111915022B (zh) 滑移式岩溶危岩稳定系数快速识别的高斯过程方法及装置
CN107169523A (zh) 自动确定机构的所属行业类别的方法、存储设备及终端
CN108717459A (zh) 一种面向用户评论信息的移动应用缺陷定位方法
CN103942604A (zh) 基于森林区分度模型的预测方法及系统
CN114638498A (zh) Esg评价方法、系统、电子设备及存储设备
CN114549897A (zh) 一种分类模型的训练方法、装置及存储介质
CN111708865B (zh) 一种基于改进XGBoost算法的技术预见及专利预警分析方法
WO2020259391A1 (zh) 一种数据库脚本性能测试的方法及装置
CN104809477A (zh) 一种基于几何语义的遗传规划分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant