CN113780394B - 一种强分类器模型的训练方法、装置及设备 - Google Patents
一种强分类器模型的训练方法、装置及设备 Download PDFInfo
- Publication number
- CN113780394B CN113780394B CN202111012641.5A CN202111012641A CN113780394B CN 113780394 B CN113780394 B CN 113780394B CN 202111012641 A CN202111012641 A CN 202111012641A CN 113780394 B CN113780394 B CN 113780394B
- Authority
- CN
- China
- Prior art keywords
- classifier
- training
- model
- amygdala
- medical sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 100
- 238000000034 method Methods 0.000 title claims abstract description 35
- 201000010099 disease Diseases 0.000 claims abstract description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 15
- 238000012360 testing method Methods 0.000 claims abstract description 13
- 210000004727 amygdala Anatomy 0.000 claims description 40
- 230000006870 function Effects 0.000 claims description 36
- 238000004590 computer program Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 17
- 235000011437 Amygdalus communis Nutrition 0.000 claims description 12
- 241000220304 Prunus dulcis Species 0.000 claims description 12
- 235000020224 almond Nutrition 0.000 claims description 12
- 210000005153 frontal cortex Anatomy 0.000 claims description 10
- 101100001674 Emericella variicolor andI gene Proteins 0.000 claims description 8
- 210000002442 prefrontal cortex Anatomy 0.000 claims description 7
- 238000011478 gradient descent method Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 2
- 238000003745 diagnosis Methods 0.000 abstract description 13
- 238000004422 calculation algorithm Methods 0.000 abstract description 12
- 230000009467 reduction Effects 0.000 abstract description 3
- 210000004556 brain Anatomy 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000008451 emotion Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- XUCIJNAGGSZNQT-JHSLDZJXSA-N (R)-amygdalin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@H](O[C@@H](C#N)C=2C=CC=CC=2)O1 XUCIJNAGGSZNQT-JHSLDZJXSA-N 0.000 description 1
- 229940089837 amygdalin Drugs 0.000 description 1
- YZLOSXFCSIDECK-UHFFFAOYSA-N amygdalin Natural products OCC1OC(OCC2OC(O)C(O)C(O)C2O)C(O)C(O)C1OC(C#N)c3ccccc3 YZLOSXFCSIDECK-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- YGHHWSRCTPQFFC-UHFFFAOYSA-N eucalyptosin A Natural products OC1C(O)C(O)C(CO)OC1OC1C(OC(C#N)C=2C=CC=CC=2)OC(CO)C(O)C1O YGHHWSRCTPQFFC-UHFFFAOYSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/043—Architecture, e.g. interconnection topology based on fuzzy logic, fuzzy membership or fuzzy inference, e.g. adaptive neuro-fuzzy inference systems [ANFIS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/048—Fuzzy inferencing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Automation & Control Theory (AREA)
- General Health & Medical Sciences (AREA)
- Fuzzy Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种强分类器模型的训练方法、装置及设备,包括:接收医学样本数据,其中,医学样本数据包括训练集和测试集;构建初始化模型,采用所述训练集迭代训练所述初始化模型,以生成多个基分类器,其中,每生成一个所述基分类器,更新一次所述训练集在所述医学样本中的权重;对每一所述基分类器进行运算,以获得强分类器,其中,所述强分类器用于根据医学样本数据对疾病进行诊断和预测分析。解决或改善了现有的医疗诊断模型算法的过拟合,泛化能力降低的问题。
Description
技术领域
本发明涉及神经网络领域,特别涉及一种强分类器模型的训练方法、装置及设备。
背景技术
疾病的诊断过程是医生根据病人的临床症状,综合自己掌握的医疗知识的基础上对病因作出的判断。传统的诊断模式主要依靠医生的直接经验,诊断结果受人为、环境等因素影响较大。另一方面,在一些地区医疗资源分布不均,顶级医疗机构人满为患,而基层偏远地区医疗资源短缺。因此,将先进计算机辅助技术拓展到医学诊断领域是现代医学诊断的发展方向之一。随着信息化进程的不断推进、大数据的飞速发展和人工智能的广泛应用,大量的医疗数据被有效利用,计算机辅助疾病诊断分析也逐渐成为了现实。
随着医学数据复杂度的增加,在满足对不同类型数据进行快速、准确分类的要求上,传统的大脑情感学习算法面临着新的挑战:一方面,由于医疗诊断过程中,病状与疾病之间存在不确定性特征,且疾病数据中可能包含噪声和冗余特征,可能会降低诊断模型构建的效率,同时在一定程度上会降低分类识别的准确率。另一方面,传统网络为得到更高的性能,会让模型进行充分的学习,容易造成算法的过拟合,泛化能力降低。
有鉴于此,提出本申请。
发明内容
本发明公开了一种强分类器模型的训练方法、装置及设备,旨在解决或改善现有的医疗诊断模型算法的过拟合,泛化能力降低的问题。
本发明第一实施例提供了一种强分类器模型的训练方法,包括:
接收医学样本数据,其中,医学样本数据包括训练集和测试集;
构建初始化模型,采用所述训练集迭代训练所述初始化模型,以生成多个基分类器,其中,每生成一个所述基分类器,更新一次所述训练集在所述医学样本中的权重;
对每一所述基分类器进行运算,以获得强分类器,其中,所述强分类器用于根据医学样本数据对疾病进行诊断和预测分析。
优选地,所述在接收医学样本数据之后,还包括对所述医学样本进行预处理,具体为:
对所述医学样本数据进行归一化处理,以使得数据能够被限制在预设区间内。
优选地,所述构建初始化模型,采用所述训练集迭代训练所述初始化模型,以生成多个基分类器,具体为:
将经过预处理的训练集作为所述初始化模型的输入,调用高斯函数分别在所述初始化模型的杏仁核部分和眶额皮质部分进行模糊处理,并生成模糊结果;
将所述模糊结果进行模糊推理,并发送至权重记忆空间,其中,所述杏仁核部分和所述眶额皮质部分采用不同的权值进行运算,并生成推理结果;
根据所述推理结果对所述杏仁核部分和所述眶额皮质部分进行解模糊运算,以获得所述初始化模型的预测结果;
根据所述预测结果和实际值的误差,采用梯度下降法对权重记忆空间的权值不断的更新,直到迭代的均方误差曲线收敛时,生成基分类器;
获取所述基分类器的输出结果,更新所述训练集在所述医学样本中的权重,并迭代生成多个基分类器,直至达到预设的迭代次数。
优选地,调用高斯函数在所述初始化模型的杏仁核部分的模糊处理方式为:
调用高斯函数在所述初始化模型的眶额皮质部分的模糊处理方式为:
优选地,所述杏仁核部分和所述眶额皮质部分采用不同的权值进行运算,并生成推理结果具体为:
其中,所述杏仁核部分的处理方式为:
其中,所述眶额皮质部分的处理方式为:
优选地,所述杏仁核部分的解模糊运算为:
所述眶额皮质部分的解模糊运算为:
所述初始化模型的预测结果为:
uk=ak-ok
其中,uk杏仁核部分和眶额皮质部分的第k维输出的差异。
优选地,获取所述基分类器的输出结果包括:在训练集上的分类误差率、当前基分类器在最终强分类器中所占权重。
优选地,所述对每一所述基分类器进行运算,以获得强分类器具体为:
获取每一所述基分类器在强分类器中所占的权重;
根据所述权重,对每一所述基分类器进行加权求和,生成强分类器;其中,所述强分类器的模型为:
其中,G(x)为强分类器,am为第m个基分类器在组合成强分类器时对应的权重,Gm(x)为基分类器。
本发明第二实施例提供了一种强分类器模型的训练装置,包括:
医学样本数据接收单元,用于接收医学样本数据,其中,医学样本数据包括训练集和测试集;
构建单元,用于构建初始化模型,采用所述训练集迭代训练所述初始化模型,以生成多个基分类器,其中,每生成一个所述基分类器,更新一次所述训练集在所述医学样本中的权重;
运算单元,用于对每一所述基分类器进行运算,以获得强分类器,其中,所述强分类器用于根据医学样本数据对疾病进行诊断和预测分析。
本发明第三实施例提供了一种强分类器模型的训练设备,包括处理器、存储器以及存储在所述存储器中且被配置由所述处理器执行的计算机程序,所述处理器执行所述计算机程序实现如上任意一项所述的一种强分类器模型的训练方法。
基于本发明提供的一种强分类器模型的训练方法、装置及设备,通过接收医疗样本数据数据,并将医疗样本数据数据按照预设权重分为训练集和测试集,通过所述训练集对构建的初始化模型进行迭代训练,在训练至满足条件之后,更新医学样本数据继续训练,直至迭代至预设次数,对多个基分类器进行运算成强分类器,用于解决或改善医疗诊断模型算法的过拟合,泛化能力降低的问题。
附图说明
图1是本发明第一实施例提供的一种强分类器模型的训练方法流程示意图;
图2是本发明第而实施例提供的一种强分类器模型的训练装置的模块示意图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
实施例中提及的“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二”区分的对象在适当情况下可以互换,以使这里描述的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
以下结合附图对本发明的具体实施例做详细说明。
本发明公开了一种强分类器模型的训练方法、装置及设备,旨在解决或改善现有的医疗诊断模型算法的过拟合,泛化能力降低的问题。
请参阅图1,本发明第一实施例提供了一种强分类器模型的训练方法,其可由强分类器模型的训练设备(以下简称训练设备)来执行,特别的,由训练设备内的一个或者多个处理器来执行,以实现如下步骤:
S101,接收医学样本数据,其中,医学样本数据包括训练集和测试集;
在本实施例中,所述训练设备可为位于云端的服务器、也可以为终端设备(如智能手机、智能打印机或者其他智能设备)用于接收医学样本数据,并根据所述医学样本数据来训练输出强分类器。
具体地,可以将接收医学样本数据,按原始数据集按一定比例分为训练集和测试集,设训练集样本大小为N记为Dtrain、测试集样本大小为n-N记为Dtest。初始化训练集中的样本权重Dtrain 1=(ω11,ω12…ω1i),其中,i=1,2,3…,N。可以理解的是,训练集是为了训练模型能让模型测出的结果准确率高,测试集就是为了验证这个训练好的模型给它新的数据它还能不能有好的预测效果,在每次生成一个基分类器之后,都会更新训练集和样本集的样本权重。
在本实施例中,所述在接收医学样本数据之后,还包括对所述医学样本进行预处理,具体为:对所述医学样本数据进行归一化处理,以使得数据能够被限制在预设区间内,其中,所述区间可以是[0,1],预处理之后的数据加快模型的训练速度,提高模型准确率。
1.模糊逻辑系统理论分析
(1)高斯区间型type-2模糊系统的学习规则
(2)模糊与解模糊运算
模糊化运算:系统的输入一般是确定的数值,模糊器的作用就是将这些确定数值映射为模糊集合,高斯区间type-2模糊系统选择高斯函数作为隶属度函数,采用不确定宽度的高斯函数对输入的数据进行模糊化。
解模糊运算:与type-1型模糊系统相比,高斯区间type-2模糊系统增加了降型环节,规则库中每一个规则输出是type-2模糊集合,所以在输出环节要先将type-2模糊集合转换为type-1模糊集合,然后将降型得到的type-1模糊集合解模糊得到一个精确的输出。
2.基于高斯区间型type-2模糊大脑的数学建模
(1)高斯区间型type-2模糊大脑总体框架设计
高斯区间型type-2模糊大脑的结构包括杏仁核网络和眶额皮层网络。杏仁核网络的结构是区间2型模糊神经网络,有六个空间:输入空间、隶属函数空间、发射空间、权重记忆空间、去模糊化空间和输出空间。
眶额皮层网络结构有五个空间:输入空间、隶属函数空间、权重记忆空间、去模糊化空间和输出空间。眶额皮层网络的输入与杏仁核网络中输入空间的输入相同。输入变量参与进2型高斯隶属函数计算不确定的隶属度。权重记忆空间执行模糊规则来得到眶额皮层网络的权值。接着执行去模糊化操作,最后进行解模糊,眶额皮层网络的最终输出为去模糊化空间输出值的平均值。高斯区间型type-2模糊大脑最终输出为杏仁核网络与眶额皮层网络输出值的差值。
(2)IF-THEN规则的建立
使用IF-THEN规则来解释大脑情感学习控制器的结果和前因之间的2型模糊关系如下:
感觉神经网络杏仁核的第j条规则:如果I1为μ1j且…且Ii为μij且…且为则ak=wjk(其中f=1,...,ni;j=1,...,nj和k=1,...,nk是第i个输入,第j条规则和第k个权值记忆空间的输出;和分别是隶属度和杏仁核权值的区间值)。
(3)更新公式的确立
在杏仁核网络中,计算损失函数对的梯度,在眶额皮层网络中,计算损失函数对的梯度。再根据参数调整规则,沿着梯度反方向进行修正。利用上述更新律,高斯区间型type-2模糊大脑情感学习器的参数可以接近最优参数,控制系统就可以达到预期的控制性能。
(4)收敛性分析
正确选择可变的学习率对于梯度下降法的收敛具有重要意义。学习率太大可能导致学习不稳定,学习率太小将会导致学习速率缓慢。因此,需要一个合适的收敛定理来为参数选择合适的学习率。选择李亚普诺夫稳定性定理,可以保证更新算法的收敛性,通过在线调整,以实现最快的稳定收敛。
S102,构建初始化模型,采用所述训练集迭代训练所述初始化模型,以生成多个基分类器,其中,每生成一个所述基分类器,更新一次所述训练集在所述医学样本中的权重;
在本实施例中,将经过预处理的训练集作为所述初始化模型的输入,调用高斯函数分别在所述初始化模型的杏仁核部分和眶额皮质部分进行模糊处理,并生成模糊结果;
具体地:调用高斯函数在所述初始化模型的杏仁核部分的模糊处理方式为:
调用高斯函数在所述初始化模型的眶额皮质部分的模糊处理方式为:
将所述模糊结果进行模糊推理,并发送至权重记忆空间,其中,所述杏仁核部分和所述眶额皮质部分采用不同的权值进行运算,并生成推理结果;
具体地:所述杏仁核部分和所述眶额皮质部分采用不同的权值进行运算,并生成推理结果具体为:
其中,所述杏仁核部分的处理方式为:
其中,fj是杏仁核部分模糊推理第j条规则由下界和上界组成;代表杏仁核部分去模糊化空间的输出,为杏仁核权值的区间值,是以l为开关点生成的第j条规则,是以r为开关点生成的第j条规则;其中,所述属于杏仁核网络的结构是区间2型模糊神经网络的发射空间,该空间基于隶属函数空间中的隶属度执行模糊运算。由于隶属空间的输出是区间集,因此发射空间的输出也是区间集。
其中,所述眶额皮质部分的处理方式为:
根据所述推理结果对所述杏仁核部分和所述眶额皮质部分进行解模糊运算,以获得所述初始化模型的预测结果;
具体地:所述杏仁核部分的解模糊运算为:
所述眶额皮质部分的解模糊运算为:
所述初始化模型的预测结果为:
uk=ak-Ok
其中,uk杏仁核部分和眶额皮质部分的第k维输出的差异。
根据所述预测结果和实际值的误差,采用梯度下降法对权重记忆空间的权值不断的更新,直到迭代的均方误差曲线收敛时,生成基分类器;
第m次迭代,使用具有权值分布Dtrainm的训练集学习,得到基分类器Gm(x)。
计算Gm在训练集上的分类误差率:
计算基分类器Gm(x)在最终的强分类器中所占权重,公式如下:
更新Dtrainm训练数据集样本的权重,公式如下:
其中Zm是归一化因子,使用Zm是为了使样本的概率分布和为1。
获取所述基分类器的输出结果,更新所述训练集在所述医学样本中的权重,并迭代生成多个基分类器,直至达到预设的迭代次数。
在本实施例中,获取所述基分类器的输出结果可以包括:在训练集上的分类误差率、当前基分类器在最终强分类器中所占权重中的一个或多个。
S103,对每一所述基分类器进行运算,以获得强分类器,其中,所述强分类器用于根据医学样本数据对疾病进行诊断和预测分析。
在本实施例中,所述对每一所述基分类器进行运算,以获得强分类器具体为:
获取每一所述基分类器在强分类器中所占的权重;
根据所述权重,对每一所述基分类器进行加权求和,生成强分类器;其中,所述强分类器的模型为:
其中,G(x)为强分类器,am为第m个基分类器在组合成强分类器时对应的权重,Gm(x)为基分类器。
本实施例的有益效果:
本实施例提出的模糊大脑情感学习集成模型,针对疾病诊断过程中出现的病状特征识别的不稳定性以及样本可能具有的高噪声特性,加入了具有更强大的处理不确定性问题的高斯区间型Type-2模糊系统,使大脑情感学习模型达到最快收敛效果,提高算法的学习推论能力和学习计算效率,同时针对分类问题的特点,利用输出信号和误差参数重新定义奖励信号,使模型在进行疾病诊断的应用中能得到更好的分类准确度,具有更为精确的辨识能力。
在单一神经网络算法模型在进行疾病分类和预测的过程中,都是通过自身的学习规则和分类原理来预测目标样本的标签。经过训练后得到的算法模型在面对不同的疾病数据集时,表现出的判断预测能力会有较明显的差异。本发明引入Adaboost集成学习算法,它的优势正是在于能够把多个单一学习器有机地结合起来,对各基分类器进行训练,用适当的组合方法有效集成,获得一个统一的集成学习模型,形成分类性能稳定且准确的强分类器,从而获得更准确、稳定和强壮的结果。
请参阅图2,本发明第二实施例提供了一种强分类器模型的训练装置,包括:
医学样本数据接收单元201,用于接收医学样本数据,其中,医学样本数据包括训练集和测试集;
构建单元202,用于构建初始化模型,采用所述训练集迭代训练所述初始化模型,以生成多个基分类器,其中,每生成一个所述基分类器,更新一次所述训练集在所述医学样本中的权重;
运算单元203,用于对每一所述基分类器进行运算,以获得强分类器,其中,所述强分类器用于根据医学样本数据对疾病进行诊断和预测分析。
本发明第三实施例提供了一种强分类器模型的训练设备,包括处理器、存储器以及存储在所述存储器中且被配置由所述处理器执行的计算机程序,所述处理器执行所述计算机程序实现如上任意一项所述的一种强分类器模型的训练方法。
本发明第四实施例提供了一种可读存储介质,包括处理器、存储器以及存储在所述存储器中且被配置由所述处理器执行的计算机程序,所述处理器执行所述计算机程序实现如上任意一项所述的一种强分类器模型的训练方法。
基于本发明提供的一种强分类器模型的训练方法、装置及设备,通过接收医疗样本数据数据,并将医疗样本数据数据按照预设权重分为训练集和测试集,通过所述训练集对构建的初始化模型进行迭代训练,在训练至满足条件之后,更新医学样本数据继续训练,直至迭代至预设次数,对多个基分类器进行运算成强分类器,用于解决或改善医疗诊断模型算法的过拟合,泛化能力降低的问题。
示例性地,本发明第三实施例和第四实施例中所述的计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述实现一种强分类器模型的训练设备中的执行过程。例如,本发明第二实施例中所述的装置。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述种强分类器模型的训练方法的控制中心,利用各种接口和线路连接整个所述实现对种强分类器模型的训练方法的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现一种强分类器模型的训练方法的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、文字转换功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、文字消息数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述实现的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一个计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (7)
1.一种强分类器模型的训练方法,其特征在于,包括:
接收医学样本数据,其中,医学样本数据包括训练集和测试集,所述在接收医学样本数据之后,还包括对所述医学样本进行预处理,具体为:对所述医学样本数据进行归一化处理,以使得数据能够被限制在预设区间内;
构建初始化模型,采用所述训练集迭代训练所述初始化模型,以生成多个基分类器,具体为:将经过预处理的训练集作为所述初始化模型的输入,调用高斯函数分别在所述初始化模型的杏仁核部分和眶额皮质部分进行模糊处理,并生成模糊结果;将所述模糊结果进行模糊推理,并发送至权重记忆空间,其中,所述杏仁核部分和所述眶额皮质部分采用不同的权值进行运算,并生成推理结果;根据所述推理结果对所述杏仁核部分和所述眶额皮质部分进行解模糊运算,以获得所述初始化模型的预测结果;根据所述预测结果和实际值的误差,采用梯度下降法对权重记忆空间的权值不断的更新,直到迭代的均方误差曲线收敛时,生成基分类器;获取所述基分类器的输出结果,更新所述训练集在所述医学样本中的权重,并迭代生成多个基分类器,直至达到预设的迭代次数,其中,每生成一个所述基分类器,更新一次所述训练集在所述医学样本中的权重;
其中,调用高斯函数在所述初始化模型的杏仁核部分的模糊处理方式为:
调用高斯函数在所述初始化模型的眶额皮质部分的模糊处理方式为:
对每一所述基分类器进行运算,以获得强分类器,其中,所述强分类器用于根据医学样本数据对疾病进行诊断和预测分析。
4.根据权利要求1所述的一种强分类器模型的训练方法,其特征在于,获取所述基分类器的输出结果包括:在训练集上的分类误差率、当前基分类器在最终强分类器中所占权重。
6.一种强分类器模型的训练装置,其特征在于,包括:
医学样本数据接收单元,用于接收医学样本数据,其中,医学样本数据包括训练集和测试集,所述在接收医学样本数据之后,还包括对所述医学样本进行预处理,具体为:对所述医学样本数据进行归一化处理,以使得数据能够被限制在预设区间内;
构建单元,用于构建初始化模型,采用所述训练集迭代训练所述初始化模型,以生成多个基分类器,具体为:将经过预处理的训练集作为所述初始化模型的输入,调用高斯函数分别在所述初始化模型的杏仁核部分和眶额皮质部分进行模糊处理,并生成模糊结果;将所述模糊结果进行模糊推理,并发送至权重记忆空间,其中,所述杏仁核部分和所述眶额皮质部分采用不同的权值进行运算,并生成推理结果;根据所述推理结果对所述杏仁核部分和所述眶额皮质部分进行解模糊运算,以获得所述初始化模型的预测结果;根据所述预测结果和实际值的误差,采用梯度下降法对权重记忆空间的权值不断的更新,直到迭代的均方误差曲线收敛时,生成基分类器;获取所述基分类器的输出结果,更新所述训练集在所述医学样本中的权重,并迭代生成多个基分类器,直至达到预设的迭代次数,其中,每生成一个所述基分类器,更新一次所述训练集在所述医学样本中的权重;
其中,调用高斯函数在所述初始化模型的杏仁核部分的模糊处理方式为:
调用高斯函数在所述初始化模型的眶额皮质部分的模糊处理方式为:
运算单元,用于对每一所述基分类器进行运算,以获得强分类器,其中,所述强分类器用于根据医学样本数据对疾病进行诊断和预测分析。
7.一种强分类器模型的训练设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置由所述处理器执行的计算机程序,所述处理器执行所述计算机程序实现如权利要求1至5任意一项所述的一种强分类器模型的训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111012641.5A CN113780394B (zh) | 2021-08-31 | 2021-08-31 | 一种强分类器模型的训练方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111012641.5A CN113780394B (zh) | 2021-08-31 | 2021-08-31 | 一种强分类器模型的训练方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113780394A CN113780394A (zh) | 2021-12-10 |
CN113780394B true CN113780394B (zh) | 2023-05-09 |
Family
ID=78840408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111012641.5A Active CN113780394B (zh) | 2021-08-31 | 2021-08-31 | 一种强分类器模型的训练方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113780394B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114528183B (zh) * | 2022-02-17 | 2023-05-02 | 厦门四信通信科技有限公司 | LoRa设备的离线预测方法、装置、设备及可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005112755A2 (en) * | 2004-05-21 | 2005-12-01 | The General Hospital Corporation | Morphometric analysis of brain structures |
CN107320115A (zh) * | 2017-07-04 | 2017-11-07 | 重庆大学 | 一种自适应的精神疲劳评估装置及方法 |
CN109858564A (zh) * | 2019-02-21 | 2019-06-07 | 上海电力学院 | 适用于风电变流器故障诊断的改进型Adaboost-SVM模型生成方法 |
WO2019170711A1 (en) * | 2018-03-07 | 2019-09-12 | Institut National De La Sante Et De La Recherche Medicale (Inserm) | Method for early prediction of neurodegenerative decline |
CN111860658A (zh) * | 2020-07-24 | 2020-10-30 | 华北电力大学(保定) | 一种基于代价敏感和集成学习的变压器故障诊断方法 |
-
2021
- 2021-08-31 CN CN202111012641.5A patent/CN113780394B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005112755A2 (en) * | 2004-05-21 | 2005-12-01 | The General Hospital Corporation | Morphometric analysis of brain structures |
CN107320115A (zh) * | 2017-07-04 | 2017-11-07 | 重庆大学 | 一种自适应的精神疲劳评估装置及方法 |
WO2019170711A1 (en) * | 2018-03-07 | 2019-09-12 | Institut National De La Sante Et De La Recherche Medicale (Inserm) | Method for early prediction of neurodegenerative decline |
CN109858564A (zh) * | 2019-02-21 | 2019-06-07 | 上海电力学院 | 适用于风电变流器故障诊断的改进型Adaboost-SVM模型生成方法 |
CN111860658A (zh) * | 2020-07-24 | 2020-10-30 | 华北电力大学(保定) | 一种基于代价敏感和集成学习的变压器故障诊断方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113780394A (zh) | 2021-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102071582B1 (ko) | 딥 뉴럴 네트워크(Deep Neural Network)를 이용하여 문장이 속하는 클래스(class)를 분류하는 방법 및 장치 | |
CN111897941B (zh) | 对话生成方法、网络训练方法、装置、存储介质及设备 | |
Gu et al. | Stack-captioning: Coarse-to-fine learning for image captioning | |
Trappenberg | Fundamentals of machine learning | |
CN112116090B (zh) | 神经网络结构搜索方法、装置、计算机设备及存储介质 | |
CN109947931B (zh) | 基于无监督学习的文本自动摘要方法、系统、设备及介质 | |
CN112508334A (zh) | 融合认知特性及试题文本信息的个性化组卷方法及系统 | |
US20210406687A1 (en) | Method for predicting attribute of target object based on machine learning and related device | |
US20220188605A1 (en) | Recurrent neural network architectures based on synaptic connectivity graphs | |
CN113673244A (zh) | 医疗文本处理方法、装置、计算机设备和存储介质 | |
CN112365359A (zh) | 种植决策确定模型的训练方法、装置、设备以及存储介质 | |
CN115238909A (zh) | 一种基于联邦学习的数据价值评估方法及其相关设备 | |
CN116994695A (zh) | 报告生成模型的训练方法、装置、设备及存储介质 | |
CN116992151A (zh) | 一种基于双塔图卷积神经网络的在线课程推荐方法 | |
CN112115131A (zh) | 数据去噪方法、装置、设备及计算机可读存储介质 | |
CN113780394B (zh) | 一种强分类器模型的训练方法、装置及设备 | |
CN112000788A (zh) | 一种数据处理方法、装置以及计算机可读存储介质 | |
CN115240843A (zh) | 基于结构因果模型的公平性预测系统 | |
Dutta et al. | An adversarial explainable artificial intelligence (XAI) based approach for action forecasting | |
Tabarisaadi et al. | An optimized uncertainty-aware training framework for neural networks | |
CN114298299A (zh) | 基于课程学习的模型训练方法、装置、设备及存储介质 | |
CN113345464A (zh) | 语音提取方法、系统、设备及存储介质 | |
CN116541507A (zh) | 一种基于动态语义图神经网络的视觉问答方法及系统 | |
EP3965021A1 (en) | A method of using clustering-based regularization in training a deep neural network to classify data | |
Schuld | Quantum machine learning for supervised pattern recognition. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |