CN113780394A

CN113780394A - 一种强分类器模型的训练方法、装置及设备

Info

Publication number: CN113780394A
Application number: CN202111012641.5A
Authority: CN
Inventors: 孙园; 高佳倩; 王绮楠; 郭前进; 龙玥
Original assignee: Xiamen University of Technology
Current assignee: Xiamen University of Technology
Priority date: 2021-08-31
Filing date: 2021-08-31
Publication date: 2021-12-10
Anticipated expiration: 2041-08-31
Also published as: CN113780394B

Abstract

本发明提供了一种强分类器模型的训练方法、装置及设备，包括：接收医学样本数据，其中，医学样本数据包括训练集和测试集；构建初始化模型，采用所述训练集迭代训练所述初始化模型，以生成多个基分类器，其中，每生成一个所述基分类器，更新一次所述训练集在所述医学样本中的权重；对每一所述基分类器进行运算，以获得强分类器，其中，所述强分类器用于根据医学样本数据对疾病进行诊断和预测分析。解决或改善了现有的医疗诊断模型算法的过拟合，泛化能力降低的问题。

Description

一种强分类器模型的训练方法、装置及设备

技术领域

本发明涉及神经网络领域，特别涉及一种强分类器模型的训练方法、装置及设备。

背景技术

疾病的诊断过程是医生根据病人的临床症状，综合自己掌握的医疗知识的基础上对病因作出的判断。传统的诊断模式主要依靠医生的直接经验，诊断结果受人为、环境等因素影响较大。另一方面，在一些地区医疗资源分布不均，顶级医疗机构人满为患，而基层偏远地区医疗资源短缺。因此，将先进计算机辅助技术拓展到医学诊断领域是现代医学诊断的发展方向之一。随着信息化进程的不断推进、大数据的飞速发展和人工智能的广泛应用，大量的医疗数据被有效利用，计算机辅助疾病诊断分析也逐渐成为了现实。

随着医学数据复杂度的增加，在满足对不同类型数据进行快速、准确分类的要求上，传统的大脑情感学习算法面临着新的挑战：一方面，由于医疗诊断过程中，病状与疾病之间存在不确定性特征，且疾病数据中可能包含噪声和冗余特征，可能会降低诊断模型构建的效率，同时在一定程度上会降低分类识别的准确率。另一方面，传统网络为得到更高的性能，会让模型进行充分的学习，容易造成算法的过拟合，泛化能力降低。

有鉴于此，提出本申请。

发明内容

本发明公开了一种强分类器模型的训练方法、装置及设备，旨在解决或改善现有的医疗诊断模型算法的过拟合，泛化能力降低的问题。

本发明第一实施例提供了一种强分类器模型的训练方法，包括：

接收医学样本数据，其中，医学样本数据包括训练集和测试集；

构建初始化模型，采用所述训练集迭代训练所述初始化模型，以生成多个基分类器，其中，每生成一个所述基分类器，更新一次所述训练集在所述医学样本中的权重；

对每一所述基分类器进行运算，以获得强分类器，其中，所述强分类器用于根据医学样本数据对疾病进行诊断和预测分析。

优选地，所述在接收医学样本数据之后,还包括对所述医学样本进行预处理，具体为：

对所述医学样本数据进行归一化处理,以使得数据能够被限制在预设区间内。

优选地，所述构建初始化模型，采用所述训练集迭代训练所述初始化模型，以生成多个基分类器，具体为：

将经过预处理的训练集作为所述初始化模型的输入，调用高斯函数分别在所述初始化模型的杏仁核部分和眶额皮质部分进行模糊处理，并生成模糊结果；

将所述模糊结果进行模糊推理，并发送至权重记忆空间，其中，所述杏仁核部分和所述眶额皮质部分采用不同的权值进行运算，并生成推理结果；

根据所述推理结果对所述杏仁核部分和所述眶额皮质部分进行解模糊运算，以获得所述初始化模型的预测结果；

根据所述预测结果和实际值的误差，采用梯度下降法对权重记忆空间的权值不断的更新，直到迭代的均方误差曲线收敛时，生成基分类器；

获取所述基分类器的输出结果，更新所述训练集在所述医学样本中的权重，并迭代生成多个基分类器，直至达到预设的迭代次数。

优选地，调用高斯函数在所述初始化模型的杏仁核部分的模糊处理方式为：

其中，所述

为杏仁核部分隶属度的区间值，

和

是杏仁核部分中区间2型高斯隶属函数的均值和不确定方差；I是高斯运算的输入样本；

调用高斯函数在所述初始化模型的眶额皮质部分的模糊处理方式为：

其中，

为眶额皮质部分隶属度的区间值，

和

是眶额皮层部分中区间2型高斯隶属函数的均值和不确定方差。

优选地，所述杏仁核部分和所述眶额皮质部分采用不同的权值进行运算，并生成推理结果具体为：

其中，所述杏仁核部分的处理方式为：

其中，f^j是杏仁核部分模糊推理第j条规则由下界和上界组成；

代表杏仁核部分去模糊化空间的输出，

为杏仁核权值的区间值，

是以l为开关点生成的第j条规则，

是以r为开关点生成的第j条规则；

其中，所述眶额皮质部分的处理方式为：

其中，

为眶额皮质部分去模糊化空间的输出，

为眶额皮质部分权值的区间值。

优选地，所述杏仁核部分的解模糊运算为：

其中，ak杏仁核部分的输出；

代表杏仁核部分去模糊化空间的输出；

所述眶额皮质部分的解模糊运算为：

其中，o_k所述眶额皮质部分的输出，

代表眶额皮质部分去模糊化空间的输出；

所述初始化模型的预测结果为：

u_k＝a_k-o_k

其中，u_k杏仁核部分和眶额皮质部分的第k维输出的差异。

优选地，获取所述基分类器的输出结果包括：在训练集上的分类误差率、当前基分类器在最终强分类器中所占权重。

优选地，所述对每一所述基分类器进行运算，以获得强分类器具体为：

获取每一所述基分类器在强分类器中所占的权重；

根据所述权重，对每一所述基分类器进行加权求和，生成强分类器；其中，所述强分类器的模型为：

其中，G(x)为强分类器，a_m为第m个基分类器在组合成强分类器时对应的权重，G_m(x)为基分类器。

本发明第二实施例提供了一种强分类器模型的训练装置，包括：

医学样本数据接收单元，用于接收医学样本数据，其中，医学样本数据包括训练集和测试集；

构建单元，用于构建初始化模型，采用所述训练集迭代训练所述初始化模型，以生成多个基分类器，其中，每生成一个所述基分类器，更新一次所述训练集在所述医学样本中的权重；

运算单元，用于对每一所述基分类器进行运算，以获得强分类器，其中，所述强分类器用于根据医学样本数据对疾病进行诊断和预测分析。

本发明第三实施例提供了一种强分类器模型的训练设备，包括处理器、存储器以及存储在所述存储器中且被配置由所述处理器执行的计算机程序，所述处理器执行所述计算机程序实现如上任意一项所述的一种强分类器模型的训练方法。

基于本发明提供的一种强分类器模型的训练方法、装置及设备，通过接收医疗样本数据数据，并将医疗样本数据数据按照预设权重分为训练集和测试集，通过所述训练集对构建的初始化模型进行迭代训练，在训练至满足条件之后，更新医学样本数据继续训练，直至迭代至预设次数，对多个基分类器进行运算成强分类器，用于解决或改善医疗诊断模型算法的过拟合，泛化能力降低的问题。

附图说明

图1是本发明第一实施例提供的一种强分类器模型的训练方法流程示意图；

图2是本发明第而实施例提供的一种强分类器模型的训练装置的模块示意图；

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了更好的理解本发明的技术方案，下面结合附图对本发明实施例进行详细描述。

应当明确，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

应当理解，本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

实施例中提及的“第一\第二”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二”区分的对象在适当情况下可以互换，以使这里描述的实施例能够以除了在这里图示或描述的那些以外的顺序实施。

以下结合附图对本发明的具体实施例做详细说明。

请参阅图1，本发明第一实施例提供了一种强分类器模型的训练方法，其可由强分类器模型的训练设备(以下简称训练设备)来执行，特别的，由训练设备内的一个或者多个处理器来执行，以实现如下步骤：

S101，接收医学样本数据，其中，医学样本数据包括训练集和测试集；

在本实施例中，所述训练设备可为位于云端的服务器、也可以为终端设备(如智能手机、智能打印机或者其他智能设备)用于接收医学样本数据，并根据所述医学样本数据来训练输出强分类器。

具体地，可以将接收医学样本数据，按原始数据集按一定比例分为训练集和测试集，设训练集样本大小为N记为D_train、测试集样本大小为n-N记为D_test。初始化训练集中的样本权重D_{train 1}＝(ω₁₁，ω₁₂…ω_1i)，其中，

i＝1，2，3…，N。可以理解的是，训练集是为了训练模型能让模型测出的结果准确率高，测试集就是为了验证这个训练好的模型给它新的数据它还能不能有好的预测效果，在每次生成一个基分类器之后，都会更新训练集和样本集的样本权重。

在本实施例中，所述在接收医学样本数据之后，还包括对所述医学样本进行预处理，具体为：对所述医学样本数据进行归一化处理，以使得数据能够被限制在预设区间内，其中，所述区间可以是[0，1]，预处理之后的数据加快模型的训练速度，提高模型准确率。

1.模糊逻辑系统理论分析

(1)高斯区间型type-2模糊系统的学习规则

给定论域X及其元素x∈X，二型模糊集台

可由隶属度函数

表示如下：

其中，

当

的首隶属度对应的集合是一个区间集时，即次隶属度为0或1时，称这样的type-2型模糊集为区间型type-2模糊集合。

(2)模糊与解模糊运算

模糊化运算：系统的输入一般是确定的数值，模糊器的作用就是将这些确定数值映射为模糊集合，高斯区间type-2模糊系统选择高斯函数作为隶属度函数，采用不确定宽度的高斯函数对输入的数据进行模糊化。

解模糊运算：与type-1型模糊系统相比，高斯区间type-2模糊系统增加了降型环节，规则库中每一个规则输出是type-2模糊集合，所以在输出环节要先将type-2模糊集合转换为type-1模糊集合，然后将降型得到的type-1模糊集合解模糊得到一个精确的输出。

2.基于高斯区间型type-2模糊大脑的数学建模

(1)高斯区间型type-2模糊大脑总体框架设计

高斯区间型type-2模糊大脑的结构包括杏仁核网络和眶额皮层网络。杏仁核网络的结构是区间2型模糊神经网络，有六个空间：输入空间、隶属函数空间、发射空间、权重记忆空间、去模糊化空间和输出空间。

眶额皮层网络结构有五个空间：输入空间、隶属函数空间、权重记忆空间、去模糊化空间和输出空间。眶额皮层网络的输入与杏仁核网络中输入空间的输入相同。输入变量参与进2型高斯隶属函数计算不确定的隶属度。权重记忆空间执行模糊规则来得到眶额皮层网络的权值。接着执行去模糊化操作，最后进行解模糊，眶额皮层网络的最终输出为去模糊化空间输出值的平均值。高斯区间型type-2模糊大脑最终输出为杏仁核网络与眶额皮层网络输出值的差值。

(2)IF-THEN规则的建立

使用IF-THEN规则来解释大脑情感学习控制器的结果和前因之间的2型模糊关系如下：

感觉神经网络杏仁核的第j条规则：如果I₁为μ_1j且…且I_i为μ_ij且…且

为

则a_k＝w_jk(其中f＝1，...，n_i；j＝1，...，n_j和k＝1，...，n_k是第i个输入，第j条规则和第k个权值记忆空间的输出；

和

分别是隶属度和杏仁核权值的区间值)。

情绪神经网络眶额皮的第j条规则：如果I₁为λ_1j且…且I_i为λ_ij且…且

为

则o_k＝v_ijk(其中

和

分别是隶属度和眶额皮权值的区间值)。

(3)更新公式的确立

采用梯度下降法，选择

作为损失函数(其中e(k)是第k个跟踪误差，d(k)和y(k)分别是实际值和学习网络输出值)，给出了高斯区间型type-2模糊大脑情感学习器参数的在线调整规律如下：

(η为学习率)

在杏仁核网络中，计算损失函数对

的梯度，在眶额皮层网络中，计算损失函数对

的梯度。再根据参数调整规则，沿着梯度反方向进行修正。利用上述更新律，高斯区间型type-2模糊大脑情感学习器的参数可以接近最优参数，控制系统就可以达到预期的控制性能。

(4)收敛性分析

正确选择可变的学习率对于梯度下降法的收敛具有重要意义。学习率太大可能导致学习不稳定，学习率太小将会导致学习速率缓慢。因此，需要一个合适的收敛定理来为参数选择合适的学习率。选择李亚普诺夫稳定性定理，可以保证更新算法的收敛性，通过在线调整，以实现最快的稳定收敛。

S102，构建初始化模型，采用所述训练集迭代训练所述初始化模型，以生成多个基分类器，其中，每生成一个所述基分类器，更新一次所述训练集在所述医学样本中的权重；

在本实施例中，将经过预处理的训练集作为所述初始化模型的输入，调用高斯函数分别在所述初始化模型的杏仁核部分和眶额皮质部分进行模糊处理，并生成模糊结果；

具体地：调用高斯函数在所述初始化模型的杏仁核部分的模糊处理方式为：

其中，所述

为杏仁核部分隶属度的区间值，

和

是杏仁核部分中区间2型高斯隶属函数的均值和不确定方差；I是指第m个基分类器对第i个样本的分类结果和该样本的标签值的比较结果；

其中，

为眶额皮质部分隶属度的区间值，

和

具体地：所述杏仁核部分和所述眶额皮质部分采用不同的权值进行运算，并生成推理结果具体为：

其中，所述杏仁核部分的处理方式为：

代表杏仁核部分去模糊化空间的输出，

为杏仁核权值的区间值，

是以l为开关点生成的第j条规则，

是以r为开关点生成的第j条规则；其中，所述

属于杏仁核网络的结构是区间2型模糊神经网络的发射空间，该空间基于隶属函数空间中的隶属度执行模糊运算。由于隶属空间的输出是区间集，因此发射空间的输出也是区间集。

其中，所述眶额皮质部分的处理方式为：

其中，

为眶额皮质部分去模糊化空间的输出，

为眶额皮质部分权值的区间值。

具体地：所述杏仁核部分的解模糊运算为：

其中，a_k杏仁核部分的输出；

代表杏仁核部分去模糊化空间的输出；

所述眶额皮质部分的解模糊运算为：

其中，o_k所述眶额皮质部分的输出，

代表眶额皮质部分去模糊化空间的输出；

所述初始化模型的预测结果为：

u_k＝a_k-O_k

其中，u_k杏仁核部分和眶额皮质部分的第k维输出的差异。

具体地：在本实施例中，依次根据前一次的基分类器输出结果对下一次样本权重进行更新，例如对于

第m次迭代，使用具有权值分布D_trainm的训练集学习，得到基分类器G_m(x)。

计算G_m在训练集上的分类误差率：

计算基分类器G_m(x)在最终的强分类器中所占权重，公式如下：

更新D_trainm训练数据集样本的权重，公式如下：

其中Z_m是归一化因子，使用Z_m是为了使样本的概率分布和为1。

在本实施例中，获取所述基分类器的输出结果可以包括：在训练集上的分类误差率、当前基分类器在最终强分类器中所占权重中的一个或多个。

S103，对每一所述基分类器进行运算，以获得强分类器，其中，所述强分类器用于根据医学样本数据对疾病进行诊断和预测分析。

在本实施例中，所述对每一所述基分类器进行运算，以获得强分类器具体为：

获取每一所述基分类器在强分类器中所占的权重；

本实施例的有益效果：

本实施例提出的模糊大脑情感学习集成模型，针对疾病诊断过程中出现的病状特征识别的不稳定性以及样本可能具有的高噪声特性，加入了具有更强大的处理不确定性问题的高斯区间型Type-2模糊系统，使大脑情感学习模型达到最快收敛效果，提高算法的学习推论能力和学习计算效率，同时针对分类问题的特点，利用输出信号和误差参数重新定义奖励信号，使模型在进行疾病诊断的应用中能得到更好的分类准确度，具有更为精确的辨识能力。

在单一神经网络算法模型在进行疾病分类和预测的过程中，都是通过自身的学习规则和分类原理来预测目标样本的标签。经过训练后得到的算法模型在面对不同的疾病数据集时，表现出的判断预测能力会有较明显的差异。本发明引入Adaboost集成学习算法，它的优势正是在于能够把多个单一学习器有机地结合起来，对各基分类器进行训练，用适当的组合方法有效集成，获得一个统一的集成学习模型，形成分类性能稳定且准确的强分类器，从而获得更准确、稳定和强壮的结果。

请参阅图2，本发明第二实施例提供了一种强分类器模型的训练装置，包括：

医学样本数据接收单元201，用于接收医学样本数据，其中，医学样本数据包括训练集和测试集；

构建单元202，用于构建初始化模型，采用所述训练集迭代训练所述初始化模型，以生成多个基分类器，其中，每生成一个所述基分类器，更新一次所述训练集在所述医学样本中的权重；

运算单元203，用于对每一所述基分类器进行运算，以获得强分类器，其中，所述强分类器用于根据医学样本数据对疾病进行诊断和预测分析。

本发明第四实施例提供了一种可读存储介质，包括处理器、存储器以及存储在所述存储器中且被配置由所述处理器执行的计算机程序，所述处理器执行所述计算机程序实现如上任意一项所述的一种强分类器模型的训练方法。

示例性地，本发明第三实施例和第四实施例中所述的计算机程序可以被分割成一个或多个模块，所述一个或者多个模块被存储在所述存储器中，并由所述处理器执行，以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序在所述实现一种强分类器模型的训练设备中的执行过程。例如，本发明第二实施例中所述的装置。

所称处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器是所述种强分类器模型的训练方法的控制中心，利用各种接口和线路连接整个所述实现对种强分类器模型的训练方法的各个部分。

所述存储器可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现一种强分类器模型的训练方法的各种功能。所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、文字转换功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、文字消息数据等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

其中，所述实现的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一个计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本发明提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。