CN112434737A

CN112434737A - 用于脑卒中分析的多智能体评价准则融合的特征选择系统

Info

Publication number: CN112434737A
Application number: CN202011333029.3A
Authority: CN
Inventors: 张雷; 张晓雯; 于凌霜; 赵乐; 余成; 李宁; 王崇骏
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2020-11-25
Filing date: 2020-11-25
Publication date: 2021-03-02
Anticipated expiration: 2040-11-25
Also published as: CN112434737B

Abstract

本发明公开了一种用于脑卒中分析的多智能体评价准则融合的特征选择系统，包括数据输入单元、数据预处理单元、初始特征序列建立单元、多智能体强化单元、特征融合单元、逻辑回归模型单元，通过对脑卒中数据进行不同属性的处理，并通过多智能体强化学习将三种特征评价准则按照最优权重策略进行特征融合，进一步得到所有特征的重要性排序序列和最优的特征子集，本发明在提高准确率的前提下减少特征子集，得到与脑卒中最相关的影响因素，进而从特征选择的角度提高对脑卒中疾病的预测性能。

Description

用于脑卒中分析的多智能体评价准则融合的特征选择系统

技术领域

本发明涉及机器学习预测分析与医疗健康技术领域，具体涉及一种基于多智能体多评价准则融合的特征选择方法。

背景技术

脑卒中是常发生在中老年人群中的一种脑血管疾病，目前已经成为我国发病率非常高的疾病。目前，对脑卒中高危人群筛查是一项必不可少的工作，主要是是对长期吸烟、喝酒、高血压等患者进行风险评估及相关检查，以阻止脑卒中危险因素的进一步发展，预防脑卒中的发生。颈动脉粥样硬化与脑卒中发病有着密切的联系，因此通过有效的特征选择，从脑卒中高危人群的数据中找到影响颈动脉粥样硬化的相关因素，可以尽早预测和发现颈动脉斑块，并及时干预，对减少脑卒中疾病的发生具有重大意义。

传统的特征选择方法，如Filter、Wrapper等，都是采用单一的评价准则，存在一定的片面性，无法有效地评价特征选择的性能，导致所选特征子集的通用性差，分类精度低。近年来，也有一些研究提出使用多评价准则融合的方法，如将特征排序值进行求和、取最小值或者采用序关系分析法来确定融合系数，但这些融合方法在评价准则重要性程度的判断上有一定的主观性，而且参数的选择(如评价准则的权重、特征子集的维度等)存在很大的难度。

发明内容

发明目的：为了克服现有技术中存在的不足，本发明提供一种用于脑卒中分析的多智能体评价准则融合的特征选择系统，对脑卒中数据进行不同属性的处理，并通过多智能体强化学习将三种特征评价准则按照最优权重策略进行特征融合，进一步得到所有特征的重要性排序序列和最优的特征子集，在保证提高准确率的前提下减少特征子集的大小，保留有价值的特征，得到与脑卒中最相关的影响因素，进而从特征选择的角度提高对脑卒中疾病的预测性能。

技术方案：为实现上述目的，本发明采用的技术方案为：

一种用于脑卒中分析的多智能体评价准则融合的特征选择系统，包括数据输入单元、数据预处理单元、初始特征序列建立单元、多智能体强化单元、特征融合单元、逻辑回归模型单元，其中：

所述数据输入单元用于输入原始脑卒中数据。

所述数据预处理单元用于对输入原始脑卒中数据进行预处理，得到处理后的数据集。

所述初始特征序列建立单元包括卡方检验模块、F检验模块和互信息检验模块，所述卡方检验模块用于根据数据集进行特征选择得到特征的权重，将特征权重降序排序得到特征序列一。所述F检验模块用于根据数据集进行特征选择得到特征的权重，将特征权重降序排序得到特征序列二。所述互信息检验模块用于根据数据集进行特征选择得到特征的权重，将特征权重降序排序得到特征序列三。

Rank_Chi＝{R_C(1)，R_C(2)，R_C(3)，...，R_C(N)}

Rank_F＝{R_F(1)，R_F(2)，R_F(3)，...，R_F(N)}

Rank_Mut＝{R_M(1)，R_M(2)，R_M(3)，...，R_M(N)}

其中，N表示为原始特征空间的特征维数，Rank_Chi表示卡方检验准则下第i个特征在N维特征集中的权值排序序号，Rank_F表示F检验验准则下第i个特征在N维特征集中的权值排序序号，Rank_Mut表示互信息检验准则下第i个特征在N维特征集中的权值排序序号。根据卡方检验准则下第i个特征在N维特征集中的权值排序序号得到特征序列一，根据F检验验准则下第i个特征在N维特征集中的权值排序序号得到特征序列二，根据互信息检验准则下第i个特征在N维特征集中的权值排序序号得到特征序列三。

所述多智能体强化单元使用多智能体强化学习，为卡方检验模块、F检验模块和互信息检验模块三种评价准则分配一个智能体，根据得到的特征序列一、特征序列二、特征序列三和环境反馈的奖励回报进行动作的调整，得到三种评价准则的最优权重分配方法。将特征序列一、特征序列二、特征序列三根据最优权重分配方法进行特征融合，得到最终特征重要性排序序列。

所述多智能体强化单元中通过建立一个Q_Table来保存智能体c、不同的状态s和将会采取的动作a，即Q(c，s，a)，智能体每次根据epsilon-贪心法选择当前最佳的动作，动作值决定其对应的评价准则在特征融合中对应的权重系数。

所述多智能体强化单元随机初始化第一个状态s，智能体从Q_Table中使用epsilon-贪心法基于当前状态s选择动作a＝{a_Chi，a_F，a_Mut}得到当前的权重，将三种评价准则进行特征融合，得到当前的融合特征序列Rank_Cur，表示如下：

Rank_Cur＝{R_Cur(1)，R_Cur(2)，...，R_Cur(N)}

式中，R_Cur(i)为融合后第i个特征在特征集中的排序值，R_Cur(i)定义如下：

R_Cur(i)＝ω_Chi*R_C(i)+ω_F*R_F(i)+ω_Mut*R_M(i)

其中，ω_Chi表示根据卡方检验准则得到的特征在融合时的权重，ω_F表示根据F检验准则得到的特征在融合时的权重，ω_Mut表示根据互信息检验准则得到的特征在融合时的权重，R_C(i)表示根据卡方检验准则得到的第i个特征在N维特征集中的权值排序序号，R_F(i)表示根据F检验准则得到的第i个特征的权值排序序号，R_M(i)表示根据互信息检验准则得到的第i个特征的权值排序序号。

根据当前的融合特征序列Rank_Cur得到新的特征空间，将新特征空间输入环境中，构建逻辑回归模型进行训练，得到新的特征子集和对应的准确率，作为环境对智能体当前采取的动作反馈的奖励回报R(c，s，a)。

更新进入新状态s′，基于状态s′，使用epsilon-贪心法选择新动作a′。对每一个智能体c_i，使用Q-learning算法更新表中Q(c_i，s，a)的值，计算方法如下：

Q(c_i，s，a)←Q(c_i，s，a)+α[R(c_i，s，a)+Q(c_i，s′，a′)-Q(c_i，s，a)]

其中，Q(c_i，s，a)表示智能体c_i在当前状态s下执行动作a后更新得到的Q值，←表示将右边的值赋值给左边，α表示学习率，R(c_i，s，a)表示智能体c_i在当前状态s下执行动作a后获得的奖励回报，Q(c_i，s′，a′)表示智能体c_i在新状态s′下执行新动作a′后得到的Q值，Q(c_i，s，a)表示智能体c_i在当前状态s下执行动作a后得到的Q值。

继续循环到指定的训练轮数为止，得到最终特征重要性排序序列。

所述逻辑回归模型单元用于将最终特征重要性排序序列输入逻辑回归模型进行训练，得到最优的特征子集和最佳分类准确率。

优选的：所述数据输入单元为键盘或者语音输入模块。

优选的：所述数据预处理单元中包括缺失值填充、离散特征独热编码处理、连续特征鲁棒性处理。

优选的：所述缺失值填充指通过将数据集中的缺失数据统一填充“-1”进行代替。

优选的：所述离散特征独热编码处理指将原始脑卒中数据中的支付方式、工作类型进行独热编码处理。

优选的：所述连续特征鲁棒性处理指将原始脑卒中数据中的年龄、身高进行离散化处理。

本发明相比现有技术，具有以下有益效果：

本发明考虑到脑卒中数据集中无关特征和冗余特征的问题，针对已有特征选择方法的不足做出改进与创新，采用多评价准则融合与多智能体强化学习相结合的方式。通过将三种特征选择评价准则相融合，避免了单一评价准则对于特征子集评价的片面性，从而得到更优的特征子集；在基于多评价准则的基础上使用强化学习，可以从每一次选择的不同特征子集组成的环境中获得回报奖励并学习，平衡开发和探索，寻找长期的最佳权重分配策略；同时，通过多智能体强化学习为每个评价准则分配一个智能体，最终得到不同评价准则在特征融合中对应的权重系数，保证了参数选择的客观性，使模型更具有普适性和通用性；同时，在特征子集的选择上，结合了强化学习的决策能力，旨在找到对脑卒中患者发生颈动脉粥样硬化最相关的影响因素，进而从特征选择的角度提高对脑卒中疾病的分类性能，在提高准确率的前提下减少特征子集的大小；与此同时，对于数据集中缺失值、连续特征和离散特征的处理，能够进一步扩充特征空间，更好的简化模型，降低模型过拟合的风险。

附图说明

图1所示为本发明一实施例的一种用于脑卒中疾病分析的多智能体多评价准则融合的特征选择方法流程图；

图2所示为本发明一实施例的脑卒中数据预处理过程的流程图；

图3所示为本发明一实施例的多智能体强化学习得到最优权重分配策略的示意图；

图4所示为本发明一实施例的基于最优权重分配策略进行特征选择的流程图。

具体实施方式

下面结合附图和具体实施例，进一步阐明本发明，应理解这些实例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

在本实施例中，提供一种用于脑卒中疾病分析的多智能体多评价准则融合的特征选择方法，如图1所示，包括如下步骤：

S10获取数据集，在中国脑卒中筛查与预防项目中，收集了脑卒中高危人群的前驱期筛查和回访数据，包括患者的人口学信息，既往病史信息，个人史家族史信息以及颈动脉彩超结果信息等。

所述步骤S10所述数据集来源于2012-2016年度参加南京脑科医院脑梗死高危人群筛查项目的人群，最终纳入6527例样本，每个样本有68个属性。数据集以<特征属性1，…，特征属性68，对应标签>的格式保存。

S20对样本数据进行预处理，考虑缺失值填充和离散型特征与连续型特征的不同影响，将一些离散型特征进行独热编码处理，将一些连续型特征进行数据分箱的离散化处理。

如图2所示，为本发明进行数据预处理的流程图，包括缺失值填充、离散特征处理和连续特征处理。

所述缺失值填充为，将数据集中的缺失数据统一填充“-1”进行代替，因为原始数据集中的属性取值都是大于等于0的数值，统一给缺失值填充“-1”，更有利于分类模型区分缺失值和正常值，达到填充缺失值的目的。

所述离散特征处理为，将一些离散型特征(特征的取值之间没有大小的意义，如支付方式、工作类型等)进行独热编码(One-Hot Encoding)处理，使数据分布更稀疏，如支付方式有三种：城镇职工基本医疗保险、新城镇居民基本医疗保险、新型农村合作医疗，其对应的独热编码分别为100，010，001。

所述连续特征处理为，将一些连续型特征(如年龄、身高等)进行离散化处理，使离散化后的特征对异常数据有很强的鲁棒性，如将年龄的属性值进行分段，将40～50岁患者的年龄属性赋值为“1”，50～60岁患者的年龄属性赋值为“2”…，以此类推。

S30采用卡方检验(Chi-square test)、F检验(F test)和互信息检验(MutualInformation)三种评价准则进行特征选择得到每个特征的权重，将特征权重进行降序排序，得到三种评价准则对应的初始特征序列。

采用卡方检验(Chi-square test)、F检验(F test)和互信息(MutualInformation)三种评价准则对特征进行排序，计算的特征权值越大，代表该特征的分类能力越强，且权值越大的特征排序序号越小。通过对权值大小进行降序排列，可以得到初始的三个排序结果，表示如下：

Rank_Chi＝{R_C(1)，R_C(2)，R_C(3)，...，R_C(N)} (1)

Rank_F＝{R_F(1)，R_F(2)，R_F(3)，...，R_F(N)} (2)

Rank_Mut＝{R_M(1)，R_M(2)，R_M(3)，...，R_M(N)} (3)

其中，N表示为原始特征空间的特征维数，Rank_Chi、Rank_F，Rank_Mut分别表示在三种准则下第i个特征在N维特征集中的权值排序序号。

S40使用多智能体强化学习，为每个评价准则分配一个智能体，智能体将决定其对应的评价准则在特征融合中对应的权重系数，得到当前融合的特征序列，将其输入逻辑回归模型进行训练得到分类准确率作为环境的反馈，智能体根据反馈的奖励或惩罚进行动作的调整，最终得到最大奖励对应的不同评价准则的最优权重分配策略。

如图3所示，为本发明进行多智能体强化学习得到最优权重分配策略的示意图。作为后续强化学习的基础，需要得到初始的三种评价准则对于特征重要性的排序序列。具体地，将数据集作为输入，分别使用卡方检验、F检验和互信息检验进行特征选择，得到初始的三个特征序列。

S41：使用多智能体强化学习，为每个评价准则分配一个智能体，分别对应Agent_c，Agent_f，Agent_m。建立一个Q_Table来保存智能体c、不同的状态s和将会采取的动作a，即Q(c，s，a)。智能体每次根据epsilon-贪心法选择当前最佳的动作，动作值决定其对应的评价准则在特征融合中对应的权重系数，如ω_Chi，ω_F，ω_Mut。

S42：随机初始化第一个状态s，每个智能体分别从Q_Table中使用epsilon-贪心法基于当前状态s选择动作a＝{a_Chi，a_F，a_Mut}得到当前的权重策略，将三种评价准则进行特征融合，得到当前的融合特征序列。

表示如下：

Rank_Cur＝{R_Cur(1)，R_Cur(2)，...，R_Cur(N)} (4)

R_Cur(i)＝ω_Chi*R_C(i)+ω_F*R_F(i)+ω_Mut*R_M(i) (5)

根据融合后的特征序列得到新的特征空间，将新特征空间输入环境中，构建逻辑回归模型进行训练，得到新的特征子集和对应的准确率，作为环境对智能体当前采取的动作反馈的奖励回报R(c，s，a)。

根据融合后的特征序列得到新的特征空间，将新特征空间输入奖励函数，构建逻辑回归模型进行训练，得到新特征子集对应的准确率，作为环境对智能体当前采取的动作反馈的奖励回报R(s，a)。

S43：更新进入新状态s′，基于状态s′，使用epsilon-贪心法选择新动作a′。对每一个智能体c_i，得到新的奖励回报R(c_i，s′，a′)，使用Q-learning算法更新表中Q(c_i，s，a)的值，，计算方法如下：

Q(c_i，s，a)←Q(c_i，s，a)+α[R(c_i，s，a)+Q(c_i，s′，a′)-Q(c_i，s，a)] (6)

按照步骤S42-S43继续循环到指定的训练轮数为止。

S50将卡方检验、F检验和互信息检验三种评价准则根据权重分配策略进行特征融合，得到最终的特征重要性排序序列，将其输入逻辑回归模型进行训练，得到最优的特征子集和最佳分类准确率。

如图4所示，为本发明基于多智能体强化学习进行特征选择的流程图，将S40输出的结果作为最终强化学习得到的最优权重分配策略，进行基于三种评价准则的特征融合，得到最终特征序列，并将其输入逻辑回归模型进行训练，得到对脑卒中数据集的最佳分类结果，并输出最优特征子集。

所述数据输入单元用于输入原始脑卒中数据，所述数据输入单元为键盘。

综上所述，本发明能够通过将不同的评价准则作为不同的智能体进行强化学习，根据得到的权重分配策略进行特征融合，进而从不同角度评价特征的重要程度，进行有效的特征选择，获得最优的特征子集，得到与脑卒中患者颈动脉粥样硬化最相关的影响因素；同时不同评价准则进行融合能够提高算法的稳定性，提升分类的精度。并针对脑卒中数据集给出了数据预处理的策略，可进一步提升模型分类性能。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种用于脑卒中分析的多智能体评价准则融合的特征选择系统，其特征在于：包括数据输入单元、数据预处理单元、初始特征序列建立单元、多智能体强化单元、特征融合单元、逻辑回归模型单元，其中：

所述数据输入单元用于输入原始脑卒中数据；

所述数据预处理单元用于对输入原始脑卒中数据进行预处理，得到处理后的数据集；

所述初始特征序列建立单元包括卡方检验模块、F检验模块和互信息检验模块，所述卡方检验模块用于根据数据集进行特征选择得到特征的权重，将特征权重降序排序得到特征序列一；所述F检验模块用于根据数据集进行特征选择得到特征的权重，将特征权重降序排序得到特征序列二；所述互信息检验模块用于根据数据集进行特征选择得到特征的权重，将特征权重降序排序得到特征序列三；

Rank_Chi＝{R_C(1)，R_C(2)，R_C(3)，...，R_C(N)}

Rank_F＝{R_F(1)，R_F(2)，R_F(3)，...，R_F(N)}

Rank_Mu＝{R_M(1)，R_M(2)，R_M(3)，...，R_M(N)}

其中，N表示为原始特征空间的特征维数，Rank_Chi表示卡方检验准则下第i个特征在N维特征集中的权值排序序号，Rank_F表示F检验验准则下第i个特征在N维特征集中的权值排序序号，Rank_Mut表示互信息检验准则下第i个特征在N维特征集中的权值排序序号；根据卡方检验准则下第i个特征在N维特征集中的权值排序序号得到特征序列一，根据F检验验准则下第i个特征在N维特征集中的权值排序序号得到特征序列二，根据互信息检验准则下第i个特征在N维特征集中的权值排序序号得到特征序列三；

所述多智能体强化单元使用多智能体强化学习，为卡方检验模块、F检验模块和互信息检验模块三种评价准则分配一个智能体，根据得到的特征序列一、特征序列二、特征序列三和环境反馈的奖励回报进行动作的调整，得到三种评价准则的最优权重分配方法；将特征序列一、特征序列二、特征序列三根据最优权重分配方法进行特征融合，得到最终特征重要性排序序列；

所述多智能体强化单元中通过建立一个Q_Table来保存智能体c、不同的状态s和将会采取的动作a，即Q(c，s，a)，智能体每次根据epsilon-贪心法选择当前最佳的动作，动作值决定其对应的评价准则在特征融合中对应的权重系数；

Rank_Cur＝{R_Cur(1)，R_Cur(2)，...，R_Cur(N)}

R_Cu(i)＝ω_Chi*R_C(i)+ω_F*R_F(i)+ω_Mut*R_M(i)

其中，ω_Chi表示根据卡方检验准则得到的特征在融合时的权重，ω_F表示根据F检验准则得到的特征在融合时的权重，ω_Mut表示根据互信息检验准则得到的特征在融合时的权重，R_C(i)表示根据卡方检验准则得到的第i个特征在N维特征集中的权值排序序号，R_F(i)表示根据F检验准则得到的第i个特征的权值排序序号，R_M(i)表示根据互信息检验准则得到的第i个特征的权值排序序号；

根据当前的融合特征序列Rank_Cur得到新的特征空间，将新特征空间输入环境中，构建逻辑回归模型进行训练，得到新的特征子集和对应的准确率，作为环境对智能体当前采取的动作反馈的奖励回报R(c，s，a)；

更新进入新状态s′，基于状态s′，使用epsilon-贪心法选择新动作a′；对每一个智能体c_i，使用Q-learning算法更新表中Q(c_i，s，a)的值，计算方法如下：

其中，Q(c_i，s，a)表示智能体c_i在当前状态s下执行动作a后更新得到的Q值，←表示将右边的值赋值给左边，α表示学习率，R(c_i，s，a)表示智能体c_i在当前状态s下执行动作a后获得的奖励回报，Q(c_i，s′，a′)表示智能体c_i在新状态s′下执行新动作a′后得到的Q值，Q(c_i，s，a)表示智能体c_i在当前状态s下执行动作a后得到的Q值；

继续循环到指定的训练轮数为止，得到最终特征重要性排序序列；

2.根据权利要求1所述用于脑卒中分析的多智能体评价准则融合的特征选择系统，其特征在于：所述数据输入单元为键盘或者语音输入模块。

3.根据权利要求2所述用于脑卒中分析的多智能体评价准则融合的特征选择系统，其特征在于：所述数据预处理单元中包括缺失值填充、离散特征独热编码处理、连续特征鲁棒性处理。

4.根据权利要求3所述用于脑卒中分析的多智能体评价准则融合的特征选择系统，其特征在于：所述缺失值填充指通过将数据集中的缺失数据统一填充“-1”进行代替。

5.根据权利要求4所述用于脑卒中分析的多智能体评价准则融合的特征选择系统，其特征在于：所述离散特征独热编码处理指将原始脑卒中数据中的支付方式、工作类型进行独热编码处理。

6.根据权利要求5所述用于脑卒中分析的多智能体评价准则融合的特征选择系统，其特征在于：所述连续特征鲁棒性处理指将原始脑卒中数据中的年龄、身高进行离散化处理。