CN114239742A - 基于规则分类器的医疗数据分类方法及相关设备 - Google Patents

基于规则分类器的医疗数据分类方法及相关设备 Download PDF

Info

Publication number
CN114239742A
CN114239742A CN202111576262.9A CN202111576262A CN114239742A CN 114239742 A CN114239742 A CN 114239742A CN 202111576262 A CN202111576262 A CN 202111576262A CN 114239742 A CN114239742 A CN 114239742A
Authority
CN
China
Prior art keywords
attribute
classification
population
attributes
iteration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111576262.9A
Other languages
English (en)
Other versions
CN114239742B (zh
Inventor
赵青松
王小燕
孙建彬
赵蕊蕊
游雅倩
熊思杰
葛冰峰
姜江
杨克巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202111576262.9A priority Critical patent/CN114239742B/zh
Publication of CN114239742A publication Critical patent/CN114239742A/zh
Application granted granted Critical
Publication of CN114239742B publication Critical patent/CN114239742B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • G06F18/256Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2111Selection of the most significant subset of features by using evolutionary computational techniques, e.g. genetic algorithms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/257Belief theory, e.g. Dempster-Shafer

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种基于规则分类器的医疗数据分类方法及相关设备;方法包括:确定医疗数据集样本执行分类时的分类顺序;在每次分类中,计算费希尔得分、皮尔逊相关系数和互信息,得到属性可靠性并排序;根据可靠性排序选择属性组建初始特征子集,根据预设的约束条件,设置参考值和参考证据权重,构建初始化种群并执行多目标遗传算法的迭代得到目标种群,并利用规则分类器对全部样本进行分类,得到初始特征子集的分类准确率;并调整初始特征子集中的属性,得到目标特征子集;根据分类顺序,进行全部类别的分类,得到每次分类操作的目标特征子集和规则分类器;集成全部目标特征子集和规则分类器,用于对医疗数据集中的新样本进行分类。

Description

基于规则分类器的医疗数据分类方法及相关设备
技术领域
本申请的实施例涉及数据处理的技术领域,尤其涉及一种基于规则分类 器的医疗数据分类方法及相关设备。
背景技术
在现有的多导睡眠图评估方法中,多利用大量不同的监测信号作为多个 特征或属性,并基于每个特征所产生的大量数据对睡眠健康进行评估,但在 实际应用中,大量的监测信号往往意味着需要病患付出大量的成本,对身体 的不同部位进行检测,并且多类信号数据的监测过程需要在特殊的场所进行, 这带来的监测成本和数据分析成本十分高昂,但少量的监测数据所形成的样 本数量小,数据分类难以精确,并且难以对逐渐增加的数据进行有效处理。
基于此,需要一种能够实现在有限数据的基础上,对以睡眠为代表的健 康数据进行有效分类的方案。
发明内容
有鉴于此,本申请的目的在于提出一种基于规则分类器的医疗数据分类 方法及相关设备。
基于上述目的,本申请提供了一种基于规则分类器的医疗数据分类方法, 应用于存储有医疗数据及的数据库,包括:
对医疗数据集预设多个类别,并确定所述医疗数据集中每个样本具备的 多个属性和每个所述样本初始所隶属的类别;
在全部所述类别中确定对每个所述类别执行分类时的分类顺序;
在每次针对单个所述类别的分类中,对于每个所述属性,利用该属性和 每个所述类别计算费希尔得分、皮尔逊相关系数和互信息,对计算结果进行 融合,得到该属性的属性可靠性,根据全部所述属性可靠性得到可靠性排序;
根据所述可靠性排序从全部所述属性中选择预定数量的所述属性作为初 始特征子集,对于所述初始特征子集中的每个所述属性,根据预设的约束条 件,设置多个参考值和参考证据权重,利用所述参考值个数、参考值个数和 所述参考证据权重构建初始化种群;
对所述初始化种群执行多目标遗传算法的迭代,得到目标种群,利用所 述目标种群构建所述规则分类器,并利用所述规则分类器对全部所述样本进 行分类,得到关于所述初始特征子集的分类准确率;
根据所述可靠性排序和所述分类准确率调整所述初始特征子集中的所述 属性,得到目标特征子集;
根据所述分类顺序,进行全部所述类别的分类,得到每次分类操作的所 述目标特征子集和所述规则分类器;集成全部所述目标特征子集和所述规则 分类器,用于对所述医疗数据集中的新样本进行分类。
进一步地,在每次针对单个所述类别的分类中,所述对于每个所述属性, 利用该属性和每个所述类别计算费希尔得分、皮尔逊相关系数和互信息,对 计算结果进行融合,得到该属性的属性可靠性,包括:
在每次针对单个所述类别的分类中,执行关于该类别,和非该类别的二 分类操作;
对于每个所述属性,计算该属性在所述二分类操作中的两个所述类别中 的类间均值、该属性在每个所述类别中的类内均值和类内方差;
利用所述类间均值、类内均值和类内方差计算所述费希尔得分;
对于每个所述属性,计算该属性与每个所述类别的协方差、该属性在两 个所述类别中的类间方差,对于每个所述类别,计算该类别的类别方差;
利用所述协方差、所述类间方差和所述类别方差计算每个所述属性与每 个所述类别之间的的所述皮尔逊相关系数;
对于每个所述属性和每个所述类别,利用该属性的值域和该类别的值域 计算该属性和该类别之间的互信息;
对所述费希尔得分、所述皮尔逊相关系数和所述互信息的计算结果均进 行归一化处理,并对归一化处理后的数值取均值,作为该属性的属性可靠性。
进一步地,设置多个参考值和参考证据权重,利用所述参考值个数、参 考值个数和所述参考证据权重构建初始化种群,包括:
根据预设的约束条件,对于每个所述属性,设置多个参考值,并为该属 性的每个所述参考值设置对应的参考证据,为每个所述参考证据设置对于该 属性的参考证据权重;
将全部所述属性所对应的所述参考值、参考值个数和所述参考证据权重 组合为个体编码,通过对所述个体编码多次初始化,得到多个初始个体并组 成初始化种群。
进一步地,对所述初始化种群执行多目标遗传算法的迭代,包括:
在每次所述多目标遗传算法的每次迭代中,执行如下操作:
响应于确定本次迭代为首次迭代,在初始化种群中,对全部初始个体构 建帕累托等级的排序,并对每个所述初始个体计算拥挤度,在初始化种群中, 选取多个所述初始个体,根据每个所述初始个体的所述帕累托等级和所述拥 挤度,执行竞标选择法,得到本次迭代的父代种群;响应于确定本次迭代为 非首次迭代,在前一次迭代得到的新代种群中,对全部新代个体构建帕累托 等级的排序,并对每个所述新代个体计算拥挤度,在前一次迭代得到的所述 新代种群中,选取多个所述新代个体,根据每个新代个体的所述帕累托等级和所述拥挤度,执行竞标选择法,得到本次迭代的所述父代种群;
对本次迭代的所述父代种群中的多个父代个体通过执行模拟二进制交叉 法和多项式变异,得到本次迭代的子代种群;
将本次迭代的所述父代种群和所述子代种群合并,得到本次迭代的过渡 种群;
在本次迭代的所述过渡种群中,对全部过渡个体构建帕累托等级的排序, 并对每个所述过渡个体计算拥挤度;
将本次迭代的所述过渡种群中的前多个过渡个体组成本次迭代的所述新 代种群。
进一步地,构建帕累托等级的排序,包括:
对于每个所述初始个体,计算利用该初始个体执行分类的错误率,根据 所述错误率构建第一目标函数;
利用该初始个体中所述参考值个数,构建第二目标函数;
根据所述帕累托支配原则,以所述第一目标函数和所述第二目标函数的 取值越小越优为目标,对所述初始化种群中的全部初始个体进行所述帕累托 等级的排序;
对于每个所述新代个体,计算利用该新代个体执行分类的错误率,根据 所述错误率构建所述第一目标函数;
利用该新代个体中所述参考值个数,构建所述第二目标函数;
根据所述帕累托支配原则,以所述第一目标函数和所述第二目标函数的 取值越小越优为目标,对所述新代种群中的全部新代个体进行所述帕累托等 级的排序;
对于每个所述过渡个体,计算利用该过渡个体执行分类的错误率,根据 所述错误率构建所述第一目标函数;
利用该过渡个体中所述参考值个数,构建所述第二目标函数;
根据所述帕累托支配原则,以所述第一目标函数和所述第二目标函数的 取值越小越优为目标,对所述过渡种群中的全部过渡个体进行所述帕累托等 级的排序;
所述计算拥挤度,包括:
对于每个所述初始个体、所述新代个体和所述过渡个体,利用所述第一 目标函数计算第一拥挤度分量,利用所述第二目标函数计算第二拥挤度分量;
利用所述第一拥挤度分量和所述第二拥挤度分量计算所述拥挤度。
进一步地,在本次迭代的所述过渡种群中,对全部过渡个体构建帕累托 等级的排序,并对每个所述过渡个体计算拥挤度,包括:
在本次迭代中,对于每个所述过渡个体中的每个所述属性,利用该属性 对应的所述参考值、所述参考值个数和所述参考证据权重计算该属性的属性 证据和属性证据权重,利用所述属性可靠性和所述属性证据权重对全部所述 属性证据进行融合,利用融合的结果对所述样本进行分类决策;
利用每个所述过渡个体对全部所述样本进行决策分类的结果,利用该分 类决策的结果,对对全部过渡个体构建帕累托等级的排序,并对每个所述过 渡个体计算拥挤度。
进一步地,利用所述目标种群构建所述规则分类器,包括:
响应于确定达到迭代的目标次数,得到目标种群,根据帕累托支配原则, 在所述目标种群中确定目标个体;
利用所述目标个体中每个所述属性对应的所述参考值、所述参考值个数 和所述参考证据权重计算该属性的属性证据和属性证据权重,利用所述属性 可靠性和所述属性证据权重对全部所述属性证据进行融合,得到所述规则分 类器。
进一步地,根据所述可靠性排序和所述分类准确率调整所述初始特征子 集中的所述属性,得到目标特征子集,包括:
在未加入所述初始特征子集的所述属性中,选择所述可靠性排序最靠前 的一个所述属性,加入到所述初始特征子集;
基于构建的所述规则分类器,利用所述初始特征子集中的全部所述属性 对全部所述样本进行分类;
基于分类结果,计算关于该所述初始特征子集的所述分类准确率;
根据所述分类准确率的数值变化,调整所述初始特征子集中的所述属性;
将调整后的所述初始特征子集作为所述目标特征子集。
进一步地,根据所述分类准确率的数值变化,调整所述初始特征子集中 的所述属性,包括:
响应于确定所述分类准确率增高,保留最后加入的所述属性,并继续在 未加入所述初始特征子集的所述属性中,选择所述可靠性排序最靠前的一个 所述属性,加入到所述初始特征子集;
响应于确定所述分类准确率未增高,去掉最后加入的所述属性,并保持 所述初始特征子集中包含的所述属性不变。
基于同一发明构思,本申请还提供了一种基于规则分类器的医疗数据分 类装置,与存储有医疗数据集的数据库连接,包括:预处理模块、单次分类 模块和全局分类模块;
其中,所述预处理模块,被配置为对医疗数据集预设多个类别,并确定 所述医疗数据集中每个样本具备的多个属性和每个所述样本初始所隶属的类 别;并在全部所述类别中确定对每个所述类别执行分类时的分类顺序。
所述单次分类模块,被配置为在每次针对单个所述类别的分类中,对于 每个所述属性,利用该属性和每个所述类别计算费希尔得分、皮尔逊相关系 数和互信息,对计算结果进行融合,得到该属性的属性可靠性,根据全部所 述属性可靠性得到可靠性排序;
进一步地,根据所述可靠性排序从全部所述属性中选择预定数量的所述 属性作为初始特征子集,对于所述初始特征子集中的每个所述属性,根据预 设的约束条件,设置多个参考值和参考证据权重,利用所述参考值个数、参 考值个数和所述参考证据权重构建初始化种群;
进一步地,对所述初始化种群执行多目标遗传算法的迭代,得到目标种 群,利用所述目标种群构建所述规则分类器,并利用所述规则分类器对全部 所述样本进行分类,得到关于所述初始特征子集的分类准确率;
进一步地,根据所述可靠性排序和所述分类准确率调整所述初始特征子 集中的所述属性,得到目标特征子集。
所述全局分类模块,被配置为根据所述分类顺序,进行全部所述类别的 分类,得到每次分类操作的所述目标特征子集和所述规则分类器;集成全部 所述目标特征子集和所述规则分类器,用于对所述医疗数据集中的新样本进 行分类。
基于同一发明构思,本申请还提供了一种电子设备,包括存储器、处理 器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所 述程序时实现如上任意一项所述的基于规则分类器的医疗数据分类方法。
基于同一发明构思,本申请还提供了一种非暂态计算机可读存储介质, 其中,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用 于使所述计算机执行如上述基于规则分类器的医疗数据分类方法。
从上面所述可以看出,本申请提供的基于规则分类器的医疗数据分类方 法及相关设备,按照实际需求对每个类别的分类划分顺序,并在每次分类中, 仅对一个类别进行分类,在每次分类中,基于属性可靠性对全部属性进行排 序,仅使用能够提高本次分类准确率的属性建立初始特征子集,通过综合考 虑了属性可靠性排序和分类准确率对初始特征子集中的属性进行调整,实现 了利用先到的数据属性训练规则分类器进行粗略分类,而后再根据后续获取 到的属性不断训练其他分类器,逐步进行更加细致的分类,并且本申请在每 次分类中,对于属性可靠性采取了多准则评价的方式进行计算,对参数的优 化也利用了多目标遗传算法,实现了参数与结构的联合全局性优化,提高了 对样本数据的分类准确率,从而优化了规则分类器的性能,在应对增量数据 的同时,实现依靠少量的监测数据,对睡眠健康的状态进行精确有效地分类。
附图说明
为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或 相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中 的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创 造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的基于规则分类器的医疗数据分类方法的流程图;
图2为本申请实施例的基于规则分类器的医疗数据分类装置模块示意图;
图3a为本申请实施例的基于规则分类器的医疗数据分类过程示意图a;
图3b为本申请实施例的基于规则分类器的医疗数据分类过程示意图b;
图4为本申请实施例的电子设备结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,以下结合具体实施 例,并参照附图,对本申请进一步详细说明。
需要说明的是,除非另外定义,本申请的实施例使用的技术术语或者科 学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本 申请的实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、 数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类 似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件 或者物件及其等同,而不排除其他元件或者物件。
如背景技术部分所述,相关的基于规则分类器的医疗数据分类方法还难 以满足实际应用的需要。
申请人在实现本申请的过程中发现,相关的基于规则分类器的医疗数据 分类方法存在的主要问题在于:一些典型的医疗数据,由于各种原因,往往 难以获取大量的有效数据样本,例如多导睡眠图评估,需要记录大量的数据, 但在更多情况时,由于病患对身体需要进行多处,多类信号的监测,并且需 要在特殊的场所进行,成本十分高昂,难以负担,少部分数据的测量可以借 助日常的穿戴设备进行,但由于以此获取的数据样本小,少量监测所得到的 小样本数据,难以产生准确的分类效果。
在相关技术中,通常将样本数量小于等于预定的有限数量的数据集作为 小样本条件的数据集,例如,预定的有限数量为30个、40、50等,具体的 数量可根据实际情况或者具体经验进行更改或设定。
对于小样本数据集的数据分类或数据处理等操作必须使用统计量的精确 分布来进行统计推断,这也是当前处理小样本数据的困难之处。
可以理解的是,小样本条件是相对于“大样本”而言样本数量较少的情 况,而非必须以30个样本数量作为限定,例如,相对于千万条数据持有量的 大样本数据集而言,100个或200个样本的数据集依然可以看作是小样本数 据集,进而需要采取更加精确的数据处理方式。
容易理解的是,对于小样本条件下的数据分类方法同样也可以适用于“大 样本”数据集,而“大样本”条件下的数据处理方法,由于精确度不够高, 而难以适用于小样本条件下的数据处理。
进一步地,申请人在研究中还发现,在一些医疗数据的分类中,以PSG 评估为例,多利用大量不同的监测信号作为数据的多个特征或属性,并基于 每个特征所产生的数值对睡眠状态进行评估,但在实际应用中,数据的获取 往往存在先后顺序,并且某些属性获取的条件苛刻或者花费昂贵。
例如,在医疗数据分类相关的PSG评估方法中,大量的监测信号来自于 对身体不同部位进行监测,并使用不同的特殊仪器,这往往意味着需要病患 付出大量的成本,并且,很多信号数据的监测过程需要在不同时段进行,例 如在刚刚患者将要入睡时,与快速眼动期睡眠状态的相关的数据属性是无用 的,因此,存在利用部分属性就能对患者的睡眠状态进行粗略分类的情况, 通过分类结果,再判断是否需要获取后续属性,这大大节省了时间和资源。
以多导睡眠图为例,为了节省监测的成本和数据处理的成本,可以先对 医疗数据样本进行粗分类,仅区分患者是否处于入睡状态,当患者处于入睡 状态时,再由后续所获取的其他数据属性,对患者处于何种深度睡眠还是浅 度睡眠进行划分,之后,再获取与眼快动睡眠状态和慢波睡眠状态相关的数 据属性,以对医疗数据划分更加细致的类别。
可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平 台、设备集群来执行。
以下,通过具体的实施例,来详细说明本申请的技术方法。
参考图1,本申请一个实施例的基于规则分类器的医疗数据分类方法, 包括以下步骤:
步骤S101、对医疗数据集预设多个类别,并确定所述医疗数据集中每个 样本具备的多个属性和每个所述样本初始所隶属的类别;并在全部所述类别 中确定对每个所述类别执行分类时的分类顺序。
在本申请的实施例中,以人类睡眠健康监测作为具体的示例,在人类睡 眠健康的监测技术中,多采用PSG作为评估手段,其中,PSG需要通过多个 传感器监测患者的多项体征,以得到关于被监测患者睡眠状态的多项信号, 例如在每次监测得到的一个数据样本中,可以包括患者的呼吸节律、心率、 脑电图、心电图、眼电图、肌电图、SPO2(脉搏氧饱和度)和HR(心率) 等十几项体征,并在每次测量得到的数据中,将上述的多项信号作为该次测 量得到的数据样本的多个属性,依据上述的十多项属性,来推断患者处于深 度入睡、浅度入睡或清醒等睡眠状态。
在本实施例中,可以将采集的患者数据作为医疗数据集,将每次采集的 患者数据作为该医疗数据集中的一个数据样本,在本申请中也简称样本,将 不同的睡眠状态作为对样本进行分类的多个类别。
在本实施例中,如图3a和图3b所示,将对医疗数据样本进行多次分类, 每次分类仅划分出上述类别中的一个类别,也即在每次分类操作中,均执行 二分类的操作。
其中,该二分类操作可以有两种方式,在一种方式下,如图3a所示,针 对选定的某1个特定特征类别进行分类,则该分类结果为该特定类别,和非 该特定类别两个类别,并且根据不断增量获取的属性,对非该特定类别中的 样本再次进行另一特定类别的二分类操作,直至一次区分出所有细致的类别, 在本实施例中,在每次分类中,特定类别的选取可以根据实际需求和情况进 行选择。
在另一种方式下,可如图3b所示,可以根据现有的数据属性,先对医疗 数据集执行粗分类的二分类操作,再根据不断获取的数据属性,粗分类得到 的两个类别进行不断细化,也即将其逐步分为更加细致的类别。
在本实施例中,将以图3a所示的第一种方式作为示例进行说明,需要另 外说明的是,这两种方式只是分类顺序有细微差别,可以根据具体场景的情 况进行选择,在规则分类器的构建以及方法操作上没有差别。
进一步地,人类睡眠健康监测数据所标记的类别有6种,分别为一种清 醒状态w,和五种睡眠状态:S1-S5。睡眠状态分为快速眼动期睡眠和非快速 眼动期睡眠,非快速眼动期又分为1期、2期、3期、4期,其中1期是睡眠 潜伏期,2期是浅睡期,3期、4期是深度睡眠期。样本类别S1到S4对应非 快速眼动期的1期、2期、3期和4期,样本类别S5对应快速眼动期。申请 人研究分发现,睡眠状态为S1和S5的样本量较少,这是因为非快速眼动期 1期和4期分别与2期和3期较接近。为了使各类别样本量接近并且类别便 于区分,将非快速眼动期1期和2期统称为浅度睡眠状态,非快速眼动期3 期和4期统称为深度睡眠状态。重新定义睡眠类别后,睡眠样本分为4类, 分别为清醒状态y1、浅度睡眠状态y2、深度睡眠状态y3,快速眼动期睡眠状 态y4
在本实施例中,PSG评估可以涉及12个监测信号,其获取需要多个传 感器,对于大多数需要每日睡眠监测的使用者而言,PSG的获取被认为是昂 贵且不方便的。而常用于区分睡眠和清醒的属性SPO2和HR的获取相对容 易许多,并且对睡眠状态分类时,若判定人处于清醒状态则无需再确定属于 何种睡眠状态,可以精简其他睡眠状态相关的属性的获取和分类过程;并可 以进一步在判定患者进入到睡眠状态后,再进一步获取相关的属性,以确定 是浅度睡眠或其他睡眠状态,最后确定是深度睡眠或快速眼动期睡眠状态。
在本实施例中,确定一共需要3次分类,首先区分清醒状态y1和非清醒 状态,也即其他所有睡眠状态:y2、y3和y4;而后区分浅度睡眠状态y2和非 浅度睡眠状态,也即其他两种睡眠状态:y3和y4;最后区分浅度睡眠状态y3和 快速眼动期睡眠状态y4,并且需要在三次分类中均分别构建1个规则分类器。
需要说明的是,本实施例仅以有限的类别数量为示例,在实际操作中, 类别数量可以为任意数量,并且在样本数量足够多的情况下,可以将类别的 划分以无限细致的方式进行下去。
在本实施例中,可以将医疗数据集设定具备K个样本,并且为了描述方 便,将每个样本具备的上述12个属性设定为M个属性:x={x1,x2,...,xM},医 疗数据集所具备的4个类别表示为N个类别:Θ={y1,…yn,…,yN},其中, N=4,yn是第n个类别,则一个样本向量可以表示为:x={(x1,x2,...,xM),yn}, 并且能够被分解为M个样本对{(xi,yn),i=1,2,...,M}。
进一步地,还需要对每个属性设置多个参考值,并表示为:
Figure RE-GDA0003471313380000101
Figure RE-GDA0003471313380000102
其中,i表示第i个属性,Ji=6,i=1,2,...,M。
进一步地,为每个参考值设置一个对应的参考证据,将下述计算得到的 属性可靠性,等价为关于该属性的参考证据的可靠性因子,并为每个参考证 据设置一个参考证据权重。
进一步地,申请人在研究中发现,参考值个数越多,则规则分类器的分 类准确性将会越高,同时,规则分类器作为一个整体系统,也将会越复杂, 根据不相容原理,随着系统复杂性的增加,人们对系统的行为将逐渐缺乏正 确、有意义的陈述能力;如果超过了界限,精确性和适合性将会成为具有冲 突性的概念;这表明对事物的精确描述和有意义的描述并不总是一致的,故 此,对于参考值个数需要设定必要的阈值范围,在本实施例中,根据人们处 理信息能力的限度,可以拟定参考值个数的上限为9,而属性参考值的个数 至少为2,才能保证下述证据融合过程的顺利进行,因此参考值个数的下限 为2。
基于上述陈述,可以得到参考值个数、参考值和参考证据权重的约束条 件如下:
Figure BDA0003424856090000111
其中,Ji表示第i个属性的参考值个数,
Figure BDA0003424856090000112
表示M个属性中,第i个属 性的第j个参考值,
Figure BDA0003424856090000113
表示M个属性中,第i个属性的第j个参考证据的参 考证据权重。
步骤S102、在每次针对单个所述类别的分类中,对于每个所述属性,利 用该属性和每个所述类别计算费希尔得分、皮尔逊相关系数和互信息,对计 算结果进行融合,得到该属性的属性可靠性,根据全部所述属性可靠性得到 可靠性排序。
在本申请的实施例中,由于在每次分类中的操作均为相同操作,本实施 例中仅以第一次分类作为示例进行说明。
如上所述,每次分类虽然是针对单个特定的类别,但所进行的是二分类 操作,因此必然会得到两个类别。
在每次分类中,均首先计算所持有的全部属性的属性可靠性,并将该属 性可靠性等价为该属性各个参考证据的可靠性因子。
在本实施例中,采用了多准则评价的方式对属性进行评价,并将评价的 结果进行融合,作为该属性的属性可靠性,并进一步地,将该属性的可靠性, 等价为下述关于该属性的参考证据的可靠性因子。
具体地,需要确定单独依据该属性直接判定隶属于各个类别的样本及其 数量,并对于每个属性,计算其Fisher(费希尔)得分、Pearson(皮尔逊) 相关系数和互信息。
对于Fisher得分的计算,可以采取如下的公式进行:
Figure BDA0003424856090000121
其中,xi表示在M个属性中的第i个属性,N表示该医疗数据集所具备 的N个类别;nj表示在第j(j=1,2,...,N)个类别中样本的个数;μj表示第j类 样本中属性xi的类内均值;σj表示和第j类样本中属性xi的类内方差,μ表示 属性xi在全部类别中的类间均值;当Fisher得分越大,则属性的类间距离越 大且类内距离越小,意味着此种属性会使规则分类器具有更高的分类准确度。
对于Pearson相关系数的计算,可以采取如下的公式进行:
Figure BDA0003424856090000122
其中,Cov(xi,y)表示属性xi与类别y的协方差,Var(xi)表示基于全部类别 时,属性xi的类间方差,Var(y)表示类别y的类别方差。
进一步地,Pearson相关系数的数值介于0到1之间,数值越大,则表明 该属性与该类别之间的相关性越强,若数值为0,则表明该属性与该类别无 线性相关关系;其中,若上述公式的绝对值内的数值大于零,则表明该属性 与该特征为正相关,若上述公式的绝对值内的数值小于零,则表明该属性与 该特征为负相关。
对于互信息的计算,可以采取如下的公式进行:
Figure BDA0003424856090000123
其中,基于给定数据集的样本数为K,属性个数为M,用x1,x2,...,xm表示, y表示样本的类别,特征xi的值域为Vi,y的值域为Vy,其中p(vi,vy)表示属性 xi的取值为vi且类别y的取值为vy的概率。I(xi,y)的值越大,表示特征xi与类 别y的关联度越大。
进一步地,对于每个属性,对计算得到的费希尔得分、皮尔逊相关系数 和互信息的结果均进行归一化处理,并对归一化处理后的数值取均值,作为 该属性的属性可靠性。
具体地,对于给定的属性,计算得到的费希尔得分、皮尔逊相关系数和 互信息的结果表示为:
Figure BDA0003424856090000131
其中,pi,j表示第i个评价准则计算的第j个属性的结果,M为属性个数, S1、S2和S3分别表示该属性的费希尔得分、皮尔逊相关系数和互信息的计 算结果。
进一步地,采取如下所示的公式,对费希尔得分、皮尔逊相关系数和互 信息的计算结果进行归一化处理:
Figure BDA0003424856090000132
其中ri,j表示第i个评价准则计算的第j个属性的结果,并可以将其进一 步表示为:
Figure BDA0003424856090000133
其中,R1、R2和R3分别表示该属性的费希尔得分、皮尔逊相关系数和 互信息在经过归一化处理后的计算结果。
进一步地,由于每个单一准则有其特有的排序打分规则,因此,融合各 个评价准则得到的结果才能全面多方位地衡量属性的可靠性,具体地,采用 如下公式,对三个评价准则的结果进行融合:
Figure BDA0003424856090000134
其中,rj表示M个属性中第j个属性的属性可靠性。
进一步地,在计算全部属性的属性可靠性后,按照属性可靠性从大到小 的顺序,对全部属性进行排序。
步骤S103、根据所述可靠性排序从全部所述属性中选择预定数量的所述 属性作为初始特征子集,对于所述初始特征子集中的每个所述属性,根据预 设的约束条件,设置多个参考值和参考证据权重,利用所述参考值个数、参 考值个数和所述参考证据权重构建初始化种群。
在本申请的实施例中,在本申请的实施例中,在每次分类中,基于上述 确定的属性可靠性排序,从全部属性中选择预定数目的属性,并将选择的属 性作为初始特征子集。
在本实施例中,进行每次分类时,均首先从全部属性中选择2个属性作 为初始特征子集,并为该初始特征子集设定可靠性阈值。
进一步地,基于该初始特征子集中的属性,以及各个属性的参考值,参 考证据,参考证据权重和可靠性因子构建规则分类器,并计算基于当前属性 的初始特征子集的分类正确率。
首先,需要对参考证据权重、参考值和参考值个数进行优化,在本实施 例中采取了多目标遗传算法,对规则分类进行了结构性优化,以达到对上述 参数进行优化的目的。
在本实施例的结构性优化中,首先,将参考值、参考值个数和参考证据 权重作为待优化参数,进行实数编码,得到如图3所示的个体编码:当属性 个数为M个时,则编码的前M位为每个属性的参考值个数,例如,JM表示 第M个属性的参考值个数;之后的7M位为每个属性的参考值,例如,
Figure BDA0003424856090000141
表 示第M个属性的第2个参考值;最后9M位为参考证据权重,例如,
Figure BDA0003424856090000142
表 示第M个属性的第9个参考证据的参考证据权重,需要说明的是,由于每个 参考值的最小值和最大值由该参考值对应的属性的最小值和最大值确定,因 此在个体编码部分,将参考值的最大值和最小值去掉,将每个属性参考值编 码为7个。
进一步地,根据上述约束条件,对图3中的个体编码进行初始化,为个 体编码中的每个参数赋予约束条件之内的随机数值,得到一个初始个体,并 进一步对该个体编码进行多次初始化,得到参数的数值不同的初始个体,在 本实施例中,可以对个体编码进行200次初始化,以生成200个初始个体, 将该200个初始个体共同组成种群规模N等于200的初始化种群。
步骤S104、对所述初始化种群执行多目标遗传算法的迭代,得到目标种 群,利用所述目标种群构建所述规则分类器,并利用所述规则分类器对全部 所述样本进行分类,得到关于所述初始特征子集的分类准确率。
在本申请的实施例中,采取多目标遗传算法,对初始化种群进行迭代。
在每次迭代中,若判定该次迭代为首次迭代,则首先对初始化种群中的 全部初始个体构建帕累托等级的排序,并对每个初始个体计算拥挤度,在初 始化种群中,选取多个初始个体,在本实施例中可以是2个初始个体,根据 每个初始个体的帕累托等级和拥挤度,执行竞标赛选择法,得到本次迭代的 父代种群;对本次迭代的父代种群中的多个父代个体通过执行模拟二进制交 叉法和多项式变异,得到本次迭代的子代种群;将本次迭代的父代种群和子 代种群合并,得到本次迭代的过渡种群;在本次迭代的过渡种群中,对全部 过渡个体构建快速非支配级排序,并对每个过渡个体计算拥挤度;将本次迭 代的过渡种群中的前多个过渡个体组成本次迭代的新代种群。
若该次迭代非首次迭代,则对前一次迭代得到的新代种群中,对全部新 代个体构建帕累托等级的排序,并对每个新代个体计算拥挤度,在前一次迭 代得到的新代种群中,选取多个新代个体,根据每个新代个体的帕累托等级 和拥挤度,执行竞标赛选择法,得到本次迭代的父代种群;对本次迭代的父 代种群中的多个父代个体通过执行模拟二进制交叉法和多项式变异,得到本 次迭代的子代种群;将本次迭代的父代种群和子代种群合并,得到本次迭代 的过渡种群;在本次迭代的过渡种群中,对全部过渡个体构建快速非支配级排序,并对每个过渡个体计算拥挤度;将本次迭代的过渡种群中的前多个过 渡个体组成本次迭代的新代种群。
具体地,在本实施例中将以首次迭代为例,对多目标遗传算法的每次迭 代过程进行如下的详细描述。
在每次迭代中,首先,在初始化种群中构建初始个体的帕累托等级的排 序,并进行每个初始个体的拥挤度的计算
在本实施例中,可以利用分类错误率和规则分类器的复杂度来进行帕累 托等级的排序和拥挤度的计算。
对于分类错误率的计算包括:
对于每个初始个体,利用其编码的参考值个数,参考值和参考证据权重 构建规则分类器,并对样本进行分类,得到关于该初始个体的分类错误率。
具体地,对于每个属性,通过如下所示的匹配度计算公式可以得到该属 性与其每个参考值的相似度:
Figure BDA0003424856090000161
Figure BDA0003424856090000162
αi,j'=0,j'=1,...Ji,j'≠j,j+1
其中,αi,j表示第k个样本的M个属性中的第i个属性
Figure BDA0003424856090000163
的值与该属性的 第j个参考值
Figure BDA0003424856090000164
的匹配度,该匹配度描述了属性
Figure BDA0003424856090000165
与参考值
Figure BDA0003424856090000166
之间的相似程 度。
由于参考值的介入,可以将属性xi和类别y的关系近似地转化为属性xi的 具体参考值
Figure BDA0003424856090000167
和类别y之间的关系,结合上述的匹配度,可以 进一步将医疗数据集中的样本对(xi,y)转换并且唯一地表示为如下表1所示 的类别y的一个相似度分布:
表1样本对(xi,y)在属性xi上的相似度分布
Figure BDA0003424856090000168
其中,an,j是属性值
Figure BDA0003424856090000169
与参考值
Figure BDA00034248560900001610
可以计算匹配度且属于yn类的所有样本 对的匹配度之和。
Figure BDA00034248560900001611
是属于类别yn的样本对的所有参考值的匹配度 之和。
Figure BDA00034248560900001612
是在参考值
Figure BDA00034248560900001613
确定的情况下,对于属性值
Figure BDA00034248560900001614
在样本对的所 有类别中与参考值
Figure BDA00034248560900001615
的匹配度之和,并且有
Figure BDA00034248560900001616
根据表1可知,在类别确定的情况下,可以构造我们可以构造属性xi的 值为参考值
Figure BDA00034248560900001617
的似然,记为cn,j
Figure BDA0003424856090000171
进一步地,可以将每个参考值的参考证据
Figure BDA0003424856090000172
定义为:当属性xi的值取参 考值
Figure BDA0003424856090000173
时,将样本判定为类别yn的参考证据信度为
Figure BDA0003424856090000174
并且,将上述属性 的可靠性等价为参考证据的可靠性因子
Figure BDA0003424856090000175
进一步地,参考证据
Figure BDA0003424856090000176
的参考证据信度
Figure BDA0003424856090000177
可以利用如下公式,通过规 范化的似然求得:
Figure BDA0003424856090000178
进一步地,根据上述计算,对于每个属性xi,均可以得到如表2所示的 关于该属性的参考证据矩阵:
表2属性xi的参考证据矩阵
Figure BDA0003424856090000179
进一步地,依据参考证据矩阵的分布,对于本实施例中具有M个属性的 第k个样本:
Figure BDA00034248560900001710
若其第i个属性
Figure BDA00034248560900001711
取值在区间
Figure BDA00034248560900001712
内, 则将激活与参考值
Figure BDA00034248560900001713
Figure BDA00034248560900001714
对应的两个在参考证据矩阵中相邻的参考证据
Figure BDA00034248560900001715
Figure BDA00034248560900001716
并进行加权,以计算该属性的属性证据。
具体的,如下公式所示,利用该属性与两个参考值的匹配度,以及两个 参考证据的参考证据信度完成参考证据
Figure BDA0003424856090000181
Figure BDA0003424856090000182
的加权:
Figure BDA0003424856090000183
其中,得到的结果pn,i表示:在
Figure BDA0003424856090000184
的取值在区间
Figure BDA0003424856090000185
内,也即激活
Figure BDA0003424856090000186
Figure BDA0003424856090000187
的情况下,该样本k的类别被认为是yn的证据信度,也即关于属性
Figure BDA0003424856090000188
的属 性证据ei的证据信度。
进一步地,对于参考证据
Figure BDA0003424856090000189
Figure BDA00034248560900001810
初始化的参考证据权重
Figure BDA00034248560900001811
Figure BDA00034248560900001812
采取 如下所示的公式,以相同的方式进行加权:
Figure BDA00034248560900001813
其中,得到的结果wi表示:关于属性
Figure BDA00034248560900001814
的属性证据ei的属性证据权重。
将上述计算得到的关于该属性的属性可靠性等价为该属性证据的可靠性 因子,结合该属性证据的属性证据权重,可靠性因子和证据信度,得到完整 的属性证据ei
进一步地,根据上述方式,可以获得M个属性的所有M条属性证据: e1,e2,...,eM
进一步地,基于证据推理规则中的融合规则,结合属性证据权重和可靠 性因子对M条属性证据进行融合。
其中,相互独立的两属性条证据e1和e2可通过证据推理融合规则进行融 合,并得到e1和e2联合共同支持命题θ的信度函数pθ,e(2),计算方法如式所示:
Figure BDA00034248560900001815
Figure BDA00034248560900001816
当M条证据进行融合时,联合支持命题θ的信度函数mθ,e(i)也可表示为:
Figure BDA0003424856090000191
Figure BDA0003424856090000192
Figure BDA0003424856090000193
结合属性证据权重和可靠性因子对M条证据进行融合后,得到关于样本 类别的如下融合结果,并将其作为规则分类器以对医疗数据集进行分类:
P(xk)={(yn,pn,e(M)),n=1,...,N}
其中,yn表示第n个类别,pn,e(M)表示样本属于类别yn的信度,根据融合 后的结果P(xk),判断样本xk类别为最大信度pn,e(m)对应的类别yn
根据上述规则分类器的分类结果,可以获知在本次迭代中每个初始个体 的分类准确率和错误率。
在本实施例中,使用错误率衡量规则分类器的分类性能,并构建致力于 最小化分类错误率的第一目标函数:f1(x)=minerror_rate。
进一步地,在考虑规则分类器的复杂度时,直接使用各个属性的参考值 个数之和来表征分类器复杂度,并构建致力于最小化复杂度的第二目标函数: f2(x)=minJ。
因此,结合第一目标函数和第二目标函数后的整个多目标优化遗传算法 的目标函数为:
Figure BDA0003424856090000194
Figure BDA0003424856090000195
其中,errorNum为医疗数据集中分类错误的样本数,totalNum为医疗数据 集中的总样本数,Ji为各个属性的参考值个数。
进一步地,利用分类错误率和规则分类器的复杂度来进行帕累托等级的 排序的过程包括:
根据上述关于分类错误率的第一目标函数,和关于复杂度的第二目标函 数,采取帕累托支配原则,为初始化种群中的全部初始个体建立帕累托支配 关系。
具体地,对于两个初始个体xa和xb,如果有以下两个条件成立,则称个 体xa支配xb
Figure BDA0003424856090000201
都有f1(xa)≤f1(xb)成立;
Figure BDA0003424856090000202
使得f2(xa)<f2(xb)成立。
进一步地,如果对于一个初始个体,可以支配初始化种群中的其他所有 初始个体,则该初始个体为该初始化种群中的非支配解。
在本实施例中,将初始化种群中作为非支配解的初始个体的等级定义为 1级;进一步地,在剩余的其他初始个体中再次确定非支配解,并将作为此 时非支配解的初始个体的等级定义为2级;以此类推,可以得到本次迭代中 的初始化种群中所有初始个体的帕累托等级,并将其按照等级进行排序。
进一步地,利用分类错误率和规则分类器的复杂度,对初始化种群中每 个初始个体进行拥挤度的计算包括:
将初始个体的拥挤度表示为nd,其中,n=1,……,N。
对于每个初始个体,首先基于第一目标函数f1(x),使用分类错误率的值 对初始个体进行排序,将初始个体的第一目标函数最大值记为
Figure BDA0003424856090000203
最小 值记为
Figure BDA0003424856090000204
对于排序后两个边界的拥挤度1d和Nd设置为∞;
计算如下公式计算第一拥挤度分量
Figure BDA0003424856090000205
Figure BDA0003424856090000206
将其作为基于第一目标函数的拥挤度分量,其中
Figure BDA0003424856090000207
Figure BDA0003424856090000208
分别代 表个体排序后一位和前一位的第一目标函数值。
进一步地,基于第二目标函数,采用相同的方法和公式,使用复杂度的 值计算基于第二目标函数的第二拥挤度分量
Figure BDA0003424856090000209
对第一拥挤度分量
Figure BDA00034248560900002010
和第二拥挤度分量
Figure BDA00034248560900002011
求和,得到本次迭代中的关于 该初始个体的拥挤度。
在非首次迭代中,对于前一次迭代得到的新代种群,采取相同的方式, 计算新代种群中每个新代个体的帕累托等级和拥挤度排序。
进一步地,在本次迭代中,根据上述得到的每个初始个体的帕累托等级 的排序和拥挤度,在初始化种群中执行竞标赛选择法。
具体的,在每次选择中,先从初始化种群中随机选出两个初始个体,比 较两个初始个体的帕累托等级和拥挤度,并从中选择帕累托等级高的初始个 体,若两个初始个体的帕累托等级相同,则选择拥挤度较高的初始个体;不 断重复前述的随机选择和比较,并将选出的初始个体加入到父代种群Ci中, 直到在父代种群中选到N个初始个体,并将此时父代种群中的初始个体作为 父代个体。
进一步地,在本次迭代中,对上述的父代种群中的多个父代个体通过执 行模拟二进制交叉法和多项式变异,得到本次迭代的子代种群。
首先,随机选取两个父代个体:
Figure BDA0003424856090000211
Figure BDA0003424856090000212
通过如下公式 所示的交叉过程,可产生两个后代个体
Figure BDA0003424856090000213
Figure BDA0003424856090000214
Figure BDA0003424856090000215
Figure BDA0003424856090000216
其中,β是由分布因子η动态随机决定的,u为区间[0,1]内的随机数。
进一步地,对父代种群中的父代个体,采用多项式变异,其变异算子的 形式为:
xi'=xi
Figure BDA0003424856090000217
其中,xi表示一个父代个体,ηm为分布指数,u为区间[0,1]内的随机数。
通过模拟二进制交叉法和多项式变异,得到子代种群Di
进一步地,将本次迭代中种群规模均为N的父代种群和子代种群进行合 并,得到种群规模为2N的过渡种群,并对过渡种群中的过渡个体进行快速 非支配排序,以及拥挤度的计算。
在本次迭代中的快速非支配排序的过程包括:
对于过渡种群中的每个过渡个体,利用该个体中的参考值个数、参考值 和参考证据权重,再次采取与上述相同的方式,构建本次迭代中关于该过渡 个体的规则分类器,并对样本进行分类,得到关于该过渡个体的分类错误率。
进一步地,利用本次迭代中关于该过渡个体的分类错误率和规则分类器 的复杂度,利用与上述相同的方式,建立关于过渡个体的第一目标函数和第 二目标函数,并采取与上述初始化种群中建立帕累托支配关系相同的方式, 在过渡种群中建立帕累托支配关系。
进一步地,对于过渡种群中的每个过渡个体,计算该过渡个体x被支配 的次数nx和被该过渡个体x支配的个体集合Sx
然后,将所有nx=0的过渡个体构成第1等级的非支配帕累托前沿解F1, 并对Sx中的过渡个体l进行以下操作:对nl减1,如果nl=0,则将这些过渡 个体放置到F2中,这些过渡个体将作为第2等级的非支配帕累托前沿解。
进一步以F2为当前种群,重复上述操作,直到确定每个过渡个体的快速 非支配排序的等级。
对于过渡种群中每个过渡个体的拥挤度,使用与上述计算初始个体拥挤 度相同的方式和公式进行计算。
基于上述快速非支配排序的等级,按照过渡个体从低到高的等级顺序, 将过渡个体放入新代种群Pi+1中,直到某一等级的过渡个体不能全部放入 Pi+1,此时将该等级的过渡个体根据拥挤度从大到小排列,依次放入Pi+1中 直到得到规模为N的新代种群Pi+1
进一步地,在下一次迭代中,将该新代种群作为迭代的起始,也即上述 迭代过程中的初始化种群,并进行与上述迭代相同的迭代步骤,直到进行到 预设的迭代阈值,在本实施例中以迭代200次为例,在迭代达到第200次的 迭代阈值时,得到第200次迭代的新代种群,并作为目标种群。
进一步地,根据目标种群中的等级顺序,将第一等级的非支配帕累托前 沿解确定为目标个体。
在本申请的实施例中,基于上述确定的目标个体,提取该目标个体中编 码的各个属性的参考值个数、参考值和参考证据权重,并将其作为初始特征 子集中各个属性的参数。
进一步地,采取与上述构建规则分类器相同的方式,利用各个属性再次 构建规则分类器,并计算基于当前属性的初始特征子集的分类正确率。
步骤S105、根据所述可靠性排序和所述分类准确率调整所述初始特征子 集中的所述属性,得到目标特征子集。
在本申请的实施例中,在未加入初始特征子集的其他剩余属性中,选择 可靠性排序最靠前的1个属性,将其与上述设定的可靠性阈值进行比较。
进一步地,当选择该属性小于可靠性阈值时,则不将其添加至初始特征 子集中,并保持该初始特征子集现有的属性。
当选择该属性大于等于可靠性阈值时,则将该属性添加值初始特征子集 中,并按照上述相同的方式,利用当前的初始特征子集构建规则分类器,并 计算当前初始特征子集的分类正确率。
基于得到的分类正确率,若分类正确率未升高,则去掉最后加入初始特 征子集的属性后,保持初始特征子集中的属性,并结束本次分类。
若分类正确率升高,则保留最后加入初始特征子集的属性,并在未加入 初始特征子集的其他剩余属性中,再次选择可靠性排序最靠前的1个属性, 并再次重复本步骤S105中上述的可靠性阈值的比较,以及分类正确率的比 较,以确定是否在初始特征子集中保留再次加入的属性。
进一步地,若全部属性均加入至初始特征子集后,分类正确率仍保持上 升,但由于没有多余属性可以继续添加,则也可以结束本次分类操作。
基于上述的分类操作,可以将医疗数据集中的样本分为两个类别:清醒 状态y1,和包括浅度睡眠状态y2、深度睡眠状态y3、快速眼动期睡眠状态y4在 内的另一类别。
步骤S106、根据所述分类顺序,进行全部所述类别的分类,得到每次分 类操作的所述目标特征子集和所述规则分类器;集成全部所述目标特征子集 和所述规则分类器,用于对所述医疗数据集中的新样本进行分类。
在本申请的实施例中,如图3a所示,按照与上述步骤S102、步骤S103 步骤S104和步骤S105相同的操作,对全部4个类别中剩余的三个类别进行 分类。
进一步地,在第二次分类和第三次分类中,由于在每次分类中建初始特 征子集添加属性时,均需要对全部属性进行属性可靠性的排序,因此,除了 可以基于现有属性对样本进行分类之外,在一些情况下,若具备新加入的属 性,也可以对新加入的属性进行属性可靠性的排序,从而实现对增量属性的 筛选。
在完成全部三次分类操作后,可以得到如图3a所示的3个特征子集,和 三个规则分类器。
进一步地,可以集成全部特征子集和全部规则分类器,用以对医疗数据 集中的新样本进行分类。
可见,本申请的实施例的基于规则分类器的医疗数据分类方法,从上面 所述可以看出,本申请提供的基于规则分类器的医疗数据分类方法及相关设 备,按照实际需求对每个类别的分类划分顺序,并在每次分类中,仅对一个 类别进行分类,在每次分类中,基于属性可靠性对全部属性进行排序,仅使 用能够提高本次分类准确率的属性建立初始特征子集,通过综合考虑了属性 可靠性排序和分类准确率对初始特征子集中的属性进行调整,实现了利用先 到的数据属性训练规则分类器进行粗略分类,而后再根据后续获取到的属性不断训练其他分类器,逐步进行更加细致的分类,并且本申请在每次分类中, 对于属性可靠性采取了多准则评价的方式进行计算,对参数的优化也利用了 多目标遗传算法,实现了参数与结构的联合全局性优化,提高了对样本数据 的分类准确率,从而优化了规则分类器的性能,在应对增量数据的同时,实 现依靠少量的监测数据,对睡眠健康的状态进行精确有效地分类。
需要说明的是,本申请的实施例的方法可以由单个设备执行,例如一台 计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设 备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备 可以只执行本申请的实施例的方法中的某一个或多个步骤,这多台设备相互 之间会进行交互以完成所述的方法。
需要说明的是,上述对本申请的一些实施例进行了描述。其它实施例在 所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步 骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。 另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实 现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者 可能是有利的。
基于同一发明构思,与上述任意实施例方法相对应的,本申请的实施例 还提供了一种基于规则分类器的医疗数据分类装置。
参考图2,所述基于规则分类器的医疗数据分类装置,与存储有医疗数 据集的数据库连接,包括:预处理模块201、单次分类模块202和全局分类 模块203;
其中,所述预处理模块201,被配置为对医疗数据集预设多个类别,并 确定所述医疗数据集中每个样本具备的多个属性和每个所述样本初始所隶属 的类别;并在全部所述类别中确定对每个所述类别执行分类时的分类顺序。
所述单次分类模块202,被配置为在每次针对单个所述类别的分类中, 对于每个所述属性,利用该属性和每个所述类别计算费希尔得分、皮尔逊相 关系数和互信息,对计算结果进行融合,得到该属性的属性可靠性,根据全 部所述属性可靠性得到可靠性排序;
进一步地,根据所述可靠性排序从全部所述属性中选择预定数量的所述 属性作为初始特征子集,对于所述初始特征子集中的每个所述属性,根据预 设的约束条件,设置多个参考值和参考证据权重,利用所述参考值个数、参 考值个数和所述参考证据权重构建初始化种群;
进一步地,对所述初始化种群执行多目标遗传算法的迭代,得到目标种 群,利用所述目标种群构建所述规则分类器,并利用所述规则分类器对全部 所述样本进行分类,得到关于所述初始特征子集的分类准确率;
进一步地,根据所述可靠性排序和所述分类准确率调整所述初始特征子 集中的所述属性,得到目标特征子集。
所述全局分类模块203,被配置为根据所述分类顺序,进行全部所述类 别的分类,得到每次分类操作的所述目标特征子集和所述规则分类器;集成 全部所述目标特征子集和所述规则分类器,用于对所述医疗数据集中的新样 本进行分类。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然, 在实施本申请的实施例时可以把各模块的功能在同一个或多个软件和/或硬 件中实现。
上述实施例的装置用于实现前述任一实施例中相应的基于规则分类器的 医疗数据分类方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请的实施例 还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理 器上运行的计算机程序,所述处理器执行所述程序时实现如上任意一实施例 所述的基于规则分类器的医疗数据分类方法。
图4示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图, 该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接 口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030 和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、 微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、 或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本申请实 施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM (Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设 备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件 或者固件来实现本申请实施例所提供的技术方案时,相关的程序代码保存在 存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。 输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于 设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、 各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他 设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实 现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器 1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入 /输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该 设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员 可以理解的是,上述设备中也可以仅包含实现本申请实施例方案所必需的组 件,而不必包含图中所示的全部组件。
上述实施例的装置用于实现前述任一实施例中相应的基于规则分类器的 医疗数据分类方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了 一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算 机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的基于 规则分类器的医疗数据分类方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动 媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、 数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限 于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存 储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、 电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只 读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、 磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质, 可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任 一实施例所述的基于规则分类器的医疗数据分类方法,并且具有相应的方法 实施例的有益效果,在此不再赘述。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性 的,并非旨在暗示本申请的范围(包括权利要求)被限于这些例子;在本申 请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合, 步骤可以以任意顺序实现,并存在如上所述的本申请的实施例的不同方面的 许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本申请的实施例难以理解, 在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件 的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本 申请的实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的 实施方式的细节是高度取决于将要实施本申请的实施例的平台的(即,这些 细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如, 电路)以描述本申请的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情 况下实施本申请的实施例。因此,这些描述应被认为是说明性的而不是限制 性的。
尽管已经结合了本申请的具体实施例对本申请进行了描述,但是根据前 面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说 将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可 以使用所讨论的实施例。
本申请的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样 的替换、修改和变型。因此,凡在本申请的实施例的精神和原则之内,所做 的任何省略、修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于规则分类器的医疗数据分类方法,其特征在于,应用于存储有医疗数据及的数据库,包括:
对医疗数据集预设多个类别,并确定所述医疗数据集中每个样本具备的多个属性和每个所述样本初始所隶属的类别;
在全部所述类别中确定对每个所述类别执行分类时的分类顺序;
在每次针对单个所述类别的分类中,对于每个所述属性,利用该属性和每个所述类别计算费希尔得分、皮尔逊相关系数和互信息,对计算结果进行融合,得到该属性的属性可靠性,根据全部所述属性可靠性得到可靠性排序;
根据所述可靠性排序从全部所述属性中选择预定数量的所述属性作为初始特征子集,对于所述初始特征子集中的每个所述属性,根据预设的约束条件,设置多个参考值和参考证据权重,利用所述参考值个数、参考值个数和所述参考证据权重构建初始化种群;
对所述初始化种群执行多目标遗传算法的迭代,得到目标种群,利用所述目标种群构建所述规则分类器,并利用所述规则分类器对全部所述样本进行分类,得到关于所述初始特征子集的分类准确率;
根据所述可靠性排序和所述分类准确率调整所述初始特征子集中的所述属性,得到目标特征子集;
根据所述分类顺序,进行全部所述类别的分类,得到每次分类操作的所述目标特征子集和所述规则分类器;集成全部所述目标特征子集和所述规则分类器,用于对所述医疗数据集中的新样本进行分类。
2.根据权利要求1所述的方法,其特征在于,所述在每次针对单个所述类别的分类中,所述对于每个所述属性,利用该属性和每个所述类别计算费希尔得分、皮尔逊相关系数和互信息,对计算结果进行融合,得到该属性的属性可靠性,包括:
在每次针对单个所述类别的分类中,执行关于该类别,和非该类别的二分类操作;
对于每个所述属性,计算该属性在所述二分类操作中的两个所述类别中的类间均值、该属性在每个所述类别中的类内均值和类内方差;
利用所述类间均值、类内均值和类内方差计算所述费希尔得分;
对于每个所述属性,计算该属性与每个所述类别的协方差、该属性在两个所述类别中的类间方差,对于每个所述类别,计算该类别的类别方差;
利用所述协方差、所述类间方差和所述类别方差计算每个所述属性与每个所述类别之间的的所述皮尔逊相关系数;
对于每个所述属性和每个所述类别,利用该属性的值域和该类别的值域计算该属性和该类别之间的互信息;
对所述费希尔得分、所述皮尔逊相关系数和所述互信息的计算结果均进行归一化处理,并对归一化处理后的数值取均值,作为该属性的属性可靠性。
3.根据权利要求1所述的方法,其特征在于,所述设置多个参考值和参考证据权重,利用所述参考值个数、参考值个数和所述参考证据权重构建初始化种群,包括:
根据预设的约束条件,对于每个所述属性,设置多个参考值,并为该属性的每个所述参考值设置对应的参考证据,为每个所述参考证据设置对于该属性的参考证据权重;
将全部所述属性所对应的所述参考值、参考值个数和所述参考证据权重组合为个体编码,通过对所述个体编码多次初始化,得到多个初始个体并组成初始化种群。
4.根据权利要求3所述的方法,其特征在于,所述对所述初始化种群执行多目标遗传算法的迭代,包括:
在每次所述多目标遗传算法的每次迭代中,执行如下操作:
响应于确定本次迭代为首次迭代,在初始化种群中,对全部初始个体构建帕累托等级的排序,并对每个所述初始个体计算拥挤度,在初始化种群中,选取多个所述初始个体,根据每个所述初始个体的所述帕累托等级和所述拥挤度,执行竞标选择法,得到本次迭代的父代种群;响应于确定本次迭代为非首次迭代,在前一次迭代得到的新代种群中,对全部新代个体构建帕累托等级的排序,并对每个所述新代个体计算拥挤度,在前一次迭代得到的所述新代种群中,选取多个所述新代个体,根据每个新代个体的所述帕累托等级和所述拥挤度,执行竞标选择法,得到本次迭代的所述父代种群;
对本次迭代的所述父代种群中的多个父代个体通过执行模拟二进制交叉法和多项式变异,得到本次迭代的子代种群;
将本次迭代的所述父代种群和所述子代种群合并,得到本次迭代的过渡种群;
在本次迭代的所述过渡种群中,对全部过渡个体构建帕累托等级的排序,并对每个所述过渡个体计算拥挤度;
将本次迭代的所述过渡种群中的前多个过渡个体组成本次迭代的所述新代种群。
5.根据权利要求4所述的方法,其特征在于,所述构建帕累托等级的排序,包括:
对于每个所述初始个体,计算利用该初始个体执行分类的错误率,根据所述错误率构建第一目标函数;
利用该初始个体中所述参考值个数,构建第二目标函数;
根据所述帕累托支配原则,以所述第一目标函数和所述第二目标函数的取值越小越优为目标,对所述初始化种群中的全部初始个体进行所述帕累托等级的排序;
对于每个所述新代个体,计算利用该新代个体执行分类的错误率,根据所述错误率构建所述第一目标函数;
利用该新代个体中所述参考值个数,构建所述第二目标函数;
根据所述帕累托支配原则,以所述第一目标函数和所述第二目标函数的取值越小越优为目标,对所述新代种群中的全部新代个体进行所述帕累托等级的排序;
对于每个所述过渡个体,计算利用该过渡个体执行分类的错误率,根据所述错误率构建所述第一目标函数;
利用该过渡个体中所述参考值个数,构建所述第二目标函数;
根据所述帕累托支配原则,以所述第一目标函数和所述第二目标函数的取值越小越优为目标,对所述过渡种群中的全部过渡个体进行所述帕累托等级的排序;
所述计算拥挤度,包括:
对于每个所述初始个体、所述新代个体和所述过渡个体,利用所述第一目标函数计算第一拥挤度分量,利用所述第二目标函数计算第二拥挤度分量;
利用所述第一拥挤度分量和所述第二拥挤度分量计算所述拥挤度。
6.根据权利要求4所述的方法,其特征在于,所述在本次迭代的所述过渡种群中,对全部过渡个体构建帕累托等级的排序,并对每个所述过渡个体计算拥挤度,包括:
在本次迭代中,对于每个所述过渡个体中的每个所述属性,利用该属性对应的所述参考值、所述参考值个数和所述参考证据权重计算该属性的属性证据和属性证据权重,利用所述属性可靠性和所述属性证据权重对全部所述属性证据进行融合,利用融合的结果对所述样本进行分类决策;
利用每个所述过渡个体对全部所述样本进行决策分类的结果,利用该分类决策的结果,对对全部过渡个体构建帕累托等级的排序,并对每个所述过渡个体计算拥挤度。
7.根据权利要求1所述的方法,其特征在于,所述利用所述目标种群构建所述规则分类器,包括:
响应于确定达到迭代的目标次数,得到目标种群,根据帕累托支配原则,在所述目标种群中确定目标个体;
利用所述目标个体中每个所述属性对应的所述参考值、所述参考值个数和所述参考证据权重计算该属性的属性证据和属性证据权重,利用所述属性可靠性和所述属性证据权重对全部所述属性证据进行融合,得到所述规则分类器。
8.根据权利要求1所述的方法,其特征在于,所述根据所述可靠性排序和所述分类准确率调整所述初始特征子集中的所述属性,得到目标特征子集,包括:
在未加入所述初始特征子集的所述属性中,选择所述可靠性排序最靠前的一个所述属性,加入到所述初始特征子集;
基于构建的所述规则分类器,利用所述初始特征子集中的全部所述属性对全部所述样本进行分类;
基于分类结果,计算关于该所述初始特征子集的所述分类准确率;
根据所述分类准确率的数值变化,调整所述初始特征子集中的所述属性;
将调整后的所述初始特征子集作为所述目标特征子集。
9.根据权利要求8所述的方法,其特征在于,所述根据所述分类准确率的数值变化,调整所述初始特征子集中的所述属性,包括:
响应于确定所述分类准确率增高,保留最后加入的所述属性,并继续在未加入所述初始特征子集的所述属性中,选择所述可靠性排序最靠前的一个所述属性,加入到所述初始特征子集;
响应于确定所述分类准确率未增高,去掉最后加入的所述属性,并保持所述初始特征子集中包含的所述属性不变。
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可由所述处理器执行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至9中任意一项所述的方法。
CN202111576262.9A 2021-12-21 2021-12-21 基于规则分类器的医疗数据分类方法及相关设备 Active CN114239742B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111576262.9A CN114239742B (zh) 2021-12-21 2021-12-21 基于规则分类器的医疗数据分类方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111576262.9A CN114239742B (zh) 2021-12-21 2021-12-21 基于规则分类器的医疗数据分类方法及相关设备

Publications (2)

Publication Number Publication Date
CN114239742A true CN114239742A (zh) 2022-03-25
CN114239742B CN114239742B (zh) 2024-04-02

Family

ID=80760874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111576262.9A Active CN114239742B (zh) 2021-12-21 2021-12-21 基于规则分类器的医疗数据分类方法及相关设备

Country Status (1)

Country Link
CN (1) CN114239742B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985327A (zh) * 2018-06-05 2018-12-11 东南大学 一种基于因子分析的地形匹配区自组织优化分类方法
CN110490234A (zh) * 2019-07-19 2019-11-22 武汉大学 基于聚类分类联合机制的分类器的构建方法以及分类方法
EP3779799A1 (en) * 2019-08-14 2021-02-17 Robert Bosch GmbH Method and system for reliable classification using a neural network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985327A (zh) * 2018-06-05 2018-12-11 东南大学 一种基于因子分析的地形匹配区自组织优化分类方法
CN110490234A (zh) * 2019-07-19 2019-11-22 武汉大学 基于聚类分类联合机制的分类器的构建方法以及分类方法
EP3779799A1 (en) * 2019-08-14 2021-02-17 Robert Bosch GmbH Method and system for reliable classification using a neural network

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XIAOYAN WANG等: "ER rule classifier with an optimization operator recommoendation", JOURNAL OF INTELLIGENT & FUZZY SYSTEM *

Also Published As

Publication number Publication date
CN114239742B (zh) 2024-04-02

Similar Documents

Publication Publication Date Title
CN109036553B (zh) 一种基于自动抽取医疗专家知识的疾病预测方法
US10783433B1 (en) Method for training and self-organization of a neural network
Zhou et al. Cost-sensitive feature selection using random forest: Selecting low-cost subsets of informative features
Xia et al. Complete random forest based class noise filtering learning for improving the generalizability of classifiers
CN112509696B (zh) 基于卷积自编码器高斯混合模型的健康数据检测方法
CN108564117B (zh) 一种基于svm的贫困生辅助认定方法
Juutinen et al. Parkinson’s disease detection from 20-step walking tests using inertial sensors of a smartphone: Machine learning approach based on an observational case-control study
CN114255830A (zh) 基于规则分类器的增量医疗数据的分类方法及相关设备
CN116680637B (zh) 社区居家老年人传感数据分析模型的构建方法及装置
CN111297327B (zh) 一种睡眠分析方法、系统、电子设备及存储介质
CN111583194A (zh) 基于贝叶斯粗糙集和布谷鸟算法的高维特征选择算法
CN113361653A (zh) 基于数据样本增强的深度学习模型去偏方法和装置
CN111091907A (zh) 基于相似病例库的健康医疗知识检索方法和系统
CN112215259A (zh) 基因选择方法和装置
CN116502742A (zh) 一种基于梯度提升决策树的风险行为信息预测方法及系统
Gerger et al. Diagnosis of Parkinson’s disease using spiral test based on pattern recognition
CN118366549A (zh) 基因筛选方法和装置
CN114239742B (zh) 基于规则分类器的医疗数据分类方法及相关设备
CN114239738B (zh) 小样本的医疗数据分类方法及相关设备
Abut et al. A robust ensemble feature selector based on rank aggregation for developing new VO\textsubscript {2} max prediction models using support vector machines
CN116739037A (zh) 具有人格特征的人格模型构建方法及装置
CN114239741B (zh) 基于证据推理分类器的医疗数据分类方法及相关设备
Umar et al. Classification Using Radial Basis Function for Prediction of Parkinson's Disease
CN111709440B (zh) 基于FSA-Choquet模糊积分的特征选择方法
CN110443374B (zh) 一种资源信息处理方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant