CN110097934A - 一种心电本体概念的属性特征约简方法 - Google Patents
一种心电本体概念的属性特征约简方法 Download PDFInfo
- Publication number
- CN110097934A CN110097934A CN201811646734.1A CN201811646734A CN110097934A CN 110097934 A CN110097934 A CN 110097934A CN 201811646734 A CN201811646734 A CN 201811646734A CN 110097934 A CN110097934 A CN 110097934A
- Authority
- CN
- China
- Prior art keywords
- attribute
- concept
- decision
- conditional
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种心电本体概念的属性特征约简方法,以医学领域心电信号诊断本体为研究对象,通过层次加权匹配的关系映射,提出一种基于包含度和信息熵模型的心电信号诊断本体概念属性约简方法,主要包括三个步骤:包括S1基于粗糙隶属度模型的本体概念属性语义重要度标注,S2基于概念信息熵的加权区间概念格建模及S3基于层次冗余度的概念属性特征自适应约简。本发明能够有效提高心电信号诊断领域本体概念级语义信息合并的准确率,提升融合医学临床诊断领域知识库的质量,降低大规模挖掘医学领域语义信息所需的计算规模。
Description
技术领域
本发明属于医学语义网络、知识网格计算与检索技术领域,具体涉及一种心 电本体概念的属性特征约简方法。
背景技术
心电信号是用于临床心脏病诊断的生物信号之一,能够综合反映心脏活动的 体表特征,越来越受到相关学者的重视。心电信号受心脏疾病诊断标准、病型差 异等因素影响,使得心电图在个体间的差异性较大,相关疾病的诊断主要依赖于 医生的主观判断,导致心电信号异常判断标准无法统一,误诊率较高。
伴随着网络通讯以及云存储等技术的迅速发展,面向心电图诊断的自动分析 系统不断出现。目前提出的诊断方法中,基于领域本体构建技术的方法能够对心 电信号的知识表示进行规范化的说明与推理,以结构化的形式获取心电诊断的概 念关系,因而受到大量学者的关注。医学领域心电本体的构建依赖于领域内的心 电数据库,现有的数据库无法直接从海量心电数据中获取隐含的、极具价值的概 念属性,造成在同一领域内的心电数据库呈现出多样性与冲突性,使得领域内知 识库间无法进行互操作。
心电信号的表示与诊断能力取决于采集与处理心电信号的准确性,而心电信 号的预处理需要消除由心肌细胞产生的噪声干扰,建立相对统一的属性值域,且 诊断推理规则需要综合考虑临床心电诊断学的不同标准,规范化推理诊断的决策 标准。上述问题的解决依赖于以下三个关键问题的处理:一是如何有效区别心电 概念所含属性的重要性,获取波段特征的权重信息,建立特征属性与诊断推理间 的依赖关系。二是如何构建心电概念的层次关系,提高决策属性的知识表示能力。 三是如何在不影响知识表示的完备性条件下,确定属性阈值,剔除无关冗余属性, 降低映射计算规模。
发明内容
本发明提供一种心电本体概念的属性特征约简方法,利用粗糙集理论和熵理 论,以心电领域规范化标准库为指导,抽取心电信号领域诊断本体的概念集,将 心电领域知识信息转变为基于语义标注的关键词集合,通过层次加权匹配的关系 映射,构建带有权重标注信息的加权形式概念格,建立层次关联度的冗余约束子 规则,降低属性约简的计算规模,获取非冗余特征属性集。
为实现上述目的,本发明的技术方案提出了一种医学领域心电本体概念属性 特征约简方法,本发明所采用的技术方案是:
一种心电本体概念的属性特征约简方法,在计算机中存有本简约方法的三个 模块:
模块S1:基于粗糙隶属度模型的心电和/或脑电本体概念属性语义重要度标 注的处理模块;所述心电和/或脑电本体概念,是指心电和/或脑电领域中术语与 术语间关系的规范说明,包括概念实体特征及概念关系。
模块S2:基于概念信息熵的加权区间概念格建模的处理模块;所述概念信息 熵,是指概念所包含的属性信息量。
模块S3:基于层次冗余度的概念属性特征自适应约简的处理模块。所述层 次冗余度,是指依据概念所在的层次确定其决策属性的冗余度函数。
更进一步说,本发明的方法具体为:将约简医学领域本体内概念数据输入计 算机,并按如下步骤进行处理:
步骤1:在模块S1中进行如下的处理:使用粗糙隶属度模型对心电和/或脑 电本体中的领域本体概念进行属性语义信息的标注,将赋有权值的概念属性的集 合记为“属性重要度信息表”。对属性语义信息的标注,获得赋有权值的概念属 性。
步骤2:在模块S1中进行如下的处理:将步骤1获得的赋有权值的概念属 性重要度信息表转化成多值概念形式背景,提取对象包含属性的概率特征,计算 属性的信息熵权重,得到加权形式概念集,依据条件属性权重阈值,获取属性加 权置信度区间。保留属于所述置信度区间的概念节点集合,构建加权概念格。
步骤3:在模块S3中进行如下的处理:对步骤2所获得的加权概念格进行 特征约简处理,获得依赖于层次冗余度的最简特征属性集,由特征属性构建维度 约简集。所述约简包括四个步骤:构造约简特征规则库,进行属性相关性分析, 预先设定阈值门限值参数,删除无关特征属性的差别属性项。
本发明的原理及特点如下:
基于粗糙隶属度模型的本体概念属性语义重要度标注模型,对心电领域本体 概念进行语义重要度信息标注,形成具有差异化的概念属性重要度信息表。利用 基于概念信息熵的加权区间概念格理论,计算条件决策属性的信息熵,构建条件 属性中等价类之间的置信度区间,弱化相邻属性的噪声干扰。基于层次冗余度的 概念属性特征自适应约简模型,通过定义心电信号弱相关的冗余特征属性集,进 一步降低决策属性的约简计算规模,通过建立类冗余特征判定表,减少无关特征 属性的语义密度,生成非冗余特征属性集。
有益的技术效果
本发明的基本流程可分为三个基本模块:基于粗糙隶属度模型的本体概念属 性语义重要度标注。基于概念信息熵的加权区间概念格建模。基于层次冗余度的 概念属性特征自适应约简。
基于粗糙隶属度模型的本体概念属性语义重要度标注,本模块的主要功能及 技术优点描述如下:
抽取心电信号诊断本体的本体概念,通过构建带有重要度信息的目标列表。 定义属性包含度复杂度函数,依据函数值区分条件属性的决策集和候选集。建立 条件决策表和候选决策表。定义并计算单条件属性和相邻属性的重要度,获取属 性隶属度的重要度,得到带有属性隶属度重要度信息的条件属性决策表。
具体流程描述如下:抽取多个心电信号诊断本体的概念集合,引入 AHA/MIT-BIH、SCP-ECG和HL7aECG三种规范化标准库,增加属性重要度标注信 息,检索出与波形对象相关的概念文本集,形成“实体-标记号-文本定义注释” 三元组目标列表。使用标记号文本识别对象信息的主关键词。返回统计目标列表 中波形对象属性关系的复杂度函数。抽取目标列表内的概念属性,获得条件属性 决策集和条件属性候选集,分别添加到属性语义重要度队列的首部和尾部。依据 属性语义重要度队列,分别建立条件属性的映射列表数组和关联映射列表数组。 定义条件决策熵和关联熵,计算决策属性的单条件属性重要度和相邻属性重要 度。定义并计算属性隶属度的重要度,利用重要度贡献函数的返回值确定条件决 策表,输出重要度信息表。
基于概念信息熵的加权区间概念格建模,本模块的主要功能及技术优点描述 如下:
对条件属性决策表中的对象进行交运算,计算所有对象包含属性的概率,将 条件属性决策表按照对象、属性、关系的三元组形式,转变成条件概念形式背景。 抽取形式背景中的决策属性,计算概念的属性信息熵权重,依据概念属性的权属 关系合并信息熵权重,获取加权形式概念集。确定决策属性的信息熵置信度区间, 归类概念属性候选集和概念属性决策集,依据概念格完整性约束,删除概念权重 不在置信度区间内的概念节点,依据概念格渐进式构造算法建立加权概念格。
具体流程描述如下:抽取条件属性决策表中的非空对象集,按照对象所含属 性的数目递减的顺序,依次进行交运算,计算对象包含属性的后验条件概率。将 条件属性决策表中的对象、属性分别映射成条件概念形式背景中的对象、属性, 并依据后验条件概率建立对象与属性间的二元关系。抽取形式背景中概念集合, 定义属性信息熵,计算平均信息熵权重,构造概念属性信息熵,建立加权形式概 念集。定义权重阈值,结合条件属性中等价类之间的临界点信息,删除不在置信 度区间的概念属性集。依据概念格完整性约束条件,还原部分删除节点,依据属 性渐进式构造算法建立加权概念格。
基于层次冗余度的概念属性特征自适应约简,本模块的主要功能及技术优点 描述如下:
基于加权概念格,定义心电信号弱相关的冗余特征属性集,建立极值情况下 冗余特征的边缘属性判定约束。依据加权概念格的不同层次,分别构建带有层次 关联度的冗余约束子规则。构造决策属性特征向量,获取门限值参数。抽取加权 概念格的层次关系,建立概念层次分类,分别计算各个层次的特征属性均值。抽 取加权形式概念集中的决策属性,获取带有决策属性的决策值向量。结合特征属 性均值与决策值向量,构建类冗余特征判定表。当类冗余特征表中冗余特征项小 于初次抽样步长时,修正门限值参数,同时判断是否满足约束条件,删除无关特 征属性的差别属性项,生成非冗余特征属性集。
本发明的技术方案旨在解决领域本体概念间的属性语义重要度标注问题、概 念格建模设计中的信息熵计算问题以及冗余特征的约简问题,通过系统层面的优 化,实现心电信号领域概念属性之间基于语义的半自动特征约简。本发明使用心 电信号领域本体作为语义信息的知识表示来源,利用带有不同重要度的属性作为 区分概念权重的特征向量,通过计算决策属性信息熵,提高领域知识表示的准确 率,降低了冗余属性的比例,从而使得大规模融合心电领域知识成为可能。
脑电数据是由大量神经元活动产生的一种非线性、非平稳、随机性的微弱信 号。脑电数据的采样与心电信号类似,区别主要在于数据的分析过程中相关参数 的调整,因为大脑活动受神经元群之间的反馈和多重耦合调节的影响,信号特征 提取主要表现为多尺度特征。
本发明利用粗糙集理论和熵理论,以心电领域或/和脑电规范化标准库为指 导,抽取心电或/和脑电信号领域诊断本体的概念集,将心电或/和脑电领域知识 信息转变为基于语义标注的关键词集合,通过层次加权匹配的关系映射,构建带 有权重标注信息的加权形式概念格,建立层次关联度的冗余约束子规则,降低属 性约简的计算规模,获取非冗余特征属性集。本发明(心电)可调整取样参数、 计算公式后应用在脑电分析上。
附图说明
图1是本发明具体实施本体概念属性语义重要度标注图
图2是本发明具体实施加权区间概念格建模过程图
图3是本发明具体实施概念属性特征自适应约简原理图
具体实施方式
以下实施用例用于说明本发明,但不用来限制本发明的范围。
一种医学领域心电和/或脑电本体概念属性特征约简方法,在计算机中存有 本简约方法的三个模块:
模块S1:基于粗糙隶属度模型的心电和/或脑电本体概念属性语义重要度标 注的处理模块;所述心电和/或脑电本体概念,是指心电和/或脑电领域中术语与 术语间关系的规范说明,包括概念实体特征及概念关系。
模块S2:基于概念信息熵的加权区间概念格建模的处理模块;所述概念信息 熵,是指概念所包含的属性信息量。
模块S3:基于层次冗余度的概念属性特征自适应约简的处理模块。所述层 次冗余度,是指依据概念所在的层次确定其决策属性的冗余度函数。
进一步说,将约简医学领域本体内概念数据输入计算机,所述的约简医学领 域本体内概念数据,是指包含该领域中实体概念及其相互关系的三元组,并按如 下步骤进行处理:
步骤1.:在模块S1中进行如下的处理:使用粗糙隶属度模型对心电和/或 脑电本体中的领域本体概念进行属性语义信息的标注,将赋有权值的概念属性的 集合记为“属性重要度信息表”。粗糙隶属度模型,是指基于属性集上等价类的 属性重要度函数。领域本体概念,是指领域本体中包含概念对象及其属性的关系 集合。属性语义信息,是指本体概念所含属性的权重及其隶属关系。对属性语义 信息的标注,获得赋有权值的概念属性
步骤2:在模块S1中进行如下的处理:将步骤1获得的赋有权值的概念属 性重要度信息表转化成多值概念形式背景,提取对象包含属性的概率特征,计算 属性的信息熵权重,得到加权形式概念集,依据条件属性权重阈值,获取属性加 权置信度区间。保留属于所述置信度区间的概念节点集合,构建加权概念格。
步骤3:在模块S3中进行如下的处理:对步骤2所获得的加权概念格进行 特征约简处理,获得依赖于层次冗余度的最简特征属性集,由特征属性构建维度 约简集。所述约简包括四个步骤:构造约简特征规则库,进行属性相关性分析, 预先设定阈值门限值参数,删除无关特征属性的差别属性项。
进一步说,在模块S1中,执行的步骤依次有:
S11.将心电本体中的“概念-属性-关系-重要度”作为一组初始元素,抽取 领域本体概念,依据心电信号领域规范化标准库,检索出所有相关的概念文本集 合信息,形成标准化的目标列表。依据心电数据库MIT-BIH中,采用212格式定 义的注释代码识别出目标列表中的心电信号诊断波形。“概念-属性-关系-重要 度”是人为设定的,以本体作为知识表示形式,使用Apriori关联规则挖掘算法 抽取领域本体内的概念、属性关系及重要度,存放在一个初始值为空的四维数组 中。心电信号领域规范化标准库采用目前国际上公认的美国麻省理工学院提供的 标准的心电数据库MIT-BIH。换言之,本步骤为:人工/仪器采样向电脑输入“领 域本体概念”,按照“心电信号领域规范化标准库”。具体过程如下:使用12导联的计算机化心电图机,以500点/秒以上的速度将毫伏级的心电信号,通过放 大电路输入计算机,并经过A/D转换和数字滤波器的二次处理,抽样出心电波形 的数字化属性特征编码,按照心电数据库MIT-BIH的数据格式,对应填入“概念 -属性-关系-重要度”的目标列表。
S12.以心电信号诊断波形为对象,从目标列表中检索包含该波形对象的属性 集,依据该属性集中属性的属性重要度,按照属性重要度由大到小排序,获取该 排序数组的前N条记录,获取其对应的概念属性,作为条件属性决策集。其余记 录作为条件属性候选集。心电信号诊断波形是从S11中获取的信号,并依据心电 数据库MIT-BIH中,采用212格式定义的注释代码识别出目标列表中的心电信号 诊断波形。关系复杂度,是本学术公知,属性重要度表示在决策表中不同的条件 属性相对于决策属性的重要性,详细定义表示如在论文:[1]王蓉,刘遵仁,纪 俊.基于属性重要度的决策树算法[J].计算机科学,2017,44(b11):129-132. [2]张清华,胡荣德,姚龙洋,等.基于属性重要度的风险决策粗糙集属性约简 [J].控制与决策,2016,31(7):1199-1205。
S13.以条件属性决策集为输入,建立条件属性的映射列表,获取支持心电信 号集成的条件决策表。以条件属性候选集为输入,建立相邻属性的映射列表,获 取辅助心电信号集成的相邻属性候选决策表。
S14.基于条件决策表将相邻对象划分为一组等价类,依据权重的不同,将属 性重要度的贡献函数分为两部分:单属性重要度以及与其具有相邻关系的属性关 联重要度。【单属性重要度,是指单个条件属性对决策属性的直接影响程度,计 算方法是:条件属性集去掉该属性前后的依赖程度的差。属性重要度贡献函数, 是指单个属性在条件属性集上相对于决策属性的重要度计算函数。
S15.对每个属性分别计算其属性重要度贡献函数,定义并计算属性隶属度的 重要度,并添加到条件决策表,输出重要度信息表。
进一步说,在模块S2中依次进行的步骤有:
S21.将重要度信息表转化成多值概念形式背景,利用对象交运算生成概念集 合,遍历并计算所有对象包含属性的概率。多值概念形式背景,是指包含非布尔 型概念属性值的形式背景。转换的方法是指,将重要度信息表的决策属性映射成 形式背景的对象,将重要度信息表的条件属性映射成形式背景的属性。对象交运 算,是指对象之间的共有最大属性集合。
S22.定义并计算属性的信息熵权重,统计属于相同概念的属性信息熵权重, 求和得到加权形式概念集。
S23.结合条件属性中等价类之间的临界点信息,定义权重阈值,并将其作为 概念重要度的置信度区间的下界。权重阈值的范围是0-0.5。
S24.删除概念权重不在置信度区间内的概念节点,若删除后的概念节点间引 起数值冲突或无法满足概念格的完备性,将该概念节点数值还原,并进入下一步。 反之,若删除后的概念节点间引起数值未发生冲突、满足概念格的完备性,则直 接进入下一步。
S25.依据概念格渐进式构造算法建立加权概念格。概念格渐进式,是指,在 给定的形式背景所对应的初始概念格的基础上,伴随着对象的增加,求解新的形 式背景所对应的概念格,即在属性集不变的情况下,利用新增对象对原始概念格 的更新,实现新概念格的构造。
进一步说,在模块S3中依次执行的步骤有:
S31.建立约简特征规则库。
S32.进行相关性分析,删除无关特征项,获取类冗余特征判定表。
S33.删除近似冗余特征,生成非冗余特征属性集。
采用基于自适应门限值的属性特征约简模型,采用Pearson相关系数定义特 征的语义相关性,通过引入自适应学习的阈值参数,约简特征属性集,获取满足 冗余特征判定条件的属性特征子集,降低属性特征维数,减少从原始特征集中提 取等价类特征子集的语义密度。
进一步说,在模块S1/步骤1中,提取心电本体中的概念集合,形成目标列 表{P1,P2……}。
采用人机交互的方式检索波形对象的属性集,形成条件属性候选集{C1,C2……}。计算条件属性决策候选集{C1,C2……}中的每个条件属性的属性关系 复杂度,排序属性关系复杂度,利用分类数组分别存储两组属性信息:条件属性 决策集和条件属性候选集,其中条件属性决策集包含较多属性关系的概念属性, 获取基于条件属性的决策表,计算单条件属性重要度。条件属性候选集包含较少 属性关系的概念属性,计算相邻属性重要度。利用单条件属性重要度和相邻属性 重要度计算属性隶属度的重要度,并输出重要度信息表{A1,A2……}。
在模块S2/步骤2中,将由步骤1获得的带有属性隶属度的重要度信息表 {A1,A2……}作为输入量,构建多值概念形式背景。计算决策属性的决策概率特 征j。遍历形式背景中的属性集合,采用参数阈值迭代方法,计算不同参数阈值 下决策属性的信息熵权重,获取加权形式概念集。设定加权区间的置信度区间, 采用概念建格算法构建加权区间概念格,得到决策属性在不同置信度区间下的概 念信息熵空间,记为集合{S1,S2……}。
在模块S3/步骤3中,利用带有双向指针的二叉树对步骤2获得的概念信息 熵集合{S1,S2……}的加权节点概念集合进行存储,并通过调整层次概念的节点 数,定义不同层次下的决策属性特征冗余度,基于Person相关系数的语义相关 性分析,构建约简特征规则库。引入自适应学习的阈值参数分析算法,提高自适 应门限值的设定精度,获取包含属性特征的多阶特征方阵。
进一步说,步骤1具体按如下步骤进行:
S11:初始化属性目标列表:通过人机交互的方式,抽取心电本体中波形对 象的属性信息。抽取的方法是现有的,使用文献[1]张清丽,心梗特征提取与 辅助诊断模型研究[D],郑州大学,2017.介绍的改进小波算法检测心电信号的 特征信息,并将其作为波形对象的属性值。初始化属性重要度为0。初始重要度 权值,是人为设定的,属性重要度包含10种决策属性参数(R波幅值、P波和T 波幅值、P波和T波时限、QRS间期、RR间期、QT间期、PR间期和ST段电 位偏移)。引入AHA/MIT-BIH、SCP-ECG和HL7aECG三种规范化标准库。前述的 3个数据库是现成的。检索出与波形对象相关的概念文本集,形成“实体-标记 号-文本定义注释”三元组目标列表。
S12:合并三种规范化标准库中属于相同属性的概念文本集,使用标记号文 本识别对象信息的主关键词。返回统计目标列表中波形对象属性关系的复杂度函 数,并依据该函数值由大到小的次序,重新排列目标列表中对象属性的记录信息。 所述属性关系的复杂度函数的返回值,是与该属性具有直接邻域关系的属性的个 数。抽取该目标列表内排名靠前的概念属性,获得条件属性决策集,添加到属性 语义重要度队列的首部。其余概念属性作为条件属性候选集,添加到属性语义重 要度队列的尾部。
S13:依次抽取该队列首部的条件属性决策集,建立条件属性的映射列表数 组,遍历映射列表数组中的决策属性。依次抽取该队列剩余的条件属性候选集, 建立条件属性的关联映射列表数组,遍历关联映射列表数组中的决策关联属性。
S14:使用邻接矩阵存放遍历出的决策属性,并将决策属性值大于β-边界 域的属性划分为一个等价类,定义条件决策熵,计算决策属性的单条件属性重要 度。构建决策关联属性的等价类,定义决策关联熵,计算决策关联属性的相邻属 性重要度。
S15:定义并计算属性隶属度的重要度,利用重要度贡献函数获取条件决策 表,输出{A1,A2……}。属性隶属度的重要度,是在重要度信息表的基础上增 加属性的隶属度。
进一步说,模块S2/步骤2具体按如下步骤进行:
S21:将属性重要度信息表的每条记录映射成对象与属性间的多值关系,通过 增加多属性值集合,将多值关系弱化成二元关系。结合对象间的交运算,计算出 依赖于该形式背景下的形式概念总数。基于后验条件概率模型,标注出所有对象 包含某单一属性的概率值。
S22:提取步骤S21中的标注概率值,带入属性信息熵权重的计算公式,获取 属性的平均信息熵权重。将属于同一个概念下的属性信息熵求和,得到加权形式 概念集。
S23:构建条件属性中等价类之间的置信度区间上下限,获取满足领域覆盖的 权重阈值,定义并计算落在此区间范围内的概念属性权重。
S24:优先删除概念属性权重取值不在步骤S23所述区间范围内的概念节点, 依据概念格结构的完备性约束,保留部分概念节点。
S25:采用概念格属性渐进式递增算法,构建带有权重标注信息的加权形式概 念格。
进一步说,模块S3/步骤3具体按如下步骤进行:
S31:定义心电信号弱相关的冗余特征属性集,建立极值情况下冗余特征的边 缘属性判定约束。依据步骤S25中加权概念格的不同层次,分别构建带有层次关 联度的冗余约束子规则。
S32:计算决策属性的特征相关值并加入到特征集中,初始化无关特征门限 值参数α,默认属性特征集中存在无关特征。计算属于同一层次的概念所包含 的特征属性值均值,以此作为属性冗余度相关性分析的决策指标,删除小于该阈 值的冗余属性,并按照特征属性值均值降序排列。保留该序列排名靠前的非冗余 特征项,并加入到类冗余特征判定表。
S33:当类冗余特征表中冗余特征较少,且最大特征值ρmax与特征属性均 值的差大于α(即),所述特征属性均值则将阈值 门限值参数α设定为同时删除无关特征属性的差别属性项,生成非 冗余特征属性集。
为了更好地解释本发明,现换一角度阐述本发明:
在步骤1中,抽取的心电本体使用OWL语言表示,获得波形对象。用OWL 语言表示波形对象具有属性信息。所述波形对象的属性信息包括ST段状态、T 波状态、QRS波段状态以及波段心电形态。所述ST段状态的定义域为ST段,值 域为形态。所述T波状态的定义域为T波,值域为形态。所述QRS波段状态的定 义域为QRS波段,值域为形态。所述波段心电形态的定义域为待检心电,值域为 心电波段。
在步骤1中,初始化属性重要度标注是指对相同类型的多个心电信号初始赋 值为0,构成包含属性权值标注的初值,主要用于区分属性中不同类型的波形某 种。将属于不同类型的波形特征属性存放于不同的数组。。相同类型的多个心电 信号,是指依据规范化标准库中定义的相同类型的关键字段,区别不同类型的特 征属性。
在步骤1中,所述三种规范化标准库均使用国际通用Entity ID标识,抽取 包含波形对象的所有属性信息,采用UML图例形式,将对象文本名称和概念描述 分别映射成领域本体的概念及属性。
在步骤1中,所述主关键词采用ecgOnto:ID的编码形式作为属性关系复杂 度函数的输入变量。所述复杂度函数是求解属性与其具有直接邻域关系的属性个 数的统计函数,值域的上限是属性集中属于该对象的属性数。使用队列数据结构, 在队列首部和尾部分开存储子属性集。
在步骤1中,条件属性决策集C选取属性集中复杂度函数值较大的前N个属 性。所述条件属性候选集是属性全集与条件属性决策集的差集。使用多维分类数 组分别存储上述集合。本步骤中,判断属性集合的子集属性是否为空值的处理方 法是:若非空,将新标注的属性加入目标数组。反之,停止添加。
在步骤1中,所述的条件属性决策集,是由对象集合和条件决策熵所构成的 二元关系集合,其中初始条件语义属性构成基于对象的等价关系。
在步骤1中,条件决策熵E(pj)表示属性pj的平均信息熵的粗糙程度,计 算方式如下:
式中,P(pj/oi)表示对象oi的拥有第j个属性pj的后验条件概率,m表示 属性总和。
在步骤1中,单条件属性重要度ma表示集合a的下逼近区域内包含的属性 对属性重要度的影响,计算方式如下:
ma=(|POS a(D)|+CON(a/D)/|U|)/(|U|+1)。
式中,|POS a(D)|表示求解POS a(D)所含子集的数量,其中POS a(D) 表示一个划分a/D的下逼近区域。CON(a/D)表示U/a到U/D的隶属度,U/ a、U/D是本领域公知的参数,其中,U/a表示对象U按照属性a的一个划分, U/D表示对象U按照属性集D的一组划分。计算方式如下:
式中,U/a={X1,X2...Xn},U/D={Y1,Y2...Ym}。X表示对象U 按照属性a的一个划分中包含的属性。Y表示对象U按照属性集D的一组划分中 包含的属性。
在步骤1中,相邻属性重要度na表示集合a的属性重要度的隶属度对属性 重要度的影响,计算方式如下:
n a=(|POS D(a)|+CON(D/a)/|U|)/(|U|+1)。
式中,|POS D(a)|表示求解POS D(a)所含子集的数量,其中POS D(a) 表示一个划分D/a的上逼近区域。CON(D/a)表示U/D到U/a的隶属度,计 算方式如下:
在步骤1中,所述属性隶属度的重要度表示属性依赖于条件概率下的重要度 信息,计算方式如下:
SIGRγ(a,C,D)=(|U|2sig’γ(a,C,D)+|U|ma-na +1)/(|U|2+|U|+1)
式中,sig’γ(a,C,D)表示在A={a1,a2,…,an}中,U/D对任意ai∈A 的重要度,计算方式如下:SIGRγ表示属性集B在条件属性集C基础上相对于 决策属性D的重要度。ma表示集合a的下逼近区域内包含的属性对属性重要度 的影响。sig’γ(a,C,D)表示单个属性a在条件属性集C的基础上相对 于决策属性D的重要度,其中sig’γ是求解函数。U表示对象集合。na表 示集合a的属性重要度的隶属度对属性重要度的影响。
上式中sigγ'(bi,B,D)可进一步写成如下公式:
在步骤1中,所述重要度信息表{A1,A2,……}中每一条记录Ai包含属性 的条件决策熵E(pj)和属性隶属度的重要度SIGRγ(a,C,D)。
进一步说,步骤2中,抽取属性重要度信息表中的属性隶属度的重要度SIGR γ(a,C,D),依据数值进行降序排列,引入形式背景阈值参数λ,筛选出所有 大于λ的属性隶属度的重要度,建立其与包含该属性的对象间的函数关系R,关 系R满足对象与属性上的偏序关系。形式背景阈值参数λ,是不同分组内的属性 隶属度的离差平方和。偏序关系,是一组包含部分排序关系的集合,本权利是指 满足严格偏序关系的对象-属性,即对象与属性间满足反自反性、对称性和传递 性。
本步骤中,带有属性重要度的形式背景K’m由五元组(O,P,W,R,wc)定 义得到,其中O={o1,o2,…,on}表示非空对象集,P={p1,p2,…,pk}表示非 空属性集,W是属性值集,满足O×P上的笛卡尔积关系,即R 是一个三元关系,满足wc(pj)表示在属性P中pj的重要度,初始 赋值为空,限定值域范围是[0,1]。
本步骤中,使用对象间的交运算,获取存在关联关系的非包含对象集合。计 算重要度信息表中包含条件属性的隶属度的重要度,计算方式如下:
SIG(pj,C,D)=SIGR γ(N(pj,C,D))/|N(pj,C,D)|。
式中,N(pj,C,D)表示抽取重要度信息表中条件属性pj∈C的属性值,|N(pj, C,D)|返回N(pj,C,D)中具有非空属性值的属性个数。
本步骤中,在计算属性信息熵权重时引入Shannon信息熵,计算带有重要度 标注的条件属性在形式概念中的熵,计算方式如下:
本步骤中,依据形式背景K’m中wc(pj)的取值分布,定义权重阈值θ的区 间,E(pj)表示属性pj的平均信息熵权重,计算公式如下:
其中,m表示形式背景Km中属性的总数。P(pj/oi)表示第i个对象(oi) 包含第j个属性(pj)的概率。
定义权重阈值θ的区间具体赋值过程如下:
式中,ma表示单条件属性重要度,E(pj)表示条件决策熵,定义与计算如权 利要求7。
本步骤中,将权重阈值θ设定为隶属度的重要度的置信度区间的上限,处于 置信度区间内的属性值表示为有效重要度属性值,其余为无效属性值。筛选出隶 属度在此区间范围内的概念,获取概念属性权重。计算概念属性的权重值,删除 置信度区间范围之外的概念节点。将对象间的二元关系作为约束条件,结合外延 一致和内涵一致,建立概念间的Galois联结。
本步骤中,所述概念格结构的完备性约束是指同时满足由概念节点间的继承 与互斥关系约束以及节点间对象外延与属性内涵之间的存在关系约束。
本步骤中,采用树结构存储与组织概念格节点,置信度区间的概念节点作为 搜索约束条件,基于属性渐增式算法,构建加权形式概念格。
步骤3中,所述心电信号特征属性由权利要求8中属性重要度信息表中的属 性隶属度的重要度特征提取部分得来,由波形特征的属性值组成特征属性值向 量。所述冗余特征属性集的初始集的初始化,以权利要求7中波形对象的属性信 息为基础,选择心电信号的ST段抬高,ST段降低,QRS波段宽大,T波倒置以 及T波双向电交替的属性值作为特征属性值向量。
本步骤中,特征集S存在弱相关Fi的充分必要条件是:
P(Y|Fi,Mi)=P(Y|Mi)
式中,P(Y|Mi)是依赖于属性特征Mi的依赖关系函数。Y表示特征属性值 向量。Mi表示特征集S中的第i个属性特征。
本步骤中,所述冗余特征的边缘属性判定约束主要用于弱相关非冗余特征的 边界划分,采用Pearson相关系数定义可量化特征的语义相关性,(Fi,Fj)间 的内涵相关系数ρi,j,ρi,j数值越大,表明Fi与Fj之间的相关性越大,反之亦 成立,特征Fi与目标值y间的外延相关系数ρi,y,ρi,y数值越大,表明Fi包含 目标值y的信息量越大,反之亦成立。特征相关性与ρi,j成负相关,与ρi,y成正 相关。
本步骤中,所述带有层次关联度的冗余约束子规则是指在4种极值情况下, 冗余特征的边缘属性的弱相关Fi的存在性约束,结合前述步骤2所述的带有层 次关联性的加权形式概念格,分层次冗余约束子规则如下:
概念层次的部分有序集(h,<)的最底层L1:当ρi,y大于权重阈值θ且ρi,j大 于权重阈值θ,当且仅当ρi,y=1时,特征Fi是冗余特征;
概念层次的部分有序集(h,<)的最底层L1:当ρi,y大于权重阈值θ且ρi,j小 于权重阈值θ,特征Fi均不是冗余特征;
概念层次的部分有序集(h,<)任意层Li(非最底层):当ρi,y小于权重阈值 θ且ρi,j大于权重阈值θ,特征Fi关于特征Fj的相关性存在,且ρi,j数值越大, (Fi,Fj)间的冗余相似性越高。
概念层次的部分有序集(h,<)任意层Li(非最底层):当ρi,y大于权重阈值 θ且ρi,j小于权重阈值θ,特征Fi均不是冗余特征;
本步骤中,所述决策属性的特征相关值以前述步骤2中的带有重要度标注的 条件属性在形式概念中的熵为基础,计算决策属性在加权形式概念中的平均熵, 计算方式如下:
式中,wc(pj)是带有重要度标注的条件属性在形式概念中的熵,计算方式如 权利要求8,n是概念中所包含的决策属性数。
本步骤中,依据决策属性的特征相关值,构建属于概念的决策属性特征向量 矩阵CR(i,j),形成n阶方阵,具体表示如下:
本步骤中,设定门限值参数,数值为决策属性特征向量矩阵CR(i,j)的秩, 依据权利要求8中的加权形式概念格的不同层次,分别计算每个层次的特征属性 值均值μi,获取层次冗余度相关性决策值向量VF={μ1,μ2,…,μl}。
本步骤中,按照层次由低到高的顺序,依次遍历加权形式概念格节点,删除 概念节点,若其平均熵weight(B)小于其所在层次的特征属性值均值μi。将遍历 后未删除的节点按照其特征属性值均值降序排列,存入属性候选特征集数组。依 据初次抽样步长γ(人工输入的初次抽样系数),选取属性候选特征集数组的前γ 项,输入类冗余特征判定表。
步骤3中,当类冗余特征表中冗余特征项小于γ时,筛选出ρi,y的最大值记 为ρmax,计算每层特征属性均值在满足的约束条件下,调整 特征属性均值为修正重复步骤S31,同时删除无关特 征属性的差别属性项,生成非冗余特征属性集。
本发明的设计思想是:使用粗糙隶属度模型将本体概念中具备不同重要性的 属性以条件属性决策表的形式显性表示。利用概念信息熵调整本体概念的语义权 重,通过建立信息熵置信度区间,获取高置信度的概念属性,构造加权概念格。 采用概念格分层约束方式,引入决策值向量,删除冗余属性,缩减属性特征映射 的计算规模。
本实施系统包括本体概念属性语义重要度标注模块、加权区间概念格生成模 块以及概念属性特征自适应约简模块,下面结合附图对本发明做进一步说明。
1)本体概念属性语义重要度标注模块
模块作用:将本体概念所含属性进行重要度标记,同时利用属性包含度复杂 度函数区分条件属性决策集和条件属性候选集,计算单条件属性重要度以及相邻 属性重要度,得到属性隶属度的重要度信息。本模块实施例图如图1所示。
对概念属性进行重要度语义标注是领域本体概念间语义级别知识建模与语 义关系映射的前提,该方法的基本思路是从心电信号领域本体中抽取出若干概念 集合来描述心电信号的基本语义特征。由于概念集合中语义概念具有不同的语义 权重关系,所以有必要对具有不同重要性的属性进行度量,本发明采用一种基于 粗糙隶属度模型的属性隶属度标注方法,该方法关键步骤如下:
输入:心电信号诊断领域本体。领域规范化标准库。
输出:带有权重的属性隶属度重要度列表。
步骤1:抽取心电信号诊断本体中波形对象的属性信息。将抽取出的属性信 息的初始重要度权值清空,初始属性重要度赋值为0。检索出与波形对象相关的 概念文本集,获取“实体-标记号-文本定义注释”三元组目标列表。
步骤2:合并属于相同属性的概念文本集,使用标记号文本识别对象信息的 主关键词。返回统计目标列表中波形对象属性关系的复杂度函数,并依据该函数 值由大到小的次序,重新排列目标列表中对象属性的记录信息。抽取目标列表内 排名靠前的概念属性,获得条件属性决策集,添加到属性语义重要度队列的首部。 其余概念属性作为条件属性候选集,添加到属性语义重要度队列的尾部。
步骤3:依次抽取队列首部的条件属性决策集,建立条件属性的映射列表数 组,遍历映射列表数组中的决策属性。依次抽取该队列剩余的条件属性候选集, 建立条件属性的关联映射列表数组,遍历关联映射列表数组中的决策关联属性。
步骤4:将决策属性的相邻对象划分为一个等价类,计算决策属性的单条件 属性重要度。构建决策关联属性的等价类,计算决策关联属性的相邻属性重要度。
步骤5:计算属性隶属度的重要度,利用重要度贡献函数获取条件决策表, 输出重要度信息表。
2)加权区间概念格生成模块
模块作用:将赋有权值的概念属性重要度信息表转化成多值概念形式背景, 提取对象包含属性的概率特征,计算属性的信息熵权重,得到加权形式概念集, 依据条件属性权重阈值,获取属性加权置信度区间。保留属于所述置信度区间的 概念节点集合,构建加权概念格。本模块实施例图如图2所示。
获取具有加权属性的形式概念关系是规范化表示本体概念间分类关系的核 心,该方法的基本思路是从条件属性决策表中获取包含多元关系的形式背景,通 过计算属性的信息熵权重,建立属性在概念上的语义权重关系,建立信息熵置信 度区间,依据概念格完整性约束,构建具有层次关系的加权概念格,该方法关键 步骤如下:
输入:条件属性决策表。
输出:带有层次关系的加权概念格。
步骤1:将属性重要度信息表的每条记录映射成对象与属性间的多值关系, 通过增加多属性值集合,将多值关系弱化成二元关系。结合对象间的交运算,计 算出依赖于该形式背景下的形式概念总数。基于后验条件概率模型,标注出所有 对象包含某单一属性的概率值。
步骤2:提取标注概率值,计算属性信息熵权重,获取属性的平均信息熵权 重。将属于同一个概念下的属性信息熵求和,得到加权形式概念集。
步骤3:构建条件属性中等价类之间的置信度区间上下限,获取满足领域覆 盖的权重阈值,计算落在此区间范围内的概念属性权重。
步骤4:删除概念属性权重取值不在步骤3所述区间范围内的概念节点,依 据概念格结构的完备性约束,保留部分概念节点。
步骤5:采用概念格属性渐进式递增算法,构建带有权重标注信息的加权形 式概念格。
3)概念属性特征自适应约简模块
模块作用:对加权概念格进行特征约简处理,获得依赖于层次冗余度的最简 特征属性集,通过构造约简特征规则库,进行属性相关性分析,删除无关特征属 性的差别属性项,构建维度约简集。本模块实施例图如图3所示。
进行概念的冗余属性约简是降低概念间语义映射的有效途径,该方法的基本 思路是依据加权概念格,建立极值情况下冗余特征的边缘属性判定约束,分别建 立不同层次下的冗余特征约束子规则,计算属于同一层次的概念所包含的特征属 性值均值建立类冗余特征判定表,本发明采用一种基于层次冗余度的概念属性特 征自适应约简方法,该方法关键步骤如下:
输入:加权概念格。初次抽样步长。
输出:非冗余特征属性集。
步骤1:定义心电信号弱相关的冗余特征属性集,建立极值情况下冗余特征 的边缘属性判定约束。依据加权概念格的不同层次,分别构建带有层次关联度的 冗余约束子规则。
步骤2:计算决策属性的特征相关值并加入到特征集中,初始化无关特征门 限值参数α,默认属性特征集中存在无关特征。计算属于同一层次的概念所包 含的特征属性值均值,以此作为属性冗余度相关性分析的决策指标,删除小于该 阈值的冗余属性,并按照特征属性值均值降序排列。保留该序列排名靠前的非冗 余特征项,并加入到类冗余特征判定表。
步骤3:当类冗余特征表中冗余特征满足最大特征值ρmax与特征属性均值 的差大于α(即)条件时,修改特征属性均值为同时修 改阈值门限值参数α为删除无关特征属性的差别属性项,生成非冗 余特征属性集。
Claims (9)
1.一种心电本体概念的属性特征约简方法,其特征在于,在计算机中存有本简约方法的三个模块:
模块S1:基于粗糙隶属度模型的心电和/或脑电本体概念属性语义重要度标注的处理模块;所述心电和/或脑电本体概念,是指心电和/或脑电领域中术语与术语间关系的规范说明,包括概念实体特征及概念关系。
模块S2:基于概念信息熵的加权区间概念格建模的处理模块;所述概念信息熵,是指概念所包含的属性信息量;
模块S3:基于层次冗余度的概念属性特征自适应约简的处理模块;所述层次冗余度,是指依据概念所在的层次确定其决策属性的冗余度函数。
2.根据权利要求1所述的一种心电本体概念的属性特征约简方法,其特征在于:将约简医学领域本体内概念数据输入计算机,并按如下步骤进行处理:
步骤1.:在模块S1中进行如下的处理:使用粗糙隶属度模型对心电和/或脑电本体中的领域本体概念进行属性语义信息的标注,将赋有权值的概念属性的集合记为“属性重要度信息表”;对属性语义信息的标注,获得赋有权值的概念属性
步骤2:在模块S1中进行如下的处理:将步骤1获得的赋有权值的概念属性重要度信息表转化成多值概念形式背景,提取对象包含属性的概率特征,计算属性的信息熵权重,得到加权形式概念集,依据条件属性权重阈值,获取属性加权置信度区间;保留属于所述置信度区间的概念节点集合,构建加权概念格;
步骤3:在模块S3中进行如下的处理:对步骤2所获得的加权概念格进行特征约简处理,获得依赖于层次冗余度的最简特征属性集,由特征属性构建维度约简集;所述约简包括四个步骤:构造约简特征规则库,进行属性相关性分析,预先设定阈值门限值参数,删除无关特征属性的差别属性项。
3.如权利要求2所述的一种心电本体概念的属性特征约简方法,其特征在于:在模块S1中,执行的步骤依次有:
S11.将心电本体中的“概念-属性-关系-重要度”作为一组初始元素,抽取领域本体概念,依据心电信号领域规范化标准库,检索出所有相关的概念文本集合信息,形成标准化的目标列表;依据心电数据库MIT-BIH中,采用212格式定义的注释代码识别出目标列表中的心电信号诊断波形;
S12.以心电信号诊断波形为对象,从目标列表中检索包含该波形对象的属性集,依据该属性集中属性的属性重要度,按照属性重要度由大到小排序,获取该排序数组的前N条记录,获取其对应的概念属性,作为条件属性决策集;其余记录作为条件属性候选集;
S13.以条件属性决策集为输入,建立条件属性的映射列表,获取支持心电信号集成的条件决策表;以条件属性候选集为输入,建立相邻属性的映射列表,获取辅助心电信号集成的相邻属性候选决策表;
S14.基于条件决策表将相邻对象划分为一组等价类,依据权重的不同,将属性重要度的贡献函数分为两部分:单属性重要度以及与其具有相邻关系的属性关联重要度;
S15.对每个属性分别计算其属性重要度贡献函数,定义并计算属性隶属度的重要度,并添加到条件决策表,输出重要度信息表。
4.如权利要求3所述的一种心电本体概念的属性特征约简方法,其特征在于:在模块S2中依次进行的步骤有:
S21.将重要度信息表转化成多值概念形式背景,利用对象交运算生成概念集合,遍历并计算所有对象包含属性的概率;
S22.定义并计算属性的信息熵权重,统计属于相同概念的属性信息熵权重,求和得到加权形式概念集;
S23.结合条件属性中等价类之间的临界点信息,定义权重阈值,并将其作为概念重要度的置信度区间的下界;
S24.删除概念权重不在置信度区间内的概念节点,若删除后的概念节点间引起数值冲突或无法满足概念格的完备性,将该概念节点数值还原,并进入下一步;反之,若删除后的概念节点间引起数值未发生冲突、满足概念格的完备性,则直接进入下一步;
S25.依据概念格渐进式构造算法建立加权概念格。
5.如权利要求1、2或3任一所述的一种心电本体概念的属性特征约简方法,其特征在于:在模块S3中依次执行的步骤有:
S31.建立约简特征规则库;
S32.进行相关性分析,删除无关特征项,获取类冗余特征判定表;
S33.删除近似冗余特征,生成非冗余特征属性集。
采用基于自适应门限值的属性特征约简模型,采用Pearson相关系数定义特征的语义相关性,通过引入自适应学习的阈值参数,约简特征属性集,获取满足冗余特征判定条件的属性特征子集,降低属性特征维数,减少从原始特征集中提取等价类特征子集的语义密度。
6.根据权利要求1、2或3所述的一种心电本体概念的属性特征约简方法,其特征在于:
在模块S1/步骤1中,提取心电本体中的概念集合,形成目标列表{P1,P2……};
采用人机交互的方式检索波形对象的属性集,形成条件属性候选集{C1,C2……};计算条件属性决策候选集{C1,C2……}中的每个条件属性的属性关系复杂度,排序属性关系复杂度,利用分类数组分别存储两组属性信息:条件属性决策集和条件属性候选集,其中条件属性决策集包含较多属性关系的概念属性,获取基于条件属性的决策表,计算单条件属性重要度;条件属性候选集包含较少属性关系的概念属性,计算相邻属性重要度;利用单条件属性重要度和相邻属性重要度计算属性隶属度的重要度,并输出重要度信息表{A1,A2……};
在模块S2/步骤2中,将由步骤1获得的带有属性隶属度的重要度信息表{A1,A2……}作为输入量,构建多值概念形式背景;计算决策属性的决策概率特征j;遍历形式背景中的属性集合,采用参数阈值迭代方法,计算不同参数阈值下决策属性的信息熵权重,获取加权形式概念集;设定加权区间的置信度区间,采用概念建格算法构建加权区间概念格,得到决策属性在不同置信度区间下的概念信息熵空间,记为集合{S1,S2……};
在模块S3/步骤3中,利用带有双向指针的二叉树对步骤2获得的概念信息熵集合{S1,S2……}的加权节点概念集合进行存储,并通过调整层次概念的节点数,定义不同层次下的决策属性特征冗余度,基于Person相关系数的语义相关性分析,构建约简特征规则库;引入自适应学习的阈值参数分析算法,提高自适应门限值的设定精度,获取包含属性特征的多阶特征方阵。
7.根据权利要求1或6所述的一种心电本体概念的属性特征约简方法,其特征在于:步骤1具体按如下步骤进行:
S11:初始化属性目标列表:通过人机交互的方式,抽取心电本体中波形对象的属性信息;初始化属性重要度为0;引入AHA/MIT-BIH、SCP-ECG和HL7aECG三种规范化标准库,检索出与波形对象相关的概念文本集,形成“实体-标记号-文本定义注释”三元组目标列表;
S12:合并三种规范化标准库中属于相同属性的概念文本集,使用标记号文本识别对象信息的主关键词;返回统计目标列表中波形对象属性关系的复杂度函数,并依据该函数值由大到小的次序,重新排列目标列表中对象属性的记录信息;所述属性关系的复杂度函数的返回值,是与该属性具有直接邻域关系的属性的个数;抽取该目标列表内排名靠前的概念属性,获得条件属性决策集,添加到属性语义重要度队列的首部;其余概念属性作为条件属性候选集,添加到属性语义重要度队列的尾部;
S13:依次抽取该队列首部的条件属性决策集,建立条件属性的映射列表数组,遍历映射列表数组中的决策属性;依次抽取该队列剩余的条件属性候选集,建立条件属性的关联映射列表数组,遍历关联映射列表数组中的决策关联属性;
S14:使用邻接矩阵存放遍历出的决策属性,并将决策属性值大于β-边界域的属性划分为一个等价类,定义条件决策熵,计算决策属性的单条件属性重要度;构建决策关联属性的等价类,定义决策关联熵,计算决策关联属性的相邻属性重要度;
S15:定义并计算属性隶属度的重要度,利用重要度贡献函数获取条件决策表,输出{A1,A2……}。
8.根据权利要求1、2、6或7所述的一种心电本体概念的属性特征约简方法,其特征在于:模块S2/步骤2具体按如下步骤进行:
S21:将属性重要度信息表的每条记录映射成对象与属性间的多值关系,通过增加多属性值集合,将多值关系弱化成二元关系;结合对象间的交运算,计算出依赖于该形式背景下的形式概念总数;基于后验条件概率模型,标注出所有对象包含某单一属性的概率值;
S22:提取步骤S21中的标注概率值,带入属性信息熵权重的计算公式,获取属性的平均信息熵权重;将属于同一个概念下的属性信息熵求和,得到加权形式概念集;
S23:构建条件属性中等价类之间的置信度区间上下限,获取满足领域覆盖的权重阈值,定义并计算落在此区间范围内的概念属性权重;
S24:优先删除概念属性权重取值不在步骤S23所述区间范围内的概念节点,依据概念格结构的完备性约束,保留部分概念节点;
S25:采用概念格属性渐进式递增算法,构建带有权重标注信息的加权形式概念格。
9.根据权利要求5或6所述的一种医学领域心电本体概念属性特征约简方法,其特征在于:模块S3/步骤3具体按如下步骤进行:
S31:定义心电信号弱相关的冗余特征属性集,建立极值情况下冗余特征的边缘属性判定约束;依据步骤S25中加权概念格的不同层次,分别构建带有层次关联度的冗余约束子规则;
S32:计算决策属性的特征相关值并加入到特征集中,初始化无关特征门限值参数α,默认属性特征集中存在无关特征;计算属于同一层次的概念所包含的特征属性值均值,以此作为属性冗余度相关性分析的决策指标,删除小于该阈值的冗余属性,并按照特征属性值均值降序排列;保留该序列排名靠前的非冗余特征项,并加入到类冗余特征判定表;
S33:当类冗余特征表中冗余特征较少,且最大特征值ρmax与特征属性均值的差大于α(即),所述特征属性均值则将阈值门限值参数α设定为同时删除无关特征属性的差别属性项,生成非冗余特征属性集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811646734.1A CN110097934A (zh) | 2018-12-29 | 2018-12-29 | 一种心电本体概念的属性特征约简方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811646734.1A CN110097934A (zh) | 2018-12-29 | 2018-12-29 | 一种心电本体概念的属性特征约简方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110097934A true CN110097934A (zh) | 2019-08-06 |
Family
ID=67443713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811646734.1A Withdrawn CN110097934A (zh) | 2018-12-29 | 2018-12-29 | 一种心电本体概念的属性特征约简方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110097934A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110825788A (zh) * | 2019-11-07 | 2020-02-21 | 成都康赛信息技术有限公司 | 基于数据质量检测规则挖掘结果的规则约简方法 |
CN112966153A (zh) * | 2021-03-30 | 2021-06-15 | 卫宁健康科技集团股份有限公司 | 术语映射方法、装置、电子设备以及存储介质 |
CN115392582A (zh) * | 2022-09-01 | 2022-11-25 | 广东工业大学 | 基于增量模糊粗糙集属性约简的作物产量预测方法 |
-
2018
- 2018-12-29 CN CN201811646734.1A patent/CN110097934A/zh not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110825788A (zh) * | 2019-11-07 | 2020-02-21 | 成都康赛信息技术有限公司 | 基于数据质量检测规则挖掘结果的规则约简方法 |
CN112966153A (zh) * | 2021-03-30 | 2021-06-15 | 卫宁健康科技集团股份有限公司 | 术语映射方法、装置、电子设备以及存储介质 |
CN112966153B (zh) * | 2021-03-30 | 2023-10-27 | 卫宁健康科技集团股份有限公司 | 术语映射方法、装置、电子设备以及存储介质 |
CN115392582A (zh) * | 2022-09-01 | 2022-11-25 | 广东工业大学 | 基于增量模糊粗糙集属性约简的作物产量预测方法 |
CN115392582B (zh) * | 2022-09-01 | 2023-11-14 | 广东工业大学 | 基于增量模糊粗糙集属性约简的作物产量预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110097934A (zh) | 一种心电本体概念的属性特征约简方法 | |
CN108733976A (zh) | 基于融合生物与拓扑特征的关键蛋白质识别方法 | |
CN109886334A (zh) | 一种隐私保护的共享近邻密度峰聚类方法 | |
Sankaranarayanan | Diabetic prognosis through data mining methods and techniques | |
CN116541472B (zh) | 一种医疗领域知识图谱构建的方法 | |
Umasankar et al. | Decision support system for heart disease diagnosis using interval vague set and fuzzy association rule mining | |
Lv | Data preprocessing and apriori algorithm improvement in medical data mining | |
Wu et al. | Cost-sensitive decision tree with multiple resource constraints | |
Sivaselvan | Data mining: Techniques and trends | |
Boyapati et al. | An Analysis of House Price Prediction Using Ensemble Learning Algorithms | |
Qiu et al. | Exclusive lasso-based k-nearest-neighbor classification | |
Pan et al. | A novel self-optimizing approach for knowledge acquisition | |
Ni et al. | Integrated case-based reasoning | |
Tarle et al. | Improved artificial neural network for dimension reduction in medical data classification | |
Zhang et al. | Research on eight machine learning algorithms applicability on different characteristics data sets in medical classification tasks | |
McKenzie et al. | The construction of computerized classification systems using machine learning algorithms: An overview | |
Yang | RETRACTED ARTICLE: Financial Information Extraction Using the Improved Hidden Markov Model and Deep Learning | |
Singh et al. | A Clustering algorithm in stream data using strong coreset | |
Jiyun et al. | Data cleaning of medical data for knowledge mining | |
Żytkow et al. | Contingency Tables as the Foundation for Concepts, Concept Hierarchies, and Rules: The 49er System Approach | |
CN114944209B (zh) | 一种医疗相似病历的集成式计算方法及系统 | |
Lee et al. | Mining fuzzy multiple-level association rules under multiple minimum supports | |
Fang et al. | Abnormal event health-status monitoring based on multi-dimensional and multi-level association rules constraints in nursing information system | |
Wang | Automatic classification of document resources based on Naive Bayesian classification algorithm | |
Sriram | Clique optimization: A method to construct parsimonious ultrametric trees from similarity data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20190806 |