CN108986872A - 用于大数据电子病历约简的多粒度属性权重Spark方法 - Google Patents

用于大数据电子病历约简的多粒度属性权重Spark方法 Download PDF

Info

Publication number
CN108986872A
CN108986872A CN201810642497.5A CN201810642497A CN108986872A CN 108986872 A CN108986872 A CN 108986872A CN 201810642497 A CN201810642497 A CN 201810642497A CN 108986872 A CN108986872 A CN 108986872A
Authority
CN
China
Prior art keywords
attribute
health record
electronic health
big data
reduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810642497.5A
Other languages
English (en)
Other versions
CN108986872B (zh
Inventor
丁卫平
陆琰
管致锦
程学云
王杰华
董建成
李跃华
张晓峰
胡彬
陈森博
沈学华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong University Technology Transfer Center Co ltd
Original Assignee
Nantong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong University filed Critical Nantong University
Priority to CN201810642497.5A priority Critical patent/CN108986872B/zh
Publication of CN108986872A publication Critical patent/CN108986872A/zh
Application granted granted Critical
Publication of CN108986872B publication Critical patent/CN108986872B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种用于大数据电子病历约简的多粒度属性权重Spark方法。该方法首先在Hadoop分布式文件系统中将大数据电子病历集划分成不同的条件属性作业和决策属性作业;然后设计基于改进MapReduce作业协同结构的Spark模型,将电子病历条件属性作业并行化处理;其次在Hadoop分布式文件系统中构建多粒度属性权重Spark方法用于电子病历属性快速约简,从而求得大数据电子病历属性约简最优特征集;最后将大数据电子病历属性约简特征集R1,R2,…,Rn存储至Hadoop分布文件系统中,为相关疾病的临床诊断和治疗提供重要的智能诊断知识依据。

Description

用于大数据电子病历约简的多粒度属性权重Spark方法
技术领域
本发明涉及医学信息智能处理领域,具体涉及一种用于大数据电子病历约简的多粒度属性权重Spark方法。
背景技术
随着云计算和大数据时代的来临,电子病历数据库中医疗数据规模不断增长,大规模电子病历处理机制在整个医疗大数据产生和使用过程中异常复杂,挖掘出其中重要的医学诊断规则和知识是形成临床决策支持系统的关键。由于电子病历系统中存储的医疗数据具有容量大、来源分散、格式多样、存取速度快以及应用价值高等特征,给其特征选择、知识发现及临床决策支持服务等带来了较大困难。结合大数据电子病历系统自身特点,采用一些高效的方法进行复杂医疗病历属性约简处理与分析,充分挖掘出疾病或体征之间的关联性,对开展大数据临床决策支持分析以及提供个性化与知识化的医疗健康大数据服务等具有重要意义,是设计面向未来医疗健康服务大数据工程和临床智能决策分析服务系统的关键。
大数据电子病历约简是当前医疗大数据背景下临床决策支持系统研究中一个具有挑战性的课题。为提高大规模电子病历数据处理效率,可利用云计算Spark技术将海量电子病历数据分布存储到不同的数据中心节点上,构建若干个大规模电子病历医疗数据中心,实现大规模海量电子病历数据的分布存储、组织和管理,以支持大规模电子病历的并行智能处理。
发明内容
本发明的目的是为了克服以上的不足,设计了一种用于大数据电子病历约简的多粒度属性权重Spark方法,该方法能适应大数据电子病历的属性约简,大大提高了病历属性约简的效率,对云计算环境下大数据电子病历约简及其相关疾病智能辅助诊断具有重要意义与价值。
本发明的目的通过以下技术方案来实现:一种用于大数据电子病历约简的多粒度属性权重Spark方法,步骤如下:
A.在Hadoop分布式文件系统中将大数据电子病历集划分成n个作业,表示为J1,J2,…,Jn,它包含i-1个电子病历条件属性作业J1,J2,…,Ji-1和n-i+1个电子病历决策属性作业Ji,Ji+1,…,Jn
B.设计基于改进MapReduce任务协同结构的Spark模型,用于每个客户端用户从Hadoop分布式文件系统云服务器中提取电子病历诊断数据集;
C.在Spark模型上执行MapReduce操作,使电子病历条件属性作业J1,J2,…,Ji-1并行化处理,其中J1产生的条件属性作业序列为J2,…,Ji-1,J2产生的条件属性作业序列为J3,…,Ji,以此类推,Ji-1产生的条件属性作业序列为Ji,…,Jn-1
D.将每个电子病历作业的条件属性和决策属性进行合并,构建属性对序列,分别表示为J1i,J2(i+1),…,J(i-2)(n-1),J(i-1)n,进一步提取电子病历作业中模糊的条件属性和不完备的决策属性;
E.在Hadoop分布式文件系统中构建多粒度属性权重Spark方法,将关联张量Τa转换为属性权重张量Τtr,并生成不同粒度i1,...,il,...,ik下属性权重k阶张量,获取属性权重张量Τw,用于大数据电子病历属性快速约简,取得大数据电子病历属性约简集局部解和全局最优解的有效平衡;
F.每个客户端用户执行Map作业任务,一致操作对<Keyi,Valuei>被存储在集成向量中,在所有Map作业任务执行完后,主结点采用一致操作对<Keyi,Valuei>执行Reduce任务,求得大数据电子病历属性约简最优特征集;
G.比较上述求出的属性约简精度RC与预先设定精度值λ关系,若满足RC≥λ,则输出大数据电子病历最优属性集。否则,继续执行上述C,D,E和F步骤,直至属性约简精度满足RC≥λ;
H.将大数据电子病历属性约简特征集R1,R2,…,Rn存储至Hadoop分布文件系统中,为相关疾病的临床诊断和治疗提供重要的智能诊断知识依据。
优选的是,步骤E中在Hadoop分布式文件系统中构建多粒度属性权重Spark方法,将关联张量Τa转换为属性权重张量Τtr,并生成不同粒度i1,...,il,...,ik下属性权重k阶张量,获取属性权重张量Τw,用于大数据电子病历属性快速约简,取得大数据电子病历属性约简集局部解和全局最优解的有效平衡,具体步骤如下:
a.构建大数据电子病历系统为DIIS={U,AT,V,f},U为电子病历对象集合,AT为电子病历属性集,V为相关病历属性的值域,f是一个信息函数,用于指定U中每一个病历对象x的值域,A1,A2,...,Am∈AT为m个属性子集序列,w1,w2,…,wm分别对应m个电子病历属性子集序列下的权重值,其中m为非负整数;
b.设共享型协同最近邻域向量为k阶张量其主要用来对应于不同电子病历属性的k阶特征空间通过计算每个电子病历属性所在特征空间中非零元素,获取关联张量Τa如下:
将关联张量Τa中非负整数值的元素表示为从第i1个电子病历属性到第ik个属性出现的次数;
c.定义每个电子病历特征空间中病历属性的重要度,利用高阶幂函数方法计算等级向量w1,w2,...,wk,其中wl,l=1,2,...,k,计算公式如下:
wl=αΤtr×1wl…×l-1wl×l+1wl…×kwl+(1-α)μ,
其中Τtr为电子病历属性权重张量,wl为特征向量对应于k阶电子病历属性权重张量Τtr的主导特征值,μ为一个随机向量,α为一个关联概率,其范围为0<α<1;
d.将关联张量Τa转换为电子病历属性权重张量Τtr,生成用于电子病历约简的多粒度属性权重k阶张量,在不同粒度i1,...,il,...,ik下属性权重张量计算方法如下:
其中z是Τa所有阶的最大维数;
e.在关联概率0<α<1范围内,定义阈值ε的范围为ε∈[0.5,1],初始向量w0满足的条件为
f.设随机向量和j=0,执行如下循环操作:
(i)j=j+1;
(ii)wj=αΤtr×1wj-1…×l-1wj-1×l+1wj-1…×kwj-1+(1-α)μ;
(iii)直到满足条件||wj-wj-1||>ε;
g.将wj的一阶向量表示为其排序向量为wj′,设wj=wj′,则构建大数据电子病历属性权重排序向量如下:
h.计算电子病历属性权重张量的乘积方程,其计算方法如下:
Τw=w1×w2×...wk
该权重张量Τw能够平衡不同电子病历属性在同一特征规则提取中的相对贡献度,从而取得大数据电子病历属性约简集的局部解和全局优势解的有效平衡。
本发明与现有技术相比具有以下优点:1、该方法能准确划分大数据电子病历中相互依赖和关联的属性集,有效处理电子病历数据元素间多维度复杂的内联关系,取得大数据电子病历属性约简集的局部解和全局最优解的有效平衡,保证最终求得的电子病历约简集为所求目标的最优约简特征集,大大降低了执行时间,提升了病历属性提取的精度,从而能更有效地应用于面向云计算的大数据电子病历约简应用服务,找出最具成本效益的相关疾病临床治疗模式;2、该方法在云计算环境下采用Spark模型对病人自身病历数据进行安全收集、维护和管理,帮助用户对医院和患者的大量电子病历数据进行实时与非实时属性约简与分析,能有效处理大数据电子病历约简时所呈现出的复杂系统特性,通过构建临床大数据电子病历约简平台,为开展大数据电子病历知识分析以及临床决策支持等智能服务奠定了较好的基础。
附图说明
图1是本发明总体结构图;
图2是基于Spark模型的电子病历条件属性作业MapReduce操作过程图;
图3是基于多粒度属性权重的大数据电子病历约简执行过程图;
具体实施方式
为了加深对本发明的理解,下面将结合实施例和附图对本发明作进一步详述,该实施例仅用于解释本发明,并不构成对本发明保护范围的限定。
如图1、2、3所示,本发明提供了一种用于大数据电子病历约简的多粒度属性权重Spark方法,步骤如下:
A.在Hadoop分布式文件系统中将大数据电子病历集划分成n个作业,表示为J1,J2,…,Jn,它包含i-1个电子病历条件属性作业J1,J2,…,Ji-1和n-i+1个电子病历决策属性作业Ji,Ji+1,…,Jn
B.设计基于改进MapReduce任务协同结构的Spark模型,用于每个客户端用户从Hadoop分布式文件系统云服务器中提取电子病历诊断数据集;
C.在Spark模型上执行MapReduce操作,使电子病历条件属性作业J1,J2,…,Ji-1并行化处理,其中J1产生的条件属性作业序列为J2,…,Ji-1,J2产生的条件属性作业序列为J3,…,Ji,以此类推,Ji-1产生的条件属性作业序列为Ji,…,Jn-1
D.将每个电子病历作业的条件属性和决策属性进行合并,构建属性对序列,分别表示为J1i,J2(i+1),…,J(i-2)(n-1),J(i-1)n,进一步提取电子病历作业中模糊的条件属性和不完备的决策属性;
E.在Hadoop分布式文件系统中构建多粒度属性权重Spark方法,将关联张量Τa转换为属性权重张量Τtr,并生成不同粒度i1,...,il,...,ik下属性权重k阶张量,获取属性权重张量Τw,用于大数据电子病历属性快速约简,取得大数据电子病历属性约简集局部解和全局最优解的有效平衡;
F.每个客户端用户执行Map作业任务,一致操作对<Keyi,Valuei>被存储在集成向量中,在所有Map作业任务执行完后,主结点采用一致操作对<Keyi,Valuei>执行Reduce任务,求得大数据电子病历属性约简最优特征集;
G.比较上述求出的属性约简精度RC与预先设定精度值λ关系,若满足RC≥λ,则输出大数据电子病历最优属性集。否则,继续执行上述C,D,E和F步骤,直至属性约简精度满足RC≥λ;
H.将大数据电子病历属性约简特征集R1,R2,…,Rn存储至Hadoop分布文件系统中,为相关疾病的临床诊断和治疗提供重要的智能诊断知识依据。
步骤E中在Hadoop分布式文件系统中构建多粒度属性权重Spark方法,将关联张量Τa转换为属性权重张量Τtr,并生成不同粒度i1,...,il,...,ik下属性权重k阶张量,获取属性权重张量Τw,用于大数据电子病历属性快速约简,取得大数据电子病历属性约简集局部解和全局最优解的有效平衡,具体步骤如下:
a.构建大数据电子病历系统为DIIS={U,AT,V,f},U为电子病历对象集合,AT为电子病历属性集,V为相关病历属性的值域,f是一个信息函数,用于指定U中每一个病历对象x的值域,A1,A2,...,Am∈AT为m个属性子集序列,w1,w2,…,wm分别对应m个电子病历属性子集序列下的权重值,其中m为非负整数;
b.设共享型协同最近邻域向量为k阶张量其主要用来对应于不同电子病历属性的k阶特征空间通过计算每个电子病历属性所在特征空间中非零元素,获取关联张量Τa如下:
将关联张量Τa中非负整数值的元素表示为从第i1个电子病历属性到第ik个属性出现的次数;
c.定义每个电子病历特征空间中病历属性的重要度,利用高阶幂函数方法计算等级向量w1,w2,...,wk,其中wl,l=1,2,...,k,计算公式如下:
wl=αΤtr×1wl…×l-1wl×l+1wl…×kwl+(1-α)μ,
其中Τtr为电子病历属性权重张量,wl为特征向量对应于k阶电子病历属性权重张量Τtr的主导特征值,μ为一个随机向量,α为一个关联概率,其范围为0<α<1;
d.将关联张量Τa转换为电子病历属性权重张量Τtr,生成用于电子病历约简的多粒度属性权重k阶张量,在不同粒度i1,...,il,...,ik下属性权重张量计算方法如下:
其中z是Τa所有阶的最大维数;
e.在关联概率0<α<1范围内,定义阈值ε的范围为ε∈[0.5,1],初始向量w0满足的条件为
f.设随机向量和j=0,执行如下循环操作:
(i)j=j+1;
(ii)wj=αΤtr×1wj-1…×l-1wj-1×l+1wj-1…×kwj-1+(1-α)μ;
(iii)直到满足条件||wj-wj-1||>ε;
g.将wj的一阶向量表示为其排序向量为wj′,设wj=wj′,则构建大数据电子病历属性权重排序向量如下:
h.计算电子病历属性权重张量的乘积方程,其计算方法如下:
Τw=w1×w2×...wk
该权重张量Τw能够平衡不同电子病历属性在同一特征规则提取中的相对贡献度,从而取得大数据电子病历属性约简集的局部解和全局最优解的有效平衡。

Claims (2)

1.一种用于大数据电子病历约简的多粒度属性权重Spark方法,其特征在于:步骤如下:
A.在Hadoop分布式文件系统中将大数据电子病历集划分成n个作业,表示为J1,J2,…,Jn,它包含i-1个电子病历条件属性作业J1,J2,…,Ji-1和n-i+1个电子病历决策属性作业Ji,Ji+1,…,Jn
B.设计基于改进MapReduce任务协同结构的Spark模型,用于每个客户端用户从Hadoop分布式文件系统云服务器中提取电子病历诊断数据集;
C.在Spark模型上执行MapReduce操作,使电子病历条件属性作业J1,J2,…,Ji-1并行化处理,其中J1产生的条件属性作业序列为J2,…,Ji-1,J2产生的条件属性作业序列为J3,…,Ji,以此类推,Ji-1产生的条件属性作业序列为Ji,…,Jn-1
D.将每个电子病历作业的条件属性和决策属性进行合并,构建属性对序列,分别表示为J1i,J2(i+1),…,J(i-2)(n-1),J(i-1)n,进一步提取电子病历作业中模糊的条件属性和不完备的决策属性;
E.在Hadoop分布式文件系统中构建多粒度属性权重Spark方法,将关联张量Τa转换为属性权重张量Τtr,并生成不同粒度i1,...,il,...,ik下属性权重k阶张量,获取属性权重张量Τw,用于大数据电子病历属性快速约简,取得大数据电子病历属性约简集局部解和全局最优解的有效平衡;
F.每个客户端用户执行Map作业任务,一致操作对<Keyi,Valuei>被存储在集成向量中,在所有Map作业任务执行完后,主结点采用一致操作对<Keyi,Valuei>执行Reduce任务,求得大数据电子病历属性约简最优特征集;
G.比较上述求出的属性约简精度RC与预先设定精度值λ关系,若满足RC≥λ,则输出大数据电子病历最优属性集。否则,继续执行上述C,D,E和F步骤,直至属性约简精度满足RC≥λ;
H.将大数据电子病历属性约简特征集R1,R2,…,Rn存储至Hadoop分布文件系统中,为相关疾病的临床诊断和治疗提供重要的智能诊断知识依据。
2.根据权利要求1所述一种用于大数据电子病历约简的多粒度属性权重Spark方法,其特征在于:所述步骤E中在Hadoop分布式文件系统中构建多粒度属性权重Spark方法,将关联张量Τa转换为属性权重张量Τtr,并生成不同粒度i1,...,il,...,ik下属性权重k阶张量,获取属性权重张量Τw,用于大数据电子病历属性快速约简,取得大数据电子病历属性约简集局部解和全局最优解的有效平衡,具体步骤如下:
a.构建大数据电子病历系统为DIIS={U,AT,V,f},U为电子病历对象集合,AT为电子病历属性集,V为相关病历属性的值域,f是一个信息函数,用于指定U中每一个病历对象x的值域,A1,A2,...,Am∈AT为m个属性子集序列,w1,w2,…,wm分别对应m个电子病历属性子集序列下的权重值,其中m为非负整数;
b.设共享型协同最近邻域向量为k阶张量其主要用来对应于不同电子病历属性的k阶特征空间通过计算每个电子病历属性所在特征空间中非零元素,获取关联张量Τa如下:
将关联张量Τa中非负整数值的元素表示为从第i1个电子病历属性到第ik个属性出现的次数;
c.定义每个电子病历特征空间中病历属性的重要度,利用高阶幂函数方法计算等级向量w1,w2,...,wk,其中wl,l=1,2,...,k,计算公式如下:
wl=αΤtr×1wl…×l-1wl×l+1wl…×kwl+(1-α)μ,
其中Τtr为电子病历属性权重张量,wl为特征向量对应于k阶电子病历属性权重张量Τtr的主导特征值,μ为一个随机向量,α为一个关联概率,其范围为0<α<1;
d.将关联张量Τa转换为电子病历属性权重张量Τtr,生成用于电子病历约简的多粒度属性权重k阶张量,在不同粒度i1,...,il,...,ik下属性权重张量计算方法如下:
其中z是Τa所有阶的最大维数;
e.在关联概率0<α<1范围内,定义阈值ε的范围为ε∈[0.5,1],初始向量w0满足的条件为
f.设随机向量和j=0,执行如下循环操作:
(i)j=j+1;
(ii)wj=αΤtr×1wj-1…×l-1wj-1×l+1wj-1…×kwj-1+(1-α)μ;
(iii)直到满足条件||wj-wj-1||>ε;
g.将wj的一阶向量表示为其排序向量为wj′,设wj=wj′,则构建大数据电子病历属性权重排序向量如下:
h.计算电子病历属性权重张量的乘积方程,其计算方法如下:
Τw=w1×w2×...wk
该权重张量Τw能够平衡不同电子病历属性在同一特征规则提取中的相对贡献度,从而取得大数据电子病历属性约简集的局部解和全局最优解的有效平衡。
CN201810642497.5A 2018-06-21 2018-06-21 用于大数据电子病历约简的多粒度属性权重Spark方法 Active CN108986872B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810642497.5A CN108986872B (zh) 2018-06-21 2018-06-21 用于大数据电子病历约简的多粒度属性权重Spark方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810642497.5A CN108986872B (zh) 2018-06-21 2018-06-21 用于大数据电子病历约简的多粒度属性权重Spark方法

Publications (2)

Publication Number Publication Date
CN108986872A true CN108986872A (zh) 2018-12-11
CN108986872B CN108986872B (zh) 2021-05-07

Family

ID=64541613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810642497.5A Active CN108986872B (zh) 2018-06-21 2018-06-21 用于大数据电子病历约简的多粒度属性权重Spark方法

Country Status (1)

Country Link
CN (1) CN108986872B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334116A (zh) * 2019-07-11 2019-10-15 河南大学 一种基于多粒度决策系统的最优客体粒度确定方法
CN110867224A (zh) * 2019-10-28 2020-03-06 南通大学 用于大规模脑病历分割的多粒度Spark超信任模糊方法
CN111354427A (zh) * 2020-02-25 2020-06-30 南通大学 用于大规模电子健康档案知识协同约简的最近邻多粒度利润方法
CN111816270A (zh) * 2020-06-18 2020-10-23 南通大学 大规模肝脏电子病历病变分类的属性并行约简Spark方法
CN113012775A (zh) * 2021-03-30 2021-06-22 南通大学 红斑病电子病历病变分类的增量属性约简Spark方法
CN113012776A (zh) * 2021-03-30 2021-06-22 南通大学 大规模不平衡糖尿病电子病历并行分类邻域证据Spark方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462853A (zh) * 2014-12-29 2015-03-25 南通大学 用于电子病历特征提取的种群精英分布云协同均衡方法
CN107256342A (zh) * 2017-06-15 2017-10-17 南通大学 用于电子病历知识约简效能评估的多种群协同熵级联方法
US20170344550A1 (en) * 2016-05-24 2017-11-30 International Business Machines Corporation Cognitive Computer Assisted Attribute Acquisition Through Iterative Disclosure
CN107562732A (zh) * 2017-10-26 2018-01-09 北京康夫子科技有限公司 电子病历的处理方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462853A (zh) * 2014-12-29 2015-03-25 南通大学 用于电子病历特征提取的种群精英分布云协同均衡方法
US20170344550A1 (en) * 2016-05-24 2017-11-30 International Business Machines Corporation Cognitive Computer Assisted Attribute Acquisition Through Iterative Disclosure
CN107256342A (zh) * 2017-06-15 2017-10-17 南通大学 用于电子病历知识约简效能评估的多种群协同熵级联方法
CN107562732A (zh) * 2017-10-26 2018-01-09 北京康夫子科技有限公司 电子病历的处理方法及系统

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334116A (zh) * 2019-07-11 2019-10-15 河南大学 一种基于多粒度决策系统的最优客体粒度确定方法
CN110334116B (zh) * 2019-07-11 2022-09-16 河南大学 一种基于多粒度决策系统的最优客体粒度确定方法
CN110867224B (zh) * 2019-10-28 2022-02-08 南通大学 用于大规模脑病历分割的多粒度Spark超信任模糊方法
CN110867224A (zh) * 2019-10-28 2020-03-06 南通大学 用于大规模脑病历分割的多粒度Spark超信任模糊方法
WO2021082444A1 (zh) * 2019-10-28 2021-05-06 南通大学 用于大规模脑病历分割的多粒度Spark超信任模糊方法
CN111354427A (zh) * 2020-02-25 2020-06-30 南通大学 用于大规模电子健康档案知识协同约简的最近邻多粒度利润方法
CN111354427B (zh) * 2020-02-25 2022-04-29 南通大学 用于大规模电子健康档案知识协同约简的最近邻多粒度利润方法
WO2021169088A1 (zh) * 2020-02-25 2021-09-02 南通大学 用于大规模电子健康档案知识协同约简的最近邻多粒度利润方法
CN111816270A (zh) * 2020-06-18 2020-10-23 南通大学 大规模肝脏电子病历病变分类的属性并行约简Spark方法
CN111816270B (zh) * 2020-06-18 2022-12-09 南通大学 大规模肝脏电子病历病变分类的属性并行约简Spark方法
CN113012775B (zh) * 2021-03-30 2021-10-08 南通大学 红斑病电子病历病变分类的增量属性约简Spark方法
CN113012776A (zh) * 2021-03-30 2021-06-22 南通大学 大规模不平衡糖尿病电子病历并行分类邻域证据Spark方法
CN113012775A (zh) * 2021-03-30 2021-06-22 南通大学 红斑病电子病历病变分类的增量属性约简Spark方法
CN113012776B (zh) * 2021-03-30 2022-11-04 南通大学 大规模不平衡糖尿病电子病历并行分类邻域证据Spark方法

Also Published As

Publication number Publication date
CN108986872B (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
Abd Elaziz et al. Advanced optimization technique for scheduling IoT tasks in cloud-fog computing environments
CN108986872A (zh) 用于大数据电子病历约简的多粒度属性权重Spark方法
Yuan et al. A stable AI-based binary and multiple class heart disease prediction model for IoMT
Medhekar et al. Heart disease prediction system using naive Bayes
JP2023505973A (ja) 連合混合モデル
Bu An efficient fuzzy c-means approach based on canonical polyadic decomposition for clustering big data in IoT
Biswas et al. Hybrid expert system using case based reasoning and neural network for classification
Wang et al. Fedacs: Federated skewness analytics in heterogeneous decentralized data environments
CN113345570A (zh) 基于区块链和智慧医疗的大数据提取方法及大数据系统
Ahn et al. Federated active learning (f-al): an efficient annotation strategy for federated learning
Liu et al. Multilevel Federated Learning based Intelligent Traffic Flow Forecasting for Transportation Network Management
Kong et al. RETRACTED ARTICLE: Multimodal interface interaction design model based on dynamic augmented reality
Azevedo et al. A deep spatiotemporal graph learning architecture for brain connectivity analysis
CN111260074B (zh) 一种超参数确定的方法、相关装置、设备及存储介质
Ghosh et al. Entity aware modelling: A survey
Huang et al. Intelligent sports prediction analysis system based on edge computing of particle swarm optimization algorithm
Zhang et al. Intrinsic Performance Influence-based Participant Contribution Estimation for Horizontal Federated Learning
Stripelis et al. Federated learning over harmonized data silos
JP2012079225A (ja) 協調フィルタリング処理方法およびプログラム
Wang et al. Construction of data transmission consistency verification model of Petri net based on fuzzy C-means
Zhang et al. Intelligent travelling visitor estimation model with big data mining
Liu et al. A cyber physical system crowdsourcing inference method based on tempering: an advancement in artificial intelligence algorithms
Sunitha et al. Political optimizer-based automated machine learning for skin lesion data
Bagirov et al. An Algorithm for Clustering Using L1‐Norm Based on Hyperbolic Smoothing Technique
CN112862070A (zh) 一种利用图神经网络和胶囊网络的链路预测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230818

Address after: 226000 No. 9 Siyuan Road, Chongchuan District, Nantong City, Jiangsu Province

Patentee after: Nantong University Technology Transfer Center Co.,Ltd.

Address before: 226000 No. 8, Siyuan Road, Chongchuan District, Nantong City, Jiangsu Province

Patentee before: NANTONG University