CN107658023A - 疾病预测方法、装置、介质和电子设备 - Google Patents

疾病预测方法、装置、介质和电子设备 Download PDF

Info

Publication number
CN107658023A
CN107658023A CN201710876698.7A CN201710876698A CN107658023A CN 107658023 A CN107658023 A CN 107658023A CN 201710876698 A CN201710876698 A CN 201710876698A CN 107658023 A CN107658023 A CN 107658023A
Authority
CN
China
Prior art keywords
health
user
data
multiple user
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710876698.7A
Other languages
English (en)
Other versions
CN107658023B (zh
Inventor
谭红霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN201710876698.7A priority Critical patent/CN107658023B/zh
Publication of CN107658023A publication Critical patent/CN107658023A/zh
Application granted granted Critical
Publication of CN107658023B publication Critical patent/CN107658023B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明实施例提供了一种疾病预测方法、装置、介质和电子设备,该疾病预测方法,包括:获取多个用户的与健康相关的数据;基于所述多个用户的与健康相关的数据对所述多个用户进行聚类分析,以将所述多个用户划分为至少一个类;确定已确诊患者所在的目标类,并将所述目标类中的其他用户预测为患病的高危人群。本发明实施例的技术方案能够对可能患病的人群进行预测,进而可以保证及时发现重大疾病,以达到早发现、早治疗的目的,提高了用户健康管理的水平。

Description

疾病预测方法、装置、介质和电子设备
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种疾病预测方法、装置、介质和电子设备。
背景技术
目前,重大疾病的发病率逐年升高,特别是老年人由于身体素质差,发病率更高,且一旦发病会迅速恶化,难以治疗,给老人身心带来很大的伤害,影响晚年生活质量。
因此重大疾病早发现、早预防,对提高老人晚年生活质量具有重大的意义。在现阶段,通常都是通过定期体检、癌症筛查等方式来发现重大疾病,这种方式存在发现不及时的问题,且全身癌症筛查检验项目众多,会对身体产生一定的副作用。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种疾病预测方法、装置、介质和电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的第一方面,提供了一种疾病预测方法,包括:获取多个用户的与健康相关的数据;基于所述多个用户的与健康相关的数据对所述多个用户进行聚类分析,以将所述多个用户划分为至少一个类;确定已确诊患者所在的目标类,并将所述目标类中的其他用户预测为患病的高危人群。
在本发明的一些实施例,基于前述方案,获取多个用户的与健康相关的数据,包括:在预定区域内的人群中出现已确诊的患者后,获取所述预定区域内的所述多个用户的与健康相关的数据。
在本发明的一些实施例,基于前述方案,获取多个用户的与健康相关的数据,基于所述多个用户的与健康相关的数据对所述多个用户进行聚类分析,包括:周期性获取多个用户的与健康相关的数据,并根据最新周期内获取到的数据对所述多个用户重新进行聚类分析。
在本发明的一些实施例,基于前述方案,基于所述多个用户的与健康相关的数据对所述多个用户进行聚类分析,包括:对所述多个用户的与健康相关的数据进行标准化处理,得到每个用户的标准化数据;将所述每个用户的标准化数据抽象为空间中对应的一个点;对所述多个用户在所述空间中对应的点进行聚类分析,以对所述多个用户进行聚类分析。
在本发明的一些实施例,基于前述方案,对所述多个用户的与健康相关的数据进行标准化处理,得到每个用户的标准化数据,包括:基于所述多个用户的与健康相关的数据,确定与用户的健康相关的多个指标;根据每个用户的与健康相关的数据,计算所述每个用户对应的所述多个指标的值,以得到所述每个用户的标注化数据。
在本发明的一些实施例,基于前述方案,还包括:获取所述高危人群的实际患病情况;根据预测的结果和所述实际患病情况,确定预测的准确性;根据所述预测的准确性,调整对所述每个用户对应的所述多个指标的值进行计算的策略。
在本发明的一些实施例,基于前述方案,还包括:在对所述策略进行调整之后,根据调整后的策略重新对所述多个用户的与健康相关的数据进行标准化处理,并基于重新标准化处理后的数据对所述多个用户重新进行聚类分析。
在本发明的一些实施例,基于前述方案,对所述多个用户在所述空间中对应的点进行聚类分析,包括:构造N个类,所述N个类中的每个类包含所述空间中的一个点;合并所述N个类中距离最近的两个类,得到合并后的新类,基于得到的新类继续合并距离最近的两个类,直到所述多个用户在所述空间中对应的点合并为一类为止;获取在聚类过程中得到的聚类谱系图,并基于所述聚类谱系图确定将所述多个用户在所述空间中对应的点进行聚类的结果。
在本发明的一些实施例,基于前述方案,还包括:向指定人员发送针对所述高危人群的预警信息。
在本发明的一些实施例,基于前述方案,还包括:计算所述目标类中已确诊患者所占的比例;根据所述目标类中已确诊患者所占的比例,设置所述预警信息的级别。
在本发明的一些实施例,基于前述方案,所述与健康相关的数据包括以下任一或多个的组合:生活环境、生活习惯和健康档案数据。
根据本发明实施例的第二方面,提供了一种疾病预测装置,包括:获取单元,用于获取多个用户的与健康相关的数据;处理单元,用于基于所述多个用户的与健康相关的数据对所述多个用户进行聚类分析,以将所述多个用户划分为至少一个类;预测单元,用于确定已确诊患者所在的目标类,并将所述目标类中的其他用户预测为患病的高危人群。
根据本发明实施例的第三方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述第一方面所述的疾病预测方法。
根据本发明实施例的第四方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述第一方面所述的疾病预测方法。
在本发明的一些实施例所提供的技术方案中,通过基于多个用户的与健康相关的数据对用户进行聚类分析,使得能够找到高度相似的人群,进而可以根据已确诊患者所在的类来预测可能患病的高危人群。可见,本发明实施例的技术方案能够对可能患病的人群进行预测,进而可以保证及时发现重大疾病,以达到早发现、早治疗的目的,提高了用户健康管理的水平。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出了根据本发明的实施例的疾病预测方法的流程图;
图2示出了图1中所示的步骤S12的一种具体实现过程示意图;
图3示出了根据本发明的实施例的标准化数据矩阵的示意图;
图4示出了根据本发明的实施例的计算类与类之间的距离的示意图;
图5示意性示出了根据本发明的实施例的疾病预测装置的框图;
图6示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示意性示出了根据本发明的实施例的疾病预测方法的流程图。
参照图1所示,根据本发明的实施例的疾病预测方法,包括:
步骤S10,获取多个用户的与健康相关的数据。
在本发明的实施例,与健康相关的数据可以包括以下任一或多个的组合:生活环境、生活习惯和健康档案数据。其中,生活环境可以包括气候、空气质量、水质量、绿化率等;生活习惯可以包括饮酒、饮食、吸烟、运动种类、运动频次、运动时长等;健康档案数据可以包括家族史、既往史、现病史等。
步骤S12,基于所述多个用户的与健康相关的数据对所述多个用户进行聚类分析,以将所述多个用户划分为至少一个类。
步骤S14,确定已确诊患者所在的目标类,并将所述目标类中的其他用户预测为患病的高危人群。
在本发明的实施例中,当预测到高危人群之后,还可以向指定人员发送针对所述高危人群的预警信息。需要说明的是,指定人员可以是健康管理师、亲属、医护人员等。在发送预警信息时可以通过邮件、短信或即时通讯软件等进行发送。
可选地,在本发明的实施例中,还可以计算所述目标类中已确诊患者所占的比例,并根据所述目标类中已确诊患者所占的比例,设置所述预警信息的级别。具体地,预警信息的级别与已确诊患者所占的比例成正相关关系,即已确诊患者所占的比例越高,预警信息的级别也越高。
以下对上述步骤S10和步骤S12进行详细说明:
在本发明的实施例中,对于步骤S10中获取多个用户的与健康相关的数据可以有如下三种具体的实现方式:
实现方式一:
步骤S10具体包括:在预定区域内的人群中出现已确诊的患者后,获取所述预定区域内的所述多个用户的与健康相关的数据。
在实现方式一中,由于是在预定区域内的人群中出现已确诊的患者之后,再获取多个用户的与健康相关的数据,因此能够保证获取到多个用户的最新数据,进而可以保证基于获取到的数据进行聚类分析的准确性,从而能够了提高疾病预测的准确性。
需要说明的是,在实现方式一中,预定区域可以是一个养老社区,也可以是多个养老社区,还可以是根据实际需要划分的其他区域。
实现方式二:
步骤S10具体包括:周期性获取多个用户的与健康相关的数据。相应的,步骤S12可以包括:根据最新周期内获取到的数据对所述多个用户重新进行聚类分析。
在实现方式二中,不管有没有出现已确诊的患者,都可以每隔一段时间(周期)获取一次与健康相关的数据,然后对用户进行一次聚类分析,这样可以保证出现已确诊的患者之后,及时预测到高危人群。同时,由于是周期性获取数据,并根据最新周期内获取到的数据对用户重新进行聚类,因此也能够保证获取到较新的数据来对聚类结果进行更新,进而也能够保证疾病预测的准确性。
实现方式三:
该实现方式可以是实现方式一与实现方式二的结合,比如在没有出现已确诊的患者时,可以通过实现方式二来周期性获取数据,并基于获取到的数据进行聚类。当出现已确诊的患者时,如果最近一次获取数据并进行聚类的时间距离当前时间(出现已确诊患者的时间)较近,则可以直接基于最近一次确定的聚类结果来进行预测;如果最近一次获取数据并进行聚类的时间距离当前时间(出现已确诊患者的时间)较远,则可以基于实现方式一来获取数据并确定最新的聚类结果,以基于最新的聚类结果来进行预测。
以下具体介绍步骤S12中的聚类分析过程:
参照图2所示,步骤S12具体包括:
步骤S121,对所述多个用户的与健康相关的数据进行标准化处理,得到每个用户的标准化数据。
在本发明的示例性实施例中,步骤S121包括:基于所述多个用户的与健康相关的数据,确定与用户的健康相关的多个指标;根据每个用户的与健康相关的数据,计算所述每个用户对应的所述多个指标的值,以得到所述每个用户的标注化数据。
需要说明的是:由于不同用户的生活环境、生活习惯和健康档案数据等可能不相同,因此不同用户的与健康相关的数据也不同,为了能够进行分析,可以基于对多个用户的相关数据的分析来确定与用户的健康相关的多个指标,然后根据每个用户的相关数据来确定其对应的各个指标的值。举例来说,比如确定的与用户的健康相关的多个指标中包含有吸烟,那么若甲先生不吸烟,则其对应的吸烟的值为0;若居民丁先生吸烟5年,则其对应的吸烟的值为10(数值在此仅为示例,并不作具体限定)。
进一步地,在本发明的实施例中,基于前述方案,还可以包括:获取所述高危人群的实际患病情况;根据预测的结果和所述实际患病情况,确定预测的准确性;根据所述预测的准确性,调整对所述每个用户对应的所述多个指标的值进行计算的策略。
在该实施例中,通过根据预测的准确性调整指标值的计算策略,使得能够修正标准化处理后得到的数据,进而能够调整聚类分析的结果,有利于提高疾病预测的准确性。举例来说,比如根据预测的准确性将指标吸烟的值的计算规则调整为:不吸烟为0,吸烟为5且吸烟年限每增加一年值加1(数值在此仅为示例,并不作具体限定)。
进一步地,在本发明的实施例中,基于前述方案,还包括:在对所述策略进行调整之后,根据调整后的策略重新对所述多个用户的与健康相关的数据进行标准化处理,并基于重新标准化处理后的数据对所述多个用户重新进行聚类分析。
在该实施例中,通过根据调整后的策略重新对与健康相关的数据进行标准化处理,并基于重新标准化处理后的数据对用户重新进行聚类分析,使得能够调整聚类分析的结果,进而能够提高疾病预测的准确性。
步骤S122,将所述每个用户的标准化数据抽象为空间中对应的一个点。
需要说明的是,比如每个用户的标准化数据中包含有m个指标,则可以将每个用户的标准化数据抽象为m维空间中对应的一个点。
步骤S123,对所述多个用户在所述空间中对应的点进行聚类分析,以对所述多个用户进行聚类分析。
在本发明的示例性实施例中,步骤S123包括:构造N个类,所述N个类中的每个类包含所述空间中的一个点;合并所述N个类中距离最近的两个类,得到合并后的新类,基于得到的新类继续合并距离最近的两个类,直到所述多个用户在所述空间中对应的点合并为一类为止;获取在聚类过程中得到的聚类谱系图,并基于所述聚类谱系图确定将所述多个用户在所述空间中对应的点进行聚类的结果。
需要说明的是,在本发明的实施例中,除了可以通过系统聚类法进行聚类分析之外,也可以通过其他聚类方法进行聚类,比如可以通过K均值聚类法等。
以下以养老社区的应用场景为例,对本发明实施例的技术方案进行详细阐述:
养老社区居民在医院确诊患有重大疾病如肺癌时,会触发后台程序以个体生活环境(同一养老社区的生活环境视为相同,不同养老社区以气候、空气质量、水质量、绿化率等作为参数)、生活习惯(饮食、饮酒、吸烟、运动种类、运动频次、运动时长等作为参数)和健康档案数据(家族史、既往史、现病史等作为参数)等作为输入参数,通过聚类算法从群体中筛选中高度相似的人群,并对筛选出的人群进行定向预警,比如向社区健康管理师发发送预警信息,社区健康管理师在接收到预警信息后,及时对定向人群进行专项评估,评估结果为高危人群的需要及时到医院由医师确诊。其中,上述的预警信息可以根据该疾病在相似人群中已经发生的百分比,分成不同预警级别,如发生百分比超过20%时,设置为严重级别。
在进行聚类分析时,可以采用系统聚类法(Hierarchical clustering methods,也称层次聚类法)。由于系统聚类法的类与类之间距离计算方法灵活多样,使其能够适应不同的要求,下面具体说明系统聚类法在本发明实施例中根据输入参数对养老社区居民进行分类的过程:
1、对数据进行标准化处理:
可选地,可以对数据进行矩阵标准化处理,具体地:m代表变量即个体环境、生活习惯、健康档案数据等输入参数,n代表养老社区居民,那么m个指标X1,X2,X3,……,Xm的标准化数据矩阵可以如图3所示。
根据业务场景、经验和已有业务数据分析自定义规则计算每个社区居民的各指标的具体数值。以吸烟为例,假定吸烟为变量X1,那么可以根据有无吸烟史、吸烟年限等来计算每个居民对应的变量X1的值,如居民甲先生不吸烟,则X1对应的值为0;居民丁先生吸烟5年,则X1对应的值为10。需要说明的是:X1值的计算规则可以根据实际需要进行调整,比如也可以是:不吸烟为0,吸烟为5且每吸烟年限每增加一年加1。
此外,在实际应用过程中,可以根据实际预测结果的准确性来调整居民的各个指标值的计算规则,进而基于调整后的计算规则重新进行聚类分析,从而提高预测的准确率。
2、对居民进行相似性测度:
(1)将养老社区居民看成是m维空间中的一个点,并在空间中定义距离,根据各个居民对应的点之间的距离远近进行分类,距离较近的分为一类,距离较远的分为不同的类。
需要说明的是:计算居民对应的点之间的距离可采用欧氏距离、明氏距离、马氏距离等多种算法,考虑到变量之间的相关性,在本发明的实施例中可以采用马氏距离计算方法,公式如下:
其中,dij表示居民i和居民j对应的点之间的距离,S表示样本协方差矩阵。
(2)构造n个类,每个类只包含一个社区居民。
(3)合并距离最近的两类为一个新类。
(4)计算新类与其他类之间的距离。
在本发明的实施例中,计算新类与各当前类之间的距离可以采用中间距离法。具体地,如图4所示,r为原来的类,p、q合并后的新类为k,新类k和原来的类r之间距离为dkr,可以通过如下公式计算dkr
(5)重复(3)和(4)合并距离最近的两类为新类,直到所有的类并为一类为止。
(6)通过聚类谱系图决定聚类的个数和各个类。
在本发明的一个具体应用中,比如:养老社区居民C先生由于身体不适去医院就诊,发现患有肺癌中期,触发了根据本发明实施例的疾病预测方法及装置,结果找出与C先生相似度极高的10位社区居民,并把预警信息发送给了居民的健康管理师甲小姐。甲小姐立刻启动对这10位居民进行肺癌症状量表专项评估,评估得出结论D先生和F小姐属于高危人群,建议D先生和F小姐去医院进行进一步检查,医院检查发现D先生患有肺癌早期,F小姐有肺部感染。可见,本发明实施例的技术方案基于个体重大疾病,通过算法寻找高度相似的人群来进行定向预警,达到了重大疾病早发现、早治疗目的,提高了养老社区居民晚年生活质量和水平,提升了社区健康管理水平。
图5示意性示出了根据本发明的实施例的疾病预测装置的框图。
参照图5,根据本发明的实施例的疾病预测装置500,包括:获取单元502、处理单元504和预测单元506。
具体地,获取单元502用于获取多个用户的与健康相关的数据;处理单元504用于基于所述多个用户的与健康相关的数据对所述多个用户进行聚类分析,以将所述多个用户划分为至少一个类;预测单元506用于确定已确诊患者所在的目标类,并将所述目标类中的其他用户预测为患病的高危人群。
在本发明的一些实施例,基于前述方案,获取单元502配置为:在预定区域内的人群中出现已确诊的患者后,获取所述预定区域内的所述多个用户的与健康相关的数据。
在本发明的一些实施例,基于前述方案,获取单元502配置为:周期性获取多个用户的与健康相关的数据;处理单元504配置为:根据最新周期内获取到的数据对所述多个用户重新进行聚类分析。
在本发明的一些实施例,基于前述方案,处理单元504包括:标准化单元、抽象单元和聚类分析单元。
具体地,标准化单元用于对所述多个用户的与健康相关的数据进行标准化处理,得到每个用户的标准化数据;抽象单元用于将所述每个用户的标准化数据抽象为空间中对应的一个点;聚类分析单元用于对所述多个用户在所述空间中对应的点进行聚类分析,以对所述多个用户进行聚类分析。
在本发明的一些实施例,基于前述方案,所述标准化单元配置为:基于所述多个用户的与健康相关的数据,确定与用户的健康相关的多个指标;根据每个用户的与健康相关的数据,计算所述每个用户对应的所述多个指标的值,以得到所述每个用户的标注化数据。
在本发明的一些实施例,基于前述方案,还包括:调整单元。其中,获取单元502获取所述高危人群的实际患病情况;调整单元用于根据预测的结果和所述实际患病情况,确定预测的准确性,并根据所述预测的准确性,调整对所述每个用户对应的所述多个指标的值进行计算的策略。
在本发明的一些实施例,基于前述方案,处理单元504还用于:在所述调整单元对所述策略进行调整之后,根据调整后的策略重新对所述多个用户的与健康相关的数据进行标准化处理,并基于重新标准化处理后的数据对所述多个用户重新进行聚类分析。
在本发明的一些实施例,基于前述方案,聚类分析单元配置为:构造N个类,所述N个类中的每个类包含所述空间中的一个点;合并所述N个类中距离最近的两个类,得到合并后的新类,基于得到的新类继续合并距离最近的两个类,直到所述多个用户在所述空间中对应的点合并为一类为止;获取在聚类过程中得到的聚类谱系图,并基于所述聚类谱系图确定将所述多个用户在所述空间中对应的点进行聚类的结果。
在本发明的一些实施例,基于前述方案,还包括:发送单元,用于向指定人员发送针对所述高危人群的预警信息。
在本发明的一些实施例,基于前述方案,还包括:计算单元和设置单元。计算单元用于计算所述目标类中已确诊患者所占的比例;设置单元用于根据所述目标类中已确诊患者所占的比例,设置所述预警信息的级别。
在本发明的一些实施例,基于前述方案,所述与健康相关的数据包括以下任一或多个的组合:生活环境、生活习惯和健康档案数据。
下面参考图6,其示出了适于用来实现本发明实施例的电子设备的计算机系统600的结构示意图。图6示出的电子设备的计算机系统600仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统操作所需的各种程序和数据。CPU601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的疾病预测方法。
例如,所述的电子设备可以实现如图1中所示的:步骤S10,获取多个用户的与健康相关的数据;步骤S12,基于所述多个用户的与健康相关的数据对所述多个用户进行聚类分析,以将所述多个用户划分为至少一个类;步骤S14,确定已确诊患者所在的目标类,并将所述目标类中的其他用户预测为患病的高危人群。
又如所述电子设备可以实现如图2中所示的各个步骤。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (14)

1.一种疾病预测方法,其特征在于,包括:
获取多个用户的与健康相关的数据;
基于所述多个用户的与健康相关的数据对所述多个用户进行聚类分析,以将所述多个用户划分为至少一个类;
确定已确诊患者所在的目标类,并将所述目标类中的其他用户预测为患病的高危人群。
2.根据权利要求1所述的疾病预测方法,其特征在于,获取多个用户的与健康相关的数据,包括:
在预定区域内的人群中出现已确诊的患者后,获取所述预定区域内的所述多个用户的与健康相关的数据。
3.根据权利要求1所述的疾病预测方法,其特征在于,获取多个用户的与健康相关的数据,基于所述多个用户的与健康相关的数据对所述多个用户进行聚类分析,包括:
周期性获取多个用户的与健康相关的数据,并根据最新周期内获取到的数据对所述多个用户重新进行聚类分析。
4.根据权利要求1所述的疾病预测方法,其特征在于,基于所述多个用户的与健康相关的数据对所述多个用户进行聚类分析,包括:
对所述多个用户的与健康相关的数据进行标准化处理,得到每个用户的标准化数据;
将所述每个用户的标准化数据抽象为空间中对应的一个点;
对所述多个用户在所述空间中对应的点进行聚类分析,以对所述多个用户进行聚类分析。
5.根据权利要求4所述的疾病预测方法,其特征在于,对所述多个用户的与健康相关的数据进行标准化处理,得到每个用户的标准化数据,包括:
基于所述多个用户的与健康相关的数据,确定与用户的健康相关的多个指标;
根据每个用户的与健康相关的数据,计算所述每个用户对应的所述多个指标的值,以得到所述每个用户的标准化数据。
6.根据权利要求5所述的疾病预测方法,其特征在于,还包括:
获取所述高危人群的实际患病情况;
根据预测的结果和所述实际患病情况,确定预测的准确性;
根据所述预测的准确性,调整对所述每个用户对应的所述多个指标的值进行计算的策略。
7.根据权利要求6所述的疾病预测方法,其特征在于,还包括:
在对所述策略进行调整之后,根据调整后的策略重新对所述多个用户的与健康相关的数据进行标准化处理,并基于重新标准化处理后的数据对所述多个用户重新进行聚类分析。
8.根据权利要求4所述的疾病预测方法,其特征在于,对所述多个用户在所述空间中对应的点进行聚类分析,包括:
构造N个类,所述N个类中的每个类包含所述空间中的一个点;
合并所述N个类中距离最近的两个类,得到合并后的新类,基于得到的新类继续合并距离最近的两个类,直到所述多个用户在所述空间中对应的点合并为一类为止;
获取在聚类过程中得到的聚类谱系图,并基于所述聚类谱系图确定将所述多个用户在所述空间中对应的点进行聚类的结果。
9.根据权利要求1所述的疾病预测方法,其特征在于,还包括:向指定人员发送针对所述高危人群的预警信息。
10.根据权利要求9所述的疾病预测方法,其特征在于,还包括:
计算所述目标类中已确诊患者所占的比例;
根据所述目标类中已确诊患者所占的比例,设置所述预警信息的级别。
11.根据权利要求1至10中任一项所述的疾病预测方法,其特征在于,所述与健康相关的数据包括以下任一或多个的组合:生活环境、生活习惯和健康档案数据。
12.一种疾病预测装置,其特征在于,包括:
获取单元,用于获取多个用户的与健康相关的数据;
处理单元,用于基于所述多个用户的与健康相关的数据对所述多个用户进行聚类分析,以将所述多个用户划分为至少一个类;
预测单元,用于确定已确诊患者所在的目标类,并将所述目标类中的其他用户预测为患病的高危人群。
13.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至11中任一项所述的疾病预测方法。
14.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至11中任一项所述的疾病预测方法。
CN201710876698.7A 2017-09-25 2017-09-25 疾病预测方法、装置、介质和电子设备 Active CN107658023B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710876698.7A CN107658023B (zh) 2017-09-25 2017-09-25 疾病预测方法、装置、介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710876698.7A CN107658023B (zh) 2017-09-25 2017-09-25 疾病预测方法、装置、介质和电子设备

Publications (2)

Publication Number Publication Date
CN107658023A true CN107658023A (zh) 2018-02-02
CN107658023B CN107658023B (zh) 2021-07-13

Family

ID=61131383

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710876698.7A Active CN107658023B (zh) 2017-09-25 2017-09-25 疾病预测方法、装置、介质和电子设备

Country Status (1)

Country Link
CN (1) CN107658023B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109300515A (zh) * 2018-09-28 2019-02-01 安徽名流健康管理有限公司 基于大数据分析的健康管理系统
CN109360658A (zh) * 2018-11-01 2019-02-19 北京航空航天大学 一种基于词向量模型的疾病模式挖掘方法及装置
CN109360657A (zh) * 2018-09-27 2019-02-19 上海利连信息科技有限公司 一种医院感染数据的样本选取的时间段推理方法
CN109903825A (zh) * 2019-03-08 2019-06-18 上海一健事信息科技有限公司 一种基于人工智能的健康管理系统
CN111063436A (zh) * 2019-11-25 2020-04-24 泰康保险集团股份有限公司 数据处理方法及装置、存储介质及电子终端
CN111128377A (zh) * 2019-11-26 2020-05-08 泰康保险集团股份有限公司 健康管理预警方法、装置、电子设备、存储介质
CN111403038A (zh) * 2020-03-13 2020-07-10 上海洛书医药科技有限公司 基于ai的体质评测及健康管理系统
CN111670476A (zh) * 2018-12-21 2020-09-15 北京哲源科技有限责任公司 患病风险预测方法、电子设备及存储介质
CN111739656A (zh) * 2020-07-17 2020-10-02 医渡云(北京)技术有限公司 基于无症状感染者预测传染病趋势的方法及装置
CN111739658A (zh) * 2020-07-20 2020-10-02 医渡云(北京)技术有限公司 基于输入病例预测传染病趋势的方法及装置
CN112102955A (zh) * 2020-09-07 2020-12-18 武汉科瓴智能科技有限公司 一种基于高斯混合模型的患者疾病预测控制系统与方法
CN113782217A (zh) * 2021-09-16 2021-12-10 工银科技有限公司 人体健康状况分级方法及装置
CN113793667A (zh) * 2021-09-16 2021-12-14 平安科技(深圳)有限公司 基于聚类分析的疾病预测方法、装置及计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915560A (zh) * 2015-06-11 2015-09-16 万达信息股份有限公司 一种基于广义神经网络聚类的疾病病种诊疗方案预测方法
CN106777935A (zh) * 2016-12-05 2017-05-31 广东石油化工学院 一种基于网络结构的疾病动态预测方法
CN107145704A (zh) * 2017-03-27 2017-09-08 西安电子科技大学 一种面向社区的健康医疗监护、评测系统及其方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915560A (zh) * 2015-06-11 2015-09-16 万达信息股份有限公司 一种基于广义神经网络聚类的疾病病种诊疗方案预测方法
CN106777935A (zh) * 2016-12-05 2017-05-31 广东石油化工学院 一种基于网络结构的疾病动态预测方法
CN107145704A (zh) * 2017-03-27 2017-09-08 西安电子科技大学 一种面向社区的健康医疗监护、评测系统及其方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109360657A (zh) * 2018-09-27 2019-02-19 上海利连信息科技有限公司 一种医院感染数据的样本选取的时间段推理方法
CN109360657B (zh) * 2018-09-27 2022-06-03 上海利连信息科技有限公司 一种医院感染数据的样本选取的时间段推理方法
CN109300515A (zh) * 2018-09-28 2019-02-01 安徽名流健康管理有限公司 基于大数据分析的健康管理系统
CN109360658B (zh) * 2018-11-01 2021-06-08 北京航空航天大学 一种基于词向量模型的疾病模式挖掘方法及装置
CN109360658A (zh) * 2018-11-01 2019-02-19 北京航空航天大学 一种基于词向量模型的疾病模式挖掘方法及装置
CN111670476B (zh) * 2018-12-21 2023-04-25 北京哲源科技有限责任公司 患病风险预测方法、电子设备及存储介质
CN111670476A (zh) * 2018-12-21 2020-09-15 北京哲源科技有限责任公司 患病风险预测方法、电子设备及存储介质
CN109903825A (zh) * 2019-03-08 2019-06-18 上海一健事信息科技有限公司 一种基于人工智能的健康管理系统
CN111063436A (zh) * 2019-11-25 2020-04-24 泰康保险集团股份有限公司 数据处理方法及装置、存储介质及电子终端
CN111128377A (zh) * 2019-11-26 2020-05-08 泰康保险集团股份有限公司 健康管理预警方法、装置、电子设备、存储介质
CN111128377B (zh) * 2019-11-26 2023-08-22 泰康保险集团股份有限公司 健康管理预警方法、装置、电子设备、存储介质
CN111403038A (zh) * 2020-03-13 2020-07-10 上海洛书医药科技有限公司 基于ai的体质评测及健康管理系统
CN111739656B (zh) * 2020-07-17 2021-02-09 医渡云(北京)技术有限公司 基于无症状感染者预测传染病趋势的方法及装置
CN111739656A (zh) * 2020-07-17 2020-10-02 医渡云(北京)技术有限公司 基于无症状感染者预测传染病趋势的方法及装置
CN111739658A (zh) * 2020-07-20 2020-10-02 医渡云(北京)技术有限公司 基于输入病例预测传染病趋势的方法及装置
CN112102955A (zh) * 2020-09-07 2020-12-18 武汉科瓴智能科技有限公司 一种基于高斯混合模型的患者疾病预测控制系统与方法
CN112102955B (zh) * 2020-09-07 2024-03-15 武汉科瓴智能科技有限公司 一种基于高斯混合模型的患者疾病预测控制系统与方法
CN113782217A (zh) * 2021-09-16 2021-12-10 工银科技有限公司 人体健康状况分级方法及装置
CN113793667A (zh) * 2021-09-16 2021-12-14 平安科技(深圳)有限公司 基于聚类分析的疾病预测方法、装置及计算机设备

Also Published As

Publication number Publication date
CN107658023B (zh) 2021-07-13

Similar Documents

Publication Publication Date Title
CN107658023A (zh) 疾病预测方法、装置、介质和电子设备
Wollenstein-Betech et al. Personalized predictive models for symptomatic COVID-19 patients using basic preconditions: hospitalizations, mortality, and the need for an ICU or ventilator
US20210142915A1 (en) Clinical predictive analytics system
US10650927B2 (en) Machine learning clinical decision support system for risk categorization
Krishnan et al. A novel GA-ELM model for patient-specific mortality prediction over large-scale lab event data
Talmor et al. Simple triage scoring system predicting death and the need for critical care resources for use during epidemics
CN110051324B (zh) 一种急性呼吸窘迫综合征死亡率预测方法及系统
US20030120133A1 (en) Patient data mining for lung cancer screening
Mohanty et al. Machine learning for predicting readmission risk among the frail: Explainable AI for healthcare
WO2021180244A1 (zh) 一种疾病风险预测系统、方法、装置、设备及介质
US20210174968A1 (en) Visualization of Social Determinants of Health
US20210192365A1 (en) Computer device, system, readable storage medium and medical data analysis method
Tognetti et al. Validation of an integrated dermoscopic scoring method in an European teledermoscopy web platform: the iDScore project for early detection of melanoma
Li et al. BCRAM: A social-network-inspired breast cancer risk assessment model
CN115168669A (zh) 传染病筛查方法、装置、终端设备及介质
CN114783580B (zh) 一种医疗数据质量评估方法及系统
JP2013148996A (ja) 重症度判定装置、及び、重症度判定方法
Elhaj et al. A comparative study of supervised machine learning approaches to predict patient triage outcomes in hospital emergency departments
CN113223734A (zh) 基于算法、医学影像和大数据的疾病诊断和大健康管理平台
Zhang et al. Machine learning in chronic obstructive pulmonary disease
Ieva et al. Network analysis of comorbidity patterns in heart failure patients using administrative data
US11289202B2 (en) Method and system to improve clinical workflow
Manocha et al. Edge intelligence-assisted smart healthcare solution for health pandemic: a federated environment approach
Juan et al. A classifier fusion approach to osteoporosis prediction for women in Taiwan
Chai et al. Edge Computing with Fog-cloud for Heart Data Processing using Particle Swarm Optimized Deep Learning Technique

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant