CN110400613B

CN110400613B - 一种随访患者筛选方法、装置、可读介质及电子设备

Info

Publication number: CN110400613B
Application number: CN201910497393.4A
Authority: CN
Inventors: 郎超; 熊亚辉; 刘水清; 梁玮; 李潇
Original assignee: Nanjing Yiji Cloud Medical Data Research Institute Co ltd
Current assignee: Nanjing Yiji Cloud Medical Data Research Institute Co ltd
Priority date: 2019-06-10
Filing date: 2019-06-10
Publication date: 2023-06-30
Anticipated expiration: 2039-06-10
Also published as: CN110400613A

Abstract

本发明公开了一种随访患者筛选方法、装置、可读介质及电子设备，所述方法包括：建立第一筛选模型和第二筛选模型，则所述方法包括：在第一阶段获取第一集合中n个患者的第一类信息，并利用所述第一筛选模型对所述第一类信息进行筛选；以所述第一筛选模型筛选后得到的m个患者建立第二集合；在第二阶段获取所述第二集合中m个患者的第二类信息，并利用所述第二筛选模型对所述第一类信息和所述第二类信息进行筛选；以所述第二筛选模型筛选后得到的k个患者建立随访集合；其中n、m、k均为正整数，且n≥m≥k。

Description

一种随访患者筛选方法、装置、可读介质及电子设备

技术领域

本发明涉及计算机技术领域，尤其涉及一种随访患者筛选方法、装置、可读介质及电子设备。

背景技术

随访，即跟踪了解患者在经过医疗之后一段时间内的健康状况，获取各种相关数据的过程。无论是对于患者的治疗，还是对于医学研究，随访都具有着非常重大的价值。一般的医疗结构都会选择长期对各类患者进行随访。

不过，并非每位患者都有随访的必要性。而且随访过程会占用患者的个人时间，对大量随访资料进行分析也需要占用医生宝贵的精力。所以理想的随访过程，是尽量减少对于患者的打扰，同时让医生尽可能高效的获得有价值的资料和数据。这就需要医疗机构对患者进行有效的筛选，从众多患者当中找到其中“典型性”的患者进行后续随访。

传统的随访往往是由医生或者随访人员通过经验判断，来筛选有必要对哪些患者进行随访。传统方式的缺陷在于，通过经验判断存在一定的主观性，准确率有待提高；而且人工筛选同样是一个耗费时间和人力的过程，效率较低，能够筛选的样本数量也非常有限。

发明内容

本发明提供一种随访患者筛选方法、装置、可读介质及电子设备，基人工智能技术，预先建立两个筛选模型，即第一筛选模型和第二筛选模型。上述两个模型，能够在两个不同的阶段，依据不同维度的信息对大量的患者进行筛选，从而得出具有随访价值的部分患者，提高了随访的针对性，也避免了对于不需随访的患者产生打扰。

第一方面，本发明提供了一种随访患者筛选方法，其特征在于，建立第一筛选模型和第二筛选模型，则所述方法包括：

在第一阶段获取第一集合中n个患者的第一类信息，并利用所述第一筛选模型对所述第一类信息进行筛选；

以所述第一筛选模型筛选后得到的m个患者建立第二集合；

在第二阶段获取所述第二集合中m个患者的第二类信息，并利用所述第二筛选模型对所述第一类信息和所述第二类信息进行筛选；

以所述第二筛选模型筛选后得到的k个患者建立随访集合；

其中n、m、k均为正整数，且n≥m≥k。

优选地，所述建立第一筛选模型包括：

利用第一目标数据和第一非目标数据作为训练样本进行监督学习训练，以获得所述第一目标数据的数值与数据特征的第一函数关系，通过所述第一函数关系建立所述第一筛选模型。

优选地，所述建立第一筛选模型还包括：

将第一目标数据或第一非目标数据代入所述第一筛选模型，以获得所述第一筛选模型的第一拟合度；当所述第一拟合度低于预设的第一拟合度标准，则通过所述监督学习训练修正所述第一函数关系。

优选地，所述建立第一筛选模型包括：

利用第一目标数据和未知特征数据作为训练样本进行半监督学习训练，以获得所述第一目标数据的相似特征函数，通过所述相似特征函数建立所述第一筛选模型。

优选地，所述建立第二筛选模型包括：

利用第二目标数据和第二非目标数据作为训练样本进行监督学习训练，以获得所述第二目标数据的数值与数据特征的第二函数关系，通过所述第二函数关系建立所述第二筛选模型。

优选地，所述建立第二筛选模型还包括：

将第二目标数据或第二非目标数据代入所述第二筛选模型，以获得所述第二筛选模型的第二拟合度；当所述第二拟合度低于预设的第二拟合度标准，则通过所述监督学习训练修正所述第二函数关系。

优选地，包括：所述第一阶段为，患者的临床治疗阶段；所述第二阶段为，患者的康复阶段。

第二方面，本发明提供了一种随访患者筛选装置，包括：

建模模块，用于建立第一筛选模型和第二筛选模型；

信息获取模块，用于在第一阶段获取第一集合中n个患者的第一类信息，并在在第二阶段获取第二集合中m个患者的第二类信息；

筛选模块，用于利用所述第一筛选模型对所述第一类信息进行筛选；并利用所述第二筛选模型对所述第一类信息和所述第二类信息进行筛选；

集合模块，用于以所述第一筛选模型筛选后得到的m个患者建立所述第二集合；以所述第二筛选模型筛选后得到的k个患者建立随访集合；

其中n、m、k均为正整数，且n≥m≥k。

优选地，所述建模模块包括：

第一建模单元，用于利用第一目标数据和第一非目标数据作为训练样本进行监督学习训练，以获得所述第一目标数据的数值与数据特征的第一函数关系，通过所述第一函数关系建立所述第一筛选模型；

第二建模单元，用于利用第二目标数据和第二非目标数据作为训练样本进行监督学习训练，以获得所述第二目标数据的数值与数据特征的第二函数关系，通过所述第二函数关系建立所述第二筛选模型。

第三方面，本发明提供了一种可读介质，包括执行指令，当电子设备的处理器执行所述执行指令时，所述电子设备执行如第一方面中任一所述的方法。

第四方面，本发明提供了一种电子设备，包括处理器以及存储有执行指令的存储器，当所述处理器执行所述存储器存储的所述执行指令时，所述处理器执行如第一方面中任一所述的方法。

本发明提供了一种随访患者筛选方法、装置、可读介质及电子设备，通过两层筛选，尽可能的提高了随访的针对性，为准确高效的获得随访信息提供了前提条件，并且减少了随访人员和医务工作者的人工成本。同时，在筛选过程中，不需随访的患者可以及早被筛除，不再参与后续步骤，避免了继续打扰不需随访的部分患者。利用监督学习训练建立第一筛选模型和第二筛选模型，并且进一步对于第一筛选模型和第二筛选模型进行校验和修正步骤。由此保障了所述第一筛选模型和第二筛选模型的精度，提高了数据筛选的准确率。利用半监督学习训练建立第一筛选模型，在保证满足需求的情况下，节约了建模的计算量。

上述的非惯用的优选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

为了更清楚地说明本发明实施例或现有的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的一种随访患者筛选方法的流程示意图；

图2为本发明一实施例提供的在所述一种随访患者筛选方法中建立所述第一筛选模型的流程示意图；

图3为本发明一实施例提供的在所述一种随访患者筛选方法中另一种建立所述第一筛选模型的流程示意图；

图4为本发明一实施例提供的在所述一种随访患者筛选方法中建立所述第二筛选模型的流程示意图

图5为本发明一实施例提供的又一种随访患者筛选装置的结构示意图；

图6为本发明一实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合具体实施例及相应的附图对本发明的技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

前述已知，理想的随访过程是尽量减少对于患者的打扰，同时让医生尽可能高效的获得有价值的资料和数据。所以本发明中将基于人工智能技术建模，以实现对于患者的精确筛选，提高了随访的针对性。并且通过多次筛选和分批的信息获取，减少了对于患者的打扰。由此提高了随访的效率，减少了虽然过程中对于人力成本的消耗。

参照图1所示，为本发明所述随访患者筛选方法的一个具体实施例。本实施例中，需要基于人工智能技术，预先建立两个筛选模型，即第一筛选模型和第二筛选模型。上述两个模型，能够在两个不同的阶段，依据不同维度的信息对大量的患者进行筛选，从而得出具有随访价值的部分患者，提高了随访的针对性，也避免了对于不需随访的患者产生打扰。本实施例中所述方法包括以下步骤：

步骤101、获取第一集合中n个患者的第一类信息，并利用所述第一筛选模型对所述第一类信息进行筛选。

本步骤一般发生在患者的临床治疗期间。即是说，第一类信息的获取将在患者就医治疗期间完成。这意味着，第一类信息的获取可以针对几乎所有患者，能够使得所述第一集合的样本数量尽可能更多，更完整。可以认为第一集合中包括的n个患者，就是该医疗结构所面对的全部患者。并且，在患者就医期间获取第一类信息，将不会对患者后续的生活产生干扰。

基于上述，所述第一类信息，往往是在患者就医期间能够获取到的部分信息。例如年龄、身高、体重、腰围、臀围、收缩压、舒张压、心率、血糖、血氧、睡眠质量和饮食习惯等。利用所述第一筛选模型，将根据所述第一类信息对患者进行筛选。排除其中不具有随访必要性的部分患者，保留可能具有随访必要性的部分患者。

步骤102、以所述第一筛选模型筛选后得到的m个患者建立第二集合。

在前述的步骤中，所述第一筛选模型能够在第一集合的n个患者中筛选出m个可能具有随访必要性的患者。以此m个患者建立第二集合，以参与后续步骤。其余患者将不再需要参与后续步骤。这样即提高了随访的针对性，也避免了继续打扰不需随访的部分患者。

步骤103、获取所述第二集合中m个患者的第二类信息，并利用所述第二筛选模型对所述第一类信息和所述第二类信息进行筛选。

本步骤一般发生在完成临床治疗之后的特定时间段。在另一些情况下也可发生在临床治疗期间。所述第二类信息的获取，通常在时间跨度上更长，所以可以进一步的跟踪患者的各项临床指标的变化情况，以获取很多在步骤101中无法获取的具体信息，更便于了解患者的身体状态。

所述第二集合中的m个患者将需要提供相应的第二类信息。所述第二类信息的具体内容，可以结合实际需求进行设定，本步骤中不做限定。以糖尿病患者为例，患者将需要提供长期的血糖数据。然后本实施例中，将利用所述第二筛选模型对所述第一类信息和所述第二类信息进行进一步的筛选，用以判断所述第二集合中哪些患者具有更大的随访必要性。通过对所述第一类信息和所述第二类信息合并进行筛选，能够使筛选的信息容量和维度尽可能丰富，保证筛选结果的准确性。

可以理解的是，所述第一类信息在第一阶段取得，时间范围比较固定，信息量较为有限。因此，第一筛选模型的筛选粒度比较粗糙，仅以第一信息进行筛选，往往不足以找到最具有随访必要性的部分患者。本步骤中，进一步利用筛选粒度更加精细的第二筛选模型，再结合信息量更为丰富的第二类信息进行筛选，从而找到最具随访必要性的部分患者参与后续的随访过程。其余患者将不再需要参与随访。由此能够进一步的提高随访的针对性，以便于获取更有效的随访信息。也避免了继续打扰不需随访的部分患者。

步骤104、以所述第二筛选模型筛选后得到的k个患者建立随访集合。

本实施例在经过第一筛选模型和第二筛选模型的两层筛选之后，最终可得到k个患者。即认为该k个患者就是具有随访必要性的部分患者。所以以此k个患者建立随访集合。后续随访人员即可针对随访集合中的患者进行人工随访，取得随访信息。

需要说明的是，本实施例中n、m、k均为正整数，且n≥m≥k。

因此通过以上技术方案可知，本实施例存在的有益效果是，通过两层筛选，尽可能的提高了随访的针对性，为准确高效的获得随访信息提供了前提条件，并且减少了随访人员和医务工作者的人工成本。同时，在筛选过程中，不需随访的患者可以及早被筛除，不再参与后续步骤，避免了继续打扰不需随访的部分患者。

图1所示仅为本发明所述方法的基础实施例，在其基础上进行一定的优化和拓展，还能够得到所述方法的其他优选实施例。

如图2所示，为本发明所述随访患者筛选方法的另一个具体实施例。本实施例在前述实施例的基础上，对于所述第一筛选模型的建模过程进行了更具体的描述和一定程度的优化。为了便于解释和说明，本实施例将结合“筛选出有随访必要性的糖尿病人”这一具体场景进行阐述。当然应该认为，在其他有关的场景下，本实施例所述方法亦同样适用。

本实施例中，所述第一筛选模型的建模过程包括以下步骤：

步骤201、利用第一目标数据和第一非目标数据作为训练样本进行监督学习训练，以获得所述第一目标数据的数值与数据特征的第一函数关系。

步骤202、通过所述第一函数关系建立所述第一筛选模型。

步骤203、将第一目标数据或第一非目标数据代入所述第一筛选模型，以获得所述第一筛选模型的第一拟合度。

步骤204、当所述第一拟合度低于预设的第一拟合度标准，则通过所述监督学习训练修正所述第一函数关系。

所述第一目标数据和第一非目标数据，为已知数据特征的临床数据。其来源可以是医疗结构的历史临床数据，优选的，所述第一目标数据和第一非目标数据的数据数量总和可以为1000～2000组。本步骤中建模的目的在于筛选出特定目标(即筛选出具有特定数据特征的数据)，而所述第一目标数据即具备所述特定数据特征的临床数据，第一非目标数据则反之为不具备所述特定数据特征的临床数据。

结合本实施例的应用场景，所述特定目标为“需随访的糖尿病人”。则第一目标数据的数据特征即“需随访的糖尿病人”，意味着所述已知目标数据为来自于具有随访必要性的糖尿病人的临床数据。而第一非目标数据的数据特征即“不需随访的糖尿病人”。

本实施例中，第一筛选模型的建模基于监督学习训练。所述监督学习训练，即通过人工智能计算来发现数据数值和已知的数据特征之间，存在怎样的关联性。在本实施例的场景下，也就是通过需随访的糖尿病人的临床数据(第一目标数据)和不需随访的糖尿病人的临床数据(第一非目标数据)来分析发现，临床数据的数值呈何种状态即意味着数据特征为“需随访的糖尿病人”。

假设第一数据集合中一份数据表示为(x₁,y₁)。其中x₁表示数据的数值，具体可以用x₁＝(x₁₁,x₁₂…x_1p)来表达x₁₁～x_1p共p项临床指标各自的数值。y₁表示数据特征，在本实施例中可认为当y₁＝1即数据特征为“需随访的糖尿病人”，y₁＝0即数据特征为“不需随访的糖尿病人”。

经过所述监督学习训练，可获得第一目标数据的数值与数据特征的函数关系y₁＝f₁(x₁)。即获得所述第一筛选模型。对于未知数据特征的临床数据，只需将其数值作为x₁代入模型，即可得到数据特征y₁。

监督学习训练的具体过程，以及相应的函数关系y₁＝f₁(x₁)的表达式，在本实施例中不做限定。现有技术中所有可实现的人工智能训练算法均可结合在本实施例的整体技术方案之下。并且根据具体应用场景和需求，建模的数学运算过程也可进行适当的调整。

为确保所述第一筛选模型能够精确的完成筛选，本实施例中在通过一定程度的训练获得上述函数关系后，还需对其进行校验及修正。

校验方式为，将第一目标数据或第一非目标数据代入，判断所述第一筛选模型计算获得的数据特征与预先已知的数据特征是否相符合。例如，代入一组“需随访的糖尿病人”的临床数据数值，看所述目标筛选模型计算的结果是否同样显示其数据特征为“需随访的糖尿病人”。

利用大量第一目标数据和第一非目标数据代入所述目标筛选模型进行校验，即可根据所述第一筛选模型输出的准确率来统计其第一拟合度。原则上第一拟合度越高说明所述第一筛选模型越准确。但如果所述第一筛选模型的第一拟合度低于预设的第一拟合度标准，则说明其准确程度尚不符合要求。所以需要对其继续进行监督学习训练，修正所述函数关系，直到第一拟合度符合要求。

通过以上技术方案可知，本实施例所述方法在图1所示实施例的基础上，进一步实现的有益效果是：本实施例中详细公开了利用监督学习训练方法建立第一筛选模型的过程，并且进一步包括了对于第一筛选模型的校验和修正步骤。由此保障了所述第一筛选模型的精度，提高了数据筛选的准确率。

如图3所示，为本发明所述随访患者筛选方法的另一个具体实施例。本实施例在前述实施例的基础上，对于所述第一筛选模型的建模过程进行了更具体的描述和一定程度的优化。为了便于解释和说明，本实施例将结合“筛选出有随访必要性的糖尿病人”这一具体场景进行阐述。当然应该认为，在其他有关的场景下，本实施例所述方法亦同样适用。

需要说明的是，不同于图2所示实施例，本实施例中将以半监督学习训练的方式建立所述第一筛选模型。本实施例中，所述第一筛选模型的建模过程包括以下步骤：

步骤301、利用第一目标数据和未知特征数据作为训练样本进行半监督学习训练，以获得所述第一目标数据的相似特征函数。

步骤302、通过所述相似特征函数建立所述第一筛选模型。

本实施例中，所述第一目标数据的概念及内容与图2所示实施例一致，在此不做赘述。进而，本实施例中还将引入部分未知特征数据共同作为训练样本。所述未知特征数据，即不知道其数据特征的临床数据。也就是说，不确定所述未知特征数据来自于“需随访的糖尿病人”还是“不需随访的糖尿病人”。

利用部分已知数据特征的数据，和部分未知数据特征的数据，共同训练建模，即称之为半监督学习训练。半监督学习训练的原理，在于分析所述未知特征数据中，哪些是与所述第一目标数据存在相似性的数据。由此分析认为，与所述第一目标数据存在相似性的部分数据，其数据特征与所述第一目标数据相同，即认为其来自于“需随访的糖尿病人”。

进而可以获得所述第一目标数据的相似特征函数。通过所述相似特征函数建立所述第一筛选模型。对于未知数据特征的临床数据，只需将其数值代入第一筛选模型，即可得到数据特征。

一般来说，半监督学习训练建模的精确度要低于图2所示实施例所描述的监督学习训练建模。但是半监督学习训练的训练建模过程相对简单，更节约计算量。既然所述第一筛选模型的功能主要在于粗粒度筛选，所以一定程度上，利用半监督学习方法建模同样可以满足需求。

如图4所示，为本发明所述随访患者筛选方法的另一个具体实施例。本实施例在前述实施例的基础上，对于所述第二筛选模型的建模过程进行了更具体的描述和一定程度的优化。为了便于解释和说明，本实施例将结合“筛选出有随访必要性的糖尿病人”这一具体场景进行阐述。当然应该认为，在其他有关的场景下，本实施例所述方法亦同样适用。

实际上，本实施例所述的用监督学习训练建立第二筛选模型的过程，与图2所示实施例所述的建立第一筛选模型的过程原理一致。但是所涉及的数据的具体内容和来源不相同。

本实施例中，所述第二筛选模型的建模过程包括以下步骤：

步骤401、利用第二目标数据和第二非目标数据作为训练样本进行监督学习训练，以获得所述第二目标数据的数值与数据特征的第二函数关系。

步骤402、通过所述第二函数关系建立所述第二筛选模型。

步骤403、将第二目标数据或第二非目标数据代入所述第二筛选模型，以获得所述第二筛选模型的第二拟合度。

步骤404、当所述第二拟合度低于预设的第二拟合度标准，则通过所述监督学习训练修正所述第二函数关系。

所述第二目标数据和第二非目标数据，为已知数据特征的临床数据。其来源可以是医疗结构的历史临床数据，优选的，所述第二目标数据和第二非目标数据的数据数量总和可以为1000～2000组。本步骤中建模的目的在于筛选出特定目标(即筛选出具有特定数据特征的数据)，而所述第二目标数据即具备所述特定数据特征的临床数据，第二非目标数据则反之为不具备所述特定数据特征的临床数据。

结合本实施例的应用场景，所述特定目标为“需随访的糖尿病人”。则第二目标数据的数据特征即“需随访的糖尿病人”，意味着所述已知目标数据为来自于具有随访必要性的糖尿病人的临床数据。而第二非目标数据的数据特征即“不需随访的糖尿病人”。

本实施例中，第二筛选模型的建模基于监督学习训练。所述监督学习训练，即通过人工智能计算来发现数据数值和已知的数据特征之间，存在怎样的关联性。在本实施例的场景下，也就是通过需随访的糖尿病人的临床数据(第二目标数据)和不需随访的糖尿病人的临床数据(第二非目标数据)来分析发现，临床数据的数值呈何种状态即意味着数据特征为“需随访的糖尿病人”。

假设第二数据集合中一份数据表示为(x₂,y₂)。其中x₂表示数据的数值，具体可以用x₂＝(x₂₁,x₂₂…x_2p)来表达x₁₁～x_1q共q项临床指标各自的数值。y₂表示数据特征，在本实施例中可认为当y₂＝1即数据特征为“需随访的糖尿病人”，y₂＝0即数据特征为“不需随访的糖尿病人”。

经过所述监督学习训练，可获得第二目标数据的数值与数据特征的函数关系y₂＝f₂(x₂)。即获得所述第二筛选模型。对于未知数据特征的临床数据，只需将其数值作为x₂代入模型，即可得到数据特征y₂。

监督学习训练的具体过程，以及相应的函数关系y₂＝f₂(x₂)的表达式，在本实施例中不做限定。现有技术中所有可实现的人工智能训练算法均可结合在本实施例的整体技术方案之下。并且根据具体应用场景和需求，建模的数学运算过程也可进行适当的调整。

为确保所述第二筛选模型能够精确的完成筛选，本实施例中在通过一定程度的训练获得上述函数关系后，还需对其进行校验及修正。

校验方式为，将第二目标数据或第二非目标数据代入，判断所述第二筛选模型计算获得的数据特征与预先已知的数据特征是否相符合。例如，代入一组“需随访的糖尿病人”的临床数据数值，看所述目标筛选模型计算的结果是否同样显示其数据特征为“需随访的糖尿病人”。

利用大量第二目标数据和第二非目标数据代入所述目标筛选模型进行校验，即可根据所述第二筛选模型输出的准确率来统计其第二拟合度。原则上第二拟合度越高说明所述第二筛选模型越准确。但如果所述第二筛选模型的第二拟合度低于预设的第二拟合度标准，则说明其准确程度尚不符合要求。所以需要对其继续进行监督学习训练，修正所述函数关系，直到第二拟合度符合要求。

通过以上技术方案可知，本实施例所述方法在图1所示实施例的基础上，进一步实现的有益效果是：本实施例中详细公开了利用监督学习训练方法建立第二筛选模型的过程，并且进一步包括了对于第二筛选模型的校验和修正步骤。由此保障了所述第二筛选模型的精度，提高了数据筛选的准确率

如图5所示，为本发明所述随访患者筛选装置的一个具体实施例。本实施例所述装置，即用于执行图1～4所述方法的实体装置。其技术方案本质上与上述实施例一致，上述实施例中的相应描述同样适用于本实施例中。本实施例中所述装置包括：

建模模块501，用于建立第一筛选模型和第二筛选模型。

所述建模模块包括：

第一建模单元511，用于利用第一目标数据和第一非目标数据作为训练样本进行监督学习训练，以获得所述第一目标数据的数值与数据特征的第一函数关系，通过所述第一函数关系建立所述第一筛选模型。

第二建模单元512，用于利用第二目标数据和第二非目标数据作为训练样本进行监督学习训练，以获得所述第二目标数据的数值与数据特征的第二函数关系，通过所述第二函数关系建立所述第二筛选模型。

信息获取模块502，用于获取第一集合中n个患者的第一类信息，并获取第二集合中m个患者的第二类信息。

筛选模块503，用于利用所述第一筛选模型对所述第一类信息进行筛选；并利用所述第二筛选模型对所述第一类信息和所述第二类信息进行筛选。

集合模块504，用于以所述第一筛选模型筛选后得到的m个患者建立所述第二集合；以所述第二筛选模型筛选后得到的k个患者建立随访集合。

其中n、m、k均为正整数，且n≥m≥k。

通过以上技术方案可知，本实施例存在的有益效果是：通过两层筛选，尽可能的提高了随访的针对性，为准确高效的获得随访信息提供了前提条件，并且减少了随访人员和医务工作者的人工成本。同时，在筛选过程中，不需随访的患者可以及早被筛除，不再参与后续步骤，避免了继续打扰不需随访的部分患者。利用监督学习训练建立第一筛选模型和第二筛选模型，并且进一步对于第一筛选模型和第二筛选模型进行校验和修正步骤。由此保障了所述第一筛选模型和第二筛选模型的精度，提高了数据筛选的准确率。利用半监督学习训练建立第一筛选模型，在保证满足需求的情况下，节约了建模的计算量。

图6是本发明实施例提供的一种电子设备的结构示意图。在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(Industry StandardArchitecture，工业标准体系结构)总线、PCI(Peripheral ComponentInterconnect，外设部件互连标准)总线或EISA(Extended IndustryStandardArchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图6中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存放执行指令。具体地，执行指令即可被执行的计算机程序。存储器可以包括内存和非易失性存储器，并向处理器提供执行指令和数据。

在一种可能实现的方式中，处理器从非易失性存储器中读取对应的执行指令到内存中然后运行，也可从其它设备上获取相应的执行指令，以在逻辑层面上形成随访患者筛选装置。处理器执行存储器所存放的执行指令，以通过执行的执行指令实现本发明任一实施例中提供的随访患者筛选方法。

上述如本发明图6所示实施例提供的随访患者筛选装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable GateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

本发明实施例还提出了一种可读介质，该可读存储介质存储有执行指令，存储的执行指令被电子设备的处理器执行时，能够使该电子设备执行本发明任一实施例中提供的随访患者筛选方法，并具体用于执行如图1～图4所示的方法。

前述各个实施例中所述的电子设备可以为计算机。

本领域内的技术人员应明白，本发明的实施例可提供为方法或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例，或软件和硬件相结合的形式。

本发明中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上所述仅为本发明的实施例而已，并不用于限制本发明。对于本领域技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的权利要求范围之内。

Claims

1.一种随访患者筛选方法，其特征在于，建立第一筛选模型和第二筛选模型，则所述方法包括：

获取第一集合中n个患者的第一类信息，并利用所述第一筛选模型对所述第一类信息进行筛选，所述第一类信息为所有患者就医期间均能够获取到的信息，所述第一筛选模型通过监督学习或半监督学习得到；

以所述第一筛选模型筛选后得到的m个患者建立第二集合；

获取所述第二集合中m个患者的第二类信息，并利用所述第二筛选模型对所述第一类信息和所述第二类信息进行筛选，所述第二类信息为临床治疗后患者的临床指标的变化信息，所述第二类信息包括患者就医期间不能够获取到的信息，所述第二筛选模型通过监督学习得到；

以所述第二筛选模型筛选后得到的k个患者建立随访集合；

其中n、m、k均为正整数，且n≥m≥k。

2.根据权利要求1所述方法，其特征在于，所述建立第一筛选模型包括：

3.根据权利要求2所述方法，其特征在于，所述建立第一筛选模型还包括：

将第一目标数据或第一非目标数据代入所述第一筛选模型，以获得所述第一筛选模型的第一拟合度；

当所述第一拟合度低于预设的第一拟合度标准，则通过所述监督学习训练修正所述第一函数关系。

4.根据权利要求1所述方法，其特征在于，所述建立第一筛选模型包括：

5.根据权利要求1所述方法，其特征在于，所述建立第二筛选模型包括：

6.根据权利要求5所述方法，其特征在于，所述建立第二筛选模型还包括：

将第二目标数据或第二非目标数据代入所述第二筛选模型，以获得所述第二筛选模型的第二拟合度；

当所述第二拟合度低于预设的第二拟合度标准，则通过所述监督学习训练修正所述第二函数关系。

7.一种随访患者筛选装置，其特征在于，包括：

建模模块，用于建立第一筛选模型和第二筛选模型；

信息获取模块，用于获取第一集合中n个患者的第一类信息，所述第一类信息为所有患者就医期间均能够获取到的信息；并获取第二集合中m个患者的第二类信息，所述第二类信息为临床治疗后患者的临床指标的变化信息，所述第二类信息包括患者就医期间不能够获取到的信息；

筛选模块，用于利用所述第一筛选模型对所述第一类信息进行筛选，所述第一筛选模型通过监督学习或半监督学习得到；并利用所述第二筛选模型对所述第一类信息和所述第二类信息进行筛选，所述第二筛选模型通过监督学习得到；

其中n、m、k均为正整数，且n≥m≥k。

8.根据权利要求7所述装置，其特征在于，所述建模模块包括：

第一建模单元，用于利用第一目标数据和第一非目标数据作为训练样本进行监督学习训练，以获得所述第一目标数据的数值与数据特征的第一函数关系，通过所述第一函数关系建立所述第一筛选模型；或者，利用第一目标数据和未知特征数据作为训练样本进行半监督学习训练，以获得所述第一目标数据的相似特征函数，通过所述相似特征函数建立所述第一筛选模型；

9.一种可读介质，包括执行指令，当电子设备的处理器执行所述执行指令时，所述电子设备执行如权利要求1至6中任一所述的方法。

10.一种电子设备，包括处理器以及存储有执行指令的存储器，当所述处理器执行所述存储器存储的所述执行指令时，所述处理器执行如权利要求1至6中任一所述的方法。