CN113990422A

CN113990422A - 一种随访数据的采集方法和装置

Info

Publication number: CN113990422A
Application number: CN202111227248.8A
Authority: CN
Inventors: 闫静静; 王雪莲
Original assignee: Taikang Insurance Group Co Ltd; Taikang Pension Insurance Co Ltd
Current assignee: Taikang Insurance Group Co Ltd; Taikang Pension Insurance Co Ltd
Priority date: 2021-10-21
Filing date: 2021-10-21
Publication date: 2022-01-28

Abstract

本发明公开了一种随访数据的采集方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：在对患者进行本次随访时或者之前，从历史随访数据中获取患者在上一次随访结束时所生成的第一历史症状集和第一新增症状集；为第一历史症状集的历史症状生成本次随访所需提问的第一随访问题，并发送至患者终端；接收患者终端返回的第一答案信息，并输入至训练好的症状判断模型，以确定在本次随访时患者存在的历史症状和新增症状；将确定的历史症状和一部分新增症状记录到本次随访对应的第二历史症状集，将另一部分新增症状记录到本次随访对应的第二新增症状集。该方法能够自动采集本次随访所需的随访数据，降低随访工作量，提高医护人员的工作效率。

Description

一种随访数据的采集方法和装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种随访数据的采集方法和装置。

背景技术

在疾病管理过程中，随访是一项重要工作。在随访过程中，医疗机构的医护人员会通过面对面或者电话方式，对患者的生活史、家族史、过敏史，体格和生化检查，疾病的特定指标(比如疾病类型、糖尿病特定指标血糖、乳腺癌特定指标癌抗原15-3等)，手术信息，症状、临床并发症、靶器官损害等相关数据进行采集，进而依据在本次随访时采集到的数据，对患者的进一步治疗进行指导建议。

由于现有技术是由医护人员人工采集随访数据，而一些患者需要频繁进行随访，且需要采集的医疗指标较多，导致医护人员的随访工作量大，随访时间长，造成医护资源的浪费，患者体验差；同时在一次随访中，医护人员很难发现多个随访时间采集的随访数据之间的趋势或者联系，导致后续对患者的指导建议不够准确。

发明内容

有鉴于此，本发明实施例提供一种随访数据的采集方法和装置，该方法基于上次随访所生成的随访数据，利用智能问答方式和症状判断模型，判断患者是否仍旧存在历史症状，以及是否存在新增症状，并根据判断结果进行记录，能够自动采集本次随访所需的随访数据，降低随访的工作量，提高医护人员的工作效率。

为实现上述目的，根据本发明实施例的一个方面，提供了一种随访数据的采集方法。

本发明实施例的一种随访数据的采集方法，包括：在对患者进行本次随访时或者之前，从历史随访数据中获取所述患者在上一次随访结束时所生成的第一历史症状集和第一新增症状集；根据预配置的问题模板，为所述第一历史症状集的历史症状生成本次随访所需提问的第一随访问题，将所述第一随访问题发送至相应的患者终端；接收所述患者终端返回的与所述第一随访问题对应的第一答案信息，将所述第一答案信息输入至训练好的症状判断模型，以确定在本次随访时所述患者存在的历史症状和新增症状；将确定出的历史症状以及存在于所述第一新增症状集的新增症状记录到本次随访对应的第二历史症状集，将不存在于所述第一新增症状集的新增症状记录到本次随访对应的第二新增症状集。

可选地，所述症状判断模型包括第一判断模型和第二判断模型，所述第一判断模型用于判断所述第一答案信息中是否包含设定的潜在症状，所述第二判断模型用于判断所述患者是否存在目标症状，所述目标症状包括所述潜在症状；将所述第一答案信息输入至训练好的症状判断模型，以确定在本次随访时所述患者存在的新增症状，包括：将所述第一答案信息输入至所述第一判断模型，以使用所述第一判断模型判断所述第一答案信息中是否包含设定的潜在症状；在所述第一答案信息中包含所述潜在症状的情况下，根据所述问题模板，为所述潜在症状生成本次随访所需提问的第二随访问题，将所述第二随访问题发送至所述患者终端；接收所述患者终端返回的与所述第二随访问题对应的第二答案信息，将所述第二答案信息输入至所述第二判断模型，以使用所述第二判断模型判断所述患者是否存在所述潜在症状，在所述患者存在所述潜在症状的情况下，将所述潜在症状作为新增症状。

可选地，所述目标症状还包括所述第一历史症状集的历史症状；所述将所述第一答案信息输入至训练好的症状判断模型，以确定在本次随访时所述患者存在的历史症状，包括：将所述第一答案信息输入至所述第二判断模型，以使用所述第二判断模型判断所述患者是否存在所述第一历史症状集的历史症状。

可选地，所述目标症状还包括所述第一新增症状集的新增症状；所述方法还包括：在所述患者不存在所述潜在症状的情况下，执行检测所述第一新增症状集的新增症状是否询问结束的步骤，所述步骤包括：计算所述第一新增症状集和所述第二新增症状集的差集，得到剩余症状集；根据所述问题模板，为所述剩余症状集的剩余症状生成本次随访所需提问的第三随访问题，将所述第三随访问题发送至所述患者终端；接收所述患者终端返回的与所述第三随访问题对应的第三答案信息，将所述第三答案信息输入至所述第二判断模型，以使用所述第二判断模型判断所述患者是否存在所述剩余症状，将确定出的剩余症状记录到所述第二历史症状集。

可选地，在使用所述第二判断模型判断所述患者是否存在所述目标症状之后，所述方法还包括以下重复执行的步骤：自增所述第一判断模型的执行次数，判断所述执行次数是否小于等于设定的执行次数阈值；如果所述执行次数大于所述执行次数阈值，则执行检测所述第一新增症状集的新增症状是否询问结束的步骤；如果所述执行次数小于等于所述执行次数阈值，则执行检测本轮问答得到的答案信息中是否包含所述潜在症状的步骤。

可选地，所述症状判断模型的训练过程包括：将训练集的训练样本输入至BERT模型中，生成所述训练样本中对话文本的第一语义表示；其中，所述训练样本包括所述对话文本和相应的对话者角色，所述对话文本包括所述历史症状；将预定义的参考样本输入至所述BERT模型中，生成所述参考样本中参考文本的第二语义表示；其中，所述参考样本包括所述参考文本和相应的对话者角色，所述参考文本包括参考症状；根据所述第一语义表示，计算所述历史症状的权重，并汇总得到相应的第三语义表示，将所述第二语义表示和所述第三语义表示进行融合，得到融合语义表示；将所述融合语义表示和所述第一语义表示输入至文本建模模型进行处理，将所述文本建模模型的输出结果通过多层感知机进行分类，得到分类结果；根据所述分类结果，计算设定的损失函数的值，最小化所述损失函数，完成对所述症状判断模型的训练。

可选地，所述第一历史症状集和所述第二历史症状集均包括第一类症状集和第二类症状集；其中，所述第一类症状集记录前M次随访均出现过的症状，M为大于等于2的整数；所述第二类症状集记录上次随访新增的症状；所述历史随访数据包括症状类数据和非症状类数据，所述症状类数据包括所述第一历史症状集和所述第一新增症状集，所述非症状类数据包括设备检测数据和非设备检测数据；所述方法还包括：获取为所述非设备检测数据设置的医疗指标，根据所述问题模板，为所述医疗指标生成本次随访所需提问的第四随访问题，将所述第四随访问题发送至所述患者终端；接收所述患者终端返回的与所述第四随访问题对应的第四答案信息，根据所述第四答案信息，确定本次随访对应的非设备检测数据；获取所述患者最近一次的设备检测数据，在获取成功的情况下，将所述最近一次的设备检测数据作为本次随访对应的设备检测数据。

为实现上述目的，根据本发明实施例的另一方面，提供了一种随访数据的采集装置。

本发明实施例的一种随访数据的采集装置，包括：数据获取模块，用于在对患者进行本次随访时或者之前，从历史随访数据中获取所述患者在上一次随访结束时所生成的第一历史症状集和第一新增症状集；问题生成模块，用于根据预配置的问题模板，为所述第一历史症状集的历史症状生成本次随访所需提问的第一随访问题，将所述第一随访问题发送至相应的患者终端；症状判断模块，用于接收所述患者终端返回的与所述第一随访问题对应的第一答案信息，将所述第一答案信息输入至训练好的症状判断模型，以确定在本次随访时所述患者存在的历史症状和新增症状；症状记录模块，用于将确定出的历史症状以及存在于所述第一新增症状集的新增症状记录到本次随访对应的第二历史症状集，将不存在于所述第一新增症状集的新增症状记录到本次随访对应的第二新增症状集。

可选地，所述症状判断模型包括第一判断模型和第二判断模型，所述第一判断模型用于判断所述第一答案信息中是否包含设定的潜在症状，所述第二判断模型用于判断所述患者是否存在目标症状，所述目标症状包括所述潜在症状；所述症状判断模块，还用于将所述第一答案信息输入至所述第一判断模型，以使用所述第一判断模型判断所述第一答案信息中是否包含设定的潜在症状；在所述第一答案信息中包含所述潜在症状的情况下，根据所述问题模板，为所述潜在症状生成本次随访所需提问的第二随访问题，将所述第二随访问题发送至所述患者终端；接收所述患者终端返回的与所述第二随访问题对应的第二答案信息，将所述第二答案信息输入至所述第二判断模型，以使用所述第二判断模型判断所述患者是否存在所述潜在症状，在所述患者存在所述潜在症状的情况下，将所述潜在症状作为新增症状。

可选地，所述目标症状还包括所述第一历史症状集的历史症状；所述症状判断模块，还用于将所述第一答案信息输入至所述第二判断模型，以使用所述第二判断模型判断所述患者是否存在所述第一历史症状集的历史症状。

可选地，所述目标症状还包括所述第一新增症状集的新增症状；所述装置还包括症状检测模块，用于在所述患者不存在所述潜在症状的情况下，计算所述第一新增症状集和所述第二新增症状集的差集，得到剩余症状集；根据所述问题模板，为所述剩余症状集的剩余症状生成本次随访所需提问的第三随访问题，将所述第三随访问题发送至所述患者终端；接收所述患者终端返回的与所述第三随访问题对应的第三答案信息，将所述第三答案信息输入至所述第二判断模型，以使用所述第二判断模型判断所述患者是否存在所述剩余症状，将确定出的剩余症状记录到所述第二历史症状集。

可选地，所述装置还包括：重复处理模块，用于自增所述第一判断模型的执行次数，判断所述执行次数是否小于等于设定的执行次数阈值；如果所述执行次数大于所述执行次数阈值，则执行检测所述第一新增症状集的新增症状是否询问结束的步骤；如果所述执行次数小于等于所述执行次数阈值，则执行检测本轮问答得到的答案信息中是否包含所述潜在症状的步骤。

可选地，所述装置还包括：模型训练模块，用于将训练集的训练样本输入至BERT模型中，生成所述训练样本中对话文本的第一语义表示；其中，所述训练样本包括所述对话文本和相应的对话者角色，所述对话文本包括所述历史症状；将预定义的参考样本输入至所述BERT模型中，生成所述参考样本中参考文本的第二语义表示；其中，所述参考样本包括所述参考文本和相应的对话者角色，所述参考文本包括参考症状；根据所述第一语义表示，计算所述历史症状的权重，并汇总得到相应的第三语义表示，将所述第二语义表示和所述第三语义表示进行融合，得到融合语义表示；将所述融合语义表示和所述第一语义表示输入至文本建模模型进行处理，将所述文本建模模型的输出结果通过多层感知机进行分类，得到分类结果；根据所述分类结果，计算设定的损失函数的值，最小化所述损失函数，完成对所述症状判断模型的训练。

可选地，所述第一历史症状集和所述第二历史症状集均包括第一类症状集和第二类症状集；其中，所述第一类症状集记录前M次随访均出现过的症状，M为大于等于2的整数；所述第二类症状集记录上次随访新增的症状；所述历史随访数据包括症状类数据和非症状类数据，所述症状类数据包括所述第一历史症状集和所述第一新增症状集，所述非症状类数据包括设备检测数据和非设备检测数据；所述装置还包括：非症状类数据采集模块，用于获取为所述非设备检测数据设置的医疗指标，根据所述问题模板，为所述医疗指标生成本次随访所需提问的第四随访问题，将所述第四随访问题发送至所述患者终端；接收所述患者终端返回的与所述第四随访问题对应的第四答案信息，根据所述第四答案信息，确定本次随访对应的非设备检测数据；获取所述患者最近一次的设备检测数据，在获取成功的情况下，将所述最近一次的设备检测数据作为本次随访对应的设备检测数据。

为实现上述目的，根据本发明实施例的再一方面，提供了一种电子设备。

本发明实施例的一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明实施例的一种随访数据的采集方法。

为实现上述目的，根据本发明实施例的再一方面，提供了一种计算机可读介质。

本发明实施例的一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现本发明实施例的一种随访数据的采集方法。

上述发明中的一个实施例具有如下优点或有益效果：基于上次随访所生成的随访数据，利用智能问答方式和训练好的症状判断模型，判断患者是否仍旧存在历史症状，以及是否存在新增症状，并根据判断结果进行记录，能够自动采集本次随访所需的随访数据，降低医护人员随访的工作量，提高医护人员的工作效率。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明，不构成对本发明的不当限定。其中：

图1是本发明实施例一的随访数据的采集方法的主要步骤示意图；

图2是本发明实施例二的随访数据的采集方法的主要流程示意图；

图3是本发明实施例三的随访数据的采集方法的主要流程示意图；

图4是本发明实施例的症状判断模型的训练过程示意图；

图5是本发明实施例的第一判断模型的模型结构示意图；

图6是本发明实施例的历史症状选择器的结构示意图；

图7是本发明实施例的第二判断模型的模型结构示意图；

图8是本发明实施例四的随访数据的采集方法的主要流程示意图；

图9(a)是本发明实施例的第一次随访的体格和生化检查数据示意图；

图9(b)是本发明实施例的第二次随访的体格和生化检查数据示意图；

图9(c)是本发明实施例的第三次随访中采集装置和患者的对话示意图；

图10是根据本发明实施例的随访数据的采集装置的主要模块的示意图；

图11是本发明实施例可以应用于其中的示例性系统架构图；

图12是适用于来实现本发明实施例的电子设备的计算机装置的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

可以理解，本发明实施例中所使用的术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。还应理解的是，虽然术语“第一”、“第二”等在本申请实施例中用来描述各种元素，但是这些元素不应该受到这些术语的限制。例如，第一历史症状集可以被命名为第二历史症状集，并且类似的，第二历史症状集可以被命名为第一历史症状集。第一历史症状集和第二历史症状集均是历史症状集，但其不是同一历史症状集。

下面对本发明实施例涉及的术语进行解释。

随访：是指医院对曾在医院就诊的病人以通讯或其他的方式，进行定期了解患者病情变化和指导患者康复的一种观察方法。

A类症状：是指在第N次随访时，第N-2次、第N-1次随访均出现过的历史症状。

B类症状：是指在第N次随访时，第N-2次随访未出现、第N-1次随访新增的症状集合。

C类症状：是指在第N次随访时出现的新症状，第N-2次、第N-1次随访时均未出现过。

BERT模型：全称为Bidirectional Encoder Representation fromTransformers，是谷歌公司发布的一个用于文本理解的通用模型。

Transformer模型：谷歌公司发布的文本建模模型。

实际应用中，需采集的随访数据中包括症状类数据和非症状类数据这两种类型。其中，症状类数据主要包括患者自行描述、或者转述为其诊疗医生的诊断数据，该诊断数据包括症状、合并症、靶器官数据。症状类数据具有以下特点：可变性大(即症状表述时机、方式多变)、噪声数据多、症状类型繁多。

比如，患者A患有高血压和糖尿病，在甲医院就诊时，医生的诊断或者判断其症状/合并症/靶器官是缺氧缺血性脑病；去乙医院就诊时，医生的诊断或者判断其症状/合并症/靶器官是短暂性脑缺血发作；而患者A去随访医院随访时，其转述的症状/合并症/靶器官可能是脑血栓。可知，症状类数据可变性较大。

另外，人工采集该部分数据时，患者回答的内容不够专业，具有较多噪声数据。例如医生问询“最近头晕胸闷减轻了吗？”，患者可能回答“最近我感觉我血压又升高了，其实，最近腿有点肿……”。其中“血压又升高”，从随访医生的角度而言，就佐证了其头晕症状依旧存在。

而且患者的一次回答中不仅有对医生问题的回复，也可能会提到新的症状。比如上例中“其实，最近腿有点肿……”，从随访医生的角度而言，说明患者患有的糖尿病，可能引起了其“下肢水肿”的合并症。这就需要医生再进一步询问“下肢水肿”的情况。同时，每次随访时需要确定的症状相比上次随访可能有较大变化，且症状类型繁多，互相关联性小，如果使用枚举的方式逐一询问，对话轮数较多，患者体验较差，配合度较低。因此需要在问答过程中捕获需要重点关注的症状。

非症状类数据具有变动频率低的特点，包括设备检测数据和非设备检测数据。其中，设备检测数据是指使用具体设备对患者身体进行检查而获得的数据，包括体格和生化检查数据、疾病的特定指标数据(也称为特定点)，比如身高、体重、甘油三脂、胆红素等。设备检测数据通常记录在患者所就诊医院的医院信息系统中，因此该部分数据可以直接从医院信息系统中获取。

非设备检测数据是指无需使用设备检查、无需医生诊断，患者即可获得的数据，包括生活史、家族史、过敏史数据。其中，生活史数据包括吸烟、饮酒、年龄、运动等情况；家族史包括父母、兄弟姐妹等亲属的疾病情况。上述数据中，生活史的变动频率较低，家族史、过敏史的变动频率相比生活史更低。

由于症状类数据可变性大，噪声数据多，且需要从繁多的症状类型中捕获重点症状；非症状类数据变动频率低，且设备检测数据通常可以直接从医院信息系统中获得，故可以采用不同的采集方式获得相应数据。下面结合附图对本发明实施例的随访数据的采集过程进行具体说明。

实施例一

图1是本发明实施例一的随访数据的采集方法的主要步骤的示意图。如图1所示，本发明实施例的随访数据的采集方法，适用于症状类数据的采集，主要包括如下步骤：

步骤S101：在对患者进行本次随访时或者之前，从历史随访数据中获取所述患者在上一次随访结束时所生成的第一历史症状集和第一新增症状集。历史随访数据中记录有在本次随访之前的随访中所采集到的随访数据。每次随访所采集的随访数据包括该次随访对应的历史症状集和新增症状集。每次随访得到的历史症状集和新增症状集构成该次随访的症状类数据。其中，历史症状集记录该次随访之前出现的症状，新增症状集记录该次随访新增的症状。

在对患者进行本次随访时，或者在对患者进行本次随访之前(是指上次随访时间之后到本次随访时间之间的时间点)，从历史随访数据中，获取上一次随访结束时所采集到的历史症状集和新增症状集。为了便于区分每次随访所采集的随访数据，下文将上一次随访结束时所采集到的历史症状集和新增症状集，分别称之为第一历史症状集和第一新增症状集。

可以理解的是，如果在本次随访之前采集随访数据，则采集时间需尽量接近本次随访时间，以保证所采集的随访数据能够反映患者病情变化，具有医疗参考价值，比如可以在本次随访时间之前的1小时、3小时、1天等采集随访数据。

步骤S102：根据预配置的问题模板，为所述第一历史症状集的历史症状生成本次随访所需提问的第一随访问题，将所述第一随访问题发送至相应的患者终端。问题模板中设置有多个症状在不同随访时间对应的随访问题集。根据第一历史症状集的历史症状，在问题模板中选择相应症状、相应随访时间所需提问的随访问题，将该随访问题作为第一随访问题发送至该患者的患者终端。

实施例中，如果第一历史症状集中包括多个历史症状，则可以通过多轮问答的方式向患者提问。一轮问答的随访问题可以是将问题模板中一个或者多个症状对应的随访问题进行组合形成。比如，第一历史症状集中包括头晕头痛、恶心呕吐、血管杂音这三个历史症状，则第一随访问题可以是“现在头晕头痛、恶心呕吐、血管杂音的症状还存在吗？”。

步骤S103：接收所述患者终端返回的与所述第一随访问题对应的第一答案信息，将所述第一答案信息输入至训练好的症状判断模型，以确定在本次随访时所述患者存在的历史症状和新增症状。患者通过患者终端反馈第一随访问题对应的第一答案信息，比如为“还有这些情况，而且走路感觉轻飘飘的”。

在接收到第一答案信息后，将其输入至预先通过深度学习方式训练好的症状判断模型，以使用该症状判断模型判断该患者在本次随访时是否仍旧存在第一历史症状集的历史症状，以及是否存在新增症状。如上例所示，经症状判断模型处理，可以确定患者仍旧存在第一历史症状集的全部历史症状(即头晕头痛、恶心呕吐、血管杂音)，且发展了新增症状(即走路轻飘飘的)。

步骤S104：将确定出的历史症状以及存在于所述第一新增症状集的新增症状记录到本次随访对应的第二历史症状集，将不存在于所述第一新增症状集的新增症状记录到本次随访对应的第二新增症状集。在本次随访时，如果第一历史症状集的历史症状仍旧存在，说明该历史症状也属于本次随访的历史症状，记录到本次随访对应的历史症状集。为了便于区分，将本次随访对应的历史症状集称之为第二历史症状集。

同时在本次随访时，如果新增症状属于第一新增症状集，则说明该新增症状在之前随访时已经存在，属于本次随访的历史症状，应该记录到本次随访对应的第二历史症状集。如果新增症状不属于第一新增症状集，则说明其是本次随访新增加的症状，将其记录到本次随访对应的新增症状集。为了便于区分，将本次随访对应的新增症状集称之为第二新增症状集。

本实施例能够确定本次随访时，患者的历史症状是否仍旧存在，以及是否出现了新增症状，实现了本次随访所需随访数据的自动采集，降低医护人员随访的工作量，提高医护人员的工作效率，且增加了随访的趣味性。特别地，如果在本次随访之前执行上述采集方法，则能够自动化、智能化、个性化的实现随访数据的预采集，进一步提高随访工作的工作效率。

实施例二

实施例一中所使用的症状判断模型是通过深度学习方式获得的。该模型能够判断患者在本次随访时是否仍旧存在历史症状，以及是否发展了新增症状。实施例中，该症状判断模型包括第一判断模型和第二判断模型，第一判断模型用于判断患者的答案信息中是否包含设定的潜在症状，第二判断模型用于判断患者是否存在目标症状，该目标症状可以是潜在症状、上次随访的历史症状、上次随访的新增症状等。下面结合实施例二对该模型的具体实现进行详细说明。

图2是本发明实施例二的随访数据的采集方法的主要流程示意图。如图2所示，本发明实施例的随访数据的采集方法，以本次随访为第N次随访为例，适用于症状类数据的采集，由随访数据的采集(比如随访机器人)实现，主要包括如下步骤：

步骤S201：在对患者进行第N次随访时，从历史随访数据中获取第N-1次随访的随访数据，该随访数据中包括第N-1次随访对应的第一历史症状集和第一新增症状集。该步骤即获取第N次随访的前一次随访的随访数据。

在一优选的实施例中，为了更好的体现不同随访时间所获得的随访数据之间的趋势、联系，可以将历史症状集进行细分，比如分为第一类症状集和第二类症状集，其中，第一类症状集记录前M次随访均出现过的症状，M为大于等于2的整数；第二类症状集记录上次随访新增的症状。

实际应用中，随访间隔以月来计算，例如一个月、三个月或者半年等。如果随访间隔为6个月，向前追溯3次，则是追溯前一年半的症状情况，临床意义不大。而如果向前追溯1次，则无法判断哪些症状是新增的，哪些是已经存在的。故优选地，M的取值为2，即向前追溯两次，来确定患者的症状变化情况。

此时，第一类症状集的症状即A类症状，第二类症状集的症状即B类症状，新增症状集的症状集C类症状。因此，可以按照类别，将第N-1次随访对应的第一历史症状集记为A_N-1类症状集和B_N-1类症状集，将第一新增症状集记为C_N-1类症状集。A_N-1类症状集、B_N-1类症状集和C_N-1类症状集的症状均为患者第N-1次随访时存在的症状。

A_N-1类症状集和B_N-1类症状集的症状代表了患者近期最主要的症状，其是否依然存在或发展，对于判断病情的发展具有较为重要的意义，因此其相比C_N-1类症状集的症状具有较高的优先级，且A_N-1类症状集的症状优先级高于B_N-1类症状集的症状。而且，这两类症状通常是慢性病患者长期存在的，发生变化的概率相对较小，容易通过较少的几轮对话询问清楚症状情况。故可以先使用预配置的问题模板询问这两类症状，具体如下。N-1

步骤S202：根据预配置的问题模板，为第一历史症状集的历史症状生成第N次随访所需提问的第一随访问题，将第一随访问题发送至相应的患者终端。问题模板中设置有多个症状在不同随访时间对应的随访问题集。比如胃溃疡症状，在第N次随访(假设为首次诊断治疗的一个月之后)的随访问题为“您是否还存在胃溃疡的情况？”，则可以将该随访问题发送至患者终端。

步骤S203：接收患者终端返回的与第一随访问题对应的第一答案信息，将第一答案信息输入至第二判断模型，以使用第二判断模型判断在第N次随访时患者是否仍旧存在第一历史症状集的历史症状，如果患者仍旧存在历史症状，则执行步骤S204；否则，执行步骤S205。该步骤即判断患者在第N次随访时是否仍旧存在A_N-1类症状集和B_N-1类症状集的症状。

步骤S204：将确定出仍旧存在的历史症状记录到第N次随访对应的第二历史症状集，执行步骤S205。按照A、B、C三类症状的分类方式，仍旧存在的历史症状属于A类症状，由于此时是第N次随访，故可以将仍旧存在的历史症状记录到A_N类症状集。

步骤S205：将本轮问答的答案信息输入至第一判断模型，以使用第一判断模型判断该答案信息中是否包含设定的潜在症状，如果该答案信息中包含潜在症状，则执行步骤S206；否则，执行步骤S208。在患者回答完随访问题后，可以使用第一判断模型判断患者是否提及了某种症状。随访数据的采集装置与患者的每一次问答，均为一轮问答。答案信息的初始值为第一答案信息。实施例中，潜在症状比如胃烧心、下肢水肿等。

步骤S206：根据问题模板，为潜在症状生成本次随访所需提问的第二随访问题，将第二随访问题发送至患者终端。

步骤S207：接收患者终端返回的与第二随访问题对应的第二答案信息，将第二答案信息输入至第二判断模型，以使用第二判断模型判断患者是否存在潜在症状，如果患者存在潜在症状，则执行步骤S211；否则，执行步骤S205。在患者回答完针对潜在症状的随访问题后，可以使用第二判断模型判断患者是否存在该潜在症状。

步骤S208：检查第一新增症状集的症状是否询问结束，如果未询问结束，则执行步骤S209；如果询问结束，则结束本流程。该步骤即检查C_N-1类症状集的症状是否全部询问结束。

步骤S209：根据问题模板，为剩余症状集的剩余症状生成本次随访所需提问的第三随访问题，将第三随访问题发送至患者终端。其中，剩余症状集为第一新增症状集和当前的第二新增症状集的差集。

步骤S210：接收患者终端返回的与第三随访问题对应的第三答案信息，将第三答案信息输入至第二判断模型，以使用第二判断模型判断患者是否存在剩余症状，如果患者存在剩余症状，则执行步骤S212；否则执行步骤S205。在患者回答完针对剩余症状的随访问题后，可以使用第二判断模型判断患者是否存在该剩余症状。

步骤S211：将潜在症状作为新增症状，判断新增症状是否存在于第一新增症状集中，如果新增症状存在于第一新增症状集，则执行步骤S212；否则，执行步骤S213。

步骤S212：将新增症状/剩余症状记录到第N次随访对应的第二历史症状集，执行步骤S205。如果新增症状属于C_N-1类症状集，说明其属于第N次随访的B类症状，记录到B_N类症状集。剩余症状也属于第N次随访的B类症状，故记录到B_N类症状集。

步骤S213：将新增症状记录到第N次随访对应的第二新增症状集，执行步骤S205。如果新增症状不属于C_N-1类症状集，说明其属于第N次随访的C类症状，记录到C_N类症状集。

实施例三

为了避免随访数据的采集装置与患者之间的问答次数过多，提升患者的配合度，可以为第一判断模型设置执行次数阈值，以限制问答次数。下面结合图3对本实施例进行进一步说明。可以理解的是，下述步骤仅对与实施例二相区别的实现过程进行了说明。

图3是本发明实施例三的随访数据的采集方法的主要流程示意图。如图3所示，本发明实施例的随访数据的采集方法，仍旧以本次随访为第N次随访为例，适用于症状类数据的采集，主要包括如下步骤：

步骤S301：在对患者进行第N次随访时，从历史随访数据中获取第N-1次随访的随访数据，该随访数据中包括第N-1次随访对应的第一历史症状集和第一新增症状集。

实施例中，某次随访的原始随访数据可以包括该次随访时患者存在的症状，此时，在获取第N-1次随访的随访数据时，可以获取第N-2次、第N-1次随访的随访数据，之后按照A、B、C类症状区分为A_N-1类症状集、B_N-1类症状集和C_N-1类症状集。A_N-1类症状集和B_N-1类症状集构成第一历史症状集，C_N-1类症状集为第一新增症状集。

步骤S302：根据预配置的问题模板，为第一历史症状集的历史症状生成第N次随访所需提问的第一随访问题，将第一随访问题发送至相应的患者终端。第一随访问题用于询问患者是否仍旧存在A_N-1类症状集和B_N-1类症状集的症状。

步骤S303：接收患者终端返回的与第一随访问题对应的第一答案信息，将第一答案信息输入至第二判断模型，以使用第二判断模型判断在第N次随访时患者是否仍旧存在第一历史症状集的历史症状，如果患者仍旧存在历史症状，则执行步骤S304；否则，执行步骤S305。该步骤即判断患者在第N次随访时是否仍旧存在A_N-1类症状集和B_N-1类症状集的症状。第二判断模型即图3的M₂模型。

步骤S304：将确定出仍旧存在的历史症状记录到第N次随访对应的第二历史症状集，执行步骤S305。按照A、B、C三类症状的分类方式，仍旧存在的历史症状属于A类症状，由于此时是第N次随访，故可以将仍旧存在的历史症状记录到A_N类症状集。

步骤S305：自增第一判断模型的执行次数k，判断执行次数k是否小于等于设定的执行次数阈值K，如果执行次数k小于等于执行次数阈值K，则执行步骤S306；否则执行步骤S309。实施例中，执行次数k的初始值为0，执行次数阈值K可以根据慢性病的病种特点进行设置。第一判断模型即图3的M₁模型。

如果执行次数k小于等于执行次数阈值K，则执行检测本轮问答得到的答案信息中是否包含潜在症状的步骤，即步骤S306。如果执行次数k大于执行次数阈值K，则直接执行检测第一新增症状集的新增症状是否询问结束的步骤，即步骤S309。

步骤S306：将本轮问答的答案信息输入至第一判断模型，以使用第一判断模型判断该答案信息中是否包含设定的潜在症状，如果该答案信息中包含潜在症状，则执行步骤S307；否则，执行步骤S309。在患者回答完随访问题后，可以使用第一判断模型判断患者是否提及了某种症状。

步骤S307：根据问题模板，为潜在症状生成本次随访所需提问的第二随访问题，将第二随访问题发送至患者终端。

步骤S308：接收患者终端返回的与第二随访问题对应的第二答案信息，将第二答案信息输入至第二判断模型，以使用第二判断模型判断患者是否存在潜在症状，如果患者存在潜在症状，则执行步骤S312；否则，执行步骤S305。

步骤S309：检查第一新增症状集的症状是否询问结束，如果未询问结束，则执行步骤S310；如果询问结束，则结束本流程。该步骤即检查C_N-1类症状集的症状是否全部询问结束。

步骤S310：根据问题模板，为剩余症状集的剩余症状生成本次随访所需提问的第三随访问题，将第三随访问题发送至患者终端。其中，剩余症状集为第一新增症状集和当前的第二新增症状集的差集。

步骤S311：接收患者终端返回的与第三随访问题对应的第三答案信息，将第三答案信息输入至第二判断模型，以使用第二判断模型判断患者是否存在剩余症状，如果患者存在剩余症状，则执行步骤S313；否则执行步骤S305。

步骤S312：将潜在症状作为新增症状，判断新增症状是否存在于第一新增症状集中，如果新增症状存在于第一新增症状集，则执行步骤S313；否则，执行步骤S314。

步骤S313：将新增症状/剩余症状记录到第N次随访对应的第二历史症状集，执行步骤S305。

步骤S314：将新增症状记录到第N次随访对应的第二新增症状集，执行步骤S305。

下面结合图4-图7，对实施例一至实施例三所使用的症状判断模型的训练过程进行说明。其中，图5-图7中，History Selection Module为历史症状选择器；FClayer为全连接层。

图4是本发明实施例的症状判断模型的训练过程示意图。如图4所示，本发明实施例的症状判断模型的训练过程，包括以下步骤：

步骤S401：将训练集的训练样本输入至BERT模型中，生成训练样本中对话文本的第一语义表示。其中，训练样本包括对话文本和相应的对话者角色，对话文本包括历史症状。BERT模型可以使用谷歌提供的预训练参数进行初始化。

实施例中，训练样本可以表示为：{Sen₁，[对话者角色]；Sen₂，[对话者角色]；……，Sen_M，[对话者角色]}。其中，Sen₁，Sen₂，……，Sen_M代表模型本次所判定的对话文本(即句子)，下标代表了句子的顺序；对话者角色可以是Patient(患者)和Doctor(医生)。[对话者角色]会作为一个独立的词输入至BERT模型，并放置于[CLS]和句子之间。其中，[CLS]为BERT模型的一个标志位，放在第一个句子的首位。

为了能够模拟医生随访的过程，准确高效地完成随访任务，因此医生和患者随访的历史对话数据可以给构建训练样本提供数据支持。实施例中，为了更好的利用医生-患者的历史对话数据，可以将历史对话数据进行如表1所示的结构化处理。

表1

步骤S402：将预定义的参考样本输入至BERT模型中，生成参考样本中参考文本的第二语义表示。其中，参考样本包括参考文本和相应的对话者角色，参考文本包括参考症状。症状判断模型包括第一判断模型和第二判断模型两种，其中，第一判断模型的参考文本可以是“是否提及症状A”，对话者角色为“[Patient]”；第二判断模型的参考文本“是否发生症状A”，对话者角色为“[Patient]”。

步骤S403：根据第一语义表示，计算历史症状的权重，并汇总得到相应的第三语义表示，将第二语义表示和第三语义表示进行融合，得到融合语义表示。实施例中可以通过多层感知机进行融合。

步骤S404：将融合语义表示和第一语义表示输入至文本建模模型进行处理，将文本建模模型的输出结果通过多层感知机进行分类，得到分类结果。此处文本建模模型为Transformer模型。实施例中，分类结果为对话文本是否提及指定症状的概率，或者患者是否存在指定症状的概率。

步骤S405：根据分类结果，计算设定的损失函数的值，最小化损失函数，完成对症状判断模型的训练。实施例中，损失函数可以用如下公式表示：

L＝-ylog(P_M1*P_M2)-(1-y)log(P_M1*(1-P_M2)+(1-P_M1))

＝-ylog(P_M1*P_M2)-(1-y)log(1-P_M1*P_M2)

where,

式中，P_M1(s_i)＝M₁(D,HS,s_i)，表示第一判断模型M1对于给定症状s_i得到的该对话文本提及该症状的概率；P_M2(s_i)＝M₂(D,HS,s_i)，表示第二判断模型M2对于给定症状s_i得到的该对话文本发生该症状的概率；D为对话文本，HS为历史症状，S为症状记录，s_i为症状记录的第i个症状。

另外，对于完整的对话文本，可能会存在如下情况：提及到某历史症状，但最终没有记录进入S。因此对于该部分训练数据增加一项正则，具体如下：

最终的最小化损失函数可以用如下公式表示：

Loss＝L+αL₁ 公式3

式中，α∈[0,1]为超参数，用于调整正则项的影响，α越接近1越相信该正则项。如果训练样本中存在大量医生未问及某些历史症状，则说明损失函数存在错误。根据上述最小化损失函数(Loss)对症状判断模型进行训练，就能够获得目标能力，即根据一段对话文本和历史症状，就能够预测患者是否提及、以及是否出现某症状。

实施例中，针对损失函数，可以使用自适应的矩估计算法(Adaptive momentestimation，Adam)进行优化，训练迭代至误差曲线基本平缓，基于Early Stop(提前停止)机制在验证集上达到收敛(即损失函数不再下降)则停止继续训练。结束训练后得到症状判断模型即可用于预测患者是否提及、以及是否出现某症状。

图5是本发明实施例的第一判断模型的模型结构示意图，图6是本发明实施例的第一判断模型中历史症状选择器的结构示意图。如图5和图6所示，本发明实施例的第一判断模型的建模过程包括：

首先，将对话文本Sen₁，Sen₂，……，Sen_M和相应的对话者角色输入至BERT模型中，得到Sen₁，Sen₂，……，Sen_M的第一语义表示，分别记作C₁，C₂，……，C_M。之后，将预定义的参考文本(比如“是否提及症状A”)和相应的对话者角色([Patient])输入至BERT模型中，得到参考文本的第二语义表示，记作C。

之后使用历史症状选择器，根据C计算历史症状的权重(attention)，并汇总得到相应的第三语义表示，记作E’，进而将E’和C通过多层感知机的方法映射到融合语义表示，记作C_q。在得到C_q，C₁，C₂，……，C_M后，按此顺序通过Transformer模型，得到C_q对应的语义表示，将该语义表示通过多层感知机进行二分类，即可得到分类结果。该分类结果为是和否的概率(可以记为P_是、P_否)，对应是否提及症状A，且P_是+P_否＝1。

图7是本发明实施例的第二判断模型的模型结构示意图。结合图5和图7可知，第二判断模型的建模流程与第一判断模型的建模流程类似，区别在于两者预定义的参考文本不同，第二判断模型对应的参考文本可以为“是否发生症状A”。第一判断模型和第二判断模型中，BERT部分共享参数，即同步更新，除此之外的参数均为独立参数。为了区分第一判断模型和第二判断模型的预测结果，可以将其最终预测为“是”的概率记录为P_M1和P_M2。

实施例四

图8是本发明施例四的随访数据的采集方法的主要流程示意图。如图8所示，本发明实施例的随访数据的采集方法，该方法可以采集症状类数据和非症状类数据的随访数据，主要包括以下步骤：

步骤S801：在对患者进行本次随访时或者之前，获取为非设备检测数据设置的第一医疗指标，根据问题模板，为第一医疗指标生成本次随访所需提问的第四随访问题，将第四随访问题发送至患者终端。该步骤用于询问患者其生活史、家族史、过敏史是否有变化。生活史的医疗指标可以是吸烟、饮酒、运动等，家族史的医疗指标可以是父亲病史、母亲病史、子女病史等；过敏史的医疗指标可以是易导致过敏的药物。

步骤S802：接收患者终端返回的与第四随访问题对应的第四答案信息，根据第四答案信息，确定本次随访对应的非设备检测数据。如果患者回答“有变化或是或对等这些有确定意义的词语”时，则在采集装置中相应数据部分标记其“有变化，未填写”，同时告知患者：“后续在APP中里填写相关数据”；如果患者回答“没有、无等有否定意义的词语”，则非设备检测数据的问询结束。

实施例中，如果生活史部分数据存在变化，则在采集装置的数据采集页面的生活史部分标记“有变化，未填写”；如果家族史、过敏史部分数据存在变化，则在数据采集页面的家族史、过敏史部分标记“有变化，未填写”。

步骤S803：获取患者最近一次的设备检测数据，判断是否成功获取到设备检测数据，如果获取成功，则执行步骤S804；如果获取失败，则执行步骤S805。对于信息化水平较高的医院，其医院信息系统中会存在设备检测数据，故可以直接从其医院信息系统采集设备检测数据。信息化水平较低的医院，无法自动采集，需要以问答方式采集(见步骤S805-步骤S806)。

步骤S804：将最近一次的设备检测数据作为本次随访对应的设备检测数据，执行步骤S807。从医院信息系统中抓取最近一次日期相关指标的结果，并自动填充至采集装置的数据采集页面。

步骤S805：获取为设备检测数据设置的第二医疗指标，根据问题模板，为第二医疗指标生成本次随访所需提问的第五随访问题，将第五随访问题发送至患者终端。体格和生化检查部分的医疗指标可以是体重、血压、血脂等，随访问题可以是“您的体重、血压、血脂等指标最近是否有变化？”；特定点的医疗指标可以是胆红素、血象等，随访问题可以是“您的胆红素、血象(乙肝的特定点)或肿瘤标志物(甲胎蛋白，乳腺癌的特定点)等指标最近是否有变化？”。

步骤S806：接收患者终端返回的与第五随访问题对应的第五答案信息，根据第五答案信息，确定本次随访对应的设备检测数据。如果患者回答“有变化或是或对等这些有确定意义的词语”，则在采集装置的相应部分标记其“有变化，未填写”，同时告知患者：“后续在APP里填写相关数据、或上传检查单”；如果患者回答“没有、无等有否定意义的词语”，则该部分问询结束，直接提取上次随访的结果进行保存即可。

步骤S807：按照实施例一至三的任意一种方式采集症状类数据。实施例四中先采集非设备检测数据(对应步骤S801-步骤S802)，之后采集设备检测数据(对应步骤S803-步骤S806)，最后采集症状类数据(对应步骤S807)。可以理解的是，本实施例并不限定各种类型数据采集的先后顺序。比如，还可以先采集设备检测数据，之后采集非设备检测数据，最后采集症状类数据。再比如还可以先采集症状类数据，再采集设备检测数据，最后采集非设备检测数据。

另外，在采集非设备检测数据和设备检测数据时，实施例四中描述的单轮问答方式仅为示例。实际应用中通常需通过多轮问答进行数据采集。比如，在采集设备检测数据时，可以先询问患者体重、血压、血脂等指标最近是否有变化，之后再询问胆红素、血象是否有变化。

实施例中，可以将采集到的随访数据记录到采集装置的数据采集页面。该数据采集页面包括生活史、家族史、过敏史、体格和生化检查数据、特定点数据、症状、合并症和靶器官数据。经过实施例四的采集流程之后，医护人员可以基于数据采集页面的数据，对患者的疾病情况进行风险评估、随访建议、干预等疾病管理工作，实现了随访患者相关医疗指标的智能化预采集，提高了医护人员的随访效率和随访质量。

实施例一至四能够用于疾病管理的随访过程，此处的疾病可以是需要长期进行疾病管理的病种，比如慢性非传染性疾病(non-infectious chronic disease，NCD，简称慢性病)。

下面结合具体应用场景对本实施例的随访数据的采集方法进行进一步说明。

假设小明(41岁)患有高血压、冠心病两种慢性病，分别于2021年01月01日、2021年03月01日在甲医院进行过这两种疾病的随访；本次于2021年07月01日再次来甲医院进行这两种疾病的随访。

第一次随访(随访时间为2021年01月01日)的随访数据包括：生活史、家族史、过敏史、体格和生化检查、症状类数据。其中，生活史数据见表2；家族史数据见表3；过敏史数据为青霉素；体格和生化检查数据见图9(a)；症状类数据中，症状：头晕头痛、恶心呕吐、多饮多尿，靶器官：心肌、血管杂音。

表2

表3

第二次随访(随访时间为2021年03月01日)的随访数据包括：生活史、家族史、过敏史、体格和生化检查、症状类数据。其中，生活史数据见表4；家族史数据见表5；过敏史数据为青霉素；体格和生化检查数据见图9(b)；症状类数据中，症状：头晕头痛、恶心呕吐、眼花耳鸣，靶器官：心肌、血管杂音。

表4

表5

2021年07月01日，小明来甲医院进行第三次随访，假设采集装置(即左侧图标)与小明(即右侧图标)的患者终端进行了图9(c)所示的对话，则本次随访，小明后续要将生活史、家族史部分有变动的指标进行填写和完善；体格和生化检查、特定点部分，采集装置可以自动进行抓取，获取最新一次的患者检查结果即可。针对症状类的随访结果为：症状：头晕头痛、恶心呕吐、四肢发麻，靶器官：心肌、血管杂音。

本发明实施例的随访数据的采集方法，以患病人群庞大、医疗花费较多的慢性病群体的疾病管理、随访为出发点，结合深度学习模型，为医护人员提供了有效的预随访工具，大大节省了医护人员的随访工作量和效率。同时解决了传统面对面或者电话随访，对于医生和患者而言都存在的枯燥、占用时间、语言不专业、聊天内容发散等问题，既降低了医疗资源的消耗，也增加了患者随访的趣味性，提高了患者的配合度，且接近于医生-患者随访体验，使得后续对疾病的管理更加有效。

图10是根据本发明实施例的随访数据的采集装置的主要模块的示意图。如图10所示，本发明实施例的随访数据的采集装置1000，主要包括：

数据获取模块1001，用于在对患者进行本次随访时或者之前，从历史随访数据中获取所述患者在上一次随访结束时所生成的第一历史症状集和第一新增症状集。历史随访数据中记录有在本次随访之前的随访中所采集到的随访数据。每次随访所采集的随访数据包括该次随访对应的历史症状集和新增症状集。每次随访得到的历史症状集和新增症状集构成该次随访的症状类数据。其中，历史症状集记录该次随访之前出现的症状，新增症状集记录该次随访新增的症状。

在对患者进行本次随访时，或者在对患者进行本次随访之前(是指上次随访时间之后到本次随访时间之间的时间点)，从历史随访数据中，获取上一次随访结束时所采集到的历史症状集和新增症状集。

问题生成模块1002，用于根据预配置的问题模板，为所述第一历史症状集的历史症状生成本次随访所需提问的第一随访问题，将所述第一随访问题发送至相应的患者终端。问题模板中设置有多个症状在不同随访时间对应的随访问题集。根据第一历史症状集的历史症状，在问题模板中选择相应症状、相应随访时间所需提问的随访问题，将该随访问题作为第一随访问题发送至该患者的患者终端。

症状判断模块1003，用于接收所述患者终端返回的与所述第一随访问题对应的第一答案信息，将所述第一答案信息输入至训练好的症状判断模型，以确定在本次随访时所述患者存在的历史症状和新增症状。患者通过患者终端反馈第一随访问题对应的第一答案信息。在接收到第一答案信息后，将其输入至预先通过深度学习方式训练好的症状判断模型，以使用该症状判断模型判断该患者在本次随访时是否仍旧存在第一历史症状集的历史症状，以及是否存在新增症状。

症状记录模块1004，用于将确定出的历史症状以及存在于所述第一新增症状集的新增症状记录到本次随访对应的第二历史症状集，将不存在于所述第一新增症状集的新增症状记录到本次随访对应的第二新增症状集。在本次随访时，如果第一历史症状集的历史症状仍旧存在，说明该历史症状也属于本次随访的历史症状，记录到本次随访对应的第二历史症状集。

同时在本次随访时，如果新增症状属于第一新增症状集，则说明该新增症状在之前随访时已经存在，属于本次随访的历史症状，应该记录到本次随访对应的第二历史症状集。如果新增症状不属于第一新增症状集，则说明其是本次随访新增加的症状，将其记录到本次随访对应的第二新增症状集。

另外，本发明实施例的随访数据的采集装置1000还可以包括：症状检测模块、重复处理模块、模型训练模块和非症状类数据采集模块(图10中未示出)。各模块所实现的功能如前所述，此处不再赘述。

从以上描述可以看出，基于上次随访所生成的随访数据，利用智能问答方式和训练好的症状判断模型，判断患者是否仍旧存在历史症状，以及是否存在新增症状，并根据判断结果进行记录，能够自动采集本次随访所需的随访数据，降低医护人员随访的工作量，提高医护人员的工作效率。

图11示出了可以应用本发明实施例的随访数据的采集方法或随访数据的采集装置的示例性系统架构1100。

如图11所示，系统架构1100可以包括终端设备1101、1102、1103，网络1104和服务器1105。网络1104用以在终端设备1101、1102、1103和服务器1105之间提供通信链路的介质。网络1104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备1101、1102、1103通过网络1104与服务器1105交互，以接收或发送消息等。终端设备1101、1102、1103上可以安装有各种通讯客户端应用，例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备1101、1102、1103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器1105可以是提供各种服务的服务器，例如对患者利用终端设备1101、1102、1103发送的采集指令进行处理的后台管理服务器。后台管理服务器可以获取上一次随访的随访数据，生成随访问题并发送至终端设备，接收患者的答案信息，确定患者的历史症状和新增症状等处理，并将处理结果(例如本次随访的随访数据)反馈给终端设备。

需要说明的是，本申请实施例所提供的随访数据的采集方法一般由服务器1105执行，相应地，随访数据的采集装置一般设置于服务器1105中。

应该理解，图11中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

根据本发明的实施例，本发明还提供了一种电子设备和一种计算机可读介质。

本发明的电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明实施例的一种随访数据的采集方法。

本发明的计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现本发明实施例的一种随访数据的采集方法。

下面参考图12，其示出了适用于来实现本发明实施例的电子设备的计算机系统1200的结构示意图。图12示出的电子设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图12所示，计算机系统1200包括中央处理单元(CPU)1201，其可以根据存储在只读存储器(ROM)1202中的程序或者从存储部分1208加载到随机访问存储器(RAM)1203中的程序而执行各种适当的动作和处理。在RAM 1203中，还存储有计算机系统1200操作所需的各种程序和数据。CPU 1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(I/O)接口1205也连接至总线1204。

以下部件连接至I/O接口1205：包括键盘、鼠标等的输入部分1206；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1207；包括硬盘等的存储部分1208；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器1210上，以便于从其上读出的计算机程序根据需要被安装入存储部分1208。

特别地，根据本发明公开的实施例，上文主要步骤图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行主要步骤图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分1209从网络上被下载和安装，和/或从可拆卸介质1211被安装。在该计算机程序被中央处理单元(CPU)1201执行时，执行本发明的系统中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中，例如，可以描述为：一种处理器包括数据获取模块、问题生成模块、症状判断模块和症状记录模块。其中，这些模块的名称在某种情况下并不构成对该模块本身的限定，例如，数据获取模块还可以被描述为“在对患者进行本次随访时或者之前，从历史随访数据中获取所述患者在上一次随访结束时所生成的第一历史症状集和第一新增症状集的模块”。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备包括：在对患者进行本次随访时或者之前，从历史随访数据中获取所述患者在上一次随访结束时所生成的第一历史症状集和第一新增症状集；根据预配置的问题模板，为所述第一历史症状集的历史症状生成本次随访所需提问的第一随访问题，将所述第一随访问题发送至相应的患者终端；接收所述患者终端返回的与所述第一随访问题对应的第一答案信息，将所述第一答案信息输入至训练好的症状判断模型，以确定在本次随访时所述患者存在的历史症状和新增症状；将确定出的历史症状以及存在于所述第一新增症状集的新增症状记录到本次随访对应的第二历史症状集，将不存在于所述第一新增症状集的新增症状记录到本次随访对应的第二新增症状集。

根据本发明实施例的技术方案，基于上次随访所生成的随访数据，利用智能问答方式和训练好的症状判断模型，判断患者是否仍旧存在历史症状，以及是否存在新增症状，并根据判断结果进行记录，能够自动采集本次随访所需的随访数据，降低医护人员随访的工作量，提高医护人员的工作效率。

上述产品可执行本发明实施例所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明实施例所提供的方法。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种随访数据的采集方法，其特征在于，包括：

在对患者进行本次随访时或者之前，从历史随访数据中获取所述患者在上一次随访结束时所生成的第一历史症状集和第一新增症状集；

根据预配置的问题模板，为所述第一历史症状集的历史症状生成本次随访所需提问的第一随访问题，将所述第一随访问题发送至相应的患者终端；

接收所述患者终端返回的与所述第一随访问题对应的第一答案信息，将所述第一答案信息输入至训练好的症状判断模型，以确定在本次随访时所述患者存在的历史症状和新增症状；

将确定出的历史症状以及存在于所述第一新增症状集的新增症状记录到本次随访对应的第二历史症状集，将不存在于所述第一新增症状集的新增症状记录到本次随访对应的第二新增症状集。

2.根据权利要求1所述的方法，其特征在于，所述症状判断模型包括第一判断模型和第二判断模型，所述第一判断模型用于判断所述第一答案信息中是否包含设定的潜在症状，所述第二判断模型用于判断所述患者是否存在目标症状，所述目标症状包括所述潜在症状；

将所述第一答案信息输入至训练好的症状判断模型，以确定在本次随访时所述患者存在的新增症状，包括：

将所述第一答案信息输入至所述第一判断模型，以使用所述第一判断模型判断所述第一答案信息中是否包含设定的潜在症状；

在所述第一答案信息中包含所述潜在症状的情况下，根据所述问题模板，为所述潜在症状生成本次随访所需提问的第二随访问题，将所述第二随访问题发送至所述患者终端；

接收所述患者终端返回的与所述第二随访问题对应的第二答案信息，将所述第二答案信息输入至所述第二判断模型，以使用所述第二判断模型判断所述患者是否存在所述潜在症状，在所述患者存在所述潜在症状的情况下，将所述潜在症状作为新增症状。

3.根据权利要求2所述的方法，其特征在于，所述目标症状还包括所述第一历史症状集的历史症状；

所述将所述第一答案信息输入至训练好的症状判断模型，以确定在本次随访时所述患者存在的历史症状，包括：

将所述第一答案信息输入至所述第二判断模型，以使用所述第二判断模型判断所述患者是否存在所述第一历史症状集的历史症状。

4.根据权利要求2所述的方法，其特征在于，所述目标症状还包括所述第一新增症状集的新增症状；所述方法还包括：

在所述患者不存在所述潜在症状的情况下，执行检测所述第一新增症状集的新增症状是否询问结束的步骤，所述步骤包括：

计算所述第一新增症状集和所述第二新增症状集的差集，得到剩余症状集；

根据所述问题模板，为所述剩余症状集的剩余症状生成本次随访所需提问的第三随访问题，将所述第三随访问题发送至所述患者终端；

接收所述患者终端返回的与所述第三随访问题对应的第三答案信息，将所述第三答案信息输入至所述第二判断模型，以使用所述第二判断模型判断所述患者是否存在所述剩余症状，将确定出的剩余症状记录到所述第二历史症状集。

5.根据权利要求2至4的任一项所述的方法，其特征在于，在使用所述第二判断模型判断所述患者是否存在所述目标症状之后，所述方法还包括以下重复执行的步骤：

自增所述第一判断模型的执行次数，判断所述执行次数是否小于等于设定的执行次数阈值；

如果所述执行次数大于所述执行次数阈值，则执行检测所述第一新增症状集的新增症状是否询问结束的步骤；

如果所述执行次数小于等于所述执行次数阈值，则执行检测本轮问答得到的答案信息中是否包含所述潜在症状的步骤。

6.根据权利要求1所述的方法，其特征在于，所述症状判断模型的训练过程包括：

将训练集的训练样本输入至BERT模型中，生成所述训练样本中对话文本的第一语义表示；其中，所述训练样本包括所述对话文本和相应的对话者角色，所述对话文本包括所述历史症状；

将预定义的参考样本输入至所述BERT模型中，生成所述参考样本中参考文本的第二语义表示；其中，所述参考样本包括所述参考文本和相应的对话者角色，所述参考文本包括参考症状；

根据所述第一语义表示，计算所述历史症状的权重，并汇总得到相应的第三语义表示，将所述第二语义表示和所述第三语义表示进行融合，得到融合语义表示；

将所述融合语义表示和所述第一语义表示输入至文本建模模型进行处理，将所述文本建模模型的输出结果通过多层感知机进行分类，得到分类结果；

根据所述分类结果，计算设定的损失函数的值，最小化所述损失函数，完成对所述症状判断模型的训练。

7.根据权利要求1至4或6所述的方法，其特征在于，所述第一历史症状集和所述第二历史症状集均包括第一类症状集和第二类症状集；其中，所述第一类症状集记录前M次随访均出现过的症状，M为大于等于2的整数；所述第二类症状集记录上次随访新增的症状；

所述历史随访数据包括症状类数据和非症状类数据，所述症状类数据包括所述第一历史症状集和所述第一新增症状集，所述非症状类数据包括设备检测数据和非设备检测数据；所述方法还包括：

获取为所述非设备检测数据设置的医疗指标，根据所述问题模板，为所述医疗指标生成本次随访所需提问的第四随访问题，将所述第四随访问题发送至所述患者终端；

接收所述患者终端返回的与所述第四随访问题对应的第四答案信息，根据所述第四答案信息，确定本次随访对应的非设备检测数据；

获取所述患者最近一次的设备检测数据，在获取成功的情况下，将所述最近一次的设备检测数据作为本次随访对应的设备检测数据。

8.一种随访数据的采集装置，其特征在于，包括：

数据获取模块，用于在对患者进行本次随访时或者之前，从历史随访数据中获取所述患者在上一次随访结束时所生成的第一历史症状集和第一新增症状集；

问题生成模块，用于根据预配置的问题模板，为所述第一历史症状集的历史症状生成本次随访所需提问的第一随访问题，将所述第一随访问题发送至相应的患者终端；

症状判断模块，用于接收所述患者终端返回的与所述第一随访问题对应的第一答案信息，将所述第一答案信息输入至训练好的症状判断模型，以确定在本次随访时所述患者存在的历史症状和新增症状；

症状记录模块，用于将确定出的历史症状以及存在于所述第一新增症状集的新增症状记录到本次随访对应的第二历史症状集，将不存在于所述第一新增症状集的新增症状记录到本次随访对应的第二新增症状集。

9.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。

10.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。