CN112786131A

CN112786131A - 识别就诊信息的方法及装置、电子设备和存储介质

Info

Publication number: CN112786131A
Application number: CN202011628395.1A
Authority: CN
Inventors: 崔恒夫; 王尧; 肖玉; 刘婷婷
Original assignee: Yidu Cloud Beijing Technology Co Ltd
Current assignee: Yidu Cloud Beijing Technology Co Ltd
Priority date: 2020-12-31
Filing date: 2020-12-31
Publication date: 2021-05-11
Anticipated expiration: 2040-12-31
Also published as: CN112786131B

Abstract

本公开是关于一种识别就诊信息的方法及装置、电子设备以及计算机可读存储介质，涉及数据挖掘技术领域，可以对历史病历数据进行重组，筛选出与本次预约挂号关联的病历数据。该方法包括：获取目标患者的预约挂号信息，根据预约挂号信息确定目标患者的患者疾病类别；根据预约挂号信息确定目标患者对应的医生信息；医生信息包括第一疾病类别；获取目标患者的历史病历数据，根据患者疾病类别与第一疾病类别从历史病历数据中确定与本次预约挂号相关的关联病史数据；将关联病史数据作为本次预约挂号的预测就诊信息。本公开可以从患者庞杂的历史病历数据中快速定位出与本次预约挂号相关联的核心病历数据，以避免可能造成的信息遗漏。

Description

识别就诊信息的方法及装置、电子设备和存储介质

技术领域

本公开涉及数据挖掘技术领域，具体而言，涉及一种识别就诊信息的方法、识别就诊信息的装置、电子设备以及计算机可读存储介质。

背景技术

近年来，我国医院信息化发展已进入成熟阶段，在医院信息化基础之上建立的大数据平台，依靠数据治理与服务，通过数据标化、采集、汇聚、深度加工等流程，可有效辅助临床数据的分析、挖掘，甚至是多学科多维度的二次数据利用。

例如，医生可以通过电子病历系统搜索患者标识(Identity Document，ID)，根据历次就诊日期，按照就诊维度查看患者历史诊疗数据，以从历史诊疗数据中获取有价值的病情信息。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供一种识别就诊信息的方法、识别就诊信息的装置、电子设备以及计算机可读存储介质，进而至少在一定程度上克服采用现有的病历检索方式无法快速定位出与本次预约挂号行为关联的病历数据，较为费力耗时且医生可能忽略判断某类疾病病情的细节信息的问题。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本发明的实践而习得。

根据本公开的第一方面，提供一种识别就诊信息的方法，包括：获取目标患者的预约挂号信息，根据预约挂号信息确定目标患者的患者疾病类别；根据预约挂号信息确定目标患者对应的医生信息；医生信息包括第一疾病类别；获取目标患者的历史病历数据，根据患者疾病类别与第一疾病类别从历史病历数据中确定与本次预约挂号相关的关联病史数据；将关联病史数据作为本次预约挂号的预测就诊信息。

可选的，根据预约挂号信息确定目标患者的患者疾病类别，包括：根据预约挂号信息确定目标患者的疾病特征；获取预先构建的疾病类别模型；根据疾病特征和疾病类别模型确定患者疾病类别。

可选的，在获取预先构建的疾病类别模型之前，上述方法还包括：根据医学指南文件构建疾病树，根据疾病树构建疾病数据模型；确定疾病类别，根据疾病类别将同一疾病类别下的多个同类型疾病对应的疾病数据模型进行聚合处理，得到初始疾病类别模型；获取临床医疗数据，根据临床医疗数据对初始疾病类别模型进行填充处理，以得到疾病类别模型。

可选的，根据疾病类别将同一疾病类别下的多个同类型疾病对应的疾病数据模型进行聚合处理，包括：确定多个同类型疾病的相同字段，并将相同字段作为关键字段；获取各同类型疾病中相同字段下的相同字段值；对多个相同字段值进行合并，以得到与各关键字段对应的关键字段值。

可选的，根据临床医疗数据对初始疾病类别模型进行填充处理，以得到疾病类别模型，包括：构建样本病历数据集，并确定样本病历数据集中样本病历对应的医学编码；根据医学编码确定各样本病历对应的疾病类别；基于疾病类别并根据样本病历数据集确定初始疾病类别模型对应的附加关键字段；根据附加关键字段对初始疾病类别模型进行填充处理，以得到疾病类别模型。

可选的，根据预约挂号信息确定目标患者对应的医生信息，包括：从预约挂号信息中确定医生标识，根据医生标识确定历史诊疗行为数据；确定历史诊疗行为数据对应的诊疗行为特征；获取疾病类别模型，根据诊疗行为特征和疾病类别模型确定第一疾病类别。

可选的，根据患者疾病类别与第一疾病类别从历史病历数据中确定与本次预约挂号相关的关联病史数据，包括：获取预先构建的病历数据处理模型；将患者疾病类别、第一疾病类别和历史病历数据输入至病历数据处理模型；由病历数据处理模型根据患者疾病类别和第一疾病类别对历史病历数据进行重组处理，以从历史病历数据中确定关联病史数据。

可选的，病历数据处理模型通过下述方式训练得到：获取训练数据；训练数据包括预约挂号训练数据、病史训练数据和医生训练数据；根据预约挂号训练数据确定对应的当前疾病类别标签，并根据病史训练数据确定全量疾病类别标签；根据医生训练数据确定对应的第一疾病类别标签以及诊疗行为数据；根据当前疾病类别标签、全量疾病类别标签、第一疾病类别标签和诊疗行为数据进行模型训练，以得到病历数据处理模型。

可选的，上述方法还包括：根据历史病历数据确定目标患者的全量疾病类别；判断全量疾病类别与第一疾病类别之间是否存在重合类别；根据重合类别的判断结果以及历史病历数据确定特征事件；特征事件包含于预测就诊信息。

根据本公开的第二方面，提供一种识别就诊信息的装置，包括：第一类别确定模块，用于获取目标患者的预约挂号信息，根据预约挂号信息确定目标患者的患者疾病类别；第二类别确定模块，用于根据预约挂号信息确定目标患者对应的医生信息；医生信息包括第一疾病类别；病史数据确定模块，用于获取目标患者的历史病历数据，根据患者疾病类别与第一疾病类别从历史病历数据中确定与本次预约挂号相关的关联病史数据；结果确定模块，用于将关联病史数据作为本次预约挂号的预测就诊信息。

可选的，第一类别确定模块包括第一类别确定单元，用于根据预约挂号信息确定目标患者的疾病特征；获取预先构建的疾病类别模型；根据疾病特征和疾病类别模型确定患者疾病类别。

可选的，第一类别确定模块还包括第一模型构建单元，用于根据医学指南文件构建疾病树，根据疾病树构建疾病数据模型；确定疾病类别，根据疾病类别将同一疾病类别下的多个同类型疾病对应的疾病数据模型进行聚合处理，得到初始疾病类别模型；获取临床医疗数据，根据临床医疗数据对初始疾病类别模型进行填充处理，以得到疾病类别模型。

可选的，第一模型构建单元包括聚合处理子单元，用于确定多个同类型疾病的相同字段，并将相同字段作为关键字段；获取各同类型疾病中相同字段下的相同字段值；对多个相同字段值进行合并，以得到与各关键字段对应的关键字段值。

可选的，第一模型构建单元还包括模型填充子单元，用于构建样本病历数据集，并确定样本病历数据集中样本病历对应的医学编码；根据医学编码确定各样本病历对应的疾病类别；基于疾病类别并根据样本病历数据集确定初始疾病类别模型对应的附加关键字段；根据附加关键字段对初始疾病类别模型进行填充处理，以得到疾病类别模型。

可选的，第二类别确定模块包括第二类别确定单元，用于从预约挂号信息中确定医生标识，根据医生标识确定历史诊疗行为数据；确定历史诊疗行为数据对应的诊疗行为特征；获取疾病类别模型，根据诊疗行为特征和疾病类别模型确定第一疾病类别。

可选的，病史数据确定模块包括病史数据确定单元，用于获取预先构建的病历数据处理模型；将患者疾病类别、第一疾病类别和历史病历数据输入至病历数据处理模型；由病历数据处理模型根据患者疾病类别和第一疾病类别对历史病历数据进行重组处理，以从历史病历数据中确定关联病史数据。

可选的，病史数据确定模块还包括第二模型构建单元，用于获取训练数据；训练数据包括预约挂号训练数据、病史训练数据和医生训练数据；根据预约挂号训练数据确定对应的当前疾病类别标签，并根据病史训练数据确定全量疾病类别标签；根据医生训练数据确定对应的第一疾病类别标签以及诊疗行为数据；根据当前疾病类别标签、全量疾病类别标签、第一疾病类别标签和诊疗行为数据进行模型训练，以得到病历数据处理模型。

可选的，结果确定模块包括特征事件确定单元，用于根据历史病历数据确定目标患者的全量疾病类别；判断全量疾病类别与第一疾病类别之间是否存在重合类别；根据重合类别的判断结果以及历史病历数据确定特征事件；特征事件包含于预测就诊信息。

根据本公开的第三方面，提供一种电子设备，包括：处理器；以及存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现根据上述任意一项所述的识别就诊信息的方法。

根据本公开的第四方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现根据上述任意一项所述的识别就诊信息的方法。

本公开提供的技术方案可以包括以下有益效果：

本公开的示例性实施例中的识别就诊信息的方法，获取目标患者的预约挂号信息，根据预约挂号信息确定目标患者的患者疾病类别；根据预约挂号信息确定目标患者对应的医生信息；医生信息包括第一疾病类别；获取目标患者的历史病历数据，根据患者疾病类别与第一疾病类别对历史病历数据进行重组处理，以得到目标患者的关联病史数据。一方面，根据患者疾病类别和第一疾病类别可以从历史病历数据快速准确地定位出与本次预约挂号相关的关联病史数据，有助于提高病历数据的搜索效率。另一方面，根据患者疾病类别和第一疾病类别对历史病历数据进行重组处理以确定关联病史数据，可以避免在信息检索时可能造成的信息遗漏，以使得到的预测就诊信息更加全面。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示意性示出了根据本公开的示例性实施方式的识别就诊信息的方法的流程图；

图2示意性示出了根据本公开的示例性实施方式的根据预约挂号信息确定目标患者的患者疾病类别的流程图；

图3示意性示出了根据本公开的示例性实施方式的构建疾病类别模型的流程图；

图4示意性示出了根据本公开的示例性实施方式的对初始疾病类别模型进行填充处理以得到疾病类别模型的流程图；

图5示意性示出了根据本公开的示例性实施方式的根据预约挂号信息确定医生信息中包含的第一疾病类别的流程图；

图6示意性示出了根据本公开的示例性实施方式的根据患者疾病类别、第一疾病类别和历史病历数据确定关联病史数据的流程图；

图7示意性示出了根据本公开的示例性实施方式的根据历史病历数据确定特征事件的流程图；

图8示意性示出了根据本公开的示例性实施方式的识别就诊信息的装置的方框图；

图9示意性示出了根据本公开一示例性实施例的电子设备的框图；

图10示意性示出了根据本公开一示例性实施例的计算机可读存储介质的示意图。

具体实施方式

现在将参考附图更全面地描述示例实施例。然而，示例实施例能够以多种形式实施，且不应被理解为限于在此阐述的实施例；相反，提供这些实施例使得本公开将全面和完整，并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知结构、方法、装置、实现、材料或者操作以避免模糊本公开的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个软件硬化的模块中实现这些功能实体或功能实体的一部分，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

目前，我国医院建立的大数据平台，依靠数据治理与服务，通过数据标化、采集、汇聚、深度加工等流程，可有效辅助临床数据的分析、挖掘，甚至是多学科多维度的二次数据利用。例如，医生可以通过电子病历系统搜索患者ID，根据历次就诊日期，按照就诊维度查看患者历史诊疗数据。

在使用电子病历进行检索时，医生只能按照患者的就诊维度进行逐次查看，然而，医生需要了解的往往是某种或某类疾病的定向信息。如果患者所患疾病种类较多或病史较长，医生在需要了解某种或某类疾病的全貌、动态变化时将会非常费力耗时。另外，医生对患者既往病史的了解依赖于主动的信息检索及查阅，若医生年资尚轻，可能会忽略对某种或某类疾病病情判断有意义的细节信息。

基于此，在本示例实施例中，首先提供了一种识别就诊信息的方法，可以利用服务器来实现本公开的识别就诊信息的方法，也可以利用终端设备来实现本公开所述的方法，其中，本公开中描述的终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant，PDA)等移动终端，以及诸如台式计算机等固定终端。图1示意性示出了根据本公开的一些实施例的识别就诊信息的方法流程的示意图。参考图1，该识别就诊信息的方法可以包括以下步骤：

步骤S110，获取目标患者的预约挂号信息，根据预约挂号信息确定目标患者的患者疾病类别。

步骤S120，根据预约挂号信息确定目标患者对应的医生信息；医生信息包括第一疾病类别。

步骤S130，获取目标患者的历史病历数据，根据患者疾病类别与第一疾病类别从历史病历数据中确定与本次预约挂号相关的关联病史数据。

步骤S140，将关联病史数据作为本次预约挂号的预测就诊信息。

根据本示例实施例中的识别就诊信息的方法，一方面，根据患者疾病类别和第一疾病类别可以从历史病历数据快速准确地定位出与本次预约挂号相关的关联病史数据，有助于提高病历数据的搜索效率。另一方面，根据患者疾病类别和第一疾病类别对历史病历数据进行重组处理以确定关联病史数据，可以避免在信息检索时可能造成的信息遗漏，以使得到的预测就诊信息更加全面。

下面，将对本示例实施例中的识别就诊信息的方法进行进一步的说明。

在步骤S110中，获取目标患者的预约挂号信息，根据预约挂号信息确定目标患者的患者疾病类别。

在本公开的一些示例性实施方式中，预约挂号信息可以是目标患者在就诊前填写的患者相关信息，例如，预约挂号信息中可以包括患者主诉症状、挂号科室、挂号科室医生等。疾病类别，即病种，可以是对医学领域中所涵盖的所有疾病进行分类后得到的类别；举例而言，疾病类别可以包括内分泌、营养和代谢疾病、泌尿生殖系统疾病、外科疾病、神经系统疾病等等。患者疾病类别可以是目标患者在本次就诊中所对应的疾病类别。

在患者就诊之前，首先进行预约挂号程序，确定出与目标患者对应的预约挂号信息，预约挂号信息中可以包括患者标识、姓名、年龄等，并且，患者需要在预约挂号程序中选择预约挂号的挂号科室和挂号科室医生等。另外，患者还可以通过预约挂号程序中填写患者的主诉症状、体征等信息。因此，预约挂号信息中除了包括患者的基本信息外，还可以包括患者的主诉症状、体征等信息，挂号科室和挂号科室医生的相关信息等等。根据预约挂号信息中的主诉症状、体征表现等信息，并结合目标患者的年龄、性别等人口学信息，可以确定出目标患者的患者疾病类别。举例而言，患者主诉症状为：口渴、多尿，则该患者对应的患者疾病类别可能是“内分泌、营养和代谢疾病”、“泌尿生殖系统疾病”等。

根据本公开的一些示例性实施例，根据预约挂号信息确定目标患者的疾病特征；获取预先构建的疾病类别模型；根据疾病特征和疾病类别模型确定患者疾病类别。疾病特征可以是某一病种区别于其他病种的关键特征。疾病类别模型可以是用于根据患者的主诉症状和体征信息确定疾病类别的数据模型。疾病类别模型是一种数据模型，搞数据模型所描述的内容包括数据结构、数据操作和数据约束三部分内容。

参考图2，图2示意性示出了根据本公开的示例性实施方式的根据预约挂号信息确定目标患者的患者疾病类别的流程图。在步骤S210中，在获取到目标患者的预约挂号信息后，可以从预约挂号信息中提取目标患者的疾病特征。举例而言，可以从目标患者的主诉症状为胸部发闷、疼痛，从主诉症状中提取的疾病特征可以为“胸部发闷、疼痛”。在步骤S220中，获取预先构建的疾病类别模型。在步骤S230中，获取到预先构建的疾病类别模型之后，可以根据疾病特征和疾病类别模型确定出目标患者本次就诊对应的患者疾病类别。

根据本公开的一些示例性实施例，根据医学指南文件构建疾病树，根据疾病树构建疾病数据模型；确定疾病类别，根据疾病类别将同一疾病类别下的多个同类型疾病对应的疾病数据模型进行聚合处理，得到初始疾病类别模型；获取临床医疗数据，根据临床医疗数据对初始疾病类别模型进行填充处理，以得到疾病类别模型。

医学指南文件可以包含医学术语、疾病的症状表现、治疗方式以及相关治疗药物等信息。疾病树可以是根据医学指南文件对某一疾病进行分析而构建得到的一个树形结构。疾病类别，又称疾病分类，可以是具有相似特征的多种疾病所共同对应的类别。疾病数据模型，又称单一疾病模型，可以是某一种疾病对应的数据模型。初始疾病类别模型可以是某一类疾病在未结合特定的临床医疗数据时所对应的数据模型。临床医疗数据可以是根据针对某一类疾病的最新临床治疗行为确定出的数据。疾病类别模型可以是某一类疾病在结合特定的临床医疗数据后，并初始疾病类别模型进行增益补充后所得到的数据模型。

参考图3，图3示意性示出了根据本公开的示例性实施方式的构建疾病类别模型的流程图。在步骤S310中，获取医学指南文件，例如可以获取医学最新指南、临床指南以及各类医疗卫生标准等文件。通过对医学指南文件进行拆解，可以得到疾病树结构，以构建疾病树。举例而言，对于糖尿病-药物治疗-口服降糖药物，根据对《中国2型糖尿病防治指南(2017年版)》的拆解，口服降糖药物可分类为双胍类、磺脲类、格列奈类、二肽基肽酶4抑制剂(DPP-4抑制剂)、噻唑烷二酮药物(TZDs)、α-糖苷酶抑制剂、钠-葡萄糖协同转运蛋白2(sodium-dependent glucose transporters 2，SGLT-2)抑制剂等等；再根据世界卫生组织发布的《ATC解剖学治疗学及化学分类》，可继续对每类药物进行具体的化学名拆解，如双胍类可以包括苯乙双胍、二甲双胍、丁福明等。

国际疾病分类(International Classification of Diseases，ICD)可以是为了对世界各国人口的健康状况和分析死因的差别面对各种疾病作出的国际通用的统一分类。根据国际疾病分类可以确定出每一种疾病所对应的疾病类别。在步骤S320中，根据疾病类别可以将同一疾病类别下的多个同类型疾病对应的疾病数据模型进行聚合，如按照《国际疾病分类(ICD-10)临床版》(以下简称ICD-10)的疾病分类将上述单一疾病的模型进行聚合。例如，疾病分类为“内分泌、营养和代谢疾病”，该疾病分类可以包含甲状腺疾患、糖尿病等疾病。由于单一的疾病数据模型与疾病类别模型，从横向结构上是一致的，因此可以对属于同一疾病类别下的疾病数据模型进行聚合，得到初始疾病类别模型。例如，无论是甲状腺疾患还是糖尿病，均可以是从症状、体征、化验、检查等相同维度上进行构建的数据模型，因此可以对同一疾病类别下的疾病数据模型进行聚合。

单纯采用疾病类别模型的模型设计，虽然可以实现按照各类疾病的医学标准对医院数据进行加工重组，但是现实情况是：人体疾病复杂，医学知识更新快，而且一些临床经验性的诊疗行为未必可被机械性的模型所完全覆盖。例如，在我国，部分疾病的治疗可能会使用中药；一些医教研属性的综合医院，通常会开展一些疾病科研相关的前沿检测项目。医学指南文件，如临床指南等医学材料，并不能完全涵盖患者的多样性。因此，在步骤S330中，为了适应患者的多样性，需要通过一些真实的临床医疗数据作为训练数据集，对疾病数据模型进行进一步填充，以得到疾病类别模型。

根据本公开的一些示例性实施例，确定多个同类型疾病的相同字段，并将相同字段作为关键字段；获取各同类型疾病中相同字段下的相同字段值；对多个相同字段值进行合并，以得到与各关键字段对应的关键字段值。相同字段可以在多个同类型疾病下的单一的疾病数据模型中均包含的字段。关键字段可以是对相同字段进行聚合后得到的字段。相同字段值可以是同一疾病类别下的单一疾病数据模型中相同字段所对应的字段值。关键字段值可以是对多个相同字段值进行聚合处理后得到的字段值。

举例而言，甲状腺疾患、糖尿病均属于“内分泌、营养和代谢疾病”这一疾病类别，在获取到甲状腺疾患和糖尿病分别对应的疾病数据模型后，这两种疾病数据模型均可以包含症状、体征、化验、检查等维度，可以从这两种疾病数据模型中确定出症状、体征、化验、检查等相同字段，并将这些相同字段作为疾病类别模型对应的关键字段。同时获取这些疾病数据模型中相同字段分别对应的相同字段值，对这些相同字段值进行合并，得到与各关键字段分别对应的关键字段值。

根据本公开的一些示例性实施例，构建样本病历数据集，并确定样本病历数据集中样本病历对应的医学编码；根据医学编码确定各样本病历对应的疾病类别；基于疾病类别并根据样本病历数据集确定初始疾病类别模型对应的附加关键字段；根据附加关键字段对初始疾病类别模型进行填充处理，以得到疾病类别模型。样本病历数据集可以是将真实的临床诊疗数据作为数据基础，对临床诊疗数据进行数据预处理后得到的数据集。样本病历可以是样本病历数据集中包含的病历样本。医学编码可以是根据国际医学分类为样本病历添加的编码。附加关键字可以是基于样本病历数据集，并通过机器学习等手段，分析各疾病类型下的初始疾病类别模型所涉及的数据信息而确定出的字段。填充处理可以是初始疾病类别模型添加附加关键字等方式，以得到疾病类别模型的处理过程。

参考图4，图4示意性示出了根据本公开的示例性实施方式的对初始疾病类别模型进行填充处理以得到疾病类别模型的流程图。在步骤S410中，为了适应患者的多样性，在得到初始疾病类别模型后，可以进行训练数据集处理的步骤，以构建得到样本病历数据集，具体包括：采集一个或多个医疗机构的全科室、全病种、全维度的诊疗数据，并进行数据清洗、映射、脱敏、加密后进行深度加工，如对诊疗数据进行数据归一和结构化处理等，以得到训练数据集。

具体的，数据归一可以是指诊疗数据中由于各种原因导致的不规范、错误的字段信息，通过自然语言同义词表、医学术语的同义关联词表，在数据挖掘的算法指导下，对文字表达不同但含义相对一致的字段信息进行归一，为后续和上层应用提供正确且统一的信息表达。结构化处理可以是以医学信息学为基础，采用医学本体知识及自然语言理解人工智能技术，对以自由文本方式录入的非结构化数据(如文本病历数据等医疗文书)按照医学术语规范、病历书写规范进行结构化分析，抽取出文本病历中的关键词，如症状、体征、诊疗、化验等关键词的相关信息，并按照医学逻辑进行分类组织。在构建得到样本病历数据集后，可以确定出样本病历数据集中每份样本病历的医学编码。

在步骤S420中，根据样本病历的医学编码，即每份病历所涉及标准化ICD-10疾病分类，即疾病类别。在步骤S430中，根据疾病类别可以反向梳理出各疾病类别下对应的真实病历数据集，通过机器学习的手段，分析挖掘实际诊疗场景中各疾病分类所涉及的数据信息，得到与初始疾病类别模型对应的附加关键字段。在步骤S440中，根据确定出的附加关键字段对原有的初始疾病类别模型进行填充处理，以得到疾病类别模型。例如：在初始疾病类别模型中增加各类疾病的非典型症状、体征、非常规性用药方案等附加关键字段，根据这些附加关键字段对初始疾病类别模型进行填充。

需要说明的是，如果采用的样本病历数据集来自某单一医院，还可针对该医院构建专属的数据模型，根据此家医院的历史诊疗数据训练得到符合该医院临床特色的数据模型。

在步骤S120中，根据预约挂号信息确定目标患者对应的医生信息；医生信息包括第一疾病类别。

在本公开的一些示例性实施方式中，医生信息可以是目标患者在预约挂号程序中所填写的挂号医生所对应的信息；医生信息可以包括医生的基本信息，医生所诊疗的疾病类别等。第一疾病类别可以是医生信息中包含的医生进行诊疗行为时所涉及的疾病类别。例如，某一医生在历史诊疗行为数据高频出现慢性阻塞性肺疾病、哮喘等诊疗名称，则该医生对应的第一疾病类别中可以包括“呼吸系统疾病”。

由于在预约挂号程序中，患者将选择对应的挂号科室和挂号科室医生，这些信息均包含在预约挂号信息中。在获取到预约挂号信息后，可以从预约挂号信息中确定出与目标患者对应的医生信息。基于医生信息并通过疾病类别模型确定第一疾病类别。

根据本公开的一些示例性实施例，从预约挂号信息中确定医生标识，根据医生标识确定历史诊疗行为数据；确定历史诊疗行为数据对应的诊疗行为特征；获取疾病类别模型，根据诊疗行为特征和疾病类别模型确定第一疾病类别。医生标识可以是用于表示医生身份的标识，每个医生对应一个唯一的医生标识，例如，医生标识可以是医生的身份证号码。历史诊疗行为数据可以是根据某一医生历史出诊记录所生成的诊疗数据。诊疗行为特征可以是医生的历史诊疗行为数据中包含的病种的关键特征，诊疗行为特征可以用于标识某一医生所对应的疾病类别的特征，根据诊疗行为特征可以确定出某一医生所专长的疾病类别。

参考图5，图5示意性示出了根据本公开的示例性实施方式的根据预约挂号信息确定医生信息中包含的第一疾病类别的流程图。在步骤S510中，根据获取到的预约挂号信息可以确定出目标患者所对应医生的医生标识，根据确定出的医生标识，可以获取到与该医生对应的所有历史诊疗行为数据。在步骤S520中，从历史诊疗行为数据中提取对应的诊疗行为特征。在步骤S530中，在确定出诊疗行为特征后，可以根据诊疗行为特征以及疾病类别模型确定出医生所属科室对应的疾病类别以及医生个人所对应的第一疾病类别。

举例而言，获取医生所属科室的历史诊疗行为数据，可以从这些历史诊疗行为数据中确定出高频诊疗行为，通过疾病类别模型，确定出对应的疾病类别。例如，呼吸科病历中高频出现慢性阻塞性肺疾病、哮喘等诊疗名称，根据疾病类别模型可以将其确定为“呼吸系统疾病”的疾病类别。另外，一些通过名称不太容易直接定位的科室，也更适合通过这种方式定位疾病类别。例如，某一科室为干部一科，历史诊疗行为数据中高频出现脑梗死、癫痫等诊疗名称，通过数据智能分析可以推断出这是一个以神经系统诊疗为特色的科室，根据疾病类别模型可以为其确定“神经系统疾病”的疾病类别。另外，对于医生个人而言，根据某医生既往书写的病历中的高频诊疗，可通过疾病数据模型智能分析出该医生的专长，确定出对应的第一疾病类别。

在步骤S130中，获取目标患者的历史病历数据，根据患者疾病类别与第一疾病类别从历史病历数据中确定与本次预约挂号相关的关联病史数据。

在本公开的一些示例性实施方式中，历史病历数据可以是目标患者的所有历史就诊记录所对应的病历数据。本次预约挂号可以是目标患者当前进行的预约挂号行为。关联病史数据可以根据第一疾病类别和患者疾病类别，对历史病历数据进行数据挖掘、分析后，确定出的与本次预约挂号相关的病史数据。

在获取到目标患者的历史病历数据后，可以根据历史病历数据确定出目标患者的所有疾病类别，并结合目标患者的患者疾病类别对所有的历史病历数据进行数据挖掘和分析，对历史病历数据进行重组，从中确定出与本次特征事件关联性较大的关键病历数据，将其作为关联病史数据。

根据本公开的一些示例性实施例，获取预先构建的病历数据处理模型；将患者疾病类别、第一疾病类别和历史病历数据输入至病历数据处理模型；由病历数据处理模型根据患者疾病类别和第一疾病类别对历史病历数据进行重组处理，以从历史病历数据中确定关联病史数据。病历数据处理模型可以是根据目标患者的患者疾病类别、医生对应的第一疾病类别对历史病历数据进行分析和重组，以确定关联病史数据的模型。

参考图6，图6示意性示出了根据本公开的示例性实施方式的根据患者疾病类别、第一疾病类别和历史病历数据确定关联病史数据的流程图。在步骤S610中，在获取到历史病历数据后，可以获取预先构建的病历数据处理模型。在步骤S620中，将患者疾病类别、第一疾病类别和历史病历数据均输入至病历数据处理模型中。在步骤S630中，病历数据处理模型可以在真实场景下对目标患者的历史病历数据进行分析重组，以得到关联病史数据。在当次就诊事件发生之前，根据病历数据处理模型判断目标患者此次需要诊治的疾病类别；再通过病历数据处理模型中的疾病分类模块对该患者的历史病历数据进行复杂逻辑的归一、结构化处理，根据疾病数据模型及特征事件标签归纳重组历史病历数据，从历史病历数据中确定关联病史数据。

根据本公开的一些示例性实施例，获取训练数据；训练数据包括预约挂号训练数据、病史训练数据和医生训练数据；根据预约挂号训练数据确定对应的当前疾病类别标签，并根据病史训练数据确定全量疾病类别标签；根据医生训练数据确定对应的第一疾病类别标签以及诊疗行为数据；根据当前疾病类别标签、全量疾病类别标签、第一疾病类别标签和诊疗行为数据进行模型训练，以得到病历数据处理模型。

其中，训练数据可以是用于训练病历数据处理模型所采用的数据。预约挂号训练数据可以是在预约挂号程序中所生成的信息所组成的训练数据。病史训练数据可以是患者的所有历史病历所对应的数据。医生训练数据可以是医生所诊治疾病类别、所属科室对应的疾病类别以及医生的真实就诊行为等信息组成的训练数据。当前疾病类别标签可以是根据预约挂号训练数据确定出患者当前就诊所对应的疾病类别标签。全量疾病类别标签可以是根据历史病历数据确定患者的疾病类别标签。第一疾病类别标签可以是根据医生训练数据确定出的医生对应的疾病类别标签。诊疗行为数据可以是从医生训练数据中确定的真实诊疗行为数据。特征事件标签可以是特征事件对应的标签。

构建病历数据处理模型的步骤具体如下：获取训练数据，训练数据可以包括预约挂号训练数据、病史训练数据和医生训练数据添加对应的标签。举例而言，1)通过疾病类别模型对预约挂号训练数据添加当前疾病类别标签；如：患者主诉口渴、多尿，可以对应添加“内分泌、营养和代谢疾病”、“泌尿生殖系统疾病”的疾病类别标签。2)通过分析患者所有的所有病史训练数据，可以通过疾病类别模型对应添加一种或多种确定的全量疾病类别标签。另外，通过分析患者的病史训练数据，还可以为患者添加对应的特征性事件标签。3)通过疾病类别模型对医生训练数据进行分析处理，可以对医生训练数据添加对应的第一疾病类别，并获取医生训练数据中包含的诊疗行为数据。

根据第一疾病类别标签和当前疾病类别标签可以确定出与预约挂号信息对应的特征事件标签。在得到上述标签后，可以结合诊疗行为数据进行模型训练，例如，训练得到一个决策树算法模型，即病历数据处理模型。另外，病历数据处理模型还可以是其他类型的多分类模型，本公开对此不作任何特殊限定。

在步骤S140中，将关联病史数据作为本次预约挂号的预测就诊信息。

在本公开的一些示例性实施方式中，预测就诊信息可以是根据本次预约挂号信息、医生信息从历史病历数据中筛选出的与目标患者的本次预约挂号相关的就诊意图相关信息。根据预测就诊信息医生可以预先了解患者本次预约挂号的相关就诊意图。

在从历史病历数据中确定出关联病史数据后，可以将关联病史数据作为预测就诊信息。将得到的预测就诊信息发送给医生，在医生未问诊患者之前，向医生推送定向场景化的病历数据，以便医生可以快速定位病历信息，以提高诊疗效率，并且避免医生在阅读多份历史病历数据时可能造成的信息遗漏。

根据本公开的一些示例性实施例，根据历史病历数据确定目标患者的全量疾病类别；判断全量疾病类别与第一疾病类别之间是否存在重合类别；根据重合类别的判断结果以及历史病历数据确定特征事件；特征事件包含于预测就诊信息。特征事件可以是目标患者本次对应的特征性事件，特征事件可以简单划分为初诊、复诊等，也可以细分为术后复查、续方某种药物等等。全量疾病类别可以是根据目标患者的历史病历数据以及疾病类别模型确定出的与目标患者对应的所有疾病类别，即目标患者历史所就诊的疾病类别。重合类别可以是全量疾病类别与第一疾病类别两种疾病类别中的相同疾病类别。

参考图7，图7示意性示出了根据本公开的示例性实施方式的根据历史病历数据确定特征事件的流程图。在步骤S710中，获取目标患者的所有历史病历数据，可以将历史病历数据输入至疾病类别模型中，由疾病类别模型确定出历史病历数据中包含的全量疾病类别，全量疾病类别不包括本次预约挂号中所包含的患者疾病类别。待本次就诊结束之后，如果患者确诊的疾病属于患者疾病类别，则将患者疾病类别添加至全量疾病类别中，以对全量疾病类别进行更新。例如，目标患者的历史病历数据中诊疗出2型糖尿病、冠心病、心房颤动等疾病，则根据历史病历数据，疾病类别模型将输出“内分泌、营养和代谢疾病”、“循环系统疾病”等疾病类别，作为全量疾病类别。

在步骤S720中，在确定出全量疾病类别后，将全量疾病类别与医生对应的第一疾病类别进行对比，判断两者之间是否存在重合类别，得到重合类别的判断结果。在步骤S730中，根据得到重合类别的判断结果和历史病历数据可以得到特征事件，特征事件可以精简地反映出本次就诊的主要目的。如果判断结果中显示两者之间未存在重合类别，则可以将特征事件确定为初诊。举例而言，目标患者本次就诊时，在预约挂号程序中主诉症状为胸痛，而目标患者在此之前并未因为胸痛这一症状就医，即目标患者的全量疾病类别中并未包括“胸痛”对应的疾病类别，因此在本次就诊中，可以将目标患者的特征事件确定为初诊。如果判断结果中显示两者之间存在重合类别，则可以将特征事件确定为复诊。对于“复诊”这一特征事件，可以结合历史病历数据进行进一步细化。

举例而言，如果历史病历数据中包含用药记录，可以对于目标患者的历史用药记录，分析患者的处方数据，根据疾病特征、服药规律、药品类型等信息进行综合判断，可以确定出该患者长期服用的药品种类，并计算当前时刻目标患者所服用的这些药品的余量，如果某一药品的余量已达到续药标准，则可以确定该目标患者的特征事件为“续方某种药”。另外，如果历史病历数据中包含手术记录或其他操作记录，则可以分析该患者一个指定时间段内的手术记录或操作记录，并据此将目标患者的特征事件确定为“术后复查”。

进一步地，本公开将结合一个具体应用场景对上述识别就诊信息的方法进行说明。一位目标患者的预约挂号信息包括：主诉为：“血糖高”，历史病历数据中曾出现“2型糖尿病、2型糖尿病性周围神经病、慢性阻塞性肺疾病、哮喘、尿道结石”等疾病类别，长期服用“二甲双胍”，所挂号科室为“内分泌科”，此时正在等待就诊，通过上述的识别就诊信息的方法，可以确定出下述信息。

1)确定患者疾病类别。对预约挂号信息中的患者主诉信息对应的文本进行文本解析，可以得到患者疾病类别为“内分泌、营养和代谢疾病”。

2)确定历史病历数据对应的全量疾病类别标签。根据患者的历史病历数据可以解析出患者的全量疾病类别为“内分泌、营养和代谢疾病”、“神经系统疾病”“呼吸系统疾病”、“泌尿生殖系统疾病”；根据疾病特征、服药规律、药品类型综合判断二甲双胍为长期用药品种，计算其末次处方，该患者手中二甲双胍的余量不足三天，可以确定特征事件标签为“续方二甲双胍”。

3)确定第一疾病类别。从预约挂号信息中获取医生标识，并根据医生标识获取该医生的相关信息，对医生的科室数据以及医生历史诊疗行为数据进行解析，可以确定出第一疾病类别为“内分泌、营养和代谢疾病”；由于患者病史标签与医生标签有重叠，打标签“复诊”。

根据就诊意图识别模型的运算，推导出患者本次就诊的目的是诊治“内分泌、营养和代谢疾病”，性质为“复诊”，可能需要“续方二甲双胍”。根据患者标识，根据疾病类别数据模型的分析处理，可以汇集历次就诊中与“内分泌、营养和代谢疾病”相关的数据，进行归纳重组展示。以时间线索，用数据变化来展示患者病情的动态演变，如相关症状体征(烦渴、多饮等)，相关的化验(糖化血红蛋白、血糖、血脂、尿酸等)，相关检查(血管超声、冠脉CTA等)、相关药物(二甲双胍等)，并突出展示二甲双胍既往的用法用量，方便医生查看病情变化及处方信息，通过上述方法可以重点定位出通过本次预约挂号进行就诊相关联的病历数据，并将全面的预测就诊信息呈现给医生，避免出现信息遗漏且提高诊疗效率。

综上所述，本公开的识别就诊信息的方法，获取目标患者的预约挂号信息，根据预约挂号信息确定目标患者的患者疾病类别；根据预约挂号信息确定目标患者对应的医生信息；医生信息包括第一疾病类别；获取目标患者的历史病历数据，根据患者疾病类别与第一疾病类别从历史病历数据中确定与本次预约挂号相关的关联病史数据；将关联病史数据作为本次预约挂号的预测就诊信息。一方面，根据患者疾病类别和第一疾病类别可以从历史病历数据快速准确地定位出与本次预约挂号相关的关联病史数据，有助于提高病历数据搜索效率。另一方面，通过构建疾病类别模型和病历数据处理模型，可以对历史病历数据进行重组，方便查看患者对应的疾病类别的病情变化，以便更准确、清晰地查看病史信息。又一方面，根据患者疾病类别和第一疾病类别对历史病历数据进行重组处理以从历史病历数据中确定关联病史数据，可以避免在信息检索时可能造成的信息遗漏，以使得到的关联病史数据更加全面。

需要说明的是，尽管在附图中以特定顺序描述了本发明中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

此外，在本示例实施例中，还提供了一种识别就诊信息的装置。参考图8，该识别就诊信息的装置800可以包括：第一类别确定模块810、第二类别确定模块820、病史数据确定模块830以及结果确定模块840。

具体的，第一类别确定模块810用于获取目标患者的预约挂号信息，根据预约挂号信息确定目标患者的患者疾病类别；第二类别确定模块820用于根据预约挂号信息确定目标患者对应的医生信息；医生信息包括第一疾病类别；病史数据确定模块830用于获取目标患者的历史病历数据，根据患者疾病类别与第一疾病类别从历史病历数据中确定与本次预约挂号相关的关联病史数据；结果确定模块840用于将关联病史数据作为本次预约挂号的预测就诊信息。

在本公开的一种示例性实施方案中，第一类别确定模块包括第一类别确定单元，用于根据预约挂号信息确定目标患者的疾病特征；获取预先构建的疾病类别模型；根据疾病特征和疾病类别模型确定患者疾病类别。

在本公开的一种示例性实施方案中，第一类别确定模块还包括第一模型构建单元，用于根据医学指南文件构建疾病树，根据疾病树构建疾病数据模型；确定疾病类别，根据疾病类别将同一疾病类别下的多个同类型疾病对应的疾病数据模型进行聚合处理，得到初始疾病类别模型；获取临床医疗数据，根据临床医疗数据对初始疾病类别模型进行填充处理，以得到疾病类别模型。

在本公开的一种示例性实施方案中，第一模型构建单元包括聚合处理子单元，用于确定多个同类型疾病的相同字段，并将相同字段作为关键字段；获取各同类型疾病中相同字段下的相同字段值；对多个相同字段值进行合并，以得到与各关键字段对应的关键字段值。

在本公开的一种示例性实施方案中，第一模型构建单元还包括模型填充子单元，用于构建样本病历数据集，并确定样本病历数据集中样本病历对应的医学编码；根据医学编码确定各样本病历对应的疾病类别；基于疾病类别并根据样本病历数据集确定初始疾病类别模型对应的附加关键字段；根据附加关键字段对初始疾病类别模型进行填充处理，以得到疾病类别模型。

在本公开的一种示例性实施方案中，第二类别确定模块包括第二类别确定单元，用于从预约挂号信息中确定医生标识，根据医生标识确定历史诊疗行为数据；确定历史诊疗行为数据对应的诊疗行为特征；获取疾病类别模型，根据诊疗行为特征和疾病类别模型确定第一疾病类别。

在本公开的一种示例性实施方案中，病史数据确定模块包括病史数据确定单元，用于获取预先构建的病历数据处理模型；将患者疾病类别、第一疾病类别和历史病历数据输入至病历数据处理模型；由病历数据处理模型根据患者疾病类别和第一疾病类别对历史病历数据进行重组处理，以从历史病历数据中确定关联病史数据。

在本公开的一种示例性实施方案中，病史数据确定模块还包括第二模型构建单元，用于获取训练数据；训练数据包括预约挂号训练数据、病史训练数据和医生训练数据；根据预约挂号训练数据确定对应的当前疾病类别标签，并根据病史训练数据确定全量疾病类别标签；根据医生训练数据确定对应的第一疾病类别标签以及诊疗行为数据；根据当前疾病类别标签、全量疾病类别标签、第一疾病类别标签和诊疗行为数据进行模型训练，以得到病历数据处理模型。

在本公开的一种示例性实施方案中，结果确定模块包括特征事件确定单元，用于根据历史病历数据确定目标患者的全量疾病类别；判断全量疾病类别与第一疾病类别之间是否存在重合类别；根据重合类别的判断结果以及历史病历数据确定特征事件；特征事件包含于预测就诊信息。

上述中各识别就诊信息的装置的虚拟模块的具体细节已经在对应的识别就诊信息的方法中进行了详细的描述，因此此处不再赘述。

应当注意，尽管在上文详细描述中提及了识别就诊信息的装置的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外，在本公开的示例性实施例中，还提供了一种能够实现上述方法的电子设备。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施例、完全的软件实施例(包括固件、微代码等)，或硬件和软件方面结合的实施例，这里可以统称为“电路”、“模块”或“系统”。

下面参考图9来描述根据本发明的这种实施例的电子设备900。图9显示的电子设备900仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图9所示，电子设备900以通用计算设备的形式表现。电子设备900的组件可以包括但不限于：上述至少一个处理单元910、上述至少一个存储单元920、连接不同系统组件(包括存储单元920和处理单元910)的总线930、显示单元940。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元910执行，使得所述处理单元910执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的步骤。

存储单元920可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)921和/或高速缓存存储单元922，还可以进一步包括只读存储单元(ROM)923。

存储单元920可以包括具有一组(至少一个)程序模块925的程序/实用工具924，这样的程序模块925包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线930可以表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备900也可以与一个或多个外部设备970(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备900交互的设备通信，和/或与使得该电子设备900能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口950进行。并且，电子设备900还可以通过网络适配器960与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器960通过总线930与电子设备900的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备900使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施例的描述，本领域的技术人员易于理解，这里描述的示例实施例可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。

在本公开的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的步骤。

参考图10所示，描述了根据本发明的实施例的用于实现上述方法的程序产品1000，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

此外，上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。

Claims

1.一种识别就诊信息的方法，其特征在于，包括：

获取目标患者的预约挂号信息，根据所述预约挂号信息确定所述目标患者的患者疾病类别；

根据所述预约挂号信息确定所述目标患者对应的医生信息；所述医生信息包括第一疾病类别；

获取所述目标患者的历史病历数据，根据所述患者疾病类别与所述第一疾病类别从所述历史病历数据中确定与本次预约挂号相关的关联病史数据；

将所述关联病史数据作为所述本次预约挂号的预测就诊信息。

2.根据权利要求1所述的方法，其特征在于，所述根据所述预约挂号信息确定所述目标患者的患者疾病类别，包括：

根据所述预约挂号信息确定所述目标患者的疾病特征；

获取预先构建的疾病类别模型；

根据所述疾病特征和所述疾病类别模型确定所述患者疾病类别。

3.根据权利要求2所述的方法，其特征在于，在所述获取预先构建的疾病类别模型之前，所述方法还包括：

根据医学指南文件构建疾病树，根据所述疾病树构建疾病数据模型；

确定疾病类别，根据所述疾病类别将同一疾病类别下的多个同类型疾病对应的疾病数据模型进行聚合处理，得到初始疾病类别模型；

获取临床医疗数据，根据所述临床医疗数据对所述初始疾病类别模型进行填充处理，以得到所述疾病类别模型。

4.根据权利要求3所述的方法，其特征在于，所述根据所述疾病类别将同一疾病类别下的多个同类型疾病对应的疾病数据模型进行聚合处理，包括：

确定多个所述同类型疾病的相同字段，并将所述相同字段作为关键字段；

获取各所述同类型疾病中所述相同字段下的相同字段值；

对多个所述相同字段值进行合并，以得到与各所述关键字段对应的关键字段值。

5.根据权利要求3所述的方法，其特征在于，所述根据所述临床医疗数据对所述初始疾病类别模型进行填充处理，以得到所述疾病类别模型，包括：

构建样本病历数据集，并确定所述样本病历数据集中样本病历对应的医学编码；

根据所述医学编码确定各所述样本病历对应的疾病类别；

基于所述疾病类别并根据所述样本病历数据集确定所述初始疾病类别模型对应的附加关键字段；

根据所述附加关键字段对所述初始疾病类别模型进行填充处理，以得到所述疾病类别模型。

6.根据权利要求1所述的方法，其特征在于，所述根据所述预约挂号信息确定所述目标患者对应的医生信息，包括：

从所述预约挂号信息中确定医生标识，根据所述医生标识确定历史诊疗行为数据；

确定所述历史诊疗行为数据对应的诊疗行为特征；

获取疾病类别模型，根据所述诊疗行为特征和所述疾病类别模型确定所述第一疾病类别。

7.根据权利要求1所述的方法，其特征在于，所述根据所述患者疾病类别与所述第一疾病类别从所述历史病历数据中确定与本次预约挂号相关的关联病史数据，包括：

获取预先构建的病历数据处理模型；

将所述患者疾病类别、所述第一疾病类别和所述历史病历数据输入至所述病历数据处理模型；

由所述病历数据处理模型根据所述患者疾病类别和所述第一疾病类别对所述历史病历数据进行重组处理，以从所述历史病历数据中确定所述关联病史数据。

8.根据权利要求7所述的方法，其特征在于，所述病历数据处理模型通过下述方式训练得到：

获取训练数据；所述训练数据包括预约挂号训练数据、病史训练数据和医生训练数据；

根据所述预约挂号训练数据确定对应的当前疾病类别标签，并根据所述病史训练数据确定全量疾病类别标签；

根据所述医生训练数据确定对应的第一疾病类别标签以及诊疗行为数据；

根据所述当前疾病类别标签、所述全量疾病类别标签、所述第一疾病类别标签和所述诊疗行为数据进行模型训练，以得到所述病历数据处理模型。

9.根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据所述历史病历数据确定所述目标患者的全量疾病类别；

判断所述全量疾病类别与所述第一疾病类别之间是否存在重合类别；

根据所述重合类别的判断结果确定特征事件；所述特征事件包含于所述预测就诊信息。

10.一种识别就诊信息的装置，其特征在于，包括：

第一类别确定模块，用于获取目标患者的预约挂号信息，根据所述预约挂号信息确定所述目标患者的患者疾病类别；

第二类别确定模块，用于根据所述预约挂号信息确定所述目标患者对应的医生信息；所述医生信息包括第一疾病类别；

病史数据确定模块，用于获取所述目标患者的历史病历数据，根据所述患者疾病类别与所述第一疾病类别从所述历史病历数据中确定与本次预约挂号相关的关联病史数据；

结果确定模块，用于将所述关联病史数据作为所述本次预约挂号的预测就诊信息。

11.一种电子设备，其特征在于，包括：

处理器；以及

存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现根据权利要求1至9中任一项所述的识别就诊信息的方法。

12.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现根据权利要求1至9中任一项所述的识别就诊信息的方法。