CN110428891A

CN110428891A - 一种就诊意图的处理方法、装置及设备

Info

Publication number: CN110428891A
Application number: CN201910699975.0A
Authority: CN
Inventors: 周佳; 孙钟前; 杨巍; 胡海峰
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2019-07-31
Filing date: 2019-07-31
Publication date: 2019-11-08

Abstract

本发明公开了一种就诊意图的处理方法、装置、设备及存储介质。其中，所述方法包括：获取病例；对所述病例进行特征抽取，得到对应的病例特征；基于所述病例特征确定所述病例的类型；当确定所述病例的类型为非诊疗类时，通过分类模型对所述病例特征进行分类处理，得到所述病例属于所述非诊疗类所包含的各子类的判断结果；基于所述各子类的判断结果，识别所述病例对应的就诊意图。通过本发明，能够自动化和准确地识别就诊对象的就诊意图。

Description

一种就诊意图的处理方法、装置及设备

技术领域

本发明涉及人工智能(AI，Artificial Intelligence)领域中的智慧医疗技术，尤其涉及一种就诊意图的处理方法、装置、设备及存储介质。

背景技术

智慧医疗技术是AI技术领域中的一个分支，其目的是利用机器根据先验的知识进行学习，从而具有对视频、图像和文本等数据进行分类和判断的逻辑能力。

医疗领域中的医疗管理技术，是智慧医疗技术的典型应用，合理规划和充分利用医院的现有资源、有效分配患者就诊在实际的应用中具有重要意义。

随着就诊患者的数量不断增多，分析医院既往就诊患者的分布及来院意图，对于医院对资源的合理运用和调配来说具有很高的应用价值，然而相关技术缺乏有效的识别就诊患者来院意图的技术方案。

发明内容

本发明实施例提供一种就诊意图的处理方法、装置、设备及存储介质，能够自动化和准确地识别就诊对象的就诊意图。

本发明实施例的技术方案是这样实现的：

本发明实施例提供一种就诊意图的处理方法，包括：

获取病例；

对所述病例进行特征抽取，得到对应的病例特征；

基于所述病例特征确定所述病例的类型；

当确定所述病例的类型为非诊疗类时，通过分类模型对所述病例特征进行分类处理，得到所述病例属于所述非诊疗类所包含的各子类的判断结果；

基于所述各子类的判断结果，识别所述病例对应的就诊意图。

上述方案中，所述基于所述各子类的判断结果，识别所述病例对应的就诊意图，包括：

将所述各子类的判断结果进行合并，得到合并结果；

基于所述合并结果，识别所述病例对应的就诊意图。

上述方案中，所述基于所述合并结果，识别所述病例对应的就诊意图，包括：

基于所述合并结果，将确定所述合并结果为是的各子类按照优先级顺序进行输出；

基于输出的结果，将优先级别最高的子类对应的就诊意图，识别为所述病例对应的就诊意图。

本发明实施例还提供一种就诊意图的处理装置，包括：

获取单元，用于获取病例；

抽取单元，用于对所述病例进行特征抽取，得到对应的病例特征；

确定单元，用于基于所述病例特征确定所述病例的类型；

分类单元，用于当确定所述病例的类型为非诊疗类时，通过分类模型对所述病例特征进行分类处理，得到所述病例属于所述非诊疗类所包含的各子类的判断结果；

识别单元，用于基于所述各子类的判断结果，识别所述病例对应的就诊意图。

上述方案中，所述确定单元，具体用于：

通过所述分类模型对所述病例特征对应的特征向量进行分类处理，得到所述分类模型输出的所述病例为诊疗类的概率；

当得到的所述概率大于第一概率阈值时，确定所述病例的类型为诊疗类；

当得到的所述概率小于等于所述第一概率阈值时，确定所述病例的类型为非诊疗类。

上述方案中，所述抽取单元，具体用于以下至少之一：

对所述病例中的症状进行识别，以及对识别出的所述症状进行统计，得到对应的症状数量；

对所述病例中的部位词进行识别，以及对识别出的所述部位词进行统计，得到对应的部位词数量；

对所述病例中包括的字数进行统计，得到对应的病例长度；

对所述病例中具有分类特征的关键词或片段命中词进行筛选，得到对应的病例关键词或病例片段命中词。

上述方案中，所述分类单元，具体用于：

分别通过至少两个所述分类模型对所述病例特征对应的特征向量进行分类处理，得到所述至少两个分类模型各自输出的所述病例属于各子类的概率；

当得到的所述概率大于第二概率阈值时，确定所述病例属于对应所述概率的子类；

其中，所述子类包括以下至少之一：复诊类；检查类；开药类；信息不全类。

上述方案中，所述分类单元，还具体用于：

按照所述复诊类、检查类、开药类和信息不全类的顺序，分别通过所述分类模型对所述病例特征对应的特征向量进行分类处理，对应得到所述病例属于复诊类、检查类、开药类和信息不全类的概率。

上述方案中，所述识别单元，具体用于：

将所述各子类的判断结果进行合并，得到合并结果；

基于所述合并结果，识别所述病例对应的就诊意图。

上述方案中，所述识别单元，还具体用于：

上述方案中，所述识别单元，还用于：

当确定所述病例的类型为诊疗类时，识别所述病例对应的就诊意图为诊疗。

上述方案中，所述就诊意图的处理装置还包括：

构建单元，用于在所述识别单元基于所述各子类的判断结果，识别所述病例对应的就诊意图之后，基于所述病例对应的就诊意图，构建针对就诊对象的就诊分布结构图；

分配单元，用于基于所述就诊分布结构图，为所述就诊对象分配相应的医疗资源。

上述方案中，所述就诊意图的处理装置还包括：

解构单元，用于在所述识别单元基于所述各子类的判断结果，识别所述病例对应的就诊意图之后，基于所述病例对应的就诊意图，对不同类型的病例进行解构，以辅助进行疾病的预测和诊断。

本发明实施例还提供一种就诊意图的处理设备，包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现本发明实施例提供的就诊意图的处理方法。

本发明实施例还提供一种存储介质，存储有可执行指令，所述可执行指令被执行时，用于实现本发明实施例提供的就诊意图的处理方法。

应用本发明上述实施例具有以下有益效果：

应用本发明实施例提供的就诊意图的处理方法，通过获取病例，对病例进行特征抽取得到病例特征，基于病例特征确定病例的类型，然后基于病例的类型进一步识别病例对应的就诊意图。如此，利用病例的文本自身的特征，能够自动化和准确地识别病例对应的就诊对象的就诊意图，为后续的病例结构化、辅助诊断等提供可用数据，从而提升医疗管理的效率。

附图说明

图1为本发明实施例提供的就诊意图的处理系统的一个可选的应用场景示意图；

图2A为本发明实施例提供的就诊意图的处理设备的一个可选的结构示意图；

图2B为本发明实施例提供的就诊意图的处理装置的一个可选的结构示意图；

图3为本发明实施例提供的就诊意图的处理方法的一个可选的流程示意图；

图4为本发明实施例提供的就诊意图的处理方法的另一个可选的流程示意图；

图5为本发明实施例提供的就诊患者的分布数据的一个可选的分布结构显示示意图；

图6为本发明实施例提供的就诊意图的处理方法的另一个可选的流程示意图；

图7为本发明实施例提供的就诊意图的处理方法的一个可选的原理结构示意图。

具体实施方式

为了使本发明实施例的目的、技术方案和优点更加清楚，下面结合附图对本发明作进一步地详细描述，所描述的实施例不应视为对本发明的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且本发明实施例所记载的各技术方案之间，可以在不冲突的情况下相互结合。

除非另有定义，本发明实施例所使用的所有的技术和科学术语与属于本发明实施例的技术领域的技术人员通常理解的含义相同。本发明中所使用的术语只是为了描述具体的实施例的目的，不是旨在限制本发明。

对本发明实施例进行进一步详细说明之前，先对本发明实施例中涉及的名词和术语进行说明，本发明实施例中涉及的名词和术语适用于如下的解释。

1)病例，是指某种疾病的例子，例如，某个人或生物患过某种疾病，就是这种疾病的病例，通常病例需要按照规范要求进行书写。

2)就诊意图，可以理解为就诊对象比如患者，来医院进行就诊的目的。例如，某患者在A医院被诊断出患有肾结石，然而该患者对A医院的诊断结果有些怀疑，因此，该患者前往B医院进行进一步检查，以确诊是否患有肾结石，此时，可将该患者来B医院的目的，即进一步检查，称为该患者的就诊意图。

目前，我国部分医院尤其是一些三甲医院，日均门诊量通常会突破5000人次，且不同医院、不同科室的患者数量分配也是极其不均匀的，例如，某些科室的就诊患者中，有很大比例是单纯的开药或检查，而无需门诊医生进行诊断，然而有时对于这种类型的患者的分配并不合理。这样将导致医疗资源非常紧张，因此，合理规划和充分利用医疗资源，比如医生资源和手术室资源等，以及有效分配患者就诊，在实际应用中具有重要的意义。

对于一些硬件资源比如实验室检查等的分配来说，可提前进行预估，这对于增加或减少资源的投入，充分利用现有资源具有重要的参考价值。因此，分析医院既往就诊患者的分布及来院意图，对于医院对资源的合理运用和调配来说具有很高的应用价值。然而，对于如何快速和准确地识别就诊患者的就诊意图，相关技术缺乏有效解决方案。

为至少解决相关技术的上述技术问题，本发明实施例提供的就诊意图的处理方法、装置、设备及存储介质，能够根据病例的文本自身的特征，自动化和准确地识别病例对应的就诊意图。

下面说明本发明实施例提供的就诊意图的处理设备的示例性应用。本发明实施例提供的就诊意图的处理设备可以是服务器，例如部署在云端的服务器，根据各种具有医疗属性的机构，例如医院提交的患者的病例，向医院提供远程的识别病例对应的患者的就诊意图的功能；也可以是医疗诊断设备，例如可以是一种或多种疾病(例如糖尿病、高血压和心脑血管疾病等)的诊断设备，能够通过基于患者的病例识别患者的就诊意图，对不同类型的病例进行解构，以辅助进行疾病的预测和诊断；甚至可以是手持终端等设备，比如平板电脑、笔记本电脑，当然也可以是台式计算机等固定终端设备。

下面将参考附图对本发明实施例的就诊意图的处理系统的示例性应用进行说明。作为示例，参见图1，图1为本发明实施例提供的就诊意图的处理系统10的一个可选的应用场景示意图，终端100可以位于各种具有医疗属性的机构(例如医院、医学研究院)中，可以被用来收集患者的病例。例如，可以通过终端100自身的采集装置来收集患者的病例，或者，也可以通过其他的采集设备400来收集患者的病例。

在一些实施例中，终端100用于本地执行本发明实施例提供的就诊意图的处理方法，来识别患者的病例对应的就诊意图，将识别到的就诊意图的结果以图形化的方式输出，从而可供医生、研究人员进行疾病的预测和诊断的研究，例如，可以根据识别到的病例对应的就诊意图，对不同类型的病例进行解构，确定不同类型的病例在形态学上的表现，进而来辅助预测和诊断患者是否有可能患有某种疾病(例如糖尿病)及其风险。

当然，终端100也可以通过网络200向服务器300发送患者的病例，并调用服务器300提供的远程识别患者的就诊意图的功能，服务器300通过执行本发明实施例提供的就诊意图的处理方法，具体地，在获取到患者的病例之后，对病例进行特征抽取得到对应的病例特征，然后基于病例特征确定病例的类型，当确定病例的类型为诊疗类时，识别病例对应的就诊意图为诊疗；当确定病例的类型为非诊疗类时，通过分类模型对病例特征进行分类处理，得到病例属于非诊疗类所包含的各子类的判断结果，基于各子类的判断结果，来识别病例对应的就诊意图，最终将识别到的就诊意图的结果返回给终端100，以供医生、研究人员进行疾病的预测和诊断的研究。

这里，终端100可以基于各种无线通信方式，或者有线通信方式，通过网络200与服务器300连接。网络200可以是广域网或者局域网，又或者是二者的组合，使用无线链路实现数据传输。

终端100可以在图形界面110中显示就诊意图的处理过程中的各种中间结果和最终结果，例如，对识别到的病例对应的就诊意图进行显示。

继续说明本发明实施例提供的就诊意图的处理设备的结构，就诊意图的处理设备可以是各种终端，例如可以是医疗诊断设备、台式计算机等，也可以是如图1示出的服务器300。

现在将参考附图描述实现本发明实施例的就诊意图的处理设备，图2A为本发明实施例提供的就诊意图的处理设备的一个可选的结构示意图，可以理解，图2A仅仅示出了就诊意图的处理设备的示例性结构而非全部结构，根据需要可以实施图2A示出的部分结构或全部结构，不应对本发明实施例的功能和使用范围带来任何限制。

参见图2A，本发明实施例提供的就诊意图的处理设备20包括：至少一个处理器201、存储器202、用户接口203和至少一个网络接口204。就诊意图的处理设备20中的各个组件通过总线系统205耦合在一起。可以理解，总线系统205用于实现这些组件之间的连接通信。总线系统205除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图2A中将各种总线都标为总线系统205。

其中，用户接口203可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。

可以理解，存储器202可以是易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。

本发明实施例中的存储器202用于存储各种类型的数据以支持就诊意图的处理设备20的操作。这些数据的示例包括：用于在就诊意图的处理设备20上操作的任何可执行指令，如计算机程序，包括可执行程序和操作系统，实现本发明实施例的就诊意图的处理方法的程序可以包含在可执行指令中。

处理器201可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，本发明实施例提供的就诊意图的处理方法的各步骤可以通过处理器201中的硬件的集成逻辑电路完成。上述的集成逻辑电路可以是通用处理器、数字信号处理器(DSP，Digital SignalProcessor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器201可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。

本发明实施例提供的就诊意图的处理方法的各步骤可以通过软件模块完成，软件模块可以位于存储介质中，存储介质位于存储器202中，处理器201执行存储器202中的软件模块，结合其硬件完成本发明实施例提供的就诊意图的处理方法的步骤。

例如，作为软件模块的示例，存储器202中可以包括本发明实施例提供的就诊意图的处理装置30，其包括一系列的软件模块，例如获取单元31、抽取单元32、确定单元33、分类单元34和识别单元35，参见图2B所示的本发明实施例提供的就诊意图的处理装置30的一个可选的结构示意图，将在下文说明上述各个单元的功能。

至此，已经按照其功能描述了本发明实施例提供的就诊意图的处理设备的结构，以及就诊意图的处理系统的示例性应用场景。接下来对本发明实施例提供的就诊意图的处理方法的实现进行说明。

参见图3，图3为本发明实施例提供的就诊意图的处理方法的一个可选的流程示意图，根据上文可以理解，本发明实施例提供的就诊意图的处理方法可以应用于各种类型的就诊意图的处理设备，例如医疗诊断设备、台式计算机和服务器中。下面以就诊意图的处理设备为服务器为例，即由服务器执行本发明实施例提供的就诊意图的处理方法为例说明图3示出的步骤。

步骤301：获取病例。

下面对病例的获取方式进行说明。在一些实施例中，服务器可采用如下方式获取病例：接收终端通过调用采集装置获取到的病例。

具体来说，服务器获取的病例，可以是由终端通过调用自身的采集装置，例如安装于终端上的摄像头来采集患者的病例，然后将采集到的患者的病例发送给服务器；还可以是通过调用部署在上述终端所处的环境中的其他采集装置，例如与上述终端处于同一环境下的照相机，由照相机来采集患者的病例，然后将采集到的患者的病例直接发送给服务器。当然，照相机还可以通过间接(比如通过无线路由器)的方式，先将采集到的患者的病例发送给上述终端，然后再由上述终端发送给服务器。对于服务器选择采用哪种方式获取病例，本发明实施例在此不做限定。

在本发明实施例中，服务器获取的病例，可以是医生针对患者就诊时的问诊所撰写的病例，也可以是患者通过预问诊的方式所生成的病例，在此不做限定。需要说明的是，在患者就诊收集中，主诉和现病史是医生对患者自述状况的最直接描述，因此，本发明实施例中将主诉和现病史作为最能体现病例的数据。

步骤302：对所述病例进行特征抽取，得到对应的病例特征。

在本发明实施例中，病例特征可以包括以下至少之一：症状数量；部位词数量；病例长度；病例关键词或病例片段命中词。

在一些实施例中，服务器可采用以下至少之一的方式对病例进行特征抽取，得到对应的病例特征：

对病例中的症状进行识别，以及对识别出的症状进行统计，得到对应的症状数量；

对病例中的部位词进行识别，以及对识别出的部位词进行统计，得到对应的部位词数量；

对病例中包括的字数进行统计，得到对应的病例长度；

对病例中具有分类特征的关键词或片段命中词进行筛选，得到对应的病例关键词或病例片段命中词。

需要指出的是，服务器还可通过病例中的医生诊断得到病例特征，即医生诊断结果中是否包含症状或疾病。例如，如果某病例中无医生诊断结果，则可设置对应的病例特征为零。

步骤303：基于所述病例特征确定所述病例的类型。

在实际应用中，由于当前的医疗领域中的诊疗类型与其他就诊类型之间是没有重叠部分的，因此，本发明实施例为了进一步提高服务器对患者的就诊意图的识别效率，可以先将获取到的病例划分为诊疗类型和非诊疗类型，然后对于诊疗类型的病例，直接可以识别出病例对应的就诊意图为诊疗；对于非诊疗类型的病例，通过分别检查疾病的其他标签情况，继续判断病例属于非诊疗类型中的哪种子类，以根据得到的子类结果识别病例对应的就诊意图。

下面对病例类型的确定方式进行说明。在一些实施例中，服务器可通过如下方式确定病例的类型：通过分类模型对病例特征对应的特征向量进行分类处理，得到分类模型输出的病例为诊疗类的概率；当得到的概率大于第一概率阈值时，确定病例的类型为诊疗类；当得到的概率小于等于第一概率阈值时，确定病例的类型为非诊疗类。

在本发明实施例中，分类模型可为深度学习模型中的循环神经网络(RNN，Recurrent Neural Network)模型，也可为逻辑回归模型；也就是说，服务器可采用RNN模型对病例特征进行分类学习，以确定病例的类型是诊疗类还是非诊疗类；当然，也可采用逻辑回归模型，如二分类的逻辑回归模型对病例特征进行分类学习，以确定病例的类型是诊疗类还是非诊疗类。对于服务器选择采用哪种分类模型进行分类处理，本发明实施例在此不做限定。

步骤304：当确定所述病例的类型为非诊疗类时，通过分类模型对所述病例特征进行分类处理，得到所述病例属于所述非诊疗类所包含的各子类的判断结果。

本发明实施例中的非诊疗类包括多个子类，子类包括以下至少之一：复诊类；检查类；开药类；信息不全类。

在本发明实施例中，当服务器确定病例的类型为诊疗类时，直接可以识别病例对应的就诊意图为诊疗。

在一些实施例中，服务器可通过如下方式对病例特征进行分类处理，得到病例属于非诊疗类所包含的各子类的判断结果：分别通过至少两个分类模型对病例特征对应的特征向量进行分类处理，得到至少两个分类模型各自输出的病例属于各子类的概率；当得到的概率大于第二概率阈值时，确定病例属于对应所述概率的子类。

需要指出的是，第一概率阈值与第二概率阈值可以相同，也可以不相同。在实际应用中，可以根据病例的类型，如非诊疗类中各子类的不同，对第二概率阈值进行适当调整。

在实际实施时，申请人发现当服务器确定病例的类型为非诊疗类时，对于进一步判断病例属于非诊疗类中的哪个子类而言，可以不用考虑各子类的判断的执行顺序；也就是说，可对非诊疗类包含的四个子类进行任意的分类处理顺序。然而，通过分析大量的患者就诊收集数据，可以发现患者来医院进行就诊的就诊意图中有很大比例是复诊，其次是检查、开药，对于信息不全类的数量几乎很少。因此，为了提高分类模型对病例特征进行分类处理的效率，本发明实施例采用复诊类、检查类、开药类和信息不全类的顺序依次执行分类处理的过程。

示例性的，服务器可通过如下方式对病例特征进行分类处理：按照复诊类、检查类、开药类和信息不全类的顺序，分别通过分类模型对病例特征对应的特征向量进行分类处理，对应得到病例属于复诊类、检查类、开药类和信息不全类的概率。

步骤305：基于所述各子类的判断结果，识别所述病例对应的就诊意图。

在一些实施例中，服务器可通过如下方式基于各子类的判断结果，识别病例对应的就诊意图：将各子类的判断结果进行合并，得到合并结果；然后，基于合并结果识别病例对应的就诊意图。

示例性的，服务器可通过如下方式基于合并结果识别病例对应的就诊意图：基于合并结果，将确定合并结果为是的各子类按照优先级顺序进行输出；基于输出的结果，将优先级别最高的子类对应的就诊意图，识别为病例对应的就诊意图。在本发明实施例中，各子类输出的优先级顺序为：复诊类、检查类、开药类和信息不全类。

在一些实施例中，就诊意图的处理方法还可包括：

在基于各子类的判断结果，识别病例对应的就诊意图之后，基于病例对应的就诊意图，构建针对就诊对象的就诊分布结构图；基于就诊分布结构图，为就诊对象分配相应的医疗资源。

在另一些实施例中，就诊意图的处理方法还可包括：

在基于各子类的判断结果，识别病例对应的就诊意图之后，基于病例对应的就诊意图，对不同类型的病例进行解构，以辅助进行疾病的预测和诊断。

采用本发明实施例提供的技术方案，利用病例的文本自身的特征，能够自动化和准确地识别病例对应的就诊对象的就诊意图，为后续的病例结构化、辅助诊断及病例关联等提供可用数据，从而提升医疗管理的效率。

基于图3所示的就诊意图的处理方法，下面继续对本发明实施例提供的就诊意图的处理方法的具体实现进行说明。

参见图4，图4为本发明实施例提供的就诊意图的处理方法的另一个可选的流程示意图，本发明实施例提供的就诊意图的处理方法可以应用于各种类型的就诊意图的处理设备，例如医疗诊断设备、台式计算机和服务器中。下面仍以就诊意图的处理设备为服务器为例，即由服务器执行本发明实施例提供的就诊意图的处理方法为例说明图4示出的步骤。对于下文各步骤的说明中未尽的细节，可以参考上文而理解。

步骤401：获取病例。

在一些实施例中，服务器可采用如下方式获取病例：接收终端通过调用采集装置获取到的病例。本发明实施例中所涉及的病例，可以是指医生针对患者就诊时的问诊所撰写的病例，也可以是指患者通过预问诊的方式所生成的病例，在此不做限定。

步骤402：对获取到的病例进行特征抽取，得到对应的病例特征。

在一些实施例中，服务器可采用以下至少之一的方式对病例进行特征抽取，得到对应的病例特征：对病例中的症状进行识别，以及对识别出的症状进行统计，得到对应的症状数量；对病例中的部位词进行识别，以及对识别出的部位词进行统计，得到对应的部位词数量；对病例中包括的字数进行统计，得到对应的病例长度；对病例中具有分类特征的关键词或片段命中词进行筛选，得到对应的病例关键词或病例片段命中词。

下面对病例特征为症状数量时的特征抽取过程进行说明。具体来说，服务器首先利用预先生成的识别模型对病例中的症状进行识别，然后对识别出的症状进行数量统计，以得到对应的症状数量。这里，就生成识别模型而言，可采用以下方式实现：利用先验知识及对应的标注生成症状词表，然后利用症状词表生成伪标注数据，再通过条件随机场(CRF，Conditional Random Fields)对伪标注数据进行训练得到识别模型。这里的伪标注数据是病例中待识别的所有症状数据。需要指出的是，本发明实施例中，对于病例中包括的阴性症状和阳性症状不予区分。另外，对于病例中写明“无”的症状，可以理解为阴性症状。

当病例特征为部位词数量时，服务器可采用类似于上述症状数量的特征抽取过程进行处理。具体地，服务器先利用识别模型对病例中的部位词进行识别，然后对识别出的部位词进行数量统计，以得到对应的部位词数量。这里，病例中的部位词，即为人体中所患疾病的部位，例如可以是人体中的肾、肝血管、右1肋骨等。

当病例特征为病例长度时，服务器可利用字数统计模型直接对病例中包括的字数进行统计，以得到对应的病例长度。

当病例特征为病例关键词或病例片段命中词时，服务器可基于不同类型的目标模型，对病例中具有分类特征的关键词或片段命中词(比如‘病史同前’、‘开药’、‘检查’等)进行筛选，以得到对应的病例关键词或病例片段命中词。需要说明的是，不同类型的目标模型，例如判断是否为诊疗类，或者判断是否为复诊类等的目标模型，所使用的关键词或病例片段命中词是不同的。

需要指出的是，服务器还可通过病例中的医生诊断得到病例特征，即医生诊断结果中是否包含症状或疾病。例如，如果某病例中无医生诊断结果，则可设置对应的病例特征为零。这里诊断结果中的症状或疾病的抽取方法，可以参考上文的症状数量的抽取方法而理解。

步骤403：基于病例特征确定病例的类型是否为诊疗类，当确定病例的类型为诊疗类时，执行步骤404；当确定病例的类型为非诊疗类时，执行步骤405。

为了进一步提高服务器对患者的就诊意图的识别效率，本发明实施例将获取到的病例划分为诊疗类型和非诊疗类型，然后针对不同类型的病例识别对应的就诊意图。本发明实施例中的非诊疗类包括多个子类，子类包括以下至少之一：复诊类；检查类；开药类；信息不全类。需要指出的是，非诊疗类所包括的四个子类之间可以重叠。

本发明实施例中的病例为诊疗类时，实际上可以理解为患者来医院的目的主要是为了请医生对所患疾病进行诊断和治疗，通常诊疗类的病例中的信息较全面，病例中的现病史或主诉中有相关症状描述，可供医生诊断。诊疗类的病例，例如“反复晕厥4年，每次持续半小时左右，无二便失禁”；“经期及月经周期延长半年，看化验单”；“右股骨取钢板术后，10月余屈膝受限”等。需要注意的是，对于诊疗类的病例的判断，首先要判断患者来医院的意图是不是需要医生诊断，而且病例中是否有相关症状的信息描述，为医生诊断提供数据支持。

本发明实施例中的病例为复诊类时，实际上可以理解为患者针对当前自身情况，并不是第一次来医院，可能是病情有所好转或加重后，来医院进行复查，也可能是长期慢性病的定期检查或开药，病例中主要包括‘病史不全’和‘无需诊断’的情况。复诊类的病例，例如“检查时发现肾结石，肝血管瘤”；“病史如前，无发热，咳嗽气喘好转，流涕减少”；“高血压病配药”；“右1肋骨骨折后两个月复查”。需要注意的是，复诊类的特点是患者对自身所患疾病的情况有一定的了解，医生可沿用以往的诊断结果。如果当前的病例中有新的症状出现，则需要考虑病例实际为诊疗类，而不是复诊类，比如“右股骨取钢板术后，10月余屈膝受限”；“肝肿瘤切除术后半个月，近日腹痛，以下午明显。大便每日一次，烂”；“拆线”；“换药”等。

本发明实施例中的病例为检查类时，实际上可以理解为患者来医院的目的主要是为了请医生开具检查单，这里的检查可能是定期检查、健康体检，也可能是自身怀疑，或者对其他医院诊断出的某类疾病的进一步检查和确诊。检查类的病例，例如“要求化验检查。LMP2016.4.28”；“要求查血铅，无发热，无咳嗽，纳可，大小便正常”；“发现高血压，来人预约检查”；“体检”。需要注意的是，检查类可能与复诊类之间有重叠部分，只有当患者主动要求做检查，才将病例归纳为检查类；当患者未主动要求做检查，而是医生为确诊疾病主动开具检查的病例，并不属于检查类。另外，若检查为医生本次开具，如“胃镜检查后配药”也不属于检查类。

本发明实施例中的病例为开药类时，实际上可以理解为患者来医院的目的主要是为了请医生开具医药单，患者同样可能对所患疾病有一定了解或经常服用某些药物，通常也无需医生进行进一步诊断。开药类的病例，例如“来人配药”；“病人未来，家属代为配药”；“重症肌无力配药”；“胃镜检查后配药”。需要注意的是，开药类可与其他的非诊疗类之间有重叠，尤其是当患者来院的目的中有较直接的开药需求的病例，则该病例属于开药类。

本发明实施例中的病例为信息不全类时，实际上是病例中对于患者所患疾病并无详细的描述，例如，现病史中并无患者当前情况(如症状或所患疾病)，可能是单纯的开药、检查，也可能是其他与疾病没有关系的表述或者病例过短，没有进一步处理的价值。信息不全类的病例，例如“预防接种”；“要求B超检查，卵泡监测。LMP2014.5.24”；“拆线”；“来人预约检查”；“目前病情平稳，来人要求配药”。需要注意的是，信息不全类可能与部分开药、检查、复诊类有重叠，关键点在于信息不全类的病例中没有具体的病情描述(病情平稳这类泛泛的描述也属于信息不全)。

在本发明实施例中，服务器可通过如下方式确定病例的类型：通过分类模型对病例特征对应的特征向量进行分类处理，得到分类模型输出的病例为诊疗类的概率；当得到的概率大于第一概率阈值时，确定病例的类型为诊疗类；当得到的概率小于等于第一概率阈值时，确定病例的类型为非诊疗类。

这里的分类模型可以是RNN模型，也可以是逻辑回归模型。下面以分类模型为逻辑回归模型为例，对本发明实施例中病例的类型的确定方式进行说明。

示例性的，将病例特征对应的特征向量输入至逻辑回归模型中，通过逻辑回归模型确定病例的类型，如通过以下公式(1)对输入的病例特征对应的特征向量进行分类处理，得到逻辑回归模型输出的病例为诊疗类的概率：

其中，P(Y＝诊疗类)表示病例为诊疗类的概率；x表示病例特征对应的特征向量；w和b分别表示逻辑回归模型的权重。

假设第一概率阈值为0.5，当通过上述公式(1)得到的概率P(Y＝诊疗类)大于0.5时，则确定病例的类型为诊疗类；当通过上述公式(1)得到的概率P(Y＝诊疗类)小于等于0.5时，则确定病例的类型为非诊疗类。需要指出的是，可以根据实际需要对第一概率阈值进行调整，在此不做限定。

步骤404：识别病例对应的就诊意图为诊疗，结束当前处理流程。

步骤405：通过分类模型对病例特征进行分类处理，得到病例属于非诊疗类所包含的各子类的判断结果。

在本发明实施例中，服务器可通过如下方式对病例特征进行分类处理，得到病例属于非诊疗类所包含的各子类的判断结果：分别通过至少两个分类模型对病例特征对应的特征向量进行分类处理，得到至少两个分类模型各自输出的病例属于各子类的概率；当得到的概率大于第二概率阈值时，确定病例属于对应所述概率的子类。

这里的至少两个分类模型可以均是RNN模型，也可以均是逻辑回归模型，当然也可以是RNN模型和逻辑回归模型的任意组合。下面以至少两个分类模型为逻辑回归模型为例，对本发明实施例中确定病例属于非诊疗类中的哪个子类的过程进行说明。可采用上述类似判断诊疗类的方法来判断各子类。

示例性的，将病例特征对应的特征向量输入至逻辑回归模型中，通过逻辑回归模型确定病例的类型，如通过以下公式(2)对输入的病例特征对应的特征向量进行分类处理，得到逻辑回归模型输出的病例为复诊类的概率：

其中，P(Y＝复诊类)表示病例为复诊类的概率；x表示病例特征对应的特征向量；w和b分别表示逻辑回归模型的权重。第一概率阈值与第二概率阈值可以相同，也可以不相同。在实际应用中，可以根据病例的类型，如非诊疗类中各子类的不同，对第二概率阈值进行适当调整。

假设第二概率阈值为0.6，同样的，当通过上述公式(2)得到的概率P(Y＝复诊类)大于0.6时，则确定病例的类型为复诊类；当通过上述公式(2)得到的概率P(Y＝复诊类)小于等于0.6时，则确定病例的类型为非复诊类。可采用上述类似的判断方式来确定病例是否属于检查类、开药类和信息不全类。

步骤406：基于各子类的判断结果，识别病例对应的就诊意图。

在一些实施例中，服务器可通过如下方式基于各子类的判断结果，识别病例对应的就诊意图：将各子类的判断结果进行合并，得到合并结果；然后，基于合并结果识别病例对应的就诊意图。这里，在服务器执行合并各子类的判断结果的过程中，可以当复诊类、检查类、开药类和信息不全类中，有两个或两个以上的子类的判断结果为是时，则得到合并结果为是；当复诊类、检查类、开药类和信息不全类中只有一个子类的判断结果为是时，则得到合并结果为否。

在本发明实施例中，服务器可通过如下方式基于合并结果识别病例对应的就诊意图：基于合并结果，将确定合并结果为是的各子类按照优先级顺序进行输出；基于输出的结果，将优先级别最高的子类对应的就诊意图，识别为病例对应的就诊意图。在本发明实施例中，各子类输出的优先级顺序为：复诊类、检查类、开药类和信息不全类。

举例来说，例如，当合并结果为是时，对应各子类中的复诊类、检查类和开药类的判断结果均为是，信息不全类的判断结果为否，则按照优先级顺序输出复诊类、检查类和开药类，并将优先级别最高的子类，即复诊类对应的就诊意图，识别为病例对应的就诊意图；又例如，当合并结果为是时，对应各子类中的检查类和开药类的判断结果为是，复诊类和信息不全类的判断结果为否，则按照优先级顺序输出检查类和开药类，并将优先级别最高的子类，即检查类对应的就诊意图，识别为病例对应的就诊意图。

在一些实施例中，就诊意图的处理方法还可包括：在基于各子类的判断结果，识别病例对应的就诊意图之后，基于病例对应的就诊意图，构建针对就诊对象的就诊分布结构图；基于就诊分布结构图，为就诊对象分配相应的医疗资源。在另一些实施例中，就诊意图的处理方法还可包括：在基于各子类的判断结果，识别病例对应的就诊意图之后，基于病例对应的就诊意图，对不同类型的病例进行解构，以辅助进行疾病的预测和诊断。

在本发明实施例中，当根据患者的病例识别出患者的就诊意图后，可以根据就诊意图向医院提供患者的分布数据，然后根据分布数据构建就诊患者的分布结构图，如图5所示的本发明实施例提供的就诊患者的分布数据的一个可选的分布结构显示示意图，参见图5，可以直观的显示对应不同类型的就诊意图的患者所占的比例，以协助医院了解患者的就诊需求分布，在导诊时可以对单纯的检查类和开药类的病例，以及需要医生问询、检查的病例分配相应的号源；并且，还可以为各个患者分配合理的医疗资源，达到医疗资源的合理调配和运用。

此外，当根据患者的病例识别出患者的就诊意图后，还可供医生、研究人员进行疾病的预测和诊断的研究，例如，可以根据识别到的病例对应的就诊意图，对不同类型的病例进行解构，确定不同类型的病例在形态学上的表现，进而来辅助预测和诊断患者是否有可能患有某种疾病(例如糖尿病)及其风险。

采用本发明实施例提供的技术方案，通过对获取到的病例进行特征抽取，得到对应的病例特征，基于病例特征确定病例的类型，当确定病例的类型为诊疗类时，识别病例对应的就诊意图为诊疗；当确定病例的类型为非诊疗类时，通过分类模型对病例特征进行分类处理，得到病例属于非诊疗类所包含的各子类的判断结果，再基于各子类的判断结果，识别病例对应的就诊意图。这样，不仅能够自动化和准确地识别病例对应的就诊对象的就诊意图，为后续的病例结构化、辅助诊断及病例关联等提供可用数据，从而提升医疗管理的效率；并且，将病例划分为诊疗类型和非诊疗类型后再识别就诊意图，可以进一步提高针对就诊意图的识别效率。

下面以一具体应用场景为例对本发明实施例的就诊意图的处理方法进行说明。该具体应用场景为某医院想要了解患者的就诊需求分布，采用本发明实施例的方法可以对患者来医院的就诊意图进行分布统计，以为就诊患者分配合理的医疗资源。

参见图6，图6为本发明实施例提供的就诊意图的处理方法的另一个可选的流程示意图，本发明实施例提供的就诊意图的处理方法可以应用于各种类型的就诊意图的处理设备，例如医疗诊断设备、台式计算机和服务器中。下面以就诊意图的处理设备为服务器为例，即由服务器执行本发明实施例提供的就诊意图的处理方法为例说明图6示出的步骤。对于下文各步骤的说明中未尽的细节，可以参考上文而理解。

步骤601：获取病例。

步骤602：对获取到的病例进行特征抽取，得到对应的病例特征。

步骤603：基于病例特征确定病例的类型是否为诊疗类，当确定病例的类型为诊疗类时，执行步骤604；当确定病例的类型为非诊疗类时，执行步骤605。

步骤604：识别病例对应的就诊意图为诊疗，结束当前处理流程。

步骤605：分别通过至少两个分类模型对病例特征对应的特征向量进行分类处理，得到至少两个分类模型各自输出的病例属于各子类的概率。

步骤606：当得到的概率大于第二概率阈值时，确定病例属于对应概率的子类。

这里的至少两个分类模型可以均是RNN模型，也可以均是逻辑回归模型，当然也可以是RNN模型和逻辑回归模型的任意组合。

为了提高分类模型对病例特征进行分类处理的效率，本发明实施例采用复诊类、检查类、开药类和信息不全类的顺序依次执行分类处理的过程。具体地，可通过如下方式对病例特征进行分类处理：按照复诊类、检查类、开药类和信息不全类的顺序，分别通过分类模型对病例特征对应的特征向量进行分类处理，对应得到病例属于复诊类、检查类、开药类和信息不全类的概率。

步骤607：将各子类的判断结果进行合并，得到合并结果。

步骤608：基于合并结果，将确定合并结果为是的各子类按照优先级顺序进行输出；基于输出的结果，将优先级别最高的子类对应的就诊意图，识别为病例对应的就诊意图。

在本发明实施例中，各子类输出的优先级顺序为：复诊类、检查类、开药类和信息不全类。

步骤609：基于病例对应的就诊意图，构建针对就诊对象的就诊分布结构图，基于就诊分布结构图为就诊对象分配相应的医疗资源。

参见图7，图7为本发明实施例提供的就诊意图的处理方法的一个可选的原理结构示意图，以就诊意图的处理设备为服务器，以患者的病例为患者的主诉或现病史为例进行说明。服务器首先获取患者的主诉或现病史，然后对获取到的患者的主诉或现病史进行特征抽取，得到对应的病例特征；接下来，通过分类模型，比如逻辑回归模型对病例特征对应的特征向量进行分类处理，判断患者的病例的类型是否为诊疗类，当确定病例的类型为诊疗类时，识别病例对应的就诊意图为诊疗，并将所识别到病例对应的就诊意图进行类型标记，即标记为诊疗；接下来，按照复诊类、检查类、开药类和信息不全类的顺序，分别通过分类模型，比如逻辑回归模型对病例特征对应的特征向量进行分类处理，即分别判断病例的类型是否为复诊类、检查类、开药类和信息不全类，得到对应的各子类的判断结果，接下来再将各子类的判断结果进行合并，得到合并结果，将确定合并结果为是的各子类按照优先级顺序进行输出，最终基于输出的结果，将优先级别最高的子类对应的就诊意图，识别为病例对应的就诊意图，并将识别到的病例对应的就诊意图进行类型标记，以形成就诊意图类型列表。

采用本发明实施例提供的技术方案，利用病例的文本自身的特征，能够自动化和准确地识别病例对应的就诊对象的就诊意图，为后续的病例结构化、辅助诊断及病例关联等提供可用数据，从而提升医疗管理的效率；并且，将病例划分为诊疗类型和非诊疗类型后再识别就诊意图，可以进一步提高针对就诊意图的识别效率；本发明实施例还可以根据识别的就诊意图为各个患者分配合理的医疗资源，达到医疗资源的合理调配和运用。

接下来对本发明实施例提供的就诊意图的处理装置30的软件实现进行说明。以上述就诊意图的处理设备20中的存储器202所包括的软件模块为例进行说明，对于下文关于模块的功能说明中未尽的细节，可以参考上文而理解。

获取单元31，用于获取病例；抽取单元32，用于对所述病例进行特征抽取，得到对应的病例特征；确定单元33，用于基于所述病例特征确定所述病例的类型；分类单元34，用于当确定所述病例的类型为非诊疗类时，通过分类模型对所述病例特征进行分类处理，得到所述病例属于所述非诊疗类所包含的各子类的判断结果；识别单元35，用于基于所述各子类的判断结果，识别所述病例对应的就诊意图。

在一些实施例中，识别单元还用于：当确定所述病例的类型为诊疗类时，识别所述病例对应的就诊意图为诊疗。

在一些实施例中，就抽取单元对所述病例进行特征抽取，得到对应的病例特征来说，可以采用以下至少之一的方式实现：

对所述病例中的症状进行识别，以及对识别出的所述症状进行统计，得到对应的症状数量；对所述病例中的部位词进行识别，以及对识别出的所述部位词进行统计，得到对应的部位词数量；对所述病例中包括的字数进行统计，得到对应的病例长度；对所述病例中具有分类特征的关键词或片段命中词进行筛选，得到对应的病例关键词或病例片段命中词。

在一些实施例中，就确定单元基于所述病例特征确定所述病例的类型来说，可以采用以下方式实现：通过所述分类模型对所述病例特征对应的特征向量进行分类处理，得到所述分类模型输出的所述病例为诊疗类的概率；

在一些实施例中，就分类单元通过分类模型对所述病例特征进行分类处理，得到所述病例属于所述非诊疗类所包含的各子类的判断结果来说，可以采用以下方式实现：分别通过至少两个所述分类模型对所述病例特征对应的特征向量进行分类处理，得到所述至少两个分类模型各自输出的所述病例属于各子类的概率；

当得到的所述概率大于第二概率阈值时，确定所述病例属于对应所述概率的子类；其中，所述子类包括以下至少之一：复诊类；检查类；开药类；信息不全类。

这里，就分类单元分别通过至少两个所述分类模型对所述病例特征对应的特征向量进行分类处理，得到所述至少两个分类模型各自输出的所述病例属于各子类的概率来说，可以采用以下方式实现：按照所述复诊类、检查类、开药类和信息不全类的顺序，分别通过所述分类模型对所述病例特征对应的特征向量进行分类处理，对应得到所述病例属于复诊类、检查类、开药类和信息不全类的概率。

在一些实施例中，就识别单元基于所述各子类的判断结果，识别所述病例对应的就诊意图来说，可以采用以下方式实现：将所述各子类的判断结果进行合并，得到合并结果；基于所述合并结果，识别所述病例对应的就诊意图。

这里，对于基于所述合并结果，识别所述病例对应的就诊意图而言，可以采用以下方式实现：

基于所述合并结果，将确定所述合并结果为是的各子类按照优先级顺序进行输出；基于输出的结果，将优先级别最高的子类对应的就诊意图，识别为所述病例对应的就诊意图。

在一些实施例中，就诊意图的处理装置还可包括：

本发明实施例还提供了一种存储介质，存储有可执行指令，所述可执行指令被执行时，用于实现本发明实施例提供的上述就诊意图的处理方法。其中，存储介质具体可为计算机可读存储介质，例如可以是铁电随机存取存储器(FRAM，ferromagnetic randomaccess memory)、只读存储器(ROM，Read Only Memory)、可编程只读存储器(PROM，Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM，ErasableProgrammable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM，ElectricallyErasable Programmable Read-Only Memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘或只读光盘(CD-ROM，Compact Disc Read-Only Memory)等存储器。

综上所述，本发明实施例的技术方案具有以下有益效果：

1)利用病例的文本自身的特征，能够自动化和准确地识别病例对应的就诊对象的就诊意图，为后续的病例结构化、辅助诊断及病例关联等提供可用数据，从而提升医疗管理的效率。

2)将病例划分为诊疗类型和非诊疗类型后再识别就诊意图，可以进一步提高针对就诊意图的识别效率。

3)为了提高分类模型对病例特征进行分类处理的效率，本发明实施例采用复诊类、检查类、开药类和信息不全类的顺序依次执行分类处理的过程。

4)根据识别的就诊意图为各个患者分配合理的医疗资源，达到医疗资源的合理调配和运用。

在以上的描述中，所涉及到的术语“第一”、“第二”等仅仅是用于区别类似的对象，不代表针对对象的特定的顺序或先后次序。可以理解地，“第一”、“第二”等在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本发明实施例能够以除了在图示或描述的以外的顺序实施。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种就诊意图的处理方法，其特征在于，包括：

获取病例；

对所述病例进行特征抽取，得到对应的病例特征；

基于所述病例特征确定所述病例的类型；

2.如权利要求1所述的方法，其特征在于，所述基于所述病例特征确定所述病例的类型，包括：

3.如权利要求1所述的方法，其特征在于，所述对所述病例进行特征抽取，得到对应的病例特征，包括以下至少之一：

对所述病例中包括的字数进行统计，得到对应的病例长度；

4.如权利要求1所述的方法，其特征在于，所述通过分类模型对所述病例特征进行分类处理，得到所述病例属于所述非诊疗类所包含的各子类的判断结果，包括：

5.如权利要求4所述的方法，其特征在于，所述分别通过至少两个所述分类模型对所述病例特征对应的特征向量进行分类处理，得到所述至少两个分类模型各自输出的所述病例属于各子类的概率，包括：

6.如权利要求1所述的方法，其特征在于，所述方法还包括：

7.如权利要求1至6任一项所述的方法，其特征在于，所述方法还包括：

在所述基于所述各子类的判断结果，识别所述病例对应的就诊意图之后，

基于所述病例对应的就诊意图，构建针对就诊对象的就诊分布结构图；

基于所述就诊分布结构图，为所述就诊对象分配相应的医疗资源。

8.如权利要求1至6任一项所述的方法，其特征在于，所述方法还包括：

基于所述病例对应的就诊意图，对不同类型的病例进行解构，以辅助进行疾病的预测和诊断。

9.一种就诊意图的处理装置，其特征在于，包括：

获取单元，用于获取病例；

确定单元，用于基于所述病例特征确定所述病例的类型；

10.一种就诊意图的处理设备，其特征在于，包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现如权利要求1至8任一项所述的就诊意图的处理方法。