WO2018228151A1

WO2018228151A1 - 分诊方法、装置和设备以及计算机可读存储介质

Info

Publication number: WO2018228151A1
Application number: PCT/CN2018/087986
Authority: WO
Inventors: 张超; 张振中
Original assignee: 京东方科技集团股份有限公司
Priority date: 2017-06-13
Filing date: 2018-05-23
Publication date: 2018-12-20
Also published as: CN107153775A; CN107153775B

Abstract

本公开实施例提供一种分诊方法、分诊装置、分诊设备以及计算机可读存储介质。该方法包括：获取患者的病情特征数据；根据患者的病情特征数据、以及病例数据库中所有病种下各病例的病情特征数据，确定患者患病例数据库中每个病种的可能性；根据患者患病例数据库中每个病种的可能性，输出患者的分诊结果。

Description

分诊方法、装置和设备以及计算机可读存储介质

相关申请

本申请要求2017年6月13日提交、申请号为201710444355.3的中国专利申请的优先权，该申请的全部内容通过引用并入本文。

技术领域

本公开涉及一种分诊方法、分诊装置、分诊设备和计算机可读存储介质。

背景技术

随着生活条件的不断改善，对于健康的需求也越来越旺盛。近年来，各大医院的门急诊量急剧增长，由此造成医疗分诊压力大，流程滞后、等候时间长，继而带来医疗质量难以保证，医患矛盾增加等一系列问题。

发明内容

根据本公开的一个方面，提供了一种分诊方法，所述方法包括：获取患者的病情特征数据；根据所述患者的病情特征数据、以及病例数据库中所有病种下各病例的病情特征数据，确定所述患者患所述病例数据库中每个病种的可能性；根据所述患者患所述病例数据库中每个病种的可能性，输出所述患者的分诊结果。

在一些实施例中，所述病情特征数据包括病情症状信息和体征检测参数的至少一者。

在一些实施例中，所述获取患者的病情特征数据的步骤进一步包括：根据预设的向量元素的位置与向量元素所表示的病情特征的对应关系，将输入的患者的病情特征转换成患者的病情特征分布向量，所述患者的病情特征分布向量中的每个元素指示所述输入的患者的病情特征中是否出现该元素所在位置对应的病情特征。

在一些实施例中，所述根据所述患者的病情特征数据、以及病例数据库中所有病种下各病例的病情特征数据，确定所述患者患所述病例数据库中每个病种的可能性的步骤进一步包括：

基于患者的病情特征分布向量，通过对关系模型h＝DX求解X来确定满足预定条件的相关系数向量X ^*，其中，h为所述患者的病情特征分布向量，h和X均为列向量，D为由所述病例数据库中每个病种下各病例的病情特征分布向量组成的矩阵，D＝[D ₁，D ₂，......，D _i，......，D _M]，其中：D _i＝[D _i，1，D _i，2，...，D _i，j，...，D _i，K]，D _i，j为所述病例数据库中病种i的第j个病例的病例病情特征分布向量，所述K表示所述病例数据库中病种i包括K个病例，所述M表示病例数据库中包括M种疾病；

根据所述确定的相关系数向量X ^*，确定所述病例数据库中每个病种的可能性。

在一些实施例中，所述方法还包括：根据预设的向量元素的位置与向量元素所表示的病情特征的对应关系，将每个病种下各病例的病情特征转换成病例病情特征分布向量；所述病例的病情特征分布向量中的每个元素指示所述病例的病情特征中是否出现该元素所在位置对应的病情特征。

在一些实施例中，所述预定条件包括第一预定条件||DX-h|| ₂≤ε以及第二预定条件X ^*＝arg min||X|| ₁，其中：||·|| ₁是L1范式，||·|| ₂是L2范式，所述ε为预设参数。

在一些实施例中，根据所述确定的相关系数向量X ^*确定所述病例数据库中每个病种的可能性的步骤进一步包括：

从所述确定的相关系数向量X ^*中确定出所述病例数据库中每个病种的相关系数向量δ _i(X ^*)，δ _i(X ^*)表示通过将系数向量X ^*中属于病种D _i的维度乘以1，其余维度乘以0所得到的一个向量；

根据所述病例数据库中每个病种的相关系数向量δ _i(X ^*)确定所述患者的病情特征分布向量h中对应每个病种的语义成分h _i＝D*δ _i(X ^*)；

将所述患者的病情特征分布向量h中对应每个病种的语义成分h _i＝D*δ _i(X ^*)代入到概率计算公式中，得到所述患者患所述病例数据库中每个病种的概率；

其中，所述概率计算公式为：

C _i表示所述患者患所述病例数据库中的病种i的概率，

中的M表示所述病例数据库中的M个病种，所述η为误差向量，所述

是L2范式的平方。

在一些实施例中，所述根据所述病例数据库中每个病种的可能性，输出所述患者的分诊结果的步骤进一步包括：

将所有病种中可能性不为零的病种，按照可能性大小顺序输出作为所述患者的分诊结果。

在一些实施例中，所述根据所述病例数据库中每个病种的可能性，输出所述患者的分诊结果的步骤进一步包括输出所有病种中可能性最大的病种作为所述患者的分诊结果。

根据本公开另一个方面，提供了一种分诊装置，包括：获取器，配置成获取患者的病情特征数据；处理器，配置成根据所述患者的病情特征数据、以及病例数据库中所有病种下各病例的病情特征数据，确定所述患者患所述病例数据库中每个病种的可能性；输出器，配置成根据所述患者患所述病例数据库中每个病种的可能性，输出所述患者的分诊结果。

在一些实施例中，所述获取器进一步配置成：根据预设的向量元素的位置与向量元素所表示的病情特征的对应关系，将输入的患者的病情特征转换成患者的病情特征分布向量，所述患者的病情特征分布向量中的每个元素指示所述输入的患者的病情特征中是否出现该元素所在位置对应的病情特征。

在一些实施例中，所述处理器进一步配置成：

在一些实施例中，所述分诊装置还可以包括转换器，该转换器可以配置成根据预设的向量元素的位置与向量元素所表示的病情特征的对应关系，将每个病种下各病例的病情特征转换成病例病情特征分布向量，所述病例病情特征分布向量中的每个元素指示病例的病情特征中是否出现该元素所在位置对应的病情特征。

在一些实施例中，所述处理器在根据所述确定的相关系数向量X ₀，确定所述病例数据库中每个病种的可能性时，具体配置成：

其中，所述概率计算公式为：

C _i表示所述患者患所述病例数据库中的病种i的概率，

是L2范式的平方。

在一些实施例中，所述输出器进一步配置成：

输出所有病种中可能性最大的病种作为所述患者的分诊结果。

根据本公开另一个方面，提供了一种分诊设备，包括：一个或多个处理器；和存储器，其上存储有计算机可执行指令，所述计算机可执行指令被配置为当被所述一个或多个处理器执行时，执行如上所述的任何一种方法的一个或多个步骤。

根据本公开另一个方面，提供了一种计算机可读存储介质，其上包含有计算机可执行指令，所述指令在由一个或多个处理器执行时，使所述一个或多个处理器执行如上所述的任何一种方法的一个或多个步骤。

上述以简化的形式介绍了本公开的一些构思，这些构思在下面的具体实施方式中进一步加以描述。发明内容部分并非要给出要求保护的主题的必要特征或实质特征，也不是要限制要求保护的主题的范围。此外，正如本文所描述的，各种各样的其他特征和优点也可以根据需要结合到这些技术中。

附图说明

为了更清楚地说明本公开一些实施例的技术方案，本公开提供了下列附图以便在实施例描述时使用，这些附图构成说明书的一部分，与本公开的实施例一起用于解释本公开一些实施例的技术方案。应当意识到，下面描述中的附图仅仅涉及一些实施例，并不构成对本公开技术方案的限制，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图，所述其它的附图也在本公开的范围内。

图1为根据本公开一个实施例提供的一种分诊方法的方法流程图；

图2为根据本公开一个实施例提供的一种语义空间的示意图；

图3为根据本公开一个实施例提供的一种分诊装置的结构示意图；

图4为根据本公开一个实施例提供的一种分诊设备的结构示意图。

具体实施方式

为了能够更清楚地理解一些实施例的目的、技术方案和优点，下面结合附图和具体实施方式对这些实施例作进一步详细描述。本领域普通技术人员能够理解，所描述的实施例仅仅是本公开的一部分实施例，而不是全部的实施例。基于本公开的实施例，本领域普通技术人员在没有做出创造性劳动前提下能够获得其它的实施例，所获得的所有其他实施例都属于本公开保护的范围。

为了便于清楚描述本公开实施例的技术方案，在本公开的实施例中，采用了“第一”、“第二”等字样对功能或作用基本相同的相同项或相似项进行区分，本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定。

本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

本公开的一些实施例提供的分诊方法的执行主体可以为分诊装置。例如，该分诊装置可以是用于执行上述分诊方法的终端或设备，也可以是用于执行上述分诊方法的处理器。其中：该终端或设备可以为计算机、智能手机、平板电脑、笔记本电脑、UMPC(Ultra-mobile Personal Computer，超级移动个人计算机)、上网本、PDA(Personal Digital Assistant，个人数字助理)等终端设备，且不限于此。

图1示出了根据本公开一个实施例提供的一种分诊方法的方法流程图。如图1所示，该方法可以包括步骤101-103。

步骤101、获取患者的病情特征数据。

该患者的病情特征数据是用于表示患者具有的病情特征的数据。示例性的，患者或者其他人(例如护士)可以通过计算机上安装的分诊系统的输入界面，输入病情特征文本；还可以通过计算机的语音采集器(例如麦克风)，采集患者声音，并且由计算机上安装的语音识别系统识别出患者口述信息，计算机上安装的分诊系统从识别出的患者口述信息中选择出、或模糊匹配出病情特征关键词(是指病情特征数据库中所存在的病情特征)；计算机上安装的分诊系统还可通过计算机的身份识别功能，识别患者身份信息(例如扫描身份证或就诊卡等)，根据患者身份信息从医院检查数据库(可以配置成存储体征检测参数的数据库，体征检测参数包括患者做身体检查的项目和结果)中调取该患者的体征检查参数。

示例性的，上述的病情特征数据可以包括：病情症状信息和/或体征检测参数，其中，病情症状信息为观察到患者的症状或患者感受到的症状，例如可以是患者的口述症状或输入的症状文本等，例如：心悸气短、肢体麻木、耳鸣等。而体征检测参数可以包括患者的各项指标检测值，例如血压值、血糖值等，其反映出的病情特征可以是血压微高、血压过高等。

当然，病情特征数据除了可以是上述类型以外，还可以是表示病情特征数据的数字集合，例如可以是一个向量(或基于向量构成的矩阵)。此时，步骤101可以进一步包括：

步骤101a、根据预设的向量元素的位置与向量元素所表示的病情特征的对应关系，将输入的患者的病情特征转换成患者的病情特征分布向量，患者的病情特征分布向量中的每个元素指示输入的患者的病情特征中是否出现该元素所在位置对应的病情特征。

例如，数据库中有Q个病情特征，该预设的向量元素的位置与向量元素所表示的病情特征的对应关系用集合I表示，该集合I为Q维向量，I＝[I ₁，I ₂，...，I _Q，] ^T。其中，I _j(1≤j≤Q)表示第j个位置处的病情特征，从而集合I表示的是从第1个位置处的病情特征到第Q个位置处的病情特征。

例如，数据库中有1000个病情特征，上述的集合I为：I＝[I ₁，I ₂，...，I ₁₀₀₀，] ^T。例如，I ₅₀₀为第500个位置处的病情特征。集合I表示从第1个位置处的病情特征到第1000个位置处的病情特征。

步骤102、根据患者的病情特征数据、以及病例数据库中所有病种下各病例的病情特征数据，确定患者患病例数据库中每个病种的可能性。

示例性的，上述的患者患病例数据库中每个病种的可能性可以是指患者患每个病种的概率，用0至1间的数值进行表示。或者也可以是患者患每个病种的可能性对应的数值(可以为包含大于1的数值)，数值越大表示可能性越大。

示例性的，上述的病情特征数据为病情特征文本时，例如：患者的病情特征文本为眩晕、恶心以及心悸气短时，上述的步骤102中确定患者患病例数据库中每个病种的可能性的具体过程可以参照以下内容：这里病例数据库中的病种个数以3个为例，分别为病种A、病种B以及病种C，其中：病种A以包含3个病例为例，病种B以包含4个病例为例，病种C以包含5个病例为例，而患者所具有的病情特征以3个为例。将患者的病情特征与病例数据库中的每个病种下各病例中的病情特征文本进行匹配，若患者的3个病情特征均出现在病例数据库中病种A下的同一个病例中，且该患者的3个病情特征没有全部出现在其他病种下的病情特征文本中，则该患者患病种A的可能性最大；若患者的2个病情特征出现在病例数据库中病种A下的第一病例中，剩下的1个病情特征出现在病种A下的第二病例中，且该患者的3个病情特征没有全部出现在其他病种下的病情特征文本中，则该患者患病种A的可能性最大，但是相对于上面的结果较小；若患者的第1个病情特征出现在病例数据库中病种A下的第一病例中，第2个病情特征出现在病种A下的第二病例中，第3个病情特征出现在病种A下的第三病例中，且该患者的3个病情特征没有全部出现在其他病种下的病情特征文本中，则该患者患病种A的可能性最大，但是相对于上面的两种结果是最小的。当然，通过匹配病情特征得到患者患每个病种的可能性大小的规则，可以根据实际需要进行设置。

示例性的，上述的病情特征数据为向量时，上述的步骤102可以进一步包括如下步骤：

步骤102a、将所述患者的病情特征分布向量代入到关系模型h＝DX中，通过对所述关系模型求解X来确定满足预定条件的相关系数向量X ^*，其中，h为所述患者的病情特征分布向量，h和X均为列向量，D为由所述病例数据库中每个病种下各病例的病情特征分布向量组成的矩阵，D＝[D ₁，D ₂，......，D _i，......，D _M]，其中：D _i＝[D _i，1，D _i，2，...，D _i，j，...，D _i，K]，D _i，j为所述病例数据库中病种i的第j个病例的病例病情特征分布向量，所述K表示所述病例数据库中病种i包括K个病例，所述M表示病例数据库中包括M种疾病。

步骤102b、根据所述确定的相关系数向量X ^*，确定所述病例数据库中每个病种的可能性。

在一些实施例中，在上述的步骤102之前，该方法例如还可以包括以下步骤：

A1、根据预设的向量元素的位置与向量元素所表示的病情特征的对应关系，将每个病种下各病例的病情特征转换成病例病情特征分布向量。其中，上述的病例的病情特征分布向量中的每个元素用于指示病例的病情特征中是否出现该元素所在位置对应的病情特征。

例如，若病例数据库中有Q个病情特征，则病例数据库中每个病种下各病例的病情特征分布向量中包含Q个元素。

示例性的，病种A下的任一个病例的病情特征分布向量为D _A1＝[I ₁，I ₂，...，I _Q，] ^T。由于数据库中的病情特征的集合I为Q维向量，相应的这里的病种A下的任一个病例的病情特征分布向量也为Q维向量。其中，I _j(1≤j≤Q)表示病种A下的任一个病例的第j个位置处的病情特征，从而D _A1表示病种A下的任一个病例中从第1个位置处的病情特征到第Q个位置处的病情特征。

示例性的，上述的关系模型可以是预先建立好的，也可以是根据需要实时进行建立的，对于上述的关系模型的建立过程可以参考以下的内容：

由于本公开的一些实施例是基于医学大数据进行疾病的病种预测，因此需要大量的案例(例如各医院历年的确诊病例)，这对应着流程图中的病例数据库中每个病种下各病例。本公开使用符号D来表示病例数据库中病种集合，假设其中一共包含M种疾病(即M个病种)，则D _i(1≤i≤M)表示病例数据库的第i种疾病。假设第i种疾病中包含K个病例，则D _ij(1≤i≤M，1≤j≤K)表示第i种疾病中的第j个病例。每一个病例由对应的特征向量(如症状和体征检测参数)构成，则D构成了一个确诊病例的语义空间。

对于新来的患者h(其含义是指：患者的病情特征分布向量用h表示)，假设其患有疾病D _i，依据本公开的基本思想：患有同一疾病的患者极有可能出现相似的特征(如症状和体征检测参数)，则患者h可以表示为D _i中所包含病例的线性组合，即h＝α _i，1×D _i，1+α _i，2×D _i，2+......+α _i，K×D _i，K，其中，α _ij是相关系数。例如，对于疾病“高血压”，病例1中的症状有“眩晕、恶心、心悸气短”，病例2中的症状有“心悸气短、耳鸣、肢体麻木”，病例3中的症状有“眩晕、恶心、耳鸣、心悸气短”，新来患者的症状有“心悸气短、肢体麻木”，则有“新来患者＝病例1+病例2-病例3”。

为了表示简洁和方便，上面的表达形式可以用矩阵表示。假设D _i＝[D _i1，D _i2，.....，D _iK]，X _i＝[α _i1，α _i2，......，α _iK] ^T，其中上标T表示矩阵的转置，则有h＝D _iX _i。

通过上面的讨论，可以看到每一个病种可以表示成由其包含的病例所构成的语义子空间，属于该病种的某一病例可以由相应子空间(病情特征)的线性组合构成。

上面所讨论的是新来的患者h，假设其患有疾病D _i所做的讨论，那么对于新来的患者在不知道所患病种的前提下，类比于上述的过程，当给定所有病种的确诊病例语义空间矩阵D，可以通过寻找患者h在D中的语义子空间来确定其所患疾病。令D＝[D ₁，D ₂，......，D _M]，则患者h与给定病例间的关系模型为：h＝DX。

具体的，对于上面的D＝[D ₁，D ₂，......，D _M]，由于病种D ₁，D ₂，......，D _M这M个病种的每个病种下可能包含多个病例，因此，这里D ₁，D ₂，......，D _M中的D _i(1≤i≤M)为由第i个病种下所包含的各病例的病情特征分布向量构成的集合。例如，假设M个病种的每个病种下均包含两个病例，则D＝[D ₁₁，D ₁₂，D ₂₁，D ₂₂，......，D _M1，D _M2]。

示例性的，假设病例数据库中有3个病种，分别为病种A、病种B以及病种C，该病种A包含2个病例，病种B包含3个病例，病种C包含2个病例，则D＝[D _A1，D _A2，D _B1，D _B2，D _B3，D _C1，D _C2]。

基于上面的病种矩阵D，D＝[D _A1，D _A2，D _B1，D _B2，D _B3，D _C1，D _C2]，假设基于上述的3个病种的7个病例统计出的病情特征数据有100个，那么，上面的患者h与给定病例间的关系模型：h＝DX中的病种矩阵D是一个100*7的矩阵，而相关系数向量X为7维列向量，可以用X＝[α _A1，α _A2，α _B1，α _B2，α _B3，α _C1，α _C2] ^T来表示。

需要说明的是，在实际的应用中，上述的病例数据库中的病种的个数为成百上千个，而每个病种下的病例相应的可能也是成百上千乃至更多，基于每个病种下的病例所抽出的病情特征可能是成千上万个，因此，上面的内容仅仅是一种示例，用于解释说明本方案，而非用于限制本公开。

在一些实施例中，其中，步骤102a中的所述预定条件包括第一预定条件||DX-h|| ₂≤ε以及第二预定条件X ^*＝arg min||X|| ₁，其中：||·|| ₁是L1范式，||·|| ₂是L2范式，所述ε为预设参数，X ^*＝arg min||X|| ₁表示使得||X|| ₁取最小值时的X，记为X ^*。

需要指出的是，在理想情况下h＝DX，即||DX-h|| ₂＝0。但是在现实中由于计算精度的限制，可能出现最后计算得到的DX不等于h的情况。例如在上面提到的“新来患者＝病例1+病例2-病例3”的例子中，病例1、病例2、病例3的病例病情特征分布向量可以被分别表示为[1，1，1，0，0] ^T、[0，0，1，1，1] ^T、[1，1，1，1，0] ^T，而新来患者的病情特征分布向量可以被表示为[0，0，1，0，1] ^T。假设通过计算得到DX＝0.8*[1，1，1，0，0] ^T+[0，0，1，1，1] ^T-[1，1，1，1，0] ^T＝[0.2，0.2，0.8，0，1]。那么此时DX-h＝[0.2，0.2，0.8，0，1] ^T-[0，0，1，0，1] ^T＝[0.2，0.2，-0.2，0，0] ^T，则||DX-h|| ₂＝0.12。如果我们设定ε＝0.2，则||DX-h|| ₂≤ε依然成立。引入ε就是为了降低“噪音”的影响。

需要说明的是，上述的L1范式||·|| ₁的运算是：范式中变量所包含的每个元素的绝对值之和，例如，若X＝[α ₁₁，α ₁₂，......，α _MK]，则||X|| ₁＝|α ₁₁|+|α ₁₂|+...+|α _MK|。而上述的L2范式||·|| ₂的运算是：范式中变量所包含的每个元素的平方之和的平方根，例如，若X＝[α ₁₁，α ₁₂，......，α _MK]，则

上述采用第一预定条件和第二预定条件来确定相关系数向量X ^*的过程中采用的是稀疏解法，即在一定精度的条件下使用最少的病例去重构患者h的病情特征，采用稀疏解法能够降低“噪音”数据的影响，使得上述的关系模型h＝DX具有良好的鲁棒性。

示例性的，当步骤102b中的可能性用概率来表示时，上述的步骤102b可以包括如下步骤：

步骤102b1、从所述确定的相关系数向量X ^*中确定出所述病例数据库中每个病种的相关系数向量δ _i(X ^*)，δ _i(X ^*)表示通过将系数向量X ^*中属于病种D _i的维度乘以1，其余维度乘以0所得到的一个向量。也就是说，将X ^*中第i个病种下各病例的相关系数保留，其他元素置为0，得到δ _i(X ^*)。

示例性的，假设所确定的相关系数向量X ^*＝[α _A1，α _A2，α _B1，α _B2，α _B3，α _C1，α _C2] ^T，则病种A的相关系数向量为：δ _A(X ^*)＝[α _A1，α _A2，0，0，0，0，0] ^T；病种B的相关系数向量为：δ _B(X ^*)＝[0，0，α _B1，α _B2，α _B3，0，0] ^T；病种C的相关系数向量为：δ _C(X ^*)＝[0，0，0，0，0，α _C1，α _C2] ^T。

步骤102b2、根据所述病例数据库中每个病种的相关系数向量δ _i(X ^*)确定所述患者的病情特征分布向量h中对应每个病种的语义成分h _i＝D*δ _i(X ^*)。

步骤102b3、将所述患者的病情特征分布向量h中对应每个病种的语义成分h _i＝D*δ _i(X ^*)代入到概率计算公式中，得到患者患病例数据库中每个病种的概率。

示例性的，概率计算公式为：

其中，C _i表示患者患病例数据库中的病种i的概率，

中的M表示病例数据库中的M个病种，η为误差矩阵，h＝h ₁+h ₂+......+h _M+η，其中：h为新来患者的病情特征分布向量，h _i为所述患者的病情特征分布向量h中对应各病种i的语义成分(1≤i≤M)，而该h _i是由病种i下的所有病例的病情特征分布向量的线性组合。

是L2范式的平方。

具体的，对于上述的h _i＝D*δ _i(X ^*)，仍然以上文所列举的例子进行说明。假设病例数据库中有3个病种，分别为病种A、病种B以及病种C，该病种A包含2个病例，病种B包含3个病例，病种C包含2个病例，则D＝[D _A1，D _A2，D _B1，D _B2，D _B3，D _C1，D _C2]。假设基于上述的3个病种的7个病例统计出的病情特征数据有100个，且假设所确定的相关系数向量为X ^*＝[α _A1，α _A2，α _B1，α _B2，α _B3，α _C1，α _C2] ^T。

基于上面的内容，考虑到上述的3个病种的7个病例统计出的病情特征数据有100个，则对应的D为100*7的矩阵，所确定出h _A＝D*δ _A(X ^*)中的δ _A(X ^*)为7维列向量，δ _A(X ^*)＝[α _A1，α _A2，0，0，0，0，0] ^T；h _B＝D*δ _B(X ^*)中的δ _B(X ^*)为7维列向量，δ _B(X ^*)＝[0，0，α _B1，α _B2，α _B3，0，0] ^T；h _C＝D*δ _C(X ^*)中的δ _C(X ^*)为7维列向量，δ _C(X ^*)＝[0，0，0，0，0，α _C1，α _C2] ^T。这样上述的h _A、h _B以及h _C中的矩阵运算才满足矩阵乘法的准则。然后，将的h _A、h _B以及h _C的内容带入到上面的公式1中可以得到患者患病种A、病种B以及病种C的概率。

示例性的，通过将h _i代入公式1可以得到C＝[C ₁，C ₂，...，C _M，C _η，]，由上述的公式1中可以得知C _i满足C ₁+C ₂+...+C _M+C _η＝1，其中，C _η的计算公式如下：

通过上述的公式1和公式2可以得知，C _i反映了患者h属于病种D _i可能性的大小(C _η反映了患者h不属于前面任一病种D ₁-D _M的可能性)。这是因为C _i越大，表明构成患者h的病情特征分布向量中包含属于病种 D _i的病例越多，即患者h位于D _i语义子空间的部分越多，则属于病种D _i的可能性越大。图2示出了根据本公开一个实施例提供的一种语义空间的示意图。例如在图2中，假设已知病例空间中一共有三个病种或子空间，分别对应不同的形状：四角星、三角形、六角星，分别对应C的前三个维度，最后一个维度为误差C _η。圆形节点表示新来的患者。图2所示的两个圆圈分别表示用来表示新来患者的两种线性组合。第一种仅仅用四角星节点所代表的子空间就可以表示新来患者，第二种需要用所有的三个子空间来表示新来的患者。可以清楚地看到，对于左边的图有C＝[1，0，0，0]，即患者可能处于四角星所代表的子空间。对于右边的图有C＝[0.25，0.375，0.375，0]，则很难分析患者处于哪个子空间或属于哪个病种。

步骤103、根据患者患病例数据库中每个病种的可能性，输出患者的分诊结果。

其中，上述的分诊结果可以包括为患者分配的科室、进一步还可以包括分诊流程、为患者所分配的医生、以及可参考的治疗指南等。

示例性的，上述的步骤103可以采用以下任一种方式实现：

方式A、输出所有病种中可能性最大的病种作为患者的分诊结果。例如，计算患者患每个病种的可能性大小，且所确定出患者患病种A的可能性最大，则在分诊系统的界面上显示出患者患病种A所对应的分诊结果。

方式B、将所有病种中可能性不为零的病种，按照可能性大小顺序输出作为患者的分诊结果。例如，计算出患者患每个病种的可能性，并将所有病种中可能性不为零的病种按可能性从大到小的顺序排序，则在分诊系统的界面上从大到小依次显示出患者患每个病种的可能性的分诊结果。

在以上实施例提供的分诊方法中，首先，通过获取患者的病情特征数据；然后，根据患者的病情特征数据、以及病例数据库中所有病种下各病例的病情特征数据，确定患者患病例数据库中每个病种的可能性；最后，根据患者患病例数据库中每个病种的可能性，输出患者的分诊结果，从而实现了对患者的智能分诊，以减少医院的分诊压力。

下面将基于图1的分诊方法的实施例中的相关描述对本公开一些实施例提供的一种分诊装置进行介绍。以下实施例中与上述实施例相关的技术术语、概念等的说明可以参照上述的实施例，这里不再赘述。

图3示出了根据本公开一个实施例提供的一种分诊装置的结构示意图。如图3所示，该装置可以包括：获取器31、处理器32以及输出器33，其中：

获取器31可以配置成获取患者的病情特征数据。

处理器32可以配置成根据患者的病情特征数据、以及病例数据库中所有病种下各病例的病情特征数据，确定患者患所述病例数据库中每个病种的可能性。

输出器33可以配置成根据患者患病例数据库中每个病种的可能性，输出患者的分诊结果。

示例性的，该患者的病情特征数据可以是病情特征文本，也可以是表示该病情特征文本的数据。

示例性的，上述的病情特征数据可以包括：病情症状信息和/或体征检测参数，其中，病情症状信息可以为观察到患者的症状或患者感受到的症状，例如可以是患者的口述症状或输入的症状文本等，例如：心悸气短、肢体麻木、耳鸣等。而体征检测参数可以包括患者的各项指标检测值，例如血压值、血糖值等，其反映出的病情特征可以是血压微高、血压过高等。

示例性的，上述的患者患病例数据库中每个病种的可能性可以是指患者患每个病种的概率，用0至1间的数值进行表示。或者可以是是患者患每个病种的可能性对应的数值(可以为包含大于1的数值)，数值越大表示可能性越大。

示例性的，上述的病情特征数据为病情特征文本时，例如：患者的病情特征文本为眩晕、恶心以及心悸气短；上述的处理器32确定患者患病例数据库中每个病种的可能性的具体过程参照以下内容：这里病例数据库中的病种个数以3个为例，分别为病种A、病种B以及病种C，其中：病种A以包含3个病例为例，病种B以包含4个病例为例，病种C以包含5个病例为例，而患者所具有的病情特征以3个为例。将患者的病情特征与病例数据库中的每个病种下各病例中的病情特征文本进行匹配，若患者的3个病情特征均出现在病例数据库中病种A下的同一个病例中，且该患者的3个病情特征没有全部出现在其他病种下的病情特征文本中，则该患者患病种A的可能性最大；若患者的2个病情特征出现在病例数据库中病种A下的第一病例中，剩下的1个病情特征出现在病种A下的第二病例中，且该患者的3个病情特征没有全部出现在其他病种下的病情特征文本中，则该患者患病种A的可能性最大，但是相对于上面的结果较小。若患者的第1个病情特征出现在病例数据库中病种A下的第一病例中，第2个病情特征出现在病种A下的第二病例中，第3个病情特征出现在病种A下的第三病例中，且该患者的3个病情特征没有全部出现在其他病种下的病情特征文本中，则该患者患病种A的可能性最大，但是相对于上面的两种结果是最小的。

示例性的，上述的获取器31可以进一步配置成：

根据预设的向量元素的位置与元素所表示的病情特征的对应关系，将输入的患者的病情特征转换成患者的病情特征分布向量，患者的病情特征分布向量中的每个元素指示输入的患者的病情特征中是否出现该元素所在位置对应的病情特征。

具体的，假设数据库中有Q个病情特征，该预设的向量元素的位置与向量元素所表示的病情特征的对应关系用集合I表示，该集合I为Q维向量，I＝[I ₁，I ₂，...，I _Q] ^T。其中，I _j(1≤j≤Q)表示第j个位置处的病情特征，从而集合I表示的是从第1个位置处的病情特征到第Q个位置处的病情特征。

示例的，假设数据库中有1000个病情特征，上述的集合I为：I＝[I ₁，I ₂，...，I ₁₀₀₀] ^T。其中，I ₅₀₀为第500个位置处的病情特征，从而集合I表示从第1个位置处的病情特征到第1000个位置处的病情特征。

示例性的，上述的处理器32具体可以进一步配置成：

将所述患者的病情特征数据代入到关系模型h＝DX中，通过对所述关系模型求解X来确定满足预定条件的相关系数向量X ^*，其中，h为所述患者的病情特征分布向量，h和X均为列向量，D为由所述病例数据库中每个病种下各病例的病情特征分布向量组成的矩阵，D＝[D ₁， D ₂，......，D _i，......，D _M]，其中：D _i＝[D _i，1，D _i，2，...，D _i，j，...，D _i，K]，D _i，j为所述病例数据库中病种i的第j个病例的病例病情特征分布向量，所述K表示所述病例数据库中病种i包括K个病例，所述M表示病例数据库中包括M种疾病；

根据所述确定的相关系数向量X ^*，确定所述病例数据库中每个病种的可能性

在一些实施例中，如图3所示，该装置例如还可以包括转换器34，其中：转换器34可以配置成根据预设的向量元素的位置与向量元素所表示的病情特征的对应关系，将每个病种下各病例的病情特征转换成病例病情特征分布向量。其中，上述的病例的病情特征分布向量中的每个元素指示病例的病情特征中是否出现该元素所在位置对应的病情特征。

具体的，若病例数据库中有Q个病情特征，则病例数据库中每个病种下各病例的病情特征分布向量中包含Q个元素。

示例性的，病种A下的任一个病例的病情特征分布向量为D _A1＝[I ₁，I ₂，...，I _Q，] ^T。由于数据库中的病情特征的集合I为Q维向量，相应的这里的病种A下的任一个病例的病情特征分布向量也为0维向量。其中，I _j(1≤j≤Q)表示病种A下的任一个病例的第j个位置处的病情特征，从而D _A1表示的病种A下的任一个病例中从第1个位置处的病情特征到第Q个位置处的病情特征。

示例性的，上述的关系模型可以是预先建立好的，也可以是根据需要实时进行建立的，对于上述的关系模型的建立过程具体可以参考方法部分的内容，这里不再详细赘述。

示例性的，所述预定条件可以包括第一预定条件||DX-h|| ₂≤ε以及第二预定条件X ^*＝arg min||X|| ₁，其中||·|| ₁是L1范式，||·|| ₂是L2范式，所述ε为预设参数，正如之前所提到的，引入ε是为了降低“噪声”的影响，该参数的值取决于实现所需要达到的精度，X ^*＝arg min||X|| ₁表示使得||X|| ₁取最小值时的X，记为X ^*。

上述的处理器32在采用第一预定条件和第二预定来确定相关系数向量X ^*的过程中所采用的是稀疏解法，即在一定精度条件下使用最少的病例去重构患者h的病情特征，采用稀疏解法能够降低“噪音”数据的影响，使得上述的关系模型h＝DX具有良好的鲁棒性。

示例性的，当上述的处理器32在根据确定的相关系数向量X ^*，确定病例数据库中每个病种的可能性用概率来表示时，该处理器32可以进一步配置成：

从所述确定的相关系数向量X ^*中确定出所述病例数据库中每个病种的相关系数向量δ _i(X ^*)，δ _i(X ^*)表示通过将系数向量X ^*中属于病种D _i的维度乘以1，其余维度乘以0所得到的一个向量。也就是说，将X ^*中第i个病种下各病例的相关系数保留，其他元素置为0，得到δ _i(X ^*)。

示例性的，假设所确定的相关系数向量X ^*＝[α _A1，α _A2，α _B1，α _B2，α _B3，α _C1，α _C2] ^T，则病种A的相关系数向量为：δ _A(X ^*)＝[α _A1，α _A2，0，0，0，0，0] ^T；病种B的相关系数向量为：δ _B(X ^*)＝[0，0，α _B1，α _B2，α _B3，0，0] ^T；病种C的相关系数向量为： δ _C(X ^*)＝[0，0，0，0，0，α _C1，α _C2] ^T。

该处理器32可以进一步配置成根据所述病例数据库中每个病种的相关系数向量δ _i(X ^*)确定所述患者的病情特征分布向量h中对应每个病种的语义成分h _i＝D*δ _i(X ^*)。

该处理器32还可以进一步配置成将所述患者的病情特征分布向量h中对应每个病种的语义成分h _i＝D*δ _i(X ^*)代入到概率计算公式中，得到患者患病例数据库中每个病种的概率。

示例性的，上述的概率计算公式为：

其中，C _i表示患者患病例数据库中的病种i的概率，

中的M表示病例数据库中的M个病种，η为误差矩阵，该h＝h ₁+h ₂+.......+h _M+η，其中：h为新来患者的病情特征分布向量，h _i为所述患者的病情特征分布向量h中对应各病种i的语义成分(1≤i≤M)，而该h _i是由病种i下的所有病例的病情特征分布向量的线性组合。

是L2范式的平方。

示例性的，通过将h _i代入公式1可以得到C＝[C ₁，C ₂，...，C _M，C _η，]，，由上述的公式1中可以得知C _i满足C ₁+C ₂+...+C _M+C _η＝1，其中，C _η的计算公式如下：

通过上述的公式1和公式2可以得知，C _i反映了患者h属于病种D _i 可能性的大小(C _η反映了患者h不属于前面任一病种D ₁-D _M的可能性)。这是因为C _i越大，表明构成患者h的病情特征分布向量中包含属于病种D _i的病例越多，即患者h位于D _i语义子空间的部分越多，则属于病种D _i的可能性越大。例如在图2中，假设已知病例空间中一共有三个病种或子空间，分别对应不同的形状：四角星、三角形、六角星，分别对应C的前三个维度，最后一个维度为误差C _η。圆形节点表示新来的患者。图2所示的两个圆圈分别表示用来表示新来患者的两种线性组合。第一种仅仅用四角星节点所代表的子空间就可以表示新来患者，第二种需要用所有的三个子空间来表示新来的患者。可以清楚地看到，对于左边的图有C＝[1，0，0，0]，即患者可能处于四角星所代表的子空间。对于右边的图有C＝[0.25，0.375，0.375，0]，则很难分析患者处于哪个子空间或属于哪个病种。

示例性的，上述的分诊结果包括可参考的治疗指南、分诊流程以及所涉及的科室等信息。

示例性的，上述的输出器33可以进一步配置成采用以下任一种方式实现：

在上述实施例提供的分诊装置中，首先，该装置通过获取患者的病情特征数据；然后，根据患者的病情特征数据、以及病例数据库中所有病种下各病例的病情特征数据，确定患者患病例数据库中每个病种的可能性；最后，根据患者患病例数据库中每个病种的可能性，输出患者的分诊结果，从而实现了对患者的智能分诊，以减少医院的分诊压力。

根据本公开的另一个方面，提供了一种分诊设备400。图4示出了该分诊设备400的结构示意图。如图4所示，该分诊设备400可以包括：一个或多个处理器401；和与处理器401连接的存储器402，其上存储有计算机可执行指令，所述计算机可执行指令被配置为当被所述一个或多个处理器执行时，执行如上所述的任何一种方法的一个或多个步骤。

分诊设备400可以实现为本地计算的计算机产品结构，即在用户侧实现上述实施例所描述的分诊方法；也可以实现为本地和远端交互的计算机产品结构，即在用户侧的终端实现上述实施例所描述的分诊方法的部分步骤，例如病情特征数据的输入、分诊结果的输出；在与用户侧终端连接的网络端实现上述实施例所描述的分诊方法的其它步骤，例如患者患所述病例数据库中每个病种的可能性的计算。

在本公开的一些实施例中，分诊设备的一个或多个处理器可以位于同一计算机产品或不同的计算机产品。例如，部分处理器可以位于用户侧的计算机产品，部分处理器位于远端或云端的服务器的计算机产品，以分别执行分诊方法的部分步骤。

处理器401可以是中央处理单元(CPU)或者现场可编程逻辑阵列(FPGA)或者单片机(MCU)或者数字信号处理器(DSP)或者专用集成电路(ASIC)等具有数据处理能力和/或程序执行能力的逻辑运算器件。

存储器402可以是各种由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

计算机指令包括了一个或多个由对应于处理器的指令集架构定义的处理器操作，这些计算机指令可以被一个或多个计算机程序在逻辑上包含和表示。

该分诊设备400还可以连接各种输入设备403(例如用户界面、键盘等)、各种输出设备404(例如扬声器等)、以及显示设备405等实现计算机产品与其它产品或用户的交互，本文在此不再赘述。

连接可以是通过网络模块406连接，例如无线网络、有线网络、和/或无线网络和有线网络的任意组合。网络可以包括局域网、互联网、电信网、基于互联网和/或电信网的物联网(Internet of Things)、和/或以上网络的任意组合等。有线网络例如可以采用双绞线、同轴电缆或光纤传输等方式进行通信，无线网络例如可以采用3G/4G/5G移动通信网络、蓝牙、Zigbee或者Wi-Fi等通信方式。

根据本公开的另一个方面，还提供了一种计算机可读存储介质，其上包含有计算机可执行指令，所述指令在由一个或多个处理器执行时，使所述一个或多个处理器执行如上所述的任何一种方法的一个或多个步骤。

上述分诊设备和计算机可读存储介质的具体实现方式可以参照前面针对分诊方法的描述，在此不再赘述。本领域普通技术人员能够理解，上述分诊设备和计算机可读存储介质同样能够实现对患者的智能分诊，可以减少医院的分诊压力。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能器的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能器完成，即将装置的内部结构划分成不同的功能器，以完成以上描述的全部或者部分功能。上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的分诊装置，可以通过其它的方式实现。例如，以上所描述的装置的实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

可以理解的是，以上所述仅为本公开的示例性实施方式，但本公开的保护范围并不局限于此。应当指出的是，在不脱离本公开的精神和原理的前提下，本领域的普通技术人员可轻易想到各种变化或替换，这些变化或替换都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以所附权利要求的保护范围为准。

在权利要求书中，任何置于括号中的附图标记都不应当解释为限制权利要求。术语“包括”并不排除除了权利要求中所列出的元件或步骤之外的元件或步骤的存在。元件前的词语“一”或“一个”并不排除存在多个这样的元件。本公开可以借助于包括若干分离元件的硬件来实现，也可以通过适当编程的软件或固件来实现，或者通过它们的任意组合来实现。

在列举了若干装置的设备或系统权利要求中，这些装置中的一个或多个能够在同一个硬件项目中体现。仅仅某些措施记载在相互不同的从属权利要求中这个事实并不表明这些措施的组合不能被有利地使用。

Claims

一种分诊方法，所述方法包括：

获取患者的病情特征数据；

根据所述患者的病情特征数据、以及病例数据库中所有病种下各病例的病情特征数据，确定所述患者患所述病例数据库中每个病种的可能性；

根据所述患者患所述病例数据库中每个病种的可能性，输出所述患者的分诊结果。
根据权利要求1所述的方法，其中，所述病情特征数据包括病情症状信息和体征检测参数的至少一者。
根据权利要求1或2所述的方法，其中，所述获取患者的病情特征数据的步骤进一步包括：

根据预设的向量元素的位置与向量元素所表示的病情特征的对应关系，将输入的患者的病情特征转换成患者的病情特征分布向量，所述患者的病情特征分布向量中的每个元素指示所述输入的患者的病情特征中是否出现该元素所在位置对应的病情特征。
根据权利要求3所述的方法，其中，所述根据所述患者的病情特征数据、以及病例数据库中所有病种下各病例的病情特征数据，确定所述患者患所述病例数据库中每个病种的可能性的步骤进一步包括：

基于患者的病情特征分布向量，通过对关系模型h＝DX求解X来确定满足预定条件的相关系数向量X ^*，其中，h为所述患者的病情特征分布向量，h和X均为列向量，D为由所述病例数据库中每个病种下各病例的病情特征分布向量组成的矩阵，D＝[D ₁，D ₂，......，D _i，......，D _M]，其中：D _i＝[D _i，1，D _i，2，…，D _i，j，…，Di _，K]，D _i，j为所述病例数据库中病种i的第j个病例的病例病情特征分布向量，所述K表示所述病例数据库中病种i包括K个病例，所述M表示病例数据库中包括M种疾病；

根据所述确定的相关系数向量X ^*，确定所述病例数据库中每个病种的可能性。
根据权利要求4所述的方法，其中，所述方法还包括：

根据预设的向量元素的位置与向量元素所表示的病情特征的对应关系，将每个病种下各病例的病情特征转换成病例病情特征分布向量；所述病例的病情特征分布向量中的每个元素指示所述病例的病情特征中是否出现该元素所在位置对应的病情特征。
根据权利要求4所述的方法，其中，所述预定条件包括第一预定条件||DX-h|| ₂≤ε以及第二预定条件X ^*＝arg min||X|| ₁，其中：||·|| ₁是L1范式，||·|| ₂是L2范式，所述ε为预设参数。
根据权利要求4所述的方法，其中，根据所述确定的相关系数向量X ^*确定所述病例数据库中每个病种的可能性的步骤进一步包括：

从所述确定的相关系数向量X ^*中确定出所述病例数据库中每个病种的相关系数向量δ _i(X ^*)，δ _i(X ^*)表示通过将系数向量X ^*中属于病种Di的维度乘以1，其余维度乘以0所得到的一个向量；

根据所述病例数据库中每个病种的相关系数向量δ _i(X ^*)确定所述患者的病情特征分布向量h中对应每个病种的语义成分h _i＝D*δ _i(X ^*)；

将所述患者的病情特征分布向量h中对应每个病种的语义成分h _i＝D*δ _i(X ^*)代入到概率计算公式中，得到所述患者患所述病例数据库中每个病种的概率；

其中，所述概率计算公式为：
C _i表示所述患者患所述病例数据库中的病种i的概率，
中的M表示所述病例数据库中的M个病种，所述η为误差向量，所述
是L2范式的平方。
根据权利要求1所述的方法，其中，所述根据所述病例数据库中每个病种的可能性，输出所述患者的分诊结果的步骤进一步包括：将所有病种中可能性不为零的病种，按照可能性大小顺序输出作为所述患者的分诊结果。
根据权利要求8所述的方法，其中，输出所有病种中可能性最大的病种作为所述患者的分诊结果。
一种分诊装置，包括：

获取器，配置成获取患者的病情特征数据；

处理器，配置成根据所述患者的病情特征数据、以及病例数据库中所有病种下各病例的病情特征数据，确定所述患者患所述病例数据库中每个病种的可能性；

输出器，配置成根据所述患者患所述病例数据库中每个病种的可能性，输出所述患者的分诊结果。
根据权利要求10所述的装置，其中，所述病情特征数据包括病情症状信息和体征检测参数的至少一者。
根据权利要求10或11所述的装置，其中，所述获取器进一步配置成：

根据预设的向量元素的位置与向量元素所表示的病情特征的对应关系，将输入的患者的病情特征转换成患者的病情特征分布向量，所述患者的病情特征分布向量中的每个元素指示所述输入的患者的病情特征中是否出现该元素所在位置对应的病情特征。
根据权利要求12所述的装置，其中，所述处理器进一步配置成：

基于患者的病情特征分布向量，通过对关系模型h＝DX求解X来确定满足预定条件的相关系数向量X ^*，其中，h为所述患者的病情特征分布向量，h和X均为列向量，D为由所述病例数据库中每个病种下各病例的病情特征分布向量组成的矩阵，D＝[D ₁，D ₂，......，D _i，......，D _M]，其中：D _i＝[D _i，1，D _i，2，…，D _i，j，…，D _i，K]，D _i，j为所述病例数据库中病种i的第j个病例的病例病情特征分布向量，所述K表示所述病例数据库中病种i包括K个病例，所述M表示病例数据库中包括M种疾病；

根据所述确定的相关系数向量X ^*，确定所述病例数据库中每个病种的可能性。
根据权利要求13所述的装置，还包括转换器，该转换器配置成根据预设的向量元素的位置与向量元素所表示的病情特征的对应关系，将每个病种下各病例的病情特征转换成病例病情特征分布向量，所述病例病情特征分布向量中的每个元素指示病例的病情特征中是否出现该元素所在位置对应的病情特征。
根据权利要求13所述的装置，其中，所述预定条件包括第一预定条件||DX-h|| ₂≤ε以及第二预定条件X ^*＝arg min||X|| ₁，其中：||·|| ₁是L1范式，||·|| ₂是L2范式，所述ε为预设参数。
根据权利要求13所述的装置，其中，所述处理器在根据所述确定的相关系数向量X ^*，确定所述病例数据库中每个病种的可能性时，进一步配置成：

从所述确定的相关系数向量X ^*中确定出所述病例数据库中每个病种的相关系数向量δ _i(X ^*)，δ _i(X ^*)表示通过将系数向量X ^*中属于病种Di的维度乘以1，其余维度乘以0所得到的一个向量；

根据所述病例数据库中每个病种的相关系数向量δ _i(X ^*)确定所述患者的病情特征分布向量h中对应每个病种的语义成分h _i＝D*δ _i(X ^*)；

将所述患者的病情特征分布向量h中对应每个病种的语义成分h _i＝D*δ _i(X ^*)代入到概率计算公式中，得到所述患者患所述病例数据库中每个病种的概率；

其中，所述概率计算公式为：
C _i表示所述患者患所述病例数据库中的病种i的概率，
中的M表示所述病例数据库中的M个病种，所述η为误差向量，所述
是L2范式的平方。
根据权利要求10所述的装置，其中，所述输出器进一步配置成：

将所有病种中可能性不为零的病种，按照可能性大小顺序输出作为所述患者的分诊结果。
根据权利要求17所述的装置，其中，所述输出器进一步配置成：输出所有病种中可能性最大的病种作为所述患者的分诊结果。
一种分诊设备，包括：

一个或多个处理器；和

存储器，其上存储有计算机可执行指令，所述计算机可执行指令配置成当被所述一个或多个处理器执行时，执行如权利要求1-9中任何一项所述的方法的一个或多个步骤。
一种计算机可读存储介质，其上包含有计算机可执行指令，所述指令在由一个或多个处理器执行时，使所述一个或多个处理器执行如权利要求1-9中任何一项所述的方法的一个或多个步骤。