CN111161880B

CN111161880B - 基于分类模型的医疗信息分类方法、装置和计算机设备

Info

Publication number: CN111161880B
Application number: CN201911340809.8A
Authority: CN
Inventors: 丛柏森
Original assignee: Shenzhen Ping An Medical Health Technology Service Co Ltd
Current assignee: Shenzhen Ping An Medical Health Technology Service Co Ltd
Priority date: 2019-12-23
Filing date: 2019-12-23
Publication date: 2022-12-02
Anticipated expiration: 2039-12-23
Also published as: CN111161880A

Abstract

本申请揭示了一种基于分类模型的医疗信息分类方法、装置、计算机设备和存储介质，所述方法包括：获取指定对象的指定医疗信息；将指定医疗信息输入预设的疾病分类模型中的第一疾病预测架构中，得到第一预测疾病；将所述第一预测疾病输入所述选择连接层中，获取选择连接层选中的指定第二疾病预测架构；将所述第一预测疾病和所述指定医疗信息输入所述指定第二疾病预测架构中，从而得到第二预测疾病；将指定医疗信息、第一预测疾病和第二预测疾病，映射为疾病分类向量；计算标准分类向量与所述疾病分类向量的距离值；若所述距离值小于预设的距离阈值，则将所述指定医疗信息分类为所述指定类别。从而提高了分类的准确性。

Description

基于分类模型的医疗信息分类方法、装置和计算机设备

技术领域

本申请涉及到计算机领域，特别是涉及到一种基于分类模型的医疗信息分类方法、装置、计算机设备和存储介质。

背景技术

医疗信息的分类有利于医疗分析领域以及相关联领域等。目前的医疗信息分类，只着重于当前时间的数据，少多对医疗信息进行预测后再进行分类的技术方案。而仅以当前时间的数据作为分类标准，其数据利用率低，因为其分类粗糙，无法实现准确分类。因此当需要调用时(例如当医疗资源分配时需要调用医疗数据)，由于分类不准确的原因，容易造成数据调取出现偏颇，对最终的结果带来不利的影响。因此传统技术的医疗信息的分类方案的准确性需要提高。

发明内容

本申请的主要目的为提供一种基于分类模型的医疗信息分类方法、装置、计算机设备和存储介质，旨在提高分类的准确性。

为了实现上述发明目的，本申请提出一种基于分类模型的医疗信息分类方法，包括以下步骤：

获取指定对象的指定医疗信息，所述指定医疗信息至少包括指定对象的患病数据和关联患病数据，所述关联患病数据指关联对象的患症数据，所述关联对象指与所述指定对象存在血缘关系的对象；

将所述指定医疗信息输入预设的疾病分类模型中的第一疾病预测架构中，从而得到所述第一疾病预测架构输出的第一预测疾病，其中所述疾病分类模型由所述第一疾病预测架构、选择连接层和多个第二疾病预测架构顺序连接而成；

将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构，其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成；

将所述第一预测疾病和所述指定医疗信息输入所述指定第二疾病预测架构中，从而得到所述指定第二疾病预测架构输出的第二预测疾病；

根据预测的分类向量映射方法，将所述指定医疗信息、所述第一预测疾病和所述第二预测疾病，映射为疾病分类向量；

调取预设的标准分类向量，并计算所述标准分类向量与所述疾病分类向量的距离值，并判断所述距离值是否小于预设的距离阈值，其中所述标准分类向量标注有所述第一预测疾病和所述第二预测疾病，所述标准分类向量被标注为指定类别；

若所述距离值小于预设的距离阈值，则将所述指定医疗信息分类为所述指定类别。

进一步地，所述第一疾病预测架构为长短期记忆架构，所述将所述指定医疗信息输入预设的疾病分类模型中的第一疾病预测架构中，从而得到所述第一疾病预测架构输出的第一预测疾病的步骤,包括：

根据预设的时间向量映射方法，将所述指定医疗信息映射为初始时间向量序列，所述初始时间向量序列至少包括由所述指定对象的患病数据映射而成的第一子序列，和由所述关联患病数据映射而成的第二子序列；所述指定医疗信息、指定对象的患病数据和关联患病数据涉及的总时间均被划分为n个时间段，从而所述初始时间向量序列、第一子序列和第二子序列的构成元素的数量均为n；

将所述初始时间向量序列输入所述第一疾病预测架构中，从而根据公式：

e_ij＝score(s_i,h_j)，h_j＝LSTM_enc(x_j,h_j-1)，计算出预测时间向量，其中c_i为所述预测时间向量，a_ij为权重参数，s_i为所述第一疾病预测架构中的第i个隐藏状态向量，score(s_i,h_j)指采用预设的score函数根据s_i和h_j计算出的分数，h_j为第j个时间段的隐藏向量，h_j-1为第j-1个时间段的隐藏向量，X_j为所述初始时间向量序列中第j个构成元素，LSTM_enc指利用长短期记忆架构进行运算；

按照时间顺序，将所述预测时间向量组合成预测时间向量序列，并根据预设的向量解读方法，解读所述预测时间向量序列，从而得到不同时间段内的预测患病结果和对应的患病机率；

将所述患病机率高于预设机率阈值的预测患病结果记为第一预测疾病，并输出所述第一预测疾病。

进一步地，所述指定第二疾病预测架构基于神经网络模型训练而成，所述将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构，其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成的步骤之前，包括：

从疾病数据库中调取样本数据，并将所述样本数据分为训练集为验证集，其中所述样本数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成；

采用随机梯度下降法，利用所述训练集训练预设的神经网络模型，从而得到中间模型；

利用所述验证集验证所述中间模型，并判断验证是否通过；

若验证通过，则将所述中间模型记为所述指定第二疾病预测架构。

进一步地，所述将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构，其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成的步骤，包括：

查询预设的国际疾病分类库，从而获取与所述第一预测疾病对应的指定国际疾病分类号；

截取所述指定国际疾病分类号的前三位代码，并在预设的多个第二疾病预测架构中，选出标注有所述前三位代码的指定第二疾病预测架构，其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成。

进一步地，所述根据预测的分类向量映射方法，将所述指定医疗信息、所述第一预测疾病和所述第二预测疾病，映射为疾病分类向量的步骤,包括：

生成第一子向量(A11,A12,...,A1n；A21,A22,...,A2n；A31,A32,...,A3n)，其中A11,A12,...,A1n为所述第一预测疾病，所述A21,A22,...,A2n为与A11,A12,...,A1n一一对应的预测发病时间段，所述A31,A32,...,A3n为与A11,A12,...,A1n一一对应的预测发病机率，共有n种第一预测疾病；

生成第二子向量(B11,B12,...,B1m；B21,B22,...,B2m；B31,B32,...,B3m)，其中B11,B12,...,B1m为所述第二预测疾病，所述B21,B22,...,B2m为与B11,B12,...,B1m一一对应的预测发病时间段，所述B31,B32,...,B3m为与B11,B12,...,B1m一一对应的预测发病机率，共有m种第二预测疾病；

将所述初始时间向量序列、所述第一子向量和所述第二子向量顺序组合，从而得到所述疾病分类向量。

进一步地，所述计算所述标准分类向量与所述疾病分类向量的距离值的步骤,包括：

根据公式：

计算出所述标准分类向量与所述疾病分类向量的距离值D，其中，xi为所述标准分类向量的第i个分向量，yi为所述疾病分类向量的第i个分向量，所述标准分类向量与所述疾病分类向量均包括p个分向量。

进一步地，所述调取预设的标准分类向量，并计算所述标准分类向量与所述疾病分类向量的距离值，并判断所述距离值是否小于预设的距离阈值，其中所述标准分类向量标注有所述第一预测疾病和所述第二预测疾病，所述标准分类向量被标注为指定类别的步骤之后，包括：

若所述距离值不小于预设的距离阈值，则根据公式：

计算出复查指数Qi，其中，xi为所述标准分类向量的第i个分向量，yi为所述疾病分类向量的第i个分向量，所述标准分类向量与所述疾病分类向量均包括p个分向量；

从所述复查指数Qi中，获取数值最大的指定复查指数，并根据复查指数-分向量-数据来源的对应关系，获取与所述指定复查指数对应的指定数据来源，其中所述指定数据来源为所述指定医疗信息、所述第一疾病预测架构或者所述指定第二疾病预测架构；

生成复查提醒信息，并在所述复查提醒信息中附上复查顺序，所述复查顺序为首先复查所述指定数据来源。

本申请提供一种基于分类模型的医疗信息分类装置，包括：

指定医疗信息获取单元，用于获取指定对象的指定医疗信息，所述指定医疗信息至少包括指定对象的患病数据和关联患病数据，所述关联患病数据指关联对象的患症数据，所述关联对象指与所述指定对象存在血缘关系的对象；

第一预测疾病获取单元，用于将所述指定医疗信息输入预设的疾病分类模型中的第一疾病预测架构中，从而得到所述第一疾病预测架构输出的第一预测疾病，其中所述疾病分类模型由所述第一疾病预测架构、选择连接层和多个第二疾病预测架构顺序连接而成；

预测架构选择单元，用于将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构，其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成；

第二预测疾病获取单元，用于将所述第一预测疾病和所述指定医疗信息输入所述指定第二疾病预测架构中，从而得到所述指定第二疾病预测架构输出的第二预测疾病；

疾病分类向量映射单元，用于根据预测的分类向量映射方法，将所述指定医疗信息、所述第一预测疾病和所述第二预测疾病，映射为疾病分类向量；

距离阈值判断单元，用于调取预设的标准分类向量，并计算所述标准分类向量与所述疾病分类向量的距离值，并判断所述距离值是否小于预设的距离阈值，其中所述标准分类向量标注有所述第一预测疾病和所述第二预测疾病，所述标准分类向量被标注为指定类别；

指定类别划分单元，用于若所述距离值小于预设的距离阈值，则将所述指定医疗信息分类为所述指定类别。

本申请提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请的基于分类模型的医疗信息分类方法、装置、计算机设备和存储介质，获取指定对象的指定医疗信息；将所述指定医疗信息输入预设的疾病分类模型中的第一疾病预测架构中，从而得到所述第一疾病预测架构输出的第一预测疾病；将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构；将所述第一预测疾病和所述指定医疗信息输入所述指定第二疾病预测架构中，从而得到所述指定第二疾病预测架构输出的第二预测疾病；将所述指定医疗信息、所述第一预测疾病和所述第二预测疾病，映射为疾病分类向量；计算标准分类向量与所述疾病分类向量的距离值；若所述距离值小于预设的距离阈值，则将所述指定医疗信息分类为所述指定类别。从而提高了分类的准确性。

附图说明

图1为本申请一实施例的基于分类模型的医疗信息分类方法的流程示意图；

图2为本申请一实施例的基于分类模型的医疗信息分类装置的结构示意框图；

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，本申请实施例提供一种基于分类模型的医疗信息分类方法，包括以下步骤：

S1、获取指定对象的指定医疗信息，所述指定医疗信息至少包括指定对象的患病数据和关联患病数据，所述关联患病数据指关联对象的患症数据，所述关联对象指与所述指定对象存在血缘关系的对象；

S2、将所述指定医疗信息输入预设的疾病分类模型中的第一疾病预测架构中，从而得到所述第一疾病预测架构输出的第一预测疾病，其中所述疾病分类模型由所述第一疾病预测架构、选择连接层和多个第二疾病预测架构顺序连接而成；

S3、将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构，其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成；

S4、将所述第一预测疾病和所述指定医疗信息输入所述指定第二疾病预测架构中，从而得到所述指定第二疾病预测架构输出的第二预测疾病；

S5、根据预测的分类向量映射方法，将所述指定医疗信息、所述第一预测疾病和所述第二预测疾病，映射为疾病分类向量；

S6、调取预设的标准分类向量，并计算所述标准分类向量与所述疾病分类向量的距离值，并判断所述距离值是否小于预设的距离阈值，其中所述标准分类向量标注有所述第一预测疾病和所述第二预测疾病，所述标准分类向量被标注为指定类别；

S7、若所述距离值小于预设的距离阈值，则将所述指定医疗信息分类为所述指定类别。

本申请采用的基于分类模型的医疗信息分类方法，例如可用于医疗分析领域、医疗资源调配领域等，但不用于疾病的诊断和治疗。

如上述步骤S1所述，获取指定对象的指定医疗信息，所述指定医疗信息至少包括指定对象的患病数据和关联患病数据，所述关联患病数据指关联对象的患症数据，所述关联对象指与所述指定对象存在血缘关系的对象。指定医疗信息存在两种身份，一种是作为分类的依据之一，另一种是作为预测疾病的依据。从而相对于传统技术，本申请的医疗信息分类能够实现更细致、更准确的分类。传统的医疗信息分类，一般只着重于直接对象，而忽略了与其存在血缘关系的对象。本申请还引入了关联患病数据，所述关联患病数据指关联对象的患症数据，所述关联对象指与所述指定对象存在血缘关系的对象。因为血缘关系的缘因，诸如遗传病等疾病具有关联性，适于作为疾病预测的依据，从而使疾病的预测更准确。

如上述步骤S2所述,将所述指定医疗信息输入预设的疾病分类模型中的第一疾病预测架构中，从而得到所述第一疾病预测架构输出的第一预测疾病，其中所述疾病分类模型由所述第一疾病预测架构、选择连接层和多个第二疾病预测架构顺序连接而成。本申请采用的是特殊结构的疾病分类模型，即所述疾病分类模型由所述第一疾病预测架构、选择连接层和多个第二疾病预测架构顺序连接而成。其中第一疾病预测架构用于直接根据指定医疗信息预测出第一预测疾病(或称常规预测疾病)，第二疾病预测架构是小体量架构，用于预测与第一预测疾病关联的其他疾病(即第二预测疾病)。这是由于有些疾病是具有伴生特性的，这是人体特殊生理结构本身所决定的，因此第二疾病预测架构用于预测这些伴生疾病，以提高预测全面性。其中，所述选择连接层用于选择使用哪一个第二疾病预测架构。因此，所述第一预测疾病是根据指定对象的指定医疗信息，运用机器学习模型(即第一疾病预测架构)预测得到的；所述第二预测疾病是在所述第一预测疾病的基础上，根据指定对象的指定医疗信息，选择与第一预测疾病关联的第二疾病预测架构预测而得到，其中由于所述第二疾病预测架构是更精确的疾病预测架构，其由于已经确认了第一预测疾病的存在，因此在所述第二疾病预测架构中进行训练、运算时，相对于第一预测架构，对所述指定医疗信息的注重偏重将会不同，从而能够预测出不同的第二预测疾病。进一步地，所述第二疾病预测架构输入的医疗信息，还可以包括新增加的医疗数据，从而进一步提高预测的准确性。

如上述步骤S3所述，将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构，其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成。其中预设的选择方法，例如为：、查询预设的国际疾病分类库，从而获取与所述第一预测疾病对应的指定国际疾病分类号；截取所述指定国际疾病分类号的前三位代码，并在预设的多个第二疾病预测架构中，选出标注有所述前三位代码的指定第二疾病预测架构。其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成，因此每个第二疾病预测架构只需要关注一个第一预测疾病即可，从而针对性强，需要的训练数据也较少，从而提高了训练效率，并且预测准确性也更高。

如上述步骤S4所述，将所述第一预测疾病和所述指定医疗信息输入所述指定第二疾病预测架构中，从而得到所述指定第二疾病预测架构输出的第二预测疾病。第二疾病预测架构是小体量架构，用于预测与第一预测疾病关联的其他疾病(即第二预测疾病)。这是由于有些疾病是具有伴生特性的，这是人体特殊生理结构本身所决定的，因此第二疾病预测架构用于预测这些伴生疾病，以提高预测全面性。所述第二疾病预测架构可采用任意可行模型，例如神经网络模型。

如上述步骤S5所述，根据预测的分类向量映射方法，将所述指定医疗信息、所述第一预测疾病和所述第二预测疾病，映射为疾病分类向量。所述分类向量映射方法，例如为：生成第一子向量(A11,A12,...,A1n；A21,A22,...,A2n；A31,A32,...,A3n)，其中A11,A12,...,A1n为所述第一预测疾病，所述A21,A22,...,A2n为与A11,A12,...,A1n一一对应的预测发病时间段，所述A31,A32,...,A3n为与A11,A12,...,A1n一一对应的预测发病机率，共有n种第一预测疾病；生成第二子向量(B11,B12,...,B1m；B21,B22,...,B2m；B31,B32,...,B3m)，其中B11,B12,...,B1m为所述第二预测疾病，所述B21,B22,...,B2m为与B11,B12,...,B1m一一对应的预测发病时间段，所述B31,B32,...,B3m为与B11,B12,...,B1m一一对应的预测发病机率，共有m种第二预测疾病；将所述初始时间向量序列、所述第一子向量和所述第二子向量顺序组合，从而得到所述疾病分类向量。从而以疾病分类向量作为分类依据，且所述疾病分类向量综合了所述指定医疗信息、所述第一预测疾病和所述第二预测疾病的信息，因此分类更细致更准确。

如上述步骤S6所述，调取预设的标准分类向量，并计算所述标准分类向量与所述疾病分类向量的距离值，并判断所述距离值是否小于预设的距离阈值，其中所述标准分类向量标注有所述第一预测疾病和所述第二预测疾病，所述标准分类向量被标注为指定类别。所述距离值用于衡量标准分类向量与所述疾病分类向量的相似度，距离值越小，表明越相似。所述计算所述标准分类向量与所述疾病分类向量的距离值，例如为：根据公式：

计算出所述标准分类向量与所述疾病分类向量的距离值D，其中，xi为所述标准分类向量的第i个分向量，yi为所述疾病分类向量的第i个分向量，所述标准分类向量与所述疾病分类向量均包括p个分向量。从而确知所述标准分类向量与所述疾病分类向量的对比结果。

如上述步骤S7所述，若所述距离值小于预设的距离阈值，则将所述指定医疗信息分类为所述指定类别。若所述距离值小于预设的距离阈值，表明所述标准分类向量与所述疾病分类向量相似，因此将所述指定医疗信息分类为所述指定类别。即，所有与所述标准分类向量相似的医疗数据，都将被分类为所述指定类别，从而所述指定类别下将汇聚有相同或相似的医疗信息、所述第一预测疾病和所述第二预测疾病构成的数据，从而实现了医疗数据的细致且准确分类。

在一个实施方式中，所述第一疾病预测架构为长短期记忆架构，所述将所述指定医疗信息输入预设的疾病分类模型中的第一疾病预测架构中，从而得到所述第一疾病预测架构输出的第一预测疾病的步骤S2,包括：

S201、根据预设的时间向量映射方法，将所述指定医疗信息映射为初始时间向量序列，所述初始时间向量序列至少包括由所述指定对象的患病数据映射而成的第一子序列，和由所述关联患病数据映射而成的第二子序列；所述指定医疗信息、指定对象的患病数据和关联患病数据涉及的总时间均被划分为n个时间段，从而所述初始时间向量序列、第一子序列和第二子序列的构成元素的数量均为n；

S202、将所述初始时间向量序列输入所述第一疾病预测架构中，从而根据公式：

S203、按照时间顺序，将所述预测时间向量组合成预测时间向量序列，并根据预设的向量解读方法，解读所述预测时间向量序列，从而得到不同时间段内的预测患病结果和对应的患病机率；

S204、将所述患病机率高于预设机率阈值的预测患病结果记为第一预测疾病，并输出所述第一预测疾病。

如上所述，实现了得到所述第一疾病预测架构输出的第一预测疾病。本申请采用的所述第一疾病预测架构为长短期记忆架构，长短期记忆网络是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件，相对于普通神经网络，其内加入了遗忘门，以将无用信息遗忘，从而避免了长序依赖的问题，对于本申请的疾病预测，尤为合适。并且本申请的输入数据所述指定对象的患病数据映射而成的第一子序列，和所述关联患病数据映射而成的第二子序列所构成，从而引入关联患病数据，以提高预测准确性。再采用公式：

e_ij＝score(s_i,h_j)，h_j＝LSTM_enc(x_j,h_j-1)，计算出预测时间向量。其中时间向量中包括代表疾病类型的分向量，和代表发病机率的分向量，以及代表发病时间的分向量。因此根据预设的向量解读方法，解读所述预测时间向量序列，即可得到不同时间段内的预测患病结果和对应的患病机率。再将所述患病机率高于预设机率阈值的预测患病结果记为第一预测疾病，并输出所述第一预测疾病。从而提高预测准确性并实现分时段的疾病预测。

在一个实施方式中，所述指定第二疾病预测架构基于神经网络模型训练而成，所述将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构，其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成的步骤S3之前，包括：

S21、从疾病数据库中调取样本数据，并将所述样本数据分为训练集为验证集，其中所述样本数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成；

S22、采用随机梯度下降法，利用所述训练集训练预设的神经网络模型，从而得到中间模型；

S23、利用所述验证集验证所述中间模型，并判断验证是否通过；

S24、若验证通过，则将所述中间模型记为所述指定第二疾病预测架构。

如上所述，实现了训练所述指定第二疾病预测架构。所述指定第二疾病预测架构基于神经网络模型训练而成，所述神经网络模型可为任意可行模型，例如VGG19模型、DPN131模型、InceptionV3模型等。样本数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成，这是因为指定第二疾病预测架构只需要满足第一预测疾病相关的预测任务即可，因此不引入其他疾病相关的数据，以避免网络参数受到不利的干扰，也因此样本数据的数据是仅针对第一预测疾病的，因此数据总量可控，从而训练速度得到了提高。据此，从疾病数据库中调取样本数据，并将所述样本数据分为训练集为验证集；采用随机梯度下降法，利用所述训练集训练预设的神经网络模型，从而得到中间模型；利用所述验证集验证所述中间模型，并判断验证是否通过；若验证通过，则将所述中间模型记为所述指定第二疾病预测架构。其中随机梯度下降法，即随机取样，以取代整个训练集，从而进一步提高训练速度。

在一个实施方式中，所述将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构，其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成的步骤S3，包括：

S301、查询预设的国际疾病分类库，从而获取与所述第一预测疾病对应的指定国际疾病分类号；

S302、截取所述指定国际疾病分类号的前三位代码，并在预设的多个第二疾病预测架构中，选出标注有所述前三位代码的指定第二疾病预测架构，其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成。

如上所述，实现了将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构。其中国际疾病分类(International Classification of Diseases，ICD)指根据疾病的某些特征，按照规则将疾病分门别类，并用编码的方法来表示的系统，本申请例如采用ICD-10、ICD11版本。国际疾病分类号的前三位代码，代表了疾病的类目，可作为疾病的类别区分。本申请采用指定国际疾病分类号的前三位代码，作为选择第二疾病预测架构的依据，即所述第二疾病预测架构预先标注有三位代码，用于代表关联的第一预测疾病。从而简单高效地将与第一预测疾病关联的指定第二疾病预测架构筛选了出来。

在一个实施方式中，所述根据预测的分类向量映射方法，将所述指定医疗信息、所述第一预测疾病和所述第二预测疾病，映射为疾病分类向量的步骤S5,包括：

S501、生成第一子向量(A11,A12,...,A1n；A21,A22,...,A2n；A31,A32,...,A3n)，其中A11,A12,...,A1n为所述第一预测疾病，所述A21,A22,...,A2n为与A11,A12,...,A1n一一对应的预测发病时间段，所述A31,A32,...,A3n为与A11,A12,...,A1n一一对应的预测发病机率，共有n种第一预测疾病；

S502、生成第二子向量(B11,B12,...,B1m；B21,B22,...,B2m；B31,B32,...,B3m)，其中B11,B12,...,B1m为所述第二预测疾病，所述B21,B22,...,B2m为与B11,B12,...,B1m一一对应的预测发病时间段，所述B31,B32,...,B3m为与B11,B12,...,B1m一一对应的预测发病机率，共有m种第二预测疾病；

S503、将所述初始时间向量序列、所述第一子向量和所述第二子向量顺序组合，从而得到所述疾病分类向量。

如上所述，实现了根据预测的分类向量映射方法，将所述指定医疗信息、所述第一预测疾病和所述第二预测疾病，映射为疾病分类向量。本申请的分类向量映射，引入了预测发病时间段和预测发病机率；并且还引入了第二子向量，所述第二子向量是由关联对象的患症数据而生成；再引入反应所述指定对象的指定医疗信息的初始时间向量序列，从而使映射得到的疾病分类向量能够全面反应所述指定医疗信息、所述第一预测疾病和所述第二预测疾病。而疾病分类向量是医疗信息分类的依据，也即医疗信息分类是以所述指定医疗信息、所述第一预测疾病和所述第二预测疾病为依据，从而提高医疗信息分类的细致且准确性。

在一个实施方式中，所述计算所述标准分类向量与所述疾病分类向量的距离值的步骤S6,包括：

S601、根据公式：

如上所述，实现了计算所述标准分类向量与所述疾病分类向量的距离值。本申请采用根据公式：

计算出所述标准分类向量与所述疾病分类向量的距离值D的方式，使得距离值D不仅衡量了所述标准分类向量的向量长度与所述疾病分类向量的向量长度之间的差异，还衡量所述标准分类向量与所述疾病分类向量的角度差异，从而计算得到的距离值D的准确性更高，更能体现所述标准分类向量与所述疾病分类向量之间的差异性。

在一个实施方式中，所述调取预设的标准分类向量，并计算所述标准分类向量与所述疾病分类向量的距离值，并判断所述距离值是否小于预设的距离阈值，其中所述标准分类向量标注有所述第一预测疾病和所述第二预测疾病，所述标准分类向量被标注为指定类别的步骤S6之后，包括：

S61、若所述距离值不小于预设的距离阈值，则根据公式：

S62、从所述复查指数Qi中，获取数值最大的指定复查指数，并根据复查指数-分向量-数据来源的对应关系，获取与所述指定复查指数对应的指定数据来源，其中所述指定数据来源为所述指定医疗信息、所述第一疾病预测架构或者所述指定第二疾病预测架构；

S63、生成复查提醒信息，并在所述复查提醒信息中附上复查顺序，所述复查顺序为首先复查所述指定数据来源。

如上所述，实现了生成复查提醒信息，并在所述复查提醒信息中附上复查顺序。本申请采用了的特殊的疾病分类模型，即所述疾病分类模型由所述第一疾病预测架构、选择连接层和多个第二疾病预测架构顺序连接而成。其中第一疾病预测架构与多个第二疾病预测架构相对独立，因此可进行分别训练，也便于对可能出现的预测错误的进行排查。若所述距离值不小于预设的距离阈值，表明所述指定医疗信息无法进行分类，这可能是预测结果有误，因此需要进行复查。由于可复查的部分包括：所述指定医疗信息、所述第一疾病预测架构或者所述指定第二疾病预测架构，因此复查的顺序尤其重要。本申请采用根据公式：

计算出复查指数Qi；从所述复查指数Qi中，获取数值最大的指定复查指数，并根据复查指数-分向量-数据来源的对应关系，获取与所述指定复查指数对应的指定数据来源；生成复查提醒信息，并在所述复查提醒信息中附上复查顺序，所述复查顺序为首先复查所述指定数据来源的方式，找出错误最可能的来源，即所述指定复查指数对应的指定数据来源。因此要后续的复查过程中，依据所述复查顺序就能提高复查的效率，有利于及早修复疾病分类模型。

本申请的基于分类模型的医疗信息分类方法，获取指定对象的指定医疗信息；将所述指定医疗信息输入预设的疾病分类模型中的第一疾病预测架构中，从而得到所述第一疾病预测架构输出的第一预测疾病；将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构；将所述第一预测疾病和所述指定医疗信息输入所述指定第二疾病预测架构中，从而得到所述指定第二疾病预测架构输出的第二预测疾病；将所述指定医疗信息、所述第一预测疾病和所述第二预测疾病，映射为疾病分类向量；计算标准分类向量与所述疾病分类向量的距离值；若所述距离值小于预设的距离阈值，则将所述指定医疗信息分类为所述指定类别。从而提高了分类的准确性。

参照图2，本申请实施例提供一种基于分类模型的医疗信息分类装置，包括：

指定医疗信息获取单元10，用于获取指定对象的指定医疗信息，所述指定医疗信息至少包括指定对象的患病数据和关联患病数据，所述关联患病数据指关联对象的患症数据，所述关联对象指与所述指定对象存在血缘关系的对象；

第一预测疾病获取单元20，用于将所述指定医疗信息输入预设的疾病分类模型中的第一疾病预测架构中，从而得到所述第一疾病预测架构输出的第一预测疾病，其中所述疾病分类模型由所述第一疾病预测架构、选择连接层和多个第二疾病预测架构顺序连接而成；

预测架构选择单元30，用于将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构，其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成；

第二预测疾病获取单元40，用于将所述第一预测疾病和所述指定医疗信息输入所述指定第二疾病预测架构中，从而得到所述指定第二疾病预测架构输出的第二预测疾病；

疾病分类向量映射单元50，用于根据预测的分类向量映射方法，将所述指定医疗信息、所述第一预测疾病和所述第二预测疾病，映射为疾病分类向量；

距离阈值判断单元60，用于调取预设的标准分类向量，并计算所述标准分类向量与所述疾病分类向量的距离值，并判断所述距离值是否小于预设的距离阈值，其中所述标准分类向量标注有所述第一预测疾病和所述第二预测疾病，所述标准分类向量被标注为指定类别；

指定类别划分单元70，用于若所述距离值小于预设的距离阈值，则将所述指定医疗信息分类为所述指定类别。

其中上述单元分别用于执行的操作与前述实施方式的基于分类模型的医疗信息分类方法的步骤一一对应,在此不再赘述。

在一个实施方式中，所述第一疾病预测架构为长短期记忆架构，所述第一预测疾病获取单元20,包括：

初始时间向量序列获取子单元，用于根据预设的时间向量映射方法，将所述指定医疗信息映射为初始时间向量序列，所述初始时间向量序列至少包括由所述指定对象的患病数据映射而成的第一子序列，和由所述关联患病数据映射而成的第二子序列；所述指定医疗信息、指定对象的患病数据和关联患病数据涉及的总时间均被划分为n个时间段，从而所述初始时间向量序列、第一子序列和第二子序列的构成元素的数量均为n；

预测时间向量计算子单元，用于将所述初始时间向量序列输入所述第一疾病预测架构中，从而根据公式：

预测时间向量序列解读子单元，用于按照时间顺序，将所述预测时间向量组合成预测时间向量序列，并根据预设的向量解读方法，解读所述预测时间向量序列，从而得到不同时间段内的预测患病结果和对应的患病机率；

第一预测疾病输出子单元，用于将所述患病机率高于预设机率阈值的预测患病结果记为第一预测疾病，并输出所述第一预测疾病。

其中上述子单元分别用于执行的操作与前述实施方式的基于分类模型的医疗信息分类方法的步骤一一对应,在此不再赘述。

在一个实施方式中，所述指定第二疾病预测架构基于神经网络模型训练而成，所述装置，包括：

样本数据调取单元，用于从疾病数据库中调取样本数据，并将所述样本数据分为训练集为验证集，其中所述样本数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成；

中间模型获取单元，用于采用随机梯度下降法，利用所述训练集训练预设的神经网络模型，从而得到中间模型；

中间模型验证单元，用于利用所述验证集验证所述中间模型，并判断验证是否通过；

中间模型标记单元，用于若验证通过，则将所述中间模型记为所述指定第二疾病预测架构。

在一个实施方式中，所述预测架构选择单元30，包括：

指定国际疾病分类号获取子单元，用于查询预设的国际疾病分类库，从而获取与所述第一预测疾病对应的指定国际疾病分类号；

指定第二疾病预测架构选取子单元，用于截取所述指定国际疾病分类号的前三位代码，并在预设的多个第二疾病预测架构中，选出标注有所述前三位代码的指定第二疾病预测架构，其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成。

在一个实施方式中，所述疾病分类向量映射单元50,包括：

第一子向量生成子单元，用于生成第一子向量(A11,A12,...,A1n；A21,A22,...,A2n；A31,A32,...,A3n)，其中A11,A12,...,A1n为所述第一预测疾病，所述A21,A22,...,A2n为与A11,A12,...,A1n一一对应的预测发病时间段，所述A31,A32,...,A3n为与A11,A12,...,A1n一一对应的预测发病机率，共有n种第一预测疾病；

第二子向量生成子单元，用于生成第二子向量(B11,B12,...,B1m；B21,B22,...,B2m；B31,B32,...,B3m)，其中B11,B12,...,B1m为所述第二预测疾病，所述B21,B22,...,B2m为与B11,B12,...,B1m一一对应的预测发病时间段，所述B31,B32,...,B3m为与B11,B12,...,B1m一一对应的预测发病机率，共有m种第二预测疾病；

疾病分类向量获取子单元，用于将所述初始时间向量序列、所述第一子向量和所述第二子向量顺序组合，从而得到所述疾病分类向量。

在一个实施方式中，所述距离阈值判断单元60,包括：

距离值D计算子单元，用于根据公式：

在一个实施方式中，所述装置，包括：

复查指数Qi计算单元，用于若所述距离值不小于预设的距离阈值，则根据公式：

指定复查指数获取单元，用于从所述复查指数Qi中，获取数值最大的指定复查指数，并根据复查指数-分向量-数据来源的对应关系，获取与所述指定复查指数对应的指定数据来源，其中所述指定数据来源为所述指定医疗信息、所述第一疾病预测架构或者所述指定第二疾病预测架构；

复查提醒信息生成单元，用于生成复查提醒信息，并在所述复查提醒信息中附上复查顺序，所述复查顺序为首先复查所述指定数据来源。

本申请的基于分类模型的医疗信息分类装置，获取指定对象的指定医疗信息；将所述指定医疗信息输入预设的疾病分类模型中的第一疾病预测架构中，从而得到所述第一疾病预测架构输出的第一预测疾病；将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构；将所述第一预测疾病和所述指定医疗信息输入所述指定第二疾病预测架构中，从而得到所述指定第二疾病预测架构输出的第二预测疾病；将所述指定医疗信息、所述第一预测疾病和所述第二预测疾病，映射为疾病分类向量；计算标准分类向量与所述疾病分类向量的距离值；若所述距离值小于预设的距离阈值，则将所述指定医疗信息分类为所述指定类别。从而提高了分类的准确性。

参照图3，本发明实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于分类模型的医疗信息分类方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于分类模型的医疗信息分类方法。

上述处理器执行上述基于分类模型的医疗信息分类方法，其中所述方法包括的步骤分别与执行前述实施方式的基于分类模型的医疗信息分类方法的步骤一一对应,在此不再赘述。

本领域技术人员可以理解，图中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请的计算机设备，获取指定对象的指定医疗信息；将所述指定医疗信息输入预设的疾病分类模型中的第一疾病预测架构中，从而得到所述第一疾病预测架构输出的第一预测疾病；将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构；将所述第一预测疾病和所述指定医疗信息输入所述指定第二疾病预测架构中，从而得到所述指定第二疾病预测架构输出的第二预测疾病；将所述指定医疗信息、所述第一预测疾病和所述第二预测疾病，映射为疾病分类向量；计算标准分类向量与所述疾病分类向量的距离值；若所述距离值小于预设的距离阈值，则将所述指定医疗信息分类为所述指定类别。从而提高了分类的准确性。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现基于分类模型的医疗信息分类方法，其中所述方法包括的步骤分别与执行前述实施方式的基于分类模型的医疗信息分类方法的步骤一一对应,在此不再赘述。

本申请的计算机可读存储介质，获取指定对象的指定医疗信息；将所述指定医疗信息输入预设的疾病分类模型中的第一疾病预测架构中，从而得到所述第一疾病预测架构输出的第一预测疾病；将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构；将所述第一预测疾病和所述指定医疗信息输入所述指定第二疾病预测架构中，从而得到所述指定第二疾病预测架构输出的第二预测疾病；将所述指定医疗信息、所述第一预测疾病和所述第二预测疾病，映射为疾病分类向量；计算标准分类向量与所述疾病分类向量的距离值；若所述距离值小于预设的距离阈值，则将所述指定医疗信息分类为所述指定类别。从而提高了分类的准确性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种基于分类模型的医疗信息分类方法，其特征在于，包括：

2.根据权利要求1所述的基于分类模型的医疗信息分类方法，其特征在于，所述第一疾病预测架构为长短期记忆架构，所述将所述指定医疗信息输入预设的疾病分类模型中的第一疾病预测架构中，从而得到所述第一疾病预测架构输出的第一预测疾病的步骤,包括：

e_ij＝score(s_i,h_j)，h_j＝LSTM_enc(x_j,h_j-1)，

计算出预测时间向量，其中c_i为所述预测时间向量，a_ij为权重参数，s_i为所述第一疾病预测架构中的第i个隐藏状态向量，score(s_i,h_j)指采用预设的score函数根据s_i和h_j计算出的分数，h_j为第j个时间段的隐藏向量，h_j-1为第j-1个时间段的隐藏向量，X_j为所述初始时间向量序列中第j个构成元素，LSTM_enc指利用长短期记忆架构进行运算；

3.根据权利要求1所述的基于分类模型的医疗信息分类方法，其特征在于，所述指定第二疾病预测架构基于神经网络模型训练而成，所述将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构，其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成的步骤之前，包括：

利用所述验证集验证所述中间模型，并判断验证是否通过；

4.根据权利要求1所述的基于分类模型的医疗信息分类方法，其特征在于，所述将所述第一预测疾病输入所述选择连接层中，从而根据预设的选择方法，获取所述选择连接层选中的指定第二疾病预测架构，其中所述指定第二疾病预测架构通过训练数据训练而成，所述训练数据仅由所述第一预测疾病、与所述第一预测疾病关联的医疗信息和与所述第一预测疾病关联的其他疾病所构成的步骤，包括：

5.根据权利要求2所述的基于分类模型的医疗信息分类方法，其特征在于，所述根据预测的分类向量映射方法，将所述指定医疗信息、所述第一预测疾病和所述第二预测疾病，映射为疾病分类向量的步骤,包括：

6.根据权利要求1所述的基于分类模型的医疗信息分类方法，其特征在于，所述计算所述标准分类向量与所述疾病分类向量的距离值的步骤,包括：

根据公式：

7.根据权利要求1所述的基于分类模型的医疗信息分类方法，其特征在于，所述调取预设的标准分类向量，并计算所述标准分类向量与所述疾病分类向量的距离值，并判断所述距离值是否小于预设的距离阈值，其中所述标准分类向量标注有所述第一预测疾病和所述第二预测疾病，所述标准分类向量被标注为指定类别的步骤之后，包括：

若所述距离值不小于预设的距离阈值，则根据公式：

8.一种基于分类模型的医疗信息分类装置，其特征在于，包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。