CN108461152A

CN108461152A - 医疗模型训练方法、医疗识别方法、装置、设备及介质

Info

Publication number: CN108461152A
Application number: CN201810030552.5A
Authority: CN
Inventors: 鲁宁; 周凡; 程诚
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-01-12
Filing date: 2018-01-12
Publication date: 2018-08-28
Also published as: WO2019136806A1

Abstract

本发明公开了一种医疗模型训练方法、医疗识别方法、装置、设备及介质。该医疗模型训练方法包括：获取目标医疗数据；将所述目标医疗数据按预设比例进行划分，获取训练集和测试集；采用所述训练集中的目标医疗数据对长短时记忆网络模型进行训练，获取原始医疗模型；采用所述测试集中的目标医疗数据对所述原始医疗模型进行测试，获取目标医疗模型。该医疗模型训练方法解决了当前疾病的识别只能依赖于医生，无法使用户更具自身自身的症状情况及时了解自身的健康情况的问题，并且提高了疾病识别的准确率。

Description

医疗模型训练方法、医疗识别方法、装置、设备及介质

技术领域

本发明涉及数据识别领域，尤其涉及一种医疗模型训练方法、医疗识别方法、装置、设备及介质。

背景技术

当前疾病的识别通常由医生根据病人的症状确定，需依赖于医生的专业和经验，无法使用户根据自身的症状情况及时了解自身的健康情况。由于当前疾病的识别主要由医生进行诊断，一般用户都是在病情比较严重时才会意识到，进而到医疗机构就诊，可能延误病情。当前医疗网站中提供的症状、疾病和治疗等医疗数据没有形成完整的系统，用户查询时没有足够的专业知识，无法根据自己的症状情况及时了解自身的健康状态。

发明内容

本发明实施例提供一种医疗模型训练方法，以解决当前疾病的识别通常由医生根据病人的症状确定，需依赖于医生的专业和经验，无法使用户根据自身的症状情况及时了解自身的健康情况的问题。

本发明实施例提供一种医疗识别方法，以解决当前医疗网站中提供的症状、疾病和治疗等医疗数据没有形成完整的系统，用户查询时没有足够的专业知识，无法根据自己的症状情况及时了解自身的健康状态的问题。

第一方面，本发明实施例提供一种医疗模型训练方法，包括：

获取目标医疗数据；

将所述目标医疗数据按预设比例进行划分，获取训练集和测试集；

采用所述训练集中的目标医疗数据对长短时记忆网络模型进行训练，获取原始医疗模型；

采用所述测试集中的目标医疗数据对所述原始医疗模型进行测试，获取目标医疗模型。

第二方面，本发明实施例提供一种医疗模型训练装置，包括：

目标医疗数据获取模块，用于获取目标医疗数据；

目标医疗数据划分模块，用于将所述目标医疗数据按预设比例进行划分，获取训练集和测试集；

原始医疗模型获取模块，用于采用所述训练集中的目标医疗数据对长短时记忆网络模型进行训练，获取原始医疗模型；

目标医疗模型获取模块，用于采用所述测试集中的目标医疗数据对所述原始医疗模型进行测试，获取目标医疗模型。

第三方面，本发明实施例提供一种医疗识别方法，包括：

获取用户的待测医疗数据，所述待测医疗数据包括至少一个症状特征；

将至少一个所述症状特征输入到所述目标医疗模型进行识别，获取目标医疗特征，所述目标医疗模型是采用权利要求1-3任一项所述医疗模型训练方法获取的模型。

第四方面，本发明实施例提供一种医疗识别装置，包括：

待测医疗数据获取模块，用于获取用户的待测医疗数据，所述待测医疗数据包括至少一个症状特征；

目标医疗特征获取模块，用于将至少一个所述症状特征输入到所述目标医疗模型进行识别，获取目标医疗特征，所述目标医疗模型是采用权利要求1-3任一项所述医疗模型训练方法获取的模型。

第五方面，本发明实施例提供一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现所述医疗模型训练方法的步骤；或者，所述处理器执行所述计算机程序时实现所述医疗识别方法的步骤。

第六方面，本发明实施例提供一种计算机可读介质，所述计算机可读介质存储有计算机程序，所述计算机程序被处理器执行时实现所述医疗模型训练方法的步骤；或者，所述处理器执行所述计算机程序时实现所述医疗识别方法的步骤。

本发明实施例提供的医疗模型训练方法、装置、设备及介质中，先获取目标医疗数据，并对目标医疗数据进行划分，获取训练集和测试集，以便基于训练集中的目标医疗数据对长短时记忆网络模型进行训练，能够有效更新长短时记忆网络模型中各层的权值，以保证训练获取的原始医疗模型能够识别目标医疗特征。最后，再基于测试集中的目标医疗数据对原始医疗模型进行测试，以保证获取到的目标医疗特征识别目标医疗特征的准确率更高。

本发明实施例提供的医疗识别方法、装置、设备及介质中，通过获取用户的待测医疗数据，以便基于目标医疗模型对待测医疗数据进行识别，以获取目标医疗特征。通过目标医疗模型对待测医疗数据进行识别，以保证识别的准确率更高，较精准的识别目标医疗特征，以辅助用户判断患病风险，以便及时预防。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例1中提供的医疗模型训练方法的一流程图。

图2是图1中步骤S11的一具体示意图。

图3是图2中步骤S112的一具体示意图。

图4是图1中步骤S13的一具体示意图。

图5是图1中步骤S14的一具体示意图。

图6是本发明实施例2中提供的医疗模型训练装置的一原理框图。

图7是本发明实施例3中提供的医疗识别方法的一流程图。

图8是图7中步骤S22的一具体示意图。

图9本发明实施例4中提供的医疗识别装置的一原理框图。

图10是本发明实施例6中提供的终端设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

图1示出本实施例中医疗模型训练方法的流程图。该医疗模型训练方法可快速从网络中采集到大量的医疗数据，以便基于采集到的医疗数据进行医疗模型训练。该医疗模型训练方法可具体应用在医疗知识库管理系统这一数据管理系统中，用于对用户所输入的症状特征进行识别，为用户推荐疑似疾病特征列表，能够有效增加识别的准确率。如图1所示，该医疗模型训练方法包括如下步骤：

S11：获取目标医疗数据。

其中，目标医疗数据是用于进行模型训练的数据。该目标医疗数据包括但不限于本实施例中的症状特征、疾病特征等医疗数据。本实施例中，通过获取目标医疗数据，以便后续进行模型训练。

S12：将目标医疗数据按预设比例进行划分，获取训练集和测试集。

其中，预设比例是预先设定好的，用于对目标医疗数据进行分类的比例。该预设比例可以是根据历史经验获取的比例。其中，训练集(training set)是学习样本数据集，是通过匹配一些参数来建立分类器，即采用训练集中的目标医疗数据训练机器学习模型，以确定机器学习模型的参数。测试集(test set)是用于测试训练好的机器学习模型的分辨能力，如识别率。本实施例中，可按照9:1的比例对目标医疗数据进行分类，即可将90％的目标医疗数据作为训练集，剩余10％的数据作为测试集。

S13：采用训练集中的目标医疗数据对长短时记忆网络模型进行训练，获取原始医疗模型。

其中，长短时记忆网络(Long Short-Term Memory，简称LSTM)模型，是一种时间递归神经网络模型，用于训练具有时序性特点的数据，将该具有时序性特点的数据在长短时记忆网络模型训练，能够获取与该数据相对应的识别模型。本实施例中，该具有时序性特点的数据为目标医疗数据，通过训练集中的目标医疗数据获取的模型即为原始医疗模型。长短时记忆网络模型包括一输入层、一输出层和至少一隐藏层，长短时记忆网络模型中各层的权值是指神经网络模型中各层连接的权值，权值决定了各层最终输出的信息，并使得网络具有时序上的记忆功能。通过采用目标医疗数据对长短时记忆网络模型进行训练，能够有效更新长短时记忆网络模型中各层的权值。并且，长短时记忆网络模型通过对具有时序性特点的训练集中的目标医疗数据进行识别，可使目标医疗模型的识别结果更为准确。

本实施例中，LSTM模型的输出层采用Softmax(回归模型)进行回归处理，用于分类输出权重矩阵。Softmax(回归模型)是一种常用于神经网络的分类函数，它将多个神经元的输出，映射到[0,1]区间内，可以理解成概率，计算起来简单方便，从而来进行多分类输出，使其输出结果更准确。

S14：采用测试集中的目标医疗数据对原始医疗模型进行测试，获取目标医疗模型。

其中，目标医疗模型是经过不断对原始医疗模型进行测试、改进所得到的模型。本实施例中，将测试集中每一目标医疗数据输入到原始医疗模型进行测试，获取得到预测医疗特征；再基于预测医疗特征和测试集中的目标医疗数据，确定模型的准确率，以便基于模型的准确率，获取目标医疗模型。

本实施例中，先获取目标医疗数据，并对目标医疗数据进行划分，获取训练集和测试集，以便基于训练集中的目标医疗数据对长短时记忆网络模型进行训练，能够有效更新长短时记忆网络模型中各层的权值，以保证训练获取的原始医疗模型能够识别目标医疗特征。最后，再基于测试集中的目标医疗数据对原始医疗模型进行测试，以保证获取到的目标医疗特征识别目标医疗特征的准确率更高。

在一具体实施方式中，如图2所示，步骤S11中，即获取目标医疗数据，具体包括如下步骤：

S111：获取目标网页地址。

其中，目标网页地址是预先定义好所要获取目标医疗数据对应的网页地址。例如：39健康网站。通过获取到目标网页地址，以使后续采用网络爬虫技术爬取目标医疗数据时，为基于目标网页地址获取目标医疗数据提供支持。

S112：采用爬虫工具爬取目标网页地址对应的网页，获取原始医疗数据。

其中，爬虫工具是按照一定的规则自动爬取网页地址所对应的网页内容的工具，例如Python爬虫工具。具体地，采用爬虫工具爬取目标网页地址所对应的网页内容，以获取原始医疗数据，每一原始医疗数据都包含实际疾病特征和对应的至少一个症状特征，例如感冒(实际疾病特征)对应流鼻涕、头疼和发烧等症状特征。本实施例中，采用爬虫工具爬取目标网页地址对应的网页，无需人工搜索，有利于提高数据采集的效率。

本实施例中，爬虫工具会采取周期性爬取的方式对目标网页地址进行爬取数据，以使原始医疗数据具有时序性，以使后续模型训练获取到的目标医疗特征也具有时序性。

S113：对原始医疗数据进行数据清洗，获取目标医疗数据。

其中，数据清洗是指对原始医疗数据按照一定规则进行处理，获取纯净的目标医疗数据的方法。目标医疗数据是指按照数据清洗规则进行处理得到的纯净的数据。该数据清洗规则包括但不限于去除重复的数据。由于每一原始医疗数据均包含实际疾病特征和对应的至少一个症状特征，依据数据清洗规则进行清洗时，可将实际疾病特征和症状特征均相同的两个或两个以上原始医疗数据合并为一原始医疗数据。本实施例中，通过对原始医疗数据进行数据清洗，以获取目标医疗数据，能够有效提升目标医疗数据的质量，并且，去除重复的原始医疗数据，以使后续采用目标医疗数据进行训练时，无需对重复的原始医疗数据进行再次训练，能够有效减少训练时长，节省时间，提高训练效率。

本实施例中，先获取目标网页地址，然后采用爬虫工具爬取目标网页地址对应的网页，以获取原始医疗数据，无需人工搜索，有利于提高数据采集的效率。最后对原始医疗数据进行数据清洗，获取目标医疗数据，以使后续采用目标医疗数据进行训练时，无需对重复的数据进行再次训练，能够有效减少训练时长，节省时间，提高训练效率。

在一具体实施方式中，如图3所示，步骤S112中，即采用爬虫工具爬取目标网页地址对应的网页，获取原始医疗数据，具体包括如下步骤：

S1121：采用爬虫工具，依据深度优先算法或广度优先算法爬取目标网页地址所链接的至少一个访问地址，每一访问地址对应一网页。

其中，深度优先算法是指网络爬虫会从起始页开始，一个链接一个链接跟踪下去，处理完这条线路之后再转入下一个起始页，继续追踪链接。目标网页地址对应一目标网页，该目标网页包括起始页和至少一个起始页所链接的至少一个访问地址，每一访问地址对应一访问网页。爬虫工具包括网页提取工具和网页下载工具。网页提取工具是用于提取访问地址的工具，步骤S1121具体是采用网页提取工具爬取目标网页地址所链接的至少一个访问地址。网页下载工具是用于下载访问地址对应的网页的工具。

本实施例中，还可采用广度优先算法不断从当前页面上爬取新的网页地址放入待下载消息队列中，直到预设停止条件满足时停止执行爬虫任务。其中，广度优先算法是指将新下载网页发现的链接直接插入到待抓取消息队列的末尾，也就是指网络爬虫会先抓取起始页中的所有网页，然后在选择其中的一个链接的网页，继续抓取在此网页中链接的所有网页。

S1122：将至少一个访问地址存储在待下载消息队列中。

具体地，将步骤S121中爬取到的每一访问地址依据爬取到的时间先后顺序存储在待下载消息队列中，以便在执行步骤S123时，可基于待下载消息队列中的网页地址进行爬取数据。待下载消息队列依据先进先入的方式对访问地址进行处理，可使爬取访问地址和基于访问地址爬取原始医疗数据异步处理，有利于提高获取原始医疗数据效率。

具体地，爬虫工具中的网页提取工具会先抓取起始页中的所有网页内容，然后再选择起始页所链接的至少一个访问地址，继续抓取此访问地址链接的网页。本实施例中，起始页为目标网页地址。

S1123：采用爬虫工具对待下载消息队列中的每一访问地址对应的网页进行数据提取，获取原始医疗数据。

具体地，采用网页下载工具根据待下载消息队列的每一访问地址自动下载该访问地址对应的网页中所有医疗数据。本实施例中，待下载消息队列中存储有多个包含原始医疗数据的网页地址，爬虫工具的网页下载工具依序从待下载消息队列中逐一获取访问地址并下载该访问地址对应的网页中的原始医疗数据。具体地，爬虫工具从待下载消息队列的队头获取到一访问地址并对该访问地址对应的网页进行下载，将下载的原始医疗数据存储在数据库后，注销待下载消息队列中相应的网页地址，重复上述步骤直至待下载消息队列中不存在访问地址，以获取爬虫工具爬取的所有网页中的原始医疗数据。本实施例中，爬虫工具中的网页下载工具根据用户设置的爬虫任务自动从互联网上爬取包含原始医疗数据的网页地址，无需人工搜索，有利于提高数据采集效率。

本实施例中，采用爬虫工具，依据深度优先算法或广度优先算法爬取目标网页地址所链接的至少一个访问地址，并将获取到的访问地址存储在待下载消息队列中，再采用爬虫工具基于待下载消息队列中获取的访问地址下载原始医疗数据，使得访问地址下载的原始医疗数据异步处理，有利于提高原始医疗数据的获取效率。本实施例中，通过采用网页提取工具和网页下载工具异步处理获取原始医疗数据，有利于提高获取原始医疗数据的效率。

在一具体实施方式中，如图4所示，步骤S13中，即采用训练集中的目标医疗数据对长短时记忆网络模型进行训练，获取原始医疗模型，具体包括如下步骤：

S131：初始化长短时记忆网络模型。

本实施例中，对长短时记忆网络模型进行初始化操作，其中，长短时记忆神经网络是在时间上相互连接的网络，其基本单元称为神经元。长短时记忆网络模型包括一输入层、一输出层和至少一隐藏层，其隐藏层包括输入门、遗忘门、输出门、神经元状态和神经元输出，长短时记忆网络模型中的每一层可以包括多个神经元。遗忘门决定了在神经元状态中所要丢弃的信息。输入门决定了在神经元中所要增加的信息。输出门决定了在神经元中所要输出的信息。神经元状态决定了各个门丢弃、增加和输出的信息，具体表示为与各个门之间连接的权值。神经元输出决定了与下一层的连接权值。可以理解地，初始化长短时记忆网络模型，即为设置长短时记忆网络模型各层之间连接的权值以及隐藏层中输入门、遗忘门、输出门、神经元状态和神经元输出之间的初始权值，本实施例中初始权值可设为1。

S132：在长短时记忆网络模型中输入训练集中的目标医疗数据，计算长短时记忆网络模型各层的输出值。

本实施例中，采用按单元时间间隔在一预设时间段内获取的训练集中的目标医疗数据输入到长短时记忆网络模型中，分别计算各层的输出值，包括计算训练集中的目标医疗数据在输入门、遗忘门、输出门、神经元状态和神经元输出的输出。其中，一个神经元包括有三种激活函数f(sigmoid)、g(tanh)和h(softmax)。激活函数能够将权值结果转化成分类结果，其作用是能够给神经网络加入一些非线性因素，使得神经网络可以更好地解决较为复杂的问题。

一个神经元所接收和处理的数据包括：输入的训练集中的目标医疗数据：x，状态数据：s。此外，以下提及的参数还包括：神经元的输入用a表示，输出用b表示。下标ι,φ和ω分别表示输入门、遗忘门和输出门。下标c表示神经元，t代表时刻。神经元跟输入门、遗忘门和输出门连接的权值分别记做w_cl、w_cφ和w_cω。S_c表示神经元状态。I表示输入层的神经元的个数，H是隐层神经元的个数，C是神经元状态的神经元个数，这里取C＝H。

输入门接收当前时刻的样本X_t、上一时刻的输出值b^t-1 _h以及上一时刻神经元的状态数据S^t-1 _c，通过连接输入的训练集中的目标医疗数据与输入门的权值w_il、连接上一时刻的输出值与输入门的权值w_hl和连接神经元与输入门的权值w_cl，根据公式计算得到输入门的输出将激活函数f作用于由公式得到一个0-1区间的标量。此标量控制了神经元根据当前状态和过去状态的综合判断所接收当前信息的比例。

遗忘门接收当前时刻的样本X_t、上一时刻的输出值b^t-1 _h以及上一时刻的状态数据S^t-1 _c，通过连接输入的训练集中的目标医疗数据与遗忘门的权值w_iφ、连接上一时刻的输出值与遗忘门的权值w_hφ和连接神经元与遗忘门的权值w_cφ，根据公式计算得到遗忘门的输出将激活函数f作用于由公式得到一个0-1区间的标量，此标量控制了神经元根据当前状态和过去状态的综合判断所接收过去信息的比例。

神经元接收当前时刻的样本X_t、上一时刻的输出值b^t-1 _h以及上一时刻的状态数据S^t ^-1 _c、连接神经元与输入的训练集中的目标医疗数据的权值w_ic、连接神经元与上一时刻的输出值的权值w_hc以及输入门、遗忘门的输出标量，根据式计算当前时刻的神经元状态

输出门接收当前时刻的样本以及当前时刻的状态数据X_t，上一时刻的输出值b^t-1 _h以及当前时刻的状态数据通过连接输入的训练集中的目标医疗数据与输出门的权值w_iw、连接上一时刻的输出值与输出门的权值w_hw以及连接神经元与输出门的权值w_cw，根据公式计算输出门的输出将激活函数f作用于上由公式得到一个0-1区间的标量。

神经元输出根据输出门输出的标量计算。具体地，神经元输出的输出根据公式计算得出。由上述对训练集中的目标医疗数据在各层间的计算可获取长短时记忆网络模型各层的输出值。

S133：根据输出值对长短时记忆网络模型各层进行误差反传更新，获取更新后的各层的权值，其中，误差反传更新的表达式为其中，T表示时刻，W表示权值，B表示输出值，δ表示误差项，为上一时刻神经元的状态数据，b^t-1 _h为上一时刻的输出值。

本实施例中，根据获取长短时记忆网络模型各层的输出值对长短时记忆网络模型各层进行误差反传更新。具体地，首先根据误差项的表达式可求出各层的误差项。其中，ε和δ均表示误差项，特别地，表示神经元输出反传的误差项，表示神经元状态反传的误差项，两者均表示误差项，但具体含义不同。在以下表达式中，神经元的输入用a表示，输出用b表示。下标ι,φ和ω分别表示输入门、遗忘门和输出门。下标c表示神经元，t代表时刻。神经元跟输入门、遗忘门和输出门连接的权值分别记做w_cl、和w_cω。S_c表示神经元状态，控制门的激活函数用f(sigmoid)表示，g(tanh)和h(softmax)分别表示神经元的输入激活函数和输出激活函数。K是输出层神经元的个数，H是隐层神经元的个数，C是神经元状态的神经元个数，这里取C＝H。则输入门反传的误差项为遗忘门反传的误差项为神经元状态反传的误差项为其中，输出门反传的误差项为神经元输出反传的误差项为根据获得的各层误差项，再进行权值梯度的计算即可更新各层的权值，其中，权值更新的表达式为式中T表示时刻，W表示权值，如w_cl、w_cφ和w_cω等连接权值。B表示输出值，如和等输出。δ表示误差项，如和等误差项。为上一时刻神经元的状态数据，b^t-1 _h为上一时刻的输出值。上述表达式各参数需相对应，如更新的具体权值为w_cl时，则输出B为相对应的误差项δ为相对应的根据步骤S132和步骤S133的表达式可获得该权值更新表达式的所需参数值。则根据该权值更新的表达式进行运算即可获取更新后各层的权值。

S134：基于更新后的各层的权值，获取原始医疗模型。

本实施例中，将获取的更新后的各层的权值，应用到长短时记忆网络模型中即可获取原始医疗模型。进一步地，该原始医疗模型中各层之间的权值实现了原始医疗模型决定丢弃哪些旧信息、增加哪些新信息以及输出哪些信息的功能。在原始医疗模型的输出层最终会输出概率值，该概率值表示信息在通过原始医疗模型处理后与该原始医疗模型的贴近程度，可广泛应用于医疗特征识别，以达到准确识别医疗特征的目的。

在一具体实施方式中，如图5所示，步骤S14中，即采用测试集中的目标医疗数据对原始医疗模型进行测试，获取目标医疗模型，具体包括如下步骤：

S141：将每一目标医疗数据中的至少一个症状特征输入到原始医疗模型进行测试，获取对应的预测医疗特征。

其中，每一目标医疗数据包含至少一个症状特征和对应的实际疾病特征，如流鼻涕和/或发烧(症状特征)对应感冒(实际疾病特征)。具体地，将测试集中的每一目标医疗数据输入到原始医疗模型进行测试，即执行步骤S31-S34，以获取对应的预测医疗特征。

S142：获取同一目标医疗数据中实际疾病特征与预测医疗特征相匹配的识别数量。

具体地，将步骤S41获取到的预测疾病特征与同一目标医疗数据中的实际疾病特征相匹配，若匹配成功，则将识别结果准确的数量加1，若匹配不成功，则识别结果准确的数量不变，最后统计识别结果准确的数量即为识别数量。

S143：基于识别数量和测试集中的目标医疗数据的数据总量，获取识别准确率。

具体地，将步骤S42获取到的识别数量即识别结果准确的数量除以测试集中所有目标医疗数据的数据总量，以获取识别准确率。可以理解地，识别准确率可以采用公式进行计算获取，其中，T为识别结果准确的数量，N为目标医疗数据的数据总量。

S144：若识别准确率大于预设准确率，则获取目标医疗模型。

其中，预设准确率是预先设置的用于评价模型好坏的概率值。具体地，若识别准确率大于预设准确率，则认定该原始医疗模型较准确，以将该原始医疗模型作为目标医疗模型；反之，若识别准确率不大于预设准确率，则认定该原始医疗模型不够准确，需采用更多的目标医疗数据重新训练原始医疗模型，在训练获取得的原始医疗模型的识别准确率大于预设准确率时，认为模型训练完成，以获取目标医疗模型。

本实施例中，将每一目标医疗数据中的至少一个症状特征输入到原始医疗模型进行测试，获取对应的预测医疗特征，然后基于同一目标医疗数据中实际疾病特征与预测医疗特征相匹配的识别数量和测试集中的目标医疗数据的数据总量，以获取识别准确率。最后基于识别准确率。获取目标医疗模型，以提高医疗特征识别的准确率。

本实施例中，先获取目标医疗数据，并对目标医疗数据进行划分，获取训练集和测试集，以便基于训练集中的目标医疗数据对长短时记忆网络模型进行训练，能够有效更新长短时记忆网络模型中各层的权值，使得通过目标医疗数据训练得到的原始医疗特征识别效果更精准。最后，再基于测试集中的目标医疗数据对原始医疗模型进行测试，以保证获取到的目标医疗特征识别目标医疗特征的准确率更高。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

实施例2

图6示出与实施例1中医疗模型训练方法一一对应的医疗模型训练装置的原理框图。如图6所示，该医疗模型训练装置包括目标医疗数据获取模块11、目标医疗数据划分模块12、原始医疗模型获取模块13和目标医疗模型获取模块14。其中，目标医疗数据获取模块11、目标医疗数据划分模块12、原始医疗模型获取模块13和目标医疗模型获取模块14的实现功能与实施例中医疗模型训练方法对应的步骤一一对应，为避免赘述，本实施例不一一详述。

目标医疗数据获取模块11，用于获取目标医疗数据.

目标医疗数据划分模块12，用于将目标医疗数据按预设比例进行划分，获取训练集和测试集。

原始医疗模型获取模块13，用于采用训练集中的目标医疗数据对长短时记忆网络模型进行训练，获取原始医疗模型。

目标医疗模型获取模块14，用于采用测试集中的目标医疗数据对原始医疗模型进行测试，获取目标医疗模型。

优选地，目标医疗数据获取模块11包括目标网页地址获取单元111、原始医疗数据获取单元112和目标医疗数据获取单元113。

目标网页地址获取单元111，用于获取目标网页地址。

原始医疗数据获取单元112，用于采用爬虫工具爬取目标网页地址对应的网页，获取原始医疗数据。

目标医疗数据获取单元113，用于对原始医疗数据进行数据清洗，获取目标医疗数据。

优选地，原始医疗数据获取单元112包括访问地址获取子单元1121、访问地址存储子单元1122和原始医疗数据获取子单元1123。

访问地址获取子单元1121，用于采用爬虫工具，依据深度优先算法或广度优先算法爬取目标网页地址所链接的至少一个访问地址，每一访问地址对应一网页。

访问地址存储子单元1122，将至少一个访问地址存储在待下载消息队列中。

原始医疗数据获取子单元1123，采用爬虫工具对待下载消息队列中的每一访问地址对应的网页进行数据提取，获取原始医疗数据。

优选地，原始医疗模型获取模块13包括网络模型初始化单元131、输出值计算单元132、权值更新单元133和原始医疗模型获取单元134。

网络模型初始化单元131，用于初始化长短时记忆网络模型。

输出值计算单元132，用于在长短时记忆网络模型中输入正负样本，计算长短时记忆网络模型各层的输出值。

权值更新单元133，用于根据输出值对长短时记忆网络模型各层进行误差反传更新，获取更新后的各层的权值。

原始医疗模型获取单元134，用于基于更新后的各层的权值，获取原始医疗模型。

优选地，目标医疗模型获取模块14包括预测医疗特征获取单元141、识别数量获取单元142、识别准确率获取单元143和目标医疗模型获取单元144。

预测医疗特征获取单元141，用于将每一目标医疗数据中的至少一个症状特征输入到原始医疗模型进行测试，获取对应的预测医疗特征。

识别数量获取单元142，用于获取同一目标医疗数据中实际疾病特征与预测医疗特征相匹配的识别数量。

识别准确率获取单元143，用于基于识别数量和测试集中的目标医疗数据的数据总量，获取识别准确率。

目标医疗模型获取单元144，用于识别准确率大于预设准确率时，则获取目标医疗模型。

实施例3

图7示出本实施例中医疗识别方法的一流程图。该医疗识别方法可应用在医疗机构或者其他机构的终端设备上，以便对症状特征进行识别，达到智能识别疾病的效果。如图7所示，该医疗识别方法包括如下步骤：

S21：获取用户的待测医疗数据，待测医疗数据包括至少一个症状特征。

其中，待测医疗数据是指用户选择的用于识别目标医疗特征概率的医疗数据。本实施例中，待测医疗数据包括至少一个症状特征，如流鼻涕、体温和血压等症状特征。

S22：将至少一个症状特征输入到目标医疗模型进行识别，获取目标医疗特征，目标医疗模型是采用实施例1中医疗模型训练方法获取的模型。

其中，目标医疗特征是采用目标医疗模型对症状特征进行识别所得到的最大概率的患病特征。具体地，将至少一个症状特征输入到目标医疗模型进行识别，即执行实施例1中步骤S131-S134，以获取目标医疗特征。

本实施例中，先获取用户的待测医疗数据，待测医疗数据包括至少一个症状特征，以便至少一个症状特征输入到目标医疗模型进行识别，获取目标医疗特征，有利保障获取识别概率值的准确性，以辅助用户判断患病风险。

在一具体实施方式中，如图8所示，步骤S22，即将至少一个症状特征输入到目标医疗模型进行识别，获取目标医疗特征，具体包括如下步骤：

S221：基于目标医疗模型对至少一个症状特征进行识别，获取至少一个识别医疗特征和对应的识别概率值。

具体地，将至少一个症状特征输入到目标医疗模型中进行识别，在目标医疗模型中对输入的至少一个症状特征进行基于各层间权值的转换处理，在输出层输出至少一个识别医疗特征和对应识别概率值。该识别医疗特征是采用目标医疗模型对至少一个症状特征进行识别时，识别出其可能患有的疾病特征。识别概率值是采用目标医疗模型对至少一个症状进行识别时，识别其可能为识别医疗特征的可能性。其中，该识别概率值可以为0-1之间的实数。

S222：选取最大的识别概率值对应的识别医疗特征作为目标医疗特征。

具体地，选取最大的识别概率值对应的识别医疗特征作为目标医疗特征。其中，数据库还会关联存储有目标医疗特征所对应的科室和至少一个药品名称。本实施例中，当用户输入至少一个症状特征进行识别时，除了输出目标医疗特征，还会关联输出对应的科室和至少一个药品名称，以增强医疗识别模型的实用性。

本实施例中，基于目标医疗模型对至少一个症状特征进行识别，获取至少一个识别医疗特征和对应的识别概率值，以便基于识别概率值确定目标医疗特征，即确定疑似患病的疾病特征，以保证医疗特征识别结果更精确可靠。

本实施例中，通过获取用户的待测医疗数据，以便基于目标医疗模型对待测医疗数据进行识别，以获取目标医疗特征。通过目标医疗模型对待测医疗数据进行识别，以保证识别的准确率更高，较精准的识别目标医疗特征，以辅助用户判断患病风险，以便及时预防。

实施例4

图9示出与实施例1中医疗识别方法一一对应的医疗识别装置的原理框图。如图9所示，该医疗识别装置包括待测医疗数据获取模块21和目标医疗特征获取模块22。其中，待测医疗数据获取模块21和目标医疗特征获取模块22的实现功能与实施例中医疗识别方法对应的步骤一一对应，为避免赘述，本实施例不一一详述。

待测医疗数据获取模块21，用于获取用户的待测医疗数据，待测医疗数据包括至少一个症状特征。

目标医疗特征获取模块22，用于将至少一个症状特征输入到目标医疗模型进行识别，获取目标医疗特征。

优选地，目标医疗特征获取模块22包括识别概率值获取单元221和目标医疗特征获取单元222。

识别概率值获取单元221，用于基于目标医疗模型对至少一个症状特征进行识别，获取至少一个识别医疗特征和对应的识别概率值。

目标医疗特征获取单元222，用于选取最大的识别概率值对应的识别医疗特征作为目标医疗特征。

实施例5

本实施例提供一计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现实施例1中医疗模型训练方法，为避免重复，这里不再赘述。或者，该计算机程序被处理器执行时实现实施例2中医疗模型训练装置中各模块/单元的功能，为避免重复，这里不再赘述。或者，该计算机程序被处理器执行时实现实施例3中医疗识别方法中各步骤的功能，为避免重复，此处不一一赘述。或者，该计算机程序被处理器执行时实现实施例4中医疗识别装置中各模块/单元的功能，为避免重复，此处不一一赘述。

实施例6

图10是本发明一实施例提供的终端设备的示意图。如图10所示，该实施例的终端设备100包括：处理器101、存储器102以及存储在存储器102中并可在处理器101上运行的计算机程序103。处理器101执行计算机程序103时实现实施例1中的医疗模型训练方法各步骤的功能，例如图1所示的步骤S11至S14。或者，处理器101执行计算机程序103时实现实施例2中的医疗模型训练装置各模块/单元的功能，例如图6所示模块11至14的功能。或者，处理器101执行计算机程序103时实现实施例3中医疗识别方法各步骤的功能，为避免重复，此处不一一赘述。或者，该计算机程序被处理器101执行计算机程序103时实现实施例4中医疗识别装置中各模块/单元的功能。为避免重复，此处不一一赘述。

示例性的，计算机程序103可以被分割成一个或多个模块/单元，一个或者多个模块/单元被存储在存储器102中，并由处理器101执行，以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序103在终端设备100中的执行过程。例如，计算机程序103可以被分割成实施例2中的目标医疗数据获取模块11、目标医疗数据划分模块12、原始医疗模型获取模块13和目标医疗模型获取模块14，或者实施例4中的待测医疗数据获取模块21和目标医疗特征获取模块22，各模块的具体功能如实施例2或实施例4所述，在此不一一赘述。

终端设备100可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。终端设备可包括，但不仅限于，处理器101、存储器102。本领域技术人员可以理解，图10仅仅是终端设备100的示例，并不构成对终端设备100的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如终端设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器101可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器102可以是终端设备100的内部存储单元，例如终端设备100的硬盘或内存。存储器102也可以是终端设备100的外部存储设备，例如终端设备100上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(FlashCard)等。进一步地，存储器102还可以既包括终端设备100的内部存储单元也包括外部存储设备。存储器102用于存储计算机程序以及终端设备所需的其他程序和数据。存储器102还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括是电载波信号和电信信号。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种医疗模型训练方法，其特征在于，包括：

获取目标医疗数据；

2.如权利要求1所述的医疗模型训练方法，其特征在于，所述获取目标医疗数据包括：

获取目标网页地址；

采用爬虫工具爬取所述目标网页地址对应的网页，获取原始医疗数据；

对所述原始医疗数据进行数据清洗，获取目标医疗数据。

3.如权利要求1所述的医疗模型训练方法，其特征在于，所述采用所述训练集中的目标医疗数据对长短时记忆网络模型进行训练，获取原始医疗模型，包括：

初始化长短时记忆网络模型；

在所述长短时记忆网络模型中输入所述训练集中的目标医疗数据，计算所述长短时记忆网络模型各层的输出值；

根据所述输出值对所述长短时记忆网络模型各层进行误差反传更新，获取更新后的所述各层的权值，其中，所述误差反传更新的表达式为其中，T表示时刻，W表示权值，B表示输出值，δ表示误差项，为上一时刻神经元的状态数据，b^t-1 _h为上一时刻的输出值；

基于更新后的所述各层的权值，获取原始医疗模型。

4.如权利要求1所述的医疗模型训练方法，其特征在于，所述目标医疗数据包括一个实际疾病特征和对应的至少一个症状特征；

所述采用所述测试集中的目标医疗数据对所述原始医疗模型进行测试，获取目标医疗模型，包括：

将每一所述目标医疗数据中的至少一个所述症状特征输入到所述原始医疗模型进行测试，获取对应的预测医疗特征；

获取同一所述目标医疗数据中所述实际疾病特征与所述预测医疗特征相匹配的识别数量；

基于所述识别数量和所述测试集中所述的目标医疗数据的数据总量，获取识别准确率；

若所述识别准确率大于预设准确率，则获取所述目标医疗模型。

5.一种医疗识别方法，其特征在于，包括：

将至少一个所述症状特征输入到所述目标医疗模型进行识别，获取目标医疗特征，所述目标医疗模型是采用权利要求1-4任一项所述医疗模型训练方法获取的模型。

6.如权利要求5所述的医疗识别方法，其特征在于，将至少一个所述症状特征输入到所述目标医疗模型进行识别，获取目标医疗特征，包括：

基于所述目标医疗模型对至少一个所述症状特征进行识别，获取至少一个识别医疗特征和对应的识别概率值；

选取最大的所述识别概率值对应的识别医疗特征作为所述目标医疗特征。

7.一种医疗模型训练装置，其特征在于，包括：

目标医疗数据获取模块，用于获取目标医疗数据；

8.一种医疗识别装置，其特征在于，包括：

目标医疗特征获取模块，用于将至少一个所述症状特征输入到所述目标医疗模型进行识别，获取目标医疗特征，所述目标医疗模型是采用权利要求1-4任一项所述医疗模型训练方法获取的模型。

9.一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述医疗模型训练方法的步骤；或者，所述处理器执行所述计算机程序时实现如权利要求5至6任一项所述医疗识别方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4任一项所述医疗模型训练方法的步骤；或者，所述计算机程序被处理器执行时实现如权利要求5至6任一项所述医疗识别方法的步骤。