WO2020215676A1

WO2020215676A1 - 基于残差网络的图像识别方法、装置、设备及存储介质

Info

Publication number: WO2020215676A1
Application number: PCT/CN2019/117426
Authority: WO
Inventors: 任嘉祥; 马进; 王健宗
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-04-26
Filing date: 2019-11-12
Publication date: 2020-10-29
Also published as: CN110163260B; CN110163260A

Abstract

一种残差网络的图像识别方法、装置、设备及存储介质，所述方法包括：构建残差网络，采用预设的训练样本对所述残差网络进行训练（S101）；获取待识别图像（S102）；对所述待识别图像执行预处理（S103）；将预处理后的所述待识别图像划分为不重叠的两个分块，依次作为输入传入所述残差网络，获取每一分块经过所述残差网络后的预测值（S104）；根据所述两个分块的预测值输出识别结果，所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像（S105）。通过残差网络提取出关键特征，能够减低噪声干扰，以高准确率判断出目标图像，将所述图像识别方法应用到肺部X光片图像，实现了基于残差网络识别包含肺炎信号的目标图像，有效地提高了肺炎预测的准确度。

Description

基于残差网络的图像识别方法、装置、设备及存储介质

本申请以2019年4月26日提交的申请号为201910345031.3，名称为“基于残差网络的图像识别方法、装置、设备及存储介质”的中国发明专利申请为基础，并要求其优先权。

技术领域

本申请涉及信息技术领域，尤其涉及一种基于残差网络的图像识别方法、装置、设备及存储介质。

背景技术

肺炎对婴幼儿是一种高危疾病，占所有儿童死亡的15％以上。2015年，有约90万名5岁以下儿童死于该病。因此，准确诊断肺炎是一项艰巨的任务。现有技术主要通过训练有素的专家审查胸部X光片，并通过结合临床病史、生命体征和实验室的检查才能确认。X光诊断作为最常进行的放射成像诊断方式，其重要性不言而喻。在X光片中，肺炎通常表现为不透明度增加的区域。然而，肺部有许多其他疾病，如肺水肿，出血，肺不张或塌陷，肺癌或放疗后或手术后的其他变化，都会影响X光片中肺炎的判断；在肺外，胸膜腔内的液体，比如胸腔积液，也表现为X光片中的不透明度增加，从降低了从X光片图像中识别包含肺炎信号的目标图像的准确率。

因此，寻找一种提高从X光片图像中识别出包含肺炎信号的目标图像的识别准确率的方法成为本领域技术人员亟需解决的问题。

发明内容

本申请实施例提供了一种基于残差网络的图像识别方法、装置、设备及存储介质，以解决现有技术对包含肺炎信号的目标图像的识别准确率低的问题。

一种基于残差网络的图像识别方法，包括：

构建残差网络，采用预设的训练样本对所述残差网络进行训练；

获取待识别图像；

对所述待识别图像执行预处理；

将预处理后的所述待识别图像划分为不重叠的两个分块，依次作为输入传入所述残差网络，获取每一分块经过所述残差网络后的预测值；

根据所述两个分块的预测值输出识别结果，其中，所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。

进一步地，所述对所述待识别图像执行预处理包括：

将所述待识别图像调整为预设分辨率；

对分辨率调整后的所述待识别图像中的每个像素点值执行归一化处理；

将归一化处理后的所述待识别图像扩展为三层图像。

进一步地，所述将所述待识别图像调整为预设分辨率包括：

将所述待识别图像的分辨率与预设的分辨率阈值进行比对；

当所述待识别图像的分辨率高于预设的分辨率阈值时，对所述待识别图像降采样至所述分辨率阈值；

当所述待识别图像的分辨率低于预设的分辨率阈值时，对所述待识别图像上采样至所述分辨率阈值。

进一步地，所述根据所述两个分块的预测值输出识别结果，其中，所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像包括：

将所述两个分块的预测值进行比较，选择预测值中的较大值作为所述待识别图像的预测值；

将所述待识别图像的预测值与预设的预测阈值进行比较；

若所述待识别图像的预测值大于或等于所述预测阈值时，输出识别结果为目标图像；

若所述待识别图像的预测值小于所述预测阈值时，输出识别结果为非目标图像。

进一步地，所述构建残差网络，采用预设的训练样本对所述残差网络进行训练包块：

构建残差网络，所述残差网络包括输入层、卷积层、最大池化层、16个残差模块、全连接层以及输出层；

收集多个指定用户的多张图像信息作为训练样本集和测试样本集；

对所述训练样本集和测试样本集中的每一张图像信息执行预处理；

将每一张预处理后的所述图像信息划分为不重叠的两个分块，对每一分块打上预设标签，所述预设标签包括第一标签和第二标签；

从所述训练样本集中获取若干张图像信息，将每一张图像信息带有预设标签的两个分块分别作为输入向量传入所述残差网络进行训练；

采用预设的损失函数计算每一所述分块经过所述残差网络的识别结果与对应的预设标签之间的误差，并根据所述误差修改所述残差网络的参数；

从所述训练样本集中获取若干张图像信息，将每一张图像信息带有预设标签的两个分块分别传入参数修改后的所述残差网络执行下一次迭代训练；

在迭代训练达到预设次数后，将测试样本集中带有预设标签的图像信息作为输入向量传入迭代训练得到的所述残差网络进行测试。

一种基于残差网络的肺炎识别装置，包括：

训练模块，用于构建残差网络，采用预设的训练样本对所述残差网络进行训练；

获取模块，用于获取待识别图像；

预处理模块，用于对所述待识别图像执行预处理；

识别模块，用于将预处理后的所述待识别图像划分为不重叠的两个分块，依次作为输入传入所述残差网络，获取每一分块经过所述残差网络后的预测值；

输出模块，用于根据所述两个分块的预测值输出识别结果，其中，所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。

进一步地，所述预处理模块包括：

调整单元，用于将所述待识别图像调整为预设分辨率；

归一化单元，用于对分辨率调整后的所述待识别图像中的每个像素点值执行归一化处理；

扩展单元，用于将归一化处理后的所述待识别图像扩展为三层图像。

进一步地，所述调整单元包括：

比对子单元，用于将所述待识别图像的分辨率与预设的分辨率阈值进行比对；

降采样子单元，用于当所述待识别图像的分辨率高于预设的分辨率阈值时，对所述待识别图像降采样至所述分辨率阈值；

上采样子单元，用于当所述待识别图像的分辨率低于预设的分辨率阈值时，对所述待识别图像上采样至所述分辨率阈值。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：

获取待识别图像；

对所述待识别图像执行预处理；

一个或多个存储有计算机可读指令的非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

获取待识别图像；

对所述待识别图像执行预处理；

本申请的一个或多个实施例的细节在下面的附图和描述中提出，本申请的其他特征和优点将从说明书、附图以及权利要求变得明显。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例中基于残差网络的图像识别方法的一流程图；

图2是本申请一实施例中基于残差网络的图像识别方法中步骤S101的一流程图；

图3是本申请一实施例提供的残差网络的结构示意图；

图4是本申请一实施例中基于残差网络的图像识别方法中步骤S103的一流程图；

图5是本申请一实施例中基于残差网络的图像识别方法中步骤S401的一流程图；

图6是本申请一实施例中基于残差网络的图像识别方法中步骤S105的一流程图；

图7是本申请一实施例中基于残差网络的图像识别装置的一原理框图；

图8是本申请一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供的基于残差网络的图像识别方法应用于服务器。所述服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一实施例中，如图1所示，提供了一种基于残差网络的图像识别方法，包括如下步骤：

在步骤S101中，构建残差网络，采用预设的训练样本对所述残差网络进行训练。

在这里，本申请实施例选取的深度神经网络为分类性能优异的残差网络ResNet(Residual Network，简称ResNet网络)。为便于理解，下面将对残差网络的训练过程进行详细描述。如图2所述，所述步骤S101包括：

在步骤S201中，构建残差网络，所述残差网络包括输入层、卷积层、最大池化层、16个残差模块、全连接层以及输出层。

如图3所示，为本申请实施例提供的残差网络的结构示意图。所述残差网络包括输入层、卷积层、最大池化层、16个残差模块、全连接层以及输出层。其中，所述卷积层的卷积核为7*7，通道数为64。最大池化层的窗口为3*3、步长为2。所述16个残差模块的结构相同，均包括三层卷积层，分别为卷积核为1*1的第一卷积层、卷积核为3*3的第二卷积层、卷积核为1*1的第三卷积层，每个卷积层后还包括一个批归一化层和激活层。所述全连接层的维度为2。

进一步地，16个残差模块根据不同的通道数划分为四组。第一组包括3个残差模块，每个残差模块中的第一卷积层的通道数为64、第二卷积层的通道数为64、第三卷积层的通道数为256。第二组包括4个残差模块，每个残差模块中的第一卷积层的通道数为128、第二卷积层的通道数为128、第三卷积层的通道数为512。第三组包括6个残差模块，每个残差模块中的第一卷积层的通道数为256、第二卷积层的通道数为256、第三卷积层的通道数为1024。第四组包括3个残差模块，每个残差模块中的第一卷积层的通道数为512、第二卷积层的通道数为512、第三卷积层的通道数为2048。

在步骤S202中，收集多个指定用户的多张图像信息作为训练样本集和测试样本集。

可选地，作为发明的一个优选示例，本申请实施例提供的基于残差网络的图像识别方法可用于通过基于残差网络识别包含肺炎信号的目标图像。因此，所述指定用户可以为肺炎患者，所述图像信息可以为肺部X光片图像，可以预先收集多个肺炎患者的5000以上张的X光片图像作为训练样本集，并选取不同于所述训练样本集的500张X片图像作为测试样本集。

在步骤S203中，对所述训练样本集和测试样本集中的每一张图像信息执行预处理。

在这里，对所述训练样本集和测试样本集中的每一张图像信息进行预处理与后续步骤S103相同，包括分辨率调整、归一化处理以及扩展，具体请参见后续实施例的叙述，此处不再赘述。预处理后的每一张图像信息为1024*1024像素的三层图像。

在步骤S204中，将每一张预处理后的所述图像信息划分为不重叠的两个分块，对每一分块打上预设标签，所述预设标签包括第一标签和第二标签。

在得到三层图像之后，将所述三层图像按照左右划分为不重叠的两个分块。所述两个分块应当为均等的两部分。然后为每一分块打上预设标签，所述预设标签用于区分图像信息是否包含关键信号，包括第一标签和第二标签，其中第一标签表示图像信息包含关键信号，第二标签表示图像信息未包含关键信号。

如前所述，当所述图像信息为肺部X光片图像时，所述两个分块分别表示左肺影像和右肺影像，每一分块包括三层图像，每一层图像的像素为512*1024。然后根据实际情况对所述两个分块打上预设标签。所述预设标签用于指示所述左肺影像和右肺影像是否患有肺炎。在这里，所述第一标签表示图像中包含肺炎信号，所述第二标签表示图像中未包含肺炎信号。若左肺影像/右肺影像患有肺炎，则将对应的左分块/右分块打上第一标签；若左肺影像/右肺影像未患有肺炎，则将对应的左分块/右分块打上第二标签。

可选地，所述第一标签和第二标签可以通过二进制数字0和1来表示。应当理解，以上仅为本申请的一个示例，并不用于限制本申请，在其他实施例中，所述预设标签还可以通过其他形式的标签来表示。

在完成标签设置后，本申请实施例以带有预设标签的所述图像信息作为所述残差网络的输入对所述残差网络进行若干次训练。每次训练若干张图像信息，比如30张X光片图像。

在步骤S205中，从所述训练样本集中获取若干张图像信息，将每一张图像信息带有预设标签的两个分块分别作为输入向量传入所述残差网络进行训练。

在训练时，针对每一个图像信息的两个分块，将带有标签的分块作为一个输入向量，传入预设的残差网络进行训练，得到每一个分块的识别结果。

所述残差网络的输入维度为512*1024*3，即图像信息的一个分块的大小。每一个分块在所述残差网络中，首先经过7*7*64的卷积层和3*3、步长为2的最大池化层后，得到256*512*64的特征图，所述特征图依次通过四组残差模块，经过第一组残差模块变化为128*256*256的特征图、经过第二组残差模块变化为64*128*512的特征图、经过第三组残差模块变化为32*64*1024的特征图、经过第四组残差模块变化为16*32*2048的特征图；最后经过维度为2的全连接层，得到所述分块的预测值；所述预测值进一步通过输出层得到分块是否为目标图像。承接前文示例，所述图像信息为肺部的X光片图像时，所述预测值表示所述分块为包含肺炎信号的目标图像的分值，所述分值越大，所述分块包含肺炎信号的概率越大。在得到所述分块的预测值之后，本申请实施例在输出层中设置预测阈值，将所述分块的预测值与所述预测阈值进行比对，若所述预测值大于或等于所述预测阈值，则判定所述分块为包含肺炎信号的目标图像，否则所述分块为未包含肺炎信号的非目标图像。

对该次训练中的若干张图像信息均执行上述步骤S205，直至遍历完所述若干张图像信息。执行步骤S206。

在步骤S206中，采用预设的损失函数计算每一所述分块经过所述残差网络的识别结果与对应的预设标签之间的误差，并根据所述误差修改所述残差网络的参数。

在完成一次训练，得到所述若干张图像信息的每一所述分块对应的识别结果后，采用预设的损失函数计算每一所述分块的识别结果与对应的预设标签之间的误差，并基于所述误差返回去修改所述残差网络中卷积层及残差模块的参数。可选地，本申请实施例采用交叉熵损失函数并应用反向传播算法把所述误差传回给各个卷积层，促使其不断学习特征，直至收敛。

在步骤S207中，从所述训练样本集中获取若干张图像信息，将每一张图像信息带有预设标签的两个分块分别传入参数修改后的所述残差网络执行下一次迭代训练。

通过步骤S206修改参数后的残差网络，用于进行下一次训练。在这里，本申请实施例先使用0.01的学习率训练3000次，每次包括30张图像信息，之后使用0.001的学习率继续训练1000次。学习率learning rate是训练残差网络的一个重要参数，其定义为网络模型中参数的更新幅度。学习率越大，模型中参数变化的越快。

因此，每次训练过程中，从训练样本集中随机选取30张带有预设标签的图像信息，将每一图像信息的两个分块作为输入向量依次传入参数修改后的残差网络进行训练，训练过程和步骤S205的相同，具体参见上面的叙述，此处不再赘述。重复迭代步骤S205、S206，直至完成学习率为0.01的训练和学习率为0.001的训练，使得所述残差网络能够学习到图像信息中的关键特征，比如前文示例的肺部X光片图像中的肺炎信号的关键特征，最终得到收敛的模型。

在步骤S208中，在迭代训练达到预设次数后，将测试样本集中带有预设标签的图像信息作为输入向量传入迭代训练得到的所述残差网络进行测试。

在这里，所述测试样本集为与训练样本集为不重合的若干张图像信息。在所述残差网络训练完毕后，将所述测试样本集中的每一个带有标签的图像信息作为输入向量传入所述残差网络进行测试，测试过程与步骤S204、S205的相同，具体参见上面的叙述，此处不再赘述。测试通过的标准是残差网络对测试样本集的识别结果的准确率达到指定的准确率阈值，即所述残差网络对测试样本集中的每一所述图像信息的识别结果与对应的预设标签相同的概率达到所述指定的准确率阈值，则说明所述残差网络中的各个参数已经调整到位。可选地，所述指定阈值可以为90％。

训练好的残差网络可用于对图像信息提取特征，能够有效减低噪声干扰，以高准确率判断出目标图像。所述基于残差网络的图像识别方法包括：

在步骤S102中，获取待识别图像。

作为本申请的一个优选示例，所述待识别图像可以为肺部的X光片图像，包括左肺和右肺的影像信息。可选地，服务器可以根据实际需要或者应用场景的需要获取待识别图像。例如，服务器从预设数据库中获取待识别图像，所述预设数据库中预先收集了大量肺部的X光片图像。所述服务器还可以通过连接到医院的影像设备得到所述待识别图像。可以理解的是，服务器还可以通过多种方式获取到待识别图像，此处不再过多赘述。

在步骤S103中，对所述待识别图像执行预处理。

在训练或者使用残差网络之前，本申请实施例首先对待识别图像进行预处理，以提高残差网络识别的速度和识别的准确度。可选地，如图4所示，所述步骤S103对所述待识别图像执行预处理包括：

在步骤S401中，将所述待识别图像调整为预设分辨率。

在这里，由于所述待识别图像为原始图像，可能存在像素、大小不一等影响识别的问题。鉴于此，本申请实施例首先对所述待识别图像的分辨率进行调整，以使得待识别图像符合残差网络的输入向量。可选地，如图5所示，所述步骤S401将所述待识别图像调整为预设分辨率包括：

在步骤S501中，将所述待识别图像的分辨率与预设的分辨率阈值进行比对。

可选地，所述预设的分辨率阈值与所述残差网络的输入维度相关。承接前文示例，假设所述残差网络的输入为一个表示左肺或右肺的分块，其维度为512*1024*3，而待识别图像通常包括两个肺部，因此，所述预设的分辨率阈值优选为1024*1024像素。本申请实施例将所述待识别图像的分辨率与所述预设的分辨率阈值1024*1024进行比对，以判断所述待识别图像的分辨率是过高还是过低。

在步骤S502中，当所述待识别图像的分辨率高于预设的分辨率阈值时，对所述待识别图像降采样至所述分辨率阈值。

在数位信号处理领域中，降采样，又称为减采样，是一种多速率数字信号处理的技术或是降低信号采样率的过程，通常用于降低数据传输速率或者数据大小。对于一幅N*M的图像来说，如果降采样系数为k，则在原图中每行每列每隔k个点取一个点组成一幅图像，使得新的图像的分辨率达到所述预设分辨率。

在步骤S503中，当所述待识别图像的分辨率低于预设的分辨率阈值时，对所述待识别图像上采样至所述分辨率阈值。

在这里，上采样和下采样都是对数字信号进行重采。上采样，也即插值，如果上采样系数为k，则在原图n与n+1两点之间插入k-1个点，使其构成k分。本申请实施例采用双线性插值法对所述待识别图像上采样至所述预设分辨率，即对所述待识别图像的每行插值完之后对于每列也进行插值。

本申请实施例通过对所述待识别图像的分辨率进行调整，使得所述待识别图像符合残差网络的输入维度，有利于提高残差网络对所述待识别图像进行识别的速度。

在步骤S402中，对分辨率调整后的所述待识别图像中的每个像素点值执行归一化处理。

在完成对所述待识别图像的分辨率调整之后，本申请实施例对所述待识别图像中的每个像素点值进行归一化处理，即将每个像素点值变换到[-1,1]之间。可选地，归一化处理的计算公式为：

在上式中，x表示X光片图像中任意像素点的值，所述x'表示像素点经过归一化后的值。

在这里，本申请实施例通过对分辨率调整后的所述待识别图像的每个像素点值进行归一化处理，使得待识别图像中的数据分布更加均匀，有利于加速残差网络的识别过程。

在步骤S403中，将归一化处理后的所述待识别图像扩展为三层图像。

在完成归一化处理之后，本申请实施例进一步将所述待识别图像进行复制，扩展为三层图像。示例性地，假设归一化处理后的所述待识别图像的分辨率为1024*1024，通过步骤S402得到的待识别图像为1024*1024*1，通过步骤S403后所述待识别图像扩展为三层，即1024*1024*3。通过将所述待识别图像扩展为三层图像，有利于残差网络导入预设参数，避免网络无法收敛的情况。

在步骤S104中，将预处理后的所述待识别图像划分为不重叠的两个分块，依次作为输入传入所述残差网络，获取每一分块经过所述残差网络后的预测值。

在得到三层图像之后，将所述三层图像按照左右划分为不重叠的两个分块。所述两个分块应当为均等的两部分。承接前文示例，若所述待识别图像为肺部的X光片图像，包括左肺和右肺的影像信息，则所述两个分块分别表示左肺影像和右肺影像，每一分块包括三层图像，每一层图像的像素为512*1024。然后将每一分块传入训练好的所述残差网络进行独立的识别。所述残差网络对每一分块进行预测，输出每一分块的预测值。

在这里，所述预测值表示所述分块为目标图像的分值，所述分值越大，所述分块归为目标图像的概率越大，所述分值越小，所述分块归为目标图像的概率越小。承接前文示例，若所述待识别图像为肺部的X光片图像时，所述预测值表示所述分块为包含肺炎信号的目标图像的分值，所述分值越大，所述分块归为包含肺炎信号的目标图像的概率越大，所述分值越小，所述分块归为包含肺炎信号的目标图像的概率越小。

在步骤S105中，根据所述两个分块的预测值输出识别结果，其中，所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。

在得到每一分块经过所述残差网络的预测值后，本申请实施例综合分析所述两个分块的预测值，得到所述待识别图像的预测值，并根据所述待识别图像的预测值输出识别结果。可选地，如图6所示，所述步骤S105根据所述两个分块的预测值输出识别结果包括：

在步骤S601中，将所述两个分块的预测值进行比较，选择预测值中的较大值作为所述待识别图像的预测值。

在这里，每个分块的预测值表示该分块为包含肺炎信号的目标图像的概率。在得到两个分块的预测值后，本申请将两个分块的预测值进行比较，选取较大预测值作为所述待识别图像的预测值。

在步骤S602中，将所述待识别图像的预测值与预设的预测阈值进行比较。

在本申请实施例中，预先根据经验设置预测阈值。所述预测阈值为待识别图像是否为包含肺炎信号的目标图像的判断标准。在得到待识别图像的预测值之后，将所述预测值与所述预测阈值进行比较。

在步骤S603中，若所述待识别图像的预测值大于或等于所述预测阈值时，输出识别结果为目标图像。

如前所述，所述预测值表示所述分块为包含肺炎信号的目标图像的分值，所述分值越大，所述分块包含肺炎信号的概率越大。当所述待识别图像的预测值大于或等于所述预测阈值时，判定所述待识别图像中疑似存在肺炎，输出分类结果为目标图像。

在步骤S604中，若所述待识别图像的预测值小于所述预测阈值时，输出识别结果为非目标图像。

当所述待识别图像的预测值小于所述预测阈值时，判定所述待识别图像未存在肺炎，输出分类结果为非目标图像。

在这里，本申请实施例通过将所述待识别图像划分为两个分块输入残差网络进行预测，可以在保留足够清晰度的同时，降低计算成本，减少训练时间，提高残差网络预测的效率。

综上所述，本申请实施例通过对待识别图像进行预处理，然后通过残差网络对预处理后的所述待识别图像提取出关键特征进行预测，得到所述待识别图像的预测值，所述预测值表示所述分块为包含肺炎信号的目标图像的分值，所述分值越大，所述分块包含肺炎信号的概率越大；最后基于所述预测值与预设阈值进行比对，并根据比对结果得到所述待识别图像是否为目标图像；从而实现了基于残差网络识别包含肺炎信号的目标图像，通过残差网络提取出关键特征，能够减低噪声干扰，以高准确率判断出是否患有肺炎，提高肺炎预测的准确度。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在一实施例中，提供一种基于残差网络的图像识别装置，该基于残差网络的图像识别装置与上述实施例中基于残差网络的图像识别方法一一对应。如图7所示，该基于残差网络的图像识别装置包括训练模块、获取模块、预处理模块、识别模块、输出模块。各功能模块详细说明如下：

训练模块71，用于构建残差网络，采用预设的训练样本对所述残差网络进行训练；

获取模块72，用于获取待识别图像；

预处理模块73，用于对所述待识别图像执行预处理；

识别模块74，用于将预处理后的所述待识别图像划分为不重叠的两个分块，依次作为输入传入所述残差网络，获取每一分块经过所述残差网络后的预测值；

输出模块75，用于根据所述两个分块的预测值输出识别结果，其中，所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。

可选地，所述预处理模块73包括：

调整单元，用于将所述待识别图像调整为预设分辨率；

可选地，所述调整单元包括：

可选地，所述输出模块75包括：

第一比较单元，用于将所述两个分块的预测值进行比较，选择预测值中的较大值作为所述待识别图像的预测值；

第二比较单元，用于将所述待识别图像的预测值与预设的预测阈值进行比较；

第一输出单元，用于若所述待识别图像的预测值大于或等于所述预测阈值时，输出识别结果为目标图像；

第二输出单元，用于若所述待识别图像的预测值小于所述预测阈值时，输出识别结果为非目标图像。

可选地，所述训练模块71包块：

构建单元，用于构建残差网络，所述残差网络包括输入层、卷积层、最大池化层、16个残差模块、全连接层以及输出层；

收集单元，用于收集多个指定用户的多张图像信息作为训练样本集和测试样本集；

预处理单元，用于对所述训练样本集和测试样本集中的每一张图像信息执行预处理；

标签单元，用于将每一张预处理后的所述图像信息划分为不重叠的两个分块，对每一分块打上预设标签，所述预设标签包括第一标签和第二标签；

训练单元，用于从所述训练样本集中获取若干张图像信息，将每一张图像信息带有预设标签的两个分块分别作为输入向量传入所述残差网络进行训练；

修正单元，用于采用预设的损失函数计算每一所述分块经过所述残差网络的识别结果与对应的预设标签之间的误差，并根据所述误差修改所述残差网络的参数；

迭代单元，用于从所述训练样本集中获取若干张图像信息，将每一张图像信息带有预设标签的两个分块分别传入参数修改后的所述残差网络执行下一次迭代训练；

测试单元，用于在迭代训练达到预设次数后，将测试样本集中带有预设标签的图像信息作为输入向量传入迭代训练得到的所述残差网络进行测试。

关于基于残差网络的图像识别装置的具体限定可以参见上文中对于基于残差网络的图像识别方法的限定，在此不再赘述。上述基于残差网络的图像识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种基于残差网络的图像识别方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令，处理器执行计算机可读指令时实现以下步骤：

获取待识别图像；

对所述待识别图像执行预处理；

在一个实施例中，提供了一个或多个存储有计算机可读指令的非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

获取待识别图像；

对所述待识别图像执行预处理；

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

一种基于残差网络的图像识别方法，其特征在于，包括：

构建残差网络，采用预设的训练样本对所述残差网络进行训练；

获取待识别图像；

对所述待识别图像执行预处理；

将预处理后的所述待识别图像划分为不重叠的两个分块，依次作为输入传入所述残差网络，获取每一分块经过所述残差网络后的预测值；

根据所述两个分块的预测值输出识别结果，其中，所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。
如权利要求1所述的基于残差网络的图像识别方法，其特征在于，所述对所述待识别图像执行预处理包括：

将所述待识别图像调整为预设分辨率；

对分辨率调整后的所述待识别图像中的每个像素点值执行归一化处理；

将归一化处理后的所述待识别图像扩展为三层图像。
如权利要求2所述的基于残差网络的图像识别方法，其特征在于，所述将所述待识别图像调整为预设分辨率包括：

将所述待识别图像的分辨率与预设的分辨率阈值进行比对；

当所述待识别图像的分辨率高于预设的分辨率阈值时，对所述待识别图像降采样至所述分辨率阈值；

当所述待识别图像的分辨率低于预设的分辨率阈值时，对所述待识别图像上采样至所述分辨率阈值。
如权利要求1所述的基于残差网络的图像识别方法，其特征在于，所述根据所述两个分块的预测值输出识别结果，其中，所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像包括：

将所述两个分块的预测值进行比较，选择预测值中的较大值作为所述待识别图像的预测值；

将所述待识别图像的预测值与预设的预测阈值进行比较；

若所述待识别图像的预测值大于或等于所述预测阈值时，输出识别结果为目标图像；

若所述待识别图像的预测值小于所述预测阈值时，输出识别结果为非目标图像。
如权利要求1所述的基于残差网络的图像识别方法，其特征在于，所述构建残差网络，采用预设的训练样本对所述残差网络进行训练包括：

构建残差网络，所述残差网络包括输入层、卷积层、最大池化层、16个残差模块、全连接层以及输出层；

收集多个指定用户的多张图像信息作为训练样本集和测试样本集；

对所述训练样本集和测试样本集中的每一张图像信息执行预处理；

将每一张预处理后的所述图像信息划分为不重叠的两个分块，对每一分块打上预设标签，所述预设标签包括第一标签和第二标签；

从所述训练样本集中获取若干张图像信息，将每一张图像信息带有预设标签的两个分块分别作为输入向量传入所述残差网络进行训练；

采用预设的损失函数计算每一所述分块经过所述残差网络的识别结果与对应的预设标签之间的误差，并根据所述误差修改所述残差网络的参数；

从所述训练样本集中获取若干张图像信息，将每一张图像信息带有预设标签的两个分块分别传入参数修改后的所述残差网络执行下一次迭代训练；

在迭代训练达到预设次数后，将测试样本集中带有预设标签的图像信息作为输入向量传入迭代训练得到的所述残差网络进行测试。
一种基于残差网络的图像识别装置，其特征在于，包括：

训练模块，用于构建残差网络，采用预设的训练样本对所述残差网络进行训练；

获取模块，用于获取待识别图像；

预处理模块，用于对所述待识别图像执行预处理；

识别模块，用于将预处理后的所述待识别图像划分为不重叠的两个分块，依次作为输入传入所述残差网络，获取每一分块经过所述残差网络后的预测值；

输出模块，用于根据所述两个分块的预测值输出识别结果，其中，所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。
如权利要求6所述的基于残差网络的图像识别装置，其特征在于，所述预处理模块包括：

调整单元，用于将所述待识别图像调整为预设分辨率；

归一化单元，用于对分辨率调整后的所述待识别图像中的每个像素点值执行归一化处理；

扩展单元，用于将归一化处理后的所述待识别图像扩展为三层图像。
如权利要求7所述的基于残差网络的图像识别装置，其特征在于，所述调整单元包括：

比对子单元，用于将所述待识别图像的分辨率与预设的分辨率阈值进行比对；

降采样子单元，用于当所述待识别图像的分辨率高于预设的分辨率阈值时，对所述待识别图像降采样至所述分辨率阈值；

上采样子单元，用于当所述待识别图像的分辨率低于预设的分辨率阈值时，对所述待识别图像上采样至所述分辨率阈值。
如权利要求6所述的基于残差网络的图像识别装置，其特征在于，所述输出模块包括：

第一比较单元，用于将所述两个分块的预测值进行比较，选择预测值中的较大值作为所述待识别图像的预测值；

第二比较单元，用于将所述待识别图像的预测值与预设的预测阈值进行比较；

第一输出单元，用于若所述待识别图像的预测值大于或等于所述预测阈值时，输出识别结果为目标图像；

第二输出单元，用于若所述待识别图像的预测值小于所述预测阈值时，输出识别结果为非目标图像。
如权利要求6所述的基于残差网络的图像识别装置，其特征在于，所述训练模块包括：

构建单元，用于构建残差网络，所述残差网络包括输入层、卷积层、最大池化层、16个残差模块、全连接层以及输出层；

收集单元，用于收集多个指定用户的多张图像信息作为训练样本集和测试样本集；

预处理单元，用于对所述训练样本集和测试样本集中的每一张图像信息执行预处理；

标签单元，用于将每一张预处理后的所述图像信息划分为不重叠的两个分块，对每一分块打上预设标签，所述预设标签包括第一标签和第二标签；

训练单元，用于从所述训练样本集中获取若干张图像信息，将每一张图像信息带有预设标签的两个分块分别作为输入向量传入所述残差网络进行训练；

修正单元，用于采用预设的损失函数计算每一所述分块经过所述残差网络的识别结果与对应的预设标签之间的误差，并根据所述误差修改所述残差网络的参数；

迭代单元，用于从所述训练样本集中获取若干张图像信息，将每一张图像信息带有预设标签的两个分块分别传入参数修改后的所述残差网络执行下一次迭代训练；

测试单元，用于在迭代训练达到预设次数后，将测试样本集中带有预设标签的图像信息作为输入向量传入迭代训练得到的所述残差网络进行测试。
一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，其特征在于，所述处理器执行所述计算机可读指令时实现如下步骤：

构建残差网络，采用预设的训练样本对所述残差网络进行训练；

获取待识别图像；

对所述待识别图像执行预处理；

将预处理后的所述待识别图像划分为不重叠的两个分块，依次作为输入传入所述残差网络，获取每一分块经过所述残差网络后的预测值；

根据所述两个分块的预测值输出识别结果，其中，所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。
如权利要求11所述的计算机设备，其特征在于，其特征在于，所述对所述待识别图像执行预处理包括：

将所述待识别图像调整为预设分辨率；

对分辨率调整后的所述待识别图像中的每个像素点值执行归一化处理；

将归一化处理后的所述待识别图像扩展为三层图像。
如权利要求12所述的计算机设备，其特征在于，所述将所述待识别图像调整为预设分辨率包括：

将所述待识别图像的分辨率与预设的分辨率阈值进行比对；

当所述待识别图像的分辨率高于预设的分辨率阈值时，对所述待识别图像降采样至所述分辨率阈值；

当所述待识别图像的分辨率低于预设的分辨率阈值时，对所述待识别图像上采样至所述分辨率阈值。
如权利要求11所述的计算机设备，其特征在于，所述根据所述两个分块的预测值输出识别结果，其中，所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像包括：

将所述两个分块的预测值进行比较，选择预测值中的较大值作为所述待识别图像的预测值；

将所述待识别图像的预测值与预设的预测阈值进行比较；

若所述待识别图像的预测值大于或等于所述预测阈值时，输出识别结果为目标图像；

若所述待识别图像的预测值小于所述预测阈值时，输出识别结果为非目标图像。
如权利要求11所述的计算机设备，其特征在于，所述构建残差网络，采用预设的训练样本对所述残差网络进行训练包括：

构建残差网络，所述残差网络包括输入层、卷积层、最大池化层、16个残差模块、全连接层以及输出层；

收集多个指定用户的多张图像信息作为训练样本集和测试样本集；

对所述训练样本集和测试样本集中的每一张图像信息执行预处理；

将每一张预处理后的所述图像信息划分为不重叠的两个分块，对每一分块打上预设标签，所述预设标签包括第一标签和第二标签；

从所述训练样本集中获取若干张图像信息，将每一张图像信息带有预设标签的两个分块分别作为输入向量传入所述残差网络进行训练；

采用预设的损失函数计算每一所述分块经过所述残差网络的识别结果与对应的预设标签之间的误差，并根据所述误差修改所述残差网络的参数；

从所述训练样本集中获取若干张图像信息，将每一张图像信息带有预设标签的两个分块分别传入参数修改后的所述残差网络执行下一次迭代训练；

在迭代训练达到预设次数后，将测试样本集中带有预设标签的图像信息作为输入向量传入迭代训练得到的所述残差网络进行测试。
一个或多个存储有计算机可读指令的非易失性可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

构建残差网络，采用预设的训练样本对所述残差网络进行训练；

获取待识别图像；

对所述待识别图像执行预处理；

将预处理后的所述待识别图像划分为不重叠的两个分块，依次作为输入传入所述残差网络，获取每一分块经过所述残差网络后的预测值；

根据所述两个分块的预测值输出识别结果，其中，所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。
如权利要求16所述的非易失性可读存储介质，其特征在于，所述对所述待识别图像执行预处理包括：

将所述待识别图像调整为预设分辨率；

对分辨率调整后的所述待识别图像中的每个像素点值执行归一化处理；

将归一化处理后的所述待识别图像扩展为三层图像。
如权利要求17所述的非易失性可读存储介质，其特征在于，所述将所述待识别图像调整为预设分辨率包括：

将所述待识别图像的分辨率与预设的分辨率阈值进行比对；

当所述待识别图像的分辨率高于预设的分辨率阈值时，对所述待识别图像降采样至所述分辨率阈值；

当所述待识别图像的分辨率低于预设的分辨率阈值时，对所述待识别图像上采样至所述分辨率阈值。
如权利要求16所述的非易失性可读存储介质，其特征在于，所述根据所述两个分块的预测值输出识别结果，其中，所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像包括：

将所述两个分块的预测值进行比较，选择预测值中的较大值作为所述待识别图像的预测值；

将所述待识别图像的预测值与预设的预测阈值进行比较；

若所述待识别图像的预测值大于或等于所述预测阈值时，输出识别结果为目标图像；

若所述待识别图像的预测值小于所述预测阈值时，输出识别结果为非目标图像。
如权利要求16所述的非易失性可读存储介质，其特征在于，所述构建残差网络，采用预设的训练样本对所述残差网络进行训练包括：

构建残差网络，所述残差网络包括输入层、卷积层、最大池化层、16个残差模块、全连接层以及输出层；

收集多个指定用户的多张图像信息作为训练样本集和测试样本集；

对所述训练样本集和测试样本集中的每一张图像信息执行预处理；

将每一张预处理后的所述图像信息划分为不重叠的两个分块，对每一分块打上预设标签，所述预设标签包括第一标签和第二标签；

从所述训练样本集中获取若干张图像信息，将每一张图像信息带有预设标签的两个分块分别作为输入向量传入所述残差网络进行训练；

采用预设的损失函数计算每一所述分块经过所述残差网络的识别结果与对应的预设标签之间的误差，并根据所述误差修改所述残差网络的参数；

从所述训练样本集中获取若干张图像信息，将每一张图像信息带有预设标签的两个分块分别传入参数修改后的所述残差网络执行下一次迭代训练；

在迭代训练达到预设次数后，将测试样本集中带有预设标签的图像信息作为输入向量传入迭代训练得到的所述残差网络进行测试。