CN110163260A - 基于残差网络的图像识别方法、装置、设备及存储介质 - Google Patents
基于残差网络的图像识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110163260A CN110163260A CN201910345031.3A CN201910345031A CN110163260A CN 110163260 A CN110163260 A CN 110163260A CN 201910345031 A CN201910345031 A CN 201910345031A CN 110163260 A CN110163260 A CN 110163260A
- Authority
- CN
- China
- Prior art keywords
- images
- recognized
- residual error
- error network
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000003860 storage Methods 0.000 title claims abstract description 16
- 238000012360 testing method Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 8
- 238000003909 pattern recognition Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 8
- 230000003252 repetitive effect Effects 0.000 claims description 8
- 239000012141 concentrate Substances 0.000 claims description 3
- 206010035664 Pneumonia Diseases 0.000 abstract description 36
- 210000004072 lung Anatomy 0.000 abstract description 32
- 239000000284 extract Substances 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 210000000038 chest Anatomy 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 206010003598 Atelectasis Diseases 0.000 description 1
- 241000521257 Hydrops Species 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- 208000007123 Pulmonary Atelectasis Diseases 0.000 description 1
- 206010037394 Pulmonary haemorrhage Diseases 0.000 description 1
- 206010037423 Pulmonary oedema Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000003475 lamination Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 210000003281 pleural cavity Anatomy 0.000 description 1
- 230000002980 postoperative effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 208000005333 pulmonary edema Diseases 0.000 description 1
- 230000000452 restraining effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种残差网络的图像识别方法、装置、设备及存储介质,所述方法包括:构建残差网络,采用预设的训练样本对所述残差网络进行训练;获取待识别图像;对所述待识别图像执行预处理;将预处理后的所述待识别图像划分为不重叠的两个分块,依次作为输入传入所述残差网络,获取每一分块经过所述残差网络后的预测值;根据所述两个分块的预测值输出识别结果,所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。本发明通过残差网络提取出关键特征,能够减低噪声干扰,以高准确率判断出目标图像,将所述图像识别方法应用到肺部X光片图像,实现了基于残差网络识别包含肺炎信号的目标图像,有效地提高了肺炎预测的准确度。
Description
技术领域
本发明涉及信息技术领域,尤其涉及一种基于残差网络的图像识别方法、装置、设备及存储介质。
背景技术
肺炎对婴幼儿是一种高危疾病,占所有儿童死亡的15%以上。2015年,有约90万名5岁以下儿童死于该病。因此,准确诊断肺炎是一项艰巨的任务。现有技术主要通过训练有素的专家审查胸部X光片,并通过结合临床病史、生命体征和实验室的检查才能确认。X光诊断作为最常进行的放射成像诊断方式,其重要性不言而喻。在X光片中,肺炎通常表现为不透明度增加的区域。然而,肺部有许多其他疾病,如肺水肿,出血,肺不张或塌陷,肺癌或放疗后或手术后的其他变化,都会影响X光片中肺炎的判断;在肺外,胸膜腔内的液体,比如胸腔积液,也表现为X光片中的不透明度增加,从降低了从X光片图像中识别包含肺炎信号的目标图像的准确率。
因此,寻找一种提高从X光片图像中识别出包含肺炎信号的目标图像的识别准确率的方法成为本领域技术人员亟需解决的问题。
发明内容
本发明实施例提供了一种基于残差网络的图像识别方法、装置、设备及存储介质,以解决现有技术对包含肺炎信号的目标图像的识别准确率低的问题。
一种基于残差网络的图像识别方法,包括:
构建残差网络,采用预设的训练样本对所述残差网络进行训练;
获取待识别图像;
对所述待识别图像执行预处理;
将预处理后的所述待识别图像划分为不重叠的两个分块,依次作为输入传入所述残差网络,获取每一分块经过所述残差网络后的预测值;
根据所述两个分块的预测值输出识别结果,其中,所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。
进一步地,所述对所述待识别图像执行预处理包括:
将所述待识别图像调整为预设分辨率;
对分辨率调整后的所述待识别图像中的每个像素点值执行归一化处理;
将归一化处理后的所述待识别图像扩展为三层图像。
进一步地,所述将所述待识别图像调整为预设分辨率包括:
将所述待识别图像的分辨率与预设的分辨率阈值进行比对;
当所述待识别图像的分辨率高于预设的分辨率阈值时,对所述待识别图像降采样至所述分辨率阈值;
当所述待识别图像的分辨率低于预设的分辨率阈值时,对所述待识别图像上采样至所述分辨率阈值。
进一步地,所述根据所述两个分块的预测值输出识别结果,其中,所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像包括:
将所述两个分块的预测值进行比较,选择预测值中的较大值作为所述待识别图像的预测值;
将所述待识别图像的预测值与预设的预测阈值进行比较;
若所述待识别图像的预测值大于或等于所述预测阈值时,输出识别结果为目标图像;
若所述待识别图像的预测值小于所述预测阈值时,输出识别结果为非目标图像。
进一步地,所述构建残差网络,采用预设的训练样本对所述残差网络进行训练包块:
构建残差网络,所述残差网络包括输入层、卷积层、最大池化层、16个残差模块、全连接层以及输出层;
收集多个指定用户的多张图像信息作为训练样本集和测试样本集;
对所述训练样本集和测试样本集中的每一张图像信息执行预处理;
将每一张预处理后的所述图像信息划分为不重叠的两个分块,对每一分块打上预设标签,所述预设标签包括第一标签和第二标签;
从所述训练样本集中获取若干张图像信息,将每一张图像信息带有预设标签的两个分块分别作为输入向量传入所述残差网络进行训练;
采用预设的损失函数计算每一所述分块经过所述残差网络的识别结果与对应的预设标签之间的误差,并根据所述误差修改所述残差网络的参数;
从所述训练样本集中获取若干张图像信息,将每一张图像信息带有预设标签的两个分块分别传入参数修改后的所述残差网络执行下一次迭代训练;
在迭代训练达到预设次数后,将测试样本集中带有预设标签的图像信息作为输入向量传入迭代训练得到的所述残差网络进行测试。
一种基于残差网络的肺炎识别装置,包括:
训练模块,用于构建残差网络,采用预设的训练样本对所述残差网络进行训练;
获取模块,用于获取待识别图像;
预处理模块,用于对所述待识别图像执行预处理;
识别模块,用于将预处理后的所述待识别图像划分为不重叠的两个分块,依次作为输入传入所述残差网络,获取每一分块经过所述残差网络后的预测值;
输出模块,用于根据所述两个分块的预测值输出识别结果,其中,所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。
进一步地,所述预处理模块包括:
调整单元,用于将所述待识别图像调整为预设分辨率;
归一化单元,用于对分辨率调整后的所述待识别图像中的每个像素点值执行归一化处理;
扩展单元,用于将归一化处理后的所述待识别图像扩展为三层图像。
进一步地,所述调整单元包括:
比对子单元,用于将所述待识别图像的分辨率与预设的分辨率阈值进行比对;
降采样子单元,用于当所述待识别图像的分辨率高于预设的分辨率阈值时,对所述待识别图像降采样至所述分辨率阈值;
上采样子单元,用于当所述待识别图像的分辨率低于预设的分辨率阈值时,对所述待识别图像上采样至所述分辨率阈值。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于残差网络的图像识别方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于残差网络的图像识别方法。
本发明实施例通过构建残差网络,并采用预设的训练样本对所述残差网络进行训练;获取待识别图像;对所述待识别图像执行预处理;然后将预处理后的所述待识别图像划分为不重叠的两个分块,依次作为输入传入所述残差网络,通过所述残差网络提取关键特征进行预测,得到每一分块对应的预测值;根据所述两个分块的预测值输出识别结果,其中,所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像;通过残差网络提取出关键特征,能够减低噪声干扰,以高准确率判断出目标图像,将所述图像识别方法应用到肺部X光片图像,从而实现了基于残差网络识别包含肺炎信号的目标图像,提高肺炎预测的准确度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中基于残差网络的图像识别方法的一流程图;
图2是本发明一实施例中基于残差网络的图像识别方法中步骤S101的一流程图;
图3是本发明一实施例提供的残差网络的结构示意图;
图4是本发明一实施例中基于残差网络的图像识别方法中步骤S103的一流程图;
图5是本发明一实施例中基于残差网络的图像识别方法中步骤S401的一流程图;
图6是本发明一实施例中基于残差网络的图像识别方法中步骤S105的一流程图;
图7是本发明一实施例中基于残差网络的图像识别装置的一原理框图;
图8是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于残差网络的图像识别方法应用于服务器。所述服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一实施例中,如图1所示,提供了一种基于残差网络的图像识别方法,包括如下步骤:
在步骤S101中,构建残差网络,采用预设的训练样本对所述残差网络进行训练。
在这里,本发明实施例选取的深度神经网络为分类性能优异的残差网络ResNet(Residual Network,简称ResNet网络)。为便于理解,下面将对残差网络的训练过程进行详细描述。如图2所述,所述步骤S101包括:
在步骤S201中,构建残差网络,所述残差网络包括输入层、卷积层、最大池化层、16个残差模块、全连接层以及输出层。
如图3所示,为本发明实施例提供的残差网络的结构示意图。所述残差网络包括输入层、卷积层、最大池化层、16个残差模块、全连接层以及输出层。其中,所述卷积层的卷积核为7*7,通道数为64。最大池化层的窗口为3*3、步长为2。所述16个残差模块的结构相同,均包括三层卷积层,分别为卷积核为1*1的第一卷积层、卷积核为3*3的第二卷积层、卷积核为1*1的第三卷积层,每个卷积层后还包括一个批归一化层和激活层。所述全连接层的维度为2。
进一步地,16个残差模块根据不同的通道数划分为四组。第一组包括3个残差模块,每个残差模块中的第一卷积层的通道数为64、第二卷积层的通道数为64、第三卷积层的通道数为256。第二组包括4个残差模块,每个残差模块中的第一卷积层的通道数为128、第二卷积层的通道数为128、第三卷积层的通道数为512。第三组包括6个残差模块,每个残差模块中的第一卷积层的通道数为256、第二卷积层的通道数为256、第三卷积层的通道数为1024。第四组包括3个残差模块,每个残差模块中的第一卷积层的通道数为512、第二卷积层的通道数为512、第三卷积层的通道数为2048。
在步骤S202中,收集多个指定用户的多张图像信息作为训练样本集和测试样本集。
可选地,作为发明的一个优选示例,本发明实施例提供的基于残差网络的图像识别方法可用于通过基于残差网络识别包含肺炎信号的目标图像。因此,所述指定用户可以为肺炎患者,所述图像信息可以为肺部X光片图像,可以预先收集多个肺炎患者的5000以上张的X光片图像作为训练样本集,并选取不同于所述训练样本集的500张X片图像作为测试样本集。
在步骤S203中,对所述训练样本集和测试样本集中的每一张图像信息执行预处理。
在这里,对所述训练样本集和测试样本集中的每一张图像信息进行预处理与后续步骤S103相同,包括分辨率调整、归一化处理以及扩展,具体请参见后续实施例的叙述,此处不再赘述。预处理后的每一张图像信息为1024*1024像素的三层图像。
在步骤S204中,将每一张预处理后的所述图像信息划分为不重叠的两个分块,对每一分块打上预设标签,所述预设标签包括第一标签和第二标签。
在得到三层图像之后,将所述三层图像按照左右划分为不重叠的两个分块。所述两个分块应当为均等的两部分。然后为每一分块打上预设标签,所述预设标签用于区分图像信息是否包含关键信号,包括第一标签和第二标签,其中第一标签表示图像信息包含关键信号,第二标签表示图像信息未包含关键信号。
如前所述,当所述图像信息为肺部X光片图像时,所述两个分块分别表示左肺影像和右肺影像,每一分块包括三层图像,每一层图像的像素为512*1024。然后根据实际情况对所述两个分块打上预设标签。所述预设标签用于指示所述左肺影像和右肺影像是否患有肺炎。在这里,所述第一标签表示图像中包含肺炎信号,所述第二标签表示图像中未包含肺炎信号。若左肺影像/右肺影像患有肺炎,则将对应的左分块/右分块打上第一标签;若左肺影像/右肺影像未患有肺炎,则将对应的左分块/右分块打上第二标签。
可选地,所述第一标签和第二标签可以通过二进制数字0和1来表示。应当理解,以上仅为本发明的一个示例,并不用于限制本发明,在其他实施例中,所述预设标签还可以通过其他形式的标签来表示。
在完成标签设置后,本发明实施例以带有预设标签的所述图像信息作为所述残差网络的输入对所述残差网络进行若干次训练。每次训练若干张图像信息,比如30张X光片图像。
在步骤S205中,从所述训练样本集中获取若干张图像信息,将每一张图像信息带有预设标签的两个分块分别作为输入向量传入所述残差网络进行训练。
在训练时,针对每一个图像信息的两个分块,将带有标签的分块作为一个输入向量,传入预设的残差网络进行训练,得到每一个分块的识别结果。
所述残差网络的输入维度为512*1024*3,即图像信息的一个分块的大小。每一个分块在所述残差网络中,首先经过7*7*64的卷积层和3*3、步长为2的最大池化层后,得到256*512*64的特征图,所述特征图依次通过四组残差模块,经过第一组残差模块变化为128*256*256的特征图、经过第二组残差模块变化为64*128*512的特征图、经过第三组残差模块变化为32*64*1024的特征图、经过第四组残差模块变化为16*32*2048的特征图;最后经过维度为2的全连接层,得到所述分块的预测值;所述预测值进一步通过输出层得到分块是否为目标图像。承接前文示例,所述图像信息为肺部的X光片图像时,所述预测值表示所述分块为包含肺炎信号的目标图像的分值,所述分值越大,所述分块包含肺炎信号的概率越大。在得到所述分块的预测值之后,本发明实施例在输出层中设置预测阈值,将所述分块的预测值与所述预测阈值进行比对,若所述预测值大于或等于所述预测阈值,则判定所述分块为包含肺炎信号的目标图像,否则所述分块为未包含肺炎信号的非目标图像。
对该次训练中的若干张图像信息均执行上述步骤S205,直至遍历完所述若干张图像信息。执行步骤S206。
在步骤S206中,采用预设的损失函数计算每一所述分块经过所述残差网络的识别结果与对应的预设标签之间的误差,并根据所述误差修改所述残差网络的参数。
在完成一次训练,得到所述若干张图像信息的每一所述分块对应的识别结果后,采用预设的损失函数计算每一所述分块的识别结果与对应的预设标签之间的误差,并基于所述误差返回去修改所述残差网络中卷积层及残差模块的参数。可选地,本发明实施例采用交叉熵损失函数并应用反向传播算法把所述误差传回给各个卷积层,促使其不断学习特征,直至收敛。
在步骤S207中,从所述训练样本集中获取若干张图像信息,将每一张图像信息带有预设标签的两个分块分别传入参数修改后的所述残差网络执行下一次迭代训练。
通过步骤S206修改参数后的残差网络,用于进行下一次训练。在这里,本发明实施例先使用0.01的学习率训练3000次,每次包括30张图像信息,之后使用0.001的学习率继续训练1000次。学习率learning rate是训练残差网络的一个重要参数,其定义为网络模型中参数的更新幅度。学习率越大,模型中参数变化的越快。
因此,每次训练过程中,从训练样本集中随机选取30张带有预设标签的图像信息,将每一图像信息的两个分块作为输入向量依次传入参数修改后的残差网络进行训练,训练过程和步骤S205的相同,具体参见上面的叙述,此处不再赘述。重复迭代步骤S205、S206,直至完成学习率为0.01的训练和学习率为0.001的训练,使得所述残差网络能够学习到图像信息中的关键特征,比如前文示例的肺部X光片图像中的肺炎信号的关键特征,最终得到收敛的模型。
在步骤S208中,在迭代训练达到预设次数后,将测试样本集中带有预设标签的图像信息作为输入向量传入迭代训练得到的所述残差网络进行测试。
在这里,所述测试样本集为与训练样本集为不重合的若干张图像信息。在所述残差网络训练完毕后,将所述测试样本集中的每一个带有标签的图像信息作为输入向量传入所述残差网络进行测试,测试过程与步骤S204、S205的相同,具体参见上面的叙述,此处不再赘述。测试通过的标准是残差网络对测试样本集的识别结果的准确率达到指定的准确率阈值,即所述残差网络对测试样本集中的每一所述图像信息的识别结果与对应的预设标签相同的概率达到所述指定的准确率阈值,则说明所述残差网络中的各个参数已经调整到位。可选地,所述指定阈值可以为90%。
训练好的残差网络可用于对图像信息提取特征,能够有效减低噪声干扰,以高准确率判断出目标图像。所述基于残差网络的图像识别方法包括:
在步骤S102中,获取待识别图像。
作为本发明的一个优选示例,所述待识别图像可以为肺部的X光片图像,包括左肺和右肺的影像信息。可选地,服务器可以根据实际需要或者应用场景的需要获取待识别图像。例如,服务器从预设数据库中获取待识别图像,所述预设数据库中预先收集了大量肺部的X光片图像。所述服务器还可以通过连接到医院的影像设备得到所述待识别图像。可以理解的是,服务器还可以通过多种方式获取到待识别图像,此处不再过多赘述。
在步骤S103中,对所述待识别图像执行预处理。
在训练或者使用残差网络之前,本发明实施例首先对待识别图像进行预处理,以提高残差网络识别的速度和识别的准确度。可选地,如图4所示,所述步骤S103对所述待识别图像执行预处理包括:
在步骤S401中,将所述待识别图像调整为预设分辨率。
在这里,由于所述待识别图像为原始图像,可能存在像素、大小不一等影响识别的问题。鉴于此,本发明实施例首先对所述待识别图像的分辨率进行调整,以使得待识别图像符合残差网络的输入向量。可选地,如图5所示,所述步骤S401将所述待识别图像调整为预设分辨率包括:
在步骤S501中,将所述待识别图像的分辨率与预设的分辨率阈值进行比对。
可选地,所述预设的分辨率阈值与所述残差网络的输入维度相关。承接前文示例,假设所述残差网络的输入为一个表示左肺或右肺的分块,其维度为512*1024*3,而待识别图像通常包括两个肺部,因此,所述预设的分辨率阈值优选为1024*1024像素。本发明实施例将所述待识别图像的分辨率与所述预设的分辨率阈值1024*1024进行比对,以判断所述待识别图像的分辨率是过高还是过低。
在步骤S502中,当所述待识别图像的分辨率高于预设的分辨率阈值时,对所述待识别图像降采样至所述分辨率阈值。
在数位信号处理领域中,降采样,又称为减采样,是一种多速率数字信号处理的技术或是降低信号采样率的过程,通常用于降低数据传输速率或者数据大小。对于一幅N*M的图像来说,如果降采样系数为k,则在原图中每行每列每隔k个点取一个点组成一幅图像,使得新的图像的分辨率达到所述预设分辨率。
在步骤S503中,当所述待识别图像的分辨率低于预设的分辨率阈值时,对所述待识别图像上采样至所述分辨率阈值。
在这里,上采样和下采样都是对数字信号进行重采。上采样,也即插值,如果上采样系数为k,则在原图n与n+1两点之间插入k-1个点,使其构成k分。本发明实施例采用双线性插值法对所述待识别图像上采样至所述预设分辨率,即对所述待识别图像的每行插值完之后对于每列也进行插值。
本发明实施例通过对所述待识别图像的分辨率进行调整,使得所述待识别图像符合残差网络的输入维度,有利于提高残差网络对所述待识别图像进行识别的速度。
在步骤S402中,对分辨率调整后的所述待识别图像中的每个像素点值执行归一化处理。
在完成对所述待识别图像的分辨率调整之后,本发明实施例对所述待识别图像中的每个像素点值进行归一化处理,即将每个像素点值变换到[-1,1]之间。可选地,归一化处理的计算公式为:
在上式中,x表示X光片图像中任意像素点的值,所述x'表示像素点经过归一化后的值。
在这里,本发明实施例通过对分辨率调整后的所述待识别图像的每个像素点值进行归一化处理,使得待识别图像中的数据分布更加均匀,有利于加速残差网络的识别过程。
在步骤S403中,将归一化处理后的所述待识别图像扩展为三层图像。
在完成归一化处理之后,本发明实施例进一步将所述待识别图像进行复制,扩展为三层图像。示例性地,假设归一化处理后的所述待识别图像的分辨率为1024*1024,通过步骤S402得到的待识别图像为1024*1024*1,通过步骤S403后所述待识别图像扩展为三层,即1024*1024*3。通过将所述待识别图像扩展为三层图像,有利于残差网络导入预设参数,避免网络无法收敛的情况。
在步骤S104中,将预处理后的所述待识别图像划分为不重叠的两个分块,依次作为输入传入所述残差网络,获取每一分块经过所述残差网络后的预测值。
在得到三层图像之后,将所述三层图像按照左右划分为不重叠的两个分块。所述两个分块应当为均等的两部分。承接前文示例,若所述待识别图像为肺部的X光片图像,包括左肺和右肺的影像信息,则所述两个分块分别表示左肺影像和右肺影像,每一分块包括三层图像,每一层图像的像素为512*1024。然后将每一分块传入训练好的所述残差网络进行独立的识别。所述残差网络对每一分块进行预测,输出每一分块的预测值。
在这里,所述预测值表示所述分块为目标图像的分值,所述分值越大,所述分块归为目标图像的概率越大,所述分值越小,所述分块归为目标图像的概率越小。承接前文示例,若所述待识别图像为肺部的X光片图像时,所述预测值表示所述分块为包含肺炎信号的目标图像的分值,所述分值越大,所述分块归为包含肺炎信号的目标图像的概率越大,所述分值越小,所述分块归为包含肺炎信号的目标图像的概率越小。
在步骤S105中,根据所述两个分块的预测值输出识别结果,其中,所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。
在得到每一分块经过所述残差网络的预测值后,本发明实施例综合分析所述两个分块的预测值,得到所述待识别图像的预测值,并根据所述待识别图像的预测值输出识别结果。可选地,如图6所示,所述步骤S105根据所述两个分块的预测值输出识别结果包括:
在步骤S601中,将所述两个分块的预测值进行比较,选择预测值中的较大值作为所述待识别图像的预测值。
在这里,每个分块的预测值表示该分块为包含肺炎信号的目标图像的概率。在得到两个分块的预测值后,本发明将两个分块的预测值进行比较,选取较大预测值作为所述待识别图像的预测值。
在步骤S602中,将所述待识别图像的预测值与预设的预测阈值进行比较。
在本发明实施例中,预先根据经验设置预测阈值。所述预测阈值为待识别图像是否为包含肺炎信号的目标图像的判断标准。在得到待识别图像的预测值之后,将所述预测值与所述预测阈值进行比较。
在步骤S603中,若所述待识别图像的预测值大于或等于所述预测阈值时,输出识别结果为目标图像。
如前所述,所述预测值表示所述分块为包含肺炎信号的目标图像的分值,所述分值越大,所述分块包含肺炎信号的概率越大。当所述待识别图像的预测值大于或等于所述预测阈值时,判定所述待识别图像中疑似存在肺炎,输出分类结果为目标图像。
在步骤S604中,若所述待识别图像的预测值小于所述预测阈值时,输出识别结果为非目标图像。
当所述待识别图像的预测值小于所述预测阈值时,判定所述待识别图像未存在肺炎,输出分类结果为非目标图像。
在这里,本发明实施例通过将所述待识别图像划分为两个分块输入残差网络进行预测,可以在保留足够清晰度的同时,降低计算成本,减少训练时间,提高残差网络预测的效率。
综上所述,本发明实施例通过对待识别图像进行预处理,然后通过残差网络对预处理后的所述待识别图像提取出关键特征进行预测,得到所述待识别图像的预测值,所述预测值表示所述分块为包含肺炎信号的目标图像的分值,所述分值越大,所述分块包含肺炎信号的概率越大;最后基于所述预测值与预设阈值进行比对,并根据比对结果得到所述待识别图像是否为目标图像;从而实现了基于残差网络识别包含肺炎信号的目标图像,通过残差网络提取出关键特征,能够减低噪声干扰,以高准确率判断出是否患有肺炎,提高肺炎预测的准确度。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种基于残差网络的图像识别装置,该基于残差网络的图像识别装置与上述实施例中基于残差网络的图像识别方法一一对应。如图7所示,该基于残差网络的图像识别装置包括训练模块、获取模块、预处理模块、识别模块、输出模块。各功能模块详细说明如下:
训练模块71,用于构建残差网络,采用预设的训练样本对所述残差网络进行训练;
获取模块72,用于获取待识别图像;
预处理模块73,用于对所述待识别图像执行预处理;
识别模块74,用于将预处理后的所述待识别图像划分为不重叠的两个分块,依次作为输入传入所述残差网络,获取每一分块经过所述残差网络后的预测值;
输出模块75,用于根据所述两个分块的预测值输出识别结果,其中,所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。
可选地,所述预处理模块73包括:
调整单元,用于将所述待识别图像调整为预设分辨率;
归一化单元,用于对分辨率调整后的所述待识别图像中的每个像素点值执行归一化处理;
扩展单元,用于将归一化处理后的所述待识别图像扩展为三层图像。
可选地,所述调整单元包括:
比对子单元,用于将所述待识别图像的分辨率与预设的分辨率阈值进行比对;
降采样子单元,用于当所述待识别图像的分辨率高于预设的分辨率阈值时,对所述待识别图像降采样至所述分辨率阈值;
上采样子单元,用于当所述待识别图像的分辨率低于预设的分辨率阈值时,对所述待识别图像上采样至所述分辨率阈值。
可选地,所述输出模块75包括:
第一比较单元,用于将所述两个分块的预测值进行比较,选择预测值中的较大值作为所述待识别图像的预测值;
第二比较单元,用于将所述待识别图像的预测值与预设的预测阈值进行比较;
第一输出单元,用于若所述待识别图像的预测值大于或等于所述预测阈值时,输出识别结果为目标图像;
第二输出单元,用于若所述待识别图像的预测值小于所述预测阈值时,输出识别结果为非目标图像。
可选地,所述训练模块71包块:
构建单元,用于构建残差网络,所述残差网络包括输入层、卷积层、最大池化层、16个残差模块、全连接层以及输出层;
收集单元,用于收集多个指定用户的多张图像信息作为训练样本集和测试样本集;
预处理单元,用于对所述训练样本集和测试样本集中的每一张图像信息执行预处理;
标签单元,用于将每一张预处理后的所述图像信息划分为不重叠的两个分块,对每一分块打上预设标签,所述预设标签包括第一标签和第二标签;
训练单元,用于从所述训练样本集中获取若干张图像信息,将每一张图像信息带有预设标签的两个分块分别作为输入向量传入所述残差网络进行训练;
修正单元,用于采用预设的损失函数计算每一所述分块经过所述残差网络的识别结果与对应的预设标签之间的误差,并根据所述误差修改所述残差网络的参数;
迭代单元,用于从所述训练样本集中获取若干张图像信息,将每一张图像信息带有预设标签的两个分块分别传入参数修改后的所述残差网络执行下一次迭代训练;
测试单元,用于在迭代训练达到预设次数后,将测试样本集中带有预设标签的图像信息作为输入向量传入迭代训练得到的所述残差网络进行测试。
关于基于残差网络的图像识别装置的具体限定可以参见上文中对于基于残差网络的图像识别方法的限定,在此不再赘述。上述基于残差网络的图像识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于残差网络的图像识别方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
构建残差网络,采用预设的训练样本对所述残差网络进行训练;
获取待识别图像;
对所述待识别图像执行预处理;
将预处理后的所述待识别图像划分为不重叠的两个分块,依次作为输入传入所述残差网络,获取每一分块经过所述残差网络后的预测值;
根据所述两个分块的预测值输出识别结果,其中,所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
构建残差网络,采用预设的训练样本对所述残差网络进行训练;
获取待识别图像;
对所述待识别图像执行预处理;
将预处理后的所述待识别图像划分为不重叠的两个分块,依次作为输入传入所述残差网络,获取每一分块经过所述残差网络后的预测值;
根据所述两个分块的预测值输出识别结果,其中,所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于残差网络的图像识别方法,其特征在于,包括:
构建残差网络,采用预设的训练样本对所述残差网络进行训练;
获取待识别图像;
对所述待识别图像执行预处理;
将预处理后的所述待识别图像划分为不重叠的两个分块,依次作为输入传入所述残差网络,获取每一分块经过所述残差网络后的预测值;
根据所述两个分块的预测值输出识别结果,其中,所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。
2.如权利要求1所述的基于残差网络的图像识别方法,其特征在于,所述对所述待识别图像执行预处理包括:
将所述待识别图像调整为预设分辨率;
对分辨率调整后的所述待识别图像中的每个像素点值执行归一化处理;
将归一化处理后的所述待识别图像扩展为三层图像。
3.如权利要求2所述的基于残差网络的图像识别方法,其特征在于,所述将所述待识别图像调整为预设分辨率包括:
将所述待识别图像的分辨率与预设的分辨率阈值进行比对;
当所述待识别图像的分辨率高于预设的分辨率阈值时,对所述待识别图像降采样至所述分辨率阈值;
当所述待识别图像的分辨率低于预设的分辨率阈值时,对所述待识别图像上采样至所述分辨率阈值。
4.如权利要求1所述的基于残差网络的图像识别方法,其特征在于,所述根据所述两个分块的预测值输出识别结果,其中,所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像包括:
将所述两个分块的预测值进行比较,选择预测值中的较大值作为所述待识别图像的预测值;
将所述待识别图像的预测值与预设的预测阈值进行比较;
若所述待识别图像的预测值大于或等于所述预测阈值时,输出识别结果为目标图像;
若所述待识别图像的预测值小于所述预测阈值时,输出识别结果为非目标图像。
5.如权利要求1所述的基于残差网络的图像识别方法,其特征在于,所述构建残差网络,采用预设的训练样本对所述残差网络进行训练包块:
构建残差网络,所述残差网络包括输入层、卷积层、最大池化层、16个残差模块、全连接层以及输出层;
收集多个指定用户的多张图像信息作为训练样本集和测试样本集;
对所述训练样本集和测试样本集中的每一张图像信息执行预处理;
将每一张预处理后的所述图像信息划分为不重叠的两个分块,对每一分块打上预设标签,所述预设标签包括第一标签和第二标签;
从所述训练样本集中获取若干张图像信息,将每一张图像信息带有预设标签的两个分块分别作为输入向量传入所述残差网络进行训练;
采用预设的损失函数计算每一所述分块经过所述残差网络的识别结果与对应的预设标签之间的误差,并根据所述误差修改所述残差网络的参数;
从所述训练样本集中获取若干张图像信息,将每一张图像信息带有预设标签的两个分块分别传入参数修改后的所述残差网络执行下一次迭代训练;
在迭代训练达到预设次数后,将测试样本集中带有预设标签的图像信息作为输入向量传入迭代训练得到的所述残差网络进行测试。
6.一种基于残差网络的图像识别装置,其特征在于,包括:
训练模块,用于构建残差网络,采用预设的训练样本对所述残差网络进行训练;
获取模块,用于获取待识别图像;
预处理模块,用于对所述待识别图像执行预处理;
识别模块,用于将预处理后的所述待识别图像划分为不重叠的两个分块,依次作为输入传入所述残差网络,获取每一分块经过所述残差网络后的预测值;
输出模块,用于根据所述两个分块的预测值输出识别结果,其中,所述识别结果包括所述待识别图像为目标图像和所述待识别图像为非目标图像。
7.如权利要求6所述的基于残差网络的图像识别装置,其特征在于,所述预处理模块包括:
调整单元,用于将所述待识别图像调整为预设分辨率;
归一化单元,用于对分辨率调整后的所述待识别图像中的每个像素点值执行归一化处理;
扩展单元,用于将归一化处理后的所述待识别图像扩展为三层图像。
8.如权利要求7所述的基于残差网络的图像识别装置,其特征在于,所述调整单元包括:
比对子单元,用于将所述待识别图像的分辨率与预设的分辨率阈值进行比对;
降采样子单元,用于当所述待识别图像的分辨率高于预设的分辨率阈值时,对所述待识别图像降采样至所述分辨率阈值;
上采样子单元,用于当所述待识别图像的分辨率低于预设的分辨率阈值时,对所述待识别图像上采样至所述分辨率阈值。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的基于残差网络的图像识别方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的基于残差网络的图像识别方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910345031.3A CN110163260B (zh) | 2019-04-26 | 2019-04-26 | 基于残差网络的图像识别方法、装置、设备及存储介质 |
PCT/CN2019/117426 WO2020215676A1 (zh) | 2019-04-26 | 2019-11-12 | 基于残差网络的图像识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910345031.3A CN110163260B (zh) | 2019-04-26 | 2019-04-26 | 基于残差网络的图像识别方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110163260A true CN110163260A (zh) | 2019-08-23 |
CN110163260B CN110163260B (zh) | 2024-05-28 |
Family
ID=67638758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910345031.3A Active CN110163260B (zh) | 2019-04-26 | 2019-04-26 | 基于残差网络的图像识别方法、装置、设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110163260B (zh) |
WO (1) | WO2020215676A1 (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110738235A (zh) * | 2019-09-16 | 2020-01-31 | 平安科技(深圳)有限公司 | 肺结核判定方法、装置、计算机设备及存储介质 |
CN110751221A (zh) * | 2019-10-24 | 2020-02-04 | 广东三维家信息科技有限公司 | 图片分类方法、装置、电子设备及计算机可读存储介质 |
CN111581418A (zh) * | 2020-04-29 | 2020-08-25 | 山东科技大学 | 一种基于图像关联人物信息的目标人员搜索方法 |
WO2020215676A1 (zh) * | 2019-04-26 | 2020-10-29 | 平安科技(深圳)有限公司 | 基于残差网络的图像识别方法、装置、设备及存储介质 |
CN112232338A (zh) * | 2020-10-13 | 2021-01-15 | 中国平安人寿保险股份有限公司 | 核保理赔过程的资料录入方法、装置、设备及存储介质 |
CN113052308A (zh) * | 2019-12-26 | 2021-06-29 | 中国移动通信集团北京有限公司 | 训练目标小区识别模型的方法及目标小区识别方法 |
CN113379779A (zh) * | 2021-06-07 | 2021-09-10 | 华南理工大学 | 堆叠宽度学习系统的边缘计算方法、装置、介质和设备 |
CN114202746A (zh) * | 2021-11-10 | 2022-03-18 | 深圳先进技术研究院 | 路面状态识别方法、装置、终端设备及存储介质 |
CN114998695A (zh) * | 2022-07-18 | 2022-09-02 | 深圳市前海泽金产融科技有限公司 | 一种提高图像识别速度的方法及系统 |
WO2023082103A1 (zh) * | 2021-11-10 | 2023-05-19 | 深圳先进技术研究院 | 路面状态识别方法、装置、终端设备、存储介质及产品 |
CN116543789A (zh) * | 2023-07-06 | 2023-08-04 | 中国电信股份有限公司 | 设备异常识别方法、装置、设备及介质 |
CN111104967B (zh) * | 2019-12-02 | 2023-12-22 | 精锐视觉智能科技(上海)有限公司 | 图像识别网络训练方法、图像识别方法、装置及终端设备 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801128B (zh) * | 2020-12-14 | 2023-10-13 | 深圳云天励飞技术股份有限公司 | 非机动车识别方法、装置、电子设备及存储介质 |
CN113449682B (zh) * | 2021-07-15 | 2023-08-08 | 四川九洲电器集团有限责任公司 | 一种基于动态融合模型识别民航领域射频指纹的方法 |
CN113673568B (zh) * | 2021-07-19 | 2023-08-22 | 华南理工大学 | 篡改图像的检测方法、系统、计算机设备和存储介质 |
CN114092759A (zh) * | 2021-10-27 | 2022-02-25 | 北京百度网讯科技有限公司 | 图像识别模型的训练方法、装置、电子设备及存储介质 |
CN114359958B (zh) * | 2021-12-14 | 2024-02-20 | 合肥工业大学 | 一种基于通道注意力机制的猪脸识别方法 |
CN115001937B (zh) * | 2022-04-11 | 2023-06-16 | 北京邮电大学 | 面向智慧城市物联网的故障预测方法及装置 |
CN115462550B (zh) * | 2022-10-24 | 2024-07-05 | 西昌学院 | 烟叶烘烤控制方法、装置、电子设备及可读存储介质 |
CN116524327B (zh) * | 2023-06-25 | 2023-08-25 | 云账户技术(天津)有限公司 | 人脸识别模型的训练方法、装置、电子设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106228162A (zh) * | 2016-07-22 | 2016-12-14 | 王威 | 一种基于深度学习的移动机器人快速物体识别方法 |
CN106874840A (zh) * | 2016-12-30 | 2017-06-20 | 东软集团股份有限公司 | 车辆信息识别方法及装置 |
CN107944458A (zh) * | 2017-12-08 | 2018-04-20 | 北京维大成科技有限公司 | 一种基于卷积神经网络的图像识别方法和装置 |
CN108229379A (zh) * | 2017-12-29 | 2018-06-29 | 广东欧珀移动通信有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
CN108596143A (zh) * | 2018-05-03 | 2018-09-28 | 复旦大学 | 基于残差量化卷积神经网络的人脸识别方法及装置 |
CN109492556A (zh) * | 2018-10-28 | 2019-03-19 | 北京化工大学 | 面向小样本残差学习的合成孔径雷达目标识别方法 |
CN109583369A (zh) * | 2018-11-29 | 2019-04-05 | 北京邮电大学 | 一种基于目标区域分割网络的目标识别方法及装置 |
CN109583297A (zh) * | 2018-10-25 | 2019-04-05 | 清华大学 | 视网膜oct体数据识别方法及装置 |
CN109636780A (zh) * | 2018-11-26 | 2019-04-16 | 深圳先进技术研究院 | 乳腺密度自动分级方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106097379B (zh) * | 2016-07-22 | 2018-11-09 | 宁波大学 | 一种使用自适应阈值的图像篡改检测与定位方法 |
US10187171B2 (en) * | 2017-03-07 | 2019-01-22 | The United States Of America, As Represented By The Secretary Of The Navy | Method for free space optical communication utilizing patterned light and convolutional neural networks |
CN109241967B (zh) * | 2018-09-04 | 2021-01-05 | 青岛大学附属医院 | 基于深度神经网络的甲状腺超声图像自动识别系统、计算机设备、存储介质 |
CN110163260B (zh) * | 2019-04-26 | 2024-05-28 | 平安科技(深圳)有限公司 | 基于残差网络的图像识别方法、装置、设备及存储介质 |
-
2019
- 2019-04-26 CN CN201910345031.3A patent/CN110163260B/zh active Active
- 2019-11-12 WO PCT/CN2019/117426 patent/WO2020215676A1/zh active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106228162A (zh) * | 2016-07-22 | 2016-12-14 | 王威 | 一种基于深度学习的移动机器人快速物体识别方法 |
CN106874840A (zh) * | 2016-12-30 | 2017-06-20 | 东软集团股份有限公司 | 车辆信息识别方法及装置 |
CN107944458A (zh) * | 2017-12-08 | 2018-04-20 | 北京维大成科技有限公司 | 一种基于卷积神经网络的图像识别方法和装置 |
CN108229379A (zh) * | 2017-12-29 | 2018-06-29 | 广东欧珀移动通信有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
CN108596143A (zh) * | 2018-05-03 | 2018-09-28 | 复旦大学 | 基于残差量化卷积神经网络的人脸识别方法及装置 |
CN109583297A (zh) * | 2018-10-25 | 2019-04-05 | 清华大学 | 视网膜oct体数据识别方法及装置 |
CN109492556A (zh) * | 2018-10-28 | 2019-03-19 | 北京化工大学 | 面向小样本残差学习的合成孔径雷达目标识别方法 |
CN109636780A (zh) * | 2018-11-26 | 2019-04-16 | 深圳先进技术研究院 | 乳腺密度自动分级方法及装置 |
CN109583369A (zh) * | 2018-11-29 | 2019-04-05 | 北京邮电大学 | 一种基于目标区域分割网络的目标识别方法及装置 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020215676A1 (zh) * | 2019-04-26 | 2020-10-29 | 平安科技(深圳)有限公司 | 基于残差网络的图像识别方法、装置、设备及存储介质 |
CN110738235A (zh) * | 2019-09-16 | 2020-01-31 | 平安科技(深圳)有限公司 | 肺结核判定方法、装置、计算机设备及存储介质 |
CN110751221A (zh) * | 2019-10-24 | 2020-02-04 | 广东三维家信息科技有限公司 | 图片分类方法、装置、电子设备及计算机可读存储介质 |
CN111104967B (zh) * | 2019-12-02 | 2023-12-22 | 精锐视觉智能科技(上海)有限公司 | 图像识别网络训练方法、图像识别方法、装置及终端设备 |
CN113052308B (zh) * | 2019-12-26 | 2024-05-03 | 中国移动通信集团北京有限公司 | 训练目标小区识别模型的方法及目标小区识别方法 |
CN113052308A (zh) * | 2019-12-26 | 2021-06-29 | 中国移动通信集团北京有限公司 | 训练目标小区识别模型的方法及目标小区识别方法 |
CN111581418A (zh) * | 2020-04-29 | 2020-08-25 | 山东科技大学 | 一种基于图像关联人物信息的目标人员搜索方法 |
CN112232338B (zh) * | 2020-10-13 | 2023-09-08 | 中国平安人寿保险股份有限公司 | 核保理赔过程的资料录入方法、装置、设备及存储介质 |
CN112232338A (zh) * | 2020-10-13 | 2021-01-15 | 中国平安人寿保险股份有限公司 | 核保理赔过程的资料录入方法、装置、设备及存储介质 |
CN113379779B (zh) * | 2021-06-07 | 2023-04-07 | 华南理工大学 | 堆叠宽度学习系统的边缘计算方法、装置、介质和设备 |
CN113379779A (zh) * | 2021-06-07 | 2021-09-10 | 华南理工大学 | 堆叠宽度学习系统的边缘计算方法、装置、介质和设备 |
WO2023082103A1 (zh) * | 2021-11-10 | 2023-05-19 | 深圳先进技术研究院 | 路面状态识别方法、装置、终端设备、存储介质及产品 |
CN114202746A (zh) * | 2021-11-10 | 2022-03-18 | 深圳先进技术研究院 | 路面状态识别方法、装置、终端设备及存储介质 |
CN114202746B (zh) * | 2021-11-10 | 2024-04-12 | 深圳先进技术研究院 | 路面状态识别方法、装置、终端设备及存储介质 |
CN114998695A (zh) * | 2022-07-18 | 2022-09-02 | 深圳市前海泽金产融科技有限公司 | 一种提高图像识别速度的方法及系统 |
CN116543789A (zh) * | 2023-07-06 | 2023-08-04 | 中国电信股份有限公司 | 设备异常识别方法、装置、设备及介质 |
CN116543789B (zh) * | 2023-07-06 | 2023-09-29 | 中国电信股份有限公司 | 设备异常识别方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110163260B (zh) | 2024-05-28 |
WO2020215676A1 (zh) | 2020-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110163260A (zh) | 基于残差网络的图像识别方法、装置、设备及存储介质 | |
CN111784671B (zh) | 基于多尺度深度学习的病理图像病灶区域检测方法 | |
CN110136103A (zh) | 医学影像解释方法、装置、计算机设备及存储介质 | |
CN111738363B (zh) | 基于改进的3d cnn网络的阿尔茨海默病分类方法 | |
CN109192305B (zh) | 一种基于深度循环神经网络的心功能自动分析方法 | |
CN109410219A (zh) | 一种基于金字塔融合学习的图像分割方法、装置和计算机可读存储介质 | |
CN111738302B (zh) | 一种基于多模态数据对阿尔茨海默病进行分类诊断的系统 | |
CN111584073A (zh) | 基于人工智能融合多模态信息构建肺结节良恶性的多种病理类型的诊断模型 | |
He et al. | Automated model design and benchmarking of deep learning models for covid-19 detection with chest ct scans | |
CN112348830B (zh) | 基于改进3D U-Net的多器官分割方法 | |
CN113935943A (zh) | 颅内动脉瘤识别检测的方法、装置、计算机设备和存储介质 | |
CN110930378A (zh) | 基于低数据需求的肺气肿影像处理方法及系统 | |
CN110189302A (zh) | 脑图像分析方法、计算机设备和可读存储介质 | |
WO2020161481A1 (en) | Method and apparatus for quality prediction | |
CN117456183A (zh) | 一种多层级特征提取融合注意力机制的医学图像分割方法 | |
CN115331071A (zh) | 一种基于多尺度特征图的结核性脑膜脑炎预测方法及系统 | |
WO2021119875A1 (zh) | 基于神经网络结构搜索的磁共振快速成像方法和装置 | |
CN116258685A (zh) | 全局和局部特征同时提取与融合的多器官分割方法及装置 | |
CN112990359B (zh) | 一种影像数据处理方法、装置、计算机及存储介质 | |
CN114565601A (zh) | 基于DeepLabV3+改进的肝脏CT图像分割算法 | |
CN111063000B (zh) | 基于神经网络结构搜索的磁共振快速成像方法和装置 | |
CN107832695A (zh) | 在视网膜图像中基于纹理特征的视盘识别方法及装置 | |
CN111755131A (zh) | 一种基于注意力引导的covid-19早筛和严重程度评估方法和系统 | |
CN116665896A (zh) | 预测乳腺癌腋窝淋巴结转移的模型建立方法 | |
CN116468702A (zh) | 黄褐斑评估方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |