CN108171260A - 一种图片识别方法及系统 - Google Patents

一种图片识别方法及系统 Download PDF

Info

Publication number
CN108171260A
CN108171260A CN201711352429.7A CN201711352429A CN108171260A CN 108171260 A CN108171260 A CN 108171260A CN 201711352429 A CN201711352429 A CN 201711352429A CN 108171260 A CN108171260 A CN 108171260A
Authority
CN
China
Prior art keywords
picture
identified
layer
classification
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711352429.7A
Other languages
English (en)
Other versions
CN108171260B (zh
Inventor
边云龙
李鑫
刘霄
李旭斌
孙昊
文石磊
丁二锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201711352429.7A priority Critical patent/CN108171260B/zh
Publication of CN108171260A publication Critical patent/CN108171260A/zh
Application granted granted Critical
Publication of CN108171260B publication Critical patent/CN108171260B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供一种图片识别方法及系统,所述方法包括:获取待识别的图片;将所述待识别的图片输入预先训练的图片识别模型,获取待识别的图片的预测类别标签;所述预先训练的图片识别模型采用卷积神经网络模型,且所述卷积神经网络模型包括输入层、卷积层、注意力分支、按元素操作层、池化层、全连接层和输出层;其中,注意力分支根据所述待识别的图片各区域的全局特征确定图片各区域的权重;按元素操作层用于根据图片各区域的权重对卷积层输出的图片的局部特征进行加权处理;根据所述待识别的图片的预测类别标签,识别所述待识别的图片的类别。解决了特定类型,例如图片主体区域过小或嵌套/拼接类图片的识别率较低的问题。

Description

一种图片识别方法及系统
【技术领域】
本申请涉及人工智能领域,尤其涉及一种图片识别方法及系统。
【背景技术】
在很多应用场景中,需要对图片进行分类,便于对图片进行管理。例如,一切涉及UGC(用户产生的数据)的互联网公司,按照国家有关规定,都需要过滤其中涉及色情的图像。
在图片较少的时候,可以人工手动地对图片进行分类。但是随着网络科技的发展,在网络场景下,通常需要对成千上万的图片进行分类,手动处理方式变得过于不切实际,因此,在网络场景中,如何智能地对图片进行识别,以进行分类变得尤为重要。
现有的技术方案中,通过计算机视觉技术可以自动审核涉黄图像,但都是基于整张图片进行分类的,对于图片主体区域过小或嵌套/拼接类图片的识别率较低。例如,对于涉黄区域过小的图片,由于图片大部分区域都是正常的;对于嵌套/拼接图,由于是多张图片直接拼在一起,其中涉黄图片可能只占很小一部分。因此识别率较低。
【发明内容】
本申请的多个方面提供一种图片识别方法及系统,用以提高图片识别的准确性和效率。
本申请的一方面,提供一种图片识别方法,包括:
获取待识别的图片;
将所述待识别的图片输入预先训练的图片识别模型,获取待识别的图片的预测类别标签;
所述预先训练的图片识别模型采用卷积神经网络模型,包括输入层、卷积层、注意力分支、按元素操作层、池化层、全连接层和输出层;其中,注意力分支根据卷积层输出的待识别的图片的局部特征得到所述待识别的图片各区域的全局特征,进一步确定所述待识别的图片各区域的权重;按元素操作层用于根据待识别的图片各区域的权重对卷积层输出的待识别的图片的局部特征进行加权处理,将加权处理结果输出到池化层;
根据所述待识别的图片的预测类别标签,识别所述待识别的图片的类别。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,根据所述待识别的图片和预先训练的图片识别模型,获取待识别的图片的预测类别标签之前,所述方法还包括:
采集数个已经确定类别的训练图片,生成训练集;
根据训练集中的数张训练图片以及各训练图片的类别,训练图片识别模型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,根据所述待识别的图片和预先训练的图片识别模型,获取待识别的图片的预测类别标签包括:
卷积层对所述待识别的图片进行卷积,得到待识别的图片的局部特征;
注意力分支根据待识别的图片各区域的全局特征确定各区域的权重;
按元素操作层根据各区域的权重对各区域局部特征进行加权处理;
输出层根据所述得分确定所述待识别的图片的预测类别标签。
池化层对待识别的图片加权后的局部特征进行下采样得到全局特征;
全连接层根据待识别图片加权下采样的得到的全局特征计算每一类别的得分;
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,根据训练集中的数张训练图片以及各训练图片的类别,训练图片识别模型包括:
利用梯度下降法对图片识别模型的参数进行更新。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,根据所述待识别的图片的预测类别标签,识别所述待识别的图片的类别包括:
根据所述待识别的图片的所述预测类别标签,获取所述待识别的图片对应的概率最大的类别;
将所述待识别的图片对应的概率最大的类别作为所述待识别的图片的类别。
本申请的另一方面,提供一种图片识别系统,包括:
获取模块,用于获取待识别的图片;
预测模块,用于根据所述待识别的图片和预先训练的图片识别模型,获取待识别的图片的预测类别标签;
所述预先训练的图片识别模型采用卷积神经网络模型,包括输入层、卷积层、注意力分支、按元素操作层、池化层、全连接层和输出层;其中,注意力分支根据卷积层输出的待识别的图片的局部特征得到所述待识别的图片各区域的全局特征,进一步确定所述待识别的图片各区域的权重;按元素操作层用于根据待识别的图片各区域的权重对卷积层输出的待识别的图片的局部特征进行加权处理,将加权处理结果输出到池化层;
识别模块,用于根据所述待识别的图片的预测类别标签,识别所述待识别的图片的类别。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述系统还包括:
采集模块,用于采集数个已经确定类别的训练图片,生成训练集;
训练模块,根据训练集中的数张训练图片以及各训练图片的类别,训练图片识别模型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述预测模块,具体用于:
卷积层对所述待识别的图片进行卷积,得到待识别的图片的局部特征;
注意力分支根据待识别的图片各区域的全局特征确定各区域的权重;
按元素操作层根据各区域的权重对各区域局部特征进行加权处理;
池化层对待识别的图片加权后的局部特征进行下采样得到全局特征;
全连接层根据待识别图片加权下采样的得到的全局特征计算每一类别的得分;
输出层根据所述得分确定所述待识别的图片的预测类别标签。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述训练模块,具体用于利用梯度下降法对图片识别模型的参数进行更新。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述识别模块,具体用于:
根据所述待识别的图片的所述预测类别标签,获取所述待识别的图片对应的概率最大的类别;
将所述待识别的图片对应的概率最大的类别作为所述待识别的图片的类别。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,
本申请的另一方面,提供一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现任一上述的方法。
本申请的另一方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现任一上述的方法。
由所述技术方案可知,采用本实施例提供的技术方案,能够避免现有技术中对图片主题区域过小或嵌套/拼接类图片的识别率较低的问题。
【附图说明】
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的图片识别方法的流程示意图;
图2为本申请另一实施例提供的图片识别系统的结构示意图;
图3为本申请实施例提供的图片识别模型的结构示意图;
图4为适于用来实现本发明实施例的示例性计算机系统/服务器的框图。
【具体实施方式】
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本申请保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本申请一实施例提供的图片识别方法的流程图,如图1所示,包括以下步骤:
步骤S11、获取待识别的图片;
步骤S12、将所述待识别的图片输入预先训练的图片识别模型,获取待识别的图片的预测类别标签;
所述预先训练的图片识别模型采用卷积神经网络模型,包括输入层、卷积层、注意力分支、按元素操作层、池化层、全连接层和输出层;其中,注意力分支根据卷积层输出的待识别的图片的局部特征得到所述待识别的图片各区域的全局特征,进一步确定所述待识别的图片各区域的权重;按元素操作层用于根据待识别的图片各区域的权重对卷积层输出的待识别的图片的局部特征进行加权处理,将加权处理结果输出到池化层;
步骤S13、根据所述待识别的图片的预测类别标签,识别所述待识别的图片的类别。
本实施例的图片识别方法的执行主体为图片识别系统,该图片识别系统可以为一个实体的电子装置,也可以为采用软件集成的装置。
在步骤S11的一种优选实现方式中,
图片识别系统利用网络爬虫获取互联网中的图片进行识别。在本实施例中,以对互联网网页中的图片进行涉黄识别为例。
在步骤S12的一种优选实现方式中,
本实施例的图片识别模型具体采用卷积神经网络模型,如图3所示,所述卷积神经网络模型包括输入层、卷积层、注意力分支、按元素操作层、池化层、全连接层和输出层;其中,卷积层和池化层可以有多层,注意力分支和按元素操作层位于最后一层卷积层和池化层之间。
优选地,输入层用于输入待识别的图片;
卷积层用于利用多个卷积核(局部特征检测器)提取待识别的图片的局部特征;
注意力分支用于根据卷积层输出的待识别的图片的局部特征得到所述待识别的图片各区域的全局特征,进一步确定所述待识别的图片各区域的权重;将所述权重输入按元素操作层;
优选地,注意力分支对卷积层输出的待识别的图片的各区域的局部特征结合得到各区域的全局特征作为输入,将各区域的权重作为输出。
优选地,在本实施例中,所述权重为通过多个卷积层和池化层将图像降维到7*7大小后,其49个区域的每个区域的权重,代表了每个区域的重要度。所述权重为softmax归一化处理得到,49个区域的权重总和为1。
按元素操作层用于根据图片各区域的权重对卷积层输出的待识别的图片的局部特征进行加权处理,将加权处理结果输出到池化层;
优选地,根据图片各区域的权重对卷积层输出的待识别图片的各区域的局部特征进行加权处理后,作为待识别图片加权后的局部特征。
池化层用于对待识别的图片加权后的局部特征进行下采样,所有的局部特征进行平均,得到图片的全局特征;
全连接层用于根据待识别图片加权下采样后的全局特征,计算每一类别的得分;
输出层用于根据所述每一类的得分,输出所述待识别的图片的预测类别标签。
本实施例中,根据待识别的图片和预先训练的图片识别模型,获取的待识别的图片的预测类别标签是一个向量的形式,该向量的维度的数量表示的是识别的图片能够识别的类别的多少,向量的维度的数量可以在训练该图片识别模型时确定。在本实施例中,只需将图片识别为正常和色情两个类别即可。
根据所述待识别的图片和预先训练的图片识别模型,获取待识别的图片的预测类别标签包括:
卷积层对所述待识别的图片进行卷积,得到待识别的图片的局部特征;
注意力分支根据待识别的图片各区域的全局特征确定各区域的权重;
按元素操作层根据各区域的权重对各区域局部特征进行加权处理;
池化层对待识别的图片加权后的局部特征进行下采样得到全局特征;
全连接层根据待识别图片加权下采样的得到的全局特征计算每一类别的得分;
输出层根据所述得分确定所述待识别的图片的预测类别标签。
由于图片识别模型输出的待识别的图片的预测类别标签中,每一个元素数值表示的是该待识别的图片属于该位置对应的图片的类别的概率,因此可以从预测类别标签中获取待识别的图片对应的概率最大的类别;可以将该概率最大的类别作为待识别的图片的类别;进而可以根据识别的图片的类别对图片进行识别。
优选地,所述图片识别模型是通过以下步骤进行预先训练的:
步骤S21、采集数个已经确定类别的训练图片,生成训练集;
本实施例在训练图片识别模型时,首先采集数张训练图片,生成训练集来对图片识别模型进行训练。本实施例的训练集中包括的图片的类别越多,在后续识别待识别的图片时,所能够支持识别的图片的类别也越多。
本实施例的训练集中包括的训练图片的数量越多,训练的图片识别模型的参数越准确,后续根据该图片识别模型得出的预测类别标签越准确,对图片的识别效率就越高。
步骤S22、根据训练图片数据库中的数张训练图片以及各训练图片的类别,训练图片识别模型。
优选地,包括以下子步骤:
在步骤S221、将训练图片数据库中的数张训练图片中的各训练图片依次输入至图片识别模型中,得到对应的训练图片的预测类别标签;
本实施例中,在训练图片识别模型的过程中,图片识别模型中的参数是不断地变化的,即图片识别模型是在不断地变化。在每一次训练时,所采用的图片识别模型均为上一次训练更新后的图片识别模型。而本实施例的图片识别模型被初次使用时,参数采用的是预设的初始值。
子步骤S222、根据训练图片的类别,生成训练图片的真实类别标签;
由于训练图片的类别是已知的,可以根据训练图片的类别,生成该训练图片的类别的真实类别标签。同理,该训练图片的真实类别标签也为向量的形式,该向量中,仅该训练图片的类别对应的位置的元素的数值为1,其余位置均为0。
子步骤S223、根据训练图片的预测类别标签和训练图片的真实类别标签,生成训练图片的损失函数;
根据训练图片的预测类别标签和训练图片的真实类别标签,可以知道训练图片的预测类别标签与训练图片的真实类别标签的差距,并根据该差距生成训练图片的损失函数。本实施例在训练图片识别模型的过程中,要将该损失函数的值逐渐变小,从而使得训练的图片识别模型越准确。
子步骤S224、计算训练图片的损失函数对图片识别模型中各参数的导数;
子步骤S225、根据图片识别模型中的各参数以及训练图片的损失函数对各参数的导数,更新图片识别模型中的各参数,从而确定本次训练后的图片识别模型;
重复执行上述子步骤S221-S225,直至数张训练图片都对所述图片识别模型进行训练,确定本轮训练后的图片识别模型。
本实施例中,注意力分支的各参数的更新不需要图片类别标签以外的其他标注信息。
具体地,由于图片识别模型中包括多个参数,当输入的训练图片确定时,也可以将损失函数看作是关于图片识别模型中的参数的函数,此时可以计算训练图片的损失函数对图片识别模型中各参数的导数;对于图片识别模型中的每一个参数,在更新时,可以将图片识别模型中该参数更新为该参数减去损失函数对该参数的导数,即每一次训练都对图片识别模型进行更新。更新完图片识别模型之后,然后开始使用下一张训练图片对图片识别模型进行训练,直到完成下一张训练图片数据对图片识别模型的训练,并再次更新图片识别模型中的各参数,从而更新图片识别模型;依次类推,直至训练图片数据库中的数张训练图片都对图片识别模型进行训练,确定本轮训练后的图片识别模型。
因为损失函数表征的是一个向梯度方向下降的值,损失函数值越大,表示图片识别模型的对输入的图片进行处理后输出的预测类别标签越不准确,本实施例中通过不断地调整损失函数,使得损失函数的最终点的梯度为0。损失函数的值越小,表示图片识别模型的处理结果越准确。上述实施例的技术方案,在更新图片识别模型的时候,具体是在朝着损失函数逐渐降低的方向更新。因此,通过不断的训练,不断地优化损失函数,不断地更新图片识别模型的参数,从而不断的更新图片识别模型,使得最终得到的图片识别模型能够非常准确地对图片进行处理,得到更加准确地预测类别标签。
在步骤S13的一种优选实现方式中,
根据待识别的图片的预测类别标签,获取待识别的图片对应的概率最大的类别;
将待识别的图片对应的概率最大的类别作为待识别的图片的类别。
由于图片识别模型输出的待识别的图片的预测类别标签中,每一个元素数值表示的是该待识别的图片属于该位置对应的图片的类别的概率,因此可以从预测类别标签中获取待识别的图片对应的概率最大的类别;可以将该概率最大的类别作为待识别的图片的类别;进而可以根据识别的图片的类别对图片进行分类。
在本申请的实施例中,通过注意力分支根据待识别的图片每个区域的特征,计算出每个区域的重要程度,对待识别的图片的每个区域的局部特征进行加权,解决了特定类型,例如图片主体区域过小或嵌套/拼接类图片的识别率较低的问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在所述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图2为本申请另一实施例提供的图片识别方法的流程图,如图2所示,包括:
获取模块21,用于获取待识别的图片;
预测模块22,用于将所述待识别的图片输入预先训练的图片识别模型,获取待识别的图片的预测类别标签;
所述预先训练的图片识别模型采用卷积神经网络模型,包括输入层、卷积层、注意力分支、按元素操作层、池化层、全连接层和输出层;其中,注意力分支根据卷积层输出的待识别的图片的局部特征得到所述待识别的图片各区域的全局特征,进一步确定所述待识别的图片各区域的权重;按元素操作层用于根据待识别的图片各区域的权重对卷积层输出的待识别的图片的局部特征进行加权处理,将加权处理结果输出到池化层;
识别模块23,用于根据所述待识别的图片的预测类别标签,识别所述待识别的图片的类别。
本实施例的图片识别方法的执行主体为图片识别系统,该图片识别系统可以为一个实体的电子装置,也可以为采用软件集成的装置。
在获取模块21的一种优选实现方式中,
获取模块21利用网络爬虫获取互联网中的图片进行识别。在本实施例中,以对互联网网页中的图片进行涉黄识别为例。
在预测模块22的一种优选实现方式中,
本实施例的图片识别模型具体采用卷积神经网络模型,如图3所示,所述卷积神经网络模型包括输入层、卷积层、注意力分支、按元素操作层、池化层、全连接层和输出层;其中,卷积层和池化层可以有多层,注意力分支和按元素操作层位于最后一层卷积层和池化层之间。
优选地,输入层用于输入待识别的图片;
卷积层用于利用多个卷积核(局部特征检测器)提取待识别的图片的局部特征;
注意力分支用于根据卷积层输出的待识别的图片的局部特征得到所述待识别的图片各区域的全局特征,进一步确定所述待识别的图片各区域的权重;将所述权重输入按元素操作层;
优选地,注意力分支对卷积层输出的待识别的图片的各区域的局部特征结合得到各区域的全局特征作为输入,将各区域的权重作为输出。
优选地,在本实施例中,所述权重为通过多个卷积层和池化层将图像降维到7*7大小后,其49个区域的每个区域的权重,代表了每个区域的重要度。所述权重为softmax归一化处理得到,49个区域的权重总和为1。
按元素操作层用于根据图片各区域的权重对卷积层输出的待识别的图片的局部特征进行加权处理,将加权处理结果输出到池化层;
优选地,根据图片各区域的权重对卷积层输出的待识别图片的各区域的局部特征进行加权处理后,作为待识别图片加权后的局部特征。
池化层用于对待识别的图片加权后的局部特征进行下采样,所有的局部特征进行平均,得到图片的全局特征;
全连接层用于根据待识别图片加权下采样后的全局特征,计算每一类别的得分;
输出层用于根据所述每一类的得分,输出所述待识别的图片的预测类别标签。
本实施例中,根据待识别的图片和预先训练的图片识别模型,获取的待识别的图片的预测类别标签是一个向量的形式,该向量的维度的数量表示的是识别的图片能够识别的类别的多少,向量的维度的数量可以在训练该图片识别模型时确定。在本实施例中,只需将图片识别为正常和色情两个类别即可。
根据所述待识别的图片和预先训练的图片识别模型,获取待识别的图片的预测类别标签包括:
卷积层对所述待识别的图片进行卷积,得到待识别的图片的局部特征;
注意力分支根据待识别的图片各区域的全局特征确定各区域的权重;
按元素操作层根据各区域的权重对各区域局部特征进行加权处理;
池化层对待识别的图片加权后的局部特征进行下采样得到全局特征;
全连接层根据待识别图片加权下采样的得到的全局特征计算每一类别的得分;
输出层根据所述得分确定所述待识别的图片的预测类别标签。
由于图片识别模型输出的待识别的图片的预测类别标签中,每一个元素数值表示的是该待识别的图片属于该位置对应的图片的类别的概率,因此可以从预测类别标签中获取待识别的图片对应的概率最大的类别;可以将该概率最大的类别作为待识别的图片的类别;进而可以根据识别的图片的类别对图片进行识别。
优选地,所述系统还包括:
采集模块,用于所述图片识别模型采集数个已经确定类别的训练图片,生成训练集;
训练模块,用于根据训练图片数据库中的数张训练图片以及各训练图片的类别,训练图片识别模型。
本实施例在训练图片识别模型时,首先采集数张训练图片,生成训练集来对图片识别模型进行训练。本实施例的训练集中包括的图片的类别越多,在后续识别待识别的图片时,所能够支持识别的图片的类别也越多。
本实施例的训练集中包括的训练图片的数量越多,训练的图片识别模型的参数越准确,后续根据该图片识别模型得出的预测类别标签越准确,对图片的识别效率就越高。
优选地,所述训练模块具体用于:
将训练图片数据库中的数张训练图片中的各训练图片依次输入至图片识别模型中,得到对应的训练图片的预测类别标签;
本实施例中,在训练图片识别模型的过程中,图片识别模型中的参数是不断地变化的,即图片识别模型是在不断地变化。在每一次训练时,所采用的图片识别模型均为上一次训练更新后的图片识别模型。而本实施例的图片识别模型被初次使用时,参数采用的是预设的初始值。
根据训练图片的类别,生成训练图片的真实类别标签;
由于训练图片的类别是已知的,可以根据训练图片的类别,生成该训练图片的类别的真实类别标签。同理,该训练图片的真实类别标签也为向量的形式,该向量中,仅该训练图片的类别对应的位置的元素的数值为1,其余位置均为0。
根据训练图片的预测类别标签和训练图片的真实类别标签,生成训练图片的损失函数;
根据训练图片的预测类别标签和训练图片的真实类别标签,可以知道训练图片的预测类别标签与训练图片的真实类别标签的差距,并根据该差距生成训练图片的损失函数。本实施例在训练图片识别模型的过程中,要将该损失函数的值逐渐变小,从而使得训练的图片识别模型越准确。
计算训练图片的损失函数对图片识别模型中各参数的导数;
根据图片识别模型中的各参数以及训练图片的损失函数对各参数的导数,更新图片识别模型中的各参数,从而确定本次训练后的图片识别模型;
重复执行上述步骤,直至数张训练图片都对所述图片识别模型进行训练,确定本轮训练后的图片识别模型。
本实施例中,注意力分支的各参数的更新不需要图片类别标签以外的其他标注信息。
具体地,由于图片识别模型中包括多个参数,当输入的训练图片确定时,也可以将损失函数看作是关于图片识别模型中的参数的函数,此时可以计算训练图片的损失函数对图片识别模型中各参数的导数;对于图片识别模型中的每一个参数,在更新时,可以将图片识别模型中该参数更新为该参数减去损失函数对该参数的导数,即每一次训练都对图片识别模型进行更新。更新完图片识别模型之后,然后开始使用下一张训练图片对图片识别模型进行训练,直到完成下一张训练图片数据对图片识别模型的训练,并再次更新图片识别模型中的各参数,从而更新图片识别模型;依次类推,直至训练图片数据库中的数张训练图片都对图片识别模型进行训练,确定本轮训练后的图片识别模型。
因为损失函数表征的是一个向梯度方向下降的值,损失函数值越大,表示图片识别模型的对输入的图片进行处理后输出的预测类别标签越不准确,本实施例中通过不断地调整损失函数,使得损失函数的最终点的梯度为0。损失函数的值越小,表示图片识别模型的处理结果越准确。上述实施例的技术方案,在更新图片识别模型的时候,具体是在朝着损失函数逐渐降低的方向更新。因此,通过不断的训练,不断地优化损失函数,不断地更新图片识别模型的参数,从而不断的更新图片识别模型,使得最终得到的图片识别模型能够非常准确地对图片进行处理,得到更加准确地预测类别标签。
在识别模块23的一种优选实现方式中,
优选地,识别模块23用于根据待识别的图片的预测类别标签,获取待识别的图片对应的概率最大的类别;将待识别的图片对应的概率最大的类别作为待识别的图片的类别。
由于图片识别模型输出的待识别的图片的预测类别标签中,每一个元素数值表示的是该待识别的图片属于该位置对应的图片的类别的概率,因此可以从预测类别标签中获取待识别的图片对应的概率最大的类别;可以将该概率最大的类别作为待识别的图片的类别;进而可以根据识别的图片的类别对图片进行分类。
在本申请的实施例中,通过注意力分支根据待识别的图片每个区域的特征,计算出每个区域的重要程度,对待识别的图片的每个区域的局部特征进行加权,解决了特定类型,例如图片主体区域过小或嵌套/拼接类图片的识别率较低的问题。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,所述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
图4示出了适于用来实现本发明实施方式的示例性计算机系统/服务器012的框图。图4显示的计算机系统/服务器012仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,计算机系统/服务器012以通用计算设备的形式表现。计算机系统/服务器012的组件可以包括但不限于:一个或者多个处理器或者处理单元016,系统存储器028,连接不同系统组件(包括系统存储器028和处理单元016)的总线018。
总线018表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器012典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器012访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器028可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)030和/或高速缓存存储器032。计算机系统/服务器012可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统034可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线018相连。存储器028可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块042的程序/实用工具040,可以存储在例如存储器028中,这样的程序模块042包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块042通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器012也可以与一个或多个外部设备014(例如键盘、指向设备、显示器024等)通信,在本发明中,计算机系统/服务器012与外部雷达设备进行通信,还可与一个或者多个使得用户能与该计算机系统/服务器012交互的设备通信,和/或与使得该计算机系统/服务器012能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口022进行。并且,计算机系统/服务器012还可以通过网络适配器020与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图4所示,网络适配器020通过总线018与计算机系统/服务器012的其它模块通信。应当明白,尽管图4中未示出,可以结合计算机系统/服务器012使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元016通过运行存储在系统存储器028中的程序,从而执行本发明所描述的实施例中的功能和/或方法。
上述的计算机程序可以设置于计算机存储介质中,即该计算机存储介质被编码有计算机程序,该程序在被一个或多个计算机执行时,使得一个或多个计算机执行本发明上述实施例中所示的方法流程和/或装置操作。
随着时间、技术的发展,介质含义越来越广泛,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载等。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (12)

1.一种图片识别方法,其特征在于,包括:
获取待识别的图片;
将所述待识别的图片输入预先训练的图片识别模型,获取待识别的图片的预测类别标签;
所述预先训练的图片识别模型采用卷积神经网络模型,包括输入层、卷积层、注意力分支、按元素操作层、池化层、全连接层和输出层;其中,注意力分支根据卷积层输出的待识别的图片的局部特征得到所述待识别的图片各区域的全局特征,进一步确定所述待识别的图片各区域的权重;按元素操作层用于根据待识别的图片各区域的权重对卷积层输出的待识别的图片的局部特征进行加权处理,将加权处理结果输出到池化层;
根据所述待识别的图片的预测类别标签,识别所述待识别的图片的类别。
2.根据权利要求1所述的方法,其特征在于,根据所述待识别的图片和预先训练的图片识别模型,获取待识别的图片的预测类别标签之前,所述方法还包括:
采集数个已经确定类别的训练图片,生成训练集;
根据训练集中的数张训练图片以及各训练图片的类别,训练图片识别模型。
3.根据权利要求1所述的方法,其特征在于,根据所述待识别的图片和预先训练的图片识别模型,获取待识别的图片的预测类别标签包括:
卷积层对所述待识别的图片进行卷积,得到待识别的图片的局部特征;
注意力分支根据待识别的图片各区域的全局特征确定各区域的权重;
按元素操作层根据各区域的权重对各区域局部特征进行加权处理;
池化层对待识别的图片加权后的局部特征进行下采样得到全局特征;
全连接层根据待识别图片加权下采样的得到的全局特征计算每一类别的得分;
输出层根据所述得分确定所述待识别的图片的预测类别标签。
4.根据权利要求1所述的方法,其特征在于,根据训练集中的数张训练图片以及各训练图片的类别,训练图片识别模型包括:
利用梯度下降法对图片识别模型的参数进行更新。
5.根据权利要求1所述的方法,其特征在于,根据所述待识别的图片的预测类别标签,识别所述待识别的图片的类别包括:
根据所述待识别的图片的所述预测类别标签,获取所述待识别的图片对应的概率最大的类别;
将所述待识别的图片对应的概率最大的类别作为所述待识别的图片的类别。
6.一种图片识别系统,其特征在于,包括:
获取模块,用于获取待识别的图片;
预测模块,用于根据所述待识别的图片和预先训练的图片识别模型,获取待识别的图片的预测类别标签;
所述预先训练的图片识别模型采用卷积神经网络模型,包括输入层、卷积层、注意力分支、按元素操作层、池化层、全连接层和输出层;其中,注意力分支根据卷积层输出的待识别的图片的局部特征得到所述待识别的图片各区域的全局特征,进一步确定所述待识别的图片各区域的权重;按元素操作层用于根据待识别的图片各区域的权重对卷积层输出的待识别的图片的局部特征进行加权处理,将加权处理结果输出到池化层;
识别模块,用于根据所述待识别的图片的预测类别标签,识别所述待识别的图片的类别。
7.根据权利要求6所述的系统,其特征在于,所述系统还包括:
采集模块,用于采集数个已经确定类别的训练图片,生成训练集;
训练模块,根据训练集中的数张训练图片以及各训练图片的类别,训练图片识别模型。
8.根据权利要求6所述的系统,其特征在于,所述预测模块,具体用于:
卷积层对所述待识别的图片进行卷积,得到待识别的图片的局部特征;
注意力分支根据待识别的图片各区域的全局特征确定各区域的权重;
按元素操作层根据各区域的权重对各区域局部特征进行加权处理;
池化层对待识别的图片加权后的局部特征进行下采样得到全局特征;
全连接层根据待识别图片加权下采样的得到的全局特征计算每一类别的得分;
输出层根据所述得分确定所述待识别的图片的预测类别标签。
9.根据权利要求6所述的系统,其特征在于,所述训练模块,具体用于利用梯度下降法对图片识别模型的参数进行更新。
10.根据权利要求6所述的系统,其特征在于,所述识别模块,具体用于:
根据所述待识别的图片的所述预测类别标签,获取所述待识别的图片对应的概率最大的类别;
将所述待识别的图片对应的概率最大的类别作为所述待识别的图片的类别。
11.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN201711352429.7A 2017-12-15 2017-12-15 一种图片识别方法及系统 Active CN108171260B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711352429.7A CN108171260B (zh) 2017-12-15 2017-12-15 一种图片识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711352429.7A CN108171260B (zh) 2017-12-15 2017-12-15 一种图片识别方法及系统

Publications (2)

Publication Number Publication Date
CN108171260A true CN108171260A (zh) 2018-06-15
CN108171260B CN108171260B (zh) 2022-02-11

Family

ID=62522471

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711352429.7A Active CN108171260B (zh) 2017-12-15 2017-12-15 一种图片识别方法及系统

Country Status (1)

Country Link
CN (1) CN108171260B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108960189A (zh) * 2018-07-20 2018-12-07 南京旷云科技有限公司 图像再识别方法、装置及电子设备
CN109255369A (zh) * 2018-08-09 2019-01-22 网易(杭州)网络有限公司 利用神经网络识别图片的方法及装置、介质和计算设备
CN109815988A (zh) * 2018-12-27 2019-05-28 北京奇艺世纪科技有限公司 模型生成方法、分类方法、装置及计算机可读存储介质
CN109948671A (zh) * 2019-03-04 2019-06-28 腾讯科技(深圳)有限公司 图像分类方法、装置、存储介质以及内窥镜成像设备
CN110121077A (zh) * 2019-05-05 2019-08-13 广州华多网络科技有限公司 一种题目生成方法、装置及设备
CN110222220A (zh) * 2019-05-06 2019-09-10 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机可读介质及电子设备
CN110516677A (zh) * 2019-08-23 2019-11-29 上海云绅智能科技有限公司 一种神经网络识别模型、目标识别方法及系统
CN110647916A (zh) * 2019-08-23 2020-01-03 苏宁云计算有限公司 基于卷积神经网络的色情图片识别方法及装置
CN110889428A (zh) * 2019-10-21 2020-03-17 浙江大搜车软件技术有限公司 图像识别方法、装置、计算机设备与存储介质
CN111241893A (zh) * 2018-11-29 2020-06-05 阿里巴巴集团控股有限公司 一种标识识别方法、装置及系统
CN111385602A (zh) * 2018-12-29 2020-07-07 广州市百果园信息技术有限公司 基于多层级多模型的视频审核方法、介质及计算机设备
CN109447095B (zh) * 2018-10-30 2020-09-29 上海七牛信息技术有限公司 视觉属性识别方法、装置及存储介质
CN111859237A (zh) * 2020-07-23 2020-10-30 恒安嘉新(北京)科技股份公司 网络内容审核方法、装置、电子设备、及存储介质
CN112712126A (zh) * 2021-01-05 2021-04-27 南京大学 一种图片识别方法
CN113642592A (zh) * 2020-04-27 2021-11-12 武汉Tcl集团工业研究院有限公司 一种训练模型的训练方法、场景识别方法、计算机设备
CN115564656A (zh) * 2022-11-11 2023-01-03 成都智元汇信息技术股份有限公司 一种基于调度的多图合并识图方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150213302A1 (en) * 2014-01-30 2015-07-30 Case Western Reserve University Automatic Detection Of Mitosis Using Handcrafted And Convolutional Neural Network Features
CN106934397A (zh) * 2017-03-13 2017-07-07 北京市商汤科技开发有限公司 图像处理方法、装置及电子设备
CN106960219A (zh) * 2017-03-10 2017-07-18 百度在线网络技术(北京)有限公司 图片识别方法及装置、计算机设备及计算机可读介质
CN107341462A (zh) * 2017-06-28 2017-11-10 电子科技大学 一种基于注意力机制的视频分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150213302A1 (en) * 2014-01-30 2015-07-30 Case Western Reserve University Automatic Detection Of Mitosis Using Handcrafted And Convolutional Neural Network Features
CN106960219A (zh) * 2017-03-10 2017-07-18 百度在线网络技术(北京)有限公司 图片识别方法及装置、计算机设备及计算机可读介质
CN106934397A (zh) * 2017-03-13 2017-07-07 北京市商汤科技开发有限公司 图像处理方法、装置及电子设备
CN107341462A (zh) * 2017-06-28 2017-11-10 电子科技大学 一种基于注意力机制的视频分类方法

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108960189B (zh) * 2018-07-20 2020-11-24 南京旷云科技有限公司 图像再识别方法、装置及电子设备
CN108960189A (zh) * 2018-07-20 2018-12-07 南京旷云科技有限公司 图像再识别方法、装置及电子设备
CN109255369A (zh) * 2018-08-09 2019-01-22 网易(杭州)网络有限公司 利用神经网络识别图片的方法及装置、介质和计算设备
CN109255369B (zh) * 2018-08-09 2020-10-16 杭州易现先进科技有限公司 利用神经网络识别图片的方法及装置、介质和计算设备
CN109447095B (zh) * 2018-10-30 2020-09-29 上海七牛信息技术有限公司 视觉属性识别方法、装置及存储介质
CN111241893A (zh) * 2018-11-29 2020-06-05 阿里巴巴集团控股有限公司 一种标识识别方法、装置及系统
CN111241893B (zh) * 2018-11-29 2023-06-16 阿里巴巴集团控股有限公司 一种标识识别方法、装置及系统
CN109815988A (zh) * 2018-12-27 2019-05-28 北京奇艺世纪科技有限公司 模型生成方法、分类方法、装置及计算机可读存储介质
CN109815988B (zh) * 2018-12-27 2021-08-20 北京奇艺世纪科技有限公司 模型生成方法、分类方法、装置及计算机可读存储介质
CN111385602B (zh) * 2018-12-29 2022-08-09 广州市百果园信息技术有限公司 基于多层级多模型的视频审核方法、介质及计算机设备
CN111385602A (zh) * 2018-12-29 2020-07-07 广州市百果园信息技术有限公司 基于多层级多模型的视频审核方法、介质及计算机设备
CN109948671B (zh) * 2019-03-04 2021-11-30 腾讯医疗健康(深圳)有限公司 图像分类方法、装置、存储介质以及内窥镜成像设备
CN109948671A (zh) * 2019-03-04 2019-06-28 腾讯科技(深圳)有限公司 图像分类方法、装置、存储介质以及内窥镜成像设备
CN110121077A (zh) * 2019-05-05 2019-08-13 广州华多网络科技有限公司 一种题目生成方法、装置及设备
CN110121077B (zh) * 2019-05-05 2021-05-07 广州方硅信息技术有限公司 一种题目生成方法、装置及设备
EP3968180A4 (en) * 2019-05-06 2022-07-06 Tencent Technology (Shenzhen) Company Limited METHOD AND APPARATUS FOR IMAGE PROCESSING, COMPUTER READABLE MEDIUM AND ELECTRONIC DEVICE
CN110222220A (zh) * 2019-05-06 2019-09-10 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机可读介质及电子设备
WO2020224405A1 (zh) * 2019-05-06 2020-11-12 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机可读介质及电子设备
CN110222220B (zh) * 2019-05-06 2024-05-10 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机可读介质及电子设备
US11978241B2 (en) 2019-05-06 2024-05-07 Tencent Technology (Shenzhen) Company Ltd Image processing method and apparatus, computer-readable medium, and electronic device
CN110516677A (zh) * 2019-08-23 2019-11-29 上海云绅智能科技有限公司 一种神经网络识别模型、目标识别方法及系统
CN110647916A (zh) * 2019-08-23 2020-01-03 苏宁云计算有限公司 基于卷积神经网络的色情图片识别方法及装置
CN110889428A (zh) * 2019-10-21 2020-03-17 浙江大搜车软件技术有限公司 图像识别方法、装置、计算机设备与存储介质
CN113642592A (zh) * 2020-04-27 2021-11-12 武汉Tcl集团工业研究院有限公司 一种训练模型的训练方法、场景识别方法、计算机设备
CN111859237A (zh) * 2020-07-23 2020-10-30 恒安嘉新(北京)科技股份公司 网络内容审核方法、装置、电子设备、及存储介质
CN112712126A (zh) * 2021-01-05 2021-04-27 南京大学 一种图片识别方法
CN112712126B (zh) * 2021-01-05 2024-03-19 南京大学 一种图片识别方法
CN115564656A (zh) * 2022-11-11 2023-01-03 成都智元汇信息技术股份有限公司 一种基于调度的多图合并识图方法及装置
CN115564656B (zh) * 2022-11-11 2023-04-28 成都智元汇信息技术股份有限公司 一种基于调度的多图合并识图方法及装置

Also Published As

Publication number Publication date
CN108171260B (zh) 2022-02-11

Similar Documents

Publication Publication Date Title
CN108171260A (zh) 一种图片识别方法及系统
US11783227B2 (en) Method, apparatus, device and readable medium for transfer learning in machine learning
CN110349147B (zh) 模型的训练方法、眼底黄斑区病变识别方法、装置及设备
CN109919684A (zh) 用于生成信息预测模型的方法、电子设备和计算机可读存储介质
CN108197532A (zh) 人脸识别的方法、装置及计算机装置
CN108416326B (zh) 人脸识别方法和装置
CN107220217A (zh) 基于逻辑回归的特征系数训练方法和装置
CN109063920A (zh) 一种交易风险识别方法、装置、及计算机设备
CN110443222B (zh) 用于训练脸部关键点检测模型的方法和装置
CN108710885A (zh) 目标对象的检测方法和装置
CN109214238A (zh) 多目标跟踪方法、装置、设备及存储介质
CN108171280A (zh) 一种分类器构建方法及预测分类的方法
CN108520220A (zh) 模型生成方法和装置
CN104077303B (zh) 用于呈现数据的方法和装置
CN112529026A (zh) 提供ai模型的方法、ai平台、计算设备及存储介质
CN108280477A (zh) 用于聚类图像的方法和装置
CN110363810A (zh) 建立图像检测模型的方法、装置、设备和计算机存储介质
CN110995459B (zh) 异常对象识别方法、装置、介质及电子设备
CN110232340A (zh) 建立视频分类模型以及视频分类的方法、装置
CN108734296A (zh) 优化监督学习的训练数据的方法、装置、电子设备和介质
CN110517254A (zh) 基于深度学习的临床靶区自动勾画方法、装置及相关设备
CN111680678A (zh) 目标区域识别方法、装置、设备及可读存储介质
CN110443317A (zh) 一种纸档资料电子化的方法、装置和电子设备
CN108182472A (zh) 用于生成信息的方法和装置
CN110188766A (zh) 基于卷积神经网络的图像主目标检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant