CN109978058A - 确定图像分类的方法、装置、终端及存储介质 - Google Patents

确定图像分类的方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN109978058A
CN109978058A CN201910241812.8A CN201910241812A CN109978058A CN 109978058 A CN109978058 A CN 109978058A CN 201910241812 A CN201910241812 A CN 201910241812A CN 109978058 A CN109978058 A CN 109978058A
Authority
CN
China
Prior art keywords
classification
image
model
process layer
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910241812.8A
Other languages
English (en)
Other versions
CN109978058B (zh
Inventor
揭泽群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910241812.8A priority Critical patent/CN109978058B/zh
Publication of CN109978058A publication Critical patent/CN109978058A/zh
Application granted granted Critical
Publication of CN109978058B publication Critical patent/CN109978058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种确定图像分类的方法、装置、终端及存储介质,属于计算机技术领域。所述方法包括:获取待识别图像;将所述待识别图像输入图像识别模型;将所述图像识别模型中至少一个处理层输出的特征图像,分别输入分类正确性判定模型,得到所述至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别所述待识别图像的分类的目标处理层,基于所述目标处理层输出的特征图像输入分类模型后得到的分类数据,确定所述待识别图像的分类。采用本申请,可以提高图像识别的准确率。

Description

确定图像分类的方法、装置、终端及存储介质
技术领域
本申请涉及计算机技术领域,特别涉及一种确定图像分类的方法、装置、终端及存储介质。
背景技术
在很多应用场景下,经常需要对图像进行物体识别,确定图像的分类,如汽车、动物、花草、人物等,对图像进行物体识别使用的图像识别模型一般为神经网络模型。神经网络模型可以包括由浅到深的多个处理层,每个处理层可以包括一个特征提取子模型。在通过神经网络模型的多个处理层进行图像识别时,按照处理层的顺序,依次对待识别图像进行特征提取,根据最后一个处理层进行特征提取得到的特征图像进行图像识别,得到待识别图像的分类。
但实际需求中,有时需要根据不同的要求在不同的处理层跳出图像识别模型,这种情况下,可以在不同深度的处理层引入分类模型(也称作分类器),分类器用于根据当前处理层进行特征提取后得到的特征图像确定该特征图像的分类。当确定在某一处理层跳出图像识别模型时,通过该处理层的特征提取后输出特征图像,将特征图像输入分类器中,将分类器输出的分类作为该待识别图像的分类。例如,一个图像识别模型有八个处理层,如果实际需求对处理时长要求较高,则可以选择在图像识别模型的第四处理层跳出图像识别模型,将根据第四处理层进行特征提取的特征图像输入分类器中,将分类器输出的分类作为待识别图像的分类。
在实现本申请的过程中,发明人发现现有技术至少存在以下问题:
根据上述方案,对于某个图像来说,最深处理层的分类器输出的分类不一定是最好的识别结果,导致识别的准确率较低。
发明内容
本申请实施例提供了一种确定图像分类的方法、装置、终端及存储介质,可以。所述技术方案如下:
一方面,提供了一种确定图像分类的方法,该方法应用于终端,该方法包括:
获取待识别图像;
将所述待识别图像输入图像识别模型;
将所述图像识别模型中至少一个处理层输出的特征图像,分别输入分类正确性判定模型,得到所述至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别所述待识别图像的分类的目标处理层,基于所述目标处理层输出的特征图像输入分类模型后得到的分类数据,确定所述待识别图像的分类。
一方面,提供了一种确定图像分类的装置,该装置应用于终端,该装置包括:
获取模块,用于获取待识别图像;
输入模块,用于将所述待识别图像输入图像识别模型;
确定模块,用于将所述图像识别模型中至少一个处理层输出的特征图像,分别输入分类正确性判定模型,得到所述至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别所述待识别图像的分类的目标处理层,基于所述目标处理层输出的特征图像输入分类模型后得到的分类数据,确定所述待识别图像的分类。
一方面,提供了一种终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述确定图像分类的方法。
一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现上述确定图像分类的方法。
本申请实施例提供的技术方案带来的有益效果是:
本申请实施例中,终端将待识别图像输入图像识别模型的至少一个处理层,得到特征图像,将特征图像输入分类正确性判定模型,得到至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别待识别图像的分类的目标处理层,基于目标处理层输出的特征图像输入分类模型后得到的分类数据,确定待识别图像的分类。这样,根据分类正确性判定模型选择分类正确的处理层,根据该处理层输出的特征图像确定待识别图像的分类,这样,可以提高图像识别的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境图;
图2是本申请实施例提供的一种确定图像分类的方法流程图;
图3是本申请实施例提供的一种确定图像分类的方法流程图;
图4是本申请实施例提供的一种分类正确性判定模型的结构示意图;
图5是本申请实施例提供的一种确定图像分类的方法流程图;
图6是本申请实施例提供的一种确定图像分类的场景示意图;
图7是本申请实施例提供的一种确定图像分类的场景示意图;
图8是本申请实施例提供的一种确定图像分类的方法流程图;
图9是本申请实施例提供的一种确定图像分类的装置示意图;
图10是本申请实施例提供的一种确定图像分类的装置示意图;
图11是本申请实施例提供的一种终端的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请实施例提供了一种确定图像分类的方法,图1是本申请实施例提供的一种实施环境图。该实施环境可以包括至少一个终端101、以及用于为该多个终端101提供服务的服务器102。至少一个终端101通过无线或者有线网络和服务器102连接,该多个终端101可以为能够访问服务器102的计算机设备或智能终端等。终端101中可以安装有图像处理程序、图像识别相关的应用程序,应用程序中包括图像识别模型、分类模型、分类正确性判定模型等,用于对待识别图像进行识别。当用户想要对某图像(可称为待识别图像)进行图像识别时,可以在终端本地存储区域选取待识别图像,也可以通过终端实时采集待识别图像,还可以通过终端接收服务器发送的待识别图像,本申请对此不做限定。服务器102也可以为上述应用程序提供待识别图像。
另外,终端101还可以作为需求方,将待识别图像发送至服务器102,请求服务器102对图像进行识别。这种情况下,服务器102中还可以具有至少一种数据库,用以存储图像识别模型、分类正确性判断模型、分类模型等等。服务器102可以是单个终端或终端组,当服务器102是终端组时,每个终端之间可以共享识别出的待识别图像的分类等。
本申请实施例提供了一种确定图像分类的方法,该方法可以由终端实现。如图2所示的确定图像分类的方法流程图,该方法的处理流程可以包括如下的步骤:
201、终端获取待识别图像。
其中,待识别图像是待输入到图像识别模型的图像,待识别图像可以是终端预先存储的任一图像,也可以是实时采集的视频中的任一图像帧,本申请实施例对此不做限定。
202、终端将待识别图像输入图像识别模型。
其中,图像识别模型是前向传播的、包含多个处理层的神经网络模型,每个处理层用于对输入的图像进行特征处理,输出特征图像。多个处理层中存在排列顺序,按照处理层的排列顺序,前一个处理层的输出作为后一个处理层的输入。图像识别模型中预设多个处理层可以分别连接一个分类模型和一个分类正确性判定模型,也可以是预设多个处理层连接一个分类模型和一个分类正确性判定模型,根据实际需求设置即可,本申请对此不作限定。
203、终端将图像识别模型中至少一个处理层输出的特征图像,分别输入分类正确性判定模型,得到至少一个处理层对应的判定结果,基于得到的判定结果,终端确定用于识别待识别图像的分类的目标处理层,基于目标处理层输出的特征图像输入分类模型后得到的分类数据,终端确定待识别图像的分类。
其中,分类正确性判定模型可以利用强化学习算法,来判定根据不同处理层输出的特征图像确定待识别图像的分类的正确性与否,包括两个输出神经元,分别代表分类正确以及分类错误。分类正确性判定模型是对初始分类正确性判定模型进行训练得到的,训练的过程下文中有具体说明。分类数据包括各分类对应的概率值,可以是一个向量,向量中的每个向量值表示这一位对应的分类对应的概率。
可选地,将待识别图像输入图像识别模型之前,还包括:
将样本图像输入该图像识别模型,获取该图像识别模型中任意处理层输出的特征图像,作为样本特征图像;
获取录入的每个样本特征图像对应的样本图像的真实分类,作为每个样本特征图像对应的样本分类;
基于每个样本特征图像和对应的样本分类,对初始分类正确性判定模型进行训练,得到该分类正确性判定模型。
可选地,将该图像识别模型中至少一个处理层输出的特征图像,分别输入分类正确性判定模型,得到该至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别该待识别图像的分类的目标处理层,基于该目标处理层输出的特征图像输入分类模型后得到的分类数据,确定该待识别图像的分类,包括:
每当得到该图像识别模型中的一个处理层输出的特征图像时,确定是否满足预设的识别结束条件;
如果不满足该识别结束条件,则将该特征图像输入分类正确性判定模型,如果该分类正确性判定模型的输出结果为分类正确,则基于该特征图像输入分类模型得到的分类数据,确定该待识别图像的分类,如果该分类正确性判定模型的输出结果为分类错误,则将该特征图像输入下一个处理层;
如果满足该识别结束条件,则基于该特征图像输入分类模型得到的分类数据,确定该待识别图像的分类。
可选地,将该图像识别模型中至少一个处理层输出的特征图像,分别输入分类正确性判定模型,得到该至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别该待识别图像的分类的目标处理层,基于该目标处理层输出的特征图像输入分类模型后得到的分类数据,确定该待识别图像的分类,包括:
每当得到该图像识别模型中的一个处理层输出的特征图像时,将该特征图像输入分类正确性判定模型,确定该分类正确性判定模型的判定结果,并确定是否满足预设的识别结束条件;
如果不满足该识别结束条件,则将该特征图像输入下一个处理层,如果满足该识别结束条件,则确定得到的所有判定结果中是否存在分类正确的判定结果;
如果得到的所有判定结果中不存在分类正确的判定结果,则基于该特征图像输入分类模型得到的分类数据,确定该待识别图像的分类;
如果得到的所有判定结果中存在分类正确的判定结果,则确定所有判定结果为分类正确的处理层中的最后一个目标处理层,基于该目标处理层输出的特征图像输入分类模型得到的分类数据,确定该待识别图像的分类。
可选地,识别结束条件,包括:该待识别图像输入该图像识别模型的时间点到当前时间点的时长超过预设的预算时长。
可选地,识别结束条件,包括:该处理层是该图像识别模型的最后一个处理层。
可选地,基于该特征图像输入分类模型得到的分类数据,确定该待识别图像的分类,包括:
将该特征图像输入分类模型,得到该特征图像的分类数据,该分类数据包括各分类对应的概率值;
确定该各分类对应的概率值中的最大概率值,将该最大概率值对应的分类,确定为该待识别图像的分类。
本申请实施例中,终端将待识别图像输入图像识别模型的至少一个处理层,得到特征图像,将特征图像输入分类正确性判定模型,得到至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别待识别图像的分类的目标处理层,基于目标处理层输出的特征图像输入分类模型后得到的分类数据,确定待识别图像的分类。这样,根据分类正确性判定模型选择正确率最高的处理层,将该处理层输出的特征图像输入到分类模型,进而确定待识别图像的分类,这样,可以提高图像识别的准确率。
本申请实施例提供的确定图像分类的方法可以由终端实现,终端可以根据图像识别模型确定待识别图像的分类,以便对图像进行识别。下面以对图像进行识别的处理流程为例进行介绍,如图3所示的确定图像分类的方法流程图,该方法的处理流程可以包括如下的步骤:
301、终端获取待识别图像。
其中,待识别图像是待输入到图像识别模型的图像,待识别图像可以是终端预先存储的任一图像,也可以是实时采集的视频中的任一图像帧,本申请实施例对此不做限定。
一个可能的实施方式中,以待识别图像是终端预先存储的任一图像为例,用户可以手动选取一个图像作为待识别图像,终端接收到待识别图像选取指令时,根据图像选取指令对应的存储地址,在本地存储区域获取待识别图像。
以待识别图像是终端实时采集的视频中的任一图像帧为例,终端将实时采集到的每个图像帧确定为待识别图像。
当然,上述的几个场景仅为本申请实施例列举的几种可能的实施场景以及对应的待识别图像获取方式,除此之外,还可以有其它的实施场景以及对应的待识别图像获取方式,本申请对此不做限定。
302、终端将待识别图像输入图像识别模型。
其中,图像识别模型是前向传播的、包含多个处理层的神经网络模型,每个处理层用于对输入的图像进行特征处理,输出特征图像。多个处理层中存在排列顺序,按照处理层的排列顺序,前一个处理层的输出作为后一个处理层的输入。图像识别模型中预设多个处理层可以分别连接一个分类模型和一个分类正确性判定模型,也可以是预设多个处理层连接一个分类模型和一个分类正确性判定模型,根据实际需求设置即可,本申请对此不作限定。
图像识别模型包括但不限于VGG(Visual Geometry Group Network,视觉几何组网络)、GoogleNet(一种用于图像识别的神经网络)、ResNet(Residual Neural Network,残差神经网络)、PSPNet(Pyramid Scene Parsing Network,金字塔场景分析网络)、Deeplab(一种用于图像分割的神经网络)等,其中,VGG、GoogleNet以及ResNet是用于图像识别的神经网络,PSPNet和Deeplab是用于图像分割的神经网络。除上述列举的级联式网络结构之外,还可以是其它拓扑结构,如并行式、并行与级联组合式结构,本申请对此不作限定。
一个可能的实施方式中,终端将待识别图像输入图像识别模型中的第一个处理层,处理层对待识别图像进行特征提取,得到特征图像。
303、每当得到图像识别模型中的一个处理层输出的特征图像时,终端确定是否满足预设的识别结束条件。
一个可能的实施方式中,如果当前处理层为第一个处理层,则得到第一个处理层输出的特征图像时,终端确定是否满足预设的识别结束条件。如果当前处理层不是第一个处理层,则将前一个处理层输出的特征图像输入到当前处理层,得到当前处理层输出的特征图像,然后,终端确定是否满足预设的识别结束条件。
可选地,上述识别结束条件可以是,待识别图像输入图像识别模型的时间点到当前时间点的时长超过预设的预算时长。
一个可能的实施方式中,某些使用场景对图像处理的实时性要求较高,如移动端的手机对图像进行处理,或无人车对采集到的场景图像进行识别等,这种情况下,技术人员可能预先设定一个预算时长,根据预设的预算时长对识别结束条件进行设定。
从终端将待识别图像输入到图像识别模型时开始计时,每当得到图像识别模型中的一个处理层输出的特征图像时,终端确定从开始计时的时间点至当前时间点的时长,确定该时长是否超过预设的预算时长。如果该时长超过预算时长,则终端确定满足预设的识别结束条件,如果上述时长没超过预算时长,则终端确定不满足预设的识别结束条件。这样,可以保证在图像处理消耗的时长不超过预算时长的基础上得到图像识别的结果,满足对实时性较高的要求。这样,对在线运行时间有要求,对模型容量有限制的情况下,例如移动端的手机、机器人等实时性要求较高、硬件内存较小的移动设施场景应用有实际意义。
可选地,识别结束条件也可以是,该处理层是图像识别模型的最后一个处理层。
一个可能的实施方式中,当得到图像识别模型中的一个处理层输出的特征图像时,终端判断该处理层是否为图像识别模型的最后一个处理层,如果该处理层是图像识别模型的最后一个处理层,则终端确定满足识别结束条件,如果该处理层不是图像识别模型的最后一个处理层,则终端确定不满足识别结束条件。
304、如果不满足识别结束条件,则终端将特征图像输入分类正确性判定模型,如果分类正确性判定模型的输出结果为分类正确,则终端基于特征图像输入分类模型得到的分类数据,确定待识别图像的分类,如果分类正确性判定模型的输出结果为分类错误,则终端将特征图像输入下一个处理层。
其中,分类正确性判定模型可以利用强化学习算法,来判定根据不同处理层输出的特征图像确定待识别图像的分类的正确性与否,包括两个输出神经元,分别代表分类正确以及分类错误。分类正确性判定模型是对初始分类正确性判定模型进行训练得到的,训练的过程下文中有具体说明。分类数据包括各分类对应的概率值,可以是一个向量,向量中的每个向量值表示这一位对应的分类对应的概率。
一个可能的实施方式中,如果终端确定不满足识别结束条件,则终端将特征图像输入分类正确性判定模型,如果分类正确性判定模型的输出结果为分类正确,则终端将上述得到的特征图像输出到分类模型中,得到该特征图像对应的分类数据,根据分类数据确定出一个分类,将其确定为待识别图像的分类,并跳出图像识别模型,输出待识别图像的分类。
如果分类正确性判定模型的输出结果为分类错误,说明基于当前处理层输出的特征图像确定待识别图像的分类的准确性不够高,则终端将上述得到的特征图像输入到下一个处理层。
需要说明的是,上述处理层可以是多尺度的残差网络,这种情况下,上述分类正确性判定模型和分类模型可以连接在每个处理层的最小尺度的卷积层上,也即,将特征图像输入到处理层后,根据处理层上多个尺度的卷积层对特征图像进行特征提取,将输出的特征图像输入分类正确性判定模型和/或分类模型。以图4为例,水平方向上的不同方框代表图像识别模型中不同处理层输出的特征图像,竖直方向上的不同大小的方框代表同一处理层中不同尺度的卷积层输出的特征图像,菱形框代表分类正确性判定模型,三角框代表分类模型。
可选地,上述基于特征图像输入分类模型得到的分类数据,确定待识别图像的分类,具体的处理可以如下:终端将特征图像输入分类模型,得到特征图像的分类数据;终端确定各分类对应的概率值中的最大概率值,将最大概率值对应的分类,确定为待识别图像的分类。
305、如果满足识别结束条件,则终端基于特征图像输入分类模型得到的分类数据,确定待识别图像的分类。
一个可能的实施方式中,如果终端确定满足识别结束条件,说明当前处理层是对图像进行处理的最后一个处理层,则终端将上述得到的特征图像输入到分类模型中,得到该特征图像对应的分类数据,根据该特征图像对应的分类数据确定该特征图像的分类,将其确定为待识别图像的分类,跳出图像识别模型,输出待识别图像的分类。
以全图图像识别举例,假定图像识别模型是ResNet101网络,在显卡上计算,该网络从输入到经过全部计算层所需时间为156ms每张图,假设给定的预算时长为80ms,则可以在ResNet101网络中的一个处理层中,通过分类正确性判定模型确定当前处理层是否为分类效果最好的处理层,如果确定当前处理层是分类效果最好的处理层,则将当前处理层输出的特征图像输入分类模型中,根据输出的分类数据确定待识别图像的分类,并跳出图像识别模型。如果确定当前处理层不是分类效果最好的处理层,则将当前处理层输出的特征图像输入到下一个处理层,继续进行图像识别。
本申请实施例中,终端将待识别图像输入图像识别模型的至少一个处理层,得到特征图像,将特征图像输入分类正确性判定模型,得到至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别待识别图像的分类的目标处理层,基于目标处理层输出的特征图像输入分类模型后得到的分类数据,确定待识别图像的分类。这样,根据分类正确性判定模型选择正确率最高的处理层,将该处理层输出的特征图像输入到分类模型,进而确定待识别图像的分类,这样,可以提高图像识别的准确率。而且,还可以提前跳出图像识别模型,减少了处理时长,提高了图像识别的效率。
本申请实施例还提供了一种确定图像分类的方法,下面将结合图5所示的确定图像分类的方法流程图进行说明。
501、终端获取待识别图像。
502、终端将待识别图像输入图像识别模型。
503、每当得到图像识别模型中的一个处理层输出的特征图像时,终端将特征图像输入分类正确性判定模型,确定分类正确性判定模型的判定结果,并确定是否满足预设的识别结束条件。
一个可能的实施方式中,如果当前处理层为第一个处理层,则得到第一个处理层输出的特征图像时,终端将特征图像输入分类正确性判定模型,确定分类正确性判定模型的判定结果,判定结果包括分类正确和分类错误,对判定结果的处理方式可以包括以下几种:
方式一,如果判定结果为分类正确,将特征图像输入到分类模型,得到特征图像对应的分类数据,并根据分类数据确定特征图像的分类,记录该处理层对应的特征图像的分类,并将特征图像输入到下一个处理层中;如果判定结果为分类错误,则将特征图像输入到下一个处理层中。
方式二,如果判定结果为分类正确,则记录判定结果为分类正确对应的处理层,将特征图像输入到下一个处理层中;如果判定结果为分类错误,则直接将特征图像输入到下一个处理层中。
根据正确性判定模型的判定结果进行相应的处理后,终端确定是否满足预设的识别结束条件。
可选地,识别结束条件可以是待识别图像输入图像识别模型的时间点到当前时间点的时长超过预设的预算时长;或者,识别结束条件可以是该处理层是图像识别模型的最后一个处理层。相应的处理可以参照上述步骤303的处理,此处不做赘述。
504、如果不满足识别结束条件,则终端将特征图像输入下一个处理层,如果满足识别结束条件,则终端确定得到的所有判定结果中是否存在分类正确的判定结果。
一个可能的实施方式中,如果终端确定不满足识别结束条件,说明当前处理层不是最后一个处理层,则终端将特征图像输入下一个处理层。如果终端确定满足识别结束条件,说明当前处理层为对待识别图像进行识别处理的最后一个处理层,则根据处理层对图像进行特征提取的处理全部完成,终端确定得到的所有判定结果中是否存在分类正确的判定结果。
505、如果得到的所有判定结果中不存在分类正确的判定结果,则终端基于特征图像输入分类模型得到的分类数据,确定待识别图像的分类。
一个可能的实施方式中,如果得到的所有判定结果中不存在分类正确的判定结果,说明根据分类正确性判定模型无法确定准确性足够大的识别结果,则可以将最后一个处理层(即当前处理层)输出的特征图像,输入到分类模型,得到特征图像的分类数据,根据分类数据确定待识别图像的分类。这样,根据符合处理条件的最深一个处理层输出的特征图像,确定待识别图像的分类,依据大量的实验结果,根据越深的处理器对图像进行识别的准确率越高,上述处理可以尽量保证图像识别的准确性。
可选地,上述基于特征图像输入分类模型得到的分类数据,确定待识别图像的分类,具体的处理可以如下:终端将特征图像输入分类模型,得到特征图像的分类数据;终端确定各分类对应的概率值中的最大概率值,将最大概率值对应的分类,确定为待识别图像的分类。
506、如果得到的所有判定结果中存在分类正确的判定结果,则终端确定所有判定结果为分类正确的处理层中的最后一个目标处理层,基于目标处理层输出的特征图像输入分类模型得到的分类数据,确定待识别图像的分类。
一个可能的实施方式中,如果得到的所有判定结果中存在分类正确的判定结果,说明至少一个处理层中存在准确率较高的处理层,则终端确定所有判定结果为分类正确的处理层,在当前确定出的处理层中确定最后一个处理层(可称为目标处理层),接下来的处理可以分为如下几种方式:
1)如果上述步骤503中采用上述方式一的处理方式,则确定记录的目标处理层对应的特征图像的分类,将其确定为待识别图像的分类。
2)如果上述步骤503中采用上述方式二的处理方式,则终端将目标处理层输出的特征图像输入到分类模型中,得到特征图像的分类数据,根据分类数据确定待识别图像的分类。
举例来说,上述通过分类正确性判定模型得到的判定结果中,分类正确可以用EXIT表示,分类错误可以用CONTINUE表示,当得到判定结果时,可以存储在判定结果对应的判定结果集合中。这样,确定得到的所有判定结果中是否存在分类正确的判定结果这一步骤相应的处理可以是:确定EXIT判定结果集合中是否为空,如果为空,则说明得到的所有判定结果中不存在分类正确的判定结果,则根据最后一个处理层输出的特征图像确定待识别图像的分类;如果不为空,则说明得到的所有判定结果中存在分类正确的判定结果,则根据最后一个决策为EXIT的处理层输出的特征图像,确定待识别图像的分类。该策略的数学表达式可以是:
如图6所示,圆形代表判定结果为分类错误,方形代表判定结果为分类正确。不同待识别图像对应有不同的目标处理层,以图中的图像1是待识别图像为例,图像识别模型中第二个处理层为对应的目标处理层,则根据第二个处理层输出的特征图像的分类,确定图像1的分类。
需要说明的是,上述实施例中的图像识别模型仅是图像处理类的神经网络的一个使用实例,除了根据上述方法根据图像识别模型对图像进行识别,上述神经网络模型还可以用于其它的使用场景,本申请对此不做限定。例如,神经网络模型可以是用于图像分割的模型。假设识别结束条件为待识别图像输入图像识别模型的时间点到当前时间点的时长超过预设的预算时长,则在给定不同的预算时长下,图像分割的效果也不同,通常来讲,给定的预算时长越大,可供选择的处理层越多,得到的图像分割的效果越好,如图7所示。相应的处理可以参照上述图像识别模型对图像进行识别的处理,此处不做赘述。
本申请实施例中,终端将待识别图像输入图像识别模型的至少一个处理层,得到特征图像,将特征图像输入分类正确性判定模型,得到至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别待识别图像的分类的目标处理层,基于目标处理层输出的特征图像输入分类模型后得到的分类数据,确定待识别图像的分类。这样,根据分类正确性判定模型选择正确率最高的处理层,将该处理层输出的特征图像输入到分类模型,进而确定待识别图像的分类,这样,可以提高图像识别的准确率。
下面将结合图8,对上述分类正确性判定模型的训练过程进行说明:
801、终端将样本图像输入图像识别模型,获取图像识别模型中任意处理层输出的特征图像,作为样本特征图像。
802、终端获取录入的每个样本特征图像对应的样本图像的真实分类,作为每个样本特征图像对应的样本分类。
一个可行的实施方式中,可以利用深度Q学习方法对初始分类正确性判定模型进行训练。将深度Q学习中的状态(state)确定为图像识别模型中任意处理层输出的特征图像,行动(action)确定为{EXIT,CONTINUE}的二元集合,其中,EXIT表示分类正确并跳出,CONTINUE表示分类错误并继续进入下一个处理层。奖励(reward)与分类是否正确以及处理层的深度有关,具体表达式如下公式(1)所示。
其中,I[x]为狄拉克函数,当且仅当x>0时其值为1。fl(s)fl(s)为分类模型在真值类别l上的预测置信度,fl'(s)fl’(s)为分类模型在错误值类别上的预测置信度,c为从图像识别模型开始到该分类模型所经过的全部运算成本,μ为调节模型对时间成本敏感度的预设系数。
将特征图像以及对应的奖励真值合成一个样本,对初始模型进行训练。
803、基于每个样本特征图像和对应的样本分类,终端对初始分类正确性判定模型进行训练,得到分类正确性判定模型。
一个可行的实施方式中,初始分类正确性判定模型中待训练的模型参数的更新表达式可以如下公式(2)所示。
其中,θi为第i次更新后的模型参数,α为预设学习参数,Q为模型预测值,Q*为基于当前参数的真值,当a=EXIT时其值为r(s,a),当a=CONTINUE时其值为maxα'Q(s',α';θi)。
根据上述公式(2),基于模型预测值以及样本中的真值的误差,对初始分类正确性判定模型进行训练,使得误差逐步收敛,直到误差达到收敛或误差小于预设阈值,则结束对初始分类正确性判定模型的训练,将当前的模型参数作为训练好的模型的参数,完成对初始分类正确性判定模型的训练。
当然,除了上述根据深度Q学习方法以及误差收敛对初始分类正确性判定模型进行训练外,还可以采用其它的训练方式对初始分类正确性判定模型进行训练,本申请对此不做限定。
基于相同的技术构思,本申请实施例还提供了一种确定图像分类的装置,该装置可以应用于上述终端,如图9所示,该装置包括:
获取模块910,用于获取待识别图像;
输入模块920,用于将所述待识别图像输入图像识别模型;
确定模块930,用于将所述图像识别模型中至少一个处理层输出的特征图像,分别输入分类正确性判定模型,得到所述至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别所述待识别图像的分类的目标处理层,基于所述目标处理层输出的特征图像输入分类模型后得到的分类数据,确定所述待识别图像的分类。
可选地,如图10所示,
所述获取模块910,还用于将待识别图像输入图像识别模型之前,将样本图像输入所述图像识别模型,获取所述图像识别模型中任意处理层输出的特征图像,作为样本特征图像;
所述获取模块910,还用于获取录入的每个样本特征图像对应的样本图像的真实分类,作为每个样本特征图像对应的样本分类;
训练模块940,用于基于每个样本特征图像和对应的样本分类,对初始分类正确性判定模型进行训练,得到所述分类正确性判定模型。
可选地,所述确定模块930,用于:
每当得到所述图像识别模型中的一个处理层输出的特征图像时,确定是否满足预设的识别结束条件;
如果不满足所述识别结束条件,则将所述特征图像输入分类正确性判定模型,如果所述分类正确性判定模型的输出结果为分类正确,则基于所述特征图像输入分类模型得到的分类数据,确定所述待识别图像的分类,如果所述分类正确性判定模型的输出结果为分类错误,则将所述特征图像输入下一个处理层;
如果满足所述识别结束条件,则基于所述特征图像输入分类模型得到的分类数据,确定所述待识别图像的分类。
可选地,所述确定模块930,用于:
每当得到所述图像识别模型中的一个处理层输出的特征图像时,将所述特征图像输入分类正确性判定模型,确定所述分类正确性判定模型的判定结果,并确定是否满足预设的识别结束条件;
如果不满足所述识别结束条件,则将所述特征图像输入下一个处理层,如果满足所述识别结束条件,则确定得到的所有判定结果中是否存在分类正确的判定结果;
如果得到的所有判定结果中不存在分类正确的判定结果,则基于所述特征图像输入分类模型得到的分类数据,确定所述待识别图像的分类;
如果得到的所有判定结果中存在分类正确的判定结果,则确定所有判定结果为分类正确的处理层中的最后一个目标处理层,基于所述目标处理层输出的特征图像输入分类模型得到的分类数据,确定所述待识别图像的分类。
可选地,所述识别结束条件,包括:所述待识别图像输入所述图像识别模型的时间点到当前时间点的时长超过预设的预算时长。
可选地,所述识别结束条件,包括:所述处理层是所述图像识别模型的最后一个处理层。
可选地,所述确定模块930,用于:
将所述特征图像输入分类模型,得到所述特征图像的分类数据,所述分类数据包括各分类对应的概率值;
确定所述各分类对应的概率值中的最大概率值,将所述最大概率值对应的分类,确定为所述待识别图像的分类。
本申请实施例中,终端将待识别图像输入图像识别模型的至少一个处理层,得到特征图像,将特征图像输入分类正确性判定模型,得到至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别待识别图像的分类的目标处理层,基于目标处理层输出的特征图像输入分类模型后得到的分类数据,确定待识别图像的分类。这样,根据分类正确性判定模型选择正确率最高的处理层,将该处理层输出的特征图像输入到分类模型,进而确定待识别图像的分类,这样,可以提高图像识别的准确率。
需要说明的是:上述实施例提供的确定图像分类的装置在确定图像分类的时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将终端的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的确定图像分类的装置与确定图像分类的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图11是本申请实施例提供的一种终端的结构示意图,该终端1100可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)1101和一个或一个以上的存储器1102,其中,所述存储器1102中存储有至少一条指令,所述至少一条指令由所述处理器1101加载并执行以实现下述确定图像分类的方法的步骤:
获取待识别图像;
将待识别图像输入图像识别模型;
将图像识别模型中至少一个处理层输出的特征图像,分别输入分类正确性判定模型,得到至少一个处理层对应的判定结果,基于得到的判定结果,终端确定用于识别待识别图像的分类的目标处理层,基于目标处理层输出的特征图像输入分类模型后得到的分类数据,终端确定待识别图像的分类。
可选的,所述至少一条指令由所述处理器1101加载并执行以实现下述方法步骤:
将样本图像输入该图像识别模型,获取该图像识别模型中任意处理层输出的特征图像,作为样本特征图像;
获取录入的每个样本特征图像对应的样本图像的真实分类,作为每个样本特征图像对应的样本分类;
基于每个样本特征图像和对应的样本分类,对初始分类正确性判定模型进行训练,得到该分类正确性判定模型。
可选的,所述至少一条指令由所述处理器1101加载并执行以实现下述方法步骤:
每当得到该图像识别模型中的一个处理层输出的特征图像时,确定是否满足预设的识别结束条件;
如果不满足该识别结束条件,则将该特征图像输入分类正确性判定模型,如果该分类正确性判定模型的输出结果为分类正确,则基于该特征图像输入分类模型得到的分类数据,确定该待识别图像的分类,如果该分类正确性判定模型的输出结果为分类错误,则将该特征图像输入下一个处理层;
如果满足该识别结束条件,则基于该特征图像输入分类模型得到的分类数据,确定该待识别图像的分类。
可选的,所述至少一条指令由所述处理器1101加载并执行以实现下述方法步骤:
每当得到该图像识别模型中的一个处理层输出的特征图像时,将该特征图像输入分类正确性判定模型,确定该分类正确性判定模型的判定结果,并确定是否满足预设的识别结束条件;
如果不满足该识别结束条件,则将该特征图像输入下一个处理层,如果满足该识别结束条件,则确定得到的所有判定结果中是否存在分类正确的判定结果;
如果得到的所有判定结果中不存在分类正确的判定结果,则基于该特征图像输入分类模型得到的分类数据,确定该待识别图像的分类;
如果得到的所有判定结果中存在分类正确的判定结果,则确定所有判定结果为分类正确的处理层中的最后一个目标处理层,基于该目标处理层输出的特征图像输入分类模型得到的分类数据,确定该待识别图像的分类。
可选的,所述至少一条指令由所述处理器1101加载并执行以实现下述方法步骤:
将该特征图像输入分类模型,得到该特征图像的分类数据,该分类数据包括各分类对应的概率值;
确定该各分类对应的概率值中的最大概率值,将该最大概率值对应的分类,确定为该待识别图像的分类。
本申请实施例中,终端将待识别图像输入图像识别模型的至少一个处理层,得到特征图像,将特征图像输入分类正确性判定模型,得到至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别待识别图像的分类的目标处理层,基于目标处理层输出的特征图像输入分类模型后得到的分类数据,确定待识别图像的分类。这样,根据分类正确性判定模型选择正确率最高的处理层,将该处理层输出的特征图像输入到分类模型,进而确定待识别图像的分类,这样,可以提高图像识别的准确率。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述确定图像分类的方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种确定图像分类的方法,其特征在于,所述方法包括:
获取待识别图像;
将所述待识别图像输入图像识别模型;
将所述图像识别模型中至少一个处理层输出的特征图像,分别输入分类正确性判定模型,得到所述至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别所述待识别图像的分类的目标处理层,基于所述目标处理层输出的特征图像输入分类模型后得到的分类数据,确定所述待识别图像的分类。
2.根据权利要求1所述的方法,其特征在于,所述将待识别图像输入图像识别模型之前,还包括:
将样本图像输入所述图像识别模型,获取所述图像识别模型中任意处理层输出的特征图像,作为样本特征图像;
获取录入的每个样本特征图像对应的样本图像的真实分类,作为每个样本特征图像对应的样本分类;
基于每个样本特征图像和对应的样本分类,对初始分类正确性判定模型进行训练,得到所述分类正确性判定模型。
3.根据权利要求1所述的方法,其特征在于,所述将所述图像识别模型中至少一个处理层输出的特征图像,分别输入分类正确性判定模型,得到所述至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别所述待识别图像的分类的目标处理层,基于所述目标处理层输出的特征图像输入分类模型后得到的分类数据,确定所述待识别图像的分类,包括:
每当得到所述图像识别模型中的一个处理层输出的特征图像时,确定是否满足预设的识别结束条件;
如果不满足所述识别结束条件,则将所述特征图像输入分类正确性判定模型,如果所述分类正确性判定模型的输出结果为分类正确,则基于所述特征图像输入分类模型得到的分类数据,确定所述待识别图像的分类,如果所述分类正确性判定模型的输出结果为分类错误,则将所述特征图像输入下一个处理层;
如果满足所述识别结束条件,则基于所述特征图像输入分类模型得到的分类数据,确定所述待识别图像的分类。
4.根据权利要求1所述的方法,其特征在于,所述将所述图像识别模型中至少一个处理层输出的特征图像,分别输入分类正确性判定模型,得到所述至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别所述待识别图像的分类的目标处理层,基于所述目标处理层输出的特征图像输入分类模型后得到的分类数据,确定所述待识别图像的分类,包括:
每当得到所述图像识别模型中的一个处理层输出的特征图像时,将所述特征图像输入分类正确性判定模型,确定所述分类正确性判定模型的判定结果,并确定是否满足预设的识别结束条件;
如果不满足所述识别结束条件,则将所述特征图像输入下一个处理层,如果满足所述识别结束条件,则确定得到的所有判定结果中是否存在分类正确的判定结果;
如果得到的所有判定结果中不存在分类正确的判定结果,则基于所述特征图像输入分类模型得到的分类数据,确定所述待识别图像的分类;
如果得到的所有判定结果中存在分类正确的判定结果,则确定所有判定结果为分类正确的处理层中的最后一个目标处理层,基于所述目标处理层输出的特征图像输入分类模型得到的分类数据,确定所述待识别图像的分类。
5.根据权利要求3或4所述的方法,其特征在于,所述识别结束条件,包括:所述待识别图像输入所述图像识别模型的时间点到当前时间点的时长超过预设的预算时长。
6.根据权利要求3或4所述的方法,其特征在于,所述识别结束条件,包括:所述处理层是所述图像识别模型的最后一个处理层。
7.根据权利要求3或4所述的方法,其特征在于,所述基于所述特征图像输入分类模型得到的分类数据,确定所述待识别图像的分类,包括:
将所述特征图像输入分类模型,得到所述特征图像的分类数据,所述分类数据包括各分类对应的概率值;
确定所述各分类对应的概率值中的最大概率值,将所述最大概率值对应的分类,确定为所述待识别图像的分类。
8.一种确定图像分类的装置,其特征在于,所述装置包括:
获取模块,用于获取待识别图像;
输入模块,用于将所述待识别图像输入图像识别模型;
确定模块,用于将所述图像识别模型中至少一个处理层输出的特征图像,分别输入分类正确性判定模型,得到所述至少一个处理层对应的判定结果,基于得到的判定结果,确定用于识别所述待识别图像的分类的目标处理层,基于所述目标处理层输出的特征图像输入分类模型后得到的分类数据,确定所述待识别图像的分类。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
获取模块,用于将待识别图像输入图像识别模型之前,将样本图像输入所述图像识别模型,获取所述图像识别模型中任意处理层输出的特征图像,作为样本特征图像;
所述获取模块,还用于获取录入的每个样本特征图像对应的样本图像的真实分类,作为每个样本特征图像对应的样本分类;
训练模块,用于基于每个样本特征图像和对应的样本分类,对初始分类正确性判定模型进行训练,得到所述分类正确性判定模型。
10.根据权利要求8所述的装置,其特征在于,所述确定模块,用于:
每当得到所述图像识别模型中的一个处理层输出的特征图像时,确定是否满足预设的识别结束条件;
如果不满足所述识别结束条件,则将所述特征图像输入分类正确性判定模型,如果所述分类正确性判定模型的输出结果为分类正确,则基于所述特征图像输入分类模型得到的分类数据,确定所述待识别图像的分类,如果所述分类正确性判定模型的输出结果为分类错误,则将所述特征图像输入下一个处理层;
如果满足所述识别结束条件,则基于所述特征图像输入分类模型得到的分类数据,确定所述待识别图像的分类。
11.根据权利要求8所述的装置,其特征在于,所述确定模块,用于:
每当得到所述图像识别模型中的一个处理层输出的特征图像时,将所述特征图像输入分类正确性判定模型,确定所述分类正确性判定模型的判定结果,并确定是否满足预设的识别结束条件;
如果不满足所述识别结束条件,则将所述特征图像输入下一个处理层,如果满足所述识别结束条件,则确定得到的所有判定结果中是否存在分类正确的判定结果;
如果得到的所有判定结果中不存在分类正确的判定结果,则基于所述特征图像输入分类模型得到的分类数据,确定所述待识别图像的分类;
如果得到的所有判定结果中存在分类正确的判定结果,则确定所有判定结果为分类正确的处理层中的最后一个目标处理层,基于所述目标处理层输出的特征图像输入分类模型得到的分类数据,确定所述待识别图像的分类。
12.根据权利要求10或11所述的装置,其特征在于,所述识别结束条件,包括:所述待识别图像输入所述图像识别模型的时间点到当前时间点的时长超过预设的预算时长。
13.根据权利要求10或11所述的装置,其特征在于,所述确定模块,用于:
将所述特征图像输入分类模型,得到所述特征图像的分类数据,所述分类数据包括各分类对应的概率值;
确定所述各分类对应的概率值中的最大概率值,将所述最大概率值对应的分类,确定为所述待识别图像的分类。
14.一种终端,其特征在于,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至7任一所述的确定图像分类的方法。
15.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至7任一所述的确定图像分类的方法。
CN201910241812.8A 2019-03-28 2019-03-28 确定图像分类的方法、装置、终端及存储介质 Active CN109978058B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910241812.8A CN109978058B (zh) 2019-03-28 2019-03-28 确定图像分类的方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910241812.8A CN109978058B (zh) 2019-03-28 2019-03-28 确定图像分类的方法、装置、终端及存储介质

Publications (2)

Publication Number Publication Date
CN109978058A true CN109978058A (zh) 2019-07-05
CN109978058B CN109978058B (zh) 2023-08-04

Family

ID=67080996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910241812.8A Active CN109978058B (zh) 2019-03-28 2019-03-28 确定图像分类的方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN109978058B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110909147A (zh) * 2019-12-02 2020-03-24 支付宝(杭州)信息技术有限公司 一种训练排序结果选择模型输出标准问法的方法和系统
CN111897991A (zh) * 2020-06-19 2020-11-06 济南信通达电气科技有限公司 一种图像标注方法及设备
CN113420170A (zh) * 2021-07-15 2021-09-21 宜宾中星技术智能系统有限公司 大数据图像的多线程存储方法、装置、设备和介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544506A (zh) * 2013-10-12 2014-01-29 Tcl集团股份有限公司 一种基于卷积神经网络的图像分类方法和装置
CN104240522A (zh) * 2014-09-04 2014-12-24 中山大学 基于车载网和模糊神经网络的自适应十字路口控制技术
US20160307096A1 (en) * 2015-04-19 2016-10-20 International Business Machines Corporation Annealed dropout training of neural networks
CN107493400A (zh) * 2016-06-13 2017-12-19 谷歌公司 向人类操作员的升级
WO2018031678A1 (en) * 2016-08-09 2018-02-15 Nauto Global Limited System and method for precision localization and mapping
CN109035242A (zh) * 2018-08-09 2018-12-18 长安大学 一种基于深度学习的hf-erw焊接状态检测方法及装置
WO2018227374A1 (en) * 2017-06-13 2018-12-20 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for route planning based on deep convolutional neural network

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544506A (zh) * 2013-10-12 2014-01-29 Tcl集团股份有限公司 一种基于卷积神经网络的图像分类方法和装置
CN104240522A (zh) * 2014-09-04 2014-12-24 中山大学 基于车载网和模糊神经网络的自适应十字路口控制技术
US20160307096A1 (en) * 2015-04-19 2016-10-20 International Business Machines Corporation Annealed dropout training of neural networks
CN107493400A (zh) * 2016-06-13 2017-12-19 谷歌公司 向人类操作员的升级
WO2018031678A1 (en) * 2016-08-09 2018-02-15 Nauto Global Limited System and method for precision localization and mapping
WO2018227374A1 (en) * 2017-06-13 2018-12-20 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for route planning based on deep convolutional neural network
CN109035242A (zh) * 2018-08-09 2018-12-18 长安大学 一种基于深度学习的hf-erw焊接状态检测方法及装置

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
SURAT TEERAPITTAYANON 等: "BranchyNet: Fast Inference via Early Exiting from Deep Neural Networks", 《2016 23RD INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR)》, pages 2464 - 2469 *
SURAT TEERAPITTAYANON 等: "BranchyNet: Fast Inference via Early Exiting from Deep Neural Networks", 《ARXIV》 *
SURAT TEERAPITTAYANON 等: "BranchyNet: Fast Inference via Early Exiting from Deep Neural Networks", 《ARXIV》, 6 September 2017 (2017-09-06), pages 1 - 7 *
TOLGA BOLUKBASI 等: "Adaptive Neural Networks for Efficient Inference", 《ARXIV》 *
TOLGA BOLUKBASI 等: "Adaptive Neural Networks for Efficient Inference", 《ARXIV》, 18 September 2017 (2017-09-18), pages 1 - 10 *
VOLODYMYR MNIH 等: "Playing Atari with Deep Reinforcement Learning", 《ARXIV》 *
VOLODYMYR MNIH 等: "Playing Atari with Deep Reinforcement Learning", 《ARXIV》, 19 December 2013 (2013-12-19), pages 1 - 9 *
ZEQUN JIE 等: "Anytime Recognition with Routing Convolutional Networks", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE 》 *
ZEQUN JIE 等: "Anytime Recognition with Routing Convolutional Networks", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE 》, vol. 43, no. 6, 18 December 2019 (2019-12-18), pages 1 - 12, XP011853815, DOI: 10.1109/TPAMI.2019.2959322 *
张永兵 等: "基于人工神经网络的自适应疾病诊断模型研究", 《医疗设备信息》, vol. 22, no. 2, pages 18 - 19 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110909147A (zh) * 2019-12-02 2020-03-24 支付宝(杭州)信息技术有限公司 一种训练排序结果选择模型输出标准问法的方法和系统
CN111897991A (zh) * 2020-06-19 2020-11-06 济南信通达电气科技有限公司 一种图像标注方法及设备
CN111897991B (zh) * 2020-06-19 2022-08-26 济南信通达电气科技有限公司 一种图像标注方法及设备
CN113420170A (zh) * 2021-07-15 2021-09-21 宜宾中星技术智能系统有限公司 大数据图像的多线程存储方法、装置、设备和介质

Also Published As

Publication number Publication date
CN109978058B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
WO2020073951A1 (zh) 用于图像识别的模型的训练方法、装置、网络设备和存储介质
CN109117781B (zh) 多属性识别模型的建立方法、装置及多属性识别方法
CN111476309A (zh) 图像处理方法、模型训练方法、装置、设备及可读介质
CN109919183B (zh) 一种基于小样本的图像识别方法、装置、设备及存储介质
CN110070101A (zh) 植物种类的识别方法及装置、存储介质、计算机设备
CN112001428B (zh) 一种基于特征匹配优化的无锚框目标检测网络训练方法
US20220067421A1 (en) Image processing apparatus and method for style transformation
CN109978058A (zh) 确定图像分类的方法、装置、终端及存储介质
CN110930296B (zh) 图像处理方法、装置、设备及存储介质
CN111310800B (zh) 图像分类模型生成方法、装置、计算机设备和存储介质
CN105956631A (zh) 一种面向电子图库的在线渐进式图像分类方法
CN109670065A (zh) 基于图像识别的问答处理方法、装置、设备和存储介质
CN113591978B (zh) 一种基于置信惩罚正则化的自我知识蒸馏的图像分类方法、设备及存储介质
CN108491825A (zh) 信息生成方法和装置
CN116258861B (zh) 基于多标签学习的半监督语义分割方法以及分割装置
CN110163250A (zh) 基于分布式调度的图像脱敏处理系统、方法以及装置
CN112418327A (zh) 图像分类模型的训练方法、装置、电子设备以及存储介质
CN112561801A (zh) 基于se-fpn的目标检测模型训练方法、目标检测方法及装置
CN113065379B (zh) 融合图像质量的图像检测方法、装置、电子设备
CN114170484B (zh) 图片属性预测方法、装置、电子设备和存储介质
CN113128308A (zh) 一种港口场景下的行人检测方法、装置、设备及介质
CN113361384A (zh) 人脸识别模型压缩方法、设备、介质及计算机程序产品
CN112991281A (zh) 视觉检测方法、系统、电子设备及介质
CN111539390A (zh) 一种基于Yolov3的小目标图像识别方法、设备和系统
CN115393925A (zh) 一种人脸吸引力分类方法、系统、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant