CN110188801A - 图像识别方法、装置、电子设备及存储介质 - Google Patents
图像识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN110188801A CN110188801A CN201910389435.2A CN201910389435A CN110188801A CN 110188801 A CN110188801 A CN 110188801A CN 201910389435 A CN201910389435 A CN 201910389435A CN 110188801 A CN110188801 A CN 110188801A
- Authority
- CN
- China
- Prior art keywords
- image
- network model
- recognition result
- training
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图像识别方法、装置、电子设备及计算机可读存储介质,该方法包括输出利用第一神经网络模型识别的目标图像的第一识别结果;监听针对所述第一识别结果的反馈指令;当监听到所述反馈指令时,根据所述反馈指令,输出利用第二神经网络模型识别的所述目标图像的第二识别结果。该方法及装置、电子设备及计算机可读存储介质兼顾了识别效率和识别精度,同时用户可以对识别结果进行一定的反馈,提高了图像识别过程中用户的互动性。
Description
技术领域
本申请涉及计算机应用技术领域,尤其涉及一种图像识别方法、装置、电子设备及存储介质。
背景技术
随着计算机与网络技术的发展,建立有效的识别机制实现快速精准的图像识别成为一种需求。在众多的图像识别系统中,基于内容的图像识别方法得到了越来越广泛的应用,它满足了人们用已有的样本快速识别目标图像的需求。现有的技术虽然通过深度学习可以利用大量的图像样本数据进行识别模型的训练,以获得用于对目标进行识别的深度神经网络模型,但由于样本数据的数量太大,导致拟合后的神经网络模型精度较低,往往识别结果与目标图像相差较大,而针对识别结果相差较大的情况,现有技术无法获取用户的反馈为用户提供更准确的结果。
发明内容
鉴于以上问题,本发明的实施例提供一种图像识别方法、装置、电子设备及存储介质,其能解决上述背景技术部分提到的技术问题。
按照本发明的实施例的图像识别方法,包括:输出利用第一神经网络模型识别的目标图像的第一识别结果;监听针对所述第一识别结果的反馈指令;当监听到所述反馈指令时,根据所述反馈指令,输出利用第二神经网络模型识别的所述目标图像的第二识别结果。
按照本发明的实施例的图像识别装置,包括:第一输出模块,用于输出利用第一神经网络模型识别的目标图像的第一识别结果;监听模块,用于监听针对所述第一识别结果的反馈指令;第二输出模块,用于当监听到所述反馈指令时,根据所述反馈指令,输出利用第二神经网络模型识别的所述目标图像的第二识别结果。
按照本发明的实施例的电子设备,包括:处理器;以及存储器,其上存储有可执行指令,其中,所述可执行指令当被执行时使得所述处理器执行前述的图像识别方法。
按照本发明的实施例的计算机可读存储介质,其上存储有计算机程序,所述计算机程序包括可执行指令,当所述可执行指令被处理器执行时,实施如前述的图像识别方法。
从以上的描述可以看出,本发明的实施例的方案利用图像样本数据中的不同训练图像集分别训练得到第一神经网络和第二神经网络,降低了训练的难度,提高了拟合的精度,在进行目标图像识别时,先输出利用第一神经网络识别的第一识别结果,若用户对第一识别结果不满意,可根据用户的反馈指令进一步输出利用第二神经网络识别的第二识别结果,如此兼顾了识别效率和识别精度,同时用户可以对识别结果进行一定的反馈,提高了图像识别过程中用户的互动性。
附图说明
图1为按照本发明的一个实施例的用于模型训练的方法的流程图;
图2为按照本发明的一个实施例的图像识别方法的总体流程图;
图3为按照本发明的一个实施例的图像识别方法的流程图;
图4为按照本发明的一个实施例的图像识别装置的示意图;
图5为按照本发明的一个实施例的电子设备的示意图。
具体实施方式
现在将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本公开内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。例如,所描述的方法可以按照与所描述的顺序不同的顺序来执行,以及各个步骤可以被添加、省略或者组合。另外,相对一些示例所描述的特征在其他例子中也可以进行组合。
如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。
本发明的实施例的方案包括模型训练阶段和实际识别阶段。
图1示出了按照本发明的一个实施例的用于模型训练的方法的流程图。图1所示的方法100对应于模型训练阶段,其利用训练数据训练得到卷积神经网络(CNN:Convolutional Neural Network)模型M1和基于区域信息的卷积神经网络(RCNN:RegionBased Convolutional Neural Network)模型M2,其中CNN模型M1和RCNN模型M2都用于图像识别。图1所示的方法可以例如由计算机或其他合适的具有计算能力的电子设备来实现。
如图1所示,在方框102,采集样本图像。用户可根据识别需求采集样本图像,例如用于织物图像的识别可采集织物相关的样本图像,用于汽车图像的识别可采集汽车相关的样本图像。用户可通过在网上下载或拍摄等方式采集样本图像。
在方框104,对样本图像执行手动分类,并按其所在类别进行重命名,以得到第一样本图像集SP1。其中,重命名可采用0102.jpg,0308.jpg,0910.jpg,…,这种方式进行,其中,前两个数字表示它所属的类,后两个数表示是这一类中图像的第几张图,比如,0308就表示第三类图像中第8张图。
在方框106,从第一样本图像集SP1中选取一些或全部样本图像作为种子图像。
在方框108,对每一个种子图像执行一次或多次等角度旋转、镜像和/或其他合适的操作,以从每一个种子图像中衍生得到一个或多个图像。将第一样本图像集SP1中的样本图像和从各个种子图像中衍生得到的图像共同组合为第二样本图像集SP2。
通过方框106和108的操作,能够增加样本图像的数量(例如,能够将2500张样本图像经过处理后得到超过50000张,甚至100000张的样本图像)。样本图像越多,训练得到的用于图像识别的神经网络模型的参数越准确。
在方框110,生成图像数据库。其中,图像数据库中存储有第二样本图像集SP2,第二样本图像集SP2中的各样本图像可以是根据索引号来存储。
方框102-110构成了方法100的图像数据库生成过程。
在方框112,获取第二样本图像集SP2中的各个样本图像的属性参数,其中,该属性参数包括但不局限于图像的高度、长度等。
在方框114,从第二样本图像集SP2中选取其属性参数满足第一组规则中的各个规则的多个图像,作为用于训练CNN模型的第一训练图像集TP1。其中,该第一组规则用于定义适用于训练CNN模型的样本图像需要满足的高度限制、长度限制等。
在方框116,从第二样本图像集SP2中选取其属性参数满足第二组规则中的各个规则的多个图像,作为用于训练RCNN模型的第二训练图像集TP2。其中,该第二组规则用于定义适用于训练RCNN模型的样本图像需要满足的高度限制、长度限制等。
这里,利用规则来选取适用于训练CNN模型和RCNN模型的样本图像,从而训练得到的CNN模型和RCNN模型能够具有更高的图像识别准确度。
在方框118,使用第一训练图像集TP1中的图像作为训练数据,训练得到CNN模型M1。
在方框120,使用第二训练图像集TP2中的图像作为训练数据,训练得到RCNN模型M2。
图2示出了按照本发明的一个实施例的图像识别方法的总体流程图。图2所示的方法200对应于实际识别阶段,其使用利用方法100生成的图像数据库、训练得到的CNN模型M1和RCNN模型M2来进行图像识别。图2所示的方法200可以例如由计算机或其他合适的具有计算能力的电子设备来实现。
如图2所示,在方框202,接收携带目标图像T的识别请求。本实施例的图像识别方法的执行主体可以为图像识别装置,该图像识别装置可以为一个实体的电子装置,也可以为采用软件集成的装置。
图像识别装置可以通过连接的摄像头接收用户拍摄的目标图像T,或者接收用户通过人机接口模块从相册或者其他路径下选择目标图像T,并接收用户触发的基于目标图像T的图像识别请求。
在方框204,利用已训练的CNN模型M1对目标图像T的特征进行抽取,获取最能够表征目标图像T的特征即特征向量;同理利用CNN模型M1获取图像数据库中每个样本图像对应的特征向量。
在方框206,计算由CNN模型M1获取的目标图像T的特征向量与图像数据库中每个样本图像的特征向量的相似度,获取相似度值最大的第一图像,根据第一图像生成第一识别结果。具体的,第一识别结果可以包括第一图像、第一图像类别信息的至少一种。优选的,第一识别结果还可以包括第一图像的相似度值数值,以方便用户对识别精确度有直观的了解。
在方框208,输出第一识别结果。
在方框210,监听针对第一识别结果的反馈指令。反馈指令可以是用户对第一识别结果不满意或希望再次进行识别时触发生成的指令。
在判断框212,判断是否监听到反馈指令。若否则流程结束,若是则转到方框214。
在方框214,利用已训练的RCNN模型M2对目标图像T的特征进行抽取,获取最能够标注目标图像T的特征即特征向量;同理利用RCNN模型M2获取图像数据库中每个样本图像对应的特征向量。
在方框216,计算由RCNN模型M2获取的目标图像T的特征向量与图像数据库中每个样本图像的特征向量的相似度,获取相似度值最大的第二图像,根据第二图像生成第二识别结果。具体的,第二识别结果可以包括第二图像、第二图像类别信息的至少一种。优选的,第二识别结果还可以包括第二图像的相似度值数值,以方便用户对识别精度有直观的了解。
在方框218,输出第二识别结果。
本发明的实施例的方案利用图像样本数据中的不同训练图像集分别训练得到第一神经网络和第二神经网络,降低了训练的难度,提高了拟合的精度,在进行目标图像识别时,先输出利用第一神经网络识别的第一识别结果,若用户对第一识别结果不满意,可根据用户的反馈指令进一步输出利用第二神经网络识别的第二识别结果,如此兼顾了识别效率和识别精度,同时用户可以对识别结果进行一定的反馈,提高了图像识别过程中用户的互动性。
其他变型
本领域技术人员将理解,虽然在上面的实施例中,方法100包括对样本图像执行手动分类的方框104,然而,本发明并不局限于此。在本发明的其他实施例中,例如但不局限于,在方框102所采集的样本图像已分类好的情况下,方法100也可以不包括对采集的样本图像执行手动分类的方框104。
本领域技术人员将理解,虽然在上面的实施例中,方法100包括方框106和108以衍生更多的样本图像,然而,本发明并不局限于此。在本发明的其他实施例中,例如但不局限于,在方框102所采集的样本图像的数量已经足够多的情况下,方法100也可以不包括方框106和108。
本领域技术人员将理解,虽然在上面的实施例中,方法100包括方框110将第二样本图像集SP2存储以生成图像数据库,然而,本发明并不局限于此。在本发明的其他实施例中,例如但不局限于,当图像数据库和用于图像识别的神经网络模型确定时,也可以根据上述实施例记载的方式,根据预先采集的图像数据库和已训练的神经网络模型,获取图像数据库中每个样本图像对应的特征向量,并可以将每个样本图像对应的特征向量也存储在图像数据库中;或者也可以再建立一个特征向量数据库,专门用来存储该图像数据库中各样本图像对应的特征向量。相应的,方法200对目标图像T进行识别时,在方框204和方框214,可以仅获取目标图像T的特征向量,然后直接从图像数据库或者特征向量数据库中获取预先存储的每个样本图像的特征向量,然后直接进行图像识别的后续处理即可。如此,可以节省图像识别的时间,提高图像识别的效率。
本领域技术人员将理解,虽然在上面的实施例中,方法100包括方框112-116以选取适用于训练CNN模型和RCNN模型的样本图像,然而,本发明并不局限于此。在本发明的其他实施例中,方法100也可以不包括方框112-116。
本领域技术人员将理解,虽然在上面的实施例中,被训练用来获取图像特征的神经网络模型是CNN模型和RCNN模型,然而,本发明并不局限于此。在本发明的其他实施例中,被训练用来获取图像特征的神经网络模型也可以是以下的任意两种:CNN模型、RCNN模型、Fast RCNN(Fast Region Based Convolutional Neural Network)模型、Faster RCNN(Faster Region Based Convolutional Neural Network)模型,以及,一种或多种除了上述模型之外的其他类型的神经网络模型。其中,RCNN模型、Fast RCNN模型和Faster RCNN模型均为基于区域信息的卷积神经网络模型。
本领域技术人员将理解,虽然在上面的实施例中,方法200采用的图像数据库由方法100生成,然而,本发明并不局限于此。在本发明的其他实施例中,方法200采用的图像数据库可通过另外采集图像生成,也就是说,神经网络模型训练时所使用的图像数据库与实际识别使用时所使用的图像数据库可以没有关系,方法200可以对目标图像在训练时采用的图像数据库以外的其他任意数据库中进行识别。
本领域技术人员将理解,虽然在上面的实施例中,方法200包括方框204-206以对目标图像T进行识别生成第一识别结果,然而,本发明并不局限于此。在本发明的其他实施例中,方法200可以不包括方框204-206,方法200可以将识别请求发送至其他设备,由其他设备对目标图像T进行识别生成第一识别结果,然后接收其他设备发送的第一识别结果,即对目标图像T的识别可以是在本地也可以是远程。同理,方法200也可以不包括方框214-216。
图3示出了按照本发明的一个实施例的一种图像识别方法的流程图。图3所示的方法300可以例如由计算机或其他合适的具有计算能力的电子设备来实现。
如图3所示,方法300可以包括,在方框302,输出利用第一神经网络模型识别的目标图像的第一识别结果。
方法300还可以包括,在方框304,监听针对所述第一识别结果的反馈指令。
方法300还可以包括,在方框306,当监听到所述反馈指令时,根据所述反馈指令,输出利用第二神经网络模型识别的所述目标图像的第二识别结果。
在一个方面,在方框302输出第一识别结果的步骤之前,方法300还可以包括以下内容:根据预先采集的图像数据库、所述第一神经网络模型和所述目标图像,从所述图像数据库中获取相似度值最大的第一图像,根据所述第一图像生成所述第一识别结果,以及,在方框306输出第二识别结果的步骤之前,方法300还可以包括以下内容:根据所述图像数据库、所述第二神经网络模型和所述目标图像,从所述图像数据库中获取相似度值最大的第二图像,根据所述第二图像生成所述第二识别结果。
在另一个方面,所述第一神经网络模型是利用第一训练图像集训练得到的,以及,所述第二神经网络模型是利用第二训练图像集训练得到的;其中,所述第一训练图像集是基于第一规则集中的规则从所述图像数据库中选取的,以及,所述第二训练图像集是基于第二规则集中的规则从所述图像数据库中选取的。
在又一个方面,所述第一神经网络模型是卷积神经网络模型,以及所述第二神经网络模型是基于区域信息的卷积神经网络模型。
图4示出了按照本发明的一个实施例的一种图像识别装置的示意图。图4所示的装置400可以利用软件、硬件或软硬件结合的方式来实现。装置400例如可以安装在计算机或其他合适的具有计算能力的电子设备中。装置400的具体技术细节请参照本申请实施例方法部分。
如图4所示,装置400可以包括第一输出模块402、监听模块404和第二输出模块406。第一输出模块402用于输出利用第一神经网络模型识别的目标图像的第一识别结果。监听模块用于监听针对所述第一识别结果的反馈指令。第二输出模块406用于当监听到所述反馈指令时,根据所述反馈指令,输出利用第二神经网络模型识别的所述目标图像的第二识别结果。
在一个方面,装置400还可以包括第一生成模块和第二生成模块。第一生成模块用于根据预先采集的图像数据库、所述第一神经网络模型和所述目标图像,从所述图像数据库中获取相似度值最大的第一图像,根据所述第一图像生成所述第一识别结果。第二生成模块用于根据所述图像数据库、所述第二神经网络模型和所述目标图像,从所述图像数据库中获取相似度值最大的第二图像,根据所述第二图像生成所述第二识别结果。
在另一个方面,所述第一神经网络模型是利用第一训练图像集训练得到的,以及,所述第二神经网络模型是利用第二训练图像集训练得到的,其中,所述第一训练图像集是基于第一规则集中的规则从所述图像数据库中选取的,以及,所述第二训练图像集是基于第二规则集中的规则从所述图像数据库中选取的。
在又一个方面,所述第一神经网络模型是卷积神经网络模型,以及所述第二神经网络模型是基于区域信息的卷积神经网络模型。
本申请实施例还提供一种电子设备,请参见图5,图5为本申请实施例电子设备一个实施例示意图。如图5所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。
如图5所示,电子设备500可以包括处理器502和存储器504,其中,存储器504上存储有可执行指令,其中,所述可执行指令当被执行时使得处理器502执行图2或图3任一实施方式所示的方法。
如图5所示,电子设备500还可以包括连接不同系统组件(包括处理器502和存储器504)的总线506。总线506表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备500典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备500访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器504可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)508和和/或高速缓存存储器510。电子设备500可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统512可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线506相连。存储器504可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明上述图2或图3实施例的功能。
具有一组(至少一个)程序模块516的程序/实用工具514,可以存储在例如存储器504中,这样的程序模块516包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块516通常执行本发明所描述的上述图2或图3实施例中的功能和/或方法。
电子设备500也可以与一个或多个外部设备522(例如键盘、指向设备、显示器524等)通信,还可与一个或者多个使得用户能与该电子设备500交互的设备通信,和/或与使得该电子设备500能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口518进行。并且,电子设备500还可以通过网络适配器520与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图5所示,网络适配器520通过总线506与电子设备500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器502通过运行存储在存储器504中的程序,从而执行各种功能应用以及数据处理,例如实现上述实施例所示的方法。
本申请的实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序包括可执行指令,当所述可执行指令被处理器执行时,实施前述各个实施例的图像识别方法的任意一种实施方式。
本实施例的计算机可读存储介质可以包括上述图5所示实施例中的存储器504中的随机存取存储器(RAM)508、和/或高速缓存存储器510、和/或存储系统512。
随着科技的发展,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载,或者采用其他方式获取。因此,本实施例中的计算机可读存储介质不仅可以包括有形的介质,还可以包括无形的介质。
本领域的技术人员应明白,本发明实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、装置、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
上面结合附图阐述的具体实施方式描述了示例性实施例,但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。
本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说,对本公开内容进行的各种修改是显而易见的,并且,也可以在不脱离本公开内容的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。因此,本公开内容并不限于本文所描述的示例,而是与符合本文公开的原理和新颖性特征的最广范围相一致。
Claims (10)
1.一种图像识别方法,包括:
输出利用第一神经网络模型识别的目标图像的第一识别结果;
监听针对所述第一识别结果的反馈指令;
当监听到所述反馈指令时,根据所述反馈指令,输出利用第二神经网络模型识别的所述目标图像的第二识别结果。
2.根据权利要求1所述的方法,其中,所述输出利用第一神经网络模型识别的目标图像的第一识别结果的步骤之前,所述方法还包括:
根据预先采集的图像数据库、所述第一神经网络模型和所述目标图像,从所述图像数据库中获取相似度值最大的第一图像,根据所述第一图像生成所述第一识别结果;以及
所述输出利用第二神经网络模型识别的所述目标图像的第二识别结果的步骤之前,所述方法还包括:
根据所述图像数据库、所述第二神经网络模型和所述目标图像,从所述图像数据库中获取相似度值最大的第二图像,根据所述第二图像生成所述第二识别结果。
3.根据权利要求2所述的方法,其中,
所述第一神经网络模型是利用第一训练图像集训练得到的,以及,所述第二神经网络模型是利用第二训练图像集训练得到的;
其中,所述第一训练图像集是基于第一规则集中的规则从所述图像数据库中选取的,以及,所述第二训练图像集是基于第二规则集中的规则从所述图像数据库中选取的。
4.根据权利要求1-3任一项所述的方法,其中,
所述第一神经网络模型是卷积神经网络模型,以及
所述第二神经网络模型是基于区域信息的卷积神经网络模型。
5.一种图像识别装置,包括:
第一输出模块,用于输出利用第一神经网络模型识别的目标图像的第一识别结果;
监听模块,用于监听针对所述第一识别结果的反馈指令;
第二输出模块,当监听到所述反馈指令时,根据所述反馈指令,输出利用第二神经网络模型识别的所述目标图像的第二识别结果。
6.根据权利要求5所述的装置,其中,还包括:
第一生成模块,用于根据预先采集的图像数据库、所述第一神经网络模型和所述目标图像,从所述图像数据库中获取相似度值最大的第一图像,根据所述第一图像生成所述第一识别结果;
第二生成模块,用于根据所述图像数据库、所述第二神经网络模型和所述目标图像,从所述图像数据库中获取相似度值最大的第二图像,根据所述第二图像生成所述第二识别结果。
7.根据权利要求6所述的方法,其中,
所述第一神经网络模型是利用第一训练图像集训练得到的,以及,所述第二神经网络模型是利用第二训练图像集训练得到的;
其中,所述第一训练图像集是基于第一规则集中的规则从所述图像数据库中选取的,以及,所述第二训练图像集是基于第二规则集中的规则从所述图像数据库中选取的。
8.根据权利要求5-7任一项所述的方法,其中,
所述第一神经网络模型是卷积神经网络模型,以及
所述第二神经网络模型是基于区域信息的卷积神经网络模型。
9.一种电子设备,包括:
处理器;以及
存储器,其上存储有可执行指令,其中,所述可执行指令当被执行时使得所述处理器执行权利要求1-4任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序包括可执行指令,当所述可执行指令被处理器执行时,实施如权利要求1-4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910389435.2A CN110188801A (zh) | 2019-05-10 | 2019-05-10 | 图像识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910389435.2A CN110188801A (zh) | 2019-05-10 | 2019-05-10 | 图像识别方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110188801A true CN110188801A (zh) | 2019-08-30 |
Family
ID=67715979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910389435.2A Pending CN110188801A (zh) | 2019-05-10 | 2019-05-10 | 图像识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110188801A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112925482A (zh) * | 2021-03-15 | 2021-06-08 | 北京首都在线科技股份有限公司 | 数据处理方法、装置、系统、电子设备和计算机存储介质 |
CN113836982A (zh) * | 2020-06-24 | 2021-12-24 | 阿里巴巴集团控股有限公司 | 图像处理方法、装置、存储介质及计算机设备 |
CN114219051A (zh) * | 2022-02-23 | 2022-03-22 | 成都明途科技有限公司 | 图像分类方法、分类模型的训练方法、装置及电子设备 |
-
2019
- 2019-05-10 CN CN201910389435.2A patent/CN110188801A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113836982A (zh) * | 2020-06-24 | 2021-12-24 | 阿里巴巴集团控股有限公司 | 图像处理方法、装置、存储介质及计算机设备 |
CN112925482A (zh) * | 2021-03-15 | 2021-06-08 | 北京首都在线科技股份有限公司 | 数据处理方法、装置、系统、电子设备和计算机存储介质 |
CN112925482B (zh) * | 2021-03-15 | 2022-08-23 | 北京首都在线科技股份有限公司 | 数据处理方法、装置、系统、电子设备和计算机存储介质 |
CN114219051A (zh) * | 2022-02-23 | 2022-03-22 | 成都明途科技有限公司 | 图像分类方法、分类模型的训练方法、装置及电子设备 |
CN114219051B (zh) * | 2022-02-23 | 2022-05-06 | 成都明途科技有限公司 | 图像分类方法、分类模型的训练方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107038751B (zh) | 从2d图像进行3d建模对象的识别的方法、介质与系统 | |
CN104050449B (zh) | 一种人脸识别方法及装置 | |
US11237702B2 (en) | Carousel interface for post-capture processing in a messaging system | |
CN110188801A (zh) | 图像识别方法、装置、电子设备及存储介质 | |
CN110210521A (zh) | 图像识别方法、装置、服务器、终端及存储介质 | |
Zhang et al. | Weakly supervised emotion intensity prediction for recognition of emotions in images | |
JP2007047862A5 (zh) | ||
US20140289663A1 (en) | Producing Artwork Based on an Imported Image | |
US11695718B2 (en) | Post-capture processing in a messaging system | |
US20220319229A1 (en) | Interactive augmented reality content including facial synthesis | |
CN109033472A (zh) | 图片检索方法及装置、计算机设备及计算机可读介质 | |
JP2010020781A5 (zh) | ||
CN107024989A (zh) | 一种基于Leap Motion手势识别的沙画制作方法 | |
US20230353520A1 (en) | Providing post-capture media overlays for post-capture processing in a messaging system | |
US11875600B2 (en) | Facial synthesis in augmented reality content for online communities | |
CN104079926B (zh) | 一种远程桌面软件的视频性能测试方法 | |
CN117157674A (zh) | 用于第三方应用的增强现实内容中的面部合成 | |
CN107516105A (zh) | 图像处理方法及装置 | |
KR20220118545A (ko) | 메시징 시스템에서의 캡처후 처리 | |
US20220319231A1 (en) | Facial synthesis for head turns in augmented reality content | |
CN117099134A (zh) | 用于广告的增强现实内容中的面部合成 | |
CN109934080A (zh) | 脸部表情辨识的方法及装置 | |
WO2018035830A1 (zh) | 一种广告视频文件分级查找方法 | |
US20170212722A1 (en) | App-based platform for synchronizing user-generated animation with music | |
US20220321804A1 (en) | Facial synthesis in overlaid augmented reality content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |