CN110210521A - 图像识别方法、装置、服务器、终端及存储介质 - Google Patents
图像识别方法、装置、服务器、终端及存储介质 Download PDFInfo
- Publication number
- CN110210521A CN110210521A CN201910389441.8A CN201910389441A CN110210521A CN 110210521 A CN110210521 A CN 110210521A CN 201910389441 A CN201910389441 A CN 201910389441A CN 110210521 A CN110210521 A CN 110210521A
- Authority
- CN
- China
- Prior art keywords
- image
- recognition result
- terminal
- server
- network model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图像识别方法、装置、服务器、终端及存储介质,该方法包括接收终端发送的携带目标图像的识别请求;利用第一神经网络模型对所述目标图像进行识别得到第一识别结果并将所述第一识别结果返回所述终端;接收所述终端发送的针对所述第一识别结果的用户反馈指令;根据所述反馈指令,利用第二神经网络模型对所述目标图像进行识别得到第二识别结果并将所述第二识别结果返回所述终端。该方法、装置、服务器、终端及存储介质兼顾了识别效率和识别精度,同时用户可以对识别结果进行一定的反馈,提高了图像识别过程中用户的互动性。
Description
技术领域
本申请涉及计算机应用技术领域,尤其涉及一种图像识别方法、装置、服务器、终端及存储介质。
背景技术
随着计算机与网络技术的发展,建立有效的识别机制实现快速精准的图像识别成为一种需求。在众多的图像识别系统中,基于内容的图像识别方法得到了越来越广泛的应用,它满足了人们用已有的样本快速识别目标图像的需求。现有的技术虽然通过深度学习可以利用大量的图像样本数据进行识别模型的训练,以获得用于对目标进行识别的深度神经网络模型,但由于样本数据的数量太大,导致拟合后的神经网络模型精度较低,往往识别结果与目标图像相差较大,而针对识别结果相差较大的情况,现有技术无法获取用户的反馈为用户提供更准确的结果。
发明内容
鉴于以上问题,本发明的实施例提供一种图像识别方法、装置、服务器、终端及存储介质,其能解决上述背景技术部分提到的技术问题。
按照本发明的实施例的图像识别方法,应用于服务器,包括:接收终端发送的携带目标图像的识别请求;利用第一神经网络模型对所述目标图像进行识别得到第一识别结果并将所述第一识别结果返回所述终端;接收所述终端发送的针对所述第一识别结果的用户反馈指令;根据所述反馈指令,利用第二神经网络模型对所述目标图像进行识别得到第二识别结果并将所述第二识别结果返回所述终端。
按照本发明的实施例的图像识别方法,应用于终端,包括:向服务器发送携带目标图像的识别请求;接收所述服务器返回的利用第一神经网络模型识别所述目标图像得到的第一识别结果;向所述服务器发送针对所述第一识别结果的用户反馈指令;接收所述服务器根据所述用户反馈指令返回的利用第二神经网络模型识别所述目标图像得到的第二识别结果。
按照本发明的实施例的图像识别装置,应用于服务器,包括:第一接收模块,用于接收终端发送的携带目标图像的识别请求;第一识别模块,用于利用第一神经网络模型对所述目标图像进行识别得到第一识别结果并将所述第一识别结果返回所述终端;第二接收模块,用于接收所述终端发送的针对所述第一识别结果的用户反馈指令;第二识别模块,用于根据所述反馈指令,利用第二神经网络模型对所述目标图像进行识别得到第二识别结果并将所述第二识别结果返回所述终端。
按照本发明的实施例的图像识别装置,应用于终端,包括:第一发送单元,用于向服务器发送携带目标图像的识别请求;第一接收单元,用于接收所述服务器返回的利用第一神经网络模型识别所述目标图像得到的第一识别结果;第二发送单元,用于向所述服务器发送针对所述第一识别结果的用户反馈指令;第二接收单元,用于接收所述服务器根据所述用户反馈指令返回的利用第二神经网络模型识别所述目标图像得到的第二识别结果。
按照本发明的实施例的用于图像识别的服务器,包括:处理器;以及存储器,其上存储有可执行指令,其中,所述可执行指令当被执行时使得所述处理器执行前述应用于服务器的图像识别方法。
按照本发明的实施例的用于图像识别的终端,包括:处理器;以及存储器,其上存储有可执行指令,其中,所述可执行指令当被执行时使得所述处理器执行前述应用于终端的图像识别方法。
按照本发明的实施例的计算机可读存储介质,其上存储有计算机程序,所述计算机程序包括可执行指令,当所述可执行指令被处理器执行时,实施前述应用于服务器或终端的图像识别方法。
从以上的描述可以看出,本发明的实施例的方案利用图像样本数据中的不同训练图像集分别训练得到第一神经网络和第二神经网络,降低了训练的难度,提高了拟合的精度,在终端发起目标图像识别请求时,提供识别服务的服务器先利用第一神经网络进行识别得到第一识别结果并返回给终端,若终端用户对第一识别结果不满意,可通过终端向服务器发送反馈指令,服务器根据反馈指令进一步利用第二神经网络进行识别得到第二识别结果并返回给终端,如此兼顾了识别效率和识别精度,同时终端用户可以对识别结果进行一定的反馈,提高了图像识别过程中用户的互动性。
附图说明
图1为按照本发明的一个实施例的示例性系统架构的示意图;
图2为按照本发明的一个实施例的用于模型训练的方法的流程图;
图3为按照本发明的一个实施例的图像识别方法的交互流程图;
图4为按照本发明的一个实施例的图像识别方法的流程图;
图5为按照本发明的另一个实施例的图像识别方法的流程图;
图6为按照本发明的一个实施例的图像识别装置的示意图;
图7为按照本发明的另一个实施例的图像识别装置的示意图;
图8为按照本发明的一个实施例的用于图像识别的服务器的示意图;
图9为按照本发明的一个实施例的用于图像识别的终端的示意图。
具体实施方式
现在将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本公开内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。例如,所描述的方法可以按照与所描述的顺序不同的顺序来执行,以及各个步骤可以被添加、省略或者组合。另外,相对一些示例所描述的特征在其他例子中也可以进行组合。
如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。
本发明的实施例的方案利用图像样本数据中的不同训练图像集分别训练得到第一神经网络和第二神经网络,降低了训练的难度,提高了拟合的精度,在终端发起目标图像识别请求时,提供识别服务的服务器先利用第一神经网络进行识别得到第一识别结果并返回给终端,若终端用户对第一识别结果不满意,可通过终端向服务器发送反馈指令,服务器根据反馈指令进一步利用第二神经网络进行识别得到第二识别结果并返回给终端,如此兼顾了识别效率和识别精度,同时终端用户可以对识别结果进行一定的反馈,提高了图像识别过程中用户的互动性。
图1示出了可以应用本发明的图像识别方法或装置的实施例的示例性系统架构的示意图。如图1所示,该系统架构100可以包括终端102、104、106,网络108和服务器110。网络108用以在终端102、104、106和服务器110之间提供通信链路的介质。网络108可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端102、104、106通过网络108与服务器110交互,以接收或发送数据、消息等。终端102、104、106上可以安装有各种客户端应用,例如图像识别应用(或称图像检索应用)等。服务器110用于提供图像识别或图像检索服务。终端102、104、106和服务器110可以是例如计算机或其他合适的具有计算能力的电子设备。终端102、104、106可以是包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
应该理解,图1中的终端、网络和服务器的数量仅仅是示意性的。根据实际需要,可以具有任意数目的终端、网络和服务器。
本发明的实施例的方案包括模型训练阶段和实际识别阶段。
图2示出了按照本发明的一个实施例的用于模型训练的方法的流程图。图2所示的方法200对应于模型训练阶段,其利用训练数据训练得到卷积神经网络(CNN:Convolutional Neural Network)模型M1和基于区域信息的卷积神经网络(RCNN:RegionBased Convolutional Neural Network)模型M2,其中CNN模型M1和RCNN模型M2都用于图像识别。图2所示的方法可以例如由计算机或其他合适的具有计算能力的电子设备来实现。
如图2所示,在步骤202,采集样本图像。用户可根据识别需求采集样本图像,例如用于织物图像的识别可采集织物相关的样本图像,用于汽车图像的识别可采集汽车相关的样本图像。用户可通过在网上下载或拍摄等方式采集样本图像。
在步骤204,对样本图像执行手动分类,并按其所在类别进行重命名,以得到第一样本图像集SP1。其中,重命名可采用0102.jpg,0308.jpg,0910.jpg,…,这种方式进行,其中,前两个数字表示它所属的类,后两个数表示是这一类中图像的第几张图,比如,0308就表示第三类图像中第8张图。
在步骤206,从第一样本图像集SP1中选取一些或全部样本图像作为种子图像。
在步骤208,对每一个种子图像执行一次或多次等角度旋转、镜像和/或其他合适的操作,以从每一个种子图像中衍生得到一个或多个图像。将第一样本图像集SP1中的样本图像和从各个种子图像中衍生得到的图像共同组合为第二样本图像集SP2。
通过步骤206和208的操作,能够增加样本图像的数量(例如,能够将2500张样本图像经过处理后得到超过50000张,甚至100000张的样本图像)。样本图像越多,训练得到的用于图像识别的神经网络模型的参数越准确。
在步骤210,生成图像数据库。其中,图像数据库中存储有第二样本图像集SP2,第二样本图像集SP2中的各样本图像可以是根据索引号来存储。
步骤202-210构成了方法200的图像数据库生成过程。
在步骤212,获取第二样本图像集SP2中的各个样本图像的属性参数,其中,该属性参数包括但不局限于图像的高度、长度等。
在步骤214,从第二样本图像集SP2中选取其属性参数满足第一组规则中的各个规则的多个图像,作为用于训练CNN模型的第一训练图像集TP1。其中,该第一组规则用于定义适用于训练CNN模型的样本图像需要满足的高度限制、长度限制等。
在步骤216,从第二样本图像集SP2中选取其属性参数满足第二组规则中的各个规则的多个图像,作为用于训练RCNN模型的第二训练图像集TP2。其中,该第二组规则用于定义适用于训练RCNN模型的样本图像需要满足的高度限制、长度限制等。
这里,利用规则来选取适用于训练CNN模型和RCNN模型的样本图像,从而训练得到的CNN模型和RCNN模型能够具有更高的图像识别准确度。
在步骤218,使用第一训练图像集TP1中的图像作为训练数据,训练得到CNN模型M1。
在步骤220,使用第二训练图像集TP2中的图像作为训练数据,训练得到RCNN模型M2。
训练好的CNN模型M1和RCNN模型M2搭载于服务器上。
图3示出了按照本发明的一个实施例的图像识别方法的交互流程图,图3所示的方法300对应于实际识别阶段,其使用利用方法200生成的图像数据库、训练得到的CNN模型M1和RCNN模型M2来进行图像识别。图3所示的方法300可以应用于包括服务器和终端的系统中。
如图3所示,在步骤302,终端获取目标图像T并生成携带目标图像T的识别请求。本实施例终端可以通过连接的摄像头接收用户拍摄的目标图像T,或者接收用户通过人机接口模块从相册或者其他路径下选择目标图像T,并基于用户触发生成携带目标图像T的识别请求。
在步骤304,终端将识别请求发送至服务器。
在步骤306,服务器接收终端发送的携带目标图像T的识别请求。
在步骤308,服务器利用已训练的CNN模型M1对目标图像T的特征进行抽取,获取最能够表征目标图像T的特征即特征向量;同理利用CNN模型M1获取图像数据库中每个样本图像对应的特征向量。
在步骤310,服务器计算由CNN模型M1获取的目标图像T的特征向量与图像数据库中每个样本图像的特征向量的相似度,获取相似度值最大的第一图像,根据生成第一识别结果。具体的,第一识别结果可以包括第一图像、第一图像类别信息的至少一种。优选的,第一识别结果还可以包括第一图像的相似度值数值,以方便用户对识别精确度有直观的了解。
在步骤312,服务器将第一识别结果发送至终端。
在步骤314,终端接收服务器发送的第一识别结果。终端可以将第一识别结果在显示组件上进行显示。
在步骤316,终端监听针对第一识别结果的用户反馈指令。用户反馈指令可以是用户对第一识别结果不满意或希望再次进行识别时触发生成的指令。
在步骤318,终端判断是否监听到用户反馈指令。若否则流程结束,若是则转到步骤320。
在步骤320,终端将用户反馈指令发送至服务器。
在步骤322,服务器接收终端发送的用户反馈指令。
在步骤324,服务器根据用户反馈指令,利用已训练的RCNN模型M2对目标图像T的特征进行抽取,获取最能够标注目标图像T的特征即特征向量;同理利用RCNN模型M2获取图像数据库中每个样本图像对应的特征向量。
在步骤326,服务器计算由RCNN模型M2获取的目标图像T的特征向量与图像数据库中每个样本图像的特征向量的相似度,获取相似度值最大的第二图像,根据第二图像生成第二识别结果。具体的,第二识别结果可以包括第二图像、第二图像类别信息的至少一种。优选的,第二识别结果还可以包括第二图像的相似度值数值,以方便用户对识别精度有直观的了解。
在步骤328,服务器将第二识别结果发送至终端。
在步骤330,终端接收服务器发送的第二识别结果。终端可以将第二识别结果在显示组件上进行显示,具体的,第二识别结果可与第一识别结果一起显示,也可以取代第一识别结果进行显示。
其他变型
本领域技术人员将理解,虽然在上面的实施例中,方法200包括对样本图像执行手动分类的步骤204,然而,本发明并不局限于此。在本发明的其他实施例中,例如但不局限于,在步骤202所采集的样本图像已分类好的情况下,方法200也可以不包括对采集的样本图像执行手动分类的步骤204。
本领域技术人员将理解,虽然在上面的实施例中,方法200包括步骤206和208以衍生更多的样本图像,然而,本发明并不局限于此。在本发明的其他实施例中,例如但不局限于,在步骤202所采集的样本图像的数量已经足够多的情况下,方法200也可以不包括步骤206和208。
本领域技术人员将理解,虽然在上面的实施例中,方法200包括步骤210将第二样本图像集SP2存储以生成图像数据库,然而,本发明并不局限于此。在本发明的其他实施例中,例如但不局限于,当图像数据库和用于图像识别的神经网络模型确定时,也可以根据上述实施例记载的方式,根据预先采集的图像数据库和已训练的神经网络模型,获取图像数据库中每个样本图像对应的特征向量,并可以将每个样本图像对应的特征向量也存储在图像数据库中;或者也可以再建立一个特征向量数据库,专门用来存储该图像数据库中各样本图像对应的特征向量。相应的,方法300对目标图像T进行识别时,在步骤308和步骤324,可以仅获取目标图像T的特征向量,然后直接从图像数据库或者特征向量数据库中获取预先存储的每个样本图像的特征向量,然后直接进行图像识别的后续处理即可。如此,可以节省图像识别的时间,提高图像识别的效率。
本领域技术人员将理解,虽然在上面的实施例中,方法200包括步骤212-216以选取适用于训练CNN模型和RCNN模型的样本图像,然而,本发明并不局限于此。在本发明的其他实施例中,方法200也可以不包括步骤212-216。
本领域技术人员将理解,虽然在上面的实施例中,被训练用来获取图像特征的神经网络模型是CNN模型和RCNN模型,然而,本发明并不局限于此。在本发明的其他实施例中,被训练用来获取图像特征的神经网络模型也可以是以下的任意两种:CNN模型、RCNN模型、Fast RCNN(Fast Region Based Convolutional Neural Network)模型、Faster RCNN(Faster Region Based Convolutional Neural Network)模型,以及,一种或多种除了上述模型之外的其他类型的神经网络模型。其中,RCNN模型、Fast RCNN模型和Faster RCNN模型均为基于区域信息的卷积神经网络模型。
本领域技术人员将理解,虽然在上面的实施例中,方法300采用的图像数据库由方法200生成,然而,本发明并不局限于此。在本发明的其他实施例中,方法300采用的图像数据库可通过另外采集图像生成,也就是说,神经网络模型训练时所使用的图像数据库与实际识别使用时所使用的图像数据库可以没有关系,方法300可以对目标图像在训练时采用的图像数据库以外的其他任意数据库中进行识别。
图4示出了按照本发明的一个实施例的一种图像识别方法的流程图。图4所示的方法400应用于服务器上。
如图4所示,方法400可以包括,在步骤402,接收终端发送的携带目标图像的识别请求。
方法400还可以包括,在步骤404,利用第一神经网络模型对所述目标图像进行识别得到第一识别结果并将所述第一识别结果返回所述终端。
方法400还可以包括,在步骤406,接收所述终端发送的针对所述第一识别结果的用户反馈指令。
方法400还可以包括,在步骤408,根据所述反馈指令,利用第二神经网络模型对所述目标图像进行识别得到第二识别结果并将所述第二识别结果返回所述终端。
在一个方面,所述第一神经网络模型是利用第一训练图像集训练得到的,以及,所述第二神经网络模型是利用第二训练图像集训练得到的;其中,所述第一训练图像集是基于第一规则集中的规则从图像数据库中选取的,以及,所述第二训练图像集是基于第二规则集中的规则从所述图像数据库中选取的。
在另一个方面,所述第一识别结果包括第一图像、第一图像类别信息的至少一种,以及,所述第二识别结果包括第二图像、第二图像类别信息的至少一种;其中,所述第一图像是利用所述第一神经网络模型从所述图像数据库中获取的与所述目标图像相似度值最大的图像,所述第二图像是利用所述第二神经网络模型从所述图像数据库中获取的与所述目标图像相似度值最大的图像。
在又一个方面,所述第一识别结果还包括第一图像对应的相似度值数值,及/或,所述第二识别结果还包括第二图像对应的相似度值数值。
图5示出了按照本发明的另一个实施例的图像识别方法的流程图。图5所示的方法500应用于终端上。
如图5所示,方法500可以包括,在步骤502,向服务器发送携带目标图像的识别请求。
方法500还可以包括,在步骤504,接收所述服务器返回的利用第一神经网络模型识别所述目标图像得到的第一识别结果。
方法500还可以包括,在步骤506,向所述服务器发送针对所述第一识别结果的用户反馈指令。
方法500还可以包括,在步骤508,接收所述服务器根据所述用户反馈指令返回的利用第二神经网络模型识别所述目标图像得到的第二识别结果。
在一个方面,所述第一神经网络模型是利用第一训练图像集训练得到的,以及,所述第二神经网络模型是利用第二训练图像集训练得到的;其中,所述第一训练图像集是基于第一规则集中的规则从图像数据库中选取的,以及,所述第二训练图像集是基于第二规则集中的规则从所述图像数据库中选取的。
在另一个方面,所述第一识别结果包括第一图像、第一图像类别信息的至少一种,以及,所述第二识别结果包括第二图像、第二图像类别信息的至少一种;其中,所述第一图像是利用所述第一神经网络模型从所述图像数据库中获取的与所述目标图像相似度值最大的图像,所述第二图像是利用所述第二神经网络模型从所述图像数据库中获取的与所述目标图像相似度值最大的图像。
在又一个方面,所述第一识别结果还包括第一图像对应的相似度值数值,及/或,所述第二识别结果还包括第二图像对应的相似度值数值。
图6示出了按照本发明的一个实施例的图像识别装置的示意图。图6所示的装置600可以利用软件、硬件或软硬件结合的方式来实现。装置600例如可以安装在服务器中。装置600的具体技术细节请参照本申请实施例方法部分。
如图6所示,装置600可以包括第一接收模块602、第一识别模块604、第二接收模块606和第二识别模块608。第一接收模块602用于接收终端发送的携带目标图像的识别请求。第一识别模块604用于利用第一神经网络模型对所述目标图像进行识别得到第一识别结果并将所述第一识别结果返回所述终端。第二接收模块606用于接收所述终端发送的针对所述第一识别结果的用户反馈指令。第二识别模块608用于根据所述反馈指令,利用第二神经网络模型对所述目标图像进行识别得到第二识别结果并将所述第二识别结果返回所述终端。
在一个方面,所述第一神经网络模型是利用第一训练图像集训练得到的,以及,所述第二神经网络模型是利用第二训练图像集训练得到的;其中,所述第一训练图像集是基于第一规则集中的规则从图像数据库中选取的,以及,所述第二训练图像集是基于第二规则集中的规则从所述图像数据库中选取的。
在另一个方面,所述第一识别结果包括第一图像、第一图像类别信息的至少一种,以及,所述第二识别结果包括第二图像、第二图像类别信息的至少一种;其中,所述第一图像是利用所述第一神经网络模型从所述图像数据库中获取的与所述目标图像相似度值最大的图像,所述第二图像是利用所述第二神经网络模型从所述图像数据库中获取的与所述目标图像相似度值最大的图像。
在又一个方面,所述第一识别结果还包括第一图像对应的相似度值数值,及/或,所述第二识别结果还包括第二图像对应的相似度值数值。
图7示出了按照本发明的另一个实施例的图像识别装置的示意图。图7所示的装置700可以利用软件、硬件或软硬件结合的方式来实现。装置700例如可以安装在终端中。装置700的具体技术细节请参照本申请实施例方法部分。
如图7所示,装置700可以包括第一发送单元702、第一接收单元704、第二发送单元706和第二接收单元708。第一发送单元702用于向服务器发送携带目标图像的识别请求。第一接收单元704用于接收所述服务器返回的利用第一神经网络模型识别所述目标图像得到的第一识别结果。第二发送单元706用于向所述服务器发送针对所述第一识别结果的用户反馈指令。第二接收单元708用于接收所述服务器根据所述用户反馈指令返回的利用第二神经网络模型识别所述目标图像得到的第二识别结果。
在一个方面,所述第一神经网络模型是利用第一训练图像集训练得到的,以及,所述第二神经网络模型是利用第二训练图像集训练得到的;其中,所述第一训练图像集是基于第一规则集中的规则从图像数据库中选取的,以及,所述第二训练图像集是基于第二规则集中的规则从所述图像数据库中选取的。
在另一个方面,所述第一识别结果包括第一图像、第一图像类别信息的至少一种,以及,所述第二识别结果包括第二图像、第二图像类别信息的至少一种;其中,所述第一图像是利用所述第一神经网络模型从所述图像数据库中获取的与所述目标图像相似度值最大的图像,所述第二图像是利用所述第二神经网络模型从所述图像数据库中获取的与所述目标图像相似度值最大的图像。
在又一个方面,所述第一识别结果还包括第一图像对应的相似度值数值,及/或,所述第二识别结果还包括第二图像对应的相似度值数值。
本申请实施例还提供一种用于图像识别的服务器,请参见图8,图8为本申请实施例用于图像识别的服务器一个实施例示意图。如图8所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。
如图8所示,服务器800可以包括处理器802和存储器804,其中,存储器804上存储有可执行指令,其中,所述可执行指令当被执行时使得处理器802执行本发明实施例中应用于服务器的图像识别功能。
如图8所示,服务器800还可以包括连接不同系统组件(包括处理器802和存储器804)的总线806。总线806表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
服务器800典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器800访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器804可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)808和和/或高速缓存存储器810。服务器800可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统812可以用于读写不可移动的、非易失性磁介质(图8未显示,通常称为“硬盘驱动器”)。尽管图8中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线806相连。存储器804可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明实施例中应用于服务器的图像识别功能。
具有一组(至少一个)程序模块816的程序/实用工具814,可以存储在例如存储器804中,这样的程序模块816包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块816通常执行本发明实施例所描述的应用于服务器的图像识别功能和/或方法。
服务器800也可以与一个或多个外部设备822(例如键盘、指向设备、显示器824等)通信,还可与一个或者多个使得用户能与该服务器800交互的设备通信,和/或与使得该服务器800能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口818进行。并且,服务器800还可以通过网络适配器820与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图8所示,网络适配器820通过总线806与服务器800的其它模块通信。应当明白,尽管图中未示出,可以结合服务器800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器802通过运行存储在存储器804中的程序,从而执行各种功能应用以及数据处理,例如实现上述应用于服务器的图像识别功能和/或方法。
本申请实施例还提供一种用于图像识别的终端,请参见图9,图9为本申请实施例用于图像识别的终端一个实施例示意图。如图9所示,为了便于说明,仅示出了与本申请实施例有关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。
如图9所示,终端900可以包括处理器902和存储器904,其中,存储器904上存储有可执行指令,其中,所述可执行指令当被执行时使得处理器902执行本发明实施例中应用于终端的图像识别功能。
如图9所示,终端900还可以包括连接不同系统组件(包括处理器902和存储器904)的总线906。总线906表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
终端900典型地包括多种计算机系统可读介质。这些介质可以是任何能够被终端900访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器904可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)908和和/或高速缓存存储器910。终端900可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统912可以用于读写不可移动的、非易失性磁介质(图9未显示,通常称为“硬盘驱动器”)。尽管图9中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线906相连。存储器904可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明实施例中应用于终端的图像识别功能。
具有一组(至少一个)程序模块916的程序/实用工具914,可以存储在例如存储器904中,这样的程序模块916包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块916通常执行本发明实施例所描述的应用于终端的图像识别功能和/或方法。
终端900也可以与一个或多个外部设备922(例如键盘、指向设备、显示器924等)通信,还可与一个或者多个使得用户能与该终端900交互的设备通信,和/或与使得该终端900能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口918进行。并且,终端900还可以通过网络适配器920与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图9所示,网络适配器920通过总线906与终端900的其它模块通信。应当明白,尽管图中未示出,可以结合终端900使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器902通过运行存储在存储器904中的程序,从而执行各种功能应用以及数据处理,例如实现上述应用于终端的图像识别功能和/或方法。
本申请的实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序包括可执行指令,当所述可执行指令被处理器执行时,实施前述各个实施例的图像识别方法的任意一种实施方式。
本实施例的计算机可读存储介质可以包括上述图8所示实施例中的存储器804中的随机存取存储器(RAM)808、和/或高速缓存存储器810、和/或存储系统812;也可以包括上述图9所示实施例中的存储器904中的随机取存储器(RAM)908、和/或高速缓存存储器910、和/或存储系统912。
随着科技的发展,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载,或者采用其他方式获取。因此,本实施例中的计算机可读存储介质不仅可以包括有形的介质,还可以包括无形的介质。
本领域的技术人员应明白,本发明实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、装置、和计算机程序产品的流程图和/或步骤图来描述的。应理解可由计算机程序指令实现流程图和/或步骤图中的每一流程和/或步骤、以及流程图和/或步骤图中的流程和/或步骤的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或步骤图一个步骤或多个步骤中指定的功能的装置。
上面结合附图阐述的具体实施方式描述了示例性实施例,但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。
本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说,对本公开内容进行的各种修改是显而易见的,并且,也可以在不脱离本公开内容的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。因此,本公开内容并不限于本文所描述的示例,而是与符合本文公开的原理和新颖性特征的最广范围相一致。
Claims (13)
1.一种图像识别方法,应用于服务器,包括:
接收终端发送的携带目标图像的识别请求;
利用第一神经网络模型对所述目标图像进行识别得到第一识别结果并将所述第一识别结果返回所述终端;
接收所述终端发送的针对所述第一识别结果的用户反馈指令;
根据所述反馈指令,利用第二神经网络模型对所述目标图像进行识别得到第二识别结果并将所述第二识别结果返回所述终端。
2.根据权利要求1所述的方法,其中,
所述第一神经网络模型是利用第一训练图像集训练得到的,以及,所述第二神经网络模型是利用第二训练图像集训练得到的;
其中,所述第一训练图像集是基于第一规则集中的规则从图像数据库中选取的,以及,所述第二训练图像集是基于第二规则集中的规则从所述图像数据库中选取的。
3.根据权利要求2所述的方法,其中,
所述第一识别结果包括第一图像、第一图像类别信息的至少一种,以及,所述第二识别结果包括第二图像、第二图像类别信息的至少一种;
其中,所述第一图像是利用所述第一神经网络模型从所述图像数据库中获取的与所述目标图像相似度值最大的图像,所述第二图像是利用所述第二神经网络模型从所述图像数据库中获取的与所述目标图像相似度值最大的图像。
4.根据权利要求3所述的方法,其中,
所述第一识别结果还包括第一图像对应的相似度值数值,及/或,所述第二识别结果还包括第二图像对应的相似度值数值。
5.一种图像识别方法,应用于终端,包括:
向服务器发送携带目标图像的识别请求;
接收所述服务器返回的利用第一神经网络模型识别所述目标图像得到的第一识别结果;
向所述服务器发送针对所述第一识别结果的用户反馈指令;
接收所述服务器根据所述用户反馈指令返回的利用第二神经网络模型识别所述目标图像得到的第二识别结果。
6.根据权利要求5所述的方法,其中,
所述第一神经网络模型是利用第一训练图像集训练得到的,以及,所述第二神经网络模型是利用第二训练图像集训练得到的;
其中,所述第一训练图像集是基于第一规则集中的规则从图像数据库中选取的,以及,所述第二训练图像集是基于第二规则集中的规则从所述图像数据库中选取的。
7.根据权利要求6所述的方法,其中,
所述第一识别结果包括第一图像、第一图像类别信息的至少一种,以及,所述第二识别结果包括第二图像、第二图像类别信息的至少一种;
其中,所述第一图像是利用所述第一神经网络模型从所述图像数据库中获取的与所述目标图像相似度值最大的图像,所述第二图像是利用所述第二神经网络模型从所述图像数据库中获取的与所述目标图像相似度值最大的图像。
8.根据权利要求7所述的方法,其中,
所述第一识别结果还包括第一图像对应的相似度值数值,及/或,所述第二识别结果还包括第二图像对应的相似度值数值。
9.一种图像识别装置,应用于服务器,包括:
第一接收模块,用于接收终端发送的携带目标图像的识别请求;
第一识别模块,用于利用第一神经网络模型对所述目标图像进行识别得到第一识别结果并将所述第一识别结果返回所述终端;
第二接收模块,用于接收所述终端发送的针对所述第一识别结果的用户反馈指令;
第二识别模块,用于根据所述反馈指令,利用第二神经网络模型对所述目标图像进行识别得到第二识别结果并将所述第二识别结果返回所述终端。
10.一种图像识别装置,应用于终端,包括:
第一发送单元,用于向服务器发送携带目标图像的识别请求;
第一接收单元,用于接收所述服务器返回的利用第一神经网络模型识别所述目标图像得到的第一识别结果;
第二发送单元,用于向所述服务器发送针对所述第一识别结果的用户反馈指令;
第二接收单元,用于接收所述服务器根据所述用户反馈指令返回的利用第二神经网络模型识别所述目标图像得到的第二识别结果。
11.一种用于图像识别的服务器,包括:
处理器;以及
存储器,其上存储有可执行指令,其中,所述可执行指令当被执行时使得所述处理器执行权利要求1-4任一项所述的方法。
12.一种用于图像识别的终端,包括:
处理器;以及
存储器,其上存储有可执行指令,其中,所述可执行指令当被执行时使得所述处理器执行权利要求5-8任一项所述的方法。
13.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序包括可执行指令,当所述可执行指令被处理器执行时,实施如权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910389441.8A CN110210521A (zh) | 2019-05-10 | 2019-05-10 | 图像识别方法、装置、服务器、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910389441.8A CN110210521A (zh) | 2019-05-10 | 2019-05-10 | 图像识别方法、装置、服务器、终端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110210521A true CN110210521A (zh) | 2019-09-06 |
Family
ID=67785982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910389441.8A Pending CN110210521A (zh) | 2019-05-10 | 2019-05-10 | 图像识别方法、装置、服务器、终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110210521A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110941987A (zh) * | 2019-10-10 | 2020-03-31 | 北京百度网讯科技有限公司 | 目标对象识别方法、装置、电子设备及存储介质 |
CN111191552A (zh) * | 2019-12-23 | 2020-05-22 | 合肥美的智能科技有限公司 | 基于视觉终端的图像识别方法以及视觉终端 |
CN113836982A (zh) * | 2020-06-24 | 2021-12-24 | 阿里巴巴集团控股有限公司 | 图像处理方法、装置、存储介质及计算机设备 |
WO2022077945A1 (zh) * | 2020-10-14 | 2022-04-21 | 北京石头世纪科技股份有限公司 | 障碍物识别信息反馈方法、装置、机器人和存储介质 |
-
2019
- 2019-05-10 CN CN201910389441.8A patent/CN110210521A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110941987A (zh) * | 2019-10-10 | 2020-03-31 | 北京百度网讯科技有限公司 | 目标对象识别方法、装置、电子设备及存储介质 |
CN111191552A (zh) * | 2019-12-23 | 2020-05-22 | 合肥美的智能科技有限公司 | 基于视觉终端的图像识别方法以及视觉终端 |
CN113836982A (zh) * | 2020-06-24 | 2021-12-24 | 阿里巴巴集团控股有限公司 | 图像处理方法、装置、存储介质及计算机设备 |
WO2022077945A1 (zh) * | 2020-10-14 | 2022-04-21 | 北京石头世纪科技股份有限公司 | 障碍物识别信息反馈方法、装置、机器人和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110210521A (zh) | 图像识别方法、装置、服务器、终端及存储介质 | |
US10846327B2 (en) | Visual attribute determination for content selection | |
JP6349031B2 (ja) | 画像に表されたオブジェクトの認識及び照合のための方法及び装置 | |
CN106164959B (zh) | 行为事件测量系统和相关方法 | |
US11893790B2 (en) | Augmented reality item collections | |
US11115724B2 (en) | Visual hash tags via trending recognition activities, systems and methods | |
US20210374839A1 (en) | Generating augmented reality content based on third-party content | |
CN117157674A (zh) | 用于第三方应用的增强现实内容中的面部合成 | |
CN117321640A (zh) | 包括面部合成的交互式增强现实内容 | |
US11574005B2 (en) | Client application content classification and discovery | |
CN117083640A (zh) | 使用对面部表情的选择在线上社区的内容中的面部合成 | |
US20230214913A1 (en) | Product cards provided by augmented reality content generators | |
US20230215118A1 (en) | Api to provide product cards generated by augmented reality content generators | |
CN117099134A (zh) | 用于广告的增强现实内容中的面部合成 | |
CN107302492A (zh) | 社交软件的交友请求方法、服务器、客户端装置和系统 | |
CN110188801A (zh) | 图像识别方法、装置、电子设备及存储介质 | |
US20230214912A1 (en) | Dynamically presenting augmented reality content generators based on domains | |
CN117157677A (zh) | 增强现实内容中头部转向的面部合成 | |
CN117099133A (zh) | 叠加的增强现实内容中的面部合成 | |
CN115735231A (zh) | 基于产品数据的增强现实内容 | |
US20220319082A1 (en) | Generating modified user content that includes additional text content | |
CN115374141A (zh) | 虚拟形象的更新处理方法及装置 | |
CN117136404A (zh) | 从歌曲中提取伴奏的神经网络 | |
KR20220105457A (ko) | Ar 아트워크 컨텐츠를 제공하는 서버 및 이의 동작 방법 | |
Mahajan et al. | Forensic Face Sketch Artist System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |