CN111695630A - 一种图像识别模型的更新方法及相关设备 - Google Patents
一种图像识别模型的更新方法及相关设备 Download PDFInfo
- Publication number
- CN111695630A CN111695630A CN202010533118.6A CN202010533118A CN111695630A CN 111695630 A CN111695630 A CN 111695630A CN 202010533118 A CN202010533118 A CN 202010533118A CN 111695630 A CN111695630 A CN 111695630A
- Authority
- CN
- China
- Prior art keywords
- image
- target image
- target
- model
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种图像识别模型的更新方法及相关设备,通过数据计算的方式在云端部署图像识别模型,并通过实时在线更新的方式更新该图像识别模型,使得识别结果更加准确。该方法包括:对目标图像进行图像预处理得到目标数据,所述目标图像为待识别的图像;将所述目标数据输入目标图像识别模型,得到所述目标图像对应的预测值,所述目标图像识别模型为部署在云端通过卷积神经网络构建的模型;当所述预测值小于预设阈值时,通过至少两个图像识别模型对所述目标数据进行识别,得到第一识别结果;当所述第一识别结果为识别成功时,将所述目标数据标记为第一样本数据;基于所述第一样本数据以及所述第一识别结果对所述目标图像识别模型进行更新。
Description
技术领域
本申请涉及通信领域,尤其涉及一种图像识别模型的更新方法及相关设备。
背景技术
近几年,生活垃圾产量保持5%左右的增长,2018年全国生活垃圾清运量达到2.28亿吨,使得中国成为世界上产生垃圾最多的国家。在过去全国垃圾清运量始终高于无害化处理量,大量城市生活垃圾未经处理直接堆放,垃圾分类显然很有必要。
目前来说,垃圾分类主要是采用机器视觉的方式进行数据计算来构建模型,但是其构建模型的训练样本数据的来源有限,大多数模型的样本数据需要人工更新,导致训练出的模型始终是有缺陷的,耗时很长而且垃圾分类的准确率不高。
发明内容
本申请提供了一种图像识别模型的更新方法及相关设备,通过不断循环的自我学习过程来更新图像识别模型,体现出自主学习趋势,提高了图像识别模型的精度和广度。
本申请第一方面提供了一种图像识别模型的更新方法,包括:
对目标图像进行图像预处理得到目标数据,所述目标图像为待识别的图像;
将所述目标数据输入目标图像识别模型,得到所述目标图像对应的预测值,所述目标图像识别模型为部署在云端通过卷积神经网络构建的模型;
当所述预测值小于预设阈值时,通过至少两个图像识别模型对所述目标数据进行识别,得到第一识别结果,所述至少两个图像识别模型为在线机器学习平台上通过除所述卷积神经网络之外的其它深度学习神经网络模型算法训练得到的模型,其中,所述在线机器学习平台为部署在云端的机器学习平台;
当所述第一识别结果为识别成功时,将所述目标数据标记为第一样本数据;
基于所述第一样本数据以及所述第一识别结果对所述目标图像识别模型进行更新。
可选地,所述方法还包括:
当所述预测值大于或等于所述预设阈值时,基于所述目标图像对应的类型信息发出第一提示信息。
可选地,所述方法还包括:
当所述预测值大于或等于所述预设阈值时,将所述目标数据标记为第二样本数据;
基于所述第二样本数据以及所述目标图像对应的预测值对所述目标图像识别模型进行更新。
可选地,所述方法还包括:
当所述第一识别结果为识别失败时,基于所述目标图像发出第二提示信息。
可选地,所述方法还包括:
获取预设时长内所述第一识别结果为识别失败的图像集合;
根据用户的操作指令对所述图像集合进行识别,得到所述图像集合对应的第二识别结果;
基于所述图像集合以及所述第二识别结果对所述目标图像识别模型进行更新。
本申请第二方面提供了一种图像识别模型的更新装置,包括:
预处理单元,用于对目标图像进行图像预处理得到目标数据,所述目标图像为待识别的图像;
第一识别单元,用于将所述目标数据输入目标图像识别模型,得到所述目标图像对应的预测值,所述目标图像识别模型为部署在云端通过卷积神经网络构建的模型;
第二识别单元,用于当所述预测值小于预设阈值时,通过至少两个图像识别模型对所述目标数据进行识别,得到第一识别结果,所述至少两个图像识别模型为在线机器学习平台上通过除所述卷积神经网络之外的其它深度学习神经网络模型算法训练得到的模型,其中,所述在线机器学习平台为部署在云端的机器学习平台;
标记单元,用于当所述第一识别结果为识别成功时,将所述目标数据标记为第一样本数据;
更新单元,用于基于所述第一样本数据以及所述第一识别结果对所述目标图像识别模型进行更新。
可选地,所述装置还包括:
第一提示单元,用于当所述预测值大于或等于所述预设阈值时,基于所述目标图像对应的类型信息发出第一提示信息。
可选地,所述标记单元还用于:当所述预测值大于或等于所述预设阈值时,将所述目标数据标记为第二样本数据;
所述更新单元,还用于基于所述第二样本数据以及所述目标图像对应的预测值对所述目标图像识别模型进行更新。
可选地,所述装置还包括:
第二提示单元,用于当所述第一识别结果为识别失败时,基于所述目标图像发出第二提示信息。
可选地,所述更新单元还用于:
获取预设时长内所述第一识别结果为识别失败的图像集合;
根据用户的操作指令对所述图像集合进行识别,得到所述图像集合对应的第二识别结果;
基于所述图像集合以及所述第二识别结果对所述目标图像识别模型进行更新。
本申请第三方面提供了一种计算机装置,其包括至少一个连接的处理器、存储器和收发器,其中,所述存储器用于存储程序代码,所述程序代码由所述处理器加载并执行以实现上述所述的图像识别模型的更新方法的步骤。
本申请第四方面提供了一种计算机可读存储介质,其包括指令,当其在计算机上运行时,使得计算机执行上述所述的图像识别模型的更新方法的步骤。
综上所述,可以看出,本申请提供的实施例中,首先通过基于卷积神经网络的目标图像识别模型判断采集目标图像对应的目标数据是否识别成功,在识别失败的情况下,再通过云端机器学习平台提供至少两个图像模型对识别失败的目标数据进行重新识别,将识别成功的目标数据进行标记,积累识别成功的已标记的目标数据,自动更新目标图像识别模型,形成了闭环自主更新,通过不断循环的自我学习过程来更新目标图像识别模型,体现出自主学习趋势,大大提高了模型识别的精度和广度,可以解决了现有技术因训练样本有限而导致的可识别的垃圾的精度和数量不足的问题。
附图说明
图1为本申请实施例提供的基于卷积神经网络的模型架构图;
图2为本申请实施例提供的图像识别模型的更新方法的网络架构图;
图3为本申请实施例提供的图像识别模型的更新方法的一个流程示意图;
图4为本申请实施例提供的图像识别模型的更新方法的另一流程示意图;
图5为本申请实施例提供的图像识别模型的更新装置的虚拟结构示意图;
图6为本申请实施例提供的服务器的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征向量可以忽略,或不执行,另外,所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块之间的间接耦合或通信连接可以是电性或其他类似的形式,本申请中均不作限定。并且,作为分离部件说明的模块或子模块可以是也可以不是物理上的分离,可以是也可以不是物理模块,或者可以分布到多个电路模块中,可以根据实际的需要选择其中的部分或全部模块来实现本申请方案的目的。
云计算(cloud computing)是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。
作为云计算的基础能力提供商,会建立云计算资源池(简称云平台,一般称为基础设施即服务(Infrastructure as a Service,IaaS)平台,在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(为虚拟化机器,包含操作系统)、存储设备、网络设备。
按照逻辑功能划分,在IaaS层上可以部署平台即服务(Platform as a Service,PaaS)层,PaaS层之上再部署软件即服务(Software as a Service,SaaS)层,也可以直接将SaaS部署在IaaS上。PaaS为软件运行的平台,如数据库、web容器等。SaaS为各式各样的业务软件,如web门户网站、短信群发器等。一般来说,SaaS和PaaS相对于IaaS是上层。
下面对本申请涉及的一些名词进行解释说明:
卷积神经网络(Convolutional Neural Networks,CNN),神经网络的基本组成包括输入层、隐藏层、输出层,CNN在原来多层神经网络的基础上,加入了更加有效的特征学习部分,具体操作就是在原来的全连接层前面加入了卷积层与池化层,CNN出现,使得神经网络层数得以加深,“深度”学习由此而来。通常所说的深度学习,一般指的是这些CNN等新的结构以及一些新的方法(比如新的激活函数ReLU等)。它解决了传统多层神经网络的一些难以解决的问题,比如图片识别。图片由大量像素点构成,每个像素点又由RGB颜色值构成,用计算机识别图片,如果直接分析各个像素点和它们的颜色值,数据计算量就非常大,分析会很复杂和低效,卷积神经网络通过卷积运算快速从大量数据中提取出各种特征,然后用神经网络对浓缩后的数据进行快速分析,就能高效地处理图片。使用高性能图形处理器(Graphics Processing Unit,GPU)可以加速卷积神经网络的训练过程,传统的中央处理器(central processing unit,CPU)平台无法充分挖掘CNN的并行性,运算耗时长,且实现代价较高;
TensorFlow以及Keras是深度学习框架,相当于封装后的神经网络框架,使用该神经网络框架能够很简易的实现神经网络对应的代码,方便地构建和训练神经网络模型;
VGG Net是深度神经网络经典模型之一,VGGNet是牛津大学计算机视觉组和DeepMind公司共同研发一种深度卷积网络,并且在2014年在ILSVRC比赛上获得了分类项目的第二名和定位项目的第一名;
ResNet是深度神经网络经典模型之一,直接将深度拉到了152层,其主要的创新在于残差网络,其实这个深度神经网络的提出本质上是要解决层次比较深时无法训练的问题;
Inceptionv4是一种深度卷积神经网络,该神经网络模型既轻量又有很高的识别准确率,是目前比较新的经典模型,将深度和宽带融合到一起,在当下ILSVRC(ImageNetLarge Scale Visual Recognition Challenge的缩写,是近年来机器视觉领域最受追捧也是最具权威的学术竞赛之一,代表了图像领域的最高水平)图像分类基准测试中实现了最好的成绩,是将Inception v3与ResNet结合而成的;
GPU是专为执行复杂的数学和几何计算而设计的,特别适合于大规模并行运算,在深度学习领域一直发挥着巨大的作用,深度学习所依赖的是神经系统网络,特别卷积,残差网络,就是要在高速的状态下分析海量的数据,GPU能够迅速高效地实现海量数据的快速处理;
腾讯云智能钛弹性模型服务(Tencent Intelligence Elastic Model Service,TI-EMS)是具备虚拟化异构算力和弹性扩缩容能力的无服务器化机器在线推理平台,能够帮助客户解决模型部署复杂、资源浪费、手工扩展资源效率低下的问题。
TI-ONE是腾讯云智能钛机器学习平台是为人工智能(Artificial Intelligence,AI)工程师打造的一站式机器学习服务平台,为用户提供从数据预处理、模型构建、模型训练、模型评估的全流程开发及部署支持。智能钛机器学习平台内置丰富的算法组件,支持多种深度学习算法框架,满足多种AI应用场景的需求。
腾讯云对象存储(Cloud Object Storage,COS)是腾讯云提供的一种存储海量文件的分布式存储服务,具有高扩展性、低成本、可靠安全等优点。
下面对本申请实施例提供的基于卷积神经网络的模型进行说明,请参阅图1,图1为本申请实施例提供的基于卷积神经网络的模型架构图,包括:101输入层101、卷积层102(convolution layer)、池化层103(pooling layer)、卷积层104、池化层105、全连接层106(fully Connected layer)、全连接层107以及输出层108,人工整理好足量合适大小的垃圾图像样本后,将垃圾图像的RGB值,作为计算机卷积神经网络模型的输入参数,经过一定的训练时间后形成合适的模型。也即,通过输入层101将图像输入,最终经过卷积层102、池化层103、卷积层104、池化层105、全连接层106以及全连接层107,最终通过输出层108得到输出结果,如图1所示的得到的识别结果为:dog(0.01),也即图像为狗的概率是0.01;cat(0.04)图像为猫的概率是0.04,boat(0.94)图像为船的概率0.94,bird(0.02)图像为鸟的概率是0.02。腾讯云Ti-one机器学习平台提供了深度学习框架,提供了完整的封装模型和预学习的权重。腾讯云Ti-ems负责将此模型部署为在线服务,部署完成后,用户可通过在线服务识别输入图片的内容。
请参阅图2,图2为本申请实施例提供的图像识别模型的更新方法的网络架构图,该图像识别模型可以用户对垃圾图像进行分类识别,也可以识别其他的图像的分类识别,具体不做限定,为例描述简便,下面以垃圾图像的分类识别为例进行说明。
如图2所示,本地端201只需要摄像头2011、显示器2012以及网络通信wifi模块(图中2中未显示),摄像头2011用于将拍摄到的垃圾照片发送至云端cos对象存储202上,在线机器学习平台203(例如腾讯云智能钛机器学习平台TI-ONE,当然也还可以是其他的在线机器学习平台,具体不做限定)构建基于残差的卷积神经网络的垃圾识别模型(图中未显示),并且通过云端强大GPU算力对垃圾识别模型进行训练,然后通过机器在线推理平台204(例如腾讯云TI-EMS)发布为在线垃圾识别服务,提供Restful API接口,给前端程序调用识别垃圾照片把结果返回。
在线垃圾识别服务会抓取垃圾照片特征,进行图像预处理,将预处理后的垃圾样本图像数据作为垃圾识别模型的输入参数,与已训练垃圾识别模型进行比对,根据比对结果,打出预测值,预测值超过阀值以上的,将被判为可回收物。同时将识别成功的垃圾样本图像数据进行标记,积累识别成功的已标记垃圾样本图像数据,更新垃圾识别模型。将识别失败的垃圾样本图像数据在线传输给在线机器学习平台203上其它深度学习神经网络模型算法进行识别标记,积累识别失败的已标记垃圾样本图像数据,进行训练,再去更新垃圾识别模型,形成闭环自主更新。垃圾识别模型自主更新后,同时通过机器在线推理平台204发布更新垃圾识别服务。通过不断循环的学习过程来自动更新垃圾识别模型,体现出自我学习趋势,大大提高了垃圾识别的范围和准确度,解决了因训练样本有限和计算能力有限而导致的可识别的垃圾的准确度和种类的不足的问题。在线机器学习平台203可以将垃圾识别结果保存在云数据库205中,供云端商业智能BI分析平台206做数据分析,BI分析平台通过垃圾数据分析进行溯源并智能推荐,提供给的用户相应商品优惠折扣二维码,例如通过云端商业智能BI分析平台206对垃圾数据进行分析得到某个区域(例如是某个街区或者某个小区)的垃圾分类识别中,某个品牌的矿泉水瓶子最多,可以向该区域内用户广播对应品牌的商业优惠折扣二维码。
请参阅图3,图3为本申请实施例提供的图像识别模型的更新方法的一个流程示意图,如图3所示,垃圾识别服务302获取到垃圾样本图像301,并将图像预处理后的垃圾样本图像数据作为基于卷积神经网络的垃圾识别模型303的输入参数,根据比对结果,将对比结果与设定的阈值进行对比,若大于或等于该设定阈值,则执行垃圾分类提示304,也即将垃圾样本图像对应的类型信息反馈给垃圾分类提示装置进行展示,例如该垃圾样本图像中的垃圾可回收垃圾还是不可回收垃圾,是塑料、金属还是其他类型的垃圾等等类型信息;若对比结果小于该设定的阈值,则确定该基于卷积神经网络的垃圾识别模型303识别失败,此时图像预处理后的垃圾样本图像数据通过腾讯云Ti-one在线机器学习平台305提供基于tensorflow框架的ResNet模型、Densenet模型、VGG net模型和基于pytorch框架的Inception V3/V4模型对识别失败的垃圾样本图像数据再次进行识别,并将再次识别成功的垃圾样本图像数据进行标记,并将垃圾相应类型信息执行垃圾分类提示304,同时积累识别成功的已标记垃圾样本图像数据,重新加入训练并通过Ti-ems在线推理平台306重新发布该垃圾识别模型。另外,该COS对象存储307可以存储垃圾样本图像301以及通过Ti-ONE在线机器学习平台识别的与垃圾样本图像301对应的分类信息。
下面从图像识别模型的更新装置的角度对本申请实施例中图像识别模型的更新方法进行说明,该图像识别模型的更新装置可以为服务器,也可以为服务器中的服务单元,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
请参阅图4,图4为本申请实施例提供的图像模型的更新装置的另一流程示意图,包括:
401、对目标图像进行图像预处理得到目标数据。
本实施例中,图像模型的更新装置可以首先获取目标图像,之后对该目标图像进行图像预处理得到目标数据,该目标图像为待识别的图像。此处具体不限定获取目标图像的方式,如图2所示,本地端201通过摄像头2011可以拍摄到垃圾图像,之后本地端201通过网络通信wifi模块将垃圾图像发送至图像识别模型的更新装置。
402、将目标数据输入目标图像识别模型,得到目标图像对应的预测值。
本实施例中,图像识别模型的更新装置在得到目标数据之后,可以将该目标数据输入目标图像识别模型,以得到目标图像对应的预测值,如该目标图像为垃圾图像,该目标图像识别模型为垃圾识别模型,当然也还可以为其他的识别模型,具体不做限定,该预测值例如可以为垃圾图像中的垃圾为塑料的概率为90%,当然也还可以是多个预测值,垃圾图像中的垃圾为金属的概率以及为纸张的概率等等。
需要说明的是,该目标图像识别模型为部署在云端通过卷积神经网络构建的模型,例如该目标图像识别模型为通过腾讯云Ti-EMS部署的模型,腾讯云Ti-EMS是一个在线推理、弹性模型服务平台,用户可以在平台上部署自己的模型,并且可以根据自身业务的特点进行服务的弹性伸缩配置。它是具备虚拟化异构算力和弹性扩缩容能力的在线推理平台,能够帮助客户解决模型部署复杂、资源浪费、手工扩展资源效率低下的问题。客户通过使用Ti-EMS可以实现模型一键部署,自动调整弹性计算资源。在大规模图像处理场景(如图像分类业务)中,Ti-EMS可以全面利用异构资源池,结合模型加速优化和框架优化技术,提高大规模图像处理服务在线推理效率。
403、当预测值小于预设阈值时,通过至少两个图像识别模型对目标数据进行识别,得到第一识别结果。
本实施例中,图像识别模型的更新装置将目标数据输入目标图像识别模型得到目标图像对应的预测值之后,可以将该预测值与预设阈值进行对比,且当预测值小于预设阈值时,通过至少两个图像识别模型对目标数据进行识别得到第一识别结果,其中,该至少两个图像识别模型为在线机器学习平台上通过除卷积神经网络之外的其他深度学习神经网络模型算法训练得到的模型,其中,该在线机器学习平台为部署在云端的机器学习平台。也就是说,如果该目标图像对应的预测值小于该预设阈值,则说明该目标图像通过目标图像识别装置没有识别出来,此时,可以将该目标数据通过至少两个图像识别模型进行识别,得到识别结果。
需要说明的是,该在线机器学习平台可以为腾讯云Ti-one在线机器学习平台,当然也可以为其他的在线机器学习平台,具体不限定,该腾讯云Ti-one提供基于tensorflow深度学习框架实现ResNet算法模型、Densenet模型、VGG net模型和Inception V3/V4模型对图像识别模型识别失败的目标数据进行再次识别,得到识别结果。
404、当第一识别结果为识别成功时,将目标数据标记为第一样本数据。
本实施例中,当通过至少两个图像识别模型对目标数据进行识别,且识别成功时,将目标数据标记为第一样本数据。
需要说明的是,通过至少两个图像识别模型进行识别时,当得到目标图像对应的预测值大于该预设阈值,则说明该至少两个图像识别模型对目标图像识别成功,例如该预设阈值为90%,该以垃圾图像为例进行说明,该目标图像对应的预测值为垃圾图像对应的垃圾为塑料的概率为95,%,则说明识别成功,若该预测值为塑料:5%,金属:%14,其他3%,都小于预设阈值,则说明识别失败。当识别失败时,则基于目标图像发出第二提示信息,也就是说,当对目标图像再次识别失败时,则发出提示信息,通知管理员,该目标图像无法识别。
一个实施例中,图像识别模型的更新装置可以获取预设时长内第一识别结果为识别失败的图像集合;并根据用户的操作指令对目标图像集合进行识别,得到图像集合对应的第二识别结果;基于该图像集合以及第二识别结果对目标图像识别模型进行更新。
也就是说,可以提取预设时长(该预设时长例如可以为1天)内两次图像识别都没有办法识别的图像的集合,由人工参与进行识别,并将人工识别的结果与该图像加入到目标图像识别模型进行重新训练,提高模型的识别准确率。
405、基于第一样本数据以及第一识别结果对目标图像识别模型进行更新。
本实施例中,图像识别模型的更新装置在对目标图像二次识别成功之后,可以将该目标数据标记为第一样本数据,并基于第一样本数据以及第一识别结果对目标图像识别模型进行更新。也即将目标数据作为样本训练数据对目标图像识别模型进行再次训练,得到训练后的目标图像识别模型,之后,发布为线上识别服务。
一个实施例中,当目标图像对应的预测值大于或等于预设阈值时,则基于目标图像对应的类型信息发出第一提示信息。
本实施例中,当目标图像对应的预测值大于或等于预设阈值时,则说明该目标图像通过目标图像识别模型识别成功,则可以基于该目标图像对应的类型信息发出第一提示信息。例如将该目标图像对应的类型信息(该类型信息例如可以为该垃圾为可回收垃圾、塑料、不可回收、有害或者无害等等类型信息,当然也还可以是其他的类型信息具体不做限定)在图2所示的显示器202中显示。
一个实施例中,当该预测值大于或等于预设阈值时,将目标数据标记为第二样本数据;
基于该第二样本数据以及目标图像对应的预测值对目标图像识别模型进行更新。
本实施例中,当该预测值大于或等于预设阈值,则说明该目标图像识别成功,此时可以将该目标数据作为训练样本对目标图像识别模型进行更新。
需要说明的是,在实际应用中,可以周期性的提取识别成功的图像数据对目标图像识别模型进行更新,例如每天提取识别成功的图像数据对目标图像识别模型进行更新,以提高目标图像识别模型的准确率。
综上所述,可以看出,本申请提供的实施例中,首先通过基于卷积神经网络的目标图像识别模型判断采集目标图像对应的目标数据是否识别成功,在识别失败的情况下,再通过云端机器学习平台提供至少两个图像识别模型对识别失败的目标数据进行重新识别,将识别成功的目标数据进行标记,积累识别成功的已标记的目标数据,自动更新目标图像识别模型,形成了闭环自主更新,通过不断循环的自我学习过程来更新目标图像识别模型,体现出自主学习趋势,大大提高了识别的精度和广度,可以解决了现有技术因训练样本有限而导致的可识别的垃圾的精度和数量不足的问题。
上面从的图像识别模型的更新方法的角度对本申请进行说明,下面从图像识别模型的更新装置的角度对本申请进行说明。
请参阅图5,图5为本申请实施例提供的一种图像识别模型的更新装置的虚拟结构示意图,包括:
预处理单元501,用于对目标图像进行图像预处理得到目标数据,所述目标图像为待识别的图像;
第一识别单元502,用于将所述目标数据输入目标图像识别模型,得到所述目标图像对应的预测值,所述目标图像识别模型为部署在云端通过卷积神经网络构建的模型;
第二识别单元503,用于当所述预测值小于预设阈值时,通过至少两个图像识别模型对所述目标数据进行识别,得到第一识别结果,所述至少两个图像识别模型为在线机器学习平台上通过除所述卷积神经网络之外的其它深度学习神经网络模型算法训练得到的模型,其中,所述在线机器学习平台为部署在云端的机器学习平台;
标记单元504,用于当所述第一识别结果为识别成功时,将所述目标数据标记为第一样本数据;
更新单元505,用于基于所述第一样本数据以及所述第一识别结果对所述目标图像识别模型进行更新。
可选地,所述装置还包括:
第一提示单元506,用于当所述预测值大于或等于所述预设阈值时,基于所述目标图像对应的类型信息发出第一提示信息。
可选地,所述标记单元504还用于:当所述预测值大于或等于所述预设阈值时,将所述目标数据标记为第二样本数据;
所述更新单元,还用于基于所述第二样本数据以及所述目标图像对应的预测值对所述目标图像识别模型进行更新。
可选地,所述装置还包括:
第二提示单元507,用于当所述第一识别结果为识别失败时,基于所述目标图像发出第二提示信息。
可选地,所述更新单元505还用于:
获取预设时长内所述第一识别结果为识别失败的图像集合;
根据用户的操作指令对所述图像集合进行识别,得到所述图像集合对应的第二识别结果;
基于所述图像集合以及所述第二识别结果对所述目标图像识别模型进行更新。
综上所述,可以看出,本申请提供的实施例中,首先通过基于卷积神经网络的目标图像识别模型判断采集目标图像对应的目标数据是否识别成功,在识别失败的情况下,再通过云端机器学习平台提供至少两个图像识别模型对识别失败的目标数据进行重新识别,将识别成功的目标数据进行标记,积累识别成功的已标记的目标数据,自动更新目标图像识别模型,形成了闭环自主更新,通过不断循环的自我学习过程来更新目标图像识别模型,体现出自主学习趋势,大大提高了模型识别的精度和广度,可以解决了现有技术因训练样本有限而导致的可识别的垃圾的精度和数量不足的问题。
图6是本申请实施例提供的一种服务器结构示意图,该服务器600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)622(例如,一个或一个以上处理器)和存储器632,一个或一个以上存储应用程序642或数据644的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器632和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器622可以设置为与存储介质630通信,在服务器600上执行存储介质630中的一系列指令操作。
服务器600还可以包括一个或一个以上电源626,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口658,和/或,一个或一个以上操作系统641,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由图像识别模型的更新装置所执行的步骤可以基于该图6所示的服务器结构。
本申请实施例还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述所述图像识别模型的更新方法的步骤。
本申请实施例还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述图像识别模型的更新方法的步骤。
本申请实施例还提供了一种终端设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,所述程序代码由所述处理器加载并执行以实现上述所述图像识别模型的更新方法的步骤。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行上述所述图像识别模型的更新方法的步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种图像识别模型的更新方法,其特征在于,包括:
对目标图像进行图像预处理得到目标数据,所述目标图像为待识别的图像;
将所述目标数据输入目标图像识别模型,得到所述目标图像对应的预测值,所述目标图像识别模型为部署在云端通过卷积神经网络构建的模型;
当所述预测值小于预设阈值时,通过至少两个图像识别模型对所述目标数据进行识别,得到第一识别结果,所述至少两个图像识别模型为在线机器学习平台上通过除所述卷积神经网络之外的其它深度学习神经网络模型算法训练得到的模型,其中,所述在线机器学习平台为部署在云端的机器学习平台;
当所述第一识别结果为识别成功时,将所述目标数据标记为第一样本数据;
基于所述第一样本数据以及所述第一识别结果对所述目标图像识别模型进行更新。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述预测值大于或等于所述预设阈值时,基于所述目标图像对应的类型信息发出第一提示信息。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
当所述预测值大于或等于所述预设阈值时,将所述目标数据标记为第二样本数据;
基于所述第二样本数据以及所述目标图像对应的预测值对所述目标图像识别模型进行更新。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述第一识别结果为识别失败时,基于所述目标图像发出第二提示信息。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
获取预设时长内所述第一识别结果为识别失败的图像集合;
根据用户的操作指令对所述图像集合进行识别,得到所述图像集合对应的第二识别结果;
基于所述图像集合以及所述第二识别结果对所述目标图像识别模型进行更新。
6.一种图像识别模型的更新装置,其特征在于,包括:
预处理单元,用于对目标图像进行图像预处理得到目标数据,所述目标图像为待识别的图像;
第一识别单元,用于将所述目标数据输入目标图像识别模型,得到所述目标图像对应的预测值,所述目标图像识别模型为部署在云端通过卷积神经网络构建的模型;
第二识别单元,用于当所述预测值小于预设阈值时,通过至少两个图像识别模型对所述目标数据进行识别,得到第一识别结果,所述至少两个图像识别模型为在线机器学习平台上通过除所述卷积神经网络之外的其它深度学习神经网络模型算法训练得到的模型,其中,所述在线机器学习平台为部署在云端的机器学习平台;
标记单元,用于当所述第一识别结果为识别成功时,将所述目标数据标记为第一样本数据;
更新单元,用于基于所述第一样本数据以及所述第一识别结果对所述目标图像识别模型进行更新。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第一提示单元,用于当所述预测值大于或等于所述预设阈值时,基于所述目标图像对应的类型信息发出第一提示信息。
8.根据权利要求7所述的装置,其特征在于,标记单元还用于:当所述预测值大于或等于所述预设阈值时,将所述目标数据标记为第二样本数据;
所述更新单元,还用于基于所述第二样本数据以及所述目标图像对应的预测值对所述目标图像识别模型进行更新。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二提示单元,用于当所述第一识别结果为识别失败时,基于所述目标图像发出第二提示信息。
10.一种计算机可读存储介质,其特征在于,包括指令,当所述指令在计算机上运行时,使得计算机执行上述权利要求1至5中任一项所述的图像识别模型的更新方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010533118.6A CN111695630A (zh) | 2020-06-11 | 2020-06-11 | 一种图像识别模型的更新方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010533118.6A CN111695630A (zh) | 2020-06-11 | 2020-06-11 | 一种图像识别模型的更新方法及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111695630A true CN111695630A (zh) | 2020-09-22 |
Family
ID=72480567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010533118.6A Pending CN111695630A (zh) | 2020-06-11 | 2020-06-11 | 一种图像识别模型的更新方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111695630A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112396042A (zh) * | 2021-01-20 | 2021-02-23 | 鹏城实验室 | 实时更新的目标检测方法及系统、计算机可读存储介质 |
CN112769811A (zh) * | 2020-12-30 | 2021-05-07 | 北京天融信网络安全技术有限公司 | 一种隐蔽信道检测模型更新方法及装置 |
CN113435406A (zh) * | 2021-07-15 | 2021-09-24 | 支付宝(杭州)信息技术有限公司 | 实现隐私保护的人脸识别方法及装置 |
CN114140802A (zh) * | 2022-01-29 | 2022-03-04 | 北京易真学思教育科技有限公司 | 一种文本识别方法、装置、电子设备和存储介质 |
CN115100631A (zh) * | 2022-07-18 | 2022-09-23 | 浙江省交通运输科学研究院 | 一种多源信息复合特征提取的道路地图采集系统与方法 |
CN115170840A (zh) * | 2022-09-08 | 2022-10-11 | 阿里巴巴(中国)有限公司 | 数据处理系统、方法和电子设备 |
-
2020
- 2020-06-11 CN CN202010533118.6A patent/CN111695630A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112769811A (zh) * | 2020-12-30 | 2021-05-07 | 北京天融信网络安全技术有限公司 | 一种隐蔽信道检测模型更新方法及装置 |
CN112396042A (zh) * | 2021-01-20 | 2021-02-23 | 鹏城实验室 | 实时更新的目标检测方法及系统、计算机可读存储介质 |
CN113435406A (zh) * | 2021-07-15 | 2021-09-24 | 支付宝(杭州)信息技术有限公司 | 实现隐私保护的人脸识别方法及装置 |
CN114140802A (zh) * | 2022-01-29 | 2022-03-04 | 北京易真学思教育科技有限公司 | 一种文本识别方法、装置、电子设备和存储介质 |
CN114140802B (zh) * | 2022-01-29 | 2022-04-29 | 北京易真学思教育科技有限公司 | 一种文本识别方法、装置、电子设备和存储介质 |
CN115100631A (zh) * | 2022-07-18 | 2022-09-23 | 浙江省交通运输科学研究院 | 一种多源信息复合特征提取的道路地图采集系统与方法 |
CN115170840A (zh) * | 2022-09-08 | 2022-10-11 | 阿里巴巴(中国)有限公司 | 数据处理系统、方法和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111695630A (zh) | 一种图像识别模型的更新方法及相关设备 | |
CN109344884B (zh) | 媒体信息分类方法、训练图片分类模型的方法及装置 | |
KR102469261B1 (ko) | 적응적 인공 신경 네트워크 선택 기법들 | |
WO2019232099A1 (en) | Neural architecture search for dense image prediction tasks | |
JP2018501579A (ja) | 画像の内容の意味表現 | |
CN111382555A (zh) | 数据处理方法、介质、装置和计算设备 | |
US11803971B2 (en) | Generating improved panoptic segmented digital images based on panoptic segmentation neural networks that utilize exemplar unknown object classes | |
CN111241850B (zh) | 提供业务模型的方法及装置 | |
CN107992937B (zh) | 基于深度学习的非结构化数据判决方法和装置 | |
CN108549909B (zh) | 基于众包的对象分类方法及对象分类系统 | |
CN112380955B (zh) | 动作的识别方法及装置 | |
CN113761220A (zh) | 信息获取方法、装置、设备及存储介质 | |
CN115512360A (zh) | 文本识别方法、装置、设备及存储介质 | |
CN115062709A (zh) | 模型优化方法、装置、设备、存储介质及程序产品 | |
CN113128526B (zh) | 图像识别方法、装置、电子设备和计算机可读存储介质 | |
CN112347976B (zh) | 遥感卫星影像的区域提取方法、装置、电子设备和介质 | |
CN117726884A (zh) | 对象类别识别模型的训练方法、对象类别识别方法及装置 | |
CN113674152A (zh) | 图像处理方法、装置、电子设备和计算机可读存储介质 | |
CN112988954A (zh) | 文本分类方法、装置、电子设备和计算机可读存储介质 | |
US20230229963A1 (en) | Machine learning model training | |
CN116484105B (zh) | 业务处理方法、装置及计算机设备、存储介质、程序产品 | |
CN114049161B (zh) | 基于电商大数据反馈的推送优化方法及电商大数据系统 | |
CN114449342A (zh) | 视频推荐方法、装置、计算机可读存储介质和计算机设备 | |
CN113535946A (zh) | 基于深度学习的文本鉴别方法、装置、设备及存储介质 | |
US11074591B2 (en) | Recommendation system to support mapping between regulations and controls |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |