CN117036720A - 图像数据处理方法、装置、设备及存储介质 - Google Patents
图像数据处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117036720A CN117036720A CN202211324086.4A CN202211324086A CN117036720A CN 117036720 A CN117036720 A CN 117036720A CN 202211324086 A CN202211324086 A CN 202211324086A CN 117036720 A CN117036720 A CN 117036720A
- Authority
- CN
- China
- Prior art keywords
- image
- model
- network processing
- image recognition
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 title claims abstract description 25
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 394
- 238000000034 method Methods 0.000 claims abstract description 63
- 238000002372 labelling Methods 0.000 claims description 79
- 238000004590 computer program Methods 0.000 claims description 27
- 238000004873 anchoring Methods 0.000 claims description 8
- 238000000586 desensitisation Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 15
- 238000013473 artificial intelligence Methods 0.000 abstract description 12
- 238000010586 diagram Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 14
- 238000012549 training Methods 0.000 description 12
- 238000012360 testing method Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000001680 brushing effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 210000000887 face Anatomy 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Bioethics (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种图像数据处理方法、装置、设备及存储介质,该方法可以应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景中,其中,该方法包括:获取用于识别目标图像的目标图像识别模型;目标图像识别模型包括M个网络处理层;确定M个网络处理层分别对目标图像中的图像特征的抽象程度;根据M个网络处理层分别对应的抽象程度,对M个网络处理层进行划分,得到第一图像识别子模型和第二图像识别子模型;将第一图像识别子模型部署在用于协同部署目标图像识别模型的终端中,将第二图像识别子模型部署在用于协同部署目标图像识别模型的服务器中。本申请在避免泄露图像中的隐私数据的情况下,提高图像识别的精度。
Description
技术领域
本申请涉及人工智能、车联网等技术领域,尤其涉及一种图像数据处理方法、装置、设备及存储介质。
背景技术
目前,在图像识别场景中,为了避免原始图像中隐私数据泄露,通常需要终端将原始图像进行加密,将加密后的原始图像上传至服务器,由服务器对加密后的原始图像进行识别处理,得到识别结果。实践中发现,由于经过加密后的原始图像中的内容存在一定程度的失真,直接对加密后的原始图像进行识别处理,会导致识别结果的精度较低。
发明内容
本申请实施例提供一种图像数据处理方法、装置、设备及存储介质,在避免泄露图像中的隐私数据的情况下,提高图像识别的精度。
本申请实施例一方面提供一种图像数据处理方法,包括:
获取用于识别目标图像的目标图像识别模型;上述目标图像识别模型包括M个网络处理层;
确定上述M个网络处理层分别对上述目标图像中的图像特征的抽象程度;
根据上述M个网络处理层分别对应的抽象程度,对上述M个网络处理层进行划分,得到第一图像识别子模型和第二图像识别子模型;
将上述第一图像识别子模型部署在用于协同部署上述目标图像识别模型的终端中,将上述第二图像识别子模型部署在用于协同部署上述目标图像识别模型的服务器中;上述终端用于调用上述第一图像识别子模型提取上述目标图像的底层特征图,上述服务器用于从上述终端中获取上述底层特征图,调用上述第二图像识别子模型对上述底层特征图进行对象识别,得到上述目标图像中的目标对象的对象属性。
本申请实施例一方面提供一种图像数据处理装置,包括:
获取模块,用于获取用于识别目标图像的目标图像识别模型,以及用于协同部署上述目标图像识别模型的终端的图像处理性能参数;上述目标图像识别模型包括M个网络处理层;
确定模块,用于确定上述M个网络处理层分别对上述目标图像中的图像特征的抽象程度;
划分模块,用于根据上述M个网络处理层分别对应的抽象程度以及上述终端的图像处理性能参数,对上述M个网络处理层进行划分,得到第一图像识别子模型和第二图像识别子模型;
部署模块,用于将上述第一图像识别子模型部署在上述终端中,将上述第二图像识别子模型部署在用于协同部署上述目标图像识别模型的服务器中;上述终端用于调用上述第一图像识别子模型提取上述目标图像的底层特征图,上述服务器用于从上述终端中获取上述底层特征图,调用上述第二图像识别子模型对上述底层特征图进行对象识别,得到上述目标图像中的目标对象的对象属性。
本申请实施例一方面提供了一种计算机设备,包括存储器和处理器,上述存储器存储有计算机程序,上述处理器执行上述计算机程序时实现上述的方法的步骤。
本申请实施例一方面提供了一种计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现上述的方法的步骤。
本申请实施例一方面提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
本申请中,基于目标图像识别模型的各个网络处理层针对目标图像中的图像特征的抽象程度,自适应地对目标图像识别模型划分,实现将目标图像识别模型的部分网络处理层(即第一图像识别子模型)部署在终端中,将目标图像识别模型的另一部分网络处理层(即第二图像识别子模型)部署在服务器端中,实现目标图像识别模型的协同部署,不需要将目标识别模型的所有网络处理层均部署在终端中,降低终端的图像处理压力。此处的抽象程度用于反映用户从网络处理层输出的图像特征中能够分辨出目标图像中的目标对象(或目标对象的对象属性)的难度,即网络处理层对应的抽象程度越高,用户从网络处理层输出的图像特征中更加难以分辨出目标图像中的目标对象;反之,网络处理层对应的抽象程度越低,用户从网络处理层输出的图像特征中更容易分辨出目标图像中的目标对象。即基于该抽象程度划分得到的第一图像识别子模型用于输出的目标图像的底层特征图,从该底层特征图中不能分辨出目标图像中的目标对象(或目标对象的对象属性),因此,在终端需要识别目标图像中的目标对象的对象属性时,只需要终端将底层特征图上传至服务器,由服务器通过第二图像识别子模型对底层特征图进行对象识别,得到目标对象的对象属性,不需要终端将原始的目标图像上传至服务器,这样可以避免目标图像中的隐私数据泄露,同时提高图像识别的精度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的一种图像数据处理系统的架构示意图;
图2是本申请提供的一种图像数据处理方法的流程示意图;
图3是本申请提供的一种图像数据处理系统中的各个设备之间交互场景系示意图;
图4是本申请提供的一种图像数据处理系统中的各个设备之间交互场景系示意图;
图5是本申请提供的一种图像数据处理方法的流程示意图;
图6是本申请提供的一种图像数据处理方法的流程示意图;
图7是本申请提供的一种训练初始图像识别模型的场景示意图;
图8是本申请提供的一种目标图像识别模型的结构示意图;
图9是本申请实施例提供的一种图像数据处理装置的结构示意图;
图10是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请主要应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景中,例如,计算机设备可以利用人工智能技术识别目标图像中道路中的车辆进行识别,得到道路中的车辆数量,基于道路中的车辆数量确定道路的车流量,进而,根据车流量实现车辆管理。
可理解的是,上述人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
为了便于更清楚理解本申请,首先介绍实现本申请的图像数据处理方法的图像数据处理,如图1所示,该图像数据处理中包括服务器10和终端集群,终端集群可以包括一条或者多条终端,这里将不对终端的数量进行限制。如图1所示,终端集群具体可以包括终端1、终端2、…、终端n;可以理解的是,终端1、终端2、终端3、…、终端n均可以与服务器10进行网络连接,以便于每条终端均可以通过网络连接与服务器10之间进行数据交互。
可理解的是,目标终端和服务器可以是用于协同部署目标图像识别模型的设备,目标终端中可以用于部署目标图像识别模型的小部分计算量,服务器用于部署目标图像识别模型的大部分计算量。此处的目标终端可以上述终端集群中的任一终端,即目标终端用于部署目标图像识别模型的第一图像识别子模型,服务器用于部署目标图像识别模型的第二图像识别子模型,第一图像识别子模型用于提取图像的底层特征图,第二图像识别子模型用于对底层特征图进行对象识别,得到目标图像中的目标对象的对象属性,由服务器将目标对象的对象属性返回给目标终端。这样在终端获取到目标图像之后,只需要将目标图像的底层特征图上传至服务器,不需要将原始的目标图像上传至服务器,可以避免目标图像中的隐私数据泄露。通过目标终端和服务器协同部署目标图像识别模型,避免受限于目标终端的图像处理性能,只能部署轻量化的目标图像识别模型,即此处的目标图像识别模型可以是指非轻量化的图像识别模型,通过非量化的图像识别模型来对目标图像进行识别,提高图像识别的精度。
可理解的是,随着个人隐私数据得到原来越多的关注及相关法律法规的落地,隐私数据的保护有了更明确的要求,例如手机、车辆、机器人等采集端获取的信息(如图像)都需要抹除隐私数据再交给下游使用,本发明提出的隐私计算方法有且不限于以下产品表现:(1)手机人脸验证识别。手机侧很多应用都有刷脸登录功能,刷脸需要图像识别模型具有较高精度来避免人脸误识别,保证登录信息的安全。但由于手机的算力有限,难以直接部署大计算量的高精度图像识别模型,利用本申请的方法,可以使用少量的计算量在手机上提取人脸底层特征图,然后将不带人脸原始信息的底层特征图传到远端(如服务器)继续推理,判断人脸是否识别成功,最后将识别结果反馈给手机侧。
(2)训练数据回传。自动驾驶、高级辅助驾驶的需要使用图像识别模型检测出行驶场景中的行人、车辆、车道线、交通牌、交通灯、可行驶区域等目标对象,这些图像识别模型的开发和迭代需要用到大量的图像数据,如果只依赖专用图像数据采集车来采集显然是不能满足需求的。这时可以将市场上量产车拍到的图像回传,由于量产车数量多且分布广,对图像数据的数量和多样性都有较强保证。而从车端回传的图像会包含车牌、人脸等隐私或敏感的信息,需要先进行脱敏处理。使用本申请提出的方法,同样可以在车端用较低的计算代价提取图像底层特征图,底层特征图传输到云端后继续完成推理,然后再把感知结果反馈给车端。车端根据感知结果,对图像内隐私或敏感的信息区域进行打码处理,然后将打码后的图像传输到云端,供后续标注和训练等使用。
其中,服务器可以是独立的一条物理服务器,也可以是至少两条物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、中容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端具体可以是指车载终端、智能手机、平板电脑、笔记本电脑、桌上型电脑、智能音箱、有屏音箱、智能手表等等,但并不局限于此。各条终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,同时,终端以及服务器的数量可以为一条或至少两条,本申请在此不做限制。
可理解的是,基于上述图像数据处理系统能够实现本申请中的图像数据处理方法,以车联网的应用场景为例,如图2、图3和图4所示,对本申请的图像处理方法进行说明,如图2、图3和图4所示,该图像处理方法包括图像识别模型的训练过程和图像识别模型的推理过程。图2、图4中的终端30a可以是指图1中的终端集群中的任一终端,图2、图3以及图4中的服务器31a可以是指图1中的服务器10。如图2所示,图像识别模型的训练过程包括如下步骤S21~S22:
S21、训练初始图像识别模型,得到目标图像识别模型。具体的,请一并参见图3所示,服务器31a获取训练数据集,该训练数据集包括K个样本图像,以及一个每个样本图像中的行驶道路的标注道路属性,K大于或等于1的正整数。此处的样本图像可以是指对行驶道路进行拍摄得到的图像,行驶道路可以是指样本图像中的样本对象,标注道路属性可以是指样本对象的标注对象属性。标注道路属性可以是指行驶道路中的行驶道路的置信度、车辆信息、车道信息、交通指示信息、行人信息等等中的一种或多种,车辆信息可以包括车辆的类型、尺寸、位置等等,车道信息可以包括车道线等等,交通指示信息包括交通牌、交通灯等等,行人信息包括行驶道路中的行人数量等等。行驶道路的置信度用于反映对应样本图像中包含行驶道路的概率,即样本图像中包含行驶道路的概率越高,则该样本图像中的行驶道路的置信度越高,样本图像中包含行驶道路的概率越低,则该样本图像中的行驶道路的置信度越低。标注道路属性可以是指人工对样本图像进行标注得到的,样本图像1、样本图像2、……、样本图像K分别对应的标注道路属性分别为标注道路属性1、标注道路属性2、……、标注道路属性K。
可理解的是,此处K个样本图像可以是指在不同时间下对同一行驶道路进行拍摄得到的图像,或者,K个样本图像可以是指在同一时间下对不同行驶道路进行拍摄得到的图像,或者,K个样本图像可以是指在同一时间下以不同视角,对同一行驶道路进行拍摄得到的图像。
服务器31a可以通过初始图像识别模型,获取K个样本图像数据中的行驶道路的道路属性。具体的,服务器31a将训练数据集中的样本图像1输入至初始图像识别模型中,通过初始图像识别模型对样本图像1进行对象预测,得到样本图像1中的行驶道路的预测道路属性1,此处的预测道路属性1可以包括样本图像1中的行驶道路中的车辆信息、车道信息、交通指示信息、行人信息中的一种或多种。服务器31a将训练数据集中的样本图像2输入至初始图像识别模型中,通过初始图像识别模型对样本图像2进行对象预测,得到样本图像2中的行驶道路的预测道路属性2,此处的预测道路属性2可以包括样本图像2中的行驶道路中的车辆信息、车道信息、交通指示信息、行人信息中的一种或多种,以此类推,服务器31a可以获取K个样本图像分别对应的预测道路属性。
进一步,服务器31a获取到K个样本图像分别对应的标注道路属性和预测道路属性后,可以根据K个样本图像分别对应的标注道路属性和预测道路属性,确定初始图像识别模型的对象识别误差,根据该对象识别误差,对初始图像识别模型进行调整,得到用于识别目标图像的目标图像识别模型。此处的目标图像可以是指针对目标行驶道路拍摄得到的图像。
S22、将目标图像识别模型划分到终端30a和服务器31a。具体的,请一并参见图4所示,为了降低终端30a部署目标图像识别模型的压力,且为了避免终端30a将原始的目标图像上传至服务器31a,服务器31a可以与终端30a协同部署该目标图像识别模型。具体的,该目标图像识别模型包括M个网络处理层,M个网络处理层包括图像输入层、识别结果输出层以及其他处理层,服务器30a可以获取M个网络处理层分别对目标图像中的图像特征的抽象程度,此处的抽象程度用于反映用户从网络处理层输出的图像特征中能够分辨出目标图像中的行驶道路的道路属性的难度,即网络处理层对应的抽象程度越高,用户从网络处理层输出的图像特征中更加难以分辨出目标图像中的行驶道路的道路属性;反之,网络处理层对应的抽象程度越低,用户从网络处理层输出的图像特征中更容易分辨出目标图像中的行驶道路的道路属性。
进一步,服务器31a可以根据M个网络处理层分别对应的抽象程度,对M个网络处理层进行划分,得到第一图像识别子模型和第二图像识别子模型,第一图像识别子模型用于提取目标图像的底层特征图,第二图像识别模型用于基于底层特征图进行对象识别,得到目标图像中的目标行驶道路的道路属性。其中,第一图像识别子模型中的网络处理层的数量与第二图像识别子模型中的网络处理层的数量之和为M,假设第一图像识别子模型中的网络处理层的数量为F个,第二图像识别子模型中的网络处理层的数量为E个,E和F之间的和为M,E和F均为大于1的正整数,第一图像识别子模型中的F个网络处理层中包括图像输入层,F-1个与图像输入层相邻的网络处理层,第二图像识别子模型中的E个网络处理层中包括识别结果输出层,E-1个与识别结果输出层相邻的网络处理层。上述底层特征图可以是指目标图像中抽象程度大于抽象程度阈值的图像特征构成的,即用户从该底层特征图中不能分辨出目标图像中的目标行驶道路的道路属性。服务器31a在获取到第一图像识别子模型和第二图像识别子模型后,可以将第一图像识别子模型部署在终端30a中,将第二图像识别子模型部署在服务器31a中。
进一步,图像识别模型的推荐过程包括如下步骤S23~S26:
S23、终端30a提取目标图像的底层特征图。
S24、终端30a将底层特征图上传至服务器31a。
S25、服务器31a基于底层特征图进行推理。
S26、服务器31a将推理结果返回给终端30a。
在步骤S23~S26中,如图4所示,当需要识别目标图像中的目标行驶道路的道路属性时,终端30a可以将目标图像输入至第一图像识别子模型中,通过第一图像识别子模型对目标图像进行底层特征提取,得到底层特征图,终端30a可以将该底层特征图发送至服务器31a。服务器31a可以接收终端30a所发送的底层特征图,将底层特征图输入至第二图像识别子模型中,通过第二图像识别子模型对底层特征图进行对象识别,得到目标道路中的道路属性,并将该目标道路的道路属性返回给终端30a。即由终端30a和服务器31a协同实现目标图像识别模型的推理过程,在服务器31a获取到推理结果后,将推理结果(即道路属性)返回给终端30a。终端30a接收到该目标道路的道路属性后,可以对目标图像进行脱敏处理,例如,对目标图像中的行人进行打码处理等等。
可理解的是,上述第一图像识别子模型可部署在多个终端中,实现多个终端共享同一个第二图像识别子模型,有利于提高目标图像识别模型的利用率。同时,执行上述初始图像识别模型的训练过程的服务器,与用于部署第二图像识别子模型的服务器可以是同一个服务器,也可以是不同服务器,特别地,也可以由终端执行上述初始图像识别模型的训练过程,本申请对此不做限定。
综上,通过在服务器和终端中协同部署目标图像识别模型,不需要将目标识别模型的所有网络处理层均部署在终端中,降低终端的图像处理压力。在终端需要识别目标图像中的目标行驶道路的道路属性时,只需要终端将底层特征图上传至服务器,由服务器通过第二图像识别子模型对底层特征图进行对象识别,得到目标道路的道路属性,不需要终端将原始的目标图像上传至服务器,这样可以避免目标图像中的隐私数据泄露,同时提高图像识别精度。
进一步地,请参见图5,是本申请实施例提供的一种图像数据处理方法的流程示意图。如图5所示,该方法可由图1中的终端来执行,也可以由图1中的服务器来执行,还可以由图1中的终端和服务器共同执行,本申请中用于执行该方法的设备可以统称为计算机设备。其中,该图像数据处理方法可以包括如下步骤:
S101、获取用于识别目标图像的目标图像识别模型;该目标图像识别模型包括M个网络处理层。
本申请中,通常图像识别模型运行时所需要的计算资源量与图像识别模型的识别准确度相关,如图像识别模型运行时所需要的计算资源量越多,图像识别模型的识别准确度也高,图像识别模型的网络处理层的数量也越多,相反,图像识别模型运行时所需要的计算资源量越少,图像识别模型的识别准确度也低,图像识别模型的网络处理层的数量也越少。因此,为类提高图像识别精度,此处的目标图像识别模型可以是指非轻量化的图像识别模型,非轻量化的图像识别模型可以是指运行时所需的计算资源量大于资源量阈值的图像识别模型,目标图像识别模型(或目标图像识别模型的网络处理层的数量)具体可以是指根据用于协同部署该目标图像识别模型的终端和服务器的计算资源量确定的。该目标图像识别模型可以包括M个网络处理层,网络处理层为目标图像识别模型的各个处理层的统称,M个网络处理层包括图像输入层、识别结果输出层,以及其他处理层。
S102、确定该M个网络处理层分别对该目标图像中的图像特征的抽象程度。
本申请中,计算机设备可以通过如下两种方式中的任一种方式,确定M个网络处理层对应的抽象程度:方式一,通常M个网络处理层中与图像输出层的距离越远的网络处理层,对该目标图像中的图像特征的抽象程度越高;相反,M个网络处理层中与图像输出层的距离越近的网络处理层,对该目标图像中的图像特征的抽象程度越低。因此,计算机设备可以根据M个网络处理层在目标图像识别模型中的位置,确定M个网络处理层分别对该目标图像中的图像特征的抽象程度。方式二:计算机设备可以获取测试图像以及该测试图像中的对象的标注对象属性,测试图像是指用于测试M个网络处理层分别对应的抽象程度的图像,将测试图像输入至目标图像识别模型中,获取M个网络处理层分别针对测试图像的输出结果,根据M个网络处理层的输出结果和,确定从输出结果中能够分辨出目标图像中的目标对象的难易程度,根据该难易程度,确定该M个网络处理层分别对该目标图像中的图像特征的抽象程度。其中,上述确定从输出结果中能够分辨出目标图像中的目标对象的难易程度,包括:将M个网络处理层分别对应的输出结果输入同一个轻量化的图像识别模型中,通过轻量化的图像识别模型对M个网络处理层分别对应的输出结果进行测试对象识别,得到M个测试对象属性,根据M个测试对象属性和标注对象属性,确定轻量化的图像识别模型的对象识别误差,根据该对象识别误差确定从输出结果中能够分辨出目标图像中的目标对象的难易程度。
可理解的是,上述M个网络处理层包括图像输入层和识别结果输出层;上述确定该M个网络处理层分别对该目标图像中的图像特征的抽象程度的实现方式可以包括:方式一:计算机设备可以按照图像输入层至该识别结果输出层的方向,以递增的方式生成M个网络处理层分别对应的层序号,如图像输入层的层序号为1、位于图像输入层之后的网络处理层的层序号为2,……,识别结果输出层的层序号为M,层序号用于反映网络处理层在目标图像识别模型中的位置。根据该M个网络处理层分别对应的层序号,确定该M个网络处理层分别对上述目标图像中的图像特征的抽象程度。此时网络处理层Pi的层序号与该网络处理层Pi针对目标图像中的图像特征的抽象程度之间具有正相关关系,i为小于或等于M的正整数;即网络处理层的Pi的层序号越大,该网络处理层Pi针对目标图像中的图像特征的抽象程度越高;相反,网络处理层的Pi的层序号越小,该网络处理层Pi针对目标图像中的图像特征的抽象程度越低。
方式二:计算机设备可以按照图像输入层至该识别结果输出层的方向,以递减的方式生成M个网络处理层分别对应的层序号,如图像输入层的层序号为M、位于图像输入层之后的网络处理层的层序号为M-1,……,识别结果输出层的层序号为1。根据该M个网络处理层分别对应的层序号,确定该M个网络处理层分别对上述目标图像中的图像特征的抽象程度。此时网络处理层Pi的层序号与该网络处理层Pi针对目标图像中的图像特征的抽象程度之间具有负相关关系,i为小于或等于M的正整数;即网络处理层的Pi的层序号越大,该网络处理层Pi针对目标图像中的图像特征的抽象程度越低;相反,网络处理层的Pi的层序号越小,该网络处理层Pi针对目标图像中的图像特征的抽象程度越高。
S103、根据该M个网络处理层分别对应的抽象程度,对该M个网络处理层进行划分,得到第一图像识别子模型和第二图像识别子模型。
本申请中,计算机设备可以根据该M个网络处理层分别对应的抽象程度,对该M个网络处理层进行划分,得到第一图像识别子模型和第二图像识别子模型。该第一图像识别子模型为用于提取目标图像的底层特征图,第二图像识别子模型用于基于底层特征图进行对象识别,得到目标图像中的目标对象的对象属性,底层特征图可以是由目标图像中不能分辨出目标图像中的目标对象的图像特征构成,且基于该底层特征图不能还原出目标图像,即底层特征图可以由目标图像中抽象程度大于抽象程度阈值的图像特征构成。
可理解的是,上述底层特征图可以是由目标图像中不能分辨出目标图像中的目标对象的图像特征构成具有如下含义:第一、用户不能从底层特征图中分辨出目标图像中的目标对象,即目标图像中的目标对象在底层特征图中处于不可见状态,也即用户不能直接从底层特征图中看到目标图像中的目标对象;第二、其他图像识别模型不能基于底层特征图识别,得到目标图像中的目标对象或目标对象的对象属性,其他图像识别模型是指除第二图像识别子模型以外的图像识别模型。造成不能从底层特征图中分辨出目标图像中的目标对象的原因如下:1、由于底层特征图是通过第一图像识别子模型对目标图像中的图像特征进行抽象化得到的;2、由于第一图像识别子模型与第二图像识别子模型是由目标图像识别模型划分得到的,相当于第一图像识别子模型与第二图像识别子模型之间具有匹配关系,即第一图像识别子模型的输出结果(即底层特征图)能够被第二图像识别子模型读懂,并进一步处理(如对象识别)。底层特征图相当于图像识别处理过程中的一个中间处理结果,由于其他图像识别模型不清楚该底层特征图是那个阶段的处理结果,因此,其他图像识别模型不能读懂该底层特征图,其他图像识别模型不能对底层特征图进一步处理,即其他图像识别模型不能从底层特征图中识别出(分辨出)目标图像中的目标对象。
可理解的是,M个网络处理层所的输出结果均可以称为目标图像的图像特征,不同网络处理层所输出的图像特征均包含目标图像中的全量的图像特征,不同网络处理层所输出的图像特征的抽象程度不一致。例如,M个网络处理层包括网络处理层1和网络处理层2,网络处理层1与网络处理层2在目标图像识别模型中具有相邻关系,即网络处理层1的输出结果为网络处理层2的输入,即网络处理层2的输出结果为进一步对网络处理层1的输出结果进行抽象化处理(如卷积)得到的,即网络处理层2所输出的图像特征的抽象程度高于网络处理层1所输出的图像特征的抽象程度。进而,上述底层特征图是由目标图像中抽象程度大于抽象程度阈值的全量图像特征构成,即底层特征图能够反映目标图像中的全量图像特征,这样能够确保图像识别精度。
可理解的是,以上述M个网络处理层中的任一网络处理层的层序号与对应网络处理层针对该目标图像中的图像特征的抽象程度之间具有正相关关系为例,对M个网络处理层进行划分的实现方式进行说明。可选的,对M个网络处理层进行划分的实现方式可以采用如下两种方式中的任一种方式:方式一,计算机设备可以按照M个网络处理层分别对应的层序号由小到大的顺序,依次遍历M个网络处理层分别对应的抽象程度,当第一次遍历到网络处理层Pa对应的抽象程度大于抽象程度阈值,则将M个网络处理层中层序号小于网络处理层Pa的层序号的网络处理层,以及网络处理层Pa,确定为第一图像识别子模型,将M个网络处理层中除第一图像识别子模型中的网络处理层以外的网络处理层,确定为第二图像识别子模型,a为小于M的正整数。通过网络处理层对应的抽象程度,自适应地对目标图像识别模型进行划分,得到第一图像识别子模型和第二图像识别子模型,避免将原始的目标图像上传至服务器,导致目标图像中的隐私数据泄露,提高图像识别处理的安全性。
方式二:由于终端中的处于可使用状态的计算资源量有限,因此,在确保部署在终端中的部分图像识别模型的输出的底层特征图不能分辨出目标对象的前提下,可以将尽量少的网络处理层部署在终端中,以降低终端的图像识别压力。具体的,计算机设备可以获取该终端的图像处理性能参数,根据该终端的图像处理性能参数,从该M个网络处理层中筛选出满足该终端的图像处理条件的N个网络处理层,该N个网络处理层分别对应的层序号之间具有相邻连续关系,即N个网络处理层包括图像输入层,以及与图像输入层相邻的N-1个网络处理层。此处终端的图像处理条件可以是指终端最多能够提供运行H个网络处理层所需要的计算资源,N小于或等于H。进一步,按照该N个网络处理层分别对应的层序号由大到小的顺序,依次遍历该N个网络处理层分别对应的抽象程度,若遍历到该N个网络处理层中存在抽象程度大于抽象程度阈值的网络处理层,则将该N个网络处理层确定为第一图像识别子模型。将剩余网络处理层,确定为第二图像识别子模型;该剩余网络处理层为该M个网络处理层中除该第一图像识别子模型中的网络处理层以外的网络处理层。通过网络处理层对应的抽象程度和终端的图像处理性能参数,自适应地对目标图像识别模型进行划分,得到第一图像识别子模型和第二图像识别子模型,避免将原始的目标图像上传至服务器,导致目标图像中的隐私数据泄露,提高图像识别处理的安全性,并降低终端的图像识别压力。
可理解的是,上述根据上述终端的图像处理性能参数,从上述M个网络处理层中筛选出满足上述终端的图像处理条件的N个网络处理层,包括:计算机设备可以获取该M个网络处理层分别需要占用该终端的计算资源量,网络处理层对应的计算资源量是指单位时间内运行网络处理层需要终端处理的数据对应的条数,进一步,根据该终端的图像处理性能参数,确定该终端中处于可使用状态的计算资源对应的限制计算资源量,即限制计算资源量为终端中处于可使用状态的计算资源量,或者,限制计算资源量是指单位时间内终端能够处理的数据对应的数据条数。然后,按照该M个网络处理层分别对应的层序号从小到大的顺序,依次累计该M个网络处理层分别对应计算资源量,若累计得到该M个网络处理层中的N个网络处理层的计算资源量与该限制计算资源量之间的差值小于差值阈值,则被累计到的N个网络处理层,确定为满足该终端的图像处理条件的N个网络处理层。
例如,假设限制计算资源量为50条,差值阈值为5条,网络处理层1、网络处理层2、网络处理层3、……、网络处理层M对应的计算资源量分别为10条、30条、18条、……、20条;计算机设备可以计算网络处理层1对应的计算资源量与网络处理层2之间的和,得到累计资源量1,累计资源量1为40条,累计资源量1与限制资源量之间的差值为10条。由于累计资源量1与限制资源量之间的差值大于差值阈值,继续遍历网络处理层,计算累计资源量1与网络处理层3对应的计算资源量之间的和,得到累计资源量2,累计资源量2为58条,累计资源量2与限制资源量之间的差值为2条,由于累计资源量2与限制资源量之间的差值小于差值阈值,暂停遍历网络处理层,确定将网络处理层1、网络处理层2、网络处理层3确定为满足该终端的图像处理条件的N个网络处理层。
S104、将该第一图像识别子模型部署在用于协同部署该目标图像识别模型的终端中,将该第二图像识别子模型部署在用于协同部署该目标图像识别模型的服务器中;该终端用于调用该第一图像识别子模型提取该目标图像的底层特征图,该服务器用于从该终端中获取该底层特征图,调用该第二图像识别子模型对该底层特征图进行对象识别,得到该目标图像中的目标对象的对象属性。
本申请中,计算机设备在获取到第一图像识别子模型和第二图像识别子模型后,可以将第一图像识别子模型部署在终端中,即将第一图像识别子模型发送至终端,在终端中搭建运行第一图像识别子模型的运行环境。将第二图像识别子模型发送至服务器,在服务器中搭建运行第二图像识别子模型的运行环境,从而实现协同部署目标图像识别模型。在需要对目标图像进行识别时,只需要终端将底层特征图上传至服务器,由服务器通过第二图像识别子模型对底层特征图进行对象识别,得到目标道路的道路属性,不需要终端将原始的目标图像上传至服务器,这样可以避免目标图像中的隐私数据泄露,同时提高图像识别精度。
本申请中,基于目标图像识别模型的各个网络处理层针对目标图像中的图像特征的抽象程度,自适应地对目标图像识别模型划分,实现将目标图像识别模型的部分网络处理层(即第一图像识别子模型)部署在终端中,将目标图像识别模型的另一部分网络处理层(即第二图像识别子模型)部署在服务器端中,实现目标图像识别模型的协同部署,不需要将目标识别模型的所有网络处理层均部署在终端中,降低终端的图像处理压力。此处的抽象程度用于反映用户从网络处理层输出的图像特征中能够分辨出目标图像中的目标对象(或目标对象的对象属性)的难度,即网络处理层对应的抽象程度越高,用户从网络处理层输出的图像特征中更加难以分辨出目标图像中的目标对象;反之,网络处理层对应的抽象程度越低,用户从网络处理层输出的图像特征中更容易分辨出目标图像中的目标对象。即基于该抽象程度划分得到的第一图像识别子模型用于输出的目标图像的底层特征图,从该底层特征图中不能分辨出目标图像中的目标对象(或目标对象的对象属性),因此,在终端需要识别目标图像中的目标对象的对象属性时,只需要终端将底层特征图上传至服务器,由服务器通过第二图像识别子模型对底层特征图进行对象识别,得到目标对象的对象属性,不需要终端将原始的目标图像上传至服务器,这样可以避免目标图像中的隐私数据泄露,同时提高图像识别精度。
进一步地,请参见图6,是本申请实施例提供的一种图像数据处理方法的流程示意图。如图6所示,该方法可由图1中的终端来执行,也可以由图1中的服务器来执行,还可以由图1中的终端和服务器共同执行,本申请中用于执行该方法的设备可以统称为计算机设备。其中,该图像数据处理方法可以包括如下步骤:
S201、获取样本图像中的样本对象的标注对象属性。
本申请中,计算机设备可以根据目标图像识别模型的应用场景,获取样本图像,以及样本图像的标注对象属性。例如,该目标图像识别模型用于识别行驶道路的道路属性时,该样本图像可以是指对行驶道路进行拍摄得到的图像,样本图像中的样本对象可以是指行驶道路,样本对象的标注对象属性可以是指道路属性,道路属性包括行驶道路中的车辆信息、行人信息、交通信号灯信息等。再例如,该目标图像识别模型用于识别人脸时,该样本对象可以是指包括人物的图像,样本对象可以是指人,样本对象的标注对象属性可以是指样本对象的用户基本信息。
S202、调用初始图像识别模型,对上述样本图像进行对象预测,得到该样本对象的预测对象属性。
本申请中,计算机设备可以将该样本图像输入至初始图像识别模型,通过该初始图像识别模型对该样本图像进行对象预测,得到该样本对象的预测对象属性。
S203、根据该预测对象属性和该标注对象属性,对该初始图像识别模型进行调整,得到用于识别该目标图像的目标图像识别模型。
本申请中,预测对象属性与标注对象属性更加接近,则表明初始图像识别模型的对象识别误差比较低;反之,预测对象属性与标注对象属性相差比较大,则表明初始图像识别模型的对象识别误差比较高。因此,计算机设备可以根据该预测对象属性和该标注对象属性确定初始图像识别模型的对象识别误差,根据该对象识别误差对初始图像识别模型进行调整,得到用于识别该目标图像的目标图像识别模型。
可理解的是,上述步骤S203包括:如图7所示,针对K个样本图像中的每个样本图像,计算机设备可以根据该预测对象属性和该标注对象属性,确定该初始图像识别模型的对象识别误差,根据该对象识别误差,确定上述初始图像识别模型的状态。如若该对象识别误差大于误差阈值,则确定该初始图像识别模型的状态未收敛状态;若该对象识别误差小于或等于误差阈值,则确定该初始图像识别模型的状态为收敛状态,初始图像识别模型的状态为收敛状态是指初始图像识别模型的对象识别误差已经达到最小值,或者接近最小值,初始图像识别模型的状态为未收敛状态是指初始图像识别模型的对象识别误差不是最小值,或者与最小值之间的差值比较大。进一步,若该初始图像识别模型处于收敛状态,则可以将初始图像识别模型确定为目标图像识别模型。若该初始图像识别模型处于未收敛状态,则根据该对象识别误差对该初始图像识别模型的模型参数进行调整,继续采用样本图像对调整后的初始图像识别模型进行训练,直到调整后的初始图像识别模型处于收敛状态,将调整后的初始图像识别模型,确定为用于识别该目标图像的目标图像识别模型。通过根据预测对象属性和标注对象属性,对初始图像识别模型进行调整,得到目标图像识别模型,可以提高目标图像识别模型的图像识别准确度。
可理解的是,该标注对象属性包括该样本对象的标注对象位置、标注对象类别、标注对象尺寸以及标注置信度;该预测对象属性包括该样本对象的预测对象位置、预测对象类别、预测对象尺寸以及预测置信度;该标注对象位置、该预测对象位置均用于反映该样本对象位于该样本图像中的位置;该标注置信度和该预测置信度均用于反映该样本图像中存在该样本对象的概率;该标注置信度和该预测置信度可以为0或1,0表示样本图像中不存在样本对象,1表示样本图像中存在样本对象。
可理解的是,上述根据该预测对象属性和该标注对象属性,确定该初始图像识别模型的对象识别误差,包括:如图7所示,针对K个样本图像中的每个样本图像,计算机设备可以采用该标注对象位置和该预测对象位置,确定该初始图像识别模型的对象位置识别误差,该对象位置识别误差用于反映初始图像识别模型的识别样本对象在该样本图像中的位置的准确度;采用该标注对象类别和该预测对象类别,确定该初始图像识别模型的对象类别识别误差,该对象类别识别误差用于反映初始图像识别模型识别样本对象的类别的准确度。进一步,采用该标注对象尺寸和该预测对象尺寸,确定该初始图像识别模型的对象尺寸识别误差,对象尺寸识别误差用于反映初始图像识别模型识别样本对象的尺寸的准确度;采用该标注置信度和该预测置信度,确定该初始图像识别模型的置信度识别误差,该置信度识别误差用于反映初始图像识别模型预测置信度的准确度。然后,根据该对象位置识别误差、该对象类别识别误差、该对象尺寸识别误差和该置信度识别误差,确定该初始图像识别模型的对象识别误差,具体的,以此类推,获取初始图像识别模型分别针对K个样本图像的对象识别误差,将K个样本对象分别对应的对象识别误差的累计和,确定为初始图像识别模型的对象识别误差。通过从样本对象的类别、尺寸、位置等多个角度,来衡量初始图像识别模型的对象识别误差,提高确定初始图像识别模型的对象识别误差的准确度,进而,提高目标图像识别模型的图像识别精度。
可理解的是,上述标注对象位置包括上述样本对象的锚定框的中心点在第一方向上的第一坐标值和在第二方向上的第二坐标值;上述预测对象位置包括上述样本对象的预测框的中心点在上述第一方向上的第三坐标值和在上述第二方向上的第四坐标值;该第一方向可以样本图像的水平方向,第二方向可以是指样本图像的垂直方向,上述锚定框、预测框是指用于指示样本对象在样本图像中的位置的矩形框。
上述采用标注对象位置和预测对象位置,确定上述初始图像识别模型的对象位置识别误差,包括:计算机设备可以获取该第一坐标值和该第三坐标值之间的差值,作为第一坐标差值,第一坐标差值用于反映初始图像识别模型在第一方向上的位置识别误差;然后,获取该第二坐标值和上述第四坐标值之间的差值,作为第二坐标差值,第二坐标差值用于反映初始图像识别模型在第二方向上的位置识别误差。进一步,根据上述第一坐标差值与上述第二坐标差值,确定上述初始图像识别模型的对象位置识别误差;通过统计初始图像识别模型在多个方向上的位置识别误差,来确定初始图像识别模型的对象位置识别误差,提高确定初始图像识别模型的位置识别误差的准确度。
可理解的是,上述标注对象尺寸包括该锚定框的宽度和高度,上述预测对象尺寸包括上述预测框的宽度和高度;上述采用标注对象尺寸和预测对象尺寸,确定上述初始图像识别模型的对象尺寸识别误差,包括:计算机设备可以获取该锚定框的宽度与该预测框的宽度之间的差值,作为宽度偏差,宽度偏差用于反映初始图像识别模型针对样本对象的宽度识别误差;获取上述锚定框的高度与上述预测框的高度之间的差值,作为高度偏差,高度偏差用于反映初始图像识别模型针对样本对象的高度识别误差;根据该宽度偏差和该高度偏差,确定该初始图像识别模型的对象尺寸识别误差。通过统计初始图像识别模型针对样本对象的高度识别误差和高度识别误差,来确定初始图像识别模型的对象尺寸识别误差,提高确定初始图像识别模型的对象尺寸识别误差的准确度。
可理解的是,根据上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差,确定上述初始图像识别模型的对象识别误差,包括:计算机设备可以获取上述目标图像识别模型的应用场景;根据该目标图像识别模型的应用场景,确定在上述应用场景下分别针对上述对象位置识别误差、该对象类别识别误差、该对象尺寸识别误差和该置信度识别误差的关注度;例如,在车联网场景下,更加关注样本对象的类别是车或行人,以及样本对象在行驶道路中的位置,因此,在车联网场景下,更加关注初始图像识别模型的对象类别识别误差以及对象位置识别误差。在例如,在人脸识别场景下,更加关注样本图像中是否存在人脸,以及人脸是否属于目标人群的人脸,等等,因此,在人脸识别场景下,更加关注初始图像识别模型的置信度识别误差和对象类别识别误差。因此,计算机设备可以根据该关注度,确定该对象位置识别误差、该对象类别识别误差、该对象尺寸识别误差和该置信度识别误差分别对应的权重,即某一识别误差对应的关注度越高,则该识别误差对应的权重也越大;相反,某一识别误差对应的关注度越低,则该识别误差对应的权重也越低。进一步,采用上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差分别对应的权重,对上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差进行加权求和处理,得到上述初始图像识别模型的对象识别误差。通过目标图像识别模型对应的应用场景,自适应地确定各个维度的识别误差对应的关注度,基于关注度,对各个维度的识别误差进行加权求和处理,得到初始图像识别模型的对象识别误差,提高初始图像识别模型的对象识别误差的准确度。
例如,该初始图像识别模型的对象识别误差可以采用如下公式(1)表示:
在公式(1)中,S表示预测框,B表示样本图像中的锚定框的数量,表示初始图像识别模型的预测得到的样本图像的(i,j)位置是否在样本对象,如果存在则值为1,否则为0。xij表示样本图像中位于(i,j)位置的预测框的中心点在第一方向上的坐标值,/>表示样本图像中位于(i,j)位置的锚定框的中心点在第一方向上的坐标值,yij表示样本图像中位于(i,j)位置的预测框的中心点在第二方向上的坐标值,/>表示样本图像中位于(i,j)位置的锚定框的中心点在第二方向上的坐标值。wij表示样本图像中位于(i,j)位置的预测框的宽度,/>表示样本图像中位于(i,j)位置的锚定框的宽度,hij表示样本图像中位于(i,j)位置的预测框的高度,/>表示样本图像中位于(i,j)位置的锚定框的高度。Cij表示样本图像中的位于(i,j)位置存在样本对象的预测置信度;/>表示样本图像中的位于(i,j)位置存在样本对象的标注置信度;pi(k)表示预测得到的样本图像中位于(i,j)位置的样本对象的类别为第k个类别的概率;/>表示标注得到的样本图像中位于(i,j)位置的样本对象的类别为第k个类别的概率,k属于c,c为类别集合,k为类别集合中的第k个类别。公式(1)的第一行中等号中右边表示初始图像识别模型的对象位置识别误差,第二行为初始图像识别模型的对象尺寸识别误差,第三行表示初始图像识别模型的置信度识别误差,第四行表示初始图像识别模型的对象类别识别误差。对象位置识别误差、对象尺寸识别误差分别对应的权重均为α,置信度识别误差对应的权重为β,对象类别识别误差对应的权重为γ。
S204、获取用于识别目标图像的目标图像识别模型;该目标图像识别模型包括M个网络处理层。
可理解的是,目标图像识别模型可以是指卷积神经网络模型、深度学习网络模型等等,如图8所示,以目标图像识别模型为深度学习网络模型为例进行说明,该目标图像识别模型包括至少两个基础卷积模块以及至少两个残差模块构成,目标图像识别模型中的模块可以统称为网络处理层。如图8所示,目标图像识别模型包括基础卷积模块60a、残差模块61a、残差模块62a、残差模块63a、残差模块64a、残差模块65a、残差模块66a、残差模块67a、基础卷积模块68a,其中,基础卷积模块60a、基础卷积模块68a分别为目标图像识别模型的图像输入层、识别结果输入层,各个残差模块为目标图像识别模型的中间网络处理层。其中,各个残差模块的参数可以不相同,如残差模块62a、残差模块64a、残差模块66a的步长均为2、残差模块61a、残差模块63a、残差模块65a、残差模块67a的步长均为1;基础卷积模块68a的分辨率为基础卷积模块60a的分辨率的1/16,基础卷积模块68a的通道数为B*(4+1+c),其中B为锚定框数量,4代表对每个锚定框的中心横坐标、中心纵坐标、长、宽的偏移回归量,1代表是否为目标对象的置信度,c为目标对象的对象类别,这里为2类。因此基础卷积模块68a的特征通道为B*7。可选的,一个残差模块可以是指由基础卷积层70b、归一化层71b、基础卷积层72b、归一化层73b构成,一个基础卷积模块可以由基础卷积层80c和归一化层81c构成,基础卷积层可以是指3x3的卷积网络。其中,残差模块主要用于对图像特征进行下采样处理,基础卷积模块60a用于提取目标图像中的图像特征,基础卷积模块68a主要用于输出识别结果。
S205、确定该M个网络处理层分别对该目标图像中的图像特征的抽象程度。
S206、根据该M个网络处理层分别对应的抽象程度,对该M个网络处理层进行划分,得到第一图像识别子模型和第二图像识别子模型。
S207、将该第一图像识别子模型部署在用于协同部署该目标图像识别模型的终端中,将该第二图像识别子模型部署在用于协同部署该目标图像识别模型的服务器中;该终端用于调用该第一图像识别子模型提取该目标图像的底层特征图,该服务器用于从该终端中获取该底层特征图,调用该第二图像识别子模型对该底层特征图进行对象识别,得到该目标图像中的目标对象的对象属性。
可理解的是,本申请中的对步骤S204的解释说明可以参考上述图4中对步骤S101的解释说明,本申请中的对步骤S205的解释说明可以参考上述图4中对步骤S102的解释说明。本申请中的对步骤S206的解释说明可以参考上述图4中对步骤S103的解释说明,本申请中的对步骤S207的解释说明可以参考上述图4中对步骤S104的解释说明,重复之处,不再赘述。
可理解的是,当需要使用目标图像识别模型识别目标图像中的目标对象的对象属性,且上述计算机设备是指终端时,终端可以调用本地存储的该第一图像识别子模型,对该目标图像进行底层体征提取,得到底层特征图;该目标图像中待识别的目标对象在该底层特征图中处于不可见状态,且该底层特征图不能恢复得到该目标图像;将该底层特征图发送至服务器,该服务器用于调用该服务器中的上述第二图像识别子模型,对该底层特征图进行对象识别,得到该目标图像中的目标对象的对象属性。进一步,接收该服务器发送的该目标对象的对象属性,根据该对象属性确定该目标图像中的隐私数据,对该目标图像中的隐私数据进行脱敏处理,此处的隐私数据可以是指车辆的牌照、人眼等。只需要终端将底层特征图上传至服务器,由服务器通过第二图像识别子模型对底层特征图进行对象识别,得到目标对象的对象属性,不需要终端将原始的目标图像上传至服务器,这样可以避免目标图像中的隐私数据泄露,同时提高图像识别精度。
本申请中,通过样本图像以及样本图像中的样本对象的标注对象属性,对初始图像识别模型进行训练,得到目标图像识别模型,提高目标图像识别模型的图像识别精度。进一步,基于目标图像识别模型的各个网络处理层针对目标图像中的图像特征的抽象程度,自适应地对目标图像识别模型划分,实现将目标图像识别模型的部分网络处理层(即第一图像识别子模型)部署在终端中,将目标图像识别模型的另一部分网络处理层(即第二图像识别子模型)部署在服务器端中,实现目标图像识别模型的协同部署,不需要将目标识别模型的所有网络处理层均部署在终端中,降低终端的图像处理压力。此处的抽象程度用于反映用户从网络处理层输出的图像特征中能够分辨出目标图像中的目标对象(或目标对象的对象属性)的难度,即网络处理层对应的抽象程度越高,用户从网络处理层输出的图像特征中更加难以分辨出目标图像中的目标对象;反之,网络处理层对应的抽象程度越低,用户从网络处理层输出的图像特征中更容易分辨出目标图像中的目标对象。即基于该抽象程度划分得到的第一图像识别子模型用于输出的目标图像的底层特征图,从该底层特征图中不能分辨出目标图像中的目标对象(或目标对象的对象属性),因此,在终端需要识别目标图像中的目标对象的对象属性时,只需要终端将底层特征图上传至服务器,由服务器通过第二图像识别子模型对底层特征图进行对象识别,得到目标对象的对象属性,不需要终端将原始的目标图像上传至服务器,这样可以避免目标图像中的隐私数据泄露,同时提高图像识别精度。
请参见图9,是本申请实施例提供的一种图像数据处理装置的结构示意图。上述图像数据处理装置可以是运行于网络设备中的一条计算机程序(包括程序代码),例如该图像数据处理装置为一条应用软件;该装置可以用于执行本申请实施例提供的方法中的相应步骤。如图9所示,该图像数据处理装置可以包括:获取模块911、确定模块912、划分模块913、部署模块914。
获取模块911,用于获取用于识别目标图像的目标图像识别模型,以及用于协同部署上述目标图像识别模型的终端的图像处理性能参数;上述目标图像识别模型包括M个网络处理层;
确定模块912,用于确定上述M个网络处理层分别对上述目标图像中的图像特征的抽象程度;
划分模块913,用于根据上述M个网络处理层分别对应的抽象程度以及上述终端的图像处理性能参数,对上述M个网络处理层进行划分,得到第一图像识别子模型和第二图像识别子模型;
部署模块914,用于将上述第一图像识别子模型部署在上述终端中,将上述第二图像识别子模型部署在用于协同部署上述目标图像识别模型的服务器中;上述终端用于调用上述第一图像识别子模型提取上述目标图像的底层特征图,上述服务器用于从上述终端中获取上述底层特征图,调用上述第二图像识别子模型对上述底层特征图进行对象识别,得到上述目标图像中的目标对象的对象属性。
可理解的是,上述M个网络处理层包括图像输入层和识别结果输出层;确定模块912包括生成单元91a和第一确定单元92a;
生成单元91a,用于按照从述图像输入层至上述识别结果输出层的方向,依次生成上述M个网络处理层分别对应的层序号;
第一确定单元92a,用于根据上述M个网络处理层分别对应的层序号,确定上述M个网络处理层分别对上述目标图像中的图像特征的抽象程度。
可理解的是,上述M个网络处理层中的网络处理层的层序号与对应网络处理层针对上述目标图像中的图像特征的抽象程度之间具有正相关关系;划分模块913包括获取单元93b、筛选单元94b、遍历单元95b和第二确定单元96b;
第一获取单元93b,用于获取上述终端的图像处理性能参数;
筛选单元94b,用于根据上述终端的图像处理性能参数,从上述M个网络处理层中筛选出满足上述终端的图像处理条件的N个网络处理层;上述N个网络处理层分别对应的层序号之间具有相邻连续关系;
遍历单元95b,用于按照上述N个网络处理层分别对应的层序号由大到小的顺序,依次遍历上述N个网络处理层分别对应的抽象程度;
第二确定单元96b,用于若遍历到上述N个网络处理层中存在对应抽象程度大于抽象程度阈值的网络处理层,则将上述N个网络处理层确定为第一图像识别子模型;将剩余网络处理层,确定为第二图像识别子模型;上述剩余网络处理层为上述M个网络处理层中除上述第一图像识别子模型中的网络处理层以外的网络处理层。
可理解的是,筛选单元94b根据上述终端的图像处理性能参数,从上述M个网络处理层中筛选出满足上述终端的图像处理条件的N个网络处理层,包括:
获取上述M个网络处理层分别需要占用上述终端的计算资源量;
根据上述终端的图像处理性能参数,确定上述终端中处于可使用状态的计算资源对应的限制计算资源量;
按照上述M个网络处理层分别对应的层序号从小到大的顺序,依次累计上述M个网络处理层分别对应计算资源量;
若累计得到上述M个网络处理层中的N个网络处理层的计算资源量与上述限制计算资源量之间的差值小于差值阈值,则被累计到的N个网络处理层,确定为满足上述终端的图像处理条件的N个网络处理层。
可理解的是,获取模块911包括第二获取单元96c、预测单元97c以及调整单元98c:
第二获取单元96c,用于获取样本图像中的样本对象的标注对象属性;
预测单元97c,用于调用初始图像识别模型,对上述样本图像进行对象预测,得到上述样本对象的预测对象属性;
调整单元98c,用于根据上述预测对象属性和上述标注对象属性,对上述初始图像识别模型进行调整,得到用于识别上述目标图像的目标图像识别模型。
可理解的是,调整单元98c根据上述预测对象属性和上述标注对象属性,对上述初始图像识别模型进行调整,得到用于识别上述目标图像的目标图像识别模型,包括:
根据上述预测对象属性和上述标注对象属性,确定上述初始图像识别模型的对象识别误差;
根据上述对象识别误差,确定上述初始图像识别模型的状态;
若上述初始图像识别模型处于未收敛状态,则根据上述对象识别误差对上述初始图像识别模型的模型参数进行调整;
直到调整后的初始图像识别模型处于收敛状态,将调整后的初始图像识别模型,确定为用于识别上述目标图像的目标图像识别模型。
可理解的是,上述标注对象属性包括上述样本对象的标注对象位置、标注对象类别、标注对象尺寸以及标注置信度;上述预测对象属性包括上述样本对象的预测对象位置、预测对象类别、预测对象尺寸以及预测置信度;上述标注对象位置、上述预测对象位置均用于反映上述样本对象位于上述样本图像中的位置;上述标注置信度和上述预测置信度均用于反映上述样本图像中存在上述样本对象的概率;
调整单元98c根据上述预测对象属性和上述标注对象属性,确定上述初始图像识别模型的对象识别误差,包括:
采用上述标注对象位置和上述预测对象位置,确定上述初始图像识别模型的对象位置识别误差;
采用上述标注对象类别和上述预测对象类别,确定上述初始图像识别模型的对象类别识别误差;
采用上述标注对象尺寸和上述预测对象尺寸,确定上述初始图像识别模型的对象尺寸识别误差;
采用上述标注置信度和上述预测置信度,确定上述初始图像识别模型的置信度识别误差;
根据上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差,确定上述初始图像识别模型的对象识别误差。
可理解的是,上述标注对象位置包括上述样本对象的锚定框的中心点在第一方向上的第一坐标值和在第二方向上的第二坐标值;上述预测对象位置包括上述样本对象的预测框的中心点在上述第一方向上的第三坐标值和在上述第二方向上的第四坐标值;
调整单元98c采用上述标注对象位置和上述预测对象位置,确定上述初始图像识别模型的对象位置识别误差,包括:
获取上述第一坐标值和上述第三坐标值之间的差值,作为第一坐标差值;
获取上述第二坐标值和上述第四坐标值之间的差值,作为第二坐标差值;
根据上述第一坐标差值与上述第二坐标差值,确定上述初始图像识别模型的对象位置识别误差。
可理解的是,上述标注对象尺寸包括上述锚定框的宽度和高度,上述预测对象尺寸包括上述预测框的宽度和高度;
调整单元98c采用上述标注对象尺寸和上述预测对象尺寸,确定上述初始图像识别模型的对象尺寸识别误差,包括:
获取上述锚定框的宽度与上述预测框的宽度之间的差值,作为宽度偏差;
获取上述锚定框的高度与上述预测框的高度之间的差值,作为高度偏差;
根据上述宽度偏差和上述高度偏差,确定上述初始图像识别模型的对象尺寸识别误差。
可理解的是,调整单元98c根据上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差,确定上述初始图像识别模型的对象识别误差,包括:
获取上述目标图像识别模型的应用场景;
根据上述目标图像识别模型的应用场景,确定在上述应用场景下分别针对上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差的关注度;
根据上述关注度,确定上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差分别对应的权重;
采用上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差分别对应的权重,对上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差进行加权求和处理,得到上述初始图像识别模型的对象识别误差。
可理解的是,上述装置还包括调用模块915、发送模块916以及接收模块917;
调用模块915,用于调用本地存储的上述第一图像识别子模型,对上述目标图像进行底层体征提取,得到底层特征图;
发送模块916,用于将上述底层特征图发送至服务器,上述服务器用于调用上述服务器中的上述第二图像识别子模型,对上述底层特征图进行对象识别,得到上述目标图像中的目标对象的对象属性;
接收模块917,用于接收上述服务器发送的上述目标对象的对象属性,根据上述对象属性对上述目标图像进行脱敏处理。
根据本申请的一个实施例,图5所示的图像数据处理方法所涉及的步骤可由图9所示的图像数据处理装置中的各个模块来执行。例如,图5中所示的步骤S101可由图9中的获取模块911来执行,图5中所示的步骤S102可由图9中的确定模块912来执行;图5中所示的步骤S103可由图9中的划分模块913来执行;图5中所示的步骤S104可由图9中的部署模块914来执行。
根据本申请的一个实施例,图9所示的图像数据处理装置中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的至少两个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由至少两个单元来实现,或者至少两个模块的功能由一个单元实现。在本申请的其它实施例中,图像数据处理装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由至少两个单元协作实现。
根据本申请的一个实施例,可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理组件和存储组件的例如计算机的通用计算机设备上运行能够执行如前文所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图9中所示的图像数据处理装置,以及来实现本申请实施例的图像数据处理方法。上述计算机程序可以记载于例如计算机可读记录介质上,并通过计算机可读记录介质装载于上述计算设备中,并在其中运行。
本申请中,基于目标图像识别模型的各个网络处理层针对目标图像中的图像特征的抽象程度,自适应地对目标图像识别模型划分,实现将目标图像识别模型的部分网络处理层(即第一图像识别子模型)部署在终端中,将目标图像识别模型的另一部分网络处理层(即第二图像识别子模型)部署在服务器端中,实现目标图像识别模型的协同部署,不需要将目标识别模型的所有网络处理层均部署在终端中,降低终端的图像处理压力。此处的抽象程度用于反映用户从网络处理层输出的图像特征中能够分辨出目标图像中的目标对象(或目标对象的对象属性)的难度,即网络处理层对应的抽象程度越高,用户从网络处理层输出的图像特征中更加难以分辨出目标图像中的目标对象;反之,网络处理层对应的抽象程度越低,用户从网络处理层输出的图像特征中更容易分辨出目标图像中的目标对象。即基于该抽象程度划分得到的第一图像识别子模型用于输出的目标图像的底层特征图,从该底层特征图中不能分辨出目标图像中的目标对象(或目标对象的对象属性),因此,在终端需要识别目标图像中的目标对象的对象属性时,只需要终端将底层特征图上传至服务器,由服务器通过第二图像识别子模型对底层特征图进行对象识别,得到目标对象的对象属性,不需要终端将原始的目标图像上传至服务器,这样可以避免目标图像中的隐私数据泄露,同时提高图像识别精度。
请参见图10,是本申请实施例提供的一种计算机设备的结构示意图。如图10所示,上述计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述计算机设备1000还可以包括:用户接口1003,和至少一条通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非易失性的存储器(non-volatile memory),例如至少一条磁盘存储器。存储器1005可选的还可以是至少一条在远离前述处理器1001的存储装置。如图10所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图10所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取用于识别目标图像的目标图像识别模型;上述目标图像识别模型包括M个网络处理层;
确定上述M个网络处理层分别对上述目标图像中的图像特征的抽象程度;
根据上述M个网络处理层分别对应的抽象程度,对上述M个网络处理层进行划分,得到第一图像识别子模型和第二图像识别子模型;
将上述第一图像识别子模型部署在用于协同部署上述目标图像识别模型的终端中,将上述第二图像识别子模型部署在用于协同部署上述目标图像识别模型的服务器中;上述终端用于调用上述第一图像识别子模型提取上述目标图像的底层特征图,上述服务器用于从上述终端中获取上述底层特征图,调用上述第二图像识别子模型对上述底层特征图进行对象识别,得到上述目标图像中的目标对象的对象属性。
可理解的是,上述M个网络处理层包括图像输入层和识别结果输出层;处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
确定上述M个网络处理层分别对上述目标图像中的图像特征的抽象程度,包括:
按照从述图像输入层至上述识别结果输出层的方向,依次生成上述M个网络处理层分别对应的层序号;
根据上述M个网络处理层分别对应的层序号,确定上述M个网络处理层分别对上述目标图像中的图像特征的抽象程度。
可理解的是,上述M个网络处理层中的网络处理层的层序号与对应网络处理层针对上述目标图像中的图像特征的抽象程度之间具有正相关关系;处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现根据上述M个网络处理层分别对应的抽象程度,对上述M个网络处理层进行划分,得到第一图像识别子模型和第二图像识别子模型,包括:
获取上述终端的图像处理性能参数;
根据上述终端的图像处理性能参数,从上述M个网络处理层中筛选出满足上述终端的图像处理条件的N个网络处理层;上述N个网络处理层分别对应的层序号之间具有相邻连续关系;
按照上述N个网络处理层分别对应的层序号由大到小的顺序,依次遍历上述N个网络处理层分别对应的抽象程度;
若遍历到上述N个网络处理层中存在对应抽象程度大于抽象程度阈值的网络处理层,则将上述N个网络处理层确定为第一图像识别子模型;
将剩余网络处理层,确定为第二图像识别子模型;上述剩余网络处理层为上述M个网络处理层中除上述第一图像识别子模型中的网络处理层以外的网络处理层。
可理解的是,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现根据上述终端的图像处理性能参数,从上述M个网络处理层中筛选出满足上述终端的图像处理条件的N个网络处理层,包括:
获取上述M个网络处理层分别需要占用上述终端的计算资源量;
根据上述终端的图像处理性能参数,确定上述终端中处于可使用状态的计算资源对应的限制计算资源量;
按照上述M个网络处理层分别对应的层序号从小到大的顺序,依次累计上述M个网络处理层分别对应计算资源量;
若累计得到上述M个网络处理层中的N个网络处理层的计算资源量与上述限制计算资源量之间的差值小于差值阈值,则被累计到的N个网络处理层,确定为满足上述终端的图像处理条件的N个网络处理层。
可理解的是,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现获取用于识别目标图像的目标图像识别模型,包括:
获取样本图像中的样本对象的标注对象属性;
调用初始图像识别模型,对上述样本图像进行对象预测,得到上述样本对象的预测对象属性;
根据上述预测对象属性和上述标注对象属性,对上述初始图像识别模型进行调整,得到用于识别上述目标图像的目标图像识别模型。
可理解的是,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现根据上述预测对象属性和上述标注对象属性,对上述初始图像识别模型进行调整,得到用于识别上述目标图像的目标图像识别模型,包括:
根据上述预测对象属性和上述标注对象属性,确定上述初始图像识别模型的对象识别误差;
根据上述对象识别误差,确定上述初始图像识别模型的状态;
若上述初始图像识别模型处于未收敛状态,则根据上述对象识别误差对上述初始图像识别模型的模型参数进行调整;
直到调整后的初始图像识别模型处于收敛状态,将调整后的初始图像识别模型,确定为用于识别上述目标图像的目标图像识别模型。
可理解的是,上述标注对象属性包括上述样本对象的标注对象位置、标注对象类别、标注对象尺寸以及标注置信度;上述预测对象属性包括上述样本对象的预测对象位置、预测对象类别、预测对象尺寸以及预测置信度;上述标注对象位置、上述预测对象位置均用于反映上述样本对象位于上述样本图像中的位置;上述标注置信度和上述预测置信度均用于反映上述样本图像中存在上述样本对象的概率;
处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现根据上述预测对象属性和上述标注对象属性,确定上述初始图像识别模型的对象识别误差,包括:
采用上述标注对象位置和上述预测对象位置,确定上述初始图像识别模型的对象位置识别误差;
采用上述标注对象类别和上述预测对象类别,确定上述初始图像识别模型的对象类别识别误差;
采用上述标注对象尺寸和上述预测对象尺寸,确定上述初始图像识别模型的对象尺寸识别误差;
采用上述标注置信度和上述预测置信度,确定上述初始图像识别模型的置信度识别误差;
根据上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差,确定上述初始图像识别模型的对象识别误差。
可理解的是,上述标注对象位置包括上述样本对象的锚定框的中心点在第一方向上的第一坐标值和在第二方向上的第二坐标值;上述预测对象位置包括上述样本对象的预测框的中心点在上述第一方向上的第三坐标值和在上述第二方向上的第四坐标值;
处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现采用上述标注对象位置和上述预测对象位置,确定上述初始图像识别模型的对象位置识别误差,包括:
获取上述第一坐标值和上述第三坐标值之间的差值,作为第一坐标差值;
获取上述第二坐标值和上述第四坐标值之间的差值,作为第二坐标差值;
根据上述第一坐标差值与上述第二坐标差值,确定上述初始图像识别模型的对象位置识别误差。
可理解的是,上述标注对象尺寸包括上述锚定框的宽度和高度,上述预测对象尺寸包括上述预测框的宽度和高度;
处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现采用上述标注对象尺寸和上述预测对象尺寸,确定上述初始图像识别模型的对象尺寸识别误差,包括:
获取上述锚定框的宽度与上述预测框的宽度之间的差值,作为宽度偏差;
获取上述锚定框的高度与上述预测框的高度之间的差值,作为高度偏差;
根据上述宽度偏差和上述高度偏差,确定上述初始图像识别模型的对象尺寸识别误差。
可理解的是,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现根据上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差,确定上述初始图像识别模型的对象识别误差,包括:
获取上述目标图像识别模型的应用场景;
根据上述目标图像识别模型的应用场景,确定在上述应用场景下分别针对上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差的关注度;
根据上述关注度,确定上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差分别对应的权重;
采用上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差分别对应的权重,对上述对象位置识别误差、上述对象类别识别误差、上述对象尺寸识别误差和上述置信度识别误差进行加权求和处理,得到上述初始图像识别模型的对象识别误差。
可理解的是,处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
调用本地存储的上述第一图像识别子模型,对上述目标图像进行底层体征提取,得到底层特征图;
将上述底层特征图发送至服务器,上述服务器用于调用上述服务器中的上述第二图像识别子模型,对上述底层特征图进行对象识别,得到上述目标图像中的目标对象的对象属性;
接收上述服务器发送的上述目标对象的对象属性,根据上述对象属性对上述目标图像进行脱敏处理。
本申请中,基于目标图像识别模型的各个网络处理层针对目标图像中的图像特征的抽象程度,自适应地对目标图像识别模型划分,实现将目标图像识别模型的部分网络处理层(即第一图像识别子模型)部署在终端中,将目标图像识别模型的另一部分网络处理层(即第二图像识别子模型)部署在服务器端中,实现目标图像识别模型的协同部署,不需要将目标识别模型的所有网络处理层均部署在终端中,降低终端的图像处理压力。此处的抽象程度用于反映用户从网络处理层输出的图像特征中能够分辨出目标图像中的目标对象(或目标对象的对象属性)的难度,即网络处理层对应的抽象程度越高,用户从网络处理层输出的图像特征中更加难以分辨出目标图像中的目标对象;反之,网络处理层对应的抽象程度越低,用户从网络处理层输出的图像特征中更容易分辨出目标图像中的目标对象。即基于该抽象程度划分得到的第一图像识别子模型用于输出的目标图像的底层特征图,从该底层特征图中不能分辨出目标图像中的目标对象(或目标对象的对象属性),因此,在终端需要识别目标图像中的目标对象的对象属性时,只需要终端将底层特征图上传至服务器,由服务器通过第二图像识别子模型对底层特征图进行对象识别,得到目标对象的对象属性,不需要终端将原始的目标图像上传至服务器,这样可以避免目标图像中的隐私数据泄露,同时提高图像识别精度。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文对应实施例中对上述图像数据处理方法的描述,也可执行前文图10所对应实施例中对上述图像数据处理装置的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且上述计算机可读存储介质中存储有前文提及的图像数据处理装置所执行的计算机程序,且上述计算机程序包括程序指令,当上述处理器执行上述程序指令时,能够执行前文对应实施例中对上述图像数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
作为示例,上述程序指令可被部署在一条计算机设备上执行,或者被部署在一条地点的至少两条计算机设备上执行,又或者,在分布在至少两条地点且通过通信网络互连的至少两条计算机设备上执行,分布在至少两条地点且通过通信网络互连的至少两条计算机设备可以组成区块链网络。
上述计算机可读存储介质可以是前述任一实施例提供的图像数据处理装置或者上述计算机设备的中部存储单元,例如计算机设备的硬盘或中存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的中部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同媒体中容,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
本申请实施例还提供了一种计算机程序产品,包括计算机程序/指令,上述计算机程序/指令被处理器执行时实现前文对应实施例中对上述图像数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机程序产品的实施例中未披露的技术细节,请参照本申请方法实施例的描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每条特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例提供的方法及相关装置是参照本申请实施例提供的方法流程图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程网络连接设备的处理器以产生一条机器,使得通过计算机或其他可编程网络连接设备的处理器执行的指令产生用于实现在流程图一条流程或多条流程和/或结构示意图一条方框或多条方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程网络连接设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一条流程或多条流程和/或结构示意图一条方框或多条方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程网络连接设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一条流程或多条流程和/或结构示意一条方框或多条方框中指定的功能的步骤。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。
Claims (15)
1.一种图像数据处理方法,其特征在于,包括:
获取用于识别目标图像的目标图像识别模型;所述目标图像识别模型包括M个网络处理层;
确定所述M个网络处理层分别对所述目标图像中的图像特征的抽象程度;
根据所述M个网络处理层分别对应的抽象程度,对所述M个网络处理层进行划分,得到第一图像识别子模型和第二图像识别子模型;
将所述第一图像识别子模型部署在用于协同部署所述目标图像识别模型的终端中,将所述第二图像识别子模型部署在用于协同部署所述目标图像识别模型的服务器中;所述终端用于调用所述第一图像识别子模型提取所述目标图像的底层特征图,所述服务器用于从所述终端中获取所述底层特征图,调用所述第二图像识别子模型对所述底层特征图进行对象识别,得到所述目标图像中的目标对象的对象属性。
2.如权利要求1所述的方法,其特征在于,所述M个网络处理层包括图像输入层和识别结果输出层;
所述确定所述M个网络处理层分别对所述目标图像中的图像特征的抽象程度,包括:
按照从述图像输入层至所述识别结果输出层的方向,依次生成所述M个网络处理层分别对应的层序号;
根据所述M个网络处理层分别对应的层序号,确定所述M个网络处理层分别对所述目标图像中的图像特征的抽象程度。
3.如权利要求2所述的方法,其特征在于,所述M个网络处理层中的网络处理层的层序号与对应网络处理层针对所述目标图像中的图像特征的抽象程度之间具有正相关关系;
所述根据所述M个网络处理层分别对应的抽象程度,对所述M个网络处理层进行划分,得到第一图像识别子模型和第二图像识别子模型,包括:
获取所述终端的图像处理性能参数;
根据所述终端的图像处理性能参数,从所述M个网络处理层中筛选出满足所述终端的图像处理条件的N个网络处理层;所述N个网络处理层分别对应的层序号之间具有相邻连续关系;
按照所述N个网络处理层分别对应的层序号由大到小的顺序,依次遍历所述N个网络处理层分别对应的抽象程度;
若遍历到所述N个网络处理层中存在对应抽象程度大于抽象程度阈值的网络处理层,则将所述N个网络处理层确定为第一图像识别子模型;
将剩余网络处理层,确定为第二图像识别子模型;所述剩余网络处理层为所述M个网络处理层中除所述第一图像识别子模型中的网络处理层以外的网络处理层。
4.如权利要求3所述的方法,其特征在于,所述根据所述终端的图像处理性能参数,从所述M个网络处理层中筛选出满足所述终端的图像处理条件的N个网络处理层,包括:
获取所述M个网络处理层分别需要占用所述终端的计算资源量;
根据所述终端的图像处理性能参数,确定所述终端中处于可使用状态的计算资源对应的限制计算资源量;
按照所述M个网络处理层分别对应的层序号从小到大的顺序,依次累计所述M个网络处理层分别对应计算资源量;
若累计得到所述M个网络处理层中的N个网络处理层的计算资源量与所述限制计算资源量之间的差值小于差值阈值,则被累计到的N个网络处理层,确定为满足所述终端的图像处理条件的N个网络处理层。
5.如权利要求1所述的方法,其特征在于,所述获取用于识别目标图像的目标图像识别模型,包括:
获取样本图像中的样本对象的标注对象属性;
调用初始图像识别模型,对所述样本图像进行对象预测,得到所述样本对象的预测对象属性;
根据所述预测对象属性和所述标注对象属性,对所述初始图像识别模型进行调整,得到用于识别所述目标图像的目标图像识别模型。
6.如权利要求5所述的方法,其特征在于,所述根据所述预测对象属性和所述标注对象属性,对所述初始图像识别模型进行调整,得到用于识别所述目标图像的目标图像识别模型,包括:
根据所述预测对象属性和所述标注对象属性,确定所述初始图像识别模型的对象识别误差;
根据所述对象识别误差,确定所述初始图像识别模型的状态;
若所述初始图像识别模型处于未收敛状态,则根据所述对象识别误差对所述初始图像识别模型的模型参数进行调整;
直到调整后的初始图像识别模型处于收敛状态,将调整后的初始图像识别模型,确定为用于识别所述目标图像的目标图像识别模型。
7.如权利要求6所述的方法,其特征在于,所述标注对象属性包括所述样本对象的标注对象位置、标注对象类别、标注对象尺寸以及标注置信度;所述预测对象属性包括所述样本对象的预测对象位置、预测对象类别、预测对象尺寸以及预测置信度;所述标注对象位置、所述预测对象位置均用于反映所述样本对象位于所述样本图像中的位置;所述标注置信度和所述预测置信度均用于反映所述样本图像中存在所述样本对象的概率;
所述根据所述预测对象属性和所述标注对象属性,确定所述初始图像识别模型的对象识别误差,包括:
采用所述标注对象位置和所述预测对象位置,确定所述初始图像识别模型的对象位置识别误差;
采用所述标注对象类别和所述预测对象类别,确定所述初始图像识别模型的对象类别识别误差;
采用所述标注对象尺寸和所述预测对象尺寸,确定所述初始图像识别模型的对象尺寸识别误差;
采用所述标注置信度和所述预测置信度,确定所述初始图像识别模型的置信度识别误差;
根据所述对象位置识别误差、所述对象类别识别误差、所述对象尺寸识别误差和所述置信度识别误差,确定所述初始图像识别模型的对象识别误差。
8.如权利要求7所述的方法,其特征在于,所述标注对象位置包括所述样本对象的锚定框的中心点在第一方向上的第一坐标值和在第二方向上的第二坐标值;所述预测对象位置包括所述样本对象的预测框的中心点在所述第一方向上的第三坐标值和在所述第二方向上的第四坐标值;
所述采用所述标注对象位置和所述预测对象位置,确定所述初始图像识别模型的对象位置识别误差,包括:
获取所述第一坐标值和所述第三坐标值之间的差值,作为第一坐标差值;
获取所述第二坐标值和所述第四坐标值之间的差值,作为第二坐标差值;
根据所述第一坐标差值与所述第二坐标差值,确定所述初始图像识别模型的对象位置识别误差。
9.如权利要求8所述的方法,其特征在于,所述标注对象尺寸包括所述锚定框的宽度和高度,所述预测对象尺寸包括所述预测框的宽度和高度;
所述采用所述标注对象尺寸和所述预测对象尺寸,确定所述初始图像识别模型的对象尺寸识别误差,包括:
获取所述锚定框的宽度与所述预测框的宽度之间的差值,作为宽度偏差;
获取所述锚定框的高度与所述预测框的高度之间的差值,作为高度偏差;
根据所述宽度偏差和所述高度偏差,确定所述初始图像识别模型的对象尺寸识别误差。
10.如权利要求7所述的方法,其特征在于,所述根据所述对象位置识别误差、所述对象类别识别误差、所述对象尺寸识别误差和所述置信度识别误差,确定所述初始图像识别模型的对象识别误差,包括:
获取所述目标图像识别模型的应用场景;
根据所述目标图像识别模型的应用场景,确定在所述应用场景下分别针对所述对象位置识别误差、所述对象类别识别误差、所述对象尺寸识别误差和所述置信度识别误差的关注度;
根据所述关注度,确定所述对象位置识别误差、所述对象类别识别误差、所述对象尺寸识别误差和所述置信度识别误差分别对应的权重;
采用所述对象位置识别误差、所述对象类别识别误差、所述对象尺寸识别误差和所述置信度识别误差分别对应的权重,对所述对象位置识别误差、所述对象类别识别误差、所述对象尺寸识别误差和所述置信度识别误差进行加权求和处理,得到所述初始图像识别模型的对象识别误差。
11.如权利要求1所述的方法,其特征在于,所述方法还包括:
调用本地存储的所述第一图像识别子模型,对所述目标图像进行底层体征提取,得到底层特征图;
将所述底层特征图发送至服务器,所述服务器用于调用所述服务器中的所述第二图像识别子模型,对所述底层特征图进行对象识别,得到所述目标图像中的目标对象的对象属性;
接收所述服务器发送的所述目标对象的对象属性,根据所述对象属性对所述目标图像进行脱敏处理。
12.一种图像数据处理装置,其特征在于,包括:
获取模块,用于获取用于识别目标图像的目标图像识别模型,以及用于协同部署所述目标图像识别模型的终端的图像处理性能参数;所述目标图像识别模型包括M个网络处理层;
确定模块,用于确定所述M个网络处理层分别对所述目标图像中的图像特征的抽象程度;
划分模块,用于根据所述M个网络处理层分别对应的抽象程度以及所述终端的图像处理性能参数,对所述M个网络处理层进行划分,得到第一图像识别子模型和第二图像识别子模型;
部署模块,用于将所述第一图像识别子模型部署在所述终端中,将所述第二图像识别子模型部署在用于协同部署所述目标图像识别模型的服务器中;所述终端用于调用所述第一图像识别子模型提取所述目标图像的底层特征图,所述服务器用于从所述终端中获取所述底层特征图,调用所述第二图像识别子模型对所述底层特征图进行对象识别,得到所述目标图像中的目标对象的对象属性。
13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。
15.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211324086.4A CN117036720A (zh) | 2022-10-27 | 2022-10-27 | 图像数据处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211324086.4A CN117036720A (zh) | 2022-10-27 | 2022-10-27 | 图像数据处理方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117036720A true CN117036720A (zh) | 2023-11-10 |
Family
ID=88635973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211324086.4A Pending CN117036720A (zh) | 2022-10-27 | 2022-10-27 | 图像数据处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117036720A (zh) |
-
2022
- 2022-10-27 CN CN202211324086.4A patent/CN117036720A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111126258A (zh) | 图像识别方法及相关装置 | |
CN109886330B (zh) | 文本检测方法、装置、计算机可读存储介质和计算机设备 | |
CN111738280A (zh) | 一种图像识别方法、装置、设备及可读存储介质 | |
CN110929806B (zh) | 基于人工智能的图片处理方法、装置及电子设备 | |
CN112954399B (zh) | 一种图像处理方法、装置以及计算机设备 | |
CN112651333B (zh) | 静默活体检测方法、装置、终端设备和存储介质 | |
CN112233428B (zh) | 车流量预测方法、装置、存储介质及设备 | |
CN112862023A (zh) | 对象密度确定方法、装置、计算机设备和存储介质 | |
CN114550051A (zh) | 一种车损检测方法、装置、计算机设备及存储介质 | |
CN115830449A (zh) | 显式轮廓引导和空间变化上下文增强的遥感目标检测方法 | |
CN112668675B (zh) | 一种图像处理方法、装置、计算机设备及存储介质 | |
CN106530198A (zh) | 基于参数拟合安全容量的自适应批量隐写方法 | |
CN116205726B (zh) | 一种贷款风险预测方法、装置、电子设备及存储介质 | |
CN113706551A (zh) | 一种图像分割方法、装置、设备及存储介质 | |
CN113570512A (zh) | 一种图像数据处理方法、计算机及可读存储介质 | |
CN117036720A (zh) | 图像数据处理方法、装置、设备及存储介质 | |
CN115345782A (zh) | 图像处理方法、装置、计算机、可读存储介质及程序产品 | |
CN111461091B (zh) | 万能指纹生成方法和装置、存储介质及电子装置 | |
CN115082873A (zh) | 基于通路融合的图像识别方法、装置及存储介质 | |
CN116958176B (zh) | 图像分割方法、装置、计算机设备及介质 | |
CN116883765B (zh) | 图像分类方法、装置、电子设备及存储介质 | |
CN117058498B (zh) | 分割图评估模型的训练方法、分割图的评估方法及装置 | |
CN116778534B (zh) | 图像处理方法、装置、设备和介质 | |
CN117314756B (zh) | 基于遥感图像的验保方法、装置、计算机设备及存储介质 | |
CN115311525B (zh) | 深度伪造检测方法及对应装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40097758 Country of ref document: HK |