CN111402120B - 一种标注图像处理方法及装置 - Google Patents
一种标注图像处理方法及装置 Download PDFInfo
- Publication number
- CN111402120B CN111402120B CN202010198455.4A CN202010198455A CN111402120B CN 111402120 B CN111402120 B CN 111402120B CN 202010198455 A CN202010198455 A CN 202010198455A CN 111402120 B CN111402120 B CN 111402120B
- Authority
- CN
- China
- Prior art keywords
- image
- original image
- labeling
- processing
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 292
- 238000003672 processing method Methods 0.000 title claims description 14
- 238000012545 processing Methods 0.000 claims abstract description 167
- 238000000034 method Methods 0.000 claims abstract description 103
- 230000011218 segmentation Effects 0.000 claims abstract description 32
- 238000001514 detection method Methods 0.000 claims description 67
- 230000008569 process Effects 0.000 claims description 67
- 238000006243 chemical reaction Methods 0.000 claims description 24
- 230000009466 transformation Effects 0.000 claims description 21
- 238000004891 communication Methods 0.000 claims description 20
- 230000005540 biological transmission Effects 0.000 abstract description 10
- 230000006798 recombination Effects 0.000 abstract 1
- 238000005215 recombination Methods 0.000 abstract 1
- 238000012549 training Methods 0.000 description 35
- 238000007726 management method Methods 0.000 description 31
- 238000013136 deep learning model Methods 0.000 description 18
- 230000002452 interceptive effect Effects 0.000 description 16
- 238000007781 pre-processing Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000013479 data entry Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0428—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Bioethics (AREA)
- Computing Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Image Processing (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请提供一种标注图像处理方法及装置,其中,标注图像处理方法应用于服务器,服务器与客户端之间采用加密协议进行通信,包括:接收客户端发送的获取待标注图像的请求;向客户端发送待标注图像;其中,待标注图像为与待标注的原始图像对应的一幅或者多幅模糊化图像;接收客户端发送的标注完成的标注信息,并将标注信息进行处理获取与原始图像对应的标注信息。因此,客户端与服务器之间采用加密协议进行通信,可以保证数据在服务器与客户端之间进行传输的安全性;此外,通过简单的对待标注图像的处理,包括模糊化处理、切分及重组处理等,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
Description
技术领域
本申请涉及图像处理领域,具体而言,涉及一种标注图像处理方法及装置。
背景技术
众所周知,对深度学习模型进行训练时需要大量的已标注数据,利用已标注的数据作为样本数据对深度学习模型进行训练,以得到对应的模型。对数据进行批注的过程通常是人为执行的,而人工标注大批量数据一个重大的问题就是隐私泄露。为了保护隐私,目前业界常用做法是,标注系统限制在公司内部运行,依靠严格的管理措施来保证数据安全。但是,采用上述做法,虽然能够保证一定的安全性,但是限制较多,导致成本较高。
发明内容
本申请实施例的目的在于提供一种标注图像处理方法及装置,用以解决进行数据标注时安全管理的成本较高的技术问题。
为了实现上述目的,本申请实施例所提供的技术方案如下所示:
第一方面,本申请实施例提供一种标注图像处理方法,应用于服务器,所述服务器与客户端之间采用加密协议进行通信,包括:通过所述加密协议接收所述客户端发送的获取待标注图像的请求;通过所述加密协议向所述客户端发送所述待标注图像;其中,所述待标注图像为与待标注的原始图像对应的一幅或者多幅模糊化图像;通过所述加密协议接收所述客户端发送的标注完成的标注信息,并将所述标注信息进行处理获取与所述原始图像对应的标注信息。因此,客户端与服务器之间采用加密协议进行通信,可以保证数据在服务器与客户端之间进行传输的安全性;此外,向标注人员提供的待标注图像是模糊化图像,模糊化图像在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中。综上,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,在所述通过所述加密协议接收所述客户端发送的获取待标注图像的请求之前,所述标注图像处理方法还包括:获取待标注的所述原始图像;对所述原始图像进行模糊化处理,得到与所述原始图像对应的一幅或者多幅所述模糊化图像;其中,所述模糊化处理包括修改所述原始图像的细节信息或者分割所述原始图像中多个对象的关联关系。因此,在将原始图像提供给标注人员进行标注之前,可以先对原始图像进行模糊化预处理,从而使得模糊化预处理后的图像可以在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中,从而通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,对于用于图像分类任务的所述原始图像,所述对所述原始图像进行模糊化处理,得到与所述原始图像对应的一幅所述模糊化图像,包括:去除所述原始图像的纹理信息或者局部对比度信息,得到所述模糊化图像。因此,可以通过去除原始图像的纹理信息或者局部对比度信息,产生一个丢失部分细节的图像提供给标注人员,从而使得模糊化后的图像可以在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中,从而通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,对于用于目标检测任务的所述原始图像,所述对所述原始图像进行模糊化处理,得到与所述原始图像对应的多幅所述模糊化图像,包括:对所述原始图像进行切分,得到N幅子图像;其中,N幅所述子图像之间有重叠部分,N为大于1的整数;对N幅所述子图像进行风格转换,以去除所述子图像中的部分细节,得到N幅所述模糊化图像。因此,可以通过对原始图像进行切分以及风格转化,从而使得每个标注人员只能看到一个局部的信息,从而保证了完整信息的安全,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,所述通过所述加密协议向所述客户端发送所述待标注图像,包括:通过所述加密协议向至少两个客户端发送M幅所述模糊化图像,M为小于N且不等于零的整数。因此,可以将切分得到的多幅模糊化图像发送给不同的标注人员进行标注,从而使得每个标注人员只能看到一个局部的信息,从而保证了完整信息的安全,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,所述对所述原始图像进行模糊化处理,得到与所述原始图像对应的一幅所述模糊化图像,包括:从所述原始图像中确定至少一类检测对象所在的范围,并对所述范围内的所述检测对象进行模糊化处理,得到一幅所述模糊化图像。因此,可以对原始图像中的多个检测对象进行模糊化处理,得到模糊化图像,从而通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,当接收到所述客户端针对第一类检测对象完成的位置标注数据后,所述标注图像处理方法还包括:根据所述位置标注数据以及所述第一类检测对象所在的范围,对所述原始图像上所述第一类检测对象所在区域进行切分,得到多幅所述模糊化图像。因此,将多个检测对象所在的区域进行切分,从而使得每个标注人员只能看到一个局部的信息,从而保证了完整信息的安全,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,所述将所述标注信息进行处理获取与所述原始图像对应的标注信息,包括:对所述标注信息进行与所述模糊化处理相应的反变换处理,获取与所述原始图像对应的标注信息;其中,所述原始图像通过所述模糊化处理后得到一幅或多幅所述模糊化图像。因此,在获取到标注信息之后,可以对标注信息进行与所述模糊化处理相应的反变换处理,以得到与原始图像对应的标注信息,从而可以利用标注后的原始图像进行训练。
在本申请的可选实施例中,所述对所述标注信息进行与所述模糊化处理相应的反变换处理,获取与所述原始图像对应的标注信息,包括:记录对所述原始图像进行切分操作的切分位置;根据所述切分位置合并多组标注信息,得到在所述原始图像上的标注信息;其中,所述多组标注信息为接收的来自于多个所述客户端的标注信息。因此,在获取到标注信息之后,可以根据原始图像的切分位置合并多组标注信息,以得到与原始图像对应的标注信息,从而可以利用标注后的原始图像进行训练。
在本申请的可选实施例中,所述对所述标注信息进行与所述模糊化处理相应的反变换处理,获取与所述原始图像对应的标注信息,包括:根据检测对象与所述原始图像对应的索引信息以及多组所述标注信息,组合出所述原始图像的标注信息。因此,在获取到标注信息之后,可以根据原始图像对应的索引信息以及多组标注信息得到与原始图像对应的标注信息,从而可以利用标注后的原始图像进行训练。
第二方面,本申请实施例提供一种标注图像处理方法,应用于客户端,所述客户端与服务器之间采用加密协议进行通信,包括:通过所述加密协议向服务器请求获取待标注图像;通过所述加密协议接收所述服务器发送的待标注图像;其中,所述待标注图像为与待标注的原始图像对应的一幅或者多幅模糊化图像;接收用户的标注指令并对所述待标注图像进行标注,得到标注完成的标注信息;通过所述加密协议将所述标注信息发送给所述服务器进行处理。因此,客户端与服务器之间采用加密协议进行通信,可以保证数据在服务器与客户端之间进行传输的安全性;此外,标注人员获取到的待标注图像是模糊化图像,模糊化图像在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中。综上,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,在所述通过所述加密协议向所述服务器请求获取待标注图像之前,所述标注图像处理方法包括:获取待标注图像;通过所述加密协议向所述服务器发送所述待标注图像,以使所述服务器存储所述待标注图像。因此,数据录入员可以通过加密协议向服务器发送待标注图像,从而保证数据传输过程的安全性。
在本申请的可选实施例中,所述获取待标注图像包括:获取原始图像;对所述原始图像进行加密,并得到加密后的所述待标注图像。因此,对待标注图像进行加密后,再发送给服务器进行存储,从而保证存储的数据的安全性。
第三方面,本申请实施例提供一种标注图像处理方法,应用于第二服务器,包括:获取待标注的原始图像;对所述原始图像进行模糊化预处理,得到与所述原始图像对应的一幅或者多幅模糊化图像;其中,所述模糊化处理包括修改所述原始图像的细节信息或者分割所述原始图像中多个对象的关联关系;输出所述模糊化图像,以使标注人员基于所述模糊化图像完成图像标注。因此,在将原始图像提供给标注人员进行标注之前,可以先对原始图像进行模糊化预处理,从而使得模糊化预处理后的图像可以在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中,从而降低数据标注时数据存在的泄密风险,提高数据标注的安全性。
在本申请的可选实施例中,对于用于图像分类任务的所述原始图像,所述对所述原始图像进行模糊化预处理,得到与所述原始图像对应的一幅模糊化图像,包括:对所述原始图像进行风格转换,以去除所述原始图像中的部分细节,得到一幅所述模糊化图像。因此,可以通过对原始图像进行风格转换,产生一个丢失部分细节的图像提供给标注人员,从而使得风格转换后的图像可以在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中,从而降低数据标注时数据存在的泄密风险,提高数据标注的安全性。
在本申请的可选实施例中,对于用于目标检测任务的所述原始图像,所述对所述原始图像进行模糊化预处理,得到与所述原始图像对应的多幅模糊化图像,包括:对所述原始图像进行切分,得到N幅子图像;其中,N幅所述子图像之间有重叠部分,N为大于1的整数;对N幅所述子图像进行风格转换,以去除所述子图像中的部分细节,得到N幅所述模糊化图像。因此,可以通过对原始图像进行切分以及风格转化,并将切分得到的子图像发送给不同的标注人员进行标注,从而使得每个标注人员只能看到一个局部的信息,从而保证了完整信息的安全,降低数据标注时数据存在的泄密风险,提高数据标注的安全性。
第四方面,本申请实施例提供一种标注图像处理装置,应用于服务器,所述服务器与客户端之间采用加密协议进行通信,包括:第一接收模块,用于通过所述加密协议接收所述客户端发送的获取待标注图像的请求;发送模块,用于通过所述加密协议向所述客户端发送所述待标注图像;其中,所述待标注图像为与待标注的原始图像对应的一幅或者多幅模糊化图像;第二接收模块,用于通过所述加密协议接收所述客户端发送的标注完成的标注信息,并将所述标注信息进行处理获取与所述原始图像对应的标注信息。因此,客户端与服务器之间采用加密协议进行通信,可以保证数据在服务器与客户端之间进行传输的安全性;此外,向标注人员提供的待标注图像是模糊化图像,模糊化图像在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中。综上,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,所述标注图像处理装置还包括:获取模块,用于获取待标注的所述原始图像;处理模块,用于对所述原始图像进行模糊化处理,得到与所述原始图像对应的一幅或者多幅所述模糊化图像;其中,所述模糊化处理包括修改所述原始图像的细节信息或者分割所述原始图像中多个对象的关联关系。因此,在将原始图像提供给标注人员进行标注之前,可以先对原始图像进行模糊化预处理,从而使得模糊化预处理后的图像可以在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中,从而通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,对于用于图像分类任务的所述原始图像,所述处理模块还用于:去除所述原始图像的纹理信息或者局部对比度信息,得到所述模糊化图像。因此,可以通过去除原始图像的纹理信息或者局部对比度信息,产生一个丢失部分细节的图像提供给标注人员,从而使得模糊化后的图像可以在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中,从而通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,对于用于目标检测任务的所述原始图像,所述处理模块还用于:对所述原始图像进行切分,得到N幅子图像;其中,N幅所述子图像之间有重叠部分,N为大于1的整数;对N幅所述子图像进行风格转换,以去除所述子图像中的部分细节,得到N幅所述模糊化图像。因此,可以通过对原始图像进行切分以及风格转化,从而使得每个标注人员只能看到一个局部的信息,从而保证了完整信息的安全,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,所述发送模块还用于:通过所述加密协议向至少两个客户端发送M幅所述模糊化图像,M为小于N且不等于零的整数。因此,可以将切分得到的多幅模糊化图像发送给不同的标注人员进行标注,从而使得每个标注人员只能看到一个局部的信息,从而保证了完整信息的安全,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,所述处理模块还用于:从所述原始图像中确定至少一类检测对象所在的范围,并对所述范围内的所述检测对象进行模糊化处理,得到一幅所述模糊化图像。因此,可以对原始图像中的多个检测对象进行模糊化处理,得到模糊化图像,从而通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,当接收到所述客户端针对第一类检测对象完成的位置标注数据后,所述标注图像处理装置还包括:切分模块,用于根据所述位置标注数据以及所述第一类检测对象所在的范围,对所述原始图像上所述第一类检测对象所在区域进行切分,得到多幅所述模糊化图像。因此,将多个检测对象所在的区域进行切分,从而使得每个标注人员只能看到一个局部的信息,从而保证了完整信息的安全,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
在本申请的可选实施例中,所述第二接收模块还用于:对所述标注信息进行与所述模糊化处理相应的反变换处理,获取与所述原始图像对应的标注信息;其中,所述原始图像通过所述模糊化处理后得到一幅或多幅所述模糊化图像。因此,在获取到标注信息之后,可以对标注信息进行与所述模糊化处理相应的反变换处理,以得到与原始图像对应的标注信息,从而可以利用标注后的原始图像进行训练。
在本申请的可选实施例中,所述第二接收模块还用于:记录对所述原始图像进行切分操作的切分位置;根据所述切分位置合并多组标注信息,得到在所述原始图像上的标注信息;其中,所述多组标注信息为接收的来自于多个所述客户端的标注信息。因此,在获取到标注信息之后,可以根据原始图像的切分位置合并多组标注信息,以得到与原始图像对应的标注信息,从而可以利用标注后的原始图像进行训练。
在本申请的可选实施例中,所述第二接收模块还用于:根据检测对象与所述原始图像对应的索引信息以及多组所述标注信息,组合出所述原始图像的标注信息。因此,在获取到标注信息之后,可以根据原始图像对应的索引信息以及多组标注信息得到与原始图像对应的标注信息,从而可以利用标注后的原始图像进行训练。
第五方面,本申请实施例提供一种电子设备,包括:处理器、存储器和总线;所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如第一方面、第二方面以及第三方面中的标注图像处理方法。
第六方面,本申请实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面、第二方面以及第三方面中的标注图像处理方法。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举本申请实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种标注图像处理系统的结构框图;
图2为本申请实施例提供的一种标注图像处理方法的流程图;
图3为本申请实施例提供的另一种标注图像处理方法的流程图;
图4为本申请实施例提供的一种标注图像处理装置的结构框图;
图5为本申请实施例提供的一种电子设备的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
目前在各种图像(例如:证件图像,证件图像可以包括身份证、驾照、护照、户口等)的识别中,基于深度学习的各种算法已经成为业界主流。众所周知,深度学习模型训练需要大量的已标注数据,而人工标注大批量的图像(例如,证件图像、其他需要目标识别或者需要分类的图像)一个重大的问题就是隐私泄露。因此,为了保护数据安全,目前一般的做法是限制标注工作的整个流程都在局部区域内(例如:公司内部)进行,相关的工作电脑屏蔽通用串行总线(Universal Serial Bus,USB)口和外部网络连接,然后再辅以严格的管理措施(例如:禁止手机拍照)等。
然而,上述做法虽然保证了一定的安全性,但效率往往会降低,标注成本和管理成本也会大大增加。这是由于,数据标注工作对技能要求并不高,是一个工作量大但是技术含量不高的任务,普通人经过简单培训可以迅速上手,对能力学历等条件基本无要求。如果能够解决数据安全问题,就可以在人力成本较低的偏远地区进行远程标注,这样可以大大降低标注成本,同时管理难度也会小得多。
因此,基于上述分析,本申请实施例提供了一种标注图像处理系统100,请参照图1,图1为本申请实施例提供的一种标注图像处理系统的结构框图。该系统包括至少一个客户端101以及至少一个服务器102,且服务器102与客户端101之间可以采用加密协议进行通信。在本申请实施例提供的标注图像处理系统100中,客户端101可以是网页应用的形式,并不限于操作系统本地可执行程序;标注图像处理系统100也可以采用CS结构,本申请实施例对此不作具体的限定。利用本申请实施例提供的标注图像处理系统100,服务器102与客户端101之间通信时,可以减少数据泄露,从而提高数据标注的安全性。
作为一种实施方式,服务器102可以包括三个部分:主服务程序、数据库以及数据存储节点。主服务程序可以用于响应客户端101的请求,比如用户登录请求、保存标注信息请求等,是整个标注图像处理过程的组织者和控制者。其中,数据库可以用于保存标注任务的所有信息,一般情况下,一个标注任务就是一个数据库表,其中记录了该标注任务的所有标注结果。除此之外,数据库中还可以存在其它各种表格,比如用户表格(例如:记录账户信息、权限等内容),统计信息表格(例如:记录标注工作量、进度等内容),以及数据集表格(保存数据集的具体存储位置和其它信息如数据类型,解码器等)。数据存储节点可以用于保存各种原始数据,例如:原始图像、原始视频等。
需要说明的是,在一个标注图像处理系统100中,主服务程序一般只有一个,而数据库可以配置为多个,存储节点也可以使用多个。服务器102中的三个部分可以位于同一局域网内部,也可以不位于同一局域网内,本申请实施例对此不作具体的限定。
在本申请实施例中,服务器102可以接受多种用户角色的操作和控制,例如:系统管理员、数据录入员、标注经理以及标注人员。其中,系列管理员负责标注图像处理系统100中所有用户的管理,包括用户的增删、权限修改等。数据录入员负责录入数据集,包括指定存储位置、设置加密方式等。标注经理负责任务分配、进度监督和标注审核等。标注人员负责数据标注。
作为另一种实施方式,客户端101的功能可以包括:连接服务器102、用户登录、获取任务信息、获取数据、将标注信息发送给服务器102等。除此之外,客户端101的主要功能还有界面操作,即按特定的方式显示数据以及响应用户的标注操作。由于界面操作和具体的任务类型关系较大,比如同样是标注一个图像,图像分类任务和光学字符识别(OpticalCharacterRecognition,OCR)识别任务就大不相同,因此界面相关的部分(包括数据显示和标注操作)往往需要针对每种任务重新实现或者修改。考虑到这种情况,客户端101实现时可以分为两大部分:一部分是和服务器102的交互逻辑,这部分和具体任务类型无关,可以剥离出来,形成一个基础模块供调用。另一部分是界面相关的部分,这部分变化较多,随着业务的调整,可能需要持续修改。此外,客户端101还可以支持标注审核,因为标注经理审核标注质量也是通过一个客户端101程序进行的。
基于上述标注图像处理系统100,本申请实施例介绍一个示例性的标注流程:
第一步,输入录入员添加一批数据到标注图像处理系统100中。
第二步,标注经理划分好子任务,并将各子任务分配给标注人员。
第三步,标注人员(远程)登录到标注图像处理系统100中,依次请求自己任务中每个数据,标注并保存。
第四步,标注经理监督标注进度并审核标注质量。
第五步,标注完成后,标注经理将标注结果导出,提交给算法开发人员。
需要说明的是,上述标注流程仅为一个成熟的标注任务流程,若是一个全新的标注任务,在上述流程之前,还需要算法人员确定标注方法、标注输出格式等细节。然后,程序开发人员根据算法方面的要求,开发出对应的客户端101程序。客户端101程序发送给服务器102的标注数据就是算法人员要求的格式,可以理解的是,由于服务器102和数据库并不处理具体的数据格式,因此,客户端101程序发送给服务器102的标注数据需要先进行序列化。相应的,标注完成后,算法人员得到的也是一个序列化后的二进制数据文件,反序列化后就得到规定格式的标注信息。
需要说明的是,本申请实施例对序列化的具体实施方式不作具体的限定,只需满足以下条件:第一,可安全的存储到数据库中,不会引起数据库格式解析错误;第二,算法人员知道如何反序列化。在实践中,我们可以要求算法人员针对自己的标注任务实现一个序列化及反序列化模块,该模块可以被用于客户端101程序。
上述标注图像处理系统100可以保证在服务器102的数据安全,以及服务器102与客户端101之间的通信安全,但无法保证数据在客户端101也是安全的。虽然服务器102可以每次只发送单个图像给客户端101,但由于是远程管理,如果客户端101被控制,仍存在数据批量泄露的风险。
发明人发现,首先,由于标注人员需要直接看到图像才能完成标注,图像必须要以某种标注人员方便理解的方式呈现出来;其次,为了避免截屏等拦截图像的手段,图像又不可以直接以原始方式展示。因此,需要找到一些展示方式,一方面可以被标注人员很方便的理解,另一方面将图像直接保存下来没有实际意义。
基于上述分析,本申请实施例提供一种标注图像处理方法,在该标注图像处理方法中,不将原始图像展示给标注人员,而是对原始图像进行一定的预处理后再展示给标注人员。可以理解的是,可以采用一些不会干扰标注人员正常辨识过程的预处理方式,使得他们可以在处理后的图像上毫不费力的完成标注,而同时,这些图像如果直接保存下来,对机器学习而言,没有什么使用价值。只需将最终得到的标注信息经过反变换,对应到原始图像上,最终训练时仍使用处理之前的图像,因此训练过程不受影响。
下面基于上述标注图像处理系统100对本申请实施例提供的标注图像处理方法进行详细的介绍。
请参照图2,图2为本申请实施例提供的一种标注图像处理方法的流程图,该标注图像处理方法应用于客户端以及服务器,该服务器除了用于对原始图像进行预处理,还用于与客户端进行交互,客户端与服务器之间采用加密协议进行通信。上述标注图像处理方法可以包括如下步骤:
步骤S201:客户端通过加密协议向服务器请求获取待标注图像。
步骤S202:服务器通过加密协议接收客户端发送的获取待标注图像的请求。
步骤S203:服务器通过所加密协议向客户端发送待标注图像。
步骤S204:客户端通过加密协议接收服务器发送的待标注图像。
步骤S205:客户端接收用户的标注指令并对待标注图像进行标注,得到标注完成的标注信息。
步骤S206:客户端通过加密协议将标注信息发送给服务器进行处理。
步骤S207:服务器通过加密协议接收客户端发送的标注完成的标注信息,并将标注信息进行处理获取与原始图像对应的标注信息。
具体的,为了保证数据传输时的安全,客户端与服务器之间可以通过加密协议进行通信,以防止网络抓包泄露数据。需要说明的是,本申请实施例对客户端与服务器之间采用的加密协议不作具体的限定,本领域技术人员可以根据实际情况进行合适的调整,例如,可以采用GRPC来实现。
可以理解的是,上述步骤S301-步骤S307与上述介绍标注图像处理系统时介绍的标注流程类似,均是利用客户端以及服务器对图像进行标注的步骤,因此,此处不再赘述。
在本申请实施例中,客户端与服务器之间采用加密协议进行通信,可以保证数据在服务器与客户端之间进行传输的安全性;此外,标注人员获取到的待标注图像是模糊化图像,模糊化图像在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中。综上,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
进一步的,在步骤S201之前,本申请实施例提供的标注图像处理方法还可以包括如下步骤:
第一步,客户端获取待标注图像。
第二步,客户端通过加密协议向服务器发送所述待标注图像,以使第二服务器存储待标注图像。
在本申请实施例中,数据录入员可以通过加密协议向服务器发送待标注图像,从而保证数据传输过程的安全性。
进一步的,上述获取待标注图像的步骤还可以包括如下步骤:
第一步,获取原始图像。
第二步,对原始图像进行加密,并得到加密后的待标注图像。
具体的,为了保证数据的安全,可以对原始图像进行加密,在对原始图像进行标注前再进行解密。需要说明的是,本申请实施例对解密的方式不作具体的限定,本领域技术人员可以根据实际情况进行合适的调整。
在本申请实施例中,对待标注图像进行加密后,再发送给服务器进行存储,从而保证存储的数据的安全性。
进一步的,请参照图3,图3为本申请实施例提供的另一种标注图像处理方法的流程图,在步骤S202之前,本申请实施例提供的标注图像处理方法还可以包括如下步骤:
步骤S301:服务器获取待标注的原始图像。
步骤S302:服务器对原始图像进行模糊化处理,得到与原始图像对应的一幅或者多幅模糊化图像。
具体的,服务器首先可以获取待标注的原始图像,其中,待标注的原始图像可以是任何需要进行标注的图像,例如:身份证、驾驶证、猫狗图画等。本申请实施例对服务器获取待标注的原始图像的方式不作具体的限定,可以是数据录入员手动上传的图像,也可以是其他服务器或者客户端向服务器发送的图像,本领域技术人员可以根据实际情况进行合适的调整。
服务器在获取到待标注的原始图像之后,可以对原始图像进行模糊化预处理。可以理解的是,本申请实施例所说的“模糊化”不同于图像处理技术上的“模糊”(例如:高斯模糊等),而是通过对图像进行变换、切割、混淆等处理,去掉图像中的某些细节,并得到与原始图像对应的一幅或者多幅模糊化图像。例如:模糊化处理可以包括边缘检测、二值化、风格转换等。然后,服务器可以向标注人员提供上述一幅或者多幅模糊化图像,以使标注人员基于模糊化图像完成图像标注。
作为一种实施方式,模糊化处理可以包括修改原始图像的细节信息或者分割原始图像中多个对象的关联关系。其中,修改原始图像的细节信息可以包括去除原始图像中的部分细节信息,或者对识别出的原始图像中的敏感信息所在区域进行打马赛克等处理;分割原始图像中多个对象的关联关系可以包括通过切分得到多幅图像,从而打乱一幅原始图像上多个对象之间的关联关系,并把这些图像发给不同人来标注。
可以理解的是,进行模糊化处理后得到的模糊化图像,标注人员仍然能够识别其中的内容,从而完成批注,但是对于深度学习的训练过程,计算机设备无法利用进行模糊化处理后得到的模糊化图像进行训练。因此,达到了降低数据泄密风险的目的。
需要说明的是,在深度学习中,常见的任务一般包括图像分类以及目标检测,针对不同的训练任务,模糊化处理可以有多种实现方式,例如:对于用于图像分类任务的原始图像,可以修改原始图像的细节信息;对于用于目标检测任务的原始图像,可以分割原始图像中多个对象的关联关系等。本申请实施例对此不作具体的限定,本领域技术人员可以根据实际情况进行合适的调整。
其中,由于模糊化后的图像丢失了大部分的细节,因此,计算机无法对图像进行相应的识别,但是,对于标注人员来说,即使丢失了大部分的细节,人眼也可以识别出大部分的图案。例如:原始图像是一张狗的照片,在丢失细节后,计算机无法对图像中的狗进行相应的识别,但是标注人员还是可以看出图像中是一只狗。
在本申请实施例中,在将原始图像提供给标注人员进行标注之前,可以先对原始图像进行模糊化预处理,从而使得模糊化预处理后的图像可以在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中,从而通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。进一步的,上述实施例中已经说明了上述步骤S302中的模糊化处理可以有多种实现方式,下面举例对步骤S302的实现方式进行详细的介绍。
作为一种实施方式,对于用于图像分类任务的原始图像,步骤S302可以包括如下步骤:
对原始图像进行风格转换,以去除原始图像中的部分细节,得到一幅模糊化图像。
具体的,在深度学习中,针对图像分类任务的标注较为简单,只需对每个图像添加一个或多个类别标签即可。也就是说,标注过程中,标注人员只需要看到大部分图像,以便确定图像中是否有某个目标即可。因此,为了避免将原始图像展示出来,我们可以对原始图像做一个风格转换。
本申请实施例中的风格转换的目的是去掉原始图像中的大部分细节,比如纹理信息或者局部对比信息等。作为一种实施方式,对原始图像进行风格转换可以采用传统的图像处理算法,例如:边缘检测以及二值化(只截断低灰度值为零,保留高灰度值)等;也可以使用GAN网络从原始图像生成一个特定风格的图像;其它一些风格转换的方式还可以包括几何变化、颜色变化、适当加入噪声、适当加入轻微模糊等。可以理解的是,上述风格转换的过程中,不能影响标注人员对图像的识别过程。
可以理解的是,步骤“去除原始图像的纹理信息或者局部对比度信息,得到模糊化图像”与前文中的“对原始图像进行风格转换,以去除原始图像中的部分细节,得到一幅模糊化图像”是相同的实施方式。
在本申请实施例中,可以通过对原始图像进行风格转换,产生一个丢失部分细节的图像提供给标注人员,从而使得风格转换后的图像可以在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中,从而通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
作为另一种实施方式,对于用于目标检测任务的原始图像,步骤S302可以包括如下步骤:
第一步,对原始图像进行切分,得到N幅子图像。
第二步,对N幅子图像进行风格转换,以去除子图像中的部分细节,得到N幅模糊化图像。
具体的,在深度学习中,针对目标检测任务的标注,需将图像中的特定目标框出来,并对每个框打上类别标签。其中,框可以用两个点或四个点来表示。为了保护图像,我们可以对原始图像做两种处理:切分以及风格转换。
首先将原始图像随机的按宽度或高度切分为N幅子图像,确保N幅子图像之间有重叠。然后对每幅子图像做风格转换。最后将N幅子图像发送给不同的标注人员标注,这样,不同的标注人员看到的都是原始图像的一部分内容,无法获知完整的原始图像中的信息。其中,N为大于1的整数。
在本申请实施例中,可以通过对原始图像进行切分以及风格转化,从而使得每个标注人员只能看到一个局部的信息,从而保证了完整信息的安全,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
进一步的,由于在真实场景下的业务,往往牵涉到多个过程以及多个模型,并不只是单一的图像分类任务或目标检测任务。因此,下面以身份证业务为例,对步骤S302的另一实现方式进行介绍。步骤S302可以包括如下步骤:
第一步,从原始图像中确定至少一类检测对象所在的范围(例如,以下示例中身份证的人脸和文字属于两类检测对象),并对范围内的所述检测对象进行模糊化处理,得到一幅模糊化图像。
第二步,当接收到客户端针对第一类检测对象完成的位置标注数据后,根据位置标注数据以及第一类检测对象所在的范围,对原始图像上第一类检测对象所在区域进行切分,得到多幅模糊化图像。
具体的,对于身份证业务,可以首先对身份证的图像进行分类:判定当前图像是否是身份证图像,并将身份证图像分为三个类型:身份证正面、身份证反面以及其它。然后对身份证图像进行识别,包括:定位出各字段的位置(如姓名,地址,身份证号的文本行位置),然后识别各文本行。最后输出一个结构化的数据,指明每个字段的位置和文本内容。其中,各字段的位置即上述步骤中第一类检测对象的位置。
根据具体的应用场合,分类过程不一定需要,但识别过程是必不可少的。具体的标注流程如下:
首先,对每个身份证图像做人脸检测以及文本检测,并记录检测结果(人脸和文本行的位置,也就是确定了两类检测对象)。其中,使用现有公开的人脸检测和文本检测模型即可达到人脸检测以及文本检测的目的。上述现有模型虽然检测精度上不一定很高,但由于防止的是大批量的数据泄露,对单个证件而言,即使(由于公开模型检测定位不准)泄露几个字符或部分人脸,也不会造成问题。
然后,对身份证图像中的人脸和文本行进行局部模糊(对两类对象分别进行模糊化处理)。其中,需保持人脸的范围大小以及文本行的范围大小不变。
其次,将处理后的身份证图像发生到客户端进行三种标注:身份证整体位置的标注、各字段文本行位置的标注以及人脸位置的标注。
最后,一个身份证图像经过上述三种标注完成后,将其中所有的文本行切成局部图像,每个文本行发送给不同的客户端进行文字内容标注。
上述流程中,实际可以看作为两个标注任务:检测任务和识别任务。检测任务中,标注人员可以看到整个身份证,但无法看到任何具体的信息,所有关键信息(姓名,身份证号,人脸图像)都被屏蔽了。识别任务中,标注人员可以看到每个条目的具体内容,但看到的每个条目都来自于不同的人,而不能看到同一人的完整信息。
在本申请实施例,通过这样的方式,可以完成身份证中所有信息的标注,同时没有完整的展示任何一个身份证的全部信息,因此数据的安全性得以保证。
进一步的,步骤S203可以包括如下步骤:
服务器通过加密协议向至少两个客户端发送M幅模糊化图像,M为小于N且不等于零的整数。
具体的,在将一个原始图像进行切分之后,为了保证标注人员不会泄露图像信息,可以将切分得到的N幅模糊化图像发送给不同的标注人员,例如:一个原始图像切分为了三幅模糊化图像,向三个标注人员分别发送其中一幅模糊化图像。因此,三个标注人员看到的都只是原始图像的局部信息,无法获知原始图像的完整信息。
在本申请实施例中,可以将切分得到的多幅模糊化图像发送给不同的标注人员进行标注,从而使得每个标注人员只能看到一个局部的信息,从而保证了完整信息的安全,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
进一步的,步骤S207可以包括如下步骤:
服务器对标注信息进行与模糊化处理相应的反变换处理,获取与原始图像对应的标注信息。
具体的,由于在标注人员进行标注之前,服务器对原始图像进行了模糊化预处理,经过模糊化处理后的图像无法进行模型训练,因此,服务器还需要根据模糊化预处理对标注得到的图像进行反变换。其中,进行反变换的具体实施方式将在后续实施例中进行详细的介绍,此处暂不介绍。
在本申请实施例中,在获取到标注信息之后,可以对标注信息进行与所述模糊化处理相应的反变换处理,以得到与原始图像对应的标注信息,从而可以利用标注后的原始图像进行训练。
进一步的,上述服务器对标注信息进行与模糊化处理相应的反变换处理,获取与原始图像对应的标注信息的步骤,可以包括如下步骤:
第一步,记录对原始图像进行切分操作的切分位置。
第二步,根据切分位置合并多组标注信息,得到在原始图像上的标注信息。
例如,若对原始图像进行的模糊化预处理是切分处理,则对应的反变换应该是将切分的多个图像还原为原始图像,还原后的原始图像上应该携带有多个图像的标注信息。
因此,可以根据模糊化预处理时的切分位置合并多组标注信息,得到在原始图像上的标注信息。
在本申请实施例中,在获取到标注信息之后,可以根据原始图像的切分位置合并多组标注信息,以得到与原始图像对应的标注信息,从而可以利用标注后的原始图像进行训练。
进一步的,上述服务器对标注信息进行与模糊化处理相应的反变换处理,获取与原始图像对应的标注信息的步骤,可以包括如下步骤:
根据检测对象与原始图像对应的索引信息以及多组标注信息,组合出原始图像的标注信息。
例如,若对原始图像进行的模糊化预处理是风格转换,则对应的反变换应该是将风格转换后的图像中的标注信息与原始图像一一对应,对应后的原始图像上应该携带有多个图像的标注信息。每一个检测对象均可以有一个对应的索引信息,用以表示该对象在原始图像中的位置。
与上述实施例中的图像分类任务不同,在目标检测任务中,由于一个图像中可能出现多个目标,同时一个目标可能跨多个子图像。为了得到原始图像上的完整标注,需要对两个子图像的信息进行合并。合并的算法较简单,只需记录原始图像中切分的具体位置,对右侧或下侧的子图像的框坐标做一个偏移即可。对一个框跨两个子图像的情况,分界线上的两个顶点应该是接近重合的,如果检测到分界先上的两个顶点重合(或十分接近),则合并对应的两个框为一个框即可。
可以理解的是,对原始图像进行的模糊化预处理是切分处理时,上述步骤也同样适用,每一个切分得到的图像均可以包括一个检测对象,每一个检测对象均可以有一个对应的索引信息,用以表示该对象在原始图像中的位置。
在本申请实施例中,在获取到标注信息之后,可以根据原始图像对应的索引信息以及多组标注信息得到与原始图像对应的标注信息,从而可以利用标注后的原始图像进行训练。
本申请上述实施例中,由同一服务器(或服务器集群)实现对原始图像进行预处理以及与客户端的交互传输。但在另一些实施例中,上述两个功能可以由不同服务器执行,例如,本申请实施例还保护一种标注图像处理系统,该标注图像处理系统包括第一服务器以及第二服务器,其中,第一服务器用于与客户端进行交互并执行标注图像处理方法中的标注流程(即步骤S201-步骤S202),第二服务器用于执行标注图像处理方法中的预处理流程(即步骤S301-步骤S302),并将预处理后的图像传输给第一服务器。
请参照图4,图4为本申请实施例提供的一种标注图像处理装置的结构框图,该标注图像处理装置400可以应用于服务器,服务器与客户端之间采用加密协议进行通信,该标注图像处理装置400可以包括:第一接收模块401,用于通过所述加密协议接收所述客户端发送的获取待标注图像的请求;发送模块402,用于通过所述加密协议向所述客户端发送所述待标注图像;其中,所述待标注图像为与待标注的原始图像对应的一幅或者多幅模糊化图像;第二接收模块403,用于通过所述加密协议接收所述客户端发送的标注完成的标注信息,并将所述标注信息进行处理获取与所述原始图像对应的标注信息。
在本申请实施例中,客户端与服务器之间采用加密协议进行通信,可以保证数据在服务器与客户端之间进行传输的安全性;此外,向标注人员提供的待标注图像是模糊化图像,模糊化图像在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中。综上,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
进一步的,所述标注图像处理装置400还包括:获取模块,用于获取待标注的所述原始图像;处理模块,用于对所述原始图像进行模糊化处理,得到与所述原始图像对应的一幅或者多幅所述模糊化图像;其中,所述模糊化处理包括修改所述原始图像的细节信息或者分割所述原始图像中多个对象的关联关系。
在本申请实施例中,在将原始图像提供给标注人员进行标注之前,可以先对原始图像进行模糊化预处理,从而使得模糊化预处理后的图像可以在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中,从而通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
进一步的,对于用于图像分类任务的所述原始图像,所述处理模块还用于:去除所述原始图像的纹理信息或者局部对比度信息,得到所述模糊化图像。
在本申请实施例中,可以通过去除原始图像的纹理信息或者局部对比度信息,产生一个丢失部分细节的图像提供给标注人员,从而使得模糊化后的图像可以在不干扰标注人员正常的辨识过程的基础上,无法被利用在对深度学习模型进行训练的过程中,从而通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
进一步的,对于用于目标检测任务的所述原始图像,所述处理模块还用于:对所述原始图像进行切分,得到N幅子图像;其中,N幅所述子图像之间有重叠部分,N为大于1的整数;对N幅所述子图像进行风格转换,以去除所述子图像中的部分细节,得到N幅所述模糊化图像。
在本申请实施例中,可以通过对原始图像进行切分以及风格转化,从而使得每个标注人员只能看到一个局部的信息,从而保证了完整信息的安全,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
进一步的,所述发送模块402还用于:通过所述加密协议向至少两个客户端发送M幅所述模糊化图像,M为小于N且不等于零的整数。
在本申请实施例中,可以将切分得到的多幅模糊化图像发送给不同的标注人员进行标注,从而使得每个标注人员只能看到一个局部的信息,从而保证了完整信息的安全,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
进一步的,所述处理模块还用于:从所述原始图像中确定至少一类检测对象所在的范围,并对所述范围内的所述检测对象进行模糊化处理,得到一幅所述模糊化图像。
在本申请实施例中,可以对原始图像中的多个检测对象进行模糊化处理,得到模糊化图像,从而通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
进一步的,当接收到所述客户端针对第一类检测对象完成的位置标注数据后,所述标注图像处理装置400还包括:切分模块,用于根据所述位置标注数据以及所述第一类检测对象所在的范围,对所述原始图像上所述第一类检测对象所在区域进行切分,得到多幅所述模糊化图像。
在本申请实施例中,将多个检测对象所在的区域进行切分,从而使得每个标注人员只能看到一个局部的信息,从而保证了完整信息的安全,通过简单的对待标注图像的处理,在提高数据标注的安全性的基础上,降低了数据标注时安全管理的成本。
进一步的,所述第二接收模块403还用于:对所述标注信息进行与所述模糊化处理相应的反变换处理,获取与所述原始图像对应的标注信息;其中,所述原始图像通过所述模糊化处理后得到一幅或多幅所述模糊化图像。
在本申请实施例中,在获取到标注信息之后,可以对标注信息进行与所述模糊化处理相应的反变换处理,以得到与原始图像对应的标注信息,从而可以利用标注后的原始图像进行训练。
进一步的,所述第二接收模块5403还用于:记录对所述原始图像进行切分操作的切分位置;根据所述切分位置合并多组标注信息,得到在所述原始图像上的标注信息;其中,所述多组标注信息为接收的来自于多个所述客户端的标注信息。
在本申请实施例中,在获取到标注信息之后,可以根据原始图像的切分位置合并多组标注信息,以得到与原始图像对应的标注信息,从而可以利用标注后的原始图像进行训练。
进一步的,所述第二接收模块403还用于:根据检测对象与所述原始图像对应的索引信息以及多组所述标注信息,组合出所述原始图像的标注信息。
在本申请实施例中,在获取到标注信息之后,可以根据原始图像对应的索引信息以及多组标注信息得到与原始图像对应的标注信息,从而可以利用标注后的原始图像进行训练。
请参照图5,图5为本申请实施例提供的一种电子设备的结构框图,该电子设备500包括:至少一个处理器501,至少一个通信接口502,至少一个存储器503和至少一个通信总线504。其中,通信总线504用于实现这些组件直接的连接通信,通信接口502用于与其他节点设备进行信令或数据的通信,存储器503存储有处理器501可执行的机器可读指令。当电子设备500运行时,处理器501与存储器503之间通过通信总线504通信,机器可读指令被处理器501调用时执行上述标注图像处理方法。
例如,本申请实施例的处理器501通过通信总线504从存储器503读取计算机程序并执行该计算机程序可以实现如下方法:
步骤S201:客户端通过加密协议向服务器请求获取待标注图像。步骤S202:服务器通过加密协议接收客户端发送的获取待标注图像的请求。步骤S203:服务器通过所加密协议向客户端发送待标注图像。步骤S204:客户端通过加密协议接收服务器发送的待标注图像。步骤S205:客户端接收用户的标注指令并对待标注图像进行标注,得到标注完成的标注图像。步骤S206:客户端通过加密协议将标注信息发送给服务器进行处理。步骤S207:服务器通过加密协议接收客户端发送的标注完成的标注信息,并将标注信息进行处理获取与原始图像对应的标注信息。
处理器501可以是一种集成电路芯片,具有信号处理能力。上述处理器501可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中公开的各种方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器503可以包括但不限于随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
可以理解,图5所示的结构仅为示意,电子设备500还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。图5中所示的各组件可以采用硬件、软件或其组合实现。于本申请实施例中,电子设备500可以是,但不限于台式机、笔记本电脑、智能手机、智能穿戴设备、车载设备等实体设备,还可以是虚拟机等虚拟设备。另外,电子设备500也不一定是单台设备,还可以是多台设备的组合,例如服务器集群,等等。于本申请实施例中,标注图像处理方法中的客户端以及服务器均可以采用图5示出的电子设备500实现。
本申请实施例还提供一种计算机程序产品,包括存储在非暂态计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,计算机能够执行上述实施例中标注图像处理方法的步骤,例如包括:通过所述加密协议接收所述客户端发送的获取待标注图像的请求;通过所述加密协议向所述客户端发送所述待标注图像;其中,所述待标注图像为与待标注的原始图像对应的一幅或者多幅模糊化图像;通过所述加密协议接收所述客户端发送的标注完成的标注信息,并将所述标注信息进行处理获取与所述原始图像对应的标注信息。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (9)
1.一种标注图像处理方法,其特征在于,应用于服务器,所述服务器与客户端之间采用加密协议进行通信,包括:
通过所述加密协议接收所述客户端发送的获取待标注图像的请求;
通过所述加密协议向所述客户端发送所述待标注图像;其中,所述待标注图像为与待标注的原始图像对应的一幅或者多幅模糊化图像;
通过所述加密协议接收所述客户端发送的标注完成的标注信息,并将所述标注信息进行处理获取与所述原始图像对应的标注信息;
在所述通过所述加密协议接收所述客户端发送的获取待标注图像的请求之前,所述标注图像处理方法还包括:
获取待标注的所述原始图像;其中,所述原始图像对应的标注任务的数量为多个;
对所述原始图像进行模糊化处理,得到与所述原始图像对应的一幅或者多幅所述模糊化图像;其中,所述模糊化处理包括修改所述原始图像的细节信息或者分割所述原始图像中多个对象的关联关系;
所述对所述原始图像进行模糊化处理,得到与所述原始图像对应的一幅所述模糊化图像,包括:
从所述原始图像中确定至少一类检测对象所在的范围,并对所述范围内的所述检测对象进行模糊化处理,得到一幅所述模糊化图像;
当接收到所述客户端针对第一类检测对象完成的位置标注数据后,所述标注图像处理方法还包括:
根据所述位置标注数据以及所述第一类检测对象所在的范围,对所述原始图像上所述第一类检测对象所在区域进行切分,得到多幅所述模糊化图像。
2.根据权利要求1所述的标注图像处理方法,其特征在于,对于用于图像分类任务的所述原始图像,所述对所述原始图像进行模糊化处理,得到与所述原始图像对应的一幅所述模糊化图像,包括:
去除所述原始图像的纹理信息或者局部对比度信息,得到所述模糊化图像。
3.根据权利要求1所述的标注图像处理方法,其特征在于,对于用于目标检测任务的所述原始图像,所述对所述原始图像进行模糊化处理,得到与所述原始图像对应的多幅所述模糊化图像,包括:
对所述原始图像进行切分,得到N幅子图像;其中,N幅所述子图像之间有重叠部分,N为大于1的整数;
对N幅所述子图像进行风格转换,以去除所述子图像中的部分细节,得到N幅所述模糊化图像。
4.根据权利要求3所述的标注图像处理方法,其特征在于,所述通过所述加密协议向所述客户端发送所述待标注图像,包括:
通过所述加密协议向至少两个客户端发送M幅所述模糊化图像,M为小于N且不等于零的整数。
5.根据权利要求1所述的标注图像处理方法,其特征在于,所述将所述标注信息进行处理获取与所述原始图像对应的标注信息,包括:
对所述标注信息进行与所述模糊化处理相应的反变换处理,获取与所述原始图像对应的标注信息;其中,所述原始图像通过所述模糊化处理后得到一幅或多幅所述模糊化图像。
6.根据权利要求5所述的标注图像处理方法,其特征在于,所述对所述标注信息进行与所述模糊化处理相应的反变换处理,获取与所述原始图像对应的标注信息,包括:
记录对所述原始图像进行切分操作的切分位置;
根据所述切分位置合并多组标注信息,得到在所述原始图像上的标注信息;其中,所述多组标注信息为接收的来自于多个所述客户端的标注信息。
7.根据权利要求5所述的标注图像处理方法,其特征在于,所述对所述标注信息进行与所述模糊化处理相应的反变换处理,获取与所述原始图像对应的标注信息,包括:
根据检测对象与所述原始图像对应的索引信息以及多组所述标注信息,组合出所述原始图像的标注信息。
8.一种标注图像处理装置,其特征在于,应用于服务器,所述服务器与客户端之间采用加密协议进行通信,包括:
第一接收模块,用于通过所述加密协议接收所述客户端发送的获取待标注图像的请求;
发送模块,用于通过所述加密协议向所述客户端发送所述待标注图像;其中,所述待标注图像为与待标注的原始图像对应的一幅或者多幅模糊化图像;
第二接收模块,用于通过所述加密协议接收所述客户端发送的标注完成的标注信息,并将所述标注信息进行处理获取与所述原始图像对应的标注信息;
所述标注图像处理装置还包括:
获取模块,用于获取待标注的所述原始图像;其中,所述原始图像对应的标注任务的数量为多个;
处理模块,用于对所述原始图像进行模糊化处理,得到与所述原始图像对应的一幅或者多幅所述模糊化图像;其中,所述模糊化处理包括修改所述原始图像的细节信息或者分割所述原始图像中多个对象的关联关系;
所述处理模块还用于:从所述原始图像中确定至少一类检测对象所在的范围,并对所述范围内的所述检测对象进行模糊化处理,得到一幅所述模糊化图像;
当接收到所述客户端针对第一类检测对象完成的位置标注数据后,所述标注图像处理装置还包括:
切分模块,用于根据所述位置标注数据以及所述第一类检测对象所在的范围,对所述原始图像上所述第一类检测对象所在区域进行切分,得到多幅所述模糊化图像。
9.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令被计算机运行时,使所述计算机执行如权利要求1-7任一项所述的标注图像处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010198455.4A CN111402120B (zh) | 2020-03-19 | 2020-03-19 | 一种标注图像处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010198455.4A CN111402120B (zh) | 2020-03-19 | 2020-03-19 | 一种标注图像处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111402120A CN111402120A (zh) | 2020-07-10 |
CN111402120B true CN111402120B (zh) | 2024-03-29 |
Family
ID=71431041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010198455.4A Active CN111402120B (zh) | 2020-03-19 | 2020-03-19 | 一种标注图像处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111402120B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112040269B (zh) * | 2020-09-08 | 2023-04-25 | 平安科技(深圳)有限公司 | 视频数据展示方法、装置、终端设备及存储介质 |
WO2023041971A1 (en) * | 2021-09-14 | 2023-03-23 | Sensetime International Pte. Ltd. | Data security processing method and apparatus, device and storage medium |
CN113692590A (zh) * | 2021-09-14 | 2021-11-23 | 商汤国际私人有限公司 | 数据安全处理方法及装置、设备、存储介质 |
CN114117494A (zh) * | 2021-11-30 | 2022-03-01 | 国网重庆市电力公司电力科学研究院 | 一种加密型数据标注系统及其使用方法 |
CN114549303B (zh) * | 2022-01-14 | 2023-10-20 | 北京百度网讯科技有限公司 | 图像显示、处理方法、装置、设备和存储介质 |
CN116796356A (zh) * | 2022-03-07 | 2023-09-22 | 华为云计算技术有限公司 | 一种数据切分方法及相关装置 |
CN116012493B (zh) * | 2022-12-30 | 2024-05-24 | 壹沓科技(上海)有限公司 | 图像标注方法、装置、存储介质、计算机设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107886104A (zh) * | 2016-09-30 | 2018-04-06 | 法乐第(北京)网络科技有限公司 | 一种图像的标注方法 |
CN109101806A (zh) * | 2018-08-17 | 2018-12-28 | 浙江捷尚视觉科技股份有限公司 | 一种基于风格迁移的隐私人像数据标注方法 |
CN110309669A (zh) * | 2019-06-12 | 2019-10-08 | 阿里巴巴集团控股有限公司 | 一种数据标注方法、装置及设备 |
CN110717317A (zh) * | 2019-09-12 | 2020-01-21 | 中国科学院自动化研究所 | 在线人工中文文本标注系统 |
-
2020
- 2020-03-19 CN CN202010198455.4A patent/CN111402120B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107886104A (zh) * | 2016-09-30 | 2018-04-06 | 法乐第(北京)网络科技有限公司 | 一种图像的标注方法 |
CN109101806A (zh) * | 2018-08-17 | 2018-12-28 | 浙江捷尚视觉科技股份有限公司 | 一种基于风格迁移的隐私人像数据标注方法 |
CN110309669A (zh) * | 2019-06-12 | 2019-10-08 | 阿里巴巴集团控股有限公司 | 一种数据标注方法、装置及设备 |
CN110717317A (zh) * | 2019-09-12 | 2020-01-21 | 中国科学院自动化研究所 | 在线人工中文文本标注系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111402120A (zh) | 2020-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111402120B (zh) | 一种标注图像处理方法及装置 | |
AU2017302250B2 (en) | Optical character recognition in structured documents | |
US9436821B2 (en) | Systems and methods for detecting attempts to transmit sensitive information via data-distribution channels | |
CN109308681B (zh) | 图像处理方法和装置 | |
WO2019019595A1 (zh) | 图片匹配方法及电子设备方法、装置、电子设备及介质 | |
CA3018437C (en) | Optical character recognition utilizing hashed templates | |
CN110222694B (zh) | 图像处理方法、装置、电子设备及计算机可读介质 | |
CN113946851A (zh) | 医疗图像的管理方法、装置、电子设备以及存储介质 | |
WO2021232865A1 (zh) | 一种对象识别方法、装置、设备及介质 | |
WO2021023085A1 (zh) | 水印添加方法、水印识别方法、装置和电子设备 | |
CN114359048A (zh) | 图像的数据增强方法、装置、终端设备及存储介质 | |
US20190303665A1 (en) | System and method of identifying an image containing an identification document | |
WO2020140616A1 (zh) | 一种数据加密方法和相关装置 | |
CN112632952A (zh) | 一种对比文件的方法和装置 | |
CN110889470B (zh) | 用于处理图像的方法和装置 | |
WO2020119058A1 (zh) | 微表情描述方法、装置、计算机装置及可读存储介质 | |
WO2023115968A1 (zh) | 用户端识别违规数据的方法、设备、介质及程序产品 | |
US11546141B1 (en) | Cryptographic protection for portions of media | |
CN114663418A (zh) | 图像处理的方法及装置、存储介质及电子设备 | |
CN110427891A (zh) | 用于识别合同的方法、装置、系统及介质 | |
CN111401137A (zh) | 证件栏位识别的方法和装置 | |
CN111311604A (zh) | 用于分割图像的方法和装置 | |
CN113591852B (zh) | 感兴趣区域标记的方法和装置 | |
CN109816035B (zh) | 图像处理方法和装置 | |
CN113780267A (zh) | 文字识别的方法、装置、设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |