CN110705360A

CN110705360A - 一种人机结合高效处理分类数据的方法

Info

Publication number: CN110705360A
Application number: CN201910839087.4A
Authority: CN
Inventors: 董伟
Original assignee: Shanghai Zero-Eye Intelligent Technology Co Ltd
Current assignee: Shanghai Zero-Eye Intelligent Technology Co Ltd
Priority date: 2019-09-05
Filing date: 2019-09-05
Publication date: 2020-01-17

Abstract

本发明公开了一种人机结合高效处理分类数据的方法，涉及计算机视觉和深度学习领域，包括以下步骤：步骤1、标注人员通过前端工具对目标物体绘制目标框，获取目标框的位置信息；步骤2、前端工具通过API接口将目标框的位置信息传向后端系统；步骤3、后端系统根据接收到的目标框的位置信息对原始图片进行切图，并将切出的小图送给图像识别算法；步骤4、图像识别算法对小图进行识别，完成后将识别结果返回给后端系统，后端系统取出置信度前五的五种识别结果并匹配好对应的参考图片返回给前端工具；步骤5、标注人员将前端工具的前端界面中展现的五种识别结果和目标进行比对，选择正确的分类结果。本发明降低对标注人员的要求，提高分类的准确性。

Description

一种人机结合高效处理分类数据的方法

技术领域

本发明涉及计算机视觉和深度学习领域，更具体的是属于深度学习图像识别中结合算法的图像数据标注处理方法，尤其涉及一种人机结合高效处理分类数据的方法。

背景技术

随着科技的发展，人类逐步走向了“智能化”时代，其中人工智能深度学习算法在生活中有着广泛的应用，而这些算法的实现离不开大规模的训练数据集，因此很多种类的数据标注工具及方法应运而生。

目前已有的很多方法，一般都需要先根据标注工具中的绘制插件对图像进行标绘，然后再根据标绘后的目标图像框去匹配对应的标签。还有一些方法是先利用较成熟的计算机视觉相关算法完成初始的图像自动标注，然后再通过人工修改来完成最终的图像标注。

现有的图像标注方法既费时也不能保证产出数据的准确性。首先，不管是纯人工标注还是先自动标注再人工修改，在对目标框匹配标签时，都需要花费大量的时间去查找对应的标签。并且，当品类标签有很多时，就需要对这些类别特别熟悉的标注人员才能保证一定的标签匹配速率。其次，人在记忆很多个类别标签时难免会把有些类别弄混淆了，这样就会影响标注数据的准确性。

因此，本领域的技术人员致力于开发一种新的处理分类数据的方法，克服现有方法中存在的问题。

发明内容

有鉴于现有技术的上述缺陷，本发明所要解决的技术问题是如何解决现有图像标注处理方法中缺乏高效和准确性的问题。

本发明提供的方法将人、系统和算法结合起来，在标注人员画出目标对象的标框后，系统会根据标框自动切出该区域的小图，并将该区域的小图送到初步的算法模型中。算法模型会预测给出五个最有可能的类别标签，并将这些类别标签带上对应的例图显示在标注界面。标注人员就可以参照给出的预测快速地选择对应的标签，从而提升了图像标注的效率。再加上所预测的五个标签有对应的图例，标注人员就不易犯现有方法中弄错标签的错误。

为实现上述目的，本发明提供了一种人机结合高效处理分类数据的方法，所述方法包括以下步骤：

步骤1、标注人员通过前端工具对目标物体绘制目标框，获取所述目标框的位置信息；

步骤2、所述前端工具通过API接口将所述目标框的位置信息传向后端系统；

步骤3、所述后端系统根据接收到的所述目标框的所述位置信息对原始图片进行切图，并将切出的小图送给图像识别算法；

步骤4、所述图像识别算法对所述小图进行识别，完成后将识别结果返回给所述后端系统，所述后端系统取出置信度前五的五种所述识别结果并匹配好对应的参考图片返回给所述前端工具；

步骤5、所述标注人员将所述前端工具的前端界面中展现的所述五种识别结果和目标进行比对，选择正确的分类结果。

进一步地，所述步骤1中的所述前端工具是用Html5、CSS3、JavaScript三种语言编写。

进一步地，所述步骤1中的所述前端工具的框架是Vue.js。

进一步地，所述步骤1中的所述位置信息为坐标信息。

进一步地，所述步骤2中的所述后端系统是用PHP语言编写。

进一步地，所述步骤2中的所述后端系统的框架为ThinkPHP5。

进一步地，关于数据、分类名称和所述参考图片的存储采用的是关系型数据库MySQL。

进一步地，所述位置信息和所述分类结果采用的是非关系型数据库MongoDB。

进一步地，所述图像识别算法是用Python语言基于Pytorch框架编写，所述图像识别算法采用的模型为基于神经网络DenseNet训练的分类模型。

进一步地，所述图像识别算法也可采用基于神经网络Resnet、AlexNet训练的分类模型。

本发明所提供的一种人机结合高效处理分类数据的方法存在以下技术效果：

1、通过分类进行实时推荐，降低海量分类标注的难度，从而降低对标注人员的要求，进而节约标注成本；

2、通过机器的推荐，标注人员可以快速校验选择的分类，从而提高数据的准确性；

3、采用的专用于分类的神经网络，分类推荐的效果更优，训练成本更低。

以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明，以充分地了解本发明的目的、特征和效果。

附图说明

图1是本发明的一个较佳实施例的流程泳道示意图；

图2是本发明的一个较佳实施例的前端工具展示效果图。

具体实施方式

以下参考说明书附图介绍本发明的多个优选实施例，使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现，本发明的保护范围并非仅限于文中提到的实施例。

如图1所示，是本发明提供的一种人机结合高效处理分类数据的方法流程示意图。本方法主要涉及四部分：标注人员、前端工具、后端系统、图像识别算法。

本方法具体包括以下步骤：

步骤1、标注人员通过前端工具对目标物体绘制目标框，获取目标框的位置信息；

步骤2、前端工具通过API接口将目标框的位置信息传向后端系统；

步骤3、后端系统根据接收到的目标框的位置信息对原始图片进行切图，并将切出的小图送给图像识别算法；

步骤4、图像识别算法对小图进行识别，完成后将识别结果返回给后端系统，后端系统取出置信度前五的五种识别结果并匹配好对应的参考图片返回给前端工具；

步骤5、标注人员将前端工具的前端界面中展现的五种识别结果和目标进行比对，选择正确的分类结果。

整个过程可以在秒级完成。

其中，步骤1中的前端工具是用Html5、CSS3、JavaScript三种语言编写。

其中，步骤1中的前端工具的框架是Vue.js。

其中，步骤1中的位置信息为坐标信息。

其中，步骤2中的后端系统是用PHP语言编写。

其中，步骤2中的后端系统的框架为ThinkPHP5。

其中，步骤4中的识别结果可以不止五种识别结果，可以是更多的识别结果。

其中，步骤5中的前端界面可以是单框实时推荐、多框实时推荐、单框异步推荐、多框异步推荐。

其中，关于数据、分类名称和参考图片的存储采用的是关系型数据库MySQL。

其中，位置信息和分类结果采用的是非关系型数据库MongoDB。

其中，图像识别算法是用Python语言基于Pytorch框架编写，图像识别算法采用的模型为基于神经网络DenseNet训练的分类模型。

其中，图像识别算法也可采用基于神经网络Resnet、AlexNet训练的分类模型。

以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

Claims

1.一种人机结合高效处理分类数据的方法，其特征在于，所述方法包括以下步骤：

2.如权利要求1所述的人机结合高效处理分类数据的方法，其特征在于，所述步骤1中的所述前端工具是用Html5、CSS3、JavaScript三种语言编写。

3.如权利要求1所述的人机结合高效处理分类数据的方法，其特征在于，所述步骤1中的所述前端工具的框架是Vue.js。

4.如权利要求1所述的人机结合高效处理分类数据的方法，其特征在于，所述步骤1中的所述位置信息为坐标信息。

5.如权利要求1所述的人机结合高效处理分类数据的方法，其特征在于，所述步骤2中的所述后端系统是用PHP语言编写。

6.如权利要求1所述的人机结合高效处理分类数据的方法，其特征在于，所述步骤2中的所述后端系统的框架为ThinkPHP5。

7.如权利要求1所述的人机结合高效处理分类数据的方法，其特征在于，关于数据、分类名称和所述参考图片的存储采用的是关系型数据库MySQL。

8.如权利要求1所述的人机结合高效处理分类数据的方法，其特征在于，所述位置信息和所述分类结果采用的是非关系型数据库MongoDB。

9.如权利要求1所述的人机结合高效处理分类数据的方法，其特征在于，所述图像识别算法是用Python语言基于Pytorch框架编写，所述图像识别算法采用的模型为基于神经网络DenseNet训练的分类模型。

10.如权利要求9所述的人机结合高效处理分类数据的方法，其特征在于，所述图像识别算法也可采用基于神经网络Resnet、AlexNet训练的分类模型。