CN110705360A - 一种人机结合高效处理分类数据的方法 - Google Patents

一种人机结合高效处理分类数据的方法 Download PDF

Info

Publication number
CN110705360A
CN110705360A CN201910839087.4A CN201910839087A CN110705360A CN 110705360 A CN110705360 A CN 110705360A CN 201910839087 A CN201910839087 A CN 201910839087A CN 110705360 A CN110705360 A CN 110705360A
Authority
CN
China
Prior art keywords
human
classified data
computer
position information
end tool
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910839087.4A
Other languages
English (en)
Inventor
董伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zero-Eye Intelligent Technology Co Ltd
Original Assignee
Shanghai Zero-Eye Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zero-Eye Intelligent Technology Co Ltd filed Critical Shanghai Zero-Eye Intelligent Technology Co Ltd
Priority to CN201910839087.4A priority Critical patent/CN110705360A/zh
Publication of CN110705360A publication Critical patent/CN110705360A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/35Categorising the entire scene, e.g. birthday party or wedding scene
    • G06V20/36Indoor scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种人机结合高效处理分类数据的方法,涉及计算机视觉和深度学习领域,包括以下步骤:步骤1、标注人员通过前端工具对目标物体绘制目标框,获取目标框的位置信息;步骤2、前端工具通过API接口将目标框的位置信息传向后端系统;步骤3、后端系统根据接收到的目标框的位置信息对原始图片进行切图,并将切出的小图送给图像识别算法;步骤4、图像识别算法对小图进行识别,完成后将识别结果返回给后端系统,后端系统取出置信度前五的五种识别结果并匹配好对应的参考图片返回给前端工具;步骤5、标注人员将前端工具的前端界面中展现的五种识别结果和目标进行比对,选择正确的分类结果。本发明降低对标注人员的要求,提高分类的准确性。

Description

一种人机结合高效处理分类数据的方法
技术领域
本发明涉及计算机视觉和深度学习领域,更具体的是属于深度学习图像识别中结合算法的图像数据标注处理方法,尤其涉及一种人机结合高效处理分类数据的方法。
背景技术
随着科技的发展,人类逐步走向了“智能化”时代,其中人工智能深度学习算法在生活中有着广泛的应用,而这些算法的实现离不开大规模的训练数据集,因此很多种类的数据标注工具及方法应运而生。
目前已有的很多方法,一般都需要先根据标注工具中的绘制插件对图像进行标绘,然后再根据标绘后的目标图像框去匹配对应的标签。还有一些方法是先利用较成熟的计算机视觉相关算法完成初始的图像自动标注,然后再通过人工修改来完成最终的图像标注。
现有的图像标注方法既费时也不能保证产出数据的准确性。首先,不管是纯人工标注还是先自动标注再人工修改,在对目标框匹配标签时,都需要花费大量的时间去查找对应的标签。并且,当品类标签有很多时,就需要对这些类别特别熟悉的标注人员才能保证一定的标签匹配速率。其次,人在记忆很多个类别标签时难免会把有些类别弄混淆了,这样就会影响标注数据的准确性。
因此,本领域的技术人员致力于开发一种新的处理分类数据的方法,克服现有方法中存在的问题。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是如何解决现有图像标注处理方法中缺乏高效和准确性的问题。
本发明提供的方法将人、系统和算法结合起来,在标注人员画出目标对象的标框后,系统会根据标框自动切出该区域的小图,并将该区域的小图送到初步的算法模型中。算法模型会预测给出五个最有可能的类别标签,并将这些类别标签带上对应的例图显示在标注界面。标注人员就可以参照给出的预测快速地选择对应的标签,从而提升了图像标注的效率。再加上所预测的五个标签有对应的图例,标注人员就不易犯现有方法中弄错标签的错误。
为实现上述目的,本发明提供了一种人机结合高效处理分类数据的方法,所述方法包括以下步骤:
步骤1、标注人员通过前端工具对目标物体绘制目标框,获取所述目标框的位置信息;
步骤2、所述前端工具通过API接口将所述目标框的位置信息传向后端系统;
步骤3、所述后端系统根据接收到的所述目标框的所述位置信息对原始图片进行切图,并将切出的小图送给图像识别算法;
步骤4、所述图像识别算法对所述小图进行识别,完成后将识别结果返回给所述后端系统,所述后端系统取出置信度前五的五种所述识别结果并匹配好对应的参考图片返回给所述前端工具;
步骤5、所述标注人员将所述前端工具的前端界面中展现的所述五种识别结果和目标进行比对,选择正确的分类结果。
进一步地,所述步骤1中的所述前端工具是用Html5、CSS3、JavaScript三种语言编写。
进一步地,所述步骤1中的所述前端工具的框架是Vue.js。
进一步地,所述步骤1中的所述位置信息为坐标信息。
进一步地,所述步骤2中的所述后端系统是用PHP语言编写。
进一步地,所述步骤2中的所述后端系统的框架为ThinkPHP5。
进一步地,关于数据、分类名称和所述参考图片的存储采用的是关系型数据库MySQL。
进一步地,所述位置信息和所述分类结果采用的是非关系型数据库MongoDB。
进一步地,所述图像识别算法是用Python语言基于Pytorch框架编写,所述图像识别算法采用的模型为基于神经网络DenseNet训练的分类模型。
进一步地,所述图像识别算法也可采用基于神经网络Resnet、AlexNet训练的分类模型。
本发明所提供的一种人机结合高效处理分类数据的方法存在以下技术效果:
1、通过分类进行实时推荐,降低海量分类标注的难度,从而降低对标注人员的要求,进而节约标注成本;
2、通过机器的推荐,标注人员可以快速校验选择的分类,从而提高数据的准确性;
3、采用的专用于分类的神经网络,分类推荐的效果更优,训练成本更低。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明的一个较佳实施例的流程泳道示意图;
图2是本发明的一个较佳实施例的前端工具展示效果图。
具体实施方式
以下参考说明书附图介绍本发明的多个优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
如图1所示,是本发明提供的一种人机结合高效处理分类数据的方法流程示意图。本方法主要涉及四部分:标注人员、前端工具、后端系统、图像识别算法。
本方法具体包括以下步骤:
步骤1、标注人员通过前端工具对目标物体绘制目标框,获取目标框的位置信息;
步骤2、前端工具通过API接口将目标框的位置信息传向后端系统;
步骤3、后端系统根据接收到的目标框的位置信息对原始图片进行切图,并将切出的小图送给图像识别算法;
步骤4、图像识别算法对小图进行识别,完成后将识别结果返回给后端系统,后端系统取出置信度前五的五种识别结果并匹配好对应的参考图片返回给前端工具;
步骤5、标注人员将前端工具的前端界面中展现的五种识别结果和目标进行比对,选择正确的分类结果。
整个过程可以在秒级完成。
其中,步骤1中的前端工具是用Html5、CSS3、JavaScript三种语言编写。
其中,步骤1中的前端工具的框架是Vue.js。
其中,步骤1中的位置信息为坐标信息。
其中,步骤2中的后端系统是用PHP语言编写。
其中,步骤2中的后端系统的框架为ThinkPHP5。
其中,步骤4中的识别结果可以不止五种识别结果,可以是更多的识别结果。
其中,步骤5中的前端界面可以是单框实时推荐、多框实时推荐、单框异步推荐、多框异步推荐。
其中,关于数据、分类名称和参考图片的存储采用的是关系型数据库MySQL。
其中,位置信息和分类结果采用的是非关系型数据库MongoDB。
其中,图像识别算法是用Python语言基于Pytorch框架编写,图像识别算法采用的模型为基于神经网络DenseNet训练的分类模型。
其中,图像识别算法也可采用基于神经网络Resnet、AlexNet训练的分类模型。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种人机结合高效处理分类数据的方法,其特征在于,所述方法包括以下步骤:
步骤1、标注人员通过前端工具对目标物体绘制目标框,获取所述目标框的位置信息;
步骤2、所述前端工具通过API接口将所述目标框的位置信息传向后端系统;
步骤3、所述后端系统根据接收到的所述目标框的所述位置信息对原始图片进行切图,并将切出的小图送给图像识别算法;
步骤4、所述图像识别算法对所述小图进行识别,完成后将识别结果返回给所述后端系统,所述后端系统取出置信度前五的五种所述识别结果并匹配好对应的参考图片返回给所述前端工具;
步骤5、所述标注人员将所述前端工具的前端界面中展现的所述五种识别结果和目标进行比对,选择正确的分类结果。
2.如权利要求1所述的人机结合高效处理分类数据的方法,其特征在于,所述步骤1中的所述前端工具是用Html5、CSS3、JavaScript三种语言编写。
3.如权利要求1所述的人机结合高效处理分类数据的方法,其特征在于,所述步骤1中的所述前端工具的框架是Vue.js。
4.如权利要求1所述的人机结合高效处理分类数据的方法,其特征在于,所述步骤1中的所述位置信息为坐标信息。
5.如权利要求1所述的人机结合高效处理分类数据的方法,其特征在于,所述步骤2中的所述后端系统是用PHP语言编写。
6.如权利要求1所述的人机结合高效处理分类数据的方法,其特征在于,所述步骤2中的所述后端系统的框架为ThinkPHP5。
7.如权利要求1所述的人机结合高效处理分类数据的方法,其特征在于,关于数据、分类名称和所述参考图片的存储采用的是关系型数据库MySQL。
8.如权利要求1所述的人机结合高效处理分类数据的方法,其特征在于,所述位置信息和所述分类结果采用的是非关系型数据库MongoDB。
9.如权利要求1所述的人机结合高效处理分类数据的方法,其特征在于,所述图像识别算法是用Python语言基于Pytorch框架编写,所述图像识别算法采用的模型为基于神经网络DenseNet训练的分类模型。
10.如权利要求9所述的人机结合高效处理分类数据的方法,其特征在于,所述图像识别算法也可采用基于神经网络Resnet、AlexNet训练的分类模型。
CN201910839087.4A 2019-09-05 2019-09-05 一种人机结合高效处理分类数据的方法 Pending CN110705360A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910839087.4A CN110705360A (zh) 2019-09-05 2019-09-05 一种人机结合高效处理分类数据的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910839087.4A CN110705360A (zh) 2019-09-05 2019-09-05 一种人机结合高效处理分类数据的方法

Publications (1)

Publication Number Publication Date
CN110705360A true CN110705360A (zh) 2020-01-17

Family

ID=69194345

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910839087.4A Pending CN110705360A (zh) 2019-09-05 2019-09-05 一种人机结合高效处理分类数据的方法

Country Status (1)

Country Link
CN (1) CN110705360A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440501A (zh) * 2013-09-01 2013-12-11 西安电子科技大学 基于非参数空间判决隐狄利克雷模型的场景分类方法
CN107832662A (zh) * 2017-09-27 2018-03-23 百度在线网络技术(北京)有限公司 一种获取图片标注数据的方法和系统
CN109784385A (zh) * 2018-12-29 2019-05-21 广州海昇计算机科技有限公司 一种商品自动识别方法、系统、装置及存储介质
CN109785361A (zh) * 2018-12-22 2019-05-21 国网内蒙古东部电力有限公司 基于cnn与mog的变电站异物入侵检测系统
US20190318208A1 (en) * 2016-12-27 2019-10-17 Cloudminds (Shenzhen) Robotics Systems Co., Ltd Image identification system and image identification method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440501A (zh) * 2013-09-01 2013-12-11 西安电子科技大学 基于非参数空间判决隐狄利克雷模型的场景分类方法
US20190318208A1 (en) * 2016-12-27 2019-10-17 Cloudminds (Shenzhen) Robotics Systems Co., Ltd Image identification system and image identification method
CN107832662A (zh) * 2017-09-27 2018-03-23 百度在线网络技术(北京)有限公司 一种获取图片标注数据的方法和系统
CN109785361A (zh) * 2018-12-22 2019-05-21 国网内蒙古东部电力有限公司 基于cnn与mog的变电站异物入侵检测系统
CN109784385A (zh) * 2018-12-29 2019-05-21 广州海昇计算机科技有限公司 一种商品自动识别方法、系统、装置及存储介质

Similar Documents

Publication Publication Date Title
JP6893233B2 (ja) 画像に基づくデータ処理方法、装置、電子機器、コンピュータ可読記憶媒体およびコンピュータプログラム
CN108376244B (zh) 一种自然场景图片中的文本字体的识别方法
CN111695439A (zh) 图像结构化数据提取方法、电子装置及存储介质
WO2021208696A1 (zh) 用户意图分析方法、装置、电子设备及计算机存储介质
CN110851641B (zh) 跨模态检索方法、装置和可读存储介质
CN109670494B (zh) 一种附带识别置信度的文本检测方法及系统
CN110275987A (zh) 智能教学顾问生成方法、系统、设备及存储介质
CN109983473A (zh) 灵活的集成识别和语义处理
CN110363190A (zh) 一种文字识别方法、装置及设备
CN117437647B (zh) 基于深度学习和计算机视觉的甲骨文字检测方法
US6567548B2 (en) Handwriting recognition system and method using compound characters for improved recognition accuracy
CN110728287A (zh) 图像识别方法及装置、电子设备、存储介质
CN114722822A (zh) 命名实体识别方法、装置、设备和计算机可读存储介质
WO2024045641A1 (zh) 图像标注方法及装置
CN110929013A (zh) 一种基于bottom-up attention和定位信息融合的图片问答实现方法
CN110705360A (zh) 一种人机结合高效处理分类数据的方法
CN115131826B (zh) 物品检测识别方法、网络模型的训练方法和装置
CN110827351A (zh) 机器人视听协同学习新目标的语音标签自动生成方法
CN113407676A (zh) 题目批改方法和系统、电子设备和计算机可读介质
CN114821424A (zh) 视频分析方法、视频分析装置、计算机设备、存储介质
CN114120057A (zh) 一种基于PaddleDetection的混淆矩阵生成方法
Chowdhury et al. Towards Tabular Data Extraction From Richly-Structured Documents Using Supervised and Weakly-Supervised Learning
CN117557871B (zh) 三维模型标注方法、装置、设备及存储介质
CN117954045B (zh) 基于处方数据分析的药品自动分拣管理系统及方法
CN114359911B (zh) 文字关键信息的提取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination