CN115204760A - 一种数据标注方法及装置 - Google Patents
一种数据标注方法及装置 Download PDFInfo
- Publication number
- CN115204760A CN115204760A CN202211125469.9A CN202211125469A CN115204760A CN 115204760 A CN115204760 A CN 115204760A CN 202211125469 A CN202211125469 A CN 202211125469A CN 115204760 A CN115204760 A CN 115204760A
- Authority
- CN
- China
- Prior art keywords
- data
- task
- labeling
- preprocessing
- annotation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 146
- 238000007781 pre-processing Methods 0.000 claims abstract description 75
- 238000000034 method Methods 0.000 claims abstract description 49
- 238000004590 computer program Methods 0.000 claims description 12
- 238000012797 qualification Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 5
- 238000009826 distribution Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims 1
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
- G06Q10/063112—Skill-based matching of a person or a group to a task
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
- G06Q10/063118—Staff planning in a project environment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06398—Performance of employee with respect to a job function
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种数据标注方法及装置,该方法包括:预先获取标注人员的特征画像;从标注系统获取待处理的标注任务;对标注任务进行预处理,得到预处理任务以及预处理任务的任务特征标签;根据任务特征标签和特征画像,为预处理任务匹配目标标注人员;将预处理任务分配至目标标注人员进行数据标注处理;接收目标标注人员针对预处理任务交付的标注数据。可见,该方法能够实现个性化标注任务分配,有利于提高标注人员标注效率和质量,从而提升了数据标注效率。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种数据标注方法及装置。
背景技术
目前,现有标注图片分配机制无法针对每一名标注人员的工作特征做到差异化分配,导致针对不同场景、不同对象的标注、分类任务等被平均的分配给了所有人。但实际上不同的标注人员针对上述工作场景的效率和质量都是不同的,可见,现有的标注任务统一分配机制很大程度上制约了标注效率和标注质量的提高,从而降低了数据标注效率。
发明内容
本申请实施例的目的在于提供一种数据标注方法及装置,能够实现个性化标注任务分配,有利于提高标注人员标注效率和质量,从而提升了数据标注效率。
本申请实施例第一方面提供了一种数据标注方法,包括:
预先获取标注人员的特征画像;
从标注系统获取待处理的标注任务;
对所述标注任务进行预处理,得到预处理任务以及所述预处理任务的任务特征标签;
根据所述任务特征标签和所述特征画像,为所述预处理任务匹配目标标注人员;
将所述预处理任务分配至所述目标标注人员进行数据标注处理;
接收所述目标标注人员针对所述预处理任务交付的标注数据;
其中,所述预先获取标注人员的特征画像,包括:
收集标注人员标注时的图形数据、所述标注人员对应的标签数据及所述标注人员对应的合格率数据;
根据所述图形数据、所述标签数据以及所述合格率数据对每个所述标注人员进行特征分析,得到每个所述标注人员对应的特征画像。
在上述实现过程中,该方法可以优先预先获取标注人员的特征画像;并从标注系统获取待处理的标注任务;然后,再对标注任务进行预处理,得到预处理任务以及预处理任务的任务特征标签;再根据任务特征标签和特征画像,为预处理任务匹配目标标注人员;再后,将预处理任务分配至目标标注人员进行数据标注处理;最后,再接收目标标注人员针对预处理任务交付的标注数据。可见,实施这种实施方式,能够实现个性化标注任务分配,有利于提高标注人员标注效率和质量,从而提升了数据标注效率。
进一步地,所述对所述标注任务进行预处理,得到预处理任务以及所述预处理任务的任务特征标签,包括:
根据所述特征画像计算每个所述标注人员对应对所述标注任务进行标注处理的处理通过率;
识别所述标注任务,得到所述标注任务的数据规格,其中,所述数据规格包括所述标注任务的数据长度、所述标注任务的数据宽度、所述标注任务的数据长宽比、所述标注任务的数据颜色比例;
根据所述处理通过率和所述数据规格生成所述标注任务的任务标签;
将所述任务标签和所述标注任务传输至调度器,生成预处理任务以及所述预处理任务的任务特征标签。
进一步地,所述方法还包括:
检测所述标注数据中是否存在不合格数据;
如果否,则提交所述标注数据至目标系统。
进一步地,所述方法还包括:
当判断出所述标注数据中存在不合格数据时,获取所述标注数据中的不合格数据和合格数据;
将所述不合格数据重新加入调度器,以重新获取所述目标标注人员针对所述不合格数据提交的重新标注数据;
当所述重新标注数据检测合格时,汇总所述重新标注数据和所述合格数据并存储。
本申请实施例第二方面提供了一种数据标注装置,所述数据标注装置包括:
第一获取单元,用于预先获取标注人员的特征画像;
第二获取单元,用于从标注系统获取待处理的标注任务;
预处理单元,用于对所述标注任务进行预处理,得到预处理任务以及所述预处理任务的任务特征标签;
匹配单元,用于根据所述任务特征标签和所述特征画像,为所述预处理任务匹配目标标注人员;
分配单元,用于将所述预处理任务分配至所述目标标注人员进行数据标注处理;
接收单元,用于接收所述目标标注人员针对所述预处理任务交付的标注数据;
其中,所述第一获取单元包括:
收集子单元,用于收集标注人员标注时的图形数据、所述标注人员对应的标签数据及所述标注人员对应的合格率数据;
特征分析子单元,用于根据所述图形数据、所述标签数据以及所述合格率数据对每个所述标注人员进行特征分析,得到每个所述标注人员对应的特征画像。
在上述实现过程中,该装置可以通过第一获取单元来预先获取标注人员的特征画像;通过第二获取单元从标注系统获取待处理的标注任务;通过预处理单元对标注任务进行预处理,得到预处理任务以及预处理任务的任务特征标签;通过匹配单元来根据任务特征标签和特征画像,为预处理任务匹配目标标注人员;通过分配单元将预处理任务分配至目标标注人员进行数据标注处理;通过接收单元接收目标标注人员针对预处理任务交付的标注数据。可见,实施这种实施方式,能够实现个性化标注任务分配,有利于提高标注人员标注效率和质量,从而提升了数据标注效率。
进一步地,所述预处理单元包括:
计算子单元,用于根据所述特征画像计算每个所述标注人员对应对所述标注任务进行标注处理的处理通过率;
识别子单元,用于识别所述标注任务,得到所述标注任务的数据规格,其中,所述数据规格包括所述标注任务的数据长度、所述标注任务的数据宽度、所述标注任务的数据长宽比、所述标注任务的数据颜色比例;
生成子单元,用于根据所述处理通过率和所述数据规格生成所述标注任务的任务标签;以及将所述任务标签和所述标注任务传输至调度器,生成预处理任务以及所述预处理任务的任务特征标签。
进一步地,所述数据标注装置还包括:
检测单元,用于检测所述标注数据中是否存在不合格数据;
提交单元,用于在所述标注数据中不存在不合格数据时,提交所述标注数据至目标系统。
进一步地,所述数据标注装置还包括:
第三获取单元,用于在所述标注数据中存在不合格数据时,获取所述标注数据中的不合格数据和合格数据;
加入单元,用于将所述不合格数据重新加入调度器,以重新获取所述目标标注人员针对所述不合格数据提交的重新标注数据;
汇总单元,用于当所述重新标注数据检测合格时,汇总所述重新标注数据和所述合格数据并存储。
本申请实施例第三方面提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行本申请实施例第一方面中任一项所述的数据标注方法。
本申请实施例第四方面提供了一种计算机可读存储介质,其存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行本申请实施例第一方面中任一项所述的数据标注方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种数据标注方法的流程示意图;
图2为本申请实施例提供的一种数据标注装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例1
请参看图1,图1为本申请实施例提供了一种数据标注方法的流程示意图。其中,该数据标注方法包括:
S101、收集标注人员标注时的图形数据、标注人员对应的标签数据及标注人员对应的合格率数据。
本实施例中,该方法可以从标注系统获取待处理的标注/分类任务。
S102、根据图形数据、标签数据以及合格率数据对每个标注人员进行特征分析,得到每个标注人员对应的特征画像。
S103、从标注系统获取待处理的标注任务。
S104、根据特征画像计算每个标注人员对应对标注任务进行标注处理的处理通过率。
S105、识别标注任务,得到标注任务的数据规格,其中,数据规格包括标注任务的数据长度、标注任务的数据宽度、标注任务的数据长宽比、标注任务的数据颜色比例。
S106、根据处理通过率和数据规格生成标注任务的任务标签。
S107、将任务标签和标注任务传输至调度器,生成预处理任务以及预处理任务的任务特征标签。
本实施例中,该方法可以对任务进行预处理,以使其能够根据长度、宽度、长宽比、颜色比例、对应标注人员处理通过率等特征打上标签,并放入调度器。
S108、根据任务特征标签和特征画像,为预处理任务匹配目标标注人员。
S109、将预处理任务分配至目标标注人员进行数据标注处理。
本实施例中,该方法可以根据对应任务特征标签与标注人员匹配程度分配任务。
S110、接收目标标注人员针对预处理任务交付的标注数据。
本实施例中,该步骤之前可以由标注人员处理分配的任务,然后再通过该方法接收标注人员交付的标注数据。
S111、检测标注数据中是否存在不合格数据,若是,则执行步骤S113~S115;若否,则执行步骤S112。
本实施例中,该方法可以收集数据信息后交付给标注系统。
S112、提交标注数据至目标系统,并结束本流程。
本实施例中,该方法可以通过标注系统针提交完成数据或者不合格数据。
S113、获取标注数据中的不合格数据和合格数据。
S114、将不合格数据重新加入调度器,以重新获取目标标注人员针对不合格数据提交的重新标注数据。
本实施例中,该方法可以将不合格数据重新加入调度器。
S115、当重新标注数据检测合格时,汇总重新标注数据和合格数据并存储。
本实施例中,该方法可以在合格数据完成收集之后对其进行持久化存储。
本实施例中,该方法可以通过收集标注人员标注时的图形数据、标签数据及对应的合格率数据,对每一名标注人员的数据进行分析形成特征画像。再结合算法对标注数据或分类数据特征进行预处理,针对每一名标注人员推送效率及质检通过率较高的类似数据,从而整体提高标注人员标注效率和质量。
本实施例中,该方法的执行主体可以为计算机、服务器等计算装置,对此本实施例中不作任何限定。
在本申请实施例中,该方法的执行主体还可以为智能手机、平板电脑等智能设备,对此本实施例中不作任何限定。
可见,实施本实施例所描述的数据标注方法,能够使用特定的算法引擎来不断收集标注人员数据,持续完善人物画像,从而提高对人员特征的识别精确度。同时,该方法能够为每一位标注人员分配其擅长的合格率高的任务,从而能够在很大程度上提高标注的速率和准确性,进而提升标注任务的完成速度。另外,该方法还能够降低由于标注类别不熟练造成的人员疲惫,效率低下,准确性差等问题,从而降低标注任务的人力成本和时间成本。
实施例2
请参看图2,图2为本申请实施例提供的一种数据标注装置的结构示意图。如图2所示,该数据标注装置包括:
第一获取单元210,用于预先获取标注人员的特征画像;
第二获取单元220,用于从标注系统获取待处理的标注任务;
预处理单元230,用于对标注任务进行预处理,得到预处理任务以及预处理任务的任务特征标签;
匹配单元240,用于根据任务特征标签和特征画像,为预处理任务匹配目标标注人员;
分配单元250,用于将预处理任务分配至目标标注人员进行数据标注处理;
接收单元260,用于接收目标标注人员针对预处理任务交付的标注数据。
作为一种可选的实施方式,第一获取单元210包括:
收集子单元211,用于收集标注人员标注时的图形数据、标注人员对应的标签数据及标注人员对应的合格率数据;
特征分析子单元212,用于根据图形数据、标签数据以及合格率数据对每个标注人员进行特征分析,得到每个标注人员对应的特征画像。
作为一种可选的实施方式,预处理单元230包括:
计算子单元231,用于根据特征画像计算每个标注人员对应对标注任务进行标注处理的处理通过率;
识别子单元232,用于识别标注任务,得到标注任务的数据规格,其中,数据规格包括标注任务的数据长度、标注任务的数据宽度、标注任务的数据长宽比、标注任务的数据颜色比例;
生成子单元233,用于根据处理通过率和数据规格生成标注任务的任务标签;以及将任务标签和标注任务传输至调度器,生成预处理任务以及预处理任务的任务特征标签。
作为一种可选的实施方式,数据标注装置还包括:
检测单元270,用于检测标注数据中是否存在不合格数据;
提交单元280,用于在标注数据中不存在不合格数据时,提交标注数据至目标系统。
作为一种可选的实施方式,数据标注装置还包括:
第三获取单元290,用于在标注数据中存在不合格数据时,获取标注数据中的不合格数据和合格数据;
加入单元300,用于将不合格数据重新加入调度器,以重新获取目标标注人员针对不合格数据提交的重新标注数据;
汇总单元310,用于当重新标注数据检测合格时,汇总重新标注数据和合格数据并存储。
本实施例中,对于数据标注装置的解释说明可以参照实施例1中的描述,对此本实施例中不再多加赘述。
可见,实施本实施例所描述的数据标注装置,能够使用特定的算法引擎来不断收集标注人员数据,持续完善人物画像,从而提高对人员特征的识别精确度。同时,该装置能够为每一位标注人员分配其擅长的合格率高的任务,从而能够在很大程度上提高标注的速率和准确性,进而提升标注任务的完成速度。另外,该装置还能够降低由于标注类别不熟练造成的人员疲惫,效率低下,准确性差等问题,从而降低标注任务的人力成本和时间成本。
本申请实施例提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行本申请实施例1中的数据标注方法。
本申请实施例提供了一种计算机可读存储介质,其存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行本申请实施例1中的数据标注方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (8)
1.一种数据标注方法,其特征在于,包括:
预先获取标注人员的特征画像;
从标注系统获取待处理的标注任务;
对所述标注任务进行预处理,得到预处理任务以及所述预处理任务的任务特征标签;
根据所述任务特征标签和所述特征画像,为所述预处理任务匹配目标标注人员;
将所述预处理任务分配至所述目标标注人员进行数据标注处理;
接收所述目标标注人员针对所述预处理任务交付的标注数据;
所述预先获取标注人员的特征画像,包括:
收集标注人员标注时的图形数据、所述标注人员对应的标签数据及所述标注人员对应的合格率数据;
根据所述图形数据、所述标签数据以及所述合格率数据对每个所述标注人员进行特征分析,得到每个所述标注人员对应的特征画像。
2.根据权利要求1所述的数据标注方法,其特征在于,所述对所述标注任务进行预处理,得到预处理任务以及所述预处理任务的任务特征标签,包括:
根据所述特征画像计算每个所述标注人员对应对所述标注任务进行标注处理的处理通过率;
识别所述标注任务,得到所述标注任务的数据规格,其中,所述数据规格包括所述标注任务的数据长度、所述标注任务的数据宽度、所述标注任务的数据长宽比、所述标注任务的数据颜色比例;
根据所述处理通过率和所述数据规格生成所述标注任务的任务标签;
将所述任务标签和所述标注任务传输至调度器,生成预处理任务以及所述预处理任务的任务特征标签。
3.根据权利要求1所述的数据标注方法,其特征在于,所述方法还包括:
检测所述标注数据中是否存在不合格数据;
如果否,则提交所述标注数据至目标系统。
4.根据权利要求3所述的数据标注方法,其特征在于,所述方法还包括:
当判断出所述标注数据中存在不合格数据时,获取所述标注数据中的不合格数据和合格数据;
将所述不合格数据重新加入调度器,以重新获取所述目标标注人员针对所述不合格数据提交的重新标注数据;
当所述重新标注数据检测合格时,汇总所述重新标注数据和所述合格数据并存储。
5.一种数据标注装置,其特征在于,所述数据标注装置包括:
第一获取单元,用于预先获取标注人员的特征画像;
第二获取单元,用于从标注系统获取待处理的标注任务;
预处理单元,用于对所述标注任务进行预处理,得到预处理任务以及所述预处理任务的任务特征标签;
匹配单元,用于根据所述任务特征标签和所述特征画像,为所述预处理任务匹配目标标注人员;
分配单元,用于将所述预处理任务分配至所述目标标注人员进行数据标注处理;
接收单元,用于接收所述目标标注人员针对所述预处理任务交付的标注数据;
其中,所述第一获取单元包括:
收集子单元,用于收集标注人员标注时的图形数据、所述标注人员对应的标签数据及所述标注人员对应的合格率数据;
特征分析子单元,用于根据所述图形数据、所述标签数据以及所述合格率数据对每个所述标注人员进行特征分析,得到每个所述标注人员对应的特征画像。
6.根据权利要求5所述的数据标注装置,其特征在于,所述预处理单元包括:
计算子单元,用于根据所述特征画像计算每个所述标注人员对应对所述标注任务进行标注处理的处理通过率;
识别子单元,用于识别所述标注任务,得到所述标注任务的数据规格,其中,所述数据规格包括所述标注任务的数据长度、所述标注任务的数据宽度、所述标注任务的数据长宽比、所述标注任务的数据颜色比例;
生成子单元,用于根据所述处理通过率和所述数据规格生成所述标注任务的任务标签;以及将所述任务标签和所述标注任务传输至调度器,生成预处理任务以及所述预处理任务的任务特征标签。
7.一种电子设备,其特征在于,所述电子设备包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行权利要求1至4中任一项所述的数据标注方法。
8.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行权利要求1至4任一项所述的数据标注方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211125469.9A CN115204760A (zh) | 2022-09-16 | 2022-09-16 | 一种数据标注方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211125469.9A CN115204760A (zh) | 2022-09-16 | 2022-09-16 | 一种数据标注方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115204760A true CN115204760A (zh) | 2022-10-18 |
Family
ID=83573644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211125469.9A Pending CN115204760A (zh) | 2022-09-16 | 2022-09-16 | 一种数据标注方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115204760A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109978356A (zh) * | 2019-03-15 | 2019-07-05 | 平安普惠企业管理有限公司 | 标注任务分配方法、装置、介质和计算机设备 |
CN110490444A (zh) * | 2019-08-13 | 2019-11-22 | 新华智云科技有限公司 | 标注任务分配方法、装置、系统及存储介质 |
CN110991486A (zh) * | 2019-11-07 | 2020-04-10 | 北京邮电大学 | 多人协作图像标注质量控制的方法和装置 |
CN111144749A (zh) * | 2019-12-26 | 2020-05-12 | 智洋创新科技股份有限公司 | 电网图像智能标注众包平台及工作方法 |
CN114969315A (zh) * | 2022-08-01 | 2022-08-30 | 翼方健数(北京)信息科技有限公司 | 一种专业领域智能化众包标注方法和系统 |
-
2022
- 2022-09-16 CN CN202211125469.9A patent/CN115204760A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109978356A (zh) * | 2019-03-15 | 2019-07-05 | 平安普惠企业管理有限公司 | 标注任务分配方法、装置、介质和计算机设备 |
CN110490444A (zh) * | 2019-08-13 | 2019-11-22 | 新华智云科技有限公司 | 标注任务分配方法、装置、系统及存储介质 |
CN110991486A (zh) * | 2019-11-07 | 2020-04-10 | 北京邮电大学 | 多人协作图像标注质量控制的方法和装置 |
CN111144749A (zh) * | 2019-12-26 | 2020-05-12 | 智洋创新科技股份有限公司 | 电网图像智能标注众包平台及工作方法 |
CN114969315A (zh) * | 2022-08-01 | 2022-08-30 | 翼方健数(北京)信息科技有限公司 | 一种专业领域智能化众包标注方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109308681B (zh) | 图像处理方法和装置 | |
CN108830147A (zh) | 一种基于图像识别的货架商品价格识别方法、装置和系统 | |
CN112100425B (zh) | 基于人工智能的标签标注方法、装置、电子设备及介质 | |
CN115758451A (zh) | 基于人工智能的数据标注方法、装置、设备及存储介质 | |
CN111368828A (zh) | 一种多票据的识别方法及装置 | |
CN112200067A (zh) | 智能视频事件检测方法、系统、电子设备和存储介质 | |
CN114240672A (zh) | 绿色资产的占比的识别方法及相关产品 | |
CN113780116A (zh) | 发票分类方法、装置、计算机设备和存储介质 | |
CN108921185A (zh) | 一种基于图像识别的货架促销信息识别方法、装置和系统 | |
CN110597984B (zh) | 异常行为用户信息的确定方法及装置、存储介质、终端 | |
CN115204760A (zh) | 一种数据标注方法及装置 | |
CN109635688B (zh) | 基于图像识别管理书架上书籍的方法与系统 | |
CN111753608A (zh) | 信息处理方法及装置、电子设备及存储介质 | |
CN116681247A (zh) | 一种银行网点的业务分配方法、装置、设备及存储介质 | |
CN116580390A (zh) | 价签内容获取方法、装置、存储介质和计算机设备 | |
CN115756486A (zh) | 一种数据接口解析方法及装置 | |
CN115131826A (zh) | 物品检测识别方法、网络模型的训练方法和装置 | |
CN115018529A (zh) | 理财广告的生成方法、装置、设备及存储介质 | |
CN108920700B (zh) | 一种虚假图片识别方法及装置 | |
CN111104844B (zh) | 多发票信息录入方法、装置、电子设备及存储介质 | |
CN114494751A (zh) | 证照信息识别方法、装置、设备及介质 | |
CN109800385B (zh) | 对象标记方法、电子设备、单据及计算机可读存储介质 | |
CN111324792A (zh) | 大数据平台 | |
CN113656486B (zh) | 生成可视化对象的方法、装置、终端设备及存储介质 | |
CN112818971A (zh) | 一种基于智能识别文件中图片内容的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20221018 |
|
RJ01 | Rejection of invention patent application after publication |