发明内容
本发明的目的在于提供一种基于标注者专业度管理的矿石图片标注方法和系统,能够提高标注效率,确保标注结果的准确性,缩短神经网络的训练时间,提升深度学习模型的准确性。
第一方面,实施例提供一种基于标注者专业度管理的矿石图片标注方法,包括:
采用预先构建的矿石标注模型对样本图片中的目标矿石进行标注,得到第一标注结果;
获取多个标注者用户端发送的多个标注者权值和多个标注者用户端对同一张样本图片对目标矿石的人工标注结果;
根据所述多个标注者权值和多个标注者用户端对样本图片中目标矿石的人工标注结果,得到样本图片的第二标注结果,在样本图片上展示所述第二标注结果;
根据所述第一标注结果和所述第二标注结果得到人机标注重合度;
根据所述人机标注重合度调整所述矿石标注模型。
在可选的实施方式中,所述多个标注者用户端对同一张样本图片的人工标注结果包括多个标注者用户端对同一张样本图片的多个标注者标签投票结果和多个标注者框选区域结果;所述第二标注结果包括矿石类别和矿石区域标框;其中,预先为同一样本图片设置多个类别的标签以获取标注者标签投票结果;根据所述多个标注者权值和多个标注者用户端对样本图片的人工标注结果,得到样本图片的第二标注结果包括:
根据多个标注者标签投票结果和标注者权值得到每个类别的标签得分;
将得分最高的标签所对应的类别作为样本图片的矿石类别;
根据多个标注者框选区域结果得到重叠区域;
根据所述重叠区域得到矿石区域标框。
在可选的实施方式中,预先存储每个标注者的专业度等级,根据每个标注者的专业度等级得到每个标注者的标注者权值;所述方法还包括:
根据多个标注者用户端对同一张样本图片的人工标注结果和第二标注结果得到多个标注者的标注者拟合命中率;
根据多个标注者的标注者拟合命中率得到每个标注者的专业度等级。
在可选的实施方式中,根据多个标注者的标注者拟合命中率得到每个标注者的专业度等级包括:
根据多个标注者拟合命中率得到每个标注者的拟合命中率均值和拟合偏差值;
当标注者的拟合命中率均值高于预设阈值时,根据所述拟合偏差值调整相应标注者的专业度等级。
在可选的实施方式中,还包括:
当标注者的拟合命中率均值低于预设阈值时,向相应的标注者用户端发送警告信息。
在可选的实施方式中,所述矿石标注模型为深度学习模型。
第二方面,实施例提供的一种基于标注者专业度管理的矿石图片标注装置,包括:
第一标注结果模块,用于采用预先构建的矿石标注模型对样本图片中的目标矿石进行标注,得到第一标注结果;
获取模块,用于获取多个标注者用户端发送的多个标注者权值和多个标注者用户端对同一张样本图片对目标矿石的人工标注结果;
第二标注结果模块,用于根据所述多个标注者权值和多个标注者用户端对样本图片对目标矿石的人工标注结果,得到样本图片的第二标注结果,在样本图片上展示所述第二标注结果;
人机标注重合度模块,用于根据所述第一标注结果和所述第二标注结果得到人机标注重合度;
调整模块,用于根据所述人机标注重合度调整所述矿石标注模型;
其中,所述多个标注者用户端对同一张样本图片的人工标注结果包括多个标注者用户端对同一张样本图片的多个标注者标签投票结果和多个标注者框选区域结果;所述第二标注结果包括矿石类别和矿石区域标框;其中,预先为同一样本图片设置多个类别的标签以获取标注者标签投票结果;根据所述多个标注者权值和多个标注者用户端对样本图片的人工标注结果,得到样本图片的第二标注结果包括:
根据多个标注者标签投票结果和标注者权值得到每个类别的标签得分;
将得分最高的标签所对应的类别作为样本图片的矿石类别;
根据多个标注者框选区域结果得到重叠区域;
根据所述重叠区域得到矿石区域标框。
第三方面,实施例提供的一种基于标注者专业度管理的矿石图片标注系统,包括标注者用户端和第二方面所述的矿石图片标注装置;
所述标注者用户端,用于接收矿石图片标注装置发送的样本图片,对样本图片进行标注得到人工标注结果,并向矿石图片标注装置发送所述人工标注结果和标注者权值;
所述矿石图片标注装置,用接收多个标注者用户端发送的多个人工标注结果和多个标注者权值,根据所述多个人工标注结果和多个标注者权值,得到样本图片的第二标注结果并加以展示;以及调整矿石标注模型。
第四方面,实施例提供一种基于标注者专业度管理的矿石分选系统,包括识别模块和分选模块;
所述识别模块,用于获取当前矿石的实时矿石图片,并采用第二方面所述的矿石图片标注装置得到的目标矿石的矿石标注模型识别矿石实时图片中的目标矿石,得到实时识别结果;
所述分选模块,用于根据所述实时识别结果控制分选执行机构从当前矿石中分选出目标矿石。
第五方面,实施例提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述前述实施方式任一项所述的方法的步骤。
第六方面,实施例提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行所述前述实施方式任一项所述方法。
本发明提供的基于标注者专业度管理的矿石图片标注方法和系统,通过矿石标注模型得到第一标注结果,通过标注者用户端得到人工标注结果,结合人工标注结果和标注者权值得到第二标注结果,根据所述第一标注结果和所述第二标注结果得到人机标注重合度,从而根据人机标注重合度调整所述矿石标注模型;本发明由于采用人机结合的方式调整矿石标注模型,从而能够提高标注效率,降低人工标注难度,确保标注结果的准确性,减少工作量,缩短神经网络的训练时间,提升深度学习模型的准确性。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
目前,在对矿石进行分类时,需要构建深度学习模型对矿石进行分类识别;而构建的深度学习模型精度十分依赖于训练样本的分类精度,但是矿石类的图片样本对于人工标注是一项十分具有挑战性的工作。普通人限于经验和专业知识很难保证标注准确性,而采用专业人员标注矿石类的图片样本则要面临标注效率和标注结果评价两大难题。
基于此,本发明提供了一种基于标注者专业度管理的矿石图片标注方法和系统,能够提高标注效率,确保标注结果的准确性,缩短神经网络的训练时间,提升深度学习模型的准确性,下面通过实施例对本发明进行详细介绍。
参照图1,本实施例提供一种基于标注者专业度管理的矿石图片标注方法,包括如下步骤:
S110,采用预先构建的矿石标注模型对样本图片中的目标矿石进行标注,得到第一标注结果;
具体地,在最初没有足够训练样本的条件下先采用传统的图像分类算法,例如决策树、支持向量机等,基于颜色、纹理等矿石表面特征进行自动分类标注。当具有足够的样本时,矿石标注模型为建立的基于神经网络的深度学习模型。因此,第一标注结果是基于机器的自动标注结果。
根据第一标注结果和样本数量对带有标注结果的样本图片通过封包软件进行分组打包,每包数据不大于N幅图片。样本包中包含样本图片,第一标注结果和唯一识别ID号。
S120,获取多个标注者用户端发送的多个标注者权值和多个标注者用户端对同一张样本图片对目标矿石的人工标注结果;
具体地,标注者用户端可以是移动终端,标注者通过自己的移动终端对接收的样本图片进行人工标注。
优选地,标注者预先通过移动终端上的APP预先注册用户账号,获取相应的待标注样本包,利用APP自带的标注工具对每幅样本图片进行标注。移动终端APP的进度管理模块自动存档每幅图片样本已完成的标注数据,并在移动终端上给出标定进度提示。当完成一个样本包的标注后提交标注结果到WEB服务器。
优选地,为标注者预先设置权限,以向指定的标注者账号开放样本报的访问权限。
S130,根据所述多个标注者权值和多个标注者用户端对样本图片的人工标注结果,得到样本图片的第二标注结果,在样本图片上展示所述第二标注结果;
具体地,根据多个标注者权值和多个标注者的人工标注结果进行决策,根据决策结果得到第二标注结果。
S140,根据所述第一标注结果和所述第二标注结果得到人机标注重合度;
具体地,通过计算第一标注结合和第二标注结果的重合率得到人机标注重合度。
S150,根据所述人机标注重合度调整所述矿石标注模型。
具体地,根据人机标注重合度调整深度学习模型,以提高深度学习模型识别的准确度。
可选地,所述多个标注者用户端对同一张样本图片的人工标注结果包括多个标注者用户端对同一张样本图片的多个标注者标签投票结果和多个标注者框选区域结果;所述第二标注结果包括矿石类别和矿石区域标框;其中,预先为同一样本图片设置多个类别的标签以获取标注者标签投票结果;上述实施例中的步骤S130包括如下步骤:
根据多个标注者标签投票结果和标注者权值得到每个类别的标签得分;
将得分最高的标签所对应的类别作为样本图片的矿石类别;
根据多个标注者框选区域结果得到重叠区域;
根据所述重叠区域得到矿石区域标框。
具体地,预先为每张图片设定多个标签,该标签表示矿石的可能类别。标注者在移动用户端对每张样本图片进行框选后,选择对应的标签,即得到标注者标签投票结果;将标注者标签投票结果和标注者权值相乘,得到一个标注者的标签得分;计算同一张样本图片框选区域的每个标注者的标签得分,从中统计出得分最高的标签;该标签所表示的类别即为该张样本图片框选区域的矿石类别。
统计每个标注者对同一样本图片所框选的重叠区域,从中取占所有标注者权值总和一定比例的重叠区域,将该重叠区域作为矿石区域标框。
可选地,预先存储每个标注者的专业度等级,根据每个标注者的专业度等级得到每个标注者的标注者权值;所述方法还包括:
根据多个标注者用户端对同一张样本图片的人工标注结果和第二标注结果得到多个标注者的拟合命中率;
根据多个标注者的拟合命中率得到每个标注者的专业度等级。
具体地,根据每个标注者的专业度等级还可以设定每个标注者的用户权限。
预先为每个标注者设定专业度等级,并标注标注者属性,其中标注者属性包括专业、经验、历史标注评分。
标注拟合策略是少数服从多数,而矿石标注的专业性和独特性导致有时真理掌握在少数人手中,标注者权值是专业度和标注历史评分的综合结果,为了最大限度保证标注结果决策的正确性,需要设定标注者权值,并调整专业度等级。
可选地,根据多个标注者的拟合命中率划分每个标注者的专业度等级包括:
根据多个标注者的拟合命中率得到每个标注者的拟合命中率均值和拟合偏差值;
当标注者的拟合命中率均值高于预设阈值时,根据所述拟合偏差值调整相应标注者的专业度等级。
具体地,统计每个标注者拟合命中率,得到拟合命中率均值和拟合偏差值,当累计N次拟合偏差高于预设偏差阈值时,降低专业度等级;而当累计N次拟合偏差低于预设偏差阈值时,则提升标注者的专业度等级。
可选地,还包括:
当标注者的拟合命中率均值低于预设阈值时,向相应的标注者用户端发送警告信息。
具体地,当标注者的拟合命中率均值低于预设阈值时,向标注者用户端发送拟合命中率均值,并发送标定质量较差警告。
参照图2,实施例提供的一种基于标注者专业度管理的矿石图片标注装置,包括如下模块:
第一标注结果模块21,用于采用预先构建的矿石标注模型对样本图片中的目标矿石进行标注,得到第一标注结果;
获取模块22,用于获取多个标注者用户端发送的多个标注者权值和多个标注者用户端对同一张样本图片对目标矿石的人工标注结果;
第二标注结果模块23,用于根据所述多个标注者权值和多个标注者用户端对样本图片对目标矿石的人工标注结果,得到样本图片的第二标注结果,在样本图片上展示所述第二标注结果;
人机标注重合度模块24,用于根据所述第一标注结果和所述第二标注结果得到人机标注重合度;
调整模块25,用于根据所述人机标注重合度调整所述矿石标注模型。
可选地,所述多个标注者用户端对同一张样本图片的人工标注结果包括多个标注者用户端对同一张样本图片的多个标注者标签投票结果和多个标注者框选区域结果;所述第二标注结果包括矿石类别和矿石区域标框;其中,预先为同一样本图片设置多个类别的标签以获取标注者标签投票结果;第二标注结果模块包括:
标签得分计算模块,用于根据多个标注者标签投票结果和标注者权值得到每个类别的标签得分;
标签得分比较模块,用于将得分最高的标签所对应的类别作为样本图片的矿石类别;
重叠区域获取模块,用于根据多个标注者框选区域结果得到重叠区域;
矿石区域标框模块,用于根据所述重叠区域得到矿石区域标框。
可选地,预先存储每个标注者的专业度等级,根据每个标注者的专业度等级得到每个标注者的标注者权值;所述装置还包括:
标注者拟合命中率模块,用于根据多个标注者用户端对同一张样本图片的人工标注结果和第二标注结果得到多个标注者的标注者拟合命中率;
专业度等级模块,用于根据多个标注者的标注者拟合命中率得到每个标注者的专业度等级。
可选地,专业度等级管理模块包括:
均值和偏差值模块,用于根据多个标注者拟合命中率得到每个标注者的拟合命中率均值和拟合偏差值;
专业度等级调整模块,用于当标注者的拟合命中率均值高于预设阈值时,根据所述拟合偏差值调整相应标注者的专业度等级。
可选地,还包括:
警告模块,用于当标注者的拟合命中率均值低于预设阈值时,向相应的标注者用户端发送警告信息。
可选地,所述矿石标注模型为深度学习模型。
参照图3,实施例提供的一种基于标注者专业度管理的矿石图片标注系统,包括标注者用户端和第二方面所述的矿石图片标注装置;
所述标注者用户端31,用于接收矿石图片标注装置发送的样本图片,对样本图片进行标注得到人工标注结果,并向矿石图片标注装置发送所述人工标注结果和标注者权值;
所述矿石图片标注装置32,用接收多个标注者用户端发送的多个人工标注结果和多个标注者权值,根据所述多个人工标注结果和多个标注者权值,得到样本图片的第二标注结果并加以展示;以及调整矿石标注模型。
参照图4,本发明实施例还提供一种基于标注者专业度管理的矿石分选系统,包括识别模块和分选模块;
所述识别模块41,用于获取当前矿石的实时矿石图片,并采用上述实施例中的矿石图片标注装置32得到目标矿石的矿石标注模型识别矿石实时图片中的目标矿石,得到实时识别结果;
所述分选模块42,用于根据所述实时识别结果控制分选执行机构从当前矿石中分选出目标矿石。
参见图5,本发明实施例还提供了一种电子设备400,包括通信接口401、处理器402、存储器403以及总线404,处理器402、通信接口401和存储器403通过总线404连接;上述存储器403用于存储支持处理器402执行上述矿石图片标注方法的计算机程序,上述处理器402被配置为用于执行该存储器403中存储的程序。
可选地,本发明实施例还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,程序代码使处理器执行如上述实施例中的矿石图片标注方法。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。