CN110516093B - 图片标注方法、装置及设备 - Google Patents

图片标注方法、装置及设备 Download PDF

Info

Publication number
CN110516093B
CN110516093B CN201910800255.9A CN201910800255A CN110516093B CN 110516093 B CN110516093 B CN 110516093B CN 201910800255 A CN201910800255 A CN 201910800255A CN 110516093 B CN110516093 B CN 110516093B
Authority
CN
China
Prior art keywords
picture
label
pairs
data set
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910800255.9A
Other languages
English (en)
Other versions
CN110516093A (zh
Inventor
张�浩
徐�明
邵新庆
刘强
宋咏君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen ZNV Technology Co Ltd
Nanjing ZNV Software Co Ltd
Original Assignee
Shenzhen ZNV Technology Co Ltd
Nanjing ZNV Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen ZNV Technology Co Ltd, Nanjing ZNV Software Co Ltd filed Critical Shenzhen ZNV Technology Co Ltd
Priority to CN201910800255.9A priority Critical patent/CN110516093B/zh
Publication of CN110516093A publication Critical patent/CN110516093A/zh
Application granted granted Critical
Publication of CN110516093B publication Critical patent/CN110516093B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供一种图片标注方法、装置及设备。该方法包括:获取图片数据集中预设数量图片对的标签关系,标签关系用于表示图片对是否具有相同标签;根据预设数量图片对的标签关系以及标签关系的传递性,确定图片数据集的标签关系集合;根据标签关系集合确定图片数据集中各个图片的标签。本发明实施例的方法,提高了图片标注的速度和准确率,解决了现有图片标注方法耗时耗力且准确率较低的问题。

Description

图片标注方法、装置及设备
技术领域
本发明实施例涉及数据处理技术领域,具体涉及图片标注方法、装置及设备。
背景技术
人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。近年来,随着人工智能的快速发展,机器学习作为一种实现人工智能的重要方式也获得的飞速的发展。机器学习通过选择合适的数学模型,拟定超参数,并输入样本数据,依据一定的策略,运用合适的学习算法对模型进行训练,最后运用训练好的模型对数据进行分析预测。为了获得高质量的模型,需要大量的已标注数据作为样本数据,用于对模型进行训练。
目前对数据的标注工作通常由人工完成。以图片识别任务为例,为了进行图片识别模型的训练,需要对大量图片进行标注,标注出各个图片对应的标签。通常每个标签需要对应多张图像,才可以进行图片识别模型的训练。在对图片进行标注的过程中,标注用户需要判断每张图片属于哪个标签,从而进行标注。若待标注的图片数据集中对应着大量的标签,由于人的记忆有限,无法准确记忆每个标签的详细信息,故难以对图片进行正确标注,逐一对比又极为耗时。
综上所述,现有的图片标注方法不仅耗时耗力,而且标注的准确率较低。
发明内容
本发明实施例提供一种图片标注方法、装置及设备,用于提高图片标注的速度和准确率,用以解决现有图片标注方法耗时耗力且准确率较低的问题。
第一方面,本发明实施例提供一种图片标注方法,包括:
获取图片数据集中预设数量图片对的标签关系,标签关系用于表示图片对是否具有相同标签;
根据预设数量图片对的标签关系以及标签关系的传递性,确定图片数据集的标签关系集合;
根据标签关系集合确定图片数据集中各个图片的标签。
第二方面,本发明实施例提供一种图片标注装置,包括:
获取模块,用于获取图片数据集中预设数量图片对的标签关系,标签关系用于表示图片对是否具有相同标签;
处理模块,用于根据预设数量图片对的标签关系以及标签关系的传递性,确定图片数据集的标签关系集合;
标注模块,用于根据标签关系集合确定图片数据集中各个图片的标签。
第三方面,本发明实施例提供一种电子设备,包括:
至少一个处理器和存储器;
存储器存储计算机执行指令;
至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行如第一方面任一项所述的图片标注方法。
第四方面,本发明实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如第一方面任一项所述的图片标注方法。
本发明实施例提供的图片标注方法、装置及设备,通过首先获取图片数据集中预设数量图片对的标签关系,标签关系用于表示图片对是否具有相同标签,然后根据预设数量图片对的标签关系以及标签关系的传递性,确定图片数据集的标签关系集合,最后根据标签关系集合确定图片数据集中各个图片的标签,实现了对图片数据集中各图片的标注,减少了人工工作量。通过获取少量图片对的标签关系,充分利用标签关系的传递性,完成对图片的标注,提高了图片标注速度;且借助于可靠的标签关系的传递性,可以提高图片标注的准确性。
附图说明
图1为本发明提供的图片标注方法一实施例的流程图;
图2为本发明提供的图片标注方法又一实施例的流程图;
图3A-3D为本发明一实施例提供的图片标注过程示意图;
图4为本发明提供的图片标注装置一实施例的结构示意图;
图5为本发明提供的电子设备一实施例的结构示意图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
图1为本发明提供的图片标注方法一实施例的流程图,如图1所示,本实施例提供的方法可以包括:
S101、获取图片数据集中预设数量图片对的标签关系,标签关系用于表示图片对是否具有相同标签。
本实施例中的图片数据集为待标注的图片数据集,可以由所有待标注图片组成。图片数据集中任意两张图片可以组成一个图片对。对于一个由N张图片组成的图片数据集,其图片对的总数量为
本实施例中预设数量的具体取值可以根据图片数据集中含有的图片对的数量确定。例如,当图片数据集中的图片数量较大时,可以将预设数量的取值,设为图片数据集的图片对数量的十分之一。
本实施例中的标签关系用于表示图片对是否具有相同标签,标签关系的取值范围可以根据具体需要进行设置。例如,以Rij表示由图片i和图片j组成的图片对的标签关系,Rij=1表示图片i和图片j具有相同的标签,Rij=0表示图片i和图片j具有不同的标签。需要说明的是,本实施例中图片的标签取值需要根据具体的标注任务进行确定,本实施例对此不作限制。以人脸识别为例,图片的标签可以为图片中人物的姓名,例如张三、李四等;以图片类型识别为例,图片的标签例如可以为人物、动物、建筑物、自然风景等。
本实施例中采用的是图片对的标签关系,而并非图片对的标签。无论是对于人工标注还是机器标注来说,获得图片对的标签关系都要比获得图片对的标签容易且迅速的多。举例来说,判断两张图片是否属于同一人(图片对的标签关系),要比分别确定这两张图片中的人是谁(图片对的标签)容易且快速的多。
S102、根据预设数量图片对的标签关系以及标签关系的传递性,确定图片数据集的标签关系集合。
本实施例中在获取到预设数量图片对的标签关系之后,便可以根据所获取到的标签关系以及标签关系的传递性,确定图片数据集中其他相关的图片对的标签关系。
本实施例中标签关系的传递性例如可以包括:若第一图片与第二图片具有相同标签,第二图片与第三图片具有相同标签,则第一图片与第三图片具有相同标签;若第四图片与第五图片具有不同标签,第五图片与第六图片具有相同标签,则第四图片与第六图片具有不同标签。
标签关系的传递性可以用如下公式进行表示(公式中符号的定义参照步骤S101):
(1)
(2)
举例来说,若获取到的预设数量图片对的标签关系中包括:图片A和图片B组成的图片对的标签关系为具有相同标签,图片B和图片C组成的图片对的标签关系为具有相同标签,则根据标签关系的传递性,可以确定图片数据集中由图片A和图片C组成的图片对的标签关系为具有相同标签;若获取到的预设数量图片对的标签关系中包括:图片D和图片E组成的图片对的标签关系为具有不同标签,图片E和图片F组成的图片对的标签关系为具有相同标签,则根据标签关系的传递性,可以确定图片数据集中由图片D和图片F组成的图片对的标签关系为具有不同标签。据此,可以根据少量已知图片对的标签关系确定图片数据集中更多图片对的标签关系。需要说明的是,若已知图片A和图片B组成的图片对的标签关系为具有不同标签,图片B和图片C组成的图片对的标签关系也为具有不同标签,则无法确定图片A和图片C组成的图片对的标签关系。
本实施例中图片数据集的标签关系集合应当包括图片数据集中所有图片对的标签关系。若根据已获取的预设数量图片对的标签关系以及标签关系的传递性,未获得图片数据集中的全部图片对,则可以遍历图片数据集,确定出未确定标签关系的所有图片对,重复S101和S102的步骤,直至获得全部图片对的标签关系。
S103、根据标签关系集合确定图片数据集中各个图片的标签。
本实施例中在确定了图片数据集的标签关系集合之后,便可以根据该标签关系集合确定图片数据集中各个图片的标签,例如可以为标签关系集合所指示的具有相同标签的所有图片设置相同且唯一的标签。
本实施例中根据标签关系集合确定图片数据集中各个图片的标签的一种可能的实现方式为:根据标签关系集合,在图片数据集中进行遍历查找,确定与第七图片具有相同标签的全部图片,第七图片为图片数据集中的任意一张图片;为第七图片以及与第七图片具有相同标签的全部图片标注相同且唯一的标签。例如,对于图片数据集中的图片i,根据标签关系集合,确定所有满足Rij=1的图片j,为其标注相同且唯一的标签IDi
本实施例提供的图片标注方法,通过首先获取图片数据集中预设数量图片对的标签关系,标签关系用于表示图片对是否具有相同标签,然后根据预设数量图片对的标签关系以及标签关系的传递性,确定图片数据集的标签关系集合,最后根据标签关系集合确定图片数据集中各个图片的标签,实现了对图片数据集中各图片的标注,减少了人工工作量。通过获取少量图片对的标签关系,充分利用标签关系的传递性,完成对图片的标注,提高了图片标注速度;且借助于可靠的标签关系的传递性,可以提高图片标注的准确性。
下面将针对步骤S101,采用几个具体的实施例来详细说明如何获取图片数据集中预设数量图片对的标签关系。本实施例中获取图片数据集中预设数量图片对的标签关系具体可以包括:获取图片数据集的标签相似度集合,标签相似度集合包括图片数据集中所有图片对的标签相似度,标签相似度用于表示图片对具有相同标签的置信度;根据标签相似度集合,获取图片数据集中预设数量图片对的标签关系。
其中,获取图片数据集的标签相似度集合具体可以包括:
获取图片数据集中每一张图片的特征向量,根据如下公式确定图片对的标签相似度:
其中,Fi表示第i张图片的特征向量,Fj表示第j张图片的特征向量,‖Fi‖表示Fi的模,||Fj||表示Fj的模,Cij表示第i张图片与第j张图片的标签相似度。
需要说明的是,针对不同的标注任务,可以采用不同类型的特征向量,可以采用一种类型的特征向量,也可以将多种类型的特征向量进行结合。例如,对于人脸识别来说,可以采用Haar特征;对于图片类别识别来说,可以采用尺度不变特征变换SIFT特征等。还可以采用针对不同标注任务预先训练的特征提取模型获取各图片的特征向量。
可选的,根据标签相似度集合,获取图片数据集中预设数量图片对的标签关系的一种实现方式可以是:根据标签相似度集合,按照标签相似度从高到低的顺序,从图片数据集中确定预设数量图片对;获取标注用户对预设数量图片对的标签关系的标注;根据标注,确定预设数量图片对的标签关系。
图片对的标签相似度越高,图片对具有相同标签的概率越高,而具有相同标签的标签关系在标签关系的传递中更为有效,因此本实施例中优先选取标签相似度高的图片对。本实施例中通过获取标注用户对预设数量图片对的标签关系的标注,然后根据标注用户的标注,确定预设数量图片对的标签关系。例如可以向标注用户提供一种人机交互的标注页面,在页面中同时显示两张图片,由标注用户判断显示的图片对是否具有相同标签。对于标注包含大量标签的数据标注任务,标注图片对的标签关系,而非标注图片对的标签,可以有效解决人工记忆有限,逐一对比极为耗时的问题。通过判断图片对的两两关系,标注用户可以简单快速的区分即两张图片是否具有相同标签。
本实施例中在从图片数据集中选择预设数量图片对时,需要排除有环关系。所谓有环关系是指3个图片对中仅包含3张图片,如P12,P23和P31(Pij表示由图片i和图片j组成的图片对)。
可选的,根据标签相似度集合,获取图片数据集中预设数量图片对的标签关系的另一种实现方式可以是:根据标签相似度集合以及预设置信度阈值,获取图片数据集中预设数量图片对的标签关系。
具体的可以设置第一置信度阈值,当图片对的标签相似度大于等于第一置信度阈值时,则确定该图片对具有相同标签;还可以设置第二置信度阈值,当图片对的标签相似度小于等于第二置信度阈值时,则确定该图片对具有不同标签。可以理解的是,为了提高准确性,第一置信度阈值应当设置的尽可能大,如可以设为0.95;同时第二置信度阈值应当设置的尽可能小,如可以设为0.05。
图2为本发明提供的图片标注方法又一实施例的流程图。如图2所示,本实施例提供的方法可以包括:
S201、获取图片数据集中每一张图片的特征向量,根据特征向量确定图片数据集的标签相似度集合。
具体实现方式可以参考上述实施例,此处不再赘述。
S202、根据标签相似度集合,从图片数据集中选择未确定标签关系的预设数量图片对。
本实施例中,可以将未确定标签关系的图片对的标签相似度按照从高到低的顺序排列,优先选取标签相似度高的图片对进行人工标注。
S203、获取标注用户对预设数量图片对的标签关系的标注;根据标注,确定预设数量图片对的标签关系。
具体实现方式可以参考上述实施例,此处不再赘述。
S204、根据预设数量图片对的标签关系以及标签关系的传递性,确定图片数据集中相关图片对的标签关系。
本实施例中的相关图片对为能够根据预设数量图片对的标签关系以及标签关系的传递性确定其标签关系的图片对。举例来说,若已获取R12=1,R23=1,则可以确定R13=1,那么由图片1和图片3组成的图片对即为相关图片对。
S205、判断图片数据集中全部图片对的标签关系是否均已确定。若否,则继续执行S202;若是,则执行S206。
本实施例可以通过遍历的方式判断是否已经获得了全部图片对的标签关系。若已获得全部图片对的标签关系,则继续执行步骤S206完成图片标注;若还有图片对的标签关系未确定,则继续执行步骤S202进行迭代,直至获取全部图片对的标签关系。
S206、根据标签关系集合确定图片数据集中各个图片的标签。
具体实现方式可以参考上述实施例中的S103,此处不再赘述。
本实施例提供的图片标注方法,仅需标注用户对少量图片对的标签关系进行标注,便可以根据标签关系的传递性,完成对图片数据集中各图片的标注,减少了人工工作量。且对图片对的标签关系进行标注,既无需记忆大量标签,也无需逐一对比,可以快速准确的完成,再结合可靠的标签关系的传递性,可以提高图片标注的速度和准确性。
图3A-3D为本发明一实施例提供的图片标注过程示意图。本实施例以行人重识别场景为例,对图片标注的过程进行详细说明。行人重识别是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。为便于进行说明,本实施例中的图片数据集包括9张待标注的行人图片,而在实际标注过程中图片数据集可能包括成千上万的待标注图片。图3A-3D示出了待标注的9张行人图片,并采用数字1-9为其进行了编号。
首先对图片1-9进行特征提取,获取对应的特征向量{F1,F2,F3,……,F9}。本实施例中例如可以使用预先训练好的行人重识别特征提取模型提取图片的特征向量,也可以采用适于进行行人重识别的一种或者多种特征向量的结合。在确定了图片的特征向量之后,根据上述实施例提供的用于确定标签相似度的公式,计算图片数据集中36个图片对的标签相似度,获得图片数据集的标签相似度集合{C12,C13,C14,……,C19,C23,C24,……,C89}。本实施例中的预设数量取值为11。将标签相似度按照从大到小的顺序进行排列,选取前11个且不包含有环关系的图片对。由标注用户对这11个图片对的标签关系进行标注。根据标注确定各图片对的标签关系。
图3A示出了本实施例中获取到的图片数据集中11个图片对的标签关系。如图3A所示,其中粗实线表示该图片对具有相同标签,细实线表示该图片对具有不同标签,即R12=1,R48=1,R56=1,R67=1,R23=0,R36=0,R38=0,R16=0,R10=0,R79=0,R18=0。
然后根据已经获得的11个图片对的标签关系以及标签关系的传递性,确定图片数据集中相关图片对的标签关系。例如,根据R56=1和R67=1,可以确定图片5和7也具有相同标签,即R57=1;根据R18=0和R12=1,可以确定图片2和图片8具有不同标签,即R28=0。图3B中使用虚线表示根据标签关系的传递性所确定的标签关系,其中粗虚线表示该图片对具有相同标签,细虚线表示该图片对具有不同标签。
图3C中示出了已经获取到的11个图片对的标签关系(采用实线表示,粗实线表示具有相同标签,细实线表示具有不同标签),以及根据这11个图片对的标签关系,利用标签关系的传递性,能够确定的全部标签关系(采用虚线表示,粗虚线表示具有相同标签,细虚线表示具有不同标签)。如图3C所示,通过上述步骤依然无法获知图片3和图片9,图片8和图片9,图片4和图片9的标签关系。因此,需要遍历图片数据集,找到仍未标记和推理出标签关系的图片对,重复上述过程直至获取图片数据集中所有图片对的标签关系。具体过程可以参考上述实施例,此处不再赘述。图3D示出了图片数据集中所有图片对的标签关系。图3D中粗实线表示具有相同标签,细实线表示具有不同标签。
最后,根据图3D所示的标签关系,确定图片数据集中各个图片的标签。对于图片数据集中的任一图片来说,遍历图片数据集,找到与该图片具有相同标签的所有图片,为其标注相同且唯一的标签。可以理解的,为了降低遍历图片数据集的运算量,在对图片进行标注后,则将已标注的图片从待标注的图片数据集中移出。再选择下一个图片重复此步骤,直至图片数据集中的全部图片被标注。以图3所示的标签关系为例,对于图片1,遍历图片数据集,只有图片2是通过粗实线与图片1连接的,因此与图片1具有相同标签的只有图片2,将图片1和图片2标注为ID1,然后将其移出图片数据集;对于图片3,遍历图片数据集,只有图片9与其具有相同标签,将图片3和图片9标注为ID3,然后移出图片数据集;对于图片4,只有图片8与其具有相同标签,将图片4和图片8标注为ID4,移出图片数据集;对于图片5,遍历图片数据集,图片6和图片7均与图片5具有相同标签,将图片5、图片6和图片7标注为ID5,移出图片数据集。至此,图片数据集中的图片全部获得标注。表1示出了图片编号与其对应的标签之间的关系。
表1
图片编号 标签
1 ID1
2 ID1
3 ID3
4 ID4
5 ID5
6 ID5
7 ID5
8 ID4
9 ID3
本发明实施例还提供一种图片标注装置,请参见图4所示,本发明实施例仅以图4为例进行说明,并不表示本发明仅限于此。图4为本发明提供的图片标注装置一实施例的结构示意图。如图4所示,本实施例提供的图片标注装置40包括:获取模块401、处理模块402和标注模块403。
获取模块401,用于获取图片数据集中预设数量图片对的标签关系,标签关系用于表示图片对是否具有相同标签;
处理模块402,用于根据预设数量图片对的标签关系以及标签关系的传递性,确定图片数据集的标签关系集合;
标注模块403,用于根据标签关系集合确定图片数据集中各个图片的标签。
本实施例的装置,可以用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
可选的,标签关系的传递性可以包括:若第一图片与第二图片具有相同标签,第二图片与第三图片具有相同标签,则第一图片与第三图片具有相同标签;若第四图片与第五图片具有不同标签,第五图片与第六图片具有相同标签,则第四图片与第六图片具有不同标签。
可选的,获取模块401用于获取图片数据集中预设数量图片对的标签关系,具体可以包括:
获取图片数据集的标签相似度集合,标签相似度集合包括图片数据集中所有图片对的标签相似度,标签相似度用于表示图片对具有相同标签的置信度;
根据标签相似度集合,获取图片数据集中预设数量图片对的标签关系。
可选的,获取模块401用于获取图片数据集的标签相似度集合,具体可以包括:
获取图片数据集中每一张图片的特征向量,根据如下公式确定图片对的标签相似度:
其中,Fi表示第i张图片的特征向量,Fj表示第j张图片的特征向量,‖Fi‖表示Fi的模,||Fj||表示Fj的模,Cij表示第i张图片与第j张图片的标签相似度。
可选的,获取模块401用于根据标签相似度集合,获取图片数据集中预设数量图片对的标签关系,具体可以包括:
根据标签相似度集合,按照标签相似度从高到低的顺序,从图片数据集中确定预设数量图片对;
获取标注用户对预设数量图片对的标签关系的标注;
根据标注,确定预设数量图片对的标签关系。
可选的,获取模块401用于根据标签相似度集合,获取图片数据集中预设数量图片对的标签关系,具体可以包括:
根据标签相似度集合以及预设置信度阈值,获取图片数据集中预设数量图片对的标签关系。
可选的,标注模块403用于根据标签关系集合确定图片数据集中各个图片的标签,具体可以包括:根据标签关系集合,在图片数据集中进行遍历查找,确定与第七图片具有相同标签的全部图片,第七图片为图片数据集中的任意一张图片;为第七图片以及与第七图片具有相同标签的全部图片标注相同且唯一的标签。
本发明实施例还提供一种电子设备,请参见图5所示,本发明实施例仅以图5为例进行说明,并不表示本发明仅限于此。图5为本发明提供的电子设备一实施例的结构示意图。如图5所示,本实施例提供的电子设备50包括:存储器501、处理器502和总线503。其中,总线503用于实现各元件之间的连接。
存储器501中存储有计算机程序,计算机程序被处理器502执行时可以实现上述任一方法实施例的技术方案。
其中,存储器501和处理器502之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可以通过一条或者多条通信总线或信号线实现电性连接,如可以通过总线503连接。存储器501中存储有实现图片标注方法的计算机程序,包括至少一个可以软件或固件的形式存储于存储器501中的软件功能模块,处理器502通过运行存储在存储器501内的软件程序以及模块,从而执行各种功能应用以及数据处理。
存储器501可以是,但不限于,随机存取存储器(Random Access Memory,简称:RAM),只读存储器(Read Only Memory,简称:ROM),可编程只读存储器(ProgrammableRead-Only Memory,简称:PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,简称:EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,简称:EEPROM)等。其中,存储器501用于存储程序,处理器502在接收到执行指令后,执行程序。进一步地,上述存储器501内的软件程序以及模块还可包括操作系统,其可包括各种用于管理系统任务(例如内存管理、存储设备控制、电源管理等)的软件组件和/或驱动,并可与各种硬件或软件组件相互通信,从而提供其他软件组件的运行环境。
处理器502可以是一种集成电路芯片,具有信号的处理能力。上述的处理器502可以是通用处理器,包括中央处理器(Central Processing Unit,简称:CPU)、网络处理器(Network Processor,简称:NP)等。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。可以理解,图5的结构仅为示意,还可以包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。图5中所示的各组件可以采用硬件和/或软件实现。
需要说明的是,本实施例提供的电子设备包括但不限于以下中的至少一个:用户侧设备、网络侧设备。用户侧设备包括但不限于计算机、智能手机、平板电脑、数字广播终端、消息收发设备、游戏控制台、个人数字助理等。网络侧设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机组成的一个超级虚拟计算机。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时可以实现上述任一方法实施例提供的图片标注方法。本实施例中的计算机可读存储介质可以是计算机能够存取的任何可用介质,或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备,可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如SSD)等。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (8)

1.一种图片标注方法,其特征在于,包括:
获取图片数据集中预设数量图片对的标签关系,所述标签关系用于表示图片对是否具有相同标签;
根据所述预设数量图片对的标签关系以及标签关系的传递性,确定所述图片数据集的标签关系集合;
根据所述标签关系集合确定所述图片数据集中各个图片的标签;
所述获取图片数据集中预设数量图片对的标签关系包括:
获取所述图片数据集的标签相似度集合,所述标签相似度集合包括所述图片数据集中所有图片对的标签相似度,所述标签相似度用于表示图片对具有相同标签的置信度;
根据所述标签相似度集合,获取图片数据集中预设数量图片对的标签关系;
所述根据所述标签相似度集合,获取图片数据集中预设数量图片对的标签关系,包括:
根据所述标签相似度集合,按照标签相似度从高到低的顺序,从所述图片数据集中确定预设数量图片对;
获取标注用户对所述预设数量图片对的标签关系的标注;
根据所述标注,确定所述预设数量图片对的标签关系。
2.如权利要求1所述的方法,其特征在于,所述标签关系的传递性包括:
若第一图片与第二图片具有相同标签,第二图片与第三图片具有相同标签,则第一图片与第三图片具有相同标签;
若第四图片与第五图片具有不同标签,第五图片与第六图片具有相同标签,则第四图片与第六图片具有不同标签。
3.如权利要求1所述的方法,其特征在于,所述获取所述图片数据集的标签相似度集合,包括:
获取所述图片数据集中每一张图片的特征向量,根据如下公式确定图片对的标签相似度:
其中,Fi表示第i张图片的特征向量,Fj表示第j张图片的特征向量,‖Fi‖表示Fi的模,‖Fj‖表示Fj的模,Cij表示第i张图片与第j张图片的标签相似度。
4.如权利要求1所述的方法,其特征在于,所述根据所述标签相似度集合,获取图片数据集中预设数量图片对的标签关系,包括:
根据所述标签相似度集合以及预设置信度阈值,获取图片数据集中预设数量图片对的标签关系。
5.如权利要求1-4任一项所述的方法,其特征在于,所述根据所述标签关系集合确定所述图片数据集中各个图片的标签,包括:
根据所述标签关系集合,在所述图片数据集中进行遍历查找,确定与第七图片具有相同标签的全部图片,所述第七图片为所述图片数据集中的任意一张图片;
为所述第七图片以及与所述第七图片具有相同标签的全部图片标注相同且唯一的标签。
6.一种图片标注装置,其特征在于,包括:
获取模块,用于获取图片数据集中预设数量图片对的标签关系,所述标签关系用于表示图片对是否具有相同标签;
处理模块,用于根据所述预设数量图片对的标签关系以及标签关系的传递性,确定所述图片数据集的标签关系集合;
标注模块,用于根据所述标签关系集合确定所述图片数据集中各个图片的标签;
所述获取图片数据集中预设数量图片对的标签关系包括:
获取所述图片数据集的标签相似度集合,所述标签相似度集合包括所述图片数据集中所有图片对的标签相似度,所述标签相似度用于表示图片对具有相同标签的置信度;
根据所述标签相似度集合,获取图片数据集中预设数量图片对的标签关系;
所述根据所述标签相似度集合,获取图片数据集中预设数量图片对的标签关系,包括:
根据所述标签相似度集合,按照标签相似度从高到低的顺序,从所述图片数据集中确定预设数量图片对;
获取标注用户对所述预设数量图片对的标签关系的标注;
根据所述标注,确定所述预设数量图片对的标签关系。
7.一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1-5任一项所述的图片标注方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-5任一项所述的图片标注方法。
CN201910800255.9A 2019-08-28 2019-08-28 图片标注方法、装置及设备 Active CN110516093B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910800255.9A CN110516093B (zh) 2019-08-28 2019-08-28 图片标注方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910800255.9A CN110516093B (zh) 2019-08-28 2019-08-28 图片标注方法、装置及设备

Publications (2)

Publication Number Publication Date
CN110516093A CN110516093A (zh) 2019-11-29
CN110516093B true CN110516093B (zh) 2023-09-29

Family

ID=68628441

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910800255.9A Active CN110516093B (zh) 2019-08-28 2019-08-28 图片标注方法、装置及设备

Country Status (1)

Country Link
CN (1) CN110516093B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284784A (zh) * 2018-09-29 2019-01-29 北京数美时代科技有限公司 一种针对直播场景视频的内容审核模型训练方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9607014B2 (en) * 2013-10-31 2017-03-28 Adobe Systems Incorporated Image tagging
CN107609466A (zh) * 2017-07-26 2018-01-19 百度在线网络技术(北京)有限公司 人脸聚类方法、装置、设备及存储介质
CN109725980B (zh) * 2017-10-27 2023-05-16 伊姆西Ip控股有限责任公司 生成镜像标签的方法、设备以及计算机可读介质
CN107909104B (zh) * 2017-11-13 2023-07-18 腾讯数码(天津)有限公司 一种图片的人脸聚类方法、装置及存储介质
CN109657087A (zh) * 2018-11-30 2019-04-19 平安科技(深圳)有限公司 一种数据批量标注方法、装置及计算机可读存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284784A (zh) * 2018-09-29 2019-01-29 北京数美时代科技有限公司 一种针对直播场景视频的内容审核模型训练方法及装置

Also Published As

Publication number Publication date
CN110516093A (zh) 2019-11-29

Similar Documents

Publication Publication Date Title
CN107944020B (zh) 人脸图像查找方法及装置、计算机装置和存储介质
CN108629043B (zh) 网页目标信息的提取方法、装置及存储介质
CN108280477B (zh) 用于聚类图像的方法和装置
CN110532884B (zh) 行人重识别方法、装置及计算机可读存储介质
CN109034069B (zh) 用于生成信息的方法和装置
CN110765882B (zh) 一种视频标签确定方法、装置、服务器及存储介质
CN108376164B (zh) 一种潜力主播的展示方法及装置
CN110807472B (zh) 图像识别方法、装置、电子设备及存储介质
CN111753746B (zh) 属性识别模型训练方法、识别方法、电子设备、存储介质
CN110399547B (zh) 用于更新模型参数的方法、装置、设备和存储介质
CN111325200A (zh) 图像标注方法、装置、设备及计算机可读存储介质
CN110020638B (zh) 人脸表情识别方法、装置、设备和介质
CN115222443A (zh) 客户群体划分方法、装置、设备及存储介质
CN112860851B (zh) 基于根因分析的课程推荐方法、装置、设备及介质
CN116227573B (zh) 分割模型训练方法、图像分割方法、装置及相关介质
CN110516093B (zh) 图片标注方法、装置及设备
CN114548192A (zh) 样本数据处理方法、装置、电子设备及介质
CN110765917A (zh) 适用于人脸识别模型训练的主动学习方法、装置、终端、介质
CN115169360A (zh) 基于人工智能的用户意图识别方法及相关设备
CN114596435A (zh) 语义分割标签的生成方法、装置、设备及存储介质
CN110059180B (zh) 文章作者身份识别及评估模型训练方法、装置及存储介质
CN114139530A (zh) 同义词提取方法、装置、电子设备及存储介质
CN112308090A (zh) 图像分类方法及装置
CN113450351B (zh) 分割模型训练方法、图像分割方法、装置、设备及介质
CN115062783B (zh) 实体对齐方法及相关装置、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant