CN103426191A - 一种图片标注方法及系统 - Google Patents

一种图片标注方法及系统 Download PDF

Info

Publication number
CN103426191A
CN103426191A CN2012101681186A CN201210168118A CN103426191A CN 103426191 A CN103426191 A CN 103426191A CN 2012101681186 A CN2012101681186 A CN 2012101681186A CN 201210168118 A CN201210168118 A CN 201210168118A CN 103426191 A CN103426191 A CN 103426191A
Authority
CN
China
Prior art keywords
picture
mark
user
unit
judgement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101681186A
Other languages
English (en)
Other versions
CN103426191B (zh
Inventor
阮星华
高亮
欧鑫凤
李宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210168118.6A priority Critical patent/CN103426191B/zh
Publication of CN103426191A publication Critical patent/CN103426191A/zh
Application granted granted Critical
Publication of CN103426191B publication Critical patent/CN103426191B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供了一种图片标注方法及系统,其中图片标注系统包括:标注单元,用于获取标注用户对主题图片的初始标注;图片选取单元,用于根据所述初始标注选取干扰图片;判断单元,用于获取判断用户根据所述初始标注在所述主题图片和所述干扰图片中做出的选择;确定单元,用于根据判断用户的选择确定所述主题图片的最终标注。通过上述方式,可以提高图片标注的可靠度和准确度。

Description

一种图片标注方法及系统
【技术领域】
本发明涉及图片处理技术,特别涉及一种图片标注方法及系统。
【背景技术】
随着搜索技术的发展,单纯地文本搜索已经不能满足用户的需要,在浩瀚的互联网空间中存在的各种资源都成为用户寻找的目标,其中对图片进行搜索是用户的热点需求。
当用户通过搜索关键字对图片进行搜索时,图片搜索引擎会使用该关键字与图片标注进行匹配验证,以返回标注与搜索关键字匹配的图片作为搜索结果。可见,只有当图片标注足够准确时,图片搜索引擎才能返回理想的搜索结果。
在现有技术中,采用人工方式对图片进行标注,存在标注信息不准确、标注精度不够等问题。例如人工对图片的标注出现错误,导致标注信息与图片表达的真正含义不同而出现标注不准确的问题。或者人工标注时,由于标注者观察图片视角的局限,导致图片信息的描述不够全面而出现标注精度较低的问题,如一张宝马汽车的图片,标注者仅标注为汽车,这时搜索宝马就无法返回这张图片,也就是说,这张图片的标注精度不够高从而影响了图片搜索引擎返回的结果。
【发明内容】
本发明所要解决的技术问题是提供一种图片标注的方法及装置,以解决现有技术中图片标注的准确度不够高的技术缺陷。
本发明为解决技术问题而采用的技术方案是提供一种图片标注系统,包括:标注单元,用于获取标注用户对主题图片的初始标注;图片选取单元,用于根据所述初始标注选取干扰图片;判断单元,用于获取判断用户根据所述初始标注在所述主题图片和所述干扰图片中做出的选择;确定单元,用于根据判断用户的选择确定所述主题图片的最终标注。
根据本发明之一优选实施例,当判断用户的选择是所述主题图片时,所述确定单元将所述初始标注作为所述主题图片的最终标注。
根据本发明之一优选实施例,当判断用户的选择是无法判断时,所述标注单元进一步用于获取标注用户基于所述初始标注对所述主题图片进行的二次标注,所述判断单元进一步用于获取判断用户根据所述二次标注在所述主题图片和所述干扰图片中进行的选择,当判断用户根据所述二次标注进行的选择为所述主题图片时,所述确定单元将所述二次标注作为所述主题图片的最终标注。
根据本发明之一优选实施例,当判断用户的选择是无法判断时,所述标注单元进一步用于获取标注用户基于初始标注对所述主题图片进行的二次标注,所述图片选取单元进一步用于根据所述二次标注再次选取干扰图片,所述判断单元进一步用于获取判断用户根据所述二次标注在所述主题图片和再次选取的干扰图片进行的选择,当判断用户根据所述二次标注进行的选择为所述主题图片时,所述确定单元将所述二次标注作为所述主题图片的最终标注。
根据本发明之一优选实施例,所述判断单元获取多个判断用户根据所述初始标注在所述主题图片和选取的干扰图片中做出的选择,所述确定单元当所述多个判断用户中超过预设比例的判断用户的选择为所述主题图片时,将所述初始标注作为所述主题图片的最终标注。
根据本发明之一优选实施例,所述系统进一步包括用户选取单元,用于根据标注用户的IP地址选取距离标注用户的物理距离超过设定值的在线用户为判断用户。
根据本发明之一优选实施例,所述图片选取单元包括:切分单元,用于对所述初始标注进行分词,得到所述初始标注包含的各切分词;搜索单元,用于以各切分词或各切分词的组合词作为搜索关键词,从图片库中获取与所述搜索关键词匹配的候选图片;计算单元,用于计算所述候选图片与所述主题图片之间的相似度,从与所述主题图片之间的相似度大于设定值的候选图片中选取干扰图片。
根据本发明之一优选实施例,所述系统进一步包括图片管理装置,所述图片管理装置用于建立包含所述主题图片和所述干扰图片在内的图片库,其中所述图片管理装置包括:图片挖掘单元,用于从互联网上挖掘各图片链接地址,并建立以图片链接地址为图片保存形式的图片库;速度探测单元,用于确定所述图片库中加载速度低于限值的图片链接地址;缓存单元,用于将加载速度低于限值的所有图片链接地址所对应的图片下载并添加到所述图片库中。
本发明还提供了一种图片标注方法,包括:A.获取标注用户对主题图片的初始标注;B.根据所述初始标注选取干扰图片;C.获取判断用户根据所述初始标注在所述主题图片和所述干扰图片中做出的选择;D.根据判断用户的选择确定所述主题图片的最终标注。
根据本发明之一优选实施例,在所述步骤C中,当判断用户的选择是所述主题图片时,将所述初始标注作为所述主题图片的最终标注。
根据本发明之一优选实施例,在所述步骤C中,当判断用户的选择是无法判断时,获取标注用户基于所述初始标注对所述主题图片进行的二次标注,当判断用户根据所述二次标注在所述主题图片和所述干扰图片中选择所述主题图片时,将所述二次标注作为所述主题图片的最终标注。
根据本发明之一优选实施例,在所述步骤C中,当判断用户的选择是无法判断时,获取标注用户基于所述初始标注对所述主题图片进行的二次标注并根据所述二次标注再次选取干扰图片,当判断用户根据所述二次标注在所述主题图片和再次选取的干扰图片中选择所述主题图片时,将所述二次标注作为所述主题图片的最终标注。
根据本发明之一优选实施例,在所述步骤B中,获取多个判断用户根据所述初始标注在所述主题图片和选取的干扰图片中做出的选择,且在所述步骤C中,当所述多个判断用户中超过预设比例的判断用户的选择为所述主题图片时,将所述初始标注作为所述主题图片的最终标注。
根据本发明之一优选实施例,在所述步骤B中,所述判断用户是通过下列方式确定的:根据所述标注用户的IP地址选取距离所述标注用户的物理距离超过设定值的在线用户为所述判断用户。
根据本发明之一优选实施例,所述步骤B包括:对所述初始标注进行分词,得到所述初始标注包含的各切分词;以各切分词或各切分词的组合词作为搜索关键词,从图片库中获取与所述搜索关键词匹配的候选图片;计算所述候选图片与所述主题图片之间的相似度,从与所述主题图片之间的相似度大于设定值的候选图片中选取干扰图片。
根据本发明之一优选实施例,所述方法在所述步骤A前进一步包括E:建立包含所述主题图片和所述干扰图片在内的图片库,其中所述步骤E包括:从互联网上挖掘各图片链接地址,并建立以图片链接地址为图片保存形式的图片库;确定所述图片库中加载速度低于限值的图片链接地址;将加载速度低于限值的所有图片链接地址所对应的图片下载并添加到所述图片库中。
由以上技术方案可以看出,本发明通过从一个用户处获取图片标注结果,并通过另一个用户对该标注结果的评价来提高图片标注的准确度。在本发明中,对标注结果的评价,即判断用户做出的选择,能够排除标注者的影响,体现客观的评价尺度。本发明得到的图片最终标注,可靠程度和准确程度都大大提高。将本发明得到的标注图片用于图片搜索引擎系统,能够有效提高图片搜索引擎的准确率和召回率。
【附图说明】
图1为本发明中图片标注系统的结构示意框图;
图2为本发明中图片标注装置的实施例一的结构示意框图;
图3为本发明中标注单元的一个实施例的示意图;
图4为本发明中判断单元的一个实施例的示意图;
图5为本发明中图片选取单元的一个实施例的结构示意框图;
图6为本发明中图片标注装置的实施例二的结构示意框图;
图7为本发明中图片标注装置的实施例三的结构示意框图;
图8为本发明中图片管理装置的实施例的结构示意框图;
图9为本发明中图片标注方法的流程示意图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
请参考图1,图1为本发明中图片标注系统的结构示意框图。如图1所示,图片标注系统10可由图片标注装置100、用户管理装置110和图片管理装置120构成。其中用户管理装置110和图片管理装置120可采用现有技术实现,用户管理装置110主要用于实现对注册用户的信息进行保存、对用户登录进行验证或确定用户偏好等功能。图片管理装置120主要用于实现对图片资源进行挖掘、对图片进行处理或对图片进行保存等功能。以上提到的用户管理装置110及图片管理装置120可以实现的功能仅为列举,本领域技术人员可以想到的其他功能,也应该在此范围之内。
图片标注装置100是本发明中的主要部分,请参考图2,图2为本发明中图片标注装置100的实施例一的结构示意框图。如图2所示,该实施例中,图片标注装置100包括标注单元101、图片选取单元102、判断单元103、及确定单元104。
其中标注单元101,用于获取标注用户对主题图片的初始标注。图片选取单元102,用于选取干扰图片。判断单元103,用于获取判断用户根据初始标注在主题图片和干扰图片中做出的选择。确定单元104,用于根据判断用户的选择确定主题图片的最终标注。
请参考图3,图3为本发明中标注单元101的一个实施例的示意图。如图3所示,标注单元101可以是一个与用户交互的界面,通过该界面能够从标注用户处获取对主题图片的初始标注。标注用户可从用户管理装置110中进行选取,主题图片可才能够图片管理装置120中进行选取。从图3所示的交互界面获取到对界面左侧的主题图片的标注为“甲壳虫汽车”。请参考图4,图4为本发明中判断单元103的一个实施例的示意图。如图4所示,判断单元103也可以是一个与用户交互的界面,通过该界面能够获取判断用户的选择。其中判断用户可从用户管理装置110中进行选取,干扰图片由图片选取单元102从图片管理装置120中选取。图4所示的交互界面上除了图3中的主题图片,以及由标注单元101获取的初始标注,还有几幅与主题图片不相同的干扰图片。在本实施例中,干扰图片可以是图片选取单元102随机选取的图片,除此之外,干扰图片还可以是图片选取单元102按照一定算法选取的图片(将在后续实施例中详细描述)。在判断单元103得到判断用户在主题图片和干扰图片中做出的选择后,确定单元104便可以根据判断用户的选择确定主题图片的最终标注。如图4所示的交互界面中,判断用户根据“甲壳虫汽车”选择了第二幅(即主题图片),因此,确定单元104可以将“甲壳虫汽车”作为对应主题图片的最终标注。在本实施例中,如果判断用户做出了错误选择或无法对主题图片和干扰图片进行判断,可以放弃对主题图片的标注。
此外,在图2所示的实施例中,判断单元103也可以获取多个判断用户根据初始标注在主题图片和选取的干扰图片中做出的选择,当这多个判断用户中超过设定比例的判断用户做出的选择均是主题图片时,确定单元103将初始标注作为主题图片的最终标注。
请参考图5,图5为本发明中图片选取单元的一个实施例的结构示意框图。在图5所示的实施例中,图片选取单元102根据标注单元101获取的初始标注选取干扰图片。如图5所示,本实施例中,图片选取单元102包括切分单元1021、搜索单元1022和计算单元1023。
其中切分单元1021用于对标注单元101获取的初始标注进行分词,得到该初始标注包含的各切分词。
搜索单元1022用于以各切分词或各切分词的组合词作为搜索关键词,从图片库中获取与关键词匹配的候选图片。例如图片标注为“红色甲壳虫汽车”经切分单元1021切分后得到的各个切分词分别为“红色”、“甲壳虫”、“汽车”,则可以用“红色”、“甲壳虫”、“汽车”、“红色甲壳虫”“红色汽车”“甲壳虫汽车”、“红色甲壳虫汽车”等词语作为搜索关键词。搜索单元1022利用以上搜索关键词可以从图片库中获取到若干候选图片,提供给计算单元1023做后续处理。
计算单元1023用于计算候选图片与主题图片之间的相似度,并从与主题图片之间的相似度大于设定值的候选图片中选取干扰图片。计算单元1023计算候选图片与主题图片之间的相似度,一种实施方式是:分别计算候选图片与主题图片基于DCT离散余弦变换的图像感知哈希函数值,然后以候选图像的感知哈希函数值与主题图片的感知哈希函数值之间的汉明距离作为候选图片与主题图片之间相似度的衡量标准,其中汉明距离越大,说明候选图片与主题图片的相似度越小,反之说明候选图片与主题图片之间的相似度越大。选取干扰图片时,既可以从满足相似度大于设定值这一约束条件的候选图片中随机选取若干候选图片作为干扰图片,也可以将相似度大于设定值的候选图片排序后,从中选取与主题图片最不相似的若干候选图片作为干扰图片。
请参考图6,图6为本发明中图片标注装置100的实施例二的结构示意框图。与实施例一相同,实施例二中的图片标注装置100也包括了标注单元101、图片选取单元102、判断单元103和确定单元104。与实施例二中不同的是,当判断单元102获取的判断用户的选择是无法判断时,标注单元101还可以进一步用于获取标注用户基于初始标注对主题图片进行的二次标注,判断单元102还可以进一步用于获取判断用户根据二次标注在主题图片和干扰图片中进行的选择。当判断用户根据二次标注进行的选择为主题图片时,确定单元103将二次标注作为主题图片的最终标注。在上述方式中,判断用户根据二次标注进行选择时的干扰图片是与根据初始标注进行选择时的干扰图片相同的图片,此外,图片选取单元102也可进一步用于根据二次标注再次选取干扰图片,并由判断单元103获取判断用户根据二次标注在主题图片和再次选取的干扰图片中进行的选择。即干扰图片可以随着标注的改变而改变,在图片选取单元102根据二次标注再次选取干扰图片时,切分单元1021则进一步用于对二次标注进行分词,搜索单元1022及计算单元1023的实施方式与前面介绍的类似,在此不再赘述。
可以理解,一张图片覆盖的信息是多个维度的,传统的采用人工对图片进行标注的方式,由于人视角的限制,很难一次性地对图片进行全面地标注,这导致了图片标注的精度不够。例如:对图3所示的汽车,人工很可能标注为“甲壳虫”,而“甲壳虫”这个信息并不能完全定位至这张图片,因为“甲壳虫”除了可以描述汽车的图片,也可以描述一种昆虫,或者一个乐队。也就是说,将图3所示的汽车标注为“甲壳虫”仅仅体现了这张图片的一个维度信息,但是如果将这张图片标注为“甲壳虫汽车”,则可以与昆虫甲壳虫或者乐队甲壳虫的图片区分开来,即提高了图片标注的精度。通过本发明的图片标注装置,标注者本人可以不用对标注信息的精度进行判断,而是通过标注单元101与判断单元103相互之间的配合,当标注信息的精度不够时(如初始标注的精度不够),能够自动推动标注者对主题图片进行更准确的标注(如二次标注),这样可以有效地提高图片标注的精度。
上述实施例中,图片标注装置100与用户交互的方式可以有多种。一种方式是图片标注装置100在标注用户A和判断用户B的一次登录期间与其进行交互,直到完成对主题图片的最终标注为止。例如标注单元101获取到标注用户A对图3中图片的标注“甲壳虫”,判断单元103为判断用户B呈现对应的主题图片、标注“甲壳虫”以及干扰图片,并获取到判断用户B的选择为“无法判断”,此时继续触发标注单元101进一步获取标注用户A对图3中图片的二次标注,例如在与标注用户A交互的界面上给予提示信息告之标注用户需要对该图片进行进一步的标注,在标注单元101得到二次标注后,判断单元103在与判断用户B的交互界面上给出二次标注的信息以帮助判断用户B做出判断,当获取到的选择与主题图片匹配时,确定单元104得到主题图片的最终标注。
此外,图片标注装置100与用户之间的交互也可以不限定用户的登录周期。例如在标注用户A的本次登录期间由标注单元101获取标注用户A对主题图片的初始标注并保存,在判断用户B登录后,判断单元103将主题图片、标注单元101获取的初始标注及干扰图片通过用户交互界面展示给判断用户B,并获取判断用户B的选择,如果该选择是无法判断,可以在标注用户A的下次登录期间获取标注用户A对主题图片的二次标注,也可以不限定标注用户A,而是通过标注用户C获取对主题图片的二次标注,并且在任意一个判断用户D登录后,通过判断单元103提供的交互界面,获取判断用户D做出的选择,当该选择与主题图片匹配时,确定单元104得到主题图片的最终标注。
请参考图7,图7为本发明中图片标注装置100的实施例三的结构示意框图。与实施例一和实施例二不同,实施例三中图片标注装置100进一步还包括用户选取单元105,用于根据标注用户的IP地址选取距离标注用户的物理距离超过设定值的在线用户为判断用户。通过本实施例的实施方式,能够保证图片标注装置获取到的对主题图片的标注更客观,而不至于是由标注用户和判断用户采用合作的方式恶意标注的,从而保证了本发明中的图片标注的准确性。
本发明的图片管理装置120用于建立包括主题图片和干扰图片在内的图片库。由于图片可以从网络挖掘得来,因此图片常用的存储方式是保存该图片在网络上的链接地址,但是考虑到网络环境有可能导致某些图片的加载速度缓慢,因此图8示出了本发明的图片管理装置的一个优选实施例。如图8所示,图片管理装置120包括图片挖掘单元1201、速度探测单元1202及缓存单元1203。其中图片挖掘单元1201用于从互联网上挖掘各图片链接地址,并建立以图片链接地址为图片保存形式的图片库。速度探测单元1202用于确定图片库中加载速度低于限值的图片链接地址。缓存单元1203用于将加载速度低于限值的所有图片链接地址所对应的图片下载并添加到图片库中。
请参考图9,图9为本发明中图片标注方法的流程示意图。如图9所示,该方法包括:
步骤S201:获取标注用户对主题图片的初始标注。
步骤S202:根据初始标注选取干扰图片。
步骤S202:获取判断用户根据初始标注在主题图片和选取的干扰图片中做出的选择;
步骤S203:根据判断用户的选择确定主题图片的最终标注。
根据一个实施例,步骤S203中,当判断用户的选择是主题图片时,将初始标注作为主题图片的最终标注。
根据另一个实施例,步骤S202中,获取多个判断用户根据初始标注在主题图片和选取的干扰图片中做出的选择。步骤S203中,当上述多个判断用户中超过预设比例的判断用户的选择为主题图片时,将初始标注作为主题图片的最终标注。
根据另一个实施例,步骤S203中,当判断用户的选择是无法判断时,获取标注用户基于初始标注对主题图片进行的二次标注,当判断用户根据二次标注在主题图片和根据初始标注选取的干扰图片中选择主题图片时,将二次标注作为主题图片的最终标注。
根据另一个实施例,步骤S203中,当判断用户的选择是无法判断时,获取标注用户基于初始标注对主题图片进行的二次标注并根据二次标注再次选取干扰图片,当判断用户根据二次标注在主题图片和再次选取的干扰图片中选择主题图片时,将二次标注作为主题图片的最终标注。
根据一个实施例,步骤S202中的判断用户是通过下列方式确定的:根据标注用户的IP地址选取距离标注用户的物理距离超过设定值的在线用户为判断用户。
根据一个实施例,步骤S202中的干扰图片是通过下列方式确定的:
对初始标注进行分词,得到各切分词;
以各切分词或各切分词的组合词作为搜索关键词,从图片库中获取与关键词匹配的候选图片;
计算候选图片与主题图片之间的相似度,从与主题图片之间的相似度大于设定值的候选图片中选取干扰图片。
可以理解,在存在二次标注的情况下,根据二次标注再次选取干扰图片的时,也可以是对二次标注进行分词后执行上述相应动作得到干扰图片的。
在一个实施例中,本发明的图片标注方法在步骤S201前进一步还包括步骤S200:建立包含主题图片和干扰图片在内的图片库。
其中步骤S200包括:
步骤S2001:从互联网上挖掘各图片链接地址,并建立以图片链接地址为图片保存形式的图片库。
步骤S2002:确定所述图片库中加载速度低于限值的图片链接地址。
步骤S2003:将加载速度低于限值的所有图片链接地址所对应的图片下载并添加到所述图片库中。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (16)

1.一种图片标注系统,包括:
标注单元,用于获取标注用户对主题图片的初始标注;
图片选取单元,用于根据所述初始标注选取干扰图片;
判断单元,用于获取判断用户根据所述初始标注在所述主题图片和所述干扰图片中做出的选择;
确定单元,用于根据判断用户的选择确定所述主题图片的最终标注。
2.根据权利要求1所述的系统,其特征在于,当判断用户的选择是所述主题图片时,所述确定单元将所述初始标注作为所述主题图片的最终标注。
3.根据权利要求1所述的系统,其特征在于,当判断用户的选择是无法判断时,所述标注单元进一步用于获取标注用户基于所述初始标注对所述主题图片进行的二次标注,所述判断单元进一步用于获取判断用户根据所述二次标注在所述主题图片和所述干扰图片中进行的选择,当判断用户根据所述二次标注进行的选择为所述主题图片时,所述确定单元将所述二次标注作为所述主题图片的最终标注。
4.根据权利要求1所述的系统,其特征在于,当判断用户的选择是无法判断时,所述标注单元进一步用于获取标注用户基于初始标注对所述主题图片进行的二次标注,所述图片选取单元进一步用于根据所述二次标注再次选取干扰图片,所述判断单元进一步用于获取判断用户根据所述二次标注在所述主题图片和再次选取的干扰图片进行的选择,当判断用户根据所述二次标注进行的选择为所述主题图片时,所述确定单元将所述二次标注作为所述主题图片的最终标注。
5.根据权利要求1所述的系统,其特征在于,所述判断单元获取多个判断用户根据所述初始标注在所述主题图片和选取的干扰图片中做出的选择,所述确定单元当所述多个判断用户中超过预设比例的判断用户的选择为所述主题图片时,将所述初始标注作为所述主题图片的最终标注。
6.根据权利要求1所述的系统,其特征在于,所述系统进一步包括用户选取单元,用于根据标注用户的IP地址选取距离标注用户的物理距离超过设定值的在线用户为判断用户。
7.根据权利要求1所述的系统,其特征在于,所述图片选取单元包括:
切分单元,用于对所述初始标注进行分词,得到所述初始标注包含的各切分词;
搜索单元,用于以各切分词或各切分词的组合词作为搜索关键词,从图片库中获取与所述搜索关键词匹配的候选图片;
计算单元,用于计算所述候选图片与所述主题图片之间的相似度,从与所述主题图片之间的相似度大于设定值的候选图片中选取干扰图片。
8.根据权利要求1至7任一权项所述的系统,其特征在于,所述系统进一步包括图片管理装置,所述图片管理装置用于建立包含所述主题图片和所述干扰图片在内的图片库,其中所述图片管理装置包括:
图片挖掘单元,用于从互联网上挖掘各图片链接地址,并建立以图片链接地址为图片保存形式的图片库;
速度探测单元,用于确定所述图片库中加载速度低于限值的图片链接地址;
缓存单元,用于将加载速度低于限值的所有图片链接地址所对应的图片下载并添加到所述图片库中。
9.一种图片标注方法,包括:
A.获取标注用户对主题图片的初始标注;
B.根据所述初始标注选取干扰图片;
C.获取判断用户根据所述初始标注在所述主题图片和所述干扰图片中做出的选择;
D.根据判断用户的选择确定所述主题图片的最终标注。
10.根据权利要求9所述的方法,其特征在于,在所述步骤C中,当判断用户的选择是所述主题图片时,将所述初始标注作为所述主题图片的最终标注。
11.根据权利要求9所述的方法,其特征在于,在所述步骤C中,当判断用户的选择是无法判断时,获取标注用户基于所述初始标注对所述主题图片进行的二次标注,当判断用户根据所述二次标注在所述主题图片和所述干扰图片中选择所述主题图片时,将所述二次标注作为所述主题图片的最终标注。
12.根据权利要求9所述的方法,其特征在于,在所述步骤C中,当判断用户的选择是无法判断时,获取标注用户基于所述初始标注对所述主题图片进行的二次标注并根据所述二次标注再次选取干扰图片,当判断用户根据所述二次标注在所述主题图片和再次选取的干扰图片中选择所述主题图片时,将所述二次标注作为所述主题图片的最终标注。
13.根据权利要求9所述的方法,其特征在于,在所述步骤B中,获取多个判断用户根据所述初始标注在所述主题图片和选取的干扰图片中做出的选择,且在所述步骤C中,当所述多个判断用户中超过预设比例的判断用户的选择为所述主题图片时,将所述初始标注作为所述主题图片的最终标注。
14.根据权利要求9所述的方法,在所述步骤B中,所述判断用户是通过下列方式确定的:
根据所述标注用户的IP地址选取距离所述标注用户的物理距离超过设定值的在线用户为所述判断用户。
15.根据权利要求9所述的方法,其特征在于,所述步骤B包括:
对所述初始标注进行分词,得到所述初始标注包含的各切分词;
以各切分词或各切分词的组合词作为搜索关键词,从图片库中获取与所述搜索关键词匹配的候选图片;
计算所述候选图片与所述主题图片之间的相似度,从与所述主题图片之间的相似度大于设定值的候选图片中选取干扰图片。
16.根据权利要求9至15任一权项所述的方法,其特征在于,所述方法在所述步骤A前进一步包括E:建立包含所述主题图片和所述干扰图片在内的图片库,其中所述步骤E包括:
从互联网上挖掘各图片链接地址,并建立以图片链接地址为图片保存形式的图片库;
确定所述图片库中加载速度低于限值的图片链接地址;
将加载速度低于限值的所有图片链接地址所对应的图片下载并添加到所述图片库中。
CN201210168118.6A 2012-05-26 2012-05-26 一种图片标注方法及系统 Active CN103426191B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210168118.6A CN103426191B (zh) 2012-05-26 2012-05-26 一种图片标注方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210168118.6A CN103426191B (zh) 2012-05-26 2012-05-26 一种图片标注方法及系统

Publications (2)

Publication Number Publication Date
CN103426191A true CN103426191A (zh) 2013-12-04
CN103426191B CN103426191B (zh) 2016-04-27

Family

ID=49650880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210168118.6A Active CN103426191B (zh) 2012-05-26 2012-05-26 一种图片标注方法及系统

Country Status (1)

Country Link
CN (1) CN103426191B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105447523A (zh) * 2015-11-26 2016-03-30 国网北京市电力公司 图片源相机型号的检测方法和装置
CN106845090A (zh) * 2016-12-30 2017-06-13 海纳医信(北京)软件科技有限责任公司 医学影像标记方法和装置
CN106874684A (zh) * 2017-03-03 2017-06-20 浙江禾连网络科技有限公司 一种图像标注系统及方法
CN107203990A (zh) * 2017-04-02 2017-09-26 南京汇川图像视觉技术有限公司 一种基于模板匹配与图像质量评估的标贴破损检测方法
CN107832662A (zh) * 2017-09-27 2018-03-23 百度在线网络技术(北京)有限公司 一种获取图片标注数据的方法和系统
CN107908641A (zh) * 2017-09-27 2018-04-13 百度在线网络技术(北京)有限公司 一种获取图片标注数据的方法和系统
CN108427970A (zh) * 2018-03-29 2018-08-21 厦门美图之家科技有限公司 图片标注方法和装置
CN111241517A (zh) * 2015-08-07 2020-06-05 阿里巴巴集团控股有限公司 一种生物特征验证问答库的构建方法和装置
CN111680708A (zh) * 2019-03-18 2020-09-18 上海铼锶信息技术有限公司 一种给图片加标签的方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007019311A2 (en) * 2005-08-03 2007-02-15 Wink Technologies, Inc. Systems for and methods of finding relevant documents by analyzing tags
CN101196994A (zh) * 2007-12-26 2008-06-11 腾讯科技(深圳)有限公司 图片内容识别方法及识别系统
US20080275850A1 (en) * 2007-03-15 2008-11-06 Arito Asai Image tag designating apparatus, image search apparatus, methods of controlling operation of same, and programs for controlling computers of same
CN101754056A (zh) * 2008-12-17 2010-06-23 中国科学院自动化研究所 支持海量数据自动处理的数字内容编目管理系统及方法
CN102054033A (zh) * 2010-12-25 2011-05-11 百度在线网络技术(北京)有限公司 表情搜索引擎、使用该表情搜索引擎的表情管理系统及表情管理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007019311A2 (en) * 2005-08-03 2007-02-15 Wink Technologies, Inc. Systems for and methods of finding relevant documents by analyzing tags
US20080275850A1 (en) * 2007-03-15 2008-11-06 Arito Asai Image tag designating apparatus, image search apparatus, methods of controlling operation of same, and programs for controlling computers of same
CN101196994A (zh) * 2007-12-26 2008-06-11 腾讯科技(深圳)有限公司 图片内容识别方法及识别系统
CN101754056A (zh) * 2008-12-17 2010-06-23 中国科学院自动化研究所 支持海量数据自动处理的数字内容编目管理系统及方法
CN102054033A (zh) * 2010-12-25 2011-05-11 百度在线网络技术(北京)有限公司 表情搜索引擎、使用该表情搜索引擎的表情管理系统及表情管理方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111241517A (zh) * 2015-08-07 2020-06-05 阿里巴巴集团控股有限公司 一种生物特征验证问答库的构建方法和装置
CN111241517B (zh) * 2015-08-07 2023-10-27 创新先进技术有限公司 一种生物特征验证问答库的构建方法和装置
CN105447523A (zh) * 2015-11-26 2016-03-30 国网北京市电力公司 图片源相机型号的检测方法和装置
CN106845090A (zh) * 2016-12-30 2017-06-13 海纳医信(北京)软件科技有限责任公司 医学影像标记方法和装置
CN106874684A (zh) * 2017-03-03 2017-06-20 浙江禾连网络科技有限公司 一种图像标注系统及方法
CN106874684B (zh) * 2017-03-03 2019-03-12 浙江禾连网络科技有限公司 一种图像标注系统及方法
CN107203990A (zh) * 2017-04-02 2017-09-26 南京汇川图像视觉技术有限公司 一种基于模板匹配与图像质量评估的标贴破损检测方法
CN107203990B (zh) * 2017-04-02 2020-12-18 南京汇川图像视觉技术有限公司 一种基于模板匹配与图像质量评估的标贴破损检测方法
CN107908641B (zh) * 2017-09-27 2021-03-19 百度在线网络技术(北京)有限公司 一种获取图片标注数据的方法和系统
CN107832662A (zh) * 2017-09-27 2018-03-23 百度在线网络技术(北京)有限公司 一种获取图片标注数据的方法和系统
CN107908641A (zh) * 2017-09-27 2018-04-13 百度在线网络技术(北京)有限公司 一种获取图片标注数据的方法和系统
CN108427970A (zh) * 2018-03-29 2018-08-21 厦门美图之家科技有限公司 图片标注方法和装置
CN111680708A (zh) * 2019-03-18 2020-09-18 上海铼锶信息技术有限公司 一种给图片加标签的方法和系统

Also Published As

Publication number Publication date
CN103426191B (zh) 2016-04-27

Similar Documents

Publication Publication Date Title
CN103426191B (zh) 一种图片标注方法及系统
US11294981B2 (en) System and method for large scale crowdsourcing of map data cleanup and correction
US10417492B2 (en) Conversion of static images into interactive maps
CN103781522B (zh) 用于生成并加入经验共享的方法和系统
US10482169B2 (en) Recommending form fragments
CN103970733B (zh) 一种基于图结构的中文新词识别方法
CN103064924A (zh) 一种基于地理标注照片挖掘的旅游地点情境化推荐方法
US20170249388A1 (en) Expert Detection in Social Networks
US20170038212A1 (en) Automatic connection of images using visual features
WO2017016122A1 (zh) 一种信息推送方法及装置
CN105426521B (zh) 具有三级索引结构的海图数据库及其数据读取方法
WO2015157344A2 (en) Systems and methods for large scale crowdsourcing of map data location, cleanup, and correction
CN115168433A (zh) 生成上下文搜索呈现
CN103745498A (zh) 一种基于图像的快速定位方法
CN110598791A (zh) 地址相似度评价方法、装置、设备及介质
CN107085568A (zh) 一种文本相似度判别方法及装置
US20120096033A1 (en) Disambiguation of Entities
CN105893396A (zh) 基于附近位置来解释用户查询
Spruce et al. Social sensing of high-impact rainfall events worldwide: A benchmark comparison against manually curated impact observations
CN109376362A (zh) 一种纠错文本的确定方法以及相关设备
US10922321B2 (en) Interpreting user queries based on device orientation
Kelm et al. Georeferencing in social networks
Barret et al. Spatial entity matching with geoalign (demo paper)
KR20180020654A (ko) Ar 정보공유 기반 커뮤니케이션 제공 방법
CN110276001A (zh) 盘点页识别方法、装置、计算设备和介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant