CN102693231B - 用于根据来自网络的图像来确定图集的方法、装置和设备 - Google Patents

用于根据来自网络的图像来确定图集的方法、装置和设备 Download PDF

Info

Publication number
CN102693231B
CN102693231B CN201110070669.4A CN201110070669A CN102693231B CN 102693231 B CN102693231 B CN 102693231B CN 201110070669 A CN201110070669 A CN 201110070669A CN 102693231 B CN102693231 B CN 102693231B
Authority
CN
China
Prior art keywords
atlas
image
information
feature information
network feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110070669.4A
Other languages
English (en)
Other versions
CN102693231A (zh
Inventor
吕文先
魏星
潘腾飞
韩璟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201110070669.4A priority Critical patent/CN102693231B/zh
Publication of CN102693231A publication Critical patent/CN102693231A/zh
Application granted granted Critical
Publication of CN102693231B publication Critical patent/CN102693231B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明的目的在于提供一种用于根据来自网络的图像来确定图集的方法,该方法包括如下步骤:获取多个图像中每个图像对应的网络特征信息;根据所述每个图像对应的网络特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集。根据本发明的技术方案,能够根据图像的网络特征信息来将来自网络的多个图像进行聚类,以根据聚类结果生成包含相似图像的图集,并能够将聚类处理所得的图集作为整体提供给进行图像检索的用户,提高了用户的图像检索效率。

Description

用于根据来自网络的图像来确定图集的方法、装置和设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种用于根据来自网络的图像来确定图集的方法、装置和设备。
背景技术
现有技术中,图像搜索引擎通过建立关键词与图像间的倒排索引库,来根据用户输入的输入序列向用户提供图像。然而,前述方法仅能向用户提供分散的单张图像,但用户在检索时往往希望获得与其所输入的输入序列相对应的成套图像,以减少其检索耗时。
因此,如何根据由网络中获得的多个图像来生成图集,以提供给用户,已成为本领域技术人员需要解决的问题。
发明内容
本发明的目的是提供一种用于根据来自网络的图像来确定图集的方法、装置和设备。
根据本发明的一个方面,提供一种用于根据来自网络的图像来确定图集的方法,其中,该方法包括如下步骤:
a获取多个图像中每个图像对应的网络特征信息;
b根据所述每个图像对应的网络特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集。
根据本发明的另一个方面,还提供了一种用于根据来自网络的图像来确定图集的图集确定装置,其中,该图集确定装置包括:
第一获取装置、用于获取多个图像中每个图像对应的网络特征信息;
聚类装置、用于根据所述每个图像对应的网络特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集。
与现有技术相比,本发明具有以下优点:1)能够根据图像的网络特征信息来将来自网络的多个图像进行聚类,以根据聚类结果生成包含相似图像的图集;2)通过综合图像的网络特征信息与基本特征信息,将来自网络中的多个图像进行聚类,进一步提高了同一图集中各个图像间的相似度,确保了图集质量;3)能够将聚类处理所得的图集作为整体提供给进行图像检索的用户,提高了用户的图像检索效率,并且由于图集中的图像质量较为均匀,使用户能够获得更好的体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一个方面的计算机实现的用于根据来自网络的图像来确定图集的方法流程图;
图2为本发明一个优选实施例的用于根据来自网络的图像来确定图集的方法流程图;
图3为本发明另一个优选实施例的用于根据来自网络的图像来确定图集的方法流程图;
图4为本发明再一个优选实施例的用于根据来自网络的图像来确定图集的方法流程图;
图5为本发明一个方面的用于根据来自网络的图像来确定图集的图集确定装置的结构示意图;
图6为本发明一个优选实施例的用于根据来自网络的图像来确定图集的图集确定装置的结构示意图;
图7为本发明另一个优选实施例的用于根据来自网络的图像来确定图集的图集确定装置的结构示意图;
图8为本发明再一个优选实施例的用于根据来自网络的图像来确定图集的图集确定装置的结构示意图;
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示意出了本发明一个方面的计算机实现的用于根据来自网络的图像来确定图集的方法流程图。其中,根据本发明的方法可通过计算机设备中的操作系统或处理控制器来完成,为简明起见,以下将所述操作系统或处理控制器统称为图集确定装置。其中,该计算机设备包括但不限于:1)用户设备;2)网络设备。所述用户设备包括但不限于计算机、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在步骤S1中,图集确定装置获取多个图像中每个图像对应的网络特征信息。
其中,一个图像的网络特征信息包括与该图像的网络特征相关的各项信息。优选的,所述网络特征信息包括但不限于以下至少一项:1)该网络特征信息所对应的图像所属网页的地址信息;2)该网络特征信息所对应的图像的源地址信息,该源地址信息包括用于获取该图像以将其展现在相应网页上的链接地址信息,例如,对于一个图像“picture”,其所属网页的网页代码中与该图像相关的代码包括“<img src=″http://skin.ebrun.com/style/images/32-weibo.gif″alt=″picture″>”,则该图像“picture”的源地址信息包括“http://skin.ebrun.com/style/images/32-weibo.gif”;3)该网络特征信息所对应的图像所属网页的类型;其中,所述网页的类型包括但不限于根据网页所提供的资源来确定的网页类型,例如,根据网页所提供的资源类型来将网页分为文本网页、图片网页、视频网页、音频网页等类型,又例如,根据网页所提供的资源内容来将网页分为游戏网页、新闻网页、专业网页等;4)该网络特征信息所对应的图像所属网页所在网站的类型;其中,所述网页的类型包括但不限于根据网站的相关信息来确定的网站类型,例如,根据网站的主办者来将网站分为企业网站、政府网站、个人网站等类型,又例如,根据网站提供的信息类型来将网站分为资讯网站、品牌网站、交易网站、社区网站、政府信息网站、游戏网站等类型;5)该网络特征信息所对应的图像的锚文本信息。
具体地,所述图集确定装置获取多个图像中每个图像对应的网络特征信息的方式包括但不限于:
1)图集确定装置获取预存储的网络特征信息;
2)图集确定装置实时获取网络中多个图像的网络特征信息;其中,所述实时获取网络中多个图像的网络特征信息的方式包括但不限于:
a)图集确定装置由一个或多个网页中获取所述多个图像的网络特征信息;例如,图集确定装置爬取多个网页,获取所述多个网页中的多个图像,并根据所获得的各个图像在其所属网页中的信息以及各个图像所属的网页及网站类型,确定所述各个图像的网络特征信息。
b)图集确定装置获取检索关键词,并根据所述检索关键词进行图像检索,以获取检索到的多个图像的网络特征信息。例如,图集确定装置获取预存储的检索关键词,并根据所述检索关键词进行图像检索,获得多个图像以及各个图像所属网页的网页地址信息;接着,图集确定装置根据所述网页地址信息获取相应的网页,并根据各个图像在其所属网页中的信息以及各个图像所属的网页及网站类型来确定所述各个图像的网络特征信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取多个图像中每个图像对应的网络特征信息的实现方式,均应包含在本发明的范围内。
在步骤S2中,图集确定装置根据所述每个图像对应的网络特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集。
其中,所述图像聚类结果包括图集确定装置对所述多个图像进行聚类处理后所获得的一组或多组聚类后的图像,其中,每组聚类后的图像包括一个或多个图像。
其中,图集确定装置根据所述网络特征信息中的一项或多项来确定所述图像聚类结果。例如,图集确定装置将所述网页类型相同的图像聚为一类,以获得一组或多组聚类后的图像;或者,图集确定装置将所属网页的地址信息相同的图像聚为一类,以获得一组或多组聚类后的图像;或者,图集确定装置将所对应的锚文本信息间包含相同关键词且所属网页所在的网站类型相同的图像聚为一类,以获得一组或多组聚类后的图像等。
具体地,图集确定装置对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新所述图集的方式包括但不限于:
1)图集确定装置对所述多个图像中的所有图像进行聚类处理,以获得所有图像的图像聚类结果,并根据该所有图像的图像聚类结果建立或更新图集。
例如,在步骤S1中,图集确定装置获得A、B、C、D、E、F六个图像的网络特征信息如下所示:
图像:图像源地址信息;所属网页类型;所属网页所在的
网站类型;
A:http://www.a.com;新闻; 交易网站;
B:http://www.b.com;图片; 交易网站;
C:http://www.a.com;图片; 资讯网站;
D:http://www.b.com;新闻; 交易网站;
E:http://www.c.com;黄页; 交易网站;
F:http://www.a.com;新闻; 资讯网站;
图集确定装置先根据去除所属网页类型为黄页的图像的预定过滤条件,去除图像E;接着,图集确定装置根据上述网络特征信息确定图像A、C、F三者的源地址信息相同,且图像A与图像F所属网页所在的网站类型相同,图像A与图像C所属网页所在的网站类型不同,则图集确定装置确定图像A与图像F聚为一类,图像C独自为一类;并且,图集确定装置判定图像B与图像D的源地址信息相同,且图像B和图像D所属网页所在的网站类型相同,则图集确定装置确定图像B与图像D聚为一类。则图集确定装置所获得的所述所有图像的图像聚类结果包括三组图像:图像A与图像F、图像C以及图像B与图像D。接着,图集确定装置根据所述所有图像的图像聚类结果建立分别包含图像A与图像F的图集,包含图像C的图集以及包含图像B和图像D的图集。
2)图集确定装置在对所述多个图像进行聚类处理的过程中,每进行一次聚类处理,即根据所获得的图像聚类结果来建立或更新图集,直至所述聚类处理完毕。
例如,图集确定装置对在步骤S1中所获得的A、B、C、D、E、F六个图像的锚文本信息进行处理,以获得各锚文本信息的锚文本关键词如下所示:
图像:锚文本关键词;
A:汽车;
B:最新,型号,经济;
C:经济,型号,展示;
D:显示,模特;
E:汽车;
F:概念,型号;
图集确定装置将所获得的上述图像随机划分为A和E,B和C,D和F三组;则对于图像A和E,图像确定装置对图像A和E的锚文本关键词进行分析,确定图像A对应的锚文本关键词“汽车”与图像E对应的锚文本关键词“汽车”间包含相同的关键词“汽车”,则图像确定装置获得图像A和E聚为一类的聚类结果,并建立包含该两者的图集,且将两者所包含的相同关键词作为该图集的关键词集合;并且,对于图像B和C,D和F,图像确定装置采用相同的方式,获得图像B和C聚为一类且图像D和图像F各自聚为一类的聚类结果,并分别建立包含图像B和C、包含图像D以及包含图像F的图集,且确定包含图像B和C的图集、包含图像D的图集以及包含图像F的图集的关键词集合分别包含“型号,经济”、“显示,模特”和“概念,型号”。则图像确定装置所获得的图集和各图集的关键词集合如下所示:
图集:关键词集合;
A,E:汽车;
B,C:型号,经济;
D:显示,模特
F:概念,型号;
接着,图集确定装置将所获得的上述图集再次随机划分为两组,一组包括包含图像A、E的图集和包含图像D的图集,另一组包括包含图像B、C的图集和包含图像F的图集;图像确定装置对前一组中两个图集的关键词集合进行分析,确定包含图像A、E的图集对应的关键词集合“汽车”与包含图像D的图集对应的关键词集合“显示,模特”间未包含相同的关键词,则图像确定装置获得前一组中两个图集各自为一类的聚类结果;接着,图像确定装置对后一组中两个图集的关键词集合进行分析,确定包含图像B、C的图集所对应的关键词集合“型号,经济”与包含图像F的图集所对应的关键词集合“概念,型号”间包含相同的关键词“型号”,则图像确定装置获得后一组中两个图集聚为一类的聚类结果,则合并后一组中的两个图集以获得包含图像B、C和F的图集,并确定合并后的图集对应的关键词集合包含“型号”。则图像确定装置所获得的图集和各图集的关键词集合如下所示:
图集:关键词集合;
A,E:汽车;
B,C,F:车型;
D:展示,模特;
接着,图集确定装置将所获得的上述三个图集划分为一组,并判定该组的三个图集所对应的关键词集合间未包含相同的关键词,则图像确定装置获得所述三个图集各自为一类的聚合结果,并判断聚类处理结束。
其中,图集确定装置将包含于同一图集的图像存储至与该图集对应的存储区域中,以确定图像所属的图集;或者,图集确定装置建立一个图像与其所属图集的图集标识信息间的对应关系,以确定图像所属的图集。其中,所述图集标识信息用于唯一地确定一个图集,且所述图集标识信息的确定方式包括但不限于:1)随机确定一个尚未用于标识其他图集的标识信息来作为该图集的图集标识信息;2)根据该图集中各个图像的网络特征信息,建立或更新该图集的图集相关信息,该方式将在后续实施例中予以详述,在此不再赘述。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述每个图像对应的网络特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的第一图像聚类结果来建立或更新图集的实现方式,均应包含在本发明的范围内。
作为本发明的优选实施例之一,根据本发明的方法还包括步骤S4(图未示)。
在步骤S4中,图集确定装置根据所述建立或更新的图集中各个图像的网络特征信息,建立或更新所述图集的图集相关信息。
其中,所述图集相关信息包括以下至少一项:
1)根据该图集所包含的所有图像的网络特征信息来获得的该图集的网络特征信息;
2)根据该图集所包含的所有图像的网络特征信息来获得的该图集的图集标识信息。
优选地,图集相关信息还包括该图集中图片的数量、存储位置等信息。
具体地,所述根据所述建立或更新的图集中各个图像的网络特征信息,建立或更新所述图集的图集相关信息的方式包括但不限于:
1)图集确定装置获取所述建立或更新的图集中各个图像的网络特征信息,并将所述网络特征信息直接作为所述图集的图集相关信息;
例如,图集中各个图像的网络特征信息包括该各个图像的源地址信息,则图集确定装置获取图集中各个图像的源地址信息并将该等源地址信息作为该图集的图集相关信息。
2)图集确定装置对所述建立或更新的图集中各个图像的网络特征信息进行处理,以将处理所得的信息作为所述图集的图集相关信息;
例如,图集中各个图像的网络特征信息包括该各个图像的锚文本信息,则图集确定装置获取包含于各个图像的所有锚文本信息中的关键词“汽车”,以将“汽车”作为该图集的图集相关信息。
又例如,图集中各个图像的网络特征信息包括该各个图像所属网页的地址信息及类型,则图集确定装置获取各个网页地址信息中相同的部分来作为该图集的网页地址信息,并获取数量最多的网页类型作为该图集的网页类型,以将所获得的该图集的网页地址信息及网页类型作为该图集的图集相关信息。
3)图集确定装置获取所述图集中各个图像的网络特征信息,并通过数字签名技术对所述网络特征信息进行处理,以建立或更新能够用于标识该图集的图集标识信息;
例如,图集确定装置将一个图集中所包含的所有图像的源地址信息作为参数进行哈希运算以获得一个数字签名,并将该数字签名作为该图集的图集标识信息等。
优选的,图像确定装置根据所述建立或更新的图集中各个图像的网络特征信息,结合所述图集中所包含的图像的数量,来建立或更新所述图集的图集相关信息。
例如,一个图集中的各个图像包含相同的源地址信息,则图像确定装置将所述源地址信息及该图集中所包含图像的数量作为该图集的图集相关信息;或者,对于该图集,图集确定装置将所述源地址信息及图集中所包含图像的数量作为参数进行哈希运算来获得数字签名,并将该数字签名作为该图集的图集相关信息等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述建立或更新的图集中各个图像的网络特征信息,建立或更新所述图集的图集相关信息的实现方式,均应包含在本发明的范围内。
根据本发明的技术方案,能够根据图像的网络特征信息来将来自网络的多个图像进行聚类,以根据聚类结果生成包含相似图像的图集。
图2为本发明一个优选实施例的用于根据来自网络的图像来确定图集的方法流程图。根据本实施例的方法包括步骤S1、步骤S3和步骤S2,其中,所述步骤S2进一步包括步骤S201。
步骤S1已在参照图1所示实施例中予以详述,并以引用的方式包含于此,不再赘述。
在步骤S3中,图集确定装置获取所述多个图像的基本特征信息。
其中,一个图像的基本特征信息包括用于描述该图像性质内容的各项基本信息;优选的,所述基本特征信息包括但不限于:1)该基本特征信息所对应图像的图像特征信息;其中,所述图像特征信息表示图像固有的属性信息,优选地,所述图像特征信息包括但不限于:a)图像的尺寸;b)图像的像素;c)图像的格式;d)图像在不同色彩模式下的各类属性等,例如在HSL模式下,图像的属性包括色相、饱和度、明度,在RGB模式下,图像的属性包括红色、黄色、绿色等;2)该基本特征信息所对应图像的描述信息,所述描述信息包括与该图像对应的文本信息,例如图像标题、图像内容介绍等。
具体地,图集确定装置获取所述多个图像的基本特征信息的方式包括但不限于:1)图集确定装置获取预存储的基本特征信息;2)图集确定装置实时获取网络中多个图像的基本特征信息。例如,图集确定装置爬取网络中的多个网页并获取所述多个网页中的多个图像及该多个图像对应的描述信息,并对所爬取的图像进行分析以获得其图像特征信息,以将所获得的图像特征信息及描述信息作为该多个图像的基本特征信息。
需要说明的是,本实施例中,所述步骤S1与步骤S3并无先后顺序,资源分配装置可以先执行步骤S1再执行步骤S3,或者先执行步骤S3再执行步骤S1,或者并行执行步骤S1和步骤S3。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取所述多个图像的基本特征信息的实现方式,均应包含在本发明的范围内。
在步骤S201中,图集确定装置根据所述网络特征信息及基本特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集。
其中,图集确定装置根据所述网络特征信息及基本特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集的方式,与前述步骤S2中根据所述网络特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集的方式相似,两者的区别仅在于增加了基本特征信息作为聚类处理的参考因素之一。以下仅说明结合基本特征信息及网络特征信息来获得聚类结果的实现方式,不再对与步骤S2相似的聚类处理过程,例如:1)图集确定装置对所述多个图像中的所有图像进行聚类处理,以根据所述聚类处理所获得的所有图像的图像聚类结果,来建立或更新图集;2)图集确定装置在对所述多个图像进行聚类处理的过程中,每进行一次聚类处理,即根据所获得的图像聚类结果来建立或更新图集,直至所述聚类处理完毕等,予以赘述。
具体地,图集确定装置根据所述网络特征信息中的一项或多项以及所述基本特征信息中的一项或多项来确定所述图像聚类结果。
例如,图集确定装置在步骤S1中获得的A、B、C、D、E、F六个图像所属网页的地址信息以及在步骤S3中获得的该六个图像的基本特征信息如下所示:
图像:格式;所属网页的地址信息;
A:Gif; http://www.m.com;
B:Bmp; http://www.m.com;
C:Jpg; http://www.n.com;
D:Bmp; http://www.m.com;
E:Jpg; http://www.p.com;
F:Jpg; http://www.n.com;
则图集确定装置先分析该六个图像所属网页的地址信息,将所属网页的地址信息相同的图像聚为一类,获得如下三组图像:图像A、B和D;图像C和F;图像E。接着,对于图像A、B和D,图集确定装置根据上述基本特征信息确定图像B和图像D的格式相同,图像A和图像B的格式不同,则图集确定装置确定图像B和图像D聚为一类,图像A独自为一类;并且,图集确定装置采用相同的方式确定图像C和图像F聚为一类,图像E独自为一类。则图集确定装置获得的图像聚类结果包括四组图像:图像B与图像D、图像C以及图像F、图像A、图像E。接着,图集确定装置根据所述图像聚类结果建立分别包含图像B与图像D的图集,包含图像C和图像F的图集、包含图像A的图集以及图像E的图集。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述网络特征信息及基本特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集的实现方式,例如,图集确定装置将所属网页的类型相同,饱和度达到预定饱和度阈值,并且像素差值在10万像素以内的图像聚为一类;或者,图集确定装置将图像格式相同,并且图像的源地址信息相同的图像聚为一类;或者,图集确定装置将锚文本信息中包含相同的关键词,并且描述信息的相似度达到预定阈值的图像聚为一类;或者,图集确定装置先滤除小于预定尺寸的图像,在进行聚类处理等,均应包含在本发明的范围内。
根据本实施例的方法,通过综合图像的网络特征信息与基本特征信息,将来自网络中的多个图像进行聚类,进一步提高了同一图集中各个图像间的相似度,确保了图集质量。
图3为本发明另一个优选实施例的用于根据来自网络的图像来确定图集的方法流程图。根据本实施例的方法还包括步骤S 1、步骤S2、步骤S4、步骤S5及步骤S6。
其中步骤S1、步骤S2及步骤S4已在参照图1所示实施例中予以详述,并以引用的方式包含于此,不再赘述。
在步骤S5中,图集确定装置获取多个图集中每个图集对应的图集相关信息。
具体地,在步骤S5之前,图集确定装置多次重复执行步骤S1、S2及S4以获得多个图集及其对应的图集相关信息;或者,在步骤S5之前,图集确定装置控制多个子装置并行执行所述步骤S1、S2及S4,以获得多个图集,并获取所述多个图集对应的图集相关信息。则在本步骤中,图集确定装置获取多个经由步骤S1、S2及S4建立的图集,并获取该等图集的图集相关信息。
接着,在步骤S6中,图集确定装置根据所述多个图集对应的图集相关信息,对该多个图集进行合并,以获得合并后的一个或多个图集。
具体地,图集确定装置对所述多个图集的图集相关信息进行分析,以执行合并操作,并获得合并后的一个或多个图集。
例如,对于多个将数字签名作为图集相关信息的图集,图集确定装置对所述多个数字签名进行比较,合并具有相同数字签名的图集。
又例如,对于多个以“源地址信息,图像数量”作为图集相关信息的图集,图集确定装置对所有“源地址信息”相同或相似的图集进行合并。
又例如,对于多个以图集中所包含的所有图像的源地址信息作为图集相关信息的图集,图集确定装置对所述多个图集的图集相关信息进行分析,若两个图集各自对应的图集相关信息中所包含的相同或相似的源地址信息的达到一定数量阈值,则合并这两个图集。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述多个图集对应的图集相关信息,对该多个图集进行合并,以获得合并后的一个或多个图集的实现方式,均应包含在本发明的范围内。
作为本实施例的优选方案之一,根据本实施例的方法还包括步骤S7(图未示)。其中,前述步骤S6进一步包括步骤S601(图未示)。
在步骤S7中,图集确定装置获取所述多个图集中每个图集对应的其他合并相关信息。
其中,所述其他合并相关信息包括以下至少一项:
1)所述多个图集中每个图集所包含的部分或全部图像的网络特征信息;
2)所述多个图集中每个图集对应的权重信息。
其中,图集确定装置获取所述多个图集中每个图集所包含的部分或全部图像的网络特征信息的方式包括:a)图集确定装置根据各个图集对应的存储区域,以获得所述存储区域中的部分或全部图像的网络特征信息;b)图集确定装置获取各个图集的图集相关信息,并获取与各个图集相关信息对应的部分或全部图像的网络特征信息。
图集确定装置获取所述多个图集中每个图集对应的权重信息的方式包括但不限于:
a)获取其他设备提供的所述多个图集的权重信息;
b)实时获取所述多个图集的权重信息;
具体地,图集确定装置获取所述建立或更新的图集中所有图像的网络特征信息及基本特征信息,并根据所获取的网络特征信息及基本特征信息,建立或更新该图集的权重信息。
例如,对于包括图像B、C、F的图集,则图集确定装置所获取的该图集中三个图像的网络特征信息及基本特征信息如下所示:
图像:像素;格式;锚文本信息;
B:225,000;Bmp; 最新型号经济;
C:180,000;Jpg; 经济型号展示;
F:240,000;Jpg; 概念型号;
预设当图集中所有图像的格式相同时,图集的格式权重为1,当包含不同格式的图像时,图集的格式权重为0.5;图集中每包含一个像素大于等于20万的图像,则图集的像素权重增加1,每包含一个小于20万像素的图像,则图集像素权重增加0.5;图集中所有图像的锚文本信息中包含n个相同的关键词,则图集的关键词权重即为n;并且图集的权重信息=图集格式权重*(图集像素权重+图集的关键词权重)。
则图集确定装置获得所述图集的图集格式权重为0.5,该图集所包含的图像中,图像B和F大于20万像素,图像C小于20万像素,则该图集的图集像素权重=1+1+0.5=2.5,并且图集确定装置确定该图集中所有图像的锚文本信息中的关键词仅包含一个相同关键词“车型”,该图集的关键词权重为1,则图集确定装置获得该图集的权重信息=0.5*(2.5+1)=1.75。
c)获取预存的多个图集的权重信息。其中,所述预存的权重信息包括但不限于通过前述a)或b)中所述方式获得。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取所述多个图集的权重信息的实现方式,例如,根据图集中所有图像的描述信息中所包含的关键词或词性对应的预定值来获得图集的权重信息等,均应包含在本发明的范围内。
接着,在步骤S601中,图集确定装置根据所述多个图集中每个图集对应的图集相关信息及其他合并相关信息,对该多个图集进行合并,以获得合并后的一个或多个图集。
具体地,图集确定装置根据所述多个图集中每个图集对应的图集相关信息及其他合并相关信息来获得一个或多个图集的方式包括但不限于:
1)图集确定装置根据多个图集中每个图集对应的图集相关信息及其所包含的部分或全部图像的网络特征信息,来对不同图集的图像进行聚类处理,并根据所述聚类处理的图像聚类结果来合并图集,以获得合并后的一个或多个图集。
具体地,图集确定装置根据图集相关信息及图像的网络特征信息,来获得合并后的一个或多个图集的方式包括但不限于:
a)图集确定装置将所有图集中的所有图像划分为多组,对于每组图像,图形确定装置根据图集相关信息来判断该组图像中的多个图像是否包含于不同图集,当判断包含于不同图集时,根据该多个图像的网络特征信息进行聚类处理,以获得图像聚类结果,并根据所获得的图像聚类结果,将聚为一类的图像所对应的图集进行合并,以获得合并后的一个或多个图集;
例如,图集确定装置在步骤S7中获得包含于四个图集的部分图像及每个图集中所有图像共有的源地址信息如下所示:
图集:源地址信息;
K1,K2,K3:http://www.a.com;
L1,L2:http://www.a.com;
M:http://www.c.com;
N:http://www.c.com;
则图集确定装置将上述图像随机划分为三组:图像K1和L2,图像K2和K3,图像L1、M和N;对于图像K1和L2,图集确定装置根据两者对应的图像标识信息判断图像K1与图像L2包含于不同的图集中,并确定所述图像K1和L1的源地址信息相同,则图集确定装置确定图像K1和L2聚为一类;并且,图集确定装置根据K2及K3的图像标识信息判断图像K2和K3包含于相同的图集中,则不对图像K2和K3进行聚类处理;对于图像L1、M和N,图集确定装置根据三者对应的图像标识信息判断三者均包含于不同的图集中,并确定所述图像L1和M的源地址信息不同,图像M和N的源地址信息相同,则图集确定装置确定图像M和N聚为一类,图像L1为一类;则图集确定装置获得的图像聚类结果包括三组图像:图像K1和L2,图像M和N,以及图像L1。
接着,图集确定装置根据所述图像聚类结果,将包含图像K1的图集和包含图像L2的图集进行合并,将包含图像M的图集和包含图像N的图集进行合并,获得合并后的图集如下:
图集:源地址信息;
K1,K2,K3,L1,L2:http://www.a.com;
M,N:http://www.c.com。
其中,图集确定装置根据多个图集中每个图集所包含的部分或全部图像的网络特征信息,来对不同图集的图像进行聚类处理,并根据所述聚类处理的图像聚类结果来合并图集的方式与步骤S2中所述根据所述每个图像对应的网络特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集的方式,在此不再赘述。
b)图集确定装置根据各个图集的图集相关信息,来确定各个图集包括的图像,以由各个图集中分别选择一个图像,并根据所选择的图像所属图集的图集相关信息及所选择的图像的网络特征信息来对所选择的图像进行聚类,以将聚为一类的图像对应的图集进行合并,并获得合并后的一个或多个图集。
其中,图集确定装置根据多个图集中每个图集所包含的部分或全部图像的网络特征信息,来对属于不同图集的图像进行聚类处理,并根据所述聚类处理的图像聚类结果来合并图集的方式与步骤S2中所述根据所述每个图像对应的网络特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集的方式,在此不再赘述。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据各个图集所包含的部分或全部图像的网络特征信息,来对不同图集的图像进行聚类处理,并根据所述聚类处理的图像聚类结果来合并图集的实现方式,均应包含在本发明的范围内。
2)图集确定装置根据所述多个图集对应的图集相关信息及权重信息,对该多个图集进行合并,以获得合并后的一个或多个图集。
具体地,图集确定装置根据图集相关信息来确定图集,并将权重信息差值小于预定阈值的图集进行合并,以获得合并后的一个或多个图集。
例如,图集确定装置通过步骤S5所获得的a、β、γ三个图集的网页地址信息以及图集确定装置根据步骤S7所获得的所述三个图集的权重信息分别如下所示;
图集:图集的权重信息;
a:22;
β:24;
γ:15;
预定将权重信息差值小于5的图集进行合并。则图集确定装置根据所述图集相关信息来识别图集,并确定图集a与β间权重信息的差值小于5,则图集确定装置合并图集a与β;并且,图集确定装置采用相同的方式,确定图集a与γ不可合并,图集β与γ不可合并。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述多个图集对应的图集相关信息及权重信息,对该多个图集进行合并,以获得合并后的图集的实现方式,均应包含在本发明的范围内。
3)图集确定装置根据多个图集中每个图集对应的图集相关信息、其所包含的部分或全部图像的网络特征信息及其对应的权重信息,对该多个图集进行合并,以获得合并后的一个或多个图集。
具体地,图集确定装置根据图集相关信息来确定图集,并将图像的网络特征信息及权重信息均符合预定合并条件的图集进行合并,以获得合并后的一个或多个图集。
例如,图集确定装置通过步骤S5所获得的a、β、γ三个图集的网页地址信息以及图集确定装置根据步骤S7所获得的所述三个图集的权重信息分别如下所示;
图集:图集的网页地址信息;图集的权重信息;
a:http://www.a.com;22;
β:http://www.a.com;24;
γ:http://www.a.com;15;
预定合并条件包括“网页地址相同,并且权重信息差值小于5”。则图集确定装置根据所述图集相关信息及权重信息,确定图集a与β间权重信息的差值小于5,并且图集a和β的网页地址信息相同,则图集确定装置合并图集a与β;并且,图集确定装置采用相同的方式,确定图集a与γ不可合并,图集β与γ不可合并。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据、其所包含的部分或全部图像的网络特征信息及其对应的权重信息,对该多个图集进行合并,以获得合并后的图集的实现方式,均应包含在本发明的范围内。
根据本实施例的方法,能够解决相似图集的合并问题。优选地,根据本实施例的方法,还能够根据其他合并相关信息,确保了所合并图集间各个图像的相似度接近,且图像质量接近,以进一步提高合并所得的图集中图像的相似度,并防止优质图像与劣质图像合并在同一图集中。
图4为本发明再一个优选实施例的用于根据来自网络的图像来确定图集的方法流程图。根据本实施例的方法包括步骤S1、步骤S2、步骤S8、步骤S9、步骤S10和步骤S11。
步骤S1及步骤S2已在参照图1所示实施例中予以详述,并以引用的方式包含于此,不再赘述。
在步骤S8中,图集确定装置获取来自用户的输入序列。
在步骤S9中,图集确定装置根据所述输入序列来进行检索,以获得一个或多个图像。
在步骤S10中,图集确定装置分别获取该一个或多个图像所属图集的图集相关信息。
其中,获取图集的图集相关信息的方式包括但不限于:1)获取预存的图像所属图集的图集相关信息;2)采用如前述步骤S5中所述方式实时获取该图像所属图集的图集相关信息等。
在步骤S11中,图集确定装置根据所获取的图集相关信息,生成相应的展示信息,以提供给所述用户。
其中,所述展示信息包括但不限于以下任一项:
1)所述图集相关信息所对应图集中的部分图像;
例如,图集确定装置由图集中任意选择一个图像来作为该图集的封面图像,以生成展现信息;又例如,图集确定装置根据图集中各个图像的基本特征信息来确定各个图像的权重,并选择权重最高的图像来作为封面图像,以生成展现信息;又例如,图集确定装置由图集中随机选择预定展现数量的多个图像,以生成展现信息等;
2)所述图集相关信息所对应图集中的所有图像。
根据本实施例的方法,能够将聚类处理所得的图集作为整体提供给进行图像检索的用户,提高了用户的图像检索效率,并且由于图集中的图像质量较为均匀,使用户能够获得更好的体验。
图5示意出了本发明另一个方面的用于根据来自网络的图像来确定图集的图集确定装置的结构示意图。根据本实施例的图集确定装置包括第一获取装置1和聚类装置2。
第一获取装置1获取多个图像中每个图像对应的网络特征信息。
其中,一个图像的网络特征信息包括与该图像的网络特征相关的各项信息。优选的,所述网络特征信息包括但不限于以下至少一项:1)该网络特征信息所对应的图像所属网页的地址信息;2)该网络特征信息所对应的图像的源地址信息,该源地址信息包括用于获取该图像以将其展现在相应网页上的链接地址信息,例如,对于一个图像“picture”,其所属网页的网页代码中与该图像相关的代码包括“<img src=″http://skin.ebrun.com/style/images/32-weibo.gif″alt=″picture″>”,则该图像“picture”的源地址信息包括“http://skin.ebrun.com/style/images/32-weibo.gif’;3)该网络特征信息所对应的图像所属网页的类型;其中,所述网页的类型包括但不限于根据网页所提供的资源来确定的网页类型,例如,根据网页所提供的资源类型来将网页分为文本网页、图片网页、视频网页、音频网页等类型,又例如,根据网页所提供的资源内容来将网页分为游戏网页、新闻网页、专业网页等;4)该网络特征信息所对应的图像所属网页所在网站的类型;其中,所述网页的类型包括但不限于根据网站的相关信息来确定的网站类型,例如,根据网站的主办者来将网站分为企业网站、政府网站、个人网站等类型,又例如,根据网站提供的信息类型来将网站分为资讯网站、品牌网站、交易网站、社区网站、政府信息网站、游戏网站等类型;5)该网络特征信息所对应的图像的锚文本信息。
具体地,所述第一获取装置1获取多个图像中每个图像对应的网络特征信息的方式包括但不限于:
1)第一获取装置1获取预存储的网络特征信息;
2)第一获取装置1实时获取网络中多个图像的网络特征信息;其中,所述实时获取网络中多个图像的网络特征信息的方式包括但不限于:
a)第一获取装置1由一个或多个网页中获取所述多个图像的网络特征信息;例如,第一获取装置1爬取多个网页,获取所述多个网页中的多个图像,并根据所获得的各个图像在其所属网页中的信息以及各个图像所属的网页及网站类型,确定所述各个图像的网络特征信息。
b)第一获取装置1获取检索关键词,并根据所述检索关键词进行图像检索,以获取检索到的多个图像的网络特征信息。例如,第一获取装置1获取预存储的检索关键词,并根据所述检索关键词进行图像检索,获得多个图像以及各个图像所属网页的网页地址信息;接着,第一获取装置1根据所述网页地址信息获取相应的网页,并根据各个图像在其所属网页中的信息以及各个图像所属的网页及网站类型来确定所述各个图像的网络特征信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取多个图像中每个图像对应的网络特征信息的实现方式,均应包含在本发明的范围内。
聚类装置2根据所述每个图像对应的网络特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集。
其中,所述图像聚类结果包括图集确定装置对所述多个图像进行聚类处理后所获得的一组或多组聚类后的图像,其中,每组聚类后的图像包括一个或多个图像。
其中,聚类装置2根据所述网络特征信息中的一项或多项来确定所述图像聚类结果。例如,聚类装置2将所述网页类型相同的图像聚为一类,以获得一组或多组聚类后的图像;或者,聚类装置2将所属网页的地址信息相同的图像聚为一类,以获得一组或多组聚类后的图像;或者,聚类装置2将所对应的锚文本信息间包含相同关键词且所属网页所在的网站类型相同的图像聚为一类,以获得一组或多组聚类后的图像等。
具体地,聚类装置2对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新所述图集的方式包括但不限于:
1)聚类装置2对所述多个图像中的所有图像进行聚类处理,以获得所有图像的图像聚类结果,并根据该所有图像的图像聚类结果建立或更新图集。
例如,第一获取装置1获得A、B、C、D、E、F六个图像的网络特征信息如下所示:
图像:图像源地址信息;所属网页类型;所属网页所在的
网站类型;
A:http://www.a.com;新闻; 交易网站;
B:http://www.b.com;图片; 交易网站;
C:http://www.a.com;图片; 资讯网站;
D:http://www.b.com;新闻; 交易网站;
E:http://www.c.com;黄页; 交易网站;
F:http://www.a.com;新闻;资讯网站;
聚类装置2先根据去除所属网页类型为黄页的图像的预定过滤条件,去除图像E;接着,聚类装置2根据上述网络特征信息确定图像A、C、F三者的源地址信息相同,且图像A与图像F所属网页所在的网站类型相同,图像A与图像C所属网页所在的网站类型不同,则聚类装置2确定图像A与图像F聚为一类,图像C独自为一类;并且,聚类装置2判定图像B与图像D的源地址信息相同,且图像B和图像D所属网页所在的网站类型相同,则聚类装置2确定图像B与图像D聚为一类。则聚类装置2所获得的所述所有图像的图像聚类结果包括三组图像:图像A与图像F、图像C以及图像B与图像D。接着,聚类装置2根据所述所有图像的图像聚类结果建立分别包含图像A与图像F的图集,包含图像C的图集以及包含图像B和图像D的图集。
2)聚类装置2在对所述多个图像进行聚类处理的过程中,每进行一次聚类处理,即根据所获得的图像聚类结果来建立或更新图集,直至所述聚类处理完毕。
例如,第一获取装置1所获得的A、B、C、D、E、F六个图像的锚文本信息进行处理,以获得各锚文本信息的锚文本关键词如下所示:
图像:锚文本关键词;
A:汽车;
B:最新,型号,经济;
C:经济,型号,展示;
D:显示,模特;
E:汽车;
F:概念,型号;
聚类装置2将所获得的上述图像随机划分为A和E,B和C,D和F三组;则对于图像A和E,聚类装置2对图像A和E的锚文本关键词进行分析,确定图像A对应的锚文本关键词“汽车”与图像E对应的锚文本关键词“汽车”间包含相同的关键词“汽车”,则聚类装置2获得图像A和E聚为一类的聚类结果,并建立包含该两者的图集,且将两者所包含的相同关键词作为该图集的关键词集合;并且,对于图像B和C,D和F,图像确定装置采用相同的方式,获得图像B和C聚为一类且图像D和图像F各自聚为一类的聚类结果,并分别建立包含图像B和C、包含图像D以及包含图像F的图集,且确定包含图像B和C的图集、包含图像D的图集以及包含图像F的图集的关键词集合分别包含“型号,经济”、“显示,模特”和“概念,型号”。则聚类装置2所获得的图集和各图集的关键词集合如下所示:
图集:关键词集合;
A,E:汽车;
B,C:型号,经济;
D:显示,模特
F:概念,型号;
接着,聚类装置2将所获得的上述图集再次随机划分为两组,一组包括包含图像A、E的图集和包含图像D的图集,另一组包括包含图像B、C的图集和包含图像F的图集;聚类装置2对前一组中两个图集的关键词集合进行分析,确定包含图像A、E的图集对应的关键词集合“汽车”与包含图像D的图集对应的关键词集合“显示,模特”间未包含相同的关键词,则聚类装置2获得前一组中两个图集各自为一类的聚类结果;接着,聚类装置2对后一组中两个图集的关键词集合进行分析,确定包含图像B、C的图集所对应的关键词集合“型号,经济”与包含图像F的图集所对应的关键词集合“概念,型号”间包含相同的关键词“型号”,则聚类装置2获得后一组中两个图集聚为一类的聚类结果,则合并后一组中的两个图集以获得包含图像B、C和F的图集,并确定合并后的图集对应的关键词集合包含“型号”。则聚类装置2所获得的图集和各图集的关键词集合如下所示:
图集:关键词集合;
A,E:汽车;
B,C,F:车型;
D: 展示,模特;
接着,聚类装置2将所获得的上述三个图集划分为一组,并判定该组的三个图集所对应的关键词集合间未包含相同的关键词,则聚类装置2获得所述三个图集各自为一类的聚合结果,并判断聚类处理结束。
其中,图集确定装置将包含于同一图集的图像存储至与该图集对应的存储区域中,以确定图像所属的图集;或者,图集确定装置建立一个图像与其所属图集的图集标识信息间的对应关系,以确定图像所属的图集。其中,所述图集标识信息用于唯一地确定一个图集,且所述图集标识信息的确定方式包括但不限于:1)随机确定一个尚未用于标识其他图集的标识信息来作为该图集的图集标识信息;2)根据该图集中各个图像的网络特征信息,建立或更新该图集的图集相关信息,该方式将在后续实施例中予以详述,在此不再赘述。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述每个图像对应的网络特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的第一图像聚类结果来建立或更新图集的实现方式,均应包含在本发明的范围内。
作为本发明的优选实施例之一,根据本发明的图集确定装置还包括第一更新装置(图未示)。
第一更新装置根据所述建立或更新的图集中各个图像的网络特征信息,建立或更新所述图集的图集相关信息。
其中,所述图集相关信息包括以下至少一项:
1)根据该图集所包含的所有图像的网络特征信息来获得的该图集的网络特征信息;
2)根据该图集所包含的所有图像的网络特征信息来获得的该图集的图集标识信息。
优选地,图集相关信息还包括该图集中图片的数量、存储位置等信息。
具体地,所述根据所述建立或更新的图集中各个图像的网络特征信息,建立或更新所述图集的图集相关信息的方式包括但不限于:
1)第一更新装置获取所述建立或更新的图集中各个图像的网络特征信息,并将所述网络特征信息直接作为所述图集的图集相关信息;
例如,图集中各个图像的网络特征信息包括该各个图像的源地址信息,则第一更新装置获取图集中各个图像的源地址信息并将该等源地址信息作为该图集的图集相关信息。
2)第一更新装置对所述建立或更新的图集中各个图像的网络特征信息进行处理,以将处理所得的信息作为所述图集的图集相关信息;
例如,图集中各个图像的网络特征信息包括该各个图像的锚文本信息,则第一更新装置获取包含于各个图像的所有锚文本信息中的关键词“汽车”,以将“汽车”作为该图集的图集相关信息。
又例如,图集中各个图像的网络特征信息包括该各个图像所属网页的地址信息及类型,则第一更新装置获取各个网页地址信息中相同的部分来作为该图集的网页地址信息,并获取数量最多的网页类型作为该图集的网页类型,以将所获得的该图集的网页地址信息及网页类型作为该图集的图集相关信息。
3)第一更新装置获取所述图集中各个图像的网络特征信息,并通过数字签名技术对所述网络特征信息进行处理,以建立或更新能够用于标识该图集的图集标识信息;
例如,第一更新装置将一个图集中所包含的所有图像的源地址信息作为参数进行哈希运算以获得一个数字签名,并将该数字签名作为该图集的图集标识信息等。
优选的,第一更新装置根据所述建立或更新的图集中各个图像的网络特征信息,结合所述图集中所包含的图像的数量,来建立或更新所述图集的图集相关信息。
例如,一个图集中的各个图像包含相同的源地址信息,则第一更新装置将所述源地址信息及该图集中所包含图像的数量作为该图集的图集相关信息;或者,对于该图集,第一更新装置将所述源地址信息及图集中所包含图像的数量作为参数进行哈希运算来获得数字签名,并将该数字签名作为该图集的图集相关信息等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述建立或更新的图集中各个图像的网络特征信息,建立或更新所述图集的图集相关信息的实现方式,均应包含在本发明的范围内。
根据本发明的技术方案,能够根据图像的网络特征信息来将来自网络的多个图像进行聚类,以根据聚类结果生成包含相似图像的图集。
图6为本发明一个优选实施例的用于根据来自网络的图像来确定图集的图集确定装置的结构示意图。根据本实施例的图集确定装置包括第一获取装置1、第二获取装置3和包含于聚类装置2中的子聚类装置201。
第一获取装置1已在参照图5所示实施例中予以详述,并以引用的方式包含于此,不再赘述。
第二获取装置3获取所述多个图像的基本特征信息。
其中,一个图像的基本特征信息包括用于描述该图像性质内容的各项基本信息;优选的,所述基本特征信息包括但不限于:1)该基本特征信息所对应图像的图像特征信息;其中,所述图像特征信息表示图像固有的属性信息,优选地,所述图像特征信息包括但不限于:a)图像的尺寸;b)图像的像素;c)图像的格式;d)图像在不同色彩模式下的各类属性等,例如在HSL模式下,图像的属性包括色相、饱和度、明度,在RGB模式下,图像的属性包括红色、黄色、绿色等;2)该基本特征信息所对应图像的描述信息,所述描述信息包括与该图像对应的文本信息,例如图像标题、图像内容介绍等。
具体地,第二获取装置3获取所述多个图像的基本特征信息的方式包括但不限于:1)第二获取装置3获取预存储的基本特征信息;2)第二获取装置3实时获取网络中多个图像的基本特征信息。例如,第二获取装置3爬取网络中的多个网页并获取所述多个网页中的多个图像及该多个图像对应的描述信息,并对所爬取的图像进行分析以获得其图像特征信息,以将所获得的图像特征信息及描述信息作为该多个图像的基本特征信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取所述多个图像的基本特征信息的实现方式,均应包含在本发明的范围内。
子聚类装置201根据所述网络特征信息及基本特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集。
其中,子聚类装置201根据所述网络特征信息及基本特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集的方式,与前述聚类装置2根据所述网络特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集的方式相似,两者的区别仅在于增加了基本特征信息作为聚类处理的参考因素之一。以下仅说明结合基本特征信息及网络特征信息来获得聚类结果的实现方式,不再对与聚类装置2所执行的相似的聚类处理过程,例如:1)对所述多个图像中的所有图像进行聚类处理,以根据所述聚类处理所获得的所有图像的图像聚类结果,来建立或更新图集;2)在对所述多个图像进行聚类处理的过程中,每进行一次聚类处理,即根据所获得的图像聚类结果来建立或更新图集,直至所述聚类处理完毕等,予以赘述。
具体地,子聚类装置201根据所述网络特征信息中的一项或多项以及所述基本特征信息中的一项或多项来确定所述图像聚类结果。
例如,第一获取装置1获得的A、B、C、D、E、F六个图像所属网页的地址信息以及第二获取装置3获得的该六个图像的基本特征信息如下所示:
图像:格式;所属网页的地址信息;
A:Gif; http://www.m.com;
B:Bmp; http://www.m.com;
C:Jpg; http://www.n.com;
D:Bmp; http://www.m.com;
E:Jpg; http://www.p.com;
F:Jpg; http://www.n.com;
则子聚类装置201先分析该六个图像所属网页的地址信息,将所属网页的地址信息相同的图像聚为一类,获得如下三组图像:图像A、B和D;图像C和F;图像E。接着,对于图像A、B和D,子聚类装置201根据上述基本特征信息确定图像B和图像D的格式相同,图像A和图像B的格式不同,则子聚类装置201确定图像B和图像D聚为一类,图像A独自为一类;并且,子聚类装置201采用相同的方式确定图像C和图像F聚为一类,图像E独自为一类。则子聚类装置201获得的图像聚类结果包括四组图像:图像B与图像D、图像C以及图像F、图像A、图像E。接着,子聚类装置201根据所述图像聚类结果建立分别包含图像B与图像D的图集,包含图像C和图像F的图集、包含图像A的图集以及图像E的图集。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述网络特征信息及基本特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集的实现方式,例如,子聚类装置201将所属网页的类型相同,饱和度达到预定饱和度阈值,并且像素差值在10万像素以内的图像聚为一类;或者,子聚类装置201将图像格式相同,并且图像的源地址信息相同的图像聚为一类;或者,子聚类装置201将锚文本信息中包含相同的关键词,并且描述信息的相似度达到预定阈值的图像聚为一类;或者,子聚类装置201先滤除小于预定尺寸的图像,在进行聚类处理等,均应包含在本发明的范围内。
根据本实施例的图集确定装置,通过综合图像的网络特征信息与基本特征信息,将来自网络中的多个图像进行聚类,进一步提高了同一图集中各个图像间的相似度,确保了图集质量。
图7为本发明另一个优选实施例的用于根据来自网络的图像来确定图集的图集确定装置的结构示意图。根据本实施例的图集确定装置还包括第一获取装置1、聚类装置2、第一更新装置4、第三获取装置5及合并装置6。
其中第一获取装置1、聚类装置2及第一更新装置4已在参照图5所示实施例中予以详述,并以引用的方式包含于此,不再赘述。
第三获取装置5获取多个图集中每个图集对应的图集相关信息。
具体地,在第三获取装置5执行操作之前,第一获取装置1、聚类装置2和第一更新装置4多次重复执行操作以获得多个图集,并获取所述多个图集对应的图集相关信息;或者,在第三获取装置5执行操作之前,图集确定装置控制多个第一获取装置1、聚类装置2和第一更新装置4并行执行操作以获得多个图集,并获取所述多个图集对应的图集相关信息。则第三获取装置5获取多个经由第一获取装置1、聚类装置2和第一更新装置4执行操作建立的图集,并获取该等图集的图集相关信息。
接着,合并装置6根据所述多个图集对应的图集相关信息,对该多个图集进行合并,以获得合并后的一个或多个图集。
具体地,合并装置6对所述多个图集的图集相关信息进行分析,以执行合并操作,并获得合并后的一个或多个图集。
例如,对于多个将数字签名作为图集相关信息的图集,合并装置6对所述多个数字签名进行比较,合并具有相同数字签名的图集。
又例如,对于多个以“源地址信息,图像数量”作为图集相关信息的图集,合并装置6对所有“源地址信息”相同或相似的图集进行合并。
又例如,对于多个以图集中所包含的所有图像的源地址信息作为图集相关信息的图集,合并装置6对所述多个图集的图集相关信息进行分析,若两个图集各自对应的图集相关信息中所包含的相同或相似的源地址信息的达到一定数量阈值,则合并这两个图集。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述多个图集对应的图集相关信息,对该多个图集进行合并,以获得合并后的一个或多个图集的实现方式,均应包含在本发明的范围内。
作为本实施例的优选方案之一,根据本实施例的图集确定装置还包括第四获取装置(图未示)。其中,前述合并装置6进一步包括子合并装置(图未示)。
第四获取装置获取所述多个图集中每个图集对应的其他合并相关信息。
其中,所述其他合并相关信息包括以下至少一项:
1)所述多个图集中每个图集所包含的部分或全部图像的网络特征信息;
2)所述多个图集中每个图集对应的权重信息。
其中,第四获取装置获取所述多个图集中每个图集所包含的部分或全部图像的网络特征信息的方式包括:a)第四获取装置根据各个图集对应的存储区域,以获得所述存储区域中的部分或全部图像的网络特征信息;b)第四获取装置获取各个图集的图集相关信息,并获取与各个图集相关信息对应的部分或全部图像的网络特征信息。
第四获取装置获取所述多个图集中每个图集对应的权重信息的方式包括但不限于:
a)获取其他设备提供的所述多个图集的权重信息;
b)实时获取所述多个图集的权重信息;
具体地,第四获取装置获取所述建立或更新的图集中所有图像的网络特征信息及基本特征信息,并根据所获取的网络特征信息及基本特征信息,建立或更新该图集的权重信息。
例如,对于包括图像B、C、F的图集,则图集确定装置所获取的该图集中三个图像的网络特征信息及基本特征信息如下所示:
图像:像素;格式;锚文本信息;
B:225,000;Bmp; 最新型号经济;
C:180,000;Jpg; 经济型号展示;
F:240,000;Jpg; 概念型号;
预设当图集中所有图像的格式相同时,图集的格式权重为1,当包含不同格式的图像时,图集的格式权重为0.5;图集中每包含一个像素大于等于20万的图像,则图集的像素权重增加1,每包含一个小于20万像素的图像,则图集像素权重增加0.5;图集中所有图像的锚文本信息中包含n个相同的关键词,则图集的关键词权重即为n;并且图集的权重信息=图集格式权重*(图集像素权重+图集的关键词权重)。
则第四获取装置获得所述图集的图集格式权重为0.5,该图集所包含的图像中,图像B和F大于20万像素,图像C小于20万像素,则该图集的图集像素权重=1+1+0.5=2.5,并且图集确定装置确定该图集中所有图像的锚文本信息中的关键词仅包含一个相同关键词“车型”,该图集的关键词权重为1,则第四获取装置获得该图集的权重信息=0.5*(2.5+1)=1.75。
c)获取预存的多个图集的权重信息。其中,所述预存的权重信息包括但不限于通过前述a)或b)中所述方式获得。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取所述多个图集的权重信息的实现方式,例如,根据图集中所有图像的描述信息中所包含的关键词或词性对应的预定值来获得图集的权重信息等,均应包含在本发明的范围内。
接着,子合并装置根据所述多个图集中每个图集对应的图集相关信息及其他合并相关信息,对该多个图集进行合并,以获得合并后的一个或多个图集。
具体地,子合并装置根据所述多个图集中每个图集对应的图集相关信息及其他合并相关信息来获得一个或多个图集的方式包括但不限于:
1)子合并装置根据多个图集中每个图集对应的图集相关信息及其所包含的部分或全部图像的网络特征信息,来对不同图集的图像进行聚类处理,并根据所述聚类处理的图像聚类结果来合并图集,以获得合并后的一个或多个图集。
具体地,子合并装置根据图集相关信息及图像的网络特征信息,来获得合并后的一个或多个图集的方式包括但不限于:
a)子合并装置将所有图集中的所有图像划分为多组,对于每组图像,图形确定装置根据图集相关信息来判断该组图像中的多个图像是否包含于不同图集,当判断包含于不同图集时,根据该多个图像的网络特征信息进行聚类处理,以获得图像聚类结果,并根据所获得的图像聚类结果,将聚为一类的图像所对应的图集进行合并,以获得合并后的一个或多个图集;
例如,第四获取装置获得包含于四个图集的部分图像及每个图集中所有图像共有的源地址信息如下所示:
图集:源地址信息;
K1,K2,K3:http://www.a.com;
L1,L2:http://www.a.com;
M:http://www.c.com;
N:http://www.c.com;
则子合并装置将上述图像随机划分为三组:图像K1和L2,图像K2和K3,图像L1、M和N;对于图像K1和L2,子合并装置根据两者对应的图像标识信息判断图像K1与图像L2包含于不同的图集中,并确定所述图像K1和L1的源地址信息相同,则子合并装置确定图像K1和L2聚为一类;并且,子合并装置根据K2及K3的图像标识信息判断图像K2和K3包含于相同的图集中,则不对图像K2和K3进行聚类处理;对于图像L1、M和N,子合并装置根据三者对应的图像标识信息判断三者均包含于不同的图集中,并确定所述图像L1和M的源地址信息不同,图像M和N的源地址信息相同,则子合并装置确定图像M和N聚为一类,图像L1为一类;则子合并装置获得的图像聚类结果包括三组图像:图像K1和L2,图像M和N,以及图像L1。
接着,子合并装置根据所述图像聚类结果,将包含图像K1的图集和包含图像L2的图集进行合并,将包含图像M的图集和包含图像N的图集进行合并,获得合并后的图集如下:
图集:源地址信息;
K1,K2,K3,L1,L2:http://www.a.com;
M,N:http://www.c.com。
其中,子合并装置根据多个图集中每个图集所包含的部分或全部图像的网络特征信息,来对不同图集的图像进行聚类处理,并根据所述聚类处理的图像聚类结果来合并图集的方式与聚类装置2中所述根据所述每个图像对应的网络特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集的方式相似,在此不再赘述。
b)子合并装置根据各个图集的图集相关信息,来确定各个图集包括的图像,以由各个图集中分别选择一个图像,并根据所选择的图像所属图集的图集相关信息及所选择的图像的网络特征信息来对所选择的图像进行聚类,以将聚为一类的图像对应的图集进行合并,并获得合并后的一个或多个图集。
其中,子合并装置根据多个图集中每个图集所包含的部分或全部图像的网络特征信息,来对属于不同图集的图像进行聚类处理,并根据所述聚类处理的图像聚类结果来合并图集的方式与聚类装置2中所述根据所述每个图像对应的网络特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新图集的方式相似,在此不再赘述。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据各个图集所包含的部分或全部图像的网络特征信息,来对不同图集的图像进行聚类处理,并根据所述聚类处理的图像聚类结果来合并图集的实现方式,均应包含在本发明的范围内。
2)子合并装置根据所述多个图集对应的图集相关信息及权重信息,对该多个图集进行合并,以获得合并后的一个或多个图集。
具体地,子合并装置根据图集相关信息来确定图集,并将权重信息差值小于预定阈值的图集进行合并,以获得合并后的一个或多个图集。
例如,第三获取装置5获得的a、β、γ三个图集的网页地址信息以及第四确定装置所获得的所述三个图集的权重信息分别如下所示;
图集:图集的权重信息;
a:22;
β:24;
γ:15;
预定将权重信息差值小于5的图集进行合并。则子合并装置根据所述图集相关信息来识别图集,并确定图集a与β间权重信息的差值小于5,则子合并装置合并图集a与β;并且,子合并装置采用相同的方式,确定图集a与γ不可合并,图集β与γ不可合并。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述多个图集对应的图集相关信息及权重信息,对该多个图集进行合并,以获得合并后的图集的实现方式,均应包含在本发明的范围内。
3)子合并装置根据多个图集中每个图集对应的图集相关信息、其所包含的部分或全部图像的网络特征信息及其对应的权重信息,对该多个图集进行合并,以获得合并后的一个或多个图集。
具体地,子合并装置根据图集相关信息来确定图集,并将图像的网络特征信息及权重信息均符合预定合并条件的图集进行合并,以获得合并后的一个或多个图集。
例如,第三获取装置5所获得的a、β、γ三个图集的网页地址信息以及第四获取装置所获得的所述三个图集的权重信息分别如下所示;
图集:图集的网页地址信息;图集的权重信息;
a:http://www.a.com;22;
β:http://www.a.com; 24;
γ:http://www.a.com;15;
预定合并条件包括“网页地址相同,并且权重信息差值小于5”。则子合并装置根据所述图集相关信息及权重信息,确定图集a与β间权重信息的差值小于5,并且图集a和β的网页地址信息相同,则子合并装置合并图集a与β;并且,子合并装置采用相同的方式,确定图集a与γ不可合并,图集β与γ不可合并。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据、其所包含的部分或全部图像的网络特征信息及其对应的权重信息,对该多个图集进行合并,以获得合并后的图集的实现方式,均应包含在本发明的范围内。
根据本实施例的方法,能够解决相似图集的合并问题。优选地,根据本实施例的方法,还能够根据其他合并相关信息,确保了所合并图集间各个图像的相似度接近,且图像质量接近,以进一步提高合并所得的图集中图像的相似度,并防止优质图像与劣质图像合并在同一图集中。
图8为本发明再一个优选实施例的用于根据来自网络的图像来确定图集的图集确定装置的结构示意图。根据本实施例的图集确定装置包括第一获取装置1、聚类装置2、第六获取装置8、第二图像获取装置9、信息获取装置10和生成装置11。
第一获取装置1及聚类装置2已在参照图5所示实施例中予以详述,并以引用的方式包含于此,不再赘述。
第六获取装置8获取来自用户的输入序列。
第二图像获取装置9根据所述输入序列来进行检索,以获得一个或多个图像。
信息获取装置10分别获取该一个或多个图像所属图集的图集相关信息。
其中,获取图集的图集相关信息的方式包括但不限于:1)获取预存的图像所属图集的图集相关信息;2)采用如前述第三获取装置5中所述方式实时获取该图像所属图集的图集相关信息等。
生成装置11根据所获取的图集相关信息,生成相应的展示信息,以提供给所述用户。
其中,所述展示信息包括但不限于以下任一项:
1)所述图集相关信息所对应图集中的部分图像;
例如,生成装置11由图集中任意选择一个图像来作为该图集的封面图像,以生成展现信息;又例如,生成装置11根据图集中各个图像的基本特征信息来确定各个图像的权重,并选择权重最高的图像来作为封面图像,以生成展现信息;又例如,生成装置11由图集中随机选择预定展现数量的多个图像,以生成展现信息等;
2)所述图集相关信息所对应图集中的所有图像。
根据本实施例的方法,能够将聚类处理所得的图集作为整体提供给进行图像检索的用户,提高了用户的图像检索效率,并且由于图集中的图像质量较为均匀,使用户能够获得更好的体验。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (19)

1.一种计算机实现的用于根据来自网络的图像来确定图集的方法,其中,该方法包括如下步骤:
a获取多个图像中每个图像对应的网络特征信息;
b获取所述每个图像对应的基本特征信息;
c根据所述每个图像对应的网络特征信息及基本特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新包含相似图像的图集;
其中,该方法还包括以下步骤:
-根据所述建立或更新的图集中各个图像的网络特征信息,建立或更新所述图集的图集相关信息;
其中,该方法还包括以下步骤:
x获取多个图集中每个图集对应的图集相关信息;
y根据所述多个图集中每个图集对应的图集相关信息,对该多个图集进行合并,以获得合并后的一个或多个图集。
2.根据权利要求1所述的方法,其中,所述网络特征信息包括以下至少一项:
-该网络特征信息所对应的图像所属网页的地址信息;
-该网络特征信息所对应的图像的源地址信息;
-该网络特征信息所对应的图像所属网页的类型;
-该网络特征信息所对应的图像所属网页所在网站的类型;
-该网络特征信息所对应的图像的锚文本信息。
3.根据所述权利要求1所述的方法,其中,所述基本特征信息包括以下至少一项:
-该基本特征信息所对应图像的图像特征信息;
-该基本特征信息所对应图像的描述信息。
4.根据权利要求1所述的方法,其中,该方法还包括以下步骤:
-获取所述多个图集中每个图集对应的其他合并相关信息;
其中,所述步骤y还包括以下步骤:
-根据所述多个图集中每个图集对应的图集相关信息及其他合并相关信息,对该多个图集进行合并,以获得合并后的一个或多个图集。
5.根据权利要求4所述的方法,其中,所述其他合并相关信息包括以下至少一项:
-所述多个图集中每个图集所包含的部分或全部图像的网络特征信息;
-所述多个图集中每个图集对应的权重信息。
6.根据权利要求5所述的方法,其中,所述网络特征信息还包括图像点击信息,其中,该方法还包括以下步骤:
-获取所述建立或更新的图集中所有图像的网络特征信息及基本特征信息;
-根据所获取的网络特征信息及基本特征信息,建立或更新该图集的权重信息。
7.根据权利要求1至6中任一项所述的方法,其中,所述步骤a还包括以下步骤:
-由一个或多个网页中获取所述多个图像的网络特征信息。
8.根据权利要求1至6中任一项所述的方法,其中,所述步骤a还包括以下步骤:
-获取检索关键词;
-根据所述检索关键词进行图像检索,以获取检索到的多个图像的网络特征信息。
9.根据权利要求1至6中任一项所述的方法,其中,该方法还包括以下步骤:
-获取来自用户的输入序列;
-根据所述输入序列来进行检索,以获得一个或多个图像;
-分别获取该一个或多个图像所属图集的图集相关信息;
-根据所获取的图集相关信息,生成相应的展示信息,以提供给所述用户。
10.一种用于根据来自网络的图像来确定图集的图集确定装置,其中,该图集确定装置包括:
第一获取装置、用于获取多个图像中每个图像对应的网络特征信息;
第二获取装置、用于获取所述每个图像对应的基本特征信息;
聚类装置、用于根据所述每个图像对应的网络特征信息及基本特征信息,来对所述多个图像进行聚类处理,并根据所述聚类处理的图像聚类结果来建立或更新包含相似图像的图集;
第一更新装置、用于根据所述建立或更新的图集中各个图像的网络特征信息,建立或更新所述图集的图集相关信息;
第三获取装置、用于获取多个图集中每个图集对应的图集相关信息;
合并装置、用于根据所述多个图集中每个图集对应的图集相关信息,对该多个图集进行合并,以获得合并后的一个或多个图集。
11.根据权利要求10所述的图集确定装置,其中,所述网络特征信息包括以下至少一项:
-该网络特征信息所对应的图像所属网页的地址信息;
-该网络特征信息所对应的图像的源地址信息;
-该网络特征信息所对应的图像所属网页的类型;
-该网络特征信息所对应的图像所属网页所在网站的类型;
-该网络特征信息所对应的图像的锚文本信息。
12.根据所述权利要求10所述的图集确定装置,其中,所述基本特征信息包括以下至少一项:
-该基本特征信息所对应图像的图像特征信息;
-该基本特征信息所对应图像的描述信息。
13.根据权利要求10所述的图集确定装置,其中,该图集确定装置还包括:
第四获取装置、用于获取所述多个图集中每个图集对应的其他合并相关信息;
其中,所述合并装置还包括:
第一子合并装置、用于根据所述多个图集中每个图集对应的图集相关信息及其他合并相关信息,对该多个图集进行合并,以获得合并后的一个或多个图集。
14.根据权利要求13所述的图集确定装置,其中,所述其他合并相关信息包括以下至少一项:
-所述多个图集中每个图集所包含的部分或全部图像的网络特征信息;
-所述多个图集中每个图集对应的权重信息。
15.根据权利要求14所述的图集确定装置,其中,所述网络特征信息还包括图像点击信息,其中,该图集确定装置还包括:
第五获取装置、用于获取所述建立或更新的图集中所有图像的网络特征信息及基本特征信息;
第二更新装置、用于根据所获取的网络特征信息及基本特征信息,建立或更新该图集的权重信息。
16.根据权利要求10至15中任一项所述的图集确定装置,其中,所述第一获取装置还包括:
第一子获取装置、用于由一个或多个网页中获取所述多个图像的网络特征信息。
17.根据权利要求10至15中任一项所述的图集确定装置,其中,所述第一获取装置还包括:
第二子获取装置、用于获取检索关键词;
第一图像获取装置、用于根据所述检索关键词进行图像检索,以获取检索到的多个图像的网络特征信息。
18.根据权利要求10至15中任一项所述的图集确定装置,其中,该图集确定装置还包括:
第六获取装置、用于获取来自用户的输入序列;
第二图像获取装置、用于根据所述输入序列来进行检索,以获得一个或多个图像;
信息获取装置、用于分别获取该一个或多个图像所属图集的图集相关信息;
生成装置、用于根据所获取的图集相关信息,生成相应的展示信息,以提供给所述用户。
19.一种计算机设备,其中,该计算机设备包括如权利要求10至18中任一项所述的图集确定装置。
CN201110070669.4A 2011-03-23 2011-03-23 用于根据来自网络的图像来确定图集的方法、装置和设备 Active CN102693231B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110070669.4A CN102693231B (zh) 2011-03-23 2011-03-23 用于根据来自网络的图像来确定图集的方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110070669.4A CN102693231B (zh) 2011-03-23 2011-03-23 用于根据来自网络的图像来确定图集的方法、装置和设备

Publications (2)

Publication Number Publication Date
CN102693231A CN102693231A (zh) 2012-09-26
CN102693231B true CN102693231B (zh) 2019-07-26

Family

ID=46858688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110070669.4A Active CN102693231B (zh) 2011-03-23 2011-03-23 用于根据来自网络的图像来确定图集的方法、装置和设备

Country Status (1)

Country Link
CN (1) CN102693231B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177100B (zh) * 2013-03-20 2016-05-04 百度在线网络技术(北京)有限公司 搜索成套图像的方法和设备
CN103177110B (zh) * 2013-03-28 2016-08-24 百度在线网络技术(北京)有限公司 搜索成套图像的方法和设备
CN104142921A (zh) * 2013-05-06 2014-11-12 苏州普达新信息技术有限公司 一种基于云计算的图像特征优化组合方法
CN108882023B (zh) * 2018-07-11 2021-04-16 Oppo广东移动通信有限公司 视频处理方法及相关产品
CN109697239B (zh) * 2018-11-23 2022-05-31 南京尚网网络科技有限公司 用于生成图文信息的方法
CN109766470A (zh) * 2019-01-15 2019-05-17 北京旷视科技有限公司 图像检索方法、装置及处理设备
CN112445922A (zh) * 2019-08-27 2021-03-05 华为技术有限公司 一种图片处理方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271476A (zh) * 2008-04-25 2008-09-24 清华大学 网络图像搜索中基于聚类的相关反馈检索方法
CN101383713A (zh) * 2007-09-06 2009-03-11 上海艾瑞市场咨询有限公司 一种互联网广告信息处理方法
CN101458695A (zh) * 2008-12-18 2009-06-17 西交利物浦大学 基于关键词和内容特征的混合图片索引构建和查询方法及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101383713A (zh) * 2007-09-06 2009-03-11 上海艾瑞市场咨询有限公司 一种互联网广告信息处理方法
CN101271476A (zh) * 2008-04-25 2008-09-24 清华大学 网络图像搜索中基于聚类的相关反馈检索方法
CN101458695A (zh) * 2008-12-18 2009-06-17 西交利物浦大学 基于关键词和内容特征的混合图片索引构建和查询方法及其应用

Also Published As

Publication number Publication date
CN102693231A (zh) 2012-09-26

Similar Documents

Publication Publication Date Title
CN102693231B (zh) 用于根据来自网络的图像来确定图集的方法、装置和设备
US9348934B2 (en) Systems and methods for facilitating open source intelligence gathering
CN103488788B (zh) 一种应用自动推荐的方法及装置
CN105144141B (zh) 用于使用距离关联性散列法对媒体数据库定址的系统和方法
US20140181125A1 (en) Systems and methods for facilitating the gathering of open source intelligence
CN103778148B (zh) Hadoop分布式文件系统数据文件的生命周期管理方法和设备
CN106658096A (zh) 推送直播节目的方法和装置
JP2005032246A (ja) 画像グループの表現方法および表現方法によって導出される記述子、探索方法、装置、コンピュータプログラム、ならびに記憶媒体
CN103440199B (zh) 测试引导方法和装置
CN110163076A (zh) 一种图像数据处理方法和相关装置
CN110138652B (zh) 一种会话更新方法、装置及客户端设备
CN106022568A (zh) 一种工作流的处理方法和装置
CN102855245A (zh) 一种用于确定图片相似度的方法与设备
CN107977445A (zh) 应用程序推荐方法及装置
CN110231974A (zh) 运维信息的可视化方法、装置、设备及可读存储介质
CN109871770A (zh) 房产证识别方法、装置、设备及存储介质
CN107885857B (zh) 一种搜索结果页用户行为模式挖掘方法、装置及系统
CN112463859A (zh) 基于大数据和业务分析的用户数据处理方法及大数据平台
CN106604068B (zh) 一种更新媒体节目的方法及其系统
CN106326436A (zh) 显示界面元素的方法及装置
CN109460299B (zh) 一种分布式并行多源社交网络数据采集系统和方法
US20220083587A1 (en) Systems and methods for organizing an image gallery
CN108153661A (zh) 执行测试用例的方法和装置
CN108287889A (zh) 一种基于弹性表模型的多源异构数据存储方法和系统
DE102022002707A1 (de) Maschinell lernende Konzepte zur Schnittstellenmerkmalseinführung über Zeitzonen oder grafische Bereiche hinweg

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant