CN101510205A - 实现相片自动聚类的方法、装置及系统 - Google Patents

实现相片自动聚类的方法、装置及系统 Download PDF

Info

Publication number
CN101510205A
CN101510205A CN 200910037976 CN200910037976A CN101510205A CN 101510205 A CN101510205 A CN 101510205A CN 200910037976 CN200910037976 CN 200910037976 CN 200910037976 A CN200910037976 A CN 200910037976A CN 101510205 A CN101510205 A CN 101510205A
Authority
CN
China
Prior art keywords
photo
clustering
photograph
photographs
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200910037976
Other languages
English (en)
Other versions
CN101510205B (zh
Inventor
李文军
邱志豪
梁焯佳
朱建伟
姚宏兵
姚宇涵
雷晖
梁毅鹏
张义明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Yofus Technology Co ltd
Original Assignee
GUANGZHOU YOUFU DIGITAL TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GUANGZHOU YOUFU DIGITAL TECHNOLOGY Co Ltd filed Critical GUANGZHOU YOUFU DIGITAL TECHNOLOGY Co Ltd
Priority to CN 200910037976 priority Critical patent/CN101510205B/zh
Publication of CN101510205A publication Critical patent/CN101510205A/zh
Application granted granted Critical
Publication of CN101510205B publication Critical patent/CN101510205B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供一种实现相片自动聚类的方法、装置及系统,该方法包括:导入相片集;提取上述导入的相片集中各个相片的各种属性信息;保存上述提取的各个相片的各种属性信息;读取保存的所有相片的属性信息并保存在相应的相片对象中,然后对所有相片对象进行缓存和排序;或缓存依次执行的多次相片聚类方法的相片聚类结果;按需求调度所述聚类算法管理器管理的一个或若干个多属性相片聚类方法,对所述相片管理器缓存的所有相片对象执行一个多属性相片聚类方法或按照顺序嵌套执行上述的若干个相片聚类方法得到相片自动聚类结果。本发明可以用于组织和管理大规模数量的数码相片,支持用户通过对相片进行多属性弹性聚类来得到适合用户需求的结果。

Description

实现相片自动聚类的方法、装置及系统
技术领域
本发明属于数码处理领域,更具体的说,本发明涉及一种实现相片自动聚类的方法、装置及系统。
背景技术
随着数码技术的飞快发展,数码相机开始越来越普遍使用,用户将收集大量的个人、家庭或团体关于各种主题的数码相片。此外,在互联网的带动下,涌现出了很多跟数码相片相关的应用或服务,例如相片共享社区、在线相册打印服务等。无论是面对个人收集的保存在PC机上的数码相片,还是面对互联网上与数码相片相关的应用或服务所存贮的大量相片,人们都期望能有一种比较有效的方法来自动地组织和管理这些相片。
到目前为止,国内外的一些研究已经开始使用自动聚类技术来对相片进行组织,它们使用的相片特征信息可以分为两类:EXIF元数据和内容信息。其中EXIF元数据是在拍照的时候自动记录在相片里面的,现有的研究用到EXIF元数据信息主要包含有拍照时间信息和空间信息。通过时间信息可以对相片进行事件划分,这里提到的事件这个概念是没有统一定义的,往往是跟某段时间或某个地点相关的,例如生日晚会、婚礼等等;通过空间信息可以对相片进行地理位置划分,但是由于目前国内外带有GPS功能的相机还没普及,对相片按照其拍照空间信息进行组织的方法可能在未来几年后才会变得通用起来。
上述现有技术按照单个特征进行相片聚类存在诸多的不足,具体如下:
第一,单个特征不能应付复杂的相片集。例如,基于时间的聚类方法能取得好效果的前提是这些相片是同一个用户在连续的时间段内所拍摄的,如果这些相片来源复杂,是通过各种渠道得到的,在时间上有交叉或重叠,那么仅用时间信息就不能区分开。
第二,单个特征难于得到适合粒度的聚类。例如,基于空间的聚类可以划分在不同地理位置上拍摄的相片,但此时得到在某个地点拍摄的相片所包含的时间跨度可能有几个月,用户需要继续用时间特征来细化才会得到合适粒度的聚类结果。
第三,前面提到的几个特征还不能处理一些特殊的情形,需要考虑增加新的特征。根据经验和观察,这些可用的新特征还包括相机类型、亮度、尺寸、人脸等。一般情况下,如果某相片集是用户使用不同类型的相机来拍摄得到的话,那么按照其相机类型来划分也是比较有意义的;相片的亮度不同也会意味着属于不同的场景或事件;按照相片的不同尺寸进行划分可能对相册排版等应用是有帮助的,这样会显得比较整齐美观。根据从相片上面检测到的人脸数量,可以判断出风景照、单人照和集体照等。
第四,单个特征只能满足某个方面的需求,需要灵活使用多个特征才能满足用户的不同需求。基于时间的聚类适合于划分事件,而基于空间的聚类适合于划分地理位置等,但在很多情况下,用户对相片管理的需求是多样的,可能有的用户想先按照地理位置再按照时间来组织相片,而有的用户却想先按照时间再按照内容信息来组织相片。这些不同的需求是跟相片集相关,即不同情形的相片集需要用不同的方式来组织和管理。
发明内容
本发明解决的技术问题是提供一种实现相片自动聚类的方法、装置及系统,以用于组织和管理大规模数量的数码相片,支持用户通过对相片进行多属性弹性聚类来得到适合用户需求的结果。
为解决上述技术问题,本发明采用如下技术方案:
一种实现相片自动聚类的装置,其包括:
特征提取器,用于提取待聚类的相片集中各个相片的各种属性信息,所述属性信息包括EXIF元数据,内容信息和用户提供信息;
数据库,用于保存所述特征提取器提取的上述相片集中各个相片的各种属性信息;
相片管理器,用于从所述数据库中读取所有相片的属性信息并保存在相应的相片对象中,然后对所有相片对象进行缓存和排序,以及缓存依次执行的多次相片聚类方法的相片聚类结果;
聚类算法管理器,用于对系统中所有的多属性相片聚类方法进行注册管理、配置参数,以及指定聚类算法对象;
聚类算法调度器,用于按需求调度所述聚类算法管理器管理的一个或若干个多属性相片聚类方法,对所述相片管理器缓存的所有相片对象执行一个多属性相片聚类方法或按照顺序嵌套执行上述的若干个相片聚类方法得到相片自动聚类结果。
另外,还包括:数据格式转换器,用于对所提取的各种属性信息按照系统处理的数据格式进行规格化,其中所述规划化包括但不限于数据格式的转换或数据格式的纠错。
另外,还包括:图形用户界面,用于显示相片聚类结果。
其中,所述一个或多个多属性相片聚类方法可由用户按需指定或由系统推荐。
一种实现相片自动聚类的系统,其包括:
实现网络互联互通的互联网;
连接互联网的客户端,所述客户端上传需要自动聚类的相片;
连接互联网的服务器端,所述服务器端包括有上述实现相片自动聚类的装置。
一种实现相片自动聚类的方法,其包括:
导入步骤:导入相片集;
提取步骤:用于提取上述导入的相片集中各个相片的各种属性信息,所述属性信息包括但不限于该相片的EXIF元数据、内容信息和用户提供信息;
保存步骤:用于保存上述提取的各个相片的各种属性信息;
相片管理步骤:用于读取保存的所有相片的属性信息并保存在相应的相片对象中,然后对所有相片对象进行缓存和排序;或
缓存依次执行的多次相片聚类方法的相片聚类结果;
聚类步骤:按需求调度所述聚类算法管理器管理的一个或若干个多属性相片聚类方法,对所述相片管理器缓存的所有相片对象执行一个多属性相片聚类方法或按照顺序嵌套执行上述的若干个相片聚类方法得到相片自动聚类结果。
其中,保存该相片集中各个相片的各种属性信息之前还包括:
对所提取的各种属性信息按照系统处理的数据格式进行规格化,其中所述规划化包括但不限于数据格式的转换或数据格式的纠错。
其中,所述一个或多个多属性相片聚类方法由用户按需指定或由系统推荐。
与现有技术相比,本发明具有以下有益效果:
本发明中提取相片的多个属性信息,使用多个属性来应付复杂的相片集,并可采用新的特征对相片进行聚类,聚类时根据用户需求可在单个相片聚类方法中可以灵活选择一个或多个属性对相片进行聚类,还可以根据需求来指定多个相片聚类方法嵌套执行聚类,而且可提供一个通用的聚类框架,可以很方便地插入新的相片聚类方法,在组织和管理大规模数量的数码相片时,支持用户通过对相片进行多属性弹性聚类来得到适合用户需求的结果。
附图说明
图1是本发明实现相片自动聚类的装置具体实施例的结构示意图;
图2是本发明实现相片自动聚类的方法具体实施例的流程示意图;
图3是本发明实现相片自动聚类的方法具体实施例显示相片拥有多重属性的示意图;
图4是本发明实现相片自动聚类的方法具体实施例显示简单的相片聚类方法的流程示意图;
图5是本发明实现相片自动聚类的方法具体实施例显示指定若干个相片聚类方法按照次序嵌套执行的流程示意图;
图6是本发明实现相片自动聚类的方法具体实施例显示使用时间、空间和人脸这三个属性对相片集进行聚类的示意图;
图7是本发明实现相片自动聚类的方法具体实施例显示系统推荐若干个相片聚类方法的流程示意图;
图8是本发明实现相片自动聚类的网络系统具体实施例的架构示意图。
具体实施方式
本发明提到的弹性聚类是指在单个相片聚类方法中可以灵活选择一个或多个属性对相片进行聚类,还可以根据需求来指定多个相片聚类方法嵌套执行的先后顺序。
图1是示意性地显示根据本发明的实施例的使用多属性对相片进行弹性聚类的装置结构图。
图1中的使用多属性对相片进行弹性聚类的视线相片自动聚类的装置主要包括特征提取器12、数据格式转换器13、数据库14、相片管理器15、聚类算法管理器16和聚类算法调度器17。各个部件执行的功能可以通过使计算机执行使用普通的编程技术生成的程序来实现,也可以通过硬件来实现,或者通过它们的组合来实现。
图2是显示由图1中显示的使用多属性对相片进行弹性聚类的装置执行的典型的处理流程的流程图。
首先,导入用户相片集20后,特征提取器12就开始提取相片各种属性信息21。这里需明确的是,用户相片集在本发明中是以文件夹层次结构的形式来存储和管理的,可采用给每张相片指派一个唯一的字符串类型ID名称,根据此ID名称则可以确定其存储路径。例如某相片的字符串类型ID名称是194e2f5d65a2dbfa7dc883bb9fbd2958.jpg,则可以考虑取此ID名称的前6个字符,按照次序分别以两个字符命名一个文件夹的形式来嵌套命名三个文件夹,故该相片的存放路径是\19\4e\2f\194e2f5d65a2dbfa7dc883bb9fbd2958.jpg。
另外,聚类算法管理器16拥有一个统一的接口,这个接口的输入是相片实体类的一系列实例化对象,输出是聚类实体类的一系列实例化对象。换句话说,输入是用户收藏的一系列相片,输出是对这些相片进行划分得到的聚类结果。聚类算法管理器对聚类算法是注册管理的,可以很方便地插入新的聚类方法,但要求所有聚类算法都要实现这个接口,以便被聚类算法调度器17调用。
进一步地,图3显示了一个相片拥有多属性的例子。本发明对相片进行弹性聚类所使用的多属性就是该例子中的EXIF元数据32、低层内容信息33、高层内容信息36和用户提供信息35。其中EXIF元数据主要包含有拍照时间、拍照地点、相机类型、相片宽高和亮度;而内容信息包含颜色、纹理和人脸。这里需明确的是,图3中文件信息34记录相片文件的一些基本信息,可以根据其含有的文件路径来读取源相片,从而获得相片的各种属性信息,具体方法如下:
EXIF元数据信息可以使用开源的开发包读取源相片获得,例如Java语言使用metadata-extractor(详见http://www.drewnoakes.com/code/exif/releases/)。其中亮度可以有两种方式获得:一是直接从源相片里面读取,但这是高级相机才提供的参数;二是间接计算F-number、ISO速率和曝光时间得到,具体公式见Bo Gong and Ramesh Jain。Segmenting Photo Streams in Events Based onOptical Metadata。International Conference on Semantic Computing(ICSC),2007。
内容信息中常用的颜色特征是颜色全局直方图,其提取方法见J Wang,WJYang and R Acharya.Color Clustering Techniques for Color-Content-Based ImageRetrieval from Image Databases.IEEE Conference on Multimedia Computing andSystems,1997,442-449。
内容信息中的纹理特征可以通过离散小波变换得到,其提取方法见DeBrunner,V.and Kadiyala,M.Texture Classification Using Wavelet Transform.Circuits and Systems,42nd Midwest Symposium,Vol.2,August 1999,1053-1056。
人脸信息可以使用现有成熟的开放源代码的计算机视觉类库OpenComputer Vision Library(详见http://sourceforge.net/projects/opencvlibrary/)对源相片进行检测获得,此外该库支持多种语言,例如JNI2OpenCV等。如果源相片被检测出来的人脸数量是0,则认为其是风景照;如果被检测出来的人脸数量是1,则认为其是单人照;如果被检测出来的人脸数量大于1,则认为其是集体照。
用户提供信息主要是指用户提供文本信息来简要地说明相片的语义。它可以由多种方式得到,其中最直接的方式是用户可以明确地给每一张相片提供一个名称、一个标题或一系列标签。另一种方法是,用户在个人电脑中也可以通过给文件夹起有意义的名称和利用文件夹的层次结构来组织相片。例如,有一张相片被放置在一个命名为“广州”的文件夹中,而此文件夹“广州”依次属于上一级文件夹“旅游”。此时“广州”和“旅游”均看作是跟该相片有关的用户提供信息。这里需明确的是,所有用户提供信息是以一组单词的形式来表述的。
当提取完相片的EXIF元数据、内容信息和用户提供信息后,数据格式转换器13开始对这些属性进行统一规格化。此时数据格式转换器主要处理以下两种情况:1)数据格式的转换,例如把从元数据中提取的String类型的时间信息转换为Date类型,后面根据需要还可以将其转换成以秒为单位的LongInteger类型等;2)数据格式的纠错,可能由于用户设置相机不恰当,出现拍照时间是0000-00-00:00-00-00等错误情况,此时数据格式转换器13就要把该相片的拍照时间重设为当前时间来处理。
在本发明的实施例中,可使用相片的以下属性来对相片进行聚类,它们的数据类型在Java编程语言中可依次表示如下(见括号内):1拍照时间(Date类型),2拍照地点(Double[2]类型),3亮度(Double类型),4相片宽高(Integer[2]类型),5颜色(Integer[64]类型),6纹理(Double[16]类型),7人脸(Integer类型),8相机类型(String类型),9用户提供信息(String[]类型)。本发明领域的普通技术人员应当理解,可以轻易地支持和集成额外的相片属性。
规格化后的属性信息都存储入数据库14,其中拍照时间、亮度、人脸、相机类型和用户提供信息都是使用数据库表的一个字段来存储,而拍照地点和相片宽高都是使用数据库表的两个字段来存储。剩下的颜色和纹理也都是使用数据库表的一个字段来存储,不过它们是以加分隔符的字符串方式来保存的,例如纹理属性值是1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,那么以分隔符为’\’的字符串来保存的话则是”1\1\1\1\1\1\1\1\1\1\1\1\1\1\1\1”,以后从数据库里读出纹理属性值时需要把分隔符为’\’的字符串还原Double[16]类型;颜色也同理。
下面以不同的实施例进行说明。
第一实施例
本实施例说明只执行一个相片聚类方法的过程。
图4显示了一种简单的相片聚类方法的处理流程的流程图。在开始对相片进行聚类之前,需要从数据库中读出所有相片的属性信息,这些属性信息就保存在相片管理器15的相片实体类中(简称为相片对象,下同),此时将所有初始化相片对象看作是一个聚类,缓存在相片管理器中等待下一步的处理。
步骤40,先从相片管理器缓存中获得指定聚类所包含的相片对象。
步骤41,把这些相片对象按照其拍照时间排列好,将每个相片对象看作一个初始化聚类,假设此时总共有N张相片,则分别记其编号为C1,C2,...,CN,接下来是不断合并聚类的过程。
步骤42,根据给定权值w1,w2,...,wk,计算任意两个聚类之间的距离。
计算给定两个聚类Ci和聚类Cj之间距离的过程如下:假设相片对象P拥有k个属性,分别记为A1,A2,...,Ak,特别地假设Ak-1和Ak分别表示相机类型和用户提供信息(下同),可知除了Ak-1属性是字符串类型和Ak属性是字符串数组类型外,其余属性都可以看作矢量(拍照时间将被转换成以秒为单位的Long Integer类型来计算),那么对上述P的前k-2个属性可以表示成Ai:(r1,r2,...,rm),这里1<=i<=k-2,如前面所述,这里注意一下这前k-2个属性的维度m可能是不同的,例如时间是一维数据,空间却是二维数据等。
1)先计算出聚类Ci的质心对象P”
这里提到的质心对象是一个虚拟的相片对象,此相片对象可以代表着这个聚类。
如果聚类Ci只有一个相片对象,则该相片对象就是质心对象。
如果聚类Ci含有N个相片对象,则通过如下方法来获得质心对象:
初始化设i=1,对相片对象的第i个属性有Ai:(r1,r2,...,rm),那么使用如下公式(1)来计算第i个属性的第j个分量的均值rj”(1<=j<=m):
rj″=∑rj/N    (1)
这里∑rj表示的是这N个相片对象的第i个属性的第j个分量的和。
循环使用公式(1)计算第i个属性的所有m个分量后,则可得到质心对象P”的第i个属性Ai”:(r1”,r2”,...,rm”),同理,可以计算出质心对象P”的前k-2个属性是(A1”,A2”,...,Ak-2”)。质心对象P”的第K-1个属性Ak-1”则是通过统计这N个相片对象的第K-1个属性Ak-1得到,取它们中出现频率最高的那个。而质心对象P”的第K个属性Ak”是由一个或多个字符串组成,计算质心对象P”的第K个属性Ak”的方法详见Salton G.,McGill M.J.,1983,"Introduction toModern Information Retrieval".McGraw-Hill,New York.
2)计算聚类Ci和聚类Cj之间距离
假设由1)步骤可以得到聚类Ci的质心对象P1和聚类Cj的质心对象P2,则P1和P2的前k-2个属性分别记为A1,A2,...,Ak-2和A1’,A2’,...,Ak-2’,那么对上述P1的每一个属性Ai:(r1,r2,...,rm),对应有P2的一个属性Ai’:(r1’,r2’,...,rm’),根据其维数m来计算第i属性间的距离di,如下:
di = ( r 1 - r 1 &prime; ) 2 + ( r 2 - r 2 &prime; ) 2 + &CenterDot; &CenterDot; &CenterDot; + ( rm - rm &prime; ) 2 - - - ( 2 )
由于属性Ak-1是字符串类型,P1和P2的第k-1个属性间的距离dk-1如下计算:如果Ak-1与Ak-1’是一样的,则dk-1为1,否则dk-1为0。
而属性Ak是字符串数组类型,P1和P2的第k个属性间距离dk的计算方法详细见Salton G.and McGill M.J.Introduction to Modern InformationRetrieval.McGraw-Hill:New York,1983,该书中描述了如何计算两个字向量(word vector)的距离。
使用公式(2)对相片的前k-2个属性进行计算以及获得距离dk-1和距离dk后,则得到这k个属性的距离矢量(d1,d2,...,dk),此时使用如下公式计算这两个相片对象P1和P2间的距离Dij
Dij=w1×d1+w2×d2+...+wk×dk   (3)
这里w1,w2,...,wk是权值,其中wi(1<=i<=k)是不小于0的有理数。当wi不为0时则表示使用属性i对相片进行聚类,当wi为0时,则表示不使用属性i对相片进行聚类。
步骤42,根据给定的权值计算每两个聚类之间的距离后,接着步骤43找出距离最小的两个聚类Ci和聚类Cj,步骤44判断其距离Dij是否小于给定阈值T,是则步骤45将聚类Cj合并到聚类Ci中,再按照原来顺序更新所有聚类的编号,此时聚类的总数量比原先减少一个。在步骤45中需要注意两点,一是合并后的聚类选用i和j中最小的那个作为其编号,二是合并后发现当前只有1个聚类,则停止计算并返回该聚类结果。如果步骤44为否的话,则得到聚类结果。
例如,现有5个聚类分别记为C1,C2,C3,C4,C5,则计算得到最小距离的两个聚类是C2和C4,且其距离D24小于给定阈值T,故可知将C4合并入C2中,按照原来顺序更新所有聚类的编号后是C1’,C2’,C3’,C4‘,即原来的C5变成了现在的C4‘,其他同理。如果此时得到任意两个聚类之间的最小距离均大于给定阈值T,则得到聚类结果就是C1’,C2’,C3’,C4‘。
下面说明利用此聚类算法来配置一个相片聚类方法的过程。
这里需要注意聚类算法和相片聚类方法的区别,前者指的是数据挖掘领域的聚类算法,后者是专门针对相片聚类的方法,两者的区别在于每个相片聚类方法是在聚类算法管理器16的算法配置文件中配置而成的,每个相片聚类方法在算法配置文件中的信息包括:有唯一的名称,给定相片各属性的权值,选择某个聚类算法以及配置该聚类算法需要的参数。换句话说,根据各属性权值和阈值T的不同,可以由同一个聚类算法配置出一系列相片聚类方法来。
例如,想利用图4所示的聚类算法配置一个基于时间和颜色的相片聚类方法,具体做法如下:在聚类算法管理器的算法配置文件中先给该相片聚类方法起一个唯一的名称如TimeAndColorClustering,再配置好时间属性和颜色属性的权值分别为X1和X2(X1和X2均是有理数),其余属性的权值均为0,即这9个属性的权值分别是X1,0,0,0,X2,0,0,0,0,最后还要配置好该聚类算法的路径和给出适当的阈值T。此时,TimeAndColorClustering就是一个基于时间和颜色的相片聚类方法。当用户或系统指定要执行TimeAndColorClustering时,则聚类算法调度器就可以根据名称TimeAndColorClustering从算法配置文件里面读取相关配置权值和参数,调用图4所示的聚类算法来完成对相片聚类。
同理,利用该聚类算法可以配置基于其他属性的相片聚类方法。更复杂一点的是可以配置多个属性的权值不为零来对相片进行聚类,例如拍照时间相近的相片集往往在视觉上也比较相似,故此时使用时间、空间、颜色和亮度等多个属性来聚类可能会得到更好效果。
第二实施例
本实施例说明用户按需指定若干个相片聚类方法按照次序嵌套执行。
图5显示了按需指定若干个相片聚类方法按照次序嵌套执行的处理流程的流程图,即图5描述了按需调用执行相片聚类方法23的过程。
步骤51,相片管理器把需要组织和管理的相片对象缓存起来后,这些初始化的相片对象在开始执行聚类之前将被看作一个初始化聚类,接着步骤52用户可以指定先后嵌套执行K个相片聚类方法。这里需要说明的是,系统通过下拉列表的方式提供所有相片聚类方法的名称,用户只需要按照名称来选择其中的K个相片聚类方法和指定它们的先后执行顺序,系统则会自动按照用户的要求去嵌套执行K个这些相片聚类方法。另外一种方法是,用户或系统管理员可以提前在配置文件中指定K个相片聚类方法和它们的先后执行顺序,而该配置文件将在系统的多次执行中被重复使用。
步骤53开始启动聚类算法调度器,接着步骤54从相片管理器缓存中获得初始化聚类,对其执行第一个相片聚类方法,步骤56将缓存由第一个相片聚类方法产生的一系列聚类结果,重复步骤54,对每个聚类执行第2个相片聚类方法,如此不断循环直到执行了第K个相片聚类方法,才输出最终聚类结果。
图6显示了上述指定3个相片聚类方法嵌套执行的例子。在刚开始相片聚类方法前,初始化用户相片集被看作一个初始化聚类600,从聚类600中获得相片对象后开始执行基于时间的相片聚类方法得到聚类601和聚类602,相片管理器15将由第一个相片聚类方法产生的聚类601和聚类602缓存起来,接着分别对聚类601和聚类602执行基于空间的相片聚类方法得到更细粒度的聚类603、聚类604和聚类605,同理,最后执行基于人脸的相片聚类方法,输出最终聚类结果见图6所示。
第三实施例
本实施例说明系统推荐若干个相片聚类方法按照次序嵌套执行。
有时候相片集来源复杂,用户也很难判断如何调度这些相片聚类方法才能得到最佳的聚类效果,需要系统通过分析相片集后自动选择适合的相片聚类方法来帮助用户划分这些相片。处理过程如下:
系统把相片的属性划分三个优先级,其中第一优先级的优先权最高,第一优先级次之,第三优先级最低。属于同一个优先级上面的属性其优先级从左到右依次减弱,具体如下:
第一优先级:时间、空间、相机类型和用户提供信息
第二优先级:颜色、纹理、人脸和亮度
第三优先级:宽高
基于上述的每个属性,分别配置好一个相片聚类方法,即总共有9个相片聚类方法。执行每一个相片聚类方法得到结果都是一系列聚类C1,C2,...,CN,使用如下公式(4)来计算其聚类效果评价值S:
S=∑ai/N     (4)
这里ai表示聚类Ci所包含的相片数量,N表示聚类的数量,其中1≤i≤N。
步骤72,计算得到聚类效果评价值S大于给定阈值t的相片聚类方法的数量为K,如果步骤73判断条件K小于1为真的话,说明执行所有相片聚类方法得到的聚类效果评价值S均小于给定某阈值t(默认t=10),则进入步骤74,只推荐使用得到聚类效果评价值S最高的那个相片聚类方法。
如果步骤73判断条件K小于1为假的话,说明执行部分相片聚类方法得到的聚类效果评价值S不小于给定某阈值t(默认t=10),则把这部分相片聚类方法记录下来。步骤75,假设其数量为K(如果K大于等于3,则只取K为3),找出得到的聚类效果评价值S最高的K个相片聚类方法,根据其所使用的属性的最高优先级来安排和指定这K个相片聚类方法嵌套执行的先后次序。步骤76,启动聚类算法调度器17对这K个相片聚类方法按次序进行嵌套执行,得到最终的聚类结果。
例如,对于某相片集,分别执行所有相片聚类方法,根据公式(4)计算它们的聚类效果评价值。通过计算得知只有基于颜色、基于时间和基于宽高这三个相片聚类方法的聚类效果评价值S大于给定阈值t,假设其聚类效果评价值分别是15、16和19,那么根据这三个属性的优先级先后可以得知,本系统推荐指定这三个相片聚类方法嵌套执行的先后次序是基于时间、基于颜色和基于宽高。
图8是显示使用多属性对相片进行弹性聚类的系统的总架构图。用户在客户端800通过互联网801把相片上传到服务器802,其中服务器802包括中央处理器(CPU)803,数据库14和主存805。服务器802接收到用户相片后则使用特征提取器12来对相片提取各种属性信息和使用数据格式转换器13来规格化这些属性信息,接着将规格化后的所有属性信息都保存在数据库14里面。在开始对相片进行聚类之前,相片管理器15需要先把相片的所有属性信息从数据库14里面读出来放在缓存区809中。此时聚类算法811记录着用户指定或系统推荐的若干个相片聚类方法的名称和执行顺序,而算法配置信息813记录着所有相片聚类方法的配置参数信息,包括算法名称、权值和阈值等。根据聚类算法811的记录信息,聚类算法调度器17依次把将要执行的相片聚类方法名称和相片对象作为参数传递给聚类算法管理器16,而聚类算法管理器16根据相片聚类方法名称从算法配置信息813中获得该相片聚类方法的所有配置信息后,则可以实例化和执行该相片聚类方法对相片进行划分得到聚类结果,并保存在缓存区809中。接着聚类算法调度器17继续调用下一个相片聚类方法对聚类结果进行细化,如此同理,直到所有指定相片聚类方法都执行完毕。最后系统从缓存区809中读出聚类结果并显示到图形用户界面上。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1、一种实现相片自动聚类的装置,其特征在于,包括:
特征提取器,用于提取待聚类的相片集中各个相片的各种属性信息,所述属性信息包括EXIF元数据,内容信息和用户提供信息;
数据库,用于保存所述特征提取器提取的上述相片集中各个相片的各种属性信息;
相片管理器,用于从所述数据库中读取所有相片的属性信息并保存在相应的相片对象中,然后对所有相片对象进行缓存和排序,以及缓存依次执行的多次相片聚类方法的相片聚类结果;
聚类算法管理器,用于对系统中所有的多属性相片聚类方法进行注册管理、配置参数,以及指定聚类算法对象;
聚类算法调度器,用于按需求调度所述聚类算法管理器管理的一个或若干个多属性相片聚类方法,对所述相片管理器缓存的所有相片对象执行一个多属性相片聚类方法或按照顺序嵌套执行上述的若干个相片聚类方法得到相片自动聚类结果。
2、根据权利要求1所述的实现相片自动聚类的装置,其特征在于,还包括:数据格式转换器,用于对所提取的各种属性信息按照系统处理的数据格式进行规格化,其中所述规格化包括但不限于数据格式的转换或数据格式的纠错。
3、根据权利要求1所述的实现相片自动聚类的装置,其特征在于,还包括:图形用户界面,用于显示相片聚类结果。
4、根据权利要求1所述的实现相片自动聚类的装置,其特征在于,所述一个或多个多属性相片聚类方法由用户按需指定或由系统推荐。
5、一种实现相片自动聚类的系统,其特征在于,包括:
实现网络互联互通的互联网;
连接互联网的客户端,所述客户端上传需要自动聚类的相片;
连接互联网的服务器端,所述服务器端包括有实现相片自动聚类的装置,所述实现相片自动聚类的装置包括有:
特征提取器,用于提取待聚类的相片集中各个相片的各种属性信息,所述属性信息包括EXIF元数据,内容信息和用户提供信息;
数据库,用于保存所述特征提取器提取的上述相片集中各个相片的各种属性信息;
相片管理器,用于从所述数据库中读取所有相片的属性信息并保存在相应的相片对象中,然后对所有相片对象进行缓存和排序,以及缓存依次执行的多次相片聚类方法的相片聚类结果;
聚类算法管理器,用于对系统中所有的多属性相片聚类方法进行注册管理、配置参数,以及指定聚类算法对象;
聚类算法调度器,用于按需求调度所述聚类算法管理器管理的一个或若干个多属性相片聚类方法,对所述相片管理器缓存的所有相片对象执行一个多属性相片聚类方法或按照顺序嵌套执行上述的若干个相片聚类方法得到相片自动聚类结果。
6、根据权利要求5所述的实现相片自动聚类的系统,其特征在于,所述实现相片自动聚类的装置还包括有:
数据格式转换器,用于对所提取的各种属性信息按照系统处理的数据格式进行规格化,其中所述规格化包括但不限于数据格式的转换或数据格式的纠错。
7、根据权利要求5所述的实现相片自动聚类的系统,其特征在于,所述实现相片自动聚类的装置还包括有:
图形用户界面,用于显示相片聚类结果。
8、一种实现相片自动聚类的方法,其特征在于,包括:
导入步骤:导入相片集;
提取步骤:用于提取上述导入的相片集中各个相片的各种属性信息,所述属性信息包括但不限于该相片的EXIF元数据、内容信息和用户提供信息;
保存步骤:用于保存上述提取的各个相片的各种属性信息;
相片管理步骤:用于读取保存的所有相片的属性信息并保存在相应的相片对象中,然后对所有相片对象进行缓存和排序;或
缓存依次执行的多次相片聚类方法的相片聚类结果;
聚类步骤:按需求调度所述聚类算法管理器管理的一个或若干个多属性相片聚类方法,对所述相片管理器缓存的所有相片对象执行一个多属性相片聚类方法或按照顺序嵌套执行上述的若干个相片聚类方法得到相片自动聚类结果。
9、根据权利要求8所述的实现相片自动聚类的方法,其特征在于,保存该相片集中各个相片的各种属性信息之前还包括:
对所提取的各种属性信息按照系统处理的数据格式进行规格化,其中所述规格化包括但不限于数据格式的转换或数据格式的纠错。
10、根据权利要求8所述的实现相片自动聚类的方法,其特征在于,所述一个或多个多属性相片聚类方法由用户按需指定或由系统推荐。
CN 200910037976 2009-03-16 2009-03-16 实现相片自动聚类的方法、装置及系统 Active CN101510205B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200910037976 CN101510205B (zh) 2009-03-16 2009-03-16 实现相片自动聚类的方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200910037976 CN101510205B (zh) 2009-03-16 2009-03-16 实现相片自动聚类的方法、装置及系统

Publications (2)

Publication Number Publication Date
CN101510205A true CN101510205A (zh) 2009-08-19
CN101510205B CN101510205B (zh) 2013-02-27

Family

ID=41002605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200910037976 Active CN101510205B (zh) 2009-03-16 2009-03-16 实现相片自动聚类的方法、装置及系统

Country Status (1)

Country Link
CN (1) CN101510205B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102262638A (zh) * 2010-05-31 2011-11-30 国际商业机器公司 图片标引的方法和装置
CN102404373A (zh) * 2010-09-17 2012-04-04 环达电脑(上海)有限公司 快速显示图片的手持式移动装置及其方法
CN103902178A (zh) * 2012-12-28 2014-07-02 腾讯科技(深圳)有限公司 一种基于安卓系统的多媒体文件处理方法及装置
CN104750688A (zh) * 2013-12-25 2015-07-01 鸿富锦精密工业(深圳)有限公司 照片管理方法及系统
CN104965863A (zh) * 2015-06-05 2015-10-07 北京奇虎科技有限公司 一种对象聚类方法和装置
CN105488074A (zh) * 2014-09-28 2016-04-13 小米科技有限责任公司 照片聚类的方法及装置
CN105488156A (zh) * 2015-11-30 2016-04-13 广州一刻影像科技有限公司 一种自动选择电子相册模板并生成电子相册的方法
CN106250907A (zh) * 2016-07-08 2016-12-21 大连大学 云计算环境基于过采样修正的大规模图像聚类方法
CN106326773A (zh) * 2016-08-29 2017-01-11 广东欧珀移动通信有限公司 一种照片加密管理的方法、装置及终端
CN106341402A (zh) * 2016-08-30 2017-01-18 中国民生银行股份有限公司 基于多架构分布式缓存的处理方法和装置
CN106855867A (zh) * 2015-12-09 2017-06-16 腾讯科技(深圳)有限公司 一种图片归档的方法及装置
CN107273399A (zh) * 2011-06-17 2017-10-20 索尼公司 信息处理设备、信息处理方法和程序
CN108073948A (zh) * 2012-01-17 2018-05-25 华为技术有限公司 一种照片分类管理方法、服务器、装置及系统
CN108737758A (zh) * 2018-05-21 2018-11-02 深圳市沃特沃德股份有限公司 音视频记录方法和装置
CN109922209A (zh) * 2019-02-22 2019-06-21 维沃移动通信有限公司 一种照片管理方法及终端设备
CN105472239B (zh) * 2015-11-17 2019-08-16 小米科技有限责任公司 照片处理方法及装置
WO2019218459A1 (zh) * 2018-05-14 2019-11-21 平安科技(深圳)有限公司 一种照片存储方法、存储介质、服务器和装置

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102262638A (zh) * 2010-05-31 2011-11-30 国际商业机器公司 图片标引的方法和装置
CN102404373A (zh) * 2010-09-17 2012-04-04 环达电脑(上海)有限公司 快速显示图片的手持式移动装置及其方法
CN107273399A (zh) * 2011-06-17 2017-10-20 索尼公司 信息处理设备、信息处理方法和程序
CN107273399B (zh) * 2011-06-17 2019-10-08 索尼公司 信息处理设备、信息处理方法和计算机可读存储介质
CN108073948A (zh) * 2012-01-17 2018-05-25 华为技术有限公司 一种照片分类管理方法、服务器、装置及系统
CN103902178A (zh) * 2012-12-28 2014-07-02 腾讯科技(深圳)有限公司 一种基于安卓系统的多媒体文件处理方法及装置
CN103902178B (zh) * 2012-12-28 2018-09-07 腾讯科技(深圳)有限公司 一种基于安卓系统的多媒体文件处理方法及装置
CN104750688A (zh) * 2013-12-25 2015-07-01 鸿富锦精密工业(深圳)有限公司 照片管理方法及系统
CN105488074A (zh) * 2014-09-28 2016-04-13 小米科技有限责任公司 照片聚类的方法及装置
CN104965863B (zh) * 2015-06-05 2019-04-26 北京奇虎科技有限公司 一种对象聚类方法和装置
CN104965863A (zh) * 2015-06-05 2015-10-07 北京奇虎科技有限公司 一种对象聚类方法和装置
CN105472239B (zh) * 2015-11-17 2019-08-16 小米科技有限责任公司 照片处理方法及装置
CN105488156A (zh) * 2015-11-30 2016-04-13 广州一刻影像科技有限公司 一种自动选择电子相册模板并生成电子相册的方法
CN106855867A (zh) * 2015-12-09 2017-06-16 腾讯科技(深圳)有限公司 一种图片归档的方法及装置
CN106250907A (zh) * 2016-07-08 2016-12-21 大连大学 云计算环境基于过采样修正的大规模图像聚类方法
CN106326773A (zh) * 2016-08-29 2017-01-11 广东欧珀移动通信有限公司 一种照片加密管理的方法、装置及终端
CN106341402A (zh) * 2016-08-30 2017-01-18 中国民生银行股份有限公司 基于多架构分布式缓存的处理方法和装置
CN106341402B (zh) * 2016-08-30 2019-11-12 中国民生银行股份有限公司 基于多架构分布式缓存的处理方法和装置
WO2019218459A1 (zh) * 2018-05-14 2019-11-21 平安科技(深圳)有限公司 一种照片存储方法、存储介质、服务器和装置
CN108737758A (zh) * 2018-05-21 2018-11-02 深圳市沃特沃德股份有限公司 音视频记录方法和装置
CN109922209A (zh) * 2019-02-22 2019-06-21 维沃移动通信有限公司 一种照片管理方法及终端设备
CN109922209B (zh) * 2019-02-22 2021-03-05 维沃移动通信有限公司 一种照片管理方法及终端设备

Also Published As

Publication number Publication date
CN101510205B (zh) 2013-02-27

Similar Documents

Publication Publication Date Title
CN101510205B (zh) 实现相片自动聚类的方法、装置及系统
US20220004573A1 (en) Method for creating view-based representations from multimedia collections
CN101021855B (zh) 基于内容的视频检索系统
US8811755B2 (en) Detecting recurring events in consumer image collections
US9367757B2 (en) Content extracting device, content extracting method and program
EP2402867B1 (en) A computer-implemented method, a computer program product and a computer system for image processing
US8732161B2 (en) Event based organization and access of digital photos
CN102521253B (zh) 一种可视化的网络用户多媒体管理方法
US8718386B2 (en) Adaptive event timeline in consumer image collections
WO2008014408A1 (en) Method and system for displaying multimedia content
US9082452B2 (en) Method for media reliving on demand
US20140337324A1 (en) Visualizing digital images on a map
CN102150163B (zh) 交互式图像选择方法
US20100082653A1 (en) Event media search
EP2405371A1 (en) Method for grouping events detected in an image collection
US20050076056A1 (en) Method for clustering and querying media items
KR20070108195A (ko) 동적 사진 콜라주
CN110287346A (zh) 数据存储方法、装置、服务器及存储介质
de Figueirêdo et al. PhotoGeo: a photo digital library with spatial-temporal support and self-annotation
CN102236714A (zh) 一种基于xml的交互应用多媒体信息检索方法
Nair et al. Photo LOI: Browsing multi-user photo collections
US11080318B2 (en) Method for ranking and selecting events in media collections
Gu et al. Personal photo organization using event annotation
CN111581420A (zh) 一种基于Flink的医学图像实时检索方法
Smeaton Content vs. context for multimedia semantics: The case of sensecam image structuring: Invited keynote paper

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: GUANGZHOU YOUFU TECHNOLOGY CO., LTD.

Free format text: FORMER NAME: GUANGZHOU YOUFU DIGITAL TECHNOLOGY CO., LTD.

CP03 Change of name, title or address

Address after: 4, 1101 rooms, 5 rooms, 1, 3 and No. 1107B, Sheng Sheng Road, Baiyun District, Guangdong, Guangzhou, China

Patentee after: Guangzhou blessed Polytron Technologies Inc.

Address before: 510630, No. 4, No. 11-17, building A, 89 Zhongshan Avenue, Tianhe District, Guangdong, Guangzhou

Patentee before: GUANGZHOU YOUFU DIGITAL TECHNOLOGY Co.,Ltd.

C56 Change in the name or address of the patentee
CP03 Change of name, title or address

Address after: 510540 Guangzhou, Baiyun District, Guangdong Sheng Road, No. 1, No. 5, No. 4, building room 1101 1107B

Patentee after: TIANYI YOFUS TECHNOLOGY CO.,LTD.

Address before: Room 1, room 1107B, room, building 4, No. 5, No. 3, Sheng Sheng Road, Baiyun District, Guangzhou, China

Patentee before: Guangzhou blessed Polytron Technologies Inc.

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method for implementing automatically clustering photographs, apparatus and system

Effective date of registration: 20170728

Granted publication date: 20130227

Pledgee: China Co. truction Bank Corp Guangzhou Yuexiu branch

Pledgor: TIANYI YOFUS TECHNOLOGY CO.,LTD.

Registration number: 2017990000695

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 510000 Baiyun District, Guangzhou, Guangdong Province, 410 from five road.

Patentee after: TIANYI YOFUS TECHNOLOGY CO.,LTD.

Address before: 510540 self compiled 4 1101 rooms, 1107B room, 1, 3 and 5 of Ke Sheng Road, Baiyun District, Guangzhou, Guangdong

Patentee before: TIANYI YOFUS TECHNOLOGY CO.,LTD.

PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20180731

Granted publication date: 20130227

Pledgee: China Co. truction Bank Corp Guangzhou Yuexiu branch

Pledgor: TIANYI YOFUS TECHNOLOGY CO.,LTD.

Registration number: 2017990000695

PC01 Cancellation of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method for implementing automatically clustering photographs, apparatus and system

Effective date of registration: 20200610

Granted publication date: 20130227

Pledgee: Bank of Guangzhou Co.,Ltd. Taojin sub branch

Pledgor: TIANYI YOFUS TECHNOLOGY Co.,Ltd.

Registration number: Y2020440000133

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20210622

Granted publication date: 20130227

Pledgee: Bank of Guangzhou Co.,Ltd. Taojin sub branch

Pledgor: TIANYI YOFUS TECHNOLOGY Co.,Ltd.

Registration number: Y2020440000133

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: The method, device and system of realizing automatic clustering of photos

Effective date of registration: 20210628

Granted publication date: 20130227

Pledgee: Development Zone sub branch of Bank of Guangzhou Co.,Ltd.

Pledgor: TIANYI YOFUS TECHNOLOGY Co.,Ltd.

Registration number: Y2021440000221

PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20221118

Granted publication date: 20130227

Pledgee: Development Zone sub branch of Bank of Guangzhou Co.,Ltd.

Pledgor: TIANYI YOFUS TECHNOLOGY CO.,LTD.

Registration number: Y2021440000221

PC01 Cancellation of the registration of the contract for pledge of patent right