CN105447523A - 图片源相机型号的检测方法和装置 - Google Patents
图片源相机型号的检测方法和装置 Download PDFInfo
- Publication number
- CN105447523A CN105447523A CN201510846024.3A CN201510846024A CN105447523A CN 105447523 A CN105447523 A CN 105447523A CN 201510846024 A CN201510846024 A CN 201510846024A CN 105447523 A CN105447523 A CN 105447523A
- Authority
- CN
- China
- Prior art keywords
- picture
- camera model
- source camera
- sample set
- unknown
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Studio Devices (AREA)
Abstract
本发明公开了一种图片源相机型号的检测方法和装置。其中,该方法包括:获取图片样本,图片样本中包括已标注源相机型号的图片和未标注源相机型号的图片;使用K邻近算法对未标注源相机型号的图片进行未知源相机型号检测,获取未知源相机型号的图片样本集;使用已标注源相机型号的图片组成的已知源相机型号的图片样本集和未知源相机型号的图片样本集训练第一分类器;以及使用训练后的第一分类器对待检测图片的源相机型号进行检测。本发明解决了相关技术无法准确检测未知型号相机拍摄的图像的源相机型号的技术问题。
Description
技术领域
本发明涉及图像处理领域,具体而言,涉及一种图片源相机型号的检测方法和装置。
背景技术
如今,随着数字成像技术的发展和数码相机的普及,数字图像的使用在人们的日常生活中已经非常普遍。同时,数字图像也越来越多地被用来当作政府、法律、科学和新闻媒体组织做出某些决定的依据。因此,在这样的背景之下,识别数字图像的相机型号将会是一个基本需求,例如验证法庭上图像证据的原始来源,找到有版权争议图片的真正主人等等。
近年来,图片源相机型号识别技术有了长足的发展。现有相机型号识别方法主要有以下三种类型:基于图像元数据的、基于水印的和基于特征的相机型号识别方法。基于图像元数据的方法依赖于检查嵌入到图像元数据中的图像来源相关信息,如相机品牌、型号、日期和时间。包含在元数据中的日期和时间信息是和捕捉图像的时期和时间相关联的。基于水印的方法目标在于图像中嵌入水印,水印中会携带相关来源相机的信息。基于特征的方法首先提取的特征是内在硬件构件或者在图像采集过程中的软件相关特征,将识别作为一个多类别分类问题。然后使用多类分类器,如支持向量机,分类图像到已知相机模型的预定义分类中。
不过直到今天,图像来源相机型号识别技术仍然面临着许多难题和挑战,未知相机型号的图像的识别便是其中之一。以上三种识别方法在识别未知相机型号的图像时都面临着很大的困难:对于基于图像元数据的方法,在实践中图像元数据很容易被人为操纵;对于基于水印的方法而言,需要在图像的创建生成期间嵌入水印,这使得相机的设计变得更加复杂,进而增加了数码相机生产的成本;对于基于特征的识别方法,对于未知相机型号的检测是个问题。因此如何更准确的对来自未知相机型号的图像进行来源识别这一问题,在近年来成为研究的热点之一。
采用多分类器的传统识别方案受到未知相机型号问题的影响。在实际应用中,往往无法在事先获得所有的相机型号。此外,随着数码相机技术的快速发展,相机制造商不断地产生新的相机型号。当被检测图像是由事先未知的相机型号所拍摄时,传统的方案往往无法精确地将它们划分到已知相机型号中去,因此未知型号的问题会严重影响识别的精确度。
综上所述,目前针对未知型号相机拍摄的图像的源相机型号的识别技术仍然是亟待解决的问题之一,也是研究的热点之一。
针对相关技术无法准确检测未知型号相机拍摄的图像的源相机型号的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种图片源相机型号的检测方法和装置,以至少解决相关技术无法准确检测未知型号相机拍摄的图像的源相机型号的技术问题。
根据本发明实施例的一个方面,提供了一种图片源相机型号的检测方法,包括:获取图片样本,图片样本中包括已标注源相机型号的图片和未标注源相机型号的图片;使用K邻近算法对未标注源相机型号的图片进行未知源相机型号检测,获取未知源相机型号的图片样本集;使用已标注源相机型号的图片组成的已知源相机型号的图片样本集和未知源相机型号的图片样本集训练第一分类器;以及使用训练后的第一分类器对待检测图片的源相机型号进行检测。
进一步地,使用K邻近算法对未标注源相机型号的图片进行未知源相机型号检测,获取未知源相机型号的图片样本集包括:确定K邻近算法中的优化参数K;合并已标注源相机型号的图片和未标注源相机型号的图片,组成第一图片样本集;查找距离第一未标注源相机型号的图片最近的K个图片,其中,第一未标注源相机型号的图片为第一图片样本集中的任意一个未标注源相机型号的图片;在查找到的K个图片中不包括已标注源相机型号的图片的情况下,确定第一未标注源相机型号的图片为未知源相机型号的图片;以及将第一未标注源相机型号的图片添加至未知源相机型号的图片样本集。
进一步地,确定K邻近算法中的优化参数K包括:获取第二图片样本集,第二图片样本集由未标注源相机型号的图片以及第一子图片样本集组成,其中,第一子图片样本集为从已标注源相机型号的图片中选取预设数量的图片组成的样本集;设定优化参数K为第一数值;使用K邻近算法检测第二图片样本集中的图片的源相机型号;计算第一子图片样本集中未标注源相机型号的图片的数量与第一子图片样本集的图片数量的比值;在比值满足第一预设条件的情况下,确定第一数值为优化参数K;以及在比值不满足第一预设条件的情况下,调整优化参数K的值,返回执行使用K邻近算法检测第二图片样本集中的图片的源相机型号的步骤。
进一步地,在使用K邻近算法对未标注源相机型号的图片进行未知源相机型号检测,获取未知源相机型号的图片样本集之后,该方法还包括:使用迭代算法对未知源相机型号的图片样本集进行扩展,直到迭代算法满足预设停止条件时停止扩展未知源相机型号的图片样本集。
进一步地,使用迭代算法对未知源相机型号的图片样本集进行扩展包括:获取第三图片样本集和第二子图片样本集,第三图片样本集由已标注源相机型号的图片和未知源相机型号的图片样本集中的图片组成,第二子图片样本集由未标注源相机型号的图片中除未知源相机型号的图片样本集中的图片之外的图片组成;使用第三图片样本集训练第二分类器;使用第二分类器对第二子图片样本集中的图片进行分类,获取第二子图片样本集中的未知源相机型号的图片;判断第二分类器标注的未知源相机型号的图片的数量与未知源相机型号的图片样本集的图片数量的比值是否满足第二预设条件;在判断出满足第二预设条件时,更新未知源相机型号的图片样本集和第二子图片样本集,并将更新后的未知源相机型号的图片样本集作为未知源相机型号的图片样本集。
根据本发明实施例的另一方面,还提供了一种图片源相机型号的检测装置,包括:第一获取模块,用于获取图片样本,图片样本中包括已标注源相机型号的图片和未标注源相机型号的图片;第一检测模块,用于使用K邻近算法对未标注源相机型号的图片进行未知源相机型号检测,获取未知源相机型号的图片样本集;第一训练模块,用于使用已标注源相机型号的图片组成的已知源相机型号的图片样本集和未知源相机型号的图片样本集训练第一分类器;以及第二检测模块,用于使用训练后的第一分类器对待检测图片的源相机型号进行检测。
进一步地,第一检测模块包括:第一确定模块,用于确定K邻近算法中的优化参数K;合并模块,用于合并已标注源相机型号的图片和未标注源相机型号的图片,组成第一图片样本集;查找模块,用于查找距离第一未标注源相机型号的图片最近的K个图片,其中,第一未标注源相机型号的图片为第一图片样本集中的任意一个未标注源相机型号的图片;第二确定模块,用于在查找到的K个图片中不包括已标注源相机型号的图片的情况下,确定第一未标注源相机型号的图片为未知源相机型号的图片;以及添加模块,用于将第一未标注源相机型号的图片添加至未知源相机型号的图片样本集。
进一步地,第一确定模块包括:第二获取模块,用于获取第二图片样本集,第二图片样本集由未标注源相机型号的图片以及第一子图片样本集组成,其中,第一子图片样本集为从已标注源相机型号的图片中选取预设数量的图片组成的样本集;设定模块,用于设定优化参数K为第一数值;第三检测模块,用于使用K邻近算法检测第二图片样本集中的图片的源相机型号;计算模块,用于计算第一子图片样本集中未标注源相机型号的图片的数量与第一子图片样本集的图片数量的比值;第一子确定模块,用于在比值满足第一预设条件的情况下,确定第一数值为优化参数K;以及调整模块,用于在比值不满足第一预设条件的情况下,调整优化参数K的值,返回执行使用K邻近算法检测第二图片样本集中的图片的源相机型号的步骤。
进一步地,该装置还包括:扩展模块,用于使用迭代算法对未知源相机型号的图片样本集进行扩展,直到迭代算法满足预设停止条件时停止扩展未知源相机型号的图片样本集。
进一步地,扩展模块包括:第三获取模块,用于获取第三图片样本集和第二子图片样本集,第三图片样本集由已标注源相机型号的图片和未知源相机型号的图片样本集中的图片组成,第二子图片样本集由未标注源相机型号的图片中除未知源相机型号的图片样本集中的图片之外的图片组成;第二训练模块,用于使用第三图片样本集训练第二分类器;分类模块,用于使用第二分类器对第二子图片样本集中的图片进行分类,获取第二子图片样本集中的未知源相机型号的图片;判断模块,用于判断第二分类器标注的未知源相机型号的图片的数量与未知源相机型号的图片样本集的图片数量的比值是否满足第二预设条件;更新模块,用于在判断出满足第二预设条件时,更新未知源相机型号的图片样本集和第二子图片样本集,并将更新后的未知源相机型号的图片样本集作为未知源相机型号的图片样本集。
在本发明实施例中,采用获取图片样本,图片样本中包括已标注源相机型号的图片和未标注源相机型号的图片;使用K邻近算法对未标注源相机型号的图片进行未知源相机型号检测,获取未知源相机型号的图片样本集;使用已标注源相机型号的图片组成的已知源相机型号的图片样本集和未知源相机型号的图片样本集训练第一分类器;以及使用训练后的第一分类器对待检测图片的源相机信号进行检测的方式,解决了相关技术无法准确检测未知型号相机拍摄的图像的源相机型号的技术问题,实现了提高对未知型号相机拍摄的图像进行识别的精度的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的图片源相机型号的检测方法的流程图;
图2是根据本发明实施例的一种可选地图片源相机型号的检测方法的流程图;
图3是根据本发明实施例的图片源相机型号的检测流程的示意图;以及
图4是根据本发明实施例的图片源相机型号的检测装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本发明实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
K邻近算法,简称为KNN算法,即给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,就把该实例分类到这个类中。
根据本发明实施例,提供了一种图片源相机型号的检测的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的图片源相机型号的检测方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取图片样本,图片样本中包括已标注源相机型号的图片和未标注源相机型号的图片。
在步骤S102提供的方案中,图片样本为预先准备好的图片,可以包括已标注源相机型号的图片和未标注源相机型号的图片,其中,已标注源相机型号的图片为已知源相机型号的图片,在已标注源相机型号的图片中标注有该图片为哪款型号的相机所拍摄的图片。未标注源相机型号的图片中可以包括已知源相机型号的图片,也可以包括未知源相机型号的图片。
步骤S104,使用K邻近算法对未标注源相机型号的图片进行未知源相机型号检测,获取未知源相机型号的图片样本集。
可选地,步骤S104可以包括以下步骤:
步骤S1,确定K邻近算法中的优化参数K。其中,优化参数K直接决定了K邻近算法。
步骤S2,合并已标注源相机型号的图片和未标注源相机型号的图片,组成第一图片样本集。
步骤S3,查找距离第一未标注源相机型号的图片最近的K个图片,其中,第一未标注源相机型号的图片为第一图片样本集中的任意一个未标注源相机型号的图片。查找距离第一未标注源相机型号的图片最近的K个图片可以使用欧式距离作为标准。
步骤S4,在查找到的K个图片中不包括已标注源相机型号的图片的情况下,确定第一未标注源相机型号的图片为未知源相机型号的图片。
步骤S5,将第一未标注源相机型号的图片添加至未知源相机型号的图片样本集。
具体地,步骤S1确定K邻近算法中的优化参数K可以包括以下步骤:
步骤S11,获取第二图片样本集,第二图片样本集由未标注源相机型号的图片以及第一子图片样本集组成,其中,第一子图片样本集为从已标注源相机型号的图片中选取预设数量的图片组成的样本集。
步骤S12,设定优化参数K为第一数值。第一数值可以为1,第一数值为初始值,且第一数值可能是优化参数,也可能不是优化参数。
步骤S13,使用K邻近算法检测第二图片样本集中的图片的源相机型号。
步骤S14,计算第一子图片样本集中未标注源相机型号的图片的数量与第一子图片样本集的图片数量的比值。
其中,在比值满足第一预设条件的情况下,确定第一数值为优化参数K。其中,第一预设条件可以为该比值小于某个阈值,比如0.05。在比值不满足第一预设条件的情况下,调整优化参数K的值,返回执行使用K邻近算法检测第二图片样本集中的图片的源相机型号的步骤。其中,该实施例在判断出比值不满足第一预设条件的情况下,优选地将优化参数在第一数值的基础上加1,再返回执行步骤S13。
可选地,在步骤S104之后,该方法还可以包括:使用迭代算法对未知源相机型号的图片样本集进行扩展,直到迭代算法满足预设停止条件时停止扩展未知源相机型号的图片样本集。
具体地,使用迭代算法对未知源相机型号的图片样本集进行扩展可以包括以下步骤:
步骤S6,获取第三图片样本集和第二子图片样本集,第三图片样本集由已标注源相机型号的图片和未知源相机型号的图片样本集中的图片组成,第二子图片样本集由未标注源相机型号的图片中除未知源相机型号的图片样本集中的图片之外的图片组成。
步骤S7,使用第三图片样本集训练第二分类器。第二类分类器可以为基于SVM的多类分类器。
步骤S8,使用第二分类器对第二子图片样本集中的图片进行分类,获取第二子图片样本集中的未知源相机型号的图片。
步骤S9,判断第二分类器标注的未知源相机型号的图片的数量与未知源相机型号的图片样本集的图片数量的比值是否满足第二预设条件。第二预设条件可以为预先设置的对未知源相机型号的图片样本集停止扩展的停止条件。比如,第二预设条件可以是该比值小于某一阈值,比如1.5%。
步骤S10,在判断出满足第二预设条件时,更新未知源相机型号的图片样本集和第二子图片样本集,并将更新后的未知源相机型号的图片样本集作为未知源相机型号的图片样本集。
步骤S106,使用已标注源相机型号的图片组成的已知源相机型号的图片样本集和未知源相机型号的图片样本集训练第一分类器。
在步骤S106提供的方案中,根据通过步骤S1至步骤S10能够得到未知源相机型号的图片样本集以及已知源相机型号的图片样本集,对第一分类器进行训练,其中,第一分类器可以是(K+1)类分类器,已知源相机型号的图片为K类,未知源相机型号的图片为1类。
步骤S108,使用训练后的第一分类器对待检测图片的源相机型号进行检测。
在步骤S108提供的方案中,利用通过步骤S106训练得到第一分类器能够检测待检测图片的源相机型号。待检测图片可以为K类已知源相机型号的图片中的任意一类,也可以为未知源相机型号的图片。待检测图片的源相机型号可以为K类已知的源相机型号中的任意一类,也可以为未知源相机型号。
通过上述步骤,通过获取图片样本,图片样本中包括已标注源相机型号的图片和未标注源相机型号的图片;使用K邻近算法对未标注源相机型号的图片进行未知源相机型号检测,获取未知源相机型号的图片样本集;使用已标注源相机型号的图片组成的已知源相机型号的图片样本集和未知源相机型号的图片样本集训练第一分类器;以及使用训练后的第一分类器对待检测图片的源相机信号进行检测的方式,解决了相关技术无法准确检测未知型号相机拍摄的图像的源相机型号的技术问题,实现了提高对未知型号相机拍摄的图像进行识别的精度的技术效果。
本发明还提供了一种可选地图片源相机型号的检测方法实施例,图2是根据本发明实施例的一种可选地图片源相机型号的检测方法的流程图,如图2所示,该方法可以包括以下步骤:
步骤S202,输入已标注源相机型号的图片样本集P、未标注源相机型号的图片样本集Q以及优化参数K;
步骤S204,将未知源相机型号的图片样本集U设置为空集;
步骤S206,将P与Q合并成第一图片样本集T;
步骤S208,判断T中每个未标注源相机型号的图片I是否属于Q。其中,如果判断出I属于Q,则执行步骤S210;如果判断出I不属于Q,则执行步骤S216。
步骤S210,在欧式距离K下从T中查找距离I最近的图片,并将其标记为N’。
步骤S212,判断N’中是否包含P中的图片。其中,如果判断出N’中包含P中的图片,则执行步骤S216;如果判断出N’中不包含P中的图片,则执行步骤S214。
步骤S214,确定I为未知源相机型号的图片,并将I添加至U。
步骤S216,输出U。
图3是根据本发明实施例的图片源相机型号的检测流程的示意图,如图3所示,将已标注源相机型号的图片样本集和未标注源相机型号的图片样本集最为图片样本,通过确定优化参数K,使用K邻近算法对未标注源相机型号的图片样本集中的图片进行未知源相机型号检测,得到未知源相机型号的图片样本集。然后根据预先设置的停止准则,对未知源相机型号的图片样本集进行未知扩张的自我训练,得到扩张后的未知源相机型号的图片样本集。利用已标注源相机型号的图片样本集和扩张后的未知源相机型号的图片样本集训练(K+1)类分类器,利用训练好的(K+1)类分类器对待测试图片样本集中的图片检测源相机型号,得到并输出该图片的识别结果。
下面结合该可选地实施例对本发明做进一步说明:
假设训练数据集由两部分组成,一部分为已标注源相机型号的图片,设这部分数据集为P。P中共有1000张照片,其中500张照片来自相机型号A,有500张照片来自相机型号B。另有200张照片没有标注源相机型号,这部分数据集记为Q。注意这200张照片有可能来自型号A,有可能来自型号B,也有可能来自未知的源相机型号。
首先,检测未标注源相机型号的图片的源相机型号,得到未知源相机型号的图片样本集,具体地:
1、将P与Q合并为数据集T。
2、按下述步骤寻找最优参数K:
确定最优参数K的基本思路为:使用真正率曲线(TruePositiveRate,简称为TPR)与假正率曲线(FalsePositiveRate,简称为FPR)确定优化参数K,二者分别定义为:
当K从1逐渐增大时,TPR与FPR均呈单调下降的趋势。因此选择较小的FPR作为阈值,当FPR小于该阈值时停止增大K,以当前的K作为优化参数K。此外,因为在未标注源相机型号的图片样本集上,无法计算准确的FPR,因此需要构建新的图片样本集,即步骤S2中的第一图片样本集,在新的图片样本集上近似计算FPR,具体地:
(1)从图片集合P中随机选取100幅图片,作为集合ΔP,将ΔP与Q合并作为参数调优数据集P’,即
P=ΔP∪Q
(2)设定K=1。
(3)使用参数K,在参数调优数据集P’上运行基于未知源相机型号检测的KNN算法。
(4)使用如下公式计算近似FPR,记为FPR’:
(5)若FPR’低于某个阈值,例如0.05,则停止迭代,返回K,否则,令K=K+1,返回(3)继续迭代。
3、使用上一步得到的参数K,运行基于K近邻的检测算法,详细步骤如下:
(1)对于Q中的每一张图片,计算在数据集T中的距离最近的K幅图片。
(2)如果K幅图片中,没有任何一张图片是来自数据集P的,则认定该幅图片为未知源相机型号的图片。
(3)记用此方法检测到的所有的未知源相机型号的图片的集合为未知源相机型号的图片样本集U。
其次,对未知源相机型号的图片样本集进行扩展,具体地:
1、记已知源相机型号的图片样本集为P,由K近邻算法得到的未知源相机型号的图片样本集为U,剩余的未标注源相机型号的图片样本集为Q’,即:
Q’=Q-U
2、将数据集P与数据集U合并为数据集T,即
T=P∪U
3、使用临时训练数据集T训练SVM多类分类器Ci,i表示第i次迭代算法。
4、使用分类器Ci分类Q’,即剩余的未标注源相机型号的图片,记由分类器分类得到的未知源相机型号的图片集合为ΔU。
5、更新各个临时数据集:
U=U∪ΔU
Q′=Q′-ΔU
6、若满足迭代停止标准,则停止迭代,否则,使用新的U与Q’,返回第二步继续迭代。其中,迭代停止标准,可以包括如下内容:
使用数据增长率(Dataincreaserate,简称为DIR)作为衡量数据集扩展的幅度。每一步迭代之后的DIR定义如下:
当DIR小于事先设定的某一阈值时,视为满足停止标准,停止迭代。DIR阈值应当设为近似于0的某数值,如0.5%。
再次,使用已知源相机型号的图片和未知源相机型号的图片训练(K+1)类别的分类器。已知源相机型号的图片为K类(训练集中存在K种型号的相机),未知源相机型号的图片为1类,共(K+1)类。使用上述训练数据集,训练(K+1)类分类器。
至此,我们得到了来自相机A的图片500张,来自相机B的图片500张,以及来自未知源相机型号的图片若干张(即由上一步得到的数据集U)。
用这三个类别(相机A、相机B、未知相机)训练多类分类器,即(K+1)类别的分类器。
最后,利用训练好的(K+1)类别的分类器对待检测的图片进行识别。
对比现有技术,本发明利用基于未知源相机型号检测的K邻近法对未知源相机型号的样本图像进行识别,利用基于SVM的自我迭代训练方法(Bootstrapping)对未知型号的样本集进行扩展,从未被标记的训练数据集中去提取更多的未知源相机型号的样本图像。通过本发明,能够通过识别未知源相机型号的图像提高识别精度。
根据本发明实施例,还提供了一种图片源相机型号的检测的装置实施例,需要说明的是,该图片源相机型号的检测装置可以用于执行本发明实施例中的图片源相机型号的检测方法,本发明实施例中的图片源相机型号的检测方法可以在该图片源相机型号的检测装置中执行。
图4是根据本发明实施例的图片源相机型号的检测装置的示意图,如图4所示,该装置可以包括:
第一获取模块22,用于获取图片样本,图片样本中包括已标注源相机型号的图片和未标注源相机型号的图片;第一检测模块24,用于使用K邻近算法对未标注源相机型号的图片进行未知源相机型号检测,获取未知源相机型号的图片样本集;第一训练模块26,用于使用已标注源相机型号的图片组成的已知源相机型号的图片样本集和未知源相机型号的图片样本集训练第一分类器;以及第二检测模块28,用于使用训练后的第一分类器对待检测图片的源相机型号进行检测。
需要说明的是,该实施例中的第一获取模块22可以用于执行本申请实施例中的步骤S102,该实施例中的第一检测模块24可以用于执行本申请实施例一中的步骤S104,该实施例中的第一训练模块26可以用于执行本申请实施例一中的步骤S106,该实施例中的第二检测模块28可以用于执行本申请实施例一中的步骤S108。上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。
可选地,第一检测模块24可以包括:第一确定模块,用于确定K邻近算法中的优化参数K;合并模块,用于合并已标注源相机型号的图片和未标注源相机型号的图片,组成第一图片样本集;查找模块,用于查找距离第一未标注源相机型号的图片最近的K个图片,其中,第一未标注源相机型号的图片为第一图片样本集中的任意一个未标注源相机型号的图片;第二确定模块,用于在查找到的K个图片中不包括已标注源相机型号的图片的情况下,确定第一未标注源相机型号的图片为未知源相机型号的图片;以及添加模块,用于将第一未标注源相机型号的图片添加至未知源相机型号的图片样本集。
具体地,第一确定模块包括:第二获取模块,用于获取第二图片样本集,第二图片样本集由未标注源相机型号的图片以及第一子图片样本集组成,其中,第一子图片样本集为从已标注源相机型号的图片中选取预设数量的图片组成的样本集;设定模块,用于设定优化参数K为第一数值;第三检测模块,用于使用K邻近算法检测第二图片样本集中的图片的源相机型号;计算模块,用于计算第一子图片样本集中未标注源相机型号的图片的数量与第一子图片样本集的图片数量的比值;第一子确定模块,用于在比值满足第一预设条件的情况下,确定第一数值为优化参数K;以及调整模块,用于在比值不满足第一预设条件的情况下,调整优化参数K的值,返回执行使用K邻近算法检测第二图片样本集中的图片的源相机型号的步骤。
可选地,该装置还可以包括:扩展模块,用于使用迭代算法对未知源相机型号的图片样本集进行扩展,直到迭代算法满足预设停止条件时停止扩展未知源相机型号的图片样本集。
具体地,扩展模块可以包括:第三获取模块,用于获取第三图片样本集和第二子图片样本集,第三图片样本集由已标注源相机型号的图片和未知源相机型号的图片样本集中的图片组成,第二子图片样本集由未标注源相机型号的图片中除未知源相机型号的图片样本集中的图片之外的图片组成;第二训练模块,用于使用第三图片样本集训练第二分类器;分类模块,用于使用第二分类器对第二子图片样本集中的图片进行分类,获取第二子图片样本集中的未知源相机型号的图片;判断模块,用于判断第二分类器标注的未知源相机型号的图片的数量与未知源相机型号的图片样本集的图片数量的比值是否满足第二预设条件;更新模块,用于在判断出满足第二预设条件时,更新未知源相机型号的图片样本集和第二子图片样本集,并将更新后的未知源相机型号的图片样本集作为未知源相机型号的图片样本集。
通过该实施例的图片源相机型号的检测装置,基于未知源相机型号检测的K邻近算法对未知源相机型号的图片进行识别,利用自我迭代训练方法对未知源相机型号的图片样本集进行扩展,从未标注的源相机型号的图片样本集中去提取更多的未知源相机型号的图片,从而解决了相关技术无法准确检测未知型号相机拍摄的图像的源相机型号的技术问题,实现了提高对未知型号相机拍摄的图像进行识别的精度的技术效果。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种图片源相机型号的检测方法,其特征在于,包括:
获取图片样本,所述图片样本中包括已标注源相机型号的图片和未标注源相机型号的图片;
使用K邻近算法对所述未标注源相机型号的图片进行未知源相机型号检测,获取未知源相机型号的图片样本集;
使用所述已标注源相机型号的图片组成的已知源相机型号的图片样本集和所述未知源相机型号的图片样本集训练第一分类器;以及
使用训练后的第一分类器对待检测图片的源相机型号进行检测。
2.根据权利要求1所述的方法,其特征在于,使用K邻近算法对所述未标注源相机型号的图片进行未知源相机型号检测,获取未知源相机型号的图片样本集包括:
确定所述K邻近算法中的优化参数K;
合并所述已标注源相机型号的图片和所述未标注源相机型号的图片,组成第一图片样本集;
查找距离第一未标注源相机型号的图片最近的K个图片,其中,所述第一未标注源相机型号的图片为所述第一图片样本集中的任意一个所述未标注源相机型号的图片;
在查找到的K个图片中不包括所述已标注源相机型号的图片的情况下,确定所述第一未标注源相机型号的图片为未知源相机型号的图片;以及
将所述第一未标注源相机型号的图片添加至所述未知源相机型号的图片样本集。
3.根据权利要求2所述的方法,其特征在于,确定所述K邻近算法中的优化参数K包括:
获取第二图片样本集,所述第二图片样本集由所述未标注源相机型号的图片以及第一子图片样本集组成,其中,所述第一子图片样本集为从所述已标注源相机型号的图片中选取预设数量的图片组成的样本集;
设定所述优化参数K为第一数值;
使用所述K邻近算法检测所述第二图片样本集中的图片的源相机型号;
计算所述第一子图片样本集中未标注源相机型号的图片的数量与所述第一子图片样本集的图片数量的比值;
在所述比值满足第一预设条件的情况下,确定所述第一数值为优化参数K;以及
在所述比值不满足所述第一预设条件的情况下,调整所述优化参数K的值,返回执行使用所述K邻近算法检测所述第二图片样本集中的图片的源相机型号的步骤。
4.根据权利要求1所述的方法,其特征在于,在使用K邻近算法对所述未标注源相机型号的图片进行未知源相机型号检测,获取未知源相机型号的图片样本集之后,所述方法还包括:
使用迭代算法对所述未知源相机型号的图片样本集进行扩展,直到所述迭代算法满足预设停止条件时停止扩展所述未知源相机型号的图片样本集。
5.根据权利要求4所述的方法,其特征在于,使用迭代算法对所述未知源相机型号的图片样本集进行扩展包括:
获取第三图片样本集和第二子图片样本集,所述第三图片样本集由所述已标注源相机型号的图片和所述未知源相机型号的图片样本集中的图片组成,第二子图片样本集由所述未标注源相机型号的图片中除所述未知源相机型号的图片样本集中的图片之外的图片组成;
使用所述第三图片样本集训练第二分类器;
使用所述第二分类器对所述第二子图片样本集中的图片进行分类,获取所述第二子图片样本集中的未知源相机型号的图片;
判断所述第二分类器标注的未知源相机型号的图片的数量与未知源相机型号的图片样本集的图片数量的比值是否满足第二预设条件;
在判断出满足所述第二预设条件时,更新所述未知源相机型号的图片样本集和所述第二子图片样本集,并将更新后的未知源相机型号的图片样本集作为所述未知源相机型号的图片样本集。
6.一种图片源相机型号的检测装置,其特征在于,包括:
第一获取模块,用于获取图片样本,所述图片样本中包括已标注源相机型号的图片和未标注源相机型号的图片;
第一检测模块,用于使用K邻近算法对所述未标注源相机型号的图片进行未知源相机型号检测,获取未知源相机型号的图片样本集;
第一训练模块,用于使用所述已标注源相机型号的图片组成的已知源相机型号的图片样本集和所述未知源相机型号的图片样本集训练第一分类器;以及
第二检测模块,用于使用训练后的第一分类器对待检测图片的源相机型号进行检测。
7.根据权利要求6所述的装置,其特征在于,所述第一检测模块包括:
第一确定模块,用于确定所述K邻近算法中的优化参数K;
合并模块,用于合并所述已标注源相机型号的图片和所述未标注源相机型号的图片,组成第一图片样本集;
查找模块,用于查找距离第一未标注源相机型号的图片最近的K个图片,其中,所述第一未标注源相机型号的图片为所述第一图片样本集中的任意一个所述未标注源相机型号的图片;
第二确定模块,用于在查找到的K个图片中不包括所述已标注源相机型号的图片的情况下,确定所述第一未标注源相机型号的图片为未知源相机型号的图片;以及
添加模块,用于将所述第一未标注源相机型号的图片添加至所述未知源相机型号的图片样本集。
8.根据权利要求7所述的装置,其特征在于,所述第一确定模块包括:
第二获取模块,用于获取第二图片样本集,所述第二图片样本集由所述未标注源相机型号的图片以及第一子图片样本集组成,其中,所述第一子图片样本集为从所述已标注源相机型号的图片中选取预设数量的图片组成的样本集;
设定模块,用于设定所述优化参数K为第一数值;
第三检测模块,用于使用所述K邻近算法检测所述第二图片样本集中的图片的源相机型号;
计算模块,用于计算所述第一子图片样本集中未标注源相机型号的图片的数量与所述第一子图片样本集的图片数量的比值;
第一子确定模块,用于在所述比值满足第一预设条件的情况下,确定所述第一数值为优化参数K;以及
调整模块,用于在所述比值不满足所述第一预设条件的情况下,调整所述优化参数K的值,返回执行使用所述K邻近算法检测所述第二图片样本集中的图片的源相机型号的步骤。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
扩展模块,用于使用迭代算法对所述未知源相机型号的图片样本集进行扩展,直到所述迭代算法满足预设停止条件时停止扩展所述未知源相机型号的图片样本集。
10.根据权利要求9所述的装置,其特征在于,所述扩展模块包括:
第三获取模块,用于获取第三图片样本集和第二子图片样本集,所述第三图片样本集由所述已标注源相机型号的图片和所述未知源相机型号的图片样本集中的图片组成,第二子图片样本集由所述未标注源相机型号的图片中除所述未知源相机型号的图片样本集中的图片之外的图片组成;
第二训练模块,用于使用所述第三图片样本集训练第二分类器;
分类模块,用于使用所述第二分类器对所述第二子图片样本集中的图片进行分类,获取所述第二子图片样本集中的未知源相机型号的图片;
判断模块,用于判断所述第二分类器标注的未知源相机型号的图片的数量与未知源相机型号的图片样本集的图片数量的比值是否满足第二预设条件;
更新模块,用于在判断出满足所述第二预设条件时,更新所述未知源相机型号的图片样本集和所述第二子图片样本集,并将更新后的未知源相机型号的图片样本集作为所述未知源相机型号的图片样本集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510846024.3A CN105447523A (zh) | 2015-11-26 | 2015-11-26 | 图片源相机型号的检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510846024.3A CN105447523A (zh) | 2015-11-26 | 2015-11-26 | 图片源相机型号的检测方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105447523A true CN105447523A (zh) | 2016-03-30 |
Family
ID=55557682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510846024.3A Pending CN105447523A (zh) | 2015-11-26 | 2015-11-26 | 图片源相机型号的检测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105447523A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108710893A (zh) * | 2018-04-04 | 2018-10-26 | 中山大学 | 一种基于特征融合的数字图像相机源模型分类方法 |
CN111737519A (zh) * | 2020-06-09 | 2020-10-02 | 北京奇艺世纪科技有限公司 | 识别机器人账号的方法、装置、电子设备及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103400144A (zh) * | 2013-07-17 | 2013-11-20 | 山东师范大学 | 一种基于k近邻的支持向量机主动学习的方法 |
CN103426191A (zh) * | 2012-05-26 | 2013-12-04 | 百度在线网络技术(北京)有限公司 | 一种图片标注方法及系统 |
CN103617435A (zh) * | 2013-12-16 | 2014-03-05 | 苏州大学 | 一种主动学习图像分类方法和系统 |
CN103927394A (zh) * | 2014-05-04 | 2014-07-16 | 苏州大学 | 一种基于svm的多标签主动学习分类方法及系统 |
-
2015
- 2015-11-26 CN CN201510846024.3A patent/CN105447523A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103426191A (zh) * | 2012-05-26 | 2013-12-04 | 百度在线网络技术(北京)有限公司 | 一种图片标注方法及系统 |
CN103400144A (zh) * | 2013-07-17 | 2013-11-20 | 山东师范大学 | 一种基于k近邻的支持向量机主动学习的方法 |
CN103617435A (zh) * | 2013-12-16 | 2014-03-05 | 苏州大学 | 一种主动学习图像分类方法和系统 |
CN103927394A (zh) * | 2014-05-04 | 2014-07-16 | 苏州大学 | 一种基于svm的多标签主动学习分类方法及系统 |
Non-Patent Citations (1)
Title |
---|
HUANG Y等: "Camera Model Identification With Unknown Models", 《IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108710893A (zh) * | 2018-04-04 | 2018-10-26 | 中山大学 | 一种基于特征融合的数字图像相机源模型分类方法 |
CN111737519A (zh) * | 2020-06-09 | 2020-10-02 | 北京奇艺世纪科技有限公司 | 识别机器人账号的方法、装置、电子设备及计算机可读存储介质 |
CN111737519B (zh) * | 2020-06-09 | 2023-10-03 | 北京奇艺世纪科技有限公司 | 识别机器人账号的方法、装置、电子设备及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Radenović et al. | Revisiting oxford and paris: Large-scale image retrieval benchmarking | |
Philbin et al. | Lost in quantization: Improving particular object retrieval in large scale image databases | |
Sun et al. | Temporal localization of fine-grained actions in videos by domain transfer from web images | |
Zhao et al. | Scale-rotation invariant pattern entropy for keypoint-based near-duplicate detection | |
US7127106B1 (en) | Fingerprinting and recognition of data | |
CN102236675B (zh) | 图像特征点匹配对处理、图像检索方法及设备 | |
Yang et al. | Dynamic match kernel with deep convolutional features for image retrieval | |
Wu et al. | A comprehensive evaluation of local detectors and descriptors | |
Lim et al. | Scene recognition with camera phones for tourist information access | |
Liao et al. | IR feature embedded bof indexing method for near-duplicate video retrieval | |
CN111583180A (zh) | 一种图像的篡改识别方法、装置、计算机设备及存储介质 | |
Wang et al. | Attention-based deep metric learning for near-duplicate video retrieval | |
CN106529388A (zh) | 信息处理装置及其控制方法 | |
Mezaris et al. | Local invariant feature tracks for high-level video feature extraction | |
CN105447523A (zh) | 图片源相机型号的检测方法和装置 | |
Chiu et al. | Efficient and effective video copy detection based on spatiotemporal analysis | |
CN105488529A (zh) | 图片的源相机型号的识别方法和装置 | |
Imran et al. | Event recognition from photo collections via pagerank | |
Bai et al. | Multiple stage residual model for accurate image classification | |
Mallick et al. | Video retrieval using salient foreground region of motion vector based extracted keyframes and spatial pyramid matching | |
Kordopatis-Zilos et al. | Finding near-duplicate videos in large-scale collections | |
CN111738173A (zh) | 视频片段检测方法、装置、电子设备及存储介质 | |
Nguyen et al. | Video instance search via spatial fusion of visual words and object proposals | |
Yang et al. | Scene classification-oriented saliency detection via the modularized prescription | |
Al-Qershi et al. | Comparison of matching methods for copy-move image forgery detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160330 |
|
RJ01 | Rejection of invention patent application after publication |