CN111475666B

CN111475666B - 一种基于稠密向量的媒体精准匹配方法及系统

Info

Publication number: CN111475666B
Application number: CN202010228115.1A
Authority: CN
Inventors: 谢华腾; 董淳光; 邱华东
Original assignee: Shenzhen Mohist Security Technology Co ltd
Current assignee: Shenzhen Mohist Security Technology Co ltd
Priority date: 2020-03-27
Filing date: 2020-03-27
Publication date: 2023-10-10
Anticipated expiration: 2040-03-27
Also published as: CN111475666A

Abstract

本发明公开了一种基于稠密向量的媒体精准匹配方法，其包括如下步骤：步骤S1，利用预设模型对目标媒体进行特征提取；步骤S2，构建对稠密向量提供相似度搜索和聚类的框架；步骤S3，利用所述框架对预设媒体库中的海量特征向量进行相似性搜索，得到相似媒体集；步骤S4，从所述媒体库中抽取干扰媒体，得到干扰媒体集；步骤S5，将所述相似媒体集和所述干扰媒体集同步输入至预设的检索引擎，将所述干扰媒体集中的干扰媒体混入所述相似媒体集，从而降低所述相似媒体集中非匹配媒体与所述目标媒体的近似度。本发明能够在媒体检索过程中减少过拟合现象，进而提高检索精度。

Description

一种基于稠密向量的媒体精准匹配方法及系统

技术领域

本发明涉及图片、视频等媒体的匹配检索方法，尤其涉及一种基于稠密向量的媒体精准匹配方法及系统。

背景技术

目前，随着计算机视觉技术的不断发展，媒体检索技术也得到一定程度的进步，以图片检索为例，从海量图片库中检索与目标图片相近图片的方法越来越多，此类检索方法所依托的机器学习算法和深度学习算法也随之得到了发展。

传统的图像检索方法中，首先需要对目标图片进行特征提取，常用的方法有SIFT特征和SURF特征等。在对图像进行特征提取和编码处理后，再利用特征或编码进行相似度计算，根据所需要的鲁棒性，设定阈值，筛选最佳匹配图片或是精确匹配的图片。其中，相似度匹配有很多的算法研究，对在一定范围内的缩放、旋转、裁剪、修改的图片，由于特征匹配经常存在误匹配，即非匹配点误匹配成匹配点，导致出现过拟合的现象，匹配精度和准确度较低。

发明内容

本发明要解决的技术问题在于，针对现有技术的不足，提供一种能够在媒体检索过程中减少过拟合现象，进而提高检索精度的基于稠密向量的媒体精准匹配方法及系统。

为解决上述技术问题，本发明采用如下技术方案。

一种基于稠密向量的媒体精准匹配方法，其包括如下步骤：步骤S1，利用预设模型对目标媒体进行特征提取；步骤S2，构建对稠密向量提供相似度搜索和聚类的框架；步骤S3，利用所述框架对预设媒体库中的海量特征向量进行相似性搜索，得到相似媒体集；步骤S4，从所述媒体库中抽取干扰媒体，得到干扰媒体集；步骤S5，将所述相似媒体集和所述干扰媒体集同步输入至预设的检索引擎，将所述干扰媒体集中的干扰媒体混入所述相似媒体集，从而降低所述相似媒体集中非匹配媒体与所述目标媒体的近似度。

优选地，所述媒体库为图片库、视频库、音频库或者文字库，所述目标媒体为图片、视频、音频或者文字。

优选地，所述步骤S1中，对目标媒体进行特征提取的方法为HOG算法、SIFT算法、SURF算法、ORB算法、LBP算法、HAAR算法和哈希码算法中的任意一种。

优选地，所述媒体库包括但不限于ImageNet数据库和IMDB-WIKI-500k-face数据库。

优选地，还包括对所述干扰媒体集进行动态调整的步骤。

一种基于稠密向量的媒体精准匹配系统，所述系统用于实现上述方法。

本发明公开的基于稠密向量的媒体精准匹配方法中，在搜索得到相似媒体集之后，抽取了干扰媒体集，该干扰媒体集针对媒体集库做了泛类型的媒体集抽取，在固化干扰媒体集后，把相似媒体集与干扰媒体集的特征一并输入检索引擎，由于整个输入媒体集中混入了干扰媒体，使得极度相似而非匹配的媒体特征得到一定范围的弱化，其等同于拉开非匹配媒体了与目标媒体的相似程度，有效降低了算法的过拟合现象，使模型的检索精度大大提高。

附图说明

图1为本发明媒体精准匹配方法的流程图；

图2为本发明第一实施例中引入干扰媒体集后的效果示意图。

具体实施方式

下面结合附图和实施例对本发明作更加详细的描述。

本发明公开了一种基于稠密向量的媒体精准匹配方法，请参见图1，其包括如下步骤：

步骤S1，利用预设模型对目标媒体进行特征提取；

步骤S2，构建对稠密向量提供相似度搜索和聚类的框架；

步骤S3，利用所述框架对预设媒体库中的海量特征向量进行相似性搜索，得到相似媒体集；

步骤S4，从所述媒体库中抽取干扰媒体，得到干扰媒体集；

步骤S5，将所述相似媒体集和所述干扰媒体集同步输入至预设的检索引擎，将所述干扰媒体集中的干扰媒体混入所述相似媒体集，从而降低所述相似媒体集中非匹配媒体与所述目标媒体的近似度。

上述方法中，以检索图片媒体为例，首先使用模型抽取图像特征，然后使用对稠密向量提供高效相似度搜索和聚类的框架，该框架的特点是能够针对海量特征向量的相似性进行快速搜索。在搜索过程中，要检索出与目标原图绝对匹配的图片具有一定难度，原因是海量图库里可能包含大量与原图极度相似而非匹配图的图片，在使用算法去检索匹配图时，容易出现过拟合的情况，难以寻找到一个适合的求得一个高鲁棒性的匹配阈值。对此，本发明抽取了干扰图集，该干扰图集针对图库做了泛类型的图片抽取，在固化了干扰图集后，把相似图集与干扰图集的特征一并输入检索引擎，由于整个输入图集中混入了干扰图，使得极度相似图而非匹配的图片特征得到一定范围的弱化，其等同于拉开非匹配图片了与原图的相似程度，有效降低了算法的过拟合现象，使模型的检索精度大大提高。

本发明可以针对多种媒体进行检索，通过引用上述干扰媒体集，挤除一些相似而非匹配的媒体特征点，从而实现更精准的匹配，因此，在实际应用中，所述媒体库可以是图片库、视频库、音频库或者文字库，所述目标媒体可以是图片、视频、音频或者文字。

作为一种优选方式，所述步骤S1中，对目标媒体进行特征提取的方法为HOG算法、SIFT算法、SURF算法、ORB算法、LBP算法、HAAR算法和哈希码算法中的任意一种。

本实施例中，所述媒体库包括但不限于ImageNet数据库和IMDB-WIKI-500k-face数据库。

为了满足实时调整的灵活性要求，本实施例还包括对所述干扰媒体集进行动态调整的步骤。

在实际应用中，本实施例还涉及一种基于稠密向量的媒体精准匹配系统，所述系统用于实现上述方法。

本发明公开的基于稠密向量的媒体精准匹配方法及系统，其实际处理过程可以参考如下实施例。

实施例一

请参见图2，在一个包含图集(A、B、C、D、E、F)中检索原图的任务里，图片A的特征为[A1 A2 A3 A4…]，在没有加入干扰图的情况下，先把图集的特征输入稠密向量检索引擎，在设置好阈值N(对匹配度最高的前N点敏感)的情况下，检索结果为A、C、D、E，假设只有A、C是真正与原图匹配的，而D、E被检索出来，是因为D、E是跟原图非常相似，与原图的特征点达到了匹配标准，这种情况下整个模型是存在过拟合现象。

针对上述过拟合现象问题，本实施例引入干扰图集(G、H、I、J、K…)，如图2所示，在引入干扰图集后，同样是设置对匹配度最高的前N点特征敏感，干扰图集的特征点能对敏感的特征点起到一定的缓冲作用，在上面的例子里，由于干扰图集的参与，D、E的匹配特征点被排挤了部分，导致最终结果D、E与原图达不到匹配程度，而被剔除在外，在一定程度上解决了模型过拟合现象，提高了模型的精度。

进一步地，在提取过程中，如果干扰集为1万张，分类有1000种(譬如人脸、家具、交通工具、动物、生物之类)，每种分类可按比例抽取10张，从而完成提取。对于调整过程，可根据检索效果，增删个别类型的图像。

实际应用中，当干扰图集固化后，能节省大量的特征提取时间，有效提高了算法的运行效率，此外，根据任务需要，也可以动态调整干扰图集，从而提高应用灵活性。

本发明公开的基于稠密向量的媒体精准匹配方法及系统，其相比现有技术而言的有益效果在于，本发明能消减过拟合现象，同时可以把计算时间控制在可应用范围内，大大提高了媒体匹配的准确度。

以上所述只是本发明较佳的实施例，并不用于限制本发明，凡在本发明的技术范围内所做的修改、等同替换或者改进等，均应包含在本发明所保护的范围内。

Claims

1.一种基于稠密向量的媒体精准匹配方法，其特征在于，包括如下步骤：

步骤S1，利用预设模型对目标媒体进行特征提取；

步骤S2，构建对稠密向量提供相似度搜索和聚类的框架；

步骤S4，从所述媒体库中抽取干扰媒体，得到干扰媒体集；

步骤S5，将所述相似媒体集和所述干扰媒体集同步输入至预设的检索引擎，将所述干扰媒体集中的干扰媒体混入所述相似媒体集，从而降低所述相似媒体集中非匹配媒体与所述目标媒体的近似度；

所述媒体库为图片库、视频库、音频库或者文字库，所述目标媒体为图片、视频、音频或者文字；

所述步骤S1中，对目标媒体进行特征提取的方法为HOG算法、SIFT算法、SURF算法、ORB算法、LBP算法、HAAR算法和哈希码算法中的任意一种；

所述媒体库包括但不限于ImageNet数据库和IMDB-WIKI-500k-face数据库；

还包括对所述干扰媒体集进行动态调整的步骤。

2.一种基于稠密向量的媒体精准匹配系统，其特征在于，所述系统用于实现权利要求1所述的方法。