CN109447023B - 确定图像相似度的方法、视频场景切换识别方法及装置 - Google Patents
确定图像相似度的方法、视频场景切换识别方法及装置 Download PDFInfo
- Publication number
- CN109447023B CN109447023B CN201811327209.3A CN201811327209A CN109447023B CN 109447023 B CN109447023 B CN 109447023B CN 201811327209 A CN201811327209 A CN 201811327209A CN 109447023 B CN109447023 B CN 109447023B
- Authority
- CN
- China
- Prior art keywords
- block
- similarity
- characteristic point
- feature point
- point pair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 230000002596 correlated effect Effects 0.000 claims abstract description 42
- 230000000875 corresponding effect Effects 0.000 claims description 171
- 239000011159 matrix material Substances 0.000 claims description 73
- 238000004364 calculation method Methods 0.000 claims description 36
- 238000013507 mapping Methods 0.000 claims description 35
- 238000004891 communication Methods 0.000 claims description 32
- 230000006870 function Effects 0.000 claims description 24
- 238000005192 partition Methods 0.000 claims description 20
- 230000008859 change Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 9
- 239000000463 material Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/48—Matching video sequences
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供了一种确定图像相似度的方法、视频场景切换识别方法及装置,其中,所述确定图像相似度的方法包括:将获取的视频数据中的本帧图像的第一特征点集,与对比帧图像的第二特征点集之间相匹配的特征点,作为关联特征点对集;获取第一特征点集与第二特征点集之间不匹配的特征点的预设相似度;基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度;关联特征点对集的相似度分别与关联特征点对集的数量呈正相关,与关联特征点对集的欧式距离呈负相关;将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度。
Description
技术领域
本发明涉及视频处理技术领域,特别是涉及一种确定图像相似度的方法、视频场景切换识别方法及装置。
背景技术
随着多媒体信息数据的发展,目前影视剧等视频数据在制作过程中,会将不同场景的不同摄影角度的视频片段进行组合,运用不同镜头语言表达不同的情绪和传递多样关系。在制作过程中,往往需要对不同场景的视频片段进行分割,对不同场景的视频片段配置不同的颜色修复参数,比如,在老电影的修复项目中需要对不同场景的视频片段配置不同的颜色修复参数,这样就需要识别出视频的场景切换。
目前相关技术中的确定图像相似度的方法,主要步骤包括:通过将视频数据相邻两帧图像进行整帧比较,如果相邻两视频帧的场景变化率超过预设阈值,则认为视频场景切换。比如,某发言人在户外发言,期间发言人不变,但是由于在户外,有不停走动的人群及车辆等变化因素,这样移动的背景会不断变化,相邻两视频帧的场景变化率可能很高,相当于与发言人不相干的变化因素,对视频场景切换造成较大的影响。而实际上发言人的场景并没有变化,因此,在识别视频场景切换过程中,使用这些与发言人不相干的变化因素增大场景变化率,使得相邻两视频帧的场景变化率与实际场景的场景变化率存在较大差异。
发明内容
本发明实施例的目的在于提供一种确定图像相似度的方法、视频场景切换识别方法及装置,用以解决现有技术中相邻两视频帧的场景变化率与实际场景的场景变化率存在较大差异的技术问题。具体技术方案如下:
第一方面,本发明实施提供了一种确定图像相似度的方法,所述方法包括:
获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;
获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;
基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;
将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度。
进一步的,所述获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,包括:
对所述本帧图像进行均匀区块划分,得到两个以上第一区块;
对所述第一区块进行特征提取,得到所述第一区块中的特征点集;
将所述第一区块中的特征点集作为第一特征点集;
对所述对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;
对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;
将所述各第一区块对应的第二区块的特征点集作为第二特征点集;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。
进一步的,所述基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,包括:
基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,利用预设相似度计算公式,计算所述关联特征点对集的相似度,其中,所述预设相似度计算公式中包含第一调整系数和第二调整系数,所述第一调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述第二调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关。
进一步的,所述预设相似度计算公式为
式中,所述sij表示第i行第j列的第一区块以及所述第一区块对应的第二区块的相似度,所述为映射函数,所述映射函数用于将映射到[0,1]的取值范围内,使得sij处于[0,1]的取值范围内,l表示所述关联特征点对集的总数,k表示关联特征点对的序号,1≤k≤l,所述l表示所述关联特征点对集的总数,P表示所述关联特征点对集,A表示由本帧图像生成的numpy矩阵中的第一区块,B表示由对比帧图像生成的numpy矩阵中的第二区块,表示所述本帧图像生成的numpy矩阵以及对比帧图像生成的numpy矩阵的第k关联特征点对,表示第k关联特征点对中位于本帧图像生成的numpy矩阵中的特征点;表示第k关联特征点对中位于对比帧图像生成的numpy矩阵中的特征点,所述x表示特征点的水平坐标,所述y表示特征点的垂直坐标,(x,y)表示关联特征点对集中的任一关联特征点对,所述i表示行的序号,表示的取值范围为到并且i取的值,不取的值,j表示列的序号,表示的取值范围为到并且j取的值,不取的值,所述h为图像的高,所述w为图像的宽,所述h为图像的横向划分个数,所述wb为图像的纵向划分个数,所述Aij表示由所述本帧图像生成的numpy矩阵中第i行j列的第一区块,所述Bij表示由所述对比帧图像生成的numpy矩阵中第i行j列第一区块对应的第二区块,Θ表示所述第二调整系数,0<<1,τ表示所述第一调整系数,0<<1。
进一步的,所述将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度,包括:
针对每个第一区块和所述第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为所述第一区块和所述第一区块对应的第二区块之间的相似度;
将所述第一区块和所述第一区块对应的第二区块之间的相似度,作为区块匹配相似度;
针对所有第一区块和所述第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为所述本帧图像和所述对比帧图像之间的全局特征相似度。
进一步的,采用如下公式,将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度:
其中,s为所述本帧图像和所述对比帧图像之间的全局特征相似度,所述为映射函数,为图像的纵向划分个数,h为图像的横向划分个数,1≤i≤wb,1≤j≤hb,所述sij表示第i行第j列的第一区块以及所述第一区块对应的第二区块的相似度。
第二方面,本发明实施提供了一种视频场景切换识别方法,所述方法包括:
获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;
获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;
基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;
将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度;
如果所述全局特征相似度小于预设值,则识别出所述本帧图像相对于所述对比帧图像发生视频场景切换。
进一步的,所述获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,包括:
对所述本帧图像进行均匀区块划分,得到两个以上第一区块;
对所述第一区块进行特征提取,得到所述第一区块中的特征点集;
将所述第一区块中的特征点集作为第一特征点集;
对所述对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;
对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;
将所述各第一区块对应的第二区块的特征点集作为第二特征点集;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。
进一步的,所述基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,包括:
基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,利用预设相似度计算公式,计算所述关联特征点对集的相似度,其中,所述预设相似度计算公式中包含第一调整系数和第二调整系数,所述第一调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述第二调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关。
进一步的,所述预设相似度计算公式为
式中,所述sij表示第i行第j列的第一区块以及所述第一区块对应的第二区块的相似度,所述为映射函数,所述映射函数用于将映射到[0,1]的取值范围内,使得sij处于[0,1]的取值范围内,l表示所述关联特征点对集的总数,k表示关联特征点对的序号,1≤k≤l,所述l表示所述关联特征点对集的总数,P表示所述关联特征点对集,A表示由本帧图像生成的numpy矩阵,B表示由对比帧图像生成的numpy矩阵,表示所述本帧图像生成的numpy矩阵以及对比帧图像生成的numpy矩阵的第k关联特征点对,表示第k关联特征点对中位于本帧图像生成的numpy矩阵中的特征点;表示第k关联特征点对中位于对比帧图像生成的numpy矩阵中的特征点,(x,y)表示关联特征点对集中的任一关联特征点对,所述i表示行的序号,表示的取值范围为到并且i取的值,不取的值,j表示列的序号,表示的取值范围为到并且j取的值,不取的值,所述h为图像的高,所述w为图像的宽,所述h为图像的横向划分个数,所述wb为图像的纵向划分个数,所述Aij表示由所述本帧图像生成的numpy矩阵中第i行j列的第一区块,所述Bij表示由所述对比帧图像生成的numpy矩阵中第i行j列第一区块对应的第二区块,Θ表示所述第二调整系数,0<Θ<1,τ表示所述第一调整系数,0<τ<1。
进一步的,所述将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度,包括:
针对每个第一区块和所述第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为所述第一区块和所述第一区块对应的第二区块之间的相似度;
将所述第一区块和所述第一区块对应的第二区块之间的相似度,作为区块匹配相似度;
针对所有第一区块和所述第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为所述本帧图像和所述对比帧图像之间的全局特征相似度。
进一步的,采用如下公式,将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度:
其中,S为所述本帧图像和所述对比帧图像之间的全局特征相似度,所述为映射函数,wb为图像的纵向划分个数,hb为图像的横向划分个数,1≤i≤wb,1≤j≤hb,所述sij表示第i行第j列的第一区块以及所述第一区块对应的第二区块的相似度。
第三方面,本发明实施提供一种确定图像相似度的装置,所述装置包括:
第一获取模块,用于获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;
第二获取模块,用于获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;
计算模块,用于基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;
获得模块,用于将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度。
进一步的,所述第一获取模块,用于:
对所述本帧图像进行均匀区块划分,得到两个以上第一区块;
对所述本帧图像进行均匀区块划分,得到两个以上第一区块;
对所述第一区块进行特征提取,得到所述第一区块中的特征点集;
将所述第一区块中的特征点集作为第一特征点集;
对所述对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;
对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;
将所述各第一区块对应的第二区块的特征点集作为第二特征点集;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。
进一步的,所述计算模块,用于:
基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,利用预设相似度计算公式,计算所述关联特征点对集的相似度,其中,所述预设相似度计算公式中包含第一调整系数和第二调整系数,所述第一调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述第二调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关。
进一步的,所述获得模块,用于:
针对每个第一区块和所述第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为所述第一区块和所述第一区块对应的第二区块之间的相似度;
将所述第一区块和所述第一区块对应的第二区块之间的相似度,作为区块匹配相似度;
针对所有第一区块和所述第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为所述本帧图像和所述对比帧图像之间的全局特征相似度。
第四方面,本发明实施提供一种视频场景切换识别装置,所述装置包括:
第一获取模块,用于获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;
第二获取模块,用于获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;
计算模块,用于基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;
获得模块,用于将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度;
识别模块,用于如果所述全局特征相似度小于预设值,则识别出所述本帧图像相对于所述对比帧图像发生视频场景切换。
进一步的,所述第一获取模块,用于:
对所述本帧图像进行均匀区块划分,得到两个以上第一区块;
对所述本帧图像进行均匀区块划分,得到两个以上第一区块;
对所述第一区块进行特征提取,得到所述第一区块中的特征点集;
将所述第一区块中的特征点集作为第一特征点集;
对所述对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;
对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;
将所述各第一区块对应的第二区块的特征点集作为第二特征点集;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。
进一步的,所述计算模块,用于:
基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,利用预设相似度计算公式,计算所述关联特征点对集的相似度,其中,所述预设相似度计算公式中包含第一调整系数和第二调整系数,所述第一调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述第二调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关。
进一步的,所述获得模块,用于:
针对每个第一区块和所述第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为所述第一区块和所述第一区块对应的第二区块之间的相似度;
将所述第一区块和所述第一区块对应的第二区块之间的相似度,作为区块匹配相似度;
针对所有第一区块和所述第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为所述本帧图像和所述对比帧图像之间的全局特征相似度。
第五方面,本发明实施提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面所述的方法步骤。
第六方面,本发明实施提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第二方面所述的方法步骤。
第七方面,本发明实施提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面任一的方法。
第八方面,本发明实施提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第二方面任一的方法。
第九方面,本发明实施还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面任一的方法。
第十方面,本发明实施还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第二方面任一的方法。
本发明实施例提供的一种确定图像相似度的方法,将获取的视频数据中的本帧图像的第一特征点集,与对比帧图像的第二特征点集之间相匹配的特征点,作为关联特征点对集;获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度;基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度,关联特征点对集的相似度分别与所述关联特征点对集的数量呈正相关,与所述关联特征点对集的欧式距离呈负相关;将预设相似度与关联特征点对集的相似度的加权平均,确定为本帧图像和对比帧图像之间的全局特征相似度。
由此可见,将第一特征点集与第二特征点集之间不匹配的特征点的相似度,设置为最小相似度,然后在计算全局特征相似度时,相当于并未使用不匹配的特征点的相似度,说明减少了不匹配的特征点的影响;并且,基于与关联特征点对集的相似度呈负相关的关联特征点对集的欧式距离,来计算关联特征点对集的相似度,说明减少距离较远的关联特征点的影响;以及基于与关联特征点对集的相似度呈正相关的关联特征点对集的数量,来计算关联特征点对集的相似度,说明关联特征点对集的数量越多,本帧图像与对比帧图像越相似,越需要提高较多的关联特征点对集的影响,相较于现有技术,本发明实施例的关联特征点对集的相似度与实际场景的相似度更加接近,更加准确,进而计算的本帧图像和对比帧图像之间的全局特征相似度,相较于现有技术更加准确。
本发明实施例还提供的一种确定图像相似度的方法视频场景切换识别方法及装置,将获取的视频数据中的本帧图像的第一特征点集,与对比帧图像的第二特征点集之间相匹配的特征点,作为关联特征点对集;获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度;基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度,关联特征点对集的相似度分别与所述关联特征点对集的数量呈正相关,与所述关联特征点对集的欧式距离呈负相关;将预设相似度与关联特征点对集的相似度的加权平均,确定为本帧图像和对比帧图像之间的全局特征相似度;如果所述全局特征相似度小于预设值,则识别出所述本帧图像相对于所述对比帧图像发生视频场景切换。
由此可见,将第一特征点集与第二特征点集之间不匹配的特征点的相似度,设置为最小相似度,然后在计算全局特征相似度时,相当于并未使用不匹配的特征点的相似度,说明减少了不匹配的特征点的影响;并且,基于与关联特征点对集的相似度呈负相关的关联特征点对集的欧式距离,来计算关联特征点对集的相似度,说明减少距离较远的关联特征点的影响;以及基于与关联特征点对集的相似度呈正相关的关联特征点对集的数量,来计算关联特征点对集的相似度,说明关联特征点对集的数量越多,本帧图像与对比帧图像越相似,越需要提高较多的关联特征点对集的影响,相较于现有技术,本发明实施例的关联特征点对集的相似度与实际场景的相似度更加接近,更加准确,进而计算的本帧图像和对比帧图像之间的全局特征相似度,相较于现有技术更加准确。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要的附图作简单地介绍。
图1为本发明实施例提供的确定图像相似度的方法的第一流程示意图;
图2为本发明实施例提供确定图像相似度的方法的第二流程示意图;
图3为本发明实施例提供确定图像相似度的方法的整体实现流程示意图;
图4为本发明实施例的确定图像相似度的方法的第三流程示意图;
图5为本发明实施例的确定图像相似度的方法的第四流程示意图;
图6为本发明实施例的输出视频源素材中发生视频场景切换的图像的具体实现流程示意图;
图7为本发明实施例的确定图像相似度的装置的第一结构示意图;
图8为本发明实施例的确定图像相似度的装置的第二结构示意图;
图9为本发明实施例提供的电子设备的第一结构示意图;
图10为本发明实施例提供的电子设备的第二结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
针对现有技术的相邻两视频帧的场景变化率与实际场景的场景变化率存在较大差异的问题,本发明实施例提供一种确定图像相似度的方法及装置,采用如下步骤,识别出视频数据中本帧图像相对于对比帧图像发生的视频场景切换:
将获取的视频数据中的本帧图像的第一特征点集,与对比帧图像的第二特征点集之间相匹配的特征点,作为关联特征点对集;获取第一特征点集与第二特征点集之间不匹配的特征点的预设相似度;基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度;关联特征点对集的相似度分别与关联特征点对集的数量呈正相关,与关联特征点对集的欧式距离呈负相关;将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度。
由此可见,在计算全局特征相似度时,将第一特征点集与第二特征点集之间不匹配的特征点的相似度,设置为最小相似度,相当于并未使用不匹配的特征点的相似度,说明减少了不匹配的特征点的影响;并且,关联特征点对集的数量越多,说明本帧图像与对比帧图像越相似,越需要提高数量较多的关联特征点对集的影响,以及关联特征点对集距离越远,说明本帧图像与对比帧图像越相似越不相似,越需要减少距离较远的关联特征点的影响,因此相较于现有技术,基于关联特征点对集的欧式距离以及关联特征点对集的数量,计算的关联特征点对集的相似度更加接近于实际场景的相似度,更加准确,进而计算的本帧图像和对比帧图像之间的全局特征相似度更加准确。
下面首先对本发明实施例提供的一种确定图像相似度的方法进行介绍。
本发明实施例所提供的一种确定图像相似度的方法,应用于电子设备。进一步的,应用于电子设备的视频播放器,比如PC(personal computer,个人计算机端)上用于视频播放的APP(Application,应用程序),以及客户端上用于视频播放的APP。
参见图1,图1为本发明实施例提供的确定图像相似度的方法的第一流程示意图。本发明实施例所提供的确定图像相似度的方法,可以包括如下步骤:
步骤110,获取视频数据中本帧图像的第一特征点集,与视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将第一特征点集与第二特征点集相匹配的特征点,作为关联特征点对集,对比帧图像与本帧图像属于不同帧的图像。
其中,上述视频数据21可以包括拍摄的完整视频,或者拍摄的部分视频,参见3所示。示例性的,视频数据可以是精剪后的完整视频节目,上述对比帧图像23可以为完整视频节目中本帧图像22之前相邻的一帧图像,或者可以为完整视频节目中本帧图像22之前,且与本帧图像22之间存在预设间隔帧的一帧图像,又或者可以为完整视频节目中本帧图像22之后相邻的一帧图像,再或者可以为完整视频节目中本帧图像22之后,且与本帧图像22之间存在预设间隔帧的一帧图像。这个预设间隔帧是指本帧图像22与上述对比帧图像23之间间隔了一个以上帧。这个预设间隔帧可以根据用户需求进行设置。这样本帧图像22和对比帧图像23均来源于同一视频数据中的不同帧图像,从而方便确定本帧图像22相对于对比帧图像23之间的全局特征相似度。
上述本帧图像中的特征点集,称为第一特征点集;上述对比帧图像的的特征点集,称为第二特征点集。上述第二特征点集中特征点的数目大于或等于三。同理,第一特征点集中特征点的数目大于或等于三。
上述步骤110中第一特征点集的一种确定方式可以是对本帧图像直接进行特征提取,得到本帧图像的特征点集;将本帧图像的特征点集,作为第一特征点集,这样方便直接得到第一特征点集。
由于镜头运动方式并未发生运动,仅仅是因为本帧图像中画面内容的部分特征点发生运动,比如,由于人物的移动而使得人物的特征点运动。因此为了避免发生运动的画面内容影响到最终关联特征点对集中各第一特征点集相对于匹配的第二特征点集对应的镜头运动方式,本发明实施例上述第一特征点集的另一种确定方式可以是采用如下步骤:
第一步,对第一区块进行特征提取,得到第一区块中的特征点集;第二步,将第一区块中的特征点集,作为第一特征点集。
参见图2所示,上述第一步进一步可以包括如下步骤111和步骤112:
步骤111,对本帧图像进行均匀区块划分,得到两个以上第一区块。
其中,将上述本帧图像进行均匀区块划分,得到两个以上区块,将这些位于本帧图像中的区块称为第一区块。这些第一区块可以但并不限定于是将本帧图像所有图像区域进行全部均匀区块划分。区块划分方式进一步的可以是在本帧图像中进行预设形状的全部区块划分。这样可以得到两个以上预设形状的第一区块。进一步的,这些第一区块的预设形状可以根据用户需求进行设置。这些第一区块的预设形状可以是圆形,或者也可以是方形,在此不做限定。对于均匀区块划分而言,可以将所有图像区域的特征点集进行使用。而,对于按照预设形状的全部区块划分而言,可以从本帧图像中得到携带有特征点集的区块,进而进行确定各个第一区块的特征点集,减少运算量,提高运算的准确度。
上述步骤111进一步可以包括:将视频数据中的本帧图像生成numpy矩阵A;将本帧图像的numpy矩阵A进行均匀区块划分,得到第一区块,即 i表示行的序号, 表示的取值范围为到并且i取的值,不取的值,j表示列的序号,表示的取值范围为 到并且j取的值,不取的值,h为图像的高,w为图像的宽,hb为图像的横向划分个数,wb为图像的纵向划分个数,Aij表示由本帧图像生成的numpy矩阵中第i行j列的第一区块。
步骤112,对第一区块进行特征提取,得到第一区块中的特征点集,将第一区块中的特征点集作为第一特征点集。
上述特征提取方式可以是指SHIF(Scale-invariant feature transform,检测局部特征的算法),ORB(Oriented FAST and Rotated BRIEF,快速特征点集提取和描述的算法),SURF(Speeded Up Robust Features,加速稳健特征)中的任一种特征提取。这样上述步骤112,进一步可以包括:采用上述特征提取方式,对第一区块Aij进行特征提取,得到第一区块中的特征点集,将第一区块中的特征点集作为第一特征点集。这样可以提取第一区块的特征点集。
上述从本帧图像中确定第一特征点集的确定方式中,将本帧图像均匀区块划分为第一区块的情况下,发生运动的画面内容的部分特征点所对应的区块的数量小于画面内容的部分特征点的数量,这样减少了画面内容的部分特征点发生运动,对关联特征点对集中各第一特征点集相对于匹配的第二特征点集对应的镜头运动方式的影响,这样不仅提高了关联特征点对集中各第一特征点集相对于匹配的第二特征点集对应的镜头运动方式的准确性,而且由于第一区块的限制,方便从本帧图像的第一区块进行特征提取,可以提高特征点集的提取效率。
基于上述第一特征点集的说明,同理,上述步骤120中第二特征点集的一种确定方式可以是指对对比帧图像直接进行特征提取,得到对比帧图像的特征点集,这样方便直接得到第二特征点集。
由于镜头运动方式并未发生运动,仅仅是因为本帧图像中画面内容的部分特征点发生运动,比如,由于人物的移动而使得人物的特征点运动。因此为了避免发生运动的画面内容影响到最终关联特征点对集中各第一特征点集相对于匹配的第二特征点集对应的镜头运动方式,本发明实施例上述第二特征点集的另一种确定方式可以是采用如下步骤:
第1步,对第二区块进行特征提取,得到第二区块中的特征点集;第2步,将第二区块中的特征点集,作为第二特征点集。
上述第1步进一步可以包括如下步骤113和步骤114:
步骤113,对对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块。
将对比帧图像进行均匀区块划分,得到两个以上区块,将这些位于对比帧图像中的区块称为第二区块。第二区块的区块划分方式与第一区块的划分方式,除以第一区块作为区块划分方式的对象不同外,第二区块的区块划分方式的过程与第一区块的区块划分方式的过程相同,均可参照第一区块的区块划分方式,在此不再赘述。
上述步骤113,进一步可以包括:将视频数据中的对比帧图像生成numpy矩阵B;将对比帧图像的numpy矩阵B进行区块划分,得到第二区块,即其中,B就是本帧图像的numpy矩阵,Bij表示由对比帧图像生成的numpy矩阵中第i行j列第一区块对应的第二区块。
步骤114,对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集,将各第一区块对应的第二区块的特征点集作为第二特征点集。其中,第二区块的特征提取方式与第一区块的特征提取方式,除以第一区块作为特征提取方式的对象不同外,第二区块的特征提取方式的过程与第一区块的特征提取方式的过程相同,均可参照第一区块的特征提取方式,在此不再赘述。这样上述步骤113,进一步可以包括:采用上述特征提取方式,对各第一区块对应的第二区块Bij进行特征提取,得到各第一区块对应的第二区块Bij的特征点集,将各第一区块对应的第二区块Bij的特征点集作为第二特征点集。这样可以提取第二区块的特征点集。
步骤115,将各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点;将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。
本步骤115,可以采用如下至少一种求取关联特征点对集的方式,确定关联特征点对集,其中,求取关联特征点对集的方式包括:KNN(k-Nearest Neighbor,K最近邻)算法。为了提高后期第一特征点集与第二特征点集匹配的准确性。进一步的,采用KNN算法,执行如下步骤,确定关联特征点对集:
第一步,利用KNN算法,确定第二特征点集与第一特征点集之间相匹配的特征点;第二步,将第二特征点集与第一特征点集之间相匹配的特征点,确定为关联特征点对集。这样方便准确得到关联特征点对集。
步骤120,获取第一特征点集与第二特征点集之间不匹配的特征点的预设相似度,这些预设相似度为最小相似度。
本步骤120中,第一特征点集与第二特征点集之间不匹配的特征点可以是除去关联特征点以外剩余的特征点。这样相当于后期使用所有的特征点。
上述最小相似度可以是根据用户需求设置的。只要能够表示对全局特征相似度影响较小的数值,均可以作为这些不匹配的特征点的最小相似度,在此不做限定。比如,最大相似度的取值可以为1,最小相似度的取值小于0.5。可选性的,最小相似度可以为零。此处仅仅是举例说明,在此不做限定。
步骤130,基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度,关联特征点对集的相似度与关联特征点对集的数量呈正相关,关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关。
基于步骤130可知,由于关联特征点对集的相似度与关联特征点对集的数量呈正相关,关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关,确定出的关联特征点对集的相似度更加接近于实际场景的相似度。因此,只要能够包含关联特征点对集的总数和关联特征点对集的欧式距离,分别与关联特征点对集的相似度之间的关系,并能够计算出关联特征点对集的相似度的实现方案,均属于本发明实施例的保护范围。以下本步骤130中得到关联特征点对集的相似度的实现方案,可以包括以下至少之一,但并不限于此:
参见3所示,在一种实现方案中,基于关联特征点对集24的总数和关联特征点对集24的欧式距离,利用预设相似度计算公式25,计算关联特征点对集24的相似度,其中,预设相似度计算公式25中包含第一调整系数和第二调整系数,该第一调整系数用于调整关联特征点对集24的相似度与关联特征点对集24的数量呈正相关,该第二调整系数用于调整关联特征点对集24的相似度与关联特征点对集24的欧式距离呈负相关。这样可以使用第一调整系数和第二调整系数,分别调整关联特征点对集24的总数和关联特征点对集24的欧式距离,与关联特征点对集24的相似度之间的关系,得到更加准确的关联特征点对集24的相似度,进而确定本帧图像22和对比帧图像23之间的全局特征相似度。
上述第一调整系数和第二调整系数可以是根据用户需求或者工业需求设置的,上述第一调整系数和第二调整系数也可以是经验值。上述第一调整系数和第二调整系数可以在(0,1)的范围内取值。第二调整系数可以是第一调整系数的2倍数量级以上。示例性的,第二调整系数为0.2,第一调整系数为0.002。只要能够对应调整关联特征点对集24的总数和关联特征点对集24的欧式距离,分别与关联特征点对集24的相似度之间的关系,达到工业需求的预期相似度的关系状态,对应的第一调整系数和第二调整系数,均属于本发明实施例的保护范围,在此不再举例。
可选的,上述预设相似度计算公式可以为
式中,所述sij表示第i行第j列的第一区块以及所述第一区块对应的第二区块的相似度,所述为映射函数,所述映射函数用于将映射到[0,1]的取值范围内,使得sij处于[0,1]的取值范围内,l表示所述关联特征点对集的总数,k表示关联特征点对的序号,1≤k≤l,所述l表示所述关联特征点对集的总数,P表示所述关联特征点对集,A表示由本帧图像生成的numpy矩阵中的第一区块,B表示由对比帧图像生成的numpy矩阵中的第二区块,表示所述本帧图像生成的numpy矩阵以及对比帧图像生成的numpy矩阵的第k关联特征点对,表示第k关联特征点对中位于本帧图像生成的numpy矩阵中的特征点;表示第k关联特征点对中位于对比帧图像生成的numpy矩阵中的特征点,所述x表示特征点的水平坐标,所述y表示特征点的垂直坐标,(x,y)表示关联特征点对集中的任一关联特征点对,所述i表示行的序号,表示的取值范围为到并且i取的值,不取的值,j表示列的序号,表示的取值范围为到并且j取的值,不取的值,所述h为图像的高,所述w为图像的宽,所述h为图像的横向划分个数,所述wb为图像的纵向划分个数,所述Aij表示由所述本帧图像生成的numpy矩阵中第i行j列的第一区块,所述Bij表示由所述对比帧图像生成的numpy矩阵中第i行j列第一区块对应的第二区块,Θ表示所述第二调整系数,0<Θ<1,τ表示所述第一调整系数,0<τ<1。
本发明实施例中的映射函数可以为双曲正切函数,也可以为反双曲正切函数,任何能够实现将映射到[0,1]的取值范围内的映射函数,均属于本发明实施例的保护范围,在此不再一一举例。上述sij的取值范围为(0,1)。由此可见,如果关联特征点对集中特征点对的数目越多,则说明关联特征点对集的相似度越高,需要使上述公式中l影响关联特征点对集的相似度的作用越大;并且,关联特征点对集中特征点对的距离越远,则说明关联特征点对集的相似度越小,需要使上述公式中的影响关联特征点对集的相似度的作用越小,进而采用上述公式第一调整系数和第二调整系数,可以实现对关联特征点对集的相似度的调整,相较于现有技术,本发明实施例的关联特征点对集的相似度与实际场景的相似度更加接近,更加准确。
步骤140,将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度。其中,全局特征相似度是用来描述本帧图像的所有第一区块与对比帧图像中所有第二区块之间的相似度,也就是,表征整个本帧图像和整个对比帧图像之间的全部特征点的相似度。
本步骤140确定本帧图像和对比帧图像之间的全局特征相似度的实现方式可以包括以下至少之一,但并不限于此:
在一种实现方式中,将所有预设相似度与所有关联特征点对集的相似度直接加权平均,得到加权平均值,作为本帧图像和对比帧图像之间的全局特征相似度。这样可以直接依据本帧图像的特征点和对比帧图像的特征点,进行计算预设相似度与所有关联特征点对集的相似度,进而方便直接运算本帧图像和对比帧图像之间的全局特征相似度。
在另一种实现方式中,结合图1或图2的基础上,参见图4所示,步骤141,针对每个第一区块和第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为第一区块和第一区块对应的第二区块之间的相似度;
步骤142,将第一区块和第一区块对应的第二区块之间的相似度,作为区块匹配相似度;
步骤143,针对所有第一区块和所述第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为本帧图像和对比帧图像之间的全局特征相似度。
本步骤142可以包括但不限于:获取所有第一区块与第一区块对应的第二区块的相似度的预设权重,按照对应的每个预设权重,将预设相似度与关联特征点对集的相似度的加权平均值,作为本帧图像和对比帧图像之间的全局特征相似度。预设权重是根据经验值设置的,只要能够满足每个第一区块与第一区块对应的第二区块的相似度呈正相关的预设权重,均属于本发明实施例的保护范围,在此不再一一举例。这样可以参照第一区块及第二区块,分别与实际情况中相似度的符合程度获取的预设权重,进而得到更加接近于实际情况的相似度,从而提高相似度的准确性。
在另一种实现方式中,采用如下公式,将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度:
其中,S为所述本帧图像和所述对比帧图像之间的全局特征相似度,所述为映射函数,为图像的纵向划分个数,hb为图像的横向划分个数,1≤i≤wb,1≤j≤hb,所述sij表示第i行第j列的第一区块以及所述第一区块对应的第二区块的相似度。
本发明实施例中,在计算全局特征相似度时,将第一特征点集与第二特征点集之间不匹配的特征点的相似度,设置为最小相似度,相当于并未使用不匹配的特征点的相似度,说明减少了不匹配的特征点的影响;并且,关联特征点对集的数量越多,说明本帧图像与对比帧图像越相似,越需要提高数量较多的关联特征点对集的影响,以及关联特征点对集距离越远,说明本帧图像与对比帧图像越相似越不相似,越需要减少距离较远的关联特征点的影响,因此相较于现有技术,基于关联特征点对集的欧式距离以及关联特征点对集的数量,计算的关联特征点对集的相似度更加接近于实际场景的相似度,更加准确,进而计算的本帧图像和对比帧图像之间的全局特征相似度更加准确。
下面继续对本发明实施例提供的一种视频场景切换识别方法进行介绍。
参见图5,图5为本发明实施例提供的视频场景切换识别方法的第二流程示意图。本发明实施例所提供的视频场景切换识别方法,可以包括如下步骤:
步骤210,获取视频数据中本帧图像的第一特征点集,与视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将第一特征点集与第二特征点集相匹配的特征点,作为关联特征点对集,对比帧图像与本帧图像属于不同帧的图像。
步骤220,获取第一特征点集与第二特征点集之间不匹配的特征点的预设相似度,预设相似度为最小相似度。
步骤230,基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度,关联特征点对集的相似度与关联特征点对集的数量呈正相关,关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关。
步骤240,将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度。
本发明实施例中的上述步骤210至步骤240与图1中的步骤110至步骤140相同,并且限定的内容相同,在此不再一一赘述。
步骤250,判断全局特征相似度是否小于预设值。
这里的预设值可以根据用户需求或工业需求进行设置。这个预设值可以是经验值。任何能够实现判断本帧图像相对于对比帧图像是否发生视频场景切换的预设值,均属于本发明实施例的保护范围,在此不再赘述。
步骤251,如果全局特征相似度小于预设值,则识别出本帧图像相对于对比帧图像发生视频场景切换。这样识别出本帧图像相对于对比帧图像发生视频场景切换,可以为如色彩修复,镜头运动方式的分类等算法,提供视频场景切换的信息,从而可以只使用视频场景切换的图像,而不使用未发生视频场景切换的图像,不需要每一帧图像进行运算,减少计算的图像数量,提高相应其他算法的计算效率与精度。
步骤252,如果全局特征相似度大于或等于预设值,则识别出本帧图像相对于对比帧图像未发生视频场景切换。这样识别视频场景切换时,可以不使用未发生视频场景切换的图像,可以只使用视频场景切换的图像,从而可减少计算图像的数量,在一个视频场景片段按需检测上述视频场景切换的图像,而不需对每帧图像都进行处理。
这样在计算全局特征相似度时,将第一特征点集与第二特征点集之间不匹配的特征点的相似度,设置为最小相似度,相当于并未使用不匹配的特征点的相似度,说明减少了不匹配的特征点的影响;并且,关联特征点对集的数量越多,说明本帧图像与对比帧图像越相似,越需要提高数量较多的关联特征点对集的影响,以及关联特征点对集距离越远,说明本帧图像与对比帧图像越相似越不相似,越需要减少距离较远的关联特征点的影响,因此相较于现有技术,基于关联特征点对集的欧式距离以及关联特征点对集的数量,计算的关联特征点对集的相似度更加接近于实际场景的相似度,更加准确,进而计算的本帧图像和对比帧图像之间的全局特征相似度更加准确。进而提高了识别本帧图像相对于对比帧图像的发生视频场景切换的准确性。
在一种可能的实现方式中,上述步骤210可以包括但不限于:
第一步,对本帧图像进行均匀区块划分,得到两个以上第一区块;
第二步,对第一区块进行特征提取,得到第一区块中的特征点集;
第三步,将第一区块中的特征点集作为第一特征点集;
第四步,对对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;
第五步,对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;
第六步,将各第一区块对应的第二区块的特征点集作为第二特征点集;
第七步,将各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集相匹配的特征点;
第八步,将各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。
在一种可能的实现方式中,上述步骤230可以包括但不限于:
基于关联特征点对集的总数和关联特征点对集的欧式距离,利用预设相似度计算公式,计算关联特征点对集的相似度,其中,预设相似度计算公式中包含第一调整系数和第二调整系数,第一调整系数用于调整关联特征点对集的相似度与关联特征点对集的数量呈正相关,第二调整系数用于调整关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关。
在一种可能的实现方式中,预设相似度计算公式为
式中,sij表示第i行第j列的第一区块以及第一区块对应的第二区块的相似度,为映射函数,映射函数用于将映射到[0,1]的取值范围内,使得sij处于[0,1]的取值范围内,l表示关联特征点对集的总数,k表示关联特征点对的序号,1≤k≤l,l表示关联特征点对集的总数,P表示关联特征点对集,A表示由本帧图像生成的numpy矩阵,B表示由对比帧图像生成的numpy矩阵,表示本帧图像生成的numpy矩阵以及对比帧图像生成的numpy矩阵的第k关联特征点对,表示第k关联特征点对中位于本帧图像生成的numpy矩阵中的特征点;表示第k关联特征点对中位于对比帧图像生成的numpy矩阵中的特征点,(x,y)表示关联特征点对集中的任一关联特征点对,i表示行的序号,表示的取值范围为到并且i取的值,不取的值,j表示列的序号,表示的取值范围为到并且j取的值,不取的值,h为图像的高,w为图像的宽,hb为图像的横向划分个数,wb为图像的纵向划分个数,Aij表示由本帧图像生成的numpy矩阵中第i行j列的第一区块,Bij表示由对比帧图像生成的numpy矩阵B中第i行j列第一区块对应的第二区块,Θ表示第二调整系数,0<Θ<1,τ表示第一调整系数,0<τ<1。
在一种可能的实现方式中,上述步骤240可以包括但不限于:
针对每个第一区块和第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为第一区块和第一区块对应的第二区块之间的相似度;
将第一区块和第一区块对应的第二区块之间的相似度,作为区块匹配相似度;
针对所有第一区块和第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为本帧图像和对比帧图像之间的全局特征相似度。
在一种可能的实现方式中,采用如下公式,将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度:
其中,S为本帧图像和对比帧图像之间的全局特征相似度,为映射函数,wb为图像的纵向划分个数,h为图像的横向划分个数,1≤i≤wb,1≤j≤hb,sij表示第i行第j列的第一区块以及第一区块对应的第二区块的相似度。
结合图1和图5,参见图6,本发明实施例的具体实现流程,进行如下举例说明:
首先,在步骤110之前,方法可以还包括:
步骤100,获取视频源素材,视频源素材包括:所有图像,图像的帧总数frames_len,图像的尺寸SIZE=(w,h),即图像的尺寸SIZE也就是一帧图像的宽w与高h。
步骤101,获取计数器的计数cnt,预设间隔帧jump_frames及预设划区块参数(wb,hb),其中计数器的计数cnt=0作为初始数值,wb为横向划分个数,hb为纵向划分个数;其中,计数器的计数cnt总数为图像的帧总数frames_len。
步骤102,从视频源素材中获取第cnt帧图像作为本帧图像;
步骤103,从视频源素材中获取第(cnt+jump_frames)帧图像作为对比帧图像。这样可以先得到本帧图像和对比帧图像,然后再执行步骤110,既可对本帧图像和对比帧图像进行处理。
步骤104,获取本帧图像的numpy矩阵以及获取对比帧图像的numpy矩阵然后继续执行步骤210至步骤250,使用步骤250来判断全局特征相似度是否小于预设值后,再然后执行步骤251或步骤252;其中,表示向量空间,3表示颜色通道数,进而确定出本帧图像相对于对比帧图像未发生视频场景切换或本帧图像相对于对比帧图像发生视频场景切换。
步骤105,判断cnt+3*jump_frames是小于,或者是等于图像的帧总数frames_len;
步骤106,如果cnt+3*jump_frames小于图像的帧总数frames_len,则cnt=cnt+2*jump_frames,返回继续执行步骤102;
步骤107,如果cnt+3*jump_frames等于图像的帧总数frames_len,则输出识别的视频源素材中发生视频场景切换的图像。
本发明实施例中,在视频数据为视频源素材的情况下,从视频源素材中获得第cnt帧图像作为本帧图像;以及获取第(cnt+jump_frames)帧图像作为对比帧图像。利用从本帧图像中的第一特征点集和对比帧图像中的第二特征点集相匹配的特征点,即本帧图像和对比帧图像之间的关联特征点对集。关联特征点对集的数量越多,说明本帧图像与对比帧图像越相似,越需要提高数量较多的关联特征点对集的影响,以及关联特征点对集距离越远,说明本帧图像与对比帧图像越相似越不相似,越需要减少距离较远的关联特征点的影响,因此相较于现有技术,基于关联特征点对集的欧式距离以及关联特征点对集的数量,计算的关联特征点对集的相似度更加接近于实际场景的相似度,更加准确,进而计算的本帧图像和对比帧图像之间的全局特征相似度更加准确。进而确定出本帧图像相对于对比帧图像的发生视频场景切换,相较于现有技术也更加准确。
相较于现有技术中使用两帧图像的像素的颜色信息进行相似度计算,如颜色直方图等相似度计算的方法。本发明实施例具有更强的鲁棒性,提高识别本帧图像相对于对比帧图像的发生视频场景切换的准确性。
下面继续对本发明实施例提供的确定图像相似度的装置进行介绍。
参见7所示,图7为本发明实施例的确定图像相似度的装置的第一结构示意图。本发明实施例提供确定图像相似度的装置,包括:
第一获取模块31,用于获取视频数据中本帧图像的第一特征点集,与视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将第一特征点集与第二特征点集相匹配的特征点,作为关联特征点对集,对比帧图像与本帧图像属于不同帧的图像;
第二获取模块32,用于获取第一特征点集与第二特征点集之间不匹配的特征点的预设相似度,预设相似度为最小相似度;
计算模块33,用于基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度,关联特征点对集的相似度与关联特征点对集的数量呈正相关,关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关;
获得模块34,用于将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度。
在一种可能的实现方式中,第一获取模块,用于:
对本帧图像进行均匀区块划分,得到两个以上第一区块;
对本帧图像进行均匀区块划分,得到两个以上第一区块;
对第一区块进行特征提取,得到第一区块中的特征点集;
将第一区块中的特征点集作为第一特征点集;
对对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;
对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;
将各第一区块对应的第二区块的特征点集作为第二特征点集;
将各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集相匹配的特征点;
将各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。
在一种可能的实现方式中,计算模块,用于:
基于关联特征点对集的总数和关联特征点对集的欧式距离,利用预设相似度计算公式,计算关联特征点对集的相似度,其中,预设相似度计算公式中包含第一调整系数和第二调整系数,第一调整系数用于调整关联特征点对集的相似度与关联特征点对集的数量呈正相关,第二调整系数用于调整关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关。
在一种可能的实现方式中,预设相似度计算公式为
式中,sij表示第i行第j列的第一区块以及第一区块对应的第二区块的相似度,为映射函数,映射函数用于将映射到[0,1]的取值范围内,使得sij处于[0,1]的取值范围内,l表示关联特征点对集的总数,k表示关联特征点对的序号,1≤k≤l,l表示关联特征点对集的总数,P表示关联特征点对集,A表示由本帧图像生成的numpy矩阵中的第一区块,B表示由对比帧图像生成的numpy矩阵中的第二区块,表示本帧图像生成的numpy矩阵以及对比帧图像生成的numpy矩阵的第k关联特征点对,表示第k关联特征点对中位于本帧图像生成的numpy矩阵中的特征点;表示第k关联特征点对中位于对比帧图像生成的numpy矩阵中的特征点,x表示特征点的水平坐标,y表示特征点的垂直坐标,(x,y)表示关联特征点对集中的任一关联特征点对, i表示行的序号, 表示的取值范围为到并且i取的值,不取的值,j表示列的序号,表示的取值范围为 到并且j取的值,不取的值,h为图像的高,w为图像的宽,hb为图像的横向划分个数,wb为图像的纵向划分个数,Aij表示由本帧图像生成的numpy矩阵中第i行j列的第一区块,Bij表示由对比帧图像生成的numpy矩阵中第i行j列第一区块对应的第二区块,Θ表示第二调整系数,0<Θ<1,τ表示第一调整系数,0<τ<1。
在一种可能的实现方式中,获得模块,用于:
针对每个第一区块和第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为第一区块和第一区块对应的第二区块之间的相似度;
将第一区块和第一区块对应的第二区块之间的相似度,作为区块匹配相似度;
针对所有第一区块和第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为本帧图像和对比帧图像之间的全局特征相似度。
在一种可能的实现方式中,采用如下公式,将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度:
其中,S为本帧图像和对比帧图像之间的全局特征相似度,为映射函数,wb为图像的纵向划分个数,hb为图像的横向划分个数,1≤i≤wb,1≤j≤hb,sij表示第i行第j列的第一区块以及第一区块对应的第二区块的相似度。
参见8所示,图8为本发明实施例的确定图像相似度的装置的第二结构示意图。本发明实施例提供确定图像相似度的装置,包括:
第一获取模块41,用于获取视频数据中本帧图像的第一特征点集,与视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将第一特征点集与第二特征点集相匹配的特征点,作为关联特征点对集,对比帧图像与本帧图像属于不同帧的图像;
第二获取模块42,用于获取第一特征点集与第二特征点集之间不匹配的特征点的预设相似度,预设相似度为最小相似度;
计算模块43,用于基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度,关联特征点对集的相似度与关联特征点对集的数量呈正相关,关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关;
获得模块44,用于将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度;
识别模块45,识别模块,用于如果全局特征相似度小于预设值,则识别出本帧图像相对于对比帧图像发生视频场景切换。
这样在计算全局特征相似度时,将第一特征点集与第二特征点集之间不匹配的特征点的相似度,设置为最小相似度,相当于并未使用不匹配的特征点的相似度,说明减少了不匹配的特征点的影响;并且,关联特征点对集的数量越多,说明本帧图像与对比帧图像越相似,越需要提高数量较多的关联特征点对集的影响,以及关联特征点对集距离越远,说明本帧图像与对比帧图像越相似越不相似,越需要减少距离较远的关联特征点的影响,因此相较于现有技术,基于关联特征点对集的欧式距离以及关联特征点对集的数量,计算的关联特征点对集的相似度更加接近于实际场景的相似度,更加准确,进而计算的本帧图像和对比帧图像之间的全局特征相似度更加准确。进而提高了识别本帧图像相对于对比帧图像的发生视频场景切换的准确性。
在一种可能的实现方式中,第一获取模块,用于:
对本帧图像进行均匀区块划分,得到两个以上第一区块;
对本帧图像进行均匀区块划分,得到两个以上第一区块;
对第一区块进行特征提取,得到第一区块中的特征点集;
将第一区块中的特征点集作为第一特征点集;
对对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;
对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;
将各第一区块对应的第二区块的特征点集作为第二特征点集;
将各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集相匹配的特征点;
将各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。
在一种可能的实现方式中,计算模块,用于:
基于关联特征点对集的总数和关联特征点对集的欧式距离,利用预设相似度计算公式,计算关联特征点对集的相似度,其中,预设相似度计算公式中包含第一调整系数和第二调整系数,第一调整系数用于调整关联特征点对集的相似度与关联特征点对集的数量呈正相关,第二调整系数用于调整关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关。
在一种可能的实现方式中,预设相似度计算公式为
式中,sij表示第i行第j列的第一区块以及第一区块对应的第二区块的相似度,为映射函数,映射函数用于将映射到[0,1]的取值范围内,使得sij处于[0,1]的取值范围内,l表示关联特征点对集的总数,k表示关联特征点对的序号,1≤k≤l,l表示关联特征点对集的总数,P表示关联特征点对集,A表示由本帧图像生成的numpy矩阵中的第一区块,B表示由对比帧图像生成的numpy矩阵中的第二区块,表示本帧图像生成的numpy矩阵以及对比帧图像生成的numpy矩阵的第k关联特征点对,表示第k关联特征点对中位于本帧图像生成的numpy矩阵中的特征点;表示第k关联特征点对中位于对比帧图像生成的numpy矩阵中的特征点,x表示特征点的水平坐标,y表示特征点的垂直坐标,(x,y)表示关联特征点对集中的任一关联特征点对, i表示行的序号, 表示的取值范围为到并且i取的值,不取的值,j表示列的序号,表示的取值范围为 到并且j取的值,不取的值,h为图像的高,w为图像的宽,hb为图像的横向划分个数,wb为图像的纵向划分个数,Aij表示由本帧图像生成的numpy矩阵中第i行j列的第一区块,Bij表示由对比帧图像生成的numpy矩阵中第i行j列第一区块对应的第二区块,Θ表示第二调整系数,0<Θ<1,τ表示第一调整系数,0<τ<1。
在一种可能的实现方式中,获得模块,用于:
针对每个第一区块和第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为第一区块和第一区块对应的第二区块之间的相似度;
将第一区块和第一区块对应的第二区块之间的相似度,作为区块匹配相似度;
针对所有第一区块和第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为本帧图像和对比帧图像之间的全局特征相似度。
在一种可能的实现方式中,采用如下公式,将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度:
其中,S为本帧图像和对比帧图像之间的全局特征相似度,为映射函数,wb为图像的纵向划分个数,hb为图像的横向划分个数,1≤i≤wb,1≤j≤hb,sij表示第i行第j列的第一区块以及第一区块对应的第二区块的相似度。
参见图9,图9为本发明实施例的电子设备的第一结构示意图。本发明实施例还提供了一种电子设备,包括处理器51、通信接口52、存储器53和通信总线54,其中,处理器51,通信接口52,存储器53通过通信总线54完成相互间的通信,
存储器53,用于存放计算机程序;
处理器51,用于执行存储器53上所存放的程序时,实现如下步骤:
获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;
获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;
基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;
将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度。
参见图10,图10为本发明实施例的电子设备的第二结构示意图。本发明实施例还提供了一种电子设备,包括处理器61、通信接口62、存储器63和通信总线64,其中,处理器61,通信接口62,存储器63通过通信总线64完成相互间的通信,
存储器63,用于存放计算机程序;
处理器61,用于执行存储器63上所存放的程序时,实现如下步骤:
获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;
获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;
基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;
将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例提供的方法可以应用于电子设备。进一步的,该电子设备可以为:台式计算机、便携式计算机、智能移动终端、服务器等。在此不作限定,任何可以实现本发明的电子设备,均属于本发明的保护范围。
相应于第一方面所示的方法,在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的确定图像相似度的方法。
相应于第二方面所示的方法,在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的视频场景切换识别方法。
相应于第一方面所示的方法,在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的确定图像相似度的方法。
相应于第二方面所示的方法,在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的视频场景切换识别方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置/电子设备/存储介质实施例/包含指令的计算机程序产品而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (22)
1.一种确定图像相似度的方法,其特征在于,所述方法包括:
获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;
获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;
基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;
将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度。
2.如权利要求1所述的方法,其特征在于,所述获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,包括:
对所述本帧图像进行均匀区块划分,得到两个以上第一区块;
对所述第一区块进行特征提取,得到所述第一区块中的特征点集;
将所述第一区块中的特征点集作为第一特征点集;
对所述对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;
对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;
将所述各第一区块对应的第二区块的特征点集作为第二特征点集;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。
3.如权利要求2所述的方法,其特征在于,所述基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,包括:
基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,利用预设相似度计算公式,计算所述关联特征点对集的相似度,其中,所述预设相似度计算公式中包含第一调整系数和第二调整系数,所述第一调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述第二调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关。
4.如权利要求3所述的方法,其特征在于,所述预设相似度计算公式为
式中,所述sij表示第i行第j列的第一区块以及所述第一区块对应的第二区块的相似度,所述为映射函数,所述映射函数用于将映射到[0,1]的取值范围内,使得sij处于[0,1]的取值范围内,l表示所述关联特征点对集的总数,k表示关联特征点对的序号,1≤k≤l,所述l表示所述关联特征点对集的总数,P表示所述关联特征点对集,A表示由本帧图像生成的numpy矩阵中的第一区块,B表示由对比帧图像生成的numpy矩阵中的第二区块,表示所述本帧图像生成的numpy矩阵以及对比帧图像生成的numpy矩阵的第k关联特征点对,表示第k关联特征点对中位于本帧图像生成的numpy矩阵中的特征点;表示第k关联特征点对中位于对比帧图像生成的numpy矩阵中的特征点,所述x表示特征点的水平坐标,所述y表示特征点的垂直坐标,(x,y)表示关联特征点对集中的任一关联特征点对,所述i表示行的序号,表示i的取值范围为到并且i取的值,不取的值,j表示列的序号,表示j的取值范围为到并且j取的值,不取的值,所述h为图像的高,所述w为图像的宽,所述hb为图像的横向划分个数,所述wb为图像的纵向划分个数,所述Aij表示由所述本帧图像生成的numpy矩阵A中第i行j列的第一区块,所述Bij表示由所述对比帧图像生成的numpy矩阵B中第i行j列第一区块对应的第二区块,Θ表示所述第二调整系数,0<Θ<1,τ表示所述第一调整系数,0<τ<1。
5.如权利要求2所述的方法,其特征在于,所述将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度,包括:
针对每个第一区块和所述第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为所述第一区块和所述第一区块对应的第二区块之间的相似度;
将所述第一区块和所述第一区块对应的第二区块之间的相似度,作为区块匹配相似度;
针对所有第一区块和所述第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为所述本帧图像和所述对比帧图像之间的全局特征相似度。
7.一种视频场景切换识别方法,其特征在于,所述方法包括:
获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;
获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;
基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;
将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度;
如果所述全局特征相似度小于预设值,则识别出所述本帧图像相对于所述对比帧图像发生视频场景切换。
8.如权利要求7所述的方法,其特征在于,所述获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,包括:
对所述本帧图像进行均匀区块划分,得到两个以上第一区块;
对所述第一区块进行特征提取,得到所述第一区块中的特征点集;
将所述第一区块中的特征点集作为第一特征点集;
对所述对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;
对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;
将所述各第一区块对应的第二区块的特征点集作为第二特征点集;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。
9.如权利要求8所述的方法,其特征在于,所述基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,包括:
基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,利用预设相似度计算公式,计算所述关联特征点对集的相似度,其中,所述预设相似度计算公式中包含第一调整系数和第二调整系数,所述第一调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述第二调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关。
10.如权利要求9所述的方法,其特征在于,所述预设相似度计算公式为
式中,所述sij表示第i行第j列的第一区块以及所述第一区块对应的第二区块的相似度,所述为映射函数,所述映射函数用于将映射到[0,1]的取值范围内,使得sij处于[0,1]的取值范围内,l表示所述关联特征点对集的总数,k表示关联特征点对的序号,1≤k≤l,所述l表示所述关联特征点对集的总数,P表示所述关联特征点对集,A表示由本帧图像生成的numpy矩阵,B表示由对比帧图像生成的numpy矩阵,表示所述本帧图像生成的numpy矩阵以及对比帧图像生成的numpy矩阵的第k关联特征点对,表示第k关联特征点对中位于本帧图像生成的numpy矩阵中的特征点;表示第k关联特征点对中位于对比帧图像生成的numpy矩阵中的特征点,(x,y)表示关联特征点对集中的任一关联特征点对, 所述i表示行的序号,表示i的取值范围为到并且i取的值,不取的值,j表示列的序号,表示j的取值范围为到并且j取的值,不取的值,所述h为图像的高,所述w为图像的宽,所述hb为图像的横向划分个数,所述wb为图像的纵向划分个数,所述Aij表示由所述本帧图像生成的numpy矩阵A中第i行j列的第一区块,所述Bij表示由所述对比帧图像生成的numpy矩阵B中第i行j列第一区块对应的第二区块,Θ表示所述第二调整系数,0<Θ<1,τ表示所述第一调整系数,0<τ<1。
11.如权利要求8所述的方法,其特征在于,所述将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度,包括:
针对每个第一区块和所述第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为所述第一区块和所述第一区块对应的第二区块之间的相似度;
将所述第一区块和所述第一区块对应的第二区块之间的相似度,作为区块匹配相似度;
针对所有第一区块和所述第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为所述本帧图像和所述对比帧图像之间的全局特征相似度。
13.一种确定图像相似度的装置,其特征在于,所述装置包括:
第一获取模块,用于获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;
第二获取模块,用于获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;
计算模块,用于基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;
获得模块,用于将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度。
14.如权利要求13所述的装置,其特征在于,所述第一获取模块,用于:
对所述本帧图像进行均匀区块划分,得到两个以上第一区块;
对所述本帧图像进行均匀区块划分,得到两个以上第一区块;
对所述第一区块进行特征提取,得到所述第一区块中的特征点集;
将所述第一区块中的特征点集作为第一特征点集;
对所述对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;
对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;
将所述各第一区块对应的第二区块的特征点集作为第二特征点集;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。
15.如权利要求13所述的装置,其特征在于,所述计算模块,用于:
基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,利用预设相似度计算公式,计算所述关联特征点对集的相似度,其中,所述预设相似度计算公式中包含第一调整系数和第二调整系数,所述第一调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述第二调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关。
16.如权利要求13所述的装置,其特征在于,所述获得模块,用于:
针对每个第一区块和所述第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为所述第一区块和所述第一区块对应的第二区块之间的相似度;
将所述第一区块和所述第一区块对应的第二区块之间的相似度,作为区块匹配相似度;
针对所有第一区块和所述第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为所述本帧图像和所述对比帧图像之间的全局特征相似度。
17.一种视频场景切换识别装置,其特征在于,所述装置包括:
第一获取模块,用于获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;
第二获取模块,用于获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;
计算模块,用于基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;
获得模块,用于将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度;
识别模块,用于如果所述全局特征相似度小于预设值,则识别出所述本帧图像相对于所述对比帧图像发生视频场景切换。
18.如权利要求17所述的装置,其特征在于,所述第一获取模块,用于:
对所述本帧图像进行均匀区块划分,得到两个以上第一区块;
对所述本帧图像进行均匀区块划分,得到两个以上第一区块;
对所述第一区块进行特征提取,得到所述第一区块中的特征点集;
将所述第一区块中的特征点集作为第一特征点集;
对所述对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;
对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;
将所述各第一区块对应的第二区块的特征点集作为第二特征点集;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点;
将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。
19.如权利要求17所述的装置,其特征在于,所述计算模块,用于:
基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,利用预设相似度计算公式,计算所述关联特征点对集的相似度,其中,所述预设相似度计算公式中包含第一调整系数和第二调整系数,所述第一调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述第二调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关。
20.如权利要求17所述的装置,其特征在于,所述获得模块,用于:
针对每个第一区块和所述第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为所述第一区块和所述第一区块对应的第二区块之间的相似度;
将所述第一区块和所述第一区块对应的第二区块之间的相似度,作为区块匹配相似度;
针对所有第一区块和所述第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为所述本帧图像和所述对比帧图像之间的全局特征相似度。
21.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
22.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求7-12任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811327209.3A CN109447023B (zh) | 2018-11-08 | 2018-11-08 | 确定图像相似度的方法、视频场景切换识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811327209.3A CN109447023B (zh) | 2018-11-08 | 2018-11-08 | 确定图像相似度的方法、视频场景切换识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109447023A CN109447023A (zh) | 2019-03-08 |
CN109447023B true CN109447023B (zh) | 2020-07-03 |
Family
ID=65552539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811327209.3A Active CN109447023B (zh) | 2018-11-08 | 2018-11-08 | 确定图像相似度的方法、视频场景切换识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109447023B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111402242B8 (zh) * | 2020-03-20 | 2021-01-19 | 乐清市智格电子科技有限公司 | 一种用于医疗图像精细化处理系统及方法 |
CN113420596A (zh) * | 2021-05-24 | 2021-09-21 | 山东云缦智能科技有限公司 | 视频唯一标识序列的生成算法 |
CN114038197B (zh) * | 2021-11-24 | 2023-06-13 | 浙江大华技术股份有限公司 | 场景状态的确定方法、装置、存储介质及电子装置 |
CN114674307B (zh) * | 2022-05-26 | 2022-09-27 | 苏州魔视智能科技有限公司 | 一种重定位方法及电子设备 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0803066D0 (en) * | 2008-02-20 | 2008-03-26 | Siemens Medical Solutions | Fast block matching |
CN101807257A (zh) * | 2010-05-12 | 2010-08-18 | 上海交通大学 | 图像标签信息识别方法 |
CN102169581A (zh) * | 2011-04-18 | 2011-08-31 | 北京航空航天大学 | 一种基于特征向量的快速高精度鲁棒性匹配方法 |
CN102201063B (zh) * | 2011-06-13 | 2013-05-01 | 中国科学院自动化研究所 | 基于纹理图像局部特征的形变虹膜匹配方法 |
CN103886013A (zh) * | 2014-01-16 | 2014-06-25 | 陈守辉 | 一种基于网络视频监控中的智能图像检索系统 |
WO2016149944A1 (zh) * | 2015-03-26 | 2016-09-29 | 北京旷视科技有限公司 | 用于识别人脸的方法、系统和计算机程序产品 |
CN105787487B (zh) * | 2016-02-24 | 2019-04-12 | 昆明理工大学 | 一种剪切工具图片的相似度匹配方法 |
CN106257497B (zh) * | 2016-07-27 | 2020-05-08 | 中测高科(北京)测绘工程技术有限责任公司 | 一种图像同名点的匹配方法及装置 |
CN106296741A (zh) * | 2016-08-15 | 2017-01-04 | 常熟理工学院 | 纳米视觉图像中细胞高速运动特征标注方法 |
CN107341824B (zh) * | 2017-06-12 | 2020-07-28 | 西安电子科技大学 | 一种图像配准的综合评价指标生成方法 |
CN108491498B (zh) * | 2018-03-20 | 2021-06-25 | 济南神博信息技术有限公司 | 一种基于多特征检测的卡口图像目标搜索方法 |
-
2018
- 2018-11-08 CN CN201811327209.3A patent/CN109447023B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109447023A (zh) | 2019-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109447023B (zh) | 确定图像相似度的方法、视频场景切换识别方法及装置 | |
CN109271870B (zh) | 行人重识别方法、装置、计算机设备及存储介质 | |
US9179071B2 (en) | Electronic device and image selection method thereof | |
CN109117801A (zh) | 人脸识别的方法、装置、终端及计算机可读存储介质 | |
CN105069424B (zh) | 面部快速识别系统和方法 | |
CN111914908B (zh) | 一种图像识别模型训练方法、图像识别方法及相关设备 | |
CN110765860A (zh) | 摔倒判定方法、装置、计算机设备及存储介质 | |
CN110956131B (zh) | 单目标追踪方法、装置及系统 | |
CN109598250B (zh) | 特征提取方法、装置、电子设备和计算机可读介质 | |
CN112085701A (zh) | 一种人脸模糊度检测方法、装置、终端设备及存储介质 | |
CN106504265B (zh) | 运动估计优化方法、设备和系统 | |
CN109409321B (zh) | 一种镜头运动方式的确定方法及装置 | |
CN112232506A (zh) | 网络模型训练方法、图像目标识别方法、装置和电子设备 | |
CN109447022B (zh) | 一种镜头类型识别方法及装置 | |
CN112614110A (zh) | 评估图像质量的方法、装置及终端设备 | |
CN109961103B (zh) | 特征提取模型的训练方法、图像特征的提取方法及装置 | |
CN111291611A (zh) | 一种基于贝叶斯查询扩展的行人重识别方法及装置 | |
CN113822871A (zh) | 基于动态检测头的目标检测方法、装置、存储介质及设备 | |
CN108764206B (zh) | 目标图像识别方法和系统、计算机设备 | |
CN116958873A (zh) | 行人跟踪方法、装置、电子设备及可读存储介质 | |
Yazdi et al. | Shot boundary detection with effective prediction of transitions' positions and spans by use of classifiers and adaptive thresholds | |
CN103578094A (zh) | 镜头分割方法 | |
CN112214639B (zh) | 视频筛选方法、视频筛选装置及终端设备 | |
CN109087351B (zh) | 基于深度信息对场景画面进行闭环检测的方法及装置 | |
CN114611565A (zh) | 数据处理方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |