CN103631932B - 一种对重复视频进行检测的方法 - Google Patents
一种对重复视频进行检测的方法 Download PDFInfo
- Publication number
- CN103631932B CN103631932B CN201310655669.XA CN201310655669A CN103631932B CN 103631932 B CN103631932 B CN 103631932B CN 201310655669 A CN201310655669 A CN 201310655669A CN 103631932 B CN103631932 B CN 103631932B
- Authority
- CN
- China
- Prior art keywords
- video
- feature
- key frame
- detected
- global
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 206010073653 Visual perseveration Diseases 0.000 title claims abstract description 10
- 238000004458 analytical method Methods 0.000 claims abstract description 34
- 230000009466 transformation Effects 0.000 claims abstract description 12
- 238000001514 detection method Methods 0.000 claims abstract description 11
- 239000000284 extract Substances 0.000 claims abstract description 7
- 238000005070 sampling Methods 0.000 claims abstract description 6
- 238000000605 extraction Methods 0.000 claims description 7
- 230000004927 fusion Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 4
- 239000012141 concentrate Substances 0.000 claims description 2
- 238000013507 mapping Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种对重复视频进行检测的方法,该方法包括以下步骤:对数据库中的所有视频进行帧采样,提取每个视频的关键帧,以获取相应视频的关键信息;对提取得到的视频关键帧的局部特征和全局特征分别进行分析得到局部分析特征和全局分析特征;对局部分析特征和全局分析特征进行融合,得到一个对于视频变换鲁棒的索引特征,用于进行视频重复性检测;利用索引特征对于待检测视频进行重复视频的检测。利用本发明,可以快速高效的检测出重复视频。
Description
技术领域
本发明涉及计算机应用技术领域,特别是一种对重复视频进行检测的方法。
背景技术
随着科技的发展,科技产品越来越多的走进人们的工作和生活。计算机、摄像头、手持DV、数码摄录像机、手机等设备的普及,使得数字视频成为工作生活中不可或缺的一部分。数字视频成为信息传播的新生主流,它包含了比文字、图像、音频更多的信息,并且资源种类繁多,包含用户自制内容(UGC),授权影视剧、监控视频等。同时,网络技术的发展使得数字视频得以广泛传播,人们通过网络进行视频上传、视频下载、视频编辑和视频观看等操作。数字视频的爆炸性增长,一方面给人们带来了工作生活的便利,人们可以快速检索到各类视频信息;但另一方面,重复视频造成的冗余不止浪费了大量的网络资源,还给检索带来困难,并且会涉及到版权信息的侵犯等各方面的问题。因此,视频数据库中的重复检测问题显得尤为重要,然而重复检测问题的核心是视频表示。
视频表示的本质是找到一个合适的特征映射函数,将视频映射到一个对视频变换鲁棒又具有判别力的特征空间上。在提取视频关键帧后,视频表示的问题就转化成图像表示的问题。在图像表达研究领域,主要包含两种类型的特征映射函数,分别是基于全局特征的特征映射函数和基于局部特征的特征映射函数。基于全局特征的特征映射函数主要是获取图像的一些底层信息,这些信息主要包括颜色、纹理、梯度等。该函数的主要优点是操作方便,计算复杂度低,主要缺点是缺乏图像的高层信息,对视频变换不具有良好的鲁棒性。相比之下,基于局部特征的特征映射函数主要是获取图像中角点的精确信息,可以较为准确的表示图像,对视频变换具有良好的鲁棒性,但是,其主要缺点是计算复杂度高,对于视频来讲计算量 的增长直接影响了模型的可行性。
综合以上两种映射函数的优缺点以及视频数据库重复性检测问题本身的特性,本发明采用融合局部和全局特征映射函数来提取图像信息,其主要原因如下:(1)视频数据库包含了多达十多种视频变换,且其中多数视频变换严重的改变了视频的亮度等底层的视觉特征,选取局部特征仍然可以检测出经过视频变换了的重复视频。(2)局部特征的缺点是维数高,数据量大,由于视频数据库的规模大,对计算复杂度要求非常严格,如果单纯使用局部特征,不具有可行性,因此需要对局部特征进行聚类和线性编码,这样可以对高维的局部特征进行降维,保留了局部特征中更具有代表意义的部分。(3)对局部特征进行聚类和线性编码的过程,忽略了视频图像中特征点的位置信息,对旋转、对称等变换不具有鲁棒性,因此,添加视频图像的位置信息,可以更全面的匹配视频。基于此,本发明提出了一种融合视频局部和全局特征对重复视频进行检测的方法。
发明内容
为了克服上述现有技术存在的缺陷,本发明提出了一种融合视频局部和全局特征对重复视频进行检测的方法,该方法所使用的视频特征集成了图像局部和全局信息,从而可以作为既鲁棒又简便的图像索引。
视频图像局部特征聚类线性编码分析是在提取视频关键帧图像的对平移、旋转、尺度缩放、亮度变化、遮挡和噪声等具有良好的不变性,对视觉变化、仿射变换也保持一定程度的稳定性的局部特征之后,对其进行聚类线性编码分析,可以得到图像兴趣点的除位置信息以外的其他信息。视频图像全局特征分析是同样提取了局部描述子之后,对图像进行分块,统计每块特征点的数量,排序得到对于视频图像兴趣点位置分布的一个全局特征。
本发明提出的一种对重复视频进行检测的方法包括以下步骤:
步骤S1,对数据库中的所有视频进行帧采样,提取每个视频的关键帧,以获取相应视频的关键信息;
步骤S2,对提取得到的视频关键帧的局部特征和全局特征分别进行分析得到局部分析特征和全局分析特征;
步骤S3,对所述局部分析特征和全局分析特征进行融合,得到一个对于视频变换鲁棒的索引特征,用于进行视频重复性检测;
步骤S4,利用所述索引特征对于待检测视频进行重复视频的检测。
本发明提出的这种图像融合特征较好的表达了图像中的整体结构和细节信息;其作为图像索引,可以有效地检测出视频数据库中重复的视频,从而对冗余信息做到有效的去除,提高了用户检索服务的质量。
附图说明
图1是本发明对重复视频进行检测的方法流程图;
图2是本发明对视频图像全局特征进行分析的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
图1是本发明对重复视频进行检测的方法流程图,如图1所示,所述方法包括以下步骤:
步骤S1,对数据库中的所有视频进行帧采样,提取每个视频的关键帧,以获取相应视频的关键信息,降低计算的复杂度;
所述视频的关键帧,指的是可以代表该视频主要信息的某些帧。关键帧的提取通常采用均匀采样的方法,采样率为每秒两帧。
视频关键帧的提取的功能是缩短视频特征提取的计算时间,关键帧可以代表视频的主要信息,提取关键帧就可以得到视频的主要关键信息,这就减少了视频处理的计算量。
步骤S2,对提取得到的视频关键帧的局部特征和全局特征分别进行分析得到局部分析特征和全局分析特征;
所述步骤S2进一步包括对所述视频关键帧的局部特征进行聚类线性编码分析得到局部分析特征,和对所述视频关键帧的全局特征进行分析得到全局分析特征。
其中,对所述视频关键帧的局部特征进行聚类线性编码分析得到局部 分析特征包括以下步骤:
步骤S21,对所述视频关键帧进行SIFT(Scale-invariant Feature Transform尺度不变特征转换)特征的提取;
图像SIFT特征提取的功能是选取图像精准的局部描述子,SIFT描述子对平移、旋转、尺度缩放、亮度变化、遮挡和噪声等具有良好的不变性,对视觉变化、仿射变换也保持一定程度的稳定性,其独特性好,信息量丰富,描述了图像局部精准特征,可以进行准确的匹配。
步骤S22,对提取得到的所有关键帧的SIFT特征进行聚类,比如使用现有技术中常用的k-means聚类方法进行聚类,得到K个聚类中心,记为聚类中心集D={dk,k=1,…K};
由于SIFT描述子具有丰富的信息量,是一个高维描述子,每帧图像均可产生大量的SIFT特征向量,为了减少计算量,需要对描述子进行k-means聚类,得到聚类中心的集合,再把聚类中心作为下面线性编码的基。
步骤S23,以聚类中心集D={dk,k=1,…K}为基,针对某个待检测视频关键帧Q的所有SIFT特征xi,i=1,2,3,…,i为关键帧Q的SIFT特征的编号,找到聚类中心集中距离xi最近的M个中心;
步骤S24,对所述SIFT特征xi使用聚类中心集D重新进行线性编码,这样,SIFT特征xi就被重新编码为c*:
s.t.1T ci=1,
其中,ci为一个K×1的向量,ci中有M个不为零的数,这M个不为零的系数对应的聚类中心即为距离xi最近的M个中心,这样就把xi聚类线性编码为c*。
步骤S25,针对每个关键帧Q,设其有P个描述子,且每个描述子都被重新编码成为c*的模式,这样就生成一个K×P维的矩阵,其每一列分别代表每个描述子对应的线性编码。对于该矩阵的每一行,用该行中的最大值来代替此行,即在所有的描述子中找到每个聚类中心系数最大的值来作为此图像对应于每个聚类中心的系数,由此得到的K×1的新向量即为此帧图像的局部约束线性编码,也就得到了视频关键帧局部特征对应的局部 分析特征。
图2是本发明对视频图像全局特征进行分析的示意图,如图2所示,对所述视频图像的全局特征进行分析得到全局分析特征包括以下步骤:
步骤S26,针对所述视频关键帧,在提取得到其SIFT特征描述子之后(SIFT特征描述子的分布如图2(a)所示),把每个关键帧图像划分成m×m个小块,统计得到每个小块上描述子的个数,如图2(b)所示;
步骤S27,按照每行每块的顺序,将所述描述子表示成为一个m2×1的向量,其中向量元素为每小块上描述子的个数;
步骤S28,将所述向量元素按照大小降序排序并编号,如图2(c)所示,利用所述编号来代替个数,生成一个新的m2×1序向量Oi,其为1,2,…m2的一个排列,即得到视频关键帧全局特征对应的全局分析特征。
步骤S3,对所述局部分析特征和全局分析特征进行融合,得到一个对于视频变换鲁棒的索引特征,用于进行视频重复性检测;
所述索引特征不仅具有局部特征的精准性,而且由于在聚类线性编码的过程中降低了特征维数,从而使其具有良好的计算速度;同时在线性编码中遗漏的特征点位置信息在视频图像全局特征分析中加以补充,这样对对所述局部分析特征和全局分析特征进行融合就能够得到一个对视频变换具有良好鲁棒性的新特征,作为视频每幅图像的索引。
其中,对于上述两个特征进行融合的方法为对上述两个特征(K×1维的向量L与m2×1维向量O)进行拼接来生成一个(K+m2)×1的新特征F,其中FT=[LT,OT]。
步骤S4,利用所述索引特征对于待检测视频进行重复视频的检测。
所述步骤S4进一步包括以下步骤:
步骤S41,基于所述索引特征,利用特征向量训练分类器判断两个待检测视频的关键帧是否重复,其中特征向量训练分类器采用的距离为欧式距离;
步骤S42,在初步得到了重复的关键帧之后,统计每个待检测视频的所有关键帧对应的重复帧所在的视频,从中选出归一化重复值(即为单位 时间内的重复帧数)最高的视频;
步骤S43,所述归一化重复值高过某个阈值的视频,作为最终的与所述待检测视频重复的视频。
综上,本发明的特点在于提出了一种融合有图像描述子梯度信息的图像局部和兴趣点位置信息的图像全局特征的索引特征。图像局部描述子具有良好的旋转、平移以及尺度不变性,其通过聚类重新编码降低了局部描述子的维数,虽然保留了关键特征,但缺失了兴趣点位置信息;本发明通过融合图像描述子位置分布特征来补充兴趣点位置信息,通过融合上述两种特征,得到了既包含了图像局部精准特征,又涵括了图像整体的全局位置信息的鲁棒的视频索引特征,可用于视频检索和重复检测。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种对重复视频进行检测的方法,其特征在于,该方法包括以下步骤:
步骤S1,对数据库中的所有视频进行帧采样,提取每个视频的关键帧,以获取相应视频的关键信息;
步骤S2,对提取得到的视频关键帧的局部特征和全局特征分别进行分析得到局部分析特征和全局分析特征;
步骤S3,对所述局部分析特征和全局分析特征进行融合,得到一个对于视频变换鲁棒的索引特征,用于进行视频重复性检测;
步骤S4,利用所述索引特征对于待检测视频进行重复视频的检测;
所述步骤S2包括:
步骤S21,对所述视频关键帧进行SIFT特征的提取;
步骤S22,对提取得到的所有关键帧的SIFT特征进行聚类,得到K个聚类中心,记为聚类中心集D={dk,k=1,…K};
步骤S23,以聚类中心集D={dk,k=1,…K}为基,针对某个视频关键帧Q的所有SIFT特征xi,i=1,2,3,…,i为关键帧Q的SIFT特征的编号,找到聚类中心集中距离xi最近的M个中心;
步骤S24,对所述SIFT特征xi使用聚类中心集D重新进行线性编码,这样,SIFT特征xi就被重新编码为c*;
步骤S25,针对每个关键帧Q,设其有P个描述子,且每个描述子都被重新编码成为c*的模式,这样就生成一个K×P维的矩阵,其每一列分别代表每个描述子对应的线性编码;对于该矩阵的每一行,用该行中的最大值来代替此行,由此得到的K×1的新向量即为此帧图像的局部约束线性编码,也即视频关键帧局部特征对应的局部分析特征;
步骤S26,针对所述视频关键帧,在提取得到其SIFT特征描述子之后,把每个关键帧图像划分成m×m个小块,统计得到每个小块上描述子的个数;
步骤S27,按照每行每块的顺序,将所述描述子表示成为一个m2×1的向量,其中向量元素为每小块上描述子的个数;
步骤S28,将所述向量元素按照大小降序排序并编号,利用所述编号来代替个数,生成一个新的m2×1序向量Oi,其为1,2,…m2的一个排列,即得到视频关键帧全局特征对应的全局分析特征。
2.根据权利要求1所述的方法,其特征在于,所述关键帧为可以代表该视频主要信息的帧。
3.根据权利要求1所述的方法,其特征在于,采用均匀采样的方法提取视频的关键帧。
4.根据权利要求1所述的方法,其特征在于,所述步骤S3中,对所述局部分析特征和全局分析特征进行融合得到索引特征具体为:对所述局部分析特征和全局分析特征进行拼接来生成索引特征F。
5.根据权利要求1所述的方法,其特征在于,所述步骤S4进一步包括以下步骤:
步骤S41,基于所述索引特征,利用特征向量训练分类器判断两个待检测视频的关键帧是否重复;
步骤S42,在初步得到了重复的关键帧之后,统计每个待检测视频的所有关键帧对应的重复帧所在的视频,从中选出归一化重复值最高的视频;
步骤S43,所述归一化重复值高过某个阈值的视频,作为最终的与所述待检测视频重复的视频。
6.根据权利要求5所述的方法,其特征在于,所述特征向量训练分类器采用的距离为欧式距离。
7.根据权利要求5所述的方法,其特征在于,所述归一化重复值为单位时间内的重复帧数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310655669.XA CN103631932B (zh) | 2013-12-06 | 2013-12-06 | 一种对重复视频进行检测的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310655669.XA CN103631932B (zh) | 2013-12-06 | 2013-12-06 | 一种对重复视频进行检测的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103631932A CN103631932A (zh) | 2014-03-12 |
CN103631932B true CN103631932B (zh) | 2017-03-01 |
Family
ID=50212973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310655669.XA Active CN103631932B (zh) | 2013-12-06 | 2013-12-06 | 一种对重复视频进行检测的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103631932B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104166685B (zh) * | 2014-07-24 | 2017-07-11 | 北京捷成世纪科技股份有限公司 | 一种检测视频片段的方法和装置 |
CN105592315A (zh) * | 2015-12-16 | 2016-05-18 | 深圳大学 | 基于视频时空属性的视频特征冗余信息压缩方法及系统 |
CN106060568B (zh) * | 2016-06-28 | 2018-12-18 | 电子科技大学 | 一种视频篡改检测及定位方法 |
CN106649440B (zh) * | 2016-09-13 | 2019-10-25 | 西安理工大学 | 融合全局r特征的近似重复视频检索方法 |
CN107750015B (zh) * | 2017-11-02 | 2019-05-07 | 腾讯科技(深圳)有限公司 | 视频版权的检测方法、装置、存储介质及设备 |
CN108566562B (zh) * | 2018-05-02 | 2020-09-08 | 中广热点云科技有限公司 | 版权视频信息结构化整理完成样本封样的方法 |
CN108846831B (zh) * | 2018-05-28 | 2021-09-28 | 中冶南方工程技术有限公司 | 基于统计特征和图像特征相结合的带钢表面缺陷分类方法 |
CN108959492A (zh) * | 2018-06-25 | 2018-12-07 | 江苏大学 | 一种基于托普利兹核偏最小二乘的近重复视频检测方法 |
CN109189991B (zh) * | 2018-08-17 | 2021-06-08 | 百度在线网络技术(北京)有限公司 | 重复视频识别方法、装置、终端及计算机可读存储介质 |
CN110442749B (zh) * | 2019-07-18 | 2023-05-23 | 腾讯音乐娱乐科技(深圳)有限公司 | 视频帧处理方法及装置 |
CN111723692B (zh) * | 2020-06-03 | 2022-08-09 | 西安交通大学 | 基于卷积神经网络语义分类的标签特征的近重复视频检测方法 |
CN112738557A (zh) * | 2020-12-22 | 2021-04-30 | 上海哔哩哔哩科技有限公司 | 视频处理方法及装置 |
CN114298992A (zh) * | 2021-12-21 | 2022-04-08 | 北京百度网讯科技有限公司 | 一种视频帧去重方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521838A (zh) * | 2011-12-19 | 2012-06-27 | 国家计算机网络与信息安全管理中心 | 一种图像检索/匹配方法及系统 |
CN102750339A (zh) * | 2012-06-05 | 2012-10-24 | 北京交通大学 | 一种基于视频重构的重复片段定位方法 |
CN103390040A (zh) * | 2013-07-17 | 2013-11-13 | 南京邮电大学 | 一种视频拷贝检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8719288B2 (en) * | 2008-04-15 | 2014-05-06 | Alexander Bronstein | Universal lookup of video-related data |
-
2013
- 2013-12-06 CN CN201310655669.XA patent/CN103631932B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521838A (zh) * | 2011-12-19 | 2012-06-27 | 国家计算机网络与信息安全管理中心 | 一种图像检索/匹配方法及系统 |
CN102750339A (zh) * | 2012-06-05 | 2012-10-24 | 北京交通大学 | 一种基于视频重构的重复片段定位方法 |
CN103390040A (zh) * | 2013-07-17 | 2013-11-13 | 南京邮电大学 | 一种视频拷贝检测方法 |
Non-Patent Citations (1)
Title |
---|
A Robust and Fast Video Copy Detection System Using Content-Based Fingerprinting;Mani Malek Esmaeili, et al.;《IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY》;20110331;第6卷(第1期);第213-226页 * |
Also Published As
Publication number | Publication date |
---|---|
CN103631932A (zh) | 2014-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103631932B (zh) | 一种对重复视频进行检测的方法 | |
CN105653700B (zh) | 视频检索方法及系统 | |
Chen et al. | Chinesefoodnet: A large-scale image dataset for chinese food recognition | |
CN110390033B (zh) | 图像分类模型的训练方法、装置、电子设备及存储介质 | |
CN109325148A (zh) | 生成信息的方法和装置 | |
CN102508923B (zh) | 基于自动分类和关键字标注的自动视频注释方法 | |
CN104376105B (zh) | 一种社会媒体中图像低层视觉特征与文本描述信息的特征融合系统及方法 | |
CN103324677B (zh) | 一种可分级的快速图像gps位置估计方法 | |
CN111914107B (zh) | 一种基于多通道注意力区域扩展的实例检索方法 | |
CN100589532C (zh) | 字幕区域提取装置和方法 | |
Zhuge et al. | Boundary-guided feature aggregation network for salient object detection | |
CN107180074A (zh) | 一种视频分类方法及装置 | |
CN102207966A (zh) | 基于对象标签的视频内容快速检索方法 | |
CN103186538A (zh) | 一种图像分类方法和装置、图像检索方法和装置 | |
US20090263014A1 (en) | Content fingerprinting for video and/or image | |
CN105808665B (zh) | 一种新的基于手绘草图的图像检索方法 | |
CN106649663A (zh) | 一种基于紧凑视频表征的视频拷贝检测方法 | |
CN110110113A (zh) | 图像搜索方法、系统及电子装置 | |
CN107229710A (zh) | 一种基于局部特征描述符的视频分析方法 | |
Xu et al. | Multi-modal transformer with global-local alignment for composed query image retrieval | |
CN109308324A (zh) | 一种基于手绘风格推荐的图像检索方法及系统 | |
CN106844785A (zh) | 一种基于显著性分割的基于内容的图像检索方法 | |
CN110287369A (zh) | 一种基于语义的视频检索方法及系统 | |
CN103514276A (zh) | 基于中心估计的图形目标检索定位方法 | |
Sarker et al. | Transformer-based person re-identification: a comprehensive review |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |