CN111191077A - 一种视频内容识别自动分类的算法 - Google Patents
一种视频内容识别自动分类的算法 Download PDFInfo
- Publication number
- CN111191077A CN111191077A CN201911327247.3A CN201911327247A CN111191077A CN 111191077 A CN111191077 A CN 111191077A CN 201911327247 A CN201911327247 A CN 201911327247A CN 111191077 A CN111191077 A CN 111191077A
- Authority
- CN
- China
- Prior art keywords
- video
- corpus
- feature
- establishing
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007635 classification algorithm Methods 0.000 title description 2
- 238000013507 mapping Methods 0.000 claims abstract description 16
- 238000001514 detection method Methods 0.000 claims abstract description 15
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/75—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种视频内容识别自动分类的算法,涉及视频处理技术领域,包括以下步骤:A、建立视频类别语料库,构建视频类别语料库到特征库的映射互联,B、将不同类别的视频加载到视频类别语料库中,C、检测视频的特征提取,D、匹配检测视频特征与特征库,E、对匹配结果图中的每个节点在匹配图中查找其最长路径,并形成最终的拷贝检测结果,F、对判定的检测视频自动进行相应的分类。本发明能够自动对视频内容进行识别分类,并通过自动更新,提高了检测的准确率、识别率,降低了误检率。
Description
技术领域
本发明涉及视频处理技术领域,特别涉及一种视频内容识别自动分类的算法。
背景技术
随着多媒体技术和网络通信技术的发展,数字媒体给人们带来了诸多方便,目前,常用的视频内容识别方法,往往是通过对视频进行关键帧抽取,然后再对关键帧采用图像内容识别的方法进行检测。
现有的视频内容识别具有检测的准确率低、识别率低和误检率高的缺陷。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种视频内容识别自动分类的算法,解决了现有的视频内容识别具有检测的准确率低、识别率低和误检率高的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种视频内容识别自动分类的算法,包括以下步骤:
A、建立视频类别语料库,构建视频类别语料库到特征库的映射互联;
B、将不同类别的视频加载到视频类别语料库中,通过对视频类别语料库进行预处理,离线提取视频类别语料库特征,并建立从视频类别语料库到特征库的哈希映射;
C、检测视频的特征提取;
D、匹配检测视频特征与特征库,并生成匹配结果图采用基于局部敏感哈希的£近邻查询模式,使得数据库中距离近的矢量聚集到一起的概率远高于距离远的矢量,从而保证以一定的概率快速得到相似帧;
E、对匹配结果图中的每个节点在匹配图中查找其最长路径,并形成最终的拷贝检测结果,采用Floyd-warshall算法,计算出每个节点之间的最短路径,通过该路径信息形成视频的拷贝的最长路径,从而判定检测视频是否为视频库中视频的一个拷贝;
F、对判定的检测视频自动进行相应的分类。
可选的,所述步骤B中的离线处理是将视频关键帧的抽取对视频每隔单位时间进行一次关键帧的抽取,并记录下相应的时间轴信息;
关键帧的特征向量形成将每一关键帧等分成4*4块,对每一块分别计算其平均亮度特征,然后计算相邻块之间的灰度排序特征,结合关键帧的时间轴信息,得到每一关键帧的十七维特征向量信息;
建立不良视频语料库到特征库的映射对每个检测视频,通过哈希映射,将其所有的关键帧的特征信息写入到一个对应的.feature文件中,形成从视频类别语料库到特征库的一一映射。
可选的,所述视频类别语料库特征由离线提取获得,并自动分类和更新,对于视频帧内容识别模块无法检测出的视频,将该视频加载到视频类别语料库中,从而实现对视频类别语料库的自动更新。
(三)有益效果
本发明提供了一种视频内容识别自动分类的算法,具备以下有益效果:
本发明能够自动对视频内容进行识别分类,并通过自动更新,提高了检测的准确率、识别率,降低了误检率。
附图说明
图1为本发明识别流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了如图1所示的一种视频内容识别自动分类的算法,包括以下步骤:
A、建立视频类别语料库,构建视频类别语料库到特征库的映射互联;
B、将不同类别的视频加载到视频类别语料库中,通过对视频类别语料库进行预处理,离线提取视频类别语料库特征,并建立从视频类别语料库到特征库的哈希映射;
C、检测视频的特征提取;
D、匹配检测视频特征与特征库,并生成匹配结果图采用基于局部敏感哈希的£近邻查询模式,使得数据库中距离近的矢量聚集到一起的概率远高于距离远的矢量,从而保证以一定的概率快速得到相似帧;
E、对匹配结果图中的每个节点在匹配图中查找其最长路径,并形成最终的拷贝检测结果,采用Floyd-warshall算法,计算出每个节点之间的最短路径,通过该路径信息形成视频的拷贝的最长路径,从而判定检测视频是否为视频库中视频的一个拷贝;
F、对判定的检测视频自动进行相应的分类。
作为本发明的一种可选技术方案:
步骤B中的离线处理是将视频关键帧的抽取对视频每隔单位时间进行一次关键帧的抽取,并记录下相应的时间轴信息;
关键帧的特征向量形成将每一关键帧等分成4*4块,对每一块分别计算其平均亮度特征,然后计算相邻块之间的灰度排序特征,结合关键帧的时间轴信息,得到每一关键帧的十七维特征向量信息;
建立不良视频语料库到特征库的映射对每个检测视频,通过哈希映射,将其所有的关键帧的特征信息写入到一个对应的.feature文件中,形成从视频类别语料库到特征库的一一映射。
作为本发明的一种可选技术方案:
视频类别语料库特征由离线提取获得,并自动分类和更新,对于视频帧内容识别模块无法检测出的视频,将该视频加载到视频类别语料库中,从而实现对视频类别语料库的自动更新。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (3)
1.一种视频内容识别自动分类的算法,其特征在于,包括以下步骤:
A、建立视频类别语料库,构建视频类别语料库到特征库的映射互联;
B、将不同类别的视频加载到视频类别语料库中,通过对视频类别语料库进行预处理,离线提取视频类别语料库特征,并建立从视频类别语料库到特征库的哈希映射;
C、检测视频的特征提取;
D、匹配检测视频特征与特征库,并生成匹配结果图采用基于局部敏感哈希的£近邻查询模式,使得数据库中距离近的矢量聚集到一起的概率远高于距离远的矢量,从而保证以一定的概率快速得到相似帧;
E、对匹配结果图中的每个节点在匹配图中查找其最长路径,并形成最终的拷贝检测结果,采用Floyd-warshall算法,计算出每个节点之间的最短路径,通过该路径信息形成视频的拷贝的最长路径,从而判定检测视频是否为视频库中视频的一个拷贝;
F、对判定的检测视频自动进行相应的分类。
2.根据权利要求1所述的一种视频内容识别自动分类的算法,其特征在于:
所述步骤B中的离线处理是将视频关键帧的抽取对视频每隔单位时间进行一次关键帧的抽取,并记录下相应的时间轴信息;
关键帧的特征向量形成将每一关键帧等分成4*4块,对每一块分别计算其平均亮度特征,然后计算相邻块之间的灰度排序特征,结合关键帧的时间轴信息,得到每一关键帧的十七维特征向量信息;
建立不良视频语料库到特征库的映射对每个检测视频,通过哈希映射,将其所有的关键帧的特征信息写入到一个对应的.feature文件中,形成从视频类别语料库到特征库的一一映射。
3.根据权利要求1所述的一种视频内容识别自动分类的算法,其特征在于:
所述视频类别语料库特征由离线提取获得,并自动分类和更新,对于视频帧内容识别模块无法检测出的视频,将该视频加载到视频类别语料库中,从而实现对视频类别语料库的自动更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911327247.3A CN111191077A (zh) | 2019-12-20 | 2019-12-20 | 一种视频内容识别自动分类的算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911327247.3A CN111191077A (zh) | 2019-12-20 | 2019-12-20 | 一种视频内容识别自动分类的算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111191077A true CN111191077A (zh) | 2020-05-22 |
Family
ID=70707459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911327247.3A Pending CN111191077A (zh) | 2019-12-20 | 2019-12-20 | 一种视频内容识别自动分类的算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111191077A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112231479A (zh) * | 2020-10-23 | 2021-01-15 | 新华三信息安全技术有限公司 | 一种安全审计方法及装置 |
CN112801053A (zh) * | 2021-04-01 | 2021-05-14 | 腾讯科技(深圳)有限公司 | 视频数据处理方法、装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853377A (zh) * | 2010-05-13 | 2010-10-06 | 复旦大学 | 一种对数字视频进行内容识别的方法 |
CN103605666A (zh) * | 2013-10-28 | 2014-02-26 | 复旦大学 | 一种进行广告检测的视频拷贝检测方法 |
-
2019
- 2019-12-20 CN CN201911327247.3A patent/CN111191077A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853377A (zh) * | 2010-05-13 | 2010-10-06 | 复旦大学 | 一种对数字视频进行内容识别的方法 |
CN103605666A (zh) * | 2013-10-28 | 2014-02-26 | 复旦大学 | 一种进行广告检测的视频拷贝检测方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112231479A (zh) * | 2020-10-23 | 2021-01-15 | 新华三信息安全技术有限公司 | 一种安全审计方法及装置 |
CN112231479B (zh) * | 2020-10-23 | 2023-03-31 | 新华三信息安全技术有限公司 | 一种安全审计方法及装置 |
CN112801053A (zh) * | 2021-04-01 | 2021-05-14 | 腾讯科技(深圳)有限公司 | 视频数据处理方法、装置 |
CN112801053B (zh) * | 2021-04-01 | 2021-07-13 | 腾讯科技(深圳)有限公司 | 视频数据处理方法、装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110941594B (zh) | 一种视频文件的拆分方法、装置、电子设备及存储介质 | |
CN102236796B (zh) | 数字视频不良内容的分类方法和系统 | |
CN110414559B (zh) | 智能零售柜商品目标检测统一框架的构建方法及商品识别方法 | |
US8150169B2 (en) | System and method for object clustering and identification in video | |
CN102254006B (zh) | 基于内容的互联网视频检索方法 | |
CN108898069B (zh) | 基于多分类器融合的视频火焰检测方法 | |
CN110728294A (zh) | 一种基于迁移学习的跨领域图像分类模型构建方法和装置 | |
CN111191077A (zh) | 一种视频内容识别自动分类的算法 | |
CN107977610B (zh) | 一种基于海量视频处理的人脸追踪方法 | |
CN111368867B (zh) | 档案归类方法及系统、计算机可读存储介质 | |
TW202004667A (zh) | 物件追蹤系統及方法 | |
CN111931859A (zh) | 一种多标签图像识别方法和装置 | |
CN112000024A (zh) | 用于控制家电设备的方法及装置、设备 | |
Hanjalic et al. | Template-based detection of anchorperson shots in news programs | |
WO2021062271A1 (en) | Automatic license plate recognition (alpr) and vehicle identification profile methods and systems | |
CN111241987B (zh) | 基于代价敏感的三支决策的多目标模型视觉追踪方法 | |
WO2023272991A1 (zh) | 一种数据处理方法、装置、计算机设备和存储介质 | |
Xie et al. | Robust vehicles extraction in a video-based intelligent transportation systems | |
CN116630947A (zh) | 异物检测方法及装置、非瞬态计算机可读存储介质 | |
US11893084B2 (en) | Object detection systems and methods including an object detection model using a tailored training dataset | |
CN111125391A (zh) | 数据库更新方法和装置、电子设备、计算机存储介质 | |
CN110807453A (zh) | 基于ocr的产品字符在线检测方法、装置及系统 | |
CN114567798A (zh) | 一种针对互联网短视频变种的溯源方法 | |
CN113536018A (zh) | 基于卷积神经网络的电商客服平台图像检索方法 | |
CN110826564A (zh) | 一种复杂场景图像中的小目标语义分割方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 266100 7th floor, Yongye building, No.166 Haier Road, Laoshan District, Qingdao, Shandong Province Applicant after: Chinese translation Entertainment Technology (Qingdao) Co.,Ltd. Address before: 266100 7th floor, Yongye building, No.166 Haier Road, Laoshan District, Qingdao, Shandong Province Applicant before: Chinese Translated Language Interpretation Technology (Qingdao) Co.,Ltd. |
|
CB02 | Change of applicant information | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200522 |
|
WD01 | Invention patent application deemed withdrawn after publication |