CN117058596B - 一种获取片名的视频处理系统 - Google Patents
一种获取片名的视频处理系统 Download PDFInfo
- Publication number
- CN117058596B CN117058596B CN202311313014.4A CN202311313014A CN117058596B CN 117058596 B CN117058596 B CN 117058596B CN 202311313014 A CN202311313014 A CN 202311313014A CN 117058596 B CN117058596 B CN 117058596B
- Authority
- CN
- China
- Prior art keywords
- target
- acquiring
- character string
- video file
- initial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004590 computer program Methods 0.000 claims abstract description 8
- 238000000605 extraction Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 8
- 238000000034 method Methods 0.000 abstract description 13
- 238000005516 engineering process Methods 0.000 abstract 1
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及视频处理技术领域,特别是涉及一种获取片名的视频处理系统,所述系统包括:目标视频文件、处理器和存储有计算机程序的存储器,计算机程序被处理器执行时,实现以下步骤:获取所述目标视频文件对应的初始文件名称,根据所述初始文件名称,获取所述目标视频文件对应的初始片名文本,根据所述目标视频文件,获取第一关键图像集,根据目标字符识别模型,从第一关键图像集中获取所述目标视频文件对应的关键片名文本,根据所述初始片名文本和所述关键片名文本,获取到所述目标片名文本。本发明根据目标视频文件,获取预设时长的第一片头视频,并得到第一关键图像集,从若干个图像中识别到片名,从而提高获取的片名的精准度。
Description
技术领域
本发明涉及视频处理技术领域,特别是涉及一种获取片名的视频处理系统。
背景技术
在从外部资源站搜索影视站内的影视或视频文件时,通常根据文件名进行匹配,而国内目前有很多资源文件的命名并没有完全按照统一的规则进行命名,有很多片名前缀还会带有各类站点广告,导致很多视频影片下载后无法直接爬到元数据和海报。在传统的文件名匹配方式中,通常将文件名放入媒体库中进行扫描,对文件名进行分解后得到片名、发行年份、版本等信息,但是上述现有技术还存在有以下问题:
一方面,直接对文件名进行分解获取到片名,会导致获取的片名包含原文件名中含有的站点广告等字符串,影响片名的准确度。
另一方面,若从视频片头中获取片名时,无法根据视频的时长来选择对视频处理的长度,影响获取到片名的可能性。
发明内容
针对上述技术问题,本发明采用的技术方案为:
一种获取片名的视频处理系统,所述系统包括:目标视频文件、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:
S100,获取所述目标视频文件对应的初始文件名称;所述目标视频文件为上传至预设视频库中的任一视频文件。
S200,根据所述初始文件名称,获取所述目标视频文件对应的初始片名文本。
S300,根据所述目标视频文件,获取第一关键图像集;其中,在S300中还通过如下步骤获取所述第一关键图像集:
S301,从所述目标视频文件中获取预设时长的第一片头视频,其中,预设时长符合如下条件:
L1=L0+Lz×α,其中,L1为预设时长,L0为预设的0-60秒内的任意初始时长,Lz为所述目标视频文件的总时长,L1、L0、Lz的单位均为秒;
其中,α符合如下条件:
α=∑z u=1αu/z,其中,z为若干个视频文件样本的数量;
其中,αu符合如下条件:
αu=(Lu1-L0)/Luz,其中,Lu1为从第u个视频文件样本中获取的片头时长,Luz为第u个视频文件样本的总时长。
S302,根据所述预设时长,获取所述第一片头视频对应的目标抽帧间隔F。
S303,根据所述第一片头视频和F,获取第一关键图像集。
S400,根据目标字符识别模型,从第一关键图像集中获取所述目标视频文件对应的关键片名文本。
S500,根据所述初始片名文本和所述关键片名文本,获取到所述目标片名文本。
本发明与现有技术相比具有明显的有益效果,借由上述技术方案,本发明提供的一种获取片名的视频处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有以下有益效果:
本发明提供了一种获取片名的视频处理系统,所述系统包括:目标视频文件、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:获取所述目标视频文件对应的初始文件名称,根据所述初始文件名称,获取所述目标视频文件对应的初始片名文本,根据所述目标视频文件,获取第一关键图像集,根据目标字符识别模型,从第一关键图像集中获取所述目标视频文件对应的关键片名文本,根据所述初始片名文本和所述关键片名文本,获取到所述目标片名文本。本发明提供了一种新的获取片名的视频处理系统,一方面,本发明通过从目标视频文件中获取第一关键图像集,能够从视频的片头中获取到视频片名,提高了获取的片名的精准度;另一方面,根据目标视频文件的时长,来确定目标视频文件对应的片头时长,并得到该时长对应的第一关键图像集,从而在不用对整个目标视频文件全程进行识别的同时,提高获取到片名的可能性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种获取片名的视频处理系统执行计算机程序的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明提供了一种获取片名的视频处理系统,所述系统包括:目标视频文件、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤,如图1所示:
S100,获取所述目标视频文件对应的初始文件名称;所述目标视频文件为上传至预设视频库中的任一视频文件。
具体的,所述预设视频库为存储有若干个预设视频文件的视频库,其中,可以根据用户的搜索信息从预设视频库中为用户提供对应的预设视频文件。
具体的,所述目标视频文件对应的初始文件名称为该目标视频文件上传至预设视频库时的文件名称。
S200,根据所述初始文件名称,获取所述目标视频文件对应的初始片名文本。
在一个具体的实施例中,在S200中通过如下步骤获取所述初始片名文本:
S201,根据所述初始文件名称,获取第一字符串集AB和AB对应的字符串编码集AB0。
在一个具体的实施例中,在S201中通过如下步骤获取AB:
S2011,根据预设标识符,从所述初始文件名称中获取中间分隔符集A={A1,A2,……,Ai,……,Am},其中,Ai为第i个中间分隔符,i=1,2……m,m为中间分隔符的数量。
具体的,所述预设标识符为预先设置的标识符,例如:“/”,“”,“空格”,“.”。
具体的,所述中间分隔符是指所述初始文件名称中与任一预设标识符相同的分隔符。
S2012,根据A,从所述初始文件名称中获取中间字符串集B={B1,B2,……,Bj,……,Bn},其中,Bj为第j个中间字符串,j=1……n,n为中间字符串的数量。
具体的,所述中间字符串为按照中间分隔符对所述初始文件名称进行分割后,并将中间分隔符删除后得到的任一字符串。
S2013,将A和B合并成第一字符串集AB={A1,A2,……,Ai,……,Am,B1,B2,……,Bj,……,Bn};可以理解为:第一字符串为中间分隔符和中间字符串中的任意一个。
具体的,AB0为根据所述初始文件名称对应的若干个第一字符串的先后顺序依次对AB中的中间字符串和中间分隔符进行编码后得到的编码集;例如,所述初始文件名称为:广告青春变形记,对上述三个第一字符串依次进行编码,得到 “广告”对应的编码为1,“”对应的编码为2,“青春变形记”对应的编码为3。
上述,通过根据与预设标识符一致的中间分隔符,对初始文件名称进行分解,能够得到更准确合理的中间字符串集和中间分隔符集,进而获取到初始文件名称对应的关键字符串集,便于根据初始文件名称进行后续的处理。
S202,根据预设词库和AB,获取AB对应的第二字符串集AC。
具体的,所述预设词库为存储有若干个冗余词的词库;其中,所述冗余词为预设词库中预先设置的与所述目标视频文件的片名无关的词,例如,人人视频、电影天堂、广告等文本。
在一个具体的实施例中,在S202中通过如下步骤获取AC:
S2021,若从所述预设词库中获取到任一Bj对应的目标字符串,根据AB0,将Bj从AB中删除,获取到AC;可以理解为:AC为根据预设词库和目标字符串对应的中间字符串的字符串编码,将目标字符串对应的中间字符串从B中去除后得到的若干个中间字符串和m个中间分隔符的集合。
具体的,所述目标字符串为B中的n个中间字符串对应的n个向量中与任意一个冗余词对应的向量的相似度ξ大于目标阈值的字符串。
具体的,ξ符合如下条件:
ξ=(BBj·G)/(||BBj||×||G||),其中,BBj为Bj对应的字符串向量,G为任意一个冗余词对应的词向量。
具体的,所述目标阈值为本领域技术人员根据实际需求预先设置的阈值,例如:80%。
S2022,若从所述预设词库中获取到的目标字符串集为空集,将AB作为AC;可以理解为:若在预设词库中,未获取到任一Bj对应的目标字符串,则目标字符串集为空集。
上述,根据预设词库中存储的冗余词,从所述第一字符串集中删除掉与任意一个冗余词的相似度大于目标阈值的第一字符串,能够使后续得到的目标视频文件的片名更加准确。
S203,根据AB0和AC,获取所述目标视频文件对应的初始片名文本。
在一个具体的实施例中,在S203中通过如下步骤获取所述初始片名文本:
S2031,若所述目标字符串集为空集,将AC中的若干个第二字符串按照AB0的字符串编码顺序依次组合后得到所述初始片名文本。
S2032,若所述目标字符串对应的目标字符串编码为AB0中的最后一个编码,获取到AC0={A1,A2,……,Ai,……,Am-1,B1,B2,……,Bj,……,Bn-1}。
具体的,所述目标字符串对应的目标字符串编码是指所述目标字符串对应的中间字符串的字符串编码。
具体的,AC0是将与所述目标字符串编码相邻的关键字符串编码对应的中间分隔符从AC中删除后得到的;可以理解为:所述关键字符串编码为AB0中的倒数第二个编码,所述关键字符串编码对应的中间分隔符为A中的最后一个中间分隔符。
S2033,将AC0中的若干个第二字符串按照AB0的字符串编码顺序依次组合后得到所述初始片名文本。
S2034,若所述目标字符串对应的目标字符串编码非AB0中的最后一个编码,获取到AC00={A1,A2,……,Ai,Ai+2,……,Am,B1,B2,……,Bj-1,Bj+1,……,Bn}。
具体的,AC00是将与所述目标字符串编码相邻的后一个字符串编码对应的中间分隔符从AC中删除后得到的;可以理解为:目标字符串对应的字符串编码为Bj对应的字符串编码时,与所述目标字符串编码相邻的后一个字符串编码是指在AB0中位于Bj对应的字符串编码的后面一个编码。
S2035,将AC00中的若干个第二字符串按照AB0的字符串编码顺序依次组合后得到所述初始片名文本。
上述,通过将初始文件名称中的目标字符串对应的中间字符串清除后,再将与该中间字符串相邻的中间分隔符删除,能够得到格式更加合理的初始片名文本,同时也减少了初始片名文本的冗余度。
S300,根据所述目标视频文件,获取第一关键图像集。
在一个具体的实施例中,在S300中还通过如下步骤获取所述第一关键图像集:
S301,从所述目标视频文件中获取预设时长的第一片头视频。
具体的,所述预设时长符合如下条件:
L1=L0+Lz×α,其中,L1为预设时长,L0为预设的0-60秒内的任意初始时长,Lz为所述目标视频文件的总时长,L1、L0、Lz的单位均为秒。
具体的,α符合如下条件:
α=∑z u=1αu/z,其中,z为若干个视频文件样本的数量。
具体的,αu符合如下条件:
αu=(Lu1-L0)/Luz,其中,Lu1为从第u个视频文件样本中获取的片头时长,Luz为第u个视频文件样本的总时长。
具体的,所述第一片头视频为从所述目标视频文件的开头时刻延伸至预设时长时获取的视频。
上述,根据所述目标视频文件的总时长,来确定预设时长,能够提高从该预设时长对应的第一片头视频中获取到关键片名文本的可能性。
在一个具体的实施例中,在S301中还包括如下步骤:
S3010,根据所述第一片头视频,获取所述第一片头视频对应的码率数据φ。
具体的,φ符合如下条件:
Φ=D×8/E,其中,D为所述第一片头视频对应的文件大小,单位为kb,E为所述第一片头视频的时长,单位为s。
上述,通过获取所述第一片头视频也即目标视频文件对应的码率数据,能够扩充所述目标视频文件的相关数据信息。
S302,根据所述预设时长,获取所述第一片头视频对应的目标抽帧间隔F。
具体的,F符合如下条件:
F=L1/240。
S303,根据所述第一片头视频和F,获取第一关键图像集。
具体的,所述第一关键图像集包括若干个第一关键图像,其中,第一关键图像是通过目标视频抽帧模型按照F对所述第一片头视频进行抽帧后得到的图像;可以理解为:获取的任意相邻两个第一关键图像的间隔为F。
具体的,所述目标视频抽帧模型为本领域技术人员知晓的任意一种能够对第一片头视频进行抽帧得到第一关键图像集的视频抽帧模型。
上述,通过在目标视频文件的片头获取预设时长的第一片头视频,并根据对第一片头视频抽帧后得到多张第一关键图像,能够为从所述目标视频文件的片头中获取对应的片名文本提供基础,保证关键片名文本的提取准确度。
S400,根据目标字符识别模型,从第一关键图像集中获取所述目标视频文件对应的关键片名文本。
具体的,所述关键片名文本为所述目标字符识别模型对若干个第一关键图像依次识别后得到的与所述目标视频文件对应的片名文本。
具体的,所述目标字符识别模型为光学字符识别(Optical CharacterRecognition,OCR)模型,本领域技术人员知晓OCR模型的具体实施方式,在此不再赘述。
具体的,根据目标字符识别模型,还可以从第一关键图像集中获取所述目标视频文件对应的提供商等数据信息,以扩充所述目标视频文件对应的相关数据信息。
在一个具体的实施例中,在S400中还包括如下步骤:
S401,当从所述第一关键图像集中未获取到所述关键片名文本时,获取所述目标视频文件对应的第一中间时长Kj,此时,j=1。
具体的,Kj为本领域技术人员根据实际需求设定的时长;例如:1分钟。
S402,从所述目标视频文件中获取Kj对应的关键片头视频P。
具体的,P为所述目标视频文件中与所述第一片头视频连续并在第一片头视频之后的视频;可以理解为:P的开头与所述第一片头视频的结尾连续。
S403,根据P和预设抽帧间隔,获取所述目标视频文件对应的第二关键图像集。
具体的,所述预设抽帧间隔为本领域技术人员根据实际需求设定的间隔;例如:15秒;可以理解为:若所述第一片头视频为1分钟,对所述第一片头视频处理后能够得到4张第一关键图像。
具体的,所述第二关键图像集与所述第一关键图像集的获取方式一致。
S404,若从所述第二关键图像集中未获取到所述关键片名文本,获取所述目标视频文件对应的第二中间时长Kj+1。
具体的,Kj+1符合如下条件:
Kj+1=Kj/2。
S405,将Kj更新为Kj+1,并执行S402-S405,直至获取到所述关键片名文本或直至K≥γ,其中,γ为预设的总时长;可以理解为:若K≥γ时还未获取到所述关键片名文本,则循环结束。
具体的,K符合如下条件:
K=K1+K2+……+Kj+1。
上述,一方面,在从第一片头视频中未获取到关键片名文本时,通过对目标视频文件继续抽帧处理,能够提高获取到目标视频文件对应的关键片名文本的可能性;另一方面,通过对按顺序获取关键片头视频并依次进行处理的方式,能够在获取到所述关键片名文本后不再继续对后续的关键片头视频进行获取,节省计算资源。
S500,根据所述初始片名文本和所述关键片名文本,获取到所述目标片名文本。
在一个具体的实施例中,在S500中通过如下步骤获取所述目标片名文本:
S501,当未获取到所述关键片名文本时,将所述初始片名文本确定为所述目标片名文本。可以理解为:当K≥γ时还未从所述目标视频文件中获取到所述关键片名文本,将所述初始片名文本确定为所述目标片名文本。
S502,当获取到所述关键片名文本时,将所述关键片名文本确定为所述目标片名文本。
上述,由于所述关键片名文本是从目标视频文件中抽取的片名文本,因此将所述关键片名文本作为目标片名文本,提高了对目标视频文件对应的片名文本提取的准确度,而在未获取到关键片名文本时,将去除冗余文本后的初始片名文本作为目标片名文本,也在一定程度上提高了提取目标视频文件对应的片名文本的准确度。
本发明提供了一种获取片名的视频处理系统,所述系统包括:目标视频文件、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:获取所述目标视频文件对应的初始文件名称,根据所述初始文件名称,获取所述目标视频文件对应的初始片名文本,根据所述目标视频文件,获取第一关键图像集,根据目标字符识别模型,从第一关键图像集中获取所述目标视频文件对应的关键片名文本,根据所述初始片名文本和所述关键片名文本,获取到所述目标片名文本。本发明提供了一种新的获取片名的视频处理系统,一方面,本发明通过从目标视频文件中获取第一关键图像集,能够从视频的片头中获取到视频片名,提高了获取的片名的精准度;另一方面,根据目标视频文件的时长,来确定目标视频文件对应的片头时长,并得到该时长对应的第一关键图像集,从而在不用对整个目标视频文件全程进行识别的同时,提高获取到片名的可能性。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明开的范围由所附权利要求来限定。
Claims (10)
1.一种获取片名的视频处理系统,其特征在于,所述系统包括:目标视频文件、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:
S100,获取所述目标视频文件对应的初始文件名称;所述目标视频文件为上传至预设视频库中的任一视频文件;
S200,根据所述初始文件名称,获取所述目标视频文件对应的初始片名文本;
S300,根据所述目标视频文件,获取第一关键图像集;其中,在S300中还通过如下步骤获取所述第一关键图像集:
S301,从所述目标视频文件中获取预设时长的第一片头视频,其中,预设时长符合如下条件:
L1=L0+Lz×α,其中,L1为预设时长,L0为预设的0-60秒内的任意初始时长,Lz为所述目标视频文件的总时长,L1、L0、Lz的单位均为秒;
其中,α符合如下条件:
α=∑z u=1αu/z,其中,z为若干个视频文件样本的数量;
其中,αu符合如下条件:
αu=(Lu1-L0)/Luz,其中,Lu1为从第u个视频文件样本中获取的片头时长,Luz为第u个视频文件样本的总时长;
S302,根据所述预设时长,获取所述第一片头视频对应的目标抽帧间隔F;
S303,根据所述第一片头视频和F,获取第一关键图像集;
S400,根据目标字符识别模型,从第一关键图像集中获取所述目标视频文件对应的关键片名文本;
S500,根据所述初始片名文本和所述关键片名文本,获取到目标片名文本。
2.根据权利要求1所述的获取片名的视频处理系统,其特征在于,在S200中通过如下步骤获取所述初始片名文本:
S201,根据所述初始文件名称,获取第一字符串集AB和AB对应的字符串编码集AB0;
S202,根据预设词库和AB,获取AB对应的第二字符串集AC;
S203,根据AB0和AC,获取所述目标视频文件对应的初始片名文本。
3.根据权利要求2所述的获取片名的视频处理系统,其特征在于,在201中通过如下步骤获取AB:
S2011,根据预设标识符,从所述初始文件名称中获取中间分隔符集A={A1,A2,……,Ai,……,Am},其中,Ai为第i个中间分隔符,i=1,2……m,m为中间分隔符的数量;
S2012,根据A,从所述初始文件名称中获取中间字符串集B={B1,B2,……,Bj,……,Bn},其中,Bj为第j个中间字符串,j=1……n,n为中间字符串的数量;
S2013,将A和B合并成第一字符串集AB={A1,A2,……,Ai,……,Am,B1,B2,……,Bj,……,Bn}。
4.根据权利要求3所述的获取片名的视频处理系统,其特征在于,在S202中通过如下步骤获取AC:
S2021,若从所述预设词库中获取到任一Bj对应的目标字符串,根据AB0,将Bj从AB中删除,获取到AC;其中,所述目标字符串为B中的n个中间字符串对应的n个向量中与任意一个冗余词对应的向量的相似度ξ大于目标阈值的字符串;
S2022,若从所述预设词库中获取到的目标字符串集为空集,将AB作为AC。
5.根据权利要求4所述的获取片名的视频处理系统,其特征在于,ξ符合如下条件:
ξ=(BBj·G)/(||BBj||×||G||),其中,BBj为Bj对应的字符串向量,G为任意一个冗余词对应的词向量。
6.根据权利要求4所述的获取片名的视频处理系统,其特征在于,在S203中通过如下步骤获取所述初始片名文本:
S2031,若所述目标字符串集为空集,将AC中的若干个第二字符串按照AB0的字符串编码顺序依次组合后得到所述初始片名文本;
S2032,若所述目标字符串对应的目标字符串编码为AB0中的最后一个编码,获取到AC0={A1,A2,……,Ai,……,Am-1,B1,B2,……,Bj,……,Bn-1};
S2033,将AC0中的若干个第二字符串按照AB0的字符串编码顺序依次组合后得到所述初始片名文本;
S2034,若所述目标字符串对应的目标字符串编码非AB0中的最后一个编码,获取到AC00={A1,A2,……,Ai,Ai+2,……,Am,B1,B2,……,Bj-1,Bj+1,……,Bn},AC00是将与所述目标字符串编码相邻的后一个字符串编码对应的中间分隔符从AC中删除后得到的;
S2035,将AC00中的若干个第二字符串按照AB0的字符串编码顺序依次组合后得到所述初始片名文本。
7.根据权利要求1所述的获取片名的视频处理系统,其特征在于,在S302中,F符合如下条件:
F=L1/240。
8.根据权利要求1所述的获取片名的视频处理系统,其特征在于,在S400中还包括如下步骤:
S401,当从所述第一关键图像集中未获取到所述关键片名文本时,获取所述目标视频文件对应的第一中间时长Kj,此时,j=1;
S402,从所述目标视频文件中获取Kj对应的关键片头视频P;
S403,根据P和预设抽帧间隔,获取所述目标视频文件对应的第二关键图像集;
S404,若从所述第二关键图像集中未获取到所述关键片名文本,获取所述目标视频文件对应的第二中间时长Kj+1;
S405,将Kj更新为Kj+1,并执行S402-S405,直至获取到所述关键片名文本或直至K≥γ,其中,γ为预设的总时长,K符合如下条件:
K=K1+K2+……+Kj+1。
9.根据权利要求8所述的获取片名的视频处理系统,其特征在于,Kj+1符合如下条件:
Kj+1=Kj/2。
10.根据权利要求1所述的获取片名的视频处理系统,其特征在于,在S500中通过如下步骤获取所述目标片名文本:
S501,当未获取到所述关键片名文本时,将所述初始片名文本确定为所述目标片名文本;
S502,当获取到所述关键片名文本时,将所述关键片名文本确定为所述目标片名文本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311313014.4A CN117058596B (zh) | 2023-10-11 | 2023-10-11 | 一种获取片名的视频处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311313014.4A CN117058596B (zh) | 2023-10-11 | 2023-10-11 | 一种获取片名的视频处理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117058596A CN117058596A (zh) | 2023-11-14 |
CN117058596B true CN117058596B (zh) | 2023-12-29 |
Family
ID=88657557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311313014.4A Active CN117058596B (zh) | 2023-10-11 | 2023-10-11 | 一种获取片名的视频处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117058596B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020015492A1 (zh) * | 2018-07-18 | 2020-01-23 | 腾讯科技(深圳)有限公司 | 识别视频中的关键时间点的方法、装置、计算机设备及存储介质 |
JP2020096342A (ja) * | 2018-12-14 | 2020-06-18 | 北京百度网▲訊▼科技有限公司Beijing Baidu Netcom Science And Technology Co.,Ltd. | 動画を処理するための方法および装置 |
CN112291589A (zh) * | 2020-10-29 | 2021-01-29 | 腾讯科技(深圳)有限公司 | 视频文件的结构检测方法、装置 |
CN114374885A (zh) * | 2021-12-31 | 2022-04-19 | 北京百度网讯科技有限公司 | 视频关键片段确定方法、装置、电子设备及可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11954912B2 (en) * | 2021-04-23 | 2024-04-09 | Ping An Technology (Shenzhen) Co., Ltd. | Method for cutting video based on text of the video and computing device applying method |
-
2023
- 2023-10-11 CN CN202311313014.4A patent/CN117058596B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020015492A1 (zh) * | 2018-07-18 | 2020-01-23 | 腾讯科技(深圳)有限公司 | 识别视频中的关键时间点的方法、装置、计算机设备及存储介质 |
JP2020096342A (ja) * | 2018-12-14 | 2020-06-18 | 北京百度网▲訊▼科技有限公司Beijing Baidu Netcom Science And Technology Co.,Ltd. | 動画を処理するための方法および装置 |
CN112291589A (zh) * | 2020-10-29 | 2021-01-29 | 腾讯科技(深圳)有限公司 | 视频文件的结构检测方法、装置 |
CN114374885A (zh) * | 2021-12-31 | 2022-04-19 | 北京百度网讯科技有限公司 | 视频关键片段确定方法、装置、电子设备及可读存储介质 |
Non-Patent Citations (2)
Title |
---|
MPEG-7 Videotext description scheme for superimposed text in images and video;Nevenka Dimitrova等;Signal Processing: Image Communication;第16卷(第1-2期);137-155 * |
基于深度学习的电视剧剧名识别在广电中的应用;罗晓松等;信息技术与运用(第4期);43-46 * |
Also Published As
Publication number | Publication date |
---|---|
CN117058596A (zh) | 2023-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106328147B (zh) | 语音识别方法和装置 | |
CN106878632B (zh) | 一种视频数据的处理方法和装置 | |
CN106570171B (zh) | 一种基于语义的科技情报处理方法及系统 | |
CN107766571B (zh) | 一种多媒体资源的检索方法和装置 | |
CN111291177A (zh) | 一种信息处理方法、装置和计算机存储介质 | |
CN111242033A (zh) | 一种基于视频和文字对判别分析的视频特征学习方法 | |
CN108108353A (zh) | 一种基于弹幕的视频语义标注方法、装置及电子设备 | |
CN114547370A (zh) | 一种视频摘要提取方法及系统 | |
CN114218348A (zh) | 基于问答文本的直播片段获取方法、装置、设备及介质 | |
CN115098706A (zh) | 一种网络信息提取方法及装置 | |
CN111353055A (zh) | 基于智能标签扩展元数据的编目方法及系统 | |
CN113407775B (zh) | 视频搜索方法、装置及电子设备 | |
CN117058596B (zh) | 一种获取片名的视频处理系统 | |
CN114691861A (zh) | 一种基于主题词语义相似度的话题聚类方法 | |
CN114817586A (zh) | 目标对象的分类方法、装置、电子设备和存储介质 | |
JP6632564B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム | |
JP6530002B2 (ja) | コンテンツ探索装置、コンテンツ探索方法、プログラム | |
CN111666437A (zh) | 一种基于局部匹配的图文检索方法及装置 | |
Hu et al. | Automatic maya hieroglyph retrieval using shape and context information | |
JP2010044614A (ja) | キーフレーズ抽出装置、シーン分割装置およびプログラム | |
Yuan et al. | Mining recurring events through forest growing | |
JP6621437B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム | |
Bui et al. | Zero-shot Video Retrieval using CLIP with Temporally Ordered Multi-query Scoring | |
JP5894852B2 (ja) | 代表静止画抽出装置、及びプログラム | |
JP2007188169A (ja) | 映像被写体抽出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |