CN117058596B

CN117058596B - 一种获取片名的视频处理系统

Info

Publication number: CN117058596B
Application number: CN202311313014.4A
Authority: CN
Inventors: 曹敬涛; 陈学铭; 王磊
Original assignee: Shanghai Kaixiang Information Technology Co ltd
Current assignee: Shanghai Kaixiang Information Technology Co ltd
Priority date: 2023-10-11
Filing date: 2023-10-11
Publication date: 2023-12-29
Anticipated expiration: 2043-10-11
Also published as: CN117058596A

Abstract

本申请涉及视频处理技术领域，特别是涉及一种获取片名的视频处理系统，所述系统包括：目标视频文件、处理器和存储有计算机程序的存储器，计算机程序被处理器执行时，实现以下步骤：获取所述目标视频文件对应的初始文件名称，根据所述初始文件名称，获取所述目标视频文件对应的初始片名文本，根据所述目标视频文件，获取第一关键图像集，根据目标字符识别模型，从第一关键图像集中获取所述目标视频文件对应的关键片名文本，根据所述初始片名文本和所述关键片名文本，获取到所述目标片名文本。本发明根据目标视频文件，获取预设时长的第一片头视频，并得到第一关键图像集，从若干个图像中识别到片名，从而提高获取的片名的精准度。

Description

一种获取片名的视频处理系统

技术领域

本发明涉及视频处理技术领域，特别是涉及一种获取片名的视频处理系统。

背景技术

在从外部资源站搜索影视站内的影视或视频文件时，通常根据文件名进行匹配，而国内目前有很多资源文件的命名并没有完全按照统一的规则进行命名，有很多片名前缀还会带有各类站点广告，导致很多视频影片下载后无法直接爬到元数据和海报。在传统的文件名匹配方式中，通常将文件名放入媒体库中进行扫描，对文件名进行分解后得到片名、发行年份、版本等信息，但是上述现有技术还存在有以下问题：

一方面，直接对文件名进行分解获取到片名，会导致获取的片名包含原文件名中含有的站点广告等字符串，影响片名的准确度。

另一方面，若从视频片头中获取片名时，无法根据视频的时长来选择对视频处理的长度，影响获取到片名的可能性。

发明内容

针对上述技术问题，本发明采用的技术方案为：

一种获取片名的视频处理系统，所述系统包括：目标视频文件、处理器和存储有计算机程序的存储器，当所述计算机程序被处理器执行时，实现以下步骤：

S100，获取所述目标视频文件对应的初始文件名称；所述目标视频文件为上传至预设视频库中的任一视频文件。

S200，根据所述初始文件名称，获取所述目标视频文件对应的初始片名文本。

S300，根据所述目标视频文件，获取第一关键图像集；其中，在S300中还通过如下步骤获取所述第一关键图像集：

S301，从所述目标视频文件中获取预设时长的第一片头视频，其中，预设时长符合如下条件：

L₁=L₀+L_z×α，其中，L₁为预设时长，L₀为预设的0-60秒内的任意初始时长，L_z为所述目标视频文件的总时长，L₁、L₀、L_z的单位均为秒；

其中，α符合如下条件：

α=∑^z _u=1α_u/z，其中，z为若干个视频文件样本的数量；

其中，α_u符合如下条件：

α_u=（L_u1-L₀）/L_uz，其中，L_u1为从第u个视频文件样本中获取的片头时长，L_uz为第u个视频文件样本的总时长。

S302，根据所述预设时长，获取所述第一片头视频对应的目标抽帧间隔F。

S303，根据所述第一片头视频和F，获取第一关键图像集。

S400，根据目标字符识别模型，从第一关键图像集中获取所述目标视频文件对应的关键片名文本。

S500，根据所述初始片名文本和所述关键片名文本，获取到所述目标片名文本。

本发明与现有技术相比具有明显的有益效果，借由上述技术方案，本发明提供的一种获取片名的视频处理系统可达到相当的技术进步性及实用性，并具有产业上的广泛利用价值，其至少具有以下有益效果：

本发明提供了一种获取片名的视频处理系统，所述系统包括：目标视频文件、处理器和存储有计算机程序的存储器，当所述计算机程序被处理器执行时，实现以下步骤：获取所述目标视频文件对应的初始文件名称，根据所述初始文件名称，获取所述目标视频文件对应的初始片名文本，根据所述目标视频文件，获取第一关键图像集，根据目标字符识别模型，从第一关键图像集中获取所述目标视频文件对应的关键片名文本，根据所述初始片名文本和所述关键片名文本，获取到所述目标片名文本。本发明提供了一种新的获取片名的视频处理系统，一方面，本发明通过从目标视频文件中获取第一关键图像集，能够从视频的片头中获取到视频片名，提高了获取的片名的精准度；另一方面，根据目标视频文件的时长，来确定目标视频文件对应的片头时长，并得到该时长对应的第一关键图像集，从而在不用对整个目标视频文件全程进行识别的同时，提高获取到片名的可能性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种获取片名的视频处理系统执行计算机程序的流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明提供了一种获取片名的视频处理系统，所述系统包括：目标视频文件、处理器和存储有计算机程序的存储器，当所述计算机程序被处理器执行时，实现以下步骤，如图1所示：

具体的，所述预设视频库为存储有若干个预设视频文件的视频库，其中，可以根据用户的搜索信息从预设视频库中为用户提供对应的预设视频文件。

具体的，所述目标视频文件对应的初始文件名称为该目标视频文件上传至预设视频库时的文件名称。

在一个具体的实施例中，在S200中通过如下步骤获取所述初始片名文本：

S201，根据所述初始文件名称，获取第一字符串集AB和AB对应的字符串编码集AB⁰。

在一个具体的实施例中，在S201中通过如下步骤获取AB：

S2011，根据预设标识符，从所述初始文件名称中获取中间分隔符集A={A₁，A₂，……，A_i，……，A_m}，其中，A_i为第i个中间分隔符，i=1，2……m，m为中间分隔符的数量。

具体的，所述预设标识符为预先设置的标识符，例如：“/”，“”，“空格”，“.”。

具体的，所述中间分隔符是指所述初始文件名称中与任一预设标识符相同的分隔符。

S2012，根据A，从所述初始文件名称中获取中间字符串集B={B₁，B₂，……，B_j，……，B_n}，其中，B_j为第j个中间字符串，j=1……n，n为中间字符串的数量。

具体的，所述中间字符串为按照中间分隔符对所述初始文件名称进行分割后，并将中间分隔符删除后得到的任一字符串。

S2013，将A和B合并成第一字符串集AB={A₁，A₂，……，A_i，……，A_m，B₁，B₂，……，B_j，……，B_n}；可以理解为：第一字符串为中间分隔符和中间字符串中的任意一个。

具体的，AB⁰为根据所述初始文件名称对应的若干个第一字符串的先后顺序依次对AB中的中间字符串和中间分隔符进行编码后得到的编码集；例如，所述初始文件名称为：广告青春变形记，对上述三个第一字符串依次进行编码，得到 “广告”对应的编码为1，“”对应的编码为2，“青春变形记”对应的编码为3。

上述，通过根据与预设标识符一致的中间分隔符，对初始文件名称进行分解，能够得到更准确合理的中间字符串集和中间分隔符集，进而获取到初始文件名称对应的关键字符串集，便于根据初始文件名称进行后续的处理。

S202，根据预设词库和AB，获取AB对应的第二字符串集AC。

具体的，所述预设词库为存储有若干个冗余词的词库；其中，所述冗余词为预设词库中预先设置的与所述目标视频文件的片名无关的词，例如，人人视频、电影天堂、广告等文本。

在一个具体的实施例中，在S202中通过如下步骤获取AC：

S2021，若从所述预设词库中获取到任一B_j对应的目标字符串，根据AB⁰，将B_j从AB中删除，获取到AC；可以理解为：AC为根据预设词库和目标字符串对应的中间字符串的字符串编码，将目标字符串对应的中间字符串从B中去除后得到的若干个中间字符串和m个中间分隔符的集合。

具体的，所述目标字符串为B中的n个中间字符串对应的n个向量中与任意一个冗余词对应的向量的相似度ξ大于目标阈值的字符串。

具体的，ξ符合如下条件：

ξ=(BB_j·G)/(||BB_j||×||G||)，其中，BB_j为B_j对应的字符串向量，G为任意一个冗余词对应的词向量。

具体的，所述目标阈值为本领域技术人员根据实际需求预先设置的阈值，例如：80%。

S2022，若从所述预设词库中获取到的目标字符串集为空集，将AB作为AC；可以理解为：若在预设词库中，未获取到任一B_j对应的目标字符串，则目标字符串集为空集。

上述，根据预设词库中存储的冗余词，从所述第一字符串集中删除掉与任意一个冗余词的相似度大于目标阈值的第一字符串，能够使后续得到的目标视频文件的片名更加准确。

S203，根据AB⁰和AC，获取所述目标视频文件对应的初始片名文本。

在一个具体的实施例中，在S203中通过如下步骤获取所述初始片名文本：

S2031，若所述目标字符串集为空集，将AC中的若干个第二字符串按照AB⁰的字符串编码顺序依次组合后得到所述初始片名文本。

S2032，若所述目标字符串对应的目标字符串编码为AB⁰中的最后一个编码，获取到AC⁰={A₁，A₂，……，A_i，……，A_m-1，B₁，B₂，……，B_j，……，B_n-1}。

具体的，所述目标字符串对应的目标字符串编码是指所述目标字符串对应的中间字符串的字符串编码。

具体的，AC⁰是将与所述目标字符串编码相邻的关键字符串编码对应的中间分隔符从AC中删除后得到的；可以理解为：所述关键字符串编码为AB⁰中的倒数第二个编码，所述关键字符串编码对应的中间分隔符为A中的最后一个中间分隔符。

S2033，将AC⁰中的若干个第二字符串按照AB⁰的字符串编码顺序依次组合后得到所述初始片名文本。

S2034，若所述目标字符串对应的目标字符串编码非AB⁰中的最后一个编码，获取到AC⁰⁰={A₁，A₂，……，A_i，A_i+2，……，A_m，B₁，B₂，……，B_j-1，B_j+1，……，B_n}。

具体的，AC⁰⁰是将与所述目标字符串编码相邻的后一个字符串编码对应的中间分隔符从AC中删除后得到的；可以理解为：目标字符串对应的字符串编码为B_j对应的字符串编码时，与所述目标字符串编码相邻的后一个字符串编码是指在AB⁰中位于B_j对应的字符串编码的后面一个编码。

S2035，将AC⁰⁰中的若干个第二字符串按照AB⁰的字符串编码顺序依次组合后得到所述初始片名文本。

上述，通过将初始文件名称中的目标字符串对应的中间字符串清除后，再将与该中间字符串相邻的中间分隔符删除，能够得到格式更加合理的初始片名文本，同时也减少了初始片名文本的冗余度。

S300，根据所述目标视频文件，获取第一关键图像集。

在一个具体的实施例中，在S300中还通过如下步骤获取所述第一关键图像集：

S301，从所述目标视频文件中获取预设时长的第一片头视频。

具体的，所述预设时长符合如下条件：

L₁=L₀+L_z×α，其中，L₁为预设时长，L₀为预设的0-60秒内的任意初始时长，L_z为所述目标视频文件的总时长，L₁、L₀、L_z的单位均为秒。

具体的，α符合如下条件：

α=∑^z _u=1α_u/z，其中，z为若干个视频文件样本的数量。

具体的，α_u符合如下条件：

具体的，所述第一片头视频为从所述目标视频文件的开头时刻延伸至预设时长时获取的视频。

上述，根据所述目标视频文件的总时长，来确定预设时长，能够提高从该预设时长对应的第一片头视频中获取到关键片名文本的可能性。

在一个具体的实施例中，在S301中还包括如下步骤：

S3010，根据所述第一片头视频，获取所述第一片头视频对应的码率数据φ。

具体的，φ符合如下条件：

Φ=D×8/E，其中，D为所述第一片头视频对应的文件大小，单位为kb，E为所述第一片头视频的时长，单位为s。

上述，通过获取所述第一片头视频也即目标视频文件对应的码率数据，能够扩充所述目标视频文件的相关数据信息。

具体的，F符合如下条件：

F=L₁/240。

S303，根据所述第一片头视频和F，获取第一关键图像集。

具体的，所述第一关键图像集包括若干个第一关键图像，其中，第一关键图像是通过目标视频抽帧模型按照F对所述第一片头视频进行抽帧后得到的图像；可以理解为：获取的任意相邻两个第一关键图像的间隔为F。

具体的，所述目标视频抽帧模型为本领域技术人员知晓的任意一种能够对第一片头视频进行抽帧得到第一关键图像集的视频抽帧模型。

上述，通过在目标视频文件的片头获取预设时长的第一片头视频，并根据对第一片头视频抽帧后得到多张第一关键图像，能够为从所述目标视频文件的片头中获取对应的片名文本提供基础，保证关键片名文本的提取准确度。

具体的，所述关键片名文本为所述目标字符识别模型对若干个第一关键图像依次识别后得到的与所述目标视频文件对应的片名文本。

具体的，所述目标字符识别模型为光学字符识别（Optical CharacterRecognition，OCR）模型，本领域技术人员知晓OCR模型的具体实施方式，在此不再赘述。

具体的，根据目标字符识别模型，还可以从第一关键图像集中获取所述目标视频文件对应的提供商等数据信息，以扩充所述目标视频文件对应的相关数据信息。

在一个具体的实施例中，在S400中还包括如下步骤：

S401，当从所述第一关键图像集中未获取到所述关键片名文本时，获取所述目标视频文件对应的第一中间时长K_j，此时，j=1。

具体的，K_j为本领域技术人员根据实际需求设定的时长；例如：1分钟。

S402，从所述目标视频文件中获取K_j对应的关键片头视频P。

具体的，P为所述目标视频文件中与所述第一片头视频连续并在第一片头视频之后的视频；可以理解为：P的开头与所述第一片头视频的结尾连续。

S403，根据P和预设抽帧间隔，获取所述目标视频文件对应的第二关键图像集。

具体的，所述预设抽帧间隔为本领域技术人员根据实际需求设定的间隔；例如：15秒；可以理解为：若所述第一片头视频为1分钟，对所述第一片头视频处理后能够得到4张第一关键图像。

具体的，所述第二关键图像集与所述第一关键图像集的获取方式一致。

S404，若从所述第二关键图像集中未获取到所述关键片名文本，获取所述目标视频文件对应的第二中间时长K_j+1。

具体的，K_j+1符合如下条件：

K_j+1=K_j/2。

S405，将K_j更新为K_j+1，并执行S402-S405，直至获取到所述关键片名文本或直至K≥γ，其中，γ为预设的总时长；可以理解为：若K≥γ时还未获取到所述关键片名文本，则循环结束。

具体的，K符合如下条件：

K=K₁+K₂+……+K_j+1。

上述，一方面，在从第一片头视频中未获取到关键片名文本时，通过对目标视频文件继续抽帧处理，能够提高获取到目标视频文件对应的关键片名文本的可能性；另一方面，通过对按顺序获取关键片头视频并依次进行处理的方式，能够在获取到所述关键片名文本后不再继续对后续的关键片头视频进行获取，节省计算资源。

在一个具体的实施例中，在S500中通过如下步骤获取所述目标片名文本：

S501，当未获取到所述关键片名文本时，将所述初始片名文本确定为所述目标片名文本。可以理解为：当K≥γ时还未从所述目标视频文件中获取到所述关键片名文本，将所述初始片名文本确定为所述目标片名文本。

S502，当获取到所述关键片名文本时，将所述关键片名文本确定为所述目标片名文本。

上述，由于所述关键片名文本是从目标视频文件中抽取的片名文本，因此将所述关键片名文本作为目标片名文本，提高了对目标视频文件对应的片名文本提取的准确度，而在未获取到关键片名文本时，将去除冗余文本后的初始片名文本作为目标片名文本，也在一定程度上提高了提取目标视频文件对应的片名文本的准确度。

虽然已经通过示例对本发明的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上示例仅是为了进行说明，而不是为了限制本发明的范围。本领域的技术人员还应理解，可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明开的范围由所附权利要求来限定。

Claims

1.一种获取片名的视频处理系统，其特征在于，所述系统包括：目标视频文件、处理器和存储有计算机程序的存储器，当所述计算机程序被处理器执行时，实现以下步骤：

S100，获取所述目标视频文件对应的初始文件名称；所述目标视频文件为上传至预设视频库中的任一视频文件；

S200，根据所述初始文件名称，获取所述目标视频文件对应的初始片名文本；

其中，α符合如下条件：

α=∑^z _u=1α_u/z，其中，z为若干个视频文件样本的数量；

其中，α_u符合如下条件：

α_u=（L_u1-L₀）/L_uz，其中，L_u1为从第u个视频文件样本中获取的片头时长，L_uz为第u个视频文件样本的总时长；

S302，根据所述预设时长，获取所述第一片头视频对应的目标抽帧间隔F；

S303，根据所述第一片头视频和F，获取第一关键图像集；

S400，根据目标字符识别模型，从第一关键图像集中获取所述目标视频文件对应的关键片名文本；

S500，根据所述初始片名文本和所述关键片名文本，获取到目标片名文本。

2.根据权利要求1所述的获取片名的视频处理系统，其特征在于，在S200中通过如下步骤获取所述初始片名文本：

S201，根据所述初始文件名称，获取第一字符串集AB和AB对应的字符串编码集AB⁰；

S202，根据预设词库和AB，获取AB对应的第二字符串集AC；

3.根据权利要求2所述的获取片名的视频处理系统，其特征在于，在201中通过如下步骤获取AB：

S2011，根据预设标识符，从所述初始文件名称中获取中间分隔符集A={A₁，A₂，……，A_i，……，A_m}，其中，A_i为第i个中间分隔符，i=1，2……m，m为中间分隔符的数量；

S2012，根据A，从所述初始文件名称中获取中间字符串集B={B₁，B₂，……，B_j，……，B_n}，其中，B_j为第j个中间字符串，j=1……n，n为中间字符串的数量；

S2013，将A和B合并成第一字符串集AB={A₁，A₂，……，A_i，……，A_m，B₁，B₂，……，B_j，……，B_n}。

4.根据权利要求3所述的获取片名的视频处理系统，其特征在于，在S202中通过如下步骤获取AC：

S2021，若从所述预设词库中获取到任一B_j对应的目标字符串，根据AB⁰，将B_j从AB中删除，获取到AC；其中，所述目标字符串为B中的n个中间字符串对应的n个向量中与任意一个冗余词对应的向量的相似度ξ大于目标阈值的字符串；

S2022，若从所述预设词库中获取到的目标字符串集为空集，将AB作为AC。

5.根据权利要求4所述的获取片名的视频处理系统，其特征在于，ξ符合如下条件：

6.根据权利要求4所述的获取片名的视频处理系统，其特征在于，在S203中通过如下步骤获取所述初始片名文本：

S2031，若所述目标字符串集为空集，将AC中的若干个第二字符串按照AB⁰的字符串编码顺序依次组合后得到所述初始片名文本；

S2032，若所述目标字符串对应的目标字符串编码为AB⁰中的最后一个编码，获取到AC⁰={A₁，A₂，……，A_i，……，A_m-1，B₁，B₂，……，B_j，……，B_n-1}；

S2033，将AC⁰中的若干个第二字符串按照AB⁰的字符串编码顺序依次组合后得到所述初始片名文本；

S2034，若所述目标字符串对应的目标字符串编码非AB⁰中的最后一个编码，获取到AC⁰⁰={A₁，A₂，……，A_i，A_i+2，……，A_m，B₁，B₂，……，B_j-1，B_j+1，……，B_n}，AC⁰⁰是将与所述目标字符串编码相邻的后一个字符串编码对应的中间分隔符从AC中删除后得到的；

7.根据权利要求1所述的获取片名的视频处理系统，其特征在于，在S302中，F符合如下条件：

F=L₁/240。

8.根据权利要求1所述的获取片名的视频处理系统，其特征在于，在S400中还包括如下步骤：

S401，当从所述第一关键图像集中未获取到所述关键片名文本时，获取所述目标视频文件对应的第一中间时长K_j，此时，j=1；

S402，从所述目标视频文件中获取K_j对应的关键片头视频P；

S403，根据P和预设抽帧间隔，获取所述目标视频文件对应的第二关键图像集；

S404，若从所述第二关键图像集中未获取到所述关键片名文本，获取所述目标视频文件对应的第二中间时长K_j+1；

S405，将K_j更新为K_j+1，并执行S402-S405，直至获取到所述关键片名文本或直至K≥γ，其中，γ为预设的总时长，K符合如下条件：

K=K₁+K₂+……+K_j+1。

9.根据权利要求8所述的获取片名的视频处理系统，其特征在于，K_j+1符合如下条件：

K_j+1=K_j/2。

10.根据权利要求1所述的获取片名的视频处理系统，其特征在于，在S500中通过如下步骤获取所述目标片名文本：

S501，当未获取到所述关键片名文本时，将所述初始片名文本确定为所述目标片名文本；