CN114765702A - 视频的处理方法、装置及计算机可读存储介质 - Google Patents
视频的处理方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN114765702A CN114765702A CN202110054490.3A CN202110054490A CN114765702A CN 114765702 A CN114765702 A CN 114765702A CN 202110054490 A CN202110054490 A CN 202110054490A CN 114765702 A CN114765702 A CN 114765702A
- Authority
- CN
- China
- Prior art keywords
- video
- videos
- similarity
- target
- collection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 50
- 238000000034 method Methods 0.000 claims abstract description 34
- 238000012216 screening Methods 0.000 claims abstract description 32
- 238000000605 extraction Methods 0.000 claims description 34
- 230000011218 segmentation Effects 0.000 claims description 33
- 238000012163 sequencing technique Methods 0.000 claims description 23
- 238000010276 construction Methods 0.000 claims description 2
- 230000015654 memory Effects 0.000 description 23
- 238000012015 optical character recognition Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 11
- 239000013598 vector Substances 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001680 brushing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/75—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种视频的处理方法、装置及计算机可读存储介质;方法包括:获取视频对应的目标对象的至少一个历史发布视频;分别确定所述视频与各所述历史发布视频的相似度,并从所述至少一个历史发布视频中,筛选得到相似度满足相似度条件的至少一个候选视频;获取所述至少一个候选视频中与所述视频归属于同一视频主题的目标视频;构建对应所述视频主题的视频合集,所述视频合集包括所述视频以及所述目标视频;当接收到针对所述视频合集中任一视频的播放请求时,返回所述视频合集对应的推荐信息;通过本申请,能够提高获取的视频间的相关性,以提升视频的推荐成功率。
Description
技术领域
本申请涉及人工智能和互联网技术领域,尤其涉及一种视频的处理方法、装置、电子设备及存储介质。
背景技术
人工智能(AI,Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
推荐系统是人工智能的重要应用分支。在进行视频的推荐时,往往为用户推荐具有相关性的视频,比如连载视频,相关技术中,在进行相关性视频获取时,往往采用文本匹配算法或基于规则的文本匹配算法,进行相关性视频匹配时,匹配到的视频准确度较低,致使获取的待推荐的多个视频间的相关性较低。
发明内容
本申请实施例提供一种视频的处理方法、装置、电子设备及存储介质,能够提高获取的视频间的相关性,以提升视频的推荐成功率。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种视频的处理方法,包括:
获取视频对应的目标对象的至少一个历史发布视频;
分别确定所述视频与各所述历史发布视频的相似度,并从所述至少一个历史发布视频中,筛选得到相似度满足相似度条件的至少一个候选视频;
获取所述至少一个候选视频中与所述视频归属于同一视频主题的目标视频;
构建对应所述视频主题的视频合集,所述视频合集包括所述视频以及所述目标视频;
当接收到针对所述视频合集中任一视频的播放请求时,返回所述视频合集对应的推荐信息。
本申请实施例还提供一种视频的处理装置,包括:
第一获取模块,用于获取视频对应的目标对象的至少一个历史发布视频;
筛选模块,用于分别确定所述视频与各所述历史发布视频的相似度,并从所述至少一个历史发布视频中,筛选得到相似度满足相似度条件的至少一个候选视频;
第二获取模块,用于获取所述至少一个候选视频中与所述视频归属于同一视频主题的目标视频;
构建模块,用于构建对应所述视频主题的视频合集,所述视频合集包括所述视频以及所述目标视频;
返回模块,用于当接收到针对所述视频合集中任一视频的播放请求时,返回所述视频合集对应的推荐信息。
上述方案中,当所述视频合集所对应的视频类型为连载型视频时,所述第一获取模块,还用于获取所述视频关联的文本信息;
对所述文本信息进行关键字提取,得到所述视频的视频关键字;
基于所述视频关键字,确定所述视频的视频类型;
当所述视频类型表征所述视频为连载型视频时,获取视频对应的目标对象的至少一个历史发布视频。
上述方案中,当所述视频合集所对应的视频类型为连载型视频时,所述筛选模块,还用于分别获取各所述历史发布视频关联的文本信息,并
对各所述文本信息进行关键字提取,得到各所述历史发布视频的视频关键字;
基于所述视频关键字,分别确定各所述历史发布视频的视频类型,并确定获取的历史发布视频中视频类型为连载型视频的历史发布视频;
分别确定所述视频与视频类型为连载型视频的历史发布视频的相似度。
上述方案中,所述筛选模块,还用于获取所述视频关联的第一文本信息、以及各所述历史发布视频关联的第二文本信息;
对所述第一文本信息进行特征提取,得到所述视频对应的第一文本特征;
分别对各所述历史发布视频关联的第二文本信息进行特征提取,得到各所述历史发布视频对应的第二文本特征;
分别确定所述第一文本特征与各所述第二文本特征的特征相似度,将所述第一文本特征与各所述第二文本特征的特征相似度,作为所述视频与各所述历史发布视频的相似度。
上述方案中,所述筛选模块,还用于提取所述视频的视频帧、以及各所述历史发布视频的视频帧;
对所述视频的视频帧进行特征提取,得到所述视频对应的第一视频帧特征;
分别对各所述历史发布视频的视频帧进行特征提取,得到各所述历史发布视频对应的第二视频帧特征;
分别确定所述第一视频帧特征与各所述第二视频帧特征的特征相似度,将所述第一视频帧特征与各所述第二视频帧特征的特征相似度,作为所述视频与各所述历史发布视频的相似度。
上述方案中,所述筛选模块,还用于基于所述视频与各所述历史发布视频的相似度,确定所述至少一个历史发布视频中,相似度在目标相似度区间范围内的历史发布视频;
将所述相似度在目标相似度区间范围内的历史发布视频作为相似度满足相似度条件的候选视频。
上述方案中,所述第二获取模块,还用于获取所述视频的第一视频标签,以及各所述候选视频的第二视频标签;
分别将所述第一视频标签与各所述第二视频标签进行匹配,得到所述第一视频标签与各所述第二视频标签的匹配度;
将匹配度达到匹配度阈值的第二视频标签所对应的候选视频,作为与所述视频归属于同一视频主题的目标视频。
上述方案中,所述第二获取模块,还用于对所述视频关联的文本信息进行分词处理,得到所述视频对应的第一词语序列;
分别对各所述候选视频关联的文本信息进行分词处理,得到各所述候选视频对应的第二词语序列;
分别确定所述第一词语序列与各所述第二词语序列之间的词语重叠度;
将词语重叠度达到重叠度阈值的第二词语序列所对应的候选视频,作为与所述视频归属于同一视频主题的目标视频。
上述方案中,所述第二获取模块,还用于对所述视频关联的文本信息进行分词处理,得到所述视频对应的第一词语序列;
分别对各所述候选视频关联的文本信息进行分词处理,得到各所述候选视频对应的第二词语序列;
分别确定所述第一词语序列与各所述第二词语序列之间的目标公共分词、以及所述目标公共分词在所述第二词语序列中的分词占比;
将分词占比达到占比阈值的目标公共分词所对应的候选视频,作为与所述视频归属于同一视频主题的目标视频。
上述方案中,所述构建模块,还用于当所述目标视频的数量为至少两个时,分别获取所述视频以及各所述目标视频的发布时间点;
按照所述发布时间点的先后顺序,对所述视频以及各所述目标视频进行排序,得到排序后的第一视频序列;
基于所述第一视频序列,构建对应所述视频主题的视频合集。
上述方案中,所述构建模块,还用于当所述目标视频的数量为至少两个时,获取所述视频关联的第一文本信息、以及各所述目标视频关联的第二文本信息;
对所述第一文本信息进行编号关键字提取,得到所述视频的第一编号,并对各所述第二文本信息进行编号关键字提取,得到相应目标视频的第二编号;
其中,所述编号关键字用于指示相应视频的发布顺序;
按照所述第一编号以及第二编号的编号大小,对所述视频以及至少两个所述目标视频进行排序,得到排序后的第二视频序列;
基于所述第二视频序列,构建对应所述视频主题的视频合集。
上述方案中,所述构建模块,还用于当所述目标视频的数量为至少两个时,分别获取所述视频以及各所述目标视频的发布时间点;
获取任意两个发布时间点间的时间差;
当基于获取的时间差确定存在小于时间差阈值的时间差时,分别对所述视频以及各所述目标视频进行编号关键字提取,得到相应的编号;
其中,所述编号关键字用于指示相应视频的发布顺序;
按照编号大小,对所述视频以及各所述目标视频进行排序,得到排序后的第三视频序列;
基于所述第三视频序列,构建对应所述视频主题的视频合集。
上述方案中,所述返回模块,还用于返回所述视频合集对应的推荐信息至终端,所述推荐信息包括:所述视频合集对应的入口信息及所述视频合集的描述信息;
其中,所述入口信息,用于供所述终端基于所述入口信息呈现所述视频合集的查看入口。
本申请实施例还提供一种电子设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的视频的处理方法。
本申请实施例还提供一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时,实现本申请实施例提供的视频的处理方法。
本申请实施例具有以下有益效果:
首先获取视频对应的目标对象的至少一个历史发布视频,然后根据视频与各历史发布视频之间的相似度,从至少一个历史发布视频中,筛选得到相似度满足相似度条件的至少一个候选视频,再从该至少一个候选视频中筛选得到与视频归属于同一视频主题的目标视频,从而基于该视频以及目标视频,构建对应视频主题的视频合集;由于构建的视频合集中的视频对应的是同一目标对象、相似度满足相似度条件,且归属于同一视频主题,相较于相关技术中基于文本匹配算法获取相关性视频的方式,大大提高了所获取视频间的相关性,如此,当接收到针对视频合集中任一视频的播放请求时,返回该视频合集对应的推荐信息,以便于用户在观看完毕所请求的视频时,可以基于推荐信息,观看与该视频相关的且归属于同一视频主题的其他视频,从而满足用户想要观看与当前播放视频相关的视频的即时需求,提升视频的推荐效果。
附图说明
图1是本申请实施例提供的视频的处理系统100的架构示意图;
图2是本申请实施例提供的视频的处理方法的电子设备500的结构示意图;
图3是本申请实施例提供的视频的处理方法的流程示意图;
图4是本申请实施例提供的查看入口以及描述信息的呈现示意图;
图5是本申请实施例提供的视频的处理方法的流程示意图;
图6是本申请实施例提供的视频的处理方法的流程示意图;
图7是本申请实施例提供的关键词提取模块的处理流程示意图;
图8是本申请实施例提供的连载内容判定模块的处理流程示意图;
图9是本申请实施例提供的连载内容排序模块的处理流程示意图;
图10是本申请实施例提供的视频的处理装置555的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)客户端,终端中运行的用于提供各种服务的应用程序,例如即时通讯客户端、视频播放客户端。
2)响应于,用于表示所执行的操作所依赖的条件或者状态,当满足所依赖的条件或状态时,所执行的一个或多个操作可以是实时的,也可以具有设定的延迟;在没有特别说明的情况下,所执行的多个操作不存在执行先后顺序的限制。
3)光学字符识别(OCR,Optical Character Recognition),通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其他印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。
4)Bert(Bidirection Encoder Representations from Transformers)模型:本质上是通过在海量的语料的基础上运行自监督学习方法为单词学习一个好的特征表示。
5)Faiss:一款稠密向量检索工具。针对聚类和相似性搜索库,为稠密向量提供高效相似度搜索和聚类,支持十亿级别向量的搜索,是目前最为成熟的近似近邻搜索库。
6)连续词汇学习模型(CBOW,Continuous Bag-of-Words),CBOW模型的训练输入是某一个特征词的上下文相关的词对应的词向量,而输出就是这特定的一个词的词向量。
基于上述对本申请实施例中涉及的名词和术语的解释,下面说明本申请实施例提供的视频的处理系统。参见图1,图1是本申请实施例提供的视频的处理系统100的架构示意图,为实现支撑一个示例性应用,终端(示例性示出了终端400-1和终端400-2)通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合,使用无线或有线链路实现数据传输。
服务器200,用于获取视频对应的目标对象的至少一个历史发布视频;分别确定视频与各历史发布视频的相似度,并从至少一个历史发布视频中,筛选得到相似度满足相似度条件的至少一个候选视频;获取至少一个候选视频中与视频归属于同一视频主题的目标视频;构建对应视频主题的视频合集;
终端(如终端400-1和终端400-2),用于响应于用户针对视频合集中任一视频的播放指令,发送针对视频合集中任一视频的播放请求至服务器200;
服务器200,用于接收到针对视频合集中任一视频的播放请求,响应于播放请求,返回相应的视频数据、以及视频合集对应的推荐信息,这里,该推荐信息可以包括视频合集对应的入口信息及视频合集的描述信息;
终端(如终端400-1和终端400-2),用于接收到视频的视频数据以及视频合集的推荐信息,在图形界面410(示例性示出了图形界面410-1和图形界面410-2)呈现播放的视频,并基于入口信息呈现视频合集的查看入口,同时呈现视频合集的描述信息。
在实际应用中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端(如终端400-1和终端400-2)可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能电视、智能手表等,但并不局限于此。终端(如终端400-1和终端400-2)以及服务器200可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
参见图2,图2是本申请实施例提供的视频的处理方法的电子设备500的结构示意图。在实际应用中,电子设备500可以为图1示出的服务器或终端,以电子设备500为图1示出的服务器为例,对实施本申请实施例的视频的处理方法的电子设备进行说明,本申请实施例提供的电子设备500包括:至少一个处理器510、存储器550、至少一个网络接口520和用户接口530。电子设备500中的各个组件通过总线系统540耦合在一起。可理解,总线系统540用于实现这些组件之间的连接通信。总线系统540除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统540。
处理器510可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口530包括使得能够呈现媒体内容的一个或多个输出装置531,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口530还包括一个或多个输入装置532,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器550可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器550可选地包括在物理位置上远离处理器510的一个或多个存储设备。
存储器550包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器550旨在包括任意适合类型的存储器。
在一些实施例中,存储器550能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统551,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块552,用于经由一个或多个(有线或无线)网络接口520到达其他计算设备,示例性的网络接口520包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;
呈现模块553,用于经由一个或多个与用户接口530相关联的输出装置531(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
输入处理模块554,用于对一个或多个来自一个或多个输入装置532之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本申请实施例提供的视频的处理装置可以采用软件方式实现,图2示出了存储在存储器550中的视频的处理装置555,其可以是程序和插件等形式的软件,包括以下软件模块:第一获取模块5551、筛选模块5552、第二获取模块5553、构建模块5554和返回模块5555,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分,将在下文中说明各个模块的功能。
在另一些实施例中,本申请实施例提供的视频的处理装置可以采用软硬件结合的方式实现,作为示例,本申请实施例提供的视频的处理装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本申请实施例提供的视频的处理方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application SpecificIntegrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Comp lex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programm able Gate Array)或其他电子元件。
基于上述对本申请实施例提供的视频的处理系统及电子设备的说明,下面说明本申请实施例提供的视频的处理方法。在一些实施例中,本申请实施例提供的视频的处理方法可由服务器或终端单独实施,或由服务器及终端协同实施,下面以服务器实施为例说明本申请实施例提供的视频的处理方法。
参见图3,图3是本申请实施例提供的视频的处理方法的流程示意图,本申请实施例提供的视频的处理方法包括:
步骤101:服务器获取视频对应的目标对象的至少一个历史发布视频。
这里,服务器可以是客户端的后台服务器,比如视频客户端的后台服务器。在实际应用中,该客户端可以供用户观看或者发布视频。在本申请实施例中,构建针对某个视频的视频合集以提高视频推荐的精确度,服务器在构建针对某视频的视频合集时,首先获取该视频对应的目标对象的多个历史发布视频。这里该目标对象为该视频的发布者。
在一些实施例中,当视频合集所对应的视频类型为连载型视频时,服务器可通过如下方式获取视频对应的目标对象的至少一个历史发布视频:获取视频关联的文本信息;对文本信息进行关键字提取,得到视频的视频关键字;基于视频关键字,确定视频的视频类型;当视频类型表征视频为连载型视频时,获取视频对应的目标对象的至少一个历史发布视频。
在实际应用中,当所构建的视频合集对应的视频类型为连载型视频时,即视频合集中的视频的视频类型为连载型视频时,服务器在获取视频对应的目标对象的历史发布视频时,需要首先对视频的视频类型进行识别。具体地,服务器可通过如下方式对视频的视频类型进行识别:首先获取视频关联的文本信息,比如用户发布视频时输入的标题、简介等文本描述信息、或者对视频包含的目标视频帧(比如首帧视频帧)进行OCR识别得到的文本信息等;然后对视频关联的文本信息进行关键字提取,得到视频的视频关键字;从而基于视频关键字确定该视频的视频类型,比如当识别到视频的文本信息包含“第二集”、“第2集”、“第贰集”、“上集”、“中集”、“下集”、“上”、“中”、“下”、“二”、“(二)”、“2”、“(2)”等视频关键字时,则确定该视频的视频类型为连载型。
在确定视频的视频类型后,当该视频类型表征视频为连载型视频时,此时则可以进一步获取视频对应的目标对象的历史发布视频,以基于该视频构建连载型视频的视频合集。而该视频类型表征视频为非连载型视频时,则无法基于该视频构建连载型视频的视频合集,此时则可以无需获取视频对应的目标对象的历史发布视频。
步骤102:分别确定视频与各历史发布视频的相似度,并从至少一个历史发布视频中,筛选得到相似度满足相似度条件的至少一个候选视频。
这里,在获取到视频对应的目标对象的多个历史发布视频后,可以分别确定该视频与各历史发布视频的相似度,以从该多个历史发布视频中筛选得到相似度满足相似度条件的候选视频。在实际应用中,该相似度条件可以是预设的相似度区间,将相似度处于该相似度区间范围内的历史发布视频作为候选视频,比如该相似度区间为第一相似度至第二相似度(其中,第一相似度小于第二相似度),基于此,可以将相似度高于第一相似度且低于第二相似度的历史发布视频作为候选视频;在实际应用中,第一相似度及第二相似度的值可以依据实际需要进行设定,例如第一相似度的值为10%,第二相似度的值为80%。
这里,相似度高于第二相似度的历史发布视频可以认为是与该视频为相同视频、或者为该视频的某个视频片段。因此,在实际应用中存在如下情况,目标对象的历史发布视频中可能包含当前上传视频的视频片段(比如视频的精彩片段),或者当前上传视频为某个历史发布视频的视频片段;此时,在进行相似度计算后,若当前视频与历史发布视频的相似度达到第二相似度,将与当前视频达到第二相似度的历史发布视频作为目标历史发布视频,获取当前视频的时长、目标历史发布视频的时长及二者的时长差值,若时长差值达到差值阈值(如十分钟)时,选取当前视频与目标历史发布视频中时长较长的视频作为候选视频;若时长差值未达到差值阈值时,选取当前视频与目标历史发布视频中任一视频作为候选视频。
在一些实施例中,服务器可通过如下方式分别确定视频与各历史发布视频的相似度:获取视频关联的第一文本信息、以及各历史发布视频关联的第二文本信息;对第一文本信息进行特征提取,得到视频对应的第一文本特征;分别对各历史发布视频关联的第二文本信息进行特征提取,得到各历史发布视频对应的第二文本特征;分别确定第一文本特征与各第二文本特征的特征相似度,将第一文本特征与各第二文本特征的特征相似度,作为视频与各历史发布视频的相似度。
这里,在确定视频与各历史发布视频的相似度时,可以基于视频以及各历史发布视频关联的文本信息确定,在实际实施时,该文本信息可以是用户发布视频时输入的标题、简介等文本描述信息、或者对视频包含的目标视频帧(比如首帧视频帧)进行OCR识别得到的文本信息等。
具体地,首先获取视频关联的第一文本信息、以及各历史发布视频关联的第二文本信息;然后对第一文本信息进行特征提取,得到视频对应的第一文本特征,并对各第二文本信息进行特征提取,得到各历史发布视频对应的第二文本特征,在实际实施时,可通过预先训练完成的Bert文本特征提取模型完成第一文本信息和各第二文本信息的特征提取;在得到视频对应的第一文本特征以及各历史发布视频对应的第二文本特征后,计算第一文本特征与各第二文本特征的特征相似度,比如余弦相似度,将第一文本特征与各第二文本特征的特征相似度,作为视频与各历史发布视频的相似度。
在一些实施例中,服务器可通过如下方式分别确定视频与各历史发布视频的相似度:提取视频的视频帧、以及各历史发布视频的视频帧;对视频的视频帧进行特征提取,得到视频对应的第一视频帧特征;分别对各历史发布视频的视频帧进行特征提取,得到各历史发布视频对应的第二视频帧特征;分别确定第一视频帧特征与各第二视频帧特征的特征相似度,将第一视频帧特征与各第二视频帧特征的特征相似度,作为视频与各历史发布视频的相似度。
这里,在确定视频与各历史发布视频的相似度时,可以基于视频以及各历史发布视频包含的视频帧确定,在实际实施时,该视频帧可以是视频或者各历史发布视频包含的所有视频帧、或者关键视频帧等。
具体地,首先提取视频的视频帧以及各历史发布视频的视频帧,该视频帧可以均为多个;然后对视频的视频帧进行特征提取,即针对各个视频帧进行特征提取,得到每个视频帧的特征,将各视频帧的特征进行拼接得到视频对应的第一视频帧特征;同时对各历史发布视频的视频帧进行特征提取,即针对各历史发布视频包含的各个视频帧进行特征提取,得到各视频帧的特征,将各视频的特征进行拼接,得到各历史发布视频对应的第二视频帧特征;在得到视频对应的第一视频帧特征以及各历史发布视频对应的第二视频帧特征后,计算第一视频帧特征以及各第二视频帧特征之间的特征相似度,将第一视频帧特征与各第二视频帧特征的特征相似度,作为视频与各历史发布视频的相似度。
在一些实施例中,当视频合集所对应的视频类型为连载型视频时,服务器可通过如下方式分别确定视频与各历史发布视频的相似度:分别获取各历史发布视频关联的文本信息,并对各文本信息进行关键字提取,得到各历史发布视频的视频关键字;基于视频关键字,分别确定各历史发布视频的视频类型,并确定获取的历史发布视频中视频类型为连载型视频的历史发布视频;分别确定视频与视频类型为连载型视频的历史发布视频的相似度。
这里,当所构建的视频合集对应的视频类型为连载型视频时,即视频合集中的视频的视频类型为连载型视频时,服务器在计算视频与各历史发布视频的相似度时,为减少非必要计算,首先针对多个历史发布视频进行连载型视频的筛选,然后再计算视频与筛选得到的视频类型为连载型视频的历史发布视频的相似度。具体地,服务器可通过如下方式对视频的视频类型进行识别:首先获取视频关联的文本信息,比如用户发布视频时输入的标题、简介等文本描述信息、或者对视频包含的目标视频帧(比如首帧视频帧)进行OCR识别得到的文本信息等;然后对视频关联的文本信息进行关键字提取,得到视频的视频关键字;从而基于视频关键字确定该视频的视频类型,比如当识别到视频的文本信息包含“第二集”、“第2集”、“第贰集”、“上集”、“中集”、“下集”、“上”、“中”、“下”、“二”、“(二)”、“2”、“(2)”等视频关键字时,则确定该视频的视频类型为连载型。
在一些实施例中,服务器可通过如下方式筛选得到相似度满足相似度条件的至少一个候选视频:基于视频与各历史发布视频的相似度,确定至少一个历史发布视频中,相似度在目标相似度区间范围内的历史发布视频;将相似度在目标相似度区间范围内的历史发布视频作为相似度满足相似度条件的候选视频。
步骤103:获取至少一个候选视频中与视频归属于同一视频主题的目标视频。
在基于相似度对获取的至少一个历史发布视频进行筛选之后,还可以对筛选得到的至少一个候选视频进行进一步筛选,在本申请实施例中,即获取至少一个候选视频中与视频归属于同一视频主题的目标视频。
在一些实施例中,服务器可通过如下方式获取至少一个候选视频中与视频归属于同一视频主题的目标视频:获取视频的第一视频标签,以及各候选视频的第二视频标签;分别将第一视频标签与各第二视频标签进行匹配,得到第一视频标签与各第二视频标签的匹配度;将匹配度达到匹配度阈值的第二视频标签所对应的候选视频,作为与视频归属于同一视频主题的目标视频。
在实际应用中,用户在发布视频时,往往会对视频打上相应的视频标签,或者后台服务器在对视频处理时,也会根据视频的相关内容进行视频标签的识别。因此,这里,服务器在获取至少一个候选视频中与视频归属于同一视频主题的目标视频时,首先获取该视频的第一视频标签以及各候选视频的第二视频标签,然后分别将第一视频标签与各第二视频标签进行匹配,得到第一视频标签与各第二视频标签的匹配度,从而将匹配度达到匹配度阈值的第二视频标签所对应的候选视频,作为与视频归属于同一视频主题的目标视频。
在一些实施例中,服务器可通过如下方式获取至少一个候选视频中与视频归属于同一视频主题的目标视频:对视频关联的文本信息进行分词处理,得到视频对应的第一词语序列;分别对各候选视频关联的文本信息进行分词处理,得到各候选视频对应的第二词语序列;分别确定第一词语序列与各第二词语序列之间的词语重叠度;将词语重叠度达到重叠度阈值的第二词语序列所对应的候选视频,作为与视频归属于同一视频主题的目标视频。
在实际应用中,服务器还可以通过对候选视频和视频的文本信息进行分析,以获取多个候选视频中与视频归属于同一视频主题的目标视频。具体地,服务器首先对视频关联的文本信息进行分词处理,得到视频对应的第一词语序列,该第一词语序列包含多个分词;然后再对各候选视频关联的文本信息进行分词,得到各候选视频对应的第二词语序列,该第二词语序列同样包含多个分词;分别确定第一词语序列与各第二词语序列之间从词语重叠度,即分词的重叠程度;最后从多个候选视频中,选择词语重叠度达到重叠度阈值的第二词语序列所对应的候选视频,作为与视频归属于同一视频主题的目标视频。
在一些实施例中,服务器可通过如下方式获取至少一个候选视频中与视频归属于同一视频主题的目标视频:对视频关联的文本信息进行分词处理,得到视频对应的第一词语序列;分别对各候选视频关联的文本信息进行分词处理,得到各候选视频对应的第二词语序列;分别确定第一词语序列与各第二词语序列之间的目标公共分词、以及目标公共分词在第二词语序列中的分词占比;将分词占比达到占比阈值的目标公共分词所对应的候选视频,作为与视频归属于同一视频主题的目标视频。
在实际应用中,服务器还可以通过对候选视频和视频的文本信息进行分析,以获取多个候选视频中与视频归属于同一视频主题的目标视频。具体地,服务器首先对视频关联的文本信息进行分词处理,得到视频对应的第一词语序列,该第一词语序列包含多个分词;然后再对各候选视频关联的文本信息进行分词,得到各候选视频对应的第二词语序列,该第二词语序列同样包含多个分词;分别确定第一词语序列与各第二词语序列之间的目标公共分词,比如最长公共分词,以及各目标公共分词在第二词语序列中的分词占比;最后从多个候选视频中,选择分词占比达到占比阈值的目标公共分词所对应的候选视频,作为与视频归属于同一视频主题的目标视频。
步骤104:构建对应视频主题的视频合集。
其中,该视频合集包括视频以及目标视频。
在一些实施例中,服务器可通过如下方式构建对应视频主题的视频合集:当目标视频的数量为至少两个时,分别获取视频以及各目标视频的发布时间点;按照发布时间点的先后顺序,对视频以及各目标视频进行排序,得到排序后的第一视频序列;基于第一视频序列,构建对应视频主题的视频合集,比如可以选取发布时间点较近的目标数量的目标视频,以构建包含视频以及目标视频的视频合集。
这里,在基于视频以及目标视频构建对应视频主题的视频合集时,可以对视频以及目标视频进行排序,比如连载型的视频合集,可以将视频合集中的视频按照连载的顺序进行排序,比如“第一集”、“第二集”等等,以便于用户在观看完上一集视频时可以快速进入下一集视频的观看。在实际实施时,在对视频以及目标视频进行排序时,可以分别获取视频以及各目标视频的发布时间点,然后按照发布时间点的先后顺序,对视频以及各目标视频进行排序,得到排序后的第一视频序列,从而基于第一视频序列构建视频合集。
在一些实施例中,服务器可通过如下方式构建对应视频主题的视频合集:当目标视频的数量为至少两个时,获取视频关联的第一文本信息、以及各目标视频关联的第二文本信息;对第一文本信息进行编号关键字提取,得到视频的第一编号,并对各第二文本信息进行编号关键字提取,得到相应目标视频的第二编号;按照第一编号以及第二编号的编号大小,对视频以及至少两个目标视频进行排序,得到排序后的第二视频序列;基于第二视频序列,构建对应视频主题的视频合集。其中,该编号关键字用于指示相应视频的发布顺序。
这里,在实际应用中,服务器还可以基于视频以及目标视频的文本信息进行排序。具体地,首先需要获取视频关联的第一文本信息、以及各目标视频关联的第二文本信息,再对第一文本信息进行编号关键字提取,得到视频的第一编号,并对各第二文本信息进行编号关键字提取,得到相应目标视频的第二编号,比如“第二集”、“第2集”、“第贰集”、“上集”、“中集”、“下集”、“上”、“中”、“下”、“二”、“(二)”、“2”、“(2)”等编号关键字,在实际实施时,还可以对同一编号的不同表达方式进行归一化,比如“上”、“一”、“壹”、“(1)”等编号关键字均归一化为编号1;然后按照第一编号以及第二编号的编号大小,对视频以及至少两个目标视频进行排序,得到排序后的第二视频序列,在实际实施时,由于存在多个关键字的情况,可以按照从左到右的顺序依次进行对比,并且保持对比位置一致,比如,视频A的关键词为[1,2],视频B的关键词为[3,6],那么先对比左侧的1和3,由于3>1,因此该视频B顺序大于A,若左侧未比较出结果,则会顺位比较右侧的2和6,依此类推。从而基于排序得到的第二视频序列构建对应视频主题的视频合集。
在一些实施例中,服务器可通过如下方式构建对应视频主题的视频合集:当目标视频的数量为至少两个时,分别获取视频以及各目标视频的发布时间点;获取任意两个发布时间点间的时间差;当基于获取的时间差确定存在小于时间差阈值的时间差时,分别对视频以及各目标视频进行编号关键字提取,得到相应的编号;按照编号大小,对视频以及各目标视频进行排序,得到排序后的第三视频序列;基于第三视频序列,构建对应视频主题的视频合集。其中,该编号关键字用于指示相应视频的发布顺序。
在实际应用中,由于用户在发布视频时可能不按照视频本身的连载顺序进行,比如视频的第3集先于第2集发布,从而导致按照发布时间点进行排序会出现错误的情况。基于此在本申请实施例中,可以结合视频的发布时间点以及文本信息进行排序。具体地,分别获取视频以及各目标视频的发布时间点,并获取任意两个发布时间点间的时间差;当基于获取的时间差确定存在小于时间差阈值的时间差时,分别对视频以及各目标视频进行编号关键字提取,得到相应的编号;按照编号大小,对视频以及各目标视频进行排序,得到排序后的第三视频序列;从而基于第三视频序列,构建对应视频主题的视频合集。
而当不存在小于时间差阈值的时间差时,则可以直接按照发布时间点对视频以及目标视频进行排序,以基于排序得到的第四视频序列,构建对应视频主题的视频合集。
步骤105:当接收到针对视频合集中任一视频的播放请求时,返回视频合集对应的推荐信息。
在一些实施例中,服务器可通过如下方式返回视频合集对应的推荐信息:返回视频合集对应的推荐信息至终端;其中,该推荐信息包括:视频合集对应的入口信息及视频合集的描述信息;该入口信息,用于供终端基于入口信息呈现视频合集的查看入口。
这里,用户在需要观看视频合集中的任一视频时,可以通过终端运行的客户端(比如视频播放客户端)发送针对视频合集中任一视频的播放请求至服务器;服务器接收到该播放请求后,返回该视频对应的视频数据、以及所属视频合集对应的推荐信息,该推荐信息用于对视频合集进行推荐,可以为视频合集的描述信息以及视频合集对应的入口信息。
当终端接收到服务器返回的视频的视频数据以及推荐信息后,基于该视频数据播放视频,并基于推荐信息中的入口信息,呈现视频合集的查看入口,同时呈现视频合集的描述信息。参见图4,图4是本申请实施例提供的视频合集的查看入口以及描述信息的呈现示意图,这里,呈现了对应“电影XXX”的视频合集的查看入口“点击查看”,同时呈现了视频合集的描述信息,即“一起来看电影XXX”。
在实际应用中,在基于上述实施例构建对应视频主题的视频合集后,若接收到该目标对象新发布的视频时,可以确定该新发布的视频与视频合集中任一视频的相似度,当该相似度满足相似度条件时,进一步确定该新发布的视频是否与该视频合集的视频主题相匹配,当确定相匹配时,则将该新发布的视频加入该构建的视频合集中。
应用本申请上述实施例,首先获取视频对应的目标对象的至少一个历史发布视频,然后根据视频与各历史发布视频之间的相似度,从至少一个历史发布视频中,筛选得到相似度满足相似度条件的至少一个候选视频,再从该至少一个候选视频中筛选得到与视频归属于同一视频主题的目标视频,从而基于该视频以及目标视频,构建对应视频主题的视频合集;由于构建的视频合集中的视频对应的是同一目标对象、相似度满足相似度条件,且归属于同一视频主题,相较于相关技术中基于文本匹配算法获取相关性视频的方式,大大提高了所获取视频间的相关性,如此,当接收到针对视频合集中任一视频的播放请求时,返回该视频合集对应的推荐信息,以便于用户在观看完毕所请求的视频时,可以基于推荐信息,观看与该视频相关的且归属于同一视频主题的其他视频,从而满足用户想要观看与当前播放视频相关的视频的即时需求,提升视频的推荐效果。
接下来继续对本申请实施例提供的视频的处理方法进行说明,本申请实施例提供的视频的处理方法可以由终端及服务器协同实施。参见图5,图5为本申请实施例提供的视频的处理方法的流程示意图,本申请实施例提供的视频的处理方法包括:
步骤201:服务器获取视频对应的目标对象的至少一个历史发布视频。
在一些实施例中,当视频合集所对应的视频类型为连载型视频时,服务器可通过如下方式获取视频对应的目标对象的至少一个历史发布视频:获取视频关联的文本信息;对文本信息进行关键字提取,得到视频的视频关键字;基于视频关键字,确定视频的视频类型;当视频类型表征视频为连载型视频时,获取视频对应的目标对象的至少一个历史发布视频。
步骤202:分别确定视频与各历史发布视频的相似度,并从至少一个历史发布视频中,筛选得到相似度满足相似度条件的至少一个候选视频。
这里,在确定视频与各历史发布视频的相似度时,可以基于视频以及各历史发布视频关联的文本信息确定,在实际实施时,该文本信息可以是用户发布视频时输入的标题、简介等文本描述信息、或者对视频包含的目标视频帧(比如首帧视频帧)进行OCR识别得到的文本信息等;还可以基于视频以及各历史发布视频包含的视频帧确定,在实际实施时,该视频帧可以是视频或者各历史发布视频包含的所有视频帧、或者关键视频帧等。
步骤203:获取至少一个候选视频中与视频归属于同一视频主题的目标视频。
这里,在实际应用中,用户在发布视频时,往往会对视频打上相应的视频标签,或者后台服务器在对视频处理时,也会根据视频的相关内容进行视频标签的识别。因此,这里,服务器在获取至少一个候选视频中与视频归属于同一视频主题的目标视频时,可以根据视频的第一视频标签,以及各候选视频的第二视频标签的匹配度来获取。在实际应用中,服务器还可以通过对候选视频和视频的文本信息进行分析,以获取多个候选视频中与视频归属于同一视频主题的目标视频。
步骤204:构建对应视频主题的视频合集。
这里,在基于视频以及目标视频构建对应视频主题的视频合集时,可以对视频以及目标视频进行排序,比如连载型的视频合集,可以将视频合集中的视频按照连载的顺序进行排序,比如“第一集”、“第二集”等等,以便于用户在观看完上一集视频时可以快速进入下一集视频的观看。在实际实施时,可以根据视频的发布时间点对视频进行排序,也可以根据视频关联的文本信息中的编号关键字对视频进行排序,还可以结合视频的发布时间点以及视频关联的文本信息中的编号关键字对视频进行排序。
步骤205:终端响应于针对视频合集中任一视频的播放指令,发送针对视频合集中任一视频的播放请求至服务器。
在实际应用中,该播放指令为用户通过运行客户端(比如视频播放客户端)的终端所触发。
步骤206:接收到针对视频合集中任一视频的播放请求,响应于播放请求,返回相应的视频数据、以及视频合集对应的推荐信息。
这里,该推荐信息可以包括视频合集对应的入口信息及视频合集的描述信息。
步骤207:接收到视频的视频数据以及视频合集的推荐信息,呈现播放的视频,并基于入口信息呈现视频合集的查看入口,同时呈现视频合集的描述信息。
这里,用户在需要观看视频合集中的任一视频时,可以通过终端运行的客户端(比如视频播放客户端)发送针对视频合集中任一视频的播放请求至服务器;服务器接收到该播放请求后,返回该视频对应的视频数据、以及所属视频合集对应的推荐信息,该推荐信息用于对视频合集进行推荐,可以为视频合集的描述信息以及视频合集对应的入口信息。
当终端接收到服务器返回的视频的视频数据以及推荐信息后,基于该视频数据播放视频,并基于推荐信息中的入口信息,呈现视频合集的查看入口,同时呈现视频合集的描述信息。参见图4,图4是本申请实施例提供的视频合集的查看入口以及描述信息的呈现示意图,这里,呈现了对应“电影XXX”的视频合集的查看入口“点击查看”,同时呈现了视频合集的描述信息,即“一起来看电影XXX”。
应用本申请上述实施例,首先获取视频对应的目标对象的至少一个历史发布视频,然后根据视频与各历史发布视频之间的相似度,从至少一个历史发布视频中,筛选得到相似度满足相似度条件的至少一个候选视频,再从该至少一个候选视频中筛选得到与视频归属于同一视频主题的目标视频,从而基于该视频以及目标视频,构建对应视频主题的视频合集;由于构建的视频合集中的视频对应的是同一目标对象、相似度满足相似度条件,且归属于同一视频主题,相较于相关技术中基于文本匹配算法获取相关性视频的方式,大大提高了所获取视频间的相关性,如此,当接收到针对视频合集中任一视频的播放请求时,返回该视频合集对应的推荐信息,以便于用户在观看完毕所请求的视频时,可以基于推荐信息,观看与该视频相关的且归属于同一视频主题的其他视频,从而满足用户想要观看与当前播放视频相关的视频的即时需求,提升视频的推荐效果。
下面将说明本申请实施例在一个实际的应用场景中的示例性应用。
以视频合集所对应的视频类型为连载型视频为例对本申请实施例提供的视频的处理方法进行说明。本申请实施例提供的视频的处理方法主要包括三个模块:(1)关键词提取模块;(2)连载内容判定模块;(3)连载内容排序模块。在实际应用中,参见图6,图6是本申请实施例提供的视频的处理方法的流程示意图。这里,针对接收到的线上视频数据流(即视频),均执行以下处理:
步骤301:通过关键词提取模块对视频的文本信息进行关键词提取,得到视频的视频关键词。
步骤302:通过连载内容判定模块,基于视频的视频关键词判定该视频是否为连载型视频,若该视频为连载型视频,则获取该视频的发布者的所有历史发布视频,提取历史发布视频的文本信息,并利用Bert提取文本信息的文本特征,通过Faiss计算视频的文本特征和历史发布视频的文本特征之间的余弦相似度,相似度大于相似度阈值的进一步进行视频主题判定,若判定为同一视频主题,则执行步骤303。
步骤303:通过连载内容排序模块对与视频归属于同一视频主题的历史发布视频、以及视频进行排序,基于排序结果构建连载视频合集。
这里,可以将构建的连载视频合集存储于连载视频数据库中。
第一,关键词提取模块的处理流程如图7所示,图7是本申请实施例提供的关键词提取模块的处理流程示意图。这里,
步骤401:提取视频的视频标题及视频OCR等文本信息。
这里,连载型视频指识别的标题文案或者视频OCR中包含“第二集”、“第2集”、“第贰集”、“上集”、“中集”、“下集”、“上”、“中”、“下”、“二”、“(二)”、“2”、“(2)”等关键字的视频,其具体表现包括但不限于同一部剧,同一首歌,同一种食物,同一款游戏等。
步骤402:通过正则表达式对视频的文本信息进行关键词匹配。
这里,可以预先设置连载型视频中应该包含的关键词,比如“第二集”、“第2集”、“第贰集”、“上集”、“中集”、“下集”、“上”、“中”、“下”、“二”、“(二)”、“2”、“(2)”等关键词。然后将视频的文本信息与预先设置的关键词进行匹配。
步骤403:是否匹配成功?若是,则执行步骤404,若否,则执行步骤405。
这里,若匹配成功,则表征视频的文本信息中包含预先设置的关键词。
步骤404:输出匹配的关键词,即输出视频的视频关键词。
步骤405:结束。
这里,关键词提取模块通过正则表达式对视频标题和封面OCR进行关键词匹配,判断视频文本信息中是否包含上述等连载关键词,若存在,则该视频大概率属于连载型视频。将经过关键词提取模块筛选后的连载型视频为种子视频,进入下一阶段的连载内容的判定。该关键词提取模块通过正则表达式实现了连载内容的初筛,操作简单,计算基本不耗时,较大程度的提升了线上数据流的连载内容判断速度。
第二,连载内容判定模块的处理流程如图8所示,图8是本申请实施例提供的连载内容判定模块的处理流程示意图。这里,
步骤501:获取种子视频的发布者的历史发布视频。
步骤502:提取历史发布视频的标题和视频OCR等文本信息。
步骤503:对历史发布视频的文本信息进行特征提取,得到历史发布视频的文本特征向量。
步骤504:从历史发布视频中检索与种子视频相似度满足相似度条件的历史发布视频。
步骤505:对相似度满足相似度条件的历史发布视频进行关键词提取,得到历史发布视频的关键词,并将历史发布视频的关键词与设置的连载关键词进行匹配。
步骤506:若匹配成功则执行步骤507,若匹配失败则执行步骤510。
步骤507:采用文本匹配确定与种子视频归属于同一视频主题的历史发布视频。
步骤508:若文本匹配成功,则执行步骤509,若匹配失败则执行步骤510。
步骤509:基于种子视频、以及与种子视频归属于同一视频主题的历史发布视频,构建对应视频主题的连载视频合集。
步骤510:结束。
在实际应用中,以经过关键词提取模块筛选后的候选连载视频为种子视频,获取该视频发文用户的所有历史发文为视频库,种子视频和视频库中所有视频都使用Bert提取文本信息的特征,文本信息包括标题和视频OCR,该特征具有相似文本余弦相似度越高的特点,因此,首先使用Faiss从视频库中检索与种子视频相似度较高的视频,然后这些视频通过关键词提取模块,进一步保证连载识别准确性同时减少非必要计算,最后,使用文本匹配进一步判断和提取种子视频和筛选出来的视频的公共主题,并以此作为当前识别的连载内容的主题。文本匹配算法具体指字符重叠率和最长公共子串算法,交叉匹配两个视频的标题和OCR文本,若字符重叠率大于某一阈值或者最长公共子串占比高于某一阈值,可基本判断两个视频是同一主题,并且通过最长公共子串可提取出当前连载内容的主题。该连载内容判定模块使用多层过滤的机制,在保证判定准确性的同时尽可能提升了速度。
为了实现相似文本余弦相似度越高这一目标,文本特征提取模型是word2vec,使用CBOW模型自监督训练,训练数据为用户发文的文本数据,无需标注,推理时首先将文本数据进行分词,每个分词后的词语通过检索的方法获取对应特征向量,最后求平均得到文本的特征向量。该模型表征能力强,无需标注,并且推理速度快,适用于时效性要求强的任务。
第三,连载内容排序模块的处理流程如图9所示,图9是本申请实施例提供的连载内容排序模块的处理流程示意图。这里,
步骤601:输入待排序的视频。
这里,待排序的视频即为种子视频和与种子视频属于同一视频主题的历史发布视频。
步骤602:分别获取视频的发布时间点,并获取任意两个发布时间点间的时间差;当存在小于时间差阈值的时间差时,执行步骤603;当不存在小于时间差阈值的时间差时,执行步骤607。
步骤603:归一化视频对应的文本信息中的编号关键词。
步骤604:按照编号关键词的编号顺序,对视频进行排序。
步骤605:若排序成功,则执行步骤607;若排序失败,则执行步骤606。
步骤606:按照视频的发布时间点对视频进行排序。
步骤607:输出视频的排序结果。
步骤608:结束。
经过连载内容判定模块之后,被识别为连载内容的视频合集处于无序状态,并且由于用户发文可能不按照顺序进行,因此本申请实施例提出一种结合发文时间和连载关键词的排序算法,该算法首先判断视频的发文时间,若时间差大于7天,则按照时间先后排序,否则根据关键词的大小顺序进行排序。该关键词排序算法首先对中文中同一编号的不同表达方式进行了归一化,比如“上”、“一”、“壹”、“(1)”等均归一化为1,然后考虑了存在多个关键词的情况,按照从左到右的顺序依次进行对比,并且保持对比位置一致,比如,视频A的关键词为[1,2],视频B的关键词为[3,6],那么先对比左侧的1和3,由于3>1,因此该视频B顺序大于A,若左侧未比较出结果,则会顺位比较右侧的2和6,依次类推,最终若关键依然未得出顺序,则依旧按照发文顺序进行排序。该连载内容排序模块综合考虑了中文连载中存在的各种问题,包括表达不一致,多个关键词等问题,最终输出结果具有鲁棒性,精准度较高。
在实际应用中,还可以从用户行为数据和视频帧信息判断是否为连载视频,比如用户主页下被连续观看率较高的视频可能为连载视频,或者用户发文中视频帧特征相似度较高的视频可能为连载视频;文本特征提取模型可以使用当前最新的Bert模型,并收集同一连载内容主题对应的所有视频描述和OCR,以主题-文本描述作为训练数据输入Bert模型训练,使模型对于同一主题判定更加具有鲁棒性。
在实际应用中,当视频合集构建完成后,终端可以以合集的形式呈现,比如可以在呈现视频合集中的任一视频时,呈现相应的视频合集的查看入口,方便用户在刷到上集内容的时候查看下集。
应用本申请上述实施例,首先利用正则表达式初筛存在连载内容关键词的种子视频,然后在特征向量召回的基础上使用规则进行辅助判断,在特征向量召回相对准确的结果之下,使用较低阈值的规则在容忍文本不规范的同时保证了识别准确率,最后再排序机制的保证下,达到识别连载内容的目标,整个流程先保证召回,在逐级保证准确,效率和准确率都达到比较高的水平,可精准识别短视频APP中用户制作的连载系列视频。
下面继续说明本申请实施例提供的视频的处理装置555,在一些实施例中,视频的处理装置可采用软件模块的方式实现。参见图10,图10是本申请实施例提供的视频的处理装置555的结构示意图,本申请实施例提供的视频的处理装置555包括:
第一获取模块5551,用于获取视频对应的目标对象的至少一个历史发布视频;
筛选模块5552,用于分别确定所述视频与各所述历史发布视频的相似度,并从所述至少一个历史发布视频中,筛选得到相似度满足相似度条件的至少一个候选视频;
第二获取模块5553,用于获取所述至少一个候选视频中与所述视频归属于同一视频主题的目标视频;
构建模块5554,用于构建对应所述视频主题的视频合集,所述视频合集包括所述视频以及所述目标视频;
返回模块5555,用于当接收到针对所述视频合集中任一视频的播放请求时,返回所述视频合集对应的推荐信息。
在一些实施例中,当所述视频合集所对应的视频类型为连载型视频时,所述第一获取模块5551,还用于获取所述视频关联的文本信息;
对所述文本信息进行关键字提取,得到所述视频的视频关键字;
基于所述视频关键字,确定所述视频的视频类型;
当所述视频类型表征所述视频为连载型视频时,获取视频对应的目标对象的至少一个历史发布视频。
在一些实施例中,当所述视频合集所对应的视频类型为连载型视频时,所述筛选模块5552,还用于分别获取各所述历史发布视频关联的文本信息,并
对各所述文本信息进行关键字提取,得到各所述历史发布视频的视频关键字;
基于所述视频关键字,分别确定各所述历史发布视频的视频类型,并确定获取的历史发布视频中视频类型为连载型视频的历史发布视频;
分别确定所述视频与视频类型为连载型视频的历史发布视频的相似度。
在一些实施例中,所述筛选模块5552,还用于获取所述视频关联的第一文本信息、以及各所述历史发布视频关联的第二文本信息;
对所述第一文本信息进行特征提取,得到所述视频对应的第一文本特征;
分别对各所述历史发布视频关联的第二文本信息进行特征提取,得到各所述历史发布视频对应的第二文本特征;
分别确定所述第一文本特征与各所述第二文本特征的特征相似度,将所述第一文本特征与各所述第二文本特征的特征相似度,作为所述视频与各所述历史发布视频的相似度。
在一些实施例中,所述筛选模块5552,还用于提取所述视频的视频帧、以及各所述历史发布视频的视频帧;
对所述视频的视频帧进行特征提取,得到所述视频对应的第一视频帧特征;
分别对各所述历史发布视频的视频帧进行特征提取,得到各所述历史发布视频对应的第二视频帧特征;
分别确定所述第一视频帧特征与各所述第二视频帧特征的特征相似度,将所述第一视频帧特征与各所述第二视频帧特征的特征相似度,作为所述视频与各所述历史发布视频的相似度。
在一些实施例中,所述筛选模块5552,还用于基于所述视频与各所述历史发布视频的相似度,确定所述至少一个历史发布视频中,相似度在目标相似度区间范围内的历史发布视频;
将所述相似度在目标相似度区间范围内的历史发布视频作为相似度满足相似度条件的候选视频。
在一些实施例中,所述第二获取模块5553,还用于获取所述视频的第一视频标签,以及各所述候选视频的第二视频标签;
分别将所述第一视频标签与各所述第二视频标签进行匹配,得到所述第一视频标签与各所述第二视频标签的匹配度;
将匹配度达到匹配度阈值的第二视频标签所对应的候选视频,作为与所述视频归属于同一视频主题的目标视频。
在一些实施例中,所述第二获取模块5553,还用于对所述视频关联的文本信息进行分词处理,得到所述视频对应的第一词语序列;
分别对各所述候选视频关联的文本信息进行分词处理,得到各所述候选视频对应的第二词语序列;
分别确定所述第一词语序列与各所述第二词语序列之间的词语重叠度;
将词语重叠度达到重叠度阈值的第二词语序列所对应的候选视频,作为与所述视频归属于同一视频主题的目标视频。
在一些实施例中,所述第二获取模块5553,还用于对所述视频关联的文本信息进行分词处理,得到所述视频对应的第一词语序列;
分别对各所述候选视频关联的文本信息进行分词处理,得到各所述候选视频对应的第二词语序列;
分别确定所述第一词语序列与各所述第二词语序列之间的目标公共分词、以及所述目标公共分词在所述第二词语序列中的分词占比;
将分词占比达到占比阈值的目标公共分词所对应的候选视频,作为与所述视频归属于同一视频主题的目标视频。
在一些实施例中,所述构建模块5554,还用于当所述目标视频的数量为至少两个时,分别获取所述视频以及各所述目标视频的发布时间点;
按照所述发布时间点的先后顺序,对所述视频以及各所述目标视频进行排序,得到排序后的第一视频序列;
基于所述第一视频序列,构建对应所述视频主题的视频合集。
在一些实施例中,所述构建模块5554,还用于当所述目标视频的数量为至少两个时,获取所述视频关联的第一文本信息、以及各所述目标视频关联的第二文本信息;
对所述第一文本信息进行编号关键字提取,得到所述视频的第一编号,并对各所述第二文本信息进行编号关键字提取,得到相应目标视频的第二编号;
其中,所述编号关键字用于指示相应视频的发布顺序;
按照所述第一编号以及第二编号的编号大小,对所述视频以及至少两个所述目标视频进行排序,得到排序后的第二视频序列;
基于所述第二视频序列,构建对应所述视频主题的视频合集。
在一些实施例中,所述构建模块5554,还用于当所述目标视频的数量为至少两个时,分别获取所述视频以及各所述目标视频的发布时间点;
获取任意两个发布时间点间的时间差;
当基于获取的时间差确定存在小于时间差阈值的时间差时,分别对所述视频以及各所述目标视频进行编号关键字提取,得到相应的编号;
其中,所述编号关键字用于指示相应视频的发布顺序;
按照编号大小,对所述视频以及各所述目标视频进行排序,得到排序后的第三视频序列;
基于所述第三视频序列,构建对应所述视频主题的视频合集。
在一些实施例中,所述返回模块5555,还用于返回所述视频合集对应的推荐信息至终端,所述推荐信息包括:所述视频合集对应的入口信息及所述视频合集的描述信息;
其中,所述入口信息,用于供所述终端基于所述入口信息呈现所述视频合集的查看入口。
应用本申请上述实施例,首先获取视频对应的目标对象的至少一个历史发布视频,然后根据视频与各历史发布视频之间的相似度,从至少一个历史发布视频中,筛选得到相似度满足相似度条件的至少一个候选视频,再从该至少一个候选视频中筛选得到与视频归属于同一视频主题的目标视频,从而基于该视频以及目标视频,构建对应视频主题的视频合集;由于构建的视频合集中的视频对应的是同一目标对象、相似度满足相似度条件,且归属于同一视频主题,相较于相关技术中基于文本匹配算法获取相关性视频的方式,大大提高了所获取视频间的相关性,如此,当接收到针对视频合集中任一视频的播放请求时,返回该视频合集对应的推荐信息,以便于用户在观看完毕所请求的视频时,可以基于推荐信息,观看与该视频相关的且归属于同一视频主题的其他视频,从而满足用户想要观看与当前播放视频相关的视频的即时需求,提升视频的推荐效果。
本申请实施例还提供一种电子设备,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的视频的处理方法。
本申请实施例还提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例提供的视频的处理方法。
本申请实施例还提供一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时,实现本申请实施例提供的视频的处理方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EP ROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。
Claims (15)
1.一种视频的处理方法,其特征在于,所述方法包括:
获取视频对应的目标对象的至少一个历史发布视频;
分别确定所述视频与各所述历史发布视频的相似度,并从所述至少一个历史发布视频中,筛选得到相似度满足相似度条件的至少一个候选视频;
获取所述至少一个候选视频中与所述视频归属于同一视频主题的目标视频;
构建对应所述视频主题的视频合集,所述视频合集包括所述视频以及所述目标视频;
当接收到针对所述视频合集中任一视频的播放请求时,返回所述视频合集对应的推荐信息。
2.如权利要求1所述的方法,其特征在于,当所述视频合集所对应的视频类型为连载型视频时,所述获取视频对应的目标对象的至少一个历史发布视频,包括:
获取所述视频关联的文本信息;
对所述文本信息进行关键字提取,得到所述视频的视频关键字;
基于所述视频关键字,确定所述视频的视频类型;
当所述视频类型表征所述视频为连载型视频时,获取视频对应的目标对象的至少一个历史发布视频。
3.如权利要求1所述的方法,其特征在于,当所述视频合集所对应的视频类型为连载型视频时,所述分别确定所述视频与各所述历史发布视频的相似度,包括:
分别获取各所述历史发布视频关联的文本信息,并
对各所述文本信息进行关键字提取,得到各所述历史发布视频的视频关键字;
基于所述视频关键字,分别确定各所述历史发布视频的视频类型,并确定获取的历史发布视频中视频类型为连载型视频的历史发布视频;
分别确定所述视频与视频类型为连载型视频的历史发布视频的相似度。
4.如权利要求1所述的方法,其特征在于,所述分别确定所述视频与各所述历史发布视频的相似度,包括:
获取所述视频关联的第一文本信息、以及各所述历史发布视频关联的第二文本信息;
对所述第一文本信息进行特征提取,得到所述视频对应的第一文本特征;
分别对各所述历史发布视频关联的第二文本信息进行特征提取,得到各所述历史发布视频对应的第二文本特征;
分别确定所述第一文本特征与各所述第二文本特征的特征相似度,将所述第一文本特征与各所述第二文本特征的特征相似度,作为所述视频与各所述历史发布视频的相似度。
5.如权利要求1所述的方法,其特征在于,所述分别确定所述视频与各所述历史发布视频的相似度,包括:
提取所述视频的视频帧、以及各所述历史发布视频的视频帧;
对所述视频的视频帧进行特征提取,得到所述视频对应的第一视频帧特征;
分别对各所述历史发布视频的视频帧进行特征提取,得到各所述历史发布视频对应的第二视频帧特征;
分别确定所述第一视频帧特征与各所述第二视频帧特征的特征相似度,将所述第一视频帧特征与各所述第二视频帧特征的特征相似度,作为所述视频与各所述历史发布视频的相似度。
6.如权利要求1所述的方法,其特征在于,所述从所述至少一个历史发布视频中,筛选得到相似度满足相似度条件的至少一个候选视频,包括:
基于所述视频与各所述历史发布视频的相似度,确定所述至少一个历史发布视频中,相似度在目标相似度区间范围内的历史发布视频;
将所述相似度在目标相似度区间范围内的历史发布视频作为相似度满足相似度条件的候选视频。
7.如权利要求1所述的方法,其特征在于,所述获取所述至少一个候选视频中与所述视频归属于同一视频主题的目标视频,包括:
获取所述视频的第一视频标签,以及各所述候选视频的第二视频标签;
分别将所述第一视频标签与各所述第二视频标签进行匹配,得到所述第一视频标签与各所述第二视频标签的匹配度;
将匹配度达到匹配度阈值的第二视频标签所对应的候选视频,作为与所述视频归属于同一视频主题的目标视频。
8.如权利要求1所述的方法,其特征在于,所述获取所述至少一个候选视频中与所述视频归属于同一视频主题的目标视频,包括:
对所述视频关联的文本信息进行分词处理,得到所述视频对应的第一词语序列;
分别对各所述候选视频关联的文本信息进行分词处理,得到各所述候选视频对应的第二词语序列;
分别确定所述第一词语序列与各所述第二词语序列之间的词语重叠度;
将词语重叠度达到重叠度阈值的第二词语序列所对应的候选视频,作为与所述视频归属于同一视频主题的目标视频。
9.如权利要求1所述的方法,其特征在于,所述获取所述至少一个候选视频中与所述视频归属于同一视频主题的目标视频,包括:
对所述视频关联的文本信息进行分词处理,得到所述视频对应的第一词语序列;
分别对各所述候选视频关联的文本信息进行分词处理,得到各所述候选视频对应的第二词语序列;
分别确定所述第一词语序列与各所述第二词语序列之间的目标公共分词、以及所述目标公共分词在所述第二词语序列中的分词占比;
将分词占比达到占比阈值的目标公共分词所对应的候选视频,作为与所述视频归属于同一视频主题的目标视频。
10.如权利要求1所述的方法,其特征在于,所述构建对应所述视频主题的视频合集,包括:
当所述目标视频的数量为至少两个时,分别获取所述视频以及各所述目标视频的发布时间点;
按照所述发布时间点的先后顺序,对所述视频以及各所述目标视频进行排序,得到排序后的第一视频序列;
基于所述第一视频序列,构建对应所述视频主题的视频合集。
11.如权利要求1所述的方法,其特征在于,所述构建对应所述视频主题的视频合集,包括:
当所述目标视频的数量为至少两个时,获取所述视频关联的第一文本信息、以及各所述目标视频关联的第二文本信息;
对所述第一文本信息进行编号关键字提取,得到所述视频的第一编号,并对各所述第二文本信息进行编号关键字提取,得到相应目标视频的第二编号;
其中,所述编号关键字用于指示相应视频的发布顺序;
按照所述第一编号以及第二编号的编号大小,对所述视频以及至少两个所述目标视频进行排序,得到排序后的第二视频序列;
基于所述第二视频序列,构建对应所述视频主题的视频合集。
12.如权利要求1所述的方法,其特征在于,所述构建对应所述视频主题的视频合集,包括:
当所述目标视频的数量为至少两个时,分别获取所述视频以及各所述目标视频的发布时间点;
获取任意两个发布时间点间的时间差;
当基于获取的时间差确定存在小于时间差阈值的时间差时,分别对所述视频以及各所述目标视频进行编号关键字提取,得到相应的编号;
其中,所述编号关键字用于指示相应视频的发布顺序;
按照编号大小,对所述视频以及各所述目标视频进行排序,得到排序后的第三视频序列;
基于所述第三视频序列,构建对应所述视频主题的视频合集。
13.如权利要求1所述的方法,其特征在于,所述返回所述视频合集对应的推荐信息,包括:
返回所述视频合集对应的推荐信息至终端,所述推荐信息包括:所述视频合集对应的入口信息及所述视频合集的描述信息;
其中,所述入口信息,用于供所述终端基于所述入口信息呈现所述视频合集的查看入口。
14.一种视频的处理装置,其特征在于,所述装置包括:
第一获取模块,用于获取视频对应的目标对象的至少一个历史发布视频;
筛选模块,用于分别确定所述视频与各所述历史发布视频的相似度,并从所述至少一个历史发布视频中,筛选得到相似度满足相似度条件的至少一个候选视频;
第二获取模块,用于获取所述至少一个候选视频中与所述视频归属于同一视频主题的目标视频;
构建模块,用于构建对应所述视频主题的视频合集,所述视频合集包括所述视频以及所述目标视频;
返回模块,用于当接收到针对所述视频合集中任一视频的播放请求时,返回所述视频合集对应的推荐信息。
15.一种计算机可读存储介质,其特征在于,存储有可执行指令,所述可执行指令被执行时,用于实现如权利要求1至13任一项所述的视频的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110054490.3A CN114765702A (zh) | 2021-01-15 | 2021-01-15 | 视频的处理方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110054490.3A CN114765702A (zh) | 2021-01-15 | 2021-01-15 | 视频的处理方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114765702A true CN114765702A (zh) | 2022-07-19 |
Family
ID=82364123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110054490.3A Pending CN114765702A (zh) | 2021-01-15 | 2021-01-15 | 视频的处理方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114765702A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110781347A (zh) * | 2019-10-23 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 一种视频处理方法、装置、设备以及可读存储介质 |
CN112182290A (zh) * | 2019-07-05 | 2021-01-05 | 北京字节跳动网络技术有限公司 | 一种信息处理方法、装置和电子设备 |
-
2021
- 2021-01-15 CN CN202110054490.3A patent/CN114765702A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182290A (zh) * | 2019-07-05 | 2021-01-05 | 北京字节跳动网络技术有限公司 | 一种信息处理方法、装置和电子设备 |
CN110781347A (zh) * | 2019-10-23 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 一种视频处理方法、装置、设备以及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753060B (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN106874279B (zh) | 生成应用类别标签的方法及装置 | |
CN110968684B (zh) | 一种信息处理方法、装置、设备及存储介质 | |
CN113590850A (zh) | 多媒体数据的搜索方法、装置、设备及存储介质 | |
CN112287069A (zh) | 基于语音语义的信息检索方法、装置及计算机设备 | |
CN112231563A (zh) | 一种内容推荐方法、装置及存储介质 | |
CN110990563A (zh) | 一种基于人工智能的传统文化素材库构建方法及系统 | |
CN115659008A (zh) | 大数据信息反馈的信息推送系统、方法、电子设备及介质 | |
CN113704420A (zh) | 文本中的角色识别方法、装置、电子设备及存储介质 | |
CN112818200A (zh) | 基于静态网站的数据爬取及事件分析方法及系统 | |
CN113626704A (zh) | 基于word2vec模型的推荐信息方法、装置及设备 | |
CN113408282A (zh) | 主题模型训练和主题预测方法、装置、设备及存储介质 | |
CN113821612A (zh) | 信息查找方法以及装置 | |
CN112712056A (zh) | 视频语义分析方法、装置、存储介质及电子设备 | |
CN113704623B (zh) | 一种数据推荐方法、装置、设备及存储介质 | |
CN114580533A (zh) | 特征提取模型的训练方法、装置、设备、介质及程序产品 | |
CN115168609A (zh) | 一种文本匹配方法、装置、计算机设备和存储介质 | |
CN115186240A (zh) | 基于关联性信息的社交网络用户对齐方法、装置、介质 | |
CN114765702A (zh) | 视频的处理方法、装置及计算机可读存储介质 | |
CN114218364A (zh) | 问答知识库扩充方法与装置 | |
CN115618873A (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN112364649A (zh) | 命名实体的识别方法、装置、计算机设备及存储介质 | |
CN116992031B (zh) | 数据处理方法、装置、电子设备、存储介质及程序产品 | |
CN115269851B (zh) | 文章分类方法、装置、电子设备、存储介质及程序产品 | |
CN116150428B (zh) | 视频标签获取方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |