CN116886943A - 直播视频高光片段自动获取方法、系统、设备及存储介质 - Google Patents

直播视频高光片段自动获取方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN116886943A
CN116886943A CN202310846886.0A CN202310846886A CN116886943A CN 116886943 A CN116886943 A CN 116886943A CN 202310846886 A CN202310846886 A CN 202310846886A CN 116886943 A CN116886943 A CN 116886943A
Authority
CN
China
Prior art keywords
highlight
video
predicted
neural network
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310846886.0A
Other languages
English (en)
Inventor
时贺平
匡涛
刘江宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Baiqiu Zhishang Network Service Co ltd
Original Assignee
Shanghai Baiqiu Zhishang Network Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Baiqiu Zhishang Network Service Co ltd filed Critical Shanghai Baiqiu Zhishang Network Service Co ltd
Priority to CN202310846886.0A priority Critical patent/CN116886943A/zh
Publication of CN116886943A publication Critical patent/CN116886943A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4334Recording operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明涉及一种直播视频高光片段自动获取方法、系统、设备及存储介质。该方法包括:获取待预测时间段之前预设数量的已知高光视频;将已知高光视频作为训练样本进行神经网络模型的训练;将直播视频作为神经网络模型的输入,神经网络模型的输出作为待预测时间段对应的预测高光片段;其中,神经网络模型是根据历史真实高光视频进行训练获得的模型,预设数量是预设模型预测的视频播放量与真实视频播放量最接近时的数量;将预测的高光片段切割并合并成新的高光视频。实现了对整个直播视频中高光片段的获取及集合,实现回放复盘的功能,且因为集合了高光片段,因此节约了回放复盘的时间,实现在较短的时间内进行复盘和学习,提高播销售的效果。

Description

直播视频高光片段自动获取方法、系统、设备及存储介质
技术领域
本发明涉及自动截取视频技术领域,具体涉及一种直播视频高光片段自动获取方法、系统、设备及存储介质。
背景技术
随着视频直播技术的快速发展,越来越多的用户可以通过网络观看各种直播视频节目、直播带货视频。在观看直播视频节目的过程中,用户可以通过发送弹幕的方式,与主播和其他用户进行互动,也可以实时观看到直播期间实时观看人数、离场人数、点赞数、评论互动数、销量等数据,且直播结束也会显示整个直播期间的浏览量。然而,由于直播存在实时性且没有回放功能,错过精彩瞬间或者想要重新观看精彩瞬间的观众无法重新观看,主播和商家也无法回看触发高销量时刻对应的数据,无法分析触发主播在讲解商品时出现直播间流量突然增大、销售情况突然提高、观众驻足时间长、提高观众互动性等高光片刻的主要因素。导致无法去复盘和提升直播品质和质量,使得直播销售的效果较差。
发明内容
为解决上述问题,本发明的目的是提供一种直播视频高光片段自动获取方法、系统、设备及存储介质。该直播视频高光片段自动获取方法、系统、设备及存储介质通过建立神经网络模型,将直播视频作为神经网络模型的输入,该神经网络模型的输出作为待预测时间段对应的预测高光视频,以此来实现预测直播视频中的高光视频并进行标记或记录,并将该预测的高光视频从直播视频中切割出来,并合并成新的高光视频并进行存储。以此来实现对整个直播视频中高光片段的获取及集合,实现回放复盘的功能,且因为集合了高光片段,因此节约了回放复盘的时间,实现在较短的时间内进行复盘和学习,提高播销售的效果。且主播账号可以将存储的合并后的新的高光视频发布在账号,使直播间进行二次引流。
本发明的一方面提供了一种直播视频高光片段自动获取方法,该直播视频高光片段自动获取方法方法包括如下步骤:
获取待预测时间段之前预设数量的已知高光视频;其中,所述已知高光视频包括真实高光视频和/或预测高光视频,所述高光视频为播放量高和/或每分钟观看人数高和/或离场人数少和/或点赞数高和/或评论互动数高和/或销量高时对应的时间段;
将所述已知高光视频作为训练样本进行神经网络模型的训练;
将直播视频作为神经网络模型的输入,所述神经网络模型的输出作为所述待预测时间段对应的预测高光片段;其中,所述神经网络模型是根据历史真实高光视频进行训练获得的模型,所述预设数量是所述预设模型预测的视频播放量与真实视频播放量最接近时的数量;
将所述预测的高光片段切割,合并成新的高光视频并存储。
根据本发明一实施例,确定所述播放量与所述每分钟观看人数和/或所述离场人数和/或点赞数和/或评论互动数和/或销量的系数值。
根据本发明一实施例,所述神经网络模型的训练包括如下步骤:
获取历史真实高光视频构建训练集;其中,各所述历史真实高光视频与各直播时间段一一对应;
对获取的所述历史真实高光视频进行预处理;
通过逻辑回归算法进行模型训练。
根据本发明一实施例,所述对获取的所述历史真实高光视频进行预处理包括:通过滑动平均方式,根据预设的滑动窗口大小,对所述历史真实高光视频进行平滑处理。
根据本发明一实施例,将直播视频作为神经网络模型的输入,所述神经网络模型的输出作为所述待预测时间段对应的预测高光片段后还包括对不同时间段高光片段进行标记。
根据本发明一实施例,所述对不同时间段高光片段进行标记具体包括:
确定所述待预测时间段对应的预测高光片段的起始时间以及所述待预测时间段对应的预测高光片段的结束时间;
记录所述起始时间与所述结束时间对应的高光片段对应的视频内容。
根据本发明一实施例,将所述预测的高光片段切割并合并成新的高光视频具体包括:
截取记录的所述起始时间与所述结束时间对应的高光片段对应的视频内容;其中截取的高光片段对应的视频内容还包括进行宽度及高度的裁剪;
拼接各截取的高光片段对应的视频内容。
本发明的另一方面提供了一种直播视频高光片段自动获取系统,该直播视频高光片段自动获取系统用于实现如前所述的直播视频高光片段自动获取方法。该直播视频高光片段自动获取系统包括:
数据获取模块,用于获取待预测时间段之前预设数量的已知高光视频;其中,所述已知高光视频包括真实高光视频和/或预测高光视频,所述高光视频为播放量高和/或每分钟观看人数高和/或离场人数少和/或点赞数高和/或评论互动数高和/或销量高时对应的时间段;
数据训练模块,用于将所述已知高光视频作为训练样本进行神经网络模型的训练;
数据预测模块,用于将直播视频作为神经网络模型的输入,所述神经网络模型的输出作为所述待预测时间段对应的预测高光片段;其中,所述神经网络模型是根据历史真实高光视频进行训练获得的模型,所述预设数量是所述预设模型预测的视频播放量与真实视频播放量最接近时的数量;
视频合成模块,用于将所述预测的高光片段切割,合并成新的高光视频并存储。
本发明的再一方面还提供了一种直播视频高光片段自动获取系统设备。该识别设备包括:
存储器,所述存储器用于存储处理程序;
处理器,所述处理器执行所述处理程序时实现本发明任一实施例所述的直播视频高光片段自动获取方法。
本发明的最后一方面则是提供了一种可读存储介质。所述可读存储介质上存储有处理程序,所述处理程序被处理器执行时实现本发明任一实施例中的直播视频高光片段自动获取方法。
本发明的优点在于:
本发明公开了一种直播视频高光片段自动获取方法、系统、设备及存储介质通过建立神经网络模型,将直播视频作为神经网络模型的输入,该神经网络模型的输出作为待预测时间段对应的预测高光视频,以此来实现预测直播视频中的高光视频并进行标记或记录,并将该预测的高光视频从直播视频中切割出来,并合并成新的高光视频并进行存储。以此来实现对整个直播视频中高光片段的获取及集合,实现回放复盘的功能,且因为集合了高光片段,因此节约了回放复盘的时间,实现在较短的时间内进行复盘和学习,提高播销售的效果。且主播账号可以将存储的合并后的新的高光视频发布在账号,使直播间进行二次引流。
附图说明
图1根据本发明公开的一种实施例,示出了一种直播视频高光片段自动获取方法的方法流程图;
图2根据本发明公开的一种实施例,示出了一种直播视频高光片段神经网络模型的训练方法流程图;
图3根据本发明公开的一种实施例,示出了一种对不同时间段高光片段进行标记的方法流程图;
图4根据本发明公开的一种实施例,示出了一种将预测的高光片段切割并合并成新的高光视频的方法流程图;
图5根据本发明公开的一种实施例,示出了一种直播视频高光片段自动获取系统的结构示意图;
图6根据本发明公开的一种实施例,示出了一种直播视频高光片段自动获取设备的结构示意图;
图7根据本发明公开的一种实施例,示出了一种计算机可读存储介质的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。下述实施例中,运用Python进行相关分析和逻辑回归算法的实现,视频切割和客户端应用使用JAVA+html+JS实现。
随着视频直播技术的快速发展,越来越多的用户可以通过网络观看各种直播视频节目、直播带货视频。在观看直播视频节目的过程中,用户可以通过发送弹幕的方式,与主播和其他用户进行互动,也可以实时观看到直播期间实时观看人数、离场人数、点赞数、评论互动数、销量等数据,且直播结束也会显示整个直播期间的浏览量。然而,由于直播存在实时性且没有回放功能,错过精彩瞬间或者想要重新观看精彩瞬间的观众无法重新观看,主播和商家也无法回看触发高销量时刻对应的数据,无法分析触发观众购买欲望、驻足时间、互动等高光时刻,导致无法去复盘和提升直播品质和质量,使得直播销售的效果较差。
为了解决上述技术问题,本发明公开了一种直播视频高光片段自动获取方法、系统、设备及存储介质通过建立神经网络模型,将直播视频作为神经网络模型的输入,该神经网络模型的输出作为待预测时间段对应的预测高光视频,以此来实现预测直播视频中的高光视频并进行标记或记录,并将该预测的高光视频从直播视频中切割出来,并合并成新的高光视频并进行存储。以此来实现对整个直播视频中高光片段的获取及集合,实现回放复盘的功能,且因为集合了高光片段,因此节约了回放复盘的时间,实现在较短的时间内进行复盘和学习,提高播销售的效果。且主播账号可以将存储的合并后的新的高光视频发布在账号,使直播间进行二次引流。下文通过实施例进行详细描述。
本发明的实施例一提供了一种直播视频高光片段自动获取方法的一种具体实施方式,参见图1-4,该直播视频高光片段自动获取方法具体包括如下步骤:
S100:获取待预测时间段之前预设数量的已知高光视频。其中,已知高光视频包括真实高光视频和/或预测高光视频,高光视频为播放量高和/或每分钟观看人数高和/或离场人数少和/或点赞数高和/或评论互动数高和/或销量高时对应的时间段。一种实施方式中,确定播放量与每分钟观看人数和/或离场人数和/或点赞数和/或评论互动数和/或销量的系数值。
其中,获取待预测时间段之前预设数量的已知高光视频可以是预先存储的历史视频,该预先存储的历史视频可以是主播手动保存的,也可以是平台自动保存的历史视频,其中,平台可以通过侦测直播间开播触发自动视频的自动保存。
示例性的,确定播放量与每分钟观看人数和/或离场人数和/或点赞数和/或评论互动数和/或销量的系数值的实现方法如下:预先制作相关系数求值表,通过该系数求值表确定系数值。其中,确定系数值的方法包括预先设定比较阈值,当系数值大于该比较阈值时,保留该系数值;当系数值小于等于该比较阈值时,识别为噪音指标,对该时间段对应的视频进行剔除。
Python实现代码如下:
具体实现步骤逻辑:
我们先导入了NumPy库,用于计算均值、标准差等统计量。然后,我们定义了一个名为pearson_corr的函数,该函数接收两个参数x和y,分别表示两个变量的取值。函数内部首先计算了x和y的均值和标准差,然后使用公式计算出协方差和Pearson相关系数,并将其返回。接着,我们定义了示例数据x和y,并使用pearson_corr函数计算它们的Pearson相关系数,并输出结果。
import numpy as np
#定义计算Pearson相关系数的函数
def pearson_corr(x,y):
#计算x和y的均值
x_mean=np.mean(x)
y_mean=np.mean(y)
#计算x和y的标准差
x_std=np.std(x)
y_std=np.std(y)
#计算协方差
cov=np.sum((x-x_mean)*(y-y_mean))
#计算Pearson相关系数
corr=cov/(len(x)*x_std*y_std)
return corr
#定义示例数据
x=[1,2,3,4,5]
y=[2,4,6,8,10]
#计算Pearson相关系数
corr=pearson_corr(x,y)
#输出结果
print("Pearson correlation coefficient:",corr)
S200:将已知高光视频作为训练样本进行神经网络模型的训练。其中,神经网络模型的训练包括如下步骤:
S210:获取历史真实高光视频构建训练集。其中,各历史真实高光视频与各直播时间段一一对应。
S220:对获取的历史真实高光视频进行预处理。其中,对获取的历史真实高光视频进行预处理包括:通过滑动平均方式,根据预设的滑动窗口大小,对历史真实高光视频进行平滑处理。
S230:通过逻辑回归算法进行模型训练。
示例性的,预先构建模型训练样本集,构建训练样本集对应的类别,对训练样本集数据进行傅里叶变换,确定样本特征并进行模型训练。以高光片段为结果集,输入每分钟观看人数、进场人数、离场人数、点赞数、评论互动数指标,通过逻辑回归算法进行训练模型,对视频的每一段进行标记是否是高光时刻。
Python实现代码如下:
#构建的训练集
X=np.array(X)
#构建的训练集对应的类别
Y=np.array(Y)
-----train logistic classifier--------------
model=LogisticRegression()
#需要numpy.array类型参数
model.fit(X,Y)
print'Starting read wavfile...'
#prepare test data-------------------
sample_rate,test=wavfile.read("i:/classical.00007.au.wav")
#sample_rate,test=wavfile.read("i:/heibao-wudizirong-remix.wav")
testdata_fft_features=abs(fft(test))[:1000]
type_index=model.predict(testdata_fft_features)[0]
print type_index
print genre_list[type_index]
S300:将直播视频作为神经网络模型的输入,神经网络模型的输出作为待预测时间段对应的预测高光片段。其中,神经网络模型是根据历史真实高光视频进行训练获得的模型,预设数量是预设模型预测的视频播放量与真实视频播放量最接近时的数量。将直播视频作为神经网络模型的输入,神经网络模型的输出作为待预测时间段对应的预测高光片段之后还包括对不同时间段高光片段进行标记,具体包括:
S310:确定待预测时间段对应的预测高光片段的起始时间以及待预测时间段对应的预测高光片段的结束时间;
S320:记录起始时间与结束时间对应的高光片段对应的视频内容。记录的方法可以在起始时间和结束时间增加标记,也可以记录该高光片段的起始时间和结束时间,且建立该记录的高光片段的起始时间和结束时间及对应的视频内容的链接。
S400:将预测的高光片段切割,合并成新的高光视频并存储。且主播账号可以将存储的合并后的新的高光视频发布在账号,使直播间进行二次引流。
其中,步骤S400具体包括:
S410:截取记录的起始时间与结束时间对应的高光片段对应的视频内容;其中截取的高光片段对应的视频内容还包括进行宽度及高度的裁剪;
S420:拼接各截取的高光片段对应的视频内容。
示例性的,在视频播放进度条标记视频高光片段点,并对高光片段进行切割,JAVA代码如下:
本发明的实施例二提供了一种直播视频高光片段自动获取系统500的一种具体实施方式,参见图5,它包括:
数据获取模块510,用于获取待预测时间段之前预设数量的已知高光视频;其中,已知高光视频包括真实高光视频和/或预测高光视频,高光视频为播放量高和/或每分钟观看人数高和/或离场人数少和/或点赞数高和/或评论互动数高和/或销量高时对应的时间段;
数据训练模块520,用于将已知高光视频作为训练样本进行神经网络模型的训练;
数据预测模块530,用于将直播视频作为神经网络模型的输入,神经网络模型的输出作为待预测时间段对应的预测高光片段;其中,神经网络模型是根据历史真实高光视频进行训练获得的模型,预设数量是预设模型预测的视频播放量与真实视频播放量最接近时的数量;
视频合成模块540,用于将预测的高光片段切割,合并成新的高光视频并存储。且主播账号可以将存储的合并后的新的高光视频发布在账号,使直播间进行二次引流。
可以理解的是,本发明技术方案的各个方面可以实现为系统、方法或程序产品。因此,本发明技术方案的各个方面可以具体实现为以下形式,即完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“单元”或“平台”。
本领域的技术人员应该明白,上述本发明的各单元或各步骤可以用通用的计算设备来实现,它们可以集中在单个的计算设备上,或者分布在多个计算设备所组成的网络上,可选地,它们可以用计算设备可执行的程序代码来实现,从而,可以将它们存储在存储介质中由计算设备来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路单元,或者将它们中的多个单元或步骤制作成单个集成电路单元来实现。
图6根据本发明的一些实施例,示出了一种直播视频高光片段自动获取设备的结构示意图。下面参照图6来详细描述根据本实施例中的实施方式实施的直播视频高光片段自动获取设备600。可以理解的是,图6显示的直播视频高光片段自动获取设备600仅仅是一个示例,不应对本发明技术方案任何实施例的功能和使用范围带来任何限制。
如图6所示,直播视频高光片段自动获取设备600以通用计算设备的形式表现。直播视频高光片段自动获取设备600的组建可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本实施例中上述直播视频高光片段自动获取系统中各个功能模块的实现。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取单元(RAM)6201和/或高速缓存存储单元6202,可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图像加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
直播视频高光片段自动获取设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可以与一个或者多个使得用户与该直播视频高光片段自动获取设备600交互的设备通信,和/或与使得该电子设备能与一个或多个其他计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN)、广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其他模块通信。应当明白,尽管图6中未示出,可以结合电子设备600使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
在本发明的一些实施例中,还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时能够实现上述公开中直播视频高光片段自动获取系统中的各个功能单元的实现。
尽管本实施例未详尽地列举其他具体的实施方式,但在一些可能的实施方式中,本发明技术方案说明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本发明技术方案中直播视频高光片段自动获取方法区域中描述的根据本发明技术方案各种实施例中实施方式的步骤。
图7根据本发明的一些实施例示出了一种计算机可读存储介质的结构示意图。如图7所示,其中描述了根据本发明技术方案的实施方式中用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。当然,依据本实施例产生的程序产品不限于此,在本发明技术方案中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读存储介质可以包括在基带中或者作为载波一区域传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明技术方案操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++、Python等,还包括常规的过程式程序设计语言—诸如C语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、区域地在用户设备上执行、作为一个独立的软件包执行、区域在用户计算设备上区域在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,通过本发明提出的技术方案,能够实现将直播视频作为神经网络模型的输入,该神经网络模型的输出作为待预测时间段对应的预测高光视频,以此来实现预测直播视频中的高光视频并进行标记或记录,并将该预测的高光视频从直播视频中切割出来,并合并成新的高光视频并进行存储。以此来实现对整个直播视频中高光片段的获取及集合,实现回放复盘的功能,且因为集合了高光片段,因此节约了回放复盘的时间,实现在较短的时间内进行复盘和学习,提高播销售的效果。且主播账号可以将存储的合并后的新的高光视频发布在账号,使直播间进行二次引流。
上述描述仅是对本发明技术方案较佳实施例的描述,并非对本发明技术方案范围的任何限定,本发明技术方案领域的普通技术人员根据上述揭示内容做的任何变更、修饰,均属于权利要求书的保护范围。

Claims (10)

1.一种直播视频高光片段自动获取方法,其特征在于,包括如下步骤:
获取待预测时间段之前预设数量的已知高光视频;其中,所述已知高光视频包括真实高光视频和/或预测高光视频,所述高光视频为播放量高和/或每分钟观看人数高和/或离场人数少和/或点赞数高和/或评论互动数高和/或销量高时对应的时间段;
将所述已知高光视频作为训练样本进行神经网络模型的训练;
将直播视频作为神经网络模型的输入,所述神经网络模型的输出作为所述待预测时间段对应的预测高光片段;其中,所述神经网络模型是根据历史真实高光视频进行训练获得的模型,所述预设数量是所述预设模型预测的视频播放量与真实视频播放量最接近时的数量;
将所述预测的高光片段切割,合并成新的高光视频并存储。
2.根据权利要求1所述的一种直播视频高光片段自动获取方法,其特征在于,确定所述播放量与所述每分钟观看人数和/或所述离场人数和/或点赞数和/或评论互动数和/或销量的系数值。
3.根据权利要求2所述的一种直播视频高光片段自动获取方法,其特征在于,所述神经网络模型的训练包括如下步骤:
获取历史真实高光视频构建训练集;其中,各所述历史真实高光视频与各直播时间段一一对应;
对获取的所述历史真实高光视频进行预处理;
通过逻辑回归算法进行模型训练。
4.根据权利要求3所述的一种直播视频高光片段自动获取方法,其特征在于,所述对获取的所述历史真实高光视频进行预处理包括:通过滑动平均方式,根据预设的滑动窗口大小,对所述历史真实高光视频进行平滑处理。
5.根据权利要求3所述的一种直播视频高光片段自动获取方法,其特征在于,将直播视频作为神经网络模型的输入,所述神经网络模型的输出作为所述待预测时间段对应的预测高光片段后还包括对不同时间段高光片段进行标记。
6.根据权利要求5所述的一种直播视频高光片段自动获取方法,其特征在于,所述对不同时间段高光片段进行标记具体包括:
确定所述待预测时间段对应的预测高光片段的起始时间以及所述待预测时间段对应的预测高光片段的结束时间;
记录所述起始时间与所述结束时间对应的高光片段对应的视频内容。
7.根据权利要求6所述的一种直播视频高光片段自动获取方法,其特征在于,将所述预测的高光片段切割并合并成新的高光视频具体包括:
截取记录的所述起始时间与所述结束时间对应的高光片段对应的视频内容;其中截取的高光片段对应的视频内容还包括进行宽度及高度的裁剪;
拼接各截取的高光片段对应的视频内容。
8.一种直播视频高光片段自动获取系统,其特征在于,包括:
数据获取模块,用于获取待预测时间段之前预设数量的已知高光视频;其中,所述已知高光视频包括真实高光视频和/或预测高光视频,所述高光视频为播放量高和/或每分钟观看人数高和/或离场人数少和/或点赞数高和/或评论互动数高和/或销量高时对应的时间段;
数据训练模块,用于将所述已知高光视频作为训练样本进行神经网络模型的训练;
数据预测模块,用于将直播视频作为神经网络模型的输入,所述神经网络模型的输出作为所述待预测时间段对应的预测高光片段;其中,所述神经网络模型是根据历史真实高光视频进行训练获得的模型,所述预设数量是所述预设模型预测的视频播放量与真实视频播放量最接近时的数量;
视频合成模块,用于将所述预测的高光片段切割,合并成新的高光视频并存储。
9.一种计算机设备,其特征在于,包括:
存储器,所述存储器用于存储处理程序;
处理器,所述处理器执行所述处理程序时实现如权利要求1至权利要求7中任意一项所述的直播视频高光片段自动获取方法。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有处理程序,所述处理程序被处理器执行时实现如权利要求1至权利要求7中任意一项所述的直播视频高光片段自动获取方法。
CN202310846886.0A 2023-07-11 2023-07-11 直播视频高光片段自动获取方法、系统、设备及存储介质 Pending CN116886943A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310846886.0A CN116886943A (zh) 2023-07-11 2023-07-11 直播视频高光片段自动获取方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310846886.0A CN116886943A (zh) 2023-07-11 2023-07-11 直播视频高光片段自动获取方法、系统、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116886943A true CN116886943A (zh) 2023-10-13

Family

ID=88263841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310846886.0A Pending CN116886943A (zh) 2023-07-11 2023-07-11 直播视频高光片段自动获取方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116886943A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108769723A (zh) * 2018-05-28 2018-11-06 广州虎牙信息科技有限公司 直播视频中优质内容的推送方法、装置、设备和存储介质
CN108989889A (zh) * 2018-08-09 2018-12-11 北京奇艺世纪科技有限公司 一种视频播放量预测方法、装置及电子设备
CN112905839A (zh) * 2021-02-10 2021-06-04 北京有竹居网络技术有限公司 模型训练方法、模型使用方法、装置、存储介质及设备
CN113965805A (zh) * 2021-10-22 2022-01-21 北京达佳互联信息技术有限公司 预测模型的训练方法及装置和目标视频剪辑方法及装置
CN114513655A (zh) * 2022-02-25 2022-05-17 广州方硅信息技术有限公司 直播视频质量评价方法、视频质量的调整方法及相关装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108769723A (zh) * 2018-05-28 2018-11-06 广州虎牙信息科技有限公司 直播视频中优质内容的推送方法、装置、设备和存储介质
CN108989889A (zh) * 2018-08-09 2018-12-11 北京奇艺世纪科技有限公司 一种视频播放量预测方法、装置及电子设备
CN112905839A (zh) * 2021-02-10 2021-06-04 北京有竹居网络技术有限公司 模型训练方法、模型使用方法、装置、存储介质及设备
CN113965805A (zh) * 2021-10-22 2022-01-21 北京达佳互联信息技术有限公司 预测模型的训练方法及装置和目标视频剪辑方法及装置
CN114513655A (zh) * 2022-02-25 2022-05-17 广州方硅信息技术有限公司 直播视频质量评价方法、视频质量的调整方法及相关装置

Similar Documents

Publication Publication Date Title
CN110781321B (zh) 一种多媒体内容推荐方法及装置
US8249912B2 (en) Method for determining, correlating and examining the causal relationships between media program and commercial content with response rates to advertising and product placement
US20190244366A1 (en) Relevant Motion Detection in Video
CN112104899A (zh) 直播中的信息推荐方法、装置、电子设备及存储介质
JP6807389B2 (ja) メディアコンテンツのパフォーマンスの即時予測のための方法及び装置
CN110784751B (zh) 信息显示方法及装置
CN104486649B (zh) 视频内容评级方法及装置
CN111711828A (zh) 一种信息处理方法、装置和电子设备
CN109377288A (zh) 一种广告投放分析方法及装置
CN113315988B (zh) 直播视频推荐方法及装置
CN111931073B (zh) 内容推送方法、装置、电子设备及计算机可读介质
CN116821475B (zh) 基于客户数据的视频推荐方法、装置及计算机设备
CN111881320A (zh) 一种视频查询方法、装置、设备及可读存储介质
CN110569910A (zh) 直播周期的处理方法、装置、设备及存储介质
CN110602528B (zh) 视频处理方法、终端、服务器及存储介质
CN115618024A (zh) 多媒体推荐方法、装置及电子设备
CN109165347B (zh) 数据推送方法和装置、存储介质及电子装置
CN113722588A (zh) 资源推荐方法、装置及电子设备
CN113204699B (zh) 信息推荐方法、装置、电子设备及存储介质
CN116886943A (zh) 直播视频高光片段自动获取方法、系统、设备及存储介质
CN110209539B (zh) 一种测试方法、终端设备以及测试器
CN111200639A (zh) 基于用户操作行为的信息推送方法、装置和电子设备
CN108833935A (zh) 一种直播间推荐方法、装置、设备及存储介质
CN111127075B (zh) 交互式推广方法、装置、电子设备以及存储介质
CN112861018A (zh) 内容发布方法、装置、计算机可读存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination