CN117150075A - 一种基于数据分析的短视频智能推荐系统 - Google Patents
一种基于数据分析的短视频智能推荐系统 Download PDFInfo
- Publication number
- CN117150075A CN117150075A CN202311416716.5A CN202311416716A CN117150075A CN 117150075 A CN117150075 A CN 117150075A CN 202311416716 A CN202311416716 A CN 202311416716A CN 117150075 A CN117150075 A CN 117150075A
- Authority
- CN
- China
- Prior art keywords
- analysis
- video
- unit
- acquiring
- short
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 13
- 238000004458 analytical method Methods 0.000 claims abstract description 124
- 238000011156 evaluation Methods 0.000 claims abstract description 74
- 238000000034 method Methods 0.000 claims abstract description 23
- 238000005206 flow analysis Methods 0.000 claims abstract description 14
- 238000010606 normalization Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 11
- 230000007704 transition Effects 0.000 claims description 9
- 230000003321 amplification Effects 0.000 claims description 6
- 238000000855 fermentation Methods 0.000 claims description 6
- 230000004151 fermentation Effects 0.000 claims description 6
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 6
- 230000009286 beneficial effect Effects 0.000 description 5
- 230000006854 communication Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 2
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明涉及短视频推荐技术领域,尤其涉及一种基于数据分析的短视频智能推荐系统,包括管理平台、数据采集单元、视频划分单元、热度分析单元、自带流量分析单元、显示执行单元、发布监管分析单元以及监督分析单元;本发明通过对待推荐用户的历史信息进行视频划分监管分析,以便根据历史信息反馈情况分析待推荐用户喜欢的短视频类型,以便合理的进行兴趣类型视频推荐,且通过采集兴趣类型的自身数据和流传数据,即从发布者自身所带的热度和发布后视频所引起的热度两个角度进行评估分析,进而有助于提高分析结果的准确性,进而使短视频推荐的更加合理,不仅满足了待推荐用户对短视频的观看需求,而且提高了待推荐用户对短视频应用程序的使用率。
Description
技术领域
本发明涉及短视频推荐技术领域,尤其涉及一种基于数据分析的短视频智能推荐系统。
背景技术
短视频是一种互联网内容传播方式,是指在各种新媒体平台上播放的、适合在移动状态和短时休闲状态下观看的、高频推送的视频内容。其内容融合了技能分享、幽默搞怪、时尚潮流、社会热点、街头采访、公益教育、广告创意、商业定制等主题。由于内容较短,可以单独成片,也可以成为系列栏目;
目前,随着互联网技术的不断发展,各种视频软件作为一种视频观看平台为用户提供多种类型视频以供观看,但是,视频推荐难以针对个人用户的真实需求进行合理的推荐,容易导致推荐的短视频的准确率下降,影响用户体验,且传统的推荐分析结果误差大,分析数据过于单一,极大的降低了用户的观看效果;
针对上述的技术缺陷,现提出一种解决方案。
发明内容
本发明的目的在于提供一种基于数据分析的短视频智能推荐系统,去解决上述提出的技术缺陷,本发明通过采集待推荐用户的历史信息,并对历史信息进行视频划分监管分析,以便根据历史信息反馈情况分析待推荐用户喜欢的短视频类型,以便合理的进行视频推荐,在确定喜欢短视频类型的顺序后,首推排序第一的兴趣类型,且通过采集兴趣类型的自身数据和流传数据,即从发布者自身所带的热度和发布后视频所引起的热度两个角度进行评估分析,进而有助于提高分析结果的准确性,进而使短视频推荐的更加合理,同时有助于提高推荐准确率,进而提高待推荐用户的观看效果,且深入式对待推荐用户的观看数据进行观看评估反馈操作,进而对浏览短视频过程中待推荐用户进行二次短视频推荐,以保证待推荐用户短视频的推荐合理性和灵活性,不仅满足了待推荐用户对短视频的观看需求,而且提高了待推荐用户对短视频应用程序的使用率。
本发明的目的可以通过以下技术方案实现:一种基于数据分析的短视频智能推荐系统,包括管理平台、数据采集单元、视频划分单元、热度分析单元、自带流量分析单元、显示执行单元、发布监管分析单元以及监督分析单元;
当管理平台生成运管指令时,并将运管指令发送至数据采集单元,数据采集单元在接收到运管指令后,立即采集待推荐用户的历史信息,历史信息包括浏览值和偏向值,并将历史信息发送至视频划分单元,视频划分单元在接收到历史信息后,立即对历史信息进行视频划分监管分析,将得到的兴趣类型发送至热度分析单元;
热度分析单元在接收到兴趣类型后,立即采集兴趣类型的自身数据和流传数据,自身数据包括作者被搜索的总次数和作者的最大粉丝数,流传数据包括单位时间点评值、平均评论间隔时长以及单位时间转发量,并将自身数据和流传数据分别发送至自带流量分析单元和发布监管分析单元,自带流量分析单元在接收到自身数据后,立即对自身数据进行待评估反馈分析,将得到的自身引流系数发送至热度分析单元;
发布监管分析单元在接收到流传数据后,立即对流传数据进行发酵监管评估分析,将得到的发布热度评估系数FB发送至热度分析单元;
热度分析单元在接收到自身引流系数和发布热度评估系数FB后,立即对自身引流系数和发布热度评估系数FB进行整合推荐评估分析,将得到的排序后的推荐评估系数TJm发送至显示执行单元和监督分析单元;
监督分析单元在接收到排序后的推荐评估系数TJm后,立即采集待推荐用户的观看数据,观看数据包括观看短视频的总个数和单个短视频的停留时长,并对观看数据进行观看评估反馈操作,将得到的二次推荐信号发送至视频划分单元。
优选的,所述视频划分单元的视频划分监管分析过程如下:
当待推荐用户登录视频网站时,获取当前系统时间,查找所述当前系统时间所在的最近历史时间段,并将其标记为时间阈值,获取到时间阈值内待推荐用户观看视频类型数,将类型数标记为g,g为大于零的自然数,获取到时间阈值内各个类型短视频的浏览值,浏览值表示同类型短视频的浏览总时长与同类型对应所有短视频原时长总和之间的比值,同时获取到时间阈值内各个类型短视频的偏向值,偏向值表示同类型短视频的点赞次数与评论次数之和与同类型对应所有短视频点赞和评论总次数之间的比值,并将浏览值和偏向值分别标号为LLg和PXg;
根据公式得到各个类型短视频的兴趣偏向系数,其中,a1和a2分别为浏览值和偏向值的预设比例因子系数,a1和a2均为大于零的正数,a3为预设容错因子系数,取值为1.228,Lg为各个类型短视频的兴趣偏向系数,并将兴趣偏向系数Lg按照从大到小的顺序进行排序,获取到排序后的兴趣偏向系数Lg的最大值,标记为Lmax,并将Lmax所对应的类型短视频标记为兴趣类型。
优选的,所述自带流量分析单元的待评估反馈分析过程如下:
采集登录前一段时间的时长,并将其标记为分析时长,将分析时长划分为i个子时间段,i为大于零的自然数,获取到各个子时间段内兴趣类型中各个短视频发布前作者被搜索的总次数,进而获取到相连两次搜索时刻之间的时间间隔时长,进而获取到相连两次搜索时刻之间的时间间隔时长的均值,并将相连两次搜索时刻之间的时间间隔时长的均值标记为搜索频次均值,以子时间段的个数为X轴,以搜索频次均值为Y轴建立直角坐标系,通过描点的方式绘制搜索频次均值曲线,进而获取到搜索频次均值曲线与X轴所围成的面积,并将搜索频次均值曲线与X轴所围成的面积标记为流量影响面积;
获取到分析时长内兴趣类型中各个短视频发布前作者的最大粉丝数,并将流量影响面积和最大粉丝数经数据归一化处理后得到的积值标记为自身引流系数。
优选的,所述发布监管分析单元的发酵监管评估分析过程如下:
获取到各个子时间段内兴趣类型中各个短视频的单位时间点评值,单位时间点评值表示单位时间内短视频被点赞和评论的次数之和,以此构建单位时间点评值的集合A,获取到集合A的均值和离散系数,并将集合A的均值和离散系数经数据归一化处理后得到的积值标记为点击影响值DJ;
获取到各个子时间段内兴趣类型中各个短视频的平均评论间隔时长,以子时间段的个数为X轴,以平均评论间隔时长为Y轴建立直角坐标系,通过描点的方式绘制平均评论间隔时长曲线,获取到相连两个点所形成线段的斜率,并将其标记增幅斜率,以此构建增幅斜率的集合B,进而获取到集合B的均值,并将集合B的均值标记为增幅倍率ZB;
获取到各个子时间段内兴趣类型中各个短视频的单位时间转发量,进而获取到分析时长内平均单位时间转发量,同时获取到分析时长内兴趣类型中各个短视频的总转发量,并将平均单位时间转发量和总转发量之间的数值的和值标记为转发影响值ZF;
根据公式得到发布热度评估系数,其中,f1、f2以及f3分别为点击影响值、增幅倍率以及转发影响值的预设影响因子系数,f1、f2以及f3均为大于零的正数,f4为预设补偿因子系数,取值为2.256,FB为发布热度评估系数。
优选的,所述热度分析单元的整合推荐评估分析过程如下:
获取到兴趣类型中各个短视频的自身引流系数和发布热度评估系数FB,并将兴趣类型中短视频的自身引流系数和发布热度评估系数FB经数据归一化处理后得到的和值标记为推荐评估系数,将兴趣类型中各个短视频标记为m,m为大于1的自然数,进而获取到兴趣类型中各个短视频的推荐评估系数TJm,并对推荐评估系数TJm按照从大到小的顺序进行排序,并将排序后的推荐评估系数TJm发送至显示执行单元和监督分析单元,显示执行单元在接收到排序后的推荐评估系数TJm后,立即将排序后的推荐评估系数TJm所对应的短视频依次给待推荐用户进行展示。
优选的,所述监督分析单元的观看评估反馈操作过程如下:
S1:采集到待推荐用户观看短视频一段时间的时长,并将其标记为分析时长,获取到分析时长内待推荐用户观看短视频的总个数,进而获取到分析时长内单个短视频的停留时长,并将停留时长与存储的预设停留时长阈值进行比对分析,若停留时长小于预设停留时长阈值,则将停留时长小于预设停留时长阈值所对应的短视频标记为过渡视频,获取到过渡视频的总个数,并将过渡视频的总个数与观看短视频的总个数之间的比值标记为切换影响值;
S12:获取到分析时长内待推荐用户的观看短视频的切换总次数,以此获取到相连两个短视频之间的切换间隔时长,并将切换间隔时长与存储的预设切换间隔时长阈值进行比对分析,若切换间隔时长小于预设切换间隔时长阈值,则将切换间隔时长小于预设切换间隔时长阈值所对应切换次数与切换总次数之间的比值标记为切换趋势值,并将切换影响值和切换趋势值经数据归一化处理后得到的积值标记为切换意向系数,并将切换意向系数与其内部录入存储的预设切换意向系数阈值进行比对分析:
若切换意向系数小于等于预设切换意向系数阈值,则不生成任何信号;
若切换意向系数大于预设切换意向系数阈值,则生成二次推荐信号,并将二次推荐信号发送至视频划分单元,视频划分单元在接收到二次推荐信号后,立即获取到排序后的兴趣偏向系数Lg的第二最大值,并将兴趣偏向系数Lg的第二最大值所对应的类型短视频标记为第二兴趣类型,并将第二兴趣类型发送至热度分析单元进行二次短视频推荐。
本发明的有益效果如下:
本发明通过采集待推荐用户的历史信息,并对历史信息进行视频划分监管分析,以便根据历史信息反馈情况分析待推荐用户喜欢的短视频类型,以便合理的进行视频推荐,在确定喜欢短视频类型的顺序后,首推排序第一的兴趣类型,且通过采集兴趣类型的自身数据和流传数据,即从发布者自身所带的热度和发布后视频所引起的热度两个角度进行评估分析,进而有助于提高分析结果的准确性,进而使短视频推荐的更加合理,同时有助于提高推荐准确率,进而提高待推荐用户的观看效果;
本发明通过深入式对待推荐用户的观看数据进行观看评估反馈操作,进而对浏览短视频过程中待推荐用户进行二次短视频推荐,以保证待推荐用户短视频的推荐合理性和灵活性,不仅满足了待推荐用户对短视频的观看需求,而且提高了待推荐用户对短视频应用程序的使用率。
附图说明
下面结合附图对本发明作进一步的说明;
图1是本发明系统流程框图;
图2是本发明局部分析参考图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
请参阅图1至图2所示,本发明为一种基于数据分析的短视频智能推荐系统,包括管理平台、数据采集单元、视频划分单元、热度分析单元、自带流量分析单元、显示执行单元、发布监管分析单元以及监督分析单元,管理平台与数据采集单元呈单向通讯连接,数据采集单元与视频划分单元呈单向通讯连接,视频划分单元与热度分析单元呈单向通讯连接,热度分析单元与自带流量分析单元和发布监管分析单元均呈双向通讯连接,热度分析单元与监督分析单元呈单向通讯连接,监督分析单元与视频划分单元呈单向通讯连接;
当管理平台生成运管指令时,并将运管指令发送至数据采集单元,数据采集单元在接收到运管指令后,立即采集待推荐用户的历史信息,历史信息包括浏览值和偏向值,并将历史信息发送至视频划分单元,视频划分单元在接收到历史信息后,立即对历史信息进行视频划分监管分析,以便根据历史信息反馈情况分析待推荐用户喜欢的短视频类型,以便合理的进行视频推荐,具体的视频划分监管分析过程如下:
当待推荐用户登录视频网站时,获取当前系统时间,查找所述当前系统时间所在的最近历史时间段,并将其标记为时间阈值,获取到时间阈值内待推荐用户观看视频类型数,将类型数标记为g,g为大于零的自然数,获取到时间阈值内各个类型短视频的浏览值,浏览值表示同类型短视频的浏览总时长与同类型对应所有短视频原时长总和之间的比值,同时获取到时间阈值内各个类型短视频的偏向值,偏向值表示同类型短视频的点赞次数与评论次数之和与同类型对应所有短视频点赞和评论总次数之间的比值,并将浏览值和偏向值分别标号为LLg和PXg,需要说明的是,浏览值和偏向值是两个反映待推荐用户推荐视频的影响参数;
根据公式得到各个类型短视频的兴趣偏向系数,其中,a1和a2分别为浏览值和偏向值的预设比例因子系数,比例因子系数用于修正各项参数在公式计算过程中出现的偏差,从而使得计算结果更加准确,a1和a2均为大于零的正数,a3为预设容错因子系数,取值为1.228,Lg为各个类型短视频的兴趣偏向系数,并将兴趣偏向系数Lg按照从大到小的顺序进行排序,获取到排序后的兴趣偏向系数Lg的最大值,标记为Lmax,并将Lmax所对应的类型短视频标记为兴趣类型,并将兴趣类型发送至热度分析单元;
热度分析单元在接收到兴趣类型后,立即采集兴趣类型的自身数据和流传数据,自身数据包括作者被搜索的总次数和作者的最大粉丝数,流传数据包括单位时间点评值、平均评论间隔时长以及单位时间转发量,并将自身数据和流传数据分别发送至自带流量分析单元和发布监管分析单元,自带流量分析单元在接收到自身数据后,立即对自身数据进行待评估反馈分析,以便根据发布者自带热度情况进行分析,以保证短视频推荐的合理性,具体的待评估反馈分析过程如下:
采集登录前一段时间的时长,并将其标记为分析时长,将分析时长划分为i个子时间段,i为大于零的自然数,获取到各个子时间段内兴趣类型中各个短视频发布前作者被搜索的总次数,进而获取到相连两次搜索时刻之间的时间间隔时长,进而获取到相连两次搜索时刻之间的时间间隔时长的均值,并将相连两次搜索时刻之间的时间间隔时长的均值标记为搜索频次均值,以子时间段的个数为X轴,以搜索频次均值为Y轴建立直角坐标系,通过描点的方式绘制搜索频次均值曲线,进而获取到搜索频次均值曲线与X轴所围成的面积,并将搜索频次均值曲线与X轴所围成的面积标记为流量影响面积,需要说明的是,流量影响面积的是数值越大,则发布者对短视频推荐的影响越大;
获取到分析时长内兴趣类型中各个短视频发布前作者的最大粉丝数,并将流量影响面积和最大粉丝数经数据归一化处理后得到的积值标记为自身引流系数,并将自身引流系数发送至热度分析单元。
实施例2
发布监管分析单元在接收到流传数据后,立即对流传数据进行发酵监管评估分析,以便结合短视频的受欢迎情况进行推荐,有助于提高短视频推荐的精准性,具体的发酵监管评估分析过程如下:
获取到各个子时间段内兴趣类型中各个短视频的单位时间点评值,单位时间点评值表示单位时间内短视频被点赞和评论的次数之和,以此构建单位时间点评值的集合A,获取到集合A的均值和离散系数,并将集合A的均值和离散系数经数据归一化处理后得到的积值标记为点击影响值,标号为DJ,需要说明的是,点击影响值DJ的数值越大,则对短视频的推荐影响越大;
获取到各个子时间段内兴趣类型中各个短视频的平均评论间隔时长,以子时间段的个数为X轴,以平均评论间隔时长为Y轴建立直角坐标系,通过描点的方式绘制平均评论间隔时长曲线,获取到相连两个点所形成线段的斜率,并将其标记增幅斜率,以此构建增幅斜率的集合B,进而获取到集合B的均值,并将集合B的均值标记为增幅倍率,标号为ZB,需要说明的是,增幅倍率ZB的数值越大,则侧面说明短视频的受欢迎程度越高;
获取到各个子时间段内兴趣类型中各个短视频的单位时间转发量,进而获取到分析时长内平均单位时间转发量,同时获取到分析时长内兴趣类型中各个短视频的总转发量,并将平均单位时间转发量和总转发量之间的数值的和值标记为转发影响值,标号为ZF,需要说明的是,转发影响值ZF的数值越大,则侧面说明短视频的受欢迎程度越高;
根据公式得到发布热度评估系数,其中,f1、f2以及f3分别为点击影响值、增幅倍率以及转发影响值的预设影响因子系数,f1、f2以及f3均为大于零的正数,f4为预设补偿因子系数,取值为2.256,FB为发布热度评估系数,并将发布热度评估系数FB发送至热度分析单元;
热度分析单元在接收到自身引流系数和发布热度评估系数FB后,立即对自身引流系数和发布热度评估系数FB进行整合推荐评估分析,以便从发布者自身和发布后热度两个角度进行分析,有助于提高分析结果的准确性,具体的整合推荐评估分析过程如下:
获取到兴趣类型中各个短视频的自身引流系数和发布热度评估系数FB,并将兴趣类型中短视频的自身引流系数和发布热度评估系数FB经数据归一化处理后得到的和值标记为推荐评估系数,将兴趣类型中各个短视频标记为m,m为大于1的自然数,进而获取到兴趣类型中各个短视频的推荐评估系数,标号为TJm,并对推荐评估系数TJm按照从大到小的顺序进行排序,并将排序后的推荐评估系数TJm发送至显示执行单元和监督分析单元,显示执行单元在接收到排序后的推荐评估系数TJm后,立即将排序后的推荐评估系数TJm所对应的短视频依次给待推荐用户进行展示,而通过发布者自身和发布后热度两个角度进行分析,有助于提高分析结果的准确性,进而使短视频推荐的更加合理;
监督分析单元在接收到排序后的推荐评估系数TJm后,立即采集待推荐用户的观看数据,观看数据包括观看短视频的总个数和单个短视频的停留时长,并对观看数据进行观看评估反馈操作,进而对浏览短视频过程中待推荐用户进行二次短视频推荐,以保证待推荐用户短视频的推荐合理性,具体的观看评估反馈操作过程如下:
采集到待推荐用户观看短视频一段时间的时长,并将其标记为分析时长,获取到分析时长内待推荐用户观看短视频的总个数,进而获取到分析时长内单个短视频的停留时长,并将停留时长与存储的预设停留时长阈值进行比对分析,若停留时长小于预设停留时长阈值,则将停留时长小于预设停留时长阈值所对应的短视频标记为过渡视频,获取到过渡视频的总个数,并将过渡视频的总个数与观看短视频的总个数之间的比值标记为切换影响值,需要说明的是,切换影响值的数值越大,则对待推荐用户观看短视频的意愿影响越来越大,使待推荐用户对推荐的短视频兴趣浓度程度越来越小;
获取到分析时长内待推荐用户的观看短视频的切换总次数,以此获取到相连两个短视频之间的切换间隔时长,并将切换间隔时长与存储的预设切换间隔时长阈值进行比对分析,若切换间隔时长小于预设切换间隔时长阈值,则将切换间隔时长小于预设切换间隔时长阈值所对应切换次数与切换总次数之间的比值标记为切换趋势值,并将切换影响值和切换趋势值经数据归一化处理后得到的积值标记为切换意向系数,并将切换意向系数与其内部录入存储的预设切换意向系数阈值进行比对分析:
若切换意向系数小于等于预设切换意向系数阈值,则不生成任何信号;
若切换意向系数大于预设切换意向系数阈值,则生成二次推荐信号,并将二次推荐信号发送至视频划分单元,视频划分单元在接收到二次推荐信号后,立即获取到排序后的兴趣偏向系数Lg的第二最大值,并将兴趣偏向系数Lg的第二最大值所对应的类型短视频标记为第二兴趣类型,并将第二兴趣类型发送至热度分析单元进行二次短视频推荐,进而有助于提高短视频推荐的合理性和灵活性,同时更好的提高待推荐用户的观看效果;
综上所述,本发明通过采集待推荐用户的历史信息,并对历史信息进行视频划分监管分析,以便根据历史信息反馈情况分析待推荐用户喜欢的短视频类型,以便合理的进行视频推荐,在确定喜欢短视频类型的顺序后,首推排序第一的兴趣类型,且通过采集兴趣类型的自身数据和流传数据,即从发布者自身所带的热度和发布后视频所引起的热度两个角度进行评估分析,进而有助于提高分析结果的准确性,进而使短视频推荐的更加合理,同时有助于提高推荐准确率,进而提高待推荐用户的观看效果,且深入式对待推荐用户的观看数据进行观看评估反馈操作,进而对浏览短视频过程中待推荐用户进行二次短视频推荐,以保证待推荐用户短视频的推荐合理性和灵活性,不仅满足了待推荐用户对短视频的观看需求,而且提高了待推荐用户对短视频应用程序的使用率。
阈值的大小的设定是为了便于比较,关于阈值的大小,取决于样本数据的多少及本领域技术人员对每一组样本数据设定基数数量;只要不影响参数与量化后数值的比例关系即可。
上述公式均是采集大量数据进行软件模拟得出且选取与真实值接近的一个公式,公式中的系数是由本领域技术人员根据实际情况进行设置,以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (6)
1.一种基于数据分析的短视频智能推荐系统,其特征在于,包括管理平台、数据采集单元、视频划分单元、热度分析单元、自带流量分析单元、显示执行单元、发布监管分析单元以及监督分析单元;
当管理平台生成运管指令时,并将运管指令发送至数据采集单元,数据采集单元在接收到运管指令后,立即采集待推荐用户的历史信息,历史信息包括浏览值和偏向值,并将历史信息发送至视频划分单元,视频划分单元在接收到历史信息后,立即对历史信息进行视频划分监管分析,将得到的兴趣类型发送至热度分析单元;
热度分析单元在接收到兴趣类型后,立即采集兴趣类型的自身数据和流传数据,自身数据包括作者被搜索的总次数和作者的最大粉丝数,流传数据包括单位时间点评值、平均评论间隔时长以及单位时间转发量,并将自身数据和流传数据分别发送至自带流量分析单元和发布监管分析单元,自带流量分析单元在接收到自身数据后,立即对自身数据进行待评估反馈分析,将得到的自身引流系数发送至热度分析单元;
发布监管分析单元在接收到流传数据后,立即对流传数据进行发酵监管评估分析,将得到的发布热度评估系数FB发送至热度分析单元;
热度分析单元在接收到自身引流系数和发布热度评估系数FB后,立即对自身引流系数和发布热度评估系数FB进行整合推荐评估分析,将得到的排序后的推荐评估系数TJm发送至显示执行单元和监督分析单元;
监督分析单元在接收到排序后的推荐评估系数TJm后,立即采集待推荐用户的观看数据,观看数据包括观看短视频的总个数和单个短视频的停留时长,并对观看数据进行观看评估反馈操作,将得到的二次推荐信号发送至视频划分单元。
2.根据权利要求1所述的一种基于数据分析的短视频智能推荐系统,其特征在于,所述视频划分单元的视频划分监管分析过程如下:
当待推荐用户登录视频网站时,获取当前系统时间,查找所述当前系统时间所在的最近历史时间段,并将其标记为时间阈值,获取到时间阈值内待推荐用户观看视频类型数,将类型数标记为g,g为大于零的自然数,获取到时间阈值内各个类型短视频的浏览值,浏览值表示同类型短视频的浏览总时长与同类型对应所有短视频原时长总和之间的比值,同时获取到时间阈值内各个类型短视频的偏向值,偏向值表示同类型短视频的点赞次数与评论次数之和与同类型对应所有短视频点赞和评论总次数之间的比值,并将浏览值和偏向值分别标号为LLg和PXg;
根据公式得到各个类型短视频的兴趣偏向系数,其中,a1和a2分别为浏览值和偏向值的预设比例因子系数,a1和a2均为大于零的正数,a3为预设容错因子系数,取值为1.228,Lg为各个类型短视频的兴趣偏向系数,并将兴趣偏向系数Lg按照从大到小的顺序进行排序,获取到排序后的兴趣偏向系数Lg的最大值,标记为Lmax,并将Lmax所对应的类型短视频标记为兴趣类型。
3.根据权利要求1所述的一种基于数据分析的短视频智能推荐系统,其特征在于,所述自带流量分析单元的待评估反馈分析过程如下:
采集登录前一段时间的时长,并将其标记为分析时长,将分析时长划分为i个子时间段,i为大于零的自然数,获取到各个子时间段内兴趣类型中各个短视频发布前作者被搜索的总次数,进而获取到相连两次搜索时刻之间的时间间隔时长,进而获取到相连两次搜索时刻之间的时间间隔时长的均值,并将相连两次搜索时刻之间的时间间隔时长的均值标记为搜索频次均值,以子时间段的个数为X轴,以搜索频次均值为Y轴建立直角坐标系,通过描点的方式绘制搜索频次均值曲线,进而获取到搜索频次均值曲线与X轴所围成的面积,并将搜索频次均值曲线与X轴所围成的面积标记为流量影响面积;
获取到分析时长内兴趣类型中各个短视频发布前作者的最大粉丝数,并将流量影响面积和最大粉丝数经数据归一化处理后得到的积值标记为自身引流系数。
4.根据权利要求1所述的一种基于数据分析的短视频智能推荐系统,其特征在于,所述发布监管分析单元的发酵监管评估分析过程如下:
获取到各个子时间段内兴趣类型中各个短视频的单位时间点评值,单位时间点评值表示单位时间内短视频被点赞和评论的次数之和,以此构建单位时间点评值的集合A,获取到集合A的均值和离散系数,并将集合A的均值和离散系数经数据归一化处理后得到的积值标记为点击影响值DJ;
获取到各个子时间段内兴趣类型中各个短视频的平均评论间隔时长,以子时间段的个数为X轴,以平均评论间隔时长为Y轴建立直角坐标系,通过描点的方式绘制平均评论间隔时长曲线,获取到相连两个点所形成线段的斜率,并将其标记增幅斜率,以此构建增幅斜率的集合B,进而获取到集合B的均值,并将集合B的均值标记为增幅倍率ZB;
获取到各个子时间段内兴趣类型中各个短视频的单位时间转发量,进而获取到分析时长内平均单位时间转发量,同时获取到分析时长内兴趣类型中各个短视频的总转发量,并将平均单位时间转发量和总转发量之间的数值的和值标记为转发影响值ZF;
根据公式得到发布热度评估系数,其中,f1、f2以及f3分别为点击影响值、增幅倍率以及转发影响值的预设影响因子系数,f1、f2以及f3均为大于零的正数,f4为预设补偿因子系数,取值为2.256,FB为发布热度评估系数。
5.根据权利要求1所述的一种基于数据分析的短视频智能推荐系统,其特征在于,所述热度分析单元的整合推荐评估分析过程如下:
获取到兴趣类型中各个短视频的自身引流系数和发布热度评估系数FB,并将兴趣类型中短视频的自身引流系数和发布热度评估系数FB经数据归一化处理后得到的和值标记为推荐评估系数,将兴趣类型中各个短视频标记为m,m为大于1的自然数,进而获取到兴趣类型中各个短视频的推荐评估系数TJm,并对推荐评估系数TJm按照从大到小的顺序进行排序,并将排序后的推荐评估系数TJm发送至显示执行单元和监督分析单元,显示执行单元在接收到排序后的推荐评估系数TJm后,立即将排序后的推荐评估系数TJm所对应的短视频依次给待推荐用户进行展示。
6.根据权利要求2所述的一种基于数据分析的短视频智能推荐系统,其特征在于,所述监督分析单元的观看评估反馈操作过程如下:
S1:采集到待推荐用户观看短视频一段时间的时长,并将其标记为分析时长,获取到分析时长内待推荐用户观看短视频的总个数,进而获取到分析时长内单个短视频的停留时长,并将停留时长与存储的预设停留时长阈值进行比对分析,若停留时长小于预设停留时长阈值,则将停留时长小于预设停留时长阈值所对应的短视频标记为过渡视频,获取到过渡视频的总个数,并将过渡视频的总个数与观看短视频的总个数之间的比值标记为切换影响值;
S12:获取到分析时长内待推荐用户的观看短视频的切换总次数,以此获取到相连两个短视频之间的切换间隔时长,并将切换间隔时长与存储的预设切换间隔时长阈值进行比对分析,若切换间隔时长小于预设切换间隔时长阈值,则将切换间隔时长小于预设切换间隔时长阈值所对应切换次数与切换总次数之间的比值标记为切换趋势值,并将切换影响值和切换趋势值经数据归一化处理后得到的积值标记为切换意向系数,并将切换意向系数与其内部录入存储的预设切换意向系数阈值进行比对分析:
若切换意向系数小于等于预设切换意向系数阈值,则不生成任何信号;
若切换意向系数大于预设切换意向系数阈值,则生成二次推荐信号,并将二次推荐信号发送至视频划分单元,视频划分单元在接收到二次推荐信号后,立即获取到排序后的兴趣偏向系数Lg的第二最大值,并将兴趣偏向系数Lg的第二最大值所对应的类型短视频标记为第二兴趣类型,并将第二兴趣类型发送至热度分析单元进行二次短视频推荐。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311416716.5A CN117150075B (zh) | 2023-10-30 | 2023-10-30 | 一种基于数据分析的短视频智能推荐系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311416716.5A CN117150075B (zh) | 2023-10-30 | 2023-10-30 | 一种基于数据分析的短视频智能推荐系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117150075A true CN117150075A (zh) | 2023-12-01 |
CN117150075B CN117150075B (zh) | 2024-02-13 |
Family
ID=88901126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311416716.5A Active CN117150075B (zh) | 2023-10-30 | 2023-10-30 | 一种基于数据分析的短视频智能推荐系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117150075B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117670435A (zh) * | 2024-02-01 | 2024-03-08 | 威海双子星软件科技有限公司 | 基于计算机软硬件集成的网页应用交叉推广系统 |
CN117729358A (zh) * | 2024-02-08 | 2024-03-19 | 北京字跳网络技术有限公司 | 数据处理方法、装置、设备、计算机可读存储介质及产品 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007148817A1 (ja) * | 2006-06-23 | 2007-12-27 | Nec Corporation | コンテンツ推薦システム、コンテンツ推薦方法及びコンテンツ推薦用プログラム |
CN113268633A (zh) * | 2021-06-25 | 2021-08-17 | 北京邮电大学 | 一种短视频推荐方法 |
CN113407773A (zh) * | 2021-05-30 | 2021-09-17 | 咸宁方片互娱网络有限公司 | 一种短视频智能推荐方法、系统、电子设备及存储介质 |
CN114896454A (zh) * | 2022-07-12 | 2022-08-12 | 长沙美哒网络科技有限公司 | 一种基于标签分析的短视频数据推荐方法及系统 |
CN115878841A (zh) * | 2023-03-03 | 2023-03-31 | 南京邮电大学 | 一种基于改进秃鹰搜索算法的短视频推荐方法及系统 |
US20230156283A1 (en) * | 2021-11-18 | 2023-05-18 | Beijing Bytedance Network Technology Co., Ltd. | A method, apparatus and electronic device for processing of video recommendations |
-
2023
- 2023-10-30 CN CN202311416716.5A patent/CN117150075B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007148817A1 (ja) * | 2006-06-23 | 2007-12-27 | Nec Corporation | コンテンツ推薦システム、コンテンツ推薦方法及びコンテンツ推薦用プログラム |
CN113407773A (zh) * | 2021-05-30 | 2021-09-17 | 咸宁方片互娱网络有限公司 | 一种短视频智能推荐方法、系统、电子设备及存储介质 |
CN113268633A (zh) * | 2021-06-25 | 2021-08-17 | 北京邮电大学 | 一种短视频推荐方法 |
US20230156283A1 (en) * | 2021-11-18 | 2023-05-18 | Beijing Bytedance Network Technology Co., Ltd. | A method, apparatus and electronic device for processing of video recommendations |
CN114896454A (zh) * | 2022-07-12 | 2022-08-12 | 长沙美哒网络科技有限公司 | 一种基于标签分析的短视频数据推荐方法及系统 |
CN115878841A (zh) * | 2023-03-03 | 2023-03-31 | 南京邮电大学 | 一种基于改进秃鹰搜索算法的短视频推荐方法及系统 |
Non-Patent Citations (1)
Title |
---|
高晨峰;: "深度神经网络视频新媒体短视频个性化推荐系统研究", 卫星电视与宽带多媒体, no. 05, pages 22 - 26 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117670435A (zh) * | 2024-02-01 | 2024-03-08 | 威海双子星软件科技有限公司 | 基于计算机软硬件集成的网页应用交叉推广系统 |
CN117729358A (zh) * | 2024-02-08 | 2024-03-19 | 北京字跳网络技术有限公司 | 数据处理方法、装置、设备、计算机可读存储介质及产品 |
Also Published As
Publication number | Publication date |
---|---|
CN117150075B (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117150075B (zh) | 一种基于数据分析的短视频智能推荐系统 | |
CN106844530A (zh) | 一种问答对分类模型的训练方法和装置 | |
CN105975472A (zh) | 一种推荐方法和装置 | |
CN103365936A (zh) | 视频推荐系统及其方法 | |
CN101482884A (zh) | 一种基于用户偏好评分分布的协作推荐系统 | |
CN102495864A (zh) | 基于评分的协同过滤推荐方法及系统 | |
CN112104642A (zh) | 一种异常账号确定方法和相关装置 | |
CN104423621A (zh) | 拼音字符串处理方法和装置 | |
CN102207972A (zh) | 一种数字电视的影视节目推荐方法及其装置 | |
CN108322317A (zh) | 一种账号识别关联方法及服务器 | |
CN108921734A (zh) | 一个基于多源异构数据的房地产信息可视化系统 | |
CN110188268A (zh) | 一种基于标签和时间信息的个性化推荐方法 | |
CN104572757A (zh) | 微博群体处理方法及装置 | |
Wenzhen | Personalized music recommendation algorithm based on hybrid collaborative filtering technology | |
Klement et al. | How do new music genres emerge? Diversification processes in symbolic knowledge bases | |
CN106572390A (zh) | 一种音视频推荐方法及设备 | |
CN109640128A (zh) | 一种电视用户观看行为特征提取方法及系统 | |
CN109816431A (zh) | 一种品牌传播指数构建方法、系统及存储介质 | |
CN101777070B (zh) | 一种互动数字电视节目搜索方法及查询服务器 | |
CN103885994A (zh) | 一种产品对比方法和装置 | |
CN102567425A (zh) | 一种数据的处理方法和设备 | |
CN113065975B (zh) | 网络舆情话题聚焦程度与演变关系计算方法、系统、终端 | |
CN108595630A (zh) | 一种用户行为数据分析模型及其构建方法 | |
CN105898409A (zh) | 基于大数据的跨平台电视节目评价系统 | |
CN106844504A (zh) | 一种发送歌单标识的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |