CN113449146A - 一种基于数据分析的短视频浏览推荐方法、设备及计算机存储介质 - Google Patents

一种基于数据分析的短视频浏览推荐方法、设备及计算机存储介质 Download PDF

Info

Publication number
CN113449146A
CN113449146A CN202110760969.9A CN202110760969A CN113449146A CN 113449146 A CN113449146 A CN 113449146A CN 202110760969 A CN202110760969 A CN 202110760969A CN 113449146 A CN113449146 A CN 113449146A
Authority
CN
China
Prior art keywords
video
short video
short
user
browsed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110760969.9A
Other languages
English (en)
Inventor
黄海燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Fenghuayu Business Co ltd
Original Assignee
Wuhan Fenghuayu Business Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Fenghuayu Business Co ltd filed Critical Wuhan Fenghuayu Business Co ltd
Priority to CN202110760969.9A priority Critical patent/CN113449146A/zh
Publication of CN113449146A publication Critical patent/CN113449146A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于数据分析的短视频浏览推荐方法、设备及计算机存储介质,本发明通过对比用户浏览短视频中各视频处理图像与各其他短视频中各视频图像的相似度,筛选用户浏览短视频与各其他短视频中相似度符合的视频图像数量,同时分析用户浏览短视频中各关键词的权重比例系数,对比得到用户浏览短视频中各关键词与各其他短视频中对应关键词的权重比例系数差值,并分析用户浏览短视频与各其他短视频的拼接文本信息关联度,计算用户浏览短视频与各其他短视频的综合关联性系数,筛选综合关联性系数最高的其他短视频进行推荐,从而确保推荐短视频与用户浏览短视频之间具有关联性,使得用户能够及时获取浏览短视频的后续内容。

Description

一种基于数据分析的短视频浏览推荐方法、设备及计算机存 储介质
技术领域
本发明涉及短视频浏览推荐领域,涉及到一种基于数据分析的短视频浏览推荐方法、设备及计算机存储介质。
背景技术
随着互联网技术的快速发展,我们正处于短视频信息过载的时代。短视频平台面对过量的信息很难找到用户感兴趣的内容,因此如何有效为用户推荐感兴趣的短视频是亟待解决的问题。
目前,现有的短视频浏览推荐方法普遍存在一些缺陷:
1、现有的短视频浏览推荐方法基本根据用户所有的历史浏览行为进行短视频推荐,但依据历史浏览行为推荐短视频存在信息滞后性、延时性的问题,从而降低短视频平台中短视频推荐的精准性,使得短视频平台中短视频推荐水平受到影响;
2、现有的短视频浏览推荐方法无法根据用户正在浏览的短视频进行实时推荐,存在推荐的短视频与用户正在浏览的短视频之间缺乏关联性,导致用户不能及时获取浏览短视频的后续内容,从而无法满足用户的实际浏览需求,降低用户的短视频浏览体验感和兴趣感;
为了解决以上问题,现设计一种基于数据分析的短视频浏览推荐方法、设备及计算机存储介质。
发明内容
本发明的目的在于提供一种基于数据分析的短视频浏览推荐方法、设备及计算机存储介质,本发明通过将用户正在浏览的短视频划分成各视频图像,并对比得到用户浏览短视频中各视频处理图像与各其他短视频中各视频图像的相似度,筛选用户浏览短视频与各其他短视频中相似度符合的视频图像数量,同时获取用户浏览短视频中视频文本信息内各有效词,统计用户浏览短视频中各有效词的词频,计算用户浏览短视频中各关键词的权重比例系数,对比得到用户浏览短视频中各关键词与各其他短视频中对应关键词的权重比例系数差值,并获取用户浏览短视频与各其他短视频的拼接文本信息,分析用户浏览短视频与各其他短视频的拼接文本信息关联度,计算用户浏览短视频与各其他短视频的综合关联性系数,筛选综合关联性系数最高的其他短视频进行推荐,解决了背景技术中存在的问题。
本发明的目的可以通过以下技术方案实现:
第一方面,本发明提供一种基于数据分析的短视频浏览推荐方法,包括如下步骤:
S1、浏览短视频获取:通过获取短视频平台中用户正在浏览的短视频,并按照设定的视频帧划分方式划分成各视频图像;
S2、短视频图像处理:通过采用图像处理技术分别对用户浏览短视频中各视频图像进行处理,得到用户浏览短视频中各视频处理图像;
S3、短视频图像分析:通过将用户浏览短视频中各视频处理图像与短视频平台内各其他短视频中各视频图像进行对比,得到用户浏览短视频中各视频处理图像与各其他短视频中各视频图像的相似度,筛选用户浏览短视频与各其他短视频中相似度符合的视频图像数量;
S4、视频文本信息获取:通过获取用户浏览短视频中视频文本信息,并对用户浏览短视频中视频文本信息进行分词处理,得到用户浏览短视频中视频文本信息内各有效词,统计用户浏览短视频中各有效词的出现次数;
S5、有效词词频分析:分别计算用户浏览短视频中各有效词的词频,将用户浏览短视频中各有效词的词频与设定关键词的标准词频进行对比,筛选用户浏览短视频中各关键词的词频;
S6、关键词权重比例系数分析:通过提取短视频中关键词对应的权重补偿系数,计算用户浏览短视频中各关键词的权重比例系数,并获取短视频平台内各其他短视频中对应各关键词的权重比例系数,对比得到用户浏览短视频中各关键词与各其他短视频中对应关键词的权重比例系数差值;
S7、视频文本信息拼接:通过将用户浏览短视频中视频文本信息与短视频平台内各其他短视频中视频文本信息进行拼接,得到用户浏览短视频与各其他短视频的拼接文本信息;
S8、拼接文本语义识别:通过语义识别技术分别对用户浏览短视频与各其他短视频的拼接文本信息进行语义识别,分析用户浏览短视频与各其他短视频的拼接文本信息关联度;
S9、短视频综合关联性分析:通过提取视频图像、视频关键词、视频文本信息对应的关联性影响比例系数,计算用户浏览短视频与各其他短视频的综合关联性系数,并将用户浏览短视频与各其他短视频的综合关联性系数进行对比,筛选综合关联性系数最高的其他短视频进行推荐。
在第一方面的一种可能的设计中,所述步骤S3中包括以下步骤:
S31、通过提取短视频平台内各其他短视频中各视频图像,将用户浏览短视频中各视频处理图像与短视频平台内各其他短视频中各视频图像进行对比;
S32、获得用户浏览短视频中各视频处理图像与各其他短视频中各视频图像的相似度,若用户浏览短视频中某视频处理图像与某其他短视频中某视频图像的相似度大于设定的相似度阈值,则用户浏览短视频中该视频处理图像与该其他短视频中该视频图像的相似度符合;
S33、筛选统计用户浏览短视频中与各其他短视频中相似度符合的视频图像数量,构成用户浏览短视频与各其他短视频中相似度符合的视频图像数量集合XB(xb1,xb2,...,xbj,...,xbm),xbj表示为用户浏览短视频与第j个其他短视频中相似度符合的视频图像数量。
在第一方面的一种可能的设计中,所述步骤S4中包括构成用户浏览短视频中各有效词的出现次数集合K(k1,k2,...,kr,...,kv),kr表示为用户浏览短视频中第r个有效词的出现次数。
在第一方面的一种可能的设计中,所述用户浏览短视频中各有效词的词频计算公式为
Figure BDA0003149706020000041
fr表示为用户浏览短视频中第r个有效词的词频,kr表示为用户浏览短视频中第r个有效词的出现次数。
在第一方面的一种可能的设计中,所述步骤S5中包括统计用户浏览短视频中各关键词的词频,构成用户浏览短视频中各关键词的词频集合f′(f′1,f′2,...,f′u,...,f′l),l≤v,f′u表示为用户浏览短视频中第u个关键词的词频。
在第一方面的一种可能的设计中,所述步骤S6中包括如下步骤:
S61、计算用户浏览短视频中各关键词的权重比例系数
Figure BDA0003149706020000042
ξau表示为用户浏览短视频中第u个关键词的权重比例系数,η表示为短视频中关键词对应的权重补偿系数,v表示为用户浏览短视频中视频文本信息内有效词数量;
S62、并获取短视频平台内各其他短视频中对应各关键词的权重比例系数,构成短视频平台内各其他短视频中对应各关键词的权重比例系数集合ξ′jB(ξ′jb1,ξ′jb2,...,ξ′jbu,...,ξ′jbl),ξ′jbu表示为短视频平台内第j个其他短视频中对应第u个关键词的权重比例系数;
S63、将用户浏览短视频中各关键词的权重比例系数与各其他短视频中对应关键词的权重比例系数进行对比,得到用户浏览短视频中各关键词与各其他短视频中对应关键词的权重比例系数差值集合Δξ′jB(Δξ′jb1,Δξ′jb2,...,Δξ′jbu,...,Δξ′jbl),Δξ′jbu表示为用户浏览短视频中第u个关键词与第j个其他短视频中对应关键词的权重比例系数差值。
在第一方面的一种可能的设计中,所述步骤S8中包括构成用户浏览短视频与各其他短视频的拼接文本信息关联度集合θ(θ12,...,θj,...,θm),θj表示为用户浏览短视频与第j个其他短视频的拼接文本信息关联度。
在第一方面的一种可能的设计中,所述用户浏览短视频与各其他短视频的综合关联性系数计算公式为
Figure BDA0003149706020000051
ψj表示为用户浏览短视频与第j个短视频的综合关联性系数,α、β、δ分别表示为视频图像、视频关键词、视频文本信息对应的关联性影响比例系数,n表示为用户浏览短视频中划分的视频图像数量,e表示为自然数,等于2.718。
第二方面,本发明还提供一种设备,包括:处理器,以及与处理器连接的内存和网络接口;所述网络接口与服务器中的非易失性存储器连接;所述处理器在运行时通过所述网络接口从所述非易失性存储器中调取计算机程序,并通过所述内存运行所述计算机程序,以执行上述本发明所述的一种基于数据分析的短视频浏览推荐方法。
第三方面,本发明还提供一种计算机存储介质,所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述本发明所述的一种基于数据分析的短视频浏览推荐方法。
有益效果:
(1)本发明提供的一种基于数据分析的短视频浏览推荐方法、设备及计算机存储介质,通过将用户正在浏览的短视频划分成各视频图像,并进行图像处理,从而减少图像分析所需的时间以及任务量,同时对比得到用户浏览短视频中各视频处理图像与各其他短视频中各视频图像的相似度,筛选用户浏览短视频与各其他短视频中相似度符合的视频图像数量,为后期分析用户浏览短视频与各其他短视频的关联性奠定基础,并获取用户浏览短视频中视频文本信息内各有效词,统计用户浏览短视频中各有效词的词频,计算用户浏览短视频中各关键词的权重比例系数,对比得到用户浏览短视频中各关键词与各其他短视频中对应关键词的权重比例系数差值,从而有效避免信息滞后性、延时性的问题,为后期计算用户浏览短视频与各其他短视频的综合关联性系数提供可靠的参考数据,同时获取用户浏览短视频与各其他短视频的拼接文本信息,分析用户浏览短视频与各其他短视频的拼接文本信息关联度,从而增加后期短视频平台中短视频推荐的精准性,提高短视频平台中短视频推荐水平。
(2)本发明通过计算用户浏览短视频与各其他短视频的综合关联性系数,筛选综合关联性系数最高的其他短视频进行推荐,从而实现短视频平台根据用户正在浏览的短视频进行实时推荐功能,使得推荐的短视频与用户正在浏览的短视频之间具有关联性,确保用户能够及时获取浏览短视频的后续内容,进而满足用户的实际浏览需求,增加用户的短视频浏览体验感和兴趣感。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明的第一方面提供一种基于数据分析的短视频浏览推荐方法,包括如下步骤:
S1、浏览短视频获取:通过获取短视频平台中用户正在浏览的短视频,并按照设定的视频帧划分方式划分成各视频图像,同时按照短视频时间先后顺序依次对用户浏览短视频中各视频图像进行编号,构成用户浏览短视频中各视频图像的编号集合A(a1,a2,...,ai,...,an),ai表示为用户浏览短视频中第i个视频图像的编号。
S2、短视频图像处理:通过采用图像处理技术分别对用户浏览短视频中各视频图像进行处理,得到用户浏览短视频中各视频处理图像。
在本实施例中,所述步骤S2中采用的图像处理技术包括几何归一化处理和增强处理,通过对用户浏览短视频中各视频图像进行几何归一化处理,变换为固定标准形式的各视频图像,并强化变化后各视频图像的高频分量,得到用户浏览短视频中各视频处理图像。
具体地,本发明通过将用户正在浏览的短视频划分成各视频图像,并进行图像处理,从而减少图像分析所需的时间以及任务量。
S3、短视频图像分析:通过将用户浏览短视频中各视频处理图像与短视频平台内各其他短视频中各视频图像进行对比,得到用户浏览短视频中各视频处理图像与各其他短视频中各视频图像的相似度,筛选用户浏览短视频与各其他短视频中相似度符合的视频图像数量。
在本实施例中,所述步骤S3中包括以下步骤:
S31、通过提取短视频平台内各其他短视频中各视频图像,将用户浏览短视频中各视频处理图像与短视频平台内各其他短视频中各视频图像进行对比;
S32、获得用户浏览短视频中各视频处理图像与各其他短视频中各视频图像的相似度,若用户浏览短视频中某视频处理图像与某其他短视频中某视频图像的相似度大于设定的相似度阈值,则用户浏览短视频中该视频处理图像与该其他短视频中该视频图像的相似度符合;
S33、筛选统计用户浏览短视频中与各其他短视频中相似度符合的视频图像数量,构成用户浏览短视频与各其他短视频中相似度符合的视频图像数量集合XB(xb1,xb2,...,xbj,...,xbm),xbj表示为用户浏览短视频与第j个其他短视频中相似度符合的视频图像数量。
具体地,本发明通过对比得到用户浏览短视频中各视频处理图像与各其他短视频中各视频图像的相似度,筛选用户浏览短视频与各其他短视频中相似度符合的视频图像数量,为后期分析用户浏览短视频与各其他短视频的关联性奠定基础。
S4、视频文本信息获取:通过获取用户浏览短视频中视频文本信息,并对用户浏览短视频中视频文本信息进行分词处理,得到用户浏览短视频中视频文本信息内各有效词,统计用户浏览短视频中各有效词的出现次数。
在本实施例中,所述步骤S4中包括获取用户浏览短视频中视频语音,并通过语音识别技术对用户浏览短视频中视频语音进行识别,得到用户浏览短视频中视频文本信息。
在本实施例中,所述步骤S4中还包括构成用户浏览短视频中各有效词的出现次数集合K(k1,k2,...,kr,...,kv),kr表示为用户浏览短视频中第r个有效词的出现次数。
S5、有效词词频分析:分别计算用户浏览短视频中各有效词的词频,将用户浏览短视频中各有效词的词频与设定关键词的标准词频进行对比,筛选用户浏览短视频中各关键词的词频。
在本实施例中,所述用户浏览短视频中各有效词的词频计算公式为
Figure BDA0003149706020000091
fr表示为用户浏览短视频中第r个有效词的词频,kr表示为用户浏览短视频中第r个有效词的出现次数。
在本实施例中,所述步骤S5中还包括统计用户浏览短视频中各关键词的词频,构成用户浏览短视频中各关键词的词频集合f′(f′1,f′2,...,f′u,...,f′l),l≤v,f′u表示为用户浏览短视频中第u个关键词的词频。
S6、关键词权重比例系数分析:通过提取短视频中关键词对应的权重补偿系数,计算用户浏览短视频中各关键词的权重比例系数,并获取短视频平台内各其他短视频中对应各关键词的权重比例系数,对比得到用户浏览短视频中各关键词与各其他短视频中对应关键词的权重比例系数差值。
在本实施例中,所述步骤S6中包括如下步骤:
S61、计算用户浏览短视频中各关键词的权重比例系数
Figure BDA0003149706020000101
ξau表示为用户浏览短视频中第u个关键词的权重比例系数,η表示为短视频中关键词对应的权重补偿系数,v表示为用户浏览短视频中视频文本信息内有效词数量;
S62、并获取短视频平台内各其他短视频中对应各关键词的权重比例系数,构成短视频平台内各其他短视频中对应各关键词的权重比例系数集合ξ′jB(ξ′jb1,ξ′jb2,...,ξ′jbu,...,ξ′jbl),ξ′jbu表示为短视频平台内第j个其他短视频中对应第u个关键词的权重比例系数;
S63、将用户浏览短视频中各关键词的权重比例系数与各其他短视频中对应关键词的权重比例系数进行对比,得到用户浏览短视频中各关键词与各其他短视频中对应关键词的权重比例系数差值集合Δξ′jB(Δξ′jb1,Δξ′jb2,...,Δξ′jbu,...,Δξ′jbl),Δξ′jbu表示为用户浏览短视频中第u个关键词与第j个其他短视频中对应关键词的权重比例系数差值。
具体地,本发明通过获取用户浏览短视频中视频文本信息内各有效词,统计用户浏览短视频中各有效词的词频,计算用户浏览短视频中各关键词的权重比例系数,对比得到用户浏览短视频中各关键词与各其他短视频中对应关键词的权重比例系数差值,从而有效避免信息滞后性、延时性的问题,为后期计算用户浏览短视频与各其他短视频的综合关联性系数提供可靠的参考数据。
S7、视频文本信息拼接:通过将用户浏览短视频中视频文本信息与短视频平台内各其他短视频中视频文本信息进行拼接,得到用户浏览短视频与各其他短视频的拼接文本信息。
S8、拼接文本语义识别:通过语义识别技术分别对用户浏览短视频与各其他短视频的拼接文本信息进行语义识别,分析用户浏览短视频与各其他短视频的拼接文本信息关联度。
在本实施例中,所述步骤S8中包括构成用户浏览短视频与各其他短视频的拼接文本信息关联度集合θ(θ12,...,θj,...,θm),θj表示为用户浏览短视频与第j个其他短视频的拼接文本信息关联度。
具体地,本发明通过获取用户浏览短视频与各其他短视频的拼接文本信息,分析用户浏览短视频与各其他短视频的拼接文本信息关联度,从而增加后期短视频平台中短视频推荐的精准性,提高短视频平台中短视频推荐水平。
S9、短视频综合关联性分析:通过提取视频图像、视频关键词、视频文本信息对应的关联性影响比例系数,计算用户浏览短视频与各其他短视频的综合关联性系数,并将用户浏览短视频与各其他短视频的综合关联性系数进行对比,筛选综合关联性系数最高的其他短视频进行推荐。
在本实施例中,所述用户浏览短视频与各其他短视频的综合关联性系数计算公式为
Figure BDA0003149706020000111
ψj表示为用户浏览短视频与第j个短视频的综合关联性系数,α、β、δ分别表示为视频图像、视频关键词、视频文本信息对应的关联性影响比例系数,n表示为用户浏览短视频中划分的视频图像数量,e表示为自然数,等于2.718。
具体地,本发明通过计算用户浏览短视频与各其他短视频的综合关联性系数,筛选综合关联性系数最高的其他短视频进行推荐,从而实现短视频平台根据用户正在浏览的短视频进行实时推荐功能,使得推荐的短视频与用户正在浏览的短视频之间具有关联性,确保用户能够及时获取浏览短视频的后续内容,进而满足用户的实际浏览需求,增加用户的短视频浏览体验感和兴趣感。
第二方面,本发明还提供一种设备,包括:处理器,以及与处理器连接的内存和网络接口;所述网络接口与服务器中的非易失性存储器连接;所述处理器在运行时通过所述网络接口从所述非易失性存储器中调取计算机程序,并通过所述内存运行所述计算机程序,以执行上述本发明所述的一种基于数据分析的短视频浏览推荐方法。
第三方面,本发明还提供一种计算机存储介质,所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述本发明所述的一种基于数据分析的短视频浏览推荐方法。
以上内容仅仅是对本发明的构思所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的构思或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (10)

1.一种基于数据分析的短视频浏览推荐方法,其特征在于:包括如下步骤:
S1、浏览短视频获取:通过获取短视频平台中用户正在浏览的短视频,并按照设定的视频帧划分方式划分成各视频图像;
S2、短视频图像处理:通过采用图像处理技术分别对用户浏览短视频中各视频图像进行处理,得到用户浏览短视频中各视频处理图像;
S3、短视频图像分析:通过将用户浏览短视频中各视频处理图像与短视频平台内各其他短视频中各视频图像进行对比,得到用户浏览短视频中各视频处理图像与各其他短视频中各视频图像的相似度,筛选用户浏览短视频与各其他短视频中相似度符合的视频图像数量;
S4、视频文本信息获取:通过获取用户浏览短视频中视频文本信息,并对用户浏览短视频中视频文本信息进行分词处理,得到用户浏览短视频中视频文本信息内各有效词,统计用户浏览短视频中各有效词的出现次数;
S5、有效词词频分析:分别计算用户浏览短视频中各有效词的词频,将用户浏览短视频中各有效词的词频与设定关键词的标准词频进行对比,筛选用户浏览短视频中各关键词的词频;
S6、关键词权重比例系数分析:通过提取短视频中关键词对应的权重补偿系数,计算用户浏览短视频中各关键词的权重比例系数,并获取短视频平台内各其他短视频中对应各关键词的权重比例系数,对比得到用户浏览短视频中各关键词与各其他短视频中对应关键词的权重比例系数差值;
S7、视频文本信息拼接:通过将用户浏览短视频中视频文本信息与短视频平台内各其他短视频中视频文本信息进行拼接,得到用户浏览短视频与各其他短视频的拼接文本信息;
S8、拼接文本语义识别:通过语义识别技术分别对用户浏览短视频与各其他短视频的拼接文本信息进行语义识别,分析用户浏览短视频与各其他短视频的拼接文本信息关联度;
S9、短视频综合关联性分析:提取视频图像、视频关键词、视频文本信息对应的关联性影响比例系数,计算用户浏览短视频与各其他短视频的综合关联性系数,并将用户浏览短视频与各其他短视频的综合关联性系数进行对比,筛选综合关联性系数最高的其他短视频进行推荐。
2.根据权利要求1所述的一种基于数据分析的短视频浏览推荐方法,其特征在于:所述步骤S3中包括以下步骤:
S31、通过提取短视频平台内各其他短视频中各视频图像,将用户浏览短视频中各视频处理图像与短视频平台内各其他短视频中各视频图像进行对比;
S32、获得用户浏览短视频中各视频处理图像与各其他短视频中各视频图像的相似度,若用户浏览短视频中某视频处理图像与某其他短视频中某视频图像的相似度大于设定的相似度阈值,则用户浏览短视频中该视频处理图像与该其他短视频中该视频图像的相似度符合;
S33、筛选统计用户浏览短视频中与各其他短视频中相似度符合的视频图像数量,构成用户浏览短视频与各其他短视频中相似度符合的视频图像数量集合XB(xb1,xb2,...,xbj,...,xbm),xbj表示为用户浏览短视频与第j个其他短视频中相似度符合的视频图像数量。
3.根据权利要求1所述的一种基于数据分析的短视频浏览推荐方法,其特征在于:所述步骤S4中包括构成用户浏览短视频中各有效词的出现次数集合K(k1,k2,...,kr,...,kv),kr表示为用户浏览短视频中第r个有效词的出现次数。
4.根据权利要求1所述的一种基于数据分析的短视频浏览推荐方法,其特征在于:所述用户浏览短视频中各有效词的词频计算公式为
Figure FDA0003149706010000031
fr表示为用户浏览短视频中第r个有效词的词频,kr表示为用户浏览短视频中第r个有效词的出现次数。
5.根据权利要求1所述的一种基于数据分析的短视频浏览推荐方法,其特征在于:所述步骤S5中包括统计用户浏览短视频中各关键词的词频,构成用户浏览短视频中各关键词的词频集合f′(f′1,f′2,...,f′u,...,f′l),l≤v,f′u表示为用户浏览短视频中第u个关键词的词频。
6.根据权利要求1所述的一种基于数据分析的短视频浏览推荐方法,其特征在于:所述步骤S6中包括如下步骤:
S61、计算用户浏览短视频中各关键词的权重比例系数
Figure FDA0003149706010000032
ξau表示为用户浏览短视频中第u个关键词的权重比例系数,η表示为短视频中关键词对应的权重补偿系数,v表示为用户浏览短视频中视频文本信息内有效词数量;
S62、并获取短视频平台内各其他短视频中对应各关键词的权重比例系数,构成短视频平台内各其他短视频中对应各关键词的权重比例系数集合ξ′jB(ξ′jb1,ξ′jb2,...,ξ′jbu,...,ξ′jbl),ξj′bu表示为短视频平台内第j个其他短视频中对应第u个关键词的权重比例系数;
S63、将用户浏览短视频中各关键词的权重比例系数与各其他短视频中对应关键词的权重比例系数进行对比,得到用户浏览短视频中各关键词与各其他短视频中对应关键词的权重比例系数差值集合Δξ′jB(Δξ′jb1,Δξ′jb2,...,Δξ′jbu,...,Δξ′jbl),Δξ′jbu表示为用户浏览短视频中第u个关键词与第j个其他短视频中对应关键词的权重比例系数差值。
7.根据权利要求1所述的一种基于数据分析的短视频浏览推荐方法,其特征在于:所述步骤S8中包括构成用户浏览短视频与各其他短视频的拼接文本信息关联度集合θ(θ12,...,θj,...,θm),θj表示为用户浏览短视频与第j个其他短视频的拼接文本信息关联度。
8.根据权利要求1所述的一种基于数据分析的短视频浏览推荐方法,其特征在于:所述用户浏览短视频与各其他短视频的综合关联性系数计算公式为
Figure FDA0003149706010000041
ψj表示为用户浏览短视频与第j个短视频的综合关联性系数,α、β、δ分别表示为视频图像、视频关键词、视频文本信息对应的关联性影响比例系数,n表示为用户浏览短视频中划分的视频图像数量,e表示为自然数,等于2.718。
9.一种设备,其特征在于:包括:处理器,以及与处理器连接的内存和网络接口;所述网络接口与服务器中的非易失性存储器连接;所述处理器在运行时通过所述网络接口从所述非易失性存储器中调取计算机程序,并通过所述内存运行所述计算机程序,以执行上述权利要求1-8任一项所述的一种基于数据分析的短视频浏览推荐方法。
10.一种计算机存储介质,其特征在于:所述计算机存储介质烧录有计算机程序,所述计算机程序在服务器的内存中运行时实现上述权利要求1-8任一项所述的一种基于数据分析的短视频浏览推荐方法。
CN202110760969.9A 2021-07-06 2021-07-06 一种基于数据分析的短视频浏览推荐方法、设备及计算机存储介质 Withdrawn CN113449146A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110760969.9A CN113449146A (zh) 2021-07-06 2021-07-06 一种基于数据分析的短视频浏览推荐方法、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110760969.9A CN113449146A (zh) 2021-07-06 2021-07-06 一种基于数据分析的短视频浏览推荐方法、设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN113449146A true CN113449146A (zh) 2021-09-28

Family

ID=77815227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110760969.9A Withdrawn CN113449146A (zh) 2021-07-06 2021-07-06 一种基于数据分析的短视频浏览推荐方法、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN113449146A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114117089A (zh) * 2022-01-25 2022-03-01 广州拟实网络科技有限公司 一种基于图像数据处理分析的信息智能推送管理系统
CN114745593A (zh) * 2022-04-08 2022-07-12 南京福田文化传媒有限公司 一种基于视频大数据的视频播放推荐系统及方法
CN114866845A (zh) * 2022-07-05 2022-08-05 长沙美哒网络科技有限公司 一种基于短视频发布的信息检测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101634996A (zh) * 2009-08-13 2010-01-27 浙江大学 基于综合考量的个性化视频排序方法
US7966632B1 (en) * 2007-12-12 2011-06-21 Google Inc. Visual presentation of video recommendations
CN110688526A (zh) * 2019-11-07 2020-01-14 山东舜网传媒股份有限公司 基于关键帧识别和音频文本化的短视频推荐方法及系统
CN111754272A (zh) * 2020-07-02 2020-10-09 腾讯科技(北京)有限公司 广告推荐方法、推荐广告显示方法、装置及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7966632B1 (en) * 2007-12-12 2011-06-21 Google Inc. Visual presentation of video recommendations
CN101634996A (zh) * 2009-08-13 2010-01-27 浙江大学 基于综合考量的个性化视频排序方法
CN110688526A (zh) * 2019-11-07 2020-01-14 山东舜网传媒股份有限公司 基于关键帧识别和音频文本化的短视频推荐方法及系统
CN111754272A (zh) * 2020-07-02 2020-10-09 腾讯科技(北京)有限公司 广告推荐方法、推荐广告显示方法、装置及设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114117089A (zh) * 2022-01-25 2022-03-01 广州拟实网络科技有限公司 一种基于图像数据处理分析的信息智能推送管理系统
CN114117089B (zh) * 2022-01-25 2022-04-08 广州拟实网络科技有限公司 一种基于图像数据处理分析的信息智能推送管理系统
CN114745593A (zh) * 2022-04-08 2022-07-12 南京福田文化传媒有限公司 一种基于视频大数据的视频播放推荐系统及方法
CN114745593B (zh) * 2022-04-08 2023-12-29 广州星轩传媒有限公司 一种基于视频大数据的视频播放推荐系统及方法
CN114866845A (zh) * 2022-07-05 2022-08-05 长沙美哒网络科技有限公司 一种基于短视频发布的信息检测方法及系统

Similar Documents

Publication Publication Date Title
EP3866026A1 (en) Theme classification method and apparatus based on multimodality, and storage medium
CN113449146A (zh) 一种基于数据分析的短视频浏览推荐方法、设备及计算机存储介质
WO2020037930A1 (zh) 信息推荐方法、装置、计算机设备及存储介质
CN112434720B (zh) 一种基于图注意力网络的中文短文本分类方法
CN113204709A (zh) 基于多维数据深度比对分析的短视频搜索匹配推荐方法、系统及计算机存储介质
CN111563071A (zh) 数据清洗方法、装置、终端设备及计算机可读存储介质
CN104111925B (zh) 项目推荐方法和装置
CN111767713A (zh) 关键词的提取方法、装置、电子设备及存储介质
CN112966682B (zh) 一种基于语义分析的档案分类方法及系统
CN112199500B (zh) 针对评论的情感倾向识别方法、装置及电子设备
CN114780746A (zh) 基于知识图谱的文档检索方法及其相关设备
CN112507167A (zh) 一种识别视频合集的方法、装置、电子设备及存储介质
CN107885875B (zh) 检索词的同义变换方法、装置及服务器
CN110795573B (zh) 一种网页内容的地理位置预测方法及装置
CN114612839A (zh) 一种短视频分析处理方法、系统及计算机存储介质
CN112163090A (zh) 一种法律裁判文书的案由分类方法和终端
CN106294797A (zh) 一种视频基因的生成方法和装置
CN104718546A (zh) 文档分析装置以及程序
CN117829999A (zh) 基于机器学习的对研究报告进行评价的方法和装置
CN113656575A (zh) 训练数据的生成方法、装置、电子设备及可读介质
CN112163415A (zh) 针对反馈内容的用户意图识别方法、装置及电子设备
CN112818221B (zh) 实体的热度确定方法、装置、电子设备及存储介质
CN115630173A (zh) 一种基于兴趣度分析的用户数据管理方法
CN114490946A (zh) 基于Xlnet模型的类案检索方法、系统及设备
CN111191095A (zh) 网页数据获取方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210928

WW01 Invention patent application withdrawn after publication