CN114494982A - 一种基于人工智能的直播视频大数据精准推荐方法及系统 - Google Patents
一种基于人工智能的直播视频大数据精准推荐方法及系统 Download PDFInfo
- Publication number
- CN114494982A CN114494982A CN202210362995.0A CN202210362995A CN114494982A CN 114494982 A CN114494982 A CN 114494982A CN 202210362995 A CN202210362995 A CN 202210362995A CN 114494982 A CN114494982 A CN 114494982A
- Authority
- CN
- China
- Prior art keywords
- key frame
- live video
- core
- frame image
- identified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于人工智能的直播视频大数据精准推荐方法及系统,涉及数据识别分析技术领域。该方法包括:选取并对基准直播视频进行识别;挑选核心基准关键帧图像;识别得到核心基准高频词汇;对待识别直播视频进行识别;挑选并对待识别核心关键帧图像进行识别,得到目标高频词汇;若至少存在一个核心基准高频词汇与目标高频词汇相同,则进行显著性检测,基于正负样本采用谱聚类方法进行聚类,确定待识别直播视频是否为目标推荐直播视频。本发明利用关键帧检测、代表性关键帧图像选取方法对直播视频中核心帧图像进行有效选取,并将基于OCR的高频词汇匹配方法和聚类方法进行结合,有效精准判别,为用户精准推荐相关视频数据。
Description
技术领域
本发明涉及数据识别分析技术领域,具体而言,涉及一种基于人工智能的直播视频大数据精准推荐方法及系统。
背景技术
随着数字媒体产业的高速发展,直播视频已经越来越广泛地被大众所认可。民众可以从直播视频中挑选喜爱的商品、学习自己喜爱的课程、领略世界各地的人文景观等,极大地丰富和便利了民众的业余生活。同时,随着直播视频大数据数量爆炸式增长,如何在海量直播视频数据的情况下针对民众需求给民众精准推荐有价值的直播视频成为了新的问题。
传统的视频检索方法虽然能够检索及推荐部分有价值的直播视频,但传统的方法的检索推荐精准度不高,且无法根据民众的需求进行有针对性的推荐。人工智能领域作为近几年的热门研究领域,其中的多项经典技术可以有助于实现直播大数据的精准推荐。如何充分利用人工智能领域中的技术,实现直播视频大数据的精准推荐成为一个亟需解决的问题。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种基于人工智能的直播视频大数据精准推荐方法及系统,利用关键帧检测技术、代表性关键帧图像选取方法对直播视频中核心帧图像进行有效选取,并在此基础上,将基于OCR的高频词汇匹配方法和K-means聚类方法进行结合,对待识别直播视频进行有效精准判别,进而为用户精准推荐相关视频数据。
本发明的实施例是这样实现的:
第一方面,本发明实施例提供一种基于人工智能的直播视频大数据精准推荐方法,包括以下步骤:
获取并统计目标用户的多段历史观看视频数据,生成并根据统计结果选取一段历史观看视频数据作为基准直播视频;
采用关键帧检测方法对基准直播视频进行关键帧图像识别检测,以得到基准关键帧图像;
利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像;
采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,得到并统计核心基准高频词汇;
获取并采用关键帧检测方法对网络直播平台中的任意一段待识别直播视频进行识别检测,以得到待识别关键帧图像;
利用代表性关键帧图像选取方法从待识别关键帧图像中挑选得到待识别核心关键帧图像;
采用OCR识别方法对待识别核心关键帧图像中的词汇进行识别,得到并统计目标高频词汇;
分别判断各个核心基准高频词汇与各个目标高频词汇是否相同,若至少存在一个核心基准高频词汇与目标高频词汇相同,则对待识别核心关键帧图像进行显著性检测,以得到显著核心关键帧图像;反之,则将该段待识别直播视频标记为非推荐直播视频;
将核心基准关键帧图像作为正样本,选取网络直播平台中目标用户未观看的直播视频作为负样本;
基于正样本和负样本采用谱聚类方法对显著核心关键帧图像进行聚类处理,得到聚类结果;
根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频,将目标推荐直播视频推送给对应的目标用户。
为了解决现有技术中针对直播视频数据检索识别推荐精准度不高,无法根据民众的需求进行有针对性的推荐的技术问题,本发明利用关键帧检测技术、代表性关键帧图像选取方法将直播视频中核心帧图像进行有效选取,保证后续数据处理的精准高效性,避免了对直播视频中所有帧图像都进行相关计算,极大地减少了计算资源消耗;并在此基础上,利用基于OCR识别的高频词汇匹配方法,基于词汇匹配对待识别直播视频进行初步判别;大大提高了判别效率。并基于K-means聚类方法,对待识别直播视频进行最终判别。通过多重方法进行判别,有效地提升了目标视频判别的精度,大大提高了后续视频推荐的精准性,若初步判别结果不理想则不进行后续判别,直接减少了计算资源的消耗。
基于第一方面,在本发明的一些实施例中,上述利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像的方法包括以下步骤:
对基准关键帧图像进行深度自编码;
计算并根据各个基准关键帧图像自编码后的欧式距离确定核心基准关键帧图像。
基于第一方面,在本发明的一些实施例中,上述采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,得到并统计核心基准高频词汇的方法包括以下步骤:
采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,以得到多个识别词汇;
根据预置的关键词汇数据集对多个识别词汇进行筛选,以得到关键词汇;
统计并根据各个关键词汇出现的次数确定核心基准高频词汇。
基于第一方面,在本发明的一些实施例中,上述统计并根据各个关键词汇出现的次数确定核心基准高频词汇的方法包括以下步骤:
统计各个关键词汇出现的次数,当关键词汇出现的次数超过预置的次数阈值时,将对应的关键词汇确定为核心基准高频词汇。
基于第一方面,在本发明的一些实施例中,上述对待识别核心关键帧图像进行显著性检测的方法包括以下步骤:
采用ITTI模型、GBVS模型、SF模型、ST模型和FT模型其中一种或多种模型对待识别核心关键帧图像进行显著性检测。
基于第一方面,在本发明的一些实施例中,上述根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频的方法包括以下步骤:
若聚类结果为与正样本聚为一类,则将待识别直播视频标记为目标推荐直播视频;
若聚类结果为与负样本聚为一类,则将待识别直播视频标记为非推荐直播视频。
第二方面,本发明实施例提供一种基于人工智能的直播视频大数据精准推荐系统,包括基准视频选取模块、关键帧识别模块、核心基准选取模块、第一识别模块、待识别图像模块、待识别挑选模块、第二识别模块、词汇对比模块、样本选取模块、聚类处理模块以及识别推荐模块,其中:
基准视频选取模块,用于获取并统计目标用户的多段历史观看视频数据,生成并根据统计结果选取一段历史观看视频数据作为基准直播视频;
关键帧识别模块,用于采用关键帧检测方法对基准直播视频进行关键帧图像识别检测,以得到基准关键帧图像;
核心基准选取模块,用于利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像;
第一识别模块,用于采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,得到并统计核心基准高频词汇;
待识别图像模块,用于获取并采用关键帧检测方法对网络直播平台中的任意一段待识别直播视频进行识别检测,以得到待识别关键帧图像;
待识别挑选模块,用于利用代表性关键帧图像选取方法从待识别关键帧图像中挑选得到待识别核心关键帧图像;
第二识别模块,用于采用OCR识别方法对待识别核心关键帧图像中的词汇进行识别,得到并统计目标高频词汇;
词汇对比模块,用于分别判断各个核心基准高频词汇与各个目标高频词汇是否相同,若至少存在一个核心基准高频词汇与目标高频词汇相同,则对待识别核心关键帧图像进行显著性检测,以得到显著核心关键帧图像;反之,则将该段待识别直播视频标记为非推荐直播视频;
样本选取模块,用于将核心基准关键帧图像作为正样本,选取网络直播平台中目标用户未观看的直播视频作为负样本;
聚类处理模块,用于基于正样本和负样本采用谱聚类方法对显著核心关键帧图像进行聚类处理,得到聚类结果;
识别推荐模块,用于根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频,将目标推荐直播视频推送给对应的目标用户。
为了解决现有技术中针对直播视频数据检索识别推荐精准度不高,无法根据民众的需求进行有针对性的推荐的技术问题,本系统通过基准视频选取模块、关键帧识别模块、核心基准选取模块、第一识别模块、待识别图像模块、待识别挑选模块、第二识别模块、词汇对比模块、样本选取模块、聚类处理模块以及识别推荐模块等多个模块的相互配合,利用关键帧检测技术、代表性关键帧图像选取方法将直播视频中核心帧图像进行有效选取,保证后续数据处理的精准高效性,避免了对直播视频中所有帧图像都进行相关计算,极大地减少了计算资源消耗;并在此基础上,利用基于OCR识别的高频词汇匹配方法,基于词汇匹配对待识别直播视频进行初步判别;大大提高了判别效率。并基于K-means聚类方法,对待识别直播视频进行最终判别。通过多重方法进行判别,有效地提升了目标视频判别的精度,大大提高了后续视频推荐的精准性,若初步判别结果不理想则不进行后续判别,直接减少了计算资源的消耗。
基于第二方面,在本发明的一些实施例中,上述核心基准选取模块包括自编码子模块和核心确定子模块,其中:
自编码子模块,用于对基准关键帧图像进行深度自编码;
核心确定子模块,用于计算并根据各个基准关键帧图像自编码后的欧式距离确定核心基准关键帧图像。
第三方面,本申请实施例提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器。当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
本发明实施例至少具有如下优点或有益效果:
本发明实施例提供一种基于人工智能的直播视频大数据精准推荐方法及系统,解决了现有技术中针对直播视频数据检索识别推荐精准度不高,无法根据民众的需求进行有针对性的推荐的技术问题,本发明利用关键帧检测技术、代表性关键帧图像选取方法将直播视频中核心帧图像进行有效选取,保证后续数据处理的精准高效性,避免了对直播视频中所有帧图像都进行相关计算,极大地减少了计算资源消耗;并在此基础上,利用基于OCR识别的高频词汇匹配方法,基于词汇匹配对待识别直播视频进行初步判别;大大提高了判别效率。并基于K-means聚类方法,对待识别直播视频进行最终判别。通过多重方法进行判别,有效地提升了目标视频判别的精度,大大提高了后续视频推荐的精准性,若初步判别结果不理想则不进行后续判别,直接减少了计算资源的消耗。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例一种基于人工智能的直播视频大数据精准推荐方法的流程图;
图2为本发明实施例一种基于人工智能的直播视频大数据精准推荐方法中选取核心基准关键帧图像的流程图;
图3为本发明实施例一种基于人工智能的直播视频大数据精准推荐系统的原理框图;
图4为本发明实施例一种基于人工智能的直播视频大数据精准推荐方法的具体原理框图;
图5为本发明实施例提供的一种电子设备的结构框图。
附图标记说明:100、基准视频选取模块;200、关键帧识别模块;300、核心基准选取模块;310、自编码子模块;320、核心确定子模块;400、第一识别模块;500、待识别图像模块;600、待识别挑选模块;700、第二识别模块;800、词汇对比模块;900、样本选取模块;1000、聚类处理模块;1100、识别推荐模块;101、存储器;102、处理器;103、通信接口。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括上述要素的过程、方法、物品或者设备中还存在另外的相同要素。
实施例:
如图1-图2 所示,第一方面,本发明实施例提供一种基于人工智能的直播视频大数据精准推荐方法,包括以下步骤:
S1、获取并统计目标用户的多段历史观看视频数据,生成并根据统计结果选取一段历史观看视频数据作为基准直播视频;对于任意一个直播视频观看者,选取他(她)观看次数最多的一段直播视频,作为基准直播视频。
S2、采用关键帧检测方法对基准直播视频进行关键帧图像识别检测,以得到基准关键帧图像;上述关键帧检测方法可以采用基于CNN、RNN等神经网络模型的关键帧区域检测方法,上述方法为现有常规检测方法,在此不做赘述。
S3、利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像;
进一步地,包括:
S31、对基准关键帧图像进行深度自编码;
S32、计算并根据各个基准关键帧图像自编码后的欧式距离确定核心基准关键帧图像。
在本发明的一些实施例中,对基准关键帧图像进行深度自编码;计算不同基准关键帧图像自编码后的欧式距离;当若干个基准关键帧图像欧式距离很近,预先设定一个距离阈值,当小于该距离阈值时,则表明其相近,认定其高度相似,仅保留其中一个即可;经过多次欧式距离的计算,筛选出一批差异性较大的基准关键帧图像,作为核心基准关键帧图像。还可以利用互近邻一致性调整图像间的相似度,然后利用AP聚类方法将图像集分为若干簇,对这些图像簇进行排名选出质量较高的簇,并从中选取中心图像作为代表性图像。
S4、采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,得到并统计核心基准高频词汇;
进一步地,采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,以得到多个识别词汇;根据预置的关键词汇数据集对多个识别词汇进行筛选,以得到关键词汇;统计并根据各个关键词汇出现的次数确定核心基准高频词汇。
进一步地,统计各个关键词汇出现的次数,当关键词汇出现的次数超过预置的次数阈值时,将对应的关键词汇确定为核心基准高频词汇。
在本发明的一些实施例中,通过OCR方法识别出核心基准关键帧图像中的关键词汇,并根据关键词汇出现的次数找出核心基准高频词汇,例如,旅游、购物等词汇出现频率较高,就将其认定为核心基准高频词汇。可以采用常用的OCR识别方法进行关键词汇识别,例如,采用CNN+RNN+CTC的模式进行识别。
S5、获取并采用关键帧检测方法对网络直播平台中的任意一段待识别直播视频进行识别检测,以得到待识别关键帧图像;对于新的一段特定直播视频,通过关键帧检测技术检测出该段视频中的关键帧图像。
S6、利用代表性关键帧图像选取方法从待识别关键帧图像中挑选得到待识别核心关键帧图像;该待识别核心关键帧图像的选取方法和上述步骤S3中的方法一致。
S7、采用OCR识别方法对待识别核心关键帧图像中的词汇进行识别,得到并统计目标高频词汇;
S8、分别判断各个核心基准高频词汇与各个目标高频词汇是否相同,若至少存在一个核心基准高频词汇与目标高频词汇相同,则对待识别核心关键帧图像进行显著性检测,以得到显著核心关键帧图像;反之,则将该段待识别直播视频标记为非推荐直播视频;
进一步地,采用ITTI模型、GBVS模型、SF模型、ST模型和FT模型其中一种或多种模型对待识别核心关键帧图像进行显著性检测。
在本发明的一些实施例中,通过OCR方法识别出核心关键帧图像中的关键词汇,并根据关键词汇出现的次数找出目标高频词汇;如果该目标高频词汇和核心基准高频词汇出现了重合,至少存在有一个词汇重合,则对于核心关键帧图像进行显著性检测,仅保留显著性区域最大的核心关键帧图像作为唯一核心关键帧图像;否则,直接将该特定直播视频认定为非目标视频,不推荐给该观看者。
S9、将核心基准关键帧图像作为正样本,选取网络直播平台中目标用户未观看的直播视频作为负样本;
S10、基于正样本和负样本采用谱聚类方法对显著核心关键帧图像进行聚类处理,得到聚类结果;
S11、根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频,将目标推荐直播视频推送给对应的目标用户。
进一步地,若聚类结果为与正样本聚为一类,则将待识别直播视频标记为目标推荐直播视频;若聚类结果为与负样本聚为一类,则将待识别直播视频标记为非推荐直播视频。
在本发明的一些实施例中,将核心基准关键帧图像作为正样本,挑选出一些该目标观众未观看视频中的关键帧图像作为负样本;然后基于正负样本,利用K-means聚类技术对唯一核心关键帧进行聚类判别。在聚类过程中,如果显著核心关键帧图像和正样本聚为一类,直接将待识别直播视频认定为目标推荐直播视频,推荐给该观众观看;在聚类过程中,如果显著核心关键帧图像和负样本聚为一类,直接将待检测视频认定为非目标视频,不推荐给该观众观看。对于海量的直播视频大数据中的每一段待检测视频都进行判别,最终将所有的目标视频都推送给观看者。
为了解决现有技术中针对直播视频数据检索识别推荐精准度不高,无法根据民众的需求进行有针对性的推荐的技术问题,本发明利用关键帧检测技术、代表性关键帧图像选取方法将直播视频中核心帧图像进行有效选取,保证后续数据处理的精准高效性,避免了对直播视频中所有帧图像都进行相关计算,极大地减少了计算资源消耗;并在此基础上,利用基于OCR识别的高频词汇匹配方法,基于词汇匹配对待识别直播视频进行初步判别;大大提高了判别效率。并基于K-means聚类方法,对待识别直播视频进行最终判别。通过多重方法进行判别,有效地提升了目标视频判别的精度,大大提高了后续视频推荐的精准性,若初步判别结果不理想则不进行后续判别,直接减少了计算资源的消耗。
如图3-图4所示,第二方面,本发明实施例提供一种基于人工智能的直播视频大数据精准推荐系统,包括基准视频选取模块100、关键帧识别模块200、核心基准选取模块300、第一识别模块400、待识别图像模块500、待识别挑选模块600、第二识别模块700、词汇对比模块800、样本选取模块900、聚类处理模块1000以及识别推荐模块1100,其中:
基准视频选取模块100,用于获取并统计目标用户的多段历史观看视频数据,生成并根据统计结果选取一段历史观看视频数据作为基准直播视频;
关键帧识别模块200,用于采用关键帧检测方法对基准直播视频进行关键帧图像识别检测,以得到基准关键帧图像;
核心基准选取模块300,用于利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像;
进一步地,上述核心基准选取模块300包括自编码子模块310和核心确定子模块320,其中:
自编码子模块310,用于对基准关键帧图像进行深度自编码;核心确定子模块320,用于计算并根据各个基准关键帧图像自编码后的欧式距离确定核心基准关键帧图像。
第一识别模块400,用于采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,得到并统计核心基准高频词汇;
待识别图像模块500,用于获取并采用关键帧检测方法对网络直播平台中的任意一段待识别直播视频进行识别检测,以得到待识别关键帧图像;
待识别挑选模块600,用于利用代表性关键帧图像选取方法从待识别关键帧图像中挑选得到待识别核心关键帧图像;
第二识别模块700,用于采用OCR识别方法对待识别核心关键帧图像中的词汇进行识别,得到并统计目标高频词汇;
词汇对比模块800,用于分别判断各个核心基准高频词汇与各个目标高频词汇是否相同,若至少存在一个核心基准高频词汇与目标高频词汇相同,则对待识别核心关键帧图像进行显著性检测,以得到显著核心关键帧图像;反之,则将该段待识别直播视频标记为非推荐直播视频;
样本选取模块900,用于将核心基准关键帧图像作为正样本,选取网络直播平台中目标用户未观看的直播视频作为负样本;
聚类处理模块1000,用于基于正样本和负样本采用谱聚类方法对显著核心关键帧图像进行聚类处理,得到聚类结果;
识别推荐模块1100,用于根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频,将目标推荐直播视频推送给对应的目标用户。
为了解决现有技术中针对直播视频数据检索识别推荐精准度不高,无法根据民众的需求进行有针对性的推荐的技术问题,本系统通过基准视频选取模块100、关键帧识别模块200、核心基准选取模块300、第一识别模块400、待识别图像模块500、待识别挑选模块600、第二识别模块700、词汇对比模块800、样本选取模块900、聚类处理模块1000以及识别推荐模块1100等多个模块的相互配合,利用关键帧检测技术、代表性关键帧图像选取方法将直播视频中核心帧图像进行有效选取,保证后续数据处理的精准高效性,避免了对直播视频中所有帧图像都进行相关计算,极大地减少了计算资源消耗;并在此基础上,利用基于OCR识别的高频词汇匹配方法,基于词汇匹配对待识别直播视频进行初步判别;大大提高了判别效率。并基于K-means聚类方法,对待识别直播视频进行最终判别。通过多重方法进行判别,有效地提升了目标视频判别的精度,大大提高了后续视频推荐的精准性,若初步判别结果不理想则不进行后续判别,直接减少了计算资源的消耗。
如图5所示,第三方面,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。
还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请所提供的实施例中,应该理解到,所揭露的方法及系统和方法,也可以通过其它的方式实现。以上所描述的方法及系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (10)
1.一种基于人工智能的直播视频大数据精准推荐方法,其特征在于,包括以下步骤:
获取并统计目标用户的多段历史观看视频数据,生成并根据统计结果选取一段历史观看视频数据作为基准直播视频;
采用关键帧检测方法对基准直播视频进行关键帧图像识别检测,以得到基准关键帧图像;
利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像;
采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,得到并统计核心基准高频词汇;
获取并采用关键帧检测方法对网络直播平台中的任意一段待识别直播视频进行识别检测,以得到待识别关键帧图像;
利用代表性关键帧图像选取方法从待识别关键帧图像中挑选得到待识别核心关键帧图像;
采用OCR识别方法对待识别核心关键帧图像中的词汇进行识别,得到并统计目标高频词汇;
分别判断各个核心基准高频词汇与各个目标高频词汇是否相同,若至少存在一个核心基准高频词汇与目标高频词汇相同,则对待识别核心关键帧图像进行显著性检测,以得到显著核心关键帧图像;反之,则将该段待识别直播视频标记为非推荐直播视频;
将核心基准关键帧图像作为正样本,选取网络直播平台中目标用户未观看的直播视频作为负样本;
基于正样本和负样本采用谱聚类方法对显著核心关键帧图像进行聚类处理,得到聚类结果;
根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频,将目标推荐直播视频推送给对应的目标用户。
2.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法,其特征在于,所述利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像的方法包括以下步骤:
对基准关键帧图像进行深度自编码;
计算并根据各个基准关键帧图像自编码后的欧式距离确定核心基准关键帧图像。
3.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法,其特征在于,所述采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,得到并统计核心基准高频词汇的方法包括以下步骤:
采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,以得到多个识别词汇;
根据预置的关键词汇数据集对多个识别词汇进行筛选,以得到关键词汇;
统计并根据各个关键词汇出现的次数确定核心基准高频词汇。
4.根据权利要求3所述的一种基于人工智能的直播视频大数据精准推荐方法,其特征在于,所述统计并根据各个关键词汇出现的次数确定核心基准高频词汇的方法包括以下步骤:
统计各个关键词汇出现的次数,当关键词汇出现的次数超过预置的次数阈值时,将对应的关键词汇确定为核心基准高频词汇。
5.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法,其特征在于,所述对待识别核心关键帧图像进行显著性检测的方法包括以下步骤:
采用ITTI模型、GBVS模型、SF模型、ST模型和FT模型其中一种或多种模型对待识别核心关键帧图像进行显著性检测。
6.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法,其特征在于,所述根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频的方法包括以下步骤:
若聚类结果为与正样本聚为一类,则将待识别直播视频标记为目标推荐直播视频;
若聚类结果为与负样本聚为一类,则将待识别直播视频标记为非推荐直播视频。
7.一种基于人工智能的直播视频大数据精准推荐系统,其特征在于,包括基准视频选取模块、关键帧识别模块、核心基准选取模块、第一识别模块、待识别图像模块、待识别挑选模块、第二识别模块、词汇对比模块、样本选取模块、聚类处理模块以及识别推荐模块,其中:
基准视频选取模块,用于获取并统计目标用户的多段历史观看视频数据,生成并根据统计结果选取一段历史观看视频数据作为基准直播视频;
关键帧识别模块,用于采用关键帧检测方法对基准直播视频进行关键帧图像识别检测,以得到基准关键帧图像;
核心基准选取模块,用于利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像;
第一识别模块,用于采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,得到并统计核心基准高频词汇;
待识别图像模块,用于获取并采用关键帧检测方法对网络直播平台中的任意一段待识别直播视频进行识别检测,以得到待识别关键帧图像;
待识别挑选模块,用于利用代表性关键帧图像选取方法从待识别关键帧图像中挑选得到待识别核心关键帧图像;
第二识别模块,用于采用OCR识别方法对待识别核心关键帧图像中的词汇进行识别,得到并统计目标高频词汇;
词汇对比模块,用于分别判断各个核心基准高频词汇与各个目标高频词汇是否相同,若至少存在一个核心基准高频词汇与目标高频词汇相同,则对待识别核心关键帧图像进行显著性检测,以得到显著核心关键帧图像;反之,则将该段待识别直播视频标记为非推荐直播视频;
样本选取模块,用于将核心基准关键帧图像作为正样本,选取网络直播平台中目标用户未观看的直播视频作为负样本;
聚类处理模块,用于基于正样本和负样本采用谱聚类方法对显著核心关键帧图像进行聚类处理,得到聚类结果;
识别推荐模块,用于根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频,将目标推荐直播视频推送给对应的目标用户。
8.根据权利要求7所述的一种基于人工智能的直播视频大数据精准推荐系统,其特征在于,所述核心基准选取模块包括自编码子模块和核心确定子模块,其中:
自编码子模块,用于对基准关键帧图像进行深度自编码;
核心确定子模块,用于计算并根据各个基准关键帧图像自编码后的欧式距离确定核心基准关键帧图像。
9.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-6中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210362995.0A CN114494982B (zh) | 2022-04-08 | 2022-04-08 | 一种基于人工智能的直播视频大数据精准推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210362995.0A CN114494982B (zh) | 2022-04-08 | 2022-04-08 | 一种基于人工智能的直播视频大数据精准推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114494982A true CN114494982A (zh) | 2022-05-13 |
CN114494982B CN114494982B (zh) | 2022-12-20 |
Family
ID=81489205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210362995.0A Active CN114494982B (zh) | 2022-04-08 | 2022-04-08 | 一种基于人工智能的直播视频大数据精准推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114494982B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114925239A (zh) * | 2022-07-20 | 2022-08-19 | 北京师范大学 | 基于人工智能的智慧教育目标视频大数据检索方法及系统 |
CN115115822A (zh) * | 2022-06-30 | 2022-09-27 | 小米汽车科技有限公司 | 车端图像处理方法、装置、车辆、存储介质及芯片 |
CN116543373A (zh) * | 2023-04-14 | 2023-08-04 | 北京嘉沐安科技有限公司 | 基于区块链的直播视频大数据智能分析和优化方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104618803A (zh) * | 2014-02-26 | 2015-05-13 | 腾讯科技(深圳)有限公司 | 信息推送方法、装置、终端及服务器 |
US20190362154A1 (en) * | 2016-09-08 | 2019-11-28 | Aiq Pte. Ltd | Object Detection From Visual Search Queries |
CN110688526A (zh) * | 2019-11-07 | 2020-01-14 | 山东舜网传媒股份有限公司 | 基于关键帧识别和音频文本化的短视频推荐方法及系统 |
CN110837579A (zh) * | 2019-11-05 | 2020-02-25 | 腾讯科技(深圳)有限公司 | 视频分类方法、装置、计算机以及可读存储介质 |
CN113010701A (zh) * | 2021-02-25 | 2021-06-22 | 北京四达时代软件技术股份有限公司 | 以视频为中心的融媒体内容推荐方法及装置 |
CN114297434A (zh) * | 2021-12-30 | 2022-04-08 | 镇江多游网络科技有限公司 | 基于gpu集群的短视频信息流智能推荐方法 |
-
2022
- 2022-04-08 CN CN202210362995.0A patent/CN114494982B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104618803A (zh) * | 2014-02-26 | 2015-05-13 | 腾讯科技(深圳)有限公司 | 信息推送方法、装置、终端及服务器 |
US20190362154A1 (en) * | 2016-09-08 | 2019-11-28 | Aiq Pte. Ltd | Object Detection From Visual Search Queries |
CN110837579A (zh) * | 2019-11-05 | 2020-02-25 | 腾讯科技(深圳)有限公司 | 视频分类方法、装置、计算机以及可读存储介质 |
CN110688526A (zh) * | 2019-11-07 | 2020-01-14 | 山东舜网传媒股份有限公司 | 基于关键帧识别和音频文本化的短视频推荐方法及系统 |
CN113010701A (zh) * | 2021-02-25 | 2021-06-22 | 北京四达时代软件技术股份有限公司 | 以视频为中心的融媒体内容推荐方法及装置 |
CN114297434A (zh) * | 2021-12-30 | 2022-04-08 | 镇江多游网络科技有限公司 | 基于gpu集群的短视频信息流智能推荐方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115115822A (zh) * | 2022-06-30 | 2022-09-27 | 小米汽车科技有限公司 | 车端图像处理方法、装置、车辆、存储介质及芯片 |
CN115115822B (zh) * | 2022-06-30 | 2023-10-31 | 小米汽车科技有限公司 | 车端图像处理方法、装置、车辆、存储介质及芯片 |
CN114925239A (zh) * | 2022-07-20 | 2022-08-19 | 北京师范大学 | 基于人工智能的智慧教育目标视频大数据检索方法及系统 |
CN116543373A (zh) * | 2023-04-14 | 2023-08-04 | 北京嘉沐安科技有限公司 | 基于区块链的直播视频大数据智能分析和优化方法及系统 |
CN116543373B (zh) * | 2023-04-14 | 2024-05-28 | 北京嘉沐安科技有限公司 | 基于区块链的直播视频大数据智能分析和优化方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114494982B (zh) | 2022-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114494982B (zh) | 一种基于人工智能的直播视频大数据精准推荐方法及系统 | |
CN105320705B (zh) | 相似车辆的检索方法及装置 | |
CN106126572B (zh) | 基于区域验证的图像检索方法 | |
CN107169106B (zh) | 视频检索方法、装置、存储介质及处理器 | |
CN104376105B (zh) | 一种社会媒体中图像低层视觉特征与文本描述信息的特征融合系统及方法 | |
Li et al. | One step beyond histograms: Image representation using Markov stationary features | |
CN112364204B (zh) | 视频搜索方法、装置、计算机设备及存储介质 | |
CN102073864A (zh) | 四层结构的体育视频中足球项目检测系统及实现 | |
CN114581207B (zh) | 一种面向电商平台的商品图像大数据精准推送方法及系统 | |
Zhang et al. | Automatic discrimination of text and non-text natural images | |
CN115100450B (zh) | 基于人工智能的智慧交通品牌汽车大数据检测方法及系统 | |
CN112417970A (zh) | 目标对象识别方法、装置和电子系统 | |
CN105760875B (zh) | 基于随机森林算法的判别二进制图像特征相似实现方法 | |
CN117271713A (zh) | 关联对象识别方法、装置、电子设备及存储介质 | |
Rushing et al. | Image segmentation using association rule features | |
CN114925239B (zh) | 基于人工智能的智慧教育目标视频大数据检索方法及系统 | |
CN114443898B (zh) | 一种面向互联网智慧教育的视频大数据推送方法 | |
Zhang et al. | Automatic image region annotation through segmentation based visual semantic analysis and discriminative classification | |
Imran et al. | Event recognition from photo collections via pagerank | |
Cheng et al. | CNN retrieval based unsupervised metric learning for near-duplicated video retrieval | |
Trojahn et al. | A new multimodal deep-learning model to video scene segmentation | |
CN112069331A (zh) | 一种数据处理、检索方法、装置、设备及存储介质 | |
Zhang et al. | Automatic preview frame selection for online videos | |
Xiang | Object Detection in Finnish Movies | |
Chen et al. | A supervised learning approach to flashlight detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20221116 Address after: 100000 zone a, Room 502, 5 / F, tower a, phase III, Dongyi International Media Industrial Park, No. 8, Gaojing Wenhua Park Road, Chaoyang District, Beijing Applicant after: Huaxia Wenguang Media Group Co.,Ltd. Address before: No. a2584, second floor, College Park, Dongsheng Science Park, Zhongguancun, No. 18 Xueqing Road, Haidian District, Beijing 100089 Applicant before: Beijing jiamuan Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |