CN116471449B - 基于大数据分析的直播行为检测方法 - Google Patents

基于大数据分析的直播行为检测方法 Download PDF

Info

Publication number
CN116471449B
CN116471449B CN202310734421.6A CN202310734421A CN116471449B CN 116471449 B CN116471449 B CN 116471449B CN 202310734421 A CN202310734421 A CN 202310734421A CN 116471449 B CN116471449 B CN 116471449B
Authority
CN
China
Prior art keywords
live broadcast
live
recommended
user
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310734421.6A
Other languages
English (en)
Other versions
CN116471449A (zh
Inventor
王晨
徐斌
邓鹏毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Electric Whale Network Technology Co ltd
Original Assignee
Hangzhou Electric Whale Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Electric Whale Network Technology Co ltd filed Critical Hangzhou Electric Whale Network Technology Co ltd
Priority to CN202310734421.6A priority Critical patent/CN116471449B/zh
Publication of CN116471449A publication Critical patent/CN116471449A/zh
Application granted granted Critical
Publication of CN116471449B publication Critical patent/CN116471449B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/454Content or additional data filtering, e.g. blocking advertisements
    • H04N21/4545Input to filtering algorithms, e.g. filtering a region of the image
    • H04N21/45457Input to filtering algorithms, e.g. filtering a region of the image applied to a time segment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于大数据分析的直播行为检测方法,在检测到用户观看直播的行为异常后,通过主动推送参数录入界面的方式,将用户由直播内容的被动接受方转变为推送内容的主动筛选者,并将用户的主动筛选行为通过一系列的算法与该用户过往在每个时间段的历史观看记录形成技术上的关联,实现了对用户在每个时间段的感兴趣的直播内容的快速且精准的寻找。并通过层层递进的方式检测用户观看直播的行为是否异常,同时通过第一策略和第二策略试探性的寻找用户在当前时间段感兴趣的直播内容,当试探到用户疑似感兴趣的直播内容后,通过第一策略或第二策略验证用户是否对试探到的兴趣点真正感兴趣,进一步提升了直播内容分时推送的精准性。

Description

基于大数据分析的直播行为检测方法
技术领域
本发明涉及数据分析技术领域,具体涉及一种基于大数据分析的直播行为检测方法。
背景技术
目前,直播平台向用户推荐直播内容的方法通常为:基于用户过往的直播观看记录,分析用户感兴趣的直播内容,在用户打开直播软件后,将判定感兴趣的内容推送给用户。现有的上述直播内容推荐方法存在以下几个技术问题:
1、用户是直播内容的被动接受方,用户本身基本没有直播内容筛选的权利。现有的部分直播平台虽然也有一些简单的筛选功能,比如可以将性别作为感兴趣的筛选点进行男、女主播的筛选,但由于用户的自主筛选行为没有与过往的历史观看记录形成技术上的关联,因此筛选结果是海量的,不精准地。所以,如何赋予用户更多的直播内容筛选权利,并如何实现用户的筛选行为与过往的历史观看记录形成技术上的关联,以更为快速、精准的寻找到用户感兴趣观看的直播内容成为直播行业亟待解决的技术问题。
2、在不同的时间段,同个用户感兴趣的直播内容可能不同。因此,针对同个用户,如何在不同的时间段向其推送感兴趣的直播内容也是目前直播行业亟待解决的技术问题。
3、为达到在不同时间段针对同个用户能够精准识别其感兴趣的直播内容的技术效果,准确判断用户对当前推送的直播内容是否感兴趣也至关重要,因此如何精准判断用户对当前推送的直播内容是否感兴趣也是目前直播行业亟待解决的技术问题。
发明内容
本发明以针对同个用户不同时间段提高直播内容推送的精准性为目的,提供了一种基于大数据分析的直播行为检测方法。
为达此目的,本发明采用以下技术方案:
提供一种基于大数据分析的直播行为检测方法,包括步骤:
S1,以打开直播软件为指令,获取当前星期的当前时间点落入的时间段对应的第一直播推荐参数,包括拟推荐用户在所述时间段的直播喜好类型及所述直播喜好类型对应的直播过滤条件;
S2,根据所述第一直播推荐参数中记载的所述直播过滤条件,并基于加密匹配算法,从所述第一直播推荐参数中记载的所述直播喜好类型对应的直播资源库中筛选出直播内容推送给所述拟推荐用户;
S3,检测所述拟推荐用户观看直播的行为,
若检测到行为异常,则生成参数录入界面推送给所述拟推荐用户,所述拟推荐用户录入参数并确定后生成第二直播推荐参数,然后转入步骤S4;
若未检测到行为异常,则跳转到步骤S5;
S4,将所述第二直播推荐参数更新为所述第一直播推荐参数,然后返回步骤S2;
S5,将更新前或更新后的所述第一直播推荐参数作为所述拟推荐用户在当前星期的所述时间段的直播推荐参数并存储到数据库中。
作为优选,所述直播喜好类型获取方法包括步骤:
S11,获取所述拟推荐用户在历史每个星期的所述时间段的直播推荐筛选过滤条件录入记录;
S12,获取系统针对每条所述录入记录所推荐的直播资源库的集合类型;
S13,计算所述拟推荐用户对每个所述集合类型的喜好值,并将喜好值最大的所述集合类型作为所述拟推荐用户在当前时间点落入的所述时间段的所述直播喜好类型。
作为优选,步骤S13中,所述喜好值通过如下步骤计算而得:
S131,抽取出所述拟推荐用户在每个历史星期的同个所述时间段录入的每条所述录入记录,形成关联每个所述历史星期的所述时间段的录入记录抽取集合;
S132,从每个所述录入记录抽取集合中进一步抽取出每条所述录入记录的录入参数,包括所述录入记录的生成时间以及所述录入记录中记录的录入过过滤信息的过滤条件的数量;
S133,根据步骤S132进一步抽取的所述生成时间由早到晚对步骤S131抽取的关联同个所述历史星期的所述时间段的每条所述录入记录进行排序,形成排序列表;
S134,根据步骤S132进一步抽取的每条所述录入记录的所述生成时间,从所述排序列表中排序最前的所述录入记录开始,计算所述排序列表中每两两相邻的第一录入记录和第二录入记录的间隔时长,记为关联于所述第一录入记录的集合类型求解第一变量
S135,通过如下公式(1)计算关联所述第一录入记录的表征值,并将/>最大的所述第一录入记录对应的所述集合类型作为所述拟推荐用户在对应历史星期的所述时间段的直播推荐喜好类型:
公式(1)中,表示所述时间段的总时长;
表示所述第一录入记录中记录的录入过过滤信息的过滤条件的数量;
S136,计算每个所述直播推荐喜好类型在历史各星期的同个所述时间段内的出现次数作为所述喜好值,并将所述喜好值最大的所述直播推荐喜好类型作为所述拟推荐用户在所述当前时间点落入的所述时间段感兴趣观看的所述直播喜好类型。
作为优选,所述直播过滤条件包括主播性别过滤、直播人数过滤、非母语直播过滤、直播地域过滤、直播场景过滤和直播热度过滤。
作为优选,步骤S2中,从步骤S1获取的所述直播喜好类型对应的所述直播资源库中筛选出直播内容的方法包括步骤:
S21,从步骤S1获取的所述直播喜好类型对应的所述直播资源库中过滤掉在非所述直播过滤条件中指定的地域直播内容和具有非指定直播热度的直播内容;
S22,计算所述直播过滤条件中剩余的每个过滤项的第一加密值;
S23,计算每个剩余的所述过滤项的所述第一加密值在关联所述拟推荐用户的每个历史星期的同个所述时间段所关联的每个所述第一直播推荐参数中出现的次数累加值;
S24,计算每个所述第一加密值与对应的所述次数累加值的和值并按和值由大到小排列后形成所述直播过滤条件的第二加密值,以确定对经步骤S21过滤剩余的每个所述过滤项在所述第二加密值中的位置;
S25,计算过滤剩余的所述直播资源库中的每个所述直播内容的第三加密值,所述第三加密值中的每个排序位对应的所述过滤项与所述第二加密值中相同排序位对应的所述过滤项相同;
S26,对所述第二加密值和所述第三加密值进行相似度匹配,
若匹配成功,则将所述第三加密值对应的所述直播内容加入到待推荐内容集中然后转入步骤S27;
若匹配失败,则从步骤S1中获取的所述直播喜好类型对应的所述直播资源库中随机推送直播内容给所述拟推荐用户;
S27,随机推送所述待推荐内容集中的直播内容给所述拟推荐用户。
作为优选,步骤S25中,经步骤S21过滤剩余的所述直播资源库中的每个所述直播内容的所述第三加密值通过以下方法计算而得:
计算经步骤S21过滤剩余的所述直播资源库中的每个所述直播内容以经步骤S21过滤剩余后的每个所述过滤项的所述第一加密值在历史每个星期的同个所述时间段被推荐给其他用户的推荐次数,并对每个所述过滤项对应的所述推荐次数按照所述第二加密值中确定的排序位进行排序后得到所述第三加密值。
作为优选,步骤S26中,判定所述第二加密值和所述第三加密值匹配成功的条件为:所述第二加密值和所述第三加密值中对应同个所述过滤项且在所述第二加密值和所述第三加密值中的排序顺序相同的元素个数大于指定的元素个数阈值。
作为优选,步骤S3中,通过第一策略检测所述拟推荐用户观看直播的行为是否异常,具体包括步骤:
S31,识别出当前推送给所述拟推荐用户的所述直播内容所归属的集合,所述集合为步骤S1中获取的所述直播喜好类型对应的原始的所述直播资源库,或步骤S26中形成的所述待推荐内容集;
S32,判断步骤S31识别出的所述集合是否为所述待推荐内容集,
若是,则转入步骤S33;
若否,则通过第二策略检测所述拟推荐用户观看直播的行为是否异常;
S33,取所述待推荐内容集和所述直播喜好类型对应的并经步骤S25过滤剩余的所述直播资源库的反集,并获取所述反集中的每个所述直播内容对应的所述第三加密值;
S34,判断所述拟推荐用户观看当前推送的所述直播内容的停留时长占所述直播内容总时长的比值是否大于预设的比值阈值,
若是,则判定观看直播的行为正常;
若否,则转入步骤S35;
S35,计算所述反集中的每个所述直播内容对应的所述第三加密值与所述第二加密值的相似度,并将相似度值最低的所述第三加密值对应的所述直播内容在所述拟推荐用户切换直播的下一时间点推送给所述拟推荐用户;
S36,判断所述拟推荐用户在下一时间点观看所推送的所述直播内容的停留时长占所述直播内容总时长的比值是否大于预设的所述比值阈值,
若是,则判定所述拟推荐用户观看直播的行为异常;
若否,则判定观看直播的行为正常,在下个时间点继续从所述待推荐内容集中进行直播内容推荐。
作为优选,通过第二策略检测所述拟推荐用户观看直播的行为是否异常,具体包括步骤:
A1,从存储器中提取出步骤S13中计算的最小喜好值对应的所述直播喜好类型所进一步对应的所述直播资源库;
A2,判断所述拟推荐用户观看当前推送的所述直播内容的停留时长占所述直播内容总时长的比值是否大于预设的所述比值阈值,
若是,则判定观看直播的行为正常;
若否,则转入步骤A3;
A3,在所述拟推荐用户切换直播的下一时间点,在步骤A1中提取的所述直播资源库中随机推送所述直播内容给所述拟推荐用户;
A4,判断所述拟推荐用户在下一时间点观看所推送的所述直播内容的停留时长占所述直播内容的总时长的比值是否大于预设的所述比值阈值,
若是,则判定所述拟推荐用户观看直播的行为异常;
若否,则判定观看直播的行为正常,在下个时间点继续从对应最高喜好值的所述直播喜好类型所对应的所述直播资源库中进行直播内容推荐。
本发明具有以下有益效果:
1、在检测到用户观看直播的行为异常后,通过主动推送参数录入界面并提示用户录入参数的方式,将用户由直播内容的被动接受方转变为推送内容的主动筛选者,并将用户的主动筛选行为通过一系列的算法与该用户过往在每个时间段的历史观看记录形成技术上的关联,实现了对用户在每个时间段的感兴趣的直播内容的快速且精准的寻找。
2、通过层层递进的方式检测拟推荐用户观看直播的行为是否异常,并通过第一策略和第二策略试探性的寻找用户在当前时间段感兴趣的直播内容,当试探到用户疑似感兴趣的直播内容后,通过第一策略从反集中推送直播内容来验证用户是否对试探到的兴趣点真正感兴趣,或通过第二策略从喜好值最低的直播喜好类型对应的直播资源库中推送内容来验证用户是否对试探到的兴趣点真正感兴趣,以便于后续及时调整视频推送策略,进一步提升了直播内容分时推送的精准性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的基于大数据分析的直播行为检测方法的实现步骤图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
在本发明的描述中,除非另有明确的规定和限定,若出现术语“连接”等指示部件之间的连接关系,该术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个部件内部的连通或两个部件的相互作用关系。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
本发明实施例提供的基于大数据分析的直播行为检测方法,如图1所示,包括步骤:
S1,以打开直播软件为指令,获取当前星期的当前时间点落入的时间段对应的第一直播推荐参数,包括拟推荐用户在该时间段的直播喜好类型及该直播喜好类型对应的直播过滤条件;
比如,拟推荐用户在10:30这一当前时间点打开直播软件,按照预设的时间段划分方法,比如划分了10:00-12:00这一时间段,则当前时间点10:30落入到10:00-12:00这一时间段。
拟推荐用户在该时间段的直播喜好类型通过如下方法步骤获得:
S11,获取拟推荐用户在历史每个星期的该时间段的直播推荐筛选过滤条件(直播过滤条件)录入记录;比如,设定获取的历史星期为连续历史星期,连续历史星期的数量设定为5,即设定录入记录获取对象的历史连续星期可分别记为:(历史第一星期)、(历史第二星期)、/>(历史第三星期)、/>(历史第四星期)、/>(历史第五星期),连续的/>按时间顺序先后排列;
直播过滤条件包括主播性别过滤、直播人数过滤、非母语直播过滤、直播地域过滤、直播场景过滤和直播热度过滤。主播性别过滤,即主播男、女性别的过滤,用户勾选“男”后,将过滤掉直播资源库中的由女性进行直播的直播内容;直播人数过滤包括单人直播和多人直播过滤,用户勾选“单人直播”后,将过滤掉多人进行直播的直播内容;非母语直播过滤,用户勾选该选项后,将过滤掉使用非母语进行直播的直播内容;直播地域过滤,用于勾选具体的地域比如“杭州”后,将过滤掉主播地不在杭州的直播内容;直播场景过滤包括室内直播和室外直播过滤,用户勾选室内直播后,将过滤掉在室外进行直播的直播内容;直播热度过滤,比如将直播热度归类为直播观看在线人数1万人以下、1-5万人、5-10万人、10-50万人、50-100万人、100万人以上,用户勾选任一直播热度选项后,将过滤掉具有其他热度的直播内容。
用户在不同历史星期的同个时间段感兴趣观看的直播内容可能并不相同,比如,在的10:00-12:00这个时间段,用户感兴趣观看海鲜类吃播的直播内容;在的10:00-12:00这个时间段,用户感兴趣观看面食类吃播的直播内容……,因此在历史星期的同个时间段,用户录入的直播过滤条件可能不同,步骤S11,首先需要获取拟推荐用户在历史每个星期的同个时间段的直播过滤条件录入记录,然后转入步骤:
S12,获取系统针对每条录入记录所推荐的直播资源库的集合类型;
比如,对于直播过滤条件录入记录1,系统在(比如历史第一周的星期三)的10:00-12:00这个时间段,从海鲜类吃播的直播资源库中向该用户推送直播内容,则直播过滤条件录入记录1对应的集合类型为“海鲜吃播类”;
也有可能,同个用户在的10:00-12:00这个时间段,还形成了直播过滤条件录入记录2,这个直播过滤条件录入记录2比如对应的集合类型为“面食吃播类”。因此,在同个历史星期的同个时间段,同个用户可能产生多个直播过滤条件录入记录。
S13,计算拟推荐用户对每个集合类型的喜好值,并将喜好值最大的集合类型作为拟推荐用户在当前时间点落入的时间段的直播喜好类型;
喜好值的计算方法具体包括如下步骤:
S131,抽取出拟推荐用户在每个历史星期(比如历史第一周的星期三)的同个时间段(比如10:00-12:00这个时间段)录入的每条录入记录,形成关联每个历史星期的该时间段的录入记录抽取集合;
S132,从每个录入记录抽取集合中进一步抽取出每条录入记录的录入参数,包括录入记录的生成时间以及录入记录中记录的录入过过滤信息的过滤条件的数量;比如,录入记录中包括主播性别过滤、直播人数过滤、非母语直播过滤、直播地域过滤、直播场景过滤和直播热度过滤总共6个过滤条件,用户对其中的主播性别过滤、非母语直播过滤、直播地域过滤录入过过滤信息,则录入过过滤信息的过滤条件的数量为3;
S133,根据进一步抽取的生成时间由早到晚对步骤S131抽取的关联同个历史星期的该时间段的每条录入记录进行排序,形成排序列表;
S134,根据步骤S132进一步抽取的每条录入记录的生成时间,从排序列表中排序最前的录入记录开始,计算排序列表中每两两相邻的第一录入记录和第二录入记录的间隔时长,记为关联于第一录入记录的集合类型求解第一变量
S135,通过如下公式(1)计算关联第一录入记录的表征值,并将/>最大的第一录入记录对应的集合类型作为拟推荐用户在对应历史星期的时间段的直播推荐喜好类型:
公式(1)中,表示时间段的总时长;
表示第一录入记录中记录的录入过过滤信息的过滤条件的数量;
S136,计算每个直播推荐喜好类型在历史各星期的同个时间段内的出现次数作为最终计算得到的喜好值,并将喜好值最大的直播推荐喜好类型作为该拟推荐用户在当前时间点落入的时间段感兴趣观看的直播喜好类型。
这里需要说明的是,当上述的步骤S131-S135无法计算到表征值时,系统直接以在当前星期的上一星期的该时间段推送给拟推荐用户的直播内容所归属的直播资源库所对应的直播喜好类型为该用户在当前时间点落入的同个时间段感兴趣观看的直播喜好类型。当归属的直播资源库大于1时,则随机指定其中一个直播资源库对应的直播喜好类型为用户在当前时间点落入的同个时间段感兴趣观看的直播喜好类型。
获取到用户在当前星期的当前时间点落入的时间段对应的直播喜好类型和该直播喜好类型对应的直播过滤条件后,本实施例提供的基于大数据分析的直播行为检测方法转入步骤:
S2,根据第一直播推荐参数中记载的直播过滤条件,并基于加密匹配算法,从第一直播推荐参数中记载的直播喜好类型对应的直播资源库中筛选出直播内容推送给推荐用户,具体筛选方法包括如下步骤:
S21,从步骤S1获取的直播喜好类型的直播资源库中过滤掉在非直播过滤掉件中指定的地域直播内容和具有非指定直播热度的直播内容,比如拟推荐用户在第一直播推荐参数中指定了感兴趣观看的直播地域为“杭州”和直播热度为“直播观看在线人数100万以上”,则在步骤S1获取的该直播喜好类型的直播资源库中过滤掉地域非“杭州”和直播热度非“直播观看在线人数100万以上”的直播内容;
S22,计算直播过滤条件中剩余的每个过滤项的第一加密值;本实施例中,直播过滤条件包括主播性别过滤、直播人数过滤、非母语直播过滤、直播地域过滤、直播场景过滤和直播热度过滤,在步骤S21中,已经对直播地域和直播热度做了条件过滤,剩下的过滤项为主播性别过滤、直播人数过滤、非母语直播过滤和直播场景过滤,这些剩余的过滤项即为第一加密值的计算对象。
第一加密值与过滤项的值的对应关系构建如下:
1、对于主播性别这一过滤项,若拟推荐用户勾选主播性别为“男”,则该过滤项对应的第一加密值为“1”,否则为“0”;
2、对于直播人数过滤这一过滤项,若拟推荐用户勾选直播人数为“单人”,则该过滤项对应的第一加密值为“1”,否则为“0”;
3、对于非母语直播这一过滤项,若拟推荐用户勾选“母语直播”,则该过滤项对应的第一加密值为“1”,否则为“0”;
4、对于直播场景过滤这一过滤项,若拟推荐用户勾选“室内直播”,则该过滤项对应的第一加密值为“1”,否则为“0”。
计算得到剩余的每个过滤项的第一加密值后,转入步骤:
S23,计算每个剩余的过滤项的第一加密值在关联该拟推荐用户的每个历史星期的同个时间段所关联的每个第一直播推荐参数中出现的次数累加值;比如,在连续历史星期的每个星期三的10:00-12:00这一时间段,主播性别为“男”对应的第一加密值“1”被用户作为过滤条件的次数一共有8次,则该第一加密值的次数累加值为“8”;又比如,在连续历史星期的每个星期三的10:00-12:00这一时间段,室外直播对应的第一加密值“0”被用户作为过滤条件的次数一共有9次,则该第一加密值的次数累加值为“9”;
S24,计算每个第一加密值与对应的次数累加值的和值,并按和值由大到小排列后形成直播过滤条件的第二加密值,以确定经步骤S21过滤剩余的每个过滤项在第二加密值中的位置;比如,同样以步骤S23中的举例为例,主播性别为“男”对应的第一加密值的次数累加值为“8”,室外直播对应的第一加密值的次数累加值为“9”,但由于主播性别为“男”对应的第一加密值本身为“1”,室外直播对应的第一加密值本身为“0”,则主播性别为“男”的第一加密值与对应的次数累加值的和值为“9”,室外直播的第一加密值与对应的次数累加值的和值同样为“9”,因此,将主播性别为“男”和室外直播分别对应的第一加密值并列排在第二加密值的同个排序位置,比如第二加密值的形式为:9/9、5、4,“/”前的“9”可定义为主播性别为“男”的第一加密值与对应的次数累加值的和值,“/”后的“9”可定义为室外直播的第一加密值与对应的次数累加值的和值,“5”可定义为非母语直播这一过滤项的第一加密值与对应的次数累加值的和值,“4”可定义为直播人数这一过滤项的第一加密值与对应的次数累加值的和值;对第二加密值中的每个排序位置定义好对应的
S25,计算经步骤S21过滤剩余的直播资源库中的每个直播内容的第三加密值,第三加密值中的每个排序位对应的过滤项与第二加密值中相同排序位对应的过滤项相同;
第三加密值通过如下方法步骤计算而得:
计算经步骤S21过滤剩余的直播资源库中的每个直播内容以经步骤S21过滤剩余后的每个过滤项的第一加密值在历史(比如选择历史连续5个星期)每个星期(比如每个历史星期三)的该同个时间段(比如10:00-12:00)被推荐给其他用户的推荐次数,并对每个过滤项对应的推荐次数按照第二加密值中确定的排序位进行排序后得到第三加密值(与第二加密值一样,同样为一个序列)。
S26,对第二加密值和第三加密值进行相似度匹配,
若匹配成功,则将第三加密值对应的直播内容加入到待推荐内容集中,然后转入步骤S27;
若匹配失败,则从步骤S1中获取的直播喜好类型对应的直播资源库中随机推送直播内容给拟推荐用户;
以下对第二加密值和第三加密值的具体匹配方法进行说明:
判定第二加密值和第三加密值匹配成功的条件为:第二加密值和第三加密值中对应同个过滤项且在第二加密值和第三加密值中的排序顺序相同的元素个数大于指定的元素个数阈值。
S27,随机推送待推荐内容集中的直播内容给拟推荐用户。
经过上述的步骤S1-S2,实现了对用户在打开直播软件时的直播内容的相对精准的推荐,但拟推荐用户在同个星期的同个时段感兴趣观看的直播内容的类型并非是一成不变的,因此,需要进一步判断用户对经步骤S1-S2推荐的直播内容是否真正感兴趣,为了解决这个问题,本发明实施例提供的基于大数据分析的直播行为检测方法转入步骤:
S3,检测拟推荐用户观看直播的行为,
若检测到行为异常,则生成参数录入界面推送给拟推荐用户,拟推荐用户录入参数并确定后生成第二直播推荐参数,然后转入步骤S4;
若未检测到行为异常,则跳转到步骤S5;
本实施例中,通过第一策略和第二策略来检测拟推荐用户观看直播的行为是否异常。通过第一策略检测拟推荐用户观看直播的行为是否异常的方法具体包括步骤:
S31,识别出当前推送给拟推荐用户的直播内容所归属的集合,所述集合为步骤S1中获取的直播喜好类型对应的原始的直播资源库,或步骤S26中形成的待推荐内容集;直播内容所归属的集合的识别方法可以采用唯一编码的方式,比如,对直播资源库和待推荐内容集分别赋予相对应的唯一库编码和唯一集编码,系统在相应的直播资源库或待推荐内容集中提取直播内容并推荐时,均会在直播内容打上表示出处来源的唯一库编码或唯一集编码。
S32,判断步骤S31识别出的集合是否为待推荐内容集,
若是,则转入步骤S33;
若否,则通过第二策略检测拟推荐用户观看直播的行为是否异常;
S33,取待推荐内容集和直播喜好类型对应的并经步骤S25过滤剩余的直播资源库的反集(假设待推荐内容集中的直播内容包括直播内容A、B、C,经步骤S25过滤剩余的直播资源库中的直播内容包括直播内容A、B、C、D、E),则直播内容D、E为反集,然后获取反集中的每个直播内容对应的第三加密值;
S34,判断拟推荐用户观看当前推送的直播内容的停留时长占直播内容总时长的比值是否大于预设的比值阈值,
若是,则判定观看直播的行为正常;
若否,则转入步骤S35;
S35,计算反集中的每个直播内容对应的第三加密值与第二加密值的相似度,并将相似度最低的第三加密值对应的直播内容在拟推荐用户切换直播的下一时间点推送给拟推荐用户;
S36,判断拟推荐用户在下一时间点观看所推送的直播内容的停留时长占直播内容总时长的比值是否大于预设的比值阈值,
若是,则判定拟推荐用户观看直播的行为异常;
若否,则判定观看直播的行为正常,在下个时间点继续从待推荐内容集中进行直播内容推荐。
通过第二策略检测拟推荐用户观看直播的行为是否异常的方法具体包括步骤:
A1,从存储器中提取出步骤S13中计算的最小喜好值对应的直播喜好类型所进一步对应的直播资源库;
A2,判断拟推荐用户观看当前推送的直播内容的停留时长占直播内容总时长的比值是否大于预设的比值阈值,
若是,则判定观看直播的行为正常;
若否,则转入步骤A3;
A3,在拟推荐用户切换直播的下一时间点,在步骤A1提取的直播资源库中随机推送直播内容给拟推荐用户;
A4,判断拟推荐用户在下一时间点观看所推送的直播内容的停留时长占直播内容总时长的比值是否大于预设的比值阈值,
若是,则判定拟推荐用户观看直播的行为异常;
若否,则判定观看直播的行为正常,在下个时间点继续从对应最高喜好值的直播喜好类型所对应的直播资源库中进行直播内容推荐。
完成对拟推荐用户观看直播的行为的异常检测后,本实施例提供的基于大数据分析的直播行为检测方法转入步骤:
S4,将第二直播推荐参数更新为第一直播推荐参数,然后返回步骤S2;
S5,将更新后的第一直播推荐参数作为拟推荐用户在当前星期的时间段的直播推荐参数并存储到数据库中。若第一直播推荐参数未更新,则以步骤S1获取的第一直播推荐参数作为拟推荐用户在当前星期的该时间段的直播推荐参数并存储到数据库中。
综上,本发明在检测到用户观看直播的行为异常后,通过主动推送参数录入界面的方式,将用户由直播内容的被动接受方转变为推送内容的主动筛选者,并将用户的主动筛选行为通过一系列的算法与该用户过往在每个时间段的历史观看记录形成技术上的关联,实现了对用户在每个时间段的感兴趣的直播内容的快速且精准的寻找。并通过层层递进的方式检测用户观看直播的行为是否异常,同时通过第一策略和第二策略试探性的寻找用户在当前时间段感兴趣的直播内容,当试探到用户疑似感兴趣的直播内容后,通过第一策略或第二策略验证用户是否对试探到的兴趣点真正感兴趣,进一步提升了直播内容分时推送的精准性。
需要声明的是,上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领域技术人员应该明白,还可以对本发明做各种修改、等同替换、变化等等。但是,这些变换只要未背离本发明的精神,都应在本发明的保护范围之内。另外,本申请说明书和权利要求书所使用的一些术语并不是限制,仅仅是为了便于描述。

Claims (5)

1.一种基于大数据分析的直播行为检测方法,其特征在于,包括步骤:
S1,以打开直播软件为指令,获取当前星期的当前时间点落入的时间段对应的第一直播推荐参数,包括拟推荐用户在所述时间段的直播喜好类型及所述直播喜好类型对应的直播过滤条件;
S2,根据所述第一直播推荐参数中记载的所述直播过滤条件,并基于加密匹配算法,从所述第一直播推荐参数中记载的所述直播喜好类型对应的直播资源库中筛选出直播内容推送给所述拟推荐用户;
S3,检测所述拟推荐用户观看直播的行为,
若检测到行为异常,则生成参数录入界面推送给所述拟推荐用户,所述拟推荐用户录入参数并确定后生成第二直播推荐参数,然后转入步骤S4;
若未检测到行为异常,则跳转到步骤S5;
S4,将所述第二直播推荐参数更新为所述第一直播推荐参数,然后返回步骤S2;
S5,将更新后的所述第一直播推荐参数作为所述拟推荐用户在当前星期的所述时间段的直播推荐参数并存储到数据库中;
所述直播过滤条件包括主播性别过滤、直播人数过滤、非母语直播过滤、直播地域过滤、直播场景过滤和直播热度过滤;
步骤S2中,从步骤S1获取的所述直播喜好类型对应的所述直播资源库中筛选出直播内容的方法包括步骤:
S21,从步骤S1获取的所述直播喜好类型对应的所述直播资源库中过滤掉在非所述直播过滤条件中指定的地域直播内容和具有非指定直播热度的直播内容;
S22,计算所述直播过滤条件中剩余的每个过滤项的第一加密值;
S23,计算每个剩余的所述过滤项的所述第一加密值在关联所述拟推荐用户的每个历史星期的同个所述时间段所关联的每个所述第一直播推荐参数中出现的次数累加值;
S24,计算每个所述第一加密值与对应的所述次数累加值的和值并按和值由大到小排列后形成所述直播过滤条件的第二加密值,以确定对经步骤S21过滤剩余的每个所述过滤项在所述第二加密值中的位置;
S25,计算过滤剩余的所述直播资源库中的每个所述直播内容的第三加密值,所述第三加密值中的每个排序位对应的所述过滤项与所述第二加密值中相同排序位对应的所述过滤项相同;
S26,对所述第二加密值和所述第三加密值进行相似度匹配,
若匹配成功,则将所述第三加密值对应的所述直播内容加入到待推荐内容集中然后转入步骤S27;
若匹配失败,则从步骤S1中获取的所述直播喜好类型对应的所述直播资源库中随机推送直播内容给所述拟推荐用户;
S27,随机推送所述待推荐内容集中的直播内容给所述拟推荐用户;
步骤S3中,通过第一策略检测所述拟推荐用户观看直播的行为是否异常,具体包括步骤:
S31,识别出当前推送给所述拟推荐用户的所述直播内容所归属的集合,所述集合为步骤S1中获取的所述直播喜好类型对应的原始的所述直播资源库,或步骤S26中形成的所述待推荐内容集;
S32,判断步骤S31识别出的所述集合是否为所述待推荐内容集,
若是,则转入步骤S33;
若否,则通过第二策略检测所述拟推荐用户观看直播的行为是否异常;
S33,取所述待推荐内容集和所述直播喜好类型对应的并经步骤S25过滤剩余的所述直播资源库的反集,并获取所述反集中的每个所述直播内容对应的所述第三加密值;
S34,判断所述拟推荐用户观看当前推送的所述直播内容的停留时长占所述直播内容总时长的比值是否大于预设的比值阈值,
若是,则判定观看直播的行为正常;
若否,则转入步骤S35;
S35,计算所述反集中的每个所述直播内容对应的所述第三加密值与所述第二加密值的相似度,并将相似度值最低的所述第三加密值对应的所述直播内容在所述拟推荐用户切换直播的下一时间点推送给所述拟推荐用户;
S36,判断所述拟推荐用户在下一时间点观看所推送的所述直播内容的停留时长占所述直播内容总时长的比值是否大于预设的所述比值阈值,
若是,则判定所述拟推荐用户观看直播的行为异常;
若否,则判定观看直播的行为正常,在下个时间点继续从所述待推荐内容集中进行直播内容推荐;
通过第二策略检测所述拟推荐用户观看直播的行为是否异常,具体包括步骤:
A1,从存储器中提取出步骤S13中计算的最小喜好值对应的所述直播喜好类型所进一步对应的所述直播资源库;
A2,判断所述拟推荐用户观看当前推送的所述直播内容的停留时长占所述直播内容总时长的比值是否大于预设的所述比值阈值,
若是,则判定观看直播的行为正常;
若否,则转入步骤A3;
A3,在所述拟推荐用户切换直播的下一时间点,在步骤A1中提取的所述直播资源库中随机推送所述直播内容给所述拟推荐用户;
A4,判断所述拟推荐用户在下一时间点观看所推送的所述直播内容的停留时长占所述直播内容的总时长的比值是否大于预设的所述比值阈值,
若是,则判定所述拟推荐用户观看直播的行为异常;
若否,则判定观看直播的行为正常,在下个时间点继续从对应最高喜好值的所述直播喜好类型所对应的所述直播资源库中进行直播内容推荐。
2.根据权利要求1所述的基于大数据分析的直播行为检测方法,其特征在于,所述直播喜好类型获取方法包括步骤:
S11,获取所述拟推荐用户在历史每个星期的所述时间段的直播推荐筛选过滤条件录入记录;
S12,获取系统针对每条所述录入记录所推荐的直播资源库的集合类型;
S13,计算所述拟推荐用户对每个所述集合类型的喜好值,并将喜好值最大的所述集合类型作为所述拟推荐用户在当前时间点落入的所述时间段的所述直播喜好类型。
3.根据权利要求2所述的基于大数据分析的直播行为检测方法,其特征在于,步骤S13中,所述喜好值通过如下步骤计算而得:
S131,抽取出所述拟推荐用户在每个历史星期的同个所述时间段录入的每条所述录入记录,形成关联每个所述历史星期的所述时间段的录入记录抽取集合;
S132,从每个所述录入记录抽取集合中进一步抽取出每条所述录入记录的录入参数,包括所述录入记录的生成时间以及所述录入记录中记录的录入过过滤信息的过滤条件的数量;
S133,根据步骤S132进一步抽取的所述生成时间由早到晚对步骤S131抽取的关联同个所述历史星期的所述时间段的每条所述录入记录进行排序,形成排序列表;
S134,根据步骤S132进一步抽取的每条所述录入记录的所述生成时间,从所述排序列表中排序最前的所述录入记录开始,计算所述排序列表中每两两相邻的第一录入记录和第二录入记录的间隔时长,记为关联于所述第一录入记录的集合类型求解第一变量
S135,通过如下公式(1)计算关联所述第一录入记录的表征值,并将/>最大的所述第一录入记录对应的所述集合类型作为所述拟推荐用户在对应历史星期的所述时间段的直播推荐喜好类型:
公式(1)中,表示所述时间段的总时长;
表示所述第一录入记录中记录的录入过过滤信息的过滤条件的数量;
S136,计算每个所述直播推荐喜好类型在历史各星期的同个所述时间段内的出现次数作为所述喜好值,并将所述喜好值最大的所述直播推荐喜好类型作为所述拟推荐用户在所述当前时间点落入的所述时间段感兴趣观看的所述直播喜好类型。
4.根据权利要求1所述的基于大数据分析的直播行为检测方法,其特征在于,步骤S25中,经步骤S21过滤剩余的所述直播资源库中的每个所述直播内容的所述第三加密值通过以下方法计算而得:
计算经步骤S21过滤剩余的所述直播资源库中的每个所述直播内容以经步骤S21过滤剩余后的每个所述过滤项的所述第一加密值在历史每个星期的同个所述时间段被推荐给其他用户的推荐次数,并对每个所述过滤项对应的所述推荐次数按照所述第二加密值中确定的排序位进行排序后得到所述第三加密值。
5.根据权利要求4所述的基于大数据分析的直播行为检测方法,其特征在于,步骤S26中,判定所述第二加密值和所述第三加密值匹配成功的条件为:所述第二加密值和所述第三加密值中对应同个所述过滤项且在所述第二加密值和所述第三加密值中的排序顺序相同的元素个数大于指定的元素个数阈值。
CN202310734421.6A 2023-06-20 2023-06-20 基于大数据分析的直播行为检测方法 Active CN116471449B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310734421.6A CN116471449B (zh) 2023-06-20 2023-06-20 基于大数据分析的直播行为检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310734421.6A CN116471449B (zh) 2023-06-20 2023-06-20 基于大数据分析的直播行为检测方法

Publications (2)

Publication Number Publication Date
CN116471449A CN116471449A (zh) 2023-07-21
CN116471449B true CN116471449B (zh) 2023-09-29

Family

ID=87184733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310734421.6A Active CN116471449B (zh) 2023-06-20 2023-06-20 基于大数据分析的直播行为检测方法

Country Status (1)

Country Link
CN (1) CN116471449B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2763421A1 (en) * 2013-02-01 2014-08-06 Krea Icerik Hizmetleri Ve Produksiyon Anonim Sirketi A personalized movie recommendation method and system
CN112702631A (zh) * 2020-11-27 2021-04-23 苏州宇讯科技信息有限公司 一种网络培训的运营管理系统及方法
CN113318440A (zh) * 2021-06-21 2021-08-31 广州博冠信息科技有限公司 弹幕生成方法及装置、存储介质、电子设备
CN115065836A (zh) * 2022-05-19 2022-09-16 广州方硅信息技术有限公司 直播间切换展示处理方法、服务器、电子终端及存储介质
CN115379266A (zh) * 2021-05-20 2022-11-22 上海哔哩哔哩科技有限公司 弹幕展示方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111263229B (zh) * 2018-11-30 2023-06-16 南京超聚通信科技有限公司 一种视频分发方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2763421A1 (en) * 2013-02-01 2014-08-06 Krea Icerik Hizmetleri Ve Produksiyon Anonim Sirketi A personalized movie recommendation method and system
CN112702631A (zh) * 2020-11-27 2021-04-23 苏州宇讯科技信息有限公司 一种网络培训的运营管理系统及方法
CN115379266A (zh) * 2021-05-20 2022-11-22 上海哔哩哔哩科技有限公司 弹幕展示方法及装置
CN113318440A (zh) * 2021-06-21 2021-08-31 广州博冠信息科技有限公司 弹幕生成方法及装置、存储介质、电子设备
CN115065836A (zh) * 2022-05-19 2022-09-16 广州方硅信息技术有限公司 直播间切换展示处理方法、服务器、电子终端及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种融合多种用户行为的协同过滤推荐算法;高山;刘炜;崔勇;张茜;王宗敏;;计算机科学(第09期);全文 *

Also Published As

Publication number Publication date
CN116471449A (zh) 2023-07-21

Similar Documents

Publication Publication Date Title
KR101827345B1 (ko) 다중 알고리즘 및 자기학습기능을 적용한 개인화 추천 시스템 및 추천 방법
KR101620748B1 (ko) 아이템 추천 방법 및 아이템 추천 장치
CN110337012B (zh) 基于互联网电视平台的智能推荐方法和装置
CN102934113B (zh) 信息提供系统、信息提供方法、信息提供设备
CN115983952B (zh) 一种定制服装设计推荐系统
CN112468853B (zh) 电视资源推荐方法、装置、计算机设备及存储介质
CN111125429A (zh) 一种视频推送方法、装置和计算机可读存储介质
CN110795584A (zh) 一种用户标识生成方法、装置及终端设备
CN111915409A (zh) 基于物品的物品推荐方法、装置、设备及存储介质
US20150120634A1 (en) Information processing device, information processing method, and program
CN112116168B (zh) 一种用户行为的预测方法、装置及电子设备
CN111382605A (zh) 视频内容审核方法、装置、存储介质和计算机设备
CN113689258A (zh) 一种商品推荐热度生成方法及系统
CN116028870A (zh) 一种数据检测的方法、装置、电子设备及存储介质
CN110166836B (zh) 一种电视节目切换方法、装置、可读存储介质及终端设备
CN112307231A (zh) 信息处理、模型训练、特征库创建方法及电子设备
CN110413881A (zh) 一种识别标签准确性的方法、装置、网络设备和存储介质
CN116471449B (zh) 基于大数据分析的直播行为检测方法
US20230230378A1 (en) Method and system for selecting highlight segments
CN117668373A (zh) 一种级联标签推荐方法、装置、电子设备及存储介质
CN116304356B (zh) 一种基于aigc的景区多场景内容创作及应用系统
CN116703503A (zh) 一种校园食堂菜品智能推荐方法及系统
JP5469876B2 (ja) 行動予測装置及びプログラム
CN114359783A (zh) 一种异常事件检测方法、装置及设备
CN110487016B (zh) 一种向智能冰箱进行信息精准推送的方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant