CN114969558A - 一种基于用户行为习惯分析的用户画像生成方法和系统 - Google Patents

一种基于用户行为习惯分析的用户画像生成方法和系统 Download PDF

Info

Publication number
CN114969558A
CN114969558A CN202210924786.0A CN202210924786A CN114969558A CN 114969558 A CN114969558 A CN 114969558A CN 202210924786 A CN202210924786 A CN 202210924786A CN 114969558 A CN114969558 A CN 114969558A
Authority
CN
China
Prior art keywords
user
behavior
browsing
time
effective
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210924786.0A
Other languages
English (en)
Other versions
CN114969558B (zh
Inventor
许建兵
费维进
李军
戴磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Suncn Pap Information Technology Co ltd
Original Assignee
Anhui Suncn Pap Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Suncn Pap Information Technology Co ltd filed Critical Anhui Suncn Pap Information Technology Co ltd
Priority to CN202210924786.0A priority Critical patent/CN114969558B/zh
Publication of CN114969558A publication Critical patent/CN114969558A/zh
Application granted granted Critical
Publication of CN114969558B publication Critical patent/CN114969558B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于用户行为习惯分析的用户画像生成方法和系统,包括:对用户的历史浏览行为记录进行数据挖掘,生成有效浏览时长;根据有效浏览时长,确定并存储有效浏览行为记录;根据存储的有效浏览行为记录分析用户浏览习惯,根据用户浏览习惯更新用户的文档兴趣度评分函数和有效浏览行为记录的兴趣度;根据更新后的文档兴趣度评分函数和有效浏览行为记录的兴趣度,生成用户行为画像。能够适配不同用户阅读习惯、依据不同时段进行行为画像的自动生成。

Description

一种基于用户行为习惯分析的用户画像生成方法和系统
技术领域
本发明涉及互联网技术领域,尤其涉及一种基于用户行为习惯分析的用户画像生成方法和系统。
背景技术
用户画像的生成及更新是新闻推送系统中的一个核心点,往往能够左右最终的推送效果。现在常用的用户画像生成方式是通过统计用户历史新闻浏览记录,并结合对应的浏览时长给予不同的权重得分以得到用户的新闻浏览兴趣取向,并依据该取向进行用户的新闻信息推送。但依据浏览时长给予不同权重的过程中,仅仅使用了预设的处理方式进行权重的处理,并没有考虑到个体之间的差异性(即不同用户的浏览习惯,有些用户浏览时间明显偏长,而有些用户明显偏短)。因此,在处理部分浏览习惯不符合预设的用户时,存在较大的偏差。
现有技术中,当前网络中所包含的主要新闻内容均有其不同的领域分类。而常见的用户画像生成方式均基于用户历史浏览记录的挖掘,如图1所示,通过对历史记录进行数据挖掘,分析确定每次浏览内容的标签、时长、操作频率、浏览类别等新闻特征确定该用户的浏览兴趣取向,并依据浏览时长给予兴趣度评分。在挖掘浏览时长的过程中,通常会人为设定一个时间--兴趣度关联函数,用于计算并赋予不同浏览时长下用户对于文档的兴趣度指标,且该指标往往取值在0到1之间。通过这种兴趣度取向的定量分析可以更精确的统计出用户对于不同内容的兴趣程度,并使得后续的内容推送更加符合用户的喜好。
然而这种统计的方式在计算过程中过于依赖预先设定的时间--兴趣度关联函数,如最简单的线性归一化函数,如下:
Figure 982434DEST_PATH_IMAGE001
其中,score表示时间--兴趣度关联函数,x表示用户浏览阅读时长,max表示最大阅读时长,min表示最小阅读时长。
通过设定的最大、最小阅读时长(超过则按照最大时长算、不足同理)将用户对文档的阅读时长缩放至0-1之间的缩放值,并依据该缩放值作为用户的阅读兴趣程度。
这种方法的思想是基于用户在常规阅读过程中,对于感兴趣的内容常常会更加仔细的阅读,因此也就有更长的阅读时间。而考虑到新闻的内容通常不会太长,且为了排除用户的异常行为记录(如误点、挂机等行为)通常会设定一个最大阅读时长max和最小阅读时长min。如果用户的实际阅读时长多于最大值则按照最大值进行计算,同理最小值也一样,如果用户的实际阅读时长少于最小值则按照最小值进行计算。
这种方式虽然可以将用户的阅读时长有效缩放至0-1并具有评分的效果,但是该方法存在以下3个缺陷:
1、忽略了不同用户本身存在的阅读习惯差异,例如两个不同的用户,一个阅读很快而另一个很慢,则通过该方式所计算出的用户阅读兴趣评分会分别过大和过小,且评分间的差异度较小。因此也就无法准确、有效的体现出对应用户的真实阅读兴趣取向情况。
2、该评分函数是线性函数,即单位阅读时间的变化所导致的评分变化是固定的。而实际情况下,用户所点击浏览的新闻(排除误点的情况),其内容一定是用户所感兴趣的,因此当浏览时长接近min时所得出的评分接近0以及当浏览时长为中间值时的得分0.5均不能合理的体现用户的真实兴趣取向。(这里我认为用户的阅读时长达到平均值或中位数值的情况下已经足够说明用户对于该文章具有较大的兴趣,而不是0.5这个不上不下的数值)。
3、忽略了用户在不同时间段上的阅读取向差异,通常情况下,一天中的几个浏览高峰期可以统计为早晨、中午和睡前。而在不同的时期,用户所处的环境不同,所需要的内容信息可能也会有较大的差异,例如在睡前可能更多偏向于娱乐放送向的内容,而在白天则更为正式倾向于工作。
本发明着手于通过算法自动分析用户的行为习惯特点,并依据该用户的习惯特点进行浏览行为分析。该方法可以智能化的面对不同用户之间的个体差异,并将这种差异对行为的分析影响降到最低。此外,考虑到用户的阅读兴趣可能会受到一天中不同时间段的影响,本发明在用户浏览行为习惯分析中自动针对用户在不同时间段的浏览习惯智能化的生成最贴近用户习惯的用户行为画像。
发明内容
本发明目的在于提供一种基于用户行为习惯分析的用户画像生成方法和系统,为解决不同用户习惯对于时间--兴趣度关联函数效果影响的问题,能够适配不同用户阅读习惯、依据不同时段进行行为画像的自动生成。
为实现上述目的,本发明提供一种基于用户行为习惯分析的用户画像生成方法,包括以下步骤:
对用户的历史浏览行为记录进行数据挖掘,生成有效浏览时长;
根据有效浏览时长,确定并存储有效浏览行为记录;
根据存储的有效浏览行为记录分析用户浏览习惯,并更新获得有效浏览行为记录的兴趣度;
根据更新后的有效浏览行为记录的兴趣度,生成用户行为画像。
进一步的,对用户的历史浏览行为记录进行数据挖掘,生成有效浏览时长,包括,
提取用户每次浏览不同文档所对应的历史浏览行为记录,按照时间进行排序,并进行有效记录挖掘和统计浏览时长,生成有效浏览时长;
进一步的,所述生成有效浏览时长包括,
遍历计算相邻两个历史浏览行为记录之间的时间间隔,将所有的时间间隔相加作为浏览时长;
根据历史浏览行为记录的时间长度,对所述浏览时长进行判定是否为无效的浏览时长,去除无效的浏览时长对应的历史浏览行为记录,剩下的历史浏览行为记录为所对应的浏览时长为有效浏览时长。
进一步的,所述根据历史浏览行为记录的时间长度进行判定是否为无效的浏览时长,去除无效的浏览时长对应的历史浏览行为记录,包括,
若文档整体的打开至关闭时间不超过第一预定时间,则将整个文档的历史浏览行为记录作废去除;
若文档的两个相邻操作的时间间隔超过第二预定时间,则所述两个相邻操作所在的时间段的历史浏览行为记录不参与最终的有效浏览时长统计。
进一步的,所述根据有效浏览时长,确定并存储有效浏览行为记录,包括,
有效浏览行为记录的存储内容包括浏览文档的ID、浏览文档的主题、有效浏览时长及文档兴趣度评分函数;
存储有效浏览行为记录时,按照预定时间间隔视为一个时区,将有效浏览行为记录按不同时区进行保存,并更新有效浏览行为记录;
根据更新后的有效浏览行为记录,更新获取用户的集中使用时间区段,以便更新后续的用户浏览行为习惯分析及用户行为画像的生成。
进一步的,根据更新后的有效浏览行为记录,更新获取用户的集中使用时间区段,包括,
计算出用户各个时区及其相邻时区中的有效浏览行为记录在所有时区中有效浏览行为记录的总数量占比,并记录为各个时区的统计值,并对各个时区的统计值结果进行排序;
将排序结果中相邻的时区进行合并,获得合并统计值
在合并统计值中,对超过所有有效浏览行为记录总数量20%的合并统计值所对应的时区进行记录,并作为用户习惯阅读时间点进行保存。
进一步的,若所述合并统计值包含的时区长度跨度大于5个时区,则选择其中有效浏览行为记录统计值最多的连续5个时区作为合并统计值;其中,
若所述连续5个时区的区间内阅读时间占比不小于30%,则认为所述连续5个时区所在的时间段为用户习惯阅读时间点。
进一步的,根据存储的有效浏览行为记录分析用户浏览习惯,获得有效浏览行为记录的兴趣度,包括,
基于有效浏览行为记录,选取15%的分位数和85%的分位数作为更新参数;
根据所述更新参数,获得兴趣度评分函数;
根据所述兴趣度评分函数,更新并存储用户的所有有效浏览行为记录的兴趣度。
进一步的,所述获得兴趣度评分函数为:
Figure 448050DEST_PATH_IMAGE002
其中,f(x)表示兴趣度评分函数,x为分位数,Q1表示15%的分位数,Q2表示85%的分位数。
获得所述有效浏览行为记录的兴趣度为:
Figure 972572DEST_PATH_IMAGE003
其中,Score表示有效浏览行为记录的兴趣度。
进一步的,根据更新后的有效浏览行为记录的兴趣度,生成用户行为画像,包括,
基于用户习惯阅读时间点,根据用户有效浏览行为记录的兴趣度,获得用户有效浏览行为记录中不同主题下,对应主题的所有文档的兴趣度得分总和;
并根据所述兴趣度得分总和,获得对应主题的所有文档的兴趣得分总和在所有主题文档下的概率,生成符合当前时间点的用户行为画像。
进一步的,判断所述用户习惯阅读时间点包括,
确定用户信息推送的时间点,判断所述时间点所在的时间段是否为用户习惯阅读时间点;其中,
确定用户信息推送的时间点,并统计该时间点所在时区及相邻4个时区内是否存在超过预定数量的历史浏览记录,即判定该时间点所在的时间段是否为用户习惯阅读时间点,其中,
若该时间点所在的时间段的历史浏览记录中,有效浏览行为记录的统计值超过所有有效浏览行为记录总数量的10%,则判定认为该时间点所在的时间段为用户习惯阅读时间点,根据用户习惯阅读时间点的浏览数据,生成符合当前时间点的用户行为画像;
若该时间点所在的时间段的历史浏览记录中,有效浏览行为记录的统计值未超过所有有效浏览行为记录总数量的10%,查找该时间点所在时区最近的用户习惯阅读时间点的时区,作为该时间点所在的时间段的用户习惯阅读时间点,并生成符合当前时间点的用户行为画像。
进一步的,通过下式获得所述对应主题的所有文档的兴趣度得分总和,包括:
Figure 5863DEST_PATH_IMAGE004
其中,S t 表示对应主题下所有文档的兴趣度得分总和,Score doc 表示第doc个文档的兴趣度分值。
进一步的,通过下式获得对应主题的所有文档的兴趣得分总和在所有主题文档下的概率,包括:
Figure 24766DEST_PATH_IMAGE005
其中,
Figure 282572DEST_PATH_IMAGE006
表示用户对topic主题文档感兴趣的概率,
Figure 243575DEST_PATH_IMAGE007
表示所有主题文档的 兴趣度总得分,Si表示第i个主题的兴趣度得分,
Figure 157304DEST_PATH_IMAGE008
表示对应主题的所有文档的兴趣度得分 总和。
本发明还提供一种基于用户行为习惯分析的用户画像生成系统,包括用户记录挖掘模块、用户记录管理模块、行为习惯分析模块和行为画像生成模块,
所述用户记录挖掘模块,用于对用户的历史浏览行为记录进行数据挖掘,生成有效浏览时长记录发送至所述用户记录管理模块;
所述用户记录管理模块,用于通过有效浏览时长,确定并存储有效浏览行为记录;
所述行为习惯分析模块,用于对所述用户记录管理模块中存储的有效浏览行为记录进行读取并分析用户浏览习惯,更新获得有效浏览行为记录的兴趣度,并存储于所述用户记录管理模块中;
所述行为画像生成模块,用于根据所述用户记录管理模块中更新后的有效浏览行为记录的兴趣度,生成用户行为画像。
进一步的,所述用户记录挖掘模块,用于对用户的历史浏览行为记录进行数据挖掘,生成有效浏览时长发送至所述用户记录管理模块,包括,
所述用户记录挖掘模块提取用户每次浏览不同文档所对应的历史浏览行为记录,按照时间进行排序,并进行有效记录的挖掘和统计浏览时长,生成有效浏览时长;
其中,提取用户每次浏览不同文档所对应的历史浏览行为记录,作为提取用户单次浏览一篇文档的历史浏览行为记录。
进一步的,所述生成有效浏览时长包括,
所述用户记录挖掘模块遍历计算相邻两个历史浏览行为记录之间的时间间隔,将所有的时间间隔相加作为浏览时长;
所述用户记录挖掘模块通过历史浏览行为记录的时间长度,对所述浏览时长进行判定是否为无效的浏览时长,去除无效的浏览时长对应的历史浏览行为记录,剩下的历史浏览行为记录为所对应的浏览时长为有效浏览时长。
进一步的,所述用户记录管理模块,用于通过有效浏览时长,确定并存储有效浏览行为记录,包括,
所述用户记录管理模块存储的有效浏览行为记录的内容包括浏览文档的ID、浏览文档的主题、有效浏览时长及文档兴趣度评分函数;
所述用户记录管理模块存储有效浏览行为记录时,按照预定时间间隔视为一个时区对浏览行为记录按不同时区进行保存,并更新有效浏览行为记录;
所述用户记录管理模块,根据更新后的有效浏览行为记录更新获取用户的集中使用时间区段。
进一步的,所述行为习惯分析模块用于对所述用户记录管理模块中存储的有效浏览行为记录进行读取并分析用户浏览习惯,更新获得有效浏览行为记录的兴趣度,并存储于所述用户记录管理模块中,包括,
所述行为习惯分析模块根据有效浏览行为长记录,选取15%的分位数和85%的分位数作为更新参数;
所述行为习惯分析模块根据所述更新参数获得兴趣度评分函数;
所述行为习惯分析模块还根据获得的兴趣度评分函数,更新用户的所有有效浏览行为记录的兴趣度,并存储于所述用户记录管理模块中。
进一步的,所述行为画像生成模块,用于根据所述用户记录管理模块中更新后的有效浏览行为记录的兴趣度,生成用户行为画像,包括,
所述行为画像生成模块基于用户习惯阅读时间点,根据用户有效浏览行为记录的兴趣度,获得用户有效浏览行为记录中不同主题下,对应主题的所有文档的兴趣度得分总和;
所述行为画像生成模块根据所述兴趣度得分总和,获得对应主题的所有文档的兴趣得分总和在所有主题文档下的概率,生成符合当前时间点的用户行为画像,以用于后续信息推送。
进一步的,判断所述用户习惯阅读时间点,包括,
所述行为画像生成模块确定用户信息推送的时间点,判断所述时间点所在的时间段是否为用户习惯阅读时间点;其中,
所述行为画像生成模块确定用户信息推送的时间点,统计该时间点所在时区及相邻4个时区内是否存在超过预定数量的历史浏览记录,即判定该时间点所在的时间段是否为用户习惯阅读时间点,其中,
若该时间点所在的时间段的历史浏览记录中,有效浏览行为记录的统计值超过所有有效浏览行为记录总数量的10%,则判定该时间点所在的时间段为用户习惯阅读时间点,根据用户习惯阅读时间点的浏览数据生成,生成符合当前时间点的用户行为画像;
若该时间点所在的时间段的历史浏览记录中,有效浏览行为记录的统计值未超过所有有效浏览行为记录总数量的10%,则查找该时间点所在时区最近的用户习惯阅读时间点的时区,作为该时间点所在的时间段的用户习惯阅读时间点,并生成符合当前时间点的用户行为画像。
本发明的技术效果和优点:1、适用于新闻推送场景下,针对不同用户浏览行为习惯自动更新适配不同用户的个性化兴趣度评分函数,并依据不同的时间段自动选取用户历史记录中符合当前时间段的数据并对应生成当前感兴趣话题的分布情况的用户画像生成流程。本发明适配不同用户阅读习惯的兴趣度评分函数,本发明依据不同时段进行行为画像实时自动生成的过程。
2、考虑了不同用户阅读习惯的影响,针对用户的行为习惯个性化的更新对应的归一化函数,避免了因为不同习惯所带来的计算偏差。使用的非线性函数作为评分函数,该函数在Q1(15%的分位数)时的取值为0.1而在阅读时间为中位数附近时的结果为0.7左右,能够更合理的体现出用户的兴趣程度;在不同的时间段,自动检索该时间段附近的历史记录并依据该记录生成对应该时段的行为画像,解决了用户在不同时段阅读倾向存在不一致的问题。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术方法的流程图;
图2为本发明实施例中一种基于用户行为习惯分析的用户画像生成方法的流程图;
图3为本发明实施例中一种基于用户行为习惯分析的用户画像生成方法的时区统计示意图;
图4为本发明实施例中一种基于用户行为习惯分析的用户画像生成系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为解决现有技术的不足,本发明通过了一种基于用户行为习惯分析的用户画像生成方法,如图2所示,包括以下步骤:
对用户的历史浏览行为记录进行数据挖掘,生成有效浏览时长。
具体为,提取用户每次浏览不同文档所对应的历史浏览行为记录,按照时间进行排序,并进行有效记录挖掘和统计浏览时长,生成有效浏览时长。其中,历史浏览行为记录包括用户记录中每次浏览行为中所产生的不同行为数据,包括打开、关闭文档,鼠标点击、移动、滚轮以及屏幕翻动等操作;提取用户每次浏览不同文档所对应的行为记录,表示提取用户单次浏览的每一篇文档的行为记录。
通过遍历计算相邻两个历史浏览行为记录之间的时间间隔,将所有的时间间隔相加作为浏览时长;考虑到实际阅读时会有挂机或是误点的情况出现,因此需要判定历史浏览行为记录的时间长度。对历史浏览行为记录的时间长度进行判定是否为无效的浏览时长的记录,将无效的浏览时长对应的历史浏览行为记录进行作废去除,统计剩下的历史浏览行为记录为所对应的浏览时长为有效浏览时长。
当出现以下情况时对该片段或该浏览记录进行弃用:
若文档整体的打开至关闭时间过短不超过第一预定时间,则认定该浏览行为是误点,此时将整个文档的历史浏览记录作废去除;若文档的两个相邻操作的时间间隔过长超过第二预定时间,则认为文档的这两个相邻操作所在的时间段内用户可能处于挂机状态,此时该时间段的历史浏览行为记录不参与最终的有效浏览时长统计;其中,示例性地,第一预定时间为10秒、第二预定时间为两分钟,但是并非仅仅限于这个具体的时间。
根据有效浏览时长,确定并存储有效浏览行为记录。
具体为,记录各个用户数据挖掘后的有效浏览行为记录,有效行为浏览记录的存储内容包括浏览文档的ID、浏览文档的主题、有效浏览时长及文档兴趣度评分函数;以便于后续的用户浏览行为习惯分析及用户行为画像的生成更新。
此外,为便于后续不同时间段下的用户画像统计,存储有效浏览行为记录时,按照30分钟的时间间隔视为一个时区,将有效浏览行为记录按不同时区进行保存,即1:00-1:30之内的数据和1:30-2:00的数据分为不同的时区进行保存记录,并更新有效浏览行为记录;
根据更新后的有效浏览行为记录,更新获取用户的集中使用时间区段。
具体为,如图3所示,按照预定时间(可以为30分钟,但不限于)间隔视为一个时区,例如图3中12:30-1:00、1:00-1:30、1:30-2:00、2:00-2:30分别都为1个时区;设1:00-1:30这个时区为时区1,设1:30-2:00这个时区为时区2,设2:00-2:30这个时区为时区3。统计用户在时区1及其相邻的时区中的有效浏览行为记录记录在所有时区中有效浏览行为记录的总数量占比,并记录为时区1的统计值,其中时区1的统计值包含了12:30-1:00、时区1(1:00-1:30)和时区2(1:30-2:00)的浏览行为记录。统计时区2及其相邻的时区中的浏览行为记录在所有时区中有效浏览行为记录的总数量占比,并记录为时区2的统计值,其中时区2(1:30-2:00)的统计值包含了时区1(1:00-1:30)、时区2(1:30-2:00)和时区3(2:00-2:30)的浏览行为记录。
依照上述例子,对应更新计算出用户各个时区及其相邻时区中所有浏览行为记录在所有时区中有效浏览行为记录的总数量占比(每一天的时区共计48个),记录为对应的各个时区的统计值,并对各个时区的统计值结果按照时间顺序进行排序。
将排序结果中相邻的时区进行合并为1个时区,获得合并统计值。其中合并统计值包含这1个时区及其相邻时区的有效浏览行为记录;例如排序结果若为...时区2,时区3,...此时将时区2和时区3进行合并,即合并统计值包含了时区1至时区4这4个时区的有效浏览行为记录。在合并统计值结果中,对超过所有时区的所有有效浏览行为记录总数量的20%的合并统计值所对应的时区进行记录,并作为用户的习惯阅读时间点进行保存。
若合并统计值的结果包含的时区长度跨度大于5个时区,则选择其中有效浏览行为记录统计值最多的连续5个时区作为最终的合并统计值;其中,若在连续5个时区的区间内的阅读时间占比不小于30%,则认为该时间段内用户存在阅读习惯,即认为这连续5个时区所在的时间段为用户习惯阅读时间点。
根据存储的有效浏览行为记录分析用户浏览习惯,根据用户浏览习惯更新获得有效浏览行为记录的兴趣度。
具体为,基于有效浏览行为记录,并选取15%的分位数和85%的分位数作为兴趣度评分函数的更新参数,并根据更新参数获得兴趣度评分函数。其中,选择15%和85%的作为参数是考虑到即便是对用户的历史浏览行为记录经过数据挖掘后,用户的行为记录中难免仍会有部分极端、异常情况出现。而选取15%~85%这段区间既可以充分有效的获取用户的主要阅读习惯,也能够有效的避免排除这种异常情况的影响。
通过下式得到兴趣度评分函数:
Figure 963586DEST_PATH_IMAGE009
其中,f(x)表示兴趣度评分函数,x为分位数,Q1表示15%的分位数,Q2表示85%的分位数。
根据更新后的用户兴趣度评分函数,更新用户的所有有效浏览行为记录的兴趣度,通过下式获得有效浏览行为记录的兴趣度:
Figure 341478DEST_PATH_IMAGE010
其中,Score表示有效浏览行为记录的兴趣度,f(x)表示兴趣度评分函数。
根据更新后的有效浏览行为记录的兴趣度,生成符合当前时间点的用户行为画像,作为信息推送依据。
具体为,确定用户信息推荐时需要推送的时间点,判断该时间点所在的时间段是否为用户习惯阅读时间点;其中,
确定用户信息推荐时需要推送的时间点,并统计该时间点所在时区及相邻4个时区内是否存在大量超过预定数量的历史浏览记录,即判定该时间点所在的时间段是否为用户习惯阅读时间点;例如8:10时,则统计自身所在时区(8:00-8:30)和附近4个时区,综合即是7:00-9:30这5个时区内的历史浏览记录;
其中,若该时间点所在的时间段的历史浏览记录中,有效浏览行为记录的统计值超过所有有效浏览行为记录总数量的10%,则判定该时间点所在的时间段为用户习惯阅读时间点;
若该时间点所在的时间段的历史浏览记录中,有效浏览行为记录的统计值未超过所有有效浏览行为记录总数量的10%,则查找该时间点所在时区最近的用户习惯阅读时间点的时区,作为该时间点所在的时间段的用户习惯阅读时间点。
基于用户习惯阅读时间点,根据用户有效浏览行为记录的兴趣度,获得用户有效浏览行为记录中不同主题下,对应主题的所有文档的兴趣度得分总和;其中,
通过下式获得对应主题下用户的所有文档的兴趣度得分总和:
Figure 955605DEST_PATH_IMAGE011
其中,S t 表示对应主题下所有文档的兴趣度得分总和,Score doc 表示第doc个文档的兴趣度分值。
然后根据对应主题下用户的所有文档的兴趣度得分总和,获得该主题的所有文档兴趣度得分总和在所有主题得所有文档下的概率,即最终获得用户对不同主题文档的兴趣度得分,生成符合该时间点的用户行为画像,用于后续信息推送。
其中,通过下式获得该主题的所有文档的兴趣得分总和在所有主题文档下的概率:
Figure 481264DEST_PATH_IMAGE012
其中,
Figure 294500DEST_PATH_IMAGE013
表示用户对topic主题文档感兴趣的概率,
Figure 323636DEST_PATH_IMAGE014
表示所有主题文档 的兴趣度总得分,Si表示第i个主题文档的兴趣度得分,
Figure 892020DEST_PATH_IMAGE015
表示对应topic主题的所有文档 的兴趣度得分总和。
本发明还提供了一种基于用户行为习惯分析的用户画像生成系统,如图4所示,包括用户记录挖掘模块、用户记录管理模块、行为习惯分析模块和行为画像生成模块,
用户记录挖掘模块,用于对用户的历史浏览行为记录进行数据挖掘,生成有效浏览行为记录发送至用户记录管理模块。
具体为,用户记录挖掘模块对用户每次浏览不同文档所对应的行为记录进行提取,按照时间顺序进行排序,并进行有效记录挖掘和统计浏览时长,生成有效浏览时长。
其中,浏览行为记录包括用户记录中每次浏览行为中所产生的不同行为数据,包括打开、关闭文档,鼠标点击、移动、滚轮以及屏幕翻动等操作;提取用户每次浏览不同文档所对应的历史浏览行为记录,表示提取用户单次浏览一篇文档的历史浏览行为记录。
用户记录挖掘模块通过遍历计算相邻两个历史浏览行为记录之间的时间间隔,将所有的时间间隔相加作为浏览时长;考虑到实际阅读时会有挂机或是误点的情况出现,因此需要判定历史浏览行为记录的时间长度。用户记录挖掘模块通过历史浏览行为记录的时间长度,对历史浏览行为记录的浏览时长进行判定是否为无效的浏览时长,将无效的浏览时长和无效浏览时长所对应的浏览行为进行作废去除,统计剩下的的历史浏览行为记录所对应的浏览时长为有效浏览时长。
用户记录管理模块,用于通过有效浏览时长,确定并存储有效浏览行为记录。
具体为,用户记录管理模块用于记录各个用户数据挖掘后的有效浏览行为记录,用户记录管理模块存储的内容包括浏览文档的ID、浏览文档的主题、有效浏览时长及文档兴趣度评分函数;以便于后续的用户浏览行为习惯分析及浏览行为画像的生成更新。
此外,为便于后续不同时间段下的用户画像统计,用户记录管理模块存储有效浏览行为记录时,按照预定时间(例如可以为30分钟,但不限于)间隔视为一个时区,将有效浏览行为记录按不同时区进行保存,即1:00-1:30之内的数据和1:30-2:00的数据分为不同的时区进行保存记录,并更新存储有效浏览行为记录;用户记录管理模块根据更新后的有效浏览行为记录,更新获取用户的集中使用时间区段。
行为习惯分析模块,用于对用户记录管理模块中存储的有效浏览行为记录进行读取并分析用户浏览习惯,行为习惯分析模块还用于根据用户浏览习惯,更新获得有效浏览行为记录的兴趣度,并存储于用户记录管理模块中。
具体为,行为习惯分析模块用于根据用户记录挖掘模块中用户对应的有效浏览时长所对应的有效浏览行为记录,选取15%的分位数和85%的分位数作为兴趣度评分函数的更新参数,根据更新参数获得兴趣度评分函数。其中,选择15%和85%的作为参数是考虑到即便是经过用户记录挖掘模块挖掘后,用户的行为记录中难免仍会有部分极端、异常情况出现。而选取15%~85%这段区间既可以充分有效的获取用户的主要阅读习惯,也能够有效的避免排除这种异常情况的影响。行为习惯分析模块根据更新后的用户兴趣评分函数,更新该用户的所有有效浏览行为记录的兴趣度,并存储于用户记录挖掘模块中。
行为画像生成模块,用于负责触发用户信息推荐时,通过用户记录管理模块中更新后的有效浏览行为记录的兴趣度,智能生成符合当前时间点用户浏览习惯的行为画像结果作为信息推送依据。
具体为,行为画像生成模块用于确定用户信息推荐时需要推送的时间点,判断该时间点所在的时间段是否为用户习惯阅读时间点。
行为画像生成模块用于确定用户信息推荐时需要推送的时间点,并统计该时间点所在时区及相邻4个时区内是否存在大量历史浏览记录,即判定该时间点所在的时间段是否为用户习惯阅读时间点;例如8:10时,则统计自身所在时区(8:00-8:30)和附近4个时区,综合一起即是7:00-9:30这5个时间段内的历史浏览记录;
若该时间点所在的时间段的历史浏览记录中,有效浏览行为记录统计值超过所有有效浏览行为记录总数量的10%,则判定该时间点所在的时间段为用户习惯阅读时间点。
若该时间点所在的时间段的历史浏览记录中,有效浏览行为记录统计值未超过所有有效浏览行为记录总数量的10%,则查找该时间点所在时区最近的用户习惯阅读时间点的时区,作为该时间点所在的时间段的用户习惯阅读时间点。
行为画像生成模块基于用户习惯阅读时间点,根据用户有效浏览行为记录的兴趣度,获得用户有效浏览行为记录中不同主题下,对应主题的所有文档的兴趣度得分总和;所述行为画像生成模块根据所述兴趣度得分总和,获得对应主题的所有文档的兴趣得分总和在所有主题文档下的概率,生成符合当前时间点的用户浏览习惯的行为画像结果,以用于后续信息推送。
关于上述实施例中的系统,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (20)

1.一种基于用户行为习惯分析的用户画像生成方法,其特征在于,包括以下步骤:
对用户的历史浏览行为记录进行数据挖掘,生成有效浏览时长;
根据有效浏览时长,确定并存储有效浏览行为记录;
根据存储的有效浏览行为记录分析用户浏览习惯,并更新获得有效浏览行为记录的兴趣度;
根据更新后的有效浏览行为记录的兴趣度,生成用户行为画像。
2.根据权利要求1所述的一种基于用户行为习惯分析的用户画像生成方法,其特征在于,对用户的历史浏览行为记录进行数据挖掘,生成有效浏览时长,包括,
提取用户每次浏览不同文档所对应的历史浏览行为记录,按照时间进行排序,并进行有效记录挖掘和统计浏览时长,生成有效浏览时长。
3.根据权利要求2所述的一种基于用户行为习惯分析的用户画像生成方法,其特征在于,所述生成有效浏览时长包括,
遍历计算相邻两个历史浏览行为记录之间的时间间隔,将所有的时间间隔相加作为浏览时长;
根据历史浏览行为记录的时间长度,对所述浏览时长进行判定是否为无效的浏览时长,去除无效的浏览时长对应的历史浏览行为记录,剩下的历史浏览行为记录为所对应的浏览时长为有效浏览时长。
4.根据权利要求3所述的一种基于用户行为习惯分析的用户画像生成方法,其特征在于,所述根据历史浏览行为记录的时间长度进行判定是否为无效的浏览时长,去除无效的浏览时长对应的历史浏览行为记录,包括,
若文档整体的打开至关闭时间不超过第一预定时间,则将整个文档的历史浏览行为记录作废去除;
若文档的两个相邻操作的时间间隔超过第二预定时间,则所述两个相邻操作所在的时间段的历史浏览行为记录不参与最终的有效浏览时长统计。
5.根据权利要求1或4所述的一种基于用户行为习惯分析的用户画像生成方法,其特征在于,所述根据有效浏览时长,确定并存储有效浏览行为记录,包括,
有效浏览行为记录的存储内容包括浏览文档的ID、浏览文档的主题、有效浏览时长及文档兴趣度评分函数;
存储有效浏览行为记录时,按照预定时间间隔视为一个时区,将有效浏览行为记录按不同时区进行保存,并更新有效浏览行为记录;
根据更新后的有效浏览行为记录,更新获取用户的集中使用时间区段,以便更新后续的用户浏览行为习惯分析及用户行为画像的生成。
6.根据权利要求5所述的一种基于用户行为习惯分析的用户画像生成方法,其特征在于,根据更新后的有效浏览行为记录,更新获取用户的集中使用时间区段,包括,
计算出用户各个时区及其相邻时区中的有效浏览行为记录在所有时区中有效浏览行为记录的总数量占比,并记录为各个时区的统计值,并对各个时区的统计值进行排序;
将排序结果中相邻的时区进行合并,获得合并统计值;
在合并统计值中,对超过所有有效浏览行为记录总数量20%的合并统计值所对应的时区进行记录,并作为用户习惯阅读时间点进行保存。
7.根据权利要求6所述的一种基于用户行为习惯分析的用户画像生成方法,其特征在于,
若所述合并统计值包含的时区长度跨度大于5个时区,则选择其中有效浏览行为记录统计值最多的连续5个时区作为合并统计值;其中,
若所述连续5个时区的区间内阅读时间占比不小于30%,则认为所述连续5个时区所在的时间段为用户习惯阅读时间点。
8.根据权利要求1所述的一种基于用户行为习惯分析的用户画像生成方法,其特征在于,根据存储的有效浏览行为记录分析用户浏览习惯,获得有效浏览行为记录的兴趣度,包括,
基于有效浏览行为记录,选取15%的分位数和85%的分位数作为更新参数;
据所述更新参数,获得兴趣度评分函数;
根据所述兴趣度评分函数,更新并存储用户的所有有效浏览行为记录的兴趣度。
9.根据权利要求8所述的一种基于用户行为习惯分析的用户画像生成方法,其特征在于,
所述获得兴趣度评分函数为:
Figure 357739DEST_PATH_IMAGE001
其中,f(x)表示兴趣度评分函数,x为分位数,Q1表示15%的分位数,Q2表示85%的分位数;
获得所述有效浏览行为记录的兴趣度为:
Figure 540458DEST_PATH_IMAGE002
其中,Score表示有效浏览行为记录的兴趣度。
10.根据权利要求1或9所述的一种基于用户行为习惯分析的用户画像生成方法,其特征在于,根据更新后的有效浏览行为记录的兴趣度,生成用户行为画像,包括,
基于用户习惯阅读时间点,根据用户有效浏览行为记录的兴趣度,获得用户有效浏览行为记录中不同主题下,对应主题的所有文档的兴趣度得分总和;
并根据所述兴趣度得分总和,获得对应主题的所有文档的兴趣得分总和在所有主题文档下的概率,生成符合当前时间点的用户行为画像。
11.根据权利要求10所述的一种基于用户行为习惯分析的用户画像生成方法,其特征在于,判断所述用户习惯阅读时间点包括,
确定用户信息推送的时间点,判断所述时间点所在的时间段是否为用户习惯阅读时间点;其中,
确定用户信息推送的时间点,并统计该时间点所在时区及相邻4个时区内是否存在超过预定数量的历史浏览记录,即判定该时间点所在的时间段是否为用户习惯阅读时间点,其中,
若该时间点所在的时间段的历史浏览记录中,有效浏览行为记录的统计值超过所有有效浏览行为记录总数量的10%,则判定认为该时间点所在的时间段为用户习惯阅读时间点,根据用户习惯阅读时间点的浏览数据,生成符合当前时间点的用户行为画像;
若该时间点所在的时间段的历史浏览记录中,有效浏览行为记录的统计值未超过所有有效浏览行为记录总数量的10%,查找该时间点所在时区最近的用户习惯阅读时间点的时区,作为该时间点所在的时间段的用户习惯阅读时间点,并生成符合当前时间点的用户浏览习惯的行为画像结果。
12.根据权利要求10所述的一种基于用户行为习惯分析的用户画像生成方法,其特征在于,
通过下式获得所述对应主题的所有文档的兴趣度得分总和,包括:
Figure 336507DEST_PATH_IMAGE003
其中,S t 表示对应主题下所有文档的兴趣度得分总和,Score doc 表示第doc个文档的兴趣度分值。
13.根据权利要求10所述的一种基于用户行为习惯分析的用户画像生成方法,其特征在于,
通过下式获得所述对应主题的所有文档的兴趣得分总和在所有主题文档下的概率,包括:
Figure 262875DEST_PATH_IMAGE004
其中,
Figure 342826DEST_PATH_IMAGE005
表示用户对topic主题文档感兴趣的概率,
Figure 430868DEST_PATH_IMAGE006
表示所有主题文档的兴趣 度总得分,S i 表示第i个主题文档的兴趣度得分,
Figure 229060DEST_PATH_IMAGE007
表示对应主题的所有文档的兴趣度得分 总和。
14.一种基于用户行为习惯分析的用户画像生成系统,其特征在于,包括用户记录挖掘模块、用户记录管理模块、行为习惯分析模块和行为画像生成模块,
所述用户记录挖掘模块,用于对用户的历史浏览行为记录进行数据挖掘,生成有效浏览时长发送至所述用户记录管理模块;
所述用户记录管理模块,用于通过有效浏览时长,确定并存储有效浏览行为记录;
所述行为习惯分析模块,用于对所述用户记录管理模块中存储的有效浏览行为记录进行读取并分析用户浏览习惯,更新获得有效浏览行为记录的兴趣度,并存储于所述用户记录管理模块中;
所述行为画像生成模块,用于根据所述用户记录管理模块中更新后的有效浏览行为记录的兴趣度,生成用户行为画像。
15.根据权利要求14所述的一种基于用户行为习惯分析的用户画像生成系统,其特征在于,所述用户记录挖掘模块,用于对用户的历史浏览行为记录进行数据挖掘,生成有效浏览时长发送至所述用户记录管理模块,包括,
所述用户记录挖掘模块提取用户每次浏览不同文档所对应的历史浏览行为记录,按照时间进行排序,并进行有效记录的挖掘和统计浏览时长,生成有效浏览时长。
16.根据权利要求14所述的一种基于用户行为习惯分析的用户画像生成系统,其特征在于,所述生成有效浏览时长,包括,
所述用户记录挖掘模块遍历计算相邻两个历史浏览行为记录之间的时间间隔,将所有的时间间隔相加作为浏览时长;
所述用户记录挖掘模块通过历史浏览行为记录的时间长度,对所述浏览时长进行判定是否为无效的浏览时长,去除无效的浏览时长对应的历史浏览行为记录,剩下的浏览时长为有效浏览时长。
17.根据权利要求14或16所述的一种基于用户行为习惯分析的用户画像生成系统,其特征在于,所述用户记录管理模块,用于通过有效浏览时长,确定并存储有效浏览行为记录,包括,
所述用户记录管理模块存储的有效浏览行为记录的内容包括浏览文档的ID、浏览文档的主题、有效浏览时长及文档兴趣度评分函数;
所述用户记录管理模块存储有效浏览行为记录时,按照预定时间间隔视为一个时区对浏览行为记录按不同时区进行保存,并更新有效浏览行为记录;
所述用户记录管理模块,根据更新后的有效浏览行为记录更新获取用户的集中使用时间区段。
18.根据权利要求14所述的一种基于用户行为习惯分析的用户画像生成系统,其特征在于,所述行为习惯分析模块用于对所述用户记录管理模块中存储的有效浏览行为记录进行读取并分析用户浏览习惯,更新获得有效浏览行为记录的兴趣度,并存储于所述用户记录管理模块中,包括,
所述行为习惯分析模块根据有效浏览行为记录,选取15%的分位数和85%的分位数作为更新参数;
所述行为习惯分析模块根据所述更新参数获得兴趣度评分函数;
所述行为习惯分析模块还根据获得的兴趣度评分函数,更新用户的所有有效浏览行为记录的兴趣度,并存储于所述用户记录管理模块中。
19.根据权利要求14所述的一种基于用户行为习惯分析的用户画像生成系统,其特征在于,所述行为画像生成模块,用于根据所述用户记录管理模块中更新后的有效浏览行为记录的兴趣度,生成用户行为画像,包括,
所述行为画像生成模块基于用户习惯阅读时间点,根据用户有效浏览行为记录的兴趣度,获得用户有效浏览行为记录中不同主题下,对应主题的所有文档的兴趣度得分总和;
所述行为画像生成模块根据所述兴趣度得分总和,获得对应主题的所有文档的兴趣得分总和在所有主题文档下的概率,生成符合当前时间点的用户行为画像,以用于后续信息推送。
20.根据权利要求19所述的一种基于用户行为习惯分析的用户画像生成系统,其特征在于,判断所述用户习惯阅读时间点,包括,
所述行为画像生成模块确定用户信息推送的时间点,判断所述时间点所在的时间段是否为用户习惯阅读时间点;其中,
所述行为画像生成模块确定用户信息推送的时间点,统计该时间点所在时区及相邻4个时区内是否存在超过预定数量的历史浏览记录,即判定该时间点所在的时间段是否为用户习惯阅读时间点,其中,
若该时间点所在的时间段的历史浏览记录中,有效浏览行为记录的统计值超过所有有效浏览行为记录总数量的10%,则判定该时间点所在的时间段为用户习惯阅读时间点,根据用户习惯阅读时间点的浏览数据,生成符合当前时间点的用户行为画像;
若该时间点所在的时间段的历史浏览记录中,有效浏览行为记录的统计值未超过所有有效浏览行为记录总数量的10%,则查找该时间点所在时区最近的用户习惯阅读时间点的时区,作为该时间点所在的时间段的用户习惯阅读时间点,并生成符合当前时间点的用户行为画像。
CN202210924786.0A 2022-08-03 2022-08-03 一种基于用户行为习惯分析的用户画像生成方法和系统 Active CN114969558B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210924786.0A CN114969558B (zh) 2022-08-03 2022-08-03 一种基于用户行为习惯分析的用户画像生成方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210924786.0A CN114969558B (zh) 2022-08-03 2022-08-03 一种基于用户行为习惯分析的用户画像生成方法和系统

Publications (2)

Publication Number Publication Date
CN114969558A true CN114969558A (zh) 2022-08-30
CN114969558B CN114969558B (zh) 2022-11-08

Family

ID=82968815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210924786.0A Active CN114969558B (zh) 2022-08-03 2022-08-03 一种基于用户行为习惯分析的用户画像生成方法和系统

Country Status (1)

Country Link
CN (1) CN114969558B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001240010A1 (en) * 2000-03-08 2001-11-29 Accenture Global Services Limited Method of manufacture for a knowledge management tool
US20130054628A1 (en) * 2011-08-31 2013-02-28 Comscore, Inc. Data Fusion Using Behavioral Factors
CN104239466A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 向用户推荐项目的方法、装置及设备
CN108154401A (zh) * 2018-01-15 2018-06-12 网易无尾熊(杭州)科技有限公司 用户画像刻画方法、装置、介质和计算设备
CN109543111A (zh) * 2018-11-28 2019-03-29 广州虎牙信息科技有限公司 推荐信息筛选方法、装置、存储介质及服务器
CN111563176A (zh) * 2020-04-30 2020-08-21 杭州哔次元科技有限公司 一种基于惯性大数据的漫画管理系统
CN112182451A (zh) * 2020-09-18 2021-01-05 武汉绿色网络信息服务有限责任公司 网页内容摘要生成方法、设备、存储介质及装置
CN112989209A (zh) * 2021-05-10 2021-06-18 腾讯科技(深圳)有限公司 内容推荐方法、装置和存储介质
CN113487117A (zh) * 2021-08-20 2021-10-08 山东省计算中心(国家超级计算济南中心) 一种基于多维度用户画像的电商用户行为数据模拟的方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2402253C (en) * 2000-03-08 2009-08-11 Accenture Llp Method of manufacture for a knowledge management tool

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001240010A1 (en) * 2000-03-08 2001-11-29 Accenture Global Services Limited Method of manufacture for a knowledge management tool
US20130054628A1 (en) * 2011-08-31 2013-02-28 Comscore, Inc. Data Fusion Using Behavioral Factors
CN104239466A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 向用户推荐项目的方法、装置及设备
CN108154401A (zh) * 2018-01-15 2018-06-12 网易无尾熊(杭州)科技有限公司 用户画像刻画方法、装置、介质和计算设备
CN109543111A (zh) * 2018-11-28 2019-03-29 广州虎牙信息科技有限公司 推荐信息筛选方法、装置、存储介质及服务器
CN111563176A (zh) * 2020-04-30 2020-08-21 杭州哔次元科技有限公司 一种基于惯性大数据的漫画管理系统
CN112182451A (zh) * 2020-09-18 2021-01-05 武汉绿色网络信息服务有限责任公司 网页内容摘要生成方法、设备、存储介质及装置
CN112989209A (zh) * 2021-05-10 2021-06-18 腾讯科技(深圳)有限公司 内容推荐方法、装置和存储介质
CN113487117A (zh) * 2021-08-20 2021-10-08 山东省计算中心(国家超级计算济南中心) 一种基于多维度用户画像的电商用户行为数据模拟的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李明菲等: ""网络问答社区付费咨询答主画像构建研究"", 《文献与数据学报》 *

Also Published As

Publication number Publication date
CN114969558B (zh) 2022-11-08

Similar Documents

Publication Publication Date Title
CN106503014B (zh) 一种实时信息的推荐方法、装置和系统
US7171620B2 (en) System and method for managing document retention of shared documents
US20070220063A1 (en) Event data translation system
CN108874812B (zh) 一种数据处理方法及服务器、计算机存储介质
CN110705288A (zh) 一种基于大数据的舆情分析系统
CN112381578B (zh) 一种基于行为特征识别的互联网广告智能推荐管理系统
CN102890689A (zh) 一种用户兴趣模型的建立方法及系统
CN111125429A (zh) 一种视频推送方法、装置和计算机可读存储介质
CN107832333A (zh) 基于分布式处理和dpi数据构建用户网络数据指纹的方法和系统
CN112330047A (zh) 一种基于用户行为特征的信用卡还款概率预测方法
CN107888602A (zh) 一种检测异常用户的方法及装置
CN112148743A (zh) 智能客服知识库的更新方法、装置、设备及存储介质
CN115577152A (zh) 基于数据分析的在线图书借阅管理系统
CN112016769A (zh) 管理相对人风险预测以及信息推荐方法及装置
CN114969558B (zh) 一种基于用户行为习惯分析的用户画像生成方法和系统
CN116861063B (zh) 一种发掘社媒热搜商业价值度的方法
CN112433993A (zh) 一种基于计算机的网络数据处理分析系统
CN116304351A (zh) 一种基于大数据的智能数据信息统计管理系统及方法
CN116071134A (zh) 一种智能用户体验显示方法、系统和存储介质
CN114417221A (zh) 一种基于互联网的大数据运算系统及其实施方法
CN110134878B (zh) 基于用户偏好与服务变化双向感知的移动服务推荐方法
CN114679490B (zh) 一种基于大数据的资讯消息内容智能推送系统及方法
CN110147491B (zh) 一种引流信息识别方法和装置
CN111026863A (zh) 客户行为预测方法、装置、设备及介质
CN111858733A (zh) 一种基于互联网多源异构数据的政务信息比对方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant