CN110442801B - 一种目标事件的关注用户的确定方法及装置 - Google Patents

一种目标事件的关注用户的确定方法及装置 Download PDF

Info

Publication number
CN110442801B
CN110442801B CN201910684880.1A CN201910684880A CN110442801B CN 110442801 B CN110442801 B CN 110442801B CN 201910684880 A CN201910684880 A CN 201910684880A CN 110442801 B CN110442801 B CN 110442801B
Authority
CN
China
Prior art keywords
user
behavior
behavior dimension
target event
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910684880.1A
Other languages
English (en)
Other versions
CN110442801A (zh
Inventor
赵志伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Security Technologies Co Ltd
Original Assignee
New H3C Security Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Security Technologies Co Ltd filed Critical New H3C Security Technologies Co Ltd
Priority to CN201910684880.1A priority Critical patent/CN110442801B/zh
Publication of CN110442801A publication Critical patent/CN110442801A/zh
Application granted granted Critical
Publication of CN110442801B publication Critical patent/CN110442801B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种目标事件的关注用户的确定方法及装置,涉及互联网技术领域。该方法包括:获取用户在预设的多个行为维度中各行为维度下的行为数据;针对每个行为维度,统计在该行为维度下的行为数据中该行为维度对应的关键字的出现次数,关键字通过目标事件的属性信息确定;根据每个行为维度对应的关键字的出现次数,计算用户对目标事件的关注度;若关注度大于预设阈值,则确定用户为目标事件的关注用户;若关注度不大于预设阈值,则确定用户不为目标事件的关注用户。采用本申请可以提高确定目标事件的关注用户的准确性。

Description

一种目标事件的关注用户的确定方法及装置
技术领域
本申请涉及互联网技术领域,特别是涉及一种目标事件的关注用户的确定方法及装置。
背景技术
社会舆情分析中有一个很重要的课题就是热点事件的感知。很多高校/企业,需要及时、准确的知道关注某些社会热点事件的校内人员/企业人员,从而预防某些特定群体事件的发生。因此,如何确定关注某一热点事件的用户是一项很重要的工作。
目前,在确定某一热点事件(可称为目标事件)的关注用户时,通常预先设定目标事件对应的关键字,然后获取用户所浏览网页的网页标题,计算该网页标题中出现预先设定的关键字的次数,根据该网页标题中出现预先设定的关键字的次数,判断该用户是否为目标事件的关注用户。如果该网页标题中出现预先设定的关键字的次数大于预设阈值,则确定该用户为该热点事件的关注用户。
然而,仅通过用户所浏览网页的网页标题,判断该用户是否为目标事件的关注用户,判断所采用的用户的行为数据较为单一,容易误判,准确性较低。
发明内容
有鉴于此,本申请提供一种目标事件的关注用户的确定方法及装置,可以提高确定目标事件的关注用户的准确性。具体技术方案如下:
第一方面,本申请提供了一种目标事件的关注用户的确定方法,所述方法包括:
获取用户在预设的多个行为维度中各行为维度下的行为数据;
针对每个行为维度,统计在该行为维度下的行为数据中该行为维度对应的关键字的出现次数,所述关键字通过目标事件的属性信息确定;
根据每个行为维度对应的关键字的出现次数,计算所述用户对所述目标事件的关注度;
若所述关注度大于预设阈值,则确定所述用户为所述目标事件的关注用户;
若所述关注度不大于所述预设阈值,则确定所述用户不为所述目标事件的关注用户。
可选的,所述根据每个行为维度对应的关键字的出现次数,计算所述用户对所述目标事件的关注度,包括:
针对每个行为维度,根据该行为维度对应的关键字的出现次数,计算所述用户在该行为维度下对所述目标事件的关注度;
根据预设的每个行为维度对应的权重值,计算所述用户在各个行为维度下对所述目标事件的关注度的加权和,作为用户对所述目标事件的关注度。
可选的,每个行为维度对应的关键字的个数为多个,所述针对每个行为维度,统计在该行为维度下的行为数据中该行为维度对应的关键字的出现次数,包括:
针对每个行为维度,对于该行为维度对应的每个关键字,统计在该行为维度下的行为数据中出现该关键字的次数;
所述针对每个行为维度,根据该行为维度对应的关键字的出现次数,计算所述用户在该行为维度下对所述目标事件的关注度,包括:
针对每个行为维度,根据预设的该行为维度对应的每个关键字的权重值,计算该行为维度对应的各个关键字的次数的加权和,作为所述用户在该行为维度下对所述目标事件的关注度。
可选的,所述方法还包括:
获取多个用户对所述目标事件的关注度;
将所述多个用户的关注度的中位数确定为所述预设阈值。
第二方面,本申请提供了一种目标事件的关注用户的确定装置,所述装置包括:
第一获取模块,用于获取用户在预设的多个行为维度中各行为维度下的行为数据;
统计模块,用于针对每个行为维度,统计在该行为维度下的行为数据中该行为维度对应的关键字的出现次数,所述关键字通过目标事件的属性信息确定;
计算模块,用于根据每个行为维度对应的关键字的出现次数,计算所述用户对所述目标事件的关注度;
第一确定模块,用于若所述关注度大于预设阈值,则确定所述用户为所述目标事件的关注用户;
第二确定模块,用于若所述关注度不大于所述预设阈值,则确定所述用户不为所述目标事件的关注用户。
可选的,所述计算模块,包括:
计算单元,用于针对每个行为维度,根据该行为维度对应的关键字的出现次数,计算所述用户在该行为维度下对所述目标事件的关注度;
确定单元,用于根据预设的每个行为维度对应的权重值,计算所述用户在各个行为维度下对所述目标事件的关注度的加权和,作为用户对所述目标事件的关注度。
可选的,每个行为维度对应的关键字的个数为多个;
所述统计模块,具体用于:
针对每个行为维度,对于该行为维度对应的每个关键字,统计在该行为维度下的行为数据中出现该关键字的次数;
所述计算单元,具体用于:
针对每个行为维度,根据预设的该行为维度对应的每个关键字的权重值,计算该行为维度对应的各个关键字的次数的加权和,作为所述用户在该行为维度下对所述目标事件的关注度。
可选的,所述装置还包括:
第二获取模块,用于获取多个用户对所述目标事件的关注度;
第三确定模块,用于将所述多个用户的关注度的中位数确定为所述预设阈值。
第三方面,本申请提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现第一方面所述的方法步骤。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法步骤。
第五方面,本申请提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行第一方面所述的方法。
本申请提供的一种目标事件的关注用户的确定方法及装置,可以获取用户在预设的多个行为维度中各行为维度下的行为数据;针对每个行为维度,统计在该行为维度下的行为数据中该行为维度对应的关键字的出现次数,关键字通过目标事件的属性信息确定;根据每个行为维度对应的关键字的出现次数,计算用户对目标事件的关注度;若关注度大于预设阈值,则确定用户为目标事件的关注用户;若关注度不大于预设阈值,则确定用户不为目标事件的关注用户。本申请采用用户在多个行为维度下的行为数据,确定用户对目标事件的关注度,数据丰富,使得计算出的用户对目标事件的关注度的准确性较高,进而可以提高确定目标事件的关注用户的准确性。
当然,实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种目标事件的关注用户的确定方法流程图;
图2为本申请实施例提供的一种目标事件的关注用户的确定装置结构示意图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种目标事件的关注用户的确定方法,应用于服务器或其他网络设备。该方法可以获取用户在预设的多个行为维度中各行为维度下的行为数据;针对每个行为维度,统计在该行为维度下的行为数据中该行为维度对应的关键字的出现次数,关键字通过目标事件的属性信息确定;根据每个行为维度对应的关键字的出现次数,计算用户对目标事件的关注度;若关注度大于预设阈值,则确定用户为目标事件的关注用户;若关注度不大于预设阈值,则确定用户不为目标事件的关注用户。本申请采用用户在多个行为维度下的行为数据,确定用户对目标事件的关注度,数据丰富,使得计算出的用户对目标事件的关注度的准确性较高,进而可以提高确定目标事件的关注用户的准确性。
下面将结合具体实施方式,对本申请实施例提供的一种目标事件的关注用户的确定方法进行详细的说明,如图1所示,具体步骤如下:
步骤101,获取用户在预设的多个行为维度中各行为维度下的行为数据。
其中,行为维度用于表示用户不同的网络行为,预设的多个行为维度可以包括以下维度任一组合:关于邮件主题的邮件收发、关于邮件收发件人的邮件收发、传输文件、搜索、娱乐股票类应用程序安装、社区主题访问、网页域名访问、网页主题访问。
本申请实施例中,终端上可以部署有行为审计应用程序,终端可以通过审计应用程序获取用户在各个行为维度下的行为数据。
例如,终端可以通过审计应用程序获取终端上的搜索引擎应用程序对应的搜索日志,然后通过搜索日志确定用户搜索的关键字(即用户在搜索行为维度下的行为数据)。
终端可以通过审计应用程序获取终端上的文件传输应用程序对应的文件传输日志,然后通过文件传输日志确定用户传输文件的文件名(即用户在传输文件行为维下的行为数据)。
终端可以通过审计应用程序获取终端上安装的娱乐股票类应用程序名(即用户在娱乐股票类应用程序安装行为维度下的行为数据)。
终端可以通过审计应用程序获取终端上的邮件应用程序对应的邮件日志,然后通过邮件日志确定用户收发邮件的邮件主题(即用户在关于邮件主题的邮件收发行为维度下的行为数据),及用户收发邮件的邮件收件人账号和邮件发件人账号(即用户在关于邮件收发件人的邮件收发行为维度下的行为数据)。
终端可以通过审计应用程序获取终端上的社区访问程序对应的社区访问日志,然后通过社区访问日志确定用户访问的社区主题(即用户在社区主题访问行为维度下的行为数据)。
终端可以通过审计应用程序获取终端上的网页浏览应用程序对应的网页访问日志,然后通过网页访问日期确定用户访问的网页域名(即用户在网页域名访问行为维度下的相位数据),及用户访问的网页主题(即用户在网页主题访问行为维度下的行为数据)。
终端可以将获取的各行为维度下的行为数据发送给服务器。
其中,用户在各个行为维度下的行为数据可以参见表一。
表一
Figure BDA0002145938980000061
Figure BDA0002145938980000071
步骤102,针对每个行为维度,统计在该行为维度下的行为数据中该行为维度对应的关键字的出现次数。
本申请实施例中,服务器预先设置有每个行为维度对应的关键字,该行为维度对应的关键字通过目标事件的属性信息确定,目标事件可以是社会敏感事件、热点事件等。其中,每个行为维度对应的关键字的个数可以是多个也可以是一个。
针对每个行为维度,服务器可以统计用户在该行为维度下的行为数据中出现该行为维度对应的关键字的次数。例如,针对网页主题访问行为维度,网页主题访问行为维度对应的关键字有A和B,服务器可以统计用户访问的网页主题中分别出现关键字A和B的次数,即用户访问的网页主题中包含关键字A的网页主题个数和用户访问的网页主题中包含关键字B的网页主题个数。
步骤103,根据每个行为维度对应的关键字的出现次数,计算用户对目标事件的关注度。
本申请实施例中,服务器可以根据每个行为维度对应的关键字的出现次数,计算用户对目标事件的关注度。一种实现方式中,服务器可以计算各个行为维度对应的关键字的出现次数之和,作为用户对目标事件的关注度,例如,服务器可以依据公式(1)计算用户对目标事件的关注度。
Figure BDA0002145938980000072
其中,y为用户对目标事件的关注度,N为行为维度的总数目,Ci为用户在行为维度Fi下的行为数据中出现行为维度Fi对应的关键字的次数(即,行为维度Fi对应的关键字的出现次数)。
一个示例中,关于邮件主题的邮件收发行为维度对应的关键字的出现次数为10,关于邮件收发件人的邮件收发行为维度对应的关键字的出现次数为20,传输文件行为维度对应的关键字的出现次数为20,搜索行为维度对应的关键字的出现次数为30,娱乐股票类应用程序安装行为维度对应的关键字的出现次数为3,社区主题访问行为维度对应的关键字的出现次数为45,网页域名访问行为维度对应的关键字的出现次数为60,网页主题访问行为维度对应的关键字的出现次数为70时,则服务器可以确定用户对目标事件的关注度为10+20+20+30+3+45+60+70=258。
可选的,根据每个行为维度对应的关键字的出现次数,计算用户对目标事件的关注度的具体过程还可以为:针对每个行为维度,根据该行为维度对应的关键字的出现次数,计算用户在该行为维度下对目标事件的关注度;根据预设的每个行为维度对应的权重值,计算用户在各个行为维度下对目标事件的关注度的加权和,作为用户对目标事件的关注度。
本申请实施例中,针对每个行为维度,服务器可以根据该行为维度对应的关键字的出现次数,计算用户在该行为维度下对目标事件的关注度,比如,针对每个行为维度,服务器可以将该行为维度对应的关键字的出现次数,作为用户在该行为维度下对目标事件的关注度。然后,服务器根据预设的每个行为维度对应的权重值,计算用户在各个行为维度下对目标事件的关注度的加权和,作为用户对目标事件的关注度。
可选的,在每个行为维度对应的关键字的个数为多个的情况下,针对每个行为维度,统计在该行为维度下的行为数据中该行为维度对应的关键字的出现次数的具体过程可以为:针对每个行为维度,对于该行为维度对应的每个关键字,统计在该行为维度下的行为数据中出现该关键字的次数。相应的,针对每个行为维度,根据该行为维度对应的关键字的出现次数,计算用户在该行为维度下对目标事件的关注度的具体过程可以为:针对每个行为维度,根据预设的该行为维度对应的每个关键字的权重值,计算该行为维度对应的各个关键字的次数的加权和,作为用户在该行为维度下对目标事件的关注度。
本申请实施例中,针对每个行为维度,对于该行为维度对应的每个关键字,服务器可以确定用户在该行为维度下的行为数据中出现该关键字的次数,然后,服务器可以根据该行为维度对应的每个关键字的权重值,计算用户在该行为维度下的行为数据中分别出现该关键字的次数的加权和,作为用户在该行为维度下对目标事件的关注度。其中,每个行为维度对应的每个关键字的权重值可以由技术人员根据经验设定。
然后,服务器可以根据每个行为维度对应的权重值,计算用户在各个行为维度下对目标事件的关注度的加权和,作为用户对目标事件的关注度。其中,每个行为维度对应的权重值可以由技术人员根据经验设定。
其中,每个行为维度对应的关键字和权重值,及各个关键字的权重值可以参考表二。需要说明的是,表二仅是本申请实施例中的一种示例,本申请并不对行为维度、行为维度的数量、每个行为维度对应的关键字,每个行为维度对应的关键字的个数做具体限定。
表二
Figure BDA0002145938980000091
Figure BDA0002145938980000101
一个示例中,服务器可以根据公式(2)计算用户对目标事件的关注度。
Figure BDA0002145938980000102
其中,y为用户对目标事件的关注度,N为行为维度的总数目,Mi为行为维度Fi对应的关键字的总数目,FWi为行为维度Fi对应的权重值,KWij为行为维度Fi对应的关键字KEYij的权重值,Cij为行为维度Fi对应的关键字KEYij的出现次数。
步骤104,若关注度大于预设阈值,则确定用户为目标事件的关注用户。
步骤105,若关注度不大于预设阈值,则确定用户不为目标事件的关注用户。
其中,预设阈值可以由技术人员依据经验设定,也可以由以下方式获取:获取多个用户对目标事件的关注度;将多个用户的关注度的中位数确定为预设阈值。
本申请实施例中,多个用户可以为监控的所有用户,比如为企业的所有工作人员,或学校的所有校内人员。服务器可以确定每个用户对目标事件的关注度,具体确定方式可以参考本申请实施例提供的确定用户对目标事件的关注度的方式。服务器可以将确定的多个关注度的中位数确定为预设阈值。
一个示例中,预设阈值为100,用户对目标事件的关注度为258,258大于100,则服务器可以确定用户为目标事件的关注用户。另一个示例中,预设阈值为100,用户对目标事件的关注度为80,80小于100,则服务器可以确定用户不为目标事件的关注用户。
本申请实施例采用用户在多个行为维度下的行为数据,确定用户对目标事件的关注度,数据丰富,使得计算出的用户对目标事件的关注度的准确性较高,进而可以提高确定目标事件的关注用户的准确性。并且本申请对每个行为维度设定权重值,并对每个行为维度对应的关键字设定权重值,使得计算出的用户对目标事件的关注度的准确性更高。
基于相同的技术构思,如图2所示,本申请实施例还提供了一种目标事件的关注用户的确定装置,所述装置包括:
第一获取模块201,用于获取用户在预设的多个行为维度中各行为维度下的行为数据;
统计模块202,用于针对每个行为维度,统计在该行为维度下的行为数据中该行为维度对应的关键字的出现次数,所述关键字通过目标事件的属性信息确定;
计算模块203,用于根据每个行为维度对应的关键字的出现次数,计算所述用户对所述目标事件的关注度;
第一确定模块204,用于若所述关注度大于预设阈值,则确定所述用户为所述目标事件的关注用户;
第二确定模块205,用于若所述关注度不大于所述预设阈值,则确定所述用户不为所述目标事件的关注用户。
可选的,所述计算模块203,包括:
计算单元,用于针对每个行为维度,根据该行为维度对应的关键字的出现次数,计算所述用户在该行为维度下对所述目标事件的关注度;
确定单元,用于根据预设的每个行为维度对应的权重值,计算所述用户在各个行为维度下对所述目标事件的关注度的加权和,作为用户对所述目标事件的关注度。
可选的,每个行为维度对应的关键字的个数为多个;
所述统计模块202,具体用于:
针对每个行为维度,对于该行为维度对应的每个关键字,统计在该行为维度下的行为数据中出现该关键字的次数;
所述计算单元,具体用于:
针对每个行为维度,根据预设的该行为维度对应的每个关键字的权重值,计算该行为维度对应的各个关键字的次数的加权和,作为所述用户在该行为维度下对所述目标事件的关注度。
可选的,所述装置还包括:
第二获取模块,用于获取多个用户对所述目标事件的关注度;
第三确定模块,用于将所述多个用户的关注度的中位数确定为所述预设阈值。
本申请实施例还提供了一种电子设备,如图3所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信,
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现如下步骤:
获取用户在预设的多个行为维度中各行为维度下的行为数据;
针对每个行为维度,统计在该行为维度下的行为数据中该行为维度对应的关键字的出现次数,所述关键字通过目标事件的属性信息确定;
根据每个行为维度对应的关键字的出现次数,计算所述用户对所述目标事件的关注度;
若所述关注度大于预设阈值,则确定所述用户为所述目标事件的关注用户;
若所述关注度不大于所述预设阈值,则确定所述用户不为所述目标事件的关注用户。
可选的,所述根据每个行为维度对应的关键字的出现次数,计算所述用户对所述目标事件的关注度,包括:
针对每个行为维度,根据该行为维度对应的关键字的出现次数,计算所述用户在该行为维度下对所述目标事件的关注度;
根据预设的每个行为维度对应的权重值,计算所述用户在各个行为维度下对所述目标事件的关注度的加权和,作为用户对所述目标事件的关注度。
可选的,每个行为维度对应的关键字的个数为多个,所述针对每个行为维度,统计在该行为维度下的行为数据中该行为维度对应的关键字的出现次数,包括:
针对每个行为维度,对于该行为维度对应的每个关键字,统计在该行为维度下的行为数据中出现该关键字的次数;
所述针对每个行为维度,根据该行为维度对应的关键字的出现次数,计算所述用户在该行为维度下对所述目标事件的关注度,包括:
针对每个行为维度,根据预设的该行为维度对应的每个关键字的权重值,计算该行为维度对应的各个关键字的次数的加权和,作为所述用户在该行为维度下对所述目标事件的关注度。
可选的,所述方法还包括:
获取多个用户对所述目标事件的关注度;
将所述多个用户的关注度的中位数确定为所述预设阈值。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一目标事件的关注用户的确定方法的步骤。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一目标事件的关注用户的确定方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质、计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。

Claims (10)

1.一种目标事件的关注用户的确定方法,其特征在于,所述方法包括:
获取用户在预设的多个行为维度中各行为维度下的行为数据;
针对每个行为维度,统计在该行为维度下的行为数据中该行为维度对应的关键字的出现次数,所述关键字通过目标事件的属性信息确定;
根据每个行为维度对应的关键字的出现次数,计算所述用户对所述目标事件的关注度;
若所述关注度大于预设阈值,则确定所述用户为所述目标事件的关注用户;
若所述关注度不大于所述预设阈值,则确定所述用户不为所述目标事件的关注用户。
2.根据权利要求1所述的方法,其特征在于,所述根据每个行为维度对应的关键字的出现次数,计算所述用户对所述目标事件的关注度,包括:
针对每个行为维度,根据该行为维度对应的关键字的出现次数,计算所述用户在该行为维度下对所述目标事件的关注度;
根据预设的每个行为维度对应的权重值,计算所述用户在各个行为维度下对所述目标事件的关注度的加权和,作为用户对所述目标事件的关注度。
3.根据权利要求2所述的方法,其特征在于,每个行为维度对应的关键字的个数为多个,所述针对每个行为维度,统计在该行为维度下的行为数据中该行为维度对应的关键字的出现次数,包括:
针对每个行为维度,对于该行为维度对应的每个关键字,统计在该行为维度下的行为数据中出现该关键字的次数;
所述针对每个行为维度,根据该行为维度对应的关键字的出现次数,计算所述用户在该行为维度下对所述目标事件的关注度,包括:
针对每个行为维度,根据预设的该行为维度对应的每个关键字的权重值,计算该行为维度对应的各个关键字的次数的加权和,作为所述用户在该行为维度下对所述目标事件的关注度。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取多个用户对所述目标事件的关注度;
将所述多个用户的关注度的中位数确定为所述预设阈值。
5.一种目标事件的关注用户的确定装置,其特征在于,所述装置包括:
第一获取模块,用于获取用户在预设的多个行为维度中各行为维度下的行为数据;
统计模块,用于针对每个行为维度,统计在该行为维度下的行为数据中该行为维度对应的关键字的出现次数,所述关键字通过目标事件的属性信息确定;
计算模块,用于根据每个行为维度对应的关键字的出现次数,计算所述用户对所述目标事件的关注度;
第一确定模块,用于若所述关注度大于预设阈值,则确定所述用户为所述目标事件的关注用户;
第二确定模块,用于若所述关注度不大于所述预设阈值,则确定所述用户不为所述目标事件的关注用户。
6.根据权利要求5所述的装置,其特征在于,所述计算模块,包括:
计算单元,用于针对每个行为维度,根据该行为维度对应的关键字的出现次数,计算所述用户在该行为维度下对所述目标事件的关注度;
确定单元,用于根据预设的每个行为维度对应的权重值,计算所述用户在各个行为维度下对所述目标事件的关注度的加权和,作为用户对所述目标事件的关注度。
7.根据权利要求6所述的装置,其特征在于,每个行为维度对应的关键字的个数为多个;
所述统计模块,具体用于:
针对每个行为维度,对于该行为维度对应的每个关键字,统计在该行为维度下的行为数据中出现该关键字的次数;
所述计算单元,具体用于:
针对每个行为维度,根据预设的该行为维度对应的每个关键字的权重值,计算该行为维度对应的各个关键字的次数的加权和,作为所述用户在该行为维度下对所述目标事件的关注度。
8.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取多个用户对所述目标事件的关注度;
第三确定模块,用于将所述多个用户的关注度的中位数确定为所述预设阈值。
9.一种电子设备,其特征在于,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现权利要求1-4任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4任一所述的方法步骤。
CN201910684880.1A 2019-07-26 2019-07-26 一种目标事件的关注用户的确定方法及装置 Active CN110442801B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910684880.1A CN110442801B (zh) 2019-07-26 2019-07-26 一种目标事件的关注用户的确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910684880.1A CN110442801B (zh) 2019-07-26 2019-07-26 一种目标事件的关注用户的确定方法及装置

Publications (2)

Publication Number Publication Date
CN110442801A CN110442801A (zh) 2019-11-12
CN110442801B true CN110442801B (zh) 2021-11-19

Family

ID=68431784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910684880.1A Active CN110442801B (zh) 2019-07-26 2019-07-26 一种目标事件的关注用户的确定方法及装置

Country Status (1)

Country Link
CN (1) CN110442801B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113590925A (zh) * 2020-04-30 2021-11-02 中国移动通信集团北京有限公司 一种用户确定方法、装置、设备及计算机存储介质
CN115454989B (zh) * 2022-09-29 2023-12-08 深圳市手心游戏科技有限公司 一种应用程序数据的数据处理方法和装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102411596A (zh) * 2010-09-21 2012-04-11 阿里巴巴集团控股有限公司 一种信息推荐方法及系统
US8918468B1 (en) * 2011-07-19 2014-12-23 West Corporation Processing social networking-based user input information to identify potential topics of interest
CN106168975A (zh) * 2016-07-12 2016-11-30 精硕世纪科技(北京)有限公司 目标用户浓度的获取方法及装置
CN106919946A (zh) * 2015-12-25 2017-07-04 华为技术有限公司 一种受众选择的方法及装置
CN107665443A (zh) * 2017-05-10 2018-02-06 平安科技(深圳)有限公司 获取目标用户的方法及装置
CN108174296A (zh) * 2018-01-02 2018-06-15 武汉斗鱼网络科技有限公司 恶意用户识别方法及装置
CN108171538A (zh) * 2017-12-26 2018-06-15 中国联合网络通信集团有限公司 用户数据处理方法及系统
CN108416015A (zh) * 2018-03-05 2018-08-17 重庆电子工程职业学院 一种信息安全推送方法
CN109582875A (zh) * 2018-12-17 2019-04-05 武汉泰乐奇信息科技有限公司 一种在线医疗教育资源的个性化推荐方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170228462A1 (en) * 2016-02-04 2017-08-10 Microsoft Technology Licensing, Llc Adaptive seeded user labeling for identifying targeted content
WO2017168202A1 (en) * 2016-03-27 2017-10-05 Yogesh Chunilal Rathod Identifying & storing followers, following users, viewers, users and connections for user
US20170364957A1 (en) * 2016-06-16 2017-12-21 Facebook, Inc. Identifying target audience for content distribution based on historical user activity

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102411596A (zh) * 2010-09-21 2012-04-11 阿里巴巴集团控股有限公司 一种信息推荐方法及系统
US8918468B1 (en) * 2011-07-19 2014-12-23 West Corporation Processing social networking-based user input information to identify potential topics of interest
CN106919946A (zh) * 2015-12-25 2017-07-04 华为技术有限公司 一种受众选择的方法及装置
CN106168975A (zh) * 2016-07-12 2016-11-30 精硕世纪科技(北京)有限公司 目标用户浓度的获取方法及装置
CN107665443A (zh) * 2017-05-10 2018-02-06 平安科技(深圳)有限公司 获取目标用户的方法及装置
CN108171538A (zh) * 2017-12-26 2018-06-15 中国联合网络通信集团有限公司 用户数据处理方法及系统
CN108174296A (zh) * 2018-01-02 2018-06-15 武汉斗鱼网络科技有限公司 恶意用户识别方法及装置
CN108416015A (zh) * 2018-03-05 2018-08-17 重庆电子工程职业学院 一种信息安全推送方法
CN109582875A (zh) * 2018-12-17 2019-04-05 武汉泰乐奇信息科技有限公司 一种在线医疗教育资源的个性化推荐方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于搜索引擎关注度的网络舆情时空演化比较分析――以谷歌趋势和百度指数比较为例;陈涛等;《情报杂志》;20130318(第03期);第11-14页 *
基于日志挖掘的电商查询建议方法;王菁等;《计算机工程与科学》;20180215(第02期);第45-51页 *
网络学习的网络时空关注度分析;吴涛等;《现代计算机(专业版)》;20180805(第22期);第22-27页 *

Also Published As

Publication number Publication date
CN110442801A (zh) 2019-11-12

Similar Documents

Publication Publication Date Title
US11108807B2 (en) Performing rule-based actions for newly observed domain names
US10678807B1 (en) Generating real-time search results
CN106202394B (zh) 文本资讯的推荐方法及系统
US7895227B1 (en) System and method for detecting trends in network-based content
US20120066359A1 (en) Method and system for evaluating link-hosting webpages
US20160132904A1 (en) Influence score of a brand
US11275748B2 (en) Influence score of a social media domain
JP2014157623A (ja) ニュース記事のランク付けを向上させるためのシステムおよび方法
CN104081392A (zh) 社会媒体配置文件的影响评分
CN109190014B (zh) 一种正则表达式生成方法、装置及电子设备
CN110442801B (zh) 一种目标事件的关注用户的确定方法及装置
KR101429397B1 (ko) 소셜 네트워크 서비스의 메시지 분석을 이용한 핵심사건 추출 방법 및 시스템
JP2011227721A (ja) 関心抽出装置、関心抽出方法、及び関心抽出プログラム
JP2013077056A (ja) アプリケーション推薦装置及びアプリケーション推薦方法
CN109168044B (zh) 一种视频特征的确定方法及装置
Choudhary et al. Role of ranking algorithms for information retrieval
CN112115280A (zh) 一种全媒体影响力传播分析方法及装置
CN107590176B (zh) 一种评价指标的获得方法、装置及电子设备
KR101568800B1 (ko) 실시간 이슈 검색어 선별 방법 및 시스템
JP6925244B2 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
US9152701B2 (en) Query classification
CN113868373A (zh) 一种词云生成方法、装置、电子设备及存储介质
CN113836412A (zh) 一种信息推荐方法、装置、电子设备及存储介质
Anh Web Scraping: A Big Data Building Tool And Its Status In The Fintech Sector In Viet Nam
CN111612550A (zh) 广告触发作弊识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant