CN112395510A - 基于活跃度确定目标用户的方法和装置 - Google Patents
基于活跃度确定目标用户的方法和装置 Download PDFInfo
- Publication number
- CN112395510A CN112395510A CN201910754200.9A CN201910754200A CN112395510A CN 112395510 A CN112395510 A CN 112395510A CN 201910754200 A CN201910754200 A CN 201910754200A CN 112395510 A CN112395510 A CN 112395510A
- Authority
- CN
- China
- Prior art keywords
- user
- pointing
- sub
- selectable
- operation data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于活跃度确定目标用户的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取关键词,并根据关键词搜索在预设时间段内发布的目标信息;根据目标信息确定可选用户,并根据目标信息对应的总操作数据,计算可选用户的指向权重;基于链接分析法,根据可选用户的指向权重,获取可选用户的活跃值,并根据活跃值从可选用户中筛选出目标用户。该实施方式分析在限制领域和时间范围内的目标信息,达到利用目标信息中的操作数据修正指向权重的效果,并且基于链接分析法提取出活跃度高的目标用户,从而可以实现从限定某一领域的角度出发,获取该领域内活跃度较高的目标用户,降低了计算代价。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于活跃度确定目标用户的方法和装置。
背景技术
智能化时代的来临,越来越多的社交网络平台映入眼帘,比如Facebook、Twitter或者微博等等,这些社交网络平台拥有大量的用户群体,并且每个用户都可以转发、评论、点赞或者反对其他用户发布的信息,这样信息传播的异常迅速。如果某用户发布的信息被其他用户转发的数量越大,则说明该用户的活跃度越高。因此,如何选择出活跃度较高的用户,以通过该用户发布有益信息,引导社会大众,具有重要意义。
目前,确定活跃度较高的用户的方法有两种,一种是指标加权法,即对用户的粉丝数、发布信息数等特征进行加权计算,对结果进行排序,选择分值较高的用户;一种全网链接分析法,根据用户的社交网络关系,对社交网络平台的全部用户转发关系图中的被转发值进行迭代,进而选择出活跃度较高的用户。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:一、指标加权法包含算法设计者的主观偏好过多,结果有失客观;二、常见的需求往往不是对全网的用户的被转发结果进行排序,而现有链接分析法需要整个图上进行迭代,用户转发关系矩阵巨大,计算代价大,并且用户关系随用户数指数级增长,迭代总时间非常漫长。
发明内容
有鉴于此,本发明实施例提供一种基于活跃度确定目标用户的方法和装置,能够实现从限定某一领域的角度出发,获取该领域内活跃度较高的目标用户,降低了计算代价。
为实现上述目的,根据本发明实施例的第一方面,提供了一种基于活跃度确定目标用户的方法。
本发明实施例的一种基于活跃度确定目标用户的方法,包括:获取关键词,并根据所述关键词搜索在预设时间段内发布的目标信息;根据所述目标信息确定可选用户,并根据所述目标信息对应的总操作数据,计算所述可选用户的指向权重;基于链接分析法,根据所述可选用户的指向权重,获取所述可选用户的活跃值,并根据所述活跃值从所述可选用户中筛选出目标用户。
可选地,所述根据所述目标信息对应的总操作数据,计算所述可选用户的指向权重,包括:按照操作方式的不同,将所述目标信息对应的总操作数据分成至少一类子操作数据;根据所述至少一类子操作数据,计算所述可选用户的子指向权重;设置所述子指向权重的比例,并根据所述比例和所述子指向权重,计算所述可选用户的指向权重。
可选地,所述根据所述子操作数据,计算所述可选用户的子指向权重,包括:针对每个可选用户,统计所述子操作数据中所述每个可选用户对应的指向用户、所述每个可选用户相对所述指向用户的操作次数;确定所述子操作数据对应的操作方式,并确定所述每个可选用户在所述操作方式下的操作总次数;根据所述每个可选用户在所述操作方式下的操作总次数、所述每个可选用户对应的指向用户、所述每个可选用户相对所述指向用户的操作次数,计算出所述每个可选用户相对于所述指向用户的子指向权重。
可选地,所述基于链接分析法,根据所述可选用户的指向权重,获取所述可选用户的活跃值,包括:将所述指向权重代入链接分析法的迭代公式中进行迭代计算;在迭代次数大于预设迭代次数或者连续两次迭代计算结果的变化量小于预设变化量的情况下,停止迭代计算,获得所述可选用户的活跃值。
为实现上述目的,根据本发明实施例的第二方面,提供了一种基于活跃度确定目标用户的装置。
本发明实施例的一种基于活跃度确定目标用户的装置,包括:获取模块,用于获取关键词,并根据所述关键词搜索在预设时间段内发布的目标信息;确定模块,用于根据所述目标信息确定可选用户,并根据所述目标信息对应的总操作数据,计算所述可选用户的指向权重;筛选模块,用于基于链接分析法,根据所述可选用户的指向权重,获取所述可选用户的活跃值,并根据所述活跃值从所述可选用户中筛选出目标用户。
可选地,所述确定模块还用于:按照操作方式的不同,将所述目标信息对应的总操作数据分成至少一类子操作数据;根据所述至少一类子操作数据,计算所述可选用户的子指向权重;设置所述子指向权重的比例,并根据所述比例和所述子指向权重,计算所述可选用户的指向权重。
可选地,所述确定模块还用于:针对每个可选用户,统计所述子操作数据中所述每个可选用户对应的指向用户、所述每个可选用户相对所述指向用户的操作次数;确定所述子操作数据对应的操作方式,并确定所述每个可选用户在所述操作方式下的操作总次数;根据所述每个可选用户在所述操作方式下的操作总次数、所述每个可选用户对应的指向用户、所述每个可选用户相对所述指向用户的操作次数,计算出所述每个可选用户相对于所述指向用户的子指向权重。
可选地,所述筛选模块还用于:将所述指向权重代入链接分析法的迭代公式中进行迭代计算;在迭代次数大于预设迭代次数或者连续两次迭代计算结果的变化量小于预设变化量的情况下,停止迭代计算,获得所述可选用户的活跃值。
为实现上述目的,根据本发明实施例的第三方面,提供了一种电子设备。
本发明实施例的一种电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本发明实施例的基于活跃度确定目标用户的方法。
为实现上述目的,根据本发明实施例的第四方面,提供了一种计算机可读介质。
本发明实施例的一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现本发明实施例的基于活跃度确定目标用户的方法。
上述发明中的一个实施例具有如下优点或有益效果:因为通过搜索在发布时间内与关键词相关的目标信息,限制了领域和时间范围,所以克服了现有技术中需要对全网用户的所有信息进行迭代计算的技术问题,降低了计算代价,并且还通过分析目标信息中的操作数据,获取可选用户以及可选用户的指向权重,进而达到利用目标信息中的操作数据修正指向权重的效果,最后基于链接分析法,获得可选用户的活跃值,提取出活跃度高的目标用户,从而可以实现从限定某一领域的角度出发,获取该领域内活跃度较高的目标用户。此外,本发明中在计算可选用户的指向权重的方法中,首先按照不同操作方式下的子指向权重,然后根据任务需求设置子指向权重的比例,进而得到最终的指向权重,这样可以结合具体场景对操作数据进行分析,提高本发明的实用性。还有,本发明中在计算子指向权重时,采用的是操作总次数,这样考虑了目标信息外的操作次数,获得的子指向权重更客观。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的基于活跃度确定目标用户的方法的主要步骤的示意图;
图2是根据本发明实施例的用户的指向关系示意图;
图3是根据本发明实施例的基于活跃度确定目标用户的方法的主要流程的示意图;
图4是根据本发明实施例的基于活跃度确定目标用户的装置的主要模块的示意图;
图5是本发明实施例可以应用于其中的示例性系统架构图;
图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
信息化时代,通过获取社交网络平台的用户影响力,从而可以借助影响力较高的用户推送有益信息,以实现引导社会大众的效果。当前获取影响力较高用户的方法中,一般是采用指标加权法或者全网链接分析法。但是,指标加权法包含算法设计者的主观偏好过多的问题,而全网链接分析法中用户转发关系矩阵巨大,计算代价大,迭代总时间长。考虑到常见的需求往往不是对用户的全部发布信息进行分析,而是对某一领域的信息进行分析,因此本发明提供一种基于活跃度确定目标用户的方法,从限定某一领域入手,优化现有全网链接分析法。
图1是根据本发明实施例的基于活跃度确定目标用户的方法的主要步骤的示意图。作为本发明的一个可参考实施例,如图1所示,本发明实施例的基于活跃度确定目标用户的方法的主要步骤可以包括步骤S101至步骤S103。
步骤S101:获取关键词,并根据关键词搜索在预设时间段内发布的目标信息。
考虑到对于社交网络平台,用户可以随时随地发布各个领域各个话题的信息,而实际上通常是选择某个领域或者某个话题中活跃度较高的用户,从而可以让该用户推广与该领域或者该话题有关的信息内容。需要注意的是,本发明实施例中的用户是指在社交网络平台上注册的用户帐号。因此在步骤S101中,首先通过实际需求限制特定话题或者特定领域,获取到该话题或者该领域的关键词,然后搜索在预设时间段内发布的与关键词相关的目标信息。比如说,特定话题或者特定领域可以是美妆领域、高考话题、垃圾分类话题等等,那么针对美妆领域,获取到关键词可以是各种美妆产品、美妆工具或者是具体的妆容,比如清新妆、晚宴妆、烟熏妆等等。针对高考话题,获取到的关键词可以是文科、理科、高考状元、某高校、本科批次或者是学霸等等。针对垃圾分类话题,获取到的关键词可以是保护环境、可再生资源、不可降解材料等等。由此看出,不同的话题或者领域对应于不同的关键词,这需要根据实际需求确定关键词。本发明实施例中限制发布时间是为了确保得到的目标用户的准确性,由于社会网络网站用户群体庞大,每天会有数百万的信息更新,限制了发布时间,可以将目标信息的范围缩小,同时也可以提高获取的目标用户的准确性。在步骤S101中,在确定了关键词和发布时间之后,就可以从整个社交网络平台的信息中提取出在发布时间范围内的与关键词相关的信息,该信息在本发明实施例中称为目标信息,后续就是对目标信息进行分析,计算用户的活跃度。
步骤S102:根据目标信息确定可选用户,并根据目标信息对应的总操作数据,计算可选用户的指向权重。
通过步骤S101中获取到目标信息后,在步骤S102中可以分析目标信息涉及到的用户,这些用户均被看作为可选用户。比如说,有100条目标信息,这100条信息的发布用户是可选用户的组成部分,并且对这100条信息进行评论、点赞、转发或者反对等操作的用户也是可选用户的组成部分。本发明实施例中的总操作数据就是指对这些目标信息进行评论、点赞、转发或者反对等操作的数据。比如说,用户A发布了一条信息,用户B转发了这条信息,用户C点赞了这条信息,那么用户B和用户C的操作均称为操作数据。
在获取到总操作数据之后,就可以计算得到用户的指向权重,其中指向权重是指一个用户指向其他用户的权重。本发明实施例中,若用户A对用户B的一条信息进行评论、点赞、转发或者反对等操作,则看作是用户A指向用户B。此处需要注意的是,本发明实施例中忽略用户对自己本身发布的信息进行操作的数据,这样可以确保得到的指向权重更加客观,那么在总操作数据中,需要预先过滤掉用户对自己本身发布的信息进行操作的数据。
本发明实施例中,指向权重的获取是主要创新点。作为本发明的再一个可参考实施例,根据目标信息对应的总操作数据计算可选用户的指向权重,可以包括步骤S201至步骤S203。
步骤S201:按照操作方式的不同,将目标信息对应的总操作数据分成至少一类子操作数据。用户可以评论、转发、点赞或者反对在社交网络平台上发布的信息,针对这些不同的操作方式,可以将目标信息对应的总操作数据分成评论数据、转发数据、点赞数据或者反对数据等不同类别的子操作数据。
步骤S202:根据至少一类子操作数据,计算可选用户的子指向权重。在步骤S201中,根据操作方式的不同,将总操作数据分类成不同的子操作数据。步骤S202是计算不同类别的子操作数据中,用户之间的关系,比如说,针对转发数据,通过分析转发关系,获取可选用户的转发指向权重。其中,本发明实施例中,计算可选用户的子指向权重可以包括:
步骤S2021:针对每个可选用户,统计子操作数据中每个可选用户对应的指向用户、每个可选用户相对指向用户的操作次数,就是针对一类子操作数据,分别计算每个可选用户进行的操作以及操作次数。比如说,若子操作数据为转发数据,可选用户为A、B和C,则分别统计A转发B以及C发布的信息的次数,统计B转发A以及C发布的信息的次数,统计C转发A以及B发布的信息的次数。在此步骤中统计可选用户的具体的指向用户以及操作次数,是为了接下来计算次数占所有次数的比例,从而可以根据比例得到权重。
步骤S2022:确定子操作数据对应的操作方式,并确定每个可选用户在操作方式下的操作总次数。
本发明实施例中,对不同的操作方式产生的子操作数据,分别进行处理,需要根据子操作数据确定操作方式,这样可以利用操作方式到全网社交网络平台中提取可选用户在该操作方式下的操作总次数。由于本发明实施例中获取的目标信息是设置了关键词和发布时间的,也就是说只获取了特定话题或者特定领域的操作数据,因此只获取了特定话题或者特定领域的用户间的指向关系,如果仅仅用目标信息统计操作总次数,会损失很多原本的指向。为了便于理解,本发明实施例提供图2所示的实例进行解释说明。图2是根据本发明实施例的用户的指向关系示意图。如图2所示,用户S3的指向,原本出度为4,设置了话题或者领域之后,S3仅指向S1和S2,即出度为2。其中,出度是指一个节点指向其他节点连接的个数,在本发明实施例中,指向关系是由操作用户指向原创用户,比如对于转发数据,用户A转发了10条微博,则A的出度为10。
步骤S2023:根据每个可选用户在操作方式下的操作总次数、每个可选用户对应的指向用户、每个可选用户相对指向用户的操作次数,计算出每个可选用户相对于指向用户的子指向权重。
本发明实施例中的子指向权重是指针对一种操作方式,可选用户相对于指向用户的指向权重。比如说,操作方式可以是评论、转发、点赞或者反对等等,若操作方式为转发,则计算每个可选用户相对指向用户的指向权重。由于本发明实施例中只获取了特定话题或者特定领域中用户间的指向关系,没有考虑设定的时间区间、设定的话题范围之外的指向关系,因此必然损失了很多原本的指向。因此,在设定的时间区间以及设定的话题范围内的子指向权重为:
其中,qji表示限制话题和时间范围的用户j指向用户i的权重,用户j指向用户i可以是用户j对用户i发布的信息进行转发、评论、点赞或者反对等操作方式;为用户j的执行某操作的出度,也就是在限制了时间区间以及设定话题范围内,用户j的执行某操作的操作总次数;aji表示用户j是否指向用户i,定义如下:
如果用户j指向用户i,则aji累加1,例如,用户j转发了10次用户i发布的某一条信息,则aji为10,又假设说用户i发布了5条信息,用户j分别转发了这5条信息,则aji为5。
其中,pji为本发明实施例中定义的用户j指向用户i的子指向权重,为用户j的原始出度,如图2中的S3,其对应的为4,这样就可以获得一个真实的子指向权重。本发明实施例中的原始出度不需要计算,只需要获取可选用户在整个社交网络平台的出度存下来即可,然后拿该原始出度修正局部的指向权重,即可在减少计算量的情况下,迭代出在设置的时间区间内特定领域或特定话题的影响力排名。
步骤S203:设置子指向权重的比例,并根据比例和子指向权重,计算可选用户的指向权重。
本发明实施例在上述步骤获取到子指向权重后,可以从具体的任务需求中获取到各子指向权重占的比例,进而获取到可选用户的指向权重。比如说,某任务只考虑用户的转发操作,可以直接忽略用户的其他操作,那么在设置子指向权重的比例时,仅考虑通过用户的转发数据计算得到的子指向权重就可以。本发明实施例,可以根据具体的任务需求,设置子指向权重的比例,进而得到可选用户的指向权重,从而可以提高本发明实施例的实用性,可以满足不同的用户需求,提高用户体验。
步骤S103:基于链接分析法,根据可选用户的指向权重,获取可选用户的活跃值,并根据活跃值从可选用户中筛选出目标用户。
其中,本发明实施例的链接分析法可以包括LeaderRank(即,一种基于图论的指向关系计算方法)和PageRank(即,一种网页之间的超链接计算的技术方法)。在步骤S102获取到用户的指向权重,在步骤S103利用指向权重,计算得到用户的活跃值,并且选择活跃值较高的用户为此次任务对应的目标用户。作为本发明的又一个可参考实施例,获取可选用户的活跃值可以包括:将指向权重代入链接分析法的迭代公式中进行迭代计算;在迭代次数大于预设迭代次数或者连续两次迭代计算结果的变化量小于预设变化量的情况下,停止迭代计算,获得至少一个可选用户的活跃值。
为了便于理解,本发明实施例中具体介绍LeaderRank算法的迭代过程。在LeaderRank算法中加入Ground Node(即,LeaderRank方法中的一个辅助节点,用于指向所有其他节点,在迭代开始前加入,在迭代完成后被删除,其分值会平均分配给其他所有节点),Ground Node指向所有用户,初始化所有用户被转发值si为1,迭代公式如下:
其中,si(t+1)为t+1次迭代后si的活跃值,sj(t)为t次迭代用户sj的活跃值,N为总的用户数,需要注意的是,此处的N值为可选用户的数量加1,因为在LeaderRank算法中加入Ground Node。本发明实施例中迭代算法的迭代终止条件可以是如果迭代次数超过设置的迭代次数阈值,或者两次迭代的用户的活跃值变化量的总和小于预设变化量的情况下,则停止迭代,否则继续迭代。最后将Ground Node的活跃值利用如下公式分给其他用户:
其中,Si表示用户i的最终活跃值,si(tc)表示tc次迭代后用户i的活跃值,sg(tc)表示tc次迭代后用户Ground Node的活跃值。这样,获得了特定话题或领域、特定时间内的用户活跃度的排序结果。然后,根据具体需要,选择活跃度排名靠前的用户为目标用户,可以利用这些目标用户发布与特定话题或者领域相关的信息。
为说明LeaderRank迭代,举例如下:有三个可选用户A、B、C,操作方式只有转发操作,A被B、C转发,B被C转发。加入Ground Node,四个的初始化分值均为1。为了专注解释迭代过程,所以让例子简单化,设置所有的指向权重为1,迭代终止条件为迭代次数为2,则有如下迭代过程:
在t=0时,sA=1,sB=1,sC=1,sG=1;
在t=1时,sA=1*sB+1*sC+1*sG=1+1+1=3,sB=1*sC+1*sG=1+1=2,sC=1*sG=1,sG=1;
在t=2时,sA=1*sB+1*sC+1*sG=2+1+1=4,sB=1*sC+1*sG=1+1=2,sC=1*sG=1,sG=1。
根据迭代终止条件,在2次迭代后停止迭代,将sG分给其他节点,迭代结果为:sA=4.33,sB=2.33,sC=1.33。
图3是根据本发明实施例的基于活跃度确定目标用户的方法的主要流程的示意图。作为本发明的另一个可参考实施例,基于活跃度确定目标用户的方法的主要流程可以包括:
步骤S301:获取特定话题或者特定领域的关键词;
步骤S302:根据关键词搜索在预设时间段内发布的目标信息,并根据目标信息确定可选用户;
步骤S303:按照操作方式的不同,将目标信息对应的总操作数据分成至少一类子操作数据;
步骤S304:针对每个可选用户,统计子操作数据中每个可选用户对应的指向用户、每个可选用户相对指向用户的操作次数;
步骤S305:确定子操作数据对应的操作方式,并确定每个可选用户在操作方式下的操作总次数;
步骤306:根据每个可选用户在操作方式下的操作总次数、每个可选用户对应的指向用户、每个可选用户相对指向用户的操作次数,计算出每个可选用户相对于指向用户的子指向权重;
步骤307:根据具体需求设置子指向权重的比例,并根据比例和子指向权重,计算可选用户的指向权重;
步骤S308:将指向权重代入链接分析法的迭代公式中进行迭代计算;
步骤S309:在迭代次数大于预设迭代次数或者连续两次迭代计算结果的变化量小于预设变化量的情况下,停止迭代计算,获得可选用户的活跃值:
步骤S310:根据活跃值从可选用户中筛选出目标用户。
根据本发明实施例的基于活跃度确定目标用户的技术方案,因为通过搜索在发布时间内与关键词相关的目标信息,限制了领域和时间范围,所以克服了现有技术中需要对全网用户的所有信息进行迭代计算的技术问题,降低了计算代价,并且还通过分析目标信息中的操作数据,获取可选用户以及可选用户的指向权重,进而达到利用目标信息中的操作数据修正指向权重的效果,最后基于链接分析法,获得可选用户的活跃值,提取出活跃度高的目标用户,从而可以实现从限定某一领域的角度出发,获取该领域内活跃度较高的目标用户。此外,本发明中在计算可选用户的指向权重的方法中,首先按照不同操作方式下的子指向权重,然后根据任务需求设置子指向权重的比例,进而得到最终的指向权重,这样可以结合具体场景对操作数据进行分析,提高本发明的实用性。还有,本发明中在计算子指向权重时,采用的是操作总次数,这样考虑了目标信息外的操作次数,获得的子指向权重更客观。
图4是根据本发明实施例的基于活跃度确定目标用户的装置的主要模块的示意图。如图4所示,本发明实施例的基于活跃度确定目标用户的装置400主要包括以下模块:获取模块401、确定模块402和筛选模块403。
其中,获取模块401可用于获取关键词,并根据关键词搜索在预设时间段内发布的目标信息;确定模块402可用于根据目标信息确定可选用户,并根据目标信息对应的总操作数据,计算可选用户的指向权重;筛选模块403可用于基于链接分析法,根据可选用户的指向权重,获取可选用户的活跃值,并根据活跃值从可选用户中筛选出目标用户。
本发明实施例中,确定模块402还可用于:按照操作方式的不同,将目标信息对应的总操作数据分成至少一类子操作数据;根据至少一类子操作数据,计算可选用户的子指向权重;设置子指向权重的比例,并根据比例和子指向权重,计算可选用户的指向权重。
本发明实施例中,确定模块402还可用于:针对每个可选用户,统计子操作数据中每个可选用户对应的指向用户、每个可选用户相对指向用户的操作次数;确定子操作数据对应的操作方式,并确定每个可选用户在操作方式下的操作总次数;根据每个可选用户在操作方式下的操作总次数、每个可选用户对应的指向用户、每个可选用户相对指向用户的操作次数,计算出每个可选用户相对于指向用户的子指向权重。
本发明实施例中,筛选模块403还可用于:将指向权重代入链接分析法的迭代公式中进行迭代计算;在迭代次数大于预设迭代次数或者连续两次迭代计算结果的变化量小于预设变化量的情况下,停止迭代计算,获得可选用户的活跃值。
从以上描述可以看出,本发明实施例的基于活跃度确定目标用户的装置因为通过搜索在发布时间内与关键词相关的目标信息,限制了领域和时间范围,所以克服了现有技术中需要对全网用户的所有信息进行迭代计算的技术问题,降低了计算代价,并且还通过分析目标信息中的操作数据,获取可选用户以及可选用户的指向权重,进而达到利用目标信息中的操作数据修正指向权重的效果,最后基于链接分析法,获得可选用户的活跃值,提取出活跃度高的目标用户,从而可以实现从限定某一领域的角度出发,获取该领域内活跃度较高的目标用户。此外,本发明中在计算可选用户的指向权重的方法中,首先按照不同操作方式下的子指向权重,然后根据任务需求设置子指向权重的比例,进而得到最终的指向权重,这样可以结合具体场景对操作数据进行分析,提高本发明的实用性。还有,本发明中在计算子指向权重时,采用的是操作总次数,这样考虑了目标信息外的操作次数,获得的子指向权重更客观。
图5示出了可以应用本发明实施例的基于活跃度确定目标用户的方法或基于活跃度确定目标用户的装置的示例性系统架构500。
如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的基于活跃度确定目标用户的方法一般由服务器505执行,相应地,基于活跃度确定目标用户的装置一般设置于服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图6,其示出了适于用来实现本发明实施例的终端设备的计算机系统600的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、确定模块和筛选模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“获取关键词,并根据关键词搜索在预设时间段内发布的目标信息的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取关键词,并根据关键词搜索在预设时间段内发布的目标信息;根据目标信息确定可选用户,并根据目标信息对应的总操作数据,计算可选用户的指向权重;基于链接分析法,根据可选用户的指向权重,获取可选用户的活跃值,并根据活跃值从可选用户中筛选出目标用户。
根据本发明实施例的技术方案,通过搜索在发布时间内与关键词相关的目标信息,限制了领域和时间范围,所以克服了现有技术中需要对全网用户的所有信息进行迭代计算的技术问题,降低了计算代价,并且还通过分析目标信息中的操作数据,获取可选用户以及可选用户的指向权重,进而达到利用目标信息中的操作数据修正指向权重的效果,最后基于链接分析法,获得可选用户的活跃值,提取出活跃度高的目标用户,从而可以实现从限定某一领域的角度出发,获取该领域内活跃度较高的目标用户。此外,本发明中在计算可选用户的指向权重的方法中,首先按照不同操作方式下的子指向权重,然后根据任务需求设置子指向权重的比例,进而得到最终的指向权重,这样可以结合具体场景对操作数据进行分析,提高本发明的实用性。还有,本发明中在计算子指向权重时,采用的是操作总次数,这样考虑了目标信息外的操作次数,获得的子指向权重更客观。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种基于活跃度确定目标用户的方法,其特征在于,包括:
获取关键词,并根据所述关键词搜索在预设时间段内发布的目标信息;
根据所述目标信息确定可选用户,并根据所述目标信息对应的总操作数据,计算所述可选用户的指向权重;
基于链接分析法,根据所述可选用户的指向权重,获取所述可选用户的活跃值,并根据所述活跃值从所述可选用户中筛选出目标用户。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标信息对应的总操作数据,计算所述可选用户的指向权重,包括:
按照操作方式的不同,将所述目标信息对应的总操作数据分成至少一类子操作数据;
根据所述至少一类子操作数据,计算所述可选用户的子指向权重;
设置所述子指向权重的比例,并根据所述比例和所述子指向权重,计算所述可选用户的指向权重。
3.根据权利要求2所述的方法,其特征在于,所述根据所述至少一类子操作数据,计算所述可选用户的子指向权重,包括:
针对每个可选用户,统计所述子操作数据中所述每个可选用户对应的指向用户、所述每个可选用户相对所述指向用户的操作次数;
确定所述子操作数据对应的操作方式,并确定所述每个可选用户在所述操作方式下的操作总次数;
根据所述每个可选用户在所述操作方式下的操作总次数、所述每个可选用户对应的指向用户、所述每个可选用户相对所述指向用户的操作次数,计算出所述每个可选用户相对于所述指向用户的子指向权重。
4.根据权利要求1所述的方法,其特征在于,所述基于链接分析法,根据所述可选用户的指向权重,获取所述可选用户的活跃值,包括:
将所述指向权重代入链接分析法的迭代公式中进行迭代计算;
在迭代次数大于预设迭代次数或者连续两次迭代计算结果的变化量小于预设变化量的情况下,停止迭代计算,获得所述可选用户的活跃值。
5.一种基于活跃度确定目标用户的装置,其特征在于,包括:
获取模块,用于获取关键词,并根据所述关键词搜索在预设时间段内发布的目标信息;
确定模块,用于根据所述目标信息确定可选用户,并根据所述目标信息对应的总操作数据,计算所述可选用户的指向权重;
筛选模块,用于基于链接分析法,根据所述可选用户的指向权重,获取所述可选用户的活跃值,并根据所述活跃值从所述可选用户中筛选出目标用户。
6.根据权利要求5所述的装置,其特征在于,所述确定模块还用于:
按照操作方式的不同,将所述目标信息对应的总操作数据分成至少一类子操作数据;
根据所述至少一类子操作数据,计算所述可选用户的子指向权重;
设置所述子指向权重的比例,并根据所述比例和所述子指向权重,计算所述可选用户的指向权重。
7.根据权利要求6所述的装置,其特征在于,所述确定模块还用于:
针对每个可选用户,统计所述子操作数据中所述每个可选用户对应的指向用户、所述每个可选用户相对所述指向用户的操作次数;
确定所述子操作数据对应的操作方式,并确定所述每个可选用户在所述操作方式下的操作总次数;
根据所述每个可选用户在所述操作方式下的操作总次数、所述每个可选用户对应的指向用户、所述每个可选用户相对所述指向用户的操作次数,计算出所述每个可选用户相对于所述指向用户的子指向权重。
8.根据权利要求5所述的装置,其特征在于,所述筛选模块还用于:
将所述指向权重代入链接分析法的迭代公式中进行迭代计算;
在迭代次数大于预设迭代次数或者连续两次迭代计算结果的变化量小于预设变化量的情况下,停止迭代计算,获得所述可选用户的活跃值。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-4中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910754200.9A CN112395510A (zh) | 2019-08-15 | 2019-08-15 | 基于活跃度确定目标用户的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910754200.9A CN112395510A (zh) | 2019-08-15 | 2019-08-15 | 基于活跃度确定目标用户的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112395510A true CN112395510A (zh) | 2021-02-23 |
Family
ID=74601630
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910754200.9A Pending CN112395510A (zh) | 2019-08-15 | 2019-08-15 | 基于活跃度确定目标用户的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112395510A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113220749A (zh) * | 2021-05-25 | 2021-08-06 | 中国农业银行股份有限公司 | 业务数据的处理方法、装置和电子设备 |
-
2019
- 2019-08-15 CN CN201910754200.9A patent/CN112395510A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113220749A (zh) * | 2021-05-25 | 2021-08-06 | 中国农业银行股份有限公司 | 业务数据的处理方法、装置和电子设备 |
CN113220749B (zh) * | 2021-05-25 | 2024-02-27 | 中国农业银行股份有限公司 | 业务数据的处理方法、装置和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106874492B (zh) | 搜索方法和装置 | |
CN109614402B (zh) | 多维数据查询方法和装置 | |
EP3356951B1 (en) | Managing a database of patterns used to identify subsequences in logs | |
US11423096B2 (en) | Method and apparatus for outputting information | |
CN109901987B (zh) | 一种生成测试数据的方法和装置 | |
CN108540508B (zh) | 用于推送信息的方法、装置和设备 | |
EP2802979A2 (en) | Processing store visiting data | |
CN108121814B (zh) | 搜索结果排序模型生成方法和装置 | |
WO2017045415A1 (zh) | 内容投放方法及装置 | |
CN107609192A (zh) | 一种搜索引擎的补充搜索方法和装置 | |
CN107291835B (zh) | 一种搜索词的推荐方法和装置 | |
CN111401684A (zh) | 一种任务处理的方法和装置 | |
CN110019802B (zh) | 一种文本聚类的方法和装置 | |
US10606909B2 (en) | Optimizing searches | |
US20150074121A1 (en) | Semantics graphs for enterprise communication networks | |
CN112395510A (zh) | 基于活跃度确定目标用户的方法和装置 | |
CN113722593B (zh) | 事件数据处理方法、装置、电子设备和介质 | |
CN113792232A (zh) | 页面特征计算方法、装置、电子设备、介质及程序产品 | |
CN113139113A (zh) | 搜索请求的处理方法和装置 | |
CN112905885A (zh) | 向用户推荐资源的方法、装置、设备、介质和程序产品 | |
CN113590322A (zh) | 一种数据处理方法和装置 | |
CN113269602A (zh) | 物品推荐的方法和装置 | |
CN112016017A (zh) | 确定特征数据的方法和装置 | |
CN114547455B (zh) | 热门对象确定方法、装置、存储介质及电子设备 | |
Postelnicu et al. | Improving websites' quality of service by shortening their browsing expected path length |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |