CN112800047B - 用户关联数据处理方法、装置、设备和存储介质 - Google Patents

用户关联数据处理方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN112800047B
CN112800047B CN202110235677.3A CN202110235677A CN112800047B CN 112800047 B CN112800047 B CN 112800047B CN 202110235677 A CN202110235677 A CN 202110235677A CN 112800047 B CN112800047 B CN 112800047B
Authority
CN
China
Prior art keywords
user
processing
data
event
associated data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110235677.3A
Other languages
English (en)
Other versions
CN112800047A (zh
Inventor
张文强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bigo Technology Pte Ltd
Original Assignee
Bigo Technology Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bigo Technology Pte Ltd filed Critical Bigo Technology Pte Ltd
Priority to CN202110235677.3A priority Critical patent/CN112800047B/zh
Publication of CN112800047A publication Critical patent/CN112800047A/zh
Application granted granted Critical
Publication of CN112800047B publication Critical patent/CN112800047B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2291User-Defined Types; Storage management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种用户关联数据处理方法、装置、设备和存储介质,该方法包括:获取用户数据处理策略以及存储的用户标识,所述用户标识依据各自的标识计算结果分组存储;获取所述用户标识对应的用户关联数据,所述用户标识和所述用户关联数据分离存储;根据所述用户关联数据确定满足所述用户数据处理策略的待处理用户,创建事件生成进程,通过所述事件生成进程生成所述待处理用户的处理事件;创建事件执行进程,通过所述事件执行进程执行所述处理事件。本方案提高了数据处理效率,降低了处理错误率,简化了处理操作流程,同时提高了数据处理的灵活性。

Description

用户关联数据处理方法、装置、设备和存储介质
技术领域
本申请实施例涉及计算机领域,尤其涉及一种用户关联数据处理方法、装置、设备和存储介质。
背景技术
针对用户的线上社交活动,系统会自动对社交行为进行相应记录。如针对每个用户,系统维护一用户主页,在用户主页中会显示访问该主页的访客信息,系统会针对每个用户记录关联的访客数量和访客到访时间等。
现有技术中,针对用户关联数据的存储方式通常为将关联数据根据数据区间来存放对应的用户标识,如访客数量0-4对应用户的用户标识存放在一起,访客数量5-20对应用户的用户标识存放在一起。该种方式的缺陷在于,当用户关联数据变更时,用户标识在各个数据区间进行迁移,存在操作效率低、操作易出错的问题;当出现关联数据调整策略变更时,需要对数据区间进行拆分、合并等操作,操作复杂;数据区间内用户标识数量的分布不均匀,由此导致数据处理效率降低,数据并发处理过程中,针对用户标识数量较多的数据区间其操作耗时会显著增加;在对关联数据进行调整时,数据区间中存在大量的非调整的冗余信息,严重影响数据遍历效率;在进行数据处理时,数据添加操作和数据处理时的条件判断操作共同执行,不利于数据负载分担。同时,在对用户关联数据进行处理时,不同的处理规则混合在同一份代码中,任何处理规则的改变都需要重新升级所有进程,使得处理流程变长且增加了错误风险;在对关联数据的针对性处理时,需要逐个查询数据区间内的数据,处理效率极低。
发明内容
本发明实施例提供了一种用户关联数据处理方法、装置、设备和存储介质,提高了数据处理效率,降低了处理错误率,简化了处理操作流程,同时提高了数据处理的灵活性。
第一方面,本发明实施例提供了一种用户关联数据处理方法,该方法包括:
获取用户数据处理策略以及存储的用户标识,所述用户标识依据各自的标识计算结果分组存储;
获取所述用户标识对应的用户关联数据,所述用户标识和所述用户关联数据分离存储;
根据所述用户关联数据确定满足所述用户数据处理策略的待处理用户,创建事件生成进程,通过所述事件生成进程生成所述待处理用户的处理事件;
创建事件执行进程,通过所述事件执行进程执行所述处理事件。
第二方面,本发明实施例还提供了一种用户关联数据处理装置,该装置包括:
处理信息获取模块,用于获取用户数据处理策略以及存储的用户标识,所述用户标识依据各自的标识计算结果分组存储;
用户数据获取模块,用于获取所述用户标识对应的用户关联数据,所述用户标识和所述用户关联数据分离存储;
处理用户确定模块,用于根据所述用户关联数据确定满足所述用户数据处理策略的待处理用户;
第一进程处理模块,用于创建事件生成进程,通过所述事件生成进程生成所述待处理用户的处理事件;
第二进程处理模块,用于创建事件执行进程,通过所述事件执行进程执行所述处理事件。
第三方面,本发明实施例还提供了一种用户关联数据处理设备,该设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例所述的用户关联数据处理方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行本发明实施例所述的用户关联数据处理方法。
本发明实施例中,通过获取用户数据处理策略以及存储的用户标识,所述用户标识依据各自的标识计算结果分组存储,获取所述用户标识对应的用户关联数据,所述用户标识和所述用户关联数据分离存储,根据所述用户关联数据确定满足所述用户数据处理策略的待处理用户,创建事件生成进程,通过所述事件生成进程生成所述待处理用户的处理事件,创建事件执行进程,通过所述事件执行进程执行所述处理事件,提高了数据处理效率,降低了处理错误率,简化了处理操作流程,同时提高了数据处理的灵活性。
附图说明
图1为本发明实施例提供的一种用户关联数据处理方法的流程图;
图2为本发明实施例提供的另一种用户关联数据处理方法的流程图;
图3为本发明实施例提供的另一种用户关联数据处理方法的流程图;
图4为本发明实施例提供的另一种用户关联数据处理方法的流程图;
图5为本发明实施例提供的一种用户关联数据处理装置的结构框图;
图6为本发明实施例提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明实施例,而非对本发明实施例的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明实施例相关的部分而非全部结构。
图1为本发明实施例提供的一种用户关联数据处理方法的流程图,本实施例可适用于对社交用户数据进行处理,该方法可以由计算设备如服务器来执行,具体包括如下步骤:
步骤S101、获取用户数据处理策略以及存储的用户标识,所述用户标识依据各自的标识计算结果分组存储。
其中,用户数据处理策略为对用户关联数据进行优化处理的具体方式。以用户关联数据包括访问记录数据为例,用户在社交过程中其主页或个人数据被访问后会相应的显示访问记录信息,该访问记录信息可以包括访客的具体信息如头像、访问时间以及被访问的访客总量等。对应的,用户数据处理策略可以是针对访客数量小于一定阈值(如访客数量少于10)的用户进行虚拟访客数量的增加,或者生成该用户的推荐信息以更多的分享推荐给关联用户等。通过用户数据处理策略以使用户得到更优的使用体验。
其中,用户标识为每个用户对应分配的唯一标识,如常见的用户id(即uid)。系统中针对每个使用用户均生成一用户标识进行存储。在一个实施例中,用户标识依据各自的标识计算结果分组存储。即对用户标识进行单独存储而非采用和用户关联数据存储在一起的策略。示例性的,用户标识使用pika存储系统的set数据结构进行保存,pika是开源的一款类redis存储系统。
在一个实施例中,用户标识依据各自的标识计算结果分组存储。具体的,用户标识以阿拉伯数字方式表征,通过对该用户标识进行计算后根据计算结果进行分组存储。如通过预设公式计算每个用户标识对应的余数,将余数相同的用户标识划分至同一组进行存储。示例性的,该预设公式可以是uid%1000,如uid=0,则0%1000=0;uid=999,则999%1000=999;uid=1001,则1001%1000=1。通过计算得到每个用户标识对应的余数后,将余数相同的用户标识划分至同一分组,即通过该种分组方式可将所有的用户标识均匀分布至1000个key中进行存储。
在一个实施例中,前述的预设公式可适应性调整。具体的,获取当前用户标识的标识数量,根据标识数量确定对应的预设公式。如公式uid%1000中uid的数量级为十万至百万,当用户uid数量级在百万至千万时,公式可以是uid%10000,通过综合考虑数据处理量以及数据存储空间均匀的将用户标识进行分组存储。
步骤S102、获取所述用户标识对应的用户关联数据,所述用户标识和所述用户关联数据分离存储。
其中,用户关联数据包括和用户相关的数据,如用户的注册时间、上次登录时间、访客数、国籍等数据。本方案中,用户标识和用户关联数据分离存储,而非如采用列表形式将用户标识和对应的用户相关的数据一起存储。在需要基于用户数据处理策略对用户数据进行处理时,首先获取存储的用户标识,通过预设接口查询确定该用户标识对应的用户关联数据(如用户的访问记录数据)。
步骤S103、根据所述用户关联数据确定满足所述用户数据处理策略的待处理用户,创建事件生成进程,通过所述事件生成进程生成所述待处理用户的处理事件。
在一个实施例中,该用户数据处理策略包括需要处理的用户所满足的条件。以对用户的访客记录进行处理为例,其处理的条件可以是针对访客数量小于10的用户进行访客记录数据的处理。相应的,确定存储的用户标识对应的用户关联数据中,在访客记录数据中小于10名访客的用户为待处理用户。
在一个实施例中,在对用户关联数据进行处理时,如增加用户的访客数量或推荐次数时,通过单独创建的事件生成进程以生成待处理用户的处理事件。示例性的,该处理事件可以是对访客数量少于10的待处理用户增加其访客数量。
在一个实施例中,用户标识被均匀分布存储在key为0到key为999的1000个key中,如每个key中存储由1万个用户标识。在执行用户数据处理策略时,依次从每个key中取出n个用户标识进行处理,即查询该n个用户标识中的待处理用户,当确定完毕后,继续从该key再次顺序的取出n个用户标识,查询该再次取出的n个用户标识中的待处理用户,直到当前key中用户标识查询完毕后,在key+1对应的key分组中取出n个用户标识,直至所有用户标识处理完毕。
步骤S104、创建事件执行进程,通过所述事件执行进程执行所述处理事件。
其中,事件执行进程用于实现对S103中生成的处理事件进行执行。以用户数据处理策略为增加特定用户的访客记录为例,对应的处理事件包括待处理用户的id以及对应的增加访客的数量。如用户id为a、b、c的用户增加访客记录10条,用户id为m、n、h的用户增加访客记录20条。可选的,该增加的访客记录可以是虚拟访客的访问记录。
由上述方案可知,本方案中用户标识依据各自的标识计算结果分组存储,使其随机均匀分布,并非依据具体的用户关联数据进行排序存储,如将访客数量0-4的用户标识存放在一个分组,将访客数量5-20的用户标识存放在一个分组,由此避免了当用户关联数据变更时,用户标识在各个数据区间进行迁移,操作效率低、操作易出错的问题;当出现数据调整策略变更时,如由对访客数量少于4的用户进行调整变更为对访客数量少于6的用户进行调整时,需要对数据区间进行拆分、合并等操作,造成的操作复杂的问题。该种分组方式,避免了原有的数据区间存储时,在对关联数据进行调整时,数据区间中存在大量的非调整的冗余信息,严重影响数据遍历效率的问题。同时,解决了现有的数据分区存储时,数据添加操作和数据处理时的条件判断操作共同执行,造成的不利于数据负载分担的问题。本方案中,用户标识和用户关联数据分离存储,在处理事件的生成和执行过程中采用不同的进程进行处理,解决了不同的处理规则混合在同一份代码中,任何处理规则的改变都需要重新升级所有进程,使得处理流程变长且增加了错误风险的问题。最终,本方案提高了数据处理效率,降低了处理错误率,简化了处理操作流程,同时提高了数据处理的灵活性。
图2为本发明实施例提供的另一种用户关联数据处理方法的流程图,对待处理用户的筛选进行了进一步优化。如图2所示,技术方案具体如下:
步骤S201、获取用户数据处理策略以及存储的用户标识,所述用户标识依据各自的标识计算结果分组存储。
步骤S202、获取所述用户标识对应的用户关联数据,所述用户标识和所述用户关联数据分离存储。
在一个实施例中,用户关联数据包括用户活跃度数据,其中该用户活跃度数据可以是用户上一次的登录时间。
步骤S203、根据所述用户活跃度数据确定活跃用户的用户标识,确定所述活跃用户的用户标识对应的访问记录数据,将所述访问记录数据满足所述用户数据处理策略的用户确定为待处理用户。
在一个实施例中,根据用户活跃度数据确定活跃用户的用户标识,其中该活跃用户可以是在预设天数(如90天)内进行过登录的用户。具体的,根据记录的用户活跃度数据即用户上一次的登录时间距离当前时间的间隔确定是否大于预设天数,如果不大于该预设天数,则判定该用户为活跃用户。相应的,确定该活跃用户的用户标识对应的访问记录数据,将所述访问记录数据满足所述用户数据处理策略的用户确定为待处理用户。
步骤S204、创建事件生成进程,通过所述事件生成进程生成所述待处理用户的处理事件,创建事件执行进程,通过所述事件执行进程执行所述处理事件。
由上述方案可知,在对用户关联数据进行处理中,确定待处理用户时,选定活跃用户对其进行策略处理,提高了数据处理效率,使得处理效果得以显著体现。
图3为本发明实施例提供的另一种用户关联数据处理方法的流程图,对存储的用户标识进行了优化处理。如图3所示,技术方案具体如下:
步骤S301、获取用户数据处理策略以及存储的用户标识,所述用户标识依据各自的标识计算结果分组存储。
步骤S302、获取所述用户标识对应的用户关联数据,所述用户标识和所述用户关联数据分离存储。
步骤S303、根据所述用户活跃度数据确定活跃用户的用户标识,确定所述活跃用户的用户标识对应的访问记录数据,将所述访问记录数据满足所述用户数据处理策略的用户确定为待处理用户。
步骤S304、创建事件生成进程,通过所述事件生成进程生成所述待处理用户的处理事件,创建事件执行进程,通过所述事件执行进程执行所述处理事件。
步骤S305、根据所述用户活跃度数据确定流失用户的用户标识,将所述流失用户的用户标识保存至创建的列表中,将所述流失用户的用户标识在分组存储的用户标识中进行删除。
在一个实施例中,在用户关联数据处理的处理过程中,基于用户活跃度数据确定流失用户。示例性的,该活跃度数据可以是用户的上一次登录时的登录时间,还可以是用户的发布留言的次数、访问其他用户主页的次数等。如将上一次登录时间距离当前时间大于60天,且发布留言总次数小于3次,访问其他用户主页的总次数小于2次的用户确定为流失用户。将该流失用户的用户标识保存至创建的列表中,同时将流失用户的用户标识在分组存储的用户标识中进行删除。
由上述方案可知,针对流失用户进行了相应的用户标识的处理,避免了后续对用户关联数据进行处理时,过度的消耗处理资源,同时本方案中用户标识依据各自的标识计算结果分组存储,用户标识和用户关联数据分离存储,降低了用户标识处理复杂度,避免了在对关联数据的针对性处理时,需要逐个查询数据区间内的数据,处理效率极低的问题,提高了数据处理效率,降低了处理错误率,简化了处理操作流程,同时提高了数据处理的灵活性。
图4为本发明实施例提供的另一种用户关联数据处理方法的流程图,在创建事件生成进程时,对其进行了进一步优化。如图4所示,技术方案具体如下:
步骤S401、获取用户数据处理策略以及存储的用户标识,所述用户标识依据各自的标识计算结果分组存储。
步骤S402、获取所述用户标识对应的用户关联数据,所述用户标识和所述用户关联数据分离存储。
步骤S403、根据所述用户活跃度数据确定活跃用户的用户标识,确定所述活跃用户的用户标识对应的访问记录数据,将所述访问记录数据满足所述用户数据处理策略的用户确定为待处理用户。
步骤S404、为每个数据处理事件创建一个事件生成进程,通过每个单独创建的事件生成进程生成对应待处理用户的处理事件。
在一个实施例中,当前的用户数据处理策略包括多个不同的数据处理事件。如针对用户访客数量少于5的用户id,为其增加4个虚拟访客记录;针对用户访客数量5-10的用户id,为其增加10个虚拟访客记录;用户访客数量11-20的用户id,为其增加6个虚拟访客记录。相应的,针对用户访客数量少于5的用户id,为其增加4个虚拟访客记录的处理事件创建a进程;针对用户访客数量5-10的用户id,为其增加10个虚拟访客记录的处理事件创建b进程;针对用户访客数量11-20的用户id,为其增加6个虚拟访客记录的处理事件,为其创建c进程。通过a进程执行用户访客数量少于5的用户id的处理事件的生成,通过b进程执行用户访客数量5-10的用户id的处理事件的生成,通过c进程执行用户访客数量11-20的用户id的处理事件的生成。
步骤S405、创建事件执行进程,通过所述事件执行进程执行所述处理事件。
步骤S406、根据所述用户活跃度数据确定流失用户的用户标识,将所述流失用户的用户标识保存至创建的列表中,将所述流失用户的用户标识在分组存储的用户标识中进行删除。
由上述方案可知,为每个数据处理事件创建一个事件生成进程,通过每个单独创建的事件生成进程生成对应待处理用户的处理事件,避免了任何处理规则的改变都需要重新升级所有进程,使得处理流程变长且增加了错误风险的问题,提高了数据处理效率,降低了处理错误率,简化了处理操作流程,同时提高了数据处理的灵活性。
图5为本发明实施例提供的一种用户关联数据处理装置的结构框图,该装置用于执行上述实施例提供的用户关联数据处理方法,具备执行方法相应的功能模块和有益效果。如图5所示,该装置具体包括:处理信息获取模块101、用户数据获取模块102、处理用户确定模块103、第一进程处理模块104和第二进程处理模块105,其中,
处理信息获取模块101,用于获取用户数据处理策略以及存储的用户标识,所述用户标识依据各自的标识计算结果分组存储;
用户数据获取模块102,用于获取所述用户标识对应的用户关联数据,所述用户标识和所述用户关联数据分离存储;
处理用户确定模块103,用于根据所述用户关联数据确定满足所述用户数据处理策略的待处理用户;
第一进程处理模块104,用于创建事件生成进程,通过所述事件生成进程生成所述待处理用户的处理事件;
第二进程处理模块105,用于创建事件执行进程,通过所述事件执行进程执行所述处理事件。
由上述方案可知,通过获取用户数据处理策略以及存储的用户标识,所述用户标识依据各自的标识计算结果分组存储,获取所述用户标识对应的用户关联数据,所述用户标识和所述用户关联数据分离存储,根据所述用户关联数据确定满足所述用户数据处理策略的待处理用户,创建事件生成进程,通过所述事件生成进程生成所述待处理用户的处理事件,创建事件执行进程,通过所述事件执行进程执行所述处理事件,本方案中用户标识依据各自的标识计算结果分组存储,使其随机均匀分布,并非依据具体的用户关联数据进行排序存储,如将访客数量0-4的用户标识存放在一个分组,将访客数量5-20的用户标识存放在一个分组,由此避免了当用户关联数据变更时,用户标识在各个数据区间进行迁移,操作效率低、操作易出错的问题;当出现数据调整策略变更时,如由对访客数量少于4的用户进行调整变更为对访客数量少于6的用户进行调整时,需要对数据区间进行拆分、合并等操作,造成的操作复杂的问题。该种分组方式,避免了原有的数据区间存储时,在对关联数据进行调整时,数据区间中存在大量的非调整的冗余信息,严重影响数据遍历效率的问题。同时,解决了现有的数据分区存储时,数据添加操作和数据处理时的条件判断操作共同执行,造成的不利于数据负载分担的问题。本方案中,用户标识和用户关联数据分离存储,在处理事件的生成和执行过程中采用不同的进程进行处理,解决了不同的处理规则混合在同一份代码中,任何处理规则的改变都需要重新升级所有进程,使得处理流程变长且增加了错误风险的问题。最终,本方案提高了数据处理效率,降低了处理错误率,简化了处理操作流程,同时提高了数据处理的灵活性。
在一个可能的实施例中,该装置还包括标识处理模块106,用于:
在所述获取用户数据处理策略以及存储的用户标识之前,通过预设公式计算每个用户标识对应的余数,将余数相同的用户标识划分至同一组进行存储。
在一个可能的实施例中,所述标识处理模块106还用于:
在通过预设公式计算每个用户标识对应的余数之前,获取当前用户标识的标识数量,根据所述标识数量确定对应的预设公式。
在一个可能的实施例中,所述用户数据获取模块102具体用于:
通过预设数据接口,获取所述用户标识对应的用户关联数据。
在一个可能的实施例中,所述处理用户确定模块103具体用于:
根据所述用户活跃度数据确定活跃用户的用户标识;
确定所述活跃用户的用户标识对应的访问记录数据;
将所述访问记录数据满足所述用户数据处理策略的用户确定为待处理用户。
在一个可能的实施例中,所述标识处理模块106还用于:
根据所述用户活跃度数据确定流失用户的用户标识,将所述流失用户的用户标识保存至创建的列表中;
将所述流失用户的用户标识在分组存储的用户标识中进行删除。
在一个可能的实施例中,所述用户数据处理策略包括至少两个数据处理事件,所述第一进程处理模块104具体用于:
为每个数据处理事件创建一个事件生成进程;
通过每个单独创建的事件生成进程生成对应待处理用户的处理事件。
图6为本发明实施例提供的一种用户关联数据处理设备的结构示意图,如图6所示,该设备包括处理器201、存储器202、输入装置203和输出装置204;设备中处理器201的数量可以是一个或多个,图6中以一个处理器201为例;设备中的处理器201、存储器202、输入装置203和输出装置204可以通过总线或其他方式连接,图6中以通过总线连接为例。存储器202作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的用户关联数据处理方法对应的程序指令/模块。处理器201通过运行存储在存储器202中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的用户关联数据处理方法。输入装置203可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置204可包括显示屏等显示设备。
本发明实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种用户关联数据处理方法,该方法包括:
获取用户数据处理策略以及存储的用户标识,所述用户标识依据各自的标识计算结果分组存储;
获取所述用户标识对应的用户关联数据,所述用户标识和所述用户关联数据分离存储;
根据所述用户关联数据确定满足所述用户数据处理策略的待处理用户,创建事件生成进程,通过所述事件生成进程生成所述待处理用户的处理事件;
创建事件执行进程,通过所述事件执行进程执行所述处理事件。
值得注意的是,上述用户关联数据处理装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。
注意,上述仅为本发明实施例的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明实施例不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明实施例的保护范围。因此,虽然通过以上实施例对本发明实施例进行了较为详细的说明,但是本发明实施例不仅仅限于以上实施例,在不脱离本发明实施例构思的情况下,还可以包括更多其他等效实施例,而本发明实施例的范围由所附的权利要求范围决定。

Claims (9)

1.用户关联数据处理方法,其特征在于,包括:
获取用户数据处理策略以及存储的用户标识,所述用户标识依据各自的标识计算结果分组存储;
获取所述用户标识对应的用户关联数据,所述用户标识和所述用户关联数据分离存储,所述用户关联数据包括用户活跃度数据以及访问记录数据;
根据所述用户关联数据确定满足所述用户数据处理策略的待处理用户,其中,包括根据所述用户活跃度数据确定活跃用户的用户标识,确定所述活跃用户的用户标识对应的访问记录数据,将所述访问记录数据满足所述用户数据处理策略的用户确定为待处理用户,创建事件生成进程,通过所述事件生成进程生成所述待处理用户的处理事件;
创建事件执行进程,通过所述事件执行进程执行所述处理事件。
2.根据权利要求1所述的用户关联数据处理方法,其特征在于,在所述获取用户数据处理策略以及存储的用户标识之前,还包括:
通过预设公式计算每个用户标识对应的余数,将余数相同的用户标识划分至同一组进行存储。
3.根据权利要求2所述的用户关联数据处理方法,其特征在于,在通过预设公式计算每个用户标识对应的余数之前,还包括:
获取当前用户标识的标识数量,根据所述标识数量确定对应的预设公式。
4.根据权利要求1所述的用户关联数据处理方法,其特征在于,所述获取所述用户标识对应的用户关联数据,包括:
通过预设数据接口,获取所述用户标识对应的用户关联数据。
5.根据权利要求1所述的用户关联数据处理方法,其特征在于,还包括:
根据所述用户活跃度数据确定流失用户的用户标识,将所述流失用户的用户标识保存至创建的列表中;
将所述流失用户的用户标识在分组存储的用户标识中进行删除。
6.根据权利要求1所述的用户关联数据处理方法,其特征在于,所述用户数据处理策略包括至少两个数据处理事件,所述创建事件生成进程,通过所述事件生成进程生成所述待处理用户的处理事件,包括:
为每个数据处理事件创建一个事件生成进程;
通过每个单独创建的事件生成进程生成对应待处理用户的处理事件。
7.用户关联数据处理装置,其特征在于,包括:
处理信息获取模块,用于获取用户数据处理策略以及存储的用户标识,所述用户标识依据各自的标识计算结果分组存储;
用户数据获取模块,用于获取所述用户标识对应的用户关联数据,所述用户标识和所述用户关联数据分离存储,所述用户关联数据包括用户活跃度数据以及访问记录数据;
处理用户确定模块,用于根据所述用户活跃度数据确定活跃用户的用户标识,确定所述活跃用户的用户标识对应的访问记录数据,将所述访问记录数据满足所述用户数据处理策略的用户确定为待处理用户;
第一进程处理模块,用于创建事件生成进程,通过所述事件生成进程生成所述待处理用户的处理事件;
第二进程处理模块,用于创建事件执行进程,通过所述事件执行进程执行所述处理事件。
8.一种用户关联数据处理设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一项所述的用户关联数据处理方法。
9.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-6中任一项所述的用户关联数据处理方法。
CN202110235677.3A 2021-03-03 2021-03-03 用户关联数据处理方法、装置、设备和存储介质 Active CN112800047B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110235677.3A CN112800047B (zh) 2021-03-03 2021-03-03 用户关联数据处理方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110235677.3A CN112800047B (zh) 2021-03-03 2021-03-03 用户关联数据处理方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN112800047A CN112800047A (zh) 2021-05-14
CN112800047B true CN112800047B (zh) 2024-04-05

Family

ID=75816404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110235677.3A Active CN112800047B (zh) 2021-03-03 2021-03-03 用户关联数据处理方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN112800047B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177063A (zh) * 2011-12-23 2013-06-26 Sap股份公司 用于时间数据聚合的时间滑动操作器
CN106294352A (zh) * 2015-05-13 2017-01-04 姚猛 一种文件处理方法、装置和文件系统
CN110727698A (zh) * 2019-09-09 2020-01-24 上海陆家嘴国际金融资产交易市场股份有限公司 数据库访问方法、装置、计算机设备和存储介质
CN111402066A (zh) * 2020-02-22 2020-07-10 中国平安财产保险股份有限公司 数据处理方法、服务器及存储介质
CN111666298A (zh) * 2020-04-29 2020-09-15 中国平安财产保险股份有限公司 基于flink的用户服务类别检测方法、装置、计算机设备
CN111782966A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 用户分群方法、装置、计算机设备和介质
CN111813783A (zh) * 2020-07-27 2020-10-23 南方电网数字电网研究院有限公司 数据处理方法、装置、计算机设备和存储介质
CN112039896A (zh) * 2020-08-29 2020-12-04 中国平安财产保险股份有限公司 一种数据处理方法、设备、服务器及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7680786B2 (en) * 2006-10-30 2010-03-16 Yahoo! Inc. Optimization of targeted advertisements based on user profile information
US10896420B2 (en) * 2018-11-28 2021-01-19 Capital One Services, Llc Product analysis platform to perform a facial recognition analysis to provide information associated with a product to a user

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103177063A (zh) * 2011-12-23 2013-06-26 Sap股份公司 用于时间数据聚合的时间滑动操作器
CN106294352A (zh) * 2015-05-13 2017-01-04 姚猛 一种文件处理方法、装置和文件系统
CN110727698A (zh) * 2019-09-09 2020-01-24 上海陆家嘴国际金融资产交易市场股份有限公司 数据库访问方法、装置、计算机设备和存储介质
CN111402066A (zh) * 2020-02-22 2020-07-10 中国平安财产保险股份有限公司 数据处理方法、服务器及存储介质
CN111666298A (zh) * 2020-04-29 2020-09-15 中国平安财产保险股份有限公司 基于flink的用户服务类别检测方法、装置、计算机设备
CN111782966A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 用户分群方法、装置、计算机设备和介质
CN111813783A (zh) * 2020-07-27 2020-10-23 南方电网数字电网研究院有限公司 数据处理方法、装置、计算机设备和存储介质
CN112039896A (zh) * 2020-08-29 2020-12-04 中国平安财产保险股份有限公司 一种数据处理方法、设备、服务器及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
User role identification based on social behavior and networking analysis for information dissemination;Zhou, XK等;《FUTURE GENERATION COMPUTER SYSTEMS-THE INTERNATIONAL JOURNAL OF ESCIENCE》;第96卷;639-648 *
基于用户关联与主题关注的朋友圈兴趣组发现方法;石小丹等;《计算机系统应用》;第26卷(第6期);137-142 *

Also Published As

Publication number Publication date
CN112800047A (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
US11297130B2 (en) Cluster resource management in distributed computing systems
US9792456B2 (en) Methods and systems for regulating user engagement
US20160378637A1 (en) Multi-tenant aware debugging methods and systems
CN106528289B (zh) 资源的操作处理方法及装置
CN113900598B (zh) 基于区块链的数据存储方法、装置、设备以及存储介质
CN112738172B (zh) 区块链节点的管理方法、装置、计算机设备和存储介质
US20170046376A1 (en) Method and system for monitoring data quality and dependency
US11221890B2 (en) Systems and methods for dynamic partitioning in distributed environments
CN115202908B (zh) 一种基于动态编排的隐私计算请求响应方法及装置
CN112636982A (zh) 网络对抗环境配置方法及用于网络对抗的实验云平台系统
US9749271B2 (en) Automatic isolation and detection of outbound spam
US10162830B2 (en) Systems and methods for dynamic partitioning in distributed environments
CN104077188A (zh) 一种用于任务调度的方法和装置
CN115865502B (zh) 权限管控方法、装置、设备及存储介质
CN112800047B (zh) 用户关联数据处理方法、装置、设备和存储介质
CN113127906A (zh) 基于c/s架构的统一权限管理平台、方法及存储介质
US20210165907A1 (en) Systems and methods for intelligent and quick masking
CN116451278A (zh) 星型连接工作负载查询隐私保护方法、系统、设备及介质
CN110275772B (zh) 一种数据处理方法及其相关设备
CN112149139A (zh) 权限管理方法及装置
US11233796B2 (en) Data-driven attribute selection for user application entitlement analysis
JP7096145B2 (ja) クラスタリング装置、クラスタリング方法及びクラスタリングプログラム
CN112988874A (zh) 一种数据处理方法、系统、计算设备及可读存储介质
EP3627359B1 (en) Transaction processing method, device and equipment
CN114819195A (zh) 集成学习模型的训练方法、装置、系统和相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant