CN111782966B - 用户分群方法、装置、计算机设备和介质 - Google Patents

用户分群方法、装置、计算机设备和介质 Download PDF

Info

Publication number
CN111782966B
CN111782966B CN202010616220.2A CN202010616220A CN111782966B CN 111782966 B CN111782966 B CN 111782966B CN 202010616220 A CN202010616220 A CN 202010616220A CN 111782966 B CN111782966 B CN 111782966B
Authority
CN
China
Prior art keywords
target
data
piece
user behavior
time period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010616220.2A
Other languages
English (en)
Other versions
CN111782966A (zh
Inventor
黄斐乔
林江红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010616220.2A priority Critical patent/CN111782966B/zh
Publication of CN111782966A publication Critical patent/CN111782966A/zh
Priority to US17/197,116 priority patent/US11580136B2/en
Priority to KR1020210032760A priority patent/KR102522274B1/ko
Priority to EP21162377.2A priority patent/EP3825861A3/en
Priority to JP2021055973A priority patent/JP7269980B2/ja
Application granted granted Critical
Publication of CN111782966B publication Critical patent/CN111782966B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种用户分群方法,涉及人工智能领域,具体涉及大数据领域的数据挖掘技术。该方法包括:获取预定用户群体的分群条件,分群条件包括:时间筛选条件和事件筛选条件;基于时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段;针对每条用户行为数据,基于该条用户行为数据和该条用户行为数据的至少一个目标时间段中的每个目标时间段,确定该条用户行为数据关于每个目标时间段的关联数据,以由关联数据构成关联表;并且,基于待测时间和事件筛选条件,从关联表中筛选针对待测时间的目标关联数据,以根据目标关联数据确定属于预定用户群体的目标用户。本公开还提供了用户分群装置、计算机设备和介质。

Description

用户分群方法、装置、计算机设备和介质
技术领域
本公开涉及人工智能领域,具体涉及大数据领域的数据挖掘技术。更具体地,本公开提供了一种用户分群方法、装置、计算机设备和介质。
背景技术
用户分群是指依据业务场景的需要对用户进行筛选,过滤出符合预定分群条件的目标用户群体的过程。用户分群结果可以用于网站或应用(application)关于用户群体的用户行为分析过程中。通常可以根据用户数据进行用户分群,用户数据可以包括用户属性数据和用户行为数据。在基于用户行为数据的用户分群方案中,现有技术需要针对每个预定时间段例行一次针对用户行为数据库的查询和存储的逻辑,导致占用大量的计算资源和存储空间,且灵活性较差。
发明内容
有鉴于此,本公开提供了一种用户分群方法、装置、计算机设备和介质。
本公开的一个方面提供了一种用户分群方法,包括:获取预定用户群体的分群条件,分群条件包括:时间筛选条件和事件筛选条件;基于时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段;针对每条用户行为数据,基于该条用户行为数据和该条用户行为数据的至少一个目标时间段中的每个目标时间段,确定该条用户行为数据关于每个目标时间段的关联数据,以由关联数据构成关联表;并且,基于待测时间和事件筛选条件,从关联表中筛选针对待测时间的目标关联数据,以根据目标关联数据确定属于预定用户群体的目标用户。
本公开的另一方面提供了一种用户分群装置,包括:获取模块、第一确定模块、第二确定模块和分群模块。获取模块用于获取预定用户群体的分群条件,分群条件包括:时间筛选条件和事件筛选条件。第一确定模块用于基于时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段。第二确定模块用于针对每条用户行为数据,基于该条用户行为数据和该条用户行为数据的至少一个目标时间段中的每个目标时间段,确定该条用户行为数据关于每个目标时间段的关联数据,以由关联数据构成关联表。分群模块用于基于待测时间和事件筛选条件,从关联表中筛选针对待测时间的目标关联数据,以根据目标关联数据确定属于预定用户群体的目标用户。
本公开的另一方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方法。
根据本公开实施例的用户分群方法在每条用户行为数据产生后,根据分群条件中的时间筛选条件从该条用户行为数据推算出该条用户行为数据所对应的所有可能的目标时间段。并根据每条用户行为数据和目标时间段之间的关联关系来构建关联表,关联表中的每条关联数据用于表征一条用户行为数据和该条用户行为数据的一个目标时间段之间的关联关系符合上述时间筛选条件,从而使得关联表能够涵盖已有的所有符合上述时间筛选条件的关联数据。再基于关联表中符合待测时间和事件筛选条件的目标关联数据,确定预定用户群体的目标用户。上述过程可以在每次产生新的用户行为数据时针对该新的用户行为数据执行,相比于相关技术中从目标时间段的角度出发,关于每个预定时间段进行一次用户行为数据库整体的遍历式查询和存储的方案,可以有效节省计算资源和存储空间。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的应用用户分群方法和装置的示例性系统架构;
图2示意性示出了根据本公开实施例的用户分群方法的流程图;
图3示意性示出了根据本公开另一实施例的用户分群方法的示例流程图;
图4示意性示出了根据本公开实施例的用户分群过程的示例示意图;
图5示意性示出了根据本公开实施例的用户分群装置的框图;以及
图6示意性示出了根据本公开实施例的计算机设备的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
本公开的实施例提供了一种用户分群方法、装置、计算机设备和介质。该用户分群方法可以包括获取过程、第一确定过程、第二确定过程和分群过程。在获取过程中,获取预定用户群体的分群条件,该分群条件可以包括:时间筛选条件和事件筛选条件。然后进行第一确定过程,基于时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段。接着进行第二确定过程,针对每条用户行为数据,基于该条用户行为数据和该条用户行为数据的至少一个目标时间段中的每个目标时间段,确定该条用户行为数据关于每个目标时间段的关联数据,以由关联数据构成关联表。再进行分群过程,基于待测时间和事件筛选条件,从关联表中筛选针对待测时间的目标关联数据,以根据目标关联数据确定属于预定用户群体的目标用户。
用户分群是指依据业务场景的需要对用户进行筛选,过滤出符合预定分群条件的目标用户群体的过程。用户分群结果可以用于网站或应用关于用户群体的用户行为分析过程中。通常可以根据用户数据进行用户分群,用户数据可以包括用户属性数据和用户行为数据。其中由于用户行为数据能够反映用户的动态行为特征,基于用户行为数据的用户分群方案可以获得实时性较好、准确度较高的用户分群结果。
图1示意性示出了根据本公开实施例的可以应用用户分群方法和装置的示例性系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括多个终端设备110、网络120和服务器130。其中,终端设备110可以是各种终端设备,例如台式机、便携式计算机、智能手机、平板电脑等,在此不做限制。服务器130可以是各种具有一定计算能力的电子设备,例如服务器、服务器集群等,在此不做限制。
响应于用户在终端设备110上的操作行为(以电商平台为例,操作行为例如包括:登录行为、访问页面行为、浏览商品行为、购买商品行为、收藏商品行为等),服务器130可以将针对该操作行为的用户行为数据按照单个行为的粒度存入用户行为数据库131中。用户行为数据库131可以为关系型数据库。在用户行为数据较多的情况下,用户行为数据库131也可以采用大型分布式数据仓库。示例性地,用户行为数据库131可以包括一条或多条用户行为数据,用户行为数据可以包括用户标识信息、事件描述信息和用于指示事件发生时间(例如包括发生日期和发生时刻)的第一时间信息。例如可以如表1所示。
表1
基于上述用户行为数据库131中的用户行为数据,服务器130可以利用查询引擎132对用户行为数据库131进行用户分群操作,以确定一个或多个用户群体。
一种处理方式下,在进行用户分群时,从观察窗口中的每个预定时间段的角度出发,针对每个预定时间段,均对用户行为数据库进行一次遍历式查询,以查找到与待测时间之间的关系符合分群条件的用户行为数据并进行存储。其中,观察窗口表征在确定分群结果后,后续基于分群结果进行用户行为分析时所关注的时间段。观察窗口可以包括一个或多个预定时间段,预定时间段可以根据实际需要进行设置,例如可以为1天、1小时、1星期等。分群条件表征预定用户群体需要符合的特征信息。
例如,以1天为预定时间段。设置分群条件指示“在过去3天内,购买商品A的次数大于等于2次”。设置观察窗口为2019年1月10日至2019年1月12日。依据该处理方式,针对观察窗口中的第一个预定时间段2019年1月10日,需要以用户标识信息为索引,从用户行为数据库中查找事件发生日期为2019年1月7日、2019年1月8日和2019年1月9日之一的且事件描述信息符合上述“购买商品A的次数大于等于2”的用户标识信息并存储。接着针对观察窗口中的第二个预定时间段2019年1月11日,需要以用户标识信息为索引,从用户行为数据库中查找事件发生日期为2019年1月8日、2019年1月9日和2019年1月10日之一且事件描述信息符合上述“购买商品A的次数大于等于2”的用户标识信息并存储。接着针对观察窗口中的第三个预定时间段2019年1月12日,需要以用户标识信息为索引,从用户行为数据库中查找事件发生日期为2019年1月9日、2019年1月10日和2019年1月11日之一且事件描述信息符合上述“购买商品A的次数大于等于2”的用户标识信息并存储。
由于上述处理方式需要针对每个预定时间段例行一次针对用户行为数据库的查询和存储的逻辑,导致占用大量的计算资源和存储空间,且灵活性较差。
根据本公开实施例,提供了一种用户分群方法。下面通过图例对该方法进行示例性说明。应注意,以下方法中各个操作的序号仅作为该操作的表示以便描述,而不应被看作表示该各个操作的执行顺序。除非明确指出,否则该方法不需要完全按照所示顺序来执行。
图2示意性示出了根据本公开实施例的用户分群方法的流程图,该用户分群方法例如可以在图1所示的服务器侧执行。
如图2所示,该方法可以包括操作S201~操作S204。
在操作S201,获取预定用户群体的分群条件。
示例性地,预定用户群体的分群条件用于指示预定用户群体需要符合的特征信息。基于该分群条件进行用户分群,所得到的目标用户属于预定用户群体。分群条件可以包括:时间筛选条件和事件筛选条件。例如,在分群条件为“在过去3天内,购买商品A的次数大于等于2次”的情况下,该分群条件的时间筛选条件指示:在前3天,该分群条件的事件筛选条件指示:购买商品A的次数大于等于2次。其中,时间筛选条件用于表征所关注的事件发生时间与待测时间之间的关系,事件筛选条件用于描述所关注的事件具体信息。可以根据实际需要,分别设置时间筛选条件和事件筛选条件以构成相应的分群条件。时间筛选条件和事件筛选条件可以通过各种数据形式进行表示,例如以键值对(key-value)的形式来表示。
例如,服务器可以与后台终端进行通信,后台终端可以提供条件配置界面,该条件配置界面可以包括条件配置入口。后台用户可以通过该条件配置入口配置分群条件,并触发条件配置指令。后台终端基于该条件配置指令确定分群条件并发送至服务器,以使服务器获取预定用户群体的分群条件。
在操作S202,基于时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段。
示例性地,用户行为数据库例如如上文中表1所示,用户行为数据库中的每条用户行为数据用于表征一次用户操作行为的相关信息。根据本公开的实施例,从每条用户行为数据的角度出发,基于时间筛选条件确定每条用户行为数据的至少一个目标时间段。
例如,针对一条用户行为数据D,本操作S202用于根据时间筛选条件所表征的所关注的事件发生时间与待测时间之间的关系,以该条用户行为数据D的事件发生时间为所关注的事件发生时间,从该事件发生时间推算所有可能的待测时间,以作为该条用户行为数据D的至少一个目标时间段。例如,用户行为数据D的目标时间段包括T1、T2和T3,表示在以T1、T2和T3中的至少一个作为待测时间进行用户分群时,均需要关注该条用户行为数据D。而在以除T1、T2和T3之外的其他时间作为待测时间进行用户分群时,无需关注该条用户行为数据D。针对用户行为数据库中的其他每条用户行为数据确定各自的目标时间段的过程同理,在此不再赘述。
在操作S203,针对每条用户行为数据,基于该条用户行为数据和该条用户行为数据的至少一个目标时间段中的每个目标时间段,确定该条用户行为数据关于每个目标时间段的关联数据,以由关联数据构成关联表。
沿用上文中的例子,针对用户行为数据D,基于该条用户行为数据D与目标时间段T1,可以确定用户行为数据D关于目标时间段T1的一条关联数据(D,T1)。同理,还可以确定用户行为数据D关于目标时间段T2的一条关联数据(D,T2),以及用户行为数据D关于目标时间段T3的一条关联数据(D,T3)。针对其他每条用户行为数据确定一条或多条关联数据的过程与此同理。以单条关联数据为粒度,由各用户行为数据的关联数据可以构成关联表。示例性地,在确定一条关联数据后,如果关联表尚未被建立,则先建立关联表并将该条关联数据添加至关联表中。如果已有关联表,则直接将该关联数据添加至关联表中。
在操作S204,基于待测时间和事件筛选条件,从关联表中筛选针对待测时间的目标关联数据,以根据目标关联数据确定属于预定用户群体的目标用户。
根据本公开的实施例,在利用同一分群条件进行用户分群时,由于用户行为数据的变化特性,待测时间不同,所得到的分群结果不同。本操作S204可以从关联表中筛选出目标时间属于待测时间且符合事件筛选条件的关联数据,作为目标关联数据。示例性地,根据目标关联数据的用户标识可以确定针对待测时间的属于预定用户群体的目标用户。
本领域技术人员可以理解,根据本公开实施例的用户分群方法在每条用户行为数据产生后,根据分群条件中的时间筛选条件从该条用户行为数据推算出该条用户行为数据所对应的所有可能的目标时间段。并根据每条用户行为数据和目标时间段之间的关联关系来构建关联表,关联表中的每条关联数据用于表征一条用户行为数据和该条用户行为数据的一个目标时间段之间的关联关系符合上述时间筛选条件,从而使得关联表能够涵盖已有的所有符合上述时间筛选条件的关联数据。再基于关联表中符合待测时间和事件筛选条件的目标关联数据,确定预定用户群体的目标用户。上述过程可以在每次产生新的用户行为数据时针对该新的用户行为数据执行,相比于相关技术中从目标时间段的角度出发,关于每个预定时间段进行一次用户行为数据库整体的遍历式查询和存储的方案,可以有效节省计算资源和存储空间。
下面参考图3,对根据本公开实施例的用户分群方法进行示例性说明。
图3示意性示出了根据本公开另一实施例的用户分群方法的示例流程图,该用户分群方法例如可以在图1所示的服务器侧执行。
如图3所示,该方法可以包括操作S301~操作S306。
在操作S301,获取预定用户群体的分群条件。如上文所述,分群条件可以包括时间筛选条件和事件筛选条件。在分群条件未发生变化的情况下,可以仅执行一次操作S301。在分群条件发生变化的情况下,执行一次操作S301。
在操作S302,获取用户行为数据D。示例性地,本操作S302可以获取来自终端设备的用户行为数据,或者,可以根据来自终端设备的上传信息来产生用户行为数据。在获取到用户行为数据之后,一方面存入用户行为数据库中,另一方面继续执行操作S303。本实施例以用户行为数据D为例进行说明,针对其他每条用户行为数据均可以执行如下操作。
在操作S303,根据时间筛选条件,确定用户行为数据D的至少一个目标时间段。
例如,用户行为数据D可以如表2所示。用户行为数据D可以包括用于指示事件发生时间(例如包括发生日期和发生时间)的第一时间信息。本例中,第一时间信息表征用户行为数据D的事件发生时间为2019年1月8日11点11分11秒。
表2
在本公开的一个实施例中,时间筛选条件用于指示在前第一数量个预定时间段。在此情况下,上述操作S303确定用户行为数据D的至少一个目标时间段的过程可以包括:将紧接在用户行为数据D的事件发生时间之后的第一数量个预定时间段中的每个预定时间段,作为一个目标时间段。
图4示意性示出了根据本公开实施例的用户分群过程的示例示意图。如图4所示,例如,分群条件401的时间筛选条件用于指示在前3个预定时间段,可以表示为[-3,-1]。以1天为预定时间段,则可以确定紧接在2019年1月8日之后的3个预定时间段:2019年1月9日(2019年1月8日+1日)、2019年1月10日(2019年1月8日+2日)和2019年1月11日(2019年1月8日+3日),分别为用户行为数据D 402的3个目标时间段403,可以表示为{T1、T2和T3}。表明在此时间筛选条件下,用户行为数据D 402影响该3个目标时间段403的用户分群结果。根据本公开的实施例,时间信息均可以通过时间戳的形式表示。
在本公开的另一个实施例中,时间筛选条件用于指示在后第二数量个预定时间段。上述操作S303确定用户行为数据D的至少一个目标时间段的过程可以包括:将紧接在用户行为数据D的发生时间之前的第二数量个预定时间段中的每个预定时间段,作为一个目标时间段。
例如,分群条件的时间筛选条件用于指示在后2个预定时间段,可以表示为[+1,+2]。以1天为预定时间段,则可以确定紧接在2019年1月8日之前的2个预定时间段:2019年1月7日(2019年1月8日-1日)和2019年1月6日(2019年1月8日-2日),分别为用户行为数据D的2个目标时间段。表明在此时间筛选条件下,用户行为数据D影响该2个目标时间段的用户分群结果。可以理解,根据本公开实施例的用户分群方法既可以用于目标时间段为未来时间段的情况,也可以用于目标时间段为过去时间段的情况,可根据分群条件的设置进行相应的调整,具有较高的灵活性。
在操作S304,从用户行为数据D的至少一个目标时间段中筛选出处于有效时间窗口内的目标时间段,并将筛选出的目标时间段作为更新的至少一个目标时间段。
在操作S305,基于用户行为数据D和该用户行为数据D的更新的至少一个目标时间段中的每个目标时间段,更新关联表。重复执行上述操作S302~操作S305,不断更新关联表。
示例性地,有效时间窗口可以为上文中的观察窗口。例如,观察窗口为2019年1月10日至2019年1月12日,位于观察窗口之外的目标日期是无意义的。因此,在确定用户行为数据D的3个目标时间段{T1,T2,T3}(其中T1=2019年1月9日,T2=2019年1月10日,T3=2019年1月11日)之后,将以上3个目标时间段中位于观察窗口之外的目标时间段(即2019年1月9日)筛除,以得到更新的2个目标时间段:{T2,T3}。
如图4所示,由用户行为数据D 402和更新的目标时间段T2403构成一条关联数据(D,T2),由用户行为数据D 402和更新的目标时间段T3403构成一条关联数据(D,T3)。基于关联数据可以更新关联表404。例如,关联表的局部如表3所示。
表3
根据表3可知,一条用户行为数据关于一个目标时间段的关联数据包括:该条用户行为数据和用于表征该目标时间段的第二时间信息。根据表1~表3可知,每条用户行为数据还可以包括:用户标识信息和事件描述信息。可以理解,上述操作S302~操作S305基于获取到的每条用户行为数据更新关联表的过程中,由于每次针对一条用户行为数据执行,数据计算量较小。计算粒度为单条用户行为数据,使得计算灵活性较高。此外,由于时间筛选条件和有效时间窗口的限制,每条用户行为数据得到的关联数据有限,占用存储空间也较小。
根据本公开的实施例,上述确定用户行为数据D关于每个目标时间段的关联数据的过程可以包括:将该条用户行为数据D和该条用户行为数据D的至少一个目标时间段{T2,T3}进行笛卡尔积(Cartesian product),以得到该条用户行为数据关于每个目标时间段的关联数据{(D,T2),(D,T3)}。本实施例基于笛卡尔积的原理,将关联数据作为有序对进行计算,可以快速、无疏漏地确定每条用户行为数据所对应的关联数据。
继续参考图3,在操作S306,根据待测时间和分群条件中的事件筛选条件,从关联表中筛选针对待测时间的目标关联数据,以根据目标关联数据确定属于预定用户群体的目标用户。
根据本公开的实施例,继续参考图4,上述操作S306从关联表中筛选目标关联数据的过程可以包括:从关联表404中筛选目标时间段属于待测时间段、且事件描述信息符合事件筛选条件的目标关联数据405。将目标关联数据405按照用户标识信息进行分组,可以得到目标关联数据1、目标关联数据2、……、目标关联数据n,n为大于2的整数。再根据每个分组的目标关联数据405的用户标识信息确定属于预定用户群体406的目标用户。
根据本公开的实施例,上述从关联表中筛选目标时间段属于待测时间段、且事件描述信息符合事件筛选条件的目标关联数据的过程可以包括:在关联表中以用户标识信息和第二时间信息为索引,对用户标识信息相同且第二时间信息也相同的关联数据进行聚合。如果聚合后的一条关联数据的第二时间信息和事件描述信息分别符合待测时间和事件筛选条件,则确定该条关联数据为目标关联数据,根据该条关联数据的用户标识信息确定属于预定用户群体的目标用户。
示例性地,事件筛选条件用于指示:针对预定商品的预定行为的发生次数大于等于预定数值。在此情况下,首先预置计次参数M,并将计次参数复位为初始值M=0。然后,在关联表中查找用户标识信息等于第一数值且第二时间信息等于第二数值的关联数据。针对从关联表中查找到的每条关联数据,在确定该关联数据中的事件描述信息指示针对预定商品的预定行为的情况下,对计次参数M的取值递增1。在针对关联表查找结束时,M的取值表征查找到的关联数据的事件描述信息的聚合结果。此时,确定计次参数M的取值是否大于等于预定数值。如果是,则确定该条关联数据为目标关联数据。
在一个例子中,预定商品为商品A,预定行为为购买行为,预定数值为2。第一数值为用户行为数据D的用户标识信息“10001”,第二数值为待测时间的时间戳表示数值,设置待测时间为2019年1月10日。针对从关联表中查找到的每条关联数据,在确定该条关联数据中的事件描述信息指示针对商品A的购买行为的情况下,对M的取值递增1。在针对关联表查找结束时,确定M的取值是否大于等于2。如果是,则确定查找到的关联数据均为针对待测时间2019年1月10日的目标关联数据,即确定用户标识信息“10001”指示的用户为属于预定用户群体的目标用户。如果否,则确定查找到的关联数据均不是针对待测时间2019年1月10日的目标关联数据。接着,可以更换上述第一数值,重复上述过程,直至遍历关联表中的所有用户标识信息取值。
在另一个例子中,通过分群条件的设置还可以筛选出进行组合事件操作行为的用户群体。事件筛选条件用于指示:针对第一预定商品的第一预定行为的发生次数大于等于第一预定数值、且针对第二预定商品的第二预定行为的发生次数大于等于第二预定数值。例如,第一预定商品为商品A,第一预定行为为购买行为,第一预定数值为3。第二预定商品为商品B,第二预定行为为浏览行为,第二预定数值为2。上述从关联表中筛选目标时间段属于待测时间段、且事件描述信息符合事件筛选条件的目标关联数据的过程可以包括:预置第一计次参数M和第二计次参数N。分别将第一计次参数M和第二计次参数N复位为初始值0。在关联表中查找用户标识信息等于第一数值(例如“10001”)且第二时间信息等于第二数值(例如2019年1月10日)的关联数据。针对查找到的每条关联数据,如果确定该条关联数据中的事件描述信息指示针对第一预定商品的第一预定行为,则对第一计次参数M的取值递增1。如果确定该条关联数据中的事件描述信息指示针对第二预定商品的第二预定行为的情况下,对第二计次参数N的取值递增1。在针对关联表查找结束时,确定第一计次参数M的取值是否大于等于3、且第二计次参数N的取值是否大于等于2。如果满足M≥3且N≥2,则确定所查找到的关联数据均为针对待测时间2019年1月10日的目标关联数据,即确定用户标识信息“10001”指示的用户为属于预定用户群体的目标用户。如果否,则确定查找到的关联数据均不是针对待测时间2019年1月10日的目标关联数据。接着,可以更换上述第一数值,重复上述过程,直至遍历关联表中的所有用户标识信息取值。可以理解,当分群条件中包括多个事件筛选条件时,不影响前期关联表的构建过程,不会增加存储空间的占用。
根据本公开的实施例,在预定用户群体的分群条件中包括多个子分群条件的情况下,可以基于上述各实施例分别构建针对多个子分群条件的多个关联表,并确定多个关联表各自符合子分群条件的目标用户集合。将多个目标用户集合的交集确定为属于预定用户群体的目标用户。
图5示意性示出了根据本公开实施例的用户分群装置的框图。
如图5所示,用户分群装置500可以包括:获取模块510、第一确定模块520、第二确定模块530和分群模块540。
获取模块510用于获取预定用户群体的分群条件,分群条件包括:时间筛选条件和事件筛选条件。
第一确定模块520用于基于时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段。
第二确定模块530用于针对每条用户行为数据,基于该条用户行为数据和该条用户行为数据的至少一个目标时间段中的每个目标时间段,确定该条用户行为数据关于每个目标时间段的关联数据,以由关联数据构成关联表。
分群模块540用于基于待测时间和事件筛选条件,从关联表中筛选针对待测时间的目标关联数据,以根据目标关联数据确定属于预定用户群体的目标用户。
需要说明的是,装置部分实施例中各模块/单元/子单元等的实施方式、解决的技术问题、实现的功能、以及达到的技术效果分别与方法部分实施例中各对应的步骤的实施方式、解决的技术问题、实现的功能、以及达到的技术效果相同或类似,在此不再赘述。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,获取模块510、第一确定模块520、第二确定模块530和分群模块540中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,获取模块510、第一确定模块520、第二确定模块530和分群模块540中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块510、第一确定模块520、第二确定模块530和分群模块540中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图6示意性示出了根据本公开实施例的适于实现上文描述的方法的计算机设备的框图。图6示出的计算机设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,根据本公开实施例的计算机设备600包括处理器601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 603中,存储有设备600操作所需的各种程序和数据。处理器601、ROM 602以及RAM 603通过总线604彼此相连。处理器601通过执行ROM 602和/或RAM 603中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 602和RAM 603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,设备600还可以包括输入/输出(I/O)接口605,输入/输出(I/O)接口605也连接至总线604。设备600还可以包括连接至I/O接口605的以下部件中的一项或多项:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
本公开还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方法。根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 602和/或RAM 603和/或ROM 602和RAM 603以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (16)

1.一种用户分群方法,包括:
获取预定用户群体的分群条件,所述分群条件包括:时间筛选条件和事件筛选条件;
基于所述时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段;
基于所述每条用户行为数据和所述至少一个目标时间段中的每个目标时间段,确定所述每条用户行为数据关于所述每个目标时间段的关联数据,以由所述关联数据构成关联表;以及
基于待测时间和所述事件筛选条件,从所述关联表中筛选针对所述待测时间的目标关联数据,以根据所述目标关联数据确定属于所述预定用户群体的目标用户,
其中,所述关联数据包括:所述每条用户行为数据和用于表征所述每个目标时间段的第二时间信息;
所述每条用户行为数据包括:用户标识信息和事件描述信息;
所述从所述关联表中筛选针对所述待测时间的目标关联数据包括:从所述关联表中筛选目标时间段属于所述待测时间段、且事件描述信息符合所述事件筛选条件的目标关联数据;
所述事件筛选条件用于指示:针对预定商品的预定行为的发生次数大于等于预定数值;
所述从所述关联表中筛选目标时间段属于所述待测时间段、且事件描述信息符合所述事件筛选条件的目标关联数据包括:
将计次参数复位为初始值0;
在所述关联表中查找所述用户标识信息等于第一数值且所述第二时间信息等于第二数值的关联数据;
针对查找到的每条关联数据,在确定所述每条关联数据中的事件描述信息指示针对所述预定商品的所述预定行为的情况下,对所述计次参数的取值递增1;
在查找结束时,确定所述计次参数的取值是否大于等于所述预定数值;以及
如果是,则确定所述每条关联数据为目标关联数据。
2.根据权利要求1所述的方法,其中,所述时间筛选条件用于指示在前第一数量个预定时间段,所述每条用户行为数据包括事件发生时间的第一时间信息;
所述确定用户行为数据库中的每条用户行为数据的至少一个目标时间段包括:将紧接在所述每条用户行为数据的事件发生时间之后的第一数量个预定时间段中的每个预定时间段,作为一个目标时间段。
3.根据权利要求1所述的方法,其中,所述时间筛选条件用于指示在后第二数量个预定时间段,所述每条用户行为数据包括事件发生时间的第一时间信息;
所述确定用户行为数据库中的每条用户行为数据的至少一个目标时间段包括:将紧接在所述每条用户行为数据的发生时间之前的第二数量个预定时间段中的每个预定时间段,作为一个目标时间段。
4. 根据权利要求1所述的方法,还包括:
在确定所述至少一个目标时间段之后,从所述至少一个目标时间段中筛选出处于有效时间窗口内的目标时间段;以及
将筛选出的目标时间段作为更新的所述至少一个目标时间段。
5.根据权利要求1所述的方法,其中,所述根据所述目标关联数据确定属于所述预定用户群体的目标用户包括:
根据所述目标关联数据的所述用户标识信息,确定针对所述待测时间段的属于所述预定用户群体的目标用户。
6.根据权利要求1所述的方法,其中,所述确定所述每条用户行为数据关于所述每个目标时间段的关联数据包括:
将所述每条用户行为数据和所述每条用户行为数据的至少一个目标时间段进行笛卡尔积,以得到所述每条用户行为数据关于所述每个目标时间段的关联数据。
7.一种用户分群方法,包括:
获取预定用户群体的分群条件,所述分群条件包括:时间筛选条件和事件筛选条件;
基于所述时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段;
基于所述每条用户行为数据和所述至少一个目标时间段中的每个目标时间段,确定所述每条用户行为数据关于所述每个目标时间段的关联数据,以由所述关联数据构成关联表;以及
基于待测时间和所述事件筛选条件,从所述关联表中筛选针对所述待测时间的目标关联数据,以根据所述目标关联数据确定属于所述预定用户群体的目标用户,
其中,所述关联数据包括:所述每条用户行为数据和用于表征所述每个目标时间段的第二时间信息;
所述每条用户行为数据包括:用户标识信息和事件描述信息;
所述从所述关联表中筛选针对所述待测时间的目标关联数据包括:从所述关联表中筛选目标时间段属于所述待测时间段、且事件描述信息符合所述事件筛选条件的目标关联数据;
所述事件筛选条件用于指示:针对第一预定商品的第一预定行为的发生次数大于等于第一预定数值、且针对第二预定商品的第二预定行为的发生次数大于等于第二预定数值;
所述从所述关联表中筛选目标时间段属于所述待测时间段、且事件描述信息符合所述事件筛选条件的目标关联数据包括:
分别将第一计次参数和第二计次参数复位为初始值0;
在所述关联表中查找所述用户标识信息等于第一数值且所述第二时间信息等于第二数值的关联数据;
针对查找到的每条关联数据,在确定所述每条关联数据中的事件描述信息指示针对所述第一预定商品的所述第一预定行为的情况下,对所述第一计次参数的取值递增1,并在确定所述每条关联数据中的事件描述信息指示针对所述第二预定商品的所述第二预定行为的情况下,对所述第二计次参数的取值递增1;
在查找结束时,确定所述第一计次参数的取值是否大于等于所述第一预定数值、且所述第二计次参数的取值是否大于等于所述第二预定数值;以及
如果是,则确定所述每条关联数据为目标关联数据。
8.根据权利要求7所述的方法,其中,所述时间筛选条件用于指示在前第一数量个预定时间段,所述每条用户行为数据包括事件发生时间的第一时间信息;
所述确定用户行为数据库中的每条用户行为数据的至少一个目标时间段包括:将紧接在所述每条用户行为数据的事件发生时间之后的第一数量个预定时间段中的每个预定时间段,作为一个目标时间段。
9.根据权利要求7所述的方法,其中,所述时间筛选条件用于指示在后第二数量个预定时间段,所述每条用户行为数据包括事件发生时间的第一时间信息;
所述确定用户行为数据库中的每条用户行为数据的至少一个目标时间段包括:将紧接在所述每条用户行为数据的发生时间之前的第二数量个预定时间段中的每个预定时间段,作为一个目标时间段。
10. 根据权利要求7所述的方法,还包括:
在确定所述至少一个目标时间段之后,从所述至少一个目标时间段中筛选出处于有效时间窗口内的目标时间段;以及
将筛选出的目标时间段作为更新的所述至少一个目标时间段。
11.根据权利要求7所述的方法,其中,所述根据所述目标关联数据确定属于所述预定用户群体的目标用户包括:
根据所述目标关联数据的所述用户标识信息,确定针对所述待测时间段的属于所述预定用户群体的目标用户。
12.根据权利要求7所述的方法,其中,所述确定所述每条用户行为数据关于所述每个目标时间段的关联数据包括:
将所述每条用户行为数据和所述每条用户行为数据的至少一个目标时间段进行笛卡尔积,以得到所述每条用户行为数据关于所述每个目标时间段的关联数据。
13.一种用户分群装置,包括:
获取模块,用于获取预定用户群体的分群条件,所述分群条件包括:时间筛选条件和事件筛选条件;
第一确定模块,用于基于所述时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段;
第二确定模块,用于基于所述每条用户行为数据和所述至少一个目标时间段中的每个目标时间段,确定所述每条用户行为数据关于所述每个目标时间段的关联数据,以由所述关联数据构成关联表;以及
分群模块,用于基于待测时间和所述事件筛选条件,从所述关联表中筛选针对所述待测时间的目标关联数据,以根据所述目标关联数据确定属于所述预定用户群体的目标用户,
其中,所述关联数据包括:所述每条用户行为数据和用于表征所述每个目标时间段的第二时间信息;
所述每条用户行为数据包括:用户标识信息和事件描述信息;
所述从所述关联表中筛选针对所述待测时间的目标关联数据包括:从所述关联表中筛选目标时间段属于所述待测时间段、且事件描述信息符合所述事件筛选条件的目标关联数据;
所述事件筛选条件用于指示:针对预定商品的预定行为的发生次数大于等于预定数值;
所述分群模块还用于:
将计次参数复位为初始值0;
在所述关联表中查找所述用户标识信息等于第一数值且所述第二时间信息等于第二数值的关联数据;
针对查找到的每条关联数据,在确定所述每条关联数据中的事件描述信息指示针对所述预定商品的所述预定行为的情况下,对所述计次参数的取值递增1;
在查找结束时,确定所述计次参数的取值是否大于等于所述预定数值;以及
如果是,则确定所述每条关联数据为目标关联数据。
14.一种用户分群装置,包括:
获取模块,用于获取预定用户群体的分群条件,所述分群条件包括:时间筛选条件和事件筛选条件;
第一确定模块,用于基于所述时间筛选条件,确定用户行为数据库中的每条用户行为数据的至少一个目标时间段;
第二确定模块,用于基于所述每条用户行为数据和所述至少一个目标时间段中的每个目标时间段,确定所述每条用户行为数据关于所述每个目标时间段的关联数据,以由所述关联数据构成关联表;以及
分群模块,用于基于待测时间和所述事件筛选条件,从所述关联表中筛选针对所述待测时间的目标关联数据,以根据所述目标关联数据确定属于所述预定用户群体的目标用户,
其中,所述关联数据包括:所述每条用户行为数据和用于表征所述每个目标时间段的第二时间信息;
所述每条用户行为数据包括:用户标识信息和事件描述信息;
所述从所述关联表中筛选针对所述待测时间的目标关联数据包括:从所述关联表中筛选目标时间段属于所述待测时间段、且事件描述信息符合所述事件筛选条件的目标关联数据;
所述事件筛选条件用于指示:针对第一预定商品的第一预定行为的发生次数大于等于第一预定数值、且针对第二预定商品的第二预定行为的发生次数大于等于第二预定数值;
所述分群模块还用于:
分别将第一计次参数和第二计次参数复位为初始值0;
在所述关联表中查找所述用户标识信息等于第一数值且所述第二时间信息等于第二数值的关联数据;
针对查找到的每条关联数据,在确定所述每条关联数据中的事件描述信息指示针对所述第一预定商品的所述第一预定行为的情况下,对所述第一计次参数的取值递增1,并在确定所述每条关联数据中的事件描述信息指示针对所述第二预定商品的所述第二预定行为的情况下,对所述第二计次参数的取值递增1;
在查找结束时,确定所述第一计次参数的取值是否大于等于所述第一预定数值、且所述第二计次参数的取值是否大于等于所述第二预定数值;以及
如果是,则确定所述每条关联数据为目标关联数据。
15. 一种计算机设备,包括:
存储器,其上存储有计算机指令;以及
至少一个处理器;
其中,所述处理器执行所述计算机指令时实现根据权利要求1~12中任一项所述的方法。
16.一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时实现根据权利要求1~12中任一项所述的方法。
CN202010616220.2A 2020-06-30 2020-06-30 用户分群方法、装置、计算机设备和介质 Active CN111782966B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202010616220.2A CN111782966B (zh) 2020-06-30 2020-06-30 用户分群方法、装置、计算机设备和介质
US17/197,116 US11580136B2 (en) 2020-06-30 2021-03-10 Method and apparatus of user clustering, computer device and medium
KR1020210032760A KR102522274B1 (ko) 2020-06-30 2021-03-12 사용자 그룹화 방법 및 장치, 컴퓨터 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램
EP21162377.2A EP3825861A3 (en) 2020-06-30 2021-03-12 Method and apparatus of user clustering, computer device
JP2021055973A JP7269980B2 (ja) 2020-06-30 2021-03-29 ユーザグループ化方法、装置、コンピュータデバイス、媒体およびコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010616220.2A CN111782966B (zh) 2020-06-30 2020-06-30 用户分群方法、装置、计算机设备和介质

Publications (2)

Publication Number Publication Date
CN111782966A CN111782966A (zh) 2020-10-16
CN111782966B true CN111782966B (zh) 2023-07-28

Family

ID=72759973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010616220.2A Active CN111782966B (zh) 2020-06-30 2020-06-30 用户分群方法、装置、计算机设备和介质

Country Status (5)

Country Link
US (1) US11580136B2 (zh)
EP (1) EP3825861A3 (zh)
JP (1) JP7269980B2 (zh)
KR (1) KR102522274B1 (zh)
CN (1) CN111782966B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112085542B (zh) * 2020-10-23 2024-01-26 北京金堤科技有限公司 用户筛选方法和装置、计算机可读存储介质、电子设备
CN112506981A (zh) * 2021-02-05 2021-03-16 深圳市阿卡索资讯股份有限公司 一种线上培训服务推送方法和装置
CN112800047B (zh) * 2021-03-03 2024-04-05 百果园技术(新加坡)有限公司 用户关联数据处理方法、装置、设备和存储介质
CN113076473B (zh) * 2021-03-19 2024-05-07 土巴兔集团股份有限公司 用户数据处理方法、装置、计算机设备及存储介质
CN114186855A (zh) * 2021-12-11 2022-03-15 中国工商银行股份有限公司 监控预警方法、装置、计算机设备、存储介质和程序产品
CN114820079B (zh) * 2022-05-20 2023-04-18 百度在线网络技术(北京)有限公司 人群确定方法、装置、设备及介质
CN115391612B (zh) * 2022-09-01 2023-06-06 元心信息科技集团有限公司 数据处理方法、装置、设备及可读存储介质
CN115882611B (zh) * 2023-03-08 2023-05-12 北京清大高科系统控制有限公司 一种多源数据融合的有序用电监视方法及装置
CN116342193A (zh) * 2023-03-29 2023-06-27 上海数禾信息科技有限公司 基于用户旅程的用户分类方法、装置、计算机设备和介质
CN117713386B (zh) * 2024-02-05 2024-04-16 国网山东省电力公司东营市河口区供电公司 电网智能监测控制方法、装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109582808A (zh) * 2018-11-22 2019-04-05 北京锐安科技有限公司 一种用户信息查询方法、装置、终端设备和存储介质
CN110147821A (zh) * 2019-04-15 2019-08-20 中国平安人寿保险股份有限公司 目标用户群体确定方法、装置、计算机设备及存储介质
CN111192072A (zh) * 2019-10-29 2020-05-22 腾讯科技(深圳)有限公司 用户分群方法及装置、存储介质
CN111259263A (zh) * 2020-01-15 2020-06-09 腾讯云计算(北京)有限责任公司 一种物品推荐方法、装置、计算机设备及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3815218B2 (ja) 2000-12-20 2006-08-30 株式会社日立製作所 データ分析方法及び装置
JP5440080B2 (ja) * 2009-10-02 2014-03-12 ソニー株式会社 行動パターン解析システム、携帯端末、行動パターン解析方法、及びプログラム
JP5785869B2 (ja) 2011-12-22 2015-09-30 株式会社日立製作所 行動属性分析プログラムおよび装置
US9171000B2 (en) * 2013-03-15 2015-10-27 Yahoo! Inc. Method and system for mapping short term ranking optimization objective to long term engagement
US9616344B2 (en) * 2014-03-31 2017-04-11 Electronic Arts Inc. Two-dimensional database query
US10735445B2 (en) * 2016-09-21 2020-08-04 Cognizant Technology Solutions U.S. Corporation Detecting behavioral anomaly in machine learned rule sets
US10721239B2 (en) * 2017-03-31 2020-07-21 Oracle International Corporation Mechanisms for anomaly detection and access management
JP6932533B2 (ja) 2017-04-06 2021-09-08 株式会社オークローンマーケティング 分析支援装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109582808A (zh) * 2018-11-22 2019-04-05 北京锐安科技有限公司 一种用户信息查询方法、装置、终端设备和存储介质
CN110147821A (zh) * 2019-04-15 2019-08-20 中国平安人寿保险股份有限公司 目标用户群体确定方法、装置、计算机设备及存储介质
CN111192072A (zh) * 2019-10-29 2020-05-22 腾讯科技(深圳)有限公司 用户分群方法及装置、存储介质
CN111259263A (zh) * 2020-01-15 2020-06-09 腾讯云计算(北京)有限责任公司 一种物品推荐方法、装置、计算机设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Dariusz Krol ; Michal Scigajlo ; Bogdan Trawinski.Investigation of internet system user behaviour using cluster analysis.《2008 International Conference on Machine Learning and Cybernetics》.2008,摘要. *
基于数据挖掘的促销决策支持系统;官亚雄;陈卫东;;浙江工业大学学报(02);全文 *

Also Published As

Publication number Publication date
JP2021103585A (ja) 2021-07-15
EP3825861A3 (en) 2021-11-03
JP7269980B2 (ja) 2023-05-09
KR20210038454A (ko) 2021-04-07
US20210191958A1 (en) 2021-06-24
KR102522274B1 (ko) 2023-04-18
CN111782966A (zh) 2020-10-16
EP3825861A2 (en) 2021-05-26
US11580136B2 (en) 2023-02-14

Similar Documents

Publication Publication Date Title
CN111782966B (zh) 用户分群方法、装置、计算机设备和介质
CN110704751B (zh) 数据处理方法、装置、电子设备及存储介质
WO2022007592A1 (zh) 数据多维分析方法、装置及系统
CN109360106B (zh) 画像构建方法、系统、介质和计算机系统
CN111414410A (zh) 数据处理方法、装置、设备和存储介质
CN110737673B (zh) 一种数据处理的方法及系统
CN109213965B (zh) 一种系统容量预测方法、计算机可读存储介质及终端设备
EP3321824A1 (en) Data retrieval system
CN109240893B (zh) 应用运行状态查询方法及终端设备
CN113792084A (zh) 数据热度的分析方法、装置、设备及存储介质
CN110097113B (zh) 一种监控展示信息投放系统工作状态的方法、装置及系统
CN111523921B (zh) 漏斗分析方法、分析设备、电子设备及可读存储介质
CN106708880B (zh) 话题关联词的获取方法和装置
CN115994830A (zh) 取数模型的构建方法和数据归集方法及相关装置
CN115185904A (zh) 云存储数据处理方法、装置、电子设备及可读存储介质
WO2022095661A1 (zh) 推荐模型的更新方法、装置、计算机设备和存储介质
CN110264306B (zh) 基于大数据的产品推荐方法、装置、服务器及介质
CN111563137A (zh) 一种用于重合轨迹的分析方法和系统
US20200097595A1 (en) Augmenting project data with searchable metadata for facilitating project queries
CN111027599A (zh) 基于随机抽样的聚类可视化方法及装置
CN114185890B (zh) 一种数据库检索方法、装置、存储介质及电子设备
CN111737281B (zh) 数据库查询方法、装置、电子设备以及可读存储介质
CN114253951B (zh) 数据处理方法、系统及第二服务器
CN111126737B (zh) 跨场景的交叉分析方法、装置、电子设备及存储介质
CN113961595A (zh) 数据查询方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant