CN110442572B - 用户特征值的确定方法及装置 - Google Patents

用户特征值的确定方法及装置 Download PDF

Info

Publication number
CN110442572B
CN110442572B CN201910579624.6A CN201910579624A CN110442572B CN 110442572 B CN110442572 B CN 110442572B CN 201910579624 A CN201910579624 A CN 201910579624A CN 110442572 B CN110442572 B CN 110442572B
Authority
CN
China
Prior art keywords
offline
accumulated
online
user
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910579624.6A
Other languages
English (en)
Other versions
CN110442572A (zh
Inventor
刘欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Advanced New Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced New Technologies Co Ltd filed Critical Advanced New Technologies Co Ltd
Priority to CN201910579624.6A priority Critical patent/CN110442572B/zh
Publication of CN110442572A publication Critical patent/CN110442572A/zh
Application granted granted Critical
Publication of CN110442572B publication Critical patent/CN110442572B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Abstract

本说明书披露的实施例提供一种用户特征值的确定方法,所述方法包括:首先,获取针对第一用户特征的离线累计特征值,所述离线累计特征值由离线处理平台基于已同步的、第一同步周期届满时刻之前的离线业务数据而预先确定;接着,获取针对所述第一用户特征的在线明细数据,所述在线明细数据基于所述第一同步周期届满时刻之后产生的在线业务数据而确定;然后,基于所述在线明细数据,计算针对所述第一用户特征的在线累计特征值;再接着,将所述离线累计特征值与所述在线累计特征值进行合并,将合并结果确定为针对所述第一用户特征的实时特征值。

Description

用户特征值的确定方法及装置
技术领域
本说明书披露的多个实施例涉及数据处理技术领域,尤其涉及一种用户特征值的确定方法及装置。
背景技术
用户特征或用户标签,是指基于用户行为数据、静态属性数据等计算出的用户特征信息。目前,用户特征被广泛应用于与用户相关的场景中,例如,用于判断用户状态,具体如用户的安全等级等。又例如,作为用户行为预测模型的输入特征。以上场景中,通常会希望采用的用户特征可以全面、准确的反映用户的真实情况,又因为,用于计算用户特征的用户行为数据等往往在不断新增或更新,这就要求能够快速、准确地计算出具有较强时效性的用户特征,或者说,要求能够提供实时的用户特征。
然而,目前提供实时用户特征的方式比较单一,具体地,处理速度和特征准确性都十分有限。因此,需要一种合理、可靠的方案,可以更加快速、准确地确定出实时用户特征。
发明内容
本说明书描述了一种用户特征值的确定方法,通过离线业务数据计算离线累计特征,以及基于在线业务数据计算在线累计特征,再将离线累计特征与在线累计特征进行合并,作为实时用户特征值,如此,可以快速、准确地确定出针对用户特征的实时特征值。
第一方面,提供了一种用户特征值的确定方法。该方法包括:获取针对第一用户特征的离线累计特征值,所述离线累计特征值由离线处理平台基于已同步的、第一同步周期届满时刻之前的离线业务数据而预先确定;获取针对所述第一用户特征的在线明细数据,所述在线明细数据基于所述第一同步周期届满时刻之后产生的在线业务数据而确定;基于所述在线明细数据,计算针对所述第一用户特征的在线累计特征值;将所述离线累计特征值与所述在线累计特征值进行合并,将合并结果确定为针对所述第一用户特征的实时特征值。
在一个实施例中,在所述获取针对第一用户特征的离线累计特征值之前,所述方法还包括:接收针对所述第一用户特征的查询请求,所述查询请求中包括多个查询参数,所述多个查询参数中至少包括用户标识信息和所述第一用户特征的标识信息。
进一步地,在一个具体的实施例中,所述多个查询参数中还包括所述第一用户特征对应的统计截至时刻。
在一个实施例中,所述离线业务数据中包括业务系统的系统日志和整理为数据库表的业务记录。
在一个实施例中,所述离线累计特征值基于以下步骤而预先确定:在第一同步周期届满时,将所述第一同步周期内新生成的业务数据同步至所述离线处理平台,与所述离线处理平台中已存储的所述同步之前的历史离线业务数据组合得到所述离线业务数据;在所述离线处理平台中,基于所述离线业务数据,计算所述离线累计特征值。
在一个实施例中,所述离线累计特征值基于以下步骤而预先确定:在第一同步周期届满时,将所述第一同步周期内新生成的业务数据同步至离线处理平台;在所述离线处理平台中,基于所述新生成的业务数据计算针对所述第一用户特征的新增离线累计特征值;获取所述同步之前基于历史离线业务数据而确定的历史离线累计特征值;将所述历史离线累计特征值和所述新增离线累计特征值合并,得到所述离线累计特征值。
在一个实施例中,在所述获取针对所述第一用户特征的在线明细数据之前,所述方法还包括:
确定所述离线累计特征值对应的所述第一同步周期届满时刻;
所述获取针对所述第一用户特征的在线明细数据,包括:
获取在所述第一同步周期届满时刻之后的在线明细数据。
在一个实施例中,在所述获取针对所述第一用户特征的在线明细数据之前,所述方法还包括:
确定所述离线累计特征值对应的所述第一同步周期届满时刻;
所述获取针对所述第一用户特征的在线明细数据,包括:
获取在所述第一同步周期届满时刻之后以及所述统计截止时刻之前的在线明细数据。
在一个实施例中,所述获取针对所述第一用户特征的在线明细数据,包括:从数据库表中获取所述在线明细数据,所述数据库表用于存储按照标准格式解析的在线业务数据。
在一个实施例中,所述第一用户特征为以下中的任一种:支付笔数、支付天数、支付红包领取次数、支付红包使用次数。
第二方面,提供了一种用户特征值的确定装置。该装置包括:第一获取单元,配置为获取针对第一用户特征的离线累计特征值,所述离线累计特征值由离线处理平台基于已同步的、第一同步周期届满时刻之前的离线业务数据而预先确定;第二获取单元,配置为获取针对所述第一用户特征的在线明细数据,所述在线明细数据基于所述第一同步周期届满时刻之后产生的在线业务数据而确定;计算单元,配置为基于所述在线明细数据,计算针对所述第一用户特征的在线累计特征值;合并单元,配置为将所述离线累计特征值与所述在线累计特征值进行合并,将合并结果确定为针对所述第一用户特征的实时特征值。
第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序。当所述计算机程序在计算机中执行时,令计算机执行上述第一方面中任一种实施方式提供的方法。
第四方面,提供了一种计算设备,包括存储器和处理器。所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述第一方面中任一种实施方式提供的方法。
在本说明书提供的一种用户特征值的确定方法及装置中,通过离线方式引入业务数据以计算离线累计特征值,通过在线方式将业务数据落入在线数据存储表中,进一步的地,当接收到针对用户特征的查询请求时,或者在其他需要确定用户特征的情况下,通过在线数据存储表中的在线明细数据计算在线累计特征值,与查询到的离线累计特征值进行合并,作为返回的针对用户特征的实时特征值。如此,可以快速、准确地确定出实时的用户特征值。
附图说明
为了更清楚地说明本说明书披露的多个实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书披露的多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出根据一个实施例的用于确定用户特征值的系统架构图;
图2示出根据一个实施例的用户特征值的确定方法流程图;
图3示出根据一个实施例的用户特征值的确定方法框图;
图4示出根据一个实施例的用户特征值的确定装置结构图。
具体实施方式
下面结合附图,对本说明书披露的多个实施例进行描述。
如前所述,要求提供实时用户特征。具体地,通常是提供用户特征对应的用户特征值。例如,用户特征为支付笔数,相应需要提供的用户特征值为支付笔数的累计数值。
为了更加快速、准确地确定实时用户特征,本说明书一个或多个实施例提供一种用户特征值的确定方法及装置,图1示出根据一个实施例的用于实现所述方法的系统架构图。如图1所示,业务系统110中不断产生新的业务数据,一方面,离线处理平台120按照预定的同步周期,如24h,将业务系统110中在T-1日内产生的业务数据同步至离线处理平台120中,离线处理平台120利用同步得到的T-1日离线业务数据和此次同步之前的历史离线业务数据,计算T-1日对应的离线累计特征值;另一方面,在线处理平台140对接业务系统中实时产生的业务数据,将获取的在线业务数据按照标准格式进行解析,并将解析得到的在线明细数据存储至在线存储系统150中;在查询系统160发出用户特征查询请求的情况下,从在线存储系统150中获取近1日的在线明细数据,计算得到在线累计特征值,与从离线存储系统130中获取的T-1日对应的离线累计特征值进行合并,得到实时特征值,返回给查询系统160。
如此,通过计算离线累计特征,可以降低在线明细数据的计算量,进而快速、准确地提供实时特征值,同时,提高数据的复用性和标签灵活性,快速支撑新的实时标签需求。下面,结合实施例描述所述方法的具体实施步骤。
图2示出根据一个实施例的用户特征值的确定方法流程图。所述方法的执行主体可以为具有处理能力的设备:服务器或者系统或者装置。如图2所示,所述方法包括以下步骤:步骤S210,获取针对第一用户特征的离线累计特征值,所述离线累计特征值由离线处理平台基于已同步的、第一同步周期届满时刻之前的离线业务数据而预先确定;步骤S220,获取针对所述第一用户特征的在线明细数据,所述在线明细数据基于所述第一同步周期届满时刻之后产生的在线业务数据而确定;步骤S230,基于所述在线明细数据,计算针对所述第一用户特征的在线累计特征值;步骤S240,将所述离线累计特征值与所述在线累计特征值进行合并,将合并结果确定为针对所述第一用户特征的实时特征值。以上步骤具体如下:
首先,在步骤S210,获取针对第一用户特征的离线累计特征值,所述离线累计特征值由离线处理平台基于已同步的、第一同步周期届满时刻之前的离线业务数据而预先确定。
在一个实施例中,上述第一用户特征可以为支付笔数、或支付天数、或支付红包领取次数、或支付红包使用次数,等等。相应地,上述离线累计特征值为基于离线业务数据而确定的针对所述第一用户特征的累计数值,如5或10,等等。
在一个实施例中,上述离线业务数据可以包括业务系统的系统日志和整理为数据库表的业务记录。在一个具体的实施例中,业务系统所对应的业务可以有多种,如供应业务、采购业务、支付业务、咨询业务等等。在一个具体的实施例中,上述系统日志可以包括通过在客户端中埋点而采集到的日志数据,例如,在支付客户端中对支付图标进行埋点,相应地,当客户端接收到用户对支付图标的触发指令时,即向业务系统上报对应的用户操作数据。在一个具体的实施例中,上述整理为数据表的业务记录可以包括交易记录。在一个例子中,交易记录可以包括交易方信息、交易内容、交易时间等交易数据。
在一个实施例中,上述离线累计特征值可以基于以下步骤而预先确定:首先,在第一同步周期届满时,将第一同步周期内新生成的业务数据同步至离线处理平台。接着,在一个具体的实施例中,可以从新生成的业务数据中提取与第一用户特征相关的业务数据,与离线处理平台中已存储的所述同步之前的与第一用户特征相关的历史离线业务数据组合得到上述离线业务数据,再在离线处理平台中,基于所述离线业务数据,计算所述离线累计特征值。在一个例子中,其中基于离线业务数据计算离线累计特征值,可以基于预先设定的业务逻辑实现。在另一个具体的实施例中,还可以在所述离线处理平台中,基于新生成的业务数据计算针对第一用户特征的新增离线累计特征值,并且,获取所述同步之前基于历史离线业务数据而确定的历史离线累计特征值,再将所述历史离线累计特征值和所述新增离线累计特征值合并,得到所述离线累计特征值。在一个例子中,可以将二者的和值确定为所述离线累计特征值。
如此,可以预先确定出针对第一用户特征的离线累计特征值。相应地,在本步骤中,可以获取到所述离线累计特征值。
另一方面,在一个实施例中,在本步骤之前,还可以包括:接收针对所述第一用户特征的查询请求。在一个具体的实施例中,上述查询请求中可以包括多个查询参数,且多个查询参数中至少包括用户标识信息和所述第一用户特征的标识信息。在一个例子中,用户标识信息可以为业务系统为用户分配的用于唯一标识用户身份的序列号,或者,可以为用户的注册账号,等等。在一个例子中,用户标识信息可以为所述方法的执行主体为第一用户特征分配的用于唯一标识该特征的序列号等。
进一步地,在一个更具体的实施例中,上述多个查询参数中还可以包括场景标识信息,用于标识第一用户特征所对应的场景。在某些情况下,定义的第一用户特征可以存在于多种不同的场景下。例如,第一用户特征可以为支付笔数,其对应的场景可以包括淘宝交易场景、天猫交易场景或者线下门店交易场景,等等。因此,需要场景标识信息指明具体的对应场景。
在另一个更具体的实施例中,上述多个查询参数中还可以包括第一用户特征对应的统计截至时刻。在一个例子中,统计截至时刻可以为上述查询请求的生成时刻。在另一个例子中,统计截至时刻可以为查询请求的发起者自定义的时刻。
相应地,本步骤可以包括:基于所述查询请求,获取针对第一用户特征的离线累计特征值。在一个具体的实施例中,在上述查询请求包括上述统计截至时刻这一查询参数的情况下,可以进一步判断出统计截至时刻是否在上述第一同步周期届满时刻之前。更进一步地,一方面,若在之前,则可以将获取的离线累计特征值直接作为查询到的用户特征值返回给查询系统。另一方面,若在之后,则继续执行下述步骤S220。
由上,可以获取针对第一用户特征的离线累计特征值。接着,在步骤S220,获取针对所述第一用户特征的在线明细数据,所述在线明细数据基于所述第一同步周期届满时刻之后产生的在线业务数据而确定。再接着,在步骤S230,基于所述在线明细数据,计算针对所述第一用户特征的在线累计特征值。
在一个实施例中,在步骤S220之前还可以包括:确定所述离线累计特征值对应的所述第一同步周期届满时刻。相应地,在一个实施例中,步骤S220中可以包括:获取在所述第一同步周期届满时刻之后的在线明细数据。在另一个实施例中,如前所述,接收的查询请求中包括统计截至时刻,则步骤S220中可以包括:获取在所述第一同步周期届满时刻之后以及所述统计截止时刻之前的在线明细数据。
在一个实施例中,如前所述,离线业务数据中可以包括业务系统的系统日志和整理为数据库表的业务记录。可以理解的是,在线业务数据中同样可以包括这些数据,区别在于所包括数据所对应的时间区段不同,步骤S210中涉及的离线业务数据对应于第一同步周期届满时刻之前产生的数据,本步骤中涉及的在线业务数据对应于第一同步周期届满时刻之后产生的数据。
在一个实施例中,步骤S220可以包括:从所述第一同步周期届满时刻之后产生的在线业务数据中提取针对所述第一用户特征的在线业务数据,作为上述在线明细数据。
进一步地,在一个实施例中,步骤S230可以包括:根据如此获取的对应于在线业务数据的在线明细数据,计算在线累计特征值。在另一个实施例中,如前所述,在线业务数据中可以包括日志数据,考虑到日志数据中往往存在重复数据,直接利用对应包括重复数据的在线明细数据计算在线累计特征值,会导致数值偏大、不准确,基于此,步骤S230可以包括:可以先对在线明细数据进行累加幂等处理,如此可以除去重复数据,再利用处理后的在线明细数据计算在线累计特征值,以保证计算结果的准确性。
另一方面,在一个实施例中,步骤S220可以包括:从数据库表中获取所述在线明细数据,所述数据库表用于存储按照标准格式解析的在线业务数据。也就是说,将在线业务数据按照标准格式进行解析后存储到数据库表中,相应可以从数据库表中获取对应于第一用户特征的在线明细数据。如此,通过利用数据库表本身具有的幂等能力,可以使在线明细数据中不存在重复数据,不同于前述实施例中需要通过另外开发实现累加幂等,通过落实明细数据可以快速、便捷、低成本地实现对重复数据的去除。此外,因为此处是从数据库表中获取具有标准格式的在线明细数据,故而可以提高获取速度,从而最终提高返回用户特征值的速度。
进一步地,在一个实施例中,步骤S230可以包括:根据获取的具有标准格式的在线明细数据,计算在线累计特征值。
以上,在步骤S210中可以获取离线累计特征值,在步骤S230中可以计算出在线累计特征值。然后,在步骤S240中,将所述离线累计特征值与所述在线累计特征值进行合并,将合并结果确定为针对第一用户特征的实时特征值。
在一个实施例中,可以对离线累计特征值与在线累计特征值进行算术求和,将得到的算术值作为所述实时特征值。在另一个实施例中,还可以对离线累计特征值和在线累计特征值进行加权求和,将得到加权值作为所述实时特征值。需要说明的是,在加权求和时采用的权值可以由工作人员根据实际经验或者实际需要进行设定或调整。在一个具体的实施例中,可以为在线累计特征值赋予更高的权重,例如,可以将在线累计特征值和离线累计特征值的权重分别设定为0.8和0.2。
以上,可以确定出针对第一用户特征的实时特征值。进一步地,在一个实施例中,可以将实时特征值返回给发送查询请求的查询系统。
下面,结合一个具体的例子,对所述方法进行进一步说明。如图3所示,所述方法包括以下步骤:
在步骤S310中,判断T-1日的离线累计特征是否就位。需要说明的是,可能存在T-1日的数据已同步至离线处理平台,但暂未结合同步的T-1日的数据更新累计离线特征的情况,因此,此处需要判断T-1日的离线累计特征是否就位,而不是判断T-1日的数据是否已同步至离线处理平台。
进一步地,一方面,在判断出就位的情况下,执行步骤S320和步骤S330,在步骤S320中,查询利用T-1日之前(包括T-1日)的离线业务数据所确定的T-1日离线累计特征。并且,在步骤S330中,查询近1日的明细数据并计算出对应的在线累计特征值。另一方面,在判断出未就位的情况下,此时,可以进一步判断T-2日的离线累计特征是否就位,此处考虑到在T-1日离线累计特征未就位的情况下,T-2日的离线累计特征通常是已就位的,因此可以执行步骤S340和步骤S350,在步骤S340中,查询利用T-2日之前(包括T-2日)的离线业务数据所确定的T-2日离线累计特征。并且,在步骤S350中,查询近2日的明细数据并计算出对应的在线累计特征值。
在执行上述步骤S330或步骤S350之后,在步骤S360,对离线累计特征值和在线累计特征值进行合并,并将合并结果进行输出。例如,可以输出至查询系统。如此,可以确定出实时的用户特征值,并进行输出。
由上可知,在本说明书一个或多个实施例提供的用户特征值的确定方法中,通过离线方式引入业务数据以计算离线累计特征值,通过在线方式将业务数据落入在线数据存储表中,进一步的地,当接收到针对用户特征的查询请求时,或者在其他需要确定用户特征的情况下,通过在线数据存储表中的在线明细数据计算在线累计特征值,与查询到的离线累计特征值进行合并,作为返回的针对用户特征的实时特征值。如此,可以快速、准确地确定出实时的用户特征值。
与用户特征值的确定方法对应地,本说明书一个或多个实施例还提供一种确定装置。具体地,图4示出根据一个实施例的用户特征值的确定装置结构图,如图4所示,该装置400包括:
第一获取单元410,配置为获取针对第一用户特征的离线累计特征值,所述离线累计特征值由离线处理平台基于已同步的、第一同步周期届满时刻之前的离线业务数据而预先确定。第二获取单元420,配置为获取针对所述第一用户特征的在线明细数据,所述在线明细数据基于所述第一同步周期届满时刻之后产生的在线业务数据而确定。计算单元430,配置为基于所述在线明细数据,计算针对所述第一用户特征的在线累计特征值。合并单元440,配置为将所述离线累计特征值与所述在线累计特征值进行合并,将合并结果确定为针对所述第一用户特征的实时特征值。
在一个实施例中,所述装置400还包括:接收单元450,配置为接收针对所述第一用户特征的查询请求,所述查询请求中包括多个查询参数,所述多个查询参数中至少包括用户标识信息和所述第一用户特征的标识信息。
进一步地,在一个具体的实施例中,所述多个查询参数中还包括所述第一用户特征对应的统计截至时刻。
在一个实施例中,所述离线业务数据中包括业务系统的系统日志和整理为数据库表的业务记录。
在一个实施例中,所述离线累计特征值基于以下步骤而预先确定:在第一同步周期届满时,将所述第一同步周期内新生成的业务数据同步至所述离线处理平台,与所述离线处理平台中已存储的所述同步之前的历史离线业务数据组合得到所述离线业务数据;在所述离线处理平台中,基于所述离线业务数据,计算所述离线累计特征值。
在一个实施例中,所述离线累计特征值基于以下步骤而预先确定:在第一同步周期届满时,将所述第一同步周期内新生成的业务数据同步至离线处理平台;在所述离线处理平台中,基于所述新生成的业务数据计算针对所述第一用户特征的新增离线累计特征值;获取所述同步之前基于历史离线业务数据而确定的历史离线累计特征值;将所述历史离线累计特征值和所述新增离线累计特征值合并,得到所述离线累计特征值。
在一个实施例中,所述装置400还包括:确定单元460,配置为确定所述离线累计特征值对应的所述第一同步周期届满时刻。所述第二获取单元420具体配置为:获取在所述第一同步周期届满时刻之后的在线明细数据。
在一个实施例中,所述装置400还包括:确定单元460,配置为确定所述离线累计特征值对应的所述第一同步周期届满时刻。所述第二获取单元420具体配置为:获取在所述第一同步周期届满时刻之后以及所述统计截止时刻之前的在线明细数据。
在一个实施例中,所述第二获取单元420具体配置为:从数据库表中获取所述在线明细数据,所述数据库表用于存储按照标准格式解析的在线业务数据。
在一个实施例中,所述第一用户特征为以下中的任一种:支付笔数、支付天数、支付红包领取次数、支付红包使用次数。
由上可知,在本说明书一个或多个实施例提供的用户特征值的确定装置中,通过离线方式引入业务数据以计算离线累计特征值,通过在线方式将业务数据落入在线数据存储表中,进一步的地,当接收到针对用户特征的查询请求时,或者在其他需要确定用户特征的情况下,通过在线数据存储表中的在线明细数据计算在线累计特征值,与查询到的离线累计特征值进行合并,作为返回的针对用户特征的实时特征值。如此,可以快速、准确地确定出实时的用户特征值。
如上,根据又一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2或图3所描述的方法。
根据又一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2或图3所描述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书披露的多个实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本说明书披露的多个实施例的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书披露的多个实施例的具体实施方式而已,并不用于限定本说明书披露的多个实施例的保护范围,凡在本说明书披露的多个实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书披露的多个实施例的保护范围之内。

Claims (16)

1.一种用户特征值的确定方法,所述方法包括:
获取针对第一用户特征的离线累计特征值,所述离线累计特征值由离线处理平台基于已同步的、第一同步周期届满时刻之前的离线业务数据而预先确定;
获取针对所述第一用户特征的在线明细数据,所述在线明细数据基于所述第一同步周期届满时刻之后产生的在线业务数据而确定;
基于所述在线明细数据,计算针对所述第一用户特征的在线累计特征值;
将所述离线累计特征值与所述在线累计特征值进行合并,将合并结果确定为针对所述第一用户特征的实时特征值;
其中,所述离线累计特征值基于以下步骤而预先确定:
在第一同步周期届满时,将所述第一同步周期内新生成的业务数据同步至离线处理平台;
在所述离线处理平台中,基于所述新生成的业务数据计算针对所述第一用户特征的新增离线累计特征值;
获取所述同步之前基于历史离线业务数据而确定的历史离线累计特征值;
将所述历史离线累计特征值和所述新增离线累计特征值合并,得到所述离线累计特征值;
其中,所述获取针对所述第一用户特征的在线明细数据,包括:
从数据库表中获取所述在线明细数据,所述数据库表用于存储按照标准格式解析的在线业务数据。
2.根据权利要求1所述的方法,其中,在所述获取针对第一用户特征的离线累计特征值之前,所述方法还包括:
接收针对所述第一用户特征的查询请求,所述查询请求中包括多个查询参数,所述多个查询参数中至少包括用户标识信息和所述第一用户特征的标识信息。
3.根据权利要求2所述的方法,其中,所述多个查询参数中还包括所述第一用户特征对应的统计截至时刻。
4.根据权利要求1所述的方法,其中,所述离线业务数据中包括业务系统的系统日志和整理为数据库表的业务记录。
5.根据权利要求1所述的方法,其中,在所述获取针对所述第一用户特征的在线明细数据之前,所述方法还包括:
确定所述离线累计特征值对应的所述第一同步周期届满时刻;
所述获取针对所述第一用户特征的在线明细数据,包括:
获取在所述第一同步周期届满时刻之后的在线明细数据。
6.根据权利要求3所述的方法,其中,在所述获取针对所述第一用户特征的在线明细数据之前,所述方法还包括:
确定所述离线累计特征值对应的所述第一同步周期届满时刻;
所述获取针对所述第一用户特征的在线明细数据,包括:
获取在所述第一同步周期届满时刻之后以及所述统计截止时刻之前的在线明细数据。
7.根据权利要求1-6中任一项所述的方法,其中,所述第一用户特征为以下中的任一种:支付笔数、支付天数、支付红包领取次数、支付红包使用次数。
8.一种用户特征值的确定装置,所述装置包括:
第一获取单元,配置为获取针对第一用户特征的离线累计特征值,所述离线累计特征值由离线处理平台基于已同步的、第一同步周期届满时刻之前的离线业务数据而预先确定;
第二获取单元,配置为获取针对所述第一用户特征的在线明细数据,所述在线明细数据基于所述第一同步周期届满时刻之后产生的在线业务数据而确定;
计算单元,配置为基于所述在线明细数据,计算针对所述第一用户特征的在线累计特征值;
合并单元,配置为将所述离线累计特征值与所述在线累计特征值进行合并,将合并结果确定为针对所述第一用户特征的实时特征值;
其中,所述离线累计特征值基于以下步骤而预先确定:
在第一同步周期届满时,将所述第一同步周期内新生成的业务数据同步至离线处理平台;
在所述离线处理平台中,基于所述新生成的业务数据计算针对所述第一用户特征的新增离线累计特征值;
获取所述同步之前基于历史离线业务数据而确定的历史离线累计特征值;
将所述历史离线累计特征值和所述新增离线累计特征值合并,得到所述离线累计特征值;
其中,所述第二获取单元具体配置为:
从数据库表中获取所述在线明细数据,所述数据库表用于存储按照标准格式解析的在线业务数据。
9.根据权利要求8所述的装置,其中,所述装置还包括:
接收单元,配置为接收针对所述第一用户特征的查询请求,所述查询请求中包括多个查询参数,所述多个查询参数中至少包括用户标识信息和所述第一用户特征的标识信息。
10.根据权利要求9所述的装置,其中,所述多个查询参数中还包括所述第一用户特征对应的统计截至时刻。
11.根据权利要求8所述的装置,其中,所述离线业务数据中包括业务系统的系统日志和整理为数据库表的业务记录。
12.根据权利要求8所述的装置,其中,所述装置还包括:
确定单元,配置为确定所述离线累计特征值对应的所述第一同步周期届满时刻;
所述第二获取单元具体配置为:
获取在所述第一同步周期届满时刻之后的在线明细数据。
13.根据权利要求10所述的装置,其中,所述装置还包括:
确定单元,配置为确定所述离线累计特征值对应的所述第一同步周期届满时刻;
所述第二获取单元具体配置为:
获取在所述第一同步周期届满时刻之后以及所述统计截止时刻之前的在线明细数据。
14.根据权利要求8-13中任一项所述的装置,其中,所述第一用户特征为以下中的任一种:支付笔数、支付天数、支付红包领取次数、支付红包使用次数。
15.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-7中任一项的所述的方法。
16.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-7中任一项所述的方法。
CN201910579624.6A 2019-06-28 2019-06-28 用户特征值的确定方法及装置 Active CN110442572B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910579624.6A CN110442572B (zh) 2019-06-28 2019-06-28 用户特征值的确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910579624.6A CN110442572B (zh) 2019-06-28 2019-06-28 用户特征值的确定方法及装置

Publications (2)

Publication Number Publication Date
CN110442572A CN110442572A (zh) 2019-11-12
CN110442572B true CN110442572B (zh) 2024-02-02

Family

ID=68428701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910579624.6A Active CN110442572B (zh) 2019-06-28 2019-06-28 用户特征值的确定方法及装置

Country Status (1)

Country Link
CN (1) CN110442572B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114416817A (zh) * 2021-12-21 2022-04-29 北京镁伽科技有限公司 用于处理数据的方法、装置、设备、系统及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103885976A (zh) * 2012-12-21 2014-06-25 腾讯科技(深圳)有限公司 在网页中配置推荐信息的方法及索引服务器
CN106126641A (zh) * 2016-06-24 2016-11-16 中国科学技术大学 一种基于Spark的实时推荐系统及方法
CN106503015A (zh) * 2015-09-07 2017-03-15 国家计算机网络与信息安全管理中心 一种构建用户画像的方法
CN106789885A (zh) * 2016-11-17 2017-05-31 国家电网公司 一种大数据环境下用户异常行为检测分析方法
JP2017167843A (ja) * 2016-03-16 2017-09-21 株式会社日立製作所 取引明細管理システムおよび取引明細管理方法
CN108021929A (zh) * 2017-11-16 2018-05-11 华南理工大学 基于大数据的移动端电商用户画像建立与分析方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103885976A (zh) * 2012-12-21 2014-06-25 腾讯科技(深圳)有限公司 在网页中配置推荐信息的方法及索引服务器
CN106503015A (zh) * 2015-09-07 2017-03-15 国家计算机网络与信息安全管理中心 一种构建用户画像的方法
JP2017167843A (ja) * 2016-03-16 2017-09-21 株式会社日立製作所 取引明細管理システムおよび取引明細管理方法
CN106126641A (zh) * 2016-06-24 2016-11-16 中国科学技术大学 一种基于Spark的实时推荐系统及方法
CN106789885A (zh) * 2016-11-17 2017-05-31 国家电网公司 一种大数据环境下用户异常行为检测分析方法
CN108021929A (zh) * 2017-11-16 2018-05-11 华南理工大学 基于大数据的移动端电商用户画像建立与分析方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于第三方的电子支付服务平台系统设计;薛蕾;《电脑迷》;20160415(第04期);全文 *

Also Published As

Publication number Publication date
CN110442572A (zh) 2019-11-12

Similar Documents

Publication Publication Date Title
CN108322350B (zh) 业务监控方法及装置和电子设备
CN108647357B (zh) 数据查询的方法及装置
CN109697247B (zh) 一种数据准确性的检测方法及装置
CN110442572B (zh) 用户特征值的确定方法及装置
CN110086894B (zh) 人员关联信息挖掘方法、通讯推荐方法及相关装置
CN109933508B (zh) 用于发送信息的方法和装置
CN110297948B (zh) 关系网络构建方法以及装置
CN113836187A (zh) 数据处理方法、装置、服务器及计算机可读存储介质
CN110825609B (zh) 服务的测试方法、装置和系统
CN110602215A (zh) 基于联盟区块链的资源处理方法及联盟区块链系统
CN113553379A (zh) 一种数据采集方法及装置
CN110941639B (zh) 数据处理、数据查询方法、装置以及设备
CN110232590B (zh) 一种方案的生成方法及设备
CN109388527B (zh) 一种确认操作合法性的方法、数据处理方法、装置及设备
CN107180047B (zh) 文件的生成方法和装置
CN116795628B (zh) 终端设备的功耗处理方法、终端设备以及可读存储介质
US11908023B1 (en) Method and system for generating user interfaces to prompt users to perform an activity in a software application based on transaction time analysis
CN112214387B (zh) 基于知识图谱的用户操作行为预测方法及装置
CN113807923B (zh) 一种订单处理方法、装置、电子设备及可读存储介质
KR102295229B1 (ko) 프로모션 시점 자동 추천 방법, 장치 및 시스템
CN110930115B (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
CN110471933B (zh) 一种信息处理方法、装置、计算机设备及存储介质
CN108959014B (zh) 用于监控平台的方法和装置
CN117472282A (zh) 基于分布式存储系统的序列号生成方法、装置及电子设备
CN117112681A (zh) 道德评价数据库的建立方法、装置、系统以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201010

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201010

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

GR01 Patent grant
GR01 Patent grant