CN112861013A - 用户画像更新方法、装置、电子设备及存储介质 - Google Patents
用户画像更新方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112861013A CN112861013A CN202110294087.8A CN202110294087A CN112861013A CN 112861013 A CN112861013 A CN 112861013A CN 202110294087 A CN202110294087 A CN 202110294087A CN 112861013 A CN112861013 A CN 112861013A
- Authority
- CN
- China
- Prior art keywords
- data
- user portrait
- real
- service
- time data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请涉及一种用户画像更新方法、装置、电子设备及存储介质,所述方法包括:在业务方的数据发生更新的情况下,获取业务方发生数据更新的实时数据,其中,实时数据包括至少一种业务数据和每种业务数据对应的事件标识,然后基于事件标识以及预设的用户画像数据生成算法,生成实时数据中每种业务数据的用户画像特征值,最后根据用户画像特征值对用户画像进行更新。由于业务方的数据一旦发生更新,就会传输过来,然后本方案就会根据实时数据生成用户画像特征值,再根据用户画像特征值对用户画像进行更新,通过本申请的方案更新后的用户画像就可以实时表征当前的用户特征,避免了数据获取的时间差带来的用户画像无法准确表征当前的用户特征的问题。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种用户画像更新方法、装置、电子设备及存储介质。
背景技术
随着大数据时代的到来,需要利用数据进行分析的场景越来越多,比如构建用户画像,就是通过用户多维度的数据来表征用户的特征,从而构建出用户的画像。
构建用户画像所需的数据往往来源于不同的业务系统,为了保证用户画像的准确性,目前都会在每天的固定时间获取业务系统的数据,从而利用获取的业务系统的数据对用户画像进行更新。一方面,从业务系统直接抽取数据对业务系统来说,存在一定的安全隐患,且数据量大时,会对进行数据获取的系统产生一定的处理压力;另一方面,由于在每天的固定时间获取的数据都是该固定时间之前的数据,那么更新后的用户画像刻画的就是该固定时间之前的用户的特征,且在下一个固定时间之前,用户画像刻画的都是该固定时间之前的用户的特征,那么在下一个固定时间之前,当前的用户画像并无法准确表征当前的用户特征,这可能就会导致后续根据用户画像作出的决策出现偏差,甚至会出现重大的决策失误。
发明内容
为克服相关技术中存在的当前的用户画像并无法准确表征当前的用户特征问题,本申请提供一种用户画像更新方法、装置、电子设备及存储介质。
根据本申请的第一方面,提供一种用户画像更新方法,包括:
在业务方的数据发生更新的情况下,获取业务方发生数据更新的实时数据,所述实时数据包括至少一种业务数据和每种所述业务数据对应的事件标识;
基于所述事件标识以及预设的用户画像数据生成算法,生成所述实时数据中每种业务数据的用户画像特征值;
根据所述用户画像特征值对用户画像进行更新。
在一个可选的实施方式中,所述基于所述事件标识以及预设的用户画像数据生成算法,根据所述实时数据生成用户画像数据,包括:
分别根据每一种所述业务数据对应的事件标识,从所述用户画像数据生成算法中,提取与事件标识对应的用户画像数据生成子算法;
根据所述用户画像数据生成子算法,对所述业务数据进行处理,获取与所述业务数据对应的用户画像特征值。
在一个可选的实施方式中,所述用户画像特征值分别存放于不同存储位置;
所述根据所述用户画像特征值对用户画像进行更新,包括:
从数据库中分别查询与每一个所述用户画像特征值对应的存储位置;
将所述用户画像特征值分别覆盖掉所述存储位置之前已经存储的数据,以完成对用户画像的更新。
在一个可选的实施方式中,所述基于所述事件标识以及预设的用户画像数据生成算法,生成所述实时数据中每种业务数据的用户画像特征值时,所述方法还包括:
监测将所述实时数据生成每种业务数据的用户画像特征值时的生成速度以及对所述业务方的实时数据进行获取的获取速度;
若所述生成速度小于所述获取速度,则增加将所述实时数据生成每种业务数据的用户画像特征值的处理线程。
在一个可选的实施方式中,所述监测将所述实时数据生成用户画像数据时的生成速度以及对所述业务方传输的实时数据进行缓存的获取速度,包括:
监测同一时间周期,将生成每种业务数据的用户画像特征值的实时数据数量以及获取的所述实时数据的数量;
根据所述时间周期的长度与生成每种业务数据的用户画像特征值的实时数据数量确定监测将实时数据生成每种业务数据的用户画像特征值时的生成速度;
根据所述时间周期的长度与获取的所述实时数据的数量确定对所述业务方的实时数据进行获取的获取速度。
在一个可选的实施方式中,在所述基于所述事件标识以及预设的用户画像数据生成算法,生成所述实时数据中每种业务数据的用户画像特征值时,所述方法还包括:
监测获取的所述实时数据中未生成每种业务数据的用户画像特征值的实时数据数量;
若所述获取的所述实时数据中未生成每种业务数据的用户画像特征值的实时数据数量大于预设阈值,增加将所述实时数据生成每种业务数据的用户画像特征值的处理线程。
根据本申请的第二方面,提供一种用户画像更新装置,所述装置包括:
获取模块,用于在业务方的数据发生更新的情况下,获取业务方发生数据更新的实时数据,所述实时数据包括至少一种业务数据和每种所述业务数据对应的事件标识;
生成模块,用于基于所述事件标识以及预设的用户画像数据生成算法,生成所述实时数据中每种业务数据的用户画像特征值;
更新模块,用于根据所述用户画像特征值对用户画像进行更新。
在一个可选的实施方式中,所述生成模块包括:
提取单元,用于分别根据每一种所述业务数据对应的事件标识,从所述用户画像数据生成算法中,提取与事件标识对应的用户画像数据生成子算法;
处理单元,用于根据所述用户画像数据生成子算法,对所述业务数据进行处理,获取与所述业务数据对应的用户画像特征值在一个可选的实施方式中,所述用户画像数据中的用户画像特征值分别存放于不同存储位置;
所述更新模块包括:
查询单元,用于从数据库中分别查询与每一个所述用户画像特征值对应的存储位置;
存储单元,用于将所述用户画像特征值分别覆盖掉所述存储位置之前已经存储的数据,以完成对用户画像的更新。
在一个可选的实施方式中,所述装置还包括:
第一监测模块,用于监测将所述实时数据生成每种业务数据的用户画像特征值时的生成速度以及对所述业务方的实时数据进行获取的获取速度获取速度;
第一线程增加模块,用于若所述生成速度小于所述获取速度,则增加将所述实时数据生成每种业务数据的用户画像特征值的处理线程获取速度。
在一个可选的实施方式中,所述第一监测模块包括:
监测单元,用于将生成每种业务数据的用户画像特征值的实时数据数量以及获取的所述实时数据的数量;
第一确定单元,用于根据所述时间周期的长度与生成每种业务数据的用户画像特征值的实时数据数量确定监测将实时数据生成每种业务数据的用户画像特征值时的生成速度;
第二确定单元,用于根据所述时间周期的长度与获取的所述实时数据的数量确定对所述业务方的实时数据进行获取的获取速度获取速度。
在一个可选的实施方式中,所述装置还包括:
第二监测模块,用于监测获取的所述实时数据中未生成每种业务数据的用户画像特征值的实时数据数量;
第二线程增加模块,用于若所述获取的所述实时数据中未生成每种业务数据的用户画像特征值的实时数据数量大于预设阈值,增加将所述实时数据生成每种业务数据的用户画像特征值的处理线程。
根据本申请的第三方面,提供一种电子设备,包括:至少一个处理器和存储器;
所述处理器用于执行所述存储器中存储的用户画像更新程序,以实现本申请第一方面所述的用户画像更新方法。
根据本申请的第四方面,提供一种存储介质,所述计算机存储介质存储有一个或者多个程序,所述一个或者多个程序被执行时,实现本申请第一方面所述的用户画像更新方法。
本申请提供的技术方案可以包括以下有益效果:在业务方的数据发生更新的情况下,获取业务方发生数据更新的实时数据,其中,实时数据包括至少一种业务数据和每种业务数据对应的事件标识,然后基于事件标识以及预设的用户画像数据生成算法,生成实时数据中每种业务数据的用户画像特征值,最后根据用户画像特征值对用户画像进行更新。由于本申请获取的是业务方发生数据更新的实时数据,也就是说,业务方的数据一旦发生更新,就会将发生数据更新的实时数据传输过来,然后本方案就会根据实时数据生成用户画像数据,再根据用户画像数据对用户画像进行更新,如此,业务方只要有实时数据产生,本申请的方案就会对用户画像进行更新,使用户画像紧随实时数据的数据更新而更新变化,那么通过本申请的方案更新后的用户画像就可以实时表征当前的用户特征,避免了数据获取的时间差带来的用户画像无法准确表征当前的用户特征的问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请的一个实施例提供的一种用户画像更新方法的流程示意图;
图2是本申请的一个实施例提供的一种用户画像更新的架构示意图;
图3是本申请的一个实施例提供的一种具体生成用户画像数据的流程示意图;
图4是本申请的另一实施例提供的一种根据用户画像数据对用户画像进行更新的流程示意图;
图5是本申请的一个实施例提供的一种扩容的流程示意图;
图6是本申请的另一实施例提供的一种用户画像更新装置的结构示意图;
图7是本申请的另一实施例提供的一种电子设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
请参阅图1,图1是本申请的一个实施例提供的一种用户画像更新方法的流程示意图。
如图1所示,本实施例提供的用户画像更新方法可以包括:
步骤S101、在业务方的数据发生更新的情况下,获取业务方发生数据更新的实时数据。
本步骤中,业务方指的是设置有业务系统的一方,该业务方的数量可以至少为1个,比如订单业务系统对应的业务方、基金业务系统对应的业务方等。为了在业务方的数据发生更新的情况下,获取业务方发生数据更新的实时数据,可以借助消息中间件、数据流处理平台等,比如activityMQ、RocketMQ、RabbitMQ、Kafka等。
以activityMQ为例,可以参阅图2,图2是本申请的一个实施例提供的一种用户画像更新的架构示意图。
该架构以3个业务方为例,本实施例可以利用activityMQ预先订阅业务方某些事件产生的业务数据,然后业务方在产生该业务数据时,会根据订阅分析传输到activityMQ对应的缓存队列中进行缓存,而该至少一种业务数据就构成了本步骤中的实时数据。
若缓存队列中出现实时数据时,便会利用数据加工模块从缓存队列中获取该实时数据,然后根据实时数据生成用户画像数据。本实施例中,针对不同的业务数据,会分别对应有不同的数据加工模块来对应加工,从而得到业务数据对应的用户画像数据,该过程具体可以参阅后续步骤中的说明。
最后由用户画像模块将用户画像数据对应存储到数据库中,以完成对用户画像的更新。
步骤S102、基于事件标识以及预设的用户画像数据生成算法,生成实时数据中每种业务数据的用户画像特征值。
本步骤中,实时数据中包括至少一种业务数据,以及与每一种业务数据对应的时间标识。需要说明的是,业务数据是由业务系统中发生某个事件的过程中所产生的数据,比如购买基金事件,就会产生相应的业务数据,该业务数据中可能就包含了购买数量、购买金额、购买基金的标识、用户标识等信息。
由于本步骤会针对每种业务数据生成一个特征值,进而构成该条实时数据对应的用户画像数据,因此,实时数据中需要至少包括业务数据以及业务数据对应的事件标识,具体可以参阅表1。
表1
本步骤具体生成用户画像特征值的过程可以参阅图3,图3是本申请的一个实施例提供的一种具体生成用户画像特征值的流程示意图。
如图3所示,本实施例提供的具体生成用户画像数据的过程可以包括:
步骤S301、分别根据每一种业务数据对应的事件标识,从用户画像数据生成算法中,提取与事件标识对应的用户画像数据生成子算法。
需要说明的是,针对不同的事件产生的业务数据,会有相应的用户画像数据生成子算法,该映射关系为根据订阅情况预先设置的,在已知事件标识的情况下,就可以从用户画像算法中提取相应的用户画像数据生成子算法。
在一个具体的例子中,事件标识与用户画像数据生成子算法的映射关系具体可以参阅表2。
表2
针对表1中的实时数据1而言,业务数据a对应的事件标识为A,那么根据表2就可以知道,针对业务数据a就可以调取算法1,同理,针对业务数据b,就可以调取算法2,针对业务数据c,就可以调取算法3。
需要说明的是,实时数据中具有什么事件标识,就仅调取相应的用户画像数据生成子算法即可,无需将所有的用户画像数据生成子算法全部调用。
步骤S302、根据用户画像数据生成子算法,对业务数据进行处理,获取与业务数据对应的用户画像特征值。
用户画像生成子算法可以对相应的业务数据进行计算、汇总等操作,得到相应的用户画像特征值。由于不同的业务数据,其能够表征的用户画像的特征并不相同,比如购买基金事件对应的业务数据,其可以表征用户的基金购买特征,而购买商品事件对应的业务数据,其可以表征用户的购买喜好特征,那么针对不同的业务数据,生成相应的用户画像特征值所采用的方式也就是不同。
在一个具体的例子中,针对于购买商品事件对应的业务数据,可以计算用户购买的金额,以此来表征用户的基金购买特征,比如购买了3.1万元的基金,那么就可以生成一个标识着大于3万的特征值。
在计算出所有业务数据对应的用户画像特征值之后,便可以将用户画像特征标识与用户画像特征值进行映射,从而构成用户画像数据。
在一个具体的例子中,实时数据1对应的用户画像数据可以如表3所示。
业务数据 | 用户画像特征标识 | 用户画像特征值 |
业务数据a | A1 | 3 |
业务数据b | B1 | 6 |
业务数据c | C1 | 5 |
表3
步骤S103、根据用户画像特征值对用户画像进行更新。
需要说明的是,用户画像特征值分别存放在不同的存储位置中,具体的,对用户画像进行更新的过程可以参阅图4,图4是本申请的另一实施例提供的一种根据用户画像特征值对用户画像进行更新的流程示意图。
如图4所示,根据用户画像特征值对用户画像进行更新的过程可以包括:
步骤S401、从数据库中分别查询与每一个用户画像特征值对应的存储位置。
需要说明的是,本步骤在进行查询时,可以借助用户画像特征标识。本实施例中为每个用户画像特征都设置了唯一标识,而存储时,也是与标识对应存储的,比如以键值对的形式进行存储,用户画像特征的标识作为键值对的键,用户画像特征值作为值。
在一个具体的例子中,若用户画像特征标识为A1,则可以从数据库中查询键为A1的键值对的存储位置,该存储位置便是A1对应的用户画像特征值对应的存储位置。
步骤S402、将用户画像特征值分别覆盖掉存储位置之前已经存储的数据,以完成对用户画像的更新。
本步骤中,可以是使用前述步骤获取到的用户画像特征值,直接覆盖掉用户画像特征值对应的存储位置之前已经存储的数据。
在一个具体的例子中,便可以是将A1对应的用户画像特征值“3”重新作为键为A1的键值对的值。
需要说明的是,上述过程中,可能会涉及到不同用户账号下产生的业务数据,此时,实时数据中会带有用户标识,然后利用用户标识对业务数据以及用户画像特征值进行对应区分即可。
本实施例中,在业务方的数据发生更新的情况下,获取业务方发生数据更新的实时数据,其中,实时数据包括至少一种业务数据和每种业务数据对应的事件标识,然后基于事件标识以及预设的用户画像数据生成算法,生成实时数据中每种业务数据的用户画像特征值,最后根据用户画像特征值对用户画像进行更新。由于本申请获取的是业务方发生数据更新的实时数据,也就是说,业务方的数据一旦发生更新,就会将发生数据更新的实时数据传输过来,然后本方案就会根据实时数据生成用户画像数据,再根据用户画像数据对用户画像进行更新,如此,业务方只要有实时数据产生,本申请的方案就会对用户画像进行更新,使用户画像紧随实时数据的数据更新而更新变化,那么通过本申请的方案更新后的用户画像就可以实时表征当前的用户特征,避免了数据获取的时间差带来的用户画像无法准确表征当前的用户特征的问题。
用户画像无法准确表征为了保证本申请的方案能够根据获取的实时数据的量来水平扩容,在部署时,可以采用dubbo分布式架构部署,具体扩容的过程可以参阅图5,图5是本申请的一个实施例提供的一种扩容的流程示意图。
如图5所示,扩容的过程可以包括:
步骤S501、监测将实时数据生成每种业务数据的用户画像特征值时的生成速度以及对业务方的实时数据进行获取的获取速度。
需要说明的是,本步骤的生成速度可以是根据时间周期的长度以及实时数据生成用户画像数据的数量来确定的,而获取速度则是根据时间周期的长度以及获取实时数据的数量来确定的。
具体的,本步骤可以监测同一时间周期,将生成每种业务数据的用户画像特征值的实时数据的数量以及获取的实时数据的数量。需要说明的是,两个数量都是同一时间周期中的数量,在一个具体的例子中,比如时间周期的长度为60秒,生成每种业务数据的用户画像特征值的实时数据的数量是180条,获取的实时数据的数量是210条。
然后再将生成每种业务数据的用户画像特征值的实时数据的数量除以时间周期的长度,就是生成速度,在一个具体的例子中,就是180/60=3条/秒;再将获取的实时数据的数量处以时间周期的长度,就是获取速度,在一个具体的例子中,就是210/60=3.5条/秒。
步骤S502、若生成速度小于获取速度,则增加将实时数据生成每种业务数据的用户画像特征值的处理线程。
本步骤中,如果生成速度小于获取速度,则说明缓存的实时数据要大于处理的实时数据,此时实时数据就会产生积压,占用消息中间件的缓存队列,甚至会发生溢出的情况。因此,需要增加将实时数据生成用户画像数据的处理线程。
仍以前述数据为例,生成速度为3条/秒,获取速度为3.5条/秒,生成速度是小于获取速度的,这种情况会产生积压,此时,就增加将实时数据生成用户画像数据的处理线程,然后由多个处理线程对实时数据进行处理,以避免实时数据积压的情况。
当然,还可以通过阈值判断的方式,更为简单地判断是否发生实时数据积压的情况,比如在生成用户画像数据的同时,检测获取的实时数据中未生成每种业务数据的用户画像特征值的实时数据的数量,然后若该数量大于预设阈值,就可以增加实时数据生成每种业务数据的用户画像特征值的处理线程。
需要说明的是,在利用消息中间件获取实时数据时,由于消息中间件是缓存队列的形式,缓存队列中的实时数据出列后,缓存队列的长度就会减1,因此,可以将缓存队列的长度作为监测得到的实时数据中未生成每种业务数据的用户画像特征值的数量。
请参阅图6,图6是本申请的另一实施例提供的一种用户画像更新装置的结构示意图。
如图6所示,本实施例提供的用户画像更新装置可以包括:
获取模块601,用于在业务方的数据发生更新的情况下,获取业务方发生数据更新的实时数据,实时数据包括至少一种业务数据和每种业务数据对应的事件标识;
生成模块602,用于基于事件标识以及预设的用户画像数据生成算法,生成实时数据中每种业务数据的用户画像特征值;
更新模块603,用于根据用户画像特征值对用户画像进行更新。
本实施例中,获取模块601在业务方的数据发生更新的情况下,获取业务方发生数据更新的实时数据,其中,实时数据包括至少一种业务数据和每种业务数据对应的事件标识,然后生成模块602基于事件标识以及预设的用户画像数据生成算法,生成实时数据中每种业务数据的用户画像特征值,最后更新模块603根据用户画像特征值对用户画像进行更新。由于本申请获取的是业务方发生数据更新的实时数据,也就是说,业务方的数据一旦发生更新,就会将发生数据更新的实时数据传输过来,然后本方案就会根据实时数据生成用户画像数据,再根据用户画像数据对用户画像进行更新,如此,业务方只要有实时数据产生,本申请的方案就会对用户画像进行更新,使用户画像紧随实时数据的数据更新而更新变化,那么通过本申请的方案更新后的用户画像就可以实时表征当前的用户特征,避免了数据获取的时间差带来的用户画像无法准确表征当前的用户特征的问题。
用户画像无法准确表征在一个可选的实施方式中,生成模块包括:
提取单元,用于分别根据每一种业务数据对应的事件标识,从用户画像数据生成算法中,提取与事件标识对应的用户画像数据生成子算法;
处理单元,用于根据用户画像数据生成子算法,对业务数据进行处理,获取与业务数据对应的用户画像特征值在一个可选的实施方式中,用户画像数据中的用户画像特征值分别存放于不同存储位置;
更新模块包括:
查询单元,用于从数据库中分别查询与每一个用户画像特征值对应的存储位置;
存储单元,用于将用户画像特征值分别覆盖掉存储位置之前已经存储的数据,以完成对用户画像的更新。
在一个可选的实施方式中,装置还包括:
第一监测模块,用于监测将实时数据生成每种业务数据的用户画像特征值时的生成速度以及对业务方的实时数据进行获取的获取速度获取速度;
第一线程增加模块,用于若生成速度小于获取速度,则增加将实时数据生成每种业务数据的用户画像特征值的处理线程获取速度。
在一个可选的实施方式中,第一监测模块包括:
监测单元,用于将生成每种业务数据的用户画像特征值的实时数据数量以及获取的实时数据的数量;
第一确定单元,用于根据时间周期的长度与生成每种业务数据的用户画像特征值的实时数据数量确定监测将实时数据生成每种业务数据的用户画像特征值时的生成速度;
第二确定单元,用于根据时间周期的长度与获取的实时数据的数量确定对业务方的实时数据进行获取的获取速度获取速度。
在一个可选的实施方式中,装置还包括:
第二监测模块,用于监测获取的实时数据中未生成每种业务数据的用户画像特征值的实时数据数量;
第二线程增加模块,用于若获取的实时数据中未生成每种业务数据的用户画像特征值的实时数据数量大于预设阈值,增加将实时数据生成每种业务数据的用户画像特征值的处理线程。
请参阅图7,图7是本申请的另一实施例提供的一种电子设备的结构示意图。
如图7所示,本实施例提供的电子设备包括:至少一个处理器701、存储器702、至少一个网络接口703和其他用户接口704。电子设备700中的各个组件通过总线系统705耦合在一起。可理解,总线系统705用于实现这些组件之间的连接通信。总线系统705除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图7中将各种总线都标为总线系统705。
其中,用户接口704可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
可以理解,本发明实施例中的存储器702可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本文描述的存储器702旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器702存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统7021和第二应用程序7022。
其中,操作系统7021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。第二应用程序7022,包含各种第二应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在第二应用程序7022中。
在本发明实施例中,通过调用存储器702存储的程序或指令,具体的,可以是第二应用程序7022中存储的程序或指令,处理器701用于执行各方法实施例所提供的方法步骤,例如包括:
在业务方的数据发生更新的情况下,获取业务方发生数据更新的实时数据,实时数据包括至少一种业务数据和每种业务数据对应的事件标识;
基于事件标识以及预设的用户画像数据生成算法,生成实时数据中每种业务数据的用户画像特征值;
根据用户画像特征值对用户画像进行更新。
在一个可选的实施方式中,基于事件标识以及预设的用户画像数据生成算法,根据实时数据生成用户画像数据,包括:
分别根据每一种业务数据对应的事件标识,从用户画像数据生成算法中,提取与事件标识对应的用户画像数据生成子算法;
根据用户画像数据生成子算法,对业务数据进行处理,获取与业务数据对应的用户画像特征值。
在一个可选的实施方式中,用户画像特征值分别存放于不同存储位置;
根据用户画像特征值对用户画像进行更新,包括:
从数据库中分别查询与每一个用户画像特征值对应的存储位置;
将用户画像特征值分别覆盖掉存储位置之前已经存储的数据,以完成对用户画像的更新。
在一个可选的实施方式中,基于事件标识以及预设的用户画像数据生成算法,生成实时数据中每种业务数据的用户画像特征值时,方法还包括:
监测将实时数据生成每种业务数据的用户画像特征值时的生成速度以及对业务方的实时数据进行获取的获取速度;
若生成速度小于获取速度,则增加将实时数据生成每种业务数据的用户画像特征值的处理线程。
在一个可选的实施方式中,监测将实时数据生成用户画像数据时的生成速度以及对业务方传输的实时数据进行缓存的获取速度,包括:
监测同一时间周期,将生成每种业务数据的用户画像特征值的实时数据数量以及获取的实时数据的数量;
根据时间周期的长度与生成每种业务数据的用户画像特征值的实时数据数量确定监测将实时数据生成每种业务数据的用户画像特征值时的生成速度;
根据时间周期的长度与获取的实时数据的数量确定对业务方的实时数据进行获取的获取速度。
在一个可选的实施方式中,在基于事件标识以及预设的用户画像数据生成算法,生成实时数据中每种业务数据的用户画像特征值时,方法还包括:
监测获取的实时数据中未生成每种业务数据的用户画像特征值的实时数据数量;
若获取的实时数据中未生成每种业务数据的用户画像特征值的实时数据数量大于预设阈值,增加将实时数据生成每种业务数据的用户画像特征值的处理线程。
上述本发明实施例揭示的方法可以应用于处理器701中,或者由处理器701实现。处理器701可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器701中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器701可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器702,处理器701读取存储器702中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSPDevice,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文功能的单元来实现本文的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在电子设备侧执行的用户画像更新方法。
处理器用于执行存储器中存储的用户画像更新程序,以实现以下在电子设备侧执行的用户画像更新方法的步骤:
在业务方的数据发生更新的情况下,获取业务方发生数据更新的实时数据,实时数据包括至少一种业务数据和每种业务数据对应的事件标识;
基于事件标识以及预设的用户画像数据生成算法,生成实时数据中每种业务数据的用户画像特征值;
根据用户画像特征值对用户画像进行更新。
在一个可选的实施方式中,基于事件标识以及预设的用户画像数据生成算法,根据实时数据生成用户画像数据,包括:
分别根据每一种业务数据对应的事件标识,从用户画像数据生成算法中,提取与事件标识对应的用户画像数据生成子算法;
根据用户画像数据生成子算法,对业务数据进行处理,获取与业务数据对应的用户画像特征值。
在一个可选的实施方式中,用户画像特征值分别存放于不同存储位置;
根据用户画像特征值对用户画像进行更新,包括:
从数据库中分别查询与每一个用户画像特征值对应的存储位置;
将用户画像特征值分别覆盖掉存储位置之前已经存储的数据,以完成对用户画像的更新。
在一个可选的实施方式中,基于事件标识以及预设的用户画像数据生成算法,生成实时数据中每种业务数据的用户画像特征值时,方法还包括:
监测将实时数据生成每种业务数据的用户画像特征值时的生成速度以及对业务方的实时数据进行获取的获取速度;
若生成速度小于获取速度,则增加将实时数据生成每种业务数据的用户画像特征值的处理线程。
在一个可选的实施方式中,监测将实时数据生成用户画像数据时的生成速度以及对业务方传输的实时数据进行缓存的获取速度,包括:
监测同一时间周期,将生成每种业务数据的用户画像特征值的实时数据数量以及获取的实时数据的数量;
根据时间周期的长度与生成每种业务数据的用户画像特征值的实时数据数量确定监测将实时数据生成每种业务数据的用户画像特征值时的生成速度;
根据时间周期的长度与获取的实时数据的数量确定对业务方的实时数据进行获取的获取速度。
在一个可选的实施方式中,在基于事件标识以及预设的用户画像数据生成算法,生成实时数据中每种业务数据的用户画像特征值时,方法还包括:
监测获取的实时数据中未生成每种业务数据的用户画像特征值的实时数据数量;
若获取的实时数据中未生成每种业务数据的用户画像特征值的实时数据数量大于预设阈值,增加将实时数据生成每种业务数据的用户画像特征值的处理线程。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种用户画像更新方法,其特征在于,所述方法包括:
在业务方的数据发生更新的情况下,获取业务方发生数据更新的实时数据,所述实时数据包括至少一种业务数据和每种所述业务数据对应的事件标识;
基于所述事件标识以及预设的用户画像数据生成算法,生成所述实时数据中每种业务数据的用户画像特征值;
根据所述用户画像特征值对用户画像进行更新。
2.根据权利要求1所述的方法,其特征在于,所述基于所述事件标识以及预设的用户画像数据生成算法,生成所述实时数据中每种业务数据的用户画像特征值,包括:
分别根据每一种所述业务数据对应的事件标识,从所述用户画像数据生成算法中,提取与事件标识对应的用户画像数据生成子算法;
根据所述用户画像数据生成子算法,对所述业务数据进行处理,获取与所述业务数据对应的用户画像特征值。
3.根据权利要求1所述的方法,其特征在于,所述用户画像特征值分别存放于不同存储位置;
所述根据所述用户画像特征值对用户画像进行更新,包括:
从数据库中分别查询与每一个所述用户画像特征值对应的存储位置;
将所述用户画像特征值分别覆盖掉所述存储位置之前已经存储的数据,以完成对用户画像的更新。
4.根据权利要求1所述的方法,其特征在于,所述基于所述事件标识以及预设的用户画像数据生成算法,生成所述实时数据中每种业务数据的用户画像特征值时,所述方法还包括:
监测将所述实时数据生成每种业务数据的用户画像特征值时的生成速度以及对所述业务方的实时数据进行获取的获取速度;
若所述生成速度小于所述获取速度,则增加将所述实时数据生成每种业务数据的用户画像特征值的处理线程。
5.根据权利要求4所述的方法,其特征在于,所述监测将所述实时数据生成每种业务数据的用户画像特征值时的生成速度以及对所述业务方的实时数据进行获取的获取速度,包括:
监测同一时间周期,将生成每种业务数据的用户画像特征值的实时数据数量以及获取的所述实时数据的数量;
根据所述时间周期的长度与生成每种业务数据的用户画像特征值的实时数据数量确定监测将实时数据生成每种业务数据的用户画像特征值时的生成速度;
根据所述时间周期的长度与获取的所述实时数据的数量确定对所述业务方的实时数据进行获取的获取速度。
6.根据权利要求1所述的方法,其特征在于,在所述基于所述事件标识以及预设的用户画像数据生成算法,生成所述实时数据中每种业务数据的用户画像特征值时,所述方法还包括:
监测获取的所述实时数据中未生成每种业务数据的用户画像特征值的实时数据数量;
若所述获取的所述实时数据中未生成每种业务数据的用户画像特征值的实时数据数量大于预设阈值,增加将所述实时数据生成每种业务数据的用户画像特征值的处理线程。
7.一种用户画像更新装置,其特征在于,所述装置包括:
获取模块,用于在业务方的数据发生更新的情况下,获取业务方发生数据更新的实时数据,所述实时数据包括至少一种业务数据和每种所述业务数据对应的事件标识;
生成模块,用于基于所述事件标识以及预设的用户画像数据生成算法,生成所述实时数据中每种业务数据的用户画像特征值;
更新模块,用于根据所述用户画像特征值对用户画像进行更新。
8.根据权利要求7所述的装置,其特征在于,所述生成模块包括:
提取单元,用于分别根据每一种所述业务数据对应的事件标识,从所述用户画像数据生成算法中,提取与事件标识对应的用户画像数据生成子算法;
处理单元,用于根据所述用户画像数据生成子算法,对所述业务数据进行处理,获取与所述业务数据对应的用户画像特征值。
9.一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述处理器用于执行所述存储器中存储的用户画像更新程序,以实现权利要求1-6任一项所述的用户画像更新方法。
10.一种存储介质,其特征在于,所述计算机存储介质存储有一个或者多个程序,所述一个或者多个程序被执行时,实现权利要求1-6任一项所述的用户画像更新方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110294087.8A CN112861013A (zh) | 2021-03-18 | 2021-03-18 | 用户画像更新方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110294087.8A CN112861013A (zh) | 2021-03-18 | 2021-03-18 | 用户画像更新方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112861013A true CN112861013A (zh) | 2021-05-28 |
Family
ID=75993538
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110294087.8A Pending CN112861013A (zh) | 2021-03-18 | 2021-03-18 | 用户画像更新方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112861013A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113409076A (zh) * | 2021-06-11 | 2021-09-17 | 广州天辰信息科技有限公司 | 一种基于大数据构建用户画像的方法、系统及云平台 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110134860A (zh) * | 2019-04-12 | 2019-08-16 | 阿里巴巴集团控股有限公司 | 用户画像生成方法、装置和设备 |
CN110659414A (zh) * | 2019-09-02 | 2020-01-07 | 惠州学院 | 一种基于用户画像的个性化信息推送方法及用户端 |
CN111652658A (zh) * | 2020-06-11 | 2020-09-11 | 北京妙医佳健康科技集团有限公司 | 画像融合方法、装置、电子设备及计算机可读存储介质 |
US20200334266A1 (en) * | 2019-04-16 | 2020-10-22 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and device for processing user portrait and server |
-
2021
- 2021-03-18 CN CN202110294087.8A patent/CN112861013A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110134860A (zh) * | 2019-04-12 | 2019-08-16 | 阿里巴巴集团控股有限公司 | 用户画像生成方法、装置和设备 |
US20200334266A1 (en) * | 2019-04-16 | 2020-10-22 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and device for processing user portrait and server |
CN110659414A (zh) * | 2019-09-02 | 2020-01-07 | 惠州学院 | 一种基于用户画像的个性化信息推送方法及用户端 |
CN111652658A (zh) * | 2020-06-11 | 2020-09-11 | 北京妙医佳健康科技集团有限公司 | 画像融合方法、装置、电子设备及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
AIDEN: "Kafka教程|消费者实例", pages 313, Retrieved from the Internet <URL:https://aiden-dong.github.io/2019/09/10/kafka消费者实例/> * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113409076A (zh) * | 2021-06-11 | 2021-09-17 | 广州天辰信息科技有限公司 | 一种基于大数据构建用户画像的方法、系统及云平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108073519B (zh) | 测试用例生成方法和装置 | |
US20180288476A1 (en) | Method for controlling network media information publication, apparatus, and server | |
US10122598B2 (en) | Subscription watch lists for event handling | |
CN109344061B (zh) | 一种接口的异常检测方法、装置、设备及系统 | |
CN110826799B (zh) | 业务预测方法、装置、服务器及可读存储介质 | |
CN112612546A (zh) | 页面加载方法、装置、电子设备和存储介质 | |
CN112506950A (zh) | 数据聚合处理方法、计算节点、计算集群及存储介质 | |
CN110245684B (zh) | 数据处理方法、电子设备和介质 | |
WO2019205307A1 (zh) | 资源处理节点的运行方法、装置、终端设备及介质 | |
CN112861013A (zh) | 用户画像更新方法、装置、电子设备及存储介质 | |
CN113407419B (zh) | 内存泄漏检测方法、装置、计算机设备和存储介质 | |
CN112862455A (zh) | 试验执行工单生成方法、装置、计算机设备和存储介质 | |
CN113238815A (zh) | 一种接口访问控制方法、装置、设备及存储介质 | |
CN109343985B (zh) | 一种数据处理方法、装置及存储介质 | |
CN108804561B (zh) | 数据同步方法及装置 | |
CN110083438B (zh) | 事务分发方法、装置、设备和存储介质 | |
US9069562B2 (en) | Mobile computing program slicing and behavior | |
CN112631905A (zh) | 执行过程数据管理方法、装置、计算机设备及存储介质 | |
CN113807923B (zh) | 一种订单处理方法、装置、电子设备及可读存储介质 | |
US20140136487A1 (en) | Content management targeted rollback | |
CN112612415B (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN109271398B (zh) | 数据库事务处理方法、装置、设备和计算机可读存储介质 | |
CN116841504A (zh) | 流水号生成方法、装置、存储介质及电子设备 | |
CN112434001A (zh) | 支持数据预处理的多数据源可配置MongoDB数据同步系统、电子设备及介质 | |
CN116976996A (zh) | 信息分析方法、信息处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176 Applicant after: Jingdong Technology Holding Co.,Ltd. Address before: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176 Applicant before: Jingdong Digital Technology Holding Co., Ltd |