CN109213802B - 用户画像构建方法、装置、终端和计算机可读存储介质 - Google Patents

用户画像构建方法、装置、终端和计算机可读存储介质 Download PDF

Info

Publication number
CN109213802B
CN109213802B CN201810933068.3A CN201810933068A CN109213802B CN 109213802 B CN109213802 B CN 109213802B CN 201810933068 A CN201810933068 A CN 201810933068A CN 109213802 B CN109213802 B CN 109213802B
Authority
CN
China
Prior art keywords
user
external
label
external object
portrait
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810933068.3A
Other languages
English (en)
Other versions
CN109213802A (zh
Inventor
史源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810933068.3A priority Critical patent/CN109213802B/zh
Publication of CN109213802A publication Critical patent/CN109213802A/zh
Application granted granted Critical
Publication of CN109213802B publication Critical patent/CN109213802B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)

Abstract

本发明实施例提出一种用户画像构建方法、装置、终端和计算机可读存储介质,方法包括:从外部数据源中选取多个已有标签作为选定标签集合;从用户数据源中获取与选定媒介对应的媒介对象集合;从外部数据源中获取与媒介对象集合相对应的外部对象集合,外部对象集合中的每一个外部对象包含选定标签集合;利用各外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。本发明实施例能够通过外部数据源中已有的标签,结合用户行为数据,快速构建用户专属的用户画像。

Description

用户画像构建方法、装置、终端和计算机可读存储介质
技术领域
本发明涉及大数据技术领域,尤其涉及一种用户画像构建方法、装置、终端和计算机可读存储介质。
背景技术
随着人工智能的发展,各行各业都有了数据意识,希望能够利用数据储备构建用户画像以支撑业务的精细化经营。但是现有的用户画像构建技术均存在以下方面的缺陷:各标签构建过程基本独立,模型复用率低,缺少通用方案。随着用户画像中要构建的标签增多,相关边际成本提高。标签种类严格受业务数据特性约束。由于过度依赖于人对业务的解读,往往只能发现数据的显性关系,从而限制可挖掘的标签种类。标签模型构建技术门槛高,传统的标签模型是构建在数据的广泛采集、大数据、人工智能计算平台以及大规模机器学习专家团队的基础上的。模型维护成本高,随着用户行为习惯和特征的变化,过去的经验不再准确或者不再适用,模型可能需要长期维护和更新。
在背景技术中公开的上述信息仅用于加强对本发明的背景的理解,因此其可能包含没有形成为本领域普通技术人员所知晓的现有技术的信息。
发明内容
本发明实施例提供一种用户画像构建方法、装置、终端和计算机可读存储介质,以解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种用户画像构建方法,包括:
从外部数据源中选取多个已有标签作为选定标签集合;
从用户数据源中获取与选定媒介对应的媒介对象集合;
从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合;
利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。
结合第一方面,本发明实施例在第一方面的第一种实现方式中,利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像,包括:
利用各所述外部对象的选定标签集合中的每一个选定标签对应的标签模型,分别结合所述用户行为数据进行计算;
将各所述外部对象的选定标签集合中相同标签的计算结果进行加权,生成用户的一个画像标签;
将所述用户的所有画像标签聚合,形成所述用户画像。
结合第一方面,本发明实施例在第一方面的第二种实现方式中,从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合,包括:
若所述外部数据源为多个,则从多个所述外部数据源中分别获取与所述媒介对象集合相对应的外部对象集合;
将各所述外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合。
结合第一方面的第二种实现方式,本发明实施例在第一方面的第三种实现方式中,将各所述外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合,包括:
将所述相同的外部对象的选定标签集合中的相同标签进行加权,生成一个加权的选定标签;
将各所述加权的选定标签聚合,形成所述聚合的选定标签集合。
结合第一方面,本发明实施例在第一方面的第四种实现方式中,还包括:
从所述用户数据源中获取最新的用户行为数据;
利用各所述外部对象的选定标签集合,对所述最新的用户行为数据进行处理,以更新用户画像。
第二方面,本发明实施例提供了一种用户画像构建装置,包括:
标签选取模块,用于从外部数据源中选取多个已有标签作为选定标签集合;
第一获取模块,用于从用户数据源中获取与选定媒介对应的媒介对象集合;
第二获取模块,用于从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合;
用户画像模块,用于利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。
在一个可能的设计中,用户画像模块包括:
计算子模块,用于利用各所述外部对象的选定标签集合中的每一个选定标签对应的标签模型,分别结合所述用户行为数据进行计算;
加权子模块,用于将各所述外部对象的选定标签集合中相同标签的计算结果进行加权,生成用户的一个画像标签;
第一聚合子模块,用于将所述用户的所有画像标签聚合,形成所述用户画像。
在一个可能的设计中,第二获取模块包括:
获取子模块,用于若所述外部数据源为多个,则从多个所述外部数据源中分别获取与所述媒介对象集合相对应的外部对象集合;
第二聚合子模块,用于将各所述外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合。
在一个可能的设计中,还包括:
更新模块,用于从所述用户数据源中获取最新的用户行为数据;利用各所述外部对象的选定标签集合,对所述最新的用户行为数据进行处理,以更新用户画像。
第三方面,本发明实施例提供了一种用户画像构建的终端,包括:
所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,用户画像构建的终端的结构中包括处理器和存储器,所述存储器用于存储支持用户画像构建的终端执行上述第一方面中用户画像构建的方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。用户画像构建的终端还可以包括通信接口,用于用户画像构建的终端与其他设备或通信网络通信。
第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储用户画像构建的终端所用的计算机软件指令,其包括用于执行上述第一方面中用户画像构建的方法为用户画像构建的终端所涉及的程序。
上述技术方案中的一个技术方案具有如下优点或有益效果:本发明实施例能够通过外部数据源中已有的标签,结合用户行为数据,快速构建用户专属的用户画像。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1为本发明实施方式提供的用户画像构建方法的流程图。
图2为本发明实施方式提供的用户画像构建方法的步骤S400的流程图。
图3为本发明实施方式提供的性别标签构建框图。
图4为本发明实施方式提供的用户画像构建方法的步骤S300的流程图。
图5为本发明实施方式提供的用户画像构建方法的步骤S320的流程图。
图6为本发明另一实施方式提供的用户画像构建方法的流程图。
图7为本发明一个应用实例的用户画像构建框图。
图8为本发明实施方式提供的用户画像构建装置的结构框图。
图9为本发明实施方式提供的用户画像模块的结构框图。
图10为本发明实施方式提供的第二获取模块的结构框图。
图11为本发明另一实施方式提供的用户画像构建装置的结构框图。
图12为本发明实施方式提供的用户画像构建终端的示意图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
本发明实施例提供了一种用户画像构建方法,如图1所示,包括以下步骤:
S100:从外部数据源中选取多个已有标签作为选定标签集合。外部数据源可以包括任意已开放的数据源或是合法采集的数据源。外部数据源中存储有若干的标签,没有标签具有对应的标签模型。可根据客户指示或业务需求,从外部数据源中选取出多个标签进行使用。
S200:从用户数据源中获取与选定媒介对应的媒介对象集合。用户数据源可以理解为客户内部自行记录和存储的已有客户的数据集合。媒介可以包括现有的任何通用媒介。例如,URL(Uniform Resource Locator,统一资源定位符)、视频、商品SKU(StockKeeping Unit,库存量单位)、社交图谱或图片等广泛应用于商业WIFI、视频媒体、电商、社交以及其他商品/服务环境中的任何媒介。媒介对象集合中的媒介对象可以包括能够体现媒介类别的若干具体的对象。例如,若媒介为视频,媒介对象则可以是具体的视频节目(电视剧、电影或短视频)。
在一个实施方式中,选定的媒介可以为一个或多个,可根据客户业务需求或客户指示选择媒介的数量和类型。
S300:从外部数据源中获取与媒介对象集合相对应的外部对象集合。
如果媒介对象集合中包括多个媒体对象,可以从外部数据源中获取与这多个媒体对象相同的外部对象。例如,媒介对象集合中包括的媒介对象为电视剧《三生三世》、《大秦帝国》和《甄嬛传》,则从外部数据源中获取的外部对象集合中包括的外部对象也为电视剧《三生三世》、《大秦帝国》和《甄嬛传》。
在一个实施方式中,可以通过协同过滤算法,从外部数据源中筛选出与媒介对象集合具有相同对象的外部对象集合。并且筛选出的每一个外部对象均包括有选定标签集合。需要说明的是,由于选定标签集合中的已有标签是通用标签。市场上主流的数据公司能够提供自然属性、位置属性、兴趣爱好等非常广泛的通用标签,足以支撑绝大部分业务场景。例如,如果选定标签集合包括的选定标签为性别、学历、兴趣、年龄段等标签,则外部对象集合的各外部对象均包括这些选定标签。
本实施例中的每一个外部对象均可以理解为是一个群体画像,该群体画像中包括了若干的标签,且若干的标签中含有这些已有标签。本实施例中的外部对象集合可以理解为由若干个群体画像形成的知识图谱。
S400:利用各外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。用户行为数据可以来自于用户数据源中记录和存储的客户自己已有用户的数据。用户行为数据可以和选定媒介直接关联或间接关联。例如,当媒介为视频时,用户行为数据可以包括用户账号、用户观看时长、用户观看类型、用户上网时段、用户操作点击的界面等数据。
需要说明的是,上述各步骤的执行顺序可进行调整,并不应当理解为按照上述步骤标号顺序执行。例如,步骤S100和S200可进行顺序调换。
在一个实施例中,如图2所示,步骤S400:利用各外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像,具体包括:
S410:利用各外部对象的选定标签集合中的每一个选定标签对应的标签模型,分别结合用户行为数据进行计算。
S420:将各外部对象的选定标签集合中相同标签的计算结果进行加权,生成用户的一个画像标签。其中,加权的方法可以采用权重调权算法、线性拟合算法或深度神经网络算法等任意现有的加权算法。
S430:将用户的所有画像标签聚合,形成用户画像。
在一个应用示例中,外部对象集合中包括5个外部对象,每个外部对象的选定标签集合中包括10个已有标签。利用每个外部对象的10个已有标签分别对用户行为数据进行计算,即将各标签结合用户行为数据进行50次计算。假设每个外部对象的选定标签集合中均包括性别标签,将5个性别标签结合用户行为数据算出的性别权重进行加权,从而得到一个用户关于性别标签的具体结果。例如,根据加权求和得到用户是男性的概率为80%,则给该用户建立男性的画像标签。对10个已有标签均计算出具体结果后,与该用户建立联系,可以形成该用户的用户画像,其中用户画像包含了十个表征该用户的标签。
如图3所示,在一个具体的应用示例中,以性别标签为例进行说明。视频厂商(客户)的其中一个媒介为视频。视频厂商从用户数据源中选定的媒介对象集合由媒介对象《三生三世》、《大秦帝国》和《甄嬛传》组成。外部数据源中获取的外部对象集合由外部对象《三生三世》、《大秦帝国》和《甄嬛传》组成。其中,外部对象《三生三世》的性别标签中,男性的权重为70%。外部对象《大秦帝国》的性别标签中,男性的权重为85%。外部对象《甄嬛传》的性别标签中,女性的权重为90%。
视频厂商的视频观看行为(用户行为数据)中记录有各用户观看《三生三世》、《大秦帝国》和《甄嬛传》的时长的行为数据。其中一个用户观看《三生三世》的时长为50分钟,观看《大秦帝国》的时长为35分钟,观看《甄嬛传》的时长为5分钟。将外部对象的性别标签模型、权重以及用户行为数据结合,从而计算出该用户为男性的概率为80%。完成了视频厂商对用户男性标签的构建。需要说明的是,本应用示例仅用于举例说明,本发明实施例的用户画像构建方法为通用方法,客户可根据需要获取外部数据源中开放的所有标签,并为用户批量的生成外部数据源中能够提供的所有标签,即形成由若干个标签组成的用户画像。
在一个实施例中,每一个选定标签的标签模型对用户行为数据进行处理时,给对应选定标签提供的用户行为数据中至少要包括该标签模型所需要用到的数据参数,以供标签模型进行计算。
在一个实施例中,如图4所示,步骤S300:从外部数据源中获取与媒介对象集合相对应的外部对象集合,外部对象集合中的每一个外部对象包含选定标签集合,具体包括:
S310:若外部数据源为多个,则从多个外部数据源中分别获取与媒介对象集合相对应的外部对象集合。例如,外部数据源包括:百度数据源、爱奇艺数据源和优酷数据源等多个数据源。则需要从每一个数据源中获取相同的外部对象集合。
S320:将各外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合。由于不同外部数据中的数据不尽相同,因此需要将不同外部数据源中的相同外部对象的选定标签集合进行聚合,形成关于同一个外部对象的同一的选定标签集合。
在一个具体实施方式中,如图5所示,步骤S320:将各外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合,包括:
S321:将相同的外部对象的选定标签集合中的相同标签进行加权,生成一个加权的选定标签。由于不同外部数据源的数据不同,所以同一个标签的权重也可能不相同。为了提高标签的标签模型准确度,将不同外部数据源中的相同标签聚合,生成一个统一的标签模型,该标签模型由于综合了各个外部数据源的数据,因此计算出的标签权重更为准确。
S322:将各加权的选定标签聚合,形成聚合的选定标签集合。
在一个实施例中,由于客户的用户和用户行为会随着时间发生变化,因此需要及时的对用户标签进行优化和更新。如图6所示,本发明实施例的方法还包括步骤:
S500:从用户数据源中获取最新的用户行为数据。
S600:利用各外部对象的选定标签集合,对最新的用户行为数据进行处理,更新用户画像。保证客户的用户画像的准确度,以便客户后续业务通过各个用户的用户画像精准展开业务推广。
在另一个实施例中,不仅客户存储记录的用户和用户行为会随时间变化,外部数据源中存储的数据也会发生变化,随着外部数据源中存储的数据变化,对应标签的标签模型通过自学习也会优化更新。因此客户可以不浪费额外的标签维护成本,而获得到最新的标签模型。进而保证客户的用户画像的准确度,以便客户后续业务通过各个用户的用户画像精准展开业务推广。
在一个应用示例中,如图7所示,客户为视频厂商,外部数据源包括数据源甲和数据源乙。媒介包括媒介1、媒介2和媒介3。客户具有用户1、用户2、用户3、用户4以及用户5。选定标签集合包括标签1、标签2和标签3。用户数据源中的用户行为数据包括各用户关于媒介1的行为、各用户关于媒介2的行为以及各用户关于媒介3的行为。
将数据源甲和数据源乙的外部对象集合中相同外部对象的标签进行聚合,使相同外部对象的选定标签集合统一。每个选定标签的标签模型通过聚合,形成一个优化的标签模型。从而构成关于媒介1的群体画像和关于媒介2的群体画像。将用户行为数据和媒介1、媒介2的群体画像结合,构建出五个用户的用户画像。每个用户的用户画像由若干画像标签组成。具体的,用户1的用户画像=id1(用户的标识)+标签1&权重+标签2&权重+标签3&权重。其中,标签1&权重为一个画像标签。用户2的用户画像=id2+标签1&权重+标签2&权重+标签3&权重。用户3的用户画像=id3+标签1&权重+标签2&权重+标签3&权重。用户4的用户画像=id4+标签1&权重+标签2&权重+标签3&权重。用户5的用户画像=id5+标签1&权重+标签2&权重+标签3&权重。
在一个应用示例中,以百度数据作为唯一外部数据源,为视频厂商客户构建用户画像为例。我们选取视频作为媒介来构建用户画像。客户拥有大量用户的网页访问数据(用户行为数据),数据的呈现为“id+url1&time+url2&time…”。百度数据拥有外部对象集合及外部对象url访问数据。百度数据基于url通过协同过滤算法,通过聚合构建出群体画像,形成url+tag1(标签1)&weight(权重)+tag2&weight形式的知识图谱进行输出。客户基于用户行为数据通过简单url频次和时间参数进行投票,可以批量的生产百度群体画像中能够提供的所有标签,从而根据已有的标签实现视频厂商客户自己的用户画像构建。
本发明实施例具有以下优点:1、根据客户的需求选取对应的媒介,通过媒介将外部数据源中开放的外部对象的群体画像和标签,与客户的内部用户行为数据进行打通融合,并通过选定标签集合中各标签的标签模型批量生成和更新客户的用户画像及标签。2、通过寻找中间媒介,打通外部数据源与用户数据源之间的壁垒。在保护用户隐私数据的情况下,通过本发明实施例的通用的用户画像构建方法,以极低的技术门槛,帮助客户能够低成本和批量地构建客户自有的用户画像体系。同时,由于整个用户画像构建的过程是模型自学习完成的,且模型的更新依赖于客户内部或外部数据的更新,没有额外的模型维护成本。
本发明实施例提供了一种用户画像构建装置,如图8所示,包括:
标签选取模块10,用于从外部数据源中选取多个已有标签作为选定标签集合。
第一获取模块20,用于从用户数据源中获取与选定媒介对应的媒介对象集合。
第二获取模块30,用于从外部数据源中获取与媒介对象集合相对应的外部对象集合,外部对象集合中的每一个外部对象包含选定标签集合。
用户画像模块40,用于利用各外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。
在一个实施例中,如图9所示,用户画像模块40包括:
计算子模块41,用于利用各外部对象的选定标签集合中的每一个选定标签对应的标签模型,分别结合用户行为数据进行计算。
加权子模块42,用于将各外部对象的选定标签集合中相同标签的计算结果进行加权,生成用户的一个画像标签。
第一聚合子模块43,用于将用户的所有画像标签聚合,形成用户画像。
在一个实施例中,如图10所示,第二获取模块30包括:
获取子模块31,用于若外部数据源为多个,则从多个外部数据源中分别获取与媒介对象集合相对应的外部对象集合。
第二聚合子模块32,用于将各外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合。
在一个实施例中,如图11所示,还包括:更新模块50,用于从用户数据源中获取最新的用户行为数据。利用各外部对象的选定标签集合,对最新的用户行为数据进行处理,以更新用户画像。
本发明实施例提供了一种用户画像构建的终端,如图12所示,包括:
存储器910和处理器920,存储器910内存储有可在处理器920上运行的计算机程序。处理器920执行计算机程序时实现上述实施例中的用户画像构建的方法。存储器910和处理器920的数量可以为一个或多个。
通信接口930,用于存储器910和处理器920与外部进行通信。
存储器910可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器910、处理器920、以及通信接口930独立实现,则存储器910、处理器920以及通信接口930可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent)总线或扩展工业标准体系结构(EISA,Extended Industry StandardComponent)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器910、处理器920以及通信接口930集成在一块芯片上,则存储器910、处理器920及通信接口930可以通过内部接口完成相互间的通信。
本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现如实施例一包括的任一所述的用户画像构建的方法。
本发明实施例通过采用容器用户画像构建的方式,改善在申请容器资源运行任务时的资源利用率,在分布式计算引擎运行任务的过程中能够节省申请容器资源带来的性能开销,避免容器资源的浪费,降低了对分布式调度系统的访问压力,提升了作业性能,实现了集群的高吞吐量和高可用性。本发明实施例通过延迟调度增加任务本地性的方式来减少任务的执行时间。本发明实施例在作业的主进程因为软硬件故障等原因挂掉后重启能够恢复正在运行的任务,无需将在主进程重启前尚未运行完成的任务清除并重新申请资源。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (11)

1.一种用户画像构建方法,其特征在于,包括:
从外部数据源中选取多个已有标签作为选定标签集合;
从用户数据源中获取与选定媒介对应的媒介对象集合;
从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合;
利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。
2.如权利要求1所述的方法,其特征在于,利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像,包括:
利用各所述外部对象的选定标签集合中的每一个选定标签对应的标签模型,分别结合所述用户行为数据进行计算;
将各所述外部对象的选定标签集合中相同标签的计算结果进行加权,生成用户的一个画像标签;
将所述用户的所有画像标签聚合,形成所述用户画像。
3.如权利要求1所述的方法,其特征在于,从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合,包括:
若所述外部数据源为多个,则从多个所述外部数据源中分别获取与所述媒介对象集合相对应的外部对象集合;
将各所述外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合。
4.如权利要求3所述的方法,其特征在于,将各所述外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合,包括:
将所述相同的外部对象的选定标签集合中的相同标签进行加权,生成一个加权的选定标签;
将各所述加权的选定标签聚合,形成所述聚合的选定标签集合。
5.如权利要求1所述的方法,其特征在于,还包括:
从所述用户数据源中获取最新的用户行为数据;
利用各所述外部对象的选定标签集合,对所述最新的用户行为数据进行处理,以更新用户画像。
6.一种用户画像构建装置,其特征在于,包括:
标签选取模块,用于从外部数据源中选取多个已有标签作为选定标签集合;
第一获取模块,用于从用户数据源中获取与选定媒介对应的媒介对象集合;
第二获取模块,用于从所述外部数据源中获取与所述媒介对象集合相对应的外部对象集合,所述外部对象集合中的每一个外部对象包含所述选定标签集合;
用户画像模块,用于利用各所述外部对象的选定标签集合,对用户行为数据进行处理,构建用户画像。
7.如权利要求6所述的装置,其特征在于,用户画像模块包括:
计算子模块,用于利用各所述外部对象的选定标签集合中的每一个选定标签对应的标签模型,分别结合所述用户行为数据进行计算;
加权子模块,用于将各所述外部对象的选定标签集合中相同标签的计算结果进行加权,生成用户的一个画像标签;
第一聚合子模块,用于将所述用户的所有画像标签聚合,形成所述用户画像。
8.如权利要求6所述的装置,其特征在于,第二获取模块包括:
获取子模块,用于若所述外部数据源为多个,则从多个所述外部数据源中分别获取与所述媒介对象集合相对应的外部对象集合;
第二聚合子模块,用于将各所述外部对象集合中相同外部对象的选定标签集合进行聚合,形成聚合的选定标签集合。
9.如权利要求6所述的装置,其特征在于,还包括:
更新模块,用于从所述用户数据源中获取最新的用户行为数据;利用各所述外部对象的选定标签集合,对所述最新的用户行为数据进行处理,以更新用户画像。
10.一种用户画像构建终端,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至5中任一项所述的方法。
11.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至5中任一项所述的方法。
CN201810933068.3A 2018-08-16 2018-08-16 用户画像构建方法、装置、终端和计算机可读存储介质 Active CN109213802B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810933068.3A CN109213802B (zh) 2018-08-16 2018-08-16 用户画像构建方法、装置、终端和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810933068.3A CN109213802B (zh) 2018-08-16 2018-08-16 用户画像构建方法、装置、终端和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109213802A CN109213802A (zh) 2019-01-15
CN109213802B true CN109213802B (zh) 2020-12-22

Family

ID=64988308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810933068.3A Active CN109213802B (zh) 2018-08-16 2018-08-16 用户画像构建方法、装置、终端和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109213802B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767290B (zh) * 2019-04-01 2024-04-19 北京百度网讯科技有限公司 用于更新用户画像的方法和装置
CN110196849B (zh) * 2019-06-05 2023-04-18 普元信息技术股份有限公司 基于大数据治理技术实现用户画像构建处理的系统及其方法
CN113127751B (zh) * 2019-12-30 2023-10-27 中移(成都)信息通信科技有限公司 用户画像构建方法、装置、设备及计算机可读存储介质
CN113297287B (zh) * 2021-04-28 2023-06-13 上海淇玥信息技术有限公司 用户策略自动部署方法、装置及电子设备
CN113326434B (zh) * 2021-06-15 2023-03-03 深圳前海微众银行股份有限公司 一种信息推荐方法、设备及存储介质
CN113592590A (zh) * 2021-07-27 2021-11-02 中国联合网络通信集团有限公司 一种用户画像生成方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729785A (zh) * 2014-01-26 2014-04-16 合一信息技术(北京)有限公司 一种视频用户性别分类方法及其装置
CN106055617A (zh) * 2016-05-26 2016-10-26 乐视控股(北京)有限公司 一种数据推送方法及装置
CN106803190A (zh) * 2017-01-03 2017-06-06 北京掌阔移动传媒科技有限公司 一种广告个性化推送系统及方法
CN108268547A (zh) * 2016-12-29 2018-07-10 北京国双科技有限公司 用户画像生成方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170154314A1 (en) * 2015-11-30 2017-06-01 FAMA Technologies, Inc. System for searching and correlating online activity with individual classification factors

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729785A (zh) * 2014-01-26 2014-04-16 合一信息技术(北京)有限公司 一种视频用户性别分类方法及其装置
CN106055617A (zh) * 2016-05-26 2016-10-26 乐视控股(北京)有限公司 一种数据推送方法及装置
CN108268547A (zh) * 2016-12-29 2018-07-10 北京国双科技有限公司 用户画像生成方法和装置
CN106803190A (zh) * 2017-01-03 2017-06-06 北京掌阔移动传媒科技有限公司 一种广告个性化推送系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《基于动态用户画像的信息推荐研究》;刘勇 等;《计算机系统应用》;20180615;第27卷(第6期);全文 *

Also Published As

Publication number Publication date
CN109213802A (zh) 2019-01-15

Similar Documents

Publication Publication Date Title
CN109213802B (zh) 用户画像构建方法、装置、终端和计算机可读存储介质
US10783450B2 (en) Learning user preferences using sequential user behavior data to predict user behavior and provide recommendations
CN110363213B (zh) 服装图像的认知分析和分类的方法和系统
US9753902B2 (en) System and method for orchestration of customization for a user experience
US8725559B1 (en) Attribute based advertisement categorization
US20190244253A1 (en) Target identification using big data and machine learning
CN111159341B (zh) 基于用户投资理财偏好的资讯推荐方法及装置
CN107885796A (zh) 信息推荐方法及装置、设备
CN111639988B (zh) 经纪人推荐方法、装置、电子设备和存储介质
US11048764B2 (en) Managing under—and over-represented content topics in content pools
US20210350190A1 (en) Using attributes for identiyfing imagery for selection
US11334750B2 (en) Using attributes for predicting imagery performance
US11449553B2 (en) Systems and methods for generating real-time recommendations
CN112613938B (zh) 模型训练方法、装置及计算机设备
JP2022525760A (ja) 予測rfmセグメンテーション
US9818044B2 (en) Content update suggestions
US20150206222A1 (en) Method to construct conditioning variables based on personal photos
US20220114616A1 (en) Digital anthropology and ethnography system
CN111177562B (zh) 一种目标对象的推荐排序处理方法、装置及服务器
US11175807B1 (en) Intelligent contextual video thumbnail display
CN116433312A (zh) 物料推送规则的生成方法和物料推送规则的生成装置
US11657409B2 (en) System and method for product demand transfer estimation through machine learning
CN110069695A (zh) 标签处理方法和装置
WO2018002664A1 (en) Data aggregation and performance assessment
CN115564450B (zh) 一种风控方法、装置、存储介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant