CN117312906A - 目标用户的确定方法、装置、设备、存储介质和产品 - Google Patents

目标用户的确定方法、装置、设备、存储介质和产品 Download PDF

Info

Publication number
CN117312906A
CN117312906A CN202311167434.6A CN202311167434A CN117312906A CN 117312906 A CN117312906 A CN 117312906A CN 202311167434 A CN202311167434 A CN 202311167434A CN 117312906 A CN117312906 A CN 117312906A
Authority
CN
China
Prior art keywords
data
source data
candidate
user
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311167434.6A
Other languages
English (en)
Inventor
严琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202311167434.6A priority Critical patent/CN117312906A/zh
Publication of CN117312906A publication Critical patent/CN117312906A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种目标用户的确定方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取业务需求和多个候选用户的源数据;基于各候选用户的源数据和业务需求,对候选用户进行画像处理,得到每一候选用户各自的画像标签;将源数据和画像标签存储至数据中台;数据中台包括由各源数据组成的数据宽表;从数据宽表的字段中筛选出与业务需求对应的目标字段;基于由目标字段组成的子数据宽表和每一候选用户各自的画像标签,从多个候选用户中筛选出与业务需求相匹配的目标用户。本方法可应用于大数据技术领域。采用本方法能够提升用户触达率。

Description

目标用户的确定方法、装置、设备、存储介质和产品
技术领域
本申请涉及大数据技术领域,特别是涉及一种目标用户的确定方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
数据中台是以“业务数据化”为目的,实施“数据业务化”,以业务的视角提供包含数据规范、收集、治理、挖掘、应用等数据服务能力。数据中台基于底层海量基础数据,为上层各机构、各系统提供统一的数据应用服务,通过对数据需求的整合分析,抽象出共性数据服务需求,在数据服务过程中沉淀数据中台数据资产,制定统一的数据服务标准与规范,满足纵向不同层级间、横向跨条线间的数据应用需求。
目前针对用户产品推荐系统与客户画像系统之间的联系并不紧密,这就导致营销员需要在多个相关的系统中进行操作,学习成本高、难以推广,从而无法及时为产品推荐最优的用户,从而会导致用户的有效触达率较低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升用户触达率的目标用户的确定方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种目标用户的确定方法,所述方法包括:
获取业务需求和多个候选用户的源数据;
基于各所述候选用户的源数据和所述业务需求,对所述候选用户进行画像处理,得到每一所述候选用户各自的画像标签;
将所述源数据和所述画像标签存储至数据中台;所述数据中台包括由各所述源数据组成的数据宽表;
从所述数据宽表的字段中筛选出与所述业务需求对应的目标字段;
基于由所述目标字段组成的子数据宽表和每一所述候选用户各自的画像标签,从所述多个候选用户中筛选出与所述业务需求相匹配的目标用户。
在其中一个实施例中,所述数据中台为数据共享中台,所述获取业务需求和多个候选用户的源数据,包括:
响应于第二部门的业务需求,确定与所述业务需求匹配的多个候选用户;
从所述数据共享中台中提取各候选用户的源数据;所述源数据为第一部门采集并存储至所述数据共享中台的。
在其中一个实施例中,所述方法还包括:
获取业务需求所对应的待推荐产品,并从所述目标用户的源数据中提取产品偏好数据;
基于所述产品偏好数据,确定每一所述待推荐产品的优先级;
基于所述待推荐产品的优先级,将所述待推荐产品依次推荐至所述目标用户。
在其中一个实施例中,所述获取业务需求和多个候选用户的源数据之后,包括:
对每一所述候选用户的源数据分别进行重复性检测,得到每一所述候选用户各自的重复性检测结果;
在所述重复性检测结果表征存在重复的情况下,对所述候选对象的源数据进行去重处理,得到去重后的源数据。
在其中一个实施例中,所述获取业务需求和多个候选用户的源数据之后,包括:
获取各所述候选用户的源数据的数据格式;
在各所述候选用户的源数据的数据格式存在差异的情况下,对各所述候选用户的源数据的数据格式进行格式转换处理,得到数据格式相同的源数据。
在其中一个实施例中,所述多个候选用户的源数据获取过程包括:
从应用程序的数据埋点中获取每一所述候选用户各自的初始源数据;
从所述初始源数据中筛选出与所述业务需求相对应的源数据。
第二方面,本申请提供了一种目标用户的确定装置,所述装置包括:
数据获取模块,用于获取业务需求和多个候选用户的源数据;
标签确定模块,用于基于各所述候选用户的源数据和所述业务需求,对所述候选用户进行画像处理,得到每一所述候选用户各自的画像标签;
数据存储模块,用于将所述源数据和所述画像标签存储至数据中台;所述数据中台包括由各所述源数据组成的数据宽表;
字段筛选模块,用于从所述数据宽表的字段中筛选出与所述业务需求对应的目标字段;
用户确定模块,用于基于由所述目标字段组成的子数据宽表和每一所述候选用户各自的画像标签,从所述多个候选用户中筛选出与所述业务需求相匹配的目标用户。
第三方面,本申请提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
第五方面,本申请提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
上述目标用户的确定方法、装置、计算机设备、存储介质和计算机程序产品,通过获取业务需求和多个候选用户的源数据,从而可以根据业务需求和每一候选对象的源数据,对各候选对象进行画像处理,从而可以得到每一候选用户各自的画像标签;通过将源数据和画像标签存储至数据中台,从而可以使得各个部门均能够获取到数据中台的数据;通过从数据宽表中的字段筛选出与业务需求相对应的目标字段,基于目标字段组成的子数据宽表和每一候选用户各自的画像标签,从而可以从多个候选用户中筛选出与业务需求相匹配的目标用户,从而可以为业务需求对应的产品推荐最优的用户,从而可以提升用户的有效触达率。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中目标用户的确定方法的应用环境图;
图2为一个实施例中目标用户的确定方法的流程示意图;
图3为一个实施例中产品推荐步骤的流程示意图;
图4为一个实施例中目标用户的确定装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的目标用户的确定方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据中台可以存储服务器104需要处理的数据。数据中台可以集成在服务器104上,也可以放在云上或其他网络服务器上。服务器104获取业务需求和多个候选用户的源数据。服务器104根据各候选用户的源数据和业务需求,对各候选用户进行画像处理,得到每一候选用户各自的画像标签。服务器104将源数据和画像标签存储至数据中台。其中,数据中台中包括由各源数据组成的数据宽表。服务器104从数据宽表的字段中筛选出与业务需求相对应的目标字段。服务器104基于由筛选出的目标字段所组成的子数据宽表和每一候选用户各自的画像标签,从多个候选用户中筛选出与业务需求相匹配的目标用户。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个示例性的实施例中,如图2所示,提供了一种目标用户的确定方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤202至步骤210。
其中:
步骤202,获取业务需求和多个候选用户的源数据。
其中,业务需求指的企业或者机构中的某一部门所提出的营销活动需求。例如,银行推销产品的业务需求。源数据指的是候选用户登录应用程序之后所产生的数据、以及从应用程序的外部所接入的数据。例如,银行内有不同的开发产品,在实施开发过程中所采集到的用户的登陆数据、购买数据、浏览数据等都属于源数据。
源数据还可以分为源系统数据、分行应用系统数据、以及外部数据。源系统数据包括产品系统的数据。例如,Boeing(波音)的数据。分行应用系统数据包括综合办公平台的数据、零售业务标准化的数据、以及绩效考核系统数据。外部数据包括总行外部数据统一接入服务平台的数据和分行自行对接引入的数据。
可选地,服务器从候选用户所登录的应用程序中获取候选用户的源数据,同时还从应用程序的外部所接入的数据中获取源数据,服务器同时还获取企业或者机构中的某一部门所提出的营销活动需求,即部门的业务需求。
步骤204,基于各候选用户的源数据和业务需求,对候选用户进行画像处理,得到每一候选用户各自的画像标签。
其中,画像标签的本质是用户需求描述,是一种刻画用户需求的模型。用户画像在推荐系统、广告系统、商业分析、数据分析、用户增长、用户研究、产品设计、数据化运营、精准营销、量化风控等领域得到广泛应用。例如,A用户频繁的购买蛋白粉、运动装备、运动器械等,那么A用户在商家的画像标签中,是一个健身爱好者。
可选地,服务器根据各候选用户的源数据以及企业的部门所提出的营销活动的业务需求,对候选对象进行画像处理,从而得到用于对候选用户的需求进行描述的画像标签。
在一个具体应用中,业务需求为推销产品A,候选用户的源数据表征候选用户经常购买与产品A属于同类型的产品,那么候选对象A的画像标签就可以是允许推荐产品A之类的标签。
步骤206,将源数据和画像标签存储至数据中台。数据中台包括由各源数据组成的数据宽表。
其中,数据中台介于源数据和应用程序之间,对各类业务系统构建统一的资产视图,建立统一的资产标准,为银行内各个部门、各应用提供数据共享和分析应用服务。数据中台建设过程中,要对源数据进行加工和整合,以便构建完整的画像标签。源数据整合后,需要结合业务需求在数据中台中建立起画像标签体系。基于已搭建的大数据平台、个人、对公以及分行集市等已有数据资产将总分行、各业务条线所需用户源数据以标签形式进行集中管理,供全行使用,最大化标签的利用和复用价值。
数据宽表指的是由各种字段以及与字段对应的具体数据所组成的表。例如,部门A中有客户号、手机号、资产,部门B中有客户号、住址、开户所在地等,数据平台中的数据宽表就是将不同部门中具有类似功能的表整合在一起所得到的一张具有更多字段的宽表。
可选地,服务器将获取到的各候选对象的源数据、以及基于源数据和业务需求所得到的画像标签均存储至数据中台中。其中,数据中台会根据各个不同部门所存储的源数据所在的表的功能,将具有相似功能的表合并到一起,从而得到一张具有更多字段的数据宽表。
步骤208,从数据宽表的字段中筛选出与业务需求对应的目标字段。
其中,目标字段的筛选可以通过机器学习算法实现。例如,使用聚类、随机森林等机器学习算法从数据宽表中筛选出与业务需求相对应的目标字段。
与业务需求对应的目标字段指的是字段与业务需求所关联的信息相匹配。例如,业务需求中待推荐的产品价值为X,那么与业务需求相对应的目标字段可以是用户的现有资源字段,用户在交易同类产品时,同类产品的价值字段等。
可选地,服务器通过使用及机器学习算法,从数据宽表中的多个字段中筛选出至少一个与业务需求所关联的信息相匹配的字段,并将筛选出的字段作为目标字段。
步骤210,基于由目标字段组成的子数据宽表和每一候选用户各自的画像标签,从多个候选用户中筛选出与业务需求相匹配的目标用户。
其中,子数据宽表中各个目标字段是从数据宽表中筛选得到的。在组成子数据宽表时,所组合的不仅只有字段,还包括字段下的具体数据,也就是包含子数据宽表中也包含了目标字段下的源数据。例如,子数据宽表A中包含姓名这一目标字段,那么子数据宽表中就还包含了具体的姓名,如姓名1、姓名2等。
与业务需求相匹配的目标用户指的是,能够被推荐业务需求所指示的营销活动或者产品、且具有较大概率能够接收推广或者购买产品的用户。例如,业务需求中所需推荐的产品价值X,产量的产品类型为A,候选用户1的画像标签表示候选用户1经常购买类型为A的产品,候选用户2的画像标签也表示候选用户2经常购买类型为A的产品,但是从子数据宽表中得知,候选用户1购买的类型A的产品价值远远低于X,而候选用户2购买的类型A的产品价值与X相近,那么就表示候选用户2为目标用户,候选用户A不为目标用户。目标用户的筛选可以通过逻辑回归、随机森林、xgboost(eXtreme Gradient Boosting,极致梯度提升)等预测算法实现。
可选地,服务器将通过机器学习算法所筛选出的目标字段组合成一张子数据宽表。服务器根据子数据宽表中各字段的数据、以及各候选用户的画像标签,从多个候选用户中筛选出与业务需求相匹配的目标用户。
上述目标用户的确定方法中,通过获取业务需求和多个候选用户的源数据,从而可以根据业务需求和每一候选对象的源数据,对各候选对象进行画像处理,从而可以得到每一候选用户各自的画像标签;通过将源数据和画像标签存储至数据中台,从而可以使得各个部门均能够获取到数据中台的数据;通过从数据宽表中的字段筛选出与业务需求相对应的目标字段,基于目标字段组成的子数据宽表和每一候选用户各自的画像标签,从而可以从多个候选用户中筛选出与业务需求相匹配的目标用户,从而可以为业务需求对应的产品推荐最优的用户,从而可以提升用户的有效触达率。
在一个示例性的实施例中,数据中台为数据共享中台,获取业务需求和多个候选用户的源数据,包括:
响应于第二部门的业务需求,确定与业务需求匹配的多个候选用户。
从数据共享中台中提取各候选用户的源数据。源数据为第一部门采集并存储至数据共享中台的。
其中,数据共享中台指的是能够将源数据共享给各个部门的平台。例如,某公司建立了一个数据共享平台,部门A从在数据共享平台中存储了源数据X,部门B产生的业务需求中刚好需要用到源数据X,则部门B可以通过数据共享平台直接获取到源数据X,并且不需要对源数据X进行任何处理,从而可以节省部门B获取源数据的时间,使得部门B的业务需求快速被处理。
第一部门和第二部门属于同一公司或者机构中的两个不同部门。
可选地,服务器将机构中的第一部门所采集的多个候选用户的源数据存储至机构所建立的数据共享中台中。服务器对机构的第二部门所发出的业务需求进行响应,然后从数据共享中台中提取出与业务需求匹配的每一候选用户各自的源数据。
本实施例中,通过将第一部门所采集到的多个候选对象的源数据存储至数据共享平台,然后在对第二部门发出的业务需求做出响应后,可以直接从数据共享平台中提取出第一部门所存储的候选用户的源数据,并且不需要对源数据进行任何处理,从而可以节省第二部门获取源数据的时间,使得第二部门的业务需求快速被处理。
在一个示例性的实施例中,如图3所示,目标对象的确定方法还包括:
步骤302,获取业务需求所对应的待推荐产品,并从目标用户的源数据中提取产品偏好数据。
其中,待推荐产品指的是发出业务需求的部门所要推荐给用户的产品,即业务需求中所指示的推荐给用户的产品。产品偏好数据指的是记录用户的历史交易行为、产品爱好等的数据。例如,用户历史购买的产品的类型、以及购买的产品的价值等数据。
可选地,服务器从部门所发送的业务需求中,获取业务需求所指示的要推荐给目标用户的产品,同时从目标用户的源数据中获取目标用户历史购买的产品的类型、以及购买的产品的价值等数据。
步骤304,基于产品偏好数据,确定每一待推荐产品的优先级。
其中,产品的优先级是通过使用机器学习算法,根据产品偏好数据中所指示的购买产品的数量,或者所购买的产品的价值所确定的。例如,根据目标用户A的产品偏好数据可知,目标用户A所购买的产品中,类型为X的产品数量最多,类型为Y的产品数量最少,那么可以确定类型为X的产品的优先级高于类型为Y的产品的优先级。
可选地,服务器使用机器学习算法,对从目标用户的源数据中提取出的产品偏好数据进行偏好预测,从而得到业务需求中所指示的每一待推荐产品的优先级。
步骤306,基于待推荐产品的优先级,将待推荐产品依次推荐至目标用户。
可选地,服务器根据待推荐产品的优先级,优先将优先级较高的产品推荐给目标用户,然后在目标用户对推荐的产品做出了购买或者不购买的决定后,再将还未推荐的产品依次推荐给目标用户。
在一个具体应用中,待推荐产品有3个,优先级顺序分别是产品1>产品2>产品3,先将产品1推荐给目标用户,然后将产品2推荐给目标用户,最后将产品3推荐给目标用户。
本实施例中,通过根据目标用户的产品偏好数据,确定业务需求所对应的各待推荐产品的优先级,从而可以得到将待推荐产品推荐给目标用户的顺序,从而能够使得优先推荐的待推荐产品都是目标用户比较感兴趣的产品,从而能够提升目标用户购买待推荐产品的概率,从而能够提升用户的有效触达率。
在一个示例性的实施例中,获取业务需求和多个候选用户的源数据之后,包括:
对每一候选用户的源数据分别进行重复性检测,得到每一候选用户各自的重复性检测结果。
在重复性检测结果表征存在重复的情况下,对候选对象的源数据进行去重处理,得到去重后的源数据。
其中,重复性检测指的是检测是否存在两个或者多个相同的数据,若存在,则将重复的数据删除,只保留一个数据。
可选地,服务器对各候选用户的源数据分别进行重复性检测,得到每一候选用户的源数据的重复性检测结果。服务器在检测到重复检测结果表征候选用户的源数据中存在数据重复的情况下,对重复的源数据进行删除处理,只保留一个数据,得到去重后的源数据。
本实施例中,通过对候选用户的源数据进行重复性检测,并在检测到候选对象的源数据存在重复的情况下,对重复的源数据进行去除处理,从而能够减少源数据存储至数据中台后所占用的存储资源,从而能够提升数据中台中存储资源的利用率。
在一个示例性的实施例中,获取业务需求和多个候选用户的源数据之后,包括:
获取各候选用户的源数据的数据格式。
在各候选用户的源数据的数据格式存在差异的情况下,对各候选用户的源数据的数据格式进行格式转换处理,得到数据格式相同的源数据。
其中,数据格式指的是数据在存储和传输中的编码方式,也就是数据的组织和表现形式。例如,币种和金额等,不同省市县等有不同的填充规则,则需要统一成同一制式。选择合适的数据格式有利于提高数据传输和处理的速率,同时减少数据在存储和传输过程中的误差率。
可选地,服务器在得到各候选用户的源数据后,对各源数据的数据格式进行解析,得到各源数据的数据格式,然后将各候选用户的源数据中,属于同一字段的源数据的格式进行统一,得到格式相同的源数据。
在一个具体应用中,候选用户A的源数据1属于字段X,源数据1的数据格式为M,候选用户A的源数据2属于字段Y,源数据2的数据格式为N,候选用户B的源数据3属于字段X,源数据3的数据格式为m,候选用户B的源数据4属于字段Y,源数据4的数据格式为n,则将源数据1和源数据3的数据格式统一成格式M或者m,将源数据2和源数据4的数据格式统一成格式N或者n。
本实施例中,通过在各候选用户的源数据的数据格式存在差异的情况下,对各候选用户的源数据进行格式转换处理,得到格式相同的源数据,从而能够使得在基于源数据和业务需求确定候选用户的画像标签时,能够减少对源数据的处理时间,从而能够提升最终确定目标用户的时间。
在一个示例性的实施例中,多个候选用户的源数据获取过程包括:
从应用程序的数据埋点中获取每一候选用户各自的初始源数据。
从初始源数据中筛选出与业务需求相对应的源数据。
其中,初始源数据指的是从应用程序的埋点中采集到的用户的所有行为数据以及日志。埋点是在候选用户的应用程序中进行的,是为了了解候选用户在应用程序中的使用情况。与业务需求相对应的源数据指的是筛选出与业务需求所关联的信息具有关联的源数据。例如,候选用户购买产品的交易数据,候选用户针对于产品的偏好数据等。
可选地,服务器基于应用程序中设置的数据埋点,采集候选用户在应用程序中的所有行为数据以及日志,即采集初始源数据。服务器根据业务需求所关联的数据信息,从采集到的初始源数据中筛选与业务需求所关联的数据信息相对应的源数据,也就是从初始源数据中筛选出有用的行为数据以及日志。
在其中一个实施例中,应用程序的数据埋点还可以采集目标用户针对于业务需求所指示的待推荐产品的购买数据、目标用户的产品持有数据、目标用户的资产变化数据等,然后根据上述数据生成针对于待推荐产品的营销评价表,从而使得公司能够根据营销评价表及时做出营销策略的调整,形成数据链路的闭环。
本实施例中,通过基于业务需求对从数据埋点中采集到的初始源数据进行筛选,从而能够使得筛选出的源数据均为与业务需求具有关联的源数据,也就是筛选出的源数据都是有用的数据,从而能够减少源数据存储至数据中台后所占用的存储资源,从而能够提升数据中台中存储资源的利用率。
本申请还提供一种应用场景,该应用场景应用上述的目标用户的确定方法。具体地,该目标用户的确定方法在该应用场景的应用如下:
服务器基于应用程序中设置的数据埋点,采集候选用户在应用程序中的所有行为数据以及日志,即采集初始源数据。服务器根据业务需求所关联的数据信息,从采集到的初始源数据中筛选与业务需求所关联的数据信息相对应的源数据,也就是从初始源数据中筛选出有用的行为数据以及日志。同时还从应用程序的外部所接入的数据中获取源数据,服务器同时还获取企业或者机构中的某一部门所提出的营销活动需求,即部门的业务需求。
服务器对各候选用户的源数据分别进行重复性检测,得到每一候选用户的源数据的重复性检测结果。服务器在检测到重复检测结果表征候选用户的源数据中存在数据重复的情况下,对重复的源数据进行删除处理,只保留一个数据,得到去重后的源数据。服务器在得到各候选用户去重后的源数据后,对各源数据的数据格式进行解析,得到各源数据的数据格式,然后将各候选用户的源数据中,属于同一字段的源数据的格式进行统一,得到格式相同的源数据。
服务器根据各候选用户的源数据以及企业的部门所提出的营销活动的业务需求,对候选对象进行画像处理,从而得到用于对候选用户的需求进行描述的画像标签。
服务器将获取到的各候选对象的源数据、以及基于源数据和业务需求所得到的画像标签均存储至数据中台中。其中,数据中台会根据各个不同部门所存储的源数据所在的表的功能,将具有相似功能的表合并到一起,从而得到一张具有更多字段的数据宽表。
服务器通过使用及机器学习算法,从数据宽表中的多个字段中筛选出至少一个与业务需求所关联的信息相匹配的字段,并将筛选出的字段作为目标字段。
服务器将通过机器学习算法所筛选出的目标字段组合成一张子数据宽表。服务器根据子数据宽表中各字段的数据、以及各候选用户的画像标签,从多个候选用户中筛选出与业务需求相匹配的目标用户。
服务器从部门所发送的业务需求中,获取业务需求所指示的要推荐给目标用户的产品,同时从目标用户的源数据中获取目标用户历史购买的产品的类型、以及购买的产品的价值等数据。服务器使用机器学习算法,对从目标用户的源数据中提取出的产品偏好数据进行偏好预测,从而得到业务需求中所指示的每一待推荐产品的优先级。
在上述实施例中,通过获取业务需求和多个候选用户的源数据,从而可以根据业务需求和每一候选对象的源数据,对各候选对象进行画像处理,从而可以得到每一候选用户各自的画像标签;通过将源数据和画像标签存储至数据中台,从而可以使得各个部门均能够获取到数据中台的数据;通过从数据宽表中的字段筛选出与业务需求相对应的目标字段,基于目标字段组成的子数据宽表和每一候选用户各自的画像标签,从而可以从多个候选用户中筛选出与业务需求相匹配的目标用户,从而可以为业务需求对应的产品推荐最优的用户,从而可以提升用户的有效触达率。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的目标用户的确定方法的目标用户的确定装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个目标用户的确定装置实施例中的具体限定可以参见上文中对于目标用户的确定方法的限定,在此不再赘述。
在一个示例性的实施例中,如图4所示,提供了一种目标用户的确定装置,包括:
数据获取模块402,用于获取业务需求和多个候选用户的源数据。
标签确定模块404,用于基于各候选用户的源数据和业务需求,对候选用户进行画像处理,得到每一候选用户各自的画像标签。
数据存储模块406,用于将源数据和画像标签存储至数据中台。数据中台包括由各源数据组成的数据宽表。
字段筛选模块408,用于从数据宽表的字段中筛选出与业务需求对应的目标字段。
用户确定模块410,用于基于由目标字段组成的子数据宽表和每一候选用户各自的画像标签,从多个候选用户中筛选出与业务需求相匹配的目标用户。
在上述实施例中,通过获取业务需求和多个候选用户的源数据,从而可以根据业务需求和每一候选对象的源数据,对各候选对象进行画像处理,从而可以得到每一候选用户各自的画像标签;通过将源数据和画像标签存储至数据中台,从而可以使得各个部门均能够获取到数据中台的数据;通过从数据宽表中的字段筛选出与业务需求相对应的目标字段,基于目标字段组成的子数据宽表和每一候选用户各自的画像标签,从而可以从多个候选用户中筛选出与业务需求相匹配的目标用户,从而可以为业务需求对应的产品推荐最优的用户,从而可以提升用户的有效触达率。
在其中一个实施例中,数据中台为数据共享中台,数据获取模块包括:
需求响应单元,用于响应于第二部门的业务需求,确定与业务需求匹配的多个候选用户。
第一数据提取单元,用于从数据共享中台中提取各候选用户的源数据。源数据为第一部门采集并存储至数据共享中台的。
在其中一个实施例中,目标用户的确定装置还包括:
第二数据提取单元,用于获取业务需求所对应的待推荐产品,并从目标用户的源数据中提取产品偏好数据。
优先级确定单元,用于基于产品偏好数据,确定每一待推荐产品的优先级。
产品推荐单元,用于基于待推荐产品的优先级,将待推荐产品依次推荐至目标用户。
在其中一个实施例中,数据获取模块包括:
数据检测单元,用于对每一候选用户的源数据分别进行重复性检测,得到每一候选用户各自的重复性检测结果。
数据去重单元,用于在重复性检测结果表征存在重复的情况下,对候选对象的源数据进行去重处理,得到去重后的源数据。
在其中一个实施例中,数据获取模块包括:
格式获取单元,用于获取各候选用户的源数据的数据格式。
格式转换单元,用于在各候选用户的源数据的数据格式存在差异的情况下,对各候选用户的源数据的数据格式进行格式转换处理,得到数据格式相同的源数据。
在其中一个实施例中,数据获取模块包括:
第三数据获取单元,用于从应用程序的数据埋点中获取每一候选用户各自的初始源数据。
数据筛选单元,用于从初始源数据中筛选出与业务需求相对应的源数据。
上述目标用户的确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个示例性的实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储业务需求、多个候选用户的源数据、每一候选用户各自的画像标签、数据宽表、目标字段、子数据宽表、目标用户。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标用户的确定方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个示例性的实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取业务需求和多个候选用户的源数据;基于各候选用户的源数据和业务需求,对候选用户进行画像处理,得到每一候选用户各自的画像标签;将源数据和画像标签存储至数据中台;数据中台包括由各源数据组成的数据宽表;从数据宽表的字段中筛选出与业务需求对应的目标字段;基于由目标字段组成的子数据宽表和每一候选用户各自的画像标签,从多个候选用户中筛选出与业务需求相匹配的目标用户。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
响应于第二部门的业务需求,确定与业务需求匹配的多个候选用户;从数据共享中台中提取各候选用户的源数据;源数据为第一部门采集并存储至数据共享中台的。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取业务需求所对应的待推荐产品,并从目标用户的源数据中提取产品偏好数据;基于产品偏好数据,确定每一待推荐产品的优先级;基于待推荐产品的优先级,将待推荐产品依次推荐至目标用户。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对每一候选用户的源数据分别进行重复性检测,得到每一候选用户各自的重复性检测结果;在重复性检测结果表征存在重复的情况下,对候选对象的源数据进行去重处理,得到去重后的源数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取各候选用户的源数据的数据格式;在各候选用户的源数据的数据格式存在差异的情况下,对各候选用户的源数据的数据格式进行格式转换处理,得到数据格式相同的源数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
从应用程序的数据埋点中获取每一候选用户各自的初始源数据;从初始源数据中筛选出与业务需求相对应的源数据。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取业务需求和多个候选用户的源数据;基于各候选用户的源数据和业务需求,对候选用户进行画像处理,得到每一候选用户各自的画像标签;将源数据和画像标签存储至数据中台;数据中台包括由各源数据组成的数据宽表;从数据宽表的字段中筛选出与业务需求对应的目标字段;基于由目标字段组成的子数据宽表和每一候选用户各自的画像标签,从多个候选用户中筛选出与业务需求相匹配的目标用户。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
响应于第二部门的业务需求,确定与业务需求匹配的多个候选用户;从数据共享中台中提取各候选用户的源数据;源数据为第一部门采集并存储至数据共享中台的。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取业务需求所对应的待推荐产品,并从目标用户的源数据中提取产品偏好数据;基于产品偏好数据,确定每一待推荐产品的优先级;基于待推荐产品的优先级,将待推荐产品依次推荐至目标用户。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对每一候选用户的源数据分别进行重复性检测,得到每一候选用户各自的重复性检测结果;在重复性检测结果表征存在重复的情况下,对候选对象的源数据进行去重处理,得到去重后的源数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取各候选用户的源数据的数据格式;在各候选用户的源数据的数据格式存在差异的情况下,对各候选用户的源数据的数据格式进行格式转换处理,得到数据格式相同的源数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
从应用程序的数据埋点中获取每一候选用户各自的初始源数据;从初始源数据中筛选出与业务需求相对应的源数据。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取业务需求和多个候选用户的源数据;基于各候选用户的源数据和业务需求,对候选用户进行画像处理,得到每一候选用户各自的画像标签;将源数据和画像标签存储至数据中台;数据中台包括由各源数据组成的数据宽表;从数据宽表的字段中筛选出与业务需求对应的目标字段;基于由目标字段组成的子数据宽表和每一候选用户各自的画像标签,从多个候选用户中筛选出与业务需求相匹配的目标用户。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
响应于第二部门的业务需求,确定与业务需求匹配的多个候选用户;从数据共享中台中提取各候选用户的源数据;源数据为第一部门采集并存储至数据共享中台的。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取业务需求所对应的待推荐产品,并从目标用户的源数据中提取产品偏好数据;基于产品偏好数据,确定每一待推荐产品的优先级;基于待推荐产品的优先级,将待推荐产品依次推荐至目标用户。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对每一候选用户的源数据分别进行重复性检测,得到每一候选用户各自的重复性检测结果;在重复性检测结果表征存在重复的情况下,对候选对象的源数据进行去重处理,得到去重后的源数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取各候选用户的源数据的数据格式;在各候选用户的源数据的数据格式存在差异的情况下,对各候选用户的源数据的数据格式进行格式转换处理,得到数据格式相同的源数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
从应用程序的数据埋点中获取每一候选用户各自的初始源数据;从初始源数据中筛选出与业务需求相对应的源数据。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种目标用户的确定方法,其特征在于,所述方法包括:
获取业务需求和多个候选用户的源数据;
基于各所述候选用户的源数据和所述业务需求,对所述候选用户进行画像处理,得到每一所述候选用户各自的画像标签;
将所述源数据和所述画像标签存储至数据中台;所述数据中台包括由各所述源数据组成的数据宽表;
从所述数据宽表的字段中筛选出与所述业务需求对应的目标字段;
基于由所述目标字段组成的子数据宽表和每一所述候选用户各自的画像标签,从所述多个候选用户中筛选出与所述业务需求相匹配的目标用户。
2.根据权利要求1所述的方法,其特征在于,所述数据中台为数据共享中台,所述获取业务需求和多个候选用户的源数据,包括:
响应于第二部门的业务需求,确定与所述业务需求匹配的多个候选用户;
从所述数据共享中台中提取各候选用户的源数据;所述源数据为第一部门采集并存储至所述数据共享中台的。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取业务需求所对应的待推荐产品,并从所述目标用户的源数据中提取产品偏好数据;
基于所述产品偏好数据,确定每一所述待推荐产品的优先级;
基于所述待推荐产品的优先级,将所述待推荐产品依次推荐至所述目标用户。
4.根据权利要求1所述的方法,其特征在于,所述获取业务需求和多个候选用户的源数据之后,包括:
对每一所述候选用户的源数据分别进行重复性检测,得到每一所述候选用户各自的重复性检测结果;
在所述重复性检测结果表征存在重复的情况下,对所述候选对象的源数据进行去重处理,得到去重后的源数据。
5.根据权利要求1所述的方法,其特征在于,所述获取业务需求和多个候选用户的源数据之后,包括:
获取各所述候选用户的源数据的数据格式;
在各所述候选用户的源数据的数据格式存在差异的情况下,对各所述候选用户的源数据的数据格式进行格式转换处理,得到数据格式相同的源数据。
6.根据权利要求1所述的方法,其特征在于,所述多个候选用户的源数据获取过程包括:
从应用程序的数据埋点中获取每一所述候选用户各自的初始源数据;
从所述初始源数据中筛选出与所述业务需求相对应的源数据。
7.一种目标用户的确定装置,其特征在于,所述装置包括:
数据获取模块,用于获取业务需求和多个候选用户的源数据;
标签确定模块,用于基于各所述候选用户的源数据和所述业务需求,对所述候选用户进行画像处理,得到每一所述候选用户各自的画像标签;
数据存储模块,用于将所述源数据和所述画像标签存储至数据中台;所述数据中台包括由各所述源数据组成的数据宽表;
字段筛选模块,用于从所述数据宽表的字段中筛选出与所述业务需求对应的目标字段;
用户确定模块,用于基于由所述目标字段组成的子数据宽表和每一所述候选用户各自的画像标签,从所述多个候选用户中筛选出与所述业务需求相匹配的目标用户。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202311167434.6A 2023-09-11 2023-09-11 目标用户的确定方法、装置、设备、存储介质和产品 Pending CN117312906A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311167434.6A CN117312906A (zh) 2023-09-11 2023-09-11 目标用户的确定方法、装置、设备、存储介质和产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311167434.6A CN117312906A (zh) 2023-09-11 2023-09-11 目标用户的确定方法、装置、设备、存储介质和产品

Publications (1)

Publication Number Publication Date
CN117312906A true CN117312906A (zh) 2023-12-29

Family

ID=89280287

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311167434.6A Pending CN117312906A (zh) 2023-09-11 2023-09-11 目标用户的确定方法、装置、设备、存储介质和产品

Country Status (1)

Country Link
CN (1) CN117312906A (zh)

Similar Documents

Publication Publication Date Title
CN109582876B (zh) 旅游行业用户画像构造方法、装置和计算机设备
CN112989059A (zh) 潜在客户识别方法及装置、设备及可读计算机存储介质
Wang et al. Collaboration based multi-label propagation for fraud detection
Arun et al. Big data: review, classification and analysis survey
CN114663198A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN113051480A (zh) 资源推送方法、装置、电子设备及存储介质
CN114693409A (zh) 产品匹配方法、装置、计算机设备、存储介质和程序产品
CN107729330A (zh) 获取数据集的方法和装置
CN116467525A (zh) 业务产品的推荐方法、装置、设备和存储介质
CN116483822A (zh) 业务数据预警方法、装置、计算机设备、存储介质
CN110619564B (zh) 一种反欺诈特征生成方法和装置
CN114723554B (zh) 异常账户识别方法及装置
US11687977B2 (en) System and method for predicting customer lifetime value using two-stage machine learning
CN117312906A (zh) 目标用户的确定方法、装置、设备、存储介质和产品
CN115619261A (zh) 一种作业标签画像数据处理方法、装置、计算机设备
CN115098572A (zh) 用户画像构建方法、装置和计算机设备
CN112907308B (zh) 数据检测方法和装置、计算机可读存储介质
CN114943543A (zh) 模型训练方法、异常商品识别方法、电子设备及存储介质
CN113822691A (zh) 用户账号的识别方法、装置、系统和介质
CN113743838A (zh) 目标用户识别方法、装置、计算机设备和存储介质
CN117786204A (zh) 金融资源对象推荐方法、装置、设备、存储介质和产品
CN116881546A (zh) 资源推荐方法、装置、设备和存储介质
CN115408280A (zh) 流量分配方法、分流模型配置方法、设备、介质和产品
CN117312660A (zh) 项目推送方法、装置、计算机设备和存储介质
CN117312999A (zh) 对象分类方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination