CN112597168A - 多源客户数据的处理方法、装置、平台及存储介质 - Google Patents

多源客户数据的处理方法、装置、平台及存储介质 Download PDF

Info

Publication number
CN112597168A
CN112597168A CN202011596015.0A CN202011596015A CN112597168A CN 112597168 A CN112597168 A CN 112597168A CN 202011596015 A CN202011596015 A CN 202011596015A CN 112597168 A CN112597168 A CN 112597168A
Authority
CN
China
Prior art keywords
data
attribute
customer
original
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011596015.0A
Other languages
English (en)
Inventor
石明陽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Enyike Beijing Data Technology Co ltd
Original Assignee
Enyike Beijing Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Enyike Beijing Data Technology Co ltd filed Critical Enyike Beijing Data Technology Co ltd
Priority to CN202011596015.0A priority Critical patent/CN112597168A/zh
Publication of CN112597168A publication Critical patent/CN112597168A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种多源客户数据的处理方法、装置、平台及存储介质,涉及多源数据处理技术领域。该方法包括:获取多个数据源中每个数据源的基础数据表,每个数据源的基础数据表存储有来自每个数据源的至少一个客户属性的原始数据;根据多个数据源的基础数据表,生成整合数据表,整合数据表中存储有:至少一个客户属性、至少一个客户属性与原始属性组的关联关系以及至少一个客户属性的优先级,每个客户属性关联的原始属性组中存储有:每个客户属性在多个数据源的基础数据表中对应的原始属性字段,至少一个客户属性的优先级为至少一个客户属性对应的每个数据源的优先级。通过本方案,确保CDP平台中具有最完整的客户数据,避免客户数据损耗。

Description

多源客户数据的处理方法、装置、平台及存储介质
技术领域
本发明涉及多源数据处理技术领域,具体而言,涉及一种多源客户数据的处理方法、装置、平台及存储介质。
背景技术
CDP(Customer Data Platform,客户数据平台)为客户数据统一管理平台,可实现将来源于多个分散系统的客户数据进行提取、清洗并合并后创建单一的客户资料。
现有的CDP平台在接入来源于多个分散系统的客户数据时,对于一个客户(自然人)在多个分散系统具有多重身份和多份信息的情况,通常会在接入数据时对客户的每一项信息定义数据唯一值取值规则,例如,客户在两个不同的系统中的姓名不一致时,按照取值规则仅将其中一个系统中的客户姓名接入CDP系统,而舍弃另外一个姓名。
上述这种数据接入CDP系统的方法,会对客户信息造成损耗,随着企业需要接入更多来源的数据时,客户信息的损耗问题会成倍放大,为企业造成数据资产的损失。
发明内容
本发明的目的在于,针对上述现有技术中的不足,提供多源客户数据的处理方法、装置、平台及存储介质,以便确保CDP平台中具有最完整的客户数据,避免客户数据损耗。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供了一种多源客户数据的处理方法,包括:
获取多个数据源中每个数据源的基础数据表,所述每个数据源的基础数据表存储有来自所述每个数据源的至少一个客户属性的原始数据;
根据所述多个数据源的基础数据表,生成整合数据表,所述整合数据表中存储有:至少一个客户属性、所述至少一个客户属性与原始属性组的关联关系以及所述至少一个客户属性的优先级,每个客户属性关联的原始属性组中存储有:所述每个客户属性在所述多个数据源的基础数据表中对应的原始属性字段,所述至少一个客户属性的优先级为所述至少一个客户属性对应的所述每个数据源的优先级。
可选的,所述整合数据表包括:关联字典表,所述关联字典表的原始属性字段存储有:所述每个客户属性关联的原始属性组。
可选的,所述关联字典表还具有:域标识字段、域值字段、原始表字段;
其中,所述域标识字段存储有所述每个客户属性的标识;所述域值字段存储有所述每个客户属性的名称;所述原始表字段存储有所述每个客户属性对应的多个基础数据表的表名。
可选的,所述关联字典表中还具有:优先级字段,所述优先级字段存储有所述每个客户属性对应的所述多个数据源的优先级。
可选的,所述方法还包括:
接收输入的客户信息查询请求,所述客户信息查询请求包括:目标客户属性;
从所述整合数据表中,查询所述目标客户属性关联的原始属性组;
根据所述目标客户属性在最高优先级的数据源中对应的目标原始属性字段,从所述最高优先级的数据源的基础数据表中,确定所述目标原始属性字段的值为所述目标客户属性对应的目标数据;
在显示界面上显示所述目标数据。
可选的,所述方法还包括:
在所述显示界面上所述目标数据对应显示位置处,显示多源客户标记,所述多源客户标记用于指示所述目标客户属性具有多个数据源的原始数据。
可选的,所述方法还包括:
响应针对所述多源客户标记的选择操作,获取所述目标客户属性在所述多个数据源的基础数据表中对应的原始属性字段的值为所述目标客户属性的多个原始数据;
在所述显示界面上显示所述目标客户属性的多个原始数据。
第二方面,本申请实施例还提供一种多源客户数据的处理装置,所述装置包括:
基础数据表获取模块,用于获取多个数据源中每个数据源的基础数据表,所述每个数据源的基础数据表存储有来自所述每个数据源的至少一个客户属性的原始数据;
整合数据表生成模块,用于根据所述多个数据源的基础数据表,生成整合数据表,所述整合数据表中存储有:至少一个客户属性、所述至少一个客户属性与原始属性组的关联关系以及所述至少一个客户属性的优先级,每个客户属性关联的原始属性组中存储有:所述每个客户属性在所述多个数据源的基础数据表中对应的原始属性字段,所述至少一个客户属性的优先级为所述至少一个客户属性对应的所述每个数据源的优先级。
可选的,所述整合数据表包括:关联字典表,所述关联字典表的原始属性字段存储有:所述每个客户属性关联的原始属性组。
可选的,所述关联字典表还具有:域标识字段、域值字段、原始表字段;
其中,所述域标识字段存储有所述每个客户属性的标识;所述域值字段存储有所述每个客户属性的名称;所述原始表字段存储有所述每个客户属性对应的多个基础数据表的表名。
可选的,所述关联字典表中还具有:优先级字段,所述优先级字段存储有所述每个客户属性对应的所述多个数据源的优先级。
可选的,所述装置还包括:
请求接收模块,用于接收输入的客户信息查询请求,所述客户信息查询请求包括:目标客户属性;
目标数据确定模块,用于根据所述目标客户属性在最高优先级的数据源中对应的目标原始属性字段,从所述最高优先级的数据源的基础数据表中,确定所述目标原始属性字段的值为所述目标客户属性对应的目标数据;
目标数据显示模块,用于在显示界面上显示所述目标数据。
可选的,所述装置还包括:
标记显示模块,用于在所述显示界面上所述目标数据对应显示位置处,显示多源客户标记,所述多源客户标记用于指示所述目标客户属性具有多个数据源的原始数据。
可选的,所述装置还包括:
选择模块,用于响应针对所述多源客户标记的选择操作,获取所述目标客户属性在所述多个数据源的基础数据表中对应的原始属性字段的值为所述目标客户属性的多个原始数据;
原始数据显示模块,用于在所述显示界面上显示所述目标客户属性的多个原始数据。
第三方面,本申请实施例还提供一种多源客户数据的处理平台,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的程序指令,当所述多源客户数据的处理平台运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述程序指令,以执行时执行如上述任一所述的多源客户数据的处理方法的步骤。
第四方面,本申请实施例还提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述任一所述的多源客户数据的处理方法的步骤。
本申请的有益效果是:
本申请提供的多源客户数据的处理方法、装置、平台及存储介质,通过获取多个数据源中每个数据源的基础数据表,每个数据源的基础数据表中存储有来自每个数据源的至少一个客户属性的原始数据,并根据多个数据源的基础数据表生成整合数据表,整合数据表中存储有至少一个客户属性、至少一个客户属性与原始属性组的关联关系以及至少一个客户属性的优先级,每个客户属性关联的原始属性组中存储有每个客户属性在多个数据源的基础数据表中对应的原始属性字段。通过本申请提供的方案,基础数据表可全量接入每个数据源的客户属性的原始数据,整合数据表中具有每个客户属性与客户属性对应的多个数据源的原始属性字段的关联关系,使得整合数据表既可以向企业提供客户的属性数据,又保留了客户的每个属性数据在多个数据源的原始属性字段,避免了客户属性数据在接入CDP平台时的客户数据损耗,以及避免由于CDP平台的业务人员或开发人员的主观判断所造成的数据整合错误而导致客户数据质量降低,保障CDP平台中具有最完整的客户数据,同时在接入新数据来源的客户数据以扩展客户数据库时也不会对现有的客户数据及客户属性与原始属性组的关联关系造成影响,方便数据接入。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的第一种多源客户数据的处理方法的流程示意图;
图2为本申请实施例提供的多源客户数据的整合示意图;
图3为本申请实施例提供的第二种多源客户数据的处理方法的流程示意图;
图4为本申请实施例提供的第三种多源客户数据的处理方法的流程示意图;
图5为本申请实施例提供的一种多源客户数据的处理装置的结构示意图;
图6为本申请实施例提供的多源客户数据的处理平台的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本申请实施例提供的多源客户数据的处理方法,可在具有多源客户数据的处理功能的平台上运行,该平台可以为安装有CDP系统的计算机设备,通过在计算机设备上运行该CDP系统,以执行本申请实施例提供的多源客户数据的处理方法,实现对多源客户数据的全量接入及数据整合。
图1为本申请实施例提供的第一种多源客户数据的处理方法的流程示意图;如图1所示,该方法可包括:
S100:获取多个数据源中每个数据源的基础数据表。
具体的,CDP系统中存储有原始数据表、基础数据表和整合数据表,通过获取多个数据源所在业务系统的至少一个客户属性的原始数据,并将每个数据源的至少一个客户属性的原始数据存储在原始数据表。通过访问原始数据表,以将客户在每个数据源的至少一个客户属性的原始数据全量接入至基础数据表,形成每个数据源的基础数据表,每个数据源的基础数据表存储有来自每个数据源的至少一个客户属性的原始数据。CDP系统可获取的原始数据为客户在访问CDP系统所属企业的业务系统时提交或默认提交的客户信息。每个业务系统对应一个数据源。
示例的,业务系统可以为软件系统,根据CDP系统所属同一组织机构的业务系统的客户信息,生成一个数据源的至少一个客户属性的原始数据。客户属性包括客户姓名属性(name)、客户性别属性(gender)、客户联系方式属性(phone)、客户公司属性(company)、客户地址属性(address)等属性,每个客户属性的原始数据以业务系统中的数据为准。示例的,组织机构可以为商家、学习、企业等。
以图2为例,图2为本申请实施例提供的多源客户数据的整合示意图,原始数据中的多个数据源包括:业务系统A、业务系统B、业务系统C、业务系统D,客户属性包括客户姓名属性(name)、客户性别属性(gender)、客户联系方式属性(phone)、客户公司属性(company)、客户地址属性(address),同一客户属性的原始数据在多个数据源中的数据内容可能相同,也可能不同,将该原始数据全量接入至基础数据表。
S200:根据多个数据源的基础数据表,生成整合数据表。
具体的,根据多个数据源的基础数据表,将多个数据源的同一客户属性的原始数据进行整合,生成每个客户属性的原始属性组,整合数据表中存储有:至少一个客户属性、至少一个客户属性与原始属性组的关联关系以及至少一个客户属性的优先级,每个客户属性关联的原始属性组中存储有:每个客户属性在多个数据源的基础数据表中对应的原始属性字段,至少一个客户属性的优先级为至少一个客户属性对应的每个数据源的优先级。
以图2为例,将基础数据表中多个数据源的客户姓名属性进行整合,生成客户姓名属性的原始属性组,将多个数据源的客户性别属性进行整合,生成客户性别属性的原始属性组,将多个数据源的客户联系方式属性进行整合,生成客户联系方式属性的原始属性组,将多个数据源的客户公司属性进行整合,生成客户公司属性的原始属性组,将多个数据源的客户地址属性进行整合,生成客户地址属性的原始属性组。根据客户属性生成的原始属性组,在整合数据表中存储客户属性、原始属性组和客户属性的关联关系,以及客户属性所属数据源的优先级。
本申请实施例提供的多源客户数据的处理方法,通过获取多个数据源中每个数据源的基础数据表,每个数据源的基础数据表中存储有来自每个数据源的至少一个客户属性的原始数据,并根据多个数据源的基础数据表生成整合数据表,整合数据表中存储有至少一个客户属性、至少一个客户属性与原始属性组的关联关系以及至少一个客户属性的优先级,每个客户属性关联的原始属性组中存储有每个客户属性在多个数据源的基础数据表中对应的原始属性字段。通过本申请提供的方案,基础数据表可全量接入每个数据源的客户属性的原始数据,整合数据表中具有每个客户属性与客户属性对应的多个数据源的原始属性字段的关联关系,使得整合数据表既可以向企业提供客户的属性数据,又保留了客户的每个属性数据在多个数据源的原始属性字段,避免了客户属性数据在接入CDP平台时的客户数据损耗,以及避免由于CDP平台的业务人员或开发人员的主观判断所造成的数据整合错误而导致客户数据质量降低,保障CDP平台中具有最完整的客户数据,同时在接入新数据来源的客户数据以扩展客户数据库时也不会对现有的客户数据及客户属性与原始属性组的关联关系造成影响,方便数据接入。
在上述实施例的基础上,本申请实施例还提供一种多源客户数据的处理方法,整合数据表可包括:关联字典表,关联字典表的原始属性字段存储有:每个客户属性关联的原始属性组。
具体的,关联字典表为预先建立的客户属性与原始属性组的关联关系的关系配置表,关联字典表中具有原始属性字段,关联字典表用于在将多个数据源的基础数据表生成整合数据表时,根据关联字典表中的原始属性字段建立每个数据源的至少一个客户属性与原始属性组的关联关系。
示例的,表1为本申请实施例提供的一种关联字典表,该关联字典表中存储有姓名属性的原始属性组:A_name、B_name、C_name、D_name,性别属性的原始属性组:A_gender、B_gender、C_gender、D_gender,联系方式属性的原始属性组:A_phone、B_phone、C_phone、D_phone,公司属性的原始属性组:A_company、D_company、D_company、D_company,地址属性的原始属性组:A_address、B_address、C_address、D_address。
以图2所示的基础数据表中的C_proflie的name为例,从关联字典表中查询到数据源C的name为姓名属性,属于姓名属性的原始属性组,则在整合数据表中将存储name的客户属性为姓名属性、关联的姓名属性的原始属性组。
在上述任一实施例的基础上,关联字典表还具有:域标识字段、域值字段、原始表字段。
具体的,域标识字段存储有每个客户属性的标识,可根据域标识字段在整合数据表中表示客户属性;域值字段存储有每个客户属性的名称,可根据域值字段在整合数据表中表示客户属性;原始表字段存储有每个客户属性对应的多个基础数据表的表名。
示例的,表1的关联字典表中,以域标识字段display_filed_id为1表示姓名属性,以域标识字段display_filed_id为2表示性别属性,以域标识字段display_filed_id为3表示联系方式属性,以域标识字段display_filed_id为4表示公司属性,以域标识字段display_filed_id为5表示地址属性。
以图2所示的基础数据表中的C_proflie的name为例,name为姓名属性,从关联字典表中查询到域标识字段display_filed_id为1,则在整合数据表中存储C_name对应的域标识字段display_filed_id为1。
示例的,表1的关联字典表中,以域值字段filed_name为name/姓名表示姓名属性,以域值字段filed_name为gender/姓名表示性别属性,以域值字段filed_name为phone/联系方式表示联系方式属性,以域值字段filed_name为company/公司表示公司属性,以域值字段filed_name为address/地址表示地址属性。
以图2所示的基础数据表中的C_proflie的name为例,name为姓名属性,从关联字典表中查询到域值字段filed_name为name/姓名,则在整合数据表中存储C_name对应的该域值字段filed_name为name/姓名。
示例的,表1的关联字典表中,原始表字段origin_table为A_profile表示属性的数据源为A,原始表字段origin_table为B_profile表示属性的数据源为B,原始表字段origin_table为C_profile表示属性的数据源为C,原始表字段origin_table为D_profile表示属性的数据源为D。
以图2所示的基础数据表中的C_proflie的name为例,从关联字典表中查询到原始表字段origin_table为C,则在整合数据表中存储C_name对应的原始表字段origin_table为C。
在上述任一实施例的基础上,关联字典表中还具有:优先级字段,优先级字段存储有每个客户属性对应的多个数据源的优先级。
具体的,优先级字段定义了多个数据源的同一客户属性在CDP系统中展示的优先级,优先级字段越小,展示优先级越高,当多个数据源的同一客户属性的优先级相同时,以最新更新的数据源的客户属性进行展示,优先级字段可基于预设的规则进行设置。
示例的,表1的关联字典表中,以优先级rank为1001表示第一优先级,以优先级rank为1002表示第二优先级,以优先级rank为1003表示第三优先级,以优先级rank为1004表示第四优先级。
以图2所示的基础数据表中的C_proflie的name为例,从关联字典表中查询到C_name的优先级rank为1002,则在整合数据表中存储C_name对应的优先级rank为1002。
示例的,表1为本申请实施例提供的一种关联字典表。
表1关联字典表
Figure BDA0002866533130000101
在一种可能的实现方式中,预设的规则为每个客户属性在多个数据源中的可信度,对每个客户属性在多个数据源中的可信度进行排序,按照每个客户属性的可信度设置优先级,数据源的客户属性的可信度越高,优先级越高。
在另一种可能的实现方式中,预设的规则为每个客户属性的多个数据源的获取方式,对每个客户属性的多个数据源的获取方式进行排序,按照每个客户属性的数据源的获取方式设置优先级。示例的,客户填写的信息调查表得到的客户属性的优先级高于客户在业务系统的注册信息的客户属性的优先级。
本申请实施例提供的多源客户数据的处理方法,根据关联字典表中具有的原始属性字段、域标识字段、域值字段、原始表字段和优先级字段,在根据多个数据源的基础数据表生成整合数据表时,根据基础数据表中至少一个客户属性的原始数据,在关联字典表中查询到客户属性的原始数据对应的原始属性字段、域标识字段、域值字段、原始表字段和优先级字段,将原始属性字段、域标识字段、域值字段、原始表字段和优先级字段存储在整合数据表中,使得整合数据表中具有每个客户的多个数据源的所有客户属性,避免了客户属性数据在接入CDP平台时的客户数据损耗,以及避免由于CDP平台的业务人员或开发人员的主观判断所造成的数据整合错误而导致客户数据质量降低,保障CDP平台中具有最完整的客户数据,同时在接入新数据来源的客户数据时也不会对现有的客户数据造成影响,方便数据接入。
在上述任一实施例的基础上,本申请实施例还提供一种多源客户数据的处理方法,图3为本申请实施例提供的第二种多源客户数据的处理方法的流程示意图,如图3所示,该方法还可包括:
S300:接收输入的客户信息查询请求。
具体的,CDP系统具有查询功能,该CDP系统在多源客户数据的处理平台上具有可展示的UI(User Interface,用户界面),该UI界面中具有属性选择栏和查询框,使用者可属性选择栏选择需要查询的客户属性,并在查询框中输入客户信息查询请求,客户信息查询请求包括:目标客户属性,目标客户属性与在属性选择栏选择的客户属性的类型相同。示例的,属性选择栏可以为域值字段filed_name形式的客户属性,如:姓名、性别、联系方式、公司、地址等;也可以为域标识字段display_filed_id的客户属性,如:1、2、3、4、5等;目标客户属性为目标客户姓名、目标客户联系方式等。
S400:从整合数据表中,查询目标客户属性关联的原始属性组。
具体的,根据属性选择栏选择的需要查询的客户属性,从整合数据表中确定原始属性组,并根据输入的目标客户属性,从原始属性组中确定目标客户属性关联的原始属性组。
S500:根据目标客户属性在最高优先级的数据源中对应的目标原始属性字段,从最高优先级的数据源的基础数据表中,确定目标原始属性字段的值为目标客户属性对应的目标数据。
具体的,根据整合数据表中存储的目标客户属性关联的原始属性组中多个原始属性字段对应的数据源的优先级,确定最高优先级的数据源的原始属性字段为目标原始属性字段,并从基础数据表获取该目标原始属性字段的值作为目标客户属性对应的目标数据。
S600:在显示界面上显示目标数据。
具体的,在显示界面上显示上述S500查找到的目标数据。
示例的,在UI界面的属性选择栏选择需要查询的客户属性为姓名属性,在查询框中输入的客户信息查询请求中包括的目标客户属性为目标客户的姓名属性,如王XX,则CDP系统基于在属性选择栏选择的姓名属性,从整合数据表中确定多个姓名属性的原始属性组,并根据的输入的目标客户的姓名属性从多个姓名属性的原始属性组中目标客户的目标原始属性组,并根据目标原始属性组中多个原始属性字段A_name、B_name、C_name、D_name对应的多个数据源的优先级,确定最高优先级的数据源A的原始属性字段A_name为目标原始属性字段,从基础数据表中查找A_name对应的值Wang XX作为目标客户属性的目标数据,在界面中显示Wang XX。
在一种可选实施方式中,除显示目标客户属性对应的目标数据外,该方法还可包括:
从整合数据表中查询与目标客户属性对应的该客户的其他客户属性的原始属性组。
根据其他客户属性在最高优先级的数据源中对应的其他原始属性字段,从最高优先级的数据源的基础数据表中,确定其他原始属性字段的值为其他客户属性对应的其他目标数据。
在显示界面上显示其他目标数据。
本申请实施例提供的多源客户数据的处理方法,接收输入的客户信息查询请求,从客户数据表中查询目标客户属性关联的原始属性组,并根据目标客户属性在最高优先级的数据源中对应的目标原始属性字段,从最高优先级的数据源的基础数据表中,确定目标原始属性字段的值为目标客户属性对应的目标数据,并在显示界面中显示目标数据。通过本方法,根据输入的需要查询的目标客户属性,从整合数据表中确定目标客户属性在最高优先级的数据源中对应的目标原始属性字段,并从基础数据表中确定目标原始属性字段的值作为目标数据进行显示,从而使得查询到的目标客户属性对应的目标数据为多个数据源中最准确的数据,避免因抛弃一些数据源中的数据而导致所提供的客户数据质量下降,具有较好的多源客户数据整合效果。
在上述任一实施例的基础上,本申请实施例还提供一种多源客户数据的处理方法,该方法还可包括:
在显示界面上目标数据对应显示位置处,显示多源客户标记,多源客户标记用于指示目标客户属性具有多个数据源的原始数据。
具体的,若目标客户属性对应的多个数据源的原始数据不同,则除了在显示界面上显示目标数据外,还显示有多源客户标记,以指示该目标客户属性在多个数据源中存在不同的原始数据。
示例的,客户在数据源A的客户姓名为王XX,在数据源B的客户姓名为XX王,且数据源A的优先级高于数据源B,若输入的客户信息查询请求中目标客户属性为XX王,则在显示界面上显示的目标数据为王XX,同时显示多源客户标记,以指示王XX在其他数据源中存在和王XX不同的客户姓名。
本申请实施例提供的多源客户数据的处理方法,通过在在显示界面上目标数据对应显示位置处,显示多源客户标记,以指示目标客户属性具有多个数据源的原始数据,使得CDP系统的使用者在查看到目标数据与使用者所输入的目标客户属性信息不对应时,使得使用者了解目标客户属性具有多个数据源的原始数据,避免使用者认为查询数据错误,减少使用者的理解偏差。
在上述任一实施例的基础上,本申请实施例还提供一种多源客户数据的处理方法,图4为本申请实施例提供的第三种多源客户数据的处理方法的流程示意图,如图4所示,该方法还可包括:
S700:响应针对多源客户标记的选择操作,获取目标客户属性在多个数据源的基础数据表中对应的原始属性字段的值为目标客户属性的多个原始数据。
具体的,若在显示界面上目标数据对应显示位置处,显示多源客户标记,CDP系统使用者在查看到该目标客户属性具有多个数据源的原始数据时,可对多源客户标记进行选择操作,CDP系统基于使用者的选择操作,从整合数据表中获取目标客户属性对应的多个原始属性字段,并从多个数据源的基础数据表中获取多个原始属性字段的值作为目标客户属性的多个原始数据。示例的,选择操作可以为单击或双击。
S800:在显示界面上显示目标客户属性的多个原始数据。
具体的,基于使用者对多源客户标记进行选择操作,在显示界面上显示目标客户属性的多个原始数据,以使得使用者查看目标客户属性在多个数据源中的原始数据。
本申请实施例提供的多源客户数据的处理方法,通过响应针对多源客户标记的选择操作,获取目标客户属性在多个数据源的基础数据表中对应的原始属性字段的值为目标客户属性的多个原始数据,并在在显示界面上显示目标客户属性的多个原始数据,使得使用者可以掌握客户在多个数据源中所记录的目标客户属性的多个原始数据,保证CDP系统中具有最完整的客户数据,减少使用者的理解偏差。
在上述任一实施例的基础上,本申请实施例还提供一种多源客户数据的处理装置,图5为本申请实施例提供的一种多源客户数据的处理装置的结构示意图,如图5所示,该装置可包括:
基础数据表获取模块100,用于获取多个数据源中每个数据源的基础数据表,每个数据源的基础数据表存储有来自每个数据源的至少一个客户属性的原始数据。
整合数据表生成模块200,用于根据多个数据源的基础数据表,生成整合数据表,整合数据表中存储有:至少一个客户属性、至少一个客户属性与原始属性组的关联关系以及至少一个客户属性的优先级,每个客户属性关联的原始属性组中存储有:每个客户属性在多个数据源的基础数据表中对应的原始属性字段,至少一个客户属性的优先级为至少一个客户属性对应的每个数据源的优先级。
可选的,整合数据表包括:关联字典表,关联字典表的原始属性字段存储有:每个客户属性关联的原始属性组。
可选的,关联字典表还具有:域标识字段、域值字段、原始表字段;
其中,域标识字段存储有每个客户属性的标识;域值字段存储有每个客户属性的名称;原始表字段存储有每个客户属性对应的多个基础数据表的表名。
可选的,关联字典表中还具有:优先级字段,优先级字段存储有每个客户属性对应的多个数据源的优先级。
可选的,该装置还可包括:
请求接收模块,用于接收输入的客户信息查询请求,客户信息查询请求包括:目标客户属性;
目标数据确定模块,用于根据目标客户属性在最高优先级的数据源中对应的目标原始属性字段,从最高优先级的数据源的基础数据表中,确定目标原始属性字段的值为目标客户属性对应的目标数据;
目标数据显示模块,用于在显示界面上显示目标数据。
可选的,该装置还可包括:
标记显示模块,用于在显示界面上目标数据对应显示位置处,显示多源客户标记,多源客户标记用于指示目标客户属性具有多个数据源的原始数据。
可选的,该装置还可包括:
选择模块,用于响应针对多源客户标记的选择操作,获取目标客户属性在多个数据源的基础数据表中对应的原始属性字段的值为目标客户属性的多个原始数据;
原始数据显示模块,用于在显示界面上显示目标客户属性的多个原始数据。
上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
图6为本申请实施例提供的多源客户数据的处理平台的示意图,该平台可以集成于终端设备或者终端设备的芯片,该终端可以是具备数据处理功能的计算计算设备。
如图6所示,该处理平台包括:处理器501、存储介质502和总线,存储介质502存储有处理器501可执行的程序指令,当多源客户数据的处理平台运行时,处理器501与存储介质502之间通过总线通信,处理器501执行程序指令,以执行上述方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本发明还提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器运行时用于执行上述方法实施例。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
上仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种多源客户数据的处理方法,其特征在于,包括:
获取多个数据源中每个数据源的基础数据表,所述每个数据源的基础数据表存储有来自所述每个数据源的至少一个客户属性的原始数据;
根据所述多个数据源的基础数据表,生成整合数据表,所述整合数据表中存储有:至少一个客户属性、所述至少一个客户属性与原始属性组的关联关系以及所述至少一个客户属性的优先级,每个客户属性关联的原始属性组中存储有:所述每个客户属性在所述多个数据源的基础数据表中对应的原始属性字段,所述至少一个客户属性的优先级为所述至少一个客户属性对应的所述每个数据源的优先级。
2.如权利要求1所述的方法,其特征在于,所述整合数据表包括:关联字典表,所述关联字典表的原始属性字段存储有:所述每个客户属性关联的原始属性组。
3.如权利要求2所述的方法,其特征在于,所述关联字典表还具有:域标识字段、域值字段、原始表字段;
其中,所述域标识字段存储有所述每个客户属性的标识;所述域值字段存储有所述每个客户属性的名称;所述原始表字段存储有所述每个客户属性对应的多个基础数据表的表名。
4.如权利要求2所述的方法,其特征在于,所述关联字典表中还具有:优先级字段,所述优先级字段存储有所述每个客户属性对应的所述多个数据源的优先级。
5.如权利要求4所述的方法,其特征在于,所述方法还包括:
接收输入的客户信息查询请求,所述客户信息查询请求包括:目标客户属性;
从所述整合数据表中,查询所述目标客户属性关联的原始属性组;
根据所述目标客户属性在最高优先级的数据源中对应的目标原始属性字段,从所述最高优先级的数据源的基础数据表中,确定所述目标原始属性字段的值为所述目标客户属性对应的目标数据;
在显示界面上显示所述目标数据。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
在所述显示界面上所述目标数据对应显示位置处,显示多源客户标记,所述多源客户标记用于指示所述目标客户属性具有多个数据源的原始数据。
7.如权利要求6所述的方法,其特征在于,所述方法还包括:
响应针对所述多源客户标记的选择操作,获取所述目标客户属性在所述多个数据源的基础数据表中对应的原始属性字段的值为所述目标客户属性的多个原始数据;
在所述显示界面上显示所述目标客户属性的多个原始数据。
8.一种多源客户数据的处理装置,其特征在于,所述装置包括:
基础数据表获取模块,用于获取多个数据源中每个数据源的基础数据表,所述每个数据源的基础数据表存储有来自所述每个数据源的至少一个客户属性的原始数据;
整合数据表生成模块,用于根据所述多个数据源的基础数据表,生成整合数据表,所述整合数据表中存储有:至少一个客户属性、所述至少一个客户属性与原始属性组的关联关系以及所述至少一个客户属性的优先级,每个客户属性关联的原始属性组中存储有:所述每个客户属性在所述多个数据源的基础数据表中对应的原始属性字段,所述至少一个客户属性的优先级为所述至少一个客户属性对应的所述每个数据源的优先级。
9.一种多源客户数据的处理平台,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的程序指令,当所述多源客户数据的处理平台运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述程序指令,以执行如权利要求1至7任一所述的多源客户数据的处理方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述的多源客户数据的处理方法的步骤。
CN202011596015.0A 2020-12-28 2020-12-28 多源客户数据的处理方法、装置、平台及存储介质 Pending CN112597168A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011596015.0A CN112597168A (zh) 2020-12-28 2020-12-28 多源客户数据的处理方法、装置、平台及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011596015.0A CN112597168A (zh) 2020-12-28 2020-12-28 多源客户数据的处理方法、装置、平台及存储介质

Publications (1)

Publication Number Publication Date
CN112597168A true CN112597168A (zh) 2021-04-02

Family

ID=75203796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011596015.0A Pending CN112597168A (zh) 2020-12-28 2020-12-28 多源客户数据的处理方法、装置、平台及存储介质

Country Status (1)

Country Link
CN (1) CN112597168A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688190A (zh) * 2021-08-25 2021-11-23 中国工商银行股份有限公司 一种客户关系的获取方法及装置
CN114490673A (zh) * 2022-04-08 2022-05-13 腾讯科技(深圳)有限公司 数据信息处理方法、装置、电子设备及存储介质
CN116089907A (zh) * 2023-04-13 2023-05-09 民航成都信息技术有限公司 航空多源数据的融合方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609154A (zh) * 2017-09-23 2018-01-19 浪潮软件集团有限公司 一种多源异构数据的处理方法及装置
CN110263314A (zh) * 2019-06-19 2019-09-20 北京明略软件系统有限公司 表格处理方法及装置、存储介质、电子装置
CN111078774A (zh) * 2019-12-05 2020-04-28 中国科学技术大学智慧城市研究院(芜湖) 一种数据的自动整合方法
CN111198910A (zh) * 2018-11-16 2020-05-26 杭州海康威视数字技术股份有限公司 数据融合方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609154A (zh) * 2017-09-23 2018-01-19 浪潮软件集团有限公司 一种多源异构数据的处理方法及装置
CN111198910A (zh) * 2018-11-16 2020-05-26 杭州海康威视数字技术股份有限公司 数据融合方法及装置
CN110263314A (zh) * 2019-06-19 2019-09-20 北京明略软件系统有限公司 表格处理方法及装置、存储介质、电子装置
CN111078774A (zh) * 2019-12-05 2020-04-28 中国科学技术大学智慧城市研究院(芜湖) 一种数据的自动整合方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688190A (zh) * 2021-08-25 2021-11-23 中国工商银行股份有限公司 一种客户关系的获取方法及装置
CN114490673A (zh) * 2022-04-08 2022-05-13 腾讯科技(深圳)有限公司 数据信息处理方法、装置、电子设备及存储介质
CN116089907A (zh) * 2023-04-13 2023-05-09 民航成都信息技术有限公司 航空多源数据的融合方法、装置、电子设备及存储介质
CN116089907B (zh) * 2023-04-13 2023-06-23 民航成都信息技术有限公司 航空多源数据的融合方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN112597168A (zh) 多源客户数据的处理方法、装置、平台及存储介质
US11803555B2 (en) Integrated entity view across distributed systems
US10970300B2 (en) Supporting multi-tenancy in a federated data management system
US20200097456A1 (en) Integrated entity view across distributed systems
US10636086B2 (en) XBRL comparative reporting
US20070239742A1 (en) Determining data elements in heterogeneous schema definitions for possible mapping
US20140067548A1 (en) Saving on device functionality for business calendar
CN107015987B (zh) 一种更新和搜索数据库的方法及设备
US20090063474A1 (en) System and Method for Information Retrieval
US9336245B2 (en) Systems and methods providing master data management statistics
CN110737706A (zh) 数据管理方法、装置、设备及计算机可读存储介质
CN110442791B (zh) 数据推送方法和系统
US20160125025A1 (en) Most likely classification code
CN111026753A (zh) 基于树形结构的标签存储方法及装置
CN112559524A (zh) 一种指标数据库建立方法、装置及存储介质
US20150317355A1 (en) Data store query
CN112328575B (zh) 数据资产血缘生成方法、装置、电子设备
CN114066533A (zh) 产品推荐方法、装置、电子设备及存储介质
CN111506564A (zh) 基于cs架构的远程数据管理方法、装置、计算机设备及存储介质
WO2016011452A1 (en) System for aggregating, comparing and acquiring collectibles, methods and uses thereof
CN113934729A (zh) 一种基于知识图谱的数据管理方法、相关设备及介质
US20200201829A1 (en) Systems and methods for compiling a database
US20160019622A1 (en) System for aggregating, comparing and acquiring collectibles, methods and uses thereof
CN112101999A (zh) 用户识别方法、装置、电子设备和计算机可读存储介质
CN110765118B (zh) 一种数据的修订方法、修订装置及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination