CN112752256B - 客户画像标签确定方法、装置、设备及存储介质 - Google Patents
客户画像标签确定方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112752256B CN112752256B CN201911052424.1A CN201911052424A CN112752256B CN 112752256 B CN112752256 B CN 112752256B CN 201911052424 A CN201911052424 A CN 201911052424A CN 112752256 B CN112752256 B CN 112752256B
- Authority
- CN
- China
- Prior art keywords
- user
- tag
- label
- identification information
- number identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000003860 storage Methods 0.000 title claims abstract description 20
- 238000012545 processing Methods 0.000 claims description 44
- 238000002372 labelling Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 15
- 238000004891 communication Methods 0.000 abstract description 10
- 230000008569 process Effects 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000004140 cleaning Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/18—Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5061—Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
- H04L41/5064—Customer relationship management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Signal Processing (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例涉及通信技术领域,尤其涉及一种客户画像标签确定方法、装置、设备及存储介质,所述方法包括:基于用户身份信息对应的全部用户号码标识信息,确定第一用户标签;所述第一用户标签为基于所述用户号码标识信息的标签;基于所述第一用户标签,获取客户画像标签;所述客户画像标签为基于所述用户身份信息的标签,解决如何建立了准确的客户画像标签的问题,进而建立了完整和全面的客户画像标签体系。
Description
技术领域
本申请涉及通信技术领域,尤其涉及一种客户画像标签确定方法、装置、设备及存储介质。
背景技术
用户画像在存量用户的保有、价值挖掘提升、精准营销等方面都发挥着重要作用,目前在电信运营商领域,如何建立一个准确的客户画像标签是需要解决的问题。
发明内容
本申请实施例提供一种客户画像标签确定方法、装置、设备及存储介质,能够提供更为准确的客户画像标签。
为达到上述目的,本申请实施例的技术方案是这样实现的:
第一方面,本申请实施例提供一种客户画像标签确定方法,客户画像标签确定方法包括:
基于用户身份信息对应的全部用户号码标识信息,确定第一用户标签;第一用户标签为基于用户号码标识信息的标签;
基于第一用户标签,获取客户画像标签;客户画像标签为基于用户身份信息的标签。
在一些实施例中,基于用户身份信息对应的全部用户号码标识信息,确定第一用户标签,包括:
根据第一业务系统中的业务参数,确定与用户号码标识信息对应的第一用户子标签;
和/或,从第二业务系统直接获取与用户号码标识信息对应的第二用户子标签;
基于用户号码标识信息关联第一用户子标签和第二用户子标签,得到与用户号码标识信息对应的第一用户标签。
在一些实施例中,根据第一业务系统中的业务参数,确定与用户号码标识信息对应的第一用户子标签,包括:
根据第一业务系统中的业务参数,获取与用户号码标识信息对应的第一业务参数;
对第一业务参数进行标签化处理,将第一业务参数转换成第一系统标签;
对第一系统标签进行汇总处理,确定与用户号码标识信息对应的第一用户子标签。
在一些实施例中,基于第一用户标签,获取客户画像标签,包括:
当用户身份信息对应一个用户号码标识信息时,客户画像标签与第一用户标签相同。
在一些实施例中,基于第一用户标签,获取客户画像标签,包括:
当用户身份信息对应至少两个用户号码标识信息时,基于第一用户标签的类别确定客户画像标签。
在一些实施例中,基于第一用户标签的类别确定客户画像标签,包括:
当至少两个用户号码标识信息对应的第一用户标签相同,且第一用户标签的类别为第一类标签时,客户画像标签与第一用户标签相同;
或者,当至少两个用户号码标识信息对应的第一用户标签相同,且第一用户标签的类别为第二类标签时,对获取全部用户号码标识信息对应的第一用户标签的业务参数至少进行加和运算或平均运算,得到客户画像标签。
在一些实施例中,基于第一用户标签的类别确定客户画像标签,包括:
当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第一类标签时,若全部用户号码标识信息对应的第一用户标签中包含一个第一标签,确定第一标签为客户画像标签;
或者,当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第一类标签时,若全部用户号码标识信息对应的第一用户标签都包含第二标签,确定第二标签为客户画像标签;
或者,当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第一类标签时,确定全部用户号码标识信息对应的第一用户标签中包含个数最多的第三标签,确定第三标签为客户画像标签;
或者,当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第二类标签时,对获取全部用户号码标识信息对应的第一用户标签的业务参数至少进行取极值运算、或加和运算、或平均运算,得到客户画像标签。
第二方面,本申请实施例提供一种客户画像标签确定装置,客户画像标签确定装置包括:
确定模块,用于基于用户身份信息对应的全部用户号码标识信息,确定第一用户标签;第一用户标签为基于用户号码标识信息的标签;
获取模块,用于基于第一用户标签,获取客户画像标签;客户画像标签为基于用户身份信息的标签。
第三方面,本申请实施例提供一种设备,设备包括处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,处理器用于运行计算机程序时,执行本申请任一实施例所提供的客户画像标签确定方法。
第四方面,本申请实施例提供一种存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现本申请任一实施例所提供的客户画像标签确定方法的步骤。
本申请实施例所提供的一种客户画像标签确定方法,方法包括:基于用户身份信息对应的全部用户号码标识信息,确定第一用户标签;第一用户标签为基于用户号码标识信息的标签;基于第一用户标签,获取客户画像标签;客户画像标签为基于用户身份信息的标签,从而通过客户的身份信息对应的所有用户号码标识信息,并根据用户号码标识信息确定用户标签,获取到客户对应的全部用户标签,同时基于用户标签与客户画像标签之间的对应关系,将用户标签集成转化成客户画像标签,简化了客户画像标签的确定过程;通过建立准确的客户画像标签,建立了完整和全面的客户画像标签体系。
附图说明
图1为本申请一实施例中客户画像标签确定方法的处理流程示意图;
图2为本申请另一实施例中客户画像标签确定方法的处理流程示意图;
图3为本申请一实施例中第一用户标签的组成结构示意图;
图4为本申请一实施例中第一用户标签确定方法的处理流程示意图;
图5为本申请另一实施例中客户画像标签确定方法的处理流程示意图;
图6为本申请一实施例中客户画像标签确定装置的结构示意图;
图7为本申请一实施例中客户画像标签确定设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对申请的具体技术方案做进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
在对本申请实施例提供一种客户画像标签确定方法进行详细描述之前,首先对用户画像进行简要介绍。
用户画像是指根据用户偏好习惯、消费习惯等信息抽象出的标签化画像,构建用户画像核心是给用户贴“标签”。目前,电信运营商是基于手机号码采集用户信息,对手机号码用户进行用户画像,然而基于一个手机号码采集的用户信息有限,从而导致最终的用户画像标签并不完整甚至存在偏差,进而使得构建的用户画像体系偏离实际情况。
但是,根据国家工信部下发的实名制有关规定,所有电信手机卡都需要办理实名登记,且同一个有效身份证件号码,在全国范围内同一家运营商最多允许办理五个手机号码。随着“一证五号”政策的落地实施和“携号转网”政策的全面开放,自然人(在无特殊说明时,本申请实施例中客户均特指自然人)的需求成为支撑系统信息模型不断趋于完善的主要驱动力。电信运营商将原来的营销视角从用户转向客户,更加突出和强调“以客户为中心”和“以人为本”的服务理念。
在此需要说明的是,本申请实施例中电信运营商是指提供固定电话、移动电话和互联网接入的通信服务公司。
本发明实施例一方面,提供一种客户画像标签确定方法,请参阅图1,客户画像标签方法包括如下步骤:
步骤101,基于用户身份信息对应的全部用户号码标识信息,确定第一用户标签,第一用户标签为基于用户号码标识信息的标签。
这里,基于用户身份信息对应的全部用户号码标识信息,确定第一用户标签是指,客户画像标签确定装置基于已有的业务系统的业务数据信息,根据用户号码标识确定对应的第一用户标签。
其中,用户身份信息可以包括客户的有效身份信息,用户号码标识信息是指包含手机号码的标识信息,包含手机号码的标识信息可以为手机号码,还可以为采用各种算法对手机号码进行加密的信息。例如MD5(Message-Digest Algorithm 5,信息-摘要算法5)加密的手机号码信息。具体地,通过客户的有效身份信息查询电信运营商已经建立并且在生产系统中持续稳定运行的数据系统,采集客户的信息,确定客户的有效身份信息对应的全部用户号码标识信息。
例如,数据系统包括“一证五号”系统,客户的有效身份信息可以包括自然人的有效身份证件号码,包括身份证、军官证、护照、边境通行证、港澳台居民往来内地通行证等真实客户信息。“一证五号”系统中客户的信息表,请参见表1,包括: MD5加密的身份证件号码、MD5加密的手机号码、手机号码的归属省份、手机号码的入网时间等信息。通过根据客户的有效身份证号查询“一证五号”系统,可以确定出MD5加密的身份证号对应的全部MD5加密的手机号码,如此,对客户的姓名、身份证件号码及其手机号码等做MD5 隐私化加密处理,保护了客户的隐私,减少用户信息泄露的风险。同时建立了客户的有效身份证件号码与其名下的手机号码的映射关系,相当于建立了客户画像标签与用户标签的一种映射关系。
字段名称 | 字段类型 | 字段中文名 |
cid_category | STRING | 证件类型 |
cid_code | STRING | 证件号码MD5值 |
name_code | STRING | 客户姓名MD5值 |
pn_province_code | STRING | 手机号码归属省代码 |
msisdn | STRING | 手机号码MD5值 |
effective_time | TIMESTAMP | 入网时间 |
statis_d | STRING | 日期(分区) |
表1客户的信息表
步骤102,基于第一用户标签,获取客户画像标签;客户画像标签为基于用户身份信息的标签。
这里,由于同一个客户对应的用户标签存在多种情况,如用户身份信息对应的用户号码标识信息的情况不同,如一个有效身份证件号码对应一个手机号,或者一个有效身份证件号码对应多个手机号,或者用户标签的类别多样,或者同一个客户对应同一个标签的业务参数可能多样。因此,针对上述存在的多种情况,客户画像标签确定装置需要分情况对第一用户标签进行处理,获取客户画像标签。
在上述实施例中,基于用户身份信息对应的全部用户号码标识信息,确定第一用户标签;第一用户标签为基于用户号码标识信息的标签;基于第一用户标签,获取客户画像标签;客户画像标签为基于用户身份信息的标签,从而通过客户的有效身份信息对应的所有用户号码标识信息,并根据用户号码标识信息确定用户标签,获取到客户对应的全部用户标签,同时基于用户标签与客户画像标签之间的对应关系,将用户标签集成转化成客户画像标签,简化了客户画像标签的计算过程;通过建立准确的客户画像标签,建立了完整和全面的客户画像标签体系。
在一些实施例中,步骤101,基于用户身份信息对应的全部用户号码标识信息,确定第一用户标签,包括:
根据第一业务系统中的业务参数,确定与用户号码标识信息对应的第一用户子标签。
这里,第一业务系统包括能够处理用户原始数据的数据系统,第一业务系统中的业务参数包括处理后的用户数据。因此,客户画像标签确定装置基于用户号码标识信息,从第一业务系统中获取到对应的业务参数,对对应的业务参数进行标签化计算,从而获取到第一用户子标签。
例如,第一业务系统包括电信运营商的业务系统,第一业务系统中的业务参数至少包括电信运营商的业务系统的业务参数,如上网流量、月租费用等参数。第一业务系统包括集中化经营分析系统、和/或一级经营分析系统、和/或逍遥位置系统等业务系统,第一业务系统中的业务参数包括集中化经营分析系统的APP(Application,应用程序)偏好基础信息,和/或一级经营分析系统信息,和/或逍遥位置系统信息。其中,集中化经营分析系统的APP(Application,应用程序)偏好基础信息,请参见表2,包括:用户手机号、用户IMSI(International Mobile Subscriber Identity,国际移动用户识别码)、AAP一级分类ID(Identification,身份识别)、AAP二级分类ID、APP_ID和APP中文名等业务参数。
字段名称 | 字段类型 | 字段中文名 |
mobile_num | STRING | 用户手机号 |
imsi | STRING | 用户IMSI |
app_type_id | STRING | APP一级分类ID |
app_subtype_id | STRING | APP二级分类ID |
app_id | STRING | APP_ID |
app_name_zh | STRING | APP中文名 |
use_sum | STRING | 使用次数 |
flow_sum | STRING | 流量 |
city | STRING | 归属地市 |
province | STRING | 归属省 |
…… | …… | …… |
表2 集中化经分系统的APP偏好基础信息表
一级经营分析系统信息表,请参见表3,包括:入网方式、用户星级、用户积分、品牌等业务参数。
接口单元名称 | 接口内容描述 |
用户信息画像 | 入网方式、用户星级、用户积分、品牌等 |
短彩信使用量画像 | 短信量、彩信量等 |
GPRS使用量画像 | 网络类型、上网时长、GPRS流量等 |
WLAN使用量画像 | 上网流量、上网时长等 |
语音通话量画像 | 通话次数、通话时长、漫游、本地通话等 |
4G属性画像 | 套餐标志、增值业务标识等 |
费用画像 | 通话费、增值费、月租费、上网费、欠费、余额等 |
终端配置画像 | 终端类型、终端品牌、终端型号等 |
用户证件号码数量汇总 | 证件号码、手机号码数量等 |
全球通用户表 | 全球通用户级别、级别生效日等 |
交往圈类语音通话 | 主叫号码、被叫号码、呼叫次数、呼叫时长等 |
…… | …… |
表3 一级经分系统信息表
逍遥位置系统信息表,请参见表4,包括:手机号码、居住地城市、居住地经度、居住地纬度和工作地城市等业务参数。
字段名称 | 字段类型 | 字段中文名 |
msisdn | STRING | 手机号码 |
imsi | STRING | IMSI |
home_localcity | STRING | 居住地城市 |
home_longitude | STRING | 居住地经度 |
home_latitude | STRING | 居住地纬度 |
home_lacid | STRING | 居住地基站lacid |
home_cellid | STRING | 居住地基站cellid |
home_days | STRING | 每月居住地天数 |
work_localcity | STRING | 工作地城市 |
work_longitude | STRING | 工作地经度 |
work_latitude | STRING | 工作地纬度 |
work_lacid | STRING | 工作地基站lacid |
work_cellid | STRING | 工作地基站cellid |
work_days | STRING | 每月工作地天数 |
…… | …… | …… |
表4 逍遥位置系统信息表
例如,第一业务系统还可以包括电信运营商的合作友商、互联网等其它第三方的业务系统,例如终端厂商的业务系统、手机APP公司的业务系统等。如此,增加第三方的业务系统,能进一步完善和丰富用户数据,提高用户数据的准确性,从而提高基于用户数据确定的用户标签的准确性,丰富标签的种类。
对第一用户子标签进行处理,确定第一用户标签。
这里,对第一用户子标签的格式进行处理,将第一用户子标签的格式转化成第一用户标签的格式。
在上述实施例中,通过第一业务系统中的业务参数,确定出第一用户子标签,从而充分利用已有的数据资源,直接采集现有业务系统中已经统计汇总好的用户数据,生成用户标签,从而利用系统中已经成熟的业务数据,简化了从源头获取数据的过程,降低采集数据量,提高生成用户标签的效率。
在一些实施例中,步骤101,基于用户身份信息对应的全部用户号码标识信息,确定第一用户标签,包括:
从第二业务系统直接获取与用户号码标识信息对应的第二用户子标签。
这里,第二业务系统包括基于用户信息构建多个用户标签的业务系统。从而,基于用户号码标识信息,可以直接从第二业务系统中获取对应的第二用户子标签。例如,第二业务系统包括集中运营平台IOP(Integrated Operation Platform,集中运营平台),IOP的信息库依据用户基础属性特性、用户行为特征、以及运营场景模型,构建多个用户标签,因此,基于用户号码标识信息,可以从IOP中获取到对应的第二用户子标签。如此,在其他业务部门经过复杂的分析建模已经完成开发的现成用户标签,从而不需要再次建立复杂的业务模型即可获取用户标签。
对第二用户子标签进行处理,确定第一用户标签。
这里,对第二用户子标签的格式进行处理,将第二用户子标签的格式转化成第一用户标签的格式。
在上述实施例中,通过第二业务系统直接获取第二用户子标签,从而利用成熟的用户标签体系获取用户身份信息对应的全部用户标签,这样缩短了用户标签的计算周期,也节约了标签计算所占用的计算资源和存储资源。
在一些实施例中,根据第一业务系统中的业务参数,确定与用户号码标识信息对应的第一用户子标签,包括:
根据第一业务系统中的业务参数,获取与用户号码标识信息对应的第一业务参数。
这里,基于用户号码标识信息从第一业务系统中,采集用户号码标识信息对应的第一业务参数。
对第一业务参数进行标签化处理,将第一业务参数转换成第一系统标签。
这里,对第一业务参数进行标签化处理包括根据第一业务参数的数值区间,对第一业务参数进行标签化处理,从而将第一业务参数转换成第一系统标签。
例如,第一业务参数包括第一业务系统的运营指标,对第一业务参数进行标签化处理,包括:按照年龄的区间段将年龄数值进行标签化处理,标签包括儿童、少年、青年、中年、老年等标签;月租费按照数值区间进行标签化处理,根据高于100元和低于30元的划分区间将月租费指标制作成高月租费和低月租费等标签;将用户的在网时长按照数值区间标签化,分为在网时长超过10年、在网时长超过5年、在网时长超过1年和在网时长不足1年等标签,诸如此类处理规则。对第一业务参数进行标签化处理均可通过业务系统中的运营指标进行简单的业务逻辑组合实现。此外,对第一业务参数进行标签化处理也可以根据神经网络模型或其它智能算法来实现。
对第一系统标签进行汇总处理,确定与用户号码标识信息对应的第一用户子标签。
这里,将第一业务系统确定出的第一系统标签,通过用户号码标识信息关联在一起,从而确定与用户号码标识信息对应的第一用户子标签。
例如,从集中化经分系统中确定出A手机号用户为游戏偏好用户,从一级经分系统确定出A手机号用户为高流量用户,将A手机号用户的标签关联和汇总,确定出A手机号用户为游戏偏好的高流量用户
在上述实施例中,通过对第一业务系统中的第一业务参数进行标签化处理和汇总处理,确定出第一用户子标签,如此,利用系统中已经成熟的业务数据经过标签化处理,生成用户标签,从而简化了从源头获取数据的过程,降低了生成用户标签的计算量,提高了用户标签的准确率和生成效率。
在一些实施例中,根据预设的客户画像标签表,提前确定出所需要的业务参数,基于用户号码标识信息从第一业务系统中,采集与所需要的业务参数对应的第一业务参数,如此,可以尽量避免无用业务参数参与客户画像标签的处理,减少了计算量。
在一些实施例中,为保证第一业务参数的可靠性,对第一业务系统中获取到的第一业务参数进行预处理,预处理包括清洗、转换、汇总和关联。
其中,对第一业务参数进行清洗,包括剔除无效脏数据、处理不合法数据和统一数据格式等。
例如,剔除无效脏数据是指剔除比如非32位的MD5身份证件号码与手机号码、缺少核心字段的记录等数据;处理不合法数据是指处理费用类、数量类的字段是负数值等数据。
其中,对第一业务参数进行转换,包括所有二分类的码值型字段转为中文描述、有限少量枚举型字段替换为中文编码格式、有限大量枚举型字段替换为中文编码格式和标签整合。
例如,所有表示二分类的码值型字段(0-1、Y-N等格式)取值统一表达为“是-否”中文描述;有限少量枚举型字段(如归属省份、用户星级、品牌标识、性别等)统一替换为中文编码格式,便于前端调用展示;有限大量枚举型字段(如城市名称)通过关联码表替换为中文编码格式;标签整合包括如2G/4G网络类型向上取值,并对上网流量字段进行加和运算。
其中,对第一业务参数进行汇总,包括:将第一业务系统中用户身份信息对应的全部用户号码标识信息对应的第一业务参数进行汇总。
例如,第一业务参数为上网费用、月租费用等参数,一个用户身份信息对应A手机号和B手机号,将一级经营分析系统中A手机号和B手机号分别对应的上网费用进行汇总。
其中,对第一业务参数进行关联,包括:将多个业务系统中汇总后的第一业务参数通过用户号码标识信息整合在一起。
例如,A业务系统中某手机号对应第一业务参数中归属省份为湖南,B业务系统中同一手机号对应第一业务参数中性别为女,基于该手机号,将A业务系统中第一业务参数和B业务系统中第一业务参数整合在一起,因此,该手机号的第一业务参数为归属省份为湖南和性别为女。
在上述实施例中,通过对第一业务系统中获取到的第一业务参数进行预处理,清除掉不合格数据,确保了第一业务参数的质量可靠,并且将业务参数的格式转换成符合规定的格式,方便了标签化的处理,从而提高了生成用户标签的准确率。
在一些实施例中,步骤101,基于用户身份信息对应的全部用户号码标识信息,确定第一用户标签,包括:
根据第一业务系统中的业务参数,确定与用户号码标识信息对应的第一用户子标签;
从第二业务系统直接获取与用户号码标识信息对应的第二用户子标签;
对第一用户子标签和第二用户子标签进行处理,确定第一用户标签。
这里,客户画像标签确定装置根据第一业务系统中的业务参数,确定出用户号码标识信息对应的第一用户子标签,以及基于用户号码标识信息从第二业务系统直接获取对应的第二用户子标签,再对第一用户子标签的格式和第二用户子标签格式进行处理,将第一用户子标签和第二用户子标签的格式转化成第一用户标签的格式,基于用户号码标识信息关联第一用户子标签和第二用户子标签,得到与用户号码标识信息对应的第一用户标签。
在上述实施例中,通过直接采集第一业务系统中已经统计汇总好的用户数据生成用户标签数据,与第二业务系统中的用户标签数据结合,生成第一用户标签, 从而充分利用已有的数据资源,确保用户标签的准确性和多样性,减少从底层获取数据的过程,降低采集的数据量,减少重复计算和系统重复建设,从而节约计算资源和存储资源。
在一些实施例中,步骤102,基于第一用户标签,获取客户画像标签,包括:
当用户身份信息对应一个用户号码标识信息时,客户画像标签与第一用户标签相同。
这里,客户画像标签确定装置确定出用户身份信息只对应一个用户号码标识信息,客户画像标签与第一用户标签一一对应,即客户画像标签直接取用户身份信息唯一对应的用户号码标识信息的第一用户标签。
在上述实施例中,在当用户身份信息对应一个用户号码标识信息时,客户画像标签与第一用户标签相同,从而简化了客户画像标签的处理过程。
在一些实施例中,步骤102,基于第一用户标签,获取客户画像标签,包括:
当用户身份信息对应至少两个用户号码标识信息时,基于第一用户标签的类别确定客户画像标签。
这里,当用户身份信息对应至少两个用户号码标识信息时,需要根据第一用户标签的类别,客户画像标签确定装置对第一用户标签进行处理,从而将第一用户标签转换成客户画像标签。如此,提高了第一用户标签转换成客户画像标签的准确性。
在一些实施例中,基于第一用户标签的类别确定客户画像标签,包括:
当至少两个用户号码标识信息对应的第一用户标签相同,且第一用户标签的类别为第一类标签时,客户画像标签与第一用户标签相同。
这里,当用户身份信息对应至少两个用户号码标识信息时,且至少两个用户号码标识信息对应的一个属于第一类标签的第一用户标签相同,则该第一类标签为客户画像标签。
例如第一类标签可以为属性类标签。属性类标签为姓名、性别、年龄、居住地、工作地、忠诚度、信用级别等标签,当一个客户的有效身份信息对应A手机号和B手机号时,且A手机号对应的性别标签为女,B手机号对应的性别标签也为女,此时,客户画像标签中性别标签为AB手机号对应的性别标签。也就是说第一用户标签与客户画像标签仍然是一一对应的,不需要再做汇聚计算。
或者,当至少两个用户号码标识信息对应的第一用户标签相同,且第一用户标签的类别为第二类标签时,对获取全部用户号码标识信息对应的第一用户标签的业务参数至少进行加和运算或平均运算,得到客户画像标签。
这里,当用户身份信息对应至少两个用户号码标识信息时,且至少两个用户号码标识信息对应的同一个属于第二类标签的第一用户标签时,对第二类标签的业务参数至少进行加和运算或者平均运算,来调整业务参数,再进行标签化处理,得到第二类标签对应的客户画像标签。
例如,第二类标签为数值类标签,比如费用类、次数类标签,此类标签的业务参数可以进行平均运算和加和运算,业务参数具体的进行何种运算可以根据标签的业务需要进行确定和调整。当一个客户的有效身份信息对应A手机号和B手机号时,且A手机号对应用户的信用卡数量标签,B手机号也对应用户的信用卡数量标签,此时将该客户关联的A和B手机号码所对应的信用卡数量进行加和,再进行标签化处理,从而获得了客户画像标签中信用卡数量标签。再比如,A手机号对应用户的基本月租费标签,B手机号也对应用户的基本月租费标签,将该客户关联的A和B手机号码所对应的基本月租费进行平均运算,再进行标签化处理,从而获得了用户的基本月租费标签对应的客户画像标签,11客户画像标签具体为客户的基本月租费标签。
在上述实施例中,在当用户身份信息对应至少两个用户号码标识信息时,且至少两个用户号码标识信息对应的第一用户标签相同时,根据第一用户标签属于第一类标签,确定第一用户标签与客户画像标签相同,或者根据第一用户标签属于第二类标签,对第一用户标签的业务参数进行至少加和或平均运算,得到客户画像标签,从而根据多个用户号码标识信息对应第一用户标签的类别,对第一用户标签进行处理,从而将第一用户标签转换成客户画像标签。如此,根据第一用户标签的类别执行不同的处理过程,进一步提高了第一用户标签转换成客户画像标签的准确性。
在一些实施例中,基于第一用户标签的类别确定客户画像标签,包括:
当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第一类标签时,若全部用户号码标识信息对应的第一用户标签中包含一个第一标签,确定第一标签为客户画像标签。
这里,当用户身份信息对应至少两个用户号码标识信息时,且至少两个用户号码标识信息对应的属于第一类标签的第一用户标签不同时,对全部用户号码标识信息对应的第一用户标签进行判断,若判断出全部用户号码标识信息对应的第一用户标签中包含一个第一标签,即可确定第一标签为客户画像标签。
例如,第一标签为投诉偏好标签,当一个客户的有效身份信息对应多个手机号码,且多个手机号码对应的属于第一类标签的第一用户标签不同时,若多个第一用户标签中出现至少一次投诉偏好的标签,则将该客户的投诉偏好设置为“是”,即该客户是投诉偏好客户,投诉偏好标签为客户画像标签。
或者,当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第一类标签时,若全部用户号码标识信息对应的第一用户标签都包含第二标签,确定第二标签为客户画像标签。
这里,当用户身份信息对应至少两个用户号码标识信息时,且至少两个用户号码标识信息对应的属于第一类标签的第一用户标签不同时,对全部用户号码标识信息对应的第一用户标签进行判断,若判断出全部用户号码标识信息对应的第一用户标签都包含第二标签,确定第二标签为客户画像标签。
例如,第二标签为咨询偏好标签,当一个客户的有效身份信息对应多个手机号码,且多个手机号码对应的属于第一类标签的第一用户标签不同时,若多个第一用户标签都出现咨询偏好标签,此时将该客户的咨询偏好标签设置为“是”,即该客户是咨询偏好客户,咨询偏好标签为客户画像标签。
或者,当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第一类标签时,确定全部用户号码标识信息对应的第一用户标签中包含个数最多的第三标签,确定第三标签为客户画像标签。
这里,当用户身份信息对应至少两个用户号码标识信息时,且至少两个用户号码标识信息对应的属于第一类标签的第一用户标签不同时,对全部用户号码标识信息对应的第一用户标签进行判断,若判断出全部用户号码标识信息对应的第一用户标签中包含个数最多的第三标签,即可确定第三标签为客户画像标签。
例如,第三标签为性别标签,当一个客户的有效身份信息对应多个手机号码,且多个手机号码对应的属于第一类标签的第一用户标签不同时,若多个手机号码对应的第一用户标签中同时出现了性别男和性别女的性别标签,由于客户的身份证件号码已经是MD5加密值,此时需要对性别标签做进一步的甄别,统计多个第一用户标签中出现的频次最多的性别标签作为客户画像标签。
或者,当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第二类标签时,对获取全部用户号码标识信息对应的第一用户标签的业务参数至少进行取极值运算、或加和运算、或平均运算,得到客户画像标签。
这里,当用户身份信息对应至少两个用户号码标识信息时,且至少两个用户号码标识信息对应的属于第二类标签的第一用户标签不同时,对第二类标签的业务参数至少进行取极值、或加和运算、或平均运算,来进行调整业务参数,再进行标签化处理,得到第二类标签对应的客户画像标签。
例如,第二类标签为数值类标签,比如费用类、次数类标签,此类标签的业务参数可以进行取极值运算、加和运算、平均运算,业务参数具体的进行何种运算可以根据标签的业务需要进行确定和调整。其中,对第一用户标签进行取极大值运算,得到客户画像标签包括:当一个客户的有效身份信息对应多个手机号码,且多个手机号码对应的用户标签中存在多个不同的数值类标签时,取最大的标签值作为该客户画像标签,比如客户的上网时段活跃度标签、客户的在网时长标签等。
取极小运算与取极大运算对应,对第一用户标签进行取极小值运算,得到客户画像标签包括:当一个客户的有效身份信息对应多个手机号码,且多个手机号码对应的第一用户标签中存在多个不同的数值类标签时,取最小的标签值作为客户画像标签,比如为第三方金融机构评估客户的信用风险时,需要取该客户的多个手机号码中信用值最小的标签值作为客户画像标签中的信用标签。
在上述实施例中,在当用户身份信息对应至少两个用户号码标识信息时,且至少两个用户号码标识信息对应的第一用户标签不同时,根据第一用户标签属于第一类标签,或者根据第一用户标签属于第二类标签,对第一用户标签进行不同的处理,得到客户画像标签,从而根据多个用户号码标识信息对应第一用户标签的类别,对第一用户标签进行处理,进而将第一用户标签转换成客户画像标签。如此,根据多个第一用户标签的不同情况,建立客户画像标签与用户标签之间的对应关系,简化客户画像标签的处理过程,同时可以根据实际情况调整客户画像标签与用户标签之间的对应关系,进一步提高了第一用户标签转换成客户画像标签的准确性。
在一些实施例中,在步骤102,基于第一用户标签,获取客户画像标签后,方法还包括:步骤103,当预设的客户画像标签表中存在与客户画像标签不同的标签内容,通过第三方数据获取标签内容。
这里,预设的客户画像标签表是根据用户需求进行设计的,请参见表5,当步骤102中获取到的客户画像标签只是客户画像标签表中的部分标签内容时,可以通过结合第三方数据源,比如通过第三方平台提供客户的银行贷款征信信息、客户的收入水平信息、客户的消费偏好等标签,来进一步确定客户画像标签。如此,进一步完善客户画像标签。
表5 客户画像标签表
在一些实施例中,方法还包括:基于第一用户标签和客户画像标签,形成第一视图,其中,第一视图至少包括用户视图、客户视图和客户群视图之一。
这里,第一视图是指用户所能见到的数据或信息的表现形式。在确定出客户画像标签与第一用户标签后,将第一用户标签整理成用户标签表,以及将客户画像标签整理成客户画像标签表,再将用户标签表和客户画像标签表加载至数据库,从而形成用户视图、客户视图,并且基于组合条件查询可以形成客户群视图,例如,客户群视图为家庭组网群。
在上述实施例中,基于第一用户标签和客户画像标签,形成第一视图,从而支持用户在前端的查询与调用,实现用户视图、客户视图、客户群视图的快速查询和更新同步,并且基于对用户标签的集成转换,实现一个全局的客户画像信息视图。
在一些实施例中,为了保证客户画像标签的准确性和时效性,根据第一视图对客户画像标签确定的处理过程进行检验,逐步优化迭代第一用户标签的处理过程。
这里,根据第一视图确定客户画像标签中是否存在不合理的标签,若存在,优化第一用户标签的处理过程,和/或重新设定客户画像标签确定的处理过程,和/或查询用于确定第一用户标签的数据是否存在异常,若存在异常,清除异常数据。
例如,当在客户视图中查询到A客户对应高价值客户画像标签,然而该客户的月基本费标签的业务参数为30元,确定该客户的客户画像标签不合理,此时,查询用于确定客户画像标签的数据,排查并处理有问题的数据,重新确定该客户的画像标签,从而提高客户画像的数据质量。
为了能够更好的对本申请实施例所提供的客户画像标签确定方法进一步了解,请参阅图2,以采用的第一业务系统为包括集中化经分系统、一级经营分析系统、逍遥位置系统等数据系统,第二业务系统为IOP系统、以及以HIVE数据仓库和PG数据库为例进行说明,客户画像标签确定方法包括:步骤201,采集现有“一证五号”系统中客户的信息,根据“一证五号” 系统中客户的信息确定用户身份信息对应的全部手机号码标识信息。
其中,客户的信息包括:MD5加密的身份证件号码、MD5加密的手机号码、手机号码的归属省份、手机号码的入网时间等信息。用户身份信息可以包括自然人的有效身份信息,包括身份证、军官证、护照、边境通行证、港澳台居民往来内地通行证等真实客户信息。
步骤202,根据预先设计好的客户画像标签表,从第一业务系统中,第一业务系统包括集中化经营分析系统、一级经营分析系统、逍遥位置系统、其它数据源等业务系统,分别采集基于用户号码标识信息为主键的用户信息数据,用户号码标识信息包括MD5加密的手机号码。
步骤203,对采集第一业务系统中的多个第一业务参数进行清洗、转换、汇总和关联,以保证数据质量可靠。
其中,第一业务参数进行清洗包括剔除无效脏数据、处理不合法数据和统一数据格式等。
例如,剔除无效脏数据是指剔除比如非32位的MD5身份证件号码与手机号码、缺少核心字段的记录等数据;处理不合法数据是指处理费用类、数量类的字段是负数值等数据。
其中,第一业务参数进行转换包括所有二分类的码值型字段转为中文描述、有限少量枚举型字段替换为中文编码格式、有限大量枚举型字段替换为中文编码格和标签整合。
例如,所有表示二分类的码值型字段(0-1、Y-N等格式)取值统一表达为“是-否”中文描述;有限少量枚举型字段(如归属省份、用户星级、品牌标识、性别等)统一替换为中文编码格式,便于前端调用展示;有限大量枚举型字段(如城市名称)通过关联码表替换为中文编码格式;标签整合包括如2G/4G网络类型向上取值,并对上网流量字段进行加和。
步骤204,预处理完毕的第一业务系统的第一业务参数均导入HIVE数据仓库,为下一步确定客户画像标签做好准备。
步骤205,在确定客户画像标签之前,获取用户身份信息对应的全部用户号码标识信息的第一用户标签,即客户对应的所有手机号码的用户标签信息,其中,第一用户标签包括第一用户子标签和第二用户子标签,其中,第一用户子标签包括自定义标签,第二用户子标签包括IOP标签。
这里,全网实名制政策的落地实施,保证了“一证五号”系统的数据准确性和完整性,且系统数据实时更新,将全网基于身份证件号码的客户画像标签与基于手机号码的用户标签建立起了天然的联系。
步骤206,确定客户画像标签。
这里,根据“一证五号”系统中客户的有效身份证件号码与其手机号码的对应关联关系,分场景(一证一号与一证多号)、分类别(属性类标签与数值类标签)、分情况(标签一致与标签不一致),客户画像标签确定装置对第一用户标签执行不同的处理过程来确定客户画像标签。
步骤207,在HIVE中完成客户画像标签与第一用户标签的确定过程后,将客户画像标签表和用户标签表加载至PG数据库。
步骤208,在将客户画像标签表和用户标签表加载至PG数据库中,实现多个小文件的合并与空值处理,支撑前端查询与调用,实现用户视图、客户视图、客户群视图的快速查询和更新同步。
步骤209,根据视图结果对标签确定的处理过程的合理性和准确性进行检验,逐步优化迭代标签的处理过程,最终实现全网集中客户中心的持续稳定运行,为企业运营提供全网的数据支撑。
在一些实施例中,将确定第一用户标签数据源拆分为两大部分:一是基于已有的IOP运营系统用户标签数据源,二是基于各业务系统的统计汇总数据源。第一用户标签包括第一用户子标签和第二用户子标签,其中,第一用户子标签包括自定义标签303,第二用户子标签包括IOP用户标签302,请参见图3,可以知道,第一用户标签301包括IOP用户标签302和自定义标签303。
其中,步骤205,第一用户标签301的整合与确定包括:
步骤401a,直接从IOP集中运营管理平台中获取需要的IOP用户标签302;
这里,直接从IOP集中运营管理平台中抽取需要的IOP用户标签302,比如高稳定用户、高价值用户、高忠诚度用户等,这些IOP用户标签是其他业务部门经过复杂的分析建模已经完成开发的现成标签,不需要再次建立复杂的业务模型即可获取,这样大大缩短了用户标签的计算周期,也节约了标签计算所占用的计算资源和存储资源。
步骤401b,计算转换第一业务系统汇总数据,生成自定义标签303;
具体地,根据第一业务系统的业务参数确定标签: 比如按照年龄的区间段将年龄数值进行标签化处理,包括儿童、少年、青年、中年、老年等标签,再比如月租费按照高于100元和低于30元进行切分,将月租费指标制作成高月租费和低月租费等标签,再比如将用户的在网时长按照数值区间标签化,分为在网时长超过10年、在网时长超过5年、在网时长超过1年和在网时长不足1年等标签,诸如此类标签,均可通过业务系统中的运营指标进行简单的业务逻辑组合得到。
步骤402,最后对IOP用户标签302和自定义标签303做格式上的统一化处理,通过手机号码MD5值进行关联,整合为一张用户标签表。
在一些实施例中,基于现有“一证五号”系统中客户的信息,可以确定,客户的有效身份证件号码与其手机号的对应关系,请参见图5,步骤206,确定客户画像标签包括:
步骤51, 当一证一号,即一个客户的身份证件号码对应一个手机号码,客户画像标签与第一用户标签是完全一一对应的,直接读取客户的身份证件号码关联的唯一手机号码所对应的第一用户标签即可,不需要做更多的汇聚计算。
然而,当一证多号时,一个客户的身份证件号码对应多个手机号码时,客户画像标签不能直接从第一用户标签中获取,需要再分一级场景,结合第一用户标签进行画像集成。
步骤52,当一证多号时,一个客户的身份证件号码对应的多个手机号码的第一用户标签相同,若第一用户标签属于第一类标签,第一类标签包括属性类标签,执行步骤521;若第一用户标签属于第二类标签,第二类标签包括数值类标签,执行步骤522。
步骤521,当第一用户标签属于属性类标签,直接取对应的第一用户标签。
例如,客户的属性类标签,比如客户的姓名、性别、年龄、居住地、工作地、忠诚度、信用级别等,此类标签直接取该手机号码对应的用户标签即可,此时的第一用户标签与客户画像标签仍然是一一对应的,不需要再做汇聚计算。
步骤522,当第一用户标签属于数值类标签,对第一用户标签业务参数进行平均运算或加和运算,确定客户画像标签。
例如,客户的数值类标签,比如费用类、次数类标签,此类标签的业务参数可以进行平均运算和加和运算,业务参数具体的进行何种运算可以根据标签的业务需要进行确定和调整。比如确定客户的信用卡数量标签,需将该客户关联的多个手机号码所对应的信用卡数量进行加和,再进行标签化处理。比如确定客户的基本月租费标签,需将该客户关联的多个手机号码所对应的基本月租费进行平均运算,再进行标签化处理。
步骤53,当一证多号时,一个客户的身份证件号码对应的多个手机号码的第一用户标签不相同,若第一用户标签属于数值类标签,执行步骤531;若第一用户标签属于属性类标签,执行步骤532。
步骤531,当第一用户标签属于数值类标签,对第一用户标签至少进行取极值运算、或加和运算、或平均运算,得到客户画像标签。
例如,加和运算和平均运算与步骤522中描述的数值类标签确定客户画像标签的方法一致。对第一用户标签进行取极大值运算,得到客户画像标签包括:当一个客户的有效身份信息对应多个手机号码,且多个手机号码对应的用户标签中存在多个不同的数值类标签时,取最大的标签值作为该客户的标签,比如客户的上网时段活跃度标签、客户的在网时长标签等。
取极小运算与取极大运算对应,对用户标签进行取极小值运算,得到客户画像标签包括:一个客户的有效身份信息对应多个手机号码,且多个手机号码对应的用户标签中存在多个不同的数值类标签时,取最小的标签值作为该客户的标签,比如为第三方金融机构评估客户的信用风险时,需要取该客户的多个手机号码中信用值最小的标签值作为该客户的信用标签。
步骤532,当第一用户标签属于属性类标签,根据多个手机号码的第一用户标签存在一个第一标签,确定第一标签为客户画像标签,或者根据多个手机号码的第一用户标签全部存在第二标签,确定第二标签为客户画像标签,或者根据多个手机号码的第一用户标签存在个数最多的第三标签,确定第三标签为客户画像标签,或者根据多个手机号码的第一用户标签存在个数最少的第四标签,确定第四标签为客户画像标签。
例如,根据多个手机号码的第一用户标签存在一个第一标签,确定11第一标签为客户画像标签:当第一标签为投诉偏好标签,当一个客户的多个手机号码对应的第一用户标签中存在至少一次投诉偏好,则将该客户的投诉偏好设置为“是”,即该客户是投诉偏好客户。
根据多个手机号码的第一用户标签全部存在第二标签,确定第二标签为客户画像标签:当第二标签为咨询偏好标签,当一个客户的多个手机号码对应的第一用户标签中咨询偏好都满足“是”,此时将该客户的咨询偏好标签设置为“是”。
根据多个手机号码的第一用户标签中存在个数最多的第三标签,确定第三标签为客户画像标签:当第一用户标签是性别标签时,若一个客户的多个手机号码对应的第一用户标签中同时存在性别男和性别女,由于客户的身份证件号码已经是MD5加密值,此时需要对性别标签做进一步的甄别,将用户标签中出现的频次最多的性别标签作为该客户的性别标签。
当根据第一用户标签不能获取客户画像标签时,可以结合其他数据源,如电信运营商的合作友商、互联网等其它第三方的业务系统提供的数据源,来进一步确定客户画像标签。比如通过第三方平台提供自客户的银行贷款征信信息、客户的收入水平信息、客户的消费偏好等标签,进一步确定客户画像标签。
步骤54,获取客户画像标签。
本发明实施例另一方面,还提供一种客户画像标签确定装置,请参阅图6,装置包括确定模块601和获取模块602,其中,
确定模块601,用于基于用户身份信息对应的全部用户号码标识信息,确定第一用户标签;第一用户标签为基于用户号码标识信息的标签;
获取模块602,用于基于第一用户标签,获取客户画像标签;客户画像标签为基于用户身份信息的标签。
在一些实施例中,确定模块601包括第一用户子标签确定单元,和/或第二用户子标签获取单元,和第一用户标签确定单元,其中,
第一用户子标签确定单元,用于根据第一业务系统中的业务参数,确定与用户号码标识信息对应的第一用户子标签;
和/或,第二用户子标签获取单元,用于从第二业务系统直接获取与用户号码标识信息对应的第二用户子标签;
第一用户标签确定单元,用于基于用户号码标识信息关联第一用户子标签和第二用户子标签,得到与用户号码标识信息对应的第一用户标签。
在一些实施例中,第一用户子标签确定单元包括第一业务参数获取单元、第一转换单元、第一汇总单元,其中,
第一业务参数获取单元,用于根据第一业务系统中的业务参数,获取与用户号码标识信息对应的第一业务参数;
第一转换单元,用于对第一业务参数进行标签化处理,将第一业务参数转换成第一系统标签;
第一汇总单元,用于对第一系统标签进行汇总处理,确定与用户号码标识信息对应的第一用户子标签。
在一些实施例中,获取模块602具体用于当用户身份信息对应一个用户号码标识信息时,客户画像标签与第一用户标签相同。
在一些实施例中,获取模块602包括第一确定单元,其中,
第一确定单元,用于当用户身份信息对应至少两个用户号码标识信息时,基于第一用户标签的类别确定客户画像标签。
在一些实施例中,第一确定单元具体用于当至少两个用户号码标识信息对应的第一用户标签相同,且第一用户标签的类别为第一类标签时,客户画像标签与第一用户标签相同;
或者,当至少两个用户号码标识信息对应的第一用户标签相同,且第一用户标签的类别为第二类标签时,对获取全部用户号码标识信息对应的第一用户标签的业务参数至少进行加和运算或平均运算,得到客户画像标签。
在一些实施例中,第一确定单元还具体用于当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第一类标签时,若全部用户号码标识信息对应的第一用户标签中包含一个第一标签,确定第一标签为客户画像标签;
或者,当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第一类标签时,若全部用户号码标识信息对应的第一用户标签都包含第二标签,确定第二标签为客户画像标签;
或者,当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第一类标签时,确定全部用户号码标识信息对应的第一用户标签中包含个数最多的第三标签,确定第三标签为客户画像标签;
或者,当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第二类标签时,对获取全部用户号码标识信息对应的第一用户标签的业务参数至少进行取极值运算、或加和运算、或平均运算,得到客户画像标签。
本发明实施例再一方面,还提供一种计算机设备,请参阅图7,计算机设备至少包括至少一个处理器701和至少一个存储器705。其中,存储器705包括用于存储能够在处理器701上运行的计算机程序,其中,处理器701用于运行计算机程序时,执行:一种客户画像标签确定方法,方法包括:基于用户身份信息对应的全部用户号码标识信息,确定第一用户标签;第一用户标签为基于用户号码标识信息的标签;
基于第一用户标签,获取客户画像标签;客户画像标签为基于用户身份信息的标签。
在一些实施例中,处理器701还用于运行计算机程序时,执行:基于用户身份信息对应的全部用户号码标识信息,确定第一用户标签,包括:
根据第一业务系统中的业务参数,确定与用户号码标识信息对应的第一用户子标签;
和/或,从第二业务系统直接获取与用户号码标识信息对应的第二用户子标签;
基于用户号码标识信息关联第一用户子标签和第二用户子标签,得到与用户号码标识信息对应的第一用户标签。
在一些实施例中,处理器701还用于运行计算机程序时,执行:根据第一业务系统中的业务参数,确定与用户号码标识信息对应的第一用户子标签,包括:
根据第一业务系统中的业务参数,获取与用户号码标识信息对应的第一业务参数;
对第一业务参数进行标签化处理,将第一业务参数转换成第一系统标签;
对第一系统标签进行汇总处理,确定与用户号码标识信息对应的第一用户子标签。
在一些实施例中,处理器701还用于运行计算机程序时,执行:基于第一用户标签,获取客户画像标签,包括:
当用户身份信息对应至少两个用户号码标识信息时,基于第一用户标签的类别确定客户画像标签。
在一些实施例中,处理器701还用于运行计算机程序时,执行:基于第一用户标签的类别确定客户画像标签,包括:
当至少两个用户号码标识信息对应的第一用户标签相同,且第一用户标签的类别为第一类标签时,客户画像标签与第一用户标签相同;
或者,当至少两个用户号码标识信息对应的第一用户标签相同,且第一用户标签的类别为第二类标签时,对获取全部用户号码标识信息对应的第一用户标签的业务参数至少进行加和运算或平均运算,得到客户画像标签。
在一些实施例中,处理器701还用于运行计算机程序时,执行:基于第一用户标签的类别确定客户画像标签,包括:
当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第一类标签时,若全部用户号码标识信息对应的第一用户标签中包含一个第一标签,确定第一标签为客户画像标签;
或者,当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第一类标签时,若全部用户号码标识信息对应的第一用户标签都包含第二标签,确定第二标签为客户画像标签;
或者,当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第一类标签时,确定全部用户号码标识信息对应的第一用户标签中包含个数最多的第三标签,确定第三标签为客户画像标签;
或者,当至少两个用户号码标识信息对应的第一用户标签不相同,且第一用户标签的类别为第二类标签时,对获取全部用户号码标识信息对应的第一用户标签的业务参数至少进行取极值运算、或加和运算、或平均运算,得到客户画像标签。
在一些实施例中,设备还包括系统总线702、用户接口703、通信接口704。其中,通信总线702配置为实现这些组件之间的连接通信,用户接口703可以包括显示屏,通信接口704可以包括标准的有线接口和无线接口。
本发明实施例再一方面,还提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器执行时实现本发明任一实施例提供的客户画像标签确定方法的步骤。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应
于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。本申请的保护范围应以所述权利要求的保护范围以准。
Claims (9)
1.一种客户画像标签确定方法,其特征在于,所述方法包括:
基于用户身份信息对应的全部用户号码标识信息,根据第一业务系统中的业务参数,确定与所述用户号码标识信息对应的第一用户子标签;和/或,从第二业务系统直接获取与所述用户号码标识信息对应的第二用户子标签;
基于所述用户号码标识信息关联第一用户子标签和/或第二用户子标签,得到与所述用户号码标识信息对应的第一用户标签;所述第一用户标签为基于所述用户号码标识信息的标签;
基于所述第一用户标签,获取客户画像标签;所述客户画像标签为基于所述用户身份信息的标签。
2.根据权利要求1所述方法,其特征在于,所述根据第一业务系统中的业务参数,确定与所述用户号码标识信息对应的第一用户子标签,包括:
根据第一业务系统中的业务参数,获取与所述用户号码标识信息对应的第一业务参数;
对所述第一业务参数进行标签化处理,将所述第一业务参数转换成第一系统标签;
对所述第一系统标签进行汇总处理,确定与所述用户号码标识信息对应的第一用户子标签。
3.根据权利要求1所述方法,其特征在于,所述基于所述第一用户标签,获取客户画像标签,包括:
当所述用户身份信息对应一个用户号码标识信息时,所述客户画像标签与所述第一用户标签相同。
4.根据权利要求1所述方法,其特征在于,所述基于所述第一用户标签,获取客户画像标签,包括:
当所述用户身份信息对应至少两个用户号码标识信息时,基于所述第一用户标签的类别确定所述客户画像标签。
5.根据权利要求4所述方法,其特征在于,所述基于第一用户标签的类别确定所述客户画像标签,包括:
当所述至少两个用户号码标识信息对应的第一用户标签相同,且所述第一用户标签的类别为第一类标签时,所述客户画像标签与所述第一用户标签相同;
或者,当所述至少两个用户号码标识信息对应的第一用户标签相同,且所述第一用户标签的类别为第二类标签时,对获取全部用户号码标识信息对应的第一用户标签的业务参数至少进行加和运算或平均运算,得到所述客户画像标签。
6.根据权利要求4所述方法,其特征在于,所述基于所述第一用户标签的类别确定所述客户画像标签,包括:
当所述至少两个用户号码标识信息对应的第一用户标签不相同,且所述第一用户标签的类别为第一类标签时,若全部用户号码标识信息对应的第一用户标签中包含一个第一标签,确定所述第一标签为客户画像标签;
或者,当所述至少两个用户号码标识信息对应的第一用户标签不相同,且所述第一用户标签的类别为第一类标签时,若全部用户号码标识信息对应的第一用户标签都包含第二标签,确定所述第二标签为所述客户画像标签;
或者,当所述至少两个用户号码标识信息对应的第一用户标签不相同,且所述第一用户标签的类别为第一类标签时,确定全部用户号码标识信息对应的第一用户标签中包含个数最多的第三标签,确定所述第三标签为所述客户画像标签;
或者,当所述至少两个用户号码标识信息对应的第一用户标签不相同,且所述第一用户标签的类别为第二类标签时,对获取全部用户号码标识信息对应的第一用户标签的业务参数至少进行取极值运算、或加和运算、或平均运算,得到所述客户画像标签;所述取极值运算为取极大值运算或取极小值运算。
7.一种客户画像标签确定装置,其特征在于,所述装置包括:
确定模块,用于基于用户身份信息对应的全部用户号码标识信息,根据第一业务系统中的业务参数,确定与所述用户号码标识信息对应的第一用户子标签;和/或,从第二业务系统直接获取与所述用户号码标识信息对应的第二用户子标签;基于所述用户号码标识信息关联第一用户子标签和/或第二用户子标签,得到与所述用户号码标识信息对应的第一用户标签;所述第一用户标签为基于所述用户号码标识信息的标签;
获取模块,用于基于所述第一用户标签,获取客户画像标签;所述客户画像标签为基于所述用户身份信息的标签。
8.一种电子设备,其特征在于,所述设备包括处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,
所述处理器用于运行所述计算机程序时,执行权利要求1至6中任一项所述客户画像标签确定方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有客户画像标签确定程序,所述客户画像标签确定程序被处理器执行时实现如权利要求1至6中任一所述客户画像标签确定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911052424.1A CN112752256B (zh) | 2019-10-31 | 2019-10-31 | 客户画像标签确定方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911052424.1A CN112752256B (zh) | 2019-10-31 | 2019-10-31 | 客户画像标签确定方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112752256A CN112752256A (zh) | 2021-05-04 |
CN112752256B true CN112752256B (zh) | 2022-06-03 |
Family
ID=75641574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911052424.1A Active CN112752256B (zh) | 2019-10-31 | 2019-10-31 | 客户画像标签确定方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112752256B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114581107A (zh) * | 2022-03-04 | 2022-06-03 | 拉扎斯网络科技(上海)有限公司 | 一种潜在商户证件的检验方法、装置、存储介质及设备 |
CN115022009B (zh) * | 2022-05-30 | 2024-01-30 | 广东太平洋互联网信息服务有限公司 | 一种多网多端多时效融合消费垂直运营方法、装置及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787071A (zh) * | 2016-03-02 | 2016-07-20 | 浪潮通信信息系统有限公司 | 一种基于信息化标签进行手机用户行为画像的方法 |
CN106897402A (zh) * | 2017-02-13 | 2017-06-27 | 山大地纬软件股份有限公司 | 基于社保数据构建用户画像的方法和用户画像生成器 |
WO2017157146A1 (zh) * | 2016-03-15 | 2017-09-21 | 平安科技(深圳)有限公司 | 基于用户画像的个性化推荐方法、装置、服务器及存储介质 |
CN109145197A (zh) * | 2018-06-28 | 2019-01-04 | 深圳市彬讯科技有限公司 | 用户画像标签的生成方法、装置和系统 |
-
2019
- 2019-10-31 CN CN201911052424.1A patent/CN112752256B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787071A (zh) * | 2016-03-02 | 2016-07-20 | 浪潮通信信息系统有限公司 | 一种基于信息化标签进行手机用户行为画像的方法 |
WO2017157146A1 (zh) * | 2016-03-15 | 2017-09-21 | 平安科技(深圳)有限公司 | 基于用户画像的个性化推荐方法、装置、服务器及存储介质 |
CN106897402A (zh) * | 2017-02-13 | 2017-06-27 | 山大地纬软件股份有限公司 | 基于社保数据构建用户画像的方法和用户画像生成器 |
CN109145197A (zh) * | 2018-06-28 | 2019-01-04 | 深圳市彬讯科技有限公司 | 用户画像标签的生成方法、装置和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112752256A (zh) | 2021-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109978608A (zh) | 目标用户画像的营销标签分析提取方法及系统 | |
CN108628866B (zh) | 数据融合的方法和装置 | |
CN107872593A (zh) | 坐席分配的方法及装置 | |
CN102710755A (zh) | 终端用户社交网的数据挖掘方法、相关方法、装置和系统 | |
CN110648195B (zh) | 一种用户识别方法、装置、计算机设备 | |
US20220067000A1 (en) | Constructing a database of verified individuals | |
CN110232104B (zh) | 一种数据显示方法、装置、存储介质及计算机设备 | |
KR20100022871A (ko) | 커뮤니케이션 제공 시스템 및 커뮤니케이션 서비스 제공 방법 | |
CN112752256B (zh) | 客户画像标签确定方法、装置、设备及存储介质 | |
CN109359868A (zh) | 一种电网用户画像的构建方法及系统 | |
CN113064936B (zh) | 一种用户画像方法及其系统、存储介质 | |
CN109670824A (zh) | 电子账本的生成方法、装置、设备及存储介质 | |
CN107451912A (zh) | 信用信息的处理方法及装置 | |
CN105376223A (zh) | 网络身份关系的可靠度计算方法 | |
CN109918678A (zh) | 一种字段含义识别方法和装置 | |
CN112559524A (zh) | 一种指标数据库建立方法、装置及存储介质 | |
CN112307297A (zh) | 一种基于优先级规则的用户标识统一方法及系统 | |
US20090268890A1 (en) | Targeting ads by tracking calls | |
US7987123B1 (en) | Method and system for providing market analysis for wireless data markets | |
CN109711984B (zh) | 一种基于催收的贷前风险监控方法及装置 | |
CN110070392A (zh) | 用户流失预警方法和装置 | |
CN112200605B (zh) | 营销策略配置方法、执行方法、终端设备及存储介质 | |
CN112632381B (zh) | 信息查询方法、装置、计算机设备和存储介质 | |
CN114998039A (zh) | 保险业务协同处理方法、系统、存储介质与电子设备 | |
CN114423009A (zh) | 诈骗用户识别方法、装置、电子设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |