CN109064342A - 客户身份识别方法及装置 - Google Patents
客户身份识别方法及装置 Download PDFInfo
- Publication number
- CN109064342A CN109064342A CN201810814991.5A CN201810814991A CN109064342A CN 109064342 A CN109064342 A CN 109064342A CN 201810814991 A CN201810814991 A CN 201810814991A CN 109064342 A CN109064342 A CN 109064342A
- Authority
- CN
- China
- Prior art keywords
- customer
- identification
- client
- data
- informations
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明实施例涉及信息处理技术领域,具体而言,涉及一种客户身份识别方法及装置。该方法应用于服务端,服务端设置有识别记录库,识别记录库中存储有多个既有客户号以及对应的多个识别信息,该方法包括获得客户数据,筛选出符合要求的客户数据,对符合要求的客户数据中的识别信息进行优先级排序,在识别记录库中根据优先级进行识别,进而获得识别结果,根据识别结果判定该客户是既有客户还是新客户,并进行相应处理。采用该方法及装置能够实现对客户的准确识别。
Description
技术领域
本发明实施例涉及信息处理技术领域,具体而言,涉及一种客户身份识别方法及装置。
背景技术
保险是一种用最小的代价获得最大的保障的一种经济模式,能让家人能有个最基本的保障,以避免在自己面对风险的时候不拖累家人,因此,保险行业成熟、稳定的发展对与从业者以及客户来说都非常重要。保险集团需要对不同客户进行准确识别,但是现有的大多技术难以实现对客户的准确识别。
发明内容
有鉴于此,本发明提供了一种客户身份识别方法及装置,能够实现对客户的准确识别。
为实现上述目的,本发明实施例提供了一种客户身份识别方法,应用于服务端,所述服务端设置有识别记录库,所述识别记录库中存储有多个既有客户号以及各个所述既有客户号对应的多个识别信息,所述方法包括:
获得多个客户数据,从所述多个客户数据中筛选出具有识别信息的至少一个客户数据;
获取所述至少一个客户数据中包括的多个识别信息,根据所述识别记录库设置的识别规则对所述至少一个客户数据中包括的多个识别信息进行优先级排序;
在所述识别记录库中按照优先级从高到低的顺序对所述至少一个客户数据中包括的多个识别信息的每个识别信息进行逐一查找,若在所述识别记录库中查找到所述至少一个客户数据中包括的多个识别信息中的其中一个识别信息,在所述识别记录库中查找该识别信息对应的既有客户号,将所述至少一个客户数据中包括的多个识别信息导入所述识别记录库,并建立与该既有客户号的对应关系,若在所述识别记录库中没有查找到所述至少一个客户数据中包括的多个识别信息中的任何一个识别信息,在所述识别记录库中创建新客户号,将所述至少一个客户数据中包括的多个识别信息中优先级最高的识别信息导入所述识别信息库,建立所述优先级最高的识别信息与所述新客户号的对应关系。
可选地,所述方法还包括:
统计所述识别记录库中的每个客户号,其中,各所述客户号对应有多个识别信息;对统计出的每个客户号执行客户归并操作;
从完成了所述客户归并操作的每个客户号中查找出问题客户号和疑似客户号,将所述问题客户号和所述疑似客户号从完成了客户归并操作的每个客户号中剔除;
对剔除了所述问题客户号和所述疑似客户号的每个客户号再次执行所述客户归并操作,将再次完成所述客户归并操作的每个客户号以及每个客户号对应的多个识别信息存储到所述识别记录库中。
可选地,对统计出的每个客户号执行客户归并操作的步骤,包括:
将统计出的每个客户号进行两两匹配,判断两两匹配的客户号对应的多个识别信息是否一一相同,若所述两两匹配的客户号对应的多个识别信息一一相同,将所述两两匹配的客户号中导入所述识别记录库时间较晚的客户号更换为导入所述识别记录库时间较早的客户号。
可选地,从完成了所述客户归并操作的每个客户号中查找出问题客户号和疑似客户号的步骤,包括:
获得客户号相同的任意两个客户号,判断所述客户号相同的任意两个客户号对应的多个识别信息是否一一相同,若所述客户号相同的任意两个客户号对应的多个识别信息不是一一相同,判定所述客户号相同的任意两个客户号为问题客户号;
获得客户号不同的任意两个客户号,判断所述客户号不同的任意两个客户号对应的多个识别信息是否存在冲突,若存在冲突,判定所述客户号不同的任意两个客户号为疑似客户号。
可选地,判断所述客户号不同的任意两个客户号对应的多个识别信息是否存在冲突,若存在冲突,判定所述客户号不同的任意两个客户号为疑似客户号的步骤,包括:
若所述客户号不同的任意两个客户号对应的多个识别信息一一相同,判定所述客户号不同的任意两个客户号为疑似可归并客户;
若所述客户号不同的任意两个客户号对应的多个识别信息存在部分相同,判定所述客户号不同的任意两个客户号为疑似不可归并客户。
可选地,从所述多个客户数据中筛选出具有识别信息的至少一个客户数据的步骤,包括:
针对所述多个客户数据中的每个客户数据,判断该客户数据是否满足清洗要求,若满足所述清洗要求,继续判断该客户数据是否满足拆分要求,若满足所述拆分要求,将该客户数据拆分并标准化为结构化数据;
判断所述结构化数据是否具有识别信息,若具有所述识别信息,筛选出该结构化数据。
可选地,所述方法还包括:
若所述结构化数据不具有所述识别信息,判定所述结构化数据为问题数据,将所述问题数据进行存储;
若满足所述清洗要求的客户数据不满足拆分要求,判定所述满足所述清洗要求的客户数据为问题数据,将所述问题数据进行存储;
若该客户数据不满足所述清洗要求,判定该客户数据为问题数据,将所述问题数据进行存储。
本发明实施例还提供了一种客户身份识别装置,应用于服务端,所述服务端设置有识别记录库,所述识别记录库中存储有多个既有客户号以及各个所述既有客户号对应的多个识别信息,所述装置包括:
获取模块,用于获得多个客户数据,从所述多个客户数据中筛选出具有识别信息的至少一个客户数据;
排序模块,用于获取所述至少一个客户数据中包括的多个识别信息,根据所述识别记录库设置的识别规则对所述至少一个客户数据中包括的多个识别信息进行优先级排序;
识别模块,用于在所述识别记录库中按照优先级从高到低的顺序对所述至少一个客户数据中包括的多个识别信息的每个识别信息进行逐一查找,若在所述识别记录库中查找到所述至少一个客户数据中包括的多个识别信息中的其中一个识别信息,在所述识别记录库中查找该识别信息对应的既有客户号,将所述至少一个客户数据中包括的多个识别信息导入所述识别记录库,并建立与该既有客户号的对应关系,若在所述识别记录库中没有查找到所述至少一个客户数据中包括的多个识别信息中的任何一个识别信息,在所述识别记录库中创建新客户号,将所述至少一个客户数据中包括的多个识别信息中优先级最高的识别信息导入所述识别信息库,建立所述优先级最高的识别信息与所述新客户号的对应关系。
可选地,所述装置还包括:
第一客户归并操作模块,用于统计所述识别记录库中的每个客户号,其中,各所述客户号对应有多个识别信息;对统计出的每个客户号执行客户归并操作;
剔除模块,用于从完成了所述客户归并操作的每个客户号中查找出问题客户号和疑似客户号,将所述问题客户号和所述疑似客户号从完成了客户归并操作的每个客户号中剔除;
第二客户归并操作模块,用于对剔除了所述问题客户号和所述疑似客户号的每个客户号再次执行所述客户归并操作,将再次完成所述客户归并操作的每个客户号以及每个客户号对应的多个识别信息存储到所述识别记录库中。
可选地,所述客户归并操作模块通过以下方式对统计出的每个客户号执行客户归并操作:
将统计出的每个客户号进行两两匹配,判断两两匹配的客户号对应的多个识别信息是否一一相同,若所述两两匹配的客户号对应的多个识别信息一一相同,将所述两两匹配的客户号中导入所述识别记录库时间较晚的客户号更换为导入所述识别记录库时间较早的客户号。
本发明实施例提供的客户身份识别方法及装置,能够根据识别规则对客户数据中的多个识别信息进行多级识别,判断出客户为既有客户号还是新客户号,进而实现对客户的准确识别。
进一步地,对识别信息库中的客户进行多次客户归并操作并剔除问题客户号和疑似客户号,保证了识别信息库中客户号以及识别信息的可靠性,进一步提高了客户识别的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例所提供的一种电子设备10的方框示意图。
图2为本发明实施例所提供的一种客户身份识别方法的流程图。
图3为一实施方式中图2所示的步骤S21包括的子步骤的示意图。
图4为本发明实施例所提供的一种客户身份识别装置20的模块框图。
图标:10-电子设备;11-存储器;12-处理器;13-网络模块;20-客户身份识别装置;21-获取模块;22-排序模块;23-识别模块;24-第一客户归并操作模块;25-剔除模块;26-第二客户归并操作模块。
具体实施方式
发明人经调查发现,在保险行业中,现有的技术大多难以准确识别客户身份,究其原因,主要在于客户身份数据来源数量庞大,且大多为跨集团、产、寿系统,在对某个客户身份进行识别时,存在计算时间长,延时严重的问题,其次,各个系统的客户信息不规范,难以实现准确归并,且线上、线下存在信息分裂的现象,无法全方位分析客户行为,这些问题共同导致了现有技术难以实现对客户的准确识别。
以上现有技术中的方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本发明实施例针对上述问题所提出的解决方案,都应该是发明人在本发明过程中对本发明做出的贡献。
基于上述研究,本发明实施例提供了一种客户身份识别方法及装置,能够对客户身份进行准确识别。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
图1示出了本发明实施例所提供的一种电子设备10的方框示意图。本发明实施例中的电子设备10可以为具有数据存储、传输、处理功能的服务端,如图1所示,电子设备10包括:存储器11、处理器12、网络模块13和客户身份识别装置20。
存储器11、处理器12和网络模块13之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通讯总线或信号线实现电性连接。存储器11中存储有客户身份识别装置20,所述客户身份识别装置20包括至少一个可以软件或固件(firmware)的形式储存于所述存储器11中的软件功能模块,所述处理器12通过运行存储在存储器11内的软件程序以及模块,例如本发明实施例中的客户身份识别装置20,从而执行各种功能应用以及数据处理,即实现本发明实施例中的客户身份识别方法。
其中,所述存储器11可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器11用于存储程序,所述处理器12在接收到执行指令后,执行所述程序。
所述处理器12可能是一种集成电路芯片,具有数据的处理能力。上述的处理器12可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等。可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
网络模块13用于通过网络建立电子设备10与其他通信终端设备之间的通信连接,实现网络信号及数据的收发操作。上述网络信号可包括无线信号或者有线信号。
可以理解,图1所示的结构仅为示意,电子设备10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
本发明实施例还提供一种计算机可读存储介质,所述可读存储介质包括计算机程序。所述计算机程序运行时控制所述可读存储介质所在电子设备10执行下面的客户身份识别方法。
在本实施例中,该客户身份识别方法应用于服务端,具体地,该服务端可以是阳光保险集团的客户信息处理服务器,该客户信息处理服务器设置有识别记录库,识别信息库存储有多个既有客户号以及每个既有客户号对应的多个识别信息,可以理解,识别信息库是实时更新和修复的,如此设置,能够将新进客户的各项信息进行实时归并,提高之后的识别准确率和识别效率。
图2示出了本发明实施例所提供的一种客户身份识别方法的流程图。所述方法有关的流程所定义的方法步骤应用于电子设备10,可以由所述处理器12实现。下面将对图2所示的具体流程进行详细阐述:
步骤S21,获得多个客户数据,从多个客户数据中筛选出具有识别信息的至少一个客户数据。
在本实施例中,客户信息处理服务器通过Kafka(一种开源流处理平台)实时接收多个用户数据,并通过Storm(一种流计算软件)进行实时预处理,以实现对多个客户数据的筛选,进而筛选出具有识别信息的至少一个客户数据。
请结合参阅图3,本实施例中通过步骤S211、步骤S212、步骤S213、步骤S214、步骤S215和步骤S216列举了步骤S21的其中一种实现方式。
步骤S211,针对多个客户数据中的每个客户数据,判断该客户数据是否满足清洗要求,若满足清洗要求,转向步骤S212,若不满足清洗要求,判定该客户数据为问题数据,转向步骤S215。
步骤S212,继续判断该客户数据是否满足拆分要求,若满足拆分要求,转向步骤S213,若不满足拆分要求,判定该客户数据为问题数据,转向步骤S215。
步骤S213,将该客户数据拆分并标准化为结构化数据。
步骤S214,判断该结构化数据是否具有识别信息,若具有识别信息,转向步骤S215,若不具有识别信息,判定该结构化数据为问题数据,转向步骤S216。
步骤S215,筛选出该结构化数据。
步骤S216,将问题数据进行存储。
其中,清洗、拆分和识别信息具有与否的判断均通过Storm实现。
例如,针对多个客户数据,最后筛选出两个符合要求的客户数据:
UID8:A1、A2、A3;
UID24:A8、A19、A20;
其中,UID为客户号,An为识别信息,可以理解,每个客户号对应有多个识别信息。
经过步骤S21的多重判断,能够在识别之前将不符合要求的数据进行排除,提高了识别效率,避免了过多的无用功。
步骤S22,获得至少一个客户数据中包括的多个识别信息,根据识别记录库设置的识别规则对至少一个客户数据中包括的多个识别信息进行优先级排序。
优先级排序靠前的识别信息被识别成功的可能性大,优先级排序的设置是为了提高识别效率。其中,可以通过Kafka和Storm的集合实现对优先级的排序,可以理解,可以对每个识别规则设置优先级,进而实现之后的逐级识别。
以UID8和UID24为例,UID8中的三个识别信息的优先级依次为:A1>A2>A3,UID24中的三个识别信息的优先级依次为A8>A19>A20。
设置了优先级之后,在后续识别过程中,优先级靠前的识别信息先被识别,如此设置,能够充分利用客户的识别信息,不断扩大客户的识别范围,提高识别准确率。
步骤S23,对至少一个客户数据中包括的多个识别信息进行识别,根据识别结果执行相应操作。
具体地,在识别记录库中按照优先级从高到低的顺序对至少一个客户数据中包括的多个识别信息中的每个识别信息进行逐一查找。
进一步地,识别结果有两种:
(1)在识别记录库中查找到至少一个客户数据中包括的多个识别信息中的其中一个识别信息。
例如,识别记录库中存在:
UID1:A1、A2;
UID2:B1、B2、B3、B4;
UID3:C1。
对UID8的识别信息进行逐一查找,查找到UID1的A1与UID8的A1对应,说明UID8是已识别过的客户UID1,因此将UID8的A1、A2、A3导入识别记录库并指向UID1,可以理解,A3是识别记录库中UID1未曾有的,因此需要对A3进行扩充,如此设置,能够增加跨渠道客户识别为同一客户的几率。
将UID8的所有识别信息导入识别信息库可以理解为扩充,若UID8的所有识别信息与UID1的所有识别信息均相同,可以视为0扩充。
(2)在识别记录库中没有查找到至少一个客户数据中包括的多个识别信息中的任何一个识别信息。
对UID24的识别信息进行查找,发现没有查找到任何一个UID24的识别信息,因此可以判定UID24为新客户,在识别记录库中生成一个新客户号(可以为UID24),将优先级最高的识别信息A8导入识别记录库并指向UID24,进而完成新客户号的补充。
通过以上识别过程,能够准确识别出实时获得的客户的身份信息,进一步地,为了保证整个识别数据库的可靠性和准确性,该方法对识别记录库中的客户号还进行了优化操作,具体请参阅步骤S24、步骤S25和步骤S26。
步骤S24,统计识别记录库中的每个客户号以及其对应的识别信息,对统计出的每个客户号执行客户归并操作。
其中,客户号对应的多个识别信息可以视为识别要素,可以通过这些识别要素判断新客户号是否与既有客户号进行归并,可以理解,归并后的客户识别要素可追溯可回退。
具体地,每日对识别记录库中的所有识别信息进行跑批,进行客户归并操作。进一步地,对识别记录库中的所有客户号进行两两匹配,判断两两匹配的客户号对应的识别信息是否一一相同,根据判定结果执行对应操作。
例如,针对UID7和UID9,UID7的识别信息为F1、F2,UID9的识别信息为F1、F2,可以理解,UID7的识别信息和UID9的识别信息一一对应,此时判断UID7和UID9导入识别记录库的时间,例如,UID7导入识别记录库的时间较早,此时将UID9更新为UID7,进而实现客户归并操作。
步骤S25,从完成了客户归并操作的每个客户号中查找出问题客户号和疑似客户号,将问题客户号和疑似客户号剔除。
可以理解,完成了客户归并操作后,还需要对识别记录库中的信息进行修正,每日在识别记录库的基础上查找出问题客户号和疑似客户号,并将问题客户号和疑似客户号从识别记录库中剔除。
进一步地,对问题客户号的定义为:如果相同的客户号之间的识别信息没有一一对应(可以理解为存在冲突),那么这部分客户号就是问题客户号。
例如,查找出问题客户号的步骤可以为:获得客户号相同的任意两个客户号,判断客户号相同的任意两个客户号对应的多个识别信息是否一一相同,若客户号相同的任意两个客户号对应的多个识别信息不是一一相同,判定客户号相同的任意两个客户号为问题客户号。应当理解,问题客户号不一定只有两个,还可能存在多个。
进一步地,疑似客户号可以分为疑似可归并客户号和疑似不可归并客户号。疑似可归并客户号:客户号不同的客户之间的识别信息全部相同(可以理解为不存在冲突);疑似不可归并客户号:客户号不同的客户之间的识别信息部分相同(可以理解为存在部分冲突)。
例如,查找出疑似可归并客户号的步骤可以为:获得客户号不同的任意两个客户号,若客户号不同的任意两个客户号对应的多个识别信息一一相同,判定客户号不同的任意两个客户号为疑似可归并客户,查找出疑似不可归并客户号的步骤可以为:若客户号不同的任意两个客户号对应的多个识别信息存在部分相同,判定客户号不同的任意两个客户号为疑似不可归并客户号。
可选地,将问题客户号和疑似客户号从识别记录库剔除之后,可以将问题客户号和疑似客户号存储到另一存储空间,可以用于业务层面的客户信息治理工作。
步骤S26,对剔除了问题客户号和疑似客户号的每个客户号再次执行客户归并操作,将再次完成客户归并操作的每个客户号以及每个客户号对应的多个识别信息存储到识别记录库中。
可以理解,在剔除了问题客户号和疑似客户号之后,再次进行客户归并操作,并将完成客户归并操作的每个客户号以及每个客户号对应的多个识别信息存储到识别记录库中,进而实现对识别记录库的更新。例如,将每天重新计算的客户号以及识别信息同步到Storm,用于第二天的实时客户归并。
其中,Kafka+Storm能够提高计算效率,目前在3亿客户计算的基础上每条客户识别归并可在0.1秒以内,业务管理、服务人员无需等待可在客户接触公司的第一时间了解客户的行为状态。
其次,整个方案打通了线上线下客户信息,促进线上线下一体化,完成了寿险客户网上行为业务员互动、全能保展示客户互动轨迹。精确归并客户,统一客户身份。程序设计实现识别规则分级配置,规则变更可回退。由于分级识别规则覆盖面广,可提高客户识别的精确性。
此外,由于客户号和识别信息是一个整体的概念,所以当其中一个环节识别规则发生变化,通常是要全部客户都重新计算一遍,在数据量很大的时候,耗时会很长。但是该方法每次规则变更不需要重新计算所有客户历史,可以精确定位规则变更的客户,重新构建所有客户信息,使整个识别过程变得更加灵活。
在上述基础上,如图4所示,本发明实施例提供了一种客户身份识别装置20,所述客户身份识别装置20包括:获取模块21、排序模块22、识别模块23、第一客户归并操作模块24、剔除模块25和第二客户归并操作模块26。
获取模块21,用于获得多个客户数据,从所述多个客户数据中筛选出具有识别信息的至少一个客户数据。
由于获取模块21和图2中步骤S21的实现原理类似,因此在此不作更多说明。
排序模块22,用于获取所述至少一个客户数据中包括的多个识别信息,根据所述识别记录库设置的识别规则对所述至少一个客户数据中包括的多个识别信息进行优先级排序。
由于排序模块22和图2中步骤S22的实现原理类似,因此在此不作更多说明。
识别模块23,用于在所述识别记录库中按照优先级从高到低的顺序对所述至少一个客户数据中包括的多个识别信息的每个识别信息进行逐一查找,若在所述识别记录库中查找到所述至少一个客户数据中包括的多个识别信息中的其中一个识别信息,在所述识别记录库中查找该识别信息对应的既有客户号,将所述至少一个客户数据中包括的多个识别信息导入所述识别记录库,并建立与该既有客户号的对应关系,若在所述识别记录库中没有查找到所述至少一个客户数据中包括的多个识别信息中的任何一个识别信息,在所述识别记录库中创建新客户号,将所述至少一个客户数据中包括的多个识别信息中优先级最高的识别信息导入所述识别信息库,建立所述优先级最高的识别信息与所述新客户号的对应关系。
由于识别模块23和图2中步骤S23的实现原理类似,因此在此不作更多说明。
第一客户归并操作模块24,用于统计所述识别记录库中的每个客户号,其中,各所述客户号对应有多个识别信息;对统计出的每个客户号执行客户归并操作。
由于第一客户归并操作模块24和图2中步骤S24的实现原理类似,因此在此不作更多说明。
剔除模块25,用于从完成了所述客户归并操作的每个客户号中查找出问题客户号和疑似客户号,将所述问题客户号和所述疑似客户号从完成了客户归并操作的每个客户号中剔除。
由于剔除模块25和图2中步骤S25的实现原理类似,因此在此不作更多说明。
第二客户归并操作模块26,用于对剔除了所述问题客户号和所述疑似客户号的每个客户号再次执行所述客户归并操作,将再次完成所述客户归并操作的每个客户号以及每个客户号对应的多个识别信息存储到所述识别记录库中。
由于第二客户归并操作模块26和图2中步骤S26的实现原理类似,因此在此不作更多说明。
综上,本发明实施例所提供的客户身份识别方法及装置,通过Kafka+Storm技术能够实现对客户的高效、准确和灵活的识别。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备10,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种客户身份识别方法,其特征在于,应用于服务端,所述服务端设置有识别记录库,所述识别记录库中存储有多个既有客户号以及各个所述既有客户号对应的多个识别信息,所述方法包括:
获得多个客户数据,从所述多个客户数据中筛选出具有识别信息的至少一个客户数据;
获取所述至少一个客户数据中包括的多个识别信息,根据所述识别记录库设置的识别规则对所述至少一个客户数据中包括的多个识别信息进行优先级排序;
在所述识别记录库中按照优先级从高到低的顺序对所述至少一个客户数据中包括的多个识别信息的每个识别信息进行逐一查找,若在所述识别记录库中查找到所述至少一个客户数据中包括的多个识别信息中的其中一个识别信息,在所述识别记录库中查找该识别信息对应的既有客户号,将所述至少一个客户数据中包括的多个识别信息导入所述识别记录库,并建立与该既有客户号的对应关系,若在所述识别记录库中没有查找到所述至少一个客户数据中包括的多个识别信息中的任何一个识别信息,在所述识别记录库中创建新客户号,将所述至少一个客户数据中包括的多个识别信息中优先级最高的识别信息导入所述识别信息库,建立所述优先级最高的识别信息与所述新客户号的对应关系。
2.根据权利要求1所述的客户身份识别方法,其特征在于,所述方法还包括:
统计所述识别记录库中的每个客户号,其中,各所述客户号对应有多个识别信息;对统计出的每个客户号执行客户归并操作;
从完成了所述客户归并操作的每个客户号中查找出问题客户号和疑似客户号,将所述问题客户号和所述疑似客户号从完成了客户归并操作的每个客户号中剔除;
对剔除了所述问题客户号和所述疑似客户号的每个客户号再次执行所述客户归并操作,将再次完成所述客户归并操作的每个客户号以及每个客户号对应的多个识别信息存储到所述识别记录库中。
3.根据权利要求1所述的客户身份识别方法,其特征在于,对统计出的每个客户号执行客户归并操作的步骤,包括:
将统计出的每个客户号进行两两匹配,判断两两匹配的客户号对应的多个识别信息是否一一相同,若所述两两匹配的客户号对应的多个识别信息一一相同,将所述两两匹配的客户号中导入所述识别记录库时间较晚的客户号更换为导入所述识别记录库时间较早的客户号。
4.根据权利要求2所述的客户身份识别方法,其特征在于,从完成了所述客户归并操作的每个客户号中查找出问题客户号和疑似客户号的步骤,包括:
获得客户号相同的任意两个客户号,判断所述客户号相同的任意两个客户号对应的多个识别信息是否一一相同,若所述客户号相同的任意两个客户号对应的多个识别信息不是一一相同,判定所述客户号相同的任意两个客户号为问题客户号;
获得客户号不同的任意两个客户号,判断所述客户号不同的任意两个客户号对应的多个识别信息是否存在冲突,若存在冲突,判定所述客户号不同的任意两个客户号为疑似客户号。
5.根据权利要求4所述的客户身份识别方法,其特征在于,判断所述客户号不同的任意两个客户号对应的多个识别信息是否存在冲突,若存在冲突,判定所述客户号不同的任意两个客户号为疑似客户号的步骤,包括:
若所述客户号不同的任意两个客户号对应的多个识别信息一一相同,判定所述客户号不同的任意两个客户号为疑似可归并客户号;
若所述客户号不同的任意两个客户号对应的多个识别信息存在部分相同,判定所述客户号不同的任意两个客户号为疑似不可归并客户号。
6.根据权利要求1所述的客户身份识别方法,其特征在于,从所述多个客户数据中筛选出具有识别信息的至少一个客户数据的步骤,包括:
针对所述多个客户数据中的每个客户数据,判断该客户数据是否满足清洗要求,若满足所述清洗要求,继续判断该客户数据是否满足拆分要求,若满足所述拆分要求,将该客户数据拆分并标准化为结构化数据;
判断所述结构化数据是否具有识别信息,若具有所述识别信息,筛选出该结构化数据。
7.根据权利要求6所述的客户身份识别方法,其特征在于,所述方法还包括:
若所述结构化数据不具有所述识别信息,判定所述结构化数据为问题数据,将所述问题数据进行存储;
若满足所述清洗要求的客户数据不满足拆分要求,判定所述满足所述清洗要求的客户数据为问题数据,将所述问题数据进行存储;
若该客户数据不满足所述清洗要求,判定该客户数据为问题数据,将所述问题数据进行存储。
8.一种客户身份识别装置,其特征在于,应用于服务端,所述服务端设置有识别记录库,所述识别记录库中存储有多个既有客户号以及各个所述既有客户号对应的多个识别信息,所述装置包括:
获取模块,用于获得多个客户数据,从所述多个客户数据中筛选出具有识别信息的至少一个客户数据;
排序模块,用于获取所述至少一个客户数据中包括的多个识别信息,根据所述识别记录库设置的识别规则对所述至少一个客户数据中包括的多个识别信息进行优先级排序;
识别模块,用于在所述识别记录库中按照优先级从高到低的顺序对所述至少一个客户数据中包括的多个识别信息的每个识别信息进行逐一查找,若在所述识别记录库中查找到所述至少一个客户数据中包括的多个识别信息中的其中一个识别信息,在所述识别记录库中查找该识别信息对应的既有客户号,将所述至少一个客户数据中包括的多个识别信息导入所述识别记录库,并建立与该既有客户号的对应关系,若在所述识别记录库中没有查找到所述至少一个客户数据中包括的多个识别信息中的任何一个识别信息,在所述识别记录库中创建新客户号,将所述至少一个客户数据中包括的多个识别信息中优先级最高的识别信息导入所述识别信息库,建立所述优先级最高的识别信息与所述新客户号的对应关系。
9.根据权利要求8所述的客户身份识别装置,其特征在于,所述装置还包括:
第一客户归并操作模块,用于统计所述识别记录库中的每个客户号,其中,各所述客户号对应有多个识别信息;对统计出的每个客户号执行客户归并操作;
剔除模块,用于从完成了所述客户归并操作的每个客户号中查找出问题客户号和疑似客户号,将所述问题客户号和所述疑似客户号从完成了客户归并操作的每个客户号中剔除;
第二客户归并操作模块,用于对剔除了所述问题客户号和所述疑似客户号的每个客户号再次执行所述客户归并操作,将再次完成所述客户归并操作的每个客户号以及每个客户号对应的多个识别信息存储到所述识别记录库中。
10.根据权利要求8所述的客户身份识别装置,其特征在于,所述客户归并操作模块通过以下方式对统计出的每个客户号执行客户归并操作:
将统计出的每个客户号进行两两匹配,判断两两匹配的客户号对应的多个识别信息是否一一相同,若所述两两匹配的客户号对应的多个识别信息一一相同,将所述两两匹配的客户号中导入所述识别记录库时间较晚的客户号更换为导入所述识别记录库时间较早的客户号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810814991.5A CN109064342A (zh) | 2018-07-20 | 2018-07-20 | 客户身份识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810814991.5A CN109064342A (zh) | 2018-07-20 | 2018-07-20 | 客户身份识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109064342A true CN109064342A (zh) | 2018-12-21 |
Family
ID=64836201
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810814991.5A Pending CN109064342A (zh) | 2018-07-20 | 2018-07-20 | 客户身份识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109064342A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110427739A (zh) * | 2019-08-09 | 2019-11-08 | 泰康保险集团股份有限公司 | 信息验证方法及装置、电子设备和计算机可读存储介质 |
CN110766474A (zh) * | 2019-10-30 | 2020-02-07 | 浙江易时科技股份有限公司 | 基于人脸识别技术的销售展厅客流批次统计 |
CN112486964A (zh) * | 2020-11-26 | 2021-03-12 | 中国人寿保险股份有限公司 | 一种目标识别方法及设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106407245A (zh) * | 2016-06-23 | 2017-02-15 | 平安科技(深圳)有限公司 | 信息的处理方法及装置 |
CN106934509A (zh) * | 2015-12-30 | 2017-07-07 | 平安科技(深圳)有限公司 | 客户信息合并方法和系统 |
CN107301578A (zh) * | 2016-04-15 | 2017-10-27 | 上海新飞凡电子商务有限公司 | 获取以及识别客户信息的方法及其装置 |
CN107704529A (zh) * | 2017-09-20 | 2018-02-16 | 平安科技(深圳)有限公司 | 信息唯一性识别方法、应用服务器、系统及存储介质 |
CN107784517A (zh) * | 2017-08-28 | 2018-03-09 | 平安科技(深圳)有限公司 | 一种客户信息筛选方法及终端设备 |
CN107798065A (zh) * | 2017-09-21 | 2018-03-13 | 平安科技(深圳)有限公司 | 一种客户号编码方法、应用服务器、系统及存储介质 |
CN107798046A (zh) * | 2017-07-25 | 2018-03-13 | 平安科技(深圳)有限公司 | 客户身份信息处理方法、装置、存储介质和计算机设备 |
-
2018
- 2018-07-20 CN CN201810814991.5A patent/CN109064342A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934509A (zh) * | 2015-12-30 | 2017-07-07 | 平安科技(深圳)有限公司 | 客户信息合并方法和系统 |
CN107301578A (zh) * | 2016-04-15 | 2017-10-27 | 上海新飞凡电子商务有限公司 | 获取以及识别客户信息的方法及其装置 |
CN106407245A (zh) * | 2016-06-23 | 2017-02-15 | 平安科技(深圳)有限公司 | 信息的处理方法及装置 |
CN107798046A (zh) * | 2017-07-25 | 2018-03-13 | 平安科技(深圳)有限公司 | 客户身份信息处理方法、装置、存储介质和计算机设备 |
CN107784517A (zh) * | 2017-08-28 | 2018-03-09 | 平安科技(深圳)有限公司 | 一种客户信息筛选方法及终端设备 |
CN107704529A (zh) * | 2017-09-20 | 2018-02-16 | 平安科技(深圳)有限公司 | 信息唯一性识别方法、应用服务器、系统及存储介质 |
CN107798065A (zh) * | 2017-09-21 | 2018-03-13 | 平安科技(深圳)有限公司 | 一种客户号编码方法、应用服务器、系统及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110427739A (zh) * | 2019-08-09 | 2019-11-08 | 泰康保险集团股份有限公司 | 信息验证方法及装置、电子设备和计算机可读存储介质 |
CN110766474A (zh) * | 2019-10-30 | 2020-02-07 | 浙江易时科技股份有限公司 | 基于人脸识别技术的销售展厅客流批次统计 |
CN112486964A (zh) * | 2020-11-26 | 2021-03-12 | 中国人寿保险股份有限公司 | 一种目标识别方法及设备 |
CN112486964B (zh) * | 2020-11-26 | 2024-04-26 | 中国人寿保险股份有限公司 | 一种目标识别方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021135105A1 (zh) | 基于大数据的对象识别方法、装置、设备及存储介质 | |
CN106777331A (zh) | 知识图谱生成方法及装置 | |
CN109064342A (zh) | 客户身份识别方法及装置 | |
CN108182215A (zh) | 一种结构化查询语言sql性能统计的方法及装置 | |
US20150188879A1 (en) | Apparatus for grouping servers, a method for grouping servers and a recording medium | |
CN110263022B (zh) | 酒店数据匹配方法及装置 | |
CN109213773A (zh) | 一种在线故障的诊断方法、装置及电子设备 | |
JP2017126282A (ja) | 検知プログラム、検知方法および検知装置 | |
CN110134759A (zh) | 一种获取企业的行业信息的方法 | |
CN112817814A (zh) | 异常监控方法、系统、存储介质及电子装置 | |
CN114091610A (zh) | 智能决策方法及装置 | |
CN114265927A (zh) | 数据查询方法及装置、存储介质及电子装置 | |
CN112765150A (zh) | 大数据异构融合提取方法及装置 | |
CN110111796B (zh) | 识别身份的方法及装置 | |
CN110909129A (zh) | 异常投诉事件的识别方法及装置 | |
CN112784025A (zh) | 一种目标事件的确定方法和装置 | |
CN106779245B (zh) | 基于事件的民航需求预测方法和装置 | |
CN109067744A (zh) | Acl规则处理方法、装置及通信设备 | |
CN104809253B (zh) | 互联网数据分析系统 | |
CN107025293A (zh) | 一种电力二次设备缺陷数据挖掘方法及系统 | |
EP3828712A1 (en) | Data parsing method and device | |
CN108062395A (zh) | 一种轨道交通大数据分析方法及系统 | |
CN115098362A (zh) | 页面测试方法、装置、电子设备以及存储介质 | |
US11704315B1 (en) | Trimming blackhole clusters | |
CN114968933A (zh) | 数据中心的日志的分类方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181221 |
|
RJ01 | Rejection of invention patent application after publication |