CN103489051A - 基金公司的多个信息系统中客户信息核对归一的一种方法 - Google Patents

基金公司的多个信息系统中客户信息核对归一的一种方法 Download PDF

Info

Publication number
CN103489051A
CN103489051A CN201210190669.2A CN201210190669A CN103489051A CN 103489051 A CN103489051 A CN 103489051A CN 201210190669 A CN201210190669 A CN 201210190669A CN 103489051 A CN103489051 A CN 103489051A
Authority
CN
China
Prior art keywords
normalizing
checking
customer information
information
clearly defined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210190669.2A
Other languages
English (en)
Inventor
刘松
杨雪松
李博海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI JIARUI INFORMATION TECHNOLOGIES Co Ltd
Original Assignee
SHANGHAI JIARUI INFORMATION TECHNOLOGIES Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI JIARUI INFORMATION TECHNOLOGIES Co Ltd filed Critical SHANGHAI JIARUI INFORMATION TECHNOLOGIES Co Ltd
Priority to CN201210190669.2A priority Critical patent/CN103489051A/zh
Publication of CN103489051A publication Critical patent/CN103489051A/zh
Pending legal-status Critical Current

Links

Abstract

本发明的目的是提供一种方法,针对基金公司的多个信息系统(包括:TA、DS、EC、CC等),抽取多个信息系统中的客户基础信息,定义核对的关键字段范围,通过程序严格核对、程序模糊核对、人工核对,最终将不同信息系统中的客户基础信息归纳合并为一份。具有5个创新点:1)明确定义了数据来源,从多个信息系统中抽取客户信息,确保覆盖所有客户,不存在遗、漏、缺现象。2)对相关字段进行有效清洗,避免全半角字符,空格等错误现象。3)明确定义了客户基础信息。4)明确定义了核对归一的规则,使判断客户信息是否一致有了明确的规则。5)明确定义了核对归一的流程,确保核对归一工作有序、有效的进行。

Description

基金公司的多个信息系统中客户信息核对归一的一种方法
技术领域
本发明涉及物理技术,尤其涉及信息系统数据处理技术,特别涉及多个信息系统中数据核准技术,具体的是基金公司的多个信息系统中客户信息核对归一的一种方法,其中,信息系统包括TA(过户登记系统),DS(直接销售系统),CC(呼叫中心系统),EC(电子商务系统)等,客户信息包括8项:姓名、身份证件类型,身份证件号码、性别、出生日期、联系地址、邮编、固定电话。客户的其他信息,例如:工作单位、单位地址、婚姻状态、户籍所在地等信息,是客户扩展信息。
背景技术
基金公司为支持其面对客户的销售和服务业务,同时运营了多类服务性的信息系统,这些信息系统包括TA(过户登记系统),DS(直接销售系统),CC(呼叫中心系统),EC(电子商务系统)。而同一类信息系统,会有多个不同目的的信息系统同时运行,例如TA,可分为专户产品TA、LOF产品TA、公募基金TA等。这些信息系统都有自身的客户信息管理,由于各个信息系统独立建立,并且各个信息系统各自运维,客观上造成客户信息的可能缺失、相互矛盾。
客户信息的有效性、完整性、真实性,关系到营销、运维、客服等多个方面,其中特别重要的是客户信息。客户信息的重要性,举例说明:1)客户可能既通过代销渠道购买了基金产品,也通过直销渠道购买了基金产品,客户在两个地方留下了联系方式,在寄送对账单的时候,基金公司无法确认有效的寄送地址。2)营销活动信息位于CC和EC系统中,如果客户信息不统一,那么CC、EC系统无法和TA系统数据关联,无法有效跟踪被营销客户的行为,进而评估营销活动效果。
为了保证多个信息系统中的客户基本信息的一致性,需要进行数据核对,然后进行数据同步校正。现在基金公司是被动的、人工的进行数据核对。例如:客户投诉账单无法送达时,客服人员手工修改CC中的客户信息,并且通知TA、DS、EC的相关人员进行更新。一般的,基金公司的数量级都在10万以上,被动式、人工式的核准远远不能确保客户基本信息的一致性。
本发明的目的是提供一种方法,针对基金公司的多个信息系统(包括:TA、DS、EC、CC等),抽取多个信息系统中的客户信息,定义核对的关键字段范围,通过程序严格核对、程序模糊核对、人工核对,最终将不同信息系统中的客户信息归纳合并为一份。
后续的,可以将“核对归一”后的客户信息分别更新到多个信息系统。
发明内容
本技术方案具有5个创新点:1)明确定义了数据来源,从多个信息系统中抽取客户信息,确保覆盖所有客户,不存在遗、漏、缺现象。2)对相关字段进行有效清洗,避免全半角字符,空格等错误现象。3)明确定义了客户信息。4)明确定义了核对归一的规则,使判断客户信息是否一致有了明确的规则。5)明确定义了核对归一的流程,确保核对归一工作有序、有效的进行。
本技术方案包括6个实施步骤,具体如下:
步骤1:定义数据来源
系统将从TA、DS、CC、EC系统中抽取客户相关信息。
步骤2:定义字段范围
客户信息包括8项:姓名、身份证件类型,身份证件号码、性别、出生日期、联系地址、邮编、固定电话。
步骤3:确定客户全集的规则
核对来自TA、DS、EC、CC四个信息系统中的所有客户,确定客户全集。确认客户唯一性的关键字段有三个:身份证件类型,身份证件号码,姓名。
在TA、DS、EC、CC四个信息系统中,可能部分客户只在部分系统,这类客户,我们也要作为一条单独的客户信息。举例:在TA、DS、EC系统中都有记录“身份证件类型=身份证,证件号码=123456789012345678,姓名=张三”,在CC中没有记录,我们也要把“张三”作为一个独立的客户。
步骤4:定义核对归一的规则
对于同一个客户的其他5个字段(性别、出生日期、联系地址、邮编、固定电话)将经过计算机程序严格处理、计算机程序模糊处理、人工处理三个环节,具体的核对归一的方法和步骤如下:
计算机程序严格处理的核对规则如下:1)这5个字段完全一致。这种情况下,不用作“归一”处理。2)对于字段不一致的记录,将进入后续的计算机程序模糊处理环节。
计算机程序模糊处理的核对规则如下:1)清洗5个字段:全角字符全部替换为半角字符;删除所有空格;将“出生日期”的多种格式,例如YYYY-MM-DD、YYYYMMDD、YYYY年MM月DD日等,统一为YYYYMMDD;将“固定电话”的多种形式(以上海区号为例),例如021-XXXXXXX、021-XXXXXXXX、21-XXXXXXXX、XXXXXXXX等,统一为:021XXXXXXX。2)对于各个字段,定义模糊的规则。例如,对于“联系地址”(以上海地区为例),定义:上海市=上海,上海市宝山区=上海市。
计算机程序模糊处理的归一规则如下:1)在TA、DS、EC、CC四个信息系统中,如果某个字段只在1个信息系统中被赋值,则以此数值为准。2)如果某个字段在多个系统中被赋值,且数值不一致,以次数多的数值为准。举例:“邮编”在4个系统中分别为:200001,200001、200001、200000,200001出现3次,200000出现1次,则以200001为准。3)如果某个字段在多个系统中被赋值,且数值不一致,且次数相同,则不归一,将进入后续的人工处理环节。举例:“邮编”在4个系统中分别为:200001,200001、200000、200000,200001出现2次,200000也出现2次,则不归一。
人工处理的规则如下:由客服人员通过电话、短信、mail等多种方式联系客户,确认客户信息。
步骤5:获取数据
依据步骤1~2定义的数据源和字段范围,从TA、DS、EC、CC中获取客户信息。
步骤6:数据核对归一
针对步骤5所获取的数据,依据步骤3定义的规则,确定客户全集。依据步骤4定义的核对归一的规则,依次进入3个流程:计算机程序严格处理、计算机程序模糊处理、人工处理,最终获得一份核对归一后的客户信息。
优点和积极效果
采用本方法,可以快速的定义客户数据核对的范围、标准;高效的抽取数据样本;通过计算机程序、人工核对归一,较为快速的产生结果。本方法与现行的被动式、人工式核对的方法比较,具有条理清晰,步骤明确,覆盖100%的客户,结果清晰准确,能够有效提升客户信息的有效性、完整性、真实性。
附图说明
图1是本发明的解决方案步骤图。
图2是本发明中数据核对归一的流程图。
具体实施方式
如图1,根据步骤1~4依次定义数据来源、字段范围、客户全集规则、核对归一规则。根据步骤5抽取样本。根据步骤6,依据图2所示流程,进行数据核对归一,最终形成一份客户信息。

Claims (4)

1.基金管理公司的多个信息系统中客户信息核对归一的一种方法。
方法中所指的信息系统包括TA(过户登记系统),DS(直接销售系统),CC(呼叫中心系统),EC(电子商务系统)等。
方法中客户信息包括8项:姓名、身份证件类型,身份证件号码、性别、出生日期、联系地址、邮编、固定电话。客户的其他信息,例如:工作单位、单位地址、婚姻状态、户籍所在地等信息,是客户扩展信息。
2.根据权利要求1所述的核对归一的方法。其主要步骤包括:
定义数据来源、定义字段范围、确定客户全集的规则、定义核对归一的规则、获取数据、数据核对归一。
3.本方法使用身份证件类型,身份证件号码,姓名三个属性作为确认客户唯一性的关键字段。
4.根据权利要求1所述的核对归一的方法,其主要特点包括:
1)明确定义了数据来源,从多个信息系统中抽取客户信息,确保覆盖所有客户,不存在遗、漏、缺现象。
2)对相关字段进行有效清洗,避免全半角字符,空格等错误现象。
3)明确定义了客户信息。
4)明确定义了核对归一的规则,使判断客户信息是否一致有了明确的规则。
5)明确定义了核对归一的流程,确保核对归一工作有序、有效的进行。
CN201210190669.2A 2012-06-11 2012-06-11 基金公司的多个信息系统中客户信息核对归一的一种方法 Pending CN103489051A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210190669.2A CN103489051A (zh) 2012-06-11 2012-06-11 基金公司的多个信息系统中客户信息核对归一的一种方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210190669.2A CN103489051A (zh) 2012-06-11 2012-06-11 基金公司的多个信息系统中客户信息核对归一的一种方法

Publications (1)

Publication Number Publication Date
CN103489051A true CN103489051A (zh) 2014-01-01

Family

ID=49829256

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210190669.2A Pending CN103489051A (zh) 2012-06-11 2012-06-11 基金公司的多个信息系统中客户信息核对归一的一种方法

Country Status (1)

Country Link
CN (1) CN103489051A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545332A (zh) * 2016-06-23 2018-01-05 平安科技(深圳)有限公司 准客户信息合并分析方法及服务器
CN107784544A (zh) * 2016-08-30 2018-03-09 阿里巴巴集团控股有限公司 一种信息比对的方法和设备
CN109241363A (zh) * 2018-06-04 2019-01-18 平安科技(深圳)有限公司 名单清洗方法、系统、计算机设备和存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545332A (zh) * 2016-06-23 2018-01-05 平安科技(深圳)有限公司 准客户信息合并分析方法及服务器
CN107784544A (zh) * 2016-08-30 2018-03-09 阿里巴巴集团控股有限公司 一种信息比对的方法和设备
CN107784544B (zh) * 2016-08-30 2021-08-17 阿里巴巴集团控股有限公司 一种信息比对的方法和设备
CN109241363A (zh) * 2018-06-04 2019-01-18 平安科技(深圳)有限公司 名单清洗方法、系统、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN110457302B (zh) 一种结构化数据智能清洗方法
CN110083623B (zh) 一种业务规则生成方法及装置
CN109241068B (zh) 前后台数据比对的方法、装置及终端设备
CN101231651A (zh) 计算计算机网络上电子文档的重要性的计算机装置和方法
CN109242460B (zh) 一种基于多个支付渠道的支付系统及其对账方法
CN108009435B (zh) 数据脱敏方法、装置及存储介质
US11886818B2 (en) Method and apparatus for detecting anomalies in mission critical environments
CN105740465A (zh) 一种灵活的自定义比对方法
CN105045847A (zh) 一种从文本信息中提取中文机构单位名称的方法
CN111327514A (zh) 微信图文消息群发方法、系统、服务器及存储介质
CN111666346A (zh) 信息归并方法、交易查询方法、装置、计算机及存储介质
CN106033438A (zh) 舆情数据存储方法和服务器
JP6419667B2 (ja) テストdbデータ生成方法及び装置
CN113420057A (zh) 对账数据处理方法及相关装置
CN102521713B (zh) 数据处理装置和数据处理方法
CN103489051A (zh) 基金公司的多个信息系统中客户信息核对归一的一种方法
CN105930313A (zh) 处理通知信息的方法和装置
CN105808518A (zh) 一种基于浏览器插件的数据填单系统及其集成方法
CN110362607A (zh) 异常号码识别方法、装置、计算机设备及存储介质
CN117313058A (zh) 信息的识别方法、装置、计算机设备和存储介质
CN112950191A (zh) 基于退费业务的业务数据处理方法、装置及计算机设备
CN110502529B (zh) 数据处理方法、装置、服务器及存储介质
CN110334333B (zh) 一种信息修改方法及相关装置
CN112463737A (zh) 针对多格式数据智能匹配模板快速采集数据的系统及方法
CN114840519A (zh) 一种数据打标签的方法、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
DD01 Delivery of document by public notice

Addressee: Shanghai Jiarui Information Technologies Co., Ltd.

Document name: Notification that Application Deemed to be Withdrawn

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140101