CN109840316A - 一种客户信息制裁名单匹配系统 - Google Patents

一种客户信息制裁名单匹配系统 Download PDF

Info

Publication number
CN109840316A
CN109840316A CN201811568431.2A CN201811568431A CN109840316A CN 109840316 A CN109840316 A CN 109840316A CN 201811568431 A CN201811568431 A CN 201811568431A CN 109840316 A CN109840316 A CN 109840316A
Authority
CN
China
Prior art keywords
matching
list
customer information
degree
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811568431.2A
Other languages
English (en)
Inventor
曹磊
陈龙
严武
王子剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Connaught Intelligent Technology Co Ltd
Original Assignee
Shanghai Connaught Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Connaught Intelligent Technology Co Ltd filed Critical Shanghai Connaught Intelligent Technology Co Ltd
Priority to CN201811568431.2A priority Critical patent/CN109840316A/zh
Publication of CN109840316A publication Critical patent/CN109840316A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)

Abstract

本发明公开一种客户信息制裁名单匹配系统,首先将客户信息接入制裁名单匹配系统,再使用包括字符编码和文本变换的方式实现客户名称及客户属性的模糊匹配,然后通过加权匹配度计算及匹配度缩放处理,获得缩放匹配度大于等于阈值的名单认为是最终的模糊匹配名单并输出。本发明使用字符编码、文本变换等方式实现名称及属性的模糊匹配,后通过加权匹配度计算及匹配度缩放处理将模糊匹配结果进行更为精确的过滤,保证在不存在漏报的情况下极大的减少错报。

Description

一种客户信息制裁名单匹配系统
技术领域
本发明涉及身份认证领域,尤其是一种客户信息制裁名单匹配系统。
背景技术
客户身份匹配识别业务大范围的应用于身份认证及识别过程中,在特殊场景下因客户对于身份的隐藏需求,而导致识别人员需要通过多种身份信息(姓名、国籍、出生日期、公司名、办公地址等)进行综合比对,才能完成实际身份的确认。
目前已有的制裁名单匹配系统或缺少模糊匹配功能,存在大量漏报情况;或模糊匹配能力较弱,存在大量错报情况,使后续的人工审核工作量极大增加。
发明内容
为解决上述问题,本发明提供一种客户信息制裁名单匹配系统。
为实现上述目的,本发明采用下述技术方案:
一种客户信息制裁名单匹配系统,首先将客户信息接入制裁名单匹配系统,再使用包括字符编码和文本变换的方式实现客户名称及客户属性的模糊匹配,然后通过加权匹配度计算及匹配度缩放处理,获得缩放匹配度大于等于阈值的名单认为是最终的模糊匹配名单并输出。
进一步地,客户信息接入包括:
客户发起开户请求,从开户系统中接出单一客户信息进入制裁名单匹配系统;
客户信息扫描,从客户核心系统中接出全体客户信息进入制裁名单匹配系统。
进一步地,客户名称及客户属性的模糊匹配包括:
从客户信息中提取出客户名称,客户信息依次匹配客户名单中的客户名称,并计算客户名称匹配度;
从客户信息中提取出客户的其他属性,客户属性依次匹配客户名单中的客户属性,并计算客户属性匹配度。
进一步地,客户名称匹配度的计算公式如下:
其中,S为客户名称字符串,len(S)为字符串S的长度,Ls为所有制裁名单的编辑距离。
进一步地,客户属性匹配度的计算公式如下:
其中,A为多个客户属性编码,LA为所有制裁名单的编辑距离。
进一步地,加权客户名称匹配度及客户属性匹配度,得到加权匹配度如下:
Score=WS×Scores+WA×ScoreA#
其中,WS与WA分别为权重,7.5≤WS≤1,0≤WA≤2.5。#
进一步地,缩放匹配度的计算公式如下:
其中,Scorei为加权匹配度,每一个加权匹配度对应的制裁名单序号为IDi,Counti为每一个加权匹配度对应制裁名单序号被匹配的次数。
有益效果:
本发明使用字符编码、文本变换等方式实现名称及属性的模糊匹配,后通过加权匹配度计算及匹配度缩放处理将模糊匹配结果进行更为精确的过滤,保证在不存在漏报的情况下极大的减少错报。
附图说明
图1是本发明的客户信息制裁名单匹配流程图;
图2是本发明的客户信息接入架构图;
图3是本发明的客户名称及其他属性模糊匹配架构图;
图4是本发明的匹配度缩放架构图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
本发明提出一种为金融机构开户扫描及全机构客户定时扫描提供更为精确的客户信息制裁名单匹配系统。如图1所示,本发明的具体步骤如下:
1.客户发起开户请求或者客户信息扫描,从开户系统或者客户核心系统中将客户信息提供给制裁名单匹配系统;
2.从客户信息中分别提取出客户名称及客户的其他属性,如性别、出生年龄、国籍等;
3.客户信息依次匹配客户名单中的客户名称,并计算客户名称匹配度;
4.客户属性依次匹配客户名单中的客户属性,并计算客户属性匹配度;
5.加权客户名称匹配度及客户属性匹配度,得到加权匹配度得分;
6.对所匹配到的所有匹配度按公式缩放;
7.获得匹配度大于等于阈值的名单认为是模糊匹配名单,输出提供给人工复查。
本系统主要包括客户信息接入、客户名称及其他属性模糊匹配和匹配度缩放三部分。
1.客户信息接入
本系统可以分别应用于开户及机构客户批量扫描业务的制裁名单匹配。如图2所示,开户业务从开户系统中接出单一客户信息进入制裁名单匹配系统;批量扫描业务从客户核心系统中接出全体客户信息进入制裁名单匹配系统。
2.客户名称及其他属性模糊匹配
如图3所示,首先从客户信息中获取客户姓名字段,计算客户姓名S与所有制裁名单的编辑距离Ls(Levenshtein距离),计算匹配度:
其中,len(S)为字符串S的长度;
然后从客户属性中提取多个客户属性,如国籍、性别、出生日期等,对字段进行拼接编码A,并与制裁名单中属性比对计算字符串编辑距离LA,后计算匹配度,公式如下:
对两个匹配度进行加权,获得加权匹配度:
Score=WS×Scores+WA×ScoreA
其中,WS与WA分别为权重, WS+WA=1,WA≥0,WS≥0,WS>3WA;所以7.5≤WS≤1, 0≤WA≤2.5。
3.匹配度缩放
为了应对制裁名单中部分名字过于普通存在较多的错报情况。本系统使用匹配度缩放的方法在保证不漏报的前提下,大大减少错报。
如图4所示的,前一步获得加权匹配度为Score1..N,每一个匹配度对应的的制裁名单序号为ID1..N,每一个匹配度对应制裁名单序号被匹配的次数为Count1..N,缩放公式如下:
最终得到缩放匹配度ScaleScore1..N,将ScaleScore1≥Threshold 对应的客户姓名、命中制裁名单以及缩放匹配度输出并展示给审核人员,可选的Threshold≥0.7。
对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (7)

1.一种客户信息制裁名单匹配系统,其特征在于:首先将客户信息接入制裁名单匹配系统,再使用包括字符编码和文本变换的方式实现客户名称及客户属性的模糊匹配,然后通过加权匹配度计算及匹配度缩放处理,获得缩放匹配度大于等于阈值的名单认为是最终的模糊匹配名单并输出。
2.根据权利要求1所述的客户信息制裁名单匹配系统,其特征在于,所述客户信息接入包括:
客户发起开户请求,从开户系统中接出单一客户信息进入制裁名单匹配系统;
客户信息扫描,从客户核心系统中接出全体客户信息进入制裁名单匹配系统。
3.根据权利要求1所述的客户信息制裁名单匹配系统,其特征在于,所述客户名称及客户属性的模糊匹配包括:
从客户信息中提取出客户名称,客户信息依次匹配客户名单中的客户名称,并计算客户名称匹配度;
从客户信息中提取出客户的其他属性,客户属性依次匹配客户名单中的客户属性,并计算客户属性匹配度。
4.根据权利要求3所述的客户信息制裁名单匹配系统,其特征在于,所述客户名称匹配度的计算公式如下:
其中,S为客户名称字符串,len(S)为字符串S的长度,Ls为所有制裁名单的编辑距离。
5.根据权利要求3所述的客户信息制裁名单匹配系统,其特征在于:所述客户属性匹配度的计算公式如下:
其中,A为多个客户属性编码,LA为所有制裁名单的编辑距离。
6.根据权利要求3所述的客户信息制裁名单匹配系统,其特征在于:加权所述客户名称匹配度及所述客户属性匹配度,得到加权匹配度如下:
Score=WS×Scores+WA×SCoreA
其中,WS与WA分别为权重,7.5≤WS≤1,0≤WA≤2.5。
7.根据权利要求1所述的客户信息制裁名单匹配系统,其特征在于:所述缩放匹配度的计算公式如下:
其中,Scorei为加权匹配度,每一个加权匹配度对应的制裁名单序号为IDi,Counti为每一个加权匹配度对应制裁名单序号被匹配的次数。
CN201811568431.2A 2018-12-21 2018-12-21 一种客户信息制裁名单匹配系统 Pending CN109840316A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811568431.2A CN109840316A (zh) 2018-12-21 2018-12-21 一种客户信息制裁名单匹配系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811568431.2A CN109840316A (zh) 2018-12-21 2018-12-21 一种客户信息制裁名单匹配系统

Publications (1)

Publication Number Publication Date
CN109840316A true CN109840316A (zh) 2019-06-04

Family

ID=66883293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811568431.2A Pending CN109840316A (zh) 2018-12-21 2018-12-21 一种客户信息制裁名单匹配系统

Country Status (1)

Country Link
CN (1) CN109840316A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115333A (zh) * 2020-09-27 2020-12-22 中国建设银行股份有限公司 一种基于搜索引擎的客户交易回溯筛查方法及装置
CN112215698A (zh) * 2020-10-10 2021-01-12 上海金仕达软件科技有限公司 一种金融信用度的模糊动态加权匹配方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007049282A2 (en) * 2005-10-26 2007-05-03 Cortica Ltd. A computing device, a system and a method for parallel processing of data streams
CN101309280A (zh) * 2008-06-23 2008-11-19 华为技术有限公司 信息过滤服务器、方法、系统及终端
US20140067602A1 (en) * 2012-08-30 2014-03-06 Bank Of America Corporation Sanctions Screening
CN106168954A (zh) * 2016-06-07 2016-11-30 中国人民解放军国防科学技术大学 一种基于编辑距离的负面信息模式模糊匹配方法
CN107562858A (zh) * 2017-08-29 2018-01-09 深圳市分期乐网络科技有限公司 一种名单管理的方法和装置
CN108108373A (zh) * 2016-11-25 2018-06-01 阿里巴巴集团控股有限公司 一种名称匹配方法及装置
CN108416062A (zh) * 2018-03-26 2018-08-17 国家电网公司客户服务中心 一种基于地址匹配技术的电网数据关联方法
CN108694657A (zh) * 2018-07-13 2018-10-23 平安科技(深圳)有限公司 客户识别装置、方法及计算机可读存储介质
CN108734571A (zh) * 2018-05-29 2018-11-02 佛山市金晶微阅信息科技有限公司 一种信贷反欺诈侦测模糊匹配算法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007049282A2 (en) * 2005-10-26 2007-05-03 Cortica Ltd. A computing device, a system and a method for parallel processing of data streams
CN101309280A (zh) * 2008-06-23 2008-11-19 华为技术有限公司 信息过滤服务器、方法、系统及终端
US20140067602A1 (en) * 2012-08-30 2014-03-06 Bank Of America Corporation Sanctions Screening
CN106168954A (zh) * 2016-06-07 2016-11-30 中国人民解放军国防科学技术大学 一种基于编辑距离的负面信息模式模糊匹配方法
CN108108373A (zh) * 2016-11-25 2018-06-01 阿里巴巴集团控股有限公司 一种名称匹配方法及装置
CN107562858A (zh) * 2017-08-29 2018-01-09 深圳市分期乐网络科技有限公司 一种名单管理的方法和装置
CN108416062A (zh) * 2018-03-26 2018-08-17 国家电网公司客户服务中心 一种基于地址匹配技术的电网数据关联方法
CN108734571A (zh) * 2018-05-29 2018-11-02 佛山市金晶微阅信息科技有限公司 一种信贷反欺诈侦测模糊匹配算法
CN108694657A (zh) * 2018-07-13 2018-10-23 平安科技(深圳)有限公司 客户识别装置、方法及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115333A (zh) * 2020-09-27 2020-12-22 中国建设银行股份有限公司 一种基于搜索引擎的客户交易回溯筛查方法及装置
CN112215698A (zh) * 2020-10-10 2021-01-12 上海金仕达软件科技有限公司 一种金融信用度的模糊动态加权匹配方法及系统

Similar Documents

Publication Publication Date Title
CN108777021B (zh) 一种基于扫描仪混扫的票据识别方法及系统
CN116205724A (zh) 大规模异构数据摄取和用户解析
CN110134765B (zh) 一种基于情感分析的餐厅用户评论分析系统及方法
CN103914907A (zh) 纸质票据信息识别与核校系统及应用方法
CN106709804A (zh) 一种交互式财富规划咨询机器人系统
US20070217715A1 (en) Property record document data validation systems and methods
WO2021012904A1 (zh) 一种数据更新方法及相关设备
CN108320374B (zh) 一种基于图像指纹的多国纸币冠字号字符识别方法
CN112967063B (zh) 一种面向以太坊平台的庞氏骗局检测方法
CN109508458A (zh) 法律实体的识别方法及装置
CN109840316A (zh) 一种客户信息制裁名单匹配系统
CN110119980A (zh) 一种用于信贷的反欺诈方法、装置、系统和记录介质
CN110502694A (zh) 基于大数据分析的律师推荐方法及相关设备
CN109815268A (zh) 一种交易制裁名单匹配系统
CN110879985B (zh) 一种抗噪声数据的人脸识别模型训练方法
CN115017272A (zh) 基于登记数据的智能核验方法及装置
US20170075986A1 (en) Document analysis system, document analysis method, and document analysis program
CN109460895A (zh) 构建社会单位画像的方法及系统
CN112633889A (zh) 一种企业基因测序系统及方法
CN117112782A (zh) 一种招标公告信息提取方法
CN114611515B (zh) 一种基于企业舆情信息识别企业实际控制人的方法和系统
CN109636578B (zh) 信贷信息的风险检测方法、装置、设备及可读存储介质
CN207037679U (zh) 一种快捷扫描发票信息的系统
CN109919811B (zh) 基于大数据的保险代理人培养方案生成方法及相关设备
CN112446709A (zh) 一种人脸识别支付认证方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190604