CN112732754A - 一种信息匹配方法及装置 - Google Patents

一种信息匹配方法及装置 Download PDF

Info

Publication number
CN112732754A
CN112732754A CN202011569170.3A CN202011569170A CN112732754A CN 112732754 A CN112732754 A CN 112732754A CN 202011569170 A CN202011569170 A CN 202011569170A CN 112732754 A CN112732754 A CN 112732754A
Authority
CN
China
Prior art keywords
matching
rule
target
name
rules
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011569170.3A
Other languages
English (en)
Inventor
刘春波
孙琳
李锟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank of China
Original Assignee
Agricultural Bank of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank of China filed Critical Agricultural Bank of China
Priority to CN202011569170.3A priority Critical patent/CN112732754A/zh
Publication of CN112732754A publication Critical patent/CN112732754A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种信息匹配方法和装置,该方法包括:获取目标名单数据;目标名单数据至少包括一个目标人员数据。之后,获取目标客户信息。获取从匹配规则库中选择的匹配规则,匹配规则库中的匹配规则包括证件号码组合匹配规则、中文姓名组合匹配规则和英文姓名组合匹配规则。按照选择的匹配规则对目标名单数据和目标客户信息进行匹配,生成预处理匹配结果。对预处理匹配结果进行合并处理,生成匹配结果。其中,匹配结果包括目标客户信息命中目标名单数据中的目标人员数据的结果。通过本申请提供的方案,可以对匹配规则库中匹配规则进行灵活选择,生成匹配规则,提高匹配规则的灵活性和匹配结果的准确度。

Description

一种信息匹配方法及装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种信息匹配方法及装置。
背景技术
当金融机构中的黑名单调整时,根据监管要求,金融机构要重新依据黑名 单对拥有的客户信息进行匹配筛查,确认客户的可疑程度。
目前,传统的匹配方式不能够灵活对匹配规则进行组合设定,缺乏灵活性, 导致最后的匹配结果准确度不高。
发明内容
为了解决上述技术问题,本申请提供了一种信息匹配方法及装置,用于设 置灵活可调整的匹配规则,提高匹配规则的灵活性和匹配结果的准确度。
为了实现上述目的,本申请实施例提供的技术方案如下:
本申请实施例提供了一种信息匹配方法,该方法包括:
获取目标名单数据;所述目标名单数据至少包括一个目标人员数据;
获取目标客户信息;
获取从匹配规则库中选择的匹配规则;所述匹配规则库中的匹配规则包括 证件号码组合匹配规则、中文姓名组合匹配规则和英文姓名组合匹配规则;
按照所述选择的匹配规则对所述目标名单数据和所述目标客户信息进行 匹配,生成预处理匹配结果;
对所述预处理匹配结果进行合并处理,生成匹配结果;所述匹配结果包括 所述目标客户信息命中所述目标名单数据中的所述目标人员数据的结果。
可选的,所述证件号码组合匹配规则至少包括证件号码英文转大小写规则、 证件号码去除干扰信息规则、证件号码精确度匹配规则和证件号码位规则中的 一种或多种;
所述中文姓名组合匹配规则至少包括大小写规则、全半角规则、简繁体规 则、中文排除干扰信息规则、姓和名颠倒匹配规则和姓名精准度匹配规则的组 合中的一种或多种;
所述英文姓名组合匹配规则至少包括大小写转换规则、英文排除干扰信息 规则、特殊符号分割颠倒规则、姓和名颠倒匹配规则和英文字母排列配规则的 组合中的一种或多种。
可选的,所述方法还包括:
根据所述匹配结果获取目标交易信息;所述匹配结果和所述目标交易信息 组成目标行为;
将所述目标行为发送给目标机构,以使所述目标机构对所述目标行为是否 存在进行确认;
接收目标报告;所述目标报告为所述机构确认所目标行为存在后生成的。
可选的,在所述获取从匹配规则库中选择的匹配规则之后,所述按照所述 选择的匹配规则对所述目标名单数据和所述目标客户信息进行匹配,生成预处 理匹配结果之前,所述方法还包括:
对所述选择的匹配规则赋予权重,生成包含权重信息的匹配规则;
可选的,所述按照所述选择的匹配规则对所述目标名单数据和所述目标客 户信息进行匹配,生成预处理匹配结果,包括:
按照所述包含权重信息的匹配规则对所述目标名单数据和所述目标客户 信息进行匹配,生成预处理匹配结果。
本申请实施例还提供了一种信息匹配装置,该装置包括:
第一获取单元,用于获取目标名单数据;所述目标名单数据至少包括一个 目标人员数据;
第二获取单元,用于获取目标客户信息;
第三获取单元,用于获取从匹配规则库中选择的匹配规则;所述匹配规则 库中的匹配规则包括证件号码组合匹配规则、中文姓名组合匹配规则和英文姓 名组合匹配规则;
匹配单元,用于按照所述选择的匹配规则对所述目标名单数据和所述目标 客户信息进行匹配,生成预处理匹配结果;
合并单元,用于对所述预处理匹配结果进行合并处理,生成匹配结果;所 述匹配结果包括所述目标客户信息命中所述目标名单数据中的所述目标人员 数据的结果。
可选的,所述证件号码组合匹配规则至少包括证件号码英文转大小写规则、 证件号码去除干扰信息规则、证件号码精确度匹配规则和证件号码位规则中的 一种或多种;
所述中文姓名组合匹配规则至少包括大小写规则、全半角规则、简繁体规 则、中文排除干扰信息规则、姓和名颠倒匹配规则和姓名精准度匹配规则的组 合中的一种或多种;
所述英文姓名组合匹配规则至少包括大小写转换规则、英文排除干扰信息 规则、特殊符号分割颠倒规则、姓和名颠倒匹配规则和英文字母排列配规则的 组合中的一种或多种。
可选的,所述装置还包括:
第四获取单元,用于根据所述匹配结果获取目标交易信息;所述匹配结果 和所述目标交易信息组成目标行为;
发送单元,用于将所述目标行为发送给目标机构,以使所述目标机构对所 述目标行为是否存在进行确认;
接收单元,用于接收目标报告;所述目标报告为所述机构确认所目标行为 存在后生成的。
本申请实施例还提供了一种信息匹配设备,其特征在于,所述设备用于执 行所述的信息匹配方法。
通过上述技术方案可知,本申请具有以下有益效果:
本申请实施例提供了一种信息匹配方法,该方法包括:获取目标名单数据; 目标名单数据至少包括一个目标人员数据。之后,获取目标客户信息。获取从 匹配规则库中选择的匹配规则,匹配规则库中的匹配规则包括证件号码组合匹 配规则、中文姓名组合匹配规则和英文姓名组合匹配规则。按照选择的匹配规 则对目标名单数据和目标客户信息进行匹配,生成预处理匹配结果。对预处理 匹配结果进行合并处理,生成匹配结果。其中,匹配结果包括目标客户信息命 中目标名单数据中的目标人员数据的结果。通过本申请提供的技术方案,可以 对匹配规则库中匹配规则进行灵活选择,生成匹配规则,提高匹配规则的灵活 性和匹配结果的准确度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施 例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述 中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创 造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种信息匹配方法的流程图;
图2为本申请实施例提供的证件号码组合匹配规则的示意图;
图3为本申请实施例提供的中文姓名组合匹配规则的示意图;
图4为本申请实施例提供的英文姓名组合匹配规则的示意图;
图5为本申请实施例提供的一种信息匹配装置的示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和 具体实施方式对本申请实施例作进一步详细的说明。
为了便于理解和解释本申请实施例提供的信息匹配方法,先对本申请的相 关技术进行说明。
在金融机构反洗钱领域中,根据监管要求,对于出现黑名单的名单数据调 整,金融机构应当立即针对本机构的所有客户启动回溯性调查。具体为获取其 客户信息、交易对手、交易金额及资产情况,并依据调整后黑名单的名单数据 确认本机构客户的可疑程度,上报可疑交易报告。
现有的名单匹配/筛查系统中,往往出现不同的名单数据的实体信息,与 银行系统录入的客户信息存在各种各样的差异,导致筛查结果准确度不高,需 要进行多次的调整筛查规则,才能得到较为理想的筛查结果。而现有的技术中 名单数据筛查方法很难对匹配/规则进行灵活的调整,不能满足业务对匹配规 则的灵活配置。
基于此,本申请实施例提供了一种信息匹配方法,该方法包括:获取目标 名单数据;目标名单数据至少包括一个目标人员数据。之后,获取目标客户信 息。获取从匹配规则库中选择的匹配规则,匹配规则库中的匹配规则包括证件 号码组合匹配规则、中文姓名组合匹配规则和英文姓名组合匹配规则。按照选 择的匹配规则对目标名单数据和目标客户信息进行匹配,生成预处理匹配结果。 对预处理匹配结果进行合并处理,生成匹配结果。其中,匹配结果包括目标客 户信息命中目标名单数据中的目标人员数据的结果。
参见图1,图1为本申请实施例提供的一种信息匹配方法的流程图。如图1 所示,该方法包括S101-S105:
S101:获取目标名单数据;目标名单数据至少包括一个目标人员数据。
获取目标名单数据;目标名单数据至少包括一个目标人员数据。
具体实施时,首先,获取名单数据,其中,名单数据获取方式包括:外部 购买名单数据、上游系统批量导入数据,例高风险、协查名单数据、前台手工 录入名单。作为一种示例,名单数据为黑名单数据。
其次,对名单数据进行标准化处理,获取目标名单数据。
具体的,先将获取的名单数据按照客户信息选项卡进行处理。客户信息选 项卡包括客户活跃程度选项、客户类型选项(对公人员/个人人员)、客户国籍 信息选择和开户时间选项等。
按照客户信息选项卡对名单数据进行处理之后,再对名单数据进行数据层 的标准化处理。具体的,将名单数据按照有无分隔符、姓名大小写、全角半角、 姓在前名在后、名在前姓在后等标准进行标准化处理,将名单数据在数据层进 行格式的统一,最终形成本次筛查的标准化的名单数据,即目标名单数据。
S102:获取目标客户信息。
获取目标客户信息。
具体实施时,首先,获取客户信息。客户信息为机构客户信息。客户信息 包括客户中文姓名、客户英文姓名、客户号、身份证号、其他证件号码、组织 机构代码等。其中,其他证件号码包括统一社会信用代码、护照号码等。
其次,对客户信息进行标准化处理,获得目标客户信息。
具体的,先将获取的客户信息按照客户信息选项卡进行处理。客户信息选 项卡包括客户活跃程度选项、客户类型选项(对公客户/个人客户)、客户国籍 信息选择和开户时间选项等。
按照客户信息选项卡对客户信息进行处理之后,再对客户信息进行数据层 的标准化处理。具体的,将客户信息按照有无分隔符、姓名大小写、全角半角、 姓在前名在后等标准进行标准化处理,将客户信息在数据层进行格式的统一, 最终形成本次筛查的标准化的客户信息数据,即目标客户信息。
可以理解的是,目标客户信息和目标名单数据的在数据层的格式为相同格 式,便于后期的匹配和筛查。
作为一种示例,目标客户信息和目标名单数据可以以表格的形式进行表达。 如表1和表2所示,表1为目标客户信息和目标名单数据中的个人客户信息数据 结构,表2为目标客户信息和目标名单数据中的对公客户信息数据结构。
表1个人客户信息数据结构
Figure BDA0002862227340000061
表2对公客户信息数据结构
Figure BDA0002862227340000062
S103:获取从匹配规则库中选择的匹配规则;匹配规则库中的匹配规则包 括证件号码组合匹配规则、中文姓名组合匹配规则和英文姓名组合匹配规则。
匹配规则库中包含多种规则,例如证件号码组合匹配规则、中文姓名组合 匹配规则和英文姓名组合匹配规则。具体实施时,要对规则库中的规则进行规 则选项勾选,生成组合匹配规则。
其中,证件号码组合匹配规则至少包括证件号码英文转大小写规则、证件 号码去除干扰信息规则、证件号码精确度匹配规则和证件号码位规则中的一种 或多种,如图2所示。具体实施时,作为一种示例,证件号码英文转大小写规 则中包括证件号码英文转大小写选项和证件号码英文不转大小写选项。在证件 号码英文转大小写规则设置时,可以根据实际情况进行证件号码英文转大小写 选项和证件号码英文不转大小写选项的勾选。作为一种示例,证件号码中包括 下划线等符号。证件号码去除干扰信息规则包括证件号码去除干扰信息规则选 项和证件号码不去除干扰信息规则选项。在证件号码去除干扰信息规则设置时, 可以根据实际情况进行证件号码去除干扰信息规则选项和证件号码不去除干 扰信息规则选项的勾选。作为一种示例,证件精确度匹配规则包括证件号码完 全一致规则选项和证件号码模糊匹配规则选项。在证件号码精确度匹配规则设 置时,可以根据实际情况进行证件号码完全一致规则选项和证件号码模糊匹配 规则选项的勾选。作为一种示例,证件号码位规则包括15位证件号码规则选项 和18位证件号码规则选项。在证件号码位规则设置时,可以根据实际情况进行 15位证件号码规则选项和18位证件号码规则选项的勾选。
需要说明的是,可以选择证件号码英文转大小写规则、证件号码去除干扰 信息规则、证件号码精确度匹配规则和证件号码位规则中的一种或多种进行相 应的设置。
可以理解的是,如图2所示,客户分为个人客户和对公客户。针对个人客 户,证件号码包括身份证件号码和护照号码等。对公客户包括组织机构代码和 统一社会信用代码等。
中文姓名组合匹配规则至少包括大小写规则、全半角规则、简繁体规则、 中文译拼音匹配规则、中文排除干扰信息规则、姓和名颠倒匹配规则和姓名精 准度匹配规则的组合中的一种或多种。如图3所示,大小写规则、全半角规则 等规则为中文姓名组合匹配规则下的子规则。具体实施时,作为一种示例,大 小写规则包括大写规则选项和小写规则选项。在大小写规则设置时,可以根据 实际情况进行大写规则选项和小写规则选项的勾选。作为一种示例,全半角规 则包括全角规则选项和半角规则选项。在全半角规则设置时,可以根据实际情 况进行全角规则选项和半角规则选项的勾选。作为一种示例,简繁体规则包括繁体规则选项和简体规则选项。在简繁体规则设置时,可以根据实际情况进行 繁体规则选项和简体规则选项的勾选。作为一种示例,中文译拼音匹配规则包 括中文译拼音规则选项和中文不译拼音规则选项。在中文译拼音匹配规则设置 时,可以根据实际情况进行中文译拼音规则选项和中文不译拼音规则选项的勾 选。作为一种示例,姓和名颠倒匹配规则包括姓在前名在后规则选项和名在前 姓在后规则选项。在姓和名颠倒匹配规则设置时,可以根据实际情况进行姓在 前名在后规则选项和名在前姓在后规则选项的勾选。作为一种示例,姓名精准 度匹配规则包括姓名精准匹配规则选项和姓名模糊匹配规则选项。在姓名精准度匹配规则设置时,可以根据实际情况进行姓名精准匹配规则选项和姓名模糊 匹配规则选项的勾选。
其中,中文排除干扰信息规则和证件号码去除干扰信息规则类似,这里不 再详述。需要说明的是,可以选择大小写规则、全半角规则、简繁体规则、中 文译拼音匹配规则、中文排除干扰信息规则、姓和名颠倒匹配规则和姓名精准 度匹配规则的组合中的一种或多种进行相应的设置。而且,中文姓名组合匹配 规则可以根据实际情况添加其他子规则进行组合,这里不做限定。
英文姓名组合匹配规则至少包括大小写转换规则、英文排除干扰信息规则、 特殊符号分割颠倒规则、姓和名颠倒匹配规则和英文字母排列配规则的组合中 的一种或多种,如图4所示。具体实施时,作为一种示例,姓名中间存在句点, 则需要考虑是否将句点隔开的姓名拆开进行匹配,或者将句点隔开的姓名拆开 不匹配进行匹配。则特殊符号分割颠倒规则包括拆开匹配规则选项和不拆开匹 配规则选项。在特殊符号分割颠倒规则设置时,可以根据实际情况进行拆开匹 配规则选项和不拆开匹配规则选项的勾选。需要说明的是,其他子规则不再赘 述。
S104:按照选择的匹配规则对目标名单数据和目标客户信息进行匹配,生 成预处理匹配结果。
在获取从匹配规则库中选择的匹配规则,即组合匹配规则之后,按照选择 的匹配规则对目标名单数据和目标客户信息进行匹配,生成预处理匹配结果。
需要说明的是,在获取从匹配规则库中选择的匹配规则,按照选择的匹配 规则对目标名单数据和目标客户信息进行匹配,生成预处理匹配结果之前,还 包括:
对选择的匹配规则赋予权重,生成包含权重信息的匹配规则。
具体的,可以为证件号码组合匹配规则、中文姓名组合匹配规则和英文姓 名组合匹配规则设置权重信息,例如证件号码组合匹配规则的权重为0.5,中 文姓名组合匹配规则的权重为0.3,英文姓名组合匹配规则的权重为0.2。
则按照选择的匹配规则对目标名单数据和目标客户信息进行匹配,生成预 处理匹配结果,包括:
按照包含权重信息的匹配规则对目标名单数据和目标客户信息进行匹配, 生成预处理匹配结果。
具体的,还可以为证件号码组合匹配规则、中文姓名组合匹配规则和英文 姓名组合匹配规则设置分数。例如证件号码组合匹配规则的分数为60分,中文 姓名组合匹配规则的分数为50分,英文姓名组合匹配规则的分数为40分。同样, 可以为各规则下的子规则进行分值的设置。
需要说明的是,在按照选择的匹配规则对目标名单数据和目标客户信息进 行匹配之前,还可以根据选择的匹配规则对目标名单数据和目标客户信息进行 预处理,得到预处理之后的目标名单数据和目标客户信息。之后,按照选择的 匹配规则对预处理之后的目标名单数据和目标客户信息进行匹配,生成预处理 匹配结果。其中,预处理具体为根据选择的匹配规则对目标名单数据和目标客 户信息进行删减处理,例如,目标名单数据和目标客户信息中的中文姓名为姓 在前名在后和名在前姓在后两种。若选择的匹配规则中仅勾选了姓在前名在后 规则选项,则可以将目标名单数据和目标客户信息中的名在前姓在后的中文名 删掉,方便后续匹配筛查处理。
还需要说明的是,预处理匹配结果可以通过表格的形式进行表达,如表3 所示,表3为生成的预处理匹配结果。
从表3中可知,预处理匹配结果包括客户名称、客户号、命中规则、命中 得分和命中实体ID(Identity document,身份标识号)等。命中实体ID为目标 名单数据上的客户的实体ID。预处理匹配结果表明了针对某条命中规则,目标 客户信息中的客户和目标名单数据中的客户(可以用实体ID进行表征)相匹配
表3预处理匹配结果
客户号 命中规则 命中得分 命中实体ID
客户A 16XXXXXXX DSID01 100 000001
客户A 16XXXXXXX DSNM01 90 000009
客户C 66XXXXXXX DGID02 80 100002
客户C 66XXXXXXX DGNM01 70 100007
的程度。其中,相匹配的程度可以用命中分值进行表示。命中得分为针对证件 号码组合匹配规则、中文姓名组合匹配规则和英文姓名组合匹配规则,考虑各 个规则或子规则的权重和分数后获得的。
从表3可知,预处理匹配结果中针对命中规则DSID01,客户A和命中实 体ID000001相匹配的分值为100分。针对命中规则DSNM01,客户A和命中 实体ID000009相匹配的分值为100分。
可以理解的是,设置预设分值,例如40分。当命中分值低于预设分值, 则不计入预处理匹配结果中。
需要说明的是,命中规则可设置以下类别:DSID01-个人客户身份证号码 匹配;DSID03-个人客户护照号码进行匹配;DSID04-个人客户其他证件的号 码匹配;DSNM01-个人客户中文姓名姓名匹配;DSNM02-个人客户中文转拼 音匹配;DSNM03-个人客户英文名称匹配;DSNM04-个人客户英文按字母顺 序匹配;DGID01-对公客户统一社会信用代码匹配;DGID02-对公客户组织机 构代码匹配;DGID03-对公客户其他证件号码匹配;DGNM01-对公客户中文 名称匹配;DGNM02-对公客户英文名称匹配。
S105:对预处理匹配结果进行合并处理,生成匹配结果;匹配结果包括目 标客户信息命中目标名单数据中的目标人员数据的结果。
获得预处理匹配结果后,对预处理匹配结果进行合并处理,生成匹配结果; 匹配结果包括目标客户信息命中目标名单数据中的目标人员数据的结果。
例如,表3中,针对客户A来说,客户A命中了两条规则,DSID01和DSNM01, 则对此结果进行合并处理。作为一种示例,可以将两条命中规则和命中分值进 行合并处理,获得一条命中规则和分值,用来表征客户A的匹配结果。需要说 明的是,进行合并处理的方式可以根据实际情况进行选取,这里不做限定。
需要说明的是,作为一种示例,匹配结果通过表格的形式进行表达,而且 匹配结果可解释。
针对批量的筛查全量客户信息,传统的做法是对筛查结果进行人工的二次 加工才能生成预警数据,手工下发人工确认后,采用手工预警方式上报。为了 对筛查结果进行自动的预警下发及上报。可知,传统的匹配/筛查结果和预警 环节完全独立,不能实现筛查结果关联客户信息及交易信息生成预警,并且不 支持筛查结果自动生成预警及下发确认环节。
为了解决此问题,本申请实施例还提供了获得匹配结果后自动生成预警的 方法流程,则本申请实施例提供的信息匹配方法,还包括:
根据匹配结果获取目标交易信息;匹配结果和目标交易信息组成目标行为;
将目标行为发送给目标机构,以使目标机构对目标行为是否存在进行确认;
接收目标报告;目标报告为机构确认目标行为存在后生成的。
需要说明的是,目标交易信息包括客户的交易信息、交易对手、交易金额 及资产情况等信息。
还需要说明的是,若机构确认某一目标行为不存在,则认为该一目标行为 对应的客户不可疑,不用生成目标报告。
因此,本申请实施例提供的信息匹配方法可以将匹配结果和预警环节相关 联,减少了人工干预环节完成筛查即可下发预警确认,确认完毕,立即上报可 疑报告。
本申请实施例提供的一种信息匹配方法包括:获取目标名单数据;目标名 单数据至少包括一个目标人员数据。之后,获取目标客户信息。获取从匹配规 则库中选择的匹配规则,匹配规则库中的匹配规则包括证件号码组合匹配规则、 中文姓名组合匹配规则和英文姓名组合匹配规则。按照选择的匹配规则对目标 名单数据和目标客户信息进行匹配,生成预处理匹配结果。对预处理匹配结果 进行合并处理,生成匹配结果。其中,匹配结果包括目标客户信息命中目标名 单数据中的目标人员数据的结果。通过本申请实施例提供的技术方案,可以对 匹配规则库中匹配规则进行灵活选择,生成匹配规则,提高匹配规则的灵活性 和匹配结果的准确度。
参见图5,图5为本申请实施例提供的一种信息匹配装置的示意图,该装 置包括:
第一获取单元501,用于获取目标名单数据;目标名单数据至少包括一个 目标人员数据;
第二获取单元502,用于获取目标客户信息;
第三获取单元503,用于获取从匹配规则库中选择的匹配规则;匹配规则 库中的匹配规则包括证件号码组合匹配规则、中文姓名组合匹配规则和英文姓 名组合匹配规则;
匹配单元504,用于按照选择的匹配规则对目标名单数据和目标客户信息 进行匹配,生成预处理匹配结果;
合并单元505,用于对预处理匹配结果进行合并处理,生成匹配结果;匹 配结果包括目标客户信息命中目标名单数据中的目标人员数据的结果。
可选的,在本申请实施例的一些实施方式中,证件号码组合匹配规则至少 包括证件号码英文转大小写规则、证件号码去除干扰信息规则、证件号码精确 度匹配规则和证件号码位规则中的一种或多种;
中文姓名组合匹配规则至少包括大小写规则、全半角规则、简繁体规则、 中文排除干扰信息规则、姓和名颠倒匹配规则和姓名精准度匹配规则的组合中 的一种或多种;
英文姓名组合匹配规则至少包括大小写转换规则、英文排除干扰信息规则、 特殊符号分割颠倒规则、姓和名颠倒匹配规则和英文字母排列配规则的组合中 的一种或多种。
可选的,在本申请实施例的一些实施方式中,装置还包括:
第四获取单元,用于根据匹配结果获取目标交易信息;匹配结果和目标交 易信息组成目标行为;
发送单元,用于将目标行为发送给目标机构,以使目标机构对目标行为是 否存在进行确认;
接收单元,用于接收目标报告;目标报告为机构确认所目标行为存在后生 成的。
本申请实施例还提供了一种信息匹配设备,设备用于执行上述实施例所述 的信息匹配方法。具体的,该信息匹配设备为基于模块化的匹配/筛查引擎, 根据业务规则拆分出子匹配规则模块,例如证件号码匹配/筛查引擎、中文姓 名匹配/筛查引擎、英文姓名匹配/筛查引擎。其中,证件号码匹配/筛查引擎用 于证件号码组合匹配规则的设置,中文姓名匹配/筛查引擎用于中文姓名组合 匹配规则的设置、英文姓名匹配/筛查引擎用于英文姓名组合匹配规则的设置。
本申请实施例提供了一种信息匹配装置,获取目标名单数据;目标名单数 据至少包括一个目标人员数据。之后,获取目标客户信息。获取从匹配规则库 中选择的匹配规则,匹配规则库中的匹配规则包括证件号码组合匹配规则、中 文姓名组合匹配规则和英文姓名组合匹配规则。按照选择的匹配规则对目标名 单数据和目标客户信息进行匹配,生成预处理匹配结果。对预处理匹配结果进 行合并处理,生成匹配结果。其中,匹配结果包括目标客户信息命中目标名单 数据中的目标人员数据的结果。通过本申请提供的装置,可以对匹配规则库中 匹配规则进行灵活选择,生成匹配规则,提高匹配规则的灵活性和匹配结果的准确度。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上 述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式 来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡 献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储 介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设 备(可以是个人计算机,服务器,或者诸如媒体网关等网络通信设备,等等) 执行本申请各个实施例或者实施例的某些部分所述的方法。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施 例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互 相参见即可。对于实施例公开的方法而言,由于其与实施例公开的系统相对应, 所以描述的比较简单,相关之处参见系统部分说明即可。
还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意 在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设 备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为 这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由 语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物 品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本 申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的, 本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它 实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要 符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种信息匹配方法,其特征在于,所述方法包括:
获取目标名单数据;所述目标名单数据至少包括一个目标人员数据;
获取目标客户信息;
获取从匹配规则库中选择的匹配规则;所述匹配规则库中的匹配规则包括证件号码组合匹配规则、中文姓名组合匹配规则和英文姓名组合匹配规则;
按照所述选择的匹配规则对所述目标名单数据和所述目标客户信息进行匹配,生成预处理匹配结果;
对所述预处理匹配结果进行合并处理,生成匹配结果;所述匹配结果包括所述目标客户信息命中所述目标名单数据中的所述目标人员数据的结果。
2.根据权利要求1所述的方法,其特征在于,所述证件号码组合匹配规则至少包括证件号码英文转大小写规则、证件号码去除干扰信息规则、证件号码精确度匹配规则和证件号码位规则中的一种或多种;
所述中文姓名组合匹配规则至少包括大小写规则、全半角规则、简繁体规则、中文译拼音匹配规则、中文排除干扰信息规则、姓和名颠倒匹配规则和姓名精准度匹配规则的组合中的一种或多种;
所述英文姓名组合匹配规则至少包括大小写转换规则、英文排除干扰信息规则、特殊符号分割颠倒规则、姓和名颠倒匹配规则和英文字母排列配规则的组合中的一种或多种。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述匹配结果获取目标交易信息;所述匹配结果和所述目标交易信息组成目标行为;
将所述目标行为发送给目标机构,以使所述目标机构对所述目标行为是否存在进行确认;
接收目标报告;所述目标报告为所述机构确认所述目标行为存在后生成的。
4.根据权利要求1所述的方法,其特征在于,在所述获取从匹配规则库中选择的匹配规则之后,所述按照所述选择的匹配规则对所述目标名单数据和所述目标客户信息进行匹配,生成预处理匹配结果之前,所述方法还包括:
对所述选择的匹配规则赋予权重,生成包含权重信息的匹配规则。
5.根据权利要求4所述的方法,其特征在于,所述按照所述选择的匹配规则对所述目标名单数据和所述目标客户信息进行匹配,生成预处理匹配结果,包括:
按照所述包含权重信息的匹配规则对所述目标名单数据和所述目标客户信息进行匹配,生成预处理匹配结果。
6.一种信息匹配装置,其特征在于,所述装置包括:
第一获取单元,用于获取目标名单数据;所述目标名单数据至少包括一个目标人员数据;
第二获取单元,用于获取目标客户信息;
第三获取单元,用于获取从匹配规则库中选择的匹配规则;所述匹配规则库中的匹配规则包括证件号码组合匹配规则、中文姓名组合匹配规则和英文姓名组合匹配规则;
匹配单元,用于按照所述选择的匹配规则对所述目标名单数据和所述目标客户信息进行匹配,生成预处理匹配结果;
合并单元,用于对所述预处理匹配结果进行合并处理,生成匹配结果;所述匹配结果包括所述目标客户信息命中所述目标名单数据中的所述目标人员数据的结果。
7.根据权利要求6所述的装置,其特征在于,所述证件号码组合匹配规则至少包括证件号码英文转大小写规则、证件号码去除干扰信息规则、证件号码精确度匹配规则和证件号码位规则中的一种或多种;
所述中文姓名组合匹配规则至少包括大小写规则、全半角规则、简繁体规则、中文排除干扰信息规则、姓和名颠倒匹配规则和姓名精准度匹配规则的组合中的一种或多种;
所述英文姓名组合匹配规则至少包括大小写转换规则、英文排除干扰信息规则、特殊符号分割颠倒规则、姓和名颠倒匹配规则和英文字母排列配规则的组合中的一种或多种。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第四获取单元,用于根据所述匹配结果获取目标交易信息;所述匹配结果和所述目标交易信息组成目标行为;
发送单元,用于将所述目标行为发送给目标机构,以使所述目标机构对所述目标行为是否存在进行确认;
接收单元,用于接收目标报告;所述目标报告为所述机构确认所目标行为存在后生成的。
9.一种信息匹配设备,其特征在于,所述设备用于执行权利要求1-5任一项所述的信息匹配方法。
CN202011569170.3A 2020-12-26 2020-12-26 一种信息匹配方法及装置 Pending CN112732754A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011569170.3A CN112732754A (zh) 2020-12-26 2020-12-26 一种信息匹配方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011569170.3A CN112732754A (zh) 2020-12-26 2020-12-26 一种信息匹配方法及装置

Publications (1)

Publication Number Publication Date
CN112732754A true CN112732754A (zh) 2021-04-30

Family

ID=75616852

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011569170.3A Pending CN112732754A (zh) 2020-12-26 2020-12-26 一种信息匹配方法及装置

Country Status (1)

Country Link
CN (1) CN112732754A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113344716A (zh) * 2021-05-31 2021-09-03 北京顶象技术有限公司 对企业受益所有人洗钱风险的实时风控系统和风控方法
CN117592911A (zh) * 2024-01-19 2024-02-23 天津盛驰精工有限公司 一种金属成形加工资源的管理方法、系统、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004139237A (ja) * 2002-10-16 2004-05-13 Toshiba Corp 名寄せ方法および名寄せシステム並びに会計処理方法および会計処理システム
CN105096028A (zh) * 2014-11-20 2015-11-25 北京航天金盾科技有限公司 一种人口数据的智能匹配方法
CN107294936A (zh) * 2016-04-12 2017-10-24 阿里巴巴集团控股有限公司 姓名验证方法及装置
CN109815268A (zh) * 2018-12-21 2019-05-28 上海诺悦智能科技有限公司 一种交易制裁名单匹配系统
CN111242645A (zh) * 2020-01-19 2020-06-05 福建省农村信用社联合社 一种银行客户信息识别和完整性控制的方法
TWM604438U (zh) * 2020-07-23 2020-11-21 臺灣銀行股份有限公司 姓名編碼比對裝置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004139237A (ja) * 2002-10-16 2004-05-13 Toshiba Corp 名寄せ方法および名寄せシステム並びに会計処理方法および会計処理システム
CN105096028A (zh) * 2014-11-20 2015-11-25 北京航天金盾科技有限公司 一种人口数据的智能匹配方法
CN107294936A (zh) * 2016-04-12 2017-10-24 阿里巴巴集团控股有限公司 姓名验证方法及装置
CN109815268A (zh) * 2018-12-21 2019-05-28 上海诺悦智能科技有限公司 一种交易制裁名单匹配系统
CN111242645A (zh) * 2020-01-19 2020-06-05 福建省农村信用社联合社 一种银行客户信息识别和完整性控制的方法
TWM604438U (zh) * 2020-07-23 2020-11-21 臺灣銀行股份有限公司 姓名編碼比對裝置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113344716A (zh) * 2021-05-31 2021-09-03 北京顶象技术有限公司 对企业受益所有人洗钱风险的实时风控系统和风控方法
CN117592911A (zh) * 2024-01-19 2024-02-23 天津盛驰精工有限公司 一种金属成形加工资源的管理方法、系统、设备及介质
CN117592911B (zh) * 2024-01-19 2024-05-28 天津盛驰精工有限公司 一种金属成形加工资源的管理方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
US8510797B2 (en) Online user authentication
CN112732754A (zh) 一种信息匹配方法及装置
CN104217160A (zh) 一种中文钓鱼网站检测方法及系统
US10223680B2 (en) Transaction decisioning by an automated device
US11170052B2 (en) Identification of potentially sensitive information in data strings
Edwards et al. Scamming the scammers: towards automatic detection of persuasion in advance fee frauds
CN112036890A (zh) 客户身份认证方法及装置
CN107169856A (zh) 一种公积金业务对账方法和系统
KR101763275B1 (ko) Cb 정보를 이용한 본인 인증 방법, 그 시스템 및 그 프로그램을 기록한 컴퓨터 판독 가능한 기록매체
US20220138768A1 (en) Systems and methods for verifying digital payments
US20160358141A1 (en) Transaction Decisioning by an Automated Device
EP3879418B1 (en) Identity verification method and device
CN108830698A (zh) 一种财务管理系统及其使用方法
CN112598038A (zh) 同城票据集中提入处理的方法和系统
US20200036722A1 (en) Controlling Interactions and Generating Alerts Based on Iterative Fuzzy Searches of a Database and Comparisons of Multiple Variables
CN111104853A (zh) 图像信息录入方法、装置、电子设备及存储介质
CN111192584A (zh) 单据核销方法及系统
CN112819595A (zh) 凭证风险智能处置的方法和装置
CN112132693A (zh) 交易验证方法、装置、计算机设备与计算机可读存储介质
CN116629804B (zh) 一种信访督查跟踪管理系统及管理方法
US11861732B1 (en) Industry-profile service for fraud detection
CN116886992B (zh) 一种视频数据的处理方法、装置、电子设备及存储介质
CN116186543B (zh) 一种基于图像识别的财务数据处理系统及方法
CN116151948A (zh) 一种新的票据黑中介识别方法及系统
CN107632975A (zh) 一种词典建立方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination