CN114022166B - 一种信息处理方法、装置、计算机设备及存储介质 - Google Patents
一种信息处理方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN114022166B CN114022166B CN202111381659.2A CN202111381659A CN114022166B CN 114022166 B CN114022166 B CN 114022166B CN 202111381659 A CN202111381659 A CN 202111381659A CN 114022166 B CN114022166 B CN 114022166B
- Authority
- CN
- China
- Prior art keywords
- client
- public
- clients
- information
- pair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 25
- 238000003672 processing method Methods 0.000 title claims abstract description 11
- 238000000034 method Methods 0.000 claims abstract description 43
- 230000007246 mechanism Effects 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims description 90
- 230000035515 penetration Effects 0.000 claims description 27
- 230000008520 organization Effects 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 13
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract 1
- 238000013136 deep learning model Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供了一种信息处理方法、装置、计算机设备及存储介质,应用于人工智能领域和金融科技领域,方法包括:根据第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单以及至少一个对公客户中每个对公客户的开户信息、设备信息、第一信息集合构建第一知识图谱;根据第一知识图谱从至少一个对公客户中确定出符合预设关注条件的第一对公客户集合;在确定至少一个对公客户包括除第一对公客户集合之外的第二对公客户集合后,将第二对公客户集合中各对公客户的第二信息集合输入客户评级模型,获得对各对公客户的评级结果,该过程可以提升对公客户评级的准确性和适应能力。本申请涉及区块链技术,如第三方黑名单等信息从区块链获取的。
Description
技术领域
本申请涉及数据分析技术领域,尤其涉及一种信息处理方法、装置、计算机设备及存储介质。
背景技术
根据银保监会监管要求,央行分支、商业银行等金融机构要高度重视并全面强化小微企业银行开户服务和管理工作,严格落实“两个不减、两个加强”管理要求,即:企业开户便利程度不减、风险防控力度不减,企业账户开户服务要加强、账户风险管理要加强。当前对公客户入网评级方案主要以静态专家业务经验模型为核心,一定程度上能够在对公客户开户时评出对公客户的等级,但随着金融科技迅猛发展,不法分子的欺诈手法和作案方式也在不断迭代升级,静态专家经验模型在评级的准确性上和适应能力上存在较大的局限性,这就意味着对公客户风险识别的准确性在不断降低。
发明内容
本申请实施例提供了一种信息处理方法、装置、计算机设备及存储介质,在对对公客户评级的准确性上和适应能力上都有较大程度提升,使得对对公客户风险识别的准确性得到提升。
第一方面,本申请实施例提供了一种信息处理方法,包括:
获取至少一个对公客户中每个对公客户的开户信息以及所述每个对公客户的设备信息;
根据所述每个对公客户的开户信息获取所述每个对公客户的第一信息集合;
获取第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单;
根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述每个对公客户的第一信息集合、所述第三方黑名单、所述关注名单构建第一知识图谱;
对所述第一知识图谱进行数据处理,以从所述至少一个对公客户中确定出符合预设关注条件的第一对公客户集合;
在确定所述至少一个对公客户包括除所述第一对公客户集合之外的第二对公客户集合时,获取所述第二对公客户集合中各个对公客户的第二信息集合,所述第二信息集合与第一信息集合存在不同;
将所述第二对公客户集合中各个对公客户的第二信息集合输入客户评级模型,获得对所述第二对公客户集合中各个对公客户的评级结果。
在一个实施例中,所述开户信息包括企业标识信息和法定代表人的标识信息,所述根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述每个对公客户的第一信息集合、所述第三方黑名单、所述关注名单构建第一知识图谱,包括:
为所述至少一个对公客户中的第一对公客户生成涉诉标签,和/或为所述第一对公客户的法定代表人生成涉诉标签,所述第一对公客户的第一信息集合包括涉诉信息;
为所述至少一个对公客户中的第二对公客户生成涉案标签,和/或为所述第二对公客户的法定代表人生成涉案标签,所述第二对公客户的第一信息集合包括涉案信息;
为所述至少一个对公客户中的第三对公客户生成黑名单客户标签,和/或为所述第三对公客户的法定代表人生成黑名单客户标签,所述第三对公客户的企业标识信息和/或法定代表人的标识信息出现在所述第三方黑名单中;
为所述至少一个对公客户中第四对公客户生成关注名单客户标签,和/或为所述第四对公客户的法定代表人生成关注名单客户标签,所述第四对公客户的企业标识信息和/或法定代表人的标识信息出现在所述关注名单中;
根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述涉诉标签、所述涉案标签、所述第三方黑名单客户标签、所述关注名单客户标签构建第一知识图谱。
在一个实施例中,所述数据处理包括实体属性识别,所述第一对公客户集合包括符合第一预设关注条件的对公客户,所述对所述第一知识图谱进行数据处理,以从所述至少一个对公客户中确定出符合预设关注条件的第一对公客户集合,包括:
从所述第一知识图谱包括的所述每个对公客户对应的企业名称实体中确定出目标企业名称实体,以作为符合第一预设关注条件的对公客户;所述目标企业名称实体的属性信息包括目标标签;所述目标标签包括目标涉诉标签、目标涉案标签、黑名单客户标签、关注名单客户标签中的至少一项;和/或,
从所述第一知识图谱包括的所述每个对公客户对应的法定代表人姓名实体中确定出目标法定代表人姓名实体,并将所述目标法定代表人姓名实体对应的对公客户确定为符合第一预设关注条件的对公客户,所述目标法定代表人姓名实体的属性信息包括所述目标标签。
在一个实施例中,所述第一信息集合还包括工商信息和股权信息,所述工商信息包括企业注册地址,所述数据处理包括多重关联关系穿透处理,所述第一对公客户集合包括符合第二预设关注条件的对公客户,所述对所述第一知识图谱进行数据处理,以从所述至少一个对公客户中确定出符合预设关注条件的第一对公客户集合,包括:
对所述第一知识图谱进行地址穿透处理,以从所述至少一个对公客户确定出第五对公客户作为符合第二预设关注条件的对公客户,所述第五对公客户的企业注册地址同时被至少两个企业使用;和/或,
对所述第一知识图谱进行法定代表人穿透处理,以从至少一个对公客户中确定出目标法定代表人对应的对公客户,当所述目标法定代表人任职的多家企业中存在企业为关注类企业或存在大于预设比例的企业为关注类企业时,确定所述目标法定代表人对应的对公客户为符合第二预设关注条件的对公客户,所述目标法定代表人为所述多家企业的法定代表人;和/或,
当所述至少一个对公客户为多个对公客户时,对所述第一知识图谱进行设备穿透处理,以从所述多个对公客户中确定出设备信息相同的至少两个对公客户,并当所述至少两个对公客户中存在第六对公客户或存在大于预设比例的第六对公客户时,将所述至少两个对公客户中除所述第六对公客户外的对公客户确定为符合第二预设关注条件的对公客户,所述第六对公客户的属性信息包括目标标签;和/或,
对所述第一知识图谱进行股权穿透处理,以确定出与所述至少一个对公客户中的第七对公客户具有直接和/或间接控股关系的企业,若与所述第七对公客户具有直接和/或间接控股关系的企业中有企业或有大于预设比例的企业为关注类客户,则确定所述第七对公客户为符合第二预设关注条件的对公客户,所述第七对公客户为所述至少一个对公客户中的任一对公客户。
在一个实施例中,所述将所述第二对公客户集合中各个对公客户的第二信息集合输入客户评级模型,获得对所述第二对公客户集合中各个对公客户的评级结果,包括:
将所述第二对公客户集合中各个对公客户的第二信息集合输入多个客户评级模型以进行评级处理,得到所述第二对公客户集合中各个对公客户的多个第三评级结果;
将第二对公客户集合后各个对公客户的多个第三评级结果中出现次数最多的第三评级结果确定为对所述第二对公客户集合中各个对公客户的评级结果。
在一个实施例中,所述方法还包括:
获取多个样本客户中每个样本客户的开户信息以及所述每个样本客户的设备信息;
获取所述每个样本客户的第一信息集合;
获取第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单;
根据所述每个样本客户的开户信息、所述每个样本客户的设备信息、所述每个样本客户的第一信息集合、所述第三方黑名单、所述关注名单构建第二知识图谱;
对所述第二知识图谱进行数据处理,以从所述多个样本客户中确定出第一样本客户集合;
在确定所述多个样本客户包括除所述第一样本客户集合之外的第二样本客户集合时,获取所述第二样本客户集合中每个样本客户的第二信息集合;
根据所述第二样本客户集合中每个样本客户的第二信息集合获得所述第二样本客户集合中每个样本客户的第三信息集合;
根据所述第二样本客户集合中每个样本客户的第三信息集合对所述第二样本客户集合中各个样本客户进行聚类处理,得到多个客户群;
利用所述多个客户群中每个客户群中各个样本客户的第三信息集合分别训练所述客户群对应的初始的梯度提升模型,得到多个训练后的梯度提升模型以作为多个客户评级模型。
在一个实施例中,所述根据所述第二样本客户集合中每个样本客户的第二信息集合获得所述第二样本客户集合中每个样本客户的第三信息集合,包括:
对所述第二样本客户集合中每个样本客户的第二信息集合进行预处理,得到所述第二样本客户集合中每个样本客户对应的预处理后的第二信息集合;
将所述第二样本客户集合中每个样本客户对应的预处理后的第二信息集合,确定为所述第二样本客户集合中每个样本客户的第三信息集合。
第二方面,本申请实施例提供了一种信息处理装置,包括:
获取模块,用于获取至少一个对公客户中每个对公客户的开户信息以及所述每个对公客户的设备信息;
所述获取模块,还用于根据所述每个对公客户的开户信息获取所述每个对公客户的第一信息集合;
所述获取模块,还用于获取第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单;
知识图谱构建模块,用于根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述每个对公客户的第一信息集合、所述第三方黑名单、所述关注名单构建第一知识图谱;
确定模块,用于对所述第一知识图谱进行数据处理,以从所述至少一个对公客户中确定出符合预设关注条件的第一对公客户集合;
所述获取模块,还用于在确定所述至少一个对公客户包括除所述第一对公客户集合之外的第二对公客户集合时,获取所述第二对公客户集合中各个对公客户的第二信息集合,所述第二信息集合与第一信息集合存在不同;
客户评级模块,用于将所述第二对公客户集合中各个对公客户的第二信息集合输入客户评级模型,获得对所述第二对公客户集合中各个对公客户的评级结果。
第三方面,本申请实施例提供了一种计算机设备,包括处理器和存储器,所述处理器和所述存储器相互连接,其中,所述存储器用于存储计算机程序指令,所述处理器被配置用于执行所述程序指令,实现如第一方面所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序指令,所述计算机程序指令被处理器执行时,用于执行如第一方面所述的方法。
综上所述,计算机设备可以获取至少一个对公客户中每个对公客户的开户信息、每个对公客户的设备信息、每个对公客户的第一信息集合、第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单;计算机设备根据每个对公客户的开户信息、每个对公客户的设备信息、每个对公客户的第一信息集合、第三方黑名单、关注名单构建第一知识图谱;计算机设备对第一知识图谱进行数据处理,以从至少一个对公客户中确定出符合预设关注条件的第一对公客户集合,并在确定至少一个对公客户包括除第一对公客户集合之外的第二对公客户集合时,将第二对公客户集合中各个对公客户的第二信息集合输入客户评级模型,获得对第二对公客户集合中各个对公客户的评级结果,上述过程结合知识图谱分析以及深度学习算法来对对公客户进行评级,在对对公客户评级的准确性上和适应能力上都有较大程度提升,使得对对公客户风险识别的准确性得到提升。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种信息处理方法的流程示意图;
图2是本申请再一实施例提供的一种信息处理方法的流程示意图;
图3是本申请实施例提供的一种信息处理过程的示意图;
图4是本申请实施例提供的一种信息处理装置的结构示意图;
图5是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
请参阅图1,为本申请实施例提供的一种信息处理方法的流程示意图。该方法可以应用于计算机设备。计算机设备可以为服务器等设备。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云存储、网络服务、中间件服务、以及大数据和人工智能平台等基础云计算服务的云服务器。具体地,该方法可以包括以下步骤:
S101、获取至少一个对公客户中每个对公客户的开户信息以及所述每个对公客户的设备信息。
其中,至少一个可以为一个或多个。对公客户又可以称为公司客户,是指与银行进行业务关系的法人客户,通常分为大型公司客户、小型公司客户,等等。开户信息指对公客户申请开户时提供给指定机构,如A银行的信息。在一个实施例中,开户信息可以包括企业标识信息和法定代表人的标识信息。其中,企业标识信息可以包括企业名称,进一步还可以包括统一社会信用代码。法定代表人的标识信息可以包括法定代表人的姓名,进一步还可以包括法定代表人的身份证号和手机号等信息。设备信息可以包括互联网协议(InternetProtocol,IP)地址、媒体访问控制(Media Access Control,MAC)地址,等等。MAC地址又可以称为物理地址或硬件地址。在一个实施例中,开户信息还可以包括企业办公地址,等等。
在一个实施例中,开户信息可以是对公客户的相关人员通过开户申请页面提交至计算机设备的。在实际应用过程中,对公客户的相关人员可以在通过手机、电脑等终端在开户申请页面填写开户信息后,通过终端发送开户申请至计算机设备,开户申请携带开户信息,计算机设备可以获取开户申请携带的开户信息。在实际的应用场景中,所指的相关人员可以为法定代表人或代理人等等。
在一个实施例中,开户信息还可以是由其它设备,比如银行客户经理的电脑等终端发送至计算机设备的,或还可以是由银行客户经理的电脑等终端通过相关服务器发送至计算机设备的。这里,对公客户的相关人员可以去银行柜台办理开户,银行客户经理可以使用电脑等终端录入对公客户的开户信息,并将开户信息发送至计算机设备,或通过其它设备将开户信息发送至计算机设备。其它设备为能够用于转发开户信息的设备。
S102、根据所述每个对公客户的开户信息获取所述每个对公客户的第一信息集合。
本申请实施例中,计算机设备可以根据每个对公客户的开户信息查询出每个对公客户的第一信息集合,如可以根据每个对公客户的企业标识信息查询出每个对公客户的第一信息集合。其中,第一信息集合可以包括用于构建实体的信息以及用于构建实体属性的信息。
在一个实施例中,第一信息集合可以包括涉诉信息和涉案信息。其中,涉诉信息可以从第一数据平台,如从提供法律大数据的数据咨询检索平台检索出,具体可以是根据企业标识信息从第一数据平台检索出。涉诉,也就是说跟诉讼有直接或者间接关系。涉案信息可以从第二数据平台,如从公开目标法院(如全国各地的各种级别的法院或指定区域的各个级别的法院或指定地区的指定级别的法院)下达的判决文书等信息的平台检索出。涉案信息可以包括涉案的判决文书,如民事案件、行政案件、执行案件等类型案件的判决文书。涉案,也就是说和案件有直接或者间接关系。此处的涉诉信息和涉案信息可以作为用于构建实体的属性的信息。
在一个实施例中,第一信息集合还可以包括工商信息和股权信息。也就是说第一信息集合可以包括工商信息、涉诉信息、涉案信息和股权信息。其中,工商信息可以是根据企业标识信息从工商局查询出的。工商信息,可以包括企业工商照面。企业工商照面至少包括营业执照信息以及营业情况信息。企业营业执照信息,可以包括企业名称、法定代表人的姓名、企业注册地址、企业注册时间、企业营业期限、企业经营范围,等等。此处的工商信息可以包括用于构建实体的信息,如工商信息包括的企业注册地址可以作为用于构建实体的信息。股权信息可以是根据工商信息查询到的。股权信息可以包括对公客户的股东信息(如股东的名称)、对公客户控股的企业的信息(如控股的企业的名称)等信息。在一个实施例中,股权信息还可以包括股权类型。
在一个实施例中,第一信息集合还可以包括税务信息。也就是说第一信息集合可以包括税务信息、工商信息、涉诉信息、涉案信息和股权信息。在一个实施例中,税务信息可以是从税务局查询出的。税务信息,可以包括目标时间范围内纳税的次数,每次纳税的金额、每次纳税的时间,等等。其中,税务信息可以作为用于构建实体的属性的信息。
S103、获取第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单。
其中,第三方黑名单,可以从除目标机构(可以为前述提及的指定机构,如A银行)之外的其它机构(如除A银行之外的B银行或公安部)获取。在一个实施例中,该第三方黑名单可以是其它机构管理的违法违规黑名单,包括违法违规的企业的标识信息,用于唯一标识该违法违规的企业。进一步地,该第三方黑名单还可以包括违法违规的企业的法定代表人的标识信息,用于唯一标识该违法违规的企业的法定代表人。关注名单,可以从目标机构获取或从目标机构的多个业务线中每个业务线获取。关注名单可以包括具有较高风险或高度可疑的企业的标识信息。进一步地,关注名单还可以包括具有较高风险或高度可疑的企业的法定代表人的标识信息。
S104、根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述每个对公客户的第一信息集合、所述第三方黑名单、所述关注名单构建第一知识图谱。
其中,第一知识图谱可以包括多个实体,可以分为以下两大类实体:企业基本信息实体和设备信息实体。
在一个实施例中,计算机设备根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述每个对公客户的第一信息集合、所述第三方黑名单、所述关注名单构建第一知识图谱的方式可以如下:
①计算机设备为至少一个对公客户中的第一对公客户生成涉诉标签,和/或为第一对公客户的法定代表人生成涉诉标签,第一对公客户的第一信息集合包括涉诉信息;计算机设备为至少一个对公客户中的第二对公客户生成涉案标签,和/或为第二对公客户的法定代表人生成涉案标签,第二对公客户的第一信息集合包括涉案信息;计算机设备为至少一个对公客户中的第三对公客户生成黑名单客户标签,和/或为第三对公客户的法定代表人生成黑名单客户标签,第三对公客户的企业标识信息和/或法定代表人的标识信息出现在第三方黑名单中;计算机设备为至少一个对公客户中第四对公客户生成关注名单客户标签,和/或为第四对公客户的法定代表人生成关注名单客户标签,第四对公客户的企业标识信息和/或法定代表人的标识信息出现在关注名单中。
其中,涉诉标签可以包括指示第一对公客户涉诉的标签。在一个实施例中,涉诉标签还可以包括指示第一对公客户涉诉的类型的标签。涉案标签可以包括指示第二对公客户涉案的标签。在一个实施例中,涉案标签还可以包括指示第二对公客户涉案的类型的标签。在一个实施例中,对于至少一个对公客户中没有涉诉信息的对公客户,也可以为没有涉诉信息的对公客户生成指示该对公客户不涉诉的标签,或者也可以不设置。同样,对于至少一个对公客户中没有涉案信息的对公客户,也可以为没有涉案信息的对公客户生成指示该对公客户不涉案的标签。
②计算机设备根据每个对公客户的开户信息、每个对公客户的设备信息、涉诉标签、涉案标签、第三方黑名单客户标签、关注名单客户标签构建第一知识图谱。
其中,企业基本信息实体可以包括企业名称实体和设备信息实体。在一个实施例中,企业名称实体的属性信息可以包括在确定对公企业存在涉诉信息时得到的涉诉标签、在确定对公企业存在涉案信息时得到的涉案标签、在确定对公企业的企业标识信息出现在第三方黑名单时得到的黑名单客户标签、在确定对公企业的企业标识信息出现在关注名单时得到的关注名单客户标签。在一个实施例中,企业名称实体的属性信息还可以包括法定代表人的标识信息。在一个实施例中,企业名称实体的属性信息还可以包括工商信息中的企业注册时间、企业营业期限、企业经营范围等信息。
在一个实施例中,在第一信息集合包括包含企业注册地址在内等信息的工商信息时,企业基本信息实体还可以包括企业注册地址实体。在一个实施例中,在第一信息集合包括股权信息时,企业基本信息实体还可以包括股东姓名实体、控股的企业的名称实体、股权类型实体。在一个实施例中,企业基本信息实体还可以包括法定代表人姓名实体。法定代表人姓名实体的属性信息可以包括在确定对公客户存在涉诉信息时得到的涉诉标签、确定对公客户存在涉案信息时得到的涉案标签、在确定对公客户出现在第三方黑名单客户时得到的黑名单客户标签、在确定对公客户出现在关注名单客户时得到的关注名单客户标签。在一个实施例中,企业基本信息实体还可以包括法定代表人的身份证号实体、法定代表人的手机号实体。
在一个实施例中,计算机设备还可以根据每个对公客户的开户信息、每个对公客户的设备信息、涉诉标签、涉案标签、第三方黑名单客户标签、关注名单客户标签、每个对公客户的股权信息构建第一知识图谱。
在一个实施例中,计算机设备还可以根据每个对公客户的开户信息、每个对公客户的税务信息、每个对公客户的设备信息、涉诉标签、涉案标签、第三方黑名单客户标签、关注名单客户标签、每个对公客户的股权信息构建第一知识图谱。在一个实施例中,计算机设备还可以根据每个对公客户的税务信息生成指示对应对公客户是否缴税的标签。计算机设备还可以根据每个对公客户的开户信息、每个对公客户对应的指示该对公客户是否缴税的标签、每个对公客户的设备信息、涉诉标签、涉案标签、第三方黑名单客户标签、关注名单客户标签、每个对公客户的股权信息构建第一知识图谱。在一个实施例中,企业名称实体的属性信息还可以包括在对应对公客户未缴税时得到的指示对公客户未缴税的标签,
S105、对所述第一知识图谱进行数据处理,以从所述至少一个对公客户中确定出符合预设关注条件的第一对公客户集合。
其中,数据处理可以包括实体属性识别和/或多重关联关系穿透处理。多重关联关系穿透处理可以包括地址穿透处理、法定代表人穿透处理、设备穿透处理、股权穿透处理。
在一个实施例中,当数据处理包括实体属性识别时,第一对公客户集合可以包括符合第一预设关注条件的对公客户。计算机设备对第一知识图谱进行数据处理,以从至少一个对公客户中确定出符合预设关注条件的第一对公客户集合的方式可以为:计算机设备从第一知识图谱包括的每个对公客户对应的企业名称实体中确定出目标企业名称实体,以作为符合第一预设关注条件的对公客户。目标企业名称实体的属性信息包括目标标签,目标标签包括目标涉诉标签、目标涉案标签、黑名单客户标签、关注名单客户标签中的至少一项;和/或,计算机设备从第一知识图谱包括的每个对公客户对应的法定代表人姓名实体中确定出目标法定代表人姓名实体,并将目标法定代表人姓名实体对应的对公客户确定为符合第一预设关注条件的对公客户,目标法定代表人姓名实体的属性信息包括目标标签。其中,目标涉诉标签指示对公客户涉诉且涉诉类型为指定涉诉类型。目标涉案标签指示对公客户涉诉且涉案类型为指定涉案类型。
和/或,当数据处理包括多重关联关系穿透处理时,所述第一对公客户集合包括符合第二预设关注条件的对公客户。计算机设备对第一知识图谱进行数据处理,以从至少一个对公客户中确定出符合预设关注条件的第一对公客户集合的方式可以为:计算机设备对第一知识图谱进行地址穿透处理,以从至少一个对公客户确定出第五对公客户作为符合第二预设关注条件的对公客户,第五对公客户的企业注册地址同时被至少两个企业使用。也就是说,计算机设备可以根据第一知识图谱从至少一个对公客户中确定出第五对公客户作为符合第二预设关注条件的对公客户。若根据第一知识图谱确定一个企业注册地址被至少两个对公客户使用,则确定至少两个对公客户为符合第二预设关注条件的对公客户。或者,若根据第一知识图谱确定一个对公客户的企业注册地址还被其它企业使用,则确定这个对公客户为符合第二预设关注条件的对公客户。
和/或,计算机设备对第一知识图谱进行数据处理,以从至少一个对公客户中确定出符合预设关注条件的第一对公客户集合的方式还可以为:计算机设备对第一知识图谱进行法定代表人穿透处理,以从至少一个对公客户中确定出目标法定代表人对应的对公客户,当目标法定代表人任职的多家企业中存在企业为关注类企业或存在大于预设比例的企业为关注类企业时,确定目标法定代表人对应的对公客户为符合第二预设关注条件的对公客户,目标法定代表人为多家企业的法定代表人。也就是说,计算机设备可以根据第一知识图谱从至少一个对公客户中确定出目标法定代表人对应的对公客户,当目标法定代表人任职的多家企业中存在企业为关注类企业或存在大于预设比例的企业为关注类企业时,确定目标法定代表人对应的对公客户为符合第二预设关注条件的对公客户。在一个实施例中,关注类企业指具有以下特性的企业:涉诉且涉诉类型为指定涉诉类型,和/或涉案且涉案类型为指定涉案类型,和/或是黑名单客户,和/或是关注名单客户。
和/或,计算机设备对第一知识图谱进行数据处理,以从至少一个对公客户中确定出符合预设关注条件的第一对公客户集合的方式还可以为:计算机设备当至少一个对公客户为多个对公客户时,对第一知识图谱进行设备穿透处理,以从多个对公客户中确定出设备信息相同的至少两个对公客户,并当至少两个对公客户中存在第六对公客户或存在大于预设比例的第六对公客户时,将至少两个对公客户中除第六对公客户外的对公客户确定为符合第二预设关注条件的对公客户,第六对公客户的属性信息包括目标标签。也就是说,计算机设备当至少一个对公客户为多个对公客户时,根据第一知识图谱从多个对公客户中确定出设备信息相同的至少两个对公客户,并当至少两个对公客户中存在第六对公客户或存在大于预设比例的第六对公客户时,将至少两个对公客户中除第六对公客户外的对公客户确定为符合第二预设关注条件的对公客户。
和/或,计算机设备对第一知识图谱进行数据处理,以从至少一个对公客户中确定出符合预设关注条件的第一对公客户集合的方式还可以为:计算机设备对第一知识图谱进行股权穿透处理,以确定出与至少一个对公客户中的第七对公客户具有直接和/或间接控股关系的企业,若与第七对公客户具有直接和/或间接控股关系的企业中有企业或有大于预设比例的企业为关注类客户,则确定第七对公客户为符合第二预设关注条件的对公客户,第七对公客户为至少一个对公客户中的任一对公客户。也就是说,计算机设备可以根据第一知识图谱确定出与至少一个对公客户中的第七对公客户具有直接和/或间接控股关系的企业,若与第七对公客户具有直接和/或间接控股关系的企业中有企业或有大于预设比例的企业为关注类客户,则确定第七对公客户为符合第二预设关注条件的对公客户。在一个实施例中,关注类客户指具有以下特性的企业:涉诉且涉诉类型为指定涉诉类型,和/或涉案且涉案类型为指定涉案类型,和/或是黑名单客户,和/或是关注名单客户。例如,假设至少一个对公客户包括企业A,企业A直接或间接控股有企业B,若企业B涉案且涉案类型为指定涉案类型,和/或涉诉且涉诉类型为指定涉诉类型,和/或为黑名单客户,和/或为关注名单客户,则确定企业A为符合第二预设关注条件的对公客户。再如,至少一个对公客户包括企业D,企业D被企业E直接控股或间接控股,若企业E涉案且涉案类型为指定涉案类型,和/或涉诉且涉诉类型为指定涉诉类型,和/或为黑名单客户,和/或为关注名单客户,则确定企业D为符合第二预设关注条件的对公客户。
在一个实施例中,计算机设备还可以当根据第一知识图谱确定目标法定代表人任职多家企业且根据第一知识图谱确定所述的多家企业中存在大于预设比例的企业未缴税时,确定目标法定代表人对应的对公客户为符合第二预设关注条件的对公客户。和/或,计算机设备还可以若与第七对公客户具有直接或间接控股关系的至少一个企业中有大于预设比例的企业未缴税,确定该第七对公客户为符合第二预设关注条件的对公客户。
在一个实施例中,当第六对公客户涉案且涉案类型为指定涉案类型且至少两个对公客户中存在大于第一预设比例的第六对公客户时,将至少两个对公客户中除第六对公客户外的对公客户确定为符合第二预设关注条件的对公客户。当第六对公客户涉诉且涉诉类型为指定涉诉类型且至少两个对公客户中存在大于第二预设比例的第六对公客户时,将至少两个对公客户中除第六对公客户外的对公客户确定为符合第二预设关注条件的对公客户。当第六对公客户为黑名单客户且至少两个对公客户中存在大于第三预设比例的第六对公客户时,将至少两个对公客户中除第六对公客户外的对公客户确定为符合第二预设关注条件的对公客户。当第六对公客户为关注名单客户且至少两个对公客户中存在大于第四预设比例的第六对公客户时,将至少两个对公客户中除第六对公客户外的对公客户确定为符合第二预设关注条件的对公客户。当关注类企业指涉诉且涉诉类型为指定涉诉类型的企业且目标法定代表人任职的多家企业中存在大于第一预设比例的企业为关注类企业,确定目标法定代表人对应的对公客户为符合第二预设关注条件的对公客户。或当关注类企业指涉案且涉案类型为指定涉案类型的企业时且目标法定代表人任职的多家企业中存在大于第二预设比例的企业为关注类企业,确定目标法定代表人对应的对公客户为符合第二预设关注条件的对公客户。或,当关注类企业指为黑名单客户的企业时且目标法定代表人任职的多家企业中存在大于第三预设比例的企业为关注类企业,确定目标法定代表人对应的对公客户为符合第二预设关注条件的对公客户。或,当关注类企业指为关注名单客户的企业时且目标法定代表人任职的多家企业中存在大于第四预设比例的企业为关注类企业,确定目标法定代表人对应的对公客户为符合第二预设关注条件的对公客户。再如,若关注类客户指涉案且涉诉类型为指定涉诉类型的客户且与第七对公客户具有直接和/或间接控股关系的企业中有企业或有大于第一预设比例的企业为关注类客户,则确定第七对公客户为符合第二预设关注条件的对公客户。若关注类客户指涉案且涉案类型为指定涉案类型的客户且与第七对公客户具有直接和/或间接控股关系的企业中有企业或有大于第二预设比例的企业为关注类客户,则确定第七对公客户为符合第二预设关注条件的对公客户。若关注类客户指黑名单客户且与第七对公客户具有直接和/或间接控股关系的企业中有企业或有大于第三预设比例的企业为关注类客户,则确定第七对公客户为符合第二预设关注条件的对公客户。若关注类客户指关注类客户且与第七对公客户具有直接和/或间接控股关系的企业中有企业或有大于第四预设比例的企业为关注类客户,则确定第七对公客户为符合第二预设关注条件的对公客户。
S106、在确定所述至少一个对公客户包括除所述第一对公客户集合之外的第二对公客户集合时,获取所述第二对公客户集合中各个对公客户的第二信息集合,所述第二信息集合与第一信息集合存在不同。
其中,第二信息集合可以包括企业注册地址所在的地域、企业所属行业、法定代表人的特征信息、涉案类型及涉诉类型。在一个实施例中,所述的年龄可以是法定代表人的年龄在多个年龄段中所属的年龄段,在一个实施例中,第二信息集合还可以包括企业注册时间。
在一个实施例中,除了可以根据知识图谱确定出符合预设关注条件的第一对公客户集合外,还可以根据知识图谱确定出符合预设优质条件的第三对公客户集合。也就是说,计算机设备还可以根据第一知识图谱从至少一个对公客户中确定出符合预设优质条件的第三对公客户集合,之后计算机设备可以在确定至少一个对公客户包括除所述第一对公客户集合和第三对公客户集合之外的第二对公客户集合时,获取第二对公客户集合中各个对公客户的第二信息集合。采用上述过程可以确定出至少一个对公客户中需要关注的对公客户以及至少一个对公客户中优质的客户,并获取至少一个对公客户中除需要关注的客户和优质的客户之外的其它对公客户的第二信息集合。
在一个实施例中,第三对公客户集合包括符合第一预设优质条件的对公客户。计算机设备根据知识图谱从至少一个对公客户中确定出满足预设优质条件的第三对公客户集合的方式可以为:计算机设备从至少一个对公客户中确定出股权类型为指定股权类型的对公客户,以作为满足第一预设优质条件的对公客户。指定股权类型可以为国有控股等表明对公客户优质的股权类型。
在一个实施例中,第三对公客户集合包括符合第二预设优质条件的对公客户。计算机设备根据知识图谱从至少一个对公客户中确定出满足预设优质条件的第三对公客户集合的方式还可以为:计算机设备查询每个对公客户的历史评级结果,从至少一个对公客户中确定出历史评级结果为目标历史评级结果(如优质类)的对公客户,以作为满足第二预设优质条件的对公客户。在一个实施例中,历史评级结果可以是由指定机构评估的。
S107、将所述第二对公客户集合中各个对公客户的第二信息集合输入客户评级模型,获得对所述第二对公客户集合中各个对公客户的评级结果。
本申请实施例中,计算机设备可以调用客户评级模型以根据第二对公客户集合中各个对公客户的第二信息集合预测得到第二对公客户集合中各个对公客户的评级结果。在一个实施例中,评级结果可以为优质类、关注类或标准类。某种程度上,评级结果可以一定程度上反映对公客户的风险水平。例如,关注类客户可能往往具有一定风险。
在一个实施例中,所述的客户评级模型可以通过如下方式得到:根据多个样本客户中每个样本客户的开户信息、每个样本客户的设备信息、每个样本客户的第一信息集合、第三方黑名单、关注名单构建第二知识图谱后,对第二知识图谱进行数据处理,以从多个样本客户中确定出第一样本客户集合,并在确定多个样本客户包括除第一样本客户集合之外的第二样本客户集合时,获取第二样本客户集合中每个样本客户的第二信息集合,从而根据第二样本客户集合中每个样本客户的第二信息集合训练初始的深度学习模型,得到训练后的深度学习模型以作为客户评级模型。需要说明的是,所指的第三方黑名单、关注名单等数据,由于会存在信息的更新,因此训练阶段和预测阶段,这些数据包括的内容可能会存在一定差异。其中,构建第二知识图谱的方式可以参考前述第一知识图谱的方式,在此不做赘述。确定第二样本客户集合的方式可以参考前述确定第二对公客户集合的方式,在此不做赘述。
在一个实施例,计算机设备可以获得对第一对公客户集合中各个对公客户的评级结果,如关注类。在一个实施例中,计算机设备可以获得对第二对公客户集合中各个对公客户的评级结果,如标准类。在一个实施例中,计算机设备还可以获得对第三对公客户集合中各个对公客户的评级结果,如优质类。
在一个实施例中,对于第一对公客户集合中各个对公客户以及第二对公集合中评级结果为关注类的对公客户,可以限制这类客户的账户的交易额,如日交易额。在一个实施例中,计算机设备为第一对公客户集合中各个对公客户确定对应的关注等级以及为第三对公客户集合中各个对公客户确定对应的关注等级,根据确定的关注等级为第一对公客户集合中各个对公客户以及为第三对公客户集合中的各个对公客户设置不同的限额。在一个实施例中,计算机设备还可以对至少一个对公客户中的目标对公客户反馈拒绝开户的信息,目标对公客户指在指定机构申请开户的对公客户中,评级结果为关注类的对公客户。
可见,图1所述的实施例中,计算机设备可以获取至少一个对公客户中每个对公客户的开户信息、每个对公客户的设备信息、每个对公客户的第一信息集合、第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单;计算机设备根据每个对公客户的开户信息、每个对公客户的设备信息、每个对公客户的第一信息集合、第三方黑名单、关注名单构建第一知识图谱;计算机设备对第一知识图谱进行数据处理,以从至少一个对公客户中确定出符合预设关注条件的第一对公客户集合,并在确定至少一个对公客户包括除第一对公客户集合之外的第二对公客户集合时,将第二对公客户集合中各个对公客户的第二信息集合输入客户评级模型,获得对第二对公客户集合中各个对公客户的评级结果,上述过程在对对公客户评级的准确性上和适应能力上都有较大程度提升,使得对对公客户风险识别的准确性得到提升。
请参阅图2,为本申请实再一实施例提供的一种信息处理方法的流程示意图。该方法可以用于前述提及的计算机设备。具体地,该方法可以包括以下步骤:
S201、获取至少一个对公客户中每个对公客户的开户信息以及所述每个对公客户的设备信息。
S202、根据所述每个对公客户的开户信息获取所述每个对公客户的第一信息集合。
S203、获取第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单。
S204、根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述每个对公客户的第一信息集合、所述第三方黑名单、所述关注名单构建第一知识图谱。
S205、对所述第一知识图谱进行数据处理,以从所述至少一个对公客户中确定出符合预设关注条件的第一对公客户集合。
S206、在确定所述至少一个对公客户包括除所述第一对公客户集合之外的第二对公客户集合时,获取所述第二对公客户集合中各个对公客户的第二信息集合,所述第二信息集合与第一信息集合存在不同。
其中,步骤S201-S206可以参见图1实施例中的步骤S101-S106,本申请实施例在此不做赘述。
S207、将所述第二对公客户集合中各个对公客户的第二信息集合输入多个客户评级模型以进行评级处理,得到所述第二对公客户集合中各个对公客户的多个第三评级结果。
S208、将第二对公客户集合后各个对公客户的多个第三评级结果中出现次数最多的第三评级结果确定为对所述第二对公客户集合中各个对公客户的评级结果。
在一个实施例中,计算机设备可以获取多个样本客户中每个样本客户的开户信息、每个样本客户的设备信息、每个样本客户的第一信息集合、第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单;计算机设备根据每个样本客户的开户信息、每个样本客户的设备信息、每个样本客户的第一信息集合、第三方黑名单、关注名单构建第二知识图谱;计算机设备对第二知识图谱进行数据处理,以从多个样本客户中确定出第一样本客户集合;计算机设备在确定多个样本客户包括除第一样本客户集合之外的第二样本客户集合时,获取第二样本客户集合中每个样本客户的第二信息集合,并根据第二样本客户集合中每个样本客户的第二信息集合获得第二样本客户集合中每个样本客户的第三信息集合;计算机设备根据第二样本客户集合中每个样本客户的第三信息集合对第二样本客户集合中各个样本客户进行聚类处理,得到多个客户群,并利用多个客户群中每个客户群中各个样本客户的第三信息集合分别训练客户群对应的初始的深度学习模型,如初始的梯度提升XGBoost模型,得到多个训练后的深度学习模型,如训练后的XGBoost模型以作为多个客户评级模型。其中,构建第二知识图谱的方式可以参见构建第一知识图谱的方式,本申请实施例在此不做赘述。数据处理可以包括实体属性识别和/或多重关联关系穿透处理。此处的数据处理的具体方式可以参见前述提及的数据处理的方式,本申请实施例在此不做赘述。计算机设备确定第二样本客户集合的方式可以参见前述提及的确定第二对公客户集合的方式,本申请实施例在此不做赘述。
在一个实施例中,计算机设备根据第二样本客户集合中每个样本客户的第二信息集合获得第二样本客户集合中每个样本客户的第三信息集合的方式可以为:计算机设备将第二信息集合确定为第三信息集合。或,计算机设备对第二样本客户集合中每个样本客户的第二信息集合进行预处理,得到第二样本客户集合中每个样本客户对应的预处理后的第二信息集合,并将第二样本客户集合中每个样本客户对应的预处理后的第二信息集合,确定为第二样本客户集合中每个样本客户的第三信息集合。预处理是对第二信息集合中的一些脏数据(比如缺失值和异常值)进行处理(比如对缺失值和异常值进行识别和填补),等等。
在一个实施例中。计算机设备根据第二样本客户集合中每个样本客户的第三信息集合对第二样本客户集合中各个样本客户进行聚类处理,得到多个客户群的方式可以为计算机设备调用基于密度分布演化的流式聚类(DDE-Stream,Density DistributionEvolution-Based Stream)算法以根据每个样本客户对应的预处理后的第二信息集合对第二样本客户集合中各个样本客户进行网格聚类,得到多个对公客户群。
Gap(K)=E(logDk)-logDk (1)
其中,K为聚类的簇数。在一个实施例中,本申请实施例除了可以用上述聚类算法实现还可以用K-means聚类算法实现,在此不做赘述。
假设多个样本客户包括对公客户1、对公客户2、对公客户3。计算机设备可以获取多个样本客户中每个样本客户的开户信息、每个样本客户的设备信息、每个样本客户的第一信息集合、第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单;计算机设备根据每个样本客户的开户信息、每个样本客户的设备信息、每个样本客户的第一信息集合、第三方黑名单、关注名单构建第二知识图谱;计算机设备对第二知识图谱进行数据处理,以从多个样本客户中确定出第一样本客户集合;计算机设备在确定多个样本客户包括除第一样本客户集合之外的第二样本客户集合时,获取第二样本客户集合中每个样本客户的第二信息集合,并根据第二样本客户集合中每个样本客户的第二信息集合获得第二样本客户集合中每个样本客户的第三信息集合。假设计算机设备根据第二样本客户集合中每个样本客户的第三信息集合对多个对公客户进行聚类处理,得到两个对公客户群,分别为对公客户群1和对公客户群2,对公客户群1包括对公客户1和对公客户2,对公客户群2包括对公客户3。计算机设备可以利用对公客户1的第三信息集合以及对公客户2的第三信息集合共同训练初始的XGBoost模型1,并利用对公客户3的第三信息集合训练初始的XGBoost模型2,以得到训练后的XGBoost模型1和训练后的XGBoost模型2。
在一个实施例中,XGBoost模型的目标函数的二阶Taylor展开式如下:
其中,一阶导数:
/>
其中,二阶导数:
其中,i表示第二样本客户集合中的样本客户i,n为第二样本客户集合的样本客户数量,yi是真实值,是第t-1轮的预测值,xi表示第三信息集合,ft表示第t棵树。
在一个实施例中,可以将召回率和误报比作为对XGBoost模型进行模型效果评估的核心指标。其中:
其中,召回率,用于衡量模型识别出的异常客户占全部异常客户的比例,该值越高标识模型准确率越高;误报比,是查准率的倒数,表示模型正确识别出异常客户所需要执行的判断次数,该值越低表示对正常客户的干扰程度越低,能够避免对正常客户的体验造成影响。
可见,图2实施例中,计算机设备可以训练得到多个训练后的梯度提升模型,并这些梯度提升模型用于共同决策出第二对公客户集合中各个样本客户的评级结果,可以提升评级结果的预测精度。
在一个实施例中,以图3为例对信息处理的大致流程进行阐述。计算机设备可以获取到多个样本客户中每个样本客户的开户信息、每个样本客户的设备信息、每个样本客户的第一信息集合、第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单,然后根据这些数据构建一个知识图谱,通过对这个知识图谱进行数据处理(包括实体属性识别和/多重关联关系穿透处理),可以从多个样本客户中确定出关注类客户,也就是说从多个样本客户中确定出满足预设关注条件的第一样本客户集合。进一步的,还可以从多个样本客户中确定出优质类客户,也就是说从多个样本客户中确定出满足预设优质条件的第三样本客户集合。之后,便可以将多个样本客户中除优质类客户以及关注类客户之外的客户,此处我们称之为标准类客户。可以在确定多个样本客户包括标准类客户时,即在确定多个样本客户中包括除第一样本客户集合以及第三样本客户集合之外的第二样本客户集合时,根据第二样本客户集合中各个样本客户的第二信息集合以用于获取第二样本客户集合中各个样本客户的第三信息集合。在得到第二样本客户集合中各个样本客户的第三信息集合,可以根据第二样本客户集合中各个样本客户的第三信息集合对第二样本集合中各个样本客户进行聚类处理,得到多个客户群。之后,便可以针对每个客户群训练该客户群对应的初始的XGBoost模型,得到每个客户群对应的训练后的XGBoost模型。具体地,可以将每个客户群包括的各个样本客户的第三信息集合输入该客户群对应的初始的XGBoost模型进行训练,得到该客户群对应的训练后的XGBoost模型。之后,便可以使用训练后的XGBoost模型进行评级处理。
下面对本申请涉及的应用场景进行阐述。
在一个应用场景中,企业A的相关人员可以在线上开户。此处的相关人员可能是法定代表人,等等。具体的,企业A的相关人员可以使用电脑等终端打开向指定银行申请开户的页面,并在此页面上输入开户信息。在填写相关信息完毕后,可以基于该页面提交开户申请到计算机设备,该开户申请携带企业A的开户信息。相应地,企业B等企业的相关人员也可以通过这种方式在线上开户,并提交各自的开户信息。通过上述过程,计算机设备可以获取到至少一个对公客户中每个对公客户的开户信息,并获取到每个对公客户发送开户申请所使用的电脑等终端的设备信息。此处的至少一个对公客户包括企业A和企业B等企业。之后,计算机设备可以根据所述开户信息获取所述每个对公客户的第一信息集合。计算机设备还可以获取第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单。再之后,计算机设备可以根据每个对公客户的开户信息、每个对公客户的设备信息、每个对公客户的第一信息集合、第三方黑名单、关注名单构建第一知识图谱,并对第一知识图谱进行数据处理,以从至少一个对公客户中确定出符合预设关注条件的第一对公客户集合;在确定至少一个对公客户包括除第一对公客户集合之外的第二对公客户集合时,获取第二对公客户集合中各个对公客户的第二信息集合,第二信息集合与第一信息集合存在不同。计算机设备将第二对公客户集合中各个对公客户的第二信息集合输入客户评级模型,获得对第二对公客户集合中各个对公客户的评级结果。
在一个应用场景中,企业A的相关人员可以在线下开户。具体企业A的相关人员可以在指定银行的银行柜台提交开户资料以办理开户,银行客户经理可以基于提交的开户资料录入开户信息等信息。相应地,企业B等企业也可以采用这种方式办理开户,银行客户经理同样可以录入企业B等企业的开户信息等信息。计算机设备可以采用上面这种方式获取到包括企业A、企业B等企业的开户信息。企业A的相关人员可以在指定银行的客户端登录企业A的银行账户,计算机设备可以在检测到对企业A的银行账户的登录行为时,获取到企业A的设备信息。或者,除了可以是采用这种方式获取到对公客户的设备信息,也可以采用其它方式获取到对公客户的设备信息,在此不做限制。
在一个应用场景中,可以在获取到对至少一个对公客户中每个对公客户的评级结果之后,对至少一个对公客户中的所有的关注类客户进行限额处理。
在一个应用场景中,对至少一个对公客户中的所有的关注类客户的相关信息进行进一步审核,以确定是否为对公客户开设账户。
本申请涉及区块链技术,例如第三方黑名单和/或关注名单可以是从区块链获取的。
请参阅图4,为本申请提供的一种信息处理装置的结构示意图。该信息处理装置可以用于计算机设备。具体地,该装置可以包括:
获取模块401,用于获取至少一个对公客户中每个对公客户的开户信息以及所述每个对公客户的设备信息。
获取模块401,还用于根据所述每个对公客户的开户信息获取所述每个对公客户的第一信息集合。
获取模块401,还用于获取第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单。
知识图谱构建模块402,用于根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述每个对公客户的第一信息集合、所述第三方黑名单、所述关注名单构建第一知识图谱。
确定模块403,用于对所述第一知识图谱进行数据处理,以从所述至少一个对公客户中确定出符合预设关注条件的第一对公客户集合。
获取模块401,还用于在确定所述至少一个对公客户包括除所述第一对公客户集合之外的第二对公客户集合时,获取所述第二对公客户集合中各个对公客户的第二信息集合,所述第二信息集合与第一信息集合存在不同。
客户评级模块404,用于将所述第二对公客户集合中各个对公客户的第二信息集合输入客户评级模型,获得对所述第二对公客户集合中各个对公客户的评级结果。
在一种可选的实施方式中,所述开户信息包括企业标识信息和法定代表人的标识信息,所述根据所述每个对公客户的开户信息、知识图谱构建模块402,具体用于:
为所述至少一个对公客户中的第一对公客户生成涉诉标签,和/或为所述第一对公客户的法定代表人生成涉诉标签,所述第一对公客户的第一信息集合包括涉诉信息;
为所述至少一个对公客户中的第二对公客户生成涉案标签,和/或为所述第二对公客户的法定代表人生成涉案标签,所述第二对公客户的第一信息集合包括涉案信息;
为所述至少一个对公客户中的第三对公客户生成黑名单客户标签,和/或为所述第三对公客户的法定代表人生成黑名单客户标签,所述第三对公客户的企业标识信息和/或法定代表人的标识信息出现在所述第三方黑名单中;
为所述至少一个对公客户中第四对公客户生成关注名单客户标签,和/或为所述第四对公客户的法定代表人生成关注名单客户标签,所述第四对公客户的企业标识信息和/或法定代表人的标识信息出现在所述关注名单中;
根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述涉诉标签、所述涉案标签、所述第三方黑名单客户标签、所述关注名单客户标签构建第一知识图谱。
在一种可选的实施方式中,所述数据处理包括实体属性识别,所述第一对公客户集合包括符合第一预设关注条件的对公客户,确定模块403,具体用于:
从所述第一知识图谱包括的所述每个对公客户对应的企业名称实体中确定出目标企业名称实体,以作为符合第一预设关注条件的对公客户;所述目标企业名称实体的属性信息包括目标标签;所述目标标签包括目标涉诉标签、目标涉案标签、黑名单客户标签、关注名单客户标签中的至少一项;和/或,
从所述第一知识图谱包括的所述每个对公客户对应的法定代表人姓名实体中确定出目标法定代表人姓名实体,并将所述目标法定代表人姓名实体对应的对公客户确定为符合第一预设关注条件的对公客户,所述目标法定代表人姓名实体的属性信息包括所述目标标签。
在一种可选的实施方式中,所述第一信息集合还包括工商信息和股权信息,所述工商信息包括企业注册地址,所述数据处理包括多重关联关系穿透处理,所述第一对公客户集合包括符合第二预设关注条件的对公客户,确定模块403,还具体用于:
对所述第一知识图谱进行地址穿透处理,以从所述至少一个对公客户确定出第五对公客户作为符合第二预设关注条件的对公客户,所述第五对公客户的企业注册地址同时被至少两个企业使用;和/或,
对所述第一知识图谱进行法定代表人穿透处理,以从至少一个对公客户中确定出目标法定代表人对应的对公客户,当所述目标法定代表人任职的多家企业中存在企业为关注类企业或存在大于预设比例的企业为关注类企业时,确定所述目标法定代表人对应的对公客户为符合第二预设关注条件的对公客户,所述目标法定代表人为所述多家企业的法定代表人;和/或,
当所述至少一个对公客户为多个对公客户时,对所述第一知识图谱进行设备穿透处理,以从所述多个对公客户中确定出设备信息相同的至少两个对公客户,并当所述至少两个对公客户中存在第六对公客户或存在大于预设比例的第六对公客户时,将所述至少两个对公客户中除所述第六对公客户外的对公客户确定为符合第二预设关注条件的对公客户,所述第六对公客户的属性信息包括目标标签;和/或,
对所述第一知识图谱进行股权穿透处理,以确定出与所述至少一个对公客户中的第七对公客户具有直接和/或间接控股关系的企业,若与所述第七对公客户具有直接和/或间接控股关系的企业中有企业或有大于预设比例的企业为关注类客户,则确定所述第七对公客户为符合第二预设关注条件的对公客户,所述第七对公客户为所述至少一个对公客户中的任一对公客户。
在一种可选的实施方式中,客户评级模块404,具体用于:
将所述第二对公客户集合中各个对公客户的第二信息集合输入多个客户评级模型以进行评级处理,得到所述第二对公客户集合中各个对公客户的多个第三评级结果;
将第二对公客户集合后各个对公客户的多个第三评级结果中出现次数最多的第三评级结果确定为对所述第二对公客户集合中各个对公客户的评级结果。
在一种可选的实施方式中,信息处理装置还可以包括聚类模块405和训练模块406。
在一种可选的实施方式中,获取模块401,还用于获取多个样本客户中每个样本客户的开户信息以及所述每个样本客户的设备信息,并获取所述每个样本客户的第一信息集合,并获取第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单。
在一种可选的实施方式中,知识图谱构建模块402,还用于根据所述每个样本客户的开户信息、所述每个样本客户的设备信息、所述每个样本客户的第一信息集合、所述第三方黑名单、所述关注名单构建第二知识图谱。
在一种可选的实施方式中,确定模块403,还用于对所述第二知识图谱进行数据处理,以从所述多个样本客户中确定出第一样本客户集合。
在一种可选的实施方式中,获取模块401,还用于在确定所述多个样本客户包括除所述第一样本客户集合之外的第二样本客户集合时,获取所述第二样本客户集合中每个样本客户的第二信息集合,并根据所述第二样本客户集合中每个样本客户的第二信息集合获得所述第二样本客户集合中每个样本客户的第三信息集合。
在一种可选的实施方式中,聚类模块405,用于根据所述第二样本客户集合中每个样本客户的第三信息集合对所述第二样本客户集合中各个样本客户进行聚类处理,得到多个客户群。
在一种可选的实施方式中,训练模块406,用于利用所述多个客户群中每个客户群中各个样本客户的第三信息集合分别训练所述客户群对应的初始的梯度提升模型,得到多个训练后的梯度提升模型以作为多个客户评级模型。
在一种可选的实施方式中,获取模块401根据所述第二样本客户集合中每个样本客户的第二信息集合获得所述第二样本客户集合中每个样本客户的第三信息集合,具体为对所述第二样本客户集合中每个样本客户的第二信息集合进行预处理,得到所述第二样本客户集合中每个样本客户对应的预处理后的第二信息集合;将所述第二样本客户集合中每个样本客户对应的预处理后的第二信息集合,确定为所述第二样本客户集合中每个样本客户的第三信息集合。
可见,图4所示的实施例中,信息处理装置可以获取至少一个对公客户中每个对公客户的开户信息、每个对公客户的设备信息、每个对公客户的第一信息集合、第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单;信息处理装置根据每个对公客户的开户信息、每个对公客户的设备信息、每个对公客户的第一信息集合、第三方黑名单、关注名单构建第一知识图谱;信息处理装置对第一知识图谱进行数据处理,以从至少一个对公客户中确定出符合预设关注条件的第一对公客户集合,并在确定至少一个对公客户包括除第一对公客户集合之外的第二对公客户集合时,将第二对公客户集合中各个对公客户的第二信息集合输入客户评级模型,获得对第二对公客户集合中各个对公客户的评级结果,在对对公客户评级的准确性上和适应能力上都有较大程度提升,使得对对公客户风险识别的准确性得到提升。
请参阅图5,为本申请实施例提供的一种计算机设备的结构示意图。本实施例中所描述的计算机设备可以包括:一个或多个处理器1000和存储器2000。处理器1000、和存储器2000可以通过总线连接。
处理器1000可以是中央处理模块(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器2000可以是高速RAM存储器,也可为非不稳定的存储器(non-volatilememory),例如磁盘存储器。其中,存储器2000用于存储计算机程序,所述计算机程序包括程序指令,处理器1000被配置用于调用所述程序指令,执行以下步骤:
获取至少一个对公客户中每个对公客户的开户信息以及所述每个对公客户的设备信息;
根据所述每个对公客户的开户信息获取所述每个对公客户的第一信息集合;
获取第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单;
根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述每个对公客户的第一信息集合、所述第三方黑名单、所述关注名单构建第一知识图谱;
对所述第一知识图谱进行数据处理,以从所述至少一个对公客户中确定出符合预设关注条件的第一对公客户集合;
在确定所述至少一个对公客户包括除所述第一对公客户集合之外的第二对公客户集合时,获取所述第二对公客户集合中各个对公客户的第二信息集合,所述第二信息集合与第一信息集合存在不同;
将所述第二对公客户集合中各个对公客户的第二信息集合输入客户评级模型,获得对所述第二对公客户集合中各个对公客户的评级结果。
在一个实施例中,所述开户信息包括企业标识信息和法定代表人的标识信息,在根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述每个对公客户的第一信息集合、所述第三方黑名单、所述关注名单构建第一知识图谱时,处理器1000被配置用于调用所述程序指令,具体执行以下步骤:
为所述至少一个对公客户中的第一对公客户生成涉诉标签,和/或为所述第一对公客户的法定代表人生成涉诉标签,所述第一对公客户的第一信息集合包括涉诉信息;
为所述至少一个对公客户中的第二对公客户生成涉案标签,和/或为所述第二对公客户的法定代表人生成涉案标签,所述第二对公客户的第一信息集合包括涉案信息;
为所述至少一个对公客户中的第三对公客户生成黑名单客户标签,和/或为所述第三对公客户的法定代表人生成黑名单客户标签,所述第三对公客户的企业标识信息和/或法定代表人的标识信息出现在所述第三方黑名单中;
为所述至少一个对公客户中第四对公客户生成关注名单客户标签,和/或为所述第四对公客户的法定代表人生成关注名单客户标签,所述第四对公客户的企业标识信息和/或法定代表人的标识信息出现在所述关注名单中;
根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述涉诉标签、所述涉案标签、所述第三方黑名单客户标签、所述关注名单客户标签构建第一知识图谱。
在一个实施例中,所述数据处理包括实体属性识别,所述第一对公客户集合包括符合第一预设关注条件的对公客户,在对所述第一知识图谱进行数据处理,以从所述至少一个对公客户中确定出符合预设关注条件的第一对公客户集合时,处理器1000被配置用于调用所述程序指令,具体执行以下步骤:
从所述第一知识图谱包括的所述每个对公客户对应的企业名称实体中确定出目标企业名称实体,以作为符合第一预设关注条件的对公客户;所述目标企业名称实体的属性信息包括目标标签;所述目标标签包括目标涉诉标签、目标涉案标签、黑名单客户标签、关注名单客户标签中的至少一项;和/或,
从所述第一知识图谱包括的所述每个对公客户对应的法定代表人姓名实体中确定出目标法定代表人姓名实体,并将所述目标法定代表人姓名实体对应的对公客户确定为符合第一预设关注条件的对公客户,所述目标法定代表人姓名实体的属性信息包括所述目标标签。
在一个实施例中,所述第一信息集合还包括工商信息和股权信息,所述工商信息包括企业注册地址,所述数据处理包括多重关联关系穿透处理,所述第一对公客户集合包括符合第二预设关注条件的对公客户,在对所述第一知识图谱进行数据处理,以从所述至少一个对公客户中确定出符合预设关注条件的第一对公客户集合时,处理器1000被配置用于调用所述程序指令,具体执行以下步骤:
对所述第一知识图谱进行地址穿透处理,以从所述至少一个对公客户确定出第五对公客户作为符合第二预设关注条件的对公客户,所述第五对公客户的企业注册地址同时被至少两个企业使用;和/或,
对所述第一知识图谱进行法定代表人穿透处理,以从至少一个对公客户中确定出目标法定代表人对应的对公客户,当所述目标法定代表人任职的多家企业中存在企业为关注类企业或存在大于预设比例的企业为关注类企业时,确定所述目标法定代表人对应的对公客户为符合第二预设关注条件的对公客户,所述目标法定代表人为所述多家企业的法定代表人;和/或,
当所述至少一个对公客户为多个对公客户时,对所述第一知识图谱进行设备穿透处理,以从所述多个对公客户中确定出设备信息相同的至少两个对公客户,并当所述至少两个对公客户中存在第六对公客户或存在大于预设比例的第六对公客户时,将所述至少两个对公客户中除所述第六对公客户外的对公客户确定为符合第二预设关注条件的对公客户,所述第六对公客户的属性信息包括目标标签;和/或,
对所述第一知识图谱进行股权穿透处理,以确定出与所述至少一个对公客户中的第七对公客户具有直接和/或间接控股关系的企业,若与所述第七对公客户具有直接和/或间接控股关系的企业中有企业或有大于预设比例的企业为关注类客户,则确定所述第七对公客户为符合第二预设关注条件的对公客户,所述第七对公客户为所述至少一个对公客户中的任一对公客户。
在一个实施例中,在将所述第二对公客户集合中各个对公客户的第二信息集合输入客户评级模型,获得对所述第二对公客户集合中各个对公客户的评级结果时,处理器1000被配置用于调用所述程序指令,还执行以下步骤:
将所述第二对公客户集合中各个对公客户的第二信息集合输入多个客户评级模型以进行评级处理,得到所述第二对公客户集合中各个对公客户的多个第三评级结果;
将第二对公客户集合后各个对公客户的多个第三评级结果中出现次数最多的第三评级结果确定为对所述第二对公客户集合中各个对公客户的评级结果。
在一个实施例中,处理器1000被配置用于调用所述程序指令,还执行以下步骤:
获取多个样本客户中每个样本客户的开户信息以及所述每个样本客户的设备信息;
获取所述每个样本客户的第一信息集合;
获取第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单;
根据所述每个样本客户的开户信息、所述每个样本客户的设备信息、所述每个样本客户的第一信息集合、所述第三方黑名单、所述关注名单构建第二知识图谱;
对所述第二知识图谱进行数据处理,以从所述多个样本客户中确定出第一样本客户集合;
在确定所述多个样本客户包括除所述第一样本客户集合之外的第二样本客户集合时,获取所述第二样本客户集合中每个样本客户的第二信息集合;
根据所述第二样本客户集合中每个样本客户的第二信息集合获得所述第二样本客户集合中每个样本客户的第三信息集合;
根据所述第二样本客户集合中每个样本客户的第三信息集合对所述第二样本客户集合中各个样本客户进行聚类处理,得到多个客户群;
利用所述多个客户群中每个客户群中各个样本客户的第三信息集合分别训练所述客户群对应的初始的梯度提升模型,得到多个训练后的梯度提升模型以作为多个客户评级模型。
在一个实施例中,在根据所述第二样本客户集合中每个样本客户的第二信息集合获得所述第二样本客户集合中每个样本客户的第三信息集合时,处理器1000被配置用于调用所述程序指令,具体执行以下步骤:
对所述第二样本客户集合中每个样本客户的第二信息集合进行预处理,得到所述第二样本客户集合中每个样本客户对应的预处理后的第二信息集合;
将所述第二样本客户集合中每个样本客户对应的预处理后的第二信息集合,确定为所述第二样本客户集合中每个样本客户的第三信息集合。
具体实现中,本申请实施例中所描述的处理器1000可执行图2实施例或图3实施例所描述的实现方式,也可执行本申请实施例所描述的实现方式,在此不再赘述。
在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以是两个或两个以上模块集成在一个模块中。上述集成的模块既可以采样硬件的形式实现,也可以采样软件功能模块的形式实现。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的计算机可读存储介质可为易失性的或非易失性的。例如,该计算机存储介质可以为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
其中,本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所揭露的仅为本申请一种较佳实施例而已,当然不能以此来限定本申请之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本申请权利要求所作的等同变化,仍属于本申请所涵盖的范围。
Claims (8)
1.一种信息处理方法,其特征在于,包括:
获取至少一个对公客户中每个对公客户的开户信息以及所述每个对公客户的设备信息;
根据所述每个对公客户的开户信息获取所述每个对公客户的第一信息集合;
获取第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单;
根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述每个对公客户的第一信息集合、所述第三方黑名单、所述关注名单构建第一知识图谱;
对所述第一知识图谱进行数据处理,以从所述至少一个对公客户中确定出符合预设关注条件的第一对公客户集合;
在确定所述至少一个对公客户包括除所述第一对公客户集合之外的第二对公客户集合时,获取所述第二对公客户集合中各个对公客户的第二信息集合,所述第二信息集合与第一信息集合存在不同;
将所述第二对公客户集合中各个对公客户的第二信息集合输入多个客户评级模型以进行评级处理,得到所述第二对公客户集合中各个对公客户的多个第三评级结果;
将第二对公客户集合后各个对公客户的多个第三评级结果中出现次数最多的第三评级结果确定为对所述第二对公客户集合中各个对公客户的评级结果;
其中,所述开户信息包括企业标识信息和法定代表人的标识信息,所述根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述每个对公客户的第一信息集合、所述第三方黑名单、所述关注名单构建第一知识图谱,包括:
为所述至少一个对公客户中的第一对公客户生成涉诉标签,和/或为所述第一对公客户的法定代表人生成涉诉标签,所述第一对公客户的第一信息集合包括涉诉信息;
为所述至少一个对公客户中的第二对公客户生成涉案标签,和/或为所述第二对公客户的法定代表人生成涉案标签,所述第二对公客户的第一信息集合包括涉案信息;
为所述至少一个对公客户中的第三对公客户生成黑名单客户标签,和/或为所述第三对公客户的法定代表人生成黑名单客户标签,所述第三对公客户的企业标识信息和/或法定代表人的标识信息出现在所述第三方黑名单中;
为所述至少一个对公客户中第四对公客户生成关注名单客户标签,和/或为所述第四对公客户的法定代表人生成关注名单客户标签,所述第四对公客户的企业标识信息和/或法定代表人的标识信息出现在所述关注名单中;
根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述涉诉标签、所述涉案标签、所述第三方黑名单客户标签、所述关注名单客户标签构建第一知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述数据处理包括实体属性识别,所述第一对公客户集合包括符合第一预设关注条件的对公客户,所述对所述第一知识图谱进行数据处理,以从所述至少一个对公客户中确定出符合预设关注条件的第一对公客户集合,包括:
从所述第一知识图谱包括的所述每个对公客户对应的企业名称实体中确定出目标企业名称实体,以作为符合第一预设关注条件的对公客户;所述目标企业名称实体的属性信息包括目标标签;所述目标标签包括目标涉诉标签、目标涉案标签、黑名单客户标签、关注名单客户标签中的至少一项;和/或,
从所述第一知识图谱包括的所述每个对公客户对应的法定代表人姓名实体中确定出目标法定代表人姓名实体,并将所述目标法定代表人姓名实体对应的对公客户确定为符合第一预设关注条件的对公客户,所述目标法定代表人姓名实体的属性信息包括所述目标标签。
3.根据权利要求1或2所述的方法,其特征在于,所述第一信息集合还包括工商信息和股权信息,所述工商信息包括企业注册地址,所述数据处理包括多重关联关系穿透处理,所述第一对公客户集合包括符合第二预设关注条件的对公客户,所述对所述第一知识图谱进行数据处理,以从所述至少一个对公客户中确定出符合预设关注条件的第一对公客户集合,包括:
对所述第一知识图谱进行地址穿透处理,以从所述至少一个对公客户确定出第五对公客户作为符合第二预设关注条件的对公客户,所述第五对公客户的企业注册地址同时被至少两个企业使用;和/或,
对所述第一知识图谱进行法定代表人穿透处理,以从至少一个对公客户中确定出目标法定代表人对应的对公客户,当所述目标法定代表人任职的多家企业中存在企业为关注类企业或存在大于预设比例的企业为关注类企业时,确定所述目标法定代表人对应的对公客户为符合第二预设关注条件的对公客户,所述目标法定代表人为所述多家企业的法定代表人;和/或,
当所述至少一个对公客户为多个对公客户时,对所述第一知识图谱进行设备穿透处理,以从所述多个对公客户中确定出设备信息相同的至少两个对公客户,并当所述至少两个对公客户中存在第六对公客户或存在大于预设比例的第六对公客户时,将所述至少两个对公客户中除所述第六对公客户外的对公客户确定为符合第二预设关注条件的对公客户,所述第六对公客户的属性信息包括目标标签;和/或,
对所述第一知识图谱进行股权穿透处理,以确定出与所述至少一个对公客户中的第七对公客户具有直接和/或间接控股关系的企业,若与所述第七对公客户具有直接和/或间接控股关系的企业中有企业或有大于预设比例的企业为关注类客户,则确定所述第七对公客户为符合第二预设关注条件的对公客户,所述第七对公客户为所述至少一个对公客户中的任一对公客户。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取多个样本客户中每个样本客户的开户信息以及所述每个样本客户的设备信息;
获取所述每个样本客户的第一信息集合;
获取第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单;
根据所述每个样本客户的开户信息、所述每个样本客户的设备信息、所述每个样本客户的第一信息集合、所述第三方黑名单、所述关注名单构建第二知识图谱;
对所述第二知识图谱进行数据处理,以从所述多个样本客户中确定出第一样本客户集合;
在确定所述多个样本客户包括除所述第一样本客户集合之外的第二样本客户集合时,获取所述第二样本客户集合中每个样本客户的第二信息集合;
根据所述第二样本客户集合中每个样本客户的第二信息集合获得所述第二样本客户集合中每个样本客户的第三信息集合;
根据所述第二样本客户集合中每个样本客户的第三信息集合对所述第二样本客户集合中各个样本客户进行聚类处理,得到多个客户群;
利用所述多个客户群中每个客户群中各个样本客户的第三信息集合分别训练所述客户群对应的初始的梯度提升模型,得到多个训练后的梯度提升模型以作为多个客户评级模型。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第二样本客户集合中每个样本客户的第二信息集合获得所述第二样本客户集合中每个样本客户的第三信息集合,包括:
对所述第二样本客户集合中每个样本客户的第二信息集合进行预处理,得到所述第二样本客户集合中每个样本客户对应的预处理后的第二信息集合;
将所述第二样本客户集合中每个样本客户对应的预处理后的第二信息集合,确定为所述第二样本客户集合中每个样本客户的第三信息集合。
6.一种信息处理装置,其特征在于,包括:
获取模块,用于获取至少一个对公客户中每个对公客户的开户信息以及所述每个对公客户的设备信息;
所述获取模块,还用于根据所述每个对公客户的开户信息获取所述每个对公客户的第一信息集合;
所述获取模块,还用于获取第三方黑名单以及目标机构的多个业务线中每个业务线的关注名单;
知识图谱构建模块,用于根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述每个对公客户的第一信息集合、所述第三方黑名单、所述关注名单构建第一知识图谱;
确定模块,用于对所述第一知识图谱进行数据处理,以从所述至少一个对公客户中确定出符合预设关注条件的第一对公客户集合;
所述获取模块,还用于在确定所述至少一个对公客户包括除所述第一对公客户集合之外的第二对公客户集合时,获取所述第二对公客户集合中各个对公客户的第二信息集合,所述第二信息集合与第一信息集合存在不同;
客户评级模块,用于将所述第二对公客户集合中各个对公客户的第二信息集合输入多个客户评级模型以进行评级处理,得到所述第二对公客户集合中各个对公客户的多个第三评级结果;将第二对公客户集合后各个对公客户的多个第三评级结果中出现次数最多的第三评级结果确定为对所述第二对公客户集合中各个对公客户的评级结果;
其中,所述知识图谱构建模块,具体用于:
为所述至少一个对公客户中的第一对公客户生成涉诉标签,和/或为所述第一对公客户的法定代表人生成涉诉标签,所述第一对公客户的第一信息集合包括涉诉信息;
为所述至少一个对公客户中的第二对公客户生成涉案标签,和/或为所述第二对公客户的法定代表人生成涉案标签,所述第二对公客户的第一信息集合包括涉案信息;
为所述至少一个对公客户中的第三对公客户生成黑名单客户标签,和/或为所述第三对公客户的法定代表人生成黑名单客户标签,所述第三对公客户的企业标识信息和/或法定代表人的标识信息出现在所述第三方黑名单中;
为所述至少一个对公客户中第四对公客户生成关注名单客户标签,和/或为所述第四对公客户的法定代表人生成关注名单客户标签,所述第四对公客户的企业标识信息和/或法定代表人的标识信息出现在所述关注名单中;
根据所述每个对公客户的开户信息、所述每个对公客户的设备信息、所述涉诉标签、所述涉案标签、所述第三方黑名单客户标签、所述关注名单客户标签构建第一知识图谱。
7.一种计算机设备,其特征在于,包括处理器和存储器,所述处理器和所述存储器相互连接,其中,所述存储器用于存储计算机程序指令,所述处理器被配置用于执行所述程序指令,实现如权利要求1-5任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序指令,所述计算机程序指令被处理器执行时,用于执行如权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111381659.2A CN114022166B (zh) | 2021-11-19 | 2021-11-19 | 一种信息处理方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111381659.2A CN114022166B (zh) | 2021-11-19 | 2021-11-19 | 一种信息处理方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114022166A CN114022166A (zh) | 2022-02-08 |
CN114022166B true CN114022166B (zh) | 2024-04-09 |
Family
ID=80065690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111381659.2A Active CN114022166B (zh) | 2021-11-19 | 2021-11-19 | 一种信息处理方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114022166B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019104868A1 (zh) * | 2017-11-30 | 2019-06-06 | 平安科技(深圳)有限公司 | 客户风险等级确定方法、装置、设备及可读存储介质 |
CN111414485A (zh) * | 2020-03-17 | 2020-07-14 | 北京恒通慧源大数据技术有限公司 | 企业客户关联关系图谱构建方法、装置、存储器和计算机 |
CN112053221A (zh) * | 2020-08-14 | 2020-12-08 | 百维金科(上海)信息科技有限公司 | 一种基于知识图谱的互联网金融团伙欺诈行为检测方法 |
CN113469668A (zh) * | 2021-07-15 | 2021-10-01 | 中国银行股份有限公司 | 基于区块链的对公客户交易限制方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10303999B2 (en) * | 2011-02-22 | 2019-05-28 | Refinitiv Us Organization Llc | Machine learning-based relationship association and related discovery and search engines |
-
2021
- 2021-11-19 CN CN202111381659.2A patent/CN114022166B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019104868A1 (zh) * | 2017-11-30 | 2019-06-06 | 平安科技(深圳)有限公司 | 客户风险等级确定方法、装置、设备及可读存储介质 |
CN111414485A (zh) * | 2020-03-17 | 2020-07-14 | 北京恒通慧源大数据技术有限公司 | 企业客户关联关系图谱构建方法、装置、存储器和计算机 |
CN112053221A (zh) * | 2020-08-14 | 2020-12-08 | 百维金科(上海)信息科技有限公司 | 一种基于知识图谱的互联网金融团伙欺诈行为检测方法 |
CN113469668A (zh) * | 2021-07-15 | 2021-10-01 | 中国银行股份有限公司 | 基于区块链的对公客户交易限制方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114022166A (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111178219A (zh) | 票据识别管理方法、装置、存储介质及电子设备 | |
CN105590055A (zh) | 用于在网络交互系统中识别用户可信行为的方法及装置 | |
CN111738844A (zh) | 基于区块链的资源分配系统、方法以及装置 | |
CN110192217A (zh) | 信息处理装置、信息处理方法以及计算机程序 | |
TW200401210A (en) | System and method for facilitating information collection, storage, and distribution | |
CA3073714C (en) | Method and system for identifying potential fraud activity in a tax return preparation system to trigger an identity verification challenge through the tax return preparation system | |
CN111402061A (zh) | 一种资产管理方法和系统 | |
CN112668859A (zh) | 基于大数据的客户风险评级方法、装置、设备及存储介质 | |
CN111861716B (zh) | 一种基于软件系统的贷中监控预警等级生成方法 | |
US20230316403A1 (en) | System and method for assessment of crypto and digital assests | |
CN110796539A (zh) | 一种征信评估方法及装置 | |
CN112348659A (zh) | 用户风险识别策略的分配方法、装置及电子设备 | |
Sampagnaro et al. | Monitoring in small business lending: How to observe the unobservable | |
El-Bannany | A model to explain intellectual capital disclosure in UAE banks | |
CN111415067A (zh) | 企业及个人信用评级系统 | |
Hatzigeorgiou et al. | Migration and servicification: Do immigrant employees spur firm exports of services? | |
CN112702410B (zh) | 一种基于区块链网络的评估系统、方法及相关设备 | |
Rossoni et al. | The complexity of social capital: the influence of board and ownership interlocks on implied cost of capital in an emerging market | |
CN114022166B (zh) | 一种信息处理方法、装置、计算机设备及存储介质 | |
CN115393036A (zh) | 基于贷后预警模型的贷后预警平台及方法 | |
CN115564591A (zh) | 一种融资产品的确定方法及相关设备 | |
CN109615498A (zh) | 税收数据资源管理方法、装置、设备、系统及介质 | |
Pakenaite et al. | Investigation of the Blockchain’s influence on traditional banking: challenges and opportunities | |
CN115292380A (zh) | 一种数据分析方法、装置、计算机设备及存储介质 | |
CN114091815A (zh) | 资源请求处理方法、装置、系统及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |