CN109767327A

CN109767327A - 基于反洗钱的客户信息采集及其使用方法

Info

Publication number: CN109767327A
Application number: CN201811567202.9A
Authority: CN
Inventors: 王晓艳; 谢翠萍
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-12-20
Filing date: 2018-12-20
Publication date: 2019-05-17

Abstract

本申请涉及大数据领域内的一种基于反洗钱的客户信息采集及其使用方法，所述方法包括：获取多种维度的客户信息以及历史交易信息；所述客户信息包括基本信息；根据所述基本信息爬取关联人员的信息；将所述多种维度的客户信息、关联人员的信息以及历史交易信息写入大数据平台；通过大数据平台提取与反洗钱相关的多个监控特征以及对应的特征字段；利用所述监控特征以及对应的特征字段对预先建立的模型进行训练，得到用于反洗钱的监控模型。采用本方法能够有效提高反洗钱工作效率。

Description

基于反洗钱的客户信息采集及其使用方法

技术领域

本申请涉及计算机技术领域，特别是涉及一种基于反洗钱的客户信息采集及其使用方法、装置、计算机设备和存储介质。

背景技术

在对交易信息进行反洗钱的风险监控时，通常是利用规则模型对交易信息进行初步分析，再将分析结果发送给反洗钱调查人员进行复核。由于规则模型的精度较低，反洗钱调查人员还需要手动收集多种信息，以便对相应的可疑交易进行确认。由于可疑交易涉及到的关联信息范围较广，人工收集的工作量较大，给反洗钱工作造成不便，导致反洗钱工作的效率较低。

发明内容

基于此，有必要针对上述技术问题，提供一种能够有效提高反洗钱工作效率的基于反洗钱的客户信息采集及其使用方法、装置、计算机设备和存储介质。

一种基于反洗钱的客户信息采集及其使用方法，所述方法包括：

获取多种维度的客户信息；所述客户信息包括基本信息；

根据所述基本信息爬取关联人员的信息；

将所述多种维度的客户信息以及关联人员的信息写入大数据平台；

通过大数据平台提取与反洗钱相关的多个监控特征以及对应的特征字段；

利用所述监控特征以及对应的特征字段对预先建立的模型进行训练，得到用于反洗钱的监控模型。

在其中一个实施例中，在所述将所述多种维度的客户信息以及关联人员的信息写入大数据平台之后，所述方法还包括：

获取多个风险画像标签；

根据所述风险画像标签通过大数据平台搜索相应客户信息；

利用所述风险画像标签以及搜索到的客户信息生成客户风险画像；

通过所述客户风险画像进行客户风险评估。

在大数据平台中获取多个资金账户的信息；

对所述多个资金账户的信息进行聚类，得到风险资金账户；

对所述风险资金账户对应的客户标识进行风险评分；

当所述风险评分达到预设值时，将所述客户标识记录至黑名单。

在其中一个实施例中，所述根据所述交易信息在大数据平台搜索关联信息包括：

对多个黑名单客户名称进行分词处理，得到对应的黑名单词语；

在监听到交易信息中获取相应的客户标识；

对所述客户标识进行分词，得到多个客户标识词语；

将所述客户标识词语与所述黑名单词语进行匹配，得到相依的匹配度；

当所述匹配度达到阈值时，确认所述客户标识为黑名单客户。

在其中一个实施例中，所述方法还包括：

当监听到与所述客户信息相关的交易信息时，根据所述交易信息在大数据平台搜索关联信息；

将所述交易信息、所述关联信息输入至所述监控模型，所述监控模型利用所述交易信息与所述关联信息进行可疑交易的识别。

一种基于反洗钱的客户信息采集及其使用装置，所述装置包括：

采集模块，用于通过多种途径采集多种维度的客户信息；所述客户信息包括基本信息；根据所述基本信息爬取关联人员的信息；

存储模块，用于将所述多种维度的客户信息以及关联人员的信息写入大数据平台；

提取模块，用于通过大数据平台提取与反洗钱相关的多个监控特征以及对应的特征字段；

模型构建模块，用于利用所述监控特征以及对应的特征字段对预先建立的模型进行训练，得到用于反洗钱的监控模型。

在其中一个实施例中，所述装置还包括：评估模块，用于获取多个风险画像标签；根据所述风险画像标签通过大数据平台搜索相应客户信息；利用所述风险画像标签以及搜索到的客户信息生成客户风险画像；通过所述客户风险画像进行客户风险评估。

在其中一个实施例中，所述装置还包括：分析模块，用于当监听到与所述客户信息相关的交易信息时，根据所述交易信息在大数据平台搜索关联信息；将所述交易信息、所述关联信息输入至所述监控模型，所述监控模型利用所述交易信息与所述关联信息进行可疑交易的识别。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述各个方法实施例中的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述各个方法实施例中的步骤。

上述基于反洗钱的客户信息采集及其使用方法、装置、计算机设备和存储介质，

通过多种途径采集多种维度的客户信息，并且爬取与客户相关的关联人员的信息，将采集到的客户信息以及关联人员的信息导入大数据平台。由此使得大数据平台中汇集了与客户相关的不同维度、不同关系的多种信息。通过在大数据平台中提取多个监控特征对应的特征字段，利用监控特征与监控字段进行模型训练，由此能够得到适用于反洗钱的监控模型。由于监控模型是利用大数据平台的搜索结果进行训练，有效扩大了训练数据的范围，能够有效提高监控模型的准确性。在反洗钱的过程中，无需人工手动收集信息，可以直接从大数据平台搜索关联信息，不仅有效扩大了数据参考范围，而且利用该监控模型能够快速准确的进行可疑交易的识别,有效提高了反洗钱工作的效率。

附图说明

图1为一个实施例中基于反洗钱的客户信息采集及其使用方法的应用场景图；

图2为一个实施例中基于反洗钱的客户信息采集及其使用方法的流程示意图；

图3为一个实施例中客户风险评估步骤的流程示意图；

图4为一个实施例中生成黑名单步骤的流程示意图；

图5为一个实施例中基于反洗钱的客户信息采集及其使用装置的结构框图；

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的基于反洗钱的客户信息采集及其使用方法，可以应用于如图1所示的应用环境中。其中，服务器102通过网络与多种数据库服务器106进行通信。服务器102通过网络与多种第三方网络服务器108进行通信。其中，服务器102可以用独立的服务器或者是多个服务器组成的服务器集群来实现。服务器102从多种数据库服务器106的源数据库中将客户信息以及历史交易信息同步至本地的目的数据库。服务器从多种第三方网络服务器108爬取网络公开信息、征信信息、经营信息以及出入境信息等。服务器102还从多种数据库服务器106的源数据库中获取与客户具有社会关系的关联人员的信息，以及从多种第三方网络服务器108爬取与客户具有社会关系的关联人员的多种信息。服务器102将多种维度的客户信息以及关联人员的信息写入大数据平台。服务器102上预先建立了反洗钱的模型，服务器102通过大数据平台提取与反洗钱相关的多个监控特征以及对应的特征字段，利用所述监控特征以及对应的特征字段对预先建立的模型进行训练，得到用于反洗钱的监控模型。

在一个实施例中，如图2所示，提供了一种基于反洗钱的客户信息采集及其使用方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

步骤202，获取多种维度的客户信息以及历史交易信息；客户信息包括基本信息。

对反洗钱的可疑交易进行分析时，需要用到多种维度的客户信息以及历史交易信息。多种维度的客户信息包括：客户基本信息、网络公开信息、征信信息、经营信息以及出入境信息等。

服务器中部署了数据库，该数据库也可以称为目的数据库。服务器可以从多个源数据库中将客户基本信息与历史信息交易信息同步至目的数据库中。其中，客户基本信息包括了客户办理业务时提交的多种基本信息以及在办理业务过程中采集到的生物特征信息。基本信息中包括客户名称、年龄、性别、地址、联系方式等。生物特征信息包括人脸、指纹、声纹等。历史信息交易信息可以是客户在柜面办理业务时产生的交易信息，也可以是客户在线办理业务时产生的交易信息。不同的源数据库中可以存储不同业务类型的交易信息。业务类型包括银行、保险、证券、基金、贷款等多种。服务器还可以将多个源数据库的黑名单进行同步至目的数据库中。

服务器还可以通过多个第三方网站爬取与客户相关的多种文章，在多种文章中提取与反洗钱的监控特征相对应的内容。服务器在文章中提取到内容包括客户的正面信息也包括负面信息。具体的，服务器可以对爬取到的文章进行语义分析以及分词处理，得到多个词语。服务器对多个词语进行过滤，在过滤后的词语中提取与监控特征对应的词语，监控特征可以是用来识别可疑交易的特征。

此外，服务器还可以第三方网站爬取客户的征信信息、经营信息以及出入境信息等。

步骤204，根据基本信息爬取关联人员的信息。

步骤206，将多种维度的客户信息、关联人员的信息以及历史交易信息写入大数据平台。

服务器还可以采集与客户具有社会关系的关联人员的信息。社会关系可以包括家庭成员关系、亲戚关系、上下属关系、投资关系、供应商关系等等。具体的，服务器可以根据客户的基本信息获取到关联人员标识。服务器在目的数据库中查询关联人员标识对应的信息，包括基本信息以及历史信息交易信息等。服务器还可以通过第三方平台爬取与关联人员标识对应的网络公开信息、征信信息、经营信息以及出入境信息等。

服务器将采集到的多种维度的客户信息以及多种维度的关联人员的信息导入大数据平台。大数据平台中可以采用Hadoop数据库，对导入的信息进行保存。其中，Hadoop数据库中可以根据业务领域进行分区，每个分区内可以保存相应业务领域内的信息。每个分区都可以建立相应的分区索引，通过分区索引可以在分区内快速查询相应的信息。

步骤208，通过大数据平台提取与反洗钱相关的多个监控特征以及对应的特征字段。

步骤210，利用监控特征以及对应的特征字段对预先建立的模型进行训练，得到用于反洗钱的监控模型。

服务器上预先建立了监控模型，该监控模型具有多个监控特征，每个监控特征对应多个特征字段。服务器通过大数据平台可以提取多个监控特征对应的多个特征字段。其中，服务器可以在大数据平台中搜索多种历史交易信息，利用特征字段对历史交易信息进行过滤。比如，对缺省值的字段、对不相关或负相关的字段、对不能体现监控特征的字段进行过滤。服务器根据过滤后的交易信息以及监控特征在大数据平台中搜索其他的关联信息。其他的关联信息可以是客户的其他交易信息、经营信息、征信信息以及具有社会关系的人员的信息等。服务器利用大数据平台的搜索结果，按照监控特征以及对应的特征字段对预先建立的监控模型进行训练，由此得到用于反洗钱的监控模型。

本实施例中，通过多种途径采集多种维度的客户信息，并且爬取与客户相关的关联人员的信息，将采集到的客户信息以及关联人员的信息导入大数据平台。由此使得大数据平台中汇集了与客户相关的不同维度、不同关系的多种信息。通过在大数据平台中提取多个监控特征对应的特征字段，利用监控特征与监控字段进行模型训练，由此能够得到适用于反洗钱的监控模型。由于监控模型是利用大数据平台的搜索结果进行训练，有效扩大了训练数据的范围，能够有效提高监控模型的准确性。在反洗钱的过程中，无需人工手动收集信息，可以直接从大数据平台搜索关联信息，不仅有效扩大了数据参考范围，而且利用该监控模型能够快速准确的进行可疑交易的识别,有效提高了反洗钱工作的效率。

在一个实施例中，在将多种维度的客户信息以及关联人员的信息写入大数据平台之后，该方法还包括：客户风险评估的步骤。如图3所示，该步骤具体包括：

步骤302，获取多个风险画像标签。

步骤304，根据风险画像标签通过大数据平台搜索相应客户信息。

步骤306，利用风险画像标签以及搜索到的客户信息生成客户风险画像。

步骤308，通过客户风险画像进行客户风险评估。

服务器还可以利用大数据平台搜索客户的多种信息，生成客户风险画像。具体的，服务器获取多个风险画像标签，通过大数据平台获取与画像标签相关联的数据，包括用户基本信息、历史信息可疑交易信息、与客户相关人员信息、交易异常风险特征等。其中，用户基本信息包括用户的姓名、性别、联系方式、交易信息、行为数据等。历史信息可疑交易信息包括该客户所有的可疑交易的数据。交易异常风险特征包括短期内频繁发生资金收付、交易金额接近大额交易标准、短期内资金分散转入集中转出等。服务器可以利用画像标签以及对应的数据生成每个客户的客户风险画像。

服务器利用客户风险画像对客户进行风险评估。其中，不同的交易类型所呈现的交易风险特征不同。服务器根据历史信息可疑交易信息提取相应的交易类型。服务器上可以预先建立了多个风险评分模型，不同的交易类型对应不同的风险评分模型。服务器根据交易类型选择相应的交易风险特征以及交易异常风险特征、用户基本信息、与相关人员信息等输入风险评分模型，进行风险评分。不同的风险评分模型可以得到不同的风险标签和得分，将得分达到风险阈值的一个或多个风险标签记录为客户风险标签。例如，风险阈值为70分，地下洗钱行为的风险评分为85分，非法集资的风险评分为75分。85分和75分均大于阈值70分，则将地下洗钱、非法集资作为客户的风险标签。

本实施例中，通过大数据平台能够搜索到与风险画像标签对应的多种客户信息，从而使得客户风险画像更能准确反映客户状况。由此能够通过客户画像对客户进行全面的风险评估。

在一个实施例中，在将多种维度的客户信息以及关联人员的信息写入大数据平台之后，该方法还包括：生成黑名单的步骤。如图4所示，该步骤具体包括：

步骤402，在大数据平台中获取多个资金账户的信息。

步骤404，对多个资金账户的信息进行聚类，得到风险资金账户。

步骤406，对风险资金账户对应的客户标识进行风险评分。

步骤408，当风险评分达到预设值时，将客户标识记录至黑名单。

服务器在大数据平台中获取不同客户的多种资金账户的信息，包括资金流入账户、资金流出账户、交易类型、资金往来记录等。服务器根据资金往来记录对多种资金账户的信息进行聚类分析。聚类结果包括正常聚类和风险聚类。聚类结果包括正常资金账户以及风险资金账户。

服务器可以根据风险资金账户之间的资金往来关系，提取风险聚类的类别特征，包括交易频率特征、交易金额特征、交易次数特征、资金进出特征(快进快出，集中进分散出)。服务器还可以根据风险资金账户的基本信息(资金账户所在地、资金账户所处年龄阶段分布等)提取风险聚类的类别特征，包括资金账户所在地集中度、资金账户所处年龄阶段等。

服务器上预先建立了黑名单评分模型。服务器将客户标识对应的风险聚类的风险特征输入至黑名单评分模型，得到相应的风险评分。当风险评分达到黑名单阈值(预设值)时，服务器将相应的客户标识记录至黑名单中。由此可以通过大数据分析，综合资金账户的对应的多种信息，能够准确识别到客户的风险，从而能够生成准确的黑名单。

进一步的，在服务器生成黑名单之后，还可以根据黑名单客户标识在大数据平台中搜索相应的生物特征，将生物特征添加至黑名单中。其中，生物特征包括人脸以及指纹等。由于生物特征通常是与客户唯一对应的，在黑名单中添加生物特征之后，可以直接利用生物特征进行黑名单匹配。从而能够有效提高黑名单匹配的准确性。

在一个实施例中，根据交易信息在大数据平台搜索关联信息包括：获取交易信息中的客户标识以及多个交易字段；获取与监控模型对应的多个监控特征；根据客户标识以及监控特征在大数据平台搜索与交易字段相关联的特征字段。

在大数据平台中存储了与客户相关联的多种数据，包括客户基本信息、历史信息交易信息、关联交易、征信信息以及风险管理信息等多种。服务器在数据库中获取了交易信息之后，可以在大数据平台中搜索关联数据。

具体的，交易信息中包括了客户标识以及多个交易字段。交易字段包括交易类型、交易金额、交易时间、交易对象等。针对反洗钱的可疑交易，在服务器上预先设置了多项监控特征。其中包括客户基本信息、交易频繁、休眠账户大额交易、交易金额超过预设值(如500万RMB)、交易地址虚假、交易账户过期、关联交易、是否属于黑名单客户、是否与黑名单客户有资金往来等。每项监控特征都包括多个特征字段。监控特征也可以视为监控的维度。不同的监控特征即为不同的维度。服务器根据客户标识在大数据平台中搜索与客户标识相关联的多种特征字段。由此可以得到与该交易信息多个维度的关联数据，不再局限于同一客户的历史信息交易信息，扩大了识别可疑交易的数据范围，从而能够有效提高可疑交易识别的准确性。

在其中一个实施例中，根据交易信息在大数据平台搜索关联信息还包括：对多个黑名单客户名称进行分词处理，得到对应的黑名单词语；在监听到交易信息中获取相应的客户标识；对客户标识进行分词，得到多个客户标识词语；将客户标识词语与黑名单词语进行匹配，得到相依的匹配度；当匹配度达到阈值时，确认客户标识为黑名单客户。

在判断是否属于黑名客户时，传统的方式是将客户名称与黑名单进行模糊匹配，但是模糊匹配容易造成误报或者漏报。为了有效提高黑名单匹配的准确性，服务器可以对客户标识(客户名称)进行语义分析以及智能分词，以此进行黑名单匹配。具体的，服务器可以预先对黑名单客户标识进行分词处理，得到对应的黑名单词语。服务器通过对黑名称客户标识进行语义分析，对每个黑名单词语赋予相应的权重。当服务器监听到交易信息时，获取交易信息中的客户标识，对客户标识进行分词，得到多个客户标识词语。服务器将客户标识词语与黑名单词语进行匹配，根据匹配到的黑名单词语的权重计算得到相应的匹配度。当匹配度达到阈值时，确认客户标识为黑名单客户标识。例如，服务器对其中一个黑名单客户名称进行分词，得到对应的A、B、C、D四个黑名单词语。服务器通过语义分析，对待匹配的客户名称进行分词后，得到A、C两个客户名称词语。A、B、C、D可以有相应的权重，如果A与C的权重之和达到阈值，则确定当前交易信息中的客户属于黑名单客户，否则，不属于黑名单客户。通过语义分析以及分词处理之后，在对分词得到的词语进行黑名单匹配，有效提高了黑名单匹配的准确性。

此外，为了进一步提高黑名单匹配的准确性，服务器还可以在通过多种途径采集客户的生物特征。黑名单中除了可以包括客户名称之外还可以包括客户的生物特征。当服务器监听到交易信息时，在交易信息中提取客户的生物特征，作为待匹配生物特征。服务器将待匹配生物特征与黑名单中的多个生物特征进行匹配，若匹配度达到阈值，则确定当前交易信息中的客户属于黑名单客户，否则，不属于黑名单客户。

在一个实施例中，该方法还包括：当监听到与客户信息相关的交易信息时，根据交易信息在大数据平台搜索关联信息；将交易信息、关联信息输入至监控模型，监控模型利用交易信息与关联信息进行可疑交易的识别。

服务器通过监听脚本对交易状况进行监听，当监听到有新的交易发生时，服务器获取相应的交易信息。交易信息中包括客户标识以及多个交易字段。交易字段包括交易类型、交易金额、交易时间、交易对象等。

服务器可以将搜索到的与客户标识相关联的特征字段以及交易字段输入至监控模型。监控模型根据交易字段以及多个特征字段调用相应的反洗钱规则，利用反洗钱规则对交易字段以及特征字段进行规则判断，得到相应的规则得分。监控模型将多项规则得分进行累加，得到与交易信息对应的监控得分。监控模型将监控得分与阈值进行比较，当监控得分超过阈值时，则将交易信息标记为可疑交易。

在其中一个实施例中，利用交易信息与关联信息进行可疑交易的识别包括：根据交易字段以及多个特征字段输入监控模型，通过监控模型调用相应的反洗钱规则；利用反洗钱规则对交易字段以及特征字段进行规则判断，得到相应的规则得分；将多项规则得分进行累加，得到与交易信息对应的监控得分；当监控得分超过阈值时，将交易信息标记为可疑交易。

服务器将当前交易信息中的交易字段以及大数据平台搜索到的多个特征字段输入至监控模型之后，监控模型根据交易字段以及多个特征字段调用相应的反洗钱规则。一个交易字段或特征字段可以调用一条反洗钱规则，也可以调用多条反洗钱规则。每项反洗钱规则都预先设置了相应的分数。监控模型根据被调用的反洗钱规则，获取每条反洗钱规则对应的规则得分。监控模型可以将多项规则得分进行累加，得到交易信息对应的监控得分。

在不同的交易信息中，具体的交易字段可以不同。大数据平台中搜索到的与客户标识相关联的多维度的特征字段也可以不同。例如，对于交易A，在大数据平台中搜索到的多维度的特征字段包括：账户休眠时间、账户活跃时间、账户活跃后的收款次数、收款金额以及收款时间、客户本人职业、客户本人收入、客户家庭成员职业及收入、客户亲属职业及收入等。通过多维度的特征字段，可以发现该账户为休眠4年长期不动，半年前开始活跃，先后5次有大额资金(20万以上)收付。客户本人目前失业没有收入，客户妻子为普通工人，月收入5千，客户的一位亲戚有贩毒记录。监控模型根据交易字段与多维度的特征字段，调用相应的反洗钱规则进行判断，每条反洗钱规则对应的规则得分，将多项规则得分进行累加，得到交易信息对应的监控得分。假设监控得分为90分，超过阈值60分，以此识别出该笔交易为可疑交易。

在其中一个实施例中，将多项规则得分进行累加，得到与交易信息对应的监控得分包括：获取监控特征对应的权重；权重通过逻辑回归模型对多项监控特征进行运算后得到的；利用权重对反洗钱规则评分进行修正；将修正后的规则得分进行累加，得到与交易信息对应的监控得分。

每项监控特征可以视为一个维度，服务器利用历史信息数据进行逻辑回归处理，得到每个维度对应的得分区间，得分区间可以是离散、线性或者正态分布。服务器根据这些得分区间，选择每个维度对应的分值，将该分值作为维度对应的权重，即监控特征对应的权重。不同监控特征之间的权重可以相同，也可以不同。同一监控特征的不同特征字段可以设置为相同的权重。

服务器利用权重对每项反洗钱规则评分分别进行修正，将修正后的规则得分进行累加，得到与交易信息对应的监控得分。由于不同维度的监控特征在反洗钱识别中重要程度不同，通过对反洗钱规则评分进行修正，可以针对不同的维度的监控特征进行调节，由此能够得到更加合理的监控得分，从而能够更加有效地提高识别可疑交易的准确性。

应该理解的是，虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图5所示，提供了一种基于反洗钱的客户信息采集及其使用装置，包括：采集模块502、存储模块504、提取模块506、模型构建模块508，其中：

采集模块502，用于通过多种途径采集多种维度的客户信息；客户信息包括基本信息；根据基本信息爬取关联人员的信息。

存储模块504，用于将多种维度的客户信息以及关联人员的信息写入大数据平台。

提取模块506，用于通过大数据平台提取与反洗钱相关的多个监控特征以及对应的特征字段。

模型构建模块508，用于利用监控特征以及对应的特征字段对预先建立的模型进行训练，得到用于反洗钱的监控模型。

在一个实施例中，装置还包括：评估模块，用于获取多个风险画像标签；根据风险画像标签通过大数据平台搜索相应客户信息；利用风险画像标签以及搜索到的客户信息生成客户风险画像；通过客户风险画像进行客户风险评估。

在一个实施例中，装置还包括：黑名单生成模块，用于在大数据平台中获取多个资金账户的信息；对多个资金账户的信息进行聚类，得到风险资金账户；对风险资金账户对应的客户标识进行风险评分；当风险评分达到预设值时，将客户标识记录至黑名单。

在一个实施例中，提取模块还用于对多个黑名单客户名称进行分词处理，得到对应的黑名单词语；在监听到交易信息中获取相应的客户标识；对客户标识进行分词，得到多个客户标识词语；将客户标识词语与黑名单词语进行匹配，得到相依的匹配度；当匹配度达到阈值时，确认客户标识为黑名单客户。

在一个实施例中，该装置还包括：分析模块，用于当监听到与客户信息相关的交易信息时，根据交易信息在大数据平台搜索关联信息；将交易信息、关联信息输入至监控模型，监控模型利用交易信息与关联信息进行可疑交易的识别。

在一个实施例中，分析模块还用于根据交易字段以及多个特征字段输入监控模型，通过监控模型调用相应的反洗钱规则；利用反洗钱规则对交易字段以及特征字段进行规则判断，得到相应的规则得分；将多项规则得分进行累加，得到与交易信息对应的监控得分；当监控得分超过阈值时，将交易信息标记为可疑交易。

关于基于反洗钱的客户信息采集及其使用装置的具体限定可以参见上文中对于基于反洗钱的客户信息采集及其使用方法的限定，在此不再赘述。上述基于反洗钱的客户信息采集及其使用装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和信息库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储多维度的客户信息等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于反洗钱的客户信息采集及其使用方法。

本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述各个方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、信息库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双信息率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种基于反洗钱的客户信息采集及其使用方法，所述方法包括：

获取多种维度的客户信息以及历史交易信息；所述客户信息包括基本信息；

根据所述基本信息爬取关联人员的信息；

将所述多种维度的客户信息、关联人员的信息以及历史交易信息写入大数据平台；

2.根据权利要求1所述的方法，其特征在于，在所述将所述多种维度的客户信息以及关联人员的信息写入大数据平台之后，所述方法还包括：

获取多个风险画像标签；

根据所述风险画像标签通过大数据平台搜索相应客户信息；

通过所述客户风险画像进行客户风险评估。

3.根据权利要求1所述的方法，其特征在于，在所述将所述多种维度的客户信息以及关联人员的信息写入大数据平台之后，所述方法还包括：

在大数据平台中获取多个资金账户的信息；

对所述多个资金账户的信息进行聚类，得到风险资金账户；

对所述风险资金账户对应的客户标识进行风险评分；

4.根据权利要求1所述的方法，其特征在于，所述根据所述交易信息在大数据平台搜索关联信息包括：

在监听到交易信息中获取相应的客户标识；

对所述客户标识进行分词，得到多个客户标识词语；

5.根据权利要求1至4任一项所述的方法，其特征在于，所述方法还包括：

6.一种基于反洗钱的客户信息采集及其使用装置，其特征在于，所述装置包括：

采集模块，用于获取多种维度的客户信息；所述客户信息包括基本信息；根据所述基本信息爬取关联人员的信息；

7.根据权利要求6所述的装置，其特征在于，所述装置还包括：评估模块，用于获取多个风险画像标签；根据所述风险画像标签通过大数据平台搜索相应客户信息；利用所述风险画像标签以及搜索到的客户信息生成客户风险画像；通过所述客户风险画像进行客户风险评估。

8.根据权利要求6所述的装置，其特征在于，所述装置还包括：分析模块，用于当监听到与所述客户信息相关的交易信息时，根据所述交易信息在大数据平台搜索关联信息；将所述交易信息、所述关联信息输入至所述监控模型，所述监控模型利用所述交易信息与所述关联信息进行可疑交易的识别。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。