CN114399382A - 用户欺诈风险的检测方法、装置、计算机设备及存储介质 - Google Patents
用户欺诈风险的检测方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN114399382A CN114399382A CN202210073536.0A CN202210073536A CN114399382A CN 114399382 A CN114399382 A CN 114399382A CN 202210073536 A CN202210073536 A CN 202210073536A CN 114399382 A CN114399382 A CN 114399382A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- data
- portrait
- risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Biology (AREA)
- Finance (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及数据检测领域,揭示了一种用户欺诈风险的检测方法、装置、计算机设备及存储介质,其中方法包括:获取用户的申请信息,所述申请信息中包括多项项目信息数据;将所述项目信息数据与对应的基准参考值进行映射,计算所述项目信息数据的偏移量;将所述偏移量作为所述项目信息数据对应的画像数据,并根据所述画像数据生成用户画像信息;将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,获取所述相似度满足预设值的待选画像;获取所述待选画像的风险评估系数,根据所述风险评估系数确定所述用户画像信息的欺诈风险。本申请能够多维度,全面地对用户存在的欺诈风险进行检测,提高欺诈风险检测的效率及准确率。
Description
技术领域
本申请涉及到数据检测领域,特别是涉及到一种金融系统中用户欺诈风险的检测方法、装置、计算机设备及存储介质。
背景技术
金融欺诈是指采用虚构事实或者隐瞒事实真相的方法骗取金融机构信用,破坏金融管理秩序的行为,传统的反欺诈系统通过数据库搜索,搜索客户信息是否命中数据库中的风险信息,根据命中的风险信息确定客户的金融欺诈风险,目前检测金融欺诈风险的信息源单一,且需要将各项客户信息在对应的数据库中搜索匹配,数据处理的速度慢,更甚者,部分数据还需要人工比对客户信息与数据库中的数据,导致客户的金融欺诈风险的检测效率低,还存在出现信息遗漏的现象,导致客户的金融欺诈风险的检测准确率低。
发明内容
本申请的主要目的为提供一种金融系统中用户欺诈风险的检测方法、装置、计算机设备及存储介质,旨在解决用户信息是否存在风险的检测效率低、检测准确率低的问题。
为了实现上述发明目的,本申请提出一种金融系统中用户欺诈风险的检测方法,包括:
获取用户的申请信息;
根据自然语言算法识别所述申请信息,获取所述申请信息包含的项目信息数据;
将所述项目信息数据与对应的基准参考值进行映射,得到画像数据,根据所述画像数据生成用户画像信息;
将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,获取所述相似度满足预设值的待选画像;
获取所述待选画像的风险评估系数,根据所述风险评估系数确定所述用户画像信息的欺诈风险。
进一步地,所述根据自然语言算法识别所述申请信息,获取所述申请信息包含的项目信息数据,包括:
根据自然语言算法识别所述申请信息,获取所述申请信息包含的项目信息及所述项目信息的内容范围;
根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
进一步地,所述根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据,包括:
获取所述项目信息的先验知识数据;
将所述自然语言算法配置增加所述先验知识数据,得到先验知识的自然语言算法;
根据所述先验知识的自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
进一步地,所述将所述项目信息数据与对应的基准参考值进行映射,得到画像数据,包括:
识别所述项目信息数据的类型;
根据所述类型从预设的配置文件中匹配计算规则;
将所述项目信息数据与对应的基准参考值基于所述计算规则计算数据偏移量,以对所述项目信息数据进行映射,得到画像数据。
进一步地,所述将所述项目信息数据与对应的基准参考值基于所述计算规则计算数据偏移量,包括:
获取所述计算规则的计算参数及基准参数;
获取所述项目信息数据中与所述计算参数具有相同语义的参数信息,并获取所述参数信息对应的数据值;
将所述数据值配置为所述计算参数的第一参数值;
将所述基准参考值配置为所述基准参数的第二参数值;
根据所述第一参数值、所述第二参数值与所述计算规则进行数据计算,得到所述项目信息数据的数据偏移量。
进一步地,所述将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,包括:
获取所述项目信息数据的风险等级;
根据所述风险等级配置相似权重;
基于模糊匹配算法根据所述相似权重计算预设的画像数据库中与所述用户画像信息的加权平均值,获得所用户述画像信息与预设的画像数据库中的画像的相似度,以进行相似度匹配。
进一步的,所述根据所述风险评估系数确定所述用户画像信息的欺诈风险,包括:
获取所述待选画像的风险评估系数;
获取所述待选画像与所述用户画像信息的相似度;
根据所述风险评估系数与所述相似度进行计算,得到所述用户画像信息的欺诈风险。
本申请还提供一种金融系统中用户欺诈风险的检测装置,包括:
数据获取模块,用于获取用户的欺诈检测申请信息,其中,所述申请信息中包括用户的多项项目信息数据;
数据映射模块,用于将所述项目信息数据与对应的基准参考值进行映射,基于所述基准参考值计算所述项目信息数据的偏移量;
画像计算模块,用于将所述偏移量作为所述项目信息数据对应的画像数据,并根据所述画像数据生成用户画像信息;
画像匹配模块,用于将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,获取所述相似度满足预设值的待选画像;
风险评估模块,用于获取所述待选画像的风险评估系数,根据所述风险评估系数确定所述用户画像信息的欺诈风险。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述金融系统中用户欺诈风险的检测方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述金融系统中用户欺诈风险的检测方法的步骤。
本申请例提供了一种基于用户画像全面、多维度检测用户欺诈风险的方法,首先获取用户的申请信息,然后对获取的用户的申请信息进行欺诈风险的识别、检测;其中,所述申请信息中包括用户的多项项目信息数据,每一部分的项目信息的数据不同,然后获取各个项目信息数据的基准值,将所述项目信息数据与对应的基准参考值进行映射,计算所述项目信息数据与对应的基准参考值的偏移量,将所述偏移量作为所述项目信息数据对应的画像数据,,再根据所述画像数据生成用户画像信息,从而通过不同的项目信息数据多维度、多角度、多层次地描述用户的特征信息,再将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,计算画像之间的相似度,获取所述相似度满足预设值的待选画像,从而对画像进行聚类,聚类后的用户画像数据均与所述用户画像信息的相似度满足预设值,然后获取所述待选画像的风险评估系数,根据所述风险评估系数计算所述用户画像的欺诈风险,将每一个待选画像的风险评估系数与对应的相似度的进行加权平均,得到用户画像信息的欺诈风险,从而多维度,全面地对用户存在的欺诈风险进行检测,提高欺诈风险检测的效率及准确率。
附图说明
图1为本申请金融系统中用户欺诈风险的检测方法的一实施例流程示意图;
图2为本申请金融系统中用户欺诈风险的检测装置的一实施例结构示意图;
图3为本申请计算机设备的一实施例结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例提供一种金融系统中用户欺诈风险的检测方法,包括步骤S10-S50,对于所述金融系统中用户欺诈风险的检测方法的各个步骤的详细阐述如下,所述金融系统中用户欺诈风险的检测方法可以由内置有相应功能的应用程序完成,例如内置于应用程序中的“风险检测”功能,通过该功能使得应用程序能够完成用户是否存在欺诈风险的检测,所述应用程序可以运行于终端设备上或运行于云端服务器中,因而,所述金融系统中用户欺诈风险的检测方法也可以理解为由运行所述应用程序的终端设备或云端服务器完成。
S10、获取用户的欺诈检测申请信息,其中,所述申请信息中包括用户的多项项目信息数据。
本实施例应用于金融系统中用户欺诈风险的监控、管理,随着数字化的不断发展,金融企业将用户的数据以数据化进行记录,包括客户基本信息、人行征信信息、公安信息等数字化数据,并且基于该些数字化数据对用户进行聚类分析,以分析用户可能存在的风险,尤其是金融欺诈风险,所述金融欺诈风险包括使用非法信息申请贷款,使用虚假信息申请借款等,本实施例提供一反欺诈系统,用于对用户提交的申请信息进行欺诈风险的识别、检测,首先获取用户的欺诈检测申请信息,当用户向平台提交数据后,将提交的数据定义为欺诈检测申请信息,平台将用户提交的数据转发至反欺诈系统,反欺诈系统因此获取用户的申请信息;其中,所述申请信息中包括用户的多项项目信息数据,包括用户基本信息、人行征信信息、公安信息、百融信息、汽融信息、司法大数据信息、固话信息、车辆信息、手机实名信息、GPS经纬度信息等数据信息。
S20、将所述项目信息数据与对应的基准参考值进行映射,基于所述基准参考值计算所述项目信息数据的偏移量。
S30、将所述偏移量作为所述项目信息数据对应的画像数据,并根据所述画像数据生成用户画像信息。
本实施例中,当获取所述申请信息包含的项目信息数据之后,获取各个项目信息数据的基准值,将其定义为基准参考值,所述基准参考值为各项信息数据在正常风险范围内的数值,然后将所述项目信息数据与对应的基准参考值进行映射,计算所述项目信息数据与对应的基准参考值的偏移量,所述偏移量为所述项目信息数据的数值与所述基准参考值的相对差值,在一种实施方式中,所述偏移量的计算方式为项目信息数据与所述基准参考值的差值,所述差值在所述基准参考值的百分比数值。然后将所述偏移量作为所述项目信息数据对应的画像数据,即根据所述偏移量转化为项目信息数据的向量,将得到的偏移量作为坐标的终点,并定义一个所有项目信息数据共同的起点,然后根据所述终点与所述起点生成所述项目信息数据的向量,每一个向量即为对应的画像数据,从而得到该项目信息数据对应的画像数据,再根据所述画像数据生成用户画像信息,即生成包含多项不同项目信息数据的用户画像,当接入的申请信息中包含越多的项目信息数据,则生成的用户画像信息具有更多维度的特征,从而多维度、多角度、多层次地描述用户的特征信息。例如对于项目信息数据A,匹配的是A1的基准参考值,对于项目信息数据B,匹配的是B1的基准参考值,所述基准参考值基于深度学习算法得到,具体的,通过采集不同项目信息对应的历史数据,将所述历史数据与对应的时间、风险值建立关联,再配置人工智能学习模型对所述项目信息的历史数据进行深度学习训练,基于人工智能学习模型预测后一时间节点的项目信息数据的风险值相对于前一时间节点的项目信息数据的风险值的变化值,然后与历史数据中真实风险值的变化值进行比较,从而对人工智能学习模型进行训练,使得训练后的人工智能学习模型能够基于现有的数据预测正常风险范围内的数据,得到项目信息数据的基准值。然后根据所述项目信息数据与对应的所述基准参考值计算数据偏移量,根据所述偏移量转化为项目信息数据的向量,从而得到该项目信息数据对应的画像数据。
S40、将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,获取所述相似度满足预设值的待选画像。
本实施例中,在生成用户画像信息,将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,在一种实施方式中,分别计算用户画像信息中每一个项目信息数据对应的画像数据与画像数据库中的第一画像的对应的项目信息数据对应的画像数据的余弦值,再将各项余弦值进行平均计算,得到用户画像信息与第一画像的相似度;。其中,所述画像数据库中存储有大量的用户画像数据,将当前用户画像信息与画像数据库中的用户画像数据进行模糊匹配,具体的,通过计算用户画像信息与画像数据库中的用户画像数据的相似度,当所述用户画像信息与画像数据库中的用户画像数据的相似度满足预设值时,将该用户画像数据对应的用户画像筛选为待选画像,从而对画像信息进行聚类,得到用户画像群,该用户画像群中的用户画像数据均与所述用户画像信息的相似度满足预设值。
S50、获取所述待选画像的风险评估系数,根据所述风险评估系数确定所述用户画像信息的欺诈风险。
本实施例中,在获取所述相似度满足预设值的待选画像,即对用户画像信息进行聚类后,获取所述待选画像的风险评估系数,在生成每一个用户的画像后,对所述画像进行欺诈风险的评估,得到风险评估系数,然后将所述风险评估系数与用户画像进行关联存储,即每一个待选用户均关联有相应的风险评估系数,当对用户画像进行聚类后,便能够从聚类的画像中分析当前的用户画像信息存在的风险,即获取所述待选画像的风险评估系数,根据所述风险评估系数确定所述用户画像信息的欺诈风险。在一种实施方式中,首先获取所述一个待选画像的风险评估系数,然后获取所述待选画像与所述用户画像信息的相似度,将所述风险评估系数与所述相似度进行乘积,得到所述用户画像信息的一个维度的欺诈风险,同样的,对于其他待选画像的风险评估系数,逐一地计算相似度与待选画像的风险评估系数的乘积,从而得到多个维度的欺诈风险,再计算所述多个维度的欺诈风险的平均值,得到用户画像信息的欺诈风险,从而多维度,全面地对用户存在的欺诈风险进行检测,提高欺诈风险检测的效率及准确率。
本实施例提供了一种基于用户画像全面、多维度检测用户欺诈风险的方法,首先获取用户的申请信息,然后对获取的用户的申请信息进行欺诈风险的识别、检测;其中,所述申请信息中包括用户的多项项目信息数据,每一部分的项目信息的数据不同,然后获取各个项目信息数据的基准值,将所述项目信息数据与对应的基准参考值进行映射,计算所述项目信息数据与对应的基准参考值的偏移量,将所述偏移量作为所述项目信息数据对应的画像数据,,再根据所述画像数据生成用户画像信息,从而通过不同的项目信息数据多维度、多角度、多层次地描述用户的特征信息,再将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,计算画像之间的相似度,所述相似度的取值范围限定在(0,1)之间,然后获取所述相似度满足预设值的待选画像,例如,所述预设值为0.8,当所述相似度大于0.8时,筛选出所述画像为待选画像,从而对画像进行聚类,当需要更精确地对画像进行聚类时,可以调高所述预设值,如调高预设值为0.85,聚类后的用户画像数据均与所述用户画像信息的相似度满足预设值,然后获取所述待选画像的风险评估系数,根据所述风险评估系数计算所述用户画像的欺诈风险,其中,待选画像的风险评估系数的取值范围限定在(0,100)之间,,当风险评估系数越高,待选画像对应的用户的金融欺诈风险越高,在一种实施方式中,将每一个待选画像的风险评估系数与对应的相似度的进行加权平均,得到用户画像信息的欺诈风险,待选画像A的风险评估系数A1,对应的相似度D1,待选画像B的风险评估系数B1,对应的相似度D2,则用户画像信息的欺诈风险为Z1=(A1*D1+B1*D2)/2,例如,A1为65,D1为0.7,B1为70,D1为0.8,则Z1=(65*0.7+70*0.8)/2=50.75。从而多维度,全面地对用户存在的欺诈风险进行检测,提高欺诈风险检测的效率及准确率。
在一个实施例中,所述获取用户的申请信息,其中,所述申请信息中包括用户的多项项目信息数据,还包括:
获取用户的申请信息;
根据自然语言算法识别所述申请信息,获取所述申请信息包含的项目信息及所述项目信息的内容范围;
根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
本实施例中,在获取用户的申请信息的过程中,获取用户的申请信息,根据自然语言算法识别所述申请信息,具体的,先识别所述申请信息包含的项目信息,所述项目信息为申请信息中不同的分类,所述项目信息也可以理解为不同机构对应的信息,通过接入不同机构得到对应机构下的数据,所述项目信息数据为所述项目信息下的内容数据。具体的,通过关键词匹配的方式,识别所述申请信息中与关键词相匹配的词语,将匹配得到的词语确定为对应的项目信息,再识别所述项目信息的内容范围,一般的,每一项项目信息的内容处于同一个内容范围中,通过识别得到的两个项目信息,便可确定前一个项目信息的内容范围,基于该方式确定每一项项目信息的内容范围,再根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。从而准确地识别出每一项项目信息包含的内容,以准确地对识别相应的项目信息数据,从而得到准确的项目信息数据,提高用户画像生成的准确率。
在一个实施例中,所述根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据,包括:
获取所述项目信息的先验知识数据;
将所述自然语言算法配置增加所述先验知识数据,得到先验知识的自然语言算法;
根据所述先验知识的自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
本实施例中,在根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据的过程中,申请信息中不同部分的项目信息包含有不同的专属名词,即不同部分项目信息对应的项目信息数据包含有不同的专属名词,为了准确地识别不同部分的项目信息中的项目信息数据,获取所述项目信息的先验知识数据,所述先验知识通过采集该项目信息对应类型下的单词库统计而得到,一种实施方式中,通过采集该项目信息对应的文本数据,对所述文本数据进行拆分,获得文本数据包含的语句和词汇,并对所述语句和词汇进行语义识别,同时去除无效的词汇如“的”,“了”,所述无效词汇为预收集的词汇,然后统计所述语句和词汇的出现概率,将出现概率满足预设值的目标语句和目标词汇作为该项目信息下的先验知识数据。然后将所述自然语言算法配置增加所述先验知识数据,得到先验知识的自然语言算法,再根据所述先验知识的自然语言算法识别所述内容范围内的内容信息,获得所述项目信息的项目信息数据,通过配置有对应专属名词的先验知识的自然语言算法,能够快速、准确地识别出所述内容范围内的内容信息,获取所述内容范围内所需的目标数据作为项目信息数据,从而提高不同项目信息对应的项目信息数据的识别效率及识别准确率。
在一个实施例中,所述基于所述基准参考值计算所述项目信息数据的偏移量,包括:
识别所述项目信息数据的项目类型;
根据所述项目类型从预设的配置文件中匹配计算规则;
将所述项目信息数据与对应的基准参考值基于所述计算规则进行计算,得到所述项目信息数据的数据偏移量。
本实施例中,在基于所述基准参考值计算所述项目信息数据的偏移量的过程中,项目信息数据与基准参考值的映射以项目信息数据与基准参考值的数据偏移量进行表征,并且,不同项目信息数据的映射方式不同,反映为数据偏移量的计算规则不同,具体的,识别所述项目信息数据的项目类型,所述项目类型为项目信息数据对应的项目信息的分类,包括用户个人信息分类、用户人行征信信息分类、用户资产信息分类等。再根据项目类型从预设的配置文件中匹配计算规则,每种类型配置了不同的计算规则,将所述项目信息数据与对应的基准参考值基于所述计算规则计算数据偏移量,以将所述偏移量转化为项目信息数据的向量,从而得到该项目信息数据对应的画像数据。其中,所述计算规则可以在多个维度下的配置不同,在一种实施方式中,所述计算规则的精度要求不同,由于精度要求不同,为一个项目信息数据配置一个计算规则,例如对项目信息数据A的数据偏移量的计算规则为(x+y)/x,项目信息数据B的数据偏移量的计算规则为(50%x+50%y)/x+y,从而为不同的项目信息数据配置符合预设要求的计算规则,通过不同的计算规则,确定不同精度要求下的数据,准确地计算每一个不同的项目信息数据的数据偏移量,从而提高对不同项目信息数据映射为画像数据的准确率。
在一个实施例中,所述将所述项目信息数据与对应的基准参考值基于所述计算规则进行计算,得到所述项目信息数据的数据偏移量,包括:
获取所述计算规则的计算参数及基准参数;
获取所述项目信息数据中与所述计算参数具有相同语义的参数信息,并获取所述参数信息对应的数据值;
将所述数据值配置为所述计算参数的第一参数值;
将所述基准参考值配置为所述基准参数的第二参数值;
根据所述第一参数值、所述第二参数值与所述计算规则进行数据计算,得到所述项目信息数据的数据偏移量。
本实施例中,在将所述项目信息数据与对应的基准参考值基于所述计算规则进行计算,得到所述项目信息数据的数据偏移量的过程中,获取所述计算规则的计算参数及基准参数,然后获取所述项目信息数据中与所述计算参数具有相同语义的参数信息,并获取所述参数信息对应的数据值,具体的,通过语义识别将项目信息数据中与所述计算参数相同语义的信息筛选出来,作为参数信息,然后获取所述参数信息包含的数据值作为所述计算参数对应的数据值,即将所述数据值配置为所述计算参数的第一参数值,然后将所述基准参考值配置为所述基准参数的第二参数值,根据所述第一参数值、所述第二参数值与所述计算规则进行数据计算,即将各个第一参数值、所述第二参数值作为所述计算规则的输入,然后执行所述计算规则,得到所述项目信息数据的数据偏移量,从而提高数据偏移量的自动化计算效率。
在一个实施例中,所述将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,包括:
获取所述项目信息数据的风险等级;
根据所述风险等级配置相似权重;
基于模糊匹配算法根据所述相似权重计算预设的画像数据库中与所述用户画像信息的加权平均值,获得所用户述画像信息与预设的画像数据库中的画像的相似度,以进行相似度匹配。
本实施例中,在将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配的过程中,在不同的场景下,对用户风险评估的方式不同,用户画像的聚类方式不同,表现为不同项目信息影响画像间的相似度的计算,即不同项目信息影响画像间的相似度的权重不同。具体的,获取所述项目信息数据的风险等级,根据所述风险等级配置相似权重,即配置相似度的计算权重,然后基于模糊匹配算法根据所述相似权重计算预设的画像数据库中与所述用户画像信息的加权平均值,获得所用户述画像信息与预设的画像数据库中的画像的相似度,以进行相似度匹配,从而适应不同场景下的相似度计算要求,灵活地配置画像的聚类规则以及阈值的设置,从而提高场景的适应性,提高不同场景下的用户欺诈风险的评估效率。
在一个实施例中,所述根据所述风险评估系数确定所述用户画像信息的欺诈风险,包括:
获取所述待选画像的风险评估系数;
获取所述待选画像与所述用户画像信息的相似度;
根据所述风险评估系数与所述相似度进行计算,得到所述用户画像信息的欺诈风险。
本实施例中,在根据所述风险评估系数确定所述用户画像信息的欺诈风险的过程中,首先获取一个所述待选画像的风险评估系数,然后获取该待选画像与所述用户画像信息的相似度,将所述风险评估系数与所述相似度进行乘积,得到所述用户画像信息的一个维度的欺诈风险,同样的,对于其他待选画像的风险评估系数,逐一地计算相似度与待选画像的风险评估系数的乘积,从而得到多个维度的欺诈风险,再计算所述多个维度的欺诈风险的平均值,得到用户画像信息的欺诈风险,从而多维度,全面地对用户存在的欺诈风险进行检测,提高欺诈风险检测的效率及准确率。
参照图2,本申请还提供一种金融系统中用户欺诈风险的检测装置,包括:
数据获取模块10,用于获取用户的申请信息,其中,所述申请信息中包括用户的多项项目信息数据;
数据映射模块20,用于将所述项目信息数据与对应的基准参考值进行映射,基于所述基准参考值计算所述项目信息数据的偏移量;
画像计算模块30,用于将所述偏移量作为所述项目信息数据对应的画像数据,并根据所述画像数据生成用户画像信息;
画像匹配模块40,用于将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,获取所述相似度满足预设值的待选画像;
风险评估模块50,用于获取所述待选画像的风险评估系数,根据所述风险评估系数确定所述用户画像信息的欺诈风险。
如上所述,可以理解地,本申请中提出的所述金融系统中用户欺诈风险的检测装置的各组成部分可以实现如上所述金融系统中用户欺诈风险的检测方法任一项的功能。
在一个实施例中,所述获取用户的申请信息,其中,所述申请信息中包括用户的多项项目信息数据,还包括:
获取用户的申请信息;
根据自然语言算法识别所述申请信息,获取所述申请信息包含的项目信息及所述项目信息的内容范围;
根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
在一个实施例中,所述根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据,包括:
获取所述项目信息的先验知识数据;
将所述自然语言算法配置增加所述先验知识数据,得到先验知识的自然语言算法;
根据所述先验知识的自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
在一个实施例中,所述基于所述基准参考值计算所述项目信息数据的偏移量,包括:
识别所述项目信息数据的项目类型;
根据所述项目类型从预设的配置文件中匹配计算规则;
将所述项目信息数据与对应的基准参考值基于所述计算规则进行计算,得到所述项目信息数据的数据偏移量。
在一个实施例中,所述将所述项目信息数据与对应的基准参考值基于所述计算规则进行计算,得到所述项目信息数据的数据偏移量,包括:
获取所述计算规则的计算参数及基准参数;
获取所述项目信息数据中与所述计算参数具有相同语义的参数信息,并获取所述参数信息对应的数据值;
将所述数据值配置为所述计算参数的第一参数值;
将所述基准参考值配置为所述基准参数的第二参数值;
根据所述第一参数值、所述第二参数值与所述计算规则进行数据计算,得到所述项目信息数据的数据偏移量。
在一个实施例中,所述将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,包括:
获取所述项目信息数据的风险等级;
根据所述风险等级配置相似权重;
基于模糊匹配算法根据所述相似权重计算预设的画像数据库中与所述用户画像信息的加权平均值,获得所用户述画像信息与预设的画像数据库中的画像的相似度,以进行相似度匹配。
在一个实施例中,所述根据所述风险评估系数确定所述用户画像信息的欺诈风险,包括:
获取所述待选画像的风险评估系数;
获取所述待选画像与所述用户画像信息的相似度;
根据所述风险评估系数与所述相似度进行计算,得到所述用户画像信息的欺诈风险。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是移动终端,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和显示装置及输入装置。其中,该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的输入装置用于接收用户的输入。该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质。该存储介质存储有操作系统、计算机程序和数据库。该计算机设备的数据库用于存放数据。该计算机程序被处理器执行时以实现一种金融系统中用户欺诈风险的检测方法。
上述处理器执行上述的金融系统中用户欺诈风险的检测方法,包括:获取用户的申请信息,其中,所述申请信息中包括用户的多项项目信息数据;将所述项目信息数据与对应的基准参考值进行映射,基于所述基准参考值计算所述项目信息数据的偏移量;将所述偏移量作为所述项目信息数据对应的画像数据,并根据所述画像数据生成用户画像信息;将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,获取所述相似度满足预设值的待选画像;获取所述待选画像的风险评估系数,根据所述风险评估系数确定所述用户画像信息的欺诈风险。
所述计算机设备提供了一种基于用户画像全面、多维度检测用户欺诈风险的方法,首先获取用户的申请信息,然后对获取的用户的申请信息进行欺诈风险的识别、检测;其中,所述申请信息中包括用户的多项项目信息数据,每一部分的项目信息的数据不同,然后获取各个项目信息数据的基准值,将所述项目信息数据与对应的基准参考值进行映射,计算所述项目信息数据与对应的基准参考值的偏移量,将所述偏移量作为所述项目信息数据对应的画像数据,,再根据所述画像数据生成用户画像信息,从而通过不同的项目信息数据多维度、多角度、多层次地描述用户的特征信息,再将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,计算画像之间的相似度,获取所述相似度满足预设值的待选画像,从而对画像进行聚类,聚类后的用户画像数据均与所述用户画像信息的相似度满足预设值,然后获取所述待选画像的风险评估系数,根据所述风险评估系数计算所述用户画像的欺诈风险,将每一个待选画像的风险评估系数与对应的相似度的进行加权平均,得到用户画像信息的欺诈风险,从而多维度,全面地对用户存在的欺诈风险进行检测,提高欺诈风险检测的效率及准确率。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被所述处理器执行时实现一种金融系统中用户欺诈风险的检测方法,包括步骤:获取用户的申请信息,其中,所述申请信息中包括用户的多项项目信息数据;将所述项目信息数据与对应的基准参考值进行映射,基于所述基准参考值计算所述项目信息数据的偏移量;将所述偏移量作为所述项目信息数据对应的画像数据,并根据所述画像数据生成用户画像信息;将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,获取所述相似度满足预设值的待选画像;获取所述待选画像的风险评估系数,根据所述风险评估系数确定所述用户画像信息的欺诈风险。
所述计算机可读存储介质提供了一种基于用户画像全面、多维度检测用户欺诈风险的方法,首先获取用户的申请信息,然后对获取的用户的申请信息进行欺诈风险的识别、检测;其中,所述申请信息中包括用户的多项项目信息数据,每一部分的项目信息的数据不同,然后获取各个项目信息数据的基准值,将所述项目信息数据与对应的基准参考值进行映射,计算所述项目信息数据与对应的基准参考值的偏移量,将所述偏移量作为所述项目信息数据对应的画像数据,,再根据所述画像数据生成用户画像信息,从而通过不同的项目信息数据多维度、多角度、多层次地描述用户的特征信息,再将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,计算画像之间的相似度,获取所述相似度满足预设值的待选画像,从而对画像进行聚类,聚类后的用户画像数据均与所述用户画像信息的相似度满足预设值,然后获取所述待选画像的风险评估系数,根据所述风险评估系数计算所述用户画像的欺诈风险,将每一个待选画像的风险评估系数与对应的相似度的进行加权平均,得到用户画像信息的欺诈风险,从而多维度,全面地对用户存在的欺诈风险进行检测,提高欺诈风险检测的效率及准确率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。
本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。
非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围。
凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种金融系统中用户欺诈风险的检测方法,其特征在于,包括:
获取用户的申请信息,其中,所述申请信息中包括用户的多项项目信息数据;
将所述项目信息数据与对应的基准参考值进行映射,基于所述基准参考值计算所述项目信息数据的偏移量;
将所述偏移量作为所述项目信息数据对应的画像数据,并根据所述画像数据生成用户画像信息;
将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,获取所述相似度满足预设值的待选画像;
获取所述待选画像的风险评估系数,根据所述风险评估系数确定所述用户画像信息的欺诈风险。
2.根据权利要求1所述的金融系统中用户欺诈风险的检测方法,其特征在于,所述获取用户的申请信息,其中,所述申请信息中包括用户的多项项目信息数据,还包括:
获取用户的申请信息;
根据自然语言算法识别所述申请信息,获取所述申请信息包含的项目信息及所述项目信息的内容范围;
根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
3.根据权利要求2所述的金融系统中用户欺诈风险的检测方法,其特征在于,所述根据自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据,包括:
获取所述项目信息的先验知识数据;
将所述自然语言算法配置增加所述先验知识数据,得到先验知识的自然语言算法;
根据所述先验知识的自然语言算法识别所述内容范围内的内容信息,获取所述项目信息的项目信息数据。
4.根据权利要求1所述的金融系统中用户欺诈风险的检测方法,其特征在于,所述基于所述基准参考值计算所述项目信息数据的偏移量,包括:
识别所述项目信息数据的项目类型;
根据所述项目类型从预设的配置文件中匹配计算规则;
将所述项目信息数据与对应的基准参考值基于所述计算规则进行计算,得到所述项目信息数据的数据偏移量。
5.根据权利要4所述的金融系统中用户欺诈风险的检测方法,其特征在于,所述将所述项目信息数据与对应的基准参考值基于所述计算规则进行计算,得到所述项目信息数据的数据偏移量,包括:
获取所述计算规则的计算参数及基准参数;
获取所述项目信息数据中与所述计算参数具有相同语义的参数信息,并获取所述参数信息对应的数据值;
将所述数据值配置为所述计算参数的第一参数值;
将所述基准参考值配置为所述基准参数的第二参数值;
根据所述第一参数值、所述第二参数值与所述计算规则进行数据计算,得到所述项目信息数据的数据偏移量。
6.根据权利要求1所述的金融系统中用户欺诈风险的检测方法,其特征在于,所述将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,包括:
获取所述项目信息数据的风险等级;
根据所述风险等级配置相似权重;
基于模糊匹配算法根据所述相似权重计算预设的画像数据库中与所述用户画像信息的加权平均值,获得所用户述画像信息与预设的画像数据库中的画像的相似度,以进行相似度匹配。
7.根据权利要求1所述的金融系统中用户欺诈风险的检测方法,其特征在于,所述根据所述风险评估系数确定所述用户画像信息的欺诈风险,包括:
获取所述待选画像的风险评估系数;
获取所述待选画像与所述用户画像信息的相似度;
根据所述风险评估系数与所述相似度进行计算,得到所述用户画像信息的欺诈风险。
8.一种金融系统中用户欺诈风险的检测装置,其特征在于,包括:
数据获取模块,用于获取用户的申请信息,其中,所述申请信息中包括用户的多项项目信息数据;
数据映射模块,用于将所述项目信息数据与对应的基准参考值进行映射,基于所述基准参考值计算所述项目信息数据的偏移量;
画像计算模块,用于将所述偏移量作为所述项目信息数据对应的画像数据,并根据所述画像数据生成用户画像信息;
画像匹配模块,用于将所述用户画像信息基于模糊匹配算法在预设的画像数据库中进行相似度匹配,获取所述相似度满足预设值的待选画像;
风险评估模块,用于获取所述待选画像的风险评估系数,根据所述风险评估系数确定所述用户画像信息的欺诈风险。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述金融系统中用户欺诈风险的检测方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述金融系统中用户欺诈风险的检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210073536.0A CN114399382A (zh) | 2022-01-21 | 2022-01-21 | 用户欺诈风险的检测方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210073536.0A CN114399382A (zh) | 2022-01-21 | 2022-01-21 | 用户欺诈风险的检测方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114399382A true CN114399382A (zh) | 2022-04-26 |
Family
ID=81232329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210073536.0A Withdrawn CN114399382A (zh) | 2022-01-21 | 2022-01-21 | 用户欺诈风险的检测方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114399382A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115392937A (zh) * | 2022-10-25 | 2022-11-25 | 成都新希望金融信息有限公司 | 一种用户欺诈风险识别方法、装置、电子设备及存储介质 |
CN115497295A (zh) * | 2022-09-21 | 2022-12-20 | 联通智网科技股份有限公司 | 安全预警方法和装置 |
CN116823274A (zh) * | 2023-08-30 | 2023-09-29 | 杭银消费金融股份有限公司 | 一种应用于金融终端的欺诈风险评估方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140350965A1 (en) * | 2013-05-23 | 2014-11-27 | Stéphane Michael Meystre | Systems and methods for extracting specified data from narrative text |
CN109509093A (zh) * | 2018-10-18 | 2019-03-22 | 中信网络科技股份有限公司 | 一种基于主体画像的交易安全控制方法及系统 |
CN113344433A (zh) * | 2021-06-28 | 2021-09-03 | 平安信托有限责任公司 | 产品匹配方法、装置、电子设备及可读存储介质 |
CN113947076A (zh) * | 2021-10-28 | 2022-01-18 | 平安科技(深圳)有限公司 | 保单数据的检测方法、装置、计算机设备及存储介质 |
-
2022
- 2022-01-21 CN CN202210073536.0A patent/CN114399382A/zh not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140350965A1 (en) * | 2013-05-23 | 2014-11-27 | Stéphane Michael Meystre | Systems and methods for extracting specified data from narrative text |
CN109509093A (zh) * | 2018-10-18 | 2019-03-22 | 中信网络科技股份有限公司 | 一种基于主体画像的交易安全控制方法及系统 |
CN113344433A (zh) * | 2021-06-28 | 2021-09-03 | 平安信托有限责任公司 | 产品匹配方法、装置、电子设备及可读存储介质 |
CN113947076A (zh) * | 2021-10-28 | 2022-01-18 | 平安科技(深圳)有限公司 | 保单数据的检测方法、装置、计算机设备及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115497295A (zh) * | 2022-09-21 | 2022-12-20 | 联通智网科技股份有限公司 | 安全预警方法和装置 |
CN115392937A (zh) * | 2022-10-25 | 2022-11-25 | 成都新希望金融信息有限公司 | 一种用户欺诈风险识别方法、装置、电子设备及存储介质 |
CN116823274A (zh) * | 2023-08-30 | 2023-09-29 | 杭银消费金融股份有限公司 | 一种应用于金融终端的欺诈风险评估方法及装置 |
CN116823274B (zh) * | 2023-08-30 | 2024-01-09 | 杭银消费金融股份有限公司 | 一种应用于金融终端的欺诈风险评估方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114399382A (zh) | 用户欺诈风险的检测方法、装置、计算机设备及存储介质 | |
CN110008349B (zh) | 计算机执行的事件风险评估的方法及装置 | |
JP6402653B2 (ja) | 物体認識装置、物体認識方法、およびプログラム | |
CN107038173B (zh) | 应用查询方法和装置、相似应用检测方法和装置 | |
CN111818198B (zh) | 域名检测方法、域名检测装置和设备以及介质 | |
CN109063921B (zh) | 客户风险预警的优化处理方法、装置、计算机设备和介质 | |
CN110309251B (zh) | 文本数据的处理方法、装置和计算机可读存储介质 | |
CN111897962A (zh) | 一种物联网资产标记方法及装置 | |
CN111046952A (zh) | 标签挖掘模型的建立方法、装置、存储介质及终端 | |
CN112541476A (zh) | 一种基于语义特征提取的恶意网页识别方法 | |
CN114399379A (zh) | 基于人工智能的催收行为识别方法、装置、设备及介质 | |
CN111221960A (zh) | 文本检测方法、相似度计算方法、模型训练方法及装置 | |
CN111274822A (zh) | 语义匹配方法、装置、设备及存储介质 | |
CN112241554A (zh) | 基于差分隐私指数机制的模型窃取防御方法和装置 | |
CN112990989B (zh) | 价值预测模型输入数据生成方法、装置、设备和介质 | |
CN112035775B (zh) | 基于随机森林模型的用户识别方法、装置和计算机设备 | |
CN109660621A (zh) | 一种内容推送方法及服务设备 | |
CN117351334A (zh) | 图像审核方法和相关设备 | |
CN110705603B (zh) | 动态判断用户请求数据相似度的方法及系统 | |
CN109409091B (zh) | 检测Web页面的方法、装置、设备以及计算机存储介质 | |
CN113177603B (zh) | 分类模型的训练方法、视频分类方法及相关设备 | |
CN113962302A (zh) | 一种基于标签分布学习的敏感数据智能识别方法 | |
CN114528908A (zh) | 网络请求数据分类模型训练方法、分类方法及存储介质 | |
CN114692785B (zh) | 行为分类方法、装置、设备及存储介质 | |
CN117811835B (zh) | 一种基于人工智能的涉诈网址检测系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220426 |