CN109272398B - 一种操作请求处理系统 - Google Patents
一种操作请求处理系统 Download PDFInfo
- Publication number
- CN109272398B CN109272398B CN201811058711.9A CN201811058711A CN109272398B CN 109272398 B CN109272398 B CN 109272398B CN 201811058711 A CN201811058711 A CN 201811058711A CN 109272398 B CN109272398 B CN 109272398B
- Authority
- CN
- China
- Prior art keywords
- characteristic data
- calculation module
- data
- operation request
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请提供了一种操作请求处理系统,其中,操作请求处理系统能够获取操作请求、所述操作请求对应的操作特征数据和所述操作请求对应的用户特征数据;根据所述用户特征数据确定用户特征参数;根据操作特征数据与用户特征参数得到第一特征数据;将操作特征数据映射到对应的第一特征数据的向量空间,得到第三特征数据;根据第一特征数据与对应的所述第三特征数据得到第四特征数据,根据第四特征数据确定所述操作请求是欺诈请求的概率值,在所述操作请求是欺诈请求的概率大于预定阈值时,判定所述操作请求为欺诈操作请求。本申请的一种操作请求处理系统能够很好的利用用户特征数据,大幅度地提高欺诈用户识别率,降低正常用户误判率。
Description
技术领域
本申请涉及计算机信息技术领域,尤其是涉及一种操作请求处理系统。
背景技术
互联网的快速发展以及智能终端的普及,使得人们在使用电子银行办理查询余额、转账、购物支付、理财等业务时获得了极大的便捷,但同时伴随的则是电子银行面临的安全隐患和遭到恶意侵害带来的风险。
目前业内的操作请求处理系统防控策略一般使用两种实现方案:一是基于专家规则的方法,单纯的专家规则难以适应现在的操作请求处理系统的需求,二是采用机器学习算法对业务全流程的风险特征进行机器学习以及对历史数据进行离线分析。
现有的基于机器学习的方法是把机器学习算法模型不加改造的直接应用到当前的场景中来,虽然相对于专家规则在一定程度上避免了人为的主观性,但其在训练模型的时候使用的是方式是直接把所有用户的行为特征数据进行混合训练,虽然相对于专家规则在一定程度上避免了人为的主观性,但是现有技术中的机器学习算法没有考虑到电子银行的用户特征,并没有很好的对用户特征数据进行建模,而是把所有用户的操作特征数据混合使用训练反欺诈模型,因此,现有的反欺诈模型对欺诈操作行为的识别准确率较低。
发明内容
本申请提出了一种操作请求处理系统,能够很好的利用用户特征数据,提高欺诈用户识别率,降低正常用户误判率。
第一方面,本申请实施例提供了一种操作请求处理系统,包括:
获取模块用于获取操作请求、所述操作请求对应的操作特征数据和所述操作请求对应的用户特征数据;
第一计算模块用于根据所述用户特征数据以及每个用户特征数据的权重,确定用户特征参数;
第二计算模块用于根据所述操作特征数据与所述用户特征参数,确定所述操作请求是欺诈请求的概率值,在所述操作请求是欺诈请求的概率大于预定阈值时,判定所述操作请求为欺诈操作请求。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,包括:
第一计算模块具体用于将每个所述用户特征数据进行加权处理,并将加权处理后的用户特征数据相加,得到用户特征参数;
所述第一计算模块还用于将所述用户特征参数映射到预定数值范围内。
结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中第二计算模块具体用于执行:
将每个所述操作特征数据分别与所述用户特征参数相乘,得到多个第一特征数据;
根据所有的所述第一特征数据确定所述操作请求是欺诈请求的概率值。
结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中还包括:
获取模块还用于获取所述操作请求对应的操作类型;
第三计算模块用于根据所述操作类型,对所述操作特征数据进行分类;
第四计算模块用于将每种操作类型的操作特征数据对应的第一特征数据进行拼接,得到第二特征数据;
第二计算模块还用于根据所述第二特征数据与所述用户特征参数,确定所述操作请求是欺诈请求的概率值。
结合第一方面的第三种可能的实施方式,本申请实施例提供了第一方面的第四种可能的实施方式,其中还包括:
第三计算模块用于将每个操作特征数据转换为非线性化特征数据;
第二计算模块还用于根据每个所述非线性化特征数据与所述用户特征参数,确定所述操作请求是欺诈请求的概率值。
结合第一方面第一种可能的实施方式,本申请实施例提供了第一方面的第五种可能的实施方式,其中所述预定数值范围为大于或等于0,并且所述预定数值范围小于或等于1。
结合第一方面第二种可能的实施方式,本申请实施例提供了第一方面的第六种可能的实施方式,其中还包括:
第五计算模块用于将所述每个操作特征数据映射到对应的第一特征数据的向量空间,得到多个第三特征数据;
第六计算模块用于对所述第一特征数据与对应的所述第四特征数据进行加权求和,得到第四特征数据;
第二计算模块还用于根据所述第四特征数据,确定所述操作请求是欺诈请求的概率值。
结合第一方面的第六种可能的实施方式,本申请实施例提供了第一方面的第七种可能的实施方式,其中第四计算模块还用于将不同操作类型的第四特征数据依次进行拼接,得到所述第二特征数据。
结合第一方面、第一方面第一到第七中可能的实施方式,本申请实施例提供了第一方面的第八种可能的实施方式,其中还包括:
数据模块用于将所述欺诈操作请求对应的用户的所有历史操作请求、所述历史操作请求对应的历史操作特征数据和所述历史操作请求对应的历史用户特征数据写入数据库。
本申请相对于传统的机器学习方法,合理的利用用户特征数据,帮助反欺诈系统大幅度地提高欺诈用户识别率,降低正常用户误判率。
进一步,为了更好地利用用户特征数据对操作特征数据进行合理化地过滤,更全面的对操作特征数据进行分析,本申请将使用用户特征数据过滤的操作特征数据和没有使用用户特征数据过滤的操作特征数据进行了加权求和,根据不同的权重参数,调整使用用户特征数据对操作特征数据进行过滤的强度,从而使反欺诈使用范围更广,进一步提高欺诈用户识别率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例一所提供的电子银行反欺诈方法的流程图;
图2示出了本申请实施例二所提供的电子银行反欺诈方法的流程图;
图3示出了本申请实施例三所提供的电子银行反欺诈方法的流程图;
图4示出了本申请实施例四所提供的电子银行反欺诈方法的流程图;
图5示出了本申请实施例五所提供的电子银行反欺诈系统的结构示意图;
图6示出了本申请实施例六的电子银行反欺诈系统具体应用于手机银行时的网络结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种电子银行反欺诈方法进行详细介绍。
实施例一
本实施例提供了一种电子银行反欺诈方法,该方法可以应用于各种电子银行业务中,例如用于网上银行、手机银行、直销银行和/或微信银行业务中。
具体的,如图1所示,本实施例的方法包括如下步骤:
S101:获取模块获取操作请求,所述操作请求对应的操作特征数据和所述操作请求对应的用户特征数据。
这里,所述用户特征数据包括但不限于所述操作请求对应的用户的年龄特征数据、收入特征数据和职业特征数据。
S102第一计算模块用于根据所述用户特征数据以及每个用户特征数据的权重,确定用户特征参数。
这里,具体利用如下步骤确定所述用户特征参数:
第一计算模块具体用于将每个所述用户特征数据进行加权处理,并将加权处理后的用户特征数据相加,得到用户特征参数;将所述用户特征参数映射到预定数值范围内。
这里,第一计算模块可以使用常用的机器学习算法中的任一种算法,例如在用于手机银行业务中时,具体的可以使用神经元激活函数sigmoid(x)。
具体的,例如在用于手机银行业务中时,用户特征数据包括年龄特征数据、职业特征数据和收入特征数据,第一计算模块使用的计算公式如下:
sigmoid(T_age*V_age+T_profession*V_profession+T_salary*V_salary)
神经元激活函数sigmoid(x)公式如下:
sigmoid(x)=1/(1+e^(-x))
其中,V_age、V_profession和V_salary分别是所述用户特征数据中的年龄特征数据、收入特征数据和职业特征数据。T_age、T_profession和T_salary分别是年龄特征数据、收入特征数据和职业特征数据对应的权重,对年龄特征数据、收入特征数据和职业特征数据进行加权计算。权重T_age,T_profession,T_salary的取值代表了不同种类的用户特征数据对于所述操作特征数据影响力的大小,而对用户特征数据进行加权求和的计算结果则代表了综合了用户的年龄、收入、职业等用户特征数据对于操作请求影响力的大小。之后,使用神经元激活函数sigmoid(x)对其进行计算,并将其映射到预定数值范围,具体的,例如预定数值范围为[0,1]之间,得到用户特征参数。也就是说,所述用户特征参数的数值范围在[0,1]之间。
这里,实施例一举例的用户特征数据包括所述操作请求对应的用户的年龄特征数据、收入特征数据和职业特征数据。但是,本申请应用的其他实施例中,还可以包括其他的用户特征数据,包括用户风险偏好、用户消费能力等。
S103第二计算模块用于根据所述操作特征数据与所述用户特征参数,确定所述操作请求是欺诈请求的概率值,在所述操作请求是欺诈请求的概率大于预定阈值时,判定所述操作请求为欺诈操作请求。
这里,第二计算模块具体用于执行如下步骤:将每个所述操作特征数据分别与所述用户特征参数相乘,得到多个第一特征数据;根据所有的所述第一特征数据确定所述操作请求是欺诈请求的概率值。
这里,还可以包括如下步骤:第三计算模块用于将每个操作特征数据转换为非线性化特征数据;第二计算模块还用于根据每个所述非线性化特征数据与所述用户特征参数,确定所述操作请求是欺诈请求的概率值。
这里,第三计算模块可以使用任一常用的机器学习算法,具体的,例如在用于手机银行业务中时,第三计算模块使用的算法公式如下:
tanh(W_behavior*V_behavior)
具体的,tanh(x)=(e^x-e^(-x))/(e^x+e^(-x))
其中V_behavior为所述操作特征数据,W_behavior为操作特征数据对应的参数矩阵,W_behavior*V_behavior得到操作请求对应的操作特征数据向量,经过神经元激活函数tanh(x)之后整个操作特征数据向量被赋予了非线性特性,更有利于反欺诈算法模型对于操作特征数据中特征的提取。
具体的,例如在用于手机银行业务中时,第二计算模块根据每个所述非线性化特征数据与所述用户特征参数,确定所述操作请求是欺诈请求的概率值的公式如下:
Gate_behavior=tanh(W_behavior*V_behavior)*sigmoid(T_age*V_age+T_profession*V_profession+T_salary*V_salary)
这里,第二计算模块可以使用任一常用的机器学习算法,具体的,例如在用于手机银行业务中时,可以使用神经元激活函数sigmoid(x)等神经元算法。
具体的,例如在用于手机银行业务中时,整个反欺诈算法模型使用交叉熵损失函数,公式如下所示:
L(x)=∑_(i=1)^n(y_(i)logσ(x_i)+(1-y_i)log(1-σ(x_i)))
其中n代表了样本数量,σ(x)代表了神经元激活函数sigmoid(x)。
这里,当计算得到的操作请求是欺诈操作的概率值大于预定阈值时,即所述操作请求为欺诈操作请求时,数据模块用于将所述欺诈操作请求对应的用户的所有历史操作请求、所述历史操作请求对应的历史操作特征数据和所述历史操作请求对应的历史用户特征数据写入数据库。数据模块将所述欺诈操作请求的拦截信息和所述欺诈请求对应的概率值写入数据库。
所述获取模块定时获取所述数据库。
根据数据库分别对所述第一计算模块、所述第二计算模块和所述第三计算模块根据所述数据库进行算法模型训练,得到所述第一计算模块、所述第二计算模块和所述第三计算模块中参数的新数值。
具体的,例如在用于手机银行业务中时,使用数据库对所述第一计算模块、所述第二计算模块和所述第三计算模块根据所述数据库进行算法模型训练,并使用训练后得到的W_behavior,T_age,T_profession,T_salary等参数的新数值更新第一计算模块、第二计算模块和第三计算模块。
这里,在进行所述操作请求是欺诈请求的概率值的计算之前,可以对操作特征数据和用户特征数据进行数据预处理操作。具体的,例如在用于手机银行业务中时,需要对操作特征数据V_behavior和用户特征数据,V_age、V_profession和V_salary进行数据预处理操作,所述数据预处理操作包括如下步骤:
首先将所述操作特征数据和所述用户特征数据向量化处理,所述向量化处理调用算法将不是数值表示的所述特征数据和所述历史特征数据对应成0和1组成的向量。因为原始特征数据形式不规范,不利于计算机进行自动化处理,而数据的向量化表示是把不规范的特征数据转化为格式一致的方便于计算机处理的形式;对于数值的特征则直接使用其对应的数值表示,将不是数值表示的特征数据对应成0和1组成的向量。
将向量化的所述操作特征数据和所述用户特征数据进行数据清洗处理,所述数据清洗处理清除欺诈数据和填充缺失数据。因为特征数据在采集和传输的过程中可能出现错误与丢失,因此,数据清洗处理清除欺诈数据和填充缺失数据。
将清洗后的所述操作特征数据和所述用户特征数据进行数据增强处理,所述数据增强处理调用算法增加欺诈操作请求在所述历史操作请求中的比例。经过清洗的数据中的正负样本很不均衡,即正常用户行为数量远大于欺诈用户的行为数量,不均衡的样本会给模型的训练带来很大的困难,因此反复进行数据增强操作可以生成任意数量的欺诈用户数据,增加欺诈用户的样本数据量,最后控制生成的欺诈用户数据量和正常用户数据量之间的比例在预设范围。
将数据增强后的所述操作特征数据和所述用户特征数据进行特征筛选处理,所述特征筛选处理去掉冗余的所述特征数据和所述历史特征数据。特征筛选的目的是为了进行特征的降维,把重要程度较低的特征去掉,以便模型训练速度的提升和模型识别准确率的提高。
将特征筛选后的所述操作特征数据和所述用户特征数据进行标准化处理,所述标准化处理将所述特征数据和所述历史特征数据映射到向量空间。所述标准化处理将特征数据映射到向量空间,目的是消除不同特征之间的量纲影响,能更加有利于识别欺诈用户和模型的训练。
实施例二
由于操作请求具有不同的操作类型,每个操作类型对应的操作特征数据具有不同的特点和重要程度,因此设计一个针对不同操作类型的实施例,定制化的设定年龄、收入、职业等用户特征数据对不同类型的操作特征数据过滤程度的大小,能够更加合理地进行欺诈概率值的计算。
如图2所示是本申请所述的一种电子银行反欺诈方法的实施例二,包括如下步骤:
S201:获取模块获取操作请求,所述操作请求对应的操作特征数据和所述操作请求对应的用户特征数据,获取所述操作请求对应的操作类型。
这里,所述操作类型包括注册、登录、转账、缴费或消费等。
并且,例如在用于手机银行业务中时,具体的可以将操作类型分为两大类,包括基础操作和业务操作;所述基础操作包括注册或登录;所述业务操作包括转账、缴费或消费。
S202第三计算模块根据所述操作类型对所述操作特征数据进行分类。
具体的,对应操作类型的操作特征数据包括Vbehavior_注册、Vbehavior_登录、Vbehavior_转账、V behavior_缴费以及V behavior_消费子特征数据。
这里,第三计算模块对每种操作类型的操作特征数据转换为非线性化特征数据;
即,分类后,针对不同操作类型的特征数据,具体的例如针对转账这一操作类型的特征数据,根据V behavior_转账这组特征数据进行计算。具体的,例如在用于手机银行业务中时,其公式为:
tanh(Wbehavior_转账*Vbehavior_转账)
S203:第二计算模块用于将每个所述操作特征数据分别与所述用户特征参数相乘,得到多个第一特征数据。
例如针对转账这一操作类型的特征数据,第二计算模块使用S202步骤得到的针对转账的非线性特征数据进行计算,与所述用户特征参数相乘得到对应转账这一操作类型的第一特征数据。具体的,例如在用于手机银行业务中时,其公式为:
Gatebehavior_转账=tanh(Wbehavior_转账*Vbehavior_转账)*sigmoid(T_age*V_age+T_profession*V_profession+T_salary*V_salary)。
S204:第四计算模块将每个操作类型的第一特征数据进行拼接,得到第二特征数据。
具体的,例如在用于手机银行业务中时,将注册、登录、转账、缴费和消费的操作类型根据步骤S201到S203计算得到的对应五种操作类型的第一特征数据进行拼接,生成第二特征数据:[Gatebehavior_注册;Gatebehavior_登录;Gatebehavior_转账;Gatebehavior_缴费;Gatebehavior_消费]。
S205:第二计算模块还用于根据所述第二特征数据与所述用户特征参数,确定所述操作请求是欺诈请求的概率值。
具体的,例如在用于手机银行业务中时,根据步骤S204得到的第二特征数据[Gatebehavior_注册;Gatebehavior_登录;Gatebehavior_转账;Gatebehavior_缴费;Gatebehavior_消费]进行计算,得到所述操作请求是欺诈请求的概率值。
这里,当计算得到的概率值大于预定阈值时,即所述操作请求为欺诈操作请求时,数据模块将所述欺诈操作请求对应的用户的历史操作请求、所述历史操作请求对应的历史操作特征数据和所述历史操作请求对应的历史用户特征数据写入数据库;具体的,预定阈值为专家阈值,是专家根据经验设定的。
所述获取模块定时获取所述数据库。
所述第一计算模块、所述第二计算模块、所述第三计算模块根据所述数据库进行算法模型训练,得到算法模型中参数的新数值。在实施例二的算法模型训练时,对历史操作特征数据根据操作类型进行分类,具体的,例如在用于手机银行业务中时,得到对应五种操作类型注册、登录、转账、缴费和消费的历史操作特征数据,利用对应五种操作类型的历史操作特征数据分别对相应操作类型的算法进行算法模型训练。
具体的,例如在用于手机银行业务中时,使用数据库对第一计算模块、所述第二计算模块、所述第三计算模块进行算法模型训练,得到上述Wbehavior_注册、Wbehavior_登录、Wbehavior_转账、Wbehavior_缴费、Wbehavior_消费、T_age、T_profession、T_salary等算法模型参数的新数值。
实施例三
如图3所示的是本申请的电子银行反欺诈方法的另一种实施例,其包括如下步骤:
S301获取模块获取操作请求,所述操作请求对应的操作特征数据和所述操作请求对应的用户特征数据。
S302第一计算模块用于根据所述用户特征数据以及每个用户特征数据的权重,确定用户特征参数。第二计算模块将每个所述操作特征数据分别与所述用户特征参数相乘,得到多个第一特征数据。
这里,步骤S301和S302的具体操作与实施例一完全相同。
S303第五计算模块用于将所述每个操作特征数据映射到对应的第一特征数据的向量空间,得到多个第三特征数据。
这里,相比于步骤S301和S302提取针对用户特征数据的操作请求行为特征,使用第五计算模块提取操作特征数据中更能反映通用行为的特征,第五计算模块可以使用任一机器学习算法,具体的,例如在用于手机银行业务中时,可以使用的算法公式如下:
L_behavior=Relu(E_behavior*V_behavior)
其中V_behavior为操作特征数据,E_behavior为第五计算模块的算法模型参数,神经元激活函数Relu(x)为第五计算模块具体使用的算法公式,L_behavior为得到的第三特征数据。具体的,神经元激活函数Relu(x)公式如下:
Relu(x)=max(0,x)
S304第六计算模块用于对所述第一特征数据与对应的所述第三特征数据进行加权求和,得到第四特征数据。
具体的,例如在用于手机银行业务中时,加权计算公式如下:
Union_bahavior=αL_behavior+(1-α)Gate_behavior
其中L_behavior为第三特征数据,Gate_behavior为第一特征数据,所述Union_bahavior为第四特征数据。其中α取值一般在[0,1]之间,具体取值由业务专家制定。通过α的取值,可以调整用户特征数据对操作特征数据影响程度的强弱,使本申请实施例中的反欺诈方法适用范围更加广泛,进一步提高欺诈用户识别率。
S305第二计算模块还用于根据所述第四特征数据,确定所述操作请求是欺诈请求的概率值。
这里,当计算得到的欺诈请求是欺诈操作的概率值大于预定阈值时,即所述操作请求为欺诈操作请求时,数据模块将所述欺诈操作请求对应的用户的历史操作请求、对应的欺诈请求是欺诈操作的概率值、所述历史操作请求对应的历史操作特征数据和所述历史操作请求对应的历史用户特征数据写入数据库。
所述获取模块定时获取所述数据库.
这里,所述第一计算模块、所述第二计算模块、所述第三计算模块、所述第五计算模块和所述第六计算模块根据所述数据库进行算法模型训练,得到所述第一计算模块、所述第二计算模块、所述第三计算模块、所述第五计算模块和所述第六计算模块中算法模型参数的新数值。
实施例四
为了对特征数据的分析更深入,更有针对性,也可以使用类似实施例二的方法,首先获取所述操作请求对应的操作类型,根据所述操作类型对所述操作特征数据进行分类。在此基础上设计了本申请所述电子银行反欺诈方法的一种实施例四,如图4所示其中包括如下步骤:
S401获取模块获取操作请求,所述操作请求对应的操作特征数据和所述操作请求对应的用户特征数据,获取所述操作请求对应的操作类型。
S402第三计算模块对每个操作类型的操作特征数据进行分类;第二计算模块将每个所述操作类型的操作特征数据分别与所述用户特征参数相乘,得到多个对应操作类型的第一特征数据。
这里,步骤S401与S402与实施例二中的相应步骤一样。具体的,例如在用于手机银行业务中时,假设针对转账这一操作类型进行计算,会根据转账操作类型对应的公式得到转账对应的第一特征数据:
Gatebehavior_转账=tanh(Wbehavior_转账*Vbehavior_转账)*sigmoid(T_age*V_age+T_profession*V_profession+T_salary*V_salary)。
S403第五计算模块将所述每个操作类型的操作特征数据映射到与所述对应操作类型的第一特征数据向量空间,得到对应操作类型的第三特征数据。
具体的,例如在用于手机银行业务中时,假设针对转账这一操作类型进行计算,具体公式如下:
Lbehavior_转账=Relu(Ebehavior_转账*Vbehavior_转账)
S404第六计算模块将所述对应操作类型的第一特征数据和所述对应操作类型的第三特征数据进行加权求和,得到对应操作类型的第四特征数据。
具体的,例如在用于手机银行业务中时,假设针对转账这一操作类型进行计算,具体公式如下:
Union_转账=αLbehavior_转账+(1-α)Gatebehavior_转账
S405第四计算模块将每个操作类型的第四特征数据依次进行拼接,得到所述第二特征数据。
具体的,例如在用于手机银行业务中时,将注册、登录、转账、缴费和消费的操作类型根据步骤S401到S404计算得到的对应五种操作类型的第四特征数据进行拼接,生成第二特征数据:[union_注册;union_登录;union_转账;union_缴费;union_消费]。
S406第二计算模块对所述第二特征数据进行计算,得到所述欺诈请求是欺诈操作的概率值。
这里,当计算得到的欺诈请求是欺诈操作的概率值大于预定阈值时,即所述操作请求为欺诈操作请求时,数据模块将所述欺诈操作请求对应的用户的历史操作请求、对应的欺诈请求是欺诈操作的概率值、所述历史操作请求对应的历史操作特征数据和所述历史操作请求对应的历史用户特征数据写入数据库。
所述获取模块定时获取所述数据库。
所述第一计算模块、所述第二计算模块、所述第三计算模块、所述第五计算模块和所述第六计算模块根据所述数据库进行算法模型训练,分别得到第一计算模块、所述第二计算模块、所述第三计算模块、所述第五计算模块和所述第六计算模块中算法模型参数的新数值。
实施例五
基于相同的设计构思,本实施例提供了一种电子银行反欺诈系统,如图5所示包括获取模块501、第一计算模块502、第二计算模块503。
501获取模块,用于获取操作请求、所述操作请求对应的操作特征数据和所述操作请求对应的用户特征数据。
502第一计算模块,用于根据所述用户特征数据以及每个用户特征数据的权重,确定用户特征参数。
503第二计算模块,用于根据所述操作特征数据与所述用户特征参数,确定所述操作请求是欺诈请求的概率值,在所述操作请求是欺诈请求的概率大于预定阈值时,判定所述操作请求为欺诈操作请求。
这里,还可以包括第三计算模块,用于将每个操作特征数据转换为非线性化特征数据。
因此,相应的第二计算模块还用于根据每个所述非线性化特征数据与所述用户特征参数,确定所述操作请求是欺诈请求的概率值。
这里还可以包括数据模块,用于将所述欺诈操作请求对应的用户的所有历史操作请求、所述历史操作请求对应的历史操作特征数据和所述历史操作请求对应的历史用户特征数据写入数据库。
这里,当第二计算模块判断所述欺诈请求是欺诈操作的概率值大于预定阈值时,发起对所述操作请求的拦截。数据模块将操作请求的拦截信息和上述数据都写入数据库中。
这里,501获取模块,还用于定时获取所述数据库。
这里,501第一计算模块、502第二计算模块和所述第三计算模块根据所述数据库进行算法模型训练。
实施例六
如图6所示是本实施例的一种电子银行反欺诈系统具体应用于手机银行时的网络结构图。
为了方便总结和理解,本实施例将反欺诈系统分为三层结构,分别为用户业务行为特征提取层、用户业务行为特征融合层和用户行为判断结果输出层。
具体的,用户业务行为特征提取层包括了获取模块、第一计算模块、第二计算模块、第三计算模块、第四计算模块和第五计算模块,用户业务行为特征提取层的方法流程包括如下步骤:
获取模块获取操作请求,所述操作请求对应的操作特征数据、所述操作请求对应的用户特征数据和所述操作请求对应的操作类型。
这里,操作特征数据为V_behavior,用户特征数据包括三类,分别是年龄特征数据V_age、职业特征数据V_profession和收入特征数据V_salary。当然,本实施例提供的是一种应用于手机银行情况下的具体例子,在本申请所述反欺诈方法和系统具体实施于其他情况时,用户特征数据可以更多也可以不同。
这里,将手机银行的操作请求分为两个大类,分别是基础操作和业务操作,其中,基础操作包括注册和登录,业务操作包括转账和缴费,即操作类型包括注册、登录、转账和缴费。当然,本实施例提供的是一种应用于手机银行情况下的具体例子,在本申请所述反欺诈方法和系统具体实施于其他情况时,操作类型可以更多也可以不同。
第三计算模块根据所述操作类型对所述操作特征数据进行分类;并且根据所述每个操作类型的操作特征数据转换为非线性化特征数据。
这里,为了简化算法模型的搭建,为了简化计算过程,本实施例的反欺诈方法每次只计算一种业务操作的操作特征数据,因此第三计算模块在对操作特征数据进行分类时,可以将业务操作的操作特征数据简化的表示为Vbehavior_业务,具体的,Vbehavior_业务指代了Vbehavior_转账或Vbehavior_缴费。另外,操作特征数据还包括Vbehavior_登录和Vbehavior_注册。总之,第四计算模块将操作特征数据分为三类,分别是,Vbehavior_注册、Vbehavior_登录和Vbehavior_业务。
这里,第三计算模块对每种操作类型的操作特征数据转化为对应的非线性化特征数据。
具体的,使用如下公式进行计算:
注册操作:tanh(Wbehavior_注册*Vbehavior_注册)
登录操作:tanh(Wbehavior_登录*Vbehavior_登录)
业务操作:tanh(Wbehavior_业务*Vbehavior_业务)
具体的,神经元激活函数tanh(x)公式如下:
tanh(x)=(e^x-e^(-x))/(e^x+e^(-x))。
第一计算模块对所述用户特征数据进行加权计算后,映射到预定数值范围,得到用户特征参数,用户特征参数代表了综合了年龄特征数据、收入特征数据、职业特征数据等用户特征数据对操作特征数据的过滤程度,其数值范围在[0,1]之间。
具体的,使用如下公式进行计算:
sigmoid(T_age*V_age+T_profession*V_profession+T_salary*V_salary)
具体的,神经元激活函数sigmoid(x)公式如下:
sigmoid(x)=1/(1+e^(-x))
第二计算模块将所述对应操作类型的操作特征数据与所述用户特征参数相乘得到对应操作类型的第一特征数据;
具体的使用如下公式进行计算:
注册操作:Gatebehavior_注册=tanh(Wbehavior_注册*Vbehavior_注册)*sigmoid(T_age*V_age+T_profession*V_profession+T_salary*V_salary)
登录操作:Gatebehavior_登录=tanh(Wbehavior_登录*Vbehavior_登录)*sigmoid(T_age*V_age+T_profession*V_profession+T_salary*V_salary)
业务操作:Gatebehavior_业务=tanh(Wbehavior_业务*Vbehavior_业务)*sigmoid(T_age*V_age+T_profession*V_profession+T_salary*V_salary)
上述步骤一方面接收输入的操作特征数据,另一方面接收反映该操作请求对应的用户的消费习惯和消费能力的数据,即用户特征数据。具体的,用户特征数据包括年龄特征数据、收入特征数据和职业特征数据等,当然,在本申请反欺诈方法及系统具体实施时,可以按不同应用需求扩展其他类型的用户特征数据,包括但不限于风险特征数据、储蓄特征数据、消费特征数据等。将这些反应用户消费习惯和消费能力的数据输入到上述算法模型公式中,用来对操作特征数据进行过滤。这里,用户特征数据属于算法模型参数的一部分,本申请反欺诈方法及系统刚开始运行时,将用户特征数据随机初始化,之后在进行算法模型训练时,用户特征数据随着第一计算模块一同进行算法模型训练。
第五计算模块将每个操作类型的操作特征数据映射到与对应操作类型的第一特征数据的向量空间,得到对应操作类型的第三特征数据。
这里,第五计算模块主要用来提取更能反映通用特性的操作特征数据的特征,这里计算得到的第三特征数据没有经过用户特征数据的过滤。具体的,使用如下公式进行计算:
注册操作:Lbehavior_注册=Relu(Ebehavior_注册*Vbehavior_注册)
登录操作:Lbehavior_登录=Relu(Ebehavior_登录*Vbehavior_登录)
业务操作:Lbehavior_业务=Relu(Ebehavior_业务*Vbehavior_业务)
具体的,神经元激活函数Relu(x)公式如下:
Relu(x)=max(0,x)
这里,用户业务行为特征提取层共得到了两类特征数据,一类经过了用户特征数据的过滤,一类没有。之后用户业务行为特征融合层将两类特征数据加权融合,用户业务行为特征融合层主要包括第六计算模块。
第六计算模块对所述对应操作类型的第一特征数据和所述对应操作类型的第三特征数据进行加权求和,得到对应操作类型的第四特征数据。
具体的,加权计算公式如下:
注册操作:Union_注册=αLbehavior_注册+(1-α)Gatebehavior_注册
登录操作:Union_登录=αLbehavior_登录+(1-α)Gatebehavior_登录
业务操作:Union_业务=αLbehavior_业务+(1-α)Gatebehavior_业务
这里,α取值一般在[0,1]之间,具体取值由专家制定。
当对每一种操作类型联合两种特征数据进行加权计算之后,将具体包括注册操、登录操作和业务操作的特征数据发给用户行为判断结果输出层。用户行为判断结果输出层主要包括第四计算模块和第二计算模块。
第四计算模块将每个操作类型的第四特征数据进行拼接,得到第二特征数据。
具体的,经过向量拼接操作生成[union_注册;union_登录;union_业务行为]。
第二计算模块对所述第二特征数据进行计算,得到所述欺诈请求是欺诈操作的概率值。
具体的,使用第二计算模块通过全连接层进行计算,计算得到的就是欺诈请求是欺诈操作的概率值所述操作请求属于欺诈操作请求的概率。
这里,还可以包括数据模块,当第二计算模块检测到所述操作请求属于欺诈操作请求时,数据模块将所述欺诈操作请求对应的用户的历史操作请求、对应的欺诈请求是欺诈操作的概率值和所述历史操作请求对应的历史操作特征数据和历史用户特征数据写入数据库。
然后,所述获取模块定时获取所述数据库。
所述第一计算模块、所述第二计算模块、所述第三计算模块、所述第五计算模块和所述第六计算模块根据所述数据库进行算法模型训练。
本申请一种反欺诈方法及系统的实验环境为:
操作系统:CentOs 6.0
主要编程语言:Python 2.7
调用的第三方库:Tensorflow 0.17
内存大小:32G
硬盘大小:500G
中央处理器型号:英特尔Xeon(R)CPU四核
本申请实施例所提供的进行一种电子银行反欺诈方法及系统的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (7)
1.一种操作请求处理系统,其特征在于,包括获取模块、第一计算模块、第二计算模块;
所述获取模块用于获取操作请求、所述操作请求对应的操作特征数据和所述操作请求对应的用户特征数据;
所述第一计算模块用于根据所述用户特征数据以及每个用户特征数据的权重,确定用户特征参数;
所述第二计算模块用于根据所述操作特征数据与所述用户特征参数,确定所述操作请求是欺诈请求的概率值,在所述操作请求是欺诈请求的概率大于预定阈值时,判定所述操作请求为欺诈操作请求;
所述操作请求处理系统还包括第三计算模块和第四计算模块;
所述获取模块还用于获取所述操作请求对应的操作类型;
所述第三计算模块用于根据所述操作类型,对所述操作特征数据进行分类;
所述第四计算模块用于将每个操作类型的操作特征数据对应的第一特征数据进行拼接,得到第二特征数据;
第二计算模块还用于根据所述第二特征数据与所述用户特征参数,确定所述操作请求是欺诈请求的概率值;
所述第三计算模块还用于将每个操作特征数据转换为非线性化特征数据;
所述第二计算模块还用于根据每个所述非线性化特征数据与所述用户特征参数,以及预先训练好的门信息流控制结构,确定所述操作请求是欺诈请求的概率值。
2.根据权利要求1所述的系统,其特征在于,所述第一计算模块还用于确定所述用户特征参数:
所述第一计算模块具体用于将每个所述用户特征数据进行加权处理,并将加权处理后的用户特征数据相加,得到用户特征参数;
所述第一计算模块还用于将所述用户特征参数映射到预定数值范围内。
3.根据权利要求1所述的系统,其特征在于,第二计算模块具体用于执行:
将每个所述操作特征数据分别与所述用户特征参数相乘,得到多个第一特征数据;
根据所有的所述第一特征数据确定所述操作请求是欺诈请求的概率值。
4.根据权利要求2所述的系统,其特征在于,所述预定数值范围为大于或等于0,并且所述预定数值范围小于或等于1。
5.根据权利要求3所述的系统,其特征在于,还包括第五计算模块和第六计算模块;
所述第五计算模块用于将所述每个操作特征数据映射到对应的第一特征数据的向量空间,得到多个第三特征数据;
所述第六计算模块用于对所述第一特征数据与对应的所述第三特征数据进行加权求和,得到第四特征数据;
所述第二计算模块还用于根据所述第四特征数据,确定所述操作请求是欺诈请求的概率值。
6.根据权利要求5所述的系统,其特征在于,所述第四计算模块还用于将每个操作类型的第四特征数据依次进行拼接,得到所述第二特征数据。
7.根据权利要求1-6任一项所述的系统,其特征在于,还包括数据模块;
所述数据模块用于将所述欺诈操作请求对应的用户的所有历史操作请求、所述历史操作请求对应的历史操作特征数据和所述历史操作请求对应的历史用户特征数据写入数据库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811058711.9A CN109272398B (zh) | 2018-09-11 | 2018-09-11 | 一种操作请求处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811058711.9A CN109272398B (zh) | 2018-09-11 | 2018-09-11 | 一种操作请求处理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109272398A CN109272398A (zh) | 2019-01-25 |
CN109272398B true CN109272398B (zh) | 2020-05-08 |
Family
ID=65188491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811058711.9A Active CN109272398B (zh) | 2018-09-11 | 2018-09-11 | 一种操作请求处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109272398B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110532895B (zh) | 2019-08-06 | 2020-10-23 | 创新先进技术有限公司 | 人脸识别过程中的欺诈行为检测方法、装置及设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101685526A (zh) * | 2008-09-28 | 2010-03-31 | 阿里巴巴集团控股有限公司 | 一种贷款准入评估方法和系统 |
CN103049851A (zh) * | 2012-12-27 | 2013-04-17 | 中国建设银行股份有限公司 | 一种基于交易数据的反欺诈监控方法和装置 |
CN104881783A (zh) * | 2015-05-14 | 2015-09-02 | 中国科学院信息工程研究所 | 电子银行账户欺诈行为及风险检测方法与系统 |
CN106067088A (zh) * | 2016-05-30 | 2016-11-02 | 中国邮政储蓄银行股份有限公司 | 电子银行访问行为的检测方法和装置 |
CN107679859A (zh) * | 2017-07-18 | 2018-02-09 | 中国银联股份有限公司 | 一种基于迁移深度学习的风险识别方法以及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090319413A1 (en) * | 2008-06-18 | 2009-12-24 | Saraansh Software Solutions Pvt. Ltd. | System for detecting banking frauds by examples |
-
2018
- 2018-09-11 CN CN201811058711.9A patent/CN109272398B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101685526A (zh) * | 2008-09-28 | 2010-03-31 | 阿里巴巴集团控股有限公司 | 一种贷款准入评估方法和系统 |
CN103049851A (zh) * | 2012-12-27 | 2013-04-17 | 中国建设银行股份有限公司 | 一种基于交易数据的反欺诈监控方法和装置 |
CN104881783A (zh) * | 2015-05-14 | 2015-09-02 | 中国科学院信息工程研究所 | 电子银行账户欺诈行为及风险检测方法与系统 |
CN106067088A (zh) * | 2016-05-30 | 2016-11-02 | 中国邮政储蓄银行股份有限公司 | 电子银行访问行为的检测方法和装置 |
CN107679859A (zh) * | 2017-07-18 | 2018-02-09 | 中国银联股份有限公司 | 一种基于迁移深度学习的风险识别方法以及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109272398A (zh) | 2019-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109409896B (zh) | 银行欺诈识别模型训练方法、银行欺诈识别方法和装置 | |
CN109410036A (zh) | 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置 | |
CN111737546B (zh) | 确定实体业务属性的方法及装置 | |
CN110827138B (zh) | 一种推送信息确定方法及装置 | |
CN110633991A (zh) | 风险识别方法、装置和电子设备 | |
CN111325619A (zh) | 一种基于联合学习的信用卡欺诈检测模型更新方法及装置 | |
CN112669143A (zh) | 基于关联网络的风险评估方法、装置、设备以及存储介质 | |
CN112017040A (zh) | 信用评分模型训练方法、评分方法及系统、设备及介质 | |
CN114782161A (zh) | 识别风险用户的方法、装置、存储介质及电子装置 | |
CN109272398B (zh) | 一种操作请求处理系统 | |
CN113144624B (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN111612284A (zh) | 数据的处理方法、装置及设备 | |
CN113408627A (zh) | 目标对象的确定方法、装置和服务器 | |
KR102455414B1 (ko) | 온라인 결제 서비스 제공 방법 및 시스템 | |
CN116595486A (zh) | 风险识别方法、训练风险识别模型的方法及对应装置 | |
CN115601044A (zh) | 欺诈检测模型训练、欺诈检测方法、装置及电子设备 | |
CN115293872A (zh) | 建立风险识别模型的方法及对应装置 | |
CN115860889A (zh) | 一种基于人工智能的金融贷款大数据管理方法及系统 | |
CN114637850A (zh) | 异常行为识别及模型训练方法、装置、设备及存储介质 | |
CN114373098A (zh) | 一种图像分类方法、装置、计算机设备及存储介质 | |
CN113781056A (zh) | 预测用户欺诈行为的方法及装置 | |
CN111383028B (zh) | 预测模型训练方法及装置、预测方法及装置 | |
KR102409019B1 (ko) | 금융 거래 위험 평가 시스템과 방법 및 이를 위한 컴퓨터 프로그램 | |
CN113408923B (zh) | 保费催收方法、装置、计算机设备和存储介质 | |
CN116611923A (zh) | 基于知识图谱的风险数据获取方法、系统、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |