CN113591932A - 基于一类支持向量机的用户异常行为处理方法和装置 - Google Patents

基于一类支持向量机的用户异常行为处理方法和装置 Download PDF

Info

Publication number
CN113591932A
CN113591932A CN202110764855.1A CN202110764855A CN113591932A CN 113591932 A CN113591932 A CN 113591932A CN 202110764855 A CN202110764855 A CN 202110764855A CN 113591932 A CN113591932 A CN 113591932A
Authority
CN
China
Prior art keywords
user
behavior
abnormal
support vector
vector machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110764855.1A
Other languages
English (en)
Other versions
CN113591932B (zh
Inventor
姚王照
沈赟
聂婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qiyu Information Technology Co Ltd
Original Assignee
Beijing Qiyu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qiyu Information Technology Co Ltd filed Critical Beijing Qiyu Information Technology Co Ltd
Priority to CN202110764855.1A priority Critical patent/CN113591932B/zh
Publication of CN113591932A publication Critical patent/CN113591932A/zh
Application granted granted Critical
Publication of CN113591932B publication Critical patent/CN113591932B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于在计算机信息处理技术领域,提供一种基于一类支持向量机的用户异常行为处理方法、装置和电子设备,方法包括:获取历史用户的用户信息和对应的行为标签;将历史用户的用户信息和对应的行为标签作为一类支持向量机的训练样本进行训练,得到用于预测用户行为的一类支持向量机模型;当接收到新用户的业务请求时将新用户的用户信息输入一类支持向量机模型,得到该新用户的行为标签,根据行为标签判定该新用户的业务请求是否包含异常行为并进行相应处理。本发明通过获取历史用户的用户信息来训练模型,利用训练好的一类支持向量机模型来判断的下单行为是否正常,若存在欺诈行为则进行相应处理,有效提高了异常行为的识别精度,降低了损失。

Description

基于一类支持向量机的用户异常行为处理方法和装置
技术领域
本发明属于计算机信息处理技术领域,更具体的是涉及一种基于一类支持向量机的用户异常行为处理方法、装置、电子设备和计算机可读介质。
背景技术
目前,随着互联网的发展,由于良好的便捷性和灵活性,越来越多的用户将网络软件应用到日常的业务办理中。
现实生话中,在众多领域,互联网的恶意欺诈行为是相当普遍的,恶意欺诈往往会给商家带来相当大的损失。
从统计学的角度来看,欺诈行为的属性一般显著偏离正常值。因此离群点检测成为反欺诈的一种常用的方法。现有技术中,离群点的检测方法有很多,如基于统计的直方图异常值法、基于聚类的离群点检测方法等,但是这些现有技术经实践发现均有精度较低等问题,导致识别欺诈行为的精度不高,增加了财产损失风险。
发明内容
(一)要解决的技术问题
本发明旨在解决如何有效识别用户订单的异常行为,以降低损失的技术问题。
(二)技术方案
为解决上述技术问题,本发明的一方面提出一种基于一类支持向量机的用户异常行为处理方法,包括:
获取历史用户的用户信息和对应的行为标签;
将所述历史用户的用户信息和对应的行为标签作为一类支持向量机的训练样本进行训练,得到用于预测用户行为的一类支持向量机模型;
当接收到新用户的业务请求时将所述新用户的用户信息输入所述一类支持向量机模型,得到该新用户的行为标签,根据所述行为标签判定该新用户的业务请求是否包含异常行为并进行相应处理。
根据本发明的优选实施方式,所述获取历史用户的用户信息和对应的行为标签,进一步包括:
获取所述历史用户的用户身份信息、业务请求中产生的用户行为数据。
根据本发明的优选实施方式,所述将所述历史用户的用户信息和对应的行为标签作为一类支持向量机的训练样本进行训练,得到用于预测用户行为的一类支持向量机模型,进一步包括:
从所述历史用户的用户身份信息和用户行为数据中筛选出与用户异常行为相关性大于预设值的变量作为异常行为变量;
将所述异常行为变量转化为异常行为特征向量;
将所述异常特征向量输入基于一类支持向量机的机器学习模型进行训练;
根据得到的行为标签及实际的行为标签调整模型参数得到用于预测异常行为的一类支持向量机模型。
根据本发明的优选实施方式,所述从所述历史用户的用户身份信息和用户行为数据中筛选出与用户异常行为相关性大于预设值的变量作为异常行为变量,进一步包括:
根据所述历史用户的用户身份信息和用户行为数据衍生出与用户异常行为相关性大于预设值的新行为变量;
将所述与用户异常行为相关性大于预设值的变量及行为变量作为异常行为变量。
根据本发明的优选实施方式,所述将所述异常特征向量输入基于一类支持向量机的机器学习模型进行训练,进一步包括:
利用支持向量数据描述算法对所述机器学习模型进行训练。
根据本发明的优选实施方式,所述根据得到的行为标签及实际的行为标签调整模型参数得到用于预测异常行为的一类支持向量机模型,进一步包括:
根据所述一类支持向量机模型的输出结果计算该历史用户的业务请求为异常行为概率;
根据不同的异常行为概率对所述历史用户进行分类,分别对每个类别的异常行为概率设置对应的阈值范围;
根据所述历史用户所在的类别设置对应的行为标签。
根据本发明的优选实施方式,所述根据不同的异常行为概率对所述历史用户进行分类,分别对每个类别的异常行为概率设置对应的阈值范围,进一步包括:
将所述异常行为概率小于预设第一阈值范围的用户设置为第一类用户;
将所述异常行为概率大于预设第一阈值范围且小于预设第二阈值范围的用户设置为第二类用户;
将所述异常行为概率大于预设第二阈值范围内的用户设置为第三类用户。
根据本发明的优选实施方式,所述当接收到新用户的业务请求时将所述新用户的用户信息输入所述一类支持向量机模型,得到该新用户的行为标签,根据所述行为标签判定该新用户的业务请求是否包含异常行为并进行相应处理,进一步包括:
当所述新用户为第一类用户时,受理并通过该用户的业务请求;
当所述新用户为第二类用户时,受理并进一步审核该用户的业务请求;
当所述新用户为第三类用户时,拒绝该用户的业务请求。
根据本发明的优选实施方式,所述用户身份信息包括:用户的年龄、职业、学历、收入及财产信息;
所述异常行为特征向量包括:用户APP个数、进行业务请求时页面停留时间及预设时间段内业务请求的次数转化的向量。
本发明第二方面提出一种基于一类支持向量机的用户异常行为处理装置,包括:
信息获取模块,用于获取历史用户的用户信息和对应的行为标签;
模型训练模块,用于将所述历史用户的用户信息和对应的行为标签作为一类支持向量机的训练样本进行训练,得到用于预测异常行为的一类支持向量机模型;
异常行为处理模块,用于当接收到新用户的业务请求时将所述新用户的用户信息输入所述一类支持向量机模型,得到该新用户的行为标签,根据所述行为标签判定该新用户的业务请求是否包含异常行为并进行相应处理。
本发明第三方面提出一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行所述的方法。
本发明第四方面还提出一种计算机可读介质,存储有计算机可执行程序,所述计算机可执行程序被执行时,实现所述的方法。
(三)有益效果
本发明通过获取历史用户的用户信息来训练模型,利用训练好的一类支持向量机模型来判断的用户的下单行为是否正常,若存在欺诈行为则进行相应处理,有效提高了异常行为的识别精度,降低了损失。
附图说明
图1是本发明一个实施例的一种基于一类支持向量机的用户异常行为处理方法应用场景示意图;
图2是本发明一个实施例的一种基于一类支持向量机的用户异常行为处理方法流程示意图;
图3是本发明一个实施例的一种基于一类支持向量机的用户异常行为处理装置示意图;
图4是本发明的一个实施例的电子设备的结构示意图;
图5是本发明的一个实施例的计算机可读记录介质的示意图。
具体实施方式
在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理单元装置和/或微控制器装置中实现这些功能实体。
各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。
为解决上述技术问题,本发明提出一种基于一类支持向量机的用户异常行为处理方法,本发明实施例中的教育题目主要以小学的数学计算类题目为主来说明,包括数字类的加减乘除运算,通过将大量的计算类题目和计算对应的公式作为样本输入机器学习模型进行训练,训练得到的机器学习模型可以用于自动生成题目对应的计算公式,最后根据得到的公式和题目中的参数计算出正确答案,并与待批改的答案进行对比,便可实现对题目的自动批改,批改效率大大提高。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
图1是本发明一个实施例的一种基于一类支持向量机的用户异常行为处理方法应用场景示意图。在互联网的各个领域均存在着用户异常行为,例如保险领域存在骗保行为,购物领域存在购买后退货,退货时以次充好的行为,金融贷款领域存在多头或共债行为,这些都属于异常行为或欺诈行为,会对商家造成一定损失。
本发明实施例以金融领域为例来说明本发明的方法。
如图1所示,用户通过手机或电脑等电子设备登录金融机构的APP客户端后,通过在客户端选取对应的商品后下单,客户端获取到用户的下单请求后,将用户登录时的信息和订单信息发送到服务器进行审核,服务器包括异常行为检测的模型,将用户的用户信息及用户的下单数据输入模型,得到用户当前的下单行为是否为异常行为,若为异常行为,则拒绝用户的下单请求,若为正常行为则受理用户的下单请求,并将审核结果通过客户端发送给用户,本发明实施例中检测用户异常行为的模型采用一类支持向量机(One ClassSVM)模型,该模型可有效提高用户异常行为的识别精度,进而降低金融机构的损失。
图2是本发明一个是实施例的一种基于一类支持向量机的用户异常行为处理方法流程示意图。
如图2所示,本方法包括:
S101、获取历史用户的用户信息和对应的行为标签。
在一些实施例中,用户在登录互联网服务平台之后,基于互联网服务平台执行各种操作。用户信息包括用户的身份信息和用户的行为数据,其中,身份信息包括但不限于用户姓名,年龄,相貌,所在地,职业,学历,收入,财产、手机号及社交关系等信息,用户身份信息通过用户注册时提交的资料或其他途径通常都能获取到。
用户在登录后执行操作将产生对应的数据,这些数据可以称之为行为数据。互联网服务平台可以存储用户产生的各种行为数据,例如:登录数据,支付数据、交易数据、借款数据、还款数据等,这里统称为用户行为数据。
本发明实施例中获取历史已交易完成的用户的身份信息和用户行为数据,同时获取金融机构为该历史用户设置的行为标签,该行为标签是金融机构通过该用户的身份信息和行为表现来设置的标签,包括正常行为和异常行为,例如授信、贷款、提升额度等属于正常行为,疑似多头、疑似共债属于异常行为,每种用户行为均会在数据上有不同的体现,也就是说根据用户行为数据通过算法可以计算出对应的用户行为,进而判断用户行为是否异常。
S102、将所述历史用户的用户信息和对应的行为标签作为一类支持向量机的训练样本进行训练,得到用于预测用户行为的一类支持向量机模型。
在一些实施例中,首先使用历史用户的用户信息作为训练样本,将用户信息转化为对应的特征向量,因为用户的特征向量维度非常多,如果全部输入模型计算量巨大,影响速度,并且输出的结果误差较大,因此首先需要筛选出与预测用户行为有关的变量,例如用户安装APP的个数、进行业务请求时页面停留的时间及预设时间段内进行业务请求的次数。
从历史用户的用户身份信息和用户行为数据中筛选出与用户异常行为的相关性大于预设值的变量,筛选过程可以是将在训练模型的过程中得出的每个变量对输出结果的影响从大到小进行排序,取其中排名在前若干名的变量作为所需变量。
优选的,由于有些变量与用户异常行为的相关性较小,但是这些变量的衍生变量对用户异常行为的相关性较大,例如在用户授权的情况下获取了用户安装的APP名称,以此可以衍生出用户安装的与贷款有关的APP个数;再如,通过获取用户近若干天的申请贷款次数,可以衍生出反映用户资金需求程度的变量。将筛选得到的变量和衍生出的新行为变量一同作为异常行为变量。
将异常行为变量转化为多维异常行为特征向量,维度一般为1000维左右,异常行为特征向量中的每个维度的变量均与用户异常行为相关性较大,将异常行为特征向量输入基于一类支持向量机的机器学习模型进行训练,根据得到的行为标签及实际的行为标签调整模型参数得到用于预测异常行为的一类支持向量机模型。例如某历史用户通过假身份信息进行贷款骗取财物,后续金融机构对其设置的行为标签是异常行为,将该用户的异常行为特征向量输入基于一类支持向量机的机器学习模型,若输出结果是该用户的订单为异常行为,则说明模型输出正确,最终将训练好的模型作为用于预测异常行为的一类支持向量机模型。
本发明实施例中运用支持向量数据描述算法(SVDD)对所述机器学习模型进行训练,最终得到一类支持向量机模型,模型输出的结果为该用户的下单行为是否是异常行为,为了更人性化的处理用户的下单行为,将模型进行改进,使输出的结果为异常行为的概率,输出结果更精确,工作人员后续根据结果能更好的进行处理。
例如根据输出的为异常行为的概率不同对历史用户进行分类,每类用户的异常行为概率均有预设的阈值范围,对于不同类别的用户设置对应的行为标签。
例如历史用户A输出的异常行为概率是2%,历史用户B输出的异常行为概率是20%,历史用户C输出的异常行为概率是50%,且第一类用户设置的概率阈值为0-10%,第二类用户设置的概率阈值为11%-30%,第三类用户设置的概率阈值为31%-100%,由于历史用户A输出的异常行为概率是2%,所以将历史用户A分为第一类用户;由于历史用户B输出的异常行为概率是20%,所以将历史用户B分为第二类用户;由于历史用户C输出的异常行为概率是50%,所以将历史用户C分为第三类用户。
将不同异常行为概率的用户进行分类,便于管理员对不同类别的用户进行不同的处理,使得处理结果更加人性化,同时避免了异常订单对金融机构带来的损失。
S103、当接收到新用户的业务请求时将所述新用户的用户信息输入所述一类支持向量机模型,得到该新用户的行为标签,根据所述行为标签判定该新用户的业务请求是否包含异常行为并进行相应处理。
在一些实施例中,将新用户的下单信息和用户信息输入一类支持向量机模型输出得到该用户订单的异常行为概率,并根据概率自动为该用户分类,随后可以将分类结果发送给管理员,由管理员根据分类结果进行处理,也可预先设置不同的处理方式,服务器根据用户的类别自动对其进行相应的处理。
例如,当新用户为第一类用户时,也就是该用户的异常行为概率较小,判定该用户为正常行为用户,受理并通过该用户的业务请求;
当新用户为第二类用户时,也就是该用户的异常行为概率居中,判定该用户为疑似异常行为用户,这类用户通常会首先受理该订单,然后转交给管理员进行进一步核实,若最终结果为异常行为,则拒绝其订单请求;
当所述新用户为第三类用户时,也就是该用户的异常行为概率较大,判定该用户为异常行为用户,拒绝该用户的业务请求。
本发明通过获取历史用户的用户信息来训练模型,利用训练好的一类支持向量机模型来判断的用户的下单行为是否正常,若存在欺诈行为则进行相应处理,有效提高了异常行为的识别精度,降低了损失。
本领域技术人员可以理解,实现上述实施例的全部或部分步骤被实现为由计算机数据处理设备执行的程序(计算机程序)。在该计算机程序被执行时,可以实现本发明提供的上述方法。而且,所述的计算机程序可以存储于计算机可读存储介质中,该存储介质可以是磁盘、光盘、ROM、RAM等可读存储介质,也可以是多个存储介质组成的存储阵列,例如磁盘或磁带存储阵列。所述的存储介质不限于集中式存储,其也可以是分布式存储,例如基于云计算的云存储。
下面描述本发明的装置实施例,该装置可以用于执行本发明的方法实施例。对于本发明装置实施例中描述的细节,应视为对于上述方法实施例的补充;对于在本发明装置实施例中未披露的细节,可以参照上述方法实施例来实现。
图3是本发明一个是实施例的一种基于一类支持向量机的用户异常行为处理装置示意图,如图3所示,该装置200包括:
信息获取模块201,用于获取历史用户的用户信息和对应的行为标签;
模型训练模块202,用于将所述历史用户的用户信息和对应的行为标签作为一类支持向量机的训练样本进行训练,得到用于预测异常行为的一类支持向量机模型;
异常行为处理模块203,用于当接收到新用户的业务请求时将所述新用户的用户信息输入所述一类支持向量机模型,得到该新用户的行为标签,根据所述行为标签判定该新用户的业务请求是否包含异常行为并进行相应处理。
其中,信息获取模块201进一步包括:
身份信息获取单元,用于获取所述历史用户的用户身份信息;
行为信息获取单元,用于获取所述历史用户的业务请求中产生的用户行为数据和实际的行为标签。
根据本发明的优选实施方式,模型训练模块202进一步包括:
变量筛选单元,用于从所述历史用户的用户身份信息和用户行为数据中筛选出与用户异常行为相关性大于预设值的变量作为异常行为变量;
向量转化单元,用于将所述异常行为变量转化为异常行为特征向量;
模型训练单元,用于将所述异常特征向量输入基于一类支持向量机的机器学习模型进行训练;
所述模型训练单元还用于根据得到的行为标签及实际的行为标签调整模型参数得到用于预测异常行为的一类支持向量机模型。
根据本发明的优选实施方式,变量筛选单元还用于:
根据所述历史用户的用户身份信息和用户行为数据衍生出与用户异常行为相关性大于预设值的新行为变量;
将所述与用户异常行为相关性大于预设值的变量及行为变量作为异常行为变量。
根据本发明的优选实施方式,模型训练单元还用于:
利用支持向量数据描述算法对所述机器学习模型进行训练。
根据本发明的优选实施方式,模型训练单元还包括:
计算单元,用于根据所述一类支持向量机模型的输出结果计算该历史用户的业务请求为异常行为概率;
分类单元,用于根据不同的异常行为概率对所述历史用户进行分类,分别对每个类别的异常行为概率设置对应的阈值范围;
标签设置单元,用于根据所述历史用户所在的类别设置对应的行为标签。
根据本发明的优选实施方式,分类单元进一步包括:
第一分类单元,用于将所述异常行为概率小于预设第一阈值范围的用户设置为第一类用户;
第二分类单元,用于将所述异常行为概率大于预设第一阈值范围且小于预设第二阈值范围的用户设置为第二类用户;
第三分类单元,用于将所述异常行为概率大于预设第二阈值范围内的用户设置为第三类用户。
根据本发明的优选实施方式,异常行为处理模块203进一步包括:
第一处理单元,用于当所述新用户为第一类用户时,判定该用户为正常行为用户,受理并通过该用户的业务请求;
第二处理单元,用于当所述新用户为第二类用户时,判定该用户为疑似异常行为用户,受理并进一步审核该用户的业务请求;
第三处理单元,用于当所述新用户为第三类用户时,判定该用户为异常行为用户,拒绝该用户的业务请求。
根据本发明的优选实施方式,所述用户身份信息包括:用户的年龄、职业、学历、收入及财产信息;
所述异常行为特征向量包括:用户APP个数、进行业务请求时页面停留时间及预设时间段内业务请求的次数转化的向量。
图4是本发明的一个实施例的电子设备的结构示意图,该电子设备包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行基于一类支持向量机的用户异常行为处理方法。
如图4所示,电子设备以通用计算设备的形式表现。其中处理器可以是一个,也可以是多个并且协同工作。本发明也不排除进行分布式处理,即处理器可以分散在不同的实体设备中。本发明的电子设备并不限于单一实体,也可以是多个实体设备的总和。
所述存储器存储有计算机可执行程序,通常是机器可读的代码。所述计算机可读程序可以被所述处理器执行,以使得电子设备能够执行本发明的方法,或者方法中的至少部分步骤。
所述存储器包括易失性存储器,例如随机存取存储单元(RAM)和/或高速缓存存储单元,还可以是非易失性存储器,如只读存储单元(ROM)。
可选的,该实施例中,电子设备还包括有I/O接口,其用于电子设备与外部的设备进行数据交换。I/O接口可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
应当理解,图4显示的电子设备仅仅是本发明的一个示例,本发明的电子设备中还可以包括上述示例中未示出的元件或组件。例如,有些电子设备中还包括有显示屏等显示单元,有些电子设备还包括人机交互元件,例如按扭、键盘等。只要该电子设备能够执行存储器中的计算机可读程序以实现本发明方法或方法的至少部分步骤,均可认为是本发明所涵盖的电子设备。
图5是本发明的一个实施例的计算机可读记录介质的示意图。如图5所示,计算机可读记录介质中存储有计算机可执行程序,所述计算机可执行程序被执行时,实现本发明上述的基于一类支持向量机的用户异常行为处理方法。所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现如下功能:获取历史用户的用户信息和对应的行为标签;将所述历史用户的用户信息和对应的行为标签作为一类支持向量机的训练样本进行训练,得到用于预测用户行为的一类支持向量机模型;当接收到新用户的业务请求时将所述新用户的用户信息输入所述一类支持向量机模型,得到该新用户的行为标签,根据所述行为标签判定该新用户的业务请求是否包含异常行为并进行相应处理。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
通过以上对实施方式的描述,本领域的技术人员易于理解,本发明可以由能够执行特定计算机程序的硬件来实现,例如本发明的系统,以及系统中包含的电子处理单元、服务器、客户端、手机、控制单元、处理器等。本发明也可以由执行本发明的方法的计算机软件来实现。但需要说明的是,执行本发明的方法的计算机软件并不限于由一个或特定个的硬件实体中执行,其也可以是由不特定具体硬件的以分布式的方式来实现,例如计算机程序执行的某些方法步骤可以在移动客户端执行,另一部分可以在智能表、智能识别笔等中执行。对于计算机软件,软件产品可以存储在一个计算机可读的存储介质(可以是CD-ROM,U盘,移动硬盘等)中,也可以分布式存储于网络上,只要其能使得电子设备执行根据本发明的方法。
综上所述,本发明可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)等通用数据处理设备来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种基于一类支持向量机的用户异常行为处理方法,其特征在于,包括:
获取历史用户的用户信息和对应的行为标签;
将所述历史用户的用户信息和对应的行为标签作为一类支持向量机的训练样本进行训练,得到用于预测用户行为的一类支持向量机模型;
当接收到新用户的业务请求时将所述新用户的用户信息输入所述一类支持向量机模型,得到该新用户的行为标签,根据所述行为标签判定该新用户的业务请求是否包含异常行为并进行相应处理。
2.根据权利要求1所述的基于一类支持向量机的用户异常行为处理方法,其特征在于,所述获取历史用户的用户信息和对应的行为标签,进一步包括:
获取所述历史用户的用户身份信息、业务请求中产生的用户行为数据和实际的行为标签。
3.根据权利要求1或2所述的基于一类支持向量机的用户异常行为处理方法,其特征在于,所述将所述历史用户的用户信息和对应的行为标签作为一类支持向量机的训练样本进行训练,得到用于预测用户行为的一类支持向量机模型,进一步包括:
从所述历史用户的用户身份信息和用户行为数据中筛选出与用户异常行为相关性大于预设值的变量作为异常行为变量;
将所述异常行为变量转化为异常行为特征向量;
将所述异常特征向量输入基于一类支持向量机的机器学习模型进行训练;
根据得到的行为标签及实际的行为标签调整模型参数得到用于预测异常行为的一类支持向量机模型。
4.根据权利要求1-3任一项所述的基于一类支持向量机的用户异常行为处理方法,其特征在于,所述从所述历史用户的用户身份信息和用户行为数据中筛选出与用户异常行为相关性大于预设值的变量作为异常行为变量,进一步包括:
根据所述历史用户的用户身份信息和用户行为数据衍生出与用户异常行为相关性大于预设值的新行为变量;
将所述与用户异常行为相关性大于预设值的变量及行为变量作为异常行为变量。
5.根据权利要求1-4任一项所述的基于一类支持向量机的用户异常行为处理方法,其特征在于,所述将所述异常特征向量输入基于一类支持向量机的机器学习模型进行训练,进一步包括:
利用支持向量数据描述算法对所述机器学习模型进行训练。
6.根据权利要求1-5任一项所述的基于一类支持向量机的用户异常行为处理方法,其特征在于,所述根据得到的行为标签及实际的行为标签调整模型参数得到用于预测异常行为的一类支持向量机模型,进一步包括:
根据所述一类支持向量机模型的输出结果计算该历史用户的业务请求为异常行为概率;
根据不同的异常行为概率对所述历史用户进行分类,分别对每个类别的异常行为概率设置对应的阈值范围;
根据所述历史用户所在的类别设置对应的行为标签。
7.根据权利要求1-6任一项所述的基于一类支持向量机的用户异常行为处理方法,其特征在于,所述根据不同的异常行为概率对所述历史用户进行分类,分别对每个类别的异常行为概率设置对应的阈值范围,进一步包括:
将所述异常行为概率小于预设第一阈值范围的用户设置为第一类用户;
将所述异常行为概率大于预设第一阈值范围且小于预设第二阈值范围的用户设置为第二类用户;
将所述异常行为概率大于预设第二阈值范围内的用户设置为第三类用户。
8.根据权利要求1-7任一项所述的基于一类支持向量机的用户异常行为处理方法,其特征在于,所述当接收到新用户的业务请求时将所述新用户的用户信息输入所述一类支持向量机模型,得到该新用户的行为标签,根据所述行为标签判定该新用户的业务请求是否包含异常行为并进行相应处理,进一步包括:
当所述新用户为第一类用户时,判定该用户为正常行为用户,受理并通过该用户的业务请求;
当所述新用户为第二类用户时,判定该用户为疑似异常行为用户,受理并进一步审核该用户的业务请求;
当所述新用户为第三类用户时,判定该用户为异常行为用户,拒绝该用户的业务请求。
9.根据权利要求1-8任一项所述的基于一类支持向量机的用户异常行为处理方法,其特征在于,
所述用户身份信息包括:用户的年龄、职业、学历、收入及财产信息;
所述异常行为特征向量包括:用户APP个数、进行业务请求时页面停留时间及预设时间段内业务请求的次数转化的向量。
10.一种基于一类支持向量机的用户异常行为处理装置,其特征在于,包括:
信息获取模块,用于获取历史用户的用户信息和对应的行为标签;
模型训练模块,用于将所述历史用户的用户信息和对应的行为标签作为一类支持向量机的训练样本进行训练,得到用于预测异常行为的一类支持向量机模型;
异常行为处理模块,用于当接收到新用户的业务请求时将所述新用户的用户信息输入所述一类支持向量机模型,得到该新用户的行为标签,根据所述行为标签判定该新用户的业务请求是否包含异常行为并进行相应处理。
11.一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,其特征在于:
当所述计算机程序被所述处理器执行时,所述处理器执行如权利要求1-9中任一项所述的方法。
12.一种计算机可读介质,存储有计算机可执行程序,其特征在于,所述计算机可执行程序被执行时,实现如权利要求1-9中任一项所述的方法。
CN202110764855.1A 2021-07-06 2021-07-06 基于一类支持向量机的用户异常行为处理方法和装置 Active CN113591932B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110764855.1A CN113591932B (zh) 2021-07-06 2021-07-06 基于一类支持向量机的用户异常行为处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110764855.1A CN113591932B (zh) 2021-07-06 2021-07-06 基于一类支持向量机的用户异常行为处理方法和装置

Publications (2)

Publication Number Publication Date
CN113591932A true CN113591932A (zh) 2021-11-02
CN113591932B CN113591932B (zh) 2024-08-20

Family

ID=78246183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110764855.1A Active CN113591932B (zh) 2021-07-06 2021-07-06 基于一类支持向量机的用户异常行为处理方法和装置

Country Status (1)

Country Link
CN (1) CN113591932B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651574A (zh) * 2016-12-30 2017-05-10 苏州大学 一种个人信用评估方法及装置
CN109345260A (zh) * 2018-10-09 2019-02-15 北京芯盾时代科技有限公司 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置
US10572885B1 (en) * 2018-10-25 2020-02-25 Beijing Trusfort Technology Co., Ltd. Training method, apparatus for loan fraud detection model and computer device
CN111666502A (zh) * 2020-07-08 2020-09-15 腾讯科技(深圳)有限公司 一种基于深度学习的异常用户识别方法、装置及存储介质
CN113052324A (zh) * 2021-03-24 2021-06-29 支付宝(杭州)信息技术有限公司 一种用户异常模式识别方法、装置以及设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651574A (zh) * 2016-12-30 2017-05-10 苏州大学 一种个人信用评估方法及装置
CN109345260A (zh) * 2018-10-09 2019-02-15 北京芯盾时代科技有限公司 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置
US10572885B1 (en) * 2018-10-25 2020-02-25 Beijing Trusfort Technology Co., Ltd. Training method, apparatus for loan fraud detection model and computer device
CN111666502A (zh) * 2020-07-08 2020-09-15 腾讯科技(深圳)有限公司 一种基于深度学习的异常用户识别方法、装置及存储介质
CN113052324A (zh) * 2021-03-24 2021-06-29 支付宝(杭州)信息技术有限公司 一种用户异常模式识别方法、装置以及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PANG, GUANSONG 等: "Self-Trained Deep Ordinal Regression for End-to-End Video Anomaly Detection", 《CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》, 19 June 2020 (2020-06-19), pages 12170 - 12179, XP033804760, DOI: 10.1109/CVPR42600.2020.01219 *
王才成: "面向银行内网日志的用户异常行为检测模型设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 December 2020 (2020-12-15), pages 139 - 66 *

Also Published As

Publication number Publication date
CN113591932B (zh) 2024-08-20

Similar Documents

Publication Publication Date Title
US11531987B2 (en) User profiling based on transaction data associated with a user
US10726501B1 (en) Method to use transaction, account, and company similarity clusters derived from the historic transaction data to match new transactions to accounts
CN111127178A (zh) 数据处理方法与装置、存储介质、电子设备
CN111340616A (zh) 线上贷款的审批方法、装置、设备及介质
CN111523678A (zh) 业务的处理方法、装置、设备及存储介质
CN111783039B (zh) 风险确定方法、装置、计算机系统和存储介质
CN112950347B (zh) 资源数据处理的优化方法及装置、存储介质、终端
US10922633B2 (en) Utilizing econometric and machine learning models to maximize total returns for an entity
CN111179051A (zh) 金融目标客户确定方法、装置及电子设备
CN113010798A (zh) 信息推荐方法、信息推荐装置、电子设备及可读存储介质
CN111179055A (zh) 授信额度调整方法、装置和电子设备
CN113034046A (zh) 一种数据风险计量方法、装置、电子设备及存储介质
US20190114639A1 (en) Anomaly detection in data transactions
CN116664306A (zh) 风控规则的智能推荐方法、装置、电子设备及介质
CN113591932B (zh) 基于一类支持向量机的用户异常行为处理方法和装置
CN110362981B (zh) 基于可信设备指纹判断异常行为的方法及系统
Lee et al. Application of machine learning in credit risk scorecard
CN114119107A (zh) 一种钢贸企业交易测评方法、装置、设备及存储介质
CN114066513A (zh) 一种用户分类的方法和装置
CN113870007A (zh) 一种产品推荐方法、装置、设备及介质
CN113691592B (zh) 向设备提供网络服务的方法、装置、设备和介质
CN114036208B (zh) 一种模型训练和敏感度分析方法、装置、设备及介质
US20220207409A1 (en) Timeline reshaping and rescoring
CN115774859A (zh) 一种用户识别方法、装置和计算机设备
CN115409636A (zh) 产品风险预测方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant