CN108366045B - 一种风控评分卡的设置方法和装置 - Google Patents

一种风控评分卡的设置方法和装置 Download PDF

Info

Publication number
CN108366045B
CN108366045B CN201810002675.8A CN201810002675A CN108366045B CN 108366045 B CN108366045 B CN 108366045B CN 201810002675 A CN201810002675 A CN 201810002675A CN 108366045 B CN108366045 B CN 108366045B
Authority
CN
China
Prior art keywords
rule
abnormal
characteristic
wind control
rules
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810002675.8A
Other languages
English (en)
Other versions
CN108366045A (zh
Inventor
陈亚东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201810002675.8A priority Critical patent/CN108366045B/zh
Publication of CN108366045A publication Critical patent/CN108366045A/zh
Application granted granted Critical
Publication of CN108366045B publication Critical patent/CN108366045B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种风控评分卡的设置方法,该设置方法应用于网站的风控系统,具体为接收网站的业务系统传递的数据集合,数据集合包括多个规则;将每个规则组织为预设的特征形式,得到与多个规则相对应的多个特征数值;将多个特征数值利用基于密度的无监督聚类算法进行聚类处理,得到多个特征集合;将包含预先标注的异常样本的特征集合标注为异常样本,并获取每个异常样本中特征数值的取值范围;根据异常样本和采样得到的正常样本进行模型训练,得到监督学习模型;根据每个异常样本中特征数值的取值范围确定每个规则的阈值,建立基于规则树的风控评分卡。该风控评分卡能够避免现有评分卡无法反应用户访问行为的真实风险水平的问题。

Description

一种风控评分卡的设置方法和装置
技术领域
本发明涉及互联网技术领域,特别是涉及一种风控评分卡的设置方法和装置。
背景技术
网站的风控系统用于防范全站可能存在的业务安全风险,如:盗号、扫号、羊毛党、账号分享、短信轰炸机、恶意挂站、恶意下单、恶意支付等。风控系统致力于帮助业务方识别、评估、防范已有的业务风险,提供跨业务的保护功能,并提供风险事件的查询及反馈机制,方便溯源及后续持续改进。
网站在正常运行期间,其业务系统接收用户的访问行为,并通过服务接入将访问行为传递至风控系统的规则引擎,规则引擎主要依赖于安全数据仓库和模型策略对访问行为的风险进行检测和拦截。其中,安全数据仓库是指社工库,即黑产用户的信息,其中包含黑产用户的手机号、IP、用户名等;模型策略主要是由数据分析人员通过数据挖掘等方法制定出的规则策略。因此,当风控系统规则引擎接收到业务传入的访问数据时,通过某次行为数据匹配的规则是否有风险,而进行拦截。规则引擎主要通过评分卡方法进行判断,即累加一次异常行为触发的所有规则分值,比较总分和阈值确定最终风险等级。
然而,目前的规则引擎中采用的评分卡方法存在同类规则分值重复累加以及同类规则占比过大的问题,例如多个来源的IP黑名单规则分值重复累加,或者不同单维度(ip、用户设备device_id、设备指纹dfp)频次规则分值的累加也容易造成该类规则分值相加占比过大,从而无法反应访问行为的真实风险水平。
发明内容
有鉴于此,本发明提供了一种风控评分卡的设置方法和装置,以解决现有评分卡因同类规则分值重复累加以及同类规则占比过大的问题而导致无法反应用户访问行为的真实风险水平的问题。
为了解决上述问题,本发明公开了一种风控评分卡的设置方法,应用于网站的风控系统,所述设置方法包括步骤:
接收网站的业务系统传递的数据集合,所述数据集合包括多个规则;
将每个所述规则组织为预设的特征形式,得到与所述多个规则相对应的多个特征数值;
将所述多个特征数值利用基于密度的无监督聚类算法进行聚类处理,得到多个特征集合;
将包含预先标注的异常点的所述特征集合标注为异常样本,并获取每个所述异常样本中特征数值的取值范围;
根据所述异常样本和采样得到的正常样本进行模型训练,得到监督学习模型;
根据每个所述异常样本中特征数值的取值范围确定每个所述规则的阈值,建立基于规则树的风控评分卡。
可选的,还包括:
根据所述异常样本和采样得到的正常样本进行模型训练,得到监督学习模型,所述监督学习模型用于对用户的访问行为进行风险评价。可选的,所述根据所述异常样本和采样得到的正常样本进行模型训练,得到监督学习模型,还包括:
利用所述监督学习模型对未标注样本进行预测,得到正常结果和异常结果;
利用所述异常结果对所述监督学习模型进一步进行训练。
可选的,所述规则树包括叶子节点和非叶子节点,其中:
所述叶子节点的规则权重为1;
所述非叶子节点的规则权重为孩子节点的加权分值的最大值或者累加值。
可选的,还包括步骤:
分别利用所述监督学习模型和所述风控评分卡对用户访问行为进行判断,并根据每个判断结果的置信度确定最终判断结果。
相应的,为了保证上述方法的实施,本发明还提供了一种风控评分卡的设置装置,应用于网站的风控系统,所述设置装置包括:
数据接收模块,用于接收网站的业务系统传递的数据集合,所述数据集合包括多个规则;
特征组织模块,用于将每个所述规则组织为预设的特征形式,得到与所述多个规则相对应的多个特征数值;
聚类处理模块,用于将所述多个特征数值利用基于密度的无监督聚类算法进行聚类处理,得到多个特征集合;
聚类标注模块,用于将包含预先标注的异常点的所述特征集合标注为异常样本,并获取每个所述异常样本中特征数值的取值范围;
模型训练模块,用于根据所述异常样本和采样得到的正常样本进行模型训练,得到监督学习模型;
评分卡输出模块,用于根据每个所述异常样本中特征数值的取值范围确定每个所述规则的阈值,建立并输出基于规则树的风控评分卡。
可选的,还包括:
模型训练模块,用于根据所述异常样本和采样得到的正常样本进行模型训练,得到监督学习模型,所述监督学习模型用于对用户的访问行为进行风险评价。可选的,所述模型训练模块包括:
结果预测单元,用于利用所述监督学习模型对未标注样本进行预测,得到正常结果和异常结果;
第二训练单元,用于利用所述异常结果对所述监督学习模型进一步进行训练。
可选的,所述规则树包括叶子节点和非叶子节点,其中:
所述叶子节点的规则权重为1;
所述非叶子节点的规则权重为孩子节点的加权分值的最大值或者累加值。
可选的,还包括:
联合判断模块,用于分别利用所述监督学习模型和所述风控评分卡对用户访问行为进行判断,并根据每个判断结果的置信度确定最终判断结果。
从上述技术方案可以看出,本发明提供了一种风控评分卡的设置方法,该设置方法应用于网站的风控系统,具体为接收网站的业务系统传递的数据集合,数据集合包括多个规则;将每个规则组织为特征形式,得到与多个规则相对应的多个预设的特征数值;将多个特征数值利用基于密度的无监督聚类算法进行聚类处理,得到多个特征集合;将包含预先标注的异常样本的特征集合标注为异常样本,并获取每个异常样本中特征数值的取值范围;根据每个异常样本中特征数值的取值范围确定每个规则的阈值,建立基于规则树的风控评分卡。通过规则树将规则形成了具有层次关系的集合,进而可以灵活设定不同类型规则的分值占比,进而避免了现有评分卡无法反应用户访问行为的真实风险水平的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种风控评分卡的设置方法的步骤流程图;
图2为本发明实施例提供的一种规则树的示意图;
图3为本发明实施例提供的另一种风控评分卡的设置方法的步骤流程图;
图4为本发明实施例提供的一种风控评分卡的设置装置的结构框图;
图5为本发明实施例提供的另一种风控评分卡的设置装置的结构框图;
图6为本发明实施例提供的又一种风控评分卡的设置装置的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
图1为本发明实施例提供的一种风控评分卡的设置方法的步骤流程图。
参照图1所示,本实施例提供的风控评分卡的设置方法应用于网站的风控系统,该风控系统用于对业务系统传入的用户访问行为的性质进行检测,避免危险行为对网站造成损害。该设置方法用于设置风控系统的规则引擎对用户访问行为进行检测所需的风控评分卡。该设置方法具体包括步骤:
S101:接收风控系统传递的数据集合。
该数据集合来源于风控系统通过对网站的日志文件的加工处理所得的结果,该数据集合包括多个规则,规则是指与用户访问行为相关的因素,如发出访问行为的用户的ip、用户设备id、设备指纹等,相应的,可以为每个规则配置相应的规则名称。
S102:将每个规则组织为特征形式。
即将每个规则进行数据化,转换为相应的特征数据,通过将这些特征数据按预设的规律进行组织,即可得到特征形式。通过将多个特征数据进行归一化处理,从而得到与规则相匹配的特征数值,这里特征数值的数量与规则的数量相同。
S103:将多个特征数值进行聚类处理。
具体为将上述得到的多个特征数值利用基于密度的无监督聚类算法进行聚类处理,通过聚类得到多个特征集合,每个特征集合中包括按一定规律组织在一起的多个特征数值,由于相应的特征数值对应于相应的规则,也可以说每个特征集合包括若干规则。
无监督聚类算法又称为无监督学习的聚类算分,是指在没有先验数据的情况下自动进行的聚类处理,即将大量的数据进行归类。聚类算法也可以基于一定的先决条件,这里的基于密度的意思是指将数据的密度作为聚类的先决条件进行无经验归类处理。
S104:将包含异常点的特征集合标注为异常样本。
在聚类处理出的多个聚类中,每个聚类都相应包括多个规则数据,其中多个规则数据中异常的规则数据为异常点,这里将包含异常点的特征集合标注为异常样品。相应的,在标记处异常样本后,获取异常样本中的特征数值的取值范围,取值范围实际上是相应特征数值中最大值与最小值之间的范围。
S105:根据确定的阈值建立风控评分卡。
根据每个异常样本中特征数值的取值范围确定每个规则的阈值,并根据该阈值对相应规则进行赋值,从而根据赋值后的规则建立基于规则树的风控评分卡。其中,图2为规则树的示意图。
该规则树中各字段解释如下:
rule_name:规则名称(id)
is_leaf:是否叶子节点,叶子节点才是具体的规则
is_max:true取孩子节点最大值,false取累加值
score:规则分值
weight:规则权重
final_score:规则加权分值=score*weight
children:孩子节点
parent:父节点
在设置上述规则树时,设定叶子节点为每条具体的规则,可设置不同规则的分值,叶子节点的规则权重全为1,其贡献全部体现在分值。非叶子节点可通过设置is_max取孩子节点加权分值final_score的最大值或累加值,非叶子节点也可设置权重,作为不同规则集合类型的权重,例如可设置行为频次规则集合与标签类规则集合不同权重,用于风控评分不同倾向性的考虑。最终通过最上层的父节点的分值,即为评分卡的最终分值。
从上述技术方案可以看出,本实施例提供了一种风控评分卡的设置方法,该设置方法应用于网站的风控系统,具体为接收网站的业务系统传递的数据集合,数据集合包括多个规则;将每个规则组织为预设的特征形式,得到与多个规则相对应的多个特征数值;将多个特征数值利用基于密度的无监督聚类算法进行聚类处理,得到多个特征集合;将包含预先标注的异常样本的特征集合标注为异常样本,并获取每个异常样本中特征数值的取值范围;根据异常样本和采样得到的正常样本进行模型训练,得到监督学习模型;根据每个异常样本中特征数值的取值范围确定每个规则的阈值,建立基于规则树的风控评分卡。通过规则树将规则形成了具有层次关系的集合,进而可以灵活设定不同类型规则的分值占比,进而避免了现有评分卡无法反应用户访问行为的真实风险水平的问题。
另外,本实施例还包括步骤:根据异常样本和正常样本训练得到监督学习模型。
在得到相应的异常样本后,根据这些异常样本进行训练,从而得到监督学习模型。具体来说,是根据该异常样本对预设数学模型进行训练,从而得到上述监督学习模型。数学模型是指相应的算法模型,如K-means算法模型,K-medoids算法模型、CLARANS算法模型。该监督学习模型用于对用户的访问行为进行判断,以确定该行为是否为危险行为。
另外,在得到上述监督学习模型后,可以利用该模型对未标注样本进行预测,在预测后可以得到正常结果和异常结果;在预测后,还可以将得到的异常结果作为上述异常样本再次对监督学习模型进行强化训练,从而使得该监督学习模型的效果更好。这里的未标注样本实际是指在本实施例的聚类所得的异常样本和采样得到的正常样本外的其他样本,是系统为了训练该模型所获取的其他样本,
另外,参照图3所示,本实施例中的设定方法还包括如下步骤:
S106:对用户访问行为进行判断,并确定最终判断结果。
在得到上述监督学习模型和风控评分卡后,联合基于监督学习模型的判断结果和基于规则树的风控评分卡的判断结果进行协同判定,通过对两个结果的不同置信度的考虑,得到最终判断结果,这样一来可以提供风控系统在识别异常时的精确性和泛化性。
例如,如果基于监督学习模型对用户的访问行为的判断结果为危险行为,然而基于规则树的风控评分卡的判断结果为正常行为,则要考虑具体用户的特征,如果该用户的特征更适宜用基于监督学习模型进行判断,则最终确定该用户的行为为危险行为。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
实施例二
图4为本发明实施例提供的一种风控评分卡的设置最终的结构框图。
参照图4所示,本实施例提供的风控评分卡的设置最终应用于网站的风控系统,该风控系统用于对业务系统传入的用户访问行为的性质进行检测,避免危险行为对网站造成损害。该设置方法用于设置风控系统的规则引擎对用户访问行为进行检测所需的风控评分卡。该设置装置具体包括数据接收模块10、特征组织模块20、聚类处理模块30、聚类标注模块40和评分卡输出模块60。
数据接收模块用于接收风控系统传递的数据集合。
该数据集合来源于风控系统通过对网站的日志文件的加工处理所得的结果,该数据集合包括多个规则,规则是指与用户访问行为相关的因素,如发出访问行为的用户的ip、用户设备id、设备指纹等,相应的,可以为每个规则配置相应的规则名称。
特征组织模块用于将每个规则组织为特征形式。
即将每个规则进行数据化,转换为相应的特征数据,通过将这些特征数据按预设的规律进行组织,即可得到特征形式。通过将多个特征数据进行归一化处理,从而得到与规则相匹配的特征数值,这里特征数值的数量与规则的数量相同。
聚类处理模块用于将多个特征数值进行聚类处理。
具体为将上述得到的多个特征数值利用基于密度的无监督聚类算法进行聚类处理,通过聚类得到多个特征集合,每个特征集合中包括按一定规律组织在一起的多个特征数值,由于相应的特征数值对应于相应的规则,也可以说每个特征集合包括若干规则。
聚类标注模块用于将包含异常点的聚类标注为异常样本。
在聚类处理出的多个聚类中,每个聚类都相应包括多个规则数据,其中多个规则数据中异常的规则数据为异常点,这里将包含异常点的特征集合标注为异常样品。相应的,在标记处异常样本后,获取异常样本中的特征数值的取值范围,取值范围实际上是相应特征数值中最大值与最小值之间的范围。
评分卡输出模块用于根据异常样本中特征数值的取值范围确定规则的阈值建立风控评分卡。
根据每个异常样本中特征数值的取值范围确定每个规则的阈值,并根据该阈值对相应规则进行赋值,从而根据赋值后的规则建立基于规则树的风控评分卡。其中,图2为规则树的示意图。
该规则树中各字段解释如下:
rule_name:规则名称(id)
is_leaf:是否叶子节点,叶子节点才是具体的规则
is_max:true取孩子节点最大值,false取累加值
score:规则分值
weight:规则权重
final_score:规则加权分值=score*weight
children:孩子节点
parent:父节点
在设置上述规则树时,设定叶子节点为每条具体的规则,可设置不同规则的分值,叶子节点的规则权重全为1,其贡献全部体现在分值。非叶子节点可通过设置is_max取孩子节点加权分值final_score的最大值或累加值,非叶子节点也可设置权重,作为不同规则集合类型的权重,例如可设置行为频次规则集合与标签类规则集合不同权重,用于风控评分不同倾向性的考虑。最终通过最上层的父节点的分值,即为评分卡的最终分值。
从上述技术方案可以看出,本实施例提供了一种风控评分卡的设置装置,该设置装置应用于网站的风控系统,具体为接收网站的业务系统传递的数据集合,数据集合包括多个规则;将每个规则组织为预设的特征形式,得到与多个规则相对应的多个特征数值;将多个特征数值利用基于密度的无监督聚类算法进行聚类处理,得到多个特征集合;将包含预先标注的异常样本的特征集合标注为异常样本,并获取每个异常样本中特征数值的取值范围;根据异常样本和采样得到的正常样本进行模型训练,得到监督学习模型;根据每个异常样本中特征数值的取值范围确定每个规则的阈值,建立基于规则树的风控评分卡。通过规则树将规则形成了具有层次关系的集合,进而可以灵活设定不同类型规则的分值占比,进而避免了现有评分卡无法反应用户访问行为的真实风险水平的问题。
另外,本实施例还包括模型训练模块50,如图5所示,模型训练模块用于根据异常样本和正常样本训练得到监督学习模型。
在得到相应的异常样本后,根据这些异常样本进行训练,从而得到监督学习模型。该模块包括第一训练单元,具体来说,第一训练单元用于根据该异常样本对预设数学模型进行训练,从而得到上述监督学习模型。该模块用于利用监督学习模型用于对用户的访问行为进行判断,以确定该行为是否为危险行为。
另外,该模块还包括结果预测单元和第二训练单元,结果预测单元用于在得到上述监督学习模型后,利用该模型对未标注样本进行预测,在预测后可以得到正常结果和异常结果;第二训练单元用于在预测后,将得到的异常结果作为上述异常样本再次对监督学习模型进行强化训练,从而使得该监督学习模型的效果更好。
另外,参照图6所示,本实施例中的设定装置还包括联合判断模块70。
联合判断模块用于对用户访问行为进行判断,并根据判断结果确定最终判断结果。
在得到上述监督学习模型和风控评分卡后,联合基于监督学习模型的判断结果和基于规则树的风控评分卡的判断结果进行协同判定,通过对两个结果的不同置信度的考虑,得到最终判断结果,这样一来可以提供风控系统在识别异常时的精确性和泛化性。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的技术方案进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种风控评分卡的设置方法,应用于网站的风控系统,其特征在于,所述设置方法包括步骤:
接收网站的业务系统传递的数据集合,所述数据集合包括多个规则;
将每个所述规则组织为预设的特征形式,得到与所述多个规则相对应的多个特征数值;
将所述多个特征数值利用基于密度的无监督聚类算法进行聚类处理,得到多个特征集合;
将包含预先标注的异常点的所述特征集合标注为异常样本,并获取每个所述异常样本中特征数值的取值范围;
根据每个所述异常样本中特征数值的取值范围确定每个所述规则的阈值,建立基于规则树的风控评分卡,以灵活设定所述规则树中不同类型规则的分值占比,所述规则树包含多个所述规则。
2.如权利要求1所述的设置方法,其特征在于,还包括:
根据所述异常样本和采样得到的正常样本进行模型训练,得到监督学习模型,其中,所述监督学习模型用于对用户的访问行为进行风险评价。
3.如权利要求2所述的设置方法,其特征在于,所述根据所述异常样本和采样得到的正常样本进行模型训练,得到监督学习模型,还包括:
利用所述监督学习模型对未标注样本进行预测,得到正常结果和异常结果;
利用所述异常结果对所述监督学习模型进一步进行训练。
4.如权利要求1所述的设置方法,其特征在于,所述规则树包括叶子节点和非叶子节点,其中:
所述叶子节点的规则权重为1;
所述非叶子节点的规则权重为孩子节点的加权分值的最大值或者累加值。
5.如权利要求2所述的设置方法,其特征在于,还包括步骤:
分别利用所述监督学习模型和所述风控评分卡对用户访问行为进行判断,并根据每个判断结果的置信度确定最终判断结果。
6.一种风控评分卡的设置装置,应用于网站的风控系统,其特征在于,所述设置装置包括:
数据接收模块,用于接收网站的业务系统传递的数据集合,所述数据集合包括多个规则;
特征组织模块,用于将每个所述规则组织为预设的特征形式,得到与所述多个规则相对应的多个特征数值;
聚类处理模块,用于将所述多个特征数值利用基于密度的无监督聚类算法进行聚类处理,得到多个特征集合;
聚类标注模块,用于将包含预先标注的异常点的所述特征集合标注为异常样本,并获取每个所述异常样本中特征数值的取值范围;
评分卡输出模块,用于根据每个所述异常样本中特征数值的取值范围确定每个所述规则的阈值,建立并输出基于规则树的风控评分卡,以灵活设定所述规则树中不同类型规则的分值占比,所述规则树包含多个所述规则。
7.如权利要求6所述的设置装置,其特征在于,还包括:
模型训练模块用于根据所述异常样本和采样得到的正常样本进行模型训练,得到监督学习模型,所述监督学习模型用于对用户的访问行为进行风险评价。
8.如权利要求7所述的设置装置,其特征在于,所述模型训练模块包括:
结果预测单元,用于利用所述监督学习模型对未标注样本进行预测,得到正常结果和异常结果;
第二训练单元,用于利用所述异常结果对所述监督学习模型进一步进行训练。
9.如权利要求6所述的设置装置,其特征在于,所述规则树包括叶子节点和非叶子节点,其中:
所述叶子节点的规则权重为1;
所述非叶子节点的规则权重为孩子节点的加权分值的最大值或者累加值。
10.如权利要求7所述的设置装置,其特征在于,还包括:
联合判断模块,用于分别利用所述监督学习模型和所述风控评分卡对用户访问行为进行判断,并根据每个判断结果的置信度确定最终判断结果。
CN201810002675.8A 2018-01-02 2018-01-02 一种风控评分卡的设置方法和装置 Active CN108366045B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810002675.8A CN108366045B (zh) 2018-01-02 2018-01-02 一种风控评分卡的设置方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810002675.8A CN108366045B (zh) 2018-01-02 2018-01-02 一种风控评分卡的设置方法和装置

Publications (2)

Publication Number Publication Date
CN108366045A CN108366045A (zh) 2018-08-03
CN108366045B true CN108366045B (zh) 2020-09-01

Family

ID=63011071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810002675.8A Active CN108366045B (zh) 2018-01-02 2018-01-02 一种风控评分卡的设置方法和装置

Country Status (1)

Country Link
CN (1) CN108366045B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009170B (zh) * 2018-11-05 2023-04-07 蚂蚁金服(杭州)网络技术有限公司 模型评分校正方法、装置及服务器
CN109525595B (zh) * 2018-12-25 2021-04-16 广州方硅信息技术有限公司 一种基于时间流特征的黑产账号识别方法及设备
CN109598095B (zh) * 2019-01-07 2023-08-08 平安科技(深圳)有限公司 评分卡模型的建立方法、装置、计算机设备和存储介质
CN109936561B (zh) * 2019-01-08 2022-05-13 平安科技(深圳)有限公司 用户请求的检测方法、装置、计算机设备及存储介质
CN109905362B (zh) * 2019-01-08 2022-05-13 平安科技(深圳)有限公司 用户请求的检测方法、装置、计算机设备及存储介质
CN111860554B (zh) * 2019-04-28 2023-06-30 杭州海康威视数字技术股份有限公司 风险监控方法、装置、存储介质及电子设备
CN110334936B (zh) * 2019-06-28 2023-09-29 创新先进技术有限公司 一种信贷资质评分模型的构建方法、装置和设备
CN111046425B (zh) * 2019-12-12 2021-07-13 支付宝(杭州)信息技术有限公司 多方联合进行风险识别的方法和装置
CN111242195B (zh) * 2020-01-06 2023-06-20 蚂蚁胜信(上海)信息技术有限公司 模型、保险风控模型训练方法、装置及电子设备
CN111723367B (zh) * 2020-06-12 2023-06-23 国家电网有限公司 一种电力监控系统业务场景处置风险评价方法及系统
CN112232944B (zh) * 2020-09-29 2024-05-31 中诚信征信有限公司 一种评分卡创建方法、装置和电子设备
CN112199416A (zh) * 2020-09-30 2021-01-08 支付宝(杭州)信息技术有限公司 数据规则生成方法及装置
CN112686521B (zh) * 2020-12-25 2024-08-20 江苏通付盾科技有限公司 一种风控规则调优方法和系统
CN114625786B (zh) * 2022-05-12 2022-08-09 杭银消费金融股份有限公司 一种基于风控技术的动态数据挖掘方法及系统
CN116012123B (zh) * 2023-03-27 2023-07-04 湖南三湘银行股份有限公司 一种基于Rete算法的风控规则引擎方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101714273A (zh) * 2009-05-26 2010-05-26 北京银丰新融科技开发有限公司 一种基于规则引擎的银行异常业务监控方法和系统
CN102376067A (zh) * 2010-08-20 2012-03-14 许威 基于金融信用贷款的评分卡系统及实现方法
CN102722814A (zh) * 2012-06-01 2012-10-10 汪德嘉 一种网上交易欺诈风险的自适应可控管理系统
CN104504901A (zh) * 2014-12-29 2015-04-08 浙江银江研究院有限公司 一种基于多维数据的交通异常点检测方法
CN106408423A (zh) * 2016-11-25 2017-02-15 泰康保险集团股份有限公司 用于风险评估的方法、系统及构建风险评估系统的方法
CN106875272A (zh) * 2017-02-20 2017-06-20 山东浪潮商用系统有限公司 一种全流程模型规则商业银行个贷逾期催收管理系统
CN107392451A (zh) * 2017-07-11 2017-11-24 重庆卡西匚匚科技有限公司 一种风险控制系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10162969B2 (en) * 2014-09-10 2018-12-25 Honeywell International Inc. Dynamic quantification of cyber-security risks in a control system

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101714273A (zh) * 2009-05-26 2010-05-26 北京银丰新融科技开发有限公司 一种基于规则引擎的银行异常业务监控方法和系统
CN102376067A (zh) * 2010-08-20 2012-03-14 许威 基于金融信用贷款的评分卡系统及实现方法
CN102722814A (zh) * 2012-06-01 2012-10-10 汪德嘉 一种网上交易欺诈风险的自适应可控管理系统
CN104504901A (zh) * 2014-12-29 2015-04-08 浙江银江研究院有限公司 一种基于多维数据的交通异常点检测方法
CN106408423A (zh) * 2016-11-25 2017-02-15 泰康保险集团股份有限公司 用于风险评估的方法、系统及构建风险评估系统的方法
CN106875272A (zh) * 2017-02-20 2017-06-20 山东浪潮商用系统有限公司 一种全流程模型规则商业银行个贷逾期催收管理系统
CN107392451A (zh) * 2017-07-11 2017-11-24 重庆卡西匚匚科技有限公司 一种风险控制系统

Also Published As

Publication number Publication date
CN108366045A (zh) 2018-08-03

Similar Documents

Publication Publication Date Title
CN108366045B (zh) 一种风控评分卡的设置方法和装置
CN110399925B (zh) 账号的风险识别方法、装置及存储介质
CN109525595B (zh) 一种基于时间流特征的黑产账号识别方法及设备
CN109241711A (zh) 基于预测模型的用户行为识别方法及装置
CN111614690A (zh) 一种异常行为检测方法及装置
CN104184763B (zh) 一种反馈信息处理方法及系统、服务设备
CN108833186A (zh) 一种网络攻击预测方法及装置
CN104040963A (zh) 用于使用字符串的频谱进行垃圾邮件检测的系统和方法
CN104202291A (zh) 基于多因素综合评定方法的反钓鱼方法
CN112839014B (zh) 建立识别异常访问者模型的方法、系统、设备及介质
CN114244611B (zh) 异常攻击检测方法、装置、设备及存储介质
CN110162958B (zh) 用于计算设备的综合信用分的方法、装置和记录介质
CN103631787A (zh) 网页类型识别方法以及网页类型识别装置
CN114329455B (zh) 基于异构图嵌入的用户异常行为检测方法及装置
CN111079184A (zh) 防护数据泄漏的方法、系统、设备以及存储介质
CN110020161B (zh) 数据处理方法、日志处理方法和终端
CN108876314B (zh) 一种职业生涯专业能力可追溯方法及平台
CN114548118A (zh) 一种服务对话检测方法及系统
CN107766737B (zh) 一种数据库审计方法
CN111931186B (zh) 软件风险识别方法及装置
CN114024761A (zh) 网络威胁数据的检测方法、装置、存储介质及电子设备
CN110532773A (zh) 恶意访问行为识别方法、数据处理方法、装置和设备
CN115982646B (zh) 一种基于云平台的多源测试数据的管理方法及系统
CN113112323A (zh) 基于数据分析的异常订单识别方法、装置、设备及介质
CN111988327A (zh) 威胁行为检测和模型建立方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant