CN110728458B - 一种目标对象的风险监测方法、装置及电子设备 - Google Patents

一种目标对象的风险监测方法、装置及电子设备 Download PDF

Info

Publication number
CN110728458B
CN110728458B CN201910992564.0A CN201910992564A CN110728458B CN 110728458 B CN110728458 B CN 110728458B CN 201910992564 A CN201910992564 A CN 201910992564A CN 110728458 B CN110728458 B CN 110728458B
Authority
CN
China
Prior art keywords
data
historical
day
characteristic
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910992564.0A
Other languages
English (en)
Other versions
CN110728458A (zh
Inventor
许小龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN201910992564.0A priority Critical patent/CN110728458B/zh
Publication of CN110728458A publication Critical patent/CN110728458A/zh
Application granted granted Critical
Publication of CN110728458B publication Critical patent/CN110728458B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Educational Administration (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例提供一种目标对象的风险监测方法、装置及电子设备。所述方法包括:获取预定时间段内目标对象所产生的历史数据,对所述历史数据进行统计得到第一历史时序数据和第二历史时序数据;对所述第一历史时序数据进行分解得到趋势特征数据、周期特征数据和随机特征数据,对所述第二历史时序数据内的数据进行相似度计算得到相似度的值;将所述趋势特征数据与相似度的值进行向前差分得到相似度差分结果,并利用异常检测算法求解得到异常情况分值;分别计算所述异常情况分值、周期特征数据和随机特征数据的特征变量,并对所述特征变量进行加权求和,得到所述目标对象的风险分值,从而根据所述风险分值实现对目标对象的风险监测。

Description

一种目标对象的风险监测方法、装置及电子设备
技术领域
本说明书涉及数据处理技术领域,尤其涉及一种目标对象的风险监测方法、装置及电子设备。
背景技术
随着互联网技术及应用的快速发展,各种互联网服务及平台应运而生,为了满足对这些互联网服务及平台的监管要求,风险监测技术得到了广泛应用。以互联网电商领域为例,随着电商不断普及,中国已经成为世界上最大的电商消费市场,同时,也拥有着全世界最大规模的网上商铺。但是,由于线上电商平台存在网上监管弱等特点,导致有些商家利用线上商铺进行黄赌毒、欺诈、洗钱等不法行为,这些行为不仅扰乱了市场秩序,还对消费者带来十分大的损失和伤害,极大地破坏了健康的电商环境和消费体验。因此,为了维护电商平台的稳定性,保护电商平台的安全,对线上商铺、网店等的经营风险进行监测显得尤为重要。
现有技术中,对线上商铺或网店进行风险监测时,对于稳定增长型的经营状况,容易被识别成为异常经营情况,并且一旦线上商铺或网店的访问量呈指数型增长时,极易被认定为经营不稳定,但是这种指数型增长的流量却是平台所希望看到的,另外对于周期性的稳定,目前的风险监测方法无法识别为周期稳定,并将其定义为存在风险的线上商铺。
基于现有技术,需要提供一种高效便捷、准确严谨的风险监测方案。
发明内容
本说明书实施例提供一种目标对象的风险监测方法、装置及电子设备,以解决现有技术存在的风险监测识别准确性差的问题。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种目标对象的风险监测方法,包括:
获取预定时间段内目标对象所产生的历史数据;
根据所述预定时间段对所述历史数据执行统计操作得到历史时序数据,所述历史时序数据包括第一历史时序数据和第二历史时序数据;
对所述第一历史时序数据进行分解得到趋势特征数据、周期特征数据和随机特征数据,并对所述第二历史时序数据内的数据进行相似度计算得到相似度的值;
将所述趋势特征数据与相似度的值进行向前差分得到相似度差分结果,并以所述相似度差分结果作为输入参数,利用异常检测算法求解得到异常情况分值;
分别根据所述异常情况分值、周期特征数据和随机特征数据,计算各自对应的特征变量,将所述特征变量按照预设的权重进行加权求和,得到所述目标对象的风险分值,根据所述风险分值对所述目标对象进行风险监测。
本说明书实施例提供的一种目标对象的风险监测装置,包括:
获取模块,用于获取预定时间段内目标对象所产生的历史数据;
统计模块,用于根据所述预定时间段对所述历史数据执行统计操作得到历史时序数据,所述历史时序数据包括第一历史时序数据和第二历史时序数据;
分解模块,用于对所述第一历史时序数据进行分解得到趋势特征数据、周期特征数据和随机特征数据,并对所述第二历史时序数据内的数据进行相似度计算得到相似度的值;
差分模块,用于将所述趋势特征数据与相似度的值进行向前差分得到相似度差分结果,并以所述相似度差分结果作为输入参数,利用异常检测算法求解得到异常情况分值;
风险模块,用于分别根据所述异常情况分值、周期特征数据和随机特征数据,计算各自对应的特征变量,将所述特征变量按照预设的权重进行加权求和,得到所述目标对象的风险分值,根据所述风险分值对所述目标对象进行风险监测。
本说明书实施例提供的一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述一种目标对象的风险监测方法。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过获取预定时间段内目标对象所产生的历史数据,对历史数据进行统计得到第一历史时序数据和第二历史时序数据;对第一历史时序数据进行分解得到趋势特征数据、周期特征数据和随机特征数据,对第二历史时序数据内的数据进行相似度计算得到相似度的值;将趋势特征数据与相似度的值进行向前差分得到相似度差分结果,并利用异常检测算法求解得到异常情况分值;分别计算异常情况分值、周期特征数据和随机特征数据的特征变量,并对特征变量进行加权求和,得到目标对象的风险分值,从而根据风险分值实现对目标对象的风险监测。基于本方案,能够结合不同特征维度进行风险监测,使得监测结果更加准确严谨,并最终提升了用户购物安全感以及电商平台的稳定性,有利于维护商家的利益。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书的方案在一种实际应用场景下涉及的平台整体架构的示意图;
图2为本说明书实施例提供的一种目标对象的风险监测方法的流程示意图;
图3为本说明书实施例提供的一种目标对象的风险监测装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
随着互联网技术的迅速发展,基于互联网技术的服务及平台如雨后春笋般涌现出来,对于提供互联网服务的线上平台来说需要满足法律的监管要求,为了提前感知黄赌毒、欺诈、洗钱等违法行为,通过发觉并解决这些问题,对于用户及为用户提供服务的互联网平台来说显得尤为重要,因此,基于风险监测的互联网平台稳定性预测和评估技术也得到了迅速发展。
以互联网电商的应用场景为例,在目前的传统风险监测方法中,需要采集长期数据才能进行预测,并且无法去除趋势性数据,仅仅能识别异常点。现有的风险监测技术对于稳定增长型的商铺经营状况,容易识别成为异常经营情况。一旦线上商城或网店的访问量和访问人数呈指数型增长时,按照期望和标准差的方法进行判断时,极易被定义为经营不稳定,但是这种指数型增长的用户访问状况却是平台所希望看到的,这种客户也具有十分强劲的流量属性。对于周期性的稳定,目前的风险监测方法也无法识别为周期稳定,会将其定义为存在风险的经营商铺。
针对上述情况,对于各种线上服务平台来说,需要一种能准确识别各种情形下的风险,进而实现高效、准确地预测平台经营稳定性,提升用户购物安全感并能维护商家利益的风险监测方案。
需要说明的是,本说明书实施例中所说的“目标对象”不限于电商领域中的线上商铺、网店等,任何互联网线上服务平台及网站均可以当作风险监测的目标对象,例如:提供金融、交易、社交、广告、资讯服务及产品的网站、移动应用、小程序等,本说明书以下实施例是以提供金融产品及服务的电商平台为应用场景,将电商平台中的线上商铺或网店作为目标对象进行说明的,不同的应用场景及目标对象不构成对本申请保护范围的限定。
图1为本说明书的技术方案在一种实际应用场景下涉及的平台整体架构的示意图。平台整体架构包括至少一个用于存储历史数据的数据库,该数据库既可以是整个平台的数据库,也可以是平台中各个线上商铺所对应的数据库,当每个线上商铺对应一个数据库时,此时数据库中可以只存储与该数据库对应的线上商铺的历史数据。图1的平台数据库中包含了三个商铺的历史数据,即商铺A、商铺B和商铺C,在实际应用中,平台数据库中可以包含一个或多个商铺的历史数据,不同商铺的数量不构成对本申请保护范围的限定。本说明书实施例中的线上商铺可以理解为提供线上产品(包括虚拟产品、金融产品、实际商品等)服务及交易的线上商家。
在本说明书实施例中,数据库中的历史数据可以来自于一个或多个不同的流量入口,所述流量入口包括但不限于:各类网站(如搜索引擎、门户网站、检索网站、购物网站等)、移动应用(如移动终端上的各类APP)、社交平台(如社交网站、微博、论坛等)、其他流量入口(如电视、直播、短视屏、自媒体等),流量入口的类型不构成对本申请保护范围的限定。
用户可通过流量入口访问平台上的任意商铺(即目标对象),这样便在平台的后台数据库中产生了用户的访问数据和交易数据等,基于这部分数据,利用本说明书实施例提供的风险监测方案,计算每个商铺的风险分值,以风险分值作为风险指标就可以准确判断出商铺的经营风险,从而预防或阻止违法行为,提升用户的购物安全感和平台稳定性。
基于上述场景,下面对本说明书的方案进行详细说明。
图2为本说明书实施例提供的一种目标对象的风险监测方法的流程示意图,该方法具体可以包括以下步骤:
在步骤S210中,获取预定时间段内目标对象所产生的历史数据。
在本说明书一个或多个实施例中,可以从一个或多个数据库中获取预定时间段内目标对象所产生的历史数据,在选择预定时间段时,可以根据线上商铺的经营时间来确定,时间段既可以是以天为单位选定的时间区间,也可以是以两个不同的先后时间点之间的时间区间作为时间段。当以天为单位选定时间段时,既可以认为0点至24点为一天,也可以将任意24小时作为一天,例如:选定1月1日至1月31日,将这31天作为上述预定的时间段,或者选定1月1日8点至1月31日8点,将这31天作为上述预定的时间段。还可以采用两个不同的先后时间点作为时间段时,例如可以选定1月1日8点至1月31日21点,将该时间区间作为预定的时间段。
进一步地,在本说明书一实施例中,可以在商铺经营时间范围内选择不少于28天作为上述预定的时间段,优选地,本说明书以下实施例中以28天作为时间段来获取目标对象(即线上商铺)所产生的历史数据,之所以选择28天作为时间段,是因为如果线上商铺的经营时间不足28天,获取到的历史数据无法有效的作为支撑风险判断的依据,而数据量太大又会影响处理效率。当线上商铺的经营时间小于28天时,可以采用历史数据的平均值或者用0补全。当然,在实际应用中,上述预定的时间段可以选择任意的时间区间,本说明书实施例中对时间段的选择不构成对本申请技术方案的限定。
进一步地,在本说明书一实施例中,历史数据包括用户对目标对象的历史访问数据和/或历史交易数据,其中,历史访问数据包括访问量、访问人数、访问人次、访问时长中的一种或多种,访问量等于访问人数乘以访问人次,访问人数以用户的IP地址来确定,一个IP地址在一天内访问同一商铺,无论访问次数为几次,对于这一天来说该商铺的访问人数加1,同理,对于不同访问时间段来说,同一时间间隔内无论访问次数为几次,对于这该时间间隔来说商铺的访问人数加1。历史交易数据包括但不限于交易额等数据。
在步骤S220中,根据所述预定时间段对所述历史数据执行统计操作得到历史时序数据,所述历史时序数据包括第一历史时序数据和第二历史时序数据。
在本说明书一个或多个实施例中,可以将步骤S210收集到的历史数据统计为两种类型的历史时序数据,即第一历史时序数据和第二历史时序数据,统计过程具体可以包括以下内容:
将预定时间段按照连续的第一时间间隔分割成多个时间序列,并从时间序列中确定出多个第二时间间隔,根据时间序列以及第二时间间隔将历史数据统计为第一历史时序数据和第二历史时序数据。
具体地,在本说明书实施例中,时序数据可以是指时间序列数据,时间序列数据可以指将数据以同一个或多个指标按时间顺序记录出来的数据列,在同一数据列中的各个数据应当是同口径的,具有可比性。为了将历史数据转化为历史时序数据,可以通过一个固定的时间段(即第一时间间隔)将上述的预定时间段分割成多个连续的时间序列,第一时间间隔既可以是完整的一天或多天,也可以是固定时长的时间段,例如:预定时间段为28天,以一天、两天或20个小时作为第一时间间隔,从而根据选定的第一时间间隔连续不断地将预定时间段分割成若干个时间序列。在将时间段分割成若干个时间序列之后,还可以在时间序列中选择多个时间间隔作为第二时间间隔,同一时间序列内的多个第二时间间隔的时间段可以相同或者不同,也可以连续或者不连续。例如:预定时间段为28天,第一时间间隔的时间段为一天,通过将预定时间段(28天)按照连续的第一时间间隔(一天)分割成多个时间序列(连续的28天),再以每个时间序列内连续的1小时作为第二时间间隔,从而将这连续的28天中的每一天都分割成了24个小时。
进一步地,在本说明书一个或多个实施例中,根据上述对预定时间段的划分,就可以得到多个时间序列以及每个时间序列内的多个第二时间间隔,通过将历史数据按照这两种时序进行统计,就可以得到第一历史时序数据和第二历史时序数据,例如以一天作为第一时间间隔,以每个小时作为第二时间间隔,那么第一历史时序数据就可以统计为每天的历史时序数据,第二历史时序数据就可以统计为每天内逐个小时的历史时序数据。
继续上述实施例,当历史数据为历史访问数据时,历史访问数据可包括访问量、访问人数以及访问时长,按照上述对历史数据的时序统计方法,就可以得到目标对象在28天内的以天为统计单位的第一历史时序数据,即每天的访问量(包括不同流量入口的访问量)、访问人数(包括不同流量入口的访问人数)以及访问时长(包括不同流量入口的访问时长),同时,也可以得到每天内逐个小时的第二历史时序数据,即每天逐个小时的访问量、访问人数和访问时长。由此可以看出,本说明书实施例中历史数据是可被时序化的数据,即只要可以按照一定的时间序列进行排列的,无论何种类型的数据都可以视为历史数据。
在步骤S230中,对所述第一历史时序数据进行分解得到趋势特征数据、周期特征数据和随机特征数据,并对所述第二历史时序数据内的数据进行相似度计算得到相似度的值。
在本说明书一个或多个实施例中,步骤S230可以包括两方面的内容,即第一方面,对以天为统计单位划分得到的第一历史时序数据(即每天的历史时序数据)进行分解获得趋势、周期、随机三个维度的特征数据;第二方面,对逐个小时统计得到的第二历史时序数据进行相似度计算得到相似度的值。
针对第一方面,可以基于X-11分解算法对每天的历史时序数据进行分解得到每天的趋势特征数据、周期特征数据和随机特征数据。X-11分解算法的作用是将时间序列数据分解为趋势、周期、随机三个部分,通过这三个部分可以用来预测一些变动(如商铺经营状况的变动),其中随机特征数据可以用来预测商铺每天经营状况中的不规则变动要素。下面以一种具体场景为例对X-11方法的原理进行简要说明:
在季节性ARIMA(自回归积分移动平均)模型的经济统计预测中,X-11方法得到了相当广泛地应用。X-11方法认为,某些非平稳时间序列{xt}(t=1,2,…,N)由三部分组成:一部分是趋势分量,记为{Tt};一部分是周期性序列,称为周期分量,记为{St},且可以规定其周期为12;另一部分是不规则分量(随机分量),记为{εt},它可以是一个平稳随机序列。因此,可以将上述非平稳时间序列用数学表达式表示为:xt=Tt+St+εt;X-11方法通过对{Tt}进行一系列的滤波,便可以从{xt}中分解获得{Tt}、{St}和{εt}。
针对第二方面,本说明书实施例中对于每天逐小时的历史时序数据(即第二历史时序数据),可以进行T和T-1数据的相似度计算,分别得到每天与其前一天的相似度的值。本说明书实施例中描述相邻两天的相似度可以同时使用DTW和欧拉距离的计算结果,也可以单独使用DTW或欧拉距离的计算结果,即相似度的值可以包括DTW值和/或欧拉距离,在实际应用中,对第二历史时序数据进行相似度计算得到相似度的值,可以包括以下内容:
利用DTW算法对每天内多个第二时间间隔的历史时序数据分别与其前一天内对应时间间隔的历史时序数据进行相似度计算得到每个第二时间间隔的DTW值,将第二时间间隔的DTW值相加得到每天的DTW值;和/或,
基于欧拉公式对每天内多个第二时间间隔的历史时序数据分别与其前一天内对应时间间隔的历史时序数据进行相似度计算得到每个第二时间间隔的欧拉距离,将第二时间间隔的欧拉距离相加得到每天的欧拉距离。
进一步地,DTW(Dynamic Time Warping,动态时间弯曲)算法可以用来计算两个时间序列的相似性,而且两个时间序列的长度可以相同或不同,在实际应用中,可以使用基于模板匹配的DTW算法进行相似度计算。具体地,在利用DTW算法进行相似度计算时,为了便于比较两个时间序列的相似度,通过将其中一个或两个时间序列在时间轴下进行扭曲,使其达到更好的对齐,利用DTW算法将时间序列进行延伸和缩短,并通过计算两个时间序列中所有对应点的距离之和来判断相似度,即DTW算法可以是通过计算两个时间序列之间的最短路径,达到计算相似性的目的。
继续上述实施例,针对28天内每天逐小时的历史时序数据,利用DTW算法,针对逐小时的历史时序数据进行T和T-1数据的相似度计算,例如:将每天按照连续的1小时作为第二时间间隔进行划分,得到每天内逐小时的历史时序数据(如每天逐小时的访问量、访问人数等),通过将每天与其前一天中对应时间间隔的历史时序数据进行向前的DTW相似度计算,并将所有时间间隔的DTW值相加,就可以得到27个具有时序的DTW相似度的值,该时序相似度的值可以描述两天流量的相似程度,相似度数值越小说明该线上商铺每天的流量越相似。
需要说明的是,由于将T和T-1的数据进行相似度计算后,只能得到T-1个相似度的值,因此实际应用中,可以将得到的DTW值归为后一天(即T)的DTW值,对于第一天的DTW值可以用0或所有DTW值的平均值进行替代;当然,也可以将得到的DTW值归为前一天(即T-1)的DTW值,对于最后一天的DTW值可以用0或所有DTW值的平均值进行补全。
在一具体实施例中,还可以针对28天内每天逐小时的历史时序数据,计算T和T-1数据在对应第二时间间隔的欧拉距离,将所有第二时间间隔的欧拉距离相加得到每天的欧拉距离;具体地,可以将每天逐个小时的访问量、访问人数减去前一天对应时间间隔的相应值,例如:将1月2号9点-10点的访问量数据与1月1号9点-10点的访问量数据相减,就可以得到该时间间隔的欧拉距离,将逐个小时的所有欧拉距离相加即可。在实际应用中,由于采集的是从第一天开始连续28天的历史时序数据,因此在计算第一天的欧拉距离时,第一天的前一天的历史时序数据是不存在的,因此为了便于计算,可以将其前一天内的逐个小时的访问量、访问人数等第二历史时序数据用0或均值进行补全。
根据以上实施例的内容,针对第二历史时序数据计算其相似度的值时,可以同时计算DTW值和欧拉距离,并同时使用DTW和欧拉距离的计算结果来描述两天的相似情况,因此可以更加准确的获得预定时间段内,每一天与其前一天相同时刻的流量差别,并且可以准确地计算相似情况及流量不同时的偏差。
在步骤S240中,将所述趋势特征数据与所述相似度的值进行向前差分得到相似度差分结果,并以所述相似度差分结果作为输入参数,利用异常检测算法求解得到异常情况分值。
在本说明书一个或多个实施例中,可以将步骤S230中分解得到的趋势特征数据与计算得到的相似度值进行向前差分得到相似度差分结果,具体地,向前差分可以包括以下内容:
将每天的趋势特征数据与其前一天的DTW值进行向前差分得到每天的相似度差分结果;和/或,
将每天的趋势特征数据与其前一天的欧拉距离进行向前差分得到每天的相似度差分结果。
继续上述实施例,在利用X-11方法对每天的历史时序数据(即第一历史时序数据)进行分解后可以得到每天的趋势特征数据,另外,由于在对第二历史时序数据进行相似度计算时,可以得到每天的DTW值和/或欧拉距离,因此,在将每天的趋势特征数据与相似度值进行向前差分(即进行插值计算)时,可以将DTW值和欧拉距离分别单独地进行向前差分。通过将每天的趋势特征数据与其前一天的相似度值进行向前差分,可以消除趋势性带来的误差,例如对一个流量稳定增长的线上商铺来说,如果不做向前差分,很容易产生因为流量增长而带来的误判。
在本说明书一个或多个实施例中,异常检测算法可以采用无监督的孤立森林算法,通过孤立森林算法可以将离群较远的异常点进行识别,识别出趋势上不稳定的点,并且可以对每个点进行打分。在实际应用中,可以将上述每天的相似度差分结果作为孤立森林算法的输入参数,从而利用孤立森林算法求解得到每天的异常情况分值。由于通过上述向前差分的操作将趋势性因素去掉之后留下来的是相对高阶的扰动项,该扰动项可以反映出不确定的因素,因此采用相似度差分的结果作为孤立森林的输入,可以进一步地对每个时序点(即每天)进行打分,获得每个时序点的异常情况分值。
在步骤S250中,分别根据所述异常情况分值、周期特征数据和随机特征数据,计算各自对应的特征变量,将所述特征变量按照预设的权重进行加权求和,得到所述目标对象的风险分值,根据所述风险分值对所述目标对象进行风险监测。
在本说明书一个或多个实施例中,可以将预定时间段内的异常情况分值、周期特征数据和随机特征数据分别组成一个数据集合,计算上述数据集合内的特征变量,特征变量包括期望、方差、最大值和最小值中的一个或多个。
进一步地,在本说明书一具体实施例中,通过步骤S210-S240的操作,可以确定出预定时间段内每天的异常情况分值、周期特征数据和随机特征数据。在实际操作中,每天的异常情况分值、周期特征数据以及随机特征数据可以分别有一个,因此如果预定时间段为28天,那么在该预定时间段内,便可以分别得到28个异常情况分值、周期特征数据和随机特征数据,将这些数据按照各自的数据类型分别组成一个数据集合,继而计算这三个数据集合的特征变量,例如:通过计算得到时间段28天内每天的异常情况分值、周期特征数据以及随机特征数据,根据这三种数据类型分别组成各自的数据集合,可以将异常情况分值的数据集合记为{a1、a2、a3……a28},周期特征数据的数据集合记为{b1、b2、b3……b28},随机特征数据的数据集合记为{c1、c2、c3……c28};计算异常情况分值的特征变量,也就可以认为是计算数据集合{a1、a2、a3……a28}的特征变量,以计算的特征变量为最大值为例,此时,可以分别从{a1、a2、a3……a28}、{b1、b2、b3……b28}、{c1、c2、c3……c28}数据集合中选取数值最大的变量作为其对应的特征变量,例如a17为异常情况分值数据集合中的最大值,b9为周期特征数据集合中的最大值,c23为随机特征数据集合中的最大值,那么计算得到的特征变量包括a17、b9和c23
通过计算异常情况分值、周期特征数据和随机特征数据的特征变量,可以清楚地辨别不同因素的量级影响。比如,如果周期性占主导作用的话,那么周期性的最大值、最小值很可能大于随机性和趋势性(可以用异常情况分值表示)的数值结果。
进一步地,在计算得到上述三种数据类型的特征变量后,可以将所述特征变量按照预设的权重进行加权求和,从而得到目标对象的风险分值,在实际应用中,上述预设的权重可以通过以下方式来确定:
在将特征变量按照预设的权重进行加权求和,得到目标对象的风险分值之前,可以通过计算特征变量的IV值,并对IV值进行归一化处理,以便获得特征变量的权重。
具体地,可以利用决策树模型对特征变量进行分箱得到分箱边界值,将分箱边界值作为特征变量的IV值,将每个特征变量的IV值除以历史黑样本与白样本的IV值之和,便可以获得每个特征变量的权重。
在本说明书一个或多个实施例中,为了计算特征变量的IV值,可以先对其进行分箱,在实际应用中,可以利用sklearn决策树,获得决策树的节点划分值,基于上述得到的节点划分值对变量进行分箱,以便查找分箱时最佳分界点的数值(即得到最优分箱边界值),将最优分箱边界值作为该特征变量的IV值。在获得每个特征变量的IV值后,还可以对特征变量的IV值进行归一化处理,具体地,将特征变量的IV值除以历史黑样本与白样本的IV值之和,其中,历史黑样本是指存在风险的线上商城,历史白样本是指无风险的线上商城,在实际应用中,涉及欺诈、赌博、色情等的线上商城即可以认为是存在风险的线上商城。
进一步地,对特征变量的IV值进行归一化后,就可以为每个特征分配最优权重,将所有的特征变量按照最优权重相加,从而得到目标对象的风险分值,将该风险分值作为衡量经营稳定性的指标。在一种实际应用场景中,最终得到的每个目标对象的风险分值可以是0~1之间的分数,获得分数越高说明该目标对象的经营稳定性差,分数越趋近于0,说明该目标对象的稳定性好。
需要说明的是,可以仅在第一次对目标对象进行风险监测时进行归一化处理计算权重,之后的风险监测过程可以直接使用该权重进行计算。本说明书实施例中,通过使用决策树寻找分箱最优边界点,从而计算最有效的IV值,再根据IV值进行特征的归一化分配权重,通过以上方式计算出来的IV值更加接近实际使用时的重要性,同时归一化处理可以将不同指标放在同一水平线上进行对比,方便使用不同权重相加时突出权重大的变量的影响,从而使获得的权重可以更加准确的评估特征变量的重要性。
综合以上实施例的内容,通过基于X-11时序分解和无监督的孤立森林方法,将线上商铺的稳定性问题转化为去除趋势性数据的异常点检测问题,从而实现风险监测;具体地,通过将历史数据分别以天为时间区间连续统计为第一历史时序数据,并以每天内逐个小时为时间区间划分为第二历史时序数据,针对这两种不同的历史时序数据,分别采用不同的策略进行计算,针对第一历史时序数据利用X-11分解得到趋势特征数据、周期特征数据和随机特征数据,针对第二历史时序数据计算其相似度的值;通过将两种不同的历史时序数据分开进行变量计算,使得特征及周期性更具有不同维度的信息,丰富了风险监测的输入,使风险监测更加立体科学。另外,为了去除趋势性带来的影响,针对趋势性分量使用向前差分的方法并将异常点放大,从而有效地将低阶趋势去除。通过本说明的技术方案,可以准确地评价线上商铺的经营稳定性,对线上商铺的风险进行预测,极大提升了用户购物安全感以及电商平台的稳定性,有利于维护商家的利益。
基于同样的思路,本说明书实施例还提供了一种目标对象的风险监测装置,如图3为本说明书实施例提供的一种目标对象的风险监测装置,该装置300主要包括:
获取模块301,用于获取预定时间段内目标对象所产生的历史数据;
统计模块302,用于根据所述预定时间段对所述历史数据执行统计操作得到历史时序数据,所述历史时序数据包括第一历史时序数据和第二历史时序数据;
分解模块303,用于对所述第一历史时序数据进行分解得到趋势特征数据、周期特征数据和随机特征数据,并对所述第二历史时序数据内的数据进行相似度计算得到相似度的值;
差分模块304,用于将所述趋势特征数据与相似度的值进行向前差分得到相似度差分结果,并以所述相似度差分结果作为输入参数,利用异常检测算法求解得到异常情况分值;
风险模块305,用于分别根据所述异常情况分值、周期特征数据和随机特征数据,计算各自对应的特征变量,将所述特征变量按照预设的权重进行加权求和,得到所述目标对象的风险分值,根据所述风险分值对所述目标对象进行风险监测。
根据本申请的实施例,在所述装置中,所述获取模块301具体用于,从数据库中获取所述预定时间段内目标对象所产生的历史数据,所述历史数据包括历史访问数据和/或历史交易数据。
根据本申请的实施例,在所述装置中,所述统计模块302具体用于,将所述预定时间段按照连续的第一时间间隔分割成多个时间序列,并从所述时间序列中确定出多个第二时间间隔,根据所述时间序列以及第二时间间隔将所述历史数据统计为第一历史时序数据和第二历史时序数据。
根据本申请的实施例,在所述装置中,所述第一时间间隔为一天,所述第一历史时序数据包括每天的历史时序数据,所述第二历史时序数据包括每天内多个第二时间间隔的历史时序数据。
根据本申请的实施例,在所述装置中,所述分解模块303还用于,利用X-11算法对所述每天的历史时序数据进行分解得到每天的趋势特征数据、周期特征数据和随机特征数据。
根据本申请的实施例,在所述装置中,所述相似度的值包括DTW值和/或欧拉距离,所述分解模块303还用于:
利用DTW算法对每天内多个第二时间间隔的历史时序数据分别与其前一天内对应时间间隔的历史时序数据进行相似度计算得到每个第二时间间隔的DTW值,将所述第二时间间隔的DTW值相加得到每天的DTW值;和/或,
基于欧拉公式对每天内多个第二时间间隔的历史时序数据分别与其前一天内对应时间间隔的历史时序数据进行相似度计算得到每个第二时间间隔的欧拉距离,将所述第二时间间隔的欧拉距离相加得到每天的欧拉距离。
根据本申请的实施例,在所述装置中,所述差分模块304还用于,将每天的趋势特征数据与其前一天的DTW值进行向前差分得到每天的相似度差分结果;和/或,将每天的趋势特征数据与其前一天的欧拉距离进行向前差分得到每天的相似度差分结果。
根据本申请的实施例,在所述装置中,所述异常检测算法采用无监督的孤立森林算法,所述差分模块304还用于:利用孤立森林算法求解得到每天的异常情况分值。
根据本申请的实施例,在所述装置中,所述风险模块305还用于,将所述预定时间段内的异常情况分值、周期特征数据和随机特征数据分别组成一个数据集合,计算所述数据集合内的特征变量,所述特征变量包括期望、方差、最大值和最小值中的一个或多个。
根据本申请的实施例,在所述装置中,还进一步包括权重模块306,用于在所述将所述特征变量按照预设的权重进行加权求和,得到所述目标对象的风险分值之前,计算所述特征变量的IV值,并对所述IV值进行归一化处理,以便获得所述特征变量的权重。
根据本申请的实施例,在所述装置中,所述权重模块306具体用于,利用决策树模型对所述特征变量进行分箱得到分箱边界值,将所述分箱边界值作为所述特征变量的IV值,将每个所述特征变量的IV值除以历史黑样本与白样本的IV值之和,便可以获得每个所述特征变量的权重。
本说明书实施例还提供一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述一种目标对象的风险监测方法。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书实施例提供的装置、电子设备、非易失性计算机存储介质与方法是对应的,因此,装置、电子设备、非易失性计算机存储介质也具有与对应方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述对应装置、电子设备、非易失性计算机存储介质的有益技术效果。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Comell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书实施例可提供为方法、系统、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (21)

1.一种目标对象的风险监测方法,所述方法包括:
获取预定时间段内目标对象所产生的历史数据;
将所述预定时间段按照连续的第一时间间隔分割成多个时间序列,并从时间序列中确定出多个第二时间间隔,根据时间序列以及第二时间间隔对所述历史数据执行统计操作得到历史时序数据,所述历史时序数据包括第一历史时序数据和第二历史时序数据;
按照所述第一时间间隔,对所述第一历史时序数据进行分解得到趋势特征数据、周期特征数据和随机特征数据,并对所述第二历史时序数据内的数据进行相似度计算得到相似度的值;
将所述趋势特征数据与所述相似度的值进行向前差分得到相似度差分结果,并以所述相似度差分结果作为输入参数,利用异常检测算法求解得到异常情况分值;
分别根据所述异常情况分值、周期特征数据和随机特征数据,计算各自对应的特征变量,将所述特征变量按照预设的权重进行加权求和,得到所述目标对象的风险分值,根据所述风险分值对所述目标对象进行风险监测。
2.如权利要求1所述的方法,所述获取预定时间段内目标对象所产生的历史数据包括:
从数据库中获取所述预定时间段内目标对象所产生的历史数据,所述历史数据包括历史访问数据和/或历史交易数据。
3.如权利要求1所述的方法,所述第一时间间隔为一天,所述第一历史时序数据包括每天的历史时序数据,所述第二历史时序数据包括每天内多个第二时间间隔的历史时序数据。
4.如权利要求3所述的方法,所述对所述第一历史时序数据进行分解得到趋势特征数据、周期特征数据和随机特征数据,包括:
利用X-11算法对所述每天的历史时序数据进行分解得到每天的趋势特征数据、周期特征数据和随机特征数据。
5.如权利要求3所述的方法,所述相似度的值包括DTW值和/或欧拉距离,所述对所述第二历史时序数据内的数据进行相似度计算得到相似度的值,包括:
利用DTW算法对每天内多个第二时间间隔的历史时序数据分别与其前一天内对应时间间隔的历史时序数据进行相似度计算得到每个第二时间间隔的DTW值,将所述第二时间间隔的DTW值相加得到每天的DTW值;和/或,
基于欧拉公式对每天内多个第二时间间隔的历史时序数据分别与其前一天内对应时间间隔的历史时序数据进行相似度计算得到每个第二时间间隔的欧拉距离,将所述第二时间间隔的欧拉距离相加得到每天的欧拉距离。
6.如权利要求5所述的方法,所述将所述趋势特征数据与所述相似度的值进行向前差分得到相似度差分结果,包括:
将每天的趋势特征数据与其前一天的DTW值进行向前差分得到每天的相似度差分结果;和/或,
将每天的趋势特征数据与其前一天的欧拉距离进行向前差分得到每天的相似度差分结果。
7.如权利要求1所述的方法,所述异常检测算法采用无监督的孤立森林算法,所述利用异常检测算法求解得到异常情况分值包括:利用孤立森林算法求解得到每天的异常情况分值。
8.如权利要求1所述的方法,所述根据所述异常情况分值、周期特征数据和随机特征数据,分别计算其特征变量,包括:
将所述预定时间段内的异常情况分值、周期特征数据和随机特征数据分别组成一个数据集合,计算所述数据集合内的特征变量,所述特征变量包括期望、方差、最大值和最小值中的一个或多个。
9.如权利要求1所述的方法,所述将所述特征变量按照预设的权重进行加权求和,得到所述目标对象的风险分值之前,还包括:
计算所述特征变量的IV值,并对所述IV值进行归一化处理,以便获得所述特征变量的权重。
10.如权利要求9所述的方法,所述计算所述特征变量的IV值,并对所述IV值进行归一化处理,以便获得所述特征变量的权重,包括:
利用决策树模型对所述特征变量进行分箱得到分箱边界值,将所述分箱边界值作为所述特征变量的IV值,将每个所述特征变量的IV值除以历史黑样本与白样本的IV值之和,便可以获得每个所述特征变量的权重。
11.一种目标对象的风险监测装置,所述装置包括:
获取模块,用于获取预定时间段内目标对象所产生的历史数据;
统计模块,用于将所述预定时间段按照连续的第一时间间隔分割成多个时间序列,并从时间序列中确定出多个第二时间间隔,根据时间序列以及第二时间间隔对所述历史数据执行统计操作得到历史时序数据,所述历史时序数据包括第一历史时序数据和第二历史时序数据;
分解模块,用于按照所述第一时间间隔对所述第一历史时序数据进行分解得到趋势特征数据、周期特征数据和随机特征数据,并对所述第二历史时序数据内的数据进行相似度计算得到相似度的值;
差分模块,用于将所述趋势特征数据与相似度的值进行向前差分得到相似度差分结果,并以所述相似度差分结果作为输入参数,利用异常检测算法求解得到异常情况分值;
风险模块,用于分别根据所述异常情况分值、周期特征数据和随机特征数据,计算各自对应的特征变量,将所述特征变量按照预设的权重进行加权求和,得到所述目标对象的风险分值,根据所述风险分值对所述目标对象进行风险监测。
12.如权利要求11所述的装置,所述获取模块具体用于:
从数据库中获取所述预定时间段内目标对象所产生的历史数据,所述历史数据包括历史访问数据和/或历史交易数据。
13.如权利要求11所述的装置,所述第一时间间隔为一天,所述第一历史时序数据包括每天的历史时序数据,所述第二历史时序数据包括每天内多个第二时间间隔的历史时序数据。
14.如权利要求13所述的装置,所述分解模块还用于:
利用X-11算法对所述每天的历史时序数据进行分解得到每天的趋势特征数据、周期特征数据和随机特征数据。
15.如权利要求13所述的装置,所述相似度的值包括DTW值和/或欧拉距离,所述分解模块还用于:
利用DTW算法对每天内多个第二时间间隔的历史时序数据分别与其前一天内对应时间间隔的历史时序数据进行相似度计算得到每个第二时间间隔的DTW值,将所述第二时间间隔的DTW值相加得到每天的DTW值;和/或,
基于欧拉公式对每天内多个第二时间间隔的历史时序数据分别与其前一天内对应时间间隔的历史时序数据进行相似度计算得到每个第二时间间隔的欧拉距离,将所述第二时间间隔的欧拉距离相加得到每天的欧拉距离。
16.如权利要求15所述的装置,所述差分模块还用于:
将每天的趋势特征数据与其前一天的DTW值进行向前差分得到每天的相似度差分结果;和/或,
将每天的趋势特征数据与其前一天的欧拉距离进行向前差分得到每天的相似度差分结果。
17.如权利要求11所述的装置,所述异常检测算法采用无监督的孤立森林算法,所述差分模块还用于:利用孤立森林算法求解得到每天的异常情况分值。
18.如权利要求11所述的装置,所述风险模块还用于:
将所述预定时间段内的异常情况分值、周期特征数据和随机特征数据分别组成一个数据集合,计算所述数据集合内的特征变量,所述特征变量包括期望、方差、最大值和最小值中的一个或多个。
19.如权利要求11所述的装置,所述装置还包括:
权重模块,用于在所述将所述特征变量按照预设的权重进行加权求和,得到所述目标对象的风险分值之前,计算所述特征变量的IV值,并对所述IV值进行归一化处理,以便获得所述特征变量的权重。
20.如权利要求19所述的装置,所述权重模块具体用于:
利用决策树模型对所述特征变量进行分箱得到分箱边界值,将所述分箱边界值作为所述特征变量的IV值,将每个所述特征变量的IV值除以历史黑样本与白样本的IV值之和,便可以获得每个所述特征变量的权重。
21.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至10中任一项所述的方法。
CN201910992564.0A 2019-10-18 2019-10-18 一种目标对象的风险监测方法、装置及电子设备 Active CN110728458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910992564.0A CN110728458B (zh) 2019-10-18 2019-10-18 一种目标对象的风险监测方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910992564.0A CN110728458B (zh) 2019-10-18 2019-10-18 一种目标对象的风险监测方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN110728458A CN110728458A (zh) 2020-01-24
CN110728458B true CN110728458B (zh) 2022-07-29

Family

ID=69220337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910992564.0A Active CN110728458B (zh) 2019-10-18 2019-10-18 一种目标对象的风险监测方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN110728458B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449753B (zh) * 2020-03-26 2024-01-02 天翼云科技有限公司 业务风险预测方法、装置和系统
CN112784420B (zh) * 2021-01-26 2022-09-02 支付宝(杭州)信息技术有限公司 一种风控策略的仿真评估方法、装置及设备
CN113392533B (zh) * 2021-06-25 2022-05-27 湖南联智科技股份有限公司 一种基于arima模型及x-11分解的gnss定位数据后处理方法
CN114091979B (zh) * 2022-01-10 2022-05-10 新风光电子科技股份有限公司 基于人工智能的配电设备风险检测方法
CN114760103B (zh) * 2022-03-21 2023-10-31 广州大学 一种工业控制系统异常检测系统、方法、设备及存储介质
CN114693110B (zh) * 2022-03-29 2023-07-04 杭州安脉盛智能技术有限公司 一种储能系统的异常监测方法、系统及存储介质
CN116304962B (zh) * 2023-05-25 2023-08-04 湖南东润智能仪表有限公司 一种用于水表计量数据的智能异常监测方法
CN117873838B (zh) * 2024-03-12 2024-05-24 武汉众诚华鑫科技有限公司 一种电信设备环境温度监控方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220833A (zh) * 2017-05-24 2017-09-29 杭州呯嘭智能技术有限公司 一种面向电商的在线信贷方法及系统
CN107360188A (zh) * 2017-08-23 2017-11-17 杭州安恒信息技术有限公司 基于云防护和云监测系统的网站风险值评估方法及装置
CN107402921A (zh) * 2016-05-18 2017-11-28 阿里巴巴集团控股有限公司 识别用户行为的事件时序数据处理方法、装置及系统
CN109165872A (zh) * 2018-09-19 2019-01-08 深圳市赢世体育科技有限公司 无人化智能球场管理系统、方法及球场
CN109191279A (zh) * 2018-08-01 2019-01-11 西安日间结算登记有限公司 基于线上供应链金融的中小企业信用风险评估平台
CN109542740A (zh) * 2017-09-22 2019-03-29 阿里巴巴集团控股有限公司 异常检测方法及装置
CN109697207A (zh) * 2018-12-25 2019-04-30 苏州思必驰信息科技有限公司 时序数据的异常监控方法及系统
CN109800217A (zh) * 2018-12-28 2019-05-24 南京天溯自动化控制系统有限公司 一种连续异常能耗数据的修复方法、装置及电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9372994B1 (en) * 2014-12-13 2016-06-21 Security Scorecard, Inc. Entity IP mapping

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107402921A (zh) * 2016-05-18 2017-11-28 阿里巴巴集团控股有限公司 识别用户行为的事件时序数据处理方法、装置及系统
CN107220833A (zh) * 2017-05-24 2017-09-29 杭州呯嘭智能技术有限公司 一种面向电商的在线信贷方法及系统
CN107360188A (zh) * 2017-08-23 2017-11-17 杭州安恒信息技术有限公司 基于云防护和云监测系统的网站风险值评估方法及装置
CN109542740A (zh) * 2017-09-22 2019-03-29 阿里巴巴集团控股有限公司 异常检测方法及装置
CN109191279A (zh) * 2018-08-01 2019-01-11 西安日间结算登记有限公司 基于线上供应链金融的中小企业信用风险评估平台
CN109165872A (zh) * 2018-09-19 2019-01-08 深圳市赢世体育科技有限公司 无人化智能球场管理系统、方法及球场
CN109697207A (zh) * 2018-12-25 2019-04-30 苏州思必驰信息科技有限公司 时序数据的异常监控方法及系统
CN109800217A (zh) * 2018-12-28 2019-05-24 南京天溯自动化控制系统有限公司 一种连续异常能耗数据的修复方法、装置及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Fraud Risk Monitoring System for E-Banking Transactions;Chaonian Guo等;《2018 IEEE 16th Intl Conf on Dependable, Autonomic and Secure Computing, 16th Intl Conf on Pervasive Intelligence and Computing, 4th Intl Conf on Big Data Intelligence and Computing and Cyber Science and Technology Congress》;20181029;正文第100-105页 *
建设市场主体信用动态综合评价模型研究――以施工企业为例;杨妍妍等;《科技管理研究》;20180920(第18期);正文第57-66页 *

Also Published As

Publication number Publication date
CN110728458A (zh) 2020-01-24

Similar Documents

Publication Publication Date Title
CN110728458B (zh) 一种目标对象的风险监测方法、装置及电子设备
US10977739B2 (en) Risk identification model building and risk identification
US20200364731A1 (en) Subscription churn prediction
TWI729058B (zh) 基於時間序列的資料預測方法和裝置
CN109242135B (zh) 一种模型运营方法、装置、及业务服务器
US10504120B2 (en) Determining a temporary transaction limit
CN108717602B (zh) 一种交易行为异常的识别方法、装置及设备
CN108829638B (zh) 一种业务数据波动处理方法及装置
CN107526667B (zh) 一种指标异常检测方法、装置以及电子设备
JP5864614B2 (ja) 分類された誤配置の識別
CN110322349B (zh) 一种数据的处理方法、装置及设备
Sridhar et al. Multi-head self-attention transformer for dogecoin price prediction
CN108346107B (zh) 一种社交内容风险识别方法、装置以及设备
JP2020501232A (ja) リスク制御イベント自動処理の方法および装置
CN110688974A (zh) 一种身份识别方法及装置
CN110633989A (zh) 一种风险行为生成模型的确定方法及装置
CN109257398A (zh) 一种业务对象的推送方法及设备
CN110347724A (zh) 异常行为识别方法、装置、电子设备及介质
CN112966113A (zh) 一种数据的风险防控方法、装置及设备
CN116362823A (zh) 用于行为稀疏场景的推荐模型训练方法、推荐方法及装置
CN110033092B (zh) 数据标签生成、模型训练、事件识别方法和装置
CN109492401B (zh) 一种内容载体风险检测方法、装置、设备及介质
Sharma et al. Intelligent data analysis using optimized support vector machine based data mining approach for tourism industry
CN110472742A (zh) 一种模型变量确定方法、装置及设备
CN110458581B (zh) 商户业务周转异常的识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant