CN110880128A - 异常信息挖掘方法、装置、系统及终端设备 - Google Patents

异常信息挖掘方法、装置、系统及终端设备 Download PDF

Info

Publication number
CN110880128A
CN110880128A CN201911052969.2A CN201911052969A CN110880128A CN 110880128 A CN110880128 A CN 110880128A CN 201911052969 A CN201911052969 A CN 201911052969A CN 110880128 A CN110880128 A CN 110880128A
Authority
CN
China
Prior art keywords
index
value
dimension
sequence
dimension value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911052969.2A
Other languages
English (en)
Inventor
周琦梦
金梦姗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN201911052969.2A priority Critical patent/CN110880128A/zh
Publication of CN110880128A publication Critical patent/CN110880128A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0225Avoiding frauds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例公开了一种异常信息挖掘方法、装置、系统及终端设备,该方法包括:获取进行风险监控的指标及与所述指标相关的交易特征;根据每一所述交易特征具有的维值,获得各维值组合;根据历史交易事件的事件信息,分别针对每一所述指标,生成与每一所述维值组合各自对应的指标值序列;以及,根据所述指标值序列挖掘存在异常的维值组合,获得并输出包括所述存在异常的维值组合的异常信息。

Description

异常信息挖掘方法、装置、系统及终端设备
技术领域
本说明书实施例涉及信息处理领域,更具体地,涉及异常信息挖掘方法、异常信息挖掘装置、终端设备、异常信息挖掘系统、以及计算机可读存储介质。
背景技术
随着互联网技术的发展,网上交易的类型也越来越丰富,例如有基于电商场景的交易、基于电子钱包场景的交易等。这些交易平台在吸引大量用户进行网上交易的同时,也出现了通过不正当交易获利的问题,致使交易平台面临众多的交易风险。以电商场景为例,电商场景的主要风险类型为盗用类风险,盗用者在获得大量卡料的情况下,可以在电商平台上进行不正当交易以套取现金或商品,快速获利。又以电子钱包场景为例,各交易平台为了抢占市场,通常会进行大范围、大力度的营销活动,一些用户可以通过接码平台、设备篡改、身份冒用等非正常手段绕过营销活动业务规则,通过不正当交易恶意套取营销活动奖励。
为了对以上交易风险进行及时的防控,运营商大多为交易平台部署相应的风险控制平台,以通过风险控制平台及时发现并终止不正当交易,以降低损失。对于风险控制平台而言,由于黑色产业通常会频繁地变换手段来规避风险防控,因此,风险控制平台需要不断地根据新增风险的交易特征进行风险控制升级,以增强对不断出现的新规避手段的对抗能力。
目前,主要通过人工分析设定时间段内发生的交易事件的事件信息,来挖掘新增风险的交易特征,该种特征挖掘方式受人为因素的影响,往往精准度低、且时效性差,上线后发现效果不如预期,需要进行返工,会造成不必要的损失。另外,现有的特征挖掘方式大多是进行单一特征维度的下探,当新增风险发生的时候,极其容易隐藏在整体交易流量中被忽视,致使风险控制平台无法及时对新增风险做出适应性地调整,等到积累一定交易量才被发现的时候,该新增风险的影响往往已经出现了质的变化,造成严重的损失。
发明内容
本说明书实施例提供一种进行异常信息挖掘的新的技术方案。
根据本说明书的第一方面,提供了异常信息挖掘方法,包括:
获取进行风险监控的指标及与所述指标相关的交易特征;
根据每一所述交易特征具有的维值,获得各维值组合;
根据历史交易事件的事件信息,分别针对每一所述指标,生成与每一所述维值组合各自对应的指标值序列;
根据所述指标值序列挖掘存在异常的维值组合,获得并输出包括所述存在异常的维值组合的异常信息。
可选地,所述生成与每一所述维值组合各自对应的指标值序列,包括:
对于每一维值组合,从历史交易事件中获取满足对应维值组合的历史交易事件,作为目标交易事件;
按照事件发生时间的先后顺序排列所述目标交易事件对于对应指标的指标值,生成对应维值组合对于对应指标的指标值序列。
可选地,获取与所述指标相关的交易特征包括:
根据所述历史交易事件的事件信息,获取引起所述指标波动的交易特征作为与所述指标相关的交易特征。
可选地,所述方法还包括:
在生成的所述指标值序列中,去除满足设定的剪枝条件的指标值序列,获得有效的指标值序列;
所述根据所述指标值序列挖掘存在异常的维值组合包括:
根据所述有效的指标值序列挖掘存在异常的维值组合。
可选地,所述剪枝条件包括:指标值序列的时序数据量相对对应指标的时序数据量的占比小于第一设定值、指标值序列的变化幅度小于第二设定值、及指标值序列的指标值的数量小于第三设定值中的至少一项。
可选地,所述去除满足设定的剪枝条件的指标值序列包括:
对于同一指标的具有上下级关系的维值组合集合,查找满足所述剪枝条件的维值数最少的维值组合作为主维值组合;
对于每一维值组合集合,去除所述主维值组对于对应指标的指标值序列、及包含所述主维值组合的其他维值组合对于对应指标的指标值序列。
可选地,所述根据所述指标值序列挖掘存在异常的维值组合包括:
根据所述指标值序列挖掘对于对应指标存在单项异常的维值组合;
根据所述存在单项异常的维值组合,获得最终的存在异常的维值组合。
可选地,所述根据所述指标值序列挖掘对于对应指标存在单项异常的维值组合,包括:
对于每一所述指标值序列,通过拟合其中的指标值获得反映时间与对应指标的指标值之间的映射关系的映射函数;
根据所述映射函数,获得对应指标值序列中设定指标值的预测值;
比较所述预测值与对应的指标值,获得比较结果;
根据所述比较结果,确定对应维值组合对于对应指标是否存在单项异常。
可选地,所述根据所述比较结果,确定对应维值组合对于对应指标是否存在单项异常,包括:
根据所述比较结果、及对应指标值序列的时序数据量相对对应指标的时序数据量的占比,获得对应维值组合的单项异常指数值;
根据所述单项异常指数值,确定对应维值组合对于对应指标是否存在单项异常。
可选地,所述根据所述指标值序列挖掘对于对应指标存在单项异常的维值组合,还包括确定与每一指标值序列相匹配的时序模型的步骤,包括:
对于每一所述指标值序列,提取设定的时序特征;
根据所述时序特征,获得对应指标值序列的时序模型;
所述通过拟合其中的指标值获得反映时间与对应指标的指标值之间的映射关系的映射函数,包括:
根据对应的时序模型拟合其中的指标值,获得反映时间与对应指标的指标值之间的映射关系的映射函数。
可选地,所述根据所述存在单项异常的维值组合,获得最终的存在异常的维值组合包括:
对于存在单项异常的维值组合,根据对应维值组合对于每一所述指标的单项异常指数值及每一所述指标的权重,获得最终的存在异常的维值组合。
可选地,所述输出包括所述存在异常的维值组合的异常信息包括:
在挖掘出的所有存在异常的维值组合中,筛选出满足设定的等价条件的维值组合集合;
对于每一所述维值组合集合,仅输出维值数量最少的维值组合。
可选地,所述等价条件包括指标值序列相同、指标值序列相似、具有相同的异常因子中的任意一项或者多项。
可选地,所述输出包括所述存在异常的维值组合的异常信息包括:
通过预置的反馈模型处理挖掘出的存在异常的维值组合,筛选出有效的维值组合,其中,所述反馈模型反映维值组合的特征与有效性之间的映射关系;
输出筛选出的所述有效的维值组合。
可选地,所述方法还包括生成所述反馈模型的步骤,包括:
获取对于输出的所述异常信息提供的反馈信息,其中,所述反馈信息包含维值组合的特征与有效性之间的对应关系;
将所述反馈信息作为训练样本,训练得到或更新所述反馈模型。
可选地,所述生成与每一所述维值组合各自对应的指标值序列包括:
按照所述各维值组合间的级别关系构建对应指标的维值树,其中,所述维值树的一个节点代表一个维值组合;
在所述维值树的每一节点,生成并记录对应维值组合对于对应指标的指标值序列。
可选地,所述按照所述各维值组合间的级别关系构建对应指标的维值树包括:
在所述维值树的同一层级中,设置同级维值组合根据对应特征具有的维值数的数量,按照所述数量从少到多的顺序依次排列。
可选地,所述获取进行风险监控的指标,包括:
响应于进行挖掘配置的触发,提供配置接口;
获取通过所述配置接口输入的进行风险监控的指标。
根据本说明书的第二方面,提供了另一异常信息挖掘方法,由终端设备实施,包括:
接收异常信息挖掘装置提供的包括存在异常的维值组合的异常信息,其中,所述维值组合由至少一个交易特征各自的一个维值构成,所述交易特征与进行风险监控的指标相关;
获取针对所述异常信息提供的反馈信息,其中,所述反馈信息包括所述维值组合的特征与有效性之间的对应关系;
将所述反馈信息发送至所述异常信息挖掘装置,以进行新挖掘出的异常信息的有效性筛查。
可选地,所述方法还包括:
响应于进行信息反馈的操作,提供进行信息反馈的人机接口;
获取通过所述人机接口输入的信息,作为所述反馈信息。
根据本说明书的第三方面,还提供了异常信息挖掘装置,包括:
数据获取模块,用于获取进行风险监控的指标及与所述指标相关的交易特征;
维值组合模块,用于根据每一所述交易特征具有的维值,获得各维值组合;
序列构建模块,用于根据历史交易事件的事件信息,分别针对每一所述指标,生成与每一所述维值组合各自对应的指标值序列;以及,
异常挖掘模块,根据所述指标值序列挖掘存在异常的维值组合,获得并输出包括所述存在异常的维值组合的异常信息。
根据本说明书的第四方面,还提供了一种异常信息挖掘装置,包括:存储器,用于存储可执行命令;处理器,用于在所述可执行命令的控制下,执行如本说明书第一方面所述的异常信息挖掘方法。
根据本说明书的第五方面,还提供了终端设备,包括:存储器,用于存储可执行命令;处理器,用于在所述可执行命令的控制下,执行根据本说明书的第二方面所述的异常信息挖掘方法。
根据本说明书的第五方面,还提供了计算机可读存储介质的一个实施例,其存储有可执行指令,所述可执行指令被处理器执行时,执行如本说明书的第一方面所述的异常信息挖掘方法。
根据本说明书的第六方面,还提供了一种异常信息挖掘系统,包括根据本说明书第三方面或者第四方面所述的异常信息挖掘装置、及根据本说明书第五方面所述的终端设备。
在一个实施例中,异常信息挖掘方法针对进行风险监控的指标,进行多维度特征的探查,能够准确、及时地挖掘出新增风险的异常信息,有利于根据所挖掘出的异常信息提高风险控制平台对于新增风险的防控能力。
通过以下参照附图对本说明书的示例性实施例的详细描述,本说明书的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本说明书的实施例,并且连同其说明一起用于解释本说明书的原理。
图1是可用于实现一个实施例的异常信息挖掘方法的场景示意图;
图2是可用于实现一个实施例的异常信息挖掘方法的异常信息挖掘系统的硬件配置结构图;
图3是根据一个实施例的异常信息挖掘方法的流程示意图;
图4是根据另一个实施例的异常信息挖掘方法中构建的维值树的结构示意图;
图5是根据另一个实施例的异常信息挖掘方法的流程示意图;
图6是根据一个例子的异常信息挖掘方法的流程示意图;
图7是根据一个实施例的异常信息挖掘装置的原理框图;
图8是根据另一个实施例的异常信息挖掘装置的原理框图;
图9是根据一个实施例的异常信息挖掘系统的原理框图。
具体实施方式
现在将参照附图来详细描述本说明书的各种示例性实施例。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本说明书及其应用或使用的任何限制。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<硬件配置>
图1为本说明书一个实施例的异常信息挖掘方法的场景示意图。
参照图1所示,该应用场景涉及的硬件可以包括服务器1100、终端设备1200和终端设备1300。终端设备1200为交易平台用户使用的终端设备,该交易平台例如是xx电商平台、xx电子商务平台等提供线上交易服务的平台,在此不做限定。终端设备1300为该交易平台的负责进行风险控制的工作人员(以下简称为风控人员)使用的终端设备。服务器1100可以用于实施根据任意实施例的异常信息挖掘方法。
在图1所示的应用场景中,交易平台用户可以通过各自的终端设备 1200登录该交易平台,并在交易平台中进行交易操作,例如领取优惠卷、领取奖励金等,进而产生交易事件,每一终端设备1200在产生交易事件后,会将该交易事件的事件信息发送至服务器1100进行处理,该事件信息例如包括事件发生时间、及根据设置需要采集的交易特征的特征值等。服务器 1100可以根据设置提取设定时间段内发生的交易事件,并根据这些交易事件的事件信息构建特征表,其中,特征表中的每条数据对应一个交易事件,在特征表中,各条数据可以按照事件发生时间的先后顺序排列,特征表中的每条数据包括对应交易事件对于设定交易特征的特征值(本说明书中称之为维值),还包括对应交易事件对于进行风险监控的指标的指标值。服务器1100在获得该特征表后,可以根据特征表中的数据,分别针对每一指标和每一维值组合,生成由满足对应维值组合的交易事件对于对应指标的指标值构成的指标值序列,并通过分析指标值序列的表现来挖掘对于某一指标或者某些指标的组合而言可能存在异常的维值组合,并将挖掘出的异常信息上报至风控人员的终端设备1300,以供风控人员根据挖掘出的异常信息更新风险控制平台的风险控制模型,进而快速、有效地提高风险控制模型对于新增风险的抵抗能力。
另外,在一个实施例中,还可以为风控人员提供反馈机制,风控人员在接收到服务器1100挖掘出的异常信息后,可以经过分析和/或实际验证,通过各自的终端设备1300向服务器1100反馈表示这些异常信息对于提升风险控制模型的风险防控能力的有效性的反馈信息,服务器1100在接收到这些反馈信息后,可以根据这些反馈信息对下一步挖掘出的异常信息进行有效性筛查,以提高上报给风控人员的异常信息的精确度。
图2为可以应用根据本说明书一个实施例的异常信息挖掘方法的一种异常信息挖掘系统的组成结构示意图。
如图2所示,本实施例的异常信息挖掘系统1000包括服务器1100、终端设备1200、及终端设备1300。
服务器1100例如可以是刀片服务器、机架式服务器等,服务器1100也可以是部署在云端的服务器集群,在此不做限定。
如图2所示,服务器1100可以包括处理器1110、存储器1120、接口装置1130、通信装置1140、显示装置1150和输入装置1160。存储器1120 例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1130例如包括USB接口、串行接口等。通信装置 1140例如能够进行有线或无线通信。显示装置1150例如是液晶显示屏。输入装置1160例如可以包括触摸屏、键盘等。
本实施例中,服务器1100的存储器1120用于存储指令,该指令用于控制处理器1110进行操作以执行任意实施例的异常信息挖掘方法。技术人员可以根据本说明书所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
本领域技术人员应当理解,尽管在图2中示出了服务器1100的多个装置,但是,本说明书实施例的服务器1100可以仅涉及其中的部分装置,例如,只涉及处理器1110和存储器1120。
如图2所示,终端设备1200可以包括处理器1210、存储器1220、接口装置1230、通信装置1240、显示装置1250、输入装置1260、音频输出装置1270、音频输入装置1280,等等。处理器1210可以是中央处理器CPU、微处理器MCU等。存储器1220例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1230例如包括USB 接口、耳机接口等。通信装置1240例如能够进行有线或无线通信。显示装置1250例如是液晶显示屏、触摸显示屏等。输入装置1260例如可以包括触摸屏、键盘等。终端设备1200可以通过音频输出装置1270输出音频信息,该音频输出装置1270例如包括扬声器。终端设备1200可以通过音频拾取装置1280拾取用户输入的语音信息,该音频拾取装置1280例如包括麦克风。
终端设备1200可以是智能手机、便携式电脑、台式计算机、平板电脑等可以支持用户通过交易平台进行交易操作的任意设备,在此不做限定。
本实施例中,终端设备1200可以响应于用户在业务平台中触发的交易操作,向服务器1100发送对应交易事件的事件信息。
本实施例中,终端设备1200的存储器1220用于存储指令,该指令用于控制该处理器1210进行操作以支持实现根据本说明书任意实施例的异常信息挖掘方法。技术人员可以根据本说明书所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
本领域技术人员应当理解,尽管在图2中示出了终端设备1200的多个装置,但是,本说明书实施例的终端设备1200可以仅涉及其中的部分装置,例如,只涉及处理器1210、存储器1220、显示装置1250、输入装置1260等。
终端设备1300可以是智能手机、便携式电脑、台式计算机、平板电脑等,终端设备1300可以具有类似于终端设备1200的硬件结构,在此不再赘述。
通信网络1300可以是无线网络也可以是有线网络,可以是局域网也可以是广域网。终端设备1200与服务器1100之间,以及终端设备1300与服务器1100 之间,可以通过通信网络1300进行通信。
图2所示的异常信息挖掘系统1000仅是解释性的,并且决不是为了要限制本说明书、其应用或用途。例如,尽管图2仅示出一个服务器1100、一个终端设备1200和一个终端设备1300,但不意味着限制各自的数量,异常信息挖掘系统1000中可以包含多个服务器1100、多个终端设备1200 和多个终端设备1300,在此不做限定。
<方法实施例1>
本实施例提供了一种异常信息挖掘方法,该方法例如可以由作为异常信息挖掘装置的服务器实施,该服务器可以是如图1或者是图2所示的服务器1100。如图3所示,该方法可以包括以下步骤S3100~S3400:
步骤S3100,获取进行风险监控的指标及与该指标相关的交易特征。
该进行风险监控的指标可以根据需要监控的风险设置。例如,需要监控的风险为薅羊毛风险,进行风险监控的指标可以包括一次领取的金额总和SUM(A)、一次领取的券数量COUNT(B)、及金额总和SUM(A)与券数量 COUNT(B)的比值SUM(A)/COUNT(B)中的任意一项或者多项等。
本实施例中,可以根据需要监控的风险,设置一项进行风险监控的指标,或者设置多项进行风险监控的指标,在此不做限定。
与该指标相关的交易特征即为可以影响对应指标的指标值的交易特征。
本实施例中,对于任意指标,可以获取与该指标相关的一个交易特征,也可以获取与该指标相关的多个交易特征。
本实施例中,对于不同的指标,与各自相关的交易特征可以相同,也可以不同,在此不做限定。
该步骤S3100中,获取与该指标相关的交易特征可以包括:根据设定时间段内的历史交易事件的事件信息,获取引起该指标波动的交易特征作为与该指标相关的交易特征。
在与该指标相关的交易特征超出设定数量的情况下,还可以在步骤 S2100中,获取与该指标波动最相关的设定数量的交易特征来参与实施本实施例的方法,以提高挖掘速度和挖掘有效性。
以上设定时间段可以根据挖掘新增风险所需的数据量及单日的交易事件数量等确定,例如,该设定时间段为最近一个月,在此不做限定。
根据步骤S3100获取到进行风险监控的指标及与该指标相关的交易特征之后,服务器1100便可以根据终端设备1200发送的交易事件的事件信息确定每一交易事件对于每一指标的指标值,及每一交易事件对于每一交易特征的维值。
在一个例子中,例如具有三个进行风险监控的指标,分别是金额总和 SUM(A)、券数量COUNT(B)、及比值SUM(A)/COUNT(B)。与这些指标相关的交易特征例如包括特征DIM1、特征DIM2和特征DIM3,即该例子通过特征DIM1、特征DIM2和特征DIM3这三个维度对上述指标进行风险监控,其中,特征DIM1例如具有两个维值,分别为D11、D12;特征DIM2 例如具有五个维值,分别为D21、D22、D23、D24、D25;特征DIM3例如具有三个维值,分别为D31、D32、D33。
以上任意维值可以是具体的一个点,例如一个具体的取值,也可以是一个范围,例如一个取值范围,在此不做限定。
在该例子中,服务器在获取到设定时间段内的历史交易事件的事件信息后,便可以获得如下表1所示的特征表,特征表中的每条数据对应一个交易事件。由于每一交易事件均具有对应的事件发生时间,即具有对应的时间戳,该时间戳可以根据需要具体到日、时、分或秒等,这些历史交易事件在数据表中按照事件发生时间的先后顺序依次排列,例如序号1、2对应的事件发生时间为2019年1月1日,序号n对应的事件发生时间为2019 年1月31日等。根据表1所示的数据表可知,在该例子中,在例如是最近一个月的设定时间段内共发生了n个交易事件,其中,n为大于1的自然数。
表1:
Figure BDA0002255791170000111
以特征表中的第一条数据为例,根据该交易事件的事件信息,可以得到:该交易事件对于特征1的维值为D11,对于特征2、3的维值均为未知 null,对于指标1(SUM(A))的指标值为10、对于指标2(COUNT(B))的指标值为5,对于指标3(SUM(A)/COUNT(B))的指标值为2。
在一个实施例中,服务器可以支持操作人员在线修改进行风险监控的指标和/或与该指标相关的交易特征。
在该实施例中,该步骤S3100中获取进行风险监控的指标,可以包括:响应于进行挖掘配置的触发,提供配置接口;以及,获取通过该配置接口输入的进行风险监控的指标。
在该实施例中,该步骤S3200中获取与该指标相关的交易特征,可以包括:响应于进行挖掘配置的触发,提供配置接口;以及,获取通过该配置接口输入的与该指标相关的交易特征。
步骤S3200,根据每一交易特征具有的维值,获得各维值组合。
本步骤S3200中,可以对每一交易特征具有的维值进行排列组合,以获得所有的维值组合,以能够根据任意交易事件的事件信息,确定对应交易事件所满足的维值组合。
继续上述例子,在通过特征DIM1、特征DIM2和特征DIM3这三个维度对上述指标进行风险监控的情况下,共包括三个级别的维值组合,其中,同一级别的维值组合的维值数量相同,维值数量越少,级别越高。
在该例子中,第一级别的维值组合包括:D11;D12;D21;D22;D23; D24;D25;D31;D32;D33;其中,第一级别具有10种不同的维值组合,每一维值组合仅具有一个维值。第二级别的维值组合包括:D11、D31;D11、 D32;D11、D33;D11、D21;D11、D22;D11、D23;D11、D24;D11、 D25;D12、D31;D12、D32;D12、D33;D12、D21;D12、D22;D12、 D23;D12、D24;D12、D25;D31、D21;D31、D22;D31、D23;D31、 D24;D31、D25;D32、D21;D32、D22;D32、D23;D32、D24;D32、D25;D33、D21;D33、D22;D33、D23;D33、D24;D33、D25;其中,第二级别具有31种不同的维值组合,每一维值组合具有来自不同维度的两个维值。第三级别的维值组合包括:D11、D31、D21;D11、D31、D22;D11、D31、D23;D11、D31、D24;D11、D31、D25;D11、D32、D21; D11、D32、D22;D11、D32、D23;D11、D32、D24;D11、D32、D25; D11、D33、D21;D11、D33、D22;D11、D33、D23;D11、D33、D24; D11、D33、D25;D12、D31、D21;D12、D31、D22;D12、D31、D23; D12、D31、D24;D12、D31、D25;D12、D32、D21;D12、D32、D22; D12、D32、D23;D12、D32、D24;D12、D32、D25;D12、D33、D21;D12、D33、D22;D12、D33、D23;D12、D33、D24;D12、D33、D25;其中,第三级别具有30种不同的维值组合,每一维值组合具有来自不同维度的三个维值。
步骤S3300,根据历史交易事件的事件信息,分别针对每一指标,生成与每一维值组合各自对应的指标值序列。
该历史交易事件为设定时间内段的历史交易事件。
该步骤S3300可以根据设定的内部触发或者外部触发启动。
该内部触发例如包括设定的时间间隔到期等,即服务器按照该时间间隔定期进行异常信息的挖掘,在此不做限定。
该外部触发例如是接收到工作人员触发的进行异常信息挖掘的指令等,在此不做限定。
本步骤S3300中,该指标值序列由满足对应维值组合的历史交易事件对于对应指标的指标值构成。
本步骤S3300中,对于进行风险监控的任意一个指标,均将生成与步骤S2200中获得的每一维值组合各自对应的指标值序列。
该指标值序列中的各指标值,可以按照各自对应的事件发生时间的先后顺序依次排列,形成一个时序序列。
在一个实施例中,该步骤S3300中的生成与每一维值组合各自对应的指标值序列,可以包括:对于每一维值组合,从历史交易事件中获取满足对应维值组合的历史交易事件,作为目标交易事件;以及,按照事件发生时间的先后顺序排列这些目标交易事件对于对应指标的指标值,生成对应维值组合对于对应指标的指标值序列。
继续上述例子,以指标1为例,根据该步骤S3300将生成与步骤S2200 获得的所有维值组合(71种维值组合)一一对应的指标值序列,即,对于指标1,将生成71个指标值序列。
在一个例子中,根据上述特征表,将更容易获得对于任意指标的对应任意维值组合的指标值序列。例如,对于维值组合D11,可以从特征表中筛选出符合该维值组合D11的各条数据,并按照特征表中的序号排列筛选出的这些条数据的对于指标1的指标值,获得对于指标1的对应维值组合 D11的指标值序列。根据该特征表可知,特征表中的第一条数据代表的交易事件符合该维值组合D11,则该条数据中的指标1的指标值10将成为对于指标1的对应维值组合D11的指标值序列中的第一序位的指标值。
步骤S3400,根据该指标值序列挖掘存在异常的维值组合,获得并输出包括该存在异常的维值组合的异常信息。
本步骤S3400中,可以根据指标值序列中指标值的变化,探查其中的指标值是否随着时间推移发生了不符合应有规律的变化,如是,则对应的维值组合对于该指标存在异常。
该应有规律可以是针对各指标预先设定的规则。
该应有规律也可以根据对应指标值序列确定。例如,对指标值序列中的各指标值进行拟合,得到对应指标值序列的、反映时间与对应指标的指标值间的映射关系的映射数据,并将该映射数据作为对应指标值序列的应用规律,其中,该映射数据可以是映射函数。
服务器1100可以将通过该步骤S3400获得的异常信息输出至风控人员的终端设备1300,风控人员可以参考该异常信息升级风险控制平台的风险控制模型,进而提升风险控制模型对于新增风险的抵抗能力。
在一个实施例中,该步骤S3400中根据该指标值序列挖掘存在异常的维值组合,可以包括:根据该指标值序列挖掘对于对应指标存在单项异常的维值组合;以及,根据存在单项异常的维值组合,获得最终的存在异常的维值组合。
该实施例中,根据该指标值序列挖掘对于对应指标存在单项异常的维值组合,可以包括如下步骤S3410~S3440:
步骤S3410,对于每一指标值序列,通过拟合其中的指标值获得反映时间与对应指标的指标值之间的映射关系的映射函数。
在步骤S3410中,对于每一指标值序列,由于其中的每一指标值均具有对应的事件发生时间,即具有对应的时间戳,因此,可以根据指标值序列中的指标值,拟合得到对应该指标值序列的映射函数作为对应该指标值序列的应有规律。
在步骤S3410中,可以通过任意设定的时序模型拟合指标值序列中的指标值,以得到该映射函数。
该时间序列模型例如是指数平滑模型(Exponential Smoothing,ES)、差分整合移动平均自回归模型(Autoregressive Integrated Moving Average model,ARIMA)、长短期记忆网络模型(Long short-term memory,LSTM) 等,在此不做限定。
由于不同的时序模型会在不同的时序特征下具有优异的表现,因此,在一个实施例中,步骤S3400中根据该指标值序列挖掘对于该指标存在异常的维值组合还可以包括确定与每一指标值序列相匹配的时序模型的步骤,包括:对于每一指标值序列,提取设定的时序特征;根据该时序特征,获得与对应指标值序列相匹配的时序模型。这样,可以在通过该时序模型拟合对应的指标值序列时,获得更加精确的映射函数。
该时序特征例如可以包括:对应的指标值序列是否呈现周期性、是否平稳、是否包含节假日、及时序长度等中的至少一项。
对于该实施例,步骤S3410中通过拟合其中的指标值获得反映时间与对应指标的指标值之间的映射关系的映射函数,可以包括:通过相匹配的时序模型拟合其中的指标值,获得反映时间与对应指标的指标值之间的映射关系的映射函数。
步骤S3420,根据该映射函数,获得对应指标值序列中设定指标值的预测值。
在步骤S3420中,在根据步骤S3410获得映射函数之后,可以根据该映射函数获得对应指标值序列中任意指标值的预测值。
在发现新增风险的应用中,例如,该设定指标值可以选取时间戳为设定时间段的最后一天的指标值,其中,该设定时间段用于选择参与执行本实施例方法的交易事件。
步骤S3430,比较该预测值与对应的指标值,得到比较结果。
在步骤S3430中,比较该预测值与对应的指标值可以包括:计算预测值与对应的指标值间的偏差。
步骤S3440,根据该比较结果,确定对应维值组合对于对应指标是否存在单项异常。
在步骤S3440中,可以在该偏差的绝对值大于或者等于一设定值的情况下,确定对应维值组合对于对应指标存在单项异常。
在步骤S3440中,也可以根据比较结果计算对应维值组合对于对应指标的单项异常指数值,并根据单项异常指数值确定对应维值组合对于对应指标是否存在单项异常。
例如,可以在单项异常指数值大于或者等于另一设定值时,确定对应维值组合对于对应指标存在单项异常。在此,可以将小于该另一设定值的单项异常指数值统一设置为0。
该单项异常指数值可以根据以上偏差、及对应指标值序列的时序数据量相对对应指标的时序数据量的占比确定。该时序数据量为指标值之和,对于比值类指标,该时序数据量也可以为指标值的分母之和。这可以是偏差越大,占比越高,则单项异常指数值越高。
继续上述例子,维值组合D11对于指标1的指标值序列为(10,5, 3,……,6),根据该指标值序列中的指标值,可以拟合得到反映时间与指标1的指标值间的映射关系的映射函数A(t)。根据映射函数A(t),可以获得对应指标值序列中最后一个指标值“6”的预测值A(tn),进而可以计算得到该该预测值与对应指标值间的偏差Δ|A(tn)-6|。该指标值序列的时序数据量等于该指标值序列中所有指标值之和,该指标1的时序数据量为表 1所示特征表中所有交易事件对于指标1的指标值之和,这样,便可以获得该指标值序列的时序数据量相对对应指标的时序数据量的占比λ。根据偏差Δ|A(tn)-6|和占比λ,可以获得维值组合D11对于指标1的单项异常指数值。
一个实施例中,在根据存在单项异常的维值组合,获得最终的存在异常的维值组合时,可以在任意维值组合对于任意指标存在单项异常的情况下,即可以设置该维值组合存在异常。
另一个实施例中,在根据存在单项异常的维值组合,获得最终的存在异常的维值组合时,也可以结合同一维值组合对于不同指标的异常情况,判断该维值组合是否存在异常。对此,根据存在单项异常的维值组合,获得最终的存在异常的维值组合的步骤可以包括:根据指标值序列挖掘对于对应指标存在单项异常的维值组合;根据该存在单项异常的维值组合,获得最终的存在异常的维值组合。
例如,可以为每一指标设置一个权重,所有指标的权重之和为1,其中,每一指标的权重可以相同,也可以不同,并根据同一维值组合对于各指标的单项异常指数值和各指标的权重,计算该维值组合的总异常指数值,以根据该总异常指数值确定对应的维值组合是否存在异常。在任意维值组合对于任意指标不存在单项异常的情况下,该维值组合对于该指标的单项异常指数值可以均统一为0。
在一个实施例中,步骤S3400输出的异常信息还可以包括:使得挖掘出的维值组合存在异常的指标、使得挖掘出的维值组合存在异常的指标值序列、及该存在异常的维值组合的异常指数值(包括单项异常指数值和/或总异常指数值)中的至少一项。例如,该异常信息可以包括存在异常的维值组合、使得挖掘出的维值组合存在异常的指标、使得挖掘出的维值组合存在异常的指标值序列、及该存在异常的维值组合的异常指数值(包括单项异常指数值和/或总异常指数值)。
在一个实施例中,输出的异常信息可以包括挖掘出的所有存在异常的维值组合,也可以对挖掘出的所有存在异常的维值组合进行筛查,以筛除冗余的维值组合,使得报出的异常信息更加精简,提高风控人员根据异常信息进行风险控制模型的优化的效率。
对于该实施例,步骤S3400中输出包括该存在异常的维值组合的异常信息可以包括:在挖掘出的所有存在异常的维值组合中,筛选出满足设定的等价条件的维值组合集合;对于满足该等价条件的维值组合集合,仅输出维值数量最少的维值组合。
该等价条件可以包括:指标值序列相同的维值组合、指标值序列相似的维值组合、具有相同的异常因子的维值组合中的任意一项或者多项。
对于指标值序列相同的维值组合集合,例如,有两个维值D11、D23 相互关联,即,特征DIM1在取值为维值D11时,特征DIM2只会取值为 D23,则,维值组合(D11)和维值组合(D11,D23)便是等价的,输出的异常信息中只保留维值组合(D11)即可。
对于指标值序列相似的维值组合集合,例如,在两个维值组合的指标值序列对应的曲线形状间的相似度大于设定阈值的情况下,则认为其中一个指标值序列能够被另一条指标值序列覆盖,即,两个维值组合的指标值序列相似,反之亦然,这样,便可以仅保留维值数较少的维值组合。指标值序列相似的维值组合通常是具有上下级关系的维值组合,其中,上级维值组合的指标值序列包含下级维值组合的指标值序列,例如维值组合(D11) 为维值组合(D11,D23)的上级,维值组合(D11)对于指标1的指标值序列包含维值组合(D11,D23)对于指标1的指标值序列。
对于具有相同的异常因子的维值组合集合,这些维值组合通常基于相同的因素导致出现异常,例如,特征DIM1取值为维值D11时存在异常,该维值D11与特征DIM2的各个维值组合后均存在异常,且异常方向相同,异常程度也相似,因此,维值D11可以作为使得这些维值组合存在异常的异常因子,即,维值组合(D11)、及维值D11与特征DIM2的各个维值构成的其他维值组合便构成了具有相同的异常因子的维值组合集合,这样,对于该种维值组合集合,只需要维值数最少的维值组合即可。或者,也可以通过任何聚类算法判断维值组合之间是否存在相同的异常因子,以筛查出具有相同的异常因子的维值组合集合,在此不做限定。
在一个实施例中,输出的异常信息可以包括挖掘出的所有存在异常的维值组合,也可以对挖掘出的所有存在异常的维值组合进行筛查,以筛除无效的维值组合,使得报出的异常信息精简、且有效,提高风控人员根据异常信息进行风险控制模型的优化的效率。
对于该实施例,步骤S3400中输出包括该存在异常的维值组合的异常信息可以包括:通过预置的反馈模型处理挖掘出的维值组合,筛选出有效的维值组合,其中,该反馈模型反映维值组合的特征与有效性之间的映射关系;以及,输出筛选出的有效的维值组合。
该维值组合的特征例如可以包括,维值组合所包含的维值、使得该维值组合存在异常的指标、使得该维值组合存在异常的指标值序列中的任意以下或者多项。
该反馈模型可以根据风控人员在接收到异常信息后提供的反馈信息训练得到,因此,在一个实施例中,该方法还可以包括生成该反馈模型的步骤,包括:获取对于输出的异常信息提供的反馈信息,其中,该反馈信息包含维值组合的特征与有效性之间的对应关系;以及,将该反馈信息作为训练样本,训练得到或更新该反馈模型。
该反馈模型例如可以是逻辑回归、分类与回归树(Classification andregression tree,CART)等二分类模型,在此不做限定。
根据以上步骤S3100~S3400可知,本实施例的方法通过多维度分析对于每一指标的指标值序列,可以及时、准确地发现随着时间推移,对于任意指标可能存在异常的维度组合,并将异常信息上报给风控人员,使得风控人员能够根据该异常信息快速、有效地升级风险控制模型,进而提高风险控制模型对于交易中可能或者已经出现的新增风险进行及时、有效地防控,保证交易安全。
在一个实施例中,该异常信息挖掘方法在通过上述步骤S3300生成指标值序列之后,还可以包括:在生成的指标值序列中,去除满足设定的剪枝条件的指标值序列,获得有效的指标值序列。
该剪枝条件例如可以包括:指标值序列的时序数据量相对对应指标的时序数据量的占比小于第一设定值、指标值序列的变化幅度小于第二设定值、及指标值序列的指标值的数量小于第三设定值中的至少一项。
以上指标值序列的变化幅度为:指标值序列中指标值的最大差异或者平均差异,如果该差异小于第二设定值,则说明该指标值序列对于挖掘异常信息无贡献,可以进行剪枝。
以上设定值可以根据需要设定,在此不做限定。
该实施例中,上述步骤S3400中根据指标值序列挖掘存在异常的维值组合可以包括:根据该有效的指标值序列挖掘存在异常的维值组合。
在一个例子中,以上去除满足设定的剪枝条件的指标值序列的步骤,可以包括:对于同一指标的具有上下级关系的维值组合集合,查找满足剪枝条件的维值数最少的维值组合作为主维值组合;以及,对于每一维值组合集合,去除该主维值组对于对应指标的指标值序列、及包含该主维值组合的其他维值组合对于对应指标的指标值序列。
该例子中,对于任意指标,将各维值组合根据是否构成上下级关系,划分为各个维值组合集合,由于一个维值组合集合中的最高级别的维值组合(维值数最少)对于该指标的指标值序列包含了该维值组合集合中其他维值组合对于该指标的指标值序列,因此,对于同一维值组合集合,仅需查找满足剪枝条件的维值数最少的维值组合,而无需针对每一维值组合判断其是否满足该剪枝条件,大大提高了剪枝效率。
本实施例中,通过在挖掘前对指标值序列进行剪枝,有利于提高挖掘效率。
在一个实施例中,该异常信息挖掘方法在生成分别与每一维值组合各自对应的指标值序列时,可以包括如下步骤S3310~S3320:
步骤S3310,按照各维值组合间的级别关系构建对应指标的维值树,其中,该维值树的一个节点代表一个维值组合。
本实施例中,相同级别的维值组合位于维值树的同一层。
继续上述例子,根据该步骤S3310,针对每一指标,均可以获得如图 4所示的一颗维值树,即指标与维值树一一对应,图4中的维值树仅示意性地给出了第一级别的各维值组合及部分第二级别的维值组合,其中,示出的部分第二级别的维值组合包括:第一级别的维值组合(D11)的下一级维值组合(D11、D31)~维值组合(D11、D25)和第一级别的维值组合(D33)的下一级维值组合(D33,D21)~维值组合(D33、D25)。
同一级别的维值组合的维值数量相同,除第一级别的维值组合之外,任意维值组合均包含自身的上一级别的维值组合。
在一个例子中,在按照各维值组合间的级别关系构建对应指标的维值树时,可以包括:在维值树的每一层级中,设置同级维值组合按照对应特征具有的维值数从少到多的顺序排列。
继续上述例子,特征DIM1具有两个维值D11、D12,特征DIM2具有五个维值D21~D25,特征DIM3具有三个维值D31~D33,参见图4所示,在构建维值树时,按照特征DIM1、特征DIM3和特征DIM2的顺序排列同级别的维值组合,这样便于记录维值树的数据。
步骤S3320,在维值树的每一节点处,生成并记录对应维值组合对于对应指标的指标值序列。
根据本步骤S3320,对于任意指标的维值树,该维值树的节点的数据即为对应维值组合对于该指标的指标值序列。
本实施例中,通过构建维值树,易于记录各维值组合之间的关联关系,这使得上述剪枝操作变得非常容易,例如,通过从根节点开始遍历维值树,对于维值树的任意树枝(对应具有上下级的维值组合集合),只要查找到满足剪枝条件的维值组合,即可停止该树枝的继续扫描,并在维值树中去除以查找到的维值组合为根节点的所有节点,即实现去除每一维值组合集合中的基础维值组及包含该基础维值组合的其他维值组合对应的指标值序列的目的。
<方法实施例2>
图5是根据本说明书另一实施例的异常信息识别方法的流程示意图,本实施例由风控人员使用的终端设备实施,例如由图2中的终端设备1300 实施。
如图5所示,本实施例的方法可以包括如下步骤S5100~S5300:
步骤S5100,接收异常信息挖掘装置提供的包括存在异常的维值组合的异常信息,其中,该维值组合由至少一个交易特征各自的一个维值构成,该交易特征与进行风险监控的指标相关。
步骤S5200,获取针对该异常信息提供的反馈信息,其中,该反馈信息包括维值组合的特征与有效性之间的对应关系。
步骤S5300,将该反馈信息发送至该异常信息挖掘装置,以进行新挖掘出的异常信息的有效性筛查。
本实施例中,该异常信息挖掘装置可以是如图1中所示的服务器 1100,也可以是能够实施本说明书任意实施例的异常信息挖掘方法的其他电子设备,在此不做限定。
该维值组合的特征例如可以包括,维值组合所包含的维值、使得该维值组合存在异常的指标、使得该维值组合存在异常的指标值序列中的任意以下或者多项。
异常信息挖掘装置在接收到对于异常信息的反馈信息后,可以将该反馈信息作为训练样本,训练得到或更新该反馈模型,以通过不断优化的反馈模型对挖掘出的存在异常的维值组合进行有效性筛查,进而提高上报至风控人员的异常信息的有效性。
在一个实施例中,该方法还可以包括:响应于进行信息反馈的操作,提供进行信息反馈的人机接口;以及,获取通过该人机接口输入的信息,作为上述反馈信息。
该人机接口例如可以提供输入框、勾选项、下拉列表中的至少一项。
根据该实施例,风控人员在通过相绑定的终端设备触发信息反馈的操作时,终端设备便可以根据该操作,提供进行信息反馈的人机接口,以通过该人机接口获取风控人员针对接收到的异常信息反馈的反馈信息,以不断提升异常信息挖掘装置挖掘有效的异常信息的能力。
<例子>
图6示出了一个例子的异常信息挖掘方法的流程示意图。
根据图6所示,该例子的异常信息挖掘方法可以包括如下步骤:
步骤S6010,服务器1100获取进行风险监控的指标及与该指标相关的交易特征。
步骤S6020,服务器1100根据每一交易特征具有的维值,获得各维值组合。
步骤S6030,服务器1100根据从终端设备1200获取到的历史交易事件的事件信息,构建特征表。
该特征表反映历史交易事件的事件发生事件、对于每一交易特征的维值、及对于每一指标的指标值。
步骤S6040,服务器1100根据该特征表,分别针对每一指标,构建与各自相对应的维值树。
该维值树由各维值组合按照级别关系构建而成,维值树的一个节点代表一个维值组合,维值树的每一节点的数据为对应维值组合对于对应指标的指标值序列。
步骤S6050,服务器1100根据对该维值树进行预剪枝处理,以在维值树中去除满足设定的剪枝条件的指标值序列,获得有效的指标值序列。
步骤S6060,服务器1100根据有效的指标值序列挖掘出存在异常的维值组合。
步骤S6070,服务器1100对挖掘出的存在异常的维值组合进行后剪枝处理,并将剪枝后的维值组合置入输出集合中。
后剪枝处理指:在挖掘出的存在异常的维值组合中,筛选满足设定的等价条件的维值组合集合,并对于每一维值组合集合,仅选取维值数量最少的维值组合置入输出集合中。
步骤S6080,服务器1100将输出集合中的维值组合输入至反馈模型中进行有效性分析,获得包含有效的维值组合、该维值组合的异常指标值、使得该维值组合存在异常的指标、及使得该维值组合存在异常的指标值序列等在内的异常信息。
步骤S6090,服务器1100将获得的异常信息发送至风控人员的终端设备1300。
步骤S6100,终端设备1300获取到服务器1100发送的异常信息后,输出该异常信息,并响应于风控人员针对该异常信息提供的反馈信息。
步骤S6110,终端设备1300将该反馈信息发送至服务器1100。
步骤S6120,服务器1100根据该反馈信息进行反馈模型的自学习训练,以更新该反馈模型。
通过更新后的反馈模型,可以在步骤S6080对下一次新挖掘出的异常信息进行更有效的有筛查。
<装置实施例1>
本实施例提供一种异常信息挖掘装置,如图7所示,该异常信息挖掘装置7000可以包括数据获取模块7100、维值组合模块7200、序列构建模块7300和异常挖掘模块7400。
该数据获取模块7100用于获取进行风险监控的指标及与该指标相关的交易特征。
该维值组合模块7200用于根据每一交易特征具有的维值,获得各维值组合。
该序列构建模块7300用于根据历史交易事件的事件信息,分别针对每一指标,生成与每一维值组合各自对应的指标值序列。
该异常挖掘模块7400用于根据该指标值序列挖掘存在异常的维值组合,获得并输出包括存在异常的维值组合的异常信息。
在一个实施例中,该序列构建模块7300在生成与每一维值组合各自对应的指标值序列时,可以用于:对于每一维值组合,从历史交易事件中获取满足对应维值组合的历史交易事件,作为目标交易事件;按照事件发生时间的先后顺序排列该目标交易事件对于对应指标的指标值,生成对应维值组合对于对应指标的指标值序列。
在一个实施例中,该数据获取模块7100在获取与指标相关的交易特征时,可以用于:根据历史交易事件的事件信息,获取引起该指标波动的交易特征作为与该指标相关的交易特征。
在一个实施例中,该异常信息挖掘装置7000还可以包括预剪枝模块,该预剪枝模块用于:在生成的指标值序列中,去除满足设定的剪枝条件的指标值序列,获得有效的指标值序列,并将有效的指标值序列提供给异常挖掘模块7400,以使异常挖掘模块7400在根据指标值序列挖掘存在异常的维值组合时,可以用于:根据有效的指标值序列挖掘存在异常的维值组合。
在一个实施例中,该预剪枝模块在去除满足设定的剪枝条件的指标值序列时,可以用于:对于同一指标的具有上下级关系的维值组合集合,查找满足该剪枝条件的维值数最少的维值组合作为主维值组合;对于每一维值组合集合,去除该主维值组对于对应指标的指标值序列、及包含该主维值组合的其他维值组合对于对应指标的指标值序列。
在一个实施例中,该异常挖掘模块7400在根据指标值序列挖掘存在异常的维值组合时,可以用于:根据指标值序列挖掘对于对应指标存在单项异常的维值组合;以及,根据存在单项异常的维值组合,获得最终的存在异常的维值组合。
在一个实施例中,该异常挖掘模块7400在根据指标值序列挖掘对于对应指标存在单项异常的维值组合时,可以用于:对于每一指标值序列,通过拟合其中的指标值获得反映时间与对应指标的指标值之间的映射关系的映射函数;根据该映射函数,获得对应指标值序列中设定指标值的预测值;比较该预测值与对应的指标值,获得比较结果;以及,根据该比较结果,确定对应维值组合对于对应指标是否存在单项异常。
在一个实施例中,该异常挖掘模块7400在根据该比较结果,确定对应维值组合对于对应指标是否存在单项异常时,可以用于:根据比较结果、及对应指标值序列的时序数据量相对对应指标的时序数据量的占比,获得对应维值组合的单项异常指数值;以及,根据单项异常指数值,确定对应维值组合对于对应指标是否存在单项异常。
在一个实施例中,该异常挖掘模块7400在根据指标值序列挖掘对于对应指标存在单项异常的维值组合,还可以用于:对于每一指标值序列,提取设定的时序特征;根据时序特征,获得对应指标值序列的时序模型,以在通过拟合其中的指标值获得反映时间与对应指标的指标值之间的映射关系的映射函数时,能够根据对应的时序模型拟合其中的指标值。
在一个实施例中,该异常挖掘模块7400在根据存在单项异常的维值组合,获得最终的存在异常的维值组合时,可以用于:对于存在单项异常的维值组合,根据对应维值组合对于每一指标的单项异常指数值及每一指标的权重,获得最终的存在异常的维值组合。
在一个实施例中,该异常挖掘模块7400在输出包括存在异常的维值组合的异常信息时,可以用于:在挖掘出的所有存在异常的维值组合中,筛选出满足设定的等价条件的维值组合集合;以及,对于每一维值组合集合,仅输出维值数量最少的维值组合。
在一个实施例中,该异常挖掘模块7400在输出包括存在异常的维值组合的异常信息时,可以用于:通过预置的反馈模型处理挖掘出的存在异常的维值组合,筛选出有效的维值组合,其中,反馈模型反映维值组合的特征与有效性之间的映射关系;以及,输出筛选出的有效的维值组合。
在一个实施例中,该异常信息挖掘装置7000还可以包括反馈模型生成模块,用于:获取对于输出的异常信息提供的反馈信息,其中,反馈信息包含维值组合的特征与有效性之间的对应关系;以及,将该反馈信息作为训练样本,训练得到或更新该反馈模型。
在一个实施例中,该序列构建模块7300在生成与每一维值组合各自对应的指标值序列时,可以用于:按照各维值组合间的级别关系构建对应指标的维值树,其中,维值树的一个节点代表一个维值组合;以及,在该维值树的每一节点,生成并记录对应维值组合对于对应指标的指标值序列。
在一个实施例中,该序列构建模块7300在按照各维值组合间的级别关系构建对应指标的维值树时,可以用于:在维值树的同一层级中,设置同级维值组合根据对应特征具有的维值数的数量,按照数量从少到多的顺序依次排列。
在一个实施例中,数据获取模块7100在获取进行风险监控的指标时,可以用于:响应于进行挖掘配置的触发,提供配置接口;获取通过该配置接口输入的进行风险监控的指标。
<装置实施例2>
在一个实施例中,该异常信息挖掘装置7000还可以包括存储器和处理器,该存储器用于存储可执行命令。该处理器用于在该存储器存储的可执行命令的控制下,执行本说明书方法实施例1中描述的任意一种异常信息挖掘方法。
在异常信息挖掘装置可以是能够执行本说明书的方法实施例1中任意方法的设备,可以是服务器,例如图1中的服务器1100,也可以是其他设备,例如笔记本电脑、台式电脑等,在此不做限定。
在该实施例中,装置实施例1中涉及的任意一个模块都可以由本实施例的异常信息挖掘装置7000的处理器实现。
<设备实施例>
本实施例提供一种终端设备8000,如图8所示,该终端设备8000可以包括异常信息获取模块8100、反馈信息获取模块8200和反馈信息发送模块8300。
该异常信息获取模块8100用于接收异常信息挖掘装置提供的包括存在异常的维值组合的异常信息。
该维值组合由至少一个交易特征各自的一个维值构成,交易特征与进行风险监控的指标相关。
该反馈信息获取模块8200用于获取针对异常信息提供的反馈信息,其中,该反馈信息包括维值组合的特征与有效性之间的对应关系。
该反馈信息发送模块8300用于将反馈信息发送至异常信息挖掘装置,以进行新挖掘出的异常信息的有效性筛查。
在一个实施例中,该终端设备8000可以包括交互模块,该交互模块用于:响应于进行信息反馈的操作,提供进行信息反馈的人机接口;获取通过该人机接口输入的信息作为反馈信息,以供反馈信息获取模块8200获取。
在一个实施例中,该终端设备还可以包括存储器和处理器,该存储器用于存储可执行命令。该处理器用于在该存储器存储的可执行命令的控制下,执行本说明书方法实施例2中描述的任意异常信息挖掘方法。
在终端设备例如可以是图1中的终端设备1300。
在该实施例中,设备实施例中的以上任意一个模块均可以由该终端设备的处理器实现。
<系统实施例>
在本实施例中,还提供一种异常信息挖掘系统9000,如图9所示,包括异常信息挖掘装置7000和终端设备8000。
该异常信息挖掘装置7000例如可以是如图1所示的服务器1100。
该终端设备8000例如可以是如图1所示的终端设备1300。
<介质实施例>
本实施例提供一种计算机可读存储介质,该存储介质中存储有可执行命令,该可执行命令被处理器执行时,执行本说明书任意方法实施例中描述的方法。
本说明书的不同实施例侧重于说明各实施例间的不同之处,各实施例间的相同或者相似的部分可以相互参见。
本说明书的一个实施例或者多个实施例可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本说明书的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/ 或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本说明书实施例操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本说明书的各个方面。
这里参照根据本说明书实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本说明书的各个方面。应当理解,流程图和/ 或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本说明书的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人物来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本说明书的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人物来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人物能理解本文披露的各实施例。本申请的范围由所附权利要求来限定。

Claims (25)

1.一种异常信息挖掘方法,包括:
获取进行风险监控的指标及与所述指标相关的交易特征;
根据每一所述交易特征具有的维值,获得各维值组合;
根据历史交易事件的事件信息,分别针对每一所述指标,生成与每一所述维值组合各自对应的指标值序列;
根据所述指标值序列挖掘存在异常的维值组合,获得并输出包括所述存在异常的维值组合的异常信息。
2.根据权利要求1所述的方法,所述生成与每一所述维值组合各自对应的指标值序列,包括:
对于每一维值组合,从历史交易事件中获取满足对应维值组合的历史交易事件,作为目标交易事件;
按照事件发生时间的先后顺序排列所述目标交易事件对于对应指标的指标值,生成对应维值组合对于对应指标的指标值序列。
3.根据权利要求1所述的方法,获取与所述指标相关的交易特征包括:
根据所述历史交易事件的事件信息,获取引起所述指标波动的交易特征作为与所述指标相关的交易特征。
4.根据权利要求1所述的方法,还包括:
在生成的所述指标值序列中,去除满足设定的剪枝条件的指标值序列,获得有效的指标值序列;
所述根据所述指标值序列挖掘存在异常的维值组合包括:
根据所述有效的指标值序列挖掘存在异常的维值组合。
5.根据权利要求4所述的方法,所述剪枝条件包括:指标值序列的时序数据量相对对应指标的时序数据量的占比小于第一设定值、指标值序列的变化幅度小于第二设定值、及指标值序列的指标值的数量小于第三设定值中的至少一项。
6.根据权利要求4所述的方法,所述去除满足设定的剪枝条件的指标值序列包括:
对于同一指标的具有上下级关系的维值组合集合,查找满足所述剪枝条件的维值数最少的维值组合作为主维值组合;
对于每一维值组合集合,去除所述主维值组对于对应指标的指标值序列、及包含所述主维值组合的其他维值组合对于对应指标的指标值序列。
7.根据权利要求1所述的方法,所述根据所述指标值序列挖掘存在异常的维值组合包括:
根据所述指标值序列挖掘对于对应指标存在单项异常的维值组合;
根据所述存在单项异常的维值组合,获得最终的存在异常的维值组合。
8.根据权利要求7所述的方法,其中,所述根据所述指标值序列挖掘对于对应指标存在单项异常的维值组合,包括:
对于每一所述指标值序列,通过拟合其中的指标值获得反映时间与对应指标的指标值之间的映射关系的映射函数;
根据所述映射函数,获得对应指标值序列中设定指标值的预测值;
比较所述预测值与对应的指标值,获得比较结果;
根据所述比较结果,确定对应维值组合对于对应指标是否存在单项异常。
9.根据权利要求8所述的方法,所述根据所述比较结果,确定对应维值组合对于对应指标是否存在单项异常,包括:
根据所述比较结果、及对应指标值序列的时序数据量相对对应指标的时序数据量的占比,获得对应维值组合的单项异常指数值;
根据所述单项异常指数值,确定对应维值组合对于对应指标是否存在单项异常。
10.根据权利要求8所述的方法,所述根据所述指标值序列挖掘对于对应指标存在单项异常的维值组合,还包括确定与每一指标值序列相匹配的时序模型的步骤,包括:
对于每一所述指标值序列,提取设定的时序特征;
根据所述时序特征,获得对应指标值序列的时序模型;
所述通过拟合其中的指标值获得反映时间与对应指标的指标值之间的映射关系的映射函数,包括:
根据对应的时序模型拟合其中的指标值,获得反映时间与对应指标的指标值之间的映射关系的映射函数。
11.根据权利要求7所述的方法,所述根据所述存在单项异常的维值组合,获得最终的存在异常的维值组合包括:
对于存在单项异常的维值组合,根据对应维值组合对于每一所述指标的单项异常指数值及每一所述指标的权重,获得最终的存在异常的维值组合。
12.根据权利要求1所述的方法,所述输出包括所述存在异常的维值组合的异常信息包括:
在挖掘出的所有存在异常的维值组合中,筛选出满足设定的等价条件的维值组合集合;
对于每一所述维值组合集合,仅输出维值数量最少的维值组合。
13.根据权利要求12所述的方法,所述等价条件包括指标值序列相同、指标值序列相似、具有相同的异常因子中的任意一项或者多项。
14.根据权利要求1所述的方法,所述输出包括所述存在异常的维值组合的异常信息包括:
通过预置的反馈模型处理挖掘出的存在异常的维值组合,筛选出有效的维值组合,其中,所述反馈模型反映维值组合的特征与有效性之间的映射关系;
输出筛选出的所述有效的维值组合。
15.根据权利要求14所述的方法,还包括生成所述反馈模型的步骤,包括:
获取对于输出的所述异常信息提供的反馈信息,其中,所述反馈信息包含维值组合的特征与有效性之间的对应关系;
将所述反馈信息作为训练样本,训练得到或更新所述反馈模型。
16.根据权利要求1至15中任一项所述的方法,所述生成与每一所述维值组合各自对应的指标值序列包括:
按照所述各维值组合间的级别关系构建对应指标的维值树,其中,所述维值树的一个节点代表一个维值组合;
在所述维值树的每一节点,生成并记录对应维值组合对于对应指标的指标值序列。
17.根据权利要求16所述的方法,所述按照所述各维值组合间的级别关系构建对应指标的维值树包括:
在所述维值树的同一层级中,设置同级维值组合根据对应特征具有的维值数的数量,按照所述数量从少到多的顺序依次排列。
18.根据权利要求1至15中任一项所述的方法,所述获取进行风险监控的指标,包括:
响应于进行挖掘配置的触发,提供配置接口;
获取通过所述配置接口输入的进行风险监控的指标。
19.一种异常信息挖掘方法,由终端设备实施,包括:
接收异常信息挖掘装置提供的包括存在异常的维值组合的异常信息,其中,所述维值组合由至少一个交易特征各自的一个维值构成,所述交易特征与进行风险监控的指标相关;
获取针对所述异常信息提供的反馈信息,其中,所述反馈信息包括所述维值组合的特征与有效性之间的对应关系;
将所述反馈信息发送至所述异常信息挖掘装置,以进行新挖掘出的异常信息的有效性筛查。
20.根据权利要求19所述的方法,还包括:
响应于进行信息反馈的操作,提供进行信息反馈的人机接口;
获取通过所述人机接口输入的信息,作为所述反馈信息。
21.一种异常信息挖掘装置,包括:
数据获取模块,用于获取进行风险监控的指标及与所述指标相关的交易特征;
维值组合模块,用于根据每一所述交易特征具有的维值,获得各维值组合;
序列构建模块,用于根据历史交易事件的事件信息,分别针对每一所述指标,生成与每一所述维值组合各自对应的指标值序列;以及,
异常挖掘模块,根据所述指标值序列挖掘存在异常的维值组合,获得并输出包括所述存在异常的维值组合的异常信息。
22.一种异常信息挖掘装置,包括:
存储器,用于存储可执行命令;
处理器,用于在所述可执行命令的控制下,执行如权利要求1-18中任一项所述的异常信息挖掘方法。
23.一种终端设备,包括:
存储器,用于存储可执行命令;
处理器,用于在所述可执行命令的控制下,执行如权利要求19或20所述的异常信息挖掘方法。
24.一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时,执行如权利要求1-20中任一项所述的异常信息挖掘方法。
25.一种异常信息挖掘系统,包括权利要求21或22所述的异常信息挖掘装置、及权利要求23所述的终端设备。
CN201911052969.2A 2019-10-31 2019-10-31 异常信息挖掘方法、装置、系统及终端设备 Pending CN110880128A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911052969.2A CN110880128A (zh) 2019-10-31 2019-10-31 异常信息挖掘方法、装置、系统及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911052969.2A CN110880128A (zh) 2019-10-31 2019-10-31 异常信息挖掘方法、装置、系统及终端设备

Publications (1)

Publication Number Publication Date
CN110880128A true CN110880128A (zh) 2020-03-13

Family

ID=69728271

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911052969.2A Pending CN110880128A (zh) 2019-10-31 2019-10-31 异常信息挖掘方法、装置、系统及终端设备

Country Status (1)

Country Link
CN (1) CN110880128A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100177A (zh) * 2020-09-04 2020-12-18 北京三快在线科技有限公司 数据存储方法、装置、计算机设备及存储介质
CN112214522A (zh) * 2020-09-25 2021-01-12 桦蓥(上海)信息科技有限责任公司 一种基于双目标投影的金融交易数据异常因素筛选方法
CN112291258A (zh) * 2020-11-12 2021-01-29 杭州比智科技有限公司 网关风险控制方法及装置
CN115277627A (zh) * 2022-07-29 2022-11-01 明阳产业技术研究院(沈阳)有限公司 一种数据监控系统、数据监控方法及相关设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197845A (zh) * 2018-02-28 2018-06-22 四川新网银行股份有限公司 一种基于深度学习模型lstm的交易指标异常的监测方法
CN109035021A (zh) * 2018-07-17 2018-12-18 阿里巴巴集团控股有限公司 一种交易指标的监控方法、装置及设备
CN110059251A (zh) * 2019-04-22 2019-07-26 郑州大学 基于多关系隐式反馈置信度的协同过滤推荐方法
CN110147902A (zh) * 2019-04-10 2019-08-20 焦点科技股份有限公司 一种多项运营指标联合异常监测方法
CN110188793A (zh) * 2019-04-18 2019-08-30 阿里巴巴集团控股有限公司 数据异常分析方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197845A (zh) * 2018-02-28 2018-06-22 四川新网银行股份有限公司 一种基于深度学习模型lstm的交易指标异常的监测方法
CN109035021A (zh) * 2018-07-17 2018-12-18 阿里巴巴集团控股有限公司 一种交易指标的监控方法、装置及设备
CN110147902A (zh) * 2019-04-10 2019-08-20 焦点科技股份有限公司 一种多项运营指标联合异常监测方法
CN110188793A (zh) * 2019-04-18 2019-08-30 阿里巴巴集团控股有限公司 数据异常分析方法及装置
CN110059251A (zh) * 2019-04-22 2019-07-26 郑州大学 基于多关系隐式反馈置信度的协同过滤推荐方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100177A (zh) * 2020-09-04 2020-12-18 北京三快在线科技有限公司 数据存储方法、装置、计算机设备及存储介质
CN112214522A (zh) * 2020-09-25 2021-01-12 桦蓥(上海)信息科技有限责任公司 一种基于双目标投影的金融交易数据异常因素筛选方法
CN112291258A (zh) * 2020-11-12 2021-01-29 杭州比智科技有限公司 网关风险控制方法及装置
CN112291258B (zh) * 2020-11-12 2023-03-21 杭州比智科技有限公司 网关风险控制方法及装置
CN115277627A (zh) * 2022-07-29 2022-11-01 明阳产业技术研究院(沈阳)有限公司 一种数据监控系统、数据监控方法及相关设备

Similar Documents

Publication Publication Date Title
US10948526B2 (en) Non-parametric statistical behavioral identification ecosystem for electricity fraud detection
CN110880128A (zh) 异常信息挖掘方法、装置、系统及终端设备
CN103294592B (zh) 利用用户工具交互来自动分析其服务交付中的缺陷的方法与系统
CN111177214B (zh) 事件联动处理方法、装置、系统、电子设备及存储介质
CN104636130B (zh) 用于生成事件树的方法和系统
CN110647522A (zh) 一种数据挖掘方法、装置及其系统
CN111008707A (zh) 自动化建模方法、装置及电子设备
WO2016093837A1 (en) Determining term scores based on a modified inverse domain frequency
CN111782611B (zh) 预测模型建模方法、装置、设备及存储介质
CN110457595A (zh) 突发事件报警方法、装置、系统、电子设备及存储介质
CN105405051B (zh) 金融事件预测方法和装置
US9460393B2 (en) Inference of anomalous behavior of members of cohorts and associate actors related to the anomalous behavior based on divergent movement from the cohort context centroid
CN112287111B (zh) 一种文本处理方法和相关装置
CN111506775A (zh) 标签处理方法、装置、电子设备及可读存储介质
CN113469461A (zh) 生成信息的方法和装置
CN112699314A (zh) 热点事件确定方法、装置、电子设备及存储介质
CN114881521A (zh) 业务评估方法、装置、电子设备以及存储介质
CN115619245A (zh) 一种基于数据降维方法的画像构建和分类方法及系统
CN111414455B (zh) 舆情分析方法、装置、电子设备及可读存储介质
CN113722593A (zh) 事件数据处理方法、装置、电子设备和介质
US10019477B2 (en) Anticipatory query completion by pattern detection
CN113407586A (zh) 数据检索方法、装置、办公系统、存储介质及电子设备
CN113094479B (zh) 一种问题处理方法、装置、电子设备和介质
CN111797994B (zh) 一种风险评估方法、装置、设备及存储介质
US20210264912A1 (en) Data analysis method, apparatus and storage medium based on intelligent speech device

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200313